KR20220009943A - Mut- 메틸영양성 효모 - Google Patents
Mut- 메틸영양성 효모 Download PDFInfo
- Publication number
- KR20220009943A KR20220009943A KR1020217035698A KR20217035698A KR20220009943A KR 20220009943 A KR20220009943 A KR 20220009943A KR 1020217035698 A KR1020217035698 A KR 1020217035698A KR 20217035698 A KR20217035698 A KR 20217035698A KR 20220009943 A KR20220009943 A KR 20220009943A
- Authority
- KR
- South Korea
- Prior art keywords
- host cell
- methanol
- mut
- gene
- protein
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
- C12N15/815—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/76—Albumins
- C07K14/765—Serum albumin, e.g. HSA
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/06—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies from serum
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0006—Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/01—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
- C12Y101/01001—Alcohol dehydrogenase (1.1.1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/03—Oxidoreductases acting on the CH-OH group of donors (1.1) with a oxygen as acceptor (1.1.3)
- C12Y101/03013—Alcohol oxidase (1.1.3.13)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/10—Immunoglobulins specific features characterized by their source of isolation or production
- C07K2317/14—Specific host cells or culture conditions, e.g. components, pH or temperature
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/50—Immunoglobulins specific features characterized by immunoglobulin fragments
- C07K2317/56—Immunoglobulins specific features characterized by immunoglobulin fragments variable (Fv) region, i.e. VH and/or VL
- C07K2317/569—Single domain, e.g. dAb, sdAb, VHH, VNAR or nanobody®
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2510/00—Genetically modified cells
- C12N2510/02—Cells for production
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/001—Vector systems having a special element relevant for transcription controllable enhancer/promoter combination
- C12N2830/002—Vector systems having a special element relevant for transcription controllable enhancer/promoter combination inducible enhancer/promoter combination, e.g. hypoxia, iron, transcription factor
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/10—Biofuels, e.g. bio-diesel
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Mycology (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Toxicology (AREA)
- Gastroenterology & Hepatology (AREA)
- Immunology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
조작된 재조합 메탄올 이용 경로 결핍 메틸영양 효모 (Mut-) 숙주 세포:
a) 상기 하나 이상의 유전적 변형 이전의 숙주 세포와 비교하여 제1 및 제2 내인성 유전자의 발현을 감소시키기 위한 하나 이상의 유전적 변형에 의해, 여기서
i. 제1 내인성 유전자는 서열번호 1로 확인된 아미노산 서열 또는 이의 상동체를 포함하는 알코올 산화효소 1(alcohol oxidase 1, AOX1)을 암호화하고,
ii. 제2 내인성 유전자는 서열번호 3으로 확인된 아미노산 서열 또는 이의 상동체를 포함하는 알코올 산화효소 2(alcohol oxidase 2, AOX2)를 암호화하고,
그리고
b) 상기 하나 이상의 유전적 변형 이전에 숙주 세포와 비교하여 알코올 탈수소효소 2(alcohol dehydrognease 2, ADH2) 유전자의 발현을 증가시키기 위한 하나 이상의 유전적 변형에 의해, 여기서 ADH2 유전자는 알코올 탈수소효소 2(alcohol dehydrogenase 2, ADH2)를 인코딩한다.
a) 상기 하나 이상의 유전적 변형 이전의 숙주 세포와 비교하여 제1 및 제2 내인성 유전자의 발현을 감소시키기 위한 하나 이상의 유전적 변형에 의해, 여기서
i. 제1 내인성 유전자는 서열번호 1로 확인된 아미노산 서열 또는 이의 상동체를 포함하는 알코올 산화효소 1(alcohol oxidase 1, AOX1)을 암호화하고,
ii. 제2 내인성 유전자는 서열번호 3으로 확인된 아미노산 서열 또는 이의 상동체를 포함하는 알코올 산화효소 2(alcohol oxidase 2, AOX2)를 암호화하고,
그리고
b) 상기 하나 이상의 유전적 변형 이전에 숙주 세포와 비교하여 알코올 탈수소효소 2(alcohol dehydrognease 2, ADH2) 유전자의 발현을 증가시키기 위한 하나 이상의 유전적 변형에 의해, 여기서 ADH2 유전자는 알코올 탈수소효소 2(alcohol dehydrogenase 2, ADH2)를 인코딩한다.
Description
본 발명은 알코올 산화효소 1(alcohol oxidase 1, AOX1) 및 알코올 산화효소 2(alcohol oxidase 2, AOX2)가 결핍된 재조합 메틸영양성 효모(recombinant methylotrophic yeast)에서 관심 단백질(protein of interest, POI)의 생산에 관한 것이다.
재조합 숙주 세포 배양에서 생산된 단백질은 진단 및 치료제로서 점점 더 중요해지고 있다. 이 목적을 위해, 세포는 비정상적으로 높은 수준의 관심 재조합 또는 이종 단백질을 생산하도록 조작 및/또는 선택된다. 세포 배양 조건의 최적화는 재조합 또는 이종 단백질의 성공적인 상업적 생산에 중요하다.
관심 단백질(POI)의 성공적인 생산은 세포 배양에서 원핵 및 진핵 숙주 세포 모두에서 달성되었다. 진핵 숙주 세포, 특히 포유동물 숙주 세포, 효모 또는 사상 진균, 또는 박테리아는 생물제약 단백질 및 벌크 화학물질의 생산 숙주로서 일반적으로 사용된다. 가장 두드러진 예는 이종 단백질의 효율적인 분비로 잘 알려진 Pichia pastoris와 같은 메틸영양성 효모이다. P. pastoris는 Komagataella라는 새로운 속으로 재분류되었고, K. pastoris, K. phaffii, 및 K. pseudopastoris의 3종으로 분할되었다. 생명 공학 응용 분야에 일반적으로 사용되는 균주는 제안된 두 종인 K. pastoris와 K. phaffii에 속한다. 균주 GS115, X-33, CBS2612 및 CBS7435는 K. phaffii이고, 균주 DSMZ70382는 모든 이용 가능한 P. pastoris 균주에 대한 참조 균주인 K. pastoris 유형 종으로 분류된다(Kurtzman 2009, J Ind Microbiol Biotechnol.36(11):1435-8). Mattanovich 등. (Microbial Cell Factories 2009, 8:29 doi:10.1186/1475-2859-8-29)은 K. pastoris의 DSMZ 70382형 균주의 게놈 시퀀싱을 기술하고, 이의 분비체(secretome) 및 당전달체(sugar transporter)를 분석하였다.
P. pastoris 균주는 AOX 유전자 AOX1 및 AOX2 모두가 결핍되거나(Mut-로 지칭됨) AOX2만 결핍되거나(MutS로 지칭됨) AOX 유전자 중 어느 것도 결핍되지 않은( Mut+로 지칭됨) 상태로 사용되었다.
재조합 숙주 세포에서 단백질 생산에 사용되는 프로모터는 조절되거나(예: 메탄올을 배지에 첨가할 때 유도, 메탄올-조절) 지속적으로 활성화(구성, constitutive)된다. 메탄올 유도성 프로모터 pAOX1은 Mut-, Mut+ 또는 MutS 균주에서 단백질 발현을 제어하는 것으로 설명되었다.
Chiruvolu 등. (Enzyme Microb. Technol. 1997, 21:277-283)은 재조합 단백질 생산에 사용되는 Mut- 균주의 구성을 기술한다. Mut- 균주는 메탄올에서 성장하지 않는 것으로 결정되었으며, 성장, 유지 및 단백질 생산을 위해 다른 탄소 공급원을 사용해야 했다. POI는 약 0.5%(v/v)의 농도를 유지하기 위해 발효기에 메탄올을 주입하여 유도된 pAOX1의 제어 하에 발현되었다.
Chauhan 등. (Process Biochemistry 1999, 34:139-145)은 pAOX1 프로모터 하에 HBsAg를 발현하기 위한 유전자를 운반하는 AOX1 결실된 숙주(Mut-로 지정되지만 MutS로 이해됨)의 이용을 기술한다. 단백질 발현은 메탄올에 의해 유도되었지만, MutS 세포는 메탄올 농도에 민감한 것으로 밝혀졌기 때문에 브로쓰(broth)의 높은 메탄올 농도는 세포에 독성이 있는 것으로 밝혀졌다.
Karaoglan 등. (Biotechnol. Lett. 1995, DOI 10.1007/s10529-015-1993-z) P. pastoris에서 알코올 탈수소효소(alcohol dehydrogenase, ADH) 유전자의 기능적 분석을 기술한다. ADH3 (XM_002491337) 및 ADH (FN392323) 유전자가 파괴되었다. 이중 녹아웃 균주도 에탄올을 생산했다. ADH 유전자는 에탄올 대사에 역할을 하지 않는다고 결론지었고, PpADH3은 P. pastoris에서 에탄올 소비를 담당하는 유일한 유전자였다.
Singh과 Narang (bioRxiv, DOI:10.1101/573519, preprint)은 Komagataella phaffii (Pichia pastoris)의 Mut+, Muts(AOX1-) 및 Mut-(AOX1- AOX2-) 계통에서 β-갈락토시다제 발현을 설명한다. 포르메이트 또는/및 포름알데히드는 모두 포르메이트 또는 포름알데히드로부터 세포내 메탄올을 합성할 수 없는 Mut-에서 PAOX1 발현을 유도하고, 메탄올을 괴롭히는 결핍으로 고통받지 않는 것처럼 보이기 때문에 메탄올에 대한 유망한 대체물로 포르메이트를 제안하고 있기 때문에 진정한 유도자라고 결론지었다.
Wei Shen 등. (Microbial Cell Factory 2016, 15(1):1-11)은 메탄올이 없는 Pichia pastoris 단백질 발현 시스템을 설명한다. 2개의 키나제 돌연변이 Δgut1 및 Δdak은 비메탄올 탄소 공급원에서 강한 알코올 산화효소 활성을 보였고 메탄올이 없는 발현 시스템을 구성하는 데 사용되었다.
Ia Pla 등. (Biotechnol Prog, 2006, pp 881-888)은 AOX 프로모터 및 메탄올에 의한 유도를 사용하여 scFv를 발현하기 위한 MutS 및 Mut+ P. pastoris 균주를 설명한다.
EP1905836A1은 재조합 인간 인터페론 알파를 생산하기 위한 P. pastoris 균주를 개시하고, 돌연변이된 AOX1 유전자를 포함하지만 AOX1 유전자좌의 완전한 결실을 포함하지 않는 AOX1-교란된 클론의 사용을 제안한다.
Ching-Hsiang Chang 등. (BMC Biotechnology 2018, 18(1):81)은 메탄올 발현 조절자 1(methanol expression regulator 1, Mxr1)-재프로그래밍된 세포를 사용하여 P. pastoris에서 유연한 pAOX1 유도 시스템을 제안한다.
Russmayer H. 등. (BMC Biology 2015, 13(1):80)은 P. pastoris 발현 시스템 조절에서 AOX의 중요성을 설명한다.
Tomas-Gamisans M. 등. (Microbial Biotechnology 2018, 11(1):224-237)은 단독 탄소원으로서 메탄올 또는 글리세롤에 대한 개선된 예측을 위한 P. pastoris 게놈 규모 대사 모델을 설명한다.
Moser 등. (Microbial Cell Factories 2017, 16(1):49)는 P. pastoris의 성장 및 재조합 단백질 생산을 개선하기 위한 적응 실험실 진화를 설명한다.
P. pastoris에서 재조합 단백질 생산은 높은 산소 요구량과 높은 바이오매스 농도와 메탄올 소비를 요구하는 열 생산으로 이어지는 집중적인 공정 계획을 필요로한다. 다운스트림 공정에서 산소 전달, 냉각 및 바이오매스 분리는 비용이 많이 든다. 따라서 낮은 산소 요구량 및 열 생산 공정을 개발하는 것이 바람직하다. 특히 탄소원의 효율적인 사용에 의해 단백질 생산 수율을 증가시키는 것이 더욱 바람직하다.
본 발명의 목적은 메틸영양 효모에서 재조합 단백질 생산을 개선하는 것이다.
본 발명의 목적은 청구범위의 주제에 의해 그리고 여기에 추가로 설명된 바와 같이 해결된다.
본 발명은 다음과 같이 조작된 재조합 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포를 제공한다:
a) 상기 하나 이상의 유전적 변형 이전의 숙주 세포와 비교하여 제1 및 제2 내인성 유전자의 발현을 감소시키기 위한 하나 이상의 유전적 변형에 의해, 여기서
i. 제1 내인성 유전자는 서열번호 1로 확인된 아미노산 서열 또는 이의 상동체를 포함하는 알코올 산화효소 1(AOX1)을 암호화하고,
ii. 제2 내인성 유전자는 서열번호 3으로 확인된 아미노산 서열 또는 이의 상동체를 포함하는 알코올 산화효소 2(AOX2)를 암호화하고,
그리고
b) 상기 하나 이상의 유전적 변형 이전에 숙주 세포와 비교하여 알코올 탈수소효소(ADH2) 유전자의 발현을 증가시키기 위한 하나 이상의 유전적 변형에 의해, 여기서 ADH2 유전자는 알코올 탈수소효소(ADH2)를 인코딩한다.
구체적으로, ADH2 단백질은 EC 1.1.1.1로 분류되는 알코올 탈수소효소이다.
본 명세서에서, 용어 "ADH2"는 서열 번호 50 (UniProtKB - F2QSX6_KOMPC; FR839629 게놈 DNA 번역: CCA38504.1; 유전자: PP7435_Chr2-0821)으로 확인된 아미노산 서열, 또는 서열번호 50과 특정 상동성(또는 서열 동일성)을 갖는 서열을 포함하거나 이로 구성된 P. pastoris 알코올 탈수소효소와 같은 본래의 알코올 탈수소효소를 지칭한다.
구체적으로, ADH2는 P. pastoris 균주로부터 유래할 수 있거나, 예를 들어 진핵생물을 비롯한 진핵생물과 같은 유기체의 야생형 세포로부터 기원하거나 내인성인 이의 상동체 또는 이종상동체일 수 있다. 효모, 특히 메틸영양 효모 균주, 종 또는 속의 효모, 또는 이러한 자연 발생 ADH2의 돌연변이체일 수 있다.
구체적으로, ADH2 단백질은 숙주 세포의 종 또는 이의 돌연변이체에서 자연적으로 발생하거나 내인성이다.
구체적으로, 본 명세서에서 ADH2 유전자로 지칭되는 P. pastoris 알코올 탈수소효소를 코딩하는 유전자는 서열번호 51로 확인된 염기서열 또는 ADH2가 서열번호 50에 대한 특정 상동성(또는 서열 동일성)을 갖는 ADH2를 코딩하는 상동 폴리뉴클레오티드(유전자)를 포함하거나 이로 이루어진다.
구체적으로, ADH2 유전자는 Mut-숙주 세포에 대해 내인성 또는 이종성이다. 구체적으로, Mut-숙주 세포는 상기 ADH2 유전자의 하나 이상의 카피를 포함한다.
구체적으로 ADH2는 다음 중 하나이다:
a) 서열번호 50으로 확인된 아미노산 서열을 포함하는 P. pastoris ADH2인 ADH2, 또는 효모 종, 특히 메틸영양성 효모에 내인성인 이의 상동체; 또는
b) 서열번호 50과 60% 이상 동일한 a)의 ADH2 돌연변이.
상동 서열은 또한 ADH2 상동체 또는 ADH2 상동체로 지칭된다.
예시적인 상동체는 도 1에 설명되어 있다:
서열번호 52: Komagataella pastoris, ATCC 28485의 ADH2 아미노산 서열
서열번호 53: Komagataella pastoris, ATCC 28485의 ADH2 유전자 서열
서열번호 54: Ogataea parapolymorpha, DL-1의 ADH2 아미노산 서열
서열번호 55: Ogataea parapolymorpha, DL-1의 ADH2 유전자 서열
서열번호 56: Ogataea parapolymorpha, DL-1의 ADH2 아미노산 서열
서열번호 57: Ogataea parapolymorpha, DL-1의 ADH2 유전자 서열
서열번호 58: Ogataea polymorpha, NCYC 495 leu1.1의 ADH 아미노산 서열
서열번호 59: Ogataea polymorpha, NCYC 495 leu1.1의 ADH 유전자 서열
서열번호 60: Ogataea polymorpha, NCYC 495 leu1.1의 ADH 아미노산 서열
서열번호 61: Ogataea polymorpha, NCYC 495 leu1.1의 ADH 유전자 서열
서열번호 62: Saccharomyces cerevisiae, YJM627의 ADH2 아미노산 서열
서열번호 63: Saccharomyces cerevisiae, YJM627의 ADH2 유전자 서열
서열번호 64: Candida maltosa, Xu316의 ADH2 아미노산 서열
서열번호 65: Candida maltosa, Xu316의 ADH2 유전자 서열
서열번호 66: Kluyveromyces marxianus, DMKU3-1042의 ADH4 아미노산 서열
서열번호 67: Kluyveromyces marxianus, DMKU3-1042의 ADH4 유전자 서열
서열번호 68: Escherichia coli, 7.1982의 ADH1 아미노산 서열
서열번호 69: Escherichia coli, 7.1982의 ADH1 유전자 서열
서열번호 70: Fusarium graminearum, PH-1의 ADH1 아미노산 서열
서열번호 71: Fusarium graminearum, PH-1의 ADH1 유전자 서열
구체적으로, ADH2 상동체는 서열번호 50에 대해 60%, 70%, 80%, 85%, 90%, 또는 95% 서열 동일성 중 어느 하나 이상을 갖는다. ADH2 상동체는 본 명세서에서 ADH2 상동체를 인코딩하는 것으로 이해된다. 구체적으로, 서열 동일성은 예를 들어 전장 서열을 비교할 때 본원에 추가로 개시된 바와 같이 결정된다.
구체적으로, 상동체 또는 상동성 서열은 예를 들어 알코올 탈수소효소(EC 1.1. 1.1.).
구체적으로, 상동체 또는 상동성 서열은 예를 들어 알코올 탈수소효소(EC 1.1.1.1.)와 같은 P. pastoris, 특히 K. pastoris 또는 K. phaffii에서와 같은 야생형 숙주 세포에서 ADH2 단백질의 동일한 정성적 기능을 특징으로 한다.
구체적으로, 서열번호 50의 상동 서열은 P. pastoris, 이외의 종, 특히 K. pastoris 또는 K. phaffii, 예를 들어 Komagataella 또는 Pichia 속의 또 다른 효모이고, 본 명세서에 기재된 바와 같이 증가된 (예를 들어, 노크인) 각각의 내인성 코딩 서열의 발현이다.
숙주 세포가 P. pastoris, 특히 K. pastoris 또는 K. phaffii의 것인 경우, ADH2 단백질은 내인성 서열, 예를 들어 서열번호 50, 또는 상이한 균주 또는 종의 서열번호 50의 상동체를 포함하거나 구성될 수 있거나 또는 돌연변이 ADH2 단백질의 인공 서열, 이는 야생형 균주 또는 유기체에서 자연적으로 발생하지 않는, 특히 메틸영양성 효모에서 자연적으로 발생하지 않는 것일 수 있다.
특정 예에 따르면, 상동 서열은 야생형 P. pastoris에서 내인성 자연 발생 P. pastoris 알코올 탈수소효소의 활성과 비교하여 0.2배, 0.3배, 0.4배, 0.5배, 0.6배, 0.7배, 0.8배, 0.9배, 1배, 1.1-배, 1.2-배, 1.3-배, 1.4-배, 1.5-배, 1.6-배, 1.7-배, 1.8-배, 1.9-배, 2-배 또는 훨씬 더 높은 알코올 탈수소효소 활성 중 어느 하나 이상을 갖는다. 알코올 탈수소효소 활성은 예를 들어 무세포(cell free) 추출물을 사용하는 알코올 탈수소효소 검정과 같은 적절한 검정으로 측정할 수 있다. 무세포 추출물은 Karaoglan 등. (Biotechnol Lett. 2016; 38(3):463-9)에서 기술된 바와 같이, 지르코니아/실리카/유리 비드에 의한 세포 배양물의 기계적 파쇄에 의해 얻어질 수 있다. 알코올 탈수소효소 활성은 Walker(Biochemical Education. 1992 21(1):42-43)에 의해 기술된 바와 같이 340 nm의 파장에서 흡수 증가를 측정함으로써 NADH의 형성 후에 측정될 수 있다. NAD+와 알코올은 기질로 사용될 수 있으며 등몰 농도로 소비된다. NADH 생산은 NAD+ 소비와 반비례한다. 또는 상용 비색 알코올 탈수소효소 활성 분석 키트(MAK053, Sigma-Aldrich)를 사용할 수 있다. 예시적인 분석은 예시 섹션에 설명되어 있다.
본 명세서에 기재된 바와 같이, 용어 "AOX1"은 서열번호 1 (UniProtKB - F2QY27)로 확인된 아미노산 서열을 포함하거나 이로 구성된 P. pastoris 알코올 옥시다제 1과 같은 천연 알코올 옥시다제 1, 또는 서열번호 1에 대한 특정 상동성(또는 서열 동일성)을 갖는 서열, 이는 메틸영양성 효모 종, 특히 본원의 메틸영양성 효모에 내인성인 P. pastoris 알코올 산화효소 1의 상동체일 수 있다. 상기 내인성 알코올 옥시다제 1의 발현을 감소시키기 위한 상기 하나 이상의 유전적 변형 이전에 숙주 세포로서 사용된다. 특히, AOX1 단백질은 숙주 세포 종의 종에 내인성인 이종상동체이다.
구체적으로, 본 명세서에서 AOX1 유전자로 지칭되는 P. pastoris 알코올 옥시다제 1을 코딩하는 유전자는 서열번호 2로 확인된 뉴클레오티드 서열을 포함하거나 이로 이루어진다.
상동 서열은 또한 AOX1 상동체 또는 AOX1 상동체로 지칭된다. 구체적으로, AOX1 단백질 또는 AOX1 상동체는 EC 1.1.3.13으로 분류되는 알코올 산화효소 효소이다.
구체적으로, AOX1 상동체는 서열번호 1에 대해 60%, 70%, 80%, 85%, 90%, 또는 95% 서열 동일성 중 적어도 어느 하나를 갖는다. AOX1 상동체는 본 명세서에서 AOX1 상동체를 인코딩하는 것으로 이해된다. 구체적으로, 서열 동일성은 예를 들어 전장 서열을 비교할 때 본원에 추가로 개시된 바와 같이 결정된다.
본 명세서에 기재된 바와 같이, 용어 "AOX2"는 서열번호 3 (UniProtKB - F2R038)으로 확인된 아미노산 서열을 포함하거나 이로 구성된 P. pastoris 알코올 산화효소 2와 같은 천연 알코올 산화효소 2, 또는 서열번호 3에 대한 특정 상동성(또는 서열 동일성)을 갖는 서열, 이는 메틸영양성 효모 종, 특히 본원의 메틸영양성 효모에 내인성인 P. pastoris 알코올 산화효소 2의 상동체일 수 있다. 상기 내인성 알코올 산화효소 2의 발현을 감소시키기 위한 상기 하나 이상의 유전적 변형 전에 숙주 세포로서 사용된다. 특히, AOX2 단백질은 숙주 세포 종의 종에 내인성인 이종상동체이다.
구체적으로, 본원에서 AOX2 유전자로 지칭되는 P. pastoris 알코올 옥시다제 2를 코딩하는 유전자는 서열번호 4로 확인된 뉴클레오티드 서열을 포함하거나 이로 이루어진다.
상동 서열은 또한 AOX2 상동체 또는 AOX2 상동체로 지칭된다. 구체적으로, AOX2 단백질 또는 AOX2 동족체는 EC 1.1.3.13으로 분류되는 알코올 산화효소 효소이다.
구체적으로, AOX2 상동체는 서열번호 3에 대해 60%, 70%, 80%, 85%, 90%, 또는 95% 서열 동일성 중 어느 하나 이상을 갖는다. AOX2 상동체는 본 명세서에서 AOX2 상동체를 인코딩하는 것으로 이해된다. 구체적으로, 서열 동일성은 예를 들어 전장 서열을 비교할 때 본원에 추가로 개시된 바와 같이 결정된다.
구체적으로, AOX1 및/또는 AOX2 단백질은 숙주 세포가 P. pastoris, 특히 K. pastoris 및 K. phaffii인 경우 각각 P. pastoris 기원, 특히 K. pastoris 또는 K. phaffii 기원이다. 대안적으로, 각각의 AOX1 및 AOX2 단백질은 P. pastoris, 특히 K. pastoris 또는 K. phaffii 기원의 각각의 단백질의 상동(또는 상동) 서열을 포함하며, 이 상동(이종상동) 서열은 야생형 숙주 세포(다른 기원 또는 종의 경우)에 내인성이다. 예를 들어, 숙주 세포가 K. phaffii인 경우, 내인성 AOX1 또는 AOX2 단백질은 각각 서열번호 1 및 서열번호 3으로 확인된 아미노산 서열을 포함하거나 이로 이루어진다.
다른 예에 따르면, 숙주 세포가 K. pastoris인 경우, 내인성 AOX1 단백질은 서열번호 9(Komagataella pasteris, ATCC 28485)로 확인된 아미노산 서열을 포함하거나 이로 구성되며, 이는 서열번호 1과 99.85% 동일하다.
다른 예에 따르면, 숙주 세포가 K. pastoris인 경우, 내인성 AOX2 단백질은 서열번호 3과 99.40% 동일한 서열번호 11로 확인된 아미노산 서열을 포함하거나 이로 이루어진다.
예시적인 상동체는 도 1에 설명되어 있다:
서열번호 9: Komagataella pastoris, ATCC 28485의 AOX1 아미노산 서열
서열번호 10: Komagataella pastoris, ATCC 28485의 AOX1 뉴클레오티드 서열
서열번호 11: Komagataella pastoris, ATCC 28485의 AOX2 아미노산 서열
서열번호 12: Komagataella pastoris, ATCC 28485의 AOX2 뉴클레오티드 서열
서열번호 13: Ogataea methanolica JCM 10240의 MOD1 아미노산 서열
서열번호 14: Ogataea methanolica JCM 10240의 MOD1 뉴클레오티드 서열
서열번호 15: Ogataea methanolica JCM 10240의 MOD2 아미노산 서열
서열번호 16: Ogataea methanolica JCM 10240의 MOD2 뉴클레오티드 서열
서열번호 17: Ogataea methanolica JCM 10240의 pMOD1 프로모터 서열
서열번호 18: Ogataea methanolica JCM 10240의 pMOD2 프로모터 서열
서열번호 19: Ogataea polymorpha NCYC 495 leu 1.1의 MOX 아미노산 서열
서열번호 20: Ogataea polymorpha NCYC 495 leu 1.1의 MOX 뉴클레오티드 서열
서열번호 21: Ogataea polymorpha NCYC 495 leu 1.1의 pMOX 프로모터 서열
그러나, 숙주 세포가 다른 종의 경우(K. pastoris 및/또는 K. phaffii는 제외), 숙주 세포에 내인성인 AOX1 또는 AOX2 단백질 서열은 각각 서열번호 1 및 서열번호 3에 대한 상동체이고, 숙주 세포에서 이러한 상동체의 발현(각각 서열번호 1 및 서열번호 3의 이종 서열)은 본원에 기재된 목적을 위해 감소된다.
구체적으로, 임의의 또는 각각의 상동 서열은 P. pastoris, 특히 K. pastoris 또는 K. phaffii, 예를 들면 알코올 산화효소(EC 1.1.3.13)에서와 같은 야생형 숙주 세포에서 각각의 AOX1 및 AOX2 단백질의 동일한 정성적 기능을 특징으로 한다.
구체적으로, 서열번호 1 및 서열번호 3의 각각의 상동성 서열은 P. pastoris, 특히 K. pastoris 또는 K. phaffii, 예를 들어, Komagataella 또는 Pichia 속의 또 다른 효모이외의 종의 것이고, 각각의 내인성 코딩 서열의 발현은 본 명세서에 기재된 바와 같이 각각의 내인성 코딩 서열의 감소 또는 폐지(녹아웃)된다.
구체적으로, AOX1 및 AOX2 단백질 모두는 숙주 세포에 내인성이며, 각각 AOX1 및 AOX2를 코딩하는 유전자의 발현이 감소되거나 결실된다.
구체적으로, AOX1 및 AOX2 단백질 둘 모두는 동일한 기원을 가지며, 상기 제1 및 제2 내인성 유전자의 발현을 감소시키기 위한 조작 전에 동일한 숙주 세포(또는 숙주 세포 종)에서 기원하거나 내인성이다.
구체적으로, AOX1 및 AOX2 단백질 둘 모두는 P. pastoris 기원, 특히 숙주 세포에 내인성인 각각의 유전자에 의해 코딩되는 단백질이고, 여기서 숙주 세포는 P. pastoris이다.
구체적으로, AOX1 및 AOX2 단백질 모두는 Komagataella phaffii 기원, 특히 숙주 세포에 내인성인 각각의 유전자에 의해 코딩되는 단백질이고, 여기서 숙주 세포는 Komagataella phaffii이다.
구체적으로, AOX1 및 AOX2 단백질 모두는 Komagataella pastoris 기원, 특히 숙주 세포에 내인성인 각각의 유전자에 의해 코딩되는 단백질이고, 여기서 숙주 세포는 Komagataella pastoris이다.
특정 측면에 따르면, 상기 하나 이상의 유전적 변형은 (i) 하나 이상의 폴리뉴클레오타이드, 또는 이의 일부; 또는 (ii) 발현 조절 서열의 파괴, 치환, 결실, 녹인 또는 녹아웃을 포함한다.
특정 측면에 따르면, 상기 하나 이상의 유전적 변형은 예를 들어 각각의 AOX1, AOX2 또는 ADH2 단백질, 특히 숙주 세포 종, 유형 또는 균주에서 자연적으로 발생하는 야생형(비변형 또는 천연) 단백질, 또는 상기 폴리뉴클레오티드(또는 유전자)의 발현을 제어하는 뉴클레오티드 서열을 코딩하는 상기 폴리뉴클레오티드(또는 유전자)를 포함하는 코딩 폴리뉴클레오티드와 같은 본원에 기재된 숙주 세포의 하나 이상의 내인성 폴리뉴클레오티드의 것이다.
특정 측면에 따르면, 상기 하나 이상의 유전적 변형은 예를 들어 프로모터, 리보솜 결합 부위, 전사 또는 번역 시작 및 정지 서열을 포함하는 발현 조절 서열, 또는 인핸서 또는 활성제 서열의 것이다.
숙주 세포를 조작하는 다양한 방법을 사용하여 다음과 같은 내인성 폴리뉴클레오티드의 발현을 조절(감소 또는 증가)시킬 수 있습니다.
a) 각각의 AOX1 또는 AOX2 단백질을 코딩하는 유전자의 발현을 감소시키기 위하여, 예를 들어, 각각의 AOX1 또는 AOX2 단백질을 코딩하는 폴리뉴클레오티드의 파괴, 이러한 폴리뉴클레오티드에 작동가능하게 연결된 프로모터의 파괴, 더 낮은 프로모터 활성을 갖는 다른 프로모터로 이러한 프로모터를 대체; 또는
b) ADH2 단백질을 코딩하는 유전자의 발현을 증가시키기 위해, 예를 들어, ADH2 단백질을 코딩하는 폴리뉴클레오티드를 숙주 세포 게놈에 도입, 이러한 폴리뉴클레오티드에 작동 가능하게 연결된 프로모터를 파괴, 이러한 프로모터를 더 높은 프로모터 활성를 갖는 다른 프로모터로 교체.
유전자 발현을 조절하는 특정 방법은 숙주 세포를 변형시키는 CRISPR 기반 방법에 사용되는 RNA 가이드된 리보뉴클레아제에 의한 서열에 표적화된 각각의 전사 조절인자들, 예를 들어, 프로모터, 리보솜 결합 부위, 전사 시작 또는 정지 서열, 번역 시작 또는 정지 서열, 인핸서 또는 활성제 서열, 억제인자 또는 억제제 서열, 신호 또는 리더 서열, 특히 단백질의 발현 및/또는 분비를 조절하는 서열로 이루어진 군으로부터 선택된 조절 서열 폴리뉴클레오티드(유전자)의 발현을 조절하는 조절 서열을 조절(예: 활성화, 상향 조절, 비활성화, 억제 또는 하향 조절)하는 것을 사용한다.
특정 측면에 따르면, 상기 하나 이상의 유전적 변형은 ADH2의 수준 또는 활성을 증가시키는 ADH2 유전자의 기능 획득(gain-of-function) 변경을 포함한다.
구체적으로, 상기 기능 획득 변경은 ADH2 유전자의 녹킨을 포함한다.
구체적으로, 상기 기능 획득 변경은 상기 세포에서 ADH2 유전자 발현을 상향 조절한다.
구체적으로, 상기 기능 획득 변경은 상기 세포에서 ADH2 유전자를 과발현하기 위한 이종 발현 카세트의 삽입을 포함한다.
구체적으로, 상기 이종 발현 카세트는 프로모터 서열의 제어 하에 ADH2 유전자를 포함하는 이종 폴리뉴클레오티드를 포함한다. 이러한 프로모터는 구성적, 억제성 또는 유도성 프로모터 중 임의의 것일 수 있다.
구체적으로, 유전자의 발현을 증가시키기 위한 상기 하나 이상의 유전적 변형은 유전자 또는 유전자의 일부의 발현을 적어도 50%, 60% 증가시키는 유전자 또는 게놈 서열의 삽입 또는 활성화를 포함하는 하나 이상의 게놈 돌연변이, 70%, 80%, 90%, 또는 95%, 또는 훨씬 더 예를 들어, 이종 유전자의 녹인(knockin)에 의해, 또는 내인성 유전자의 카피 수 증가에 의해 이러한 유전적 변형이 없는 각각의 숙주와 비교된다.
구체적으로, 발현을 증가시키는 하나 이상의 유전적 변형은 하나 이상의 내인성 폴리뉴클레오티드의 발현을 구성적으로 개선하거나 그렇지 않으면 증가시키는 게놈 돌연변이를 포함한다.
구체적으로, 발현을 증가시키는 하나 이상의 유전적 변형은 하나 이상의 내인성 폴리뉴클레오티드의 발현을 조건부로 개선하거나 그렇지 않으면 증가시키는 하나 이상의 유도성 또는 억제성 조절 서열을 도입하는 게놈 돌연변이를 포함한다. 이러한 조건부 활성 변형은 특히 세포 배양 조건에 따라 활성 및/또는 발현되는 조절 요소 및 유전자를 표적으로 한다.
구체적으로, ADH2 단백질을 코딩하는 폴리뉴클레오티드의 발현은 POI(Protein of Interest)의 생산 방법에서 숙주 세포를 사용하는 경우 증가된다. 구체적으로, 유전자 변형 시 POI가 생성되는 숙주 세포 배양 조건에서 ADH2 단백질의 발현이 증가한다.
구체적으로, 숙주 세포는 ADH2 단백질의 양(예를 들어, 수준, 활성 또는 농도)을 50%, 60%, 70%, 80%, 90%, 또는 95% 중 적어도 어느 하나로 증가시키도록 유전적으로 변형된다. 예를 들어, 하나 이상의 각각의 ADH2 유전자의 녹인에 의해 상기 변형이 없는 숙주 세포와 비교하여 %, (mol/mol), 또는 그 이상. 특정 실시양태에 따르면, 숙주 세포는 (하나 이상의) 게놈 서열, 특히 숙주 세포 게놈에 통합된 각각의 ADH2 단백질을 코딩하는 게놈 서열의 하나 이상의 삽입을 포함하도록 유전적으로 변형된다. 이러한 숙주 세포는 일반적으로 녹인 균주로 제공된다.
특정 실시양태에 따르면, 본원에 기재된 숙주 세포가 세포 배양물에서 배양되면, 숙주 세포 또는 숙주 세포 배양물에서 ADH2 단백질의 총량이 50%, 60%, 70%, 80%, 90%, 또는 95%, (활성% 또는 mol/mol), 또는 심지어 100% 이상 중 적어도 어느 하나로 증가된다. 이러한 유전적 변형 전 또는 없이 숙주 세포에 의해 발현되거나 생성된 기준량, 또는 비교 각각의 숙주 세포 배양물에서 생성된 기준량으로, 또는 상기 변형 전 또는 변형 없이 숙주 세포와 비교된다.
구체적으로, AOX1 및/또는 AOX2 유전자와 같은 유전자의 발현을 감소시키기 위한 상기 하나 이상의 유전적 변형은 유전자 또는 그 일부의 발현을 감소시키는 유전자 또는 게놈 서열의 결실 또는 불활성화를 포함하는 하나 이상의 게놈 돌연변이를 포함하거나 유전자의 적어도 50%, 60%, 70%, 80%, 90%, 또는 95%, 또는 심지어 이러한 유전자 변형이 없는 각각의 숙주와 비교하여 유전자의 녹아웃과 같은 유전자 발현의 완전한 제거된 유전자 또는 그 부분을 포함한다.
구체적으로, 발현을 감소시키는 하나 이상의 유전자 변형은 하나 이상의 내인성 폴리뉴클레오티드의 발현을 구성적으로 손상시키거나 그렇지 않으면 감소시키는 게놈 돌연변이를 포함한다.
구체적으로, 발현을 감소시키는 하나 이상의 유전적 변형은 하나 이상의 내인성 폴리뉴클레오티드의 발현을 조건부로 손상시키거나 그렇지 않으면 감소시키는 하나 이상의 유도성 또는 억제성 조절 서열을 도입하는 게놈 돌연변이를 포함한다. 이러한 조건부 활성 변형은 특히 세포 배양 조건에 따라 활성 및/또는 발현되는 조절 요소 및 유전자를 표적으로 한다.
구체적으로, 관심 단백질(POI)을 생산하는 방법에서 숙주 세포를 사용할 때 상기 하나 이상의 내인성 폴리뉴클레오타이드의 발현이 감소되어 각각의 AOX1 또는 AOX2 단백질을 인코딩하는 폴리뉴클레오타이드의 발현이 감소된다. 구체적으로, 유전자 변형시, AOX1 및 AOX2 단백질 둘 다의 발현은 POI가 생성되는 동안 숙주 세포 배양 조건 하에서 감소된다.
구체적으로, 숙주 세포는 AOX1 및 AOX2 단백질 둘 다의 양(예: 수준, 활성 또는 농도)을 상기 변형이 없는 숙주 세포와 비교하여 50%, 60%, 70%, 80%, 90%, 또는 95%, (활성%, 또는 mol/mol), 또는 심지어 100%, 예를 들어, 각각의 AOX1 및 AOX2 유전자의 녹아웃에 의해 AOX1 및 AOX2 단백질 모두의 생산을 검출할 수 없는 양으로 완전히 제거된 비-검출 양 중 적어도 어느 하나로 감소시키도록 유전적으로 변형된다. 특정 실시양태에 따르면, 숙주 세포는 (하나 이상의) 게놈 서열, 특히 각각의 AOX1 및/또는 AOX2 단백질을 코딩하는 게놈 서열의 하나 이상의 결실을 포함하도록 유전적으로 변형된다. 이러한 숙주 세포는 전형적으로 결실 또는 녹아웃 균주로서 제공된다.
특정 측면에 따르면, 상기 제1 및/또는 제2 내인성 유전자는 상기 하나 이상의 유전적 변형에 의해 녹아웃된다. 구체적으로, Mut- 숙주 세포는 △AOX1/△AOX2 녹아웃 균주이다.
특정 측면에 따르면, 상기 제1 및/또는 제2 내인성 유전자는 상기 하나 이상의 유전적 변형에 의해 녹아웃되고; 상기 ADH2 유전자는 상기 하나 이상의 유전적 변형에 의해 녹인된다. 구체적으로, Mut- 숙주 세포는 △AOX1/△AOX2 + ADH2-OE 균주이다.
특정 실시양태에 따르면, 본원에 기재된 숙주 세포가 세포 배양물에서 배양되면, 숙주 세포 또는 숙주 세포 배양물에서 각각의 AOX1 및/또는 AOX2 단백질의 총량이 50%, 60%, 70%, 80%, 90%, 또는 95%, (mol/mol), 또는 심지어 100%, 예를 들어 이러한 유전적 변형 전 또는 없이 숙주 세포에 의해 발현되거나 생성된 기준량과 비교하거나, 각각의 숙주 세포 배양에서 생성된 기준량과 비교하거나, 또는 상기 변형 전 또는 없는 숙주 세포와 비교하여 검출 불가능한 양 중 적어도 어느 하나에 의해 감소된다.
각각의 ADH2, AOX1 또는 AOX2 단백질의 생산을 증가 또는 감소시키는 상기 유전적 변형의 효과에 대해 본원에 기재된 숙주 세포를 비교할 때, 이는 전형적으로 이러한 유전적 변형 전 또는 없이 비교가능한 숙주 세포와 비교된다. 특히 상기 POI를 생성하는 조건 하에 배양될 때 재조합 또는 이종 POI를 생성하도록 조작된 유전자 변형 없이(또는 이전에) 동일한 숙주 세포 종 또는 유형으로 비교가 이루어진다. 그러나, 재조합 또는 이종 POI를 생성하도록 추가로 조작되지 않은 동일한 숙주 세포 종 또는 유형으로 비교가 이루어질 수도 있다.
특정 측면에 따르면, 각각의 ADH2, AOX1 또는 AOX2 단백질의 증가 또는 감소는 세포 내 각각의 단백질의 양(예를 들어, 수준, 활성 또는 농도)의 증가 또는 감소에 의해 결정된다. 구체적으로, 상기 단백질의 양은 웨스턴 블롯, 면역형광 영상화, 유세포분석 또는 질량분석법, 특히 질량분석법이 액체 크로마토그래피-질량분석법(LC-MS) 또는 액체 크로마토그래피를 사용하는 것과 같은 적절한 방법에 의해 결정됩니다. 탠덤 질량 분석법(LC-MS/MS), 예를 들어 Doneanu 등. (MAbs. 2012; 4(1): 24-44). 구체적인 예에 따르면, 알코올 탈수소효소 활성은 무세포 추출물을 이용한 활성 분석에 의해 측정될 수 있다. 무세포 추출물은 Karaoglan 등. (Biotechnol Lett. 2016; 38(3): 463-9)에 의해 기술된 지르코니아/실리카/유리 비드에 의한 세포 배양의 기계적 파괴에 의해 획득될 수 있다. 알코올 탈수소효소 활성은 Walker (Biochemical Education. 1992 21(1):42-43)에 의해 기술된 바와 같이 340 nm의 파장에서 흡수 증가를 측정함으로써 NADH의 형성 직후에 측정된다. NAD+와 알코올은 기질로 사용되며 등몰 농도로 소비된다. NADH 생산은 NAD+ 소비와 반비례한다. 또는 상용 비색 알코올 탈수소효소 활성 분석 키트(MAK053, Sigma-Aldrich)를 사용할 수 있다. 알코올 산화효소 활성은 Verduyn 등. (Journal of Microbiological Methods. 1984(2)1: 15-25)이 설명한 대로 과산화수소와 반응하는 2,2'-azino-bis-(3-ethylbenzothiazoline-6-sulfonic acid)를 사용하여 열량 측정법으로 측정되거나 Couder 및 Baratti(Agric. Bioi. Chern. 1980; 44(10):2279-2289)에 의해 기술된 바와 같이 형성된 포름알데히드의 양으로 측정될 수 있다. 자세한 분석은 실시예 섹션에 기술되어 있다.
특정 측면에 따르면, Mut- 숙주 세포는 관심 단백질(POI)을 암호화하는 관심 유전자(GOI)에 작동가능하게 연결된 발현 카세트 프로모터(expression cassette promoter, ECP)를 포함하는 이종 관심 유전자 발현 카세트(gene of interest expression cassette, GOIEC)를 포함한다.
특정 측면에 따르면, 돌연변이-숙주 세포는 적어도 하나의 이종 GOIEC를 포함하는 재조합 숙주 세포이고, 여기서 GOIEC에 포함된 적어도 하나의 성분 또는 성분의 조합은 숙주 세포에 대해 이종이다. 구체적으로, 인공 발현 카세트가 사용되며, 특히 프로모터와 GOI가 서로에 대해 이종성이고, 자연에서 이러한 조합으로 발생하지 않고, 예를 들어 프로모터와 GOI 중 하나(또는 하나만)가 인공적이거나 이종성인 경우 기타 및/또는 본원에 기재된 숙주 세포; 프로모터는 내인성 프로모터이고 GOI는 이종 GOI이고; 또는 프로모터는 인공 또는 이종 프로모터이고 GOI는 내인성 GOI이고; 여기서 프로모터 및 GOI 둘 모두는 인공적이거나, 이종적이거나, 본원에 기재된 숙주 세포와 비교하여 세포의 상이한 종 또는 유형(균주)과 같은 상이한 기원으로부터 유래한다. 구체적으로, ECP는 본 명세서에 기재된 숙주 세포로서 사용되는 세포에서 상기 GOI와 자연적으로 연관되거나 작동가능하게 연결되지 않는다.
구체적으로, GOIEC는 구성적(constitutive), 유도성(inducible) 또는 억제성(repressible) 프로모터를 포함한다.
구성적 프로모터의 구체적인 예는 예를 들어 WO2014139608에 공개된 pGAP 및 이의 기능적 변이체, pCS1과 같은 구성적 프로모터 중 임의의 것을 포함한다.
유도성 또는 억제성 프로모터의 특정 예는 예를 들어 WO2013050551에 공개된 천연 pAOX1 또는 pAOX2 및 이의 기능적 변이체, 임의의 조절 프로모터, 예를 들어 pG1-pG8, 및 이의 단편; WO2017021541 A1에 공개된 pG1 및 pG1-x와 같은 임의의 조절 프로모터를 포함한다.
효모 숙주 세포와 함께 사용하기에 적합한 프로모터 서열은 Mattanovich 등. (Methods Mol. Biol. (2012) 824:329-58)에 기술되어 있고, triosephosphate isomerase (TPI)와 같은 당분해효소, phosphoglycerate kinase (PGK), glyceraldehyde-3- phosphate dehydrogenase (GAPDH or GAP) 및 이의 변이체, lactase (LAC) and galactosidase (GAL), P. pastoris glucose-6-phosphate isomerase promoter (PPGI), 3- phosphoglycerate kinase promoter (PPGK), the glycerol aldehyde phosphate dehydrogenase promoter (pGAP), translation elongation factor promoter (PTEF), 및 P. pastoris enolase 1 (PEN01) 프로모터, triose phosphate isomerase (PTPI), ribosomal subunit proteins (PRPS2, PRPS7, PRPS31, PRPL1), alcohol oxidase promoter (PAOX1, PAOX2) 또는 변형된 특성을 갖는 이의 변이체, formaldehyde dehydrogenase promoter (PFLD), isocitrate lyase promoter (PICL), alpha-ketoisocaproate decarboxylase promoter (PTHI), heat shock protein family members (PSSA1, PHSP90, PKAR2)의 프로모터, 6-Phosphogluconate dehydrogenase (PGND1), phosphoglycerate mutase (PGPM1), transketolase (PTKL1), phosphatidylinositol synthase (PPIS1), ferro-02-oxidoreductase (PFET3), high affinity iron permease (PFTR1), repressible alkaline phosphatase (PPH08), N-myristoyl transferase (PNMT1), pheromone response transcription factor (PMCM1), ubiquitin (PUBI4), single- stranded DNA endonuclease (PRAD2)의 프로모터, mitochondrial inner membrane (PPET9)의 주요 ADP/ATP 운반체의 프로모터(WO2008/128701) 및 formate dehydrogenase (FMD) 프로모터를 포함한다.
적합한 프로모터의 추가 예에는 Saccharomyces cerevisiae enolase (ENO1), Saccharomyces cerevisiae galactokinase (GAL1), Saccharomyces cerevisiae alcohol dehydrogenase/glyceraldehyde-3-phosphate dehydrogenase (ADH1, ADH2/GAP), Saccharomyces cerevisiae triose phosphate isomerase (TPI), Saccharomyces cerevisiae metallothionein (CUP1), 및 Saccharomyces cerevisiae 3-phosphoglycerate kinase (PGK), 및 maltase gene promoter (MAL)를 포함한다.
GAP 프로모터(pGAP), AOX1(pAOX1) 또는 AOX2(pAOX2) 프로모터 또는 이들의 기능적 변이체인 프로모터이고, pGAP, pAOX1 또는 pAOX2 중 어느 하나로부터 유도된 프로모터가 특히 바람직하다. pAOX 프로모터는 메탄올에 의해 유도될 수 있으며 포도당에 의해 억제된다. 구체적으로, 기능적 변이체는 그것이 유래된 프로모터에 대해 80%, 85%, 90%, 95% 또는 100% 서열 동일성 중 적어도 어느 하나를 가지며 그것이 유래된 프로모터에 대해 거의 동일한 프로모터 활성(예: +/- 50%, 40%, 30%, 20%, 또는 10% 중 어느 하나; 프로모터 활성이 향상될 수 있음에도 불구하고)을 가지고 있다.
특정 구현예에 따르면, ECP는 메탄올-유도성이다. 특히 ECP는 메탄올로 조절된다. 구체적으로, ECP는 메탄올 함유 세포 배양에서 완전히 유도될 수 있다. 이러한 경우, 메탄올은 세포 배양에 공급되는 에너지원으로 사용될 수 있을 뿐만 아니라 ECP 유도 시 POI 발현을 유도하기 위해 사용될 수 있다.
특정 측면에 따르면, ECP는 POI를 생성하기 위한 탄소원으로 사용되는 세포 배양물에 존재하는 메탄올의 양에 의해 메탄올-유도성이다. 구체적으로, 이종 발현 카세트에 의한 GOI 발현은 메탄올 유도성 ECP에 의해 유도될 수 있다.
구체적으로, ECP는 메탄올-유도성이며, 예를 들어, 세포 배양 배지 또는 상청액에서 0.1%, 0.05%, 또는 0.01%(v/v) 중 어느 하나보다 작은 양(본 명세서에서 촉진제 억제량이라고 함)인 메탄올의 부재하에 억제된다.
구체적으로, ECP는 메탄올-유도성이며, 예를 들어 촉진제-억제량보다 높은 메탄올 양의 존재 하에 예를 들어 세포 배양 배지 또는 상청액 중 0.1%, 0.5%, 1%, 1.5%, 2.0 %, 2.5% 또는 3%(v/v)(본 명세서에서 프로모터 유도량이라 함) 중 적어도 어느 하나만큼 유도된다.
구체적으로, ECP는 본 명세서에 기술된 세포 배양 방법에서 사용되는 메탄올 양에 의해 완전히 유도된다. ECP 프로모터는 배양 조건이 최대 유도를 제공하는 경우 완전히 유도된 것으로 간주된다.
세포 배양 배지 또는 상청액 중 이러한 양은 특히 숙주 세포의 공급 및 숙주 세포에 의한 소비가 검출될 수 있는 양으로 이해된다. 일반적으로, 세포 배양의 생산 단계 동안 POI를 생성할 때, 세포 배양은 보충 탄소원을 추가함으로써 공급되지만 POI 생성 동안 세포에 의해 즉시 소비되는 양으로, 따라서 세포 배양 배지 또는 상청액에 남아 있는 양, 예를 들어 최대 1.0g/L의 양이 제공된다.
구체적으로, ECP는 숙주 세포에 대해 내인성 또는 이종성이다.
구체적으로, ECP는 다음 중 하나이다.
a) 서열번호 5에 대한 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 100% 서열 동일성 중 적어도 어느 하나를 포함하거나 이로 구성된 pAOX1 프로모터; 또는
b) 서열번호 6에 대한 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 100% 서열 동일성 중 적어도 어느 하나를 포함하거나 이로 구성된 pAOX2 프로모터; 또는
c) 서열번호 36-49로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 포함하거나 이로 구성된 프로모터.
구체적으로, 표 38에 열거된 임의의 메탄올-유도성 프로모터, 특히 서열번호 36-49로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 포함하거나 이로 이루어진 것이 사용될 수 있다.
적어도 60%의 서열 동일성을 특징으로 하는 기능성 pAOX1 및 pAOX2 프로모터 변이체는 본원에 추가로 기재된 예시적인 메탄올-유도성 프로모터에 의해 예시된다. 예를 들어, 서열번호 17(Ogataea methanolica JCM 10240의 pMOD1 프로모터 서열)은 서열번호 5와 비교하여 54.0%의 서열 동일성을 가지며; 및 서열번호 18(Ogataea methanolica JCM 10240의 pMOD2 프로모터 서열)은 서열 번호 6과 비교하여 53.7%의 서열 동일성을 갖는다. 각각의 pAOX1 및 pAOX2 프로모터와 비교한 pMOD1 및 pMOD2 프로모터의 서열 동일성은 LALIGN 버전 36.3.8g Dec, 2017을 사용한 정렬에 의해 결정되었다. 결과는 동일한 시퀀스 방향과 가장 높은 중첩으로 정렬된 시퀀스를 나타낸다(매개변수: 매트릭스: +5/-4; GAP OPEN: -5; Gap Extend: -4; E() 임계값 10.0; 출력 형식: MARKX 0; 그래픽: 예).
추가의 예시적인 메탄올 유도성 프로모터는 표 38에 열거되어 있거나, 또는 pSHB17, pALD4, pFDH1, pDAS1, pDAS2, pPMP20, pFBA1-2 pPMP47, pFLD, pFGH1, pTAL1-2, pDAS2, pCAM1, pPP7435_Chr1-0336 는 Gasser 등(Gasser, Steiger, & Mattanovich, 2015, Microb Cell Fact. 14: 196)에 의해 기술되어 있다.
본 명세서에 기재된 바와 같이, 용어 "pAOX1"은 서열번호 5로 확인된 서열을 포함하는 프로모터, 또는 서열번호 5와 특정 상동성(또는 서열 동일성)을 갖는 서열 둘 다를 지칭할 것이다. 상동 서열은 또한 pAOX1 상동체로 지칭된다. pAOX1 상동체는 예를 들어 임의의 적합한 돌연변이유발 방법에 의해 생성된 천연의 자연 발생 서열 또는 이의 돌연변이체일 수 있다.
본원에 기재된 바와 같이, 용어 "pAOX2"는 서열번호 6으로 확인된 서열을 포함하는 프로모터, 또는 서열번호 6과 특정 상동성(또는 서열 동일성)을 갖는 서열 둘 다를 지칭할 것이다. 상동 서열은 또한 pAOX2 상동체로 지칭된다. pAOX2 상동체는 예를 들어 임의의 적합한 돌연변이유발 방법에 의해 생성된 천연의 자연 발생 서열 또는 이의 돌연변이체일 수 있다.
본원에 기재된 pAOX1 또는 pAOX2 돌연변이체는 필적하는 발현 시스템 또는 생산 숙주 세포주에서 측정시 유도된 상태에 있을 때 각각의 천연 pAOX1 또는 pAOX2 프로모터와 비교하여 약 0.5배 내지 1.1배, 1.2배, 1.3배, 1.4배, 1.5배, 1.6배, 1.7배, 1.8배, 1.9배, 2배, 2.1배, 2.2배, 2.3배, 2.4배, 2.5배, 2.6배, 2.7배, 2.8배, 2.9배 각각의 천연 pAOX1 또는 pAOX2 프로모터와 비교하여 배, 3배, 3.3배, 3.5배, 3.8배, 4배, 4.5배, 5배, 5.5배 또는 적어도 6배 증가된 프로모터 강도를 특징으로 한다.
구체적으로, 프로모터 강도는 모델 단백질(예를 들어, 녹색 형광 단백질, GFP, 예를 들어, 강화 GFP, eGFP, Gene Bank Accession no. U57607을 포함함) 및/또는 전사와 같은 POI의 발현 수준 및/또는 전사에 의해 결정된다. 참조 프로모터와 비교하여 강도. 바람직하게는, 전사 분석은 정량적 또는 반정량적이며, 바람직하게는 qRT-PCR, DNA 마이크로어레이, RNA 시퀀싱 및 전사체 분석을 사용한다.
구체적으로, 본원에 기재된 재조합 숙주 세포는 단지 하나 또는 다수의 이종 GOIEC, 예를 들어, 상기 발현 카세트의 다중 카피, 예를 들어 적어도 2, 3, 4, 또는 5 카피(유전자 카피 수, GCN)를 포함한다. 예를 들어, 재조합 숙주 세포는 최대 2, 3, 4 또는 5개의 카피를 포함한다. 각각의 카피는 동일하거나 상이한 서열을 포함하거나 구성될 수 있지만, GOI에 작동가능하게 연결된 ECP를 포함한다.
특정 측면에 따르면, 이종 발현 카세트는 자가 복제 벡터 또는 플라스미드에 포함되거나 상기 숙주 세포의 염색체 내에 통합된다.
발현 카세트는 숙주 세포 내로 도입될 수 있고, 예를 들어 통합의 특정 부위에서 염색체내 요소로서 숙주 세포 게놈(또는 그의 염색체 중 임의의 것) 내로 통합될 수 있고, 이에 따라 높은 생산자 숙주 세포주가 선택된다. 대안적으로, 발현 카세트는 플라스미드 또는 인공 염색체, 예를 들어 효모 인공 염색체(YAC)와 같은 염색체외 유전 요소 내에 통합될 수 있다. 특정 예에 따르면, 발현 카세트는 벡터, 특히 발현 벡터에 의해 숙주 세포 내로 도입되고, 이는 적합한 형질전환 기술에 의해 숙주 세포 내로 도입된다. 이를 위해, GOI는 발현 벡터에 결찰될 수 있다.
바람직한 효모 발현 벡터(이는 바람직하게는 효모에서의 발현에 사용됨)는 pPICZ, pGAPZ, pPIC9, pPICZalfa, pGAPZalfa, pPIC9K, pGAPHis, pPUZZLE 또는 GoldenPiCS로부터 유래된 플라스미드로 이루어진 군으로부터 선택된다.
벡터 또는 플라스미드를 도입하기 위해 숙주 세포를 형질감염시키거나 형질전환시키는 기술은 당업계에 잘 알려져 있다. 여기에는 전기천공, 스페로플라스팅, 지질 소포 매개 흡수, 열 충격 매개 흡수, 인산칼슘 매개 형질감염(인산칼슘/DNA 공동 침전), 바이러스 감염, 특히 변형된 바이러스, 예를 들어 변형된 아데노바이러스 사용, 미세주사 및 전기천공이 포함될 수 있다.
본원에 기재된 형질전환체는 발현 카세트, 벡터 또는 플라스미드 DNA를 숙주에 도입하고 관련 단백질 또는 선택 마커를 발현하는 형질전환체를 선택함으로써 얻을 수 있다. 숙주 세포는 전기 펄스 방법, 원형질체 방법, 리튬 아세테이트 방법 및 이들의 변형 방법과 같은 숙주 세포의 형질전환에 통상적으로 사용되는 방법에 의해 이종 또는 외래 DNA를 도입하도록 처리될 수 있다. P. pastoris는 바람직하게는 전기천공에 의해 형질전환된다. 미생물에 의한 재조합 DNA 단편의 흡수를 위한 바람직한 형질전환 방법은 화학적 형질전환, 전기천공법 또는 원형질성형에 의한 형질전환을 포함한다.
특정 측면에 따르면, 본원에 기재된 이종 GOIEC는 GOI에 작동가능하게 연결된 ECP를 포함하는 폴리뉴클레오티드의 인공 융합, 및 임의로 추가 서열, 예컨대 신호, 리더 또는 종결자 서열을 포함하거나 이로 이루어진다.
구체적으로, 발현 카세트는 GOI에 작동가능하게 연결된 ECP를 포함하고, 선택적으로 POI를 분비된 단백질로서 발현 및 생산하는 데 필요한 신호 및 리더 서열을 추가로 포함한다.
특정 측면에 따르면, GOIEC는 POI의 분비를 가능하게 하는 신호 펩티드를 코딩하는 뉴클레오티드 서열을 포함한다.
구체적으로, 시그널 펩타이드를 코딩하는 뉴클레오티드 서열은 GOI의 5'-말단에 인접하여 융합된다.
구체적으로, 신호 펩티드는 S. cerevisiae 알파-교배 인자 프리프로 펩티드로부터의 신호 서열, P. pastoris 산 포스파타제 유전자(PHO1) 및 세포외 단백질 X(EPX1)로부터의 신호 펩티드로 구성된 군에서 선택된 것이다(Heiss , S., V. Puxbaum, C. Gruber, F. Altmann, D. Mattanovich & B. Gasser, Microbiology 2015;161(7):1356-68).
구체적으로, WO2014067926 A1에 기재된 바와 같은 임의의 신호 및/또는 리더 서열, 특히 서열번호 22 또는 서열번호 23이 사용될 수 있다.
구체적으로, WO2012152823 A1에 기재된 바와 같은 신호 서열, 특히 서열번호 24로 확인된 S. cerevisiae의 천연 알파 교배 인자 또는 그의 돌연변이체의 신호 서열이 사용될 수 있다.
특정 측면에 따르면, 본원에 기재된 숙주 세포는 예를 들어 단백질 생산을 개선하기 위해 하나 이상의 추가의 유전적 변형을 겪을 수 있다.
구체적으로, 숙주 세포는 프로테아제 결핍 균주, 특히 카르복시펩티다아제 Y 활성이 결핍된 균주를 생성하는 데 사용되는 단백질 분해 활성에 영향을 미치는 하나 이상의 유전자를 변형시키도록 추가로 조작된다. 특정 예는 WO1992017595A1에 설명되어 있다. 프로테아제 A 또는 프로테이나제 B와 같은 액포 프로테아제의 기능적 결핍을 갖는 프로테아제 결핍 Pichia 균주의 추가 예는 US6153424A에 기재되어 있다. 추가 예는 ade2 결실 및/또는 프로테아제 유전자 PEP4 및 PRB1 중 하나 또는 둘 모두의 결실이 있는 Pichia 균주이며, 예를 들어 ThermoFisher Scientific에서 제공한다.
구체적으로, 숙주 세포는 기능적 유전자 산물, 특히 WO2010099195A1에 개시된 바와 같은 PEP4, PRB1, YPS1, YPS2, YMP1, YMP2, YMP1, DAP2, GRH1, PRD1, YSP3, 및 PRB3로 이루어진 군에서 선택된 단백분해효소를 코딩하는 적어도 하나의 핵산서열을 변형하여 조작된다. .
헬퍼 인자를 코딩하는 유전자의 과발현 또는 과소발현은 GOI, 예를 들어 WO2015158800A1에 기술된 바와 같은 유전자의 발현을 향상시키기 위해 특이적으로 적용된다.
POI는 진핵생물, 원핵생물 또는 합성 펩티드, 폴리펩티드, 단백질 또는 숙주 세포의 대사산물 중 어느 하나일 수 있다.
특정 측면에 따르면, POI는 돌연변이-숙주 세포 또는 ECP에 대해 이종성이다.
구체적으로, POI는 숙주 세포 종에 대해 이종성이다.
구체적으로, POI는 분비된 펩티드, 폴리펩티드 또는 단백질, 즉 숙주 세포에서 세포 배양 상청액으로 분비된다.
구체적으로, POI는 진핵생물 단백질, 바람직하게는 인간 단백질 또는 인간 단백질 서열을 포함하는 단백질과 같은 포유동물 유래 또는 관련 단백질, 또는 박테리아 단백질 또는 박테리아 유래 단백질이다.
바람직하게는, POI는 포유동물에서 기능하는 치료 단백질이다.
특정한 경우에, POI는 다량체 단백질, 특히 이량체 또는 사량체이다.
구체적으로, POI는 항원 결합 단백질, 치료 단백질, 효소, 펩티드, 단백질 항생제, 독소 융합 단백질, 탄수화물-단백질 접합체, 구조 단백질, 조절 단백질, 백신 항원, 성장 인자, 호르몬, 사이토카인, 처리 효소로 이루어진 군에서 선택된 펩타이드 또는 단백질이다.
구체적으로, 항원 결합 단백질은 하기로 이루어진 군에서 선택된다.
a) 항체 또는 항체 단편, 예를 들어 키메라 항체, 인간화 항체, 이중특이성 항체, Fab, Fd, scFv, 디아바디, 트리아바디, Fv 사량체, 미니바디, VH, VHH, IgNAR 또는 V와 같은 단일 도메인 항체 -NAR;
b) Adnectins, Affibodies, Affilins, Affimers, Affitins, Alphabodies, Anticalins, Avimers, DARPin, Fynomers, Kunitz 도메인 펩티드, Monobodies, 또는 NanoCLAMPS와 같은 항체 모방체; 또는
c) 하나 이상의 면역글로불린-접힘 도메인, 항체 도메인 또는 항체 모방체를 포함하는 융합 단백질.
특정 POI는 항체 또는 이의 단편, 특히 항원 결합 도메인을 포함하는 항체 단편과 같은 항원 결합 분자이다. 특정 POI 중에는 단일클론 항체(mAb), 면역글로불린(Ig) 또는 면역글로불린 클래스 G(IgG)와 같은 항체, 중쇄 항체(HcAb), 또는 단편-항원 결합(Fab), Fd, 단일- 사슬 가변 단편(scFv), 또는 이의 조작된 변이체, 예를 들어 Fv 이량체(디아바디), Fv 삼량체(트리바디), Fv 사량체, 또는 미니바디 및 VH, VHH, IgNAR, 또는 V-NAR과 같은 단일 도메인 항체, 또는 면역글로불린-폴드 도메인을 포함하는 임의의 단백질. 추가 항원-결합 분자는 항체 모방체, 또는 (대체) 스캐폴드 단백질, 예를 들어 조작된 Kunitz 도메인, Adnectin, Affibodies, Affiline, Anticalins 또는 DARPin으로부터 선택될 수 있다.
특정 측면에 따르면, POI는 예를 들면 BOTOX, Myobloc, Neurobloc, Dysport (or other serotypes of botulinum neurotoxins), alglucosidase alpha, daptomycin, YH-16, choriogonadotropin alpha, filgrastim, cetrorelix, interleukin-2, aldesleukin, teceleulin, denileukin diftitox, interferon alpha-n3 (injection), interferon alpha-nl, DL-8234, interferon, Suntory (gamma-1a), interferon gamma, thymosin alpha 1, tasonermin, DigiFab, ViperaTAb, EchiTAb, CroFab, nesiritide, abatacept, alefacept, Rebif, eptoterminalfa, teriparatide (osteoporosis), calcitonin injectable (bone disease), calcitonin (nasal, osteoporosis), etanercept, hemoglobin glutamer 250 (bovine), drotrecogin alpha, collagenase, carperitide, recombinant human epidermal growth factor (topical gel, wound healing), DWP401, darbepoetin alpha, epoetin omega, epoetin beta, epoetin alpha, desirudin, lepirudin, bivalirudin, nonacog alpha, Mononine, eptacog alpha (activated), recombinant Factor VIII+VWF, Recombinate, recombinant Factor VIII, Factor VIII (recombinant), Alphnmate, octocog alpha, Factor VIII, palifermin, indikinase, tenecteplase, alteplase, pamiteplase, reteplase, nateplase, monteplase, follitropin alpha, rFSH, hpFSH, micafungin, pegfilgrastim, lenograstim, nartograstim, sermorelin, glucagon, exenatide, pramlintide, iniglucerase, galsulfase, Leucotropin, molgramostirn, triptorelin acetate, histrelin (subcutaneous implant, Hydron), deslorelin, histrelin, nafarelin, leuprolide sustained release depot (ATRIGEL), leuprolide implant (DUROS), goserelin, Eutropin, KP-102 program, somatropin, mecasermin (growth failure), enlfavirtide, Org-33408, insulin glargine, insulin glulisine, insulin (inhaled), insulin lispro, insulin deternir, insulin (buccal, RapidMist), mecasermin rinfabate, anakinra, celmoleukin, 99 mTc-apcitide injection, myelopid, Betaseron, glatiramer acetate, Gepon, sargramostim, oprelvekin, human leukocyte-derived alpha interferons, Bilive, insulin (recombinant), recombinant human insulin, insulin aspart, mecasenin, Roferon-A, interferon-alpha 2, Alfaferone, interferon alfacon-1, interferon alpha, Avonex' recombinant human luteinizing hormone, dornase alpha, trafermin, ziconotide, taltirelin, diboterminalfa, atosiban, becaplermin, eptifibatide, Zemaira, CTC-111, Shanvac-B, HPV vaccine (quadrivalent), octreotide, lanreotide, ancestirn, agalsidase beta, agalsidase alpha, laronidase, prezatide copper acetate (topical gel), rasburicase, ranibizumab, Actimmune, PEG-Intron, Tricomin, recombinant house dust mite allergy desensitization injection, recombinant human parathyroid hormone (PTH) 1-84 (sc, osteoporosis), epoetin delta, transgenic antithrombin III, Granditropin, Vitrase, recombinant insulin, interferon-alpha (oral lozenge), GEM-21S, vapreotide, idursulfase, omnapatrilat, recombinant serum albumin, certolizumab pegol, glucarpidase, human recombinant C1 esterase inhibitor (angioedema), lanoteplase, recombinant human growth hormone, enfuvirtide (needle-free injection, Biojector 2000), VGV-1, interferon (alpha), lucinactant, aviptadil (inhaled, pulmonary disease), icatibant, ecallantide, omiganan, Aurograb, pexigananacetate, ADI-PEG-20, LDI-200, degarelix, cintredelinbesudotox, Favld, MDX-1379, ISAtx-247, liraglutide, teriparatide (osteoporosis), tifacogin, AA4500, T4N5 liposome lotion, catumaxomab, DWP413, ART-123, Chrysalin, desmoteplase, amediplase, corifollitropinalpha, TH-9507, teduglutide, Diamyd, DWP-412, growth hormone (sustained release injection), recombinant G-CSF, insulin (inhaled, AIR), insulin (inhaled, Technosphere), insulin (inhaled, AERx), RGN-303, DiaPep277, interferon beta (hepatitis C viral infection (HCV)), interferon alpha-n3 (oral), belatacept, transdermal insulin patches, AMG-531, MBP-8298, Xerecept, opebacan, AIDSVAX, GV-1001, LymphoScan, ranpirnase, Lipoxysan, lusupultide, MP52 (beta-tricalciumphosphate carrier, bone regeneration), melanoma vaccine, sipuleucel-T, CTP-37, Insegia, vitespen, human thrombin (frozen, surgical bleeding), thrombin, TransMID, alfimeprase, Puricase, terlipressin (intravenous, hepatorenal syndrome), EUR-1008M, recombinant FGF-I (injectable, vascular disease), BDM-E, rotigaptide, ETC-216, P-113, MBI-594AN, duramycin (inhaled, cystic fibrosis), SCV-07, OPI-45, Endostatin, Angiostatin, ABT-510, Bowman Birk Inhibitor Concentrate, XMP-629, 99 mTc-Hynic-Annexin V, kahalalide F, CTCE-9908, teverelix (extended release), ozarelix, rornidepsin, BAY-504798, interleukin4, PRX-321, Pepscan, iboctadekin, rhlactoferrin, TRU-015, IL-21, ATN-161, cilengitide, Albuferon, Biphasix, IRX-2, omega interferon, PCK-3145, CAP-232, pasireotide, huN901-DMI, ovarian cancer immunotherapeutic vaccine, SB-249553, Oncovax-CL, OncoVax-P, BLP-25, CerVax-16, multi-epitope peptide melanoma vaccine (MART-1, gp100, tyrosinase), nemifitide, rAAT (inhaled), rAAT (dermatological), CGRP (inhaled, asthma), pegsunercept, thymosinbeta4, plitidepsin, GTP-200, ramoplanin, GRASPA, OBI-1, AC-100, salmon calcitonin (oral, eligen), calcitonin (oral, osteoporosis), examorelin, capromorelin, Cardeva, velafermin, 131I-TM-601, KK-220, T-10, ularitide, depelestat, hematide, Chrysalin (topical), rNAPc2, recombinant Factor V111 (PEGylated liposomal), bFGF, PEGylated recombinant staphylokinase variant, V-10153, SonoLysis Prolyse, NeuroVax, CZEN-002, islet cell neogenesis therapy, rGLP-1, BIM-51077, LY-548806, exenatide (controlled release, Medisorb), AVE-0010, GA-GCB, avorelin, ACM-9604, linaclotid eacetate, CETi-1, Hemospan, VAL (injectable), fast-acting insulin (injectable, Viadel), intranasal insulin, insulin (inhaled), insulin (oral, eligen), recombinant methionyl human leptin, pitrakinra subcutancous injection, eczema), pitrakinra (inhaled dry powder, asthma), Multikine, RG-1068, MM-093, NBI-6024, AT-001, PI-0824, Org-39141, Cpn10 (autoimmune diseases/inflammation), talactoferrin (topical), rEV-131 (ophthalmic), rEV-131 (respiratory disease), oral recombinant human insulin (diabetes), RPI-78M, oprelvekin (oral), CYT-99007 CTLA4-Ig, DTY-001, valategrast, interferon alpha-n3 (topical), IRX-3, RDP-58, Tauferon, bile salt stimulated lipase, Merispase, alaline phosphatase, EP-2104R, Melanotan-II, bremelanotide, ATL-104, recombinant human microplasmin, AX-200, SEMAX, ACV-1, Xen-2174, CJC-1008, dynorphin A, SI-6603, LAB GHRH, AER-002, BGC-728, malaria vaccine (virosomes, PeviPRO), ALTU-135, parvovirus B19 vaccine, influenza vaccine (recombinant neuraminidase), malaria/HBV vaccine, anthrax vaccine, Vacc-5q, Vacc-4x, HIV vaccine (oral), HPV vaccine, Tat Toxoid, YSPSL, CHS-13340, PTH(1-34) liposomal cream (Novasome), Ostabolin-C, PTH analog (topical, psoriasis), MBRI-93.02, MTB72F vaccine (tuberculosis), MVA-Ag85A vaccine (tuberculosis), FARA04, BA-210, recombinant plague FIV vaccine, AG-702, OxSODrol, rBetV1, Der-p1/Der-p2/Der-p7 allergen-targeting vaccine (dust mite allergy), PR1 peptide antigen (leukemia), mutant ras vaccine, HPV-16 E7 lipopeptide vaccine, labyrinthin vaccine (adenocarcinoma), CML vaccine, WT1-peptide vaccine (cancer), IDD-5, CDX-110, Pentrys, Norelin, CytoFab, P-9808, VT-111, icrocaptide, telbermin (dermatological, diabetic foot ulcer), rupintrivir, reticulose, rGRF, HA, alpha-galactosidase A, ACE-011, ALTU-140, CGX-1160, angiotensin therapeutic vaccine, D-4F, ETC-642, APP-018, rhMBL, SCV-07 (oral, tuberculosis), DRF-7295, ABT-828, ErbB2-specific immunotoxin (anticancer), DT3SSIL-3, TST-10088, PRO-1762, Combotox, cholecystokinin-B/gastrin-receptor binding peptides, 111In-hEGF, AE-37, trasnizumab-DM1, Antagonist G, IL-12 (recombinant), PM-02734, IMP-321, rhIGF-BP3, BLX-883, CUV-1647 (topical), L-19 based radioimmunotherapeutics (cancer), Re-188-P-2045, AMG-386, DC/1540/KLH vaccine (cancer), VX-001, AVE-9633, AC-9301, NY-ESO-1 vaccine (peptides), NA17.A2 peptides, melanoma vaccine (pulsed antigen therapeutic), prostate cancer vaccine, CBP-501, recombinant human lactoferrin (dry eye), FX-06, AP-214, WAP-8294A (injectable), ACP-HIP, SUN-11031, peptide YY [3-36] (obesity, intranasal), FGLL, atacicept, BR3-Fc, BN-003, BA-058, human parathyroid hormone 1-34 (nasal, osteoporosis), F-18-CCR1, AT-1100 (celiac disease/diabetes), JPD-003, PTH(7-34) liposomal cream (Novasome), duramycin (ophthalmic, dry eye), CAB-2, CTCE-0214, GlycoPEGylated erythropoietin, EPO-Fc, CNTO-528, AMG-114, JR-013, Factor XIII, aminocandin, PN-951, 716155, SUN-E7001, TH-0318, BAY-73-7977, teverelix (immediate release), EP-51216, hGH (controlled release, Biosphere), OGP-I, sifuvirtide, TV4710, ALG-889, Org-41259, rhCC10, F-991, thymopentin (pulmonary diseases), r(m)CRP, hepatoselective insulin, subalin, L19-IL-2 fusion protein, elafin, NMK-150, ALTU-139, EN-122004, rhTPO, thrombopoietin receptor agonist (thrombocytopenic disorders), AL-108, AL-208, nerve growth factor antagonists (pain), SLV-317, CGX-1007, INNO-105, oral teriparatide (eligen), GEM-OS1, AC-162352, PRX-302, LFn-p24 fusion vaccine (Therapore), EP-1043, S pneumoniae pediatric vaccine, malaria vaccine, Neisseria meningitidis Group B vaccine, neonatal group B streptococcal vaccine, anthrax vaccine, HCV vaccine (gpE1+gpE2+MF-59), otitis media therapy, HCV vaccine (core antigen+ISCOMATRIX), hPTH(1-34) (transdermal, ViaDerm), 768974, SYN-101, PGN-0052, aviscumnine, BIM-23190, tuberculosis vaccine, multi-epitope tyrosinase peptide, cancer vaccine, enkastim, APC-8024, GI-5005, ACC-001, TTS-CD3, vascular-targeted TNF (solid tumors), desmopressin (buccal controlled-release), onercept, or TP-9201, adalimumab (HUMIRA), infliximab (REMICADETM), rituximab (RITUXANTM/MAB THERATM), etanercept (ENBRELTM), bevacizumab (AVASTINTM), trastuzumab (HERCEPTINTM), pegrilgrastim (NEULASTATM), 또는 바이오시밀러 및 바이오베터를 포함한 기타 적합한 POI이다.
특정 측면에 따르면, 발효 생성물은 POI 또는 Mut- 숙주 세포로부터 수득된 숙주 세포 대사산물을 포함하는 세포 배양물로부터 단리된다.
특정 측면에 따르면, 돌연변이-숙주 세포는 Pichia, Komagataella, Hansenula, Ogataea 또는 Candida 속의 효모 세포이다.
구체적으로, 돌연변이-숙주 세포는 Pichia pastoris, Pichia methanolica, Pichia kluyveri 및 Pichia angusta와 같은 피치아 종; Komagataella 종, 예를 들어 Komagataella pastoris, Komagataella pseudopastoris 또는 Komagataella phaffii, Hansenula 종, 예를 들어 Hansenula polymorpha, Ogataea 종, 예를 들어 Ogataea polymorpha, 또는 Ogataea parapolymorpha, 및 칸디다 종, 예를 들어 Candida utilis, Candida cacaoi, 및 Candida boidinii종으로 이루어진 군으로부터 선택된 효모인 균주로부터 유래하고 있다.
바람직한 종은 Pichia pastoris이다. 구체적으로, 숙주 세포는 CBS 704, CBS 2612, CBS 7435, CBS 9173-9189, DSMZ 70877, X-33, GS115, KM71, KM71H 및 SMD1168로 이루어진 군으로부터 선택된 Pichia pastoris 균주이다.
출처: CBS 704(=NRRL Y-1603 = DSMZ 70382), CBS 2612(=NRRL Y-7556), CBS 7435(=NRRL Y-11430), CBS 9173-9189(CBS 균주: CBS-KNAW Fungal Biodivers Centraalbureau voor Schimmelculturen, Utrecht, The Netherlands) 및 DSMZ 70877(German Collection of Microorganisms and Cell Cultures); X-33, GS115, KM71, KM71H 및 SMD1168과 같은 Invitrogen의 균주.
특정 측면에 따르면, 본 발명은 본원에 기술된 Mut- 숙주 세포를 배양하여 관심 단백질(POI)을 생산하는 방법을 제공한다. 여기에서 POI를 생산하기 위한 탄소원으로 메탄올을 사용하고, 특히 에너지원으로 사용하기 위한 메탄올의 양을 사용하는 것이며, ECP의 메탄올-유도를 위한 것이 아니다.
특정 측면에 따르면, 상기 방법은 POI를 생성하기 위해 탄소원으로서 메탄올을 사용하여 Mut- 숙주 세포를 배양하는 것을 포함하고, Mut- 숙주 세포는 관심 단백질(POI)을 암호화하는 관심 유전자(GOI)에 작동 가능하게 연결된 발현 카세트 프로모터(ECP)를 포함하는 이종 관심 대상 발현 카세트(GOIEC) 유전자를 포함하며,
여기서 Mut- 숙주 세포는 하나 이상의 유전적 변형 이전의 숙주 세포와 비교하여 제1 및 제2 내인성 유전자의 발현을 감소시키기 위해 하나 이상의 유전적 변형에 의해 조작되고, 여기서
a) 첫 번째 내인성 유전자는 서열번호 1로 확인된 아미노산 서열 또는 이의 상동체를 포함하는 알코올 산화효소 1(AOX1)을 암호화하고,
b) 제2 내인성 유전자는 서열번호 3으로 확인된 아미노산 서열 또는 이의 상동체를 포함하는 알코올 산화효소 2(AOX2)를 암호화한다.
구체적으로, Mut- 숙주 세포는 단독 탄소원으로서 또는 특히 성장 및/또는 POI 생산(합성)을 위한 것과 같은 에너지원으로서 다른 탄소원(또는 탄수화물)과의 혼합물로 메탄올을 사용하여 배양된다.
구체적으로, 이러한 다른 탄소원(본원에서 "비메탄올 탄소원"이라고도 함)은 탄수화물이다.
구체적으로, 비-메탄올 탄소원은 당류, 폴리올, 알코올, 또는 이들 중 임의의 하나 이상의 혼합물로부터 선택된다.
구체적으로, 당류는 6탄당과 같은 단당류 중 임의의 하나 이상일 수 있다. 글루코스, 프룩토스, 갈락토스 또는 만노스, 또는 이당류, 예를 들어 사카로스; 또는 알코올 또는 폴리올(예: 에탄올), 또는 임의의 디올, 또는 트리올(예: 글리세롤), 또는 이들 중 임의의 것의 혼합물. 본원에 기술된 탄소원으로서 사용된 메탄올의 양에 더하여, 임의의 그러한 비-메탄올 탄소원은 상기 POI를 생성하는 양으로 세포 배양에 추가로 사용될 수 있다.
특정 구체예에 따르면, Mut- 숙주 세포의 세포주가 배양된다.
구체적으로, 세포주는 회분식, 유가식 또는 연속식 배양 조건 하에서 배양된다. 배양은 미세역가 플레이트, 진탕 플라스크 또는 생물반응기에서 수행될 수 있으며, 선택적으로 첫 번째 단계로서 배치 단계로 시작하여 두 번째 단계로서 유가식 단계 또는 연속 배양 단계가 뒤따른다.
구체적으로, 이 방법은 다음 단계를 포함한다:
a) 성장 조건(성장기 또는 "성장기") 하에 숙주 세포를 배양하는 단계; 그리고 추가 단계
b) 탄소원으로서 메탄올의 존재(생성 단계) 하에 성장 제한 조건 하에 숙주 세포를 배양하고, 이 동안 GOI가 발현되어 상기 POI를 생성한다.
구체적으로, 두 번째 단계 b)는 첫 번째 단계 a)를 따른다.
구체적으로,
a) 기본 탄소원을 에너지원으로 사용하여 Mut- 숙주 세포를 배양하는 성장기; 다음에
b) Mut- 숙주 세포가 메탄올 공급물을 사용하여 배양되어 POI를 생산하는 생산 단계.
구체적으로, 숙주 세포는 제1 탄소원, 예를 들어, 제1 탄소원을 포함하는 세포 배양 배지에서 성장 조건 하에 제1 단계에서 배양된다. 선택적으로 탄소원의 양이 소모될 때까지 세포 배양에서 숙주 세포의 성장을 가능하게 하기에 충분한 양으로, 추가 배양은 성장 제한 조건 하에 있을 수 있다.
구체적으로, 제2 탄소원은 메탄올 및 선택적으로 하나 이상의 추가 탄소원(메탄올 이외)이며, 상기 제2 탄소원은 보충 탄소원으로 지칭된다.
구체적으로, 상기 기초 탄소원 및/또는 보충 탄소원(메탄올에 더하여)은 당류, 폴리올, 알코올, 또는 이들 중 임의의 하나 이상의 혼합물로부터 선택될 수 있다.
특정 구체예에 따르면, 기초 탄소원은 보충 탄소원과 상이하다, 예를 들어, 탄소원. 양적으로 및/또는 질적으로 다릅니다. 양적 차이는 일반적으로 ECP 프로모터 활성을 억제하거나 유도하는 다양한 조건을 제공한다.
추가의 특정 실시양태에 따르면, 기초 및 보충 탄소원은 동일한 유형의 분자 또는 탄수화물을 바람직하게는 상이한 농도로 포함한다. 추가의 특정 실시양태에 따르면, 탄소원은 2개 이상의 상이한 탄소원의 혼합물이다.
임의의 유형의 유기 탄소 공급원, 특히 숙주 세포 배양, 특히 진핵 숙주 세포 배양에 전형적으로 사용되는 유기 탄소 공급원이 사용될 수 있다. 특정 구체예에 따르면, 탄소원은 포도당, 과당, 갈락토오스 또는 만노오스와 같은 육탄당, 사카로오스와 같은 이당류, 글리세롤 또는 에탄올과 같은 알코올, 또는 이들의 혼합물이다.
특히 바람직한 실시양태에 따르면, 기초 탄소원은 글루코스, 글리세롤, 에탄올, 또는 이들의 혼합물로 이루어진 군으로부터 선택된다. 바람직한 구현예에 따르면, 기초 탄소원은 글리세롤이다.
추가의 특정 구체예에 따르면, 보충 탄소원은 (메탄올에 더하여) 6탄당, 예를 들어 글루코스, 과당, 갈락토오스 및 만노오스, 이당류, 예를 들어 사카로오스, 알코올, 예를 들어 글리세롤 또는 에탄올, 또는 이들의 혼합물을 포함한다. 바람직한 구현예에 따르면, 보충 탄소원은 메탄올에 더하여 글루코스를 포함한다.
상기 배양 단계 모두는 구체적으로 상기 탄소원의 존재 하에 세포주를 배양하는 것을 포함한다.
구체적으로, 상기 성장 단계(단계 a)) 배양은 배치 단계에서 수행되고; 상기 생산 단계(단계 b)) 배양은 유가식 또는 연속 배양 단계에서 수행된다.
구체적으로, 숙주 세포는 높은 성장 속도의 단계 동안(성장 조건 하에) 기초 탄소원을 포함하는 탄소원 풍부 배지에서 성장한다, 단계 a)(예를 들어, 적어도 50%, 또는 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 최대 성장 속도까지) 및 낮은 성장 속도(성장- 제한 조건)의 단계 동안 POI를 생성, 단계 b) (예를 들어, 최대성장율의 90% 미만, 바람직하게는 80% 미만, 70% 미만, 60% 미만, 50% 미만, 또는 40% 미만, 30% 미만, 20% 미만, 10% 미만, 5% 미만, 3% 미만, 2% 미만, 1% 미만, 0.5% 미만, 0.4% 미만, 0.3% 미만 또는 0.2% 미만 속도) 특히 생산 단계에서 세포 배양을 유지할 때 완전히 소모되는 탄소원의 양만을 포함하는 한정된 최소 배지를 공급함으로써 탄소원을 제한한다.
구체적으로, 0.5, 0.55, 0.6, 0.65, 0.7, 0.75, 0.8, 0.85, 0.9, 0.95, 또는 1.0%(v/v) 중 적어도 어느 하나의 평균 메탄올 농도, 예를 들어 최대 3%, 2.5%, 2%, 1.5% 또는 1%(v/v)는 특히 생산 단계 동안 숙주 세포 배양, 특히 세포 배양 배지 또는 상청액에서 사용된다.
구체적으로, 평균 메탄올 농도는 24시간 이상, 바람직하게는 0.1%, 0.5%, 1%, 1.5%, 2%, 2.5% 또는 3%(v/v) 중 적어도 어느 하나의 생산 단계 동안 유지된다.
특정 구현예에 따르면, 평균 메탄올 농도는 적어도 24시간의 생산 단계 동안 0.5-2%(v/v)이다.
평균 양 또는 농도는 적어도 관찰 기간의 시작과 끝에서 그리고 관찰 기간 동안 세포 배양, 특히 세포 배양 배지 또는 상청액에서 측정된 메탄올 농도의 합으로 계산할 수 있다. 예를 들어, 적어도 24시간마다 또는 연속 측정마다 측정 횟수로 나눈 값이다.
세포 배양물 중 메탄올 농도는 HPLC와 같은 적합한 표준 분석법을 사용하여 측정할 수 있다. 세포 배양에 의한 소비시 배양 배지의 잔류 농도로 결정된다.
구체적으로, 메탄올 공급물은 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 또는 15 mg 메탄올/(g) 또는 그 이상, 예를 들어 생산 단계 동안 2-20 또는 2-15 mg 메탄올/(g 건조 바이오매스*h) 중 적어도 어느 하나의 평균 공급 속도이다.
메탄올은 예를 들어 1회 이상의 주사에 의해 1회 이상의 분할로 세포 배양물에 첨가될 수 있거나 POI를 생성하는 동안 특정 기간 동안 연속적으로 첨가될 수 있다. 평균 양은 관찰 기간 동안 추가된 모든 메탄올의 합계를 평균 총 건조 바이오매스 및 관찰 기간으로 나눈 값으로 계산할 수 있다. 평균 총 건조 바이오매스는 적어도 관찰 기간의 시작과 끝에서 건조 바이오매스 농도를 측정하고 관찰 기간 동안 선택적으로 측정하여 계산된다. 그런 다음 건조 바이오매스 농도는 관찰 기간의 시작과 끝 사이에 삽입된다. 보간된 건조 바이오매스 농도에 각 간격의 반응기 부피를 곱하고 모든 간격에 대해 계산된 값을 합산하고 간격의 수로 나눈다. 간격 지속 시간은 1시간 이하이다.
구체적으로, 평균 공급 속도는 24시간 이상, 바람직하게는 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15 mg 메탄올/(g 건조 바이오매스*h), 또는 그 이상, 예를 들어 2-20 또는 2-15 mg 메탄올/(g 건조 바이오매스*h) 중 적어도 어느 하나의 생산 단계 동안 유지된다.
관찰 기간은 본원에서 세포 배양이 POI를 생산하는 특정 기간으로 이해되고, 특히 생산 단계, 특히 유가식 또는 연속 세포 배양 방법의 생산 단계로 이해된다. 실제 POI 생성 과정이나 생성 단계는 관찰 기간보다 길 수 있지만, 평균 금액은 정의된 관찰 기간 동안 계산된다.
구체적으로, POI 제작 과정의 지속시간은 10~500h이다.
구체적으로, 배치 단계는 약(around) 10 내지 36시간 동안 수행된다.
재배 시간과 관련하여 용어 "약(around)"은 +/-5% 또는 +/-10%를 의미한다.
예를 들어, 약 10 내지 36h의 특정 배치 수행 시간은 18 내지 39.6h, 구체적으로 19 내지 37.8h일 수 있다.
구체적인 구현예에 따르면, 배치 배지에서 10 내지 50g/L 글리세롤, 구체적으로 20 내지 40g/L 글리세롤을 기초 탄소원으로 사용하여 배치 단계를 수행하고, 약 27 내지 30시간 동안 25℃에서, 또는 30℃에서 약 23~36시간 동안, 또는 23~36시간의 배양 시간 동안 25℃~30℃ 사이의 온도에서 배양을 수행한다. 배치 배지에서 글리세롤 농도를 낮추면 배치 단계의 길이가 감소하는 반면, 배치 매체에서 글리세롤을 증가시키면 배치 단계가 연장된다. 글리세롤의 대안으로 포도당을 사용할 수 있고, 예를 들면 거의 같은 양으로 사용된다.
세포 배양 및 POI 발현의 전형적인 시스템에서, 회분식 단계 후에 유가식 단계가 뒤따르고, 구체적으로, 유가식 단계에서의 배양은 약 15 내지 100h, 약 15 내지 80h, 약 15~70h, 약 15~60h, 약 15~50h, 약 15~45h, 약 15~40h, 약 15~35h, 약 15~30h, 약 15~35h, 약 15~25h, 또는 약 15~20h 중 어느 하나 동안 수행되고; 바람직하게는 약 20 내지 40시간이다. 구체적으로, 유가식 단계에서의 배양은 약 100h, 약 80h, 약 70h, 약 60h, 약 55h, 약 50h, 약 45h, 약 40h, 약 35h, 약 33h, 약 30h, 약 25h, 약 20h 또는 약 15h 중 어느 하나 동안 수행된다.
구체적으로, 부피비생성물 형성율(rP)은 단위 부피(L) 및 단위 시간(h)당 생성된 생성물(mg)의 양(mg(L h)-1)이다. 체적 특정 제품 형성 속도는 공간 시간 수율(STY) 또는 체적 생산성이라고도 한다.
구체적으로, 본 명세서에 기재된 방법의 유가식 배양은 약 30 mg(L h)-1(30 mg(L h)-1 +/-5% 또는 +/-10%)을 의미함을 의미함)의 공간 시간 수율이 되도록 수행된다. 구체적으로, 약 30 mg(L h)-1의 공간 시간 수율이 약 30h 유가식 내에 달성되며, 구체적으로 33h, 32h, 31h, 30h, 29h, 28h, 27h, 26h 또는 25h 유가식 시간 중 어느 하나보다 짧은 시간에 27, 28, 29, 30, 31, 32, 또는 33 mg (L h)-1 중 어느 하나를 달성할 수 있다.
특히, POI는 성장 제한 조건에서 최대 성장률 미만, 전형적으로 90% 미만, 바람직하게는 80% 미만, 70% 미만, 60% 미만, 50% 미만, 40% 미만, 30% 미만, 20% 미만, 10% 미만, 5% 미만, 3% 미만, 2% 미만, 1% 미만, 0.5% 미만, 0.4% 미만, 0.3% 미만, 또는 세포의 최대 성장률의 0.2% 미만 생산 단계에서 발현된다. 일반적으로 최대 성장률은 각 유형의 숙주 세포에 대해 개별적으로 결정된다.
특정 측면에 따르면, Mut- 숙주 세포는 숙주 세포 성장을 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2% 또는 1%(w/w 바이오매스) 중 어느 하나로 제한하는 조건 하에 생산 단계 동안 배양된다.
구체적으로, 생산 단계는 비성장률을 0.0001h-1 내지 0.2h-1, 바람직하게는 0.005h-1 내지 0.15h-1의 범위 내로 유지하기 위해 성장 제한량의 보충 탄소원을 제공하는 공급 배지를 사용한다.
특정 측면에 따르면, 본 발명은 알코올 탈수소효소(ADH2)의 기질로 메탄올을 사용하고 발효 생성물을 생산하는 Mut- 숙주 세포를 허용되는 조건 하에 상기 Mut- 숙주 세포를 배양하는 것을 포함하는 발효 생성물을 생산하는 방법에서 재조합 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포의 용도를 제공한다.
구체적으로, 상기 Mut- 숙주 세포는 알코올 산화효소 1(AOX1) 및 알코올 산화효소 2(AOX2)가 결핍되어 있다.
구체적으로, 상기 Mut- 숙주 세포에서, 알코올 산화효소 1(AOX1) 및 알코올 산화효소 2(AOX2)를 코딩하는 유전자가 녹아웃되거나 결실된다.
특정 측면에 따르면, 본 발명은 Mut- 숙주 세포가 탄소원으로 메탄올을 사용하여 발효 생성물을 생산하는 허용되는 조건 하에 Mut- 숙주 세포를 배양하는 것을 포함하는 발효 생성물을 생산하는 방법에서 재조합 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포의 용도를 제공한다. 여기서, Mut- 숙주 세포는 하기 하나 이상의 유전적 변형에 의해 조작됨
a) 상기 하나 이상의 유전적 변형 이전의 숙주 세포와 비교하여 제1 및 제2 내인성 유전자의 발현을 감소시키고, 여기서
i. 제1 내인성 유전자는 서열번호 1로 확인된 아미노산 서열 또는 이의 상동체를 포함하는 알코올 산화효소 1(AOX1)을 암호화하고,
ii. 제2 내인성 유전자는 서열번호 3으로 확인된 아미노산 서열 또는 이의 상동체를 포함하는 알코올 산화효소 2(AOX2)를 암호화하고,
b) 알코올 탈수소효소(ADH2) 유전자의 발현을 증가시키기 위해, 여기서 ADH2 유전자는 알코올 탈수소효소(ADH2)를 인코딩한다.
특정 측면에 따르면, 본 발명은 다음 단계를 포함하는 숙주 세포에서 관심 단백질(POI)을 생산하는 방법을 제공한다:
a) AOX1 및 AOX2를 각각 인코딩하는 상기 제1 및 제2 유전자의 발현을 감소(과소발현)하도록 숙주 세포를 유전적으로 조작하는 단계;
b) ADH2를 코딩하는 유전자의 발현(과발현)을 증가시키도록 숙주 세포를 유전적으로 조작하는 단계;
c) 발현 카세트 프로모터(ECP)의 제어 하에 상기 POI를 코딩하는 관심 유전자(GOI)를 포함하는 이종 발현 카세트를 숙주 세포에 도입하는 단계;
d) 탄소원으로서 메탄올을 사용하여 상기 POI를 생성하는 조건 하에서 상기 숙주 세포를 배양함으로써, 특히 성장 및/또는 POI 생성을 위한 에너지를 제공하는 단계;
e) 선택적으로 상기 POI를 세포 배양물로부터 분리하는 단계; 그리고
f) 선택적으로 상기 POI를 정제하는 단계.
구체적으로, 본 명세서에 기재된 방법의 단계 a)는 단계 b) 전, 후에, 또는 이와 동시에 수행된다.
구체적으로, 본 명세서에 기재된 방법의 단계 a) 및 b)는 단계 c) 전, 후에, 또는 이와 동시에 수행된다.
특정 측면에 따르면, 숙주 세포는 POI를 생산하기 위해 조작되기 전에 먼저 AOX1 및 AOX2를 코딩하는 상기 제1 및 제2 유전자의 발현을 감소시키고 ADH2를 코딩하는 유전자의 발현을 증가시키도록 유전적으로 변형된다. 특정 예에 따르면, 야생형 숙주 세포는 본원에 기재된 방법의 단계 a) 및 b)에 따라 유전적으로 변형된다. 구체적으로, 숙주 세포는 각각 AOX1 및 AOX2를 인코딩하는 상기 제1 및 제2 유전자의 감소 및 ADH2를 인코딩하는 유전자의 발현 증가를 위해 야생형 숙주 세포 균주에 상기 하나 이상의 유전적 변형을 도입할 때 제공된다.
추가 측면에 따르면, 숙주 세포는 AOX1 및 AOX2를 각각 코딩하는 상기 제1 및 제2 유전자를 감소시키고 ADH2를 코딩하는 유전자의 발현을 증가시키도록 추가로 유전적으로 변형되기 전에 이종 또는 재조합 POI를 생성하도록 먼저 조작된다. 특정 예에 따르면, 야생형 숙주 세포는 먼저 POI 생산을 위한 발현 카세트를 포함하도록 조작될 수 있다. 그런 다음, 이러한 조작된 숙주 세포는 AOX1 및 AOX2를 각각 코딩하는 상기 제1 및 제2 유전자를 감소시키고 ADH2를 코딩하는 유전자의 발현을 증가시키도록 추가로 변형될 수 있다.
추가 측면에 따르면, 숙주 세포는 POI 생산을 위한 조작 및 AOX1 및 AOX2를 각각 암호화하는 상기 제1 및 제2 유전자의 감소 및 ADH2를 암호화하는 유전자의 발현 증가를 위한 유전자 변형을 포함하는 조작 단계를 거치고 있으며, 동시에, 즉 하나의 방법 단계에서, 예를 들어 하나 이상의 반응 혼합물에서 각각의 발현 카세트, 시약 및 도구를 사용한다.
구체적으로, 상기 방법은 본원에 추가로 기재된 바와 같이 재조합 Mut- 숙주 세포를 생산하기 위한 방법 단계를 사용한다.
구체적으로, 이종 발현 카세트는 본원에 추가로 기재된 바와 같은 ECP를 포함한다.
구체적으로, POI는 적절한 배지에서 Mut- 숙주 세포를 배양하고, 메탄올을 포함하는 세포 배양 생산 배지를 사용하여 배양 단계 동안 POI를 생산하고, 세포 배양, 특히 세포로부터 발현된 POI를 단리함으로써 생산할 수 있다. 세포를 분리할 때 배양 상층액 또는 배지를 사용하고, 선택적으로 발현된 생성물에 적합한 방법으로 정제한다. 이로써 정제된 POI 제제를 제조할 수 있다.
놀랍게도 Mut- 숙주 세포가 메탄올에 둔감하고 POI 생산을 위한 에너지를 제공하는 데 필요한 상당한 양의 메탄올을 효과적으로 흡수하고 사용할 수 있다는 것이 밝혀졌다. 이는 선행 기술에서 메탄올이 MutS 균주에 독성인 것으로 밝혀졌기 때문에 놀라운 일이었다.
본 명세서에 기재된 바와 같은 세포 배양의 특정 예에 따르면, Mut- 숙주 세포의 성장은 유리하게는 생산 단계 동안 제한되어 산소 공급 및 냉각의 필요성을 감소시켰다.
POI 생산의 수율이 지금까지 과소평가된 알코올 탈수소효소의 메커니즘과 메틸영양성 효모에서 ADH2의 활성에 의해 증가되었다는 사실은 더욱 놀라운 사실이었습니다. 여기에서 상기 효모는 메탄올 이용 경로가 결핍된 메틸영양 효모에서 AOX1 및 AOX2 유전자를 녹아웃시킴에도 불구하고 메탄올 흡수 및 효과적인 메탄올 소비를 초래하는 것으로 밝혀졌다.
구체적인 예에 따르면 메탄올 유도성 ECP는 GOIEC에서 유리하게 사용되어 왔다. 탄소원으로서 세포 배양에 사용된 메탄올 양은 GOI의 발현을 유도하기에 충분하였다.
본 발명은 다음과 같이 조작된 재조합 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포를 제공한다:
a) 상기 하나 이상의 유전적 변형 이전의 숙주 세포와 비교하여 제1 및 제2 내인성 유전자의 발현을 감소시키기 위한 하나 이상의 유전적 변형에 의해, 여기서
i. 제1 내인성 유전자는 서열번호 1로 확인된 아미노산 서열 또는 이의 상동체를 포함하는 알코올 산화효소 1(AOX1)을 암호화하고,
ii. 제2 내인성 유전자는 서열번호 3으로 확인된 아미노산 서열 또는 이의 상동체를 포함하는 알코올 산화효소 2(AOX2)를 암호화하고,
그리고
b) 상기 하나 이상의 유전적 변형 이전에 숙주 세포와 비교하여 알코올 탈수소효소(ADH2) 유전자의 발현을 증가시키기 위한 하나 이상의 유전적 변형에 의해, 여기서 ADH2 유전자는 알코올 탈수소효소(ADH2)를 인코딩한다.
도 1: 본 명세서에 언급된 서열
명세서 전체에서 사용되는 특정 용어는 다음과 같은 의미를 갖는다.
본원에 사용된 용어 "탄소원"은 발효 가능한 탄소 기질, 일반적으로 미생물을 위한 에너지원, 예를 들어 숙주 유기체 또는 생산 세포주, 특히 단당류, 올리고당류, 다당류, 글리세롤을 포함한 알코올로 구성된 그룹, 정제된 형태, 최소 배지 또는 복합 영양 물질과 같은 원료로 제공됨. 탄소 공급원은 단일 탄소 공급원으로서 또는 상이한 탄소 공급원의 혼합물로서 본원에 기재된 바와 같이 사용될 수 있다.
본 명세서에 기재된 바와 같이, 메탄올은 탄소원으로서, 예를 들어 생산 단계 동안 단독 탄소원으로서, 또는 비-메탄올 탄소원과의 혼합물로 사용된다. 구체적으로, 메탄올은 비메탄올 탄소 공급원과 함께 세포 배양물에 함께 공급된다.
비-메탄올 탄소 공급원은 본원에서 메탄올 이외의 임의의 탄소 공급원, 특히 메탄올이 없는 탄소 공급원으로 이해된다.
본 명세서에 기재된 바와 같은 "기저 탄소원(basal carbon source)"은 일반적으로 숙주 세포, 특히 진핵 세포를 위한 영양소와 같은 세포 성장에 적합한 탄소원이다. 기저 탄소원은 기본 배지 또는 복합 배지와 같은 배지에 제공될 수 있지만, 정제된 탄소원을 함유하는 화학적으로 정의된 배지에도 제공될 수 있습니다. 기저 탄소원은 전형적으로, 예를 들어 적어도 5g/L 세포 건조 질량, 바람직하게는 적어도 10g/L의 세포 밀도를 얻기 위해, 특히 배양 과정에서 성장 단계 동안 세포 성장을 제공하는 양으로 제공됩니다. L 세포 건조 질량, 또는 적어도 15g/L 세포 건조 질량, 예 표준 계대배양 단계 동안 90% 초과, 바람직하게는 95% 초과의 생존력을 나타낸다.
기저 탄소원은 일반적으로 과량 또는 잉여량으로 사용되며, 이는 바이오매스를 증가시키기 위해 에너지를 제공하는 과량, 예를 들어 회분식 또는 유가식 배양 공정에서 세포주의 성장 단계 동안과 같이 비성장률이 높은 세포주의 배양 중으로 이해된다. 이러한 잉여량은 측정가능하고 전형적으로 제한된 양의 보충 탄소원을 공급하는 동안보다 적어도 10배 더 높고, 바람직하게는 적어도 50배 또는 적어도 100배 더 높은 발효 브로스 내의 잔류 농도를 달성하기 위한 보충 탄소원의 제한된 양(성장-제한 조건 하에서 사용됨)을 특히 초과한다.
본원에 기재된 바와 같은 "보충 탄소원(supplemental carbon source)"은 일반적으로 특히 배양 공정의 생산 단계에서 생산 세포주에 의한 발효 생성물의 생산을 촉진하는 보충 기질이다. 생산 단계는 특히 성장 단계, 예를 들어 배치, 유가 및 연속 재배 공정을 따른다. 보충 탄소원은 구체적으로 유가식 공정의 공급물에 포함될 수 있다. 보충 탄소원은 일반적으로 탄소 기질 제한된 조건, 즉 제한된 양의 탄소원을 사용하여 세포 배양에 사용된다.
구체적으로, 본 명세서에 기재된 방법에서 메탄올은 보충 탄소원으로 사용된다.
탄소원의 "제한된 양(limited amount)" 또는 "제한된 탄소원(limited carbon source)"은 특히 최대 성장률보다 낮은 성장률로 제어된 배양 공정에서 생산 세포주에 의한 발효 생성물의 생산을 촉진하는 탄소 기질의 유형 및 양을 지칭하는 것으로 본원에서 이해된다. 생산 단계는 특히 성장 단계, 예를 들어 배치, 유가 및 연속 재배 공정을 따른다. 세포 배양 공정은 회분식 배양, 연속 배양 및 유가식 배양을 사용할 수 있습니다. 회분식 배양은 배지에 소량의 종자 배양액을 첨가하고 배양 중 별도의 배지를 추가하거나 배양액을 배출하지 않고 세포를 성장시키는 배양 과정이다.
연속 배양은 배양 중에 배지를 연속적으로 첨가하고 배출하는 배양 과정이다. 연속 배양에는 관류 배양도 포함된다. 유가식 배양은 회분식 배양과 연속식 배양의 중간인 반회분식 배양이라고도 하며, 배양 중에 배지를 연속적으로 또는 순차적으로 첨가하는 배양 과정이지만, 연속식 배양과 달리 배양액이 지속적으로 배출되지 않는다.
특히 바람직한 것은 배양물에 대한 성장 제한 영양 기질의 공급을 기반으로 하는 유가식(fed-batch) 공정이다. 단일 유가식 또는 반복된 유가식 발효를 포함한 유가식 전략은 일반적으로 생물 반응기에서 높은 세포 밀도에 도달하기 위해 생물 산업 공정에서 사용된다. 탄소 기질의 조절된 첨가는 배양물의 성장률에 직접적인 영향을 미치고 과잉 대사 또는 원치 않는 대사 부산물의 형성을 방지하는 데 도움이 된다. 탄소원 제한 조건 하에서, 탄소원은 구체적으로 유가식 공정의 공급물에 포함될 수 있다. 이에 의해, 탄소 기질은 제한된 양으로 제공된다.
또한 본 명세서에 기재된 바와 같은 케모스탯 또는 연속 배양에서, 성장 속도는 엄격하게 제어될 수 있다.
탄소원의 제한된 양은 본 명세서에서 특히 성장 제한 조건, 예를 들어, 생산 단계 또는 생산 모드에서 세포주를 생산 세포주를 유지하는 데 필요한 탄소원의 양으로 이해된다. 이러한 제한된 양은 탄소 공급원이 공급 배지에 함유되고 지속적인 에너지 전달, 예를 들어 낮은 특정 성장률에서 바이오매스를 유지하면서 POI를 생성하기 위해 낮은 공급 속도로 배양물에 공급되는 유가식 공정에서 사용될 수 있다. 피드 배지는 일반적으로 세포 배양의 생산 단계 동안 발효 브로쓰에 첨가됩니다.
제한된 양의 탄소원은, 예를 들어 세포 배양 브로스 내 탄소원의 잔류량에 의해 결정될 수 있으며, 이는 미리 결정된 역치 미만이거나 심지어 표준(탄수화물) 검정에서 측정된 검출 한계 미만이다. 잔류량은 전형적으로 발효 생성물을 수확할 때 발효 브로쓰에서 결정될 것이다.
탄소원의 제한된 양은 또한 발효기에 대한 탄소원의 평균 공급 속도를 정의함으로써 결정될 수 있다. 전체 재배 과정에 걸쳐 추가된 양에 의해 결정된다. 배양 시간당 유가식 단계를 통해 시간당 계산된 평균 양을 결정한다. 이 평균 공급 속도는 세포 배양에 의한 보충 탄소원의 완전한 사용, 예를 들어 0.6g L-1h-1(L 초기 발효 부피 및 h 시간당 탄소원 g) 내지 25g L-1h-1, 바람직하게는 1.6g L-1h-1 내지 20g L-1h-1을 보장하기 위해 낮게 유지된다. .
탄소원의 제한된 양은 또한 특정 성장률(specific growth rate)을 측정함으로써 결정될 수 있으며, 특정 성장률은 낮게 예를 들어, 생산 단계에서 최대 특정 성장률보다 낮게, 예를 들어 0.001h-1 내지 0.20h-1, 또는 0.005h-1 내지 0.20h-1, 바람직하게는 0.01h-1 내지 0.15h-1과 같은 미리 결정된 범위 내에서 유지된다. .
구체적으로, 화학적으로 정의되고 메탄올을 포함하는 공급 배지가 사용된다.
유가식 공정에서 최소 배지 또는 피드 배지와 같은 세포 배양 배지와 관련하여 "화학적으로 정의된(chemically defined)"이라는 용어는 생산 세포주의 시험관 내 세포 배양에 적합한 배양 배지를 의미하며, 여기서 모든 화학 성분 및 (폴리)펩티드가 알려져 있다. 일반적으로 화학적으로 정의된 배지는 동물 유래 성분이 전혀 없으며 순수하고 일관된 세포 배양 환경을 나타낸다.
본 명세서에서 용어 "세포(cell)" 또는 "숙주 세포(host cell)"는 단일 세포, 단일 세포 클론, 또는 숙주 세포의 세포주를 지칭할 것이다. "숙주 세포"라는 용어는 특히 POI 또는 숙주 세포 대사 산물을 생성하기 위한 재조합 목적에 적합하게 사용되는 메틸영양 효모 세포에 적용된다. "숙주 세포"라는 용어는 인간을 포함하지 않는다는 것은 잘 이해된다. 구체적으로, 본 명세서에 기재된 바와 같은 숙주 세포는 인공 유기체 및 천연(야생형) 숙주 세포의 유도체이다. 본원에 기술된 숙주 세포, 방법 및 용도, 예를 들어 하나 이상의 유전적 변형, 상기 이종 발현 카세트 또는 구축물, 상기 형질감염 또는 형질전환된 숙주 세포 및 재조합 단백질을 포함하는 것을 구체적으로 언급하는 것은 비-천연-발생하는 "인공(man-made)" 또는 합성이므로 "자연법칙(law of nature)"의 결과로 간주되지 않는다.
본원에 사용된 용어 "세포주(cell line)"는 장기간에 걸쳐 증식하는 능력을 획득한 특정 세포 유형의 확립된 클론을 지칭한다. 세포주는 일반적으로 내인성 또는 재조합 유전자, 또는 이러한 폴리펩티드에 의해 매개되는 폴리펩티드 또는 세포 대사산물을 생산하기 위한 대사 경로의 산물을 발현하는 데 사용된다.
본 명세서에 기재된 바와 같은 POI를 생산하는 숙주 세포는 또한 "생산 숙주 세포(production host cell)"로 지칭되고, 각각의 세포주는 "생산 세포주(production cell line)"로 지칭된다. "생산 세포주"는 일반적으로 POI와 같은 생산 공정의 생성물을 얻기 위해 생물반응기에서 세포 배양에 바로 사용할 수 있는 세포주로 이해된다.
본원에 기재된 특정 실시양태는 ADH2를 효과적으로 사용하여 메탄올을 효소적으로 처리함으로써 세포에 에너지를 제공할 수 있는 Mut- 생산 숙주 세포를 지칭한다.
본원에 기재된 특정 실시양태는 AOX1 및 AOX2 단백질을 코딩하는 내인성 유전자를 과소발현하고 ADH2를 코딩하는 유전자를 과발현하도록 조작되고 본원에 기재된 메탄올을 탄소원으로 사용하여 ECP의 제어 하에 높은 수율의 POI 생산을 특징으로 하는 생산 세포주를 지칭한다.
숙주 세포와 관련하여 본원에 사용된 용어 "세포 배양(cell culture)" 또는 "배양하는(culturing)" 또는 "배양(cultivation)"은 인공, 예를 들어 시험관내 환경에서, 성장, 분화 또는 지속적인 생존을 선호하는 조건 하에서, 세포의 활성 또는 정지 상태에서, 특히 업계에 공지된 방법에 따라 제어된 생물반응기에서 세포를 유지하는 것을 지칭한다.
적절한 배양 배지를 사용하여 세포 배양물을 배양할 때, 세포는 세포 배양물에서 세포 배양을 지원하기에 적합한 조건 하에 배양 용기 내의 배지 또는 기질과 접촉하게 된다. 본원에 기재된 바와 같이, 숙주 세포, 예를 들어 메틸영양성 효모의 성장에 사용될 수 있는 배양 배지가 제공된다. 표준 세포 배양 기술은 당업계에 잘 알려져 있다.
본원에 기재된 바와 같은 세포 배양물은 특히 본원에서 "세포 배양 상청액(cell culture supernatant)"으로 지칭되는 세포 바이오매스로부터 분리가능한 세포 배양 배지에서 POI를 수득하기 위해 분비된 POI의 생성을 제공하는 기술을 사용하고, 더 높은 순도의 POI를 얻기 위해 정제될 수 있다. 단백질(예를 들어, POI)이 세포 배양에서 숙주 세포에 의해 생산되고 분비될 때, 이러한 단백질은 세포 배양 상청액으로 분비되고, 세포 배양 상청액을 숙주 세포 바이오매스, 및 임의로 단백질을 추가로 정제하여 정제된 단백질 제제를 생성하는 단계를 포함한다.
세포 배양 배지는 통제된 인공 및 시험관 내 환경에서 세포를 유지하고 성장시키는 데 필요한 영양소를 제공한다. 세포 배양 배지의 특성 및 조성은 특정 세포 요구 사항에 따라 다르다. 중요한 매개변수에는 삼투질 농도, pH 및 영양 성분이 포함된다. 영양소의 공급은 당업계에 공지된 방법에 따라 연속 또는 불연속 방식으로 수행될 수 있다.
회분식(batch) 공정은 발효 과정에서 추가적인 영양소의 공급 없이 초기 배양액에 세포를 배양하는데 필요한 모든 영양소가 포함된 세포 배양 방식인 반면, 유가식(fed-batch) 공정에서는 회분식(batch) 단계 이후에 공급(feeding) 섭식을 통해 하나 이상의 영양소가 배양물에 공급되는 단계가 발생한다. 대부분의 과정에서 공급 방식이 중요하고 중요하지만, 여기에 설명된 숙주 세포 및 방법은 특정 방식의 세포 배양과 관련하여 제한되지 않는다.
재조합 POI는 적절한 배지에서 배양하고, 발현된 생성물 또는 대사산물을 배양물로부터 단리하고, 임의로 적합한 방법에 의해 이를 정제함으로써 본원에 기재된 숙주 세포 및 각각의 세포주를 사용하여 생성될 수 있다.
본 명세서에 기술된 바와 같은 POI의 생성을 위한 몇 가지 상이한 접근법이 바람직하다. POI는 관련 단백질을 코딩하는 재조합 DNA를 보유하는 발현 벡터로 숙주 세포를 형질감염 또는 형질전환시키고, 형질감염 또는 형질전환된 세포의 배양물을 제조하고, 배양물을 성장시키고, 전사 및 POI 생산을 유도함으로써 발현, 처리 및 임의로 분비될 수 있으며, POI를 복구한다.
특정 실시양태에서, 세포 배양 공정은 유가식 공정이다. 구체적으로, 원하는 재조합 POI를 코딩하는 핵산 구조체로 형질전환된 숙주 세포는 원하는 재조합 POI를 생산하기 위해 성장기에서 배양되고 생산기로 전환된다.
또 다른 실시양태에서, 본원에 기재된 숙주 세포는 예를 들어 케모스탯을 사용하는 연속 방식으로 배양된다. 연속 발효 공정은 새로운 배양 배지를 생물 반응기로 공급하는 정의되고 일정하며 연속적인 속도를 특징으로 하며, 이에 의해 배양 브로쓰는 동시에 정의되고 일정하며 연속적인 동일한 제거 속도로 생물 반응기에서 제거된다. 배양 배지, 공급 속도 및 제거율을 동일한 일정한 수준으로 유지함으로써 생물 반응기의 세포 배양 매개변수 및 조건이 일정하게 유지된다.
본원에 기재된 바와 같은 안정한 세포 배양물은 유전적 특성을 유지하는 세포 배양물, 구체적으로 예를 들어 적어도 ㎍ 수준에서, 약 20세대, 바람직하게는 최소 30세대, 보다 바람직하게는 최소 40세대, 가장 바람직하게는 최소 50세대의 배양 후에도 POI 생산 수준을 높게 유지하는 세포 배양물을 지칭하는 것으로 구체적으로 이해된다. 구체적으로, 산업적 규모의 생산에 사용될 때 큰 이점으로 간주되는 안정적인 재조합 숙주 세포주가 제공된다.
본 명세서에 기술된 세포 배양은 산업적 제조 규모, 예를 들면, 공업적 제조 규모의 방법에 특히 유리하다. 양분 및 기술 시스템 모두와 관련하여 영양소 공급, 특히 유가식 또는 회분식 공정, 또는 연속식 또는 반연속식 공정(예: 케모스탯)을 기반으로 하는 재배 모드와 결합된다.
여기에 설명된 숙주 세포는 일반적으로 POI 생산을 위한 GOI를 발현하는 능력에 대해 테스트되고, 다음 테스트 중 하나에 의해 POI 수율에 대해 테스트된다: ELISA, 활성 분석, HPLC, 또는 SDS-PAGE 및 Western과 같은 기타 적합한 테스트 블로팅 기술 또는 질량 분석법.
각각의 세포 배양에서 AOX1 및/또는 AOX2 단백질(들)을 코딩하는 유전자의 저발현 또는 발현 감소에 대한 하나 이상의 유전적 변형의 효과 및 예를 들어 POI 생성에 대한 이들의 효과를 결정하기 위해, 숙주 세포주는 마이크로타이터 플레이트, 진탕 플라스크, 또는 유가식 또는 케모스탯 발효를 사용하는 생물반응기에서 각각의 세포에서 이러한 유전자 변형(들)이 없는 균주와 비교하여 배양될 수 있다.
본원에 기재된 생산 방법은 구체적으로 파일럿 또는 산업적 규모의 발효를 허용한다. 산업적 공정 규모는 바람직하게는 적어도 10L, 구체적으로 적어도 50L, 바람직하게는 적어도 1 m3, 바람직하게는 적어도 10 m3, 가장 바람직하게는 적어도 100 m3의 부피를 사용할 것이다.
산업적 규모의 생산 조건이 선호되는데, 예를 들어 수일의 일반적인 공정 시간 사용하는 100 L~10 m3 또는 그 이상의 반응기 용적에서 유가식 배양, 또는 희석 비율은 약 0.02-0.15 h-1 인 약 50~1000L 또는 그 이상의 발효기 용적에서 연속 공정을 의미한다.
본 명세서에 기술된 목적을 위해 사용되는 장치, 시설 및 방법은 원핵 및/또는 진핵 세포주를 포함하는 임의의 원하는 세포주를 배양하는데 사용하기에 특히 적합하다. 또한, 구현예에서, 장치, 시설 및 방법은 현탁 세포 또는 고정 의존성(부착) 세포를 포함하는 임의의 세포 유형을 배양하는 데 적합하고 POI, 핵산 제품(예: DNA 또는 RNA), 또는 세포 및/또는 바이러스 치료에 사용되는 것과 같은 세포 및/또는 바이러스와 같은 제약 및 생물제약 제품의 생산을 위해 구성된 생산 작업에 적합하다.
특정 실시양태에서, 세포는 재조합 치료 또는 진단 제품과 같은 제품을 발현하거나 생산한다. 본원에 더 상세히 기재된 바와 같이, 세포에 의해 생성된 생성물의 예는 항체 분자(예: 단일클론 항체, 이중특이성 항체), 항체 모방체(항원에 특이적으로 결합하지만, 항체(예: DARPin, 어피바디, 애드넥틴 또는 IgNAR), 융합 단백질(예: Fc 융합 단백질, 키메라 사이토카인), 기타 재조합 단백질(예: 글리코실화 단백질, 효소, 호르몬) 또는 바이러스 치료제와 같은 항체와 구조적으로 관련되지 않은 (예를 들어, 항암 종양 용해 바이러스, 유전자 요법 및 바이러스 면역 요법을 위한 바이러스 벡터), 세포 치료제 (예를 들어, 만능 줄기 세포, 중간엽 줄기 세포 및 성체 줄기 세포), 백신 또는 지질 캡슐화된 입자 (예를 들어, 엑소좀, 바이러스- 입자), RNA(예: siRNA) 또는 DNA(예: 플라스미드 DNA), 항생제 또는 아미노산을 포함하는 POI를 포함하지만, 이에 제한되지 않는다. 일 구현예에서 장치, 시설 및 방법은 바이오시밀러를 생산하는 데 사용될 수 있다.
언급된 바와 같이, 특정 실시양태에서, 장치, 시설 및 방법은 진핵 세포, 예를 들어 효모 세포, 예를 들어 단백질, 펩티드 또는 항생제, 아미노산, 핵산(예: DNA 또는 RNA)를 포함하는 POI의 생산을 허용하고, 대규모 방식으로 상기 세포에 의해 합성된다. 여기에 달리 명시되지 않는 한, 장치, 시설 및 방법은 벤치 규모, 파일럿 규모 및 전체 생산 규모 용량을 포함하지만 이에 국한되지 않는 임의의 원하는 양 또는 생산 용량을 포함할 수 있다.
더욱이, 그리고 여기에 달리 언급되지 않는 한, 장치, 시설 및 방법은 교반 탱크, 에어리프트, 섬유, 극세사, 중공 섬유, 세라믹 매트릭스, 유동층, 고정층 및 /또는 분출층 생물반응기를 포함하는 적절한 반응기를 포함할 수 있으나, 이에 제한되는 것은 아니다. 본원에 사용된 "반응기(reactor)"는 발효기 또는 발효 유닛, 또는 임의의 다른 반응 용기를 포함할 수 있고 용어 "반응기"는 "발효기(fermentor)"와 상호교환적으로 사용된다. 예를 들어, 일부 측면에서, 예시적인 생물반응기 유닛은 다음 중 하나 이상 또는 모두를 수행할 수 있다: 영양 및/또는 탄소원 공급, 적절한 가스(예, 산소) 주입, 발효 또는 세포 배양 배지의 유입 및 출입 흐름, 기체 및 액체상 분리, 온도 유지, 산소 및 CO2 수준 유지, pH 수준 유지, 교반(예: 교반) 및/또는 세척/멸균. 발효 유닛과 같은 예시적인 반응기 유닛은 유닛 내에 다중 반응기를 포함할 수 있다. 예를 들어 유닛은 각 유닛 및/또는 시설의 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90 또는 100 또는 그 이상의 생물 반응기는 시설 내에 단일 또는 다중 반응기가 있는 다중 유닛을 포함할 수 있다. 다양한 실시양태에서, 생물반응기는 배치, 반 유가, 유가, 관류 및/또는 연속 발효 공정에 적합할 수 있다. 임의의 적합한 반응기 직경을 사용할 수 있다. 구체예에서, 생물반응기는 약 100mL 내지 약 50,000L의 부피를 가질 수 있다. 비제한적인 예는 100mL, 250mL, 500mL, 750mL, 1리터, 2리터, 3리터, 4리터, 5리터, 6리터, 7리터, 8리터, 9리터, 10리터, 15리터, 20리터, 25리터, 30리터, 40리터, 50리터, 60리터, 70리터, 80리터, 90리터, 100리터 , 150리터, 200리터, 250리터, 300리터, 350리터, 400리터, 450리터, 500리터, 550리터, 600리터, 650리터, 700리터, 750리터, 800리터, 850리터, 9500리터 리터, 1000리터, 1500리터, 2000리터, 2500리터, 3000리터, 3500리터, 4000리터, 4500리터, 5000리터, 6000리터, 7000리터, 8000리터, 900050, 10,10 및/또는 50,000리터를 포함한다. 또한, 적합한 반응기는 다용도, 일회용, 일회용 또는 비일회용일 수 있으며 스테인리스강(예: 316L 또는 기타 적합한 스테인리스강) 및 Inconel, 플라스틱, 및/또는 유리와 같은 금속 합금을 비롯한 임의의 적합한 재료로 형성될 수 있다. .
실시예에서 그리고 여기에 달리 언급되지 않는 한, 여기에 설명된 장치, 시설 및 방법은 이러한 제품의 분리, 정제 및 격리를 위한 작업 및/또는 장비와 같이 달리 언급되지 않은 임의의 적절한 단위 작업 및/또는 장비도 포함할 수 있다. 전통적인 스틱 빌트 시설, 모듈식, 이동식 및 임시 시설, 또는 기타 적절한 건설, 시설 및/또는 레이아웃과 같은 임의의 적절한 시설 및 환경을 사용할 수 있다. 예를 들어, 일부 실시예에서 모듈식 청정실이 사용될 수 있다. 또한, 달리 명시되지 않는 한, 여기에 설명된 장치, 시스템 및 방법은 단일 위치 또는 시설에 보관 및/또는 수행되거나 대안적으로 별도의 또는 여러 위치 및/또는 시설에 보관 및/또는 수행될 수 있다.
적합한 기술은 배치 단계에서 시작하여 생물반응기에서 배양한 후 높은 비성장률에서 짧은 지수 유가식으로 배양한 후 낮은 비성장률에서 추가로 유가식으로 배양하는 것을 포함할 수 있다. 또 다른 적합한 배양 기술은 POI 생산 시간에 걸쳐 높은 성장률에서 낮은 성장률로, 또는 POI 생산 시간에 걸쳐 낮은 성장률에서 높은 성장률로 가는 것과 같은 특정 성장률 또는 특정 성장률의 조합에서 배치 단계 이후에 유가식 단계를 포함할 수 있다. POI 제작 시간. 또 다른 적합한 배양 기술은 배치 단계에 이어 낮은 희석율로 연속 배양 단계를 포함할 수 있다.
바람직한 실시양태는 바이오매스를 제공하기 위한 회분식 배양에 이어 고수율 POI 생산을 위한 유가식 배양을 포함한다.
적어도 1 g/L 세포 건조 중량, 보다 바람직하게는 적어도 10 g/L 세포 건조 중량, 바람직하게는 적어도 20 g/L 세포 건조 중량, 바람직하게는 30, 40, 50, 60, 70, 또는 80 g/L 세포 건조 중량 중 적어도 어느 하나의 세포 밀도를 얻기 위해 성장 조건 하에 생물반응기에서 본원에 기재된 바와 같은 숙주 세포를 배양하는 것이 바람직하다. 파일럿 또는 산업적 규모에서 이러한 바이오매스 생산 수율을 제공하는 것이 유리하다.
바이오매스의 축적을 허용하는 성장 배지, 특히 기초 성장 배지는 전형적으로 탄소원, 질소원, 황 공급원 및 인산염 공급원을 포함한다. 전형적으로, 이러한 배지는 미량 원소 및 비타민을 추가로 포함하고 아미노산, 펩톤 또는 효모 추출물을 추가로 포함할 수 있다.
바람직한 질소 공급원은 NH4H2PO4, 또는 NH3 또는 (NH4)2SO4를 포함하고;
바람직한 황 공급원은 MgSO4, 또는 (NH4)2SO4 또는 K2SO4를 포함하고;
바람직한 포스페이트 공급원은 NH4H2PO4, 또는 H3PO4, 또는 NaH2PO4, KH2PO4, Na2HPO4 또는 K2HPO4를 포함하고;
추가적인 전형적인 매질 성분에는 KCl, CaCl2 및 Fe, Co, Cu, Ni, Zn, Mo, Mn, I, B와 같은 미량 원소가 포함되고;
바람직하게는 배지는 비타민 B7을 보충하고;
P. pastoris의 전형적인 성장 배지는 글리세롤, 소르비톨 또는 포도당, NH4H2PO4, MgSO4, KCl, CaCl2, 비오틴 및 미량 원소를 포함한다.
생산 단계에서 생산 배지는 특별히 제한된 양의 보충 탄소원과 함께 사용된다.
바람직하게는 숙주 세포주는 적절한 탄소원을 갖는 미네랄 배지에서 배양되어 분리 과정을 상당히 단순화한다. 바람직한 미네랄 배지의 예는 이용가능한 탄소원(특히 본원에 기술된 메탄올과 임의로 예를 들어, 글루코스, 글리세롤 또는 소르비톨과 조합됨), 거대 원소(칼륨, 마그네슘, 칼슘, 암모늄, 염화물, 황산염, 인산염) 및 미량 원소(구리, 요오드화물, 망간, 몰리브덴산염, 코발트, 아연, 철염, 및 붕산), 그리고 선택적으로 비타민 또는 아미노산, 예를 들어 영양요구성 보완을 함유하는 염을 함유하는 것이다.
구체적으로, 세포는 발현 시스템 및 발현된 단백질의 성질, 예를 들어 단백질이 신호 펩티드와 유합되어 있는지 및 단백질이 가용성인지 막 결합인지 여부에 따라 세포 또는 배양 배지로부터 정제될 수 있는 원하는 POI의 발현을 달성하기에 적합한 조건 하에 배양된다. 당업자에 의해 이해되는 바와 같이, 배양 조건은 사용되는 숙주 세포 및 특정 발현 벡터의 유형을 포함하는 인자에 따라 달라질 것이다.
일반적인 생산 배지는 보충 탄소원과 추가로 NH4H2PO4, MgSO4, KCl, CaCl2, 비오틴 및 미량 원소를 포함한다.
예를 들어, 발효에 첨가되는 보충 탄소원의 공급물은 최대 50 wt%의 이용가능한 당을 갖는 탄소원을 포함할 수 있다.
발효는 바람직하게는 3 내지 8 범위의 pH에서 수행된다.
전형적인 발효 시간은 20℃ 내지 35℃, 바람직하게는 22 내지 30℃ 범위의 온도에서 약 24 내지 120시간이다.
POI는 바람직하게는 1 mg/L 이상, 바람직하게는 10 mg/L 이상, 바람직하게는 100 mg/L 이상, 가장 바람직하게는 1 g/L 이상의 역가를 생성하는 조건을 사용하여 표현된다.
본원에 사용된 용어 "발현(expression)" 또는 "발현 카세트(expression cassette)"는 작동 가능한 연결로 원하는 코딩 서열 및 제어 서열을 함유하는 핵산 분자를 지칭하므로, 이들 서열로 형질전환되거나 형질감염된 숙주는 코딩된 단백질 또는 숙주 세포 대사산물을 생산할 수 있다. 형질전환을 수행하기 위해 발현 시스템이 벡터에 포함될 수 있지만, 관련 DNA가 숙주 세포 염색체에 통합될 수도 있다. 발현은 폴리펩티드 또는 대사물을 포함하는 분비 또는 비분비 발현 생성물을 지칭할 수 있다. .
발현 카세트는 예를 들어 "벡터(vector)" 또는 "플라스미드(plasmid)"의 형태로 발현 구성물로서 편리하게 제공되며, 이는 일반적으로 복제된 재조합 뉴클레오티드 서열의 전사를 위해 필요한 DNA 서열, 즉 재조합 유전자 및 적합한 숙주 유기체에서 그들의 mRNA의 번역이다. 발현 벡터 또는 플라스미드는 일반적으로 숙주 세포, 선택 마커(예를 들어, 아미노산 합성 유전자 또는 제오신, 카나마이신, G418 또는 하이그로마이신, 노르세오트리신과 같은 항생제에 내성을 부여하는 유전자), 다수의 제한 효소 절단 부위, 적합한 프로모터 서열 및 전사 종결자에서 자율 복제를 위한 기점 또는 게놈 통합을 위한 유전자좌를 포함하고, 이들 구성요소는 작동가능하게 함께 연결된다. 본원에 사용된 용어 "플라스미드" 및 "벡터"는 자가 복제 뉴클레오티드 서열 뿐만 아니라 인공 염색체, 예를 들어 효모 인공 염색체(YAC)와 같은 게놈 통합 뉴클레오티드 서열을 포함한다.
발현 벡터는 클로닝 벡터, 변형된 클로닝 벡터 및 특이적으로 설계된 플라스미드를 포함할 수 있지만 이에 제한되지는 않는다. 본원에 기재된 바람직한 발현 벡터는 진핵 숙주 세포에서 재조합 유전자의 발현에 적합한 발현 벡터이고 숙주 유기체에 따라 선택된다. 적절한 발현 벡터는 전형적으로 진핵 숙주 세포에서 POI를 코딩하는 DNA를 발현하기에 적합한 조절 서열을 포함한다. 조절 서열의 예는 프로모터, 오퍼레이터, 인핸서, 리보솜 결합 부위, 및 전사 및 번역 개시 및 종결을 제어하는 서열을 포함한다. 조절 서열은 전형적으로 발현될 DNA 서열에 작동가능하게 연결된다.
본원에 기재된 특정 발현 구축물은 상기 프로모터의 전사 제어 하에 POI를 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 포함한다. 구체적으로, 프로모터는 POI의 코딩 서열과 본래 연관되어 있지 않다.
숙주 세포에서 재조합 뉴클레오티드 서열의 발현을 허용하기 위해, GOIEC로서 본원에 기재된 발현 카세트 또는 벡터는 ECP, 전형적으로 코딩 서열의 5' 말단에 인접한, 예를 들어, 상류 및 인접하는 프로모터 뉴클레오티드 서열을 포함한다. 관심 유전자(GOI)에, 또는 신호 또는 리더 서열이 사용되는 경우, 각각 상기 신호 및 리더 서열의 업스트림 및 인접하여 POI의 발현 및 분비를 촉진한다. 프로모터 서열은 전형적으로 특히 GOI를 포함하여 작동가능하게 연결된 다운스트림 뉴클레오티드 서열의 전사를 조절하고 개시한다.
본원에 기재된 특정 발현 작제물은 숙주 세포로부터 POI의 분비를 유발하는 리더 서열과 연결된 POI를 코딩하는 폴리뉴클레오티드를 포함한다. 발현 벡터에서 이러한 분비 리더 서열의 존재는 일반적으로 재조합 발현 및 분비를 위한 POI가 자연적으로 분비되지 않는 단백질이고 따라서 천연 분비 리더 서열이 결여된 단백질이거나 그의 뉴클레오타이드 서열이 자연 분비 리더 시퀀스 없이 클로닝된 경우에 요구된다. 일반적으로, 숙주 세포로부터 POI의 분비를 유발하는데 효과적인 임의의 분비 리더 서열이 사용될 수 있다. 분비 리더 서열은 효모 공급원, 예를 들어 Saccharomyces cerevisiae의 MFa 또는 효모 포스파타제(yeast phosphatase)와 같은 효모 α-인자, 포유동물 또는 식물 공급원, 또는 기타에서 유래할 수 있다.
구체적인 구현예에서는 멀티클로닝 부위를 갖는 벡터인 멀티클로닝 벡터를 사용할 수 있다. 구체적으로, 원하는 이종 유전자를 다중 클로닝 부위에 통합 또는 통합하여 발현 벡터를 제조할 수 있다. 멀티클로닝 벡터의 경우 프로모터는 일반적으로 멀티클로닝 부위의 상류에 위치한다.
본원에 사용된 용어 "유전자 발현(gene expression)" 또는 "폴리뉴클레오티드를 발현하는(expressing a polynucleotide)"은 mRNA로의 DNA 전사, mRNA 프로세싱, mRNA 성숙, mRNA 내보내기, 번역, 단백질 폴딩 및 /또는 단백질 수송으로 이루어진 군에서 선택된 적어도 하나의 단계를 포함하는 것을 의미한다.
본원에서 "과발현(overexpression)"으로도 지칭되는 용어 "발현 증가(increase expression)"는 참조 표준에 의해 나타나는 발현 수준보다 더 높은 임의의 양을 지칭하며, 이는 특정 폴리뉴클레오티드의 발현을 증가시키기 위한 유전적 변경 이전의 숙주 세포일 수 있거나, 그렇지 않으면 상기 폴리뉴클레오티드의 발현을 증가시키도록 조작되지 않은 동일한 유형 또는 종의 숙주 세포에서 발현된다.
숙주 세포가 주어진 유전자 산물을 포함하지 않는 경우, 발현을 위해 유전자 산물을 숙주 세포에 도입하는 것이 가능하며; 이 경우 감지 가능한 모든 표현은 "과발현"이라는 용어에 포함된다.
단백질(예: ADH2)을 암호화하는 유전자의 과발현은 또한 단백질(예: ADH2)의 과발현으로 지칭된다. 과발현은 당업자에게 공지된 임의의 방식으로 달성될 수 있다. 일반적으로 유전자의 전사/번역을 증가시켜 달성할 수 있다. 유전자의 카피 수를 증가시키거나 유전자의 발현과 관련된 조절 서열 또는 부위를 변경 또는 변형함으로써, 예를 들어, 유전자는 높은 발현 수준에 도달하기 위해 강력한 프로모터에 작동 가능하게 연결될 수 있다. 이러한 프로모터는 내인성 프로모터 또는 이종성, 특히 재조합 프로모터일 수 있다. 프로모터를 유전자의 발현을 증가시키는 이종 프로모터로 대체할 수 있다. 추가로 유도성 프로모터를 사용하면 배양 과정에서 발현을 증가시킬 수 있다. 또한, 과발현은 또한 예를 들어 특정 유전자의 염색체 위치를 수정하고, 리보솜 결합 부위 또는 전사 종결자와 같은 특정 유전자에 인접한 핵산 서열을 변경하고, 오픈 리딩 프레임에 프레임 이동을 도입하고, 유전자의 전사 및/또는 유전자 산물의 번역에 관여하는 단백질(예: 조절 단백질, 억제인자, 인핸서, 전사 활성화제 등)을 변경하고, 또는 당업계에서 일상적인 특정 유전자의 발현을 탈조절하는 임의의 다른 통상적인 수단 (예를 들어, 억제 단백질의 발현을 차단하거나 과발현하고자 하는 유전자의 발현을 정상적으로 억제하는 전사 인자에 대한 유전자를 결실 또는 돌연변이시키기 위한 안티센스 핵산 분자의 사용을 포함하지만 이에 국한되지 않음)에 의해 달성될 수 있다. mRNA의 수명 연장 또한 발현 수준을 향상시킬 수 있다. 예를 들어, 특정 종결자 영역을 사용하여 mRNA의 반감기를 증가시킬 수 있다. 유전자의 여러 사본이 포함되는 경우, 유전자는 다양한 사본 수의 플라스미드에 위치하거나 염색체에 통합 및 증폭될 수 있다. 발현을 위해 하나 이상의 유전자 또는 게놈 서열을 숙주 세포에 도입하는 것이 가능하다.
특정 구현예에 따르면, ADH2 단백질을 인코딩하는 폴리뉴클레오티드는 단일 카피로 또는 세포당 다중 카피로 제시될 수 있다. 복사본은 서로 인접하거나 떨어져 있을 수 있다. 또 다른 특정 구체예에 따르면, ADH2 단백질의 과발현은 숙주 세포의 게놈(즉, 녹인)으로의 통합에 적합한 하나 이상의 플라스미드 상에 제공된 ADH2 단백질을 암호화하는 재조합 뉴클레오티드 서열을 세포당 단일 카피 또는 다중 카피로 사용한다. 복사본은 서로 인접하거나 떨어져 있을 수 있다. 과발현은 숙주 세포당 상기 폴리뉴클레오타이드의 2, 3, 4, 5, 6 또는 그 이상의 카피와 같은 폴리뉴클레오타이드의 다중 카피를 발현함으로써 달성될 수 있다.
GOI 및 ADH2 단백질을 인코딩하는 폴리뉴클레오타이드(유전자)를 포함하는 재조합 뉴클레오타이드 서열은 하나 이상의 자가 복제 플라스미드에 제공될 수 있고, 세포당 단일 카피 또는 다중 카피로 도입될 수 있다.
대안적으로, GOI 및 ADH2 단백질을 코딩하는 폴리뉴클레오티드(유전자)를 포함하는 재조합 뉴클레오티드 서열은 동일한 플라스미드 상에 존재할 수 있고, 세포당 단일 카피 또는 다중 카피로 도입될 수 있다.
ADH2 단백질을 코딩하는 이종 폴리뉴클레오티드(유전자) 또는 ADH2 단백질을 코딩하는 폴리뉴클레오티드(유전자)를 포함하는 이종 재조합 발현 구조체는 바람직하게는 숙주 세포의 게놈에 통합된다.
"게놈(genome)"이라는 용어는 일반적으로 DNA(또는 RNA)에 암호화된 유기체의 전체 유전 정보를 나타낸다. 염색체, 플라스미드 또는 벡터 또는 둘 다에 존재할 수 있다. 바람직하게는, ADH2 단백질을 코딩하는 폴리뉴클레오티드(유전자)는 상기 세포의 염색체에 통합된다.
ADH2 단백질을 코딩하는 폴리뉴클레오티드(유전자)는 그의 천연 유전자좌에 통합될 수 있다. "천연 유전자좌(Natural locus)"는 ADH2 단백질을 코딩하는 폴리뉴클레오티드(유전자)가 자연 발생 야생형 세포에 위치하는 특정 염색체 상의 위치를 의미한다. 그러나, 또 다른 구체예에서, ADH2 단백질을 코딩하는 폴리뉴클레오티드(유전자)는 그들의 천연 유전자좌가 아니라 이소적으로 통합된 숙주 세포의 게놈에 존재한다. "이소성 통합(ectopic integration)"이라는 용어는 미생물의 일반적인 염색체 유전자좌 이외의 부위, 즉 미리 결정된 또는 무작위 통합에서 미생물의 게놈 내로 핵산의 삽입을 의미한다. 또 다른 실시양태에서, ADH2 단백질을 코딩하는 폴리뉴클레오티드(유전자)는 자연 유전자좌 내로 및 이소적으로 통합된다. 이종 재조합을 사용하여 무작위 또는 비표적 통합을 달성할 수 있다. 이종 재조합은 서열이 상당히 다른 DNA 분자 간의 재조합을 의미한다.
효모 세포의 경우, ADH2 단백질 및/또는 GOI를 코딩하는 폴리뉴클레오티드(유전자)는 AOX1, GAP, ENO1, TEF, HIS4 (Zamir et al., Proc. NatL Acad. Sci. USA(1981) 78(6):3496-3500), HO (Voth et al. Nucleic Acids Res. 2001 June 15; 29(12): e59), TYR1 (Mirisola et al., Yeast 2007; 24: 761-766), His3, Leu2, Ura3 (Taxis et al., BioTechniques (2006) 40:73-78), Lys2, ADE2, TRP1, GAL1, ADH1 또는 5S 리보솜 RNA 유전자의 통합과 같은 원하는 유전자좌에 삽입될 수 있다.
다른 실시양태에서, ADH2 단백질 및/또는 GOI를 코딩하는 폴리뉴클레오티드(유전자)는 플라스미드 또는 벡터에 통합될 수 있다. 바람직하게는, 플라스미드는 진핵생물 발현 벡터, 바람직하게는 효모 발현 벡터이다. 적합한 플라스미드 또는 벡터는 본원에 추가로 기재되어 있다.
재조합 숙주 세포에서 내인성 또는 이종성 폴리뉴클레오티드의 과발현은 발현 조절 서열을 변형함으로써 달성될 수 있다. 발현 조절 서열은 당업계에 공지되어 있고, 예를 들어 숙주 세포에서 폴리뉴클레오티드 서열의 발현을 제공하는 프로모터, 인핸서, 폴리아데닐화 신호, 전사 종결자, 내부 리보솜 진입 부위(IRES) 등을 포함한다. 발현 조절 서열은 전사에 관여하는 세포 단백질과 특이적으로 상호작용한다. 예시적인 발현 조절 서열은 예를 들어 문헌[Goeddel, Gene Expression Technology: Methods in Enzymology, Vol. 185, Academic Press, San Diego, CA(1990)에 기술되어 있다.
바람직한 실시양태에서, 과발현은 인핸서를 사용하여 폴리뉴클레오티드를 발현함으로써 달성된다. 전사 인핸서는 인트론 내에서 뿐만 아니라 코딩 서열 자체 내에서 전사 단위에 대해 5' 및 3'에서 발견되는 비교적 배향 및 위치 독립적이다. 인핸서는 코딩 서열의 5' 또는 3' 위치에서 발현 벡터 내로 스플라이싱될 수 있지만, 바람직하게는 프로모터로부터 5' 부위에 위치한다. 대부분의 효모 유전자는 일반적으로 캡 부위의 수백 염기쌍 내에 있는 하나의 UAS만을 포함하며 대부분의 효모 인핸서(UAS)는 프로모터의 3'에 위치할 때 기능할 수 없지만 고등 진핵생물의 인핸서는 프로모터의 5' 및 3' 모두에서 기능할 수 있다.
많은 인핸서 서열이 포유동물 유전자(글로빈, RSV, SV40, EMC, 엘라스타제, 알부민, α-태아단백 및 인슐린)로부터 알려져 있다. SV40 후기 인핸서, 사이토메갈로바이러스 초기 프로모터 인핸서, 복제 기점의 후반에 있는 폴리오마 인핸서 및 아데노바이러스 인핸서와 같은 진핵 세포 바이러스의 인핸서를 사용할 수도 있다.
구체적으로, 본원에 기재된 바와 같은 GOI 및/또는 ADH2 코딩 폴리뉴클레오티드(유전자)는 숙주 세포에서의 발현을 제공하는 전사 및 번역 조절 서열에 작동가능하게 연결된다. 본원에 사용된 용어 "번역 조절 서열(translational regulatory sequences)"은 유전자 핵산 서열과 연관되고 유전자의 번역을 조절하는 뉴클레오티드 서열을 지칭한다. 전사 및/또는 번역 조절 서열은 플라스미드 또는 벡터에 위치하거나 숙주 세포의 염색체에 통합될 수 있다. 전사 및/또는 번역 조절 서열은 그것이 조절하는 유전자의 동일한 핵산 분자에 위치한다.
구체적으로, ADH2 단백질의 과발현은 본 발명이 속하는 기술분야의 통상적인 방법으로 달성할 수 있고, 예를 들어 Marx 등., 2008(Marx, H., Mattanovich, D. and Sauer, M. Microb Cell Fact 7 (2008): 23)에 기술된 바와 같이 그들의 내재적인 조절영역을 유전적으로 조절하는 것일 수 있고, 이러한 방법은 예를 들어 유전자의 발현을 증가시키는 재조합 프로모터의 통합을 포함한다.
예를 들어, 재조합 숙주 세포에서 내인성 또는 이종성 폴리뉴클레오티드의 과발현은 이러한 발현을 제어하는 프로모터를 변형함으로써, 예를 들어 프로모터(예를 들어, 내인성 프로모터 또는 높은 발현 수준에 도달하기 위해 다른 보다 강력한 프로모터로 상기 폴리뉴클레오티드에 작동 가능하게 연결된 야생형 유기체)를 대체하여 달성할 수 있고, 이는 높은 발현수준을 달성하기 위하여 다른 강력한 프로모터와 상기 폴리뉴클레오티드를 작동가능하게 연결하고 있다. 이러한 프로모터는 유도적이거나 구성적일 수 있습니다. 프로모터의 변형은 또한 당업계에 공지된 돌연변이유발 방법에 의해 수행될 수 있다.
바람직한 실시양태에서, ADH2 단백질을 코딩하는 폴리뉴클레오티드 및 POI를 코딩하는 폴리뉴클레오티드 둘 모두의 발현은 유도성 프로모터에 의해 구동된다. 또 다른 바람직한 구체예에서, ADH2 단백질을 인코딩하는 폴리뉴클레오타이드 및 POI를 인코딩하는 폴리뉴클레오타이드 둘 다의 발현은 구성적 프로모터에 의해 구동된다. 또 다른 바람직한 실시양태에서, ADH2 단백질을 코딩하는 폴리뉴클레오티드의 발현은 구성적 프로모터에 의해 유도되고 POI를 코딩하는 폴리뉴클레오티드의 발현은 유도성 프로모터에 의해 유도된다. 또 다른 바람직한 실시양태에서, ADH2 단백질을 코딩하는 폴리뉴클레오티드의 발현은 유도성 프로모터에 의해 유도되고 POI를 코딩하는 폴리뉴클레오티드의 발현은 구성적 프로모터에 의해 유도된다.
구체적으로, 메탄올-유도성 프로모터는 본원에 추가로 기재된 바와 같이 ADH2를 코딩하는 유전자를 과발현 및/또는 GOI를 발현하는 데 사용되는 발현 작제물에 사용될 수 있다.
예로서, ADH2 단백질을 코딩하는 폴리뉴클레오티드의 발현은 구성적 GAP 프로모터에 의해 구동될 수 있고 POI를 코딩하는 폴리뉴클레오티드의 발현은 메탄올-유도성 AOX1 또는 AOX2 프로모터에 의해 구동될 수 있다.
한 실시양태에서, ADH2 단백질 및 POI를 코딩하는 폴리뉴클레오티드의 발현은 프로모터 활성(예를 들어, 프로모터 강도) 및/또는 발현 거동(예를 들어, 유도성 또는 구성적) 측면에서 동일한 프로모터 또는 동일한 유형의 프로모터에 의해 구동된다.
본원에서 "과소발현(underexpression)"으로도 지칭되는 용어 "발현 감소(reduce expression)"는 참조 표준에 의해 나타나는 표현된 양 또는 수준(예: 활성 또는 농도) 미만인 임의의 양 또는 수준(예: 활성 또는 농도)을 지칭하며, 특정 폴리뉴클레오타이드의 발현을 감소시키기 위한 유전적 변경 이전의 숙주 세포일 수 있거나, 또는 상기 폴리뉴클레오타이드의 발현을 낮추도록 조작되지 않은 동일한 유형 또는 종의 숙주 세포에서 발현되는 숙주 세포일 수 있다. 본원에 기재된 바와 같은 발현의 감소는 구체적으로 정의된 AOX1 단백질 또는 AOX2 단백질, 특히 조작 전에 숙주 세포에 내인성인 유전자를 코딩하는 폴리뉴클레오티드 또는 유전자를 지칭한다. 특히, 각각의 유전자 생성물은 본원에 기재된 바와 같이 정의된 AOX1 단백질 또는 AOX2 단백질이다. 상기 유전자의 발현을 감소시키기 위해 유전자 변형에 의해 숙주 세포를 조작할 때, 상기 유전자 생성물 또는 폴리펩타이드의 발현은 숙주 세포의 유전적 변형 이전 또는 유전적으로 변형되지 않은 비교 가능한 숙주에서 동일한 유전자 생성물 또는 폴리펩타이드의 발현보다 낮은 수준이다. "미만(less than)"은 예를 들어 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80, 90% 또는 그 이상을 포함한다. 유전자 산물 또는 폴리펩타이드의 어떠한 발현도 "발현 감소(reduction of expression)" 또는 "과소발현(underexpression)"이라는 용어에 포함되지 않는다.
본원에 기재된 특정 실시양태에 따르면, 숙주 세포는 AOX1 단백질 또는 AOX2 단백질을 코딩하는 내인성 숙주 세포 유전자(예를 들어, 야생형 P. pastoris에서 자연적으로 발생하는 서열의 상동체 또는 이종상동체), 또는 상기 AOX1 단백질 또는 AOX2 단백질을 발현하거나 생산하는 숙주 세포의 능력을 부여하는 다른 (암호화 또는 비암호화) 뉴클레오티드 서열을 녹다운하거나 녹아웃(유전자 또는 그 부분의 불활성화 또는 결실을 위함)하여 조작된다.
구체적으로, 뉴클레오티드 서열이 파괴된 결실 균주가 제공된다.
본원에 사용된 용어 "파괴(disrupt)"는 예를 들어 녹다운 또는 녹아웃에 의해 숙주 세포에서 하나 이상의 내인성 단백질의 발현 또는 활성을 완전히 제거하기 위한 상당한 감소를 지칭한다. 이는 내인성 단백질의 총 함량이 역치 미만이거나 검출 불가능할 수 있는 질량 분광법과 같은 숙주 세포의 세포 배양물 또는 배양 배지에서 이러한 하나 이상의 내인성 단백질의 존재로서 측정될 수 있다. 또는 내인성 단백질의 효소 활성으로 측정할 수 있다.
"파괴된(disrupted)"이라는 용어는 구체적으로 유전자 침묵, 유전자 녹다운, 유전자 녹아웃, 우성 음성 작제물의 전달, 조건부 유전자 녹아웃 및/또는 특정 유전자에 대한 유전자 변형으로 이루어진 군으로부터 선택된 적어도 하나의 단계에 의한 유전 공학의 결과를 지칭한다.
본원에 사용된 유전자 발현의 맥락에서 용어 "녹-다운(knock-down)", "감소(reduction)" 또는 "결실(deletion)"은 대조군 세포에서의 발현과 비교하여 주어진 유전자의 감소된 발현을 유도하는 실험적 접근법을 지칭한다. 유전자의 녹다운은 핵산 분자를 세포에 도입하여 분해를 유도하는 유전자 mRNA의 일부(예: shRNA, RNAi, miRNA) 또는 감소된 전사, 감소된 mRNA 안정성, 감소된 mRNA 번역 또는 인코딩된 단백질의 감소된 활성을 유도하는 방식으로 유전자 서열 변경과 같은 다양한 실험 수단을 통해 달성할 수 있다.
주어진 유전자의 발현이 완전히 억제되는 것을 "녹아웃(knockout)"이라고 한니다. 유전자의 녹아웃은 기능적 전사체가 상기 유전자로부터 합성되지 않아 이 유전자에 의해 정상적으로 제공되는 기능의 손실을 초래함을 의미한다. 유전자 녹아웃은 유전자 또는 그 조절 서열, 또는 그러한 유전자 또는 조절 서열의 일부를 파괴 또는 결실시키는 DNA 서열을 변경함으로써 달성된다. 녹아웃 기술에는 상동 재조합 기술을 사용하여 중요한 부분 또는 전체 유전자 서열을 대체, 중단 또는 삭제하거나 아연 핑거 또는 메가 뉴클레아제와 같은 DNA 변형 효소를 사용하여 예를 들어, Gaj 등. (Trends Biotechnol. 2013;31(7):397-405)에 기술된 바와 같이 표적 유전자의 DNA에 이중 가닥 파손을 도입하는 것이 포함된다.
특정 구체예는 숙주 세포로 형질전환되거나 형질감염되는 하나 이상의 녹아웃 플라스미드 또는 카세트를 사용한다. 상동 재조합에 의해 숙주 세포의 표적 유전자가 파괴될 수 있다. 이 절차는 일반적으로 대상 유전자의 모든 대립 유전자가 안정적으로 제거될 때까지 반복된다.
본원에 기술된 바와 같은 특정 유전자를 녹아웃시키는 하나의 특정 방법은 예를 들어, Weninger 등. (J. Biotechnol. 2016, 235:139-49)에 기술된 바와 같이 CRISPR-Cas9 방법이다. 또 다른 방법은 예를 들어 Heiss et al. 2013 (Appl Microbiol Biotechnol. 97(3):1241-9.)에 기술된 바와 같이 분할 마커 접근을 포함한다.
또 다른 구체예는 작은 간섭 RNA(siRNA)를 사용하여 숙주 세포를 형질감염시키고 상기 숙주 세포에 의해 내인적으로 발현된 표적 단백질을 인코딩하는 mRNA를 표적화함으로써 표적 mRNA 분해를 지칭한다.
유전자의 발현은 DNA 전사의 억제 또는 감소, 예를 들어 프로모터-관련 억제자의 사용, 주어진 프로모터의 부위 특이적인 돌연변이, 프로모터 교환, 또는 예를 들어 RNAi 또는 비-코딩 RNA 유도된 전사후 유전자 침묵에 의한 번역의 억제 또는 감소를 포함하지만 이에 국한되지 않는 유전자 발현을 직접적으로 방해하는 방법에 의해 억제되거나 감소될 수 있다. 감소된 활성을 갖는 기능장애 또는 불활성 유전자 생성물의 발현은, 예를 들어, 코딩 유전자 내의 부위 특이적 또는 무작위 돌연변이유발, 삽입 또는 결실에 의해 달성될 수 있다.
유전자 생성물의 활성의 억제 또는 감소는 예를 들어 단백질 발현 전 또는 단백질 발현과 동시에 각각의 효소에 대한 억제제의 투여 또는 그와 함께 인큐베이션함으로써 달성될 수 있다. 이러한 억제제의 예는 억제 펩티드, 항체, 압타머, 융합 단백질 또는 상기 효소에 대한 항체 모방체, 또는 그의 리간드 또는 수용체, 또는 억제 펩티드 또는 핵산, 또는 유사한 결합 활성을 갖는 작은 분자를 포함한다.
유전자 침묵, 유전자 녹다운 및 유전자 녹아웃은 유전자 변형을 통해 또는 mRNA 전사체 또는 유전자에 상보적인 서열을 갖는 올리고뉴클레오티드로 처리하여 유전자의 발현을 감소시키는 기술을 의미한다. DNA의 유전자 변형이 완료되면 결과는 녹다운 또는 녹아웃 유기체이다. 올리고뉴클레오티드가 mRNA에 결합하거나 일시적으로 유전자에 결합하여 유전자 발현의 변화가 발생하는 경우 염색체 DNA의 변형 없이 일시적으로 유전자 발현에 변화가 생기는 현상을 일시적인 녹다운(transient knock-down)이라고 한다.
위의 용어에도 포함되는 일시적인 녹다운에서 활성 유전자 또는 이의 전사체에 대한 이 올리고뉴클레오티드의 결합은 전사 차단(유전자 결합의 경우), mRNA 전사체 분해(예를 들어, 작은 간섭 RNA(siRNA) 또는 안티센스 RNA에 의해) 또는 mRNA 번역 차단을 통해 발현 감소를 유발한다. .
유전자 침묵, 녹다운 또는 녹아웃을 수행하기 위한 다른 접근법은 각각의 문헌으로부터 당업자에게 공지되어 있으며, 본 발명의 맥락에서 이들의 적용은 일상적인 것으로 간주된다. 유전자 녹아웃은 유전자의 발현이 완전히 차단되는 기술을 의미한다. 즉, 해당 유전자가 작동하지 않거나 심지어 제거된다. 이 목표를 달성하기 위한 방법론적 접근은 다양하고 당업자에게 알려져 있다. 예는 주어진 유전자에 대해 우세하게 음성인 돌연변이체의 생산이다. 이러한 돌연변이는 부위 지정 돌연변이유발(예: 결실, 부분 결실, 삽입 또는 핵산 치환), 적합한 트랜스포존의 사용, 또는 각각의 문헌으로부터 당업자에게 공지된 다른 접근법에 의해 생성될 수 있으며, 그 적용은 따라서 본 발명의 맥락에서 일상적인 것으로 간주된다. 한 가지 예는 표적 아연 핑거 뉴클레아제를 사용한 녹아웃이다. 각 키트는 Sigma Aldrich에서 "CompoZR 녹아웃 ZFN"으로 제공하고 있다. 또 다른 접근법은 전사 활성화제 유사 효과기 뉴클레아제(Transcription activator-like effector nucleases, TALEN)의 사용을 포함한다.
우성 음성 작제물(dominant negative construct)의 전달은 예를 들어 형질감염에 의한 기능장애 유전자 발현 생성물을 코딩하는 서열의 도입을 포함한다. 상기 코딩 서열은 기능 장애 효소의 유전자 발현이 유전자 발현 생성물의 자연적 발현을 압도하는 방식으로 강력한 프로모터에 기능적으로 결합되어, 차례로 상기 유전자 발현 생성물 각각의 활성의 효과적인 생리학적 결함을 유도한다.
조건부 유전자 녹아웃(conditional gene knockout)은 조직 또는 시간 특정 방식으로 유전자 발현을 차단할 수 있다. 이것은 예를 들어 관심 유전자 주위에 loxP 부위라고 하는 짧은 서열을 도입함으로써 수행된다. 다시 말하지만, 다른 접근법은 각각의 문헌으로부터 당업자에게 알려져 있으며, 본 발명의 맥락에서 이들의 적용은 일상적인 것으로 간주된다.
한 가지 다른 접근법은 기능장애 유전자 산물 또는 감소된 활성을 갖는 유전자 산물로 이어질 수 있는 유전자 변경이다. 이 접근법은 프레임 이동 돌연변이, 넌센스 돌연변이(즉, 조기 정지 코돈의 도입) 또는 전체 유전자 산물을 기능장애로 만들거나 활성 감소를 유발하는 아미노산 치환을 유도하는 돌연변이의 도입을 포함한다. 이러한 유전자 변경은 예를 들어 돌연변이유발(예를 들어, 결실, 부분 결실, 삽입 또는 핵산 치환), 비특이적(무작위) 돌연변이유발 또는 부위 지정 돌연변이유발에 의해 생성될 수 있다. 유전자 침묵, 유전자 녹다운, 유전자 녹아웃, 우성 음성 구성의 전달, 조건부 유전자 녹아웃 및/또는 유전자 변경의 실제 적용을 설명하는 프로토콜은 일반적으로 숙련된 기술자가 사용할 수 있으며 그의 루틴 내에 있다. 따라서, 본 명세서에 제공된 기술적 교시는 유전자 산물의 유전자 발현의 억제 또는 감소, 또는 기능장애 또는 불활성 유전자 산물의 발현, 또는 감소된 활성을 유도하는 모든 생각할 수 있는 방법과 관련하여 전적으로 가능하다.
본원에 기재된 유전자 변형은 J. Sambrook 등., Molecular Cloning: A Laboratory Manual (3rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, New York (2001)에 기술된 바와 같이 해당 기술분야에 알려진 도구, 방법 및 기술로서 채용될 수 있다.
본원에 사용된 용어 "내인성(endogenous)"은 각각의 내인성 유전자의 발현을 감소 및/또는 내인성 단백질의 생산을 감소시키기 위한 변형 전에 야생형(천연) 숙주 세포에 존재하는 분자 및 서열, 특히 내인성 유전자 또는 단백질을 포함하는 것을 의미한다. 특히, 자연에서 발견되는 특정 숙주 세포에서 발생하는(및 얻을 수 있는) 내인성 핵산 분자(예: 유전자) 또는 단백질은 "숙주 세포 내인성(host cell endogenous)" 또는 "숙주 세포에 대한 내인성(endogenous to the host cell)"인 것으로 이해된다. 더욱이, 핵산 또는 단백질을 "내인적으로 발현하는(endogenously expressing)" 세포는 자연에서 발견되는 것과 동일한 특정 유형의 숙주가 하는 것처럼 핵산 또는 단백질을 발현한다. 더욱이, 핵산, 단백질, 또는 다른 화합물을 "내인적으로 생성(endogenously producing)"하거나 "내인적으로 생성(endogenously produces)"하는 숙주 세포는 자연에서 발견되는 것과 동일한 특정 유형의 숙주 세포가 하는 것과 같이 핵산, 단백질 또는 화합물을 생성한다.
따라서, 내인성 단백질이 숙주 세포의 녹아웃 돌연변이체와 같이 숙주 세포에 의해 더 이상 생산되지 않는 경우에도, 단백질 코딩 유전자가 불활성화되거나 결실된 경우에도, 단백질은 본원에서 여전히 "내인성(endogenous)"으로 지칭된다.
뉴클레오타이드 서열, 발현 카세트, 아미노산 서열 또는 단백질과 같은 구축물과 관련하여 본원에 사용된 용어 "이종성(heterologous)"은 주어진 숙주 세포에 대해 외래인 화합물, 즉 "외인성(exogenous)", 상기 숙주 세포에서 자연에서 발견되지 않는 것; 또는 주어진 숙주 세포에서 자연적으로 발견되는, 예를 들어 "내인성(endogenous"으로 지칭되지만, 이종 구성의 맥락에서 또는 이러한 이종 구성에 통합된, 예를 들어, 내인성 핵산과 융합되거나 결합된 이종 핵산을 사용하므로, 구성물을 이종으로 만든다. 내인성으로 발견되는 이종 뉴클레오티드 서열은 또한 세포에서 비천연, 예를 들어 예상보다 많거나 자연적으로 발견된 것보다 많은 양으로 생성될 수 있다. 이종 뉴클레오타이드 서열, 또는 이종 뉴클레오타이드 서열을 포함하는 핵산은 내인성 뉴클레오타이드 서열과 서열이 다를 수 있지만 내인성에서 발견되는 것과 동일한 단백질을 암호화한다. 구체적으로, 이종 뉴클레오티드 서열은 자연에서 숙주 세포와 동일한 관계에서 발견되지 않는 것이다. 임의의 재조합 또는 인공 뉴클레오티드 서열은 이종성인 것으로 이해된다. 이종성 폴리뉴클레오타이드의 예는 예를 들어 하이브리드 프로모터를 얻기 위해 프로모터와 천연적으로 연관되지 않은 뉴클레오타이드 서열이거나, 본 명세서에 기술된 바와 같이 암호화 서열에 작동가능하게 연결된 뉴클레오타이드 서열이다. 그 결과, 하이브리드 또는 키메라 폴리뉴클레오티드가 얻어질 수 있다. 이종 화합물의 추가 예는 전사 조절 요소, 예를 들어 프로모터에 작동 가능하게 연결된 폴리뉴클레오티드를 코딩하는 POI이며, 여기에는 내인성, 자연 발생 POI 코딩 서열이 정상적으로 작동 가능하게 연결되어 있지 않다.
본원에 사용된 용어 "작동가능하게 연결된(operably linked)"은 하나 이상의 뉴클레오티드 서열의 기능이 상기 핵산 분자 상에 존재하는 적어도 하나의 다른 뉴클레오티드 서열. 작동 가능하게 연결함으로써, 핵산 서열은 동일한 핵산 분자 상의 다른 핵산 서열과 기능적 관계에 놓이게 된다. 예를 들어, 프로모터는 코딩 서열의 발현에 영향을 미칠 수 있는 경우, 재조합 유전자의 코딩 서열과 작동가능하게 연결된다. 추가 예로서, 신호 펩티드를 코딩하는 핵산은 성숙 단백질 또는 성숙 단백질의 프리폼과 같은 분비된 형태의 단백질을 발현할 수 있는 경우 POI를 코딩하는 핵산 서열에 작동가능하게 연결된다. 구체적으로, 서로 작동가능하게 연결된 이러한 핵산은 즉, 신호 펩티드를 코딩하는 핵산과 POI를 코딩하는 핵산 서열 사이에 추가 요소 또는 핵산 서열 없이 즉시 연결될 수 있다.
본원에 사용된 용어 "메틸영양성 효모(methylotrophic yeast)"는 성장을 위한 유일한 탄소원으로서 메탄올을 사용할 수 있게 하는 공통 대사 경로를 공유하는 효모 속 및 종을 지칭한다. 메탄올 유도에 대한 전사 조절 반응에서 몇몇 효소는 높은 수준에서 빠르게 합성된다. 이들 유전자의 발현을 조절하는 프로모터는 가장 강력하고 가장 엄격하게 조절되는 효모 프로모터 중 하나이기 때문에, 메틸영양 효모는 재조합 단백질의 대규모 생산을 위한 숙주로서 매력적이다.
본원에 기재된 바와 같은 메틸영양성 효모는 특히 내인성 AOX1 및 AOX2 단백질을 각각 코딩하는 유전자 중 하나 또는 둘 모두를 과소발현함으로써 메탄올 이용 경로가 결핍되게 하는 하나 이상의 유전적 변형에 의해 돌연변이된다. AOX1 단백질을 코딩하는 유전자 및 AOX2 단백질을 코딩하는 유전자 둘 다를 발현하지 않거나 발현이 결핍된 메틸영양 효모는 본원에서 "Mut-"로 이해된다. 본원에 기술된 목적을 위해, 이러한 Mut- 효모는 이러한 유전자 변형(들) 이전에 기능적 메탄올 이용 경로를 포함하기 때문에 여전히 "메틸영양성 효모(methylotrophic yeast)"로 지칭된다.
"프로모터(promoter)" 서열은 일반적으로 프로모터가 코딩 서열의 전사를 제어하는 경우 코딩 서열에 작동가능하게 연결된 것으로 이해된다. 프로모터 서열이 코딩 서열과 본래 연관되어 있지 않은 경우, 그의 전사는 천연(야생형) 세포에서 프로모터에 의해 제어되지 않거나 서열이 상이한 인접 서열과 재조합된다.
본원에 기재된 목적을 위해 사용되는 프로모터는 본원에서 "ECP"로 지칭된다. ECP는 구성적, 유도성 또는 억제성 프로모터일 수 있습니다. 특정 실시양태에서, ECP는 각각 메탄올 및 메탄올 탄소원에 의해 유도될 수 있는 촉진제이다.
본 명세서에 기재된 바와 같은 ECP는 특히 POI 코딩 DNA의 발현을 개시, 조절 또는 달리 매개하거나 조절한다. 프로모터 DNA 및 코딩 DNA는 동일한 유전자 또는 상이한 유전자로부터 유래할 수 있고, 동일하거나 상이한 유기체로부터 유래할 수 있다.
본원에 기재된 유도성 ECP는 억제 및 유도된 상태에서 상이한 프로모터 강도를 갖는 조절가능한 프로모터인 것으로 구체적으로 이해된다. 본원에 기술된 프로모터와 같은 유도성 또는 억제성 조절 요소와 관련하여 "조절 가능한(regulatable)"이라는 용어는 과량의 물질(예를 들어, 세포 배양 배지) 예를 들어 회분식 배양의 성장 단계에서 및 예를 들어 생산 단계에서(예: 보충 기질을 공급할 때 또는 메탄올 유도를 위해 메탄올을 첨가할 때) 강력한 활성을 유도하기 위해 억제를 해제한다. 유가식 전략으로. 조절 요소는 세포 배양 첨가제의 첨가 없이 요소가 비활성화되고 이러한 첨가제의 존재 하에 활성화되도록 조절 가능하도록 설계될 수도 있습니다. 따라서, 이러한 조절 요소의 제어하에 있는 POI의 발현은 이러한 첨가제의 첨가에 의해 유도될 수 있다.
ECP의 강도는 특히 높거나 낮은 빈도로 해당 프로모터에서 발생하는 전사 개시의 효율성으로 표시되는 전사 강도를 나타냅니다. 전사 강도가 높을수록 해당 프로모터에서 더 자주 전사가 발생합니다. 프로모터 강도는 주어진 mRNA 서열이 얼마나 자주 전사되는지를 결정하여 다른 유전자보다 일부 유전자에 더 높은 전사 우선순위를 효과적으로 부여하여 전사물의 더 높은 농도로 이어지기 때문에 프로모터의 전형적인 특징이다. 예를 들어, 대량으로 필요한 단백질을 코딩하는 유전자는 일반적으로 비교적 강력한 프로모터를 가지고 있다. RNA 중합효소는 한 번에 하나의 전사 작업만 수행할 수 있으므로 효율성을 위해 작업의 우선 순위를 지정해야 한다. 프로모터 강도의 차이는 이 우선순위를 허용하도록 선택된다.
강한 ECP, 특히 완전히 유도된 상태에서 비교적 강한 ECP가 바람직하며, 이는 일반적으로 거의 최대 활성 상태로 이해된다. 상대 강도는 일반적으로 표준 프로모터, 예를 들어 숙주 세포로 사용되는 세포의 각각의 pGAP 프로모터일 수 있는 비교 프로모터(본원에서 참조 프로모터로 지칭됨)와 관련하여 결정된다.
전사의 빈도는 일반적으로 전사 속도로 이해된다. 적절한 분석에서 전사체의 양에 의해 결정된다. RT-PCR 또는 노던 블로팅. 예를 들어, 본 발명에 따른 프로모터의 전사 강도는 P. pastoris인 숙주 세포에서 결정되고 P. pastoris의 천연 pGAP 프로모터와 비교된다.
관심 유전자를 발현하는 프로모터의 강도는 일반적으로 발현 강도 또는 높은 발현 수준/속도를 지원하는 능력으로 이해된다. 예를 들어, 본 발명의 프로모터의 발현 및/또는 전사 강도는 P. pastoris인 숙주 세포에서 결정되고 P. pastoris의 천연 pGAP 프로모터와 비교된다.
참조 프로모터와 비교한 비교 전사 강도는 마이크로어레이를 사용하는 것과 같이 전사체의 양을 측정하는 표준 방법에 의해, 또는 재조합 세포에서 각각의 유전자 발현 산물의 양을 측정하는 것과 같은 세포 배양에서 결정될 수 있다. 특히, 전사 속도는 마이크로어레이의 전사 강도, 노던 블롯 또는 정량적 실시간 PCR(qRT-PCR) 또는 데이터가 높은 성장률 및 낮은 성장률의 조건, 또는 다른 배지 조성을 사용하는 조건 및 참조 프로모터와 비교하여 높은 신호 강도 조건 사이의 발현 수준의 차이를 나타내는 RNA 시퀀싱(RNA-seq)에 의해 결정될 수 있다.
발현율은 예를 들어 eGFP와 같은 리포터 유전자의 발현량에 의해 결정될 수 있다.
본원에 기재된 바와 같은 ECP는 예를 들어 "상동 pGAP 프로모터(homologous pGAP promoter)"라고도 하는 숙주 세포의 천연 pGAP 프로모터와 비교하여 적어도 15%의 전사율 또는 전사 강도에 의해 반영되는 비교적 높은 전사 강도를 발휘한다. 바람직하게는 전사율 또는 강도는 POI를 생성하기 위한 재조합 목적을 위한 숙주 세포로 선택된 (예를 들어, 진핵생물) 숙주 세포에서 결정된 것과 같은 천연 pGAP 프로모터와 비교하여 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 또는 100% 중 적어도 어느 하나, 예컨대 110%, 120%, 130%, 140%, 150%, 160%, 170%, 180%, 190%, 또는 200%, 또는 그 이상 중 적어도 어느 하나이다.
천연 pGAP 프로모터는 일반적으로 대부분의 살아있는 유기체에 존재하는 구성적 프로모터인 글리세르알데히드-3-포스페이트 탈수소효소(GAPDH)를 코딩하는 갭 유전자의 발현을 개시한다. 해당과정과 포도당신생합성의 핵심 효소인 GAPDH(EC 1.2.1.12)는 이화 및 동화 탄수화물 대사에서 중요한 역할을 한다.
천연 pGAP 프로모터는 비변형(비재조합) 또는 재조합 진핵 세포를 포함하는 동일한 종 또는 균주의 천연 진핵 세포에서와 유사한 방식으로 재조합 진핵 세포에서 특이적으로 활성이다. 이러한 천연 pGAP 프로모터는 일반적으로 내인성 프로모터로 이해되어 숙주 세포와 상동성이고, 비교 목적을 위한 표준 또는 참조 프로모터로 작용할 수 있다. 본원에 기재된 프로모터의 상대적인 발현 또는 전사 강도는 일반적으로 POI를 생성하기 위한 숙주로서 사용되는 동일한 종 또는 균주의 세포의 천연 pGAP 프로모터와 비교된다.
본원에 사용된 용어 "돌연변이유발(mutagenesis)"은 뉴클레오티드 서열의 돌연변이체를 제공하는 방법, 예를 들어, 뉴클레오티드 서열을 지칭할 것이다. 하나 이상의 뉴클레오티드의 삽입, 결실 및/또는 치환을 통해 비-코딩 또는 코딩 영역에서 적어도 하나의 변화를 갖는 그의 변이체를 수득한다. 돌연변이유발은 무작위, 반무작위 또는 부위 지정 돌연변이를 통해 이루어질 수 있다. 변이체는 모 서열을 참조로 사용하여 적합한 돌연변이유발 방법에 의해 생성될 수 있다. 특정 돌연변이유발 방법은 핵산을 조작하거나 각각의 모 서열 정보를 주형으로 사용하여 뉴클레오타이드 서열을 새로 합성하는 방법을 포함한다. 특정 돌연변이 유발 방법은 돌연변이의 합리적인 조작을 적용한다.
본 명세서에서 용어 "뉴클레오티드 서열(nucleotide sequence)" 또는 "핵산 서열(nucleic acid sequence)"은 DNA 또는 RNA를 지칭한다. "핵산 서열(nucleic acid sequence)" 또는 "폴리뉴클레오타이드 서열(polynucleotide sequence)" 또는 간단히 "폴리뉴클레오타이드(polynucleotide)"는 5' 말단에서 3' 말단으로 판독되는 데옥시리보뉴클레오타이드 또는 리보뉴클레오타이드 염기의 단일 또는 이중 가닥 중합체를 지칭한다. 여기에는 발현 카세트, 자가 복제 플라스미드, DNA 또는 RNA의 감염성 중합체, 비기능성 DNA 또는 RNA가 포함된다.
본원에 사용된 용어 "관심 단백질(protein of interest, POI)"은 숙주 세포에서 재조합 기술에 의해 생성된 폴리펩티드 또는 단백질을 지칭한다. 보다 구체적으로, 단백질은 숙주 세포에서 자연적으로 발생하지 않는 폴리펩티드, 즉 이종성 단백질일 수 있거나, 그렇지 않으면 숙주 세포에 고유할 수 있고, 즉 숙주 세포에 대해 상동성 단백질일 수 있지만, 예를 들어, POI를 인코딩하는 핵산 서열을 함유하는 자가-복제 벡터로 형질전환함으로써, 또는 POI를 인코딩하는 핵산 서열의 하나 이상의 카피의 재조합 기술에 의해 숙주 세포의 게놈으로 통합되거나, 또는 하나의 재조합 변형에 의해 예를 들어, 프로모터 서열의 POI를 코딩하는 유전자의 발현을 제어하는 또는 그 이상의 조절 서열. 일부 경우에 본원에 사용된 용어 POI는 또한 재조합적으로 발현된 단백질에 의해 매개되는 숙주 세포에 의한 임의의 대사 산물을 지칭한다.
모 뉴클레오티드 또는 아미노산 서열과 비교하여 변이체, 상동체 또는 이종상동체의 "서열 동일성(sequence identity)"이라는 용어는 2개 이상의 서열의 동일성 정도를 나타낸다. 2개 이상의 아미노산 서열은 상응하는 위치에서 동일하거나 보존된 아미노산 잔기를 어느 정도, 최대 100%까지 가질 수 있다. 2개 이상의 뉴클레오티드 서열은 상응하는 위치에서 동일하거나 보존된 염기쌍을 어느 정도, 최대 100%까지 가질 수 있다.
서열 유사성 검색은 과량(예: 최소 50%) 서열 동일성을 갖는 상동체를 식별하기 위한 효과적이고 신뢰할 수 있는 전략이다. 자주 사용되는 서열 유사성 검색 도구는 예를 들어 BLAST, FASTA 및 HMMER이다.
서열 유사성 검색은 초과 유사성 및 공통 조상을 반영하는 통계적으로 유의한 유사성을 검출함으로써 상동 단백질 또는 유전자를 식별할 수 있다. 상동체는 본 명세서에서 상이한 유기체에서 동일한 단백질, 예를 들어 상이한 상이한 유기체 또는 종에서 이러한 단백질의 변이체로 이해되는 이종상동체를 포함할 수 있다.
상이한 유기체 또는 종에서 동일한 단백질의 이종상동성 서열은 전형적으로 단백질 서열, 구체적으로 동일한 속에서 유래하는 이종상동체의 상동성이다. 전형적으로, 오르토로그는 적어도 약 25%, 30%, 35%, 40%, 50%, 60%, 70%, 80%, 85%, 90% 또는 95% 동일성, 최대 100% 서열 동일성 중 어느 하나를 갖는다.
구체적으로, 단백질의 이종상동체는 상기 단백질 또는 상기 단백질을 코딩하는 유전자가 녹아웃 숙주 세포에서 이종상동성 서열에 의해 대체될 때 결정될 수 있으며, 이러한 대체 전에 숙주 세포는 각각의 유전자 또는 단백질을 녹아웃시키도록 변형된다.
예를 들어, 추정 ADH2, AOX1 또는 AOX2 단백질이 이러한 내인성 단백질을 코딩하는 유전자가 녹아웃된 P. pastoris 숙주 세포에서 각각의 내인성 단백질을 대체하는 P. pastoris 숙주 세포에서 기능적이라면, 그러한 추정 ADH2, AOX1 또는 AOX2 단백질은 본 명세서에 기재된 목적을 위한 각각의 상동체로 간주될 수 있다.
서열번호 1로 확인된 아미노산 서열을 포함하거나 이로 구성된 AOX1 단백질은 K. phaffii 기원의 것이다. 다른 메틸영양성 효모 숙주 세포에 상동 서열이 존재한다는 것은 잘 이해된다. 예를 들어, Pichia pastoris의 효모는 각각의 상동 서열을 포함한다. Pichia pastoris는 Komagataella라는 새로운 속으로 재분류되어 K. pastoris, K. phaffii 및 K. pseudopastoris의 3종으로 나뉜다.
서열번호 1의 특이적 상동성 서열은 예를 들어 K. pastoris (예를 들어, 서열번호 9, 예를 들어 서열번호 10을 포함하거나 이로 구성된 뉴클레오티드 서열에 의해 암호화되는), Ogataea polymorpha (예를 들어, 서열번호 20을 포함하거나 이로 구성된 뉴클레오티드 서열에 의해 코딩되는 것과 같은 서열번호 19) 또는 Ogataea methanolica (예를 들어, 서열번호 14를 포함하거나 이로 이루어진 뉴클레오티드 서열에 의해 코딩되는 것과 같은 서열번호 13)에서 발견되었다.
서열번호 3으로 확인된 아미노산 서열을 포함하거나 이로 구성된 AOX2 단백질은 K. phaffii 기원의 것이다. 다른 메틸영양성 효모 숙주 세포에 상동 서열이 존재한다는 것은 잘 이해된다. 예를 들어, Pichia pastoris의 효모는 각각의 상동 서열을 포함한다. Pichia pastoris는 Komagataella라는 새로운 속으로 재분류되어 K. pastoris, K. phaffii 및 K. pseudopastoris의 3종으로 나뉜다.
서열번호 3의 특이적 상동성 서열은 예를 들어, K. pastoris (예를 들어, 서열번호 11, 예를 들어 서열번호 12를 포함하거나 이로 이루어진 뉴클레오티드 서열에 의해 암호화되는), Ogataea polymorpha (예를 들어, 서열번호 20을 포함하거나 이로 구성된 뉴클레오티드 서열에 의해 코딩되는 것과 같은 서열번호 19), 또는 gataea methanolica (예를 들어, 서열번호 16을 포함하거나 이로 이루어진 뉴클레오티드 서열에 의해 코딩되는 것과 같은 서열번호 15)에서 발견되었다.
Ogataea polymorpha는 본 명세서에서 서열번호 19로 예시된 단 하나의 알코올 산화효소를 갖는다. 따라서, 본 명세서에 기재된 바와 같은 Ogataea polymorpha에서 AOX1 및 AOX2의 발현 감소는 Ogataea polymorpha의 내인성 알코올 산화효소의 발현을 감소시킴으로써 효과적으로 수행된다.
본원에 기재된 특정 서열 동일성을 갖는 AOX1 또는 AOX2 단백질의 임의의 상동성 서열, 특히 P. pastoris AOX1 또는 AOX2 단백질의 이종상동체인 임의의 그러한 단백질은 여기에 설명된 대로 각각의 AOX1 단백질 또는 AOX2 단백질의 정의에 포함된다.
서열번호 50으로 확인된 아미노산 서열을 포함하거나 이로 구성된 ADH2 단백질은 K. phaffii 기원의 것이다. 다른 메틸영양성 효모 숙주 세포에 상동 서열이 존재한다는 것은 잘 이해된다. 예를 들어, Pichia pastoris의 효모는 각각의 상동 서열을 포함한다. Pichia pastoris는 Komagataella라는 새로운 속으로 재분류되어 K. pastoris, K. phaffii 및 K. pseudopastoris의 3종으로 나뉜다.
서열번호 50의 특이적 상동성 서열은 예를 들어, 서열번호 52, 54, 56, 58, 60, 62, 64, 66, 68, 또는 70 중 어느 하나이다.
본원에 기재된 특정 서열 동일성을 갖는 ADH2 단백질의 임의의 상동성 서열, 특히 본원에 기재된 바와 같은 P. pastoris ADH2 단백질의 이종상동체인 임의의 그러한 단백질을 포함한다.
본원에 기재된 아미노산 서열, 상동체 및 이종상동체에 대한 "아미노산 서열 동일성 백분율(%)"은 특정 폴리펩티드 서열의 아미노산 잔기와 동일한 후보 서열의 아미노산 잔기의 백분율로 정의되며, 필요한 경우 최대 퍼센트 서열 동일성을 달성하기 위해 서열을 정렬하고 갭을 도입한 후, 서열 동일성의 일부로 보존적 치환을 고려하지 않는다. 당업자는 비교되는 서열의 전체 길이에 걸쳐 최대 정렬을 달성하는 데 필요한 임의의 알고리즘을 포함하여 정렬을 측정하기 위한 적절한 매개변수를 결정할 수 있다.
본원에 기재된 목적을 위해, 2개의 아미노산 서열 사이의 서열 동일성은 하기 예시적인 파라미터와 함께 NCBI BLAST 프로그램 버전 BLASTP 2.8.1을 사용하여 결정된다: 프로그램: blastp, 워드 크기: 6, 예상 값: 10, 히트리스트 크기: 100, Gapcosts: 11.1, 매트릭스: BLOSUM62, 필터 문자열: F, 구성 조정: 조건부 구성 점수 매트릭스 조정.
예를 들어, 프로모터 또는 유전자의 뉴클레오티드 서열에 대한 "퍼센트(%) 동일성(percent (%) identity)"은 서열을 정렬한 후 DNA 서열의 뉴클레오티드와 동일한 후보 DNA 서열의 뉴클레오티드의 백분율로 정의된다. 필요한 경우 최대 퍼센트 서열 동일성을 달성하기 위해 간격을 도입하고 서열 동일성의 일부로 보존적 치환을 고려하지 않는다. 퍼센트 뉴클레오티드 서열 동일성을 결정하기 위한 정렬은 예를 들어 공개적으로 이용가능한 컴퓨터 소프트웨어를 사용하여 당업계의 기술 범위 내에 있는 다양한 방식으로 달성될 수 있다. 당업자는 비교되는 서열의 전체 길이에 걸쳐 최대 정렬을 달성하는 데 필요한 임의의 알고리즘을 포함하여 정렬을 측정하기 위한 적절한 매개변수를 결정할 수 있다.
본원에 기재된 목적을 위해(달리 표시되지 않는 한), 2개의 아미노산 서열 사이의 서열 동일성은 하기 예시적인 파라미터와 함께 NCBI BLAST 프로그램 버전 BLASTN 2.8.1을 사용하여 결정된다: 프로그램: blastn, 워드 크기: 11, 예상 역치: 10, 히트 목록 크기: 100, 갭 비용: 5.2, 일치/불일치 점수: 2,-3, 필터 문자열: 복잡성이 낮은 영역, 조회 테이블 전용으로 표시.
POI와 관련하여 본원에 사용된 용어 "분리된(isolated)" 또는 "분리(isolation)"는 자연적으로 결합될 환경, 특히 세포 배양 상청액으로부터 충분히 분리되어 "정제된(purified)" 또는 "실질적으로 순수한(substantially pure)" 형태. 그러나 "분리된(isolated)"은 다른 화합물 또는 물질과의 인공 또는 합성 혼합물의 배제 또는 기본 활성을 방해하지 않는 불순물의 존재를 의미하지 않으며, 예를 들어 불완전한 정제로 인해 존재할 수 있다. 단리된 화합물은 이의 제제를 생성하기 위해 추가로 제형화될 수 있으며, 여전히 실용적인 목적을 위해 단리될 수 있니다. 예를 들어, POI는 진단 또는 치료에 사용될 때 약학적으로 허용되는 담체 또는 부형제와 혼합될 수 있다.
본원에 사용된 용어 "정제된(purified)"은 적어도 50%(mol/mol), 바람직하게는 적어도 60%, 70%, 80%, 90% 또는 95%의 화합물(예: POI)을 포함하는 제제를 의미할 것이다. 순도(purity)는 화합물에 적합한 방법(예: 크로마토그래피 방법, 폴리아크릴아미드 겔 전기영동, HPLC 분석 등)에 의해 측정된다. 본원에 기재된 바와 같은 단리되고 정제된 POI는 세포 배양 상청액을 정제하여 불순물을 감소시킴으로써 수득될 수 있다.
재조합 폴리펩타이드 또는 단백질 생성물을 얻기 위한 단리 및 정제 방법으로서, 염석 및 용매 침전과 같은 용해도의 차이를 이용하는 방법, 한외여과 및 겔 전기영동과 같은 분자량의 차이를 이용하는 방법, 이온 교환 크로마토그래피와 같은 전하, 친화성 크로마토그래피와 같은 비친화성을 이용하는 방법, 역상 고성능 액체 크로마토그래피와 같은 소수성의 차이를 이용하는 방법, 등전점의 차이를 이용하는 방법, 예를 들어 등전점 포커싱이 사용될 수 있다.
다음과 같은 표준 방법이 선호된다: 미세여과 또는 접선 흐름 필터(TFF) 또는 원심분리에 의한 세포(잔해물) 분리 및 세척, 침전 또는 열처리에 의한 POI 정제, 효소 분해에 의한 POI 활성화, 이온 교환과 같은 크로마토그래피에 의한 POI 정제( IEX), 소수성 상호작용 크로마토그래피(HIC), 친화성 크로마토그래피, 크기 배제(SEC) 또는 HPLC 크로마토그래피, 농축의 POI 침전 및 한외여과 단계에 의한 세척.
고도로 정제된 생성물은 본질적으로 오염된 단백질이 없고, 바람직하게는 순도가 90% 이상, 보다 바람직하게는 95% 이상, 또는 심지어 98% 이상, 최대 100%이다. 정제된 생성물은 세포 배양 상청액의 정제 또는 세포 잔해로부터 수득될 수 있다.
분리 및 정제된 POI는 Western blot, HPLC, 활성 분석 또는 ELISA와 같은 기존의 방법으로 식별할 수 있다.
본 명세서에 사용된 용어 "재조합(recombinant)"은 "유전자 공학에 의해 제조되거나 그 결과로 만들어진 것"을 의미한다. 재조합 숙주는 하나 이상의 뉴클레오타이드 또는 뉴클레오타이드 서열을 결실 및/또는 불활성화하도록 조작될 수 있고, 특히 숙주에 대해 외래인 뉴클레오타이드 서열을 사용하는 재조합 핵산 서열을 함유하는 발현 벡터 또는 클로닝 벡터를 포함할 수 있다. 재조합 단백질은 숙주에서 각각의 재조합 핵산을 발현함으로써 생산된다. 본 명세서에 사용된 POI와 관련하여 용어 "재조합(recombinant)"은 POI를 발현하도록 형질전환된 숙주 세포로부터 단리된 POI와 같은 재조합 수단에 의해 제조, 발현, 생성 또는 단리된 POI를 포함한다. 본 발명에 따르면, 당해 분야의 기술 내에서 통상적인 분자 생물학, 미생물학 및 재조합 DNA 기술이 사용될 수 있다. 이러한 기술은 문헌에 완전히 설명되어 있습니다. 예를 들어 Maniatis, Fritsch & Sambrook, "Molecular Cloning: A Laboratory Manual, Cold Spring Harbor, (1982)에서 확인할 수 있다.
특정 재조합 숙주 세포는 유전자 조작, 즉 인간 개입에 의해 조작된 숙주 세포로 이해되는 "조작된(engineered)" 숙주 세포이다. 숙주 세포가 주어진 유전자 또는 각각의 단백질의 발현을 감소시키거나 과소발현하도록 조작될 때, 숙주 세포는 하에 있는 숙주 세포와 비교하여 숙주 세포가 더 이상 각각 그러한 유전자 및 단백질을 발현하는 능력이 없도록 조작된다. 조작 전의 동일한 조건, 또는 상기 유전자 또는 단백질이 과소발현되도록 조작되지 않은 숙주 세포와 비교된다.
전술한 설명은 다음의 실시예를 참조하여 더욱 완전하게 이해될 것이다. 그러나, 이러한 예는 본 발명의 하나 이상의 실시양태를 실시하는 방법을 나타내는 것일 뿐이며 본 발명의 범위를 제한하는 것으로 해석되어서는 안된다.
실시예
실시예 1
:
Pichia pastoris
의 메탄올 이용 음성 균주의 생성
메탄올 이용 음성 균주(Mut-)를 생성하기 위해 AOX1 및 AOX2로 명명된 메탄올 이용을 담당하는 2개의 유전자가 Pichia pastoris (동명 Komagataella phaffii)의 게놈에서 삭제되었다.
a) 이 목적을 위해 Pichia pastoris 균주(CBS2612, CBS-KNAW Fungal Biodiversity Centre, Centraalbureau voor Schimmelcultures, Utrecht, The Netherlands)를 전기 적합성으로 만들었다. 균주를 16-20시간(25℃; 180rpm) 동안 100mL YPD 배지(주 배양)에 접종하고 원심분리(5분, 1500g, 4℃)에 의해 1.8-3의 광학 밀도(OD600)에서 수확하였다. 2개의 50mL 팔콘 튜브에. 세포 펠릿을 10mL YPD + 20mM HEPES + 25mM DTT에 재현탁하고 인큐베이션(30분, 25℃, 180rpm) 하였다. 인큐베이션 기간 후 팔콘 튜브는 40mL 얼음처럼 차가운 멸균 증류수로 채워지고 원심분리하였다(5분, 1500g, 4℃)(Eppendorf AG, Germany). 세포 펠렛을 빙냉 멸균 1mM HEPES 완충액, pH 8에 재현탁시키고 원심분리하였다(5분; 1500g; 4℃). 세포 펠릿을 45mL 얼음처럼 차가운 1M 소르비톨에 재현탁하고 원심분리하였다(5분, 1500g, 4℃). 펠렛을 500μL 얼음처럼 차가운 1M 소르비톨에 재현탁하고 80μL를 얼음처럼 차가운 1.5mL Eppendorf 튜브에 분주하였다. 분취된 전기 컴피턴트 세포는 사용할 때까지 -80℃에서 유지하였다.
b) 효모 균주의 배양은 YPD 배지(10g/L 효모 추출물, 20g/L 펩톤, 20g/L 포도당) 또는 YPD 한천 플레이트(10g/L 효모 추출물, 20g/L 펩톤, 20g/L 포도당, 20g/L agar-agar) 선택에 필요한 경우 500μg/mL Geneticin 또는 200μg/mL Hygromycin 포함하여 수행되었다.
c) AOX1 및 AOX2의 결실 균주를 생성하기 위해 분할 마커 카세트 접근법이 사용되었다(Gasser et al., 2013). 유전자 결실을 생성하기 위한 DNA 단편은 표 1에서 찾을 수 있다. 분할 마커 카세트는 LoxP 부위가 측면에 있는 Geneticin에 대한 항생제 내성 카세트를 운반하고 있었다.
d) 0.5μg AOX1 분할 마커 카세트 1 및 0.5μg AOX1 분할 마커 카세트 2를 분취된 전기 컴피턴트 세포에 추가하여 삭제를 수행하고 얼음에서 5분 동안 인큐베이션하였다. 전기천공은 2kV에서 4밀리초 동안 수행되었다(Gene Pulser, Bio-Rad Laboratories, Inc, USA). 형질전환 후 전기천공된 세포를 1mL YPD 배지에 현탁시키고 열진탕기(Eppendorf AG, Germany)에서 700rpm으로 진탕하는 30℃에서 1.5시간 내지 3시간 동안 재생시켰다. 나중에 20μL 및 150μL의 세포 현탁액을 선택을 위해 500μg/mL Geneticin을 포함하는 YPD 플레이트에 플레이팅하고 28℃에서 48시간 동안 인큐베이션하였다. 나타난 콜로니는 500 μg/mL Geneticin을 포함하는 새로운 YPD 플레이트에 다시 줄무늬가 생겼다. AOX1 유전자좌의 정확한 파괴는 결실 카세트 외부에 결합하는 프라이머 AOX1_ctrl_Fwd 및 AOX1_ctrl_Rev(표 2)를 사용하여 게놈 DNA에 대한 PCR에 의해 확인되었다. 하나의 클론은 P. pastoris aox1△::KanMX 균주를 생성하는 원하는 유전자의 정확한 결실을 확인하는 PCR 증폭 및 PCR 앰플리콘의 시퀀싱을 기반으로 선택되었다. 단일 양성 콜로니로부터 액체 배양물을 인큐베이션하고 본 배양물을 생성하기 위해 액체 배지에 500㎍/mL Geneticin을 첨가한 것을 제외하고 실시예 1a)에 설명된 대로 전기적격으로 만들었다. LoxP 영역과 선택을 위한 하이그로마이신 내성 카세트 사이의 Geneticin 항생제 내성 카세트의 삭제에 필요한 Cre 재조합효소를 운반하는 500 μg pTAC_Cre_Hph_Mx4 플라스미드로 균주를 전기천공했다(Marx, Mattanovich, & Sauer, 2008). 전기천공은 500㎍/mL 제네티신 및 200㎍/mL 하이그로마이신 및 200㎍/mL 하이그로마이신만 있는 YPD 플레이트를 사용하여 YPD에서 형질전환체를 병렬로 재스트리킹함으로써 제네티신 내성 손실에 대해 설명된 대로 수행하고 선택했다. 500 μg/mL Geneticin 및 200 μg/mL Hygromycin이 있는 YPD 플레이트에서는 성장할 수 없지만 200 μg/mL Hygromycin만 있는 YPD 플레이트에서는 성장할 수 있는 클론이 선택되었다. AOX1 코딩 영역 및 항생제 마커의 성공적인 삭제는 프라이머 AOX1_ctrl_Fwd 및 AOX1_ctrl_Rev(표 2)를 사용한 PCR 증폭 및 PCR 앰플리콘(Microsynth AG, Swiss)의 시퀀싱에 의해 확인되었다. 생성된 균주는 P. pastoris CBS2612 △aox1이라고 하며 MutS 표현형을 갖는다. 추가 유전자 조작을 위해 선택되었다.
e) P. pastoris CBS2612 △aox1을 사용하여 a)에 설명된 프로토콜로 전기 적격 세포를 생성하고 설명된 절차에 따라 0.5μg AOX2 분할 마커 카세트 1 및 0.5μg AOX2 분할 마커 카세트 2(표 1)로 전기천공했다. d)에서. d)에서 설명한 것과 동일한 절차로 항생제 마커를 제거했다. AOX2 코딩 영역 및 항생제 마커의 성공적인 삭제는 프라이머 AOX2_ctrl_fwd & AOX2_ctrl_rev(표 2)를 사용한 PCR 증폭 및 PCR 앰플리콘(Microsynth AG, Swiss)의 시퀀싱에 의해 확인되었다. 생성된 균주는 P. pastoris CBS2612 △aox1△aox2라고 하며 메탄올 이용 음성(Mut-) 표현형을 갖는다.
f) PCR 증폭을 위한 게놈 DNA는 제조업체의 권장 사항에 따라 Wizard® Genomic DNA Purification Kit(Promega Corporation, USA)를 사용하여 분리되었다. PCR 증폭 반응은 제조업체의 권장 사항에 따라 Q5 중합효소(New England Biolabs, Inc., USA)로 수행되었다.
DNA fragment | DNA sequence 5' to 3' |
AOX1split marker cassette 1 | (SEQ ID NO:25) AGGGGTCCAAGTAAGAAGCTTCTTGCTGTAGAATTTGGGCATATGTGCTGGTGACAAAGGCATCTCTGCCTTGAGTTTCTGACGGCGGGACAGCATTCTTACCGGATATATAACACCAATTGCCAGCACCACCAATCTCAGAGGTACCCCTAACAAACTTAATAAAATCTTGGGTATCAACTTCATTAAGCTTTGTAGTTTGCAAGTACTTATAAACAAAATTCCGTAAGGTGTCGTCTTGAGGCTGGGACTTGACAAACTGCCAAAATGGCAACAAATCTACTGGCTTGGCCATAATTTTGACATTCGAGTCATCAAAGGTAAATTCAACCGGAGACTTGTATTCTTTATTGATAACTTTCTCATATAGGACATTGTCAGGAACACGATGAAACCAGGATGCCCCCAAATCCAATGAGACTGAGGTTTCATGAGTCGCAACCAACCTACCTCCAATACGGTCCCTACCCTCTAAAATCAACGCATTCACGCCATTGCTTTTGAGATCGACTGCAGCTTTGATGCCTGAAATCCCAGCGCCTACAATGATGACATTTGGATTTGGTTGACTCATGTTGGTATTGTGAAATAGACGCAGATCGGGAACACTGAAAAATAACAGTTATTATTCGAGATCTAACATCCAAAGACGAAAGGTTGAATGAAACCTTTTTGCCATCCGACATCCACAGGTCCATTCTCACACATAAGTGCCAAACGCAACAGGAGGGGATACACTAGCAGCAGACCGTTGCAAACGCAGGACCTCCACTCCTCTTCTCCTCAACACCCACTTTTGCCATCGAAAAACCAGCCCAGTTATTGGGCTTGATTGGAGCTCGCTCATTCCAATTCCTTCTATTAGGCTACTAACACCATGACTTTATTAGCCTGTCTATCCTGGCCCCCCTGGCGAGGTTCATGTTTGTTTATTTCCGAATGCAACAAGCTCCGCATTACACCCGAACATCACTCCAGATGAGGGCTTTCTGAGTGTGGGGTCAGTACGCTGCAGGTCGACAACCCTTAATATAACTTCGTATAATGTATGCTATACGAAGTTATTAGGTCTAGATCGGTACCGACATGGAGGCCCAGAATACCCTCCTTGACAGTCTTGACGTGCGCAGCTCAGGGGCATGATGTGACTGTCGCCCGTACATTTAGCCCATACATCCCCATGTATAATCATTTGCATCCATACATTTTGATGGCCGCACGGCGCGAAGCAAAAATTACGGCTCCTCGCTGCAGACCTGCGAGCAGGGAAACGCTCCCCTCACAGACGCGTTGAATTGTCCCCACGCCGCGCCCCTGTAGAGAAATATAAAAGGTTAGGATTTGCCACTGAGGTTCTTCTTTCATATACTTCCTTTTAAAATCTTGCTAGGATACAGTTCTCACATCACATCCGAACATAAACAACCATGGGTAAGGAAAAGACTCACGTTTCGAGGCCGCGATTAAATTCCAACATGGATGCTGATTTATATGGGTATAAATGGGCTCGCGATAATGTCGGGCAATCAGGTGCGACAATCTATCGATTGTATGGGAAGCCCGATGCGCCAGAGTTGTTTCTGAAACATGGCAAAGGTAGCGTTGCCAATGATGTTACAGATGAGATGGTCAGACTAAACTGGCTGACGGAATTTATGCCTCTTCCGACCATCAAGCATTTTATCCGTACTCCTGATGATGCATGGTTACTCACCACTGCGATCCCCGGCAAAACAGCATTCCAGGTATTAGAAGAATATCCTGATTCAGGTGAAAATATTGTTGATGCGCTGGCAGTGTTCCTGCGCCGGTTGCATTCGATTCCTGTTTGTAATTGTCCTTTTAACAGCGATCGCGTATTTCGTCTCGCTCAGGCGCAATCACGAATGAATAACGGTTTGGTTGATGCGAGTGATTTTGATGACGAGCGTAATGGCTGGCCTGTTGAACAAGTCTGGAAAGAAATGCATAAGCTTTTGCCATTCTCACCG |
AOX1split marker cassette 2 |
(SEQ ID NO:26) AAGCCCGATGCGCCAGAGTTGTTTCTGAAACATGGCAAAGGTAGCGTTGCCAATGATGTTACAGATGAGATGGTCAGACTAAACTGGCTGACGGAATTTATGCCTCTTCCGACCATCAAGCATTTTATCCGTACTCCTGATGATGCATGGTTACTCACCACTGCGATCCCCGGCAAAACAGCATTCCAGGTATTAGAAGAATATCCTGATTCAGGTGAAAATATTGTTGATGCGCTGGCAGTGTTCCTGCGCCGGTTGCATTCGATTCCTGTTTGTAATTGTCCTTTTAACAGCGATCGCGTATTTCGTCTCGCTCAGGCGCAATCACGAATGAATAACGGTTTGGTTGATGCGAGTGATTTTGATGACGAGCGTAATGGCTGGCCTGTTGAACAAGTCTGGAAAGAAATGCATAAGCTTTTGCCATTCTCACCGGATTCAGTCGTCACTCATGGTGATTTCTCACTTGATAACCTTATTTTTGACGAGGGGAAATTAATAGGTTGTATTGATGTTGGACGAGTCGGAATCGCAGACCGATACCAGGATCTTGCCATCCTATGGAACTGCCTCGGTGAGTTTTCTCCTTCATTACAGAAACGGCTTTTTCAAAAATATGGTATTGATAATCCTGATATGAATAAATTGCAGTTTCATTTGATGCTCGATGAGTTTTTCTAATCAGTACTGACAATAAAAAGATTCTTGTTTTCAAGAACTTGTCATTTGTATAGTTTTTTTATATTGTAGTTGTTCTATTTTAATCAAATGTTAGCGTGATTTATATTTTTTTTCGCCTCGACATCATCTGCCCAGATGCGAAGTTAAGTGCGCAGAAAGTAATATCATGCGTCAATCGTATGTGAATGCTGGTCGCTATACTGGTACCATTCGAGAACCCTTAATATAACTTCGTATAATGTATGCTATACGAAGTTATTAGGTGATATCAGATCCACTGCCATTTGCCTGAGAGATGCAGGCTTCATTTTTGATACTTTTTTATTTGTAACCTATATAGTATAGGATTTTTTTTGTCATTTTGTTTCTTCTCGTACGAGCTTGCTCCTGATCAGCCTATCTCGCAGCTGATGAATATCTTGTGGTAGGGGTTTGGGAAAATCATTCGAGTTTGATGTTTTTCTTGGTATTTCCCACTCCTCTTCAGAGTACAGAAGATTAAGTGAGACGTTCGTTTGTGCAAGCTTCAACGATGCCAAAAGGGTATAATAAGCGTCATTTGCAGCATTGTGAAGAAAACTATGTGGCAAGCCAAGCCTGCGAAGAATGTATTTTAAGTTTGACTTTGATGTATTCACTTGATTAAGCCATAATTCTCGAGTATCTATGATTGGAAGTATGGGAATGGTGATACCCGCATTCTTCAGTGTCTTGAGGTCTCCTATCAGATTATGCCCAACTAAAGCAACCGGAGGAGGAGATTTCATGGTAAATTTCTCTGACTTTTGGTCATCAGTAGACTCGAACTGTGAGACTATCTCGGTTATGACAGCAGAAATGTCCTTCTTGGAGACAGTAAATGAAGTCCCACCAATAAAGAAATCCTTGTTATCAGGAACAAACTTCTTGTTTCGAACTTTTTCGGTGCCTTGAACTATAAAATGTAGAGTGGATATGTCGGGTAGGAATGGAGCGGGCAAATGCTTACCTTCTGGACCTTCAAGAGGTATGTAGGGTTTGTAGATACTGATGCCAACTTCAGTGACAACGTTGCTATTTCGTTCAAACCATTCCGAATCCAGAGAAATCAAAGTTGTTTGTCTACTATTGATCCAAGCCAGTGCGGTCTTGAAACTGACAATAGTGTGCTCGTGTTTTGAGGTCATCTTTGT |
AOX2split marker cassette 1 | (SEQ ID NO:27) GTACGGGTTTACTGATTTGACATATCTTGGTACTAACGTTACCAATGGTGTTCCAAATAACGCAGATGATGAGCGTGGTTGCATTGCTGGATTTGACAACACTGGTTTCGTGCTGGGAACTTCATCCTCGTTGTTTAATCAGTTTATTCTGCAACTGAATACGAGTGATCTTTCAGGAGCAATTTACCAAATCATTGAGCATTTTCTGACTGGACTTAGCGAAGACGAAGACGACATTGCTATCTATTCCCCCAACCCTTTCTACAAAAGTACGTATGCAGGAGTAGGTGCCATTGCGGAAAATGACACCCTTTACTTGGTTGATGGTGGAGAGGATAACCAAAACGTCCCTCTGCAGCCTCTACTTCAAAAGGAGCGTGACGTTGATATCATCTTTGCGTTTGACAACAGTGCAGACACTGACCTCTCTTGGCCAAACGGTTCATCATTAGTCAACACCTACATGAGACAGTTTTCTTCTCAAGCAAATGGAACAACGTTCCCTTATGTACCTGATACCACCACTTTCCTAAACTTGAATCTTTCGAGTAAGCCAACCTTCTTTGGTTGTGATGCTAGAAATTTGACAGACATTGTTGAAGGCACGGATCACATTCCTCCCCTGGTTGTTTATCTGGCCAATAGACCTTTCTCGTATTGGAGTAACACTTCAACTTTCAAGTTAGACTACTCTGAATCCGAGAAGAGAGGAATGATCCAAAACGGTTTTGAAGTGTCGTCTCGTTTGAACATGACTATTGATGAAGAATGGCGTACTTGTGTTGGATGTGCAATCATTCGTAGACAGCAGGAGAGATCCAATGCAACACAAACAGAGCAATGTAGAAGATGTTTTGAGAATTATTGTTGGAACGGTGATATTGACACTTCCACCGAAGATATCCCCGTTAATTTTACCACTACTGGAGCAACCAATGAGGAGAATGACAACTCCACTTCAATATCATCGGCCAATTCGGTAGCACCTTCCAAACTTTGGTACCAAGCACCATTGCTGTTGGTCGGCCTTGTCGCATTCTTCATCTAGTACGTACGCTGCAGGTCGACAACCCTTAATATAACTTCGTATAATGTATGCTATACGAAGTTATTAGGTCTAGATCGGTACCGACATGGAGGCCCAGAATACCCTCCTTGACAGTCTTGACGTGCGCAGCTCAGGGGCATGATGTGACTGTCGCCCGTACATTTAGCCCATACATCCCCATGTATAATCATTTGCATCCATACATTTTGATGGCCGCACGGCGCGAAGCAAAAATTACGGCTCCTCGCTGCAGACCTGCGAGCAGGGAAACGCTCCCCTCACAGACGCGTTGAATTGTCCCCACGCCGCGCCCCTGTAGAGAAATATAAAAGGTTAGGATTTGCCACTGAGGTTCTTCTTTCATATACTTCCTTTTAAAATCTTGCTAGGATACAGTTCTCACATCACATCCGAACATAAACAACCATGGGTAAGGAAAAGACTCACGTTTCGAGGCCGCGATTAAATTCCAACATGGATGCTGATTTATATGGGTATAAATGGGCTCGCGATAATGTCGGGCAATCAGGTGCGACAATCTATCGATTGTATGGGAAGCCCGATGCGCCAGAGTTGTTTCTGAAACATGGCAAAGGTAGCGTTGCCAATGATGTTACAGATGAGATGGTCAGACTAAACTGGCTGACGGAATTTATGCCTCTTCCGACCATCAAGCATTTTATCCGTACTCCTGATGATGCATGGTTACTCACCACTGCGATCCCCGGCAAAACAGCATTCCAGGTATTAGAAGAATATCCTGATTCAGGTGAAAATATTGTTGATGCGCTGGCAGTGTTCCTGCGCCGGTTGCATTCGATTCCTGTTTGTAATTGTCCTTTTAACAGCGATCGCGTATTTCGTCTCGCTCAGGCGCAATCACGAATGAATAACGGTTTGGTTGATGCGAGTGATTTTGATGACGAGCGTAATGGCTGGCCTGTTGAACAAGTCTGGAAAGAAATGCATAAGCTTTTGCCATTCTCACCG |
AOX2split marker cassette 2 | (SEQ ID NO:28) AAGCCCGATGCGCCAGAGTTGTTTCTGAAACATGGCAAAGGTAGCGTTGCCAATGATGTTACAGATGAGATGGTCAGACTAAACTGGCTGACGGAATTTATGCCTCTTCCGACCATCAAGCATTTTATCCGTACTCCTGATGATGCATGGTTACTCACCACTGCGATCCCCGGCAAAACAGCATTCCAGGTATTAGAAGAATATCCTGATTCAGGTGAAAATATTGTTGATGCGCTGGCAGTGTTCCTGCGCCGGTTGCATTCGATTCCTGTTTGTAATTGTCCTTTTAACAGCGATCGCGTATTTCGTCTCGCTCAGGCGCAATCACGAATGAATAACGGTTTGGTTGATGCGAGTGATTTTGATGACGAGCGTAATGGCTGGCCTGTTGAACAAGTCTGGAAAGAAATGCATAAGCTTTTGCCATTCTCACCGGATTCAGTCGTCACTCATGGTGATTTCTCACTTGATAACCTTATTTTTGACGAGGGGAAATTAATAGGTTGTATTGATGTTGGACGAGTCGGAATCGCAGACCGATACCAGGATCTTGCCATCCTATGGAACTGCCTCGGTGAGTTTTCTCCTTCATTACAGAAACGGCTTTTTCAAAAATATGGTATTGATAATCCTGATATGAATAAATTGCAGTTTCATTTGATGCTCGATGAGTTTTTCTAATCAGTACTGACAATAAAAAGATTCTTGTTTTCAAGAACTTGTCATTTGTATAGTTTTTTTATATTGTAGTTGTTCTATTTTAATCAAATGTTAGCGTGATTTATATTTTTTTTCGCCTCGACATCATCTGCCCAGATGCGAAGTTAAGTGCGCAGAAAGTAATATCATGCGTCAATCGTATGTGAATGCTGGTCGCTATACTGGTACCATTCGAGAACCCTTAATATAACTTCGTATAATGTATGCTATACGAAGTTATTAGGTGATATCAGATCCACTTCCTCTTACGGCTTTCTTTCCCAAAAAATCATTGGGGAAATGTGCCCCTCATCAGAGTCCAATGACCCATGAATAAAGTTTCTTGTACTGTTTAAGACGATGAATTGCAACGATAATCCGAGCAGTTTACGGGGTACATCACGTGCTTTGCATATGATCTCGGAGTCGGATCAGTTCCGGATGTGATGTATTACCCCATAGTTTCAAACTCTAATGCAGCCGCCAAGTGCCATACACCCTCCATCAATCTATGCTTAAAGTTTTTCACCATCGTTGGGTGGTGATGATGACTCGCTTAGTCTCTGCTGTTCGATATTAACTTTGTAAGGATCGCCCTTGGATGGAAAATTGAGGGGTTGTAACCTGAATTTGCAGGCTACTTACATTGGACTTTTGAGAAGGCTGGACGGTTGATGAAGAGGGCTGGGTGCAGAGGAATGGAAAAAAATTTAGTTGAGAGGACTGCTTGAAATTTTAGGAAATGGAGTCCTTTAAGCTGACAAAACTTCAAGGATGGGGATTTTCATGTAGCTTTTTCATGCCTTCGACAAGCTAAAGGAAGGTAATTGATTCTGGATAAATGGATATTTGATCTGCTTTAGCAGATGTCAAAGTTCTACTAGTGATAGTCTGGTATCTCGTAGCCTTCAATTGGGCGTATCTTACTCGAAGTGTTATATTTTTAGCTGACGAGACGAAGAACGAGAGAGTATTGACACATTCAGAGGTAAGACAATATGTCGTATTATCAAAATAAGTATCGAACCTCTATTAGGAGCCTACTGGCTCAAATGTGCAACCTTAGTGGTGATTGTCTCTGCTTCTTGATCACAATCTGTCGTGTTTGAGAGTGCCGATGTATGATTTTTAGTAAATGTTTTTCAGAAAAGGCGCTAAGTAAATAACCAGTAAGTAATAAATAACGTAAAAGTGATTTGAATCATAAAAGAATCAAGATAGAGGTCAAAGCATAGATAATCCCCC |
Primer Name | DNA sequence 5' to 3' |
AOX1_ctrl_Fwd | GGCTGGAAATAGATGTAGGGAG (SEQ ID NO:29) |
AOX1_ctrl_Rev | TCGCATCTCCGCAAATTTCTC (SEQ ID NO:30) |
AOX2_ctrl_fwd | GATCCCATTCCCTATCCATGT (SEQ ID NO:31) |
AOX2_ctrl_rev | CTCTCCCCCCTCGTAATCTT (SEQ ID NO:32) |
실시예 2 : 메탄올 유도성 AOX1 프로모터 하에서 P. pastoris △aox1 및 P. pastoris △aox1△aox2 를 사용한 세포내 eGFP 생산.
단백질 생산 능력 및 프로모터 활성을 테스트하기 위해 P. pastoris △aox1△aox2 및 P. pastoris △aox1 균주를 강화된 녹색 형광 단백질(eGFP)에 대한 발현 구조로 형질전환시켰다(표 4). eGFP 코딩 서열은 PAOX1: PP7435_chr4(237941…238898)의 발현 제어 하에 있었다.
a) 발현 구성 BB3aN_pAOX1_GFP_ScCYCtt는 플라스미드 BB1_12_pAOX1, BB1_23_eGFP, BB1_34_ScCYC1tt 및 BB3aN_14*에서 설명한 대로 골든 게이트 조립 절차를 사용하여 조립되었다(Prielhofer et al., 2017). 플라스미드 및 서열은 Golden PiCS 키트 # 1000000133(Addgene, Inc., USA)에서 사용할 수 있다. 전기천공 전에 플라스미드를 제조업체의 프로토콜에 따라 제한 효소 AscI(New England Biolabs, Inc., USA)로 선형화하고 Hi Yield® Gel/PCR DNA 단편 추출 키트(Sud-Laborbedarf GmbH, 독일)로 정제했다. 500ng의 선형화된 플라스미드를 실시예 1a) 및 1d)에서 이전에 기술된 바와 같이 전기적격 P. pastoris △aox1△aox2 및 P. pastoris △aox1로 형질전환시켰다. 양성 형질전환체는 100μg/L Nourseothricin이 포함된 YPD에서 선택되었고 이후 스크리닝 실험에 사용되었다.
b) P. pastoris △aox1△aox2 및 P. pastoris △aox1에서 세포내 eGFP 발현의 소규모 스크리닝 실험. 실시예 2a)로부터 10개의 형질전환체를 선택하고 웰당 2mL YPD 및 100㎍/L 누르세오트리신을 함유하는 24개의 깊은 웰 플레이트에서 밤새 배양물에 접종하였다. 모든 형질전환체를 이중으로 시험하였다. 24웰 플레이트를 공기 허용 막으로 밀봉하고 25℃ 및 280rpm에서 인큐베이션하였다. eGFP의 세포내 발현 수준의 스크리닝을 위해 밤새 배양물을 느린 포도당 방출을 위해 25g/L 다당류 및 0.3% 아밀라아제(m2p-labs GmbH, Germany)가 포함된 2.5mL 최소 ASMv6 배지가 있는 24개의 딥 웰 플레이트로 옮기고 인큐베이션했다. 2시간 후 eGFP 생산 유도를 위해 0.2%(v/v) 또는 1%(v/v) 메탄올을 첨가하였다. eGFP 측정은 Gallios 유세포 분석기(Beckman Coulter, Inc., USA)를 사용하여 유도 후 4시간 및 20시간 후에 수행되었다. 이 목적을 위해 세포를 0.24g/L KH2PO4, 1.8g/L Na2HPO4*2H2O, 0.2g/L KCl, 8g/L NaCl을 함유하는 인산염 완충 식염수에서 0.5의 OD600으로 희석했다. 20,000개의 이벤트가 측정되었다. FX 값은 다음 방정식을 사용하여 소프트웨어 FACS Express 버전 3(De Novo Software, USA)으로 계산되었다.
이 방법은 이미 설명되어 있다(Ata, Prielhofer, Gasser, Mattanovich, & Calık, 2017; Hohenblum, Borth, & Mattanovich, 2003; Prielhofer et al., 2013).
c) 최소 배지 ASMv6: 6.3g/L(NH4)2HPO4, 0.8g/L(NH4)2SO4, 0.49g/L MgSO4*7H2O, 2.64g/L KCl, 0.054g/L CaCl2*2H2O, 22g/L 시트르산 일수화물, 1.47mL/L PTM0 미량 금속, 0.8mg/L 비오틴 20mL/L NH4OH(25%); KOH를 사용하여 pH를 6.5로 설정했습니다.
d) 결과는 표 3에 표시된다. 형광은 세포내 eGFP 수준을 결정하기 위한 프록시이고 세포내 eGFP 수준은 PAOX1의 활성을 결정하기 위한 프록시였다. 결과는 1% 메탄올 유도 20시간에서 프로모터가 P. pastoris △aox1△aox2 균주에서 활성화되고 eGFP가 생성됨을 보여준다. P. pastoris △aox1△aox2 BB3aN_pAOX1_GFP_ScCYCtt 균주의 유도는 20시간 후 0.2% 메탄올보다 1%에서 더 우수하며, P. pastoris △aox1 균주에서는 메탄올 농도의 차이가 관찰되지 않는다.
negative control | ||||
P. pastoris △aox1△aox2 BB3aN_pAOX1_ GFP_ScCYCtt |
P. pastoris △aox1 BB3aN_pAOX1_ GFP_ScCYCtt |
P. pastoris △aox1△aox2 | P. pastoris △aox1 | |
0.2% MeOH at 4h | 4.39 ± 0.90 | 6.26 ± 1.74 | 2.94 | 2.92 |
1% MeOH at 4h | 5.59 ± 1.09 | 7.39 ± 1.57 | 2.95 | 2.89 |
0.2% MeOH at 20h | 37.81 ± 12.71 | 84.18 ± 4.57 | 2.37 | 2.70 |
1% MeOH at 20h | 62.89 ± 8.81 | 89.85 ± 3.90 | 2.35 | 2.42 |
Gene of interest name | DNA sequence 5' to 3' |
enhanced green fluorescent protein (eGFP) | (SEQ ID NO:33) ATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTAA |
Human serum albumin (HSA) with its native secretion leader | (SEQ ID NO:34) ATGAAGTGGGTTACTTTCATCTCCTTGTTGTTCTTGTTCTCCTCAGCTTACTCCAGAGGTGTTTTCAGAAGAGATGCTCACAAGTCCGAGGTTGCTCACAGATTCAAGGACTTGGGTGAAGAGAACTTCAAGGCTTTGGTTTTGATCGCTTTCGCTCAGTACTTGCAGCAGTGTCCATTCGAGGACCACGTTAAGTTGGTTAACGAGGTTACTGAGTTCGCTAAGACTTGTGTTGCTGACGAATCCGCTGAGAACTGTGATAAGTCCTTGCACACTTTGTTCGGTGACAAGTTGTGTACTGTTGCTACTTTGAGAGAAACTTACGGTGAGATGGCTGACTGTTGTGCTAAGCAAGAGCCTGAGAGAAACGAGTGTTTCTTGCAACACAAGGACGACAACCCAAACTTGCCAAGATTGGTTAGACCAGAGGTTGACGTTATGTGTACTGCTTTCCACGACAACGAAGAGACTTTCTTGAAGAAGTACTTGTACGAGATCGCTAGAAGACACCCATACTTCTACGCTCCAGAGTTGTTGTTCTTCGCTAAGAGATACAAGGCTGCTTTCACTGAGTGTTGTCAGGCTGCTGATAAGGCTGCTTGTTTGTTGCCAAAGTTGGACGAGTTGAGAGATGAGGGTAAGGCTTCTTCCGCTAAGCAGAGATTGAAGTGTGCTTCCTTGCAGAAGTTCGGAGAGAGAGCTTTTAAGGCTTGGGCTGTTGCTAGATTGTCCCAGAGATTCCCAAAGGCTGAGTTCGCTGAGGTTTCCAAGTTGGTTACTGACTTGACTAAGGTTCACACAGAGTGTTGTCACGGTGACTTGTTGGAATGTGCTGATGACAGAGCTGACTTGGCTAAGTACATCTGTGAGAACCAGGATTCCATCTCCTCCAAGTTGAAAGAATGTTGTGAGAAGCCTTTGTTGGAGAAGTCCCACTGTATCGCTGAGGTTGAAAACGACGAAATGCCAGCTGACTTGCCATCTTTGGCTGCTGACTTCGTTGAATCCAAGGACGTCTGCAAGAACTACGCTGAGGCTAAGGACGTTTTCTTGGGTATGTTCTTGTATGAGTACGCTAGAAGACATCCAGACTACTCCGTTGTTTTGTTGTTGAGATTGGCTAAGACTTACGAGACTACTTTGGAGAAGTGTTGTGCTGCTGCTGACCCACATGAGTGTTACGCTAAGGTTTTCGACGAGTTCAAGCCATTGGTTGAGGAACCACAGAACTTGATCAAGCAGAACTGTGAGTTGTTCGAGCAGTTGGGTGAGTACAAGTTCCAGAACGCTTTGTTGGTTAGATACACTAAGAAGGTTCCACAGGTTTCCACTCCAACTTTGGTTGAGGTTTCCAGAAACTTGGGTAAGGTTGGTTCCAAGTGTTGTAAGCACCCAGAGGCTAAGAGAATGCCATGTGCTGAGGACTACTTGTCTGTTGTTTTGAACCAGTTGTGTGTCTTGCACGAAAAGACACCAGTTTCCGACAGAGTTACTAAGTGTTGTACTGAATCCTTGGTTAACAGAAGACCTTGTTTCTCCGCTTTGGAGGTTGACGAGACTTACGTTCCAAAAGAGTTCAACGCTGAGACTTTCACTTTCCACGCTGACATCTGTACTTTGTCCGAGAAAGAGAGACAGATCAAGAAGCAGACTGCTTTGGTTGAGTTGGTTAAGCACAAGCCAAAGGCTACAAAAGAGCAGTTGAAGGCTGTTATGGACGACTTCGCTGCTTTCGTTGAGAAATGTTGTAAGGCTGACGACAAAGAGACTTGTTTCGCTGAAGAGGGTAAGAAGTTGGTTGCTGCTTCCCAAGCTGCTTTGGGTCTGTAA |
variable region of a camelid antibody (VHH) with the S. cerevisiae α-mating factor leader | (SEQ ID NO:35) ATGAGATTCCCATCTATTTTCACCGCTGTCTTGTTCGCTGCCTCCTCTGCATTGGCTGCCCCTGTTAACACTACCACTGAAGACGAGACTGCTCAAATTCCAGCTGAAGCAGTTATCGGTTACTCTGACCTTGAGGGTGATTTCGACGTCGCTGTTTTGCCTTTCTCTAACTCCACTAACAACGGTTTGTTGTTCATTAACACCACTATCGCTTCCATTGCTGCTAAGGAAGAGGGTGTCTCTCTCGAGAAGAGACAAGCCGGTGGTTCATTAAGATTGTCCTGTGCTGCCTCTGGTAGAACTTTCACTTCTTTCGCAATGGGTTGGTTTAGACAAGCACCTGGAAAAGAGAGAGAGTTTGTTGCTTCTATCTCCAGATCCGGTACTTTAACTAGATACGCTGACTCTGCCAAGGGTAGATTCACTATTTCTGTTGACAACGCCAAGAACACTGTTTCTTTGCAAATGGACAACCTTAACCCAGATGACACCGCAGTCTATTACTGTGCCGCTGACTTGCACAGACCATACGGTCCAGGAACCCAAAGATCCGATGAGTACGATTCTTGGGGTCAGGGAACTCAAGTCACTGTCTCTTCAGGTGGTGGATCTGGTGGTGGAGGTTCAGGTGGTGGAGGATCCGGTGGTGGTGGTTCTGGTGGTGGTGGATCTGGTGGAGGTGAAGTTCAACTTGTCGAATCCGGTGGTGCACTTGTCCAACCTGGTGGATCTCTTAGACTTTCTTGTGCCGCCTCCGGTTTTCCTGTTAACCGTTACTCTATGCGTTGGTACAGACAAGCCCCTGGAAAAGAACGTGAATGGGTTGCCGGAATGTCCTCAGCTGGTGACAGATCCTCCTACGAAGATTCTGTGAAGGGACGTTTCACCATCTCCAGAGATGACGCCCGTAACACCGTTTACCTTCAAATGAACTCCCTTAAGCCTGAGGATACTGCCGTCTACTATTGTAACGTGAATGTCGGATTTGAATACTGGGGACAGGGAACCCAAGTTACTGTCTCTTCCGGTGGACATCACCACCACCATCACTAATAG |
실시예 3 : 메탄올 유도성 AOX1 프로모터 하에서 분비된 HSA 및 VHH를 생성하는 P. pastoris △aox1 및 P. pastoris △aox1△aox2 균주의 생성.
P. pastoris △aox1△aox2 균주에서 분비된 재조합 단백질을 생산하는 능력을 테스트하고 이를 P. pastoris △aox1 균주와 비교하기 위해, 균주는 2개의 분비 모델 단백질에 대한 발현 구조로 형질전환되었다: (1) 인간 혈청 알부민 고유 분비 리더(HSA) 또는 (2) S. cerevisiae α-짝짓기 인자 분비 리더(VHH)가 있는 낙타류 항체의 가변 영역. 이러한 관심 유전자의 코딩 서열(코돈 최적화 및 외부 제공자에 의해 합성됨)은 표 4에서 찾을 수 있다.
a) HSA 및 VHH 생산에 사용되는 pPM2pN21_pAOX1_HSAopt_CycTT 및 pPM2pZ30_pAOX1_αMF-vHH_CycTT 발현 구성물은 WO2008128701A2에 기재된 pPuzzle ZeoR 벡터의 유도체이며, 이는 E.coli pUC19 ori 및 Zeocin 항생제 내성 카세트로 구성되어 있다. pPM2pN21_pAOX1_HSAopt_CycTT Zeocin 내성의 경우 제한 및 결찰을 통해 Nourseothricin 내성으로 교환된다. 또한 벡터는 효율적인 통합을 위해 PGI 유전자좌 PP7435_Chr3 (1366329…1367193)과 상동인 통합 시퀀스를 전달한다. 발현 벡터는 다른 곳에서 더 자세히 설명되어 있다(Gasser et al., 2013; Stadlmayr et al., 2010). 관심 유전자(GOI)의 발현은 PAOX1 PP7435_chr4(237941…238898) 및 Saccharomyces cerevisiae CYC1 전사 종결자에 의해 매개된다. 인간 혈청 알부민(HSA) 유전자(GenBank NP_000468)는 P. pastoris에 최적화된 코돈으로 최적화되었고 합성되었다. 고유 분비 리더가 있으므로 상층액으로 분비된다. VHH에 대한 유전자는 P. pastoris에 최적화된 코돈이고 합성되었으며(표 4), 상청액으로 분비하기 위한 N-말단 S. cerevisiae α-교배형 리더를 갖는다. 발현 구성체의 형질전환을 위해 원형 벡터를 XmnI (New England Biolabs, Inc., USA)를 사용하여 PGI1 상동 서열의 제한에 의해 선형화하고 Hi Yield® Gel/PCR DNA 단편 추출 키트(Sud- Laborbedarf GmbH, 독일)로 정제하였다.
b) 500ng 선형화된 pPM2pN21_pAOX1_HSAopt_CycTT 및 pPM2pZ30_pAOX1_αMF-vHH_CycTT plas1a)로 수행된 전기 컴피턴트 P. pastoris △aox1△aox2 및 P. pastoris △aox1의 전기천공 선택은 각각 100μg/mL Nourseothricin 또는 25μg/mL Zeocin이 포함된 YPD 플레이트에서 수행되었다.
실시예 4 : P. pastoris △aox1△aox2 및 P. pastoris △aox1 를 생성하는 HSA 및 VHH의 소규모 스크리닝.
a) 전배양을 위해 형질전환체를 선택에 사용된 항생제 내성을 기준으로 100μg/mL Nourseothricin 또는 25μg/mL Zeocin이 포함된 2mL YPD에 접종했다. 각각의 발현 구축물에 대해 스크리닝을 위해 12개의 형질전환체를 선택하였다. 전배양 및 스크리닝 배양물을 공기 투과성 막으로 밀봉된 24웰 플레이트에서 배양하고 25℃에서 280rpm으로 인큐베이션하였다. 스크리닝 배양물은 배양물을 포도당 한계로 유지하기 위해 6mm 피드비드(Kuhner Shaker GmbH, Germany)를 기반으로 하는 느린 포도당 방출 시스템이 있는 2mL의 최소 배지(ASMv6)에 8의 시작 광학 밀도(OD600)로 접종되었다. 균주는 수용된 총 메탄올 및 기간이 다른 다양한 메탄올 공급 절차와 비교되었다(표 5).
b) 인큐베이션 기간 후 1mL의 각 배양물을 제거하고 미리 가중된 Eppendorf 튜브에서 원심분리했다. 상청액을 제거하고 제조업체의 지침에 따라 Caliper LabChip GXII Touch (PerkinElmer, inc., USA)로 단백질 농도를 측정했다. 세포 펠릿으로 Eppendorf 튜브의 무게를 측정하여 습윤 세포 중량을 결정하고 다음과 같이 계산했다: 중량(전체)-중량(비어 있음) = 습윤 세포 중량(WCW)(g/L). 이 데이터에서 수율이 계산되었다: 수율(μg/g) = 단백질 농도 / 습윤 세포 중량. 농도가 두 배이거나 상층액에서 단백질이 검출되지 않는 형질전환체 데이터는 분석에서 이상치(outlier)로 제거되었다. 이상치(outlier)는 발현 구성체의 사본이 두 개 있거나 사본이 전혀 없는 형질전환자로 간주된다(Aw & Polizzi, 2013; Schwarzhans et al., 2016).
Protocol | Incubation period | Feedbeads | Start OD600 | Methanol pulse | Total methanol | Methanol shot time points |
Standard | 48 h | 12 mm | 8 | 4 x | 3.5% (v/v) | 4 h*, 19 h, 27 h, 43 h |
One shot | 48 h | 3x6 mm | 8 | 1 x | 1% (v/v) | 3 h |
Two shot | 48 h | 3x6 mm | 8 | 2 x | 2% (v/v) | 3 h, 23 h |
One shot - extended | 72 h | 3x6 mm | 8 | 1 x | 1% (v/v) | 3 h |
Two shot - extended | 72 h | 3x6 mm | 8 | 2 x | 2% (v/v) | 3 h, 43 h |
c) 결과는 P. pastoris △aox1△aox2가 PAOX1의 유도 하에서 분비된 단백질을 생산할 수 있고 수율이 산업 표준으로 사용되는 P. pastoris △aox1와 비슷함을 보여준다(표 6). “투샷-확장(two shot-extended)” 전략에서 P. pastoris △aox1△aox2는 더 나은 수확량을 보여 더 적은 메탄올로 더 긴 배양 시간에서 P. pastoris △aox1△aox2가 수확량 이점이 있음을 나타낸다. 또한 이것은 PAOX1 및 메탄올 유도에 의해 제어되는 분비 단백질을 생산하는 P. pastoris △aox1△aox2 균주를 스크리닝하기 위해 제한된 포도당 조건을 사용할 수 있음을 보여준다.
Standard | One shot | Two shot | One shot extended | Two shot extended | |
P. pastoris △aox1△aox2 pPM2pZ30_pAOX1_αMF-vHH_CycTT |
733 ± 59 | 219 ± 32 | 379 ± 38 | 0 | 410 ± 16 |
P. pastoris △aox1 pPM2pZ30_pAOX1_αMF-vHH_CycTT |
1465 ± 239 | 195 ± 66 | 413 ± 114 | 0 | 239 ± 77 |
P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT | 443 ± 111 | 138 ± 24 | 251 ± 110 | 228 ± 33 | 363 ± 55 |
P. pastoris △aox1 pPM2pN21_pAOX1_HSAopt_CycTT |
840 ± 36 | 79 ± 9 | 388 ± 61 | 83 ± 18 | 277 ± 23 |
실시예 5
: 생물 반응기 배양
재조합 단백질 생산 환경에서 유가식 모드에서 P. pastoris △aox1△aox2의 거동 및 공정 매개변수를 결정하기 위해 생물 반응기 배양이 수행되었다. 배양은 다음과 같이 수행하였다.
a) DASGIP 생물반응기는 0.7L의 작업 부피로 사용되었다(Eppendorf AG, Germany). 하나의 바이오리액터 시스템은 온도를 제어하기 위해 하나의 바이오 블록에 배열된 4개의 반응기로 구성된다. 각 반응기는 소프트웨어로 제어되는 4개의 연동 펌프에 연결되었다. 또한 각 반응기에는 중량 측정 방식으로 펌프 속도를 조정하기 위해 DASGIP 제어 소프트웨어(Eppendorf AG, Germany)에 연결된 2개의 저울이 있다. 각 반응기는 제어 가능한 가스 공급(압력 공기, N2, O2는 원하는 양으로 혼합될 수 있음) 및 반응기 오프 가스에서 O2 및 CO2 농도 측정을 위한 가스 분석기와 연결되었다. 반응기에는 DASGIP 제어 소프트웨어에 연결된 pH 프로브 및 용존 산소(DO) 프로브가 있다. DASGIP 제어 소프트웨어는 1분 간격으로 모든 매개변수를 기록하고 있었다.
b) 생물반응기 배양 배지는 BSM 배지(Mellitzer et al., 2014)로 구성되어 있다: 11.48 g/L H3PO4, 0.5 g/L CaCl2*2H2O, 7.5 g/L MgSO4*7H2O, 9 g/L K2SO4, 2 g/L KOH, 40g/L Glycerol, 0.25 g/L NaCl, 4.35 mL/L PTM0, 0.87 mg/L Biotin, 0.1 mL/L Glanapon 2000, pH set to 5.5 with 25% NH3.
c) PTM0는 하기로 구성된다: 6.0 g CuSO4*5H2O, 0.08 g NaI, 3.36 g MnSO4*H2O, 0.2 g Na2MoO4*2H2O, 0.02 g H3BO3, 0.82 g CoCl2, 20.0 g ZnCl2, 65.0 g FeSO4*7H2O, 5 mL/L H2SO4 (95 %-98 %).
d) 포도당 공급 배지는 하기로 구성된다: 50% (w/w) glucose, 2.08 mg/kg Biotin, 10.4 mL/kg PTM0. The methanol feed media was: 50% (v/v) or 100% (v/v) methanol. The glycerol feed media consisted of: 60% (w/w) glycerol, 2.08 mg/kg Biotin, 10.4 mL/kg PTM0.
e) 용존 산소(DO) 설정점은 20%였다. 특정 경우에 DO 제어가 비활성화되고 교반 및 통기가 일정한 750rpm 및 9.5sL/h로 수동으로 설정되었다. pH는 DASGIP 제어 소프트웨어에 의해 제어되는 12.5% 또는 25% NH3로 5.0 또는 5.5로 설정되었다. 산 조절은 필요한 경우 수동 첨가에 의해 10% H3PO4로 달성되었다. 온도는 25℃로 설정되었다. 시작 OD600은 2였고 시작 부피는 300mL + 15mL의 접종 배양물이었다.
f) 샘플링을 매일(대략 24시간마다) 수행했다. 먼저 반응기에서 3mL 흡인물을 취하여 샘플링 포트의 사부피를 제거했다. 그런 다음 9mL의 샘플을 취했다. 3 x 2 mL를 다시 무게를 재어진 2 mL Eppendorf 튜브에, 1 x 1.5 mL를 1.5 mL Eppendorf 튜브에 피펫팅했다. 샘플을 원심분리했다(16,000g, 10분, 4℃). 단백질 및 HPLC 분석을 위해 상청액을 수집하고 -20℃에서 보관하였다. 펠렛을 0.1M HCl 1mL에 재현탁하여 세척하여 미량의 염을 제거하고 다시 원심분리했다(16,000g, 10분, 4℃). 그 다음, 펠릿을 105℃에서 24시간 동안 건조시켜 건조 세포 중량을 결정하였다. 건조 세포 무게는 다음과 같이 계산되었다: (무게(전체)-무게(비어 있음)) / 2 = 건조 세포 무게(g/L) 및 3회 반복의 평균으로 계산되었다. HPLC 샘플만 필요한 경우 샘플 2mL만 취했다.
g) 세포 현탁액을 요오드화프로피디움으로 염색하여 세포 생존율을 측정하였다. 이를 위해 반응기 샘플의 세포 현탁액을 OD600이 0.5가 되도록 인산 완충 식염수로 희석하고, Gallios 유세포 분석기(Beckman coulter, Inc., USA) 590 - 650 nm의 필터를 사용하였다. 샘플당 50,000개의 이벤트가 측정되었다.
실시예 6 : 세포가 없는 생물 반응기에서 메탄올의 증발 속도 결정.
폭기 및 교반에 의한 반응기로부터의 메탄올의 증발 속도를 평가하기 위해 반응기를 멸균 매질로 채우고 메탄올로 펄스화하고, 메탄올 농도를 결정하기 위해 샘플을 채취하였다.
a) 이 예에서 2개의 반응기는 글리세롤이 없는 310mL의 BSM 배지로 채워졌고 2개의 반응기는 글리세롤이 없는 500mL BSM 배지로 채워져 글리세롤이 성장하는 배양물에 의해 소비되는 배치 단계의 끝에서 배지를 시뮬레이션했다.
b) P. pastoris △aox1△aox2 배양의 경우와 같이 반응기 교반기 속도를 760rpm으로 설정하고 가스 공급을 9.5sL/h로 설정했다. 매개변수는 표 7에서 찾을 수 있다.
c) 50%(v/v) 메탄올 펄스를 수동으로 추가하여 메탄올 농도를 1%(v/v)로 증가시키고 실제 달성 농도를 결정하기 위해 샘플을 채취했다. 3.4, 6.5, 22.4, 31.0, 47.9시간에 먼저 샘플 포트에서 3mL의 데드 볼륨을 제거하고 흡인물을 버려 샘플을 채취했다. 그 직후에 4mL 샘플을 취하였다.
d) 메탄올 농도의 HPLC 측정은 이전에 설명한 대로 수행되었다(Blumhoff, Steiger, Marx, Mattanovich, & Sauer, 2013). 식별 및 정량화를 위해 순수 표준물질이 사용되었다. 컬럼은 0.6mL/min의 4mM H2SO4 이동상으로 60℃에서 실행되는 Aminex HPX-87H(Bio-Rad Laboratories, Inc, USA)였다. 검출기는 굴절률 검출기 RID-10 A(Shimadzu, Corp., Japan)이고 계산은 LabSolutions v5.85 소프트웨어(Shimadzu, Corp., Japan)로 수행되었다.
e) 증발 속도는 시간과 농도 차이가 가장 큰 첫 번째와 마지막 샘플에서만 계산되었다. 인접한 샘플 사이의 농도 변화는 미미했으며 측정 오류는 계산에 상당한 영향을 미칠 수 있다. 데이터는 표 8에서 찾을 수 있다. 500mL 배지로 채워진 R1 및 R2의 평균값은 0.063 g*L-1*h-1이었다.
Reactor | Volume (mL) | Agitation (rpm) | Gassing (sL/h) | 50% (v/v) methanol (ml) |
R1 | 310 | 760 | 9.5 | 6.2 |
R2 | 310 | 760 | 9.5 | 6.2 |
R3 | 500 | 760 | 9.5 | 10 |
R4 | 500 | 760 | 9.5 | 10 |
Time (h) | |
|||||||
0 | 3.4 | 6.5 | 22.4 | 31.0 | 46.9 | |||
Reactor | Methanol (g/L) | dc/dt (g L-1 h-1) |
||||||
R1 | 7.91 | 6.13 | 7.53 | 6.76 | 6.10 | 5.49 | 0.052 | |
R2 | 7.80 | 7.14 | 7.49 | 6.72 | 6.28 | 4.29 | 0.075 | |
R3 | 7.47 | 7.73 | 5.07* | 7.05 | 6.93 | 6.43 | 0.022 | |
R4 | 7.54 | 7.80 | 6.33* | 6.97 | 4.39* | 6.49 | 0.022 |
*are too low and are considered as outliers.
실시예 7:
P. pastoris
△aox1△aox2
의 메탄올 흡수율 결정
메탄올 흡수율을 결정하기 위해 P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT 균주를 생물반응기에서 배양했다. 특정 바이오매스 농도까지 배양물을 성장시켰다. 그런 다음 메탄올 펄스를 적용하고 펄스 직후와 약 20시간 후에 샘플을 채취했다. 목표는 Mut- 균주의 메탄올 흡수율을 결정하고 이를 실시예 6에서 측정한 메탄올 증발율과 비교하는 것이었다.
a) 전배양: 반응기 접종 24시간 전에 100㎍/L 누르세오트리신을 함유하는 YPD 50mL에 P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT를 접종하였다. 반응기를 접종하기 3시간 전에 예비 배양물을 100㎍/L 누르세오트리신을 함유하는 또 다른 50mL YPD로 희석하였다. 접종 전에 적절한 양의 배양액을 원심분리(1500g, 5분, 20℃)하고 OD600이 42인 BSM 배지 15mL에 재현탁했다.
b) 300mL BSM 배지로 채워진 반응기에 P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT 배양 15mL를 접종했다. 반응기에서 표적 접종 OD600은 2였다. 용존 산소 스파이크에 의해 지시된 바와 같이 배치 단계의 끝에서, 바이오매스를 증가시키기 위해 50%(w/w) 글루코스 공급이 24시간 동안 2.4mL/h에서 시작되었다. 포도당 공급을 시작한 지 2시간 후에 9.5mL 50%(v/v) 메탄올 샷이 제공되어 메탄올 농도를 1.5%로 증가시켰다(측정된 농도는 R1 = 1.47% 및 R2 = 1.48%임). 이것은 메탄올 소비를 유도하기 위해 수행되었다. 포도당 공급 단계의 끝에서 세포 건조 중량 및 HPLC에 대한 샘플을 취했다.
c) 글루코스 단계 후 교반 및 가스 공급은 일정한 750rpm 및 9.5sL/h로 설정되었다. 추가 50% 메탄올 펄스를 추가하여 농도를 1.5%로 증가시키고 즉시 샘플을 채취했다(측정된 농도는 R1 = 1.36% 및 R2 = 1.36%임). 19.5시간 후에 농도를 다시 측정하여 특정 메탄올 흡수율(qmethanol)을 결정하는 데 사용했다.
d) 이 실험에 대한 메탄올 농도 감소(dc/dt)는 0.022 내지 0.063 g L-1 h-1 범위의 실시예 6e), 표 8에서 증발 속도에 대해 수득된 값과 비교하여 평균 0.37 g L-1 h-1에서 실질적으로 더 높았다.
특정 메탄올 흡수율은 다음과 같이 표 9에 나타난 데이터를 기반으로 계산되었다.
부피는 측정된 기간 동안 일정했다. 증발을 뺀 평균 비메탄올 흡수율(qmethanol)은 5.07 mg g-1 h-1이었다. 증발을 뺀 특정 메탄올 흡수율의 계산을 위해 실시예 6e), 표 8의 결과에 기초하여 22mg L-1 h-1의 증발율이 추정되었다. 이 결과는 완전히 새롭고 예상치 못한 것이었다. 지금까지 Mut-는 메탄올을 대사할 수 없고 메탄올의 감소는 증발 손실로 인한 것이라고 발표된 문헌에서 보고되고 수용되었다(Looser et al., 2015).
Reactor | Volume (mL) | CDW (g/L) |
Methanol at 0 h (g/L) |
Methanol at 19.5 h (g/L) |
dc/dt (g L-1 h-1) |
qmethanol (mg g-1 h-1) |
qmethanol- evaporated (subtracted evaporation) (mg g-1 h-1) |
R1 | 378 | 73.4 | 10.71 | 3.67 | 0.361 | 4.92 | 4.61 |
R2 | 372 | 72.6 | 10.74 | 3.35 | 0.379 | 5.22 | 4.90 |
실시예 8
: 배양 전략 1 -
P. pastoris
△aox1△aox2
에 일정한 포도당/메탄올 동시 공급 적용
P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT 균주는 재조합 단백질 생산 시나리오에서 배양되었다. 균주는 일정하게 제한된 포도당 공급으로 공급되었고 단백질 생산을 위해 메탄올로 유도되었다.
a) 실시예 7a) b)에 기술된 바와 같이 접종을 수행하였다. 배양은 두 단계로 분리되었다. (1) 1단계: BSM 배지에서 배치가 OD600 2에서 시작되었다. 배치 단계 종료는 반응기 R1의 경우 22.27시간 및 반응기 R2의 경우 21.52시간에 용존 산소 스파이크에 의해 표시되었다.
b) (2) 2단계: 97시간 동안 2.4mL/h의 공급 속도로 1단계 후에 50%(w/w) 글루코오스 공급이 있는 유가식 단계를 시작했다. 동시에 50%(v/v) 메탄올 펄스를 추가하여 메탄올 협력을 1.5%(v/v)로 증가시켰다. 실시예 6d)에 기술된 바와 같이 HPLC 샘플을 채취하여 정확한 농도를 측정하고 필요한 경우 추가 펄스를 첨가하였다. 실시예 7d)에서 측정된 바와 같이 예측된 바이오매스 농도 및 5 mg g-1 h-1의 특정 메탄올 흡수율에 기초하여 계산된 메탄올 공급물을 적용하였다. 메탄올 농도는 HPLC에 의해 라인에서 매일 측정하였다.
c) 메탄올 공급은 다음과 같이 시간 간격으로 계산되었다:
d) 실시예 7d)에 기초한 예측된 특정 메탄올 흡수율 때문에 라인 메탄올 농도 측정 및 사료 조정에서 하루에 한 번만 메탄올의 1.19%에서 1.5%(v/v)까지 생물반응기 배양 동안 과량의 메탄올 농도를 유지할 수 있었다.
e) 공정 및 생산성 데이터는 표 10에서 확인할 수 있다. 전체 평균 특정 생산성은 29.4 μg g-1 h-1이었다. 배양 종료 시 메탄올 농도는 반응기 R1 및 R2에 대해 10.4 및 10.0g/L(1%(v/v) 메탄올은 7.92g/L에 해당)이었다. 반응기 R1 및 R2에 의해 단계 2에서 소비된 메탄올의 총량은 25.03g 및 24.07g이었다. 이것은 다음 방정식으로 계산되었다:
Time (h) | Volume (mL) | YDM (g/L) | Recombinant protein concentration (mg/L) | Specific productivity (qP) (μg g-1 h-1) |
Methanol concentration (g/L) | |||||
R1 | R2 | R1 | R2 | R1 | R2 | R1 | R2 | R1 | R2 | |
22.30 | 318.2 | 318.0 | 25.2 | 25.0 | 0.0 | 0.0 | ||||
24.60 | 4.9* | 9.0* | ||||||||
43.22 | 382.9 | 378.3 | 66.4 | 67.0 | 75.4 | 75.2 | 64.50 | 63.63 | 10.3 | 11.9 |
68.20 | 458.5 | 453.1 | 99.0 | 101.5 | 164.0 | 142.5 | 31.74 | 23.35 | 9.4 | 10.0 |
92.45 | 528.9 | 521.5 | 119.8 | 122.0 | 235.9 | 211.6 | 18.83 | 17.28 | 11.0 | 10.7 |
116.37 | 621.6 | 613.5 | 135.1 | 136.9 | 363.6 | 338.4 | 28.30 | 27.17 | 10.3 | 9.9 |
120.12 | 625.3 | 617.6 | 136.0 | 137.3 | 390.9 | 378.6 | 28.90 | 30.17 | 10.4 | 10.0 |
* Represents a control sample after the methanol pulse.
실시예 9 : 배양 전략 2 - 분리된 포도당 공급 단계와 메탄올 전용 공급 단계가 있는 공급 전략.
P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT 균주는 바이오매스를 증가시키기 위해 먼저 제한된 포도당 공급물을 적용한 다음 단백질 생산을 유도하기 위해 메탄올 펄스 및 공급물로 분리된 단계를 적용하는 재조합 단백질 생산 시나리오에서 테스트되었다.
a) 생물반응기 배양은 3단계로 분리되었다. (1) 1단계는 시작 OD600이 2인 BSM 배지의 배치 단계로 구성되었다. 접종은 실시예 7a) b)에 설명된 대로 수행되었다. 배치 단계는 반응기 R3 및 R4에 대해 각각 19.68 및 19.50시간 동안 지속되었다. (2) 2단계는 바이오매스 농도를 증가시키기 위해 25시간 동안 4.8mL/h에서 50%(w/w) 포도당 공급이었다. (3) 3단계는 50%(v/v) 메탄올 펄스로 시작하여 1.5%(v/v)의 목표 농도에 도달하고 메탄올 공급 프로파일은 72.7시간 동안 실시예 8c)에 기술된 바와 같이 예측된 세포 건조 중량 및 특정 메탄올 흡수율을 기반으로 계산되었다. 메탄올 농도는 정확한 농도를 측정하기 위해 실시예 6d)에 기술된 바와 같이 매일 HPLC 라인에서 측정되었고, 필요하다면 추가적인 보상 풀이 첨가되었다. 이 단계에서 반응기 교반기 속도는 일정한 760rpm으로 설정되고 기체 공급은 9.5sL/h로 설정되었다.
b) 공정 및 생산성 데이터는 표 11에서 찾을 수 있다. 배양 전반에 걸친 최대 및 최소 메탄올 농도 범위는 4.3g/L에서 12.55g/L이다. 전체 평균 특정 생산성은 32.9 μg g-1 h-1이었다. 배양 종료시 메탄올 농도는 반응기 R3 및 R4에 대해 7.10 및 7.47 g/L이었다. 반응기 R3 및 R4에 의해 단계 3에서 소비된 메탄올의 양은 12.0g 및 12.6g이었다. 이는 실시예 8e)에서와 같이 계산되었다. 바이오매스는 3단계에서 일정하기 때문에 3단계에 대한 메탄올 흡수율(qmethanol)은 다음 식과 같이 계산되었다.
단계 3에서 반응기 R3에 대한 qmethanol은 3.79 mg g-1 h-1이고 반응기 R4에 대한 q메탄올은 3.92 mg g-1 h-1이다.
c) 표 11의 총 바이오매스는 12mL의 샘플 회수에 대해 수정되었으며 바이오매스가 증가하지 않았음을 보여줍니다. 전체적으로 3단계의 총 바이오매스는 반응기 R3 및 R4의 경우 4.5% 및 3.4% 감소했습니다. 놀랍게도 배양액은 분비된 재조합 단백질을 생산하고 있었습니다. 이는 P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT 균주가 뚜렷한 성장 없이 메탄올만 공급한 경우에도 재조합 분비 단백질을 효율적으로 생산할 수 있음을 보여준다. 메탄올을 유일한 탄소원으로 하여 3단계에서 생산된 단백질의 총 평균량은 105mg이다.
Time (h) | Volume (mL) | YDM (g/L) | Total Biomass (g) |
Recombinant protein concentration (mg/L) | Specific productivity (qP) (μg g-1 h-1) |
Methanol concentration (g/L) | |||||||
Phase | R3 | R4 | R3 | R4 | R3 | R4 | R3 | R4 | R3 | R4 | R3 | R4 | |
1 | 20.13 | 317.9 | 318.5 | 25.5 | 25.5 | 8.1 | 8.1 | ||||||
2 | 29.92 | 366.5 | 368.0 | 67.2 | 67.0 | 24.9 | 24.9 | 0.0 | 0.0 | 0.0 | 0.0 | ||
45.02 | 445.8 | 447.8 | 108.0 | 107.7 | 49.2 | 49.3 | 0.0 | 0.0 | 0.0 | 0.0 | |||
3 | 47.08 | 12.1* | 12.5* | ||||||||||
53.00 | 444.2 | 446.1 | 104.4 | 103.7 | 48.8 | 48.6 | 46.1 | 45.7 | 35.56 | 35.6 | |||
69.58 | 432.2 | 435.7 | 103.3 | 102.9 | 48.3 | 48.5 | 106.7 | 107.8 | 22.51 | 23.3 | 4.3 | 5.9 | |
93.93 | 434.7 | 437.0 | 98.5 | 99.1 | 47.7 | 48.2 | 244.0 | 251.0 | 38.67 | 39.9 | 6.6 | 7.4 | |
118.12 | 434.4 | 435.9 | 94.2 | 95.3 | 47.0 | 47.6 | 350.9 | 350.2 | 33.07 | 30.0 | 7.1 | 7.5 |
* Represents a control sample after the methanol pulse.
실시예 10 : 배양 전략 3 - 포도당/메탄올 동시 공급 단계 및 분리된 메탄올 단독 공급 단계를 사용한 공급 전략.
P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT 균주는 배치 단계 후에 제한된 포도당 공급과 추가 메탄올 펄스 및 공급이 적용되어 바이오매스 증가와 재조합 단백질 생산을 동시에 달성하는 재조합 단백질 생산 시나리오에서 테스트되었다. 원하는 바이오매스에 도달한 후 포도당 공급은 중단되었지만 메탄올 공급은 나머지 배양 동안 계속되었다.
a) 이 생물 반응기 배양은 3단계로 분리되었다. (1) 1단계는 배치 단계였다. 이를 위해 반응기에 시작 OD600이 2인 생산 균주 P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT를 접종하였다. 접종은 실시예 7a) b)에 기재된 바와 같이 수행하였다. 배치 단계는 반응기 R1 및 R2에 대해 각각 19.35시간 및 19.37시간 동안 지속되었다. 배치 단계의 끝은 용존 산소 피크로 표시되었다. (2) 이 시점에서 2단계가 시작되었다. 2단계는 25시간 동안 4.8mL/h에서 50%(w/w) 포도당 공급으로 구성되었다. 2단계 시작 시 50%(v/v) 메탄올 펄스를 적용하여 메탄올 농도를 1.5%(v/v)의 목표로 증가시켰고 후속 메탄올 공급을 시작하여 포도당 공급으로 메탄올 소비, 증발 및 희석을 상쇄했다. (3) 3단계는 72.9시간 동안 메탄올만 공급하는 것으로 구성되었다. 이 단계에서 반응기 교반기 속도는 일정한 760rpm으로 설정되고 기체 공급은 9.5sL/h로 설정되었다. 메탄올 농도는 실시예 6d)에 기재된 바와 같이 매일 HPLC에 따라 측정하였다. 필요한 경우 추가 보상 펄스가 추가되었다.
b) 메탄올 공급은 실시예 9b)에서와 같이 시간 간격으로 계산되었다:
c) 공정 및 생산성 데이터는 표 12에서 찾을 수 있다. 두 반복의 배양을 통한 최대 및 최소 메탄올 농도 범위는 6.9g/L에서 11.4g/L이다. 전체 평균 특정 생산성은 45.8 μg g-1 h-1이었고, 3단계의 평균 특정생산성은 34.0 μg g-1 h-1이었다. 배양 종료 시 메탄올 농도는 반응기 R1 및 R2에 대해 8.0g/L였다. 반응기 R1 및 R2에 의해 단계 3에서 소비된 메탄올의 양은 14.4g 및 14.1g이었다. 이는 실시예 9b)에 나타낸 방정식에 의해 계산되었다. 바이오매스가 3단계에서 일정했기 때문에 실시예 9b)에 나타낸 바와 같이 3단계에 대한 메탄올 흡수율을 계산하였다(qmethanol). 단계 3에서 반응기 R1에 대한 qmethanol은 4.61 mg g-1 h-1이었고 반응기 R2에 대한 qmethanol은 4.54 mg g-1 h-1이었다. 전체적으로 바이오매스는 3단계에서 반응기 R1 및 R2에 대해 5.7% 및 5.5% 감소했다. 다시 말하지만, 이것은 P. pastoris △aox1△aox2 균주를 사용하여 명백한 성장이 없는 균주 생산이 가능함을 보여준다. 메탄올만을 탄소원으로 하여 3단계에서 생산된 재조합 단백질의 평균 총량은 106mg으로 실시예 9, 3단계에서 생산된 재조합 단백질 105mg과 유사하다. 이것은 또한 이 실시예에서 32.9 μg g-1 h-1 및 34.0 μg g-1 h-1에서 실시예 9의 3단계에서 유사한 비 생산성에 의해 설명된다. 결론적으로, 3단계(메탄올 단독 공급 단계)의 생산성은 배양이 2단계(포도당 공급 단계)에서 유도되었는지 여부에 의존하지 않았다. 재조합 단백질 생산은 성장과 무관하기 때문에 메탄올 단독 공급 전략은 P. pastoris △aox1△aox2 균주와 함께 사용될 때 몇 가지 이점이 있다. 실시예 8에서와 같이 메탄올 단독 공급 단계가 없는 생물반응기 배양에서 공정은 최대 반응기 부피 및 효모 건조 질량 농도에 의해 제약을 받는다. 특정 시간이 지나면 이러한 제약이 최대 부피 또는 원하는 최대 바이오매스 농도에 도달하여 배양 과정을 중지한다. 실시예 9에서와 같이 P. pastoris △aox1△aox2와 함께 메탄올 공급 단계를 사용함으로써 바이오매스가 증가하지 않고 부피 증가가 무시할 수 있기 때문에 배양 시간은 더 이상 바이오매스 농도 또는 부피에 의해 제한되지 않는다. 결과적으로 높은 바이오매스 농도의 배양은 이러한 제약 조건에 도달하지 않고 더 오랜 기간 동안 생물 반응기에 보관될 수 있으며 관심 있는 단백질의 농도를 증가시키는 더 긴 생산 단계를 허용한다. 다음 실시예 12에 나타난 바와 같이 메탄올 이용이 느린 P. pastoris △aox1 균주를 사용할 때 메탄올 단독 공급 단계도 적용되지만 P. pastoris △aox1는 메탄올 단독 공급에서 지속적으로 성장하므로 이러한 이점이 존재하지 않습니다. 논의된 것과 동일한 제약을 나타냅니다. P. pastoris △aox1를 P. pastoris △aox1△aox2와 동일한 메탄올 공급 속도로 제한하면 생산성 손실이 발생합니다. P. pastoris △aox1△aox2 균주의 추가 공정 관련 개선 사항은 실시예 12에서 논의된다.
Time (h) | Volume (mL) | YDM (g/L) | Total Biomass (g) |
Recombinant protein concentration (mg/L) | Specific productivity (qP) (μg g-1 h-1) |
Methanol concentration (g/L) | |||||||
Phase | R1 | R2 | R1 | R2 | R1 | R2 | R1 | R2 | R1 | R2 | R1 | R2 | |
1 | 20.13 | 318.0 | 317.7 | 25.0 | 24.9 | 7.9 | 7.9 | 0.0 | 0.0 | 0.0 | 0.0 | ||
2 | 21.87 | 11.0* | 11.4* | ||||||||||
29.92 | 374.5 | 374.2 | 65.3 | 64.6 | 24.7 | 24.5 | 47.7 | 51.9 | 88.6 | 97.3 | |||
45.02 | 464.2 | 461.8 | 104.0 | 103.1 | 49.4 | 48.7 | 203.0 | 243.4 | 87.1 | 108.6 | 7.2 | 6.9 | |
33 | 53.00 | 462.7 | 460.9 | 99.7 | 99.5 | 48.4 | 48.2 | 246.1 | 265.5 | 38.6 | 21.5 | ||
69.58 | 457.4 | 455.6 | 95.9 | 96.3 | 47.4 | 47.4 | 357.3 | 371.8 | 47.3 | 44.9 | 7.9 | 7.5 | |
93.93 | 459.8 | 458.3 | 91.9 | 91.2 | 46.9 | 46.5 | 459.5 | 515.0 | 33.9 | 47.4 | 8.2 | 7.1 | |
118.12 | 462.0 | 460.8 | 88.3 | 87.3 | 46.6 | 46.0 | 494.8 | 568.2 | 14.8 | 21.6 | 8.0 | 8.0 |
* Represents a control sample after the methanol pulse.
실시예 11
: 배양 전략 3 - VHH를 분비하는
P. pastoris
△aox1△aox2
에 글루코오스/메탄올 동시 공급 단계 및 분리된 메탄올 단독 공급 단계를 사용한 공급 전략
다른 분비 단백질을 사용한 분비 재조합 단백질 생산을 확인하기 위해 실시예 10a)에 기재된 생물반응기 배양을 균주 P. pastoris △aox1△aox2 pPM2pZ30_pAOX1_αMF-vHH_CycTT로 반복하였다.
a) 실시예 10a)에서와 같이, 이 생물반응기 배양은 3단계로 분리되었다. (1) 1단계는 배치 단계였다. 이를 위해 실시예 7a) b)에 기술된 바와 같이 시작 OD600이 2인 생산 균주 P. pastoris △aox1△aox2 pPM2pZ30_pAOX1_αMF-vHH_CycTT를 반응기에 접종하였다. 배치 단계는 반응기 R1 및 R2에 대해 각각 18.79 및 19.33시간 동안 지속되었다. 배치 단계의 끝은 용존 산소 피크로 표시되었다. (2) 이 시점에서 2단계가 시작되었다. 2단계는 실시예 10에서보다 훨씬 더 높은 바이오매스를 증가시키기 위해 33.9시간 동안 4.8mL/h에서 50%(w/w) 포도당 공급으로 구성되었다. 2단계의 시작에서 50%(v/v) 메탄올 펄스는 메탄올 농도를 1.5%(v/v)의 목표 값으로 증가시키기 위해 첨가하고 후속 메탄올 공급을 시작하여 메탄올 소비, 증발 및 포도당 공급에 의한 희석을 상쇄했다. (3) 3단계는 63.9시간 동안 메탄올만 공급하는 것으로 구성되었다. 교반기 속도는 일정한 760 rpm으로 설정되었고 기체 공급은 9.5 sL/h로 설정되었다. 메탄올 농도는 실시예 6d)에 기재된 바와 같이 매일 HPLC에 따라 측정하였다. 필요한 경우 추가 보상 펄스가 추가되었다.
b) 메탄올 공급물을 실시예 9b)에 기재된 바와 같이 계산하였다.
공정 및 생산성 데이터는 표 13에서 찾을 수 있다. 두 반복의 배양을 통한 최대 및 최소 메탄올 농도 범위는 8.7g/L(R1)에서 11.3g/L(R1)입니다. 전체 평균 특정 생산성은 118.0 μg g-1 h-1이었고 3단계에서는 88.2 μg g-1 h-1이었다. 배양 종료 시 메탄올 농도는 반응기 R1 및 R2에 대해 10.5 및 10.8 g/L이었다. 반응기 R1 및 R2에 의해 소비된 메탄올의 양은 26.6g 및 26.0g이었다. 이는 실시예 8e)에 나타낸 바와 같이 하기 방정식에 의해 계산하였다. 이 양은 더 높은 바이오매스 농도로 인해 실시예 10에서와 같이 더 높지만 MutS 균주(실시예 12에 기술됨)에서보다 여전히 현저히(5배) 낮다. 바이오매스는 3단계에서 일정하기 때문에 메탄올 흡수율(qmethanol)은 실시예 9b에 나타낸 바와 같이 3단계에 대해 계산되었다. 단계 3에서 반응기 R1에 대한 qmethanol은 4.75 mg g-1 h-1이었고 반응기 R2에 대해서는 4.68 mg g-1 h-1이었다.
c) 전체적으로 바이오매스는 이전 실시예에서와 같이 3단계에서 반응기 R1 및 R2에 대해 4.4% 및 4.9% 감소했다. 표 13의 데이터는 P. pastoris △aox1△aox2 균주가 리터당 그램 양으로도 분비된 재조합 단백질을 생산할 수 있음을 분명히 보여준다. 메탄올 단독 공급 단계에서 vHH 농도는 815.5 mg/L만큼 증가했으며, 이는 메탄올을 유일한 탄소원으로 사용하여 평균 총 323.1 mg의 항체 단편이 생성되었음을 의미한다.
Time (h) | Volume (mL) | YDM (g/L) | Total biomass (g) |
Recombinant protein concentration (mg/L) | Specific productivity (qP) (μg g-1 h-1) |
Methanol concentration (g/L) | |||||||
Phase | R1 | R2 | R1 | R2 | R1 | R2 | R1 | R2 | R1 | R2 | R1 | R2 | |
1 | 20.00 | 316.7 | 316.7 | 25.1 | 25.2 | 7.9 | 8.0 | 0.0 | 0.0 | 0.0 | 0.0 | ||
2 | 21.42 | 10.9* | 10.9* | ||||||||||
28.22 | 358.4 | 358.7 | 60.2 | 60.1 | 21.9 | 21.9 | 58.2 | 59.7 | 137.8 | 141.5 | |||
44.83 | 449.9 | 449.8 | 105.8 | 105.2 | 48.6 | 48.3 | 494.4 | 464.5 | 222.8 | 208.3 | 7.8 | 7.9 | |
53.58 | 499.8 | 499.4 | 124.1 | 122.9 | 64.3 | 63.7 | 776.8 | 854.1 | 176.0 | 246.2 | |||
3 | 68.83 | 502.5 | 503.3 | 115.5 | 116.3 | 61.8 | 62.3 | 1156.0 | 1030.0 | 142.5 | 72.2 | 8.7 | 9.5 |
92.00 | 511.3 | 511.1 | 110.8 | 109.4 | 61.8 | 61.1 | 1337.2 | 1374.0 | 55.8 | 97.5 | 11.3 | 9.8 | |
117.92 | 525.0 | 527.3 | 104.7 | 102.7 | 61.5 | 60.6 | 1623.2 | 1638.6 | 85.7 | 85.8 | 10.5 | 10.8 |
* Represents a control sample after the methanol pulse.
실시예 11.1 : 확립된 생물반응기 배양 프로토콜로 배양한 메탄올 활용도가 느린 P. pastoris △aox1 (Mut S )와 비교하여 P. pastoris △aox1△aox2 (Mut - ) 균주를 사용하여 얻은 공정 매개변수.
비교를 위해 P. pastoris △aox1 pPM2pN21_pAOX1_HSAopt_CycTT를 MutS 표현형에 대해 확립된 배양 프로토콜로 배양했다(Potvin, Ahmad, & Zhang, 2012).
a) 이 생물 반응기 배양은 4단계로 분리되었다. (1) 1단계는 배치 단계였다. 이를 위해 반응기에 실시예 7a) b)에 기술된 바와 같이 시작 OD600이 2인 생산 균주 P. pastoris △aox1 pPM2pN21_pAOX1_HSAopt_CycTT를 접종하였다. 배치 단계는 반응기 R1 및 R2에 대해 각각 20.17 및 20.30시간 동안 지속되었다. 배치 단계의 끝은 용존 산소 피크로 표시되었다. (2) 2단계는 8시간 동안 선형으로 증가하는(y = 0.225x + 1.95) 60% 글리세롤 공급이다. (3) 3단계는 18시간 동안 선형 감소(y = 3.75 - 0.111x) 60% 글리세롤 공급과 선형 증가(y = 0.028x + 0.6) 100% 메탄올 공급이 있는 동시 공급 단계이다. (4) 단계 4는 72시간 동안 선형으로 증가하는 100% 메탄올 공급(y = 0.028x + 1.10)이 있는 메탄올 단독 공급 단계이다. 총 실행 시간은 119.25시간이었다.
b) 글리세롤 및 메탄올 공급물은 DASGIP 제어 소프트웨어(Eppendorf AG, Germany)에 의해 a)의 방정식에 따라 중량 측정적으로 제어되었다.
c) 공정 및 생산성 데이터는 표 131에서 확인할 수 있습니다. 3~4단계(생산 단계)의 전체 평균 비 생산성은 61.7 μg g-1 h-1이었다. 소비된 메탄올의 평균 총량은 전체 배양 기간 동안 165.8g이었고 4단계(메탄올 단독 공급 단계)에서 150.6g이었다. 이것이 메탄올 제한 배양이기 때문에 배양 브로쓰의 잔류 메탄올 농도는 0으로 간주되었다. 이 실시예의 4단계는 실시예 9, 10 및 11의 3단계에 해당한다. 단계 4의 평균 바이오매스에 기초하여 실시예 9b)에 나타낸 바와 같이 메탄올 흡수율(qmethanol)을 계산했다. 반응기 R1에 대한 4단계의 qmethanol은 반응기 R2에 대해 37.1 mg g-1 h-1 및 37.6 mg g-1 h-1이다. 4단계의 qmethanol은 원치 않는 바이오매스 증가를 촉진한다. 배양 종료 시 총 바이오매스의 53.2%(R1) 및 52.4%(R2)는 메탄올에서 4단계 성장 동안 생성된다.
d) 변형 관련 공정 매개변수의 비교가 표 132에 나타나 있으며 제시된 예의 특정 메탄올 흡수율 및 공급 속도에 대한 개요는 표 133에 나와 있다. P. pastoris △aox1△aox2 Mut-를 사용하여 재조합 단백질 생산을 위한 여러 주요 공정 매개변수가 P. pastoris △aox1를 사용한 공정에 비해 상당히 개선되었다. 반응열이 80% 이상 감소하여 냉각 필요성이 감소한다. 특정 산소 흡수율과 산소 전달율이 80% 이상 감소하여 혼합 및 통기의 필요성이 줄어들고 통기의 유량이 감소하고 생물 반응기 용기에 순수한 산소를 공급해야 할 필요성이 줄어든다. 낮은 특정 메탄올 흡수율은 배양에 필요한 메탄올의 양을 감소시킨다. 메탄올은 독성이 있고 가연성이다.
Mut- 균주를 사용하면 생산 시설에서 처리 및 저장해야 하는 메탄올의 양이 줄어들기 때문에 기술 및 안전성이 향상된다. 또 다른 이점은 높은 메탄올 농도에 대한 P. pastoris △aox1△aox2의 낮은 민감도이다. 이는 실시예 10의 균주 P. pastoris △aox1△aox2 및 본 실시예의 P. pastoris △aox1의 세포 생존율 데이터에 의해 확인된다. 실시예 10에서 공정 종료 시 반응기 R1 및 R2에서 돌연변이 세포의 생존율은 99.8% 및 99.7%였다. 대조적으로, 이 실시예에서 반응기 R1 및 R2에서 MutS 세포의 세포 생존율은 95.9% 및 96.5%였다. P. pastoris △aox1△aox2 균주의 낮은 감도와 높은 생존력은 재조합 생산 분비 단백질의 순도에 영향을 미친다. 용해된 세포는 관심 단백질을 분해하고 상청액에 원치 않는 가용성 단백질을 추가하는 프로테아제를 방출한다. 두 효과는 모두 순도를 낮추고 상청액에서 관심 단백질의 손실을 초래한다. 이 실시예에서 P. pastoris △aox1의 순도는 반응기 R1 및 R2에 대해 72% 및 77%인 반면, 실시예 10에서 P. pastoris △aox1△aox2의 순도는 반응기 R1 및 R2 모두에 대해 85%였다.
Time (h) | Volume (mL) | YDM (g/L) | Total biomass (g) |
Recombinant protein concentration (mg/L) | Specific productivity (qP) (μg g-1 h-1) |
||||||
Phase | R1 | R2 | R1 | R2 | R1 | R2 | R1 | R2 | R1 | R2 | |
1 | 20.3 | 318.1 | 316.5 | 26.6 | 25.9 | 8.5 | 8.2 | ||||
2 | 28.5 | 330.4 | 328.6 | 51.6 | 51.4 | 17.0 | 16.9 | 0.0 | 0.0 | 0.00 | 0.0 |
3 | 47.1 | 392.5 | 390.3 | 99.6 | 100.4 | 39.1 | 39.2 | 129.6 | 112.9 | 65.57 | 56.6 |
4 | 69.8 | 428.4 | 426.5 | 111.5 | 111.4 | 47.7 | 47.5 | 260.9 | 306.7 | 36.89 | 53.9 |
92.9 | 487.8 | 487.3 | 126.9 | 124.6 | 61.9 | 60.7 | 548.1 | 534.7 | 67.14 | 56.7 | |
119.3 | 581.9 | 584.9 | 143.7 | 140.8 | 83.6 | 82.3 | 893.9 | 927.9 | 61.55 | 72.7 |
|
P. pastoris △aox1△aox2 pPM2pN21_ pAOX1_HSAopt_CycTT Example 10 |
P. pastoris △aox1 pPM2pN21_ pAOX1_HSAopt_CycTT Example 11.1 |
Change | |
Overall | HSA concentration (mg/L) | 531 | 911 | -42% |
qproduct (μg g-1 h-1) |
46 | 62 | -26% | |
Methanol only feed phase: Example 10 - Phase three; Example 11.1 - Phase four |
Duration (h) | 73.1 | 72.2 | |
Heat production rate (W/L) | 3 | 19.2 | -84% | |
OTR (mM/h) |
23 | 149 | -85% | |
Heat of reaction (kJ) Integrated OTR (MA 120 min) |
359 | 2286 | -84% | |
Heat of combustion (kJ) | 324 | 2468 | -87% | |
qO2 (mmol g-1 h-1) |
-81% | |||
qmethanol (mg g-1 h-1) | 4.6 | 37.4 | -88% | |
Protein (mg) | 106 | 250 | -58% | |
Protein/methanol(mg g-1) | 7 | 1.7 | +311% | |
Protein/02(mg mol-1) | 135 | 51 | +164% | |
Protein/Heat of reaction (mg kJ-1) | 0.30 | 0.11 | +172% |
Example 7 | Example 9 | Example 10 | Example 11 | Example 11.1 | ||||||
Reactor | R1 | R2 | R3 | R4 | R1 | R2 | R1 | R2 | R1 | R2 |
qmethanol (mg g-1 h-1) | 4.92 | 5.22 | 3.79 | 3.92 | 4.61 | 4.54 | 4.75 | 4.68 | 37.1* | 37.1* |
Feed rate(mg g-1 h-1) | NA | NA | 4.79 | 4.89 | 5.80 | 5.73 | 5.78 | 7.71 | 37.1 | 37.6 |
실시예 12 : 메탄올 이용 음성 및 알코올 탈수소효소 결함 균주의 생성.
실시예 7에서 관찰된 P. pastoris Mut- 균주의 메탄올 소비는 예상치 못한 새로운 것이었다. 이 지식에 기초하여 알코올 탈수소효소가 이러한 특성에 책임이 있을 수 있다는 가설이 형성되었다. P. pastoris △aox1△aox2에서 메탄올 소비에 대한 알코올 탈수소효소의 효과를 테스트하기 위해 두 가지 잠재적 알코올 탈수소효소 ADH2: PP7435_Chr2-0821 및 ADH900: PP7435_Chr2-0990을 선택하여 삭제했다. (1) ADH2 결손주, (2) ADH900 결손주, (3) 이중 결실 ADH2 & ADH900 균주가 항생제 내성 유전자의 코딩 영역을 교환하여 3개의 균주를 생성하였다. 효과적인 균주 (1) P. pastoris △aox1△aox2 adh2△::HphR, (2) P. pastoris △aox1△aox2 adh900△::KanMX 및 (3) P. pastoris △aox1△aox2 adh2△::HphR adh900△::KanMX가 생성되었다.
a) P. pastoris △aox1△aox2를 실시예 1a)에 기술된 바와 같이 전기적격으로 만들었다. ADH2 결실을 생성하기 위해 유출된 마커 접근법이 실시예 1b)에 기술된 바와 같이 사용되었다. 전기적격 세포를 실시예 1d)에 기재된 바와 같이 500ng의 Adh2 분할 마커 카세트 1 및 500ng Adh2 분할 마커 카세트 2로 형질전환시켰다. 카세트 서열은 표 14에서 찾을 수 있다. 형질전환체는 200㎍/mL 하이그로마이신이 포함된 YPD 플레이트에서 선택되었다. 하나의 클론은 PCR 증폭 및 PCR 앰플리콘의 시퀀싱을 기반으로 선택되었다. ADH2 코딩 영역의 항생제 마커로의 성공적인 치환은 프라이머 Adh2_KO_ctrl_fwd & Adh2_KO_ctrl_rev(표 15)를 사용한 PCR 증폭 및 PCR 앰플리콘(Microsynth AG, Swiss)의 시퀀싱에 의해 확인되었다. 생성된 균주를 (1) P. pastoris △aox1△aox2 adh2△::HphR이라고 한다.
b) P. pastoris △aox1△aox2 균주를 실시예 1a)에 기술된 바와 같이 전기적격으로 만들었다. 전기적격 세포를 실시예 1d)에 기재된 바와 같이 500ng의 Adh900 분할 마커 카세트 1 및 500ng Adh900 분할 마커 카세트 2로 형질전환시켰다. 카세트 서열은 표 14에서 찾을 수 있다. 형질전환체는 500㎍/mL Geneticin이 포함된 YPD 플레이트에서 선택되었다. 하나의 클론은 PCR 증폭 및 PCR 앰플리콘의 시퀀싱을 기반으로 선택되었다. ADH900 코딩 영역의 항생제 마커로의 성공적인 치환은 프라이머 AdhII_KO_Ctrl_fwd & AdhII_KO_Ctrl_rev(표 15)를 사용한 PCR 증폭 및 PCR 앰플리콘(Microsynth AG, Swiss)의 시퀀싱에 의해 확인되었다. 생성된 균주를 (2) P. pastoris △aox1△aox2 adh900△::KanMX라고 한다.
c) P. pastoris △aox1△aox2 adh2△::HphR 균주를 주 배양 배지에 200㎍/mL 하이그로마이신을 첨가한 것을 제외하고는 실시예 1a)에 기술된 바와 같이 전기 적합성으로 만들었다. 전기적격 세포를 실시예 1d)에 기재된 바와 같이 500ng의 Adh900 분할 마커 카세트 1 및 500ng Adh900 분할 마커 카세트 2로 형질전환시켰다. 카세트 서열은 표 14에서 찾을 수 있다. 형질전환체는 200㎍/mL 하이그로마이신 및 500㎍/mL 제네티신이 포함된 YPD 플레이트에서 선택되었다. 하나의 클론은 PCR 증폭 및 PCR 앰플리콘의 시퀀싱을 기반으로 선택되었다. ADH900 코딩 영역의 항생제 마커로의 성공적인 치환은 프라이머 AdhII_KO_Ctrl_fwd & AdhII_KO_Ctrl_rev(표 15)를 사용한 PCR 증폭 및 PCR 앰플리콘(Microsynth AG, Swiss)의 시퀀싱에 의해 확인되었다. 생성된 균주를 (3) P. pastoris △aox1△aox2 adh2△::HphR adh900△::KanMX라고 한다.
d) PCR 증폭을 위한 게놈 DNA는 제조업체의 권장 사항에 따라 Wizard® Genomic DNA Purification Kit(Promega Corporation, USA)를 사용하여 분리되었다. PCR 증폭 반응은 제조사의 권고에 따라 Q5 중합효소(New England Biolabs, Inc., USA)를 사용하여 수행되었다.
DNA fragment | DNA sequence 5' to 3' |
Adh2split marker cassette 1 | (SEQ ID NO:72) CGTATCTACCGATGATGGCACCAGCCTCCATCTGTTCGTAGACCTTAGCAAGTTCAGACAGACCGATAATCTTGATAGGAGCCTTGACCAAACCTCTGGTGAACAAGTCGATGGCCTCGGCACTGTCCTCTCTGTTTCCAACGTAAGATCCCTTGATCTCGATGGACTTCAGAACGTGCCAGAAAACGTCAGAGTTGACAACGGCACCAGATGGCAGACCAACCAAAACAACCTTACCCAAAGTTCTAACGTATTGGACAGATTGGTTGATAGCATGTGGGGAAACGGAGACGTTAATAACACCGTGTGGACCACCGTTGGTGAGCTTTTGGACTTCAGCAACGACGTCCTTAGTCTTAGTGAAGTCGACGAAGACCTCAGCACCCAAGGACTTGACAAATTCACCCTTGTCGGCACCACCATCAATACCCAAAACTCTCAAACCCAGAGCCTTGGCGTATTGAACGGCAAGAGAACCCAGTCCTCCACCAGCACCAGAAATGGCAACCCATTGGCCAATACGCAAGTCAGCGGTCTTAAGAGCCTTGTAAACGGTGATACCAGCACACAGAATTGGGGCAACTTCAGCCAAGTCAGCCTCCTTTGGAATTCTGGCGGCTTGGGTGGCATCAGCAGTAGCATACTGCTGGAAAGATCCGTCGTGGGTGAAACCAGACAGGTCAGCCTTGGCACAACTGGATTCAGCACCTTGGATACAGTACTCACAGTTCAAACAAGAACCGTTCAACCATTTGATACCAGCGTAGTCACCGATAGTGGATCTGATATCACCTAATAACTTCGTATAGCATACATTATACGAAGTTATATTAAGGGTTCTCGAATGGTACCTTGCTCACATGTTGATCTCCAGCTTGCAAATTAAAGCCTTCGAGCGTCCCAAAACCTTCTCAAGCAAGGTTTTCAGTATAATGTTACATGCGTACACGCGTCTGTACAGAAAAAAAAGAAAAATTTGAAATATAAATAACGTTCTTAATACTAACATAACTATAAAAAAATAAATAGGGACCTAGACTTCAGGTTGTCTAACTCCTTCCTTTTCGGTTAGAGCGGATGTGGGGGGAGGGCGTGAATGTAAGCGTGACATAACTAATTACATGATATCGACAAAGGAAAAGGGGGACGGATCTCCGAGGTAAAATAGAACAACTACAATATAAAAAAACTATACAAATGACAAGTTCTTGAAAACAAGAATCTTTTTATTGTCAGTACTGATTATTCCTTTGCCCTCGGACGAGTGCTGGGGCGTCGGTTTCCACTATCGGCGAGTACTTCTACACAGCCATCGGTCCAGACGGCCGCGCTTCTGCGGGCGATTTGTGTACGCCCGACAGTCCCGGCTCCGGATCGGACGATTGCGTCGCATCGACCCTGCGCCCAAGCTGCATCATCGAAATTGCCGTCAACCAAGCTCTGATAGAGTTGGTCAAGACCAATGCGGAGCATATACGCCCGGAGCCGCGGCGATCCTGCAAGCTCCGGATGCCTCCGCTCGAAGTAGCGCGTCTGCTGCTCCATACAAGCCAACCACGGCCTCCAGAAGAAGATGTTGGCGACCTCGTATTGGGAATCCCCGAACATCGCCTCGCTCCAGTCAATGACCGCTGTTATGCGGCCATTGTCCGTCAGGACATTGTTGGAGCCGAAATCCGCGTGCACGAGGTGCCGGACTTCGGGGCAGTCCTCGGCCCAAAGCATCAGCTCATCGAGAGCCTGCGCGACGGACGCACTGACGGTGTCGTCCATCACAGTTTGCCAGTGATACACATGGGGATCAGCAATCGCGCATATGAAATCACGCCATGTAGTGTATTGACCGATTCCTTGCGGTCCGAATGGGCCGAACCCGCTCGTCTGGCTAAGATCGGCCGCAGCGATCGCATCCATGGCCTCCGCGACCGGCTGCAGAACAGCGGGCAGTTCGGTTTCAGGCAGGTCT |
Adh2split marker cassette 2 |
(SEQ ID NO:73) AGATGTTGGCGACCTCGTATTGGGAATCCCCGAACATCGCCTCGCTCCAGTCAATGACCGCTGTTATGCGGCCATTGTCCGTCAGGACATTGTTGGAGCCGAAATCCGCGTGCACGAGGTGCCGGACTTCGGGGCAGTCCTCGGCCCAAAGCATCAGCTCATCGAGAGCCTGCGCGACGGACGCACTGACGGTGTCGTCCATCACAGTTTGCCAGTGATACACATGGGGATCAGCAATCGCGCATATGAAATCACGCCATGTAGTGTATTGACCGATTCCTTGCGGTCCGAATGGGCCGAACCCGCTCGTCTGGCTAAGATCGGCCGCAGCGATCGCATCCATGGCCTCCGCGACCGGCTGCAGAACAGCGGGCAGTTCGGTTTCAGGCAGGTCTTGCAACGTGACACCCTGTGCACGGCGGGAGATGCAATAGGTCAGGCTCTCGCTGAATTCCCCAATGTCAAGCACTTCCGGAATCGGGAGCGCGGCCGATGCAAAGTGCCGATAAACATAACGATCTTTGTAGAAACCATCGGCGCAGCTATTTACCCGCAGGACATATCCACGCCCTCCTACATCGAAGCTGAAAGCACGAGATTCTTCGCCCTCCGAGAGCTGCATCAGGTCGGAGACGCTGTCGAACTTTTCGATCAGAAACTTCTCGACAGACGTCGCGGTGAGTTCAGGCTTTTTACCCATGGTTTAGTTCCTCACCTTGTCGTATTATACTATGCCGATATACTATGCCGATGATTAATTGTCAACACCGCCCTTAGATTAGATTGCTATGCTTTCTTTCTAATGAGCAAGAAGTAAAAAAAGTTGTAATAGAACAAGAAAAATGAAACTGAAACTTGAGAAATTGAAGACCGTTTATTAACTTAAATATCAATGGGAGGTCATCGAAAGAGAAAAAAATCAAAAAAAAAAAATTTTCAAGAAAAAGAAACGTGATAAAAATTTTTATTGCCTTTTTAGACGAAGAAAAAGAAACGAGGCGGTCTCTTTTTTCTTTTCCAAACCTTTAGTACGGGTAATTAACGACACCCTAGAGGAAGAAAGAGGGGAAATTTAGTATGCTGTGCTTGGGGGTTTTGNAAATGGTACGGCGATGCGCGGAATCCGAGAAAATCTGGAAGAGTAAAAAAGGAGTAGAAACATTTTGAAGCTATGGTGTGTGGTACCGATCTAGACCTAATAACTTCGTATAGCATACATTATACGAAGTTATATTAAGGGTTGTCGACCTGCAGCGTACGGCACGAATTCGCACCCCGGAGAGCGCTCACCCCCGTTTTCAAACAGCGGGGGGAGCACAAAATGTTGAAAACTACACAGATCTTTTCGGACACCGGTCGCTTTATGTAGTCGACATGCAGATTCTCCCAAATGGAAAACGAGATTGGACAATTTGTGGAGTTGGAAAGGGGGGTGGGAATCAACGAAATTAGCAGATTCATGGGCAATTGGCAGGACTGGGCAGAAGGGGTGAGAATTGCAATCGAATGGAACAGGCACTCCCGTTGCGAAATCAAAAAAGTCTCGCTATCTGAACTGATTTTTTTTAAGCAGCAACTTACGGTCAATACATCTCCGATGGAGGAATTTTTCACCCCTCGCTAACTAGATGGGCCCCTTCTAAGAAATTTGGGTTTAAGGTTGGGCAGTCAGTCAGTGCACCAATGCTAACTGCCATTTGTCCAAAGAGGGGTGCAAGGATGAGGGACCGTTGAGAATAAGATTTGGGGTGTTAATCGGTGATACTGATTTGTCAAAGAGTGGGGAGGACTGCTGGGCATTGTTCACCCCCCTAGTTGTTAGAGTTCGATAGCCGGCCGAATCACCCCCCTCTTCTTACATAATCATTGTCACTATGTGGGGTCTCTACAGTCTCACCCTGCGATCCGGGACGACGCCGCGAAATTAGGGGGCAAGTCTCCTCCGGGCATGCAATATTGGTAACAGGATCAATTGATGCGAGAAAAGTTGGAGGGGGTGTAAAATTCAAGCCCACAAAGTCACACCCTTATGCCTGTAGAGGGGCAATCGGAGAGCAGCCATGGGGTGT |
Adh900split marker cassette 1 | (SEQ ID NO:74) CACTCCAGTTGGGCCATTACCGAACATTTTGCCATTGTAGGCGATTAGTAAGTATTAACAAGACAGCTGACTATACGTTTATTCTCAAACAATATTTCCCTTTTTGGTTTTGACCTCGCTTTAATCAATTTTTCAGACCTGATCCCACCTACTTTTCTTCGGCCTCAACTTCAATCTGACTCTTCTCTCTCAATTGGTACCAACCAGCCAGAAAATGTCCTTCCGTTACTTGAAACGGCATTTCTCTACAGCTACAAACGCAATTGCTCTCCTTAGCAGACCTGAATTCAAAATAGGTCGAATTGTGGACGTCGTGAAACATCCAAATGCAGACAAACTTTATGTCTCGTCGATTTCTGTGGGAAACAATTATGCCTCGGGTACATCCAACACCCTAACCGTTTGCAGCGGCTTGGTGGACTACTTTTCAGTTCCCGAATTGCTTCAGCGACGGGTCGTTGTGGTCACAAACCTCAAGCCATCGAAGATGAGAGGTGTAACATCGGAGGCAATGCTTTTGGCAGGGGAAAAGTCGGGGAAAGTGGAATTGGTCGAGCCGCCAATGTCCGGGAGAGAGGGCGAATCACTCCACTTCGAAGGTGTAGAAATTACATCAGAGGAGAGCGCCAATCAATTGCATTTGCCTGCTAAGCGATTGAAGAAGTCAGAGTGGAGTCAACTGGCGGAAGGTCTACAGACAAATGACCAGCGTGAAGTGGTCTTCCACAGCCAAATTGGCTCCAAACGAATTTACGCTTTAGTAGGAGCGAGTACTGAAAAATGCACGTTAGCGACTCTTGCGCAGGCCGTCGTACGATAAGGGCAATATGGTTGAGAACGTTCCTCACCCAAATAAAATCATCGTACGCTGCAGGTCGACAACCCTTAATATAACTTCGTATAATGTATGCTATACGAAGTTATTAGGTCTAGATCGGTACCGACATGGAGGCCCAGAATACCCTCCTTGACAGTCTTGACGTGCGCAGCTCAGGGGCATGATGTGACTGTCGCCCGTACATTTAGCCCATACATCCCCATGTATAATCATTTGCATCCATACATTTTGATGGCCGCACGGCGCGAAGCAAAAATTACGGCTCCTCGCTGCAGACCTGCGAGCAGGGAAACGCTCCCCTCACAGACGCGTTGAATTGTCCCCACGCCGCGCCCCTGTAGAGAAATATAAAAGGTTAGGATTTGCCACTGAGGTTCTTCTTTCATATACTTCCTTTTAAAATCTTGCTAGGATACAGTTCTCACATCACATCCGAACATAAACAACCATGGGTAAGGAAAAGACTCACGTTTCGAGGCCGCGATTAAATTCCAACATGGATGCTGATTTATATGGGTATAAATGGGCTCGCGATAATGTCGGGCAATCAGGTGCGACAATCTATCGATTGTATGGGAAGCCCGATGCGCCAGAGTTGTTTCTGAAACATGGCAAAGGTAGCGTTGCCAATGATGTTACAGATGAGATGGTCAGACTAAACTGGCTGACGGAATTTATGCCTCTTCCGACCATCAAGCATTTTATCCGTACTCCTGATGATGCATGGTTACTCACCACTGCGATCCCCGGCAAAACAGCATTCCAGGTATTAGAAGAATATCCTGATTCAGGTGAAAATATTGTTGATGCGCTGGCAGTGTTCCTGCGCCGGTTGCATTCGATTCCTGTTTGTAATTGTCCTTTTAACAGCGATCGCGTATTTCGTCTCGCTCAGGCGCAATCACGAATGAATAACGGTTTGGTTGATGCGAGTGATTTTGATGACGAGCGTAATGGCTGGCCTGTTGAACAAGTCTGGAAAGAAATGCATAAGCTTTTGCCATTCTCACCG |
Adh900split marker cassette 2 | (SEQ ID NO:75) AAGCCCGATGCGCCAGAGTTGTTTCTGAAACATGGCAAAGGTAGCGTTGCCAATGATGTTACAGATGAGATGGTCAGACTAAACTGGCTGACGGAATTTATGCCTCTTCCGACCATCAAGCATTTTATCCGTACTCCTGATGATGCATGGTTACTCACCACTGCGATCCCCGGCAAAACAGCATTCCAGGTATTAGAAGAATATCCTGATTCAGGTGAAAATATTGTTGATGCGCTGGCAGTGTTCCTGCGCCGGTTGCATTCGATTCCTGTTTGTAATTGTCCTTTTAACAGCGATCGCGTATTTCGTCTCGCTCAGGCGCAATCACGAATGAATAACGGTTTGGTTGATGCGAGTGATTTTGATGACGAGCGTAATGGCTGGCCTGTTGAACAAGTCTGGAAAGAAATGCATAAGCTTTTGCCATTCTCACCGGATTCAGTCGTCACTCATGGTGATTTCTCACTTGATAACCTTATTTTTGACGAGGGGAAATTAATAGGTTGTATTGATGTTGGACGAGTCGGAATCGCAGACCGATACCAGGATCTTGCCATCCTATGGAACTGCCTCGGTGAGTTTTCTCCTTCATTACAGAAACGGCTTTTTCAAAAATATGGTATTGATAATCCTGATATGAATAAATTGCAGTTTCATTTGATGCTCGATGAGTTTTTCTAATCAGTACTGACAATAAAAAGATTCTTGTTTTCAAGAACTTGTCATTTGTATAGTTTTTTTATATTGTAGTTGTTCTATTTTAATCAAATGTTAGCGTGATTTATATTTTTTTTCGCCTCGACATCATCTGCCCAGATGCGAAGTTAAGTGCGCAGAAAGTAATATCATGCGTCAATCGTATGTGAATGCTGGTCGCTATACTGGTACCATTCGAGAACCCTTAATATAACTTCGTATAATGTATGCTATACGAAGTTATTAGGTGATATCAGATCCACTCTGTAGTGAGGGTTGGTGGTCTGACGAACATCCAGCAAGGTGTTCCACCTGAAATTTTTCACCTTGGAGGGTAATGTGATGACGCCATTTCCTGTGCAAATGCTTTTCGTTTTGAACAGTGCAACTTTTGTATCAGATCTTCATCTACTTGATGCCATCTCAACAAATCCCTCATTTACTAGCGTGTGAAGGAATCTAGATTTTCCACTGATAAGCCAATTTGTCGGAAATCCCCCGCGCGGGAGTTGGCGTTCAGTACGAGCCACACACGTTTCTTTTGGACAACCAAAGCATCCGCCTGAAGGGACAACTTGCATTCAACGGCTTCAGTTGGAAACGTCAGAGCTGACCTATAGTTTGCTAGAACCGTTTTCTCTGTTTACGTTTACGTCTCCTCAAATTTGCGCTCGGTATGTCCTTCCTAATTAGCGGGAAAAGCTGTTCTTAGTTAATACGGAGAAAGTTTCGGGGTTACCGTTCCGGGAAGAGGAGGGGTCATCTCTCTCATCTCATCCAACCATTAAGTTTCTTCCAAAACTTCAGGATAATCAGTTTAACCACCGACAGGAGTCAGATTTGAGATTGACAGAAAGTTTTTCCGTCCATTTCCTCATCTTGTCGCCGTTATCAGTCAATCTCTATGGTTATCTGGAATTTCTTTTTTCTTTTAATTCATCTTCTTTTTATCCCGCGCCTTTGGCGTTCTAGCTCATCTCATGAAAACAAAACCCTCTCATGTTCGGATAATTCCAGCGGCTTTCACTTTCAGATGACACATAGATTGGACTCAACCATGGCTATCTGGGGTATACGGACGTTGGCAAGGGCGTTAATTTTTCAGGACAAACGGAAATGCCATGGCTCCAGGGAAAGGCATTCCTATTGCAAACCTAGACCGTCGAACCTCTCCTATCGCCTACCAGTCACCCAGCTATCCCTAGGCAACTCATCTCCTTCAAGCGGATTGCAACCTGCTAAGCCAAATTAGATCTGGCCACAGAAATGCCGCAATATTTCTTGGCTCTCCCCTCCC |
Primer Name | DNA sequence 5' to 3' |
Adh2_KO_ctrl_fwd | GAATTGAGCCAAAAAAGGAGAGG (SEQ ID NO:76) |
Adh2_KO_ctrl_rev | GATGGAATAGGAGACTAGGTGTG (SEQ ID NO:77) |
AdhII_KO_Ctrl_fwd | TGGTTGAGACGTTTGTATTG (SEQ ID NO:78) |
AdhII_KO_Ctrl_rev | TGGGTTGGGAGTTTAGTG (SEQ ID NO:79) |
실시예 13 : Adh2 및 Adh900 과발현 메탄올 이용 음성 균주의 생성.
ADH2 및 ADH900 과발현의 효과를 확인하기 위하여, 구성적 프로모터 PGAP: PP7425_Chr1(596296…596790) 및 각각 ADH2 코딩 서열 또는 ADH900 코딩 서열로 구성된 발현 구축물이 생성되었다. ADH2 및 ADH900 코딩 서열(표 16)은 유전자 산물의 아미노산 서열에 영향을 미치지 않으면서 코딩 서열에서 BbsI 및 BsaI 제한 부위를 제거하도록 변형되었다. 생성된 균주는 P. pastoris △aox1△aox2 BB3aZ_pGAP_Adh2_CycTT 및 P. pastoris △aox1△aox2 BB3aZ_pGAP_Adh900_CycTT로 지정되었다.
a) Golden Gate 어셈블리 방법을 사용하기 위해 제한 효소 BbsI 및 BsaI(New England Biolabs, Inc., USA)의 제한 부위는 유전자 산물의 아미노산 서열에 영향을 미치지 않으면서 코딩 서열에서 제거되어야 했다. 이 과정을 경화라고 한다. ADH2 PP7435_Chr2-0821의 코딩 서열은 c.45G>A 및 c.660C>G에서 수정되었다. ADH900 PP7435_Chr2-0990의 코딩 서열은 c.42C>G에서 수정되었다. Golden Gate 어셈블리에 사용된 경화된 코딩 시퀀스는 표 15에서 찾을 수 있다. 처음 12개 염기쌍과 마지막 15개 염기쌍은 코딩 시퀀스의 일부가 아니며 Golden Gate 어셈블리에 필요하다.
b) 여기에 사용된 골든 게이트 어셈블리는 이미 설명되어 있다(Prielhofer et al., 2017). (1) 발현 구조 BB3aZ_pGAP_Adh2_CycTT는 다음과 같이 조립되었다. Adh2_GG_cured DNA 단편(표 15)을 BB1_23 백본에 복제하여 BB1_23_Adh2를 생성했다. 발현 구조는 BB3aZ_14*(백본), BB1_23_Adh2(암호화 서열) BB1_12_pGAP(프로모터), BB1_34_ScCYC1tt(터미네이터)의 골든 게이트 어셈블리에 의해 생성되었다. (2) 발현 구조 BB3aZ_pGAP_Adh900_CycTT를 다음과 같이 조립하였다. Adh900_GG_cured DNA 단편(표 15)을 BB1_23 백본에 복제하여 BB1_23_Adh900을 생성했다. 발현 구성은 BB3aZ_14*(백본), BB1_23_Adh900(암호화 서열), BB1_12_pGAP(프로모터), BB1_34_ScCYC1tt(터미네이터)의 골든 게이트 어셈블리에 의해 생성되었다. 플라스미드 및 서열은 Golden PiCS 키트 # 1000000133(Addgene, Inc., USA)에서 사용할 수 있다.
DNA fragment | DNA sequence 5' to 3' |
ADH2coding sequence | (SEQ ID NO:80) ATGTCTCCAACTATCCCAACTACACAAAAGGCTGTTATCTTCGAGACCAACGGCGGTCCCCTAGAGTACAAGGACATTCCAGTCCCAAAGCCAAAGTCAAACGAACTTTTGATCAACGTTAAGTACTCCGGTGTCTGTCACACTGATTTGCACGCCTGGAAGGGTGACTGGCCATTGGACAACAAGCTTCCTTTGGTTGGTGGTCACGAAGGTGCTGGTGTCGTTGTCGCTTACGGTGAGAACGTCACTGGATGGGAGATCGGTGACTACGCTGGTATCAAATGGTTGAACGGTTCTTGTTTGAACTGTGAGTACTGTATCCAAGGTGCTGAATCCAGTTGTGCCAAGGCTGACCTGTCTGGTTTCACCCACGACGGATCTTTCCAGCAGTATGCTACTGCTGATGCCACCCAAGCCGCCAGAATTCCAAAGGAGGCTGACTTGGCTGAAGTTGCCCCAATTCTGTGTGCTGGTATCACCGTTTACAAGGCTCTTAAGACCGCTGACTTGCGTATTGGCCAATGGGTTGCCATTTCTGGTGCTGGTGGAGGACTGGGTTCTCTTGCCGTTCAATACGCCAAGGCTCTGGGTTTGAGAGTTTTGGGTATTGATGGTGGTGCCGACAAGGGTGAATTTGTCAAGTCCTTGGGTGCTGAGGTCTTCGTCGACTTCACTAAGACTAAGGACGTCGTTGCTGAAGTCCAAAAGCTCACCAACGGTGGTCCACACGGTGTTATTAACGTCTCCGTTTCCCCACATGCTATCAACCAATCTGTCCAATACGTTAGAACTTTGGGTAAGGTTGTTTTGGTTGGTCTGCCATCTGGTGCCGTTGTCAACTCTGACGTTTTCTGGCACGTTCTGAAGTCCATCGAGATCAAGGGATCTTACGTTGGAAACAGAGAGGACAGTGCCGAGGCCATCGACTTGTTCACCAGAGGTTTGGTCAAGGCTCCTATCAAGATTATCGGTCTGTCTGAACTTGCTAAGGTCTACGAACAGATGGAGGCTGGTGCCATCATCGGTAGATACGTTGTGGACACTTCCAAATAA |
ADH900 coding sequence |
(SEQ ID NO:81) ATGTCTGTGATGAAAGCCCTCGTGTACGGTGGTAAGAACGTCTTCGCCTGGAAAAACTTCCCTAAACCAACTATCTTGCACCCAACAGATGTCATCGTTAAGACGGTGGCTACTACCATCTGCGGAACAGACTTGCACATCTTGAAAGGTGATGTTCCAGAGGTCAAACCTGAAACCGTCTTGGGTCATGAAGCAATTGGAGTCGTCGAATCTATCGGTGATAACGTCAAAAACTTCAGCATTGGTGATAAGGTGCTGGTTTCATGCATCACCAGTTGTGGAAGCTGTTACTACTGTAAGAGAAACTTGCAGAGTCATTGCAAGACCGGTGGATGGAAATTAGGTCACGATTTGAACGGTACGCAGGCTGAGTTTGTCCGTATCCCATATGGAGACTTCTCATTGCACCGTATTCCTCATGAAGCAGATGAAAAGGCAGTTCTGATGCTGTCTGACATCTTACCTACTGCTTACGAAGTTGGTGTTCTTGCCGGAAATGTCCAAAAGGGAGACTCAGTTGCCATTGTCGGCGCCGGTCCAGTTGGTCTTGCCGCTCTGCTGACTGTCAAAGCCTTTGAGCCTTCTGAAATTATTATGATTGACACTAACGATGAAAGACTGAGTGCCTCCTTGAAATTGGGAGCCACCAAGGCAGTCAACCCAACCAAGGTCAGCAGTGTCAAAGATGCTGTTTATGATATTGTCAATGCCACTGTCCGCGTCAAGGAGAACGACCTGGAGCCAGGTGTCGATGTTGCCATTGAGTGTGTTGGTGTTCCTGACACGTTTGCAACTTGTGAAGAGATTATCGCCCCAGGTGGCCGTATTGCCAATGTTGGTGTTCACGGCACTAAAGTGGATTTACAACTGCAAGACCTATGGATCAAGAACATTGCTATCACCACCGGTTTGGTAGCCACATACTCCACTAAAGACCTGTTGAAGCGAGTCTCTGACAAGTCTCTAGACCCTACACCACTGGTTACACATGAGTTCAAGTTCAGTGAATTTGAGAAGGCCTATGAGACTTCTCAAAATGCTGCCACCACCAAAGCCATCAAGATTTTCTTATCTGCCGATTAA |
Adh2_GG_cured | (SEQ ID NO:82) GATAGGTCTCACATGTCTCCAACTATCCCAACTACACAAAAGGCTGTTATCTTCGAAACCAACGGCGGTCCCCTAGAGTACAAGGACATTCCAGTCCCAAAGCCAAAGTCAAACGAACTTTTGATCAACGTTAAGTACTCCGGTGTCTGTCACACTGATTTGCACGCCTGGAAGGGTGACTGGCCATTGGACAACAAGCTTCCTTTGGTTGGTGGTCACGAAGGTGCTGGTGTCGTTGTCGCTTACGGTGAGAACGTCACTGGATGGGAGATCGGTGACTACGCTGGTATCAAATGGTTGAACGGTTCTTGTTTGAACTGTGAGTACTGTATCCAAGGTGCTGAATCCAGTTGTGCCAAGGCTGACCTGTCTGGTTTCACCCACGACGGATCTTTCCAGCAGTATGCTACTGCTGATGCCACCCAAGCCGCCAGAATTCCAAAGGAGGCTGACTTGGCTGAAGTTGCCCCAATTCTGTGTGCTGGTATCACCGTTTACAAGGCTCTTAAGACCGCTGACTTGCGTATTGGCCAATGGGTTGCCATTTCTGGTGCTGGTGGAGGACTGGGTTCTCTTGCCGTTCAATACGCCAAGGCTCTGGGTTTGAGAGTTTTGGGTATTGATGGTGGTGCCGACAAGGGTGAATTTGTCAAGTCCTTGGGTGCTGAGGTGTTCGTCGACTTCACTAAGACTAAGGACGTCGTTGCTGAAGTCCAAAAGCTCACCAACGGTGGTCCACACGGTGTTATTAACGTCTCCGTTTCCCCACATGCTATCAACCAATCTGTCCAATACGTTAGAACTTTGGGTAAGGTTGTTTTGGTTGGTCTGCCATCTGGTGCCGTTGTCAACTCTGACGTTTTCTGGCACGTTCTGAAGTCCATCGAGATCAAGGGATCTTACGTTGGAAACAGAGAGGACAGTGCCGAGGCCATCGACTTGTTCACCAGAGGTTTGGTCAAGGCTCCTATCAAGATTATCGGTCTGTCTGAACTTGCTAAGGTCTACGAACAGATGGAGGCTGGTGCCATCATCGGTAGATACGTTGTGGACACTTCCAAATAAGCTTAGAGACCGATC |
Adh900_GG_cured | (SEQ ID NO:83) GATAGGTCTCACATGTCTGTGATGAAAGCCCTCGTGTACGGTGGTAAGAACGTGTTCGCCTGGAAAAACTTCCCTAAACCAACTATCTTGCACCCAACAGATGTCATCGTTAAGACGGTGGCTACTACCATCTGCGGAACAGACTTGCACATCTTGAAAGGTGATGTTCCAGAGGTCAAACCTGAAACCGTCTTGGGTCATGAAGCAATTGGAGTCGTCGAATCTATCGGTGATAACGTCAAAAACTTCAGCATTGGTGATAAGGTGCTGGTTTCATGCATCACCAGTTGTGGAAGCTGTTACTACTGTAAGAGAAACTTGCAGAGTCATTGCAAGACCGGTGGATGGAAATTAGGTCACGATTTGAACGGTACGCAGGCTGAGTTTGTCCGTATCCCATATGGAGACTTCTCATTGCACCGTATTCCTCATGAAGCAGATGAAAAGGCAGTTCTGATGCTGTCTGACATCTTACCTACTGCTTACGAAGTTGGTGTTCTTGCCGGAAATGTCCAAAAGGGAGACTCAGTTGCCATTGTCGGCGCCGGTCCAGTTGGTCTTGCCGCTCTGCTGACTGTCAAAGCCTTTGAGCCTTCTGAAATTATTATGATTGACACTAACGATGAAAGACTGAGTGCCTCCTTGAAATTGGGAGCCACCAAGGCAGTCAACCCAACCAAGGTCAGCAGTGTCAAAGATGCTGTTTATGATATTGTCAATGCCACTGTCCGCGTCAAGGAGAACGACCTGGAGCCAGGTGTCGATGTTGCCATTGAGTGTGTTGGTGTTCCTGACACGTTTGCAACTTGTGAAGAGATTATCGCCCCAGGTGGCCGTATTGCCAATGTTGGTGTTCACGGCACTAAAGTGGATTTACAACTGCAAGACCTATGGATCAAGAACATTGCTATCACCACCGGTTTGGTAGCCACATACTCCACTAAAGACCTGTTGAAGCGAGTCTCTGACAAGTCTCTAGACCCTACACCACTGGTTACACATGAGTTCAAGTTCAGTGAATTTGAGAAGGCCTATGAGACTTCTCAAAATGCTGCCACCACCAAAGCCATCAAGATTTTCTTATCTGCCGATTAAGCTTAGAGACCGATC |
c) P. pastoris △aox1△aox2 균주를 실시예 1a)에 기술된 바와 같이 전기적합성으로 만들었다. BB3aZ_pGAP_Adh2_CycTT 발현 구조 및 BB3aZ_pGAP_Adh900_CycTT 발현 구조를 제조업체의 프로토콜에 따라 AscI(New England Biolabs, Inc., USA)로 선형화하고 Hi Yield® Gel/PCR DNA Fragment Extraction Kits(Sud-Laborbedarf GmbH, Germany)로 정제했다. 500ng의 선형화된 플라스미드를 실시예 1a) 및 1d)에서 이전에 기술한 바와 같이 전기적격 P. pastoris △aox1△aox2로 형질전환시켰다. 양성 형질전환체는 25μg/mL Zeocin이 포함된 YPD 플레이트에서 선택되었다. 발현 구축물의 성공적인 통합은 게놈 DNA를 주형으로 하는 프라이머 109_BB3aN_ctrl_fwd 및 pGAP_goi_rev_v2(표 17)를 사용한 PCR 증폭에 의해 확인되었다. 생성된 균주는 P. pastoris △aox1△aox2 BB3aZ_pGAP_Adh2_CycTT 및 P. pastoris △aox1△aox2 BB3aZ_pGAP_Adh900_CycTT이다.
d) PCR 증폭을 위한 게놈 DNA는 제조업체의 권장 사항에 따라 Wizard® Genomic DNA Purification Kit(Promega Corporation, USA)를 사용하여 분리되었다. PCR 증폭 반응은 제조사의 권고에 따라 Q5 중합효소(New England Biolabs, Inc., USA)를 사용하여 수행되었다.
Primer Name | DNA sequence 5' to 3' |
109_BB3aN_ctrl_fwd | TTGATCTTTTCTACGGGGTGG (SEQ ID NO:84) |
pGAP_goi_rev_v2 | GGTGTTTTGAAGTGGTACGG (SEQ ID NO:85) |
실시예 14 : 메탄올 이용 음성 알코올 탈수소효소 결함 균주의 무세포 추출물에서 알코올 탈수소효소 활성 측정.
표현형 수준에서 알코올 탈수소효소의 성공적인 삭제를 확인하기 위해 에탄올을 기질로 하는 무세포 추출물에서 알코올 탈수소효소 활성을 측정하였다. 에탄올은 일반적으로 Adh2의 주요 기질로 간주된다.
a) 25℃ 및 280rpm에서 공기 투과성 막으로 밀봉된 24웰 플레이트에서 2mL의 YPD 배지에서 밤새 배양을 수행했다. 사용된 균주는 실시예 12a) P. pastoris △aox1△aox2 Adh2△::HphR, 실시예 12b) P. pastoris △aox1△aox2 Adh2△::HphR Adh900△::KanMX 및 실시예 1e) P. pastoris △aox1△aox2였다. 추가 대조군으로 P. pastoris X33(Thermo Fisher Scientific Inc., USA) 및 P. pastoris X33 △Adh2(Nocon et al., 2014)를 사용하였다.
b) 밤새 배양액을 원심분리(16.000g, 5분, 4℃)하고 1mL 인산염 완충 식염수에 재현탁하여 무세포 추출물을 제조했다. 두 번째 원심분리 단계(16.000g, 5분, 4℃) 후 세포를 유리 비트와 함께 0.5mL의 세포 용해 완충액에 재현탁했다. 배양물을 단계 사이에 얼음 위에서 1분간 냉각시키면서 6m/s에서 3 x 20초 동안 비드 비팅함으로써 리볼라이저(MP Biomedicals, Inc., USA)에서 용해시켰다. 용해 단계 후 배양물을 원심분리하고(16.000g, 5분, 4℃) 상층액을 새로운 Eppendorf 튜브로 옮기고 다시 원심분리하여(16.000g, 30분, 4℃) 세포 파편을 제거했다. 두 번째 원심분리 단계 후 상층액을 사용할 때까지 -20℃에서 보관했다.
c) 세포 용해 완충액은 50mL당 20mM HEPES, 420mM NaCl, 1.5mM MgCl2, 10% 글리세롤, 1개의 SIGMAFAST™ 프로테아제 억제제 칵테일 정제(Sigma-Aldrich GmbH)로 구성되었다. 분석 완충액은 pH 8.9에서 100mM MOPS, 5mM MgSO4, 2mM NAD+로 구성되었습니다.
d) 무세포 추출물의 단백질 결합은 제조업체의 권장 사항에 따라 Pierce™ BCA 단백질 분석(Thermo Scientific, Inc., USA)에 의해 측정되었으며 모든 샘플에 대해 3.8 mg/mL의 공통 농도로 균일하게 조정되었다.
e) 알코올 탈수소효소 활성 분석은 96웰 플레이트에서 수행되었다. 측정은 340 nm에서 NADH의 흡광도를 측정하여 마이크로플레이트 리더(Tecan Group Ltd., Swiss)에서 수행되었다. 온도는 42℃로 설정되었다. 분석을 시작하기 위해 20μL의 무세포 추출물을 분석 완충액에 첨가하고 1M의 에탄올을 기질로 첨가하기 전에 10~15분 동안 평형을 유지했다. 총 최종 부피는 300 μL였다. mU/mg 단위의 활성은 기질 에탄올 첨가 후 최대 선형 흡수 증가로부터 계산되었다. 하나의 활동 단위는 분당 소비되는 1μmol 기질(NAD+)에 해당한다. 이것은 Lambert-Beer 법칙과 계수 εNADH = 6220 M-1 cm-1을 사용하여 흡수 데이터에서 계산되었다.
f) 결과는 무세포 추출물의 알코올 탈수소효소 활성에 대한 AHD 유전자 결실의 효과를 명확하게 보여준다(표 18). ADH2 유전자를 삭제함으로써 94%의 활성 감소가 달성된다. 이것은 P. pastoris X33 균주에 의해 추가로 확인된다. 또한 두 번째 알코올 탈수소효소 유전자 ADH900을 삭제함으로써 결합 활성이 99% 감소하는 것이 관찰된다.
Alcohol dehydrogenase activity (mU/mg) | |||
Mean | Standard Error | Clones tested | |
P. pastoris CBS2612 △aox1△aox2 | 1293.8 | 244.9 | 3 |
P. pastoris CBS2612 △aox1△aox2 Adh2△::HphR |
80.8 | 7.9 | 6 |
P. pastoris CBS2612 △aox1△aox2 Adh2△::HphR Adh900△::KanMX | 8.0 | 0.4 | 6 |
P. pastoris X33 | 1196.5 | 28.3 | 3 |
P. pastoris X33 Adh2△::HphR |
88.5 | 2.1 | 7 |
실시예 15 : 메탄올 이용 음성 및 알코올 탈수소효소 결핍 균주의 메탄올 흡수율 측정.
메탄올 흡수율을 결정하기 위해 Mut- 및 알코올 탈수소효소 결핍 균주를 생물반응기에서 배양했다. 테스트한 균주는 P. pastoris △aox1△aox2 Adh2△::HphR, P. pastoris △aox1△aox2 Adh900△::KanMX 및 P. pastoris △aox1△aox2 Adh2△::HphR Adh900△::KanMX입니다. 특정 바이오매스 농도까지 배양물을 성장시켰다. 그런 다음 메탄올 펄스를 적용하고 펄스 직후와 약 20시간 후에 메탄올 농도를 측정했다. 실험 설정은 이미 실시예 7에 자세히 설명되어 있다. 목표는 알코올 탈수소효소 결핍 균주의 특정 메탄올 흡수율을 결정하고 이를 실시예 7에서 측정된 메탄올 흡수율과 비교하는 것이었다.
a) 300mL BSM 배지로 채워진 반응기에 P. pastoris △aox1△aox2 Adh2△::HphR(반응기 aR2 및 aR4) 및 P. pastoris △aox1△aox2 Adh900△::KanMX(반응기 및 aR3). 목표 시작 OD600은 2였다. 용존 산소 스파이크로 표시되는 배치 단계의 끝에서, 바이오매스를 증가시키기 위해 24시간 동안 2.8mL/h에서 50%(w/w) 포도당 공급을 시작했다. 포도당 공급을 시작한 지 2시간 후 50%(v/v) 메탄올 샷이 제공되어 메탄올 농도를 1.5%로 증가시켰다(측정된 농도는 aR1=1.64%, aR2=1.66%, aR3=1.59% 및 aR4=1.67%). 이것은 메탄올 소비를 유도하기 위해 수행되었다. 포도당 공급 단계의 끝에서 세포 건조 중량 및 HPLC에 대한 샘플을 취했다.
b) 글루코스 공급 단계 후 교반 및 기체 공급은 일정한 750rpm 및 9.5sL/h로 설정되었다. 추가 50% 메탄올 펄스를 첨가하여 농도를 1.5%로 증가시키고 즉시 HPLC 샘플을 취하였다(측정된 농도는 aR1=1.36%, aR2=1.44%, aR3=1.34% 및 aR4=1.45%임). 18.4시간 후에 농도를 다시 측정하여 특정 메탄올 흡수율(qmethanol)을 결정하는 데 사용했다.
c) 이중 ADH 결실 균주 P. pastoris △aox1△aox2 Adh2△::HphR Adh900△::KanMX의 흡수율을 측정하기 위해 별도의 생물반응기 배양이 시작되었다. 배양은 본 실시예 및 실시예 7에 설명된 대로 수행하였다. P. pastoris △aox1△aox2 Adh2△::HphR Adh900△::KanMX를 반응기 cR3 및 cR4에 접종하였다. 목표 시작 OD600은 2였다. 용존 산소 스파이크로 표시된 배치 단계의 끝에서, 50%(w/w) 포도당 공급이 24시간 동안 2.4mL/h에서 시작되어 바이오매스를 증가시켰다. 글루코스 공급을 시작한 지 2시간 후에 50%(v/v) 메탄올 샷을 하여 메탄올 농도를 1.5%로 증가시켰다(측정된 농도는 cR3=1.50% 및 cR4=1.47%임). 이것은 메탄올 소비를 유도하기 위해 수행되었다. 포도당 공급 단계의 끝에서 세포 건조 중량 및 HPLC에 대한 샘플을 취했다.
d) 글루코스 공급 단계 후 교반 및 가스 공급은 일정한 750rpm 및 9.5sL/h로 설정되었다. 추가 50% 메탄올 펄스를 첨가하여 농도를 1.5%로 증가시키고 즉시 HPLC 샘플을 취하였다(측정된 농도는 cR3=1.37% 및 cR4=1.49%임). 19.5시간 후에 농도를 다시 측정하여 특정 메탄올 흡수율(qmethanol)을 결정하는 데 사용했다.
e) 특정 메탄올 흡수율은 실시예 7d)에서와 같이 계산하였다. ADH2를 삭제함으로써 메탄올 흡수율의 놀랍고 실질적인 감소가 달성되었다(표 19). 메탄올의 dc/dt는 aR2 및 aR4에 대해 0.07 내지 0.06 g L-1 h-1이며, 이는 실시예 6에서 관찰된 증발보다 약간 더 높을 뿐이다. 대조적으로 ADH900 결실 균주의 메탄올 흡수율은 감소되지 않고 실제로 실시예 7에서 측정된 P. pastoris △aox1△aox2의 흡수율보다 약간 더 높았다. 이 차이는 실시예 7과 이 실시예 사이의 약간 다른 조건에 기인할 수 있으며, 차이는 약간 더 높은 반응기 부피와 메탄올 농도임 메탄올 펄스 후. 이중 ADH 결실 균주는 ADH2 결실 균주의 이미 낮은 흡수율에 비해 메탄올 흡수율의 관찰 가능한 감소를 나타내지 않는다. 이러한 결과는 예기치 않게 ADH2 유전자와 그 산물인 효소 Adh2가 P. pastoris △aox1△aox2에 대해 관찰된 특성에 가장 큰 영향을 미치며 실시예 7의 관찰이 자발적인 메탄올 산화 또는 다른 효소의 혼잡한 활성 아니라는 것을 확인한 것이었다.
따라서, P. pastoris △aox1△aox2의 메탄올 흡수에 관여하는 주요 유전자 및 효소는 ADH2 유전자이고 그 생성물은 효소 Adh2인 것으로 결론지었다.
Reactor | ADH gene | Volume (mL) | CDW (g/L) |
Methanol at 0 h (g/L) |
Methanol at 18.4 h (g/L) |
dc/dt (g L-1 h-1) |
qmethanol (mg g-1 h-1) |
aR1 | Adh900△::KanMX | 392 | 73.4 | 10.75 | 3.49 | 0.40 | 5.38 |
aR2 | Adh2△::HphR | 385 | 74.1 | 11.40 | 10.20 | 0.07 | 0.89 |
aR3 | Adh900△::KanMX | 395 | 71.2 | 10.61 | 3.24 | 0.40 | 5.63 |
aR4 | Adh2△::HphR | 382 | 74.7 | 11.47 | 10.34 | 0.06 | 0.82 |
cR3 | Adh2△::HphR Adh900△::KanMX | 373 | 73.9 | 10.8 | 10.0* | 0.04 | 0.55 |
cR4 | Adh2△::HphR Adh900△::KanMX | 369 | 73.9 | 11.8 | 10.6* | 0.06 | 0.85 |
실시예 16 : 메탄올 이용 음성 및 알코올 탈수소효소 과발현 균주의 메탄올 흡수율 측정.
P. pastoris △aox1△aox2에서 Adh2가 메탄올 소비에 관여하는 효소임을 확인하고 ADH2 또는 ADH900 유전자의 과발현으로 메탄올 흡수율을 증가시킬 수 있는지 조사하기 위해 P. pastoris △aox1△aox2 BB3aZ_pGAP_Adh2_CycTT 및 P. pastoris △aox1△aox2 BB3aZ_pGAP_Adh900_CycTT 균주는 생물반응기 배양에서 측정되었다. 실험은 실시예 7 및 15에 기재된 바와 같이 수행하였다.
a) 300mL BSM 배지로 채워진 반응기에 15mL의 P. pastoris △aox1△aox2 BB3aZ_pGAP_Adh2_CycTT(반응기 R1 및 R3) 및 P. pastoris △aox1△aox2 BB3aZ_pGAP_ 목표 시작 OD600은 2였다. 용존 산소 스파이크로 표시되는 배치 단계의 끝에서, 바이오매스를 증가시키기 위해 24시간 동안 2.8mL/h에서 50%(w/w) 포도당 공급을 시작했다. 포도당 공급을 시작한 지 2시간 후 50%(v/v) 메탄올 샷이 제공되어 메탄올 농도를 1.5%로 증가시켰다(측정된 농도는 R1=1.56%, R2=1.53%, R3=1.52% 및 R4=1.54%). 이것은 메탄올 소비를 유도하기 위해 수행되었다. 포도당 공급 단계의 마지막에 세포 건조 중량 및 HPLC에 대한 샘플을 취했다.
b) 글루코스 공급 단계 후 교반 및 가스 공급은 일정한 750rpm 및 9.5sL/h로 설정되었다. 추가 50% 메탄올 펄스를 첨가하여 농도를 1.5%로 증가시키고 즉시 HPLC 샘플을 취하였다(측정된 농도는 R1=1.30%, R2=1.30%, R3=1.35% 및 R4=1.30%임). 4.1, 20.1시간 후에 농도를 다시 측정하여 특정 메탄올 흡수율(qmethanol)을 결정하는 데 사용했다.
c) 더 높은 메탄올 흡수율이 예상되기 때문에 4.1시간의 추가 샘플링 시점이 선택되었다. 4.1시간에 평균 메탄올 흡수율은 ADH2 과발현 균주 P. pastoris △aox1△aox2 BB3aZ_pGAP_Adh2_CycTT의 경우 7.72 mg g-1 h-1이었고 ADH900 과발현 균주 P. pastoris △aox1△aox2 BB3aZ_pGAP_Adh900_CycTT는 5.61 mg g-1 h-1이었다. 20.1시간 후 평균 흡수율은 ADH2 과발현 균주의 경우 6.35 mg g-1 h-1로 감소하고 ADH900 과발현 균주의 경우 5.16 mg g-1 h-1로 감소한다(표 20). 이전에 실시예 15e)에서 논의된 바와 같이, 모 P. pastoris △aox1△aox2는 ADH900 유전자를 결실시킬 때 관찰될 수 없고, ADH900 유전자를 과발현하는 경우에도 마찬가지이다. 한편, ADH2 과발현주는 ADH900 과발현주에 비해 4.1시간 및 21.7시간에서 37% 및 23% 더 높은 흡수율을 나타내었다. Adh2가 메탄올 소비에 대한 책임이 있는 효소이며 ADH2 유전자의 과발현으로 메탄올 소비를 증가시킬 수 있다는 예상치 못한 발견을 더욱 강조한다.
Reactor | ADH gene | Volume (mL) | CDW (g/L) |
Methanol at 0 h (g/L) |
Methanol at 4.1 h (g/L) |
Methanol at 20.1 h (g/L) |
qmethanol (mg g-1 h-1) At 4.1 h |
qmethanol (mg g-1 h-1) At 20.1 h |
R1 | PGAP ADH2 | 398 | 72.9 | 10.3 | 8.0 | 1.2 | 7.65 | 6.18 |
R2 | PGAP ADH900 | 400 | 71.7 | 10.3 | 8.7 | 2.9 | 5.30 | 5.09 |
R3 | PGAP ADH2 | 406 | 70.7 | 10.7 | 8.4 | 1.3 | 7.80 | 6.51 |
R4 | PGAP ADH900 | 399 | 71.3 | 10.3 | 8.6 | 2.8 | 5.91 | 5.23 |
실시예 17 : ADH2 과발현에 대한 메탄올 유도성 프로모터를 사용한 균주 생성.
메탄올 유도성 ADH2 과발현의 효과를 조사하기 위해, ADH2 코딩 서열의 발현을 조절하는 메탄올 유도성 프로모터 P AOX1 PP7435_chr4 (237941…238898) 및 P FLD1 PP7435_Chr3 (262922…263518)로 구성된 2개의 과발현 작제물을 생성하였다. ADH2 코딩 서열은 유전자 생성물의 아미노산 서열에 영향을 미치지 않으면서 코딩 서열에서 BbsI 및 BsaI 제한 부위를 제거하도록 변형되었다(표 16). 생성된 균주는 P. pastoris △aox1△aox2 BB3aZ_pAOX1_Adh2_CycTT 및 P. pastoris △aox1△aox2 BB3aZ_pFLD1_Adh2_CycTT로 지정되었다.
a) 발현 구성은 이미 설명한 대로 Golden Gate 어셈블리를 사용하여 생성되었다(Prielhofer et al., 2017). (1) 발현 구조 BB3aZ_pAOX1_Adh2_CycTT를 다음과 같이 조립하였다. Adh2_GG_cured DNA 단편(표 16)을 BB1_23 백본에 복제하여 BB1_23_Adh2를 생성했다. 발현 구조는 BB3aZ_14*(백본), BB1_23_Adh2(암호화 서열) BB1_12_pAOX1(프로모터), BB1_34_ScCYC1tt(터미네이터)의 골든 게이트 어셈블리에 의해 생성되었다. (2) 발현 구조 BB3aZ_pFLD1_Adh2_CycTT는 BB3aZ_14*(백본), BB1_23_Adh2(암호화 서열) BB1_12_pFLD1(프로모터), BB1_34_ScCYC1tt(터미네이터)의 골든 게이트 어셈블리에 의해 생성되었다. 플라스미드 및 서열은 Golden PiCS 키트 # 1000000133(Addgene, Inc., USA)에서 사용할 수 있다.
b) P. pastoris △aox1△aox2 균주를 실시예 1a)에 기술된 바와 같이 전기 적합성으로 만들었다. BB3aZ_pAOX1_Adh2_CycTT 발현 구조와 BB3aZ_pFLD1_Adh2_CycTT 발현 구조는 제조사의 프로토콜에 따라 AscI(New England Biolabs, Inc., USA)로 선형화되었고 Hi Yield® Gel/PCR DNA Fragment Extraction Kits(Sud-Laborbedarf GmbH, Germany)로 정제되었다. 500ng의 선형화된 플라스미드를 실시예 1a) 및 1d)에서 이전에 기술된 바와 같이 전기적격 P. pastoris △aox1△aox2로 형질전환시켰다. 양성 형질전환체는 25μg/mL Zeocin이 포함된 YPD 플레이트에서 선택되었다. 발현 구축물의 성공적인 통합은 게놈 DNA를 주형으로 하는 프라이머 109_BB3aN_ctrl_fwd 및 pGAP_goi_rev_v2(표 17)를 사용한 PCR 증폭에 의해 확인되었다. 생성된 균주는 P. pastoris △aox1△aox2 BB3aZ_pAOX1_Adh2_CycTT 및 P. pastoris △aox1△aox2 BB3aZ_pFLD1_Adh2_CycTT이다.
c) PCR 증폭을 위한 게놈 DNA는 제조업체의 권장 사항에 따라 Wizard® Genomic DNA Purification Kit(Promega Corporation, USA)를 사용하여 분리되었다. PCR 증폭 반응은 제조사의 권고에 따라 Q5 중합효소(New England Biolabs, Inc., USA)를 사용하여 수행되었다.
실시예 18
: AHD2 과발현에 대한 메탄올 유도성 프로모터를 사용한 메탄올 이용 음성 균주의 특정 메탄올 흡수율 측정.
메탄올 유도성 프로모터를 사용한 ADH2 과발현이 특정 메탄올 흡수율에 미치는 영향을 조사하기 위해 실시예 7 및 실시예 16에 설명된 대로 생물반응기 배양을 설정했다. 이를 위해 실시예 17에서 생성된 균주 P. pastoris △aox1△aox2 BB3aZ_pAOX1_Adh2_CycTT 및 P. pastoris △aox1△aox2 BB3aZ_pFLD1_Adh2_CycTT를 사용하였다.
a) 300mL BSM 배지로 채워진 반응기에 P. pastoris △aox1△aox2 BB3aZ_pAOX1_Adh2_CycTT(반응기 R1 및 R2) 및 P. pastoris △aox1△aox2 BB3aZ_pFLD 15mL를 접종했다. 목표 시작 OD600은 2였다. 용존 산소 스파이크로 표시되는 배치 단계의 끝에서, 바이오매스를 증가시키기 위해 24시간 동안 2.8mL/h에서 50%(w/w) 포도당 공급을 시작했다. 포도당 공급을 시작한 지 2시간 후에 50%(v/v) 메탄올 샷이 제공되어 메탄올 농도를 1.5%로 증가시켰다(측정된 농도는 R1=1.57%, R2=1.57%, R3=1.57% 및 R4=1.70%). 이것은 메탄올 소비 및 메탄올 유도성 프로모터를 유도하기 위해 수행되었습니다. 포도당 공급 단계의 마지막에 세포 건조 중량 및 HPLC에 대한 샘플을 취했다.
b) 글루코스 공급 단계 후 교반 및 기체 공급은 일정한 750rpm 및 9.5sL/h로 설정되었다. 추가 50% 메탄올 펄스를 첨가하여 농도를 1.5%로 증가시키고 즉시 HPLC 샘플을 채취하였다(측정된 농도는 R1=1.42%, R2=1.39%, R3=1.39% 및 R4=1.42%임). 4.2시간 후에 농도를 다시 측정하여 특정 메탄올 흡수율(qmethanol)을 결정하는 데 사용했다. 초기 펄스가 거의 소모된 후 두 번째 메탄올 펄스를 적용하고 즉시 HPLC 샘플을 채취했다(측정된 농도는 R1=1.61%, R2=1.65%, R3=1.50% 및 R4=1.47%임). 6.2시간 후에 농도를 다시 측정하고 특정 메탄올 흡수율(qmethanol)을 두 번째로 결정하는 데 사용했다.
c) 2개의 메탄올 펄스를 사용하여 특정 메탄올 흡수율(qmethanol)을 결정했다. 첫 번째 펄스와 샘플링 시점 사이의 시간은 4.2시간이었다. 두 번째 메탄올 펄스와 샘플링 지점 사이의 시간은 6.2시간이었다. 첫 번째 펄스 후 4.2시간 후 평균 메탄올 흡수율은 PFLD1 ADH2 과발현 균주 P. pastoris △aox1△aox2 BB3aZ_pFLD1_Adh2_CycTT의 경우 8.3 mg g-1 h-1이었고 PAOX1 ADH2 과발현 균주 P. pastoris △aox1△aox2 BB3aZ_pAOX1_Adh2_CycTT는 11.6 mg g-1 h-1이었다(표 21). 두 번째 메탄올 펄스 후 6.2시간 후 평균 흡수율은 PFLD1 ADH2 과발현 균주의 경우 10.1 mg g-1 h-1로 증가하고 PAOX1 ADH2 과발현 균주의 경우 13.8 mg g-1 h-1로 증가했다(표 22). 이 데이터는 메탄올 유도성 프로모터가 사용될 때 더 긴 메탄올 유도 시간이 Adh2의 증가된 발현 및 특정 메탄올 흡수율로 이어진다는 것을 보여준다. 따라서 균주는 메탄올이 유일한 에너지 및 탄소원인 배지에서 시간이 지남에 따라 특정 메탄올 흡수율을 유지하고 증가시킬 수 있다. 실시예 7에 기재된 P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT 균주와 비교하여 특정 메탄올 흡수율은 P. pastoris △aox1△aox2 BB3aZ_pFLD1.Adhfold에 대해 평균 1.6배 및 P. pastoris △aox1△aox2 aox2 BB3aZ_pAOX1_Adh2_CycTT에 대해 평균 2.3배 증가하였다.
Reactor | ADH gene | Volume (mL) |
CDW (g/L) |
Methanol 1st pulse (g/L) |
Methanol 4.2 h after 1st methanol pulse (g/L) |
qmethanol (mg g-1 h-1) |
R1 | PAOX1 ADH2 | 400 | 77.7 | 11.2 | 7.6 | 11.2 |
R2 | PAOX1 ADH2 | 401 | 76.4 | 11.0 | 7.2 | 11.9 |
R3 | PFLD1 ADH2 | 400 | 75.1 | 11.0 | 8.5 | 8.0 |
R4 | PFLD1 ADH2 | 401 | 75.8 | 11.3 | 8.6 | 8.5 |
Reactor | ADH gene | Volume (mL) |
CDW (g/L) |
Methanol 2nd pulse (g/L) |
Methanol 6.2 h after 2nd methanol pulse (g/L) |
qmethanol (mg g-1 h-1) |
R1 | PAOX1 ADH2 | 394 | 72.7 | 12.7 | 6.3 | 14.4 |
R2 | PAOX1 ADH2 | 393 | 72.6 | 13.1 | 7.1 | 13.3 |
R3 | PFLD1 ADH2 | 393 | 71.1 | 11.9 | 7.4 | 10.2 |
R4 | PFLD1 ADH2 | 394 | 73.0 | 11.7 | 7.1 | 10.1 |
실시예 19
: 분비된 재조합 단백질을 생산하는 ADH2 과발현 균주의 생성.
ADH2 과발현과 특정 메탄올 흡수율의 결과적인 증가가 재조합 단백질 생산에 영향을 미치는지 조사하기 위해 실시예 3에서 HSA 및 vHH를 생산하는 P. pastoris △aox1△aox2를 P AOX1 ADH2 및 P FLD1 ADH2 과발현 구조로 형질전환하고 실시예 4에 기술된 적응된 프로토콜로 소규모 스크리닝했다.
a) 과발현 구조는 이미 설명한 대로 Golden Gate 어셈블리를 사용하여 수행되었다(Prielhofer et al., 2017). (1) 발현 구조 BB3aK_pAOX1_Adh2_CycTT는 실시예 17로부터의 BB3aK_14*(백본), BB1_23_Adh2(암호화 서열), BB1_12_pAOX1(프로모터), BB1_34_ScCYC1tt의 골든 게이트 어셈블리에 의해 생성되었다. (2) 발현 구조 BB3aK_pFLD1_Adh2_CycTT는 실시예 17로부터의 BB3aK_14*(백본), BB1_23_Adh2(암호화 서열), BB1_12_pFLD1(프로모터), BB1_34_ScCYC1tt의 골든 게이트 어셈블리에 의해 생성되었다. 플라스미드 및 서열은 Golden PiCS 키트 # 1000000133(Addgene, Inc., USA)에서 사용할 수 있다.
b) P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT 및 P. pastoris △aox1△aox2 pPM2pZ30_pAOX1_αMF-vHH_CycTT 균주를 실시예 1a에 기재된 바와 같이 전기적격으로 만들었다. BB3aK_pAOX1_Adh2_CycTT 발현 구성체 및 BB3aK_pFLD1_Adh2_CycTT 발현 구성체를 제조업체의 프로토콜에 따라 AscI(New England Biolabs, Inc., USA)로 선형화하고 Hi Yield® Gel/PCR DNA Fragment Extraction Kits(Sud-Laborbedarf GmbH, Germany)로 정제했다. 500ng의 선형화된 플라스미드를 실시예 1a) 및 1d)에 기재된 바와 같이 전기 컴피턴트 P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT 및 P. pastoris △aox1△aox2 pPM2pZ30_pAOX1_αMF-vHH_CycTT에 형질전환하였다. 양성 형질을 500 ㎍/㎖의 제네티신 및 25 ㎍/㎖의 제오신을 포함하는 YPD 플레이트상에서 P. pastoris △aox1△aox2 pPM2pZ30_pAOX1_αMF-vHH_CycTT_BB3aK_pAOX1_Adh2_CycTT 및 P. pastoris △aox1△aox2 pPM2pZ30_pAOX1_αMF-vHH_CycTT_BB3aK_pFLD1_Adh2_CycTT 형질을 선별하였다. P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT_BB3aK_pAOX1_Adh2_CycTT 및 P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT_BB3aK_pFLD1_Adh2_CycTT 형질을 500 ㎍/㎖의 제네티신 및 100 ㎍/L nourseothricin을 포함하는 YPD 플레이트상에서 선택하였다. 추가 스크리닝을 위해 형질전환당 다중 클론을 선택하였다(실시예 20). 제조된 균주의 이름은 하기와 같다: P. pastoris △aox1△aox2 P AOX1 HSA P AOX1 ADH2, P. pastoris △aox1△aox2 P AOX1 HSA P FLD1 ADH2, P. pastoris △aox1△aox2 P AOX1 vHH P AOX1 ADH2, 및 P. pastoris △aox1△aox2 P AOX1 vHH P FLD1 ADH2.
실시예 20
: 분비된 재조합 단백질을 생산하는 ADH2 과발현 균주의 소규모 스크리닝.
실시예 19에 기재된 형질전환체로부터의 다중 클론을 소규모 스크리닝에서 시험하여 재조합 단백질 생산에 대한 ADH2 과발현의 영향을 조사하였다. 스크리닝 절차는 실시예 4에 설명된 2개의 샷 확장 프로토콜과 표준 프로토콜에서 조정되었습니다.
a) P. pastoris △aox1△aox2 P AOX1 HSA P AOX1 ADH2 및 P. pastoris △aox1△aox2 P AOX1 HSA P FLD1 ADH2 클론의 사전 배양을 위해 500μg/mL 제네티신 및 100μg/mL 누르세오트리신이 포함된 2mL YPD에 P. pastoris △aox1△aox2 P AOX1 vHH P AOX1 ADH2 및 P. pastoris △aox1△aox2 P AOX1 vHH P FLD1 ADH2 클론을 500μg/mL Geneticin 및 25μg/mL 제오신에 접종했다. 부모 균주는 선택에 사용된 항생제 내성을 기반으로 100μg/mL Nourseothricin 또는 25μg/mL Zeocin으로 YPD에 두 번 반복하여 접종되었다. 각 발현 구성물에 대해 스크리닝을 위해 11개의 클론을 선택했다. 전배양 및 스크리닝 배양물을 공기 투과성 막으로 밀봉된 24웰 플레이트에서 배양하고 25℃에서 280rpm으로 인큐베이션하였다. 스크리닝 배양물은 8의 시작 광학 밀도(OD600)로 다당류 용액 및 배양물을 유지하기 위한 효소를 기반으로 하는 느린 포도당 방출 시스템 EnPump200(Enpresso GmbH, Germany)이 있는 2mL의 최소 배지(ASMv6)에 접종되었다. 포도당 제한. 균주를 수용된 총 메탄올 및 인큐베이션 시간이 상이한 2개의 상이한 메탄올 공급 절차와 비교하였다(표 23).
b) 인큐베이션 기간 후 1mL의 각 배양물을 제거하고 미리 가중된 Eppendorf 튜브에서 원심분리하였다. 상청액을 제거하고 제조업체의 지침에 따라 Caliper LabChip GXII Touch(PerkinElmer, inc., USA)로 단백질 농도를 측정했다. 세포 펠릿으로 Eppendorf 튜브의 무게를 측정하여 습윤 세포 중량을 결정하고 다음과 같이 계산했다. 중량(전체) - 중량(비어 있음) = 습윤 세포 중량(WCW)(g/L). 이 데이터에서 수율을 계산했다. 수율(μg/g) = 단백질 농도 / 습윤 세포 중량.
Protocol | Incubation period | Polysaccharide (g/L) | Enzyme (%) | Methanol shot | Total methanol (v/v) |
Methanol shot time points (h) |
Standard | 48 h | 25 | 0.35 | 4 x | 3.5% | 4* ,19, 27,43 |
Two shot - extended | 72 h | 25 | 0.20 | 2 x | 2% | 3, 43 |
c) 결과는 표 24에 요약되어 있다. 놀랍게도 과발현은 모 돌연변이 균주와 비교할 때 vHH의 경우 최대 1.7배, HSA의 경우 2.3배까지 단백질 수율(㎍/g)을 증가시켰다. 실제로, ADH2의 과발현이 P. pastoris △aox1△aox2의 재조합 단백질 생산을 향상시킨다는 것을 증명했다.
d) 생물 반응기 배양을 위해 평균 성능 균주를 선택했다. 발현 구축물의 성공적인 통합은 게놈 DNA를 주형으로 하는 프라이머 109_BB3aN_ctrl_fwd 및 pGAP_goi_rev_v2(표 17)를 사용한 PCR 증폭에 의해 확인되었다. PCR 증폭을 위한 게놈 DNA는 제조업체의 권장 사항에 따라 Wizard® Genomic DNA Purification Kit(Promega Corporation, USA)를 사용하여 분리되었다. PCR 증폭 반응은 제조사의 권고에 따라 Q5 중합효소(New England Biolabs, Inc., USA)를 사용하여 수행되었다.
Screening protocol | |||
Descriptive name | Name | Two shot - extended | Standard MutS |
Parent strain: △aox1△aox2 P AOX1 vHH |
P. pastoris △aox1△aox2 pPM2pZ30_pAOX1_αMF-vHH_CycTT |
1766 | 1428 |
△aox1△aox2 P AOX1 vHH P AOX1 ADH2 | P. pastoris △aox1△aox2 pPM2pZ30_pAOX1_αMF-vHH_CycTT BB3aK_pAOX1_Adh2_CycTT |
2394* ±640 | 2441* ±211 |
△aox1△aox2 P AOX1 vHH P FLD1 ADH2 | P. pastoris △aox1△aox2 pPM2pZ30_pAOX1_αMF-vHH_CycTT BB3aK_pFLD1_Adh2_CycTT |
1907 ±381 | 1810* ±175 |
Parent strain: △aox1△aox2 P AOX1 HSA |
P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT |
635 | 459 |
△aox1△aox2 P AOX1 HSA P AOX1 ADH2 |
P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT BB3aK_pAOX1_Adh2_CycTT |
1485* ±183 | 711* ±135 |
△aox1△aox2 P AOX1 HSA P FLD1 ADH2 |
P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT BB3aK_pFLD1_Adh2_CycTT |
1198 ±96 | 621* ±85 |
실시예 21
: HSA를 모델 단백질로 생성하는 ADH2 과발현을 갖는 메탄올 이용 음성 균주. 전략 3으로 배양 - 포도당/메탄올 동시 공급 단계 및 분리된 메탄올 단독 공급 단계가 있는 공급 전략.
실시예 19에서 생성되고 실시예 20에서 선별된 메탄올 이용 음성 ADH2 과발현 균주의 재조합 단백질 생산 능력을 평가하기 위해 생물반응기 배양을 수행하였다. 이런 목적으로, P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT BB3aK_pFLD1_Adh2_CycTT(△aox1△aox2 P AOX1 HSA P AOX1 ADH2) 및 P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT BB3aK_pFLD1_Adh2_CycTT(△aox1△aox2 P AOX1 HSA P FLD1 ADH2) 균주를 실시예 10 및 실시예 11에 기재된 전략 13에 따라 배양하였다.
a) 이 생물 반응기 배양은 3단계로 분리되었다. (1) 1단계는 배치 단계였다. 반응기에 시작 OD600이 2인 생산 균주를 접종하였다. 접종은 실시예 7a) b)에 기재된 바와 같이 수행하였다. 배치 단계의 끝은 용존 산소 스파이크로 표시되었다. (2) 이 시점에서 2단계가 시작되었다. 2단계는 25시간 동안 4.8mL/h에서 50%(w/w) 포도당 공급으로 구성되었다. 2단계 시작 시 50%(v/v) 메탄올 펄스를 적용하여 메탄올 농도를 1.5%(v/v)의 목표로 증가시켰고 후속 메탄올 공급을 시작하여 포도당 공급으로 메탄올 소비, 증발 및 희석을 상쇄했다. (3) 3단계는 19.6(R1, R2) 및 21.6(R5, R6) 시간 동안 메탄올만 공급하는 것으로 구성되었다. 메탄올 농도는 실시예 6d)에 기재된 바와 같이 HPLC에 따라 측정하였다. 필요한 경우 추가 보상 펄스가 추가되었다. 메탄올 공급은 실시예 8 및 9b)에서와 같이 시간 간격으로 계산하였다. 각각의 반응기 R1, R2, R5 및 R6에 사용된 균주는 표 25에 식별되어 있다.
b) 공정 및 생산성 데이터는 표 26 및 표 27에서 찾을 수 있다. 반응기 R1, R2, R5 및 R6의 배양 전반에 걸친 최대 및 최소 메탄올 농도는 8.0g/L에서 13.6g/L 범위였다. 반응기 R1, R2 및 R5, R6은 모델 단백질로 HSA를 생산하고 있었다. 단계 3에서 68.7시간에서의 특정 생산성(qP)은 실시예 10과 비교하여 P AOX1 또는 P FLD1 을 사용한 ADH2 과발현의 긍정적인 영향을 보여준다(표 28, 표 29). 실시예 10에 대해 qP의 가중 평균을 계산하였고, 더 쉬운 비교를 위해 시점 45.02 내지 69.58시간에 대한 것이었다. 시점 45.02 내지 69.58h에서 실시예 10의 qP는 평균 40.9㎍ g-1h-1이다. 시점 49.1 내지 68.7시간에서 반응기 P AOX1 ADH2 과발현(R1, R2)에 대한 본 실시예의 qP는 평균 84.3㎍/g-1h-1이다. 이는 실시예 10과 비교하여 2배 증가된 것이다(표 28). 유사한 기간(47.1 내지 68.7시간)에서 P FLD1 ADH2 과발현(R5, R6)은 71㎍/g-1h-1의 평균 qP를 나타낸다. 이는 qP의 1.7배 증가를 나타낸다(표 29). 시점 68.7시간에서의 부피 생산성은 P AOX1 ADH2 과발현의 경우 1.21배(표 30) 및 P FLD1 ADH2 과발현의 경우 1.13배(표 31) 증가한다. 이 예에서 증가된 qP 및 체적 생산성은 재조합 단백질 생산을 위한 P. pastoris △aox1△aox2 균주에서 ADH2 과발현의 이점을 입증한다.
Reactor | Descriptive name | Name |
R1 | P. pastoris △aox1△aox2 PAOX1HSA PAOX1 ADH2 |
P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT BB3aK_pAOX1_Adh2_CycTT |
R2 | P. pastoris △aox1△aox2 PAOX1HSA PAOX1 ADH2 | P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT BB3aK_pAOX1_Adh2_CycTT |
R3 | P. pastoris △aox1△aox2 PAOX1vHH PAOX1 ADH2 |
P. pastoris △aox1△aox2 pPM2pZ30_pAOX1_αMF-vHH_CycTT BB3aK_pAOX1_Adh2_CycTT |
R4 | P. pastoris △aox1△aox2 PAOX1vHH PAOX1 ADH2 |
P. pastoris △aox1△aox2 pPM2pZ30_pAOX1_αMF-vHH_CycTT BB3aK_pAOX1_Adh2_CycTT |
R5 | P. pastoris △aox1△aox2 PAOX1HSA PFLD1 ADH2 |
P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT BB3aK_pFLD1_Adh2_CycTT |
R6 | P. pastoris △aox1△aox2 PAOX1HSA PFLD1 ADH2 | P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT BB3aK_pFLD1_Adh2_CycTT |
R7 | P. pastoris △aox1△aox2 PAOX1vHH PFLD1 ADH2 |
P. pastoris △aox1△aox2 pPM2pZ30_pAOX1_αMF-vHH_CycTT BB3aK_pFLD1_Adh2_CycTT |
R8 | P. pastoris △aox1△aox2 PAOX1vHH PFLD1 ADH2 |
P. pastoris △aox1△aox2 pPM2pZ30_pAOX1_αMF-vHH_CycTT BB3aK_pFLD1_Adh2_CycTT |
P
AOX1
HSA P AOX1 ADH2 |
Time (h) | Volume (mL) | YDM (g/L) | Recombinant protein concentration (mg/L) | Specific productivity (qP) |
Methanol concentration (g/L) | |||||
(μg g-1 h-1) | |||||||||||
Phase | R1 | R2 | R1 | R2 | R1 | R2 | R1 | R2 | R1 | R2 | |
1 | 24.0 | 318 | 317 | 24.8 | 24.0 | 0.0 | 0.0 | ||||
2 |
26.2 | *9.4 | *9.9 | ||||||||
49.1 | 502 | 501 | 100.4 | 100.2 | 208.9 | 218.6 | 96.0 | 101.1 | 13.8 | 13.6 | |
3 | 68.7 | 517 | 517 | 95.2 | 95.8 | 445.6 | 423.8 | 90.2 | 78.3 | 8.0 | 8.7 |
P
AOX1
HSA P FLD1 ADH2 |
Time (h) | Volume (mL) | YDM (g/L) | Recombinant protein concentration (mg/L) | Specific productivity (qP) |
Methanol concentration (g/L) | |||||
(μg g-1 h-1) | |||||||||||
Phase | R5 | R6 | R5 | R6 | R5 | R6 | R5 | R6 | R5 | R6 | |
1 | 21.9 | 308 | 306 | 25.2 | 25.2 | ||||||
2 |
23.8 | *10.6 | *11.0 | ||||||||
47.1 | 488 | 486 | 101.2 | 100.5 | 208.5 | 203.9 | 94.2 | 93.1 | 11.6 | 11.0 | |
3 | 68.7 | 515 | 513 | 95.4 | 95.2 | 412.5 | 395.6 | 73.0 | 69.0 | 10.8 | 10.4 |
Example 10 △aox1△aox2 PAOX1HSA |
Example 21 △aox1△aox2 PAOX1HSA P AOX1 ADH2 |
Example 10 △aox1△aox2 PAOX1HSA |
Example 21 △aox1△aox2 PAOX1HSA P AOX1 ADH2 |
Fold increase | ||||||
qP (μg g-1 h-1) | qP (μg g-1 h-1) | qP (μg g-1 h-1) | ||||||||
Time (h) | R1 | R2 | Time (h) | R1 | R2 | Time (h) | Average | Time (h) | Average | |
45.02 | 49.1 | 45.02 | 49.1 | |||||||
53.00 | 38.6 | 21.5 | 53.00 |
Weighted average
40.9 |
||||||
69.58 | 47.3 | 44.9 | 68.7 | 90.2 | 78.3 | 69.58 | 68.7 | 84.3 | 2.06 |
Example 10 △aox1△aox2 P AOX1 HSA |
Example 21 △aox1△aox2 P AOX1 HSA P FLD1 ADH2 |
Example 10 △aox1△aox2 P AOX1 HSA |
Example 21 △aox1△aox2 P AOX1 HSA P FLD1 ADH2 |
Fold increase | ||||||
qP (μg g-1 h-1) | qP (μg g-1 h-1) | qP (μg g-1 h-1) | ||||||||
Time (h) | R1 | R2 | Time (h) | R5 | R6 | Time (h) | Average | Time (h) | Average | |
45.02 | 47.1 | 45.02 | 47.1 | |||||||
53.00 | 38.6 | 21.5 | 53.00 | Weighted average | ||||||
69.58 | 47.3 | 44.9 | 68.7 | 73.0 | 69.0 | 69.58 | 40.9 | 68.7 | 71.0 | 1.74 |
Example 10 △aox1△aox2 PAOX1HSA |
Example 21 △aox1△aox2 PAOX1HSA P AOX1 ADH2 |
Example 10 △aox1△aox2 PAOX1HSA |
Example 21 △aox1△aox2 PAOX1HSA P AOX1 ADH2 |
Fold increase | |||
R1 | R2 | R1 | R2 | Average | Average | ||
Recombinant protein (mg/L) | 357.3 | 371.8 | 445.6 | 423.8 | 364.6 | 434.7 | |
Biomass (g/L) | 95.9 | 96.3 | 95.2 | 95.8 | 96.1 | 95.5 | |
*Corrected recombinant protein (mg/L) | 244.2 | 253.6 | 305.6 | 289.8 | 248.9 | 297.7 | |
Time (h) | 69.58 | 68.7 | |||||
Volumetric productivity (mg L -1 h -1 ) | 3.58 | 4.33 | 1.21 |
Example 10 △aox1△aox2 P AOX1 HSA |
Example 21 △aox1△aox2 PAOX1HSA P FLD1 ADH2 |
Example 10 △aox1△aox2 P AOX1 HSA |
Example 21 △aox1△aox2 PAOX1HSA P FLD1 ADH2 |
Fold increase | |||
R1 | R2 | R5 | R6 | Average | Average | ||
Recombinant protein (mg/L) | 357.3 | 371.8 | 412.5 | 395.6 | 364.6 | 404.1 | |
Biomass (g/L) | 95.9 | 96.3 | 95.4 | 95.2 | 96.1 | 95.3 | |
*Corrected recombinant protein (mg/L) | 244.2 | 253.6 | 282.6 | 271.3 | 248.9 | 277.0 | |
Time (h) | 69.58 | 68.7 | |||||
Volumetric productivity (mg L -1 h -1 ) | 3.58 | 4.03 | 1.13 |
실시예 22
: 모델 단백질로서 vHH를 생성하는 ADH2 과발현을 갖는 메탄올 이용 음성 균주. 전략 3으로 배양 - 포도당/메탄올 동시 공급 단계 및 분리된 메탄올 단독 공급 단계가 있는 공급 전략.
실시예 19에서 생성되고 실시예 20에서 선별된 메탄올 이용 음성 ADH2 과발현 균주의 재조합 단백질 생산 능력을 평가하기 위해 생물반응기 배양을 수행하였다. 실시예 10 및 실시예 11에 기재된 바와 같이, P. pastoris △aox1△aox2 pPM2pZ30_pAOX1_vHH_CycTT BB3aK_pAOX1_Adh2_CycTT (△aox1△aox2 P AOX1 vHH P AOX1 ADH2) 및 P. pastoris △aox1△aox2 pPM2pZ30_pAOX1_vHH_CycTT BB3aK_pFLD1_Adh2_CycTT (△aox1△aox2 P AOX1 vHH P AOX1 ADH2) 균주를 전략 3으로 배양하였다.
a) 이 생물 반응기 배양은 3단계로 분리되었다. (1) 1단계는 배치 단계였다. 반응기에 시작 OD600이 2인 생산 균주를 접종하였다. 접종은 실시예 7a) b)에 기재된 바와 같이 수행하였다. 배치 단계의 끝은 용존 산소 스파이크로 표시되었다. (2) 이 시점에서 2단계가 시작되었다. 2단계는 25시간 동안 4.8mL/h의 50%(w/w) 포도당 공급으로 구성되었다. 2단계 시작 시 50%(v/v) 메탄올 펄스를 적용하여 메탄올 농도를 1.5%(v/v)의 목표로 증가시켰고 후속 메탄올 공급을 시작하여 포도당 공급에 의한 메탄올 소비, 증발 및 희석을 상쇄했다. (3) 3단계는 43.6(R3, R4) 및 44.6(R7, R8) 시간 동안 메탄올만 공급하는 것으로 구성되었다. 메탄올 농도는 실시예 6d)에 기재된 바와 같이 HPLC에 따라 측정하였다. 필요한 경우 추가 보상 펄스가 추가되었다. 메탄올 공급은 실시예 8 및 9b)에서와 같이 시간 간격으로 계산하였다. 각 반응기 R3, R4, R7 및 R8에 사용된 균주는 표 25에서 찾을 수 있다.
b) 공정 및 생산성 데이터는 표 32 및 표 33에서 찾을 수 있다. 반응기 R3, R4, R7 및 R8의 배양 전반에 걸친 최대 및 최소 메탄올 농도는 8.6g/L에서 14.4g/L 범위였다. 반응기 R3, R4 및 R7, R8은 모델 단백질로서 vHH를 생산하고 있었다. ADH2 과발현은 실시예 11과 비교하여 비 생산성(qP)에 긍정적인 영향을 미쳤습니다. 더 쉬운 비교를 위해 qP의 가중 평균을 실시예 11의 2단계(시점 20.0 내지 53.6시간)에 대해 계산했다. 비교는 P AOX1 ADH2 과발현(R3, R4)는 1.71배이고 PFLD1ADH2 과발현(R7, R8)은 2단계에서 qP에서 1.78배 증가한다(표 34, 표 35). 3단계의 나중 시점에서 개선 사항은 훨씬 더 크다. 시점 92.7 및 91.7에서 qP는 3.76배(P AOX1 ADH2 과발현) 및 3.86배(P FLD1 ADH2 과발현) 증가한다(표 34, 표 35). 또한, 체적 생산성은 두 경우 모두에서 실시예 11의 친주에 비해 1.9배 이상 개선되었다(표 35, 표 36). 이 예에서 증가된 qP 및 부피 생산성은 재조합 단백질 생산을 위한 P. pastoris △aox1△aox2 균주에서 ADH2 과발현의 이점을 입증한다.
P AOX1 vHH P AOX1 ADH2 | Time (h) | Volume (mL) | YDM (g/L) | Recombinant protein concentration (mg/L) | Specific productivity (qP) | Methanol concentration (g/L) | |||||
(μg g-1 h-1) | |||||||||||
Phase | R3 | R4 | R3 | R4 | R3 | R4 | R3 | R4 | R3 | R4 | |
1 | 24.0 | 318 | 318 | 24.9 | 24.3 | ||||||
2 |
26.2 | *9.8 | *10.3 | ||||||||
49.1 | 501 | 502 | 102.6 | 100.6 | 696.1 | 783.0 | 310.3 | 359.4 | 13.9 | 14.4 | |
3 |
68.7 | 518 | 518 | 94.9 | 94.6 | 1688.5 | 1724.9 | 376.1 | 362.0 | 9.4 | 9.7 |
92.7 | 544 | 543 | 86.7 | 85.2 | 2466.5 | 2364.8 | 307.4 | 268.3 | 8.6 | 8.9 |
P
AOX1
vHH P FLD1 ADH2 |
Time (h) | Volume (mL) | YDM (g/L) | Recombinant protein concentration (mg/L) | Specific productivity (qP) | Methanol concentration (g/L) | |||||
(μg g-1 h-1) | |||||||||||
Phase | R7 | R8 | R7 | R8 | R7 | R8 | R7 | R8 | R7 | R8 | |
1 | 21.9 | 306 | 307 | 24.5 | 24.3 | ||||||
2 |
23.8 | *10.8 | *10.7 | ||||||||
47.1 | 485 | 484 | 100.3 | 98.6 | 738.1 | 761.1 | 339.0 | 358.0 | 10.8 | 11.5 | |
3 |
68.7 | 514 | 513 | 93.3 | 92.3 | 1511.7 | 1555.3 | 284.7 | 297.8 | 11.2 | 11.7 |
91.7 | 516 | 514 | 85.8 | 85.2 | 2270.9 | 2364.4 | 285.7 | 305.6 | 10.5 | 10.5 |
Example 11 △aox1△aox2 P AOX1 vHH |
Example 22 △aox1△aox2 P AOX1 vHH P AOX1 ADH2 |
Example 11 △aox1△aox2 P AOX1 vHH |
Example 22 △aox1△aox2 P AOX1 vHH P AOX1 ADH2 |
Fold increase | ||||||
qP(μg g-1 h-1) | qP(μg g-1 h-1) | qP(μg g-1 h-1) | qP(μg g-1 h-1) | |||||||
Time (h) | R1 | R2 | Time (h) | R3 | R4 | Time (h) | Average | Time (h) | Average | |
20.00 | 24.0 | 20.00 | Weighted average 195.8 | 24.0 | ||||||
28.22 | 137.8 | 141.5 | 28.22 | |||||||
44.83 | 222.8 | 208.3 | 44.83 | |||||||
53.58 | 176.0 | 246.2 | 49.1 | 310.3 | 359.4 | 53.58 | 49.1 | 335 | 1.71 | |
68.83 | 142.5 | 72.2 | 68.7 | 376.1 | 362 | 68.83 | 107.4 | 68.7 | 369 | 3.44 |
92.00 | 55.8 | 97.5 | 92.7 | 307.4 | 268.3 | 92.00 | 76.7 | 92.7 | 288 | 3.76 |
Example 11 △aox1△aox2 P AOX1 vHH |
Example 22 △aox1△aox2 P AOX1 vHH P FLD1 ADH2 |
Example 11 △aox1△aox2 P AOX1 vHH |
Example 22 △aox1△aox2 P AOX1 vHH P FLD1 ADH2 |
Fold increase | ||||||
qP(μg g-1 h-1) | qP(μg g-1 h-1) | qP(μg g-1 h-1) | qP(μg g-1 h-1) | |||||||
Time (h) | R1 | R2 | Time (h) | R7 | R8 | Time (h) | Average | Time (h) | Average | |
20.00 | 21.9 | 20.00 | Weighted average 195.8 | 21.9 | ||||||
28.22 | 137.8 | 141.5 | 28.22 | |||||||
44.83 | 222.8 | 208.3 | 44.83 | |||||||
53.58 | 176.0 | 246.2 | 47.1 | 339.0 | 358.0 | 53.58 | 47.1 | 349 | 1.78 | |
68.83 | 142.5 | 72.2 | 68.7 | 284.7 | 297.8 | 68.83 | 107.4 | 68.7 | 291 | 2.71 |
92.00 | 55.8 | 97.5 | 91.7 | 285.7 | 305.6 | 92.00 | 76.7 | 91.7 | 296 | 3.86 |
Example 11 △aox1△aox2 PAOX1vHH |
Example 22 △aox1△aox2 PAOX1vHH P AOX1 ADH2 |
Example 11 △aox1△aox2 PAOX1vHH |
Example 22 △aox1△aox2 PAOX1vHH P AOX1 ADH2 |
Fold increase | |||
R1 | R2 | R3 | R4 | Average | Average | ||
Recombinant protein (mg/L) | 1337.2 | 1374.0 | 2466.5 | 2364.8 | 1355.6 | 2415.7 | |
Biomass (g/L) | 110.8 | 109.4 | 86.7 | 85.2 | 110.1 | 86.0 | |
*Corrected recombinant protein (mg/L) | 848.3 | 878.0 | 1760.8 | 1699.9 | 863.1 | 1730.4 | |
Time (h) | 92.0 | 92.0 | 92.7 | 92.7 | 92.0 | 92.7 | |
Volumetric productivity (mg L -1 h -1 ) | 9.38 | 18.67 | 1.99 |
Example 11 △aox1△aox2 PAOX1vHH |
Example 22 △aox1△aox2 PAOX1vHH P FLD1 ADH2 |
Example 11 △aox1△aox2 PAOX1vHH |
Example 22 △aox1△aox2 PAOX1vHH P FLD1 ADH2 |
Fold increase | |||
R1 | R2 | R7 | R8 | Average | Average | ||
Recombinant protein (mg/L) | 1337.2 | 1374.0 | 2270.9 | 2364.4 | 1355.6 | 2317.7 | |
Biomass (g/L) | 110.8 | 109.4 | 85.8 | 85.2 | 110.1 | 85.5 | |
*Corrected recombinant protein (mg/L) | 848.3 | 878.0 | 1627.9 | 1699.6 | 863.1 | 1663.8 | |
Time (h) | 92.0 | 92.0 | 91.7 | 91.7 | 92.00 | 91.7 | |
Volumetric productivity (mg L -1 h -1 ) | 9.38 | 18.14 | 1.93 |
PSHB17 | PP7435_chr2 (340616...341606) | (SEQ ID NO:36) GCAAGGCAACTGAGAAATTGAATAGTGGTTTCAAGCCCGCTGACTTTTTGTATTATCTCAATGTCGGTGTTTCACAGTCCCCAGAAGGGGGCTTTGCCTTCAAGGGAGACGGAAGAGACATCGTCAACCCTGGGGAGAAGTATTTCAAATGGCGCAAGTTCGCTAATTTTTACGATTAAGCAGTGCTGTATGGGGTAGTTAATAAATCGGGAATATCCTTCTGACGTGACTGTAACAAATCTCTTTTTACGTGGTGCGCATACTGGACAGAGGCAGAGTCTCAATTTCTTCTTTTGAGACAGGCTACTACAGCCTGTGATTCCTCTTGGTACTTGGATTTGCTTTTATCTGGCTCCGTTGGGAACTGTGCCTGGGTTTTGAAGTATCTTGTGGATGTGTTTCTAACACTTTTTCAATCTTCTTGGAGTGAGAATGCAGGACTTTGAACATCGTCTAGCTCGTTGGTAGGTGAACCGTTTTACCTTGCATGTGGTTAGGAGTTTTCTGGAGTAACCAAGACCGTCTTATCATCGCCGTAAAATCGCTCTTACTGTCGCTAATAATCCCGCTGGAAGAGAAGTTCGAACAGAAGTAGCACGCAAAGCTCTTGTCAAATGAGAATTGTTAATCGTTTGACAGGTCACACTCGTGGGCTATGTACGATCAACTTGCCGGCTGTTGCTGGAGAGATGACACCAGTTGTGGCATGGCCAATTGGTATTCAGCCGTACCACTGTATGGAAAATGAGATTATCTTGTTCTTGATCTAGTTTCTTGCCATTTTAGAGTTGCCACATTCGTAGGTTTCAGTACCAATAATGGTAACTTCCAAACTTCCAACGCAGATACCAGAGATCTGCCGATCCTTCCCCAACAATAGGAGCTTACTACGCCATACATATAGCCTATCTATTTTCACTTTCGCGTGGGTGCTTCTATATAAACGGTTCCCCATCTTCCGTTTCATACTACTTGAATTTTAAGCACTAAA |
PALD4 | PP7435_chr2 (1466285...1467148) | (SEQ ID NO:37) CTTTTCTTTGGGCAAGGAAAAATCAAGAAAAAGCAGAGGTTAAAGTTTTCAGGGGAATGGCAATTGCTTTATATATGGGAGAAAGTTAACTACGTCGGTGCTGTAGGCGTAGAGAGCGACTGGAGAATGCGTGATGAGGTCGTCTCTTTTCGCCCCCCCTTGGCGGGGTAAAAATTGCACTACTGCAGAATTACTACACCCCTATTCCGAGGAGACGGAGTGCGACAAAAATGGTAAAGTTCACCCTAGTCTGCGACTTTTAATTGACGGACACCGGCGTTTACATGCGAAAAAAACTAAAGTGCGCGCATTTCACGGCCGAGGGGGGTCCCACTTGGGACTGAGAGGGGGTGGGATCTGAAATCGAGGAGGTATCAAGACCCCCCGTTTCTCAACTCCCTAATCAAAAATTACGAAGTCCTCGTTGGAAAGGAGTTAAAATAATTAAGCGGGGTCGGACGCCATACCGAGGTTATCTTGCAGGCATTTTACTAATATTGGAATTCGGAGCTCAACTTGCAACCAGGCAGGGTTTAGCTATGTAATCAATGTAATCAATATAATAAAGCACTACCACATCGAAGGTTTGGGAGGGAGGCCAATAGTGTCCCCCACAGGGTGCTGATATCGCGATTCTTGGGTGAGGAGACACATATTTCACTCCTCTCACCAACCAACCAAGCGGCTCCTCGCAAGATGATTTATCCGATTATCCGGACACTATACTCCCATCCAGTTTGATGCCGATTTCATCGATTGTCCTAAATAATCCTTAAATATGTATAGAACGGTACCCTGGGGTTACATAATCCTTATTTAATAATCCCTCCCCCACCGCTTTTCTTTTTTTTTCTTCTTATTGTC |
PFDH1 | PP7435_chr3 (423504...424503) | (SEQ ID NO:38) AAATGGCAGAAGGATCAGCCTGGACGAAGCAACCAGTTCCAACTGCTAAGTAAAGAAGATGCTAGACGAAGGAGACTTCAGAGGTGAAAAGTTTGCAAGAAGAGAGCTGCGGGAAATAAATTTTCAATTTAAGGACTTGAGTGCGTCCATATTCGTGTACGTGTCCAACTGTTTTCCATTACCTAAGAAAAACATAAAGATTAAAAAGATAAACCCAATCGGGAAACTTTAGCGTGCCGTTTCGGATTCCGAAAAACTTTTGGAGCGCCAGATGACTATGGAAAGAGGAGTGTACCAAAATGGCAAGTCGGGGGCTACTCACCGGATAGCCAATACATTCTCTAGGAACCAGGGATGAATCCAGGTTTTTGTTGTCACGGTAGGTCAAGCATTCACTTCTTAGGAATATCTCGTTGAAAGCTACTTGAAATCCCATTGGGTGCGGAACCAGCTTCTAATTAAATAGTTCGATGATGTTCTCTAAGTGGGACTCTACGGCTCAAACTTCTACACAGCATCATCTTAGTAGTCCCTTCCCAAAACACCATTCTAGGTTTCGGAACGTAACGAAACAATGTTCCTCTCTTCACATTGGGCCGTTACTCTAGCCTTCCGAAGAACCAATAAAAGGGACCGGCTGAAACGGGTGTGGAAACTCCTGTCCAGTTTATGGCAAAGGCTACAGAAATCCCAATCTTGTCGGGATGTTGCTCCTCCCAAACGCCATATTGTACTGCAGTTGGTGCGCATTTTAGGGAAAATTTACCCCAGATGTCCTGATTTTCGAGGGCTACCCCCAACTCCCTGTGCTTATACTTAGTCTAATTCTATTCAGTGTGCTGACCTACACGTAATGATGTCGTAACCCAGTTAAATGGCCGAAAAACTATTTAAGTAAGTTTATTTCTCCTCCAGATGAGACTCTCCTTCTTTTCTCCGCTAGTTATCAAACTATAAACCTATTTTACCTCAAATACCTCCAACATCACCCACTTAAACA |
PDAS1 | PP7435_chr3 (634140...634688) | (SEQ ID NO:39) AATGATATAAACAACAATTGAGTGACAGGTCTACTTTGTTCTCAAAAGGCCATAACCATCTGTTTGCATCTCTTATCACCACACCATCCTCCTCATCTGGCCTTCAATTGTGGGGAACAACTAGCATCCCAACACCAGACTAACTCCACCCAGATGAAACCAGTTGTCGCTTACCAGTCAATGAATGTTGAGCTAACGTTCCTTGAAACTCGAATGATCCCAGCCTTGCTGCGTATCATCCCTCCGCTATTCCGCCGCTTGCTCCAACCATGTTTCCGCCTTTTTCGAACAAGTTCAAATACCTATCTTTGGCAGGACTTTTCCTCCTGCCTTTTTTAGCCTCAGGTCTCGGTTAGCCTCTAGGCAAATTCTGGTCTTCATACCTATATCAACTTTTCATCAGATAGCCTTTGGGTTCAAAAAAGAACTAAAGCAGGATGCCTGATATATAAATCCCAGATGATCTGCTTTTGAAACTATTTTCAGTATCTTGATTCGTTTACTTACAAACAACTATTGTTGATTTTATCTGGAGAATAATCGAACAAA |
PDAS2 | PP7435_chr3 (632201...633200) | (SEQ ID NO:40) ATTACTGTTTTGGGCAATCCTGTTGATAAGACGCATTCTAGAGTTGTTTCATGAAAGGGTTACGGGTGTTGATTGGTTTGAGATATGCCAGAGGACAGATCAATCTGTGGTTTGCTAAACTGGAAGTCTGGTAAGGACTCTAGCAAGTCCGTTACTCAAAAAGTCATACCAAGTAAGATTACGTAACACCTGGGCATGACTTTCTAAGTTAGCAAGTCACCAAGAGGGTCCTATTTAACGTTTGGCGGTATCTGAAACACAAGACTTGCCTATCCCATAGTACATCATATTACCTGTCAAGCTATGCTACCCCACAGAAATACCCCAAAAGTTGAAGTGAAAAAATGAAAATTACTGGTAACTTCACCCCATAACAAACTTAATAATTTCTGTAGCCAATGAAAGTAAACCCCATTCAATGTTCCGAGATTTAGTATACTTGCCCCTATAAGAAACGAAGGATTTCAGCTTCCTTACCCCATGAACAGAAATCTTCCATTTACCCCCCACTGGAGAGATCCGCCCAAACGAACAGATAATAGAAAAAAGAAATTCGGACAAATAGAACACTTTCTCAGCCAATTAAAGTCATTCCATGCACTCCCTTTAGCTGCCGTTCCATCCCTTTGTTGAGCAACACCATCGTTAGCCAGTACGAAAGAGGAAACTTAACCGATACCTTGGAGAAATCTAAGGCGCGAATGAGTTTAGCCTAGATATCCTTAGTGAAGGGTTGTTCCGATACTTCTCCACATTCAGTCATAGATGGGCAGCTTTGTTATCATGAAGAGACGGAAACGGGCATTAAGGGTTAACCGCCAAATTATATAAAGACAACATGTCCCCAGTTTAAAGTTTTTCTTTCCTATTCTTGTATCCTGAGTGACCGTTGTGTTTAATATAACAAGTTCGTTTTAACTTAAGACCAAAACCAGTTACAACAAATTATAACCCCTCTAAACACTAAAGTTCACTCTTATCAAACTATCAAACATCAAAA |
PPMP20 | PP7435_ Chr1 (2418090...2419089) | (SEQ ID NO:41) GTCAACTGCGTACTCTTTTGTCGAATGGACTACTGAATCTGCCTCGATAGCCACTATAGGAAGGTCCATAGAGGCCAGTTTTTCAACTAGTCTTGGTGGAAAGAAACCGACAAAGCCTTTCATGGAGTCACCGATACTGAAAGGTTCAAACAAAGAATGCTTGGGTAGTCTCTTAATACCCATGGCAACGAAAAAGGGGTCTTCATTGTTCAACATGAATTCGTATCCACCTTTAATGTAGTCATAAAGCTGCTGAAGTTCCGAATCAGTGATGGAACTGTCTACAGTGACAATATAGGAGTTCTCAATCACCTTATATCCAGTCGAATATATCTGGATAGGGTCGGGTCTCACTGTGGAAGATTCAAATGGGTTAGATCCCTGTAATTTCAGCGATGGAGACTCAGTATGATGGGGCAAGGAAAACGGCAATTGGATATTCAATTGGTCAAGAGATGGTATCAAAAGCGAGTGTGCCAGGGTAGCCACGGTAGCCACTGATGCTAATCTGATAATTTTCATTTCTGGAGTGTCAAAACAGTAGTGATAAAAGGCTATGAAGGAGGTTGTCTAGGGGCTCGCGGAGGAAAGTGATTCAAACAGACCTGCCAAAAAGAGAAAAAAGAGGGAATCCCTGTTCTTTCCAATGGAAATGACGTAACTTTAACTTGAAAAATACCCCAACCAGAAGGGTTCAAACTCAACAAGGATTGCGTAATTCCTACAAGTAGCTTAGAGCTGGGGGAGAGACAACTGAAGGCAGCTTAACGATAACGCGGGGGGATTGGTGCACGACTCGAAAGGAGGTATCTTAGTCTTGTAACCTCTTTTTTCCAGAGGCTATTCAAGATTCATAGGCGATATCGATGTGGAGAAGGGTGAACAATATAAAAGGCTGGAGAGATGTCAATGAAGCAGCTGGATAGATTTCAAATTTTCTAGATTTCAGAGTAATCGCACAAAACGAAGGAATCCCACCAAGCAAAAAAAAAAATCTAAG |
PFBA1-2 | PP7435_Chr1 (1162918...1163621) | (SEQ ID NO:42) AAATTAATCCATAAGATAAGGCAAATGTGCTTAAGTAATTGAAAACAGTGTTGTGATTATATAAGCATGGTATTTGAATAGAACTACTGGGGTTAACTTATCTAGTAGGATGGAAGTTGAGGGAGATCAAGATGCTTAAAGAAAAGGATTGGCCAATATGAAAGCCATAATTAGCAATACTTATTTAATCAGATAATTGTGGGGCATTGTGACTTGACTTTTACCAGGACTTCAAACCTCAACCATTTAAACAGTTATAGAAGACGTACCGTCACTTTTGCTTTTAATGTGATCTAAATGTGATCACATGAACTCAAACTAAAATGATATCTTTTACTGGACAAAAATGTTATCCTGCAAACAGAAAGCTTTCTTCTATTCTAAGAAGAACATTTACATTGGTGGGAAACCTGAAAACAGAAAATAAATACTCCCCAGTGACCCTATGAGCAGGATTTTTGCATCCCTATTGTAGGCCTTTCAAACTCACACCTAATATTTCCCGCCACTCACACTATCAATGATCACTTCCCAGTTCTCTTCTTCCCCTATTCGTACCATGCAACCCTTACACGCCTTTTCCATTTCGGTTCGGATGCGACTTCCAGTCTGTGGGGTACGTAGCCTATTCTCTTAGCCGGTATTTAAACATACAAATTCACCCAAATTCTACCTTGATAAGGTAATTGATTAATTTCATAAAT |
PPMP47 | PP7435_Chr3 (2033196??2034195) | (SEQ ID NO:43)AGCTCAGATTGGAAATGATTTTTGATCCTACCAAGAAGCCTTTGATTTCCAGAATCTCCGCTAAGTAAGTAACCCCCGCAAACGCATGCATCCATGCAAACAAAATACTAACAATTTTAGCCCCGTTGTTGAGAAACCCAGAAAATTGAATGTTCAACCAATCCAGACGATCAATAAGAAAAAAGGCCCAAAGGCTACTTCCAAACCTGCTGCCGCCAAACCTGCTCCTTCAAAAGCCGGTCCCAAGGGAGGTAAGAAGGTGAGAAAGCCAAAGAAGACAGTTGAAGAATTGGATCAGGAAATGGCTGACTACTTTGAAAATAAGAATTAGCCCAACAAAATATGTACAAGTATTATATAAATGAATCTACATGGTGTGTTTTATTTAGATCCTCCAAACCAAGGAAAGAAACTAAACTTATCTCCGGACTTACGAGTCAAATAACTATCCGCAGTTCCTTGGAACTCAGACTTTCTTCCATAAGCGGTCATATCATCTTTGGACTGTGGGAATCCTGGACGAATCTTTGAAATGTCATAATCTTGCTCTCTATCTCCAAGCACAGCGTCCGGTAAATGCTGGTTCTTCTTTCTCAGATGAATCTTGGATTTAACAAATAAAGCCGTGCCTATGGCTAATGTACTCAAAAACAAAGTCTGCTTCCAGAATTTCGCAAACGATGGAATGCCATTTCCTGTAAATGTACTCATTGAACCTATGTTTGATTAAAGTTGGTGTGAAGTCATCAAACGAGAGTAAAATCAGATACTCGTGCACCGGCCAAAATTGACTGAGCTAATCTCTGCAGGCTTGACATCCGAACACAACAAATAGGCGACAAATCTTAACTATCTAATCGTAGGCTATGGTAGAACTTTGTGGGGGTAGAGGAAGACTACAACAGCAAGACAAAACAAAAGAGTCATAGTTTGACTCTCTGCTTTTTTCTTCTTTCTCTTCTTTTTCTTCCTCCATATTCGTTATTTATTTCGAACTGGA |
PFLD | PP7435_Chr3 (262519...263518) | (SEQ ID NO:44) CAGCCATTAATCTCACCTCAGTTTTTGAATCAGTAGAATTTTTAATGAAACAAACGGTTGGTATATTATTTGATAGAGTTGCCAAATTTCCAAAGATAAATTTTTCATCAGGTAATATCCTGAATACCGTAACATAGTGACTATTGGAAGACACTGCTATCATATTATATTTCGGATAAAAATCCAAACCCCAGACCGACCTCTTGAGTCTCAACTCCAAGTCAGCCGCAACTTTAATTATCCGTGGATTGGGAGCTAGTTTGGACAACGCATCAGTATAATATAACTTTACGGTTCCATTATCAGACGCTATTGCAAGAACTTCCTTTCCATTGATCTCGCCAATGCGGCAGTAATTGATATCGTAGGGTAGGTCTGGAAAGACGCTGGCGCTTGTGTCCCATTCTGCAGGAATCTCTGGCACGGTGCTAATGGTAGTTATCCAACGGAGCTGAGGTAGTCGATATATCTGGATATGCCGCCTATAGGATAAAAACAGGAGAGGGTGAACCTTGCTTATGGCTACTAGATTGTTCTTGTACTCTGAATTCTCATTATGGGAAACTAAACTAATCTCATCTGTGTGTTGCAGTACTATTGAATCGTTGTAGTATCTACCTGGAGGGCATTCCATGAATTAGTGAGATAACAGAGTTGGGTAACTAGAGAGAATAATAGACGTATGCATGATTACTACACAACGGATGTCGCACTCTTTCCTTAGTTAAAACTATCATCCAATCACAAGATGCGGGCTGGAAAGACTTGCTCCCGAAGGATAATCTTCTGCTTCTATCTCCCTTCCTCATATGGTTTCGCAGGGCTCATGCCCCTTCTTCCTTCGAACTGCCCGATGAGGAAGTCCTTAGCCTATCAAAGAATTCGGGACCATCATCGATTTTTAGAGCCTTACCTGATCGCAATCAGGATTTCACTACTCATATAAATACATCGCTCAAAGCTCCAACTTTGCTTGTTCATACAATTCTTGATATTCACA |
PFGH1 | PP7435_Chr3 (555587...556586) | (SEQ ID NO:45) TGGTTCCCTCTCGGTCCAATACCAAAAATATTATCACCATACAGGTCTCCCTTCGATACCAGTGCAAAGTTGAACCGTGGGATTACCTTGGAATCTACAAAAATAGTGTCACTCACAAGTTTGTCATCAACCACGCTGCCGCTTGCAAAGGAGAACTGAACATGAAGGTTGTTAGGGTTTGTTATATTGGAATAAGTGGTGGATTTGTTGAAGGCGAACGCACCAAAGCTACATCCGTCCTGAGCACACTGTGAATTTGTCACGGAATTGACCAAGAGGTCAGACGATCCTGTATCCCATTGAGCCGTTATGCTTTGTGGGGGAAACCCTATTTCTATCGTACTAAGAAAACCAATGGTGAACTCATATTCGGTATCAATGGCGACGATTCCAGCATAGCCTGTAGACAGTAACAACACTAGGGCAACAGCAACTAACATATCTTCATTGATGAAACGTTGTGATCGGTGTGACTTTTATAGTAAAAGCTACAACTGTTTGAAATACCAAGATATCATTGTGAATGGCTCAAAAGGGTAATACATCTGAAAAACCTGAAGTGTGGAAAATTCCGATGGAGCCAACTCATGATAACGCAGAAGTCCCATTTTGCCATCTTCTCTTGGTATGAAACGGTAGAAAATGATCCGAGTATGCCAATTGATACTCTTGATTCATGCCCTATAGTTTGCGTAGGGTTTAATTGATCTCCTGGTCTATCGATCTGGGACGCAATGTAGACCCCATTAGTGGAAACACTGAAAGGGATCCAACACTCTAGGCGGACCCGCTCACAGTCATTTCAGGACAATCACCACAGGAATCAACTACTTCTCCCAGTCTTCCTTGCGTGAAGCTTCAAGCCTACAACATAACACTTCTTACTTAATCTTTGATTCTCGAATTGTTTACCCAATCTTGACAACTTAGCCTAAGCAATACTCTGGGGTTATATATAGCAATTGCTCTTCCTCGCTGTAGCGTTCATTCCATCTTTCTA |
PTAL1-2 | PP7435_Chr2 (644082...645082) | (SEQ ID NO:46) GATATCGATCTACACTTAATAGTAGATGACGAGGCATCTCTCCAATAGGTACCATATCTGGTGTTTCTTGTAATTTAAGAATCTGTTGGTCTATGAATGTAGATTTGTCATGAACAATGATATATGGGTCAGGAGGACAAGATGGTTTCTCTGAGTTGGGTTGTTGAGGTGCCTGGCAAGACTTCGGAGCGTTGATATCCCCAAGACTTGTAGTGACCGATAGTTGAAGCGTGTGTTTGCAGGAACGGCACATCAATGCAACTTTCGTAACTTTGGAATTGAGAGTTGATGCACTGATGACGATACCCGAAATTTTGACGATTTTACCAATATGACTTGAAGACAAGTCTCTCATTGAAACCTTATTATCGTTACTAAGCAAAACGAGCTGACAAGAAGGGAAGGTGGTCGGTATTTCCTCGTTGTTCAAATATATGATTCTCCTGGCAATATCTGTGATGGCCTGTTCAAAAAGTGGAATCATTTCTGCAGGATCATCTACCAACTTTTTATTGAGCTCCTCATTGAATACGATTAAGTGGTCATTTTGAATCGTCAGTAAGTACTTGTTTACAAGTAAATTCTGTCTGAGTTGTTCTCTGTAGATGTACTGATTTTCCATACGAAACTCCAAAATGAACGAACGGAATGCCTTAATGACCTCACTGAACTGGTCATCGTTCTGTTCTCCGGGAAGGACACTTGTGTTAAAGACTGATGCTCTATCAAAGGACATTGCAACAAAGTATAAACGGTTGTGAGCGGGAAAAAGATGTGTAGGTAATTGTCGTAGATGAGACTGATTCAGTAGAAAACGCGTCCTGCACTATTTTTTTCTTTCTTCATTACATTTCCTAATCGGGACAAAATGAATCTAAAGACGTGGTTATGTAGTACACGCATCGATAGGCTATCCCCATACCAAAACACTATTTTACCCCATCCTTGACAGGTTATAAATATGCGATAGTATGAGTATCTTCAAATTCAGCTGAAATATC |
PDAS2 | PP7435_Chr3(633689-634688) | SEQ ID NO:47) AATAAAAAAACGTTATAGAAAGAAATTGGACTACGATATGCTCCAATCCAAATTGTCAAAATTGACCACCGAAAAAGAACAATTGGAATTTGACAAGAGGAACAACTCACTAGATTCTCAAACGGAGCGTCACCTAGAGTCAGTTTCCAAGTCAATTACAGAAAGTTTGGAAACAGAAGAGGAGTATCTACAATTGAATTCCAAACTTAAAGTCGAGCTGTCCGAATTCATGTCGCTAAGGCTTTCTTACTTGGACCCCATTTTTGAAAGTTTCATTAAAGTTCAGTCAAAAATTTTCATGGACATTTATGACACATTAAAGAGCGGACTACCTTATGTTGATTCTCTATCCAAAGAGGATTATCAGTCCAAGATCTTGGACTCTAGAATAGATAACATTCTGTCGAAAATGGAAGCGCTGAACCTTCAAGCTTACATTGATGATTAGAGCAATGATATAAACAACAATTGAGTGACAGGTCTACTTTGTTCTCAAAAGGCCATAACCATCTGTTTGCATCTCTTATCACCACACCATCCTCCTCATCTGGCCTTCAATTGTGGGGAACAACTAGCATCCCAACACCAGACTAACTCCACCCAGATGAAACCAGTTGTCGCTTACCAGTCAATGAATGTTGAGCTAACGTTCCTTGAAACTCGAATGATCCCAGCCTTGCTGCGTATCATCCCTCCGCTATTCCGCCGCTTGCTCCAACCATGTTTCCGCCTTTTTCGAACAAGTTCAAATACCTATCTTTGGCAGGACTTTTCCTCCTGCCTTTTTTAGCCTCAGGTCTCGGTTAGCCTCTAGGCAAATTCTGGTCTTCATACCTATATCAACTTTTCATCAGATAGCCTTTGGGTTCAAAAAAGAACTAAAGCAGGATGCCTGATATATAAATCCCAGATGATCTGCTTTTGAAACTATTTTCAGTATCTTGATTCGTTTACTTACAAACAACTATTGTTGATTTTATCTGGAGAATAATCGAACAAA |
PCAM1 | PP7435_Chr3(178828-179827) | SEQ ID NO:48) ATTGTTGTGAATACTCTCCTTCATTTGGATTTCTTGGACTTCGGACTCTCTTGATCTCTCTTCGAAAGTTTTAACTCTGTTCATGTATAATTTTACCCGCTGTAGGTCGCTCATAATACCATGAGTATGCACATCTTTTACTCCATTAACTTTCAGGTATGCAAAATACAATGAAGATAGTATATAGCTCAAAGAATTTAGCATTTTGCATTGATCTAATTGTGACATTTTCTCTATGATATCATCTAGCTTCTTAAACTCGAGAATCTCGTCCAACGAGGCAGAAACATTGTCCAGTCTTACGTCAAGATTATTCACGAGTTTCTGGACCGTATCAACGTTTTCCATCTTAAGATTACAGTAAGTATCGTCCTTTTGAACTGCAAAGGTAGAAAAGTTAATTTTTGATTTGGTAGTACACTATGAAACTTGCTCACCCCAATCTTTCCTCCTGACAGGTTGATCTTTATCCCTCTACTAAATTGCCCCAAGTGTATCAAGTAGACTAGATCTCGCGAAAGAACAGCCTAATAAACTCCGAAGCATGATGGCCTCTATCCGGAAAACGTTAAGAGATGTGGCAACAGGAGGGCACATAGAATTTTTAAAGACGCTGAAGAATGCTATCATAGTCCGTAAAAATGTGATAGTACTTTGTTTAGTGCGTACGCCACTTATTCGGGGCCAATAGCTAAACCCAGGTTTGCTGGCAGCAAATTCAACTGTAGATTGAATCTCTCTAACAATAATGGTGTTCAATCCCCTGGCTGGTCACGGGGAGGACTATCTTGCGTGATCCGCTTGGAAAATGTTGTGTATCCCTTTCTCAATTGCGGAAAGCATCTGCTACTTCCCATAGGCACCAGTTACCCAATTGATATTTCCAAAAAAGATTACCATATGTTCATCTAGAAGTATAAATACAAGTGGACATTCAATGAATATTTCATTCAATTAGTCATTGACACTTTCATCAACTTACTACGTCTTATTCAACAAT |
P PP7435_Chr1-0336 | PP7435_Chr1(615194-615193) | SEQ ID NO:49) TATACGGTCTATCCACTTTGGAAACGATGTAGTTGAAACGGGGAAGTAATAGTGGTTCCCAAACGACATGAAGAGGTTATATAAGTTTGCAAGAGGGTGACACCATTTTAGTTGTGGTTCCCGGGTATTTTTTTAATCTTTTTAGTCTAAGATAGCCTCCCCAGATATTACCGAGTTGGGCCATTTGGGGCGGTATCGGTGGTATCTGATGGTAGCGCGTTTTTACATGCCTGTGCATTGAACTGGCAAAGAGTATACTATCGTGGGGCCCTGAAGGAGGCAGCAAATGGACCGTCAATTGGTTGATCAGGGACTCAAGACAGGTATTGAGCTTTTCAAACAAAAAGAGTATAGGCGCTGCTACAAGGCATTTACTTCTACTATCAATTTCATTGAGAATGATCCCGAGTTGGCCGCCAGCTGTGTATCTCAACTGATATCTCTGTTAGATTGTAGGGCAGCCTGTTTGGAAAAGCTAGATCAATTGAATATGGCCTTGAAAGATGGTCTTAAAATGATCAAGAGAGAGTGCCACAACTGCAAGGGTTATTTGAGAACTTGCAAAATTTTAGACCTACAAGGGAAGATCAGTGAGGCTTTGTCTACAGCAAGAGAAGGGATCTCCATAATAGAAACTAGAAGAGATCAGGATAATCAATTTAGATATTCCAAGGTTCTTTTGGAACAATTAAAGGAACTGAAAAATGCACTGAAAATCAAATTGGACAAGAAAAATCAGCTACACTTCAAAGTTTTAAAGTTTGACGCACCAGTGCCTTGTACAAAGAAACTAAGATTAGTCACTCCAAGAACAATAGATCCTTCCATTTTTTTGCCGATAGAGCTAGTGAAGCTGATCTTTCGCCTGTTGAATTTCTCAGACATGTATGCCTGTTTATTGGTCTCAACAAAATGGAACTCAATTATATCCTCATCACCGGAACTGTTTCGAAAACTTCAGTTGAAATCCCAACTGTCCAACAAGGCGTTAAACAATTGT |
References:
Ata, O., Prielhofer, R., Gasser, B., Mattanovich, D., & Calik, P. (2017). Transcriptional engineering of the glyceraldehyde-3-phosphate dehydrogenase promoter for improved heterologous protein production in Pichia pastoris: Transcriptional Engineering of the P GAP for Gene Overexpression in P. pastoris. Biotechnology and Bioengineering, 114(10), 2319-2327. https://doi.org/10.1002/bit.26363
Aw, R., & Polizzi, K. M. (2013). Can too many copies spoil the broth? Microbial Cell Factories, 12, 128. https://doi.org/10.1186/1475-2859-12-128
Blumhoff, M., Steiger, M. G., Marx, H., Mattanovich, D., & Sauer, M. (2013). Six novel constitutive promoters for metabolic engineering of Aspergillus niger. Applied Microbiology and Biotechnology, 97(1), 259-267. https://doi.org/10.1007/s00253-012-4207-9
Gasser, B., Prielhofer, R., Marx, H., Maurer, M., Nocon, J., Steiger, M., Mattanovich, D. (2013). Pichia pastoris: protein production host and model organism for biomedical research. Future Microbiology, 8(2), 191-208. https://doi.org/10.2217/fmb.12.133
Gasser, B., Steiger, M. G., & Mattanovich, D. (2015). Methanol regulated yeast promoters: production vehicles and toolbox for synthetic biology. Microbial Cell Factories, 14(1). https://doi.org/10.1186/s12934-015-0387-1
Hohenblum, H., Borth, N., & Mattanovich, D. (2003). Assessing viability and cell-associated product of recombinant protein producing Pichia pastoris with flow cytometry. Journal of Biotechnology, 102(3), 281-290. https://doi.org/10.1016/S0168-1656(03)00049-X
Looser, V., Bruhlmann, B., Bumbak, F., Stenger, C., Costa, M., Camattari, A., Kovar, K. (2015). Cultivation strategies to enhance productivity of Pichia pastoris: A review. Biotechnology Advances, 33(6), 1177-1193. https://doi.org/10.1016/j.biotechadv.2015.05.008
Marx, H., Mattanovich, D., & Sauer, M. (2008). Overexpression of the riboflavin biosynthetic pathway in Pichia pastoris. Microbial Cell Factories, 7(1), 23. https://doi.org/10.1186/1475-2859-7-23
Mellitzer, A., Ruth, C., Gustafsson, C., Welch, M., Birner-Grnberger, R., Weis, R., Glieder, A. (2014). Synergistic modular promoter and gene optimization to push cellulase secretion by Pichia pastoris beyond existing benchmarks. Journal of Biotechnology, 191, 187-195. https://doi.org/10.1016/j.jbiotec.2014.08.035
Nocon, J., Steiger, M. G., Pfeffer, M., Sohn, S. B., Kim, T. Y., Maurer, M., Mattanovich, D. (2014). Model based engineering of Pichia pastoris central metabolism enhances recombinant protein production. Metabolic Engineering, 24, 129-138. https://doi.org/10.1016/j.ymben.2014.05.011
Prielhofer, R., Barrero, J. J., Steuer, S., Gassler, T., Zahrl, R., Baumann, K., Marx, H. (2017). GoldenPiCS: a Golden Gate-derived modular cloning system for applied synthetic biology in the yeast Pichia pastoris. BMC Systems Biology, 11(1). https://doi.org/10.1186/s12918-017-0492-3
Prielhofer, R., Maurer, M., Klein, J., Wenger, J., Kiziak, C., Gasser, B., & Mattanovich, D. (2013). Induction without methanol: novel regulated promoters enable high-level expression in Pichia pastoris. Microbial Cell Factories, 12(1), 5. https://doi.org/10.1186/1475-2859-12-5
Schwarzhans, J.-P., Wibberg, D., Winkler, A., Luttermann, T., Kalinowski, J., & Friehs, K. (2016). Integration event induced changes in recombinant protein productivity in Pichia pastoris discovered by whole genome sequencing and derived vector optimization. Microbial Cell Factories, 15, 84. https://doi.org/10.1186/s12934-016-0486-7
Stadlmayr, G., Mecklenbrauker, A., Rothmuller, M., Maurer, M., Sauer, M., Mattanovich, D., & Gasser, B. (2010). Identification and characterisation of novel Pichia pastoris promoters for heterologous protein production. Journal of Biotechnology, 150(4), 519-529. https://doi.org/10.1016/j.jbiotec.2010.09.957
<110> Lonza Ltd
<120> MUT- METHYLOTROPHIC YEAST
<130> F21-8761-AT
<150> PCT/EP 2019/058190
<151> 2019-04-01
<150> PCT/EP 2019058191
<151> 2019-04-01
<160> 85
<170> KoPatentIn 3.0
<210> 1
<211> 663
<212> PRT
<213> Unknown
<220>
<223> Komagataella phaffii
<400> 1
Met Ala Ile Pro Glu Glu Phe Asp Ile Leu Val Leu Gly Gly Gly Ser
1 5 10 15
Ser Gly Ser Cys Ile Ala Gly Arg Leu Ala Asn Leu Asp His Ser Leu
20 25 30
Lys Val Gly Leu Ile Glu Ala Gly Glu Asn Asn Leu Asn Asn Pro Trp
35 40 45
Val Tyr Leu Pro Gly Ile Tyr Pro Arg Asn Met Lys Leu Asp Ser Lys
50 55 60
Thr Ala Ser Phe Tyr Thr Ser Asn Pro Ser Pro His Leu Asn Gly Arg
65 70 75 80
Arg Ala Ile Val Pro Cys Ala Asn Ile Leu Gly Gly Gly Ser Ser Ile
85 90 95
Asn Phe Met Met Tyr Thr Arg Gly Ser Ala Ser Asp Tyr Asp Asp Phe
100 105 110
Glu Ala Glu Gly Trp Lys Thr Lys Asp Leu Leu Pro Leu Met Lys Lys
115 120 125
Thr Glu Thr Tyr Gln Arg Ala Cys Asn Asn Pro Glu Ile His Gly Phe
130 135 140
Glu Gly Pro Ile Lys Val Ser Phe Gly Asn Tyr Thr Tyr Pro Val Cys
145 150 155 160
Gln Asp Phe Leu Arg Ala Thr Glu Ser Gln Gly Ile Pro Tyr Val Asp
165 170 175
Asp Leu Glu Asp Leu Val Thr Ala His Gly Ala Glu His Trp Leu Lys
180 185 190
Trp Ile Asn Arg Asp Thr Gly Arg Arg Ser Asp Ser Ala His Ala Phe
195 200 205
Val His Ser Thr Met Arg Asn His Asp Asn Leu Tyr Leu Ile Cys Asn
210 215 220
Thr Lys Val Asp Lys Ile Ile Val Glu Asp Gly Arg Ala Ala Ala Val
225 230 235 240
Arg Thr Val Pro Ser Lys Pro Leu Asn Ala Lys Lys Pro Thr His Lys
245 250 255
Val Tyr Arg Ala Arg Lys Gln Ile Val Leu Ser Cys Gly Thr Ile Ser
260 265 270
Ser Pro Leu Val Leu Gln Arg Ser Gly Phe Gly Asp Pro Ile Lys Leu
275 280 285
Arg Ala Ala Gly Val Lys Pro Leu Val Asn Leu Pro Gly Val Gly Arg
290 295 300
Asn Phe Gln Asp His Tyr Cys Phe Phe Ser Pro Tyr Arg Ile Lys Pro
305 310 315 320
Gln Tyr Glu Ser Phe Asp Asp Phe Val Arg Gly Asp Ala Asn Ile Gln
325 330 335
Lys Lys Val Phe Asp Gln Trp Tyr Ala Asn Gly Thr Gly Pro Leu Ala
340 345 350
Thr Asn Gly Ile Glu Ala Gly Val Lys Ile Arg Pro Thr Pro Glu Glu
355 360 365
Leu Ser Gln Met Asp Glu Ser Phe Gln Glu Gly Tyr Arg Glu Tyr Phe
370 375 380
Glu Asp Lys Pro Asp Lys Pro Val Met His Tyr Ser Ile Ile Ala Gly
385 390 395 400
Phe Phe Gly Asp His Thr Lys Ile Pro Pro Gly Lys Tyr Met Thr Met
405 410 415
Phe His Phe Leu Glu Tyr Pro Phe Ser Arg Gly Ser Ile His Ile Thr
420 425 430
Ser Pro Asp Pro Tyr Ala Thr Pro Asp Phe Asp Pro Gly Phe Met Asn
435 440 445
Asp Glu Arg Asp Met Ala Pro Met Val Trp Ser Tyr Lys Lys Ser Arg
450 455 460
Glu Thr Ala Arg Lys Met Asp His Phe Ala Gly Glu Val Thr Ser His
465 470 475 480
His Pro Leu Phe Pro Tyr Ser Ser Glu Ala Arg Ala Tyr Glu Met Asp
485 490 495
Leu Glu Thr Ser Asn Ala Tyr Gly Gly Pro Leu Asn Leu Thr Ala Gly
500 505 510
Leu Ala His Gly Ser Trp Thr Gln Pro Leu Lys Lys Pro Ala Gly Arg
515 520 525
Asn Glu Gly His Val Thr Ser Asn Gln Val Glu Leu His Pro Asp Ile
530 535 540
Glu Tyr Asp Glu Glu Asp Asp Lys Ala Ile Glu Asn Tyr Ile Arg Glu
545 550 555 560
His Thr Glu Thr Thr Trp His Cys Leu Gly Thr Cys Ser Ile Gly Pro
565 570 575
Arg Glu Gly Ser Lys Ile Val Lys Trp Gly Gly Val Leu Asp His Arg
580 585 590
Ser Asn Val Tyr Gly Val Lys Gly Leu Lys Val Gly Asp Leu Ser Val
595 600 605
Cys Pro Asp Asn Val Gly Cys Asn Thr Tyr Thr Thr Ala Leu Leu Ile
610 615 620
Gly Glu Lys Thr Ala Thr Leu Val Gly Glu Asp Leu Gly Tyr Thr Gly
625 630 635 640
Glu Ala Leu Asp Met Thr Val Pro Gln Phe Lys Leu Gly Thr Tyr Glu
645 650 655
Lys Thr Gly Leu Ala Arg Phe
660
<210> 2
<211> 1992
<212> DNA
<213> Unknown
<220>
<223> Komagataella phaffii
<400> 2
atggctatcc ccgaagagtt tgatatccta gttctaggtg gtggatccag tggatcctgt 60
attgccggaa gattggcaaa cttggaccac tccttgaaag ttggtcttat cgaagcaggt 120
gagaacaacc tcaacaaccc atgggtctac cttccaggta tttacccaag aaacatgaag 180
ttggactcca agactgcttc cttctacact tctaacccat ctcctcactt gaatggtaga 240
agagccattg ttccatgtgc taacgtcttg ggtggtggtt cttctatcaa cttcatgatg 300
tacaccagag gttctgcttc tgattacgat gacttccaag ccgagggctg gaaaaccaag 360
gacttgcttc cattgatgaa aaagactgag acctaccaaa gagcttgcaa caaccctgac 420
attcacggtt tcgaaggtcc aatcaaggtt tctttcggta actacaccta cccagtttgc 480
caggacttct tgagggcttc tgagtcccaa ggtattccat acgttgacga cttggaagac 540
ttggttactg ctcacggtgc tgaacactgg ttgaagtgga tcaacagaga cactggtcgt 600
cgttccgact ctgctcatgc atttgtccac tctactatga gaaaccacga caacttgtac 660
ttgatctgta acacgaaggt cgacaaaatt attgtcgaag acggaagagc tgctgctgtt 720
agaaccgttc caagcaagcc tttgaaccca aagaagccaa gtcacaagat ctaccgtgct 780
agaaagcaaa tcgttttgtc ttgtggtacc atctcctctc cattggtttt gcaaagatcc 840
ggttttggtg acccaatcaa gttgagagcc gctggtgtta agcctttggt caacttgcca 900
ggtgtcggaa gaaacttcca agaccactac tgtttcttca gtccttacag aatcaagcct 960
cagtacgagt ctttcgatga cttcgtccgt ggtgatgctg agattcaaaa gagagtcttt 1020
gaccaatggt acgccaatgg tactggtcct cttgccacta acggtatcga agctggtgtc 1080
aagatcagac caacaccaga agaactctct caaatggacg aatccttcca ggagggttac 1140
agagaatact tcgaagacaa gccagacaag ccagttatgc actactccat cattgctggt 1200
ttcttcggtg accacaccaa gattcctcct ggaaagtaca tgactatgtt ccacttcttg 1260
gaatacccat tctccagagg ttccattcac attacctccc cagacccata cgcagctcca 1320
gacttcgacc caggtttcat gaacgatgaa agagacatgg ctcctatggt ttgggcttac 1380
aagaagtcta gagaaaccgc tagaagaatg gaccactttg ccggtgaggt cacttctcac 1440
caccctctgt tcccatactc atccgaggcc agagccttgg aaatggattt ggagacctct 1500
aatgcctacg gtggaccttt gaacttgtct gctggtcttg ctcacggttc ttggactcaa 1560
cctttgaaga agccaactgc aaagaacgaa ggccacgtta cttcgaacca ggtcgagctt 1620
catccagaca tcgagtacga tgaggaggat gacaaggcca ttgagaacta cattcgtgag 1680
cacactgaga ccacatggca ctgtctggga acctgttcca tcggtccaag agaaggttcc 1740
aagatcgtca aatggggtgg tgttttggac cacagatcca acgtttacgg agtcaagggc 1800
ttgaaggttg gtgacttgtc cgtgtgccca gacaatgttg gttgtaacac ctacaccacc 1860
gctcttttga tcggtgaaaa gactgccact ttggttggag aagatttagg atactctggt 1920
gaggccttag acatgactgt tcctcagttc aagttgggca cttacgagaa gaccggtctt 1980
gctagattct aa 1992
<210> 3
<211> 663
<212> PRT
<213> Unknown
<220>
<223> Komagataella phaffii
<400> 3
Met Ala Ile Pro Glu Glu Phe Asp Ile Leu Val Leu Gly Gly Gly Ser
1 5 10 15
Ser Gly Ser Cys Ile Ala Gly Arg Leu Ala Asn Leu Asp His Ser Leu
20 25 30
Lys Val Gly Leu Ile Glu Ala Gly Glu Asn Asn Leu Asn Asn Pro Trp
35 40 45
Val Tyr Leu Pro Gly Ile Tyr Pro Arg Asn Met Lys Leu Asp Ser Lys
50 55 60
Thr Ala Ser Phe Tyr Thr Ser Asn Pro Ser Pro His Leu Asn Gly Arg
65 70 75 80
Arg Ala Ile Val Pro Cys Ala Asn Ile Leu Gly Gly Gly Ser Ser Ile
85 90 95
Asn Phe Met Met Tyr Thr Arg Gly Ser Ala Ser Asp Tyr Asp Asp Phe
100 105 110
Glu Ala Glu Gly Trp Lys Thr Lys Asp Leu Leu Pro Leu Met Lys Lys
115 120 125
Thr Glu Thr Tyr Gln Arg Ala Cys Asn Asn Pro Glu Ile His Gly Phe
130 135 140
Glu Gly Pro Ile Lys Val Ser Phe Gly Asn Tyr Thr Tyr Pro Val Cys
145 150 155 160
Gln Asp Phe Leu Arg Ala Thr Glu Ser Gln Gly Ile Pro Tyr Val Asp
165 170 175
Asp Leu Glu Asp Leu Val Thr Ala His Gly Ala Glu His Trp Leu Lys
180 185 190
Trp Ile Asn Arg Asp Thr Gly Arg Arg Ser Asp Ser Ala His Ala Phe
195 200 205
Val His Ser Thr Met Arg Asn His Asp Asn Leu Tyr Leu Ile Cys Asn
210 215 220
Thr Lys Val Asp Lys Ile Ile Val Glu Asp Gly Arg Ala Ala Ala Val
225 230 235 240
Arg Thr Val Pro Ser Lys Pro Leu Asn Ala Lys Lys Pro Thr His Lys
245 250 255
Val Tyr Arg Ala Arg Lys Gln Ile Val Leu Ser Cys Gly Thr Ile Ser
260 265 270
Ser Pro Leu Val Leu Gln Arg Ser Gly Phe Gly Asp Pro Ile Lys Leu
275 280 285
Arg Ala Ala Gly Val Lys Pro Leu Val Asn Leu Pro Gly Val Gly Arg
290 295 300
Asn Phe Gln Asp His Tyr Cys Phe Phe Ser Pro Tyr Arg Ile Lys Pro
305 310 315 320
Gln Tyr Glu Ser Phe Asp Asp Phe Val Arg Gly Asp Ala Asn Ile Gln
325 330 335
Lys Lys Val Phe Asp Gln Trp Tyr Ala Asn Gly Thr Gly Pro Leu Ala
340 345 350
Thr Asn Gly Ile Glu Ala Gly Val Lys Ile Arg Pro Thr Pro Glu Glu
355 360 365
Leu Ser Gln Met Asp Glu Ser Phe Gln Glu Gly Tyr Arg Glu Tyr Phe
370 375 380
Glu Asp Lys Pro Asp Lys Pro Val Met His Tyr Ser Ile Ile Ala Gly
385 390 395 400
Phe Phe Gly Asp His Thr Lys Ile Pro Pro Gly Lys Tyr Met Thr Met
405 410 415
Phe His Phe Leu Glu Tyr Pro Phe Ser Arg Gly Ser Ile His Ile Thr
420 425 430
Ser Pro Asp Pro Tyr Ala Thr Pro Asp Phe Asp Pro Gly Phe Met Asn
435 440 445
Asp Glu Arg Asp Met Ala Pro Met Val Trp Ser Tyr Lys Lys Ser Arg
450 455 460
Glu Thr Ala Arg Lys Met Asp His Phe Ala Gly Glu Val Thr Ser His
465 470 475 480
His Pro Leu Phe Pro Tyr Ser Ser Glu Ala Arg Ala Tyr Glu Met Asp
485 490 495
Leu Glu Thr Ser Asn Ala Tyr Gly Gly Pro Leu Asn Leu Thr Ala Gly
500 505 510
Leu Ala His Gly Ser Trp Thr Gln Pro Leu Lys Lys Pro Ala Gly Arg
515 520 525
Asn Glu Gly His Val Thr Ser Asn Gln Val Glu Leu His Pro Asp Ile
530 535 540
Glu Tyr Asp Glu Glu Asp Asp Lys Ala Ile Glu Asn Tyr Ile Arg Glu
545 550 555 560
His Thr Glu Thr Thr Trp His Cys Leu Gly Thr Cys Ser Ile Gly Pro
565 570 575
Arg Glu Gly Ser Lys Ile Val Lys Trp Gly Gly Val Leu Asp His Arg
580 585 590
Ser Asn Val Tyr Gly Val Lys Gly Leu Lys Val Gly Asp Leu Ser Val
595 600 605
Cys Pro Asp Asn Val Gly Cys Asn Thr Tyr Thr Thr Ala Leu Leu Ile
610 615 620
Gly Glu Lys Thr Ala Thr Leu Val Gly Glu Asp Leu Gly Tyr Thr Gly
625 630 635 640
Glu Ala Leu Asp Met Thr Val Pro Gln Phe Lys Leu Gly Thr Tyr Glu
645 650 655
Lys Thr Gly Leu Ala Arg Phe
660
<210> 4
<211> 1992
<212> DNA
<213> Unknown
<220>
<223> Komagataella phaffii
<400> 4
atggccattc ctgaagaatt cgatattctt gtcctgggtg gtggatccag tggatcctgt 60
attgccggaa gattggccaa cttggaccac tccttgaaag ttggtcttat cgaggctggt 120
gagaacaatc ttaacaaccc atgggtctac cttccaggta tttacccaag aaacatgaag 180
ttggactcca aaactgcttc tttctacacc tccaaccctt ctcctcattt gaatggtaga 240
agagctattg tcccatgtgc caacatcttg ggtggtggtt cttcgatcaa cttcatgatg 300
tacaccagag gttccgcttc tgattacgat gactttgaag ctgagggatg gaagaccaag 360
gatttgcttc ctttgatgaa gaagactgag acttaccaaa gagcttgcaa caaccctgaa 420
attcacggtt ttgaaggtcc aatcaaggtt tctttcggta actacactta cccagtttgt 480
caagacttct tgagagcaac tgaatcccaa ggtattccat acgttgacga cttggaagac 540
ttggtgactg ctcatggtgc tgaacactgg ctgaaatgga tcaacagaga cactggtcgt 600
cgttccgact ctgctcatgc cttcgttcat tctacgatga gaaaccacga caatctgtac 660
ttgatctgca acaccaaagt tgacaagatt attgttgaag acggaagagc tgctgctgtc 720
agaaccgttc caagtaaacc tttgaacgca aagaagccaa ctcacaaggt ttatcgtgct 780
agaaagcaaa tcgttttgtc ttgtggtacc atctcttctc ctctggttct gcaaagatcc 840
ggttttggtg acccaatcaa attgagagcc gctggtgtta agcctttggt caacttgcca 900
ggtgttggaa gaaacttcca agaccactac tgcttcttct ctccttacag aattaagccc 960
caatacgagt ctttcgatga cttcgtacgt ggtgacgcta acattcaaaa gaaggtattc 1020
gaccaatggt acgctaacgg tactggtcca ttggccacca acggtattga agccggtgtc 1080
aagattagac caactccaga agaattatct cagatggacg agtccttcca agagggttac 1140
agagagtact tcgaagacaa accagacaag ccagttatgc actattccat cattgctggt 1200
ttcttcggtg accacaccaa gattccacct ggaaagtaca tgaccatgtt ccacttcttg 1260
gagtacccat tctccagagg ttctatccac atcacctctc cagacccata cgcaactcca 1320
gactttgacc caggtttcat gaacgatgaa agagacatgg ctcctatggt ctggtcttac 1380
aagaagtcca gagagactgc cagaaaaatg gaccactttg ctggtgaggt tacttcccac 1440
caccctctgt tcccatactc atccgaggcc agagcttacg agatggattt ggagacctcc 1500
aacgcctacg gtggaccact gaacttgact gctggtcttg ctcacggttc ttggactcag 1560
cctttgaaga agcctgctgg aagaaacgaa ggacatgtta cttccaacca agtcgagctt 1620
catccagaca ttgagtacga tgaggaggat gataaggcca ttgagaacta cattcgtgag 1680
cacactgaga ccacatggca ctgtctggga acctgttcca ttggtccaag agagggttcc 1740
aagatcgtca aatggggtgg tgttttggat cacagatcta acgtttacgg agtcaagggc 1800
ctgaaggttg gtgacttgtc cgtctgtcca gacaatgttg gttgtaacac ctacaccacc 1860
gctcttttga tcggtgaaaa gactgccacc ttggttggtg aagacttagg atacacaggt 1920
gaggccttag acatgactgt acctcagttc aagttgggca cttacgagaa gactggtctt 1980
gctagattct ag 1992
<210> 5
<211> 1000
<212> DNA
<213> Unknown
<220>
<223> Komagataella phaffii
<400> 5
catgttggta ttgtgaaata gacgcagatc gggaacactg aaaaataaca gttattattc 60
gagatctaac atccaaagac gaaaggttga atgaaacctt tttgccatcc gacatccaca 120
ggtccattct cacacataag tgccaaacgc aacaggaggg gatacactag cagcagaccg 180
ttgcaaacgc aggacctcca ctcctcttct cctcaacacc cacttttgcc atcgaaaaac 240
cagcccagtt attgggcttg attggagctc gctcattcca attccttcta ttaggctact 300
aacaccatga ctttattagc ctgtctatcc tggcccccct ggcgaggttc atgtttgttt 360
atttccgaat gcaacaagct ccgcattaca cccgaacatc actccagatg agggctttct 420
gagtgtgggg tcaaatagtt tcatgttccc caaatggccc aaaactgaca gtttaaacgc 480
tgtcttggaa cctaatatga caaaagcgtg atctcatcca agatgaacta agtttggttc 540
gttgaaatgc taacggccag ttggtcaaaa agaaacttcc aaaagtcggc ataccgtttg 600
tcttgtttgg tattgattga cgaatgctca aaaataatct cattaatgct tagcgcagtc 660
tctctatcgc ttctgaaccc cggtgcacct gtgccgaaac gcaaatgggg aaacacccgc 720
tttttggatg attatgcatt gtctccacat tgtatgcttc caagattctg gtgggaatac 780
tgctgatagc ctaacgttca tgatcaaaat ttaactgttc taacccctac ttgacagcaa 840
tatataaaca gaaggaagct gccctgtctt aaaccttttt tttatcatca ttattagctt 900
actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 960
caacttgaga agatcaaaaa acaactaatt attcgaaacg 1000
<210> 6
<211> 1000
<212> DNA
<213> Unknown
<220>
<223> Komagataella phaffii
<400> 6
gcttaaagga ctccatttcc taaaatttca agcagtcctc tcaactaaat ttttttccat 60
tcctctgcac ccagccctct tcatcaaccg tccagccttc tcaaaagtcc aatgtaagta 120
gcctgcaaat tcaggttaca acccctcaat tttccatcca agggcgatcc ttacaaagtt 180
aatatcgaac agcagagact aagcgagtca tcatcaccac ccaacgatgg tgaaaaactt 240
taagcataga ttgatggagg gtgtatggca cttggcggct gcattagagt ttgaaactat 300
ggggtaatac atcacatccg gaactgatcc gactccgaga tcatatgcaa agcacgtgat 360
gtaccccgta aactgctcgg attatcgttg caattcatcg tcttaaacag tacaagaaac 420
tttattcatg ggtcattgga ctctgatgag gggcacattt ccccaatgat tttttgggaa 480
agaaagccgt aagaggacag ttaagcgaaa gagacaagac aacgaacagc aaaagtgaca 540
gctgtcagct acctagtgga cagttgggag tttccaattg gttggttttg aatttttacc 600
catgttgagt tgtccttgct tctccttgca aacaatgcaa gttgataaga catcaccttc 660
caagataggc tatttttgtc gcataaattt ttgtctcgga gtgaaaaccc cttttatgtg 720
aacagattac agaagcgtcc tacccttcac cggttgagat ggggagaaaa ttaagcgatg 780
aggagacgat tattggtata aaagaagcaa ccaaaatccc ttattgtcct tttctgatca 840
gcatcaaaga atattgtctt aaaacgggct tttaactaca ttgttcttac acattgcaaa 900
cctcttcctt ctatttcgga tcaactgtat tgactacatt gatctttttt aacgaagttt 960
acgacttact aaatccccac aaacaaatca actgagaaaa 1000
<210> 7
<211> 1000
<212> DNA
<213> Unknown
<220>
<223> Komagataella pastoris
<400> 7
atatcgtgaa atagacccaa atccggacac tgtgaaataa aacagttagt atgcgaaatc 60
taacatccaa gaacgagaaa ctaaataaga cattttgcca tccgacatct acaaaccaca 120
tcaccctcac acataagtgc caaaacgcag caggagggac acccagcagc agaagccgtg 180
tcgaacgcag gacctccact tctcttctcc tcaacatcca ctttcgttat tgaaaaccag 240
cctgcttaaa aaaactgatt ggagctcgct cattccagtc ccctttgtta ggctactaag 300
accacgactt tattagcctg tccattctgg ttcctggcga gacttattct tgtttgttta 360
ttttcgaatg caacaaagct ccgcattaca tccgaacatc actttagatg agggctttct 420
gagtgtgggg tcgaatagtt tcatgttccc ccaatggccc aaaactgaca ctttaaacgc 480
tgtcttcgaa cttaatatgg caaaagcgtg atctcatcca agacgaacta agtttggttc 540
gttgaaatgc taacggccag ttggtcaaaa agaaacttcc aaaagtcggc atatcgtttg 600
tcttgtttgg tattcataga cgaatgctca agaatattct cattaatgct tagcgcagtc 660
tctgtatcgc ttctggaccc cggtgcagtt gtgccgaaac gcaaatgggg aaacacccgc 720
ttttcggatg attatgcatt gtctccacat tgtatgcttc caagattctg gtgggaatac 780
tactgatagc ctaacgttca tgatcaatat caaactgttc taacccctac ttgaactgca 840
atatataaac aggaggaaac ttcccagtcg aaaaccttct ttcatcatca ttattagctt 900
actttcataa ttgtgactgg ttccaattga caagcttttg attctaacga cttttaacga 960
caatttgaga agatcaaaaa acaactaatt attcgaaacg 1000
<210> 8
<211> 1000
<212> DNA
<213> Unknown
<220>
<223> Komagataella pastoris
<400> 8
gcttgcacga ctcagttacc tgaaaatttc agcctgtcct ctttaataaa atttcacccg 60
ttcctctgca tgtccactca gctctattca tctatccttg agccttctcg agcgtctaat 120
gaacagcctg cgaattcagg ttacaacccc tcattttttc gtctcggtcg atctctacaa 180
agtcaacagc caactttgat gttaagcgag tcatcaccag ccagcgatag tgaaaaactt 240
taagcataga ttgatggtgg gtttatgtca cttggcggct gcattagagt ttgaaactat 300
ggggtaatgc atcacatccg gaactgatcc gactcggaga tcatatgcaa accacgtgat 360
gtaccccgta aactgctcgg attactgttc caattcatcg tcttaaacag tataagaaac 420
tttattcatg ggtcattgga ctctgatgag gggcacattt ccccattgat ttttgggaca 480
gtaagccata aaaggactgt taagcgaagc agacaagaca acgaacagct agaataacaa 540
ctatctaccg ccttgtggac cgttgggagt ttccaattgg ttggttttgg atttctgagc 600
ccatgttgtg ttgtccatgc ttctccttgc acacaatgca agttgataag atatcacctt 660
ccaagatagg ctatttttgt cgcataaatt ttggtctcag agtgaaaccc ccttttatgt 720
gaacggatta gagaagcctc ctacccttca ccggctgaga tggggagaaa ttaagcgatg 780
aggagacgat aattgctata aaagaagcaa ccaaaacccc ttattgtctc tttctgatca 840
gcatcaaaga atattgtctt aaaacgggct tttaactaca ttgttcttac acattgcaaa 900
cctcctcctt caatttcgga tcagctgtat tgactacatt gatctttttt aacgaagttc 960
acgacttact aaatccccat aaacaaacca actgagaaaa 1000
<210> 9
<211> 663
<212> PRT
<213> Unknown
<220>
<223> Komagataella pastoris
<400> 9
Met Ala Ile Pro Glu Glu Phe Asp Ile Leu Val Leu Gly Gly Gly Ser
1 5 10 15
Ser Gly Ser Cys Ile Ala Gly Arg Leu Ala Asn Leu Asp His Ser Leu
20 25 30
Lys Val Gly Leu Ile Glu Ala Gly Glu Asn Asn Leu Asn Asn Pro Trp
35 40 45
Val Tyr Leu Pro Gly Ile Tyr Pro Arg Asn Met Lys Leu Asp Ser Lys
50 55 60
Thr Ala Ser Phe Tyr Thr Ser Asn Pro Ser Pro His Leu Asn Gly Arg
65 70 75 80
Arg Ala Ile Val Pro Cys Ala Asn Val Leu Gly Gly Gly Ser Ser Ile
85 90 95
Asn Phe Met Met Tyr Thr Arg Gly Ser Ala Ser Asp Tyr Asp Asp Phe
100 105 110
Gln Ala Glu Gly Trp Lys Thr Lys Asp Leu Leu Pro Leu Met Lys Lys
115 120 125
Thr Glu Thr Tyr Gln Arg Ala Cys Asn Asn Pro Asp Ile His Gly Phe
130 135 140
Glu Gly Pro Ile Lys Val Ser Phe Gly Asn Tyr Thr Tyr Pro Val Cys
145 150 155 160
Gln Asp Phe Leu Arg Ala Ser Glu Ser Gln Gly Ile Pro Tyr Val Asp
165 170 175
Asp Leu Glu Asp Leu Val Thr Ala His Gly Ala Glu His Trp Leu Lys
180 185 190
Trp Ile Asn Arg Asp Thr Gly Arg Arg Ser Asp Ser Ala His Ala Phe
195 200 205
Val His Ser Thr Met Arg Asn His Asp Asn Leu Tyr Leu Ile Cys Asn
210 215 220
Thr Lys Val Asp Lys Ile Ile Val Glu Asp Gly Arg Ala Ala Ala Val
225 230 235 240
Arg Thr Val Pro Ser Lys Pro Leu Asn Pro Lys Lys Pro Ser His Lys
245 250 255
Ile Tyr Arg Ala Arg Lys Gln Ile Val Leu Ser Cys Gly Thr Ile Ser
260 265 270
Ser Pro Leu Val Leu Gln Arg Ser Gly Phe Gly Asp Pro Ile Lys Leu
275 280 285
Arg Ala Ala Gly Val Lys Pro Leu Val Asn Leu Pro Gly Val Gly Arg
290 295 300
Asn Phe Gln Asp His Tyr Cys Phe Phe Ser Pro Tyr Arg Ile Lys Pro
305 310 315 320
Gln Tyr Glu Ser Phe Asp Asp Phe Val Arg Gly Asp Ala Glu Ile Gln
325 330 335
Lys Arg Val Phe Asp Gln Trp Tyr Ala Asn Gly Thr Gly Pro Leu Ala
340 345 350
Thr Asn Gly Ile Glu Ala Gly Val Lys Ile Arg Pro Thr Pro Glu Glu
355 360 365
Leu Ser Gln Met Asp Glu Ser Phe Gln Glu Gly Tyr Arg Glu Tyr Phe
370 375 380
Glu Asp Lys Pro Asp Lys Pro Val Met His Tyr Ser Ile Ile Ala Gly
385 390 395 400
Phe Phe Gly Asp His Thr Lys Ile Pro Pro Gly Lys Tyr Met Thr Met
405 410 415
Phe His Phe Leu Glu Tyr Pro Phe Ser Arg Gly Ser Ile His Ile Thr
420 425 430
Ser Pro Asp Pro Tyr Ala Ala Pro Asp Phe Asp Pro Gly Phe Met Asn
435 440 445
Asp Glu Arg Asp Met Ala Pro Met Val Trp Ala Tyr Lys Lys Ser Arg
450 455 460
Glu Thr Ala Arg Arg Met Asp His Phe Ala Gly Glu Val Thr Ser His
465 470 475 480
His Pro Leu Phe Pro Tyr Ser Ser Glu Ala Arg Ala Leu Glu Met Asp
485 490 495
Leu Glu Thr Ser Asn Ala Tyr Gly Gly Pro Leu Asn Leu Ser Ala Gly
500 505 510
Leu Ala His Gly Ser Trp Thr Gln Pro Leu Lys Lys Pro Thr Ala Lys
515 520 525
Asn Glu Gly His Val Thr Ser Asn Gln Val Glu Leu His Pro Asp Ile
530 535 540
Glu Tyr Asp Glu Glu Asp Asp Lys Ala Ile Glu Asn Tyr Ile Arg Glu
545 550 555 560
His Thr Glu Thr Thr Trp His Cys Leu Gly Thr Cys Ser Ile Gly Pro
565 570 575
Arg Glu Gly Ser Lys Ile Val Lys Trp Gly Gly Val Leu Asp His Arg
580 585 590
Ser Asn Val Tyr Gly Val Lys Gly Leu Lys Val Gly Asp Leu Ser Val
595 600 605
Cys Pro Asp Asn Val Gly Cys Asn Thr Tyr Thr Thr Ala Leu Leu Ile
610 615 620
Gly Glu Lys Thr Ala Thr Leu Val Gly Glu Asp Leu Gly Tyr Thr Gly
625 630 635 640
Glu Ala Leu Asp Met Thr Val Pro Gln Phe Lys Leu Gly Thr Tyr Glu
645 650 655
Lys Thr Gly Leu Ala Arg Phe
660
<210> 10
<211> 1992
<212> DNA
<213> Unknown
<220>
<223> Komagataella pastoris
<400> 10
atggctatcc ctgaagagtt tgatatcctt gttttaggtg gtggatccag tggatcctgt 60
attgccggaa gattggccaa cttggaccac tccttgaaag ttggtcttat cgaggcaggt 120
gagaacaacc tcaacaaccc atgggtttac cttccaggta tttacccaag aaacatgaag 180
ttggactcca agactgcatc cttctacact tctaaccctt ctcctcactt gaacggtaga 240
agagctattg ttccatgtgc taacgtcttg ggtggtggtt cttccattaa cttcatgatg 300
tacaccagag gttctgcttc tgattatgac gacttccaag ccgagggctg gaaaaccaag 360
gacttgcttc cattgatgaa aaagaccgag acctaccaaa gagcttgcaa caaccctgac 420
attcacgggt tcgaaggtcc aatcaaggtt tctttcggta actacaccta cccagtttgc 480
caggacttct tgagagcttc tgaatcccaa ggtattccat acgttgacga cttggaagac 540
ttggttactg ctcacggtgc tgaacactgg ctgaaatgga tcaacagaga cactggtcgt 600
cgttccgact ccgctcatgc atttgtccac tctactatga gaaaccacga caacttgtac 660
ttgatttgta acacaaaggt tgacaagatt attgtcgaag acggaagagc tgctgctgtt 720
agaactgttc caagcaagcc tttgaaccca aagaagccaa gtcacaagat ctaccgtgct 780
agaaagcaaa tcgttttgtc ttgtggtacc atctcatctc ctttggttct gcaaagatcc 840
ggtttcggtg acccaatcaa gttgagagcc gctggtgtta agcctttggt caacttgcct 900
ggtgtcggaa gaaacttcca agaccactac tgtttcttca gtccttacag aatcaagcct 960
cagtacgaat ctttcgatga cttcgtgcgt ggtgatgctg agatccaaaa gagagttttc 1020
gaccaatggt acgccaatgg tactggtcct cttgccacta acggtatcga agccggtgtc 1080
aagattagac caacaccaga ggaactgtct caaatggacg aatctttcca agagggttac 1140
agagaatact ttgaggacaa gccagacaag ccagttatgc actactccat tattgctggt 1200
ttcttcggtg accacaccaa gattcctcct ggaaagtaca tgaccatgtt ccactttttg 1260
gaatacccat tctccagagg ttccattcac attacctctc cagatccata cgcagctcca 1320
gacttcgacc caggtttcat gaacgatgaa agagacatgg ctcctatggt ctgggcctac 1380
aagaagtcta gagagacagc tagaagaatg gaccactttg ccggtgaggt tacttctcac 1440
cacccattgt tcccatactc atccgaggcc agagctttgg agatggattt ggagacctcc 1500
aatgcctacg gtggaccttt gaacttgtct gctggtcttg cccacggttc ttggactcaa 1560
cctttgaaga agccaactgc aaagaacgaa ggccatgtta cctccaacca agtcgagctt 1620
catccagaca tcgagtacga cgaggaggac gacaaggcca ttgaaaacta catccgtgag 1680
cacactgaga ccacatggca ctgtctggga acctgttcca tcggtccaag agagggttcc 1740
aagatcgtca aatggggtgg tgttttggac cacagatcca acgtttacgg agtcaagggc 1800
ctgaaggttg gtgacttgtc tgtctgtcca gacaatgttg gttgtaacac ctacaccacc 1860
gctcttttga tcggtgagaa gactgccact ttggttggag aagacttagg atacaccggt 1920
gaagccttag acatgactgt tcctcagttc aagttgggca cttacgagaa gaccggtctt 1980
gctagattct aa 1992
<210> 11
<211> 663
<212> PRT
<213> Unknown
<220>
<223> Komagataella pastoris
<400> 11
Met Ala Ile Pro Glu Glu Phe Asp Ile Leu Val Leu Gly Gly Gly Ser
1 5 10 15
Ser Gly Ser Cys Ile Ala Gly Arg Leu Ala Asn Leu Asp His Ser Leu
20 25 30
Lys Val Gly Leu Ile Glu Ala Gly Glu Asn Asn Leu Asn Asn Pro Trp
35 40 45
Val Tyr Leu Pro Gly Ile Tyr Pro Arg Asn Met Lys Leu Asp Ser Lys
50 55 60
Thr Ala Ser Phe Tyr Thr Ser Asn Pro Ser Pro His Leu Asn Gly Arg
65 70 75 80
Arg Ala Ile Val Pro Cys Ala Asn Ile Leu Gly Gly Gly Ser Ser Ile
85 90 95
Asn Phe Met Met Tyr Thr Arg Gly Ser Ala Ser Asp Tyr Asp Asp Phe
100 105 110
Glu Ala Glu Gly Trp Lys Thr Lys Asp Leu Leu Pro Leu Met Lys Lys
115 120 125
Thr Glu Thr Tyr Gln Arg Ala Cys Asn Asn Pro Glu Ile His Gly Phe
130 135 140
Glu Gly Pro Ile Lys Val Ser Phe Gly Asn Tyr Thr Tyr Pro Val Cys
145 150 155 160
Gln Asp Phe Leu Arg Ala Thr Glu Ser Gln Gly Ile Pro Tyr Val Asp
165 170 175
Asp Leu Glu Asp Leu Glu Thr Ala His Gly Ala Glu His Trp Leu Lys
180 185 190
Trp Ile Asn Arg Asp Thr Gly Arg Arg Ser Asp Ser Ala His Ala Phe
195 200 205
Val His Ser Thr Met Arg Asn His Asp Asn Leu Tyr Leu Ile Cys Asn
210 215 220
Thr Lys Val Asp Lys Ile Ile Val Glu Asp Gly Arg Ala Ala Gly Val
225 230 235 240
Arg Thr Val Pro Ser Lys Pro Leu Asn Ala Lys Lys Pro Thr His Lys
245 250 255
Val Tyr Arg Ala Arg Lys Gln Ile Val Leu Ser Cys Gly Thr Ile Ser
260 265 270
Ser Pro Leu Val Leu Gln Arg Ser Gly Phe Gly Asp Pro Ile Lys Leu
275 280 285
Arg Ala Ala Gly Val Lys Pro Leu Val Asn Leu Pro Gly Val Gly Arg
290 295 300
Asn Phe Gln Asp His Tyr Cys Phe Phe Ser Pro Tyr Arg Ile Lys Pro
305 310 315 320
Gln Tyr Glu Ser Phe Asp Asp Phe Val Arg Gly Asp Ala Asn Ile Gln
325 330 335
Lys Lys Val Phe Asp Gln Trp Tyr Ala Asn Gly Thr Gly Pro Leu Ala
340 345 350
Thr Asn Gly Ile Glu Ala Gly Val Lys Ile Arg Pro Thr Pro Glu Glu
355 360 365
Leu Ser Gln Met Asp Glu Ser Phe Gln Glu Gly Tyr Arg Glu Tyr Phe
370 375 380
Glu Asp Lys Pro Asp Lys Pro Val Met His Tyr Ser Ile Ile Ala Gly
385 390 395 400
Phe Phe Gly Asp His Thr Lys Ile Pro Pro Gly Lys Tyr Met Thr Met
405 410 415
Phe His Phe Leu Glu Tyr Pro Phe Ser Arg Gly Ser Ile His Ile Thr
420 425 430
Ser Pro Asp Pro Tyr Ala Thr Pro Asp Phe Asp Pro Gly Phe Met Asn
435 440 445
Asp Glu Arg Asp Met Ala Pro Met Val Trp Ser Tyr Lys Lys Ser Arg
450 455 460
Glu Thr Ala Arg Lys Met Asp His Phe Ala Gly Glu Val Thr Ser His
465 470 475 480
His Pro Leu Phe Pro Tyr Ser Ser Glu Ala Arg Ala Tyr Glu Met Asp
485 490 495
Leu Glu Thr Ser Asn Ala Tyr Gly Gly Pro Leu Asn Leu Thr Ala Gly
500 505 510
Leu Ala His Gly Ser Trp Thr Gln Pro Leu Lys Lys Pro Ala Ala Arg
515 520 525
Asn Glu Gly His Val Thr Ser Asn Gln Val Glu Leu His Pro Asp Ile
530 535 540
Glu Tyr Asp Glu Glu Asp Asp Lys Ala Ile Glu Asn Tyr Ile Arg Glu
545 550 555 560
His Thr Glu Thr Thr Trp His Cys Leu Gly Thr Cys Ser Ile Gly Pro
565 570 575
Arg Glu Gly Ser Lys Ile Val Lys Trp Gly Gly Val Leu Asp His Arg
580 585 590
Ser Asn Val Tyr Gly Val Lys Gly Leu Lys Val Gly Asp Leu Ser Val
595 600 605
Cys Pro Asp Asn Val Gly Cys Asn Thr Tyr Thr Thr Ala Leu Leu Ile
610 615 620
Gly Glu Lys Thr Ala Thr Leu Val Gly Glu Asp Leu Gly Tyr Thr Gly
625 630 635 640
Asp Ala Leu Asp Met Thr Val Pro Gln Phe Lys Leu Gly Thr Tyr Glu
645 650 655
Lys Thr Gly Leu Ala Arg Phe
660
<210> 12
<211> 1992
<212> DNA
<213> Unknown
<220>
<223> Komagataella pastoris
<400> 12
atggctattc ctgaagaatt cgatattctt gtcctaggtg gtggatccag tggatcctgt 60
attgccggaa gattggccaa cttggaccac tctttgaaag ttggtcttat cgaggccggt 120
gagaacaatc ttaacaaccc ttgggtctac cttccaggta tttacccaag aaacatgaaa 180
ttggactcca agaccgcttc tttctacacc tccaacccat ctcctcattt gaatggtaga 240
agagctattg tcccatgtgc taacatcttg ggtggtggtt cttccatcaa cttcatgatg 300
tacaccagag gttccgcttc tgattacgat gacttcgaag ctgagggctg gaaaaccaag 360
gatttgcttc ctttgatgaa gaagactgag acctaccaaa gagcttgcaa caaccctgag 420
atccacggtt tcgaaggtcc aatcaaggtt tctttcggta actacactta cccggtttgt 480
caagacttct tgagagcaac tgaatcccaa ggtattccat acgttgacga cttggaagac 540
ttggagactg ctcatggtgc cgaacactgg ttgaaatgga tcaacagaga cactggtcgt 600
cgttccgact ctgctcatgc tttcgtccat tctactatga gaaaccatga taacttgtac 660
ttgatctgca acaccaaggt tgacaagatt attgttgaag acggaagagc tgctggtgtc 720
agaaccgtcc caagtaaacc tttgaacgca aagaagccaa ctcacaaggt ttaccgtgct 780
agaaagcaga tcgttttgtc ttgtggtacc atttcttccc ctctggtttt gcaaagatcc 840
ggttttggtg atccaatcaa attgagagcc gctggtgtta agcctttggt caacttgcca 900
ggtgttggaa ggaacttcca ggaccattac tgcttcttct ctccttacag aatcaagccc 960
caatacgagt cttttgatga cttcgtccgt ggtgacgcta acatccaaaa gaaggtattc 1020
gaccaatggt acgctaacgg tactggtcca ttggccacca atggtattga agccggtgtc 1080
aagatcagac caactccaga ggaattatct caaatggacg agtcgttcca ggagggttac 1140
agagagtact ttgaagacaa accagacaaa ccagttatgc actattccat cattgctggt 1200
ttcttcggtg accacaccaa gattccgcct ggaaagtaca tgaccatgtt ccacttcttg 1260
gagtacccat tctccagagg ttctattcat atcacctctc cagacccata cgcaactcca 1320
gactttgacc caggtttcat gaatgatgaa agagacatgg ctcctatggt ttggtcttac 1380
aagaagtcca gagagactgc cagaaagatg gatcactttg ctggtgaggt tacttcccac 1440
caccctctgt tcccatactc atccgaggcc agagcttacg agatggactt ggagacctcc 1500
aacgcctacg gtggaccact gaacttgact gctggtcttg ctcacggttc ttggactcag 1560
cctttgaaga agcctgccgc aagaaacgaa ggacatgtta cctctaacca agttgagctt 1620
catccagaca ttgaatacga tgaggaggat gacaaggcca ttgagaacta catccgtgag 1680
cacactgaga ccacatggca ctgtctcgga acctgttcca tcggtccaag agaaggttcc 1740
aagatagtca aatggggtgg tgttttggac cacagatcca acgtttacgg agtcaagggc 1800
ctgaaggttg gtgacttgtc tgtctgccca gacaatgttg gttgtaacac ctacaccacc 1860
gctcttttaa tcggtgaaaa gactgcaacc ttggtgggtg aagacttagg atacacaggt 1920
gatgccttag acatgactgt tcctcagttc aagttgggca cttacgagaa gactggtctt 1980
gctagattct ag 1992
<210> 13
<211> 664
<212> PRT
<213> Unknown
<220>
<223> Ogataea methanolica
<400> 13
Met Ala Ile Pro Asp Glu Phe Asp Ile Ile Val Val Gly Gly Gly Ser
1 5 10 15
Thr Gly Cys Ala Leu Ala Gly Arg Leu Gly Asn Leu Asp Glu Asn Val
20 25 30
Thr Val Ala Leu Ile Glu Gly Gly Glu Asn Asn Ile Asn Asn Pro Trp
35 40 45
Val Tyr Leu Pro Gly Val Tyr Pro Arg Asn Met Arg Leu Asp Ser Lys
50 55 60
Thr Ala Thr Phe Tyr Ser Ser Arg Pro Ser Pro His Leu Asn Gly Arg
65 70 75 80
Arg Ala Ile Val Pro Cys Ala Asn Ile Leu Gly Gly Gly Ser Ser Ile
85 90 95
Asn Phe Leu Met Tyr Thr Arg Ala Ser Ala Ser Asp Tyr Asp Asp Trp
100 105 110
Glu Ser Glu Gly Trp Thr Thr Asp Glu Leu Leu Pro Leu Met Lys Lys
115 120 125
Ile Glu Thr Tyr Gln Arg Pro Cys Asn Asn Arg Glu Leu His Gly Phe
130 135 140
Asp Gly Pro Ile Lys Val Ser Phe Gly Asn Tyr Thr Tyr Pro Asn Gly
145 150 155 160
Gln Asp Phe Ile Arg Ala Ala Glu Ser Gln Gly Ile Pro Phe Val Asp
165 170 175
Asp Ala Glu Asp Leu Lys Cys Ser His Gly Ala Glu His Trp Leu Lys
180 185 190
Trp Ile Asn Arg Asp Leu Gly Arg Arg Ser Asp Ser Ala His Ala Tyr
195 200 205
Ile His Pro Thr Met Arg Asn Lys Gln Asn Leu Phe Leu Ile Thr Ser
210 215 220
Thr Lys Cys Glu Lys Ile Ile Ile Glu Asn Gly Val Ala Thr Gly Val
225 230 235 240
Lys Thr Val Pro Met Lys Pro Thr Gly Ser Pro Lys Thr Gln Val Ala
245 250 255
Arg Thr Phe Lys Ala Arg Lys Gln Ile Ile Val Ser Cys Gly Thr Ile
260 265 270
Ser Ser Pro Leu Val Leu Gln Arg Ser Gly Ile Gly Ser Ala His Lys
275 280 285
Leu Arg Gln Val Gly Ile Lys Pro Ile Val Asp Leu Pro Gly Val Gly
290 295 300
Met Asn Phe Gln Asp His Tyr Cys Phe Phe Thr Pro Tyr His Val Lys
305 310 315 320
Pro Asp Thr Pro Ser Phe Asp Asp Phe Val Arg Gly Asp Lys Ala Val
325 330 335
Gln Lys Ser Ala Phe Asp Gln Trp Tyr Ala Asn Lys Asp Gly Pro Leu
340 345 350
Thr Thr Asn Gly Ile Glu Ala Gly Val Lys Ile Arg Pro Thr Glu Glu
355 360 365
Glu Leu Ala Thr Ala Asp Asp Glu Phe Arg Ala Ala Tyr Asp Asp Tyr
370 375 380
Phe Gly Asn Lys Pro Asp Lys Pro Leu Met His Tyr Ser Leu Ile Ser
385 390 395 400
Gly Phe Phe Gly Asp His Thr Lys Ile Pro Asn Gly Lys Tyr Met Cys
405 410 415
Met Phe His Phe Leu Glu Tyr Pro Phe Ser Arg Gly Phe Val His Val
420 425 430
Val Ser Pro Asn Pro Tyr Asp Ala Pro Asp Phe Asp Pro Gly Phe Met
435 440 445
Asn Asp Pro Arg Asp Met Trp Pro Met Val Trp Ser Tyr Lys Lys Ser
450 455 460
Arg Glu Thr Ala Arg Arg Met Asp Cys Phe Ala Gly Glu Val Thr Ser
465 470 475 480
His His Pro His Tyr Pro Tyr Asp Ser Pro Ala Arg Ala Ala Asp Met
485 490 495
Asp Leu Glu Thr Thr Lys Ala Tyr Ala Gly Pro Asp His Phe Thr Ala
500 505 510
Asn Leu Tyr His Gly Ser Trp Thr Val Pro Ile Glu Lys Pro Thr Pro
515 520 525
Lys Asn Ala Ala His Val Thr Ser Asn Gln Val Glu Lys His Arg Asp
530 535 540
Ile Glu Tyr Thr Lys Glu Asp Asp Ala Ala Ile Glu Asp Tyr Ile Arg
545 550 555 560
Glu His Thr Glu Thr Thr Trp His Cys Leu Gly Thr Cys Ser Met Ala
565 570 575
Pro Arg Glu Gly Ser Lys Val Val Pro Thr Gly Gly Val Val Asp Ser
580 585 590
Arg Leu Asn Val Tyr Gly Val Glu Lys Leu Lys Val Ala Asp Leu Ser
595 600 605
Ile Cys Pro Asp Asn Val Gly Cys Asn Thr Tyr Ser Thr Ala Leu Leu
610 615 620
Ile Gly Glu Lys Ala Ser Thr Leu Val Ala Glu Asp Leu Gly Tyr Ser
625 630 635 640
Gly Asp Ala Leu Lys Met Thr Val Pro Asn Phe Lys Leu Gly Thr Tyr
645 650 655
Glu Glu Ala Gly Leu Ala Arg Phe
660
<210> 14
<211> 1995
<212> DNA
<213> Unknown
<220>
<223> Ogataea methanolica
<400> 14
atggctattc cagatgaatt tgatattatt gttgtcggtg gtggttccac cggttgtgct 60
cttgctggta gattaggtaa cttggacgaa aacgtcacag ttgctttaat cgaaggtggt 120
gaaaacaaca tcaacaaccc atgggtttac ttaccaggtg tttatccaag aaacatgaga 180
ttagactcaa agactgctac tttttactct tcaagaccat caccacactt gaacggtaga 240
agagctattg ttccatgtgc taacatcttg ggtggtggtt cttccatcaa cttcttgatg 300
tacaccagag cctctgcctc cgattacgat gattgggaat ctgaaggttg gactaccgat 360
gaattattac cactaatgaa gaagattgaa acttatcaaa gaccatgtaa caacagagaa 420
ttgcacggtt tcgatggtcc aattaaggtt tcatttggta actatactta tccaaacggt 480
caagatttca ttagagctgc cgaatctcaa ggtattccat ttgttgatga tgctgaagat 540
ttgaaatgtt cccacggtgc tgagcactgg ttgaagtgga tcaacagaga cttaggtaga 600
agatccgatt ctgctcatgc ttacattcac ccaaccatga gaaacaagca aaacttgttc 660
ttgattactt ccaccaagtg tgaaaagatt atcattgaaa acggtgttgc tactggtgtt 720
aagactgttc caatgaagcc aactggttct ccaaagaccc aagttgctag aactttcaag 780
gctagaaagc aaattattgt ttcttgtggt actatctcat caccattagt tttgcaaaga 840
tctggtatcg gttccgctca caagttgaga caagttggta ttaaaccaat tgttgactta 900
ccaggtgttg gtatgaactt ccaagatcac tactgtttct tcactccata ccatgtcaag 960
ccagatactc catcattcga tgactttgtt agaggtgata aagctgttca aaaatctgct 1020
ttcgaccaat ggtatgctaa caaggatggt ccattaacca ctaatggtat tgaggcaggt 1080
gttaagatta gaccaactga agaagaatta gccactgctg atgacgaatt cagagctgct 1140
tatgatgact actttggtaa caagccagat aagccattaa tgcactactc tctaatttct 1200
ggtttctttg gtgaccacac caagattcca aacggtaagt acatgtgcat gttccacttc 1260
ttggaatatc cattctccag aggtttcgtt cacgttgttt ctccaaaccc atacgatgct 1320
cctgactttg atccaggttt catgaacgat ccaagagata tgtggccaat ggtttggtct 1380
tacaagaagt ccagagaaac tgccagaaga atggactgtt ttgccggtga agttacttct 1440
caccacccac actacccata cgactcacca gccagagctg ctgacatgga cttggaaact 1500
actaaagctt atgctggtcc agaccacttt actgctaact tgtaccacgg ttcatggact 1560
gttccaattg aaaagccaac tccaaagaac gctgctcacg ttacttctaa ccaagttgaa 1620
aaacatcgtg acatcgaata caccaaggag gatgatgctg ctatcgaaga ttacatcaga 1680
gaacacactg aaaccacatg gcattgtctt ggtacttgtt caatggctcc aagagaaggt 1740
tctaaggttg tcccaactgg tggtgttgtt gactccagat taaacgttta cggtgttgaa 1800
aagttgaagg ttgctgattt atcaatttgc ccagataatg ttggttgtaa cacttactct 1860
actgctttgt taatcggtga aaaggcttct accttagttg ctgaagactt gggctactct 1920
ggtgatgctt tgaagatgac tgttccaaac ttcaaattgg gtacttatga agaagctggt 1980
ctagctagat tctag 1995
<210> 15
<211> 663
<212> PRT
<213> Unknown
<220>
<223> Ogataea methanolica
<400> 15
Met Ala Ile Pro Glu Glu Phe Asp Ile Ile Val Val Gly Gly Gly Ser
1 5 10 15
Ala Gly Cys Pro Thr Ala Gly Arg Leu Ala Asn Leu Asp Pro Asn Leu
20 25 30
Thr Val Ala Leu Ile Glu Ala Gly Glu Asn Asn Ile Asn Asn Pro Trp
35 40 45
Val Tyr Leu Pro Gly Val Tyr Pro Arg Asn Met Arg Leu Asp Ser Lys
50 55 60
Thr Ala Thr Phe Tyr Ser Ser Arg Pro Ser Pro His Leu Asn Gly Arg
65 70 75 80
Arg Ala Ile Val Pro Cys Ala Asn Ile Leu Gly Gly Gly Ser Ser Ile
85 90 95
Asn Phe Met Met Tyr Thr Arg Gly Ser Ala Ser Asp Tyr Asp Asp Trp
100 105 110
Glu Ser Glu Gly Trp Thr Thr Asp Glu Leu Leu Pro Leu Met Lys Arg
115 120 125
Leu Glu Thr Tyr Gln Arg Pro Cys Asn Asn Pro Asp Leu His Gly Phe
130 135 140
Asp Gly Pro Ile Lys Val Ser Phe Gly Asn Tyr Thr Tyr Pro Asn Cys
145 150 155 160
Gln Asp Phe Leu Arg Ala Ala Glu Ser Gln Gly Ile Pro Phe Val Asp
165 170 175
Asp Ala Glu Asp Leu Lys Thr Ser His Ala Ser Gln His Trp Leu Lys
180 185 190
Trp Ile Asn Arg Asp Leu Gly Arg Arg Ser Asp Ala Ala His Ala Tyr
195 200 205
Ile His Pro Thr Met Arg Asn Lys Ser Asn Leu Tyr Leu Ile Thr Ser
210 215 220
Thr Lys Ala Asp Lys Val Ile Ile Glu Asp Gly Val Ala Ala Gly Ile
225 230 235 240
Gln Val Val Pro Ser Lys Pro Leu Asn Pro Glu Lys Pro Ala Ala Lys
245 250 255
Ile Tyr Lys Ala Arg Lys Gln Ile Ile Leu Ser Cys Gly Thr Ile Ser
260 265 270
Thr Pro Leu Val Leu Gln Arg Ser Gly Ile Gly Ser Ala His Lys Leu
275 280 285
Arg Gln Ala Gly Ile Lys Pro Ile Val Asp Leu Pro Gly Val Gly Met
290 295 300
Asn Phe Gln Asp His Tyr Cys Phe Phe Thr Pro Tyr His Val Lys Pro
305 310 315 320
Asp Thr Pro Ser Phe Asp Asp Phe Ala Arg Gly Asp Lys Ala Val Gln
325 330 335
Lys Ser Ala Phe Asp Gln Trp Tyr Ala Asn Lys Asp Gly Pro Leu Thr
340 345 350
Thr Asn Gly Ile Glu Ala Gly Val Lys Ile Arg Pro Thr Ala Glu Glu
355 360 365
Leu Ala Thr Ala Asp Glu Asp Phe Gln Leu Gly Tyr Ala Ser Tyr Phe
370 375 380
Glu Asn Lys Pro Asp Lys Pro Leu Met His Tyr Ser Leu Ile Ser Gly
385 390 395 400
Phe Phe Gly Asp His Thr Lys Ile Pro Asn Gly Lys Tyr Met Thr Met
405 410 415
Phe His Phe Leu Glu Tyr Pro Phe Ser Arg Gly Phe Val His Val Val
420 425 430
Ser Pro Ser Pro Tyr Asp Ala Pro Asp Phe Asp Pro Gly Phe Met Asn
435 440 445
Asp Pro Lys Asp Met Trp Pro Met Val Trp Ala Tyr Lys Met Ser Arg
450 455 460
Glu Thr Ala Arg Arg Met Glu Cys Phe Ala Gly Glu Val Thr Ser His
465 470 475 480
His Pro Lys Tyr Pro Tyr Asp Ser Pro Ala Arg Ala Lys Asp Leu Asp
485 490 495
Leu Glu Thr Cys Lys Ala Tyr Ala Gly Pro Asp His Phe Thr Ala Asn
500 505 510
Leu Tyr His Gly Ser Trp Thr Ile Pro Leu Glu Lys Pro Thr Pro Lys
515 520 525
Asn Thr Ser His Val Thr Ser Asn Gln Val Glu Leu His Ala Gln Leu
530 535 540
Glu Tyr Ser Lys Glu Asp Asp Ile Ala Ile Glu Asn Tyr Ile Lys Glu
545 550 555 560
His Val Glu Thr Thr Trp His Cys Leu Gly Thr Cys Ser Met Ala Pro
565 570 575
Arg Glu Gly Ser Ser Ile Val Pro Thr Gly Gly Val Val Asp Glu Arg
580 585 590
Leu Asn Val Tyr Asp Val Ala His Leu Lys Cys Ala Asp Leu Ser Ile
595 600 605
Cys Pro Asp Asn Val Gly Cys Asn Thr Tyr Ser Thr Ala Leu Leu Val
610 615 620
Gly Glu Lys Ala Ser Met Ile Val Ala Glu Asp Leu Gly Tyr Ser Gly
625 630 635 640
Ala Glu Leu Asp Met Thr Ile Pro Gly Phe Lys Leu Gly Thr Tyr Glu
645 650 655
Ser Thr Gly Leu Gly Arg Phe
660
<210> 16
<211> 1992
<212> DNA
<213> Unknown
<220>
<223> Ogataea methanolica
<400> 16
atggctattc ctgaagaatt cgatatcatt gttgtcggtg gtggttctgc cggctgtcct 60
actgctggta gattggctaa cttagaccca aatttaactg ttgctttaat cgaagctggt 120
gaaaacaaca ttaacaaccc atgggtctac ttaccaggcg tttacccaag aaacatgaga 180
ttagactcca aaactgcaac tttctactct tctagacctt ccccacattt aaatggtaga 240
agagctattg ttccatgtgc taatatctta ggtggtggtt cttcaattaa cttcatgatg 300
tacactagag gttcagcttc tgattatgat gactgggaat ccgaaggttg gactaccgat 360
gaattattgc cattgatgaa aagattagaa acttatcaaa gaccatgtaa caaccctgat 420
ttgcacggtt tcgacggccc tatcaaggtc tccttcggta actacactta tcctaactgt 480
caagatttct taagagccgc tgaatctcaa ggtattccat ttgttgatga tgctgaagat 540
ttaaagactt ctcatgcttc ccaacactgg ctgaagtgga ttaacagaga cctgggtaga 600
agatctgatg ctgcgcatgc ttacattcac ccaactatga gaaacaagtc aaacttatac 660
ttgatcactt ccactaaggc tgataaagtt ataattgaag atggagttgc agctggtatt 720
caagttgttc cttccaaacc attgaaccca gaaaagccgg ctgccaagat ctacaaggct 780
agaaagcaaa tcattctatc ctgtggtaca atttctaccc cgttggtcct acaaagatct 840
ggtattggct cagctcataa attaagacag gcaggcataa aaccgatcgt tgacttgcca 900
ggagttggta tgaacttcca agatcactac tgctttttca ccccatacca tgtcaagcca 960
gatactcctt cttttgatga ctttgccaga ggtgataagg ctgttcaaaa atcagctttt 1020
gatcaatggt atgctaacaa agatggtcct ttaaccacta acggtattga agctggtgtt 1080
aagattagac caactgctga agaactggct actgctgatg aagatttcca actaggctac 1140
gcttcttact ttgaaaacaa gccagataaa ccattgatgc attactcttt aatctctggt 1200
ttctttggtg atcacactaa gattccaaac ggtaaataca tgaccatgtt ccatttctta 1260
gaatacccat tctccagggg ttttgttcac gttgtttcgc caagcccata cgatgctcca 1320
gactttgacc caggtttcat gaacgaccca aaggacatgt ggccaatggt ttgggcttat 1380
aaaatgtcaa gagaaactgc tagaagaatg gaatgctttg ctggtgaagt tacttcccac 1440
catcctaaat atccatacga ttcacctgcc agagctaagg acttggactt ggaaacttgt 1500
aaagcttacg cgggtccaga tcactttact gcaaacttgt accacggttc gtggaccatt 1560
ccattggaga agccaactcc caagaacact tctcacgtta cttcgaatca agttgaatta 1620
catgctcaat tagaatattc taaagaagat gacatcgcca tcgaaaacta tatcaaggaa 1680
cacgttgaaa ctacctggca ttgtcttggt acttgttcaa tggctccaag agaaggctca 1740
tcaattgtcc caacaggtgg tgttgttgat gaaagactaa acgtttatga tgttgctcac 1800
ttaaaatgtg ctgatttatc tatctgtcca gataatgtgg gttgtaacac ttactctact 1860
gcgttactgg ttggtgaaaa ggcttctatg attgttgctg aagatttagg ttactctgga 1920
gctgaattgg atatgaccat tcctggtttc aagttaggta cttacgaatc tactggatta 1980
ggtagattct aa 1992
<210> 17
<211> 1000
<212> DNA
<213> Unknown
<220>
<223> Ogataea methanolica
<400> 17
gacaaagttt tgttaaatga ctatcgaaca agccatgaaa tagcacattt ctgccagtca 60
cttttaacac tttcctgctt gctggttgac tctcctcata caaacaccca aaagggaaac 120
tttcagtgtg gggacacttg acatctcaca tgcaccccag attaatttcc ccagacgatg 180
cggagacaag acaaaacaac cctttgtcct gctcttttct ttctcacacc gcgtgggtgt 240
gtgcgcaggc aggcaggcag gcagcgggct gcctgccatc tctaatcgct gctcctcccc 300
cctggcttca aataacagcc tgctgctatc tgtgaccaga ttgggacacc cccctcccct 360
ccgaatgatc catcaccttt tgtcgtactc cgacaatgat ccttccctgt catcttctgg 420
caatcagctc cttcaataat taaatcaaat aagcataaat agtaaaatcg catacaaacg 480
tcatgaaaag ttttatctct atggccaacg gatagtctat ctgcttaatt ccatccactt 540
tgggaaccgt tctctcttta ccccagattc tcaaagctaa tatctgcccc ttgtctattg 600
tcctttctcc gtgtacaagc ggagcttttg cctcccatcc tcttgctttg tttcggttat 660
ttttttttct tttgaaactc ttggtcaaat caaatcaaac aaaaccaaac cttctattcc 720
atcagatcaa ccttgttcaa cattctataa atcgatataa atataacctt atccctccct 780
tgttttttac caattaatca atcttcaaat ttcaaatatt ttctacttgc tttattactc 840
agtattaaca tttgtttaaa ccaactataa cttttaactg gctttagaag ttttatttaa 900
catcagtttc aatttacatc tttatttatt aacgaaatct ttacgaatta actcaatcaa 960
aacttttacg aaaaaaaaat cttactatta atttctcaaa 1000
<210> 18
<211> 1000
<212> DNA
<213> Unknown
<220>
<223> Ogataea methanolica
<400> 18
cgaacttgcc cttgtggaat ttggttgtta atcaaactgt tctgtatttc atgtcatact 60
actattgata ttattaatgt tacttactca tctggccatt taacaggttt gaagctttaa 120
tgctcttaac taacagcaat ccatcaccgt caaccttaac ccccctggtg cttgctgtct 180
ttatccttcg tatctttttc atgttgcacc gccctgttcc ttatacggtt gttcccccat 240
aggctaactt ctctgtttcc gaccatctct gcaataacaa agaattctat acgcttacac 300
tataatcata caatgactct acatgccatt ttcactttac ttacttgcca tcggaagata 360
ctgaatcaga aagccatagt aactacataa cttcaaaaca cacccttttt acagattagt 420
tacaattttg tcaatgtttg tttgataacc caaggtggaa cgtttccagt tagacctgtt 480
taatccaact cactttacca ccccaaaact ttcctaccgt tagacaaata ctggctaaat 540
ctgacgaaaa caaccaatca acaattgaat ccactgggag gtatctctaa tccactgaca 600
aactttgcta aaacaagaaa aagtgggggc ctccgttgcg gagaagacgt gcgcaggctt 660
aaaaacacaa gagaacactt ggaagtaccc cagattttta gcttcctact attctgacac 720
cccctattca agcacgacgg tgattgattc attcaatttt gctgctccaa tgataggata 780
aacccttttg gacttcaatc agacctctgt cctccatagc aatataaata ccttctagtt 840
gccccacttc ctctctcctg tactgcccca atgagtgact tattcaagtt actttctctc 900
ttttcctaac aattaaacaa gaagctttat tataacatta atatactatt ttataacagg 960
attgaaaatt atatttatct atctaaaact aaaattcaaa 1000
<210> 19
<211> 664
<212> PRT
<213> Unknown
<220>
<223> Ogataea polymorpha
<400> 19
Met Ala Ile Pro Asp Glu Phe Asp Ile Ile Val Val Gly Gly Gly Ser
1 5 10 15
Thr Gly Cys Cys Ile Ala Gly Arg Leu Ala Asn Leu Asp Asp Gln Asn
20 25 30
Leu Thr Val Ala Leu Ile Glu Gly Gly Glu Asn Asn Ile Asn Asn Pro
35 40 45
Trp Val Tyr Leu Pro Gly Val Tyr Pro Arg Asn Met Arg Leu Asp Ser
50 55 60
Lys Thr Ala Thr Phe Tyr Ser Ser Arg Pro Ser Lys Ala Leu Asn Gly
65 70 75 80
Arg Arg Ala Ile Val Pro Cys Ala Asn Ile Leu Gly Gly Gly Ser Ser
85 90 95
Ile Asn Phe Leu Met Tyr Thr Arg Ala Ser Ala Ser Asp Tyr Asp Asp
100 105 110
Trp Glu Ser Glu Gly Trp Ser Thr Asp Glu Leu Leu Pro Leu Ile Lys
115 120 125
Lys Ile Glu Thr Tyr Gln Arg Pro Cys Asn Asn Arg Asp Leu His Gly
130 135 140
Phe Asp Gly Pro Ile Lys Val Ser Phe Gly Asn Tyr Thr Tyr Pro Thr
145 150 155 160
Cys Gln Asp Phe Leu Arg Ala Ala Glu Ser Gln Gly Ile Pro Val Val
165 170 175
Asp Asp Leu Glu Asp Phe Lys Thr Ser His Gly Ala Glu His Trp Leu
180 185 190
Lys Trp Ile Asn Arg Asp Leu Gly Arg Arg Ser Asp Ser Ala His Ala
195 200 205
Tyr Val His Pro Thr Met Arg Asn Lys Gln Ser Leu Phe Leu Ile Thr
210 215 220
Ser Thr Lys Cys Asp Lys Val Ile Ile Glu Asp Gly Lys Ala Val Ala
225 230 235 240
Val Arg Thr Val Pro Met Lys Pro Leu Asn Pro Lys Lys Pro Val Ser
245 250 255
Arg Thr Phe Arg Ala Arg Lys Gln Ile Val Ile Ser Cys Gly Thr Ile
260 265 270
Ser Ser Pro Leu Val Leu Gln Arg Ser Gly Ile Gly Ala Ala His His
275 280 285
Leu Arg Ser Val Gly Val Lys Pro Ile Val Asp Leu Pro Gly Val Gly
290 295 300
Glu Asn Phe Gln Asp His Tyr Cys Phe Phe Thr Pro Tyr Tyr Val Lys
305 310 315 320
Pro Asp Val Pro Thr Phe Asp Asp Phe Val Arg Gly Asp Pro Val Ala
325 330 335
Gln Lys Ala Ala Phe Asp Gln Trp Tyr Ser Asn Lys Asp Gly Pro Leu
340 345 350
Thr Thr Asn Gly Ile Glu Ala Gly Val Lys Ile Arg Pro Thr Glu Glu
355 360 365
Glu Leu Ala Thr Ala Asp Glu Asp Phe Arg Arg Gly Tyr Ala Glu Tyr
370 375 380
Phe Glu Asn Lys Pro Asp Lys Pro Leu Met His Tyr Ser Val Ile Ser
385 390 395 400
Gly Phe Phe Gly Asp His Thr Lys Ile Pro Asn Gly Lys Phe Met Thr
405 410 415
Met Phe His Phe Leu Glu Tyr Pro Phe Ser Arg Gly Phe Val Arg Ile
420 425 430
Thr Ser Ala Asn Pro Tyr Asp Ala Pro Asp Phe Asp Pro Gly Phe Leu
435 440 445
Asn Asp Glu Arg Asp Leu Trp Pro Met Val Trp Ala Tyr Lys Lys Ser
450 455 460
Arg Glu Thr Ala Arg Arg Met Glu Ser Phe Ala Gly Glu Val Thr Ser
465 470 475 480
His His Pro Leu Phe Lys Val Asp Ser Pro Ala Arg Ala Arg Asp Leu
485 490 495
Asp Leu Glu Thr Cys Ser Ala Tyr Ala Gly Pro Lys His Leu Thr Ala
500 505 510
Asn Leu Tyr His Gly Ser Trp Thr Val Pro Ile Asp Lys Pro Thr Pro
515 520 525
Lys Asn Asp Phe His Val Thr Ser Asn Gln Val Gln Leu His Ser Asp
530 535 540
Ile Glu Tyr Thr Glu Glu Asp Asp Glu Ala Ile Val Asn Tyr Ile Lys
545 550 555 560
Glu His Thr Glu Thr Thr Trp His Cys Leu Gly Thr Cys Ser Met Ala
565 570 575
Pro Arg Glu Gly Ser Lys Ile Ala Pro Lys Gly Gly Val Leu Asp Ala
580 585 590
Arg Leu Asn Val Tyr Gly Val Gln Asn Leu Lys Val Ala Asp Leu Ser
595 600 605
Val Cys Pro Asp Asn Val Gly Cys Asn Thr Tyr Ser Thr Ala Leu Thr
610 615 620
Ile Gly Glu Lys Ala Ala Thr Leu Val Ala Glu Asp Leu Gly Tyr Ser
625 630 635 640
Gly Ser Asp Leu Asp Met Thr Ile Pro Asn Phe Arg Leu Gly Thr Tyr
645 650 655
Glu Glu Thr Gly Leu Ala Arg Phe
660
<210> 20
<211> 1995
<212> DNA
<213> Unknown
<220>
<223> Ogataea polymorpha
<400> 20
atggccattc ctgacgaatt cgatatcatt gttgttggtg gaggttccac cggctgctgc 60
attgcgggca gactcgcaaa cctcgacgac caaaacctca cagttgccct gatcgagggt 120
ggtgagaaca acatcaacaa cccttgggtc taccttcccg gagtgtatcc tagaaacatg 180
agactcgact ccaagacggc caccttctac tcgtccagac catcgaaggc tctgaacggc 240
agaagagcga tcgttccttg cgccaacatc cttggaggcg gctcgtcgat caactttctg 300
atgtacacca gagcctctgc ttccgactac gacgactggg agtccgaggg atggagcacc 360
gacgagttgc tacctctgat caaaaaaatc gaaacttacc agcgtccttg caacaacaga 420
gatctgcacg gctttgacgg cccaatcaag gtttcctttg gaaactacac gtatcctacg 480
tgccaggact tcctgagagc agcagagtcg cagggaattc ctgttgtgga cgacctggag 540
gacttcaaga catcgcatgg tgcagagcac tggctgaagt ggattaacag agacctgggc 600
agaagatcgg attctgcgca cgcctacgtc cacccaacta tgagaaacaa gcagagcctg 660
ttcctcatca cctccaccaa gtgtgacaag gtgatcatcg aggacggcaa ggctgtggcc 720
gtgagaacag tgccaatgaa gcctctgaac cctaagaagc ctgtgtccag aaccttcaga 780
gccagaaagc agattgtgat ctcctgcgga accatctcgt ctcctctggt gctccagaga 840
tctggtattg gtgcagctca ccacttgaga tccgtggggg tcaagccaat cgtcgacctg 900
ccaggtgtgg gtgagaattt ccaggaccac tactgtttct tcactccata ctacgtcaag 960
cctgacgttc ctacgttcga cgactttgtc aggggtgacc cagttgccca gaaggccgct 1020
ttcgaccagt ggtactccaa caaggacggt ccattgacca ccaacggtat tgaagccgga 1080
gtcaagatca gacctaccga agaggagctg gctaccgcgg acgaggactt cagacgcggc 1140
tacgcagagt acttcgagaa caagccagac aagcctctga tgcactactc tgtcatctcc 1200
ggcttctttg gagaccacac caagattcct aacggcaagt tcatgaccat gttccacttc 1260
ctggagtatc cattctccag aggatttgtt agaatcacct cggcaaaccc atacgacgct 1320
cctgacttcg atcccggctt cctcaatgac gaaagagacc tgtggcctat ggtctgggca 1380
tacaagaagt ccagagagac ggccagaaga atggagagct ttgcaggaga ggtcacctcg 1440
caccacccat tgttcaaggt tgactcgcca gccagagcca gagacctgga cctcgagaca 1500
tgcagtgcat atgccggtcc taagcacctc actgccaacc tgtaccacgg ctcgtggacc 1560
gttcctatcg acaagccaac gcctaagaac gatttccacg tgacctccaa ccaagtccaa 1620
ctgcactccg acatcgagta caccgaggag gacgacgagg ccatcgtcaa ctacattaag 1680
gaacacaccg agaccacttg gcactgtctg ggtacctgct cgatggcccc aagagagggt 1740
agtaagattg ctcctaaggg aggtgtcttg gacgccagac tgaacgttta cggagtccag 1800
aacctcaagg ttgcggacct ttctgtttgt cccgacaacg ttggatgcaa cacctactct 1860
actgcattga ccatcggtga gaaggctgcc actcttgttg ctgaagatct tggctactca 1920
ggctccgacc tggacatgac gattccaaac ttcagactcg gaacttacga ggagaccgga 1980
cttgccagat tctaa 1995
<210> 21
<211> 1000
<212> DNA
<213> Unknown
<220>
<223> Ogataea polymorpha
<400> 21
gctgcagctt gcgatctcgg atggttttgg aatggaagaa ccgcgacatc tccaacagct 60
gggccgtgtt gagaatgagc cggacgtcgt tgaacgaggg ggccacaagc cggcgtttgc 120
tgatggcgcg gcgctcgtcc tcgatgtaga aggccttttc cagaggcagt ctcgtgaaga 180
agttgccaac gctcggaacc agctgcacga gccgagacaa ttcgggggtg ccggctttgg 240
tcatttcaat gttgtcgtcg atgaggagtt caaggtcgtg gaagatttcc gcgtagcggc 300
gttttgcctc agagtttacc atgaggtcgt ccactgcaga gatgccgttg ctcttcaccg 360
cgtacaggac gaacggcgtg gccagcaggc ccttgatcca ttctatgagg ccatctcgac 420
ggtgttcctt gagtgcgtac tccactctgt agcgactgga catctcgaga ctgggcttgc 480
tgtgctggat gcaccaatta attgttgccg catgcatcct tgcaccgcaa gtttttaaaa 540
cccactcgct ttagccgtcg cgtaaaactt gtgaatctgg caactgaggg ggttctgcag 600
ccgcaaccga acttttcgct tcgaggacgc agctggatgg tgtcatgtga ggctctgttt 660
gctggcgtag cctacaacgt gaccttgcct aaccggacgg cgctacccac tgctgtctgt 720
gcctgctacc agaaaatcac cagagcagca gagggccgat gtggcaactg gtggggtgtc 780
ggacaggctg tttctccaca gtgcaaatgc gggtgaaccg gccagaaagt aaattcttat 840
gctaccgtgc agtgactccg acatccccag tttttgccct acttgatcac agatggggtc 900
agcgctgccg ctaagtgtac ccaaccgtcc ccacacggtc catctataaa tactgctgcc 960
agtgcacggt ggtgacatca atctaaagta caaaaacaaa 1000
<210> 22
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> Signal sequence
<220>
<221> MISC_FEATURE
<222> (3)
<223> X at position 3 is either F or L
<220>
<221> MISC_FEATURE
<222> (16)
<223> X at position 16 is either A or T
<400> 22
Met Lys Xaa Ser Thr Asn Leu Ile Leu Ala Ile Ala Ala Ala Ser Xaa
1 5 10 15
Val Val Ser Ala
20
<210> 23
<211> 36
<212> PRT
<213> Artificial Sequence
<220>
<223> Leader sequence
<220>
<221> MISC_FEATURE
<222> (3)
<223> X at position 3 is either F or L
<220>
<221> MISC_FEATURE
<222> (16)
<223> X at position 16 is either A or T
<400> 23
Met Lys Xaa Ser Thr Asn Leu Ile Leu Ala Ile Ala Ala Ala Ser Xaa
1 5 10 15
Val Val Ser Ala Ala Pro Val Ala Pro Ala Glu Glu Ala Ala Asn His
20 25 30
Leu His Lys Arg
35
<210> 24
<211> 85
<212> PRT
<213> Saccharomyces cerevisiae
<400> 24
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe
35 40 45
Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu
50 55 60
Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Ser Leu Glu Lys Arg
85
<210> 25
<211> 1991
<212> DNA
<213> Artificial Sequence
<220>
<223> AOX1 split marker cassette 1
<400> 25
aggggtccaa gtaagaagct tcttgctgta gaatttgggc atatgtgctg gtgacaaagg 60
catctctgcc ttgagtttct gacggcggga cagcattctt accggatata taacaccaat 120
tgccagcacc accaatctca gaggtacccc taacaaactt aataaaatct tgggtatcaa 180
cttcattaag ctttgtagtt tgcaagtact tataaacaaa attccgtaag gtgtcgtctt 240
gaggctggga cttgacaaac tgccaaaatg gcaacaaatc tactggcttg gccataattt 300
tgacattcga gtcatcaaag gtaaattcaa ccggagactt gtattcttta ttgataactt 360
tctcatatag gacattgtca ggaacacgat gaaaccagga tgcccccaaa tccaatgaga 420
ctgaggtttc atgagtcgca accaacctac ctccaatacg gtccctaccc tctaaaatca 480
acgcattcac gccattgctt ttgagatcga ctgcagcttt gatgcctgaa atcccagcgc 540
ctacaatgat gacatttgga tttggttgac tcatgttggt attgtgaaat agacgcagat 600
cgggaacact gaaaaataac agttattatt cgagatctaa catccaaaga cgaaaggttg 660
aatgaaacct ttttgccatc cgacatccac aggtccattc tcacacataa gtgccaaacg 720
caacaggagg ggatacacta gcagcagacc gttgcaaacg caggacctcc actcctcttc 780
tcctcaacac ccacttttgc catcgaaaaa ccagcccagt tattgggctt gattggagct 840
cgctcattcc aattccttct attaggctac taacaccatg actttattag cctgtctatc 900
ctggcccccc tggcgaggtt catgtttgtt tatttccgaa tgcaacaagc tccgcattac 960
acccgaacat cactccagat gagggctttc tgagtgtggg gtcagtacgc tgcaggtcga 1020
caacccttaa tataacttcg tataatgtat gctatacgaa gttattaggt ctagatcggt 1080
accgacatgg aggcccagaa taccctcctt gacagtcttg acgtgcgcag ctcaggggca 1140
tgatgtgact gtcgcccgta catttagccc atacatcccc atgtataatc atttgcatcc 1200
atacattttg atggccgcac ggcgcgaagc aaaaattacg gctcctcgct gcagacctgc 1260
gagcagggaa acgctcccct cacagacgcg ttgaattgtc cccacgccgc gcccctgtag 1320
agaaatataa aaggttagga tttgccactg aggttcttct ttcatatact tccttttaaa 1380
atcttgctag gatacagttc tcacatcaca tccgaacata aacaaccatg ggtaaggaaa 1440
agactcacgt ttcgaggccg cgattaaatt ccaacatgga tgctgattta tatgggtata 1500
aatgggctcg cgataatgtc gggcaatcag gtgcgacaat ctatcgattg tatgggaagc 1560
ccgatgcgcc agagttgttt ctgaaacatg gcaaaggtag cgttgccaat gatgttacag 1620
atgagatggt cagactaaac tggctgacgg aatttatgcc tcttccgacc atcaagcatt 1680
ttatccgtac tcctgatgat gcatggttac tcaccactgc gatccccggc aaaacagcat 1740
tccaggtatt agaagaatat cctgattcag gtgaaaatat tgttgatgcg ctggcagtgt 1800
tcctgcgccg gttgcattcg attcctgttt gtaattgtcc ttttaacagc gatcgcgtat 1860
ttcgtctcgc tcaggcgcaa tcacgaatga ataacggttt ggttgatgcg agtgattttg 1920
atgacgagcg taatggctgg cctgttgaac aagtctggaa agaaatgcat aagcttttgc 1980
cattctcacc g 1991
<210> 26
<211> 1853
<212> DNA
<213> Artificial Sequence
<220>
<223> AOX1 split marker cassette 2
<400> 26
aagcccgatg cgccagagtt gtttctgaaa catggcaaag gtagcgttgc caatgatgtt 60
acagatgaga tggtcagact aaactggctg acggaattta tgcctcttcc gaccatcaag 120
cattttatcc gtactcctga tgatgcatgg ttactcacca ctgcgatccc cggcaaaaca 180
gcattccagg tattagaaga atatcctgat tcaggtgaaa atattgttga tgcgctggca 240
gtgttcctgc gccggttgca ttcgattcct gtttgtaatt gtccttttaa cagcgatcgc 300
gtatttcgtc tcgctcaggc gcaatcacga atgaataacg gtttggttga tgcgagtgat 360
tttgatgacg agcgtaatgg ctggcctgtt gaacaagtct ggaaagaaat gcataagctt 420
ttgccattct caccggattc agtcgtcact catggtgatt tctcacttga taaccttatt 480
tttgacgagg ggaaattaat aggttgtatt gatgttggac gagtcggaat cgcagaccga 540
taccaggatc ttgccatcct atggaactgc ctcggtgagt tttctccttc attacagaaa 600
cggctttttc aaaaatatgg tattgataat cctgatatga ataaattgca gtttcatttg 660
atgctcgatg agtttttcta atcagtactg acaataaaaa gattcttgtt ttcaagaact 720
tgtcatttgt atagtttttt tatattgtag ttgttctatt ttaatcaaat gttagcgtga 780
tttatatttt ttttcgcctc gacatcatct gcccagatgc gaagttaagt gcgcagaaag 840
taatatcatg cgtcaatcgt atgtgaatgc tggtcgctat actggtacca ttcgagaacc 900
cttaatataa cttcgtataa tgtatgctat acgaagttat taggtgatat cagatccact 960
gccatttgcc tgagagatgc aggcttcatt tttgatactt ttttatttgt aacctatata 1020
gtataggatt ttttttgtca ttttgtttct tctcgtacga gcttgctcct gatcagccta 1080
tctcgcagct gatgaatatc ttgtggtagg ggtttgggaa aatcattcga gtttgatgtt 1140
tttcttggta tttcccactc ctcttcagag tacagaagat taagtgagac gttcgtttgt 1200
gcaagcttca acgatgccaa aagggtataa taagcgtcat ttgcagcatt gtgaagaaaa 1260
ctatgtggca agccaagcct gcgaagaatg tattttaagt ttgactttga tgtattcact 1320
tgattaagcc ataattctcg agtatctatg attggaagta tgggaatggt gatacccgca 1380
ttcttcagtg tcttgaggtc tcctatcaga ttatgcccaa ctaaagcaac cggaggagga 1440
gatttcatgg taaatttctc tgacttttgg tcatcagtag actcgaactg tgagactatc 1500
tcggttatga cagcagaaat gtccttcttg gagacagtaa atgaagtccc accaataaag 1560
aaatccttgt tatcaggaac aaacttcttg tttcgaactt tttcggtgcc ttgaactata 1620
aaatgtagag tggatatgtc gggtaggaat ggagcgggca aatgcttacc ttctggacct 1680
tcaagaggta tgtagggttt gtagatactg atgccaactt cagtgacaac gttgctattt 1740
cgttcaaacc attccgaatc cagagaaatc aaagttgttt gtctactatt gatccaagcc 1800
agtgcggtct tgaaactgac aatagtgtgc tcgtgttttg aggtcatctt tgt 1853
<210> 27
<211> 2038
<212> DNA
<213> Artificial Sequence
<220>
<223> AOX2 split marker cassette 1
<400> 27
gtacgggttt actgatttga catatcttgg tactaacgtt accaatggtg ttccaaataa 60
cgcagatgat gagcgtggtt gcattgctgg atttgacaac actggtttcg tgctgggaac 120
ttcatcctcg ttgtttaatc agtttattct gcaactgaat acgagtgatc tttcaggagc 180
aatttaccaa atcattgagc attttctgac tggacttagc gaagacgaag acgacattgc 240
tatctattcc cccaaccctt tctacaaaag tacgtatgca ggagtaggtg ccattgcgga 300
aaatgacacc ctttacttgg ttgatggtgg agaggataac caaaacgtcc ctctgcagcc 360
tctacttcaa aaggagcgtg acgttgatat catctttgcg tttgacaaca gtgcagacac 420
tgacctctct tggccaaacg gttcatcatt agtcaacacc tacatgagac agttttcttc 480
tcaagcaaat ggaacaacgt tcccttatgt acctgatacc accactttcc taaacttgaa 540
tctttcgagt aagccaacct tctttggttg tgatgctaga aatttgacag acattgttga 600
aggcacggat cacattcctc ccctggttgt ttatctggcc aatagacctt tctcgtattg 660
gagtaacact tcaactttca agttagacta ctctgaatcc gagaagagag gaatgatcca 720
aaacggtttt gaagtgtcgt ctcgtttgaa catgactatt gatgaagaat ggcgtacttg 780
tgttggatgt gcaatcattc gtagacagca ggagagatcc aatgcaacac aaacagagca 840
atgtagaaga tgttttgaga attattgttg gaacggtgat attgacactt ccaccgaaga 900
tatccccgtt aattttacca ctactggagc aaccaatgag gagaatgaca actccacttc 960
aatatcatcg gccaattcgg tagcaccttc caaactttgg taccaagcac cattgctgtt 1020
ggtcggcctt gtcgcattct tcatctagta cgtacgctgc aggtcgacaa cccttaatat 1080
aacttcgtat aatgtatgct atacgaagtt attaggtcta gatcggtacc gacatggagg 1140
cccagaatac cctccttgac agtcttgacg tgcgcagctc aggggcatga tgtgactgtc 1200
gcccgtacat ttagcccata catccccatg tataatcatt tgcatccata cattttgatg 1260
gccgcacggc gcgaagcaaa aattacggct cctcgctgca gacctgcgag cagggaaacg 1320
ctcccctcac agacgcgttg aattgtcccc acgccgcgcc cctgtagaga aatataaaag 1380
gttaggattt gccactgagg ttcttctttc atatacttcc ttttaaaatc ttgctaggat 1440
acagttctca catcacatcc gaacataaac aaccatgggt aaggaaaaga ctcacgtttc 1500
gaggccgcga ttaaattcca acatggatgc tgatttatat gggtataaat gggctcgcga 1560
taatgtcggg caatcaggtg cgacaatcta tcgattgtat gggaagcccg atgcgccaga 1620
gttgtttctg aaacatggca aaggtagcgt tgccaatgat gttacagatg agatggtcag 1680
actaaactgg ctgacggaat ttatgcctct tccgaccatc aagcatttta tccgtactcc 1740
tgatgatgca tggttactca ccactgcgat ccccggcaaa acagcattcc aggtattaga 1800
agaatatcct gattcaggtg aaaatattgt tgatgcgctg gcagtgttcc tgcgccggtt 1860
gcattcgatt cctgtttgta attgtccttt taacagcgat cgcgtatttc gtctcgctca 1920
ggcgcaatca cgaatgaata acggtttggt tgatgcgagt gattttgatg acgagcgtaa 1980
tggctggcct gttgaacaag tctggaaaga aatgcataag cttttgccat tctcaccg 2038
<210> 28
<211> 1944
<212> DNA
<213> Artificial Sequence
<220>
<223> AOX2 split marker cassette 2
<400> 28
aagcccgatg cgccagagtt gtttctgaaa catggcaaag gtagcgttgc caatgatgtt 60
acagatgaga tggtcagact aaactggctg acggaattta tgcctcttcc gaccatcaag 120
cattttatcc gtactcctga tgatgcatgg ttactcacca ctgcgatccc cggcaaaaca 180
gcattccagg tattagaaga atatcctgat tcaggtgaaa atattgttga tgcgctggca 240
gtgttcctgc gccggttgca ttcgattcct gtttgtaatt gtccttttaa cagcgatcgc 300
gtatttcgtc tcgctcaggc gcaatcacga atgaataacg gtttggttga tgcgagtgat 360
tttgatgacg agcgtaatgg ctggcctgtt gaacaagtct ggaaagaaat gcataagctt 420
ttgccattct caccggattc agtcgtcact catggtgatt tctcacttga taaccttatt 480
tttgacgagg ggaaattaat aggttgtatt gatgttggac gagtcggaat cgcagaccga 540
taccaggatc ttgccatcct atggaactgc ctcggtgagt tttctccttc attacagaaa 600
cggctttttc aaaaatatgg tattgataat cctgatatga ataaattgca gtttcatttg 660
atgctcgatg agtttttcta atcagtactg acaataaaaa gattcttgtt ttcaagaact 720
tgtcatttgt atagtttttt tatattgtag ttgttctatt ttaatcaaat gttagcgtga 780
tttatatttt ttttcgcctc gacatcatct gcccagatgc gaagttaagt gcgcagaaag 840
taatatcatg cgtcaatcgt atgtgaatgc tggtcgctat actggtacca ttcgagaacc 900
cttaatataa cttcgtataa tgtatgctat acgaagttat taggtgatat cagatccact 960
tcctcttacg gctttctttc ccaaaaaatc attggggaaa tgtgcccctc atcagagtcc 1020
aatgacccat gaataaagtt tcttgtactg tttaagacga tgaattgcaa cgataatccg 1080
agcagtttac ggggtacatc acgtgctttg catatgatct cggagtcgga tcagttccgg 1140
atgtgatgta ttaccccata gtttcaaact ctaatgcagc cgccaagtgc catacaccct 1200
ccatcaatct atgcttaaag tttttcacca tcgttgggtg gtgatgatga ctcgcttagt 1260
ctctgctgtt cgatattaac tttgtaagga tcgcccttgg atggaaaatt gaggggttgt 1320
aacctgaatt tgcaggctac ttacattgga cttttgagaa ggctggacgg ttgatgaaga 1380
gggctgggtg cagaggaatg gaaaaaaatt tagttgagag gactgcttga aattttagga 1440
aatggagtcc tttaagctga caaaacttca aggatgggga ttttcatgta gctttttcat 1500
gccttcgaca agctaaagga aggtaattga ttctggataa atggatattt gatctgcttt 1560
agcagatgtc aaagttctac tagtgatagt ctggtatctc gtagccttca attgggcgta 1620
tcttactcga agtgttatat ttttagctga cgagacgaag aacgagagag tattgacaca 1680
ttcagaggta agacaatatg tcgtattatc aaaataagta tcgaacctct attaggagcc 1740
tactggctca aatgtgcaac cttagtggtg attgtctctg cttcttgatc acaatctgtc 1800
gtgtttgaga gtgccgatgt atgattttta gtaaatgttt ttcagaaaag gcgctaagta 1860
aataaccagt aagtaataaa taacgtaaaa gtgatttgaa tcataaaaga atcaagatag 1920
aggtcaaagc atagataatc cccc 1944
<210> 29
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 29
ggctggaaat agatgtaggg ag 22
<210> 30
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 30
tcgcatctcc gcaaatttct c 21
<210> 31
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 31
gatcccattc cctatccatg t 21
<210> 32
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 32
ctctcccccc tcgtaatctt 20
<210> 33
<211> 720
<212> DNA
<213> Artificial Sequence
<220>
<223> enhanced green fluorescent protein (eGFP)
<400> 33
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120
ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180
ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420
aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480
ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600
tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 720
720
<210> 34
<211> 1830
<212> DNA
<213> Artificial Sequence
<220>
<223> Human serum albumin (HSA) with its native secretion leader
<400> 34
atgaagtggg ttactttcat ctccttgttg ttcttgttct cctcagctta ctccagaggt 60
gttttcagaa gagatgctca caagtccgag gttgctcaca gattcaagga cttgggtgaa 120
gagaacttca aggctttggt tttgatcgct ttcgctcagt acttgcagca gtgtccattc 180
gaggaccacg ttaagttggt taacgaggtt actgagttcg ctaagacttg tgttgctgac 240
gaatccgctg agaactgtga taagtccttg cacactttgt tcggtgacaa gttgtgtact 300
gttgctactt tgagagaaac ttacggtgag atggctgact gttgtgctaa gcaagagcct 360
gagagaaacg agtgtttctt gcaacacaag gacgacaacc caaacttgcc aagattggtt 420
agaccagagg ttgacgttat gtgtactgct ttccacgaca acgaagagac tttcttgaag 480
aagtacttgt acgagatcgc tagaagacac ccatacttct acgctccaga gttgttgttc 540
ttcgctaaga gatacaaggc tgctttcact gagtgttgtc aggctgctga taaggctgct 600
tgtttgttgc caaagttgga cgagttgaga gatgagggta aggcttcttc cgctaagcag 660
agattgaagt gtgcttcctt gcagaagttc ggagagagag cttttaaggc ttgggctgtt 720
gctagattgt cccagagatt cccaaaggct gagttcgctg aggtttccaa gttggttact 780
gacttgacta aggttcacac agagtgttgt cacggtgact tgttggaatg tgctgatgac 840
agagctgact tggctaagta catctgtgag aaccaggatt ccatctcctc caagttgaaa 900
gaatgttgtg agaagccttt gttggagaag tcccactgta tcgctgaggt tgaaaacgac 960
gaaatgccag ctgacttgcc atctttggct gctgacttcg ttgaatccaa ggacgtctgc 1020
aagaactacg ctgaggctaa ggacgttttc ttgggtatgt tcttgtatga gtacgctaga 1080
agacatccag actactccgt tgttttgttg ttgagattgg ctaagactta cgagactact 1140
ttggagaagt gttgtgctgc tgctgaccca catgagtgtt acgctaaggt tttcgacgag 1200
ttcaagccat tggttgagga accacagaac ttgatcaagc agaactgtga gttgttcgag 1260
cagttgggtg agtacaagtt ccagaacgct ttgttggtta gatacactaa gaaggttcca 1320
caggtttcca ctccaacttt ggttgaggtt tccagaaact tgggtaaggt tggttccaag 1380
tgttgtaagc acccagaggc taagagaatg ccatgtgctg aggactactt gtctgttgtt 1440
ttgaaccagt tgtgtgtctt gcacgaaaag acaccagttt ccgacagagt tactaagtgt 1500
tgtactgaat ccttggttaa cagaagacct tgtttctccg ctttggaggt tgacgagact 1560
tacgttccaa aagagttcaa cgctgagact ttcactttcc acgctgacat ctgtactttg 1620
tccgagaaag agagacagat caagaagcag actgctttgg ttgagttggt taagcacaag 1680
ccaaaggcta caaaagagca gttgaaggct gttatggacg acttcgctgc tttcgttgag 1740
aaatgttgta aggctgacga caaagagact tgtttcgctg aagagggtaa gaagttggtt 1800
gctgcttccc aagctgcttt gggtctgtaa 1830
<210> 35
<211> 1056
<212> DNA
<213> Artificial Sequence
<220>
<223> variable region of a camelid antibody (VHH) with the S.
cerevisiae alpha-mating factor leader
<400> 35
atgagattcc catctatttt caccgctgtc ttgttcgctg cctcctctgc attggctgcc 60
cctgttaaca ctaccactga agacgagact gctcaaattc cagctgaagc agttatcggt 120
tactctgacc ttgagggtga tttcgacgtc gctgttttgc ctttctctaa ctccactaac 180
aacggtttgt tgttcattaa caccactatc gcttccattg ctgctaagga agagggtgtc 240
tctctcgaga agagacaagc cggtggttca ttaagattgt cctgtgctgc ctctggtaga 300
actttcactt ctttcgcaat gggttggttt agacaagcac ctggaaaaga gagagagttt 360
gttgcttcta tctccagatc cggtacttta actagatacg ctgactctgc caagggtaga 420
ttcactattt ctgttgacaa cgccaagaac actgtttctt tgcaaatgga caaccttaac 480
ccagatgaca ccgcagtcta ttactgtgcc gctgacttgc acagaccata cggtccagga 540
acccaaagat ccgatgagta cgattcttgg ggtcagggaa ctcaagtcac tgtctcttca 600
ggtggtggat ctggtggtgg aggttcaggt ggtggaggat ccggtggtgg tggttctggt 660
ggtggtggat ctggtggagg tgaagttcaa cttgtcgaat ccggtggtgc acttgtccaa 720
cctggtggat ctcttagact ttcttgtgcc gcctccggtt ttcctgttaa ccgttactct 780
atgcgttggt acagacaagc ccctggaaaa gaacgtgaat gggttgccgg aatgtcctca 840
gctggtgaca gatcctccta cgaagattct gtgaagggac gtttcaccat ctccagagat 900
gacgcccgta acaccgttta ccttcaaatg aactccctta agcctgagga tactgccgtc 960
tactattgta acgtgaatgt cggatttgaa tactggggac agggaaccca agttactgtc 1020
tcttccggtg gacatcacca ccaccatcac taatag 1056
<210> 36
<211> 991
<212> DNA
<213> Pichia pastoris
<400> 36
gcaaggcaac tgagaaattg aatagtggtt tcaagcccgc tgactttttg tattatctca 60
atgtcggtgt ttcacagtcc ccagaagggg gctttgcctt caagggagac ggaagagaca 120
tcgtcaaccc tggggagaag tatttcaaat ggcgcaagtt cgctaatttt tacgattaag 180
cagtgctgta tggggtagtt aataaatcgg gaatatcctt ctgacgtgac tgtaacaaat 240
ctctttttac gtggtgcgca tactggacag aggcagagtc tcaatttctt cttttgagac 300
aggctactac agcctgtgat tcctcttggt acttggattt gcttttatct ggctccgttg 360
ggaactgtgc ctgggttttg aagtatcttg tggatgtgtt tctaacactt tttcaatctt 420
cttggagtga gaatgcagga ctttgaacat cgtctagctc gttggtaggt gaaccgtttt 480
accttgcatg tggttaggag ttttctggag taaccaagac cgtcttatca tcgccgtaaa 540
atcgctctta ctgtcgctaa taatcccgct ggaagagaag ttcgaacaga agtagcacgc 600
aaagctcttg tcaaatgaga attgttaatc gtttgacagg tcacactcgt gggctatgta 660
cgatcaactt gccggctgtt gctggagaga tgacaccagt tgtggcatgg ccaattggta 720
ttcagccgta ccactgtatg gaaaatgaga ttatcttgtt cttgatctag tttcttgcca 780
ttttagagtt gccacattcg taggtttcag taccaataat ggtaacttcc aaacttccaa 840
cgcagatacc agagatctgc cgatccttcc ccaacaatag gagcttacta cgccatacat 900
atagcctatc tattttcact ttcgcgtggg tgcttctata taaacggttc cccatcttcc 960
gtttcatact acttgaattt taagcactaa a 991
<210> 37
<211> 864
<212> DNA
<213> Pichia pastoris
<400> 37
cttttctttg ggcaaggaaa aatcaagaaa aagcagaggt taaagttttc aggggaatgg 60
caattgcttt atatatggga gaaagttaac tacgtcggtg ctgtaggcgt agagagcgac 120
tggagaatgc gtgatgaggt cgtctctttt cgccccccct tggcggggta aaaattgcac 180
tactgcagaa ttactacacc cctattccga ggagacggag tgcgacaaaa atggtaaagt 240
tcaccctagt ctgcgacttt taattgacgg acaccggcgt ttacatgcga aaaaaactaa 300
agtgcgcgca tttcacggcc gaggggggtc ccacttggga ctgagagggg gtgggatctg 360
aaatcgagga ggtatcaaga ccccccgttt ctcaactccc taatcaaaaa ttacgaagtc 420
ctcgttggaa aggagttaaa ataattaagc ggggtcggac gccataccga ggttatcttg 480
caggcatttt actaatattg gaattcggag ctcaacttgc aaccaggcag ggtttagcta 540
tgtaatcaat gtaatcaata taataaagca ctaccacatc gaaggtttgg gagggaggcc 600
aatagtgtcc cccacagggt gctgatatcg cgattcttgg gtgaggagac acatatttca 660
ctcctctcac caaccaacca agcggctcct cgcaagatga tttatccgat tatccggaca 720
ctatactccc atccagtttg atgccgattt catcgattgt cctaaataat ccttaaatat 780
gtatagaacg gtaccctggg gttacataat ccttatttaa taatccctcc cccaccgctt 840
ttcttttttt ttcttcttat tgtc 864
<210> 38
<211> 1000
<212> DNA
<213> Pichia pastoris
<400> 38
aaatggcaga aggatcagcc tggacgaagc aaccagttcc aactgctaag taaagaagat 60
gctagacgaa ggagacttca gaggtgaaaa gtttgcaaga agagagctgc gggaaataaa 120
ttttcaattt aaggacttga gtgcgtccat attcgtgtac gtgtccaact gttttccatt 180
acctaagaaa aacataaaga ttaaaaagat aaacccaatc gggaaacttt agcgtgccgt 240
ttcggattcc gaaaaacttt tggagcgcca gatgactatg gaaagaggag tgtaccaaaa 300
tggcaagtcg ggggctactc accggatagc caatacattc tctaggaacc agggatgaat 360
ccaggttttt gttgtcacgg taggtcaagc attcacttct taggaatatc tcgttgaaag 420
ctacttgaaa tcccattggg tgcggaacca gcttctaatt aaatagttcg atgatgttct 480
ctaagtggga ctctacggct caaacttcta cacagcatca tcttagtagt cccttcccaa 540
aacaccattc taggtttcgg aacgtaacga aacaatgttc ctctcttcac attgggccgt 600
tactctagcc ttccgaagaa ccaataaaag ggaccggctg aaacgggtgt ggaaactcct 660
gtccagttta tggcaaaggc tacagaaatc ccaatcttgt cgggatgttg ctcctcccaa 720
acgccatatt gtactgcagt tggtgcgcat tttagggaaa atttacccca gatgtcctga 780
ttttcgaggg ctacccccaa ctccctgtgc ttatacttag tctaattcta ttcagtgtgc 840
tgacctacac gtaatgatgt cgtaacccag ttaaatggcc gaaaaactat ttaagtaagt 900
ttatttctcc tccagatgag actctccttc ttttctccgc tagttatcaa actataaacc 960
tattttacct caaatacctc caacatcacc cacttaaaca 1000
<210> 39
<211> 549
<212> DNA
<213> Pichia pastoris
<400> 39
aatgatataa acaacaattg agtgacaggt ctactttgtt ctcaaaaggc cataaccatc 60
tgtttgcatc tcttatcacc acaccatcct cctcatctgg ccttcaattg tggggaacaa 120
ctagcatccc aacaccagac taactccacc cagatgaaac cagttgtcgc ttaccagtca 180
atgaatgttg agctaacgtt ccttgaaact cgaatgatcc cagccttgct gcgtatcatc 240
cctccgctat tccgccgctt gctccaacca tgtttccgcc tttttcgaac aagttcaaat 300
acctatcttt ggcaggactt ttcctcctgc cttttttagc ctcaggtctc ggttagcctc 360
taggcaaatt ctggtcttca tacctatatc aacttttcat cagatagcct ttgggttcaa 420
aaaagaacta aagcaggatg cctgatatat aaatcccaga tgatctgctt ttgaaactat 480
tttcagtatc ttgattcgtt tacttacaaa caactattgt tgattttatc tggagaataa 540
tcgaacaaa 549
<210> 40
<211> 1000
<212> DNA
<213> Pichia pastoris
<400> 40
attactgttt tgggcaatcc tgttgataag acgcattcta gagttgtttc atgaaagggt 60
tacgggtgtt gattggtttg agatatgcca gaggacagat caatctgtgg tttgctaaac 120
tggaagtctg gtaaggactc tagcaagtcc gttactcaaa aagtcatacc aagtaagatt 180
acgtaacacc tgggcatgac tttctaagtt agcaagtcac caagagggtc ctatttaacg 240
tttggcggta tctgaaacac aagacttgcc tatcccatag tacatcatat tacctgtcaa 300
gctatgctac cccacagaaa taccccaaaa gttgaagtga aaaaatgaaa attactggta 360
acttcacccc ataacaaact taataatttc tgtagccaat gaaagtaaac cccattcaat 420
gttccgagat ttagtatact tgcccctata agaaacgaag gatttcagct tccttacccc 480
atgaacagaa atcttccatt taccccccac tggagagatc cgcccaaacg aacagataat 540
agaaaaaaga aattcggaca aatagaacac tttctcagcc aattaaagtc attccatgca 600
ctccctttag ctgccgttcc atccctttgt tgagcaacac catcgttagc cagtacgaaa 660
gaggaaactt aaccgatacc ttggagaaat ctaaggcgcg aatgagttta gcctagatat 720
ccttagtgaa gggttgttcc gatacttctc cacattcagt catagatggg cagctttgtt 780
atcatgaaga gacggaaacg ggcattaagg gttaaccgcc aaattatata aagacaacat 840
gtccccagtt taaagttttt ctttcctatt cttgtatcct gagtgaccgt tgtgtttaat 900
ataacaagtt cgttttaact taagaccaaa accagttaca acaaattata acccctctaa 960
acactaaagt tcactcttat caaactatca aacatcaaaa 1000
<210> 41
<211> 1000
<212> DNA
<213> Pichia pastoris
<400> 41
gtcaactgcg tactcttttg tcgaatggac tactgaatct gcctcgatag ccactatagg 60
aaggtccata gaggccagtt tttcaactag tcttggtgga aagaaaccga caaagccttt 120
catggagtca ccgatactga aaggttcaaa caaagaatgc ttgggtagtc tcttaatacc 180
catggcaacg aaaaaggggt cttcattgtt caacatgaat tcgtatccac ctttaatgta 240
gtcataaagc tgctgaagtt ccgaatcagt gatggaactg tctacagtga caatatagga 300
gttctcaatc accttatatc cagtcgaata tatctggata gggtcgggtc tcactgtgga 360
agattcaaat gggttagatc cctgtaattt cagcgatgga gactcagtat gatggggcaa 420
ggaaaacggc aattggatat tcaattggtc aagagatggt atcaaaagcg agtgtgccag 480
ggtagccacg gtagccactg atgctaatct gataattttc atttctggag tgtcaaaaca 540
gtagtgataa aaggctatga aggaggttgt ctaggggctc gcggaggaaa gtgattcaaa 600
cagacctgcc aaaaagagaa aaaagaggga atccctgttc tttccaatgg aaatgacgta 660
actttaactt gaaaaatacc ccaaccagaa gggttcaaac tcaacaagga ttgcgtaatt 720
cctacaagta gcttagagct gggggagaga caactgaagg cagcttaacg ataacgcggg 780
gggattggtg cacgactcga aaggaggtat cttagtcttg taacctcttt tttccagagg 840
ctattcaaga ttcataggcg atatcgatgt ggagaagggt gaacaatata aaaggctgga 900
gagatgtcaa tgaagcagct ggatagattt caaattttct agatttcaga gtaatcgcac 960
aaaacgaagg aatcccacca agcaaaaaaa aaaatctaag 1000
<210> 42
<211> 704
<212> DNA
<213> Pichia pastoris
<400> 42
aaattaatcc ataagataag gcaaatgtgc ttaagtaatt gaaaacagtg ttgtgattat 60
ataagcatgg tatttgaata gaactactgg ggttaactta tctagtagga tggaagttga 120
gggagatcaa gatgcttaaa gaaaaggatt ggccaatatg aaagccataa ttagcaatac 180
ttatttaatc agataattgt ggggcattgt gacttgactt ttaccaggac ttcaaacctc 240
aaccatttaa acagttatag aagacgtacc gtcacttttg cttttaatgt gatctaaatg 300
tgatcacatg aactcaaact aaaatgatat cttttactgg acaaaaatgt tatcctgcaa 360
acagaaagct ttcttctatt ctaagaagaa catttacatt ggtgggaaac ctgaaaacag 420
aaaataaata ctccccagtg accctatgag caggattttt gcatccctat tgtaggcctt 480
tcaaactcac acctaatatt tcccgccact cacactatca atgatcactt cccagttctc 540
ttcttcccct attcgtacca tgcaaccctt acacgccttt tccatttcgg ttcggatgcg 600
acttccagtc tgtggggtac gtagcctatt ctcttagccg gtatttaaac atacaaattc 660
acccaaattc taccttgata aggtaattga ttaatttcat aaat 704
<210> 43
<211> 1000
<212> DNA
<213> Pichia pastoris
<400> 43
agctcagatt ggaaatgatt tttgatccta ccaagaagcc tttgatttcc agaatctccg 60
ctaagtaagt aacccccgca aacgcatgca tccatgcaaa caaaatacta acaattttag 120
ccccgttgtt gagaaaccca gaaaattgaa tgttcaacca atccagacga tcaataagaa 180
aaaaggccca aaggctactt ccaaacctgc tgccgccaaa cctgctcctt caaaagccgg 240
tcccaaggga ggtaagaagg tgagaaagcc aaagaagaca gttgaagaat tggatcagga 300
aatggctgac tactttgaaa ataagaatta gcccaacaaa atatgtacaa gtattatata 360
aatgaatcta catggtgtgt tttatttaga tcctccaaac caaggaaaga aactaaactt 420
atctccggac ttacgagtca aataactatc cgcagttcct tggaactcag actttcttcc 480
ataagcggtc atatcatctt tggactgtgg gaatcctgga cgaatctttg aaatgtcata 540
atcttgctct ctatctccaa gcacagcgtc cggtaaatgc tggttcttct ttctcagatg 600
aatcttggat ttaacaaata aagccgtgcc tatggctaat gtactcaaaa acaaagtctg 660
cttccagaat ttcgcaaacg atggaatgcc atttcctgta aatgtactca ttgaacctat 720
gtttgattaa agttggtgtg aagtcatcaa acgagagtaa aatcagatac tcgtgcaccg 780
gccaaaattg actgagctaa tctctgcagg cttgacatcc gaacacaaca aataggcgac 840
aaatcttaac tatctaatcg taggctatgg tagaactttg tgggggtaga ggaagactac 900
aacagcaaga caaaacaaaa gagtcatagt ttgactctct gcttttttct tctttctctt 960
ctttttcttc ctccatattc gttatttatt tcgaactgga 1000
<210> 44
<211> 1000
<212> DNA
<213> Pichia pastoris
<400> 44
cagccattaa tctcacctca gtttttgaat cagtagaatt tttaatgaaa caaacggttg 60
gtatattatt tgatagagtt gccaaatttc caaagataaa tttttcatca ggtaatatcc 120
tgaataccgt aacatagtga ctattggaag acactgctat catattatat ttcggataaa 180
aatccaaacc ccagaccgac ctcttgagtc tcaactccaa gtcagccgca actttaatta 240
tccgtggatt gggagctagt ttggacaacg catcagtata atataacttt acggttccat 300
tatcagacgc tattgcaaga acttcctttc cattgatctc gccaatgcgg cagtaattga 360
tatcgtaggg taggtctgga aagacgctgg cgcttgtgtc ccattctgca ggaatctctg 420
gcacggtgct aatggtagtt atccaacgga gctgaggtag tcgatatatc tggatatgcc 480
gcctatagga taaaaacagg agagggtgaa ccttgcttat ggctactaga ttgttcttgt 540
actctgaatt ctcattatgg gaaactaaac taatctcatc tgtgtgttgc agtactattg 600
aatcgttgta gtatctacct ggagggcatt ccatgaatta gtgagataac agagttgggt 660
aactagagag aataatagac gtatgcatga ttactacaca acggatgtcg cactctttcc 720
ttagttaaaa ctatcatcca atcacaagat gcgggctgga aagacttgct cccgaaggat 780
aatcttctgc ttctatctcc cttcctcata tggtttcgca gggctcatgc cccttcttcc 840
ttcgaactgc ccgatgagga agtccttagc ctatcaaaga attcgggacc atcatcgatt 900
tttagagcct tacctgatcg caatcaggat ttcactactc atataaatac atcgctcaaa 960
gctccaactt tgcttgttca tacaattctt gatattcaca 1000
<210> 45
<211> 1000
<212> DNA
<213> Pichia pastoris
<400> 45
tggttccctc tcggtccaat accaaaaata ttatcaccat acaggtctcc cttcgatacc 60
agtgcaaagt tgaaccgtgg gattaccttg gaatctacaa aaatagtgtc actcacaagt 120
ttgtcatcaa ccacgctgcc gcttgcaaag gagaactgaa catgaaggtt gttagggttt 180
gttatattgg aataagtggt ggatttgttg aaggcgaacg caccaaagct acatccgtcc 240
tgagcacact gtgaatttgt cacggaattg accaagaggt cagacgatcc tgtatcccat 300
tgagccgtta tgctttgtgg gggaaaccct atttctatcg tactaagaaa accaatggtg 360
aactcatatt cggtatcaat ggcgacgatt ccagcatagc ctgtagacag taacaacact 420
agggcaacag caactaacat atcttcattg atgaaacgtt gtgatcggtg tgacttttat 480
agtaaaagct acaactgttt gaaataccaa gatatcattg tgaatggctc aaaagggtaa 540
tacatctgaa aaacctgaag tgtggaaaat tccgatggag ccaactcatg ataacgcaga 600
agtcccattt tgccatcttc tcttggtatg aaacggtaga aaatgatccg agtatgccaa 660
ttgatactct tgattcatgc cctatagttt gcgtagggtt taattgatct cctggtctat 720
cgatctggga cgcaatgtag accccattag tggaaacact gaaagggatc caacactcta 780
ggcggacccg ctcacagtca tttcaggaca atcaccacag gaatcaacta cttctcccag 840
tcttccttgc gtgaagcttc aagcctacaa cataacactt cttacttaat ctttgattct 900
cgaattgttt acccaatctt gacaacttag cctaagcaat actctggggt tatatatagc 960
aattgctctt cctcgctgta gcgttcattc catctttcta 1000
<210> 46
<211> 1001
<212> DNA
<213> Pichia pastoris
<400> 46
gatatcgatc tacacttaat agtagatgac gaggcatctc tccaataggt accatatctg 60
gtgtttcttg taatttaaga atctgttggt ctatgaatgt agatttgtca tgaacaatga 120
tatatgggtc aggaggacaa gatggtttct ctgagttggg ttgttgaggt gcctggcaag 180
acttcggagc gttgatatcc ccaagacttg tagtgaccga tagttgaagc gtgtgtttgc 240
aggaacggca catcaatgca actttcgtaa ctttggaatt gagagttgat gcactgatga 300
cgatacccga aattttgacg attttaccaa tatgacttga agacaagtct ctcattgaaa 360
ccttattatc gttactaagc aaaacgagct gacaagaagg gaaggtggtc ggtatttcct 420
cgttgttcaa atatatgatt ctcctggcaa tatctgtgat ggcctgttca aaaagtggaa 480
tcatttctgc aggatcatct accaactttt tattgagctc ctcattgaat acgattaagt 540
ggtcattttg aatcgtcagt aagtacttgt ttacaagtaa attctgtctg agttgttctc 600
tgtagatgta ctgattttcc atacgaaact ccaaaatgaa cgaacggaat gccttaatga 660
cctcactgaa ctggtcatcg ttctgttctc cgggaaggac acttgtgtta aagactgatg 720
ctctatcaaa ggacattgca acaaagtata aacggttgtg agcgggaaaa agatgtgtag 780
gtaattgtcg tagatgagac tgattcagta gaaaacgcgt cctgcactat ttttttcttt 840
cttcattaca tttcctaatc gggacaaaat gaatctaaag acgtggttat gtagtacacg 900
catcgatagg ctatccccat accaaaacac tattttaccc catccttgac aggttataaa 960
tatgcgatag tatgagtatc ttcaaattca gctgaaatat c 1001
<210> 47
<211> 1000
<212> DNA
<213> Pichia pastoris
<400> 47
aataaaaaaa cgttatagaa agaaattgga ctacgatatg ctccaatcca aattgtcaaa 60
attgaccacc gaaaaagaac aattggaatt tgacaagagg aacaactcac tagattctca 120
aacggagcgt cacctagagt cagtttccaa gtcaattaca gaaagtttgg aaacagaaga 180
ggagtatcta caattgaatt ccaaacttaa agtcgagctg tccgaattca tgtcgctaag 240
gctttcttac ttggacccca tttttgaaag tttcattaaa gttcagtcaa aaattttcat 300
ggacatttat gacacattaa agagcggact accttatgtt gattctctat ccaaagagga 360
ttatcagtcc aagatcttgg actctagaat agataacatt ctgtcgaaaa tggaagcgct 420
gaaccttcaa gcttacattg atgattagag caatgatata aacaacaatt gagtgacagg 480
tctactttgt tctcaaaagg ccataaccat ctgtttgcat ctcttatcac cacaccatcc 540
tcctcatctg gccttcaatt gtggggaaca actagcatcc caacaccaga ctaactccac 600
ccagatgaaa ccagttgtcg cttaccagtc aatgaatgtt gagctaacgt tccttgaaac 660
tcgaatgatc ccagccttgc tgcgtatcat ccctccgcta ttccgccgct tgctccaacc 720
atgtttccgc ctttttcgaa caagttcaaa tacctatctt tggcaggact tttcctcctg 780
ccttttttag cctcaggtct cggttagcct ctaggcaaat tctggtcttc atacctatat 840
caacttttca tcagatagcc tttgggttca aaaaagaact aaagcaggat gcctgatata 900
taaatcccag atgatctgct tttgaaacta ttttcagtat cttgattcgt ttacttacaa 960
acaactattg ttgattttat ctggagaata atcgaacaaa 1000
<210> 48
<211> 1000
<212> DNA
<213> Pichia pastoris
<400> 48
attgttgtga atactctcct tcatttggat ttcttggact tcggactctc ttgatctctc 60
ttcgaaagtt ttaactctgt tcatgtataa ttttacccgc tgtaggtcgc tcataatacc 120
atgagtatgc acatctttta ctccattaac tttcaggtat gcaaaataca atgaagatag 180
tatatagctc aaagaattta gcattttgca ttgatctaat tgtgacattt tctctatgat 240
atcatctagc ttcttaaact cgagaatctc gtccaacgag gcagaaacat tgtccagtct 300
tacgtcaaga ttattcacga gtttctggac cgtatcaacg ttttccatct taagattaca 360
gtaagtatcg tccttttgaa ctgcaaaggt agaaaagtta atttttgatt tggtagtaca 420
ctatgaaact tgctcacccc aatctttcct cctgacaggt tgatctttat ccctctacta 480
aattgcccca agtgtatcaa gtagactaga tctcgcgaaa gaacagccta ataaactccg 540
aagcatgatg gcctctatcc ggaaaacgtt aagagatgtg gcaacaggag ggcacataga 600
atttttaaag acgctgaaga atgctatcat agtccgtaaa aatgtgatag tactttgttt 660
agtgcgtacg ccacttattc ggggccaata gctaaaccca ggtttgctgg cagcaaattc 720
aactgtagat tgaatctctc taacaataat ggtgttcaat cccctggctg gtcacgggga 780
ggactatctt gcgtgatccg cttggaaaat gttgtgtatc cctttctcaa ttgcggaaag 840
catctgctac ttcccatagg caccagttac ccaattgata tttccaaaaa agattaccat 900
atgttcatct agaagtataa atacaagtgg acattcaatg aatatttcat tcaattagtc 960
attgacactt tcatcaactt actacgtctt attcaacaat 1000
<210> 49
<211> 1000
<212> DNA
<213> Pichia pastoris
<400> 49
tatacggtct atccactttg gaaacgatgt agttgaaacg gggaagtaat agtggttccc 60
aaacgacatg aagaggttat ataagtttgc aagagggtga caccatttta gttgtggttc 120
ccgggtattt ttttaatctt tttagtctaa gatagcctcc ccagatatta ccgagttggg 180
ccatttgggg cggtatcggt ggtatctgat ggtagcgcgt ttttacatgc ctgtgcattg 240
aactggcaaa gagtatacta tcgtggggcc ctgaaggagg cagcaaatgg accgtcaatt 300
ggttgatcag ggactcaaga caggtattga gcttttcaaa caaaaagagt ataggcgctg 360
ctacaaggca tttacttcta ctatcaattt cattgagaat gatcccgagt tggccgccag 420
ctgtgtatct caactgatat ctctgttaga ttgtagggca gcctgtttgg aaaagctaga 480
tcaattgaat atggccttga aagatggtct taaaatgatc aagagagagt gccacaactg 540
caagggttat ttgagaactt gcaaaatttt agacctacaa gggaagatca gtgaggcttt 600
gtctacagca agagaaggga tctccataat agaaactaga agagatcagg ataatcaatt 660
tagatattcc aaggttcttt tggaacaatt aaaggaactg aaaaatgcac tgaaaatcaa 720
attggacaag aaaaatcagc tacacttcaa agttttaaag tttgacgcac cagtgccttg 780
tacaaagaaa ctaagattag tcactccaag aacaatagat ccttccattt ttttgccgat 840
agagctagtg aagctgatct ttcgcctgtt gaatttctca gacatgtatg cctgtttatt 900
ggtctcaaca aaatggaact caattatatc ctcatcaccg gaactgtttc gaaaacttca 960
gttgaaatcc caactgtcca acaaggcgtt aaacaattgt 1000
<210> 50
<211> 350
<212> PRT
<213> Unknown
<220>
<223> Komagataella phaffii
<400> 50
Met Ser Pro Thr Ile Pro Thr Thr Gln Lys Ala Val Ile Phe Glu Thr
1 5 10 15
Asn Gly Gly Pro Leu Glu Tyr Lys Asp Ile Pro Val Pro Lys Pro Lys
20 25 30
Ser Asn Glu Leu Leu Ile Asn Val Lys Tyr Ser Gly Val Cys His Thr
35 40 45
Asp Leu His Ala Trp Lys Gly Asp Trp Pro Leu Asp Asn Lys Leu Pro
50 55 60
Leu Val Gly Gly His Glu Gly Ala Gly Val Val Val Ala Tyr Gly Glu
65 70 75 80
Asn Val Thr Gly Trp Glu Ile Gly Asp Tyr Ala Gly Ile Lys Trp Leu
85 90 95
Asn Gly Ser Cys Leu Asn Cys Glu Tyr Cys Ile Gln Gly Ala Glu Ser
100 105 110
Ser Cys Ala Lys Ala Asp Leu Ser Gly Phe Thr His Asp Gly Ser Phe
115 120 125
Gln Gln Tyr Ala Thr Ala Asp Ala Thr Gln Ala Ala Arg Ile Pro Lys
130 135 140
Glu Ala Asp Leu Ala Glu Val Ala Pro Ile Leu Cys Ala Gly Ile Thr
145 150 155 160
Val Tyr Lys Ala Leu Lys Thr Ala Asp Leu Arg Ile Gly Gln Trp Val
165 170 175
Ala Ile Ser Gly Ala Gly Gly Gly Leu Gly Ser Leu Ala Val Gln Tyr
180 185 190
Ala Lys Ala Leu Gly Leu Arg Val Leu Gly Ile Asp Gly Gly Ala Asp
195 200 205
Lys Gly Glu Phe Val Lys Ser Leu Gly Ala Glu Val Phe Val Asp Phe
210 215 220
Thr Lys Thr Lys Asp Val Val Ala Glu Val Gln Lys Leu Thr Asn Gly
225 230 235 240
Gly Pro His Gly Val Ile Asn Val Ser Val Ser Pro His Ala Ile Asn
245 250 255
Gln Ser Val Gln Tyr Val Arg Thr Leu Gly Lys Val Val Leu Val Gly
260 265 270
Leu Pro Ser Gly Ala Val Val Asn Ser Asp Val Phe Trp His Val Leu
275 280 285
Lys Ser Ile Glu Ile Lys Gly Ser Tyr Val Gly Asn Arg Glu Asp Ser
290 295 300
Ala Glu Ala Ile Asp Leu Phe Thr Arg Gly Leu Val Lys Ala Pro Ile
305 310 315 320
Lys Ile Ile Gly Leu Ser Glu Leu Ala Lys Val Tyr Glu Gln Met Glu
325 330 335
Ala Gly Ala Ile Ile Gly Arg Tyr Val Val Asp Thr Ser Lys
340 345 350
<210> 51
<211> 1053
<212> DNA
<213> Unknown
<220>
<223> Komagataella phaffii
<400> 51
atgtctccaa ctatcccaac tacacaaaag gctgttatct tcgagaccaa cggcggtccc 60
ctagagtaca aggacattcc agtcccaaag ccaaagtcaa acgaactttt gatcaacgtt 120
aagtactccg gtgtctgtca cactgatttg cacgcctgga agggtgactg gccattggac 180
aacaagcttc ctttggttgg tggtcacgaa ggtgctggtg tcgttgtcgc ttacggtgag 240
aacgtcactg gatgggagat cggtgactac gctggtatca aatggttgaa cggttcttgt 300
ttgaactgtg agtactgtat ccaaggtgct gaatccagtt gtgccaaggc tgacctgtct 360
ggtttcaccc acgacggatc tttccagcag tatgctactg ctgatgccac ccaagccgcc 420
agaattccaa aggaggctga cttggctgaa gttgccccaa ttctgtgtgc tggtatcacc 480
gtttacaagg ctcttaagac cgctgacttg cgtattggcc aatgggttgc catttctggt 540
gctggtggag gactgggttc tcttgccgtt caatacgcca aggctctggg tttgagagtt 600
ttgggtattg atggtggtgc cgacaagggt gaatttgtca agtccttggg tgctgaggtc 660
ttcgtcgact tcactaagac taaggacgtc gttgctgaag tccaaaagct caccaacggt 720
ggtccacacg gtgttattaa cgtctccgtt tccccacatg ctatcaacca atctgtccaa 780
tacgttagaa ctttgggtaa ggttgttttg gttggtctgc catctggtgc cgttgtcaac 840
tctgacgttt tctggcacgt tctgaagtcc atcgagatca agggatctta cgttggaaac 900
agagaggaca gtgccgaggc catcgacttg ttcaccagag gtttggtcaa ggctcctatc 960
aagattatcg gtctgtctga acttgctaag gtctacgaac agatggaggc tggtgccatc 1020
atcggtagat acgttgtgga cacttccaaa taa 1053
<210> 52
<211> 350
<212> PRT
<213> Unknown
<220>
<223> Komagataella pastoris
<400> 52
Met Ser Pro Thr Ile Pro Ser Thr Gln Lys Ala Val Val Phe Glu Thr
1 5 10 15
Asn Gly Gly Pro Leu Glu Tyr Lys Asp Ile Pro Val Pro Lys Pro Lys
20 25 30
Ser Asn Glu Ile Leu Ile Asn Val Lys Tyr Ser Gly Val Cys His Thr
35 40 45
Asp Leu His Ala Trp Lys Gly Asp Trp Pro Leu Asp Asn Lys Leu Pro
50 55 60
Leu Val Gly Gly His Glu Gly Ala Gly Val Val Val Ala Leu Gly Glu
65 70 75 80
Asn Val Thr Gly Trp Asn Ile Gly Asp Tyr Ala Gly Ile Lys Trp Leu
85 90 95
Asn Gly Ser Cys Leu Asn Cys Glu Tyr Cys Ile Gln Gly Ala Glu Ser
100 105 110
Ser Cys Ala Lys Ala Asp Leu Ser Gly Phe Thr His Asp Gly Ser Phe
115 120 125
Gln Gln Tyr Ala Thr Ala Asp Ala Thr Gln Ala Ala Arg Ile Pro Lys
130 135 140
Glu Val Asp Leu Ala Glu Val Ala Pro Ile Leu Cys Ala Gly Ile Thr
145 150 155 160
Val Tyr Lys Ala Leu Lys Thr Ala Asp Leu Arg Ile Gly Gln Trp Val
165 170 175
Ala Ile Ser Gly Ala Gly Gly Gly Leu Gly Ser Leu Ala Val Gln Tyr
180 185 190
Ala Lys Ala Leu Gly Leu Arg Val Leu Gly Ile Asp Gly Gly Ala Asp
195 200 205
Lys Gly Glu Phe Val Lys Ser Leu Gly Ala Glu Val Tyr Val Asp Phe
210 215 220
Thr Lys Thr Lys Asp Val Val Ala Glu Val Gln Lys Ala Thr Asn Gly
225 230 235 240
Gly Pro His Gly Val Ile Asn Val Ser Val Ser Pro His Ala Ile Asn
245 250 255
Gln Ser Val Gln Tyr Ala Arg Thr Leu Gly Lys Ile Val Leu Val Gly
260 265 270
Leu Pro Ser Gly Ala Val Val Asn Ser Asp Val Phe Trp His Val Leu
275 280 285
Lys Ser Ile Glu Ile Lys Gly Ser Tyr Val Gly Asn Arg Glu Asp Ser
290 295 300
Ala Glu Ala Ile Asp Leu Phe Ala Arg Gly Leu Val Lys Ala Pro Ile
305 310 315 320
Lys Ile Ile Gly Leu Ser Glu Leu Ala Lys Val Tyr Glu Gln Met Glu
325 330 335
Ala Gly Ala Ile Ile Gly Arg Tyr Val Val Asp Thr Ser Lys
340 345 350
<210> 53
<211> 1053
<212> DNA
<213> Unknown
<220>
<223> Komagataella pastoris
<400> 53
atgtctccaa ctatcccatc tacacaaaag gctgttgtct tcgagaccaa cggcggtcct 60
ctcgagtaca aggacatccc tgtcccaaag ccaaagtcca acgaaatctt gatcaacgtt 120
aagtactccg gtgtctgtca cactgacttg cacgcctgga agggtgactg gccattggac 180
aacaagcttc ctttggtcgg tggtcacgaa ggtgctggtg tcgttgtcgc tttaggtgag 240
aacgtcactg gatggaacat cggtgactac gctggtatca aatggttgaa cggttcttgt 300
ttgaactgtg agtactgtat ccaaggtgct gaatccagtt gtgccaaggc tgacctgtct 360
ggtttcaccc acgacggatc tttccagcag tatgctactg ctgatgccac ccaagccgcc 420
agaattccaa aggaagttga cttggctgaa gttgccccaa ttttgtgtgc tggtatcacc 480
gtttacaagg ctcttaagac cgctgacttg cgtatcggcc aatgggttgc catttccggt 540
gctggtggag gattaggttc tcttgccgtt caatacgcca aggctctggg tttgagagtt 600
ttgggtattg atggtggtgc cgacaagggt gagttcgtca agtccttggg tgctgaggtc 660
tacgtcgact tcactaagac taaggacgtc gttgctgagg tccaaaaggc caccaacggt 720
ggtccacacg gtgttatcaa cgtctccgtt tccccacatg ctatcaacca atctgtccaa 780
tacgctagaa ctttgggtaa gattgttttg gttggtctgc catctggtgc cgttgtcaac 840
tctgacgttt tctggcacgt tctgaagtcc atcgagatca agggatctta cgttggaaac 900
agagaggaca gtgccgaagc catcgacttg ttcgctagag gcttagtcaa ggctcctatt 960
aagattattg gtctgtccga acttgctaag gtctacgagc agatggaggc tggtgccatc 1020
atcggtagat acgttgtgga cacttccaaa taa 1053
<210> 54
<211> 349
<212> PRT
<213> Unknown
<220>
<223> Ogataea parapolymorpha
<400> 54
Met Thr Ser Ile Pro Lys Thr Gln Lys Ala Val Val Phe Glu Thr Asn
1 5 10 15
Gly Gly Pro Leu Leu Tyr Lys Asp Ile Pro Val Pro Gln Pro Lys Pro
20 25 30
Asn Glu Ile Leu Val Asn Val Lys Tyr Ser Gly Val Cys His Thr Asp
35 40 45
Leu His Ala Trp Lys Gly Asp Trp Pro Leu Asp Thr Lys Leu Pro Leu
50 55 60
Val Gly Gly His Glu Gly Ala Gly Val Val Val Ala Lys Gly Ala Asn
65 70 75 80
Val Thr Asn Phe Glu Ile Gly Asp Tyr Ala Gly Ile Lys Trp Leu Asn
85 90 95
Gly Ser Cys Met Gly Cys Glu Phe Cys Gln Gln Gly Ala Glu Pro Asn
100 105 110
Cys Pro Glu Ala Asp Leu Ser Gly Tyr Thr His Asp Gly Ser Phe Gln
115 120 125
Gln Tyr Ala Thr Ala Asp Ala Val Gln Ala Ala Lys Ile Pro Lys Gly
130 135 140
Thr Asn Leu Ala Asp Val Ala Pro Ile Leu Cys Ala Gly Val Thr Val
145 150 155 160
Tyr Lys Ala Leu Lys Thr Ala Glu Leu Ser Pro Gly Gln Trp Val Ala
165 170 175
Ile Ser Gly Ala Gly Gly Gly Leu Gly Ser Leu Ala Val Gln Tyr Ala
180 185 190
Val Ala Met Gly Leu Arg Val Leu Gly Ile Asp Gly Gly Asp Glu Lys
195 200 205
Ala Lys Leu Phe Glu Ser Leu Gly Gly Glu Val Phe Ile Asp Phe Thr
210 215 220
Lys Glu Lys Asp Ile Val Gly Ala Val Gln Lys Ala Thr Asn Gly Gly
225 230 235 240
Pro His Gly Val Ile Asn Val Ser Val Ser Pro Ala Ala Ile Ser Gln
245 250 255
Ser Cys Gln Tyr Val Arg Thr Leu Gly Lys Val Val Leu Val Gly Leu
260 265 270
Pro Ala Gly Ala Val Cys Glu Ser Pro Val Phe Glu His Val Ile Lys
275 280 285
Ser Ile Gln Ile Arg Gly Ser Tyr Val Gly Asn Arg Gln Asp Thr Ala
290 295 300
Glu Ser Ile Asp Phe Phe Val Arg Gly Lys Val Lys Ala Pro Ile Lys
305 310 315 320
Val Val Gly Leu Ser Glu Leu Pro Lys Val Phe Glu Leu Met Glu Gln
325 330 335
Gly Lys Ile Ala Gly Arg Tyr Val Leu Asp Thr Ser Lys
340 345
<210> 55
<211> 1050
<212> DNA
<213> Unknown
<220>
<223> Ogataea parapolymorpha
<400> 55
atgacttcca ttccaaagac tcaaaaggcc gttgttttcg agaccaacgg tggtcctctt 60
ctctacaagg acatccctgt tccacaacca aagccaaatg agattcttgt caacgtcaag 120
tactccggtg tttgccacac cgatctccac gcttggaagg gtgactggcc attggacacc 180
aaacttccac tggtcggtgg tcacgagggt gctggtgttg ttgttgctaa gggtgccaac 240
gttaccaact ttgaaatcgg tgactacgct ggtatcaaat ggttgaacgg ctcgtgcatg 300
ggttgtgagt tctgtcaaca aggtgcagag ccaaactgtc ctgaggccga cctttccggt 360
tacacgcacg acggttcttt ccaacaatac gccactgctg atgctgtcca ggctgccaag 420
attccaaagg gaactaacct ggctgacgtt gctccaattc tctgtgctgg tgtcactgtg 480
tacaaggcat tgaagactgc cgaattgagc ccaggccaat gggttgctat ctctggtgct 540
ggtggaggat tgggttctct tgccgttcaa tacgctgtcg ccatgggcct gagagtcctg 600
ggtatcgatg gtggtgacga aaaggctaag ctcttcgaga gcttgggcgg agaagtcttc 660
atcgatttca ccaaggaaaa ggacattgtc ggagccgtcc agaaggcaac caacggtggt 720
ccacacggtg ttatcaacgt ttctgtgtct ccagcagcta tctctcaatc ctgccaatac 780
gtgagaactc ttggtaaggt tgttcttgtt ggtcttccag ccggtgctgt ttgcgagtct 840
ccagttttcg agcacgttat caagtctatc cagattagag gttcctacgt tggtaacaga 900
caggacactg ccgagtcgat tgacttcttc gtcagaggca aggttaaggc tccaatcaag 960
gttgttggcc tttctgagct gccaaaggtg ttcgagttga tggagcaagg aaagattgct 1020
ggaagatacg ttcttgacac ttccaaatag 1050
<210> 56
<211> 382
<212> PRT
<213> Unknown
<220>
<223> Ogataea parapolymorpha
<400> 56
Met Met Ser Ile Ser Arg Val Ala Ala Leu Arg Asn Gln Phe Ala Arg
1 5 10 15
Leu Ala Lys Pro Ala Val Val Gln Gln Val Phe Arg His Ser Thr Ala
20 25 30
Ser Ala Pro Thr Ile Pro Lys Thr Gln Met Gly Cys Val Phe Glu Thr
35 40 45
Asn Gly Gly Pro Ile Glu Tyr Lys Glu Ile Pro Val Pro Lys Pro Lys
50 55 60
Pro Asn Glu Ile Leu Val His Val Lys Tyr Ser Gly Val Cys His Thr
65 70 75 80
Asp Leu His Ala Trp Lys Gly Asp Trp Pro Leu Pro Val Lys Leu Pro
85 90 95
Leu Val Gly Gly His Glu Gly Ala Gly Val Val Val Ala Lys Gly Glu
100 105 110
Asn Val Lys Asn Phe Glu Ile Gly Asp Leu Ala Gly Ile Lys Trp Leu
115 120 125
Asn Gly Ser Cys Met Gly Cys Glu Phe Cys Gln Gln Gly Ala Glu Pro
130 135 140
Asn Cys Pro Asp Ala Asp Leu Ser Gly Tyr Thr His Asp Gly Ser Phe
145 150 155 160
Gln Gln Tyr Ala Thr Ala Asp Ala Val Gln Ala Ala Lys Leu Pro Pro
165 170 175
Gly Thr Asp Leu Ala Ala Val Ala Pro Ile Leu Cys Ala Gly Val Thr
180 185 190
Val Tyr Lys Ala Leu Lys Thr Ala Ala Leu Arg Pro Gly Gln Ile Val
195 200 205
Ala Ile Ser Gly Ala Ala Gly Gly Leu Gly Ser Leu Ala Val Gln Tyr
210 215 220
Ala Val Ala Met Gly Leu Arg Val Leu Gly Ile Asp Gly Gly Glu Gln
225 230 235 240
Lys Gly Glu Phe Ile Lys Lys Leu Gly Ala Glu Phe Tyr Val Asp Phe
245 250 255
Thr Lys Glu Lys Asp Ile Val Ser Ala Ile Gln Lys Ile Thr Asn Gly
260 265 270
Gly Pro His Gly Val Ile Asn Val Ser Val Ser Pro Ala Ala Ile Ser
275 280 285
Gln Ser Cys Gln Tyr Val Arg Thr Leu Gly Lys Val Val Leu Val Gly
290 295 300
Leu Pro Ala Gly Ala Val Cys Glu Ser Pro Val Phe Glu His Val Val
305 310 315 320
Lys Ser Ile Gln Ile Lys Gly Ser Tyr Val Gly Asn Arg Gln Asp Thr
325 330 335
Ala Glu Ala Val Asp Phe Phe Thr Arg Gly Leu Val Lys Ser Pro Phe
340 345 350
Gln Ile Ala Gly Leu Ser Glu Leu Pro Glu Val Phe Lys Lys Met Glu
355 360 365
Glu Gly Lys Ile Leu Gly Arg Tyr Val Leu Asp Thr Ser Lys
370 375 380
<210> 57
<211> 1149
<212> DNA
<213> Unknown
<220>
<223> Ogataea parapolymorpha
<400> 57
atgatgtcta tttcgagagt tgctgctttg agaaaccaat ttgctcggct agccaagccc 60
gctgttgtcc agcaggtctt cagacactct actgcctctg ctccaaccat cccaaagacc 120
cagatgggat gtgtttttga aaccaacggt ggtccaattg agtacaagga gatccctgtt 180
ccaaagccaa agcctaacga gattttggtc cacgtcaagt actctggtgt gtgccacact 240
gacttgcacg cctggaaggg tgactggcca ctgcctgtca aactcccact tgtgggtggt 300
cacgagggtg ccggtgttgt cgttgccaag ggtgagaacg ttaaaaactt cgagatcggc 360
gacttggccg gtatcaagtg gctgaacggc tcgtgtatgg gttgtgagtt ctgtcaacag 420
ggtgccgaac caaactgtcc agacgctgac ctgtccggtt acacgcacga cggttctttc 480
caacaatacg ccactgctga cgctgtccag gccgctaagc tgcctcctgg aactgacctc 540
gctgctgttg ctcctatttt gtgtgctggt gtcactgttt acaaggcctt gaagactgct 600
gctctgcgtc caggacagat cgttgccatt tccggtgccg ccggtggatt gggttctctt 660
gccgttcaat acgctgtcgc catgggcctg agagttctgg gtattgacgg tggtgagcaa 720
aagggcgagt tcatcaagaa gctcggtgcc gaattctacg tcgacttcac caaggagaag 780
gacattgtgt ctgccatcca gaagatcacc aacggcggtc cacacggtgt catcaacgtt 840
tctgtctctc cagctgctat ctcccagtct tgtcaatacg tgagaaccct cggtaaggtt 900
gttctggtcg gtcttccagc cggcgctgtt tgcgagtctc ctgtctttga gcacgtcgtc 960
aagtccatcc agatcaaggg atcttacgtt ggtaacagac aagacactgc cgaggccgtg 1020
gacttcttca ccagaggcct tgtcaagtct ccattccaga ttgctggtct ttccgagctg 1080
ccagaggtct tcaagaagat ggaggagggc aagatcttgg gcagatacgt ccttgacact 1140
tctaaatag 1149
<210> 58
<211> 349
<212> PRT
<213> Unknown
<220>
<223> Ogataea polymorpha
<400> 58
Met Pro Ser Ile Pro Lys Thr Gln Lys Ala Ile Val Phe Glu Thr Asn
1 5 10 15
Gly Gly Pro Leu Leu Tyr Lys Asp Ile Pro Val Pro Gln Pro Lys Pro
20 25 30
Asn Glu Ile Leu Val Asn Val Lys Tyr Ser Gly Val Cys His Thr Asp
35 40 45
Leu His Ala Trp Lys Gly Asp Trp Pro Leu Ala Thr Lys Leu Pro Leu
50 55 60
Val Gly Gly His Glu Gly Ala Gly Val Val Val Ala Lys Gly Ala Asn
65 70 75 80
Val Thr Asn Phe Glu Ile Gly Asp Tyr Ala Gly Ile Lys Trp Leu Asn
85 90 95
Gly Ser Cys Met Gly Cys Glu Phe Cys Gln Gln Gly Ala Glu Pro Asn
100 105 110
Cys Pro Asp Ala Asp Leu Ser Gly Tyr Thr His Asp Gly Ser Phe Gln
115 120 125
Gln Tyr Ala Thr Ala Asp Ala Val Gln Ala Ala Lys Ile Pro Lys Gly
130 135 140
Thr Asn Leu Ala Asp Val Ala Pro Ile Leu Cys Ala Gly Val Thr Val
145 150 155 160
Tyr Lys Ala Leu Lys Thr Ala Glu Leu Ser Pro Gly Gln Trp Val Ala
165 170 175
Ile Ser Gly Ala Gly Gly Gly Leu Gly Ser Leu Ala Val Gln Tyr Ala
180 185 190
Val Ala Met Gly Leu Arg Val Leu Gly Ile Asp Gly Gly Asp Glu Lys
195 200 205
Ala Lys Leu Phe Glu Ser Leu Gly Gly Glu Val Phe Ile Asp Phe Thr
210 215 220
Lys Glu Lys Asp Ile Val Gly Ala Val Gln Lys Ala Thr Asn Gly Gly
225 230 235 240
Pro His Gly Val Ile Asn Val Ser Val Ser Pro Ala Ala Ile Ser Gln
245 250 255
Ser Cys Gln Tyr Val Arg Thr Leu Gly Lys Val Val Leu Val Gly Leu
260 265 270
Pro Ala Gly Ala Val Cys Glu Ser Pro Val Phe Glu His Val Ile Lys
275 280 285
Ser Ile Gln Ile Arg Gly Ser Tyr Val Gly Asn Arg Gln Asp Thr Ala
290 295 300
Glu Ser Ile Asp Phe Phe Val Arg Gly Lys Val Lys Ala Pro Ile Lys
305 310 315 320
Val Val Gly Leu Ser Glu Leu Pro Lys Val Phe Glu Leu Met Glu Gln
325 330 335
Gly Lys Ile Ala Gly Arg Tyr Val Leu Asp Thr Ser Lys
340 345
<210> 59
<211> 1050
<212> DNA
<213> Unknown
<220>
<223> Ogataea polymorpha
<400> 59
atgccttcca ttccaaagac tcaaaaggcc attgttttcg aaaccaacgg tggtcctctt 60
ctatacaagg acatccctgt tccacagcca aagccaaatg aaatccttgt caacgtcaag 120
tactctggtg tgtgccacac cgacttgcac gcctggaagg gtgactggcc attggccacc 180
aaacttccac tggtcggtgg tcacgagggt gctggtgttg ttgttgccaa gggtgccaac 240
gttaccaact ttgagatcgg cgactacgct ggtatcaaat ggctgaacgg ctcgtgtatg 300
ggttgtgagt tctgtcaaca aggtgcagaa ccaaactgtc cagacgccga cctttccggt 360
tacacgcacg acggttcctt ccaacaatac gccactgctg atgctgtcca ggctgccaag 420
attccaaagg gaactaacct ggccgatgtt gctccaattc tctgtgctgg tgtcactgtg 480
tacaaggcat tgaagactgc cgaattgagc ccaggccagt gggtcgctat ctctggtgct 540
ggtggaggat tgggttctct tgccgttcaa tacgctgtcg ctatgggcct gagagttctg 600
ggtatcgatg gtggtgacga aaaggccaag ctcttcgaga gcttgggcgg agaagtcttc 660
atcgatttca caaaggaaaa ggacattgtc ggagccgtcc agaaggctac caacggtggt 720
ccacacggtg tcatcaacgt ttccgtgtct ccagcagcta tctctcaatc ctgccaatac 780
gtgagaactc ttggtaaggt tgttcttgtt ggtcttccag caggtgctgt ttgcgagtct 840
ccagttttcg agcacgttat caagtctatc cagattagag gttcctacgt tggtaacaga 900
caggacactg cggagtcgat cgacttcttc gtcagaggca aggttaaggc tccaatcaag 960
gttgttggtc tttctgagct gccaaaagtg ttcgagttga tggagcaagg aaagattgca 1020
ggaagatacg tcctcgacac ttccaaatag 1050
<210> 60
<211> 381
<212> PRT
<213> Unknown
<220>
<223> Ogataea polymorpha
<400> 60
Met Ser Ile Ser Arg Val Ala Ala Leu Arg Asn Gln Phe Ala Arg Leu
1 5 10 15
Ala Lys Pro Ala Val Val Gln Gln Val Phe Arg His Ser Thr Ala Ser
20 25 30
Ala Pro Thr Ile Pro Lys Thr Gln Met Gly Cys Val Phe Glu Thr Asn
35 40 45
Gly Gly Pro Ile Glu Tyr Lys Glu Ile Pro Val Pro Lys Pro Lys Pro
50 55 60
Asn Glu Ile Leu Val His Val Lys Tyr Ser Gly Val Cys His Thr Asp
65 70 75 80
Leu His Ala Trp Lys Gly Asp Trp Pro Leu Pro Val Lys Leu Pro Leu
85 90 95
Val Gly Gly His Glu Gly Ala Gly Val Val Val Ala Lys Gly Glu Asn
100 105 110
Val Lys Asn Phe Glu Ile Gly Asp Leu Ala Gly Ile Lys Trp Leu Asn
115 120 125
Gly Ser Cys Met Gly Cys Glu Phe Cys Gln Gln Gly Ala Glu Pro Asn
130 135 140
Cys Pro Asp Ala Asp Leu Ser Gly Tyr Thr His Asp Gly Ser Phe Gln
145 150 155 160
Gln Tyr Ala Thr Ala Asp Ala Val Gln Ala Ala Lys Leu Pro Pro Gly
165 170 175
Thr Asp Leu Ala Ala Val Ala Pro Ile Leu Cys Ala Gly Val Thr Val
180 185 190
Tyr Lys Ala Leu Lys Thr Ala Ala Leu Arg Pro Gly Gln Ile Val Ala
195 200 205
Ile Ser Gly Ala Ala Gly Gly Leu Gly Ser Leu Ala Val Gln Tyr Ala
210 215 220
Val Ala Met Gly Leu Arg Val Leu Gly Ile Asp Gly Gly Glu Gln Lys
225 230 235 240
Gly Glu Phe Ile Lys Lys Leu Gly Ala Glu Phe Tyr Val Asp Phe Thr
245 250 255
Lys Glu Lys Asp Ile Val Ser Ala Ile Gln Lys Val Thr Asn Gly Gly
260 265 270
Pro His Gly Val Ile Asn Val Ser Val Ser Pro Ala Ala Ile Ser Gln
275 280 285
Ser Cys Gln Tyr Val Arg Thr Leu Gly Lys Val Val Leu Val Gly Leu
290 295 300
Pro Ala Gly Ala Val Cys Glu Ser Pro Val Phe Glu His Val Val Lys
305 310 315 320
Ser Ile Gln Ile Lys Gly Ser Tyr Val Gly Asn Arg Gln Asp Thr Ala
325 330 335
Glu Ala Val Asp Phe Phe Thr Arg Gly Leu Val Arg Ser Pro Phe Gln
340 345 350
Ile Ala Gly Leu Ser Glu Leu Pro Glu Val Phe Lys Lys Met Glu Glu
355 360 365
Gly Lys Ile Leu Gly Arg Tyr Val Leu Asp Thr Ser Lys
370 375 380
<210> 61
<211> 1146
<212> DNA
<213> Unknown
<220>
<223> Ogataea polymorpha
<400> 61
atgtctattt cgagagttgc tgcattgaga aaccaatttg ctcgtctagc caagccggct 60
gtagtccagc aggtcttcag acactccact gcctctgctc caaccatccc aaagacccag 120
atgggatgtg tttttgaaac caacggcggt ccaattgagt acaaggagat cccagttcca 180
aagccaaagc caaacgagat tctggtccac gtcaagtact ctggtgtgtg ccacaccgac 240
ttgcacgcct ggaagggtga ctggccactg cctgtcaaac tcccacttgt gggtggtcac 300
gagggtgccg gtgttgtcgt tgccaagggt gagaacgtta aaaacttcga gatcggcgac 360
ttggccggta tcaaatggct gaacggctcg tgtatgggtt gtgagttctg tcaacagggt 420
gccgaaccaa actgtcctga cgccgacctt tccggttaca cacacgacgg ttctttccaa 480
caatacgcca ctgctgacgc tgtccaggcc gctaagctgc ctccaggaac tgacctcgct 540
gctgttgctc caattttgtg tgctggtgtg actgtttaca aggccttgaa gactgctgct 600
ttgcgtccag gtcagattgt tgctatttcc ggtgccgccg gtggattggg ttctcttgcc 660
gttcaatacg ctgtcgccat gggtctgaga gttctgggta ttgacggtgg tgagcagaag 720
ggcgagttca tcaagaagct cggtgccgaa ttctacgtcg acttcaccaa ggagaaggac 780
attgtgtctg ccatccagaa ggtcaccaat ggcggtccac acggtgtcat caacgtgtct 840
gtgtctccag ctgctatctc ccagtcttgt caatacgtga gaaccctcgg taaggttgtt 900
ctggttggtc ttccagccgg cgctgtttgc gaatctcctg tctttgagca cgtcgtcaag 960
tccatccaga tcaagggatc ttatgttggt aacagacaag acactgccga ggccgtggac 1020
ttcttcacca gaggccttgt ccgttctcca ttccaaattg ccggtctttc cgagctgcct 1080
gaggtcttca agaagatgga ggagggcaag atcttgggta gatatgtcct tgacacttct 1140
aaataa 1146
<210> 62
<211> 348
<212> PRT
<213> Saccharomyces cerevisiae
<400> 62
Met Ser Ile Pro Glu Thr Gln Lys Ala Ile Ile Phe Tyr Glu Ser Asn
1 5 10 15
Gly Lys Leu Glu Tyr Lys Asp Ile Pro Val Pro Lys Pro Lys Ala Asn
20 25 30
Glu Leu Leu Ile Asn Val Lys Tyr Ser Gly Val Cys His Thr Asp Leu
35 40 45
His Ala Trp His Gly Asp Trp Pro Leu Pro Val Lys Leu Pro Leu Val
50 55 60
Gly Gly His Glu Gly Ala Gly Val Val Val Gly Met Gly Glu Asn Val
65 70 75 80
Lys Gly Trp Lys Ile Gly Asp Tyr Ala Gly Ile Lys Trp Leu Asn Gly
85 90 95
Ser Cys Met Ala Cys Glu Tyr Cys Glu Leu Gly Asn Glu Ser Asn Cys
100 105 110
Pro His Ala Asp Leu Ser Gly Tyr Thr His Asp Gly Ser Phe Gln Gln
115 120 125
Tyr Ala Thr Ala Asp Ala Val Gln Ala Ala His Ile Pro Gln Gly Thr
130 135 140
Asp Leu Ala Glu Val Ala Pro Val Leu Cys Ala Gly Ile Thr Val Tyr
145 150 155 160
Lys Ala Leu Lys Ser Ala Asn Leu Arg Ala Gly His Trp Val Ala Ile
165 170 175
Ser Gly Ala Ala Gly Gly Leu Gly Ser Leu Ala Val Gln Tyr Ala Lys
180 185 190
Ala Met Gly Tyr Arg Val Leu Gly Ile Asp Gly Gly Pro Gly Lys Glu
195 200 205
Glu Leu Phe Thr Ser Leu Gly Gly Glu Val Phe Ile Asp Phe Thr Lys
210 215 220
Glu Lys Asp Ile Val Ser Ala Val Val Lys Ala Thr Asn Gly Gly Ala
225 230 235 240
His Gly Ile Ile Asn Val Ser Val Ser Glu Ala Ala Ile Glu Ala Ser
245 250 255
Thr Arg Tyr Cys Arg Ala Asn Gly Thr Val Val Leu Val Gly Leu Pro
260 265 270
Ala Gly Ala Lys Cys Ser Ser Asp Val Phe Asn His Val Val Lys Ser
275 280 285
Ile Ser Ile Val Gly Ser Tyr Val Gly Asn Arg Ala Asp Thr Arg Glu
290 295 300
Ala Leu Asp Phe Phe Ala Arg Gly Leu Val Lys Ser Pro Ile Lys Val
305 310 315 320
Val Gly Leu Ser Ser Leu Pro Glu Ile Tyr Glu Lys Met Glu Lys Gly
325 330 335
Gln Ile Ala Gly Arg Tyr Val Val Asp Thr Ser Lys
340 345
<210> 63
<211> 1047
<212> DNA
<213> Saccharomyces cerevisiae
<400> 63
atgtctattc cagaaactca aaaagccatt atcttctacg agtccaacgg taagttggaa 60
tacaaagata ttccagttcc aaagccaaag gccaacgaat tgttgatcaa cgttaaatac 120
tctggtgtct gtcacactga cttgcacgct tggcacggtg actggccatt gccagttaag 180
ctaccattag tcggtggtca cgaaggtgcc ggtgtcgttg tcggcatggg tgaaaacgtt 240
aagggctgga agatcggtga ctacgccggt atcaaatggt tgaacggttc ttgtatggcc 300
tgtgaatact gtgaattggg taacgaatcc aactgtcctc acgctgactt gtctggttac 360
acccacgacg gttctttcca acaatacgct accgctgacg ctgttcaagc cgctcacatt 420
cctcaaggta ctgacttggc tgaagtcgcc ccagttttgt gtgctggtat caccgtctac 480
aaggctttga agtctgccaa cttgagagca ggccactggg tggccatttc tggtgctgct 540
ggtggtctag gttctttggc tgttcaatat gctaaggcga tgggttacag agtcttaggt 600
attgatggtg gtccaggaaa ggaagaattg tttacctcgc tcggtggtga agtattcatc 660
gacttcacca aagagaagga cattgttagc gcagtcgtta aggctaccaa cggcggtgcc 720
cacggtatca tcaatgtttc cgtttccgaa gccgctatcg aagcttctac cagatactgt 780
agggcgaacg gtactgttgt cttggttggt ttgccagccg gtgcaaagtg ctcctctgat 840
gtcttcaacc acgttgtcaa gtctatctcc attgtcggct cttacgtggg gaacagagct 900
gataccagag aagccttaga tttctttgcc agaggtctag tcaagtctcc aataaaggta 960
gttggcttat ccagtttacc agaaatttac gaaaagatgg agaagggcca aattgctggt 1020
agatacgttg ttgacacttc taaataa 1047
<210> 64
<211> 349
<212> PRT
<213> Candida maltosa
<400> 64
Met Ser Ser Ile Pro Thr Thr Gln Lys Ala Ile Ile Phe Glu Thr Asn
1 5 10 15
Gly Gly Lys Leu Glu Tyr Lys Asp Ile Pro Val Pro Lys Pro Lys Pro
20 25 30
Asn Glu Leu Leu Ile Asn Val Lys Tyr Ser Gly Val Cys His Thr Asp
35 40 45
Leu His Ala Trp Lys Gly Asp Trp Pro Leu Ala Thr Lys Leu Pro Leu
50 55 60
Val Gly Gly His Glu Gly Ala Gly Val Val Val Ala Ile Gly Asp Asn
65 70 75 80
Val Lys Asn Trp Lys Val Gly Asp Phe Ala Gly Val Lys Trp Leu Asn
85 90 95
Gly Ser Cys Leu Asn Cys Glu Tyr Cys Gln Gln Gly Ala Glu Pro Asn
100 105 110
Cys Ala Gln Ala Asp Leu Ser Gly Tyr Thr His Asp Gly Ser Phe Gln
115 120 125
Gln Tyr Ala Thr Ala Asp Ala Val Gln Ala Ala Arg Ile Pro Ala Gly
130 135 140
Thr Asp Leu Ala Thr Val Ala Pro Ile Leu Cys Ala Gly Val Thr Val
145 150 155 160
Tyr Lys Ala Leu Lys Thr Ala Asn Leu Gln Pro Gly Gln Trp Val Ala
165 170 175
Ile Ser Gly Ala Ala Gly Gly Leu Gly Ser Leu Ala Val Gln Tyr Ala
180 185 190
Lys Ala Met Gly Tyr Arg Val Leu Ala Ile Asp Gly Gly Glu Asp Lys
195 200 205
Gly Gln Phe Val Lys Ser Leu Gly Ala Glu Thr Phe Ile Asp Phe Thr
210 215 220
Lys Glu Lys Asp Val Val Gly Ala Val Gln Lys Ala Thr Asn Gly Gly
225 230 235 240
Pro His Gly Val Ile Asn Val Ser Val Ser Asp Arg Ala Ile Asn Gln
245 250 255
Ser Val Glu Tyr Val Arg Thr Leu Gly Lys Val Val Leu Val Gly Leu
260 265 270
Pro Ala Gly Ala Lys Val Thr Ala Pro Val Phe Asp Ser Val Val Lys
275 280 285
Ser Ile Glu Ile Lys Gly Ser Tyr Val Gly Asn Arg Lys Asp Thr Ala
290 295 300
Glu Ala Val Asp Phe Phe Ser Arg Gly Leu Ile Lys Cys Pro Ile Lys
305 310 315 320
Ile Val Gly Leu Ser Glu Leu Pro Glu Val Tyr Lys Leu Met Glu Glu
325 330 335
Gly Lys Ile Leu Gly Arg Tyr Val Leu Asp Thr Ser Lys
340 345
<210> 65
<211> 1050
<212> DNA
<213> Candida maltosa
<400> 65
atgtcttcta ttccaactac tcaaaaagct attatcttcg aaaccaacgg cggtaaatta 60
gaatacaaag atatcccagt cccaaaacca aaaccaaatg aattgttgat caatgttaaa 120
tactccggtg tttgtcacac tgatttgcac gcttggaaag gtgattggcc attagccacc 180
aaattaccat tggtcggtgg tcacgaaggt gctggtgttg tcgttgctat tggtgacaat 240
gtcaagaact ggaaagttgg tgatttcgcc ggtgtcaaat ggttgaatgg ttcttgtttg 300
aactgtgaat actgtcaaca aggtgctgaa ccaaactgtg ctcaagctga cttgtccggt 360
tacacccacg atggttcttt ccaacaatac gccactgccg atgcagttca agcggctaga 420
attccagctg gtactgattt agccaccgtt gctccaatct tgtgtgctgg tgttaccgtt 480
tacaaggctt tgaagactgc caacttacaa ccaggtcaat gggttgccat ttccggtgcc 540
gctggtggtt taggttcttt ggctgttcaa tacgctaaag ctatgggtta cagagtcttg 600
gccattgacg gtggtgaaga taaaggtcaa tttgttaaat ctttgggtgc tgaaactttt 660
atcgatttta ccaaagaaaa ggatgttgtt ggtgctgtcc aaaaagctac caacggtggt 720
ccacatggtg tcattaacgt ctctgtttcc gacagagcta tcaaccaatc cgttgaatac 780
gttagaactt taggtaaagt tgttttggtt ggtttaccag ctggtgctaa agtcactgct 840
ccagtctttg actccgtcgt taaatccatt gaaattaaag gttcttatgt tggtaacaga 900
aaagacactg ccgaagccgt tgatttcttc tctagaggtt tgattaaatg tccaatcaag 960
attgttggtt tatctgaatt accagaagtt tacaaattga tggaagaagg taaaatcttg 1020
ggtagatacg ttttggacac ctccaaataa 1050
<210> 66
<211> 379
<212> PRT
<213> Kluyveromyces marxianus
<400> 66
Met Phe Arg Leu Ala Arg Ala Gln Thr Ser Ile Thr Thr Thr Ser Lys
1 5 10 15
Ala Leu Gly Gly Ser Arg Arg Leu Phe Val Arg Leu Asn Ser Ser Phe
20 25 30
Ala Ile Pro Glu Ser Gln Lys Gly Val Ile Phe Tyr Glu Asn Gly Gly
35 40 45
Lys Leu Glu Tyr Lys Asp Leu Pro Val Pro Lys Pro Lys Pro Asn Glu
50 55 60
Ile Leu Ile Asn Val Lys Tyr Ser Gly Val Cys His Thr Asp Leu His
65 70 75 80
Ala Trp Lys Gly Asp Trp Pro Leu Pro Val Lys Leu Pro Leu Val Gly
85 90 95
Gly His Glu Gly Ala Gly Val Val Val Ala Lys Gly Glu Asn Val Thr
100 105 110
Asn Phe Glu Ile Gly Asp Tyr Ala Gly Ile Lys Trp Leu Asn Gly Ser
115 120 125
Cys Met Ser Cys Glu Leu Cys Glu Gln Gly Tyr Glu Ser Asn Cys Leu
130 135 140
Gln Ala Asp Leu Ser Gly Tyr Thr His Asp Gly Ser Phe Gln Gln Tyr
145 150 155 160
Ala Thr Ala Asp Ala Val Gln Ala Ala Gln Ile Pro Lys Gly Thr Asp
165 170 175
Leu Ala Glu Ile Ala Pro Ile Leu Cys Ala Gly Val Thr Val Tyr Lys
180 185 190
Ala Leu Lys Thr Ala Asp Leu Gln Pro Gly Gln Trp Ile Ala Ile Ser
195 200 205
Gly Ala Ala Gly Gly Leu Gly Ser Leu Ala Val Gln Tyr Ala Lys Ala
210 215 220
Met Gly Leu Arg Val Leu Gly Ile Asp Gly Gly Pro Gly Lys Glu Glu
225 230 235 240
Leu Phe Lys Ser Leu Gly Gly Glu Val Phe Ile Asp Phe Thr Lys Ser
245 250 255
Lys Asp Met Val Ala Asp Ile Gln Glu Ala Thr Asn Gly Gly Pro His
260 265 270
Gly Val Ile Asn Val Ser Val Ser Glu Ala Ala Ile Ser Met Ser Thr
275 280 285
Glu Tyr Val Arg Pro Thr Gly Val Val Val Leu Val Gly Leu Pro Ala
290 295 300
His Ala Tyr Val Lys Ser Glu Val Phe Ser His Val Val Lys Ser Ile
305 310 315 320
Ser Ile Lys Gly Ser Tyr Val Gly Asn Arg Ala Asp Thr Arg Glu Ala
325 330 335
Ile Asp Phe Phe Thr Arg Gly Leu Val Lys Ser Pro Ile Lys Val Val
340 345 350
Gly Leu Ser Glu Leu Pro Lys Val Tyr Glu Leu Met Glu Ala Gly Lys
355 360 365
Ile Leu Gly Arg Tyr Val Val Asp Thr Ser Lys
370 375
<210> 67
<211> 1140
<212> DNA
<213> Kluyveromyces marxianus
<400> 67
atgttcagac tagcacgcgc tcagaccagc attaccacca ctagcaaggc tctaggtggc 60
tccagaagac tattcgtcag actaaactcc tctttcgcca tcccagaatc ccaaaagggt 120
gtgattttct acgaaaacgg cggtaagttg gaatacaagg accttccagt tccaaagcca 180
aagccaaatg aaatcttgat caacgtcaag tactccggtg tgtgtcacac tgatttgcac 240
gcctggaagg gtgactggcc attgccagtt aagttgcctt tggtcggtgg tcacgaaggt 300
gccggtgtcg tcgttgccaa gggtgaaaac gttaccaact tcgagatcgg tgactacgca 360
ggtatcaagt ggttgaacgg ttcttgtatg tcttgtgaac tctgtgaaca aggttacgaa 420
tccaactgtt tgcaagctga cttgtctggt tacacccacg acggttcctt ccaacaatat 480
gccactgctg acgctgttca agctgcccaa attccaaagg gtaccgattt ggctgaaatc 540
gccccaatct tgtgtgccgg tgtcaccgtc tacaaggctc taaagaccgc tgacttgcaa 600
ccaggtcaat ggatcgctat ctccggtgct gccggtggtc ttggttccct agccgtgcaa 660
tacgccaagg caatgggtct aagagttcta ggtatcgacg gtggtccagg taaggaagaa 720
ttgttcaaga gcttgggtgg tgaagtcttc attgacttca caaagtccaa ggacatggtc 780
gcagacatcc aggaagccac caacggtggt cctcacggtg tgatcaacgt ctccgtctcc 840
gaggccgcta tctccatgtc caccgagtac gtcagaccaa ccggtgtggt cgttctagtc 900
ggtttgccag cccacgctta cgtcaagtcc gaagtcttct cccacgtcgt caagtctatc 960
tctattaagg gttcttacgt cggtaacaga gcagacacca gagaagctat tgacttcttc 1020
accagaggtt tggtcaagtc tccaatcaag gttgttggtt tgtctgaatt gccaaaggtt 1080
tatgaattga tggaagctgg taagatcttg ggtagatacg tcgttgacac ttccaaataa 1140
1140
<210> 68
<211> 350
<212> PRT
<213> Escherichia coli
<400> 68
Met Ser Glu Gln Ile Pro Lys Thr Gln Lys Ala Val Val Phe Asp Thr
1 5 10 15
Asn Gly Gly Gln Leu Val Tyr Lys Asp Tyr Pro Val Pro Thr Pro Lys
20 25 30
Pro Asn Glu Leu Leu Ile Asn Val Lys Tyr Ser Gly Val Cys His Thr
35 40 45
Asp Leu His Ala Trp Lys Gly Asp Trp Pro Leu Ala Thr Lys Leu Pro
50 55 60
Leu Val Gly Gly His Glu Gly Ala Gly Val Val Val Gly Met Gly Glu
65 70 75 80
Asn Val Lys Gly Trp Lys Ile Gly Asp Phe Ala Gly Ile Lys Trp Leu
85 90 95
Asn Gly Ser Cys Met Ser Cys Glu Phe Cys Gln Gln Gly Ala Glu Pro
100 105 110
Asn Cys Gly Glu Ala Asp Leu Ser Gly Tyr Thr His Asp Gly Ser Phe
115 120 125
Glu Gln Tyr Ala Thr Ala Asp Ala Val Gln Ala Ala Lys Ile Pro Ala
130 135 140
Gly Thr Asp Leu Ala Asn Val Ala Pro Ile Leu Cys Ala Gly Val Thr
145 150 155 160
Val Tyr Lys Ala Leu Lys Thr Ala Asp Leu Ala Ala Gly Gln Trp Val
165 170 175
Ala Ile Ser Gly Ala Gly Gly Gly Leu Gly Ser Leu Ala Val Gln Tyr
180 185 190
Ala Arg Ala Met Gly Leu Arg Val Val Ala Ile Asp Gly Gly Asp Glu
195 200 205
Lys Gly Glu Phe Val Lys Ser Leu Gly Ala Glu Ala Tyr Val Asp Phe
210 215 220
Thr Lys Asp Lys Asp Ile Val Glu Ala Val Lys Lys Ala Thr Asp Gly
225 230 235 240
Gly Pro His Gly Ala Ile Asn Val Ser Val Ser Glu Lys Ala Ile Asp
245 250 255
Gln Ser Val Glu Tyr Val Arg Pro Leu Gly Lys Val Val Leu Val Gly
260 265 270
Leu Pro Ala His Ala Lys Val Thr Ala Pro Val Phe Asp Ala Val Val
275 280 285
Lys Ser Ile Glu Ile Lys Gly Ser Tyr Val Gly Asn Arg Lys Asp Thr
290 295 300
Ala Glu Ala Ile Asp Phe Phe Ser Arg Gly Leu Ile Lys Cys Pro Ile
305 310 315 320
Lys Ile Val Gly Leu Ser Asp Leu Pro Glu Val Phe Lys Leu Met Glu
325 330 335
Glu Gly Lys Ile Leu Gly Arg Tyr Val Leu Asp Thr Ser Lys
340 345 350
<210> 69
<211> 1053
<212> DNA
<213> Escherichia coli
<400> 69
atgtctgaac aaatcccaaa aactcaaaaa gccgttgtct ttgataccaa tggtggtcaa 60
ttagtctaca aggattaccc agttccaact ccaaagccaa atgaattgtt aatcaacgtc 120
aaatactctg gtgtctgtca cactgattta cacgcttgga aaggtgactg gccattggct 180
actaaattgc cattagttgg tggtcacgaa ggtgccggtg tcgttgtcgg tatgggtgaa 240
aacgtcaaag gatggaaaat cggtgacttt gccggtatca aatggttgaa cggttcttgt 300
atgagttgtg aattctgtca acaaggtgct gaaccaaact gtggtgaagc tgacttgtct 360
ggttacactc acgatggttc attcgaacaa tacgctactg ctgatgctgt ccaagccgct 420
aaaattccag ctggtactga tttagccaat gtcgcaccaa tcttatgtgc tggtgttact 480
gtttacaaag ccttaaagac tgctgactta gcagctggcc aatgggttgc tatctccggt 540
gctggtggtg gtttaggttc tttggccgtt caatacgcca gagccatggg tttgagagtt 600
gttgctattg acggtggtga cgaaaaaggt gaatttgtta aatcattggg tgctgaagct 660
tacgttgatt tcaccaaaga taaagatatt gttgaagctg ttaagaaggc tactgatggt 720
ggtccacacg gtgctatcaa tgtctctgtt tctgaaaaag ccattgacca atctgttgaa 780
tatgttagac cattaggtaa agttgttttg gttggtttac cagctcacgc taaagtcact 840
gctccagttt tcgatgctgt tgtcaaatcc attgaaatca aaggttctta cgttggtaac 900
agaaaagata ctgctgaagc tattgacttc ttctccagag gtttaatcaa atgcccaatc 960
aagattgtcg gtttatctga cttgccagaa gtcttcaaat tgatggaaga aggtaaaatc 1020
ttgggtagat acgtcttgga caccagtaaa taa 1053
<210> 70
<211> 353
<212> PRT
<213> Unknown
<220>
<223> Fusarium graminearum
<400> 70
Met Ala Ala Pro Gln Ile Pro Ser Gln Gln Trp Ala Gln Ile Phe Glu
1 5 10 15
Lys Thr Ala Gly Pro Ile Glu Tyr Lys Gln Ile Pro Val Gln Lys Pro
20 25 30
Gly Pro Asp Glu Val Leu Val Asn Val Lys Phe Ser Gly Val Cys His
35 40 45
Thr Asp Leu His Ala Trp Gln Gly Asp Trp Pro Leu Asp Thr Lys Leu
50 55 60
Pro Leu Val Gly Gly His Glu Gly Ala Gly Val Val Val Ala Arg Gly
65 70 75 80
Glu Leu Val Lys Asp Val Lys Ile Gly Glu Lys Val Gly Ile Lys Trp
85 90 95
Leu Asn Gly Ser Cys Leu Ser Cys Ser Tyr Cys Gln Asn Ala Asp Glu
100 105 110
Ser Leu Cys Ala Glu Ala Leu Leu Ser Gly Tyr Thr Val Asp Gly Ser
115 120 125
Phe Gln Gln Tyr Ala Ile Ala Lys Ala Ile His Val Ala Arg Ile Pro
130 135 140
Glu Glu Cys Asp Leu Glu Ala Ile Ser Pro Ile Leu Cys Ala Gly Ile
145 150 155 160
Thr Val Tyr Lys Gly Ile Lys Glu Ser Gly Val Lys Ala Gly Gln Ser
165 170 175
Leu Ala Ile Val Gly Ala Gly Gly Gly Leu Gly Ser Ile Ala Val Gln
180 185 190
Tyr Ala Lys Ala Met Gly Ile His Ala Ile Ala Ile Asp Gly Gly Glu
195 200 205
Glu Lys Glu Lys Met Cys Met Ser Leu Gly Ala Gln Thr Phe Ile Asp
210 215 220
Phe Thr Lys Thr Lys Asn Ile Val Ala Asp Val Lys Ala Thr Thr Asn
225 230 235 240
Asp Gly Leu Gly Pro His Ala Ala Leu Leu Val Ala Ala Ala Glu Lys
245 250 255
Pro Phe Gln Gln Ala Thr Gln Tyr Ile Arg Ser Lys Gly Thr Val Val
260 265 270
Cys Ile Gly Leu Pro Ala Gly Ala Gln Phe Ser Ala Pro Val Phe Asp
275 280 285
Thr Val Val Arg Met Ile Gln Ile Lys Gly Ser Tyr Val Gly Asn Arg
290 295 300
Ala Asp Thr Ala Glu Ala Ile Asp Phe Phe Arg Arg Gly Leu Ile Lys
305 310 315 320
Val Pro Phe Lys Thr Val Gly Leu Ser Glu Leu Asn Glu Val Phe Lys
325 330 335
Leu Met Lys Ala Gly Gln Val Ala Gly Arg Tyr Val Val Asp Thr Ser
340 345 350
Arg
<210> 71
<211> 1062
<212> DNA
<213> Unknown
<220>
<223> Fusarium graminearum
<400> 71
atggccgctc cccagattcc ttcccagcag tgggctcaga tcttcgagaa gaccgccggt 60
cccatcgagt acaagcagat tcccgtccag aagcctggcc ccgatgaggt tctcgtcaac 120
gtcaagttct ccggtgtctg ccacactgac ctccacgcct ggcagggtga ctggcccctc 180
gacaccaagc tgccccttgt cggtggccac gagggtgccg gtgttgtcgt tgcccgcggc 240
gagcttgtca aggatgtcaa gattggcgag aaggtcggta tcaagtggct caacggttct 300
tgcttgagct gctcttactg ccaaaacgcc gatgagtctc tctgcgctga ggctcttctc 360
tccggttaca ccgtcgatgg atctttccag caatacgcca tcgccaaggc tatccacgtt 420
gctcgcatcc ctgaggagtg tgaccttgag gccatctccc ccattctctg cgccggtatc 480
accgtctaca agggtatcaa ggagtccggt gtcaaggccg gccagtctct tgctatcgtc 540
ggtgctggtg gtggtctcgg ttccatcgct gttcagtacg ccaaggctat gggtatccat 600
gccattgcca ttgatggtgg tgaggagaag gagaagatgt gcatgtctct cggtgcccaa 660
accttcatcg acttcacaaa gactaagaac atcgtcgctg atgtcaaggc tactaccaac 720
gatggccttg gccctcacgc tgctctcctc gtcgctgctg ccgagaagcc cttccaacag 780
gctacccaat acatccgatc caagggtacc gtcgtctgca tcggtctccc cgctggtgct 840
cagttctctg cccccgtctt cgacactgtc gttcgcatga ttcagatcaa gggatcttat 900
gtcggtaacc gtgccgatac tgctgaggcc atcgacttct tccgccgtgg tctcatcaag 960
gttcccttca agactgttgg tctctctgag ctcaacgagg tcttcaagct catgaaggct 1020
ggccaagttg ctggtcgcta tgtcgttgac accagccgat aa 1062
<210> 72
<211> 1966
<212> DNA
<213> Artificial Sequence
<220>
<223> Adh2 split marker cassette 1
<400> 72
cgtatctacc gatgatggca ccagcctcca tctgttcgta gaccttagca agttcagaca 60
gaccgataat cttgatagga gccttgacca aacctctggt gaacaagtcg atggcctcgg 120
cactgtcctc tctgtttcca acgtaagatc ccttgatctc gatggacttc agaacgtgcc 180
agaaaacgtc agagttgaca acggcaccag atggcagacc aaccaaaaca accttaccca 240
aagttctaac gtattggaca gattggttga tagcatgtgg ggaaacggag acgttaataa 300
caccgtgtgg accaccgttg gtgagctttt ggacttcagc aacgacgtcc ttagtcttag 360
tgaagtcgac gaagacctca gcacccaagg acttgacaaa ttcacccttg tcggcaccac 420
catcaatacc caaaactctc aaacccagag ccttggcgta ttgaacggca agagaaccca 480
gtcctccacc agcaccagaa atggcaaccc attggccaat acgcaagtca gcggtcttaa 540
gagccttgta aacggtgata ccagcacaca gaattggggc aacttcagcc aagtcagcct 600
cctttggaat tctggcggct tgggtggcat cagcagtagc atactgctgg aaagatccgt 660
cgtgggtgaa accagacagg tcagccttgg cacaactgga ttcagcacct tggatacagt 720
actcacagtt caaacaagaa ccgttcaacc atttgatacc agcgtagtca ccgatagtgg 780
atctgatatc acctaataac ttcgtatagc atacattata cgaagttata ttaagggttc 840
tcgaatggta ccttgctcac atgttgatct ccagcttgca aattaaagcc ttcgagcgtc 900
ccaaaacctt ctcaagcaag gttttcagta taatgttaca tgcgtacacg cgtctgtaca 960
gaaaaaaaag aaaaatttga aatataaata acgttcttaa tactaacata actataaaaa 1020
aataaatagg gacctagact tcaggttgtc taactccttc cttttcggtt agagcggatg 1080
tggggggagg gcgtgaatgt aagcgtgaca taactaatta catgatatcg acaaaggaaa 1140
agggggacgg atctccgagg taaaatagaa caactacaat ataaaaaaac tatacaaatg 1200
acaagttctt gaaaacaaga atctttttat tgtcagtact gattattcct ttgccctcgg 1260
acgagtgctg gggcgtcggt ttccactatc ggcgagtact tctacacagc catcggtcca 1320
gacggccgcg cttctgcggg cgatttgtgt acgcccgaca gtcccggctc cggatcggac 1380
gattgcgtcg catcgaccct gcgcccaagc tgcatcatcg aaattgccgt caaccaagct 1440
ctgatagagt tggtcaagac caatgcggag catatacgcc cggagccgcg gcgatcctgc 1500
aagctccgga tgcctccgct cgaagtagcg cgtctgctgc tccatacaag ccaaccacgg 1560
cctccagaag aagatgttgg cgacctcgta ttgggaatcc ccgaacatcg cctcgctcca 1620
gtcaatgacc gctgttatgc ggccattgtc cgtcaggaca ttgttggagc cgaaatccgc 1680
gtgcacgagg tgccggactt cggggcagtc ctcggcccaa agcatcagct catcgagagc 1740
ctgcgcgacg gacgcactga cggtgtcgtc catcacagtt tgccagtgat acacatgggg 1800
atcagcaatc gcgcatatga aatcacgcca tgtagtgtat tgaccgattc cttgcggtcc 1860
gaatgggccg aacccgctcg tctggctaag atcggccgca gcgatcgcat ccatggcctc 1920
cgcgaccggc tgcagaacag cgggcagttc ggtttcaggc aggtct 1966
<210> 73
<211> 2069
<212> DNA
<213> Artificial Sequence
<220>
<223> Adh2 split marker cassette 2
<220>
<221> misc_feature
<222> (1099)
<223> n is a, c, g, or t
<400> 73
agatgttggc gacctcgtat tgggaatccc cgaacatcgc ctcgctccag tcaatgaccg 60
ctgttatgcg gccattgtcc gtcaggacat tgttggagcc gaaatccgcg tgcacgaggt 120
gccggacttc ggggcagtcc tcggcccaaa gcatcagctc atcgagagcc tgcgcgacgg 180
acgcactgac ggtgtcgtcc atcacagttt gccagtgata cacatgggga tcagcaatcg 240
cgcatatgaa atcacgccat gtagtgtatt gaccgattcc ttgcggtccg aatgggccga 300
acccgctcgt ctggctaaga tcggccgcag cgatcgcatc catggcctcc gcgaccggct 360
gcagaacagc gggcagttcg gtttcaggca ggtcttgcaa cgtgacaccc tgtgcacggc 420
gggagatgca ataggtcagg ctctcgctga attccccaat gtcaagcact tccggaatcg 480
ggagcgcggc cgatgcaaag tgccgataaa cataacgatc tttgtagaaa ccatcggcgc 540
agctatttac ccgcaggaca tatccacgcc ctcctacatc gaagctgaaa gcacgagatt 600
cttcgccctc cgagagctgc atcaggtcgg agacgctgtc gaacttttcg atcagaaact 660
tctcgacaga cgtcgcggtg agttcaggct ttttacccat ggtttagttc ctcaccttgt 720
cgtattatac tatgccgata tactatgccg atgattaatt gtcaacaccg cccttagatt 780
agattgctat gctttctttc taatgagcaa gaagtaaaaa aagttgtaat agaacaagaa 840
aaatgaaact gaaacttgag aaattgaaga ccgtttatta acttaaatat caatgggagg 900
tcatcgaaag agaaaaaaat caaaaaaaaa aaattttcaa gaaaaagaaa cgtgataaaa 960
atttttattg cctttttaga cgaagaaaaa gaaacgaggc ggtctctttt ttcttttcca 1020
aacctttagt acgggtaatt aacgacaccc tagaggaaga aagaggggaa atttagtatg 1080
ctgtgcttgg gggttttgna aatggtacgg cgatgcgcgg aatccgagaa aatctggaag 1140
agtaaaaaag gagtagaaac attttgaagc tatggtgtgt ggtaccgatc tagacctaat 1200
aacttcgtat agcatacatt atacgaagtt atattaaggg ttgtcgacct gcagcgtacg 1260
gcacgaattc gcaccccgga gagcgctcac ccccgttttc aaacagcggg gggagcacaa 1320
aatgttgaaa actacacaga tcttttcgga caccggtcgc tttatgtagt cgacatgcag 1380
attctcccaa atggaaaacg agattggaca atttgtggag ttggaaaggg gggtgggaat 1440
caacgaaatt agcagattca tgggcaattg gcaggactgg gcagaagggg tgagaattgc 1500
aatcgaatgg aacaggcact cccgttgcga aatcaaaaaa gtctcgctat ctgaactgat 1560
tttttttaag cagcaactta cggtcaatac atctccgatg gaggaatttt tcacccctcg 1620
ctaactagat gggccccttc taagaaattt gggtttaagg ttgggcagtc agtcagtgca 1680
ccaatgctaa ctgccatttg tccaaagagg ggtgcaagga tgagggaccg ttgagaataa 1740
gatttggggt gttaatcggt gatactgatt tgtcaaagag tggggaggac tgctgggcat 1800
tgttcacccc cctagttgtt agagttcgat agccggccga atcacccccc tcttcttaca 1860
taatcattgt cactatgtgg ggtctctaca gtctcaccct gcgatccggg acgacgccgc 1920
gaaattaggg ggcaagtctc ctccgggcat gcaatattgg taacaggatc aattgatgcg 1980
agaaaagttg gagggggtgt aaaattcaag cccacaaagt cacaccctta tgcctgtaga 2040
ggggcaatcg gagagcagcc atggggtgt 2069
<210> 74
<211> 1850
<212> DNA
<213> Artificial Sequence
<220>
<223> Adh900 split marker cassette 1
<400> 74
cactccagtt gggccattac cgaacatttt gccattgtag gcgattagta agtattaaca 60
agacagctga ctatacgttt attctcaaac aatatttccc tttttggttt tgacctcgct 120
ttaatcaatt tttcagacct gatcccacct acttttcttc ggcctcaact tcaatctgac 180
tcttctctct caattggtac caaccagcca gaaaatgtcc ttccgttact tgaaacggca 240
tttctctaca gctacaaacg caattgctct ccttagcaga cctgaattca aaataggtcg 300
aattgtggac gtcgtgaaac atccaaatgc agacaaactt tatgtctcgt cgatttctgt 360
gggaaacaat tatgcctcgg gtacatccaa caccctaacc gtttgcagcg gcttggtgga 420
ctacttttca gttcccgaat tgcttcagcg acgggtcgtt gtggtcacaa acctcaagcc 480
atcgaagatg agaggtgtaa catcggaggc aatgcttttg gcaggggaaa agtcggggaa 540
agtggaattg gtcgagccgc caatgtccgg gagagagggc gaatcactcc acttcgaagg 600
tgtagaaatt acatcagagg agagcgccaa tcaattgcat ttgcctgcta agcgattgaa 660
gaagtcagag tggagtcaac tggcggaagg tctacagaca aatgaccagc gtgaagtggt 720
cttccacagc caaattggct ccaaacgaat ttacgcttta gtaggagcga gtactgaaaa 780
atgcacgtta gcgactcttg cgcaggccgt cgtacgataa gggcaatatg gttgagaacg 840
ttcctcaccc aaataaaatc atcgtacgct gcaggtcgac aacccttaat ataacttcgt 900
ataatgtatg ctatacgaag ttattaggtc tagatcggta ccgacatgga ggcccagaat 960
accctccttg acagtcttga cgtgcgcagc tcaggggcat gatgtgactg tcgcccgtac 1020
atttagccca tacatcccca tgtataatca tttgcatcca tacattttga tggccgcacg 1080
gcgcgaagca aaaattacgg ctcctcgctg cagacctgcg agcagggaaa cgctcccctc 1140
acagacgcgt tgaattgtcc ccacgccgcg cccctgtaga gaaatataaa aggttaggat 1200
ttgccactga ggttcttctt tcatatactt ccttttaaaa tcttgctagg atacagttct 1260
cacatcacat ccgaacataa acaaccatgg gtaaggaaaa gactcacgtt tcgaggccgc 1320
gattaaattc caacatggat gctgatttat atgggtataa atgggctcgc gataatgtcg 1380
ggcaatcagg tgcgacaatc tatcgattgt atgggaagcc cgatgcgcca gagttgtttc 1440
tgaaacatgg caaaggtagc gttgccaatg atgttacaga tgagatggtc agactaaact 1500
ggctgacgga atttatgcct cttccgacca tcaagcattt tatccgtact cctgatgatg 1560
catggttact caccactgcg atccccggca aaacagcatt ccaggtatta gaagaatatc 1620
ctgattcagg tgaaaatatt gttgatgcgc tggcagtgtt cctgcgccgg ttgcattcga 1680
ttcctgtttg taattgtcct tttaacagcg atcgcgtatt tcgtctcgct caggcgcaat 1740
cacgaatgaa taacggtttg gttgatgcga gtgattttga tgacgagcgt aatggctggc 1800
ctgttgaaca agtctggaaa gaaatgcata agcttttgcc attctcaccg 1850
<210> 75
<211> 1993
<212> DNA
<213> Artificial Sequence
<220>
<223> Adh900 split marker cassette 2
<400> 75
aagcccgatg cgccagagtt gtttctgaaa catggcaaag gtagcgttgc caatgatgtt 60
acagatgaga tggtcagact aaactggctg acggaattta tgcctcttcc gaccatcaag 120
cattttatcc gtactcctga tgatgcatgg ttactcacca ctgcgatccc cggcaaaaca 180
gcattccagg tattagaaga atatcctgat tcaggtgaaa atattgttga tgcgctggca 240
gtgttcctgc gccggttgca ttcgattcct gtttgtaatt gtccttttaa cagcgatcgc 300
gtatttcgtc tcgctcaggc gcaatcacga atgaataacg gtttggttga tgcgagtgat 360
tttgatgacg agcgtaatgg ctggcctgtt gaacaagtct ggaaagaaat gcataagctt 420
ttgccattct caccggattc agtcgtcact catggtgatt tctcacttga taaccttatt 480
tttgacgagg ggaaattaat aggttgtatt gatgttggac gagtcggaat cgcagaccga 540
taccaggatc ttgccatcct atggaactgc ctcggtgagt tttctccttc attacagaaa 600
cggctttttc aaaaatatgg tattgataat cctgatatga ataaattgca gtttcatttg 660
atgctcgatg agtttttcta atcagtactg acaataaaaa gattcttgtt ttcaagaact 720
tgtcatttgt atagtttttt tatattgtag ttgttctatt ttaatcaaat gttagcgtga 780
tttatatttt ttttcgcctc gacatcatct gcccagatgc gaagttaagt gcgcagaaag 840
taatatcatg cgtcaatcgt atgtgaatgc tggtcgctat actggtacca ttcgagaacc 900
cttaatataa cttcgtataa tgtatgctat acgaagttat taggtgatat cagatccact 960
ctgtagtgag ggttggtggt ctgacgaaca tccagcaagg tgttccacct gaaatttttc 1020
accttggagg gtaatgtgat gacgccattt cctgtgcaaa tgcttttcgt tttgaacagt 1080
gcaacttttg tatcagatct tcatctactt gatgccatct caacaaatcc ctcatttact 1140
agcgtgtgaa ggaatctaga ttttccactg ataagccaat ttgtcggaaa tcccccgcgc 1200
gggagttggc gttcagtacg agccacacac gtttcttttg gacaaccaaa gcatccgcct 1260
gaagggacaa cttgcattca acggcttcag ttggaaacgt cagagctgac ctatagtttg 1320
ctagaaccgt tttctctgtt tacgtttacg tctcctcaaa tttgcgctcg gtatgtcctt 1380
cctaattagc gggaaaagct gttcttagtt aatacggaga aagtttcggg gttaccgttc 1440
cgggaagagg aggggtcatc tctctcatct catccaacca ttaagtttct tccaaaactt 1500
caggataatc agtttaacca ccgacaggag tcagatttga gattgacaga aagtttttcc 1560
gtccatttcc tcatcttgtc gccgttatca gtcaatctct atggttatct ggaatttctt 1620
ttttctttta attcatcttc tttttatccc gcgcctttgg cgttctagct catctcatga 1680
aaacaaaacc ctctcatgtt cggataattc cagcggcttt cactttcaga tgacacatag 1740
attggactca accatggcta tctggggtat acggacgttg gcaagggcgt taatttttca 1800
ggacaaacgg aaatgccatg gctccaggga aaggcattcc tattgcaaac ctagaccgtc 1860
gaacctctcc tatcgcctac cagtcaccca gctatcccta ggcaactcat ctccttcaag 1920
cggattgcaa cctgctaagc caaattagat ctggccacag aaatgccgca atatttcttg 1980
gctctcccct ccc 1993
<210> 76
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 76
gaattgagcc aaaaaaggag agg 23
<210> 77
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 77
gatggaatag gagactaggt gtg 23
<210> 78
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 78
tggttgagac gtttgtattg 20
<210> 79
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 79
tgggttggga gtttagtg 18
<210> 80
<211> 1053
<212> DNA
<213> Artificial Sequence
<220>
<223> ADH2 coding sequence
<400> 80
atgtctccaa ctatcccaac tacacaaaag gctgttatct tcgagaccaa cggcggtccc 60
ctagagtaca aggacattcc agtcccaaag ccaaagtcaa acgaactttt gatcaacgtt 120
aagtactccg gtgtctgtca cactgatttg cacgcctgga agggtgactg gccattggac 180
aacaagcttc ctttggttgg tggtcacgaa ggtgctggtg tcgttgtcgc ttacggtgag 240
aacgtcactg gatgggagat cggtgactac gctggtatca aatggttgaa cggttcttgt 300
ttgaactgtg agtactgtat ccaaggtgct gaatccagtt gtgccaaggc tgacctgtct 360
ggtttcaccc acgacggatc tttccagcag tatgctactg ctgatgccac ccaagccgcc 420
agaattccaa aggaggctga cttggctgaa gttgccccaa ttctgtgtgc tggtatcacc 480
gtttacaagg ctcttaagac cgctgacttg cgtattggcc aatgggttgc catttctggt 540
gctggtggag gactgggttc tcttgccgtt caatacgcca aggctctggg tttgagagtt 600
ttgggtattg atggtggtgc cgacaagggt gaatttgtca agtccttggg tgctgaggtc 660
ttcgtcgact tcactaagac taaggacgtc gttgctgaag tccaaaagct caccaacggt 720
ggtccacacg gtgttattaa cgtctccgtt tccccacatg ctatcaacca atctgtccaa 780
tacgttagaa ctttgggtaa ggttgttttg gttggtctgc catctggtgc cgttgtcaac 840
tctgacgttt tctggcacgt tctgaagtcc atcgagatca agggatctta cgttggaaac 900
agagaggaca gtgccgaggc catcgacttg ttcaccagag gtttggtcaa ggctcctatc 960
aagattatcg gtctgtctga acttgctaag gtctacgaac agatggaggc tggtgccatc 1020
atcggtagat acgttgtgga cacttccaaa taa 1053
<210> 81
<211> 1083
<212> DNA
<213> Artificial Sequence
<220>
<223> ADH900 coding sequence
<400> 81
atgtctgtga tgaaagccct cgtgtacggt ggtaagaacg tcttcgcctg gaaaaacttc 60
cctaaaccaa ctatcttgca cccaacagat gtcatcgtta agacggtggc tactaccatc 120
tgcggaacag acttgcacat cttgaaaggt gatgttccag aggtcaaacc tgaaaccgtc 180
ttgggtcatg aagcaattgg agtcgtcgaa tctatcggtg ataacgtcaa aaacttcagc 240
attggtgata aggtgctggt ttcatgcatc accagttgtg gaagctgtta ctactgtaag 300
agaaacttgc agagtcattg caagaccggt ggatggaaat taggtcacga tttgaacggt 360
acgcaggctg agtttgtccg tatcccatat ggagacttct cattgcaccg tattcctcat 420
gaagcagatg aaaaggcagt tctgatgctg tctgacatct tacctactgc ttacgaagtt 480
ggtgttcttg ccggaaatgt ccaaaaggga gactcagttg ccattgtcgg cgccggtcca 540
gttggtcttg ccgctctgct gactgtcaaa gcctttgagc cttctgaaat tattatgatt 600
gacactaacg atgaaagact gagtgcctcc ttgaaattgg gagccaccaa ggcagtcaac 660
ccaaccaagg tcagcagtgt caaagatgct gtttatgata ttgtcaatgc cactgtccgc 720
gtcaaggaga acgacctgga gccaggtgtc gatgttgcca ttgagtgtgt tggtgttcct 780
gacacgtttg caacttgtga agagattatc gccccaggtg gccgtattgc caatgttggt 840
gttcacggca ctaaagtgga tttacaactg caagacctat ggatcaagaa cattgctatc 900
accaccggtt tggtagccac atactccact aaagacctgt tgaagcgagt ctctgacaag 960
tctctagacc ctacaccact ggttacacat gagttcaagt tcagtgaatt tgagaaggcc 1020
tatgagactt ctcaaaatgc tgccaccacc aaagccatca agattttctt atctgccgat 1080
taa 1083
<210> 82
<211> 1080
<212> DNA
<213> Artificial Sequence
<220>
<223> Adh2_GG_cured
<400> 82
gataggtctc acatgtctcc aactatccca actacacaaa aggctgttat cttcgaaacc 60
aacggcggtc ccctagagta caaggacatt ccagtcccaa agccaaagtc aaacgaactt 120
ttgatcaacg ttaagtactc cggtgtctgt cacactgatt tgcacgcctg gaagggtgac 180
tggccattgg acaacaagct tcctttggtt ggtggtcacg aaggtgctgg tgtcgttgtc 240
gcttacggtg agaacgtcac tggatgggag atcggtgact acgctggtat caaatggttg 300
aacggttctt gtttgaactg tgagtactgt atccaaggtg ctgaatccag ttgtgccaag 360
gctgacctgt ctggtttcac ccacgacgga tctttccagc agtatgctac tgctgatgcc 420
acccaagccg ccagaattcc aaaggaggct gacttggctg aagttgcccc aattctgtgt 480
gctggtatca ccgtttacaa ggctcttaag accgctgact tgcgtattgg ccaatgggtt 540
gccatttctg gtgctggtgg aggactgggt tctcttgccg ttcaatacgc caaggctctg 600
ggtttgagag ttttgggtat tgatggtggt gccgacaagg gtgaatttgt caagtccttg 660
ggtgctgagg tgttcgtcga cttcactaag actaaggacg tcgttgctga agtccaaaag 720
ctcaccaacg gtggtccaca cggtgttatt aacgtctccg tttccccaca tgctatcaac 780
caatctgtcc aatacgttag aactttgggt aaggttgttt tggttggtct gccatctggt 840
gccgttgtca actctgacgt tttctggcac gttctgaagt ccatcgagat caagggatct 900
tacgttggaa acagagagga cagtgccgag gccatcgact tgttcaccag aggtttggtc 960
aaggctccta tcaagattat cggtctgtct gaacttgcta aggtctacga acagatggag 1020
gctggtgcca tcatcggtag atacgttgtg gacacttcca aataagctta gagaccgatc 1080
1080
<210> 83
<211> 1110
<212> DNA
<213> Artificial Sequence
<220>
<223> Adh900_GG_cured
<400> 83
gataggtctc acatgtctgt gatgaaagcc ctcgtgtacg gtggtaagaa cgtgttcgcc 60
tggaaaaact tccctaaacc aactatcttg cacccaacag atgtcatcgt taagacggtg 120
gctactacca tctgcggaac agacttgcac atcttgaaag gtgatgttcc agaggtcaaa 180
cctgaaaccg tcttgggtca tgaagcaatt ggagtcgtcg aatctatcgg tgataacgtc 240
aaaaacttca gcattggtga taaggtgctg gtttcatgca tcaccagttg tggaagctgt 300
tactactgta agagaaactt gcagagtcat tgcaagaccg gtggatggaa attaggtcac 360
gatttgaacg gtacgcaggc tgagtttgtc cgtatcccat atggagactt ctcattgcac 420
cgtattcctc atgaagcaga tgaaaaggca gttctgatgc tgtctgacat cttacctact 480
gcttacgaag ttggtgttct tgccggaaat gtccaaaagg gagactcagt tgccattgtc 540
ggcgccggtc cagttggtct tgccgctctg ctgactgtca aagcctttga gccttctgaa 600
attattatga ttgacactaa cgatgaaaga ctgagtgcct ccttgaaatt gggagccacc 660
aaggcagtca acccaaccaa ggtcagcagt gtcaaagatg ctgtttatga tattgtcaat 720
gccactgtcc gcgtcaagga gaacgacctg gagccaggtg tcgatgttgc cattgagtgt 780
gttggtgttc ctgacacgtt tgcaacttgt gaagagatta tcgccccagg tggccgtatt 840
gccaatgttg gtgttcacgg cactaaagtg gatttacaac tgcaagacct atggatcaag 900
aacattgcta tcaccaccgg tttggtagcc acatactcca ctaaagacct gttgaagcga 960
gtctctgaca agtctctaga ccctacacca ctggttacac atgagttcaa gttcagtgaa 1020
tttgagaagg cctatgagac ttctcaaaat gctgccacca ccaaagccat caagattttc 1080
ttatctgccg attaagctta gagaccgatc 1110
<210> 84
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 84
ttgatctttt ctacggggtg g 21
<210> 85
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer sequence
<400> 85
ggtgttttga agtggtacgg 20
Claims (27)
- 조작된 재조합 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포:
a) 상기 하나 이상의 유전적 변형 이전의 숙주 세포와 비교하여 제1 및 제2 내인성 유전자의 발현을 감소시키기 위한 하나 이상의 유전적 변형에 의해, 여기서
i. 제1 내인성 유전자는 서열번호 1로 확인된 아미노산 서열 또는 이의 상동체를 포함하는 알코올 산화효소 1(alcohol oxidase 1, AOX1)을 암호화하고,
ii. 제2 내인성 유전자는 서열번호 3으로 확인된 아미노산 서열 또는 이의 상동체를 포함하는 알코올 산화효소 2(alcohol oxidase 2, AOX2)를 암호화하고,
그리고
b) 상기 하나 이상의 유전적 변형 이전에 숙주 세포와 비교하여 알코올 탈수소효소 2(alcohol dehydrogenase 2, ADH2) 유전자의 발현을 증가시키기 위한 하나 이상의 유전적 변형에 의해, 여기서 ADH2 유전자는 알코올 탈수소효소 2(ADH2)를 인코딩한다. - 제1항에 있어서, 상기 하나 이상의 유전적 변형이 (i) 하나 이상의 폴리뉴클레오타이드, 또는 이의 일부; 또는 (ii) 발현 조절 서열의 분열(disruption), 치환(subtitution), 결실(deletion), 녹인(knockin) 또는 녹아웃(knockout)을 포함하는 것인 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포.
- 제2항에 있어서, 상기 발현 조절 서열은 프로모터, 리보솜 결합 부위, 전사 또는 번역 시작 및 정지 서열, 인핸서 및 활성제 서열로 이루어진 군으로부터 선택되는 것인 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 제1 및/또는 제2 내인성 유전자가 상기 하나 이상의 유전적 변형에 의해 녹아웃되는 것인 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포.
- 제1항 내지 제4항 중 어느 한 항에 있어서, ADH2 유전자가 Mut- 숙주 세포에 대해 내인성 또는 이종성인 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포.
- 제1항 내지 제5항 중 어느 한 항에 있어서, ADH2가 하기 중 어느 하나인 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포:
a) 서열번호 50으로 확인된 아미노산 서열, 또는 효모 종에 내인성인 이의 상동체를 포함하는 피키아 파스토리스(P. pastoris) ADH2인 ADH2;
b) 서열번호 50과 60% 이상 동일한 a)의 ADH2 돌연변이. - 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 하나 이상의 유전적 변형이 ADH2의 수준 또는 활성을 증가시키는 ADH2 유전자의 기능 획득 변경을 포함하는 것인 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포.
- 제7항에 있어서, 상기 기능 획득 변경이 ADH2 유전자의 녹인을 포함하는 것인 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포.
- 제7항 또는 제8항에 있어서, 상기 기능 획득 변경은 상기 세포에서 ADH2 유전자 발현을 상향 조절하는 것인 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포.
- 제7항 내지 제9항 중 어느 한 항에 있어서, 상기 기능 획득 변경이 상기 세포에서 ADH2 유전자를 과발현하기 위한 이종 발현 카세트의 삽입을 포함하는 것인 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포.
- 제10항에 있어서, 상기 이종 발현 카세트가 프로모터 서열의 제어 하에 ADH2 유전자를 포함하는 이종 폴리뉴클레오티드를 포함하는 것인 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포.
- 제1항 내지 제11항 중 어느 한 항에 있어서, 관심 단백질(protein of interest, POI)을 코딩하는 관심 유전자(gene of interest, GOI)에 작동가능하게 연결된 발현 카세트 프로모터(expression cassette promoter, ECP)를 포함하는 이종 관심 유전자 발현 카세트(gene of interest expression cassette, GOIEC)를 포함하는 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포.
- 제12항에 있어서, ECP가 메탄올-유도성 프로모터인 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포.
- 제13항에 있어서, ECP가 하기 중 어느 하나인 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포:
a) 서열번호 5에 대해 60% 이상의 서열 동일성을 포함하는 pAOX1 프로모터;
b) 서열번호 6에 대해 60% 이상의 서열 동일성을 포함하는 pAOX2 프로모터; 또는
c) 서열번호 36-49로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 포함하는 프로모터. - 제12항 내지 제14항 중 어느 한 항에 있어서, GOIEC가 POI의 분비를 가능하게 하는 신호 펩티드를 코딩하는 뉴클레오티드 서열을 추가로 포함하는 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포.
- 제15항에 있어서, 상기 신호 펩티드를 코딩하는 염기서열은 상기 GOI의 5' 말단에 인접하여 융합되어 있는 것을 특징으로 하는 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포.
- 제12항 내지 제16항 중 어느 한 항에 있어서, POI가 Mut- 숙주 세포 또는 ECP에 이종성인 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포.
- 제12항 내지 제17항 중 어느 한 항에 있어서, POI가 항원 결합 단백질, 치료 단백질, 효소, 펩티드, 단백질 항생제, 독소 융합 단백질, 탄수화물-단백질 접합체, 구조 단백질, 조절 단백질, 백신 항원, 성장 인자, 호르몬, 사이토카인, 공정 효소로 이루어진 군으로부터 선택된 펩티드 또는 단백질인 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포.
- 제1항 내지 제18항 중 어느 한 항에 있어서, 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포가 Pichia, Komagataella, Hansenula, Ogataea 또는 Candida 속의 효모 세포인 방법.
- POI를 생산하기 위하여 탄소원으로서 메탄올을 사용하여 제1항 내지 제18항 중 어느 한 항의 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포를 배양하는 것을 포함하는 관심 단백질(POI) 생산 방법.
- 제20항에 있어서, 발효 생성물이 세포 배양물로부터 단리되고, 발효 생성물이 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포로부터 수득된 POI 또는 숙주 세포 대사산물을 포함하는 것인 방법.
- 제20항 또는 제21항에 있어서,
a) 기본 탄소원을 에너지원으로 사용하여 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포를 배양하는 성장기(growing phase); 다음에
b) 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포가 메탄올 공급을 사용하여 배양되어 POI를 생산하는 생산기(production phase)를 포함하는 것인 방법. - 제22항에 있어서, 0.5-2.0%(v/v)의 평균 메탄올 농도가 적어도 24시간의 생산기(production phase) 동안 숙주 세포 배양에서 사용되는 것인 방법.
- 제22항 또는 제23항에 있어서, 메탄올 공급이 적어도 24시간의 생산기(production phase) 동안 적어도 2 mg 메탄올/(g 건조 바이오매스*h)의 평균 공급 속도인 방법.
- 제22항 내지 제24항 중 어느 한 항에 있어서, 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포가 10%(w/w 바이오매스) 미만으로 숙주 세포 성장을 제한하는 조건 하에 생산기(production phase) 동안 배양되는 것인 방법.
- 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포가 알코올 탈수소효소 2(alcohol dehydrogenase 2, ADH2)의 기질로서 메탄올을 사용하고, 발효 산물을 생산하도록 하는 조건 하에 상기 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포를 배양하는 것을 포함하는 발효 생성물의 생산 방법에서 재조합 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포의 용도
- 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포가 하나 이상의 유전적 변형에 의해 조작되는 탄소원으로 메탄올을 사용하여 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포가 발효 생성물을 생산하도록 허용하는 조건 하에 상기 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포를 배양하는 것을 포함하는 발효 생성물을 생산하는 방법에서 재조합 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포의 용도
a) 상기 하나 이상의 유전적 변형 이전에 숙주 세포와 비교하여 제1 및 제2 내인성 유전자의 발현을 감소시키고, 여기서
i. 제1 내인성 유전자는 서열번호 1로 확인된 아미노산 서열 또는 이의 상동체를 포함하는 알코올 산화효소 1(alcohol oxidase 1, AOX1)을 암호화하고,
ii. 제2 내인성 유전자는 서열번호 3으로 확인된 아미노산 서열 또는 이의 상동체를 포함하는 알코올 산화효소 2(alcohol oxidase 2, AOX2)를 암호화하고,
b) 알코올 탈수소효소 2(alcohol dehydrogenase 2, ADH2) 유전자의 발현을 증가시키기 위해, 여기서 ADH2 유전자는 알코올 탈수소효소 2(alcohol dehydrogenase 2, ADH2)를 코딩한다.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/EP2019/058190 WO2020200414A1 (en) | 2019-04-01 | 2019-04-01 | Protein production in mut-methylotrophic yeast |
PCT/EP2019/058191 WO2020200415A1 (en) | 2019-04-01 | 2019-04-01 | Mut- methylotrophic yeast |
EPPCT/EP2019/058191 | 2019-04-01 | ||
EPPCT/EP2019/058190 | 2019-04-01 | ||
PCT/EP2020/059284 WO2020201369A1 (en) | 2019-04-01 | 2020-04-01 | Mut- methylotrophic yeast |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220009943A true KR20220009943A (ko) | 2022-01-25 |
Family
ID=70005646
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217035698A KR20220009943A (ko) | 2019-04-01 | 2020-04-01 | Mut- 메틸영양성 효모 |
Country Status (11)
Country | Link |
---|---|
US (1) | US20220170032A1 (ko) |
EP (1) | EP3947695B1 (ko) |
KR (1) | KR20220009943A (ko) |
CN (1) | CN114026239A (ko) |
AU (1) | AU2020252241B2 (ko) |
BR (1) | BR112021019477A2 (ko) |
CA (1) | CA3135444A1 (ko) |
ES (1) | ES2964319T3 (ko) |
HU (1) | HUE064229T2 (ko) |
SG (1) | SG11202110695PA (ko) |
WO (1) | WO2020201369A1 (ko) |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69232666T2 (de) | 1991-04-01 | 2003-03-20 | Merck & Co., Inc. | Gene, die die proteolytische aktivitaet von pichia beeinflussen und deren verwendung |
US6153424A (en) | 1995-11-09 | 2000-11-28 | Zymogenetics, Inc. | Protease-deficient strains of Pichia methanolica |
EP1905836A1 (en) | 2006-09-28 | 2008-04-02 | Institut Pasteur | Recombinant Pichia pastoris strains and process for the production of recombinant human interferon alpha |
CN101679992A (zh) | 2007-04-20 | 2010-03-24 | 波利门科学生物免疫研究有限公司 | 酵母菌表达系统 |
EP2921551A3 (en) | 2009-02-26 | 2015-12-02 | GlaxoSmithKline LLC | Host cells and methods of use |
EP3590950A1 (en) | 2011-05-09 | 2020-01-08 | Ablynx NV | Method for the production of immunoglobulin single varible domains |
KR101954389B1 (ko) | 2011-10-07 | 2019-03-06 | 론자 리미티드 | 조절가능한 프로모터 |
ES2789299T3 (es) | 2012-10-29 | 2020-10-26 | Lonza Ag | Secuencias de expresión |
EP2970994B1 (en) | 2013-03-15 | 2019-07-17 | Lonza Ltd | Constitutive promoter |
EP3132039B1 (en) | 2014-04-17 | 2019-07-24 | Boehringer Ingelheim RCV GmbH & Co KG | Recombinant host cell for expressing proteins of interest |
KR102253479B1 (ko) | 2015-08-05 | 2021-05-21 | 론자 리미티드 | 프로모터 변이체 |
-
2020
- 2020-04-01 BR BR112021019477A patent/BR112021019477A2/pt unknown
- 2020-04-01 HU HUE20714242A patent/HUE064229T2/hu unknown
- 2020-04-01 EP EP20714242.3A patent/EP3947695B1/en active Active
- 2020-04-01 CA CA3135444A patent/CA3135444A1/en active Pending
- 2020-04-01 US US17/601,045 patent/US20220170032A1/en active Pending
- 2020-04-01 AU AU2020252241A patent/AU2020252241B2/en active Active
- 2020-04-01 KR KR1020217035698A patent/KR20220009943A/ko active Search and Examination
- 2020-04-01 CN CN202080040100.0A patent/CN114026239A/zh active Pending
- 2020-04-01 SG SG11202110695PA patent/SG11202110695PA/en unknown
- 2020-04-01 ES ES20714242T patent/ES2964319T3/es active Active
- 2020-04-01 WO PCT/EP2020/059284 patent/WO2020201369A1/en unknown
Also Published As
Publication number | Publication date |
---|---|
EP3947695C0 (en) | 2023-09-06 |
AU2020252241A1 (en) | 2021-10-28 |
WO2020201369A1 (en) | 2020-10-08 |
JP2022528536A (ja) | 2022-06-14 |
EP3947695A1 (en) | 2022-02-09 |
BR112021019477A2 (pt) | 2022-02-08 |
HUE064229T2 (hu) | 2024-02-28 |
AU2020252241B2 (en) | 2024-03-21 |
ES2964319T3 (es) | 2024-04-05 |
CA3135444A1 (en) | 2020-10-08 |
SG11202110695PA (en) | 2021-10-28 |
US20220170032A1 (en) | 2022-06-02 |
EP3947695B1 (en) | 2023-09-06 |
CN114026239A (zh) | 2022-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3874047B1 (en) | Carbon-source regulated protein production in a recombinant host cell | |
JP2023156329A (ja) | 目的タンパク質を産生するための宿主細胞 | |
US20230126246A1 (en) | Helper factors for expressing proteins in yeast | |
US20230348545A1 (en) | Host cells overexpressing translational factors | |
WO2020200414A1 (en) | Protein production in mut-methylotrophic yeast | |
JP7570346B2 (ja) | Mut-メチロトローフ酵母 | |
EP3947695B1 (en) | Mut- methylotrophic yeast | |
TWI853878B (zh) | 重組宿主細胞中的碳源調控蛋白質製造 | |
WO2020200415A1 (en) | Mut- methylotrophic yeast | |
WO2024133538A1 (en) | Host cells with pat1 knockout for increased specific protein productivity |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |