KR20220009943A

KR20220009943A - Mut- 메틸영양성 효모

Info

Publication number: KR20220009943A
Application number: KR1020217035698A
Authority: KR
Inventors: 도먼 자벡; 브리지트 가쎌; 디에달드 마타노비치
Original assignee: 우니베르지태트 퓌르 보덴쿨투르 빈
Priority date: 2019-04-01
Filing date: 2020-04-01
Publication date: 2022-01-25
Also published as: EP3947695C0; AU2020252241A1; WO2020201369A1; JP2022528536A; EP3947695A1; BR112021019477A2; HUE064229T2; AU2020252241B2; ES2964319T3; CA3135444A1; SG11202110695PA; US20220170032A1; EP3947695B1; CN114026239A

Abstract

조작된 재조합 메탄올 이용 경로 결핍 메틸영양 효모 (Mut-) 숙주 세포:
a) 상기 하나 이상의 유전적 변형 이전의 숙주 세포와 비교하여 제1 및 제2 내인성 유전자의 발현을 감소시키기 위한 하나 이상의 유전적 변형에 의해, 여기서
i. 제1 내인성 유전자는 서열번호 1로 확인된 아미노산 서열 또는 이의 상동체를 포함하는 알코올 산화효소 1(alcohol oxidase 1, AOX1)을 암호화하고,
ii. 제2 내인성 유전자는 서열번호 3으로 확인된 아미노산 서열 또는 이의 상동체를 포함하는 알코올 산화효소 2(alcohol oxidase 2, AOX2)를 암호화하고,
그리고
b) 상기 하나 이상의 유전적 변형 이전에 숙주 세포와 비교하여 알코올 탈수소효소 2(alcohol dehydrognease 2, ADH2) 유전자의 발현을 증가시키기 위한 하나 이상의 유전적 변형에 의해, 여기서 ADH2 유전자는 알코올 탈수소효소 2(alcohol dehydrogenase 2, ADH2)를 인코딩한다.

Description

MUT- 메틸영양성 효모

본 발명은 알코올 산화효소 1(alcohol oxidase 1, AOX1) 및 알코올 산화효소 2(alcohol oxidase 2, AOX2)가 결핍된 재조합 메틸영양성 효모(recombinant methylotrophic yeast)에서 관심 단백질(protein of interest, POI)의 생산에 관한 것이다.

재조합 숙주 세포 배양에서 생산된 단백질은 진단 및 치료제로서 점점 더 중요해지고 있다. 이 목적을 위해, 세포는 비정상적으로 높은 수준의 관심 재조합 또는 이종 단백질을 생산하도록 조작 및/또는 선택된다. 세포 배양 조건의 최적화는 재조합 또는 이종 단백질의 성공적인 상업적 생산에 중요하다.

관심 단백질(POI)의 성공적인 생산은 세포 배양에서 원핵 및 진핵 숙주 세포 모두에서 달성되었다. 진핵 숙주 세포, 특히 포유동물 숙주 세포, 효모 또는 사상 진균, 또는 박테리아는 생물제약 단백질 및 벌크 화학물질의 생산 숙주로서 일반적으로 사용된다. 가장 두드러진 예는 이종 단백질의 효율적인 분비로 잘 알려진 Pichia pastoris와 같은 메틸영양성 효모이다. P. pastoris는 Komagataella라는 새로운 속으로 재분류되었고, K. pastoris, K. phaffii, 및 K. pseudopastoris의 3종으로 분할되었다. 생명 공학 응용 분야에 일반적으로 사용되는 균주는 제안된 두 종인 K. pastoris와 K. phaffii에 속한다. 균주 GS115, X-33, CBS2612 및 CBS7435는 K. phaffii이고, 균주 DSMZ70382는 모든 이용 가능한 P. pastoris 균주에 대한 참조 균주인 K. pastoris 유형 종으로 분류된다(Kurtzman 2009, J Ind Microbiol Biotechnol.36(11):1435-8). Mattanovich 등. (Microbial Cell Factories 2009, 8:29 doi:10.1186/1475-2859-8-29)은 K. pastoris의 DSMZ 70382형 균주의 게놈 시퀀싱을 기술하고, 이의 분비체(secretome) 및 당전달체(sugar transporter)를 분석하였다.

P. pastoris 균주는 AOX 유전자 AOX1 및 AOX2 모두가 결핍되거나(Mut-로 지칭됨) AOX2만 결핍되거나(Mut^S로 지칭됨) AOX 유전자 중 어느 것도 결핍되지 않은( Mut⁺로 지칭됨) 상태로 사용되었다.

재조합 숙주 세포에서 단백질 생산에 사용되는 프로모터는 조절되거나(예: 메탄올을 배지에 첨가할 때 유도, 메탄올-조절) 지속적으로 활성화(구성, constitutive)된다. 메탄올 유도성 프로모터 pAOX1은 Mut-, Mut⁺ 또는 Mut^S 균주에서 단백질 발현을 제어하는 것으로 설명되었다.

Chiruvolu 등. (Enzyme Microb. Technol. 1997, 21:277-283)은 재조합 단백질 생산에 사용되는 Mut- 균주의 구성을 기술한다. Mut- 균주는 메탄올에서 성장하지 않는 것으로 결정되었으며, 성장, 유지 및 단백질 생산을 위해 다른 탄소 공급원을 사용해야 했다. POI는 약 0.5%(v/v)의 농도를 유지하기 위해 발효기에 메탄올을 주입하여 유도된 pAOX1의 제어 하에 발현되었다.

Chauhan 등. (Process Biochemistry 1999, 34:139-145)은 pAOX1 프로모터 하에 HBsAg를 발현하기 위한 유전자를 운반하는 AOX1 결실된 숙주(Mut-로 지정되지만 Mut^S로 이해됨)의 이용을 기술한다. 단백질 발현은 메탄올에 의해 유도되었지만, Mut^S 세포는 메탄올 농도에 민감한 것으로 밝혀졌기 때문에 브로쓰(broth)의 높은 메탄올 농도는 세포에 독성이 있는 것으로 밝혀졌다.

Karaoglan 등. (Biotechnol. Lett. 1995, DOI 10.1007/s10529-015-1993-z) P. pastoris에서 알코올 탈수소효소(alcohol dehydrogenase, ADH) 유전자의 기능적 분석을 기술한다. ADH3 (XM_002491337) 및 ADH (FN392323) 유전자가 파괴되었다. 이중 녹아웃 균주도 에탄올을 생산했다. ADH 유전자는 에탄올 대사에 역할을 하지 않는다고 결론지었고, PpADH3은 P. pastoris에서 에탄올 소비를 담당하는 유일한 유전자였다.

Singh과 Narang (bioRxiv, DOI:10.1101/573519, preprint)은 Komagataella phaffii (Pichia pastoris)의 Mut⁺, Mut^s(AOX1-) 및 Mut^-(AOX1- AOX2-) 계통에서 β-갈락토시다제 발현을 설명한다. 포르메이트 또는/및 포름알데히드는 모두 포르메이트 또는 포름알데히드로부터 세포내 메탄올을 합성할 수 없는 Mut^-에서 P_AOX1 발현을 유도하고, 메탄올을 괴롭히는 결핍으로 고통받지 않는 것처럼 보이기 때문에 메탄올에 대한 유망한 대체물로 포르메이트를 제안하고 있기 때문에 진정한 유도자라고 결론지었다.

Wei Shen 등. (Microbial Cell Factory 2016, 15(1):1-11)은 메탄올이 없는 Pichia pastoris 단백질 발현 시스템을 설명한다. 2개의 키나제 돌연변이 Δgut1 및 Δdak은 비메탄올 탄소 공급원에서 강한 알코올 산화효소 활성을 보였고 메탄올이 없는 발현 시스템을 구성하는 데 사용되었다.

Ia Pla 등. (Biotechnol Prog, 2006, pp 881-888)은 AOX 프로모터 및 메탄올에 의한 유도를 사용하여 scFv를 발현하기 위한 Mut^S 및 Mut⁺ P. pastoris 균주를 설명한다.

EP1905836A1은 재조합 인간 인터페론 알파를 생산하기 위한 P. pastoris 균주를 개시하고, 돌연변이된 AOX1 유전자를 포함하지만 AOX1 유전자좌의 완전한 결실을 포함하지 않는 AOX1-교란된 클론의 사용을 제안한다.

Ching-Hsiang Chang 등. (BMC Biotechnology 2018, 18(1):81)은 메탄올 발현 조절자 1(methanol expression regulator 1, Mxr1)-재프로그래밍된 세포를 사용하여 P. pastoris에서 유연한 pAOX1 유도 시스템을 제안한다.

Russmayer H. 등. (BMC Biology 2015, 13(1):80)은 P. pastoris 발현 시스템 조절에서 AOX의 중요성을 설명한다.

Tomas-Gamisans M. 등. (Microbial Biotechnology 2018, 11(1):224-237)은 단독 탄소원으로서 메탄올 또는 글리세롤에 대한 개선된 예측을 위한 P. pastoris 게놈 규모 대사 모델을 설명한다.

Moser 등. (Microbial Cell Factories 2017, 16(1):49)는 P. pastoris의 성장 및 재조합 단백질 생산을 개선하기 위한 적응 실험실 진화를 설명한다.

P. pastoris에서 재조합 단백질 생산은 높은 산소 요구량과 높은 바이오매스 농도와 메탄올 소비를 요구하는 열 생산으로 이어지는 집중적인 공정 계획을 필요로한다. 다운스트림 공정에서 산소 전달, 냉각 및 바이오매스 분리는 비용이 많이 든다. 따라서 낮은 산소 요구량 및 열 생산 공정을 개발하는 것이 바람직하다. 특히 탄소원의 효율적인 사용에 의해 단백질 생산 수율을 증가시키는 것이 더욱 바람직하다.

본 발명의 목적은 메틸영양 효모에서 재조합 단백질 생산을 개선하는 것이다.

본 발명의 목적은 청구범위의 주제에 의해 그리고 여기에 추가로 설명된 바와 같이 해결된다.

본 발명은 다음과 같이 조작된 재조합 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포를 제공한다:

a) 상기 하나 이상의 유전적 변형 이전의 숙주 세포와 비교하여 제1 및 제2 내인성 유전자의 발현을 감소시키기 위한 하나 이상의 유전적 변형에 의해, 여기서

i. 제1 내인성 유전자는 서열번호 1로 확인된 아미노산 서열 또는 이의 상동체를 포함하는 알코올 산화효소 1(AOX1)을 암호화하고,

ii. 제2 내인성 유전자는 서열번호 3으로 확인된 아미노산 서열 또는 이의 상동체를 포함하는 알코올 산화효소 2(AOX2)를 암호화하고,

그리고

b) 상기 하나 이상의 유전적 변형 이전에 숙주 세포와 비교하여 알코올 탈수소효소(ADH2) 유전자의 발현을 증가시키기 위한 하나 이상의 유전적 변형에 의해, 여기서 ADH2 유전자는 알코올 탈수소효소(ADH2)를 인코딩한다.

구체적으로, ADH2 단백질은 EC 1.1.1.1로 분류되는 알코올 탈수소효소이다.

본 명세서에서, 용어 "ADH2"는 서열 번호 50 (UniProtKB - F2QSX6_KOMPC; FR839629 게놈 DNA 번역: CCA38504.1; 유전자: PP7435_Chr2-0821)으로 확인된 아미노산 서열, 또는 서열번호 50과 특정 상동성(또는 서열 동일성)을 갖는 서열을 포함하거나 이로 구성된 P. pastoris 알코올 탈수소효소와 같은 본래의 알코올 탈수소효소를 지칭한다.

구체적으로, ADH2는 P. pastoris 균주로부터 유래할 수 있거나, 예를 들어 진핵생물을 비롯한 진핵생물과 같은 유기체의 야생형 세포로부터 기원하거나 내인성인 이의 상동체 또는 이종상동체일 수 있다. 효모, 특히 메틸영양 효모 균주, 종 또는 속의 효모, 또는 이러한 자연 발생 ADH2의 돌연변이체일 수 있다.

구체적으로, ADH2 단백질은 숙주 세포의 종 또는 이의 돌연변이체에서 자연적으로 발생하거나 내인성이다.

구체적으로, 본 명세서에서 ADH2 유전자로 지칭되는 P. pastoris 알코올 탈수소효소를 코딩하는 유전자는 서열번호 51로 확인된 염기서열 또는 ADH2가 서열번호 50에 대한 특정 상동성(또는 서열 동일성)을 갖는 ADH2를 코딩하는 상동 폴리뉴클레오티드(유전자)를 포함하거나 이로 이루어진다.

구체적으로, ADH2 유전자는 Mut-숙주 세포에 대해 내인성 또는 이종성이다. 구체적으로, Mut-숙주 세포는 상기 ADH2 유전자의 하나 이상의 카피를 포함한다.

구체적으로 ADH2는 다음 중 하나이다:

a) 서열번호 50으로 확인된 아미노산 서열을 포함하는 P. pastoris ADH2인 ADH2, 또는 효모 종, 특히 메틸영양성 효모에 내인성인 이의 상동체; 또는

b) 서열번호 50과 60% 이상 동일한 a)의 ADH2 돌연변이.

상동 서열은 또한 ADH2 상동체 또는 ADH2 상동체로 지칭된다.

예시적인 상동체는 도 1에 설명되어 있다:

서열번호 52: Komagataella pastoris, ATCC 28485의 ADH2 아미노산 서열

서열번호 53: Komagataella pastoris, ATCC 28485의 ADH2 유전자 서열

서열번호 54: Ogataea parapolymorpha, DL-1의 ADH2 아미노산 서열

서열번호 55: Ogataea parapolymorpha, DL-1의 ADH2 유전자 서열

서열번호 56: Ogataea parapolymorpha, DL-1의 ADH2 아미노산 서열

서열번호 57: Ogataea parapolymorpha, DL-1의 ADH2 유전자 서열

서열번호 58: Ogataea polymorpha, NCYC 495 leu1.1의 ADH 아미노산 서열

서열번호 59: Ogataea polymorpha, NCYC 495 leu1.1의 ADH 유전자 서열

서열번호 60: Ogataea polymorpha, NCYC 495 leu1.1의 ADH 아미노산 서열

서열번호 61: Ogataea polymorpha, NCYC 495 leu1.1의 ADH 유전자 서열

서열번호 62: Saccharomyces cerevisiae, YJM627의 ADH2 아미노산 서열

서열번호 63: Saccharomyces cerevisiae, YJM627의 ADH2 유전자 서열

서열번호 64: Candida maltosa, Xu316의 ADH2 아미노산 서열

서열번호 65: Candida maltosa, Xu316의 ADH2 유전자 서열

서열번호 66: Kluyveromyces marxianus, DMKU3-1042의 ADH4 아미노산 서열

서열번호 67: Kluyveromyces marxianus, DMKU3-1042의 ADH4 유전자 서열

서열번호 68: Escherichia coli, 7.1982의 ADH1 아미노산 서열

서열번호 69: Escherichia coli, 7.1982의 ADH1 유전자 서열

서열번호 70: Fusarium graminearum, PH-1의 ADH1 아미노산 서열

서열번호 71: Fusarium graminearum, PH-1의 ADH1 유전자 서열

구체적으로, ADH2 상동체는 서열번호 50에 대해 60%, 70%, 80%, 85%, 90%, 또는 95% 서열 동일성 중 어느 하나 이상을 갖는다. ADH2 상동체는 본 명세서에서 ADH2 상동체를 인코딩하는 것으로 이해된다. 구체적으로, 서열 동일성은 예를 들어 전장 서열을 비교할 때 본원에 추가로 개시된 바와 같이 결정된다.

구체적으로, 상동체 또는 상동성 서열은 예를 들어 알코올 탈수소효소(EC 1.1. 1.1.).

구체적으로, 상동체 또는 상동성 서열은 예를 들어 알코올 탈수소효소(EC 1.1.1.1.)와 같은 P. pastoris, 특히 K. pastoris 또는 K. phaffii에서와 같은 야생형 숙주 세포에서 ADH2 단백질의 동일한 정성적 기능을 특징으로 한다.

구체적으로, 서열번호 50의 상동 서열은 P. pastoris, 이외의 종, 특히 K. pastoris 또는 K. phaffii, 예를 들어 Komagataella 또는 Pichia 속의 또 다른 효모이고, 본 명세서에 기재된 바와 같이 증가된 (예를 들어, 노크인) 각각의 내인성 코딩 서열의 발현이다.

숙주 세포가 P. pastoris, 특히 K. pastoris 또는 K. phaffii의 것인 경우, ADH2 단백질은 내인성 서열, 예를 들어 서열번호 50, 또는 상이한 균주 또는 종의 서열번호 50의 상동체를 포함하거나 구성될 수 있거나 또는 돌연변이 ADH2 단백질의 인공 서열, 이는 야생형 균주 또는 유기체에서 자연적으로 발생하지 않는, 특히 메틸영양성 효모에서 자연적으로 발생하지 않는 것일 수 있다.

특정 예에 따르면, 상동 서열은 야생형 P. pastoris에서 내인성 자연 발생 P. pastoris 알코올 탈수소효소의 활성과 비교하여 0.2배, 0.3배, 0.4배, 0.5배, 0.6배, 0.7배, 0.8배, 0.9배, 1배, 1.1-배, 1.2-배, 1.3-배, 1.4-배, 1.5-배, 1.6-배, 1.7-배, 1.8-배, 1.9-배, 2-배 또는 훨씬 더 높은 알코올 탈수소효소 활성 중 어느 하나 이상을 갖는다. 알코올 탈수소효소 활성은 예를 들어 무세포(cell free) 추출물을 사용하는 알코올 탈수소효소 검정과 같은 적절한 검정으로 측정할 수 있다. 무세포 추출물은 Karaoglan 등. (Biotechnol Lett. 2016; 38(3):463-9)에서 기술된 바와 같이, 지르코니아/실리카/유리 비드에 의한 세포 배양물의 기계적 파쇄에 의해 얻어질 수 있다. 알코올 탈수소효소 활성은 Walker(Biochemical Education. 1992 21(1):42-43)에 의해 기술된 바와 같이 340 nm의 파장에서 흡수 증가를 측정함으로써 NADH의 형성 후에 측정될 수 있다. NAD⁺와 알코올은 기질로 사용될 수 있으며 등몰 농도로 소비된다. NADH 생산은 NAD⁺ 소비와 반비례한다. 또는 상용 비색 알코올 탈수소효소 활성 분석 키트(MAK053, Sigma-Aldrich)를 사용할 수 있다. 예시적인 분석은 예시 섹션에 설명되어 있다.

본 명세서에 기재된 바와 같이, 용어 "AOX1"은 서열번호 1 (UniProtKB - F2QY27)로 확인된 아미노산 서열을 포함하거나 이로 구성된 P. pastoris 알코올 옥시다제 1과 같은 천연 알코올 옥시다제 1, 또는 서열번호 1에 대한 특정 상동성(또는 서열 동일성)을 갖는 서열, 이는 메틸영양성 효모 종, 특히 본원의 메틸영양성 효모에 내인성인 P. pastoris 알코올 산화효소 1의 상동체일 수 있다. 상기 내인성 알코올 옥시다제 1의 발현을 감소시키기 위한 상기 하나 이상의 유전적 변형 이전에 숙주 세포로서 사용된다. 특히, AOX1 단백질은 숙주 세포 종의 종에 내인성인 이종상동체이다.

구체적으로, 본 명세서에서 AOX1 유전자로 지칭되는 P. pastoris 알코올 옥시다제 1을 코딩하는 유전자는 서열번호 2로 확인된 뉴클레오티드 서열을 포함하거나 이로 이루어진다.

상동 서열은 또한 AOX1 상동체 또는 AOX1 상동체로 지칭된다. 구체적으로, AOX1 단백질 또는 AOX1 상동체는 EC 1.1.3.13으로 분류되는 알코올 산화효소 효소이다.

구체적으로, AOX1 상동체는 서열번호 1에 대해 60%, 70%, 80%, 85%, 90%, 또는 95% 서열 동일성 중 적어도 어느 하나를 갖는다. AOX1 상동체는 본 명세서에서 AOX1 상동체를 인코딩하는 것으로 이해된다. 구체적으로, 서열 동일성은 예를 들어 전장 서열을 비교할 때 본원에 추가로 개시된 바와 같이 결정된다.

본 명세서에 기재된 바와 같이, 용어 "AOX2"는 서열번호 3 (UniProtKB - F2R038)으로 확인된 아미노산 서열을 포함하거나 이로 구성된 P. pastoris 알코올 산화효소 2와 같은 천연 알코올 산화효소 2, 또는 서열번호 3에 대한 특정 상동성(또는 서열 동일성)을 갖는 서열, 이는 메틸영양성 효모 종, 특히 본원의 메틸영양성 효모에 내인성인 P. pastoris 알코올 산화효소 2의 상동체일 수 있다. 상기 내인성 알코올 산화효소 2의 발현을 감소시키기 위한 상기 하나 이상의 유전적 변형 전에 숙주 세포로서 사용된다. 특히, AOX2 단백질은 숙주 세포 종의 종에 내인성인 이종상동체이다.

구체적으로, 본원에서 AOX2 유전자로 지칭되는 P. pastoris 알코올 옥시다제 2를 코딩하는 유전자는 서열번호 4로 확인된 뉴클레오티드 서열을 포함하거나 이로 이루어진다.

상동 서열은 또한 AOX2 상동체 또는 AOX2 상동체로 지칭된다. 구체적으로, AOX2 단백질 또는 AOX2 동족체는 EC 1.1.3.13으로 분류되는 알코올 산화효소 효소이다.

구체적으로, AOX2 상동체는 서열번호 3에 대해 60%, 70%, 80%, 85%, 90%, 또는 95% 서열 동일성 중 어느 하나 이상을 갖는다. AOX2 상동체는 본 명세서에서 AOX2 상동체를 인코딩하는 것으로 이해된다. 구체적으로, 서열 동일성은 예를 들어 전장 서열을 비교할 때 본원에 추가로 개시된 바와 같이 결정된다.

구체적으로, AOX1 및/또는 AOX2 단백질은 숙주 세포가 P. pastoris, 특히 K. pastoris 및 K. phaffii인 경우 각각 P. pastoris 기원, 특히 K. pastoris 또는 K. phaffii 기원이다. 대안적으로, 각각의 AOX1 및 AOX2 단백질은 P. pastoris, 특히 K. pastoris 또는 K. phaffii 기원의 각각의 단백질의 상동(또는 상동) 서열을 포함하며, 이 상동(이종상동) 서열은 야생형 숙주 세포(다른 기원 또는 종의 경우)에 내인성이다. 예를 들어, 숙주 세포가 K. phaffii인 경우, 내인성 AOX1 또는 AOX2 단백질은 각각 서열번호 1 및 서열번호 3으로 확인된 아미노산 서열을 포함하거나 이로 이루어진다.

다른 예에 따르면, 숙주 세포가 K. pastoris인 경우, 내인성 AOX1 단백질은 서열번호 9(Komagataella pasteris, ATCC 28485)로 확인된 아미노산 서열을 포함하거나 이로 구성되며, 이는 서열번호 1과 99.85% 동일하다.

다른 예에 따르면, 숙주 세포가 K. pastoris인 경우, 내인성 AOX2 단백질은 서열번호 3과 99.40% 동일한 서열번호 11로 확인된 아미노산 서열을 포함하거나 이로 이루어진다.

예시적인 상동체는 도 1에 설명되어 있다:

서열번호 9: Komagataella pastoris, ATCC 28485의 AOX1 아미노산 서열

서열번호 10: Komagataella pastoris, ATCC 28485의 AOX1 뉴클레오티드 서열

서열번호 11: Komagataella pastoris, ATCC 28485의 AOX2 아미노산 서열

서열번호 12: Komagataella pastoris, ATCC 28485의 AOX2 뉴클레오티드 서열

서열번호 13: Ogataea methanolica JCM 10240의 MOD1 아미노산 서열

서열번호 14: Ogataea methanolica JCM 10240의 MOD1 뉴클레오티드 서열

서열번호 15: Ogataea methanolica JCM 10240의 MOD2 아미노산 서열

서열번호 16: Ogataea methanolica JCM 10240의 MOD2 뉴클레오티드 서열

서열번호 17: Ogataea methanolica JCM 10240의 pMOD1 프로모터 서열

서열번호 18: Ogataea methanolica JCM 10240의 pMOD2 프로모터 서열

서열번호 19: Ogataea polymorpha NCYC 495 leu 1.1의 MOX 아미노산 서열

서열번호 20: Ogataea polymorpha NCYC 495 leu 1.1의 MOX 뉴클레오티드 서열

서열번호 21: Ogataea polymorpha NCYC 495 leu 1.1의 pMOX 프로모터 서열

그러나, 숙주 세포가 다른 종의 경우(K. pastoris 및/또는 K. phaffii는 제외), 숙주 세포에 내인성인 AOX1 또는 AOX2 단백질 서열은 각각 서열번호 1 및 서열번호 3에 대한 상동체이고, 숙주 세포에서 이러한 상동체의 발현(각각 서열번호 1 및 서열번호 3의 이종 서열)은 본원에 기재된 목적을 위해 감소된다.

구체적으로, 임의의 또는 각각의 상동 서열은 P. pastoris, 특히 K. pastoris 또는 K. phaffii, 예를 들면 알코올 산화효소(EC 1.1.3.13)에서와 같은 야생형 숙주 세포에서 각각의 AOX1 및 AOX2 단백질의 동일한 정성적 기능을 특징으로 한다.

구체적으로, 서열번호 1 및 서열번호 3의 각각의 상동성 서열은 P. pastoris, 특히 K. pastoris 또는 K. phaffii, 예를 들어, Komagataella 또는 Pichia 속의 또 다른 효모이외의 종의 것이고, 각각의 내인성 코딩 서열의 발현은 본 명세서에 기재된 바와 같이 각각의 내인성 코딩 서열의 감소 또는 폐지(녹아웃)된다.

구체적으로, AOX1 및 AOX2 단백질 모두는 숙주 세포에 내인성이며, 각각 AOX1 및 AOX2를 코딩하는 유전자의 발현이 감소되거나 결실된다.

구체적으로, AOX1 및 AOX2 단백질 둘 모두는 동일한 기원을 가지며, 상기 제1 및 제2 내인성 유전자의 발현을 감소시키기 위한 조작 전에 동일한 숙주 세포(또는 숙주 세포 종)에서 기원하거나 내인성이다.

구체적으로, AOX1 및 AOX2 단백질 둘 모두는 P. pastoris 기원, 특히 숙주 세포에 내인성인 각각의 유전자에 의해 코딩되는 단백질이고, 여기서 숙주 세포는 P. pastoris이다.

구체적으로, AOX1 및 AOX2 단백질 모두는 Komagataella phaffii 기원, 특히 숙주 세포에 내인성인 각각의 유전자에 의해 코딩되는 단백질이고, 여기서 숙주 세포는 Komagataella phaffii이다.

구체적으로, AOX1 및 AOX2 단백질 모두는 Komagataella pastoris 기원, 특히 숙주 세포에 내인성인 각각의 유전자에 의해 코딩되는 단백질이고, 여기서 숙주 세포는 Komagataella pastoris이다.

특정 측면에 따르면, 상기 하나 이상의 유전적 변형은 (i) 하나 이상의 폴리뉴클레오타이드, 또는 이의 일부; 또는 (ii) 발현 조절 서열의 파괴, 치환, 결실, 녹인 또는 녹아웃을 포함한다.

특정 측면에 따르면, 상기 하나 이상의 유전적 변형은 예를 들어 각각의 AOX1, AOX2 또는 ADH2 단백질, 특히 숙주 세포 종, 유형 또는 균주에서 자연적으로 발생하는 야생형(비변형 또는 천연) 단백질, 또는 상기 폴리뉴클레오티드(또는 유전자)의 발현을 제어하는 뉴클레오티드 서열을 코딩하는 상기 폴리뉴클레오티드(또는 유전자)를 포함하는 코딩 폴리뉴클레오티드와 같은 본원에 기재된 숙주 세포의 하나 이상의 내인성 폴리뉴클레오티드의 것이다.

특정 측면에 따르면, 상기 하나 이상의 유전적 변형은 예를 들어 프로모터, 리보솜 결합 부위, 전사 또는 번역 시작 및 정지 서열을 포함하는 발현 조절 서열, 또는 인핸서 또는 활성제 서열의 것이다.

숙주 세포를 조작하는 다양한 방법을 사용하여 다음과 같은 내인성 폴리뉴클레오티드의 발현을 조절(감소 또는 증가)시킬 수 있습니다.

a) 각각의 AOX1 또는 AOX2 단백질을 코딩하는 유전자의 발현을 감소시키기 위하여, 예를 들어, 각각의 AOX1 또는 AOX2 단백질을 코딩하는 폴리뉴클레오티드의 파괴, 이러한 폴리뉴클레오티드에 작동가능하게 연결된 프로모터의 파괴, 더 낮은 프로모터 활성을 갖는 다른 프로모터로 이러한 프로모터를 대체; 또는

b) ADH2 단백질을 코딩하는 유전자의 발현을 증가시키기 위해, 예를 들어, ADH2 단백질을 코딩하는 폴리뉴클레오티드를 숙주 세포 게놈에 도입, 이러한 폴리뉴클레오티드에 작동 가능하게 연결된 프로모터를 파괴, 이러한 프로모터를 더 높은 프로모터 활성를 갖는 다른 프로모터로 교체.

유전자 발현을 조절하는 특정 방법은 숙주 세포를 변형시키는 CRISPR 기반 방법에 사용되는 RNA 가이드된 리보뉴클레아제에 의한 서열에 표적화된 각각의 전사 조절인자들, 예를 들어, 프로모터, 리보솜 결합 부위, 전사 시작 또는 정지 서열, 번역 시작 또는 정지 서열, 인핸서 또는 활성제 서열, 억제인자 또는 억제제 서열, 신호 또는 리더 서열, 특히 단백질의 발현 및/또는 분비를 조절하는 서열로 이루어진 군으로부터 선택된 조절 서열 폴리뉴클레오티드(유전자)의 발현을 조절하는 조절 서열을 조절(예: 활성화, 상향 조절, 비활성화, 억제 또는 하향 조절)하는 것을 사용한다.

특정 측면에 따르면, 상기 하나 이상의 유전적 변형은 ADH2의 수준 또는 활성을 증가시키는 ADH2 유전자의 기능 획득(gain-of-function) 변경을 포함한다.

구체적으로, 상기 기능 획득 변경은 ADH2 유전자의 녹킨을 포함한다.

구체적으로, 상기 기능 획득 변경은 상기 세포에서 ADH2 유전자 발현을 상향 조절한다.

구체적으로, 상기 기능 획득 변경은 상기 세포에서 ADH2 유전자를 과발현하기 위한 이종 발현 카세트의 삽입을 포함한다.

구체적으로, 상기 이종 발현 카세트는 프로모터 서열의 제어 하에 ADH2 유전자를 포함하는 이종 폴리뉴클레오티드를 포함한다. 이러한 프로모터는 구성적, 억제성 또는 유도성 프로모터 중 임의의 것일 수 있다.

구체적으로, 유전자의 발현을 증가시키기 위한 상기 하나 이상의 유전적 변형은 유전자 또는 유전자의 일부의 발현을 적어도 50%, 60% 증가시키는 유전자 또는 게놈 서열의 삽입 또는 활성화를 포함하는 하나 이상의 게놈 돌연변이, 70%, 80%, 90%, 또는 95%, 또는 훨씬 더 예를 들어, 이종 유전자의 녹인(knockin)에 의해, 또는 내인성 유전자의 카피 수 증가에 의해 이러한 유전적 변형이 없는 각각의 숙주와 비교된다.

구체적으로, 발현을 증가시키는 하나 이상의 유전적 변형은 하나 이상의 내인성 폴리뉴클레오티드의 발현을 구성적으로 개선하거나 그렇지 않으면 증가시키는 게놈 돌연변이를 포함한다.

구체적으로, 발현을 증가시키는 하나 이상의 유전적 변형은 하나 이상의 내인성 폴리뉴클레오티드의 발현을 조건부로 개선하거나 그렇지 않으면 증가시키는 하나 이상의 유도성 또는 억제성 조절 서열을 도입하는 게놈 돌연변이를 포함한다. 이러한 조건부 활성 변형은 특히 세포 배양 조건에 따라 활성 및/또는 발현되는 조절 요소 및 유전자를 표적으로 한다.

구체적으로, ADH2 단백질을 코딩하는 폴리뉴클레오티드의 발현은 POI(Protein of Interest)의 생산 방법에서 숙주 세포를 사용하는 경우 증가된다. 구체적으로, 유전자 변형 시 POI가 생성되는 숙주 세포 배양 조건에서 ADH2 단백질의 발현이 증가한다.

구체적으로, 숙주 세포는 ADH2 단백질의 양(예를 들어, 수준, 활성 또는 농도)을 50%, 60%, 70%, 80%, 90%, 또는 95% 중 적어도 어느 하나로 증가시키도록 유전적으로 변형된다. 예를 들어, 하나 이상의 각각의 ADH2 유전자의 녹인에 의해 상기 변형이 없는 숙주 세포와 비교하여 %, (mol/mol), 또는 그 이상. 특정 실시양태에 따르면, 숙주 세포는 (하나 이상의) 게놈 서열, 특히 숙주 세포 게놈에 통합된 각각의 ADH2 단백질을 코딩하는 게놈 서열의 하나 이상의 삽입을 포함하도록 유전적으로 변형된다. 이러한 숙주 세포는 일반적으로 녹인 균주로 제공된다.

특정 실시양태에 따르면, 본원에 기재된 숙주 세포가 세포 배양물에서 배양되면, 숙주 세포 또는 숙주 세포 배양물에서 ADH2 단백질의 총량이 50%, 60%, 70%, 80%, 90%, 또는 95%, (활성% 또는 mol/mol), 또는 심지어 100% 이상 중 적어도 어느 하나로 증가된다. 이러한 유전적 변형 전 또는 없이 숙주 세포에 의해 발현되거나 생성된 기준량, 또는 비교 각각의 숙주 세포 배양물에서 생성된 기준량으로, 또는 상기 변형 전 또는 변형 없이 숙주 세포와 비교된다.

구체적으로, AOX1 및/또는 AOX2 유전자와 같은 유전자의 발현을 감소시키기 위한 상기 하나 이상의 유전적 변형은 유전자 또는 그 일부의 발현을 감소시키는 유전자 또는 게놈 서열의 결실 또는 불활성화를 포함하는 하나 이상의 게놈 돌연변이를 포함하거나 유전자의 적어도 50%, 60%, 70%, 80%, 90%, 또는 95%, 또는 심지어 이러한 유전자 변형이 없는 각각의 숙주와 비교하여 유전자의 녹아웃과 같은 유전자 발현의 완전한 제거된 유전자 또는 그 부분을 포함한다.

구체적으로, 발현을 감소시키는 하나 이상의 유전자 변형은 하나 이상의 내인성 폴리뉴클레오티드의 발현을 구성적으로 손상시키거나 그렇지 않으면 감소시키는 게놈 돌연변이를 포함한다.

구체적으로, 발현을 감소시키는 하나 이상의 유전적 변형은 하나 이상의 내인성 폴리뉴클레오티드의 발현을 조건부로 손상시키거나 그렇지 않으면 감소시키는 하나 이상의 유도성 또는 억제성 조절 서열을 도입하는 게놈 돌연변이를 포함한다. 이러한 조건부 활성 변형은 특히 세포 배양 조건에 따라 활성 및/또는 발현되는 조절 요소 및 유전자를 표적으로 한다.

구체적으로, 관심 단백질(POI)을 생산하는 방법에서 숙주 세포를 사용할 때 상기 하나 이상의 내인성 폴리뉴클레오타이드의 발현이 감소되어 각각의 AOX1 또는 AOX2 단백질을 인코딩하는 폴리뉴클레오타이드의 발현이 감소된다. 구체적으로, 유전자 변형시, AOX1 및 AOX2 단백질 둘 다의 발현은 POI가 생성되는 동안 숙주 세포 배양 조건 하에서 감소된다.

구체적으로, 숙주 세포는 AOX1 및 AOX2 단백질 둘 다의 양(예: 수준, 활성 또는 농도)을 상기 변형이 없는 숙주 세포와 비교하여 50%, 60%, 70%, 80%, 90%, 또는 95%, (활성%, 또는 mol/mol), 또는 심지어 100%, 예를 들어, 각각의 AOX1 및 AOX2 유전자의 녹아웃에 의해 AOX1 및 AOX2 단백질 모두의 생산을 검출할 수 없는 양으로 완전히 제거된 비-검출 양 중 적어도 어느 하나로 감소시키도록 유전적으로 변형된다. 특정 실시양태에 따르면, 숙주 세포는 (하나 이상의) 게놈 서열, 특히 각각의 AOX1 및/또는 AOX2 단백질을 코딩하는 게놈 서열의 하나 이상의 결실을 포함하도록 유전적으로 변형된다. 이러한 숙주 세포는 전형적으로 결실 또는 녹아웃 균주로서 제공된다.

특정 측면에 따르면, 상기 제1 및/또는 제2 내인성 유전자는 상기 하나 이상의 유전적 변형에 의해 녹아웃된다. 구체적으로, Mut- 숙주 세포는 △AOX1/△AOX2 녹아웃 균주이다.

특정 측면에 따르면, 상기 제1 및/또는 제2 내인성 유전자는 상기 하나 이상의 유전적 변형에 의해 녹아웃되고; 상기 ADH2 유전자는 상기 하나 이상의 유전적 변형에 의해 녹인된다. 구체적으로, Mut- 숙주 세포는 △AOX1/△AOX2 + ADH2-OE 균주이다.

특정 실시양태에 따르면, 본원에 기재된 숙주 세포가 세포 배양물에서 배양되면, 숙주 세포 또는 숙주 세포 배양물에서 각각의 AOX1 및/또는 AOX2 단백질의 총량이 50%, 60%, 70%, 80%, 90%, 또는 95%, (mol/mol), 또는 심지어 100%, 예를 들어 이러한 유전적 변형 전 또는 없이 숙주 세포에 의해 발현되거나 생성된 기준량과 비교하거나, 각각의 숙주 세포 배양에서 생성된 기준량과 비교하거나, 또는 상기 변형 전 또는 없는 숙주 세포와 비교하여 검출 불가능한 양 중 적어도 어느 하나에 의해 감소된다.

각각의 ADH2, AOX1 또는 AOX2 단백질의 생산을 증가 또는 감소시키는 상기 유전적 변형의 효과에 대해 본원에 기재된 숙주 세포를 비교할 때, 이는 전형적으로 이러한 유전적 변형 전 또는 없이 비교가능한 숙주 세포와 비교된다. 특히 상기 POI를 생성하는 조건 하에 배양될 때 재조합 또는 이종 POI를 생성하도록 조작된 유전자 변형 없이(또는 이전에) 동일한 숙주 세포 종 또는 유형으로 비교가 이루어진다. 그러나, 재조합 또는 이종 POI를 생성하도록 추가로 조작되지 않은 동일한 숙주 세포 종 또는 유형으로 비교가 이루어질 수도 있다.

특정 측면에 따르면, 각각의 ADH2, AOX1 또는 AOX2 단백질의 증가 또는 감소는 세포 내 각각의 단백질의 양(예를 들어, 수준, 활성 또는 농도)의 증가 또는 감소에 의해 결정된다. 구체적으로, 상기 단백질의 양은 웨스턴 블롯, 면역형광 영상화, 유세포분석 또는 질량분석법, 특히 질량분석법이 액체 크로마토그래피-질량분석법(LC-MS) 또는 액체 크로마토그래피를 사용하는 것과 같은 적절한 방법에 의해 결정됩니다. 탠덤 질량 분석법(LC-MS/MS), 예를 들어 Doneanu 등. (MAbs. 2012; 4(1): 24-44). 구체적인 예에 따르면, 알코올 탈수소효소 활성은 무세포 추출물을 이용한 활성 분석에 의해 측정될 수 있다. 무세포 추출물은 Karaoglan 등. (Biotechnol Lett. 2016; 38(3): 463-9)에 의해 기술된 지르코니아/실리카/유리 비드에 의한 세포 배양의 기계적 파괴에 의해 획득될 수 있다. 알코올 탈수소효소 활성은 Walker (Biochemical Education. 1992 21(1):42-43)에 의해 기술된 바와 같이 340 nm의 파장에서 흡수 증가를 측정함으로써 NADH의 형성 직후에 측정된다. NAD⁺와 알코올은 기질로 사용되며 등몰 농도로 소비된다. NADH 생산은 NAD⁺ 소비와 반비례한다. 또는 상용 비색 알코올 탈수소효소 활성 분석 키트(MAK053, Sigma-Aldrich)를 사용할 수 있다. 알코올 산화효소 활성은 Verduyn 등. (Journal of Microbiological Methods. 1984(2)1: 15-25)이 설명한 대로 과산화수소와 반응하는 2,2'-azino-bis-(3-ethylbenzothiazoline-6-sulfonic acid)를 사용하여 열량 측정법으로 측정되거나 Couder 및 Baratti(Agric. Bioi. Chern. 1980; 44(10):2279-2289)에 의해 기술된 바와 같이 형성된 포름알데히드의 양으로 측정될 수 있다. 자세한 분석은 실시예 섹션에 기술되어 있다.

특정 측면에 따르면, Mut- 숙주 세포는 관심 단백질(POI)을 암호화하는 관심 유전자(GOI)에 작동가능하게 연결된 발현 카세트 프로모터(expression cassette promoter, ECP)를 포함하는 이종 관심 유전자 발현 카세트(gene of interest expression cassette, GOIEC)를 포함한다.

특정 측면에 따르면, 돌연변이-숙주 세포는 적어도 하나의 이종 GOIEC를 포함하는 재조합 숙주 세포이고, 여기서 GOIEC에 포함된 적어도 하나의 성분 또는 성분의 조합은 숙주 세포에 대해 이종이다. 구체적으로, 인공 발현 카세트가 사용되며, 특히 프로모터와 GOI가 서로에 대해 이종성이고, 자연에서 이러한 조합으로 발생하지 않고, 예를 들어 프로모터와 GOI 중 하나(또는 하나만)가 인공적이거나 이종성인 경우 기타 및/또는 본원에 기재된 숙주 세포; 프로모터는 내인성 프로모터이고 GOI는 이종 GOI이고; 또는 프로모터는 인공 또는 이종 프로모터이고 GOI는 내인성 GOI이고; 여기서 프로모터 및 GOI 둘 모두는 인공적이거나, 이종적이거나, 본원에 기재된 숙주 세포와 비교하여 세포의 상이한 종 또는 유형(균주)과 같은 상이한 기원으로부터 유래한다. 구체적으로, ECP는 본 명세서에 기재된 숙주 세포로서 사용되는 세포에서 상기 GOI와 자연적으로 연관되거나 작동가능하게 연결되지 않는다.

구체적으로, GOIEC는 구성적(constitutive), 유도성(inducible) 또는 억제성(repressible) 프로모터를 포함한다.

구성적 프로모터의 구체적인 예는 예를 들어 WO2014139608에 공개된 pGAP 및 이의 기능적 변이체, pCS1과 같은 구성적 프로모터 중 임의의 것을 포함한다.

유도성 또는 억제성 프로모터의 특정 예는 예를 들어 WO2013050551에 공개된 천연 pAOX1 또는 pAOX2 및 이의 기능적 변이체, 임의의 조절 프로모터, 예를 들어 pG1-pG8, 및 이의 단편; WO2017021541 A1에 공개된 pG1 및 pG1-x와 같은 임의의 조절 프로모터를 포함한다.

효모 숙주 세포와 함께 사용하기에 적합한 프로모터 서열은 Mattanovich 등. (Methods Mol. Biol. (2012) 824:329-58)에 기술되어 있고, triosephosphate isomerase (TPI)와 같은 당분해효소, phosphoglycerate kinase (PGK), glyceraldehyde-3- phosphate dehydrogenase (GAPDH or GAP) 및 이의 변이체, lactase (LAC) and galactosidase (GAL), P. pastoris glucose-6-phosphate isomerase promoter (PPGI), 3- phosphoglycerate kinase promoter (PPGK), the glycerol aldehyde phosphate dehydrogenase promoter (pGAP), translation elongation factor promoter (PTEF), 및 P. pastoris enolase 1 (PEN01) 프로모터, triose phosphate isomerase (PTPI), ribosomal subunit proteins (PRPS2, PRPS7, PRPS31, PRPL1), alcohol oxidase promoter (PAOX1, PAOX2) 또는 변형된 특성을 갖는 이의 변이체, formaldehyde dehydrogenase promoter (PFLD), isocitrate lyase promoter (PICL), alpha-ketoisocaproate decarboxylase promoter (PTHI), heat shock protein family members (PSSA1, PHSP90, PKAR2)의 프로모터, 6-Phosphogluconate dehydrogenase (PGND1), phosphoglycerate mutase (PGPM1), transketolase (PTKL1), phosphatidylinositol synthase (PPIS1), ferro-02-oxidoreductase (PFET3), high affinity iron permease (PFTR1), repressible alkaline phosphatase (PPH08), N-myristoyl transferase (PNMT1), pheromone response transcription factor (PMCM1), ubiquitin (PUBI4), single- stranded DNA endonuclease (PRAD2)의 프로모터, mitochondrial inner membrane (PPET9)의 주요 ADP/ATP 운반체의 프로모터(WO2008/128701) 및 formate dehydrogenase (FMD) 프로모터를 포함한다.

적합한 프로모터의 추가 예에는 Saccharomyces cerevisiae enolase (ENO1), Saccharomyces cerevisiae galactokinase (GAL1), Saccharomyces cerevisiae alcohol dehydrogenase/glyceraldehyde-3-phosphate dehydrogenase (ADH1, ADH2/GAP), Saccharomyces cerevisiae triose phosphate isomerase (TPI), Saccharomyces cerevisiae metallothionein (CUP1), 및 Saccharomyces cerevisiae 3-phosphoglycerate kinase (PGK), 및 maltase gene promoter (MAL)를 포함한다.

GAP 프로모터(pGAP), AOX1(pAOX1) 또는 AOX2(pAOX2) 프로모터 또는 이들의 기능적 변이체인 프로모터이고, pGAP, pAOX1 또는 pAOX2 중 어느 하나로부터 유도된 프로모터가 특히 바람직하다. pAOX 프로모터는 메탄올에 의해 유도될 수 있으며 포도당에 의해 억제된다. 구체적으로, 기능적 변이체는 그것이 유래된 프로모터에 대해 80%, 85%, 90%, 95% 또는 100% 서열 동일성 중 적어도 어느 하나를 가지며 그것이 유래된 프로모터에 대해 거의 동일한 프로모터 활성(예: +/- 50%, 40%, 30%, 20%, 또는 10% 중 어느 하나; 프로모터 활성이 향상될 수 있음에도 불구하고)을 가지고 있다.

특정 구현예에 따르면, ECP는 메탄올-유도성이다. 특히 ECP는 메탄올로 조절된다. 구체적으로, ECP는 메탄올 함유 세포 배양에서 완전히 유도될 수 있다. 이러한 경우, 메탄올은 세포 배양에 공급되는 에너지원으로 사용될 수 있을 뿐만 아니라 ECP 유도 시 POI 발현을 유도하기 위해 사용될 수 있다.

특정 측면에 따르면, ECP는 POI를 생성하기 위한 탄소원으로 사용되는 세포 배양물에 존재하는 메탄올의 양에 의해 메탄올-유도성이다. 구체적으로, 이종 발현 카세트에 의한 GOI 발현은 메탄올 유도성 ECP에 의해 유도될 수 있다.

구체적으로, ECP는 메탄올-유도성이며, 예를 들어, 세포 배양 배지 또는 상청액에서 0.1%, 0.05%, 또는 0.01%(v/v) 중 어느 하나보다 작은 양(본 명세서에서 촉진제 억제량이라고 함)인 메탄올의 부재하에 억제된다.

구체적으로, ECP는 메탄올-유도성이며, 예를 들어 촉진제-억제량보다 높은 메탄올 양의 존재 하에 예를 들어 세포 배양 배지 또는 상청액 중 0.1%, 0.5%, 1%, 1.5%, 2.0 %, 2.5% 또는 3%(v/v)(본 명세서에서 프로모터 유도량이라 함) 중 적어도 어느 하나만큼 유도된다.

구체적으로, ECP는 본 명세서에 기술된 세포 배양 방법에서 사용되는 메탄올 양에 의해 완전히 유도된다. ECP 프로모터는 배양 조건이 최대 유도를 제공하는 경우 완전히 유도된 것으로 간주된다.

세포 배양 배지 또는 상청액 중 이러한 양은 특히 숙주 세포의 공급 및 숙주 세포에 의한 소비가 검출될 수 있는 양으로 이해된다. 일반적으로, 세포 배양의 생산 단계 동안 POI를 생성할 때, 세포 배양은 보충 탄소원을 추가함으로써 공급되지만 POI 생성 동안 세포에 의해 즉시 소비되는 양으로, 따라서 세포 배양 배지 또는 상청액에 남아 있는 양, 예를 들어 최대 1.0g/L의 양이 제공된다.

구체적으로, ECP는 숙주 세포에 대해 내인성 또는 이종성이다.

구체적으로, ECP는 다음 중 하나이다.

a) 서열번호 5에 대한 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 100% 서열 동일성 중 적어도 어느 하나를 포함하거나 이로 구성된 pAOX1 프로모터; 또는

b) 서열번호 6에 대한 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 100% 서열 동일성 중 적어도 어느 하나를 포함하거나 이로 구성된 pAOX2 프로모터; 또는

c) 서열번호 36-49로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 포함하거나 이로 구성된 프로모터.

구체적으로, 표 38에 열거된 임의의 메탄올-유도성 프로모터, 특히 서열번호 36-49로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 포함하거나 이로 이루어진 것이 사용될 수 있다.

적어도 60%의 서열 동일성을 특징으로 하는 기능성 pAOX1 및 pAOX2 프로모터 변이체는 본원에 추가로 기재된 예시적인 메탄올-유도성 프로모터에 의해 예시된다. 예를 들어, 서열번호 17(Ogataea methanolica JCM 10240의 pMOD1 프로모터 서열)은 서열번호 5와 비교하여 54.0%의 서열 동일성을 가지며; 및 서열번호 18(Ogataea methanolica JCM 10240의 pMOD2 프로모터 서열)은 서열 번호 6과 비교하여 53.7%의 서열 동일성을 갖는다. 각각의 pAOX1 및 pAOX2 프로모터와 비교한 pMOD1 및 pMOD2 프로모터의 서열 동일성은 LALIGN 버전 36.3.8g Dec, 2017을 사용한 정렬에 의해 결정되었다. 결과는 동일한 시퀀스 방향과 가장 높은 중첩으로 정렬된 시퀀스를 나타낸다(매개변수: 매트릭스: +5/-4; GAP OPEN: -5; Gap Extend: -4; E() 임계값 10.0; 출력 형식: MARKX 0; 그래픽: 예).

추가의 예시적인 메탄올 유도성 프로모터는 표 38에 열거되어 있거나, 또는 pSHB17, pALD4, pFDH1, pDAS1, pDAS2, pPMP20, pFBA1-2 pPMP47, pFLD, pFGH1, pTAL1-2, pDAS2, pCAM1, pPP7435_Chr1-0336 는 Gasser 등(Gasser, Steiger, & Mattanovich, 2015, Microb Cell Fact. 14: 196)에 의해 기술되어 있다.

본 명세서에 기재된 바와 같이, 용어 "pAOX1"은 서열번호 5로 확인된 서열을 포함하는 프로모터, 또는 서열번호 5와 특정 상동성(또는 서열 동일성)을 갖는 서열 둘 다를 지칭할 것이다. 상동 서열은 또한 pAOX1 상동체로 지칭된다. pAOX1 상동체는 예를 들어 임의의 적합한 돌연변이유발 방법에 의해 생성된 천연의 자연 발생 서열 또는 이의 돌연변이체일 수 있다.

본원에 기재된 바와 같이, 용어 "pAOX2"는 서열번호 6으로 확인된 서열을 포함하는 프로모터, 또는 서열번호 6과 특정 상동성(또는 서열 동일성)을 갖는 서열 둘 다를 지칭할 것이다. 상동 서열은 또한 pAOX2 상동체로 지칭된다. pAOX2 상동체는 예를 들어 임의의 적합한 돌연변이유발 방법에 의해 생성된 천연의 자연 발생 서열 또는 이의 돌연변이체일 수 있다.

본원에 기재된 pAOX1 또는 pAOX2 돌연변이체는 필적하는 발현 시스템 또는 생산 숙주 세포주에서 측정시 유도된 상태에 있을 때 각각의 천연 pAOX1 또는 pAOX2 프로모터와 비교하여 약 0.5배 내지 1.1배, 1.2배, 1.3배, 1.4배, 1.5배, 1.6배, 1.7배, 1.8배, 1.9배, 2배, 2.1배, 2.2배, 2.3배, 2.4배, 2.5배, 2.6배, 2.7배, 2.8배, 2.9배 각각의 천연 pAOX1 또는 pAOX2 프로모터와 비교하여 배, 3배, 3.3배, 3.5배, 3.8배, 4배, 4.5배, 5배, 5.5배 또는 적어도 6배 증가된 프로모터 강도를 특징으로 한다.

구체적으로, 프로모터 강도는 모델 단백질(예를 들어, 녹색 형광 단백질, GFP, 예를 들어, 강화 GFP, eGFP, Gene Bank Accession no. U57607을 포함함) 및/또는 전사와 같은 POI의 발현 수준 및/또는 전사에 의해 결정된다. 참조 프로모터와 비교하여 강도. 바람직하게는, 전사 분석은 정량적 또는 반정량적이며, 바람직하게는 qRT-PCR, DNA 마이크로어레이, RNA 시퀀싱 및 전사체 분석을 사용한다.

구체적으로, 본원에 기재된 재조합 숙주 세포는 단지 하나 또는 다수의 이종 GOIEC, 예를 들어, 상기 발현 카세트의 다중 카피, 예를 들어 적어도 2, 3, 4, 또는 5 카피(유전자 카피 수, GCN)를 포함한다. 예를 들어, 재조합 숙주 세포는 최대 2, 3, 4 또는 5개의 카피를 포함한다. 각각의 카피는 동일하거나 상이한 서열을 포함하거나 구성될 수 있지만, GOI에 작동가능하게 연결된 ECP를 포함한다.

특정 측면에 따르면, 이종 발현 카세트는 자가 복제 벡터 또는 플라스미드에 포함되거나 상기 숙주 세포의 염색체 내에 통합된다.

발현 카세트는 숙주 세포 내로 도입될 수 있고, 예를 들어 통합의 특정 부위에서 염색체내 요소로서 숙주 세포 게놈(또는 그의 염색체 중 임의의 것) 내로 통합될 수 있고, 이에 따라 높은 생산자 숙주 세포주가 선택된다. 대안적으로, 발현 카세트는 플라스미드 또는 인공 염색체, 예를 들어 효모 인공 염색체(YAC)와 같은 염색체외 유전 요소 내에 통합될 수 있다. 특정 예에 따르면, 발현 카세트는 벡터, 특히 발현 벡터에 의해 숙주 세포 내로 도입되고, 이는 적합한 형질전환 기술에 의해 숙주 세포 내로 도입된다. 이를 위해, GOI는 발현 벡터에 결찰될 수 있다.

바람직한 효모 발현 벡터(이는 바람직하게는 효모에서의 발현에 사용됨)는 pPICZ, pGAPZ, pPIC9, pPICZalfa, pGAPZalfa, pPIC9K, pGAPHis, pPUZZLE 또는 GoldenPiCS로부터 유래된 플라스미드로 이루어진 군으로부터 선택된다.

벡터 또는 플라스미드를 도입하기 위해 숙주 세포를 형질감염시키거나 형질전환시키는 기술은 당업계에 잘 알려져 있다. 여기에는 전기천공, 스페로플라스팅, 지질 소포 매개 흡수, 열 충격 매개 흡수, 인산칼슘 매개 형질감염(인산칼슘/DNA 공동 침전), 바이러스 감염, 특히 변형된 바이러스, 예를 들어 변형된 아데노바이러스 사용, 미세주사 및 전기천공이 포함될 수 있다.

본원에 기재된 형질전환체는 발현 카세트, 벡터 또는 플라스미드 DNA를 숙주에 도입하고 관련 단백질 또는 선택 마커를 발현하는 형질전환체를 선택함으로써 얻을 수 있다. 숙주 세포는 전기 펄스 방법, 원형질체 방법, 리튬 아세테이트 방법 및 이들의 변형 방법과 같은 숙주 세포의 형질전환에 통상적으로 사용되는 방법에 의해 이종 또는 외래 DNA를 도입하도록 처리될 수 있다. P. pastoris는 바람직하게는 전기천공에 의해 형질전환된다. 미생물에 의한 재조합 DNA 단편의 흡수를 위한 바람직한 형질전환 방법은 화학적 형질전환, 전기천공법 또는 원형질성형에 의한 형질전환을 포함한다.

특정 측면에 따르면, 본원에 기재된 이종 GOIEC는 GOI에 작동가능하게 연결된 ECP를 포함하는 폴리뉴클레오티드의 인공 융합, 및 임의로 추가 서열, 예컨대 신호, 리더 또는 종결자 서열을 포함하거나 이로 이루어진다.

구체적으로, 발현 카세트는 GOI에 작동가능하게 연결된 ECP를 포함하고, 선택적으로 POI를 분비된 단백질로서 발현 및 생산하는 데 필요한 신호 및 리더 서열을 추가로 포함한다.

특정 측면에 따르면, GOIEC는 POI의 분비를 가능하게 하는 신호 펩티드를 코딩하는 뉴클레오티드 서열을 포함한다.

구체적으로, 시그널 펩타이드를 코딩하는 뉴클레오티드 서열은 GOI의 5'-말단에 인접하여 융합된다.

구체적으로, 신호 펩티드는 S. cerevisiae 알파-교배 인자 프리프로 펩티드로부터의 신호 서열, P. pastoris 산 포스파타제 유전자(PHO1) 및 세포외 단백질 X(EPX1)로부터의 신호 펩티드로 구성된 군에서 선택된 것이다(Heiss , S., V. Puxbaum, C. Gruber, F. Altmann, D. Mattanovich & B. Gasser, Microbiology 2015;161(7):1356-68).

구체적으로, WO2014067926 A1에 기재된 바와 같은 임의의 신호 및/또는 리더 서열, 특히 서열번호 22 또는 서열번호 23이 사용될 수 있다.

구체적으로, WO2012152823 A1에 기재된 바와 같은 신호 서열, 특히 서열번호 24로 확인된 S. cerevisiae의 천연 알파 교배 인자 또는 그의 돌연변이체의 신호 서열이 사용될 수 있다.

특정 측면에 따르면, 본원에 기재된 숙주 세포는 예를 들어 단백질 생산을 개선하기 위해 하나 이상의 추가의 유전적 변형을 겪을 수 있다.

구체적으로, 숙주 세포는 프로테아제 결핍 균주, 특히 카르복시펩티다아제 Y 활성이 결핍된 균주를 생성하는 데 사용되는 단백질 분해 활성에 영향을 미치는 하나 이상의 유전자를 변형시키도록 추가로 조작된다. 특정 예는 WO1992017595A1에 설명되어 있다. 프로테아제 A 또는 프로테이나제 B와 같은 액포 프로테아제의 기능적 결핍을 갖는 프로테아제 결핍 Pichia 균주의 추가 예는 US6153424A에 기재되어 있다. 추가 예는 ade2 결실 및/또는 프로테아제 유전자 PEP4 및 PRB1 중 하나 또는 둘 모두의 결실이 있는 Pichia 균주이며, 예를 들어 ThermoFisher Scientific에서 제공한다.

구체적으로, 숙주 세포는 기능적 유전자 산물, 특히 WO2010099195A1에 개시된 바와 같은 PEP4, PRB1, YPS1, YPS2, YMP1, YMP2, YMP1, DAP2, GRH1, PRD1, YSP3, 및 PRB3로 이루어진 군에서 선택된 단백분해효소를 코딩하는 적어도 하나의 핵산서열을 변형하여 조작된다. .

헬퍼 인자를 코딩하는 유전자의 과발현 또는 과소발현은 GOI, 예를 들어 WO2015158800A1에 기술된 바와 같은 유전자의 발현을 향상시키기 위해 특이적으로 적용된다.

POI는 진핵생물, 원핵생물 또는 합성 펩티드, 폴리펩티드, 단백질 또는 숙주 세포의 대사산물 중 어느 하나일 수 있다.

특정 측면에 따르면, POI는 돌연변이-숙주 세포 또는 ECP에 대해 이종성이다.

구체적으로, POI는 숙주 세포 종에 대해 이종성이다.

구체적으로, POI는 분비된 펩티드, 폴리펩티드 또는 단백질, 즉 숙주 세포에서 세포 배양 상청액으로 분비된다.

구체적으로, POI는 진핵생물 단백질, 바람직하게는 인간 단백질 또는 인간 단백질 서열을 포함하는 단백질과 같은 포유동물 유래 또는 관련 단백질, 또는 박테리아 단백질 또는 박테리아 유래 단백질이다.

바람직하게는, POI는 포유동물에서 기능하는 치료 단백질이다.

특정한 경우에, POI는 다량체 단백질, 특히 이량체 또는 사량체이다.

구체적으로, POI는 항원 결합 단백질, 치료 단백질, 효소, 펩티드, 단백질 항생제, 독소 융합 단백질, 탄수화물-단백질 접합체, 구조 단백질, 조절 단백질, 백신 항원, 성장 인자, 호르몬, 사이토카인, 처리 효소로 이루어진 군에서 선택된 펩타이드 또는 단백질이다.

구체적으로, 항원 결합 단백질은 하기로 이루어진 군에서 선택된다.

a) 항체 또는 항체 단편, 예를 들어 키메라 항체, 인간화 항체, 이중특이성 항체, Fab, Fd, scFv, 디아바디, 트리아바디, Fv 사량체, 미니바디, VH, VHH, IgNAR 또는 V와 같은 단일 도메인 항체 -NAR;

b) Adnectins, Affibodies, Affilins, Affimers, Affitins, Alphabodies, Anticalins, Avimers, DARPin, Fynomers, Kunitz 도메인 펩티드, Monobodies, 또는 NanoCLAMPS와 같은 항체 모방체; 또는

c) 하나 이상의 면역글로불린-접힘 도메인, 항체 도메인 또는 항체 모방체를 포함하는 융합 단백질.

특정 POI는 항체 또는 이의 단편, 특히 항원 결합 도메인을 포함하는 항체 단편과 같은 항원 결합 분자이다. 특정 POI 중에는 단일클론 항체(mAb), 면역글로불린(Ig) 또는 면역글로불린 클래스 G(IgG)와 같은 항체, 중쇄 항체(HcAb), 또는 단편-항원 결합(Fab), Fd, 단일- 사슬 가변 단편(scFv), 또는 이의 조작된 변이체, 예를 들어 Fv 이량체(디아바디), Fv 삼량체(트리바디), Fv 사량체, 또는 미니바디 및 VH, VHH, IgNAR, 또는 V-NAR과 같은 단일 도메인 항체, 또는 면역글로불린-폴드 도메인을 포함하는 임의의 단백질. 추가 항원-결합 분자는 항체 모방체, 또는 (대체) 스캐폴드 단백질, 예를 들어 조작된 Kunitz 도메인, Adnectin, Affibodies, Affiline, Anticalins 또는 DARPin으로부터 선택될 수 있다.

특정 측면에 따르면, POI는 예를 들면 BOTOX, Myobloc, Neurobloc, Dysport (or other serotypes of botulinum neurotoxins), alglucosidase alpha, daptomycin, YH-16, choriogonadotropin alpha, filgrastim, cetrorelix, interleukin-2, aldesleukin, teceleulin, denileukin diftitox, interferon alpha-n3 (injection), interferon alpha-nl, DL-8234, interferon, Suntory (gamma-1a), interferon gamma, thymosin alpha 1, tasonermin, DigiFab, ViperaTAb, EchiTAb, CroFab, nesiritide, abatacept, alefacept, Rebif, eptoterminalfa, teriparatide (osteoporosis), calcitonin injectable (bone disease), calcitonin (nasal, osteoporosis), etanercept, hemoglobin glutamer 250 (bovine), drotrecogin alpha, collagenase, carperitide, recombinant human epidermal growth factor (topical gel, wound healing), DWP401, darbepoetin alpha, epoetin omega, epoetin beta, epoetin alpha, desirudin, lepirudin, bivalirudin, nonacog alpha, Mononine, eptacog alpha (activated), recombinant Factor VIII+VWF, Recombinate, recombinant Factor VIII, Factor VIII (recombinant), Alphnmate, octocog alpha, Factor VIII, palifermin, indikinase, tenecteplase, alteplase, pamiteplase, reteplase, nateplase, monteplase, follitropin alpha, rFSH, hpFSH, micafungin, pegfilgrastim, lenograstim, nartograstim, sermorelin, glucagon, exenatide, pramlintide, iniglucerase, galsulfase, Leucotropin, molgramostirn, triptorelin acetate, histrelin (subcutaneous implant, Hydron), deslorelin, histrelin, nafarelin, leuprolide sustained release depot (ATRIGEL), leuprolide implant (DUROS), goserelin, Eutropin, KP-102 program, somatropin, mecasermin (growth failure), enlfavirtide, Org-33408, insulin glargine, insulin glulisine, insulin (inhaled), insulin lispro, insulin deternir, insulin (buccal, RapidMist), mecasermin rinfabate, anakinra, celmoleukin, 99 mTc-apcitide injection, myelopid, Betaseron, glatiramer acetate, Gepon, sargramostim, oprelvekin, human leukocyte-derived alpha interferons, Bilive, insulin (recombinant), recombinant human insulin, insulin aspart, mecasenin, Roferon-A, interferon-alpha 2, Alfaferone, interferon alfacon-1, interferon alpha, Avonex' recombinant human luteinizing hormone, dornase alpha, trafermin, ziconotide, taltirelin, diboterminalfa, atosiban, becaplermin, eptifibatide, Zemaira, CTC-111, Shanvac-B, HPV vaccine (quadrivalent), octreotide, lanreotide, ancestirn, agalsidase beta, agalsidase alpha, laronidase, prezatide copper acetate (topical gel), rasburicase, ranibizumab, Actimmune, PEG-Intron, Tricomin, recombinant house dust mite allergy desensitization injection, recombinant human parathyroid hormone (PTH) 1-84 (sc, osteoporosis), epoetin delta, transgenic antithrombin III, Granditropin, Vitrase, recombinant insulin, interferon-alpha (oral lozenge), GEM-21S, vapreotide, idursulfase, omnapatrilat, recombinant serum albumin, certolizumab pegol, glucarpidase, human recombinant C1 esterase inhibitor (angioedema), lanoteplase, recombinant human growth hormone, enfuvirtide (needle-free injection, Biojector 2000), VGV-1, interferon (alpha), lucinactant, aviptadil (inhaled, pulmonary disease), icatibant, ecallantide, omiganan, Aurograb, pexigananacetate, ADI-PEG-20, LDI-200, degarelix, cintredelinbesudotox, Favld, MDX-1379, ISAtx-247, liraglutide, teriparatide (osteoporosis), tifacogin, AA4500, T4N5 liposome lotion, catumaxomab, DWP413, ART-123, Chrysalin, desmoteplase, amediplase, corifollitropinalpha, TH-9507, teduglutide, Diamyd, DWP-412, growth hormone (sustained release injection), recombinant G-CSF, insulin (inhaled, AIR), insulin (inhaled, Technosphere), insulin (inhaled, AERx), RGN-303, DiaPep277, interferon beta (hepatitis C viral infection (HCV)), interferon alpha-n3 (oral), belatacept, transdermal insulin patches, AMG-531, MBP-8298, Xerecept, opebacan, AIDSVAX, GV-1001, LymphoScan, ranpirnase, Lipoxysan, lusupultide, MP52 (beta-tricalciumphosphate carrier, bone regeneration), melanoma vaccine, sipuleucel-T, CTP-37, Insegia, vitespen, human thrombin (frozen, surgical bleeding), thrombin, TransMID, alfimeprase, Puricase, terlipressin (intravenous, hepatorenal syndrome), EUR-1008M, recombinant FGF-I (injectable, vascular disease), BDM-E, rotigaptide, ETC-216, P-113, MBI-594AN, duramycin (inhaled, cystic fibrosis), SCV-07, OPI-45, Endostatin, Angiostatin, ABT-510, Bowman Birk Inhibitor Concentrate, XMP-629, 99 mTc-Hynic-Annexin V, kahalalide F, CTCE-9908, teverelix (extended release), ozarelix, rornidepsin, BAY-504798, interleukin4, PRX-321, Pepscan, iboctadekin, rhlactoferrin, TRU-015, IL-21, ATN-161, cilengitide, Albuferon, Biphasix, IRX-2, omega interferon, PCK-3145, CAP-232, pasireotide, huN901-DMI, ovarian cancer immunotherapeutic vaccine, SB-249553, Oncovax-CL, OncoVax-P, BLP-25, CerVax-16, multi-epitope peptide melanoma vaccine (MART-1, gp100, tyrosinase), nemifitide, rAAT (inhaled), rAAT (dermatological), CGRP (inhaled, asthma), pegsunercept, thymosinbeta4, plitidepsin, GTP-200, ramoplanin, GRASPA, OBI-1, AC-100, salmon calcitonin (oral, eligen), calcitonin (oral, osteoporosis), examorelin, capromorelin, Cardeva, velafermin, 131I-TM-601, KK-220, T-10, ularitide, depelestat, hematide, Chrysalin (topical), rNAPc2, recombinant Factor V111 (PEGylated liposomal), bFGF, PEGylated recombinant staphylokinase variant, V-10153, SonoLysis Prolyse, NeuroVax, CZEN-002, islet cell neogenesis therapy, rGLP-1, BIM-51077, LY-548806, exenatide (controlled release, Medisorb), AVE-0010, GA-GCB, avorelin, ACM-9604, linaclotid eacetate, CETi-1, Hemospan, VAL (injectable), fast-acting insulin (injectable, Viadel), intranasal insulin, insulin (inhaled), insulin (oral, eligen), recombinant methionyl human leptin, pitrakinra subcutancous injection, eczema), pitrakinra (inhaled dry powder, asthma), Multikine, RG-1068, MM-093, NBI-6024, AT-001, PI-0824, Org-39141, Cpn10 (autoimmune diseases/inflammation), talactoferrin (topical), rEV-131 (ophthalmic), rEV-131 (respiratory disease), oral recombinant human insulin (diabetes), RPI-78M, oprelvekin (oral), CYT-99007 CTLA4-Ig, DTY-001, valategrast, interferon alpha-n3 (topical), IRX-3, RDP-58, Tauferon, bile salt stimulated lipase, Merispase, alaline phosphatase, EP-2104R, Melanotan-II, bremelanotide, ATL-104, recombinant human microplasmin, AX-200, SEMAX, ACV-1, Xen-2174, CJC-1008, dynorphin A, SI-6603, LAB GHRH, AER-002, BGC-728, malaria vaccine (virosomes, PeviPRO), ALTU-135, parvovirus B19 vaccine, influenza vaccine (recombinant neuraminidase), malaria/HBV vaccine, anthrax vaccine, Vacc-5q, Vacc-4x, HIV vaccine (oral), HPV vaccine, Tat Toxoid, YSPSL, CHS-13340, PTH(1-34) liposomal cream (Novasome), Ostabolin-C, PTH analog (topical, psoriasis), MBRI-93.02, MTB72F vaccine (tuberculosis), MVA-Ag85A vaccine (tuberculosis), FARA04, BA-210, recombinant plague FIV vaccine, AG-702, OxSODrol, rBetV1, Der-p1/Der-p2/Der-p7 allergen-targeting vaccine (dust mite allergy), PR1 peptide antigen (leukemia), mutant ras vaccine, HPV-16 E7 lipopeptide vaccine, labyrinthin vaccine (adenocarcinoma), CML vaccine, WT1-peptide vaccine (cancer), IDD-5, CDX-110, Pentrys, Norelin, CytoFab, P-9808, VT-111, icrocaptide, telbermin (dermatological, diabetic foot ulcer), rupintrivir, reticulose, rGRF, HA, alpha-galactosidase A, ACE-011, ALTU-140, CGX-1160, angiotensin therapeutic vaccine, D-4F, ETC-642, APP-018, rhMBL, SCV-07 (oral, tuberculosis), DRF-7295, ABT-828, ErbB2-specific immunotoxin (anticancer), DT3SSIL-3, TST-10088, PRO-1762, Combotox, cholecystokinin-B/gastrin-receptor binding peptides, 111In-hEGF, AE-37, trasnizumab-DM1, Antagonist G, IL-12 (recombinant), PM-02734, IMP-321, rhIGF-BP3, BLX-883, CUV-1647 (topical), L-19 based radioimmunotherapeutics (cancer), Re-188-P-2045, AMG-386, DC/1540/KLH vaccine (cancer), VX-001, AVE-9633, AC-9301, NY-ESO-1 vaccine (peptides), NA17.A2 peptides, melanoma vaccine (pulsed antigen therapeutic), prostate cancer vaccine, CBP-501, recombinant human lactoferrin (dry eye), FX-06, AP-214, WAP-8294A (injectable), ACP-HIP, SUN-11031, peptide YY [3-36] (obesity, intranasal), FGLL, atacicept, BR3-Fc, BN-003, BA-058, human parathyroid hormone 1-34 (nasal, osteoporosis), F-18-CCR1, AT-1100 (celiac disease/diabetes), JPD-003, PTH(7-34) liposomal cream (Novasome), duramycin (ophthalmic, dry eye), CAB-2, CTCE-0214, GlycoPEGylated erythropoietin, EPO-Fc, CNTO-528, AMG-114, JR-013, Factor XIII, aminocandin, PN-951, 716155, SUN-E7001, TH-0318, BAY-73-7977, teverelix (immediate release), EP-51216, hGH (controlled release, Biosphere), OGP-I, sifuvirtide, TV4710, ALG-889, Org-41259, rhCC10, F-991, thymopentin (pulmonary diseases), r(m)CRP, hepatoselective insulin, subalin, L19-IL-2 fusion protein, elafin, NMK-150, ALTU-139, EN-122004, rhTPO, thrombopoietin receptor agonist (thrombocytopenic disorders), AL-108, AL-208, nerve growth factor antagonists (pain), SLV-317, CGX-1007, INNO-105, oral teriparatide (eligen), GEM-OS1, AC-162352, PRX-302, LFn-p24 fusion vaccine (Therapore), EP-1043, S pneumoniae pediatric vaccine, malaria vaccine, Neisseria meningitidis Group B vaccine, neonatal group B streptococcal vaccine, anthrax vaccine, HCV vaccine (gpE1+gpE2+MF-59), otitis media therapy, HCV vaccine (core antigen+ISCOMATRIX), hPTH(1-34) (transdermal, ViaDerm), 768974, SYN-101, PGN-0052, aviscumnine, BIM-23190, tuberculosis vaccine, multi-epitope tyrosinase peptide, cancer vaccine, enkastim, APC-8024, GI-5005, ACC-001, TTS-CD3, vascular-targeted TNF (solid tumors), desmopressin (buccal controlled-release), onercept, or TP-9201, adalimumab (HUMIRA), infliximab (REMICADE^TM), rituximab (RITUXAN^TM/MAB THERA^TM), etanercept (ENBREL^TM), bevacizumab (AVASTIN^TM), trastuzumab (HERCEPTIN^TM), pegrilgrastim (NEULASTA^TM), 또는 바이오시밀러 및 바이오베터를 포함한 기타 적합한 POI이다.

특정 측면에 따르면, 발효 생성물은 POI 또는 Mut- 숙주 세포로부터 수득된 숙주 세포 대사산물을 포함하는 세포 배양물로부터 단리된다.

특정 측면에 따르면, 돌연변이-숙주 세포는 Pichia, Komagataella, Hansenula, Ogataea 또는 Candida 속의 효모 세포이다.

구체적으로, 돌연변이-숙주 세포는 Pichia pastoris, Pichia methanolica, Pichia kluyveri 및 Pichia angusta와 같은 피치아 종; Komagataella 종, 예를 들어 Komagataella pastoris, Komagataella pseudopastoris 또는 Komagataella phaffii, Hansenula 종, 예를 들어 Hansenula polymorpha, Ogataea 종, 예를 들어 Ogataea polymorpha, 또는 Ogataea parapolymorpha, 및 칸디다 종, 예를 들어 Candida utilis, Candida cacaoi, 및 Candida boidinii종으로 이루어진 군으로부터 선택된 효모인 균주로부터 유래하고 있다.

바람직한 종은 Pichia pastoris이다. 구체적으로, 숙주 세포는 CBS 704, CBS 2612, CBS 7435, CBS 9173-9189, DSMZ 70877, X-33, GS115, KM71, KM71H 및 SMD1168로 이루어진 군으로부터 선택된 Pichia pastoris 균주이다.

출처: CBS 704(=NRRL Y-1603 = DSMZ 70382), CBS 2612(=NRRL Y-7556), CBS 7435(=NRRL Y-11430), CBS 9173-9189(CBS 균주: CBS-KNAW Fungal Biodivers Centraalbureau voor Schimmelculturen, Utrecht, The Netherlands) 및 DSMZ 70877(German Collection of Microorganisms and Cell Cultures); X-33, GS115, KM71, KM71H 및 SMD1168과 같은 Invitrogen의 균주.

특정 측면에 따르면, 본 발명은 본원에 기술된 Mut- 숙주 세포를 배양하여 관심 단백질(POI)을 생산하는 방법을 제공한다. 여기에서 POI를 생산하기 위한 탄소원으로 메탄올을 사용하고, 특히 에너지원으로 사용하기 위한 메탄올의 양을 사용하는 것이며, ECP의 메탄올-유도를 위한 것이 아니다.

특정 측면에 따르면, 상기 방법은 POI를 생성하기 위해 탄소원으로서 메탄올을 사용하여 Mut- 숙주 세포를 배양하는 것을 포함하고, Mut- 숙주 세포는 관심 단백질(POI)을 암호화하는 관심 유전자(GOI)에 작동 가능하게 연결된 발현 카세트 프로모터(ECP)를 포함하는 이종 관심 대상 발현 카세트(GOIEC) 유전자를 포함하며,

여기서 Mut- 숙주 세포는 하나 이상의 유전적 변형 이전의 숙주 세포와 비교하여 제1 및 제2 내인성 유전자의 발현을 감소시키기 위해 하나 이상의 유전적 변형에 의해 조작되고, 여기서

a) 첫 번째 내인성 유전자는 서열번호 1로 확인된 아미노산 서열 또는 이의 상동체를 포함하는 알코올 산화효소 1(AOX1)을 암호화하고,

b) 제2 내인성 유전자는 서열번호 3으로 확인된 아미노산 서열 또는 이의 상동체를 포함하는 알코올 산화효소 2(AOX2)를 암호화한다.

구체적으로, Mut- 숙주 세포는 단독 탄소원으로서 또는 특히 성장 및/또는 POI 생산(합성)을 위한 것과 같은 에너지원으로서 다른 탄소원(또는 탄수화물)과의 혼합물로 메탄올을 사용하여 배양된다.

구체적으로, 이러한 다른 탄소원(본원에서 "비메탄올 탄소원"이라고도 함)은 탄수화물이다.

구체적으로, 비-메탄올 탄소원은 당류, 폴리올, 알코올, 또는 이들 중 임의의 하나 이상의 혼합물로부터 선택된다.

구체적으로, 당류는 6탄당과 같은 단당류 중 임의의 하나 이상일 수 있다. 글루코스, 프룩토스, 갈락토스 또는 만노스, 또는 이당류, 예를 들어 사카로스; 또는 알코올 또는 폴리올(예: 에탄올), 또는 임의의 디올, 또는 트리올(예: 글리세롤), 또는 이들 중 임의의 것의 혼합물. 본원에 기술된 탄소원으로서 사용된 메탄올의 양에 더하여, 임의의 그러한 비-메탄올 탄소원은 상기 POI를 생성하는 양으로 세포 배양에 추가로 사용될 수 있다.

특정 구체예에 따르면, Mut- 숙주 세포의 세포주가 배양된다.

구체적으로, 세포주는 회분식, 유가식 또는 연속식 배양 조건 하에서 배양된다. 배양은 미세역가 플레이트, 진탕 플라스크 또는 생물반응기에서 수행될 수 있으며, 선택적으로 첫 번째 단계로서 배치 단계로 시작하여 두 번째 단계로서 유가식 단계 또는 연속 배양 단계가 뒤따른다.

구체적으로, 이 방법은 다음 단계를 포함한다:

a) 성장 조건(성장기 또는 "성장기") 하에 숙주 세포를 배양하는 단계; 그리고 추가 단계

b) 탄소원으로서 메탄올의 존재(생성 단계) 하에 성장 제한 조건 하에 숙주 세포를 배양하고, 이 동안 GOI가 발현되어 상기 POI를 생성한다.

구체적으로, 두 번째 단계 b)는 첫 번째 단계 a)를 따른다.

구체적으로,

a) 기본 탄소원을 에너지원으로 사용하여 Mut- 숙주 세포를 배양하는 성장기; 다음에

b) Mut- 숙주 세포가 메탄올 공급물을 사용하여 배양되어 POI를 생산하는 생산 단계.

구체적으로, 숙주 세포는 제1 탄소원, 예를 들어, 제1 탄소원을 포함하는 세포 배양 배지에서 성장 조건 하에 제1 단계에서 배양된다. 선택적으로 탄소원의 양이 소모될 때까지 세포 배양에서 숙주 세포의 성장을 가능하게 하기에 충분한 양으로, 추가 배양은 성장 제한 조건 하에 있을 수 있다.

구체적으로, 제2 탄소원은 메탄올 및 선택적으로 하나 이상의 추가 탄소원(메탄올 이외)이며, 상기 제2 탄소원은 보충 탄소원으로 지칭된다.

구체적으로, 상기 기초 탄소원 및/또는 보충 탄소원(메탄올에 더하여)은 당류, 폴리올, 알코올, 또는 이들 중 임의의 하나 이상의 혼합물로부터 선택될 수 있다.

특정 구체예에 따르면, 기초 탄소원은 보충 탄소원과 상이하다, 예를 들어, 탄소원. 양적으로 및/또는 질적으로 다릅니다. 양적 차이는 일반적으로 ECP 프로모터 활성을 억제하거나 유도하는 다양한 조건을 제공한다.

추가의 특정 실시양태에 따르면, 기초 및 보충 탄소원은 동일한 유형의 분자 또는 탄수화물을 바람직하게는 상이한 농도로 포함한다. 추가의 특정 실시양태에 따르면, 탄소원은 2개 이상의 상이한 탄소원의 혼합물이다.

임의의 유형의 유기 탄소 공급원, 특히 숙주 세포 배양, 특히 진핵 숙주 세포 배양에 전형적으로 사용되는 유기 탄소 공급원이 사용될 수 있다. 특정 구체예에 따르면, 탄소원은 포도당, 과당, 갈락토오스 또는 만노오스와 같은 육탄당, 사카로오스와 같은 이당류, 글리세롤 또는 에탄올과 같은 알코올, 또는 이들의 혼합물이다.

특히 바람직한 실시양태에 따르면, 기초 탄소원은 글루코스, 글리세롤, 에탄올, 또는 이들의 혼합물로 이루어진 군으로부터 선택된다. 바람직한 구현예에 따르면, 기초 탄소원은 글리세롤이다.

추가의 특정 구체예에 따르면, 보충 탄소원은 (메탄올에 더하여) 6탄당, 예를 들어 글루코스, 과당, 갈락토오스 및 만노오스, 이당류, 예를 들어 사카로오스, 알코올, 예를 들어 글리세롤 또는 에탄올, 또는 이들의 혼합물을 포함한다. 바람직한 구현예에 따르면, 보충 탄소원은 메탄올에 더하여 글루코스를 포함한다.

상기 배양 단계 모두는 구체적으로 상기 탄소원의 존재 하에 세포주를 배양하는 것을 포함한다.

구체적으로, 상기 성장 단계(단계 a)) 배양은 배치 단계에서 수행되고; 상기 생산 단계(단계 b)) 배양은 유가식 또는 연속 배양 단계에서 수행된다.

구체적으로, 숙주 세포는 높은 성장 속도의 단계 동안(성장 조건 하에) 기초 탄소원을 포함하는 탄소원 풍부 배지에서 성장한다, 단계 a)(예를 들어, 적어도 50%, 또는 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 최대 성장 속도까지) 및 낮은 성장 속도(성장- 제한 조건)의 단계 동안 POI를 생성, 단계 b) (예를 들어, 최대성장율의 90% 미만, 바람직하게는 80% 미만, 70% 미만, 60% 미만, 50% 미만, 또는 40% 미만, 30% 미만, 20% 미만, 10% 미만, 5% 미만, 3% 미만, 2% 미만, 1% 미만, 0.5% 미만, 0.4% 미만, 0.3% 미만 또는 0.2% 미만 속도) 특히 생산 단계에서 세포 배양을 유지할 때 완전히 소모되는 탄소원의 양만을 포함하는 한정된 최소 배지를 공급함으로써 탄소원을 제한한다.

구체적으로, 0.5, 0.55, 0.6, 0.65, 0.7, 0.75, 0.8, 0.85, 0.9, 0.95, 또는 1.0%(v/v) 중 적어도 어느 하나의 평균 메탄올 농도, 예를 들어 최대 3%, 2.5%, 2%, 1.5% 또는 1%(v/v)는 특히 생산 단계 동안 숙주 세포 배양, 특히 세포 배양 배지 또는 상청액에서 사용된다.

구체적으로, 평균 메탄올 농도는 24시간 이상, 바람직하게는 0.1%, 0.5%, 1%, 1.5%, 2%, 2.5% 또는 3%(v/v) 중 적어도 어느 하나의 생산 단계 동안 유지된다.

특정 구현예에 따르면, 평균 메탄올 농도는 적어도 24시간의 생산 단계 동안 0.5-2%(v/v)이다.

평균 양 또는 농도는 적어도 관찰 기간의 시작과 끝에서 그리고 관찰 기간 동안 세포 배양, 특히 세포 배양 배지 또는 상청액에서 측정된 메탄올 농도의 합으로 계산할 수 있다. 예를 들어, 적어도 24시간마다 또는 연속 측정마다 측정 횟수로 나눈 값이다.

세포 배양물 중 메탄올 농도는 HPLC와 같은 적합한 표준 분석법을 사용하여 측정할 수 있다. 세포 배양에 의한 소비시 배양 배지의 잔류 농도로 결정된다.

구체적으로, 메탄올 공급물은 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 또는 15 mg 메탄올/(g) 또는 그 이상, 예를 들어 생산 단계 동안 2-20 또는 2-15 mg 메탄올/(g 건조 바이오매스*h) 중 적어도 어느 하나의 평균 공급 속도이다.

메탄올은 예를 들어 1회 이상의 주사에 의해 1회 이상의 분할로 세포 배양물에 첨가될 수 있거나 POI를 생성하는 동안 특정 기간 동안 연속적으로 첨가될 수 있다. 평균 양은 관찰 기간 동안 추가된 모든 메탄올의 합계를 평균 총 건조 바이오매스 및 관찰 기간으로 나눈 값으로 계산할 수 있다. 평균 총 건조 바이오매스는 적어도 관찰 기간의 시작과 끝에서 건조 바이오매스 농도를 측정하고 관찰 기간 동안 선택적으로 측정하여 계산된다. 그런 다음 건조 바이오매스 농도는 관찰 기간의 시작과 끝 사이에 삽입된다. 보간된 건조 바이오매스 농도에 각 간격의 반응기 부피를 곱하고 모든 간격에 대해 계산된 값을 합산하고 간격의 수로 나눈다. 간격 지속 시간은 1시간 이하이다.

구체적으로, 평균 공급 속도는 24시간 이상, 바람직하게는 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15 mg 메탄올/(g 건조 바이오매스*h), 또는 그 이상, 예를 들어 2-20 또는 2-15 mg 메탄올/(g 건조 바이오매스*h) 중 적어도 어느 하나의 생산 단계 동안 유지된다.

관찰 기간은 본원에서 세포 배양이 POI를 생산하는 특정 기간으로 이해되고, 특히 생산 단계, 특히 유가식 또는 연속 세포 배양 방법의 생산 단계로 이해된다. 실제 POI 생성 과정이나 생성 단계는 관찰 기간보다 길 수 있지만, 평균 금액은 정의된 관찰 기간 동안 계산된다.

구체적으로, POI 제작 과정의 지속시간은 10~500h이다.

구체적으로, 배치 단계는 약(around) 10 내지 36시간 동안 수행된다.

재배 시간과 관련하여 용어 "약(around)"은 +/-5% 또는 +/-10%를 의미한다.

예를 들어, 약 10 내지 36h의 특정 배치 수행 시간은 18 내지 39.6h, 구체적으로 19 내지 37.8h일 수 있다.

구체적인 구현예에 따르면, 배치 배지에서 10 내지 50g/L 글리세롤, 구체적으로 20 내지 40g/L 글리세롤을 기초 탄소원으로 사용하여 배치 단계를 수행하고, 약 27 내지 30시간 동안 25℃에서, 또는 30℃에서 약 23~36시간 동안, 또는 23~36시간의 배양 시간 동안 25℃~30℃ 사이의 온도에서 배양을 수행한다. 배치 배지에서 글리세롤 농도를 낮추면 배치 단계의 길이가 감소하는 반면, 배치 매체에서 글리세롤을 증가시키면 배치 단계가 연장된다. 글리세롤의 대안으로 포도당을 사용할 수 있고, 예를 들면 거의 같은 양으로 사용된다.

세포 배양 및 POI 발현의 전형적인 시스템에서, 회분식 단계 후에 유가식 단계가 뒤따르고, 구체적으로, 유가식 단계에서의 배양은 약 15 내지 100h, 약 15 내지 80h, 약 15~70h, 약 15~60h, 약 15~50h, 약 15~45h, 약 15~40h, 약 15~35h, 약 15~30h, 약 15~35h, 약 15~25h, 또는 약 15~20h 중 어느 하나 동안 수행되고; 바람직하게는 약 20 내지 40시간이다. 구체적으로, 유가식 단계에서의 배양은 약 100h, 약 80h, 약 70h, 약 60h, 약 55h, 약 50h, 약 45h, 약 40h, 약 35h, 약 33h, 약 30h, 약 25h, 약 20h 또는 약 15h 중 어느 하나 동안 수행된다.

구체적으로, 부피비생성물 형성율(rP)은 단위 부피(L) 및 단위 시간(h)당 생성된 생성물(mg)의 양(mg(L h)^-1)이다. 체적 특정 제품 형성 속도는 공간 시간 수율(STY) 또는 체적 생산성이라고도 한다.

구체적으로, 본 명세서에 기재된 방법의 유가식 배양은 약 30 mg(L h)^-1(30 mg(L h)^-1 +/-5% 또는 +/-10%)을 의미함을 의미함)의 공간 시간 수율이 되도록 수행된다. 구체적으로, 약 30 mg(L h)^-1의 공간 시간 수율이 약 30h 유가식 내에 달성되며, 구체적으로 33h, 32h, 31h, 30h, 29h, 28h, 27h, 26h 또는 25h 유가식 시간 중 어느 하나보다 짧은 시간에 27, 28, 29, 30, 31, 32, 또는 33 mg (L h)^-1중 어느 하나를 달성할 수 있다.

특히, POI는 성장 제한 조건에서 최대 성장률 미만, 전형적으로 90% 미만, 바람직하게는 80% 미만, 70% 미만, 60% 미만, 50% 미만, 40% 미만, 30% 미만, 20% 미만, 10% 미만, 5% 미만, 3% 미만, 2% 미만, 1% 미만, 0.5% 미만, 0.4% 미만, 0.3% 미만, 또는 세포의 최대 성장률의 0.2% 미만 생산 단계에서 발현된다. 일반적으로 최대 성장률은 각 유형의 숙주 세포에 대해 개별적으로 결정된다.

특정 측면에 따르면, Mut- 숙주 세포는 숙주 세포 성장을 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2% 또는 1%(w/w 바이오매스) 중 어느 하나로 제한하는 조건 하에 생산 단계 동안 배양된다.

구체적으로, 생산 단계는 비성장률을 0.0001h^-1 내지 0.2h^-1, 바람직하게는 0.005h^-1 내지 0.15h^-1의 범위 내로 유지하기 위해 성장 제한량의 보충 탄소원을 제공하는 공급 배지를 사용한다.

특정 측면에 따르면, 본 발명은 알코올 탈수소효소(ADH2)의 기질로 메탄올을 사용하고 발효 생성물을 생산하는 Mut- 숙주 세포를 허용되는 조건 하에 상기 Mut- 숙주 세포를 배양하는 것을 포함하는 발효 생성물을 생산하는 방법에서 재조합 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포의 용도를 제공한다.

구체적으로, 상기 Mut- 숙주 세포는 알코올 산화효소 1(AOX1) 및 알코올 산화효소 2(AOX2)가 결핍되어 있다.

구체적으로, 상기 Mut- 숙주 세포에서, 알코올 산화효소 1(AOX1) 및 알코올 산화효소 2(AOX2)를 코딩하는 유전자가 녹아웃되거나 결실된다.

특정 측면에 따르면, 본 발명은 Mut- 숙주 세포가 탄소원으로 메탄올을 사용하여 발효 생성물을 생산하는 허용되는 조건 하에 Mut- 숙주 세포를 배양하는 것을 포함하는 발효 생성물을 생산하는 방법에서 재조합 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포의 용도를 제공한다. 여기서, Mut- 숙주 세포는 하기 하나 이상의 유전적 변형에 의해 조작됨

a) 상기 하나 이상의 유전적 변형 이전의 숙주 세포와 비교하여 제1 및 제2 내인성 유전자의 발현을 감소시키고, 여기서

b) 알코올 탈수소효소(ADH2) 유전자의 발현을 증가시키기 위해, 여기서 ADH2 유전자는 알코올 탈수소효소(ADH2)를 인코딩한다.

특정 측면에 따르면, 본 발명은 다음 단계를 포함하는 숙주 세포에서 관심 단백질(POI)을 생산하는 방법을 제공한다:

a) AOX1 및 AOX2를 각각 인코딩하는 상기 제1 및 제2 유전자의 발현을 감소(과소발현)하도록 숙주 세포를 유전적으로 조작하는 단계;

b) ADH2를 코딩하는 유전자의 발현(과발현)을 증가시키도록 숙주 세포를 유전적으로 조작하는 단계;

c) 발현 카세트 프로모터(ECP)의 제어 하에 상기 POI를 코딩하는 관심 유전자(GOI)를 포함하는 이종 발현 카세트를 숙주 세포에 도입하는 단계;

d) 탄소원으로서 메탄올을 사용하여 상기 POI를 생성하는 조건 하에서 상기 숙주 세포를 배양함으로써, 특히 성장 및/또는 POI 생성을 위한 에너지를 제공하는 단계;

e) 선택적으로 상기 POI를 세포 배양물로부터 분리하는 단계; 그리고

f) 선택적으로 상기 POI를 정제하는 단계.

구체적으로, 본 명세서에 기재된 방법의 단계 a)는 단계 b) 전, 후에, 또는 이와 동시에 수행된다.

구체적으로, 본 명세서에 기재된 방법의 단계 a) 및 b)는 단계 c) 전, 후에, 또는 이와 동시에 수행된다.

특정 측면에 따르면, 숙주 세포는 POI를 생산하기 위해 조작되기 전에 먼저 AOX1 및 AOX2를 코딩하는 상기 제1 및 제2 유전자의 발현을 감소시키고 ADH2를 코딩하는 유전자의 발현을 증가시키도록 유전적으로 변형된다. 특정 예에 따르면, 야생형 숙주 세포는 본원에 기재된 방법의 단계 a) 및 b)에 따라 유전적으로 변형된다. 구체적으로, 숙주 세포는 각각 AOX1 및 AOX2를 인코딩하는 상기 제1 및 제2 유전자의 감소 및 ADH2를 인코딩하는 유전자의 발현 증가를 위해 야생형 숙주 세포 균주에 상기 하나 이상의 유전적 변형을 도입할 때 제공된다.

추가 측면에 따르면, 숙주 세포는 AOX1 및 AOX2를 각각 코딩하는 상기 제1 및 제2 유전자를 감소시키고 ADH2를 코딩하는 유전자의 발현을 증가시키도록 추가로 유전적으로 변형되기 전에 이종 또는 재조합 POI를 생성하도록 먼저 조작된다. 특정 예에 따르면, 야생형 숙주 세포는 먼저 POI 생산을 위한 발현 카세트를 포함하도록 조작될 수 있다. 그런 다음, 이러한 조작된 숙주 세포는 AOX1 및 AOX2를 각각 코딩하는 상기 제1 및 제2 유전자를 감소시키고 ADH2를 코딩하는 유전자의 발현을 증가시키도록 추가로 변형될 수 있다.

추가 측면에 따르면, 숙주 세포는 POI 생산을 위한 조작 및 AOX1 및 AOX2를 각각 암호화하는 상기 제1 및 제2 유전자의 감소 및 ADH2를 암호화하는 유전자의 발현 증가를 위한 유전자 변형을 포함하는 조작 단계를 거치고 있으며, 동시에, 즉 하나의 방법 단계에서, 예를 들어 하나 이상의 반응 혼합물에서 각각의 발현 카세트, 시약 및 도구를 사용한다.

구체적으로, 상기 방법은 본원에 추가로 기재된 바와 같이 재조합 Mut- 숙주 세포를 생산하기 위한 방법 단계를 사용한다.

구체적으로, 이종 발현 카세트는 본원에 추가로 기재된 바와 같은 ECP를 포함한다.

구체적으로, POI는 적절한 배지에서 Mut- 숙주 세포를 배양하고, 메탄올을 포함하는 세포 배양 생산 배지를 사용하여 배양 단계 동안 POI를 생산하고, 세포 배양, 특히 세포로부터 발현된 POI를 단리함으로써 생산할 수 있다. 세포를 분리할 때 배양 상층액 또는 배지를 사용하고, 선택적으로 발현된 생성물에 적합한 방법으로 정제한다. 이로써 정제된 POI 제제를 제조할 수 있다.

놀랍게도 Mut- 숙주 세포가 메탄올에 둔감하고 POI 생산을 위한 에너지를 제공하는 데 필요한 상당한 양의 메탄올을 효과적으로 흡수하고 사용할 수 있다는 것이 밝혀졌다. 이는 선행 기술에서 메탄올이 Mut^S 균주에 독성인 것으로 밝혀졌기 때문에 놀라운 일이었다.

본 명세서에 기재된 바와 같은 세포 배양의 특정 예에 따르면, Mut- 숙주 세포의 성장은 유리하게는 생산 단계 동안 제한되어 산소 공급 및 냉각의 필요성을 감소시켰다.

POI 생산의 수율이 지금까지 과소평가된 알코올 탈수소효소의 메커니즘과 메틸영양성 효모에서 ADH2의 활성에 의해 증가되었다는 사실은 더욱 놀라운 사실이었습니다. 여기에서 상기 효모는 메탄올 이용 경로가 결핍된 메틸영양 효모에서 AOX1 및 AOX2 유전자를 녹아웃시킴에도 불구하고 메탄올 흡수 및 효과적인 메탄올 소비를 초래하는 것으로 밝혀졌다.

구체적인 예에 따르면 메탄올 유도성 ECP는 GOIEC에서 유리하게 사용되어 왔다. 탄소원으로서 세포 배양에 사용된 메탄올 양은 GOI의 발현을 유도하기에 충분하였다.

그리고

도 1: 본 명세서에 언급된 서열

명세서 전체에서 사용되는 특정 용어는 다음과 같은 의미를 갖는다.

본원에 사용된 용어 "탄소원"은 발효 가능한 탄소 기질, 일반적으로 미생물을 위한 에너지원, 예를 들어 숙주 유기체 또는 생산 세포주, 특히 단당류, 올리고당류, 다당류, 글리세롤을 포함한 알코올로 구성된 그룹, 정제된 형태, 최소 배지 또는 복합 영양 물질과 같은 원료로 제공됨. 탄소 공급원은 단일 탄소 공급원으로서 또는 상이한 탄소 공급원의 혼합물로서 본원에 기재된 바와 같이 사용될 수 있다.

본 명세서에 기재된 바와 같이, 메탄올은 탄소원으로서, 예를 들어 생산 단계 동안 단독 탄소원으로서, 또는 비-메탄올 탄소원과의 혼합물로 사용된다. 구체적으로, 메탄올은 비메탄올 탄소 공급원과 함께 세포 배양물에 함께 공급된다.

비-메탄올 탄소 공급원은 본원에서 메탄올 이외의 임의의 탄소 공급원, 특히 메탄올이 없는 탄소 공급원으로 이해된다.

본 명세서에 기재된 바와 같은 "기저 탄소원(basal carbon source)"은 일반적으로 숙주 세포, 특히 진핵 세포를 위한 영양소와 같은 세포 성장에 적합한 탄소원이다. 기저 탄소원은 기본 배지 또는 복합 배지와 같은 배지에 제공될 수 있지만, 정제된 탄소원을 함유하는 화학적으로 정의된 배지에도 제공될 수 있습니다. 기저 탄소원은 전형적으로, 예를 들어 적어도 5g/L 세포 건조 질량, 바람직하게는 적어도 10g/L의 세포 밀도를 얻기 위해, 특히 배양 과정에서 성장 단계 동안 세포 성장을 제공하는 양으로 제공됩니다. L 세포 건조 질량, 또는 적어도 15g/L 세포 건조 질량, 예 표준 계대배양 단계 동안 90% 초과, 바람직하게는 95% 초과의 생존력을 나타낸다.

기저 탄소원은 일반적으로 과량 또는 잉여량으로 사용되며, 이는 바이오매스를 증가시키기 위해 에너지를 제공하는 과량, 예를 들어 회분식 또는 유가식 배양 공정에서 세포주의 성장 단계 동안과 같이 비성장률이 높은 세포주의 배양 중으로 이해된다. 이러한 잉여량은 측정가능하고 전형적으로 제한된 양의 보충 탄소원을 공급하는 동안보다 적어도 10배 더 높고, 바람직하게는 적어도 50배 또는 적어도 100배 더 높은 발효 브로스 내의 잔류 농도를 달성하기 위한 보충 탄소원의 제한된 양(성장-제한 조건 하에서 사용됨)을 특히 초과한다.

본원에 기재된 바와 같은 "보충 탄소원(supplemental carbon source)"은 일반적으로 특히 배양 공정의 생산 단계에서 생산 세포주에 의한 발효 생성물의 생산을 촉진하는 보충 기질이다. 생산 단계는 특히 성장 단계, 예를 들어 배치, 유가 및 연속 재배 공정을 따른다. 보충 탄소원은 구체적으로 유가식 공정의 공급물에 포함될 수 있다. 보충 탄소원은 일반적으로 탄소 기질 제한된 조건, 즉 제한된 양의 탄소원을 사용하여 세포 배양에 사용된다.

구체적으로, 본 명세서에 기재된 방법에서 메탄올은 보충 탄소원으로 사용된다.

탄소원의 "제한된 양(limited amount)" 또는 "제한된 탄소원(limited carbon source)"은 특히 최대 성장률보다 낮은 성장률로 제어된 배양 공정에서 생산 세포주에 의한 발효 생성물의 생산을 촉진하는 탄소 기질의 유형 및 양을 지칭하는 것으로 본원에서 이해된다. 생산 단계는 특히 성장 단계, 예를 들어 배치, 유가 및 연속 재배 공정을 따른다. 세포 배양 공정은 회분식 배양, 연속 배양 및 유가식 배양을 사용할 수 있습니다. 회분식 배양은 배지에 소량의 종자 배양액을 첨가하고 배양 중 별도의 배지를 추가하거나 배양액을 배출하지 않고 세포를 성장시키는 배양 과정이다.

연속 배양은 배양 중에 배지를 연속적으로 첨가하고 배출하는 배양 과정이다. 연속 배양에는 관류 배양도 포함된다. 유가식 배양은 회분식 배양과 연속식 배양의 중간인 반회분식 배양이라고도 하며, 배양 중에 배지를 연속적으로 또는 순차적으로 첨가하는 배양 과정이지만, 연속식 배양과 달리 배양액이 지속적으로 배출되지 않는다.

특히 바람직한 것은 배양물에 대한 성장 제한 영양 기질의 공급을 기반으로 하는 유가식(fed-batch) 공정이다. 단일 유가식 또는 반복된 유가식 발효를 포함한 유가식 전략은 일반적으로 생물 반응기에서 높은 세포 밀도에 도달하기 위해 생물 산업 공정에서 사용된다. 탄소 기질의 조절된 첨가는 배양물의 성장률에 직접적인 영향을 미치고 과잉 대사 또는 원치 않는 대사 부산물의 형성을 방지하는 데 도움이 된다. 탄소원 제한 조건 하에서, 탄소원은 구체적으로 유가식 공정의 공급물에 포함될 수 있다. 이에 의해, 탄소 기질은 제한된 양으로 제공된다.

또한 본 명세서에 기재된 바와 같은 케모스탯 또는 연속 배양에서, 성장 속도는 엄격하게 제어될 수 있다.

탄소원의 제한된 양은 본 명세서에서 특히 성장 제한 조건, 예를 들어, 생산 단계 또는 생산 모드에서 세포주를 생산 세포주를 유지하는 데 필요한 탄소원의 양으로 이해된다. 이러한 제한된 양은 탄소 공급원이 공급 배지에 함유되고 지속적인 에너지 전달, 예를 들어 낮은 특정 성장률에서 바이오매스를 유지하면서 POI를 생성하기 위해 낮은 공급 속도로 배양물에 공급되는 유가식 공정에서 사용될 수 있다. 피드 배지는 일반적으로 세포 배양의 생산 단계 동안 발효 브로쓰에 첨가됩니다.

제한된 양의 탄소원은, 예를 들어 세포 배양 브로스 내 탄소원의 잔류량에 의해 결정될 수 있으며, 이는 미리 결정된 역치 미만이거나 심지어 표준(탄수화물) 검정에서 측정된 검출 한계 미만이다. 잔류량은 전형적으로 발효 생성물을 수확할 때 발효 브로쓰에서 결정될 것이다.

탄소원의 제한된 양은 또한 발효기에 대한 탄소원의 평균 공급 속도를 정의함으로써 결정될 수 있다. 전체 재배 과정에 걸쳐 추가된 양에 의해 결정된다. 배양 시간당 유가식 단계를 통해 시간당 계산된 평균 양을 결정한다. 이 평균 공급 속도는 세포 배양에 의한 보충 탄소원의 완전한 사용, 예를 들어 0.6g L^-1h^-1(L 초기 발효 부피 및 h 시간당 탄소원 g) 내지 25g L^-1h^-1, 바람직하게는 1.6g L^-1h^-1 내지 20g L^-1h^-1을 보장하기 위해 낮게 유지된다. .

탄소원의 제한된 양은 또한 특정 성장률(specific growth rate)을 측정함으로써 결정될 수 있으며, 특정 성장률은 낮게 예를 들어, 생산 단계에서 최대 특정 성장률보다 낮게, 예를 들어 0.001h^-1 내지 0.20h^-1, 또는 0.005h^-1 내지 0.20h^-1, 바람직하게는 0.01h^-1 내지 0.15h^-1과 같은 미리 결정된 범위 내에서 유지된다. .

구체적으로, 화학적으로 정의되고 메탄올을 포함하는 공급 배지가 사용된다.

유가식 공정에서 최소 배지 또는 피드 배지와 같은 세포 배양 배지와 관련하여 "화학적으로 정의된(chemically defined)"이라는 용어는 생산 세포주의 시험관 내 세포 배양에 적합한 배양 배지를 의미하며, 여기서 모든 화학 성분 및 (폴리)펩티드가 알려져 있다. 일반적으로 화학적으로 정의된 배지는 동물 유래 성분이 전혀 없으며 순수하고 일관된 세포 배양 환경을 나타낸다.

본 명세서에서 용어 "세포(cell)" 또는 "숙주 세포(host cell)"는 단일 세포, 단일 세포 클론, 또는 숙주 세포의 세포주를 지칭할 것이다. "숙주 세포"라는 용어는 특히 POI 또는 숙주 세포 대사 산물을 생성하기 위한 재조합 목적에 적합하게 사용되는 메틸영양 효모 세포에 적용된다. "숙주 세포"라는 용어는 인간을 포함하지 않는다는 것은 잘 이해된다. 구체적으로, 본 명세서에 기재된 바와 같은 숙주 세포는 인공 유기체 및 천연(야생형) 숙주 세포의 유도체이다. 본원에 기술된 숙주 세포, 방법 및 용도, 예를 들어 하나 이상의 유전적 변형, 상기 이종 발현 카세트 또는 구축물, 상기 형질감염 또는 형질전환된 숙주 세포 및 재조합 단백질을 포함하는 것을 구체적으로 언급하는 것은 비-천연-발생하는 "인공(man-made)" 또는 합성이므로 "자연법칙(law of nature)"의 결과로 간주되지 않는다.

본원에 사용된 용어 "세포주(cell line)"는 장기간에 걸쳐 증식하는 능력을 획득한 특정 세포 유형의 확립된 클론을 지칭한다. 세포주는 일반적으로 내인성 또는 재조합 유전자, 또는 이러한 폴리펩티드에 의해 매개되는 폴리펩티드 또는 세포 대사산물을 생산하기 위한 대사 경로의 산물을 발현하는 데 사용된다.

본 명세서에 기재된 바와 같은 POI를 생산하는 숙주 세포는 또한 "생산 숙주 세포(production host cell)"로 지칭되고, 각각의 세포주는 "생산 세포주(production cell line)"로 지칭된다. "생산 세포주"는 일반적으로 POI와 같은 생산 공정의 생성물을 얻기 위해 생물반응기에서 세포 배양에 바로 사용할 수 있는 세포주로 이해된다.

본원에 기재된 특정 실시양태는 ADH2를 효과적으로 사용하여 메탄올을 효소적으로 처리함으로써 세포에 에너지를 제공할 수 있는 Mut- 생산 숙주 세포를 지칭한다.

본원에 기재된 특정 실시양태는 AOX1 및 AOX2 단백질을 코딩하는 내인성 유전자를 과소발현하고 ADH2를 코딩하는 유전자를 과발현하도록 조작되고 본원에 기재된 메탄올을 탄소원으로 사용하여 ECP의 제어 하에 높은 수율의 POI 생산을 특징으로 하는 생산 세포주를 지칭한다.

숙주 세포와 관련하여 본원에 사용된 용어 "세포 배양(cell culture)" 또는 "배양하는(culturing)" 또는 "배양(cultivation)"은 인공, 예를 들어 시험관내 환경에서, 성장, 분화 또는 지속적인 생존을 선호하는 조건 하에서, 세포의 활성 또는 정지 상태에서, 특히 업계에 공지된 방법에 따라 제어된 생물반응기에서 세포를 유지하는 것을 지칭한다.

적절한 배양 배지를 사용하여 세포 배양물을 배양할 때, 세포는 세포 배양물에서 세포 배양을 지원하기에 적합한 조건 하에 배양 용기 내의 배지 또는 기질과 접촉하게 된다. 본원에 기재된 바와 같이, 숙주 세포, 예를 들어 메틸영양성 효모의 성장에 사용될 수 있는 배양 배지가 제공된다. 표준 세포 배양 기술은 당업계에 잘 알려져 있다.

본원에 기재된 바와 같은 세포 배양물은 특히 본원에서 "세포 배양 상청액(cell culture supernatant)"으로 지칭되는 세포 바이오매스로부터 분리가능한 세포 배양 배지에서 POI를 수득하기 위해 분비된 POI의 생성을 제공하는 기술을 사용하고, 더 높은 순도의 POI를 얻기 위해 정제될 수 있다. 단백질(예를 들어, POI)이 세포 배양에서 숙주 세포에 의해 생산되고 분비될 때, 이러한 단백질은 세포 배양 상청액으로 분비되고, 세포 배양 상청액을 숙주 세포 바이오매스, 및 임의로 단백질을 추가로 정제하여 정제된 단백질 제제를 생성하는 단계를 포함한다.

세포 배양 배지는 통제된 인공 및 시험관 내 환경에서 세포를 유지하고 성장시키는 데 필요한 영양소를 제공한다. 세포 배양 배지의 특성 및 조성은 특정 세포 요구 사항에 따라 다르다. 중요한 매개변수에는 삼투질 농도, pH 및 영양 성분이 포함된다. 영양소의 공급은 당업계에 공지된 방법에 따라 연속 또는 불연속 방식으로 수행될 수 있다.

회분식(batch) 공정은 발효 과정에서 추가적인 영양소의 공급 없이 초기 배양액에 세포를 배양하는데 필요한 모든 영양소가 포함된 세포 배양 방식인 반면, 유가식(fed-batch) 공정에서는 회분식(batch) 단계 이후에 공급(feeding) 섭식을 통해 하나 이상의 영양소가 배양물에 공급되는 단계가 발생한다. 대부분의 과정에서 공급 방식이 중요하고 중요하지만, 여기에 설명된 숙주 세포 및 방법은 특정 방식의 세포 배양과 관련하여 제한되지 않는다.

재조합 POI는 적절한 배지에서 배양하고, 발현된 생성물 또는 대사산물을 배양물로부터 단리하고, 임의로 적합한 방법에 의해 이를 정제함으로써 본원에 기재된 숙주 세포 및 각각의 세포주를 사용하여 생성될 수 있다.

본 명세서에 기술된 바와 같은 POI의 생성을 위한 몇 가지 상이한 접근법이 바람직하다. POI는 관련 단백질을 코딩하는 재조합 DNA를 보유하는 발현 벡터로 숙주 세포를 형질감염 또는 형질전환시키고, 형질감염 또는 형질전환된 세포의 배양물을 제조하고, 배양물을 성장시키고, 전사 및 POI 생산을 유도함으로써 발현, 처리 및 임의로 분비될 수 있으며, POI를 복구한다.

특정 실시양태에서, 세포 배양 공정은 유가식 공정이다. 구체적으로, 원하는 재조합 POI를 코딩하는 핵산 구조체로 형질전환된 숙주 세포는 원하는 재조합 POI를 생산하기 위해 성장기에서 배양되고 생산기로 전환된다.

또 다른 실시양태에서, 본원에 기재된 숙주 세포는 예를 들어 케모스탯을 사용하는 연속 방식으로 배양된다. 연속 발효 공정은 새로운 배양 배지를 생물 반응기로 공급하는 정의되고 일정하며 연속적인 속도를 특징으로 하며, 이에 의해 배양 브로쓰는 동시에 정의되고 일정하며 연속적인 동일한 제거 속도로 생물 반응기에서 제거된다. 배양 배지, 공급 속도 및 제거율을 동일한 일정한 수준으로 유지함으로써 생물 반응기의 세포 배양 매개변수 및 조건이 일정하게 유지된다.

본원에 기재된 바와 같은 안정한 세포 배양물은 유전적 특성을 유지하는 세포 배양물, 구체적으로 예를 들어 적어도 ㎍ 수준에서, 약 20세대, 바람직하게는 최소 30세대, 보다 바람직하게는 최소 40세대, 가장 바람직하게는 최소 50세대의 배양 후에도 POI 생산 수준을 높게 유지하는 세포 배양물을 지칭하는 것으로 구체적으로 이해된다. 구체적으로, 산업적 규모의 생산에 사용될 때 큰 이점으로 간주되는 안정적인 재조합 숙주 세포주가 제공된다.

본 명세서에 기술된 세포 배양은 산업적 제조 규모, 예를 들면, 공업적 제조 규모의 방법에 특히 유리하다. 양분 및 기술 시스템 모두와 관련하여 영양소 공급, 특히 유가식 또는 회분식 공정, 또는 연속식 또는 반연속식 공정(예: 케모스탯)을 기반으로 하는 재배 모드와 결합된다.

여기에 설명된 숙주 세포는 일반적으로 POI 생산을 위한 GOI를 발현하는 능력에 대해 테스트되고, 다음 테스트 중 하나에 의해 POI 수율에 대해 테스트된다: ELISA, 활성 분석, HPLC, 또는 SDS-PAGE 및 Western과 같은 기타 적합한 테스트 블로팅 기술 또는 질량 분석법.

각각의 세포 배양에서 AOX1 및/또는 AOX2 단백질(들)을 코딩하는 유전자의 저발현 또는 발현 감소에 대한 하나 이상의 유전적 변형의 효과 및 예를 들어 POI 생성에 대한 이들의 효과를 결정하기 위해, 숙주 세포주는 마이크로타이터 플레이트, 진탕 플라스크, 또는 유가식 또는 케모스탯 발효를 사용하는 생물반응기에서 각각의 세포에서 이러한 유전자 변형(들)이 없는 균주와 비교하여 배양될 수 있다.

본원에 기재된 생산 방법은 구체적으로 파일럿 또는 산업적 규모의 발효를 허용한다. 산업적 공정 규모는 바람직하게는 적어도 10L, 구체적으로 적어도 50L, 바람직하게는 적어도 1 m³, 바람직하게는 적어도 10 m³, 가장 바람직하게는 적어도 100 m³의 부피를 사용할 것이다.

산업적 규모의 생산 조건이 선호되는데, 예를 들어 수일의 일반적인 공정 시간 사용하는 100 L~10 m³ 또는 그 이상의 반응기 용적에서 유가식 배양, 또는 희석 비율은 약 0.02-0.15 h^-1 인 약 50~1000L 또는 그 이상의 발효기 용적에서 연속 공정을 의미한다.

본 명세서에 기술된 목적을 위해 사용되는 장치, 시설 및 방법은 원핵 및/또는 진핵 세포주를 포함하는 임의의 원하는 세포주를 배양하는데 사용하기에 특히 적합하다. 또한, 구현예에서, 장치, 시설 및 방법은 현탁 세포 또는 고정 의존성(부착) 세포를 포함하는 임의의 세포 유형을 배양하는 데 적합하고 POI, 핵산 제품(예: DNA 또는 RNA), 또는 세포 및/또는 바이러스 치료에 사용되는 것과 같은 세포 및/또는 바이러스와 같은 제약 및 생물제약 제품의 생산을 위해 구성된 생산 작업에 적합하다.

특정 실시양태에서, 세포는 재조합 치료 또는 진단 제품과 같은 제품을 발현하거나 생산한다. 본원에 더 상세히 기재된 바와 같이, 세포에 의해 생성된 생성물의 예는 항체 분자(예: 단일클론 항체, 이중특이성 항체), 항체 모방체(항원에 특이적으로 결합하지만, 항체(예: DARPin, 어피바디, 애드넥틴 또는 IgNAR), 융합 단백질(예: Fc 융합 단백질, 키메라 사이토카인), 기타 재조합 단백질(예: 글리코실화 단백질, 효소, 호르몬) 또는 바이러스 치료제와 같은 항체와 구조적으로 관련되지 않은 (예를 들어, 항암 종양 용해 바이러스, 유전자 요법 및 바이러스 면역 요법을 위한 바이러스 벡터), 세포 치료제 (예를 들어, 만능 줄기 세포, 중간엽 줄기 세포 및 성체 줄기 세포), 백신 또는 지질 캡슐화된 입자 (예를 들어, 엑소좀, 바이러스- 입자), RNA(예: siRNA) 또는 DNA(예: 플라스미드 DNA), 항생제 또는 아미노산을 포함하는 POI를 포함하지만, 이에 제한되지 않는다. 일 구현예에서 장치, 시설 및 방법은 바이오시밀러를 생산하는 데 사용될 수 있다.

언급된 바와 같이, 특정 실시양태에서, 장치, 시설 및 방법은 진핵 세포, 예를 들어 효모 세포, 예를 들어 단백질, 펩티드 또는 항생제, 아미노산, 핵산(예: DNA 또는 RNA)를 포함하는 POI의 생산을 허용하고, 대규모 방식으로 상기 세포에 의해 합성된다. 여기에 달리 명시되지 않는 한, 장치, 시설 및 방법은 벤치 규모, 파일럿 규모 및 전체 생산 규모 용량을 포함하지만 이에 국한되지 않는 임의의 원하는 양 또는 생산 용량을 포함할 수 있다.

더욱이, 그리고 여기에 달리 언급되지 않는 한, 장치, 시설 및 방법은 교반 탱크, 에어리프트, 섬유, 극세사, 중공 섬유, 세라믹 매트릭스, 유동층, 고정층 및 /또는 분출층 생물반응기를 포함하는 적절한 반응기를 포함할 수 있으나, 이에 제한되는 것은 아니다. 본원에 사용된 "반응기(reactor)"는 발효기 또는 발효 유닛, 또는 임의의 다른 반응 용기를 포함할 수 있고 용어 "반응기"는 "발효기(fermentor)"와 상호교환적으로 사용된다. 예를 들어, 일부 측면에서, 예시적인 생물반응기 유닛은 다음 중 하나 이상 또는 모두를 수행할 수 있다: 영양 및/또는 탄소원 공급, 적절한 가스(예, 산소) 주입, 발효 또는 세포 배양 배지의 유입 및 출입 흐름, 기체 및 액체상 분리, 온도 유지, 산소 및 CO2 수준 유지, pH 수준 유지, 교반(예: 교반) 및/또는 세척/멸균. 발효 유닛과 같은 예시적인 반응기 유닛은 유닛 내에 다중 반응기를 포함할 수 있다. 예를 들어 유닛은 각 유닛 및/또는 시설의 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90 또는 100 또는 그 이상의 생물 반응기는 시설 내에 단일 또는 다중 반응기가 있는 다중 유닛을 포함할 수 있다. 다양한 실시양태에서, 생물반응기는 배치, 반 유가, 유가, 관류 및/또는 연속 발효 공정에 적합할 수 있다. 임의의 적합한 반응기 직경을 사용할 수 있다. 구체예에서, 생물반응기는 약 100mL 내지 약 50,000L의 부피를 가질 수 있다. 비제한적인 예는 100mL, 250mL, 500mL, 750mL, 1리터, 2리터, 3리터, 4리터, 5리터, 6리터, 7리터, 8리터, 9리터, 10리터, 15리터, 20리터, 25리터, 30리터, 40리터, 50리터, 60리터, 70리터, 80리터, 90리터, 100리터 , 150리터, 200리터, 250리터, 300리터, 350리터, 400리터, 450리터, 500리터, 550리터, 600리터, 650리터, 700리터, 750리터, 800리터, 850리터, 9500리터 리터, 1000리터, 1500리터, 2000리터, 2500리터, 3000리터, 3500리터, 4000리터, 4500리터, 5000리터, 6000리터, 7000리터, 8000리터, 900050, 10,10 및/또는 50,000리터를 포함한다. 또한, 적합한 반응기는 다용도, 일회용, 일회용 또는 비일회용일 수 있으며 스테인리스강(예: 316L 또는 기타 적합한 스테인리스강) 및 Inconel, 플라스틱, 및/또는 유리와 같은 금속 합금을 비롯한 임의의 적합한 재료로 형성될 수 있다. .

실시예에서 그리고 여기에 달리 언급되지 않는 한, 여기에 설명된 장치, 시설 및 방법은 이러한 제품의 분리, 정제 및 격리를 위한 작업 및/또는 장비와 같이 달리 언급되지 않은 임의의 적절한 단위 작업 및/또는 장비도 포함할 수 있다. 전통적인 스틱 빌트 시설, 모듈식, 이동식 및 임시 시설, 또는 기타 적절한 건설, 시설 및/또는 레이아웃과 같은 임의의 적절한 시설 및 환경을 사용할 수 있다. 예를 들어, 일부 실시예에서 모듈식 청정실이 사용될 수 있다. 또한, 달리 명시되지 않는 한, 여기에 설명된 장치, 시스템 및 방법은 단일 위치 또는 시설에 보관 및/또는 수행되거나 대안적으로 별도의 또는 여러 위치 및/또는 시설에 보관 및/또는 수행될 수 있다.

적합한 기술은 배치 단계에서 시작하여 생물반응기에서 배양한 후 높은 비성장률에서 짧은 지수 유가식으로 배양한 후 낮은 비성장률에서 추가로 유가식으로 배양하는 것을 포함할 수 있다. 또 다른 적합한 배양 기술은 POI 생산 시간에 걸쳐 높은 성장률에서 낮은 성장률로, 또는 POI 생산 시간에 걸쳐 낮은 성장률에서 높은 성장률로 가는 것과 같은 특정 성장률 또는 특정 성장률의 조합에서 배치 단계 이후에 유가식 단계를 포함할 수 있다. POI 제작 시간. 또 다른 적합한 배양 기술은 배치 단계에 이어 낮은 희석율로 연속 배양 단계를 포함할 수 있다.

바람직한 실시양태는 바이오매스를 제공하기 위한 회분식 배양에 이어 고수율 POI 생산을 위한 유가식 배양을 포함한다.

적어도 1 g/L 세포 건조 중량, 보다 바람직하게는 적어도 10 g/L 세포 건조 중량, 바람직하게는 적어도 20 g/L 세포 건조 중량, 바람직하게는 30, 40, 50, 60, 70, 또는 80 g/L 세포 건조 중량 중 적어도 어느 하나의 세포 밀도를 얻기 위해 성장 조건 하에 생물반응기에서 본원에 기재된 바와 같은 숙주 세포를 배양하는 것이 바람직하다. 파일럿 또는 산업적 규모에서 이러한 바이오매스 생산 수율을 제공하는 것이 유리하다.

바이오매스의 축적을 허용하는 성장 배지, 특히 기초 성장 배지는 전형적으로 탄소원, 질소원, 황 공급원 및 인산염 공급원을 포함한다. 전형적으로, 이러한 배지는 미량 원소 및 비타민을 추가로 포함하고 아미노산, 펩톤 또는 효모 추출물을 추가로 포함할 수 있다.

바람직한 질소 공급원은 NH₄H₂PO₄, 또는 NH₃ 또는 (NH₄)₂SO₄를 포함하고;

바람직한 황 공급원은 MgSO₄, 또는 (NH₄)₂SO₄ 또는 K₂SO₄를 포함하고;

바람직한 포스페이트 공급원은 NH₄H₂PO₄, 또는 H₃PO₄, 또는 NaH₂PO₄, KH₂PO₄, Na₂HPO₄ 또는 K₂HPO₄를 포함하고;

추가적인 전형적인 매질 성분에는 KCl, CaCl₂ 및 Fe, Co, Cu, Ni, Zn, Mo, Mn, I, B와 같은 미량 원소가 포함되고;

바람직하게는 배지는 비타민 B₇을 보충하고;

P. pastoris의 전형적인 성장 배지는 글리세롤, 소르비톨 또는 포도당, NH₄H₂PO₄, MgSO₄, KCl, CaCl₂, 비오틴 및 미량 원소를 포함한다.

생산 단계에서 생산 배지는 특별히 제한된 양의 보충 탄소원과 함께 사용된다.

바람직하게는 숙주 세포주는 적절한 탄소원을 갖는 미네랄 배지에서 배양되어 분리 과정을 상당히 단순화한다. 바람직한 미네랄 배지의 예는 이용가능한 탄소원(특히 본원에 기술된 메탄올과 임의로 예를 들어, 글루코스, 글리세롤 또는 소르비톨과 조합됨), 거대 원소(칼륨, 마그네슘, 칼슘, 암모늄, 염화물, 황산염, 인산염) 및 미량 원소(구리, 요오드화물, 망간, 몰리브덴산염, 코발트, 아연, 철염, 및 붕산), 그리고 선택적으로 비타민 또는 아미노산, 예를 들어 영양요구성 보완을 함유하는 염을 함유하는 것이다.

구체적으로, 세포는 발현 시스템 및 발현된 단백질의 성질, 예를 들어 단백질이 신호 펩티드와 유합되어 있는지 및 단백질이 가용성인지 막 결합인지 여부에 따라 세포 또는 배양 배지로부터 정제될 수 있는 원하는 POI의 발현을 달성하기에 적합한 조건 하에 배양된다. 당업자에 의해 이해되는 바와 같이, 배양 조건은 사용되는 숙주 세포 및 특정 발현 벡터의 유형을 포함하는 인자에 따라 달라질 것이다.

일반적인 생산 배지는 보충 탄소원과 추가로 NH4H2PO4, MgSO4, KCl, CaCl2, 비오틴 및 미량 원소를 포함한다.

예를 들어, 발효에 첨가되는 보충 탄소원의 공급물은 최대 50 wt%의 이용가능한 당을 갖는 탄소원을 포함할 수 있다.

발효는 바람직하게는 3 내지 8 범위의 pH에서 수행된다.

전형적인 발효 시간은 20℃ 내지 35℃, 바람직하게는 22 내지 30℃ 범위의 온도에서 약 24 내지 120시간이다.

POI는 바람직하게는 1 mg/L 이상, 바람직하게는 10 mg/L 이상, 바람직하게는 100 mg/L 이상, 가장 바람직하게는 1 g/L 이상의 역가를 생성하는 조건을 사용하여 표현된다.

본원에 사용된 용어 "발현(expression)" 또는 "발현 카세트(expression cassette)"는 작동 가능한 연결로 원하는 코딩 서열 및 제어 서열을 함유하는 핵산 분자를 지칭하므로, 이들 서열로 형질전환되거나 형질감염된 숙주는 코딩된 단백질 또는 숙주 세포 대사산물을 생산할 수 있다. 형질전환을 수행하기 위해 발현 시스템이 벡터에 포함될 수 있지만, 관련 DNA가 숙주 세포 염색체에 통합될 수도 있다. 발현은 폴리펩티드 또는 대사물을 포함하는 분비 또는 비분비 발현 생성물을 지칭할 수 있다. .

발현 카세트는 예를 들어 "벡터(vector)" 또는 "플라스미드(plasmid)"의 형태로 발현 구성물로서 편리하게 제공되며, 이는 일반적으로 복제된 재조합 뉴클레오티드 서열의 전사를 위해 필요한 DNA 서열, 즉 재조합 유전자 및 적합한 숙주 유기체에서 그들의 mRNA의 번역이다. 발현 벡터 또는 플라스미드는 일반적으로 숙주 세포, 선택 마커(예를 들어, 아미노산 합성 유전자 또는 제오신, 카나마이신, G418 또는 하이그로마이신, 노르세오트리신과 같은 항생제에 내성을 부여하는 유전자), 다수의 제한 효소 절단 부위, 적합한 프로모터 서열 및 전사 종결자에서 자율 복제를 위한 기점 또는 게놈 통합을 위한 유전자좌를 포함하고, 이들 구성요소는 작동가능하게 함께 연결된다. 본원에 사용된 용어 "플라스미드" 및 "벡터"는 자가 복제 뉴클레오티드 서열 뿐만 아니라 인공 염색체, 예를 들어 효모 인공 염색체(YAC)와 같은 게놈 통합 뉴클레오티드 서열을 포함한다.

발현 벡터는 클로닝 벡터, 변형된 클로닝 벡터 및 특이적으로 설계된 플라스미드를 포함할 수 있지만 이에 제한되지는 않는다. 본원에 기재된 바람직한 발현 벡터는 진핵 숙주 세포에서 재조합 유전자의 발현에 적합한 발현 벡터이고 숙주 유기체에 따라 선택된다. 적절한 발현 벡터는 전형적으로 진핵 숙주 세포에서 POI를 코딩하는 DNA를 발현하기에 적합한 조절 서열을 포함한다. 조절 서열의 예는 프로모터, 오퍼레이터, 인핸서, 리보솜 결합 부위, 및 전사 및 번역 개시 및 종결을 제어하는 서열을 포함한다. 조절 서열은 전형적으로 발현될 DNA 서열에 작동가능하게 연결된다.

본원에 기재된 특정 발현 구축물은 상기 프로모터의 전사 제어 하에 POI를 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 포함한다. 구체적으로, 프로모터는 POI의 코딩 서열과 본래 연관되어 있지 않다.

숙주 세포에서 재조합 뉴클레오티드 서열의 발현을 허용하기 위해, GOIEC로서 본원에 기재된 발현 카세트 또는 벡터는 ECP, 전형적으로 코딩 서열의 5' 말단에 인접한, 예를 들어, 상류 및 인접하는 프로모터 뉴클레오티드 서열을 포함한다. 관심 유전자(GOI)에, 또는 신호 또는 리더 서열이 사용되는 경우, 각각 상기 신호 및 리더 서열의 업스트림 및 인접하여 POI의 발현 및 분비를 촉진한다. 프로모터 서열은 전형적으로 특히 GOI를 포함하여 작동가능하게 연결된 다운스트림 뉴클레오티드 서열의 전사를 조절하고 개시한다.

본원에 기재된 특정 발현 작제물은 숙주 세포로부터 POI의 분비를 유발하는 리더 서열과 연결된 POI를 코딩하는 폴리뉴클레오티드를 포함한다. 발현 벡터에서 이러한 분비 리더 서열의 존재는 일반적으로 재조합 발현 및 분비를 위한 POI가 자연적으로 분비되지 않는 단백질이고 따라서 천연 분비 리더 서열이 결여된 단백질이거나 그의 뉴클레오타이드 서열이 자연 분비 리더 시퀀스 없이 클로닝된 경우에 요구된다. 일반적으로, 숙주 세포로부터 POI의 분비를 유발하는데 효과적인 임의의 분비 리더 서열이 사용될 수 있다. 분비 리더 서열은 효모 공급원, 예를 들어 Saccharomyces cerevisiae의 MFa 또는 효모 포스파타제(yeast phosphatase)와 같은 효모 α-인자, 포유동물 또는 식물 공급원, 또는 기타에서 유래할 수 있다.

구체적인 구현예에서는 멀티클로닝 부위를 갖는 벡터인 멀티클로닝 벡터를 사용할 수 있다. 구체적으로, 원하는 이종 유전자를 다중 클로닝 부위에 통합 또는 통합하여 발현 벡터를 제조할 수 있다. 멀티클로닝 벡터의 경우 프로모터는 일반적으로 멀티클로닝 부위의 상류에 위치한다.

본원에 사용된 용어 "유전자 발현(gene expression)" 또는 "폴리뉴클레오티드를 발현하는(expressing a polynucleotide)"은 mRNA로의 DNA 전사, mRNA 프로세싱, mRNA 성숙, mRNA 내보내기, 번역, 단백질 폴딩 및 /또는 단백질 수송으로 이루어진 군에서 선택된 적어도 하나의 단계를 포함하는 것을 의미한다.

본원에서 "과발현(overexpression)"으로도 지칭되는 용어 "발현 증가(increase expression)"는 참조 표준에 의해 나타나는 발현 수준보다 더 높은 임의의 양을 지칭하며, 이는 특정 폴리뉴클레오티드의 발현을 증가시키기 위한 유전적 변경 이전의 숙주 세포일 수 있거나, 그렇지 않으면 상기 폴리뉴클레오티드의 발현을 증가시키도록 조작되지 않은 동일한 유형 또는 종의 숙주 세포에서 발현된다.

숙주 세포가 주어진 유전자 산물을 포함하지 않는 경우, 발현을 위해 유전자 산물을 숙주 세포에 도입하는 것이 가능하며; 이 경우 감지 가능한 모든 표현은 "과발현"이라는 용어에 포함된다.

단백질(예: ADH2)을 암호화하는 유전자의 과발현은 또한 단백질(예: ADH2)의 과발현으로 지칭된다. 과발현은 당업자에게 공지된 임의의 방식으로 달성될 수 있다. 일반적으로 유전자의 전사/번역을 증가시켜 달성할 수 있다. 유전자의 카피 수를 증가시키거나 유전자의 발현과 관련된 조절 서열 또는 부위를 변경 또는 변형함으로써, 예를 들어, 유전자는 높은 발현 수준에 도달하기 위해 강력한 프로모터에 작동 가능하게 연결될 수 있다. 이러한 프로모터는 내인성 프로모터 또는 이종성, 특히 재조합 프로모터일 수 있다. 프로모터를 유전자의 발현을 증가시키는 이종 프로모터로 대체할 수 있다. 추가로 유도성 프로모터를 사용하면 배양 과정에서 발현을 증가시킬 수 있다. 또한, 과발현은 또한 예를 들어 특정 유전자의 염색체 위치를 수정하고, 리보솜 결합 부위 또는 전사 종결자와 같은 특정 유전자에 인접한 핵산 서열을 변경하고, 오픈 리딩 프레임에 프레임 이동을 도입하고, 유전자의 전사 및/또는 유전자 산물의 번역에 관여하는 단백질(예: 조절 단백질, 억제인자, 인핸서, 전사 활성화제 등)을 변경하고, 또는 당업계에서 일상적인 특정 유전자의 발현을 탈조절하는 임의의 다른 통상적인 수단 (예를 들어, 억제 단백질의 발현을 차단하거나 과발현하고자 하는 유전자의 발현을 정상적으로 억제하는 전사 인자에 대한 유전자를 결실 또는 돌연변이시키기 위한 안티센스 핵산 분자의 사용을 포함하지만 이에 국한되지 않음)에 의해 달성될 수 있다. mRNA의 수명 연장 또한 발현 수준을 향상시킬 수 있다. 예를 들어, 특정 종결자 영역을 사용하여 mRNA의 반감기를 증가시킬 수 있다. 유전자의 여러 사본이 포함되는 경우, 유전자는 다양한 사본 수의 플라스미드에 위치하거나 염색체에 통합 및 증폭될 수 있다. 발현을 위해 하나 이상의 유전자 또는 게놈 서열을 숙주 세포에 도입하는 것이 가능하다.

특정 구현예에 따르면, ADH2 단백질을 인코딩하는 폴리뉴클레오티드는 단일 카피로 또는 세포당 다중 카피로 제시될 수 있다. 복사본은 서로 인접하거나 떨어져 있을 수 있다. 또 다른 특정 구체예에 따르면, ADH2 단백질의 과발현은 숙주 세포의 게놈(즉, 녹인)으로의 통합에 적합한 하나 이상의 플라스미드 상에 제공된 ADH2 단백질을 암호화하는 재조합 뉴클레오티드 서열을 세포당 단일 카피 또는 다중 카피로 사용한다. 복사본은 서로 인접하거나 떨어져 있을 수 있다. 과발현은 숙주 세포당 상기 폴리뉴클레오타이드의 2, 3, 4, 5, 6 또는 그 이상의 카피와 같은 폴리뉴클레오타이드의 다중 카피를 발현함으로써 달성될 수 있다.

GOI 및 ADH2 단백질을 인코딩하는 폴리뉴클레오타이드(유전자)를 포함하는 재조합 뉴클레오타이드 서열은 하나 이상의 자가 복제 플라스미드에 제공될 수 있고, 세포당 단일 카피 또는 다중 카피로 도입될 수 있다.

대안적으로, GOI 및 ADH2 단백질을 코딩하는 폴리뉴클레오티드(유전자)를 포함하는 재조합 뉴클레오티드 서열은 동일한 플라스미드 상에 존재할 수 있고, 세포당 단일 카피 또는 다중 카피로 도입될 수 있다.

ADH2 단백질을 코딩하는 이종 폴리뉴클레오티드(유전자) 또는 ADH2 단백질을 코딩하는 폴리뉴클레오티드(유전자)를 포함하는 이종 재조합 발현 구조체는 바람직하게는 숙주 세포의 게놈에 통합된다.

"게놈(genome)"이라는 용어는 일반적으로 DNA(또는 RNA)에 암호화된 유기체의 전체 유전 정보를 나타낸다. 염색체, 플라스미드 또는 벡터 또는 둘 다에 존재할 수 있다. 바람직하게는, ADH2 단백질을 코딩하는 폴리뉴클레오티드(유전자)는 상기 세포의 염색체에 통합된다.

ADH2 단백질을 코딩하는 폴리뉴클레오티드(유전자)는 그의 천연 유전자좌에 통합될 수 있다. "천연 유전자좌(Natural locus)"는 ADH2 단백질을 코딩하는 폴리뉴클레오티드(유전자)가 자연 발생 야생형 세포에 위치하는 특정 염색체 상의 위치를 의미한다. 그러나, 또 다른 구체예에서, ADH2 단백질을 코딩하는 폴리뉴클레오티드(유전자)는 그들의 천연 유전자좌가 아니라 이소적으로 통합된 숙주 세포의 게놈에 존재한다. "이소성 통합(ectopic integration)"이라는 용어는 미생물의 일반적인 염색체 유전자좌 이외의 부위, 즉 미리 결정된 또는 무작위 통합에서 미생물의 게놈 내로 핵산의 삽입을 의미한다. 또 다른 실시양태에서, ADH2 단백질을 코딩하는 폴리뉴클레오티드(유전자)는 자연 유전자좌 내로 및 이소적으로 통합된다. 이종 재조합을 사용하여 무작위 또는 비표적 통합을 달성할 수 있다. 이종 재조합은 서열이 상당히 다른 DNA 분자 간의 재조합을 의미한다.

효모 세포의 경우, ADH2 단백질 및/또는 GOI를 코딩하는 폴리뉴클레오티드(유전자)는 AOX1, GAP, ENO1, TEF, HIS4 (Zamir et al., Proc. NatL Acad. Sci. USA(1981) 78(6):3496-3500), HO (Voth et al. Nucleic Acids Res. 2001 June 15; 29(12): e59), TYR1 (Mirisola et al., Yeast 2007; 24: 761-766), His3, Leu2, Ura3 (Taxis et al., BioTechniques (2006) 40:73-78), Lys2, ADE2, TRP1, GAL1, ADH1 또는 5S 리보솜 RNA 유전자의 통합과 같은 원하는 유전자좌에 삽입될 수 있다.

다른 실시양태에서, ADH2 단백질 및/또는 GOI를 코딩하는 폴리뉴클레오티드(유전자)는 플라스미드 또는 벡터에 통합될 수 있다. 바람직하게는, 플라스미드는 진핵생물 발현 벡터, 바람직하게는 효모 발현 벡터이다. 적합한 플라스미드 또는 벡터는 본원에 추가로 기재되어 있다.

재조합 숙주 세포에서 내인성 또는 이종성 폴리뉴클레오티드의 과발현은 발현 조절 서열을 변형함으로써 달성될 수 있다. 발현 조절 서열은 당업계에 공지되어 있고, 예를 들어 숙주 세포에서 폴리뉴클레오티드 서열의 발현을 제공하는 프로모터, 인핸서, 폴리아데닐화 신호, 전사 종결자, 내부 리보솜 진입 부위(IRES) 등을 포함한다. 발현 조절 서열은 전사에 관여하는 세포 단백질과 특이적으로 상호작용한다. 예시적인 발현 조절 서열은 예를 들어 문헌[Goeddel, Gene Expression Technology: Methods in Enzymology, Vol. 185, Academic Press, San Diego, CA(1990)에 기술되어 있다.

바람직한 실시양태에서, 과발현은 인핸서를 사용하여 폴리뉴클레오티드를 발현함으로써 달성된다. 전사 인핸서는 인트론 내에서 뿐만 아니라 코딩 서열 자체 내에서 전사 단위에 대해 5' 및 3'에서 발견되는 비교적 배향 및 위치 독립적이다. 인핸서는 코딩 서열의 5' 또는 3' 위치에서 발현 벡터 내로 스플라이싱될 수 있지만, 바람직하게는 프로모터로부터 5' 부위에 위치한다. 대부분의 효모 유전자는 일반적으로 캡 부위의 수백 염기쌍 내에 있는 하나의 UAS만을 포함하며 대부분의 효모 인핸서(UAS)는 프로모터의 3'에 위치할 때 기능할 수 없지만 고등 진핵생물의 인핸서는 프로모터의 5' 및 3' 모두에서 기능할 수 있다.

많은 인핸서 서열이 포유동물 유전자(글로빈, RSV, SV40, EMC, 엘라스타제, 알부민, α-태아단백 및 인슐린)로부터 알려져 있다. SV40 후기 인핸서, 사이토메갈로바이러스 초기 프로모터 인핸서, 복제 기점의 후반에 있는 폴리오마 인핸서 및 아데노바이러스 인핸서와 같은 진핵 세포 바이러스의 인핸서를 사용할 수도 있다.

구체적으로, 본원에 기재된 바와 같은 GOI 및/또는 ADH2 코딩 폴리뉴클레오티드(유전자)는 숙주 세포에서의 발현을 제공하는 전사 및 번역 조절 서열에 작동가능하게 연결된다. 본원에 사용된 용어 "번역 조절 서열(translational regulatory sequences)"은 유전자 핵산 서열과 연관되고 유전자의 번역을 조절하는 뉴클레오티드 서열을 지칭한다. 전사 및/또는 번역 조절 서열은 플라스미드 또는 벡터에 위치하거나 숙주 세포의 염색체에 통합될 수 있다. 전사 및/또는 번역 조절 서열은 그것이 조절하는 유전자의 동일한 핵산 분자에 위치한다.

구체적으로, ADH2 단백질의 과발현은 본 발명이 속하는 기술분야의 통상적인 방법으로 달성할 수 있고, 예를 들어 Marx 등., 2008(Marx, H., Mattanovich, D. and Sauer, M. Microb Cell Fact 7 (2008): 23)에 기술된 바와 같이 그들의 내재적인 조절영역을 유전적으로 조절하는 것일 수 있고, 이러한 방법은 예를 들어 유전자의 발현을 증가시키는 재조합 프로모터의 통합을 포함한다.

예를 들어, 재조합 숙주 세포에서 내인성 또는 이종성 폴리뉴클레오티드의 과발현은 이러한 발현을 제어하는 프로모터를 변형함으로써, 예를 들어 프로모터(예를 들어, 내인성 프로모터 또는 높은 발현 수준에 도달하기 위해 다른 보다 강력한 프로모터로 상기 폴리뉴클레오티드에 작동 가능하게 연결된 야생형 유기체)를 대체하여 달성할 수 있고, 이는 높은 발현수준을 달성하기 위하여 다른 강력한 프로모터와 상기 폴리뉴클레오티드를 작동가능하게 연결하고 있다. 이러한 프로모터는 유도적이거나 구성적일 수 있습니다. 프로모터의 변형은 또한 당업계에 공지된 돌연변이유발 방법에 의해 수행될 수 있다.

바람직한 실시양태에서, ADH2 단백질을 코딩하는 폴리뉴클레오티드 및 POI를 코딩하는 폴리뉴클레오티드 둘 모두의 발현은 유도성 프로모터에 의해 구동된다. 또 다른 바람직한 구체예에서, ADH2 단백질을 인코딩하는 폴리뉴클레오타이드 및 POI를 인코딩하는 폴리뉴클레오타이드 둘 다의 발현은 구성적 프로모터에 의해 구동된다. 또 다른 바람직한 실시양태에서, ADH2 단백질을 코딩하는 폴리뉴클레오티드의 발현은 구성적 프로모터에 의해 유도되고 POI를 코딩하는 폴리뉴클레오티드의 발현은 유도성 프로모터에 의해 유도된다. 또 다른 바람직한 실시양태에서, ADH2 단백질을 코딩하는 폴리뉴클레오티드의 발현은 유도성 프로모터에 의해 유도되고 POI를 코딩하는 폴리뉴클레오티드의 발현은 구성적 프로모터에 의해 유도된다.

구체적으로, 메탄올-유도성 프로모터는 본원에 추가로 기재된 바와 같이 ADH2를 코딩하는 유전자를 과발현 및/또는 GOI를 발현하는 데 사용되는 발현 작제물에 사용될 수 있다.

예로서, ADH2 단백질을 코딩하는 폴리뉴클레오티드의 발현은 구성적 GAP 프로모터에 의해 구동될 수 있고 POI를 코딩하는 폴리뉴클레오티드의 발현은 메탄올-유도성 AOX1 또는 AOX2 프로모터에 의해 구동될 수 있다.

한 실시양태에서, ADH2 단백질 및 POI를 코딩하는 폴리뉴클레오티드의 발현은 프로모터 활성(예를 들어, 프로모터 강도) 및/또는 발현 거동(예를 들어, 유도성 또는 구성적) 측면에서 동일한 프로모터 또는 동일한 유형의 프로모터에 의해 구동된다.

본원에서 "과소발현(underexpression)"으로도 지칭되는 용어 "발현 감소(reduce expression)"는 참조 표준에 의해 나타나는 표현된 양 또는 수준(예: 활성 또는 농도) 미만인 임의의 양 또는 수준(예: 활성 또는 농도)을 지칭하며, 특정 폴리뉴클레오타이드의 발현을 감소시키기 위한 유전적 변경 이전의 숙주 세포일 수 있거나, 또는 상기 폴리뉴클레오타이드의 발현을 낮추도록 조작되지 않은 동일한 유형 또는 종의 숙주 세포에서 발현되는 숙주 세포일 수 있다. 본원에 기재된 바와 같은 발현의 감소는 구체적으로 정의된 AOX1 단백질 또는 AOX2 단백질, 특히 조작 전에 숙주 세포에 내인성인 유전자를 코딩하는 폴리뉴클레오티드 또는 유전자를 지칭한다. 특히, 각각의 유전자 생성물은 본원에 기재된 바와 같이 정의된 AOX1 단백질 또는 AOX2 단백질이다. 상기 유전자의 발현을 감소시키기 위해 유전자 변형에 의해 숙주 세포를 조작할 때, 상기 유전자 생성물 또는 폴리펩타이드의 발현은 숙주 세포의 유전적 변형 이전 또는 유전적으로 변형되지 않은 비교 가능한 숙주에서 동일한 유전자 생성물 또는 폴리펩타이드의 발현보다 낮은 수준이다. "미만(less than)"은 예를 들어 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80, 90% 또는 그 이상을 포함한다. 유전자 산물 또는 폴리펩타이드의 어떠한 발현도 "발현 감소(reduction of expression)" 또는 "과소발현(underexpression)"이라는 용어에 포함되지 않는다.

본원에 기재된 특정 실시양태에 따르면, 숙주 세포는 AOX1 단백질 또는 AOX2 단백질을 코딩하는 내인성 숙주 세포 유전자(예를 들어, 야생형 P. pastoris에서 자연적으로 발생하는 서열의 상동체 또는 이종상동체), 또는 상기 AOX1 단백질 또는 AOX2 단백질을 발현하거나 생산하는 숙주 세포의 능력을 부여하는 다른 (암호화 또는 비암호화) 뉴클레오티드 서열을 녹다운하거나 녹아웃(유전자 또는 그 부분의 불활성화 또는 결실을 위함)하여 조작된다.

구체적으로, 뉴클레오티드 서열이 파괴된 결실 균주가 제공된다.

본원에 사용된 용어 "파괴(disrupt)"는 예를 들어 녹다운 또는 녹아웃에 의해 숙주 세포에서 하나 이상의 내인성 단백질의 발현 또는 활성을 완전히 제거하기 위한 상당한 감소를 지칭한다. 이는 내인성 단백질의 총 함량이 역치 미만이거나 검출 불가능할 수 있는 질량 분광법과 같은 숙주 세포의 세포 배양물 또는 배양 배지에서 이러한 하나 이상의 내인성 단백질의 존재로서 측정될 수 있다. 또는 내인성 단백질의 효소 활성으로 측정할 수 있다.

"파괴된(disrupted)"이라는 용어는 구체적으로 유전자 침묵, 유전자 녹다운, 유전자 녹아웃, 우성 음성 작제물의 전달, 조건부 유전자 녹아웃 및/또는 특정 유전자에 대한 유전자 변형으로 이루어진 군으로부터 선택된 적어도 하나의 단계에 의한 유전 공학의 결과를 지칭한다.

본원에 사용된 유전자 발현의 맥락에서 용어 "녹-다운(knock-down)", "감소(reduction)" 또는 "결실(deletion)"은 대조군 세포에서의 발현과 비교하여 주어진 유전자의 감소된 발현을 유도하는 실험적 접근법을 지칭한다. 유전자의 녹다운은 핵산 분자를 세포에 도입하여 분해를 유도하는 유전자 mRNA의 일부(예: shRNA, RNAi, miRNA) 또는 감소된 전사, 감소된 mRNA 안정성, 감소된 mRNA 번역 또는 인코딩된 단백질의 감소된 활성을 유도하는 방식으로 유전자 서열 변경과 같은 다양한 실험 수단을 통해 달성할 수 있다.

주어진 유전자의 발현이 완전히 억제되는 것을 "녹아웃(knockout)"이라고 한니다. 유전자의 녹아웃은 기능적 전사체가 상기 유전자로부터 합성되지 않아 이 유전자에 의해 정상적으로 제공되는 기능의 손실을 초래함을 의미한다. 유전자 녹아웃은 유전자 또는 그 조절 서열, 또는 그러한 유전자 또는 조절 서열의 일부를 파괴 또는 결실시키는 DNA 서열을 변경함으로써 달성된다. 녹아웃 기술에는 상동 재조합 기술을 사용하여 중요한 부분 또는 전체 유전자 서열을 대체, 중단 또는 삭제하거나 아연 핑거 또는 메가 뉴클레아제와 같은 DNA 변형 효소를 사용하여 예를 들어, Gaj 등. (Trends Biotechnol. 2013;31(7):397-405)에 기술된 바와 같이 표적 유전자의 DNA에 이중 가닥 파손을 도입하는 것이 포함된다.

특정 구체예는 숙주 세포로 형질전환되거나 형질감염되는 하나 이상의 녹아웃 플라스미드 또는 카세트를 사용한다. 상동 재조합에 의해 숙주 세포의 표적 유전자가 파괴될 수 있다. 이 절차는 일반적으로 대상 유전자의 모든 대립 유전자가 안정적으로 제거될 때까지 반복된다.

본원에 기술된 바와 같은 특정 유전자를 녹아웃시키는 하나의 특정 방법은 예를 들어, Weninger 등. (J. Biotechnol. 2016, 235:139-49)에 기술된 바와 같이 CRISPR-Cas9 방법이다. 또 다른 방법은 예를 들어 Heiss et al. 2013 (Appl Microbiol Biotechnol. 97(3):1241-9.)에 기술된 바와 같이 분할 마커 접근을 포함한다.

또 다른 구체예는 작은 간섭 RNA(siRNA)를 사용하여 숙주 세포를 형질감염시키고 상기 숙주 세포에 의해 내인적으로 발현된 표적 단백질을 인코딩하는 mRNA를 표적화함으로써 표적 mRNA 분해를 지칭한다.

유전자의 발현은 DNA 전사의 억제 또는 감소, 예를 들어 프로모터-관련 억제자의 사용, 주어진 프로모터의 부위 특이적인 돌연변이, 프로모터 교환, 또는 예를 들어 RNAi 또는 비-코딩 RNA 유도된 전사후 유전자 침묵에 의한 번역의 억제 또는 감소를 포함하지만 이에 국한되지 않는 유전자 발현을 직접적으로 방해하는 방법에 의해 억제되거나 감소될 수 있다. 감소된 활성을 갖는 기능장애 또는 불활성 유전자 생성물의 발현은, 예를 들어, 코딩 유전자 내의 부위 특이적 또는 무작위 돌연변이유발, 삽입 또는 결실에 의해 달성될 수 있다.

유전자 생성물의 활성의 억제 또는 감소는 예를 들어 단백질 발현 전 또는 단백질 발현과 동시에 각각의 효소에 대한 억제제의 투여 또는 그와 함께 인큐베이션함으로써 달성될 수 있다. 이러한 억제제의 예는 억제 펩티드, 항체, 압타머, 융합 단백질 또는 상기 효소에 대한 항체 모방체, 또는 그의 리간드 또는 수용체, 또는 억제 펩티드 또는 핵산, 또는 유사한 결합 활성을 갖는 작은 분자를 포함한다.

유전자 침묵, 유전자 녹다운 및 유전자 녹아웃은 유전자 변형을 통해 또는 mRNA 전사체 또는 유전자에 상보적인 서열을 갖는 올리고뉴클레오티드로 처리하여 유전자의 발현을 감소시키는 기술을 의미한다. DNA의 유전자 변형이 완료되면 결과는 녹다운 또는 녹아웃 유기체이다. 올리고뉴클레오티드가 mRNA에 결합하거나 일시적으로 유전자에 결합하여 유전자 발현의 변화가 발생하는 경우 염색체 DNA의 변형 없이 일시적으로 유전자 발현에 변화가 생기는 현상을 일시적인 녹다운(transient knock-down)이라고 한다.

위의 용어에도 포함되는 일시적인 녹다운에서 활성 유전자 또는 이의 전사체에 대한 이 올리고뉴클레오티드의 결합은 전사 차단(유전자 결합의 경우), mRNA 전사체 분해(예를 들어, 작은 간섭 RNA(siRNA) 또는 안티센스 RNA에 의해) 또는 mRNA 번역 차단을 통해 발현 감소를 유발한다. .

유전자 침묵, 녹다운 또는 녹아웃을 수행하기 위한 다른 접근법은 각각의 문헌으로부터 당업자에게 공지되어 있으며, 본 발명의 맥락에서 이들의 적용은 일상적인 것으로 간주된다. 유전자 녹아웃은 유전자의 발현이 완전히 차단되는 기술을 의미한다. 즉, 해당 유전자가 작동하지 않거나 심지어 제거된다. 이 목표를 달성하기 위한 방법론적 접근은 다양하고 당업자에게 알려져 있다. 예는 주어진 유전자에 대해 우세하게 음성인 돌연변이체의 생산이다. 이러한 돌연변이는 부위 지정 돌연변이유발(예: 결실, 부분 결실, 삽입 또는 핵산 치환), 적합한 트랜스포존의 사용, 또는 각각의 문헌으로부터 당업자에게 공지된 다른 접근법에 의해 생성될 수 있으며, 그 적용은 따라서 본 발명의 맥락에서 일상적인 것으로 간주된다. 한 가지 예는 표적 아연 핑거 뉴클레아제를 사용한 녹아웃이다. 각 키트는 Sigma Aldrich에서 "CompoZR 녹아웃 ZFN"으로 제공하고 있다. 또 다른 접근법은 전사 활성화제 유사 효과기 뉴클레아제(Transcription activator-like effector nucleases, TALEN)의 사용을 포함한다.

우성 음성 작제물(dominant negative construct)의 전달은 예를 들어 형질감염에 의한 기능장애 유전자 발현 생성물을 코딩하는 서열의 도입을 포함한다. 상기 코딩 서열은 기능 장애 효소의 유전자 발현이 유전자 발현 생성물의 자연적 발현을 압도하는 방식으로 강력한 프로모터에 기능적으로 결합되어, 차례로 상기 유전자 발현 생성물 각각의 활성의 효과적인 생리학적 결함을 유도한다.

조건부 유전자 녹아웃(conditional gene knockout)은 조직 또는 시간 특정 방식으로 유전자 발현을 차단할 수 있다. 이것은 예를 들어 관심 유전자 주위에 loxP 부위라고 하는 짧은 서열을 도입함으로써 수행된다. 다시 말하지만, 다른 접근법은 각각의 문헌으로부터 당업자에게 알려져 있으며, 본 발명의 맥락에서 이들의 적용은 일상적인 것으로 간주된다.

한 가지 다른 접근법은 기능장애 유전자 산물 또는 감소된 활성을 갖는 유전자 산물로 이어질 수 있는 유전자 변경이다. 이 접근법은 프레임 이동 돌연변이, 넌센스 돌연변이(즉, 조기 정지 코돈의 도입) 또는 전체 유전자 산물을 기능장애로 만들거나 활성 감소를 유발하는 아미노산 치환을 유도하는 돌연변이의 도입을 포함한다. 이러한 유전자 변경은 예를 들어 돌연변이유발(예를 들어, 결실, 부분 결실, 삽입 또는 핵산 치환), 비특이적(무작위) 돌연변이유발 또는 부위 지정 돌연변이유발에 의해 생성될 수 있다. 유전자 침묵, 유전자 녹다운, 유전자 녹아웃, 우성 음성 구성의 전달, 조건부 유전자 녹아웃 및/또는 유전자 변경의 실제 적용을 설명하는 프로토콜은 일반적으로 숙련된 기술자가 사용할 수 있으며 그의 루틴 내에 있다. 따라서, 본 명세서에 제공된 기술적 교시는 유전자 산물의 유전자 발현의 억제 또는 감소, 또는 기능장애 또는 불활성 유전자 산물의 발현, 또는 감소된 활성을 유도하는 모든 생각할 수 있는 방법과 관련하여 전적으로 가능하다.

본원에 기재된 유전자 변형은 J. Sambrook 등., Molecular Cloning: A Laboratory Manual (3rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, New York (2001)에 기술된 바와 같이 해당 기술분야에 알려진 도구, 방법 및 기술로서 채용될 수 있다.

본원에 사용된 용어 "내인성(endogenous)"은 각각의 내인성 유전자의 발현을 감소 및/또는 내인성 단백질의 생산을 감소시키기 위한 변형 전에 야생형(천연) 숙주 세포에 존재하는 분자 및 서열, 특히 내인성 유전자 또는 단백질을 포함하는 것을 의미한다. 특히, 자연에서 발견되는 특정 숙주 세포에서 발생하는(및 얻을 수 있는) 내인성 핵산 분자(예: 유전자) 또는 단백질은 "숙주 세포 내인성(host cell endogenous)" 또는 "숙주 세포에 대한 내인성(endogenous to the host cell)"인 것으로 이해된다. 더욱이, 핵산 또는 단백질을 "내인적으로 발현하는(endogenously expressing)" 세포는 자연에서 발견되는 것과 동일한 특정 유형의 숙주가 하는 것처럼 핵산 또는 단백질을 발현한다. 더욱이, 핵산, 단백질, 또는 다른 화합물을 "내인적으로 생성(endogenously producing)"하거나 "내인적으로 생성(endogenously produces)"하는 숙주 세포는 자연에서 발견되는 것과 동일한 특정 유형의 숙주 세포가 하는 것과 같이 핵산, 단백질 또는 화합물을 생성한다.

따라서, 내인성 단백질이 숙주 세포의 녹아웃 돌연변이체와 같이 숙주 세포에 의해 더 이상 생산되지 않는 경우에도, 단백질 코딩 유전자가 불활성화되거나 결실된 경우에도, 단백질은 본원에서 여전히 "내인성(endogenous)"으로 지칭된다.

뉴클레오타이드 서열, 발현 카세트, 아미노산 서열 또는 단백질과 같은 구축물과 관련하여 본원에 사용된 용어 "이종성(heterologous)"은 주어진 숙주 세포에 대해 외래인 화합물, 즉 "외인성(exogenous)", 상기 숙주 세포에서 자연에서 발견되지 않는 것; 또는 주어진 숙주 세포에서 자연적으로 발견되는, 예를 들어 "내인성(endogenous"으로 지칭되지만, 이종 구성의 맥락에서 또는 이러한 이종 구성에 통합된, 예를 들어, 내인성 핵산과 융합되거나 결합된 이종 핵산을 사용하므로, 구성물을 이종으로 만든다. 내인성으로 발견되는 이종 뉴클레오티드 서열은 또한 세포에서 비천연, 예를 들어 예상보다 많거나 자연적으로 발견된 것보다 많은 양으로 생성될 수 있다. 이종 뉴클레오타이드 서열, 또는 이종 뉴클레오타이드 서열을 포함하는 핵산은 내인성 뉴클레오타이드 서열과 서열이 다를 수 있지만 내인성에서 발견되는 것과 동일한 단백질을 암호화한다. 구체적으로, 이종 뉴클레오티드 서열은 자연에서 숙주 세포와 동일한 관계에서 발견되지 않는 것이다. 임의의 재조합 또는 인공 뉴클레오티드 서열은 이종성인 것으로 이해된다. 이종성 폴리뉴클레오타이드의 예는 예를 들어 하이브리드 프로모터를 얻기 위해 프로모터와 천연적으로 연관되지 않은 뉴클레오타이드 서열이거나, 본 명세서에 기술된 바와 같이 암호화 서열에 작동가능하게 연결된 뉴클레오타이드 서열이다. 그 결과, 하이브리드 또는 키메라 폴리뉴클레오티드가 얻어질 수 있다. 이종 화합물의 추가 예는 전사 조절 요소, 예를 들어 프로모터에 작동 가능하게 연결된 폴리뉴클레오티드를 코딩하는 POI이며, 여기에는 내인성, 자연 발생 POI 코딩 서열이 정상적으로 작동 가능하게 연결되어 있지 않다.

본원에 사용된 용어 "작동가능하게 연결된(operably linked)"은 하나 이상의 뉴클레오티드 서열의 기능이 상기 핵산 분자 상에 존재하는 적어도 하나의 다른 뉴클레오티드 서열. 작동 가능하게 연결함으로써, 핵산 서열은 동일한 핵산 분자 상의 다른 핵산 서열과 기능적 관계에 놓이게 된다. 예를 들어, 프로모터는 코딩 서열의 발현에 영향을 미칠 수 있는 경우, 재조합 유전자의 코딩 서열과 작동가능하게 연결된다. 추가 예로서, 신호 펩티드를 코딩하는 핵산은 성숙 단백질 또는 성숙 단백질의 프리폼과 같은 분비된 형태의 단백질을 발현할 수 있는 경우 POI를 코딩하는 핵산 서열에 작동가능하게 연결된다. 구체적으로, 서로 작동가능하게 연결된 이러한 핵산은 즉, 신호 펩티드를 코딩하는 핵산과 POI를 코딩하는 핵산 서열 사이에 추가 요소 또는 핵산 서열 없이 즉시 연결될 수 있다.

본원에 사용된 용어 "메틸영양성 효모(methylotrophic yeast)"는 성장을 위한 유일한 탄소원으로서 메탄올을 사용할 수 있게 하는 공통 대사 경로를 공유하는 효모 속 및 종을 지칭한다. 메탄올 유도에 대한 전사 조절 반응에서 몇몇 효소는 높은 수준에서 빠르게 합성된다. 이들 유전자의 발현을 조절하는 프로모터는 가장 강력하고 가장 엄격하게 조절되는 효모 프로모터 중 하나이기 때문에, 메틸영양 효모는 재조합 단백질의 대규모 생산을 위한 숙주로서 매력적이다.

본원에 기재된 바와 같은 메틸영양성 효모는 특히 내인성 AOX1 및 AOX2 단백질을 각각 코딩하는 유전자 중 하나 또는 둘 모두를 과소발현함으로써 메탄올 이용 경로가 결핍되게 하는 하나 이상의 유전적 변형에 의해 돌연변이된다. AOX1 단백질을 코딩하는 유전자 및 AOX2 단백질을 코딩하는 유전자 둘 다를 발현하지 않거나 발현이 결핍된 메틸영양 효모는 본원에서 "Mut-"로 이해된다. 본원에 기술된 목적을 위해, 이러한 Mut- 효모는 이러한 유전자 변형(들) 이전에 기능적 메탄올 이용 경로를 포함하기 때문에 여전히 "메틸영양성 효모(methylotrophic yeast)"로 지칭된다.

"프로모터(promoter)" 서열은 일반적으로 프로모터가 코딩 서열의 전사를 제어하는 경우 코딩 서열에 작동가능하게 연결된 것으로 이해된다. 프로모터 서열이 코딩 서열과 본래 연관되어 있지 않은 경우, 그의 전사는 천연(야생형) 세포에서 프로모터에 의해 제어되지 않거나 서열이 상이한 인접 서열과 재조합된다.

본원에 기재된 목적을 위해 사용되는 프로모터는 본원에서 "ECP"로 지칭된다. ECP는 구성적, 유도성 또는 억제성 프로모터일 수 있습니다. 특정 실시양태에서, ECP는 각각 메탄올 및 메탄올 탄소원에 의해 유도될 수 있는 촉진제이다.

본 명세서에 기재된 바와 같은 ECP는 특히 POI 코딩 DNA의 발현을 개시, 조절 또는 달리 매개하거나 조절한다. 프로모터 DNA 및 코딩 DNA는 동일한 유전자 또는 상이한 유전자로부터 유래할 수 있고, 동일하거나 상이한 유기체로부터 유래할 수 있다.

본원에 기재된 유도성 ECP는 억제 및 유도된 상태에서 상이한 프로모터 강도를 갖는 조절가능한 프로모터인 것으로 구체적으로 이해된다. 본원에 기술된 프로모터와 같은 유도성 또는 억제성 조절 요소와 관련하여 "조절 가능한(regulatable)"이라는 용어는 과량의 물질(예를 들어, 세포 배양 배지) 예를 들어 회분식 배양의 성장 단계에서 및 예를 들어 생산 단계에서(예: 보충 기질을 공급할 때 또는 메탄올 유도를 위해 메탄올을 첨가할 때) 강력한 활성을 유도하기 위해 억제를 해제한다. 유가식 전략으로. 조절 요소는 세포 배양 첨가제의 첨가 없이 요소가 비활성화되고 이러한 첨가제의 존재 하에 활성화되도록 조절 가능하도록 설계될 수도 있습니다. 따라서, 이러한 조절 요소의 제어하에 있는 POI의 발현은 이러한 첨가제의 첨가에 의해 유도될 수 있다.

ECP의 강도는 특히 높거나 낮은 빈도로 해당 프로모터에서 발생하는 전사 개시의 효율성으로 표시되는 전사 강도를 나타냅니다. 전사 강도가 높을수록 해당 프로모터에서 더 자주 전사가 발생합니다. 프로모터 강도는 주어진 mRNA 서열이 얼마나 자주 전사되는지를 결정하여 다른 유전자보다 일부 유전자에 더 높은 전사 우선순위를 효과적으로 부여하여 전사물의 더 높은 농도로 이어지기 때문에 프로모터의 전형적인 특징이다. 예를 들어, 대량으로 필요한 단백질을 코딩하는 유전자는 일반적으로 비교적 강력한 프로모터를 가지고 있다. RNA 중합효소는 한 번에 하나의 전사 작업만 수행할 수 있으므로 효율성을 위해 작업의 우선 순위를 지정해야 한다. 프로모터 강도의 차이는 이 우선순위를 허용하도록 선택된다.

강한 ECP, 특히 완전히 유도된 상태에서 비교적 강한 ECP가 바람직하며, 이는 일반적으로 거의 최대 활성 상태로 이해된다. 상대 강도는 일반적으로 표준 프로모터, 예를 들어 숙주 세포로 사용되는 세포의 각각의 pGAP 프로모터일 수 있는 비교 프로모터(본원에서 참조 프로모터로 지칭됨)와 관련하여 결정된다.

전사의 빈도는 일반적으로 전사 속도로 이해된다. 적절한 분석에서 전사체의 양에 의해 결정된다. RT-PCR 또는 노던 블로팅. 예를 들어, 본 발명에 따른 프로모터의 전사 강도는 P. pastoris인 숙주 세포에서 결정되고 P. pastoris의 천연 pGAP 프로모터와 비교된다.

관심 유전자를 발현하는 프로모터의 강도는 일반적으로 발현 강도 또는 높은 발현 수준/속도를 지원하는 능력으로 이해된다. 예를 들어, 본 발명의 프로모터의 발현 및/또는 전사 강도는 P. pastoris인 숙주 세포에서 결정되고 P. pastoris의 천연 pGAP 프로모터와 비교된다.

참조 프로모터와 비교한 비교 전사 강도는 마이크로어레이를 사용하는 것과 같이 전사체의 양을 측정하는 표준 방법에 의해, 또는 재조합 세포에서 각각의 유전자 발현 산물의 양을 측정하는 것과 같은 세포 배양에서 결정될 수 있다. 특히, 전사 속도는 마이크로어레이의 전사 강도, 노던 블롯 또는 정량적 실시간 PCR(qRT-PCR) 또는 데이터가 높은 성장률 및 낮은 성장률의 조건, 또는 다른 배지 조성을 사용하는 조건 및 참조 프로모터와 비교하여 높은 신호 강도 조건 사이의 발현 수준의 차이를 나타내는 RNA 시퀀싱(RNA-seq)에 의해 결정될 수 있다.

발현율은 예를 들어 eGFP와 같은 리포터 유전자의 발현량에 의해 결정될 수 있다.

본원에 기재된 바와 같은 ECP는 예를 들어 "상동 pGAP 프로모터(homologous pGAP promoter)"라고도 하는 숙주 세포의 천연 pGAP 프로모터와 비교하여 적어도 15%의 전사율 또는 전사 강도에 의해 반영되는 비교적 높은 전사 강도를 발휘한다. 바람직하게는 전사율 또는 강도는 POI를 생성하기 위한 재조합 목적을 위한 숙주 세포로 선택된 (예를 들어, 진핵생물) 숙주 세포에서 결정된 것과 같은 천연 pGAP 프로모터와 비교하여 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 또는 100% 중 적어도 어느 하나, 예컨대 110%, 120%, 130%, 140%, 150%, 160%, 170%, 180%, 190%, 또는 200%, 또는 그 이상 중 적어도 어느 하나이다.

천연 pGAP 프로모터는 일반적으로 대부분의 살아있는 유기체에 존재하는 구성적 프로모터인 글리세르알데히드-3-포스페이트 탈수소효소(GAPDH)를 코딩하는 갭 유전자의 발현을 개시한다. 해당과정과 포도당신생합성의 핵심 효소인 GAPDH(EC 1.2.1.12)는 이화 및 동화 탄수화물 대사에서 중요한 역할을 한다.

천연 pGAP 프로모터는 비변형(비재조합) 또는 재조합 진핵 세포를 포함하는 동일한 종 또는 균주의 천연 진핵 세포에서와 유사한 방식으로 재조합 진핵 세포에서 특이적으로 활성이다. 이러한 천연 pGAP 프로모터는 일반적으로 내인성 프로모터로 이해되어 숙주 세포와 상동성이고, 비교 목적을 위한 표준 또는 참조 프로모터로 작용할 수 있다. 본원에 기재된 프로모터의 상대적인 발현 또는 전사 강도는 일반적으로 POI를 생성하기 위한 숙주로서 사용되는 동일한 종 또는 균주의 세포의 천연 pGAP 프로모터와 비교된다.

본원에 사용된 용어 "돌연변이유발(mutagenesis)"은 뉴클레오티드 서열의 돌연변이체를 제공하는 방법, 예를 들어, 뉴클레오티드 서열을 지칭할 것이다. 하나 이상의 뉴클레오티드의 삽입, 결실 및/또는 치환을 통해 비-코딩 또는 코딩 영역에서 적어도 하나의 변화를 갖는 그의 변이체를 수득한다. 돌연변이유발은 무작위, 반무작위 또는 부위 지정 돌연변이를 통해 이루어질 수 있다. 변이체는 모 서열을 참조로 사용하여 적합한 돌연변이유발 방법에 의해 생성될 수 있다. 특정 돌연변이유발 방법은 핵산을 조작하거나 각각의 모 서열 정보를 주형으로 사용하여 뉴클레오타이드 서열을 새로 합성하는 방법을 포함한다. 특정 돌연변이 유발 방법은 돌연변이의 합리적인 조작을 적용한다.

본 명세서에서 용어 "뉴클레오티드 서열(nucleotide sequence)" 또는 "핵산 서열(nucleic acid sequence)"은 DNA 또는 RNA를 지칭한다. "핵산 서열(nucleic acid sequence)" 또는 "폴리뉴클레오타이드 서열(polynucleotide sequence)" 또는 간단히 "폴리뉴클레오타이드(polynucleotide)"는 5' 말단에서 3' 말단으로 판독되는 데옥시리보뉴클레오타이드 또는 리보뉴클레오타이드 염기의 단일 또는 이중 가닥 중합체를 지칭한다. 여기에는 발현 카세트, 자가 복제 플라스미드, DNA 또는 RNA의 감염성 중합체, 비기능성 DNA 또는 RNA가 포함된다.

본원에 사용된 용어 "관심 단백질(protein of interest, POI)"은 숙주 세포에서 재조합 기술에 의해 생성된 폴리펩티드 또는 단백질을 지칭한다. 보다 구체적으로, 단백질은 숙주 세포에서 자연적으로 발생하지 않는 폴리펩티드, 즉 이종성 단백질일 수 있거나, 그렇지 않으면 숙주 세포에 고유할 수 있고, 즉 숙주 세포에 대해 상동성 단백질일 수 있지만, 예를 들어, POI를 인코딩하는 핵산 서열을 함유하는 자가-복제 벡터로 형질전환함으로써, 또는 POI를 인코딩하는 핵산 서열의 하나 이상의 카피의 재조합 기술에 의해 숙주 세포의 게놈으로 통합되거나, 또는 하나의 재조합 변형에 의해 예를 들어, 프로모터 서열의 POI를 코딩하는 유전자의 발현을 제어하는 또는 그 이상의 조절 서열. 일부 경우에 본원에 사용된 용어 POI는 또한 재조합적으로 발현된 단백질에 의해 매개되는 숙주 세포에 의한 임의의 대사 산물을 지칭한다.

모 뉴클레오티드 또는 아미노산 서열과 비교하여 변이체, 상동체 또는 이종상동체의 "서열 동일성(sequence identity)"이라는 용어는 2개 이상의 서열의 동일성 정도를 나타낸다. 2개 이상의 아미노산 서열은 상응하는 위치에서 동일하거나 보존된 아미노산 잔기를 어느 정도, 최대 100%까지 가질 수 있다. 2개 이상의 뉴클레오티드 서열은 상응하는 위치에서 동일하거나 보존된 염기쌍을 어느 정도, 최대 100%까지 가질 수 있다.

서열 유사성 검색은 과량(예: 최소 50%) 서열 동일성을 갖는 상동체를 식별하기 위한 효과적이고 신뢰할 수 있는 전략이다. 자주 사용되는 서열 유사성 검색 도구는 예를 들어 BLAST, FASTA 및 HMMER이다.

서열 유사성 검색은 초과 유사성 및 공통 조상을 반영하는 통계적으로 유의한 유사성을 검출함으로써 상동 단백질 또는 유전자를 식별할 수 있다. 상동체는 본 명세서에서 상이한 유기체에서 동일한 단백질, 예를 들어 상이한 상이한 유기체 또는 종에서 이러한 단백질의 변이체로 이해되는 이종상동체를 포함할 수 있다.

상이한 유기체 또는 종에서 동일한 단백질의 이종상동성 서열은 전형적으로 단백질 서열, 구체적으로 동일한 속에서 유래하는 이종상동체의 상동성이다. 전형적으로, 오르토로그는 적어도 약 25%, 30%, 35%, 40%, 50%, 60%, 70%, 80%, 85%, 90% 또는 95% 동일성, 최대 100% 서열 동일성 중 어느 하나를 갖는다.

구체적으로, 단백질의 이종상동체는 상기 단백질 또는 상기 단백질을 코딩하는 유전자가 녹아웃 숙주 세포에서 이종상동성 서열에 의해 대체될 때 결정될 수 있으며, 이러한 대체 전에 숙주 세포는 각각의 유전자 또는 단백질을 녹아웃시키도록 변형된다.

예를 들어, 추정 ADH2, AOX1 또는 AOX2 단백질이 이러한 내인성 단백질을 코딩하는 유전자가 녹아웃된 P. pastoris 숙주 세포에서 각각의 내인성 단백질을 대체하는 P. pastoris 숙주 세포에서 기능적이라면, 그러한 추정 ADH2, AOX1 또는 AOX2 단백질은 본 명세서에 기재된 목적을 위한 각각의 상동체로 간주될 수 있다.

서열번호 1로 확인된 아미노산 서열을 포함하거나 이로 구성된 AOX1 단백질은 K. phaffii 기원의 것이다. 다른 메틸영양성 효모 숙주 세포에 상동 서열이 존재한다는 것은 잘 이해된다. 예를 들어, Pichia pastoris의 효모는 각각의 상동 서열을 포함한다. Pichia pastoris는 Komagataella라는 새로운 속으로 재분류되어 K. pastoris, K. phaffii 및 K. pseudopastoris의 3종으로 나뉜다.

서열번호 1의 특이적 상동성 서열은 예를 들어 K. pastoris (예를 들어, 서열번호 9, 예를 들어 서열번호 10을 포함하거나 이로 구성된 뉴클레오티드 서열에 의해 암호화되는), Ogataea polymorpha (예를 들어, 서열번호 20을 포함하거나 이로 구성된 뉴클레오티드 서열에 의해 코딩되는 것과 같은 서열번호 19) 또는 Ogataea methanolica (예를 들어, 서열번호 14를 포함하거나 이로 이루어진 뉴클레오티드 서열에 의해 코딩되는 것과 같은 서열번호 13)에서 발견되었다.

서열번호 3으로 확인된 아미노산 서열을 포함하거나 이로 구성된 AOX2 단백질은 K. phaffii 기원의 것이다. 다른 메틸영양성 효모 숙주 세포에 상동 서열이 존재한다는 것은 잘 이해된다. 예를 들어, Pichia pastoris의 효모는 각각의 상동 서열을 포함한다. Pichia pastoris는 Komagataella라는 새로운 속으로 재분류되어 K. pastoris, K. phaffii 및 K. pseudopastoris의 3종으로 나뉜다.

서열번호 3의 특이적 상동성 서열은 예를 들어, K. pastoris (예를 들어, 서열번호 11, 예를 들어 서열번호 12를 포함하거나 이로 이루어진 뉴클레오티드 서열에 의해 암호화되는), Ogataea polymorpha (예를 들어, 서열번호 20을 포함하거나 이로 구성된 뉴클레오티드 서열에 의해 코딩되는 것과 같은 서열번호 19), 또는 gataea methanolica (예를 들어, 서열번호 16을 포함하거나 이로 이루어진 뉴클레오티드 서열에 의해 코딩되는 것과 같은 서열번호 15)에서 발견되었다.

Ogataea polymorpha는 본 명세서에서 서열번호 19로 예시된 단 하나의 알코올 산화효소를 갖는다. 따라서, 본 명세서에 기재된 바와 같은 Ogataea polymorpha에서 AOX1 및 AOX2의 발현 감소는 Ogataea polymorpha의 내인성 알코올 산화효소의 발현을 감소시킴으로써 효과적으로 수행된다.

본원에 기재된 특정 서열 동일성을 갖는 AOX1 또는 AOX2 단백질의 임의의 상동성 서열, 특히 P. pastoris AOX1 또는 AOX2 단백질의 이종상동체인 임의의 그러한 단백질은 여기에 설명된 대로 각각의 AOX1 단백질 또는 AOX2 단백질의 정의에 포함된다.

서열번호 50으로 확인된 아미노산 서열을 포함하거나 이로 구성된 ADH2 단백질은 K. phaffii 기원의 것이다. 다른 메틸영양성 효모 숙주 세포에 상동 서열이 존재한다는 것은 잘 이해된다. 예를 들어, Pichia pastoris의 효모는 각각의 상동 서열을 포함한다. Pichia pastoris는 Komagataella라는 새로운 속으로 재분류되어 K. pastoris, K. phaffii 및 K. pseudopastoris의 3종으로 나뉜다.

서열번호 50의 특이적 상동성 서열은 예를 들어, 서열번호 52, 54, 56, 58, 60, 62, 64, 66, 68, 또는 70 중 어느 하나이다.

본원에 기재된 특정 서열 동일성을 갖는 ADH2 단백질의 임의의 상동성 서열, 특히 본원에 기재된 바와 같은 P. pastoris ADH2 단백질의 이종상동체인 임의의 그러한 단백질을 포함한다.

본원에 기재된 아미노산 서열, 상동체 및 이종상동체에 대한 "아미노산 서열 동일성 백분율(%)"은 특정 폴리펩티드 서열의 아미노산 잔기와 동일한 후보 서열의 아미노산 잔기의 백분율로 정의되며, 필요한 경우 최대 퍼센트 서열 동일성을 달성하기 위해 서열을 정렬하고 갭을 도입한 후, 서열 동일성의 일부로 보존적 치환을 고려하지 않는다. 당업자는 비교되는 서열의 전체 길이에 걸쳐 최대 정렬을 달성하는 데 필요한 임의의 알고리즘을 포함하여 정렬을 측정하기 위한 적절한 매개변수를 결정할 수 있다.

본원에 기재된 목적을 위해, 2개의 아미노산 서열 사이의 서열 동일성은 하기 예시적인 파라미터와 함께 NCBI BLAST 프로그램 버전 BLASTP 2.8.1을 사용하여 결정된다: 프로그램: blastp, 워드 크기: 6, 예상 값: 10, 히트리스트 크기: 100, Gapcosts: 11.1, 매트릭스: BLOSUM62, 필터 문자열: F, 구성 조정: 조건부 구성 점수 매트릭스 조정.

예를 들어, 프로모터 또는 유전자의 뉴클레오티드 서열에 대한 "퍼센트(%) 동일성(percent (%) identity)"은 서열을 정렬한 후 DNA 서열의 뉴클레오티드와 동일한 후보 DNA 서열의 뉴클레오티드의 백분율로 정의된다. 필요한 경우 최대 퍼센트 서열 동일성을 달성하기 위해 간격을 도입하고 서열 동일성의 일부로 보존적 치환을 고려하지 않는다. 퍼센트 뉴클레오티드 서열 동일성을 결정하기 위한 정렬은 예를 들어 공개적으로 이용가능한 컴퓨터 소프트웨어를 사용하여 당업계의 기술 범위 내에 있는 다양한 방식으로 달성될 수 있다. 당업자는 비교되는 서열의 전체 길이에 걸쳐 최대 정렬을 달성하는 데 필요한 임의의 알고리즘을 포함하여 정렬을 측정하기 위한 적절한 매개변수를 결정할 수 있다.

본원에 기재된 목적을 위해(달리 표시되지 않는 한), 2개의 아미노산 서열 사이의 서열 동일성은 하기 예시적인 파라미터와 함께 NCBI BLAST 프로그램 버전 BLASTN 2.8.1을 사용하여 결정된다: 프로그램: blastn, 워드 크기: 11, 예상 역치: 10, 히트 목록 크기: 100, 갭 비용: 5.2, 일치/불일치 점수: 2,-3, 필터 문자열: 복잡성이 낮은 영역, 조회 테이블 전용으로 표시.

POI와 관련하여 본원에 사용된 용어 "분리된(isolated)" 또는 "분리(isolation)"는 자연적으로 결합될 환경, 특히 세포 배양 상청액으로부터 충분히 분리되어 "정제된(purified)" 또는 "실질적으로 순수한(substantially pure)" 형태. 그러나 "분리된(isolated)"은 다른 화합물 또는 물질과의 인공 또는 합성 혼합물의 배제 또는 기본 활성을 방해하지 않는 불순물의 존재를 의미하지 않으며, 예를 들어 불완전한 정제로 인해 존재할 수 있다. 단리된 화합물은 이의 제제를 생성하기 위해 추가로 제형화될 수 있으며, 여전히 실용적인 목적을 위해 단리될 수 있니다. 예를 들어, POI는 진단 또는 치료에 사용될 때 약학적으로 허용되는 담체 또는 부형제와 혼합될 수 있다.

본원에 사용된 용어 "정제된(purified)"은 적어도 50%(mol/mol), 바람직하게는 적어도 60%, 70%, 80%, 90% 또는 95%의 화합물(예: POI)을 포함하는 제제를 의미할 것이다. 순도(purity)는 화합물에 적합한 방법(예: 크로마토그래피 방법, 폴리아크릴아미드 겔 전기영동, HPLC 분석 등)에 의해 측정된다. 본원에 기재된 바와 같은 단리되고 정제된 POI는 세포 배양 상청액을 정제하여 불순물을 감소시킴으로써 수득될 수 있다.

재조합 폴리펩타이드 또는 단백질 생성물을 얻기 위한 단리 및 정제 방법으로서, 염석 및 용매 침전과 같은 용해도의 차이를 이용하는 방법, 한외여과 및 겔 전기영동과 같은 분자량의 차이를 이용하는 방법, 이온 교환 크로마토그래피와 같은 전하, 친화성 크로마토그래피와 같은 비친화성을 이용하는 방법, 역상 고성능 액체 크로마토그래피와 같은 소수성의 차이를 이용하는 방법, 등전점의 차이를 이용하는 방법, 예를 들어 등전점 포커싱이 사용될 수 있다.

다음과 같은 표준 방법이 선호된다: 미세여과 또는 접선 흐름 필터(TFF) 또는 원심분리에 의한 세포(잔해물) 분리 및 세척, 침전 또는 열처리에 의한 POI 정제, 효소 분해에 의한 POI 활성화, 이온 교환과 같은 크로마토그래피에 의한 POI 정제( IEX), 소수성 상호작용 크로마토그래피(HIC), 친화성 크로마토그래피, 크기 배제(SEC) 또는 HPLC 크로마토그래피, 농축의 POI 침전 및 한외여과 단계에 의한 세척.

고도로 정제된 생성물은 본질적으로 오염된 단백질이 없고, 바람직하게는 순도가 90% 이상, 보다 바람직하게는 95% 이상, 또는 심지어 98% 이상, 최대 100%이다. 정제된 생성물은 세포 배양 상청액의 정제 또는 세포 잔해로부터 수득될 수 있다.

분리 및 정제된 POI는 Western blot, HPLC, 활성 분석 또는 ELISA와 같은 기존의 방법으로 식별할 수 있다.

본 명세서에 사용된 용어 "재조합(recombinant)"은 "유전자 공학에 의해 제조되거나 그 결과로 만들어진 것"을 의미한다. 재조합 숙주는 하나 이상의 뉴클레오타이드 또는 뉴클레오타이드 서열을 결실 및/또는 불활성화하도록 조작될 수 있고, 특히 숙주에 대해 외래인 뉴클레오타이드 서열을 사용하는 재조합 핵산 서열을 함유하는 발현 벡터 또는 클로닝 벡터를 포함할 수 있다. 재조합 단백질은 숙주에서 각각의 재조합 핵산을 발현함으로써 생산된다. 본 명세서에 사용된 POI와 관련하여 용어 "재조합(recombinant)"은 POI를 발현하도록 형질전환된 숙주 세포로부터 단리된 POI와 같은 재조합 수단에 의해 제조, 발현, 생성 또는 단리된 POI를 포함한다. 본 발명에 따르면, 당해 분야의 기술 내에서 통상적인 분자 생물학, 미생물학 및 재조합 DNA 기술이 사용될 수 있다. 이러한 기술은 문헌에 완전히 설명되어 있습니다. 예를 들어 Maniatis, Fritsch & Sambrook, "Molecular Cloning: A Laboratory Manual, Cold Spring Harbor, (1982)에서 확인할 수 있다.

특정 재조합 숙주 세포는 유전자 조작, 즉 인간 개입에 의해 조작된 숙주 세포로 이해되는 "조작된(engineered)" 숙주 세포이다. 숙주 세포가 주어진 유전자 또는 각각의 단백질의 발현을 감소시키거나 과소발현하도록 조작될 때, 숙주 세포는 하에 있는 숙주 세포와 비교하여 숙주 세포가 더 이상 각각 그러한 유전자 및 단백질을 발현하는 능력이 없도록 조작된다. 조작 전의 동일한 조건, 또는 상기 유전자 또는 단백질이 과소발현되도록 조작되지 않은 숙주 세포와 비교된다.

전술한 설명은 다음의 실시예를 참조하여 더욱 완전하게 이해될 것이다. 그러나, 이러한 예는 본 발명의 하나 이상의 실시양태를 실시하는 방법을 나타내는 것일 뿐이며 본 발명의 범위를 제한하는 것으로 해석되어서는 안된다.

실시예

실시예 1 : Pichia pastoris 의 메탄올 이용 음성 균주의 생성

메탄올 이용 음성 균주(Mut^-)를 생성하기 위해 AOX1 및 AOX2로 명명된 메탄올 이용을 담당하는 2개의 유전자가 Pichia pastoris (동명 Komagataella phaffii)의 게놈에서 삭제되었다.

a) 이 목적을 위해 Pichia pastoris 균주(CBS2612, CBS-KNAW Fungal Biodiversity Centre, Centraalbureau voor Schimmelcultures, Utrecht, The Netherlands)를 전기 적합성으로 만들었다. 균주를 16-20시간(25℃; 180rpm) 동안 100mL YPD 배지(주 배양)에 접종하고 원심분리(5분, 1500g, 4℃)에 의해 1.8-3의 광학 밀도(OD600)에서 수확하였다. 2개의 50mL 팔콘 튜브에. 세포 펠릿을 10mL YPD + 20mM HEPES + 25mM DTT에 재현탁하고 인큐베이션(30분, 25℃, 180rpm) 하였다. 인큐베이션 기간 후 팔콘 튜브는 40mL 얼음처럼 차가운 멸균 증류수로 채워지고 원심분리하였다(5분, 1500g, 4℃)(Eppendorf AG, Germany). 세포 펠렛을 빙냉 멸균 1mM HEPES 완충액, pH 8에 재현탁시키고 원심분리하였다(5분; 1500g; 4℃). 세포 펠릿을 45mL 얼음처럼 차가운 1M 소르비톨에 재현탁하고 원심분리하였다(5분, 1500g, 4℃). 펠렛을 500μL 얼음처럼 차가운 1M 소르비톨에 재현탁하고 80μL를 얼음처럼 차가운 1.5mL Eppendorf 튜브에 분주하였다. 분취된 전기 컴피턴트 세포는 사용할 때까지 -80℃에서 유지하였다.

b) 효모 균주의 배양은 YPD 배지(10g/L 효모 추출물, 20g/L 펩톤, 20g/L 포도당) 또는 YPD 한천 플레이트(10g/L 효모 추출물, 20g/L 펩톤, 20g/L 포도당, 20g/L agar-agar) 선택에 필요한 경우 500μg/mL Geneticin 또는 200μg/mL Hygromycin 포함하여 수행되었다.

c) AOX1 및 AOX2의 결실 균주를 생성하기 위해 분할 마커 카세트 접근법이 사용되었다(Gasser et al., 2013). 유전자 결실을 생성하기 위한 DNA 단편은 표 1에서 찾을 수 있다. 분할 마커 카세트는 LoxP 부위가 측면에 있는 Geneticin에 대한 항생제 내성 카세트를 운반하고 있었다.

d) 0.5μg AOX1 분할 마커 카세트 1 및 0.5μg AOX1 분할 마커 카세트 2를 분취된 전기 컴피턴트 세포에 추가하여 삭제를 수행하고 얼음에서 5분 동안 인큐베이션하였다. 전기천공은 2kV에서 4밀리초 동안 수행되었다(Gene Pulser, Bio-Rad Laboratories, Inc, USA). 형질전환 후 전기천공된 세포를 1mL YPD 배지에 현탁시키고 열진탕기(Eppendorf AG, Germany)에서 700rpm으로 진탕하는 30℃에서 1.5시간 내지 3시간 동안 재생시켰다. 나중에 20μL 및 150μL의 세포 현탁액을 선택을 위해 500μg/mL Geneticin을 포함하는 YPD 플레이트에 플레이팅하고 28℃에서 48시간 동안 인큐베이션하였다. 나타난 콜로니는 500 μg/mL Geneticin을 포함하는 새로운 YPD 플레이트에 다시 줄무늬가 생겼다. AOX1 유전자좌의 정확한 파괴는 결실 카세트 외부에 결합하는 프라이머 AOX1_ctrl_Fwd 및 AOX1_ctrl_Rev(표 2)를 사용하여 게놈 DNA에 대한 PCR에 의해 확인되었다. 하나의 클론은 P. pastoris aox1△::KanMX 균주를 생성하는 원하는 유전자의 정확한 결실을 확인하는 PCR 증폭 및 PCR 앰플리콘의 시퀀싱을 기반으로 선택되었다. 단일 양성 콜로니로부터 액체 배양물을 인큐베이션하고 본 배양물을 생성하기 위해 액체 배지에 500㎍/mL Geneticin을 첨가한 것을 제외하고 실시예 1a)에 설명된 대로 전기적격으로 만들었다. LoxP 영역과 선택을 위한 하이그로마이신 내성 카세트 사이의 Geneticin 항생제 내성 카세트의 삭제에 필요한 Cre 재조합효소를 운반하는 500 μg pTAC_Cre_Hph_Mx4 플라스미드로 균주를 전기천공했다(Marx, Mattanovich, & Sauer, 2008). 전기천공은 500㎍/mL 제네티신 및 200㎍/mL 하이그로마이신 및 200㎍/mL 하이그로마이신만 있는 YPD 플레이트를 사용하여 YPD에서 형질전환체를 병렬로 재스트리킹함으로써 제네티신 내성 손실에 대해 설명된 대로 수행하고 선택했다. 500 μg/mL Geneticin 및 200 μg/mL Hygromycin이 있는 YPD 플레이트에서는 성장할 수 없지만 200 μg/mL Hygromycin만 있는 YPD 플레이트에서는 성장할 수 있는 클론이 선택되었다. AOX1 코딩 영역 및 항생제 마커의 성공적인 삭제는 프라이머 AOX1_ctrl_Fwd 및 AOX1_ctrl_Rev(표 2)를 사용한 PCR 증폭 및 PCR 앰플리콘(Microsynth AG, Swiss)의 시퀀싱에 의해 확인되었다. 생성된 균주는 P. pastoris CBS2612 △aox1이라고 하며 Mut^S 표현형을 갖는다. 추가 유전자 조작을 위해 선택되었다.

e) P. pastoris CBS2612 △aox1을 사용하여 a)에 설명된 프로토콜로 전기 적격 세포를 생성하고 설명된 절차에 따라 0.5μg AOX2 분할 마커 카세트 1 및 0.5μg AOX2 분할 마커 카세트 2(표 1)로 전기천공했다. d)에서. d)에서 설명한 것과 동일한 절차로 항생제 마커를 제거했다. AOX2 코딩 영역 및 항생제 마커의 성공적인 삭제는 프라이머 AOX2_ctrl_fwd & AOX2_ctrl_rev(표 2)를 사용한 PCR 증폭 및 PCR 앰플리콘(Microsynth AG, Swiss)의 시퀀싱에 의해 확인되었다. 생성된 균주는 P. pastoris CBS2612 △aox1△aox2라고 하며 메탄올 이용 음성(Mut^-) 표현형을 갖는다.

f) PCR 증폭을 위한 게놈 DNA는 제조업체의 권장 사항에 따라 Wizard® Genomic DNA Purification Kit(Promega Corporation, USA)를 사용하여 분리되었다. PCR 증폭 반응은 제조업체의 권장 사항에 따라 Q5 중합효소(New England Biolabs, Inc., USA)로 수행되었다.

DNA fragment	DNA sequence 5' to 3'
AOX1split marker cassette 1	(SEQ ID NO:25) AGGGGTCCAAGTAAGAAGCTTCTTGCTGTAGAATTTGGGCATATGTGCTGGTGACAAAGGCATCTCTGCCTTGAGTTTCTGACGGCGGGACAGCATTCTTACCGGATATATAACACCAATTGCCAGCACCACCAATCTCAGAGGTACCCCTAACAAACTTAATAAAATCTTGGGTATCAACTTCATTAAGCTTTGTAGTTTGCAAGTACTTATAAACAAAATTCCGTAAGGTGTCGTCTTGAGGCTGGGACTTGACAAACTGCCAAAATGGCAACAAATCTACTGGCTTGGCCATAATTTTGACATTCGAGTCATCAAAGGTAAATTCAACCGGAGACTTGTATTCTTTATTGATAACTTTCTCATATAGGACATTGTCAGGAACACGATGAAACCAGGATGCCCCCAAATCCAATGAGACTGAGGTTTCATGAGTCGCAACCAACCTACCTCCAATACGGTCCCTACCCTCTAAAATCAACGCATTCACGCCATTGCTTTTGAGATCGACTGCAGCTTTGATGCCTGAAATCCCAGCGCCTACAATGATGACATTTGGATTTGGTTGACTCATGTTGGTATTGTGAAATAGACGCAGATCGGGAACACTGAAAAATAACAGTTATTATTCGAGATCTAACATCCAAAGACGAAAGGTTGAATGAAACCTTTTTGCCATCCGACATCCACAGGTCCATTCTCACACATAAGTGCCAAACGCAACAGGAGGGGATACACTAGCAGCAGACCGTTGCAAACGCAGGACCTCCACTCCTCTTCTCCTCAACACCCACTTTTGCCATCGAAAAACCAGCCCAGTTATTGGGCTTGATTGGAGCTCGCTCATTCCAATTCCTTCTATTAGGCTACTAACACCATGACTTTATTAGCCTGTCTATCCTGGCCCCCCTGGCGAGGTTCATGTTTGTTTATTTCCGAATGCAACAAGCTCCGCATTACACCCGAACATCACTCCAGATGAGGGCTTTCTGAGTGTGGGGTCAGTACGCTGCAGGTCGACAACCCTTAATATAACTTCGTATAATGTATGCTATACGAAGTTATTAGGTCTAGATCGGTACCGACATGGAGGCCCAGAATACCCTCCTTGACAGTCTTGACGTGCGCAGCTCAGGGGCATGATGTGACTGTCGCCCGTACATTTAGCCCATACATCCCCATGTATAATCATTTGCATCCATACATTTTGATGGCCGCACGGCGCGAAGCAAAAATTACGGCTCCTCGCTGCAGACCTGCGAGCAGGGAAACGCTCCCCTCACAGACGCGTTGAATTGTCCCCACGCCGCGCCCCTGTAGAGAAATATAAAAGGTTAGGATTTGCCACTGAGGTTCTTCTTTCATATACTTCCTTTTAAAATCTTGCTAGGATACAGTTCTCACATCACATCCGAACATAAACAACCATGGGTAAGGAAAAGACTCACGTTTCGAGGCCGCGATTAAATTCCAACATGGATGCTGATTTATATGGGTATAAATGGGCTCGCGATAATGTCGGGCAATCAGGTGCGACAATCTATCGATTGTATGGGAAGCCCGATGCGCCAGAGTTGTTTCTGAAACATGGCAAAGGTAGCGTTGCCAATGATGTTACAGATGAGATGGTCAGACTAAACTGGCTGACGGAATTTATGCCTCTTCCGACCATCAAGCATTTTATCCGTACTCCTGATGATGCATGGTTACTCACCACTGCGATCCCCGGCAAAACAGCATTCCAGGTATTAGAAGAATATCCTGATTCAGGTGAAAATATTGTTGATGCGCTGGCAGTGTTCCTGCGCCGGTTGCATTCGATTCCTGTTTGTAATTGTCCTTTTAACAGCGATCGCGTATTTCGTCTCGCTCAGGCGCAATCACGAATGAATAACGGTTTGGTTGATGCGAGTGATTTTGATGACGAGCGTAATGGCTGGCCTGTTGAACAAGTCTGGAAAGAAATGCATAAGCTTTTGCCATTCTCACCG
AOX1split marker cassette 2	(SEQ ID NO:26) AAGCCCGATGCGCCAGAGTTGTTTCTGAAACATGGCAAAGGTAGCGTTGCCAATGATGTTACAGATGAGATGGTCAGACTAAACTGGCTGACGGAATTTATGCCTCTTCCGACCATCAAGCATTTTATCCGTACTCCTGATGATGCATGGTTACTCACCACTGCGATCCCCGGCAAAACAGCATTCCAGGTATTAGAAGAATATCCTGATTCAGGTGAAAATATTGTTGATGCGCTGGCAGTGTTCCTGCGCCGGTTGCATTCGATTCCTGTTTGTAATTGTCCTTTTAACAGCGATCGCGTATTTCGTCTCGCTCAGGCGCAATCACGAATGAATAACGGTTTGGTTGATGCGAGTGATTTTGATGACGAGCGTAATGGCTGGCCTGTTGAACAAGTCTGGAAAGAAATGCATAAGCTTTTGCCATTCTCACCGGATTCAGTCGTCACTCATGGTGATTTCTCACTTGATAACCTTATTTTTGACGAGGGGAAATTAATAGGTTGTATTGATGTTGGACGAGTCGGAATCGCAGACCGATACCAGGATCTTGCCATCCTATGGAACTGCCTCGGTGAGTTTTCTCCTTCATTACAGAAACGGCTTTTTCAAAAATATGGTATTGATAATCCTGATATGAATAAATTGCAGTTTCATTTGATGCTCGATGAGTTTTTCTAATCAGTACTGACAATAAAAAGATTCTTGTTTTCAAGAACTTGTCATTTGTATAGTTTTTTTATATTGTAGTTGTTCTATTTTAATCAAATGTTAGCGTGATTTATATTTTTTTTCGCCTCGACATCATCTGCCCAGATGCGAAGTTAAGTGCGCAGAAAGTAATATCATGCGTCAATCGTATGTGAATGCTGGTCGCTATACTGGTACCATTCGAGAACCCTTAATATAACTTCGTATAATGTATGCTATACGAAGTTATTAGGTGATATCAGATCCACTGCCATTTGCCTGAGAGATGCAGGCTTCATTTTTGATACTTTTTTATTTGTAACCTATATAGTATAGGATTTTTTTTGTCATTTTGTTTCTTCTCGTACGAGCTTGCTCCTGATCAGCCTATCTCGCAGCTGATGAATATCTTGTGGTAGGGGTTTGGGAAAATCATTCGAGTTTGATGTTTTTCTTGGTATTTCCCACTCCTCTTCAGAGTACAGAAGATTAAGTGAGACGTTCGTTTGTGCAAGCTTCAACGATGCCAAAAGGGTATAATAAGCGTCATTTGCAGCATTGTGAAGAAAACTATGTGGCAAGCCAAGCCTGCGAAGAATGTATTTTAAGTTTGACTTTGATGTATTCACTTGATTAAGCCATAATTCTCGAGTATCTATGATTGGAAGTATGGGAATGGTGATACCCGCATTCTTCAGTGTCTTGAGGTCTCCTATCAGATTATGCCCAACTAAAGCAACCGGAGGAGGAGATTTCATGGTAAATTTCTCTGACTTTTGGTCATCAGTAGACTCGAACTGTGAGACTATCTCGGTTATGACAGCAGAAATGTCCTTCTTGGAGACAGTAAATGAAGTCCCACCAATAAAGAAATCCTTGTTATCAGGAACAAACTTCTTGTTTCGAACTTTTTCGGTGCCTTGAACTATAAAATGTAGAGTGGATATGTCGGGTAGGAATGGAGCGGGCAAATGCTTACCTTCTGGACCTTCAAGAGGTATGTAGGGTTTGTAGATACTGATGCCAACTTCAGTGACAACGTTGCTATTTCGTTCAAACCATTCCGAATCCAGAGAAATCAAAGTTGTTTGTCTACTATTGATCCAAGCCAGTGCGGTCTTGAAACTGACAATAGTGTGCTCGTGTTTTGAGGTCATCTTTGT
AOX2split marker cassette 1	(SEQ ID NO:27) GTACGGGTTTACTGATTTGACATATCTTGGTACTAACGTTACCAATGGTGTTCCAAATAACGCAGATGATGAGCGTGGTTGCATTGCTGGATTTGACAACACTGGTTTCGTGCTGGGAACTTCATCCTCGTTGTTTAATCAGTTTATTCTGCAACTGAATACGAGTGATCTTTCAGGAGCAATTTACCAAATCATTGAGCATTTTCTGACTGGACTTAGCGAAGACGAAGACGACATTGCTATCTATTCCCCCAACCCTTTCTACAAAAGTACGTATGCAGGAGTAGGTGCCATTGCGGAAAATGACACCCTTTACTTGGTTGATGGTGGAGAGGATAACCAAAACGTCCCTCTGCAGCCTCTACTTCAAAAGGAGCGTGACGTTGATATCATCTTTGCGTTTGACAACAGTGCAGACACTGACCTCTCTTGGCCAAACGGTTCATCATTAGTCAACACCTACATGAGACAGTTTTCTTCTCAAGCAAATGGAACAACGTTCCCTTATGTACCTGATACCACCACTTTCCTAAACTTGAATCTTTCGAGTAAGCCAACCTTCTTTGGTTGTGATGCTAGAAATTTGACAGACATTGTTGAAGGCACGGATCACATTCCTCCCCTGGTTGTTTATCTGGCCAATAGACCTTTCTCGTATTGGAGTAACACTTCAACTTTCAAGTTAGACTACTCTGAATCCGAGAAGAGAGGAATGATCCAAAACGGTTTTGAAGTGTCGTCTCGTTTGAACATGACTATTGATGAAGAATGGCGTACTTGTGTTGGATGTGCAATCATTCGTAGACAGCAGGAGAGATCCAATGCAACACAAACAGAGCAATGTAGAAGATGTTTTGAGAATTATTGTTGGAACGGTGATATTGACACTTCCACCGAAGATATCCCCGTTAATTTTACCACTACTGGAGCAACCAATGAGGAGAATGACAACTCCACTTCAATATCATCGGCCAATTCGGTAGCACCTTCCAAACTTTGGTACCAAGCACCATTGCTGTTGGTCGGCCTTGTCGCATTCTTCATCTAGTACGTACGCTGCAGGTCGACAACCCTTAATATAACTTCGTATAATGTATGCTATACGAAGTTATTAGGTCTAGATCGGTACCGACATGGAGGCCCAGAATACCCTCCTTGACAGTCTTGACGTGCGCAGCTCAGGGGCATGATGTGACTGTCGCCCGTACATTTAGCCCATACATCCCCATGTATAATCATTTGCATCCATACATTTTGATGGCCGCACGGCGCGAAGCAAAAATTACGGCTCCTCGCTGCAGACCTGCGAGCAGGGAAACGCTCCCCTCACAGACGCGTTGAATTGTCCCCACGCCGCGCCCCTGTAGAGAAATATAAAAGGTTAGGATTTGCCACTGAGGTTCTTCTTTCATATACTTCCTTTTAAAATCTTGCTAGGATACAGTTCTCACATCACATCCGAACATAAACAACCATGGGTAAGGAAAAGACTCACGTTTCGAGGCCGCGATTAAATTCCAACATGGATGCTGATTTATATGGGTATAAATGGGCTCGCGATAATGTCGGGCAATCAGGTGCGACAATCTATCGATTGTATGGGAAGCCCGATGCGCCAGAGTTGTTTCTGAAACATGGCAAAGGTAGCGTTGCCAATGATGTTACAGATGAGATGGTCAGACTAAACTGGCTGACGGAATTTATGCCTCTTCCGACCATCAAGCATTTTATCCGTACTCCTGATGATGCATGGTTACTCACCACTGCGATCCCCGGCAAAACAGCATTCCAGGTATTAGAAGAATATCCTGATTCAGGTGAAAATATTGTTGATGCGCTGGCAGTGTTCCTGCGCCGGTTGCATTCGATTCCTGTTTGTAATTGTCCTTTTAACAGCGATCGCGTATTTCGTCTCGCTCAGGCGCAATCACGAATGAATAACGGTTTGGTTGATGCGAGTGATTTTGATGACGAGCGTAATGGCTGGCCTGTTGAACAAGTCTGGAAAGAAATGCATAAGCTTTTGCCATTCTCACCG
AOX2split marker cassette 2	(SEQ ID NO:28) AAGCCCGATGCGCCAGAGTTGTTTCTGAAACATGGCAAAGGTAGCGTTGCCAATGATGTTACAGATGAGATGGTCAGACTAAACTGGCTGACGGAATTTATGCCTCTTCCGACCATCAAGCATTTTATCCGTACTCCTGATGATGCATGGTTACTCACCACTGCGATCCCCGGCAAAACAGCATTCCAGGTATTAGAAGAATATCCTGATTCAGGTGAAAATATTGTTGATGCGCTGGCAGTGTTCCTGCGCCGGTTGCATTCGATTCCTGTTTGTAATTGTCCTTTTAACAGCGATCGCGTATTTCGTCTCGCTCAGGCGCAATCACGAATGAATAACGGTTTGGTTGATGCGAGTGATTTTGATGACGAGCGTAATGGCTGGCCTGTTGAACAAGTCTGGAAAGAAATGCATAAGCTTTTGCCATTCTCACCGGATTCAGTCGTCACTCATGGTGATTTCTCACTTGATAACCTTATTTTTGACGAGGGGAAATTAATAGGTTGTATTGATGTTGGACGAGTCGGAATCGCAGACCGATACCAGGATCTTGCCATCCTATGGAACTGCCTCGGTGAGTTTTCTCCTTCATTACAGAAACGGCTTTTTCAAAAATATGGTATTGATAATCCTGATATGAATAAATTGCAGTTTCATTTGATGCTCGATGAGTTTTTCTAATCAGTACTGACAATAAAAAGATTCTTGTTTTCAAGAACTTGTCATTTGTATAGTTTTTTTATATTGTAGTTGTTCTATTTTAATCAAATGTTAGCGTGATTTATATTTTTTTTCGCCTCGACATCATCTGCCCAGATGCGAAGTTAAGTGCGCAGAAAGTAATATCATGCGTCAATCGTATGTGAATGCTGGTCGCTATACTGGTACCATTCGAGAACCCTTAATATAACTTCGTATAATGTATGCTATACGAAGTTATTAGGTGATATCAGATCCACTTCCTCTTACGGCTTTCTTTCCCAAAAAATCATTGGGGAAATGTGCCCCTCATCAGAGTCCAATGACCCATGAATAAAGTTTCTTGTACTGTTTAAGACGATGAATTGCAACGATAATCCGAGCAGTTTACGGGGTACATCACGTGCTTTGCATATGATCTCGGAGTCGGATCAGTTCCGGATGTGATGTATTACCCCATAGTTTCAAACTCTAATGCAGCCGCCAAGTGCCATACACCCTCCATCAATCTATGCTTAAAGTTTTTCACCATCGTTGGGTGGTGATGATGACTCGCTTAGTCTCTGCTGTTCGATATTAACTTTGTAAGGATCGCCCTTGGATGGAAAATTGAGGGGTTGTAACCTGAATTTGCAGGCTACTTACATTGGACTTTTGAGAAGGCTGGACGGTTGATGAAGAGGGCTGGGTGCAGAGGAATGGAAAAAAATTTAGTTGAGAGGACTGCTTGAAATTTTAGGAAATGGAGTCCTTTAAGCTGACAAAACTTCAAGGATGGGGATTTTCATGTAGCTTTTTCATGCCTTCGACAAGCTAAAGGAAGGTAATTGATTCTGGATAAATGGATATTTGATCTGCTTTAGCAGATGTCAAAGTTCTACTAGTGATAGTCTGGTATCTCGTAGCCTTCAATTGGGCGTATCTTACTCGAAGTGTTATATTTTTAGCTGACGAGACGAAGAACGAGAGAGTATTGACACATTCAGAGGTAAGACAATATGTCGTATTATCAAAATAAGTATCGAACCTCTATTAGGAGCCTACTGGCTCAAATGTGCAACCTTAGTGGTGATTGTCTCTGCTTCTTGATCACAATCTGTCGTGTTTGAGAGTGCCGATGTATGATTTTTAGTAAATGTTTTTCAGAAAAGGCGCTAAGTAAATAACCAGTAAGTAATAAATAACGTAAAAGTGATTTGAATCATAAAAGAATCAAGATAGAGGTCAAAGCATAGATAATCCCCC

Primer Name	DNA sequence 5' to 3'
AOX1_ctrl_Fwd	GGCTGGAAATAGATGTAGGGAG (SEQ ID NO:29)
AOX1_ctrl_Rev	TCGCATCTCCGCAAATTTCTC (SEQ ID NO:30)
AOX2_ctrl_fwd	GATCCCATTCCCTATCCATGT (SEQ ID NO:31)
AOX2_ctrl_rev	CTCTCCCCCCTCGTAATCTT (SEQ ID NO:32)

실시예 2 : 메탄올 유도성 AOX1 프로모터 하에서 P. pastoris △aox1 및 P. pastoris △aox1△aox2 를 사용한 세포내 eGFP 생산.

단백질 생산 능력 및 프로모터 활성을 테스트하기 위해 P. pastoris △aox1△aox2 및 P. pastoris △aox1 균주를 강화된 녹색 형광 단백질(eGFP)에 대한 발현 구조로 형질전환시켰다(표 4). eGFP 코딩 서열은 PAOX1: PP7435_chr4(237941…238898)의 발현 제어 하에 있었다.

a) 발현 구성 BB3aN_pAOX1_GFP_ScCYCtt는 플라스미드 BB1_12_pAOX1, BB1_23_eGFP, BB1_34_ScCYC1tt 및 BB3aN_14*에서 설명한 대로 골든 게이트 조립 절차를 사용하여 조립되었다(Prielhofer et al., 2017). 플라스미드 및 서열은 Golden PiCS 키트 # 1000000133(Addgene, Inc., USA)에서 사용할 수 있다. 전기천공 전에 플라스미드를 제조업체의 프로토콜에 따라 제한 효소 AscI(New England Biolabs, Inc., USA)로 선형화하고 Hi Yield® Gel/PCR DNA 단편 추출 키트(Sud-Laborbedarf GmbH, 독일)로 정제했다. 500ng의 선형화된 플라스미드를 실시예 1a) 및 1d)에서 이전에 기술된 바와 같이 전기적격 P. pastoris △aox1△aox2 및 P. pastoris △aox1로 형질전환시켰다. 양성 형질전환체는 100μg/L Nourseothricin이 포함된 YPD에서 선택되었고 이후 스크리닝 실험에 사용되었다.

b) P. pastoris △aox1△aox2 및 P. pastoris △aox1에서 세포내 eGFP 발현의 소규모 스크리닝 실험. 실시예 2a)로부터 10개의 형질전환체를 선택하고 웰당 2mL YPD 및 100㎍/L 누르세오트리신을 함유하는 24개의 깊은 웰 플레이트에서 밤새 배양물에 접종하였다. 모든 형질전환체를 이중으로 시험하였다. 24웰 플레이트를 공기 허용 막으로 밀봉하고 25℃ 및 280rpm에서 인큐베이션하였다. eGFP의 세포내 발현 수준의 스크리닝을 위해 밤새 배양물을 느린 포도당 방출을 위해 25g/L 다당류 및 0.3% 아밀라아제(m2p-labs GmbH, Germany)가 포함된 2.5mL 최소 ASMv6 배지가 있는 24개의 딥 웰 플레이트로 옮기고 인큐베이션했다. 2시간 후 eGFP 생산 유도를 위해 0.2%(v/v) 또는 1%(v/v) 메탄올을 첨가하였다. eGFP 측정은 Gallios 유세포 분석기(Beckman Coulter, Inc., USA)를 사용하여 유도 후 4시간 및 20시간 후에 수행되었다. 이 목적을 위해 세포를 0.24g/L KH2PO4, 1.8g/L Na2HPO4*2H2O, 0.2g/L KCl, 8g/L NaCl을 함유하는 인산염 완충 식염수에서 0.5의 OD600으로 희석했다. 20,000개의 이벤트가 측정되었다. FX 값은 다음 방정식을 사용하여 소프트웨어 FACS Express 버전 3(De Novo Software, USA)으로 계산되었다.

이 방법은 이미 설명되어 있다(Ata, Prielhofer, Gasser, Mattanovich, & Calık, 2017; Hohenblum, Borth, & Mattanovich, 2003; Prielhofer et al., 2013).

c) 최소 배지 ASMv6: 6.3g/L(NH4)2HPO4, 0.8g/L(NH4)2SO4, 0.49g/L MgSO4*7H2O, 2.64g/L KCl, 0.054g/L CaCl2*2H2O, 22g/L 시트르산 일수화물, 1.47mL/L PTM0 미량 금속, 0.8mg/L 비오틴 20mL/L NH4OH(25%); KOH를 사용하여 pH를 6.5로 설정했습니다.

d) 결과는 표 3에 표시된다. 형광은 세포내 eGFP 수준을 결정하기 위한 프록시이고 세포내 eGFP 수준은 PAOX1의 활성을 결정하기 위한 프록시였다. 결과는 1% 메탄올 유도 20시간에서 프로모터가 P. pastoris △aox1△aox2 균주에서 활성화되고 eGFP가 생성됨을 보여준다. P. pastoris △aox1△aox2 BB3aN_pAOX1_GFP_ScCYCtt 균주의 유도는 20시간 후 0.2% 메탄올보다 1%에서 더 우수하며, P. pastoris △aox1 균주에서는 메탄올 농도의 차이가 관찰되지 않는다.

			negative control
	P. pastoris △aox1△aox2 BB3aN_pAOX1_ GFP_ScCYCtt	P. pastoris △aox1 BB3aN_pAOX1_ GFP_ScCYCtt	P. pastoris △aox1△aox2	P. pastoris △aox1
0.2% MeOH at 4h	4.39 ± 0.90	6.26 ± 1.74	2.94	2.92
1% MeOH at 4h	5.59 ± 1.09	7.39 ± 1.57	2.95	2.89
0.2% MeOH at 20h	37.81 ± 12.71	84.18 ± 4.57	2.37	2.70
1% MeOH at 20h	62.89 ± 8.81	89.85 ± 3.90	2.35	2.42

Gene of interest name	DNA sequence 5' to 3'
enhanced green fluorescent protein (eGFP)	(SEQ ID NO:33) ATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTAA
Human serum albumin (HSA) with its native secretion leader	(SEQ ID NO:34) ATGAAGTGGGTTACTTTCATCTCCTTGTTGTTCTTGTTCTCCTCAGCTTACTCCAGAGGTGTTTTCAGAAGAGATGCTCACAAGTCCGAGGTTGCTCACAGATTCAAGGACTTGGGTGAAGAGAACTTCAAGGCTTTGGTTTTGATCGCTTTCGCTCAGTACTTGCAGCAGTGTCCATTCGAGGACCACGTTAAGTTGGTTAACGAGGTTACTGAGTTCGCTAAGACTTGTGTTGCTGACGAATCCGCTGAGAACTGTGATAAGTCCTTGCACACTTTGTTCGGTGACAAGTTGTGTACTGTTGCTACTTTGAGAGAAACTTACGGTGAGATGGCTGACTGTTGTGCTAAGCAAGAGCCTGAGAGAAACGAGTGTTTCTTGCAACACAAGGACGACAACCCAAACTTGCCAAGATTGGTTAGACCAGAGGTTGACGTTATGTGTACTGCTTTCCACGACAACGAAGAGACTTTCTTGAAGAAGTACTTGTACGAGATCGCTAGAAGACACCCATACTTCTACGCTCCAGAGTTGTTGTTCTTCGCTAAGAGATACAAGGCTGCTTTCACTGAGTGTTGTCAGGCTGCTGATAAGGCTGCTTGTTTGTTGCCAAAGTTGGACGAGTTGAGAGATGAGGGTAAGGCTTCTTCCGCTAAGCAGAGATTGAAGTGTGCTTCCTTGCAGAAGTTCGGAGAGAGAGCTTTTAAGGCTTGGGCTGTTGCTAGATTGTCCCAGAGATTCCCAAAGGCTGAGTTCGCTGAGGTTTCCAAGTTGGTTACTGACTTGACTAAGGTTCACACAGAGTGTTGTCACGGTGACTTGTTGGAATGTGCTGATGACAGAGCTGACTTGGCTAAGTACATCTGTGAGAACCAGGATTCCATCTCCTCCAAGTTGAAAGAATGTTGTGAGAAGCCTTTGTTGGAGAAGTCCCACTGTATCGCTGAGGTTGAAAACGACGAAATGCCAGCTGACTTGCCATCTTTGGCTGCTGACTTCGTTGAATCCAAGGACGTCTGCAAGAACTACGCTGAGGCTAAGGACGTTTTCTTGGGTATGTTCTTGTATGAGTACGCTAGAAGACATCCAGACTACTCCGTTGTTTTGTTGTTGAGATTGGCTAAGACTTACGAGACTACTTTGGAGAAGTGTTGTGCTGCTGCTGACCCACATGAGTGTTACGCTAAGGTTTTCGACGAGTTCAAGCCATTGGTTGAGGAACCACAGAACTTGATCAAGCAGAACTGTGAGTTGTTCGAGCAGTTGGGTGAGTACAAGTTCCAGAACGCTTTGTTGGTTAGATACACTAAGAAGGTTCCACAGGTTTCCACTCCAACTTTGGTTGAGGTTTCCAGAAACTTGGGTAAGGTTGGTTCCAAGTGTTGTAAGCACCCAGAGGCTAAGAGAATGCCATGTGCTGAGGACTACTTGTCTGTTGTTTTGAACCAGTTGTGTGTCTTGCACGAAAAGACACCAGTTTCCGACAGAGTTACTAAGTGTTGTACTGAATCCTTGGTTAACAGAAGACCTTGTTTCTCCGCTTTGGAGGTTGACGAGACTTACGTTCCAAAAGAGTTCAACGCTGAGACTTTCACTTTCCACGCTGACATCTGTACTTTGTCCGAGAAAGAGAGACAGATCAAGAAGCAGACTGCTTTGGTTGAGTTGGTTAAGCACAAGCCAAAGGCTACAAAAGAGCAGTTGAAGGCTGTTATGGACGACTTCGCTGCTTTCGTTGAGAAATGTTGTAAGGCTGACGACAAAGAGACTTGTTTCGCTGAAGAGGGTAAGAAGTTGGTTGCTGCTTCCCAAGCTGCTTTGGGTCTGTAA
variable region of a camelid antibody (VHH) with the S. cerevisiae α-mating factor leader	(SEQ ID NO:35) ATGAGATTCCCATCTATTTTCACCGCTGTCTTGTTCGCTGCCTCCTCTGCATTGGCTGCCCCTGTTAACACTACCACTGAAGACGAGACTGCTCAAATTCCAGCTGAAGCAGTTATCGGTTACTCTGACCTTGAGGGTGATTTCGACGTCGCTGTTTTGCCTTTCTCTAACTCCACTAACAACGGTTTGTTGTTCATTAACACCACTATCGCTTCCATTGCTGCTAAGGAAGAGGGTGTCTCTCTCGAGAAGAGACAAGCCGGTGGTTCATTAAGATTGTCCTGTGCTGCCTCTGGTAGAACTTTCACTTCTTTCGCAATGGGTTGGTTTAGACAAGCACCTGGAAAAGAGAGAGAGTTTGTTGCTTCTATCTCCAGATCCGGTACTTTAACTAGATACGCTGACTCTGCCAAGGGTAGATTCACTATTTCTGTTGACAACGCCAAGAACACTGTTTCTTTGCAAATGGACAACCTTAACCCAGATGACACCGCAGTCTATTACTGTGCCGCTGACTTGCACAGACCATACGGTCCAGGAACCCAAAGATCCGATGAGTACGATTCTTGGGGTCAGGGAACTCAAGTCACTGTCTCTTCAGGTGGTGGATCTGGTGGTGGAGGTTCAGGTGGTGGAGGATCCGGTGGTGGTGGTTCTGGTGGTGGTGGATCTGGTGGAGGTGAAGTTCAACTTGTCGAATCCGGTGGTGCACTTGTCCAACCTGGTGGATCTCTTAGACTTTCTTGTGCCGCCTCCGGTTTTCCTGTTAACCGTTACTCTATGCGTTGGTACAGACAAGCCCCTGGAAAAGAACGTGAATGGGTTGCCGGAATGTCCTCAGCTGGTGACAGATCCTCCTACGAAGATTCTGTGAAGGGACGTTTCACCATCTCCAGAGATGACGCCCGTAACACCGTTTACCTTCAAATGAACTCCCTTAAGCCTGAGGATACTGCCGTCTACTATTGTAACGTGAATGTCGGATTTGAATACTGGGGACAGGGAACCCAAGTTACTGTCTCTTCCGGTGGACATCACCACCACCATCACTAATAG

실시예 3 : 메탄올 유도성 AOX1 프로모터 하에서 분비된 HSA 및 VHH를 생성하는 P. pastoris △aox1 및 P. pastoris △aox1△aox2 균주의 생성.

P. pastoris △aox1△aox2 균주에서 분비된 재조합 단백질을 생산하는 능력을 테스트하고 이를 P. pastoris △aox1 균주와 비교하기 위해, 균주는 2개의 분비 모델 단백질에 대한 발현 구조로 형질전환되었다: (1) 인간 혈청 알부민 고유 분비 리더(HSA) 또는 (2) S. cerevisiae α-짝짓기 인자 분비 리더(VHH)가 있는 낙타류 항체의 가변 영역. 이러한 관심 유전자의 코딩 서열(코돈 최적화 및 외부 제공자에 의해 합성됨)은 표 4에서 찾을 수 있다.

a) HSA 및 VHH 생산에 사용되는 pPM2pN21_pAOX1_HSAopt_CycTT 및 pPM2pZ30_pAOX1_αMF-vHH_CycTT 발현 구성물은 WO2008128701A2에 기재된 pPuzzle ZeoR 벡터의 유도체이며, 이는 E.coli pUC19 ori 및 Zeocin 항생제 내성 카세트로 구성되어 있다. pPM2pN21_pAOX1_HSAopt_CycTT Zeocin 내성의 경우 제한 및 결찰을 통해 Nourseothricin 내성으로 교환된다. 또한 벡터는 효율적인 통합을 위해 PGI 유전자좌 PP7435_Chr3 (1366329…1367193)과 상동인 통합 시퀀스를 전달한다. 발현 벡터는 다른 곳에서 더 자세히 설명되어 있다(Gasser et al., 2013; Stadlmayr et al., 2010). 관심 유전자(GOI)의 발현은 PAOX1 PP7435_chr4(237941…238898) 및 Saccharomyces cerevisiae CYC1 전사 종결자에 의해 매개된다. 인간 혈청 알부민(HSA) 유전자(GenBank NP_000468)는 P. pastoris에 최적화된 코돈으로 최적화되었고 합성되었다. 고유 분비 리더가 있으므로 상층액으로 분비된다. VHH에 대한 유전자는 P. pastoris에 최적화된 코돈이고 합성되었으며(표 4), 상청액으로 분비하기 위한 N-말단 S. cerevisiae α-교배형 리더를 갖는다. 발현 구성체의 형질전환을 위해 원형 벡터를 XmnI (New England Biolabs, Inc., USA)를 사용하여 PGI1 상동 서열의 제한에 의해 선형화하고 Hi Yield® Gel/PCR DNA 단편 추출 키트(Sud- Laborbedarf GmbH, 독일)로 정제하였다.

b) 500ng 선형화된 pPM2pN21_pAOX1_HSAopt_CycTT 및 pPM2pZ30_pAOX1_αMF-vHH_CycTT plas1a)로 수행된 전기 컴피턴트 P. pastoris △aox1△aox2 및 P. pastoris △aox1의 전기천공 선택은 각각 100μg/mL Nourseothricin 또는 25μg/mL Zeocin이 포함된 YPD 플레이트에서 수행되었다.

실시예 4 : P. pastoris △aox1△aox2 및 P. pastoris △aox1 를 생성하는 HSA 및 VHH의 소규모 스크리닝.

a) 전배양을 위해 형질전환체를 선택에 사용된 항생제 내성을 기준으로 100μg/mL Nourseothricin 또는 25μg/mL Zeocin이 포함된 2mL YPD에 접종했다. 각각의 발현 구축물에 대해 스크리닝을 위해 12개의 형질전환체를 선택하였다. 전배양 및 스크리닝 배양물을 공기 투과성 막으로 밀봉된 24웰 플레이트에서 배양하고 25℃에서 280rpm으로 인큐베이션하였다. 스크리닝 배양물은 배양물을 포도당 한계로 유지하기 위해 6mm 피드비드(Kuhner Shaker GmbH, Germany)를 기반으로 하는 느린 포도당 방출 시스템이 있는 2mL의 최소 배지(ASMv6)에 8의 시작 광학 밀도(OD600)로 접종되었다. 균주는 수용된 총 메탄올 및 기간이 다른 다양한 메탄올 공급 절차와 비교되었다(표 5).

b) 인큐베이션 기간 후 1mL의 각 배양물을 제거하고 미리 가중된 Eppendorf 튜브에서 원심분리했다. 상청액을 제거하고 제조업체의 지침에 따라 Caliper LabChip GXII Touch (PerkinElmer, inc., USA)로 단백질 농도를 측정했다. 세포 펠릿으로 Eppendorf 튜브의 무게를 측정하여 습윤 세포 중량을 결정하고 다음과 같이 계산했다: 중량(전체)-중량(비어 있음) = 습윤 세포 중량(WCW)(g/L). 이 데이터에서 수율이 계산되었다: 수율(μg/g) = 단백질 농도 / 습윤 세포 중량. 농도가 두 배이거나 상층액에서 단백질이 검출되지 않는 형질전환체 데이터는 분석에서 이상치(outlier)로 제거되었다. 이상치(outlier)는 발현 구성체의 사본이 두 개 있거나 사본이 전혀 없는 형질전환자로 간주된다(Aw & Polizzi, 2013; Schwarzhans et al., 2016).

Protocol	Incubation period	Feedbeads	Start OD₆₀₀	Methanol pulse	Total methanol	Methanol shot time points
Standard	48 h	12 mm	8	4 x	3.5% (v/v)	4 h*, 19 h, 27 h, 43 h
One shot	48 h	3x6 mm	8	1 x	1% (v/v)	3 h
Two shot	48 h	3x6 mm	8	2 x	2% (v/v)	3 h, 23 h
One shot - extended	72 h	3x6 mm	8	1 x	1% (v/v)	3 h
Two shot - extended	72 h	3x6 mm	8	2 x	2% (v/v)	3 h, 43 h

c) 결과는 P. pastoris △aox1△aox2가 PAOX1의 유도 하에서 분비된 단백질을 생산할 수 있고 수율이 산업 표준으로 사용되는 P. pastoris △aox1와 비슷함을 보여준다(표 6). “투샷-확장(two shot-extended)” 전략에서 P. pastoris △aox1△aox2는 더 나은 수확량을 보여 더 적은 메탄올로 더 긴 배양 시간에서 P. pastoris △aox1△aox2가 수확량 이점이 있음을 나타낸다. 또한 이것은 PAOX1 및 메탄올 유도에 의해 제어되는 분비 단백질을 생산하는 P. pastoris △aox1△aox2 균주를 스크리닝하기 위해 제한된 포도당 조건을 사용할 수 있음을 보여준다.

	Standard	One shot	Two shot	One shot extended	Two shot extended
P. pastoris △aox1△aox2　 pPM2pZ30_pAOX1_αMF-vHH_CycTT	733 ± 59	219 ± 32	379 ± 38	0	410 ± 16
P. pastoris △aox1 pPM2pZ30_pAOX1_αMF-vHH_CycTT	1465 ± 239	195 ± 66	413 ± 114	0	239 ± 77
P. pastoris △aox1△aox2　 pPM2pN21_pAOX1_HSAopt_CycTT	443 ± 111	138 ± 24	251 ± 110	228 ± 33	363 ± 55
P. pastoris △aox1 pPM2pN21_pAOX1_HSAopt_CycTT	840 ± 36	79 ± 9	388 ± 61	83 ± 18	277 ± 23

실시예 5 : 생물 반응기 배양

재조합 단백질 생산 환경에서 유가식 모드에서 P. pastoris △aox1△aox2의 거동 및 공정 매개변수를 결정하기 위해 생물 반응기 배양이 수행되었다. 배양은 다음과 같이 수행하였다.

a) DASGIP 생물반응기는 0.7L의 작업 부피로 사용되었다(Eppendorf AG, Germany). 하나의 바이오리액터 시스템은 온도를 제어하기 위해 하나의 바이오 블록에 배열된 4개의 반응기로 구성된다. 각 반응기는 소프트웨어로 제어되는 4개의 연동 펌프에 연결되었다. 또한 각 반응기에는 중량 측정 방식으로 펌프 속도를 조정하기 위해 DASGIP 제어 소프트웨어(Eppendorf AG, Germany)에 연결된 2개의 저울이 있다. 각 반응기는 제어 가능한 가스 공급(압력 공기, N2, O2는 원하는 양으로 혼합될 수 있음) 및 반응기 오프 가스에서 O2 및 CO2 농도 측정을 위한 가스 분석기와 연결되었다. 반응기에는 DASGIP 제어 소프트웨어에 연결된 pH 프로브 및 용존 산소(DO) 프로브가 있다. DASGIP 제어 소프트웨어는 1분 간격으로 모든 매개변수를 기록하고 있었다.

b) 생물반응기 배양 배지는 BSM 배지(Mellitzer et al., 2014)로 구성되어 있다: 11.48 g/L H₃PO₄, 0.5 g/L CaCl₂*2H₂O, 7.5 g/L MgSO₄*7H₂O, 9 g/L K₂SO₄, 2 g/L KOH, 40g/L Glycerol, 0.25 g/L NaCl, 4.35 mL/L PTM0, 0.87 mg/L Biotin, 0.1 mL/L Glanapon 2000, pH set to 5.5 with 25% NH₃.

c) PTM0는 하기로 구성된다: 6.0 g CuSO₄*5H₂O, 0.08 g NaI, 3.36 g MnSO₄*H₂O, 0.2 g Na₂MoO₄*2H₂O, 0.02 g H₃BO₃, 0.82 g CoCl₂, 20.0 g ZnCl₂, 65.0 g FeSO₄*7H₂O, 5 mL/L H₂SO₄ (95 %-98 %).

d) 포도당 공급 배지는 하기로 구성된다: 50% (w/w) glucose, 2.08 mg/kg Biotin, 10.4 mL/kg PTM0. The methanol feed media was: 50% (v/v) or 100% (v/v) methanol. The glycerol feed media consisted of: 60% (w/w) glycerol, 2.08 mg/kg Biotin, 10.4 mL/kg PTM0.

e) 용존 산소(DO) 설정점은 20%였다. 특정 경우에 DO 제어가 비활성화되고 교반 및 통기가 일정한 750rpm 및 9.5sL/h로 수동으로 설정되었다. pH는 DASGIP 제어 소프트웨어에 의해 제어되는 12.5% 또는 25% NH3로 5.0 또는 5.5로 설정되었다. 산 조절은 필요한 경우 수동 첨가에 의해 10% H3PO4로 달성되었다. 온도는 25℃로 설정되었다. 시작 OD₆₀₀은 2였고 시작 부피는 300mL + 15mL의 접종 배양물이었다.

f) 샘플링을 매일(대략 24시간마다) 수행했다. 먼저 반응기에서 3mL 흡인물을 취하여 샘플링 포트의 사부피를 제거했다. 그런 다음 9mL의 샘플을 취했다. 3 x 2 mL를 다시 무게를 재어진 2 mL Eppendorf 튜브에, 1 x 1.5 mL를 1.5 mL Eppendorf 튜브에 피펫팅했다. 샘플을 원심분리했다(16,000g, 10분, 4℃). 단백질 및 HPLC 분석을 위해 상청액을 수집하고 -20℃에서 보관하였다. 펠렛을 0.1M HCl 1mL에 재현탁하여 세척하여 미량의 염을 제거하고 다시 원심분리했다(16,000g, 10분, 4℃). 그 다음, 펠릿을 105℃에서 24시간 동안 건조시켜 건조 세포 중량을 결정하였다. 건조 세포 무게는 다음과 같이 계산되었다: (무게(전체)-무게(비어 있음)) / 2 = 건조 세포 무게(g/L) 및 3회 반복의 평균으로 계산되었다. HPLC 샘플만 필요한 경우 샘플 2mL만 취했다.

g) 세포 현탁액을 요오드화프로피디움으로 염색하여 세포 생존율을 측정하였다. 이를 위해 반응기 샘플의 세포 현탁액을 OD₆₀₀이 0.5가 되도록 인산 완충 식염수로 희석하고, Gallios 유세포 분석기(Beckman coulter, Inc., USA) 590 - 650 nm의 필터를 사용하였다. 샘플당 50,000개의 이벤트가 측정되었다.

실시예 6 : 세포가 없는 생물 반응기에서 메탄올의 증발 속도 결정.

폭기 및 교반에 의한 반응기로부터의 메탄올의 증발 속도를 평가하기 위해 반응기를 멸균 매질로 채우고 메탄올로 펄스화하고, 메탄올 농도를 결정하기 위해 샘플을 채취하였다.

a) 이 예에서 2개의 반응기는 글리세롤이 없는 310mL의 BSM 배지로 채워졌고 2개의 반응기는 글리세롤이 없는 500mL BSM 배지로 채워져 글리세롤이 성장하는 배양물에 의해 소비되는 배치 단계의 끝에서 배지를 시뮬레이션했다.

b) P. pastoris △aox1△aox2 배양의 경우와 같이 반응기 교반기 속도를 760rpm으로 설정하고 가스 공급을 9.5sL/h로 설정했다. 매개변수는 표 7에서 찾을 수 있다.

c) 50%(v/v) 메탄올 펄스를 수동으로 추가하여 메탄올 농도를 1%(v/v)로 증가시키고 실제 달성 농도를 결정하기 위해 샘플을 채취했다. 3.4, 6.5, 22.4, 31.0, 47.9시간에 먼저 샘플 포트에서 3mL의 데드 볼륨을 제거하고 흡인물을 버려 샘플을 채취했다. 그 직후에 4mL 샘플을 취하였다.

d) 메탄올 농도의 HPLC 측정은 이전에 설명한 대로 수행되었다(Blumhoff, Steiger, Marx, Mattanovich, & Sauer, 2013). 식별 및 정량화를 위해 순수 표준물질이 사용되었다. 컬럼은 0.6mL/min의 4mM H2SO4 이동상으로 60℃에서 실행되는 Aminex HPX-87H(Bio-Rad Laboratories, Inc, USA)였다. 검출기는 굴절률 검출기 RID-10 A(Shimadzu, Corp., Japan)이고 계산은 LabSolutions v5.85 소프트웨어(Shimadzu, Corp., Japan)로 수행되었다.

e) 증발 속도는 시간과 농도 차이가 가장 큰 첫 번째와 마지막 샘플에서만 계산되었다. 인접한 샘플 사이의 농도 변화는 미미했으며 측정 오류는 계산에 상당한 영향을 미칠 수 있다. 데이터는 표 8에서 찾을 수 있다. 500mL 배지로 채워진 R1 및 R2의 평균값은 0.063 g*L^-1*h^-1이었다.

Reactor	Volume (mL)	Agitation (rpm)	Gassing (sL/h)	50% (v/v) methanol (ml)
R1	310	760	9.5	6.2
R2	310	760	9.5	6.2
R3	500	760	9.5	10
R4	500	760	9.5	10

	Time (h)
	0	3.4	6.5	22.4	31.0	46.9
Reactor	Methanol (g/L)						dc/dt (g L^-1 h^-1)
R1		7.91	6.13	7.53	6.76	6.10	5.49	0.052
R2		7.80	7.14	7.49	6.72	6.28	4.29	0.075
R3		7.47	7.73	5.07*	7.05	6.93	6.43	0.022
R4		7.54	7.80	6.33*	6.97	4.39*	6.49	0.022

*are too low and are considered as outliers.

실시예 7: P. pastoris △aox1△aox2 의 메탄올 흡수율 결정

메탄올 흡수율을 결정하기 위해 P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT 균주를 생물반응기에서 배양했다. 특정 바이오매스 농도까지 배양물을 성장시켰다. 그런 다음 메탄올 펄스를 적용하고 펄스 직후와 약 20시간 후에 샘플을 채취했다. 목표는 Mut^- 균주의 메탄올 흡수율을 결정하고 이를 실시예 6에서 측정한 메탄올 증발율과 비교하는 것이었다.

a) 전배양: 반응기 접종 24시간 전에 100㎍/L 누르세오트리신을 함유하는 YPD 50mL에 P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT를 접종하였다. 반응기를 접종하기 3시간 전에 예비 배양물을 100㎍/L 누르세오트리신을 함유하는 또 다른 50mL YPD로 희석하였다. 접종 전에 적절한 양의 배양액을 원심분리(1500g, 5분, 20℃)하고 OD₆₀₀이 42인 BSM 배지 15mL에 재현탁했다.

b) 300mL BSM 배지로 채워진 반응기에 P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT 배양 15mL를 접종했다. 반응기에서 표적 접종 OD₆₀₀은 2였다. 용존 산소 스파이크에 의해 지시된 바와 같이 배치 단계의 끝에서, 바이오매스를 증가시키기 위해 50%(w/w) 글루코스 공급이 24시간 동안 2.4mL/h에서 시작되었다. 포도당 공급을 시작한 지 2시간 후에 9.5mL 50%(v/v) 메탄올 샷이 제공되어 메탄올 농도를 1.5%로 증가시켰다(측정된 농도는 R1 = 1.47% 및 R2 = 1.48%임). 이것은 메탄올 소비를 유도하기 위해 수행되었다. 포도당 공급 단계의 끝에서 세포 건조 중량 및 HPLC에 대한 샘플을 취했다.

c) 글루코스 단계 후 교반 및 가스 공급은 일정한 750rpm 및 9.5sL/h로 설정되었다. 추가 50% 메탄올 펄스를 추가하여 농도를 1.5%로 증가시키고 즉시 샘플을 채취했다(측정된 농도는 R1 = 1.36% 및 R2 = 1.36%임). 19.5시간 후에 농도를 다시 측정하여 특정 메탄올 흡수율(q_methanol)을 결정하는 데 사용했다.

d) 이 실험에 대한 메탄올 농도 감소(dc/dt)는 0.022 내지 0.063 g L^-1 h^-1 범위의 실시예 6e), 표 8에서 증발 속도에 대해 수득된 값과 비교하여 평균 0.37 g L^-1 h^-1에서 실질적으로 더 높았다.

특정 메탄올 흡수율은 다음과 같이 표 9에 나타난 데이터를 기반으로 계산되었다.

부피는 측정된 기간 동안 일정했다. 증발을 뺀 평균 비메탄올 흡수율(q_methanol)은 5.07 mg g^-1 h^-1이었다. 증발을 뺀 특정 메탄올 흡수율의 계산을 위해 실시예 6e), 표 8의 결과에 기초하여 22mg L^-1 h^-1의 증발율이 추정되었다. 이 결과는 완전히 새롭고 예상치 못한 것이었다. 지금까지 Mut^-는 메탄올을 대사할 수 없고 메탄올의 감소는 증발 손실로 인한 것이라고 발표된 문헌에서 보고되고 수용되었다(Looser et al., 2015).

Reactor	Volume (mL)	CDW (g/L)	Methanol at 0 h (g/L)	Methanol at 19.5 h (g/L)	dc/dt (g L^-1 h^-1)	q_methanol (mg g^-1 h^-1)	q_methanol- _evaporated (subtracted evaporation) (mg g^-1 h^-1)
R1	378	73.4	10.71	3.67	0.361	4.92	4.61
R2	372	72.6	10.74	3.35	0.379	5.22	4.90

실시예 8 : 배양 전략 1 - P. pastoris △aox1△aox2 에 일정한 포도당/메탄올 동시 공급 적용

P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT 균주는 재조합 단백질 생산 시나리오에서 배양되었다. 균주는 일정하게 제한된 포도당 공급으로 공급되었고 단백질 생산을 위해 메탄올로 유도되었다.

a) 실시예 7a) b)에 기술된 바와 같이 접종을 수행하였다. 배양은 두 단계로 분리되었다. (1) 1단계: BSM 배지에서 배치가 OD600 2에서 시작되었다. 배치 단계 종료는 반응기 R1의 경우 22.27시간 및 반응기 R2의 경우 21.52시간에 용존 산소 스파이크에 의해 표시되었다.

b) (2) 2단계: 97시간 동안 2.4mL/h의 공급 속도로 1단계 후에 50%(w/w) 글루코오스 공급이 있는 유가식 단계를 시작했다. 동시에 50%(v/v) 메탄올 펄스를 추가하여 메탄올 협력을 1.5%(v/v)로 증가시켰다. 실시예 6d)에 기술된 바와 같이 HPLC 샘플을 채취하여 정확한 농도를 측정하고 필요한 경우 추가 펄스를 첨가하였다. 실시예 7d)에서 측정된 바와 같이 예측된 바이오매스 농도 및 5 mg g^-1 h^-1의 특정 메탄올 흡수율에 기초하여 계산된 메탄올 공급물을 적용하였다. 메탄올 농도는 HPLC에 의해 라인에서 매일 측정하였다.

c) 메탄올 공급은 다음과 같이 시간 간격으로 계산되었다:

d) 실시예 7d)에 기초한 예측된 특정 메탄올 흡수율 때문에 라인 메탄올 농도 측정 및 사료 조정에서 하루에 한 번만 메탄올의 1.19%에서 1.5%(v/v)까지 생물반응기 배양 동안 과량의 메탄올 농도를 유지할 수 있었다.

e) 공정 및 생산성 데이터는 표 10에서 확인할 수 있다. 전체 평균 특정 생산성은 29.4 μg g^-1 h^-1이었다. 배양 종료 시 메탄올 농도는 반응기 R1 및 R2에 대해 10.4 및 10.0g/L(1%(v/v) 메탄올은 7.92g/L에 해당)이었다. 반응기 R1 및 R2에 의해 단계 2에서 소비된 메탄올의 총량은 25.03g 및 24.07g이었다. 이것은 다음 방정식으로 계산되었다:

Time (h)	Volume (mL)		YDM (g/L)		Recombinant protein concentration (mg/L)		Specific productivity (q_P) (μg g^-1 h^-1)		Methanol concentration (g/L)
	R1	R2	R1	R2	R1	R2	R1	R2	R1	R2
22.30	318.2	318.0	25.2	25.0	0.0	0.0
24.60									4.9*	9.0*
43.22	382.9	378.3	66.4	67.0	75.4	75.2	64.50	63.63	10.3	11.9
68.20	458.5	453.1	99.0	101.5	164.0	142.5	31.74	23.35	9.4	10.0
92.45	528.9	521.5	119.8	122.0	235.9	211.6	18.83	17.28	11.0	10.7
116.37	621.6	613.5	135.1	136.9	363.6	338.4	28.30	27.17	10.3	9.9
120.12	625.3	617.6	136.0	137.3	390.9	378.6	28.90	30.17	10.4	10.0

* Represents a control sample after the methanol pulse.

실시예 9 : 배양 전략 2 - 분리된 포도당 공급 단계와 메탄올 전용 공급 단계가 있는 공급 전략.

P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT 균주는 바이오매스를 증가시키기 위해 먼저 제한된 포도당 공급물을 적용한 다음 단백질 생산을 유도하기 위해 메탄올 펄스 및 공급물로 분리된 단계를 적용하는 재조합 단백질 생산 시나리오에서 테스트되었다.

a) 생물반응기 배양은 3단계로 분리되었다. (1) 1단계는 시작 OD₆₀₀이 2인 BSM 배지의 배치 단계로 구성되었다. 접종은 실시예 7a) b)에 설명된 대로 수행되었다. 배치 단계는 반응기 R3 및 R4에 대해 각각 19.68 및 19.50시간 동안 지속되었다. (2) 2단계는 바이오매스 농도를 증가시키기 위해 25시간 동안 4.8mL/h에서 50%(w/w) 포도당 공급이었다. (3) 3단계는 50%(v/v) 메탄올 펄스로 시작하여 1.5%(v/v)의 목표 농도에 도달하고 메탄올 공급 프로파일은 72.7시간 동안 실시예 8c)에 기술된 바와 같이 예측된 세포 건조 중량 및 특정 메탄올 흡수율을 기반으로 계산되었다. 메탄올 농도는 정확한 농도를 측정하기 위해 실시예 6d)에 기술된 바와 같이 매일 HPLC 라인에서 측정되었고, 필요하다면 추가적인 보상 풀이 첨가되었다. 이 단계에서 반응기 교반기 속도는 일정한 760rpm으로 설정되고 기체 공급은 9.5sL/h로 설정되었다.

b) 공정 및 생산성 데이터는 표 11에서 찾을 수 있다. 배양 전반에 걸친 최대 및 최소 메탄올 농도 범위는 4.3g/L에서 12.55g/L이다. 전체 평균 특정 생산성은 32.9 μg g^-1 h^-1이었다. 배양 종료시 메탄올 농도는 반응기 R3 및 R4에 대해 7.10 및 7.47 g/L이었다. 반응기 R3 및 R4에 의해 단계 3에서 소비된 메탄올의 양은 12.0g 및 12.6g이었다. 이는 실시예 8e)에서와 같이 계산되었다. 바이오매스는 3단계에서 일정하기 때문에 3단계에 대한 메탄올 흡수율(qmethanol)은 다음 식과 같이 계산되었다.

단계 3에서 반응기 R3에 대한 q_methanol은 3.79 mg g^-1 h^-1이고 반응기 R4에 대한 q메탄올은 3.92 mg g^-1 h^-1이다.

c) 표 11의 총 바이오매스는 12mL의 샘플 회수에 대해 수정되었으며 바이오매스가 증가하지 않았음을 보여줍니다. 전체적으로 3단계의 총 바이오매스는 반응기 R3 및 R4의 경우 4.5% 및 3.4% 감소했습니다. 놀랍게도 배양액은 분비된 재조합 단백질을 생산하고 있었습니다. 이는 P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT 균주가 뚜렷한 성장 없이 메탄올만 공급한 경우에도 재조합 분비 단백질을 효율적으로 생산할 수 있음을 보여준다. 메탄올을 유일한 탄소원으로 하여 3단계에서 생산된 단백질의 총 평균량은 105mg이다.

	Time (h)	Volume (mL)		YDM (g/L)		Total Biomass (g)		Recombinant protein concentration (mg/L)		Specific productivity (q_P) (μg g^-1 h^-1)		Methanol concentration (g/L)
Phase		R3	R4	R3	R4	R3	R4	R3	R4	R3	R4	R3	R4
1	20.13	317.9	318.5	25.5	25.5	8.1	8.1
2	29.92	366.5	368.0	67.2	67.0	24.9	24.9	0.0	0.0	0.0	0.0
2	45.02	445.8	447.8	108.0	107.7	49.2	49.3	0.0	0.0	0.0	0.0
3	47.08											12.1*	12.5*
	53.00	444.2	446.1	104.4	103.7	48.8	48.6	46.1	45.7	35.56	35.6
	69.58	432.2	435.7	103.3	102.9	48.3	48.5	106.7	107.8	22.51	23.3	4.3	5.9
	93.93	434.7	437.0	98.5	99.1	47.7	48.2	244.0	251.0	38.67	39.9	6.6	7.4
	118.12	434.4	435.9	94.2	95.3	47.0	47.6	350.9	350.2	33.07	30.0	7.1	7.5

* Represents a control sample after the methanol pulse.

실시예 10 : 배양 전략 3 - 포도당/메탄올 동시 공급 단계 및 분리된 메탄올 단독 공급 단계를 사용한 공급 전략.

P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT 균주는 배치 단계 후에 제한된 포도당 공급과 추가 메탄올 펄스 및 공급이 적용되어 바이오매스 증가와 재조합 단백질 생산을 동시에 달성하는 재조합 단백질 생산 시나리오에서 테스트되었다. 원하는 바이오매스에 도달한 후 포도당 공급은 중단되었지만 메탄올 공급은 나머지 배양 동안 계속되었다.

a) 이 생물 반응기 배양은 3단계로 분리되었다. (1) 1단계는 배치 단계였다. 이를 위해 반응기에 시작 OD₆₀₀이 2인 생산 균주 P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT를 접종하였다. 접종은 실시예 7a) b)에 기재된 바와 같이 수행하였다. 배치 단계는 반응기 R1 및 R2에 대해 각각 19.35시간 및 19.37시간 동안 지속되었다. 배치 단계의 끝은 용존 산소 피크로 표시되었다. (2) 이 시점에서 2단계가 시작되었다. 2단계는 25시간 동안 4.8mL/h에서 50%(w/w) 포도당 공급으로 구성되었다. 2단계 시작 시 50%(v/v) 메탄올 펄스를 적용하여 메탄올 농도를 1.5%(v/v)의 목표로 증가시켰고 후속 메탄올 공급을 시작하여 포도당 공급으로 메탄올 소비, 증발 및 희석을 상쇄했다. (3) 3단계는 72.9시간 동안 메탄올만 공급하는 것으로 구성되었다. 이 단계에서 반응기 교반기 속도는 일정한 760rpm으로 설정되고 기체 공급은 9.5sL/h로 설정되었다. 메탄올 농도는 실시예 6d)에 기재된 바와 같이 매일 HPLC에 따라 측정하였다. 필요한 경우 추가 보상 펄스가 추가되었다.

b) 메탄올 공급은 실시예 9b)에서와 같이 시간 간격으로 계산되었다:

c) 공정 및 생산성 데이터는 표 12에서 찾을 수 있다. 두 반복의 배양을 통한 최대 및 최소 메탄올 농도 범위는 6.9g/L에서 11.4g/L이다. 전체 평균 특정 생산성은 45.8 μg g^-1 h^-1이었고, 3단계의 평균 특정생산성은 34.0 μg g^-1 h^-1이었다. 배양 종료 시 메탄올 농도는 반응기 R1 및 R2에 대해 8.0g/L였다. 반응기 R1 및 R2에 의해 단계 3에서 소비된 메탄올의 양은 14.4g 및 14.1g이었다. 이는 실시예 9b)에 나타낸 방정식에 의해 계산되었다. 바이오매스가 3단계에서 일정했기 때문에 실시예 9b)에 나타낸 바와 같이 3단계에 대한 메탄올 흡수율을 계산하였다(q_methanol). 단계 3에서 반응기 R1에 대한 q_methanol은 4.61 mg g^-1 h^-1이었고 반응기 R2에 대한 q_methanol은 4.54 mg g^-1 h^-1이었다. 전체적으로 바이오매스는 3단계에서 반응기 R1 및 R2에 대해 5.7% 및 5.5% 감소했다. 다시 말하지만, 이것은 P. pastoris △aox1△aox2 균주를 사용하여 명백한 성장이 없는 균주 생산이 가능함을 보여준다. 메탄올만을 탄소원으로 하여 3단계에서 생산된 재조합 단백질의 평균 총량은 106mg으로 실시예 9, 3단계에서 생산된 재조합 단백질 105mg과 유사하다. 이것은 또한 이 실시예에서 32.9 μg g^-1 h^-1 및 34.0 μg g^-1 h^-1에서 실시예 9의 3단계에서 유사한 비 생산성에 의해 설명된다. 결론적으로, 3단계(메탄올 단독 공급 단계)의 생산성은 배양이 2단계(포도당 공급 단계)에서 유도되었는지 여부에 의존하지 않았다. 재조합 단백질 생산은 성장과 무관하기 때문에 메탄올 단독 공급 전략은 P. pastoris △aox1△aox2 균주와 함께 사용될 때 몇 가지 이점이 있다. 실시예 8에서와 같이 메탄올 단독 공급 단계가 없는 생물반응기 배양에서 공정은 최대 반응기 부피 및 효모 건조 질량 농도에 의해 제약을 받는다. 특정 시간이 지나면 이러한 제약이 최대 부피 또는 원하는 최대 바이오매스 농도에 도달하여 배양 과정을 중지한다. 실시예 9에서와 같이 P. pastoris △aox1△aox2와 함께 메탄올 공급 단계를 사용함으로써 바이오매스가 증가하지 않고 부피 증가가 무시할 수 있기 때문에 배양 시간은 더 이상 바이오매스 농도 또는 부피에 의해 제한되지 않는다. 결과적으로 높은 바이오매스 농도의 배양은 이러한 제약 조건에 도달하지 않고 더 오랜 기간 동안 생물 반응기에 보관될 수 있으며 관심 있는 단백질의 농도를 증가시키는 더 긴 생산 단계를 허용한다. 다음 실시예 12에 나타난 바와 같이 메탄올 이용이 느린 P. pastoris △aox1 균주를 사용할 때 메탄올 단독 공급 단계도 적용되지만 P. pastoris △aox1는 메탄올 단독 공급에서 지속적으로 성장하므로 이러한 이점이 존재하지 않습니다. 논의된 것과 동일한 제약을 나타냅니다. P. pastoris △aox1를 P. pastoris △aox1△aox2와 동일한 메탄올 공급 속도로 제한하면 생산성 손실이 발생합니다. P. pastoris △aox1△aox2 균주의 추가 공정 관련 개선 사항은 실시예 12에서 논의된다.

	Time (h)	Volume (mL)		YDM (g/L)		Total Biomass (g)		Recombinant protein concentration (mg/L)		Specific productivity (q_P) (μg g^-1 h^-1)		Methanol concentration (g/L)
Phase		R1	R2	R1	R2	R1	R2	R1	R2	R1	R2	R1	R2
1	20.13	318.0	317.7	25.0	24.9	7.9	7.9	0.0	0.0	0.0	0.0
2	21.87											11.0*	11.4*
	29.92	374.5	374.2	65.3	64.6	24.7	24.5	47.7	51.9	88.6	97.3
	45.02	464.2	461.8	104.0	103.1	49.4	48.7	203.0	243.4	87.1	108.6	7.2	6.9
33	53.00	462.7	460.9	99.7	99.5	48.4	48.2	246.1	265.5	38.6	21.5
	69.58	457.4	455.6	95.9	96.3	47.4	47.4	357.3	371.8	47.3	44.9	7.9	7.5
	93.93	459.8	458.3	91.9	91.2	46.9	46.5	459.5	515.0	33.9	47.4	8.2	7.1
	118.12	462.0	460.8	88.3	87.3	46.6	46.0	494.8	568.2	14.8	21.6	8.0	8.0

* Represents a control sample after the methanol pulse.

실시예 11 : 배양 전략 3 - VHH를 분비하는 P. pastoris △aox1△aox2 에 글루코오스/메탄올 동시 공급 단계 및 분리된 메탄올 단독 공급 단계를 사용한 공급 전략

다른 분비 단백질을 사용한 분비 재조합 단백질 생산을 확인하기 위해 실시예 10a)에 기재된 생물반응기 배양을 균주 P. pastoris △aox1△aox2 pPM2pZ30_pAOX1_αMF-vHH_CycTT로 반복하였다.

a) 실시예 10a)에서와 같이, 이 생물반응기 배양은 3단계로 분리되었다. (1) 1단계는 배치 단계였다. 이를 위해 실시예 7a) b)에 기술된 바와 같이 시작 OD₆₀₀이 2인 생산 균주 P. pastoris △aox1△aox2 pPM2pZ30_pAOX1_αMF-vHH_CycTT를 반응기에 접종하였다. 배치 단계는 반응기 R1 및 R2에 대해 각각 18.79 및 19.33시간 동안 지속되었다. 배치 단계의 끝은 용존 산소 피크로 표시되었다. (2) 이 시점에서 2단계가 시작되었다. 2단계는 실시예 10에서보다 훨씬 더 높은 바이오매스를 증가시키기 위해 33.9시간 동안 4.8mL/h에서 50%(w/w) 포도당 공급으로 구성되었다. 2단계의 시작에서 50%(v/v) 메탄올 펄스는 메탄올 농도를 1.5%(v/v)의 목표 값으로 증가시키기 위해 첨가하고 후속 메탄올 공급을 시작하여 메탄올 소비, 증발 및 포도당 공급에 의한 희석을 상쇄했다. (3) 3단계는 63.9시간 동안 메탄올만 공급하는 것으로 구성되었다. 교반기 속도는 일정한 760 rpm으로 설정되었고 기체 공급은 9.5 sL/h로 설정되었다. 메탄올 농도는 실시예 6d)에 기재된 바와 같이 매일 HPLC에 따라 측정하였다. 필요한 경우 추가 보상 펄스가 추가되었다.

b) 메탄올 공급물을 실시예 9b)에 기재된 바와 같이 계산하였다.

공정 및 생산성 데이터는 표 13에서 찾을 수 있다. 두 반복의 배양을 통한 최대 및 최소 메탄올 농도 범위는 8.7g/L(R1)에서 11.3g/L(R1)입니다. 전체 평균 특정 생산성은 118.0 μg g^-1 h^-1이었고 3단계에서는 88.2 μg g^-1 h^-1이었다. 배양 종료 시 메탄올 농도는 반응기 R1 및 R2에 대해 10.5 및 10.8 g/L이었다. 반응기 R1 및 R2에 의해 소비된 메탄올의 양은 26.6g 및 26.0g이었다. 이는 실시예 8e)에 나타낸 바와 같이 하기 방정식에 의해 계산하였다. 이 양은 더 높은 바이오매스 농도로 인해 실시예 10에서와 같이 더 높지만 Mut^S 균주(실시예 12에 기술됨)에서보다 여전히 현저히(5배) 낮다. 바이오매스는 3단계에서 일정하기 때문에 메탄올 흡수율(q_methanol)은 실시예 9b에 나타낸 바와 같이 3단계에 대해 계산되었다. 단계 3에서 반응기 R1에 대한 q_methanol은 4.75 mg g^-1 h^-1이었고 반응기 R2에 대해서는 4.68 mg g^-1 h^-1이었다.

c) 전체적으로 바이오매스는 이전 실시예에서와 같이 3단계에서 반응기 R1 및 R2에 대해 4.4% 및 4.9% 감소했다. 표 13의 데이터는 P. pastoris △aox1△aox2 균주가 리터당 그램 양으로도 분비된 재조합 단백질을 생산할 수 있음을 분명히 보여준다. 메탄올 단독 공급 단계에서 vHH 농도는 815.5 mg/L만큼 증가했으며, 이는 메탄올을 유일한 탄소원으로 사용하여 평균 총 323.1 mg의 항체 단편이 생성되었음을 의미한다.

	Time (h)	Volume (mL)		YDM (g/L)		Total biomass (g)		Recombinant protein concentration (mg/L)		Specific productivity (q_P) (μg g^-1 h^-1)		Methanol concentration (g/L)
Phase		R1	R2	R1	R2	R1	R2	R1	R2	R1	R2	R1	R2
1	20.00	316.7	316.7	25.1	25.2	7.9	8.0	0.0	0.0	0.0	0.0
2	21.42											10.9*	10.9*
	28.22	358.4	358.7	60.2	60.1	21.9	21.9	58.2	59.7	137.8	141.5
	44.83	449.9	449.8	105.8	105.2	48.6	48.3	494.4	464.5	222.8	208.3	7.8	7.9
	53.58	499.8	499.4	124.1	122.9	64.3	63.7	776.8	854.1	176.0	246.2
3	68.83	502.5	503.3	115.5	116.3	61.8	62.3	1156.0	1030.0	142.5	72.2	8.7	9.5
	92.00	511.3	511.1	110.8	109.4	61.8	61.1	1337.2	1374.0	55.8	97.5	11.3	9.8
	117.92	525.0	527.3	104.7	102.7	61.5	60.6	1623.2	1638.6	85.7	85.8	10.5	10.8

* Represents a control sample after the methanol pulse.

실시예 11.1 : 확립된 생물반응기 배양 프로토콜로 배양한 메탄올 활용도가 느린 P. pastoris △aox1 (Mut ^S )와 비교하여 P. pastoris △aox1△aox2 (Mut ^- ) 균주를 사용하여 얻은 공정 매개변수.

비교를 위해 P. pastoris △aox1 pPM2pN21_pAOX1_HSAopt_CycTT를 Mut^S 표현형에 대해 확립된 배양 프로토콜로 배양했다(Potvin, Ahmad, & Zhang, 2012).

a) 이 생물 반응기 배양은 4단계로 분리되었다. (1) 1단계는 배치 단계였다. 이를 위해 반응기에 실시예 7a) b)에 기술된 바와 같이 시작 OD₆₀₀이 2인 생산 균주 P. pastoris △aox1 pPM2pN21_pAOX1_HSAopt_CycTT를 접종하였다. 배치 단계는 반응기 R1 및 R2에 대해 각각 20.17 및 20.30시간 동안 지속되었다. 배치 단계의 끝은 용존 산소 피크로 표시되었다. (2) 2단계는 8시간 동안 선형으로 증가하는(y = 0.225x + 1.95) 60% 글리세롤 공급이다. (3) 3단계는 18시간 동안 선형 감소(y = 3.75 - 0.111x) 60% 글리세롤 공급과 선형 증가(y = 0.028x + 0.6) 100% 메탄올 공급이 있는 동시 공급 단계이다. (4) 단계 4는 72시간 동안 선형으로 증가하는 100% 메탄올 공급(y = 0.028x + 1.10)이 있는 메탄올 단독 공급 단계이다. 총 실행 시간은 119.25시간이었다.

b) 글리세롤 및 메탄올 공급물은 DASGIP 제어 소프트웨어(Eppendorf AG, Germany)에 의해 a)의 방정식에 따라 중량 측정적으로 제어되었다.

c) 공정 및 생산성 데이터는 표 131에서 확인할 수 있습니다. 3~4단계(생산 단계)의 전체 평균 비 생산성은 61.7 μg g^-1 h^-1이었다. 소비된 메탄올의 평균 총량은 전체 배양 기간 동안 165.8g이었고 4단계(메탄올 단독 공급 단계)에서 150.6g이었다. 이것이 메탄올 제한 배양이기 때문에 배양 브로쓰의 잔류 메탄올 농도는 0으로 간주되었다. 이 실시예의 4단계는 실시예 9, 10 및 11의 3단계에 해당한다. 단계 4의 평균 바이오매스에 기초하여 실시예 9b)에 나타낸 바와 같이 메탄올 흡수율(q_methanol)을 계산했다. 반응기 R1에 대한 4단계의 q_methanol은 반응기 R2에 대해 37.1 mg g^-1 h^-1 및 37.6 mg g^-1 h^-1이다. 4단계의 q_methanol은 원치 않는 바이오매스 증가를 촉진한다. 배양 종료 시 총 바이오매스의 53.2%(R1) 및 52.4%(R2)는 메탄올에서 4단계 성장 동안 생성된다.

d) 변형 관련 공정 매개변수의 비교가 표 132에 나타나 있으며 제시된 예의 특정 메탄올 흡수율 및 공급 속도에 대한 개요는 표 133에 나와 있다. P. pastoris △aox1△aox2 Mut^-를 사용하여 재조합 단백질 생산을 위한 여러 주요 공정 매개변수가 P. pastoris △aox1를 사용한 공정에 비해 상당히 개선되었다. 반응열이 80% 이상 감소하여 냉각 필요성이 감소한다. 특정 산소 흡수율과 산소 전달율이 80% 이상 감소하여 혼합 및 통기의 필요성이 줄어들고 통기의 유량이 감소하고 생물 반응기 용기에 순수한 산소를 공급해야 할 필요성이 줄어든다. 낮은 특정 메탄올 흡수율은 배양에 필요한 메탄올의 양을 감소시킨다. 메탄올은 독성이 있고 가연성이다.

Mut^- 균주를 사용하면 생산 시설에서 처리 및 저장해야 하는 메탄올의 양이 줄어들기 때문에 기술 및 안전성이 향상된다. 또 다른 이점은 높은 메탄올 농도에 대한 P. pastoris △aox1△aox2의 낮은 민감도이다. 이는 실시예 10의 균주 P. pastoris △aox1△aox2 및 본 실시예의 P. pastoris △aox1의 세포 생존율 데이터에 의해 확인된다. 실시예 10에서 공정 종료 시 반응기 R1 및 R2에서 돌연변이 세포의 생존율은 99.8% 및 99.7%였다. 대조적으로, 이 실시예에서 반응기 R1 및 R2에서 Mut^S 세포의 세포 생존율은 95.9% 및 96.5%였다. P. pastoris △aox1△aox2 균주의 낮은 감도와 높은 생존력은 재조합 생산 분비 단백질의 순도에 영향을 미친다. 용해된 세포는 관심 단백질을 분해하고 상청액에 원치 않는 가용성 단백질을 추가하는 프로테아제를 방출한다. 두 효과는 모두 순도를 낮추고 상청액에서 관심 단백질의 손실을 초래한다. 이 실시예에서 P. pastoris △aox1의 순도는 반응기 R1 및 R2에 대해 72% 및 77%인 반면, 실시예 10에서 P. pastoris △aox1△aox2의 순도는 반응기 R1 및 R2 모두에 대해 85%였다.

	Time (h)	Volume (mL)		YDM (g/L)		Total biomass (g)		Recombinant protein concentration (mg/L)		Specific productivity (q_P) (μg g^-1 h^-1)
Phase		R1	R2	R1	R2	R1	R2	R1	R2	R1	R2
1	20.3	318.1	316.5	26.6	25.9	8.5	8.2
2	28.5	330.4	328.6	51.6	51.4	17.0	16.9	0.0	0.0	0.00	0.0
3	47.1	392.5	390.3	99.6	100.4	39.1	39.2	129.6	112.9	65.57	56.6
4	69.8	428.4	426.5	111.5	111.4	47.7	47.5	260.9	306.7	36.89	53.9
	92.9	487.8	487.3	126.9	124.6	61.9	60.7	548.1	534.7	67.14	56.7
	119.3	581.9	584.9	143.7	140.8	83.6	82.3	893.9	927.9	61.55	72.7

		P. pastoris △aox1△aox2 pPM2pN21_ pAOX1_HSAopt_CycTT Example 10	P. pastoris △aox1 pPM2pN21_ pAOX1_HSAopt_CycTT Example 11.1	Change
Overall	HSA concentration (mg/L)	531	911	-42%
Overall	q_product (μg g^-1 h^-1)	46	62	-26%
Methanol only feed phase: Example 10 - Phase three; Example 11.1 - Phase four	Duration (h)	73.1	72.2
	Heat production rate (W/L)	3	19.2	-84%
	OTR (mM/h)	23	149	-85%
	Heat of reaction (kJ) Integrated OTR (MA 120 min)	359	2286	-84%
	Heat of combustion (kJ)	324	2468	-87%
	qO₂ (mmol g^-1 h^-1)			-81%
	q_methanol (mg g^-1 h^-1)	4.6	37.4	-88%
	Protein (mg)	106	250	-58%
	Protein/methanol(mg g^-1)	7	1.7	+311%
	Protein/0₂(mg mol^-1)	135	51	+164%
	Protein/Heat of reaction (mg kJ^-1)	0.30	0.11	+172%

	Example 7		Example 9		Example 10		Example 11		Example 11.1
Reactor	R1	R2	R3	R4	R1	R2	R1	R2	R1	R2
q_methanol(mg g^-1 h^-1)	4.92	5.22	3.79	3.92	4.61	4.54	4.75	4.68	37.1*	37.1*
Feed rate(mg g^-1 h^-1)	NA	NA	4.79	4.89	5.80	5.73	5.78	7.71	37.1	37.6

실시예 12 : 메탄올 이용 음성 및 알코올 탈수소효소 결함 균주의 생성.

실시예 7에서 관찰된 P. pastoris Mut^- 균주의 메탄올 소비는 예상치 못한 새로운 것이었다. 이 지식에 기초하여 알코올 탈수소효소가 이러한 특성에 책임이 있을 수 있다는 가설이 형성되었다. P. pastoris △aox1△aox2에서 메탄올 소비에 대한 알코올 탈수소효소의 효과를 테스트하기 위해 두 가지 잠재적 알코올 탈수소효소 ADH2: PP7435_Chr2-0821 및 ADH900: PP7435_Chr2-0990을 선택하여 삭제했다. (1) ADH2 결손주, (2) ADH900 결손주, (3) 이중 결실 ADH2 & ADH900 균주가 항생제 내성 유전자의 코딩 영역을 교환하여 3개의 균주를 생성하였다. 효과적인 균주 (1) P. pastoris △aox1△aox2 adh2△::HphR, (2) P. pastoris △aox1△aox2 adh900△::KanMX 및 (3) P. pastoris △aox1△aox2 adh2△::HphR adh900△::KanMX가 생성되었다.

a) P. pastoris △aox1△aox2를 실시예 1a)에 기술된 바와 같이 전기적격으로 만들었다. ADH2 결실을 생성하기 위해 유출된 마커 접근법이 실시예 1b)에 기술된 바와 같이 사용되었다. 전기적격 세포를 실시예 1d)에 기재된 바와 같이 500ng의 Adh2 분할 마커 카세트 1 및 500ng Adh2 분할 마커 카세트 2로 형질전환시켰다. 카세트 서열은 표 14에서 찾을 수 있다. 형질전환체는 200㎍/mL 하이그로마이신이 포함된 YPD 플레이트에서 선택되었다. 하나의 클론은 PCR 증폭 및 PCR 앰플리콘의 시퀀싱을 기반으로 선택되었다. ADH2 코딩 영역의 항생제 마커로의 성공적인 치환은 프라이머 Adh2_KO_ctrl_fwd & Adh2_KO_ctrl_rev(표 15)를 사용한 PCR 증폭 및 PCR 앰플리콘(Microsynth AG, Swiss)의 시퀀싱에 의해 확인되었다. 생성된 균주를 (1) P. pastoris △aox1△aox2 adh2△::HphR이라고 한다.

b) P. pastoris △aox1△aox2 균주를 실시예 1a)에 기술된 바와 같이 전기적격으로 만들었다. 전기적격 세포를 실시예 1d)에 기재된 바와 같이 500ng의 Adh900 분할 마커 카세트 1 및 500ng Adh900 분할 마커 카세트 2로 형질전환시켰다. 카세트 서열은 표 14에서 찾을 수 있다. 형질전환체는 500㎍/mL Geneticin이 포함된 YPD 플레이트에서 선택되었다. 하나의 클론은 PCR 증폭 및 PCR 앰플리콘의 시퀀싱을 기반으로 선택되었다. ADH900 코딩 영역의 항생제 마커로의 성공적인 치환은 프라이머 AdhII_KO_Ctrl_fwd & AdhII_KO_Ctrl_rev(표 15)를 사용한 PCR 증폭 및 PCR 앰플리콘(Microsynth AG, Swiss)의 시퀀싱에 의해 확인되었다. 생성된 균주를 (2) P. pastoris △aox1△aox2 adh900△::KanMX라고 한다.

c) P. pastoris △aox1△aox2 adh2△::HphR 균주를 주 배양 배지에 200㎍/mL 하이그로마이신을 첨가한 것을 제외하고는 실시예 1a)에 기술된 바와 같이 전기 적합성으로 만들었다. 전기적격 세포를 실시예 1d)에 기재된 바와 같이 500ng의 Adh900 분할 마커 카세트 1 및 500ng Adh900 분할 마커 카세트 2로 형질전환시켰다. 카세트 서열은 표 14에서 찾을 수 있다. 형질전환체는 200㎍/mL 하이그로마이신 및 500㎍/mL 제네티신이 포함된 YPD 플레이트에서 선택되었다. 하나의 클론은 PCR 증폭 및 PCR 앰플리콘의 시퀀싱을 기반으로 선택되었다. ADH900 코딩 영역의 항생제 마커로의 성공적인 치환은 프라이머 AdhII_KO_Ctrl_fwd & AdhII_KO_Ctrl_rev(표 15)를 사용한 PCR 증폭 및 PCR 앰플리콘(Microsynth AG, Swiss)의 시퀀싱에 의해 확인되었다. 생성된 균주를 (3) P. pastoris △aox1△aox2 adh2△::HphR adh900△::KanMX라고 한다.

d) PCR 증폭을 위한 게놈 DNA는 제조업체의 권장 사항에 따라 Wizard® Genomic DNA Purification Kit(Promega Corporation, USA)를 사용하여 분리되었다. PCR 증폭 반응은 제조사의 권고에 따라 Q5 중합효소(New England Biolabs, Inc., USA)를 사용하여 수행되었다.

DNA fragment	DNA sequence 5' to 3'
Adh2split marker cassette 1	(SEQ ID NO:72) CGTATCTACCGATGATGGCACCAGCCTCCATCTGTTCGTAGACCTTAGCAAGTTCAGACAGACCGATAATCTTGATAGGAGCCTTGACCAAACCTCTGGTGAACAAGTCGATGGCCTCGGCACTGTCCTCTCTGTTTCCAACGTAAGATCCCTTGATCTCGATGGACTTCAGAACGTGCCAGAAAACGTCAGAGTTGACAACGGCACCAGATGGCAGACCAACCAAAACAACCTTACCCAAAGTTCTAACGTATTGGACAGATTGGTTGATAGCATGTGGGGAAACGGAGACGTTAATAACACCGTGTGGACCACCGTTGGTGAGCTTTTGGACTTCAGCAACGACGTCCTTAGTCTTAGTGAAGTCGACGAAGACCTCAGCACCCAAGGACTTGACAAATTCACCCTTGTCGGCACCACCATCAATACCCAAAACTCTCAAACCCAGAGCCTTGGCGTATTGAACGGCAAGAGAACCCAGTCCTCCACCAGCACCAGAAATGGCAACCCATTGGCCAATACGCAAGTCAGCGGTCTTAAGAGCCTTGTAAACGGTGATACCAGCACACAGAATTGGGGCAACTTCAGCCAAGTCAGCCTCCTTTGGAATTCTGGCGGCTTGGGTGGCATCAGCAGTAGCATACTGCTGGAAAGATCCGTCGTGGGTGAAACCAGACAGGTCAGCCTTGGCACAACTGGATTCAGCACCTTGGATACAGTACTCACAGTTCAAACAAGAACCGTTCAACCATTTGATACCAGCGTAGTCACCGATAGTGGATCTGATATCACCTAATAACTTCGTATAGCATACATTATACGAAGTTATATTAAGGGTTCTCGAATGGTACCTTGCTCACATGTTGATCTCCAGCTTGCAAATTAAAGCCTTCGAGCGTCCCAAAACCTTCTCAAGCAAGGTTTTCAGTATAATGTTACATGCGTACACGCGTCTGTACAGAAAAAAAAGAAAAATTTGAAATATAAATAACGTTCTTAATACTAACATAACTATAAAAAAATAAATAGGGACCTAGACTTCAGGTTGTCTAACTCCTTCCTTTTCGGTTAGAGCGGATGTGGGGGGAGGGCGTGAATGTAAGCGTGACATAACTAATTACATGATATCGACAAAGGAAAAGGGGGACGGATCTCCGAGGTAAAATAGAACAACTACAATATAAAAAAACTATACAAATGACAAGTTCTTGAAAACAAGAATCTTTTTATTGTCAGTACTGATTATTCCTTTGCCCTCGGACGAGTGCTGGGGCGTCGGTTTCCACTATCGGCGAGTACTTCTACACAGCCATCGGTCCAGACGGCCGCGCTTCTGCGGGCGATTTGTGTACGCCCGACAGTCCCGGCTCCGGATCGGACGATTGCGTCGCATCGACCCTGCGCCCAAGCTGCATCATCGAAATTGCCGTCAACCAAGCTCTGATAGAGTTGGTCAAGACCAATGCGGAGCATATACGCCCGGAGCCGCGGCGATCCTGCAAGCTCCGGATGCCTCCGCTCGAAGTAGCGCGTCTGCTGCTCCATACAAGCCAACCACGGCCTCCAGAAGAAGATGTTGGCGACCTCGTATTGGGAATCCCCGAACATCGCCTCGCTCCAGTCAATGACCGCTGTTATGCGGCCATTGTCCGTCAGGACATTGTTGGAGCCGAAATCCGCGTGCACGAGGTGCCGGACTTCGGGGCAGTCCTCGGCCCAAAGCATCAGCTCATCGAGAGCCTGCGCGACGGACGCACTGACGGTGTCGTCCATCACAGTTTGCCAGTGATACACATGGGGATCAGCAATCGCGCATATGAAATCACGCCATGTAGTGTATTGACCGATTCCTTGCGGTCCGAATGGGCCGAACCCGCTCGTCTGGCTAAGATCGGCCGCAGCGATCGCATCCATGGCCTCCGCGACCGGCTGCAGAACAGCGGGCAGTTCGGTTTCAGGCAGGTCT
Adh2split marker cassette 2	(SEQ ID NO:73) AGATGTTGGCGACCTCGTATTGGGAATCCCCGAACATCGCCTCGCTCCAGTCAATGACCGCTGTTATGCGGCCATTGTCCGTCAGGACATTGTTGGAGCCGAAATCCGCGTGCACGAGGTGCCGGACTTCGGGGCAGTCCTCGGCCCAAAGCATCAGCTCATCGAGAGCCTGCGCGACGGACGCACTGACGGTGTCGTCCATCACAGTTTGCCAGTGATACACATGGGGATCAGCAATCGCGCATATGAAATCACGCCATGTAGTGTATTGACCGATTCCTTGCGGTCCGAATGGGCCGAACCCGCTCGTCTGGCTAAGATCGGCCGCAGCGATCGCATCCATGGCCTCCGCGACCGGCTGCAGAACAGCGGGCAGTTCGGTTTCAGGCAGGTCTTGCAACGTGACACCCTGTGCACGGCGGGAGATGCAATAGGTCAGGCTCTCGCTGAATTCCCCAATGTCAAGCACTTCCGGAATCGGGAGCGCGGCCGATGCAAAGTGCCGATAAACATAACGATCTTTGTAGAAACCATCGGCGCAGCTATTTACCCGCAGGACATATCCACGCCCTCCTACATCGAAGCTGAAAGCACGAGATTCTTCGCCCTCCGAGAGCTGCATCAGGTCGGAGACGCTGTCGAACTTTTCGATCAGAAACTTCTCGACAGACGTCGCGGTGAGTTCAGGCTTTTTACCCATGGTTTAGTTCCTCACCTTGTCGTATTATACTATGCCGATATACTATGCCGATGATTAATTGTCAACACCGCCCTTAGATTAGATTGCTATGCTTTCTTTCTAATGAGCAAGAAGTAAAAAAAGTTGTAATAGAACAAGAAAAATGAAACTGAAACTTGAGAAATTGAAGACCGTTTATTAACTTAAATATCAATGGGAGGTCATCGAAAGAGAAAAAAATCAAAAAAAAAAAATTTTCAAGAAAAAGAAACGTGATAAAAATTTTTATTGCCTTTTTAGACGAAGAAAAAGAAACGAGGCGGTCTCTTTTTTCTTTTCCAAACCTTTAGTACGGGTAATTAACGACACCCTAGAGGAAGAAAGAGGGGAAATTTAGTATGCTGTGCTTGGGGGTTTTGNAAATGGTACGGCGATGCGCGGAATCCGAGAAAATCTGGAAGAGTAAAAAAGGAGTAGAAACATTTTGAAGCTATGGTGTGTGGTACCGATCTAGACCTAATAACTTCGTATAGCATACATTATACGAAGTTATATTAAGGGTTGTCGACCTGCAGCGTACGGCACGAATTCGCACCCCGGAGAGCGCTCACCCCCGTTTTCAAACAGCGGGGGGAGCACAAAATGTTGAAAACTACACAGATCTTTTCGGACACCGGTCGCTTTATGTAGTCGACATGCAGATTCTCCCAAATGGAAAACGAGATTGGACAATTTGTGGAGTTGGAAAGGGGGGTGGGAATCAACGAAATTAGCAGATTCATGGGCAATTGGCAGGACTGGGCAGAAGGGGTGAGAATTGCAATCGAATGGAACAGGCACTCCCGTTGCGAAATCAAAAAAGTCTCGCTATCTGAACTGATTTTTTTTAAGCAGCAACTTACGGTCAATACATCTCCGATGGAGGAATTTTTCACCCCTCGCTAACTAGATGGGCCCCTTCTAAGAAATTTGGGTTTAAGGTTGGGCAGTCAGTCAGTGCACCAATGCTAACTGCCATTTGTCCAAAGAGGGGTGCAAGGATGAGGGACCGTTGAGAATAAGATTTGGGGTGTTAATCGGTGATACTGATTTGTCAAAGAGTGGGGAGGACTGCTGGGCATTGTTCACCCCCCTAGTTGTTAGAGTTCGATAGCCGGCCGAATCACCCCCCTCTTCTTACATAATCATTGTCACTATGTGGGGTCTCTACAGTCTCACCCTGCGATCCGGGACGACGCCGCGAAATTAGGGGGCAAGTCTCCTCCGGGCATGCAATATTGGTAACAGGATCAATTGATGCGAGAAAAGTTGGAGGGGGTGTAAAATTCAAGCCCACAAAGTCACACCCTTATGCCTGTAGAGGGGCAATCGGAGAGCAGCCATGGGGTGT
Adh900split marker cassette 1	(SEQ ID NO:74) CACTCCAGTTGGGCCATTACCGAACATTTTGCCATTGTAGGCGATTAGTAAGTATTAACAAGACAGCTGACTATACGTTTATTCTCAAACAATATTTCCCTTTTTGGTTTTGACCTCGCTTTAATCAATTTTTCAGACCTGATCCCACCTACTTTTCTTCGGCCTCAACTTCAATCTGACTCTTCTCTCTCAATTGGTACCAACCAGCCAGAAAATGTCCTTCCGTTACTTGAAACGGCATTTCTCTACAGCTACAAACGCAATTGCTCTCCTTAGCAGACCTGAATTCAAAATAGGTCGAATTGTGGACGTCGTGAAACATCCAAATGCAGACAAACTTTATGTCTCGTCGATTTCTGTGGGAAACAATTATGCCTCGGGTACATCCAACACCCTAACCGTTTGCAGCGGCTTGGTGGACTACTTTTCAGTTCCCGAATTGCTTCAGCGACGGGTCGTTGTGGTCACAAACCTCAAGCCATCGAAGATGAGAGGTGTAACATCGGAGGCAATGCTTTTGGCAGGGGAAAAGTCGGGGAAAGTGGAATTGGTCGAGCCGCCAATGTCCGGGAGAGAGGGCGAATCACTCCACTTCGAAGGTGTAGAAATTACATCAGAGGAGAGCGCCAATCAATTGCATTTGCCTGCTAAGCGATTGAAGAAGTCAGAGTGGAGTCAACTGGCGGAAGGTCTACAGACAAATGACCAGCGTGAAGTGGTCTTCCACAGCCAAATTGGCTCCAAACGAATTTACGCTTTAGTAGGAGCGAGTACTGAAAAATGCACGTTAGCGACTCTTGCGCAGGCCGTCGTACGATAAGGGCAATATGGTTGAGAACGTTCCTCACCCAAATAAAATCATCGTACGCTGCAGGTCGACAACCCTTAATATAACTTCGTATAATGTATGCTATACGAAGTTATTAGGTCTAGATCGGTACCGACATGGAGGCCCAGAATACCCTCCTTGACAGTCTTGACGTGCGCAGCTCAGGGGCATGATGTGACTGTCGCCCGTACATTTAGCCCATACATCCCCATGTATAATCATTTGCATCCATACATTTTGATGGCCGCACGGCGCGAAGCAAAAATTACGGCTCCTCGCTGCAGACCTGCGAGCAGGGAAACGCTCCCCTCACAGACGCGTTGAATTGTCCCCACGCCGCGCCCCTGTAGAGAAATATAAAAGGTTAGGATTTGCCACTGAGGTTCTTCTTTCATATACTTCCTTTTAAAATCTTGCTAGGATACAGTTCTCACATCACATCCGAACATAAACAACCATGGGTAAGGAAAAGACTCACGTTTCGAGGCCGCGATTAAATTCCAACATGGATGCTGATTTATATGGGTATAAATGGGCTCGCGATAATGTCGGGCAATCAGGTGCGACAATCTATCGATTGTATGGGAAGCCCGATGCGCCAGAGTTGTTTCTGAAACATGGCAAAGGTAGCGTTGCCAATGATGTTACAGATGAGATGGTCAGACTAAACTGGCTGACGGAATTTATGCCTCTTCCGACCATCAAGCATTTTATCCGTACTCCTGATGATGCATGGTTACTCACCACTGCGATCCCCGGCAAAACAGCATTCCAGGTATTAGAAGAATATCCTGATTCAGGTGAAAATATTGTTGATGCGCTGGCAGTGTTCCTGCGCCGGTTGCATTCGATTCCTGTTTGTAATTGTCCTTTTAACAGCGATCGCGTATTTCGTCTCGCTCAGGCGCAATCACGAATGAATAACGGTTTGGTTGATGCGAGTGATTTTGATGACGAGCGTAATGGCTGGCCTGTTGAACAAGTCTGGAAAGAAATGCATAAGCTTTTGCCATTCTCACCG
Adh900split marker cassette 2	(SEQ ID NO:75) AAGCCCGATGCGCCAGAGTTGTTTCTGAAACATGGCAAAGGTAGCGTTGCCAATGATGTTACAGATGAGATGGTCAGACTAAACTGGCTGACGGAATTTATGCCTCTTCCGACCATCAAGCATTTTATCCGTACTCCTGATGATGCATGGTTACTCACCACTGCGATCCCCGGCAAAACAGCATTCCAGGTATTAGAAGAATATCCTGATTCAGGTGAAAATATTGTTGATGCGCTGGCAGTGTTCCTGCGCCGGTTGCATTCGATTCCTGTTTGTAATTGTCCTTTTAACAGCGATCGCGTATTTCGTCTCGCTCAGGCGCAATCACGAATGAATAACGGTTTGGTTGATGCGAGTGATTTTGATGACGAGCGTAATGGCTGGCCTGTTGAACAAGTCTGGAAAGAAATGCATAAGCTTTTGCCATTCTCACCGGATTCAGTCGTCACTCATGGTGATTTCTCACTTGATAACCTTATTTTTGACGAGGGGAAATTAATAGGTTGTATTGATGTTGGACGAGTCGGAATCGCAGACCGATACCAGGATCTTGCCATCCTATGGAACTGCCTCGGTGAGTTTTCTCCTTCATTACAGAAACGGCTTTTTCAAAAATATGGTATTGATAATCCTGATATGAATAAATTGCAGTTTCATTTGATGCTCGATGAGTTTTTCTAATCAGTACTGACAATAAAAAGATTCTTGTTTTCAAGAACTTGTCATTTGTATAGTTTTTTTATATTGTAGTTGTTCTATTTTAATCAAATGTTAGCGTGATTTATATTTTTTTTCGCCTCGACATCATCTGCCCAGATGCGAAGTTAAGTGCGCAGAAAGTAATATCATGCGTCAATCGTATGTGAATGCTGGTCGCTATACTGGTACCATTCGAGAACCCTTAATATAACTTCGTATAATGTATGCTATACGAAGTTATTAGGTGATATCAGATCCACTCTGTAGTGAGGGTTGGTGGTCTGACGAACATCCAGCAAGGTGTTCCACCTGAAATTTTTCACCTTGGAGGGTAATGTGATGACGCCATTTCCTGTGCAAATGCTTTTCGTTTTGAACAGTGCAACTTTTGTATCAGATCTTCATCTACTTGATGCCATCTCAACAAATCCCTCATTTACTAGCGTGTGAAGGAATCTAGATTTTCCACTGATAAGCCAATTTGTCGGAAATCCCCCGCGCGGGAGTTGGCGTTCAGTACGAGCCACACACGTTTCTTTTGGACAACCAAAGCATCCGCCTGAAGGGACAACTTGCATTCAACGGCTTCAGTTGGAAACGTCAGAGCTGACCTATAGTTTGCTAGAACCGTTTTCTCTGTTTACGTTTACGTCTCCTCAAATTTGCGCTCGGTATGTCCTTCCTAATTAGCGGGAAAAGCTGTTCTTAGTTAATACGGAGAAAGTTTCGGGGTTACCGTTCCGGGAAGAGGAGGGGTCATCTCTCTCATCTCATCCAACCATTAAGTTTCTTCCAAAACTTCAGGATAATCAGTTTAACCACCGACAGGAGTCAGATTTGAGATTGACAGAAAGTTTTTCCGTCCATTTCCTCATCTTGTCGCCGTTATCAGTCAATCTCTATGGTTATCTGGAATTTCTTTTTTCTTTTAATTCATCTTCTTTTTATCCCGCGCCTTTGGCGTTCTAGCTCATCTCATGAAAACAAAACCCTCTCATGTTCGGATAATTCCAGCGGCTTTCACTTTCAGATGACACATAGATTGGACTCAACCATGGCTATCTGGGGTATACGGACGTTGGCAAGGGCGTTAATTTTTCAGGACAAACGGAAATGCCATGGCTCCAGGGAAAGGCATTCCTATTGCAAACCTAGACCGTCGAACCTCTCCTATCGCCTACCAGTCACCCAGCTATCCCTAGGCAACTCATCTCCTTCAAGCGGATTGCAACCTGCTAAGCCAAATTAGATCTGGCCACAGAAATGCCGCAATATTTCTTGGCTCTCCCCTCCC

Primer Name	DNA sequence 5' to 3'
Adh2_KO_ctrl_fwd	GAATTGAGCCAAAAAAGGAGAGG (SEQ ID NO:76)
Adh2_KO_ctrl_rev	GATGGAATAGGAGACTAGGTGTG (SEQ ID NO:77)
AdhII_KO_Ctrl_fwd	TGGTTGAGACGTTTGTATTG (SEQ ID NO:78)
AdhII_KO_Ctrl_rev	TGGGTTGGGAGTTTAGTG (SEQ ID NO:79)

실시예 13 : Adh2 및 Adh900 과발현 메탄올 이용 음성 균주의 생성.

ADH2 및 ADH900 과발현의 효과를 확인하기 위하여, 구성적 프로모터 P_GAP: PP7425_Chr1(596296…596790) 및 각각 ADH2 코딩 서열 또는 ADH900 코딩 서열로 구성된 발현 구축물이 생성되었다. ADH2 및 ADH900 코딩 서열(표 16)은 유전자 산물의 아미노산 서열에 영향을 미치지 않으면서 코딩 서열에서 BbsI 및 BsaI 제한 부위를 제거하도록 변형되었다. 생성된 균주는 P. pastoris △aox1△aox2 BB3aZ_pGAP_Adh2_CycTT 및 P. pastoris △aox1△aox2 BB3aZ_pGAP_Adh900_CycTT로 지정되었다.

a) Golden Gate 어셈블리 방법을 사용하기 위해 제한 효소 BbsI 및 BsaI(New England Biolabs, Inc., USA)의 제한 부위는 유전자 산물의 아미노산 서열에 영향을 미치지 않으면서 코딩 서열에서 제거되어야 했다. 이 과정을 경화라고 한다. ADH2 PP7435_Chr2-0821의 코딩 서열은 c.45G>A 및 c.660C>G에서 수정되었다. ADH900 PP7435_Chr2-0990의 코딩 서열은 c.42C>G에서 수정되었다. Golden Gate 어셈블리에 사용된 경화된 코딩 시퀀스는 표 15에서 찾을 수 있다. 처음 12개 염기쌍과 마지막 15개 염기쌍은 코딩 시퀀스의 일부가 아니며 Golden Gate 어셈블리에 필요하다.

b) 여기에 사용된 골든 게이트 어셈블리는 이미 설명되어 있다(Prielhofer et al., 2017). (1) 발현 구조 BB3aZ_pGAP_Adh2_CycTT는 다음과 같이 조립되었다. Adh2_GG_cured DNA 단편(표 15)을 BB1_23 백본에 복제하여 BB1_23_Adh2를 생성했다. 발현 구조는 BB3aZ_14*(백본), BB1_23_Adh2(암호화 서열) BB1_12_pGAP(프로모터), BB1_34_ScCYC1tt(터미네이터)의 골든 게이트 어셈블리에 의해 생성되었다. (2) 발현 구조 BB3aZ_pGAP_Adh900_CycTT를 다음과 같이 조립하였다. Adh900_GG_cured DNA 단편(표 15)을 BB1_23 백본에 복제하여 BB1_23_Adh900을 생성했다. 발현 구성은 BB3aZ_14*(백본), BB1_23_Adh900(암호화 서열), BB1_12_pGAP(프로모터), BB1_34_ScCYC1tt(터미네이터)의 골든 게이트 어셈블리에 의해 생성되었다. 플라스미드 및 서열은 Golden PiCS 키트 # 1000000133(Addgene, Inc., USA)에서 사용할 수 있다.

DNA fragment	DNA sequence 5' to 3'
ADH2coding sequence	(SEQ ID NO:80) ATGTCTCCAACTATCCCAACTACACAAAAGGCTGTTATCTTCGAGACCAACGGCGGTCCCCTAGAGTACAAGGACATTCCAGTCCCAAAGCCAAAGTCAAACGAACTTTTGATCAACGTTAAGTACTCCGGTGTCTGTCACACTGATTTGCACGCCTGGAAGGGTGACTGGCCATTGGACAACAAGCTTCCTTTGGTTGGTGGTCACGAAGGTGCTGGTGTCGTTGTCGCTTACGGTGAGAACGTCACTGGATGGGAGATCGGTGACTACGCTGGTATCAAATGGTTGAACGGTTCTTGTTTGAACTGTGAGTACTGTATCCAAGGTGCTGAATCCAGTTGTGCCAAGGCTGACCTGTCTGGTTTCACCCACGACGGATCTTTCCAGCAGTATGCTACTGCTGATGCCACCCAAGCCGCCAGAATTCCAAAGGAGGCTGACTTGGCTGAAGTTGCCCCAATTCTGTGTGCTGGTATCACCGTTTACAAGGCTCTTAAGACCGCTGACTTGCGTATTGGCCAATGGGTTGCCATTTCTGGTGCTGGTGGAGGACTGGGTTCTCTTGCCGTTCAATACGCCAAGGCTCTGGGTTTGAGAGTTTTGGGTATTGATGGTGGTGCCGACAAGGGTGAATTTGTCAAGTCCTTGGGTGCTGAGGTCTTCGTCGACTTCACTAAGACTAAGGACGTCGTTGCTGAAGTCCAAAAGCTCACCAACGGTGGTCCACACGGTGTTATTAACGTCTCCGTTTCCCCACATGCTATCAACCAATCTGTCCAATACGTTAGAACTTTGGGTAAGGTTGTTTTGGTTGGTCTGCCATCTGGTGCCGTTGTCAACTCTGACGTTTTCTGGCACGTTCTGAAGTCCATCGAGATCAAGGGATCTTACGTTGGAAACAGAGAGGACAGTGCCGAGGCCATCGACTTGTTCACCAGAGGTTTGGTCAAGGCTCCTATCAAGATTATCGGTCTGTCTGAACTTGCTAAGGTCTACGAACAGATGGAGGCTGGTGCCATCATCGGTAGATACGTTGTGGACACTTCCAAATAA
ADH900 coding sequence	(SEQ ID NO:81) ATGTCTGTGATGAAAGCCCTCGTGTACGGTGGTAAGAACGTCTTCGCCTGGAAAAACTTCCCTAAACCAACTATCTTGCACCCAACAGATGTCATCGTTAAGACGGTGGCTACTACCATCTGCGGAACAGACTTGCACATCTTGAAAGGTGATGTTCCAGAGGTCAAACCTGAAACCGTCTTGGGTCATGAAGCAATTGGAGTCGTCGAATCTATCGGTGATAACGTCAAAAACTTCAGCATTGGTGATAAGGTGCTGGTTTCATGCATCACCAGTTGTGGAAGCTGTTACTACTGTAAGAGAAACTTGCAGAGTCATTGCAAGACCGGTGGATGGAAATTAGGTCACGATTTGAACGGTACGCAGGCTGAGTTTGTCCGTATCCCATATGGAGACTTCTCATTGCACCGTATTCCTCATGAAGCAGATGAAAAGGCAGTTCTGATGCTGTCTGACATCTTACCTACTGCTTACGAAGTTGGTGTTCTTGCCGGAAATGTCCAAAAGGGAGACTCAGTTGCCATTGTCGGCGCCGGTCCAGTTGGTCTTGCCGCTCTGCTGACTGTCAAAGCCTTTGAGCCTTCTGAAATTATTATGATTGACACTAACGATGAAAGACTGAGTGCCTCCTTGAAATTGGGAGCCACCAAGGCAGTCAACCCAACCAAGGTCAGCAGTGTCAAAGATGCTGTTTATGATATTGTCAATGCCACTGTCCGCGTCAAGGAGAACGACCTGGAGCCAGGTGTCGATGTTGCCATTGAGTGTGTTGGTGTTCCTGACACGTTTGCAACTTGTGAAGAGATTATCGCCCCAGGTGGCCGTATTGCCAATGTTGGTGTTCACGGCACTAAAGTGGATTTACAACTGCAAGACCTATGGATCAAGAACATTGCTATCACCACCGGTTTGGTAGCCACATACTCCACTAAAGACCTGTTGAAGCGAGTCTCTGACAAGTCTCTAGACCCTACACCACTGGTTACACATGAGTTCAAGTTCAGTGAATTTGAGAAGGCCTATGAGACTTCTCAAAATGCTGCCACCACCAAAGCCATCAAGATTTTCTTATCTGCCGATTAA
Adh2_GG_cured	(SEQ ID NO:82) GATAGGTCTCACATGTCTCCAACTATCCCAACTACACAAAAGGCTGTTATCTTCGAAACCAACGGCGGTCCCCTAGAGTACAAGGACATTCCAGTCCCAAAGCCAAAGTCAAACGAACTTTTGATCAACGTTAAGTACTCCGGTGTCTGTCACACTGATTTGCACGCCTGGAAGGGTGACTGGCCATTGGACAACAAGCTTCCTTTGGTTGGTGGTCACGAAGGTGCTGGTGTCGTTGTCGCTTACGGTGAGAACGTCACTGGATGGGAGATCGGTGACTACGCTGGTATCAAATGGTTGAACGGTTCTTGTTTGAACTGTGAGTACTGTATCCAAGGTGCTGAATCCAGTTGTGCCAAGGCTGACCTGTCTGGTTTCACCCACGACGGATCTTTCCAGCAGTATGCTACTGCTGATGCCACCCAAGCCGCCAGAATTCCAAAGGAGGCTGACTTGGCTGAAGTTGCCCCAATTCTGTGTGCTGGTATCACCGTTTACAAGGCTCTTAAGACCGCTGACTTGCGTATTGGCCAATGGGTTGCCATTTCTGGTGCTGGTGGAGGACTGGGTTCTCTTGCCGTTCAATACGCCAAGGCTCTGGGTTTGAGAGTTTTGGGTATTGATGGTGGTGCCGACAAGGGTGAATTTGTCAAGTCCTTGGGTGCTGAGGTGTTCGTCGACTTCACTAAGACTAAGGACGTCGTTGCTGAAGTCCAAAAGCTCACCAACGGTGGTCCACACGGTGTTATTAACGTCTCCGTTTCCCCACATGCTATCAACCAATCTGTCCAATACGTTAGAACTTTGGGTAAGGTTGTTTTGGTTGGTCTGCCATCTGGTGCCGTTGTCAACTCTGACGTTTTCTGGCACGTTCTGAAGTCCATCGAGATCAAGGGATCTTACGTTGGAAACAGAGAGGACAGTGCCGAGGCCATCGACTTGTTCACCAGAGGTTTGGTCAAGGCTCCTATCAAGATTATCGGTCTGTCTGAACTTGCTAAGGTCTACGAACAGATGGAGGCTGGTGCCATCATCGGTAGATACGTTGTGGACACTTCCAAATAAGCTTAGAGACCGATC
Adh900_GG_cured	(SEQ ID NO:83) GATAGGTCTCACATGTCTGTGATGAAAGCCCTCGTGTACGGTGGTAAGAACGTGTTCGCCTGGAAAAACTTCCCTAAACCAACTATCTTGCACCCAACAGATGTCATCGTTAAGACGGTGGCTACTACCATCTGCGGAACAGACTTGCACATCTTGAAAGGTGATGTTCCAGAGGTCAAACCTGAAACCGTCTTGGGTCATGAAGCAATTGGAGTCGTCGAATCTATCGGTGATAACGTCAAAAACTTCAGCATTGGTGATAAGGTGCTGGTTTCATGCATCACCAGTTGTGGAAGCTGTTACTACTGTAAGAGAAACTTGCAGAGTCATTGCAAGACCGGTGGATGGAAATTAGGTCACGATTTGAACGGTACGCAGGCTGAGTTTGTCCGTATCCCATATGGAGACTTCTCATTGCACCGTATTCCTCATGAAGCAGATGAAAAGGCAGTTCTGATGCTGTCTGACATCTTACCTACTGCTTACGAAGTTGGTGTTCTTGCCGGAAATGTCCAAAAGGGAGACTCAGTTGCCATTGTCGGCGCCGGTCCAGTTGGTCTTGCCGCTCTGCTGACTGTCAAAGCCTTTGAGCCTTCTGAAATTATTATGATTGACACTAACGATGAAAGACTGAGTGCCTCCTTGAAATTGGGAGCCACCAAGGCAGTCAACCCAACCAAGGTCAGCAGTGTCAAAGATGCTGTTTATGATATTGTCAATGCCACTGTCCGCGTCAAGGAGAACGACCTGGAGCCAGGTGTCGATGTTGCCATTGAGTGTGTTGGTGTTCCTGACACGTTTGCAACTTGTGAAGAGATTATCGCCCCAGGTGGCCGTATTGCCAATGTTGGTGTTCACGGCACTAAAGTGGATTTACAACTGCAAGACCTATGGATCAAGAACATTGCTATCACCACCGGTTTGGTAGCCACATACTCCACTAAAGACCTGTTGAAGCGAGTCTCTGACAAGTCTCTAGACCCTACACCACTGGTTACACATGAGTTCAAGTTCAGTGAATTTGAGAAGGCCTATGAGACTTCTCAAAATGCTGCCACCACCAAAGCCATCAAGATTTTCTTATCTGCCGATTAAGCTTAGAGACCGATC

c) P. pastoris △aox1△aox2 균주를 실시예 1a)에 기술된 바와 같이 전기적합성으로 만들었다. BB3aZ_pGAP_Adh2_CycTT 발현 구조 및 BB3aZ_pGAP_Adh900_CycTT 발현 구조를 제조업체의 프로토콜에 따라 AscI(New England Biolabs, Inc., USA)로 선형화하고 Hi Yield® Gel/PCR DNA Fragment Extraction Kits(Sud-Laborbedarf GmbH, Germany)로 정제했다. 500ng의 선형화된 플라스미드를 실시예 1a) 및 1d)에서 이전에 기술한 바와 같이 전기적격 P. pastoris △aox1△aox2로 형질전환시켰다. 양성 형질전환체는 25μg/mL Zeocin이 포함된 YPD 플레이트에서 선택되었다. 발현 구축물의 성공적인 통합은 게놈 DNA를 주형으로 하는 프라이머 109_BB3aN_ctrl_fwd 및 pGAP_goi_rev_v2(표 17)를 사용한 PCR 증폭에 의해 확인되었다. 생성된 균주는 P. pastoris △aox1△aox2 BB3aZ_pGAP_Adh2_CycTT 및 P. pastoris △aox1△aox2 BB3aZ_pGAP_Adh900_CycTT이다.

Primer Name	DNA sequence 5' to 3'
109_BB3aN_ctrl_fwd	TTGATCTTTTCTACGGGGTGG (SEQ ID NO:84)
pGAP_goi_rev_v2	GGTGTTTTGAAGTGGTACGG (SEQ ID NO:85)

실시예 14 : 메탄올 이용 음성 알코올 탈수소효소 결함 균주의 무세포 추출물에서 알코올 탈수소효소 활성 측정.

표현형 수준에서 알코올 탈수소효소의 성공적인 삭제를 확인하기 위해 에탄올을 기질로 하는 무세포 추출물에서 알코올 탈수소효소 활성을 측정하였다. 에탄올은 일반적으로 Adh2의 주요 기질로 간주된다.

a) 25℃ 및 280rpm에서 공기 투과성 막으로 밀봉된 24웰 플레이트에서 2mL의 YPD 배지에서 밤새 배양을 수행했다. 사용된 균주는 실시예 12a) P. pastoris △aox1△aox2 Adh2△::HphR, 실시예 12b) P. pastoris △aox1△aox2 Adh2△::HphR Adh900△::KanMX 및 실시예 1e) P. pastoris △aox1△aox2였다. 추가 대조군으로 P. pastoris X33(Thermo Fisher Scientific Inc., USA) 및 P. pastoris X33 △Adh2(Nocon et al., 2014)를 사용하였다.

b) 밤새 배양액을 원심분리(16.000g, 5분, 4℃)하고 1mL 인산염 완충 식염수에 재현탁하여 무세포 추출물을 제조했다. 두 번째 원심분리 단계(16.000g, 5분, 4℃) 후 세포를 유리 비트와 함께 0.5mL의 세포 용해 완충액에 재현탁했다. 배양물을 단계 사이에 얼음 위에서 1분간 냉각시키면서 6m/s에서 3 x 20초 동안 비드 비팅함으로써 리볼라이저(MP Biomedicals, Inc., USA)에서 용해시켰다. 용해 단계 후 배양물을 원심분리하고(16.000g, 5분, 4℃) 상층액을 새로운 Eppendorf 튜브로 옮기고 다시 원심분리하여(16.000g, 30분, 4℃) 세포 파편을 제거했다. 두 번째 원심분리 단계 후 상층액을 사용할 때까지 -20℃에서 보관했다.

c) 세포 용해 완충액은 50mL당 20mM HEPES, 420mM NaCl, 1.5mM MgCl₂, 10% 글리세롤, 1개의 SIGMAFAST™ 프로테아제 억제제 칵테일 정제(Sigma-Aldrich GmbH)로 구성되었다. 분석 완충액은 pH 8.9에서 100mM MOPS, 5mM MgSO₄, 2mM NAD⁺로 구성되었습니다.

d) 무세포 추출물의 단백질 결합은 제조업체의 권장 사항에 따라 Pierce™ BCA 단백질 분석(Thermo Scientific, Inc., USA)에 의해 측정되었으며 모든 샘플에 대해 3.8 mg/mL의 공통 농도로 균일하게 조정되었다.

e) 알코올 탈수소효소 활성 분석은 96웰 플레이트에서 수행되었다. 측정은 340 nm에서 NADH의 흡광도를 측정하여 마이크로플레이트 리더(Tecan Group Ltd., Swiss)에서 수행되었다. 온도는 42℃로 설정되었다. 분석을 시작하기 위해 20μL의 무세포 추출물을 분석 완충액에 첨가하고 1M의 에탄올을 기질로 첨가하기 전에 10~15분 동안 평형을 유지했다. 총 최종 부피는 300 μL였다. mU/mg 단위의 활성은 기질 에탄올 첨가 후 최대 선형 흡수 증가로부터 계산되었다. 하나의 활동 단위는 분당 소비되는 1μmol 기질(NAD⁺)에 해당한다. 이것은 Lambert-Beer 법칙과 계수 ε_NADH = 6220 M^-1 cm^-1을 사용하여 흡수 데이터에서 계산되었다.

f) 결과는 무세포 추출물의 알코올 탈수소효소 활성에 대한 AHD 유전자 결실의 효과를 명확하게 보여준다(표 18). ADH2 유전자를 삭제함으로써 94%의 활성 감소가 달성된다. 이것은 P. pastoris X33 균주에 의해 추가로 확인된다. 또한 두 번째 알코올 탈수소효소 유전자 ADH900을 삭제함으로써 결합 활성이 99% 감소하는 것이 관찰된다.

	Alcohol dehydrogenase activity (mU/mg)
	Mean	Standard Error	Clones tested
P. pastoris CBS2612 △aox1△aox2	1293.8	244.9	3
P. pastoris CBS2612 △aox1△aox2 Adh2△::HphR	80.8	7.9	6
P. pastoris CBS2612 △aox1△aox2 Adh2△::HphR Adh900△::KanMX	8.0	0.4	6
P. pastoris X33	1196.5	28.3	3
P. pastoris X33 Adh2△::HphR	88.5	2.1	7

실시예 15 : 메탄올 이용 음성 및 알코올 탈수소효소 결핍 균주의 메탄올 흡수율 측정.

메탄올 흡수율을 결정하기 위해 Mut^- 및 알코올 탈수소효소 결핍 균주를 생물반응기에서 배양했다. 테스트한 균주는 P. pastoris △aox1△aox2 Adh2△::HphR, P. pastoris △aox1△aox2 Adh900△::KanMX 및 P. pastoris △aox1△aox2 Adh2△::HphR Adh900△::KanMX입니다. 특정 바이오매스 농도까지 배양물을 성장시켰다. 그런 다음 메탄올 펄스를 적용하고 펄스 직후와 약 20시간 후에 메탄올 농도를 측정했다. 실험 설정은 이미 실시예 7에 자세히 설명되어 있다. 목표는 알코올 탈수소효소 결핍 균주의 특정 메탄올 흡수율을 결정하고 이를 실시예 7에서 측정된 메탄올 흡수율과 비교하는 것이었다.

a) 300mL BSM 배지로 채워진 반응기에 P. pastoris △aox1△aox2 Adh2△::HphR(반응기 aR2 및 aR4) 및 P. pastoris △aox1△aox2 Adh900△::KanMX(반응기 및 aR3). 목표 시작 OD₆₀₀은 2였다. 용존 산소 스파이크로 표시되는 배치 단계의 끝에서, 바이오매스를 증가시키기 위해 24시간 동안 2.8mL/h에서 50%(w/w) 포도당 공급을 시작했다. 포도당 공급을 시작한 지 2시간 후 50%(v/v) 메탄올 샷이 제공되어 메탄올 농도를 1.5%로 증가시켰다(측정된 농도는 aR1=1.64%, aR2=1.66%, aR3=1.59% 및 aR4=1.67%). 이것은 메탄올 소비를 유도하기 위해 수행되었다. 포도당 공급 단계의 끝에서 세포 건조 중량 및 HPLC에 대한 샘플을 취했다.

b) 글루코스 공급 단계 후 교반 및 기체 공급은 일정한 750rpm 및 9.5sL/h로 설정되었다. 추가 50% 메탄올 펄스를 첨가하여 농도를 1.5%로 증가시키고 즉시 HPLC 샘플을 취하였다(측정된 농도는 aR1=1.36%, aR2=1.44%, aR3=1.34% 및 aR4=1.45%임). 18.4시간 후에 농도를 다시 측정하여 특정 메탄올 흡수율(q_methanol)을 결정하는 데 사용했다.

c) 이중 ADH 결실 균주 P. pastoris △aox1△aox2 Adh2△::HphR Adh900△::KanMX의 흡수율을 측정하기 위해 별도의 생물반응기 배양이 시작되었다. 배양은 본 실시예 및 실시예 7에 설명된 대로 수행하였다. P. pastoris △aox1△aox2 Adh2△::HphR Adh900△::KanMX를 반응기 cR3 및 cR4에 접종하였다. 목표 시작 OD₆₀₀은 2였다. 용존 산소 스파이크로 표시된 배치 단계의 끝에서, 50%(w/w) 포도당 공급이 24시간 동안 2.4mL/h에서 시작되어 바이오매스를 증가시켰다. 글루코스 공급을 시작한 지 2시간 후에 50%(v/v) 메탄올 샷을 하여 메탄올 농도를 1.5%로 증가시켰다(측정된 농도는 cR3=1.50% 및 cR4=1.47%임). 이것은 메탄올 소비를 유도하기 위해 수행되었다. 포도당 공급 단계의 끝에서 세포 건조 중량 및 HPLC에 대한 샘플을 취했다.

d) 글루코스 공급 단계 후 교반 및 가스 공급은 일정한 750rpm 및 9.5sL/h로 설정되었다. 추가 50% 메탄올 펄스를 첨가하여 농도를 1.5%로 증가시키고 즉시 HPLC 샘플을 취하였다(측정된 농도는 cR3=1.37% 및 cR4=1.49%임). 19.5시간 후에 농도를 다시 측정하여 특정 메탄올 흡수율(q_methanol)을 결정하는 데 사용했다.

e) 특정 메탄올 흡수율은 실시예 7d)에서와 같이 계산하였다. ADH2를 삭제함으로써 메탄올 흡수율의 놀랍고 실질적인 감소가 달성되었다(표 19). 메탄올의 dc/dt는 aR2 및 aR4에 대해 0.07 내지 0.06 g L^-1 h^-1이며, 이는 실시예 6에서 관찰된 증발보다 약간 더 높을 뿐이다. 대조적으로 ADH900 결실 균주의 메탄올 흡수율은 감소되지 않고 실제로 실시예 7에서 측정된 P. pastoris △aox1△aox2의 흡수율보다 약간 더 높았다. 이 차이는 실시예 7과 이 실시예 사이의 약간 다른 조건에 기인할 수 있으며, 차이는 약간 더 높은 반응기 부피와 메탄올 농도임 메탄올 펄스 후. 이중 ADH 결실 균주는 ADH2 결실 균주의 이미 낮은 흡수율에 비해 메탄올 흡수율의 관찰 가능한 감소를 나타내지 않는다. 이러한 결과는 예기치 않게 ADH2 유전자와 그 산물인 효소 Adh2가 P. pastoris △aox1△aox2에 대해 관찰된 특성에 가장 큰 영향을 미치며 실시예 7의 관찰이 자발적인 메탄올 산화 또는 다른 효소의 혼잡한 활성 아니라는 것을 확인한 것이었다.

따라서, P. pastoris △aox1△aox2의 메탄올 흡수에 관여하는 주요 유전자 및 효소는 ADH2 유전자이고 그 생성물은 효소 Adh2인 것으로 결론지었다.

Reactor	ADH gene	Volume (mL)	CDW (g/L)	Methanol at 0 h (g/L)	Methanol at 18.4 h (g/L)	dc/dt (g L^-1 h^-1)	q_methanol (mg g^-1 h^-1)
aR1	Adh900△::KanMX	392	73.4	10.75	3.49	0.40	5.38
aR2	Adh2△::HphR	385	74.1	11.40	10.20	0.07	0.89
aR3	Adh900△::KanMX	395	71.2	10.61	3.24	0.40	5.63
aR4	Adh2△::HphR	382	74.7	11.47	10.34	0.06	0.82
cR3	Adh2△::HphR Adh900△::KanMX	373	73.9	10.8	10.0*	0.04	0.55
cR4	Adh2△::HphR Adh900△::KanMX	369	73.9	11.8	10.6*	0.06	0.85

실시예 16 : 메탄올 이용 음성 및 알코올 탈수소효소 과발현 균주의 메탄올 흡수율 측정.

P. pastoris △aox1△aox2에서 Adh2가 메탄올 소비에 관여하는 효소임을 확인하고 ADH2 또는 ADH900 유전자의 과발현으로 메탄올 흡수율을 증가시킬 수 있는지 조사하기 위해 P. pastoris △aox1△aox2 BB3aZ_pGAP_Adh2_CycTT 및 P. pastoris △aox1△aox2 BB3aZ_pGAP_Adh900_CycTT 균주는 생물반응기 배양에서 측정되었다. 실험은 실시예 7 및 15에 기재된 바와 같이 수행하였다.

a) 300mL BSM 배지로 채워진 반응기에 15mL의 P. pastoris △aox1△aox2 BB3aZ_pGAP_Adh2_CycTT(반응기 R1 및 R3) 및 P. pastoris △aox1△aox2 BB3aZ_pGAP_ 목표 시작 OD₆₀₀은 2였다. 용존 산소 스파이크로 표시되는 배치 단계의 끝에서, 바이오매스를 증가시키기 위해 24시간 동안 2.8mL/h에서 50%(w/w) 포도당 공급을 시작했다. 포도당 공급을 시작한 지 2시간 후 50%(v/v) 메탄올 샷이 제공되어 메탄올 농도를 1.5%로 증가시켰다(측정된 농도는 R1=1.56%, R2=1.53%, R3=1.52% 및 R4=1.54%). 이것은 메탄올 소비를 유도하기 위해 수행되었다. 포도당 공급 단계의 마지막에 세포 건조 중량 및 HPLC에 대한 샘플을 취했다.

b) 글루코스 공급 단계 후 교반 및 가스 공급은 일정한 750rpm 및 9.5sL/h로 설정되었다. 추가 50% 메탄올 펄스를 첨가하여 농도를 1.5%로 증가시키고 즉시 HPLC 샘플을 취하였다(측정된 농도는 R1=1.30%, R2=1.30%, R3=1.35% 및 R4=1.30%임). 4.1, 20.1시간 후에 농도를 다시 측정하여 특정 메탄올 흡수율(qmethanol)을 결정하는 데 사용했다.

c) 더 높은 메탄올 흡수율이 예상되기 때문에 4.1시간의 추가 샘플링 시점이 선택되었다. 4.1시간에 평균 메탄올 흡수율은 ADH2 과발현 균주 P. pastoris △aox1△aox2 BB3aZ_pGAP_Adh2_CycTT의 경우 7.72 mg g^-1 h^-1이었고 ADH900 과발현 균주 P. pastoris △aox1△aox2 BB3aZ_pGAP_Adh900_CycTT는 5.61 mg g^-1 h^-1이었다. 20.1시간 후 평균 흡수율은 ADH2 과발현 균주의 경우 6.35 mg g^-1 h^-1로 감소하고 ADH900 과발현 균주의 경우 5.16 mg g^-1 h^-1로 감소한다(표 20). 이전에 실시예 15e)에서 논의된 바와 같이, 모 P. pastoris △aox1△aox2는 ADH900 유전자를 결실시킬 때 관찰될 수 없고, ADH900 유전자를 과발현하는 경우에도 마찬가지이다. 한편, ADH2 과발현주는 ADH900 과발현주에 비해 4.1시간 및 21.7시간에서 37% 및 23% 더 높은 흡수율을 나타내었다. Adh2가 메탄올 소비에 대한 책임이 있는 효소이며 ADH2 유전자의 과발현으로 메탄올 소비를 증가시킬 수 있다는 예상치 못한 발견을 더욱 강조한다.

Reactor	ADH gene	Volume (mL)	CDW (g/L)	Methanol at 0 h (g/L)	Methanol at 4.1 h (g/L)	Methanol at 20.1 h (g/L)	q_methanol (mg g^-1 h^-1) At 4.1 h	q_methanol (mg g^-1 h^-1) At 20.1 h
R1	P_GAP ADH2	398	72.9	10.3	8.0	1.2	7.65	6.18
R2	P_GAP ADH900	400	71.7	10.3	8.7	2.9	5.30	5.09
R3	P_GAP ADH2	406	70.7	10.7	8.4	1.3	7.80	6.51
R4	P_GAP ADH900	399	71.3	10.3	8.6	2.8	5.91	5.23

실시예 17 : ADH2 과발현에 대한 메탄올 유도성 프로모터를 사용한 균주 생성.

메탄올 유도성 ADH2 과발현의 효과를 조사하기 위해, ADH2 코딩 서열의 발현을 조절하는 메탄올 유도성 프로모터 P _AOX1 PP7435_chr4 (237941…238898) 및 P _FLD1 PP7435_Chr3 (262922…263518)로 구성된 2개의 과발현 작제물을 생성하였다. ADH2 코딩 서열은 유전자 생성물의 아미노산 서열에 영향을 미치지 않으면서 코딩 서열에서 BbsI 및 BsaI 제한 부위를 제거하도록 변형되었다(표 16). 생성된 균주는 P. pastoris △aox1△aox2 BB3aZ_pAOX1_Adh2_CycTT 및 P. pastoris △aox1△aox2 BB3aZ_pFLD1_Adh2_CycTT로 지정되었다.

a) 발현 구성은 이미 설명한 대로 Golden Gate 어셈블리를 사용하여 생성되었다(Prielhofer et al., 2017). (1) 발현 구조 BB3aZ_pAOX1_Adh2_CycTT를 다음과 같이 조립하였다. Adh2_GG_cured DNA 단편(표 16)을 BB1_23 백본에 복제하여 BB1_23_Adh2를 생성했다. 발현 구조는 BB3aZ_14*(백본), BB1_23_Adh2(암호화 서열) BB1_12_pAOX1(프로모터), BB1_34_ScCYC1tt(터미네이터)의 골든 게이트 어셈블리에 의해 생성되었다. (2) 발현 구조 BB3aZ_pFLD1_Adh2_CycTT는 BB3aZ_14*(백본), BB1_23_Adh2(암호화 서열) BB1_12_pFLD1(프로모터), BB1_34_ScCYC1tt(터미네이터)의 골든 게이트 어셈블리에 의해 생성되었다. 플라스미드 및 서열은 Golden PiCS 키트 # 1000000133(Addgene, Inc., USA)에서 사용할 수 있다.

b) P. pastoris △aox1△aox2 균주를 실시예 1a)에 기술된 바와 같이 전기 적합성으로 만들었다. BB3aZ_pAOX1_Adh2_CycTT 발현 구조와 BB3aZ_pFLD1_Adh2_CycTT 발현 구조는 제조사의 프로토콜에 따라 AscI(New England Biolabs, Inc., USA)로 선형화되었고 Hi Yield® Gel/PCR DNA Fragment Extraction Kits(Sud-Laborbedarf GmbH, Germany)로 정제되었다. 500ng의 선형화된 플라스미드를 실시예 1a) 및 1d)에서 이전에 기술된 바와 같이 전기적격 P. pastoris △aox1△aox2로 형질전환시켰다. 양성 형질전환체는 25μg/mL Zeocin이 포함된 YPD 플레이트에서 선택되었다. 발현 구축물의 성공적인 통합은 게놈 DNA를 주형으로 하는 프라이머 109_BB3aN_ctrl_fwd 및 pGAP_goi_rev_v2(표 17)를 사용한 PCR 증폭에 의해 확인되었다. 생성된 균주는 P. pastoris △aox1△aox2 BB3aZ_pAOX1_Adh2_CycTT 및 P. pastoris △aox1△aox2 BB3aZ_pFLD1_Adh2_CycTT이다.

c) PCR 증폭을 위한 게놈 DNA는 제조업체의 권장 사항에 따라 Wizard® Genomic DNA Purification Kit(Promega Corporation, USA)를 사용하여 분리되었다. PCR 증폭 반응은 제조사의 권고에 따라 Q5 중합효소(New England Biolabs, Inc., USA)를 사용하여 수행되었다.

실시예 18 : AHD2 과발현에 대한 메탄올 유도성 프로모터를 사용한 메탄올 이용 음성 균주의 특정 메탄올 흡수율 측정.

메탄올 유도성 프로모터를 사용한 ADH2 과발현이 특정 메탄올 흡수율에 미치는 영향을 조사하기 위해 실시예 7 및 실시예 16에 설명된 대로 생물반응기 배양을 설정했다. 이를 위해 실시예 17에서 생성된 균주 P. pastoris △aox1△aox2 BB3aZ_pAOX1_Adh2_CycTT 및 P. pastoris △aox1△aox2 BB3aZ_pFLD1_Adh2_CycTT를 사용하였다.

a) 300mL BSM 배지로 채워진 반응기에 P. pastoris △aox1△aox2 BB3aZ_pAOX1_Adh2_CycTT(반응기 R1 및 R2) 및 P. pastoris △aox1△aox2 BB3aZ_pFLD 15mL를 접종했다. 목표 시작 OD₆₀₀은 2였다. 용존 산소 스파이크로 표시되는 배치 단계의 끝에서, 바이오매스를 증가시키기 위해 24시간 동안 2.8mL/h에서 50%(w/w) 포도당 공급을 시작했다. 포도당 공급을 시작한 지 2시간 후에 50%(v/v) 메탄올 샷이 제공되어 메탄올 농도를 1.5%로 증가시켰다(측정된 농도는 R1=1.57%, R2=1.57%, R3=1.57% 및 R4=1.70%). 이것은 메탄올 소비 및 메탄올 유도성 프로모터를 유도하기 위해 수행되었습니다. 포도당 공급 단계의 마지막에 세포 건조 중량 및 HPLC에 대한 샘플을 취했다.

b) 글루코스 공급 단계 후 교반 및 기체 공급은 일정한 750rpm 및 9.5sL/h로 설정되었다. 추가 50% 메탄올 펄스를 첨가하여 농도를 1.5%로 증가시키고 즉시 HPLC 샘플을 채취하였다(측정된 농도는 R1=1.42%, R2=1.39%, R3=1.39% 및 R4=1.42%임). 4.2시간 후에 농도를 다시 측정하여 특정 메탄올 흡수율(q_methanol)을 결정하는 데 사용했다. 초기 펄스가 거의 소모된 후 두 번째 메탄올 펄스를 적용하고 즉시 HPLC 샘플을 채취했다(측정된 농도는 R1=1.61%, R2=1.65%, R3=1.50% 및 R4=1.47%임). 6.2시간 후에 농도를 다시 측정하고 특정 메탄올 흡수율(q_methanol)을 두 번째로 결정하는 데 사용했다.

c) 2개의 메탄올 펄스를 사용하여 특정 메탄올 흡수율(q_methanol)을 결정했다. 첫 번째 펄스와 샘플링 시점 사이의 시간은 4.2시간이었다. 두 번째 메탄올 펄스와 샘플링 지점 사이의 시간은 6.2시간이었다. 첫 번째 펄스 후 4.2시간 후 평균 메탄올 흡수율은 P_FLD1 ADH2 과발현 균주 P. pastoris △aox1△aox2 BB3aZ_pFLD1_Adh2_CycTT의 경우 8.3 mg g^-1 h^-1이었고 P_AOX1 ADH2 과발현 균주 P. pastoris △aox1△aox2 BB3aZ_pAOX1_Adh2_CycTT는 11.6 mg g^-1 h^-1이었다(표 21). 두 번째 메탄올 펄스 후 6.2시간 후 평균 흡수율은 P_FLD1 ADH2 과발현 균주의 경우 10.1 mg g^-1 h^-1로 증가하고 P_AOX1 ADH2 과발현 균주의 경우 13.8 mg g^-1 h^-1로 증가했다(표 22). 이 데이터는 메탄올 유도성 프로모터가 사용될 때 더 긴 메탄올 유도 시간이 Adh2의 증가된 발현 및 특정 메탄올 흡수율로 이어진다는 것을 보여준다. 따라서 균주는 메탄올이 유일한 에너지 및 탄소원인 배지에서 시간이 지남에 따라 특정 메탄올 흡수율을 유지하고 증가시킬 수 있다. 실시예 7에 기재된 P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT 균주와 비교하여 특정 메탄올 흡수율은 P. pastoris △aox1△aox2 BB3aZ_pFLD1.Adhfold에 대해 평균 1.6배 및 P. pastoris △aox1△aox2 aox2 BB3aZ_pAOX1_Adh2_CycTT에 대해 평균 2.3배 증가하였다.

Reactor	ADH gene	Volume (mL)	CDW (g/L)	Methanol 1^st pulse (g/L)	Methanol 4.2 h after 1^st methanol pulse (g/L)	q_methanol (mg g^-1 h^-1)
R1	P_AOX1 ADH2	400	77.7	11.2	7.6	11.2
R2	P_AOX1 ADH2	401	76.4	11.0	7.2	11.9
R3	P_FLD1 ADH2	400	75.1	11.0	8.5	8.0
R4	P_FLD1 ADH2	401	75.8	11.3	8.6	8.5

Reactor	ADH gene	Volume (mL)	CDW (g/L)	Methanol 2^nd pulse (g/L)	Methanol 6.2 h after 2^nd methanol pulse (g/L)	q_methanol (mg g^-1 h^-1)
R1	P_AOX1 ADH2	394	72.7	12.7	6.3	14.4
R2	P_AOX1 ADH2	393	72.6	13.1	7.1	13.3
R3	P_FLD1 ADH2	393	71.1	11.9	7.4	10.2
R4	P_FLD1 ADH2	394	73.0	11.7	7.1	10.1

실시예 19 : 분비된 재조합 단백질을 생산하는 ADH2 과발현 균주의 생성.

ADH2 과발현과 특정 메탄올 흡수율의 결과적인 증가가 재조합 단백질 생산에 영향을 미치는지 조사하기 위해 실시예 3에서 HSA 및 vHH를 생산하는 P. pastoris △aox1△aox2를 P _AOX1 ADH2 및 P _FLD1 ADH2 과발현 구조로 형질전환하고 실시예 4에 기술된 적응된 프로토콜로 소규모 스크리닝했다.

a) 과발현 구조는 이미 설명한 대로 Golden Gate 어셈블리를 사용하여 수행되었다(Prielhofer et al., 2017). (1) 발현 구조 BB3aK_pAOX1_Adh2_CycTT는 실시예 17로부터의 BB3aK_14*(백본), BB1_23_Adh2(암호화 서열), BB1_12_pAOX1(프로모터), BB1_34_ScCYC1tt의 골든 게이트 어셈블리에 의해 생성되었다. (2) 발현 구조 BB3aK_pFLD1_Adh2_CycTT는 실시예 17로부터의 BB3aK_14*(백본), BB1_23_Adh2(암호화 서열), BB1_12_pFLD1(프로모터), BB1_34_ScCYC1tt의 골든 게이트 어셈블리에 의해 생성되었다. 플라스미드 및 서열은 Golden PiCS 키트 # 1000000133(Addgene, Inc., USA)에서 사용할 수 있다.

b) P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT 및 P. pastoris △aox1△aox2 pPM2pZ30_pAOX1_αMF-vHH_CycTT 균주를 실시예 1a에 기재된 바와 같이 전기적격으로 만들었다. BB3aK_pAOX1_Adh2_CycTT 발현 구성체 및 BB3aK_pFLD1_Adh2_CycTT 발현 구성체를 제조업체의 프로토콜에 따라 AscI(New England Biolabs, Inc., USA)로 선형화하고 Hi Yield® Gel/PCR DNA Fragment Extraction Kits(Sud-Laborbedarf GmbH, Germany)로 정제했다. 500ng의 선형화된 플라스미드를 실시예 1a) 및 1d)에 기재된 바와 같이 전기 컴피턴트 P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT 및 P. pastoris △aox1△aox2 pPM2pZ30_pAOX1_αMF-vHH_CycTT에 형질전환하였다. 양성 형질을 500 ㎍/㎖의 제네티신 및 25 ㎍/㎖의 제오신을 포함하는 YPD 플레이트상에서 P. pastoris △aox1△aox2 pPM2pZ30_pAOX1_αMF-vHH_CycTT_BB3aK_pAOX1_Adh2_CycTT 및 P. pastoris △aox1△aox2 pPM2pZ30_pAOX1_αMF-vHH_CycTT_BB3aK_pFLD1_Adh2_CycTT 형질을 선별하였다. P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT_BB3aK_pAOX1_Adh2_CycTT 및 P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT_BB3aK_pFLD1_Adh2_CycTT 형질을 500 ㎍/㎖의 제네티신 및 100 ㎍/L nourseothricin을 포함하는 YPD 플레이트상에서 선택하였다. 추가 스크리닝을 위해 형질전환당 다중 클론을 선택하였다(실시예 20). 제조된 균주의 이름은 하기와 같다: P. pastoris △aox1△aox2 P _AOX1 HSA P _AOX1 ADH2, P. pastoris △aox1△aox2 P _AOX1 HSA P _FLD1 ADH2, P. pastoris △aox1△aox2 P _AOX1 vHH P _AOX1 ADH2, 및 P. pastoris △aox1△aox2 P _AOX1 vHH P _FLD1 ADH2.

실시예 20 : 분비된 재조합 단백질을 생산하는 ADH2 과발현 균주의 소규모 스크리닝.

실시예 19에 기재된 형질전환체로부터의 다중 클론을 소규모 스크리닝에서 시험하여 재조합 단백질 생산에 대한 ADH2 과발현의 영향을 조사하였다. 스크리닝 절차는 실시예 4에 설명된 2개의 샷 확장 프로토콜과 표준 프로토콜에서 조정되었습니다.

a) P. pastoris △aox1△aox2 P _AOX1 HSA P _AOX1 ADH2 및 P. pastoris △aox1△aox2 P _AOX1 HSA P _FLD1 ADH2 클론의 사전 배양을 위해 500μg/mL 제네티신 및 100μg/mL 누르세오트리신이 포함된 2mL YPD에 P. pastoris △aox1△aox2 P _AOX1 vHH P _AOX1 ADH2 및 P. pastoris △aox1△aox2 P _AOX1 vHH P _FLD1 ADH2 클론을 500μg/mL Geneticin 및 25μg/mL 제오신에 접종했다. 부모 균주는 선택에 사용된 항생제 내성을 기반으로 100μg/mL Nourseothricin 또는 25μg/mL Zeocin으로 YPD에 두 번 반복하여 접종되었다. 각 발현 구성물에 대해 스크리닝을 위해 11개의 클론을 선택했다. 전배양 및 스크리닝 배양물을 공기 투과성 막으로 밀봉된 24웰 플레이트에서 배양하고 25℃에서 280rpm으로 인큐베이션하였다. 스크리닝 배양물은 8의 시작 광학 밀도(OD₆₀₀)로 다당류 용액 및 배양물을 유지하기 위한 효소를 기반으로 하는 느린 포도당 방출 시스템 EnPump200(Enpresso GmbH, Germany)이 있는 2mL의 최소 배지(ASMv6)에 접종되었다. 포도당 제한. 균주를 수용된 총 메탄올 및 인큐베이션 시간이 상이한 2개의 상이한 메탄올 공급 절차와 비교하였다(표 23).

b) 인큐베이션 기간 후 1mL의 각 배양물을 제거하고 미리 가중된 Eppendorf 튜브에서 원심분리하였다. 상청액을 제거하고 제조업체의 지침에 따라 Caliper LabChip GXII Touch(PerkinElmer, inc., USA)로 단백질 농도를 측정했다. 세포 펠릿으로 Eppendorf 튜브의 무게를 측정하여 습윤 세포 중량을 결정하고 다음과 같이 계산했다. 중량(전체) - 중량(비어 있음) = 습윤 세포 중량(WCW)(g/L). 이 데이터에서 수율을 계산했다. 수율(μg/g) = 단백질 농도 / 습윤 세포 중량.

Protocol	Incubation period	Polysaccharide (g/L)	Enzyme (%)	Methanol shot	Total methanol (v/v)	Methanol shot time points (h)
Standard	48 h	25	0.35	4 x	3.5%	4* ,19, 27,43
Two shot - extended	72 h	25	0.20	2 x	2%	3, 43

c) 결과는 표 24에 요약되어 있다. 놀랍게도 과발현은 모 돌연변이 균주와 비교할 때 vHH의 경우 최대 1.7배, HSA의 경우 2.3배까지 단백질 수율(㎍/g)을 증가시켰다. 실제로, ADH2의 과발현이 P. pastoris △aox1△aox2의 재조합 단백질 생산을 향상시킨다는 것을 증명했다.

d) 생물 반응기 배양을 위해 평균 성능 균주를 선택했다. 발현 구축물의 성공적인 통합은 게놈 DNA를 주형으로 하는 프라이머 109_BB3aN_ctrl_fwd 및 pGAP_goi_rev_v2(표 17)를 사용한 PCR 증폭에 의해 확인되었다. PCR 증폭을 위한 게놈 DNA는 제조업체의 권장 사항에 따라 Wizard® Genomic DNA Purification Kit(Promega Corporation, USA)를 사용하여 분리되었다. PCR 증폭 반응은 제조사의 권고에 따라 Q5 중합효소(New England Biolabs, Inc., USA)를 사용하여 수행되었다.

		Screening protocol
Descriptive name	Name	Two shot - extended	Standard Mut^S
Parent strain: △aox1△aox2 P _AOX1 vHH	P. pastoris △aox1△aox2　 pPM2pZ30_pAOX1_αMF-vHH_CycTT	1766	1428
△aox1△aox2 P _AOX1 vHH P _AOX1 ADH2	P. pastoris △aox1△aox2　 pPM2pZ30_pAOX1_αMF-vHH_CycTT BB3aK_pAOX1_Adh2_CycTT	2394* ±640	2441* ±211
△aox1△aox2 P _AOX1 vHH P _FLD1 ADH2	P. pastoris △aox1△aox2　 pPM2pZ30_pAOX1_αMF-vHH_CycTT BB3aK_pFLD1_Adh2_CycTT	1907 ±381	1810* ±175
Parent strain: △aox1△aox2　 P _AOX1 HSA	P. pastoris △aox1△aox2　 pPM2pN21_pAOX1_HSAopt_CycTT	635	459
△aox1△aox2 P _AOX1 HSA P _AOX1 ADH2	P. pastoris △aox1△aox2　 pPM2pN21_pAOX1_HSAopt_CycTT BB3aK_pAOX1_Adh2_CycTT	1485* ±183	711* ±135
△aox1△aox2　 P _AOX1 HSA P _FLD1 ADH2	P. pastoris △aox1△aox2　 pPM2pN21_pAOX1_HSAopt_CycTT BB3aK_pFLD1_Adh2_CycTT	1198 ±96	621* ±85

실시예 21 : HSA를 모델 단백질로 생성하는 ADH2 과발현을 갖는 메탄올 이용 음성 균주. 전략 3으로 배양 - 포도당/메탄올 동시 공급 단계 및 분리된 메탄올 단독 공급 단계가 있는 공급 전략.

실시예 19에서 생성되고 실시예 20에서 선별된 메탄올 이용 음성 ADH2 과발현 균주의 재조합 단백질 생산 능력을 평가하기 위해 생물반응기 배양을 수행하였다. 이런 목적으로, P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT BB3aK_pFLD1_Adh2_CycTT(△aox1△aox2 P _AOX1 HSA P _AOX1 ADH2) 및 P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT BB3aK_pFLD1_Adh2_CycTT(△aox1△aox2 P _AOX1 HSA P _FLD1 ADH2) 균주를 실시예 10 및 실시예 11에 기재된 전략 13에 따라 배양하였다.

a) 이 생물 반응기 배양은 3단계로 분리되었다. (1) 1단계는 배치 단계였다. 반응기에 시작 OD₆₀₀이 2인 생산 균주를 접종하였다. 접종은 실시예 7a) b)에 기재된 바와 같이 수행하였다. 배치 단계의 끝은 용존 산소 스파이크로 표시되었다. (2) 이 시점에서 2단계가 시작되었다. 2단계는 25시간 동안 4.8mL/h에서 50%(w/w) 포도당 공급으로 구성되었다. 2단계 시작 시 50%(v/v) 메탄올 펄스를 적용하여 메탄올 농도를 1.5%(v/v)의 목표로 증가시켰고 후속 메탄올 공급을 시작하여 포도당 공급으로 메탄올 소비, 증발 및 희석을 상쇄했다. (3) 3단계는 19.6(R1, R2) 및 21.6(R5, R6) 시간 동안 메탄올만 공급하는 것으로 구성되었다. 메탄올 농도는 실시예 6d)에 기재된 바와 같이 HPLC에 따라 측정하였다. 필요한 경우 추가 보상 펄스가 추가되었다. 메탄올 공급은 실시예 8 및 9b)에서와 같이 시간 간격으로 계산하였다. 각각의 반응기 R1, R2, R5 및 R6에 사용된 균주는 표 25에 식별되어 있다.

b) 공정 및 생산성 데이터는 표 26 및 표 27에서 찾을 수 있다. 반응기 R1, R2, R5 및 R6의 배양 전반에 걸친 최대 및 최소 메탄올 농도는 8.0g/L에서 13.6g/L 범위였다. 반응기 R1, R2 및 R5, R6은 모델 단백질로 HSA를 생산하고 있었다. 단계 3에서 68.7시간에서의 특정 생산성(q_P)은 실시예 10과 비교하여 P _AOX1 또는 P _FLD1 을 사용한 ADH2 과발현의 긍정적인 영향을 보여준다(표 28, 표 29). 실시예 10에 대해 q_P의 가중 평균을 계산하였고, 더 쉬운 비교를 위해 시점 45.02 내지 69.58시간에 대한 것이었다. 시점 45.02 내지 69.58h에서 실시예 10의 q_P는 평균 40.9㎍ g^-1h^-1이다. 시점 49.1 내지 68.7시간에서 반응기 P _AOX1 ADH2 과발현(R1, R2)에 대한 본 실시예의 q_P는 평균 84.3㎍/g^-1h^-1이다. 이는 실시예 10과 비교하여 2배 증가된 것이다(표 28). 유사한 기간(47.1 내지 68.7시간)에서 P _FLD1 ADH2 과발현(R5, R6)은 71㎍/g^-1h^-1의 평균 q_P를 나타낸다. 이는 q_P의 1.7배 증가를 나타낸다(표 29). 시점 68.7시간에서의 부피 생산성은 P _AOX1 ADH2 과발현의 경우 1.21배(표 30) 및 P _FLD1 ADH2 과발현의 경우 1.13배(표 31) 증가한다. 이 예에서 증가된 q_P 및 체적 생산성은 재조합 단백질 생산을 위한 P. pastoris △aox1△aox2 균주에서 ADH2 과발현의 이점을 입증한다.

Reactor	Descriptive name	Name
R1	P. pastoris △aox1△aox2　 P_AOX1HSA P_AOX1 ADH2	P. pastoris △aox1△aox2　 pPM2pN21_pAOX1_HSAopt_CycTT BB3aK_pAOX1_Adh2_CycTT
R2	P. pastoris △aox1△aox2　 P_AOX1HSA P_AOX1 ADH2	P. pastoris △aox1△aox2　 pPM2pN21_pAOX1_HSAopt_CycTT BB3aK_pAOX1_Adh2_CycTT
R3	P. pastoris △aox1△aox2　 P_AOX1vHH P_AOX1 ADH2	P. pastoris △aox1△aox2　 pPM2pZ30_pAOX1_αMF-vHH_CycTT BB3aK_pAOX1_Adh2_CycTT
R4	P. pastoris △aox1△aox2　 P_AOX1vHH P_AOX1 ADH2	P. pastoris △aox1△aox2　 pPM2pZ30_pAOX1_αMF-vHH_CycTT BB3aK_pAOX1_Adh2_CycTT
R5	P. pastoris △aox1△aox2　 P_AOX1HSA P_FLD1 ADH2	P. pastoris △aox1△aox2 pPM2pN21_pAOX1_HSAopt_CycTT BB3aK_pFLD1_Adh2_CycTT
R6	P. pastoris △aox1△aox2 P_AOX1HSA P_FLD1 ADH2	P. pastoris △aox1△aox2　 pPM2pN21_pAOX1_HSAopt_CycTT BB3aK_pFLD1_Adh2_CycTT
R7	P. pastoris △aox1△aox2　 P_AOX1vHH P_FLD1 ADH2	P. pastoris △aox1△aox2　 pPM2pZ30_pAOX1_αMF-vHH_CycTT BB3aK_pFLD1_Adh2_CycTT
R8	P. pastoris △aox1△aox2　 P_AOX1vHH P_FLD1 ADH2	P. pastoris △aox1△aox2 pPM2pZ30_pAOX1_αMF-vHH_CycTT BB3aK_pFLD1_Adh2_CycTT

P *_AOX1* HSA P *_AOX1* *ADH2*	Time (h)	Volume (mL)		YDM (g/L)		Recombinant protein concentration (mg/L)		Specific productivity (q_P)		Methanol concentration (g/L)
P *_AOX1* HSA P *_AOX1* *ADH2*	Time (h)	Volume (mL)		YDM (g/L)		Recombinant protein concentration (mg/L)		(μg g^-1 h^-1)		Methanol concentration (g/L)
Phase		R1	R2	R1	R2	R1	R2	R1	R2	R1	R2
1	24.0	318	317	24.8	24.0					0.0	0.0
2	26.2									*9.4	*9.9
2	49.1	502	501	100.4	100.2	208.9	218.6	96.0	101.1	13.8	13.6
3	68.7	517	517	95.2	95.8	445.6	423.8	90.2	78.3	8.0	8.7

P *_AOX1* HSA P *_FLD1* *ADH2*	Time (h)	Volume (mL)		YDM (g/L)		Recombinant protein concentration (mg/L)		Specific productivity (q_P)		Methanol concentration (g/L)
P *_AOX1* HSA P *_FLD1* *ADH2*	Time (h)	Volume (mL)		YDM (g/L)		Recombinant protein concentration (mg/L)		(μg g^-1 h^-1)		Methanol concentration (g/L)
Phase		R5	R6	R5	R6	R5	R6	R5	R6	R5	R6
1	21.9	308	306	25.2	25.2
2	23.8									*10.6	*11.0
2	47.1	488	486	101.2	100.5	208.5	203.9	94.2	93.1	11.6	11.0
3	68.7	515	513	95.4	95.2	412.5	395.6	73.0	69.0	10.8	10.4

Example 10 △aox1△aox2 P_AOX1HSA			Example 21 △aox1△aox2　 P_AOX1HSA P *_AOX1* *ADH2*			Example 10 △aox1△aox2 P_AOX1HSA		Example 21 △aox1△aox2　 P_AOX1HSA P *_AOX1* *ADH2*		Fold increase
	q_P (μg g^-1 h^-1)			q_P (μg g^-1 h^-1)			q_P (μg g^-1 h^-1)
Time (h)	R1	R2	Time (h)	R1	R2	Time (h)	Average	Time (h)	Average
45.02			49.1			45.02		49.1
53.00	38.6	21.5				53.00	Weighted average 40.9
69.58	47.3	44.9	68.7	90.2	78.3	69.58	Weighted average 40.9	68.7	84.3	2.06

Example 10 △aox1△aox2 P _AOX1 HSA			Example 21 △aox1△aox2　 P _AOX1 HSA P *_FLD1* *ADH2*			Example 10 △aox1△aox2 P _AOX1 HSA		Example 21 △aox1△aox2 P _AOX1 HSA P *_FLD1* *ADH2*		Fold increase
	q_P (μg g^-1 h^-1)			q_P (μg g^-1 h^-1)			q_P (μg g^-1 h^-1)
Time (h)	R1	R2	Time (h)	R5	R6	Time (h)	Average	Time (h)	Average
45.02			47.1			45.02		47.1
53.00	38.6	21.5				53.00	Weighted average
69.58	47.3	44.9	68.7	73.0	69.0	69.58	40.9	68.7	71.0	1.74

	Example 10 △aox1△aox2 P_AOX1HSA		Example 21 △aox1△aox2 P_AOX1HSA P *_AOX1* *ADH2*		Example 10 △aox1△aox2 P_AOX1HSA	Example 21 △aox1△aox2 P_AOX1HSA P *_AOX1* *ADH2*	Fold increase
	R1	R2	R1	R2	Average	Average
Recombinant protein (mg/L)	357.3	371.8	445.6	423.8	364.6	434.7
Biomass (g/L)	95.9	96.3	95.2	95.8	96.1	95.5
*Corrected recombinant protein (mg/L)	244.2	253.6	305.6	289.8	248.9	297.7
Time (h)					69.58	68.7
Volumetric productivity (mg L ^-1 h ^-1 )					3.58	4.33	1.21

	Example 10 △aox1△aox2 P _AOX1 HSA		Example 21 △aox1△aox2 P_AOX1HSA P *_FLD1* *ADH2*		Example 10 △aox1△aox2 P _AOX1 HSA	Example 21 △aox1△aox2 P_AOX1HSA P *_FLD1* *ADH2*	Fold increase
	R1	R2	R5	R6	Average	Average
Recombinant protein (mg/L)	357.3	371.8	412.5	395.6	364.6	404.1
Biomass (g/L)	95.9	96.3	95.4	95.2	96.1	95.3
*Corrected recombinant protein (mg/L)	244.2	253.6	282.6	271.3	248.9	277.0
Time (h)					69.58	68.7
Volumetric productivity (mg L ^-1 h ^-1 )					3.58	4.03	1.13

실시예 22 : 모델 단백질로서 vHH를 생성하는 ADH2 과발현을 갖는 메탄올 이용 음성 균주. 전략 3으로 배양 - 포도당/메탄올 동시 공급 단계 및 분리된 메탄올 단독 공급 단계가 있는 공급 전략.

실시예 19에서 생성되고 실시예 20에서 선별된 메탄올 이용 음성 ADH2 과발현 균주의 재조합 단백질 생산 능력을 평가하기 위해 생물반응기 배양을 수행하였다. 실시예 10 및 실시예 11에 기재된 바와 같이, P. pastoris △aox1△aox2 pPM2pZ30_pAOX1_vHH_CycTT BB3aK_pAOX1_Adh2_CycTT (△aox1△aox2 P _AOX1 vHH P _AOX1 ADH2) 및 P. pastoris △aox1△aox2 pPM2pZ30_pAOX1_vHH_CycTT BB3aK_pFLD1_Adh2_CycTT (△aox1△aox2 P _AOX1 vHH P _AOX1 ADH2) 균주를 전략 3으로 배양하였다.

a) 이 생물 반응기 배양은 3단계로 분리되었다. (1) 1단계는 배치 단계였다. 반응기에 시작 OD₆₀₀이 2인 생산 균주를 접종하였다. 접종은 실시예 7a) b)에 기재된 바와 같이 수행하였다. 배치 단계의 끝은 용존 산소 스파이크로 표시되었다. (2) 이 시점에서 2단계가 시작되었다. 2단계는 25시간 동안 4.8mL/h의 50%(w/w) 포도당 공급으로 구성되었다. 2단계 시작 시 50%(v/v) 메탄올 펄스를 적용하여 메탄올 농도를 1.5%(v/v)의 목표로 증가시켰고 후속 메탄올 공급을 시작하여 포도당 공급에 의한 메탄올 소비, 증발 및 희석을 상쇄했다. (3) 3단계는 43.6(R3, R4) 및 44.6(R7, R8) 시간 동안 메탄올만 공급하는 것으로 구성되었다. 메탄올 농도는 실시예 6d)에 기재된 바와 같이 HPLC에 따라 측정하였다. 필요한 경우 추가 보상 펄스가 추가되었다. 메탄올 공급은 실시예 8 및 9b)에서와 같이 시간 간격으로 계산하였다. 각 반응기 R3, R4, R7 및 R8에 사용된 균주는 표 25에서 찾을 수 있다.

b) 공정 및 생산성 데이터는 표 32 및 표 33에서 찾을 수 있다. 반응기 R3, R4, R7 및 R8의 배양 전반에 걸친 최대 및 최소 메탄올 농도는 8.6g/L에서 14.4g/L 범위였다. 반응기 R3, R4 및 R7, R8은 모델 단백질로서 vHH를 생산하고 있었다. ADH2 과발현은 실시예 11과 비교하여 비 생산성(qP)에 긍정적인 영향을 미쳤습니다. 더 쉬운 비교를 위해 q_P의 가중 평균을 실시예 11의 2단계(시점 20.0 내지 53.6시간)에 대해 계산했다. 비교는 P _AOX1 ADH2 과발현(R3, R4)는 1.71배이고 PFLD1ADH2 과발현(R7, R8)은 2단계에서 qP에서 1.78배 증가한다(표 34, 표 35). 3단계의 나중 시점에서 개선 사항은 훨씬 더 크다. 시점 92.7 및 91.7에서 q_P는 3.76배(P _AOX1 ADH2 과발현) 및 3.86배(P _FLD1 ADH2 과발현) 증가한다(표 34, 표 35). 또한, 체적 생산성은 두 경우 모두에서 실시예 11의 친주에 비해 1.9배 이상 개선되었다(표 35, 표 36). 이 예에서 증가된 q_P 및 부피 생산성은 재조합 단백질 생산을 위한 P. pastoris △aox1△aox2 균주에서 ADH2 과발현의 이점을 입증한다.

P *_AOX1* vHH P *_AOX1* *ADH2*	Time (h)	Volume (mL)		YDM (g/L)		Recombinant protein concentration (mg/L)		Specific productivity (q_P)		Methanol concentration (g/L)
P *_AOX1* vHH P *_AOX1* *ADH2*	Time (h)	Volume (mL)		YDM (g/L)		Recombinant protein concentration (mg/L)		(μg g^-1 h^-1)		Methanol concentration (g/L)
Phase		R3	R4	R3	R4	R3	R4	R3	R4	R3	R4
1	24.0	318	318	24.9	24.3
2	26.2									*9.8	*10.3
2	49.1	501	502	102.6	100.6	696.1	783.0	310.3	359.4	13.9	14.4
3	68.7	518	518	94.9	94.6	1688.5	1724.9	376.1	362.0	9.4	9.7
3	92.7	544	543	86.7	85.2	2466.5	2364.8	307.4	268.3	8.6	8.9

P *_AOX1* vHH P *_FLD1* *ADH2*	Time (h)	Volume (mL)		YDM (g/L)		Recombinant protein concentration (mg/L)		Specific productivity (q_P)		Methanol concentration (g/L)
P *_AOX1* vHH P *_FLD1* *ADH2*	Time (h)	Volume (mL)		YDM (g/L)		Recombinant protein concentration (mg/L)		(μg g^-1 h^-1)		Methanol concentration (g/L)
Phase		R7	R8	R7	R8	R7	R8	R7	R8	R7	R8
1	21.9	306	307	24.5	24.3
2	23.8									*10.8	*10.7
2	47.1	485	484	100.3	98.6	738.1	761.1	339.0	358.0	10.8	11.5
3	68.7	514	513	93.3	92.3	1511.7	1555.3	284.7	297.8	11.2	11.7
3	91.7	516	514	85.8	85.2	2270.9	2364.4	285.7	305.6	10.5	10.5

Example 11 △aox1△aox2 P _AOX1 vHH			Example 22 △aox1△aox2 P _AOX1 vHH P *_AOX1* *ADH2*			Example 11 △aox1△aox2 P _AOX1 vHH		Example 22 △aox1△aox2 P _AOX1 vHH P *_AOX1* *ADH2*		Fold increase
	q_P(μg g^-1 h^-1)			q_P(μg g^-1 h^-1)			q_P(μg g^-1 h^-1)		q_P(μg g^-1 h^-1)
Time (h)	R1	R2	Time (h)	R3	R4	Time (h)	Average	Time (h)	Average
20.00			24.0			20.00	Weighted average 195.8	24.0
28.22	137.8	141.5				28.22
44.83	222.8	208.3				44.83
53.58	176.0	246.2	49.1	310.3	359.4	53.58		49.1	335	1.71
68.83	142.5	72.2	68.7	376.1	362	68.83	107.4	68.7	369	3.44
92.00	55.8	97.5	92.7	307.4	268.3	92.00	76.7	92.7	288	3.76

Example 11 △aox1△aox2 P _AOX1 vHH			Example 22 △aox1△aox2 P _AOX1 vHH P *_FLD1* *ADH2*			Example 11 △aox1△aox2 P _AOX1 vHH		Example 22 △aox1△aox2 P _AOX1 vHH P *_FLD1* *ADH2*		Fold increase
	q_P(μg g^-1 h^-1)			q_P(μg g^-1 h^-1)			q_P(μg g^-1 h^-1)		q_P(μg g^-1 h^-1)
Time (h)	R1	R2	Time (h)	R7	R8	Time (h)	Average	Time (h)	Average
20.00			21.9			20.00	Weighted average 195.8	21.9
28.22	137.8	141.5				28.22
44.83	222.8	208.3				44.83
53.58	176.0	246.2	47.1	339.0	358.0	53.58		47.1	349	1.78
68.83	142.5	72.2	68.7	284.7	297.8	68.83	107.4	68.7	291	2.71
92.00	55.8	97.5	91.7	285.7	305.6	92.00	76.7	91.7	296	3.86

	Example 11 △aox1△aox2 P_AOX1vHH		Example 22 △aox1△aox2　 P_AOX1vHH P *_AOX1* *ADH2*		Example 11 △aox1△aox2 P_AOX1vHH	Example 22 △aox1△aox2　 P_AOX1vHH P *_AOX1* *ADH2*	Fold increase
	R1	R2	R3	R4	Average	Average
Recombinant protein (mg/L)	1337.2	1374.0	2466.5	2364.8	1355.6	2415.7
Biomass (g/L)	110.8	109.4	86.7	85.2	110.1	86.0
*Corrected recombinant protein (mg/L)	848.3	878.0	1760.8	1699.9	863.1	1730.4
Time (h)	92.0	92.0	92.7	92.7	92.0	92.7
Volumetric productivity (mg L ^-1 h ^-1 )					9.38	18.67	1.99

	Example 11 △aox1△aox2 P_AOX1vHH		Example 22 △aox1△aox2　 P_AOX1vHH P *_FLD1* *ADH2*		Example 11 △aox1△aox2 P_AOX1vHH	Example 22 △aox1△aox2　 P_AOX1vHH P *_FLD1* *ADH2*	Fold increase
	R1	R2	R7	R8	Average	Average
Recombinant protein (mg/L)	1337.2	1374.0	2270.9	2364.4	1355.6	2317.7
Biomass (g/L)	110.8	109.4	85.8	85.2	110.1	85.5
*Corrected recombinant protein (mg/L)	848.3	878.0	1627.9	1699.6	863.1	1663.8
Time (h)	92.0	92.0	91.7	91.7	92.00	91.7
Volumetric productivity (mg L ^-1 h ^-1 )					9.38	18.14	1.93

P_SHB17	PP7435_chr2 (340616...341606)	(SEQ ID NO:36) GCAAGGCAACTGAGAAATTGAATAGTGGTTTCAAGCCCGCTGACTTTTTGTATTATCTCAATGTCGGTGTTTCACAGTCCCCAGAAGGGGGCTTTGCCTTCAAGGGAGACGGAAGAGACATCGTCAACCCTGGGGAGAAGTATTTCAAATGGCGCAAGTTCGCTAATTTTTACGATTAAGCAGTGCTGTATGGGGTAGTTAATAAATCGGGAATATCCTTCTGACGTGACTGTAACAAATCTCTTTTTACGTGGTGCGCATACTGGACAGAGGCAGAGTCTCAATTTCTTCTTTTGAGACAGGCTACTACAGCCTGTGATTCCTCTTGGTACTTGGATTTGCTTTTATCTGGCTCCGTTGGGAACTGTGCCTGGGTTTTGAAGTATCTTGTGGATGTGTTTCTAACACTTTTTCAATCTTCTTGGAGTGAGAATGCAGGACTTTGAACATCGTCTAGCTCGTTGGTAGGTGAACCGTTTTACCTTGCATGTGGTTAGGAGTTTTCTGGAGTAACCAAGACCGTCTTATCATCGCCGTAAAATCGCTCTTACTGTCGCTAATAATCCCGCTGGAAGAGAAGTTCGAACAGAAGTAGCACGCAAAGCTCTTGTCAAATGAGAATTGTTAATCGTTTGACAGGTCACACTCGTGGGCTATGTACGATCAACTTGCCGGCTGTTGCTGGAGAGATGACACCAGTTGTGGCATGGCCAATTGGTATTCAGCCGTACCACTGTATGGAAAATGAGATTATCTTGTTCTTGATCTAGTTTCTTGCCATTTTAGAGTTGCCACATTCGTAGGTTTCAGTACCAATAATGGTAACTTCCAAACTTCCAACGCAGATACCAGAGATCTGCCGATCCTTCCCCAACAATAGGAGCTTACTACGCCATACATATAGCCTATCTATTTTCACTTTCGCGTGGGTGCTTCTATATAAACGGTTCCCCATCTTCCGTTTCATACTACTTGAATTTTAAGCACTAAA
P_ALD4	PP7435_chr2 (1466285...1467148)	(SEQ ID NO:37) CTTTTCTTTGGGCAAGGAAAAATCAAGAAAAAGCAGAGGTTAAAGTTTTCAGGGGAATGGCAATTGCTTTATATATGGGAGAAAGTTAACTACGTCGGTGCTGTAGGCGTAGAGAGCGACTGGAGAATGCGTGATGAGGTCGTCTCTTTTCGCCCCCCCTTGGCGGGGTAAAAATTGCACTACTGCAGAATTACTACACCCCTATTCCGAGGAGACGGAGTGCGACAAAAATGGTAAAGTTCACCCTAGTCTGCGACTTTTAATTGACGGACACCGGCGTTTACATGCGAAAAAAACTAAAGTGCGCGCATTTCACGGCCGAGGGGGGTCCCACTTGGGACTGAGAGGGGGTGGGATCTGAAATCGAGGAGGTATCAAGACCCCCCGTTTCTCAACTCCCTAATCAAAAATTACGAAGTCCTCGTTGGAAAGGAGTTAAAATAATTAAGCGGGGTCGGACGCCATACCGAGGTTATCTTGCAGGCATTTTACTAATATTGGAATTCGGAGCTCAACTTGCAACCAGGCAGGGTTTAGCTATGTAATCAATGTAATCAATATAATAAAGCACTACCACATCGAAGGTTTGGGAGGGAGGCCAATAGTGTCCCCCACAGGGTGCTGATATCGCGATTCTTGGGTGAGGAGACACATATTTCACTCCTCTCACCAACCAACCAAGCGGCTCCTCGCAAGATGATTTATCCGATTATCCGGACACTATACTCCCATCCAGTTTGATGCCGATTTCATCGATTGTCCTAAATAATCCTTAAATATGTATAGAACGGTACCCTGGGGTTACATAATCCTTATTTAATAATCCCTCCCCCACCGCTTTTCTTTTTTTTTCTTCTTATTGTC
P_FDH1	PP7435_chr3 (423504...424503)	(SEQ ID NO:38) AAATGGCAGAAGGATCAGCCTGGACGAAGCAACCAGTTCCAACTGCTAAGTAAAGAAGATGCTAGACGAAGGAGACTTCAGAGGTGAAAAGTTTGCAAGAAGAGAGCTGCGGGAAATAAATTTTCAATTTAAGGACTTGAGTGCGTCCATATTCGTGTACGTGTCCAACTGTTTTCCATTACCTAAGAAAAACATAAAGATTAAAAAGATAAACCCAATCGGGAAACTTTAGCGTGCCGTTTCGGATTCCGAAAAACTTTTGGAGCGCCAGATGACTATGGAAAGAGGAGTGTACCAAAATGGCAAGTCGGGGGCTACTCACCGGATAGCCAATACATTCTCTAGGAACCAGGGATGAATCCAGGTTTTTGTTGTCACGGTAGGTCAAGCATTCACTTCTTAGGAATATCTCGTTGAAAGCTACTTGAAATCCCATTGGGTGCGGAACCAGCTTCTAATTAAATAGTTCGATGATGTTCTCTAAGTGGGACTCTACGGCTCAAACTTCTACACAGCATCATCTTAGTAGTCCCTTCCCAAAACACCATTCTAGGTTTCGGAACGTAACGAAACAATGTTCCTCTCTTCACATTGGGCCGTTACTCTAGCCTTCCGAAGAACCAATAAAAGGGACCGGCTGAAACGGGTGTGGAAACTCCTGTCCAGTTTATGGCAAAGGCTACAGAAATCCCAATCTTGTCGGGATGTTGCTCCTCCCAAACGCCATATTGTACTGCAGTTGGTGCGCATTTTAGGGAAAATTTACCCCAGATGTCCTGATTTTCGAGGGCTACCCCCAACTCCCTGTGCTTATACTTAGTCTAATTCTATTCAGTGTGCTGACCTACACGTAATGATGTCGTAACCCAGTTAAATGGCCGAAAAACTATTTAAGTAAGTTTATTTCTCCTCCAGATGAGACTCTCCTTCTTTTCTCCGCTAGTTATCAAACTATAAACCTATTTTACCTCAAATACCTCCAACATCACCCACTTAAACA
P_DAS1	PP7435_chr3 (634140...634688)	(SEQ ID NO:39) AATGATATAAACAACAATTGAGTGACAGGTCTACTTTGTTCTCAAAAGGCCATAACCATCTGTTTGCATCTCTTATCACCACACCATCCTCCTCATCTGGCCTTCAATTGTGGGGAACAACTAGCATCCCAACACCAGACTAACTCCACCCAGATGAAACCAGTTGTCGCTTACCAGTCAATGAATGTTGAGCTAACGTTCCTTGAAACTCGAATGATCCCAGCCTTGCTGCGTATCATCCCTCCGCTATTCCGCCGCTTGCTCCAACCATGTTTCCGCCTTTTTCGAACAAGTTCAAATACCTATCTTTGGCAGGACTTTTCCTCCTGCCTTTTTTAGCCTCAGGTCTCGGTTAGCCTCTAGGCAAATTCTGGTCTTCATACCTATATCAACTTTTCATCAGATAGCCTTTGGGTTCAAAAAAGAACTAAAGCAGGATGCCTGATATATAAATCCCAGATGATCTGCTTTTGAAACTATTTTCAGTATCTTGATTCGTTTACTTACAAACAACTATTGTTGATTTTATCTGGAGAATAATCGAACAAA
P_DAS2	PP7435_chr3 (632201...633200)	(SEQ ID NO:40) ATTACTGTTTTGGGCAATCCTGTTGATAAGACGCATTCTAGAGTTGTTTCATGAAAGGGTTACGGGTGTTGATTGGTTTGAGATATGCCAGAGGACAGATCAATCTGTGGTTTGCTAAACTGGAAGTCTGGTAAGGACTCTAGCAAGTCCGTTACTCAAAAAGTCATACCAAGTAAGATTACGTAACACCTGGGCATGACTTTCTAAGTTAGCAAGTCACCAAGAGGGTCCTATTTAACGTTTGGCGGTATCTGAAACACAAGACTTGCCTATCCCATAGTACATCATATTACCTGTCAAGCTATGCTACCCCACAGAAATACCCCAAAAGTTGAAGTGAAAAAATGAAAATTACTGGTAACTTCACCCCATAACAAACTTAATAATTTCTGTAGCCAATGAAAGTAAACCCCATTCAATGTTCCGAGATTTAGTATACTTGCCCCTATAAGAAACGAAGGATTTCAGCTTCCTTACCCCATGAACAGAAATCTTCCATTTACCCCCCACTGGAGAGATCCGCCCAAACGAACAGATAATAGAAAAAAGAAATTCGGACAAATAGAACACTTTCTCAGCCAATTAAAGTCATTCCATGCACTCCCTTTAGCTGCCGTTCCATCCCTTTGTTGAGCAACACCATCGTTAGCCAGTACGAAAGAGGAAACTTAACCGATACCTTGGAGAAATCTAAGGCGCGAATGAGTTTAGCCTAGATATCCTTAGTGAAGGGTTGTTCCGATACTTCTCCACATTCAGTCATAGATGGGCAGCTTTGTTATCATGAAGAGACGGAAACGGGCATTAAGGGTTAACCGCCAAATTATATAAAGACAACATGTCCCCAGTTTAAAGTTTTTCTTTCCTATTCTTGTATCCTGAGTGACCGTTGTGTTTAATATAACAAGTTCGTTTTAACTTAAGACCAAAACCAGTTACAACAAATTATAACCCCTCTAAACACTAAAGTTCACTCTTATCAAACTATCAAACATCAAAA
P_PMP20	PP7435_ Chr1 (2418090...2419089)	(SEQ ID NO:41) GTCAACTGCGTACTCTTTTGTCGAATGGACTACTGAATCTGCCTCGATAGCCACTATAGGAAGGTCCATAGAGGCCAGTTTTTCAACTAGTCTTGGTGGAAAGAAACCGACAAAGCCTTTCATGGAGTCACCGATACTGAAAGGTTCAAACAAAGAATGCTTGGGTAGTCTCTTAATACCCATGGCAACGAAAAAGGGGTCTTCATTGTTCAACATGAATTCGTATCCACCTTTAATGTAGTCATAAAGCTGCTGAAGTTCCGAATCAGTGATGGAACTGTCTACAGTGACAATATAGGAGTTCTCAATCACCTTATATCCAGTCGAATATATCTGGATAGGGTCGGGTCTCACTGTGGAAGATTCAAATGGGTTAGATCCCTGTAATTTCAGCGATGGAGACTCAGTATGATGGGGCAAGGAAAACGGCAATTGGATATTCAATTGGTCAAGAGATGGTATCAAAAGCGAGTGTGCCAGGGTAGCCACGGTAGCCACTGATGCTAATCTGATAATTTTCATTTCTGGAGTGTCAAAACAGTAGTGATAAAAGGCTATGAAGGAGGTTGTCTAGGGGCTCGCGGAGGAAAGTGATTCAAACAGACCTGCCAAAAAGAGAAAAAAGAGGGAATCCCTGTTCTTTCCAATGGAAATGACGTAACTTTAACTTGAAAAATACCCCAACCAGAAGGGTTCAAACTCAACAAGGATTGCGTAATTCCTACAAGTAGCTTAGAGCTGGGGGAGAGACAACTGAAGGCAGCTTAACGATAACGCGGGGGGATTGGTGCACGACTCGAAAGGAGGTATCTTAGTCTTGTAACCTCTTTTTTCCAGAGGCTATTCAAGATTCATAGGCGATATCGATGTGGAGAAGGGTGAACAATATAAAAGGCTGGAGAGATGTCAATGAAGCAGCTGGATAGATTTCAAATTTTCTAGATTTCAGAGTAATCGCACAAAACGAAGGAATCCCACCAAGCAAAAAAAAAAATCTAAG
P_FBA1-2	PP7435_Chr1 (1162918...1163621)	(SEQ ID NO:42) AAATTAATCCATAAGATAAGGCAAATGTGCTTAAGTAATTGAAAACAGTGTTGTGATTATATAAGCATGGTATTTGAATAGAACTACTGGGGTTAACTTATCTAGTAGGATGGAAGTTGAGGGAGATCAAGATGCTTAAAGAAAAGGATTGGCCAATATGAAAGCCATAATTAGCAATACTTATTTAATCAGATAATTGTGGGGCATTGTGACTTGACTTTTACCAGGACTTCAAACCTCAACCATTTAAACAGTTATAGAAGACGTACCGTCACTTTTGCTTTTAATGTGATCTAAATGTGATCACATGAACTCAAACTAAAATGATATCTTTTACTGGACAAAAATGTTATCCTGCAAACAGAAAGCTTTCTTCTATTCTAAGAAGAACATTTACATTGGTGGGAAACCTGAAAACAGAAAATAAATACTCCCCAGTGACCCTATGAGCAGGATTTTTGCATCCCTATTGTAGGCCTTTCAAACTCACACCTAATATTTCCCGCCACTCACACTATCAATGATCACTTCCCAGTTCTCTTCTTCCCCTATTCGTACCATGCAACCCTTACACGCCTTTTCCATTTCGGTTCGGATGCGACTTCCAGTCTGTGGGGTACGTAGCCTATTCTCTTAGCCGGTATTTAAACATACAAATTCACCCAAATTCTACCTTGATAAGGTAATTGATTAATTTCATAAAT
P_PMP47	PP7435_Chr3 (2033196??2034195)	(SEQ ID NO:43)AGCTCAGATTGGAAATGATTTTTGATCCTACCAAGAAGCCTTTGATTTCCAGAATCTCCGCTAAGTAAGTAACCCCCGCAAACGCATGCATCCATGCAAACAAAATACTAACAATTTTAGCCCCGTTGTTGAGAAACCCAGAAAATTGAATGTTCAACCAATCCAGACGATCAATAAGAAAAAAGGCCCAAAGGCTACTTCCAAACCTGCTGCCGCCAAACCTGCTCCTTCAAAAGCCGGTCCCAAGGGAGGTAAGAAGGTGAGAAAGCCAAAGAAGACAGTTGAAGAATTGGATCAGGAAATGGCTGACTACTTTGAAAATAAGAATTAGCCCAACAAAATATGTACAAGTATTATATAAATGAATCTACATGGTGTGTTTTATTTAGATCCTCCAAACCAAGGAAAGAAACTAAACTTATCTCCGGACTTACGAGTCAAATAACTATCCGCAGTTCCTTGGAACTCAGACTTTCTTCCATAAGCGGTCATATCATCTTTGGACTGTGGGAATCCTGGACGAATCTTTGAAATGTCATAATCTTGCTCTCTATCTCCAAGCACAGCGTCCGGTAAATGCTGGTTCTTCTTTCTCAGATGAATCTTGGATTTAACAAATAAAGCCGTGCCTATGGCTAATGTACTCAAAAACAAAGTCTGCTTCCAGAATTTCGCAAACGATGGAATGCCATTTCCTGTAAATGTACTCATTGAACCTATGTTTGATTAAAGTTGGTGTGAAGTCATCAAACGAGAGTAAAATCAGATACTCGTGCACCGGCCAAAATTGACTGAGCTAATCTCTGCAGGCTTGACATCCGAACACAACAAATAGGCGACAAATCTTAACTATCTAATCGTAGGCTATGGTAGAACTTTGTGGGGGTAGAGGAAGACTACAACAGCAAGACAAAACAAAAGAGTCATAGTTTGACTCTCTGCTTTTTTCTTCTTTCTCTTCTTTTTCTTCCTCCATATTCGTTATTTATTTCGAACTGGA
P_FLD	PP7435_Chr3 (262519...263518)	(SEQ ID NO:44) CAGCCATTAATCTCACCTCAGTTTTTGAATCAGTAGAATTTTTAATGAAACAAACGGTTGGTATATTATTTGATAGAGTTGCCAAATTTCCAAAGATAAATTTTTCATCAGGTAATATCCTGAATACCGTAACATAGTGACTATTGGAAGACACTGCTATCATATTATATTTCGGATAAAAATCCAAACCCCAGACCGACCTCTTGAGTCTCAACTCCAAGTCAGCCGCAACTTTAATTATCCGTGGATTGGGAGCTAGTTTGGACAACGCATCAGTATAATATAACTTTACGGTTCCATTATCAGACGCTATTGCAAGAACTTCCTTTCCATTGATCTCGCCAATGCGGCAGTAATTGATATCGTAGGGTAGGTCTGGAAAGACGCTGGCGCTTGTGTCCCATTCTGCAGGAATCTCTGGCACGGTGCTAATGGTAGTTATCCAACGGAGCTGAGGTAGTCGATATATCTGGATATGCCGCCTATAGGATAAAAACAGGAGAGGGTGAACCTTGCTTATGGCTACTAGATTGTTCTTGTACTCTGAATTCTCATTATGGGAAACTAAACTAATCTCATCTGTGTGTTGCAGTACTATTGAATCGTTGTAGTATCTACCTGGAGGGCATTCCATGAATTAGTGAGATAACAGAGTTGGGTAACTAGAGAGAATAATAGACGTATGCATGATTACTACACAACGGATGTCGCACTCTTTCCTTAGTTAAAACTATCATCCAATCACAAGATGCGGGCTGGAAAGACTTGCTCCCGAAGGATAATCTTCTGCTTCTATCTCCCTTCCTCATATGGTTTCGCAGGGCTCATGCCCCTTCTTCCTTCGAACTGCCCGATGAGGAAGTCCTTAGCCTATCAAAGAATTCGGGACCATCATCGATTTTTAGAGCCTTACCTGATCGCAATCAGGATTTCACTACTCATATAAATACATCGCTCAAAGCTCCAACTTTGCTTGTTCATACAATTCTTGATATTCACA
P_FGH1	PP7435_Chr3 (555587...556586)	(SEQ ID NO:45) TGGTTCCCTCTCGGTCCAATACCAAAAATATTATCACCATACAGGTCTCCCTTCGATACCAGTGCAAAGTTGAACCGTGGGATTACCTTGGAATCTACAAAAATAGTGTCACTCACAAGTTTGTCATCAACCACGCTGCCGCTTGCAAAGGAGAACTGAACATGAAGGTTGTTAGGGTTTGTTATATTGGAATAAGTGGTGGATTTGTTGAAGGCGAACGCACCAAAGCTACATCCGTCCTGAGCACACTGTGAATTTGTCACGGAATTGACCAAGAGGTCAGACGATCCTGTATCCCATTGAGCCGTTATGCTTTGTGGGGGAAACCCTATTTCTATCGTACTAAGAAAACCAATGGTGAACTCATATTCGGTATCAATGGCGACGATTCCAGCATAGCCTGTAGACAGTAACAACACTAGGGCAACAGCAACTAACATATCTTCATTGATGAAACGTTGTGATCGGTGTGACTTTTATAGTAAAAGCTACAACTGTTTGAAATACCAAGATATCATTGTGAATGGCTCAAAAGGGTAATACATCTGAAAAACCTGAAGTGTGGAAAATTCCGATGGAGCCAACTCATGATAACGCAGAAGTCCCATTTTGCCATCTTCTCTTGGTATGAAACGGTAGAAAATGATCCGAGTATGCCAATTGATACTCTTGATTCATGCCCTATAGTTTGCGTAGGGTTTAATTGATCTCCTGGTCTATCGATCTGGGACGCAATGTAGACCCCATTAGTGGAAACACTGAAAGGGATCCAACACTCTAGGCGGACCCGCTCACAGTCATTTCAGGACAATCACCACAGGAATCAACTACTTCTCCCAGTCTTCCTTGCGTGAAGCTTCAAGCCTACAACATAACACTTCTTACTTAATCTTTGATTCTCGAATTGTTTACCCAATCTTGACAACTTAGCCTAAGCAATACTCTGGGGTTATATATAGCAATTGCTCTTCCTCGCTGTAGCGTTCATTCCATCTTTCTA
P_TAL1-2	PP7435_Chr2 (644082...645082)	(SEQ ID NO:46) GATATCGATCTACACTTAATAGTAGATGACGAGGCATCTCTCCAATAGGTACCATATCTGGTGTTTCTTGTAATTTAAGAATCTGTTGGTCTATGAATGTAGATTTGTCATGAACAATGATATATGGGTCAGGAGGACAAGATGGTTTCTCTGAGTTGGGTTGTTGAGGTGCCTGGCAAGACTTCGGAGCGTTGATATCCCCAAGACTTGTAGTGACCGATAGTTGAAGCGTGTGTTTGCAGGAACGGCACATCAATGCAACTTTCGTAACTTTGGAATTGAGAGTTGATGCACTGATGACGATACCCGAAATTTTGACGATTTTACCAATATGACTTGAAGACAAGTCTCTCATTGAAACCTTATTATCGTTACTAAGCAAAACGAGCTGACAAGAAGGGAAGGTGGTCGGTATTTCCTCGTTGTTCAAATATATGATTCTCCTGGCAATATCTGTGATGGCCTGTTCAAAAAGTGGAATCATTTCTGCAGGATCATCTACCAACTTTTTATTGAGCTCCTCATTGAATACGATTAAGTGGTCATTTTGAATCGTCAGTAAGTACTTGTTTACAAGTAAATTCTGTCTGAGTTGTTCTCTGTAGATGTACTGATTTTCCATACGAAACTCCAAAATGAACGAACGGAATGCCTTAATGACCTCACTGAACTGGTCATCGTTCTGTTCTCCGGGAAGGACACTTGTGTTAAAGACTGATGCTCTATCAAAGGACATTGCAACAAAGTATAAACGGTTGTGAGCGGGAAAAAGATGTGTAGGTAATTGTCGTAGATGAGACTGATTCAGTAGAAAACGCGTCCTGCACTATTTTTTTCTTTCTTCATTACATTTCCTAATCGGGACAAAATGAATCTAAAGACGTGGTTATGTAGTACACGCATCGATAGGCTATCCCCATACCAAAACACTATTTTACCCCATCCTTGACAGGTTATAAATATGCGATAGTATGAGTATCTTCAAATTCAGCTGAAATATC
P_DAS2	PP7435_Chr3(633689-634688)	SEQ ID NO:47) AATAAAAAAACGTTATAGAAAGAAATTGGACTACGATATGCTCCAATCCAAATTGTCAAAATTGACCACCGAAAAAGAACAATTGGAATTTGACAAGAGGAACAACTCACTAGATTCTCAAACGGAGCGTCACCTAGAGTCAGTTTCCAAGTCAATTACAGAAAGTTTGGAAACAGAAGAGGAGTATCTACAATTGAATTCCAAACTTAAAGTCGAGCTGTCCGAATTCATGTCGCTAAGGCTTTCTTACTTGGACCCCATTTTTGAAAGTTTCATTAAAGTTCAGTCAAAAATTTTCATGGACATTTATGACACATTAAAGAGCGGACTACCTTATGTTGATTCTCTATCCAAAGAGGATTATCAGTCCAAGATCTTGGACTCTAGAATAGATAACATTCTGTCGAAAATGGAAGCGCTGAACCTTCAAGCTTACATTGATGATTAGAGCAATGATATAAACAACAATTGAGTGACAGGTCTACTTTGTTCTCAAAAGGCCATAACCATCTGTTTGCATCTCTTATCACCACACCATCCTCCTCATCTGGCCTTCAATTGTGGGGAACAACTAGCATCCCAACACCAGACTAACTCCACCCAGATGAAACCAGTTGTCGCTTACCAGTCAATGAATGTTGAGCTAACGTTCCTTGAAACTCGAATGATCCCAGCCTTGCTGCGTATCATCCCTCCGCTATTCCGCCGCTTGCTCCAACCATGTTTCCGCCTTTTTCGAACAAGTTCAAATACCTATCTTTGGCAGGACTTTTCCTCCTGCCTTTTTTAGCCTCAGGTCTCGGTTAGCCTCTAGGCAAATTCTGGTCTTCATACCTATATCAACTTTTCATCAGATAGCCTTTGGGTTCAAAAAAGAACTAAAGCAGGATGCCTGATATATAAATCCCAGATGATCTGCTTTTGAAACTATTTTCAGTATCTTGATTCGTTTACTTACAAACAACTATTGTTGATTTTATCTGGAGAATAATCGAACAAA
P_CAM1	PP7435_Chr3(178828-179827)	SEQ ID NO:48) ATTGTTGTGAATACTCTCCTTCATTTGGATTTCTTGGACTTCGGACTCTCTTGATCTCTCTTCGAAAGTTTTAACTCTGTTCATGTATAATTTTACCCGCTGTAGGTCGCTCATAATACCATGAGTATGCACATCTTTTACTCCATTAACTTTCAGGTATGCAAAATACAATGAAGATAGTATATAGCTCAAAGAATTTAGCATTTTGCATTGATCTAATTGTGACATTTTCTCTATGATATCATCTAGCTTCTTAAACTCGAGAATCTCGTCCAACGAGGCAGAAACATTGTCCAGTCTTACGTCAAGATTATTCACGAGTTTCTGGACCGTATCAACGTTTTCCATCTTAAGATTACAGTAAGTATCGTCCTTTTGAACTGCAAAGGTAGAAAAGTTAATTTTTGATTTGGTAGTACACTATGAAACTTGCTCACCCCAATCTTTCCTCCTGACAGGTTGATCTTTATCCCTCTACTAAATTGCCCCAAGTGTATCAAGTAGACTAGATCTCGCGAAAGAACAGCCTAATAAACTCCGAAGCATGATGGCCTCTATCCGGAAAACGTTAAGAGATGTGGCAACAGGAGGGCACATAGAATTTTTAAAGACGCTGAAGAATGCTATCATAGTCCGTAAAAATGTGATAGTACTTTGTTTAGTGCGTACGCCACTTATTCGGGGCCAATAGCTAAACCCAGGTTTGCTGGCAGCAAATTCAACTGTAGATTGAATCTCTCTAACAATAATGGTGTTCAATCCCCTGGCTGGTCACGGGGAGGACTATCTTGCGTGATCCGCTTGGAAAATGTTGTGTATCCCTTTCTCAATTGCGGAAAGCATCTGCTACTTCCCATAGGCACCAGTTACCCAATTGATATTTCCAAAAAAGATTACCATATGTTCATCTAGAAGTATAAATACAAGTGGACATTCAATGAATATTTCATTCAATTAGTCATTGACACTTTCATCAACTTACTACGTCTTATTCAACAAT
P _{PP7435_Chr1-0336}	PP7435_Chr1(615194-615193)	SEQ ID NO:49) TATACGGTCTATCCACTTTGGAAACGATGTAGTTGAAACGGGGAAGTAATAGTGGTTCCCAAACGACATGAAGAGGTTATATAAGTTTGCAAGAGGGTGACACCATTTTAGTTGTGGTTCCCGGGTATTTTTTTAATCTTTTTAGTCTAAGATAGCCTCCCCAGATATTACCGAGTTGGGCCATTTGGGGCGGTATCGGTGGTATCTGATGGTAGCGCGTTTTTACATGCCTGTGCATTGAACTGGCAAAGAGTATACTATCGTGGGGCCCTGAAGGAGGCAGCAAATGGACCGTCAATTGGTTGATCAGGGACTCAAGACAGGTATTGAGCTTTTCAAACAAAAAGAGTATAGGCGCTGCTACAAGGCATTTACTTCTACTATCAATTTCATTGAGAATGATCCCGAGTTGGCCGCCAGCTGTGTATCTCAACTGATATCTCTGTTAGATTGTAGGGCAGCCTGTTTGGAAAAGCTAGATCAATTGAATATGGCCTTGAAAGATGGTCTTAAAATGATCAAGAGAGAGTGCCACAACTGCAAGGGTTATTTGAGAACTTGCAAAATTTTAGACCTACAAGGGAAGATCAGTGAGGCTTTGTCTACAGCAAGAGAAGGGATCTCCATAATAGAAACTAGAAGAGATCAGGATAATCAATTTAGATATTCCAAGGTTCTTTTGGAACAATTAAAGGAACTGAAAAATGCACTGAAAATCAAATTGGACAAGAAAAATCAGCTACACTTCAAAGTTTTAAAGTTTGACGCACCAGTGCCTTGTACAAAGAAACTAAGATTAGTCACTCCAAGAACAATAGATCCTTCCATTTTTTTGCCGATAGAGCTAGTGAAGCTGATCTTTCGCCTGTTGAATTTCTCAGACATGTATGCCTGTTTATTGGTCTCAACAAAATGGAACTCAATTATATCCTCATCACCGGAACTGTTTCGAAAACTTCAGTTGAAATCCCAACTGTCCAACAAGGCGTTAAACAATTGT

References:

Ata, O., Prielhofer, R., Gasser, B., Mattanovich, D., & Calik, P. (2017). Transcriptional engineering of the glyceraldehyde-3-phosphate dehydrogenase promoter for improved heterologous protein production in Pichia pastoris: Transcriptional Engineering of the P GAP for Gene Overexpression in P. pastoris. Biotechnology and Bioengineering, 114(10), 2319-2327. https://doi.org/10.1002/bit.26363

Aw, R., & Polizzi, K. M. (2013). Can too many copies spoil the broth? Microbial Cell Factories, 12, 128. https://doi.org/10.1186/1475-2859-12-128

Blumhoff, M., Steiger, M. G., Marx, H., Mattanovich, D., & Sauer, M. (2013). Six novel constitutive promoters for metabolic engineering of Aspergillus niger. Applied Microbiology and Biotechnology, 97(1), 259-267. https://doi.org/10.1007/s00253-012-4207-9

Gasser, B., Prielhofer, R., Marx, H., Maurer, M., Nocon, J., Steiger, M., Mattanovich, D. (2013). Pichia pastoris: protein production host and model organism for biomedical research. Future Microbiology, 8(2), 191-208. https://doi.org/10.2217/fmb.12.133

Gasser, B., Steiger, M. G., & Mattanovich, D. (2015). Methanol regulated yeast promoters: production vehicles and toolbox for synthetic biology. Microbial Cell Factories, 14(1). https://doi.org/10.1186/s12934-015-0387-1

Hohenblum, H., Borth, N., & Mattanovich, D. (2003). Assessing viability and cell-associated product of recombinant protein producing Pichia pastoris with flow cytometry. Journal of Biotechnology, 102(3), 281-290. https://doi.org/10.1016/S0168-1656(03)00049-X

Looser, V., Bruhlmann, B., Bumbak, F., Stenger, C., Costa, M., Camattari, A., Kovar, K. (2015). Cultivation strategies to enhance productivity of Pichia pastoris: A review. Biotechnology Advances, 33(6), 1177-1193. https://doi.org/10.1016/j.biotechadv.2015.05.008

Marx, H., Mattanovich, D., & Sauer, M. (2008). Overexpression of the riboflavin biosynthetic pathway in Pichia pastoris. Microbial Cell Factories, 7(1), 23. https://doi.org/10.1186/1475-2859-7-23

Mellitzer, A., Ruth, C., Gustafsson, C., Welch, M., Birner-Gr

nberger, R., Weis, R., Glieder, A. (2014). Synergistic modular promoter and gene optimization to push cellulase secretion by Pichia pastoris beyond existing benchmarks. Journal of Biotechnology, 191, 187-195. https://doi.org/10.1016/j.jbiotec.2014.08.035

Nocon, J., Steiger, M. G., Pfeffer, M., Sohn, S. B., Kim, T. Y., Maurer, M., Mattanovich, D. (2014). Model based engineering of Pichia pastoris central metabolism enhances recombinant protein production. Metabolic Engineering, 24, 129-138. https://doi.org/10.1016/j.ymben.2014.05.011

Prielhofer, R., Barrero, J. J., Steuer, S., Gassler, T., Zahrl, R., Baumann, K., Marx, H. (2017). GoldenPiCS: a Golden Gate-derived modular cloning system for applied synthetic biology in the yeast Pichia pastoris. BMC Systems Biology, 11(1). https://doi.org/10.1186/s12918-017-0492-3

Prielhofer, R., Maurer, M., Klein, J., Wenger, J., Kiziak, C., Gasser, B., & Mattanovich, D. (2013). Induction without methanol: novel regulated promoters enable high-level expression in Pichia pastoris. Microbial Cell Factories, 12(1), 5. https://doi.org/10.1186/1475-2859-12-5

Schwarzhans, J.-P., Wibberg, D., Winkler, A., Luttermann, T., Kalinowski, J., & Friehs, K. (2016). Integration event induced changes in recombinant protein productivity in Pichia pastoris discovered by whole genome sequencing and derived vector optimization. Microbial Cell Factories, 15, 84. https://doi.org/10.1186/s12934-016-0486-7

Stadlmayr, G., Mecklenbrauker, A., Rothmuller, M., Maurer, M., Sauer, M., Mattanovich, D., & Gasser, B. (2010). Identification and characterisation of novel Pichia pastoris promoters for heterologous protein production. Journal of Biotechnology, 150(4), 519-529. https://doi.org/10.1016/j.jbiotec.2010.09.957

<110> Lonza Ltd <120> MUT- METHYLOTROPHIC YEAST <130> F21-8761-AT <150> PCT/EP 2019/058190 <151> 2019-04-01 <150> PCT/EP 2019058191 <151> 2019-04-01 <160> 85 <170> KoPatentIn 3.0 <210> 1 <211> 663 <212> PRT <213> Unknown <220> <223> Komagataella phaffii <400> 1 Met Ala Ile Pro Glu Glu Phe Asp Ile Leu Val Leu Gly Gly Gly Ser 1 5 10 15 Ser Gly Ser Cys Ile Ala Gly Arg Leu Ala Asn Leu Asp His Ser Leu 20 25 30 Lys Val Gly Leu Ile Glu Ala Gly Glu Asn Asn Leu Asn Asn Pro Trp 35 40 45 Val Tyr Leu Pro Gly Ile Tyr Pro Arg Asn Met Lys Leu Asp Ser Lys 50 55 60 Thr Ala Ser Phe Tyr Thr Ser Asn Pro Ser Pro His Leu Asn Gly Arg 65 70 75 80 Arg Ala Ile Val Pro Cys Ala Asn Ile Leu Gly Gly Gly Ser Ser Ile 85 90 95 Asn Phe Met Met Tyr Thr Arg Gly Ser Ala Ser Asp Tyr Asp Asp Phe 100 105 110 Glu Ala Glu Gly Trp Lys Thr Lys Asp Leu Leu Pro Leu Met Lys Lys 115 120 125 Thr Glu Thr Tyr Gln Arg Ala Cys Asn Asn Pro Glu Ile His Gly Phe 130 135 140 Glu Gly Pro Ile Lys Val Ser Phe Gly Asn Tyr Thr Tyr Pro Val Cys 145 150 155 160 Gln Asp Phe Leu Arg Ala Thr Glu Ser Gln Gly Ile Pro Tyr Val Asp 165 170 175 Asp Leu Glu Asp Leu Val Thr Ala His Gly Ala Glu His Trp Leu Lys 180 185 190 Trp Ile Asn Arg Asp Thr Gly Arg Arg Ser Asp Ser Ala His Ala Phe 195 200 205 Val His Ser Thr Met Arg Asn His Asp Asn Leu Tyr Leu Ile Cys Asn 210 215 220 Thr Lys Val Asp Lys Ile Ile Val Glu Asp Gly Arg Ala Ala Ala Val 225 230 235 240 Arg Thr Val Pro Ser Lys Pro Leu Asn Ala Lys Lys Pro Thr His Lys 245 250 255 Val Tyr Arg Ala Arg Lys Gln Ile Val Leu Ser Cys Gly Thr Ile Ser 260 265 270 Ser Pro Leu Val Leu Gln Arg Ser Gly Phe Gly Asp Pro Ile Lys Leu 275 280 285 Arg Ala Ala Gly Val Lys Pro Leu Val Asn Leu Pro Gly Val Gly Arg 290 295 300 Asn Phe Gln Asp His Tyr Cys Phe Phe Ser Pro Tyr Arg Ile Lys Pro 305 310 315 320 Gln Tyr Glu Ser Phe Asp Asp Phe Val Arg Gly Asp Ala Asn Ile Gln 325 330 335 Lys Lys Val Phe Asp Gln Trp Tyr Ala Asn Gly Thr Gly Pro Leu Ala 340 345 350 Thr Asn Gly Ile Glu Ala Gly Val Lys Ile Arg Pro Thr Pro Glu Glu 355 360 365 Leu Ser Gln Met Asp Glu Ser Phe Gln Glu Gly Tyr Arg Glu Tyr Phe 370 375 380 Glu Asp Lys Pro Asp Lys Pro Val Met His Tyr Ser Ile Ile Ala Gly 385 390 395 400 Phe Phe Gly Asp His Thr Lys Ile Pro Pro Gly Lys Tyr Met Thr Met 405 410 415 Phe His Phe Leu Glu Tyr Pro Phe Ser Arg Gly Ser Ile His Ile Thr 420 425 430 Ser Pro Asp Pro Tyr Ala Thr Pro Asp Phe Asp Pro Gly Phe Met Asn 435 440 445 Asp Glu Arg Asp Met Ala Pro Met Val Trp Ser Tyr Lys Lys Ser Arg 450 455 460 Glu Thr Ala Arg Lys Met Asp His Phe Ala Gly Glu Val Thr Ser His 465 470 475 480 His Pro Leu Phe Pro Tyr Ser Ser Glu Ala Arg Ala Tyr Glu Met Asp 485 490 495 Leu Glu Thr Ser Asn Ala Tyr Gly Gly Pro Leu Asn Leu Thr Ala Gly 500 505 510 Leu Ala His Gly Ser Trp Thr Gln Pro Leu Lys Lys Pro Ala Gly Arg 515 520 525 Asn Glu Gly His Val Thr Ser Asn Gln Val Glu Leu His Pro Asp Ile 530 535 540 Glu Tyr Asp Glu Glu Asp Asp Lys Ala Ile Glu Asn Tyr Ile Arg Glu 545 550 555 560 His Thr Glu Thr Thr Trp His Cys Leu Gly Thr Cys Ser Ile Gly Pro 565 570 575 Arg Glu Gly Ser Lys Ile Val Lys Trp Gly Gly Val Leu Asp His Arg 580 585 590 Ser Asn Val Tyr Gly Val Lys Gly Leu Lys Val Gly Asp Leu Ser Val 595 600 605 Cys Pro Asp Asn Val Gly Cys Asn Thr Tyr Thr Thr Ala Leu Leu Ile 610 615 620 Gly Glu Lys Thr Ala Thr Leu Val Gly Glu Asp Leu Gly Tyr Thr Gly 625 630 635 640 Glu Ala Leu Asp Met Thr Val Pro Gln Phe Lys Leu Gly Thr Tyr Glu 645 650 655 Lys Thr Gly Leu Ala Arg Phe 660 <210> 2 <211> 1992 <212> DNA <213> Unknown <220> <223> Komagataella phaffii <400> 2 atggctatcc ccgaagagtt tgatatccta gttctaggtg gtggatccag tggatcctgt 60 attgccggaa gattggcaaa cttggaccac tccttgaaag ttggtcttat cgaagcaggt 120 gagaacaacc tcaacaaccc atgggtctac cttccaggta tttacccaag aaacatgaag 180 ttggactcca agactgcttc cttctacact tctaacccat ctcctcactt gaatggtaga 240 agagccattg ttccatgtgc taacgtcttg ggtggtggtt cttctatcaa cttcatgatg 300 tacaccagag gttctgcttc tgattacgat gacttccaag ccgagggctg gaaaaccaag 360 gacttgcttc cattgatgaa aaagactgag acctaccaaa gagcttgcaa caaccctgac 420 attcacggtt tcgaaggtcc aatcaaggtt tctttcggta actacaccta cccagtttgc 480 caggacttct tgagggcttc tgagtcccaa ggtattccat acgttgacga cttggaagac 540 ttggttactg ctcacggtgc tgaacactgg ttgaagtgga tcaacagaga cactggtcgt 600 cgttccgact ctgctcatgc atttgtccac tctactatga gaaaccacga caacttgtac 660 ttgatctgta acacgaaggt cgacaaaatt attgtcgaag acggaagagc tgctgctgtt 720 agaaccgttc caagcaagcc tttgaaccca aagaagccaa gtcacaagat ctaccgtgct 780 agaaagcaaa tcgttttgtc ttgtggtacc atctcctctc cattggtttt gcaaagatcc 840 ggttttggtg acccaatcaa gttgagagcc gctggtgtta agcctttggt caacttgcca 900 ggtgtcggaa gaaacttcca agaccactac tgtttcttca gtccttacag aatcaagcct 960 cagtacgagt ctttcgatga cttcgtccgt ggtgatgctg agattcaaaa gagagtcttt 1020 gaccaatggt acgccaatgg tactggtcct cttgccacta acggtatcga agctggtgtc 1080 aagatcagac caacaccaga agaactctct caaatggacg aatccttcca ggagggttac 1140 agagaatact tcgaagacaa gccagacaag ccagttatgc actactccat cattgctggt 1200 ttcttcggtg accacaccaa gattcctcct ggaaagtaca tgactatgtt ccacttcttg 1260 gaatacccat tctccagagg ttccattcac attacctccc cagacccata cgcagctcca 1320 gacttcgacc caggtttcat gaacgatgaa agagacatgg ctcctatggt ttgggcttac 1380 aagaagtcta gagaaaccgc tagaagaatg gaccactttg ccggtgaggt cacttctcac 1440 caccctctgt tcccatactc atccgaggcc agagccttgg aaatggattt ggagacctct 1500 aatgcctacg gtggaccttt gaacttgtct gctggtcttg ctcacggttc ttggactcaa 1560 cctttgaaga agccaactgc aaagaacgaa ggccacgtta cttcgaacca ggtcgagctt 1620 catccagaca tcgagtacga tgaggaggat gacaaggcca ttgagaacta cattcgtgag 1680 cacactgaga ccacatggca ctgtctggga acctgttcca tcggtccaag agaaggttcc 1740 aagatcgtca aatggggtgg tgttttggac cacagatcca acgtttacgg agtcaagggc 1800 ttgaaggttg gtgacttgtc cgtgtgccca gacaatgttg gttgtaacac ctacaccacc 1860 gctcttttga tcggtgaaaa gactgccact ttggttggag aagatttagg atactctggt 1920 gaggccttag acatgactgt tcctcagttc aagttgggca cttacgagaa gaccggtctt 1980 gctagattct aa 1992 <210> 3 <211> 663 <212> PRT <213> Unknown <220> <223> Komagataella phaffii <400> 3 Met Ala Ile Pro Glu Glu Phe Asp Ile Leu Val Leu Gly Gly Gly Ser 1 5 10 15 Ser Gly Ser Cys Ile Ala Gly Arg Leu Ala Asn Leu Asp His Ser Leu 20 25 30 Lys Val Gly Leu Ile Glu Ala Gly Glu Asn Asn Leu Asn Asn Pro Trp 35 40 45 Val Tyr Leu Pro Gly Ile Tyr Pro Arg Asn Met Lys Leu Asp Ser Lys 50 55 60 Thr Ala Ser Phe Tyr Thr Ser Asn Pro Ser Pro His Leu Asn Gly Arg 65 70 75 80 Arg Ala Ile Val Pro Cys Ala Asn Ile Leu Gly Gly Gly Ser Ser Ile 85 90 95 Asn Phe Met Met Tyr Thr Arg Gly Ser Ala Ser Asp Tyr Asp Asp Phe 100 105 110 Glu Ala Glu Gly Trp Lys Thr Lys Asp Leu Leu Pro Leu Met Lys Lys 115 120 125 Thr Glu Thr Tyr Gln Arg Ala Cys Asn Asn Pro Glu Ile His Gly Phe 130 135 140 Glu Gly Pro Ile Lys Val Ser Phe Gly Asn Tyr Thr Tyr Pro Val Cys 145 150 155 160 Gln Asp Phe Leu Arg Ala Thr Glu Ser Gln Gly Ile Pro Tyr Val Asp 165 170 175 Asp Leu Glu Asp Leu Val Thr Ala His Gly Ala Glu His Trp Leu Lys 180 185 190 Trp Ile Asn Arg Asp Thr Gly Arg Arg Ser Asp Ser Ala His Ala Phe 195 200 205 Val His Ser Thr Met Arg Asn His Asp Asn Leu Tyr Leu Ile Cys Asn 210 215 220 Thr Lys Val Asp Lys Ile Ile Val Glu Asp Gly Arg Ala Ala Ala Val 225 230 235 240 Arg Thr Val Pro Ser Lys Pro Leu Asn Ala Lys Lys Pro Thr His Lys 245 250 255 Val Tyr Arg Ala Arg Lys Gln Ile Val Leu Ser Cys Gly Thr Ile Ser 260 265 270 Ser Pro Leu Val Leu Gln Arg Ser Gly Phe Gly Asp Pro Ile Lys Leu 275 280 285 Arg Ala Ala Gly Val Lys Pro Leu Val Asn Leu Pro Gly Val Gly Arg 290 295 300 Asn Phe Gln Asp His Tyr Cys Phe Phe Ser Pro Tyr Arg Ile Lys Pro 305 310 315 320 Gln Tyr Glu Ser Phe Asp Asp Phe Val Arg Gly Asp Ala Asn Ile Gln 325 330 335 Lys Lys Val Phe Asp Gln Trp Tyr Ala Asn Gly Thr Gly Pro Leu Ala 340 345 350 Thr Asn Gly Ile Glu Ala Gly Val Lys Ile Arg Pro Thr Pro Glu Glu 355 360 365 Leu Ser Gln Met Asp Glu Ser Phe Gln Glu Gly Tyr Arg Glu Tyr Phe 370 375 380 Glu Asp Lys Pro Asp Lys Pro Val Met His Tyr Ser Ile Ile Ala Gly 385 390 395 400 Phe Phe Gly Asp His Thr Lys Ile Pro Pro Gly Lys Tyr Met Thr Met 405 410 415 Phe His Phe Leu Glu Tyr Pro Phe Ser Arg Gly Ser Ile His Ile Thr 420 425 430 Ser Pro Asp Pro Tyr Ala Thr Pro Asp Phe Asp Pro Gly Phe Met Asn 435 440 445 Asp Glu Arg Asp Met Ala Pro Met Val Trp Ser Tyr Lys Lys Ser Arg 450 455 460 Glu Thr Ala Arg Lys Met Asp His Phe Ala Gly Glu Val Thr Ser His 465 470 475 480 His Pro Leu Phe Pro Tyr Ser Ser Glu Ala Arg Ala Tyr Glu Met Asp 485 490 495 Leu Glu Thr Ser Asn Ala Tyr Gly Gly Pro Leu Asn Leu Thr Ala Gly 500 505 510 Leu Ala His Gly Ser Trp Thr Gln Pro Leu Lys Lys Pro Ala Gly Arg 515 520 525 Asn Glu Gly His Val Thr Ser Asn Gln Val Glu Leu His Pro Asp Ile 530 535 540 Glu Tyr Asp Glu Glu Asp Asp Lys Ala Ile Glu Asn Tyr Ile Arg Glu 545 550 555 560 His Thr Glu Thr Thr Trp His Cys Leu Gly Thr Cys Ser Ile Gly Pro 565 570 575 Arg Glu Gly Ser Lys Ile Val Lys Trp Gly Gly Val Leu Asp His Arg 580 585 590 Ser Asn Val Tyr Gly Val Lys Gly Leu Lys Val Gly Asp Leu Ser Val 595 600 605 Cys Pro Asp Asn Val Gly Cys Asn Thr Tyr Thr Thr Ala Leu Leu Ile 610 615 620 Gly Glu Lys Thr Ala Thr Leu Val Gly Glu Asp Leu Gly Tyr Thr Gly 625 630 635 640 Glu Ala Leu Asp Met Thr Val Pro Gln Phe Lys Leu Gly Thr Tyr Glu 645 650 655 Lys Thr Gly Leu Ala Arg Phe 660 <210> 4 <211> 1992 <212> DNA <213> Unknown <220> <223> Komagataella phaffii <400> 4 atggccattc ctgaagaatt cgatattctt gtcctgggtg gtggatccag tggatcctgt 60 attgccggaa gattggccaa cttggaccac tccttgaaag ttggtcttat cgaggctggt 120 gagaacaatc ttaacaaccc atgggtctac cttccaggta tttacccaag aaacatgaag 180 ttggactcca aaactgcttc tttctacacc tccaaccctt ctcctcattt gaatggtaga 240 agagctattg tcccatgtgc caacatcttg ggtggtggtt cttcgatcaa cttcatgatg 300 tacaccagag gttccgcttc tgattacgat gactttgaag ctgagggatg gaagaccaag 360 gatttgcttc ctttgatgaa gaagactgag acttaccaaa gagcttgcaa caaccctgaa 420 attcacggtt ttgaaggtcc aatcaaggtt tctttcggta actacactta cccagtttgt 480 caagacttct tgagagcaac tgaatcccaa ggtattccat acgttgacga cttggaagac 540 ttggtgactg ctcatggtgc tgaacactgg ctgaaatgga tcaacagaga cactggtcgt 600 cgttccgact ctgctcatgc cttcgttcat tctacgatga gaaaccacga caatctgtac 660 ttgatctgca acaccaaagt tgacaagatt attgttgaag acggaagagc tgctgctgtc 720 agaaccgttc caagtaaacc tttgaacgca aagaagccaa ctcacaaggt ttatcgtgct 780 agaaagcaaa tcgttttgtc ttgtggtacc atctcttctc ctctggttct gcaaagatcc 840 ggttttggtg acccaatcaa attgagagcc gctggtgtta agcctttggt caacttgcca 900 ggtgttggaa gaaacttcca agaccactac tgcttcttct ctccttacag aattaagccc 960 caatacgagt ctttcgatga cttcgtacgt ggtgacgcta acattcaaaa gaaggtattc 1020 gaccaatggt acgctaacgg tactggtcca ttggccacca acggtattga agccggtgtc 1080 aagattagac caactccaga agaattatct cagatggacg agtccttcca agagggttac 1140 agagagtact tcgaagacaa accagacaag ccagttatgc actattccat cattgctggt 1200 ttcttcggtg accacaccaa gattccacct ggaaagtaca tgaccatgtt ccacttcttg 1260 gagtacccat tctccagagg ttctatccac atcacctctc cagacccata cgcaactcca 1320 gactttgacc caggtttcat gaacgatgaa agagacatgg ctcctatggt ctggtcttac 1380 aagaagtcca gagagactgc cagaaaaatg gaccactttg ctggtgaggt tacttcccac 1440 caccctctgt tcccatactc atccgaggcc agagcttacg agatggattt ggagacctcc 1500 aacgcctacg gtggaccact gaacttgact gctggtcttg ctcacggttc ttggactcag 1560 cctttgaaga agcctgctgg aagaaacgaa ggacatgtta cttccaacca agtcgagctt 1620 catccagaca ttgagtacga tgaggaggat gataaggcca ttgagaacta cattcgtgag 1680 cacactgaga ccacatggca ctgtctggga acctgttcca ttggtccaag agagggttcc 1740 aagatcgtca aatggggtgg tgttttggat cacagatcta acgtttacgg agtcaagggc 1800 ctgaaggttg gtgacttgtc cgtctgtcca gacaatgttg gttgtaacac ctacaccacc 1860 gctcttttga tcggtgaaaa gactgccacc ttggttggtg aagacttagg atacacaggt 1920 gaggccttag acatgactgt acctcagttc aagttgggca cttacgagaa gactggtctt 1980 gctagattct ag 1992 <210> 5 <211> 1000 <212> DNA <213> Unknown <220> <223> Komagataella phaffii <400> 5 catgttggta ttgtgaaata gacgcagatc gggaacactg aaaaataaca gttattattc 60 gagatctaac atccaaagac gaaaggttga atgaaacctt tttgccatcc gacatccaca 120 ggtccattct cacacataag tgccaaacgc aacaggaggg gatacactag cagcagaccg 180 ttgcaaacgc aggacctcca ctcctcttct cctcaacacc cacttttgcc atcgaaaaac 240 cagcccagtt attgggcttg attggagctc gctcattcca attccttcta ttaggctact 300 aacaccatga ctttattagc ctgtctatcc tggcccccct ggcgaggttc atgtttgttt 360 atttccgaat gcaacaagct ccgcattaca cccgaacatc actccagatg agggctttct 420 gagtgtgggg tcaaatagtt tcatgttccc caaatggccc aaaactgaca gtttaaacgc 480 tgtcttggaa cctaatatga caaaagcgtg atctcatcca agatgaacta agtttggttc 540 gttgaaatgc taacggccag ttggtcaaaa agaaacttcc aaaagtcggc ataccgtttg 600 tcttgtttgg tattgattga cgaatgctca aaaataatct cattaatgct tagcgcagtc 660 tctctatcgc ttctgaaccc cggtgcacct gtgccgaaac gcaaatgggg aaacacccgc 720 tttttggatg attatgcatt gtctccacat tgtatgcttc caagattctg gtgggaatac 780 tgctgatagc ctaacgttca tgatcaaaat ttaactgttc taacccctac ttgacagcaa 840 tatataaaca gaaggaagct gccctgtctt aaaccttttt tttatcatca ttattagctt 900 actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 960 caacttgaga agatcaaaaa acaactaatt attcgaaacg 1000 <210> 6 <211> 1000 <212> DNA <213> Unknown <220> <223> Komagataella phaffii <400> 6 gcttaaagga ctccatttcc taaaatttca agcagtcctc tcaactaaat ttttttccat 60 tcctctgcac ccagccctct tcatcaaccg tccagccttc tcaaaagtcc aatgtaagta 120 gcctgcaaat tcaggttaca acccctcaat tttccatcca agggcgatcc ttacaaagtt 180 aatatcgaac agcagagact aagcgagtca tcatcaccac ccaacgatgg tgaaaaactt 240 taagcataga ttgatggagg gtgtatggca cttggcggct gcattagagt ttgaaactat 300 ggggtaatac atcacatccg gaactgatcc gactccgaga tcatatgcaa agcacgtgat 360 gtaccccgta aactgctcgg attatcgttg caattcatcg tcttaaacag tacaagaaac 420 tttattcatg ggtcattgga ctctgatgag gggcacattt ccccaatgat tttttgggaa 480 agaaagccgt aagaggacag ttaagcgaaa gagacaagac aacgaacagc aaaagtgaca 540 gctgtcagct acctagtgga cagttgggag tttccaattg gttggttttg aatttttacc 600 catgttgagt tgtccttgct tctccttgca aacaatgcaa gttgataaga catcaccttc 660 caagataggc tatttttgtc gcataaattt ttgtctcgga gtgaaaaccc cttttatgtg 720 aacagattac agaagcgtcc tacccttcac cggttgagat ggggagaaaa ttaagcgatg 780 aggagacgat tattggtata aaagaagcaa ccaaaatccc ttattgtcct tttctgatca 840 gcatcaaaga atattgtctt aaaacgggct tttaactaca ttgttcttac acattgcaaa 900 cctcttcctt ctatttcgga tcaactgtat tgactacatt gatctttttt aacgaagttt 960 acgacttact aaatccccac aaacaaatca actgagaaaa 1000 <210> 7 <211> 1000 <212> DNA <213> Unknown <220> <223> Komagataella pastoris <400> 7 atatcgtgaa atagacccaa atccggacac tgtgaaataa aacagttagt atgcgaaatc 60 taacatccaa gaacgagaaa ctaaataaga cattttgcca tccgacatct acaaaccaca 120 tcaccctcac acataagtgc caaaacgcag caggagggac acccagcagc agaagccgtg 180 tcgaacgcag gacctccact tctcttctcc tcaacatcca ctttcgttat tgaaaaccag 240 cctgcttaaa aaaactgatt ggagctcgct cattccagtc ccctttgtta ggctactaag 300 accacgactt tattagcctg tccattctgg ttcctggcga gacttattct tgtttgttta 360 ttttcgaatg caacaaagct ccgcattaca tccgaacatc actttagatg agggctttct 420 gagtgtgggg tcgaatagtt tcatgttccc ccaatggccc aaaactgaca ctttaaacgc 480 tgtcttcgaa cttaatatgg caaaagcgtg atctcatcca agacgaacta agtttggttc 540 gttgaaatgc taacggccag ttggtcaaaa agaaacttcc aaaagtcggc atatcgtttg 600 tcttgtttgg tattcataga cgaatgctca agaatattct cattaatgct tagcgcagtc 660 tctgtatcgc ttctggaccc cggtgcagtt gtgccgaaac gcaaatgggg aaacacccgc 720 ttttcggatg attatgcatt gtctccacat tgtatgcttc caagattctg gtgggaatac 780 tactgatagc ctaacgttca tgatcaatat caaactgttc taacccctac ttgaactgca 840 atatataaac aggaggaaac ttcccagtcg aaaaccttct ttcatcatca ttattagctt 900 actttcataa ttgtgactgg ttccaattga caagcttttg attctaacga cttttaacga 960 caatttgaga agatcaaaaa acaactaatt attcgaaacg 1000 <210> 8 <211> 1000 <212> DNA <213> Unknown <220> <223> Komagataella pastoris <400> 8 gcttgcacga ctcagttacc tgaaaatttc agcctgtcct ctttaataaa atttcacccg 60 ttcctctgca tgtccactca gctctattca tctatccttg agccttctcg agcgtctaat 120 gaacagcctg cgaattcagg ttacaacccc tcattttttc gtctcggtcg atctctacaa 180 agtcaacagc caactttgat gttaagcgag tcatcaccag ccagcgatag tgaaaaactt 240 taagcataga ttgatggtgg gtttatgtca cttggcggct gcattagagt ttgaaactat 300 ggggtaatgc atcacatccg gaactgatcc gactcggaga tcatatgcaa accacgtgat 360 gtaccccgta aactgctcgg attactgttc caattcatcg tcttaaacag tataagaaac 420 tttattcatg ggtcattgga ctctgatgag gggcacattt ccccattgat ttttgggaca 480 gtaagccata aaaggactgt taagcgaagc agacaagaca acgaacagct agaataacaa 540 ctatctaccg ccttgtggac cgttgggagt ttccaattgg ttggttttgg atttctgagc 600 ccatgttgtg ttgtccatgc ttctccttgc acacaatgca agttgataag atatcacctt 660 ccaagatagg ctatttttgt cgcataaatt ttggtctcag agtgaaaccc ccttttatgt 720 gaacggatta gagaagcctc ctacccttca ccggctgaga tggggagaaa ttaagcgatg 780 aggagacgat aattgctata aaagaagcaa ccaaaacccc ttattgtctc tttctgatca 840 gcatcaaaga atattgtctt aaaacgggct tttaactaca ttgttcttac acattgcaaa 900 cctcctcctt caatttcgga tcagctgtat tgactacatt gatctttttt aacgaagttc 960 acgacttact aaatccccat aaacaaacca actgagaaaa 1000 <210> 9 <211> 663 <212> PRT <213> Unknown <220> <223> Komagataella pastoris <400> 9 Met Ala Ile Pro Glu Glu Phe Asp Ile Leu Val Leu Gly Gly Gly Ser 1 5 10 15 Ser Gly Ser Cys Ile Ala Gly Arg Leu Ala Asn Leu Asp His Ser Leu 20 25 30 Lys Val Gly Leu Ile Glu Ala Gly Glu Asn Asn Leu Asn Asn Pro Trp 35 40 45 Val Tyr Leu Pro Gly Ile Tyr Pro Arg Asn Met Lys Leu Asp Ser Lys 50 55 60 Thr Ala Ser Phe Tyr Thr Ser Asn Pro Ser Pro His Leu Asn Gly Arg 65 70 75 80 Arg Ala Ile Val Pro Cys Ala Asn Val Leu Gly Gly Gly Ser Ser Ile 85 90 95 Asn Phe Met Met Tyr Thr Arg Gly Ser Ala Ser Asp Tyr Asp Asp Phe 100 105 110 Gln Ala Glu Gly Trp Lys Thr Lys Asp Leu Leu Pro Leu Met Lys Lys 115 120 125 Thr Glu Thr Tyr Gln Arg Ala Cys Asn Asn Pro Asp Ile His Gly Phe 130 135 140 Glu Gly Pro Ile Lys Val Ser Phe Gly Asn Tyr Thr Tyr Pro Val Cys 145 150 155 160 Gln Asp Phe Leu Arg Ala Ser Glu Ser Gln Gly Ile Pro Tyr Val Asp 165 170 175 Asp Leu Glu Asp Leu Val Thr Ala His Gly Ala Glu His Trp Leu Lys 180 185 190 Trp Ile Asn Arg Asp Thr Gly Arg Arg Ser Asp Ser Ala His Ala Phe 195 200 205 Val His Ser Thr Met Arg Asn His Asp Asn Leu Tyr Leu Ile Cys Asn 210 215 220 Thr Lys Val Asp Lys Ile Ile Val Glu Asp Gly Arg Ala Ala Ala Val 225 230 235 240 Arg Thr Val Pro Ser Lys Pro Leu Asn Pro Lys Lys Pro Ser His Lys 245 250 255 Ile Tyr Arg Ala Arg Lys Gln Ile Val Leu Ser Cys Gly Thr Ile Ser 260 265 270 Ser Pro Leu Val Leu Gln Arg Ser Gly Phe Gly Asp Pro Ile Lys Leu 275 280 285 Arg Ala Ala Gly Val Lys Pro Leu Val Asn Leu Pro Gly Val Gly Arg 290 295 300 Asn Phe Gln Asp His Tyr Cys Phe Phe Ser Pro Tyr Arg Ile Lys Pro 305 310 315 320 Gln Tyr Glu Ser Phe Asp Asp Phe Val Arg Gly Asp Ala Glu Ile Gln 325 330 335 Lys Arg Val Phe Asp Gln Trp Tyr Ala Asn Gly Thr Gly Pro Leu Ala 340 345 350 Thr Asn Gly Ile Glu Ala Gly Val Lys Ile Arg Pro Thr Pro Glu Glu 355 360 365 Leu Ser Gln Met Asp Glu Ser Phe Gln Glu Gly Tyr Arg Glu Tyr Phe 370 375 380 Glu Asp Lys Pro Asp Lys Pro Val Met His Tyr Ser Ile Ile Ala Gly 385 390 395 400 Phe Phe Gly Asp His Thr Lys Ile Pro Pro Gly Lys Tyr Met Thr Met 405 410 415 Phe His Phe Leu Glu Tyr Pro Phe Ser Arg Gly Ser Ile His Ile Thr 420 425 430 Ser Pro Asp Pro Tyr Ala Ala Pro Asp Phe Asp Pro Gly Phe Met Asn 435 440 445 Asp Glu Arg Asp Met Ala Pro Met Val Trp Ala Tyr Lys Lys Ser Arg 450 455 460 Glu Thr Ala Arg Arg Met Asp His Phe Ala Gly Glu Val Thr Ser His 465 470 475 480 His Pro Leu Phe Pro Tyr Ser Ser Glu Ala Arg Ala Leu Glu Met Asp 485 490 495 Leu Glu Thr Ser Asn Ala Tyr Gly Gly Pro Leu Asn Leu Ser Ala Gly 500 505 510 Leu Ala His Gly Ser Trp Thr Gln Pro Leu Lys Lys Pro Thr Ala Lys 515 520 525 Asn Glu Gly His Val Thr Ser Asn Gln Val Glu Leu His Pro Asp Ile 530 535 540 Glu Tyr Asp Glu Glu Asp Asp Lys Ala Ile Glu Asn Tyr Ile Arg Glu 545 550 555 560 His Thr Glu Thr Thr Trp His Cys Leu Gly Thr Cys Ser Ile Gly Pro 565 570 575 Arg Glu Gly Ser Lys Ile Val Lys Trp Gly Gly Val Leu Asp His Arg 580 585 590 Ser Asn Val Tyr Gly Val Lys Gly Leu Lys Val Gly Asp Leu Ser Val 595 600 605 Cys Pro Asp Asn Val Gly Cys Asn Thr Tyr Thr Thr Ala Leu Leu Ile 610 615 620 Gly Glu Lys Thr Ala Thr Leu Val Gly Glu Asp Leu Gly Tyr Thr Gly 625 630 635 640 Glu Ala Leu Asp Met Thr Val Pro Gln Phe Lys Leu Gly Thr Tyr Glu 645 650 655 Lys Thr Gly Leu Ala Arg Phe 660 <210> 10 <211> 1992 <212> DNA <213> Unknown <220> <223> Komagataella pastoris <400> 10 atggctatcc ctgaagagtt tgatatcctt gttttaggtg gtggatccag tggatcctgt 60 attgccggaa gattggccaa cttggaccac tccttgaaag ttggtcttat cgaggcaggt 120 gagaacaacc tcaacaaccc atgggtttac cttccaggta tttacccaag aaacatgaag 180 ttggactcca agactgcatc cttctacact tctaaccctt ctcctcactt gaacggtaga 240 agagctattg ttccatgtgc taacgtcttg ggtggtggtt cttccattaa cttcatgatg 300 tacaccagag gttctgcttc tgattatgac gacttccaag ccgagggctg gaaaaccaag 360 gacttgcttc cattgatgaa aaagaccgag acctaccaaa gagcttgcaa caaccctgac 420 attcacgggt tcgaaggtcc aatcaaggtt tctttcggta actacaccta cccagtttgc 480 caggacttct tgagagcttc tgaatcccaa ggtattccat acgttgacga cttggaagac 540 ttggttactg ctcacggtgc tgaacactgg ctgaaatgga tcaacagaga cactggtcgt 600 cgttccgact ccgctcatgc atttgtccac tctactatga gaaaccacga caacttgtac 660 ttgatttgta acacaaaggt tgacaagatt attgtcgaag acggaagagc tgctgctgtt 720 agaactgttc caagcaagcc tttgaaccca aagaagccaa gtcacaagat ctaccgtgct 780 agaaagcaaa tcgttttgtc ttgtggtacc atctcatctc ctttggttct gcaaagatcc 840 ggtttcggtg acccaatcaa gttgagagcc gctggtgtta agcctttggt caacttgcct 900 ggtgtcggaa gaaacttcca agaccactac tgtttcttca gtccttacag aatcaagcct 960 cagtacgaat ctttcgatga cttcgtgcgt ggtgatgctg agatccaaaa gagagttttc 1020 gaccaatggt acgccaatgg tactggtcct cttgccacta acggtatcga agccggtgtc 1080 aagattagac caacaccaga ggaactgtct caaatggacg aatctttcca agagggttac 1140 agagaatact ttgaggacaa gccagacaag ccagttatgc actactccat tattgctggt 1200 ttcttcggtg accacaccaa gattcctcct ggaaagtaca tgaccatgtt ccactttttg 1260 gaatacccat tctccagagg ttccattcac attacctctc cagatccata cgcagctcca 1320 gacttcgacc caggtttcat gaacgatgaa agagacatgg ctcctatggt ctgggcctac 1380 aagaagtcta gagagacagc tagaagaatg gaccactttg ccggtgaggt tacttctcac 1440 cacccattgt tcccatactc atccgaggcc agagctttgg agatggattt ggagacctcc 1500 aatgcctacg gtggaccttt gaacttgtct gctggtcttg cccacggttc ttggactcaa 1560 cctttgaaga agccaactgc aaagaacgaa ggccatgtta cctccaacca agtcgagctt 1620 catccagaca tcgagtacga cgaggaggac gacaaggcca ttgaaaacta catccgtgag 1680 cacactgaga ccacatggca ctgtctggga acctgttcca tcggtccaag agagggttcc 1740 aagatcgtca aatggggtgg tgttttggac cacagatcca acgtttacgg agtcaagggc 1800 ctgaaggttg gtgacttgtc tgtctgtcca gacaatgttg gttgtaacac ctacaccacc 1860 gctcttttga tcggtgagaa gactgccact ttggttggag aagacttagg atacaccggt 1920 gaagccttag acatgactgt tcctcagttc aagttgggca cttacgagaa gaccggtctt 1980 gctagattct aa 1992 <210> 11 <211> 663 <212> PRT <213> Unknown <220> <223> Komagataella pastoris <400> 11 Met Ala Ile Pro Glu Glu Phe Asp Ile Leu Val Leu Gly Gly Gly Ser 1 5 10 15 Ser Gly Ser Cys Ile Ala Gly Arg Leu Ala Asn Leu Asp His Ser Leu 20 25 30 Lys Val Gly Leu Ile Glu Ala Gly Glu Asn Asn Leu Asn Asn Pro Trp 35 40 45 Val Tyr Leu Pro Gly Ile Tyr Pro Arg Asn Met Lys Leu Asp Ser Lys 50 55 60 Thr Ala Ser Phe Tyr Thr Ser Asn Pro Ser Pro His Leu Asn Gly Arg 65 70 75 80 Arg Ala Ile Val Pro Cys Ala Asn Ile Leu Gly Gly Gly Ser Ser Ile 85 90 95 Asn Phe Met Met Tyr Thr Arg Gly Ser Ala Ser Asp Tyr Asp Asp Phe 100 105 110 Glu Ala Glu Gly Trp Lys Thr Lys Asp Leu Leu Pro Leu Met Lys Lys 115 120 125 Thr Glu Thr Tyr Gln Arg Ala Cys Asn Asn Pro Glu Ile His Gly Phe 130 135 140 Glu Gly Pro Ile Lys Val Ser Phe Gly Asn Tyr Thr Tyr Pro Val Cys 145 150 155 160 Gln Asp Phe Leu Arg Ala Thr Glu Ser Gln Gly Ile Pro Tyr Val Asp 165 170 175 Asp Leu Glu Asp Leu Glu Thr Ala His Gly Ala Glu His Trp Leu Lys 180 185 190 Trp Ile Asn Arg Asp Thr Gly Arg Arg Ser Asp Ser Ala His Ala Phe 195 200 205 Val His Ser Thr Met Arg Asn His Asp Asn Leu Tyr Leu Ile Cys Asn 210 215 220 Thr Lys Val Asp Lys Ile Ile Val Glu Asp Gly Arg Ala Ala Gly Val 225 230 235 240 Arg Thr Val Pro Ser Lys Pro Leu Asn Ala Lys Lys Pro Thr His Lys 245 250 255 Val Tyr Arg Ala Arg Lys Gln Ile Val Leu Ser Cys Gly Thr Ile Ser 260 265 270 Ser Pro Leu Val Leu Gln Arg Ser Gly Phe Gly Asp Pro Ile Lys Leu 275 280 285 Arg Ala Ala Gly Val Lys Pro Leu Val Asn Leu Pro Gly Val Gly Arg 290 295 300 Asn Phe Gln Asp His Tyr Cys Phe Phe Ser Pro Tyr Arg Ile Lys Pro 305 310 315 320 Gln Tyr Glu Ser Phe Asp Asp Phe Val Arg Gly Asp Ala Asn Ile Gln 325 330 335 Lys Lys Val Phe Asp Gln Trp Tyr Ala Asn Gly Thr Gly Pro Leu Ala 340 345 350 Thr Asn Gly Ile Glu Ala Gly Val Lys Ile Arg Pro Thr Pro Glu Glu 355 360 365 Leu Ser Gln Met Asp Glu Ser Phe Gln Glu Gly Tyr Arg Glu Tyr Phe 370 375 380 Glu Asp Lys Pro Asp Lys Pro Val Met His Tyr Ser Ile Ile Ala Gly 385 390 395 400 Phe Phe Gly Asp His Thr Lys Ile Pro Pro Gly Lys Tyr Met Thr Met 405 410 415 Phe His Phe Leu Glu Tyr Pro Phe Ser Arg Gly Ser Ile His Ile Thr 420 425 430 Ser Pro Asp Pro Tyr Ala Thr Pro Asp Phe Asp Pro Gly Phe Met Asn 435 440 445 Asp Glu Arg Asp Met Ala Pro Met Val Trp Ser Tyr Lys Lys Ser Arg 450 455 460 Glu Thr Ala Arg Lys Met Asp His Phe Ala Gly Glu Val Thr Ser His 465 470 475 480 His Pro Leu Phe Pro Tyr Ser Ser Glu Ala Arg Ala Tyr Glu Met Asp 485 490 495 Leu Glu Thr Ser Asn Ala Tyr Gly Gly Pro Leu Asn Leu Thr Ala Gly 500 505 510 Leu Ala His Gly Ser Trp Thr Gln Pro Leu Lys Lys Pro Ala Ala Arg 515 520 525 Asn Glu Gly His Val Thr Ser Asn Gln Val Glu Leu His Pro Asp Ile 530 535 540 Glu Tyr Asp Glu Glu Asp Asp Lys Ala Ile Glu Asn Tyr Ile Arg Glu 545 550 555 560 His Thr Glu Thr Thr Trp His Cys Leu Gly Thr Cys Ser Ile Gly Pro 565 570 575 Arg Glu Gly Ser Lys Ile Val Lys Trp Gly Gly Val Leu Asp His Arg 580 585 590 Ser Asn Val Tyr Gly Val Lys Gly Leu Lys Val Gly Asp Leu Ser Val 595 600 605 Cys Pro Asp Asn Val Gly Cys Asn Thr Tyr Thr Thr Ala Leu Leu Ile 610 615 620 Gly Glu Lys Thr Ala Thr Leu Val Gly Glu Asp Leu Gly Tyr Thr Gly 625 630 635 640 Asp Ala Leu Asp Met Thr Val Pro Gln Phe Lys Leu Gly Thr Tyr Glu 645 650 655 Lys Thr Gly Leu Ala Arg Phe 660 <210> 12 <211> 1992 <212> DNA <213> Unknown <220> <223> Komagataella pastoris <400> 12 atggctattc ctgaagaatt cgatattctt gtcctaggtg gtggatccag tggatcctgt 60 attgccggaa gattggccaa cttggaccac tctttgaaag ttggtcttat cgaggccggt 120 gagaacaatc ttaacaaccc ttgggtctac cttccaggta tttacccaag aaacatgaaa 180 ttggactcca agaccgcttc tttctacacc tccaacccat ctcctcattt gaatggtaga 240 agagctattg tcccatgtgc taacatcttg ggtggtggtt cttccatcaa cttcatgatg 300 tacaccagag gttccgcttc tgattacgat gacttcgaag ctgagggctg gaaaaccaag 360 gatttgcttc ctttgatgaa gaagactgag acctaccaaa gagcttgcaa caaccctgag 420 atccacggtt tcgaaggtcc aatcaaggtt tctttcggta actacactta cccggtttgt 480 caagacttct tgagagcaac tgaatcccaa ggtattccat acgttgacga cttggaagac 540 ttggagactg ctcatggtgc cgaacactgg ttgaaatgga tcaacagaga cactggtcgt 600 cgttccgact ctgctcatgc tttcgtccat tctactatga gaaaccatga taacttgtac 660 ttgatctgca acaccaaggt tgacaagatt attgttgaag acggaagagc tgctggtgtc 720 agaaccgtcc caagtaaacc tttgaacgca aagaagccaa ctcacaaggt ttaccgtgct 780 agaaagcaga tcgttttgtc ttgtggtacc atttcttccc ctctggtttt gcaaagatcc 840 ggttttggtg atccaatcaa attgagagcc gctggtgtta agcctttggt caacttgcca 900 ggtgttggaa ggaacttcca ggaccattac tgcttcttct ctccttacag aatcaagccc 960 caatacgagt cttttgatga cttcgtccgt ggtgacgcta acatccaaaa gaaggtattc 1020 gaccaatggt acgctaacgg tactggtcca ttggccacca atggtattga agccggtgtc 1080 aagatcagac caactccaga ggaattatct caaatggacg agtcgttcca ggagggttac 1140 agagagtact ttgaagacaa accagacaaa ccagttatgc actattccat cattgctggt 1200 ttcttcggtg accacaccaa gattccgcct ggaaagtaca tgaccatgtt ccacttcttg 1260 gagtacccat tctccagagg ttctattcat atcacctctc cagacccata cgcaactcca 1320 gactttgacc caggtttcat gaatgatgaa agagacatgg ctcctatggt ttggtcttac 1380 aagaagtcca gagagactgc cagaaagatg gatcactttg ctggtgaggt tacttcccac 1440 caccctctgt tcccatactc atccgaggcc agagcttacg agatggactt ggagacctcc 1500 aacgcctacg gtggaccact gaacttgact gctggtcttg ctcacggttc ttggactcag 1560 cctttgaaga agcctgccgc aagaaacgaa ggacatgtta cctctaacca agttgagctt 1620 catccagaca ttgaatacga tgaggaggat gacaaggcca ttgagaacta catccgtgag 1680 cacactgaga ccacatggca ctgtctcgga acctgttcca tcggtccaag agaaggttcc 1740 aagatagtca aatggggtgg tgttttggac cacagatcca acgtttacgg agtcaagggc 1800 ctgaaggttg gtgacttgtc tgtctgccca gacaatgttg gttgtaacac ctacaccacc 1860 gctcttttaa tcggtgaaaa gactgcaacc ttggtgggtg aagacttagg atacacaggt 1920 gatgccttag acatgactgt tcctcagttc aagttgggca cttacgagaa gactggtctt 1980 gctagattct ag 1992 <210> 13 <211> 664 <212> PRT <213> Unknown <220> <223> Ogataea methanolica <400> 13 Met Ala Ile Pro Asp Glu Phe Asp Ile Ile Val Val Gly Gly Gly Ser 1 5 10 15 Thr Gly Cys Ala Leu Ala Gly Arg Leu Gly Asn Leu Asp Glu Asn Val 20 25 30 Thr Val Ala Leu Ile Glu Gly Gly Glu Asn Asn Ile Asn Asn Pro Trp 35 40 45 Val Tyr Leu Pro Gly Val Tyr Pro Arg Asn Met Arg Leu Asp Ser Lys 50 55 60 Thr Ala Thr Phe Tyr Ser Ser Arg Pro Ser Pro His Leu Asn Gly Arg 65 70 75 80 Arg Ala Ile Val Pro Cys Ala Asn Ile Leu Gly Gly Gly Ser Ser Ile 85 90 95 Asn Phe Leu Met Tyr Thr Arg Ala Ser Ala Ser Asp Tyr Asp Asp Trp 100 105 110 Glu Ser Glu Gly Trp Thr Thr Asp Glu Leu Leu Pro Leu Met Lys Lys 115 120 125 Ile Glu Thr Tyr Gln Arg Pro Cys Asn Asn Arg Glu Leu His Gly Phe 130 135 140 Asp Gly Pro Ile Lys Val Ser Phe Gly Asn Tyr Thr Tyr Pro Asn Gly 145 150 155 160 Gln Asp Phe Ile Arg Ala Ala Glu Ser Gln Gly Ile Pro Phe Val Asp 165 170 175 Asp Ala Glu Asp Leu Lys Cys Ser His Gly Ala Glu His Trp Leu Lys 180 185 190 Trp Ile Asn Arg Asp Leu Gly Arg Arg Ser Asp Ser Ala His Ala Tyr 195 200 205 Ile His Pro Thr Met Arg Asn Lys Gln Asn Leu Phe Leu Ile Thr Ser 210 215 220 Thr Lys Cys Glu Lys Ile Ile Ile Glu Asn Gly Val Ala Thr Gly Val 225 230 235 240 Lys Thr Val Pro Met Lys Pro Thr Gly Ser Pro Lys Thr Gln Val Ala 245 250 255 Arg Thr Phe Lys Ala Arg Lys Gln Ile Ile Val Ser Cys Gly Thr Ile 260 265 270 Ser Ser Pro Leu Val Leu Gln Arg Ser Gly Ile Gly Ser Ala His Lys 275 280 285 Leu Arg Gln Val Gly Ile Lys Pro Ile Val Asp Leu Pro Gly Val Gly 290 295 300 Met Asn Phe Gln Asp His Tyr Cys Phe Phe Thr Pro Tyr His Val Lys 305 310 315 320 Pro Asp Thr Pro Ser Phe Asp Asp Phe Val Arg Gly Asp Lys Ala Val 325 330 335 Gln Lys Ser Ala Phe Asp Gln Trp Tyr Ala Asn Lys Asp Gly Pro Leu 340 345 350 Thr Thr Asn Gly Ile Glu Ala Gly Val Lys Ile Arg Pro Thr Glu Glu 355 360 365 Glu Leu Ala Thr Ala Asp Asp Glu Phe Arg Ala Ala Tyr Asp Asp Tyr 370 375 380 Phe Gly Asn Lys Pro Asp Lys Pro Leu Met His Tyr Ser Leu Ile Ser 385 390 395 400 Gly Phe Phe Gly Asp His Thr Lys Ile Pro Asn Gly Lys Tyr Met Cys 405 410 415 Met Phe His Phe Leu Glu Tyr Pro Phe Ser Arg Gly Phe Val His Val 420 425 430 Val Ser Pro Asn Pro Tyr Asp Ala Pro Asp Phe Asp Pro Gly Phe Met 435 440 445 Asn Asp Pro Arg Asp Met Trp Pro Met Val Trp Ser Tyr Lys Lys Ser 450 455 460 Arg Glu Thr Ala Arg Arg Met Asp Cys Phe Ala Gly Glu Val Thr Ser 465 470 475 480 His His Pro His Tyr Pro Tyr Asp Ser Pro Ala Arg Ala Ala Asp Met 485 490 495 Asp Leu Glu Thr Thr Lys Ala Tyr Ala Gly Pro Asp His Phe Thr Ala 500 505 510 Asn Leu Tyr His Gly Ser Trp Thr Val Pro Ile Glu Lys Pro Thr Pro 515 520 525 Lys Asn Ala Ala His Val Thr Ser Asn Gln Val Glu Lys His Arg Asp 530 535 540 Ile Glu Tyr Thr Lys Glu Asp Asp Ala Ala Ile Glu Asp Tyr Ile Arg 545 550 555 560 Glu His Thr Glu Thr Thr Trp His Cys Leu Gly Thr Cys Ser Met Ala 565 570 575 Pro Arg Glu Gly Ser Lys Val Val Pro Thr Gly Gly Val Val Asp Ser 580 585 590 Arg Leu Asn Val Tyr Gly Val Glu Lys Leu Lys Val Ala Asp Leu Ser 595 600 605 Ile Cys Pro Asp Asn Val Gly Cys Asn Thr Tyr Ser Thr Ala Leu Leu 610 615 620 Ile Gly Glu Lys Ala Ser Thr Leu Val Ala Glu Asp Leu Gly Tyr Ser 625 630 635 640 Gly Asp Ala Leu Lys Met Thr Val Pro Asn Phe Lys Leu Gly Thr Tyr 645 650 655 Glu Glu Ala Gly Leu Ala Arg Phe 660 <210> 14 <211> 1995 <212> DNA <213> Unknown <220> <223> Ogataea methanolica <400> 14 atggctattc cagatgaatt tgatattatt gttgtcggtg gtggttccac cggttgtgct 60 cttgctggta gattaggtaa cttggacgaa aacgtcacag ttgctttaat cgaaggtggt 120 gaaaacaaca tcaacaaccc atgggtttac ttaccaggtg tttatccaag aaacatgaga 180 ttagactcaa agactgctac tttttactct tcaagaccat caccacactt gaacggtaga 240 agagctattg ttccatgtgc taacatcttg ggtggtggtt cttccatcaa cttcttgatg 300 tacaccagag cctctgcctc cgattacgat gattgggaat ctgaaggttg gactaccgat 360 gaattattac cactaatgaa gaagattgaa acttatcaaa gaccatgtaa caacagagaa 420 ttgcacggtt tcgatggtcc aattaaggtt tcatttggta actatactta tccaaacggt 480 caagatttca ttagagctgc cgaatctcaa ggtattccat ttgttgatga tgctgaagat 540 ttgaaatgtt cccacggtgc tgagcactgg ttgaagtgga tcaacagaga cttaggtaga 600 agatccgatt ctgctcatgc ttacattcac ccaaccatga gaaacaagca aaacttgttc 660 ttgattactt ccaccaagtg tgaaaagatt atcattgaaa acggtgttgc tactggtgtt 720 aagactgttc caatgaagcc aactggttct ccaaagaccc aagttgctag aactttcaag 780 gctagaaagc aaattattgt ttcttgtggt actatctcat caccattagt tttgcaaaga 840 tctggtatcg gttccgctca caagttgaga caagttggta ttaaaccaat tgttgactta 900 ccaggtgttg gtatgaactt ccaagatcac tactgtttct tcactccata ccatgtcaag 960 ccagatactc catcattcga tgactttgtt agaggtgata aagctgttca aaaatctgct 1020 ttcgaccaat ggtatgctaa caaggatggt ccattaacca ctaatggtat tgaggcaggt 1080 gttaagatta gaccaactga agaagaatta gccactgctg atgacgaatt cagagctgct 1140 tatgatgact actttggtaa caagccagat aagccattaa tgcactactc tctaatttct 1200 ggtttctttg gtgaccacac caagattcca aacggtaagt acatgtgcat gttccacttc 1260 ttggaatatc cattctccag aggtttcgtt cacgttgttt ctccaaaccc atacgatgct 1320 cctgactttg atccaggttt catgaacgat ccaagagata tgtggccaat ggtttggtct 1380 tacaagaagt ccagagaaac tgccagaaga atggactgtt ttgccggtga agttacttct 1440 caccacccac actacccata cgactcacca gccagagctg ctgacatgga cttggaaact 1500 actaaagctt atgctggtcc agaccacttt actgctaact tgtaccacgg ttcatggact 1560 gttccaattg aaaagccaac tccaaagaac gctgctcacg ttacttctaa ccaagttgaa 1620 aaacatcgtg acatcgaata caccaaggag gatgatgctg ctatcgaaga ttacatcaga 1680 gaacacactg aaaccacatg gcattgtctt ggtacttgtt caatggctcc aagagaaggt 1740 tctaaggttg tcccaactgg tggtgttgtt gactccagat taaacgttta cggtgttgaa 1800 aagttgaagg ttgctgattt atcaatttgc ccagataatg ttggttgtaa cacttactct 1860 actgctttgt taatcggtga aaaggcttct accttagttg ctgaagactt gggctactct 1920 ggtgatgctt tgaagatgac tgttccaaac ttcaaattgg gtacttatga agaagctggt 1980 ctagctagat tctag 1995 <210> 15 <211> 663 <212> PRT <213> Unknown <220> <223> Ogataea methanolica <400> 15 Met Ala Ile Pro Glu Glu Phe Asp Ile Ile Val Val Gly Gly Gly Ser 1 5 10 15 Ala Gly Cys Pro Thr Ala Gly Arg Leu Ala Asn Leu Asp Pro Asn Leu 20 25 30 Thr Val Ala Leu Ile Glu Ala Gly Glu Asn Asn Ile Asn Asn Pro Trp 35 40 45 Val Tyr Leu Pro Gly Val Tyr Pro Arg Asn Met Arg Leu Asp Ser Lys 50 55 60 Thr Ala Thr Phe Tyr Ser Ser Arg Pro Ser Pro His Leu Asn Gly Arg 65 70 75 80 Arg Ala Ile Val Pro Cys Ala Asn Ile Leu Gly Gly Gly Ser Ser Ile 85 90 95 Asn Phe Met Met Tyr Thr Arg Gly Ser Ala Ser Asp Tyr Asp Asp Trp 100 105 110 Glu Ser Glu Gly Trp Thr Thr Asp Glu Leu Leu Pro Leu Met Lys Arg 115 120 125 Leu Glu Thr Tyr Gln Arg Pro Cys Asn Asn Pro Asp Leu His Gly Phe 130 135 140 Asp Gly Pro Ile Lys Val Ser Phe Gly Asn Tyr Thr Tyr Pro Asn Cys 145 150 155 160 Gln Asp Phe Leu Arg Ala Ala Glu Ser Gln Gly Ile Pro Phe Val Asp 165 170 175 Asp Ala Glu Asp Leu Lys Thr Ser His Ala Ser Gln His Trp Leu Lys 180 185 190 Trp Ile Asn Arg Asp Leu Gly Arg Arg Ser Asp Ala Ala His Ala Tyr 195 200 205 Ile His Pro Thr Met Arg Asn Lys Ser Asn Leu Tyr Leu Ile Thr Ser 210 215 220 Thr Lys Ala Asp Lys Val Ile Ile Glu Asp Gly Val Ala Ala Gly Ile 225 230 235 240 Gln Val Val Pro Ser Lys Pro Leu Asn Pro Glu Lys Pro Ala Ala Lys 245 250 255 Ile Tyr Lys Ala Arg Lys Gln Ile Ile Leu Ser Cys Gly Thr Ile Ser 260 265 270 Thr Pro Leu Val Leu Gln Arg Ser Gly Ile Gly Ser Ala His Lys Leu 275 280 285 Arg Gln Ala Gly Ile Lys Pro Ile Val Asp Leu Pro Gly Val Gly Met 290 295 300 Asn Phe Gln Asp His Tyr Cys Phe Phe Thr Pro Tyr His Val Lys Pro 305 310 315 320 Asp Thr Pro Ser Phe Asp Asp Phe Ala Arg Gly Asp Lys Ala Val Gln 325 330 335 Lys Ser Ala Phe Asp Gln Trp Tyr Ala Asn Lys Asp Gly Pro Leu Thr 340 345 350 Thr Asn Gly Ile Glu Ala Gly Val Lys Ile Arg Pro Thr Ala Glu Glu 355 360 365 Leu Ala Thr Ala Asp Glu Asp Phe Gln Leu Gly Tyr Ala Ser Tyr Phe 370 375 380 Glu Asn Lys Pro Asp Lys Pro Leu Met His Tyr Ser Leu Ile Ser Gly 385 390 395 400 Phe Phe Gly Asp His Thr Lys Ile Pro Asn Gly Lys Tyr Met Thr Met 405 410 415 Phe His Phe Leu Glu Tyr Pro Phe Ser Arg Gly Phe Val His Val Val 420 425 430 Ser Pro Ser Pro Tyr Asp Ala Pro Asp Phe Asp Pro Gly Phe Met Asn 435 440 445 Asp Pro Lys Asp Met Trp Pro Met Val Trp Ala Tyr Lys Met Ser Arg 450 455 460 Glu Thr Ala Arg Arg Met Glu Cys Phe Ala Gly Glu Val Thr Ser His 465 470 475 480 His Pro Lys Tyr Pro Tyr Asp Ser Pro Ala Arg Ala Lys Asp Leu Asp 485 490 495 Leu Glu Thr Cys Lys Ala Tyr Ala Gly Pro Asp His Phe Thr Ala Asn 500 505 510 Leu Tyr His Gly Ser Trp Thr Ile Pro Leu Glu Lys Pro Thr Pro Lys 515 520 525 Asn Thr Ser His Val Thr Ser Asn Gln Val Glu Leu His Ala Gln Leu 530 535 540 Glu Tyr Ser Lys Glu Asp Asp Ile Ala Ile Glu Asn Tyr Ile Lys Glu 545 550 555 560 His Val Glu Thr Thr Trp His Cys Leu Gly Thr Cys Ser Met Ala Pro 565 570 575 Arg Glu Gly Ser Ser Ile Val Pro Thr Gly Gly Val Val Asp Glu Arg 580 585 590 Leu Asn Val Tyr Asp Val Ala His Leu Lys Cys Ala Asp Leu Ser Ile 595 600 605 Cys Pro Asp Asn Val Gly Cys Asn Thr Tyr Ser Thr Ala Leu Leu Val 610 615 620 Gly Glu Lys Ala Ser Met Ile Val Ala Glu Asp Leu Gly Tyr Ser Gly 625 630 635 640 Ala Glu Leu Asp Met Thr Ile Pro Gly Phe Lys Leu Gly Thr Tyr Glu 645 650 655 Ser Thr Gly Leu Gly Arg Phe 660 <210> 16 <211> 1992 <212> DNA <213> Unknown <220> <223> Ogataea methanolica <400> 16 atggctattc ctgaagaatt cgatatcatt gttgtcggtg gtggttctgc cggctgtcct 60 actgctggta gattggctaa cttagaccca aatttaactg ttgctttaat cgaagctggt 120 gaaaacaaca ttaacaaccc atgggtctac ttaccaggcg tttacccaag aaacatgaga 180 ttagactcca aaactgcaac tttctactct tctagacctt ccccacattt aaatggtaga 240 agagctattg ttccatgtgc taatatctta ggtggtggtt cttcaattaa cttcatgatg 300 tacactagag gttcagcttc tgattatgat gactgggaat ccgaaggttg gactaccgat 360 gaattattgc cattgatgaa aagattagaa acttatcaaa gaccatgtaa caaccctgat 420 ttgcacggtt tcgacggccc tatcaaggtc tccttcggta actacactta tcctaactgt 480 caagatttct taagagccgc tgaatctcaa ggtattccat ttgttgatga tgctgaagat 540 ttaaagactt ctcatgcttc ccaacactgg ctgaagtgga ttaacagaga cctgggtaga 600 agatctgatg ctgcgcatgc ttacattcac ccaactatga gaaacaagtc aaacttatac 660 ttgatcactt ccactaaggc tgataaagtt ataattgaag atggagttgc agctggtatt 720 caagttgttc cttccaaacc attgaaccca gaaaagccgg ctgccaagat ctacaaggct 780 agaaagcaaa tcattctatc ctgtggtaca atttctaccc cgttggtcct acaaagatct 840 ggtattggct cagctcataa attaagacag gcaggcataa aaccgatcgt tgacttgcca 900 ggagttggta tgaacttcca agatcactac tgctttttca ccccatacca tgtcaagcca 960 gatactcctt cttttgatga ctttgccaga ggtgataagg ctgttcaaaa atcagctttt 1020 gatcaatggt atgctaacaa agatggtcct ttaaccacta acggtattga agctggtgtt 1080 aagattagac caactgctga agaactggct actgctgatg aagatttcca actaggctac 1140 gcttcttact ttgaaaacaa gccagataaa ccattgatgc attactcttt aatctctggt 1200 ttctttggtg atcacactaa gattccaaac ggtaaataca tgaccatgtt ccatttctta 1260 gaatacccat tctccagggg ttttgttcac gttgtttcgc caagcccata cgatgctcca 1320 gactttgacc caggtttcat gaacgaccca aaggacatgt ggccaatggt ttgggcttat 1380 aaaatgtcaa gagaaactgc tagaagaatg gaatgctttg ctggtgaagt tacttcccac 1440 catcctaaat atccatacga ttcacctgcc agagctaagg acttggactt ggaaacttgt 1500 aaagcttacg cgggtccaga tcactttact gcaaacttgt accacggttc gtggaccatt 1560 ccattggaga agccaactcc caagaacact tctcacgtta cttcgaatca agttgaatta 1620 catgctcaat tagaatattc taaagaagat gacatcgcca tcgaaaacta tatcaaggaa 1680 cacgttgaaa ctacctggca ttgtcttggt acttgttcaa tggctccaag agaaggctca 1740 tcaattgtcc caacaggtgg tgttgttgat gaaagactaa acgtttatga tgttgctcac 1800 ttaaaatgtg ctgatttatc tatctgtcca gataatgtgg gttgtaacac ttactctact 1860 gcgttactgg ttggtgaaaa ggcttctatg attgttgctg aagatttagg ttactctgga 1920 gctgaattgg atatgaccat tcctggtttc aagttaggta cttacgaatc tactggatta 1980 ggtagattct aa 1992 <210> 17 <211> 1000 <212> DNA <213> Unknown <220> <223> Ogataea methanolica <400> 17 gacaaagttt tgttaaatga ctatcgaaca agccatgaaa tagcacattt ctgccagtca 60 cttttaacac tttcctgctt gctggttgac tctcctcata caaacaccca aaagggaaac 120 tttcagtgtg gggacacttg acatctcaca tgcaccccag attaatttcc ccagacgatg 180 cggagacaag acaaaacaac cctttgtcct gctcttttct ttctcacacc gcgtgggtgt 240 gtgcgcaggc aggcaggcag gcagcgggct gcctgccatc tctaatcgct gctcctcccc 300 cctggcttca aataacagcc tgctgctatc tgtgaccaga ttgggacacc cccctcccct 360 ccgaatgatc catcaccttt tgtcgtactc cgacaatgat ccttccctgt catcttctgg 420 caatcagctc cttcaataat taaatcaaat aagcataaat agtaaaatcg catacaaacg 480 tcatgaaaag ttttatctct atggccaacg gatagtctat ctgcttaatt ccatccactt 540 tgggaaccgt tctctcttta ccccagattc tcaaagctaa tatctgcccc ttgtctattg 600 tcctttctcc gtgtacaagc ggagcttttg cctcccatcc tcttgctttg tttcggttat 660 ttttttttct tttgaaactc ttggtcaaat caaatcaaac aaaaccaaac cttctattcc 720 atcagatcaa ccttgttcaa cattctataa atcgatataa atataacctt atccctccct 780 tgttttttac caattaatca atcttcaaat ttcaaatatt ttctacttgc tttattactc 840 agtattaaca tttgtttaaa ccaactataa cttttaactg gctttagaag ttttatttaa 900 catcagtttc aatttacatc tttatttatt aacgaaatct ttacgaatta actcaatcaa 960 aacttttacg aaaaaaaaat cttactatta atttctcaaa 1000 <210> 18 <211> 1000 <212> DNA <213> Unknown <220> <223> Ogataea methanolica <400> 18 cgaacttgcc cttgtggaat ttggttgtta atcaaactgt tctgtatttc atgtcatact 60 actattgata ttattaatgt tacttactca tctggccatt taacaggttt gaagctttaa 120 tgctcttaac taacagcaat ccatcaccgt caaccttaac ccccctggtg cttgctgtct 180 ttatccttcg tatctttttc atgttgcacc gccctgttcc ttatacggtt gttcccccat 240 aggctaactt ctctgtttcc gaccatctct gcaataacaa agaattctat acgcttacac 300 tataatcata caatgactct acatgccatt ttcactttac ttacttgcca tcggaagata 360 ctgaatcaga aagccatagt aactacataa cttcaaaaca cacccttttt acagattagt 420 tacaattttg tcaatgtttg tttgataacc caaggtggaa cgtttccagt tagacctgtt 480 taatccaact cactttacca ccccaaaact ttcctaccgt tagacaaata ctggctaaat 540 ctgacgaaaa caaccaatca acaattgaat ccactgggag gtatctctaa tccactgaca 600 aactttgcta aaacaagaaa aagtgggggc ctccgttgcg gagaagacgt gcgcaggctt 660 aaaaacacaa gagaacactt ggaagtaccc cagattttta gcttcctact attctgacac 720 cccctattca agcacgacgg tgattgattc attcaatttt gctgctccaa tgataggata 780 aacccttttg gacttcaatc agacctctgt cctccatagc aatataaata ccttctagtt 840 gccccacttc ctctctcctg tactgcccca atgagtgact tattcaagtt actttctctc 900 ttttcctaac aattaaacaa gaagctttat tataacatta atatactatt ttataacagg 960 attgaaaatt atatttatct atctaaaact aaaattcaaa 1000 <210> 19 <211> 664 <212> PRT <213> Unknown <220> <223> Ogataea polymorpha <400> 19 Met Ala Ile Pro Asp Glu Phe Asp Ile Ile Val Val Gly Gly Gly Ser 1 5 10 15 Thr Gly Cys Cys Ile Ala Gly Arg Leu Ala Asn Leu Asp Asp Gln Asn 20 25 30 Leu Thr Val Ala Leu Ile Glu Gly Gly Glu Asn Asn Ile Asn Asn Pro 35 40 45 Trp Val Tyr Leu Pro Gly Val Tyr Pro Arg Asn Met Arg Leu Asp Ser 50 55 60 Lys Thr Ala Thr Phe Tyr Ser Ser Arg Pro Ser Lys Ala Leu Asn Gly 65 70 75 80 Arg Arg Ala Ile Val Pro Cys Ala Asn Ile Leu Gly Gly Gly Ser Ser 85 90 95 Ile Asn Phe Leu Met Tyr Thr Arg Ala Ser Ala Ser Asp Tyr Asp Asp 100 105 110 Trp Glu Ser Glu Gly Trp Ser Thr Asp Glu Leu Leu Pro Leu Ile Lys 115 120 125 Lys Ile Glu Thr Tyr Gln Arg Pro Cys Asn Asn Arg Asp Leu His Gly 130 135 140 Phe Asp Gly Pro Ile Lys Val Ser Phe Gly Asn Tyr Thr Tyr Pro Thr 145 150 155 160 Cys Gln Asp Phe Leu Arg Ala Ala Glu Ser Gln Gly Ile Pro Val Val 165 170 175 Asp Asp Leu Glu Asp Phe Lys Thr Ser His Gly Ala Glu His Trp Leu 180 185 190 Lys Trp Ile Asn Arg Asp Leu Gly Arg Arg Ser Asp Ser Ala His Ala 195 200 205 Tyr Val His Pro Thr Met Arg Asn Lys Gln Ser Leu Phe Leu Ile Thr 210 215 220 Ser Thr Lys Cys Asp Lys Val Ile Ile Glu Asp Gly Lys Ala Val Ala 225 230 235 240 Val Arg Thr Val Pro Met Lys Pro Leu Asn Pro Lys Lys Pro Val Ser 245 250 255 Arg Thr Phe Arg Ala Arg Lys Gln Ile Val Ile Ser Cys Gly Thr Ile 260 265 270 Ser Ser Pro Leu Val Leu Gln Arg Ser Gly Ile Gly Ala Ala His His 275 280 285 Leu Arg Ser Val Gly Val Lys Pro Ile Val Asp Leu Pro Gly Val Gly 290 295 300 Glu Asn Phe Gln Asp His Tyr Cys Phe Phe Thr Pro Tyr Tyr Val Lys 305 310 315 320 Pro Asp Val Pro Thr Phe Asp Asp Phe Val Arg Gly Asp Pro Val Ala 325 330 335 Gln Lys Ala Ala Phe Asp Gln Trp Tyr Ser Asn Lys Asp Gly Pro Leu 340 345 350 Thr Thr Asn Gly Ile Glu Ala Gly Val Lys Ile Arg Pro Thr Glu Glu 355 360 365 Glu Leu Ala Thr Ala Asp Glu Asp Phe Arg Arg Gly Tyr Ala Glu Tyr 370 375 380 Phe Glu Asn Lys Pro Asp Lys Pro Leu Met His Tyr Ser Val Ile Ser 385 390 395 400 Gly Phe Phe Gly Asp His Thr Lys Ile Pro Asn Gly Lys Phe Met Thr 405 410 415 Met Phe His Phe Leu Glu Tyr Pro Phe Ser Arg Gly Phe Val Arg Ile 420 425 430 Thr Ser Ala Asn Pro Tyr Asp Ala Pro Asp Phe Asp Pro Gly Phe Leu 435 440 445 Asn Asp Glu Arg Asp Leu Trp Pro Met Val Trp Ala Tyr Lys Lys Ser 450 455 460 Arg Glu Thr Ala Arg Arg Met Glu Ser Phe Ala Gly Glu Val Thr Ser 465 470 475 480 His His Pro Leu Phe Lys Val Asp Ser Pro Ala Arg Ala Arg Asp Leu 485 490 495 Asp Leu Glu Thr Cys Ser Ala Tyr Ala Gly Pro Lys His Leu Thr Ala 500 505 510 Asn Leu Tyr His Gly Ser Trp Thr Val Pro Ile Asp Lys Pro Thr Pro 515 520 525 Lys Asn Asp Phe His Val Thr Ser Asn Gln Val Gln Leu His Ser Asp 530 535 540 Ile Glu Tyr Thr Glu Glu Asp Asp Glu Ala Ile Val Asn Tyr Ile Lys 545 550 555 560 Glu His Thr Glu Thr Thr Trp His Cys Leu Gly Thr Cys Ser Met Ala 565 570 575 Pro Arg Glu Gly Ser Lys Ile Ala Pro Lys Gly Gly Val Leu Asp Ala 580 585 590 Arg Leu Asn Val Tyr Gly Val Gln Asn Leu Lys Val Ala Asp Leu Ser 595 600 605 Val Cys Pro Asp Asn Val Gly Cys Asn Thr Tyr Ser Thr Ala Leu Thr 610 615 620 Ile Gly Glu Lys Ala Ala Thr Leu Val Ala Glu Asp Leu Gly Tyr Ser 625 630 635 640 Gly Ser Asp Leu Asp Met Thr Ile Pro Asn Phe Arg Leu Gly Thr Tyr 645 650 655 Glu Glu Thr Gly Leu Ala Arg Phe 660 <210> 20 <211> 1995 <212> DNA <213> Unknown <220> <223> Ogataea polymorpha <400> 20 atggccattc ctgacgaatt cgatatcatt gttgttggtg gaggttccac cggctgctgc 60 attgcgggca gactcgcaaa cctcgacgac caaaacctca cagttgccct gatcgagggt 120 ggtgagaaca acatcaacaa cccttgggtc taccttcccg gagtgtatcc tagaaacatg 180 agactcgact ccaagacggc caccttctac tcgtccagac catcgaaggc tctgaacggc 240 agaagagcga tcgttccttg cgccaacatc cttggaggcg gctcgtcgat caactttctg 300 atgtacacca gagcctctgc ttccgactac gacgactggg agtccgaggg atggagcacc 360 gacgagttgc tacctctgat caaaaaaatc gaaacttacc agcgtccttg caacaacaga 420 gatctgcacg gctttgacgg cccaatcaag gtttcctttg gaaactacac gtatcctacg 480 tgccaggact tcctgagagc agcagagtcg cagggaattc ctgttgtgga cgacctggag 540 gacttcaaga catcgcatgg tgcagagcac tggctgaagt ggattaacag agacctgggc 600 agaagatcgg attctgcgca cgcctacgtc cacccaacta tgagaaacaa gcagagcctg 660 ttcctcatca cctccaccaa gtgtgacaag gtgatcatcg aggacggcaa ggctgtggcc 720 gtgagaacag tgccaatgaa gcctctgaac cctaagaagc ctgtgtccag aaccttcaga 780 gccagaaagc agattgtgat ctcctgcgga accatctcgt ctcctctggt gctccagaga 840 tctggtattg gtgcagctca ccacttgaga tccgtggggg tcaagccaat cgtcgacctg 900 ccaggtgtgg gtgagaattt ccaggaccac tactgtttct tcactccata ctacgtcaag 960 cctgacgttc ctacgttcga cgactttgtc aggggtgacc cagttgccca gaaggccgct 1020 ttcgaccagt ggtactccaa caaggacggt ccattgacca ccaacggtat tgaagccgga 1080 gtcaagatca gacctaccga agaggagctg gctaccgcgg acgaggactt cagacgcggc 1140 tacgcagagt acttcgagaa caagccagac aagcctctga tgcactactc tgtcatctcc 1200 ggcttctttg gagaccacac caagattcct aacggcaagt tcatgaccat gttccacttc 1260 ctggagtatc cattctccag aggatttgtt agaatcacct cggcaaaccc atacgacgct 1320 cctgacttcg atcccggctt cctcaatgac gaaagagacc tgtggcctat ggtctgggca 1380 tacaagaagt ccagagagac ggccagaaga atggagagct ttgcaggaga ggtcacctcg 1440 caccacccat tgttcaaggt tgactcgcca gccagagcca gagacctgga cctcgagaca 1500 tgcagtgcat atgccggtcc taagcacctc actgccaacc tgtaccacgg ctcgtggacc 1560 gttcctatcg acaagccaac gcctaagaac gatttccacg tgacctccaa ccaagtccaa 1620 ctgcactccg acatcgagta caccgaggag gacgacgagg ccatcgtcaa ctacattaag 1680 gaacacaccg agaccacttg gcactgtctg ggtacctgct cgatggcccc aagagagggt 1740 agtaagattg ctcctaaggg aggtgtcttg gacgccagac tgaacgttta cggagtccag 1800 aacctcaagg ttgcggacct ttctgtttgt cccgacaacg ttggatgcaa cacctactct 1860 actgcattga ccatcggtga gaaggctgcc actcttgttg ctgaagatct tggctactca 1920 ggctccgacc tggacatgac gattccaaac ttcagactcg gaacttacga ggagaccgga 1980 cttgccagat tctaa 1995 <210> 21 <211> 1000 <212> DNA <213> Unknown <220> <223> Ogataea polymorpha <400> 21 gctgcagctt gcgatctcgg atggttttgg aatggaagaa ccgcgacatc tccaacagct 60 gggccgtgtt gagaatgagc cggacgtcgt tgaacgaggg ggccacaagc cggcgtttgc 120 tgatggcgcg gcgctcgtcc tcgatgtaga aggccttttc cagaggcagt ctcgtgaaga 180 agttgccaac gctcggaacc agctgcacga gccgagacaa ttcgggggtg ccggctttgg 240 tcatttcaat gttgtcgtcg atgaggagtt caaggtcgtg gaagatttcc gcgtagcggc 300 gttttgcctc agagtttacc atgaggtcgt ccactgcaga gatgccgttg ctcttcaccg 360 cgtacaggac gaacggcgtg gccagcaggc ccttgatcca ttctatgagg ccatctcgac 420 ggtgttcctt gagtgcgtac tccactctgt agcgactgga catctcgaga ctgggcttgc 480 tgtgctggat gcaccaatta attgttgccg catgcatcct tgcaccgcaa gtttttaaaa 540 cccactcgct ttagccgtcg cgtaaaactt gtgaatctgg caactgaggg ggttctgcag 600 ccgcaaccga acttttcgct tcgaggacgc agctggatgg tgtcatgtga ggctctgttt 660 gctggcgtag cctacaacgt gaccttgcct aaccggacgg cgctacccac tgctgtctgt 720 gcctgctacc agaaaatcac cagagcagca gagggccgat gtggcaactg gtggggtgtc 780 ggacaggctg tttctccaca gtgcaaatgc gggtgaaccg gccagaaagt aaattcttat 840 gctaccgtgc agtgactccg acatccccag tttttgccct acttgatcac agatggggtc 900 agcgctgccg ctaagtgtac ccaaccgtcc ccacacggtc catctataaa tactgctgcc 960 agtgcacggt ggtgacatca atctaaagta caaaaacaaa 1000 <210> 22 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Signal sequence <220> <221> MISC_FEATURE <222> (3) <223> X at position 3 is either F or L <220> <221> MISC_FEATURE <222> (16) <223> X at position 16 is either A or T <400> 22 Met Lys Xaa Ser Thr Asn Leu Ile Leu Ala Ile Ala Ala Ala Ser Xaa 1 5 10 15 Val Val Ser Ala 20 <210> 23 <211> 36 <212> PRT <213> Artificial Sequence <220> <223> Leader sequence <220> <221> MISC_FEATURE <222> (3) <223> X at position 3 is either F or L <220> <221> MISC_FEATURE <222> (16) <223> X at position 16 is either A or T <400> 23 Met Lys Xaa Ser Thr Asn Leu Ile Leu Ala Ile Ala Ala Ala Ser Xaa 1 5 10 15 Val Val Ser Ala Ala Pro Val Ala Pro Ala Glu Glu Ala Ala Asn His 20 25 30 Leu His Lys Arg 35 <210> 24 <211> 85 <212> PRT <213> Saccharomyces cerevisiae <400> 24 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe 35 40 45 Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu 50 55 60 Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Ser Leu Glu Lys Arg 85 <210> 25 <211> 1991 <212> DNA <213> Artificial Sequence <220> <223> AOX1 split marker cassette 1 <400> 25 aggggtccaa gtaagaagct tcttgctgta gaatttgggc atatgtgctg gtgacaaagg 60 catctctgcc ttgagtttct gacggcggga cagcattctt accggatata taacaccaat 120 tgccagcacc accaatctca gaggtacccc taacaaactt aataaaatct tgggtatcaa 180 cttcattaag ctttgtagtt tgcaagtact tataaacaaa attccgtaag gtgtcgtctt 240 gaggctggga cttgacaaac tgccaaaatg gcaacaaatc tactggcttg gccataattt 300 tgacattcga gtcatcaaag gtaaattcaa ccggagactt gtattcttta ttgataactt 360 tctcatatag gacattgtca ggaacacgat gaaaccagga tgcccccaaa tccaatgaga 420 ctgaggtttc atgagtcgca accaacctac ctccaatacg gtccctaccc tctaaaatca 480 acgcattcac gccattgctt ttgagatcga ctgcagcttt gatgcctgaa atcccagcgc 540 ctacaatgat gacatttgga tttggttgac tcatgttggt attgtgaaat agacgcagat 600 cgggaacact gaaaaataac agttattatt cgagatctaa catccaaaga cgaaaggttg 660 aatgaaacct ttttgccatc cgacatccac aggtccattc tcacacataa gtgccaaacg 720 caacaggagg ggatacacta gcagcagacc gttgcaaacg caggacctcc actcctcttc 780 tcctcaacac ccacttttgc catcgaaaaa ccagcccagt tattgggctt gattggagct 840 cgctcattcc aattccttct attaggctac taacaccatg actttattag cctgtctatc 900 ctggcccccc tggcgaggtt catgtttgtt tatttccgaa tgcaacaagc tccgcattac 960 acccgaacat cactccagat gagggctttc tgagtgtggg gtcagtacgc tgcaggtcga 1020 caacccttaa tataacttcg tataatgtat gctatacgaa gttattaggt ctagatcggt 1080 accgacatgg aggcccagaa taccctcctt gacagtcttg acgtgcgcag ctcaggggca 1140 tgatgtgact gtcgcccgta catttagccc atacatcccc atgtataatc atttgcatcc 1200 atacattttg atggccgcac ggcgcgaagc aaaaattacg gctcctcgct gcagacctgc 1260 gagcagggaa acgctcccct cacagacgcg ttgaattgtc cccacgccgc gcccctgtag 1320 agaaatataa aaggttagga tttgccactg aggttcttct ttcatatact tccttttaaa 1380 atcttgctag gatacagttc tcacatcaca tccgaacata aacaaccatg ggtaaggaaa 1440 agactcacgt ttcgaggccg cgattaaatt ccaacatgga tgctgattta tatgggtata 1500 aatgggctcg cgataatgtc gggcaatcag gtgcgacaat ctatcgattg tatgggaagc 1560 ccgatgcgcc agagttgttt ctgaaacatg gcaaaggtag cgttgccaat gatgttacag 1620 atgagatggt cagactaaac tggctgacgg aatttatgcc tcttccgacc atcaagcatt 1680 ttatccgtac tcctgatgat gcatggttac tcaccactgc gatccccggc aaaacagcat 1740 tccaggtatt agaagaatat cctgattcag gtgaaaatat tgttgatgcg ctggcagtgt 1800 tcctgcgccg gttgcattcg attcctgttt gtaattgtcc ttttaacagc gatcgcgtat 1860 ttcgtctcgc tcaggcgcaa tcacgaatga ataacggttt ggttgatgcg agtgattttg 1920 atgacgagcg taatggctgg cctgttgaac aagtctggaa agaaatgcat aagcttttgc 1980 cattctcacc g 1991 <210> 26 <211> 1853 <212> DNA <213> Artificial Sequence <220> <223> AOX1 split marker cassette 2 <400> 26 aagcccgatg cgccagagtt gtttctgaaa catggcaaag gtagcgttgc caatgatgtt 60 acagatgaga tggtcagact aaactggctg acggaattta tgcctcttcc gaccatcaag 120 cattttatcc gtactcctga tgatgcatgg ttactcacca ctgcgatccc cggcaaaaca 180 gcattccagg tattagaaga atatcctgat tcaggtgaaa atattgttga tgcgctggca 240 gtgttcctgc gccggttgca ttcgattcct gtttgtaatt gtccttttaa cagcgatcgc 300 gtatttcgtc tcgctcaggc gcaatcacga atgaataacg gtttggttga tgcgagtgat 360 tttgatgacg agcgtaatgg ctggcctgtt gaacaagtct ggaaagaaat gcataagctt 420 ttgccattct caccggattc agtcgtcact catggtgatt tctcacttga taaccttatt 480 tttgacgagg ggaaattaat aggttgtatt gatgttggac gagtcggaat cgcagaccga 540 taccaggatc ttgccatcct atggaactgc ctcggtgagt tttctccttc attacagaaa 600 cggctttttc aaaaatatgg tattgataat cctgatatga ataaattgca gtttcatttg 660 atgctcgatg agtttttcta atcagtactg acaataaaaa gattcttgtt ttcaagaact 720 tgtcatttgt atagtttttt tatattgtag ttgttctatt ttaatcaaat gttagcgtga 780 tttatatttt ttttcgcctc gacatcatct gcccagatgc gaagttaagt gcgcagaaag 840 taatatcatg cgtcaatcgt atgtgaatgc tggtcgctat actggtacca ttcgagaacc 900 cttaatataa cttcgtataa tgtatgctat acgaagttat taggtgatat cagatccact 960 gccatttgcc tgagagatgc aggcttcatt tttgatactt ttttatttgt aacctatata 1020 gtataggatt ttttttgtca ttttgtttct tctcgtacga gcttgctcct gatcagccta 1080 tctcgcagct gatgaatatc ttgtggtagg ggtttgggaa aatcattcga gtttgatgtt 1140 tttcttggta tttcccactc ctcttcagag tacagaagat taagtgagac gttcgtttgt 1200 gcaagcttca acgatgccaa aagggtataa taagcgtcat ttgcagcatt gtgaagaaaa 1260 ctatgtggca agccaagcct gcgaagaatg tattttaagt ttgactttga tgtattcact 1320 tgattaagcc ataattctcg agtatctatg attggaagta tgggaatggt gatacccgca 1380 ttcttcagtg tcttgaggtc tcctatcaga ttatgcccaa ctaaagcaac cggaggagga 1440 gatttcatgg taaatttctc tgacttttgg tcatcagtag actcgaactg tgagactatc 1500 tcggttatga cagcagaaat gtccttcttg gagacagtaa atgaagtccc accaataaag 1560 aaatccttgt tatcaggaac aaacttcttg tttcgaactt tttcggtgcc ttgaactata 1620 aaatgtagag tggatatgtc gggtaggaat ggagcgggca aatgcttacc ttctggacct 1680 tcaagaggta tgtagggttt gtagatactg atgccaactt cagtgacaac gttgctattt 1740 cgttcaaacc attccgaatc cagagaaatc aaagttgttt gtctactatt gatccaagcc 1800 agtgcggtct tgaaactgac aatagtgtgc tcgtgttttg aggtcatctt tgt 1853 <210> 27 <211> 2038 <212> DNA <213> Artificial Sequence <220> <223> AOX2 split marker cassette 1 <400> 27 gtacgggttt actgatttga catatcttgg tactaacgtt accaatggtg ttccaaataa 60 cgcagatgat gagcgtggtt gcattgctgg atttgacaac actggtttcg tgctgggaac 120 ttcatcctcg ttgtttaatc agtttattct gcaactgaat acgagtgatc tttcaggagc 180 aatttaccaa atcattgagc attttctgac tggacttagc gaagacgaag acgacattgc 240 tatctattcc cccaaccctt tctacaaaag tacgtatgca ggagtaggtg ccattgcgga 300 aaatgacacc ctttacttgg ttgatggtgg agaggataac caaaacgtcc ctctgcagcc 360 tctacttcaa aaggagcgtg acgttgatat catctttgcg tttgacaaca gtgcagacac 420 tgacctctct tggccaaacg gttcatcatt agtcaacacc tacatgagac agttttcttc 480 tcaagcaaat ggaacaacgt tcccttatgt acctgatacc accactttcc taaacttgaa 540 tctttcgagt aagccaacct tctttggttg tgatgctaga aatttgacag acattgttga 600 aggcacggat cacattcctc ccctggttgt ttatctggcc aatagacctt tctcgtattg 660 gagtaacact tcaactttca agttagacta ctctgaatcc gagaagagag gaatgatcca 720 aaacggtttt gaagtgtcgt ctcgtttgaa catgactatt gatgaagaat ggcgtacttg 780 tgttggatgt gcaatcattc gtagacagca ggagagatcc aatgcaacac aaacagagca 840 atgtagaaga tgttttgaga attattgttg gaacggtgat attgacactt ccaccgaaga 900 tatccccgtt aattttacca ctactggagc aaccaatgag gagaatgaca actccacttc 960 aatatcatcg gccaattcgg tagcaccttc caaactttgg taccaagcac cattgctgtt 1020 ggtcggcctt gtcgcattct tcatctagta cgtacgctgc aggtcgacaa cccttaatat 1080 aacttcgtat aatgtatgct atacgaagtt attaggtcta gatcggtacc gacatggagg 1140 cccagaatac cctccttgac agtcttgacg tgcgcagctc aggggcatga tgtgactgtc 1200 gcccgtacat ttagcccata catccccatg tataatcatt tgcatccata cattttgatg 1260 gccgcacggc gcgaagcaaa aattacggct cctcgctgca gacctgcgag cagggaaacg 1320 ctcccctcac agacgcgttg aattgtcccc acgccgcgcc cctgtagaga aatataaaag 1380 gttaggattt gccactgagg ttcttctttc atatacttcc ttttaaaatc ttgctaggat 1440 acagttctca catcacatcc gaacataaac aaccatgggt aaggaaaaga ctcacgtttc 1500 gaggccgcga ttaaattcca acatggatgc tgatttatat gggtataaat gggctcgcga 1560 taatgtcggg caatcaggtg cgacaatcta tcgattgtat gggaagcccg atgcgccaga 1620 gttgtttctg aaacatggca aaggtagcgt tgccaatgat gttacagatg agatggtcag 1680 actaaactgg ctgacggaat ttatgcctct tccgaccatc aagcatttta tccgtactcc 1740 tgatgatgca tggttactca ccactgcgat ccccggcaaa acagcattcc aggtattaga 1800 agaatatcct gattcaggtg aaaatattgt tgatgcgctg gcagtgttcc tgcgccggtt 1860 gcattcgatt cctgtttgta attgtccttt taacagcgat cgcgtatttc gtctcgctca 1920 ggcgcaatca cgaatgaata acggtttggt tgatgcgagt gattttgatg acgagcgtaa 1980 tggctggcct gttgaacaag tctggaaaga aatgcataag cttttgccat tctcaccg 2038 <210> 28 <211> 1944 <212> DNA <213> Artificial Sequence <220> <223> AOX2 split marker cassette 2 <400> 28 aagcccgatg cgccagagtt gtttctgaaa catggcaaag gtagcgttgc caatgatgtt 60 acagatgaga tggtcagact aaactggctg acggaattta tgcctcttcc gaccatcaag 120 cattttatcc gtactcctga tgatgcatgg ttactcacca ctgcgatccc cggcaaaaca 180 gcattccagg tattagaaga atatcctgat tcaggtgaaa atattgttga tgcgctggca 240 gtgttcctgc gccggttgca ttcgattcct gtttgtaatt gtccttttaa cagcgatcgc 300 gtatttcgtc tcgctcaggc gcaatcacga atgaataacg gtttggttga tgcgagtgat 360 tttgatgacg agcgtaatgg ctggcctgtt gaacaagtct ggaaagaaat gcataagctt 420 ttgccattct caccggattc agtcgtcact catggtgatt tctcacttga taaccttatt 480 tttgacgagg ggaaattaat aggttgtatt gatgttggac gagtcggaat cgcagaccga 540 taccaggatc ttgccatcct atggaactgc ctcggtgagt tttctccttc attacagaaa 600 cggctttttc aaaaatatgg tattgataat cctgatatga ataaattgca gtttcatttg 660 atgctcgatg agtttttcta atcagtactg acaataaaaa gattcttgtt ttcaagaact 720 tgtcatttgt atagtttttt tatattgtag ttgttctatt ttaatcaaat gttagcgtga 780 tttatatttt ttttcgcctc gacatcatct gcccagatgc gaagttaagt gcgcagaaag 840 taatatcatg cgtcaatcgt atgtgaatgc tggtcgctat actggtacca ttcgagaacc 900 cttaatataa cttcgtataa tgtatgctat acgaagttat taggtgatat cagatccact 960 tcctcttacg gctttctttc ccaaaaaatc attggggaaa tgtgcccctc atcagagtcc 1020 aatgacccat gaataaagtt tcttgtactg tttaagacga tgaattgcaa cgataatccg 1080 agcagtttac ggggtacatc acgtgctttg catatgatct cggagtcgga tcagttccgg 1140 atgtgatgta ttaccccata gtttcaaact ctaatgcagc cgccaagtgc catacaccct 1200 ccatcaatct atgcttaaag tttttcacca tcgttgggtg gtgatgatga ctcgcttagt 1260 ctctgctgtt cgatattaac tttgtaagga tcgcccttgg atggaaaatt gaggggttgt 1320 aacctgaatt tgcaggctac ttacattgga cttttgagaa ggctggacgg ttgatgaaga 1380 gggctgggtg cagaggaatg gaaaaaaatt tagttgagag gactgcttga aattttagga 1440 aatggagtcc tttaagctga caaaacttca aggatgggga ttttcatgta gctttttcat 1500 gccttcgaca agctaaagga aggtaattga ttctggataa atggatattt gatctgcttt 1560 agcagatgtc aaagttctac tagtgatagt ctggtatctc gtagccttca attgggcgta 1620 tcttactcga agtgttatat ttttagctga cgagacgaag aacgagagag tattgacaca 1680 ttcagaggta agacaatatg tcgtattatc aaaataagta tcgaacctct attaggagcc 1740 tactggctca aatgtgcaac cttagtggtg attgtctctg cttcttgatc acaatctgtc 1800 gtgtttgaga gtgccgatgt atgattttta gtaaatgttt ttcagaaaag gcgctaagta 1860 aataaccagt aagtaataaa taacgtaaaa gtgatttgaa tcataaaaga atcaagatag 1920 aggtcaaagc atagataatc cccc 1944 <210> 29 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer sequence <400> 29 ggctggaaat agatgtaggg ag 22 <210> 30 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer sequence <400> 30 tcgcatctcc gcaaatttct c 21 <210> 31 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer sequence <400> 31 gatcccattc cctatccatg t 21 <210> 32 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer sequence <400> 32 ctctcccccc tcgtaatctt 20 <210> 33 <211> 720 <212> DNA <213> Artificial Sequence <220> <223> enhanced green fluorescent protein (eGFP) <400> 33 atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60 ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120 ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180 ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240 cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300 ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360 gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420 aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480 ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540 gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600 tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660 ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 720 720 <210> 34 <211> 1830 <212> DNA <213> Artificial Sequence <220> <223> Human serum albumin (HSA) with its native secretion leader <400> 34 atgaagtggg ttactttcat ctccttgttg ttcttgttct cctcagctta ctccagaggt 60 gttttcagaa gagatgctca caagtccgag gttgctcaca gattcaagga cttgggtgaa 120 gagaacttca aggctttggt tttgatcgct ttcgctcagt acttgcagca gtgtccattc 180 gaggaccacg ttaagttggt taacgaggtt actgagttcg ctaagacttg tgttgctgac 240 gaatccgctg agaactgtga taagtccttg cacactttgt tcggtgacaa gttgtgtact 300 gttgctactt tgagagaaac ttacggtgag atggctgact gttgtgctaa gcaagagcct 360 gagagaaacg agtgtttctt gcaacacaag gacgacaacc caaacttgcc aagattggtt 420 agaccagagg ttgacgttat gtgtactgct ttccacgaca acgaagagac tttcttgaag 480 aagtacttgt acgagatcgc tagaagacac ccatacttct acgctccaga gttgttgttc 540 ttcgctaaga gatacaaggc tgctttcact gagtgttgtc aggctgctga taaggctgct 600 tgtttgttgc caaagttgga cgagttgaga gatgagggta aggcttcttc cgctaagcag 660 agattgaagt gtgcttcctt gcagaagttc ggagagagag cttttaaggc ttgggctgtt 720 gctagattgt cccagagatt cccaaaggct gagttcgctg aggtttccaa gttggttact 780 gacttgacta aggttcacac agagtgttgt cacggtgact tgttggaatg tgctgatgac 840 agagctgact tggctaagta catctgtgag aaccaggatt ccatctcctc caagttgaaa 900 gaatgttgtg agaagccttt gttggagaag tcccactgta tcgctgaggt tgaaaacgac 960 gaaatgccag ctgacttgcc atctttggct gctgacttcg ttgaatccaa ggacgtctgc 1020 aagaactacg ctgaggctaa ggacgttttc ttgggtatgt tcttgtatga gtacgctaga 1080 agacatccag actactccgt tgttttgttg ttgagattgg ctaagactta cgagactact 1140 ttggagaagt gttgtgctgc tgctgaccca catgagtgtt acgctaaggt tttcgacgag 1200 ttcaagccat tggttgagga accacagaac ttgatcaagc agaactgtga gttgttcgag 1260 cagttgggtg agtacaagtt ccagaacgct ttgttggtta gatacactaa gaaggttcca 1320 caggtttcca ctccaacttt ggttgaggtt tccagaaact tgggtaaggt tggttccaag 1380 tgttgtaagc acccagaggc taagagaatg ccatgtgctg aggactactt gtctgttgtt 1440 ttgaaccagt tgtgtgtctt gcacgaaaag acaccagttt ccgacagagt tactaagtgt 1500 tgtactgaat ccttggttaa cagaagacct tgtttctccg ctttggaggt tgacgagact 1560 tacgttccaa aagagttcaa cgctgagact ttcactttcc acgctgacat ctgtactttg 1620 tccgagaaag agagacagat caagaagcag actgctttgg ttgagttggt taagcacaag 1680 ccaaaggcta caaaagagca gttgaaggct gttatggacg acttcgctgc tttcgttgag 1740 aaatgttgta aggctgacga caaagagact tgtttcgctg aagagggtaa gaagttggtt 1800 gctgcttccc aagctgcttt gggtctgtaa 1830 <210> 35 <211> 1056 <212> DNA <213> Artificial Sequence <220> <223> variable region of a camelid antibody (VHH) with the S. cerevisiae alpha-mating factor leader <400> 35 atgagattcc catctatttt caccgctgtc ttgttcgctg cctcctctgc attggctgcc 60 cctgttaaca ctaccactga agacgagact gctcaaattc cagctgaagc agttatcggt 120 tactctgacc ttgagggtga tttcgacgtc gctgttttgc ctttctctaa ctccactaac 180 aacggtttgt tgttcattaa caccactatc gcttccattg ctgctaagga agagggtgtc 240 tctctcgaga agagacaagc cggtggttca ttaagattgt cctgtgctgc ctctggtaga 300 actttcactt ctttcgcaat gggttggttt agacaagcac ctggaaaaga gagagagttt 360 gttgcttcta tctccagatc cggtacttta actagatacg ctgactctgc caagggtaga 420 ttcactattt ctgttgacaa cgccaagaac actgtttctt tgcaaatgga caaccttaac 480 ccagatgaca ccgcagtcta ttactgtgcc gctgacttgc acagaccata cggtccagga 540 acccaaagat ccgatgagta cgattcttgg ggtcagggaa ctcaagtcac tgtctcttca 600 ggtggtggat ctggtggtgg aggttcaggt ggtggaggat ccggtggtgg tggttctggt 660 ggtggtggat ctggtggagg tgaagttcaa cttgtcgaat ccggtggtgc acttgtccaa 720 cctggtggat ctcttagact ttcttgtgcc gcctccggtt ttcctgttaa ccgttactct 780 atgcgttggt acagacaagc ccctggaaaa gaacgtgaat gggttgccgg aatgtcctca 840 gctggtgaca gatcctccta cgaagattct gtgaagggac gtttcaccat ctccagagat 900 gacgcccgta acaccgttta ccttcaaatg aactccctta agcctgagga tactgccgtc 960 tactattgta acgtgaatgt cggatttgaa tactggggac agggaaccca agttactgtc 1020 tcttccggtg gacatcacca ccaccatcac taatag 1056 <210> 36 <211> 991 <212> DNA <213> Pichia pastoris <400> 36 gcaaggcaac tgagaaattg aatagtggtt tcaagcccgc tgactttttg tattatctca 60 atgtcggtgt ttcacagtcc ccagaagggg gctttgcctt caagggagac ggaagagaca 120 tcgtcaaccc tggggagaag tatttcaaat ggcgcaagtt cgctaatttt tacgattaag 180 cagtgctgta tggggtagtt aataaatcgg gaatatcctt ctgacgtgac tgtaacaaat 240 ctctttttac gtggtgcgca tactggacag aggcagagtc tcaatttctt cttttgagac 300 aggctactac agcctgtgat tcctcttggt acttggattt gcttttatct ggctccgttg 360 ggaactgtgc ctgggttttg aagtatcttg tggatgtgtt tctaacactt tttcaatctt 420 cttggagtga gaatgcagga ctttgaacat cgtctagctc gttggtaggt gaaccgtttt 480 accttgcatg tggttaggag ttttctggag taaccaagac cgtcttatca tcgccgtaaa 540 atcgctctta ctgtcgctaa taatcccgct ggaagagaag ttcgaacaga agtagcacgc 600 aaagctcttg tcaaatgaga attgttaatc gtttgacagg tcacactcgt gggctatgta 660 cgatcaactt gccggctgtt gctggagaga tgacaccagt tgtggcatgg ccaattggta 720 ttcagccgta ccactgtatg gaaaatgaga ttatcttgtt cttgatctag tttcttgcca 780 ttttagagtt gccacattcg taggtttcag taccaataat ggtaacttcc aaacttccaa 840 cgcagatacc agagatctgc cgatccttcc ccaacaatag gagcttacta cgccatacat 900 atagcctatc tattttcact ttcgcgtggg tgcttctata taaacggttc cccatcttcc 960 gtttcatact acttgaattt taagcactaa a 991 <210> 37 <211> 864 <212> DNA <213> Pichia pastoris <400> 37 cttttctttg ggcaaggaaa aatcaagaaa aagcagaggt taaagttttc aggggaatgg 60 caattgcttt atatatggga gaaagttaac tacgtcggtg ctgtaggcgt agagagcgac 120 tggagaatgc gtgatgaggt cgtctctttt cgccccccct tggcggggta aaaattgcac 180 tactgcagaa ttactacacc cctattccga ggagacggag tgcgacaaaa atggtaaagt 240 tcaccctagt ctgcgacttt taattgacgg acaccggcgt ttacatgcga aaaaaactaa 300 agtgcgcgca tttcacggcc gaggggggtc ccacttggga ctgagagggg gtgggatctg 360 aaatcgagga ggtatcaaga ccccccgttt ctcaactccc taatcaaaaa ttacgaagtc 420 ctcgttggaa aggagttaaa ataattaagc ggggtcggac gccataccga ggttatcttg 480 caggcatttt actaatattg gaattcggag ctcaacttgc aaccaggcag ggtttagcta 540 tgtaatcaat gtaatcaata taataaagca ctaccacatc gaaggtttgg gagggaggcc 600 aatagtgtcc cccacagggt gctgatatcg cgattcttgg gtgaggagac acatatttca 660 ctcctctcac caaccaacca agcggctcct cgcaagatga tttatccgat tatccggaca 720 ctatactccc atccagtttg atgccgattt catcgattgt cctaaataat ccttaaatat 780 gtatagaacg gtaccctggg gttacataat ccttatttaa taatccctcc cccaccgctt 840 ttcttttttt ttcttcttat tgtc 864 <210> 38 <211> 1000 <212> DNA <213> Pichia pastoris <400> 38 aaatggcaga aggatcagcc tggacgaagc aaccagttcc aactgctaag taaagaagat 60 gctagacgaa ggagacttca gaggtgaaaa gtttgcaaga agagagctgc gggaaataaa 120 ttttcaattt aaggacttga gtgcgtccat attcgtgtac gtgtccaact gttttccatt 180 acctaagaaa aacataaaga ttaaaaagat aaacccaatc gggaaacttt agcgtgccgt 240 ttcggattcc gaaaaacttt tggagcgcca gatgactatg gaaagaggag tgtaccaaaa 300 tggcaagtcg ggggctactc accggatagc caatacattc tctaggaacc agggatgaat 360 ccaggttttt gttgtcacgg taggtcaagc attcacttct taggaatatc tcgttgaaag 420 ctacttgaaa tcccattggg tgcggaacca gcttctaatt aaatagttcg atgatgttct 480 ctaagtggga ctctacggct caaacttcta cacagcatca tcttagtagt cccttcccaa 540 aacaccattc taggtttcgg aacgtaacga aacaatgttc ctctcttcac attgggccgt 600 tactctagcc ttccgaagaa ccaataaaag ggaccggctg aaacgggtgt ggaaactcct 660 gtccagttta tggcaaaggc tacagaaatc ccaatcttgt cgggatgttg ctcctcccaa 720 acgccatatt gtactgcagt tggtgcgcat tttagggaaa atttacccca gatgtcctga 780 ttttcgaggg ctacccccaa ctccctgtgc ttatacttag tctaattcta ttcagtgtgc 840 tgacctacac gtaatgatgt cgtaacccag ttaaatggcc gaaaaactat ttaagtaagt 900 ttatttctcc tccagatgag actctccttc ttttctccgc tagttatcaa actataaacc 960 tattttacct caaatacctc caacatcacc cacttaaaca 1000 <210> 39 <211> 549 <212> DNA <213> Pichia pastoris <400> 39 aatgatataa acaacaattg agtgacaggt ctactttgtt ctcaaaaggc cataaccatc 60 tgtttgcatc tcttatcacc acaccatcct cctcatctgg ccttcaattg tggggaacaa 120 ctagcatccc aacaccagac taactccacc cagatgaaac cagttgtcgc ttaccagtca 180 atgaatgttg agctaacgtt ccttgaaact cgaatgatcc cagccttgct gcgtatcatc 240 cctccgctat tccgccgctt gctccaacca tgtttccgcc tttttcgaac aagttcaaat 300 acctatcttt ggcaggactt ttcctcctgc cttttttagc ctcaggtctc ggttagcctc 360 taggcaaatt ctggtcttca tacctatatc aacttttcat cagatagcct ttgggttcaa 420 aaaagaacta aagcaggatg cctgatatat aaatcccaga tgatctgctt ttgaaactat 480 tttcagtatc ttgattcgtt tacttacaaa caactattgt tgattttatc tggagaataa 540 tcgaacaaa 549 <210> 40 <211> 1000 <212> DNA <213> Pichia pastoris <400> 40 attactgttt tgggcaatcc tgttgataag acgcattcta gagttgtttc atgaaagggt 60 tacgggtgtt gattggtttg agatatgcca gaggacagat caatctgtgg tttgctaaac 120 tggaagtctg gtaaggactc tagcaagtcc gttactcaaa aagtcatacc aagtaagatt 180 acgtaacacc tgggcatgac tttctaagtt agcaagtcac caagagggtc ctatttaacg 240 tttggcggta tctgaaacac aagacttgcc tatcccatag tacatcatat tacctgtcaa 300 gctatgctac cccacagaaa taccccaaaa gttgaagtga aaaaatgaaa attactggta 360 acttcacccc ataacaaact taataatttc tgtagccaat gaaagtaaac cccattcaat 420 gttccgagat ttagtatact tgcccctata agaaacgaag gatttcagct tccttacccc 480 atgaacagaa atcttccatt taccccccac tggagagatc cgcccaaacg aacagataat 540 agaaaaaaga aattcggaca aatagaacac tttctcagcc aattaaagtc attccatgca 600 ctccctttag ctgccgttcc atccctttgt tgagcaacac catcgttagc cagtacgaaa 660 gaggaaactt aaccgatacc ttggagaaat ctaaggcgcg aatgagttta gcctagatat 720 ccttagtgaa gggttgttcc gatacttctc cacattcagt catagatggg cagctttgtt 780 atcatgaaga gacggaaacg ggcattaagg gttaaccgcc aaattatata aagacaacat 840 gtccccagtt taaagttttt ctttcctatt cttgtatcct gagtgaccgt tgtgtttaat 900 ataacaagtt cgttttaact taagaccaaa accagttaca acaaattata acccctctaa 960 acactaaagt tcactcttat caaactatca aacatcaaaa 1000 <210> 41 <211> 1000 <212> DNA <213> Pichia pastoris <400> 41 gtcaactgcg tactcttttg tcgaatggac tactgaatct gcctcgatag ccactatagg 60 aaggtccata gaggccagtt tttcaactag tcttggtgga aagaaaccga caaagccttt 120 catggagtca ccgatactga aaggttcaaa caaagaatgc ttgggtagtc tcttaatacc 180 catggcaacg aaaaaggggt cttcattgtt caacatgaat tcgtatccac ctttaatgta 240 gtcataaagc tgctgaagtt ccgaatcagt gatggaactg tctacagtga caatatagga 300 gttctcaatc accttatatc cagtcgaata tatctggata gggtcgggtc tcactgtgga 360 agattcaaat gggttagatc cctgtaattt cagcgatgga gactcagtat gatggggcaa 420 ggaaaacggc aattggatat tcaattggtc aagagatggt atcaaaagcg agtgtgccag 480 ggtagccacg gtagccactg atgctaatct gataattttc atttctggag tgtcaaaaca 540 gtagtgataa aaggctatga aggaggttgt ctaggggctc gcggaggaaa gtgattcaaa 600 cagacctgcc aaaaagagaa aaaagaggga atccctgttc tttccaatgg aaatgacgta 660 actttaactt gaaaaatacc ccaaccagaa gggttcaaac tcaacaagga ttgcgtaatt 720 cctacaagta gcttagagct gggggagaga caactgaagg cagcttaacg ataacgcggg 780 gggattggtg cacgactcga aaggaggtat cttagtcttg taacctcttt tttccagagg 840 ctattcaaga ttcataggcg atatcgatgt ggagaagggt gaacaatata aaaggctgga 900 gagatgtcaa tgaagcagct ggatagattt caaattttct agatttcaga gtaatcgcac 960 aaaacgaagg aatcccacca agcaaaaaaa aaaatctaag 1000 <210> 42 <211> 704 <212> DNA <213> Pichia pastoris <400> 42 aaattaatcc ataagataag gcaaatgtgc ttaagtaatt gaaaacagtg ttgtgattat 60 ataagcatgg tatttgaata gaactactgg ggttaactta tctagtagga tggaagttga 120 gggagatcaa gatgcttaaa gaaaaggatt ggccaatatg aaagccataa ttagcaatac 180 ttatttaatc agataattgt ggggcattgt gacttgactt ttaccaggac ttcaaacctc 240 aaccatttaa acagttatag aagacgtacc gtcacttttg cttttaatgt gatctaaatg 300 tgatcacatg aactcaaact aaaatgatat cttttactgg acaaaaatgt tatcctgcaa 360 acagaaagct ttcttctatt ctaagaagaa catttacatt ggtgggaaac ctgaaaacag 420 aaaataaata ctccccagtg accctatgag caggattttt gcatccctat tgtaggcctt 480 tcaaactcac acctaatatt tcccgccact cacactatca atgatcactt cccagttctc 540 ttcttcccct attcgtacca tgcaaccctt acacgccttt tccatttcgg ttcggatgcg 600 acttccagtc tgtggggtac gtagcctatt ctcttagccg gtatttaaac atacaaattc 660 acccaaattc taccttgata aggtaattga ttaatttcat aaat 704 <210> 43 <211> 1000 <212> DNA <213> Pichia pastoris <400> 43 agctcagatt ggaaatgatt tttgatccta ccaagaagcc tttgatttcc agaatctccg 60 ctaagtaagt aacccccgca aacgcatgca tccatgcaaa caaaatacta acaattttag 120 ccccgttgtt gagaaaccca gaaaattgaa tgttcaacca atccagacga tcaataagaa 180 aaaaggccca aaggctactt ccaaacctgc tgccgccaaa cctgctcctt caaaagccgg 240 tcccaaggga ggtaagaagg tgagaaagcc aaagaagaca gttgaagaat tggatcagga 300 aatggctgac tactttgaaa ataagaatta gcccaacaaa atatgtacaa gtattatata 360 aatgaatcta catggtgtgt tttatttaga tcctccaaac caaggaaaga aactaaactt 420 atctccggac ttacgagtca aataactatc cgcagttcct tggaactcag actttcttcc 480 ataagcggtc atatcatctt tggactgtgg gaatcctgga cgaatctttg aaatgtcata 540 atcttgctct ctatctccaa gcacagcgtc cggtaaatgc tggttcttct ttctcagatg 600 aatcttggat ttaacaaata aagccgtgcc tatggctaat gtactcaaaa acaaagtctg 660 cttccagaat ttcgcaaacg atggaatgcc atttcctgta aatgtactca ttgaacctat 720 gtttgattaa agttggtgtg aagtcatcaa acgagagtaa aatcagatac tcgtgcaccg 780 gccaaaattg actgagctaa tctctgcagg cttgacatcc gaacacaaca aataggcgac 840 aaatcttaac tatctaatcg taggctatgg tagaactttg tgggggtaga ggaagactac 900 aacagcaaga caaaacaaaa gagtcatagt ttgactctct gcttttttct tctttctctt 960 ctttttcttc ctccatattc gttatttatt tcgaactgga 1000 <210> 44 <211> 1000 <212> DNA <213> Pichia pastoris <400> 44 cagccattaa tctcacctca gtttttgaat cagtagaatt tttaatgaaa caaacggttg 60 gtatattatt tgatagagtt gccaaatttc caaagataaa tttttcatca ggtaatatcc 120 tgaataccgt aacatagtga ctattggaag acactgctat catattatat ttcggataaa 180 aatccaaacc ccagaccgac ctcttgagtc tcaactccaa gtcagccgca actttaatta 240 tccgtggatt gggagctagt ttggacaacg catcagtata atataacttt acggttccat 300 tatcagacgc tattgcaaga acttcctttc cattgatctc gccaatgcgg cagtaattga 360 tatcgtaggg taggtctgga aagacgctgg cgcttgtgtc ccattctgca ggaatctctg 420 gcacggtgct aatggtagtt atccaacgga gctgaggtag tcgatatatc tggatatgcc 480 gcctatagga taaaaacagg agagggtgaa ccttgcttat ggctactaga ttgttcttgt 540 actctgaatt ctcattatgg gaaactaaac taatctcatc tgtgtgttgc agtactattg 600 aatcgttgta gtatctacct ggagggcatt ccatgaatta gtgagataac agagttgggt 660 aactagagag aataatagac gtatgcatga ttactacaca acggatgtcg cactctttcc 720 ttagttaaaa ctatcatcca atcacaagat gcgggctgga aagacttgct cccgaaggat 780 aatcttctgc ttctatctcc cttcctcata tggtttcgca gggctcatgc cccttcttcc 840 ttcgaactgc ccgatgagga agtccttagc ctatcaaaga attcgggacc atcatcgatt 900 tttagagcct tacctgatcg caatcaggat ttcactactc atataaatac atcgctcaaa 960 gctccaactt tgcttgttca tacaattctt gatattcaca 1000 <210> 45 <211> 1000 <212> DNA <213> Pichia pastoris <400> 45 tggttccctc tcggtccaat accaaaaata ttatcaccat acaggtctcc cttcgatacc 60 agtgcaaagt tgaaccgtgg gattaccttg gaatctacaa aaatagtgtc actcacaagt 120 ttgtcatcaa ccacgctgcc gcttgcaaag gagaactgaa catgaaggtt gttagggttt 180 gttatattgg aataagtggt ggatttgttg aaggcgaacg caccaaagct acatccgtcc 240 tgagcacact gtgaatttgt cacggaattg accaagaggt cagacgatcc tgtatcccat 300 tgagccgtta tgctttgtgg gggaaaccct atttctatcg tactaagaaa accaatggtg 360 aactcatatt cggtatcaat ggcgacgatt ccagcatagc ctgtagacag taacaacact 420 agggcaacag caactaacat atcttcattg atgaaacgtt gtgatcggtg tgacttttat 480 agtaaaagct acaactgttt gaaataccaa gatatcattg tgaatggctc aaaagggtaa 540 tacatctgaa aaacctgaag tgtggaaaat tccgatggag ccaactcatg ataacgcaga 600 agtcccattt tgccatcttc tcttggtatg aaacggtaga aaatgatccg agtatgccaa 660 ttgatactct tgattcatgc cctatagttt gcgtagggtt taattgatct cctggtctat 720 cgatctggga cgcaatgtag accccattag tggaaacact gaaagggatc caacactcta 780 ggcggacccg ctcacagtca tttcaggaca atcaccacag gaatcaacta cttctcccag 840 tcttccttgc gtgaagcttc aagcctacaa cataacactt cttacttaat ctttgattct 900 cgaattgttt acccaatctt gacaacttag cctaagcaat actctggggt tatatatagc 960 aattgctctt cctcgctgta gcgttcattc catctttcta 1000 <210> 46 <211> 1001 <212> DNA <213> Pichia pastoris <400> 46 gatatcgatc tacacttaat agtagatgac gaggcatctc tccaataggt accatatctg 60 gtgtttcttg taatttaaga atctgttggt ctatgaatgt agatttgtca tgaacaatga 120 tatatgggtc aggaggacaa gatggtttct ctgagttggg ttgttgaggt gcctggcaag 180 acttcggagc gttgatatcc ccaagacttg tagtgaccga tagttgaagc gtgtgtttgc 240 aggaacggca catcaatgca actttcgtaa ctttggaatt gagagttgat gcactgatga 300 cgatacccga aattttgacg attttaccaa tatgacttga agacaagtct ctcattgaaa 360 ccttattatc gttactaagc aaaacgagct gacaagaagg gaaggtggtc ggtatttcct 420 cgttgttcaa atatatgatt ctcctggcaa tatctgtgat ggcctgttca aaaagtggaa 480 tcatttctgc aggatcatct accaactttt tattgagctc ctcattgaat acgattaagt 540 ggtcattttg aatcgtcagt aagtacttgt ttacaagtaa attctgtctg agttgttctc 600 tgtagatgta ctgattttcc atacgaaact ccaaaatgaa cgaacggaat gccttaatga 660 cctcactgaa ctggtcatcg ttctgttctc cgggaaggac acttgtgtta aagactgatg 720 ctctatcaaa ggacattgca acaaagtata aacggttgtg agcgggaaaa agatgtgtag 780 gtaattgtcg tagatgagac tgattcagta gaaaacgcgt cctgcactat ttttttcttt 840 cttcattaca tttcctaatc gggacaaaat gaatctaaag acgtggttat gtagtacacg 900 catcgatagg ctatccccat accaaaacac tattttaccc catccttgac aggttataaa 960 tatgcgatag tatgagtatc ttcaaattca gctgaaatat c 1001 <210> 47 <211> 1000 <212> DNA <213> Pichia pastoris <400> 47 aataaaaaaa cgttatagaa agaaattgga ctacgatatg ctccaatcca aattgtcaaa 60 attgaccacc gaaaaagaac aattggaatt tgacaagagg aacaactcac tagattctca 120 aacggagcgt cacctagagt cagtttccaa gtcaattaca gaaagtttgg aaacagaaga 180 ggagtatcta caattgaatt ccaaacttaa agtcgagctg tccgaattca tgtcgctaag 240 gctttcttac ttggacccca tttttgaaag tttcattaaa gttcagtcaa aaattttcat 300 ggacatttat gacacattaa agagcggact accttatgtt gattctctat ccaaagagga 360 ttatcagtcc aagatcttgg actctagaat agataacatt ctgtcgaaaa tggaagcgct 420 gaaccttcaa gcttacattg atgattagag caatgatata aacaacaatt gagtgacagg 480 tctactttgt tctcaaaagg ccataaccat ctgtttgcat ctcttatcac cacaccatcc 540 tcctcatctg gccttcaatt gtggggaaca actagcatcc caacaccaga ctaactccac 600 ccagatgaaa ccagttgtcg cttaccagtc aatgaatgtt gagctaacgt tccttgaaac 660 tcgaatgatc ccagccttgc tgcgtatcat ccctccgcta ttccgccgct tgctccaacc 720 atgtttccgc ctttttcgaa caagttcaaa tacctatctt tggcaggact tttcctcctg 780 ccttttttag cctcaggtct cggttagcct ctaggcaaat tctggtcttc atacctatat 840 caacttttca tcagatagcc tttgggttca aaaaagaact aaagcaggat gcctgatata 900 taaatcccag atgatctgct tttgaaacta ttttcagtat cttgattcgt ttacttacaa 960 acaactattg ttgattttat ctggagaata atcgaacaaa 1000 <210> 48 <211> 1000 <212> DNA <213> Pichia pastoris <400> 48 attgttgtga atactctcct tcatttggat ttcttggact tcggactctc ttgatctctc 60 ttcgaaagtt ttaactctgt tcatgtataa ttttacccgc tgtaggtcgc tcataatacc 120 atgagtatgc acatctttta ctccattaac tttcaggtat gcaaaataca atgaagatag 180 tatatagctc aaagaattta gcattttgca ttgatctaat tgtgacattt tctctatgat 240 atcatctagc ttcttaaact cgagaatctc gtccaacgag gcagaaacat tgtccagtct 300 tacgtcaaga ttattcacga gtttctggac cgtatcaacg ttttccatct taagattaca 360 gtaagtatcg tccttttgaa ctgcaaaggt agaaaagtta atttttgatt tggtagtaca 420 ctatgaaact tgctcacccc aatctttcct cctgacaggt tgatctttat ccctctacta 480 aattgcccca agtgtatcaa gtagactaga tctcgcgaaa gaacagccta ataaactccg 540 aagcatgatg gcctctatcc ggaaaacgtt aagagatgtg gcaacaggag ggcacataga 600 atttttaaag acgctgaaga atgctatcat agtccgtaaa aatgtgatag tactttgttt 660 agtgcgtacg ccacttattc ggggccaata gctaaaccca ggtttgctgg cagcaaattc 720 aactgtagat tgaatctctc taacaataat ggtgttcaat cccctggctg gtcacgggga 780 ggactatctt gcgtgatccg cttggaaaat gttgtgtatc cctttctcaa ttgcggaaag 840 catctgctac ttcccatagg caccagttac ccaattgata tttccaaaaa agattaccat 900 atgttcatct agaagtataa atacaagtgg acattcaatg aatatttcat tcaattagtc 960 attgacactt tcatcaactt actacgtctt attcaacaat 1000 <210> 49 <211> 1000 <212> DNA <213> Pichia pastoris <400> 49 tatacggtct atccactttg gaaacgatgt agttgaaacg gggaagtaat agtggttccc 60 aaacgacatg aagaggttat ataagtttgc aagagggtga caccatttta gttgtggttc 120 ccgggtattt ttttaatctt tttagtctaa gatagcctcc ccagatatta ccgagttggg 180 ccatttgggg cggtatcggt ggtatctgat ggtagcgcgt ttttacatgc ctgtgcattg 240 aactggcaaa gagtatacta tcgtggggcc ctgaaggagg cagcaaatgg accgtcaatt 300 ggttgatcag ggactcaaga caggtattga gcttttcaaa caaaaagagt ataggcgctg 360 ctacaaggca tttacttcta ctatcaattt cattgagaat gatcccgagt tggccgccag 420 ctgtgtatct caactgatat ctctgttaga ttgtagggca gcctgtttgg aaaagctaga 480 tcaattgaat atggccttga aagatggtct taaaatgatc aagagagagt gccacaactg 540 caagggttat ttgagaactt gcaaaatttt agacctacaa gggaagatca gtgaggcttt 600 gtctacagca agagaaggga tctccataat agaaactaga agagatcagg ataatcaatt 660 tagatattcc aaggttcttt tggaacaatt aaaggaactg aaaaatgcac tgaaaatcaa 720 attggacaag aaaaatcagc tacacttcaa agttttaaag tttgacgcac cagtgccttg 780 tacaaagaaa ctaagattag tcactccaag aacaatagat ccttccattt ttttgccgat 840 agagctagtg aagctgatct ttcgcctgtt gaatttctca gacatgtatg cctgtttatt 900 ggtctcaaca aaatggaact caattatatc ctcatcaccg gaactgtttc gaaaacttca 960 gttgaaatcc caactgtcca acaaggcgtt aaacaattgt 1000 <210> 50 <211> 350 <212> PRT <213> Unknown <220> <223> Komagataella phaffii <400> 50 Met Ser Pro Thr Ile Pro Thr Thr Gln Lys Ala Val Ile Phe Glu Thr 1 5 10 15 Asn Gly Gly Pro Leu Glu Tyr Lys Asp Ile Pro Val Pro Lys Pro Lys 20 25 30 Ser Asn Glu Leu Leu Ile Asn Val Lys Tyr Ser Gly Val Cys His Thr 35 40 45 Asp Leu His Ala Trp Lys Gly Asp Trp Pro Leu Asp Asn Lys Leu Pro 50 55 60 Leu Val Gly Gly His Glu Gly Ala Gly Val Val Val Ala Tyr Gly Glu 65 70 75 80 Asn Val Thr Gly Trp Glu Ile Gly Asp Tyr Ala Gly Ile Lys Trp Leu 85 90 95 Asn Gly Ser Cys Leu Asn Cys Glu Tyr Cys Ile Gln Gly Ala Glu Ser 100 105 110 Ser Cys Ala Lys Ala Asp Leu Ser Gly Phe Thr His Asp Gly Ser Phe 115 120 125 Gln Gln Tyr Ala Thr Ala Asp Ala Thr Gln Ala Ala Arg Ile Pro Lys 130 135 140 Glu Ala Asp Leu Ala Glu Val Ala Pro Ile Leu Cys Ala Gly Ile Thr 145 150 155 160 Val Tyr Lys Ala Leu Lys Thr Ala Asp Leu Arg Ile Gly Gln Trp Val 165 170 175 Ala Ile Ser Gly Ala Gly Gly Gly Leu Gly Ser Leu Ala Val Gln Tyr 180 185 190 Ala Lys Ala Leu Gly Leu Arg Val Leu Gly Ile Asp Gly Gly Ala Asp 195 200 205 Lys Gly Glu Phe Val Lys Ser Leu Gly Ala Glu Val Phe Val Asp Phe 210 215 220 Thr Lys Thr Lys Asp Val Val Ala Glu Val Gln Lys Leu Thr Asn Gly 225 230 235 240 Gly Pro His Gly Val Ile Asn Val Ser Val Ser Pro His Ala Ile Asn 245 250 255 Gln Ser Val Gln Tyr Val Arg Thr Leu Gly Lys Val Val Leu Val Gly 260 265 270 Leu Pro Ser Gly Ala Val Val Asn Ser Asp Val Phe Trp His Val Leu 275 280 285 Lys Ser Ile Glu Ile Lys Gly Ser Tyr Val Gly Asn Arg Glu Asp Ser 290 295 300 Ala Glu Ala Ile Asp Leu Phe Thr Arg Gly Leu Val Lys Ala Pro Ile 305 310 315 320 Lys Ile Ile Gly Leu Ser Glu Leu Ala Lys Val Tyr Glu Gln Met Glu 325 330 335 Ala Gly Ala Ile Ile Gly Arg Tyr Val Val Asp Thr Ser Lys 340 345 350 <210> 51 <211> 1053 <212> DNA <213> Unknown <220> <223> Komagataella phaffii <400> 51 atgtctccaa ctatcccaac tacacaaaag gctgttatct tcgagaccaa cggcggtccc 60 ctagagtaca aggacattcc agtcccaaag ccaaagtcaa acgaactttt gatcaacgtt 120 aagtactccg gtgtctgtca cactgatttg cacgcctgga agggtgactg gccattggac 180 aacaagcttc ctttggttgg tggtcacgaa ggtgctggtg tcgttgtcgc ttacggtgag 240 aacgtcactg gatgggagat cggtgactac gctggtatca aatggttgaa cggttcttgt 300 ttgaactgtg agtactgtat ccaaggtgct gaatccagtt gtgccaaggc tgacctgtct 360 ggtttcaccc acgacggatc tttccagcag tatgctactg ctgatgccac ccaagccgcc 420 agaattccaa aggaggctga cttggctgaa gttgccccaa ttctgtgtgc tggtatcacc 480 gtttacaagg ctcttaagac cgctgacttg cgtattggcc aatgggttgc catttctggt 540 gctggtggag gactgggttc tcttgccgtt caatacgcca aggctctggg tttgagagtt 600 ttgggtattg atggtggtgc cgacaagggt gaatttgtca agtccttggg tgctgaggtc 660 ttcgtcgact tcactaagac taaggacgtc gttgctgaag tccaaaagct caccaacggt 720 ggtccacacg gtgttattaa cgtctccgtt tccccacatg ctatcaacca atctgtccaa 780 tacgttagaa ctttgggtaa ggttgttttg gttggtctgc catctggtgc cgttgtcaac 840 tctgacgttt tctggcacgt tctgaagtcc atcgagatca agggatctta cgttggaaac 900 agagaggaca gtgccgaggc catcgacttg ttcaccagag gtttggtcaa ggctcctatc 960 aagattatcg gtctgtctga acttgctaag gtctacgaac agatggaggc tggtgccatc 1020 atcggtagat acgttgtgga cacttccaaa taa 1053 <210> 52 <211> 350 <212> PRT <213> Unknown <220> <223> Komagataella pastoris <400> 52 Met Ser Pro Thr Ile Pro Ser Thr Gln Lys Ala Val Val Phe Glu Thr 1 5 10 15 Asn Gly Gly Pro Leu Glu Tyr Lys Asp Ile Pro Val Pro Lys Pro Lys 20 25 30 Ser Asn Glu Ile Leu Ile Asn Val Lys Tyr Ser Gly Val Cys His Thr 35 40 45 Asp Leu His Ala Trp Lys Gly Asp Trp Pro Leu Asp Asn Lys Leu Pro 50 55 60 Leu Val Gly Gly His Glu Gly Ala Gly Val Val Val Ala Leu Gly Glu 65 70 75 80 Asn Val Thr Gly Trp Asn Ile Gly Asp Tyr Ala Gly Ile Lys Trp Leu 85 90 95 Asn Gly Ser Cys Leu Asn Cys Glu Tyr Cys Ile Gln Gly Ala Glu Ser 100 105 110 Ser Cys Ala Lys Ala Asp Leu Ser Gly Phe Thr His Asp Gly Ser Phe 115 120 125 Gln Gln Tyr Ala Thr Ala Asp Ala Thr Gln Ala Ala Arg Ile Pro Lys 130 135 140 Glu Val Asp Leu Ala Glu Val Ala Pro Ile Leu Cys Ala Gly Ile Thr 145 150 155 160 Val Tyr Lys Ala Leu Lys Thr Ala Asp Leu Arg Ile Gly Gln Trp Val 165 170 175 Ala Ile Ser Gly Ala Gly Gly Gly Leu Gly Ser Leu Ala Val Gln Tyr 180 185 190 Ala Lys Ala Leu Gly Leu Arg Val Leu Gly Ile Asp Gly Gly Ala Asp 195 200 205 Lys Gly Glu Phe Val Lys Ser Leu Gly Ala Glu Val Tyr Val Asp Phe 210 215 220 Thr Lys Thr Lys Asp Val Val Ala Glu Val Gln Lys Ala Thr Asn Gly 225 230 235 240 Gly Pro His Gly Val Ile Asn Val Ser Val Ser Pro His Ala Ile Asn 245 250 255 Gln Ser Val Gln Tyr Ala Arg Thr Leu Gly Lys Ile Val Leu Val Gly 260 265 270 Leu Pro Ser Gly Ala Val Val Asn Ser Asp Val Phe Trp His Val Leu 275 280 285 Lys Ser Ile Glu Ile Lys Gly Ser Tyr Val Gly Asn Arg Glu Asp Ser 290 295 300 Ala Glu Ala Ile Asp Leu Phe Ala Arg Gly Leu Val Lys Ala Pro Ile 305 310 315 320 Lys Ile Ile Gly Leu Ser Glu Leu Ala Lys Val Tyr Glu Gln Met Glu 325 330 335 Ala Gly Ala Ile Ile Gly Arg Tyr Val Val Asp Thr Ser Lys 340 345 350 <210> 53 <211> 1053 <212> DNA <213> Unknown <220> <223> Komagataella pastoris <400> 53 atgtctccaa ctatcccatc tacacaaaag gctgttgtct tcgagaccaa cggcggtcct 60 ctcgagtaca aggacatccc tgtcccaaag ccaaagtcca acgaaatctt gatcaacgtt 120 aagtactccg gtgtctgtca cactgacttg cacgcctgga agggtgactg gccattggac 180 aacaagcttc ctttggtcgg tggtcacgaa ggtgctggtg tcgttgtcgc tttaggtgag 240 aacgtcactg gatggaacat cggtgactac gctggtatca aatggttgaa cggttcttgt 300 ttgaactgtg agtactgtat ccaaggtgct gaatccagtt gtgccaaggc tgacctgtct 360 ggtttcaccc acgacggatc tttccagcag tatgctactg ctgatgccac ccaagccgcc 420 agaattccaa aggaagttga cttggctgaa gttgccccaa ttttgtgtgc tggtatcacc 480 gtttacaagg ctcttaagac cgctgacttg cgtatcggcc aatgggttgc catttccggt 540 gctggtggag gattaggttc tcttgccgtt caatacgcca aggctctggg tttgagagtt 600 ttgggtattg atggtggtgc cgacaagggt gagttcgtca agtccttggg tgctgaggtc 660 tacgtcgact tcactaagac taaggacgtc gttgctgagg tccaaaaggc caccaacggt 720 ggtccacacg gtgttatcaa cgtctccgtt tccccacatg ctatcaacca atctgtccaa 780 tacgctagaa ctttgggtaa gattgttttg gttggtctgc catctggtgc cgttgtcaac 840 tctgacgttt tctggcacgt tctgaagtcc atcgagatca agggatctta cgttggaaac 900 agagaggaca gtgccgaagc catcgacttg ttcgctagag gcttagtcaa ggctcctatt 960 aagattattg gtctgtccga acttgctaag gtctacgagc agatggaggc tggtgccatc 1020 atcggtagat acgttgtgga cacttccaaa taa 1053 <210> 54 <211> 349 <212> PRT <213> Unknown <220> <223> Ogataea parapolymorpha <400> 54 Met Thr Ser Ile Pro Lys Thr Gln Lys Ala Val Val Phe Glu Thr Asn 1 5 10 15 Gly Gly Pro Leu Leu Tyr Lys Asp Ile Pro Val Pro Gln Pro Lys Pro 20 25 30 Asn Glu Ile Leu Val Asn Val Lys Tyr Ser Gly Val Cys His Thr Asp 35 40 45 Leu His Ala Trp Lys Gly Asp Trp Pro Leu Asp Thr Lys Leu Pro Leu 50 55 60 Val Gly Gly His Glu Gly Ala Gly Val Val Val Ala Lys Gly Ala Asn 65 70 75 80 Val Thr Asn Phe Glu Ile Gly Asp Tyr Ala Gly Ile Lys Trp Leu Asn 85 90 95 Gly Ser Cys Met Gly Cys Glu Phe Cys Gln Gln Gly Ala Glu Pro Asn 100 105 110 Cys Pro Glu Ala Asp Leu Ser Gly Tyr Thr His Asp Gly Ser Phe Gln 115 120 125 Gln Tyr Ala Thr Ala Asp Ala Val Gln Ala Ala Lys Ile Pro Lys Gly 130 135 140 Thr Asn Leu Ala Asp Val Ala Pro Ile Leu Cys Ala Gly Val Thr Val 145 150 155 160 Tyr Lys Ala Leu Lys Thr Ala Glu Leu Ser Pro Gly Gln Trp Val Ala 165 170 175 Ile Ser Gly Ala Gly Gly Gly Leu Gly Ser Leu Ala Val Gln Tyr Ala 180 185 190 Val Ala Met Gly Leu Arg Val Leu Gly Ile Asp Gly Gly Asp Glu Lys 195 200 205 Ala Lys Leu Phe Glu Ser Leu Gly Gly Glu Val Phe Ile Asp Phe Thr 210 215 220 Lys Glu Lys Asp Ile Val Gly Ala Val Gln Lys Ala Thr Asn Gly Gly 225 230 235 240 Pro His Gly Val Ile Asn Val Ser Val Ser Pro Ala Ala Ile Ser Gln 245 250 255 Ser Cys Gln Tyr Val Arg Thr Leu Gly Lys Val Val Leu Val Gly Leu 260 265 270 Pro Ala Gly Ala Val Cys Glu Ser Pro Val Phe Glu His Val Ile Lys 275 280 285 Ser Ile Gln Ile Arg Gly Ser Tyr Val Gly Asn Arg Gln Asp Thr Ala 290 295 300 Glu Ser Ile Asp Phe Phe Val Arg Gly Lys Val Lys Ala Pro Ile Lys 305 310 315 320 Val Val Gly Leu Ser Glu Leu Pro Lys Val Phe Glu Leu Met Glu Gln 325 330 335 Gly Lys Ile Ala Gly Arg Tyr Val Leu Asp Thr Ser Lys 340 345 <210> 55 <211> 1050 <212> DNA <213> Unknown <220> <223> Ogataea parapolymorpha <400> 55 atgacttcca ttccaaagac tcaaaaggcc gttgttttcg agaccaacgg tggtcctctt 60 ctctacaagg acatccctgt tccacaacca aagccaaatg agattcttgt caacgtcaag 120 tactccggtg tttgccacac cgatctccac gcttggaagg gtgactggcc attggacacc 180 aaacttccac tggtcggtgg tcacgagggt gctggtgttg ttgttgctaa gggtgccaac 240 gttaccaact ttgaaatcgg tgactacgct ggtatcaaat ggttgaacgg ctcgtgcatg 300 ggttgtgagt tctgtcaaca aggtgcagag ccaaactgtc ctgaggccga cctttccggt 360 tacacgcacg acggttcttt ccaacaatac gccactgctg atgctgtcca ggctgccaag 420 attccaaagg gaactaacct ggctgacgtt gctccaattc tctgtgctgg tgtcactgtg 480 tacaaggcat tgaagactgc cgaattgagc ccaggccaat gggttgctat ctctggtgct 540 ggtggaggat tgggttctct tgccgttcaa tacgctgtcg ccatgggcct gagagtcctg 600 ggtatcgatg gtggtgacga aaaggctaag ctcttcgaga gcttgggcgg agaagtcttc 660 atcgatttca ccaaggaaaa ggacattgtc ggagccgtcc agaaggcaac caacggtggt 720 ccacacggtg ttatcaacgt ttctgtgtct ccagcagcta tctctcaatc ctgccaatac 780 gtgagaactc ttggtaaggt tgttcttgtt ggtcttccag ccggtgctgt ttgcgagtct 840 ccagttttcg agcacgttat caagtctatc cagattagag gttcctacgt tggtaacaga 900 caggacactg ccgagtcgat tgacttcttc gtcagaggca aggttaaggc tccaatcaag 960 gttgttggcc tttctgagct gccaaaggtg ttcgagttga tggagcaagg aaagattgct 1020 ggaagatacg ttcttgacac ttccaaatag 1050 <210> 56 <211> 382 <212> PRT <213> Unknown <220> <223> Ogataea parapolymorpha <400> 56 Met Met Ser Ile Ser Arg Val Ala Ala Leu Arg Asn Gln Phe Ala Arg 1 5 10 15 Leu Ala Lys Pro Ala Val Val Gln Gln Val Phe Arg His Ser Thr Ala 20 25 30 Ser Ala Pro Thr Ile Pro Lys Thr Gln Met Gly Cys Val Phe Glu Thr 35 40 45 Asn Gly Gly Pro Ile Glu Tyr Lys Glu Ile Pro Val Pro Lys Pro Lys 50 55 60 Pro Asn Glu Ile Leu Val His Val Lys Tyr Ser Gly Val Cys His Thr 65 70 75 80 Asp Leu His Ala Trp Lys Gly Asp Trp Pro Leu Pro Val Lys Leu Pro 85 90 95 Leu Val Gly Gly His Glu Gly Ala Gly Val Val Val Ala Lys Gly Glu 100 105 110 Asn Val Lys Asn Phe Glu Ile Gly Asp Leu Ala Gly Ile Lys Trp Leu 115 120 125 Asn Gly Ser Cys Met Gly Cys Glu Phe Cys Gln Gln Gly Ala Glu Pro 130 135 140 Asn Cys Pro Asp Ala Asp Leu Ser Gly Tyr Thr His Asp Gly Ser Phe 145 150 155 160 Gln Gln Tyr Ala Thr Ala Asp Ala Val Gln Ala Ala Lys Leu Pro Pro 165 170 175 Gly Thr Asp Leu Ala Ala Val Ala Pro Ile Leu Cys Ala Gly Val Thr 180 185 190 Val Tyr Lys Ala Leu Lys Thr Ala Ala Leu Arg Pro Gly Gln Ile Val 195 200 205 Ala Ile Ser Gly Ala Ala Gly Gly Leu Gly Ser Leu Ala Val Gln Tyr 210 215 220 Ala Val Ala Met Gly Leu Arg Val Leu Gly Ile Asp Gly Gly Glu Gln 225 230 235 240 Lys Gly Glu Phe Ile Lys Lys Leu Gly Ala Glu Phe Tyr Val Asp Phe 245 250 255 Thr Lys Glu Lys Asp Ile Val Ser Ala Ile Gln Lys Ile Thr Asn Gly 260 265 270 Gly Pro His Gly Val Ile Asn Val Ser Val Ser Pro Ala Ala Ile Ser 275 280 285 Gln Ser Cys Gln Tyr Val Arg Thr Leu Gly Lys Val Val Leu Val Gly 290 295 300 Leu Pro Ala Gly Ala Val Cys Glu Ser Pro Val Phe Glu His Val Val 305 310 315 320 Lys Ser Ile Gln Ile Lys Gly Ser Tyr Val Gly Asn Arg Gln Asp Thr 325 330 335 Ala Glu Ala Val Asp Phe Phe Thr Arg Gly Leu Val Lys Ser Pro Phe 340 345 350 Gln Ile Ala Gly Leu Ser Glu Leu Pro Glu Val Phe Lys Lys Met Glu 355 360 365 Glu Gly Lys Ile Leu Gly Arg Tyr Val Leu Asp Thr Ser Lys 370 375 380 <210> 57 <211> 1149 <212> DNA <213> Unknown <220> <223> Ogataea parapolymorpha <400> 57 atgatgtcta tttcgagagt tgctgctttg agaaaccaat ttgctcggct agccaagccc 60 gctgttgtcc agcaggtctt cagacactct actgcctctg ctccaaccat cccaaagacc 120 cagatgggat gtgtttttga aaccaacggt ggtccaattg agtacaagga gatccctgtt 180 ccaaagccaa agcctaacga gattttggtc cacgtcaagt actctggtgt gtgccacact 240 gacttgcacg cctggaaggg tgactggcca ctgcctgtca aactcccact tgtgggtggt 300 cacgagggtg ccggtgttgt cgttgccaag ggtgagaacg ttaaaaactt cgagatcggc 360 gacttggccg gtatcaagtg gctgaacggc tcgtgtatgg gttgtgagtt ctgtcaacag 420 ggtgccgaac caaactgtcc agacgctgac ctgtccggtt acacgcacga cggttctttc 480 caacaatacg ccactgctga cgctgtccag gccgctaagc tgcctcctgg aactgacctc 540 gctgctgttg ctcctatttt gtgtgctggt gtcactgttt acaaggcctt gaagactgct 600 gctctgcgtc caggacagat cgttgccatt tccggtgccg ccggtggatt gggttctctt 660 gccgttcaat acgctgtcgc catgggcctg agagttctgg gtattgacgg tggtgagcaa 720 aagggcgagt tcatcaagaa gctcggtgcc gaattctacg tcgacttcac caaggagaag 780 gacattgtgt ctgccatcca gaagatcacc aacggcggtc cacacggtgt catcaacgtt 840 tctgtctctc cagctgctat ctcccagtct tgtcaatacg tgagaaccct cggtaaggtt 900 gttctggtcg gtcttccagc cggcgctgtt tgcgagtctc ctgtctttga gcacgtcgtc 960 aagtccatcc agatcaaggg atcttacgtt ggtaacagac aagacactgc cgaggccgtg 1020 gacttcttca ccagaggcct tgtcaagtct ccattccaga ttgctggtct ttccgagctg 1080 ccagaggtct tcaagaagat ggaggagggc aagatcttgg gcagatacgt ccttgacact 1140 tctaaatag 1149 <210> 58 <211> 349 <212> PRT <213> Unknown <220> <223> Ogataea polymorpha <400> 58 Met Pro Ser Ile Pro Lys Thr Gln Lys Ala Ile Val Phe Glu Thr Asn 1 5 10 15 Gly Gly Pro Leu Leu Tyr Lys Asp Ile Pro Val Pro Gln Pro Lys Pro 20 25 30 Asn Glu Ile Leu Val Asn Val Lys Tyr Ser Gly Val Cys His Thr Asp 35 40 45 Leu His Ala Trp Lys Gly Asp Trp Pro Leu Ala Thr Lys Leu Pro Leu 50 55 60 Val Gly Gly His Glu Gly Ala Gly Val Val Val Ala Lys Gly Ala Asn 65 70 75 80 Val Thr Asn Phe Glu Ile Gly Asp Tyr Ala Gly Ile Lys Trp Leu Asn 85 90 95 Gly Ser Cys Met Gly Cys Glu Phe Cys Gln Gln Gly Ala Glu Pro Asn 100 105 110 Cys Pro Asp Ala Asp Leu Ser Gly Tyr Thr His Asp Gly Ser Phe Gln 115 120 125 Gln Tyr Ala Thr Ala Asp Ala Val Gln Ala Ala Lys Ile Pro Lys Gly 130 135 140 Thr Asn Leu Ala Asp Val Ala Pro Ile Leu Cys Ala Gly Val Thr Val 145 150 155 160 Tyr Lys Ala Leu Lys Thr Ala Glu Leu Ser Pro Gly Gln Trp Val Ala 165 170 175 Ile Ser Gly Ala Gly Gly Gly Leu Gly Ser Leu Ala Val Gln Tyr Ala 180 185 190 Val Ala Met Gly Leu Arg Val Leu Gly Ile Asp Gly Gly Asp Glu Lys 195 200 205 Ala Lys Leu Phe Glu Ser Leu Gly Gly Glu Val Phe Ile Asp Phe Thr 210 215 220 Lys Glu Lys Asp Ile Val Gly Ala Val Gln Lys Ala Thr Asn Gly Gly 225 230 235 240 Pro His Gly Val Ile Asn Val Ser Val Ser Pro Ala Ala Ile Ser Gln 245 250 255 Ser Cys Gln Tyr Val Arg Thr Leu Gly Lys Val Val Leu Val Gly Leu 260 265 270 Pro Ala Gly Ala Val Cys Glu Ser Pro Val Phe Glu His Val Ile Lys 275 280 285 Ser Ile Gln Ile Arg Gly Ser Tyr Val Gly Asn Arg Gln Asp Thr Ala 290 295 300 Glu Ser Ile Asp Phe Phe Val Arg Gly Lys Val Lys Ala Pro Ile Lys 305 310 315 320 Val Val Gly Leu Ser Glu Leu Pro Lys Val Phe Glu Leu Met Glu Gln 325 330 335 Gly Lys Ile Ala Gly Arg Tyr Val Leu Asp Thr Ser Lys 340 345 <210> 59 <211> 1050 <212> DNA <213> Unknown <220> <223> Ogataea polymorpha <400> 59 atgccttcca ttccaaagac tcaaaaggcc attgttttcg aaaccaacgg tggtcctctt 60 ctatacaagg acatccctgt tccacagcca aagccaaatg aaatccttgt caacgtcaag 120 tactctggtg tgtgccacac cgacttgcac gcctggaagg gtgactggcc attggccacc 180 aaacttccac tggtcggtgg tcacgagggt gctggtgttg ttgttgccaa gggtgccaac 240 gttaccaact ttgagatcgg cgactacgct ggtatcaaat ggctgaacgg ctcgtgtatg 300 ggttgtgagt tctgtcaaca aggtgcagaa ccaaactgtc cagacgccga cctttccggt 360 tacacgcacg acggttcctt ccaacaatac gccactgctg atgctgtcca ggctgccaag 420 attccaaagg gaactaacct ggccgatgtt gctccaattc tctgtgctgg tgtcactgtg 480 tacaaggcat tgaagactgc cgaattgagc ccaggccagt gggtcgctat ctctggtgct 540 ggtggaggat tgggttctct tgccgttcaa tacgctgtcg ctatgggcct gagagttctg 600 ggtatcgatg gtggtgacga aaaggccaag ctcttcgaga gcttgggcgg agaagtcttc 660 atcgatttca caaaggaaaa ggacattgtc ggagccgtcc agaaggctac caacggtggt 720 ccacacggtg tcatcaacgt ttccgtgtct ccagcagcta tctctcaatc ctgccaatac 780 gtgagaactc ttggtaaggt tgttcttgtt ggtcttccag caggtgctgt ttgcgagtct 840 ccagttttcg agcacgttat caagtctatc cagattagag gttcctacgt tggtaacaga 900 caggacactg cggagtcgat cgacttcttc gtcagaggca aggttaaggc tccaatcaag 960 gttgttggtc tttctgagct gccaaaagtg ttcgagttga tggagcaagg aaagattgca 1020 ggaagatacg tcctcgacac ttccaaatag 1050 <210> 60 <211> 381 <212> PRT <213> Unknown <220> <223> Ogataea polymorpha <400> 60 Met Ser Ile Ser Arg Val Ala Ala Leu Arg Asn Gln Phe Ala Arg Leu 1 5 10 15 Ala Lys Pro Ala Val Val Gln Gln Val Phe Arg His Ser Thr Ala Ser 20 25 30 Ala Pro Thr Ile Pro Lys Thr Gln Met Gly Cys Val Phe Glu Thr Asn 35 40 45 Gly Gly Pro Ile Glu Tyr Lys Glu Ile Pro Val Pro Lys Pro Lys Pro 50 55 60 Asn Glu Ile Leu Val His Val Lys Tyr Ser Gly Val Cys His Thr Asp 65 70 75 80 Leu His Ala Trp Lys Gly Asp Trp Pro Leu Pro Val Lys Leu Pro Leu 85 90 95 Val Gly Gly His Glu Gly Ala Gly Val Val Val Ala Lys Gly Glu Asn 100 105 110 Val Lys Asn Phe Glu Ile Gly Asp Leu Ala Gly Ile Lys Trp Leu Asn 115 120 125 Gly Ser Cys Met Gly Cys Glu Phe Cys Gln Gln Gly Ala Glu Pro Asn 130 135 140 Cys Pro Asp Ala Asp Leu Ser Gly Tyr Thr His Asp Gly Ser Phe Gln 145 150 155 160 Gln Tyr Ala Thr Ala Asp Ala Val Gln Ala Ala Lys Leu Pro Pro Gly 165 170 175 Thr Asp Leu Ala Ala Val Ala Pro Ile Leu Cys Ala Gly Val Thr Val 180 185 190 Tyr Lys Ala Leu Lys Thr Ala Ala Leu Arg Pro Gly Gln Ile Val Ala 195 200 205 Ile Ser Gly Ala Ala Gly Gly Leu Gly Ser Leu Ala Val Gln Tyr Ala 210 215 220 Val Ala Met Gly Leu Arg Val Leu Gly Ile Asp Gly Gly Glu Gln Lys 225 230 235 240 Gly Glu Phe Ile Lys Lys Leu Gly Ala Glu Phe Tyr Val Asp Phe Thr 245 250 255 Lys Glu Lys Asp Ile Val Ser Ala Ile Gln Lys Val Thr Asn Gly Gly 260 265 270 Pro His Gly Val Ile Asn Val Ser Val Ser Pro Ala Ala Ile Ser Gln 275 280 285 Ser Cys Gln Tyr Val Arg Thr Leu Gly Lys Val Val Leu Val Gly Leu 290 295 300 Pro Ala Gly Ala Val Cys Glu Ser Pro Val Phe Glu His Val Val Lys 305 310 315 320 Ser Ile Gln Ile Lys Gly Ser Tyr Val Gly Asn Arg Gln Asp Thr Ala 325 330 335 Glu Ala Val Asp Phe Phe Thr Arg Gly Leu Val Arg Ser Pro Phe Gln 340 345 350 Ile Ala Gly Leu Ser Glu Leu Pro Glu Val Phe Lys Lys Met Glu Glu 355 360 365 Gly Lys Ile Leu Gly Arg Tyr Val Leu Asp Thr Ser Lys 370 375 380 <210> 61 <211> 1146 <212> DNA <213> Unknown <220> <223> Ogataea polymorpha <400> 61 atgtctattt cgagagttgc tgcattgaga aaccaatttg ctcgtctagc caagccggct 60 gtagtccagc aggtcttcag acactccact gcctctgctc caaccatccc aaagacccag 120 atgggatgtg tttttgaaac caacggcggt ccaattgagt acaaggagat cccagttcca 180 aagccaaagc caaacgagat tctggtccac gtcaagtact ctggtgtgtg ccacaccgac 240 ttgcacgcct ggaagggtga ctggccactg cctgtcaaac tcccacttgt gggtggtcac 300 gagggtgccg gtgttgtcgt tgccaagggt gagaacgtta aaaacttcga gatcggcgac 360 ttggccggta tcaaatggct gaacggctcg tgtatgggtt gtgagttctg tcaacagggt 420 gccgaaccaa actgtcctga cgccgacctt tccggttaca cacacgacgg ttctttccaa 480 caatacgcca ctgctgacgc tgtccaggcc gctaagctgc ctccaggaac tgacctcgct 540 gctgttgctc caattttgtg tgctggtgtg actgtttaca aggccttgaa gactgctgct 600 ttgcgtccag gtcagattgt tgctatttcc ggtgccgccg gtggattggg ttctcttgcc 660 gttcaatacg ctgtcgccat gggtctgaga gttctgggta ttgacggtgg tgagcagaag 720 ggcgagttca tcaagaagct cggtgccgaa ttctacgtcg acttcaccaa ggagaaggac 780 attgtgtctg ccatccagaa ggtcaccaat ggcggtccac acggtgtcat caacgtgtct 840 gtgtctccag ctgctatctc ccagtcttgt caatacgtga gaaccctcgg taaggttgtt 900 ctggttggtc ttccagccgg cgctgtttgc gaatctcctg tctttgagca cgtcgtcaag 960 tccatccaga tcaagggatc ttatgttggt aacagacaag acactgccga ggccgtggac 1020 ttcttcacca gaggccttgt ccgttctcca ttccaaattg ccggtctttc cgagctgcct 1080 gaggtcttca agaagatgga ggagggcaag atcttgggta gatatgtcct tgacacttct 1140 aaataa 1146 <210> 62 <211> 348 <212> PRT <213> Saccharomyces cerevisiae <400> 62 Met Ser Ile Pro Glu Thr Gln Lys Ala Ile Ile Phe Tyr Glu Ser Asn 1 5 10 15 Gly Lys Leu Glu Tyr Lys Asp Ile Pro Val Pro Lys Pro Lys Ala Asn 20 25 30 Glu Leu Leu Ile Asn Val Lys Tyr Ser Gly Val Cys His Thr Asp Leu 35 40 45 His Ala Trp His Gly Asp Trp Pro Leu Pro Val Lys Leu Pro Leu Val 50 55 60 Gly Gly His Glu Gly Ala Gly Val Val Val Gly Met Gly Glu Asn Val 65 70 75 80 Lys Gly Trp Lys Ile Gly Asp Tyr Ala Gly Ile Lys Trp Leu Asn Gly 85 90 95 Ser Cys Met Ala Cys Glu Tyr Cys Glu Leu Gly Asn Glu Ser Asn Cys 100 105 110 Pro His Ala Asp Leu Ser Gly Tyr Thr His Asp Gly Ser Phe Gln Gln 115 120 125 Tyr Ala Thr Ala Asp Ala Val Gln Ala Ala His Ile Pro Gln Gly Thr 130 135 140 Asp Leu Ala Glu Val Ala Pro Val Leu Cys Ala Gly Ile Thr Val Tyr 145 150 155 160 Lys Ala Leu Lys Ser Ala Asn Leu Arg Ala Gly His Trp Val Ala Ile 165 170 175 Ser Gly Ala Ala Gly Gly Leu Gly Ser Leu Ala Val Gln Tyr Ala Lys 180 185 190 Ala Met Gly Tyr Arg Val Leu Gly Ile Asp Gly Gly Pro Gly Lys Glu 195 200 205 Glu Leu Phe Thr Ser Leu Gly Gly Glu Val Phe Ile Asp Phe Thr Lys 210 215 220 Glu Lys Asp Ile Val Ser Ala Val Val Lys Ala Thr Asn Gly Gly Ala 225 230 235 240 His Gly Ile Ile Asn Val Ser Val Ser Glu Ala Ala Ile Glu Ala Ser 245 250 255 Thr Arg Tyr Cys Arg Ala Asn Gly Thr Val Val Leu Val Gly Leu Pro 260 265 270 Ala Gly Ala Lys Cys Ser Ser Asp Val Phe Asn His Val Val Lys Ser 275 280 285 Ile Ser Ile Val Gly Ser Tyr Val Gly Asn Arg Ala Asp Thr Arg Glu 290 295 300 Ala Leu Asp Phe Phe Ala Arg Gly Leu Val Lys Ser Pro Ile Lys Val 305 310 315 320 Val Gly Leu Ser Ser Leu Pro Glu Ile Tyr Glu Lys Met Glu Lys Gly 325 330 335 Gln Ile Ala Gly Arg Tyr Val Val Asp Thr Ser Lys 340 345 <210> 63 <211> 1047 <212> DNA <213> Saccharomyces cerevisiae <400> 63 atgtctattc cagaaactca aaaagccatt atcttctacg agtccaacgg taagttggaa 60 tacaaagata ttccagttcc aaagccaaag gccaacgaat tgttgatcaa cgttaaatac 120 tctggtgtct gtcacactga cttgcacgct tggcacggtg actggccatt gccagttaag 180 ctaccattag tcggtggtca cgaaggtgcc ggtgtcgttg tcggcatggg tgaaaacgtt 240 aagggctgga agatcggtga ctacgccggt atcaaatggt tgaacggttc ttgtatggcc 300 tgtgaatact gtgaattggg taacgaatcc aactgtcctc acgctgactt gtctggttac 360 acccacgacg gttctttcca acaatacgct accgctgacg ctgttcaagc cgctcacatt 420 cctcaaggta ctgacttggc tgaagtcgcc ccagttttgt gtgctggtat caccgtctac 480 aaggctttga agtctgccaa cttgagagca ggccactggg tggccatttc tggtgctgct 540 ggtggtctag gttctttggc tgttcaatat gctaaggcga tgggttacag agtcttaggt 600 attgatggtg gtccaggaaa ggaagaattg tttacctcgc tcggtggtga agtattcatc 660 gacttcacca aagagaagga cattgttagc gcagtcgtta aggctaccaa cggcggtgcc 720 cacggtatca tcaatgtttc cgtttccgaa gccgctatcg aagcttctac cagatactgt 780 agggcgaacg gtactgttgt cttggttggt ttgccagccg gtgcaaagtg ctcctctgat 840 gtcttcaacc acgttgtcaa gtctatctcc attgtcggct cttacgtggg gaacagagct 900 gataccagag aagccttaga tttctttgcc agaggtctag tcaagtctcc aataaaggta 960 gttggcttat ccagtttacc agaaatttac gaaaagatgg agaagggcca aattgctggt 1020 agatacgttg ttgacacttc taaataa 1047 <210> 64 <211> 349 <212> PRT <213> Candida maltosa <400> 64 Met Ser Ser Ile Pro Thr Thr Gln Lys Ala Ile Ile Phe Glu Thr Asn 1 5 10 15 Gly Gly Lys Leu Glu Tyr Lys Asp Ile Pro Val Pro Lys Pro Lys Pro 20 25 30 Asn Glu Leu Leu Ile Asn Val Lys Tyr Ser Gly Val Cys His Thr Asp 35 40 45 Leu His Ala Trp Lys Gly Asp Trp Pro Leu Ala Thr Lys Leu Pro Leu 50 55 60 Val Gly Gly His Glu Gly Ala Gly Val Val Val Ala Ile Gly Asp Asn 65 70 75 80 Val Lys Asn Trp Lys Val Gly Asp Phe Ala Gly Val Lys Trp Leu Asn 85 90 95 Gly Ser Cys Leu Asn Cys Glu Tyr Cys Gln Gln Gly Ala Glu Pro Asn 100 105 110 Cys Ala Gln Ala Asp Leu Ser Gly Tyr Thr His Asp Gly Ser Phe Gln 115 120 125 Gln Tyr Ala Thr Ala Asp Ala Val Gln Ala Ala Arg Ile Pro Ala Gly 130 135 140 Thr Asp Leu Ala Thr Val Ala Pro Ile Leu Cys Ala Gly Val Thr Val 145 150 155 160 Tyr Lys Ala Leu Lys Thr Ala Asn Leu Gln Pro Gly Gln Trp Val Ala 165 170 175 Ile Ser Gly Ala Ala Gly Gly Leu Gly Ser Leu Ala Val Gln Tyr Ala 180 185 190 Lys Ala Met Gly Tyr Arg Val Leu Ala Ile Asp Gly Gly Glu Asp Lys 195 200 205 Gly Gln Phe Val Lys Ser Leu Gly Ala Glu Thr Phe Ile Asp Phe Thr 210 215 220 Lys Glu Lys Asp Val Val Gly Ala Val Gln Lys Ala Thr Asn Gly Gly 225 230 235 240 Pro His Gly Val Ile Asn Val Ser Val Ser Asp Arg Ala Ile Asn Gln 245 250 255 Ser Val Glu Tyr Val Arg Thr Leu Gly Lys Val Val Leu Val Gly Leu 260 265 270 Pro Ala Gly Ala Lys Val Thr Ala Pro Val Phe Asp Ser Val Val Lys 275 280 285 Ser Ile Glu Ile Lys Gly Ser Tyr Val Gly Asn Arg Lys Asp Thr Ala 290 295 300 Glu Ala Val Asp Phe Phe Ser Arg Gly Leu Ile Lys Cys Pro Ile Lys 305 310 315 320 Ile Val Gly Leu Ser Glu Leu Pro Glu Val Tyr Lys Leu Met Glu Glu 325 330 335 Gly Lys Ile Leu Gly Arg Tyr Val Leu Asp Thr Ser Lys 340 345 <210> 65 <211> 1050 <212> DNA <213> Candida maltosa <400> 65 atgtcttcta ttccaactac tcaaaaagct attatcttcg aaaccaacgg cggtaaatta 60 gaatacaaag atatcccagt cccaaaacca aaaccaaatg aattgttgat caatgttaaa 120 tactccggtg tttgtcacac tgatttgcac gcttggaaag gtgattggcc attagccacc 180 aaattaccat tggtcggtgg tcacgaaggt gctggtgttg tcgttgctat tggtgacaat 240 gtcaagaact ggaaagttgg tgatttcgcc ggtgtcaaat ggttgaatgg ttcttgtttg 300 aactgtgaat actgtcaaca aggtgctgaa ccaaactgtg ctcaagctga cttgtccggt 360 tacacccacg atggttcttt ccaacaatac gccactgccg atgcagttca agcggctaga 420 attccagctg gtactgattt agccaccgtt gctccaatct tgtgtgctgg tgttaccgtt 480 tacaaggctt tgaagactgc caacttacaa ccaggtcaat gggttgccat ttccggtgcc 540 gctggtggtt taggttcttt ggctgttcaa tacgctaaag ctatgggtta cagagtcttg 600 gccattgacg gtggtgaaga taaaggtcaa tttgttaaat ctttgggtgc tgaaactttt 660 atcgatttta ccaaagaaaa ggatgttgtt ggtgctgtcc aaaaagctac caacggtggt 720 ccacatggtg tcattaacgt ctctgtttcc gacagagcta tcaaccaatc cgttgaatac 780 gttagaactt taggtaaagt tgttttggtt ggtttaccag ctggtgctaa agtcactgct 840 ccagtctttg actccgtcgt taaatccatt gaaattaaag gttcttatgt tggtaacaga 900 aaagacactg ccgaagccgt tgatttcttc tctagaggtt tgattaaatg tccaatcaag 960 attgttggtt tatctgaatt accagaagtt tacaaattga tggaagaagg taaaatcttg 1020 ggtagatacg ttttggacac ctccaaataa 1050 <210> 66 <211> 379 <212> PRT <213> Kluyveromyces marxianus <400> 66 Met Phe Arg Leu Ala Arg Ala Gln Thr Ser Ile Thr Thr Thr Ser Lys 1 5 10 15 Ala Leu Gly Gly Ser Arg Arg Leu Phe Val Arg Leu Asn Ser Ser Phe 20 25 30 Ala Ile Pro Glu Ser Gln Lys Gly Val Ile Phe Tyr Glu Asn Gly Gly 35 40 45 Lys Leu Glu Tyr Lys Asp Leu Pro Val Pro Lys Pro Lys Pro Asn Glu 50 55 60 Ile Leu Ile Asn Val Lys Tyr Ser Gly Val Cys His Thr Asp Leu His 65 70 75 80 Ala Trp Lys Gly Asp Trp Pro Leu Pro Val Lys Leu Pro Leu Val Gly 85 90 95 Gly His Glu Gly Ala Gly Val Val Val Ala Lys Gly Glu Asn Val Thr 100 105 110 Asn Phe Glu Ile Gly Asp Tyr Ala Gly Ile Lys Trp Leu Asn Gly Ser 115 120 125 Cys Met Ser Cys Glu Leu Cys Glu Gln Gly Tyr Glu Ser Asn Cys Leu 130 135 140 Gln Ala Asp Leu Ser Gly Tyr Thr His Asp Gly Ser Phe Gln Gln Tyr 145 150 155 160 Ala Thr Ala Asp Ala Val Gln Ala Ala Gln Ile Pro Lys Gly Thr Asp 165 170 175 Leu Ala Glu Ile Ala Pro Ile Leu Cys Ala Gly Val Thr Val Tyr Lys 180 185 190 Ala Leu Lys Thr Ala Asp Leu Gln Pro Gly Gln Trp Ile Ala Ile Ser 195 200 205 Gly Ala Ala Gly Gly Leu Gly Ser Leu Ala Val Gln Tyr Ala Lys Ala 210 215 220 Met Gly Leu Arg Val Leu Gly Ile Asp Gly Gly Pro Gly Lys Glu Glu 225 230 235 240 Leu Phe Lys Ser Leu Gly Gly Glu Val Phe Ile Asp Phe Thr Lys Ser 245 250 255 Lys Asp Met Val Ala Asp Ile Gln Glu Ala Thr Asn Gly Gly Pro His 260 265 270 Gly Val Ile Asn Val Ser Val Ser Glu Ala Ala Ile Ser Met Ser Thr 275 280 285 Glu Tyr Val Arg Pro Thr Gly Val Val Val Leu Val Gly Leu Pro Ala 290 295 300 His Ala Tyr Val Lys Ser Glu Val Phe Ser His Val Val Lys Ser Ile 305 310 315 320 Ser Ile Lys Gly Ser Tyr Val Gly Asn Arg Ala Asp Thr Arg Glu Ala 325 330 335 Ile Asp Phe Phe Thr Arg Gly Leu Val Lys Ser Pro Ile Lys Val Val 340 345 350 Gly Leu Ser Glu Leu Pro Lys Val Tyr Glu Leu Met Glu Ala Gly Lys 355 360 365 Ile Leu Gly Arg Tyr Val Val Asp Thr Ser Lys 370 375 <210> 67 <211> 1140 <212> DNA <213> Kluyveromyces marxianus <400> 67 atgttcagac tagcacgcgc tcagaccagc attaccacca ctagcaaggc tctaggtggc 60 tccagaagac tattcgtcag actaaactcc tctttcgcca tcccagaatc ccaaaagggt 120 gtgattttct acgaaaacgg cggtaagttg gaatacaagg accttccagt tccaaagcca 180 aagccaaatg aaatcttgat caacgtcaag tactccggtg tgtgtcacac tgatttgcac 240 gcctggaagg gtgactggcc attgccagtt aagttgcctt tggtcggtgg tcacgaaggt 300 gccggtgtcg tcgttgccaa gggtgaaaac gttaccaact tcgagatcgg tgactacgca 360 ggtatcaagt ggttgaacgg ttcttgtatg tcttgtgaac tctgtgaaca aggttacgaa 420 tccaactgtt tgcaagctga cttgtctggt tacacccacg acggttcctt ccaacaatat 480 gccactgctg acgctgttca agctgcccaa attccaaagg gtaccgattt ggctgaaatc 540 gccccaatct tgtgtgccgg tgtcaccgtc tacaaggctc taaagaccgc tgacttgcaa 600 ccaggtcaat ggatcgctat ctccggtgct gccggtggtc ttggttccct agccgtgcaa 660 tacgccaagg caatgggtct aagagttcta ggtatcgacg gtggtccagg taaggaagaa 720 ttgttcaaga gcttgggtgg tgaagtcttc attgacttca caaagtccaa ggacatggtc 780 gcagacatcc aggaagccac caacggtggt cctcacggtg tgatcaacgt ctccgtctcc 840 gaggccgcta tctccatgtc caccgagtac gtcagaccaa ccggtgtggt cgttctagtc 900 ggtttgccag cccacgctta cgtcaagtcc gaagtcttct cccacgtcgt caagtctatc 960 tctattaagg gttcttacgt cggtaacaga gcagacacca gagaagctat tgacttcttc 1020 accagaggtt tggtcaagtc tccaatcaag gttgttggtt tgtctgaatt gccaaaggtt 1080 tatgaattga tggaagctgg taagatcttg ggtagatacg tcgttgacac ttccaaataa 1140 1140 <210> 68 <211> 350 <212> PRT <213> Escherichia coli <400> 68 Met Ser Glu Gln Ile Pro Lys Thr Gln Lys Ala Val Val Phe Asp Thr 1 5 10 15 Asn Gly Gly Gln Leu Val Tyr Lys Asp Tyr Pro Val Pro Thr Pro Lys 20 25 30 Pro Asn Glu Leu Leu Ile Asn Val Lys Tyr Ser Gly Val Cys His Thr 35 40 45 Asp Leu His Ala Trp Lys Gly Asp Trp Pro Leu Ala Thr Lys Leu Pro 50 55 60 Leu Val Gly Gly His Glu Gly Ala Gly Val Val Val Gly Met Gly Glu 65 70 75 80 Asn Val Lys Gly Trp Lys Ile Gly Asp Phe Ala Gly Ile Lys Trp Leu 85 90 95 Asn Gly Ser Cys Met Ser Cys Glu Phe Cys Gln Gln Gly Ala Glu Pro 100 105 110 Asn Cys Gly Glu Ala Asp Leu Ser Gly Tyr Thr His Asp Gly Ser Phe 115 120 125 Glu Gln Tyr Ala Thr Ala Asp Ala Val Gln Ala Ala Lys Ile Pro Ala 130 135 140 Gly Thr Asp Leu Ala Asn Val Ala Pro Ile Leu Cys Ala Gly Val Thr 145 150 155 160 Val Tyr Lys Ala Leu Lys Thr Ala Asp Leu Ala Ala Gly Gln Trp Val 165 170 175 Ala Ile Ser Gly Ala Gly Gly Gly Leu Gly Ser Leu Ala Val Gln Tyr 180 185 190 Ala Arg Ala Met Gly Leu Arg Val Val Ala Ile Asp Gly Gly Asp Glu 195 200 205 Lys Gly Glu Phe Val Lys Ser Leu Gly Ala Glu Ala Tyr Val Asp Phe 210 215 220 Thr Lys Asp Lys Asp Ile Val Glu Ala Val Lys Lys Ala Thr Asp Gly 225 230 235 240 Gly Pro His Gly Ala Ile Asn Val Ser Val Ser Glu Lys Ala Ile Asp 245 250 255 Gln Ser Val Glu Tyr Val Arg Pro Leu Gly Lys Val Val Leu Val Gly 260 265 270 Leu Pro Ala His Ala Lys Val Thr Ala Pro Val Phe Asp Ala Val Val 275 280 285 Lys Ser Ile Glu Ile Lys Gly Ser Tyr Val Gly Asn Arg Lys Asp Thr 290 295 300 Ala Glu Ala Ile Asp Phe Phe Ser Arg Gly Leu Ile Lys Cys Pro Ile 305 310 315 320 Lys Ile Val Gly Leu Ser Asp Leu Pro Glu Val Phe Lys Leu Met Glu 325 330 335 Glu Gly Lys Ile Leu Gly Arg Tyr Val Leu Asp Thr Ser Lys 340 345 350 <210> 69 <211> 1053 <212> DNA <213> Escherichia coli <400> 69 atgtctgaac aaatcccaaa aactcaaaaa gccgttgtct ttgataccaa tggtggtcaa 60 ttagtctaca aggattaccc agttccaact ccaaagccaa atgaattgtt aatcaacgtc 120 aaatactctg gtgtctgtca cactgattta cacgcttgga aaggtgactg gccattggct 180 actaaattgc cattagttgg tggtcacgaa ggtgccggtg tcgttgtcgg tatgggtgaa 240 aacgtcaaag gatggaaaat cggtgacttt gccggtatca aatggttgaa cggttcttgt 300 atgagttgtg aattctgtca acaaggtgct gaaccaaact gtggtgaagc tgacttgtct 360 ggttacactc acgatggttc attcgaacaa tacgctactg ctgatgctgt ccaagccgct 420 aaaattccag ctggtactga tttagccaat gtcgcaccaa tcttatgtgc tggtgttact 480 gtttacaaag ccttaaagac tgctgactta gcagctggcc aatgggttgc tatctccggt 540 gctggtggtg gtttaggttc tttggccgtt caatacgcca gagccatggg tttgagagtt 600 gttgctattg acggtggtga cgaaaaaggt gaatttgtta aatcattggg tgctgaagct 660 tacgttgatt tcaccaaaga taaagatatt gttgaagctg ttaagaaggc tactgatggt 720 ggtccacacg gtgctatcaa tgtctctgtt tctgaaaaag ccattgacca atctgttgaa 780 tatgttagac cattaggtaa agttgttttg gttggtttac cagctcacgc taaagtcact 840 gctccagttt tcgatgctgt tgtcaaatcc attgaaatca aaggttctta cgttggtaac 900 agaaaagata ctgctgaagc tattgacttc ttctccagag gtttaatcaa atgcccaatc 960 aagattgtcg gtttatctga cttgccagaa gtcttcaaat tgatggaaga aggtaaaatc 1020 ttgggtagat acgtcttgga caccagtaaa taa 1053 <210> 70 <211> 353 <212> PRT <213> Unknown <220> <223> Fusarium graminearum <400> 70 Met Ala Ala Pro Gln Ile Pro Ser Gln Gln Trp Ala Gln Ile Phe Glu 1 5 10 15 Lys Thr Ala Gly Pro Ile Glu Tyr Lys Gln Ile Pro Val Gln Lys Pro 20 25 30 Gly Pro Asp Glu Val Leu Val Asn Val Lys Phe Ser Gly Val Cys His 35 40 45 Thr Asp Leu His Ala Trp Gln Gly Asp Trp Pro Leu Asp Thr Lys Leu 50 55 60 Pro Leu Val Gly Gly His Glu Gly Ala Gly Val Val Val Ala Arg Gly 65 70 75 80 Glu Leu Val Lys Asp Val Lys Ile Gly Glu Lys Val Gly Ile Lys Trp 85 90 95 Leu Asn Gly Ser Cys Leu Ser Cys Ser Tyr Cys Gln Asn Ala Asp Glu 100 105 110 Ser Leu Cys Ala Glu Ala Leu Leu Ser Gly Tyr Thr Val Asp Gly Ser 115 120 125 Phe Gln Gln Tyr Ala Ile Ala Lys Ala Ile His Val Ala Arg Ile Pro 130 135 140 Glu Glu Cys Asp Leu Glu Ala Ile Ser Pro Ile Leu Cys Ala Gly Ile 145 150 155 160 Thr Val Tyr Lys Gly Ile Lys Glu Ser Gly Val Lys Ala Gly Gln Ser 165 170 175 Leu Ala Ile Val Gly Ala Gly Gly Gly Leu Gly Ser Ile Ala Val Gln 180 185 190 Tyr Ala Lys Ala Met Gly Ile His Ala Ile Ala Ile Asp Gly Gly Glu 195 200 205 Glu Lys Glu Lys Met Cys Met Ser Leu Gly Ala Gln Thr Phe Ile Asp 210 215 220 Phe Thr Lys Thr Lys Asn Ile Val Ala Asp Val Lys Ala Thr Thr Asn 225 230 235 240 Asp Gly Leu Gly Pro His Ala Ala Leu Leu Val Ala Ala Ala Glu Lys 245 250 255 Pro Phe Gln Gln Ala Thr Gln Tyr Ile Arg Ser Lys Gly Thr Val Val 260 265 270 Cys Ile Gly Leu Pro Ala Gly Ala Gln Phe Ser Ala Pro Val Phe Asp 275 280 285 Thr Val Val Arg Met Ile Gln Ile Lys Gly Ser Tyr Val Gly Asn Arg 290 295 300 Ala Asp Thr Ala Glu Ala Ile Asp Phe Phe Arg Arg Gly Leu Ile Lys 305 310 315 320 Val Pro Phe Lys Thr Val Gly Leu Ser Glu Leu Asn Glu Val Phe Lys 325 330 335 Leu Met Lys Ala Gly Gln Val Ala Gly Arg Tyr Val Val Asp Thr Ser 340 345 350 Arg <210> 71 <211> 1062 <212> DNA <213> Unknown <220> <223> Fusarium graminearum <400> 71 atggccgctc cccagattcc ttcccagcag tgggctcaga tcttcgagaa gaccgccggt 60 cccatcgagt acaagcagat tcccgtccag aagcctggcc ccgatgaggt tctcgtcaac 120 gtcaagttct ccggtgtctg ccacactgac ctccacgcct ggcagggtga ctggcccctc 180 gacaccaagc tgccccttgt cggtggccac gagggtgccg gtgttgtcgt tgcccgcggc 240 gagcttgtca aggatgtcaa gattggcgag aaggtcggta tcaagtggct caacggttct 300 tgcttgagct gctcttactg ccaaaacgcc gatgagtctc tctgcgctga ggctcttctc 360 tccggttaca ccgtcgatgg atctttccag caatacgcca tcgccaaggc tatccacgtt 420 gctcgcatcc ctgaggagtg tgaccttgag gccatctccc ccattctctg cgccggtatc 480 accgtctaca agggtatcaa ggagtccggt gtcaaggccg gccagtctct tgctatcgtc 540 ggtgctggtg gtggtctcgg ttccatcgct gttcagtacg ccaaggctat gggtatccat 600 gccattgcca ttgatggtgg tgaggagaag gagaagatgt gcatgtctct cggtgcccaa 660 accttcatcg acttcacaaa gactaagaac atcgtcgctg atgtcaaggc tactaccaac 720 gatggccttg gccctcacgc tgctctcctc gtcgctgctg ccgagaagcc cttccaacag 780 gctacccaat acatccgatc caagggtacc gtcgtctgca tcggtctccc cgctggtgct 840 cagttctctg cccccgtctt cgacactgtc gttcgcatga ttcagatcaa gggatcttat 900 gtcggtaacc gtgccgatac tgctgaggcc atcgacttct tccgccgtgg tctcatcaag 960 gttcccttca agactgttgg tctctctgag ctcaacgagg tcttcaagct catgaaggct 1020 ggccaagttg ctggtcgcta tgtcgttgac accagccgat aa 1062 <210> 72 <211> 1966 <212> DNA <213> Artificial Sequence <220> <223> Adh2 split marker cassette 1 <400> 72 cgtatctacc gatgatggca ccagcctcca tctgttcgta gaccttagca agttcagaca 60 gaccgataat cttgatagga gccttgacca aacctctggt gaacaagtcg atggcctcgg 120 cactgtcctc tctgtttcca acgtaagatc ccttgatctc gatggacttc agaacgtgcc 180 agaaaacgtc agagttgaca acggcaccag atggcagacc aaccaaaaca accttaccca 240 aagttctaac gtattggaca gattggttga tagcatgtgg ggaaacggag acgttaataa 300 caccgtgtgg accaccgttg gtgagctttt ggacttcagc aacgacgtcc ttagtcttag 360 tgaagtcgac gaagacctca gcacccaagg acttgacaaa ttcacccttg tcggcaccac 420 catcaatacc caaaactctc aaacccagag ccttggcgta ttgaacggca agagaaccca 480 gtcctccacc agcaccagaa atggcaaccc attggccaat acgcaagtca gcggtcttaa 540 gagccttgta aacggtgata ccagcacaca gaattggggc aacttcagcc aagtcagcct 600 cctttggaat tctggcggct tgggtggcat cagcagtagc atactgctgg aaagatccgt 660 cgtgggtgaa accagacagg tcagccttgg cacaactgga ttcagcacct tggatacagt 720 actcacagtt caaacaagaa ccgttcaacc atttgatacc agcgtagtca ccgatagtgg 780 atctgatatc acctaataac ttcgtatagc atacattata cgaagttata ttaagggttc 840 tcgaatggta ccttgctcac atgttgatct ccagcttgca aattaaagcc ttcgagcgtc 900 ccaaaacctt ctcaagcaag gttttcagta taatgttaca tgcgtacacg cgtctgtaca 960 gaaaaaaaag aaaaatttga aatataaata acgttcttaa tactaacata actataaaaa 1020 aataaatagg gacctagact tcaggttgtc taactccttc cttttcggtt agagcggatg 1080 tggggggagg gcgtgaatgt aagcgtgaca taactaatta catgatatcg acaaaggaaa 1140 agggggacgg atctccgagg taaaatagaa caactacaat ataaaaaaac tatacaaatg 1200 acaagttctt gaaaacaaga atctttttat tgtcagtact gattattcct ttgccctcgg 1260 acgagtgctg gggcgtcggt ttccactatc ggcgagtact tctacacagc catcggtcca 1320 gacggccgcg cttctgcggg cgatttgtgt acgcccgaca gtcccggctc cggatcggac 1380 gattgcgtcg catcgaccct gcgcccaagc tgcatcatcg aaattgccgt caaccaagct 1440 ctgatagagt tggtcaagac caatgcggag catatacgcc cggagccgcg gcgatcctgc 1500 aagctccgga tgcctccgct cgaagtagcg cgtctgctgc tccatacaag ccaaccacgg 1560 cctccagaag aagatgttgg cgacctcgta ttgggaatcc ccgaacatcg cctcgctcca 1620 gtcaatgacc gctgttatgc ggccattgtc cgtcaggaca ttgttggagc cgaaatccgc 1680 gtgcacgagg tgccggactt cggggcagtc ctcggcccaa agcatcagct catcgagagc 1740 ctgcgcgacg gacgcactga cggtgtcgtc catcacagtt tgccagtgat acacatgggg 1800 atcagcaatc gcgcatatga aatcacgcca tgtagtgtat tgaccgattc cttgcggtcc 1860 gaatgggccg aacccgctcg tctggctaag atcggccgca gcgatcgcat ccatggcctc 1920 cgcgaccggc tgcagaacag cgggcagttc ggtttcaggc aggtct 1966 <210> 73 <211> 2069 <212> DNA <213> Artificial Sequence <220> <223> Adh2 split marker cassette 2 <220> <221> misc_feature <222> (1099) <223> n is a, c, g, or t <400> 73 agatgttggc gacctcgtat tgggaatccc cgaacatcgc ctcgctccag tcaatgaccg 60 ctgttatgcg gccattgtcc gtcaggacat tgttggagcc gaaatccgcg tgcacgaggt 120 gccggacttc ggggcagtcc tcggcccaaa gcatcagctc atcgagagcc tgcgcgacgg 180 acgcactgac ggtgtcgtcc atcacagttt gccagtgata cacatgggga tcagcaatcg 240 cgcatatgaa atcacgccat gtagtgtatt gaccgattcc ttgcggtccg aatgggccga 300 acccgctcgt ctggctaaga tcggccgcag cgatcgcatc catggcctcc gcgaccggct 360 gcagaacagc gggcagttcg gtttcaggca ggtcttgcaa cgtgacaccc tgtgcacggc 420 gggagatgca ataggtcagg ctctcgctga attccccaat gtcaagcact tccggaatcg 480 ggagcgcggc cgatgcaaag tgccgataaa cataacgatc tttgtagaaa ccatcggcgc 540 agctatttac ccgcaggaca tatccacgcc ctcctacatc gaagctgaaa gcacgagatt 600 cttcgccctc cgagagctgc atcaggtcgg agacgctgtc gaacttttcg atcagaaact 660 tctcgacaga cgtcgcggtg agttcaggct ttttacccat ggtttagttc ctcaccttgt 720 cgtattatac tatgccgata tactatgccg atgattaatt gtcaacaccg cccttagatt 780 agattgctat gctttctttc taatgagcaa gaagtaaaaa aagttgtaat agaacaagaa 840 aaatgaaact gaaacttgag aaattgaaga ccgtttatta acttaaatat caatgggagg 900 tcatcgaaag agaaaaaaat caaaaaaaaa aaattttcaa gaaaaagaaa cgtgataaaa 960 atttttattg cctttttaga cgaagaaaaa gaaacgaggc ggtctctttt ttcttttcca 1020 aacctttagt acgggtaatt aacgacaccc tagaggaaga aagaggggaa atttagtatg 1080 ctgtgcttgg gggttttgna aatggtacgg cgatgcgcgg aatccgagaa aatctggaag 1140 agtaaaaaag gagtagaaac attttgaagc tatggtgtgt ggtaccgatc tagacctaat 1200 aacttcgtat agcatacatt atacgaagtt atattaaggg ttgtcgacct gcagcgtacg 1260 gcacgaattc gcaccccgga gagcgctcac ccccgttttc aaacagcggg gggagcacaa 1320 aatgttgaaa actacacaga tcttttcgga caccggtcgc tttatgtagt cgacatgcag 1380 attctcccaa atggaaaacg agattggaca atttgtggag ttggaaaggg gggtgggaat 1440 caacgaaatt agcagattca tgggcaattg gcaggactgg gcagaagggg tgagaattgc 1500 aatcgaatgg aacaggcact cccgttgcga aatcaaaaaa gtctcgctat ctgaactgat 1560 tttttttaag cagcaactta cggtcaatac atctccgatg gaggaatttt tcacccctcg 1620 ctaactagat gggccccttc taagaaattt gggtttaagg ttgggcagtc agtcagtgca 1680 ccaatgctaa ctgccatttg tccaaagagg ggtgcaagga tgagggaccg ttgagaataa 1740 gatttggggt gttaatcggt gatactgatt tgtcaaagag tggggaggac tgctgggcat 1800 tgttcacccc cctagttgtt agagttcgat agccggccga atcacccccc tcttcttaca 1860 taatcattgt cactatgtgg ggtctctaca gtctcaccct gcgatccggg acgacgccgc 1920 gaaattaggg ggcaagtctc ctccgggcat gcaatattgg taacaggatc aattgatgcg 1980 agaaaagttg gagggggtgt aaaattcaag cccacaaagt cacaccctta tgcctgtaga 2040 ggggcaatcg gagagcagcc atggggtgt 2069 <210> 74 <211> 1850 <212> DNA <213> Artificial Sequence <220> <223> Adh900 split marker cassette 1 <400> 74 cactccagtt gggccattac cgaacatttt gccattgtag gcgattagta agtattaaca 60 agacagctga ctatacgttt attctcaaac aatatttccc tttttggttt tgacctcgct 120 ttaatcaatt tttcagacct gatcccacct acttttcttc ggcctcaact tcaatctgac 180 tcttctctct caattggtac caaccagcca gaaaatgtcc ttccgttact tgaaacggca 240 tttctctaca gctacaaacg caattgctct ccttagcaga cctgaattca aaataggtcg 300 aattgtggac gtcgtgaaac atccaaatgc agacaaactt tatgtctcgt cgatttctgt 360 gggaaacaat tatgcctcgg gtacatccaa caccctaacc gtttgcagcg gcttggtgga 420 ctacttttca gttcccgaat tgcttcagcg acgggtcgtt gtggtcacaa acctcaagcc 480 atcgaagatg agaggtgtaa catcggaggc aatgcttttg gcaggggaaa agtcggggaa 540 agtggaattg gtcgagccgc caatgtccgg gagagagggc gaatcactcc acttcgaagg 600 tgtagaaatt acatcagagg agagcgccaa tcaattgcat ttgcctgcta agcgattgaa 660 gaagtcagag tggagtcaac tggcggaagg tctacagaca aatgaccagc gtgaagtggt 720 cttccacagc caaattggct ccaaacgaat ttacgcttta gtaggagcga gtactgaaaa 780 atgcacgtta gcgactcttg cgcaggccgt cgtacgataa gggcaatatg gttgagaacg 840 ttcctcaccc aaataaaatc atcgtacgct gcaggtcgac aacccttaat ataacttcgt 900 ataatgtatg ctatacgaag ttattaggtc tagatcggta ccgacatgga ggcccagaat 960 accctccttg acagtcttga cgtgcgcagc tcaggggcat gatgtgactg tcgcccgtac 1020 atttagccca tacatcccca tgtataatca tttgcatcca tacattttga tggccgcacg 1080 gcgcgaagca aaaattacgg ctcctcgctg cagacctgcg agcagggaaa cgctcccctc 1140 acagacgcgt tgaattgtcc ccacgccgcg cccctgtaga gaaatataaa aggttaggat 1200 ttgccactga ggttcttctt tcatatactt ccttttaaaa tcttgctagg atacagttct 1260 cacatcacat ccgaacataa acaaccatgg gtaaggaaaa gactcacgtt tcgaggccgc 1320 gattaaattc caacatggat gctgatttat atgggtataa atgggctcgc gataatgtcg 1380 ggcaatcagg tgcgacaatc tatcgattgt atgggaagcc cgatgcgcca gagttgtttc 1440 tgaaacatgg caaaggtagc gttgccaatg atgttacaga tgagatggtc agactaaact 1500 ggctgacgga atttatgcct cttccgacca tcaagcattt tatccgtact cctgatgatg 1560 catggttact caccactgcg atccccggca aaacagcatt ccaggtatta gaagaatatc 1620 ctgattcagg tgaaaatatt gttgatgcgc tggcagtgtt cctgcgccgg ttgcattcga 1680 ttcctgtttg taattgtcct tttaacagcg atcgcgtatt tcgtctcgct caggcgcaat 1740 cacgaatgaa taacggtttg gttgatgcga gtgattttga tgacgagcgt aatggctggc 1800 ctgttgaaca agtctggaaa gaaatgcata agcttttgcc attctcaccg 1850 <210> 75 <211> 1993 <212> DNA <213> Artificial Sequence <220> <223> Adh900 split marker cassette 2 <400> 75 aagcccgatg cgccagagtt gtttctgaaa catggcaaag gtagcgttgc caatgatgtt 60 acagatgaga tggtcagact aaactggctg acggaattta tgcctcttcc gaccatcaag 120 cattttatcc gtactcctga tgatgcatgg ttactcacca ctgcgatccc cggcaaaaca 180 gcattccagg tattagaaga atatcctgat tcaggtgaaa atattgttga tgcgctggca 240 gtgttcctgc gccggttgca ttcgattcct gtttgtaatt gtccttttaa cagcgatcgc 300 gtatttcgtc tcgctcaggc gcaatcacga atgaataacg gtttggttga tgcgagtgat 360 tttgatgacg agcgtaatgg ctggcctgtt gaacaagtct ggaaagaaat gcataagctt 420 ttgccattct caccggattc agtcgtcact catggtgatt tctcacttga taaccttatt 480 tttgacgagg ggaaattaat aggttgtatt gatgttggac gagtcggaat cgcagaccga 540 taccaggatc ttgccatcct atggaactgc ctcggtgagt tttctccttc attacagaaa 600 cggctttttc aaaaatatgg tattgataat cctgatatga ataaattgca gtttcatttg 660 atgctcgatg agtttttcta atcagtactg acaataaaaa gattcttgtt ttcaagaact 720 tgtcatttgt atagtttttt tatattgtag ttgttctatt ttaatcaaat gttagcgtga 780 tttatatttt ttttcgcctc gacatcatct gcccagatgc gaagttaagt gcgcagaaag 840 taatatcatg cgtcaatcgt atgtgaatgc tggtcgctat actggtacca ttcgagaacc 900 cttaatataa cttcgtataa tgtatgctat acgaagttat taggtgatat cagatccact 960 ctgtagtgag ggttggtggt ctgacgaaca tccagcaagg tgttccacct gaaatttttc 1020 accttggagg gtaatgtgat gacgccattt cctgtgcaaa tgcttttcgt tttgaacagt 1080 gcaacttttg tatcagatct tcatctactt gatgccatct caacaaatcc ctcatttact 1140 agcgtgtgaa ggaatctaga ttttccactg ataagccaat ttgtcggaaa tcccccgcgc 1200 gggagttggc gttcagtacg agccacacac gtttcttttg gacaaccaaa gcatccgcct 1260 gaagggacaa cttgcattca acggcttcag ttggaaacgt cagagctgac ctatagtttg 1320 ctagaaccgt tttctctgtt tacgtttacg tctcctcaaa tttgcgctcg gtatgtcctt 1380 cctaattagc gggaaaagct gttcttagtt aatacggaga aagtttcggg gttaccgttc 1440 cgggaagagg aggggtcatc tctctcatct catccaacca ttaagtttct tccaaaactt 1500 caggataatc agtttaacca ccgacaggag tcagatttga gattgacaga aagtttttcc 1560 gtccatttcc tcatcttgtc gccgttatca gtcaatctct atggttatct ggaatttctt 1620 ttttctttta attcatcttc tttttatccc gcgcctttgg cgttctagct catctcatga 1680 aaacaaaacc ctctcatgtt cggataattc cagcggcttt cactttcaga tgacacatag 1740 attggactca accatggcta tctggggtat acggacgttg gcaagggcgt taatttttca 1800 ggacaaacgg aaatgccatg gctccaggga aaggcattcc tattgcaaac ctagaccgtc 1860 gaacctctcc tatcgcctac cagtcaccca gctatcccta ggcaactcat ctccttcaag 1920 cggattgcaa cctgctaagc caaattagat ctggccacag aaatgccgca atatttcttg 1980 gctctcccct ccc 1993 <210> 76 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Primer sequence <400> 76 gaattgagcc aaaaaaggag agg 23 <210> 77 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Primer sequence <400> 77 gatggaatag gagactaggt gtg 23 <210> 78 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer sequence <400> 78 tggttgagac gtttgtattg 20 <210> 79 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Primer sequence <400> 79 tgggttggga gtttagtg 18 <210> 80 <211> 1053 <212> DNA <213> Artificial Sequence <220> <223> ADH2 coding sequence <400> 80 atgtctccaa ctatcccaac tacacaaaag gctgttatct tcgagaccaa cggcggtccc 60 ctagagtaca aggacattcc agtcccaaag ccaaagtcaa acgaactttt gatcaacgtt 120 aagtactccg gtgtctgtca cactgatttg cacgcctgga agggtgactg gccattggac 180 aacaagcttc ctttggttgg tggtcacgaa ggtgctggtg tcgttgtcgc ttacggtgag 240 aacgtcactg gatgggagat cggtgactac gctggtatca aatggttgaa cggttcttgt 300 ttgaactgtg agtactgtat ccaaggtgct gaatccagtt gtgccaaggc tgacctgtct 360 ggtttcaccc acgacggatc tttccagcag tatgctactg ctgatgccac ccaagccgcc 420 agaattccaa aggaggctga cttggctgaa gttgccccaa ttctgtgtgc tggtatcacc 480 gtttacaagg ctcttaagac cgctgacttg cgtattggcc aatgggttgc catttctggt 540 gctggtggag gactgggttc tcttgccgtt caatacgcca aggctctggg tttgagagtt 600 ttgggtattg atggtggtgc cgacaagggt gaatttgtca agtccttggg tgctgaggtc 660 ttcgtcgact tcactaagac taaggacgtc gttgctgaag tccaaaagct caccaacggt 720 ggtccacacg gtgttattaa cgtctccgtt tccccacatg ctatcaacca atctgtccaa 780 tacgttagaa ctttgggtaa ggttgttttg gttggtctgc catctggtgc cgttgtcaac 840 tctgacgttt tctggcacgt tctgaagtcc atcgagatca agggatctta cgttggaaac 900 agagaggaca gtgccgaggc catcgacttg ttcaccagag gtttggtcaa ggctcctatc 960 aagattatcg gtctgtctga acttgctaag gtctacgaac agatggaggc tggtgccatc 1020 atcggtagat acgttgtgga cacttccaaa taa 1053 <210> 81 <211> 1083 <212> DNA <213> Artificial Sequence <220> <223> ADH900 coding sequence <400> 81 atgtctgtga tgaaagccct cgtgtacggt ggtaagaacg tcttcgcctg gaaaaacttc 60 cctaaaccaa ctatcttgca cccaacagat gtcatcgtta agacggtggc tactaccatc 120 tgcggaacag acttgcacat cttgaaaggt gatgttccag aggtcaaacc tgaaaccgtc 180 ttgggtcatg aagcaattgg agtcgtcgaa tctatcggtg ataacgtcaa aaacttcagc 240 attggtgata aggtgctggt ttcatgcatc accagttgtg gaagctgtta ctactgtaag 300 agaaacttgc agagtcattg caagaccggt ggatggaaat taggtcacga tttgaacggt 360 acgcaggctg agtttgtccg tatcccatat ggagacttct cattgcaccg tattcctcat 420 gaagcagatg aaaaggcagt tctgatgctg tctgacatct tacctactgc ttacgaagtt 480 ggtgttcttg ccggaaatgt ccaaaaggga gactcagttg ccattgtcgg cgccggtcca 540 gttggtcttg ccgctctgct gactgtcaaa gcctttgagc cttctgaaat tattatgatt 600 gacactaacg atgaaagact gagtgcctcc ttgaaattgg gagccaccaa ggcagtcaac 660 ccaaccaagg tcagcagtgt caaagatgct gtttatgata ttgtcaatgc cactgtccgc 720 gtcaaggaga acgacctgga gccaggtgtc gatgttgcca ttgagtgtgt tggtgttcct 780 gacacgtttg caacttgtga agagattatc gccccaggtg gccgtattgc caatgttggt 840 gttcacggca ctaaagtgga tttacaactg caagacctat ggatcaagaa cattgctatc 900 accaccggtt tggtagccac atactccact aaagacctgt tgaagcgagt ctctgacaag 960 tctctagacc ctacaccact ggttacacat gagttcaagt tcagtgaatt tgagaaggcc 1020 tatgagactt ctcaaaatgc tgccaccacc aaagccatca agattttctt atctgccgat 1080 taa 1083 <210> 82 <211> 1080 <212> DNA <213> Artificial Sequence <220> <223> Adh2_GG_cured <400> 82 gataggtctc acatgtctcc aactatccca actacacaaa aggctgttat cttcgaaacc 60 aacggcggtc ccctagagta caaggacatt ccagtcccaa agccaaagtc aaacgaactt 120 ttgatcaacg ttaagtactc cggtgtctgt cacactgatt tgcacgcctg gaagggtgac 180 tggccattgg acaacaagct tcctttggtt ggtggtcacg aaggtgctgg tgtcgttgtc 240 gcttacggtg agaacgtcac tggatgggag atcggtgact acgctggtat caaatggttg 300 aacggttctt gtttgaactg tgagtactgt atccaaggtg ctgaatccag ttgtgccaag 360 gctgacctgt ctggtttcac ccacgacgga tctttccagc agtatgctac tgctgatgcc 420 acccaagccg ccagaattcc aaaggaggct gacttggctg aagttgcccc aattctgtgt 480 gctggtatca ccgtttacaa ggctcttaag accgctgact tgcgtattgg ccaatgggtt 540 gccatttctg gtgctggtgg aggactgggt tctcttgccg ttcaatacgc caaggctctg 600 ggtttgagag ttttgggtat tgatggtggt gccgacaagg gtgaatttgt caagtccttg 660 ggtgctgagg tgttcgtcga cttcactaag actaaggacg tcgttgctga agtccaaaag 720 ctcaccaacg gtggtccaca cggtgttatt aacgtctccg tttccccaca tgctatcaac 780 caatctgtcc aatacgttag aactttgggt aaggttgttt tggttggtct gccatctggt 840 gccgttgtca actctgacgt tttctggcac gttctgaagt ccatcgagat caagggatct 900 tacgttggaa acagagagga cagtgccgag gccatcgact tgttcaccag aggtttggtc 960 aaggctccta tcaagattat cggtctgtct gaacttgcta aggtctacga acagatggag 1020 gctggtgcca tcatcggtag atacgttgtg gacacttcca aataagctta gagaccgatc 1080 1080 <210> 83 <211> 1110 <212> DNA <213> Artificial Sequence <220> <223> Adh900_GG_cured <400> 83 gataggtctc acatgtctgt gatgaaagcc ctcgtgtacg gtggtaagaa cgtgttcgcc 60 tggaaaaact tccctaaacc aactatcttg cacccaacag atgtcatcgt taagacggtg 120 gctactacca tctgcggaac agacttgcac atcttgaaag gtgatgttcc agaggtcaaa 180 cctgaaaccg tcttgggtca tgaagcaatt ggagtcgtcg aatctatcgg tgataacgtc 240 aaaaacttca gcattggtga taaggtgctg gtttcatgca tcaccagttg tggaagctgt 300 tactactgta agagaaactt gcagagtcat tgcaagaccg gtggatggaa attaggtcac 360 gatttgaacg gtacgcaggc tgagtttgtc cgtatcccat atggagactt ctcattgcac 420 cgtattcctc atgaagcaga tgaaaaggca gttctgatgc tgtctgacat cttacctact 480 gcttacgaag ttggtgttct tgccggaaat gtccaaaagg gagactcagt tgccattgtc 540 ggcgccggtc cagttggtct tgccgctctg ctgactgtca aagcctttga gccttctgaa 600 attattatga ttgacactaa cgatgaaaga ctgagtgcct ccttgaaatt gggagccacc 660 aaggcagtca acccaaccaa ggtcagcagt gtcaaagatg ctgtttatga tattgtcaat 720 gccactgtcc gcgtcaagga gaacgacctg gagccaggtg tcgatgttgc cattgagtgt 780 gttggtgttc ctgacacgtt tgcaacttgt gaagagatta tcgccccagg tggccgtatt 840 gccaatgttg gtgttcacgg cactaaagtg gatttacaac tgcaagacct atggatcaag 900 aacattgcta tcaccaccgg tttggtagcc acatactcca ctaaagacct gttgaagcga 960 gtctctgaca agtctctaga ccctacacca ctggttacac atgagttcaa gttcagtgaa 1020 tttgagaagg cctatgagac ttctcaaaat gctgccacca ccaaagccat caagattttc 1080 ttatctgccg attaagctta gagaccgatc 1110 <210> 84 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer sequence <400> 84 ttgatctttt ctacggggtg g 21 <210> 85 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer sequence <400> 85 ggtgttttga agtggtacgg 20

Claims

조작된 재조합 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포:
a) 상기 하나 이상의 유전적 변형 이전의 숙주 세포와 비교하여 제1 및 제2 내인성 유전자의 발현을 감소시키기 위한 하나 이상의 유전적 변형에 의해, 여기서
i. 제1 내인성 유전자는 서열번호 1로 확인된 아미노산 서열 또는 이의 상동체를 포함하는 알코올 산화효소 1(alcohol oxidase 1, AOX1)을 암호화하고,
ii. 제2 내인성 유전자는 서열번호 3으로 확인된 아미노산 서열 또는 이의 상동체를 포함하는 알코올 산화효소 2(alcohol oxidase 2, AOX2)를 암호화하고,
그리고
b) 상기 하나 이상의 유전적 변형 이전에 숙주 세포와 비교하여 알코올 탈수소효소 2(alcohol dehydrogenase 2, ADH2) 유전자의 발현을 증가시키기 위한 하나 이상의 유전적 변형에 의해, 여기서 ADH2 유전자는 알코올 탈수소효소 2(ADH2)를 인코딩한다.
제1항에 있어서, 상기 하나 이상의 유전적 변형이 (i) 하나 이상의 폴리뉴클레오타이드, 또는 이의 일부; 또는 (ii) 발현 조절 서열의 분열(disruption), 치환(subtitution), 결실(deletion), 녹인(knockin) 또는 녹아웃(knockout)을 포함하는 것인 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포.
제2항에 있어서, 상기 발현 조절 서열은 프로모터, 리보솜 결합 부위, 전사 또는 번역 시작 및 정지 서열, 인핸서 및 활성제 서열로 이루어진 군으로부터 선택되는 것인 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포.
제1항 내지 제3항 중 어느 한 항에 있어서, 상기 제1 및/또는 제2 내인성 유전자가 상기 하나 이상의 유전적 변형에 의해 녹아웃되는 것인 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포.
제1항 내지 제4항 중 어느 한 항에 있어서, ADH2 유전자가 Mut- 숙주 세포에 대해 내인성 또는 이종성인 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포.
제1항 내지 제5항 중 어느 한 항에 있어서, ADH2가 하기 중 어느 하나인 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포:
a) 서열번호 50으로 확인된 아미노산 서열, 또는 효모 종에 내인성인 이의 상동체를 포함하는 피키아 파스토리스(P. pastoris) ADH2인 ADH2;
b) 서열번호 50과 60% 이상 동일한 a)의 ADH2 돌연변이.
제1항 내지 제6항 중 어느 한 항에 있어서, 상기 하나 이상의 유전적 변형이 ADH2의 수준 또는 활성을 증가시키는 ADH2 유전자의 기능 획득 변경을 포함하는 것인 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포.
제7항에 있어서, 상기 기능 획득 변경이 ADH2 유전자의 녹인을 포함하는 것인 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포.
제7항 또는 제8항에 있어서, 상기 기능 획득 변경은 상기 세포에서 ADH2 유전자 발현을 상향 조절하는 것인 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포.
제7항 내지 제9항 중 어느 한 항에 있어서, 상기 기능 획득 변경이 상기 세포에서 ADH2 유전자를 과발현하기 위한 이종 발현 카세트의 삽입을 포함하는 것인 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포.
제10항에 있어서, 상기 이종 발현 카세트가 프로모터 서열의 제어 하에 ADH2 유전자를 포함하는 이종 폴리뉴클레오티드를 포함하는 것인 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포.
제1항 내지 제11항 중 어느 한 항에 있어서, 관심 단백질(protein of interest, POI)을 코딩하는 관심 유전자(gene of interest, GOI)에 작동가능하게 연결된 발현 카세트 프로모터(expression cassette promoter, ECP)를 포함하는 이종 관심 유전자 발현 카세트(gene of interest expression cassette, GOIEC)를 포함하는 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포.
제12항에 있어서, ECP가 메탄올-유도성 프로모터인 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포.
제13항에 있어서, ECP가 하기 중 어느 하나인 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포:
a) 서열번호 5에 대해 60% 이상의 서열 동일성을 포함하는 pAOX1 프로모터;
b) 서열번호 6에 대해 60% 이상의 서열 동일성을 포함하는 pAOX2 프로모터; 또는
c) 서열번호 36-49로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 포함하는 프로모터.
제12항 내지 제14항 중 어느 한 항에 있어서, GOIEC가 POI의 분비를 가능하게 하는 신호 펩티드를 코딩하는 뉴클레오티드 서열을 추가로 포함하는 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포.
제15항에 있어서, 상기 신호 펩티드를 코딩하는 염기서열은 상기 GOI의 5' 말단에 인접하여 융합되어 있는 것을 특징으로 하는 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포.
제12항 내지 제16항 중 어느 한 항에 있어서, POI가 Mut- 숙주 세포 또는 ECP에 이종성인 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포.
제12항 내지 제17항 중 어느 한 항에 있어서, POI가 항원 결합 단백질, 치료 단백질, 효소, 펩티드, 단백질 항생제, 독소 융합 단백질, 탄수화물-단백질 접합체, 구조 단백질, 조절 단백질, 백신 항원, 성장 인자, 호르몬, 사이토카인, 공정 효소로 이루어진 군으로부터 선택된 펩티드 또는 단백질인 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포.
제1항 내지 제18항 중 어느 한 항에 있어서, 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포가 Pichia, Komagataella, Hansenula, Ogataea 또는 Candida 속의 효모 세포인 방법.
POI를 생산하기 위하여 탄소원으로서 메탄올을 사용하여 제1항 내지 제18항 중 어느 한 항의 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포를 배양하는 것을 포함하는 관심 단백질(POI) 생산 방법.
제20항에 있어서, 발효 생성물이 세포 배양물로부터 단리되고, 발효 생성물이 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포로부터 수득된 POI 또는 숙주 세포 대사산물을 포함하는 것인 방법.
제20항 또는 제21항에 있어서,
a) 기본 탄소원을 에너지원으로 사용하여 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포를 배양하는 성장기(growing phase); 다음에
b) 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포가 메탄올 공급을 사용하여 배양되어 POI를 생산하는 생산기(production phase)를 포함하는 것인 방법.
제22항에 있어서, 0.5-2.0%(v/v)의 평균 메탄올 농도가 적어도 24시간의 생산기(production phase) 동안 숙주 세포 배양에서 사용되는 것인 방법.
제22항 또는 제23항에 있어서, 메탄올 공급이 적어도 24시간의 생산기(production phase) 동안 적어도 2 mg 메탄올/(g 건조 바이오매스*h)의 평균 공급 속도인 방법.
제22항 내지 제24항 중 어느 한 항에 있어서, 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포가 10%(w/w 바이오매스) 미만으로 숙주 세포 성장을 제한하는 조건 하에 생산기(production phase) 동안 배양되는 것인 방법.
메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포가 알코올 탈수소효소 2(alcohol dehydrogenase 2, ADH2)의 기질로서 메탄올을 사용하고, 발효 산물을 생산하도록 하는 조건 하에 상기 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포를 배양하는 것을 포함하는 발효 생성물의 생산 방법에서 재조합 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포의 용도
메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포가 하나 이상의 유전적 변형에 의해 조작되는 탄소원으로 메탄올을 사용하여 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포가 발효 생성물을 생산하도록 허용하는 조건 하에 상기 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포를 배양하는 것을 포함하는 발효 생성물을 생산하는 방법에서 재조합 메탄올 이용 경로 결핍 메틸영양 효모(Mut-) 숙주 세포의 용도
a) 상기 하나 이상의 유전적 변형 이전에 숙주 세포와 비교하여 제1 및 제2 내인성 유전자의 발현을 감소시키고, 여기서
i. 제1 내인성 유전자는 서열번호 1로 확인된 아미노산 서열 또는 이의 상동체를 포함하는 알코올 산화효소 1(alcohol oxidase 1, AOX1)을 암호화하고,
ii. 제2 내인성 유전자는 서열번호 3으로 확인된 아미노산 서열 또는 이의 상동체를 포함하는 알코올 산화효소 2(alcohol oxidase 2, AOX2)를 암호화하고,
b) 알코올 탈수소효소 2(alcohol dehydrogenase 2, ADH2) 유전자의 발현을 증가시키기 위해, 여기서 ADH2 유전자는 알코올 탈수소효소 2(alcohol dehydrogenase 2, ADH2)를 코딩한다.