KR20210114401A

KR20210114401A - 재조합 숙주 세포에서 탄소 공급원 조절된 단백질 생산

Info

Publication number: KR20210114401A
Application number: KR1020217020068A
Authority: KR
Inventors: 브리지트 개서; 코리나 렙네거; 빌레가스 미렐르 시트랄리 플로레스; 디트하드 마타노비치
Original assignee: 론자 리미티드
Priority date: 2019-01-11
Filing date: 2020-01-10
Publication date: 2021-09-23
Also published as: CN113423836A; CA3125217C; SG11202105667RA; US11773424B2; TW202031898A; DK3874047T3; ES2921137T3; CN116904331A; JP7061234B2; CA3125217A1; US20240018563A1; US20220042064A1; JP2022508470A; EP3874047A1; KR102495283B1; CN113423836B; EP3874047B1; WO2020144313A1; KR20230022260A

Abstract

서열번호:1로 식별된 아미노산 서열을 포함하는 FLO8 단백질 또는 이의 상동체를 암호화하는 내인성 유전자를 포함하며, 하나 이상의 유전적 변형 전의 숙주 세포와 비교하여 상기 유전자의 발현을 감소시키기 위해 상기 하나 이상의 유전적 변형에 의해 조작되고, 비-메탄올 탄소 공급원에 의해 억제가능한 발현 카세트 프로모터(ECP)의 제어 하에 관심 유전자(GOI)를 포함하는 이종 발현 카세트를 포함하는 재조합 숙주 세포, 및 상기 재조합 숙주 세포를 사용하여 관심 단백질을 생산하는 방법.

Description

재조합 숙주 세포에서 탄소 공급원 조절된 단백질 생산

본 발명은 관심 단백질(POI)을 암호화하는 관심 유전자(GOI)를 발현하기 위해 이종 발현 카세트를 포함하는 재조합 숙주 세포에서 POI를 생산하는 것에 관한 것이며, 숙주 세포는 FLO8 단백질의 발현을 감소시키도록 조작된다.

재조합 숙주 세포 배양에서 생산된 단백질은 진단제 및 치료제로 점차 중요해지고 있다. 이 목적을 위해, 세포는 비정상적으로 높은 수준의 재조합 또는 이종 관심 단백질을 생산하도록 조작되고/되거나 선택된다. 세포 배양 조건의 최적화는 재조합 또는 이종 단백질의 성공적인 상업적 생산에 중요하다.

관심 단백질(POI)의 성공적 생산은 세포 배양물에서 원핵 및 진핵 숙주 세포 둘 다로 달성되었다. 진핵 숙주 세포, 특히 포유류 숙주 세포, 효모 또는 사상성 진균, 또는 박테리아는 통상적으로 생물약제학적 단백질 뿐만 아니라 벌크 화학물질에 대한 생산 숙주로서 사용된다. 가장 우세한 예는 사카로마이세스 세레비지애(Saccharomyces cerevisiae), 피키아 파스토리스(Pichia pastoris) 또는 한세눌라 폴리모르파(Hansenula polymorpha)와 같은 효모, 아스페르길루스 아와모리(Aspergillus awamori) 또는 트리코더마 레세이(Trichoderma reesei)와 같은 사상성 진균, 또는 CHO 세포와 같은 포유류 세포이다. 피키아 파스토리스와 같은 메탄올자화(Methylotrophic) 효모는 이종 단백질의 효율적인 분비로 널리 평판이 나 있다. 피. 파스토리스(P. pastoris)는 새로운 속 코마가타엘라(Komagataella)로 재분류되었고, 케이. 파스토리스(K. pastoris), 케이. 파피이(K. phaffii), 및 케이. 슈도파스토리스(K. pseudopatoris)의 3 종으로 나뉘었다. 생물공학적 적용에 통상적으로 사용되는 균주는 케이. 파스토리스 및 케이. 파피이의 제안된 2 종에 속한다. 균주 GS115, X-33, CBS2612, 및 CBS7435는 케이. 파피이이지만, 프로테아제 결핍 균주의 SMD 시리즈(예를 들어, SMD1168)는 모든 이용가능한 피. 파스토리스 균주에 대한 참조 균주인 케이. 파스토리스 유형 종으로 분류된다(Kurtzman 2009, J Ind Microbiol Biotechnol. 36(11):1435-8). Mattanovich et al.(Microbial Cell Factories 2009, 8:29 doi:10.1186/1475-2859-8-29)은 케이. 파스토리스의 유형 균주 DSMZ 70382의 게놈 서열분석을 기재하고, 이의 분비단백질(secretome) 및 당 수송체를 분석하였다.

WO2015/158808A2는 헬퍼 단백질을 과발현하도록 조작된 재조합 숙주 세포를 개시한다.

WO2015/158800A1은 숙주 세포에 내인성이고 과발현될 때 단백질 생산 수율을 감소시키는 것으로 입증된 특정 단백질(KO 단백질이라고 명명됨)을 과소발현하도록 조작함으로써 POI를 발현하고/하거나 분비하는 숙주 세포의 능력을 개선하는 것을 개시한다. 따라서 이러한 KO 단백질은 수율을 개선하기 위한 녹아웃(knock-out) 표적으로 선택되었다. 결국, 피. 파스토리스 숙주 세포주에서 KO 단백질을 과소발현하면 모델 단백질의 수율이 1.2 내지 2.4 배까지 증가하는 것으로 밝혀졌다. 유도성(pAOX1) 또는 구성적(pGAP) 프로모터가 사용되었다. KO 단백질은 에스. 세레비지애(S. cerevisiae) FLO8 단백질의 피. 파스토리스 상동체, 에스. 세레비지애 HCH1 단백질의 피. 파스토리스 상동체, 및 에스. 세레비지애 SCJ1 단백질의 피. 파스토리스 상동체인 KO3으로 식별되었다.

Rebnegger et al.(Applied and Environmental Microbiology 2016, 82(15):4570-4583)은 필터 막힘을 방지하기 위해 피. 파스토리스 flo8 결실 돌연변이체의 글루코스 제한된 케모스태트(chemostat) 배양을 기재한다.

재조합 숙주 세포에서 단백질 생산에 사용되는 프로모터는 조절되거나(예를 들어, 메탄올을 배지에 첨가할 때 유도됨, 메탄올-제어), 또는 지속적으로 활성적(구성적)이다. 메탄올-제어 프로모터는 반응기에서의 폐열, 또는 산소 공급과 같은 기술적 한계를 초래한다.

WO20137050551A1은 피. 파스토리스의 일련의 탄소 공급원 조절가능한 프로모터(pG1-pG8로 지정됨), 및 세포 배양물에서 탄소 공급원 제한 시 단백질 생산의 유도를 개시한다.

WO2017021541A1은 메탄올 이외의 탄소 공급원에 의해 조절되며, 즉 메탄올 조절되지 않고, 예를 들어 성장 단계 동안 탄소 공급원의 존재 하에 억제되고, 생산 단계에서 탄소 공급원을 제한함으로써 유도되는 피. 파스토리스의 탄소 공급원 조절가능한 프로모터(pG1로 지정됨)의 변이체를 개시한다.

Prielhofer et al.(Microbial Cell Factories 2013; 12(5):1-10)은 메탄올 없이 조절가능하고 유도되는 피. 파스토리스 프로모터를 기재한다.

Prielhofer et al.(Biotechnology and Bioengineering. 2018;115:2479-2488)은 글루코스-조절 P_GTH1 프로모터 및 야생형 프로모터와 비교하여 유도 특성이 크게 향상된 조작된 변이체를 기재한다.

EP2669375A1은 MPP1 상동체의 고수준 발현에 의해 개선된 단백질 발현을 갖는 효모를 개시한다.

Hye Young Kim et al.(Biochemical and Biophysical Research Communications 2014, 449:202-207)은 표적 유전자 세트의 전사 활성화에서 Flo8 활성인자의 2 개 도메인의 역할, 및 Mss11 활성인자와의 상호작용에 의한 Flo8 작용의 방식을 기재한다.

EP2952584A1은 특정 폴리뉴클레오티드의 과발현에 의해 개선된 단백질 생산을 개시한다.

EP2258855A1은 피. 파스토리스의 특정 리더 및 분비 신호 서열을 개시한다.

WO2010099195A1은 유전적으로 변형된 피. 파스토리스 균주 및 이종 단백질 및 샤폐론 단백질의 공발현을 개시한다.

목적은 재조합 숙주 세포에서 단백질 생산을 개선하고 단백질 생산 수율을 증가시키는 것이다. 본 발명의 또 다른 목적은 숙주 세포에서 재조합 또는 이종 단백질을 생산하는 방법을 제공하는 것이며, 여기서 생산 공정 동안 숙주 세포의 형태 변화 위험은 감소된다.

목적은 청구된 바와 같은 주제에 의해 해결된다.

본 발명에 따르면, 서열번호:1로 식별된 아미노산 서열을 포함하는 FLO8 단백질 또는 이의 상동체를 암호화하는 내인성 유전자를 포함하며, 하나 이상의 유전적 변형 전의 숙주 세포와 비교하여 상기 폴리뉴클레오티드의 발현을 감소(또는 폐지)시키기 위해 상기 하나 이상의 유전적 변형에 의해 조작되고, 발현 카세트 프로모터(ECP)의 제어 하에 이러한 관심 유전자(GOI)를 발현하기 위해 이러한 GOI를 포함하는 이종 발현 카세트를 포함하는, 재조합 숙주 세포가 제공된다.

구체적으로, ECP는 비-메탄올 탄소 공급원에 의해 조절가능하다.

구체적으로, ECP는 비-메탄올 탄소 공급원에 의해 억제가능하다.

구체적으로, ECP는 억제 탄소 공급원, 예를 들어 글루코스 또는 글리세롤과 같은 메탄올이 아닌 억제 탄소 공급원에 의해 억제가능하고, 억제 탄소 공급원의 양을 감소시킴으로써 유도가능(탈억제가능)하다.

구체적으로, ECP는 메탄올에 의해 유도가능하지 않다.

구체적으로, 비-메탄올 탄소 공급원은 숙주 세포 배양에 적합하게 사용되는 메탄올 이외의 임의의 탄소 공급원이다. 구체적으로, 비-메탄올 탄소 공급원은 메탄올이 아니다.

구체적으로, 비-메탄올 탄소 공급원은 메탄올 이외의 탄소 공급원이다. 특히, ECP는 메탄올-제어되지 않는다. 세포 배양물 또는 세포 배양 배지는 메탄올을 포함할 수 있거나 또는 포함하지 않을 수 있지만, 본원에 사용된 바와 같은 ECP는 임의의 양의 메탄올에 의해 조절되지 않으며, 특히 메탄올에 의해 유도가능하지 않아서 메탄올-제어되지 않는다. 구체적으로, ECP는 메탄올이 없는 세포 배양물 또는 세포 배양 배지에서 완전히 유도될 수 있다.

본원에 기재된 목적을 위해, 용어 "FLO8 단백질"은 서열번호:1로 식별된 아미노산 서열을 포함하는 단백질, 또는 서열번호:1에 대해 특정 상동성을 갖는 아미노산 서열을 모두 지칭할 것이다. 그러나, 상동 서열은 또한 FLO8 상동체로 지칭된다.

구체적으로, FLO8 상동체는 서열번호:1에 대해 25%, 30%, 또는 35% 서열 동일성 중 적어도 임의의 하나 예를 들어, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 서열 동일성 중 적어도 임의의 하나를 갖거나, 또는 서열번호:1과 100% 동일하다. 구체적으로, 서열 동일성은 예를 들어 전장 서열을 비교할 때 본원에 추가로 개시된 바와 같이 결정된다.

구체적으로, FLO8 단백질 또는 각각의 상동체는 서열번호:50에 대해 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 서열 동일성 중 적어도 임의의 하나를 포함하거나, 또는 서열번호:50과 100% 동일한 LisH 도메인을 포함한다.

구체적 측면에 따르면, FLO8 단백질의 LisH 도메인은 진핵 유기체의 FLO8 단백질, 또는 각각의 FLO8 이종상동체(orthologue)의 자연 발생 LisH 도메인 중 임의의 것에 대해 80%, 85%, 90%, 또는 95% 서열 동일성 중 적어도 임의의 하나를 포함하거나, 또는 이러한 자연 발생 LisH 도메인, 구체적으로 효모 또는 진균, 특히 사상성 진균의 LisH 도메인, 예컨대 다음 중 임의의 하나를 포함하거나 또는 이로 이루어진 LisH 도메인과 100% 동일하다:

a) 서열번호:50, 케이. 파피이의 FLO8 단백질의 LisH 도메인(서열번호:50);

b) 서열번호:51, 케이. 파스토리스의 FLO8 단백질의 LisH 도메인(BLASTp: 서열번호:50에 대해 96% 동일성(23/24 aa));

c) 에스. 세레비지애 균주의 FLO8 이종상동체의 LisH 도메인인, 서열번호:52(BLASTp: 서열번호 :50에 대해 54% 동일성(13/24 aa));

d) 또 다른 에스. 세레비지애 균주의 FLO8 이종상동체의 LisH 도메인인, 서열번호:53(BLASTp: 서열번호 :50에 대해 54% 동일성(13/24 aa));

e) 야로위아 리폴리티카(Yarrowia lipolytica) 균주의 FLO8 이종상동체의 LisH 도메인인, 서열번호:54(BLASTp: 서열번호 :50에 대해 71% 동일성(12/17 aa));

f) 오가타에아 폴리모르파(Ogataea polymorpha)의 FLO8 이종상동체의 LisH 도메인인, 서열번호:55(BLASTp: 서열번호 :50에 대해 62% 동일성(8/13 aa)); 또는

g) 아스페르길루스 니게르(Aspergillus niger) 균주의 FLO8 이종상동체의 LisH 도메인인, 서열번호:56(BLASTp: 서열번호 :50에 대해 73% 동일성(8/11 aa)).

전형적으로, FLO8 단백질의 LisH 도메인은 데이터베이스 Pfam, ID 번호 PF08513 및 각각의 서열에 기재된 바와 같이, 25-27 개의 아미노산 길이 및 인간 단백질 LIS1에 대한 특정 서열 동일성을 갖는다. 분자 생물학에서, LisH 도메인은 광범위한 기능을 갖는 다수의 진핵 단백질에서 발견되는 단백질 도메인이다. LIS1의 N-말단 영역에서 LisH 도메인의 구조는 이량체화 모티프로 묘사되었다(The dimerization mechanism of LIS1 and its implication for proteins containing the LisH motif. Mateja A, Cierpicki T, Paduch M, Derewenda ZS, Otlewski J. 2006. J Mol Biol. 357(2):621-31).

FLO8 상동체는 특히 본원에 추가로 기재된 바와 같이 POI를 생산하는 재조합 숙주 세포로서 사용되는 숙주 세포에 내인성인 것으로 이해된다. 특히, FLO8 단백질은 숙주 세포 종의 종에 내인성인 이종상동체이다.

구체적으로, FLO8 단백질은 숙주 세포가 피. 파스토리스, 특히 각각 케이. 파스토리스 및 케이. 파피이인 경우, 피. 파스토리스, 특히 케이. 파스토리스 또는 케이. 파피이 기원의 것이다. 대안적으로, FLO8 단백질은 또 다른 기원 또는 종의 것인 경우, 피. 파스토리스, 특히 케이. 파스토리스 또는 케이. 파피이 기원에서의 이러한 FLO8 단백질의 상동(또는 이종상동) 서열을 포함하며, 상동(또는 이종상동) 서열은 야생형 숙주 세포에 내인성이다. 예를 들어, 숙주 세포가 케이. 파피이인 경우, 내인성 FLO8 단백질은 서열번호:1로 식별된 아미노산 서열을 포함하거나 또는 이로 이루어진다. 또 다른 예에 따르면, 숙주 세포가 케이. 파스토리스인 경우, 내인성 FLO8 단백질은 서열번호:1과 91% 동일한 서열번호:3으로 식별된 아미노산 서열을 포함하거나 또는 이루어진다. 그러나, 숙주 세포가 상이한 종(케이. 파스토리스 및/또는 케이. 파피이 이외)의 것인 경우, 숙주 세포에 내인성인 FLO8 단백질 서열은 서열번호:1에 대한 상동체이고 숙주 세포에서 이러한 상동체(서열번호:1의 이종상동 서열)의 발현은 본원에 기재된 목적을 위해 감소된다.

구체적으로, 임의의 또는 각각의 상동 서열은 예를 들어, 전사 인자, 특히 세포 부착, 응집, 침습적 성장, 또는 전분 이화작용의 조절에 수반되는 DNA 결합 전사 활성인자로서 피. 파스토리스, 특히 케이. 파스토리스 또는 케이. 파피이에서와 같이 각각의 야생형 숙주 세포에서 FLO8 단백질의 동일한 정성적 기능을 특징으로 하지만, 야생형 케이. 파스토리스 또는 케이. 파피이에서 FLO8 단백질과 비교할 때 정량적 활성은 상이할 수 있다.

구체적으로, 각각의 상동 서열은 피. 파스토리스, 특히 케이. 파스토리스 또는 케이. 파피이 이외의 종, 예를 들어, 또 다른 효모 또는 사상성 진균 세포, 바람직하게는 코마가타엘라 또는 피키아(Pichia) 속, 또는 사카로마이세스(Saccharomyces) 속의 효모 또는 임의의 메탄올자화 효모의 것이다. 그러나, 숙주 세포는 동물 세포, 척추동물 세포, 포유류 세포, 인간 세포, 식물 세포, 박테리아 세포, 선충 세포, 곤충 세포 또는 연체동물 세포와 같은 무척추동물 세포, 또는 줄기 세포일 수 있고, 본원에 기재된 각각의 FLO8 단백질 및 이의 상동체는 각각의 숙주 세포에 내인성이지만, 이의 발현은 본원에 기재된 바와 같이 감소되거나 또는 폐지된다.

구체적으로, FLO8 단백질 상동체는 피키아 종에 내인성이거나 또는 이로부터 유래하거나 또는 임의의 다른 효모, 진균, 또는 박테리아에 내인성이거나 또는 이로부터 유래하고, 서열번호: 1 또는 서열번호:2에 대해 25% 서열 동일성, 특이적 경우에 35%, 40%, 45%, 50%, 55%, 60, 65%, 70%, 75%, 80%, 85%, 90%, 95% 중 적어도 임의의 하나를 갖거나, 또는 서열번호: 1 또는 서열번호:2와 100% 동일하다. 구체적으로, 외인성 FLO8 단백질은 외인성 FLO8 단백질(또는 외인성 FLO8 단백질을 암호화하는 유전자)이 피키아(파스토리스) 또는 사카로마이세스(세레비지애) 균주의 flo8 녹아웃(knockout) 균주의 배양물에 첨가될 때 기능적인 경우, FLO8 단백질 상동체인 것으로 결정되며, 녹아웃 균주는 외인성 FLO8 단백질의 기원과 상이하여 결실된 내인성 FLO8 단백질의 기능적 대체를 입증한다.

구체적으로, FLO8 단백질은 특히 숙주 세포에 내인성인 유전자에 의해 암호화된 피. 파스토리스 기원의 것이며, 여기서 숙주 세포는 피. 파스토리스이다.

구체적으로, 서열번호:1을 포함하거나 또는 이로 이루어진 FLO8 단백질은 코마가타엘라 파피이(Komagataella phaffii) 기원의 것이다. 구체적으로, 이러한 FLO8 단백질은 숙주 세포에 내인성인 유전자에 의해 암호화되며, 여기서 숙주 세포는 코마가타엘라 파피이이다. 구체적으로, FLO8 단백질은 서열번호:2로 식별된 뉴클레오티드 서열에 의해 암호화된다.

구체적으로, 서열번호:1에 대해 적어도 90% 또는 91% 서열 동일성을 포함하는 FLO8 단백질은 코마가타엘라 기원의 것이다. 구체적으로, 서열번호:3을 포함하거나 또는 이로 이루어진 FLO8 단백질은 코마가타엘라 파스토리스 기원의 것이다. 구체적으로, 이러한 FLO8 단백질은 숙주 세포에 내인성인 유전자에 의해 암호화되며, 여기서 숙주 세포는 코마가타엘라 파스토리스다.

구체적으로, 서열번호:1에 대해 적어도 35% 서열 동일성을 포함하는 FLO8 단백질은 사카로마이세스 기원의 것이다. 구체적으로, 서열번호:5 또는 서열번호:6을 포함하거나 또는 이로 이루어진 FLO8 단백질은 에스. 세레비지애 기원의 것이다. 구체적으로, 이러한 FLO8 단백질은 숙주 세포에 내인성인 유전자에 의해 암호화되며, 여기서 숙주 세포는 에스. 세레비지애이다.

구체적으로, 서열번호:1에 대해 적어도 40% 또는 44% 서열 동일성을 포함하는 FLO8 단백질은 야로위아 기원의 것이다. 구체적으로, 서열번호:7을 포함하거나 또는 이로 이루어진 FLO8 단백질은 야로위아 리폴리티카 기원의 것이다. 구체적으로, 이러한 FLO8 단백질은 숙주 세포에 내인성인 유전자에 의해 암호화되며, 여기서 숙주 세포는 야로위아 리폴리티카이다.

구체적으로, 서열번호:1에 대해 적어도 30% 또는 34% 서열 동일성을 포함하는 FLO8 단백질은 오가타에아 기원의 것이다. 구체적으로, 서열번호:8을 포함하거나 또는 이로 이루어진 FLO8 단백질은 오가타에아 폴리모르파 기원의 것이다. 구체적으로, 이러한 FLO8 단백질은 숙주 세포에 내인성인 유전자에 의해 암호화되며, 여기서 숙주 세포는 오가타에아 폴리모르파이다.

구체적으로, 서열번호:1에 대해 적어도 25% 또는 26% 서열 동일성을 포함하는 FLO8 단백질은 아스페르길루스 기원의 것이다. 구체적으로, 서열번호:9를 포함하거나 또는 이로 이루어진 FLO8 단백질은 아스페르길루스 니게르 기원의 것이다. 구체적으로, 이러한 FLO8 단백질은 숙주 세포에 내인성인 유전자에 의해 암호화되며, 여기서 숙주 세포는 아스페르길루스 니게르이다.

구체적으로, 숙주 세포는 상기 FLO8 단백질을 암호화하는 상기 폴리뉴클레오티드의 전사 및/또는 번역을 감소시키고/시키거나, 달리 각각 상기 폴리뉴클레오티드의 발현을 감소시키고 상기 FLO8 단백질의 생산을 감소시키는 게놈 돌연변이(들)를 포함하는 하나 이상의 유전적 변형에 의해 유전적으로 변형된다.

구체적으로, 상기 하나 이상의 유전적 변형은 (i) 하나 이상의 내인성 폴리뉴클레오티드, 또는 이의 일부의 파괴, 치환, 결실 또는 녹아웃; 또는 (ii) 발현 제어 서열을 포함한다.

구체적 측면에 따르면, 상기 하나 이상의 유전적 변형은 예를 들어, 숙주 세포 종, 유형 또는 균주에서 자연 발생하는 FLO8 단백질, 특히 야생형(비변형 또는 천연) 단백질을 암호화하는 상기 폴리뉴클레오티드(또는 유전자)를 포함하는 코딩 폴리뉴클레오티드와 같은 본원에 기재된 숙주 세포의 하나 이상의 내인성 폴리뉴클레오티드의 변형이다.

구체적 측면에 따르면, 상기 하나 이상의 유전적 변형은 예를 들어, 프로모터, 리보솜 결합 부위, 전사 또는 번역 시작 및 중지 서열을 포함한 발현 제어 서열의 변형, 또는 인핸서 또는 활성인자 서열의 변형이다.

예를 들어, FLO8 단백질을 암호화하는 폴리뉴클레오티드의 파괴, 이러한 폴리뉴클레오티드에 작동가능하게 연결된 프로모터의 파괴, 이러한 프로모터를 더 낮은 프로모터 활성을 갖는 또 다른 프로모터로의 대체, 숙주 세포를 변형시키는 CRISPR 기반 방법에 사용되는 RNA 유도 리보뉴클레아제에 의해 관련 서열에 표적화된 각각의 전사 조절인자를 사용하는 것과 같이 이러한 폴리뉴클레오티드의 발현을 조절하는 조절 서열, 예를 들어, 프로모터, 리보솜 결합 부위, 전사 시작 또는 중지 서열, 번역 시작 또는 중지 서열, 인핸서 또는 활성인자 서열, 저해인자 또는 억제인자 서열, 신호 또는 리더 서열, 특히 단백질의 발현 및/또는 분비를 제어하는 것들로 이루어진 군으로부터 선택된 조절 서열의 변형 또는 조정(예를 들어, 활성화, 상향 조절, 불활성화, 억제, 또는 하향 조절)을 포함하는 숙주 세포를 조작하는 다양한 방법을 이용하여 내인성 폴리뉴클레오티드의 발현을 감소시킬 수 있다.

구체적으로, 상기 하나 이상의 유전적 변형은 이러한 유전적 변형이 없는 각각의 숙주와 비교하여, 예를 들어 유전자의 녹아웃에 의해 유전자 또는 유전자의 일부의 발현을 적어도 50%, 60%, 70%, 80%, 90%, 또는 95%, 또는 이의 발현을 심지어 완전히 폐지함으로써 감소시키는 유전자 또는 게놈 서열의 결실 또는 불활성화는 포함하는 하나 이상의 게놈 돌연변이를 포함한다.

구체적으로, 하나 이상의 유전적 변형은 하나 이상의 내인성 폴리뉴클레오티드의 발현을 구성적으로 손상시키거나 또는 달리 감소시키는 게놈 돌연변이를 포함한다.

구체적으로, 하나 이상의 유전적 변형은 하나 이상의 내인성 폴리뉴클레오티드의 발현을 조건부로 손상시키거나 또는 달리 감소시키는 하나 이상의 유도성 또는 억제성 조절 서열을 도입하는 게놈 돌연변이를 포함한다. 이러한 조건부 활성 변형은 특히 세포 배양 조건에 따라 활성이고/이거나 발현되는 조절 요소 및 유전자를 표적으로 한다.

구체적으로, 상기 하나 이상의 내인성 폴리뉴클레오티드의 발현이 감소되어 POI를 생산할 때 FLO8 단백질을 암호화하는 폴리뉴클레오티드의 발현을 감소시킨다. 구체적으로, 유전적 변형 시, 상기 FLO8 단백질의 발현은 POI가 생산되는 동안 숙주 세포 배양 조건 하에 감소된다.

구체적으로, 숙주 세포는 예를 들어, 유전자의 녹아웃에 의해 상기 FLO8 단백질의 양(예를 들어, 수준 또는 농도)을 상기 변형이 없는 숙주 세포와 비교하여 50%, 60%, 70%, 80%, 90%, 또는 95%, (mol/mol) 중 적어도 임의의 하나, 또는 심지어 100%, 예를 들어 검출불가능한 양으로 감소시켜 FLO8 단백질의 생산을 완전시 폐지하도록 유전적으로 변형된다. 구체적 구현예에 따르면, 숙주 세포는 (하나 이상의) 게놈 서열, 특히 FLO8 단백질 또는 이의 각각의 상동체를 암호화하는 게놈 서열의 하나 이상의 결실을 포함하도록 유전적으로 변형된다. 이러한 숙주 세포는 전형적으로 결실 또는 녹아웃 균주로 제공된다.

구체적 구현예에 따르면, 본원에 기재된 숙주 세포가 세포 배양물에서 배양되면, 숙주 세포 또는 숙주 세포 배양물에서 총 FLO8 단백질의 양은 이러한 유전적 변형이 없거나 또는 이전의 숙주 세포에 의해 발현되거나 또는 생산된 참조 양과 비교하여, 또는 각각의 숙주 세포 배양물에서 생산된 참조 양과 비교하여, 또는 상기 변형이 없거나 또는 이전의 숙주 세포와 비교하여 50%, 60%, 70%, 80%, 90%, 또는 95%, (mol/mol) 중 적어도 임의의 하나, 또는 심지어 100%, 예를 들어 검출불가능한 양으로 감소된다.

상기 FLO8 단백질의 생산을 감소시키는 상기 유전적 변형의 효과에 대해 본원에 기재된 숙주 세포를 비교할 때, 전형적으로 이러한 유전적 변형이 없거나 또는 이전의 비슷한 숙주 세포와 비교된다. 비교는 전형적으로 재조합 또는 이종 POI를 생산하도록 조작된 이러한 유전적 변형 없이, 특히 상기 POI를 생산하는 조건 하에 배양 될 때 동일한 숙주 세포 종 또는 유형으로 이루어진다. 그러나, 비교는 또한 재조합 또는 이종 POI를 생산하도록 추가로 조작되지 않은 동일한 숙주 세포 종 또는 유형으로 이루어질 수 있다.

구체적 측면에 따르면, 상기 FLO8 단백질 또는 이의 각각의 상동체의 감소는 세포에서 상기 FLO8 단백질의 양(예를 들어, 수준 또는 농도)의 감소에 의해 결정된다. 구체적으로, 상기 FLO8 단백질 또는 이의 각각의 상동체의 양은 웨스턴 블롯, 면역형광 이미징, 유세포 분석 또는 질량 분광법을 이용하는 것과 같은 적합한 방법에 의해 결정되며, 특히 여기서 질량 분광법은 예를 들어, Doneanu et al.(MAbs. 2012; 4(1): 24-44)에 의해 기재된 바와 같은 액체 크로마토그래피-질량 분광법(LC-MS), 또는 액체 크로마토그래피 탠덤-질량 분광법(LC-MS/MS)이다.

구체적 측면에 따르면, 재조합 숙주 세포는 단지 하나 또는 다수의 이종 발현 카세트, 예를 들어 상기 발현 카세트의 다수의 카피, 예컨대 적어도 2, 3, 4, 또는 5 개의 카피(유전자 카피 수, GCN)를 포함한다. 예를 들어, 재조합 숙주 세포는 최대 2, 3, 4, 또는 5 개의 카피를 포함한다. 각각의 카피는 동일하거나 또는 상이한 서열을 포함하거나 또는 이로 이루어질 수 있지만, GOI에 작동가능하게 연결된 ECP를 포함한다.

구체적 측면에 따르면, 이종 발현 카세트는 GOI에 작동가능하게 연결된 ECP를 포함하는 폴리뉴클레오티드의 인공 융합, 및 임의적으로 신호, 리더, 또는 종결인자 서열과 같은 추가 서열을 포함하거나 또는 이로 이루어진다. 구체적으로, 숙주 세포에 이종이거나 또는 인공인 발현 카세트가 사용되며, 특히 여기서 발현 카세트는 프로모터(ECP) 및 GOI를 포함하며, 여기서 프로모터 및 GOI는 서로 이종이고, 예를 들어 자연에서 이러한 조합으로 발생하지 않으며, 여기서 프로모터 및 GOI 중 하나(또는 단지 하나)는 다른 하나 및/또는 본원에 기재된 숙주 세포에 인공 또는 이종이며; 프로모터는 내인성 프로모터이고 GOI는 이종 GOI이거나; 또는 프로모터는 인공 또는 이종 프로모터이고 GOI는 내인성 GOI이며; 여기서 프로모터 및 GOI는 모두 인공이거나, 이종이거나 또는 상이한 기원, 예컨대 본원에 기재된 숙주 세포와 비교하여 세포의 상이한 종 또는 유형(균주)으로부터 유래한다. 구체적으로, ECP는 본원에 기재된 숙주 세포로 사용되는 세포에서 상기 GOI와 자연적으로 연관되지 않고/않거나 이에 작동가능하게 연결되지 않는다.

구체적 측면에 따르면, ECP는 성장-제한량의 비-메탄올 탄소 공급원의 존재 하에, 바람직하게는 메탄올의 부재 하에 유도가능하고; 성장-제한량보다 높은 과량의 비-메탄올 탄소 공급원의 존재 하에 억제가능하다. 구체적으로, 이종 발현 카세트에 의한 GOI 발현은 유도성 ECP에 의해 유도가능하다.

바람직하게는, ECP는 세포 배양 배지 또는 상청액에서 1, 1.5, 2, 2.5, 또는 3 g/L의 탄소 공급원 중 임의의 하나보다 높은 양의 존재 하에 억제되고(본원에서 프로모터-억제량으로 언급됨), 검출가능한 탄소 공급원이 없거나 또는 세포 배양 배지 또는 상청액에서 최대 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 또는 1.0 g/L 탄소 공급원 중 임의의 하나의 양의 존재 하에 유도되거나 또는 탈억제되는(본원에서 프로모터-유도량으로 언급됨) 것과 같이 조절가능한 탄소 공급원이다. 세포 배양 배지 또는 상청액에서 이러한 양은 특히 숙주 세포의 공급 및 숙주 세포에 의한 소비 시 검출가능할 수 있는 양으로 이해된다. 전형적으로, 성장-제한 조건 하에 POI를 생산할 때, 세포 배양물은 보충 탄소 공급원을 POI 생산 동안 세포에 의해 즉시 소비되는 양으로 첨가함으로써 공급되어, 이에 따라 세포 배양 배지 또는 상청액에 잔여량이 없거나 또는 적은 양, 예를 들어 최대 1.0 g/L의 양만이 남아있다.

구체적으로, ECP를 조절하는 탄소 공급원은 메탄올 이외의 임의의 것이며, 본원에서 비-메탄올 탄소 공급원으로 언급된다.

구체적으로, 비-메탄올 탄소 공급원은 탄수화물이다.

구체적으로, 비-메탄올 탄소 공급원은 사카라이드, 폴리올, 알코올, 또는 전술한 것 중 임의의 하나 이상의 혼합물로부터 선택된다.

구체적으로, 사카라이드는 헥소스, 예를 들어 글루코스, 프룩토스, 갈락토스 또는 만노스와 같은 모노사카라이드, 또는 사카로즈와 같은 디사카라이드; 또는 알코올 또는 폴리올 예를 들어, 에탄올, 또는 임의의 디올, 또는 트리올, 예를 들어, 글리세롤, 또는 전술한 것 중 임의의 것의 혼합물 중 임의의 하나 이상일 수 있다. 구체적으로, 임의의 이러한 비-메탄올 탄소 공급원은 ECP의 제어 하에 상기 POI를 생산하는 양으로 세포 배양에 사용될 수 있다.

구체적 측면에 따르면, ECP는 적어도 하나의 제1 및 적어도 하나의 제2 코어 조절 영역을 포함한다. 구체적으로, ECP는 상기 제1 및/또는 제2 코어 조절 영역 중 적어도 2 개를 포함한다. 구체적으로, ECP는 제한된 수의 상기 제1 및 제2 코어 조절 영역을 포함하며, 여기서 상기 제1 코어 조절 영역의 수는 단지 1, 2 또는 3 개이고, 상기 제2 코어 조절 영역의 수는 단지 1, 2 또는 3 개이다. 구체적으로, ECP는 예를 들어 동일한 수의 상기 제1 및 제2 코어 조절 영역을 포함하며, 여기서 상기 제1 코어 조절 영역의 수는 1 개이고, 상기 제2 코어 조절 영역의 수는 1 개이며; 여기서 상기 제1 코어 조절 영역의 수는 2 개이고, 상기 제2 코어 조절 영역의 수는 2 개이거나, 또는 여기서 상기 제1 코어 조절 영역의 수는 3 개이고, 상기 제2 코어 조절 영역의 수는 3 개이다.

구체적으로, 제1 코어 조절 영역은 서열번호:17에 대해 적어도 75% 서열 동일성, 예컨대 적어도 80%, 또는 적어도 90% 서열 동일성 중 적어도 임의의 하나를 갖고/갖거나, 제2 코어 조절 영역은 서열번호:18에 대해 적어도 75% 서열 동일성, 예컨대 적어도 80%, 또는 적어도 90% 서열 동일성 중 적어도 임의의 하나를 갖는다.

구체적으로, 제1 및 제2 코어 조절 영역 각각은 8-16 nt의 길이를 갖는다.

구체적으로, 제1 코어 조절 영역은 8 내지 10 nt, 특히 9 nt의 길이를 갖는다. 구체적으로, 제1 코어 조절 영역은 서열번호:17, 또는 서열번호:17로 식별된 뉴클레오티드 서열의 변형을 포함하거나 또는 이로 이루어지며, 여기서 변형은 최대 1 또는 2 개의 점 돌연변이이며, 특히 여기서 1 개의 점 돌연변이는 하나의 뉴클레오티드의 치환, 삽입, 또는 결실 중 임의의 하나이다.

구체적으로, 제2 코어 조절 영역은 14 내지 16 nt, 특히 15 nt의 길이를 갖는다. 구체적으로, 제2 코어 조절 영역은 서열번호:18, 또는 서열번호:18로 식별된 뉴클레오티드 서열의 변형을 포함하거나 또는 이로 이루어지며, 여기서 변형은 최대 1, 2 또는 3 개의 점 돌연변이이며, 특히 여기서 1 개의 점 돌연변이는 하나의 뉴클레오티드의 치환, 삽입, 또는 결실 중 임의의 하나이다.

구체적으로, ECP는 적어도 하나의 제1 및 적어도 하나의 제2 코어 조절 영역을 임의의 순서로, 바람직하게는 서로 아주 근접하여, 예를 들어 가장 가까운 제1 및 제2 코어 조절 영역 사이의 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 또는 10 nt 중 임의의 하나까지 포함한다.

구체적으로, ECP는 스페이서를 통해 연결되며, 특히 5, 6, 7, 8, 9, 10 nt 중 적어도 임의의 하나, 및/또는 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 또는 10 중 임의의 하나까지의 길이를 갖는 뉴클레오티드 서열(본원에서 "스페이서 코어 영역"으로 언급됨)에 의해 분리되는 하나의 제1 및 하나의 제2 코어 조절 영역을 포함한다. 특히, 스페이서 코어 영역은 서열번호:36에 대해 적어도 75% 서열 동일성, 예컨대 적어도 80%, 또는 적어도 90% 서열 동일성 중 적어도 임의의 하나를 갖고/갖거나, 서열번호:36, 또는 서열번호:36으로 식별된 뉴클레오티드 서열의 변형을 포함하거나 또는 이로 이루어지며, 여기서 변형은 4 개의 점 돌연변이 중 최대 1, 2, 3 개이며, 특히 여기서 1 개의 점 돌연변이는 하나의 뉴클레오티드의 치환, 삽입, 또는 결실 중 임의의 하나이다. 구체적으로, 스페이서 코어 영역은 뉴클레오티드 서열을 포함하거나 또는 이로 이루어지며 여기서 대부분의 뉴클레오티드(적어도 50% 또는 적어도 60%)는 G, C, 또는 T로부터 선택된다.

구체적으로, ECP는 5'-단부에서 3'단부까지 다음 3 개의 인접한 요소, (i) 제1 코어 조절 영역, (ii) 스페이서 코어 영역, 및 (iii) 제2 코어 조절 영역으로 이루어진 뉴클레오티드 서열로 이루어진 적어도 하나의 영역을 포함하며, 이는 본원에서 "주 조절 영역"으로 언급된다.

구체적으로, ECP는 적어도 하나의 또는 2 개, 또는 단지 1 또는 2 개의 주 조절 영역을 포함하며, 각각은 서열번호:35에 대해 85%, 90%, 또는 95% 서열 동일성 중 적어도 임의의 하나를 갖는 뉴클레오티드 서열을 포함하거나 또는 이로 이루어진다. 이러한 주 조절 영역은 바람직하게는 제1 코어 조절 영역, 스페이서 코어 영역 및 제2 코어 조절 영역으로 이루어진다.

구체적으로, ECP는 서열번호:35에 대해 85%, 90%, 또는 95% 서열 동일성 중 적어도 임의의 하나를 갖는 적어도 하나의 폴리뉴클레오티드 서열을 포함한다.

구체적으로, ECP는 본원에 기재된 바와 같이 단지 1, 2 또는 3 개의 주 조절 영역을 포함하며, 특히 여기서 주 조절 영역의 수는 2 또는 3 개이며, 여기서 상기 2 또는 3 개의 조절 영역은 서로 동일하거나 또는 상이할 수 있다. 구체적으로, ECP는 단지 2 개의 주 조절 영역을 포함하며, 이는 50, 60, 70, 80, 90, 100 nt 중 적어도 임의의 하나, 및/또는 500, 450, 400, 350, 또는 300 nt 중 임의의 하나까지, 특히 100 내지 300 nt 범위의 길이를 갖는 뉴클레오티드 서열(본원에서 "스페이서 주 영역"으로 언급됨)에 의해 분리된다. 구체적으로, 스페이서 주 영역은 서열번호:37에 대해 적어도 60% 서열 동일성, 예컨대 적어도 70%, 75%, 80%, 85%, 90%, 또는 95% 서열 동일성 중 적어도 임의의 하나를 갖고/갖거나 서열번호:37, 또는 서열번호:37로 식별된 뉴클레오티드 서열의 변형을 포함하거나 또는 이로 이루어진 50, 60, 70, 80, 90, 100 nt 길이 중 적어도 임의의 하나의 뉴클레오티드 서열을 포함하며, 여기서 변형은 하나 이상, 최대 30, 25, 20, 15, 또는 10 개의 점 돌연변이 중 임의의 하나인 점 돌연변이의 수이며, 특히 여기서 1 개의 점 돌연변이는 하나의 뉴클레오티드의 치환, 삽입, 또는 결실 중 임의의 하나이다.

구체적 측면에 따르면, ECP는 뉴클레오티드 서열로 이루어진 적어도 하나의 T 모티프를 포함하며 여기서 대다수의 뉴클레오티드는 티민(T)이며, 예를 들어 바람직하게는 50%, 60%, 70%, 80%, 90% 또는 100% 중 적어도 임의의 하나는 T이며, 임의적으로 상기 T 모티프의 5' 또는 3' 단부 중 어느 하나에서 하나 이상의 추가(또는 인접한) 티민에 의한 상기 T 모티프의 연장 없이, 서열번호:19-34 중 임의의 하나를 포함하거나 또는 이로 이루어진다.

구체적으로, ECP는 상기 T 모티프 중 단지 1 또는 2 개, 또는 상기 T 모티프의 적어도 2 개, 최대 4 개, 또는 3 개의 T 모티프를 포함하며, 여기서 상기 T 모티프는 서로 동일하거나 또는 상이하다.

구체적으로, ECP는 주 조절 영역의 상류 또는 하류에 있는 T 모티프 중 적어도 하나, 예를 들어, 주 조절 영역의 상류에 있는 1 개(또는 1 또는 2 개)의 T 모티프 및 하류에 있는 1 개(또는 1 또는 2 개)의 T 모티프를 포함한다. 그러나, 구체적 구현예에 따르면, ECP는 상기 T 모티프 중 적어도 하나, 특히 스페이서 주 영역 내에 단지 1 또는 2 개의 T 모티프를 포함한다.

구체적으로, ECP는 예를 들어, 350, 400, 450, 500, 550, 600, 650, 700, 850, 900, 950, 또는 1000 bp 중 적어도 임의의 하나, 최대 2000 bp, 또는 최대 1500 bp의 길이를 갖는다.

구체적으로, ECP는 예를 들어 번역 개시 부위의 적어도 일부를 포함하는 3'-말단을 포함하여 최대 50, 40, 30, 20, 10, 9, 8, 7, 6, 또는 5 nt 길이의 3'-말단 뉴클레오티드 서열, 예를 들어 서열번호:38, 서열번호:39, 또는 서열번호:40 중 임의의 하나와 60%, 70%, 80%, 85% 또는 적어도 90% 중 적어도 임의의 하나와 동일한 서열을 포함한다. 번역 개시 부위는 진핵생물에서 Kozak 공통 서열 및 유전자 발현을 지지하기에 적합한 프로모터 서열일 수 있다.

구체적 측면에 따르면, ECP는 특히 전장이 1000 nt 미만인 경우, 전술한 뉴클레오티드 서열 중 임의의 것의 전장까지 서열 서열번호:10, 서열번호:11, 서열번호:12, 서열번호:13, 서열번호:14, 서열번호:15, 또는 서열번호:16 중 임의의 하나, 또는 서열번호:41-45 중 임의의 하나의 전사 인자 결합 부위(TFBS)를 포함하는 영역 내, 및/또는 3' 단부를 포함하는 3' 말단 서열 내에서, 예를 들어, 적어도 300(연속적) nt, 특히 300, 350, 400, 450, 500, 550, 600, 650, 700, 850, 900, 950, 또는 1000 nt 중 적어도 임의의 하나에 대해 60%, 65%, 70%, 75%, 또는 80% 서열 동일성 중 적어도 임의의 하나, 특히 85%, 90%, 또는 95% 서열 동일성 중 적어도 임의의 하나를 포함하거나, 또는 100% 동일하다.

구체적 측면에 따르면, ECP는 전장 서열 서열번호:10, 서열번호:11, 서열번호:12, 서열번호:13, 서열번호:14, 서열번호:15, 또는 서열번호:16 중 임의의 하나, 또는 서열번호:41-45 중 임의의 하나에 대해 60%, 65%, 70%, 75%, 또는 80% 서열 동일성 중 임의의 하나, 특히 85%, 90%, 또는 95% 서열 동일성 중 임의의 하나를 포함하거나, 또는 100% 동일하다.

구체적 구현예는 서열번호:10 또는 서열번호:11을 포함하거나 또는 이로 이루어지거나 또는 각각 서열번호:10, 서열번호:11, 서열번호:12, 서열번호:13, 서열번호:14, 서열번호:15, 또는 서열번호:16의 전장 서열 중 임의의 하나, 또는 서열번호:41-45 중 임의의 하나에 대해 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 서열 동일성 중 적어도 임의의 하나를 갖거나, 또는 100% 동일한 뉴클레오티드 서열을 포함하거나 또는 이로 이루어진 ECP를 지칭한다.

구체적으로, ECP 프로모터는 300, 400, 500, 600, 700, 800, 900 또는 1000 bp 중 적어도 임의의 하나의 길이를 갖는 서열번호:10 또는 서열번호:11의 적어도 일부 또는 단편을 포함하거나 또는 이로 이루어지며, 특히 이는 TFBS 및/또는 3' 말단을 포함한다.

구체적으로, ECP의 제1 및 제2 코어 조절 영역, 또는 ECP의 주 조절 영역 중 임의의 것은 하나 이상의 TFBS를 함유한다. 구체적으로, ECP의 상기 제1 및 제2 코어 조절 영역 각각, 또는 상기 제1 및 제2 코어 조절 영역 모두 함께, 또는 상기 주 조절 영역 각각은 기능적으로 간주되고 각각의 전사 인자에 의해 인식되는 TFBS 또는 적어도 이의 일부를 포함한다.

구체적으로, TFBS는 Rgt1(예를 들어, 서열번호:47을 포함하거나 또는 이로 이루어짐), Cat8-1(예를 들어, 서열번호:48을 포함하거나 또는 이로 이루어짐) 및 Cat8-2(예를 들어, 서열번호:49를 포함하거나 또는 이로 이루어짐)로 이루어진 군으로부터 선택된 전사 인자 중 임의의 하나 이상에 의해 인식된다.

TFBS는 특정 공통 서열을 특징으로 하며, 이는 동일한 인자에 대해 달라질 수 있다. 특이적 전사 인자는 다음과 같이 식별된다:

Rgt1은 글루코스-반응성 전사 활성인자 및 저해인자이며 이는 여러 글루코스 수송체(HXT) 유전자의 발현을 조절한다. 피. 파스토리스의 Rgt1은 아미노산 서열 서열번호:47을 포함한다.

Cat8-1 및 Cat8-2는 비발효성 성장 조건 하에 다양한 유전자의 탈억제에 필요한 탄소 공급원 반응 요소에 결합하는 아연 클러스터 전사 활성인자이다. 피. 파스토리스의 Cat8-1 및 Cat8-2는 각각 아미노산 서열 서열번호:48 및 서열번호:49를 포함한다.

구체적 측면에 따르면, ECP는 적어도 2, 3, 4, 5, 6, 7 또는 8 개의 TFBS를 포함하며, 여기서 각각의 TFBS는 Rgt1, Cat8-1 또는 Cat8-2 중 임의의 것에 의해 개별적으로 인식된다.

구체적으로, ECP는 참조 프로모터와 비교하여 증가된 프로모터 강도를 특징으로 하며, 여기서

- 프로모터 강도는 참조 프로모터의 프로모터 강도와 동일하거나 또는 더 높으며, 특히 유도된 상태에 있을 때 1.1-배, 1.2-배, 1.3-배, 1.4-배, 1.5-배, 1.6-배, 1.7-배, 1.8-배, 1.9-배, 2-배, 2.1-배, 2.2-배, 2.3-배, 2.4-배, 2.5-배, 2.6-배, 2.7-배, 2.8-배, 2.9-배, 3-배, 3.3-배, 3.5-배, 3.8-배, 4-배, 4.5-배, 5-배, 5.5-배, 또는 적어도 6-배 중 적어도 임의의 하나로 증가된다.

특히, 숙주 세포의 천연 pGAP 프로모터, 구체적으로 재조합 POI 생산에 사용되는 숙주 세포에 내인성이고 자연 발생하는 pGAP 프로모터, 예를 들어, 서열번호:46을 포함하거나 또는 이로 이루어진 피. 파스토리스에서 GAPDH의 발현을 제어하는 데 사용되는 바와 같은 피. 파스토리스의 천연 pGAP 프로모터는 개선된 ECP 프로모터 강도를 결정하기 위해 피. 파스토리스 숙주 세포에서 참조로서 역할을 할 수 있다. 이러한 참조 프로모터는 동일한 숙주 세포 및 발현 시스템을 사용하는 동시 실험에 사용되거나, 또는 동일한 숙주 세포 배양물 내에서 내부 대조군으로 사용될 수 있다. 참조 프로모터와 비교하여 프로모터 기능을 한정하는 이러한 대조 실험은 바람직하게는 피. 파스토리스 숙주 세포 배양물, 특히 GFP 또는 eGFP와 같은 모델 단백질을 발현하는 재조합 피. 파스토리스에서 수행된다. 참조 프로모터 강도와 비교하여 프로모터 강도는 다음 표준 검정에 의해 결정될 수 있다: 시험될 프로모터의 제어 하에 eGFP를 발현하는 피. 파스토리스 균주를 웰 당 2 mL 배양물과 함께 280 rpm으로 진탕하면서 25℃에서 24-깊은 웰 플레이트에서 스크리닝한다. 글루코스 공급 비드(6mm, Kuhner, 스위스 소재)를 사용하여 글루코스-제한 성장 조건을 생성한다. 세포를 유도된 상태(YP + 1 공급 비드, 20-28 시간 동안)에서 eGFP 발현에 대해 분석한다.

구체적 측면에 따르면, 본원에 기재된 ECP의 상대적 프로모터 또는 전사 강도 또는 속도는 POI를 생산하기 위해 숙주로 사용되는 동일한 종 또는 균주의 세포의 천연 pGAP 프로모터와 비교된다.

구체적으로, 참조 프로모터는 숙주 세포의 천연 pGAP 프로모터이다. 예를 들어, 피. 파스토리스(GS115)에서 GAPDH의 발현을 제어하는 데 사용될 때, 예를 들어 서열번호:46으로 식별된 서열을 포함하거나 또는 이로 이루어진 피. 파스토리스에서 비변형된 내인성 프로모터 서열인 피. 파스토리스의 천연 pGAP 프로모터가 피. 파스토리스에서 참조 프로모터로서 사용될 수 있다. 피. 파스토리스가 본원에 기재된 바와 같이 POI를 생산하기 위한 재조합 숙주 세포로서 사용되는 경우, 본원에 기재된 ECP의 전사 강도 또는 속도는 피. 파스토리스의 이러한 천연 pGAP 프로모터와 편리하게 비교된다.

피. 파스토리스(GS115)의 예시적인 천연 pGAP 프로모터 서열(서열번호:46)

또 다른 예에 따르면, 에스. 세레비지애의 천연 pGAP 프로모터는 에스. 세레비지애에서 GAPDH의 발현을 제어하는 데 사용될 때, 에스. 세레비지애에서 비변형된 내인성 프로모터 서열인 참조 프로모터로서 사용될 수 있다. 에스. 세레비지애가 본원에 기재된 바와 같이 POI를 생산하기 위한 재조합 숙주 세포로서 사용되는 경우, 본원에 기재된 ECP의 전사 강도 또는 속도는 에스. 세레비지애의 이러한 천연 pGAP 프로모터와 편리하게 비교된다.

구체적으로, 프로모터 강도는 참조 프로모터와 비교하여 모델 단백질(예를 들어, 녹색 형광 단백질, 예를 들어, 향상된 GFP를 포함한 GFP, eGFP, Gene Bank 수탁 번호 U57607)과 같은 POI의 발현 수준, 및/또는 전사 강도에 의해 결정된다. 바람직하게는, 전사 분석은 정량적 또는 반정량적이며, 바람직하게는 qRT-PCR, DNA 마이크로어레이, RNA 서열분석 및 전사체 분석을 이용한다.

구체적으로, ECP는 추가로 억제된 상태에서의 낮은 수준과 비교하여, 완전히 유도된 상태에서의 높은 강도를 특징으로 하는 프로모터 유도비를 특징으로 한다.

프로모터 유도비는 구체적으로 전사의 유도를 지칭하며, 구체적으로 상기 POI의 추가 번역 및 임의적 발현을 포함한다. 전사는 전형적으로 프로모터 강도의 측정으로 결정되며 구체적으로 상기 프로모터를 완전히 유도할 때 수득된 전사체의 양을 지칭한다. 상기 전사체 풍부도는 완전히 유도된 상태에서의 전사 강도에 의해 결정될 수 있으며, 이는 예를 들어, 글루코스-제한된 케모스태트 배양 조건 하에 수득되고 참조 프로모터의 전사 속도와 관련하여 발현된다.

유도비는 ECP의 탄소 공급원 조절을 결정하는 주요 매개변수이며, 유도된 상태에서 프로모터 활성 또는 강도를 억제된 상태에서 프로모터 활성 또는 강도와 비교하여 설정한다. 예를 들어, 리포터 단백질(예를 들어, GFP 또는 eGFP)의 발현 수준 및/또는 억제된 상태에서 전사 수준은 과잉 글리세롤에 의해 억제될 때 결정되고, 모델 단백질의 발현 수준 및/또는 전사 수준은 글루코스 공급을 제한함으로써 유도될 때 유도된 상태에서 결정된다.

ECP 프로모터는 배양 조건이 거의 최대 유도, 예를 들어 0.4 g/L 미만, 바람직하게는 0.04 g/L 미만, 구체적으로 0.02 g/L 미만의 글루코스 농도에서 제공되는 경우 탈억제되고 완전히 유도되는 것으로 간주된다. 완전히 유도된 프로모터는 천연 pGAP 프로모터와 비교하여 바람직하게는 적어도 20%, 보다 바람직하게는 적어도 30%, 40%, 50%, 60%, 70%, 80%, 90% 및 적어도 100%의 전사 수준/강도 또는 적어도 150% 또는 적어도 200%의 훨씬 더 높은 전사 수준/강도를 나타낸다. 전사 수준/강도는 예를 들어 액체 배양물에서 클론을 배양할 때 eGFP와 같은 리포터 유전자의 전사 양에 의해 결정될 수 있다. 대안적으로, 전사 속도는 마이크로어레이 상에서 고유하게 제어된 유전자의 전사 강도에 의해 결정될 수 있으며, 여기서 마이크로어레이 데이터는 억제 및 탈억제 상태 사이의 발현 수준 차이 및 대조군과 비교하여 완전히 유도된 상태에서 높은 신호 강도를 나타낸다.

구체적으로, 유도비는 유도된 상태 대 억제된 상태에서 발현 수준의 (예를 들어 GFP 또는 eGFP와 같은 모델 단백질의) 비율에 의해 결정될 수 있다. 참조 프로모터와 비교하여 유도비는 다음 표준 검정에 의해 결정될 수 있다: 테스트될 프로모터의 제어 하에 eGFP를 발현하는 피. 파스토리스 균주를 웰 당 2 mL 배양물과 함께 280 rpm으로 진탕하면서 25℃에서 24-깊은 웰 플레이트에서 스크리닝한다. 글루코스 공급 비드(6mm, Kuhner, 스위스 소재)를 사용하여 글루코스-제한 성장 조건을 생성한다. 세포를 억제(YP + 1% 글리세롤, 대수증식기) 및 유도(YP + 1 공급 비드, 20-28 시간 동안) 동안 eGFP 발현에 대해 분석한다.

구체적으로, ECP 프로모터는 탈억제된(유도된) 상태에서 프로모터 활성 또는 강도(예를 들어, 전사 활성 또는 전사 강도)를 가지며, 이는 억제된 상태에서보다 1.5, 2.0, 2.5, 3, 3.5, 4, 4.5, 5, 5.5, 6, 6.5, 7, 7.5, 8, 8.5, 9, 9.5, 또는 10 배 중 적어도 임의의 하나로 더 높다. 따라서, 각각의 유도 속도는 1.5, 2.0, 2.5, 3, 3.5, 4, 4.5, 5, 5.5, 6, 6.5, 7, 7.5, 8, 8.5, 9, 9.5, 또는 10 중 적어도 임의의 하나일 수 있다.

놀랍게도 flo8 유전자좌를 포함하고 FLO8 단백질을 생산하는 야생형 균주와 비교하여 flo8 녹아웃 균주에서 본원에 기재된 ECP의 전사 활성(또는 전사 강도)(완전히 유도된 경우, 예를 들어 글루코스-제한 유도 조건 하에)은 1.5-배, 1.6-배, 1.7-배, 1.8-배, 1.9-배, 2-배, 3-배, 4-배, 5-배, 6-배, 7-배, 8-배, 9-배, 또는 10-배 이상 중 적어도 임의의 하나와 같이 훨씬 더 높은 것으로 밝혀졌다. 본원에 기재된 숙주 세포에서 전사 강도는 상당히 증가하여 flo8 결실 돌연변이체에서 ECP의 제어 하에 GOI의 높은 발현 수준을 허용하는 것으로 밝혀졌다. 대조적으로, pGAP 또는 pAOX로부터의 전사는 flo8 결실 돌연변이체에서 증가하지 않는다(비교예에서 결정된 바와 같음).

구체적 측면에 따르면, 이종 발현 카세트는 자율 복제 벡터 또는 플라스미드에 포함되거나, 또는 상기 숙주 세포의 염색체 내에서 통합된다.

발현 카세트는 숙주 세포에 도입되고 예를 들어 특정 통합 부위에서 또는 무작위로 통합된 염색체내 요소로서 숙주 세포 게놈(또는 이의 염색체 중 임의의 것)에 통합될 수 있으며, 그 결과 높은 생산자 숙주 세포주가 선택된다. 대안적으로, 발현 카세트는 플라스미드 또는 인공 염색체 예를 들어, 효모 인공 염색체(YAC)와 같은 염색체외 유전적 요소 내에서 통합될 수 있다. 구체적 예에 따르면, 발현 카세트는 적합한 형질전환 기술에 의해 숙주 세포에 도입되는 벡터, 특히 발현 벡터에 의해 숙주 세포에 도입된다. 이 목적을 위해, GOI는 발현 벡터로 결찰될 수 있다.

바람직한 효모 발현 벡터(효모에서 발현을 위해 바람직하게 사용되는 것)는 pPICZ, pGAPZ, pPIC9, pPICZ알파, pGAPZ알파, pPIC9K, pGAPHis, pPUZZLE 또는 GoldenPiCS로부터 유래된 플라스미드로 이루어진 군으로부터 선택된다.

벡터 또는 플라스미드를 도입하기 위해 숙주 세포를 형질감염 또는 형질전환시키는 기술은 당업계에 잘 알려져 있다. 이들은 전기천공법, 세포벽불완전제거(spheroplasting), 지질 소포 매개 흡수, 열 충격 매개 흡수, 칼슘 포스페이트 매개 형질감염(칼슘 포스페이트/DNA 공침전), 바이러스 감염, 및 특히, 예를 들어, 변형된 아데노바이러스, 미세주사 및 전기천공법과 같은 변형된 바이러스를 사용하는 것을 포함할 수 있다.

본원에 기재된 바와 같은 형질전환체는 발현 카세트, 벡터 또는 플라스미드 DNA를 숙주 세포에 도입하고 관련 단백질 또는 선택 마커를 발현하는 형질전환체를 선택함으로써 수득될 수 있다. 숙주 세포는 전기 펄스 방법, 원형질체 방법, 리튬 아세테이트 방법, 및 이의 변형된 방법과 같은 숙주 세포의 형질전환에 통상적으로 사용되는 방법에 의해 이종 또는 외래 DNA를 도입하도록 처리될 수 있다. 피. 파스토리스는 바람직하게는 전기천공법에 의해 형질전환된다. 미생물에 의한 재조합 DNA 단편의 흡수를 위한 바람직한 형질전환 방법은 화학적 형질전환, 전기천공법 또는 원형질체 형성에 의한 형질전환을 포함한다.

구체적으로, 발현 카세트는 POI를 암호화하는 GOI에 작동가능하게 연결된 ECP를 포함하며, 임의적으로 분비된 단백질로서 POI를 발현 및 생산하는 데 필요한 신호 및 리더 서열을 추가로 포함한다.

구체적 측면에 따르면, 발현 카세트는 바람직하게는 POI의 분비를 가능하게 하는 신호 펩티드를 암호화하는 뉴클레오티드 서열을 추가로 포함하며 여기서 신호 펩티드를 암호화하는 뉴클레오티드 서열은 GOI의 5'-단부에 인접하게, 또는 직접적으로 융합된다.

구체적으로, 신호 펩티드는 피. 파스토리스 산 포스파타제 유전자(PHO1) 및 세포외 단백질 X(EPX1)로부터의 신호 펩티드인 에스. 세레비지애 알파-결합 인자 전전구 펩티드로부터의 신호 서열로 이루어진 군으로부터 선택된다(Heiss, S., V. Puxbaum, C. Gruber, F. Altmann, D. Mattanovich & B. Gasser, Microbiology 2015;161(7):1356-68).

구체적으로, WO2014067926 A1에 기재된 바와 같은 신호 및/또는 리더 서열 중 임의의 것, 특히 서열번호:59 또는 서열번호:60이 사용될 수 있다.

구체적으로, WO2012152823 A1에 기재된 바와 같은 신호 서열, 특히 서열번호:61로 식별된 에스. 세레비지애의 천연 알파 결합 인자, 또는 이의 돌연변이체의 신호 서열이 사용될 수 있다.

구체적 측면에 따르면, 본원에 기재된 숙주 세포는 예를 들어 단백질 생산을 개선하기 위해 하나 이상의 추가의 유전적 변형을 겪을 수 있다.

구체적으로, 숙주 세포는 프로테아제 결핍 균주, 특히 카복시펩티다제 Y 활성이 결핍된 균주를 생성하는 데 사용되는 단백질 가수분해 활성에 영향을 미치는 하나 이상의 유전자를 변형시키도록 추가로 조작된다. 특정 예는 WO1992017595A1에 기재되어 있다. 프로테아제 A 또는 프로테아제 B와 같은 배큘로 프로테아제의 기능적 결핍이 있는 프로테아제 결핍 피키아 균주의 추가 예는 US6153424A에 기재되어 있다. 추가 예는 ade2 결실을 갖는 피키아 균주이고/이거나, 프로테아제 유전자인 PEP4 및 PRB1 중 하나 또는 둘 다의 결실은 예를 들어, ThermoFisher Scientific에 의해 제공된다.

구체적으로, 숙주 세포는 WO2010099195A1에 개시된 바와 같이, PEP4, PRB1, YPS1, YPS2, YMP1, YMP2, YMP1, DAP2, GRHl, PRD1, YSP3, 및 PRB3으로 이루어진 군으로부터 선택된 기능적 유전자 산물, 특히 프로테아제를 암호화하는 적어도 하나의 핵산 서열울 변형하도록 조작된다.

헬퍼 인자를 암호화하는 유전자의 과발현 또는 과소발현은 구체적으로 예를 들어 WO2015158800A1에 기재된 바와 같이 GOI의 발현을 향상시키기 위해 적용된다.

다음 유전자의 과발현은 피. 파스토리스에서 POI 분비를 증가시키는 것으로 나타났다: PP7435_Chr3-0607, PP7435_Chr3-0933, PP7435_Chr2-0220, PP7435_Chr3-0639, PP7435_Chr4-0108, PP7435_Chr1-1232, PP7435_Chr1-1225, PP7435_Chr1-0667, 및 PP7435_Chr4-0448.

다음 유전자의 과소발현은 피. 파스토리스에서 POI 분비를 증가시키는 것으로 나타났다: PP7435_Chr1-0176, PP7435_Chr3-1062, 및 PP7435_Chr4-0252.

특히, 숙주 세포는 헬퍼 인자 중 임의의 하나 이상을 과발현하고 서열번호:62-71 중 임의의 하나에 의해 식별된 각각의 단백질의 생산을 증가시키도록 조작되어, POI 수율을 추가로 증가시킬 수 있다. POI는 진핵, 원핵 또는 합성 펩티드, 폴리펩티드, 단백질, 또는 숙주 세포의 대사산물 중 임의의 하나일 수 있다.

구체적으로, POI는 숙주 세포 종에 이종이다.

구체적으로, POI는 분비된 펩티드, 폴리펩티드, 또는 단백질이며, 즉 숙주 세포에서 세포 배양 상청액으로 분비된다.

구체적으로, POI는 진핵 단백질, 바람직하게는 인간 단백질 또는 인간 단백질 서열을 포함하는 단백질과 같은 포유류 유래 또는 관련 단백질, 또는 박테리아 단백질 또는 박테리아 유래 단백질이다.

바람직하게는, POI는 포유동물에서 기능하는 치료 단백질이다.

구체적 경우에, POI는 다량체 단백질, 구체적으로 이량체 또는 사량체이다.

구체적 측면에 따르면, POI는 항원 결합 단백질, 치료 단백질, 효소, 펩티드, 단백질 항생제, 독소 융합 단백질, 탄수화물 - 단백질 접합체, 구조적 단백질, 조절 단백질, 백신 항원, 성장 인자, 호르몬, 사이토카인, 공정 효소, 및 대사 효소로 이루어진 군으로부터 선택된 펩티드 또는 단백질이다.

구체적으로, 항원 결합 단백질은 하기로 이루어진 군으로부터 선택된다:

a) 항체 또는 항체 단편, 예컨대 키메라 항체, 인간화 항체, 이중특이적 항체, Fab, Fd, scFv, 디아바디(diabody), 트리아바디(triabody), Fv 사량체, 미니바디(minibody), VH, VHH, IgNAR, 또는 V-NAR과 같은 단일-도메인 항체 중 임의의 것;

b) 항체 모방체, 예컨대 아드넥틴(Adnectin), 아피바디(Affibody), 아필린(Affilin), 아피머(Affimer), 아피틴(Affitin), 알파바디(Alphabody), 안티칼린(Anticalin), 아비머(Avimer), DARPin, 피노머(Fynomer), 쿠니츠(Kunitz) 도메인 펩티드, 모노바디(Monobody), 또는 NanoCLAMPS; 또는

c) 하나 이상의 면역글로불린-폴드 도메인, 항체 도메인 또는 항체 모방체를 포함하는 융합 단백질.

특이적 POI는 항체, 또는 이의 단편, 특히 항원 결합 도메인을 포함하는 항체 단편과 같은 항원 결합 분자이다. 특이적 POI 중에는 모노클로날 항체(mAb), 면역글로불린(Ig) 또는 면역글로불린 클래스 G(IgG), 중쇄 항체(HcAb's)와 같은 항체, 또는 단편-항원 결합(Fab), Fd, 단일-쇄 가변 단편(scFv)과 같은 이의 단편, 또는 예를 들어 Fv 이량체(디아바디), Fv 삼량체(트리아바디), Fv 사량체, 또는 미니바디 및 VH, VHH, IgNAR, 또는 V-NAR과 같은 단일-도메인 항체와 같은 이의 조작된 변이체, 또는 면역글로불린-폴드 도메인을 포함하는 임의의 단백질이 있다. 추가의 항원 결합 분자는 예를 들어, 조작된 쿠니츠 도메인, 아드넥틴, 아피바디, 아필린, 안티칼린, 또는 DARPin과 같은 항체 모방체, 또는 (대체) 스캐폴드 단백질로부터 선택될 수 있다.

구체적 측면에 따르면, POI는 예를 들어 다음과 같다: 보톡스(BOTOX), 마이오블록(Myobloc), 뉴로블록(Neurobloc), 디스포트(Dysport)(또는 모툴리눔 신경독소의 다른 혈청형), 알글루코시다제 알파, 답토마이신, YH-16, 코리오고나도트로핀 알파, 필그라스팀, 세트로렐릭스, 인터류킨-2, 알데스류킨, 테셀류린, 데닐류킨 디프티톡스, 인터페론 알파-n3(주사), 인터페론 알파-nl, DL-8234, 인터페론, 선토리(Suntory)(감마-1a), 인터페론 감마, 티모신 알파 1, 타소네르민, DigiFab, ViperaTAb, EchiTAb, CroFab, 네시리티드, 아바타셉트, 알레파셉트, 레비프(Rebif), 엡토테르민알파, 테리파라티드(골다공증), 칼시토닌 주사용(골 질환), 칼시토닌(비강, 골다공증), 에타네르셉트, 헤모글로빈 글루타머 250(소), 드로트레코긴 알파, 콜라게나제, 카르페리티드, 재조합 인간 상피 성장 인자(국소 겔, 상처 치유), DWP401, 다르베포에틴 알파, 에포에틴 오메가, 에포에틴 베타, 에포에틴 알파, 데시루딘, 레피루딘, 비발리루딘, 노나코그 알파, 모노닌(Mononine), 엡타코그 알파(활성화), 재조합 인자 VIII+VWF, 레콤비네이트(Recombinate), 재조합 인자 VIII, 인자 VIII(재조합), 알픈메이트(Alphnmate), 옥토코그 알파, 인자 VIII, 팔리페르민, 인디키나제, 테넥테플라제, 알테플라제, 파미테플라제, 레테플라제, 나테플라제, 몬테플라제, 폴리트로핀 알파, rFSH, hpFSH, 미카푼긴, 페그필그라스팀, 레노그라스팀, 나르토그라스팀, 세르모렐린, 글루카곤, 엑세나티드, 프람린티드, 이니글루세라제, 갈술파제, 류코트로핀(Leucotropin), 몰그라모스티른, 트립토렐린 아세테이트, 히스트렐린(피하 이식, Hydron), 데슬로렐린, 히스트렐린, 나파렐린, 류프롤리드 지속 방출 데포(ATRIGEL), 류프롤리드 이식(DUROS), 고세렐린, 유트로핀(Eutropin), KP-102 프로그램, 소마트로핀, 메카세르민(성장 부전), 엔파비르티드, Org-33408, 인슐린 글라르긴, 인슐린 글룰리신, 인슐린(흡입), 인슐린 리스포, 인슐린 데테르니르, 인슐린(협측, RapidMist), 메카세르민 린파베이트, 아나킨라, 셀몰류킨, 99 mTc-아프시티드 주사, 마이어로피드, 베타세론, 글라티라머 아세테이트, 게폰(Gepon), 사르그라모스팀, 오프렐베킨, 인간 백혈구 유래 알파 인터페론, 빌리브(Bilive), 인슐린(재조합), 재조합 인간 인슐린, 인슐린 아스파르트, 메카세닌, 로페론(Roferon)-A, 인터페론-알파 2, 알파페론(Alfaferone), 인터페론 알파콘-1, 인터페론 알파, 아노벡스(Avonex)의 재조합 인간 황체형성 호르몬, 도르나제 알파, 트라페르민, 지코노티드, 탈티렐린, 디보테르민알파, 아토시반, 베카플레르민, 엡티피바티드, 제마이라(Zemaira), CTC-111, Shanvac-B, HPV 백신(4가), 옥트레오티드, 란레오티드, 안세스티른, 아갈시다제 베타, 아갈시다제 알파, 라로니다제, 프레자티드 구리 아세테이트(국소 겔), 라스부리카제, 라니비주맙, 악티뮨(Actimmune), PEG-인트론, 트리코민(Tricomin), 재조합 집먼지 진드기 알레르기 둔감화 주사, 재조합 인간 부갑상선 호르몬(PTH) 1-84(sc, 골다공증), 에포에틴 델타, 유전자이식 항트로빈 III, 그란디트로핀(Granditropin), 비트라제(Vitrase), 재조합 인슐린, 인터페론-알파(경구 로젠지), GEM-21S, 바프레오티드, 이두르술파제, 옴나파트리라트, 재조합 혈청 알부민, 세르톨리누맙 페골, 글루카르피다제, 인간 재조합 C1 에스테라제 억제제(혈관부종), 라노테플라제, 재조합 인간 성장 호르몬, 엔푸비르티드(무바늘 주사, Biojector 2000), VGV-1, 인터페론(알파), 루시낙탄트, 아비프타딜(흡입, 폐 질환), 이카티반트, 에칼란티드, 오미가난, 아우로그랍(Aurograb), 펙시가난아세테이트, ADI-PEG-20, LDI-200, 데가렐릭스, 신트레델린베수도톡스, Favld, MDX-1379, ISAtx-247, 리가글루티드, 테리파라티드(골다공증), 티파코긴, AA4500, T4N5 리포솜 로션, 카투막소맙, DWP413, ART-123, 크리살린(Chrysalin), 데스모테플라제, 아메디플라제, 코리폴리트로핀알파, TH-9507, 테두글루티드, Diamyd, DWP-412, 성장 호르몬(지속 방출 주사), 재조합 G-CSF, 인슐린(흡입, AIR), 인슐린(흡입, Technosphere), 인슐린(흡입, AERx), RGN-303, DiaPep277, 인터페론 베타(C형 간염 바이러스 감염(HCV)), 인터페론 알파-n3(경구), 벨라타셉트, 경피성 인슐린 패치, AMG-531, MBP-8298, 세레셉트(Xerecept), 오페바칸, AIDSVAX, GV-1001, 림포스캔(LymphoScan), 란피르나제, 리폭시산(Lipoxysan), 루수풀티드, MP52(베타-트리칼슘포스페이트 캐리어, 골 재생), 흑색종 백신, 시플류셀-T, CTP-37, 인세기아(Insegia), 비테스펜, 인간 트롬빈(동결, 외과적 출혈), 트롬빈, TransMID, 알피메프라제, 푸리카제(Puricase), 테를리프레신(정맥내, 간신 증후군), EUR-1008M, 재조합 FGF-I(주사가능, 혈관 질환), BDM-E, 로티갑티드, ETC-216, P-113, MBI-594AN, 듀라마니신(흡입, 낭포성 섬유증), SCV-07, OPI-45, 엔도스타틴(Endostatin), 안지오스타틴(Angiostatin), ABT-510, 바우만 버트 억제제 농축액(Bowman Birk Inhibitor Concentrate), XMP-629, 99 mTc-Hynic-Annexin V, 카할라리드 F, CTCE-9908, 테베렐릭스(연장 방출), 오자렐릭스, 로르니뎁신, BAY-504798, 인터류킨4, PRX-321, 펩스캔(Pepscan), 이복타데킨, 락토페린, TRU-015, IL-21, ATN-161, 실렌기티드, 알부페론(Albuferon), 비파식스(Biphasix), IRX-2, 오메가 인터페론, PCK-3145, CAP-232, 파시레오티드, huN901-DMI, 난소암 면역요법 백신, SB-249553, Oncovax-CL, OncoVax-P, BLP-25, CerVax-16, 다중 에피토프 펩티드 흑색종 백신(MART-1, gp100, 티로시나제), 네미피티드, rAAT(흡입), rAAT(피부과용), CGRP(흡입, 천식), 페그수네르셉트, 티모신베타4, 플리티뎁신, GTP-200, 라모플라닌, GRASPA, OBI-1, AC-100, 살몬 칼시토닌(경구, 엘리겐), 칼시토닌(경구, 골다공증), 엑사모렐린, 카프로모렐린, 카르데바(Cardeva), 벨라페르민, 131I-TM-601, KK-220, T-10, 울라리티드, 데펠레스태트, 헤마티드, 크리살린(국소), rNAPc2, 재조합 인자 V111(페길화 리포솜), bFGF, 페길화 재조합 스타필로키나제 변이체, V-10153, 솔로라이시스 프롤리제(SonoLysis Prolyse), 뉴로백스(NeuroVax), CZEN-002, 섬 세포 신생 요법, rGLP-1, BIM-51077, LY-548806, 엑세나티드(제어 방출, Medisorb), AVE-0010, GA-GCB, 아보렐린, ACM-9604, 리나클로티드 에아세테이트, CETi-1, 헤모스팬(Hemospan), VAL(주사가능), 급속 작용 인슐린(주사가능, Viadel), 비강내 인슐린, 인슐린(흡입), 인슐린(경구, 엘리겐), 재조합 메틸오닐 인간 렙틴, 피트라킨라 피하 주사, 습진), 피트라킨라(흡입 건조 분말, 천식), 멀티킨(Multikine), RG-1068, MM-093, NBI-6024, AT-001, PI-0824, Org-39141, Cpn10(자가면역 질환/염증), 탈락토페린(국소), rEV-131(안과용), rEV-131(호흡기 질환), 경구 재조합 인간 인슐린(당뇨병), RPI-78M, 오프렐베킨(경구), CYT-99007 CTLA4-Ig, DTY-001, 발라테그래스트, 인터페론 알파-n3(국소), IRX-3, RDP-58, 타우페론(Tauferon), 담즙 염 자극 리파제, 메리스파제(Merispase), 알랄린 포스파타제, EP-2104R, 멜라노탄(Melanotan)-II, 브레멜라노티드, ATL-104, 재조합 인간 마이크로플라스민, AX-200, SEMAX, ACV-1, Xen-2174, CJC-1008, 디노르핀 A, SI-6603, LAB GHRH, AER-002, BGC-728, 말라리아 백신(비로좀, PeviPRO), ALTU-135, 파보바이러스 B19 백신, 인플루엔자 백신(재조합 뉴라미니다제), 말라리아/HBV 백신, 탄저병 백신, Vacc-5q, Vacc-4x, HIV 백신(경구), HPV 백신, 태트 톡소이드(Tat Toxoid), YSPSL, CHS-13340, PTH(1-34) 리포솜 크림(Novasome), 오스타볼린(Ostabolin)-C, PTH 유사체(국소, 건선), MBRI-93.02, MTB72F 백신(결핵), MVA-Ag85A 백신(결핵), FARA04, BA-210, 재조합 플래그 FIV 백신, AG-702, OxSODrol, rBetV1, Der-p1/Der-p2/Der-p7 알레르겐-표적화 백신(먼지 진드기 알레르기), PR1 펩티드 항원(백혈병), 돌연변이체 ras 백신, HPV-16 E7 리포펩티드 백신, 미로 백신(선암종), CML 백신, WT1-펩티드 백신(암), IDD-5, CDX-110, 펜트리스(Pentrys), 노렐린(Norelin), CytoFab, P-9808, VT-111, 이크로캅티드, 텔베르민(피부과용, 당뇨병성 족부 궤양), 루핀트리비르, 레티쿨로제, rGRF, HA, 알파-갈락토시다제 A, ACE-011, ALTU-140, CGX-1160, 안지오텐신 치료 백신, D-4F, ETC-642, APP-018, rhMBL, SCV-07(경구, 결핵), DRF-7295, ABT-828, ErbB2-특이적 면역독소(항암), DT3SSIL-3, TST-10088, PRO-1762, 콤보톡스(Combotox), 콜레시스토키닌-B/가스트린-수용체 결합 펩티드, 111In-hEGF, AE-37, 트라스니주맙-DM1, 길항제 G, IL-12(재조합), PM-02734, IMP-321, rhIGF-BP3, BLX-883, CUV-1647(국소), L-19 기반 방사선면역요법제(암), Re-188-P-2045, AMG-386, DC/1540/KLH 백신(암), VX-001, AVE-9633, AC-9301, NY-ESO-1 백신(펩티드), NA17.A2 펩티드, 흑색종 백신(펄스 항원 치료제), 전립선암 백신, CBP-501, 재조합 인간 락토페린(안구 건조), FX-06, AP-214, WAP-8294A(주사가능), ACP-HIP, SUN-11031, 펩티드 YY [3-36](비만, 비강내), FGLL, 아타시셉트, BR3-Fc, BN-003, BA-058, 인간 부갑상선 호르몬 1-34(비강, 골다공증), F-18-CCR1, AT-1100(셀리악병/당뇨병), JPD-003, PTH(7-34) 리포솜 크림(Novasome), 듀라마니신(안과용, 안구 건조), CAB-2, CTCE-0214, 글리코페길화 에리트로포이에틴, EPO-Fc, CNTO-528, AMG-114, JR-013, 인자 XIII, 아미노칸딘, PN-951, 716155, SUN-E7001, TH-0318, BAY-73-7977, 테베렐릭스(즉시 방출), EP-51216, hGH(제어 방출, Biosphere), OGP-I, 시푸비르티드, TV4710, ALG-889, Org-41259, rhCC10, F-991, 티모펜틴(폐 질환), r(m)CRP, 간선택적 인슐린, 수발린, L19-IL-2 융합 단백질, 엘라핀, NMK-150, ALTU-139, EN-122004, rhTPO, 트롬보포이에틴 수용체 작용제(혈소판감소증), AL-108, AL-208, 신경 성장 인자 길항제(통증), SLV-317, CGX-1007, INNO-105, 경구 테리파라티드(엘리겐), GEM-OS1, AC-162352, PRX-302, LFn-p24 융합 백신(Therapore), EP-1043, S 뉴모니애 소아 백신, 말라리아 백신, 수막염균 그룹 B 백신, 신생아 그룹 B 연쇄상구균 백신, 탄저병 백신, HCV 백신(gpE1+gpE2+MF-59), 중이염 요법, HCV 백신(코어 항원+ISCOMATRIX), hPTH(1-34)(경피성, ViaDerm), 768974, SYN-101, PGN-0052, 아비스쿰닌, BIM-23190, 결핵 백신, 다중 에피토프 티로시나제 펩티드, 암 백신, 엔카스팀, APC-8024, GI-5005, ACC-001, TTS-CD3, 혈관 표적 TNF(고형 종양), 데스모프레신(협측 제어 방출), 오네르셉트, 또는 TP-9201, 아달리무맙(HUMIRA), 인플릭시맙(REMICADE™), 리툭시맙(RITUXAN™/MAB THERA™), 에타네르셉트(ENBREL™), 베바시주맙(AVASTIN™), 트라스투주맙(HERCEPTIN™), 페그릴그라스팀(NEULASTA™), 또는 바이오시밀러 및 바이오베터를 포함한 임의의 다른 적합한 POI.

구체적 측면에 따르면, 숙주 세포는 임의의 동물 세포, 척추동물 세포, 포유류 세포, 인간 세포, 식물 세포, 선충 세포, 곤충 세포 또는 연체동물 세포와 같은 무척추동물 세포, 전술한 것 중 임의의 것으로부터 유래된 줄기 세포, 또는 진균 세포 또는 효모 세포일 수 있다. 구체적으로 숙주 세포는 피키아, 한세눌라, 코마가타엘라, 사카로마이세스, 클루이베로마이세스(Kluyveromyces), 칸디다(Candida), 오가타에아, 야로위아, 및 지오트리쿰(Geotrichum), 구체적으로 사카로마이세스 세레비지애, 피키아 파스토리스, 오가타에아 미누타(Ogataea minuta), 클루이베롬세스 락티스(Kluyveromces lactis), 클루이베로메스 마르시아누스(Kluyveromes marxianus), 야로위아 리폴리티카 또는 한세눌라 폴리모르파로 이루어진 군으로부터 선택된 속, 또는 아스페르길루스 아와모리 또는 트리코더마 레세이와 같은 사상성 진균의 세포이다. 바람직하게는, 숙주 세포는 메탄올자화 효모, 바람직하게는 피키아 파스토리스이다. 본원에서 피키아 파스토리스는 코마가타엘라 파스토리스, 코마가타엘라 파피이 및 코마가타엘라 슈도파스토리스 모두에 대해 동의어로 사용된다.

구체적 측면에 따르면, 숙주 세포는 다음과 같다:

a) 피키아, 한세눌라, 코마가타엘라, 사카로마이세스, 클루이베로마이세스, 칸디다, 오가타에아, 야로위아, 및 지오트리쿰으로 이루어진 군으로부터 선택된 속, 예컨대 피키아 속(예를 들어 피키아 파스토리스, 피키아 메타놀리카(Pichia methanolica), 피키아 클루이베리(Pichia kluyveri), 및 피키아 안구스타(Pichia angusta)), 코마가타엘라 속(예를 들어, 코마가타엘라 파스토리스, 코마가타엘라 슈도파스토리스 또는 코마가타엘라 파피이), 사카로마이세스 속(예를 들어 사카로마이에스 세레비재(Saccharomyces cerevisae), 사카로마이세스 클루이베리(Saccharomyces kluyveri), 사카로마이세스 우바룸(Saccharomyces uvarum)), 클루이베로마이세스 속(예를 들어 클루이베로마이세스 락티스(Kluyveromyces lactis), 클루이베로마이세스 마르시아누스(Kluyveromyces marxianus)), 칸디다 속(예를 들어 칸디다 우틸리스(Candida utilis), 칸디다 카카오이(Candida cacaoi), 칸디다 보이디니이(Candida boidinii),), 지오트리쿰 속(예를 들어 지오트리쿰 퍼멘탄스(Geotrichum fermentans)), 한세눌라 폴리모르파, 야로위아 리폴리티카, 또는 스키조사카로마이세스 폼베(Schizosaccharomyces pombe)의 효모 세포; 또는

b) 아스페르길루스 아와모리 또는 트리코더마 레세이와 같은 사상성 진균의 세포.

종 피키아 파스토리스가 바람직하다. 구체적으로, 숙주 세포는 CBS 704, CBS 2612, CBS 7435, CBS 9173-9189, DSMZ 70877, X-33, GS115, KM71, KM71H 및 SMD1168로 이루어진 군으로부터 선택된 피키아 파스토리스 균주이다.

공급원: CBS 704(=NRRL Y-1603 = DSMZ 70382), CBS 2612(=NRRL Y-7556), CBS 7435(=NRRL Y-11430), CBS 9173-9189(CBS 균주: CBS-KNAW Fungal Biodiversity Centre, Centraalbureau voor Schimmelculturen, 네덜란드 위트레흐트 소재), 및 DSMZ 70877(German Collection of Microorganisms and Cell Cultures); X-33, GS115, KM71, KM71H 및 SMD1168과 같은 Invitrogen으로부터의 균주.

바람직한 에스. 세레비지애 균주의 예는 W303, CEN.PK 및 BY-시리즈(EUROSCARF 콜렉션)를 포함한다. 상기 기재된 모든 균주는 형질전환체를 생산하고 이종 유전자를 발현하는 데 성공적으로 사용되었다.

구체적 측면에 따르면, 진핵 숙주 세포는 진균 세포(예를 들어, 아스페르길루스(예컨대 에이. 니게르(A. niger), 에이. 푸미가투스(A. fumigatus), 에이. 오리재(A. oryzae), 에이. 니둘란스(A. nidulans)), 아크레모니움(Acremonium)(예컨대 에이. 써모필룸(A. thermophilum)), 카에토미움(Chaetomium)(예컨대 씨. 써모필룸(C. thermophilum)), 크리소스포리움(예컨대 씨. 써모필레(C. thermophile)), 코르디셉스(Cordyceps)(예컨대 씨. 밀리타리스(C. militaris)), 코리나스쿠스, 크테노마이세스(Ctenomyces), 푸사리움(Fusarium)(예컨대 에프. 옥시스포룸(F. oxysporum)), 글로메렐라(Glomerella)(예컨대 지. 그라미니콜라(G. graminicola)), 하이포크레아(Hypocrea)(예컨대 에이치. 예코리나(H. jecorina)), 마그나포르테(Magnaporthe)(예컨대 엠. 오리재(M. oryzae)), 마이셀리오프토라(Myceliophthora)(예컨대 엠. 써모필레(M. thermophile)), 네크트리아(Nectria)(예컨대 엔. 해마토코카(N. haematococca)), 뉴로스포라(Neurospora)(예컨대 엔. 크라싸(N. crassa)), 페니실리움(Penicillium), 스포로트리쿰(Sporotrichum)(예컨대 에스. 써모필레(S. thermophile)), 티엘라비아(Thielavia)(예컨대 티. 테레스트리스(T. terrestris), 티. 헤테로탈리카(T. heterothallica)), 트리코더마(Trichoderma)(예컨대 티. 레세이(T. reesei)), 또는 버티실리움(Verticillium)(예컨대 브이. 달리아(V. dahlia)))일 수 있다.

구체적 측면에 따르면, 포유류 세포는 인간 또는 설치류 또는 소 세포, 세포주 또는 세포 균주이다. 본원에 기재된 숙주 세포로서 적합한 특이적 포유류 세포의 예는 마우스 골수종(NSO)-세포주, 차이니즈 햄스터 난소(CHO)-세포주, HT1080, H9, HepG2, MCF7, MDBK Jurkat, MDCK, NIH3T3, PC12, BHK(새끼 햄스터 신장 세포), VERO, SP2/0, YB2/0, Y0, C127, L 세포, COS, 예를 들어, COS1 및 COS7, QC1-3, HEK-293, VERO, PER.C6, HeLA, EBl, EB2, EB3, 종양용해성 또는 하이브리도마-세포주이다. 바람직하게는 포유류 세포는 CHO-세포주이다. 일 구현예에서, 세포는 CHO 세포이다. 일 구현예에서, 세포는 CHO-K1 세포, CHO-K1 SV 세포, DG44 CHO 세포, DUXB11 CHO 세포, DUKX CHO 세포, CHO-S, CHO FUT8 녹아웃 CHO GS 녹아웃 세포, CHO FUT8 GS 녹아웃 세포, CHOZN, 또는 CHO-유래 세포이다. CHO GS 녹아웃 세포(예를 들어, GSKO 세포)는 예를 들어, CHO-K1 SV GS 녹아웃 세포이다. CHO FUT8 녹아웃 세포는 예를 들어, Potelligent® CHOK1 SV(Lonza Biologics, Inc.)이다. 진핵 세포는 또한 예를 들어, EBx® 세포, EB14, EB24, EB26, EB66, 또는 EBvl3과 같은 새의 세포, 세포주 또는 세포 균주를 포함한다.

또 다른 구체적 측면에 따르면, 진핵 세포는 곤충 세포(예를 들어, Sf9, Mimic™ Sf9, Sf21, High FiveTM(BT1-TN-5B1-4), 또는 BT1-Ea88 세포), 조류 세포(예를 들어, 속 암포라(Amphora), 규조류(Bacillariophyceae), 두나리엘라(Dunaliella), 클로렐라(Chlorella), 클라미도모나스(Chlamydomonas), 시아노피타(Cyanophyta)(시아노박테리아), 난노클로롭시스(Nannochloropsis), 스피룰리나(Spirulina), 또는 오크로모나스(Ochromonas)의 것), 또는 식물 세포(예를 들어, 외떡잎 식물(예를 들어, 옥수수, 벼, 밀, 또는 강아지풀), 또는 쌍떡잎 식물(예를 들어, 카사바, 감자, 대두, 토마토, 담배, 알파파, 피지코미트렐라 파텐스(Physcomitrella patens) 또는 애기장대)로부터의 세포이다.

구체적 측면에 따르면, 숙주 세포는 원핵 세포 예를 들어 박테리아 세포이다. 구체적으로, 숙주 세포는 바실루스(Bacillus), 스트렙토마이세스 스트렙토코쿠스(Streptomyces Streptococcus), 스타필로코쿠스(Staphylococcus) 또는 락토바실루스(Lactobacillus)와 같은 그람-양성 세포이다. 사용될 수 있는 바실루스는 예를 들어 비.서브틸리스(B.subtilis), 비.아밀로리케파시엔스(B.amyloliquefaciens), 비.리케니포르미스(B.licheniformis), 비.나토(B.natto), 또는 비.메가테리움(B.megaterium)이다. 구현예에서, 세포는 비.서브틸리스 3NA 및 비.서브틸리스 168과 같은 비.서브틸리스이다. 바실루스는 예를 들어, 43210-1214 오하이오주 콜럼버스 웨스트 12번가 484 바이오로지칼 사이언시스 556 소재의 바실루스 유전 스톡 센터(Bacillus Genetic Stock Center)에서 수득가능하다.

일 구현예에서, 원핵 세포는 살모넬라 종(Salmonella spp.) 또는 예를 들어, TG1, TG2, W3110, DH1, DHB4, DH5a, HMS 174, HMS174(DE3), NM533, C600, HB101, JM109, MC4100, XL1-Blue 및 오리가미(Origami)와 같은 에스케리키아 콜라이(Escherichia coli), 뿐만 아니라 예를 들어 BL-21 또는 BL21(DE3)과 같은 이.콜라이(E.coli) B-균주로부터 유래된 것들과 같은 그람-음성 세포이며, 이들 모두는 상업적으로 이용가능하다.

구체적 구현예에 따르면, 원핵 세포는 이.콜라이, 비. 서브틸리스, 및 슈도모나스(Pseudomonas)로 이루어진 군으로부터 선택된다.

적합한 숙주 세포는 예를 들어, DSMZ(Deutsche Sammlung von Mikroorganismen and Zellkulturen GmbH, 독일 브라운슈바이크 소재) 또는 어메리칸 타입 컬쳐 콜렉션(ATCC)과 같은 배양 콜렉션으로부터 상업적으로 이용가능하다.

구체적 측면에 따르면, 본 발명은 숙주 세포에서 서열번호:1로 식별된 아미노산 서열을 포함하는 FLO8 단백질 또는 이의 상동체를 암호화하는 유전자, 특히 상기 숙주 세포에 내인성인 상기 FLO8 단백질을 암호화하는 유전자의 발현을 감소시킴으로써, 비-메탄올 탄소 공급원(특히, 본원에 기재된 ECP)에 의해 조절가능하거나 또는 억제가능한 프로모터의 제어 하에 관심 단백질(POI)을 암호화하는 관심 유전자(GOI)를 발현하는 숙주 세포에 의해 생산된 상기 POI의 수율을 증가시키는 방법을 제공한다.

구체적으로, 수율은 다음과 같은 상기 GOI를 발현하는 비슷한 숙주 세포와 비교하여, 1.2 배, 1.3 배, 1.4 배, 1.5 배, 1. 6 배, 1.7 배, 1.8 배, 1.9 배, 2.0 배, 2.1 배, 2.2 배, 2.3 배, 2.4 배, 2.5 배, 2.6 배, 2.7 배, 2.8 배, 2.9 배, 3 배, 3.5 배, 4 배, 5 배, 5.5 배, 6 배, 6.5 배, 7 배, 7.5 배, 8 배, 8.5 배, 9 배, 9.5 배, 10 배, 10.5 배, 11 배, 11.5 배, 또는 12 배 중 적어도 임의의 하나만큼 증가된다:

a) 내인성 FLO8 단백질를 암호화하는 상기 유전자의 발현을 감소시키도록 조작되지 않았거나, 또는 여기서 내인성 FLO8 단백질을 암호화하는 상기 유전자의 발현이 변형되지 않고; 임의적으로

b) 여기서 상기 GOI의 발현을 제어하는 프로모터는 구성적 프로모터, 특히 GAP 프로모터, 또는 메탄올-유도성 프로모터, 특히 AOX1 프로모터임.

구체적으로, 본원에 기재된 POI 생산 수율을 증가시키는 방법은 본원에 추가로 기재된 바와 같은 재조합 숙주 세포를 이용한다.

추가의 구체적 측면에 따르면, 본 발명은 관심 단백질(POI)을 생산하는 조건 하에 본원에 추가로 기재된 바와 같은 재조합 숙주 세포를 배양함으로써 관심 유전자(GOI)에 의해 암호화된 상기 POI를 생산하는 방법을 제공한다.

추가의 구체적 구현예에 따르면, 본 발명은 POI의 생산을 위한 본원에 기재된 숙주 세포의 용도를 제공한다.

구체적으로, 숙주 세포는 세포 배양물에서 배양된 세포주, 특히 생산 숙주 세포주이다.

구체적 구현예에 따르면, 세포주는 회분(batch), 유가(fed-batch) 또는 연속 배양 조건 하에 배양된다. 배양은 마이크로타이터 플레이트, 진탕 플라스크, 또는 생물반응기에서 수행될 수 있고, 임의적으로 제1 단계로서 회분 단계로 시작하여, 제2 단계로 유가 단계 또는 연속 배양 단계가 이어진다.

구체적으로, 방법은 다음 단계를 포함한다:

a) 성장 조건 하에 숙주 세포를 배양하는 단계; 및 추가 단계

b) 최대 1 g/L의 제2 비-메탄올 탄소 공급원의 존재 하에 성장-제한 조건 하에 숙주 세포를 배양하여, 상기 GOI를 발현시켜 상기 POI를 생산하는 단계.

구체적으로, 제2 단계 b)는 제1 단계 a)를 따른다.

구체적으로, 제1 탄소 공급원은 본원에서 기저 탄소 공급원으로 지칭되는 비-메탄올 탄소 공급원이다.

구체적으로, 숙주 세포는 제1 단계에서 예를 들어 세포 배양물에서 숙주 세포의 성장을 가능하게 하기에 충분한 양으로 제1 탄소 공급원을 포함하는 세포 배양 배지에서 성장 조건 하에, 임의적으로 탄소 공급원의 양이 소모될 때까지 배양되며, 추가 배양은 성장-제한 조건 하에 수행될 수 있다.

구체적으로, 제2 탄소 공급원은 본원에서 보충 탄소 공급원으로 지칭되는 비-메탄올 탄소 공급원이다.

구체적으로, 상기 제1 및/또는 제2 탄소 공급원은 본원에 추가로 기재된 바와 같은 사카라이드, 폴리올, 알코올, 또는 전술한 것 중 임의의 하나 이상의 혼합물로부터 선택된다.

구체적 구현예에 따르면, 기저 탄소 공급원은 보충 탄소 공급원과 상이하며, 예를 들어 정량적으로 및/또는 정성적으로 상이하다. 정량적 차이는 전형적으로 프로모터 활성을 억제 또는 탈억제하는 상이한 조건을 제공한다.

추가의 구체적 구현예에 따르면 기저 및 보충 탄소 공급원은 동일한 유형의 분자 또는 탄수화물을 바람직하게는 상이한 농도로 포함한다. 추가의 구체적 구현예에 따르면, 탄소 공급원은 2 개 이상의 상이한 탄소 공급원의 혼합물이다.

임의의 유형의 유기 탄소 공급원, 특히 숙주 세포 배양, 특히 진핵 숙주 세포 배양에 전형적으로 사용되는 것들이 사용될 수 있다. 구체적 구현예에 따르면, 탄소 공급원은 글루코스, 프룩토스, 갈락토스 또는 만노스와 같은 헥소스, 사카로즈와 같은 디사카라이드, 글리세롤 또는 에탄올과 같은 알코올, 또는 이의 혼합물이다.

구체적으로 바람직한 구현예에 따르면, 기저 탄소 공급원은 글루코스, 글리세롤, 에탄올, 또는 이의 혼합물로 이루어진 군으로부터 선택된다. 바람직한 구현예에 따르면, 기저 탄소 공급원은 글리세롤이다.

추가의 구체적 구현예에 따르면, 보충 탄소 공급원은 글루코스, 프룩토스, 갈락토스 및 만노스와 같은 헥소스, 사카로즈와 같은 디사카라이드, 글리세롤 또는 에탄올과 같은 알코올, 또는 이의 혼합물이다. 바람직한 구현예에 따르면, 보충 탄소 공급원은 글루코스이다.

구체적으로,

a) 기저 탄소 공급원은 글루코스, 글리세롤, 에탄올, 이의 혼합물로 이루어진 군으로부터 선택되고;

b) 보충 탄소 공급원은 글루코스, 프룩토스, 갈락토스 또는 만노스와 같은 헥소스, 사카로즈와 같은 디사카라이드, 글리세롤 또는 에탄올과 같은 알코올, 또는 전술한 것 중 임의의 것의 혼합물이다.

상기 배양 단계는 모두 구체적으로 상기 탄소 공급원의 존재 하에 세포주를 배양하는 것을 포함한다. 예를 들어, 상기 성장 조건 하에 숙주 세포를 배양하는 단계(단계 a)는 기저 탄소 공급원을 사용하여 수행되며; 성장-제한 조건 하에 상기 숙주 세포를 배양하는 단계(단계 b)는 세포 배양 배지가 배양 단계(단계 b) 동안 세포 배양 배지 또는 상청액에 최대 1 g/L의 보충 탄소 공급원을 포함하거나 또는 심지어 검출가능한 양의 보충 탄소 공급원이 없도록 제한된 양으로 보충 탄소 공급원을 사용하여 수행된다.

탈억제(또는 유도) 조건은 적절하게 특이적 수단에 의해 달성될 수 있다. 제2 단계 b)는 임의적으로 세포 배양 배지 또는 상청액에서 보충 탄소 공급원을 제한된 양으로 제공하거나 또는 제공하지 않는 공급 배지를 이용한다. 구체적으로, 공급 배지는 화학적으로 정의되고 메탄올이 없다.

구체적으로, 제2 단계 b)는 0.0001 h^-1 내지 0.2 h^-1, 바람직하게는 0.005 h^-1 내지 0.15 h^-1 범위 내에서 특이적 성장 속도를 유지하기 위해 성장 제한량으로 보충 탄소 공급원을 제공하는 공급 배지를 이용한다.

공급 배지는 액체 형태 또는 달리 고체와 같은 대체 형태, 예를 들어 정제 또는 다른 지속 방출 수단, 또는 가스로 배양 배지에 첨가될 수 있다. 그러나, 바람직한 구현예에 따르면 세포 배양 배지에 첨가되는 보충 탄소 공급원의 제한된 양은 심지어 0일 수 있다. 바람직하게는, 제한된 탄소 기질의 조건 하에, 배양 배지에서 보충 탄소 공급원의 검출가능한 농도는 0-1 g/L, 바람직하게는 0.9, 0.8, 0.7, 0.6, 0.5, 0.4, 0.3, 0.2, 0.1 g/L 중 임의의 하나 미만, 바람직하게는 90, 80, 70, 60, 50, 40, 30, 20, 또는 10 mg/L 중 임의의 하나 미만, 또는 심지어 9, 8, 7, 6, 5, 4, 3, 2, 또는 1 mg/L 미만, 또는 구체적으로 1-50 mg/L, 또는 1-10 mg/L, 구체적으로 바람직하게는 1 mg/L 또는 심지어 미만, 예컨대 적합한 표준 검정으로 측정된, 예를 들어 성장 세포 배양에 의해 소비될 때 배양 배지에서 잔류 농도로 결정된 검출 한계 미만이다.

바람직한 방법에서, 제한된 양의 보충 공급원은 생산 단계의 끝에서 또는 발효 공정의 결과에서, 바람직하게는 발효 생성물을 수확할 때 발효 브로쓰에서 결정된 바와 같은 검출 한계 미만인 세포 배양물의 잔류량을 제공한다.

구체적으로, 상기 단계 a) 배양은 회분 단계에서 수행되고; 상기 단계 b) 배양은 유가 또는 연속 배양 단계에서 수행된다.

구체적으로, 숙주 세포는 특히 생산 단계에서 세포 배양을 유지할 때 완전히 소비되는 탄소 공급원의 양만을 포함하는 정의된 최소 배지를 공급함으로써, 탄소 공급원을 제한하면서 고성장 속도 단계 동안(성장 조건 하에), 단계 a)(예를 들어 적어도 50%, 또는 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 최대 성장 속도까지) 기저 탄소 공급원을 포함하고 저성장 속도 단계 동안(성장-제한 조건 하에), 단계 b)(예를 들어 최대 성장 속도의 90% 미만, 바람직하게는 80% 미만, 70% 미만, 60% 미만, 50% 미만, 또는 40% 미만, 30% 미만, 20% 미만, 10% 미만, 5% 미만, 3% 미만, 2% 미만, 1% 미만, 0.5% 미만, 0.4% 미만, 0.3% 미만, 또는 0.2% 미만) POI를 생산하는 탄소 공급원 풍부 배지에서 성장된다.

구체적으로, POI는 예를 들어 세포주를 최대 성장 속도 미만의 성장 속도, 전형적으로 세포의 최대 성장 속도의 90% 미만, 바람직하게는 80% 미만, 70% 미만, 60% 미만, 50% 미만, 40% 미만, 30% 미만, 20% 미만, 10% 미만, 5% 미만, 3% 미만, 2% 미만, 1% 미만, 0.5% 미만, 0.4% 미만, 0.3% 미만, 또는 0.2% 미만으로 배양함으로써 상기 성장-제한 조건 하에 발현된다. 전형적으로 최대 성장 속도는 각 유형의 숙주 세포에 대해 개별적으로 결정된다.

구체적으로, 회분 단계는 세포 배양물에 초기에 첨가된 기저 탄소 공급원이 세포주에 의해 소비될 때까지 수행된다. 용존 산조(DO) 스파이크 방법을 사용하여 회분 단계 동안 기저 탄소 공급원 소비를 결정할 수 있다.

구체적 구현예에 따르면, 회분 단계는 산소 분압(pO2) 신호의 연속적인 감소를 특징으로 하며 여기서 회분 단계의 끝은 pO2의 증가를 특징으로 한다. 전형적으로, 회분 단계 동안 기저 탄소 공급원을 소비하고 회분 단계에서 전형적인 추가 탄소 공급원을 첨가하지 않으면서, 산소 분압(pO2) 신호는 예를 들어 30%와 같이 예를 들어 65% 미만까지 연속적으로 감소될 것이다. 기저 탄소 공급원을 소비할 때, pO2는 예를 들어 65% 초과와 같이 예를 들어 30% 초과까지 증가할 수 있거나, 또는 탄소 공급원 제한 조건 하에 추가 탄소 공급원을 첨가하기 위해 공급 배지를 사용하는 유가 시스템으로 전환하는 적절한 시점을 추가로 나타낸다.

구체적으로, pO2는 회분 단계 동안 65% 미만 또는 그 이하의 포화 상태로 감소된 다음 회분의 끝에 65% 초과 또는 그 이상의 포화 상태로 증가한다. 구체적으로, 회분 단계는 산소 분압(pO2) 신호가 65% 초과 포화 상태, 구체적으로 70%, 75%, 80%, 또는 85% 중 임의의 것의 초과로 증가할 때까지 수행된다.

구체적으로, 회분 단계는 약 10 내지 36 시간 동안 수행된다.

배양 시간과 관련하여 용어 "약"은 +/-5% 또는 +/-10%를 의미할 것이다.

예를 들어, 약 10 내지 36 시간의 구체적 회분 수행 시간은 18 내지 39.6 시간, 구체적으로 19 내지 37.8 시간일 수 있다.

구체적 구현예에 따르면, 회분 단계는 회분 배지에서 기저 탄소 공급원으로 40 내지 50 g/L 글리세롤, 구체적으로 45 g/L 글리세롤을 사용하여 수행되며, 배양은 약 27 내지 30 시간 동안 25℃, 또는 약 23 내지 36 시간 동안 30℃, 또는 23 내지 36 시간의 배양 시간 동안 25℃ 내지 30℃의 임의의 온도에서 수행된다. 회분 배지에서 글리세롤 농도가 낮아지면 회분 단계의 길이가 감소할 수 있는 반면, 회분 배지에서 글리세롤이 증가하면 심지어 회분 단계를 연장할 것이다. 글리세롤에 대한 대안으로, 글루코스가 예를 들어 거의 동일한 양으로 사용될 수 있다.

회분 단계 뒤에 유가 단계가 이어지는 세포 배양 및 POI 발현의 전형적인 시스템에서, 구체적으로, 유가 단계에서의 배양은 약 15 내지 80 시간, 약 15 내지 70 시간, 약 15 내지 60 시간, 약 15 내지 50 시간, 약 15 내지 45 시간, 약 15 내지 40 시간, 약 15 내지 35 시간, 약 15 내지 30 시간, 약 15 내지 35 시간, 약 15 내지 25 시간, 또는 약 15 내지 20 시간 중 임의의 하나; 바람직하게는 약 20 내지 40 시간 동안 수행된다. 구체적으로, 유가 단계에서의 배양은 약 80 시간, 약 70 시간, 약 60 시간, 약 55 시간, 약 50 시간, 약 45 시간, 약 40 시간, 약 35 시간, 약 33 시간, 약 30 시간, 약 25 시간, 약 20 시간, 또는 약 15 시간 중 임의의 하나 동안 수행된다.

성공적인 POI 생산을 초래하여 고수율을 수득하는 120 시간 미만 또는 100 시간 미만 또는 최대 80 시간의 임의의 유가 배양은 본원에서 "속도 발효"라고 언급된다. 구체적으로, 부피 특이적 생성물 형성 속도(rP)는 단위 부피(L) 및 단위 시간(h) 당 형성된 생성물의 양(mg)이다(mg(L h)^-1). 부피 특이적 생성물 형성 속도가 또한 공간 시간 수율(STY) 또는 부피 생산성으로 명명된다.

구체적으로, 본원에 기재된 방법 중 유가 배양은 약 30 mg(L h)^-1(30 mg(L h)^-1 +/-5% 또는 +/-10% 의미)의 공간 시간 수율이 되도록 수행된다. 구체적으로 약 30 mg(L h)^-1의 공간 시간 수율은 약 30 시간 유가 내에서 달성되며, 구체적으로 33 시간, 32 시간, 31 시간, 30 시간, 29 시간, 28 시간, 27 시간, 26 시간, 또는 25 시간의 유가 시간 중 임의의 하나 미만 내에서 27, 28, 29, 30, 31, 32, 또는 33 mg(L h)^-1중 적어도 임의의 것이 달성될 수 있다.

구체적으로, 회분 단계는 제1 단계 a)에서 수행되고, 유가 단계는 제2 단계 b)에서 수행된다.

구체적으로, 제2 단계 b)는 0.0001 h^-1 내지 0.2 h^-1, 바람직하게는 0.2, 0.15, 0.1 h^-1 또는 0.15 h^-1 중 임의의 것 미만의 범위 내에서 특이적 성장 속도를 유지하기 위해 성장 제한량으로 보충 탄소 공급원을 제공하는 유가 단계에서 공급 배지를 이용한다.

구체적으로, 회분 및 유가 배양 단계를 모두 포함하는 배양 방법은 특히 효모 숙주 세포, 예를 들어 사카로마이세스 속 또는 피키아 속 또는 코마가타엘라 속 중 임의의 것의 효모, 또는 케이. 락티스(K. lactis), 제트. 룩시이(Z. rouxii), 피. 스티피티스(P. stipitis), 에이치. 폴리모르파(H. polymorpha), 또는 와이. 리폴리티카(Y. lipolytica)와 같은 피키아 이외의 속으로부터의 효모, 바람직하게는 피키아 파스토리스 또는 코마가타엘라 파스토리스를 이용할 수 있다.

추가의 구체적 측면에 따르면, 본 발명은 다음 단계를 포함하는, 숙주 세포에서 관심 단백질(POI)을 생산하는 방법을 제공한다:

a) 서열번호:1로 식별된 아미노산 서열을 포함하는 FLO8 단백질 또는 이의 상동체를 암호화하는 내인성 유전자의 발현을 감소시키도록 숙주 세포를 유전적으로 조작하는 단계;

b) 관심 유전자(GOI)에 작동가능하게 연결된, 비-메탄올 탄소 공급원에 의해 조절가능하거나 또는 억제가능한 발현 카세트 프로모터(ECP)의 제어 하에 상기 POI를 암호화 또는 발현하는 GOI를 포함하는 이종 발현 카세트를 숙주 세포에 도입하는 단계;

c) 상기 POI를 생산하기 위한 조건 하에 상기 숙주 세포를 배양하는 단계;

d) 임의적으로 세포 배양물로부터 상기 POI를 단리하는 단계; 및

e) 임의적으로 상기 POI를 정제하는 단계.

구체적으로, 본원에 기재된 방법의 단계 a)는 단계 b) 전에, 또는 이후에, 또는 동시에 수행된다.

구체적 측면에 따르면, 숙주 세포는 POI를 생산하도록 조작되기 전에 먼저 상기 FLO8 단백질 또는 이의 각각의 상동체의 발현을 감소시키도록 유전적으로 변형된다. 구체적 예에 따르면, 야생형 숙주 세포는 본원에 기재된 방법의 단계 a)에 따라 유전적으로 변형된다. 구체적으로, 숙주 세포는 상기 FLO8 단백질 또는 이의 각각의 상동체의 감소를 위해 상기 하나 이상의 유전적 변형을 야생형 숙주 세포 균주에 도입할 때 제공된다.

추가의 측면에 따르면, 숙주 세포는 상기 FLO8 단백질 또는 이의 각각의 상동체를 감소시키도록 추가로 유전적으로 변형되기 전에, 먼저 이종 또는 재조합 POI를 생산하기 위해 조작된다. 구체적 예에 따르면, 야생형 숙주 세포는 먼저 POI 생산을 위한 발현 카세트를 포함하도록 조작될 수 있다. 그런 다음 이러한 조작된 숙주 세포는 본원에 기재된 바와 같은 상기 FLO8 단백질 또는 이의 각각의 상동체를 감소시키도록 추가로 변형될 수 있다.

추가의 측면에 따르면, 숙주 세포는 하나의 방법 단계에서, 예를 들어, 하나 이상의 반응 혼합물에서 각각의 발현 카세트, 시약 및 도구를 이용하여 POI 생산을 위한 조작 및 상기 FLO8 단백질 또는 이의 각각의 상동체의 감소를 위한 유전적 변형을 모두 겪고 있다.

구체적으로, 방법은 본원에 추가로 기재된 바와 같이 재조합 숙주 세포를 생산하기 위한 방법 단계를 이용한다.

구체적으로, 이종 발현 카세트는 본원에 추가로 기재된 바와 같이 ECP를 포함한다.

구체적으로, POI는 적절한 배지에서 숙주 세포를 배양하고, 세포를 분리할 때 세포 배양물, 특히 세포 배양 상청액 또는 배지로부터 발현된 PPI를 단리하고, 특히 세포로부터 POI를 분리하고 적합한 수단에 의해 정제할 때 이를 발현된 생성물에 대해 적절한 방법에 의해 정제함으로써 생산될 수 있다. 이에 의해, 정제된 POI 제제가 생산될 수 있다.

도 1: 본원에 언급된 서열

명세서 전반에 걸쳐 사용된 바와 같은 특이적 용어는 하기 의미를 갖는다.

본원에 사용된 바와 같은 "탄소 기질"로도 지칭되는 용어 "탄소 공급원"은 숙주 유기체 또는 생산 세포주에 의해 대사될 수 있는 것들과 같은 미생물에 대한 에너지 공급원, 특히 정제된 형태로, 최소 배지로 또는 복합 영양 물질과 같은 원료로 제공되는 모노사카라이드, 올리고사카라이드, 폴리사카라이드, 글리세롤을 포함한 알코올로 이루어진 군으로부터 선택된 공급원으로 적합한 전형적으로 공급원 탄수화물인 발효가능한 탄소 기질을 의미할 것이다. 탄소 공급원은 단일 탄소 공급원으로 또는 상이한 탄소 공급원의 혼합물로 본원에 기재된 바와 같이 사용될 수 있다.

비-메탄올 탄소 공급원은 메탄올 이외의 임의의 탄소 공급원, 특히 메탄올이 없는 탄소 공급원의 양으로 본원에서 이해된다.

본원에 기재된 바와 같이 사용된 것과 같은 "기저 탄소 공급원"은 전형적으로 숙주 세포, 특히 진핵 세포에 대한 영양소와 같은 세포 성장에 적합한 탄소 공급원이다. 기저 탄소 공급원은 기저 배지 또는 복합 배지와 같은 배지, 뿐만 아니라 정제된 탄소 공급원을 함유하는 화학적으로 정의된 배지에 제공될 수 있다. 기저 탄소 공급원은 전형적으로 세포 성장, 특히 배양 공정 중 성장 단계 동안 세포 성장을 제공하기 위한, 예를 들어 표준 하위 배양 단계 동안 90% 초과, 바람직하게는 95% 초과의 생존력을 나타내는, 예를 들어 적어도 5 g/L 세포 건조 질량, 바람직하게는 적어도 10 g/L 세포 건조 질량, 또는 적어도 15 g/L 세포 건조 질량의 세포 밀도를 수득하기 위한 양으로 제공된다.

기저 탄소 공급원은 전형적으로 과량 또는 잉여량으로 사용되며, 예를 들어 회분 또는 유가 배양 공정에서 세포주의 성장 단계 동안과 같이 높은 특이적 성장 속도로 세포주를 배양하는 동안 바이오매스를 증가시키기 위해 에너지를 과량으로 제공하는 것으로 이해된다. 이러한 잉여량은 특히 측정가능한 발효 브로쓰에서 잔류 농도를 달성하기 위해 보충 탄소 공급원(성장-제한 조건 하에 사용될 때)의 제한된 양을 초과하며 보충 탄소 공급원의 제한된 양을 공급하는 동안 전형적으로 적어도 10 배, 바람직하게는 적어도 50 배 또는 적어도 100 배 더 높다.

본원에 기재된 바와 같은 "보충 탄소 공급원"은 전형적으로 특히 배양 공정의 생산 단계에서 생산 세포주에 의한 발효 생성물의 생산을 용이하게 하는 보충 기질이다. 생산 단계는 구체적으로 예를 들어 회분, 유가 및 연속 배양 공정에서 성장 단계를 따른다. 보충 탄소 공급원은 구체적으로 유가 공정의 공급물에 함유될 수 있다. 보충 탄소 공급원은 전형적으로 탄소 기질 제한된 조건 하에, 즉 탄소 공급원을 제한된 양으로 사용하는 세포 배양물에 이용된다.

탄소 공급원의 "제한된 양" 또는 "제한된 탄소 공급원"은 본원에서 특히 최대 성장 속도 보다 낮은 제어된 성장 속도의 배양 공정에서 생산 세포주에 의한 발효 생성물의 생산을 용이하게 하는 탄소 기질의 유형 및 양을 구체적으로 지칭하는 것으로 이해된다. 생산 단계는 구체적으로 예를 들어 회분, 유가 및 연속 배양 공정에서 성장 단계를 따른다. 세포 배양 공정은 회분 배양, 연속 배양, 및 유가 배양을 이용할 수 있다. 회분 배양은 소량의 시드 배양 용액을 배지에 첨가하여 배양 동안 추가 배지를 첨가하거나 또는 배양 용액을 버리지 않고 세포를 성장시키는 배양 공정이다. 연속 배양은 배지를 배양 동안 연속으로 첨가하고 버리는 배양 공정이다. 연속 배양은 또한 관류 배양을 포함한다. 회분 배양 및 연속 배양 사이의 중간이고 또한 반회분 배양으로 언급되는 유가 배양은 배지를 배양 동안 연속적으로 또는 순차적으로 첨가하지만, 연속 배양과는 달리, 배양 용액을 연속적으로 버리지 않는 배양 공정이다.

구체적으로 성장 제한 영양 기질을 배양물에 공급하는 것을 기반으로 하는 유가 공정이 바람직하다. 단일 유가 또는 반복 유가 발효를 포함하는 유가 전략은 전형적으로 생물반응기에서 높은 세포 밀도에 도달하기 위해 생물 산업 공정에 사용된다. 탄소 기질의 제어된 첨가는 배양물의 성장 속도에 직접적으로 영향을 미치고 범람성 대사 또는 원치않은 대사 부산물 형성을 피하는 데 도움을 준다. 탄소 공급원 제한 조건 하에, 탄소 공급원은 구체적으로 유가 공정의 공급물에 함유될 수 있다. 이에 의해, 탄소 기질이 제한된 양으로 제공된다.

또한 본원에 기재된 바와 같은 케모스태트 또는 연속 배양에서, 성장 속도는 엄격하게 제어될 수 있다.

탄소 공급원의 제한된 양은 본원에서 특히 예를 들어 생산 단계 또는 생산 방식에서 성장-제한 조건 하에 생산 세포주를 유지하는 데 필요한 탄소 공급원의 양으로 이해된다. 이러한 제한된 양은 유가 공정에 이용될 수 있으며, 여기서 탄소 공급원은 공급 배지에 함유되고 낮은 특이적 성장 속도로 바이오매스를 유지하면서, 예를 들어 POI를 생산하기 위해 지속적인 에너지 전달을 위한 낮은 공급 속도로 배양물에 공급된다. 공급 배지는 전형적으로 세포 배양물의 생산 단계 동안 발효 브로쓰에 첨가된다.

탄소 공급원의 제한된 양은 예를 들어, 세포 배양 브로쓰에서 탄소 공급원의 잔류량에 의해 결정될 수 있으며, 이는 표준(탄수화물) 검정에서 측정된 바와 같이 미리 결정된 역치 미만 또는 심지어 검출 한계 미만이다. 잔류량은 전형적으로 발효 제품을 수확할 때 발효 브로쓰에서 결정될 것이다.

탄소 공급원의 제한된 양은 또한 발효기에 대한 탄소 공급원의 평균 공급 속도를 정의함으로써, 예를 들어 시간 당 계산된 평균량을 결정하기 위해 배양 시간 당 전체 배양 공정, 예를 들어 유가 단계에 걸쳐 첨가된 양을 결정함으로써 결정될 수 있다. 이 평균 공급 속도는 세포 배양에 의한 보충 탄소 공급원의 완전한 사용을 보장하기 위해 낮게, 예를 들어 0.6 g L^-1 h^-1(L 초기 발효 부피 및 h 시간 당 g 탄소 공급원) 내지 25 g L^-1 h^-1, 바람직하게는 1.6 g L^-1 h^-1 내지 20 g L^-1 h^-1로 유지된다.

탄소 공급원의 제한된 양은 또한 특이적 성장 속도를 측정함으로써 결정될 수 있으며, 특이적 성장 속도는 생산 단계 동안 낮게, 예를 들어 최대 특이적 성장 속도보다 낮게, 예를 들어 0.001 h^-1 내지 0.20 h^-1, 또는 0.005 h^-1 내지 0.20 h^-1, 바람직하게는 0.01 h^-1 내지 0.15 h^-1의 범위에서와 같이 미리 결정된 범위 내에서 유지된다.

구체적으로, 화학적으로 정의되고 메탄올이 없는 공급 배지가 사용된다.

유가 공정에서 최소 배지 또는 공급 배지와 같이 세포 배양 배지와 관련하여 용어 "화학적으로 정의된"은 생산 세포주의 시험관내 세포 배양에 적합한 배양 배지를 의미할 것이며, 여기서 모든 화학적 구성요소 및 (폴리)펩티드가 알려져 있다. 전형적으로, 화학적으로 정의된 배지는 동물 유래 구성요소가 완전히 없고 순수하고 일관된 세포 배양 환경을 나타낸다.

본원에 사용된 바와 같은 "숙주 세포"는 단일 세포, 단일 세포 클론, 또는 숙주 세포의 세포주를 지칭할 것이다.

본원에 사용된 바와 같은 용어 "세포주"는 장기간에 걸쳐 증식하는 능력을 획득한 특정 세포 유형의 확립된 클론을 지칭한다. 세포주는 전형적으로 내인성 또는 재조합 유전자, 또는 폴리펩티드 또는 이러한 폴리펩티드에 의해 매개되는 세포 대사산물을 생산하기 위한 대사 경로의 생성물을 발현하기 위해 사용된다. "생산 숙주 세포주" 또는 "생산 세포주"는 통상적으로 POI와 같은 생산 공정의 생성물을 수득하기 위해 생물반응기에서 세포 배양에 사용될 준비가 된 세포주인 것으로 이해된다.

본원에 기재된 바와 같은 POI를 생산하는 숙주 세포는 또한 "생산 숙주 세포"로 지칭되고, 각각의 세포주는 "생산 세포주"로 지칭된다.

본원에 기재된 구체적 구현예는 FLO8 단백질을 암호화하는 내인성 유전자를 과소발현하도록 조작되고/되거나, 이러한 유전자의 발현이 감소되고, 탄소 공급원 조절가능한 프로모터(예컨대 본원에 기재된 ECP), 특히 세포 배양물에 메탄올을 첨가할 필요 없이 유도될 수 있는 프로모터의 제어 하에 고수율의 POI 생산을 특징으로 하는 생산 숙주 세포주를 지칭한다. 이러한 숙주 세포는 형태를 유의하게 변화시키기 않으면서 POI를 안정되게 발현하는 것으로 밝혀졌다.

용어 "숙주 세포"는 특히 임의의 진핵 또는 원핵 세포 또는 유기체에 적용될 것이며, 이는 POI 또는 숙주 세포 대사산물을 생산하기 위해 재조합 목적에 적합하게 사용된다. 용어 "숙주 세포"는 인간을 포함하지 않음이 잘 이해된다. 구체적으로, 본원에 기재된 바와 같은 숙주 세포는 인공 유기체 및 천연(야생형) 숙주 세포의 유도체이다. 예를 들어, 하나 이상의 유전적 변형, 상기 이종 발현 카세트 또는 작제물, 상기 형질감염 또는 형질전환된 숙주 세포 및 재조합 단백질을 포함하는 것들을 구체적으로 언급하는 본원에 기재된 숙주 세포, 방법 및 용도는 비-자연 발생, "인공(man-made)" 또는 합성이고, 따라서 "자연 법칙"의 결과로 간주되지 않음이 잘 이해된다.

숙주 세포와 관련하여 본원에 사용된 바와 같은 용어 "세포 배양" 또는 "배양하는" 또는 "배양"은 세포의 성장, 분화 또는 지속적인 생존력을 선호하는 조건 하에 인공으로 예를 들어 생체내 환경에서, 활성 또는 중지 상태에서, 구체적으로 산업계에 알려진 방법에 따라 제어된 생물 반응기에서 세포를 유지하는 것을 지칭한다.

적절한 배양 배지를 사용하여 세포 배양물을 배양할 때, 세포는 세포 배양물에서 세포 배양을 지지하기에 적합한 조건 하에 배양 용기 내 배지 또는 기질과 접촉하게 된다. 본원에 기재된 바와 같이, 숙주 세포 예를 들어, 진핵 세포, 구체적으로 효모 또는 사상성 진균의 성장에 사용될 수 있는 배양 배지가 제공된다. 표준 세포 배양 기술은 당업계에 잘 알려져 있다.

본원에 기재된 바와 같은 세포 배양은 특히 세포 바이오매스로부터 분리가능하고, 본원에서 "세포 배양 상청액"으로 지칭되는 세포 배양 배지에서 POI를 수득하는 것과 같이 분비된 POI의 생산을 제공하는 기술을 이용하며, 더 높은 순도의 POI를 수득하기 위해 정제될 수 있다. 단백질(예컨대 예를 들어, POI)이 세포 배양물에서 숙주 세포에 의해 생산 및 분비될 때, 이러한 단백질이 세포 배양 상청액에 분비되고, 숙주 세포 바이오매스로부터 세포 배양 상청액을 분리함으로써 수득될 수 있고, 임의적으로 단백질을 추가로 정제하여 정제된 단백질 제제를 생산함이 본원에서 이해된다.

세포 배양 배지는 제어된 인공 및 시험관내 환경에서 세포를 유지하고 성장시키는 데 필요한 영양소를 제공한다. 세포 배양 배지의 특징 및 조성은 특정 세포 요건에 따라 달라진다. 중요한 매개변수는 삼투압, pH, 및 영양소 제형을 포함한다. 영양소 공급은 당업계에 알려진 방법에 따라 연속 또는 불연속 방식으로 수행될 수 있다.

회분 공정은 세포를 배양하는 데 필요한 모든 영양소가 발효 동안 추가 영양소의 추가 공급 없이 초기 배양 배지에 함유되는 세포 배양 방식인 반면, 유가 공정에서는, 회분 단계 후, 하나 이상의 영양소를 공급에 의해 배양물에 공급하는 공급 단계가 발생한다. 대부분의 공정에서 공급 방식은 핵심이고 중요하지만, 본원에 기재된 숙주 세포 및 방법은 세포 배양의 핵심 방식과 관련하여 제한되지 않는다.

재조합 POI는 적절한 배지에서 배양하고, 배양물로부터 발현된 생성물 또는 대사산물을 단리하고, 임의적으로 적합한 방법에 의해 정제함으로써 본원에 기재된 숙주 세포 및 각각의 세포주를 사용하여 생산될 수 있다.

본원에 기재된 바와 같은 POI의 생산을 위한 여러 상이한 접근법이 바람직하다. POI는 숙주 세포를 관련 단백질을 암호화하는 재조합 DNA를 함유하는 발현 벡터로 형질감염 또는 형질전환하고, 형질감염 또는 형질전환된 세포의 배양물을 제조하고, 배양물을 성장시키고, 전사 및 POI 생산을 유도하고, POI를 회복함으로써 발현되고, 처리되고 임의적으로 분비될 수 있다.

특정 구현예에서, 세포 배양 공정은 유가 공정이다. 구체적으로, 원하는 재조합 POI를 암호화하는 핵산 작제물로 형질전환된 숙주 세포는 성장 단계에서 배양되고 원하는 재조합 POI를 생산하기 위해 생산 단계로 전이된다.

또 다른 구현예에서, 본원에 기재된 숙주 세포는 예를 들어 케모스태트를 이용하여 연속 방식으로 배양된다. 연속 발효 공정은 신선한 배양 배지를 정의되고 일정하고 연속적인 속도로 생물반응기에 공급하는 것을 특징으로 하며, 이에 의해 배양 브로쓰가 동일한 정의되고 일정하고 연속적인 제거 속도로 생물반응기로부터 동시에 제거된다. 배양 배지, 공급 속도 및 제거 속도를 동일한 일정한 수준으로 유지함으로써, 생물반응기에서 세포 배양 매개변수 및 조건이 일정하게 유지된다.

본원에 기재된 바와 같은 안정된 세포 배양은 구체적으로 유전적 특성을 유지하며, 구체적으로 심지어 약 20 세대 배양, 바람직하게는 적어도 30 세대, 보다 바람직하게는 적어도 40 세대, 가장 바람직하게는 적어도 50 세대 후에도 POI 생산을 높은 수준, 예를 들어 적어도 μg 수준으로 유지하는 세포 배양을 지칭하는 것으로 이해된다. 구체적으로, 산업 규모 생산에 사용될 때 큰 이점으로 간주되는 안정된 재조합 숙주 세포주가 제공된다.

본원에 기재된 세포 배양은 특히 산업 제조 규모에 대한 방법, 예를 들어 부피 및 기술 시스템과 관련하여 영양소 공급을 기반으로 하는 배양 방식 , 특히 유가 또는 회분 공정, 또는 연속 또는 반연속 공정(예를 들어 케모스태트)과 조합하여 특히 유리하다.

본원에 기재된 숙주 세포는 전형적으로 POI 생산을 위해 GOI를 발현하는 능력에 대해 테스트되고, 다음 테스트 중 임의의 것에 의해 POI 수율을 테스트한다: ELISA, 활성 검정, HPLC, 또는 SDS-PAGE 및 웨스턴 블롯팅 기술과 같은 다른 적합한 테스트, 또는 질량 분광법.

각각의 세포 배양물에서 FLO8 단백질 또는 이의 상동체를 암호화하는 유전자의 과소발현 또는 감소에 대한 유전적 변형의 효과 및 예를 들어, POI 생산에 대한 이의 효과를 결정하기 위해, 숙주 세포주는 마이크로타이터 플레이트, 진탕 플라스크, 또는 각각의 세포에서 이러한 유전적 변형이 없는 균주와 비교하여 유가 또는 케모스태트 발효를 사용하는 생물 반응기에서 배양될 수 있다.

본원에 기재된 생산 방법은 구체적으로 파일럿 또는 산업 규모로 발효를 허용한다. 산업 공정 규모는 바람직하게는 적어도 10 L, 구체적으로 적어도 50 L, 바람직하게는 적어도 1 m³, 바람직하게는 적어도 10 m³, 가장 바람직하게는 적어도 100 m³의 부피를 이용할 것이다.

산업 규모의 생산 조건이 바람직하며, 이는 예를 들어, 수 일 동안 전형적인 공정 시간을 이용하는 100 L 내지 10 m³ 또는 그 이상의 반응기 부피에서 유가 배양, 또는 대략 0.02 - 0.15 h^-1의 희석 속도로 대략 50 - 1000 L 또는 그 이상의 발효기 부피에서 연속 공정을 지칭한다.

본원에 기재된 목적을 위해 사용되는 장치, 시설 및 방법은 구체적으로 원핵 및/또는 진핵 세포주를 포함한 임의의 원하는 세포주에서 사용하고 배양하는 데 적합하다. 또한, 구현예에서, 장치, 시설 및 방법은 현탁 세포 또는 흡착-의존(부착) 세포를 포함한 임의의 세포 유형을 배양하는 데 적합하고 폴리펩티드 생성물(POI), 핵산 생성물(예를 들어 DNA 또는 RNA)과 같은 약제학적 및 생물약제학적 생성물, 또는 세포 및/또는 바이러스 요법에 사용되는 것들과 같은 세포 및/또는 바이러스의 생산을 위해 구성된 생산 작동에 적합하다.

특정 구현예에서, 세포는 재조합 치료제 또는 진단 제품과 같은 생성물을 발현하거나 또는 생산한다. 본원에 보다 상세하게 기재된 바와 같이, 세포에 의해 생산된 생성물의 예는 항체 분자(예를 들어, 모노클로날 항체, 이중특이적 항체), 항체 모방체(항원에 특이적으로 결합하나 예를 들어 DARPin, 아피바디, 아드넥틴, 또는 IgNAR와 같은 항체에 구조적으로 관련되지 않은 폴리펩티드 분자), 융합 단백질(예를 들어, Fc 융합 단백질, 키메라 사이토카인), 다른 재조합 단백질(예를 들어, 글리코실화 단백질, 효소, 호르몬), 또는 바이러스 치료제(예를 들어, 항암 종양용해성 바이러스, 유전자 요법 및 바이러스 면역요법을 위한 바이러스 벡터), 세포 치료제(예를 들어, 다능성 줄기 세포, 간엽성 줄기 세포 및 성체 줄기 세포), 백신 또는 지질-캡슐화 입자(예를 들어, 엑소좀, 바이러스-유사 입자), RNA(예컨대 예를 들어 siRNA) 또는 DNA(예컨대 예를 들어 플라스미드 DNA), 항생제 또는 아미노산을 포함하는 본원에 예시된 바와 같은 POI를 포함하나 이에 제한되지 않는다. 구현예에서, 장치, 시설 및 방법은 바이오시밀러를 생산하는 데 사용될 수 있다.

언급된 바와 같이, 특정 구현예에서, 장치, 시설 및 방법은 진핵 세포, 예를 들어, 포유류 세포 또는 예를 들어 효모 세포 또는 사상성 진균 세포과 같은 저급 진핵 세포, 또는 그람-양성 또는 그람-음성 세포와 같은 원핵 세포 및/또는 진핵 또는 원핵 세포의 생성물, 예를 들어, 대규모 방식으로 상기 세포에 의해 합성된 단백질, 펩티드, 또는 항생제, 아미노산, 핵산(예컨대 DNA 또는 RNA)을 포함하는 POI의 생산을 허용한다. 본원에 달리 언급되지 않는 한, 장치, 시설, 및 방법은 벤치 규모, 파일럿 규모, 및 전체 생산 규모 용량을 포함하나 이에 제한되지 않는 임의의 원하는 부피 또는 생산 용량을 포함할 수 있다.

더욱이, 본원에 달리 언급되지 않는 한, 장치, 시설, 및 방법은 교반 탱크, 에어리프트, 섬유, 마이크로섬유, 중공 섬유, 세라믹 매트릭스, 유동층, 고정층, 및/또는 분출층 생물반응기를 포함하나 이에 제한되지 않는 임의의 적합한 반응기(들)를 포함할 수 있다. 본원에 사용된 바와 같이, "반응기"는 발효기 또는 발효 유닛, 또는 임의의 다른 반응 용기를 포함할 수 있고 용어 "반응기"는 "발효기"와 상호교환가능하게 사용된다. 예를 들어, 일부 측면에서, 예시적인 생물반응기 유닛은 다음 중 하나 이상, 또는 전부를 수행할 수 있다: 영양소 및/또는 탄소 공급원 공급, 적합한 가스(예를 들어, 산소) 주입, 발효 또는 세포 배양 배지의 유입 및 유출 흐름, 가스 및 액체 상 분리, 온도 유지, 산소 및 CO₂ 수준 유지, pH 수준 유지, 휘저음(예를 들어, 교반), 및/또는 세정/멸균. 발효 유닛과 같은 예시적인 반응기 유닛은 유닛 내에 다중 반응기를 함유할 수 있으며, 예를 들어 유닛은 각각의 유닛에서 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 또는 100 개, 또는 그 이상의 생물반응기를 가질 수 있고/있거나 시설은 시설 내에 단일 또는 다중 반응기를 갖는 다중 유닛을 함유할 수 있다. 다양한 구현예에서, 생물반응기는 회분, 반 유가, 유가, 관류, 및/또는 연속 발효 공정에 적합할 수 있다. 임의의 적합한 반응기 직경이 사용될 수 있다. 구현예에서, 생물반응기는 약 100 mL 내지 약 50,000 L의 부피를 가질 수 있다. 비제한적인 예는 100 mL, 250 mL, 500 mL, 750 mL, 1 리터, 2 리터, 3 리터, 4 리터, 5 리터, 6 리터, 7 리터, 8 리터, 9 리터, 10 리터, 15 리터, 20 리터, 25 리터, 30 리터, 40 리터, 50 리터, 60 리터, 70 리터, 80 리터, 90 리터, 100 리터, 150 리터, 200 리터, 250 리터, 300 리터, 350 리터, 400 리터, 450 리터, 500 리터, 550 리터, 600 리터, 650 리터, 700 리터, 750 리터, 800 리터, 850 리터, 900 리터, 950 리터, 1000 리터, 1500 리터, 2000 리터, 2500 리터, 3000 리터, 3500 리터, 4000 리터, 4500 리터, 5000 리터, 6000 리터, 7000 리터, 8000 리터, 9000 리터, 10,000 리터, 15,000 리터, 20,000 리터, 및/또는 50,000 리터의 부피를 포함한다. 추가로, 적합한 반응기는 다중 사용, 단일 사용, 일회용, 또는 비-일회용일 수 있고 스테인리스 강(예를 들어, 316L 또는 임의의 다른 적합한 스테인리스 강) 및 인코넬과 같은 금속 합금, 플라스틱, 및/또는 유리를 포함한 임의의 적합한 물질로 형성될 수 있다.

구현예에서 및 본원에서 달리 언급되지 않는 한, 본원에 기재된 장치, 시설, 및 방법은 또한 이러한 생성물의 분리, 정제, 및 단리를 위한 작동 및/또는 장비와 같이 달리 언급되지 않은 임의의 적합한 유닛 작동 및/또는 장비를 포함할 수 있다. 전통적인 스틱 조립 시설, 모듈식, 이동식 및 임시 시설, 또는 임의의 다른 적합한 구조, 시설, 및/또는 레이아웃 같은 임의의 적합한 시설 및 환경이 사용될 수 있다. 예를 들어, 일부 구현예에서 모듈식 클린 룸이 사용될 수 있다. 추가로, 달리 언급되지 않는 한, 본원에 기재된 장치, 시스템, 및 방법은 단일 위치 또는 시설에서 수용 및/또는 수행될 수 있거나 또는 대안적으로 별도 또는 다중 위치 및/또는 시설에서 수용 및/또는 수행될 수 있다.

적합한 기술은 회분 단계로 시작한 다음, 높은 특이적 성장 속도로 짧은 지수 유가 단계 다음에, 추가로 낮은 특이적 성장 속도로 유가 단계가 이어지는 생물반응기에서 배양하는 것을 포함할 수 있다. 또 다른 적합한 배양 기술은 임의의 적합한 특이적 성장 속도 또는 POI 생산 시간에 걸쳐 높은 성장 속도에서 낮은 성장 속도로, 또는 POI 생산 시간에 걸쳐 낮은 성장 속도에서 높은 성장 속도로 진행하는 것과 같은 특이적 성장 속도의 조합으로 회분 단계 다음에 유가 단계를 포함할 수 있다. 또 다른 적합한 배양 기술은 낮은 희석 속도로 회분 단계 다음에 연속 배양 단계를 포함할 수 있다.

바람직한 구현예는 바이오매스를 제공하기 위한 회분 배양 다음에 고 수율 POI 생산을 위한 유가 배양을 포함한다.

적어도 1 g/L 세포 건조 중량, 보다 바람직하게는 적어도 10 g/L 세포 건조 중량, 바람직하게는 적어도 20 g/L 세포 건조 중량, 바람직하게는 30, 40, 50, 60, 70, 또는 80 g/L 세포 건조 중량 중 적어도 임의의 하나의 세포 밀도를 수득하기 위한 성장 조건 하에 생물반응기에서 본원에 기재된 바와 같은 숙주 세포를 배양하는 것이 바람직하다. 이러한 바이오매스 생산 수율을 파일럿 또는 산업 규모로 제공하는 것이 유리하다.

바이오매스의 축적을 허용하는 성장 배지, 구체적으로 기저 성장 배지는 전형적으로 탄소 공급원, 질소 공급원, 황의 공급원 및 포스페이트의 공급원을 포함한다. 전형적으로, 이러한 배지는 추가의 미량 원소 및 비타민을 포함하고, 아미노산, 펩톤 또는 효모 추출물을 추가로 포함할 수 있다.

바람직한 질소 공급원은 NH₄H₂PO₄, 또는 NH₃ 또는 (NH₄)₂SO₄를 포함한다.

바람직한 황 공급원은 MgSO₄, 또는 (NH₄)₂SO₄ 또는 K₂SO₄를 포함한다.

바람직한 포스페이트 공급원은 NH₄H₂PO₄, 또는H₃PO₄, 또는 NaH₂PO₄, KH₂PO₄, Na₂HPO₄ 또는 K₂HPO₄를 포함한다.

추가의 전형적인 배지 성분은 KCl, CaCl₂, 및 Fe, Co, Cu, Ni, Zn, Mo, Mn, I, B와 같은 미량 원소를 포함한다.

바람직하게는 배지는 비타민 B₇이 보충된다.

피. 파스토리스에 대한 전형적인 성장 배지는 글리세롤, 소르비톨 또는 글루코스, NH₄H₂PO₄, MgSO₄, KCl, CaCl₂, 비오틴, 및 미량 원소를 포함한다.

생산 단계에서 생산 배지는 구체적으로 단지 제한된 양의 보충 탄소 공급원과 함께 사용된다.

바람직하게는 숙주 세포주는 적합한 탄소 공급원과 함께 미네랄 배지에서 배양되어, 추가로 단리 공정을 상당히 단순화한다. 바람직한 미네랄 배지의 예는 활용가능한 탄소 공급원(예를 들어, 글루코스, 글리세롤, 또는 소르비톨), 거대 원소(칼륨, 마그네슘, 칼슘, 암모늄, 클로라이드, 술페이트, 포스페이트) 및 미량 원소(구리, 요오드, 망간, 몰리브데이트, 코발트, 아연, 및 철 염, 및 붕산)를 함유하는 염, 및 예를 들어 영양요구성을 보완하기 위해 임의적으로 비타민 또는 아미노산을 함유하는 것이다.

구체적으로, 세포는 원하는 POI의 발현을 시행하기에 적합한 조건 하에 배양되며, 이는 발현 시스템 및 발현된 단백질의 속성, 예를 들어, 단백질이 신호 펩티드에 융합되는지 및 단백질이 가용성이거나 또는 막-결합된 것인지에 따라, 세포 또는 배양 배지로부터 정제될 수 있다. 당업자에 의해 이해되는 바와 같이, 배양 조건은 이용되는 숙주 세포 유형 및 특정 발현 벡터를 포함하는 인자에 따라 달라질 것이다.

전형적인 생산 배지는 보충 탄소 공급원, 및 추가로 NH₄H₂PO₄, MgSO₄, KCl, CaCl₂, 비오틴, 및 미량 원소를 포함한다.

예를 들어 첨가된 보충 탄소 공급원을 발효에 공급하는 것은 최대 50 wt %의 활용가능한 당과 함께 탄소 공급원을 포함할 수 있다.

발효는 바람직하게는 3 내지 8 범위의 pH에서 수행된다.

전형적인 발효 시간은 약 24 내지 120 시간이며 온도는 20℃ 내지 35℃, 바람직하게는 22-30℃ 범위이다.

POI는 바람직하게는 적어도 1 mg/L, 바람직하게는 적어도 10 mg/L, 바람직하게는 적어도 100 mg/L, 가장 바람직하게는 적어도 1 g/L의 수율을 생산하는 조건을 이용하여 발현된다.

본원에 사용된 바와 같은 용어 "발현" 또는 "발현 카세트"는 작동가능한 연결로 원하는 코딩 서열 및 제어 서열을 함유하여, 이러한 서열로 형질전환 또는 형질감염된 숙주가 암호화된 단백질 또는 숙주 세포 대사산물을 생산할 수 있도록 하는 핵산 분자를 지칭한다. 형질전환을 시행하기 위해, 발현 시스템이 벡터에 포함될 수 있지만; 그러나, 관련 DNA가 또한 숙주 세포 염색체에 통합될 수 있다. 발현은 폴리펩티드 또는 대사산물을 포함하는 분비 또는 비분비된 발현 산물을 지칭할 수 있다.

발현 카세트는 예를 들어, "벡터" 또는 "플라스미드"의 형태의 발현 작제물로 편리하게 제공되며, 이는 전형적으로 클로닝된 재조합 뉴클레오티드 서열, 즉 재조합 유전자의 전사 및 적합한 숙주 유기체에서 mRNA의 번역에 필요한 DNA 서열이다. 발현 벡터 또는 플라스미드는 일반적으로 숙주 세포에서 게놈 통합을 위한 자율 복제 기원 또는 유전자좌, 선택가능한 마커(예를 들어, 아미노산 합성 유전자 또는 제오신, 카나마이신, G418 또는 하이드로마이신, 노르세오트리신과 같은 항생제에 내성을 부여하는 유전자), 다수의 제한 효소 절단 부위, 적합한 프로모터 서열 및 전사 종결인자를 포함하며, 이 구성요소는 함께 작동가능하게 연결된다. 본원에 사용된 바와 같은 용어 "플라스미드" 및 "벡터"는 자율 복제 뉴클레오티드 서열 뿐만 아니라 인공 염색체, 예를 들어, 효모 인공 염색체(YAC)와 같은 게놈 통합 뉴클레오티드 서열을 포함한다.

발현 벡터는 클로닝 벡터, 변형된 클로닝 벡터 및 특이적으로 설계된 플라스미드를 포함할 수 있으나 이에 제한되지 않는다. 본원에 기재된 바람직한 발현 벡터는 진핵 숙주 세포에서 재조합 유전자의 발현에 적합한 벡터이며 숙주 유기체에 따라 선택된다. 적절한 발현 벡터는 전형적으로 진핵 숙주 세포에서 POI를 암호화하는 DNA를 발현하는 데 적합한 조절 서열을 포함한다. 조절 서열의 예는 프로모터, 오퍼레이터, 인핸서, 리보솜 결합 부위, 및 전사 및 번역 개시 및 종결을 제어하는 서열을 포함한다. 조절 서열은 전형적으로 발현될 DNA 서열에 작동가능하게 연결된다.

숙주 세포에서 재조합 뉴클레오티드 서열의 발현을 허용하기 위해, 본원에 기재된 발현 카세트 또는 벡터는 ECP를 포함하며, 전형적으로 프로모터 뉴클레오티드 서열은 POI의 발현 및 분비를 용이하게 하기 위해 각각 코딩 서열의 5' 단부에 인접한, 예를 들어, 관심 유전자(GOI)로부터 상류에 있고 이에 인접하거나, 또는 신호 또는 리더 서열이 사용되는 경우, 상기 신호 및 리더 서열로부터 상류에 있고 이에 인접하다. 프로모터 서열은 전형적으로 작동가능하게 연결된, 특히 GOI를 포함하는 하류 뉴클레오티드 서열의 전사를 조절하고 개시한다.

본원에 기재된 특이적 발현 작제물은 프로모터의 전사 제어 하에 POI를 암호화하는 뉴클레오티드에 작동가능하게 연결된 상기 프로모터를 포함한다. 구체적으로, 프로모터는 POI의 코딩 서열과 고유하게 연관되지 않는다.

본원에 기재된 특이적 발현 작제물은 숙주 세포로부터 POI의 분비를 야기하는 리더 서열과 연결된 POI를 암호화하는 폴리뉴클레오티드를 포함한다. 발현 벡터에서 이러한 분비 리더 서열의 존재는 전형적으로 재조합 발현 및 분비를 위해 의도된 POI가 자연적으로 분비되지 않고 따라서 자연 분비 리더 서열이 결여된 단백질이거나, 또는 이의 뉴클레오티드 서열이 자연 분비 리더 서열 없이 클로닝된 경우 필요하다. 일반적으로, 숙주 세포로부터 POI의 분비를 야기하는 데 효과적인 임의의 분비 리더 서열이 사용될 수 있다. 분비 리더 서열은 효모 공급원, 예를 들어 사카로마이세스 세레비지애의 MFa와 같은 효모 α-인자, 또는 포유류 또는 식물 공급원으로부터의 효모 포스파타제, 또는 다른 것들로부터 유래할 수 있다.

구체적 구현예에서, 다중클로닝 부위를 갖는 벡터인 다중클로닝 벡터가 사용될 수 있다. 구체적으로, 원하는 이종 유전자는 다중클로닝 부위에서 통합 또는 혼입되어 발현 벡터를 제조할 수 있다. 다중클로닝 벡터의 경우, 프로모터는 전형적으로 다중클로닝 부위의 상류에 위치한다.

본원에 기재된 재조합 숙주 세포는 특히 각각의 코딩 유전자 서열의 발현을 낮추어 유전자를 과소발현함으로써, 숙주 세포의 내인성 FLO8 단백질 또는 숙주 세포에서 각각의 상동체 또는 이종상동체의 양을 감소시키도록 특이적으로 조작된다.

본원에 사용된 바와 같은 용어 "유전자 발현", 또는 "폴리뉴클레오티드를 발현하는"은 mRNA로의 DNA 전사, mRNA 처리, mRNA 성숙, mRNA 방출, 번역, 단백질 폴딩 및/또는 단백질 수송으로 이루어진 군으로부터 선택된 적어도 하나의 단계를 포함하는 것을 의미한다.

용어 "발현 감소"는 전형적으로 "과소발현"을 지칭하고 일반적으로 특정 폴리뉴클레오티드의 발현을 감소시키기 위한 조작 이전의 숙주 세포이거나, 또는 달리 상기 폴리뉴클레오티드의 발현을 낮추도록 조작되지 않은 동일한 유형 또는 종의 숙주 세포에서 발현되는 참조 표준에 의해 나타낸 발현 수준보다 적은 임의의 양을 지칭한다. 본원에 기재된 바와 같은 발현 감소는 구체적으로 정의된 FLO8 단백질을 암호화하는 폴리뉴클레오티드 또는 유전자, 특히 조작 전의 숙주 세포에 내인성인 유전자를 지칭한다. 특히, 각각의 유전자 산물은 본원에 기재된 바와 같이 정의된 FLO8 단백질이다. 상기 유전자의 발현을 감소시키기 위한 유전적 변형에 의해 숙주 세포를 조작할 때 유전자 산물 또는 폴리펩티드의 발현은 숙주 세포의 유전적 변형 전 또는 유전적으로 변형되지 않은 비슷한 숙주에서 동일한 유전자 산물 또는 폴리펩티드의 발현보다 적은 수준으로 있다. "보다 적은"은 예를 들어, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80, 90% 또는 그 이상을 포함한다. 유전자 산물 또는 폴리펩티드의 발현 없음이 또한 용어 "발현 감소" 또는 "과소발현"에 포함된다.

본원에 기재된 구체적 구현예에 따르면, 숙주 세포는 FLO8 단백질을 암호화하는 내인성 숙주 세포 유전자(본원에 정의된 바와 같음, 예를 들어 각각의 상동체 또는 이종상동체 포함), 또는 상기 FLO8 단백질을 발현하거나 또는 생산하는 숙주 세포의 능력을 부여하는 다른 (코딩 또는 비코딩) 뉴클레오티드 서열을 (유전자 또는 이의 일부의 불활성화 또는 결실을 위해) 녹다운(knock-down) 또는 녹아웃하도록 조작된다.

구체적으로, 뉴클레오티드 서열이 파괴된 결실 균주가 제공된다.

본원에 사용된 바와 같은 용어 "파괴"는 녹다운 또는 녹아웃에 의해서와 같이, 숙주 세포에서 하나 이상의 내인성 단백질 발현의 완전한 제거를 위한 상당한 감소를 지칭한다. 이는 질량 분광법에 의해서와 같이, 숙주 세포의 세포 배양물 또는 배양 배지에서 이러한 하나 이상의 내인성 단백질의 존재로서 측정될 수 있으며, 여기서 내인성 단백질의 총 함량은 역치 미만이거나 또는 검출불가능할 수 있다.

용어 "파괴된"은 구체적으로 유전자 침묵, 유전자 녹다운, 유전자 녹아웃, 우성 음성 작제물의 전달, 조건부 유전자 녹아웃으로 이루어진 군으로부터 선택된 적어도 하나의 단계, 및/또는 특이적 유전자에 대한 유전자 변경에 의한 유전적 조작의 결과를 지칭한다.

본원에 사용된 바와 같은 유전자 발현의 맥락에서 용어 "녹다운", "감소" 또는 "고갈"은 대조군 세포에서의 발현과 비교하여 주어진 유전자의 발현 감소를 야기하는 실험적 접근법을 지칭한다. 유전자의 녹다운은 핵산 분자를 세포에 도입하여 유전자의 mRNA의 일부와 혼성화하여 이의 분해(예를 들어, shRNA, RNAi, miRNA)를 야기하거나 또는 전사 감소, mRNA 안정성 감소 또는 mRNA 번역 저하를 야기하는 방식으로 유전자의 서열을 변경하는 것과 같은 다양한 실험적 수단에 의해 달성될 수 있다.

주어진 유전자의 발현을 완전히 억제하는 것은 "녹아웃"이라고 언급된다. 유전자의 녹아웃은 기능적 전사체가 상기 유전자로부터 합성되지 않아서 이 유전자에 의해 정상적으로 제공되는 기능의 상실을 야기하는 것을 의미한다. 유전자 녹아웃은 DNA 서열을 변경시켜 유전자 또는 이의 조절 서열, 또는 이러한 유전자 또는 조절 서열의 일부를 파괴 또는 결실시킴으로써 달성된다. 녹아웃 기술은 중요한 부분 또는 전체 유전자 서열을 대체, 중단 또는 결실시키기 위한 상동 재조합 기술의 사용 또는 예를 들어 Gaj et al.(Trends Biotechnol. 2013;31(7):397-405)에 의해 기재된 표적 유전자의 DNA에 이중 가닥 파괴를 도입하기 위한 아연 핑거 또는 메가 뉴클레아제와 같은 DNA-변형 효소의 사용을 포함한다.

구체적 구현예는 숙주 세포로 형질전환 또는 형질감염된 하나 이상의 녹아웃 플라스미드 또는 카세트를 이동한다. 상동 재조합에 의해 숙주 세포 내 표적 유전자가 파괴될 수 있다. 이 절차는 전형적으로 표적 유전자의 모든 대립유전자가 안정하게 제거될 때까지 반복된다.

본원에 기재된 바와 같은 특이적 유전자를 녹아웃시키는 한 가지 구체적 방법은 예를 들어, Weninger et al.(J. Biotechnol. 2016, 235:139-49)에 기재된 바와 같은 CRISPR-Cas9 방법이다. 또 다른 방법은 예를 들어 Heiss et al. 2013(Appl Microbiol Biotechnol. 97(3):1241-9.)에 기재된 바와 같은 분열 마커 접근법을 포함한다.

또 다른 구현예는 작은 간섭 RNA(siRNA)를 사용하여 숙주 세포를 형질감염시키고 상기 숙주 세포에 의해 내인성으로 발현된 표적 단백질을 암호화하는 mRNA를 표적화함으로써 mRNA 분해를 표적화하는 것을 지칭한다.

유전자의 발현은 예를 들어, 특이적 프로모터-관련 저해인자의 사용, 주어진 프로모터의 부위 특이적 돌연변이 생성, 프로모터 변화, 또는 번역의 억제 또는 감소, 예를 들어, RNAi 또는 비-코딩 RNA 유도된 전사후 유전자 침묵에 의한 DNA 전사의 억제 또는 감소를 포함하지만 이에 제한되지 않는 유전자 발현을 직접적으로 방해하는 방법에 의해 억제되거나 또는 감소될 수 있다. 활성이 감소된 기능장애, 또는 불활성 유전자 산물의 발현은 예를 들어 코딩 유전자 내에서 부위 특이적 또는 무작위 돌연변이 생성, 삽입 또는 결실에 의해 달성될 수 있다.

유전자 산물의 활성의 억제 또는 감소는 예를 들어 단백질 발현 이전에 또는 동시에 각각의 효소에 억제제의 투여, 또는 배양에 의해 달성될 수 있다. 이러한 억제제에 대한 예는 억제 펩티드, 항체, 앱타머, 융합 단백질 또는 상기 효소에 대한 항체 모방체, 또는 이의 리간드 또는 수용체, 또는 억제 펩티드 또는 핵산, 또는 유사한 결합 활성이 있는 소분자를 포함하나 이에 제한되지 않는다.

유전자 침묵, 유전자 녹다운 및 유전자 녹아웃은 유전적 변형을 통해 또는 mRNA 전사 또는 유전자에 상보적인 서열을 갖는 올리고뉴클레오티드로 처리하여 유전자의 발현이 감소되는 기술을 지칭한다. DNA의 유전적 변형이 수행되면, 결과는 녹다운 또는 녹아웃 유기체이다. 유전자 발현의 변화가 mRNA에 결합하거나 또는 유전자에 일시적으로 결합하는 올리고뉴클레오티드에 의해 야기되면, 이는 염색체 DNA의 변형 없이 유전자 발현의 일시적 변화를 초래하고 일시적 녹다운으로 언급된다.

또한 상기 용어에 의해 포함되는 일시적 녹다운에서, 이 올리고뉴클레오티드가 활성 유전자 또는 이의 전사체에 결합하는 것은 전사 차단(유전자-결합의 경우), mRNA 전사체 분해(예를 들어, 작은 간섭 RNA(siRNA) 또는 안티센스 RNA에 의해) 또는 mRNA 번역 차단을 통해 발현 감소를 야기한다.

유전자 침묵, 녹다운 또는 녹아웃을 수행하는 다른 접근법은 각각의 문헌으로부터 당업자에게 알려져 있으며, 본 발명의 맥락에서 이들의 적용은 일상적인 것으로 간주된다. 유전자 녹아웃은 유전자의 발현이 완전히 차단되는 기술, 즉 각각의 유전자가 작동하지 않거나, 또는 심지어 제거되는 기술을 지칭한다. 이 목표를 달성하기 위한 방법론적 접근법은 여러가지이며 당업자에게 알려져 있다. 예는 주어진 유전자에 대해 우세하게 음성인 돌연변이체의 생산이다. 이러한 돌연변이체는 부위 지정 돌연변이 생성(예를 들어, 결실, 부분 결실, 삽입 또는 핵산 치환), 적합한 트랜스포존의 사용, 또는 각각의 문헌으로부터 당업자에게 알려져 있는 다른 접근법에 의해 생산될 수 있으며, 따라서 본 발명의 맥락에서 이의 적용은 일상적인 것으로 간주된다. 한 가지 예는 표적화된 징크 핑거 뉴클레아제를 사용한 녹아웃이다. 각각의 키트는 "CompoZR knockout ZFN"으로 Sigma Aldrich에 의해 제공된다. 또 다른 접근법은 전사 활성인자-유사 이펙터 뉴클레아제(TALEN)의 사용을 포함한다.

우성 음성 작제물의 전달은 예를 들어, 형질감염에 의해 기능장애 유전자 발현 산물을 코딩하는 서열의 도입을 수반한다. 상기 코딩 서열은 기능장애 효소의 유전자 발현이 유전자 발현 산물의 자연 발현을 파기하여, 결국 상기 유전자 발현 산물의 각각의 활성의 효과적인 생리학적 결함을 초래하는 방식으로 강한 프로모터에 기능적으로 결합된다.

조건부 유전자 녹아웃은 조직- 또는 시간-특이적 방식으로 유전자 발현을 차단시킨다. 이는 예를 들어, 관심 유전자 주위에 loxP 부위라 불리는 짧은 서열을 도입함으로써 수행된다. 다시 말해서, 다른 접근법은 각각의 문헌으로부터 당업자에게 알려져 있으며, 본 발명의 맥락에서 이들의 적용은 일상적인 것으로 간주된다.

한 가지 다른 접근법은 기능장애 유전자 산물 또는 활성이 감소된 유전자 산물을 초래할 수 있는 유전자 변경이다. 이 접근법은 프레임 시프트 돌연변이, 넌센스 돌연변이(즉, 조기 정지 코돈의 도입) 또는 전체 유전자 산물을 기능장애로 만들거나, 감소된 활성을 야기하는 아미노산 치환을 초래하는 돌연변이의 도입을 수반한다. 이러한 유전자 변경은 예를 들어 돌연변이 생성(예를 들어, 결실, 부분 결실, 삽입 또는 핵산 치환), 비특이적(무작위) 돌연변이 생성 또는 부위 지정 돌연변이 생성에 의해 생산될 수 있다. 유전자 침묵, 유전자 녹다운, 유전자 녹아웃, 우성 음성 작제물의 전달, 조건부 유전자 녹아웃, 및/또는 유전자 변경의 실제 적용을 기재하는 프로토콜은 통상적으로 당업자가 이용가능하며, 일상에 속한다. 따라서 본원에 제공된 기술적 교시는 유전자 산물의 유전자 발현의 억제 또는 감소, 또는 기능장애, 또는 불활성 유전자 산물의 발현, 또는 활성 감소로 이어지는 모든 생각할 수 있는 방법과 관련하여 완전히 가능하다.

본원에 기재된 유전적 변형은 J. Sambrook et al., Molecular Cloning: A Laboratory Manual(3rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, New York(2001)에 기재된 바와 같이 당업계에 알려진 도구, 방법 및 기술을 이용할 수 있다.

본원에 사용된 바와 같은 용어 "내인성"은 각각의 내인성 유전자의 발현을 감소시키고/시키거나 내인성 단백질의 생산을 감소시키는 변형 전에, 야생형(천연) 숙주 세포에 존재하는 그러한 분자 및 서열, 특히 내인성 유전자 또는 단백질을 포함하는 것을 의미한다. 특히, 자연에서 발견되는 특정 숙주 세포에서 발생하는(그리고 그로부터 수득될 수 있는) 내인성 핵산 분자(예를 들어, 유전자) 또는 단백질은 "숙주 세포 내인성" 또는 "숙주 세포에 내인성"인 것으로 이해된다. 더욱이, 핵산 또는 단백질을 "내인성으로 발현하는" 세포는 핵산 또는 단백질을 자연에서 발견되는 것과 동일한 특정 유형의 숙주가 하는 것처럼 발현한다. 더욱이, 핵산, 단백질, 또는 다른 화합물을 "내인성으로 생산하는" 또는 "내인성으로 생산한" 숙주 세포는 핵산, 단백질, 또는 화합물을 자연에서 발견되는 것과 동일한 특정 유형의 숙주 세포가 하는 것처럼 생산한다.

따라서, 내인성 단백질이 단백질 암호화 유전자가 불활성화이거나 또는 결실된 숙주 세포의 녹아웃 돌연변이체에서과 같은 숙주 세포에 의해 더이상 생산되지 않더라도, 단백질은 본원에서 여전히 "내인성"으로 언급된다.

뉴클레오티드 서열, 발현 카세트와 같은 작제물, 아미노산 서열 또는 단백질과 관련하여 본원에 사용된 바와 같은 용어 "이종"은 주어진 숙주 세포에 대해 외래인, 즉 상기 숙주 세포에서 자연에서 발견되지 않는 것과 같은 "외인성"이거나; 또는 주어진 숙주 세포에서 자연적으로 발견되는, 예를 들어, "내인성"이지만, 이종 작제물의 맥락에서 또는 이러한 이종 작제물에 통합된, 예를 들어, 내인성 핵산과 융합되거나 또는 결합된 이종 핵산을 이용하여, 작제물을 이종으로 만드는 화합물을 지칭한다. 내인성으로 발견되는 이종 뉴클레오티드 서열은 또한 예를 들어, 세포에서 예상된 것보다 많거나 또는 자연적으로 발견되는 것보다 많은 양으로 비자연에서 생산될 수 있다. 이종 뉴클레오티드 서열, 또는 이종 뉴클레오티드 서열을 포함하는 핵산은 아마도 내인성 뉴클레오티드 서열과 상이한 서열이지만 내인성으로 발견되는 것과 동일한 단백질을 암호화한다. 구체적으로, 이종 뉴클레오티드 서열은 자연에서 숙주 세포와 동일한 관계에서 발견되지 않는 것들이다. 임의의 재조합 또는 인공 뉴클레오티드 서열은 이종인 것으로 이해된다. 이종 폴리뉴클레오티드의 예는 예를 들어, 본원에 기재된 바와 같이 하이브리드 프로모터를 수득하기 위해 프로모터와 천연적으로 회합하지 않거나, 또는 코딩 서열에 작동가능하게 연결된 뉴클레오티드 서열이다. 결과적으로, 하이브리드 또는 키메라 폴리뉴클레오티드가 수득될 수 있다. 이종 화합물의 추가 예는 내인성 자연 발생 POI 코딩 서열이 정상적으로 작동가능하게 연결되지 않은 전사 제어 요소, 예를 들어, 프로모터에 작동가능하게 연결된 POI 암호화 폴리뉴클레오티드이다.

본원에 사용된 바와 같이 용어 "작동가능하게 연결된"은 하나 이상의 뉴클레오티드 서열의 기능이 상기 핵산 분자 상에 존재하는 적어도 하나의 다른 뉴클레오티드 서열에 의해 영향을 받는 방식으로 단일 핵산 분자, 예를 들어, 벡터, 또는 발현 카세트 상에서 뉴클레오티드 서열의 회합을 지칭한다. 작동가능하게 연결함으로써, 핵산 서열은 동일한 핵산 분자 상에서 또다른 핵산 서열과 기능적 관계로 배치된다. 예를 들어, 프로모터는 코딩 서열의 발현에 영향을 미칠 수 있는 경우, 재조합 유전자의 코딩 서열과 작동가능하게 연결된다. 추가 예로서, 신호 펩티드를 암호화하는 핵산은 성숙 단백질의 예비형태 또는 성숙 단백질과 같은 분비된 형태로 단백질을 발현할 수 있는 경우, POI를 암호화하는 핵산 서열에 작동가능하게 연결된다. 구체적으로, 서로 작동가능하게 연결된 이러한 핵산은 즉시 연결될 수 있으며, 즉 신호 펩티드를 암호화하는 핵산 및 POI를 암호화하는 핵산 서열 사이에 추가 요소 또는 핵산 서열이 없다.

프로모터가 코딩 서열의 전사를 제어하는 경우, "프로모터" 서열은 전형적으로 코딩 서열에 작동가능하게 연결된 것으로 이해된다. 프로모터 서열이 코딩 서열과 천연적으로 회합하지 않는 경우, 이의 전사는 천연(야생형) 세포에서 프로모터에 의해 제어되지 않거나 또는 서열은 상이한 연속 서열과 재조합된다.

비-메탄올 탄소 공급원에 의해 조절가능하고 특히 억제가능하고 본원에 기재된 목적을 위해 사용되는 프로모터는 본원에서 "ECP"로 지칭된다. 따라서, "ECP"에 관한 본 개시내용은 또한 "비-메탄올 탄소 공급원에 의해 조절가능한(또는 억제가능한) 프로모터"를 지칭할 수 있으며, 그 반대의 경우도 마찬가지이다.

본원에 기재된 바와 같은 ECP는 특히 POI 코딩 DNA의 발현을 개시하거나, 조절하거나, 또는 달리 매개하거나 또는 제어한다. 프로모터 DNA 및 코딩 DNA는 동일한 유전자 또는 상이한 유전자로부터 유래할 수 있고, 동일하거나 또는 상이한 유기체로부터 유래할 수 있다.

본원에 기재된 바와 같은 ECP는 조절가능한 프로모터, 특히 억제된 상태 및 유도된 상태에서 상이한 프로모터 강도를 갖는 탄소 공급원 조절가능한 프로모터, 특히 비-메탄올 탄소 공급원에 의해 억제가능하고, 특히 메탄올에 의해 유도가능하지 않는 ECP와 같은 비-메탄올 탄소 공급원 조절가능한 프로모터로서 구체적으로 이해된다. 구체적으로, 메탄올의 부재 하에 전사 활성을 갖는 ECP를 사용함으로써, ECP의 전사 제어 하에 POI 생산을 위한 숙주 세포 배양물에 메탄올을 첨가할 필요가 없다.

ECP의 강도는 구체적으로 높은 빈도 또는 낮은 빈도를 갖는 해당 프로모터에서 발생하는 전사 개시의 효율성에 의해 나타낸 전사 강도를 지칭한다. 전사 강도가 높을수록, 해당 프로모터에서 더 빈번하게 전사가 발생할 것이다. 프로모터 강도는 프로모터의 전형적인 특징인데, 이는 주어진 mRNA 서열이 얼마나 자주 전사되는지를 결정하고, 다른 유전자보다 일부 유전자에 전사에 대해 더 높은 우선순위를 효과적으로 부여하여, 더 높은 농도의 전사체를 초래하기 때문이다. 예를 들어 대량으로 필요한 단백질을 암호화하는 유전자는 전형적으로 상대적으로 강한 프로모터를 갖는다. RNA 폴리머라제는 한번에 하나의 전사 업무만을 수행할 수 있어서 효율성을 높이려면 작업의 우선순위를 정해야 한다. 프로모터 강도의 차이는 이 우선순위를 허용하기 위해 선택된다.

본원에 사용되는 ECP는 완전히 유도된 상태에서 상대적으로 강하며, 전형적으로 거의 최대 활성 상태로 이해된다. 상대적 강도는 통상적으로 숙주 세포로 사용되는 바와 같은 세포의 각각의 pGAP 프로모터와 같은 표준 프로모터일 수 있는 본원에서 참조 프로모터로 언급되는 비슷한 프로모터에 대해 결정된다.

전사 빈도는 통상적으로 예를 들어 적합한 검정, 예를 들어 RT-PCR 또는 노던 블롯팅으로 전사체의 양에 의해 결정된 바와 같은 전사 속도로 이해된다. 예를 들어, 본 발명에 따른 프로모터의 전사 강도는 피. 파스토리스인 숙주 세포에서 결정되고 피. 파스토리스의 천연 pGAP 프로모터와 비교된다.

관심 유전자를 발현하는 프로모터의 강도는 통상적으로 발현 강도 또는 높은 발현 수준/속도를 지지하는 능력으로 이해된다. 예를 들어, 본 발명의 프로모터의 발현 및/또는 전사 강도는 피. 파스토리스인 숙주 세포에서 결정되고 피. 파스토리스의 천연 pGAP 프로모터와 비교된다.

참조 프로모터와 비교된 비교 전사 강도는 전사체의 양을 측정하는 것과 같은 표준 방법에 의해, 예를 들어 마이크로 어레이를 이용하거나, 또는 달리 재조합 세포에서 각각의 유전자 발현 산물의 양을 측정하는 것과 같이 세포 배양물에서 결정될 수 있다. 특히, 전사 속도는 마이크로어레이, 노던 블롯 또는 정량적 실시간 PCR(qRT-PCR) 또는 RNA 서열분석(RNA-seq)의 전사 강도에 의해 결정될 수 있으며 여기서 데이터는 높은 성장 속도를 갖는 조건 및 낮은 성장 속도를 갖는 조건, 또는 상이한 배지 조성을 이용하는 조건 사이의 발현 수준 차이, 및 참조 프로모터에 비해 높은 신호 강도를 나타낸다.

발현 속도는 예를 들어 eGFP와 같은 리포터 유전자의 발현량에 의해 결정될 수 있다.

본원에 기재된 바와 같은 ECP는 예를 들어 "상동 pGAP 프로모터"로도 불리는 숙주 세포에서의 천연 pGAP 프로모터와 비교하여 적어도 15%의 전사 속도 또는 전사 강도에 의해 반영된 상대적으로 높은 전사 강도를 발휘한다. 바람직하게는 전사 속도 또는 강도는 POI를 생산하는 재조합 목적을 위한 숙주 세포로서 선택된 (예를 들어 진핵) 숙주 세포에서 결정된 바와 같이 천연 pGAP 프로모터와 비교하여 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 또는 100%, 또는 110%, 120%, 130%, 140%, 150%, 160%, 170%, 180%, 190%, 또는 200% 중 적어도 임의의 하나와 같이 심지어 그 이상 중 적어도 임의의 하나이다.

천연 pGAP 프로모터는 전형적으로 대부분의 살아있는 유기체에 존재하는 구성적 프로모터인 글리세르알데히드-3-포스페이트 데하이드로게나제(GAPDH)를 암호화하는 gap 유전자의 발현을 개시한다. 당분해 및 당신생의 주요 효소인 GAPDH(EC 1＼2＼1＼12)는 이화작용 및 동화작용 탄수화물 대사에서 중요한 역할을 한다.

천연 pGAP 프로모터는 구체적으로 비변형(비-재조합) 또는 재조합 진핵 세포를 포함하는 동일한 종 또는 균주의 천연 진핵 세포에서와 유사한 방식으로 재조합 진핵 세포에서 활성이다. 이러한 천연 pGAP 프로모터는 통상적으로 내인성 프로모터인 것으로 이해되며, 따라서 세포에 상동성이며, 비교 목적을 위한 표준 또는 참조 프로모터로서 제공될 수 있다. 본원에 기재된 바와 같은 프로모터의 상대적 발현 또는 전사 강도는 일반적으로 POI를 생산하기 위한 숙주로서 사용되는 동일한 종 또는 균주의 세포의 천연 pGAP 프로모터와 비교된다.

본원에 기재된 프로모터와 같이 유도성 또는 억제성 조절 요소와 관련하여 용어 "조절가능한"은 유가 전략에 따라, 숙주 세포에서 과량의 물질(예컨대 세포 배양 배지에서의 영양소)의 존재 하에 예를 들어, 회분 배양의 성장 단계에서 억제되고, 예를 들어 생산 단계(예컨대 영양소의 양을 감소시킬 때, 또는 보충 기질을 공급할 때)에서 강한 활성을 유도하기 위해 탈억제되는 요소를 지칭할 것이다. 조절 요소는 또한 조절가능한 것으로 설계될 수 있어서, 요소가 세포 배양 첨가제의 첨가 없이 불활성이고, 이러한 첨가제의 존재 하에 활성이도록 한다. 따라서, 이러한 조절 요소의 제어 하에 POI의 발현은 이러한 첨가제의 첨가 시 유도될 수 있다.

본원에 기재된 바와 같은 ECP는 전형적으로 세포 성장 조건(성장 단계) 하에 침묵 또는 억제되고, 생산 조건(생산 단계) 하에 활성화 또는 탈억제되어, 탄소 공급원을 제한함으로써 생산 세포주에서 POI 생산을 유도하는 데 적합한 상대적으로 강한 조절가능한 프로모터이다.

구체적으로, 본원에 기재된 바와 같은 프로모터는 글루코스의 존재 및 글루코스 제한 하에 강도를 비교하는 테스트에서 결정된 바와 같은 차등 프로모터 강도로 조절가능한 탄소 공급원이며, 이는 상대적으로 높은 글루코스 농도, 바람직하게는 적어도 10 g/L, 바람직하게는 적어도 20 g/L의 농도에서 여전히 억제됨을 나타낸다. 구체적으로 본원에 기재된 프로모터는 프로모터를 완전히 유도하는 글루코스 역치 농도를 고려하여 제한된 글루코스 농도에서 완전히 유도되며, 역치는 전형적으로 20 g/L 미만, 바람직하게는 10 g/L 미만, 1 g/L 미만 또는 최대 1 g/L, 심지어 0.1 g/L 미만 또는 50 mg/L 미만이며, 바람직하게는 완전 전사 강도는 40 mg/L 미만의 글루코스 농도에서 천연 상동 pGAP 프로모터의 적어도 50%이다.

예를 들어, 본원에 기재된 탄소 공급원 조절가능한 프로모터를 특징으로 하기 위해 본원의 개시내용의 맥락 내에서 본원에 사용된 바와 같은 용어 "억제," 또는 "억제된"은 억제가능한 것으로 이해되는 프로모터의 전사 제어 하에 있어서, 세포(들)에 의해 관심 단백질의 발현을 감소시키는 관심 유전자(관심 단백질을 암호화)의 전사 간섭을 지칭한다.

본원에 기재된 ECP의 억제는 구체적으로 억제제가 세포 배양 배지에 있을 때 발생한다. 억제제는 특정 탄소 공급원 또는 억제량 예를 들어 특정 역치량을 초과하는 탄소 공급원일 수 있다. 관심 유전자 또는 관심 단백질의 발현은 억제제가 배지에서 제거되거나, 또는 더 이상 억제하지 않는 역치량 미만으로 감소될 때 "탈억제된" 것이이라고 한다. 탈억제 시, ECP는 완전히 유도된 것으로 이해되고, 관심 단백질의 발현은 전형적으로 프로모터-억제 조건 하에 세포(들)에 의한 기저 발현 수준보다 적어도 1.5-배 높다.

구체적으로, 본원에 기재된 ECP의 제어 하에 관심 유전자의 전사는 ECP를 탈억제 또는 완전 유도할 때 상기 유전자의 전사와 비교하여 30, 40, 50, 60, 70, 80, 85%, 90%, 또는 95% 중 적어도 임의의 하나만큼 억제되거나, 또는 완전히 억제(100% 억제)될 수 있다.

억제 및 탈억제 조건 하에 프로모터 강도를 비교하는 차등 프로모터 강도는 프로모터의 조절가능한 특성 및 각각의 유도비를 결정한다. 특정 구현예에 따르면, 유도비는 미리 결정된 탄소 공급원 역치 미만의 유도 조건으로 전환할 때 POI 생산 개시에 의해 결정되고, 억제된 상태에서 강도와 비교되는 차등 프로모터 강도로서 이해된다. 전사 강도는 통상적으로 완전히 유도된 상태에서의 강도로 이해되며, 즉 탈억제 조건 하에 거의 최대 활성을 나타낸다. 차등 프로모터 강도는 예를 들어 억제 조건과 비교하여 탈억제 조건 하에 재조합 숙주 세포주에서 POI 생산의 효율 또는 수율에 따라, 또는 달리 전사체의 양에 의해 결정된다. 본원에 기재된 바와 같은 조절가능한 프로모터는 바람직한 차등 프로모터 강도(유도비)를 가지며, 억제된 상태와 비교하여 탈억제된(완전히 유도된) 상태에서 적어도 1.5 배 또는 적어도 2 배, 보다 바람직하게는 적어도 5 배, 보다 더 바람직하게는 적어도 10 배, 보다 바람직하게는 적어도 20 배, 보다 바람직하게는 적어도 30, 40, 50, 또는 100 배이며, 또한 배수 유도로도 이해된다.

본원에 사용된 바와 같은 용어 "돌연변이 생성"은 비-코딩 또는 코딩 영역에서 적어도 하나의 변화가 있는 이의 변이체를 수득하기 위해 예를 들어 하나 이상의 뉴클레오티드의 삽입, 결실 및/또는 치환을 통해 뉴클레오티드 서열의 돌연변이체를 제공하는 방법을 지칭할 것이다. 돌연변이 생성은 무작위, 반무작위 또는 부위 지정 돌연변이를 통해서일 수 있다. 본원에 기재된 특이적 ECP 및 각각의 뉴클레오티드 서열을 사용하여 변이체를 생산할 수 있으며, 이는 마찬가지로 본원에 기재된 바와 같은 목적을 위해 사용될 수 있는 조절가능한 프로모터이다. 이러한 변이체는 모체 서열로서 본원에 제공된 ECP 뉴클레오티드 서열을 사용하는 적합한 돌연변이 생성 방법에 의해 생산될 수 있다. 이러한 돌연변이 생성 방법은 각각의 모체 프로모터 서열 정보를 주형으로 사용하여 핵산을 조작하거나 또는 뉴클레오티드 서열을 새로 합성하는 방법을 포함한다. 구체적 돌연변이 생성 방법은 합리적인 프로모터 조작을 적용한다.

본원에 기재된 예시적인 ECP는 예를 들어 변경된 발현 수준 및 조절 특성을 갖는 프로모터 변이체를 생성하기 위해 변형될 수 있다. 예를 들어, 프로모터 라이브러리는 선택된 프로모터 서열의 돌연변이 생성에 의해 제조될 수 있으며, 이는 예를 들어 상이한 발효 전략 하에 발현에 대해 변이체를 분석하고 적합한 변이체를 선택함으로써 진핵 세포에서 유전자 발현을 미세 조정하기 위해 모체 분자로서 사용될 수 있다. 변이체의 합성 라이브러리는 예를 들어 선택된 POI를 생산하기 위한 요건과 일치하는 프로모터를 선택하기 위해 사용될 수 있다. 이러한 변이체는 (예를 들어, 진핵) 숙주 세포에서 증가된 발현 효율 및 탄소 공급원이 풍부하고 제한적인 조건 하에 차등 발현을 가질 수 있다. 전형적으로 큰 무작위화된 유전자 라이브러리는 높은 유전자 다양성으로 생산되며, 구체적으로 원하는 유전자형 또는 표현형에 따라 선택될 수 있다.

특정 ECP 변이체는 본원에 제공된 ECP 뉴클레오티드 서열의 크기 변이체일 수 있고/있거나 코어 조절 영역, 주 조절 영역, 또는 T 모티프와 같은 본원에 기재된 프로모터의 요소 또는 영역 중 하나 초과를 포함하고/하거나, ECP 뉴클레오티드 서열의 하나 이상의 (동일하거나 또는 상이한) 단편을 포함한다.

구체적 돌연변이 생성 방법은 프로모터의 뉴클레오티드 서열 내에서 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10 개, 또는 심지어 그 이상의 연속 뉴클레오티드의 변화와 같은 서열에서 하나 이상의 뉴클레오티드의 점 돌연변이, 특히 탠덤 점 돌연변이를 제공한다. 점 돌연변이는 전형적으로 하나 이상의 뉴클레오티드의 결실, 삽입, 및/또는 치환 중 적어도 하나이다. 프로모터 서열은 원위 단부, 특히 전장 프로모터 서열의 최대 50%에 이르는 5'-영역 내에서 돌연변이될 수 있으며, 5'-영역은 프로모터 활성을 실질적으로 상실하지 않고 매우 가변적일 수 있다. 프로모터 서열은 주 조절 영역 내에서 특이적으로 돌연변이될 수 있지만, 예시적인 주 조절 영역 및 특히 예시적인 코어 조절 영역에 대한 서열 동일성은 예를 들어 80%, 85%, 90%, 또는 95% 중 적어도 임의의 하나와 같이 높은 것이 바람직할 수 있다. 코어 또는 주 조절 영역 중 임의의 것 외에, 서열의 가변성이 더 높을 수 있고 ECP는 여전히 기능적이며 예를 들어, 80% 미만 또는 85% 미만의 서열 동일성을 갖는다.

코어 또는 주 조절 영역 내에서 임의의 돌연변이는 전형적으로 보존적이며, 즉 예컨대 특정 전사 인자에 의한 인식을 유지한다(또는 심지어 개선시킨다).

구체적으로, 본원에 기재된 ECP는 예를 들어 본원에 기재된 코어 또는 주 조절 영역 및 또한 상이한 프로모터, 예를 들어 임의의 구성적 또는 조절가능한(또는 달리 유도가능한) 프로모터의 3'-말단(예를 들어, 최대 20, 25, 또는 30 nt)을 포함하는 적어도 10 또는 15 개의 3'-말단 뉴클레오티드 서열을 포함하는 3'-영역(특이적으로 3'-단부에서 번역 개시 부위와 같은 하나 이상의 영역 또는 대체(천연 또는 인공) 프로모터 서열을 포함하여, ECP 프로모터의 번역 개시 부위를 대체하는 하이브리드 뉴클레오티드 서열을 포함할 수 있다.

본원에 사용된 바와 같은 용어 "뉴클레오티드 서열" 또는 "핵산 서열"은 DNA 또는 RNA를 지칭한다. "핵산 서열" 또는 "폴리뉴클레오티드 서열" 또는 간단히 "폴리뉴클레오티드"는 5'에서 3' 단부까지 판독되는 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 염기의 단일 또는 이중-가닥 중합체를 지칭한다. 이는 발현 카세트, 자기 복제 플라스미드, DNA 또는 RNA의 감염성 중합체, 및 비기능적 DNA 또는 RNA를 포함한다.

본원에 기재된 바와 같은 용어 "관심 단백질(POI)"은 숙주 세포에서 재조합 기술에 의해 생산되는 폴리펩티드 또는 단백질을 지칭한다. 보다 구체적으로, 단백질은 숙주 세포에서 자연 발생하지 않는 폴리펩티드, 즉 이종 단백질일 수 있거나, 또는 달리 숙주 세포에 고유할 수 있으며, 즉 숙주 세포에 대해 상동 단백질일 수 있지만, 예를 들어, POI를 암호화하는 핵산 서열을 함유하는 자기 복제 벡터로의 형질전환, 또는 POI를 암호화하는 핵산 서열의 하나 이상의 카피의 재조합 기술을 숙주 세포의 게놈에 통합할 때, 또는 POI를 암호화하는 유전자의 발현을 제어하는 하나 이상의 조절 서열, 예를 들어, 프로모터 서열의 재조합 변형에 의해 생산된다. 일부 경우에 본원에 사용된 바와 같은 용어 POI는 또한 재조합으로 발현된 단백질에 의해 매개된 바와 같은 숙주 세포에 의한 임의의 대사 산물을 지칭한다.

본원에 사용된 바와 같은 용어 "스캐폴드"는 항원 결합 분자의 생성을 위한 시작점으로서 제공되는 크기, 구조, 및 기원이 상이한 조밀하고 안정되게 폴딩된 단백질의 다면적인 그룹을 기재한다. 항체(면역글로불린)의 구조-기능 관계에 의해 영감을 받아, 이러한 대체 단백질 스캐폴드는 주어진 (생체)분자 표적의 조밀하고 특이적인 인식을 위해 재형성될 수 있는 상호작용 부위를 지지하는 견고하고 보존된 구조적 프레임워크를 제공한다.

모체 뉴클레오티드 또는 아미노산 서열과 비교하여 변이체, 상동체 또는 이종상동체의 "서열 동일성"이라는 용어는 2 개 이상의 서열의 동일성 정도를 나타낸다. 2 개 이상의 아미노산 서열은 어느 정도로, 최대 100%까지 상응하는 위치에서 동일하거나 또는 보존된 아미노산 잔기를 가질 수 있다. 2 개 이상의 뉴클레오티드 서열은 어느 정도로, 최대 100%까지 상응하는 위치에서 동일하거나 또는 보존된 염기쌍을 가질 수 있다.

서열 유사성 검색은 과도한 (예를 들어, 적어도 50%) 서열 동일성을 갖는 상동체를 식별하기 위한 효과적이고 신뢰할 수 있는 전략이다. 빈번하게 사용되는 서열 유사성 검색 도구는 예를 들어, BLAST, FASTA, 및 HMMER이다.

서열 유사성 검색은 과도한 유사성, 및 공통 조상을 반영하는 통계적으로 유의한 유사성을 검출함으로써 이러한 상동 단백질 또는 유전자를 식별할 수 있다. 상동체는 본원에서 상이한 유기체의 동일한 단백질, 예를 들어, 상이한 상이한 유기체 또는 종에서 이러한 단백질의 변이체로 이해되는 이종상동체를 포함할 수 있다.

상이한 유기체 또는 종에서 동일한 단백질의 이종상동 서열은 전형적으로 특이적으로 동일한 속에서 유래하는 이종상동체의 단백질 서열에 상동이다. 전형적으로, 이종상동체는 25%, 30%, 35%, 40%, 50%, 60%, 70%, 80%, 85%, 90%, 또는 95% 동일성 중 적어도 약 임의의 하나, 최대 100% 서열 동일성을 갖는다. 구체적으로, 이종상동체는 FLO8 단백질 또는 내인성 FLO8 단백질을 녹아웃하도록 변형된 숙주 세포에서 이종상동 서열에 의해 FLO8 단백질을 암호화하는 유전자의 대체 시 결정될 수 있다. 예를 들어, 추정되는 FLO8 단백질이 각각 피. 파스토리스 및 에스. 세레비지애 숙주 세포에서 기능하여 각각 이러한 피. 파스토리스 또는 에스. 세레비지애 숙주 세포에서 녹아웃된 유전자에 의해 암호화된 내인성 FLO8 단백질을 대체하는 경우, 이러한 추정되는 FLO8 단백질은 본원에 기재된 목적을 위해 FLO8 단백질 상동체로 간주될 수 있다.

서열번호:1로 식별된 아미노산 서열을 포함하거나 또는 이로 이루어진 FLO8 단백질은 케이. 파피이 기원의 것이다. 다른 진핵 또는 원핵 숙주 세포에 존재하는 상동 서열이 있음이 잘 이해된다. 예를 들어, 효모 세포는 특히 피키아 파스토리스의 효모에서 각각의 상동 서열을 포함하며, 이는 새로운 속인 코마가타엘라로 재분류되었고, 3 개의 종인 케이. 파스토리스, 케이. 파피이, 및 케이. 슈도파스토리스로 분열되었다. 특이적 상동 서열은 예를 들어 케이. 파스토리스(예를 들어, 서열번호:3, 예컨대 서열번호:4를 포함하거나 또는 이로 이루어진 뉴클레오티드 서열에 의해 암호화됨), 사카로마이세스 세레비지애(예를 들어, 서열번호:5 또는 서열번호:6), 야로위아 리폴리티카(예를 들어, 서열번호:7), 오가타에아 폴리모르파(예를 들어, 서열번호:8), 또는 아스페르길루스 니게르(예를 들어, 서열번호:9)에서 발견된다.

본원에 기재된 특정 서열 동일성을 갖는 FLO8 단백질, 특히 피. 파스토리스 FLO8 단백질의 이종상동체인 임의의 FLO8 단백질의 임의의 상동 서열은 본원에 기재된 FLO8 단백질의 정의에 포함된다.

본원에 기재된 아미노산 서열, 상동체 및 이종상동체와 관련하여 "퍼센트(%) 아미노산 서열 동일성"은 특이적 폴리펩티드 서열에서 아미노산 잔기와 동일한 후보 서열에서 아미노산 잔기의 백분율로 정의되며, 필요한 경우, 서열 정렬 및 갭 도입 후, 최대 퍼센트 서열 동일성을 달성하고, 임의의 보존적 치환을 서열 동일성의 일부로 간주하지 않는다. 당업자는 비교되는 서열의 전장에 걸쳐 최대 정렬을 달성하는 데 필요한 임의의 알고리즘을 포함하여, 정렬을 측정하기 위한 적절한 매개변수를 결정할 수 있다.

본원에 기재된 목적을 위해, 2 개의 아미노산 서열 사이의 서열 동일성은 NCBI BLAST 프로그램 버전 BLASTP 2.8.1을 사용하여 다음 예시적인 매개변수로 결정된다: 프로그램: blastp, 글자 크기: 6, 예상값: 10, 히트리스트 크기: 100, 갭비용: 11.1, 매트릭스: BLOSUM62, 문자 열: F, 구성 조정: 조건부 구성 점수 매트릭스 조정.

예를 들어 프로모터 또는 유전자의 뉴클레오티드 서열과 관련하여 "퍼센트(%) 동일성"은 DNA 서열에서 뉴클레오티드와 동일한 후보 DNA 서열에서 뉴클레오티드의 백분율로 정의되며, 필요한 경우, 서열 정렬 및 갭 도입 후, 최대 퍼센트 서열 동일성을 달성하고, 임의의 보존적 치환을 서열 동일성의 일부로 고려하지 않는다. 퍼센트 뉴클레오티드 서열 동일성을 결정하는 목적을 위한 정렬은 예를 들어, 공개적으로 이용가능한 컴퓨터 소프트웨어를 사용하여 당업계의 기술 내에 있는 다양한 방식으로 달성될 수 있다. 당업자는 비교되는 서열의 전장에 걸쳐 최대 정렬을 달성하는 데 필요한 임의의 알고리즘을 포함하여 정렬을 측정하기 위한 적절한 매개변수를 결정할 수 있다.

POI와 관련하여 본원에 사용된 바와 같은 용어 "단리된" 또는 "단리"는 "정제된" 또는 "실질적으로 순수한" 형태로 존재하기 위해 자연적으로 회합될 환경, 특히 세포 배양 상청액으로부터 충분히 분리된 이러한 화합물을 지칭할 것이다. 그러나, "단리된"은 다른 화합물 또는 물질과의 인공 또는 합성 혼합물의 배제, 또는 기본 활성을 방해하지 않고 예를 들어 불완전한 정제로 인해 존재할 수 있는 불순물의 존재를 반드시 의미하지는 않는다. 단리된 화합물은 이의 제제를 생산하기 위해 추가로 제형화될 수 있고, 여전히 실용적 목적을 위해 단리될 수 있으며, 예를 들어 POI는 진단 또는 요법에 사용될 때 약제학적으로 허용되는 담체 또는 부형제와 혼합될 수 있다.

본원에 사용된 바와 같은 용어 "정제된"은 적어도 50%(mol/mol), 바람직하게는 적어도 60%, 70%, 80%, 90% 또는 95%의 화합물(예를 들어, POI)을 포함하는 제제를 지칭할 것이다. 순도는 화합물에 적절한 방법(예를 들어, 크로마토그래픽 방법, 폴리아크릴아미드 겔 전기영동, HPLC 분석 등)에 의해 측정된다. 본원에 기재된 바와 같이 단리되고 정제된 POI는 세포 배양 상청액을 정제하여 불순물을 감소시킴으로써 수득될 수 있다.

재조합 폴리펩티드 또는 단백질 산물을 수득하기 위한 단리 및 정제 방법으로서, 염석 및 용매 침전과 같이 용해도 차이를 활용하는 방법, 한외여과 및 겔 전기영동과 같이 분자량 차이를 활용하는 방법, 이온 교환 크로마토그래피와 같이 전하 차이를 활용하는 방법, 친화성 크로마토그래피와 같이 특이적 친화성을 활용하는 방법, 역상 고성능 액체 크로마토그래피와 같이 소수성 차이를 활용하는 방법, 및 등전위 초점과 같이 등전점 차이를 활용하는 방법과 같은 방법이 사용될 수 있다.

다음 표준 방법이 바람직하다: 미세여과 또는 접선 유동 여과(TFF) 또는 원심분리에 의한 세포(파편) 분리 및 세척, 침전 또는 열 처리에 의한 POI 정제, 효소적 소화에 의한 POI 활성화, 이온 교환(IEX), 소수성 상호작용 크로마토그래피(HIC), 친화성 크로마토그래피, 크기 배제(SEC) 또는 HPLC 크로마토그래피와 같은 크로마토그래피에 의한 POI 정제, POI 농도 침전 및 한외여과 단계에 의한 세척.

고도로 정제된 생성물은 본질적으로 오염 단백질이 없고, 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95%, 또는 심지어 적어도 98%, 최대 100%의 순도를 갖는다. 정제된 생성물은 세포 배양 상청액의 정제 또는 또는 달리 세포 파편으로부터 수득될 수 있다.

단리되고 정제된 POI는 웨스턴 블롯, HPLC, 활성 검정, 또는 ELISA와 같은 통상적인 방법에 의해 식별될 수 있다.

본원에 사용된 바와 같은 용어 "재조합"은 유전적 조작에 의해 제조되는 것 또는 결과를 의미한다. 재조합 숙주는 하나 이상의 뉴클레오티드 또는 뉴클레오티드 서열을 결실 및/또는 불활성화하도록 조작될 수 있고, 특히 숙주에 외래인 뉴클레오티드 서열을 이용하여 구체적으로 재조합 핵산 서열을 함유하는 발현 벡터 또는 클로닝 벡터를 포함할 수 있다. 재조합 단백질은 숙주에서 각각의 재조합 핵산을 발현함으로써 생산된다. 본원에 사용된 바와 같은 POI와 관련하여 용어 "재조합"은 POI를 발현하도록 형질전환된 숙주 세포로부터 단리된 POI와 같은 재조합 수단에 의해 제조, 발현, 생성 또는 단리된 POI를 포함한다. 본 발명에 따르면 당업계의 기술 내의 통상적인 분자 생물학, 미생물학, 및 재조합 DNA 기술이 이용될 수 있다. 이러한 기술은 문헌에 자세히 설명되어 있다. 예를 들어, Maniatis, Fritsch & Sambrook, "Molecular Cloning: A Laboratory Manual, Cold Spring Harbor, (1982) 참조.

특정 재조합 숙주 세포는 유전적 조작을 사용하여, 즉 인간 개입에 의해 조작된 숙주 세포로서 이해되는 "조작된" 숙주 세포이다. 숙주 세포가 주어진 유전자 또는 각각의 단백질의 발현을 감소시키거나 또는 과소발현하도록 조작된 경우, 숙주 세포는 숙주 세포가 조작 전의 동일한 조건 하에 숙주 세포와 비교하거나, 또는 상기 유전자 또는 단백질이 과소발현되도록 조작되지 않은 숙주 세포와 비교하여, 각각 이러한 유전자 및 단백질을 발현하는 능력이 더 이상 없도록 조작된다.

구체적 예에 따르면, 놀랍게도 숙주 세포에서 FLO8 암호화 유전자 발현의 감소, 특히 이러한 유전자의 결실은 비-메탄올 제어된 유도성 프로모터(ECP)에 의해 제어된 유전자의 발현 수준에 긍정적인 영향을 미쳐서, 탄소 공급원 프로모터 조절을 상실하지 않으면서 더 높은 발현 수준을 허용함을 밝혀내었다. 따라서, FLO8 단백질을 암호화하는 각각의 내인성 유전자(flo8 유전자)가 결실되거나 또는 결실되지 않은 세포를 생성하고 ECP의 제어 하에 유전자의 강도 및 조절을 테스트하였다. 세포내 또는 분비된 모델 단백질인 여러 예시적인 POI의 경우, 발현은 증가된 전사체 수준으로 추적가능한 각각의 flo8 유전자의 결실이 있는 세포에서 증가된 것으로 나타났다. 증가된 발현은 소규모 스크리닝 배양 및 생물반응기의 제어된 생산 공정에서 모두 나타날 수 있다. 따라서, 이전의 기존 발현 시스템과 비교하여 메탄올이 없는 배지에서, 예를 들어 피키아와 같은 효모에서 훨씬 더 많은 생성물 형성을 허용하는 새로운 발현 시스템이 개발되었다.

구체적 예에 따르면, 비-메탄올 탄소 공급원 조절된 프로모터 pG1, pG3, pG4, pG6(이는 메탄올 이외의 탄소 공급원에 의해 조절됨)의 발현 강도에 대한 FLO8 파괴의 효과를 구성적 프로모터 pGAP 또는 메탄올-유도 프로모터 pAOX1과 비교하였다. 모든 비-메탄올 탄소 공급원 조절된 프로모터는 dFLO8 균주에서 통계적으로 유의한 더 높은 전사를 갖는 것으로 밝혀졌으며, 이는 놀라운 일이며 이러한 프로모터의 제어 하에 증가된 발현을 나타낸다. 대조적으로, 메탄올-유도성 pAOX1은 야생형과 비교하여 dFLO8 돌연변이체에서 유의하게 증가된 전사 강도를 나타내지 않았고, 또한 pGAP의 전사 강도에 대한 유의한 효과가 없었다. 따라서, pGAP 또는 pAOX1 프로모터 활성은 FLO8의 과소발현에 의해 영향받지 않는다는 결론을 내렸다.

놀랍게도 세포 배양물에서 관심 단백질을 생산하기 위한 관심 이종 유전자의 발현은 메탄올에 의해 유도가능하지 않는 탄소 공급원 억제성 프로모터를 사용할 때, 표준 pGAP 프로모터와 비교하여 FLO8의 녹아웃 또는 파괴 시 효과적으로 증가되었음을 밝혀내었다. 예를 들어, 프로모터 pG1, pG1-3, pG3, pG4, pG6, pG7, 및 pG8 각각에 대한 eGFP 형광의 증가는 dFLO8 균주에서 밝혀졌으며, 야생형 숙주 세포(FLO8 파괴 없음)에서의 발현과 비교하여 1.2 내지 3.9 배 범위로 증가하였다.

다음 항목은 본원에 기재된 구현예이다:

1. 서열번호:1로 식별된 아미노산 서열을 포함하는 FLO8 단백질 또는 이의 상동체를 암호화하는 내인성 유전자를 포함하며, 하나 이상의 유전적 변형 전의 숙주 세포와 비교하여 상기 유전자의 발현을 감소시키기 위해 상기 하나 이상의 유전적 변형에 의해 조작되고, 비-메탄올 탄소 공급원에 의해 조절가능한 발현 카세트 프로모터(ECP)의 제어 하에 관심 유전자(GOI)를 포함하는 이종 발현 카세트를 포함하는, 재조합 숙주 세포.

2. 항목 1에 있어서, 상기 상동체가 서열번호:1에 대해 적어도 25% 서열 동일성을 갖는, 숙주 세포.

3. 항목 1 내지 2 중 어느 한 항목에 있어서, 상기 하나 이상의 유전적 변형이 (i) 하나 이상의 내인성 폴리뉴클레오티드, 또는 이의 일부의 파괴, 치환, 결실 또는 녹아웃; 또는 (ii) 발현 제어 서열을 포함하는, 숙주 세포.

4. 항목 3에 있어서, 상기 내인성 폴리뉴클레오티드가 상기 FLO8 단백질 또는 상기 상동체를 암호화하는 유전자인, 숙주 세포.

5. 항목 4에 있어서, 상기 발현 제어 서열이 프로모터, 리보솜 결합 부위, 전사 또는 번역 시작 및 중지 서열, 또는 인핸서 또는 활성인자 서열 중 임의의 하나를 포함하는, 숙주 세포.

6. 항목 1 내지 4 중 어느 한 항목에 있어서, 상기 ECP가 성장-제한량의 비-메탄올 탄소 공급원의 존재 하에, 바람직하게는 메탄올의 부재 하에 유도가능하고; 성장-제한량보다 높은 과량의 비-메탄올 탄소 공급원의 존재 하에 억제가능한, 숙주 세포.

7. 항목 6에 있어서, 상기 비-메탄올 탄소 공급원의 성장-제한량이 최대 1 g/L 세포 배양 배지인, 숙주 세포.

8. 항목 1 내지 7 중 어느 한 항목에 있어서, 상기 ECP가 적어도 하나의 제1 및 적어도 하나의 제2 코어 조절 영역을 포함하며, 여기서 제1 코어 조절 영역은 서열번호:17에 대해 적어도 75% 서열 동일성을 갖고, 제2 코어 조절 영역은 서열번호:18에 대해 적어도 75% 서열 동일성을 갖는, 숙주 세포.

9. 항목 1 내지 8 중 어느 한 항목에 있어서, 상기 ECP가 서열번호:35에 대해 적어도 85% 서열 동일성을 갖는 적어도 하나의 조절 영역을 포함하는, 숙주 세포.

10. 항목 8 또는 9에 있어서, 상기 ECP가 상기 제1 및/또는 제2 코어 조절 영역 중 적어도 2 개를 포함하는, 숙주 세포.

11. 항목 1 내지 10 중 어느 한 항목에 있어서, 상기 ECP가 서열번호:19-34 중 임의의 하나로 이루어진 적어도 하나의 T 모티프를 포함하며, 임의적으로 상기 T 모티프의 5' 또는 3' 단부 중 어느 하나에서 하나 이상의 티민에 의한 상기 T 모티프의 연장이 없는, 숙주 세포.

12. 항목 11에 있어서, 상기 ECP가 상기 T 모티프 중 적어도 2 개를 포함하는, 숙주 세포.

13. 항목 1 내지 7 중 어느 한 항목에 있어서, 상기 ECP가 서열 서열번호:10-16 중 임의의 하나, 또는 서열번호:41-45 중 임의의 하나의 적어도 300 nt에 대해 적어도 60% 서열 동일성을 포함하는, 숙주 세포.

14. 항목 13에 있어서, 상기 ECP가 전장 서열 서열번호:10-16 중 임의의 하나, 또는 서열번호:41-45 중 임의의 하나에 대해 적어도 60% 서열 동일성을 포함하는, 숙주 세포.

15. 항목 13 또는 14에 있어서, 상기 ECP가 서열번호:10 또는 서열번호:11을 포함하거나 또는 이로 이루어지는, 숙주 세포.

16. 항목 1 내지 15 중 어느 한 항목에 있어서, 상기 발현 카세트가 자율 복제 벡터 또는 플라스미드, 또는 상기 숙주 세포의 염색체 내에 포함되는, 숙주 세포.

17. 항목 1 내지 16 중 어느 한 항목에 있어서, 상기 발현 카세트가 GOI에 의해 암호화된 관심 단백질(POI)의 분비를 가능하게 하는 신호 펩티드를 암호화하는 뉴클레오티드 서열을 추가로 포함하며, 바람직하게는 여기서 상기 신호 펩티드를 암호화하는 뉴클레오티드 서열은 GOI의 5'-단부에 인접하게 융합되는, 숙주 세포.

18. 항목 1 내지 17 중 어느 한 항목에 있어서, 상기 GOI가 항원 결합 단백질, 치료 단백질, 효소, 펩티드, 단백질 항생제, 독소 융합 단백질, 탄수화물 - 단백질 접합체, 구조적 단백질, 조절 단백질, 백신 항원, 성장 인자, 호르몬, 사이토카인, 공정 효소, 및 대사 효소로 이루어진 군으로부터 선택된 펩티드 또는 단백질인 관심 단백질(POI)을 암호화하는, 숙주 세포.

19. 항목 1 내지 18 중 어느 한 항목에 있어서, 상기 항원 결합 단백질이 다음으로 이루어진 군으로부터 선택되는, 숙주 세포:

a) 항체 또는 항체 단편, 예컨대 키메라 항체, 인간화 항체, 이중특이적 항체, Fab, Fd, scFv, 디아바디, 트리아바디, Fv 사량체, 미니바디, VH, VHH, IgNAR, 또는 V-NAR과 같은 단일-도메인 항체 중 임의의 것;

b) 항체 모방체, 예컨대 아드넥틴, 아피바디, 아필린, 아피머, 아피틴, 알파바디, 안티칼린, 아비머, DARPin, 피노머, 쿠니츠 도메인 펩티드, 모노바디, 또는 NanoCLAMPS; 또는

20. 항목 1 내지 19 중 어느 한 항목에 있어서,

a) 피키아, 한세눌라, 코마가타엘라, 사카로마이세스, 클루이베로마이세스, 칸디다, 오가타에아, 야로위아, 및 지오트리쿰, 예컨대 피키아 파스토리스, 코마가타엘라 파피이, 코마가타엘라 파스토리스, 코마가타엘라 슈도파스토리스, 사카로마이세스 세레비지애, 오가타에아 미누타, 클루이베롬세스 락티스, 클루이베로메스 마르시아누스, 야로위아 리폴리티카 또는 한세눌라 폴리모르파로 이루어진 군으로부터 선택된 속의 효모 세포; 또는

b) 사상성 진균, 예컨대 아스페르길루스 아와모리 또는 트리코더마 레세이의 세포인, 숙주 세포.

21. 숙주 세포에서 서열번호:1로 식별된 아미노산 서열을 포함하는 FLO8 단백질 또는 이의 상동체를 암호화하는 유전자의 발현을 감소시킴으로써, 비-메탄올 탄소 공급원에 의해 조절가능하거나 또는 억제가능한 프로모터의 제어 하에 관심 단백질(POI)을 암호화하는 관심 유전자(GOI)를 발현하는 상기 숙주 세포에 의해 생산된 상기 POI의 수율을 증가시키는 방법.

22. 관심 단백질(POI)을 생산하기 위한 조건 하에 항목 1 내지 20 중 어느 한 항목의 숙주 세포를 배양함으로써 관심 유전자(GOI)에 의해 암호화된 상기 POI를 생산하는 방법.

23. 항목 21 또는 22에 있어서, 하기 단계를 포함하는, 방법:

a) 성장 조건 하에 숙주 세포를 배양하는 단계; 및 추가 단계

24. 항목 23에 있어서, 상기 제1 또는 제2 탄소 공급원이 사카라이드, 폴리올, 알코올, 또는 전술한 것 중 임의의 하나 이상의 혼합물로부터 선택되는, 방법.

25. 항목 23 또는 24에 있어서, 상기 단계 a) 배양이 회분 단계에서 수행되고; 상기 단계 b) 배양이 유가 또는 연속 배양 단계에서 수행되는, 방법.

26. 하기 단계를 포함하는, 숙주 세포에서 관심 단백질(POI)을 생산하는 방법:

a) 서열번호:1로 식별된 아미노산 서열을 포함하는 FLO8 단백질 또는 이의 상동체를 암호화하는 내인성 유전자의 발현을 감소시키기 위해 숙주 세포를 유전적으로 조작하는 단계;

b) 상기 POI를 암호화하는 관심 유전자(GOI)에 작동가능하게 연결된 비-메탄올 탄소 공급원 조절가능한 프로모터(특히 본원에 기재된 ECP)를 포함하는 이종 발현 카세트를 숙주 세포에 도입하는 단계;

e) 임의적으로 상기 POI를 정제하는 단계.

전술한 설명은 하기 실시예를 참조하여 더 완전히 이해될 것이다. 그러나, 이러한 실시예는 단지 본 발명의 하나 이상의 구현예를 실시하는 방법을 대표하는 것이며 본 발명의 범위를 제한하는 것으로 해석되어서는 안 된다.

실시예

하기 실시예는 전사 조절인자 FLO8의 파괴가 pG1, pG3, pG4, pG6, 및 pG8과 같은 탄소 조절된 프로모터, 및 이의 조작된 변이체의 더 높은 전사 활성을 초래하여 탄소 제한된 배양 조건 하에 재조합 단백질의 생산성을 증가시킬 수 있음을 입증할 것이다.

실시예 1: 피. 파스토리스 d FLO8 균주의 구축

피. 파스토리스 야생형 균주 CBS7435 또는 CBS2612(CBS-KNAW Fungal Biodiversity Centre, Centraalbureau voor Schimmelcultures, 네덜란드 위트레흐트 소재)를 숙주 균주로 사용하였다.

dFLO8 돌연변이체 균주를 생성하기 위해 유전자 PP7435_Chr4-0252(FLO8)를 피. 파스토리스에 대해 적합하고(Gasser et al., 2013) WO2015158800A1에 기재된 바와 가튼 분열 마커 카세트 방법으로 파괴하였다. 간단히 말해서, ORF의 번역 시작의 대략 200 bp 상류 및 하류에 위치한 2 개의 1.5 kb 영역을 각각 프라이머 A_fw 및 A_bw 뿐만 아니라 D_fw 및 D_bw를 사용하여 증폭시켰다(표 1). 생성된 단편 A 및 B를 사용하여 내성 마커 카세트의 각각의 부분 B 및 C의 5' 및 3' 단부에 상동성인 프라이머 A_bw 및 D_fw의 돌출부를 사용하여, 융합 PCR에 의해 KanMX 마커 카세트(프라이머 B_fw, B_bw, C_fw 및 C_bw)의 2 개의 약 1 kb 길이 및 중첩 부분(435 bp)을 플랭킹하였다. 2 개의 융합된 단편 AB 및 CD를 동시에 (Gasser et al., 2013)에 기재된 바와 같은 전기적격 피. 파스토리스 세포로 형질전환하였다. 성공적인 통합은 KanMX 카세트에 의해 PP7435_Chr4-0252의 5' 단부에 있는 0.4 kb 단편 및 이의 프로모터를 교체하는 3 가지 상이한 재조합 이벤트가 필요하다.

양성 형질전환체의 선택은 500 μg mL^-1 제네티신(Geneticin)을 함유하는 선택적 YPD-한천 플레이트(리터 당: 10 g 효모 추출물, 20 g 펩톤, 20 g 글루코스, 20 g 한천-한천)에서 수행하였다. 정확한 결실 돌연변이체는 분열 마커 카세트(Det_fw 및 Det_bw, 표 1)의 외부에 위치한 프라이머를 사용한 PCR 및 겔 전기영동에 의해 검증하였다.

표 1: 분열 마커 카세트 구축을 위한 프라이머

실시예 2: pG1 및 pG1-3 구동된 세포내 eGFP 생산성에 대한 FLO8 파괴의 효과

a) 피. 파스토리스 d FLO8 균주의 구축

피. 파스토리스 CBS2612_pG1_eGFP #8(WO2013050551A1에 기재됨) 및 CBS2612_pG1-3_eGFP#1(WO2017021541A1 및 Prielhofer et al., 2018에 CBS2612_pGTH1-D1240으로 기재됨)을 숙주 균주로 사용하였다. 이들 균주는 글루코스-조절 프로모터 pG1(서열번호:12) 또는 이의 조작된 변이체(pG1-3, 서열번호:10), GOI 및 에스. 세레비지애 CYC1 전사 종결인자로 구성된 eGFP 발현 카세트와 함께 제오신(Zeocin) 내성 카세트의 단일 카피를 통합한 것으로 입증되었다. 상응하는 dFLO8 돌연변이체 균주를 실시예 1에 기재된 바와 같이 구축하였다.

b) eGFP 생산성 스크리닝

발현 스크리닝을 위해, dFLO8 균주 뿐만 아니라 각각의 모체 균주 및 비-생산 야생형 균주의 단일 콜로니를 25 μg mL^-1 제오신 및 500 μg mL^-1 제네티신(적절한 경우)을 함유하는 2 mL 액체 YP 배지(리터 당: 20 g 펩톤, 10 g 효모 추출물)에 접종하였다. 사전 배양물을 24-DWP에서 25℃ 및 280 rpm에서 약 24 시간 동안 성장시킨 후 50 g L^-1 폴리사카라이드 및 1.5 %의 글루코스-방출 효소(약 0.8 mg mL^-1 h^-1의 글루코스 방출 속도를 가능하게 함; m2p 배지 발색 키트)를 함유하는 2 mL의 합성 스크리닝 배지 ASMv6(배지 조성은 하기 제공됨)을 5의 시작-OD₆₀₀(유도 조건)으로 접종하는 데 사용하였다. 억제 조건을 위해, 2% 글리세롤을 함유하는 ASMv6을 사용하였다. 그런 다음 주 배양물을 25℃ 및 280 rpm에서 추가 48 시간 동안 배양하였다. eGFP-발현을 측정하기 위해, 세포를 포스페이트-완충 염수(PBS)에서 0.1의 OD₆₀₀으로 희석하고 Stadlmayr et al., 2010에 기재된 바와 같이 유세포 분석에 의해 분석하였다. 각각의 샘플에 대해 15 000 개의 세포를 분석하였다. 피. 파스토리스의 자동 형광을 피. 파스토리스 야생형 세포를 사용하여 측정하고 신호로부터 차감하였다. 정규화된 eGFP 발현 수준(세포 크기와 관련한 형광 강도)은 pGAP-제어된 발현의 백분율로 주어진다(표 2).

리터 당 함유된 합성 스크리닝 배지 ASMv6: 22.0 g 시트르산 일수화물, 6.30 g (NH₄)₂HPO₄, 0.49 g MgSO₄*7H₂O, 2.64 g KCl, 0.0535 g CaCl₂*2H₂O, 1.470 mL PTM0 미량 염 스톡 용액, 0.4 mg 비오틴; pH는 KOH(고체)를 사용하여 6.5로 설정하였다.

리터 당 함유된 PTM0 미량 염 스톡 용액:

6.0 g CuSO₄*5H₂O, 0.08 g NaI, 3.36 g MnSO₄*H₂O, 0.2 g Na₂MoO₄*2H₂O, 0.02 g H₃BO₃, 0.82 g CoCl₂*6H₂O, 20.0 g ZnCl₂, 65.0 g FeSO₄*7H₂O 및 5.0 ml H₂SO₄(95 %-98 %).

표 2: pG1 또는 pG1-3의 제어 하에 eGFP의 발현에 대한 d FLO8 의 영향. 2% 글리세롤(억제) 또는 제한-글루코스(유도)에서 48 시간 배양 후 pGAP에 대한 eGFP 발현 수준 뿐만 아니라 야생형에서 pG1 또는 pG1-3과 비교한 유도 조건 하에 dFLO8 균주의 eGFP 형광의 증가가 제시된다.

FLO8의 결실은 pG1-구동된 발현에 긍정적인 영향을 미쳐, 유도(글루코스-제한) 조건에서 거의 4-배 더 높은 eGFP 수준으로 이어졌다(표 2). 따라서, FLO8을 파괴하는 효과를 또한 그 자체가 더 높은 고유한 발현을 갖는 프로모터 변이체 pG1-3에 대해 연구하였다. 또한 프로모터 변이체에 대해서도 긍정적인 영향을 나타냈으며, 다시 말해서 야생형 배경에서 동일한 프로모터로부터의 발현과 비교하여 dFLO8 균주에서 2.5 내지 3-배 더 높은 eGFP 수준을 가능하게 하였다(표 2).

실시예 3: 분비된 재조합 단백질의 P _G1-3 구동된 생산성에 대한 FLO8 파괴의 효과

다음으로, 분비 모델 단백질의 pG1-3구동된 발현에 대한 dFLO8 돌연변이의 영향을 평가하였다. 이 목적을 위해 vHH 또는 scR에 대한 발현 카세트를 CBS2612 및 CBS2612_dFLO8로 형질전환하였다.

a) 피. 파스토리스 d FLO8 균주의 구축 및 선택 마커 재활용

피. 파스토리스 야생형 균주 CBS2612(CBS-KNAW Fungal Biodiversity Centre, Centraalbureau voor Schimmelcultures, 네덜란드 위트레흐트 소재)를 숙주 균주로 사용하였다.

CBS2612_KanR_dFLO8 #2를 실시예 1에 기재된 바와 같이 구축하였다. Cre-loxP 재조합에 기초한 게놈으로부터 KanMX 선택 마커 카세트를 잘라내기 위해, CBS2612_KanR_dFLO8 #2를 Gasser et al., 2013에 기재된 바와 같은 전기천공법에 의해 플라스미드 pTAC_Cre_hphMX4로 일시적으로 형질전환하였다. pTAC_Cre_hphMX4는 플라스미드 pYX022(R&D Systems)의 유도체이며 이. 콜라이에 대한 복제 기점, Cre-리콤비나제 유전자에 대한 발현 카세트, 하이그로마이신 내성 카세트 뿐만 아니라 ARS/CEN 요소로 구성된다. 이의 구축을 위해 pTAC_Cre_kanMX(Marx et al., 2008)를 EcoR91I로 분해하여 카나마이신 내성 카세트를 제거하였다. 플라스미드 pGA26_hphMX4를 동일한 효소로 분해하여 하이그로마이신 내성 카세트를 잘라내고 적절한 단편을 결찰에 의해 융합시켰다.

양성 형질전환체의 선택을 100 μg mL^-1 하이그로마이신을 함유하는 YPD-한천에서 수행하였다. 이후에 하이그로마이신 내성 클론을 YPD-한천(pKTAC-CRE_hygR의 손실을 촉진하기 위해 하이그로마이신 없음) 뿐만 아니라 500 μg mL^-1 제네티신을 함유하는 YPD-한천에서 동시에 다시 스트리킹하였다. 제네티신에 대한 내성을 상실한 균주를 프라이머 Det_bw 및 Det_fw(표 1)를 이용하는 PCR 및 겔 전기영동에 의해 추가로 확인하여 게놈으로부터 KanMX 내성 카세트의 절제를 확인하였다. 상응하는 균주로부터, 추가 사용을 위해 CBS2612_L_dFLO8 #2_4를 선택하였다.

b) P _G1-3 의 전사 제어 하에 항체 단편 scFv(scR) 및 vHH를 분비하는 피. 파스토리스 균주의 구축

발현 플라스미드 pPM2d_pAOX_scR 및 pPM2d_pAOX_vHH는 pPUZZLE 플라스미드 백본의 유도체이다(Stadlmayr et al. 2010). 이들은 이. 콜라이의 복제 기원(pUC19), 제오신 내성 카세트, 에스. 세레비지애 알파-결합 인자 전-전구 리더, 관심 유전자(vHH 또는 scR) 및 에스. 세레비지애 CYC1 전사 종결인자, 뿐만 아니라 피. 파스토리스 게놈으로의 통합을 위한 유전자좌(3´AOX1 영역)로 구성된다. 이의 구축을 위해 scFv(scR) 및 vHH를 암호화하는 유전자를 DNA2.0에 의해 코돈-최적화하고 합성 DNA(하기 나타낸 서열)로 수득하였다. 검출을 위해 His6-태그를 유전자에 C-말단으로 융합시켰다. XhoI 및 BamHI(scR의 경우) 또는 EcoRV(vHH의 경우)로의 제한 분해 후, 각 유전자를 XhoI 및 BamHI 또는 EcoRV로 분해된 pPM2d_pAOX에 결찰시켰다. 이들 플라스미드 뿐만 아니라 발현 플라스미드 pPM1aZ10_pG1-3_eGFP(또한 WO2017021541A1에 기재된 pPUZZLE 유도체)를 AlwNI 및 SbfI로 제한 분해하고 적절한 플라스미드 단편을 융합시켜 P_AOX1의 P_G1-3으로의 대체를 수행하였다. pPM1aZ10_pG1-3_eGFP로부터 유도된 단편은 또한 이 유전자좌에 대한 표적화된 통합을 가능하게 하는 AOX-종결인자에 대한 서열을 함유하였다.

생성된 발현 플라스미드 pPM1aZ30_pG1-3_scR 및 pPM1aZ30_pG1-3_vHH를 AscI로 선형화하고 Gasser et al., 2013에 기재된 바와 같은 표준 프로토콜을 사용하여 전기천공법에 의해 CBS2612(약칭 wt), CBS2612_KanR_dFLO8 #2(약칭 dFLO8) 또는 CBS2612_L_dFLO8 #2_4(약칭 dFLO8L)로 형질전환하였다.

50 μg mL^-1의 제오신 및 500 μg mL^-1 제네티신(적절한 경우)을 함유하는 선택적 YPD-한천에서 양성 형질전환체의 선택을 수행하였다.

c) 항체 단편 생산성의 스크리닝

발현 스크리닝을 위해, 각각의 형질전환체의 단일 콜로니를 25 μg mL^-1 제오신 및 500 μg mL^-1 제네티신(적절한 경우)을 함유하는 2 mL 액체 YP 배지(리터 당: 20 g 펩톤, 10 g 효모 추출물)에 접종하고 280 rpm으로 24-DWP에서 25℃에서 약 24 시간 동안 성장시켰다. 이들 배양물을 사용하여 50 g L^-1 폴리사카라이드 및 1.5 %의 글루코스-방출 효소(약 0.8 mg h^{- 1} mL^-1의 글루코스 방출 속도를 가능하게 함; m2p 배지 발색 키트)를 함유하는 2 mL의 합성 스크리닝 배지 ASMv6(조성의 경우 실시예 2 참조)에 8의 시작-OD₆₀₀으로 접종하였다. 배양 조건은 사전 배양 조건과 유사하였다. 48 시간 후, 1 mL의 세포 현탁액을 미리 칭량된 1.5 mL 원심분리 튜브로 옮기고 실온에서 5 분 동안 16100 g로 원심분리하였다. 상청액을 조심스럽게 새로운 바이알로 옮기고 추가 사용까지 -20℃에서 저장하였다. 펠릿을 함유하는 원심분리 튜브를 다시 칭량하여 습윤 세포 중량(WCW)을 결정하였다. 상청액 중 재조합 분비된 단백질의 정량화를 하기 기재된 바와 같은 미세유체 모세관 전기영동에 의해 수행하였다.

d) 미세유체 모세관 전기영동(mCE)에 의한 정량화

'LabChip GX/GXII System'(PerkinElmer)을 배양 상청액 내 분비된 단백질 역가의 정량적 분석을 위해 사용하였다. 소모품 'Protein Express Lab Chip'(760499, PerkinElmer) 및 'Protein Express Reagent Kit'(CLS960008, PerkinElmer)를 사용하였다. 칩 및 샘플 제조는 제조업체의 권장사항에 따라 수행하였다. 절차의 간단한 설명이 하기 주어진다.

칩 제조: 시약이 실온으로 된 후 520 및 280 μL의 Protein Express Gel Matrix를 스핀 필터로 옮겼다. 20 μL의 Protein Express Dye 용액을 스핀 필터를 함유하는 520 μL Gel Matrix에 첨가하였다. 스핀 필터를 함유하는 염료를 잠시 반대 방향으로 볼텍싱한 후, 두 스핀 필터를 9300 g로 10 분 동안 원심분리하였다. 칩을 세척하기 위해, 120 μL Milli-Q® 물을 모든 활성 칩 웰에 첨가하고 칩을 기기 세척 프로그램에 적용하였다. Milli-Q® 물을 사용하여 2 번의 추가 헹굼 단계 후, 남아있는 유체를 완전히 흡인하고 적절한 양의 여과된 Gel Matrix 용액 뿐만 아니라 Protein Express Lower Marker 용액을 적절한 칩 웰에 첨가하였다.

샘플 및 래더 제조: 샘플 제조를 위해 6 μL 샘플을 96-마이크로타이터 플레이트에서 21 μL의 샘플 완충액과 혼합하였다. 샘플을 100℃에서 5 분 동안 변성시키고 1200 g로 2 분 동안 원심분리하였다. 이후에, 105 μL의 Milli-Q® 물을 첨가하였다. 샘플 용액을 피펫팅에 의해 잠시 혼합하고 측정 전에 1200 g로 2 분 동안 다시 원심분리하였다. 래더를 제조하기 위해 12 μL의 Protein Express Ladder를 PCR 튜브에서 100℃에서 5 분 동안 변성시켰다. 이후에, 120 μL의 Milli-Q® 물을 첨가하고 미니원심분리기에서 15 초 동안 튜브를 회전시키기 전에 래더 용액을 잠시 볼텍싱하였다.

정량화는 제조업체에서 제공한 LabChip 소프트웨어를 이용하고 BSA 표준과 비교하여 수행하였다.

표 3은 평균 scR-역가가 야생형과 비교하여 dFLO8 균주의 상청액에서 1.8-배 더 높지만, 바이오매스 농도는 상이하지 않아서 dFLO8 균주의 상청액에서 scR 수율이 1.86-배 더 높음을 나타낸다. 또한 vHH-발현 균주의 경우에 dFLO8 돌연변이 시 평균 역가 및 vHH 수율(1.7-배)의 유사한 증가를 관찰하였다(표 4).

표 3: pPM1aZ30_pG1-3_scR로 형질전환된 CBS2612 및 CB2612_L_dFLO8 #2_4의 24-DWP 스크리닝의 평균 WCW, 생산 역가 및 수율. 작제물 당 20 개의 클론을 스크리닝하였다.

표 4: pPM1aZ30_pG1-3_vHH로 형질전환된 CBS2612 및 CB2612_KanR_dFLO8 #2의 24-DWP 스크리닝의 평균 WCW, 생산 역가 및 수율. 작제물 당 20 개의 클론을 스크리닝하였다.

다음으로, FLO8을 실시예 1에 기재된 바와 같은 분열 마커 카세트 접근법을 사용함으로써 상기 스크리닝으로부터 선택된 4 개의 상이한 vHH-발현 클론(CBS2612_pG1-3_vHH #4, #5, #13 및 #15)에서 파괴하였다. 이후에, dFLO8 돌연변이체 클론 뿐만 아니라 상응하는 FLO8 모체 클론을 24-DWP-스크리닝 법에 적용하여 이들의 생산성에 대해 스크리닝하였다. 표 5는 vHH 역가 및 생산 수율이 dFLO8 클론에서 2- 내지 3-배 더 높았음을 나타낸다. 증가된 생산 수준이 더 높은 전사 발현에 기초하였음을 검증하기 위해, vHH 전사체 수준을 상이한 시점에서 qPCR에 의해 정량화하였다. 평균 2-배 더 높은 vHH 발현 수준이 dFLO8 클론에서 관찰되었으며, 이는 개선된 vHH 역가가 실제로 pG1-3의 더 높은 전사 활성에 기초함을 나타낸다(실시예 4 참조).

표 5: 4 개의 상이한 vHH-발현 균주 뿐만 아니라 이의 상응하는 dFLO8 균주의 평균 WCW 및 역가. 각 모체 균주의 4 개의 복제물 뿐만 아니라 6 개의 상응하는 dFLO8 균주를 스크리닝하였다. (FC: 배수 변화).

실시예 4: pG1-3 제어된 vHH-전사에 대한 FLO8 파괴의 효과

FLO8의 파괴가 pG1-3의 제어 하에 유전자의 증가된 전사 활성을 야기하는지를 테스트하기 위해, CBS2612_pG1-3_vHH #4 및 #13의 6 개의 기술적 복제물 뿐만 아니라 상응하는 dFLO8 돌연변이체 균주 CBS2612_pG1-3_vHH #4_dFLO8_1 및 #13_dFLO8_2(표 5; 실시예 3)를 실시예 3에 기재된 바와 같은 24-DWP 형식으로 배양하였다. 2, 19 및 26 시간 후, 2 개의 복제물로부터 1 mL의 배양물을 수확하고 16100 g 및 4℃에서 1 분 동안 원심분리하여 상청액을 버렸다. 이후에, 세포 펠릿을 1 mL TRI 시약(Sigma-Aldrich)에 재현탁하고 추가 처리까지 -80℃에서 저장하였다.

RNA 단리를 실시예 6에 기재된 바와 같이 수행하였다. 잔류 DNA를 제거하기 위해, RNA 샘플을 제조업체의 매뉴얼에 따라 DNA-free™-키트(Ambion)로 처리하였다. 이후에, RNA 품질, 순도 및 농도를 겔 전기영동 뿐만 아니라 NanoDrop 2000(Thermo Scientific)을 사용한 분광 광도 분석에 의해 분석하였다.

cDNA의 합성을 제조업체의 매뉴얼에 따라 Biozym cDNA Synthesis Kit로 수행하였다. 간단히 말해서, 500 ng의 총 RNA를 역 전사효소, dNTP, RNase 억제제 및 합성 완충액을 함유하는 마스터 믹스에 첨가하였다. 프라이밍을 위해 올리고 d(T)₂₃VN(NEB)을 사용하였다. 반응 믹스의 배양을 55℃에서 60 분 동안 수행하였다. 이후에, 반응 믹스를 99℃에서 5 분 동안 배양하여 효소의 불활성화를 달성하였다.

정량적 실시간 PCR(qPCR)을 위해 vHH-특이적 프라이머를 사용하였다(표 6). ACT1 발현 수준을 비교하여 정규화를 수행하였다(표 6). 분석을 위해 1 μL의 cDNA, 물 및 프라이머를 SensiMix SYBR 2x Master Mix(Bioline)로 혼합하고 실시간 PCR 사이클러(Rotor-Gene, Qiagen)에서 분석하였다.

표 6: vHH-전사체 분석을 위한 정량적 실시간 PCR 프라이머

모든 샘플을 기술적으로 삼중으로 측정하였다. 데이터 분석은 비교 정량(QC) 방법을 이용하여 Rotor-Gene 소프트웨어로 수행하였다.

표 7은 dFLO8 균주에서 평균 vHH-전사체 수준이 모든 분석된 배양 시점에 걸쳐 증가하였음을 나타낸다.

표 7: 상이한 스크리닝-배양 시점에서 평균 상대적 vHH-전사체 수준

실시예 5: 실험실 규모 생물반응기 유가 배양에서 pG1-3-구동된 분비된 항체 단편 생산성에 대한 FLO8 파괴의 영향

유가 배양을 수행하기 전에, 제네티신 내성 마커 카세트를 실시예 3에 기재된 바와 같은 Cre-매개 재조합에 의해 균주 CBS2612_ pG1-3_vHH #4_dFLO8_4(약칭 dFLO8_pG1-3_vHH #4_4)(표 5, 실시예 3)의 게놈으로부터 잘라내었다. 생성된 균주 CBS2612_pG1-3_vHH #4_ dFLO8_4 #L1(약칭 L_dFLO8 _pG1-3_vHH #4_4_1)의 3 개의 복제물의 생산성을 실시예 3에 기재된 바와 같은 24-DPW 스크리닝 형식에서 모체 균주의 3 개의 복제물의 생산 수준과 비교하였다(표 8). CBS2612_pG1-3_vHH #4_dFLO8_4 #L1의 평균 생산성은 모체 균주와 유사하게 유지되었다(p-값 0.096).

표 8: 24-DWP 스크리닝에서 CBS2612_dFLO8_pG1-3_vHH #4_4 및 CBS2612_L_dFLO8_pG1-3_vHH #4_4_1의 WCW 및 역가.

유가 배양을 1 L 벤치탑 생물반응기(SR0700ODLS; Dasgip, 독일 소재)에서 균주 CBS2612_ pG1-3_vHH #4 및 상응하는 loxed dFLO8 돌연변이체 CBS2612_L_dFLO8_pG1-3_vHH #4_4_1로 수행하였다. 사전 배양을 위해 1 L 진탕 플라스크에서 50 μg mL 제오신을 함유하는 100 mL YPG 배지를 1.0 mL 저온저장물로 접종하고 180 rpm 및 25℃에서 약 24 시간 동안 배양하였다. 회분 배양을 0.25 L의 작업 부피에서 작동시키고 1.5의 시작 OD₆₀₀으로 접종하였다. 글리세롤 회분 배지 조성은 하기에 주어진다. 전체 공정 동안 온도를 30℃로 제어하고, DO를 교반기 속도(400 내지 1200 rpm) 및 공기 흐름(9.5 내지 30 sL h^-1)의 자동 조정에 의해 30%로 유지하고 pH를 12.5 % NH₄OH의 자동 첨가에 의해 5.0으로 조절하였다. 회분-종료를 나타내는 DO에서 갑작스런 스파이크 후, 빠른 초기 성장 속도를 초래하는 선형 증분 글루코스 공급(배지 조성은 하기에 상세히 설명됨) 이어서 P_G1-3-기반 q_P 에서 μ 동역학에 대해 특이적으로 최적화된 점진적으로 감소하는 μ의 확장 단계를 적용하였다(Prielhofer et al., 2018).

리터 당 함유된 글리세롤 회분 배지:

2 g 시트르산 일수화물(C₆H₈O₇*H₂O), 45 g 글리세롤, 12.6 g (NH₄)₂HPO₄, 0.5 g MgSO⁴*7H₂O, 0.9 g KCl, 0.022 g CaCl₂*2H₂O, 6.6 mL 비오틴 스톡 용액(0.2 g L^-1) 및 4.6 mL PTM0 미량 염 스톡 용액(실시예 2에 기재됨). HCl(conc.)을 첨가하여 pH 5로 설정하였다.

리터 당 함유된 글루코스 공급 배지:

495 g 글루코스 일수화물, 5.2 g MgSO₄*7H₂O, 8.4 g KCl, 0.28 g CaCl₂*2H₂O, 11.8 mL 비오틴 스톡 용액(0.2 g L^-1) 및 10.1 mL PTM0 미량 염 스톡 용액(실시예 2에 기재됨).

YDM 및 분비된 재조합 단백질을 공정 전반에 걸쳐 다양한 시점에서 분석하였다(표 9). YDM 분석을 위해 1 mL의 배양 브로쓰를 2 mL의 미리 건조되고(105℃에서 적어도 24 시간 동안) 미리 칭량된 원심분리 튜브로 옮겼다. 16100 g로 5 분 동안 원심분리 후 상청액을 조심스럽게 새 바이알로 옮기고 추가 사용까지 -20℃에서 저장하였다. 세포 펠릿을 이온수로 2 회 세척하고 다시 중량을 측정하기 전에 105 ℃에서 적어도 24 시간 동안 건조시켰다.

상청액을 실시예 3에 기재된 바와 같이 미세유체 모세관 전기영동(GXII, Perkin-Elmer)에 의해 분석하였다.

표 9: CBS2612 _pG1-3_vHH #4 및 L_CBS2612_dFLO8_pG1-3_vHH #4_4_1의 생물반응기 유가 배양 동안 YDM 및 vHH-역가

표 9로부터 공정 전반에 걸쳐 dFLO8 균주에 대한 생산 역가가 wt-배경 균주에 대한 것보다 지속적으로 더 높았음을 알 수 있다. 공정 종료 시 생산성에서 5.7-배 증가를 관찰하였다. 또한 유가 배양에서, 전체 시간 과정에 걸쳐 dFLO8 균주에서 vHH 전사 수준 증가를 관찰하였다.

실시예 6: 비-메탄올 탄소 조절된 프로모터의 발현 강도 및 조절 거동에 대한 FLO8 파괴의 효과

다음 단계에서, 유도 조건에서 다른 탄소 조절된 프로모터(WO2013050551A1 및 Prielhofer et al. 2013에 기재됨)의 전사 강도에 대한 FLO8 파괴의 영향을 연구하였다. 글루코스-제한 조건 하에 전사체 분석을 위해, CBS7435 야생형 및 CBS7436_KanR_dFLO8 #2를 사용하였다. 24-딥-웰-플레이트(24-DWP)에서 사전 및 주 배양물을 배양하였다. 첫번째 사전 배양을 위해 500 μg mL^-1 제네티신(적절한 경우)을 함유하는 2 mL YPD(리터 당: 10 g 효모 추출물, 20 g 펩톤, 20 g 글루코스)를 각각 CBS7435 및 CBS7435_KanR_dFLO8 #2의 단일 콜로니에 접종하고, 25℃ 및 280 rpm에서 약 24 시간 동안 성장시켰다. 두번째 사전 배양을 위해 4의 시작 OD₆₀₀으로 접종된 2 mL M2(D) 배지(조성은 하기 기재됨)를 사용하였다. 디스크 당 1.63 t^0.74 mg(t = 시간 [h])의 비선형 속도로 글루코스를 유리하는 글루코스-방출 중합체 비드(12 mm 공급 비드, Kuhner, 스위스 소재)를 첨가하고 배양물을 25℃ 및 280 rpm에서 약 24 시간 동안 배양하였다. 주 배양을 위해 2 mL의 M2 배지(글루코스 없는 M2(D))를 사용하였다. 배양물을 280 rpm 및 25℃에서 진탕하였다. 글루코스의 느린 방출은 글루코스 제한 성장을 보장하였다. 샘플을 주 배양 3 시간 후에 취하고(추정된 특이적 성장 속도: 0.1 h^-1), 사전 냉각된 고정 용액(에탄올 [절대] 중 5% [vol/vol] 페놀)과 2:1 비율로 즉시 혼합하고, 밀봉된 튜브로 분취하고 16100 g로 1 분 동안 원심분리하였다. 펠릿을 추가 사용까지 -80℃에서 저장하였다.

리터 당 함유된 M2(D): 22.0 g 글루코스 일수화물, 22.0 g 시트르산 일수화물, 3.15 g (NH₄)₂HPO₄, 0.49 g MgSO₄*7H₂O, 0.80 g KCl, 0.0268 g CaCl₂*2H₂O, 1.47 mL의 PTM0 미량 염 스톡 용액(실시예 1에 기재됨) 및 0.4 mg 비오틴; pH를 KOH(고체)를 사용하여 5로 설정하였다.

RNA 단리를 위해 1 mL의 TRI 시약(Sigma-Aldrich) 및 500 μL 산 세척된 유리 비드를 첨가하고 세포를 FastPrep-24(mpbio)에서 5.5 m/s의 속도로 40 초 동안 파괴하였다. 그후에, 200 μL의 클로로포름을 첨가하였다. 이후에, 샘플을 격렬하게 진탕시킨 다음 실온에서 5 - 10 분 동안 방치시켰다. 상 분리를 촉진하기 위해 16100 g 및 4℃에서 10 분 동안 원심분리한 후, RNA를 함유하는 상단의 무색 수성 상을 새로운 튜브로 옮기고 500 μL의 이소프로판올을 첨가하여 RNA를 침전시켰다. 10 분 배양 후 샘플을 16100 g 및 4℃에서 10 분 동안 원심분리하고 상청액을 버렸다. RNA 펠릿을 70% 에탄올로 1 회 세척하고, 공기 건조하고 RNAse가 없는 물에 재현탁하였다.

전사체 분석을 위해, 자체 설계된 피. 파스토리스-특이적 올리고뉴클레오티드 어레이(AMAD-ID 034821, 8 Х 15K 맞춤형 어레이; Agilent, 미국 소재)를 사용하였다(Graf et al.; BMC Genomics. 2008;9:390.). cRNA의 합성, 혼성화, 뿐만 아니라 스캐닝을 2-색 발현 어레이에 대한 Agilent 프로토콜에 따라 수행하였다. 샘플을 Cy3 및 Cy5로 삼중으로 표지하고 다양한 배양 조건 하에 성장된 세포로부터 생성된 참조 풀에 대해 혼성화하였다. 모든 샘플에 대해, 염료 교환 실험을 수행하였다.

마이크로어레이 데이터의 정규화 단계 및 통계적 분석은 국지적 가중 MA-산점도 평활(LOESS)을 사용한 색상 편향 제거, 이어서 그 사이에 "Aquantile" 방법을 사용한 어레이 정규화를 포함하였다. 차등으로 발현된 유전자를 식별하고 p-값을 계산하기 위해 eBayes 보정으로 맞춘 선형 모델을 사용하였다. P-값은 Benjamini & Yekutieli, 2001에 의한 오발견 방법(FDR)을 사용하여 다중 테스트를 위해 조정되었다. 조정된 p-값이 0.05 미만인 유전자는 통계적으로 유의한 차등 발현을 갖는 것으로 간주된다. 차등으로 발현된 유전자를 식별하기 위해, 추가로 최소 0.58 > log2 FC < -0.58의 배수 변화 컷오프를 적용하였다.

모든 단계를 R 소프트웨어(Robinson MD, McCarthy DJ, Smyth GK. edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. 2010. Bioinformatics. 26:139-40.) 및 limma 패키지를 사용하여 수행하였다. 탄소-조절된 유전자(탄소 공급원 조절된 프로모터의 제어 하의 유전자)의 선택을 위한 배수 변화는 표 10에 제시되어 있다. 천연 FLO8 유전자의 발현은 야생형과 비교하여 dFLO8 돌연변이체에서 명확하고 유의하게 감소된다. 모든 탄소 공급원 조절된 유전자에 대해, dFLO8 돌연변이체에서 증가된 전사체 수준을 볼 수 있으며, 이는 유도 조건에서 3.7 내지 11.4-배 더 높은 전사 강도에 도달한다. 모든 이들 유전자는 dFLO8 돌연변이체 균주에서 통계적으로 유의한 더 높은 전사(조정된 p-값 <0.05)를 갖는다. 이는 Prielhofer et al. 2013 및 Prielhofer et al. 2018에 기재된 바와 같은 모든 비-메탄올 탄소 조절된 프로모터의 생산 잠재력이 FLO8의 파괴에 의해 향상됨을 강하게 나타낸다. 대조적으로, GAP 프로모터의 발현 강도는 FLO8의 파괴에 의해 영향을 받지 않는다.

표 10: 글루코스-제한 유도 조건에서 FLO8 유전자 및 탄소-조절된 프로모터 하에 제어된 유전자의 전사 강도에 대한 dFLO8 돌연변이체의 효과. 야생형 균주와 비교하여 dFLO8 돌연변이체 균주 사이의 배수 변화(FC)가 제시된다. 조정된 p-값이 0.05 미만인 발현 변화는 통계적으로 유의한 차이를 나타낸다.

실시예 7: 메탄올 조절된 프로모터 pAOX1의 전사 강도에 대한 FLO8 파괴의 효과

또한 전사 강도에 대한 FLO8 파괴의 영향을 메탄올-유도 조건 하에 pAOX1 및 pGAP와 같은 피. 파스토리스 표준 프로모터에 대해 결정하였다. 따라서 pAOX1의 제어 하에 재조합 Fab 단편을 발현하는 균주 CBS7435 및 각각의 dFLO8 돌연변이체 균주 dFLO8#2를 메탄올-기반 유가 배양으로 배양하였다.

유가 배양을 1.0 L의 최대 작업 부피로 1.4 L DASGIP 반응기(Eppendorf, 독일 소재)에서 수행하였다. 배양 온도를 25℃로 제어하고, pH를 25% 수산화암모늄을 첨가하여 5.0으로 제어하고 용존 산조 농도를 교반 속도 400 내지 1200 rpm, 및 공기 흐름 24 내지 72 sL/h로 제어함으로써 20% 초과의 포화 상태로 유지하였다.

유가 배양을 위한 접종물을 20 g/L 글리세롤 및 50 μg/mL 제오신을 함유하는 100 mL의 YP 배지를 함유하는 진탕 플라스크에서 배양하고, 28℃ 및 180 rpm에서 대략 24 시간 동안 배양하였다. 배양물을 사용하여 생물반응기에서 0.4 L의 시작 부피를 1.0의 시작 광학 밀도(600 nm)로 접종하였다. 회분 배양을 대략 24 시간 후에 완료하였고 첫번째 (10 mL) 염 샷(salt shot)을 제공하였다.

그런 다음 글리세롤 유가 용액을 5 시간 동안 5 mL/h의 일정한 속도로 공급하였다. 이어서, 메탄올 펄스(2 g) 및 염 샷(10 mL)을 배양물에 제공하였다. 메탄올 펄스 소비가 배양물에서 용존 산소 농도의 증가에 의해 나타난 후, 1.0 g/h의 공급 속도로 메탄올 유가 용액의 일정한 공급을 시작하였다. ~43 g 메탄올 공급 배지에 상응하는 새로 형성된 바이오매스 10 g 마다 염 샷 10 mL가 제공된다. 바이오매스 농도가 증가함에 따라, 단시간 동안 메탄올 공급을 차단할 때 배양물에서 용존 산소의 갑작스런 증가로 인해 메탄올 축적이 배제될 수 있을 때 메탄올 공급 속도가 적절하게 증가하였다. 최종 메탄올 공급 속도는 2.5 g/h였다.

샘플을 빈번하게 취하였다. 배양물은 세포 밀도가 100 g/L 세포 건조 중량 초과에 도달했을 때 대략 100 시간 후에 수확하였다.

배지는 다음과 같았다:

함유된 회분 배지(리터 당): 2.0 g 시트르산, 12.4 g (NH₄)₂HPO₄, 0.022 g CaCl₂·2H₂O, 0.9 g KCl, 0.5 g MgSO₄·7H₂O, 40 g 글리세롤, 4.6 mL PTM1 미량 염 스톡 용액. pH는 25% HCl을 사용하여 5.0으로 설정하였다.

함유된 글리세롤 유가 용액(리터 당): 623 g 글리세롤, 12 mL PTM0 미량 염 스톡 용액 및 40 mg 비오틴. PTM0 조성은 실시예 2에 제시되어 있다.

함유된 순수 메탄올의 메탄올 유가 용액(리터 당): 12 mL PTM0 미량 염 스톡 용액 및 40 mg 비오틴.

함유된 염 샷 용액(리터 당): 20.8 g MgSO₄·7H₂O, 41.6 KCl, 1.04 g CaCl₂·2H₂O.

ELISA에 의한 온전한 Fab의 정량화를 항-인간 IgG 항체(ab7497, Abcam)를 코팅 항체로 사용하고 염소 항-인간 IgG(Fab 특이적) - 알칼리성 포스파타제 접합된 항체(Sigma A8542)를 검출 항체로 사용하여 수행하였다. 인간 Fab/카파, IgG 단편(Bethyl P80-115)을 시작 농도가 100 ng/mL인 표준으로 사용하였고, 상청액 샘플을 이에 따라 희석하였다. 검출은 pNPP(Sigma S0942)로 수행하였다. 코팅-, 희석- 및 세척 완충액은 PBS(2 mM KH₂PO₄, 10 mM Na₂HPO₄.2 H₂O, 2.7 mM g KCl, 8 mM NaCl, pH 7.4)를 기반으로 하고 이에 따라 BSA(1%(w/v)) 및/또는 ween20(0.1%(v/v))으로 완료하였다.

생산 역가와 관련하여, dFLO8 돌연변이체에서 pAOX1의 제어 하에 Fab 생산 증가는 메탄올 유가 배양의 종료 시 최대 1.45-배였지만(119 시간 후, WO2015/158800A1에 기재된 바와 같음), 바이오매스 형성은 약간 감소하였다(10-14%).

마이크로어레이 샘플을 53.5 시간(25 시간 메탄올 공급) 후에 취하고 실시예 6에 기재된 바와 같은 처리하였다. 야생형 균주와 비교하여 dFLO8 돌연변이체 균주 사이의 유전자 선택을 위한 배수 변화는 표 11에 제시되어 있다. 다시 말해서, FLO8 전사체 수준은 야생형과 비교하여 dFLO8 돌연변이체에서 유의하게 낮다. 표 10에 제시된 비-메탄올 탄소 조절된 유전자 및 프로모터와 달리, 메탄올-유도성 pAOX1은 완전히 유도된 조건에서(조정된 p-값이 0.05보다 클 때) 야생형과 비교하여 dFLO8 돌연변이체에서 유의하게 증가된 전사 강도를 나타내지 않는다. 또한 메탄올-성장된 세포에서 pGAP에 대한 유의한 효과도 없다. 따라서, 피. 파스토리스에서 이들 표준 프로모터의 전사는 FLO8의 과소발현에 의해 영향받지 않는다.

표 11: 메탄올 유도 유가 조건에서 FLO8 유전자 및 메탄올-유도성 AOX1 프로모터 하에 제어된 유전자의 전사 강도에 대한 dFLO8 돌연변이체의 효과. 야생형 균주와 비교하여 dFLO8 돌연변이체 균주 사이의 배수 변화(FC)가 제시되어 있다. 조정된 p-값이 0.05 미만인 발현 변화는 통계적으로 유의한 차이를 나타낸다.

실시예 8: 비-메탄올 탄소 조절된 프로모터에 의해 구동된 세포내 eGFP 발현에 대한 FLO8 파괴의 효과

대부분의 비-메탄올 탄소 조절된 프로모터에 의해 구동된 천연 유전자 발현(WO2013050551A1; Prielhofer et al. 2013)은 dFLO8 균주에서 유도 조건 하에 유의하게 상향조절되었으므로(실시예 6 참조) FLO8의 파괴를 또한 WO2013050551A1 및 Prielhofer et al(2013)에 기재된 각각의 eGFP-리포터 균주에서 테스트하였다. 각각의 비-메탄올 유도성 프로모터에 대해 pPM1aZ10_pG#_eGFP 발현 벡터를 보유하는 하나의 균주(CBS2612_pG3_eGFP #1; CBS2612_pG4_eGFP #6; CBS2612_pG6_eGFP #53; X33_pG7_eGFP #1; CBS2612_pG8_eGFP #8)를 선택하고 실시예 1에 기재된 분열 마커 카세트 방법을 이용하여 FLO8을 파괴하였다. 유도(글루코스-제한) 조건 하에 스크리닝-배양은 폴리사카라이드 및 글루코스-방출 효소를 상이한 공급처(EnPump 200, Enpresso)로부터 수득한 것을 제외하고는 실시예 2에 기재된 바와 같이 수행하였다. 새로운 글루코스-방출 효소의 특성은 상이하므로, 농도는 약 0.6 mg mL^-1 h^-1의 일정한 글루코스-방출 속도에 상응하는 0.4%로 조정하였다. 각 경우에 각각의 모체의 2 개의 복제물 뿐만 아니라 적어도 7 개의 상응하는 dFLO8 균주를 스크리닝하였다. eGFP-생산성은 값을 세포 크기에 대해 정규화하지 않은 것을 제외하고는 실시예 2에 기재된 바와 같이 결정하였다. 표 12는 FLO8의 파괴가 각 프로모터에 대한 eGFP 형광 증가로 이어져 각각 pG3 및 pG8의 경우1.7- 내지 1.2-배, 뿐만 아니라 pG4 및 pG7의 경우 2.3-배 및 pG6의 경우 2.2-배에 도달함을 나타낸다. 이는 추가로 pG1 및 pG1 유도체 이외에 다른 비-메탄올 탄소 조절된 프로모터의 향상을 위한 FLO8 파괴의 잠재력을 강조한다.

이들 결과는 야생형 숙주 세포에서 이러한 발현과 비교하여 dFLO8 숙주 세포에서 pG1 또는 pG1 유도체(pG1-3)의 제어 하에 증가된 eGFP 발현을 입증한다. 표 2는 FLO8의 파괴가 eGFP 형광의 증가로 이어져 각각 pG1 및 pG1-3의 경우 3.8(또는 3.9) 및 2.8(또는 2.9)-배임을 나타낸다.

표 12: 비-메탄올 탄소 조절된 프로모터의 제어 하에 eGFP의 발현에 대한 d FLO8 의 영향. 제한-글루코스(유도) 조건에서 48 시간 배양 후 모체 야생형 균주와 비교하여 각각의 dFLO8_pG#_eGFP 균주의 배수 변화 뿐만 아니라 pGAP 발현의 백분율로서 eGFP 발현 수준이 제시되어 있다.

참고문헌:

SEQUENCE LISTING <110> Lonza Ltd <120> CARBON-SOURCE REGULATED PROTEIN PRODUCTION IN A RECOMBINANT HOST CELL <130> IPA210802-AT <160> 86 <170> PatentIn version 3.5 <210> 1 <211> 806 <212> PRT <213> Komagataella phaffii <400> 1 Met Asn Lys Pro Asn Gly Ser Glu Gln Gln Pro Pro Ser Arg Gly Met 1 5 10 15 Lys Gln Glu Ser Gly Gly Pro Val Thr Ser Ser Thr Thr Pro Gly Thr 20 25 30 Asn Thr Gly Leu Glu Asn Ser His Ser Met Gly Ala Asp Met Glu Pro 35 40 45 Asp Val Gly Ala Thr Ser Pro Arg His Leu Leu Asn Gly Tyr Ile Tyr 50 55 60 Asp Tyr Leu Val Lys Ser Asn Met Gln Asn Leu Ala Asp Gln Phe Ala 65 70 75 80 Gln Glu Thr Glu Leu Leu Glu Thr Asp Leu Thr Val Pro Met Asp Thr 85 90 95 Pro Ser Gly Tyr Leu Leu Glu Trp Trp Met Val Phe Trp Asp Leu Phe 100 105 110 Asn Ala Arg Leu Lys Gln Arg Gly Ser Gln Lys Ala His Gln Tyr Ile 115 120 125 Gln Leu Asn Met Leu Arg Gln Gln Gln Gln Arg Thr Met Arg Asn Thr 130 135 140 Ala Arg Val Gln Lys Val Pro Leu Arg Pro His Thr Gln Ser Ser Pro 145 150 155 160 Ser Met Ser Gln Thr Phe Ile Pro Gln Gln Pro Gln Gln Gln Ala Gln 165 170 175 Gly Gln Gln His Ala Gln Ala Gln Ala Gln Val Gln Ala His Gln Gln 180 185 190 Ala Gln His His Ala Gln Ala Gln Val Pro Val Gln Pro Gln Gln His 195 200 205 Gln Leu Gly Gly Gln Thr Gln Gln Gln Gln Ser Ile Asn Thr Gly Ser 210 215 220 Pro Ala Gly Pro Asn Ala Ile Asn Ser Arg Val Gln His Leu Ala Gln 225 230 235 240 Gln Gln Met Asn His Leu Arg Gln Gln Ala Thr Ala Thr Thr Gln Gln 245 250 255 Pro Ile Pro Gln Gln Asn Ile Pro Ser Asn Gln Gln Gly Pro Thr Gly 260 265 270 Pro Tyr Pro Thr Ser Pro Ser Arg Arg Pro Arg Leu Leu Ser Asn Glu 275 280 285 Ser Gly Ala Ser Ala Pro Ser Val Met Thr Lys Ser Gln Leu Gln Gly 290 295 300 Val Pro Pro Ser Gln Gln Pro His Gln Gln Gln Gly Gln Gln Val Gly 305 310 315 320 Pro Pro Asn Gln His Gln Gly Gln Ser Ser Ser Phe Tyr Ser Gly Met 325 330 335 Pro Pro Gln Gly Val Val Val Pro His Gln Phe Asn Pro Gln Gln Tyr 340 345 350 Ala Asn Met Leu Ala Arg Gln Gln His Val Gln Ala Gln Gln Gln Val 355 360 365 Gln Leu Gln Gln Val Gln His Val Gln Gln Arg Gln Gln Gln Asp Gln 370 375 380 Gln Gln His Arg Leu Ser Ala Gly Ser Pro Gly His Pro Ser Phe Gly 385 390 395 400 Val Phe Gln Gln Pro Pro Pro Met Ser Asn His Asn Gln Val Met Ile 405 410 415 Asn Gln Gln Gly Glu Thr Phe Phe Asp Pro His Ser Pro Tyr Ala Gln 420 425 430 Pro Asn Gly Tyr Pro Gln Pro Gln Gln Gln Gln Gln Gln Gln Gln Gln 435 440 445 Gln Gln Gln Gln Gln Gln Pro Gln Gln Gln Gln Gln Gln Gln Gln Gln 450 455 460 Gln Lys Gln Gln Pro Pro Pro Pro Pro Arg Gln Pro Gln Arg Gln Gln 465 470 475 480 Ala Met Ala Met Ala Pro Leu Pro His Ser Thr Ser Ala Ala Gly Thr 485 490 495 Pro His Ser Ser Thr Thr Pro Arg Phe Ser Gln Pro Gly Pro Val Tyr 500 505 510 Gln Gln Pro Leu Pro Ala Ser Gln Pro Gln His Ser Pro Pro Ser Ser 515 520 525 Ile Gln Gln Pro Glu Leu Val Pro Thr Pro Gly Ser Gln His Gln Gln 530 535 540 Ile Ala Gln Pro Gln Ser Gln Ser Gln His Gln Gln Ser Gln Gln Ser 545 550 555 560 Gln Ser Ser Ala Ser Lys Ile Val Gly Ile Gln Glu Tyr Gln Lys Glu 565 570 575 Leu Met Met Leu Glu Lys Gln Asn Lys Gln Arg His Asp Met Ala Cys 580 585 590 Lys Lys Gly Ser Gly His Phe Ser Asn Phe Asp Pro Ile Pro Glu His 595 600 605 Thr Pro Pro Glu Pro Lys Phe Asn Val Asn Val Met Leu Pro Pro Gln 610 615 620 Asn Ser Ala Val Val Thr Lys Asn Thr Pro Gly Thr Ser Pro Gly Thr 625 630 635 640 Gln Thr Gln Asn Thr Ala His Ser Thr Gly Asn Thr Ser Ala Gly Ser 645 650 655 Thr Pro Asn Asn Val Ala Pro Val Arg Lys Lys Lys Glu Pro Ala Lys 660 665 670 Lys Lys Ala Lys Lys Ala Thr Glu Pro Pro Thr Pro Thr Thr Pro Gln 675 680 685 Thr Pro Ile Ala Ala Arg Thr His Gln Asn Ser Thr Gly Gly Ile Pro 690 695 700 Gly Asn Asn Ala Ala Thr Lys Arg Arg Lys Arg Glu Pro Leu Val Asp 705 710 715 720 Gln Thr Val Ser Pro Asn Leu Asn Glu Ala Ser Lys Ser Thr Lys Thr 725 730 735 Gly Lys Ile Ser Ser Gln Thr Asp Phe Thr Gly Ser Asp Asn Gly Phe 740 745 750 Leu Gln Asp Phe Gly Asp Gly Thr Gly Pro Pro Thr Gly Thr Asp Asp 755 760 765 Met Glu Phe Asp Phe Asn Ser Phe Leu Asn Asn Glu Thr Gly Glu Pro 770 775 780 Asn Ser Ser Thr Ile His Phe Asp Asn Val Phe Asn Trp Gly Glu Gly 785 790 795 800 Thr Glu Ala Gly Asp Leu 805 <210> 2 <211> 2421 <212> DNA <213> Komagataella phaffii <400> 2 atgaacaagc caaacgggtc tgaacaacaa ccaccgtcac gcggaatgaa gcaagagtca 60 ggaggcccag ttacttcatc tacgacgccg ggtaccaata ctggcctaga aaactctcat 120 tccatggggg cggatatgga gcctgatgtt ggtgctacct ctcctcgcca tcttcttaat 180 gggtacattt acgattattt agtcaaatct aacatgcaaa atttggctga tcaatttgcc 240 caagagacgg agctcttaga aacagacttg acagtaccaa tggatacgcc ttcaggctat 300 cttctagaat ggtggatggt attctgggac cttttcaatg cccgcctaaa gcaacggggt 360 tcacagaagg cccaccagta tattcagttg aacatgctac gacaacagca acagaggacc 420 atgcgaaata cagcccgtgt tcaaaaagtc ccgttgaggc cacacaccca atcatctcct 480 tcaatgtcac agacttttat tccacagcag cctcaacagc aagcacaggg acaacagcac 540 gcccaggctc aagcccaagt gcaagcacat cagcaagccc aacaccacgc gcaggcacaa 600 gtgccagtgc aaccgcaaca gcaccagcta ggaggccaaa ctcaacagca gcaatccatt 660 aacactgggt ctcctgcggg tccaaatgct atcaactcgc gtgttcaaca cttagcacaa 720 caacagatga atcaccttcg ccagcaggcg actgccacta cgcaacaacc tatcccgcaa 780 cagaatatcc catcaaacca acagggtcct acaggccctt atcctacttc cccttcaaga 840 agaccgagat tactgtctaa cgaatcgggt gcaagtgcac cctctgtaat gacaaagtca 900 cagctccaag gagtccctcc ctcacaacaa ccacaccagc agcaaggtca gcaggtaggc 960 ccccctaatc aacatcaagg tcaatcttct tccttttatt cgggcatgcc tcctcaaggg 1020 gtcgtggttc ctcatcagtt caatcctcag cagtatgcca atatgctagc aagacaacag 1080 catgtacaag ctcaacaaca ggttcagtta caacaggtcc aacatgtaca acagagacaa 1140 cagcaagacc aacaacaaca ccgcctgtcc gccggttcac cggggcaccc ttcatttggc 1200 gtttttcaac aacctcctcc gatgtcaaac cataatcagg tcatgatcaa tcagcaggga 1260 gaaacttttt ttgatccaca ttctccatat gctcaaccta acgggtaccc ccagccacag 1320 caacaacaac aacaacagca acaacaacaa caacagcagc aaccgcaaca gcagcagcag 1380 cagcagcagc aacagaagca gcaaccacca ccaccaccac gacagcctca gcgccaacaa 1440 gcgatggcca tggctcctct gcctcactct acttctgccg ccggtactcc tcactcgtcc 1500 accacaccta gattctcgca acctggtcct gtttatcagc agcctttacc tgcatctcaa 1560 ccgcaacatt ctccgccttc ttctattcag cagccggagc tagttccaac tccagggtca 1620 caacatcagc aaatagcaca accacaatca cagagccaac accagcaatc gcaacagtct 1680 caatcaagtg cttctaaaat tgtaggtata caggagtatc agaaagagct aatgatgctt 1740 gagaaacaga acaaacagcg tcatgacatg gcatgtaaga agggaagcgg gcatttttct 1800 aactttgatc caattccaga gcacacaccg cccgaaccaa aatttaatgt gaatgtaatg 1860 ctccctcccc agaactctgc agtggtcacg aagaatactc ccggaacttc acctggtaca 1920 caaactcaaa acactgcaca tagtactggt aacacttctg cggggtctac accaaataat 1980 gtcgcacctg tacgaaagaa aaaggagcca gctaaaaaga aggcaaagaa agctactgag 2040 cccccgactc ccactactcc acagactcca attgcagcta ggacacatca aaactctaca 2100 ggcggcattc ctggtaataa tgctgctact aagcgacgaa aacgggagcc gctggttgat 2160 caaactgttt cacctaacct taacgaagct tccaagtcaa caaagaccgg aaaaatttca 2220 tctcaaactg actttacagg ttctgacaat ggattcttac aggattttgg cgatggaact 2280 ggtcctccca ctggaaccga tgatatggaa tttgatttta acagttttct taataacgaa 2340 actggcgaac ctaatagttc aaccattcat tttgacaatg tattcaattg gggagaaggt 2400 accgaagccg gagatttata g 2421 <210> 3 <211> 804 <212> PRT <213> Komagataella pastoris <400> 3 Met Asn Lys Pro Asn Gly Ser Gly Gln Gln Pro Pro Ser Arg Gly Met 1 5 10 15 Lys Gln Asp Pro Gly Gly Pro Val Thr Ser Ser Thr Thr Pro Gly Thr 20 25 30 Asn Thr Gly Phe Glu Asn Ser His Ser Met Gly Ala Asp Val Glu Pro 35 40 45 Asp Val Gly Ala Ala Ser Pro Arg His Ile Leu Asn Gly Tyr Ile His 50 55 60 Asp Tyr Leu Val Lys Ser Asn Met Gln Asn Leu Ala Asp Gln Phe Ala 65 70 75 80 Gln Glu Ser Asp Leu Leu Glu Thr Asp Leu Thr Val Pro Met Asp Thr 85 90 95 Pro Thr Gly Tyr Leu Leu Glu Trp Trp Met Val Phe Trp Asp Leu Phe 100 105 110 Asn Ala Arg Leu Lys Gln Arg Gly Ser Gln Lys Ala His Gln Tyr Ile 115 120 125 Gln Leu Asn Met Leu Arg Gln Gln Gln Gln Arg Thr Met Arg Asn Thr 130 135 140 Ala Arg Val Gln Lys Val Pro Leu Arg Pro His Thr Gln Ser Ser Pro 145 150 155 160 Ser Met Ser Gln Thr Phe Ile Pro Gln Gln Pro Gln Gln Gln Ala Gln 165 170 175 Ala Gln Ala Gln Gln His Ala Gln Ala Gln Ala Gln Val Gln Ala His 180 185 190 Gln Gln Ala Gln His His Ala Gln Ala Gln Val Pro Met Gln Ser Gln 195 200 205 Pro His Gln Gln Gly Gly Gln Thr Gln Gln Gln Gln Pro Ile Asn Thr 210 215 220 Gly Ser Pro Ala Gly Pro Asn Ala Ile Asn Ser Arg Val Gln His Leu 225 230 235 240 Ala Gln Gln Gln Met Asn His Leu Arg Gln Gln Ala Thr Ala Thr Thr 245 250 255 Gln Gln Pro Ile Pro Gln Gln Asn Ile Pro Ser Asn Gln Gln Gly Pro 260 265 270 Ala Gly Pro Tyr Pro Thr Ser Pro Ser Arg Arg Pro Arg Leu Leu Ser 275 280 285 Asn Glu Ser Gly Ala Ser Ala Pro Ser Val Met Thr Lys Ser Gln Leu 290 295 300 Gln Gly Gly Pro Pro Ser Gln Gln Pro His Gln Gln Gln Ala Gln Gln 305 310 315 320 Val Gly Pro Pro Asn Gln His Gln Gly Gln Ser Ser Ser Phe Tyr Ser 325 330 335 Gly Met Pro Pro Gln Gly Val Val Val Pro His Gln Phe Asn Pro Gln 340 345 350 Gln Tyr Ala Asn Met Leu Ala Arg Gln Gln His Val Gln Ala Gln Gln 355 360 365 Gln Val Gln Leu Gln Gln Val Pro His Val Gln Gln Arg Gln Gln Gln 370 375 380 Asp Gln Gln Gln His Arg Leu Ser Ala Gly Ser Pro Gly His Pro Ser 385 390 395 400 Phe Gly Val Phe Gln Gln Pro Pro Pro Met Ser Asn His Asn Gln Val 405 410 415 Met Ile Asn Gln Gln Gly Glu Thr Phe Phe Asp Pro His Ser Pro Tyr 420 425 430 Ala Gln Pro Asn Gly Tyr Pro Gln Pro Gln Gln Gln Gln Gln Gln Gln 435 440 445 Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln 450 455 460 Lys Gln Gln Gln Pro Pro Pro Arg Gln Pro Gln Arg Gln Gln Ala Met 465 470 475 480 Ala Thr Ala Pro Leu Pro His Ser Thr Ser Ala Ser Gly Thr Pro His 485 490 495 Thr Ala Thr Thr Pro Arg Phe Ser Gln Pro Gly Pro Val Tyr Gln Gln 500 505 510 Pro Leu Pro Ala Ser Gln Pro Gln His Ser Pro Pro Thr Ser Ile Gln 515 520 525 Gln Gln Glu Pro Ile Pro Thr Pro Gly Ser Gln His Gln Gln Ile Ala 530 535 540 Gln Pro Gln Ser Gln Asn Gln His Gln Gln Pro Gln Gln Pro Gln Ala 545 550 555 560 Ser Ala Ser Lys Met Val Gly Ile Gln Glu Tyr Gln Lys Glu Leu Met 565 570 575 Met Leu Glu Lys Gln Asn Lys Gln Arg His Asp Met Ala Ile Lys Lys 580 585 590 Gly Ser Gly His Phe Ser Asn Phe Asp Pro Ile Pro Glu His Thr Gln 595 600 605 Thr Glu Pro Lys Phe Asn Val Asn Val Met Leu Pro Pro Gln Asn Ser 610 615 620 Ala Val Ala Thr Lys Asn Thr Pro Gly Thr Ser Pro Gly Thr Gln Thr 625 630 635 640 Gln Asn Thr Ala His Ser Thr Gly Asn Thr Ser Ala Gly Ser Thr Pro 645 650 655 Asn Asn Val Val Pro Val Arg Lys Lys Lys Glu Pro Ser Lys Lys Lys 660 665 670 Ser Lys Lys Ala Thr Glu Pro Pro Thr Pro Thr Thr Pro Gln Thr Pro 675 680 685 Ile Ala Ala Arg Ala His Gln Asn Ser Thr Gly Gly Ile Ser Gly Asn 690 695 700 Asn Ala Ala Thr Lys Arg Arg Lys Arg Glu Pro Leu Val Asp Gln Thr 705 710 715 720 Val Ser Pro Asn Leu Asn Glu Ala Ser Lys Ser Thr Lys Pro Gly Lys 725 730 735 Ile Ser Ser Gln Asn Asp Phe Thr Gly Ser Asp Asn Gly Phe Leu Gln 740 745 750 Asp Phe Gly Asp Gly Thr Gly Pro Pro Thr Gly Thr Asp Asp Met Glu 755 760 765 Phe Asp Phe Asn Ser Phe Leu Asn Asn Glu Thr Gly Glu Pro Asn Ser 770 775 780 Ser Thr Ile His Phe Asp Asn Val Phe Asn Trp Gly Glu Gly Thr Glu 785 790 795 800 Ala Gly Asp Leu <210> 4 <211> 2415 <212> DNA <213> Komagataella pastoris <400> 4 atgaacaagc caaacgggtc tggacaacaa ccaccgtcac gcggaatgaa gcaagaccca 60 ggaggcccag ttacctcatc tacgacaccc ggtaccaata ctggctttga aaactctcat 120 tccatgggag cggatgtgga gcctgatgtt ggtgccgcct ctcctcgcca tattcttaat 180 gggtacattc atgattactt agtcaaatct aatatgcaaa atttggccga tcaatttgct 240 caagagtcgg atctcttaga aacagaccta acggtaccaa tggatacacc tacaggctat 300 cttttagagt ggtggatggt attttgggac cttttcaatg cccgcctaaa gcaacgaggt 360 tcacagaagg ctcatcagta tattcagttg aacatgctac gacaacaaca gcagaggact 420 atgcgaaata cagcccgtgt tcagaaagtc ccgttgagac cacacaccca atcatctcct 480 tcaatgtcac agacctttat tccacagcag cctcaacagc aagcacaggc acaggcacag 540 cagcacgccc aagctcaagc gcaagtccag gctcatcagc aagcacagca tcatgcgcag 600 gctcaagtgc caatgcaatc gcaaccacat cagcaaggag gccaaactca acaacagcaa 660 cccattaaca ctgggtctcc tgcggggcca aatgctatca actctcgtgt gcaacactta 720 gcgcaacaac agatgaatca tcttcgccag caggcaactg ccactaccca gcaacctatc 780 ccgcaacaga atattccatc aaaccagcag ggccctgcgg gcccttatcc tacatcgcct 840 tcaagaagac cgagattact gtctaacgaa tcgggtgcaa gtgcaccctc tgtaatgacg 900 aagtcacagc tccaaggagg tcctccatca caacaaccac accaacagca agctcagcag 960 gtaggacccc ccaatcaaca tcaaggccag tcctcttcct tttattcggg catgcctcct 1020 caaggagttg tggttcctca tcagttcaat cctcagcagt atgccaatat gctagcaaga 1080 caacagcatg tgcaagctca acaacaggtt cagttacagc aggttccaca tgtgcaacaa 1140 agacaacagc aagaccaaca acaacaccgc ttgtcagccg gttcaccagg gcatccttca 1200 tttggcgttt ttcaacaacc tcctccgatg tcaaaccata atcaggtcat gatcaaccag 1260 cagggagaaa ccttttttga tcctcattca ccatatgctc aacctaatgg gtacccccag 1320 ccacagcaac aacaacaaca gcagcaacaa caacaacaac aacaacaaca gcagcagcag 1380 cagcaacaac agaagcagca acagccacca ccaagacagc ctcagcgcca acaagcgatg 1440 gctacggctc ctttgcctca ttctacttct gcctcgggta ctcctcacac ggccaccaca 1500 cctagattct cccagcctgg tcctgtttat cagcagcctt tacctgcatc tcaaccgcaa 1560 cattctccgc ctacttctat tcagcaacag gaaccaattc caactcctgg gtcacaacat 1620 cagcaaatag cacaaccgca atcacagaat caacaccagc aaccgcagca acctcaagca 1680 agtgcttcta aaatggtggg tatacaggag taccagaaag agttaatgat gcttgagaag 1740 cagaacaaac aacgtcatga catggcaatt aagaagggaa gcggacattt ctctaatttt 1800 gatccaattc cagagcacac acagactgaa ccaaaattca atgtgaacgt aatgctccct 1860 ccccagaact ctgcagtggc cacgaagaat actcctggaa cttctcctgg tacgcaaact 1920 caaaacactg cacacagtac tggcaacact tctgctgggt ctacaccgaa taatgttgta 1980 ccagttcgaa aaaagaagga gccatctaaa aagaaatcaa agaaggctac cgaacctcca 2040 actcctacta ctccacagac accaattgca gctagggcac atcaaaactc tacgggcggc 2100 atttcaggta ataatgctgc tactaagcga cgaaaaaggg agccgctggt cgaccaaaca 2160 gtttcaccta accttaacga agcttcgaaa tcaacaaagc ctgggaaaat ctcatctcaa 2220 aatgacttta caggttctga caatggattt ttacaggatt ttggcgatgg aacaggtccc 2280 cccactggaa ctgacgatat ggagtttgat tttaacagtt ttctcaacaa cgaaactggt 2340 gaacctaata gttcaaccat tcattttgac aatgtattta attgggggga gggtactgaa 2400 gccggggatc tatag 2415 <210> 5 <211> 799 <212> PRT <213> Saccharomyces cerevisiae <400> 5 Met Ser Tyr Lys Val Asn Ser Ser Tyr Pro Asp Ser Ile Pro Pro Thr 1 5 10 15 Glu Gln Pro Tyr Met Ala Ser Gln Tyr Lys Gln Asp Leu Gln Ser Asn 20 25 30 Ile Ala Met Ala Thr Asn Ser Glu Gln Gln Arg Gln Gln Gln Gln Gln 35 40 45 Gln Gln Gln Gln Gln Gln Gln Trp Ile Asn Gln Pro Thr Ala Glu Asn 50 55 60 Ser Asp Leu Lys Glu Lys Met Asn Cys Lys Asn Thr Leu Asn Glu Tyr 65 70 75 80 Ile Phe Asp Phe Leu Thr Lys Ser Ser Leu Lys Asn Thr Ala Ala Ala 85 90 95 Phe Ala Gln Asp Ala His Leu Asp Arg Asp Lys Gly Gln Asn Pro Val 100 105 110 Asp Gly Pro Lys Ser Lys Glu Asn Asn Gly Asn Gln Asn Thr Phe Ser 115 120 125 Lys Val Val Asp Thr Pro Gln Gly Phe Leu Tyr Glu Trp Trp Gln Ile 130 135 140 Phe Trp Asp Ile Phe Asn Thr Ser Ser Ser Arg Gly Gly Ser Glu Phe 145 150 155 160 Ala Gln Gln Tyr Tyr Gln Leu Val Leu Gln Glu Gln Arg Gln Glu Gln 165 170 175 Ile Tyr Arg Ser Leu Ala Val His Ala Ala Arg Leu Gln His Asp Ala 180 185 190 Glu Arg Arg Gly Glu Tyr Ser Asn Glu Asp Ile Asp Pro Met His Leu 195 200 205 Ala Ala Met Met Leu Gly Asn Pro Met Ala Pro Ala Val Gln Met Arg 210 215 220 Asn Val Asn Met Asn Pro Ile Pro Ile Pro Met Val Gly Asn Pro Ile 225 230 235 240 Val Asn Asn Phe Ser Ile Pro Pro Tyr Asn Asn Ala Asn Pro Thr Thr 245 250 255 Gly Ala Thr Ala Val Ala Pro Thr Ala Pro Pro Ser Gly Asp Phe Thr 260 265 270 Asn Val Gly Pro Thr Gln Asn Arg Ser Gln Asn Val Thr Gly Trp Pro 275 280 285 Val Tyr Asn Tyr Pro Met Gln Pro Thr Thr Glu Asn Pro Val Gly Asn 290 295 300 Pro Cys Asn Asn Asn Thr Thr Asn Asn Thr Thr Asn Asn Lys Ser Pro 305 310 315 320 Val Asn Gln Pro Lys Ser Leu Lys Thr Met His Ser Thr Asp Lys Pro 325 330 335 Asn Asn Val Pro Thr Ser Lys Ser Thr Arg Ser Arg Ser Ala Thr Ser 340 345 350 Lys Ala Lys Gly Lys Val Lys Ala Gly Leu Val Ala Lys Arg Arg Arg 355 360 365 Lys Asn Asn Thr Ala Thr Val Ser Ala Gly Ser Thr Asn Ala Cys Ser 370 375 380 Pro Asn Ile Thr Thr Pro Gly Ser Thr Thr Ser Glu Pro Ala Met Val 385 390 395 400 Gly Ser Arg Val Asn Lys Thr Pro Arg Ser Asp Ile Ala Thr Asn Phe 405 410 415 Arg Asn Gln Ala Ile Ile Phe Gly Glu Glu Asp Ile Tyr Ser Asn Ser 420 425 430 Lys Ser Ser Pro Ser Leu Asp Gly Ala Ser Pro Ser Ala Leu Ala Ser 435 440 445 Lys Gln Pro Thr Lys Val Arg Lys Asn Thr Lys Lys Ala Ser Thr Ser 450 455 460 Ala Phe Pro Val Glu Ser Thr Asn Lys Leu Gly Gly Asn Ser Val Val 465 470 475 480 Thr Gly Lys Lys Arg Ser Pro Pro Asn Thr Arg Val Ser Arg Arg Lys 485 490 495 Ser Thr Pro Ser Val Ile Leu Asn Ala Asp Ala Thr Lys Asp Glu Asn 500 505 510 Asn Met Leu Arg Thr Phe Ser Asn Thr Ile Ala Pro Asn Ile His Ser 515 520 525 Ala Pro Pro Thr Lys Thr Ala Asn Ser Leu Pro Phe Pro Gly Ile Asn 530 535 540 Leu Gly Ser Phe Asn Lys Pro Ala Val Ser Ser Pro Leu Ser Ser Val 545 550 555 560 Thr Glu Ser Cys Phe Asp Pro Glu Ser Gly Lys Ile Ala Gly Lys Asn 565 570 575 Gly Pro Lys Arg Ala Val Asn Ser Lys Val Ser Ala Ser Ser Pro Leu 580 585 590 Ser Ile Ala Thr Pro Arg Ser Gly Asp Ala Gln Lys Gln Arg Ser Ser 595 600 605 Lys Val Pro Gly Asn Val Val Ile Lys Pro Pro His Gly Phe Ser Thr 610 615 620 Thr Asn Leu Asn Ile Thr Leu Lys Asn Ser Lys Ile Ile Thr Ser Gln 625 630 635 640 Asn Asn Thr Val Ser Gln Glu Leu Pro Asn Gly Gly Asn Ile Leu Glu 645 650 655 Ala Gln Val Gly Asn Asp Ser Arg Ser Ser Lys Gly Asn Arg Asn Thr 660 665 670 Leu Ser Thr Pro Glu Glu Lys Lys Pro Ser Ser Asn Asn Gln Gly Tyr 675 680 685 Asp Phe Asp Ala Leu Lys Asn Ser Ser Ser Leu Leu Phe Pro Asn Gln 690 695 700 Ala Tyr Ala Ser Asn Asn Arg Thr Pro Asn Glu Asn Ser Asn Val Ala 705 710 715 720 Asp Glu Thr Ser Ala Ser Thr Asn Ser Gly Asp Asn Asp Asn Thr Leu 725 730 735 Ile Gln Pro Ser Ser Asn Val Gly Thr Thr Leu Gly Pro Gln Gln Thr 740 745 750 Ser Thr Asn Glu Asn Gln Asn Val His Ser Gln Asn Leu Lys Phe Gly 755 760 765 Asn Ile Gly Met Val Glu Asp Gln Gly Pro Asp Tyr Asp Leu Asn Leu 770 775 780 Leu Asp Thr Asn Glu Asn Asp Phe Asn Phe Ile Asn Trp Glu Gly 785 790 795 <210> 6 <211> 791 <212> PRT <213> Saccharomyces cerevisiae <400> 6 Met Ser Tyr Lys Val Asn Ser Ser Tyr Pro Asp Ser Ile Pro Pro Thr 1 5 10 15 Glu Gln Pro Tyr Met Ala Ser Gln Tyr Lys Gln Asp Leu Gln Ser Asn 20 25 30 Ile Ala Met Ala Thr Asn Ser Glu Gln Gln Arg Gln Gln Gln Gln Trp 35 40 45 Ile Asn Gln Pro Thr Ala Glu Asn Ser Asp Leu Lys Glu Lys Met Asn 50 55 60 Cys Lys Asn Thr Leu Asn Glu Tyr Ile Phe Asp Phe Leu Thr Lys Ser 65 70 75 80 Ser Leu Lys Asn Thr Ala Ala Ala Phe Ala Gln Asp Ala His Leu Asp 85 90 95 Arg Asp Lys Gly Gln Asn Pro Ile Asp Gly Pro Lys Ser Lys Glu Asn 100 105 110 Asn Gly Asn Gln Asn Thr Phe Ser Lys Val Val Asp Thr Pro Gln Gly 115 120 125 Phe Leu Tyr Glu Trp Trp Gln Ile Phe Trp Asp Ile Phe Asn Thr Ser 130 135 140 Ser Ser Arg Gly Gly Ser Glu Phe Ala Gln Gln Tyr Tyr Gln Leu Val 145 150 155 160 Leu Gln Glu Gln Arg Gln Glu Gln Ile Tyr Arg Ser Leu Ala Ala His 165 170 175 Ala Ala Arg Leu Gln His Asp Ala Glu Arg Arg Gly Glu Tyr Ser Asn 180 185 190 Glu Asp Ile Asp Pro Met His Leu Ala Ala Met Met Leu Gly Asn Pro 195 200 205 Met Ala Pro Ala Val Gln Met Arg Asn Val Asn Met Asn Pro Ile Pro 210 215 220 Ile Pro Met Val Gly Asn Pro Ile Val Asn Asn Phe Ser Ile Pro Pro 225 230 235 240 Tyr Asn Asn Ala Asn Pro Thr Thr Gly Ala Thr Ala Val Ala Pro Thr 245 250 255 Ala Pro Pro Ser Gly Asp Phe Ala Asn Val Gly Pro Thr Gln Asn Arg 260 265 270 Ser Gln Asn Val Thr Gly Trp Pro Val Tyr Asn Tyr Pro Met Gln Pro 275 280 285 Thr Thr Glu Asn Pro Val Gly Asn Pro Cys Asn Asn Asn Thr Thr Asn 290 295 300 Asn Thr Thr Asn Asn Lys Ser Pro Val Asn Gln Pro Lys Ser Leu Lys 305 310 315 320 Thr Met His Ser Thr Asp Lys Pro Asn Asn Val Pro Thr Ser Lys Ser 325 330 335 Thr Arg Ser Arg Ser Ala Thr Ser Lys Ala Lys Gly Lys Val Lys Ala 340 345 350 Gly Leu Val Ala Lys Arg Arg Arg Lys Asn Asn Thr Ala Thr Val Ser 355 360 365 Ala Gly Ser Thr Asn Ala Gly Ser Pro Asn Ile Thr Thr Pro Gly Ser 370 375 380 Thr Thr Ser Glu Pro Ala Met Val Gly Ser Arg Val Asn Lys Thr Pro 385 390 395 400 Arg Ser Asp Ile Ala Thr Asn Phe Arg Asn Gln Ala Ile Ile Phe Gly 405 410 415 Glu Glu Asp Ile Tyr Ser Asn Ser Lys Ser Ser Pro Ser Leu Asp Gly 420 425 430 Ala Ser Pro Ser Ala Leu Val Ser Lys Gln Pro Thr Lys Val Arg Lys 435 440 445 Asn Thr Lys Lys Ala Ser Thr Ser Ala Phe Pro Val Glu Ser Ala Asn 450 455 460 Lys Leu Gly Gly Asn Ser Val Val Thr Gly Lys Lys Arg Ser Pro Pro 465 470 475 480 Asn Thr Arg Val Leu Arg Arg Lys Ser Thr Pro Ser Val Ile Leu Asn 485 490 495 Ala Asp Ala Thr Lys Asp Glu Asn Asn Met Leu Arg Thr Phe Ser Asn 500 505 510 Thr Thr Ala Pro Asn Ile His Ser Ala Pro Pro Thr Lys Thr Ala Asn 515 520 525 Ser Leu Pro Phe Pro Gly Ile Asn Leu Gly Ser Phe Asn Lys Pro Ala 530 535 540 Val Ser Ser Pro Leu Ser Ser Val Thr Glu Ser Cys Phe Asp Pro Glu 545 550 555 560 Ser Gly Lys Ile Ala Gly Lys Asn Gly Pro Lys Arg Ala Val Asn Ser 565 570 575 Lys Val Ser Ala Ser Ser Pro Leu Ser Ile Ala Thr Pro Pro Ser Gly 580 585 590 Asp Ala Gln Glu Gln Arg Ser Ser Asn Val Pro Gly Asn Val Val Ile 595 600 605 Lys Pro Pro His Gly Phe Ser Thr Thr Asn Leu Asn Ile Thr Leu Lys 610 615 620 Ser Ser Lys Ile Ile Thr Ser Gln Asn Asn Thr Ala Phe Gln Glu Leu 625 630 635 640 Pro Asn Gly Gly Asn Ile Leu Glu Ala Gln Val Gly Asn Asp Ser Arg 645 650 655 Ser Ser Lys Gly Asn Arg Asp Thr Leu Ser Thr Pro Glu Glu Lys Lys 660 665 670 Pro Ser Ser Asn Asn Gln Gly Tyr Asp Phe Asp Ala Leu Lys Asn Ser 675 680 685 Ser Ser Leu Leu Phe Pro Asn Gln Ala Tyr Ala Ser Asn Asn Arg Thr 690 695 700 Pro Asn Glu Asn Ser Asn Val Ala Asp Glu Thr Ser Ala Ser Thr Asn 705 710 715 720 Asn Gly Asp Asn Asp Asn Thr Leu Ile Gln Pro Ser Ser Asn Val Gly 725 730 735 Thr Thr Leu Gly Pro Gln Gln Thr Ser Thr Asn Glu Asn Gln Asn Val 740 745 750 His Ser Gln Asn Leu Lys Phe Gly Asn Ile Gly Met Val Glu Asp Gln 755 760 765 Gly Pro Asp Tyr Asp Leu Asn Leu Leu Asp Thr Asn Glu Asn Asp Phe 770 775 780 Asn Phe Ile Asn Trp Glu Gly 785 790 <210> 7 <211> 768 <212> PRT <213> Yarrowia lipolytica <400> 7 Met Pro Ala Lys Ser Asp Lys Glu Leu Leu Asn Ala Tyr Ile Tyr Asp 1 5 10 15 Tyr Leu Leu Lys His Asn Met His Asp Ser Ala Arg Thr Phe Gly Ala 20 25 30 Glu Ala Lys Val Val Pro Asn Val Lys Lys Glu Asp Asp Lys Asp Leu 35 40 45 Pro Lys Pro Leu Ile Pro Ile Asp Ala Pro Gln Gly Phe Leu Tyr Glu 50 55 60 Trp Trp Ala Leu Phe Trp Asp Ile Tyr Ser Ala Arg Gly Ser Lys Gly 65 70 75 80 Gly Gly Ser Val Pro Ala Gln Gln Tyr Val Gln Gly Thr Met Arg Leu 85 90 95 Arg Gln Glu His Ala Ala Arg Ala Gln Leu Gln Gln Gln His Gln Ala 100 105 110 Gln Gln His Ala Gln Ala Gln Ala Ala Ala Gln Val Gln Gly Gln Ala 115 120 125 Gln Gly Gln Gly Gln Gly Gln Asn Pro Thr Gln Gly Pro Gln Pro Gln 130 135 140 Gly His Met Gly Met Pro Gly Gln Gly Pro His Gln Pro Gly Gly Pro 145 150 155 160 Phe Met Asn Gly Asn Met Met Phe Pro Pro Gly Gln Met Arg Met Gly 165 170 175 Gln Leu Pro Gln His Leu Gln Gln Gln Gly Thr Gly Val Ala Gly Ala 180 185 190 Asn Pro Ser Asp Asp Ser Ser Ser Pro Gly Gly Thr Ser Pro Ala Lys 195 200 205 Arg Gln Arg Leu Ser Pro Asp Met Gly Gly Gln Ser His Pro Glu Gln 210 215 220 Gln Gly Gln His Met Met Gly Thr Pro Asn Pro Asn Asn Pro Val Phe 225 230 235 240 Asn Ser Gln Val Met Gln Gln Leu Lys Ala Ser Gln Gly Gln Met Pro 245 250 255 Asn Leu Gln Gln Gln Gln Gln Ala Gln Leu Gln Gln Tyr Ser Asn Thr 260 265 270 Leu Ser Leu Ala Gln Gln Arg Ala Met Met Asn Ala Lys Gly Gly Pro 275 280 285 Asn Gly Gln Pro Gly Gln Pro Gly Gln Pro Gly Gln Pro Gly Gln Pro 290 295 300 Gly Gln Pro Gly Gln Pro Gly Gln Pro Gly Gln Pro Leu Pro Met Gly 305 310 315 320 Tyr Glu Gly Met Glu Pro Gly Phe Met Gly Gly Asn Gly Leu Ile Leu 325 330 335 Asn Ala Gln Gln Met Arg Gln Gln Gln Ala Gly Ser Gly Gly Ala Ala 340 345 350 Gly Ser Gly Gln Leu Asn Gly Asn Ser Asn Ala Leu His Asp Tyr Gln 355 360 365 Met Gln Leu Met Leu Leu Glu Gln Gln Asn Lys Lys Arg Leu Met Val 370 375 380 Ala Arg Gln Glu Gln Gln Glu Gly Gln Pro Arg Ala Glu Gly Gln Ala 385 390 395 400 Ala Ala Ala Gly Ala Asn Pro Gly Ala Arg Met Ser Gly Gln Phe Lys 405 410 415 Arg Pro Gly Ser Ser Pro Val Val Gly Asn Ile Gly Asp Gly Arg Arg 420 425 430 Val Thr Pro Lys Leu Pro Asn Gln Pro Ser Pro Leu Ile Asp Ala Asn 435 440 445 Arg Ala Ser Pro Leu Gln Ser Asn Phe Asn Gly Gln Gly Asp Phe Asn 450 455 460 Val Val Val Gly Pro Ser Gly Gln Met Met Arg Met Gln Gln Pro Gln 465 470 475 480 Gln Gln Gly Gly Pro Pro Gln Gln Gln Gly Gln Gln Gln Gly Gly Pro 485 490 495 Gly Gln Gln Gln Gly Gly Pro Gly Gln Gln Pro Gln Gln Gly Gln Gln 500 505 510 Gln Gly Gln Gln Gly Gly Pro Gln Gly Gly Gln His Arg Phe Asp Asp 515 520 525 Pro Gln Gln Leu Pro Gln Ser Gln Asn Gly Gly Pro Gln Pro Gly Ser 530 535 540 Ala Pro Gly Gln Leu Pro Gln Thr Gln Gly Gly Pro Gln Arg Pro Pro 545 550 555 560 Ser Arg Val Ser Gln Met Pro Pro Pro Gly Val Gln Gly Gly Gln Arg 565 570 575 Thr Gln Pro Ser Ser Pro Gly Gln Ala Ser Asn Pro Gly Ser Gly Gly 580 585 590 Ser Ser Gly Ser Ala Pro Gly Gly Thr Thr Pro Thr Gln Ala Asn Lys 595 600 605 Gln Leu Lys Gly Lys Lys Ala Glu Pro Lys Lys Arg Ala Lys Lys Gly 610 615 620 Asn Gln Pro Val Thr Pro Lys Ala Val Ser Glu Ser Pro Thr Pro Thr 625 630 635 640 Thr Pro Ala Thr Pro Ser Ala Ala Ser Asn Gln Ser Leu Leu Ser Lys 645 650 655 Ala Thr Asn Phe Ala Ala Asn Asn Lys Gln Ala Gln Ala Ala Ala His 660 665 670 Ala Gln Ala Gln Ala Gln Ala Ala Ala Gln Ala Gln Ser Gln Met His 675 680 685 Met Gly Gly Met Gly Gly Ser Ser Ser Gly Leu Glu Leu Asp Val Asn 690 695 700 Gly Gly Met Gly Leu Asp Asn Asp Ser Ser Ser Phe Leu Asn Asp Phe 705 710 715 720 Ser Thr Gly Asn Glu Gly Asp Val Gly Asp Met Asp Phe Asp Phe Asn 725 730 735 Ser Phe Leu Asn Thr Asp Asp Asn Ala Ala Gly Ala Leu Lys Phe Asp 740 745 750 Ser Gly Ser Ala Phe Gly Trp Gly Glu Gly Val Glu Ala Met Asn Glu 755 760 765 <210> 8 <211> 598 <212> PRT <213> Ogataea polymorpha <400> 8 Met Ser Gln Asn Ala Thr Pro Gln Thr Thr Glu Gly His Met Ser Met 1 5 10 15 Asn Asp Gln Gln Ser Asn Ser Ser Ser Gly Thr Asn Asn Thr Glu His 20 25 30 Pro Ser Ser Ser Ser Val Ser Ser Val Pro Thr Val Ser Asp Ser Thr 35 40 45 Ala Val Asn Ser Arg Glu Leu Leu Asn Ala Tyr Val Tyr Asp Phe Ile 50 55 60 Leu Lys Ser Gly Phe Thr Ala Thr Ala Ser Ala Phe Phe Lys Glu Ala 65 70 75 80 Asn Ile Pro Val Ile His Ser Glu Lys Arg Pro Thr Asn Ser Pro Ser 85 90 95 Ser Ser Ala Thr Gly Thr Ser Asp Leu Pro Ala Ser Phe Met Thr Met 100 105 110 Asp Ala Pro Gln Gly Phe Leu Tyr Glu Trp Trp Gln Ile Phe Trp Asp 115 120 125 Val Phe Asn Ala Arg Thr Gln Arg Gly Gly Thr Thr Asn Ala Thr Gln 130 135 140 Tyr Tyr His Tyr Val Asn Leu Lys Gln Lys Gln Asp His Leu Met Ser 145 150 155 160 Gln Gln Ala Ala Ala Val Ala Ala Ala Ser Thr Val Met Asn Gly Asn 165 170 175 Asn Thr Ser Met Ser Gly Ala Pro Val Thr Ser Ala Ala Gln Asp Ile 180 185 190 Gly Val Leu Met Pro Gln Gln Gln Gln Gln Gln Gln Gln Ala Gln Met 195 200 205 Ala His Pro Pro Gln Gln Val Pro Met Ala Gln Gln Gln Arg Val Asn 210 215 220 Ala Arg Met Gln Gln Pro Gln Gln Gln Gln Ser Gln Ser Met Pro Met 225 230 235 240 His Pro Gln Ala Ala Ala Gln Ala Gln Met Asn Thr Leu Arg Gln Gln 245 250 255 Gln Ile Ala Gln Gln Ala Gln Ala Ala Gln Val Ala Ala Gln Ala Val 260 265 270 Ser Gln Arg Gly Ser Pro Ser Lys Arg Gln Arg Met Asp Ala Ala Gly 275 280 285 Asn Gly Ser Ala Thr Glu Ile Asn Gln Thr Ser Ser Pro Asn Ile Ala 290 295 300 Met Asn Ser Gln Gln Gln Gln Gln Gln Gln Gln His Pro Pro Met Pro 305 310 315 320 Met Pro Gln Gly Met Met Ile Pro Asn Gln Phe Gly Val Pro Gln Gln 325 330 335 Tyr Ala Met Phe Ala Ala Ala Gln Ala Ala Gln Gln Gly Gln Ser Gln 340 345 350 Gln Lys Phe Asn Gln Tyr Met Ile Pro Asn Phe Gln Asn Gln Pro Gln 355 360 365 Gln Pro Gln Gln Gln Met Leu Met His Gln Gln Met His Gln Gln Ser 370 375 380 Val His Met Gln His Asp Gln Gln His Pro Pro Pro Pro Pro Pro Asn 385 390 395 400 Val Pro Gln His Ser Gln Thr Phe Ser Asn Pro Asn Asp Phe Phe His 405 410 415 Glu Met Pro Lys Gln Asn Asn Pro Gly Thr Ala Arg Val Asn Asp Thr 420 425 430 Ala Ile Lys Asp Tyr Glu Lys Gln Leu Arg Leu Met Glu Ser Gln Asn 435 440 445 Arg Arg Arg Leu Asp Val His Arg Asn Val Ser Asp Ser Lys Asp Pro 450 455 460 Asn Ser Pro Gly Ser Ala Gln Phe Thr Glu Tyr Ser Ala Met Leu Asn 465 470 475 480 Gln Met Pro Pro Gln His Ala Ala Ala Ser Ile Met Gln Gln Arg Ala 485 490 495 Ser Pro Ala Thr Lys Ala Ser Pro Thr Thr Lys Ser Pro Ala Asn Gly 500 505 510 Ala Pro Pro Ala Asn Gly Lys Gln Lys Lys Ala Pro Arg Lys Ala Arg 515 520 525 Lys Asn Ser Ser Ser Val Pro Ala Thr Pro Leu Thr Pro Ala Asn Asn 530 535 540 Gln Pro Thr Pro Gln Thr Asn Ile Pro Pro Thr Pro Gln Asn Thr Thr 545 550 555 560 Pro Gln Gln Thr Pro Gln Ser Ser Ala Ala Ala Ala Ser Gln Val Met 565 570 575 Ala Gly Lys Lys Gly Ile Lys Arg Lys Asn Arg Gly Arg Ala Ile Tyr 580 585 590 Pro Ile Glu Tyr Ser Arg 595 <210> 9 <211> 771 <212> PRT <213> Aspergillus niger <400> 9 Met Asn Gln Met Asn Gln Met Asn Met Ala Gly Met Asn Pro Gly Ala 1 5 10 15 Gly Gly Pro Val Gly Gly Val Pro Met Ile Asn Asn Gly Ser Ala Ala 20 25 30 Pro Arg Asn Glu Gln Asn Ile Asn Asn Ile Pro Glu Asn Met Ile Asn 35 40 45 Asn Leu Asn Thr Tyr Ile Tyr Asp Tyr Phe Leu Lys Arg Gly Tyr His 50 55 60 Asp Cys Ala Arg Ala Leu Val Lys Asp Glu Ser Ile Lys Leu Asn Thr 65 70 75 80 Glu Pro Pro Ile Lys Thr Ser Pro Gly His Arg Arg Asp Ala Asp Val 85 90 95 Asn Gly Val Asp Gly Asp Thr Met Met Thr Asp Gly Lys Asp Gly Asp 100 105 110 Lys Leu Lys Ile Pro Asp Asp Leu Pro Arg Pro Asn Leu Pro Ser Glu 115 120 125 Gly Gln Gln Ser Ser Phe Leu Leu Asp Trp Phe Ser Leu Phe Trp Asp 130 135 140 Phe Phe Trp Ala Gln Arg Lys Lys Gly Asn Ser Asn Asp Val Arg Ser 145 150 155 160 Tyr Leu Thr His Thr Gln Asn Met Met Arg Leu Arg Glu Gln His Gln 165 170 175 Asn Gln Leu Leu Arg Gln Gln Pro Leu Met Asn Gly Gln Met Gly Gln 180 185 190 Met Asn Ile Arg Arg Asn Gly Met Val Pro Pro Asn Leu Gln Lys Thr 195 200 205 Val Leu Gln Asn Asn Thr Thr Gly Leu Ser Gln Gln Gln Leu Ala Gln 210 215 220 Met His Lys Asn Gln Gln Val Gln Met Met Gln Gln Met Gln Arg Glu 225 230 235 240 His Ser Asp Met Asp Met Asn Gly His Arg Pro Gln Ser Pro Ala Ser 245 250 255 Ala Glu Asn Ala Pro Ser Pro Ser Lys Arg Pro Arg Leu Glu Gly Gly 260 265 270 Pro Met Asn Gly Gln Gln Leu Ala Pro Asn Gly Arg Gly Gln Ala Gln 275 280 285 Gly Ile Pro Gly Gln Pro Thr Pro Gln Ala Leu Leu Met Gln Asn Gly 290 295 300 Leu Asn Arg Ala Met Asn Pro Asn Gln Phe Gln Ala Phe Gln Gln Ser 305 310 315 320 Gly Pro Ala Ala Gln Gln Lys Gln Met Gln Gly Met Pro Asn Gly Met 325 330 335 Met Asn Pro Ala Asn Val Met Ala Asn Pro Gln Thr Glu Met Val Ser 340 345 350 Ile Pro Glu Gly Gln Val Tyr Pro Ile Asn Gly Asp Tyr Tyr Gly Ala 355 360 365 Asn Gly Gln Met Ala Gln Val Arg Thr Gly Met Gln Thr Pro Gly Gly 370 375 380 Gln His Gly Asn His Ala Leu Gln Asp Tyr Gln Met Gln Leu Met Leu 385 390 395 400 Leu Glu Gln Gln Asn Lys Arg Arg Leu Met Met Ala Arg Gln Glu Gln 405 410 415 Asp Ser Met Ala Arg Pro Asp Gly Gln Pro Gln Met Pro Gly Gln Gln 420 425 430 Leu Pro Pro Gly Thr Ser Pro Gln Gly Ser Arg Ala Gly Thr Ser Pro 435 440 445 Asn Pro Asn Asp Gln Met Lys Arg Gly Thr Pro Lys Met Pro Gln Thr 450 455 460 Gly Leu Pro Gly Ser Pro Ser Ala Ala Asp Ala Met Ala Gln Gly Arg 465 470 475 480 Gly Ser Pro Ala Ser Met Asn Phe Pro Gly Gly Gln Met Pro Pro Glu 485 490 495 Met Ala Gly Pro Gln Phe Phe Val Lys Asn Met Ala Asp Gly Met Ala 500 505 510 Ala Pro Asn Gly Met Arg Pro Pro Ser Ser Asn Pro Ala Phe Ser Thr 515 520 525 Pro Gln Met Gly Gln Pro Ile Gln Ala Gly Ala Asn Arg Met Pro Asn 530 535 540 Gly Gly Trp Gln Pro Gln Gln Gly Ala Gln Gly Gln Pro Met Ala Pro 545 550 555 560 Gln Gln Ser Pro Ala Thr Gln Pro Gln Ser Thr Gly Thr Pro Gln Glu 565 570 575 Arg Asn Ala Met Pro Pro Pro Gln Ala Pro Pro Ala Pro Gly Ala Asn 580 585 590 Val Gly Arg Thr Gln Pro Pro Ser Pro Gln Thr Ala Ala Pro Pro Thr 595 600 605 Pro Gln Gln Gly Asn Lys Pro Ala Pro Lys Lys Lys Glu Thr Lys Asp 610 615 620 Ser Arg Lys Arg Pro Lys Lys Gly Ala Ala Ala Ala Ala Ala Ala Ala 625 630 635 640 Gln Ala Asn Thr Ala Ala Thr Pro Ser Ser Glu Ala Glu His Pro Pro 645 650 655 Thr Pro Thr Pro Ser Thr Pro Ile Thr Pro Gln His Pro Asn Ser Phe 660 665 670 Asn Lys Thr Gly Ala Asn Ala Thr Thr Ser Ala Pro Gln Gln Pro Thr 675 680 685 Ser Ala Pro Ala Pro Pro Pro Leu Val Gln Gln Pro Pro Asp Gln Thr 690 695 700 Gln Gln Pro Phe Asn Glu Leu Ser Ile Pro Asp Ala Ser Ala Phe Asn 705 710 715 720 Leu Asp Phe Ser Ala Leu Glu Asn Pro Asp Ile Leu Glu Asn Phe Asp 725 730 735 Phe Asp Thr Phe Leu Asn Thr Asp Ala Asp Thr Ala Gly Phe Gly Phe 740 745 750 Asp Pro Asn Thr Ser Tyr Pro Thr Asp Gly Val Glu Thr Gly Ala Gly 755 760 765 Asp Gly Leu 770 <210> 10 <211> 1240 <212> DNA <213> Artificial Sequence <220> <223> promoter <400> 10 caaacatttg ctccccctag tctccaggga aatgtaaaat atactgctaa tagaaaacag 60 taagacgctc agttgtcagg ataattacgt tcgactgtag taaaacagga atctgtattg 120 ttagaaagaa cgagagtttt ttacggcgcc gccatattgg gccgtgtgaa aacagcttga 180 aaccccacta ctttcaaagg ttctgttgct atacacgaac catgtttaac caacctcgct 240 tttgacttga ctgaagtcat cggttaacaa tcaagtaccc tagtctgtct gaatgctcct 300 ttccatattc agtaggtgtt tcttgcactt ttgcatgcac tgcggaagaa ttagccaata 360 gcgcgtttca tatgcgcttt taccccctct tttgtcaagc gcaaaatgcc tgtaagattt 420 ggtgggggtg tgagccgtta gctgaagtac aacaggctaa ttccctgaaa aaactgcagc 480 tcagggattc ccactatttg gtattctgat atgtttttcc tgatatgcat caaaactcta 540 atctaaaacc tgaatctccg ctattttttt ttttttttga tgaccccgtt ttcgtgacaa 600 attaatttcc aacggggtct tgtccggata agagaatttt gtttgattat ccgttcggat 660 aaatggacgc ctgctccata tttttccggt tattacccca cctggaagtg cccagaattt 720 tccggggatt acggataata cggtggtctg gattaattaa tacgagatct cagggattcc 780 cactatttgg tattctgata tgtttttcct gatatgcatc aaaactctaa tctaaaacct 840 gaatctccgc tatttttttt tttttttgat gaccccgttt tcgtgacaaa ttaatttcca 900 acggggtctt gtccggataa gagaattttg tttgattatc cgttcggata aatggacgcc 960 tgctccatat ttttccggtt attaccccac ctggaagtgc ccagaatttt ccggggatta 1020 cggataatac ggtggtctgg attaattaat acgccaagtc ttacattttg ttgcagtctc 1080 gtgcgagtat gtgcaataat aaacaagatg agccaattta ttggattagt tgcagcttga 1140 ccccgccata gctaggcata gccaagtgct atgggtgtta gatgatgcac ttggatgcag 1200 tgagttttgg agtataaaag atccttaaaa ttccaccctt 1240 <210> 11 <211> 1425 <212> DNA <213> Artificial Sequence <220> <223> promoter <400> 11 caaacatttg ctccccctag tctccaggga aatgtaaaat atactgctaa tagaaaacag 60 taagacgctc agttgtcagg ataattacgt tcgactgtag taaaacagga atctgtattg 120 ttagaaagaa cgagagtttt ttacggcgcc gccatattgg gccgtgtgaa aacagcttga 180 aaccccacta ctttcaaagg ttctgttgct atacacgaac catgtttaac caacctcgct 240 tttgacttga ctgaagtcat cggttaacaa tcaagtaccc tagtctgtct gaatgctcct 300 ttccatattc agtaggtgtt tcttgcactt ttgcatgcac tgcggaagaa ttagccaata 360 gcgcgtttca tatgcgcttt taccccctct tttgtcaagc gcaaaatgcc tgtaagattt 420 ggtgggggtg tgagccgtta gctgaagtac aacaggctaa ttccctgaaa aaactgcagc 480 tcagggattc ccactatttg gtattctgat atgtttttcc tgatatgcat caaaactcta 540 atctaaaacc tgaatctccg ctattttttt tttttttgat gaccccgttt tcgtgacaaa 600 ttaatttcca acggggtctt gtccggataa gagaattttg tttgattatc cgttcggata 660 aatggacgcc tgctccatat ttttccggtt attaccccac ctggaagtgc ccagaatttt 720 ccggggatta cggataatac ggtggtctgg attaattaat acgccaagtc ttacattttg 780 ttgcagtctc gtgcgagtat gtgcaataat aaacaagatg agccaattta ttggattagt 840 tgcagcttga ccccgccata gctaggcata gccaagtgct atgggtgtta gatgatgcac 900 ttggatgcag tgagttttgg agtataaaag atccttaaaa ttccaccctt agatctcagg 960 gattcccact atttggtatt ctgatatgtt tttcctgata tgcatcaaaa ctctaatcta 1020 aaacctgaat ctccgctatt tttttttttt ttgatgaccc cgttttcgtg acaaattaat 1080 ttccaacggg gtcttgtccg gataagagaa ttttgtttga ttatccgttc ggataaatgg 1140 acgcctgctc catatttttc cggttattac cccacctgga agtgcccaga attttccggg 1200 gattacggat aatacggtgg tctggattaa ttaatacgcc aagtcttaca ttttgttgca 1260 gtctcgtgcg agtatgtgca ataataaaca agatgagcca atttattgga ttagttgcag 1320 cttgaccccg ccatagctag gcatagccaa gtgctatggg tgttagatga tgcacttgga 1380 tgcagtgagt tttggagtat aaaagatcct taaaattcca ccctt 1425 <210> 12 <211> 966 <212> DNA <213> Artificial Sequence <220> <223> promoter <220> <221> misc_feature <222> (592)..(593) <223> n is T or absent <400> 12 caaacatttg ctccccctag tctccaggga aatgtaaaat atactgctaa tagaaaacag 60 taagacgctc agttgtcagg ataattacgt tcgactgtag taaaacagga atctgtattg 120 ttagaaagaa cgagagtttt ttacggcgcc gccatattgg gccgtgtgaa aacagcttga 180 aaccccacta ctttcaaagg ttctgttgct atacacgaac catgtttaac caacctcgct 240 tttgacttga ctgaagtcat cggttaacaa tcaagtaccc tagtctgtct gaatgctcct 300 ttccatattc agtaggtgtt tcttgcactt ttgcatgcac tgcggaagaa ttagccaata 360 gcgcgtttca tatgcgcttt taccccctct tttgtcaagc gcaaaatgcc tgtaagattt 420 ggtgggggtg tgagccgtta gctgaagtac aacaggctaa ttccctgaaa aaactgcaga 480 tagacttcaa gatctcaggg attcccacta tttggtattc tgatatgttt ttcctgatat 540 gcatcaaaac tctaatctaa aacctgaatc tccgctattt tttttttttt tnngatgacc 600 ccgttttcgt gacaaattaa tttccaacgg ggtcttgtcc ggataagaga attttgtttg 660 attatccgtt cggataaatg gacgcctgct ccatattttt ccggttatta ccccacctgg 720 aagtgcccag aattttccgg ggattacgga taatacggtg gtctggatta attaatacgc 780 caagtcttac attttgttgc agtctcgtgc gagtatgtgc aataataaac aagatgagcc 840 aatttattgg attagttgca gcttgacccc gccatagcta ggcatagcca agtgctatgg 900 gtgttagatg atgcacttgg atgcagtgag ttttggagta taaaagatcc ttaaaattcc 960 accctt 966 <210> 13 <211> 1000 <212> DNA <213> Artificial Sequence <220> <223> promoter <400> 13 gtaaatagcg gcagcaatcc agtaaccttt tctgaatagc agagccttaa ctaaaataat 60 ggccagggta aaaaattcga aatttgacac caaaaataaa gacttgtcgt tataagtctt 120 aacaaagtcc gcaattttgg agctaacggt ggcggttgct gggatattca ataatggtag 180 aatgttgctg cgggtatatg acagagcgtg aaacacactg aacaaggtaa atggaacaac 240 agcaattgca atatggggga ggatagtcaa gaacaaagca gcaatggcaa agtactgaat 300 attctccaaa gccaaaaggt ccagtggttt caacgacaaa gtcttgttgg tatagctttg 360 gaacaaaagg acaccgaaag actcgacagc gcccacaaat acagcgttgt agaagaacga 420 attgattgct ccagagcttc taatagtcag aagatacccc aaacctccga gcaacgttag 480 cacatgacct aagaaccagg cgaagtgaag agtctggaat aacgacaccc agtcagtttt 540 tcctgagctc ctggtgggat tggtagaagc atttgatttg cttggagtgg ttttatttga 600 agatggtgtt gaagccattg ttgctaaaga gtcggagttt tgcttttagg gtttgttaag 660 caaaggagga aaaactgcgc cgtttgaagt cccaggtagt ttcgcgtgtg aggccagcca 720 gggaaagctt ccttcggtac ttttttttct tttgcaggtt ccggacggat taagcttcgg 780 gttatgaggg gggcggtagc caattccgga cacaatattg cgtcgcagct agtcaccccg 840 ccataaatat acgcaggatt gaggtaataa catcgatagt cttagtaatt aatacaattc 900 agtggcgaat ttggcaacat gacgtaaggc ccactgttgt ctataaaagg ggatgaattt 960 tcatgttttt gaggcctccc ggacaattta ttgaactcaa 1000 <210> 14 <211> 1000 <212> DNA <213> Artificial Sequence <220> <223> promoter <400> 14 tggactgttc aatttgaagt cgatgctgac gatgtcaaga gagatgctca attatatttg 60 tcatttgctg gttacactgg aaacgctact tttgttggcg gaaactctac cagtttggcc 120 gtccatgtaa acgatgtcgt tctgggccgt gaccgtttca acacgaacat aaccaatgac 180 aaatccactt acaggtctag ttcatatgga ggcaattggt accttacttc tttggatgtc 240 ccaagtgggg ctttaacgtc tggtactaac aatgtctcgt ttgtcactac aaactccgag 300 gtaaataaag gattcttgtg ggattctctc aagtttgttt ggaagttgta acaggtttat 360 aagcatatcg tgcgcttgtc cacaattgaa tcatttattg ttgcgagata catgaacaaa 420 gtgtgaactg ggacccatta ctacaattcc cacgcaaccg ttgtttcaaa gcccatattt 480 tttgacaatt gtttcgttac acccccagtt tgatgtacat cgcttgcaat gatgtgtgtc 540 ccggagtatt ttccatattc agcttgaatt cgtatactca accaatatct gggggtatac 600 ttttatgtaa cctatacaaa tcaactatac tatttcacct ttcgaccaat catctcccat 660 cttgttaagt tttgcttcct atatccctga ccctgacatc acccatgatt ccgctcaacg 720 gttctcctct acatcgtccc tcttttggag agggtgttca gtttgacatt caaattaccc 780 cccgccatca cgcgcaaccg agaccgcacc cccgaatttt cacaaattac cccacaccct 840 atactccacc actatgaggg ttattagaac tgatcacgta taaataccac cgcaagttcc 900 caagggatcg tgttcttctt ctccaattgc aatcatattt ctgactcttt ctagttcaga 960 ttaattcctt tacacttgct tttttccctt acctttatcc 1000 <210> 15 <211> 1001 <212> DNA <213> Artificial Sequence <220> <223> promoter <400> 15 agaccagcag tttaactacg caaatccaca ggaatttcta catcacaata ccaatggtaa 60 taccacgacg tcaaggaatg gaaacgacga cttggaggaa gacttcgtca acctcttgcg 120 gagtacccga ggctaagaca ataagaagaa aaaaaaaaga aaagcggtgg gggagggatt 180 attaaataag gattatgtaa ccccagggta ccgttctata catatttaag gattatttag 240 gacaatcgat gaaatcggca tcaaactgga tgggagtata gtgtccggat aatcggataa 300 atcatcttgc gaggagccgc ttggttggtt ggtgagagga gtgaaatatg tgtctcctca 360 cccaagaatc gcgatatcag caccctgtgg gggacactat tggcctccct cccaaacctt 420 cgatgtggta gtgctttatt atattgatta cattgattac atagctaaac cctgcctggt 480 tgcaagttga gctccgaatt ccaatattag taaaatgcct gcaagataac ctcggtatgg 540 cgtccgaccc cgcttaatta ttttaactcc tttccaacga ggacttcgta atttttgatt 600 agggagttga gaaacggggg gtcttgatac ctcctcgatt tcagatccca ccccctctca 660 gtcccaagtg ggacccccct cggccgtgaa atgcgcgcac tttagttttt ttcgcatgta 720 aacgccggtg tccgtcaatt aaaagtcgca gactagggtg aactttacca tttttgtcgc 780 actccgtctc ctcggaatag gggtgtagta attctgcagt agtgcaattt ttaccccgcc 840 aagggggggc gaaaagagac gacctcatca cgcattctcc agtcgctctc tacgcctaca 900 gcaccgacgt agttaacttt ctcccatata taaagcaatt gccattcccc tgaaaacttt 960 aacctctgct ttttcttgat ttttccttgc ccaaagaaaa g 1001 <210> 16 <211> 1000 <212> DNA <213> Artificial Sequence <220> <223> promoter <400> 16 ctgcacaacc attgccagta aggacgaaga gaaggcccca ctacccaaaa ttcaggataa 60 cgtcttcata ccatgcagcg acgcctacaa gacgctgtca agacatgcca acttcaacga 120 agtgaacttt aacacattga tcgggaaatt gaccaccaag ggaatgctgg ttgaggctgg 180 aagcgttgcc agtgtcctga gggaactgga ccgaaagttt agtaatgcat aagaggatat 240 atataggaat gcagtaataa tattagtacc cattaagtgg gctaagccat tggaaggccg 300 tctgactgat ggtggtgttc ttctcattta gatagtgcat ttgcaactac cgtctgagat 360 tgagtttgat gtgaagctcc agcgccaaaa cagtataaga accttatctc cgcattattg 420 ttcttgcgta aaagtttgtg tgaagaaaca ggggtagttg cgcagattag ttgtaatatg 480 cgcataggat gggtcattga cttctttcct cgaaagagcc acaccgttag ctaaaaaagg 540 acgcgcatct accccaaaat agaatgtggg gaaataggac gcgcaacttc ctctcaatca 600 ctggacgtca gaaaaacaaa tgcgcaatcg agtcaccctc cgtgataccc tccgtgatac 660 cccctctccg tctattctga cagcgtctcc ccatgacgtt tcaatctact tagaaaagat 720 ttcgtttttt tttccttcaa ttacacgatc tcatcttctg caagggtctg gaggacatca 780 ccaatctgcg actccataac ttagtcctga gtttatattt acgcttcatc tgatgagtag 840 gaagaaaaag tttcacgaaa ttcccccgcc aacttgccct tcggaataag cagccactct 900 ccttctgccc atagtaagct tgcgcgaggc cccaacttgg ccagaaactt taaatatgcc 960 aaacaatctc ccccaatcta agttctccct cttctaaaaa 1000 <210> 17 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> regulatory region <400> 17 ataaatgga 9 <210> 18 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> regulatory region <400> 18 catatttttc cggtt 15 <210> 19 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> motif <400> 19 tatttttttt ttttt 15 <210> 20 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> motif <400> 20 tttttttttt ttttt 15 <210> 21 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> motif <400> 21 tatttttttt tttttt 16 <210> 22 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> motif <400> 22 tttttttttt tttttt 16 <210> 23 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> motif <400> 23 tatttttttt ttttttt 17 <210> 24 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> motif <400> 24 tttttttttt ttttttt 17 <210> 25 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> motif <400> 25 tatttttttt tttttttt 18 <210> 26 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> motif <400> 26 tttttttttt tttttttt 18 <210> 27 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> motif <400> 27 tatttttttt ttttttttt 19 <210> 28 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> motif <400> 28 tttttttttt ttttttttt 19 <210> 29 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> motif <400> 29 tatttttttt tttttttttt 20 <210> 30 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> motif <400> 30 tttttttttt tttttttttt 20 <210> 31 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> motif <400> 31 tatttttttt tttttttttt t 21 <210> 32 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> motif <400> 32 tttttttttt tttttttttt t 21 <210> 33 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> motif <400> 33 tatttttttt tttttttttt tt 22 <210> 34 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> motif <400> 34 tttttttttt tttttttttt tt 22 <210> 35 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> main regulatory region <400> 35 ataaatggac gcctgctcca tatttttccg gtt 33 <210> 36 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> spacer core region <400> 36 cgcctgctc 9 <210> 37 <211> 255 <212> DNA <213> Artificial Sequence <220> <223> spacer main region <400> 37 attaccccac ctggaagtgc ccagaatttt ccggggatta cggataatac ggtggtctgg 60 attaattaat acgagatctc agggattccc actatttggt attctgatat gtttttcctg 120 atatgcatca aaactctaat ctaaaacctg aatctccgct tttttttttt tttttgatga 180 ccccgttttc gtgacaaatt aatttccaac ggggtcttgt ccggataaga gaattttgtt 240 tgattatccg ttcgg 255 <210> 38 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> translation initiation site <400> 38 ttccaccctt 10 <210> 39 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> translation initiation site <400> 39 ttcgaaacg 9 <210> 40 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> translation initiation site <220> <221> misc_feature <222> (7)..(7) <223> R at position 7 is A or G, preferably A <400> 40 gccgccrcc 9 <210> 41 <211> 859 <212> DNA <213> Artificial Sequence <220> <223> promoter <400> 41 ggaatctgta ttgttagaaa gaacgagagt tttttacggc gccgccatat tgggccgtgt 60 gaaaacagct tgaaacccca ctactttcaa aggttctgtt gctatacacg aaccatgttt 120 aaccaacctc gcttttgact tgactgaagt catcggttaa caatcaagta ccctagtctg 180 tctgaatgct cctttccata ttcagtaggt gtttcttgca cttttgcatg cactgcggaa 240 gaattagcca atagcgcgtt tcatatgcgc ttttaccccc tcttttgtca agcgcaaaat 300 gcctgtaaga tttggtgggg gtgtgagccg ttagctgaag tacaacaggc taattccctg 360 aaaaaactgc agatagactt caagatctca gggattccca ctatttggta ttctgatatg 420 tttttcctga tatgcatcaa aactctaatc taaaacctga atctccgcta tttttttttt 480 ttttttgatg accccgtttt cgtgacaaat taatttccaa cggggtcttg tccggataag 540 agaattttgt ttgattatcc gttcggataa atggacgcct gctccatatt tttccggtta 600 ttaccccacc tggaagtgcc cagaattttc cggggattac ggataatacg gtggtctgga 660 ttaattaata cgccaagtct tacattttgt tgcagtctcg tgcgagtatg tgcaataata 720 aacaagatga gccaatttat tggattagtt gcagcttgac cccgccatag ctaggcatag 780 ccaagtgcta tgggtgttag atgatgcact tggatgcagt gagttttgga gtataaaaga 840 tccttaaaat tccaccctt 859 <210> 42 <211> 664 <212> DNA <213> Artificial Sequence <220> <223> promoter <400> 42 ccatattcag taggtgtttc ttgcactttt gcatgcactg cggaagaatt agccaatagc 60 gcgtttcata tgcgctttta ccccctcttt tgtcaagcgc aaaatgcctg taagatttgg 120 tgggggtgtg agccgttagc tgaagtacaa caggctaatt ccctgaaaaa actgcagata 180 gacttcaaga tctcagggat tcccactatt tggtattctg atatgttttt cctgatatgc 240 atcaaaactc taatctaaaa cctgaatctc cgctattttt tttttttttt tgatgacccc 300 gttttcgtga caaattaatt tccaacgggg tcttgtccgg ataagagaat tttgtttgat 360 tatccgttcg gataaatgga cgcctgctcc atatttttcc ggttattacc ccacctggaa 420 gtgcccagaa ttttccgggg attacggata atacggtggt ctggattaat taatacgcca 480 agtcttacat tttgttgcag tctcgtgcga gtatgtgcaa taataaacaa gatgagccaa 540 tttattggat tagttgcagc ttgaccccgc catagctagg catagccaag tgctatgggt 600 gttagatgat gcacttggat gcagtgagtt ttggagtata aaagatcctt aaaattccac 660 cctt 664 <210> 43 <211> 493 <212> DNA <213> Artificial Sequence <220> <223> promoter <400> 43 ctgcagatag acttcaagat ctcagggatt cccactattt ggtattctga tatgtttttc 60 ctgatatgca tcaaaactct aatctaaaac ctgaatctcc gctatttttt tttttttttt 120 gatgaccccg ttttcgtgac aaattaattt ccaacggggt cttgtccgga taagagaatt 180 ttgtttgatt atccgttcgg ataaatggac gcctgctcca tatttttccg gttattaccc 240 cacctggaag tgcccagaat tttccgggga ttacggataa tacggtggtc tggattaatt 300 aatacgccaa gtcttacatt ttgttgcagt ctcgtgcgag tatgtgcaat aataaacaag 360 atgagccaat ttattggatt agttgcagct tgaccccgcc atagctaggc atagccaagt 420 gctatgggtg ttagatgatg cacttggatg cagtgagttt tggagtataa aagatcctta 480 aaattccacc ctt 493 <210> 44 <211> 370 <212> DNA <213> Artificial Sequence <220> <223> promoter <400> 44 gaccccgttt tcgtgacaaa ttaatttcca acggggtctt gtccggataa gagaattttg 60 tttgattatc cgttcggata aatggacgcc tgctccatat ttttccggtt attaccccac 120 ctggaagtgc ccagaatttt ccggggatta cggataatac ggtggtctgg attaattaat 180 acgccaagtc ttacattttg ttgcagtctc gtgcgagtat gtgcaataat aaacaagatg 240 agccaattta ttggattagt tgcagcttga ccccgccata gctaggcata gccaagtgct 300 atgggtgtta gatgatgcac ttggatgcag tgagttttgg agtataaaag atccttaaaa 360 ttccaccctt 370 <210> 45 <211> 328 <212> DNA <213> Artificial Sequence <220> <223> promoter <400> 45 ccggataaga gaattttgtt tgattatccg ttcggataaa tggacgcctg ctccatattt 60 ttccggttat taccccacct ggaagtgccc agaattttcc ggggattacg gataatacgg 120 tggtctggat taattaatac gccaagtctt acattttgtt gcagtctcgt gcgagtatgt 180 gcaataataa acaagatgag ccaatttatt ggattagttg cagcttgacc ccgccatagc 240 taggcatagc caagtgctat gggtgttaga tgatgcactt ggatgcagtg agttttggag 300 tataaaagat ccttaaaatt ccaccctt 328 <210> 46 <211> 1000 <212> DNA <213> Pichia pastoris <400> 46 ctgctactct ggtcccaagt gaaccacctt ttggacccta ttgaccggac cttaacttgc 60 caaacctaaa cgcttaatgc ctcagacgtt ttaatgcctc tcaacacctc caaggttgct 120 ttcttgagca tgcctactag gaactttaac gaactgtggg gttgcagaca gtttcaggcg 180 tgtcccgacc aatatggcct actagactct ctgaaaaatc acagttttcc agtagttccg 240 atcaaattac catcgaaatg gtcccataaa cggacatttg acatccgttc ctgaattata 300 gtcttccacc gtggatcatg gtgttccttt ttttcccaaa gaatatcagc atcccttaac 360 tacgttaggt cagtgatgac aatggaccaa attgttgcaa ggtttttctt tttctttcat 420 cggcacattt cagcctcaca tgcgactatt atcgatcaat gaaatccatc aagattgaaa 480 tcttaaaatt gcccctttca cttgacagga tccttttttg tagaaatgtc ttggtgtcct 540 cgtccaatca ggtagccatc tctgaaatat ctggctccgt tgcaactccg aacgacctgc 600 tggcaacgta aaattctccg gggtaaaact taaatgtgga gtaatggaac cagaaacgtc 660 tcttcccttc tctctccttc caccgcccgt taccgtccct aggaaatttt actctgctgg 720 agagcttctt ctacggcccc cttgcagcaa tgctcttccc agcattacgt tgcgggtaaa 780 acggaggtcg tgtacccgac ctagcagccc agggatggaa aagtcccggc cgtcgctggc 840 aataatagcg ggcggacgca tgtcatgaga ttattggaaa ccaccagaat cgaatataaa 900 aggcgaacac ctttcccaat tttggtttct cctgacccaa agactttaaa tttaatttat 960 ttgtccctat ttcaatcaat tgaacaacta tcaaaacaca 1000 <210> 47 <211> 756 <212> PRT <213> Pichia pastoris <400> 47 Met Ile Pro Thr Ile Asp Pro Lys Asp Pro Glu Leu Val Ser Glu Asp 1 5 10 15 Thr Ala Gln Ser Ala Ser Ala Arg Lys Arg Ser Lys Val Ser Arg Ala 20 25 30 Cys Asp Glu Cys Arg Arg Lys Lys Ile Lys Cys Asp Ala Thr Phe Leu 35 40 45 Ala Asn Ser Asn Thr Leu Leu Lys Pro Cys Thr Asn Cys Tyr Lys Tyr 50 55 60 Asn Cys Ser Cys Ser Phe Thr Arg Val Pro Leu Lys Arg Gly Pro Ser 65 70 75 80 Lys Gly Phe Ala Arg Asp Gly Ser Gly Tyr Glu Arg Arg Arg Ser Ser 85 90 95 Ser Val His Ser Val Ser Ser Ser Gln Ser Val Thr Ser Pro Val Pro 100 105 110 Ser His Ala Ser Leu Pro Ile Pro Pro Ala Asn Pro Val Ser Leu Pro 115 120 125 Arg Leu Asn Val Pro Gly Asp Gly Leu Leu Ser Pro Lys Ala Val Pro 130 135 140 Pro Thr Asn Leu Phe Trp Lys Val Pro Tyr Glu Leu Pro Ser Phe Ser 145 150 155 160 Asp Arg Arg Ser Ser Val Ala Ser Ala Asp Ser Phe Arg Arg Pro Ser 165 170 175 Ile Tyr Gln Ser Asp Ser Glu Asp Asp Phe Tyr Ser Ala Thr Gly Ser 180 185 190 Gln Arg Asn Ser Ile Ser Gln Ala Pro Arg Gln Arg Asn Leu Ser Pro 195 200 205 Ala Leu Ser Val Ser Ser Thr Ser Ser Leu Asn Asn Arg Ile Lys Ser 210 215 220 Leu Asn Met Val Ala Ser Thr Leu Glu Ser Asn Ile His Asn Tyr Tyr 225 230 235 240 Ser Gln Gly Phe Asn Ser Ser Leu Pro Ile Leu Pro Leu Asp Glu Arg 245 250 255 Ile Leu Ser Thr Leu Leu Ser Asn Val Ser Asn Gly Ser Ser Ser Ala 260 265 270 Ser Trp Asp Ala Ile Arg Ser Pro Ile Leu Glu Leu Phe Asp Lys Ser 275 280 285 Ile Leu Met Leu Leu Arg Ser Tyr Glu Ser Gln Phe Asn Phe Asn Asp 290 295 300 Leu Leu Asp His Val Thr Glu Met Gln Ser Ile Tyr Pro Arg Ile Arg 305 310 315 320 Ser His Leu Leu Ser Asp Glu Leu Leu Lys Leu Ile Phe Leu Met Ser 325 330 335 Gly Val Leu Thr Asp Tyr Ala Leu Ile Leu Thr Gly Gln Pro Tyr Ser 340 345 350 Thr Gly Leu Ser Ile Thr Val Ser Val Phe Asn Asp Trp Lys Thr Tyr 355 360 365 Glu Asn Val Gln Arg Val Leu Val Ile Asn Arg Ala Gly Ser Leu Asp 370 375 380 Leu Asp Tyr Asp Ser Leu Pro Phe Leu Phe Ala Arg Cys Tyr Leu Ser 385 390 395 400 Leu Ala Thr Leu Asp Leu Ile Tyr Ser Leu Ser Phe Ser Ser Pro Arg 405 410 415 Leu Ile Ser Ser Phe Ala Asn Leu Pro Ile Leu Asp Ile Val Gln Lys 420 425 430 Cys Gly Ile Thr Lys Asp Ala Lys Leu Asp Glu Thr Pro Leu Pro Val 435 440 445 Leu Asp Gln Phe Leu Asn Cys Phe Leu Pro Gly Asp Thr Tyr Pro Thr 450 455 460 Ala Leu Asn Thr Leu Lys Thr Gly Leu Val Leu Leu Asp Phe Thr Asn 465 470 475 480 Asn Arg Ser Thr Thr Leu Arg Phe Pro Phe Ile Asn Ile His Asp Asp 485 490 495 Asn His Met Thr Gly Leu Ser His Leu Leu Ser Asn Val Ser Asp Phe 500 505 510 Met Ser Gln Phe Thr Glu Val His Ser Asp Ser Lys Asp Ser Gln Leu 515 520 525 Leu Phe Leu Arg Cys Ile Trp Ala Phe Trp Glu Ile Gly Ser Val Leu 530 535 540 Ser Glu Leu Ile Asp His Phe Ile Ser Ser Ser Ala Asn Ser Gln Val 545 550 555 560 Gly Asp Lys Asp Ala Ser Phe Phe Tyr Glu His Gln Leu Lys Val Thr 565 570 575 Thr Leu Leu Gly Thr Phe Ser Asn Ile Ala Ser Ala Phe Leu Thr Ser 580 585 590 Ser Thr Thr Ala Ala Ser His Pro Pro Pro Ser Ile Ser Pro Phe His 595 600 605 Ile Ile Ser Met Val Glu Ser Phe Lys Met Val Gln Phe Leu Asn Lys 610 615 620 Leu Ile Ala Ser Phe Ile Ser Leu Asn Glu Lys Leu Glu Lys Arg Glu 625 630 635 640 Leu Glu Asp Glu Leu Ser Lys Cys Lys Glu Glu Leu Asn Asn Leu Asn 645 650 655 Glu Arg Phe Gln Ala Val Ser Ser Val Gln Thr Leu Pro Val Val His 660 665 670 Val Leu Phe Arg Asp Leu Val Phe Ser Ser Asn Arg Leu Asp Thr Gln 675 680 685 Arg Asp Arg Ala Ser Ser Val Val Ser Ala Thr Thr Thr Thr Ser Thr 690 695 700 Ala Thr Thr Thr Ala Thr Thr Lys Lys Ser Ser Phe Gly Asn Leu Leu 705 710 715 720 His Ser Asp Glu Glu Asn Ile Leu Pro Thr Val Ile Asp Trp Cys Lys 725 730 735 Glu Gln Lys His Ser Ala Glu Met Phe Leu Asn Lys Asn Asp Leu Asn 740 745 750 Gly Trp Leu Tyr 755 <210> 48 <211> 1036 <212> PRT <213> Pichia pastoris <400> 48 Met Met Pro Glu Glu Gln Val Thr Ser Pro Gln Arg Lys His Gln Lys 1 5 10 15 Ser Lys Ala Lys Thr Ile Arg Ala Pro Gly Ser Ser Ile Glu Arg Val 20 25 30 Ala Gln Ala Cys Asp Arg Cys Arg Ser Lys Lys Thr Arg Cys Asp Gly 35 40 45 Lys Arg Pro Gln Cys Ser Gln Cys Ala Ala Val Gly Phe Glu Cys Lys 50 55 60 Ile Ser Asp Lys Leu Ser Arg Arg Ala Phe Pro Arg Gly Tyr Thr Glu 65 70 75 80 Thr Leu Glu Glu Arg Ile Arg Glu Leu Glu Phe Glu Asn Lys Lys Leu 85 90 95 His Lys Leu Ile Asp Leu Lys Asn Glu Gln Val Glu Ile Lys Asn Arg 100 105 110 Ile Asp Gln Glu Ser Thr Leu Thr Asn Glu Asn Leu Thr Leu Leu Asn 115 120 125 Lys Glu Gln Glu Val Ser His Ser Gly Asn Ile His His His Ala Asp 130 135 140 Gly Glu Pro Cys Asn Cys Ala Asn Ser Val Ser Ala Arg Pro Val Ser 145 150 155 160 Ile Ala Gly Ser Val Asp Ile Asp Thr Thr Asp Leu Ser Asp Glu Asp 165 170 175 Asp Ser Leu Tyr Ser Ala Ala Ser Tyr Asn Ala Lys Tyr His Gln Thr 180 185 190 Gly Thr Ser Gly Pro Glu Met Val Arg Leu Ser Gln Arg Tyr Ser Ser 195 200 205 Gly Asn Phe Asn Asp Pro Leu Ser Phe Glu Gln Ser Asn Ala Pro Gly 210 215 220 Ala Ala Ala Ala Ile Ser Ile Gln Asn Lys Met Arg Thr Gln Thr Phe 225 230 235 240 Val Asn Leu Ala Asn Leu Val Ala Met Ser Ile Pro Arg Thr Thr Glu 245 250 255 Glu Thr Leu Phe Ile Ala Ser Leu Leu Ala Lys Ile Cys Asn Val His 260 265 270 Gly Phe Gln Ser Lys Ala Pro Ile Leu Thr Ala Lys Ser Ile Ala Leu 275 280 285 Leu Lys Asp Lys Tyr Asn Tyr Gly Asn Asp Glu Val Phe Ala Asn Ile 290 295 300 Thr Leu Lys Asn Val Asn Phe Asn Lys Leu Thr Ser Gln Gln Ser Gln 305 310 315 320 Gln Phe Phe Gln Ser Leu Asn Leu Pro Asn Gln Val Asn Leu Asp Leu 325 330 335 Phe Ile Thr Thr Phe Phe Asn Thr Trp Asn Asn Phe Ile Pro Ile Ile 340 345 350 Asn Arg His Ile Phe Met Ser Ser Tyr Ile Lys Phe Asn Lys Ser Arg 355 360 365 Glu Thr Met Phe Thr Asp Asn Ser Met Phe Gly Asn Glu Lys Phe Gly 370 375 380 Glu Ile Leu Leu Leu Ile Thr Thr Met Val Met Leu Ser Gln Glu Arg 385 390 395 400 Asn Asn Asn Arg Glu Ala Val Pro Ser Ser Ser Tyr Lys Lys Asp Ser 405 410 415 Thr Pro His Pro His Arg Pro Asp Ala Ser Ser Gln Ser Asn Val Glu 420 425 430 Ile Leu Gln Tyr Tyr Asp His Leu Ile His Glu Phe Ile Lys Ser Asn 435 440 445 Ile Ser Asp Asp Cys Ser Leu Pro Thr Leu Glu Ser Leu Ser Leu Gln 450 455 460 Leu Leu Tyr Cys Leu Ala Ile Gly Asp Leu Thr Thr Ser Tyr Glu Leu 465 470 475 480 Arg Gly Lys Ile Ile Thr Met Gly Gln Gln Leu Arg Leu His Arg Cys 485 490 495 Pro Ser Ala Val Leu Gly Thr Asn Gly Ser Lys Val Ser Gln Met Gln 500 505 510 Gln Gly Glu Arg Arg Ile Leu Phe Trp Cys Ile Tyr Ile Leu Asp Thr 515 520 525 Phe Ser Ala Leu Ile Leu Gly Val Pro Arg Leu Leu Lys Asp Tyr Glu 530 535 540 Ile Glu Cys Ala Leu Pro Phe Ser Asn Glu Ser Asn Asn Ala Asn Val 545 550 555 560 Lys Gly Ser Ile Glu Asn Thr Thr Asn Thr Val Ile Ile Asn Asn Ile 565 570 575 Lys Leu Ser Leu Ala Gly Lys Val Ser Asp Cys Ala Leu Ala Val Met 580 585 590 Arg Tyr Ser Lys Val Leu Gly Asn Ile Leu Asp Ser Ile Phe Gln Arg 595 600 605 Ser Ser Ile Asn Asn Pro Ser Val Val Ser Lys Ser Thr Asn Ile Thr 610 615 620 Glu Glu Thr Cys Leu Leu His Glu His Ala Leu Asp Leu Trp Arg Arg 625 630 635 640 Glu Leu Ser Pro His Ile Asn Val Asp Leu Asp Lys Ser Pro Gly Gly 645 650 655 Val Glu Tyr Glu Arg Leu Ser Asp Asn Gln Leu Thr Ile Leu Phe Leu 660 665 670 Tyr Tyr His Ala Lys Ile Leu Ile Tyr Leu Pro Leu Met Ala Asn Glu 675 680 685 Ser Ser Gln Ser Arg Ser Ser Ala Ser Tyr Ile Asn Ile Gln Gln Ser 690 695 700 Thr Thr Ser Ile Leu Ala Ile Ala Asn Thr Leu Ala Thr Lys Glu Arg 705 710 715 720 Asn Phe Tyr Phe Leu Pro Leu Pro Val Asn Leu Ser Arg Glu Lys Val 725 730 735 Arg Leu Ala Phe Leu Ser Ala Lys Gly Ser Leu Glu Tyr Ala Arg Gly 740 745 750 Gly Ala Leu Phe Gln Glu Ser Lys Ile Leu Leu Ala Ser Val Ile Asn 755 760 765 Glu Leu Lys Ile Glu Thr Ser Ile Gly Met Leu Gly Cys Leu Ser Val 770 775 780 Pro Cys Met Glu Ala Val Asp Asn Ala Met Glu Gln Ile Met Ala Leu 785 790 795 800 Pro Gly Lys Val Ser Ser Val Asn Gly Ser Asn Ser Glu Met Lys Arg 805 810 815 Ser Ser Ser Lys Arg Lys Ser Ser Pro Leu Arg Gln Asp Ile Ser Gly 820 825 830 Asp Glu Arg Lys Ser His Asn Ile Glu Val Ser Asp Ser Arg Thr Pro 835 840 845 Ser Val Gln Ser Ser Leu Tyr Pro Gln Pro Asn Gln Met His His Pro 850 855 860 Asn Ile Ile Lys Ser Glu Asn Asn Glu Gln Met Ile Pro Glu Asn Asp 865 870 875 880 Thr Pro Gly Ala Ile Asn Asp Ile Phe Thr Ser His Ser Pro Pro Gly 885 890 895 Thr Val Thr Ser Met Lys Glu Glu Asp Leu Pro Ile Lys Val Pro Ile 900 905 910 Leu Leu Gln Thr Gln Gln Arg Gln Ile Tyr Asn Asn Asn Pro Asn His 915 920 925 Ser Leu Phe Ser Gln Gln Pro Gly Thr Gln Val Leu Ser Gly Gln Gln 930 935 940 Met Pro Gly Pro Ser Ser Thr Asp Gln Gln Phe Lys Arg Ile Thr Thr 945 950 955 960 Pro Asp Gly Leu Asp Ser Leu Met Met Gln Asp Phe Gly Val Asp Ala 965 970 975 Ser Leu Gly Leu Pro Met Leu Asp Phe Asp Phe Asn Phe Asp Phe Glu 980 985 990 Asn Val Gln Asn Asn Tyr Ser Gln Ser Asn Val Ser Pro Pro Asn Ser 995 1000 1005 Glu Ser Val Pro Ser Ser Ile Gln Gly Thr His Ser Asn Asp Pro 1010 1015 1020 Lys Asp Ser Gln Val Ser Ala Gly Ser Leu Phe Gly Leu 1025 1030 1035 <210> 49 <211> 887 <212> PRT <213> Pichia pastoris <400> 49 Met Lys Glu Asn Gln Ala Ser Asn Lys Phe Asn Leu Ile Lys Asn Pro 1 5 10 15 Ile Thr Gly Lys Pro Arg Ile Ser Gln Ala Cys Asp Arg Cys Arg Ile 20 25 30 Lys Lys Ile Lys Cys Asp Gly Thr Leu Pro Ser Cys Thr Asn Cys Ser 35 40 45 Lys Ile Gly Phe Val Cys Lys Ile Ser Asp Arg Leu Thr Arg Ser Ser 50 55 60 Phe Pro Lys Gly Tyr Thr Lys Asn Leu Glu Gln Lys Leu Ile Asp Met 65 70 75 80 Glu Leu Asp Arg Asn Arg Leu Met Leu Glu Leu Asn Arg Ile Lys Lys 85 90 95 Glu Gly Phe Asp Gly Thr Asn Asn Asn Ile Ala Met Ala Ser Ser Val 100 105 110 Ser Ser Ser Glu Asn Leu Lys Ser Asp Asp Ser Ser Glu Cys Gln Ser 115 120 125 Val Thr Val Ser Leu Ser Ser Thr Ser Gly Pro Ser Leu Ser Pro Glu 130 135 140 Pro Lys Gln Asp Asp Phe Arg Phe Arg Val Gly Met Asp Gly Ser Phe 145 150 155 160 Val Leu Asn Gln Phe Leu Gln Ser Pro Leu Met Asp Tyr Ile Lys Ser 165 170 175 Leu Asn Val Leu Gln Phe Asn Gly Cys Ala Asn Phe Asp Gln Ser Phe 180 185 190 Asn Asp Asp Pro Leu Val Leu Asn Lys Tyr His Met Asn Leu Asn Arg 195 200 205 Phe Leu Asn Leu Ile Phe Tyr Lys Leu Leu Leu Pro Leu Ile His Arg 210 215 220 Asn Ser Asn Thr Leu Asn Glu Lys Phe Ala Glu Asp Asn Asn Ser Leu 225 230 235 240 Asp Ser Leu Ile Trp Lys Phe Phe Thr Asn Tyr Asn Lys Leu Ile Pro 245 250 255 Ile Leu Glu Phe Asp Ser Phe Tyr Lys Asp Tyr Leu Gln Phe Ile His 260 265 270 Lys Tyr Tyr Ser Asn Asn Gln Val Phe Val Asp Gly Phe Arg Lys Tyr 275 280 285 Phe Glu Phe Ser Glu Phe Glu Gln Cys Phe Ile Val Lys Leu Ile Leu 290 295 300 Ile Leu Lys Phe Thr Leu Pro Val Ile His Asp Thr Ser Val Pro Ser 305 310 315 320 Glu Ile Tyr Arg Leu Ile Ser Met Asp Ser Leu Gln Arg Leu Phe Gly 325 330 335 Asn Ile Asp Phe Leu Lys Pro Ser Thr Asp Lys Val Ser Ile Leu Leu 340 345 350 Leu Val Leu His Tyr Met Val Leu Tyr Glu Ser Pro Lys Ser Leu Leu 355 360 365 Asp Thr Gln Asp Glu Ala Gln Lys Tyr Asp Glu Phe Ile Gly Asn Leu 370 375 380 Leu Ser Thr Ala Val His His Ile Thr Ser Leu Arg Leu His Ile Asp 385 390 395 400 Pro Arg Lys Leu Gln Phe Pro Arg Pro Leu Pro Ser Asn Gly Asn Arg 405 410 415 Leu Arg Ile Lys Leu Ser Trp Cys Tyr Lys Leu Ile Ser Lys Leu Phe 420 425 430 Arg Val Ile Tyr Asn Ile Asp Asn Asp Ser Leu Tyr Ser Leu Asp Asp 435 440 445 Ser His Leu Pro Glu Leu Gln Ser Ile Ser Ile Leu His Glu Glu Leu 450 455 460 Asp Val Thr Ile Gln Phe Asn Asn Leu Leu Asn Leu Ile Pro Asn Asn 465 470 475 480 Phe His Ser Leu Arg Asp Lys Gln Ser Leu Ser Lys Ile Lys Thr Gln 485 490 495 Leu Leu Glu Trp His Lys Asn Phe Asn Thr Glu Phe Val Glu His Phe 500 505 510 Asn Leu Asn Asp Thr Asp Ser Asp Glu Leu Ser Ala Glu Lys Ile Asn 515 520 525 Val Leu Arg Ser Lys Leu Ile Ser Leu Asn Arg Leu Asn Cys Tyr Asn 530 535 540 Ser Tyr Phe Gln Leu Val Ile Glu Leu Gln Leu Lys Glu Asn Leu Asp 545 550 555 560 Ser Val Val Ser Gly Ile Phe Gly Leu Ser Asn Glu Met Leu Ile Asp 565 570 575 Asn Lys Ser Ser Thr Glu Leu Leu Asn Thr Leu Gln Gln Thr Pro Ile 580 585 590 Ile His Gln Ser Ser Ile Leu Val Ser Leu Cys Tyr Arg Ile Gln Thr 595 600 605 Gly Asn Leu Gln Asp Glu Ile Cys Ser Ile Leu Val Asn Asn Tyr Glu 610 615 620 Lys Leu Leu Gln Cys Asn Asp Ala Gly Leu Pro Ile Lys Ile Leu Pro 625 630 635 640 Gln Leu Val His Tyr Phe Lys Gly Lys Ile Ser Thr Asn Leu Ser Asn 645 650 655 Ser Ala Ala His Glu Asp Leu Met Asn Met Phe Thr Leu Asn Asp Asn 660 665 670 Leu Ser Thr Thr Thr Thr Asp Leu Asp Ser Phe Ile Ile Pro Pro Lys 675 680 685 Arg Lys Gln Asp Gln Thr Leu Pro Ile Gly Thr Lys Arg Ser Lys Ser 690 695 700 Ala Ser Thr Ser Ser Val Ile Ser Ser Asp Asp Cys Ser Leu Phe Ser 705 710 715 720 Asn Ser Leu Ser Val Pro Thr Thr Phe Ser Gly Ser Ser Ile Ser Val 725 730 735 Gly Met Asp Asn Pro Pro Ser Ser Leu Phe Gly Ser Tyr Lys Arg Pro 740 745 750 Ser Ser Ile Val Lys Gln Glu Pro Thr Ile Asn Pro Arg Ser Asn Gly 755 760 765 Thr Asn Thr Asp Ser Asn Leu Phe Asp Thr Phe Asn Asp Ser Ile Lys 770 775 780 Gly Ser Leu Asn Asn Gly Leu Lys Lys Leu Lys Asp Ile Arg Cys Asn 785 790 795 800 Ser Val Val Glu Arg Ser His Ser Ser Gln Arg Asn Asp Phe Leu Met 805 810 815 Asp Gln Glu Asp Ser Ile Thr Lys Glu Thr Ile Asn Phe Ser Glu Leu 820 825 830 Phe Thr Cys Gly Thr Pro Thr Ala Ser Gln Ser Ile Asp Arg Ser Pro 835 840 845 Lys Ser Leu Leu Leu Asn Asp Leu Ala Ile Ala Pro Asp Thr Leu Val 850 855 860 Ile Lys Pro Asp Ala Glu Asp Leu Asp Arg Leu Lys Asn Lys Ile Arg 865 870 875 880 Ser Val Lys Ser Thr Val His 885 <210> 50 <211> 26 <212> PRT <213> Komagataella phaffii <400> 50 Leu Leu Asn Gly Tyr Ile Tyr Asp Tyr Leu Val Lys Ser Asn Met Gln 1 5 10 15 Asn Leu Ala Asp Gln Phe Ala Gln Glu Thr 20 25 <210> 51 <211> 25 <212> PRT <213> Komagatella pastoris <400> 51 Leu Asn Gly Tyr Ile His Asp Tyr Leu Val Lys Ser Asn Met Gln Asn 1 5 10 15 Leu Ala Asp Gln Phe Ala Gln Glu Ser 20 25 <210> 52 <211> 25 <212> PRT <213> Saccharomyces cerevisiae <400> 52 Leu Asn Glu Tyr Ile Phe Asp Phe Leu Thr Lys Ser Ser Leu Lys Asn 1 5 10 15 Thr Ala Ala Ala Phe Ala Gln Asp Ala 20 25 <210> 53 <211> 25 <212> PRT <213> Saccharomyces cerevisiae <400> 53 Leu Asn Glu Tyr Ile Phe Asp Phe Leu Thr Lys Ser Ser Leu Lys Asn 1 5 10 15 Thr Ala Ala Ala Phe Ala Gln Asp Ala 20 25 <210> 54 <211> 27 <212> PRT <213> Yarrowia lipolytica <400> 54 Glu Leu Leu Asn Ala Tyr Ile Tyr Asp Tyr Leu Leu Lys His Asn Met 1 5 10 15 His Asp Ser Ala Arg Thr Phe Gly Ala Glu Ala 20 25 <210> 55 <211> 27 <212> PRT <213> Ogataea polymorpha <400> 55 Glu Leu Leu Asn Ala Tyr Val Tyr Asp Phe Ile Leu Lys Ser Gly Phe 1 5 10 15 Thr Ala Thr Ala Ser Ala Phe Phe Lys Glu Ala 20 25 <210> 56 <211> 26 <212> PRT <213> Aspergillus niger <400> 56 Asn Asn Leu Asn Thr Tyr Ile Tyr Asp Tyr Phe Leu Lys Arg Gly Tyr 1 5 10 15 His Asp Cys Ala Arg Ala Leu Val Lys Asp 20 25 <210> 57 <211> 774 <212> DNA <213> Artificial Sequence <220> <223> scR sequence <400> 57 caggaacaac taatggagtc tgggggtggt ttggttaccc tgggtggttc tcttaagctt 60 tcatgtaagg cctctggtat tgatttttcg cactacggta tctcctgggt tagacaagct 120 cctggaaaag gtctggaatg gatcgcttac atttacccaa attacggttc tgttgactat 180 gcctcctggg tcaatggtag gttcactatt tcccttgaca acgctcagaa cacggtattc 240 ctacagatga tctccctaac cgctgctgat actgcaacct acttctgtgc tcgtgacaga 300 ggttactact ctggctctcg tggaactaga cttgacttat ggggacaagg tactctcgtt 360 accatctcta gtggtggagg tggttctgga ggaggaggtt ccggcggagg tggtagcgag 420 ctggtcatga ctcaaacccc tccatcccta tctgcatcag tcggtgaaac cgttagaatt 480 agatgccttg catctgagtt cttgttcaac ggtgtgtcct ggtatcaaca aaagcctggt 540 aagcctccaa agtttctcat ttctggtgcc tcaaacctcg aatctggagt gccaccaaga 600 ttttccggat ctggctctgg tactgactac actctgacaa ttggtggtgt tcaagctgag 660 gatgttgcta cctactattg tctcggtggt tactcaggat cttccggcct aactttcggt 720 gccggtacaa acgtcgagat caaaggtgga catcaccacc accatcacta atag 774 <210> 58 <211> 837 <212> DNA <213> Artificial Sequence <220> <223> vHH sequence <400> 58 caggttcagc tgcaggagtc cggtggtggt ctggttcaag ccggtggttc attaagattg 60 tcctgtgctg cctctggtag aactttcact tctttcgcaa tgggttggtt tagacaagca 120 cctggaaaag agagagagtt tgttgcttct atctccagat ccggtacttt aactagatac 180 gctgactctg ccaagggtag attcactatt tctgttgaca acgccaagaa cactgtttct 240 ttgcaaatgg acaaccttaa cccagatgac accgcagtct attactgtgc cgctgacttg 300 cacagaccat acggtccagg aacccaaaga tccgatgagt acgattcttg gggtcaggga 360 actcaagtca ctgtctcttc aggtggtgga tctggtggtg gaggttcagg tggtggagga 420 tccggtggtg gtggttctgg tggtggtgga tctggtggag gtgaagttca acttgtcgaa 480 tccggtggtg cacttgtcca acctggtgga tctcttagac tttcttgtgc cgcctccggt 540 tttcctgtta accgttactc tatgcgttgg tacagacaag cccctggaaa agaacgtgaa 600 tgggttgccg gaatgtcctc agctggtgac agatcctcct acgaagattc tgtgaaggga 660 cgtttcacca tctccagaga tgacgcccgt aacaccgttt accttcaaat gaactccctt 720 aagcctgagg atactgccgt ctactattgt aacgtgaatg tcggatttga atactgggga 780 cagggaaccc aagttactgt ctcttccggt ggacatcacc accaccatca ctaatag 837 <210> 59 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> signal sequence <220> <221> MISC_FEATURE <222> (3)..(3) <223> X at position 3 is either F or L <220> <221> MISC_FEATURE <222> (16)..(16) <223> X at position 16 is either A or T <400> 59 Met Lys Xaa Ser Thr Asn Leu Ile Leu Ala Ile Ala Ala Ala Ser Xaa 1 5 10 15 Val Val Ser Ala 20 <210> 60 <211> 36 <212> PRT <213> Artificial Sequence <220> <223> leader sequence <220> <221> MISC_FEATURE <222> (3)..(3) <223> X at position 3 is either F or L <220> <221> MISC_FEATURE <222> (16)..(16) <223> X at position 16 is either A or T <400> 60 Met Lys Xaa Ser Thr Asn Leu Ile Leu Ala Ile Ala Ala Ala Ser Xaa 1 5 10 15 Val Val Ser Ala Ala Pro Val Ala Pro Ala Glu Glu Ala Ala Asn His 20 25 30 Leu His Lys Arg 35 <210> 61 <211> 85 <212> PRT <213> Saccharomyces cerevisiae <400> 61 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe 35 40 45 Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu 50 55 60 Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Ser Leu Glu Lys Arg 85 <210> 62 <211> 274 <212> PRT <213> Komagataella pastoris <400> 62 Met Ser Ser Asp Ala Val Glu Gln Leu Glu Asn Phe Gln Leu Ile Lys 1 5 10 15 Phe Asp Arg Phe Asp Pro Ser Thr Gln Ser Thr Ile Arg Ile Ala Arg 20 25 30 Ser Pro Lys Pro Ile Pro Val Lys Val Val Ile Val Gly Asp Gly Gly 35 40 45 Cys Gly Lys Thr Cys Leu Leu Asn Val Phe Ala Thr Gly Thr Phe Pro 50 55 60 Glu Ala Tyr Val Pro Thr Ile Ile Glu Asn Val Val Ile Thr Leu Val 65 70 75 80 Thr Pro Thr Gly Gln Ile Ala Ala Val Thr Leu Trp Asp Thr Ala Gly 85 90 95 Gln Glu Glu Tyr Asp Arg Leu Arg Pro Leu Ser Tyr Ser Asp Val Asp 100 105 110 Val Val Leu Leu Cys Tyr Ser Ile Asp Asn Leu Ser Thr Phe His Asn 115 120 125 Val Ala Asp Lys Trp Tyr Pro Glu Val Ala His Phe Cys Pro Asn Thr 130 135 140 Pro Ile Ile Leu Val Gly Thr Lys Ser Asp Met Arg Arg His Gln Lys 145 150 155 160 Ser Gln Pro His Phe Val Ser Pro Gln Asp Ser Ser Gln Leu Ala Arg 165 170 175 Gln Met Gly Ala Val Met Asn Ile Glu Cys Ser Ala Lys Glu Val Ser 180 185 190 Asn Val Asn Ile Val Phe Asp Ala Ala Val Ser Tyr Cys Leu Ser Asn 195 200 205 Ser Arg Pro Lys Thr Arg Gly Asp Asn Asp Asn Asn Arg Ser Asn Arg 210 215 220 Arg Leu Ser Arg Ala Lys Arg Ala Ser Met Phe Ile Arg Gly Lys Asp 225 230 235 240 Val Ser Ser Thr Ser Gly Asn Ser Arg Glu Glu Leu Val Glu Tyr Asp 245 250 255 Gln Asp Gly Leu Ala Ile Ile Pro Asp Arg Lys Lys Arg Lys Cys Ser 260 265 270 Ile Ile <210> 63 <211> 95 <212> PRT <213> Komagataella pastoris <400> 63 Met Leu Asn Lys Leu Phe Ile Ala Ile Leu Ile Val Ile Thr Ala Val 1 5 10 15 Ile Gly Glu Thr Thr Thr Ser Ser Thr Thr Ala Ser Leu Ser Glu Ser 20 25 30 Pro Thr Leu Val Trp Val Thr Gly Thr Asp Ala Ser Gly Arg Leu Ala 35 40 45 Thr Thr Gln Ser Ala Tyr Thr Gln Gln Phe Ser Gln Leu Tyr Ser Ser 50 55 60 Ile Ala Ser Pro Ser Ser Gly Ser Ile Gly Leu Gly Thr Ile Gln Gly 65 70 75 80 Thr Val Gly Ile Val Arg Thr Tyr Glu Thr Ile Thr Leu Ala Ser 85 90 95 <210> 64 <211> 86 <212> PRT <213> Komagataella pastoris <400> 64 Met Ser Thr Ala Ile Pro Gly Gly Gln Arg Thr Leu Ala Lys Arg Arg 1 5 10 15 Ala Ala Asn Leu Asp Lys Lys Gln Asp Glu Pro Thr Ser Ala Arg Ser 20 25 30 Ala Gly Ala Gly Gly Ser Ser Ser Thr Met Leu Lys Leu Tyr Thr Asp 35 40 45 Glu Ala Gln Gly Leu Lys Val Asp Pro Leu Ile Val Leu Val Leu Ala 50 55 60 Val Gly Phe Ile Phe Ser Val Ile Gly Leu His Val Val Ala Lys Leu 65 70 75 80 Thr Gly Lys Leu Ile Asn 85 <210> 65 <211> 361 <212> PRT <213> Komagataella pastoris <400> 65 Met Thr Pro Arg Ser His Ile Phe Phe Asp Ile Ser Ile Asn Asn Gln 1 5 10 15 Pro Ala Gly Arg Ile Ile Phe Glu Leu Phe Asn Asp Ile Val Pro Lys 20 25 30 Thr Ala Glu Asn Phe Arg Ala Leu Ser Thr Gly Glu Lys Gly Ile Gly 35 40 45 Lys Ser Gly Lys Pro Leu His Tyr Lys Gly Ser Thr Phe His Arg Ile 50 55 60 Ile Lys Asp Phe Met Val Gln Gly Gly Asp Phe Thr Asn Gly Asn Gly 65 70 75 80 Thr Gly Gly Glu Ser Ile Tyr Gly Glu Lys Phe Glu Asp Glu Asn Phe 85 90 95 Gln Leu Thr His Asp Lys Pro Phe Leu Leu Ser Met Ala Asn Ala Gly 100 105 110 Pro Gly Thr Asn Gly Ser Gln Phe Phe Ile Thr Thr Val Pro Thr Pro 115 120 125 His Leu Asp Asn Lys His Val Val Phe Gly Lys Val Ile Ala Gly Lys 130 135 140 Ala Thr Val Arg Lys Ile Glu Arg Asn Ser Glu Gly Glu Ala Pro Ile 145 150 155 160 Glu Pro Val Val Ile Glu Asp Cys Gly Glu Leu Pro Glu Asp Ala Asp 165 170 175 Leu Thr Ile Ser Asp Glu Thr Gly Asp Lys Tyr Glu Glu Val Leu Lys 180 185 190 Asp Asn Glu Asn Ile Asp Ile Asp Asp Phe Glu Gln Val Tyr Gln Ala 195 200 205 Ile Thr Glu Ile Lys Glu Leu Gly Thr Lys Tyr Phe Lys Asn Gly Asp 210 215 220 Thr Lys Ile Ala Phe Glu Lys Tyr Gln Lys Ala Ala Asn Tyr Leu Leu 225 230 235 240 Glu Tyr Ile Pro Ser Asp Leu Ser Glu Glu Gln Ser Ser Lys Leu Glu 245 250 255 Leu Leu Lys Thr Ser Val Phe Ser Asn Val Ala Leu Ala Gly Leu Lys 260 265 270 Val Ser Lys Phe Lys Asp Thr Ile Lys Tyr Ala Thr Leu Val Ile Glu 275 280 285 Asp Glu Ser Ala Asp Ala Lys Ala Lys Ser Lys Gly Tyr Tyr Arg Arg 290 295 300 Gly Ser Ala Tyr Ser Ser Leu Lys Asp Glu Asp Ser Ala Ile Ser Asp 305 310 315 320 Phe Gln Lys Ala Leu Glu Leu Ser Pro Gly Asp Pro Ala Ile Ser Gln 325 330 335 Ser Leu Gln Arg Thr Thr Lys Ala Arg Lys Asp Arg Leu Ala Lys Glu 340 345 350 Lys Ala Ala Leu Ser Lys Phe Phe Glu 355 360 <210> 66 <211> 127 <212> PRT <213> Komagataella pastoris <400> 66 Met Thr Asn Trp Lys Ala Ile Leu Thr Pro Ala Gln Tyr Gln Val Leu 1 5 10 15 Arg Leu Gly Gly Thr Glu Arg Pro Tyr Thr Gly Gln Tyr Val Asn Phe 20 25 30 Lys Lys Asn Gly Thr Tyr Leu Cys Ser Gly Cys Gln Thr Pro Leu Tyr 35 40 45 Lys Ser Gly Thr Lys Phe Asp Ser Ser Cys Gly Trp Pro Ala Phe Tyr 50 55 60 Glu Ala Leu Pro Gly Ala Val Lys Arg Ile Glu Asp Asn Ser Leu Gly 65 70 75 80 Met Arg Arg Ile Glu Ile Arg Cys Ser Lys Cys Asp Gly His Leu Gly 85 90 95 His Val Phe Glu Gly Glu Gly Phe Asp Thr Pro Thr Asp Ser Arg His 100 105 110 Cys Val Asn Ser Ile Ser Leu Lys Phe Gln Gly Glu Glu Glu Asn 115 120 125 <210> 67 <211> 546 <212> PRT <213> Komagataella pastoris <400> 67 Met Ser His Leu Leu Leu Arg Asp Ser Phe Trp Gly Arg Thr Ile Tyr 1 5 10 15 His Leu Ser Lys His Arg Tyr Phe Ser Phe Pro Glu Glu Lys Asp Gly 20 25 30 Phe Ile Ala Pro Glu Lys Tyr Tyr Leu Asn Met Asp Gln Val Ser Ile 35 40 45 His Ala Glu Ser Glu Lys Asn Ile Val Glu Gly Leu Val Asp Thr Ser 50 55 60 Asn Ser Ser Leu Glu Glu Val Lys Thr Thr Arg Val Ile Val Asp Trp 65 70 75 80 Asp Glu Tyr Asp Gln Lys Glu Asn Pro Gln Asn Trp Ser Ser Leu Leu 85 90 95 Lys Cys Phe Val Val Phe Glu Val Gly Ile Leu Thr Val Ala Val Tyr 100 105 110 Met Gly Ser Ala Ile Tyr Thr Pro Gly Ile Glu Asp Ile Met Arg Asp 115 120 125 Leu Asn Val Ser Arg Thr Val Ala Thr Leu Pro Leu Thr Leu Phe Val 130 135 140 Ile Gly Tyr Ala Val Gly Pro Met Ile Phe Ser Pro Met Ser Glu His 145 150 155 160 Pro Ala Ile Gly Arg Thr Thr Ile Tyr Val Trp Thr Leu Phe Ile Phe 165 170 175 Ala Ile Leu Gln Ile Pro Thr Ala Leu Thr Thr Asn Ile Ala Gly Phe 180 185 190 Cys Ile Leu Arg Phe Ile Gly Gly Phe Phe Ala Ser Pro Ala Leu Ala 195 200 205 Thr Gly Pro Ala Ser Val Gly Asp Val Ile Ala Ile Pro His Leu Pro 210 215 220 Val Gly Leu Gly Leu Trp Ser Ile Cys Ala Val Cys Gly Pro Ser Leu 225 230 235 240 Gly Pro Leu Phe Gly Ala Ile Phe Ser Gln Leu Val Ser Trp Arg Trp 245 250 255 Cys Phe Trp Phe Leu Leu Ile Thr Ser Gly Thr Leu Phe Ile Val Leu 260 265 270 Gly Phe Thr Leu Pro Glu Thr Tyr Val Pro Thr Leu Leu Tyr Arg Lys 275 280 285 Ala Arg Arg Leu Arg Ala Leu Thr Lys Asn Glu Leu Ile Ile Ser Lys 290 295 300 Gly Glu Leu Asp Ile Gln Asp Arg Thr Ala Lys Glu Val Leu Ile Glu 305 310 315 320 Cys Leu Trp Arg Pro Val Asp Ile Ser Phe Arg Asp Pro Val Val Leu 325 330 335 Met Ile Asn Leu Tyr Ile Ser Met Val Tyr Ser Ile Trp Tyr Ile Trp 340 345 350 Phe Glu Ala Phe Pro Ile Val Phe Leu Glu Ile Tyr Gly Phe Ser Leu 355 360 365 Ile Gly Met Gly Ala Ser Phe Ala Gly Ile Leu Ile Gly Val Leu Ile 370 375 380 Cys Ser Ala Cys Tyr Cys Tyr Ala Cys His Val Thr Phe Ala Arg Arg 385 390 395 400 Ile Ile Ala Asn Glu Thr Ile His Pro Glu Phe Phe Val Pro Gly Ala 405 410 415 Ile Ile Gly Gly Cys Ile Met Pro Thr Gly Ile Phe Ile Leu Gly Trp 420 425 430 Thr Ala Thr Lys Ser Val His Trp Ile Val Pro Ile Ile Gly Ser Gly 435 440 445 Leu Phe Ala Ala Gly Gly Tyr Leu Ile Phe Gln Thr Leu Phe Asn Tyr 450 455 460 Leu Ala Met Ser Phe Pro Arg Tyr Met Ala Ser Ala Phe Ala Gly Asn 465 470 475 480 Asp Leu Phe Arg Ser Phe Ser Ala Ser Val Phe Pro Leu Phe Gly His 485 490 495 Ala Leu Tyr Ala Asn Leu Gly Ser Glu Lys Phe Pro Val Gly Trp Gly 500 505 510 Ser Ser Val Leu Gly Phe Ile Thr Val Ala Met Ile Ala Ile Pro Val 515 520 525 Thr Phe Met Arg Tyr Gly Pro Arg Leu Arg Ala Asn Ser Arg Tyr Ala 530 535 540 Gly Pro 545 <210> 68 <211> 355 <212> PRT <213> Komagataella pastoris <400> 68 Met Thr Asp Tyr Val Thr Ser Lys Arg Pro Asp Asn Val Leu Asn Trp 1 5 10 15 Thr Ser Ile His Val Ser Ser Trp Ile Gly Glu Thr Ile Pro Glu Ile 20 25 30 Asp Pro Ser Leu Leu Gln Asn Phe Leu Glu His Asp Ile Ala Gly Asp 35 40 45 Val Leu Pro Tyr Leu Lys Ser Glu Asp Leu Lys Glu Ile Gly Ile Asn 50 55 60 Glu Leu Lys His Arg Ile Ser Ile Lys Lys Asn Ile His Glu Leu Leu 65 70 75 80 Val Ser Asn Glu Lys His Ile Asp Thr Ser Ile Leu Ser Asp Thr Ala 85 90 95 Thr Glu Leu Gly Thr Leu Ile Leu Thr Asn Lys Phe Ile Thr Gln Met 100 105 110 Ala Asn Arg Lys Asn Val Val Asp Asp Ser Thr His His Ser Asn Asn 115 120 125 Arg Arg Leu Thr Glu Gln Phe Asn Lys Leu Arg Lys Asp Leu Leu Pro 130 135 140 Ile Phe Lys Trp Ile Lys Glu Thr Gln Pro Leu Pro Thr Pro Glu Asn 145 150 155 160 Thr His Phe Ala Asn Met Gly Ser Val Pro Ala Ser Pro Val Glu His 165 170 175 Thr Ser Gly Glu Ser Thr Leu Ser Asn Pro Ser Leu Ser Thr Ile Asn 180 185 190 Ala Gly Glu Gly Val Asn Ser Ala Val Ala Gly Gln Ser Leu Gly Arg 195 200 205 Lys Pro Thr Leu Ser Ser Arg Arg Gln Ser His Ala Leu Ser Pro Thr 210 215 220 Gly Glu His Leu Asn Val Ser Ser Ser Ser Pro Ser Thr Gly Asn Phe 225 230 235 240 Glu Thr Leu Asn Gly Glu Arg Pro Asn Leu Arg Ser Ala Ser Ser Gly 245 250 255 Ser Gln Glu His Thr Glu Asn Glu Leu Leu Lys Pro Leu Arg Val Lys 260 265 270 Ala Asp Glu Pro Cys Tyr Lys Val Ile Gln Asn Ala Met Lys Arg His 275 280 285 Gly Leu Ser Val Asp Asp Trp Arg Lys Tyr Ala Leu Val Ile Cys Tyr 290 295 300 Gly Asp Glu Glu Arg Val Leu Gly Leu His Glu Lys Pro Gly Ser Ile 305 310 315 320 Phe Lys Glu Leu Lys Asp Gln Lys Gln Asn Pro Ala Ile Met Leu Arg 325 330 335 Gln Ile Asp Thr Asn Asn Asp Asp Gln Asn His Ile Glu Thr Pro Gly 340 345 350 Gly Arg Leu 355 <210> 69 <211> 1027 <212> PRT <213> Komagataella pastoris <400> 69 Met Thr Thr Asn Gly Gln Lys Arg Gln Lys Thr Arg Lys Pro Leu Leu 1 5 10 15 Ile Asn Ala Phe Val Met Gly Cys Ala Gly Leu Gln Asn Pro Gly Leu 20 25 30 Trp Lys His Pro Lys Asp Ser Ser His Arg Phe Asn Gln Ile Asp His 35 40 45 Trp Thr Tyr Leu Ala Lys Leu Ala Glu Lys Gly Lys Phe Asn Ala Leu 50 55 60 Phe Ile Ala Asp Val Leu Gly Gly Tyr Asp Val Tyr Lys Gly Pro Glu 65 70 75 80 Asn Leu Ala Thr Pro Ala Val Ala Gly Ala Gln Trp Pro Val Thr Glu 85 90 95 Pro Ser Ala Val Val Ser Ala Met Ala Ala Val Thr Thr Asn Leu Ala 100 105 110 Phe Gly Val Thr Phe Ser Thr Ile Ser Glu Ala Pro Tyr His Phe Ala 115 120 125 Arg Arg Leu Ser Thr Leu Asp His Leu Thr Lys Gly Arg Ile Gly Trp 130 135 140 Asn Val Val Ser Ser Tyr Leu Glu Ser Ala Ala Arg Asn Leu Leu Asn 145 150 155 160 Gly Glu Lys Leu Asp Glu His Asp Gln Arg Tyr Leu Lys Ala Glu Glu 165 170 175 Tyr Ile Gln Ile Val Tyr Glu Leu Leu Leu Ser Ser Trp Arg Asp Asp 180 185 190 Ala Val Val Leu Asp Lys Lys Ala Gly Val Tyr Thr Asp Pro Thr Arg 195 200 205 Phe Arg Lys Ile Asn Phe Glu Gly Lys Phe Phe Lys Val Pro Gly Pro 210 215 220 His Ile Val Asp Pro Thr Pro Gln Arg Leu Pro Val Ile Leu Gln Ala 225 230 235 240 Gly Thr Ser Lys Val Gly Lys Glu Phe Ala Ala Lys His Ala Glu Ile 245 250 255 Val Phe Val Ile Ser Phe Ser Pro Asp Asp Leu Lys Pro Lys Ile Ala 260 265 270 Glu Val Arg Gln Leu Ala Lys Glu Lys Phe Gly Arg Asn His Asp Asp 275 280 285 Ile Lys Phe Val Ala Leu Ala Thr Pro Val Ile Gly Ala Thr His Glu 290 295 300 Leu Ala Glu Glu Lys Tyr Gln Glu Leu Leu Ser Tyr Gly Asp Ile Glu 305 310 315 320 Gly Ala Gln Ala Leu Phe Gly Gly Trp Thr Gly Ile Asp Leu Ser Gln 325 330 335 Tyr Gly Glu Asp Glu Glu Leu Gly Asn Val Ser Ser Asn Ala Met Arg 340 345 350 Gly Ala Val Gln Asn Trp Thr Lys Ala Ile Pro Asn Glu Lys Arg Trp 355 360 365 Thr Arg Lys Val Ile Ala Lys Gln Ile Thr Val Gly Gly Leu Gly Pro 370 375 380 Ala Phe Val Gly Thr Pro Glu Glu Ile Ala Asp Glu Leu Glu His Trp 385 390 395 400 Ser Asp His Ala Gly Leu Asp Gly Phe Asn Phe Thr Tyr Ala Val Asn 405 410 415 Pro Leu Ser Phe Glu Glu Ile Val Glu Asp Leu Ile Pro Val Leu Gln 420 425 430 Arg Arg Gly Leu Ala Gln Lys Glu Tyr Pro Asn Pro Glu Thr Gly Ser 435 440 445 Thr Phe Arg Lys Asn Leu Phe Gly Thr Asp Phe Val Pro Ser Thr His 450 455 460 Pro Ala Tyr Asn Leu Arg Trp Arg Ala Gly Val Ser Lys Glu Glu Phe 465 470 475 480 Glu Lys Ser Leu Asn Ala Thr Thr Asn Trp Tyr Ser Ser Phe Ala Arg 485 490 495 Ser Gly Ala Leu Gly Glu Leu His Asn Thr Cys Arg Ile Leu Tyr Leu 500 505 510 Gln Ile Val Lys Tyr Lys Tyr Arg Leu Arg Val Arg Ser Glu Gly Asn 515 520 525 Ser Ile Pro Phe Ala Lys Met Thr Lys Glu Asn Glu Ala Lys Arg Gln 530 535 540 Lys Thr Ser Gln Pro Lys Ala Lys Lys Gln Leu Ile Ile Asn Ala Phe 545 550 555 560 Met Ser Gly Ser Ser Gly Asn Gln Ser Pro Gly Leu Trp Ser Tyr Pro 565 570 575 Gly Asp Lys Ser Thr Glu Tyr Thr Thr Leu Asp Tyr Trp Val Glu Leu 580 585 590 Ala Gln Lys Leu Glu Lys Ala Lys Phe His Ser Ile Phe Ile Ala Asp 595 600 605 Val Leu Gly Gly Tyr Asp Val Tyr Asn Gly Pro Gly Asn Tyr Ser Ala 610 615 620 Ala Ala Lys Ser Gly Ala Gln Phe Pro Met Ile Glu Pro Ser Ala Ala 625 630 635 640 Val Thr Ala Met Ala Ala Ala Thr Lys Ser Ile Thr Phe Gly Val Thr 645 650 655 Phe Ser Thr Ile Ser Glu Ala Pro Tyr His Phe Ala Arg Arg Leu Gly 660 665 670 Thr Leu Asp Leu Leu Thr Asn Gly Arg Val Gly Trp Asn Ile Val Ser 675 680 685 Ser Tyr Leu Asp Ser Ala Ala Arg Asn Leu Leu Asn Gly Glu Pro Leu 690 695 700 Pro Leu His Ala Asp Arg Tyr Lys Arg Ala Glu Glu Phe Leu Gln Val 705 710 715 720 Val Tyr Arg Leu Phe Leu Ser Ser Trp Arg Asp Asp Ala Tyr Lys Leu 725 730 735 Asp Lys Lys Thr Arg Thr Phe Ala Asp Pro Lys Leu Ile Arg Thr Ile 740 745 750 Asp His Val Gly Glu Phe Phe Asn Val Pro Gly Pro Gln Phe Leu Pro 755 760 765 Pro Thr Pro Gln Arg Leu Pro Leu Ile Leu Gln Ala Gly Thr Ser Lys 770 775 780 Val Gly Met Asp Tyr Ala Ala Lys His Ala Glu Val Val Phe Leu Ala 785 790 795 800 Ser Phe Asp Pro Glu Ser Leu Gln Glu Lys Ile Lys Thr Val Arg Asp 805 810 815 Ile Ala Glu Thr Lys Tyr Asn Arg Pro Arg Asp Ser Ile Lys Phe Leu 820 825 830 Ile Leu Ile Thr Val Val Ile Ala Asp Thr His Glu Asp Ala Val Lys 835 840 845 Arg Tyr Glu Asp Leu Ala Ser Tyr Ala Asp Leu Glu Gly Ala Gln Ala 850 855 860 Leu Phe Ser Gly Trp Thr Gly Ile Asp Ile Gly Lys Tyr Gly Glu Asp 865 870 875 880 Glu Pro Leu Glu His Val Glu Ser Asn Ala Ile Lys Ser His Val Lys 885 890 895 Asn Trp Thr Lys Phe Lys Asp Asn Lys Pro Arg Ala Arg Lys Asp Ile 900 905 910 Ala Lys Gln Ile Gly Val Gly Gly Ser Gly Pro Leu Leu Val Gly Ser 915 920 925 Val Gln Glu Ile Ala Asp Glu Leu Glu Arg Trp Ala Glu Val Ser Asp 930 935 940 Leu Asp Gly Phe Asn Phe Ala Tyr Ala Asp Tyr Pro Gln Thr Phe Asp 945 950 955 960 Asp Ile Ile Glu Lys Leu Leu Pro Glu Leu Asn Lys Arg Gly Val Phe 965 970 975 Trp Asp Asp Tyr Lys Ile Pro Gly Gly Thr Phe Arg Glu Ser Val Phe 980 985 990 Gly Arg Lys Phe Val Asp Lys Asp His Pro Ala Tyr Asp Leu Arg Trp 995 1000 1005 Arg Ser Asp Gln Thr Arg Glu Glu Phe Glu Lys Lys Leu Ala Glu 1010 1015 1020 Leu Glu Lys Lys 1025 <210> 70 <211> 194 <212> PRT <213> Komagataella pastoris <400> 70 Met Arg Phe Ser Asn Val Val Leu Thr Ala Ile Ala Ala Ala Gly Val 1 5 10 15 Gln Ala Asp Glu Ala Leu Tyr Thr Val Phe Tyr Asn Asp Val Thr Glu 20 25 30 Asn Ala Gln Glu Tyr Leu Ser Tyr Ile Gln Ala Asn Thr Ala Ala Gly 35 40 45 Phe Thr Asp Leu Leu Ser Leu Tyr Thr Glu Leu Ala Thr Tyr Thr Asp 50 55 60 Asp Ser Tyr Thr Ser Ile Phe Thr Glu Glu Asp Phe Pro Ala Ser Glu 65 70 75 80 Leu Ser Ser Phe Val Val Asn Leu Pro Trp Tyr Ser Ser Arg Ile Glu 85 90 95 Pro Gln Val Ala Ala Ala Glu Thr Gly Glu Ser Glu Glu Glu Ser Glu 100 105 110 Thr Gly Glu Ser Glu Glu Glu Ser Glu Thr Gly Glu Glu Thr Glu Thr 115 120 125 Glu Thr Gly Ser Glu Ser Glu Ser Glu Ser Glu Ser Glu Thr Ser Ala 130 135 140 Thr Gly Thr Gly Thr Gly Thr Ser Ala Ser Glu Ser Ala Glu Thr Glu 145 150 155 160 Thr Ser Thr Asp Ala Ala Val Ser Ile Asp His Pro Lys Ser Thr Leu 165 170 175 Leu Met Gly Leu Thr Ala Ala Val Val Ser Ile Thr Phe Gly Val Phe 180 185 190 Ala Leu <210> 71 <211> 478 <212> PRT <213> Komagataella pastoris <400> 71 Met Ser Ser Phe Arg Val Leu Asp Leu Val Lys Pro Phe Thr Pro Phe 1 5 10 15 Leu Pro Glu Val Ile Ser Pro Glu Arg Lys Val Pro Phe Gln Gln Lys 20 25 30 Leu Met Trp Thr Gly Val Thr Leu Leu Ile Phe Leu Val Met Ser Glu 35 40 45 Ile Pro Leu Tyr Gly Ile Thr Ser Ser Asp Ser Ser Asp Pro Leu Phe 50 55 60 Trp Leu Arg Met Met Leu Ala Ser Asn Arg Gly Thr Leu Met Glu Leu 65 70 75 80 Gly Ile Ser Pro Ile Val Thr Ser Gly Met Val Phe Gln Leu Leu Gln 85 90 95 Gly Ile Gln Ile Leu Asp Val Asn Met Glu Asn Lys Ala Asp Arg Glu 100 105 110 Leu Phe Gln Thr Ala Gln Lys Val Phe Ala Ile Leu Leu Ser Ile Gly 115 120 125 Gln Ala Thr Val Tyr Val Leu Thr Gly Met Tyr Gly Pro Pro Gly Glu 130 135 140 Leu Gly Val Gly Val Cys Leu Leu Leu Val Leu Gln Leu Val Phe Ala 145 150 155 160 Gly Ile Val Val Ile Leu Leu Asp Glu Leu Leu Gln Lys Gly Tyr Gly 165 170 175 Leu Gly Ser Gly Ile Ser Leu Phe Met Ala Thr Asn Ile Cys Glu Gln 180 185 190 Ile Phe Trp Lys Thr Phe Ala Pro Thr Thr Val Asn Arg Gly Arg Gly 195 200 205 Lys Glu Phe Glu Gly Ala Phe Ile Ser Phe Phe His Leu Ile Leu Thr 210 215 220 Lys Lys Asp Lys Lys Arg Ala Leu Leu Glu Ser Phe Tyr Arg Asp Asn 225 230 235 240 Ala Pro Asn Met Phe Gln Val Ile Ala Thr Leu Val Val Phe Phe Thr 245 250 255 Val Val Tyr Leu Gln Gly Phe Arg Leu Glu Ile Pro Val Lys Ser Thr 260 265 270 Arg Gln Arg Gly Pro Tyr Gly Thr Tyr Pro Ile Arg Leu Phe Tyr Thr 275 280 285 Ser Asn Met Pro Ile Met Leu Gln Ser Ala Leu Thr Ser Asn Ile Phe 290 295 300 Ile Ile Ser Gln Met Leu Tyr Ser His Phe Pro Asp Asn Ala Phe Val 305 310 315 320 Lys Leu Ile Gly Thr Trp Glu Ala Gln Pro Gly Ser Ala Gln Leu Phe 325 330 335 Ala Ala Ser Gly Leu Ala Tyr Tyr Met Gln Pro Pro Met Ser Leu Ser 340 345 350 Gln Ala Leu Leu Asp Pro Ile Lys Thr Val Val Tyr Val Val Phe Val 355 360 365 Leu Thr Thr Cys Ala Ile Phe Ser Lys Thr Trp Ile Glu Ile Ser Gly 370 375 380 Ser Ser Pro Arg Asp Val Ala Lys Gln Phe Lys Asp Gln Gly Leu Val 385 390 395 400 Ile Ala Gly His Arg Asp Ala Thr Val Tyr Lys Glu Leu Lys Lys Ile 405 410 415 Ile Pro Thr Ala Ala Ala Phe Gly Gly Ala Thr Ile Gly Ala Leu Ser 420 425 430 Val Val Ser Asp Leu Leu Gly Thr Leu Gly Ser Gly Thr Ser Ile Leu 435 440 445 Leu Ala Val Thr Thr Ile Tyr Gly Tyr Tyr Glu Leu Ala Val Lys Glu 450 455 460 Gly Gly Phe Ser Lys Gly Gly Pro Ser Gly Phe Val Asp Leu 465 470 475 <210> 72 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 72 cgaacatcca tcaccaaaac ac 22 <210> 73 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 73 gttgtcgacc tgcagcgtac ggtgttgccg cgaaatg 37 <210> 74 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 74 taggtgatat cagatccact gatcaatttg cccaagagac g 41 <210> 75 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 75 gactgttgcg attgctggtg 20 <210> 76 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 76 catttcgcgg caacaccgta cgctgcaggt cgacaac 37 <210> 77 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 77 cggtgagaat ggcaaaagct tat 23 <210> 78 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 78 aagcccgatg cgccagagtt g 21 <210> 79 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 79 cgtctcttgg gcaaattgat cagtggatct gatatcacct a 41 <210> 80 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 80 atccaggaca cgctcatcaa g 21 <210> 81 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 81 tgtaacgtga atgtcggatt tg 22 <210> 82 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 82 tagtgatggt ggtggtgatg 20 <210> 83 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 83 cctgaggctt tgttccaccc act 23 <210> 84 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 84 ggaacatagt agcaccggca taacga 26 <210> 85 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> translation initiation site <400> 85 cctgcaggcc 10 <210> 86 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> translation initiation site <220> <221> misc_feature <222> (1)..(6) <223> n at positions 1-6 is any nucleic acid, preferably A <220> <221> misc_feature <222> (8)..(9) <223> n at positions 8-9 is any nucleic acid, preferably A <400> 86 nnnnnnann 9

Claims

서열번호:1로 식별된 아미노산 서열을 포함하는 FLO8 단백질 또는 이의 상동체를 암호화하는 내인성 유전자를 포함하며, 하나 이상의 유전적 변형 전의 숙주 세포와 비교하여 상기 유전자의 발현을 감소시키기 위해 상기 하나 이상의 유전적 변형에 의해 조작되고, 비-메탄올 탄소 공급원에 의해 억제가능한 발현 카세트 프로모터(ECP)의 제어 하에 관심 유전자(GOI)를 포함하는 이종 발현 카세트를 포함하는, 재조합 숙주 세포.
상기 내인성 폴리뉴클레오티드가 상기 FLO8 단백질을 암호화하는 유전자이고, 상기 하나 이상의 유전적 변형이 (i) 하나 이상의 내인성 폴리뉴클레오티드, 또는 이의 일부의 파괴, 치환, 결실 또는 녹아웃; 또는 (ii) 발현 제어 서열을 포함하며, 바람직하게는 상기 발현 제어 서열이 프로모터, 리보솜 결합 부위, 전사 또는 번역 시작 및 중지 서열, 인핸서 및 활성인자 서열로 이루어진 군으로부터 선택되는, 숙주 세포.
제1항 또는 제2항에 있어서, 상기 FLO8 단백질 또는 상기 상동체를 암호화하는 상기 내인성 유전자가 상기 하나 이상의 유전적 변형에 의해 녹아웃되는, 숙주 세포.
제1항 내지 제3항 중 어느 한 항에 있어서, 상기 ECP가 성장-제한량의 비-메탄올 탄소 공급원의 존재 하에, 바람직하게는 메탄올의 부재 하에 유도가능하고; 성장-제한량보다 높은 과량의 비-메탄올 탄소 공급원의 존재 하에 억제가능한, 숙주 세포.
제1항 내지 제4항 중 어느 한 항에 있어서, 상기 ECP가 서열 서열번호:10-16 중 임의의 하나, 또는 서열번호:41-45 중 임의의 하나의 적어도 300 nt에 대해 적어도 60% 서열 동일성을 포함하는, 숙주 세포.
제5항에 있어서, 상기 ECP가 서열번호:10 또는 서열번호:11을 포함하거나 또는 이로 이루어지는, 숙주 세포.
제1항 내지 제6항 중 어느 한 항에 있어서, 상기 발현 카세트가 GOI에 의해 암호화된 관심 단백질(POI)의 분비를 가능하게 하는 신호 펩티드를 암호화하는 뉴클레오티드 서열을 추가로 포함하며, 바람직하게는 여기서 신호 펩티드를 암호화하는 뉴클레오티드 서열은 GOI의 5'-단부에 인접하게 융합되는, 숙주 세포.
제1항 내지 제7항 중 어느 한 항에 있어서, 상기 GOI가 항원 결합 단백질, 치료 단백질, 효소, 펩티드, 단백질 항생제, 독소 융합 단백질, 탄수화물 - 단백질 접합체, 구조적 단백질, 조절 단백질, 백신 항원, 성장 인자, 호르몬, 사이토카인, 공정 효소, 및 대사 효소로 이루어진 군으로부터 선택된 펩티드 또는 단백질인 관심 단백질(POI)을 암호화하는, 숙주 세포.
제1항 내지 제8항 중 어느 한 항에 있어서,
a) 피키아, 한세눌라, 코마가타엘라, 사카로마이세스, 클루이베로마이세스, 칸디다, 오가타에아, 야로위아, 및 지오트리쿰, 예컨대 피키아 파스토리스, 코마가타엘라 파피이, 코마가타엘라 파스토리스, 코마가타엘라 슈도파스토리스, 사카로마이세스 세레비지애, 오가타에아 미누타, 클루이베롬세스 락티스, 클루이베로메스 마르시아누스, 야로위아 리폴리티카 또는 한세눌라 폴리모르파로 이루어진 군으로부터 선택된 속의 효모 세포; 또는
b) 사상성 진균, 예컨대 아스페르길루스 아와모리 또는 트리코더마 레세이의 세포인, 숙주 세포.
상기 숙주 세포에서 서열번호:1로 식별된 아미노산 서열을 포함하는 FLO8 단백질 또는 이의 상동체를 암호화하는 유전자의 발현을 감소시킴으로써, 비-메탄올 탄소 공급원에 의해 억제가능한 프로모터의 제어 하에 관심 단백질(POI)을 암호화하는 관심 유전자(GOI)를 발현하는 숙주 세포에 의해 생산된 상기 POI의 수율을 증가시키는 방법.
관심 단백질(POI)을 생산하는 조건 하에 제1항 내지 제9항 중 어느 한 항의 숙주 세포를 배양함으로써 관심 유전자(GOI)에 의해 암호화된 상기 POI를 생산하는 방법.
제10항 또는 제11항에 있어서, 하기 단계를 포함하는, 방법:
a) 성장 조건 하에 숙주 세포를 배양하는 단계; 및
b) 최대 1 g/L의 제2 비-메탄올 탄소 공급원의 존재 하에 성장-제한 조건 하에 숙주 세포를 배양하여, 상기 GOI의 발현을 초래하여 상기 POI를 생산하는 단계로, 여기서 바람직하게는 상기 단계 a) 배양은 회분 단계에서 수행되고; 상기 단계 b) 배양은 유가 또는 연속 배양 단계.
제12항에 있어서, 상기 제1 또는 제2 탄소 공급원이 사카라이드, 폴리올, 알코올, 또는 전술한 것 중 임의의 하나 이상의 혼합물로부터 선택되는, 방법.
하기 단계를 포함하는, 숙주 세포에서 관심 단백질(POI)을 생산하는 방법:
a) 서열번호:1로 식별된 아미노산 서열을 포함하는 FLO8 단백질 또는 이의 상동체를 암호화하는 내인성 유전자의 발현을 감소시키도록 숙주 세포를 유전적으로 조작하는 단계;
b) 관심 유전자(GOI)에 작동가능하게 연결된, 비-메탄올 탄소 공급원에 의해 억제가능한 발현 카세트 프로모터(ECP)의 제어 하에 상기 POI를 발현하는 상기 GOI를 포함하는 이종 발현 카세트를 숙주 세포에 도입하는 단계;
c) 상기 POI를 생산하기 위한 조건 하에 상기 숙주 세포를 배양하는 단계;
d) 임의적으로 세포 배양물로부터 상기 POI를 단리하는 단계; 및
e) 임의적으로 상기 POI를 정제하는 단계.
제14항에 있어서, 상기 ECP가 서열 서열번호:10-16 중 임의의 하나, 또는 서열번호:41-45 중 임의의 하나의 적어도 300 nt에 대해 적어도 60% 서열 동일성을 포함하는, 방법.