KR20200120908A - 목적 단백질을 생산하기 위한 숙주 세포 - Google Patents

목적 단백질을 생산하기 위한 숙주 세포 Download PDF

Info

Publication number
KR20200120908A
KR20200120908A KR1020207023186A KR20207023186A KR20200120908A KR 20200120908 A KR20200120908 A KR 20200120908A KR 1020207023186 A KR1020207023186 A KR 1020207023186A KR 20207023186 A KR20207023186 A KR 20207023186A KR 20200120908 A KR20200120908 A KR 20200120908A
Authority
KR
South Korea
Prior art keywords
ser
host cell
thr
ala
val
Prior art date
Application number
KR1020207023186A
Other languages
English (en)
Inventor
카트리엔 클레스
제임스 그레이엄
실비아 요즈비악
크리스토프 키지악
Original Assignee
론자 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 론자 리미티드 filed Critical 론자 리미티드
Publication of KR20200120908A publication Critical patent/KR20200120908A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • C07K14/39Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • C12N15/815Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Mycology (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biomedical Technology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

이종 목적 단백질 (POI)를 생산하기 위해 조작되며, 3개의 상이한 내인성 숙주 세포 단백질 (HCP) 중 적어도 하나의 생산이 감소되도록 유전적으로 변형되는 진핵 숙주 세포, 및 그의 POI 생산 방법에서의 용도.

Description

목적 단백질을 생산하기 위한 숙주 세포
본 발명은 진핵 숙주 세포 내 단백질 생산에 관한 것으로, 숙주 세포는 숙주 세포 배양물 내 불순물이 감소되도록 조작된다.
진핵 세포 배양물에서 생산된 단백질은 진단 및 치료제로서 점차 중요해지고 있었다. 이를 위해, 세포는 매우 높은 수준의 재조합 또는 이종 목적 단백질을 생산하도록 조작 및/또는 선택된다. 세포 배양 조건의 최적화는 재조합 또는 이종 단백질의 성공적인 상업적 생산에 중요하다. 숙주 세포 단백질 (HCP)로서 숙주 세포로부터 방출되고 배양물에 축적된 부산물은 재조합 또는 이종 단백질의 정제에 어려움을 주며 제품 효능 또는 환자 안전에 위험을 초래할 수 있다.
포유류 숙주 세포 외에, 효모 및 사상성 진균은 생약학적 단백질 및 벌크 화학물질의 생산 숙주로서 일반적으로 사용된다. 피키아 파스토리스 (Pichia pastoris)와 같은 메탄올자화성 효모는 이종 단백질의 효율적인 분비로 잘 알려져 있다. 피키아 파스토리스는 새로운 속, 코마가타엘라 (Komagataella)로 재분류되었으며, 3가지 종, 코마가타엘라 파스토리스 (K. pastoris), 코마가타엘라 파피이 (K. phaffii), 및 코마가타엘라 슈도파스토리스 (K. pseudopastoris)로 나뉜다. 생명공학 응용에 일반적으로 사용되는 균주는 2가지 제안된 종, 코마가타엘라 파스토리스 (K. pastoris) 및 코마가타엘라 파피이 (K. phaffii)에 속한다. 균주 GS115, X-33, CBS2612, 및 CBS7435는 코마가타엘라 파피이인 반면, SMD 계열의 프로테아제 결핍 균주 (예를 들어, SMD1168)는 모식종 (type strain)인 코마가타엘라 파스토리스로 분류되며, 이는 모든 이용가능한 피키아 파스토리스 (P. pastoris) 균주에 대한 레퍼런스 균주이다 (Mattanovich et al. 2009, Microb Cell Fact. 8: 29; Kurtzman 2009, J Ind Microbiol Biotechnol. 36(11): 1435-8).
코마가타엘라 (피키아) 파스토리스의 생명공학적 균주는 다중유전자 서열 분석으로부터 결정된 코마가타엘라 파피이이다.
문헌 [Mattanovich et al., Microbial Cell Factories 2009, 8: 29 doi:10.1186/1475-2859-8-29]은 코마가타엘라 파스토리스 (K. pastoris)의 모식종 DSMZ 70382의 게놈 시퀀싱을 기술하며, 그의 분비체 (secretome) 및 당 수송체를 분석하였다.
문헌 [Huang et al., Appl Microbiol Biotechnol. 2011 Apr; 90(1): 235-47. doi: 10.1007/s00253-011-3118-5. Epub 2011 Feb 9]은 메탄올-유도 배양에서 피키아 파스토리스 분비체의 단백질학 분석을 기술하며, 피키아 파스토리스 X-33의 메탄올-유도 발효 배양물 내 배양 배지로 분비 또는 방출된 단백질을 확인하였다.
문헌 [Heiss et al., Appl Microbiol Biotechnol. 2013 Feb; 97(3): 1241-9. doi: 10.1007/s00253-012-4260-4. Epub 2012 Jul 17]은 세포외 단백질 X 1 (Epx1)을 항체 Fab 단편을 생산하는 피키아 파스토리스의 주된 오염 숙주 세포 단백질로서 확인하였다. EPX1은 일반적으로는 상향조절되지 않으나 상이한 스트레스 상황에서만 상향조절되는 것으로 밝혀졌다. 각 결실 균주 (Δepx1)가 생산되었으며 세포벽 손상제인 화이트 및 콩고 레드에 대해 야생형보다 더 민감한 것으로 밝혀졌는데, 이는 Epx1이 세포벽 보호 역할을 할 수 있음을 나타낸다. 성장 및 산물 형성에 있어 야생형과 Δepx1 균주 사이에 유의한 차이는 발견되지 않았다.
그러나 본 발명자들은 Epx1p가 피키아 파스토리스 세포 배양물에서 총 HCP의 약 3% (mol/mol) 미만의 양으로, 매우 풍부한 단백질이 아님을 밝혔다.
HCP는 생산 공정에 사용되는 세포 또는 유기체에 의해 생산 또는 암호화되며, 의도된 산물과 관련이 없는 단백질이다. 일부는 성장, 생존, 및 정상적인 세포 가공에 필요하나 나머지는 필수적이지 않을 수 있다. 유용성, 또는 그의 결핍과 상관없이, HCP는 일반적으로 최종 약물 물질에서 바람직하지 않다. 일반적으로 소량 (ppm, 의도된 단백질의 밀리그램 당 나노그램으로 표현됨)으로 존재함에도 불구하고 이를 제거하는데 산업에서 많은 노력과 비용이 든다.
이종 및/또는 재조합 단백질의 생산 및/또는 정제에 적절한 개선된 숙주 세포를 개발할 필요가 있다.
본 발명의 목적은 재조합 또는 이종 단백질을 생산할 때 감소된 수준의 HCP 불순물을 발생시키도록 변형된 숙주 세포를 제공하는 것이다. 본 발명의 다른 목적은 숙주 세포 내 재조합 또는 이종 단백질을 생산하는 방법을 제공하는 것으로, 여기서 재조합 또는 이종 단백질이 HCP 불순물로 오염될 가능성이 감소된다.
목적은 청구된 대상에 의해 해결된다.
본 발명에 따르면, 이종 목적 단백질 (POI)을 생산하도록 조작된 진핵 숙주 세포가 제공되며, 세포는 제1 HCP (HCP1), 제2 HCP (HCP2), 및 제3 HCP (HCP3)로 이루어지는 군에서 선택되는 적어도 하나의 내인성 숙주 세포 단백질 (HCP)의 생산이 감소되도록 유전적으로 변형되고, 여기서
a) HCP1은, 숙주 세포가 코마가타엘라 파피이 (Komagataella phaffii)인 경우 서열번호 1로 식별되는 아미노산 서열, 또는 숙주 세포가 다른 종인 경우 그 숙주 세포에 내인성인 서열번호 1로 식별되는 아미노산 서열의 상동 서열을 포함하고;
b) HCP2는, 숙주 세포가 코마가타엘라 파피이인 경우 서열번호 3으로 식별되는 아미노산 서열, 또는 숙주 세포가 다른 종인 경우 그 숙주 세포에 내인성인 서열번호 3으로 식별되는 아미노산 서열의 상동 서열을 포함하며; 그리고
c) HCP3은, 숙주 세포가 코마가타엘라 파피이인 경우 서열번호 5로 식별되는 아미노산 서열, 또는 숙주 세포가 다른 종인 경우 그 숙주 세포에 내인성인 서열번호 5로 식별되는 아미노산 서열의 상동 서열을 포함한다.
특정 양태에 따르면, 세포는 HCP4인 추가 HCP의 생산이 감소되도록 추가로 유전적으로 변형되며, 여기서
d) HCP4는, 숙주 세포가 코마가타엘라 파피이인 경우 서열번호 7로 식별되는 아미노산 서열, 또는 숙주 세포가 다른 종인 경우 그 숙주 세포에 내인성인 서열번호 7로 식별되는 아미노산 서열의 상동 서열을 포함한다.
구체적으로, 상기 적어도 하나의 HCP는 HCP1, HCP2, HCP3 중 어느 하나, 둘 또는 셋을 포함한다. 나아가, 상기 적어도 하나의 HCP는 구체적으로 HCP4를 포함한다.
구체적으로, 상기 적어도 하나의 HCP는 HCP1, 및 선택적으로 또는 추가적으로 HCP2 및/또는 HCP3 및/또는 HCP4이다. 특정 실시양태는 HCP1을 포함하는 2 이상의 HCP의 감소를 언급한다. 구체적으로, 상기 적어도 하나의 HCP는 HCP1, 및 HCP2, HCP3, 또는 HCP4 중 어느 하나, 둘 또는 셋을 포함한다.
더 구체적으로, 상기 적어도 하나의 HCP는 HCP2, 및 선택적으로 HCP1 및/또는 HCP3 및/또는 HCP4이다.
더 구체적으로, 상기 적어도 하나의 HCP는 HCP3, 및 선택적으로 HCP1 및/또는 HCP2 및/또는 HCP4이다.
특정 실시양태는 2 이상의 HCP, 예를 들어, HCP1 및 HCP2, 또는 HCP1 및 HCP3, 또는 HCP2 및 HCP3의 감소를 언급한다.
특정 실시양태는 HCP1 및 HCP4, 또는 HCP2 및 HCP4, 또는 HCP3 및 HCP4 중 어느 하나의 감소를 포함하는, 2 이상의 HCP의 감소를 언급한다.
구체적으로, 서열번호 1, 3, 5, 및 7은 각각 코마가타엘라 파피이 (K. phaffii)의 야생형 (천연의) 내인성 서열이다.
구체적으로, 각각의 상동 서열은 코마가타엘라 파피이 외의 종, 예를 들어, 효모 또는 사상성 진균 세포, 바람직하게 코마가타엘라 (Komagataella) 또는 피키아 (Pichia) 속의 효모, 또는 사카로마이세스 (Saccharomyces) 속 또는 임의의 메탄올자화성 효모의 것이다.
특정 양태에 따르면, 숙주 세포는
a) 피키아 파스토리스 (Pichia pastoris), 코마가타엘라 파피이, 코마가타엘라 파스토리스 (Komagataella pastoris), 코마가타엘라 슈도파스토리스 (Komagataella pseudopastoris), 사카로마이세스 세레비지애 (Saccharomyces cerevisiae), 오가타에아 미누타 (Ogataea minuta), 클루이베로마이세스 락티스 (Kluyveromces lactis), 클루이베로마이세스 마르시아누스 (Kluyveromes marxianus), 야로위아 리폴리티카 (Yarrowia lipolytica) 또는 한세눌라 폴리모르파 (Hansenula polymorpha)와 같은, 피키아 (Pichia), 한세눌라 (Hansenula), 코마가타엘라 (Komagataella), 사카로마이세스 (Saccharomyces), 클루이베로마이세스 (Kluyveromyces), 칸디다 (Candida), 오가타에아 (Ogataea), 야로위아 (Yarrowia), 및 게오트리쿰 (Geotrichum)으로 이루어지는 군에서 선택되는 속의 효모의 세포; 또는
b) 아스퍼질러스 아와모리 (Aspergillus awamori) 또는 트리코데르마 리세이 (Trichoderma reesei)와 같은, 사상성 진균의 세포이다.
그러나, 본 명세서에서 기술된 목적을 위해, 각각의 HCP는 동물 세포, 척추 동물 세포, 포유류 세포, 인간 세포, 식물 세포, 선충 세포, 곤충 세포 또는 연체동물 세포와 같은 무척추 동물 세포, 또는 상기한 것 중 어느 하나로부터 유래한 줄기 세포, 구체적으로 임의의 진균 세포 또는 효모 세포 중 어느 하나인 숙주 세포 내에서 감소될 수 있다.
각각의 상동 서열은 본 명세서에서 추가로 기재된 것과 같이 POI를 생산하는 숙주 세포로 사용되는 숙주 세포에 내인성인 것으로 이해된다.
예를 들어, 숙주 세포가 코마가타엘라 파피이인 경우, HCP1은 서열번호 1을 특징으로 한다. 그러나, 숙주 세포가 다른 종 (코마가타엘라 파피이 외)의 것인 경우, 숙주 세포에 내인성인 HCP1 서열은 서열번호 1에 상동성이 있는데, 예를 들어, 서열번호 1의 오쏠로그 (ortholgous) 서열이다.
마찬가지로, 숙주 세포가 코마가타엘라 파피이인 경우, HCP2는 서열번호 3을 특징으로 한다. 그러나, 숙주 세포가 다른 종 (코마가타엘라 파피이 외)의 것인 경우, 숙주 세포에 내인성인 HCP2 서열은 서열번호 3에 상동성이 있는데, 예를 들어, 서열번호 3의 오쏠로그 서열이다.
마찬가지로, 숙주 세포가 코마가타엘라 파피이인 경우, HCP3은 서열번호 5를 특징으로 한다. 그러나, 숙주 세포가 다른 종 (코마가타엘라 파피이 외)의 것인 경우, 숙주 세포에 내인성인 HCP3 서열은 서열번호 5에 상동성이 있는데, 예를 들어, 서열번호 5의 오쏠로그 서열이다.
마찬가지로, 숙주 세포가 코마가타엘라 파피이인 경우, HCP4는 서열번호 7을 특징으로 한다. 그러나, 숙주 세포가 다른 종 (코마가타엘라 파피이 외)의 것인 경우, 숙주 세포에 내인성인 HCP4 서열은 서열번호 7에 상동성이 있는데, 예를 들어, 서열번호 7의 오쏠로그 서열이다.
구체적으로, 임의의 또는 각각의 상동 서열은 코마가타엘라 파피이 내 각각의 아미노산 서열에 대한 적어도 50%의 서열 동일성, 구체적으로 적어도 50%, 60%, 70%, 80%, 90%, 또는 95% 중 적어도 어느 하나의 서열 동일성을 특징으로 한다.
구체적으로, 임의의 또는 각각의 상동 서열은 그 정량적 활성이 코마가타엘라 파피이 내 아미노산 서열 각각과 비교할 때 상이할 수 있으나, 예를 들어, 구조 단백질 또는 효소로서, 동일한 정성적 기능을 특징으로 한다.
구체적으로, 숙주 세포는 상기 적어도 하나의 HCP를 암호화하는 폴리뉴클레오티드(들)의 발현을 감소시키는 게놈 돌연변이(들)을 포함하는 1 이상의 유전적 변형에 의해 유전적으로 변형된다.
구체적으로, 1 이상의 유전적 변형은 제1 및/또는 제2 및/또는 제3 내인성 폴리뉴클레오티드의 발현을 감소시키는 게놈 돌연변이(들)을 포함하며, 여기서
- 제1 내인성 폴리뉴클레오티드는 HCP1을 암호화하고;
- 제2 내인성 폴리뉴클레오티드는 HCP2를 암호화하고; 그리고
- 제3 내인성 폴리뉴클레오티드는 HCP3을 암호화한다.
선택적 및 추가적으로, 숙주 세포는 추가 내인성 폴리뉴클레오티드의 발현을 감소시키는 게놈 돌연변이(들)를 도입하기 위해 추가로 변형되며, 여기서
- 상기 추가 내인성 폴리뉴클레오티드는 HCP4를 암호화한다.
구체적으로, 각각의 HCP를 암호화하는 각각의 내인성 폴리뉴클레오티드는 숙주 세포 내 자연적으로 발생하는 서열을 갖는 야생형 (천연의) 내인성 폴리뉴클레오티드이다.
구체적으로, 코마가타엘라 파피이 내 HCP1을 암호화하는 내인성 폴리뉴클레오티드는 서열번호 2를 포함한다. 그러나, 숙주 세포가 상이한 종 (코마가타엘라 파피이 외)의 것인 경우, 숙주 세포에 내인성인 서열을 암호화하는 HCP1은 서열번호 2에 상동성이 있는데, 예를 들어, 서열번호 2의 오쏠로그 서열이다.
구체적으로, 코마가타엘라 파피이 내 HCP2를 암호화하는 내인성 폴리뉴클레오티드는 서열번호 4를 포함한다. 그러나, 숙주 세포가 상이한 종 (코마가타엘라 파피이 외)의 것인 경우, 숙주 세포에 내인성인 서열을 암호화하는 HCP2는 서열번호 4에 상동성이 있는데, 예를 들어, 서열번호 4의 오쏠로그 서열이다.
구체적으로, 코마가타엘라 파피이 내 HCP3을 암호화하는 내인성 폴리뉴클레오티드는 서열번호 6을 포함한다. 그러나, 숙주 세포가 상이한 종 (코마가타엘라 파피이 외)의 것인 경우, 숙주 세포에 내인성인 서열을 암호화하는 HCP3은 서열번호 6에 상동성이 있는데, 예를 들어, 서열번호 6의 오쏠로그 서열이다.
구체적으로, 코마가타엘라 파피이 내 HCP4를 암호화하는 내인성 폴리뉴클레오티드는 서열번호 8을 포함한다. 그러나, 숙주 세포가 상이한 종 (코마가타엘라 파피이 외)의 것인 경우, 숙주 세포에 내인성인 서열을 암호화하는 HCP4는 서열번호 8에 상동성이 있는데, 예를 들어, 서열번호 8의 오쏠로그 서열이다.
구체적으로, 숙주 세포는 (i) 1 이상의 내인성 폴리뉴클레오티드, 또는 그의 일부; 또는 (ii) 상기 1 이상의 내인성 폴리뉴클레오티드의 발현 조절 서열의 파괴, 치환, 결실 또는 녹아웃을 포함하는 숙주 세포 게놈의 1 이상의 유전적 변형에 의해 유전적으로 변형되며, 바람직하게 상기 발현 조절 서열은 프로모터, 리보솜 결합 부위, 전사 또는 번역 개시 및 종결 서열, 인핸서 및 활성인자 서열로 이루어지는 군에서 선택된다.
구체적으로, 유전적 또는 녹아웃 변형은, 유전자 또는 유전자 일부의 발현을 이러한 유전적 변형 없는 각각의 숙주와 대비할 때 적어도 50%, 60%, 70%, 80%, 90%, 또는 95% 감소시키거나, 또는 심지어 그 발현을 없애는 유전자 또는 게놈 서열의 결실 또는 비활성화를 포함하는 1 이상의 게놈 돌연변이를 포함한다.
구체적으로, 유전적 변형은 프로모터, 인핸서, 신호, 리더, 또는 임의의 다른 조절 서열, 구체적으로 발현 및/또는 단백질의 분비를 제어하는 서열의 결실 또는 비활성화와 같은, 발현 제어 서열의 적어도 하나의 변형을 포함한다. 구체적으로, 발현 제어 서열은 관련있는 단백질 암호화 유전자에 작동가능하게 연결된다.
구체적으로, 1 이상의 유전적 변형은 구성적으로 손상시키거나 그렇지 않으면 1 이상의 내인성 폴리뉴클레오티드의 발현을 감소시키는 게놈 돌연변이를 포함한다.
구체적으로, 1 이상의 유전적 변형은 조건적으로 손상시키거나 그렇지 않으면 1 이상의 내인성 폴리뉴클레오티드의 발현을 감소시키는 1 이상의 유도성 또는 억제성 조절 서열을 도입하는 게놈 돌연변이를 포함한다. 이러한 조건적 활성 변형은 세포 배양 조건에 따라 활성화 및/또는 발현되는 이들 조절 요소 및 유전자를 특히 표적으로 한다.
구체적으로, 상기 적어도 하나의 HCP 중 어느 하나를 암호화하는 유전자는 상기 1 이상의 유전적 변형에 의해 녹아웃된다.
구체적으로, 상기 1 이상의 내인성 폴리뉴클레오티드의 발현은 POI를 생산할 때 감소된다. 구체적으로, 유전적 변형 시, 적어도 하나의 HCP를 암호화하는 상기 1 이상의 내인성 폴리뉴클레오티드의 발현은 POI가 생산되는 숙주 세포 배양 조건하에서 감소된다.
구체적으로, 숙주 세포는 상기 적어도 하나의 HCP 중 어느 하나 또는 각각의 양을 상기 변형이 없는 숙주 세포 대비 적어도 50%, 60%, 70%, 80%, 90%, 또는 95% (mol/mol) 중 어느 하나만큼 감소시키거나, 또는 심지어 100% 감소시켜 각각의 HCP의 생산을 없애도록 유전적으로 변형된다. 구체적으로, HCP1 및 HCP2, HCP3, 또는 HCP4 중 어느 하나, 둘, 또는 셋 각각의 양은 상기 변형이 없는 숙주 세포 대비 적어도 50%, 60%, 70%, 80%, 90%, 95%, 또는 100% (mol/mol) 중 어느 하나만큼 감소된다. 구체적인 실시양태에 따르면, 이러한 감소는 상기 적어도 하나의 HCP 중 어느 하나를 암호화하는 유전자의 녹아웃에 의해 얻어진다.
따라서, 구체적인 실시양태에 따르면, 본 명세서에 기술된 숙주 세포가 세포 배양물 내에서 배양되면, 세포 배양 상등액 내 총 HCP의 양은 상기 유전적 변형 없는 유사한 숙주 세포를 배양할 때의 배양 상등액 내 총 HCP의 양 대비, 적어도 5%, 또는 10%, 또는 심지어 적어도 15% (mol/mol) 감소된다.
세포 배양물 중의 총 숙주 세포 단백질 (HCP)은 POI를 발현하는 세포로부터 유래하나 POI를 제외하며, 세포가 세포 배양 배지로부터 예를 들어, 원심분리에 의해 분리되면 세포 배양 상등액 내에 존재하는 모든 개별 단백질의 합을 지칭한다.
구체적으로, 숙주 세포는 상기 적어도 하나의 HCP의 양이 세포 배양 상등액 내 총 HCP의 10%, 또는 5%, 또는 3% (mol/mol) 중 어느 하나 미만으로 감소되도록 유전적으로 변형된다.
구체적으로, 본 명세서에 기술된 상기 적어도 하나의 HCP 각각의 양은 질량 분석법에 의해 확인되는 것과 같이 세포 배양 상등액 내 총 HCP의 1% (mol/mol) 미만으로 감소되거나, 없어진다.
구체적으로, 세포 배양 상등액 내 총 HCP의 양은 상기 유전적 변형이 없는 유사한 숙주 세포의 세포 배양물 대비 적어도 5%, 또는 적어도 10% (mol/mol) 감소된다.
상기 적어도 하나의 HCP의 생산을 감소시킴으로써 세포 배양 상등액 내 얻는 상기 적어도 하나의 HCP의 양 (예를 들어, 수준 또는 농도, 구체적으로 레퍼런스 또는 총 HCP에 상대적인 양)은 감소된다.
본 명세서에서 기술된 숙주 세포에 대해 상기 적어도 하나의 HCP의 생산을 감소시키기 위한 상기 유전적 변형의 효과를 비교할 때, 이는 이러한 유전적 변형이 없는 유사한 숙주 세포와 일반적으로 비교된다. 비교는 이러한 유전적 변형이 없으며, 구체적으로 상기 POI를 생산하기 위한 조건하에서 배양될 때 재조합 또는 이종 POI를 생산하기 위해 조작된, 동일한 숙주 세포 타입에 대해 일반적으로 이루어진다. 별볍으로, 비교는 재조합 또는 이종 POI를 생산하기 위해 추가로 조작되지 않은 동일한 숙주 세포 타입에 대해 이루어진다.
특정 양태에 따르면, 상기 적어도 하나의 HCP의 감소는 세포 배양 상등액 내 상기 적어도 하나의 HCP의 양 (예를 들어, 수준 또는 농도, 또는 레퍼런스 또는 총 HCP에 상대적인 양)의 감소에 의해 결정된다. 구체적으로, 각 개별 HCP의 양 또는 총 HCP의 양은 ELISA 어세이, HPLC, SDS-PAGE와 같은 모세관 전기영동, 또는 질량 분석법을 사용하는 것과 같이 적절한 방법에 의해 결정되며, 구체적으로 질량 분석법은 액체 크로마토그래피-질량 분석법 (LC-MS), 또는 예를 들어 Doneanu et al. (MAbs. 2012; 4(1): 24-44)에 기술된 것과 같은 액체 크로마토그래피 텐덤-질량 분석법 (LC-MS/MS)이다.
구체적으로, POI 외의 부산물로서 감소된 양의 HCP를 생산할 수 있는 숙주 세포가 제공된다. HCP는 특정 POI 생산 공정 또는 공정-특이적 단백질과 독립적으로 존재하는 내인성 단백질을 포함하며, POI를 포함하는 세포 배양 상등액 제제, 또는 세포 배양 상등액으로부터 POI를 정제할 때 얻은 제제와 같은 POI 제제 내의 불순물 또는 오염물이다.
구체적인 실시양태에 따르면, 숙주 세포는 (1 이상의) 게놈 서열의 1 이상의 결실을 포함하도록 유전적으로 변형된다. 이러한 숙주 세포는 일반적으로 결실 균주로 제공된다.
특정 양태에 따르면, 본 명세서에서 기술된 숙주 세포는 POI를 암호화하는 뉴클레오티드 서열에 작동가능하게 연결된 1 이상의 조절 핵산 서열을 포함하는 발현 카세트를 포함하며, 구체적으로 상기 1 이상의 작동가능하게 연결된 서열은 POI 암호화 서열과 자연적으로 결합되지 않는다.
구체적으로, 발현 카세트는 분비된 단백질로서 POI를 발현 및 생산하는데 필요한, POI 암호화 유전자, 및 선택적으로 신호 및 리더 서열에 작동가능하게 연결된 프로모터를 포함한다.
구체적으로, 발현 카세트는 구성적 또는 유도성 또는 억제성 프로모터를 포함한다.
구성적 프로모터의 구체 예는 예를 들어, pGAP 및 그의 기능적 변이체, WO2014139608에 공개된 pCS1와 같은 임의의 구성적 프로모터를 포함한다.
유도성 또는 억제성 프로모터의 구체 예는 예를 들어, 천연의 pAOX1 또는 pAOX2 및 그의 기능적 변이체, pG1-pG8와 같은 임의의 조절 프로모터, 및 WO2013050551에 공개된 그의 단편, WO2017021541 A1에 공개된 pG1 및 pG1-x와 같은 임의의 조절 프로모터를 포함한다.
효모 숙주 세포와 함께 사용하기에 적합한 프로모터 서열은 문헌 [Mattanovich et al., Methods Mol. Biol. (2012) 824: 329-58]에 기술되며 트리오스포스페이트 이소머라제 (TPI), 포스포글리세레이트 키나제 (PGK), 글리세르알데히드-3- 포스페이트 디히드로게나제 (GAPDH 또는 GAP) 및 그의 변이체, 락타제 (LAC) 및 갈락토시다제 (GAL)와 같은 해당 (glycolytic) 효소, 피키아 파스토리스 글루코스-6-포스페이트 이소머라제 프로모터 (PPGI), 3-포스포글리세레이트 키나제 프로모터 (PPGK), 글리세롤 알데히드 포스페이트 디히드로게나제 프로모터 (pGAP), 번역 신장 인자 프로모터 (PTEF), 및 피키아 파스토리스 에놀라제 1 (PEN01)의 프로모터, 트리오스포스페이트 이소머라제의 프로모터 (PTPI), 리보솜 서브유닛 단백질의 프로모터 (PRPS2, PRPS7, PRPS31, PRPL1), 알코올 옥시다제 프로모터 (PAOX1, PAOX2) 또는 변형된 특성을 갖는 그의 변이체, 포름알데히드 디히드로게나제 프로모터 (PFLD), 이소시트레이트 리아제 프로모터 (PICL), 알파-케토이소카프로에이트 디카르복실라제 프로모터 (PTHI), 열 충격 단백질 패밀리 멤버의 프로모터 (PSSA1, PHSP90, PKAR2), 6-포스포글루코네이트 디히드로게나제 (PGND1), 포스포글리세레이트 뮤타제 (PGPM1), 트랜스케톨라제 (PTKL1), 포스파티딜이노시톨 신타제 (PPIS1), 페로-02-옥시도리덕타제 (PFET3), 고친화성 철 투과효소 (PFTR1), 억제성 알칼리성 포스파타제 (PPH08), N-미리스토일 트렌스퍼라제 (PNMT1), 페로몬 반응 전사 인자 (PMCM1), 유비퀴틴 (PUBI4), 단일-가닥 DNA 엔도뉴클라제 (PRAD2), 미토콘드리아 내막의 주요 ADP/ATP 전달자의 프로모터 (PPET9) (WO2008/128701) 및 포르메이트 디히드로게나제 (FMD) 프로모터를 포함한다. GAP 프로모터, AOX1 또는 AOX2 프로모터 또는 GAP 유래 프로모터 또는 AOX1 또는 AOX2 프로모터가 특히 바람직하다. AOX 프로모터는 메탄올에 의해 유도될 수 있으며 글루코스에 의해 억제된다.
적합한 프로모터의 추가 예는 사카로마이세스 세레비지애 (Saccharomyces cerevisiae) 에놀라제 (ENO-1), 사카로마이세스 세레비지애 갈락토키나제 (GAL1), 사카로마이세스 세레비지애 알코올 디히드로게나제/글리세르알데히드-3-포스페이트 디히드로게나제 (ADH1, ADH2/GAP), 사카로마이세스 세레비지애 트리오스 포스페이트 이소머라제 (TPI), 사카로마이세스 세레비지애 메탈로티오네인 (CUP1), 및 사카로마이세스 세레비지애 3-포스포글리세레이트 키나제 (PGK), 및 말타제 유전자 프로모터 (MAL)를 포함한다.
특정 양태에 따르면, 발현 카세트는 숙주 세포의 염색체, 또는 플라스미드 내에 통합된다.
발현 카세트는 숙주 세포 내에 도입될 수 있고 숙주 세포 게놈 내에 염색체내 요소로서 예를 들어, 특정 통합 부위에 통합되거나 무작위로 통합될 수 있으며, 그 결과 고 생산성 숙주 세포주가 선택된다. 별법으로, 발현 카세트는 플라스미드 또는 YAC와 같은 염색체외 유전적 요소 내에 통합될 수 있다. 특정 실시예에 따르면, 발현 카세트는 벡터, 구체적으로 발현 벡터에 의해 숙주 세포 내에 도입되며, 이는 숙주 세포 내로 적절한 형질감염 기술에 의해 도입된다. 이를 위해, POI 암호화 폴리뉴클레오티드는 발현 벡터 내로 라이게이션 (ligation)될 수 있다.
바람직한 효모 발현 벡터 (바람직하게는 효모 내 발현에 사용됨)는 pPICZ, pGAPZ, pPIC9, pPICZalfa, pGAPZalfa, pPIC9K, pGAPHis 또는 pPUZZLE 유래 플라스미드로 이루어지는 군에서 선택된다.
벡터 또는 플라스미드를 도입하는 진핵 세포의 형질감염 또는 형질전환 기술은 당업계에 잘 알려져 있다. 이들은 지질 소포 매개 흡수, 열 충격 매개 흡수, 칼슘 포스페이트 매개 형질감염 (칼슘 포스페이트/DNA 공침), 바이러스 감염, 및 특히 예를 들어, 변형된 아데노바이러스와 같은 변형된 바이러스의 이용, 미세주입 및 전기천공을 포함할 수 있다.
특정 양태에 따르면, 본 명세서에서 기술된 숙주 세포는 예를 들어, 단백질 생산을 개선하기 위해 1 이상의 추가적인 유전적 변형을 거칠 수 있다.
구체적으로, 숙주 세포는 프로테아제 결핍 균주, 구체적으로 카르복시펩티다제 Y 활성이 결핍된 균주를 생성하는데 사용되는 단백질분해 활성에 영향을 미치는 1 이상의 유전자를 변형하도록 추가로 조작된다. 구체적인 예가 WO1992017595A1에 기술된다. 프로테이나제 A 또는 프로테이나제 B와 같은 액포 프로테아제가 기능적 결핍된 프로테아제 결핍 피키아 균주의 추가 예는 US6153424A에 기술된다. ade2가 결실되고/되거나 프로테아제 유전자인 PEP4PRB1 어느 하나 또는 둘이 결실된 피키아 균주의 추가 예는 예를 들어, ThermoFisher Scientific에 의해 제공된다.
구체적으로, 숙주 세포는 기능적 유전자 산물, 구체적으로 WO2010099195A1에 기술된 것과 같은 PEP4, PRB1, YPS1, YPS2, YMP1, YMP2, YMP1, DAP2, GRHl, PRD1, YSP3, 및 PRB3로 이루어지는 군에서 선택되는 프로테아제를 암호화하는 적어도 하나의 핵산 서열을 변형하도록 조작된다.
POI는 진핵, 원핵 또는 합성 펩티드, 폴리펩티드, 단백질, 또는 숙주 세포의 대사산물 중 어느 하나일 수 있다.
구체적으로, POI는 숙주 세포 종에 이종이다.
구체적으로, POI는 분비된, 즉, 숙주 세포로부터 세포 배양 상등액 내로 분비된, 펩티드, 폴리펩티드, 또는 단백질이다.
구체적으로, POI는 진핵 단백질, 바람직하게는 인간 단백질 또는 인간 단백질 서열을 포함하는 단백질과 같은 포유류 유래 또는 관련 단백질, 또는 세균성 단백질 또는 세균 유래 단백질이다.
바람직하게, POI는 포유류에서 기능하는 치료용 단백질이다.
구체적인 경우에서, POI는 다량체 단백질, 구체적으로 이량체 또는 사량체이다.
특정 양태에 따르면, POI는 항원-결합 단백질, 치료용 단백질, 효소, 펩티드, 단백질 항생물질, 독소 융합 단백질, 탄수화물-단백질 컨쥬게이트, 구조 단백질, 조절 단백질, 백신 항원, 성장 인자, 호르몬, 사이토카인, 공정 효소 (process enzyme), 및 대사 효소로 이루어지는 군에서 선택되는 펩티드 또는 단백질이다.
구체적인 POI는 항체, 또는 그의 단편, 구체적으로 항원-결합 도메인을 포함하는 항체 단편과 같은 항원-결합 분자이다. 구체적인 POI 중에는 단일클론 항체 (mAb), 면역글로불린 (Ig) 또는 면역글로불린 클래스 G (IgG), 중쇄 항체 (HcAb'), 또는 단편-항원 결합 (Fab), Fd, 단일-사슬 가변 단편 (scFv)과 같은 그의 단편, 또는 예를 들어 Fv 이량체 (디아바디), Fv 삼량체 (트리아바디), Fv 사량체, 또는 미니바디와 같은 그의 조작된 변이체 및 VH, VHH, IgNAR, 또는 V-NAR과 같은 단일-도메인 항체, 또는 면역글로불린-폴드 (immunoglobulin-fold) 도메인을 포함하는 임의의 단백질과 같은 항체가 있다. 추가 항원-결합 분자는 항체 모방체, 또는 예를 들어, 조작된 쿠니츠 (Kunitz) 도메인, 애드넥틴 (Adnectin), 아피바디 (Affibody), 아필린 (Affiline), 안티칼린 (Anticalin), 또는 다르핀 (DARPin)과 같은 (대체) 스캐폴드 단백질로부터 선택될 수 있다.
특정 양태에 따르면, POI는 예를 들어, 보톡스 (BOTOX), 마이오블록 (Myobloc), 뉴로블록 (Neurobloc), 디스포트 (Dysport) (또는 보툴리눔 신경독의 다른 혈청형), 알글루코시다제 알파, 댑토마이신 (daptomycin), YH-16, 융모생식선자극호르몬 알파, 필그라스팀 (filgrastim), 세트로렐릭스 (cetrorelix), 인터류킨-2, 알데스류킨 (aldesleukin), 테세류린 (teceleulin), 데닐류킨 디피톡스 (denileukin diftitox), 인터페론 알파-n3 (주사), 인터페론 알파-nl, DL-8234, 인터페론, 산토리 (Suntory) (감마-1a), 인터페론 감마, 티모신 알파 1, 타소너민 (tasonermin), DigiFab, ViperaTAb, EchiTAb, CroFab, 네시리티드 (nesiritide), 아바타셉트 (abatacept), 알레파셉트 (alefacept), 레비프 (Rebif), 엡토터미날파 (eptoterminalfa), 테리파라티드 (teriparatide) (골다공증 (osteoporosis)), 주사가능한 칼시토닌 (골 질환 (bone disease)), 칼시토닌 (비강, 골다공증 (osteoporosis)), 에타너셉트 (etanercept), 헤모글로빈 글루타머 250 (소), 드로트레코긴 (drotrecogin) 알파, 콜라게나제, 카르페리티드 (carperitide), 재조합 인간 상피 성장 인자 (국소 젤, 상처 치유), DWP401, 다베포에틴 (darbepoetin) 알파, 에포에틴 (epoetin) 오메가, 에포에틴 (epoetin) 베타, 에포에틴 (epoetin) 알파, 데시루딘 (desirudin), 레피루딘 (lepirudin), 비발리루딘 (bivalirudin), 노나코그 (nonacog) 알파, 모노나인 (Mononine), 엡타코그 (eptacog) 알파 (활성화된), 재조합 인자 VIII+VWF, 리컴비네이트 (Recombinate), 재조합 인자 VIII, 인자 VIII (재조합), 알픈메이트 (Alphnmate), 옥토코그 (octocog) 알파, 인자 VIII, 팔리페르민 (palifermin), 인디키나제 (indikinase), 테넥테플라제 (tenecteplase), 알테플라제 (alteplase), 파미테플라제 (pamiteplase), 레테플라제 (reteplase), 나테플라제 (nateplase), 몬테플라제 (monteplase), 폴리트로핀 (follitropin) 알파, rFSH, hpFSH, 미카펑긴 (micafungin), 페그필그라스팀 (pegfilgrastim), 레노그라스팀 (lenograstim), 나르토그라스팀 (nartograstim), 세르모렐린 (sermorelin), 글루카곤, 엑세나티드 (exenatide), 프람린티드 (pramlintide), 이니글루세라제 (iniglucerase), 갈설파제 (galsulfase), 류코트로핀 (Leucotropin), 몰그라모스팀 (molgramostirn), 트립토렐린 (triptorelin) 아세테이트, 히스트렐린 (histrelin) (피하 임플란트, Hydron), 데스로렐린 (deslorelin), 히스트렐린 (histrelin), 나파렐린 (nafarelin), 류프롤리드 (leuprolide) 서방형 디폿 (아트리젤 (ATRIGEL)), 류프롤리드 (leuprolide) 임플란트 (DUROS), 고세렐린 (goserelin), 유트로핀 (Eutropin), KP-102 프로그램, 소마트로핀 (somatropin), 메카세르민 (mecasermin) (성장 부전), 엔파비르티드 (enlfavirtide), Org-33408, 인슐린 글라진 (glargine), 인슐린 글루리신 (glulisine), 인슐린 (흡입), 인슐린 리스프로 (lispro), 인슐린 디터머 (deternir), 인슐린 (구강, RapidMist), 메카세르민 린파베이트 (mecasermin rinfabate), 아나킨라 (anakinra), 셀모류킨 (celmoleukin), 99 mTc-압시티드 (apcitide) 주사제, 미엘로피드 (myelopid), 베타세론 (betaseron), 글라티라머 (glatiramer) 아세테이트, 게폰 (Gepon), 사르그라모스팀 (sargramostim), 오프렐베킨 (oprelvekin), 인간 백혈구-유래 알파 인터페론, 빌리베 (Bilive), 인슐린 (재조합), 재조합 인간 인슐린, 인슐린 아스파르트 (aspart), 메카세닌 (mecasenin), 로페론 (Roferon)-A, 인터페론-알파 2, 알파페론 (Alfaferone), 인터페론 알파콘 (alfacon)-1, 인터페론 알파, 아보넥스 (Avonex) 재조합 인간 황체형성 호르몬, 도르나제 (dornase) 알파, 트라페르민 (trafermin), 지코노티드 (ziconotide), 탈티렐린 (taltirelin), 디보테르민알파 (diboterminalfa), 아토시반 (atosiban), 베카플레르민 (becaplermin), 엡티피바티드 (eptifibatide), 제마이라 (Zemaira), CTC-111, 샨박 (Shanvac)-B, HPV 백신 (4가), 옥트레오티드 (octreotide), 란레오티드 (lanreotide), 안세스팀 (ancestirn), 아갈시다제 (agalsidase) 베타, 아갈시다제 알파, 라로니다제 (laronidase), 프레자티드 (prezatide) 구리 아세테이트 (국소 젤), 라스부리카제 (rasburicase), 라니비주맙 (ranibizumab), 액티뮨 (Actimmune), PEG-인트론 (Intron), 트리코민 (Tricomin), 재조합 집먼지 진드기 알러지 탈감작 주사, 재조합 인간 부갑상선 호르몬 (PTH) 1-84 (sc, 골다공증), 에포에틴 (epoetin) 델타, 트랜스제닉 항트롬빈 III, 그란디트로핀 (Granditropin), 비트라제 (Vitrase), 재조합 인슐린, 인터페론-알파 (경구 사탕 (lozenge)), GEM-21S, 바프레오티드 (vapreotide), 이두설파제 (idursulfase), 옴나파트릴라트 (omnapatrilat), 재조합 혈청 알부민, 서톨리주맙 페골 (certolizumab pegol), 글루카피다제 (glucarpidase), 인간 재조합 C1 에스테라제 저해제 (혈관부종 (angioedema)), 라노테플라제 (lanoteplase), 재조합 인간 성장 호르몬, 엔푸버티드 (enfuvirtide) (바늘 없는 주사, Biojector 2000), VGV-1, 인터페론 (알파), 루시낙탄 (lucinactant), 아빕타딜 (aviptadil) (흡입, 폐질환 (pulmonary disease)), 이카티반트 (icatibant), 에칼란티드 (ecallantide), 오미가난 (omiganan), 오로그랩 (Aurograb), 펙시가난 (pexiganan) 아세테이트, ADI-PEG-20, LDI-200, 데가렐릭스 (degarelix), 신트레델린베수도톡스 (cintredelinbesudotox), Favld, MDX-1379, ISAtx-247, 리라글루티드 (liraglutide), 테리파라티드 (teriparatide) (골다공증), 티파코긴 (tifacogin), AA4500, T4N5 리포솜 로션, 카투막소맙 (catumaxomab), DWP413, ART-123, 크리살린 (Chrysalin), 데스모테플라제 (desmoteplase), 아메디플라제 (amediplase), 코리폴리트로핀 (corifollitropin) 알파, TH-9507, 테두글루티드 (teduglutide), 디아미드 (Diamyd), DWP-412, 성장 호르몬 (서방형 주사), 재조합 G-CSF, 인슐린 (흡입, AIR), 인슐린 (흡입, 테크노스피어 (Technosphere)), 인슐린 (흡입, AERx), RGN-303, DiaPep277, 인터페론 베타 (C형 간염 바이러스 감염 (hepatitis C viral infection, HCV)), 인터페론 알파-n3 (경구), 벨라타셉트 (belatacept), 경피 인슐린 패치, AMG-531, Mbp-8298, 세레셉트 (Xerecept), 오페바칸 (opebacan), AIDSVAX, GV-1001, 림포스캔 (LymphoScan), 란피르나제 (ranpirnase), 리폭시산 (Lipoxysan), 루수펄티드 (lusupultide), MP52 (베타-트리칼슘포스페이트 담체, 뼈 재형성), 흑색종 (melanoma) 백신, 시푸류셀-T (sipuleucel-T), CTP-37, 인세지아 (Insegia), 비테스펜 (vitespen), 인간 트롬빈 (냉동, 외과적 출혈), 트롬빈, TransMID, 알피메프라제 (alfimeprase), 푸리카제 (Puricase), 털리프레신 (terlipressin) (정맥내, 간염 증후군 (hepatorenal syndrome)), EUR-1008M, 재조합 FGF-I (주사 가능, 혈관 질환 (vascular disease)), BDM-E, 로티갭티드 (rotigaptide), ETC-216, P-113, MBI-594AN, 듀라마이신 (duramycin) (흡입, 낭포성 섬유증 (cystic fibrosis)), SCV-07, OPI-45, 엔도스타틴 (Endostatin), 안지오스타틴 (Angiostatin), ABT-510, 보우만 버크 (Bowman Birk) 저해제 농축물, XMP-629, 99 mTc-히닉-아넥신 V (Annexin V), 카할랄리드 F (kahalalide F), CTCE-9908, 테베렐릭스 (teverelix) (지속 방출), 오자렐릭스 (ozarelix), 로르니뎁신 (rornidepsin), BAY-504798, 인터류킨4, PRX-321, 펩스캔 (Pepscan), 이복타데킨 (iboctadekin), rh 락토페린 (rhlactoferrin), TRU-015, IL-21, ATN-161, 실렌지티드 (cilengitide), 알부페론 (Albuferon), 비파식스 (Biphasix), IRX-2, 오메가 인터페론, PCK-3145, CAP-232, 파시레오티드 (pasireotide), huN901-DMI, 난소암 (ovarian cancer) 면역치료 백신, SB-249553, 온코박스-CL (Oncovax-CL), 온코박스-P (OncoVax-P), BLP-25, 세박스-16 (CerVax-16), 다중-에피토프 펩티드 흑색종 (melanoma) 백신 (MART-1, gp100, 티로시나제), 네미피티드 (nemifitide), rAAT (흡입), rAAT (피부과), CGRP (흡입, 천식 (asthma)), 페그수너셉트 (pegsunercept), 티모신베타4, 플리티뎁신 (plitidepsin), GTP-200, 라모플라닌 (ramoplanin), GRASPA, OBI-1, AC-100, 연어 칼시토닌 (경구, eligen), 칼시토닌 (경구, 골다공증), 이그재모렐린 (examorelin), 카프로모렐린 (capromorelin), 카데바 (Cardeva), 벨라페르민 (velafermin), 131I-TM-601, KK-220, T-10, 울라리티드 (ularitide), 데펠레스타트 (depelestat), 헤마티드 (hematide), 크리살린 (Chrysalin) (국소), rNAPc2, 재조합 인자 V111 (페길화된 리포솜), bFGF, 페길화된 재조합 스타필로키나제 변이체, V-10153, 소노라이시스 프롤리제 (SonoLysis Prolyse), 뉴로백스 (NeuroVax), CZEN-002, 섬 세포 신생 치료요법, rGLP-1, BIM-51077, LY-548806, 엑세나티드 (조절 방출, Medisorb), AVE-0010, GA-GCB, 아보렐린 (avorelin), ACM-9604, 리나클로티드 (linaclotide) 아세테이트, CETi-1, 헤모스판 (Hemospan), VAL (주사 가능한), 속효성 인슐린 (주사 가능한, Viadel), 비강내 인슐린, 인슐린 (흡입), 인슐린 (경구, eligen), 재조합 메티오닐 인간 렙틴, 피트라킨라 (pitrakinra) 피하 주사, 습진 (eczema)), 피트라킨나 (흡입 건조 분말, 천식 (asthma)), 멀티킨 (Multikine), RG-1068, MM-093, NBI-6024, AT-001, PI-0824, Org-39141, Cpn10 (자가면역 질환 (autoimmune diseases)/염증 (inflammation)), 탈락토페린 (talactoferrin) (국소), rEV-131 (안과), rEV-131 (호흡기 질환 (respiratory disease)), 경구 재조합 인간 인슐린 (당뇨 (diabetes)), RPI-78M, 오프렐베킨 (oprelvekin) (경구), CYT-99007 CTLA4-Ig, DTY-001, 발라테그라스트 (valategrast), 인터페론 알파-n3 (국소), IRX-3, RDP-58, 타우페론 (Tauferon), 담즙염 자극된 리파제, 메리스파제 (Merispase), 알라닌 포스파타제, EP-2104R, 멜라노탄 (Melanotan)-II, 브레멜라노티드 (bremelanotide), ATL-104, 재조합 인간 마이크로플라스민 (microplasmin), AX-200, SEMAX, ACV-1, Xen-2174, CJC-1008, 다이노르핀 (dynorphin) A, SI-6603, LAB GHRH, AER-002, BGC-728, 말라리아 백신 (비로좀, PeviPRO), ALTU-135, 파보바이러스 B19 백신, 인플루엔자 백신 (재조합 뉴라미니다제), 말라리아/HBV 백신, 탄저병 (anthrax) 백신, Vacc-5q, Vacc-4x, HIV 백신 (경구), HPV 백신, Tat 톡소이드, YSPSL, CHS-13340, PTH(1-34) 리포솜 크림 (노바좀), 오스타볼린 (Ostabolin)-C, PTH 유사체 (국소, 건선 (psoriasis)), MBRI-93.02, MTB72F 백신 (결핵), MVA-Ag85A 백신 (결핵 (tuberculosis)), FARA04, BA-210, 재조합 플라그 FIV 백신, AG-702, OxSODrol, rBetV1, Der-p1/Der-p2/Der-p7 알레르겐-표적 백신 (먼지 진드기 알러지), PR1 펩티드 항원 (백혈병 (leukemia)), 돌연변이 라스 (ras) 백신, HPV-16 E7 리포펩티드 백신, 라비린틴 (labyrinthin) 백신 (선암종 (adenocarcinoma)), CML 백신, WT1-펩티드 백신 (암), IDD-5, CDX-110, 펜트리스 (Pentrys), 노렐린 (Norelin), CytoFab, P-9808, VT-111, 이크로캡티드 (icrocaptide), 텔베르민 (telbermin) (피부과, 당뇨성 발 궤양 (diabetic foot ulcer)), 루핀트리비어 (rupintrivir), 레티쿨로스 (reticulose), rGRF, HA, 알파-갈락토시다제 A, ACE-011, ALTU-140, CGX-1160, 안지오텐신 치료 백신, D-4F, ETC-642, APP-018, rhMBL, SCV-07 (경구, 결핵 (tuberculosis)), DRF-7295, ABT-828, ErbB2-특이적 면역독소 (항암), DT3SSIL-3, TST-10088, PRO-1762, 콤보톡스 (Combotox), 콜레시스토키닌 (cholecystokinin)-B/가스트린-수용체 결합 펩티드, 111In-hEGF, AE-37, 트라스니주맙 (trasnizumab)-DM1, 길항물질 G, IL-12 (재조합), PM-02734, IMP-321, rhIGF-bp3, BLX-883, CUV-1647 (국소), L-19 기반 방사성면역치료 (암), Re-188-P-2045, AMG-386, DC/1540/KLH 백신 (암), VX-001, AVE-9633, AC-9301, NY-ESO-1 백신 (펩티드), NA17.A2 펩티드, 흑색종 (melanoma) 백신 (펄스처리된 항원 치료), 전립선암 (prostate cancer) 백신, Cbp-501, 재조합 인간 락토페린 (안구 건조증 (dry eye)), FX-06, AP-214, WAP-8294A (주사 가능한), ACP-HIP, SUN-11031, 펩티드 YY [3-36] (비만 (obesity), 비강내), FGLL, 아타시셉트 (atacicept), BR3-Fc, BN-003, BA-058, 인간 부갑상선 호르몬 1-34 (코, 골다공증), F-18-CCR1, AT-1100 (셀리악병 (celiac disease)/당뇨 (diabetes)), JPD-003, PTH(7-34) 리포솜 크림 (노바좀), 듀라마이신 (duramycin) (안과, 안구 건조증), CAB-2, CTCE-0214, 글리코페길화된 에리트로포이에틴 (erythropoietin), EPO-Fc, CNTO-528, AMG-114, JR-013, 인자 XIII, 아미노칸딘 (aminocandin), PN-951, 716155, SUN-E7001, TH-0318, BAY-73-7977, 테베렐릭스 (teverelix) (즉시 방출), EP-51216, hGH (조절 방출, 바이오스피어), OGP-I, 시푸비르티드 (sifuvirtide), TV4710, ALG-889, Org-41259, rhCC10, F-991, 티모펜틴 (thymopentin) (폐질환 (pulmonary disease)), r(m)CRP, 간선택성 인슐린, 수발린 (subalin), L19-IL-2 융합 단백질, 엘라핀 (elafin), NMK-150, ALTU-139, EN-122004, rhTPO, 트롬보포이에틴 (thrombopoietin) 수용체 아고니스트 (혈소판감소성 질환 (thrombocytopenic disorder)), AL-108, AL-208, 신경 성장 인자 길항물질 (통증), SLV-317, CGX-1007, INNO-105, 경구 테리파라티드 (teriparatide) (eligen), GEM-OS1, AC-162352, PRX-302, LFn-p24 융합 백신 (테라포어 (Therapore)), EP-1043, 폐렴균 (S. pneumoniae) 소아 백신, 말라리아 백신, 수막염균 (Neisseria meningitidis) 그룹 B 백신, 신생아 그룹 B 스트렙토코커스 백신, 탄저병 (anthrax) 백신, HCV 백신 (gpE1+gpE2+MF-59), 귀 염증 (otitis) 미디어 테라피, HCV 백신 (코어 항원+ISCOMATRIX), hPTH(1-34) (경피, ViaDerm), 768974, SYN-101, PGN-0052, 아비스큠닌 (aviscumnine), BIM-23190, 결핵 백신, 다중-에피토프 티로시나제 펩티드, 암 백신, 엔카스팀 (enkastim), APC-8024, GI-5005, ACC-001, TTS-CD3, 혈관-표적화된 TNF (고형 종양 (solid tumor)), 데스모프레신 (desmopressin) (구강 조절-방출), 오너셉트 (onercept), 또는 TP-9201, 아달리무맙 (adalimumab) (HUMIRA), 인플릭시맙 (infliximab) (REMICADE™), 리툭시맙 (rituximab) (RITUXAN™/MAB THERA™), 에타너셉트 (etanercept) (ENBREL™), 베바시주맙 (bevacizumab) (AVASTIN™), 트라스투주맙 (trastuzumab) (HERCEPTIN™), 페그릴그라스팀 (pegrilgrastim) (NEULASTA™), 또는 바이오시밀러 및 바이오베터를 포함하는 임의의 다른 적절한 POI이다.
특정 양태에 따르면, 숙주 세포는 임의의 동물 세포, 척추 동물 세포, 포유류 세포, 인간 세포, 식물 세포, 선충 세포, 곤충 세포 또는 연체동물 세포와 같은 무척추 동물 세포, 상기한 것 중 어느 하나로부터 유래한 줄기 세포, 또는 진균 세포 또는 효모 세포일 수 있다. 구체적으로 숙주 세포는 피키아, 한세눌라, 코마가타엘라, 사카로마이세스, 클루이베로마이세스, 칸디다, 오가타에아, 야로위아, 및 게오트리쿰, 구체적으로 사카로마이세스 세레비지애, 피키아 파스토리스, 오가타에아 미누타 또는 한세눌라 폴리모르파로 이루어지는 군에서 선택되는 속의 세포, 또는 아스퍼질러스 아와모리 또는 트리코데르마 리세이와 같은 사상성 진균의 세포이다. 바람직하게, 숙주 세포는 메탄올자화성 효모, 바람직하게 피키아 파스토리스이다. 본 명세서에서 피키아 파스토리스는 코마가타엘라 파스토리스, 코마가타엘라 파피이 및 코마가타엘라 슈도파스토리스의 모든 동의어로 사용된다.
특정 양태에 따르면, 숙주 세포는 피키아 파스토리스, 한세눌라 폴리모르파, 트리코데르마 리세이, 사카로마이세스 세레비지애, 클루이베로마이세스 락티스, 야로위아 리폴리티카, 피키아 메탄올리카 (Pichia methanolica), 칸디다 보이디니 (Candida boidinii), 코마가타엘라 파피이, 코마가타엘라 파스토리스 및 스키조사카로마이세스 폼베 (Schizosaccharomyces pombe)로 이루어지는 군에서 선택되는 효모 또는 사상성 진균 세포이다.
특정 양태에 따르면, 숙주 세포는 예를 들어, 효모 세포 (예를 들어, 피키아 속 (예를 들어, 피키아 파스토리스, 피키아 메탄올리카, 피키아 클루이베리 (Pichia kluyveri), 및 피키아 앙구스타 (Pichia angusta)), 코마가타엘라 속 (예를 들어, 코마가타엘라 파스토리스, 코마가타엘라 슈도파스토리스 또는 코마가타엘라 파피이), 사카로마이세스 속 (예를 들어, 사카로마이세스 세레비지애, 사카로마이세스 클루이베리 (Saccharomyces kluyveri), 사카로마이세스 우바룸 (Saccharomyces uvarum), 클루이베로마이세스 속 (예를 들어, 클루이베로마이세스 락티스, 클루이베로마이세스 막시아누스), 칸디다 속 (예를 들어, 칸디다 유틸리스 (Candida utilis), 칸디다 카카오이 (Candida cacaoi), 칸디다 보이디니), 게오트리쿰 속 (예를 들어, 게오트리쿰 퍼멘탄스 (Geotrichum fermentans)), 한세눌라 폴리모르파, 야로위아 리폴리티카, 또는 스키조사카로마이세스 폼베와 같은 하위 진핵 세포이다. 피키아 파스토리스 종이 바람직하다. 피키아 파스토리스 균주의 예로는 X33, GS115, KM71, KM71H; CBS 2612, 및 CBS7435가 있다.
구체적으로, 숙주 세포는 CBS 704, CBS 2612, CBS 7435, CBS 9173-9189, DSMZ 70877, X-33, GS115, KM71, KM71H 및 SMD1168로 이루어지는 군에서 선택되는 피키아 파스토리스 균주이다.
출처: CBS 704 (=NRRL Y-1603 = DSMZ 70382), CBS 2612 (=NRRL Y-7556), CBS 7435 (=NRRL Y-11430), CBS 9173-9189 (CBS 균주: CBS-KNAW Fungal Biodiversity Centre, Centraalbureau voor Schimmelculturen, Utrecht, The Netherlands), 및 DSMZ 70877 (German Collection of Microorganisms and Cell Cultures); X-33, GS115, KM71, KM71H 및 SMD1168과 같은 인비트로젠 (Invitrogen)의 균주. 사카로마이세스 세레비지애 균주의 예로는 W303, CEN.PK 및 BY-시리즈 (EUROSCARF collection)가 포함된다. 상술된 모든 균주는 형질전환체를 생산하고 이종 유전자를 발현시키는데 성공적으로 사용되었다.
진핵 숙주 세포는 진균 세포 (예를 들어, 아스퍼질러스 (Aspergillus) (예: 아스퍼질러스 니게르 (A. niger), 아스퍼질러스 푸미가투스 (A. fumigatus), 아스퍼질러스 오리자에 (A. oryzae), 아스퍼질러스 니둘란스 (A. nidulans)), 아크레모니움 (Acremonium) (예: 아크레모니움 써모필룸 (A. thermophilum)), 케토미움 (Chaetomium) (예: 케토미움 써모필룸 (C. thermophilum)), 크리소스포리움 (Chrysosporium) (예: 크리소스포리움 써모필레 (C. thermophile)), 코르디셉스 (Cordyceps) (예: 코르디셉스 밀리타리스 (C. militaris)), 코리나스쿠스 (Corynascus), 크테노마이세스 (Ctenomyces), 푸사리움 (Fusarium) (예: 푸사리움 옥시스포룸 (F. oxysporum)), 글로메렐라 (Glomerella) (예: 글로메렐라 그라미니콜라 (G. graminicola)), 하이포크레아 (Hypocrea) (예: 하이포크레아 제코리나 (H. jecorina)), 마그나포르테 (Magnaporthe) (예: 마그나포르테 오리자에 (M. oryzae)), 마이셀리오프토라 (Myceliophthora) (예: 마이셀리오프토라 써모필레 (M. thermophile), 넥트리아 (Nectria) (예: 넥트리아 해마토코카 (N. haematococca)), 뉴로스포라 (Neurospora) (예: 뉴로스포라 크라사 (N. crassa)), 페니실리움 (Penicillium), 스포로트리쿰 (Sporotrichum) (예: 스포로트리쿰 써모필레 (S. thermophile)), 티엘라비아 (Thielavia) (예: 티엘라비아 테레스트리스 (T. terrestris), 티엘라비아 헤테로탈리카 (T. heterothallica), 트리코더마 (Trichoderma) (예: 트리코더마 리세이 (T. reesei)), 또는 베르티실리움 (Verticillium) (예: 베르티실리움 달리아 (V. dahlia)))일 수 있다.
특정 양태에 따르면, 포유류 세포는 인간 또는 설치류 또는 소 세포, 세포주 또는 세포 균주이다. 본 명세서에서 기술된 숙주 세포로서 적절한 구체적인 포유류 세포의 예는 마우스 골수종 (myeloma) (NSO)-세포주, 차이니즈 햄스터 난소 (CHO)-세포주, HT1080, H9, HepG2, MCF7, MDBK Jurkat, MDCK, NIH3T3, PC12, BHK (베이비 햄스터 신장 세포), VERO, SP2/0, YB2/0, Y0, C127, L 세포, COS, 예를 들어, COS1 및 COS7, QC1-3, HEK-293, VERO, PER.C6, HeLA, EBl, EB2, EB3, 종양분해 (oncolytic) 또는 하이브리도마-세포주이다. 바람직하게 포유류 세포는 CHO-세포주이다. 일 실시양태에서, 세포는 CHO 세포이다. 일 실시양태에서, 세포는 CHO-K1 세포, CHO-K1 SV 세포, DG44 CHO 세포, DUXB11 CHO 세포, DUKX CHO 세포, CHO-S, CHO FUT8 녹아웃 CHO GS 녹아웃 세포, CHO FUT8 GS 녹아웃 세포, CHOZN, 또는 CHO-유래 세포이다. CHO GS 녹아웃 세포 (예를 들어, GSKO 세포)는, 예를 들어, CHO-K1 SV GS 녹아웃 세포이다. CHO FUT8 녹아웃 세포는, 예를 들어, Potelligent® CHOK1 SV (Lonza Biologics, Inc.)이다. 진핵 세포는 또한 예를 들어, EBx® 세포, EB14, EB24, EB26, EB66, 또는 EBvl3과 같은 조류 세포, 세포주 또는 세포 균주를 포함한다.
다른 특정 양태에 따르면, 진핵 세포는 곤충 세포 (예를 들어, Sf9, Mimic™Sf9, Sf21, High FiveTM (BT1-TN-5B1-4), 또는 BT1-Ea88 세포), 조류 (algae) 세포 (예를 들어, 암포라 (Amphora), 바실라리오피세아에 (Bacillariophyceae), 두나리엘라 (Dunaliella), 클로렐라 (Chlorella), 클라마이도모나스 (Chlamydomonas), 시아노피타 (Cyanophyta) (시아노박테리아 (cyanobacteria)), 나노클로롭시스 (Nannochloropsis), 스피룰리나 (Spirulina), 또는 오크로모나스 (Ochromonas) 속의 조류 세포), 또는 식물 세포 (예를 들어, 외떡잎 식물 (예를 들어, 옥수수, 벼, 밀, 또는 세타리아), 또는 쌍떡잎 식물 (예를 들어, 카사바, 감자, 대두, 토마토, 담배, 알팔파, 피스코미트렐라 파텐스 (Physcomitrella patens) 또는 아라비돕시스 (Arabidopsis)로부터의 세포))이다.
적절한 숙주 세포는 예를 들어, DSMZ (Deutsche Sammlung von Mikroorganismen and Zellkulturen GmbH, Braunschweig, Germany) 또는 아메리칸 타입 컬쳐 콜렉션 (American Type Culture Collection, ATCC)과 같은 미생물 자원은행으로부터, 상업적으로 입수가능하다.
구체적인 실시양태에 따르면, 본 발명은 하기 단계를 포함하는, 진핵 숙주 세포 내 목적 단백질 (POI)을 생산하는 방법을 제공한다:
i) 제1 HCP (HCP1), 제2 HCP (HCP2), 및 제3 HCP (HCP3)로 이루어지는 군에서 선택되는 적어도 하나의 내인성 숙주 세포 단백질 (HCP)의 생산이 감소되도록 숙주 세포를 유전적으로 변형하는 단계로, 여기서
a) HCP1은, 숙주 세포가 코마가타엘라 파피이인 경우 서열번호 1로 식별되는 아미노산 서열, 또는 숙주 세포가 다른 종인 경우 그 숙주 세포에 내인성인 서열번호 1로 식별되는 아미노산 서열의 상동 서열을 포함하고;
b) HCP2는, 숙주 세포가 코마가타엘라 파피이인 경우 서열번호 3으로 식별되는 아미노산 서열, 또는 숙주 세포가 다른 종인 경우 그 숙주 세포에 내인성인 서열번호 3으로 식별되는 아미노산 서열의 상동 서열을 포함하며; 그리고
c) HCP3은, 숙주 세포가 코마가타엘라 파피이인 경우 서열번호 5로 식별되는 아미노산 서열, 또는 숙주 세포가 다른 종인 경우 그 숙주 세포에 내인성인 서열번호 5로 식별되는 아미노산 서열의 상동 서열을 포함하는 단계.
ii) POI를 암호화하는 뉴클레오티드 서열에 작동가능하게 연결된 1 이상의 조절 핵산 서열을 포함하는 발현 카세트를 숙주 세포에 도입하는 단계;
iii) 상기 POI를 생산하기 위한 조건하에서 상기 숙주 세포를 배양하는 단계; 및 선택적으로
iv) 상기 POI를 세포 배양물, 구체적으로 세포 배양 상등액으로부터 단리하는 단계; 및 선택적으로
v) 상기 POI를 정제하는 단계.
구체적으로, 관심 POI는 숙주 세포를 적절한 배지에서 배양하고, 발현된 POI를 배양물, 구체적으로 세포 배양 상등액으로부터 단리하고, 이를 발현된 산물에 적합한 방법, 구체적으로 세포로부터 POI를 분리하기에 적합한 방법에 의해 정제하여 생산될 수 있다. 이로써, 정제된 POI 제제가 생산될 수 있다.
추가의 특정 실시양태에 따르면, 본 발명은 구체적으로, 본 명세서에서 기술된 방법의 단계 i)을 수행하기 전 또는 후, 또는 이와 동시에 단계 ii)를 도입함으로써,
숙주 세포 배양물 내 목적 단백질 (POI)을 생산할 수 있는 진핵 숙주 세포를 생산하는 방법을 제공한다.
특정 양태에 따르면, 숙주 세포는 이종 또는 재조합 POI를 생산하도록 조작되기 전에 상기 적어도 하나의 HCP가 감소되도록 먼저 유전적으로 변형된다. 특정 실시예에 따르면, 야생형 숙주 세포는 본 명세서에서 기술된 방법의 단계 i)에 따라 유전적으로 변형된다. 구체적으로, 숙주 세포는 HCP 감소를 위해 상기 1 이상의 유전적 변형이 야생형 숙주 세포 균주 내로 도입될 때 제공된다.
추가 양태에 따르면, 숙주 세포는 상기 적어도 하나의 HCP를 감소시키기 위해 추가로 유전자 변형되기 전에, 먼저 이종 또는 재조합 POI를 생산하도록 조작된다. 특정 실시예에 따르면, 야생형 숙주 세포는 POI 생산을 위한 발현 카세트를 포함하도록 먼저 조작될 수 있다. 이러한 조작된 숙주 세포는 본 명세서에서 추가로 기재된 것과 같이 HCP를 감소시키기 위해 이후 추가로 변형될 수 있다.
추가 양태에 따르면, 숙주 세포는 예를 들어, 1 이상의 반응 혼합물에서 각각의 발현 카세트, 시약 및 도구를 사용하는, 하나의 방법 단계에서 POI 생산을 위한 조작 및 HCP 감소를 위한 유전적 변형 모두를 거친다.
구체적으로, 숙주 세포는 세포 배양물, 구체적으로 생산 숙주 세포주에서 배양된 세포주이다.
추가의 특정 실시양태에 따르면, 본 발명은 본 명세서에서 기술된 숙주 세포를 배양함으로써, 또는 상기 POI를 생산하기 위한 조건하에서 본 명세서에서 기술된 방법에 의해 얻어질 수 있는, 목적 단백질 (POI)을 생산하는 방법을 제공한다.
추가의 특정 실시양태에 따르면, 본 발명은 POI의 생산을 위한 본 명세서에서 기술된 숙주 세포의 용도를 제공한다.
구체적인 실시양태에 따르면, 세포주는 회분식, 유가식 또는 연속 배양 조건하에서 배양된다. 배양은 제1 단계로서 회분 단계로 시작하며, 제2 단계로서 유가 단계 또는 연속 배양 단계가 이어지는 미세역가 플레이트, 진탕 플라스크, 또는 생물반응기 내에서 이루어질 수 있다.
구체적으로, 본 명세서에서 기술된 방법은 본 명세서에서 추가로 기재된 것과 같이 상기 적어도 하나의 HCP의 양을 감소시키기 위한 숙주 세포의 적어도 하나의 유전적 변형을 포함한다. 구체적으로, 적어도 하나의 유전적 변형은 구체적으로 상기 POI를 발현하는 조건하에서 배양될 때, HCP 감소를 위한 상기 유전적 변형이 없는 숙주 세포 대비, 숙주 세포 내 HCP 감소의 하기의 특징 중 어느 하나 이상을 도입한다:
·숙주 세포에 의해 생산된 상기 적어도 하나의 HCP의 양이 총 HCP의 10%, 5%, 또는 3% (mol/mol) 중 어느 하나보다 적도록 감소함;
·숙주 세포에 의해 생산된 상기 적어도 하나의 HCP의 양이 50%, 60%, 70%, 80%, 90%, 95%, (mol/mol) 중 적어도 어느 하나만큼 감소하거나, 심지어 100% 감소함으로써 그에 의해 각각의 HCP의 생산을 제거함;
·숙주 세포에 의해 생산된 상기 적어도 하나의 HCP 각각의 양, 구체적으로 HCP1 및 HCP2, HCP3, 또는 HCP4 중 어느 하나, 둘, 또는 셋 각각이 50%, 60%, 70%, 80%, 90%, 95%, 또는 100% (mol/mol) 중 적어도 어느 하나만큼 감소함;
·숙주 세포에 의해 생산된 상기 적어도 하나의 HCP 각각의 양, 구체적으로 HCP1 및 HCP2, HCP3, 또는 HCP4 중 어느 하나, 둘, 또는 셋 각각이 총 HCP의 1% (mol/mol) 미만으로 감소함;
·세포 배양 상등액 내 총 HCP의 양이 적어도 5%, 또는 10%, 또는 15% (mol/mol) 감소함.
추가의 특정 실시양태에 따르면, 본 발명은 본 명세서에서 기술된 숙주 세포를 상기 POI를 생산하기 위한 조건하에서 배양하고 상기 세포 배양물로부터 POI를 단리함으로써, 숙주 세포 배양물 내 생산된 목적 단백질 (POI)의 내인성 숙주 세포 단백질 (HCP) 오염의 위험을 감소시키는 방법을 제공한다. HCP의 양을 감소시킴으로써, 숙주 세포 배양물, 또는 그의 분획 내 POI의 순도가 효과적으로 증가할 수 있다.
도 1a 내지 1e: 본 명세서에서 기술된 HCP 서열
코마가타엘라 파피이의 HCP1
서열번호 1: F2QXM5의 아미노산 서열 (NCBI 등록 번호): 기능이 밝혀지지 않은 (uncharacterized) 단백질, PP7435_Chr3-1213, PAS_Chr3_0030, gi l 254570259, gi l 328353755, PIPA05357, CCA40153;
서열번호 2: F2QXM5에 대응하는 뉴클레오티드 서열 (NCBI 등록 번호): 기능이 밝혀지지 않은 단백질, PP7435_Chr3-1213, PAS_Chr3_0030, gi l 254570259, gi l 328353755, PIPA05357, CCA40153;
코마가타엘라 파피이의 HCP2
서열번호 3: F2QNG1의 아미노산 서열 (NCBI 등록 번호): 글루카나제와 유사성을 갖는 세포벽 단백질, PP7435_Chr1-0232, PAS_Chr1-3_0229, gi l 25456492, gi l 328349994, PIPA04722;
서열번호 4: F2QNG1에 대응하는 뉴클레오티드 서열 (NCBI 등록 번호): 글루카나제와 유사성을 갖는 세포벽 단백질, PP7435_Chr1-0232, PAS_Chr1-3_0229, gi l 25456492, gi l 328349994, PIPA04722;
코마가타엘라 파피이의 HCP3
서열번호 5: F2QQT7의 아미노산 서열 (NCBI 등록 번호): SUN 패밀리 단백질 (Sim1p, Uth1p, Nca3p, Sun4p), PAS_chr2-2_0064;
서열번호 6: F2QQT7에 대응하는 뉴클레오티드 서열: SUN 패밀리 단백질 (Sim1p, Uth1p, Nca3p, Sun4p), PAS_chr2-2_0064;
코마가타엘라 파피이의 HCP4
서열번호 7: F2QXH5의 아미노산 서열 (NCBI 등록 번호): EPX1; 세포외 단백질 X1, PAS_chr3_0076, PIPA00934, PP7435_Chr3-1160;
서열번호 8: F2QXH5에 대응하는 뉴클레오티드 서열 (NCBI 등록 번호): EPX1; 세포외 단백질 X1, PAS_chr3_0076, PIPA00934, PP7435_Chr3-1160;
코마가타엘라 파스토리스의 HCP1 상동체 (homolog)
서열번호 20: NCBI 등록 번호: BA75_00021T0의 아미노산 서열 [Komagataella pastoris], GenBank: ANZ74151.1;
코마가타엘라 파스토리스의 HCP2 상동체
서열번호 21: NCBI 등록 번호: BA75_01624T0의 아미노산 서열 [Komagataella pastoris], GenBank: ANZ73790.1;
코마가타엘라 파스토리스의 HCP3 상동체
서열번호 22: NCBI 등록 번호: BA75_01931T0의 아미노산 서열 [Komagataella pastoris], GenBank: ANZ76017.1;
코마가타엘라 파스토리스의 HCP4 상동체
서열번호 23: NCBI 등록 번호: BA75_00070T0의 아미노산 서열 [Komagataella pastoris]; GenBank: ANZ73364.1 ;
사카로마이세스 세레비지애의 HCP2 상동체
서열번호 24: NCBI 등록 번호: SCW10의 아미노산 서열 [Saccharomyces cerevisiae], GenBank: KZV09161.1; >SCW10 YMR305C SGDID:S000004921;
사카로마이세스 세레비지애의 HCP2 상동체
서열번호 25: NCBI 등록 번호: SCW4의 아미노산 서열 [Saccharomyces cerevisiae], GenBank: KZV11513.1; >SCW4 YGR279C SGDID:S000003511 ;
사카로마이세스 세레비지애의 HCP3 상동체
서열번호 26: NCBI 등록 번호: SUN4의 아미노산 서열 [Saccharomyces cerevisiae]; GenBank: CAA95939.1; >SUN4 YNL066W SGDID:S000005010.
도 2: HCP1 녹아웃 균주의 PCR-기반 검증. HCP1을 암호화하는 유전자를 스플릿-마커-카세트 시스템을 이용하여 CBS2612 야생형 균주 내에서, 그리고 3개의 목적 단백질 (POI1-3) 중 각각을 발현하는 3개의 균주 내에서 부분적으로 결실시켰다. 프라이머 쌍 (Control_Forward 및 Control_Reverse)을 사용하는 검증 PCR은 게놈 유전자좌가 여전히 완전한 경우인 3699bp와 비교할 때 HCP1 녹아웃의 경우 4602bp의 PCR 산물을 제공한다. PCR 산물 상의 2개의 제한효소 분해는 PCR 증폭물을 추가로 검증하기 위해 EcoRI 또는 NcoI을 이용하여 수행된다. 양성 녹아웃 균주의 PCR 산물은 EcoRI (4602bp 단편)에 의해 절단되지 않는 반면; NcoI (1955bp 및 2647bp 단편)에 의해서는 분해된다. 모든 녹아웃 균주에 대해, 성공적인 결실이 확인될 수 있었다.
도 3: 백그라운드 HCP1 KO 균주의 PCR-기반 검증.
도 4: 야생형 피키아 (CBS2612) 및 3가지 POI 중 어느 하나를 발현하는 야생형 피키아 균주에서 다른 모든 HCP 대비 HCP1의 풍부도의 그래픽 표현. HCP1은 발효 샘플의 마지막에 놀랍게도 총 HCP 함량의 43-70%을 차지한다.
도 5: 야생형 균주 대비 HCP1 KO 균주의 총 HCP의 20-79% 감소.
본 명세서에 걸쳐 사용된 구체적인 용어는 하기 의미를 가진다.
본 명세서에서 사용된 용어 "숙주 세포"는 숙주 세포의 단일 세포, 단일 세포 클론, 또는 세포주를 지칭할 것이다.
본 명세서에서 사용된 용어 "세포주"는 장기간에 걸쳐 증식하는 능력을 획득한 특정 세포 유형의 확립된 클론을 지칭한다. 세포주는 내인성 또는 재조합 유전자, 또는 폴리펩티드를 생산하는 대사 경로의 산물 또는 이런 폴리펩티드에 의해 매개된 세포 대사산물을 발현하는데 일반적으로 사용된다. "생산 숙주 세포주" 또는 "생산 세포주"는 POI와 같은 생산 공정의 산물을 얻기 위해 생물반응기에서 세포 배양에 즉시 사용할 수 있는 세포주인 것으로 일반적으로 이해된다.
본 명세서에서 기술된 POI를 생산하는 숙주 세포는 "생산 숙주 세포"로도 지칭되며, 각각의 세포주는 "생산 세포주"로도 지칭된다.
본 명세서에서 기술된 특정 실시양태는 낮은 HCP 발현을 특징으로 하는 생산 숙주 세포주를 지칭한다.
용어 "진핵 숙주 세포"는 POI 또는 숙주 세포 대사산물을 생성하도록 배양될 수 있는 임의의 진핵 세포 또는 유기체를 의미할 것이다. 이 용어는 인간을 포함하지 않는 것으로 이해된다.
숙주 세포와 관련하여 본 명세서에서 사용된 용어 "세포 배양물"은 인공적인 환경, 예를 들어, 시험관내 환경에서, 성장, 분화 또는 지속적인 생존력을 선호하는 조건하에서, 세포의 활성 또는 정지 상태에서, 구체적으로 업계에 공지된 방법에 따라 제어된 생물반응기에서의, 세포의 지속을 지칭한다.
적절한 배양 배지를 이용하여 세포 배양물을 배양할 때, 세포는 배양 용기 내의 배지 또는 기질과, 세포 배양물 내 세포 배양을 지원하기에 적절한 조건하에서 접촉하게 된다. 본 명세서에서 기술된 것과 같이, 진핵 세포, 구체적으로 효모 또는 사상성 진균의 성장을 위해 사용될 수 있는 배양 배지가 제공된다. 표준 세포 배양 기술은 당업계에 잘 알려져 있다.
본 명세서에서 기재된 것과 같은 세포 배양은 특히 분비된 POI의 생산을 제공하는 기술, 예를 들어 세포 배양 배지 내 POI를 얻기 위한 기술을 이용하며, 분비된 POI는 본 명세서에서 "세포 배양 상등액"으로 지칭되는 세포 바이오매스로부터 분리 가능하고, 보다 높은 순도로 POI를 수득하도록 정제될 수 있다. 단백질 (예를 들어, HCP 또는 POI와 같은)이 세포 배양물 내 숙주 세포에 의해 생산 및 분비될 때, 이러한 단백질은 세포 배양 상등액 내로 분비되며, 숙주 세포 바이오매스로부터 세포 배양 상등액을 분리하고, 선택적으로는 정제된 단백질 제제를 생산하도록 단백질을 추가로 정제함으로써 얻어질 수 있는 것으로 본 명세서에서 이해된다.
세포 배양 배지는 제어된, 인공 및 시험관내 환경에서 세포를 유지 및 성장시키는데 필수적인 영양분을 제공한다. 세포 배양 배지의 특성 및 조성은 특정 세포 요건에 따라 다양하다. 중요한 파라미터는 삼투질농도 (osmolality), pH, 및 영양분 제제를 포함한다. 영양분의 공급은 당업계에 공지된 방법에 따라 연속 또는 불연속적 방식으로 수행될 수 있다.
회분식 공정은 세포 배양에 필요한 모든 영양분이 초기 배양 배지에 포함되어, 추가 영양분을 발효 동안 추가로 공급할 필요가 없는 세포 배양 방식인 반면, 유가식 공정에서는, 회분 단계 이후 1 이상의 영양분이 배양물에 투입되어 공급되는 투입 단계가 나타난다. 대부분의 공정에서 투입 방식은 결정적이고 중요하지만, 본 명세서에서 기술된 숙주 세포 및 방법은 특정 방식의 세포 배양에 관하여 제한되지 않는다.
특정 실시양태에서, 세포 배양 공정은 유가식 공정이다. 구체적으로, 원하는 재조합 POI를 암호화하는 핵산 컨스트럭트로 형질전환된 숙주 세포는, 성장 단계에서 배양되며 원하는 재조합 POI를 생산하기 위하여 생산 단계로 이동한다.
다른 실시양태에서, 본 명세서에서 기술된 숙주 세포는 연속 방식으로, 예를 들어, 케모스탯 (chemostat)에서 배양된다. 연속 발효 공정은 생물반응기로 새로운 배양 배지를 정의된, 일정하고 연속적인 속도로 투입하는 것을 특징으로 하며, 이에 따라 동시에 배양액은 정의된, 일정하고 연속적인 제거 속도로 생물반응기로부터 제거된다. 배양 배지, 투입 속도 및 제거 속도를 동일한 일정한 수준으로 유지함으로써, 생물반응기에서 세포 배양 파라미터 및 조건은 일정하게 유지된다.
재조합 POI는 적절한 배지에서 배양하고, 발현된 산물 또는 대사산물을 배양물로부터 단리하고, 선택적으로는 적절한 방법에 의해 정제함으로써, 본 명세서에서 기술된 숙주 세포 및 각각의 세포주를 이용하여 생산될 수 있다.
본 명세서에서 기술된 것과 같은 POI의 생산을 위한 여러 상이한 접근법이 바람직하다. POI는 진핵 숙주 세포를 관련 단백질을 암호화하는 재조합 DNA를 보유하는 발현 벡터로 형질전환시키고, 형질전환된 세포의 배양물을 제조하고, 배양물을 성장시키고, 전사 및 POI 생산을 유도하며, POI를 회수함으로써 발현, 가공 및 선택적으로는 분비될 수 있다.
본 명세서에서 사용되는 용어 "숙주 세포 단백질", 약칭 "HCP"는 숙주 세포에 의해 생산되는 개별 분비 단백질을 지칭한다. 숙주 세포가 POI를 발현하는 경우, HCP는 POI의 부산물로서 이해된다. 따라서 POI는 HCP로서 이해되지 않는다. HCP는 세포가 세포 배양 배지로부터 예를 들어, 원심분리에 의해 분리되면 일반적으로 세포 배양 배지 또는 세포 배양 상등액에 존재한다. 모든 HCP의 합을 "총 HCP"라고 한다. HCP는 예를 들어, POI, 또는 POI 제제를 포함하는 숙주 세포 산물의 제제를 오염시킬 위험이 있다. POI 산물 내 오염물 HCP의 존재를 분석하기 위한 현재 분석 방법은 ELISA, HPLC, 모세관 전기영동, SDS-PAGE, 또는 질량 분석법을 포함하며, 구체적으로 여기서 질량 분석법은 예를 들어, 당업계에 공지되고/되거나 실시예 항목에서 기술된 것과 같이 액체 크로마토그래피-질량 분석법 (LC-MS), 또는, 바람직하게 액체 크로마토그래피 텐덤-질량 분석법 (LC-MS/MS)이다.
본 명세서에서 기술된 숙주 세포에 대하여 일반적으로 그의 발현 능력, HCP 함량 또는 POI 수율이 임의의 하기 시험에 의해 시험된다: ELISA, 활성 어세이, HPLC, 또는 SDS-PAGE 및 웨스턴 블롯팅 기술, 또는 질량 분석법과 같은 다른 적절한 시험.
각각의 세포 내 이러한 유전적 변형이 없는 균주와 비교하여, 유전적 변형이 세포 배양물 내 HCP의 감소 및 예를 들어, 이렇게 생산된 POI 내 불순물의 양에 미치는 효과를 확인하기 위하여, 숙주 세포주는 미세역가 플레이트, 진탕 플라스크, 또는 생물반응기 내에서 유가식 또는 케모스탯 발효를 이용하여 배양될 수 있다.
본 명세서에서 기술된 생산 방법은 구체적으로 파일럿 또는 산업 규모로의 발효를 가능케 한다. 산업 공정 규모는 바람직하게 적어도 10 L, 구체적으로 적어도 50 L, 바람직하게는 적어도 1 m3, 바람직하게는 적어도 10 m3, 가장 바람직하게는 적어도 100 m3의 부피를 이용할 것이다.
산업 규모의 생산 조건이 바람직하며, 이는 예를 들어, 수일의 일반적인 공정 시간을 이용하는 100 L 내지 10 m3 이상의 반응기 부피에서의 유가식 배양, 또는 약 0.02 - 0.15 h-1의 희석 속도, 약 50 - 1000 L 이상의 반응기 부피에서의 연속 공정을 지칭한다.
본 명세서에서 기술된 목적을 위해 사용된 장치, 설비 및 방법은 구체적으로, 원핵 및/또는 진핵 세포주를 포함하는 임의의 원하는 세포주를 배양하거나 그 배양과 함께 사용하기에 적절하다. 나아가, 실시양태에서, 장치, 설비 및 방법은 현탁 세포 또는 고정-의존성 (접착성) 세포를 포함하는 임의의 세포 유형을 배양하기에 적절하며, 폴리펩티드 산물 (POI), 핵산 산물 (예를 들어 DNA 또는 RNA), 또는 세포 및/또는 바이러스 치료에 사용되는 것과 같은 세포 및/또는 바이러스와 같은, 약학 및 생약학 산물의 생산을 위해 구성된 생산 작업에 적절하다.
실시양태에서, 세포는 재조합 치료용 또는 진단용 제품과 같은 산물을 발현 또는 생산한다. 본 명세서에서 상세하게 기술한 것과 같이, 세포에 의해 생산된 산물의 예는 이에 제한되지 않으나, 항체 분자 (예를 들어, 단일클론 항체, 이중특이적 항체), 항체 모방체 (항원에 특이적으로 결합하지만 항체와 구조적으로 관련이 없는, 예를 들어, 다르핀 (DARPin), 아피바디, 애드넥틴, 또는 IgNAR과 같은 폴리펩티드 분자), 융합 단백질 (예를 들어, Fc 융합 단백질, 키메릭 사이토카인), 다른 재조합 단백질 (예를 들어, 글리코실화 단백질, 효소, 호르몬), 또는 바이러스 치료제 (예를 들어, 유전자 치료 및 바이러스 면역치료를 위한 항-암 종양분해 바이러스, 바이러스성 벡터), 세포 치료제 (예를 들어, 만능 줄기세포, 중간엽 줄기세포 및 성체 줄기세포), 백신 또는 지질-캡슐화된 입자 (예를 들어, 엑소좀, 바이러스-유사 입자), RNA (예를 들어, siRNA와 같은) 또는 DNA (예를 들어, 플라스미드 DNA와 같은), 항생제 또는 아미노산을 포함하여 본 명세서에서 예시된 것과 같은 POI를 포함한다. 실시양태에서, 장치, 설비 및 방법은 바이오시밀러를 생산하는데 사용될 수 있다.
언급한 것과 같이, 실시양태에서, 장치, 설비 및 방법은 진핵 세포, 예를 들어, 포유류 세포 또는 예를 들어 효모 세포 또는 사상성 진균 세포와 같은 하위 진핵 세포, 또는 그람양성 또는 그람음성 세포와 같은 원핵 세포 및/또는 진핵 또는 원핵 세포의 산물, 예를 들어, 대규모 방식으로 상기 세포에 의해 합성된 단백질, 펩티드를 포함하는 POI, 또는 항생제, 아미노산, 핵산 (DNA 또는 RNA와 같은)이 생산되도록 한다. 본 명세서에서 달리 언급하지 않는 한, 장치, 설비 및 방법은 이에 제한되지 않으나 실험실 규모, 파일럿 규모, 및 전체 생산 규모 능력을 포함하는 임의의 원하는 부피 또는 생산 능력을 포함할 수 있다.
또한, 본 명세서에서 달리 언급하지 않는 한, 장치, 설비 및 방법은 이에 제한되지 않으나 교반 탱크, 에어리프트, 섬유, 극세사, 중공사, 세라믹 매트릭스, 유동층, 고정층, 및/또는 분출층 생물반응기를 포함하는 임의의 적절한 반응기(들)을 포함할 수 있다. 본 명세서에서 사용되는, "반응기"는 배양기 또는 배양 유닛, 또는 임의의 다른 반응 용기를 포함할 수 있으며 용어 "반응기"는 "배양기"와 상호교환적으로 사용된다. 예를 들어, 일부 양태에서, 예시적인 생물반응기 유닛은 하기 중 1 이상, 또는 모두를 수행할 수 있다: 영양분 및/또는 탄소원의 공급, 적절한 기체 (예를 들어, 산소)의 주입, 발효 또는 세포 배양 배지의 유입 및 유출 흐름, 기체 및 액체상의 분리, 온도 유지, 산소 및 CO2 수준의 유지, pH 수준의 유지, 교반 (예를 들어, 뒤섞음), 및/또는 세척/살균. 배양 유닛과 같은 예시적인 반응기 유닛은 유닛 내에 복수의 반응기를 포함할 수 있는데, 예를 들어 유닛은 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 또는 100, 또는 그 이상의 생물반응기를 각 유닛에 가질 수 있고/있거나, 설비는 설비 내에 단일 또는 복수의 반응기를 갖는 유닛을 복수개 포함할 수 있다. 다양한 실시양태에서, 생물반응기는 회분식, 반 유가식, 유가식, 관류, 및/또는 연속 발효 공정에 적합할 수 있다. 임의의 적합한 반응기 직경이 사용될 수 있다. 실시양태에서, 생물반응기는 약 100 mL 내지 약 50,000 L의 부피를 가질 수 있다. 비제한적인 예는 100 mL, 250 mL, 500 mL, 750 mL, 1 리터, 2 리터, 3 리터, 4 리터, 5 리터, 6 리터, 7 리터, 8 리터, 9 리터, 10 리터, 15 리터, 20 리터, 25 리터, 30 리터, 40 리터, 50 리터, 60 리터, 70 리터, 80 리터, 90 리터, 100 리터, 150 리터, 200 리터, 250 리터, 300 리터, 350 리터, 400 리터, 450 리터, 500 리터, 550 리터, 600 리터, 650 리터, 700 리터, 750 리터, 800 리터, 850 리터, 900 리터, 950 리터, 1000 리터, 1500 리터, 2000 리터, 2500 리터, 3000 리터, 3500 리터, 4000 리터, 4500 리터, 5000 리터, 6000 리터, 7000 리터, 8000 리터, 9000 리터, 10,000 리터, 15,000 리터, 20,000 리터, 및/또는 50,000 리터의 부피를 포함한다. 또한, 적합한 반응기는 다-용도, 단일-용도, 일회용, 또는 비-일회용일 수 있으며 스테인리스 스틸 (예를 들어, 316L 또는 임의의 기타 적절한 스테인리스 스틸) 및 인코넬 (Inconel)과 같은 금속 합금, 플라스틱, 및/또는 유리를 포함한 임의의 적절한 재료로 형성될 수 있다.
실시양태에서, 본 명세서에서 달리 언급하지 않는 한, 본 명세서에서 기술된 장치, 설비 및 방법은 이러한 산물의 분리, 정제, 및 단리를 위한 작동 및/또는 장비와 같은, 달리 언급되지 않은 임의의 적절한 유닛 작동 및/또는 장비를 또한 포함할 수 있다. 전통적인 스틱빌트 (stick-built) 설비, 모듈식, 이동식 및 임시 설비, 또는 임의의 기타 적절한 건축, 설비, 및/또는 레이아웃과 같은, 임의의 적절한 설비 및 환경이 사용될 수 있다. 예를 들어, 일부 실시양태에서 모듈식 클린룸이 사용될 수 있다. 또한, 달리 언급하지 않는 한, 본 명세서에서 기술된 장치, 시스템, 및 방법이 단일 위치 또는 설비에 수용되고/되거나 여기서 수행될 수 있거나 대안적으로 별개의 또는 다수의 위치 및/또는 설비에 수용되고/되거나 여기서 수행될 수 있다.
적절한 기술은 회분 단계에서 시작하여, 높은 비 성장 속도의 짧은 지수곡선의 유가 단계를 거쳐, 나아가 낮은 비 성장 속도의 유가 단계로 이어지는 생물반응기에서 배양하는 것을 포함할 수 있다. 다른 적절한 배양 기술은 회분 단계에 이어, 임의의 적절한 비 성장 속도 또는 POI 생산 시간 동안 높았다가 낮아지는 성장 속도, 또는 POI 생산 시간 동안 낮았다가 높아지는 성장 속도와 같은 조합의 비 성장 속도의 유가 단계를 포함할 수 있다. 다른 적절한 배양 기술은 회분 단계에 이어, 낮은 희석 속도의 연속 배양 단계를 포함할 수 있다.
바람직한 실시양태는 바이오매스를 제공하는 회분식 배양에 이어 고수율 POI 생산을 위한 유가식 배양을 포함한다.
적어도 1 g/L 세포 건조 중량, 더욱 바람직하게 적어도 10 g/L 세포 건조 중량, 바람직하게 적어도 20 g/L 세포 건조 중량, 바람직하게 적어도 30, 40, 50, 60, 70, 또는 80 g/L 중 어느 하나의 세포 건조 중량의 세포 밀도를 얻기 위한 성장 조건하에서 생물반응기에서 본 명세서에서 기술된 숙주 세포를 배양하는 것이 바람직하다. 파일럿 또는 산업 규모로 이러한 수율의 바이오매스 생산을 제공하는 것이 유리하다.
바이오매스가 축적되도록 하는 성장 배지, 구체적으로 기초 성장 배지는 일반적으로 탄소원, 질소원, 황 공급원 및 포스페이트 공급원을 포함한다. 일반적으로, 이러한 배지는 미량 원소 및 비타민을 추가로 포함하고, 아미노산, 펩톤 또는 효모 추출물을 추가로 포함할 수 있다.
바람직한 질소원은 NH4H2PO4, 또는 NH3 또는 (NH4)2SO4를 포함하고;
바람직한 황 공급원은 MgSO4, 또는 (NH4)2SO4 또는 K2SO4를 포함하고;
바람직한 포스페이트 공급원은 NH4H2PO4, 또는 H3PO4 또는 NaH2PO4, KH2PO4, Na2HPO4 또는 K2HPO4를 포함하고;
추가의 일반적인 배지 성분은 KCl, CaCl2, 및 Fe, Co, Cu, Ni, Zn, Mo, Mn, I, B와 같은 미량 원소를 포함하고;
바람직하게 배지는 비타민 B7이 보충되고;
피키아 파스토리스에 대한 일반적인 성장 배지는 글리세롤, 소르비톨 또는 글루코스, NH4H2PO4, MgSO4, KCl, CaCl2, 비오틴, 및 미량 원소를 포함한다.
생산 단계에서 생산 배지는 구체적으로 한정된 양의 보충적 탄소원과만 함께 사용된다.
바람직하게 숙주 세포주는 적절한 탄소원이 있는 미네랄 배지에서 배양되어, 단리 공정을 상당히 추가로 단순화시킨다. 바람직한 미네랄 배지의 예는, 예를 들어, 영양요구를 보충하기 위한, 이용가능한 탄소원 (예를 들어, 글루코스, 글리세롤, 소르비톨 또는 메탄올), 대량 원소 (칼륨, 마그네슘, 칼슘, 암모늄, 클로라이드, 설페이트, 포스페이트) 및 미량 원소 (구리, 요오드, 망간, 몰리브데이트, 코발트, 아연, 및 철 염, 및 붕산)를 포함하는 염, 및 선택적으로 비타민 또는 아미노산을 포함하는 것이다.
구체적으로, 세포는 원하는 POI의 발현에 영향을 미치기에 적절한 조건하에서 배양되는데, 이는 발현 시스템 및 발현된 단백질의 성질, 예를 들어, 단백질이 신호 펩티드에 융합되는지 및 단백질이 가용성인지 또는 막-결합되어 있는지에 따라, 세포 또는 배양 배지로부터 정제될 수 있다. 당업자에 의해 이해되는 것과 같이, 배양 조건은 사용된 숙주 세포의 유형 및 특정 발현 벡터를 포함하는 인자에 따라 달라질 것이다.
일반적인 생산 배지는 보충 탄소원, 및 추가의 NH4H2PO4, MgSO4, KCl, CaCl2, 비오틴, 및 미량 원소를 포함한다.
예를 들어, 발효에 가해지는 보충 탄소원의 공급물은 최대 50 중량%의 이용가능한 당을 갖는 탄소원을 포함할 수 있다.
발효는 바람직하게 3 내지 8 범위의 pH에서 수행된다.
일반적인 발효 시간은 20℃ 내지 35℃, 바람직하게 22-30℃ 범위의 온도에서 약 24 내지 120시간이다.
POI는 바람직하게 적어도 1mg/L, 바람직하게 적어도 10mg/L, 바람직하게 적어도 100mg/L, 가장 바람직하게는 적어도 1g/L의 수율을 생산하는 조건을 사용하여 발현된다.
본 명세서에서 사용되는 용어 "발현" 또는 "발현 카세트"는 작동가능하게 연결된 원하는 암호화 서열 및 제어 서열을 포함하여 이들 서열로 형질전환 또는 형질감염된 숙주가 암호화된 단백질 또는 숙주 세포 대사산물을 생산할 수 있는 핵산 분자를 지칭한다. 형질전환을 하기 위해, 발현 시스템은 벡터에 포함될 수 있으나, 관련 DNA가 또한 숙주 염색체에 통합될 수 있다. 발현은 폴리펩티드 또는 대사산물을 포함하는, 분비 또는 비분비 발현 산물을 지칭할 수 있다.
발현 카세트는 예를 들어, "벡터" 또는 "플라스미드"의 형태의 발현 컨스트럭트로서 편리하게 제공되며, 일반적으로 적절한 숙주 유기체에서 클로닝된 재조합 뉴클레오티드 서열, 즉, 재조합 유전자의 전사 및 mRNA 번역에 필요한 DNA 서열이다. 발현 벡터 또는 플라스미드는 대개 숙주 세포 내 자율 복제의 기원, 선택 마커 (예를 들어, 아미노산 합성 유전자 또는 제오신, 카나마이신, G418 또는 히그로마이신, 노우세오츠리신 (nourseothricin)과 같은 항생제에 내성을 부여하는 유전자), 다수의 제한 효소 절단 부위, 적절한 프로모터 서열 및 전사 종결자를 포함하며, 성분들은 작동가능하게 서로 연결된다. 본 명세서에서 사용되는 용어 "플라스미드" 및 "벡터"는 인공 염색체, 예를 들어, 효모 인공 염색체 (YAC)와 같은 자율 복제 뉴클레오티드 서열 및 게놈 통합 뉴클레오티드 서열을 포함한다.
발현 벡터는 이에 제한되는 것은 아니나 클로닝 벡터, 변형된 클로닝 벡터 및 구체적으로 설계된 플라스미드를 포함할 수 있다. 본 명세서에서 기술된 바람직한 발현 벡터는 재조합 유전자를 진핵 숙주 세포에서 발현하기에 적절한 발현 벡터이며 숙주 유기체에 따라 선택된다. 적절한 발현 벡터는 일반적으로 진핵 숙주 세포에서 POI를 암호화하는 DNA를 발현하기에 적합한 조절 서열을 포함한다. 조절 서열의 예는 작동자, 인핸서, 리보솜 결합 부위, 및 전사 및 번역의 개시 및 종결을 제어하는 서열을 포함한다. 조절 서열은 발현될 DNA 서열에 작동가능하게 연결될 수 있다.
숙주 세포에서 재조합 뉴클레오티드 서열이 발현되도록 하기 위해, 발현 벡터는 암호화 서열의 5' 말단에 인접하게, 예를 들어, 목적 유전자 (GOI) 또는 POI의 분비를 가능하게 하는 신호 펩티드 유전자의 상류에 프로모터를 제공할 수 있다. 이로 인해 전사는 그 프로모터 서열에 의해 조절되고 개시된다.
본 명세서에서 기술된 발현 컨스트럭트는 구체적으로 상기 프로모터의 전사 제어 하에서 POI를 암호화하는 뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 포함한다. 구체적으로, 프로모터는 POI의 암호화 서열과 선천적으로 관련되지는 않는다.
또한 다중클로닝 부위를 갖는 벡터인 다중클로닝 벡터는 본 명세서에서 기술된 것과 같이 사용될 수 있는데, 여기서 원하는 이종 유전자는 발현 벡터를 제공하기 위하여 다중클로닝 부위에서 통합될 수 있다. 다중클로닝 벡터의 경우, POI의 유전자가 다중클로닝 부위로 도입되기 때문에, 프로모터는 일반적으로 다중클로닝 부위의 상류에 위치한다.
본 명세서에서 사용되는 용어 "내인성"은 내인성 단백질을 감소시키기 위한 변형 전에, 야생형 (천연의) 숙주 세포에 존재하는 이들 분자 및 서열, 구체적으로 내인성 단백질을 포함하는 것을 의미한다. 구체적으로, 자연에서 발견되는 것과 같이 특정 숙주 세포에서 나타나는 (그리고 특정 숙주 세포에서 얻어질 수 있는) 내인성 핵산 분자 (예를 들어, 유전자) 또는 단백질은 "숙주 세포 내인성" 또는 "숙주 세포에 내인성"인 것으로 이해된다. 또한, 핵산 또는 단백질을 "내인성으로 발현하는" 세포는, 자연에서 발견되는 것과 동일한 특정 유형의 숙주와 같이 핵산 또는 단백질을 발현한다. 또한, 핵산, 단백질, 또는 다른 화합물을 "내인성으로 생산하는" 또는 "내인성으로 생산"하는 숙주 세포는 자연에서 발견되는 것과 동일한 특정 유형의 숙주 세포와 같이 핵산, 단백질, 또는 화합물을 생산한다.
따라서, 단백질 암호화 유전자가 비활성화되거나 결실된 숙주 세포의 녹아웃 돌연변이에서와 같이, 내인성 단백질이 더이상 숙주 세포에 의해 생산되지 않더라도, 단백질은 본 명세서에서 여전히 "내인성"으로 지칭된다.
뉴클레오티드 또는 아미노산 서열 또는 단백질과 관련하여 본 명세서에서 사용되는 용어 "이종성"은, 주어진 숙주 세포에 대해 자연에서 발견되지 않는 것과 같이 외래성, 즉, "외인성"을 갖거나; 예를 들어, 이종 핵산을 사용하는 이종 컨스트럭트의 맥락에서는 주어진 숙주 세포에서 자연적으로 발견되는, 예를 들어, "내인성"인 화합물을 지칭한다. 내인성으로 확인된 이종 뉴클레오티드 서열은 또한 비천연의 양으로, 예를 들어, 예상보다 많거나 자연적으로 발견되는 것에 비해 많은 양으로 세포에서 생산될 수 있다. 이종 뉴클레오티드 서열, 또는 이종 뉴클레오티드 서열을 포함하는 핵산은 내인성 뉴클레오티드 서열과 서열이 다를 수 있지만, 내인성으로 발견된 것과 동일한 단백질을 암호화한다. 구체적으로, 이종 뉴클레오티드 서열은 사실상 숙주 세포와 동일한 관계에서 발견되지 않은 것이다. 임의의 재조합 또는 인공 뉴클레오티드 서열은 이종성인 것으로 이해된다. 이종 폴리뉴클레오티드의 예는, 예를 들어, 하이브리드 프로모터를 얻기 위해 프로모터와 선천적으로 관련되지 않거나, 본 명세서에서 기술된 것과 같이 암호화 서열에 작동가능하게 연결된 뉴클레오티드 서열이다. 결과적으로, 하이브리드 또는 키메릭 폴리뉴클레오티드가 얻어질 수 있다. 이종 화합물의 추가 예는 전사 컨트롤 요소, 예를 들어, 내인성의, 자연 발생된 POI 암호화 서열이 정상적으로 작동가능하게 연결되지 않은 프로모터에 작동가능하게 연결된 POI 암호화 폴리뉴클레오티드이다.
본 명세서에서 기술된 용어 "숙주 세포"는 구체적으로 인공 유기체 및 천연의 (야생형) 숙주 세포의 파생물을 지칭한다. 예를 들어, 구체적으로 1 이상의 유전적 변형, 발현 컨스트럭트, 형질전환된 숙주 세포 및 재조합 단백질을 언급하는, 본 명세서에서 기술된 숙주 세포, 방법 및 용도는 자연적으로 발생되지 않은, "인공" 또는 합성이며, 따라서 "자연 법칙"의 결과로 간주되지 않는 것으로 잘 알려져 있다.
숙주 세포는 구체적으로 세포에 의해 생산되고 세포 배양 상등액에서 얻은 숙주 세포의 내인성 HCP의 양을 감소시키도록 조작된 재조합 숙주 세포이다. 구체적으로 야생형 숙주 세포의 배양물에 풍부한 1 이상의 단백질은 발현을 감소시키기 위한 유전자 변형의 표적이다. 단백질이 세포 배양 상등액에 높은 수준으로 존재하는 경우, 예를 들어, 총 HCP의 적어도 10%, 또는 적어도 5% (mol/mol)의 양인 경우, 단백질은 특히 풍부한 것으로 간주된다. 특정 실시양태에 따르면, 숙주 세포는 가장 풍부하게 분비된 내인성 단백질 중 적어도 하나, 둘, 또는 셋을 암호화하는 숙주 세포 유전자를 넉다운 또는 녹아웃 (유전자 또는 그의 일부의 비활성화 또는 결실을 위해)하도록 조작된다.
구체적으로, 결실 균주가 제공되며, 여기서 유전자는 파괴된다.
본 명세서에서 사용되는 용어 "파괴"는 넉다운 또는 녹아웃과 같은, 숙주 세포에서 1 이상의 내인성 단백질의 발현을 완전히 제거하는 유의한 감소를 지칭한다. 이는 숙주 세포의 배양 배지 내 1 이상의 내인성 단백질의 존재로 예를 들어 질량 분석법에 의해서 측정될 수 있는데, 여기서 내인성 단백질의 총 함량은 역치 미만이거나 검출 불가능할 수 있다.
용어 "파괴된"은 구체적으로 유전자 침묵, 유전자 넉다운, 유전자 녹아웃, 우성 음성 컨스트럭트의 전달, 조건부 유전자 녹아웃으로 이루어지는 군에서 선택되는 적어도 하나의 단계 및/또는 특정 유전자에 대한 유전자 변경에 의한, 유전자 조작의 결과를 지칭한다.
유전자 발현의 맥락에서 본 명세서에서 사용되는 용어 "넉다운", "감소" 또는 "손상"은 대조군 세포에서의 발현 대비 주어진 유전자의 발현을 감소시키는 실험적 접근법을 지칭한다. 유전자 넉다운은 유전자의 mRNA의 일부와 혼성화하여 그의 분해를 유도하는 핵산 분자 (예를 들어, shRNA, RNAi, miRNA)를 세포 내로 도입시키는 것, 또는 감소된 전사, 감소된 mRNA 안정성 또는 감소된 mRNA 번역을 야기하는 방식으로 유전자의 서열을 변경하는 것과 같은 다양한 실험 수단에 의해 이루어질 수 있다.
주어진 유전자의 완전한 발현 억제는 "녹아웃"으로 지칭된다. 유전자의 녹아웃은 상기 유전자로부터 기능적 전사체가 합성되지 않아 이 유전자에 의해 정상적으로 제공되는 기능의 상실을 초래하는 것을 의미한다. 유전자 녹아웃은 DNA 서열을 변경하여 유전자 또는 그의 조절 서열, 또는 그 유전자 또는 조절 서열의 일부의 파괴 또는 결실을 초래함으로써 이루어진다. 녹아웃 기술은 예를 들어, 문헌 [Gaj et al., Trends Biotechnol. 2013; 31(7): 397-405]에 기술된 것과 같이, 중요한 부분 또는 전체 유전자 서열을 대체, 방해 또는 결실시키는 상동 재조합 기법의 사용 또는 표적 유전자의 DNA에 이중 가닥 파괴를 도입하기 위한 징크-핑거 또는 메가-뉴클레아제와 같은 DNA-변형 효소의 사용을 포함한다.
특정 실시양태는 숙주 세포 내로 형질감염된 1 이상의 녹아웃 플라스미드를 이용한다. 상동 재조합에 의해 숙주 세포에서 표적 유전자가 파괴될 수 있다. 이 과정은 일반적으로 표적 유전자의 모든 대립유전자가 안정적으로 제거될 때까지 반복된다.
본 명세서에서 기술된 것과 같이 특정 유전자를 녹아웃시키기 위한 하나의 특정한 방법은 예를 들어, 문헌 [Weninger et al., J. Biotechnol. 2016, 235: 139-49]에 기술된 것과 같은 CRISPR-Cas9 방법이다.
다른 실시양태는 숙주 세포를 형질감염시키기 위한 짧은 간섭 RNA (siRNA)의 사용 및 상기 숙주 세포에 의해 내인성으로 발현된 표적 단백질 오염물을 암호화하는 mRNA의 표적화에 의한, 표적 mRNA 분해를 지칭한다.
본 명세서에서 사용되는 용어 "유전자 발현"은 mRNA로의 DNA 전사, mRNA 가공, 비-암호화 mRNA 성숙, mRNA 방출, 번역, 단백질 접힘 및/또는 단백질 수송으로 이루어지는 군에서 선택되는 적어도 하나의 단계를 포함하는 것으로 의도된다.
유전자의 유전자 발현은 이에 제한되지 않으나, 예를 들어, 특정 프로모터-관련 억제자의 사용, 정해진 프로모터의 부위 특이적 돌연변이 유발, 프로모터 교환에 의한 DNA 전사의 저해 또는 감소, 또는 예를 들어, RNAi 유도된 전사후 유전자 침묵에 의한 번역의 저해 또는 감소를 포함하는, 유전자 발현을 직접적으로 방해하는 방법에 의해 저해 또는 감소될 수 있다. 감소된 활성을 갖는 기능이상 또는 비활성 유전자 산물의 발현은 예를 들어, 암호화 유전자 내 부위 특이적 또는 무작위 돌연변이 유발, 삽입 또는 결실에 의해 이루어질 수 있다.
유전자 산물의 활성의 저해 또는 감소는 예를 들어, 단백질 발현 이전에 또는 이와 동시에, 각각의 효소에 대한 저해제를 투여하거나 이와 함께 배양하여 이루어질 수 있다. 이러한 저해제의 예로는, 이에 제한되지 않으나 저해 펩티드, 항체, 압타머, 융합 단백질 또는 상기 효소, 또는 리간드 또는 그의 수용체, 또는 저해 펩티드 또는 핵산, 또는 저분자에 대한 유사한 결합 활성을 갖는 항체 모방체가 포함된다. 효소를 저해하는 다른 방법은 PAM 특이적 이온 보조인자인 구리 (예를 들어, CuSO4의 형태), PAM의 전자 공여체로 작용하는 아스코르베이트, 분자 산소, 카탈라제 및 오늘날 당업자에게 공지되어 있거나 이제 미래에 발견될 것들과 같은, 배지 내 효소의 특정 보조인자의 감소이다.
유전자 침묵, 유전자 넉다운 및 유전자 녹아웃은 유전적 변형을 통해 또는 mRNA 전사체 또는 유전자에 상보적인 서열을 갖는 올리고뉴클레오티드로 처리함으로써, 유전자의 발현이 감소되는 기술을 지칭한다. DNA의 유전적 변형이 수행되는 경우, 결과는 넉다운 또는 녹아웃 유기체이다. 유전자 발현의 변화가 mRNA에 결합하거나 유전자에 일시적으로 결합하는 올리고뉴클레오티드에 의해 야기되는 경우, 이는 염색체 DNA의 변형 없이 유전자 발현의 일시적인 변화를 초래하며 일시적 넉다운으로 지칭된다.
상기 용어에 또한 포함되는 일시적 넉다운에서, 이 올리고뉴클레오티드의 유전자 또는 그의 전사체에 대한 결합은 전사의 차단 (유전자-결합의 경우), mRNA 전사체의 분해 (예를 들어, 짧은 간섭 RNA (siRNA) 또는 RNase-H 의존성 안티센스에 의해) 또는 miRNA와 같은 다른 기능적 RNA의 성숙에 사용되는 mRNA 번역, 전-mRNA 스플라이싱 부위 또는 뉴클레아제 절단 부위의 차단을 통해 발현을 감소시킨다 (예를 들어, 모르폴리노 올리고 또는 다른 RNase-H 의존성 안티센스에 의해). 다른 접근법은 shRNA (짧은 헤어핀 RNA, RNA 간섭을 통해 유전자 발현을 침묵시키는데 사용될 수 있는 단단한 헤어핀 회전을 만드는 RNA 서열), esiRNA (엔도리보뉴클레아제-제조된 siRNA, 엔도리보뉴클레아제와 함께 긴 이중가닥 RNA (dsRNA)의 절단으로 인한 siRNA 올리고의 혼합물)의 사용, 또는 RNA-유도 침묵 복합체 (RISC)의 활성화를 포함한다.
유전자 침묵을 수행하기 위한 다른 접근법인 넉다운 또는 녹아웃은 각각의 문헌으로부터 당업자에게 공지되어 있으며, 본 발명의 문맥에서의 적용은 통상적인 것으로 간주된다. 유전자 녹아웃은 유전자의 발현이 완전히 차단되는, 즉, 각각의 유전자가 작동하지 않거나 심지어 제거되는 기술을 지칭한다. 이 목표를 달성하기 위한 방법론적 접근법은 다양하며 당업자에게 알려져 있다. 예로는 정해진 유전자에 대해 우성 음성인 돌연변이의 제조가 있다. 이러한 돌연변이는 부위 지정 돌연변이 유발 (예를 들어, 결실, 부분 결실, 삽입 또는 핵산 치환)에 의해, 적절한 트랜스포존의 사용에 의해, 또는 각 문헌으로부터 당업자에게 알려져 있으며 본 발명의 문맥에서 그 적용이 통상적인 것으로 간주되는 다른 접근법에 의해 생산될 수 있다. 하나의 예는 표적화된 아연 핑거 뉴클레아제의 사용에 의한 녹아웃이다. 각각의 키트는 시그마 알드리치 (Sigma Aldrich)에 의해 "CompoZR 녹아웃 ZFN"으로 제공된다. 다른 접근법은 전사 활성화제-유사 이펙터 뉴클레아제 (TALEN)의 사용을 포함한다.
우성 음성 컨스트럭트의 전달은 예를 들어, 형질감염에 의해 기능이상 효소를 암호화하는 서열의 도입을 포함한다. 상기 암호화 서열은, 기능이상 효소의 유전자 발현이 야생형 효소의 자연적 발현을 지배하는 방식으로 강한 프로모터에 기능적으로 결합하며, 이는 결국 각각의 효소 활성의 효과적인 생리학적 결함으로 이어진다.
조건부 유전자 녹아웃은 조직- 또는 시간-특이적 방식으로 유전자 발현을 차단하도록 한다. 이는, 예를 들어, 목적 유전자 주위에 loxP 부위라 불리는 짧은 서열을 도입함으로써 수행된다. 또한, 다른 접근법은 각 문헌으로부터 당업자에게 알려져 있으며, 본 발명의 문맥에서 그 적용은 통상적인 것으로 간주된다.
다른 하나의 접근법은 기능이상 유전자 산물 또는 감소된 활성을 갖는 유전자 산물을 초래할 수 있는 유전자 변경이다. 이러한 접근법은 틀 이동 돌연변이, 넌센스 돌연변이 (즉, 미성숙 정지 코돈의 도입) 또는 전체 유전자 산물 기능이상을 만들거나 감소된 활성을 야기하는 아미노산 치환을 초래하는 돌연변이의 도입을 포함한다. 이러한 유전자 변경은 예를 들어 돌연변이 유발 (예를 들어, 결실, 부분 결실, 삽입 또는 핵산 치환), 비특이적 (임의의) 돌연변이 유발 또는 부위 지정 돌연변이 유발에 의해 생산될 수 있다. 유전자 침묵, 유전자 넉다운, 유전자 녹아웃, 우성 음성 컨스트럭트의 전달, 조건부 유전자 녹아웃, 및/또는 유전자 변경의 실제 적용을 기술하는 프로토콜은 통상의 기술자가 일반적으로 이용가능하며 통상적인 것이다. 따라서 본 명세서에서 제공된 기술 교시는 유전자 산물의 유전자 발현의 저해 또는 감소, 또는 기능이상, 또는 비활성화 또는 감소된 활성을 갖는 유전자 산물의 발현을 초래하는 모든 가능한 방법에 대해 전적으로 사용가능하다.
본 명세서에서 기술된 유전적 변형은 문헌 [J. Sambrook et al., Molecular Cloning: A Laboratory Manual (3rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, New York (2001)]에 의해 기술된 것과 같이, 당업계에 알려진 도구, 방법 및 기술을 사용할 수 있다.
본 명세서에서 사용되는 용어 "작동가능하게 연결된"은 1 이상의 뉴클레오티드 서열의 기능이 상기 핵산 분자 상에 존재하는 적어도 하나의 다른 뉴클레오티드 서열에 의해 영향을 받는 방식으로 단일 핵산 분자, 예를 들어, 벡터, 또는 발현 카세트 상의 뉴클레오티드 서열이 연계된 것을 지칭한다. 예를 들어, 프로모터는 암호화 서열의 발현에 영향을 줄 수 있을 때 재조합 유전자의 암호화 서열과 작동가능하게 연결된다. 추가 예로서, 신호 펩티드를 암호화하는 핵산은 성숙 단백질의 전구체 또는 성숙 단백질과 같은 분비 형태로 단백질을 발현시킬 수 있을 때 POI를 암호화하는 핵산 서열에 작동가능하게 연결된다. 구체적으로, 각각에 작동가능하게 연결된 이러한 핵산은 직접적으로, 즉, 신호 펩티드를 암호화하는 핵산과 POI를 암호화하는 핵산 서열 사이에 추가 성분 또는 핵산 서열 없이, 연결될 수 있다.
프로모터가 암호화 서열의 전사를 제어하는 경우, 프로모터 서열은 일반적으로 암호화 서열에 작동가능하게 연결되는 것으로 이해된다. 프로모터 서열이 암호화 서열에 선천적으로 관련되지 않은 경우, 그의 전사는 천연의 (야생형) 세포 내 프로모터에 의해 제어되지 않거나 서열은 상이한 연속 서열과 재조합된다.
프로모터와 같은 조절 요소와 관련하여 용어 "구성적"은 상이한 배지 또는 기질을 이용한, 상이한 세포 배양 조건에서 활성을 갖는 요소를 지칭할 것이다. 효모 세포의 구성적 프로모터 중에서, 특히 GAP 및 TEF 프로모터가 강력하고, 재조합 단백질 생산에 유용한 것으로 설명된다.
프로모터가 유도의 필요성, 또는 억제 가능성 없이 발현을 제어할 수 있는 경우 그 프로모터는 구체적으로 구성적 프로모터로 이해된다. 따라서, 일정 수준에서 연속적이고 지속적인 발현이 있다. 이는 바람직하게 숙주 세포의 모든 성장 단계 또는 성장률에서 높은 프로모터 강도를 갖는다.
프로모터와 같은 유도성 또는 억제성 조절 요소와 관련하여 용어 "조절 가능한"은 숙주 세포에서 과량의 물질 (세포 배양 배지 내 영양분과 같은)의 존재하에서, 예를 들어, 회분식 배양의 성장 단계에서 억제되고, 예를 들어, 유가식 전략에 따른 생산 단계에서 (영양분의 양을 감소시킬 때, 또는 보충 기질의 공급 시와 같은) 강한 활성을 갖도록 활성화되는 요소를 지칭할 것이다. 조절 요소는 또한 조절 가능하도록 설계될 수 있어서, 세포 배양물 첨가제를 첨가하지 않고도 비활성화되고, 이러한 첨가제의 존재하 활성을 가질 수 있다. 따라서, 이러한 조절 요소의 제어 하에서 POI의 발현은 이러한 첨가제의 첨가 시 유도될 수 있다.
본 명세서에서 사용되는 용어 "목적 단백질 (POI)"은 숙주 세포에서 재조합 기술에 의해 생산된 폴리펩티드 또는 단백질을 지칭한다. 보다 구체적으로, 단백질은 숙주 세포에서 자연적으로 발생하지 않는 폴리펩티드, 즉, 이종 단백질일 수 있거나, 그렇지 않으면 숙주 세포에서 천연인 것, 즉, 숙주 세포에 대한 상동 단백질일 수 있으나, 예를 들어, POI를 암호화하는 핵산 서열을 포함하는 자율-복제 벡터를 이용한 형질전환에 의해, 숙주 세포의 게놈 내로 POI를 암호화하는 핵산 서열을 1 이상 카피수로 재조합 기술에 의해 통합시킬 때, 또는, 예를 들어, 프로모터 서열의, POI를 암호화하는 유전자의 발현을 제어하는 1 이상의 조절 서열의 재조합 변형에 의해 생산된다. 경우에 따라 본 명세서에서 사용되는 용어 POI는 재조합되어 발현된 단백질에 의해 매개되는, 숙주 세포에 의한 임의의 대사산물 생성물을 또한 지칭한다.
본 명세서에서 사용되는 용어 "스캐폴드"는 항원-결합 분자의 생성을 위한 출발점으로 제공하는, 크기, 구조, 및 기원이 상이한 밀집되고 안정적으로 접힌 단백질의 다면체 그룹을 말한다. 항체 (면역글로불린)의 구조-기능 관계에서 영감을 얻은, 이러한 대체 단백질 스캐폴드는 주어진 (생물)분자 표적의 엄격하고 명확한 인식을 위해 재구성될 수 있는 상호작용 부위를 지지하는, 강력하고, 보존된 구조적 프레임워크를 제공한다.
모 뉴클레오티드 또는 아미노산 서열과 비교하여 변이체, 상동체 또는 오쏠로그의 "서열 동일성"이란 용어는 2 이상의 서열의 동일성 정도를 나타낸다. 2 이상의 아미노산 서열은 상응하는 위치에서 일정 정도, 최대 100%까지 동일하거나 보존된 아미노산 잔기를 가질 수 있다. 2 이상의 뉴클레오티드 서열은 상응하는 위치에서 일정 정도, 최대 100%까지 동일하거나 보존된 염기쌍을 가질 수 있다.
서열 유사성 검색은 초과 (예를 들어, 적어도 50%)의 서열 동일성을 갖는 상동체를 식별하기 위한 효과적이고 신뢰할 수 있는 전략이다. 자주 사용되는 서열 유사 검색 도구는 예를 들어, BLAST, FASTA, 및 HMMER이다.
서열 유사성 검색은 공통 조상을 반영하는 초과의 유사성, 및 통계적으로 유의한 유사성을 검출함으로써 이러한 상동 단백질 또는 유전자를 확인할 수 있다. 상동체는 상이한 유기체에서의 동일한 단백질, 예를 들어, 상이한 유기체 또는 종에서의 이러한 단백질의 변이체로 본 명세서에서 이해되는 오쏠로그체를 포함할 수 있다.
상이한 유기체 또는 종, 구체적으로 동일한 속에서의 동일한 단백질의 상동 또는 오쏠로그 서열은, 일반적으로 적어도 약 50%의 서열 동일성, 바람직하게 적어도 약 60% 동일성, 더욱 바람직하게 적어도 약 70% 동일성, 더욱 바람직하게 적어도 약 80% 동일성, 더욱 바람직하게 적어도 약 90% 동일성, 더욱 바람직하게 적어도 약 95% 동일성을 가진다.
서열번호 1-8로 식별되는 서열을 특징으로 하는 각각의 HCP는 코마가타엘라 파피이의 것이다. 다른 진핵 숙주 세포에 상동 서열이 존재한다는 것이 잘 알려져 있다. 예를 들어, 효모 세포는 구체적으로 효모인 피키아 파스토리스 내 각각의 상동 서열을 포함하며, 이는 새로운 속, 코마가타엘라로 재분류되고, 3개의 종, 코마가타엘라 파스토리스, 코마가타엘라 파피이, 및 코마가타엘라 슈도파스토리스로 나뉜다. 추가의 상동 서열은 예를 들어, 사카로마이세스 세레비지애 또는 야로위아 리폴리티카에서 발견된다.
HCP1 (코마가타엘라 파피이): F2QXM5: NCBI에 따르면, 단백질은 아글루티닌 패밀리에 속하는 조나드헤신 (Zonahecin)이나, 블라스트 (blast) 분석은 또한 서브틸리신-유사 세린 프로테아제 SUB2에 대해 제한된 상동성을 나타낸다. 대부분의 데이터베이스에서, 단백질은 여전히 기능이 밝혀지지 않은 단백질로 지정된다. 63kDa, 587AA.
코마가타엘라 파스토리스 내 각각의 상동 서열은 본 명세서에서 서열번호 20 (NCBI 등록 번호: BA75_00021T0 [Komagataella pastoris], GenBank: ANZ74151.1)을 포함하거나 이로 이루어지는 아미노산 서열을 특징으로 하는, HCP1 상동체로 지칭된다.
HCP2 (코마가타엘라 파피이): F2QNG1: SCW10은 글루카나제와 유사한 세포벽 단백질이다. 이는 탄수화물 대사 과정에 관여하며 가수분해 효소 활성을 가진다. 사카로마이세스 세레비지애의 상동체는 교배 동안 접합에서 역할을 할 수 있다.
코마가타엘라 파스토리스 내 각각의 상동 서열은 본 명세서에서 서열번호 21 (NCBI 등록 번호: BA75_01624T0 [Komagataella pastoris], GenBank: ANZ73790.1)을 포함하거나 이로 이루어지는 아미노산 서열을 특징으로 하는, HCP2 상동체로 지칭된다.
HCP3 (코마가타엘라 파피이): F2QQT7: SUN4는 글루카나제와 유사한 또 다른 단백질이다. 이는 사카로마이세스 세레비지애의 상동체에 대한 데이터에 따르면, DNA 복제 및/또는 세포벽 격막구분에 참여할 수 있는 SUN 패밀리 (Sim1p, Uth1p, Nca3p, Sun4p) 단백질이다. 45kDa, 431AAs.
코마가타엘라 파스토리스 내 각각의 상동 서열은 본 명세서에서 서열번호 22 (NCBI 등록 번호: BA75_01931T0 [Komagataella pastoris], GenBank: ANZ76017.1)를 포함하거나 이로 이루어지는 아미노산 서열을 특징으로 하는, HCP3 상동체로 지칭된다.
HCP4 (코마가타엘라 파피이): F2QXH5: EPX1, 또는 세포외 단백질 1. 이 단백질에는 명확한 기능이 부여되지 않았으나, 각각의 결실 균주 (Δepx1)가 생성되었고 세포벽 손상제인 칼코플루오르 화이트 (Calcofluor white) 및 콩고 레드 (Congo red)에 대해 야생형보다 더 민감한 것으로 나타났으며, 이는 Epx1이 세포벽 보호 역할을 할 수 있음을 나타낸다.
코마가타엘라 파스토리스 내 각각의 상동 서열은 본 명세서에서 서열번호 23 (NCBI 등록 번호: BA75_00070T0 [Komagataella pastoris]; GenBank: ANZ73364.1)을 포함하거나 이로 이루어지는 아미노산 서열을 특징으로 하는, HCP4 상동체로 지칭된다.
코마가타엘라 파피이 외에 다른 효모에서 발견되는, 본 명세서에서 기술된 HCP의 예시적인 추가의 상동 서열은 다음과 같다:
사카로마이세스 세레비지애 내 HCP2의 상동 서열은 본 명세서에서 서열번호 24 (NCBI 등록 번호: SCW10 [Saccharomyces cerevisiae], GenBank: KZV09161.1; >SCW10 YMR305C SGDID:S000004921)를 포함하거나 이로 이루어지는 아미노산 서열을 특징으로 하는, HCP2 상동체로 지칭된다.
사카로마이세스 세레비지애 내 HCP2의 추가의 상동 서열은 본 명세서에서 서열번호 25 (NCBI 등록 번호: SCW4 [Saccharomyces cerevisiae], GenBank: KZV11513.1; >SCW4 YGR279C SGDID:S000003511)를 포함하거나 이로 이루어지는 아미노산 서열을 특징으로 하는, HCP2 상동체로 지칭된다.
사카로마이세스 세레비지애 내 HCP3의 추가의 상동 서열은 본 명세서에서 서열번호 26 (NCBI 등록 번호: SUN4 [Saccharomyces cerevisiae]; GenBank: CAA95939.1; >SUN4 YNL066W SGDID:S000005010)을 포함하거나 이로 이루어지는 아미노산 서열을 특징으로 하는, HCP3 상동체로 지칭된다.
본 명세서에서 기술된 아미노산 서열, 상동체 및 오쏠로그와 관련하여 "백분율 (%) 아미노산 서열 동일성"은 서열을 정렬하고, 필요할 경우, 최대 서열 동일성(%)을 달성하기 위해 갭을 도입한 후, 및 임의의 보존적 치환은 서열 동일성의 일부로서 간주하지 않으면서, DNA 서열 중 뉴클레오티드와 동일한 후보 DNA 서열 중 뉴클레오티드의 백분율인 것으로 정의된다. 당업자는 비교되는 서열의 전장에 걸쳐 최대 정렬을 이루기 위해 필요한 임의의 알고리즘을 포함하여, 정렬을 측정하기 위한 적절한 파라미터를 결정할 수 있다.
본 명세서에서 기술된 목적을 위해, 두 아미노산 서열 간의 서열 동일성은 하기 예시적인 파라미터가 설정된 blastp로 NCBI BLAST 프로그램 버전 2.2.29 (2014.01.06)를 이용하여 결정된다: 프로그램: blastp, 글자 크기: 6, 기대 값: 10, 처리대상 크기: 100, 공백값 (Gapcosts): 11.1, 매트릭스: BLOSUM62, 필터 문자열: F, 유전 부호: 1, 윈도우 크기: 40, 임계값: 21, 구성-기반 통계: 2.
뉴클레오티드 서열과 관련하여, 예를 들어, 프로모터 또는 유전자의 "백분율 (%) 동일성"은 서열을 정렬하고, 필요할 경우, 최대 서열 동일성(%)을 달성하기 위해 갭을 도입한 후, 및 임의의 보존적 치환은 서열 동일성의 일부로서 간주하지 않으면서, DNA 서열 중 뉴클레오티드와 동일한 후보 DNA 서열 중 뉴클레오티드의 백분율인 것으로 정의된다. 백분율 뉴클레오티드 서열 동일성을 결정하기 위한 정렬은 당업계의 기술 내의 다양한 방식으로, 예를 들어, 공개적으로 이용가능한 컴퓨터 소프트웨어를 사용하여 이루어질 수 있다. 당업자는 비교되는 서열의 전장에 걸쳐 최대 정렬을 이루기 위해 필요한 임의의 알고리즘을 포함하여, 정렬을 측정하기 위한 적절한 파라미터를 결정할 수 있다.
POI와 관련하여 본 명세서에서 사용되는 용어 "단리된" 또는 "단리"는 "정제된" 또는 "실질적으로 정제된" 형태로 존재하기 위하여, 자연적으로 연관된 환경, 구체적으로 세포 배양 상등액으로부터 충분히 분리된 화합물을 지칭할 것이다. 그러나, "단리된"은 다른 화합물 또는 물질과의 인공 또는 합성 혼합물, 또는 기본 활성을 방해하지 않고 예를 들어, 불완전한 정제로 인해 존재할 수 있는 불순물의 존재의 배제를 반드시 의미하는 것은 아니다. 단리된 화합물은 그의 제제를 생산하기 위해 추가로 제제화될 수 있으며 그럼에도 불구하고 실용적 목적에서 단리될 수 있다 - 예를 들어, POI는 진단 또는 치료에 사용될 때 약학적으로 허용가능한 담체 또는 부형제와 혼합될 수 있다.
본 명세서에서 사용되는 용어 "정제된"은 적어도 50% (mol/mol), 바람직하게 적어도 60%, 70%, 80%, 90% 또는 95%의 화합물 (예를 들어, POI)을 포함하는 제제를 지칭할 것이다. 순도는 화합물에 적합한 방법 (예를 들어, 크로마토그래피 방법, 폴리아크릴아미드 겔 전기영동, HPLC 분석 등)에 의해 측정된다. 본 명세서에서 기술된 단리된, 정제된 POI는 불순물을 감소시키기 위해 세포 배양 상등액을 정제하여 얻을 수 있다.
재조합 폴리펩티드 또는 단백질 산물을 얻기 위한 단리 및 정제 방법으로서, 염석 및 용매 침전과 같은 용해도 차이를 이용하는 방법, 한외여과 및 젤 전기영동과 같은 분자량 차이를 이용하는 방법, 이온 교환 크로마토그래피와 같은 전하 차이를 이용하는 방법, 친화성 크로마토그래피와 같이 특이적 친화성을 이용하는 방법, 역상 고성능 액체 크로마토그래피와 같이 소수성 차이를 이용하는 방법, 및 등전점 전기영동과 같이 등전점 차이를 이용하는 방법과 같은 방법이 사용될 수 있다.
하기 표준 방법이 바람직하다: 미세여과 또는 접선 (tangential) 유동 여과 (TFF) 또는 원심분리에 의한 세포 (파편) 분리 및 세척, 침전 또는 열 처리에 의한 POI 정제, 효소 분해에 의한 POI 활성화, 이온 교환 (IEX), 소수성 상호작용 크로마토그래피 (HIC), 친화성 크로마토그래피, 크기 배제 (SEC) 또는 HPLC 크로마토그래피와 같은 크로마토그래피에 의한 POI 정제, 농축액의 POI 침전 및 한외여과 단계에 의한 세척.
고도로 정제된 산물은 오염 단백질, 구체적으로 오염 HCP가 본질적으로 없으며, 바람직하게는 적어도 90%, 더 바람직하게는 적어도 95%, 또는 심지어 적어도 98%, 최대 100%의 순도를 가진다. 정제된 산물은 세포 배양 상등액의 정제 또는 다른 방법으로 세포 파편으로부터 얻을 수 있다.
단리되고 정제된 POI는 웨스턴 블롯, HPLC, 활성 어세이, 또는 ELISA와 같은 기존의 방법에 의해 확인될 수 있다.
본 명세서에서 사용되는 용어 "재조합"은 "유전 공학에 의해 또는 그 결과로 제조되는 것"을 의미할 것이다. 재조합 숙주는 1 이상의 뉴클레오티드 또는 뉴클레오티드 서열을 결실 및/또는 비활성화시키도록 조작될 수 있고, 구체적으로 숙주에 외래인 뉴클레오티드 서열을 사용하는 재조합 핵산 서열을 포함하는, 발현 벡터 또는 클로닝 벡터를 구체적으로 포함할 수 있다. 재조합 단백질은 각각의 재조합 핵산을 숙주에서 발현시킴으로써 생산된다. 본 명세서에서 사용되는 POI와 관련하여 용어 "재조합"은 POI를 발현하도록 형질전환된 숙주 세포로부터 단리된 POI와 같이, 재조합 수단에 의해 제조, 발현, 생성 또는 단리된 POI를 포함한다. 본 발명에 따르면, 당업계 통상 기술 내의 통상적인 분자 생물학, 미생물학, 및 재조합 DNA 기술이 사용될 수 있다. 이러한 기술은 문헌에 충분히 설명되어 있다. 예를 들어, 문헌 [Maniatis, Fritsch & Sambrook, "Molecular Cloning: A Laboratory Manual, Cold Spring Harbor, (1982)]을 참조한다.
전술한 설명은 하기 실시예를 참조하여 보다 완전히 이해될 것이다. 그러나, 이러한 예는 단지 본 발명의 1 이상의 실시양태를 실시하는 대표적인 방법일 뿐이며 본 발명의 범위를 제한하는 것으로 해석되어서는 안된다.
실시예
실시예 1: 피키아 파스토리스의 숙주 세포 단백질 불순물의 확인
POI로서 재조합 단백질을 생산하는 피키아 파스토리스 세포 (CBS2612 균주) 유래 숙주 세포 단백질 (HCP) 불순물을 확인하기 위하여, 세포 배양 상등액 샘플에 대해 하기 기술된 것과 같이 HCP 조성, 함량 및 특성을 분석하였다. 3개의 상이한 POI가 상이한 신호 펩티드 (POI1의 경우 WO2014067926A1의 서열번호 12, 및 POI2 및 POI3의 경우: 알파-교배 인자의 신호 펩티드 (예를 들어, US9534039의 서열번호 1)가 사용됨)를 포함하는, 예를 들어, 문헌 [Stratton et al., 1998, High Cell-Density Fermentation. In: Higgins D.R., Cregg J.M. (eds) Pichia Protocols. Methods in Molecular Biology, vol 103. Humana Press]에 기술된 것과 같이; 2개의 상이한 발현 시스템: pG1-3 (WO2017021541의 서열번호 38), 및 pAOX1을 이용하여 유가식 배양에서 발현되었고, 표 1에 나타난 다양한 pH 및 온도의 각 시간차 발효 조건이 사용되었다. 각 샘플은 HCP 조성, 함량 및 특성에 대해 3회 시험되었다.
리포터 단백질은 3개의 상이한 단백질이다: POI1: 세균 기원의 항원 결합 단백질, POI2: 인공 항원 결합 단백질; POI3: 인간 기원의 항원 결합 단백질.
샘플 리포터 단백질 POI 발현 시스템 pH 온도 (℃) 역가 (mg/L)
1 POI 1 pG1-3 5.0 30 250
2 POI 1 pG1-3 6.0 30 600
3 POI 1 pG1-3 6.8 30 700
4 POI 1 pG1-3 6.0 25 500
5 POI 2 pG1-3 4.0 25 1300
6 POI 2 pG1-3 6.0 30 1500
7 POI 3 pAOX1 5.0 25 3000
8 POI 3 pAOX1 5.0 25 3000
9 POI 3 pG1-3 5.0 25 6000
10 POI 3 pG1-3 5.0 25 4000
11 POI 3 pG1-3 5.0 25 6500
LC-MS/MS를 위한 샘플 준비
샘플을 6.6M 구아니딘 HCl에서 변성시키고, TCEP로 환원시킨 후 분석 전에 트립신으로 분해하였다: 각 샘플에 대해 3개의 복제물을 준비하였다. 18.5μl 부피의 각 샘플을 96-웰 플레이트에 이동시켰다. 90μl 0.5M MES (2-(N-모르폴리노)에탄설폰산) pH 5.5, 6.6M 구아니딘 HCl, 10mM TCEP (트리스(2-카복시에틸)포스핀)을 각 복제물에 가하였다. 배양을 50℃에서 30분 동안 수행하였다. 모든 샘플은 이어 ZebaSpin 탈염 플레이트 (Thermo)를 이용하여 제조사의 설명서에 따라 0.1M MOPS (3-(N-모르폴리노)프로판설폰산, 4-모르폴린프로판설폰산) pH 7.3, 2M 요소, 2mM CaCl2, 1mM TCEP로 버퍼를 교환하였다. 질량 분석법-등급의 트립신 (Promega)으로 분해를 수행하였다. 버퍼 교환된 각 샘플의 75μl 분취액에, 25μl 트립신 분해 용액 (4mg/ml 트립신, 0.1M MOPS pH 7.3, 2M 요소, 2mM CaCl2, 1mM TCEP)을 가하고 혼합하였다. 샘플을 30 ± 2℃에서 밤새 배양하였다. 2% (최종) TFA (트리플루오로아세트산)을 가하여 분해를 중단시켰다.
LC-MS/MS 데이터 수집
열 융합 트리브리드 Q-OT-qIT (4중극자-오비트랩-선형 이온 트랩) 질량 분석기에 연결된 Dionex RSSL나노 나노LC 시스템을 이용하여 데이터를 수집하였다. 각 샘플에 대한 1μl 부피의 트립신 분해 펩티드를 Acclaim PepMap100 C18, 5μm, 100Å, 300μm i.d.×5mm 나노-트랩 컬럼 (Thermo) 상에 98:2 물:아세토니트릴 및 0.05% TFA의 로딩 버퍼 내에 12μl/분으로 3분 동안 주입하였다. 3분 후 나노LC 흐름을 포획 컬럼을 통해 분석 컬럼 (EasySpray PepMap C18 2μm, 100Å, 75μm×25cm (Thermo)) 상으로 역방향으로 향하도록 하였다. 물 중의 0.1% 포름산과 80:20 아세토니트릴:물 중의 0.08% 포름산 사이에 선형 구배가 적용되었다.
2500V 스프레이 전압 및 275℃의 트랜스퍼 튜브 온도에서 수집하는 동안 공급원 이온화 설정은 고정되었다. 질량 분석기는 200-2000m/z의 스캔 범위, 2.0e5의 AGC 목표 및 50ms의 최대 주입 시간으로 120,000 FWHM 공칭 해상도에서 오비트랩 내 MS1 데이터를 수집하기 위한 양이온화 모드로 구성되었다. 데이터는 별개의 시약 이온 공급원으로부터 생성된 플로란틴 이온 고정질량에 기초한 내부 표준을 이용하여 질량-보정되었다. MS2 단편화를 위해 z=2 내지 z=8의 전하 상태만이 선택되었다.
MS2 단편화가 선형 이온 트랩에서 HCD 및 ETD 방법을 포함한 데이터-의존적 결정 트리 방법을 이용하여 수행되었다. HCD는 28%의 충돌 에너지, 1.0e4의 AGC 목표 및 100ms의 최대 스캔 시간으로 "정상" 트랩 스캔 속도에서 수행되었다. ETD는 15%의 추가 활성화 충돌 에너지, 1.0e4의 AGC 목표 및 100ms의 최대 스캔 시간으로 "정상" 트랩 스캔 속도에서 수행되었다.
질량 분석법 데이터 분석
PEAKS 스튜디오 소프트웨어를 사용하여 MS2 단편화에 기초한 단백질 식별을 수행하였다. 단백질 식별은 CCCS (정화된 세포 배양 상등액)에 대해서만 수행하였다. 펩티드 수준에서 위발견율은 유인 융합 (decoy fusion) 방법론 (Zhang, J, et al., "PEAKS DB: de novo sequencing assisted database search for sensitive and accurate peptide identification", Mol.Cell Proteomics 4(11), 111 (2012))을 이용하여 0.5% 미만으로 제어되었다. 각 단백질 할당에 대해 적어도 2개의 특유의 펩티드가 요구되었다. 질량 허용오차는 모 이온의 경우 5ppm 미만, 단편 이온의 경우 0.3Da 미만으로 지정되었다.
생성된 LC-MSMS 데이터는 3개의 POI 각각에 대해 개별적으로 분석되어 가공 중에 데이터가 더 잘 정렬되도록 하였다. 존재하는 단백질을 확인하기 위해 PEAKS 스튜디오 7을 사용하여 UniProt 데이터베이스로부터 코마가타엘라 파피이 (균주 ATCC 76273 / CBS 7435 / CECT 11047 / NRRL Y-11430 / Wegner 21-1) (효모) (피키아 파스토리스)의 프로테옴에 대한 데이터베이스 검색이 수행되었다. 모든 샘플이 단백질체학을 위한 Progenesis QI를 이용하여 가공되었다. PEAKS로부터의 식별정보가 실험 동안 정량화를 위해 Progenesis로 보내졌다. 각 POI에 대한 데이터가 독립적으로 가공되었다. Hi5 방법론을 이용하여 정량화가 수행되었다. 발현 프로파일 (q 값 < 0.01)의 유의한 변화 및 2 초과의 배수 변화를 보이는 단백질에 대해 발현 프로파일의 유사성이 평가되었다.
총 HCP는 다음과 같이 결정된다: 각각의 식별된 단백질에 대해, 그 단백질에서 유래한 가장 강한 5개의 펩티드 신호의 피크 면적이 결정된 후 합산되었다. 결과로 나온 숫자로 몰 기준 단백질 풍부도의 비교가 가능하다 (Silva et al., 2006: "Absolute quantification of proteins by LCMSE: a virtue of parallel MS acquisition." Mol Cell Proteomics 5 (1): 144-56.). 시험 샘플에서 모든 개별 HCP에 대해 이러한 방식으로 얻은 값을 합산하였다. 결과 합산 값은 시험 샘플에서 모든 HCP의 양 (몰)에 정비례한다. 따라서 HCP의 백분율 또는 배수변화 차이의 관점에서 샘플 사이의 비교가 이루어질 수 있다.
결과
pAOX1 발현 시스템이 사용된 샘플은 메탄올 대사에 특이적인 단백질 (알코올 옥시다제, 포르메이트 디히드로게나제, 알코올 디히드로게나제) 및 메탄올 대사 중에 생성된 활성 산소 종의 대사에 특이적인 단백질 (슈퍼옥시드 디스뮤타제, 퍼옥시레독신 PMP, 단백질 디설파이드-이소머라제, 티오레독신)의 유의한 증가를 보였다. 샘플 7, 8, 및 10 대비 샘플 9 및 11에 대한 높은 역가와 관련하여 이 실험 내에서 추가적인 변화가 관찰되었다. 이러한 변화는 단백질 접힘에 관여하는 ATP아제, GPI-고정 세포 표면 글리코단백질, 펩티딜-프로필 시스 트랜스이소머라제 및 번역 신장 인자 EF-1 감마 (코마가타엘라 파피이)(C4R6E8)에 상동성을 보이는 기능이 밝혀지지 않은 단백질 F2QUJ0과 같은 단백질을 포함하였다. pG1-3 발현 시스템이 사용된 샘플은 구조 단백질뿐만 아니라 탄수화물 (글루카나제, 글루코시다제) 가공 (processing)에 관여하는 효소의 증가된 발현을 보였다. 다양한 발효 조건 (온도, pH)이 HCP 발현 프로파일에서의 변화를 야기하는 것으로 나타났는데, 예를 들어, 증가된 온도 및 pH에서 진행된 발효에서 샤페론 단백질 HSP90에 대해 증가된 양이 관찰되었다.
놀랍게도 소수의 상이한 HCP만이, 상이한 발현 조건 (상술한 것과 같음) 하에서 상이한 POI를 발현하는 모든 피키아 파스토리스 세포 배양물의 상등액에 존재하는 가장 풍부한 단백질을 구성하는 것으로 밝혀졌다.
확인된 가장 풍부한 HCP는 하기 표 2에 요약되어 있다:
POI3은 샘플 7 및 8의 AOX1 프로모터의 제어하에서, 그리고 샘플 9, 10 및 11의 G1.3 프로모터의 제어하에서 발현되었다. 2개의 유도 시스템 중 하나에 특이적인 몇몇 HCP가 관찰될 수 있으나, 그들의 풍부도는 주된 HCP1에 비해 무시할만 하였으며, HCP 2 및 3의 풍부도에 비해서는 더 적었다.
HCP 단백질 식별자 POI를 고려하지 않은 HCP의 총 몰량에 대해 명시된 HCP의 몰량의 모든 조건의 평균 백분율 아미노산
서열번호
DNA
서열번호
HCP1 F2QXM5 50 1 2
HCP2 F2QNG1 19 3 4
HCP3 F2QQT7 6 5 6
HCP4 F2QXH5 3 7 8
실험에 따라 HCP1 및 HCP2는 함께 총 HCP 함량의 약 56 내지 81%, 평균적으로는 총 HCP 함량의 약 68%를 나타내었다. 흥미롭게도, 문헌 [Heiss et al., Appl Microbiol Biotechnol. 2013 Feb; 97(3): 1241-9. doi: 10.1007/s00253-012-4260-4. Epub 2012 Jul 17]의 Epx1 (F2QXH5) 단백질은 HCP1, HCP2, 또는 HCP3 단독 또는 조합에 비해 훨씬 덜 풍부한데, 다시 말하면 총 피키아 파스토리스 HCP의 3%를 차지하는 것으로 밝혀졌다.
실시예 2: 피키아에서 HCP1 녹아웃 균주의 생성
실시예 1의 숙주 세포 단백질 식별 분석에서 HCP1 (F2QXM5: 서열번호 1 및 2로 식별됨)은, 상이한 발현 시스템 및 발효 조건 (실시예 1)을 이용하여 3개의 상이한 POI를 발현하는 상이한 피키아 파스토리스 균주에서 26 내지 64%, 평균적으로 총 HCP 무게의 약 50%를 차지하는 것으로 확인되었다:
피키아 파스토리스 (CBS2612 균주)에서 HCP1을 암호화하는 유전자의 파괴를 위해, 문헌 [Heiss et al., Appl Microbiol Biotechnol. 2013; 97(3): 1241-9]에 의해 기술된 것과 같이 분할 마커 카세트 접근법이 사용되었다.
HCP1 암호화 유전자의 파괴를 위해 사용된 프라이머가 하기 표 3에 열거되었다 (녹아웃 표적 당 2개의 중첩 분할 마커 카세트가 사용됨):
프라이머 이름 서열 서열번호
A_Forward GAGAGAACTAATGCCCAGATAAACTTGC 9
A_Reverse GTTGTCGACCTGCAGCGTACGATCAAGTGAGTGAGTGACTGTTGGTG 10
B_Forward CACTCACTTGATCGTACGCTGCAGGTCGACAAC 11
B_Reverse CGGTGAGAATGGCAAAAGCTTATG 12
C_Forward AAGCCCGATGCGCCAGAGTTG 13
C_Reverse GGCTGAGATCTGAGTGGATCTGATATCACCTAATAAC 14
D_Forward TAGGTGATATCAGATCCACTCAGATCTCAGCCAATCAAGCTG 15
D_Reverse CGCTTGGTAATAGACAGTGTTATGTGG 16
Control Forward CACAGGTTCATCCACCCCGC 17
Control Reverse CCATCTTACAGATTCCAGTCTCTAAGCTGC 18
Control Forward 2 CGCCTCGACATCATCTGCCCAGATGC 27
Control Reverse 2 CGGGCGACAGTCACATCATGCCCCTG 28
Control Forward 3 GGCCAGAATGTAAACAAATGCAGATAAGG 29
Control Reverse 3 CGTCACTGCCAGCAGTG 30
Control Forward 4 GCTGCCTTCCCTATATCTGATATCAC 31
프라이머 쌍 A_Forward/A_Reverse, B_Forward/B_Reverse, C_Forward/C_Reverse, D_Forward/D_Reverse는 PCR에 의해 단편 A, B, C 및 D를 증폭시키는데 사용되었다 (Q5 High-Fidelity 2X Master Mix, New England Biolabs). HCP1 암호화 유전자의 녹아웃을 위한 단편 A는 (HCP1 암호화 유전자의) ATG 각각의 5 프라임 방향으로 1500bp에서 시작하여 ATG의 5 프라임 방향으로 1bp까지, 피키아 파스토리스 게놈 DNA로부터 증폭되었다. HCP1 암호화 유전자의 녹아웃을 위한 단편 D는 (표적 유전자의) ATG 각각의 3 프라임 방향으로 500bp에서 시작하여 ATG의 3 프라임 방향으로 2000bp까지, 피키아 파스토리스 게놈 DNA로부터 증폭되었다. 단편 B는 KanMX 선택 마커 카세트의 처음 2/3으로 이루어지며 KanMX 카세트 벡터 DNA 주형을 포함하는 플라스미드로부터 증폭된다. 단편 C는 KanMX 선택 마커 카세트의 마지막 2/3으로 이루어지며 또한 KanMX 카세트의 벡터 DNA 주형을 포함하는 플라스미드로부터 증폭된다. 단편 A 및 B는 프라이머 A_Forward 및 B_Reverse를 이용한 오버랩 PCR에 의해 함께 어닐링된다 (단편 AB). 단편 C 및 D는 프라이머 C_Forward 및 D_Reverse를 이용한 오버랩 PCR에 의해 함께 어닐링된다 (단편 CD).
녹아웃 균주를 생성하기 위해, 4개의 숙주 균주 (KO 균주 1: HCP1 녹아웃 (CBS2612 KO HCP1)을 포함하는 CBS2612 균주; KO 균주 2: POI1를 암호화하는 이종 유전자를 포함하고 HCP1 녹아웃을 포함하는 CBS2612 균주 (CBS2612 KO HCP1+POI1); KO 균주 3: POI2를 암호화하는 이종 유전자를 포함하고 HCP1 녹아웃을 포함하는 CBS2612 균주 (CBS2612 KO HCP1+POI2); 및 KO 균주 4: POI3을 암호화하는 이종 유전자를 포함하고 HCP1 녹아웃을 포함하는 CBS2612 균주 (CBS2612 KO HCP1+POI3))를 총 0.5 μg DNA의 단편 AB 및 CD로 형질전환하였다. 세포는 500 μg/mL 제네티신을 포함하는 YPD 아가 플레이트에서 선택되었다. 양성 녹아웃 클론은 프라이머 쌍 Control_Forward (단편 A의 상류에 결합함) 및 Control_Reverse (단편 D의 하류에 결합함)를 사용한 PCR에 의해 확인되었다. 개시 코돈 주변의 영역을 KanMX 카세트로 대체하였기 때문에, 양성 녹아웃 균주의 PCR 산물 밴드는 야생형 서열의 것보다 더 크다 (도 2). EcoRI 또는 NcoI로 PCR 산물에 대한 제한효소 분해를 수행하여 PCR 증폭물을 추가로 확인하였다. 양성 녹아웃 균주의 PCR 산물은 EcoRI (4602bp 단편)에 의해 절단되어서는 안되나; NcoI (1955bp 및 2647bp 단편)에 의해 분해되어야 한다 (도 2).
HCP1 녹아웃 균주 대 온전한 HCP1 유전자좌를 포함하는 균주의 전체 숙주 세포 단백질 (HCP) 함량을 분석하고 비교하기 위하여, POI3 (CBS2612 POI3)을 발현하는 균주 CBS2612 및 또한 HCP1 녹아웃을 이에 추가로 포함하는 균주 (CBS2612 KO HCP1+POI3)는 유가식 배양되었고, 각각의 배양 상등액의 총 HCP는 POI3 생산을 위하여 프로모터 pG1.3 및 신호 펩티드 aMF_EAEA (사카로마이세스 세레비지애 a-교배 인자 신호 펩티드와 테트라펩티드 EAEA, 테트라펩티드 EAEA는 서열번호 19로 식별됨)를 이용한 실시예 1에 개략된 것과 같다. 분석의 결과는 표 4에 나타내었다.
CBS2612 KO HCP1+POI3 CBS2612 POI3
% 농도; 총 HCP의 양 50% 100%
표 4에서 볼 수 있는 것과 같이, HCP1 암호화 유전자의 녹아웃을 포함하는 균주는 HCP1 단백질을 암호화하는 유전자를 포함하는 각각의 균주 대비, HCP의 총량을 약 50% (mol/mol) 덜 생성하였다.
실시예 3: 피키아 HCP1 녹아웃 균주에서 다수의 재조합 단백질 발현 균주의 생성
HCP1을 녹아웃할 때 HCP의 총량의 강한 감소를 추가로 보여주기 위해, 추가 균주가 생성되었다. 실시예 2에 대조적으로, 먼저 녹아웃 균주가 생성되었고, 균주는 이후 목적 단백질을 발현하는 3개의 플라스미드 중 하나로 형질전환되었다.
피키아 파스토리스 (CBS2612 균주) 서열번호 2에서 HCP1을 암호화하는 유전자의 파괴를 위해, 실시예 2에서 기술된 것과 같은 동일한 접근법이 사용되었다. HCP1 KO 균주는 4개의 상이한 PCR 반응에 의해 확인되었다 (도 3). PCR1 (프라이머 쌍 Control Forward 및 Control Reverse 2 (표 3)을 이용함)은 올바른 게놈 위치 내 녹아웃 카세트의 5' 측면 통합을 확인하기 위해 사용되었는데, 이는 야생형 균주에서 증폭물을 제공하지 않아야 하는 반면, HCP1 KO 균주에 대해서는 1687bp의 증폭물이 얻어져야 한다. PCR2 (프라이머 쌍 Control Forward 2 및 Control Reverse를 사용함)는 올바른 게놈 위치 내 녹아웃 카세트의 3' 측면 통합을 확인하기 위해 사용되었는데, 이는 야생형 균주에서 증폭물을 제공하지 않아야 하는 반면, HCP1 KO 균주에 대해서는 1723bp의 증폭물이 얻어져야 한다. PCR3 (프라이머 쌍 Control Forward 3 및 Control Reverse를 이용함)은 HCP1 게놈 위치를 확인하기 위해 사용되었으며, 야생형 균주에서 2172bp의 증폭물을 제공해야 하는 반면, HCP1 KO 균주에 대해서는 증폭물이 얻어지지 않아야 한다. PCR4 (프라이머 쌍 Control Forward 4 및 Control Reverse 3을 이용함)는 HCP1 유전자의 녹아웃된 단편이 게놈의 다른 곳에서 다시-통합되지 않았음을 확인하기 위해 사용되었다. 야생형 균주에서 115bp의 증폭물이 제공되어야 하는 반면, HCP1 KO 균주에서는 증폭물이 얻어지지 않아야 한다.
제2 단계에서, 야생형 (CBS2612) 균주 및 HCP1 KO 균주는 모두 G1-3 프로모터 (WO2017021541의 서열번호 38)의 제어 하에서 POI1, POI2 또는 POI3을 각각 암호화하는 3개의 플라스미드 중 1개의 플라스미드 1-5μg로 형질감염되었다. 세포는 100-1000μg/mL 제오신 (Zeocin)을 포함하는 YPD 아가 플레이트에서 선택되었다. 양성 클론을 WO2017021541에 기술된 것을 약간 변형하여 발현을 위해 분석하였는데, 다시 말해 배양 배지를 배지 개발 키트 (Media Development Kit (M-KIT-100, m2pLabs, DE))의 배지로 교환하였다. 나아가, 유전자 카피 수 (GCN)를 당업자에게 알려진 방법 (예: Abad et al., 2010)을 이용하여 분석하였다. 8개의 균주를 야생형 및 HCP1 KO 백그라운드에서 비슷한 POI 역가 및 GCN에 기초하여 선택하였다.
실시예 4: 실시예 3의 균주의 배양 상등액 내 숙주 세포 단백질 불순물의 특성
8개의 선택된 균주 (실시예 3)로부터 유래한 HCP 불순물의 특성을 분석하기 위하여, 실시예 1에 기재된 것과 같이 균주를 유가식 발효에서 배양하였다. 발효 종료된 샘플을 HCP 식별에 사용하였다.
실시예 1에 기술된 것과 유사하나 약간 변형된 작업 순서를 이용하여 샘플을 제조하고, MS 데이터를 획득하고 데이터를 분석하였다. 분석은 하기와 같이 수행되었다:
LC-MS/MS를 위한 샘플 준비
샘플을 6.6M 구아니딘 HCl에서 변성시키고, TCEP로 환원시킨 후 분석 전에 트립신으로 분해하였다: 각 샘플에 대해 3개의 복제물을 준비하였다. 60μl 부피의 각 샘플을 96-웰 플레이트에 이동시켰다. 90μl 0.5M MES (2-(N-모르폴리노)에탄설폰산) pH 5.5, 6.6M 구아니딘 HCl, 10mM TCEP (트리스(2-5 카복시에틸)포스핀)을 각 복제물에 가하였다. 배양을 50℃에서 30분 동안 수행하였다. 모든 샘플은 이어 ZebaSpin 탈염 플레이트 (Thermo)를 이용하여 제조사의 설명서에 따라 0.1M MOPS (3-(N-모르폴리노)프로판설폰산, 4-모르폴린프로판설폰산) pH 7.3, 2M 요소, 2mM CaCl2, 1mM TCEP로 버퍼를 교환하였다. 질량 분석법-등급의 트립신 (Promega)으로 분해를 수행하였다. 버퍼 교환된 각 샘플의 50μl 분취액에, 16.6μl 트립신 분해 용액 (4mg/ml 트립신, 0.1M MOPS pH 7.3, 2M 요소, 2mM CaCl2, 1mM TCEP)을 가하고 혼합하였다. 샘플을 30 ± 2℃에서 밤새 배양하였다. 2% (최종) TFA (트리플루오로아세트산)을 가하여 분해를 중단시켰다. 샘플을 분해 버퍼로 1:10 희석하였다.
LC-MS/MS 데이터 수집
열 융합 트리브리드 Q-OT-qIT (4중극자-오비트랩-선형 이온 트랩) 질량 분석기에 연결된 Dionex RSSL나노 나노LC 시스템을 이용하여 데이터를 수집하였다. 각 샘플에 대한 1μl 부피의 트립신 분해 펩티드를 Acclaim PepMap100 C18, 5μm, 100Å, 300μm i.d.×5mm 나노-트랩 컬럼 (Thermo) 상에 98:2 물:아세토니트릴 및 0.05% TFA의 로딩 버퍼 내에 12μl/분으로 3분 동안 주입하였다. 3분 후 나노LC 흐름을 포획 컬럼을 통해 분석 컬럼 (EasySpray PepMap C18 2μm, 100Å, 75μm×25cm (Thermo)) 상으로 역방향으로 향하도록 하였다. 물 중의 0.1% 포름산과 80:20 아세토니트릴:물 중의 0.08% 포름산 사이에 선형 구배가 적용되었다. 2500V 스프레이 전압 및 275℃의 트랜스퍼 튜브 온도에서 수집하는 동안 원 이온화 설정은 고정되었다. 질량 분석기는 350-1500m/z의 스캔 범위, 5.0e5의 AGC 목표 및 150ms의 최대 주입 시간으로 120,000 FWHM 공칭 해상도에서 오비트랩 내 MS1 데이터를 수집하기 위한 양이온화 모드로 구성되었다. 데이터는 별개의 시약 이온 공급원으로부터 생성된 플로란틴 이온 고정질량에 기초한 내부 표준을 이용하여 질량-보정되었다. MS2 단편화를 위해 z=2 내지 z=8의 전하 상태만이 선택되었다. HCD 방법과 TopN 가장 강한 데이터-의존 방식을 이용하여 선형 이온 트랩에서 MS2 단편화를 수행하였다. HCD는 28%의 충돌 에너지, 1.0e4의 AGC 목표, 100 ms의 최대 스캔 시간으로 "빠른" 트랩 스캔 속도에서 수행되었다.
질량 분석법 데이터 분석
PEAKS 스튜디오 소프트웨어를 사용하여 MS2 단편화에 기초한 단백질 식별을 수행하였다. 단백질 식별은 CCCS (정화된 세포 배양 상등액)에 대해서만 수행하였다. 펩티드 수준에서 위발견율은 유인 융합 (decoy fusion) 방법론 (Zhang, J, et al., "PEAKS DB: de novo sequencing assisted database search for sensitive and accurate peptide identification", Mol.Cell Proteomics 4(11), 111 (2012))을 이용하여 0.1% 미만으로 제어되었다. 각 단백질 할당에 대해 적어도 2개의 특유의 펩티드가 요구되었다. 질량 허용오차는 모 이온의 경우 5ppm 미만, 단편 이온의 경우 0.3Da 미만으로 지정되었다. 생성된 LC-MSMS 데이터는 3개의 POI 각각에 대해 개별적으로 분석되어 가공 중에 데이터가 더 잘 정렬되도록 하였다. 존재하는 단백질을 확인하기 위해 PEAKS 스튜디오 7을 사용하여 UniProt 데이터베이스로부터 코마가타엘라 파피이 (균주 ATCC 76273 / CBS 7435 / CECT 11047 / NRRL Y-11430 / Wegner 21-1) (효모) (피키아 파스토리스)의 프로테옴에 대한 데이터베이스 검색이 수행되었다. 모든 샘플이 단백질체학을 위한 Progenesis QI를 이용하여 가공되었다. PEAKS로부터의 식별정보가 실험 동안 정량화를 위해 Progenesis로 보내졌다. 각 POI에 대한 데이터가 독립적으로 가공되었다. Hi3 방법론을 이용하여 정량화가 수행되었다. 발현 프로파일 (p 값 < 0.05)의 유의한 변화 및 2 초과의 배수 변화를 보이는 단백질에 대해 발현 프로파일의 유사성이 평가되었다. 총 HCP는 다음과 같이 결정된다: 각각의 식별된 단백질에 대해, 그 단백질에서 유래한 가장 강한 3개의 펩티드 신호의 피크 면적이 결정된 후 합산되었다. 결과로 나온 숫자로 몰 기준 단백질 풍부도의 비교가 가능하다 (Silva et al., 2006: "Absolute quantification of proteins by LCMSE: a virtue of parallel MS acquisition." Mol Cell Proteomics 5 (1): 144-56.). 시험 샘플에서 모든 개별 HCP에 대해 이러한 방식으로 얻은 값을 합산하였다. 결과 합산 값은 시험 샘플에서 모든 HCP의 양 (몰)에 정비례한다. 따라서 HCP의 백분율 또는 배수변화 차이의 관점에서 샘플 사이의 비교가 이루어질 수 있다.
결과
실시예 1에서 볼 수 있듯이, 본 실험에서 비-조작된 균주의 총 HCP 풀에서 놀랍게도 높은 HCP1 풍부도가 확인되었다 (도 4). HCP1은 재조합 단백질의 발현이 있거나 없거나 야생형 균주의 상등액에서 총 HCP의 43 내지 70%를 구성한다.
야생형 균주 및 HCP1 녹아웃 균주에서 HCP의 총량을 비교할 때, 20 내지 79%의 총 HCP 감소가 얻어졌다 (도 5). POI1을 발현하는 야생형 균주는 총 HCP의 40% 이상의 HCP1 함량을 가지는 반면, 총 HCP의 총량은 단지 20% 감소하였다. 이는 이 균주 백그라운드에서 다른 HCP의 약간의 상향조절 때문이다. 그럼에도 불구하고, 모든 균주에 대해, HCP1을 녹아웃시키는 것은 무세포 배지에서 재조합 생산된 단백질의 불순도 프로파일에 실질적으로 긍정적인 영향을 미치며, 이는 예상치 못한 것이었다.
SEQUENCE LISTING <110> Lonza Ltd <120> HOST CELL FOR PRODUCING A PROTEIN OF INTEREST <130> IPA200855-AT <160> 31 <170> PatentIn version 3.5 <210> 1 <211> 587 <212> PRT <213> Komagataella phaffii <400> 1 Met Lys Phe Ala Ile Ser Thr Leu Leu Ile Ile Leu Gln Ala Ala Ala 1 5 10 15 Val Phe Ala Ala Phe Pro Ile Ser Asp Ile Thr Val Val Ser Glu Arg 20 25 30 Thr Asp Ala Ser Thr Ala Tyr Leu Ser Asp Trp Phe Val Val Ser Phe 35 40 45 Val Phe Ser Thr Ala Gly Ser Asp Glu Thr Ile Ala Gly Asp Ala Thr 50 55 60 Ile Glu Val Ser Ile Pro Asn Glu Leu Glu Phe Val Gln Tyr Pro Asp 65 70 75 80 Ser Val Asp Pro Ser Val Ser Glu Phe Phe Thr Thr Ala Gly Val Gln 85 90 95 Val Leu Ser Thr Ala Phe Asp Tyr Asp Ser His Val Leu Thr Phe Thr 100 105 110 Phe Ser Asp Pro Gly Gln Val Ile Thr Asp Leu Glu Gly Val Val Phe 115 120 125 Phe Thr Leu Lys Leu Ser Glu Gln Phe Thr Glu Ser Ala Ser Pro Gly 130 135 140 Gln His Thr Phe Asp Phe Glu Thr Ser Asp Gln Thr Tyr Ser Pro Ser 145 150 155 160 Val Asp Leu Val Ala Leu Asp Arg Ser Gln Pro Ile Lys Leu Ser Asn 165 170 175 Ala Val Thr Gly Gly Val Glu Trp Phe Val Asp Ile Pro Gly Ala Phe 180 185 190 Gly Asp Ile Thr Asn Ile Asp Ile Ser Thr Val Gln Thr Pro Gly Thr 195 200 205 Phe Asp Cys Ser Glu Val Lys Tyr Ala Val Gly Ser Ser Leu Asn Glu 210 215 220 Phe Gly Asp Phe Thr Pro Gln Asp Arg Thr Thr Phe Phe Ser Asn Ser 225 230 235 240 Ser Ser Gly Glu Trp Ile Pro Ile Thr Pro Ala Ser Gly Leu Pro Val 245 250 255 Glu Ser Phe Glu Cys Gly Asp Gly Thr Ile Ser Leu Ser Phe Ala Gly 260 265 270 Glu Leu Ala Asp Asp Glu Val Leu Arg Val Ser Phe Leu Ser Asn Leu 275 280 285 Ala Asp Asp Val Leu Glu Val Gln Asn Val Val Asn Val Asp Leu Thr 290 295 300 Thr Ala Asp Ser Arg Lys Arg Ala Leu Thr Ser Phe Val Leu Asp Glu 305 310 315 320 Pro Phe Tyr Arg Ala Ser Arg Thr Asp Thr Ala Ala Phe Glu Ala Phe 325 330 335 Ala Ala Val Pro Ala Asp Gly Asp Ile Thr Ser Thr Ser Thr Ala Ile 340 345 350 Thr Ser Val Thr Ala Thr Val Thr His Thr Thr Val Thr Ser Val Cys 355 360 365 Tyr Val Cys Ala Glu Thr Pro Val Thr Val Thr Tyr Thr Ala Pro Val 370 375 380 Ile Thr Asn Pro Ile Tyr Tyr Thr Thr Lys Val His Val Cys Asn Val 385 390 395 400 Cys Ala Glu Thr Pro Ile Thr Tyr Thr Val Thr Ile Pro Cys Glu Thr 405 410 415 Asp Glu Tyr Ala Pro Ala Lys Pro Thr Gly Thr Glu Gly Glu Lys Ile 420 425 430 Val Thr Val Ile Thr Lys Glu Gly Gly Asp Lys Tyr Thr Lys Thr Tyr 435 440 445 Glu Glu Val Thr Tyr Thr Lys Thr Tyr Pro Lys Gly Gly His Glu Asp 450 455 460 His Ile Val Thr Val Lys Thr Lys Glu Gly Gly Glu Lys Val Thr Lys 465 470 475 480 Thr Tyr Glu Glu Val Thr Tyr Thr Lys Gly Pro Glu Ile Val Thr Val 485 490 495 Val Thr Lys Glu Gly Gly Glu Lys Val Thr Thr Thr Tyr His Asp Val 500 505 510 Pro Glu Val Val Thr Val Ile Thr Lys Glu Gly Gly Glu Lys Val Thr 515 520 525 Thr Thr Tyr Pro Ala Thr Tyr Pro Ala Thr Tyr Thr Glu Gly His Ser 530 535 540 Ala Gly Val Pro Thr Ser Ala Ser Thr Pro Pro Gln Ala Thr Tyr Thr 545 550 555 560 Val Ser Glu Ala Gln Val Asn Leu Gly Ser Lys Ser Ala Val Gly Leu 565 570 575 Leu Ala Ile Val Pro Met Leu Phe Leu Ala Ile 580 585 <210> 2 <211> 1764 <212> DNA <213> Komagataella phaffii <400> 2 atgaagttcg caatttcaac acttcttatt atcctacagg ctgccgctgt ttttgctgcc 60 ttccctatat ctgatatcac agttgtcagt gaaagaactg acgcatcgac tgcctatctg 120 tcggactggt ttgttgtttc attcgttttt agcactgctg gcagtgacga aacaatcgct 180 ggtgacgcta ctattgaagt ctctattcct aatgagctag agtttgttca ataccctgat 240 tccgttgacc catccgtttc cgaattcttt acaaccgctg gtgttcaagt tttgagtacc 300 gcatttgatt atgacagcca tgttttgact ttcactttct ctgacccagg tcaagttatt 360 actgaccttg aaggagttgt tttctttaca ctcaaactca gtgagcagtt caccgagtct 420 gcttcccctg gccaacacac cttcgacttc gaaacctctg atcagaccta cagtccttct 480 gtcgacttgg tcgcacttga cagatctcag ccaatcaagc tgagcaacgc tgtgaccggt 540 ggtgttgaat ggtttgttga tattccaggt gcatttggag acatcaccaa cattgacatc 600 agcactgttc agaccccagg tacctttgac tgttcggagg ttaagtatgc tgtcggaagc 660 agcctgaacg aatttggtga ctttacccca caggatagaa caactttctt cagcaattcg 720 tccagtggag aatggattcc aattactcct gcttcaggtc ttccagttga aagctttgag 780 tgtggtgatg gtaccatctc tttgagcttt gccggtgaat tagctgacga tgaagttctt 840 agagtttctt tcctatcaaa cctggctgat gatgttcttg aagttcagaa cgttgtgaat 900 gttgacctca ccactgcaga ctcgcgtaag agagcattga cttcgttcgt ccttgatgag 960 ccattttacc gtgctagcag aaccgacaca gctgccttcg aagcttttgc agccgtacca 1020 gctgacggag atattacttc tacttcaact gccattacca gtgttactgc aacagttacc 1080 cacaccactg ttacatccgt ctgttacgtt tgtgctgaaa ctcctgttac cgttacctac 1140 accgctccag tcattactaa cccaatttac tataccacta aggttcacgt ttgtaacgtc 1200 tgtgctgaaa caccaattac ctacactgtt accattcctt gtgaaactga tgaatacgct 1260 ccagctaagc caactggcac tgagggtgag aagatcgtca ccgttattac aaaagaaggt 1320 ggtgacaagt acaccaagac atacgaagaa gtcacttaca ccaagactta tcccaagggt 1380 ggtcatgagg accatattgt cactgtcaaa actaaagaag gtggtgaaaa ggtcactaag 1440 acttacgagg aagtcaccta taccaagggt cctgaaattg ttactgttgt taccaaggag 1500 ggtggggaga aagttaccac tacttaccac gatgttcctg aggttgttac tgttatcacc 1560 aaggaaggtg gagagaaagt tactactact tacccagcta cttacccagc tacctacaca 1620 gaaggccaca gtgctggagt tccaacaagt gctagcaccc ctcctcaagc tacttacact 1680 gtgagtgagg ctcaagtcaa cttgggttcc aaatctgctg ttggtctgtt agcaatcgtc 1740 ccaatgctct tcttggctat ctaa 1764 <210> 3 <211> 348 <212> PRT <213> Komagataella phaffii <400> 3 Met Gln Val Lys Ser Ile Val Asn Leu Leu Leu Ala Cys Ser Leu Ala 1 5 10 15 Val Ala Arg Pro Leu Glu His Ala His His Gln His Asp Lys Arg Gly 20 25 30 Val Val Val Val Thr Lys Thr Ile Val Val Asp Gly Ser Thr Val Glu 35 40 45 Ala Thr Ala Ala Ala Gln Val Gln Glu His Ala Glu Thr Phe Ala Glu 50 55 60 Ser Thr Pro Ser Ala Val Val Ser Ser Ser Ser Ala Pro Ser Ser Ala 65 70 75 80 Ser Ser Ala Ser Ala Pro Ala Ser Ser Gly Ser Phe Ser Ala Gly Thr 85 90 95 Lys Gly Val Thr Tyr Ser Pro Tyr Gln Ala Gly Gly Gly Cys Lys Thr 100 105 110 Ala Glu Glu Val Ala Ser Asp Leu Ser Gln Leu Thr Gly Tyr Glu Ile 115 120 125 Ile Arg Leu Tyr Gly Val Asp Cys Asn Gln Val Glu Asn Val Phe Lys 130 135 140 Ala Lys Ala Pro Gly Gln Lys Leu Phe Leu Gly Ile Phe Phe Val Asp 145 150 155 160 Ala Ile Glu Ser Gly Val Ser Ala Ile Ala Ser Ala Val Lys Ser Tyr 165 170 175 Gly Ser Trp Asp Asp Val His Thr Val Ser Val Gly Asn Glu Leu Val 180 185 190 Asn Asn Gly Glu Ala Thr Val Ser Gln Ile Gly Gln Tyr Val Ser Thr 195 200 205 Ala Lys Ser Ala Leu Arg Ser Ala Gly Phe Thr Gly Pro Val Leu Ser 210 215 220 Val Asp Thr Phe Ile Ala Val Ile Asn Asn Pro Gly Leu Cys Asp Phe 225 230 235 240 Ala Asp Glu Tyr Val Ala Val Asn Ala His Ala Phe Phe Asp Gly Gly 245 250 255 Ile Ala Ala Ser Gly Ala Gly Asp Trp Ala Ala Glu Gln Ile Gln Arg 260 265 270 Val Ser Ser Ala Cys Gly Gly Lys Asp Val Leu Ile Val Glu Ser Gly 275 280 285 Trp Pro Ser Lys Gly Asp Thr Asn Gly Ala Ala Val Pro Ser Lys Ser 290 295 300 Asn Gln Gln Ala Ala Val Gln Ser Leu Gly Gln Lys Ile Gly Ser Ser 305 310 315 320 Cys Ile Ala Phe Asn Ala Phe Asn Asp Tyr Trp Lys Ala Asp Gly Pro 325 330 335 Phe Asn Ala Glu Lys Tyr Trp Gly Ile Leu Asp Ser 340 345 <210> 4 <211> 1047 <212> DNA <213> Komagataella phaffii <400> 4 atgcaagtta aatctatcgt taacctactg ttggcatgtt cgttggccgt ggccagacct 60 ttggagcacg cccaccatca acatgacaag agaggtgttg tcgtcgtgac caagaccatc 120 gttgtcgatg gttccaccgt tgaggctacc gcagcagccc aggtccaaga gcacgctgaa 180 actttcgcag agtcgactcc ttcagctgtt gtttccagtt catcagctcc ttcctctgct 240 tcttctgctt ccgctcctgc ctcttccggt agcttctccg ctggaaccaa aggtgtcacc 300 tactctcctt accaagccgg tggtggctgt aagactgcag aggaggtcgc ttccgatctt 360 tcccagttga ccggctacga gatcatcaga ttgtacggtg ttgactgtaa ccaagtcgag 420 aacgtcttca aggccaaggc cccaggtcaa aagttgtttt tgggaatctt ctttgttgat 480 gctatcgaga gcggtgtcag tgctattgcc tccgctgtca agtcatacgg ttcttgggac 540 gatgtccaca ctgtctctgt tggtaacgag ttggtcaaca acggtgaggc cactgtttcc 600 caaatcggtc aatacgtttc taccgctaaa tctgccttga gatctgctgg tttcaccggt 660 ccagttcttt ctgtcgacac tttcattgct gtcatcaaca acccagggtt gtgtgacttt 720 gctgacgagt acgttgccgt taacgctcac gctttctttg acggtggcat tgctgcctct 780 ggagctggtg attgggctgc tgagcagatc caaagagttt cttccgcttg tggtggcaag 840 gatgtcctca ttgtcgagtc cggatggcct tcaaagggag acaccaacgg tgctgccgtt 900 ccttccaagt caaaccaaca ggctgctgtc caatctctag gtcagaagat cggttcttct 960 tgtattgctt tcaacgcttt caacgattac tggaaggccg atggtccttt caacgctgag 1020 aagtactggg gtatcctaga ctcctaa 1047 <210> 5 <211> 431 <212> PRT <213> Komagataella phaffii <400> 5 Met Lys Ile Ser Ala Leu Thr Ala Cys Ala Val Thr Leu Ala Gly Leu 1 5 10 15 Ala Ile Ala Ala Pro Ala Pro Lys Pro Glu Asp Cys Thr Thr Thr Val 20 25 30 Gln Lys Arg His Gln His Lys Arg Ala Val Ala Tyr Asp Tyr Val Tyr 35 40 45 Val Thr Val Thr Ile Asn Gly Gln Gly Glu Thr Ile Ser Pro Thr Val 50 55 60 Val Ala Glu Leu Glu Thr Val Ser Thr Pro Ala Thr Ser Ser Ser Ala 65 70 75 80 Val Ala Thr Ser Ser Ala Pro Ala Thr Thr Ser Ser Ile Pro Glu Thr 85 90 95 Thr Ser Ala Gln Val Thr Thr Ser Ser Val Ala Glu Ser Thr Ser Ala 100 105 110 Gln Phe Thr Ser Ser Thr Glu Glu Ala Ser Ser Ser Val Glu Gln Thr 115 120 125 Thr Gln Ser Ser Ser Ser Ser Ser Pro Ser Ser Ser Ser Ser Ser Ser 130 135 140 Ser Ser Ser Gly Ser Ser Ser Gly Ser Ser Ser Gly Gly Ile Asp Gly 145 150 155 160 Asp Leu Ser Trp Tyr Ser Gly Pro Gly Asn Lys Phe Gln Asp Gly Thr 165 170 175 Ile Lys Cys Ser Glu Phe Pro Ser Gly Asn Gly Val Val Ala Leu Asp 180 185 190 His Leu Gly Phe Gly Gly Trp Ser Gly Leu Tyr His Pro Ser Asp Thr 195 200 205 Ser Thr Gly Gly Ile Cys Glu Pro Asp Thr Tyr Cys Ser Tyr Ala Cys 210 215 220 Gln Ser Gly Met Ser Lys Thr Gln Trp Pro Ser Glu Gln Pro Asp Asn 225 230 235 240 Gly Val Ser Val Gly Gly Leu Tyr Cys Asp Ser Asp Gly Tyr Leu Tyr 245 250 255 Arg Ser Lys Lys Asp Thr Asp Tyr Leu Cys Glu Trp Gly Ile Asp Val 260 265 270 Ala Tyr Val Val Ser Glu Ile Gly Lys Thr Ala Ala Ile Cys Arg Thr 275 280 285 Asp Tyr Pro Gly Thr Glu Asn Met Val Ile Pro Thr Val Val Ser Pro 290 295 300 Gly Gly Glu Leu Pro Leu Thr Thr Val Asp Gln Ser Ser Tyr Tyr Thr 305 310 315 320 Trp Arg Gly Met Lys Thr Ser Ala Gln Tyr Tyr Val Asn Asp Ala Gly 325 330 335 Val Asp Trp Thr Thr Gly Cys Thr Trp Gly Asp Tyr Gly Thr Asp Tyr 340 345 350 Gly Asn Trp Ala Pro Leu Asn Phe Gly Ala Gly Tyr Asp Asn Gly Ile 355 360 365 Ser Tyr Leu Ser Leu Ile Pro Asn Pro Asn Asn Lys Asp Ser Leu Asn 370 375 380 Tyr Asn Val Lys Ile Val Ala Tyr Asp Asp Ser Ser Val Val Ile Gly 385 390 395 400 Glu Cys Lys Tyr Glu Asn Gly Ser Tyr Asn Gly Asn Gly Ser Asp Gly 405 410 415 Cys Thr Val Ala Val Asn Ser Gly Lys Ala Lys Phe Val Leu Tyr 420 425 430 <210> 6 <211> 1296 <212> DNA <213> Komagataella phaffii <400> 6 atgaagatat ccgctcttac agcctgcgct gttactctag ctggtcttgc aattgcagca 60 ccagctccaa agcctgaaga ttgtactact acagtgcaga aacgtcacca acacaaacgt 120 gctgtcgcat acgattacgt ttatgtcaca gtgactatca atggccaagg tgaaaccatt 180 tctccaactg ttgtggcaga acttgagacg gtttccacgc ctgcaacaag ctcatccgca 240 gttgcaactt cttctgctcc tgcaaccact tcttcaatcc cagagacaac ttctgcacaa 300 gtgaccacct cttctgttgc agagtccact tcagcgcaat tcacttcatc taccgaagaa 360 gcctcttctt ctgttgagca aacgactcaa tcaagttcaa gttcaagtcc aagttccagt 420 tccagttcaa gttcgagctc aggctctagt tcaggatcca gttccggtgg aatcgatgga 480 gacctaagct ggtactcagg tcctggaaac aaattccagg atggtactat aaagtgttcc 540 gagttcccat ccggtaacgg tgttgttgcc ttggaccatc tcggattcgg aggatggtca 600 ggattatacc acccatctga tacctctact ggtgggatct gtgaaccaga cacctactgc 660 tcttatgcct gccaatcagg tatgtcgaag acacaatggc catctgaaca accggacaat 720 ggtgtttccg ttggtggtct gtattgtgat tctgatggat acctttaccg ttccaagaaa 780 gacactgact atctatgtga atggggtatt gatgtcgcct atgttgtcag tgaaattggt 840 aaaactgctg ccatctgtag aaccgactat ccaggaactg aaaacatggt tataccaact 900 gttgtgagtc cgggtggaga actccctctg acaacagttg accaatcctc ttactatacg 960 tggaggggaa tgaagacttc ggcccaatac tacgtgaacg atgctggtgt tgactggacc 1020 accggttgta cctggggaga ctatggaacc gactacggta actgggcgcc attgaacttt 1080 ggtgccggtt acgacaacgg catttcatac ctttctttaa tccctaaccc taacaacaag 1140 gactccttga actataatgt caagattgtt gcttatgatg attcttctgt cgttatcggc 1200 gagtgcaagt atgaaaatgg ttcatacaat ggaaacggtt ccgacggttg taccgttgct 1260 gtcaacagcg gtaaggccaa gtttgtgttg tattaa 1296 <210> 7 <211> 313 <212> PRT <213> Komagataella phaffii <400> 7 Met Lys Leu Ser Thr Asn Leu Ile Leu Ala Ile Ala Ala Ala Ser Ala 1 5 10 15 Val Val Ser Ala Ala Pro Val Ala Pro Ala Glu Glu Ala Ala Asn His 20 25 30 Leu His Lys Arg Ala Tyr Tyr Thr Asp Thr Thr Lys Thr His Thr Phe 35 40 45 Thr Glu Val Val Thr Val Tyr Arg Thr Leu Lys Pro Gly Glu Ser Ile 50 55 60 Pro Thr Asp Ser Pro Ser His Gly Gly Lys Ser Thr Lys Lys Gly Lys 65 70 75 80 Gly Ser Thr Thr His Ser Gly Ala Pro Gly Ala Thr Ser Gly Ala Pro 85 90 95 Thr Asp Asp Thr Thr Ser Thr Ser Gly Ser Val Gly Leu Pro Thr Ser 100 105 110 Ala Thr Ser Val Thr Ser Ser Thr Ser Ser Ala Ser Thr Thr Ser Ser 115 120 125 Gly Thr Ser Ala Thr Ser Thr Gly Thr Gly Thr Ser Thr Ser Thr Ser 130 135 140 Thr Gly Thr Gly Thr Gly Thr Thr Gly Thr Gly Thr Thr Ser Ser Ser 145 150 155 160 Thr Ser Ser Ser Ala Thr Ser Thr Pro Thr Gly Ser Ile Asp Ala Ile 165 170 175 Ser Gln Thr Leu Leu Asp Thr His Asn Asp Lys Arg Ala Leu His Gly 180 185 190 Val Pro Asp Leu Thr Trp Ser Thr Glu Leu Ala Asp Tyr Ala Gln Gly 195 200 205 Tyr Ala Asp Ser Tyr Thr Cys Gly Ser Ser Leu Glu His Thr Gly Gly 210 215 220 Pro Tyr Gly Glu Asn Leu Ala Ser Gly Tyr Ser Pro Ala Gly Ser Val 225 230 235 240 Glu Ala Trp Tyr Asn Glu Ile Ser Asp Tyr Asp Phe Ser Asn Pro Gly 245 250 255 Tyr Ser Ala Gly Thr Gly His Phe Thr Gln Val Val Trp Lys Ser Thr 260 265 270 Thr Gln Leu Gly Cys Gly Tyr Lys Glu Cys Ser Thr Asp Arg Tyr Tyr 275 280 285 Ile Ile Cys Glu Tyr Ala Pro Arg Gly Asn Ile Val Ser Ala Gly Tyr 290 295 300 Phe Glu Asp Asn Val Leu Pro Pro Val 305 310 <210> 8 <211> 939 <212> DNA <213> Komagataella phaffii <400> 8 atgaagctct ccaccaattt gattctagct attgcagcag cttccgccgt tgtctcagct 60 gctccagttg ctccagccga agaggcagca aaccacttgc acaagcgtgc ttactacacc 120 gacacaacca agactcacac tttcactgag gttgttactg tctaccgaac tttgaaaccg 180 ggcgaaagta tcccaactga ctctccaagc cacggtggta aaagtactaa aaagggtaag 240 ggtagtacca ctcactctgg tgctccagga gctacctctg gtgctccaac tgacgacacc 300 acttcgacta gtggctcagt agggttacca actagcgcaa cttcagttac ctcttctacc 360 tcctctgcaa gtacaacaag cagtggaact tcagccacta gcactggtac cggtactagc 420 actagcacta gcactggtac tggtactggt actacaggca caggaaccac tagttccagc 480 actagctctt ctgctacttc gactccaacc ggttctatcg acgctatcag ccagacactt 540 ctggatactc acaatgataa gcgtgctttg cacggcgtcc cagaccttac ttggtctacc 600 gaactcgctg actacgccca aggttacgcc gattcataca cttgtggctc ttcattagaa 660 cacacaggtg gaccatacgg tgaaaatttg gcctctggat actctcctgc tggcagtgta 720 gaagcatggt acaacgagat cagcgactac gatttctcta acccaggtta ttctgctggt 780 accggtcact tcacccaagt tgtctggaaa tcaactacac agctgggctg tggatacaag 840 gagtgcagta ccgacagata ctacatcatc tgcgaatacg cacctcgtgg aaatattgtt 900 tctgccggct acttcgaaga caacgtcctg cctcctgtt 939 <210> 9 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 9 gagagaacta atgcccagat aaacttgc 28 <210> 10 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 10 gttgtcgacc tgcagcgtac gatcaagtga gtgagtgact gttggtg 47 <210> 11 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 11 cactcacttg atcgtacgct gcaggtcgac aac 33 <210> 12 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 12 cggtgagaat ggcaaaagct tatg 24 <210> 13 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 13 aagcccgatg cgccagagtt g 21 <210> 14 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 14 ggctgagatc tgagtggatc tgatatcacc taataac 37 <210> 15 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 15 taggtgatat cagatccact cagatctcag ccaatcaagc tg 42 <210> 16 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 16 cgcttggtaa tagacagtgt tatgtgg 27 <210> 17 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 17 cacaggttca tccaccccgc 20 <210> 18 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 18 ccatcttaca gattccagtc tctaagctgc 30 <210> 19 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Tetrapeptide <400> 19 Glu Ala Glu Ala 1 <210> 20 <211> 615 <212> PRT <213> Komagataella pastoris <400> 20 Met Gln Leu Arg Val Ser Phe Ser Phe Asp Tyr Lys Asn Gly Gly Tyr 1 5 10 15 Pro Trp Thr Tyr Phe Asp Phe Pro His Thr Val Thr His Leu Ile Met 20 25 30 Lys Phe Ala Ile Pro Thr Leu Phe Val Ile Leu Gln Ala Ala Ser Val 35 40 45 Phe Ala Ala Phe Pro Ile Thr Asp Ile Thr Val Val Ser Glu Arg Thr 50 55 60 Asp Ala Ser Ile Ala Tyr Leu Ser Asp Trp Phe Leu Val Ser Phe Val 65 70 75 80 Phe Ser Thr Ala Gly Ser Asp Glu Thr Leu Ala Gly Asp Ala Thr Ile 85 90 95 Glu Val Ser Ile Pro Asp Glu Leu Glu Phe Val Gln Tyr Pro Glu Ser 100 105 110 Val Asp Pro Ser Val Ser Glu Phe Phe Thr Thr Ala Gly Val Gln Val 115 120 125 Leu Ser Thr Ala Phe Asp Tyr Asp Ser His Val Leu Thr Phe Thr Phe 130 135 140 Ser Asp Pro Gly Gln Val Ile Thr Glu Leu Glu Gly Val Val Tyr Phe 145 150 155 160 Thr Leu Lys Leu Ser Glu Gln Phe Thr Glu Ser Ala Thr Pro Gly Gln 165 170 175 His Thr Phe Asp Phe Glu Thr Ser Asp Gln Val Tyr Ser Pro Ser Val 180 185 190 Asp Leu Val Ala Leu Asp Arg Thr Gln Pro Ile Lys Leu Ser Asn Ala 195 200 205 Val Thr Gly Gly Val Glu Trp Phe Val Asp Ile Pro Gly Ala Phe Gly 210 215 220 Asp Ile Thr Asn Ile Asp Ile Ser Thr Val Gln Thr Pro Gly Thr Phe 225 230 235 240 Asp Cys Ser Glu Val Lys Tyr Ala Val Gly Ser Ser Leu Asn Glu Phe 245 250 255 Gly Asp Phe Thr Pro Gln Asp Arg Thr Thr Phe Phe Ser Asn Ser Ser 260 265 270 Ser Gly Glu Trp Ile Pro Ile Thr Pro Ala Ser Gly Leu Pro Val Glu 275 280 285 Ser Phe Glu Cys Gly Asp Gly Thr Ile Ser Leu Ser Phe Ala Gly Glu 290 295 300 Leu Ala Asp Asp Glu Val Leu Arg Val Ser Phe Leu Ser Asn Leu Asp 305 310 315 320 Asp Asp Val Leu Glu Val Gln Asn Val Val Asn Val Asp Leu Thr Thr 325 330 335 Ala Asp Ser Arg Lys Arg Ala Leu Thr Ser Phe Val Leu Asp Glu Pro 340 345 350 Phe Tyr Arg Ala Ser Arg Thr Asp Pro Ala Ala Phe Glu Ala Phe Ala 355 360 365 Ala Val Pro Ala Asp Gly Asp Ile Thr Thr Thr Ser Thr Ala Thr Thr 370 375 380 Ser Val Thr Ala Thr Val Thr Glu Thr Thr Val Thr Ser Val Cys Tyr 385 390 395 400 Val Cys Ala Glu Thr Pro Val Thr Val Thr Tyr Thr Ala Pro Val Ile 405 410 415 Thr Asn Pro Ile Tyr Tyr Thr Thr Lys Val His Val Cys Asn Val Cys 420 425 430 Ala Glu Thr Pro Ile Thr Tyr Thr Val Thr Ile Pro Cys Glu Ser Asp 435 440 445 Glu Tyr Ala Pro Ala Lys Pro Thr Gly Thr Lys Gly Glu Lys Ile Val 450 455 460 Thr Val Val Thr Lys Glu Gly Gly Asp Lys Tyr Thr Lys Thr Tyr Glu 465 470 475 480 Glu Val Thr Tyr Thr Lys Thr Tyr Pro Lys Glu Gly Gly His Glu Asp 485 490 495 His Ile Val Thr Val Thr Thr Lys Glu Gly Gly Glu Lys Val Thr Lys 500 505 510 Thr Tyr Glu Glu Val Thr Tyr Thr Lys Gly Pro Glu Ile Val Thr Val 515 520 525 Val Thr Lys Glu Gly Gly Glu Glu Val Thr Lys Thr Tyr His Asp Val 530 535 540 Pro Glu Val Val Thr Val Val Thr Lys Glu Gly Gly Glu Lys Val Thr 545 550 555 560 Thr Thr Tyr Pro Ala Thr Tyr Thr Glu Gly Pro Gly Ala Val Pro Thr 565 570 575 Ser Val Ser Ala Pro Pro Lys Ala Thr Tyr Thr Val Ser Glu Ala Asp 580 585 590 Val Asn Leu Gly Ser Arg Ser Ala Ala Val Gly Leu Leu Ala Ile Leu 595 600 605 Pro Met Leu Phe Leu Ala Val 610 615 <210> 21 <211> 348 <212> PRT <213> Komagataella pastoris <400> 21 Met Gln Val Lys Ser Ile Val Asn Leu Leu Leu Ala Cys Ser Leu Ala 1 5 10 15 Val Ala Arg Pro Leu Glu His Ala His His Gln His Asp Lys Arg Gly 20 25 30 Val Val Val Val Thr Lys Thr Ile Ile Val Asp Gly Ser Thr Val Glu 35 40 45 Ala Thr Ala Ala Ala Gln Val Gln Glu His Ala Glu Thr Ile Ala Glu 50 55 60 Ser Thr Pro Ser Ala Val Val Ala Ser Ser Ala Ala Pro Ser Ala Ala 65 70 75 80 Ser Ser Ala Ser Ala Pro Ala Ser Ser Gly Ser Phe Ser Ala Gly Thr 85 90 95 Lys Gly Val Thr Tyr Ser Pro Tyr Gln Ala Gly Gly Gly Cys Lys Thr 100 105 110 Ala Glu Glu Val Ala Ser Asp Leu Ser Gln Leu Thr Asp Tyr Glu Ile 115 120 125 Ile Arg Leu Tyr Gly Val Asp Cys Asn Gln Val Glu Asn Val Phe Lys 130 135 140 Ala Lys Ala Pro Gly Gln Lys Leu Phe Leu Gly Ile Phe Phe Val Asp 145 150 155 160 Ala Ile Glu Ser Gly Val Ser Ala Ile Ala Ser Ala Val Ser Ser Tyr 165 170 175 Gly Ser Trp Asn Asp Val His Thr Val Ser Val Gly Asn Glu Leu Val 180 185 190 Asn Asn Gly Glu Ala Thr Val Ser Gln Ile Gly Gln Tyr Val Ser Thr 195 200 205 Ala Lys Ser Ala Leu Arg Ser Ala Gly Phe Thr Gly Pro Val Leu Ser 210 215 220 Val Asp Thr Phe Ile Ala Val Ile Asn Asn Pro Gly Leu Cys Asp Phe 225 230 235 240 Ala Asp Glu Tyr Val Ala Val Asn Ala His Ala Phe Phe Asp Gly His 245 250 255 Ile Ala Ala Ser Gly Ala Gly Asp Trp Ala Ala Glu Gln Ile Gln Arg 260 265 270 Val Ser Ser Ala Cys Gly Gly Lys Asp Val Leu Ile Val Glu Ser Gly 275 280 285 Trp Pro Ser Lys Gly Asp Thr Asn Gly Ala Ala Val Pro Ser Lys Ser 290 295 300 Asn Gln Gln Ala Ala Val Gln Ser Leu Gly Gln Lys Ile Gly Ser Ser 305 310 315 320 Cys Ile Ala Phe Asn Ala Phe Asn Asp Tyr Trp Lys Ala Asp Gly Pro 325 330 335 Phe Asn Ala Glu Lys Tyr Trp Gly Ile Leu Asp Ser 340 345 <210> 22 <211> 430 <212> PRT <213> Komagataella pastoris <400> 22 Met Lys Ile Ser Ala Leu Thr Ala Cys Ala Val Thr Leu Ala Gly Leu 1 5 10 15 Ala Ile Ala Ala Pro Ala Pro Lys Pro Glu Asp Cys Thr Thr Thr Val 20 25 30 Gln Lys Arg His Gln His Lys Arg Ala Val Ala Tyr Asp Tyr Val Tyr 35 40 45 Val Thr Val Thr Ile Asn Gly Gln Gly Glu Thr Ile Ser Pro Thr Val 50 55 60 Val Ala Glu Leu Glu Thr Ala Ser Thr Pro Ala Thr Ser Ser Ser Ala 65 70 75 80 His Val Glu Thr Ser Ser Ala Pro Ala Thr Thr Ser Ser Val Pro Glu 85 90 95 Thr Thr Ser Ala Glu Gln Thr Thr Ser Ser Ala Glu Thr Thr Ser Ala 100 105 110 Gln Val Thr Ser Ser Val Gln Glu Thr Ser Ser Ser Ala Glu Glu Gln 115 120 125 Val Thr Gln Ser Ser Ser Ser Ser Ser Pro Ser Ser Ser Ser Ser Ser 130 135 140 Ser Ser Gly Ser Ser Ser Gly Ser Ser Ser Gly Gly Ile Asp Gly Asp 145 150 155 160 Leu Ser Trp Tyr Ser Gly Pro Gly Asn Lys Phe Gln Asp Gly Thr Ile 165 170 175 Lys Cys Ser Glu Phe Pro Ser Gly Asn Gly Val Val Ala Leu Asp His 180 185 190 Leu Gly Phe Gly Gly Trp Ser Gly Leu Tyr His Pro Ser Asp Thr Ser 195 200 205 Thr Gly Gly Ile Cys Glu Pro Asp Thr Tyr Cys Ser Tyr Ala Cys Gln 210 215 220 Ser Gly Met Ser Lys Thr Gln Trp Pro Ser Glu Gln Pro Asp Asn Gly 225 230 235 240 Val Ser Val Gly Gly Leu Tyr Cys Asp Ser Asp Gly Tyr Leu Tyr Arg 245 250 255 Ser Lys Thr Asp Thr Asp Tyr Leu Cys Glu Trp Gly Ile Asp Val Ala 260 265 270 Tyr Val Val Ser Glu Ile Gly Lys Thr Ala Ala Ile Cys Arg Thr Asp 275 280 285 Tyr Pro Gly Thr Glu Asn Met Val Ile Pro Thr Val Val Thr Pro Gly 290 295 300 Gly Glu Leu Pro Leu Thr Thr Val Asp Gln Ser Ser Tyr Tyr Thr Trp 305 310 315 320 Arg Gly Met Lys Thr Ser Ala Gln Tyr Tyr Val Asn Asp Ala Gly Val 325 330 335 Asp Trp Thr Thr Gly Cys Thr Trp Gly Asp Tyr Gly Thr Asp Tyr Gly 340 345 350 Asn Trp Ala Pro Leu Asn Phe Gly Ala Gly Tyr Asp Asn Gly Ile Ser 355 360 365 Tyr Leu Ser Leu Ile Pro Asn Pro Asn Asn Lys Asp Thr Met Asn Tyr 370 375 380 Asn Val Lys Ile Val Ala Tyr Asp Asp Ser Ser Val Val Ile Gly Glu 385 390 395 400 Cys Lys Tyr Glu Asn Gly Ser Tyr Asn Gly Asn Gly Ser Asp Gly Cys 405 410 415 Thr Val Ala Val Asn Ser Gly Lys Ala Lys Phe Val Leu Tyr 420 425 430 <210> 23 <211> 313 <212> PRT <213> Komagataella pastoris <400> 23 Met Lys Phe Ser Thr Asn Leu Ile Leu Ala Ile Ala Ala Ala Ser Thr 1 5 10 15 Val Val Ser Ala Ala Pro Val Ala Pro Ala Glu Glu Ala Ala Asn His 20 25 30 Leu His Lys Arg Ala Tyr Tyr Thr Asp Thr Thr Lys Thr His Thr Phe 35 40 45 Thr Glu Val Val Thr Val Tyr Arg Thr Leu Lys Pro Gly Glu Ser Ile 50 55 60 Pro Thr Gly Ser Pro Ser His Gly Gly Lys Gly Ser Lys Thr Gly Lys 65 70 75 80 Gly Lys Gly Ser Thr Thr Asp Ala Gly Val Pro Gly Thr Thr Ser Val 85 90 95 Ala Pro Thr Ala Asp Ser Thr Ser Ala Ser Gly Ser Ile Gly Leu Pro 100 105 110 Thr Ser Ala Ser Ser Ala Thr Ser Ala Thr Ser Ser Ala Ser Thr Thr 115 120 125 Thr Ser Gly Thr Ser Thr Ser Ser Thr Gly Thr Gly Thr Thr Thr Gly 130 135 140 Ala Thr Thr Gly Thr Gly Thr Ser Ser Thr Gly Thr Thr Ser Ser Ser 145 150 155 160 Thr Ser Ser Ser Ala Thr Ser Thr Pro Thr Gly Ser Leu Asp Ala Ile 165 170 175 Ser Gln Ser Leu Leu Asp Thr His Asn Glu Lys Arg Ala Leu His Gly 180 185 190 Val Ser Asp Leu Thr Trp Ser Thr Glu Leu Ala Asp Tyr Ala Gln Gly 195 200 205 Tyr Ala Asp Ser Phe Thr Cys Gly Ser Ser Leu Val His Thr Gly Gly 210 215 220 Pro Tyr Gly Glu Asn Leu Ala Ser Gly Tyr Ser Pro Ala Gly Ser Val 225 230 235 240 Glu Ala Trp Tyr Asn Glu Ile Ser Asp Tyr Asp Phe Ser Asn Pro Gly 245 250 255 Tyr Ser Ala Gly Thr Gly His Phe Thr Gln Val Val Trp Lys Ser Thr 260 265 270 Thr Gln Leu Gly Cys Gly Tyr Lys Glu Cys Gly Thr Asn Arg Tyr Tyr 275 280 285 Ile Ile Cys Glu Tyr Ala Pro Arg Gly Asn Ile Val Ser Ala Gly Tyr 290 295 300 Phe Glu Asp Asn Val Leu Pro Leu Val 305 310 <210> 24 <211> 389 <212> PRT <213> Saccharomyces cerevisiae <400> 24 Met Arg Phe Ser Asn Phe Leu Thr Val Ser Ala Leu Leu Thr Gly Ala 1 5 10 15 Leu Gly Ala Pro Ala Val Arg His Lys His Glu Lys Arg Asp Val Val 20 25 30 Thr Ala Thr Val His Ala Gln Val Thr Val Val Val Ser Gly Asn Ser 35 40 45 Gly Glu Thr Ile Val Pro Val Asn Glu Asn Ala Val Val Ala Thr Thr 50 55 60 Ser Ser Thr Ala Val Ala Ser Gln Ala Thr Thr Ser Thr Leu Glu Pro 65 70 75 80 Thr Thr Ser Ala Asn Val Val Thr Ser Gln Gln Gln Thr Ser Thr Leu 85 90 95 Gln Ser Ser Glu Ala Ala Ser Thr Val Gly Ser Ser Thr Ser Ser Ser 100 105 110 Pro Ser Ser Ser Ser Ser Thr Ser Ser Ser Ala Ser Ser Ser Ala Ser 115 120 125 Ser Ser Ile Ser Ala Ser Gly Ala Lys Gly Ile Thr Tyr Ser Pro Tyr 130 135 140 Asn Asp Asp Gly Ser Cys Lys Ser Thr Ala Gln Val Ala Ser Asp Leu 145 150 155 160 Glu Gln Leu Thr Gly Phe Asp Asn Ile Arg Leu Tyr Gly Val Asp Cys 165 170 175 Ser Gln Val Glu Asn Val Leu Gln Ala Lys Thr Ser Ser Gln Lys Leu 180 185 190 Phe Leu Gly Ile Tyr Tyr Val Asp Lys Ile Gln Asp Ala Val Asp Thr 195 200 205 Ile Lys Ser Ala Val Glu Ser Tyr Gly Ser Trp Asp Asp Ile Thr Thr 210 215 220 Val Ser Val Gly Asn Glu Leu Val Asn Gly Gly Ser Ala Thr Thr Thr 225 230 235 240 Gln Val Gly Glu Tyr Val Ser Thr Ala Lys Ser Ala Leu Thr Ser Ala 245 250 255 Gly Tyr Thr Gly Ser Val Val Ser Val Asp Thr Phe Ile Ala Val Ile 260 265 270 Asn Asn Pro Asp Leu Cys Asn Tyr Ser Asp Tyr Met Ala Val Asn Ala 275 280 285 His Ala Tyr Phe Asp Glu Asn Thr Ala Ala Gln Asp Ala Gly Pro Trp 290 295 300 Val Leu Glu Gln Ile Glu Arg Val Tyr Thr Ala Cys Gly Gly Lys Lys 305 310 315 320 Asp Val Val Ile Thr Glu Thr Gly Trp Pro Ser Lys Gly Asp Thr Tyr 325 330 335 Gly Glu Ala Val Pro Ser Lys Ala Asn Gln Glu Ala Ala Ile Ser Ser 340 345 350 Ile Lys Ser Ser Cys Gly Ser Ser Ala Tyr Leu Phe Thr Ala Phe Asn 355 360 365 Asp Leu Trp Lys Asp Asp Gly Gln Tyr Gly Val Glu Lys Tyr Trp Gly 370 375 380 Ile Leu Ser Ser Asp 385 <210> 25 <211> 386 <212> PRT <213> Saccharomyces cerevisiae <400> 25 Met Arg Leu Ser Asn Leu Ile Ala Ser Ala Ser Leu Leu Ser Ala Ala 1 5 10 15 Thr Leu Ala Ala Pro Ala Asn His Glu His Lys Asp Lys Arg Ala Val 20 25 30 Val Thr Thr Thr Val Gln Lys Gln Thr Thr Ile Ile Val Asn Gly Ala 35 40 45 Ala Ser Thr Pro Val Ala Ala Leu Glu Glu Asn Ala Val Val Asn Ser 50 55 60 Ala Pro Ala Ala Ala Thr Ser Thr Thr Ser Ser Ala Ala Ser Val Ala 65 70 75 80 Thr Ala Ala Ala Ser Ser Ser Glu Asn Asn Ser Gln Val Ser Ala Ala 85 90 95 Ala Ser Pro Ala Ser Ser Ser Ala Ala Thr Ser Thr Gln Ser Ser Ser 100 105 110 Ser Ser Gln Ala Ser Ser Ser Ser Ser Ser Gly Glu Asp Val Ser Ser 115 120 125 Phe Ala Ser Gly Val Arg Gly Ile Thr Tyr Thr Pro Tyr Glu Ser Ser 130 135 140 Gly Ala Cys Lys Ser Ala Ser Glu Val Ala Ser Asp Leu Ala Gln Leu 145 150 155 160 Thr Asp Phe Pro Val Ile Arg Leu Tyr Gly Thr Asp Cys Asn Gln Val 165 170 175 Glu Asn Val Phe Lys Ala Lys Ala Ser Asn Gln Lys Val Phe Leu Gly 180 185 190 Ile Tyr Tyr Val Asp Gln Ile Gln Asp Gly Val Asn Thr Ile Lys Ser 195 200 205 Ala Val Glu Ser Tyr Gly Ser Trp Asp Asp Val Thr Thr Val Ser Ile 210 215 220 Gly Asn Glu Leu Val Asn Gly Asn Gln Ala Thr Pro Ser Gln Val Gly 225 230 235 240 Gln Tyr Ile Asp Ser Gly Arg Ser Ala Leu Lys Ala Ala Gly Tyr Thr 245 250 255 Gly Pro Val Val Ser Val Asp Thr Phe Ile Ala Val Ile Asn Asn Pro 260 265 270 Glu Leu Cys Asp Tyr Ser Asp Tyr Met Ala Val Asn Ala His Ala Tyr 275 280 285 Phe Asp Lys Asn Thr Val Ala Gln Asp Ser Gly Lys Trp Leu Leu Glu 290 295 300 Gln Ile Gln Arg Val Trp Thr Ala Cys Asp Gly Lys Lys Asn Val Val 305 310 315 320 Ile Thr Glu Ser Gly Trp Pro Ser Lys Gly Glu Thr Tyr Gly Val Ala 325 330 335 Val Pro Ser Lys Glu Asn Gln Lys Asp Ala Val Ser Ala Ile Thr Ser 340 345 350 Ser Cys Gly Ala Asp Thr Phe Leu Phe Thr Ala Phe Asn Asp Tyr Trp 355 360 365 Lys Ala Asp Gly Ala Tyr Gly Val Glu Lys Tyr Trp Gly Ile Leu Ser 370 375 380 Asn Glu 385 <210> 26 <211> 420 <212> PRT <213> Saccharomyces cerevisiae <400> 26 Met Lys Leu Ser Ala Thr Thr Leu Thr Ala Ala Ser Leu Ile Gly Tyr 1 5 10 15 Ser Thr Ile Val Ser Ala Leu Pro Tyr Ala Ala Asp Ile Asp Thr Gly 20 25 30 Cys Thr Thr Thr Ala His Gly Ser His Gln His Lys Arg Ala Val Ala 35 40 45 Val Thr Tyr Val Tyr Glu Thr Val Thr Val Asp Lys Asn Gly Gln Thr 50 55 60 Val Thr Pro Thr Ser Thr Glu Ala Ser Ser Thr Val Ala Ser Thr Thr 65 70 75 80 Thr Leu Ile Ser Glu Ser Ser Val Thr Lys Ser Ser Ser Lys Val Ala 85 90 95 Ser Ser Ser Glu Ser Thr Glu Gln Ile Ala Thr Thr Ser Ser Ser Ala 100 105 110 Gln Thr Thr Leu Thr Ser Ser Glu Thr Ser Thr Ser Glu Ser Ser Val 115 120 125 Pro Ile Ser Thr Ser Gly Ser Ala Ser Thr Ser Ser Ala Ala Ser Ser 130 135 140 Ala Thr Gly Ser Ile Tyr Gly Asp Leu Ala Asp Phe Ser Gly Pro Tyr 145 150 155 160 Glu Lys Phe Glu Asp Gly Thr Ile Pro Cys Gly Gln Phe Pro Ser Gly 165 170 175 Gln Gly Val Ile Pro Ile Ser Trp Leu Asp Glu Gly Gly Trp Ser Gly 180 185 190 Val Glu Asn Thr Asp Thr Ser Thr Gly Gly Ser Cys Lys Glu Gly Ser 195 200 205 Tyr Cys Ser Tyr Ala Cys Gln Pro Gly Met Ser Lys Thr Gln Trp Pro 210 215 220 Ser Asp Gln Pro Ser Asp Gly Arg Ser Ile Gly Gly Leu Leu Cys Lys 225 230 235 240 Asp Gly Tyr Leu Tyr Arg Ser Asn Thr Asp Thr Asp Tyr Leu Cys Glu 245 250 255 Trp Gly Val Asp Ala Ala Tyr Val Val Ser Glu Leu Ser Asn Asp Val 260 265 270 Ala Ile Cys Arg Thr Asp Tyr Pro Gly Thr Glu Asn Met Val Ile Pro 275 280 285 Thr Tyr Val Gln Ala Gly Asp Ser Leu Pro Leu Thr Val Val Asp Gln 290 295 300 Asp Thr Tyr Tyr Thr Trp Gln Gly Leu Lys Thr Ser Ala Gln Tyr Tyr 305 310 315 320 Val Asn Asn Ala Gly Ile Ser Val Glu Asp Ala Cys Val Trp Gly Ser 325 330 335 Ser Ser Ser Gly Val Gly Asn Trp Ala Pro Leu Asn Phe Gly Ala Gly 340 345 350 Ser Ser Asp Gly Val Ala Tyr Leu Ser Leu Ile Pro Asn Pro Asn Asn 355 360 365 Gly Asn Ala Leu Asn Phe Asn Val Lys Ile Val Ala Ala Asp Asp Ser 370 375 380 Ser Thr Val Asn Gly Glu Cys Ile Tyr Glu Asn Gly Ser Phe Ser Gly 385 390 395 400 Gly Ser Asp Gly Cys Thr Val Ser Val Thr Ala Gly Lys Ala Lys Phe 405 410 415 Val Leu Tyr Asn 420 <210> 27 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 27 cgcctcgaca tcatctgccc agatgc 26 <210> 28 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 28 cgggcgacag tcacatcatg cccctg 26 <210> 29 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 29 ggccagaatg taaacaaatg cagataagg 29 <210> 30 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 30 cgtcactgcc agcagtg 17 <210> 31 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 31 gctgccttcc ctatatctga tatcac 26

Claims (15)

  1. 이종 목적 단백질 (POI)을 생산하도록 조작된 진핵 숙주 세포로서, 세포가 제1 HCP (HCP1), 제2 HCP (HCP2), 및 제3 HCP (HCP3)로 이루어지는 군에서 선택되는 적어도 하나의 내인성 숙주 세포 단백질 (HCP)의 생산이 감소되도록 유전적으로 변형되고, 여기서
    a) HCP1이, 숙주 세포가 코마가타엘라 파피이 (Komagataella phaffii)인 경우 서열번호 1로 식별되는 아미노산 서열, 또는 숙주 세포가 다른 종인 경우 그 숙주 세포에 내인성인 서열번호 1로 식별되는 아미노산 서열의 상동 서열을 포함하고;
    b) HCP2가, 숙주 세포가 코마가타엘라 파피이인 경우 서열번호 3으로 식별되는 아미노산 서열, 또는 숙주 세포가 다른 종인 경우 그 숙주 세포에 내인성인 서열번호 3으로 식별되는 아미노산 서열의 상동 서열을 포함하며; 그리고
    c) HCP3이, 숙주 세포가 코마가타엘라 파피이인 경우 서열번호 5로 식별되는 아미노산 서열, 또는 숙주 세포가 다른 종인 경우 그 숙주 세포에 내인성인 서열번호 5로 식별되는 아미노산 서열의 상동 서열을 포함하는, 숙주 세포.
  2. 제1항에 있어서, 상기 적어도 하나의 HCP가 HCP1, 및 선택적으로 HCP2 및/또는 HCP3인, 숙주 세포.
  3. 제1항 또는 제2항에 있어서, 세포가 HCP4인 추가 HCP의 생산이 감소되도록 추가로 유전적으로 변형되고, 여기서
    a) HCP4가, 숙주 세포가 코마가타엘라 파피이인 경우 서열번호 7로 식별되는 아미노산 서열, 또는 숙주 세포가 다른 종인 경우 그 숙주 세포에 내인성인 이의 상동 서열을 포함하는, 숙주 세포.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 각 상동 서열이 각각의 아미노산 서열에 대한 적어도 50%의 서열 동일성을 특징으로 하는, 숙주 세포.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 숙주 세포가 (i) 1 이상의 내인성 폴리뉴클레오티드, 또는 그의 일부; 또는 (ii) 발현 조절 서열의 파괴, 치환, 결실 또는 녹아웃을 포함하는 숙주 세포 게놈의 1 이상의 유전적 변형에 의해 유전적으로 변형되며, 바람직하게 상기 발현 조절 서열은 프로모터, 리보솜 결합 부위, 전사 또는 번역 개시 및 종결 서열, 인핸서 및 활성인자 서열로 이루어지는 군에서 선택되는, 숙주 세포.
  6. 제5항에 있어서, 상기 적어도 하나의 HCP 중 어느 하나를 암호화하는 유전자가 상기 1 이상의 유전적 변형에 의해 녹아웃되는, 숙주 세포.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 적어도 하나의 HCP 중 어느 하나의 양이 상기 변형이 없는 숙주 세포 대비 적어도 50% (mol/mol) 감소되도록, 바람직하게는 상기 적어도 하나의 HCP 중 어느 하나를 암호화하는 유전자의 녹아웃에 의해 유전적으로 변형되는, 숙주 세포.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, POI를 암호화하는 뉴클레오티드 서열에 작동가능하게 연결된 1 이상의 조절 핵산 서열을 포함하는 발현 카세트를 포함하며, 여기서 상기 1 이상의 작동가능하게 연결된 서열이 POI 암호화 서열과 선천적으로 관련되지 (natively associated) 않은, 숙주 세포.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, POI가 항원-결합 단백질, 치료용 단백질, 효소, 펩티드, 단백질 항생물질, 독소 융합 단백질, 탄수화물-단백질 컨쥬게이트, 구조 단백질, 조절 단백질, 백신 항원, 성장 인자, 호르몬, 사이토카인, 공정 효소 (process enzyme), 및 대사 효소로 이루어지는 군에서 선택되는 펩티드 또는 단백질인, 숙주 세포.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 동물 세포, 척추 동물 세포, 포유류 세포, 인간 세포, 식물 세포, 선충 세포, 무척추 동물 세포, 곤충 세포, 연체동물 세포, 상기한 것 중 어느 하나로부터 유래한 줄기 세포, 또는 효모 또는 진균 세포 중 어느 하나인, 숙주 세포.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서,
    a) 피키아 파스토리스 (Pichia pastoris), 코마가타엘라 파피이 (Komagataella phaffii), 코마가타엘라 파스토리스 (Komagataella pastoris), 코마가타엘라 슈도파스토리스 (Komagataella pseudopastoris), 사카로마이세스 세레비지애 (Saccharomyces cerevisiae), 오가타에아 미누타 (Ogataea minuta), 클루이베로마이세스 락티스 (Kluyveromces lactis), 클루이베로마이세스 마르시아누스 (Kluyveromes marxianus), 야로위아 리폴리티카 (Yarrowia lipolytica) 또는 한세눌라 폴리모르파 (Hansenula polymorpha)와 같은 피키아 (Pichia), 한세눌라 (Hansenula), 코마가타엘라 (Komagataella), 사카로마이세스 (Saccharomyces), 클루이베로마이세스 (Kluyveromyces), 칸디다 (Candida), 오가타에아 (Ogataea), 야로위아 (Yarrowia), 및 게오트리쿰 (Geotrichum)으로 이루어지는 군에서 선택되는 속의 효모 세포; 또는
    b) 아스퍼질러스 아와모리 (Aspergillus awamori) 또는 트리코데르마 리세이 (Trichoderma reesei)와 같은 사상성 진균 세포인, 숙주 세포.
  12. 하기 단계를 포함하는, 진핵 숙주 세포에서 목적 단백질 (POI)을 생산하는 방법:
    i) 제1 HCP (HCP1), 제2 HCP (HCP2), 및 제3 HCP (HCP3)로 이루어지는 군에서 선택되는 적어도 하나의 내인성 숙주 세포 단백질 (HCP)의 생산이 감소되도록 숙주 세포를 유전적으로 변형하는 단계로, 여기서
    a) HCP1아, 숙주 세포가 코마가타엘라 파피이 (Komagataella phaffii)인 경우 서열번호 1로 식별되는 아미노산 서열, 또는 숙주 세포가 다른 종인 경우 그 숙주 세포에 내인성인 서열번호 1로 식별되는 아미노산 서열의 상동 서열을 포함하고;
    b) HCP2가, 숙주 세포가 코마가타엘라 파피이 (Komagataella phaffii)인 경우 서열번호 3으로 식별되는 아미노산 서열, 또는 숙주 세포가 다른 종인 경우 그 숙주 세포에 내인성인 서열번호 3으로 식별되는 아미노산 서열의 상동 서열을 포함하며; 그리고
    c) HCP3이, 숙주 세포가 코마가타엘라 파피이 (Komagataella phaffii)인 경우 서열번호 5로 식별되는 아미노산 서열, 또는 숙주 세포가 다른 종인 경우 그 숙주 세포에 내인성인 서열번호 5로 식별되는 아미노산 서열의 상동 서열을 포함하는 단계;
    ii) POI를 암호화하는 뉴클레오티드 서열에 작동가능하게 연결된 1 이상의 조절 핵산 서열을 포함하는 발현 카세트를 숙주 세포에 도입하는 단계;
    iii) 상기 POI를 생산하기 위한 조건하에서 상기 숙주 세포를 배양하는 단계; 및 선택적으로
    iv) 상기 POI를 세포 배양물로부터 단리하는 단계; 및 선택적으로
    v) 상기 POI를 정제하는 단계.
  13. 제1항 내지 제11항 중 어느 한 항의 숙주 세포를 상기 POI를 생산하기 위한 조건하에서 배양함으로써 목적 단백질 (POI)을 생산하는 방법.
  14. 제12항 또는 제13항에 있어서, 상기 적어도 하나의 HCP 중 어느 하나의 양이 바람직하게는 상기 적어도 하나의 HCP 중 어느 하나를 암호화하는 유전자의 녹아웃에 의해, 상기 변형이 없는 숙주 세포 대비 적어도 50% (mol/mol) 감소되는, 방법.
  15. 제1항 내지 제10항 중 어느 한 항의 숙주 세포를 상기 POI를 생산하기 위한 조건하에서 배양하고 상기 세포 배양물로부터 POI를 단리함으로써, 숙주 세포 배양물 내 생산된 목적 단백질 (POI)의 내인성 숙주 세포 단백질 (HCP) 오염의 위험을 감소시키는 방법.
KR1020207023186A 2018-02-12 2019-01-30 목적 단백질을 생산하기 위한 숙주 세포 KR20200120908A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP18156329 2018-02-12
EP18156329.7 2018-02-12
PCT/EP2019/052218 WO2019154686A1 (en) 2018-02-12 2019-01-30 Host cell for producing a protein of interest

Publications (1)

Publication Number Publication Date
KR20200120908A true KR20200120908A (ko) 2020-10-22

Family

ID=61223720

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207023186A KR20200120908A (ko) 2018-02-12 2019-01-30 목적 단백질을 생산하기 위한 숙주 세포

Country Status (11)

Country Link
US (1) US20200399325A1 (ko)
EP (1) EP3752617A1 (ko)
JP (2) JP2021513370A (ko)
KR (1) KR20200120908A (ko)
CN (1) CN112105737A (ko)
AU (1) AU2019218931A1 (ko)
BR (1) BR112020016258A2 (ko)
CA (1) CA3089682A1 (ko)
IL (1) IL276625A (ko)
SG (1) SG11202006449RA (ko)
WO (1) WO2019154686A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115772519A (zh) * 2021-09-06 2023-03-10 中国科学院天津工业生物技术研究所 源于蛹虫草的强启动子及其应用

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2177528T3 (es) 1991-04-01 2002-12-16 Merck & Co Inc Genes que influyen en la actividad proteolitica de pichia y usoso de los mismos.
US6153424A (en) 1995-11-09 2000-11-28 Zymogenetics, Inc. Protease-deficient strains of Pichia methanolica
KR20100016170A (ko) 2007-04-20 2010-02-12 폴리문 사이언티픽 임무노이비오로기쉐 포르슝 게엠베하 이스트 발현 시스템
WO2010064748A1 (en) * 2008-12-04 2010-06-10 Korea Research Institute Of Bioscience And Biotechnology Screening of abundantly secreted proteins and their use as fusion partners for the production of recombinant proteins
US10392625B2 (en) 2009-02-26 2019-08-27 Glaxosmithkline Llc Host cells and methods of use
EP2258855A1 (en) * 2009-05-28 2010-12-08 Universität für Bodenkultur Wien Expression sequences
WO2012152823A1 (en) 2011-05-09 2012-11-15 Ablynx Nv Method for the production of immunoglobulin single variable domains
CN102276704B (zh) * 2011-07-29 2013-07-24 华南理工大学 毕赤酵母壁蛋白Gcw28及其表面展示系统和构建方法
BR112014008152A2 (pt) * 2011-10-07 2017-04-18 Lonza Ag método para produção de uma proteina de interesse cultivando uma linhagem celular eucariótica recombinante compreendendo uma construção de expressão compreendendo um promotor regulável e uma molécula de ácido nucleico que codifica uma poi sob o controle transcricional de tal promotor
EP2912053B1 (en) 2012-10-29 2016-11-09 Lonza Ltd Expression sequences
EP2970994B1 (en) 2013-03-15 2019-07-17 Lonza Ltd Constitutive promoter
BR112016023769A2 (pt) * 2014-04-17 2017-10-17 Boehringer Ingelheim Rcv Gmbh célula hospedeira recombinante para a expressão de proteínas de interesse
US10752907B2 (en) 2015-08-05 2020-08-25 Lonza Ltd Promoter variants

Also Published As

Publication number Publication date
BR112020016258A2 (pt) 2020-12-15
EP3752617A1 (en) 2020-12-23
WO2019154686A8 (en) 2020-03-05
JP2021513370A (ja) 2021-05-27
WO2019154686A1 (en) 2019-08-15
IL276625A (en) 2020-09-30
CN112105737A (zh) 2020-12-18
US20200399325A1 (en) 2020-12-24
AU2019218931A1 (en) 2020-07-23
CA3089682A1 (en) 2019-08-15
JP2023156329A (ja) 2023-10-24
SG11202006449RA (en) 2020-08-28

Similar Documents

Publication Publication Date Title
EP3130598B1 (en) Expression sequences
US11773424B2 (en) Carbon-source regulated protein production in a recombinant host cell
JP2023156329A (ja) 目的タンパク質を産生するための宿主細胞
US20230126246A1 (en) Helper factors for expressing proteins in yeast
US20230348545A1 (en) Host cells overexpressing translational factors
AU2020252241B2 (en) Mut- methylotrophic yeast
WO2020200414A1 (en) Protein production in mut-methylotrophic yeast
WO2020200415A1 (en) Mut- methylotrophic yeast

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal