KR20200073280A

KR20200073280A - 주변세포질 단백질 발현을 위한 박테리아 리더 서열

Info

Publication number: KR20200073280A
Application number: KR1020207015248A
Authority: KR
Inventors: 러셀 제이 콜먼
Original assignee: 피페넥스 인크.
Priority date: 2017-10-27
Filing date: 2018-10-17
Publication date: 2020-06-23
Also published as: CA3077393A1; US20190127744A1; SG11202002989SA; JP2021501157A; AU2018354069A1; EP3700915A4; CN111372941A; WO2019083795A1; BR112020008369A2; EP3700915A1

Abstract

이종 단백질의 주변세포질 발현을 위한 박테리아 리더 서열, 박테리아 리더 서열을 포함하는 융합 단백질, 및 이것의 발현 방법이 본원에 제공된다.

Description

주변세포질 단백질 발현을 위한 박테리아 리더 서열

관련 출원에 대한 상호 참조

본 출원은 2017년 10월 27일에 제출된 미국 가출원 제62/578,304호를 우선권으로 주장하며, 상기 가출원은 그 전체가 본 출원에 참고로 인용된다.

서열 목록

본 출원은 ASCII 포맷으로 전자적으로 제출된 서열 목록을 포함하고, 그 전체 내용이 본 출원에 참고로 인용된다. 상기 ASCII 사본은 2018년 10월 16일에 생성되었고, 그 명칭은 38194-752_601_SL.txt이며, 크기는 13,698 바이트이다.

재조합적으로 생산된 150개를 초과하는 단백질 및 폴리펩타이드가 생명공학 약물 및 백신으로서의 사용에 대해 미국 식품의약청(FDA)에서 허가되었고, 또 다른 370개가 임상 시험 중이다. 화학적 합성을 통해 생산되는 저분자 치료제와는 달리, 단백질 및 폴리펩타이드는 살아 있는 세포에서 가장 효율적으로 생산된다. 그러나, 박테리아에서의 현재의 재조합 단백질 생산 방법으로는 부적절하게 폴딩되거나, 응집되거나 또는 불활성인 단백질이 종종 생산되고, 다수의 유형의 단백질은 공지된 방법을 사용하여 비효율적으로 달성되는 2차 변형을 필요로 한다.

공지된 방법의 한가지 중요한 문제점은 세포질 내에 응집된 단백질들로 이루어진 봉입체(inclusion body)가 형성되는 것이고, 이는 과량의 단백질이 세포 내에 축적될 때 발생한다. 재조합 단백질 생산에서의 또 다른 문제점은 발현된 단백질에 대해 적절한 2차 및 3차 형태(conformation)를 수립하는 것이다. 한가지 장벽은 종종 적절한 단백질 폴딩의 기초가 되는 다이설파이드 결합 형성을 박테리아 세포질이 활발하게 저지한다는 것이다(Derman et al., 1993, Science, 1744-7). 그 결과, 다수의 재조합 단백질, 특히 진핵생물 기원의 단백질이 박테리아에서 생산되는 경우 부적절하게 폴딩되고 불활성이다.

재조합 시스템에서 적절하게 폴딩되고, 가용성이고/이거나 활성인 단백질의 생산을 증가시키기 위해 수많은 시도들이 진행되었다. 예를 들어, 연구원들은 발효 조건을 변경시키거나, 프로모터 강도에 변화를 주거나, 봉입체의 형성을 방지하는 것을 도울 수 있는 과발현된 샤페론(chaperone) 단백질을 사용하여 왔다.

적절하게 폴딩되고, 가용성이고/이거나 활성인 단백질의 수확을 증가시키기 위한 대안적인 접근법은 단백질을 세포내 환경으로부터 분비시키는 것이다. 신호 서열이 있는 폴리펩타이드의 가장 통상적인 형태의 분비는 Sec 시스템과 관련된다. Sec 시스템은 N-말단 신호 폴리펩타이드가 있는 단백질의 세포질 막을 가로지르는 유출(export)을 담당한다.

세포로부터 상등액 내로 단백질을 배출(excretion)시키기 위한 전략들이 개발되었다. 증가된 발현을 위한 또 다른 전략은 단백질을 주변세포질로 타겟팅하는 것에 관한 것이다. 일부 연구원들은 Sec 타입이 아닌 분비(secretion)에 초점을 맞추었다. 그러나, 대다수의 연구는 Sec 타입 분비 시스템을 이용하는 외인성 단백질의 분비에 집중되어 왔다. 다수의 분비 신호는 재조합 폴리펩타이드 또는 단백질을 발현에 사용하기 위해 언급되어 왔다.

단백질을 세포질 밖으로 타겟팅하기 위해 신호 서열에 의존하는 전략들은 종종 부적절하게 프로세싱된 단백질을 생산한다. 이는 아미노-말단 분비 신호, 예를 들어 Sec 시스템을 통해 분비를 유도한 신호에 대해 특히 그러하다. 이러한 시스템을 통해 프로세싱된 단백질들은 종종 분비 신호의 일부를 유지하거나, 부적절하게 절단되는(cleaved) 연결 요소를 필요로 하거나, 또는 말단에서 절단된다(truncated).

앞에서 언급한 기술로부터 명백한 바와 같이, 단백질을 숙주 세포의 주변세포질로 타겟팅하기 위해 다수의 전략들이 개발되어 왔다. 그러나, 공지된 전략들은 종종 치료적 용도를 위해 정제되는, 지속적으로 높은 수율의 적절하게 프로세싱된 활성 재조합 단백질을 생산할 수 없었다. 기존의 전략들에서의 한가지 중요한 제한 사항은 부적절한 세포 시스템에서 불량한 분비 신호 서열을 이용하는 단백질의 발현이었다.

적절하게 프로세싱된 형태의 재조합 폴리펩타이드를 생산하기 위해 재조합 폴리펩타이드를 분비할 수 있고 적절하게 프로세싱할 수 있는 개선된 대규모 발현 시스템에 대한 요구가 존재한다.

본 출원에서 제1 부분 및 제2 부분을 보유하는 폴리펩타이드가 제공되는데, 제1 부분은 서열 번호 1-3 중 하나 이상과 상동성인 아미노산 서열을 보유하고, 제2 부분은 관심 단백질 또는 폴리펩타이드의 아미노산 서열을 보유하며, 제1 부분 및 제2 부분은 작동 가능하게 연결된다. 몇몇 실시양태에서, 폴리펩타이드의 제1 부분은 관심 단백질 또는 폴리펩타이드 태생이 아니다. 몇몇 실시양태에서, 관심 단백질은 항체 또는 항체 유도체, 효소, 사이토카인, 케모카인, 성장 인자 및 백신 항원으로부터 선택된다. 몇몇 실시양태에서, 항체 또는 항체 유도체는 scFv, Fab, 인간화 항체, 변형된 항체, 단일 도메인 항체, 이종 특이성 항체, 3가 항체, 이중 특이성 항체, 단일 사슬 항체, Fab 단편, 선형 항체, 디아바디, 또는 전체 사슬 항체이다. 몇몇 실시양태에서, 폴리펩타이드는 링커를 추가로 포함한다. 몇몇 실시양태에서, 폴리펩타이드는 절단 도메인을 추가로 포함한다. 몇몇 실시양태에서, 제1 부분은 원핵 숙주 세포의 주변세포질로 관심 단백질의 발현을 유도하는 리더 펩타이드이다. 몇몇 실시양태에서, 숙주 세포는 슈도모나드(Pseudomonad) 세포 또는 이. 콜라이(E. coli) 세포로부터 선택된다.

또한, 본 출원에서 리더 펩타이드 및 관심 단백질 또는 폴리펩타이드를 포함하는 폴리펩타이드가 제공되는데, 리더 펩타이드는 서열 번호 1-3 중 하나 이상으로부터 선택된 아미노산 서열을 보유한다. 몇몇 실시양태에서, 리더 펩타이드는 관심 단백질 또는 폴리펩타이드 태생이 아니다. 몇몇 실시양태에서, 관심 단백질 또는 폴리펩타이드는 항체 또는 항체 유도체, 효소, 사이토카인, 케모카인, 성장 인자 및 백신 항원으로부터 선택된다. 몇몇 실시양태에서, 항체 또는 항체 유도체는 scFv, Fab, 인간화 항체, 변형된 항체, 단일 도메인 항체, 이종 특이성 항체, 3가 항체, 이중 특이성 항체, 단일 사슬 항체, Fab 단편, 선형 항체, 디아바디, 또는 전체 사슬 항체이다. 몇몇 실시양태에서, 폴리펩타이드는 링커를 추가로 포함한다. 몇몇 실시양태에서, 폴리펩타이드는 절단 도메인을 추가로 포함한다. 몇몇 실시양태에서, 제1 부분은 원핵 숙주 세포의 주변세포질로 관심 단백질의 발현을 유도하는 리더 펩타이드이다. 몇몇 실시양태에서, 숙주 세포는 슈도모나드 세포 또는 이. 콜라이 세포로부터 선택된다.

추가로, 본 출원에서 제1 부분 및 제2 부분을 보유하는 폴리펩타이드를 코딩하는 폴리뉴클레오타이드가 제공되는데, 제1 부분은 서열 번호 4-6 중 하나 이상으로부터 선택된 핵산 서열에 의해 코딩되고, 제2 부분은 관심 단백질 또는 폴리펩타이드의 핵산 서열에 의해 코딩되며, 제1 부분 및 제2 부분은 작동 가능하게 연결된다. 몇몇 실시양태에서, 폴리펩타이드의 제1 부분은 관심 단백질 또는 폴리펩타이드 태생이 아니다. 몇몇 실시양태에서, 관심 단백질 또는 폴리펩타이드는 항체 또는 항체 유도체, 효소, 사이토카인, 케모카인, 성장 인자 및 백신 항원으로부터 선택된다. 몇몇 실시양태에서, 항체 또는 항체 유도체는 scFv, Fab, 인간화 항체, 변형된 항체, 단일 도메인 항체, 이종 특이성 항체, 3가 항체, 이중 특이성 항체, 단일 사슬 항체, Fab 단편, 선형 항체, 디아바디, 또는 전체 사슬 항체이다. 몇몇 실시양태에서, 폴리뉴클레오타이드는 링커를 코딩하는 핵산을 추가로 포함한다. 몇몇 실시양태에서, 폴리뉴클레오타이드는 절단 도메인을 코딩하는 핵산을 추가로 포함한다. 몇몇 실시양태에서, 제1 부분은 원핵 숙주 세포의 주변세포질로 관심 단백질의 발현을 유도하는 리더 펩타이드이다. 몇몇 실시양태에서, 숙주 세포는 슈도모나드 세포 또는 이. 콜라이 세포로부터 선택된다.

또한, 본 출원에서 리더 펩타이드를 코딩하는 핵산을 포함하는 단백질 발현을 위한 벡터가 제공되는데, 핵산은 서열 번호 4-6 중 하나 이상으로부터 선택된 핵산 서열을 보유한다. 몇몇 실시양태에서, 벡터는 링커를 추가로 포함한다. 몇몇 실시양태에서, 벡터는 절단 도메인을 추가로 포함한다. 몇몇 실시양태에서, 리더 펩타이드는 원핵 숙주 세포의 주변세포질로 관심 단백질 또는 폴리펩타이드의 발현을 유도한다. 몇몇 실시양태에서, 숙주 세포는 슈도모나드 세포 또는 이. 콜라이 세포로부터 선택된다.

또한, 본 출원에서 원핵 세포 배양으로 관심 단백질 또는 폴리펩타이드를 생산하는 방법이 제공된다. 몇몇 실시양태에서, 상기 방법은 (a) 세포 배양 성장 배지에서 관심 단백질 또는 폴리펩타이드 및 리더 펩타이드를 코딩하는 핵산을 포함하는 원핵 세포를 배양하는 단계; 및 (b) 원핵 세포의 주변세포질로부터 관심 단백질 또는 폴리펩타이드를 단리하는 단계를 포함하고, 여기서 리더 펩타이드는 서열 번호 1-3 중 하나 이상으로부터 선택된 아미노산 서열을 포함한다. 몇몇 실시양태에서, 관심 단백질 또는 폴리펩타이드는 항체 또는 항체 유도체, 효소, 사이토카인, 케모카인, 성장 인자 및 백신 항원으로부터 선택된다. 몇몇 실시양태에서, 항체 또는 항체 유도체는 scFv, Fab, 인간화 항체, 변형된 항체, 단일 도메인 항체, 이종 특이성 항체, 3가 항체, 이중 특이성 항체, 단일 사슬 항체, Fab 단편, 선형 항체, 디아바디, 또는 전체 사슬 항체이다. 몇몇 실시양태에서, 핵산은 링커를 코딩한다. 몇몇 실시양태에서, 핵산은 절단 도메인을 코딩한다. 몇몇 실시양태에서, 원핵 세포는 슈도모나드 세포 또는 이. 콜라이 세포로부터 선택된다. 몇몇 실시양태에서, 관심 단백질 또는 폴리펩타이드의 발현은 배양 배지에 IPTG를 첨가함으로써 유도된다. 몇몇 실시양태에서, 원핵 세포는 약 5.0 내지 약 8.0의 pH에서 배양된다. 몇몇 실시양태에서, 원핵 세포는 약 22℃ 내지 약 33℃의 온도에서 배양된다.

몇몇 실시양태에서, 본 출원의 방법은 원핵 세포 배양으로 관심 단백질 또는 폴리펩타이드를 생산하는 방법을 포함하는데, 상기 방법은 (a) 세포 배양 성장 배지에서 관심 단백질 또는 폴리펩타이드 및 리더 펩타이드를 코딩하는 핵산을 포함하는 원핵 세포를 배양하는 단계; 및 (b) 원핵 세포의 주변세포질로부터 관심 단백질 또는 폴리펩타이드를 단리하는 단계를 포함하고, 여기서 리더 펩타이드는 서열 번호 4-6 중 하나 이상으로부터 선택된 핵산 서열에 의해 코딩된다. 몇몇 실시양태에서, 관심 단백질 또는 폴리펩타이드는 항체 또는 항체 유도체, 효소, 사이토카인, 케모카인, 성장 인자 및 백신 항원으로부터 선택된다. 몇몇 실시양태에서, 항체 또는 항체 유도체는 scFv, Fab, 인간화 항체, 변형된 항체, 단일 도메인 항체, 이종 특이성 항체, 3가 항체, 이중 특이성 항체, 단일 사슬 항체, Fab 단편, 선형 항체, 디아바디, 또는 전체 사슬 항체이다. 몇몇 실시양태에서, 핵산은 링커를 코딩한다. 몇몇 실시양태에서, 핵산은 절단 도메인을 코딩한다. 몇몇 실시양태에서, 원핵 세포는 슈도모나드 세포 또는 이. 콜라이 세포로부터 선택된다. 몇몇 실시양태에서, 관심 단백질 또는 폴리펩타이드의 발현은 배양 배지에 IPTG를 첨가함으로써 유도된다. 몇몇 실시양태에서, 원핵 세포는 약 5.0 내지 약 8.0의 pH에서 배양된다. 몇몇 실시양태에서, 원핵 세포는 약 22℃ 내지 약 33℃의 온도에서 배양된다.

몇몇 실시양태에서, 본 출원의 방법은 원핵 세포의 주변세포질에서 관심 단백질 또는 폴리펩타이드를 발현하는 방법을 포함하는데, 상기 방법은 세포 배양 성장 배지에서 관심 단백질 또는 폴리펩타이드 및 리더 펩타이드를 코딩하는 핵산을 포함하는 원핵 세포를 배양하는 단계를 포함하고, 리더 펩타이드는 서열 번호 1-3 중 하나 이상으로부터 선택된 아미노산 서열을 포함한다. 몇몇 실시양태에서, 관심 단백질 또는 폴리펩타이드는 항체 또는 항체 유도체, 효소, 사이토카인, 케모카인, 성장 인자 및 백신 항원으로부터 선택된다. 몇몇 실시양태에서, 항체 또는 항체 유도체는 scFv, Fab, 인간화 항체, 변형된 항체, 단일 도메인 항체, 이종 특이성 항체, 3가 항체, 이중 특이성 항체, 단일 사슬 항체, Fab 단편, 선형 항체, 디아바디, 또는 전체 사슬 항체이다. 몇몇 실시양태에서, 핵산은 링커를 코딩한다. 몇몇 실시양태에서, 핵산은 절단 도메인을 코딩한다. 몇몇 실시양태에서, 원핵 세포는 슈도모나드 세포 또는 이. 콜라이 세포로부터 선택된다. 몇몇 실시양태에서, 관심 단백질 또는 폴리펩타이드의 발현은 배양 배지에 IPTG를 첨가함으로써 유도된다. 몇몇 실시양태에서, 원핵 세포는 약 5.0 내지 약 8.0의 pH에서 배양된다. 몇몇 실시양태에서, 원핵 세포는 약 22℃ 내지 약 33℃의 온도에서 배양된다.

몇몇 실시양태에서, 본 출원의 방법은 원핵 세포의 주변세포질에서 관심 단백질 또는 폴리펩타이드를 발현하는 방법을 포함하는데, 상기 방법은 세포 배양 성장 배지에서 관심 단백질 또는 폴리펩타이드 및 리더 펩타이드를 코딩하는 핵산을 포함하는 원핵 세포를 배양하는 단계를 포함하고, 리더 펩타이드는 서열 번호 4-6 중 하나 이상으로부터 선택된 핵산 서열에 의해 코딩된다. 몇몇 실시양태에서, 관심 단백질 또는 폴리펩타이드는 항체 또는 항체 유도체, 효소, 사이토카인, 케모카인, 성장 인자 및 백신 항원으로부터 선택된다. 몇몇 실시양태에서, 항체 또는 항체 유도체는 scFv, Fab, 인간화 항체, 변형된 항체, 단일 도메인 항체, 이종 특이성 항체, 3가 항체, 이중 특이성 항체, 단일 사슬 항체, Fab 단편, 선형 항체, 디아바디, 또는 전체 사슬 항체이다. 몇몇 실시양태에서, 핵산은 링커를 코딩한다. 몇몇 실시양태에서, 핵산은 절단 도메인을 코딩한다. 몇몇 실시양태에서, 원핵 세포는 슈도모나드 세포 또는 이. 콜라이 세포로부터 선택된다. 몇몇 실시양태에서, 관심 단백질 또는 폴리펩타이드의 발현은 배양 배지에 IPTG의 첨가로 유도된다. 몇몇 실시양태에서, 원핵 세포는 약 5.0 내지 약 8.0의 pH에서 배양된다. 몇몇 실시양태에서, 원핵 세포는 약 22℃ 내지 약 33℃의 온도에서 배양된다.

참고 인용

본 명세서에서 언급된 모든 간행물, 특허 및 특허 출원은, 각각의 개별적인 간행물, 특허, 또는 특허 출원이 구체적이고 개별적으로 참고로 인용된 것임을 나타낸 바와 같이 동일한 정도로 본 출원에 참고로 인용된다.

본 개시내용의 신규한 특징들은 첨부한 청구범위에 특징적으로 기재된다. 본 개시내용의 특징 및 이점의 더 좋은 이해는 본 개시내용의 원칙이 이용되는 예시적인 실시양태를 기재하는 후술하는 발명의 상세한 설명 및 첨부 도면을 참고하여 획득될 것이다:
도 1은 TrxA 발현에 대한 SDS-CGE 겔-유사 이미지를 나타낸다.
도 2는 Gal2 발현에 대한 SDS-CGE 겔-유사 이미지를 나타낸다.
도 3은 mrPA 발현에 대한 SDS-CGE 겔-유사 이미지를 나타낸다.
도 4. 크리산타스파아제 예시 서열. 크리산타스파아제를 코딩하는 예시적인 핵산 서열(서열 번호 8)은 상응하는 아미노산 서열(서열 번호 7)과 함께 나타낸다. 또한, 도 4는 서열 번호 20으로서 클로닝 부위를 포함하는 전장 뉴클레오타이드 서열를 개시한다.
도 5. SDS-CGE 겔-유사 이미지 - 크리산타스파아제 발현 플라스미드 스크린. DC454(상부 패널) 및 DC441(하부 패널) 유래의 크리산타스파아제 소규모 성장 전체 브로스 초음파 처리 가용성 샘플은 환원된 SDS-CGC에 의해 분석되었다. 가장 좌측의 레인은 분자량 마커 래더 1(상부 패널 MW 래더 48 KD, 29 KD; 하부 패널 MW 래더 48 KD, 29 KD, 21 KD)를 나타내고, 가장 우측의 레인은 동일한 래더를 나타낸다. 좌측에서 우측으로(레인 1에서 46), 래더 1의 바로 우측에서 시작하는 것은, 하기 분비 리더 펩타이드가 크리산타스파아제 단백질의 N-말단에 융합된 경우에 관찰된 발현 패턴을 나타내는 레인이다(달리 언급하는 경우를 제외하고 고 RBS): 리더 없음; DsbD; 리더 A; DsbA; DsbA-중 RBS; Azu; Azu-중 RBS; Lao; Ibp-S31A; TolB; DC432 눌(null)(단지 플라스미드 벡터만을 보유하는 야생형 호스트 균주); Tpr; Ttg2C; FlgI; CupC2; CupB2; Pbp; PbpA20V; DsbC; 리더 B; 리더 C; DC432 null; 리더 D; 리더 E; 리더 F; 리더 G; 리더 H; PorE; 리더 I; 리더 J; 리더 K; 리더 L; DC432 눌; 리더 M; 리더 N; 리더 O; 5193; 리더 P; 리더 Q; 리더 R; 8484; 리더 S; 리더 T; DC432 눌. 겔 이미지의 우측의 화살표는 크리산타스파아제 타겟 단백질(35 kDa)의 이동을 나타낸다.
도 6. SDS-CGE 겔-유사 이미지 - 이. 콜라이 아스파라기나아제 발현 플라스미드 스크린. 아스파라기나아제 소규모(0.5 ml) 성장 전체 브로스 초음파 처리 가용성(상부 패널) 및 불용성(하부 패널) 샘플은 환원된 SDS-CGE에 의해 분석되었다. 가장 좌측의 레인은 분자량 마커 래더(상부 패널 MW 래더 119 kDa, 68 KDa, 48 kDa, 29 kDa, 21 kDa, 16 kDa; 하부 패널 MW 래더 119 kDa, 68 KDa, 48 kDa, 29 kDa, 21 kDa, 16 kDa)를 나타내고, 가장 우측의 레인은 동일한 래더를 나타낸다. 좌측에서 우측으로 래더 1의 바로 우측에서 시작하는 것은 눌, STR55467, STR55689, STR55559, STR55561, STR55569, STR55575, STR55555, STR55571, STR55560, STR55570, STR55572, STR55601, STR55585, STR55592, STR55501, 및 대조군에서 관찰된 발현 패턴을 나타내는 레인이다: Sigma 이. 콜라이 L-아스파라기나아제 1000 μg/ml, Sigma 이. 콜라이 L-아스파라기나아제 500 μg/ml, Sigma 이. 콜라이 L-아스파라기나아제 250 μg/ml, Sigma 이. 콜라이 L-아스파라기나아제 125 μg/ml, 및 Sigma 이. 콜라이 L-아스파라기나아제 62.5 μg/ml. 겔 이미지의 우측의 화살표는 아스파라기나아제 타겟 단백질(35 kDa)의 이동을 나타낸다.
도 7. SDS-CGE 겔-유사 이미지 - 크리산타스파아제 진탕 플라스크 발현 분석. 가용성의 환원된 모세관 겔 전기영동(SDS-CGE)에 의해 측정된 바와 같이 상이한 성장 조건 하에서의 발현이 도시된다. 좌측에서 우측으로는 하기 샘플에서 관찰된 발현 패턴을 나타내는 레인이다: 래더 1(분자량 마커 68, 48, 29, 21, 및 16 KD); I0에서 STR55987(리더 없이 세포질 발현); I24에서 STR55987(리더 없이 세포질 발현); I24에서 STR55987(리더 없이 세포질 발현); I24에서 STR55987(리더 없이 세포질 발현); I0에서 STR55979(리더 O); I24에서 STR55979(리더 O); I24에서 STR55979(리더 O); I24에서 STR55979(리더 O); I0에서 STR55980(8484 리더); I24에서 STR55980(8484 리더); I24에서 STR55980(8484 리더); I24에서 STR55980(8484 리더); I0에서 STR55982(눌 플라스미드); I24에서 STR55982(눌 플라스미드); I24에서 STR55982(눌 플라스미드); I24에서 STR55982(눌 플라스미드); 래더 2(래더 1에서와 동일한 마커); Sigma 이. 콜라이 AspG 1,000 ug/ml(표준 이. 콜라이 Asp2); Sigma 이. 콜라이 AspG 500 ug/ml; Sigma 이. 콜라이 AspG 250 ug/ml; Sigma 이. 콜라이 AspG 125 ug/ml; Sigma 이. 콜라이 AspG 62.5 ug/ml; 및 래더 3(래더 1에서와 동일한 마커), 이때 I0 샘플은 유도 시에 채취되고, I24 샘플은 유도 후 24 시간에 채취된다. 우측의 화살표는 이. 콜라이 L-Asp2 (35 KD)의 이동을 나타낸다.
도 8은 단백질 발현 샘플의 분석을 위한 LC-MS 출력값을 나타낸다.

개관

숙주 세포에서 높은 레벨의 적절하게 프로세싱된 재조합 단백질 또는 폴리펩타이드의 생산을 위한 조성물 및 방법이 제공된다. 특히, 그람 음성 박테리아의 주변세포질로 또는 세포외 환경 내로 관심 재조합 단백질 또는 폴리펩타이드의 타겟팅을 촉진하는 신규의 분비 신호가 제공된다. 본 출원에 개시된 주변세포질 분비 리더는 그람 음성 박테리아에서 내막을 가로질러 주변세포질 공간으로 단백질의 수송을 가능하게 한다. 재조합 발현의 경우, 주변세포질 발현은 주변세포질에서 다이설파이드 결합의 형성을 가능하게 하고, 몇몇 경우에, 높은 레벨의 재조합 단백질 발현을 가능하게 한다. 또한, 주변세포질 공간으로의 발현은 재조합 단백질의 더 효율적인 회수/정제를 가능하게 할 수 있다. 본 개시내용의 목적을 위해, "분비 신호", "분리 리더", "분비 신호 폴리펩타이드", "신호 펩타이드", 또는 "리더 서열"은 관심 단백질 또는 폴리펩타이드를 그람 음성 박테리아의 주변세포질로 또는 세포외 공간 내로 타겟팅하는데 유용한 펩타이드 서열(또는 펩타이드 서열을 코딩하는 폴리뉴클레오타이드)을 의미한다. 본 발명의 분비 신호 서열은 AnsB, 8484, 및 5193 분비 신호, 및 이의 단편 및 변이체로부터 선택된 분비 리더를 포함한다. 분비 신호를 위한 아미노산 서열은 서열 번호 1-3에 기재되어 있다. 서열 번호 1-3을 코딩하고 본 발명의 방법에 유용한 뉴클레오타이드의 예는 각각 서열 번호 4-6에 제공된다(표 1). 당해 기술분야의 통상의 기술자에게 공지된 바와 같이, 아미노산 서열은 유전 코드의 축퇴성으로 인해 상이한 뉴클레오타이드 서열에 의해 코딩될 수 있다. 따라서, 본 발명은 동일한 아미노산 서열을 보유하지만, 상이한 뉴클레오타이드 서열에 의해 코딩되는 펩타이드 또는 단백질의 사용을 포함한다. 또한, 본 출원에서 작동 가능하게 연결된 관심 재조합 단백질 또는 폴리펩타이드의 주변세포질 발현을 유도할 수 있는 이들 분비 신호 서열의 단편 및 변이체가 제공된다.

본 발명에 개시된 방법은 부적절하게 폴딩되거나, 응집되거나 또는 불활성인 단백질이 종종 생산되는, 현재의 박테리아에서의 재조합 단백질 생산 방법의 개선점을 제공한다. 추가적으로, 많은 타입의 단백질이 공지된 방법을 사용하여 비효율적으로 달성되는 2차 변형을 필요로 한다. 본 출원의 방법은 세포내 환경으로부터 단백질을 분비시킴으로써 적절하게 폴딩되고, 가용성이고/이거나, 활성인 단백질의 수확을 증가시킨다. 그람 음성 박테리아에서, 세포질로부터 분비된 단백질은 종종 주변세포질 공간에서, 외막에 부착되거나, 또는 세포외 브로스 내에 종착된다. 또한, 상기 방법은 응집된 단백질로 이루어진 봉입체의 형성을 방지한다. 또한, 주변세포질 공간 내로의 분비는 적합한 다이설파이드 결합 형성을 용이하게 하는 효과를 보유한다(Bardwell et al., 1994, "Pathways of Disulfide Bond Formation in Proteins In Vivo," in Phosphate in microorganisms : cellular and molecular biology, eds. Torriani-Gorini et al., pp. 270-5, 및 Manoil, 2000, Methods in Enzymol. 326:35-47, 두 문헌 모두 본 출원에 참고로 인용됨). 재조합 단백질의 분비의 이점들은 단백질의 더 효율적인 단리; 가용성 및/또는 활성 형태의 단백질의 백분율에서의 증가로 귀결되는, 트랜스제닉 단백질의 적절한 폴딩 및 다이설파이드 결합 형성; 봉입체 형성의 감소 및 숙주 세포에 대한 독성의 감소를 포함한다. 몇몇 경우에서, 배양 배지 내로의 관심 단백질의 분비에 대한 가능성은 단백질 생산을 위해 회분식 배양보다는 연속 배양을 촉진한다.

그람 음성 박테리아는 그들의 이중막을 가로지르는 단백질의 활성 유출을 위한 수많은 시스템을 진화시켜 왔다. 이들 분비 경로는, 예를 들어 원형질막과 외막 둘 다를 가로지르는 1 단계 전위를 위한, ABC(타입 I) 경로, Path/Fla(타입 III) 경로, 및 Path/Vir(타입 IV) 경로; 원형질막을 가로지르는 전위를 위한 Sec(타입 II), Tat, MscL, 및 Holins 경로; 및 원형질막과 외막을 가로지르는 2 단계 전위를 위한, Sec-플러스-핌브리알 어셔 포린(Sec-plus-fimbrial usher porin)(FUP), Sec-플러스-오토트랜스포터(autotransporter)(AT), Sec-플러스-2-파트너 분비(Sec-plus-two partner secretion)(TPS), Sec-플러스-메인 터미널 브랜치(Sec-plue-main terminal branch)(MTB), 및 Tat-플러스-MTB 경로가 포함된다. 모든 박테리아가 이러한 모든 분비 경로를 보유하고 있지는 않다.

3가지 단백질 시스템(타입 I, III 및 IV)은 단일 에너지-커플링된 단계로 양쪽 막을 가로질러 단백질을 분비한다. 4가지 시스템(Sec, Tat, MscL 및 Holins)은 내막만을 가로질러 분비하고, 또 다른 4가지 시스템(MTB, FUP, AT 및 TPS)은 외막만을 가로질러 분비한다.

몇몇 경우에서, 본 출원의 신호 서열은 Sec 분비 시스템을 이용한다. Sec 시스템은 세포질막을 가로지르는 N-말단 분비 리더를 이용하여 단백질의 유출을 담당한다(참조: Agarraberes 및 Dice, 2001, Biochim Biophys Acta 1513:1-24; Muller et al., 2001, Prog Nucleic Acid Res Mol. Biol. 66:107-157). Sec 패밀리의 단백질 복합체는 원핵생물 및 진핵생물에서 보편적으로 발견된다. 박테리아 Sec 시스템은 수송 단백질, 샤페론 단백질(SecB) 또는 신호 인식 입자(SRP) 및 신호 펩티다아제(SPase I 및 SPase II)로 구성된다. 이. 콜라이에서의 Sec 수송 복합체는 SecY, SecE 및 SecG의 3가지 내재성 내막 단백질, 및 세포질 ATPase인 SecA로 구성된다. SecA는 활성 전위 채널을 형성하도록 SecY/E/G 복합체를 동원한다. 샤페론 단백질 SecB는 신생 폴리펩타이드 사슬에 결합하여, 이의 폴딩을 방지하고, 이를 SecA에 타겟팅한다. 이어서, 선형 폴리펩타이드 사슬은 SecYEG 채널을 통해 수송되고, 신호 펩타이드의 절단 후, 단백질은 주변세포질에서 폴딩된다. 3개의 보조 단백질(SecD, SecF 및 YajC)은 분비를 필수적인 것은 아니지만, 많은 조건 하에서, 특히 저온에서 최대 10배까지 분비를 자극하는 복합체를 형성한다.

또한, 주변세포질 내로, 즉 타입 II 분비 시스템을 통해 수송되는 단백질은 추가적인 단계에서 세포외 배지 내로 유출된다. 일반적으로 상기 메커니즘은 오토트랜스포터, 2 파트너 분비 시스템, 메인 터미널 브랜치 시스템 또는 핌브리알 어셔 포린을 통한 것이다.

그람 음성 박테리아의 12개의 공지된 분비 시스템 중에서, 8개가 발현된 단백질의 일부분으로서 확인된 타겟팅 신호 펩타이드를 이용하는 것으로 공지되어 있다. 이들 신호 펩타이드는 분비 시스템의 단백질과 상호작용하여, 세포가 단백질을 그의 적합한 목적지로 유도하도록 한다. 이러한 8개의 신호 펩타이드 기반 분비 시스템 중 5개는 Sec 시스템과 관련된 것이다. 이들 5개는 Sec 의존성 세포질막 전위에 연루되는 것으로 언급되고, 몇몇 경우에 그 안에서 작동성인 그들의 신호 펩타이드는 Sec 의존성 분비 신호로 언급된다. 적합한 분비 신호의 개발에 있어서 쟁점 중 하나는 상기 신호의 적절한 발현 및 발현된 단백질로부터 절단이 담보되어야 한다는 것이다.

일반적으로, sec 경로를 위한 신호 펩타이드는 하기 3개의 도메인을 보유한다: (i) 양으로 하전된 n-영역, (ii) 소수성 영역 및 (iii) 하전되지 않았지만 극성인 c-영역. 신호 펩티다아제에 대한 절단 부위는 c-영역 내에 위치된다. 그러나, 종종 신호 서열 보존 및 길이의 정도, 뿐만 아니라 절단 부위 위치는 상이한 단백질들 사이에서 다를 수 있다.

Sec-의존성 단백질 유출에 대한 서명은 유출된 단백질 내에 짧은(아미노산 약 30개), 주로 소수성 아미노-말단 신호 서열의 존재이다. 신호 서열은 단백질 유출을 돕고, 유출된 단백질이 주변세포질에 도달하는 경우, 주변세포질 신호 펩티다아제에 의해 절단되어 제거된다. 전형적인 N-말단 Sec 신호 펩타이드는 적어도 하나의 아르기닌 또는 라이신 잔기를 보유하는 N-도메인, 이에 후속하는 일련의 소수성 잔기의 스트레치를 함유하는 도메인, 및 신호 펩티다아제에 대한 절단 부위를 함유하는 C-도메인을 함유한다.

단백질을 세포질 밖으로 타겟팅하기 위한 시도에서 관심 단백질 및 분비 신호 둘 다를 함유하는 융합 단백질로서 트랜스제닉 단백질 구축물이 조작된 박테리아 단백질 생산 시스템이 개발되어 왔다.

피. 플루오레센스는 다양한 단백질의 생산을 위한 개선된 플랫폼인 것으로 입증되었고, 몇몇 효율적인 분비 신호가 이러한 유기체로부터 확인되었다(참조: 그 전체 내용이 본 출원에 참고로 인용된, "Sec-시스템 분비를 이용하는 발현 시스템"이라는 명칭의 미국 특허 제7,985,564호). 피. 플루오레센스는 다른 박테리아 발현 시스템에서 전형적으로 확인되는 것보다 더 높은 레벨로 정확하게 프로세싱된 형태로 외인성 단백질을 생산하고, 이들 단백질을 세포의 주변세포질에 더 높은 레벨로 수송하여, 완전히 프로세싱된 재조합 단백질의 회수를 증가시킨다. 따라서, 한 실시양태에서, 본 출원에서 분비 신호에 작동 가능하게 연결된 타겟 단백질을 발현시킴으로써 피. 플루오레센스 세포에서 외인성 단백질을 생산하기 위한 방법이 제공된다.

몇몇 경우에서, 본 출원의 분비 신호 서열은 슈도모나스(Pseudomonas)에서 유용하다. 슈도모나스 시스템은 다른 박테리아 발현 시스템과 비교하여 폴리펩타이드 및 효소의 상업적인 발현을 위한 장점을 제공한다. 특히, 피. 플루오레센스는 유리한 발현 시스템으로 확인되어 왔다. 피. 플루오레센스는 토양, 물 및 식물 표면 환경에서 콜로니를 형성하는 일군의 일반적인 비-병원성 부패균(saprophyte)을 포괄한다. 피. 플루오레센스로부터 유래된 상업적인 효소들은 환경 오염을 감소시키기 위해 사용되어 왔는데, 세제 첨가물로서, 그리고 입체선택적 가수분해를 위해 사용되었다. 또한, 피. 플루오레센스는 병원체를 제어하기 위해 농업적으로 사용된다. "생물학적 살충제의 세포 캡슐화"라는 명칭의 미국 특허 제4,695,462호는 피. 플루오레센스에서의 재조합 박테리아 단백질의 발현을 기재하고 있다.

조성물

분비 리더

본 출원의 한 실시양태에서, 펩타이드가 제공되는데, 상기 펩타이드는 그람 음성 박테리아의 주변세포질로 또는 세포외 공간 내로 관심 단백질 또는 폴리펩타이드를 타겟팅하기 위해 유용한 신규 분비 리더 또는 신호이다. 한 실시양태에서, 상기 펩타이드는 AnsB, 8484, 또는 5193 분비 신호 또는 이의 단편 또는 변이체이거나, 이와 실질적으로 상동성인 아미노산 서열을 보유한다. 또한, 본 발명은 관심 타겟 단백질 또는 폴리펩타이드에 융합된 본 발명의 분비 신호 펩타이드를 포함하는 폴리펩타이드, 및 분비 신호 펩타이드 및 관심 폴리펩타이드를 포함하는 융합 단백질을 생산하는 발현 컨스트럭트를 제공한다. 실시양태에서, 분비 신호 펩타이드는 관심 폴리펩타이드에 작동 가능하게 연결된다.

실시양태에서, 분비 신호 서열은 서열 번호 1-3 중 임의의 서열 번호에 기재된 분비 신호 펩타이드와 상동성이거나, 실질적으로 상동성이거나, 또는 서열 번호 4-6 중 임의의 서열 번호에 기재된 폴리뉴클레오타이드에 의해 코딩된다. 다른 실시양태에서, 분비 신호 서열은 서열 번호 1의 적어도 아미노산 2-25, 서열 번호 2의 적어도 아미노산 2-18, 또는 서열 번호 3의 적어도 아미노산 2-29를 포함한다. 여전히 다른 실시양태에서, 분비 신호 서열은 서열 번호 1-3 중 하나의 단편을 포함하는데, 이는 아미노 말단으로부터 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 아미노산이 절단되나 생물학적 활성, 즉 분비 신호 활성은 유지된다.

한 실시양태에서, 상기 펩타이드의 아미노산 서열은 주어진 원래 펩타이드의 변이체인데, 상기 변이체의 서열은 최대 약 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 또는 30%를 포함하는, 원래 펩타이드의 아미노산 잔기의 최대 또는 약 30%가 다른 아미노산 잔기(들)로 대체될 수 있으나, 단 변이체는 원래 펩타이드의 원하는 기능을 유지한다. 실질적인 상동성을 보유하는 변이체 아미노산은 원래 펩타이드와 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 약 85%, 약 90%, 약 95%, 약 96%, 약 97%, 약 98%, 또는 적어도 약 99% 상동성일 것이다. 변이체 아미노산 서열은 1 이상, 1-5, 1-10, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25개, 또는 그 초과의 아미노산 치환, 결실, 삽입, 또는 이의 조합을 포함하는, 서열 번호 1-3 중 임의의 하나 이상의 아미노산의 아미노산 치환, 결실, 절단, 및 삽입을 포함하는 다양한 방식으로 얻어질 수 있다.

"실질적으로 상동성인", "실질적으로 동일한", 또는 "실질적으로 유사한"은 표준 파라미터를 이용하는 당해 기술분야에 공지되거나 본 출원에 기재된 적합한 정렬 프로그램을 이용하여 참조 서열과 비교하는 경우, 약 또는 적어도 약 60%, 약 또는 적어도 약 65%, 약 또는 적어도 약 70%, 약 또는 적어도 약 75%, 약 또는 적어도 약 80%, 약 또는 적어도 약 85%, 약 또는 적어도 약 81%, 약 또는 적어도 약 82%, 약 또는 적어도 약 83%, 약 또는 적어도 약 84%, 약 또는 적어도 약 85%, 약 또는 적어도 약 86%, 약 또는 적어도 약 87%, 약 또는 적어도 약 88%, 약 또는 적어도 약 89%, 약 또는 적어도 약 90%, 약 또는 적어도 약 91%, 약 또는 적어도 약 92%, 약 또는 적어도 약 93%, 약 또는 적어도 약 94%, 약 또는 적어도 약 95%, 약 또는 적어도 약 96%, 약 또는 적어도 약 97%, 약 또는 적어도 약 98% 또는 약 또는 적어도 약 99%, 또는 그 초과의 서열 동일성을 보유하는 아미노산 또는 뉴클레오타이드 서열을 의미한다. 당해 기술분야의 통상의 기술자는 이들 값이 코돈 축퇴성, 아미노산 유사성, 리딩 프레임 위치결정 등을 고려함으로써 2개의 뉴클레오타이드 서열에 의해 코딩되는 단백질들의 상응하는 동일성을 결정하기 위해 적절하게 조정될 수 있다는 것을 인식할 것이다.

실시양태에서, 본 발명에 사용된 펩타이드, 단백질, 또는 폴리펩타이드는 "비필수" 아미노산 잔기의 하나 이상의 변형을 포함할 수 있다. 이와 관련하여, "비필수" 아미노산 잔기는 원래 펩타이드, 단백질, 또는 폴리펩타이드(또한 "유사체" 또는 "참조" 펩타이드, 단백질, 또는 폴리펩타이드로도 언급됨)의 활성(예를 들어, 아고니스트 활성)을 없애거나 실질적으로 감소시키지 않고 신규한 아미노산 서열 내에서 변경될 수 있는, 예를 들어 결실, 치환, 또는 유도체화될 수 있는 잔기이다. 몇몇 실시양태에서, 펩타이드, 단백질, 또는 폴리펩타이드는 "필수" 아미노산 잔기의 하나 이상의 변형을 포함할 수 있다. 이와 관련하여, "필수" 아미노산 잔기는 신규한 아미노산 서열 내에서 변경되는 경우, 예를 들어 결실, 치환, 또는 유도체화되는 경우 참조 펩타이드, 단백질, 또는 폴리펩타이드의 활성이 실질적으로 감소되거나 또는 없어지는 잔기이다. 필수 아미노산 잔기가 변경되는 그러한 실시양태에서, 변형된 펩타이드, 단백질 또는 폴리펩타이드는 원래 펩타이드, 단백질, 또는 폴리펩타이드의 활성을 보유할 수 있다. 치환, 삽입 및 결실은 펩타이드, 단백질, 또는 폴리펩타이드의 N-말단 및 C-말단에 존재할 수 있거나, 또는 내부 부분에 존재할 수 있다. 예를 들어, 펩타이드, 단백질, 또는 폴리펩타이드는 펩타이드, 단백질, 또는 폴리펩타이드 분자 전체에 걸쳐 연속적인 방식 또는 이격되는 방식 둘 다로 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 그 초과의 치환을 포함할 수 있다. 단독으로, 또는 치환과의 조합으로, 펩타이드, 단백질, 또는 폴리펩타이드는 펩타이드, 단백질, 또는 폴리펩타이드 분자 전체에 걸쳐 재차 연속적인 방식 또는 이격되는 방식으로 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 그 초과의 삽입을 포함할 수 있다. 단독으로 또는 치환 및/또는 삽입과의 조합으로 펩타이드, 단백질, 또는 폴리펩타이드는 펩타이드, 단백질, 또는 폴리펩타이드 분자 전체에 걸쳐 재차 연속적인 방식 또는 이격되는 방식으로 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 그 초과의 결실을 포함할 수 있다. 단독으로 또는 치환, 삽입 및/또는 결실과의 조합으로 펩타이드, 단백질, 또는 폴리펩타이드는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 초과의 아미노산 부가를 포함할 수 있다.

치환은 보존적 아미노산 치환을 포함한다. "보존적 아미노산 치환"은 아미노산 잔기가 유사한 측쇄, 또는 생리화학적 특성(예를 들어, 정전, 수소 결합, 등전, 소수성 특징)을 보유하는 아미노산으로 대체되는 것이다. 아미노산은 천연 발생 또는 비천연일 수 있다. 유사한 측쇄를 보유하는 아미노산 잔기의 패밀리는 당해 기술분야에 공지되어 있다. 이들 패밀리는 염기성 측쇄를 보유하는 아미노산(예를 들어, 라이신, 아르기닌, 히스티딘), 산성 측쇄를 보유하는 아미노산(예를 들어, 아스파르트산, 글루탐산), 하전되지 않은 극성 측쇄를 보유하는 아미노산(예를 들어, 글리신, 아스파라긴, 글루타민, 세린, 트레오닌, 타이로신, 메티오닌, 시스테인), 비극성 측쇄를 보유하는 아미노산(예를 들어, 알라닌, 발린, 루신, 이소루신, 프롤린, 페닐알라닌, 트립토판), β-분지된 측쇄를 보유하는 아미노산(예를 들어, 트레오닌, 발린, 이소루신) 및 방향족 측쇄를 보유하는 아미노산(예를 들어, 타이로신, 페닐알라닌, 트립토판, 히스티딘)을 포함한다.

본 출원에 포함된 변이체 펩타이드, 단백질, 또는 폴리펩타이드는 생물학적으로 활성이다. 즉, 그들은 원래 펩타이드, 단백질, 또는 폴리펩타이드의 바람직한 생물학적 활성을 계속 보유하는데, 예를 들어 변이체 분비 리더 펩타이드는 분비 신호 활성을 유지한다. "활성을 유지한다"는 변이체가 원래 펩타이드, 단백질, 또는 폴리펩타이드의 활성, 예를 들어 분비 신호 활성의 약 또는 적어도 약 30%, 약 또는 적어도 약 35%, 약 또는 적어도 약 40%, 약 또는 적어도 약 45%, 약 또는 적어도 약 50%, 약 또는 적어도 약 55%, 약 또는 적어도 약 60%, 약 또는 적어도 약 65%, 약 또는 적어도 약 70%, 약 또는 적어도 약 75%, 약 또는 적어도 약 80%, 약 또는 적어도 약 85%, 약 또는 적어도 약 81%, 약 또는 적어도 약 82%, 약 또는 적어도 약 83%, 약 또는 적어도 약 84%, 약 또는 적어도 약 85%, 약 또는 적어도 약 86%, 약 또는 적어도 약 87%, 약 또는 적어도 약 88%, 약 또는 적어도 약 89%, 약 또는 적어도 약 90%, 약 또는 적어도 약 91%, 약 또는 적어도 약 92%, 약 또는 적어도 약 93%, 약 또는 적어도 약 94%, 약 또는 적어도 약 95%, 약 또는 적어도 약 96%, 약 또는 적어도 약 97%, 약 또는 적어도 약 98% 또는 약 또는 적어도 약 99%, 약 또는 적어도 약 100%, 약 또는 적어도 약 110%, 약 또는 적어도 약 125%, 약 또는 적어도 약 150%, 약 또는 적어도 약 200% 또는 그 초과를 보유할 것임을 의미한다.

폴리뉴클레오타이드

본 개시내용은 또한 관심 단백질 또는 폴리펩타이드를 그람 음성 박테리아의 주변세포질로 또는 세포외 공간 내로 타겟팅하는데 유용한 신규한 분비 신호를 코딩하는 서열을 보유하는 핵산을 포함한다. 한 실시양태에서, 단리된 폴리뉴클레오타이드는 AnsB, 8484, 또는 5193 분비 신호 펩타이드와 실질적으로 상동성인 펩타이드 서열을 코딩한다. 다른 실시양태에서, 본 개시내용은 서열 번호 1의 적어도 아미노산 2-25, 서열 번호 2의 적어도 아미노산 2-18, 또는 서열 번호 3의 적어도 아미노산 2-29와 실질적으로 상동성인 펩타이드 서열을 코딩하는 핵산을 제공하거나, 또는 서열 번호 4-6으로 기재된 뉴클레오타이드 서열 중 임의의 하나와 실질적으로 상동성인 핵산을 제공하는데, 이들은 이들의 생물학적으로 활성인 변이체 및 단편을 포함한다. 다른 실시양태에서, 핵산 서열은 서열 번호 4-6으로 기재된 핵산 서열 중 임의의 하나와 약 또는 적어도 약 60%, 약 또는 적어도 약 65%, 약 또는 적어도 약 70%, 약 또는 적어도 약 75%, 약 또는 적어도 약 80%, 약 또는 적어도 약 85%, 약 또는 적어도 약 81%, 약 또는 적어도 약 82%, 약 또는 적어도 약 83%, 약 또는 적어도 약 84%, 약 또는 적어도 약 85%, 약 또는 적어도 약 86%, 약 또는 적어도 약 87%, 약 또는 적어도 약 88%, 약 또는 적어도 약 89%, 약 또는 적어도 약 90%, 약 또는 적어도 약 91%, 약 또는 적어도 약 92%, 약 또는 적어도 약 93%, 약 또는 적어도 약 94%, 약 또는 적어도 약 95%, 약 또는 적어도 약 96%, 약 또는 적어도 약 97%, 약 또는 적어도 약 98% 또는 약 또는 적어도 약 99%, 또는 그 초과로 동일하다.

실시양태에서, 본 출원의 분비 신호 펩타이드는 서열 번호 4-6으로 기재된 뉴클레오타이드 서열 중 임의의 하나와 실질적으로 상동성인 뉴클레오타이드 서열에 의해 코딩된다. 본 발명의 분비 신호 서열에 대해 실질적인 동일성을 보유하는 상응하는 분비 신호 펩타이드 서열은 당해 기술분야에 공지된 임의의 적합한 방법, 예를 들어 PCR, 하이브리드화 방법, 또는 문헌에 기재된 방법을 사용하여 확인될 수 있다. 참조, 예를 들어, Sambrook J, and Russell, D. W., 2001, Molecular Cloning: A Laboratory Manual. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY; 및 Innis, et al., 1990, PCR Protocols: A Guide to Methods and Applications; Academic Press, NY. 변이체 뉴클레오타이드 서열은 예를 들어 위치 지정 돌연변이유발을 이용함으로써 생성된 합성적으로 유도된 뉴클레오타이드 서열을 포함할 수 있다. 실시양태에서, 돌연변이유발된 서열은 여전히 본 출원에 개시된 분비 신호 펩타이드를 코딩한다. 변이체 분비 신호 펩타이드는 생물학적으로 활성이다. 즉, 그들은 천연 단백질의 바람직한 생물학적 활성을 계속 보유한다. 즉, 그들은 분비 신호 활성을 유지한다. "활성을 유지한다"는 변이체가 원래 분비 신호 펩타이드의 활성의 약 30%, 약 또는 적어도 약 35%, 약 또는 적어도 약 40%, 약 또는 적어도 약 45%, 약 또는 적어도 약 50%, 약 또는 적어도 약 55%, 약 또는 적어도 약 60%, 약 또는 적어도 약 65%, 약 또는 적어도 약 70%, 약 또는 적어도 약 75%, 약 또는 적어도 약 80%, 약 또는 적어도 약 85%, 약 또는 적어도 약 81%, 약 또는 적어도 약 82%, 약 또는 적어도 약 83%, 약 또는 적어도 약 84%, 약 또는 적어도 약 85%, 약 또는 적어도 약 86%, 약 또는 적어도 약 87%, 약 또는 적어도 약 88%, 약 또는 적어도 약 89%, 약 또는 적어도 약 90%, 약 또는 적어도 약 91%, 약 또는 적어도 약 92%, 약 또는 적어도 약 93%, 약 또는 적어도 약 94%, 약 또는 적어도 약 95%, 약 또는 적어도 약 96%, 약 또는 적어도 약 97%, 약 또는 적어도 약 98% 또는 약 또는 적어도 약 99%, 약 또는 적어도 약 100%, 약 또는 적어도 약 110%, 약 또는 적어도 약 125%, 약 또는 적어도 약 150%, 약 또는 적어도 약 200%, 또는 그 초과를 보유할 것임을 의미한다. 펩타이드, 단백질, 또는 폴리펩타이드 활성, 예를 들어 분비 신호 활성을 측정하기 위한 임의의 적합한 방법은 본 출원에서 논의된 실시예와 함께 당해 기술분야에 널리 공지되어 있다.

또한, 통상의 기술자는 몇몇 경우에서, 변화는 본 출원에서 제공된 뉴클레오타이드 서열 내로 돌연변이에 의해 도입되고, 그에 따라 분비 신호 펩타이드의 생물학적 활성을 변경시키지 않으면서, 코딩된 분비 신호 펩타이드의 아미노산 서열에서의 변화를 초래할 수 있다는 것을 이해할 것이다. 따라서, 단리된 핵산 분자 변이체는 종종 코딩된 단백질 내로 하나 이상의 아미노산 치환, 부가 또는 결실이 도입되도록 하나 이상의 뉴클레오타이드 치환, 부가, 또는 결실을 본 출원에 개시된 상응하는 뉴클레오타이드 서열 내로 도입함으로써 생성될 수 있다. 돌연변이는 임의의 표준 기법, 예를 들어 위치 지정 돌연변이유발 및 PCR 매개 돌연변이유발에 의해 도입될 수 있다.

핵산 및 아미노산 상동성

핵산 및 아미노산 서열 상동성은 본 출원에 개시된 것들을 포함하나 이들로 한정되지 않는 당해 기술분야에 공지된 임의의 적합한 방법에 따라 결정된다.

예를 들어, 유사한 서열들에 대한 정렬 및 검색은 미국 NCBI(National Center for Biotechnology Information, Bethesda, MD)의 프로그램인 MegaBLAST를 사용하여 수행될 수 있다. 아미노산 서열에 대해 예를 들어 70％로 설정된, 또는 뉴클레오타이드 서열에 대해 예를 들어 90％로 설정된 동일성 백분율에 대한 옵션과 함께 이러한 프로그램을 사용하여, 질의 서열에 대한 서열 동일성이 70％, 또는 90％, 또는 그 초과인 서열들이 확인될 것이다. 또한, 당해 기술분야에 공지된 다른 소프트웨어는 유사한 서열, 예를 들어, 본 발명에 따른 분비 신호 서열을 함유하는 정보 문자열(string)에 대해 적어도 70％ 또는 90％ 동일한 서열을 정렬 및/또는 검색하기 위해 이용할 수 있다. 예를 들어, 종종 질의 서열에 대해 적어도 70％ 또는 90％ 동일한 서열을 확인하기 위한 비교용 서열 정렬은, 예를 들어 GCG 서열 분석 소프트웨어 패키지(1710 University Avenue, Madison, Wis. 53705에 소재하는 University of Wisconsin Biotechnology Center의 Genetics Computer Group으로부터 입수 가능)에서 입수 가능한 GAP, BESTFIT, BLAST, FASTA, 및 TFASTA 프로그램을 프로그램 내에 특정된 바와 같은 디폴트 파라미터 및 원하는 백분율로 설정된 서열 동일성 정도에 대한 파라미터와 함께 사용함으로써 수행될 수 있다. 또한, 예를 들어, CLUSTAL 프로그램(Mountain View, Cal.에 소재하는 Intelligenetics로부터 PC/Gene 소프트웨어 패키지로 입수 가능)이 사용될 수 있다.

이들 및 다른 서열 정렬 방법은 당해 기술 분야에 공지되어 있고, 수동 정렬에 의해, 육안 검사에 의해, 또는 서열 정렬 알고리즘, 예를 들어 상기 프로그램에 의해 구현되는 것들 중 임의의 것의 수동 또는 자동 적용에 의해 수행될 수 있다. 여러 가지 유용한 알고리즘은, 예를 들어 W. R. Pearson & D. J. Lipman, Proc. Natl. Acad. Sci. USA 85:2444-48 (April 1988)에 기재된 유사성 검색 방법; T. F. Smith & M. S. Waterman, in Adv. Appl. Math. 2:482-89 (1981) 및 J. Molec. Biol. 147:195-97 (1981)에 기재된 국소적인 상동성 방법; S. B. Needleman & C. D. Wunsch, J. Molec. Biol. 48(3):443-53 (March 1970)에 기재된 상동성 정렬 방법; 및 예를 들어, W. R. Pearson, Genomics 11(3):.635-50 (November 1991); W. R. Pearson, Methods Molec. Biol. 24:307-31 & 25:365-89 (1994); D. G. Higgins & P. M. Sharp, Comp. Appl'ns in Biosci. 5:151-53 (1989) 및 in Gene 73(1):237-44 (15 Dec. 1988)]에 의해 기재된 다양한 방법을 포함한다.

Needleman and Wunsch (1970) 상기 참조의 알고리즘을 사용하는 GAP 버전 10은 하기 파라미터를 사용하여 서열 동일성 또는 유사성을 결정하기 위해 사용될 수 있다: GAP 가중치 50 및 길이 가중치 3, 및 nwsgapdna.cmp 스코어링 매트릭스를 사용하는 뉴클레오타이드 서열에 대한 ％ 동일성 및 ％ 유사성; GAP 가중치 8 및 길이 가중치 2, 및 BLOSUM62 스코어링 프로그램을 사용하는 아미노산 서열에 대한 ％ 동일성 또는 ％ 유사성. 또한, 균등 또는 유사한 프로그램은 당해 기술분야의 통상의 기술자에 의해 이해되는 바와 같이 사용될 수 있다. 예를 들어, 질의되는 임의의 2개의 서열에 대해, GAP 버전 10에 의해 생성된 상응하는 정렬에 비교하는 경우, 동일한 뉴클레오타이드 잔기 매치 및 동일한 서열 동일성 백분율을 보유하는 정렬을 생성하는 서열 비교 프로그램이 사용될 수 있다. 실시양태에서, 서열 비교는 질의 서열 또는 대상 서열, 또는 둘 다의 전체에 걸쳐 수행된다.

하이브리드화 조건

본 출원의 다른 관점에서, AnsB, 8484, 또는 5193 분비 신호 펩타이드와 실질적으로 유사한 서열을 보유하는 펩타이드를 코딩하는 서열을 보유하는 단리된 핵산에 하이브리드화하는 핵산이 제공된다. 특정 실시양태에서, 하이브리드화 핵산은 고도의 엄격성 조건 하에서 결합할 것이다. 다양한 실시양태에서, 하이브리드화는 예를 들어 서열 번호 4-6 중 하나 이상의 실질적으로 전체적인 길이에 걸쳐 분비 신호 펩타이드를 코딩하는 뉴클레오타이드 서열의 실질적으로 전체적인 길이에 걸쳐 일어난다. 핵산 분자는, 상기 핵산 분자가 서열 번호 4-6 중 하나 이상의 전체적일 길이의 적어도 80% 이상, 상기 전체적인 길이의 적어도 85%, 적어도 90%, 또는 적어도 95%에 하이브리드화하는 경우, 본 출원에 개시된 분비 신호 코딩 뉴클레오타이드 서열의 "실질적으로 전체적인 길이"에 하이브리드화한다. 달리 언급하지 않으면, "실질적으로 전체적인 길이"는, 상기 길이가 연속하는 뉴클레오타이드에서 측정되는 경우, 분비 신호 코딩 뉴클레오타이드 서열의 전체적인 길이의 적어도 80%를 의미한다(예를 들어, 서열 번호 4의 적어도 60개의 연속하는 뉴클레오타이드, 서열 번호 5의 적어도 43개의 연속하는 뉴클레오타이드, 또는 서열 번호 6의 적어도 43개의 연속하는 뉴클레오타이드 등).

하이브리드화 방법에서, 분비 신호 펩타이드를 코딩하는 뉴클레오타이드 서열 모두 또는 이의 일부분은 cDNA 또는 게놈 라이브러리를 스크리닝하기 위해 사용된다. 그러한 cDNA 및 게놈 라이브러리의 구축 방법은 당해 기술분야에 일반적으로 공지되어 있고, Sambrook and Russell, 2001에 개시되어 있다. 소위 하이브리드화 프로브는 게놈 DNA 단편, cDNA 단편, RNA 단편, 또는 기타 올리고뉴클레오타이드일 수 있고, 검출 가능한 기 예를 들어 ³²P, 또는 임의의 다른 검출 가능한 마커, 예를 들어 다른 방사성 동위원소, 형광 화합물, 효소, 또는 효소 보조인자로 표지될 수 있다. 종종 하이브리드화를 위한 프로브는 본 출원에 개시된 공지된 분비 신호 펩타이드 코딩 뉴클레오타이드 서열에 기초하여 합성 올리고뉴클레오타이드를 표지함으로써 제조된다. 뉴클레오타이드 서열 또는 코딩된 아미노산 서열 내의 보존된 뉴클레오타이드 또는 아미노산 잔기를 기초로 디자인된 축퇴성 프라이머는 추가적으로 사용될 수 있다. 프로브는 본 출원의 분비 신호 펩타이드 코딩 뉴클레오타이드 서열 또는 이의 단편 또는 변이체의 적어도 약 10개, 적어도 약 11개, 적어도 약 12개, 적어도 약 13개, 적어도 약 14개, 적어도 약 15개, 적어도 약 16개, 적어도 약 17개, 적어도 약 18개, 적어도 약 19개, 적어도 약 20개, 또는 그 초과의 연속적인 뉴클레오타이드에 엄격한 조건 하에 하이브리드화하는 뉴클레오타이드 서열의 영역을 전형적으로 포함한다. 하이브리드화를 위한 프로브의 제조 방법은 당해 기술분야에 일반적으로 공지되어 있고, 본 출원에 참고로 인용된 Sambrook and Russell, 2001에 개시되어 있다.

하이브리드화 기법에서, 공지된 뉴클레오타이드 서열 모두 또는 이의 일부분은 선택된 유기체로부터의 클로닝된 DNA 단편 또는 cDNA 단편의 집단(즉, 게놈 또는 cDNA 라이브러리) 내에 존재하는 다른 상응하는 뉴클레오타이드 서열에 선택적으로 하이브리드화하는 프로브로서 사용된다. 하이브리드화 프로브는 게놈 DNA 단편, cDNA 단편, RNA 단편, 또는 다른 올리고뉴클레오타이드일 수 있고, 검출 가능한 기 예를 들어 ³²P, 또는 임의의 다른 검출 가능한 마커로 표지될 수 있다. 따라서, 예를 들어, 본 출원의 분비 신호 펩타이드 코딩 뉴클레오타이드 서열을 기초하여 합성 올리고뉴클레오타이드를 표지함으로써 하이브리드화를 위한 프로브가 제조된다. 하이브리드화를 위한 프로브의 제조 방법 및 cDNA 및 게놈 라이브러리의 구축 방법은 당해 기술분야에 일반적으로 공지되어 있고, Sambrook et al., 1989, Molecular Cloning: A Laboratory Manual, 2nd ed., Cold Spring Harbor Laboratory Press, Plainview, New York에 개시되어 있다.

본 출원에 개시된 전체적인 분비 신호 펩타이드 코딩 뉴클레오타이드 서열, 또는 이의 하나 이상의 일부분은 분비 신호 펩타이드를 코딩하는 상응하는 뉴클레오타이드 서열 및 전령 RNA에 특이적으로 하이브리드화할 수 있는 프로브로 사용될 수 있다. 다양한 조건 하에서의 특이적 하이브리드화를 달성하기 위해, 그러한 프로브는 독특한 서열을 포함하고, 바람직하게는 길이가 적어도 약 10개 이상의 뉴클레오타이드이거나 또는 적어도 약 15개 이상의 뉴클레오타이드이다. 그러한 프로브는 PCR에 의해 선택된 유기체로부터 상응하는 분비 신호 펩타이드 코딩 뉴클레오타이드 서열을 증폭시키기 위해 사용될 수 있다. 이러한 기법은 원하는 유기체로부터 추가적인 코딩 서열을 단리하기 위해 사용될 수 있거나, 또는 유기체 내의 코딩 서열의 존재를 결정하기 위한 진단 분석법에서 사용될 수 있다. 하이브리드화 기법은 플레이팅된 DNA 라이브러리(플라크 또는 콜로니; 예를 들어, Sambrook et al., 1989 참조)의 하이브리드화 스크리닝을 포함한다.

그러한 서열의 하이브리드화는 엄격한 조건 하에 수행될 수 있다. "엄격한 조건" 또는 "엄격한 하이브리드화 조건"은 프로브가 그의 타겟 서열에 다른 서열보다 검출 가능하게 더 큰 정도로 하이브리드화할 조건을 의미한다(예를 들어, 배경에 비해 적어도 2배). 엄격한 조건은 서열 의존적이고, 상이한 환경에서 달라질 것이다. 하이브리드화 및/또는 세정 조건의 엄격성을 제어함으로써, 프로브에 100％ 상보적인 타겟 서열이 확인될 수 있다(상동성 프로빙). 대안적으로, 종종 엄격성 조건을 조정하여, 더 낮은 정도의 유사성이 검출되도록 서열 내에 약간의 미스매칭을 허용할 수 있다(이종성 프로빙). 일반적으로, 프로브는 길이가 약 1000개 미만의 뉴클레오타이드, 바람직하게는 길이가 500개 미만의 뉴클레오타이드이다.

전형적으로, 엄격한 조건은 pH 7.0 내지 8.3에서 염 농도가 Na 이온 약 1.5 M 미만, 전형적으로는 Na 이온(또는 다른 염) 농도 약 0.01 내지 1.0 M이고, 온도가 적어도 약 60℃인 조건이다. 실시양태에서, 상기 온도는 약 68℃이다. 또한, 엄격한 조건은 포름아미드와 같은 불안정화제의 첨가에 의해 달성될 수 있다. 낮은 엄격성 조건은 예를 들어 37℃에서의 30 내지 35％ 포름아미드, 1 M NaCl, 1％ SDS(나트륨 도데실 설페이트)의 완충용액을 이용하는 하이브리드화, 및 50 내지 55℃에서의 1X 내지 2X SSC(20X SSC = 3.0 M NaCl/0.3 M 3나트륨 시트레이트)에서의 세정을 포함한다. 예시적인 중등도의 엄격성 조건은 37℃에서의 40 내지 45％ 포름아미드, 1.0 M NaCl, 1％ SDS에서의 하이브리드화, 및 55 내지 60℃에서의 0.5X 내지 1X SSC에서의 세정을 포함한다. 예시적인 높은 엄격성 조건은 37℃에서의 50％ 포름아미드, 1 M NaCl, 1％ SDS에서의 하이브리드화, 및 60 내지 68℃에서의 0.1X SSC에서의 세정을 포함한다. 경우에 따라, 세정 완충용액은 약 0.1％ 내지 약 1％ SDS를 포함할 수 있다. 일반적으로, 하이브리드화의 지속 기간은 약 24 시간 미만, 전형적으로 약 4 시간 내지 약 12 시간이다.

특이성은 전형적으로 하이브리드화 후의 세정의 함수이고, 결정적인 인자는 최종 세정 용액의 이온 강도 및 온도이다. DNA-DNA 하이브리드의 경우, Meinkoth and Wahl (1984) Anal. Biochem. 138:267-284의 식으로부터 Tm의 근사값을 구할 수 있다: Tm = 81.5℃ + 16.6(log M) + 0.41(％GC) - 0.61(％ form) - 500/L; 여기서, M은 1가 양이온의 몰 농도이고, ％GC는 DNA 내의 구아노신 및 사이토신 뉴클레오타이드의 백분율이며, ％ form은 하이브리드화 용액 내의 포름아미드의 백분율이며, L은 염기 쌍 내의 하이브리드의 길이이다. Tm은 상보적인 타겟 서열의 50％가 완벽하게 매칭된 프로브에 하이브리드화하는 온도(규정된 이온 강도 및 pH 하에서의 온도)이다. Tm은 각각 1％의 미스 매칭에 대해 약 1℃만큼 감소한다; 따라서, 원하는 동일성의 서열에 하이브리드화하도록 Tm, 하이브리드화, 및/또는 세정 조건을 조정할 수 있다. 예를 들어, >90％ 동일성의 서열을 찾는 경우, Tm은 종종 10℃ 감소된다. 일반적으로, 엄격한 조건은 규정된 이온 강도 및 pH에서의 특정 서열 및 이의 상보물에 대한 열 융점(Tm)보다 약 5℃ 더 낮도록 선택된다. 그러나, 과도하게 엄격한 조건은 종종 열 융점(Tm)보다 1, 2, 3, 또는 4℃ 더 낮은 온도에서의 하이브리드화 및/또는 세정을 이용하고, 중등도로 엄격한 조건은 종종 열 융점(Tm)보다 6, 7, 8, 9, 또는 10℃ 더 낮은 온도에서의 하이브리드화 및/또는 세정을 이용하며, 낮은 엄격성 조건은 종종 열 융점(Tm)보다 11, 12, 13, 14, 15, 또는 20℃ 더 낮은 온도에서의 하이브리드화 및/또는 세정을 이용한다. 관계식, 하이브리드화 및 세정 조성물, 및 원하는 Tm을 사용하여, 통상의 기술자는 하이브리드화 및/또는 세정 용액의 엄격성에서의 변동이 내재적으로 기재된다는 것을 이해할 것이다. 원하는 정도의 미스매칭이 45℃(수용액) 또는 32℃(포름아미드 용액) 미만의 Tm을 초래하는 경우, 더 높은 온도가 사용될 수 있도록 SSC 농도를 증가시키는 것이 바람직하다. 핵산의 하이브리드화에 대한 안내는 Tijssen, 1993, Laboratory Techniques in Biochemistry and Molecular Biology - Hybridization with Nucleic Acid Probes, Part I, Chapter 2(Elsevier, New York); 및 Ausubel et al., eds 1995, Current Protocols in Molecular Biology, Chapter 2(Greene Publishing and Wiley-Interscience, New York)에서 확인된다. Sambrook et al., 1989 참조.

코돈 최적화

한 실시양태에서, 본 출원의 조성물 및 방법은 관심 균주에서 코돈 용법에 대해 최적화된 컨스트럭트로부터 관심 재조합 단백질 또는 폴리펩타이드의 발현을 포함한다. 실시양태에서, 균주는 슈도모나스 숙주 세포, 예를 들어 슈도모나스 플루오레센스이다. 박테리아 호스트에서 발현을 개선하기 위해 코돈을 최적화하기 위한 방법은 당해 기술분야에 공지되어 있고, 문헌에 기재되어 있다. 예를 들어, 슈도모나스 호스트 균주에서 발현을 위한 코돈의 최적화는 예를 들어 그 전체 내용이 본 출원에 참고로 인용된 "코돈 최적화 방법"이라는 명칭의 미국 특허 출원 공보 제2007/0292918호에 기재되어 있다.

이종성 발현 시스템에서, 최적화 단계는 외래 단백질을 생산할 수 있는 호스트의 능력을 개선시킬 수 있다. 단백질 발현은 전사, mRNA 프로세싱, 및 번역의 안정성 및 개시에 영향을 미치는 것을 포함하는 다수의 요인들에 의해 통제된다. 폴리펩타이드 최적화 단계는 외래 단백질을 생산할 수 있는 호스트의 능력을 개선시키는 단계뿐만 아니라 발현 컨스트럭트를 효율적으로 디자인함에 있어서 연구자를 지원하는 단계를 포함할 수 있다. 최적화 전략은 예를 들어 번역 개시 영역의 변형, mRNA 구조 요소의 변경, 및 상이한 코돈 바이어스의 사용을 포함할 수 있다. 박테리아 호스트에서 이종성 단백질의 발현을 개선시키는 핵산 서열을 최적화하기 위한 방법은 당해 기술분야에 공지되어 있고, 문헌에 기재되어 있다. 예를 들어, 슈도모나스 호스트 균주에서 발현을 위한 코돈의 최적화는 예를 들어 그 전체 내용이 본 출원에 참고로 인용된 "코돈 최적화 방법"이라는 명칭의 미국 특허 출원 공보 제2007/0292918호에 기재되어 있다.

최적화는 이종성 유전자의 다수의 서열 특징 중 임의의 특징을 처리한다. 특정 예로서, 희귀 코돈 유도된 번역 정지는 종종 감소된 이종성 단백질 발현을 초래한다. 희귀 코돈 유도된 번역 정지는 가용한 tRNA 풀 내에서 그들의 희소성으로 인해 단백질 번역에 대해 부정적인 영향을 보유할 수 있는, 호스트 유기체 내에서 좀처럼 사용되지 않는 관심 폴리펩타이드 내의 코돈의 존재를 포함한다. 호스트 유기체 내에서 최적 번역을 개선하는 한 가지 방법은 종종 합성 폴리뉴클레오타이드 서열로부터 희귀 호스트 코돈의 제거를 초래하는 코돈 최적화를 수행하는 것을 포함한다.

또한, 교호 번역 개시는 종종 감소된 이종성 단백질 발현을 초래한다. 교호 번역 개시는 리보좀 결합 부위(RBS)로서 작용할 수 있는 모티프를 우연히 함유하는 합성 폴리뉴클레오타이드 서열을 포함한다. 몇몇 경우에서, 이들 부위는 유전자 내부 부위로부터 절단된 단백질의 번역 개시를 초래한다. 종종 정제 과정에서 제거하기 어려운 절단된 단백질의 생산 가능성을 감소시키는 한 가지 방법은 최적화된 뉴클레오타이드 서열로부터 추정적인 내부 RBS 서열을 제거하는 것을 포함한다.

종종 반복부 유도된 폴리머라아제 누출(slippage)은 감소된 이종성 단백질 발현을 초래한다. 반복부 유도된 폴리머라아제 누출은 종종 프레임쉬프트 돌연변이를 초래하는 DNA 폴리머라아제의 누출 또는 스터터링(stuttering)을 야기하는 것으로 확인되어 온 뉴클레오타이드 서열 반복부와 관련되어 있다. 또한, 이러한 반복부는 종종 RNA 폴리머라아제의 누출을 야기한다. 높은 G+C 함량 바이어스를 보유하는 유기체에서, 종종 G 또는 C 뉴클레오타이드 반복부로 구성된 더 높은 정도의 반복부가 존재한다. 따라서, RNA 폴리머라아제 누출을 유도할 확률을 감소시키는 한 가지 방법은 G 또는 C의 연장된 반복부를 변경시키는 것을 포함한다.

또한, 간섭 이차 구조는 종종 감소된 이종성 단백질 발현을 초래한다. 이차 구조는 종종 RBS 서열 또는 개시 코돈을 격리하고, 단백질 발현의 감소와 상관관계가 있어 왔다. 또한, 스템 루프 구조는 전사 정지 및 감쇠와 관련되어 있다. 최적화된 폴리뉴클레오타이드 서열은 일반적으로 개선된 전사 및 번역을 가능하도록 하기 위해 뉴클레오타이드 서열의 유전자 코딩 영역 및 RBS내 최소 이차 구조를 함유한다.

이종성 단백질 발현에 종종 영향을 미치는 다른 특징은 제한 부위의 존재이다. 호스트 발현 벡터 내로 전사 유닛의 후속적인 서브클로닝과 간섭할 수 있는 제한 부위를 제거함으로써, 폴리뉴클레오타이드 서열은 최적화된다.

예를 들어, 최적화 프로세스는 종종 호스트에 의해 이종성으로 발현되도록 원하는 아미노산 서열을 확인함으로써 개시된다. 상기 아미노산 서열로부터 후속 폴리뉴클레오타이드 또는 DNA가 디자인된다. 합성 DNA 서열의 디자인 과정 중, 코돈 용법의 빈도는 종종 호스트 발현 유기체의 코돈 용법과 비교되고, 희귀 호스트 코돈은 합성 서열로부터 제거된다. 아울러, 합성 후보 DNA 서열은 종종 바람직하지 않은 효소 제한 부위를 제거하고, 임의의 원하는 신호 서열, 링커 또는 비번역된 영역을 추가 또는 제거하기 위해 변형된다. 종종 합성 DNA 서열은 번역 프로세스와 간섭할 수 있는 이차 구조, 예를 들어 G/C 반복부 및 스템 루프 구조의 존재에 대해 분석된다. 후보 DNA 서열이 합성되기 이전에, 종종 최적화된 서열 디자인은, 상기 서열이 원하는 아미노산 서열을 올바르게 코딩하는지 검증하기 위해 검사된다. 최종적으로, 후보 DNA 서열은 당해 기술분야에 공지된 것과 같은 DNA 합성 기법을 이용하여 합성된다.

본 출원의 다른 실시양태에서, 호스트 유기체, 예를 들어 피. 플루오레센스에서의 일반적인 코돈 용법은 종종 이종성 폴리뉴클레오타이드 서열의 발현을 최적화하기 위해 사용된다. 호스트 발현 시스템 내에서 특정 아미노산에 대해 좀처럼 바람직한 것으로 고려되지 않는 코돈의 백분율 및 분포가 평가된다. 종종 5% 및 10% 용법의 값은 희귀 코돈의 결정을 위한 컷오프 값으로서 사용된다. 예를 들어, 표 2에 목록화된 코돈은 피. 플루오레센스 MB214 게놈에서 5% 미만의 계산된 출현율을 보유하고, 일반적으로 피. 플루오레센스 호스트에서 발현된 최적화된 유전자에서 회피된다.

본 개시내용은 슈도모나스 숙주 세포에서 발현을 위해 최적화된 임의의 서열을 사용하는 것을 포함하는 임의의 관심 폴리펩타이드 또는 단백질 코딩 서열의 사용을 고려한다. 사용을 위해 고려된 서열은 종종 원하는 바와 같이 임의의 정도로 최적화되는데, 이는 슈도모나스 숙주 세포에서 5% 미만으로 출현하는 코돈, 슈도모나스 숙주 세포에서 10% 미만으로 출현하는 코돈, 희귀 코돈 유도된 번역 정지, 추정적인 내부 RBS 서열, G 또는 C 뉴클레오타이드의 연장된 반복부, 간섭 2차 구조, 제한 부위, 또는 이의 조합을 제거하기 위한 최적화를 포함하나, 이들로 한정되는 것은 아니다.

또한, 본 출원에서 제공된 방법을 실시하는데 유용한 임의의 분비 리더의 아미노산 서열은 임의의 적합한 핵산 서열에 의해 코딩된다. 이. 콜라이에서의 발현을 위한 코돈 최적화는 예를 들어 Welch, et al., 2009, PLoS One, "Design Parameters to Control Synthetic Gene Expression in Escherichia coli," 4(9): e7002, Ghane, et al., 2008, Krishna R. et al., (2008) Mol Biotechnology "Optimization of the AT-content of Codons Immediately Downstream of the Initiation Codon and Evaluation of Culture Conditions for High-level Expression of Recombinant Human G-CSF in Escherichia coli," 38:221-232에 의해 기재된다.

발현 시스템

몇몇 경우에서, 본 출원의 방법은 AnsB, 8484, 또는 5193 분비 신호 서열, 또는 서열 번호 1-3으로서 본 출원에 개시된 분비 신호 펩타이드와 실질적으로 상동성인 서열로 구성되는 군으로부터 선택된 분비 신호 펩타이드에 작동 가능하게 연결된 관심 단백질 또는 폴리펩타이드를 포함하는 폴리펩타이드를 발현시키는 단계를 포함한다. 실시양태에서, 분비 신호 펩타이드 서열은 슈도모나스 숙주 세포내의 발현 컨스트럭트로부터 서열 번호 4-6으로 기재된 뉴클레오타이드 서열에 의해 코딩된다. 몇몇 경우에, 발현 컨스트럭트는 플라스미드이다. 몇몇 실시양태에서, 관심 폴리펩타이드 또는 단백질 서열을 코딩하는 플라스미드는 선택 마커를 포함하고, 플라스미드를 유지하는 숙주 세포는 선택적인 조건 하에서 성장된다. 몇몇 실시양태에서, 상기 플라스미드는 선택 마커를 포함하지 않는다. 몇몇 실시양태에서, 상기 발현 컨스트럭트는 숙주 세포 게놈 내로 통합된다.

슈도모나스 호스트 균주를 포함하는 호스트 균주에서 본 발명의 방법에서 유용한 조절 서열(예를 들어, 프로모터, 분비 리더, 및 리보좀 결합 부위)를 포함하는 이종성 단백질을 발현하기 위한 방법은 예를 들어 "증가된 발현을 위한 박테리아 리더 서열"이라는 명칭의 미국 특허 제7, 618,799호, "Sec-시스템 분비를 이용하는 발현 시스템"이라는 명칭의 미국 특허 제7,985,564호, 둘 다 "이종성 단백질의 발현에서 개선된 수율 및/또는 품질을 보유하는 특정 균주를 동정하기 위한 미생물 호스트를 신속하게 스크리닝하기 위한 방법"이라는 명칭의 미국 특허 제9,394,571호 및 제9,580,719호, "슈도모나스 플루오레센스에서 포유동물 단백질의 발현"이라는 명칭의 미국 특허 제9,453,251호, "균주 공학에 의해 개선된 단백질 발현을 위한 방법"이라는 명칭의 미국 특허 제8,603,824호, 및 "재조합 톡신 단백질의 고 레벨 발현"이라는 명칭의 미국 특허 제8,530,171호에 기재되어 있고, 이들 각각의 특허는 그 전체 내용이 본 출원에 참고로 인용된다. 실시양태에서, 본 발명의 맥락에서 사용된 분비 리더는 미국 특허 제7, 618,799호, 제7,985,564호, 제9,394,571호, 제9,580,719호, 제9,453,251호, 제8,603,824호, 및 제8,530,171호 중 임의의 특허에 개시된 바와 같은 분비 리더이다. 또한, 이들 특허는 이종성 단백질 발현을 증가시키기 위해, 폴딩 조절자를 과발현시키도록 조작되거나, 또는 프로테아제 돌연변이가 도입된 본 발명의 방법을 실시하는데 유용한 박테리아 호스트 균주를 기재하고 있다.

실시양태에서, 본 발명의 방법에 사용된 발현 균주는 표 13에 목록화된 바와 같이 실시예 4에 기재된 임의의 발현 균주이다. 실시양태에서, 본 발명의 방법에 사용된 발현 균주는 표 13에 목록화된 바와 같이 실시예 4에 기재된 발현 균주의 배경 표현형을 보유하는 미생물 발현 균주이다. 실시양태에서, 본 발명의 방법에 사용된 발현 균주는 표 13에 목록화된 바와 같이 실시예 4에 기재된 발현 균주의 배경 표현형을 보유하는 미생물 발현 균주이고, 이때 상기 균주는 표 13에 목록화된 바와 같이 각각의 분비 리더를 이용하는 융합에서 재조합 아스파라기나아제를 발현한다. 실시양태에서, 본 발명의 방법에서 사용된 발현 균주는 표 13에 목록화된 바와 같이 실시예 4에 기재된 발현 균주 STR57864, STR57865, STR57866, STR57860, STR57861, STR57862, STR57863의 배경 표현형을 보유하는 미생물 발현 균주이고, 발현 균주가 폴딩 조절자 과발현자인 것은 제외 된다. 실시양태에서, 본 발명의 방법에서 사용된 발현 균주는 만니톨 없이 배양된 표 13에 목록화된 바와 같이 실시예 4에 기재된 발현 균주 STR57864, STR57865, STR57866, STR57860, STR57861, STR57862, STR57863의 배경 표현형을 보유하는 미생물 발현 균주이다.

프로모터

본 출원의 방법에 따라 사용된 프로모터는 구성적 프로모터 또는 조절된 프로모터일 수 있다. 유용한 조절된 프로모터의 통상적인 예는 lac 프로모터(즉, lacZ 프로모터)로부터 유도된 패밀리의 프로모터, 특히 미국 특허 제4,551,433호(DeBoer)에 기재된 tac 및 trc 프로모터뿐만 아니라 Ptac16, Ptac17, PtacII, PlacUV5, 및 T7lac 프로모터를 포함한다. 한 실시양태에서, 프로모터는 숙주 세포 유기체로부터 유도되지 않는다. 특정 실시양태에서, 프로모터는 이. 콜라이 유기체로부터 유도된다.

유도성 프로모터 서열은 본 출원의 방법에 따라 관심 폴리펩타이드 또는 단백질의 발현을 조절하기 위해 사용된다. 실시양태에서, 본 출원의 방법에 유용한 유도성 프로모터는 lac 프로모터(즉, lacZ 프로모터)로부터 유도된 패밀리의 프로모터, 특히 미국 특허 제4,551,433호(DeBoer)에 기재된 tac 및 trc 프로모터뿐만 아니라 Ptac16, Ptac17, PtacII, PlacUV5, 및 T7lac 프로모터를 포함한다. 한 실시양태에서, 프로모터는 숙주 세포 유기체로부터 유도되지 않는다. 특정 실시양태에서, 프로모터는 이. 콜라이 유기체로부터 유도된다. 몇몇 실시양태에서, lac 프로모터는 플라스미드로부터 관심 폴리펩타이드 또는 단백질의 발현을 조절하기 위해 사용된다. Lac 프로모터 유도체 또는 패밀리 구성원, 예를 들어 tac 프로모터의 경우, 유도인자(inducer)는 IPTG(이소프로필-β-D-1-티오갈락토피라노사이드, "이소프로필티오갈락토사이드"로도 언급됨)이다. 특정 실시양태에서, IPTG는 슈도모나스 숙주 세포에서 lac 프로모터로부터 관심 폴리펩타이드 또는 단백질의 발현을 유도하기 위해 배양물에 첨가된다.

본 출원의 방법에 따른 발현 시스템에 유용한 비-lac 타입 프로모터의 통상적인 예는 예를 들어 표 3에 목록화된 것을 포함한다.

예를 들어 J. Sanchez-Rome & V. De Lorenz (1999) Manual of Industrial Microbiology and Biotechnology (A. Demain & J. Davies, eds.) pp. 460-74 (ASM Press, Washington, D.C.); H. Schneider (2001) Current Opinion in Biotechnology, 12:439-445; R. Slater & R. Williams (2000) Molecular Biology and Biotechnology (J. Walker & R. Replay, eds.) pp. 125-54 (The Royal Society of Chemistry, Cambridge, UK); 및 L.-M. Gunman, et al., 1995, J. Bacterial. 177(14):4121-4130을 참조할 수 있고, 이들 모두는 본 출원에 참고로 인용된다. 또한, 선택된 박테리아 숙주 세포 태생인 프로모터의 뉴클레오타이드 서열을 보유하는 프로모터, 예를 들어 슈도모나스 또는 벤조에이트 오페론 프로모터(Pant, Pben)는 관심 재조합 단백질 또는 폴리펩타이드를 코딩하는 트랜스유전자의 발현을 조절하기 위해 사용될 수 있다. 또한, 하나 이상의 프로모터가 다른 프로모터에 공유적으로 부착된 탠덤 프로모터가 사용될 수 있는데, 서열이 동일 또는 상이한 경우, 예를 들어 Pant-Pben 탠덤 프로모터(인터프로모터 하이브리드) 또는 Plac-Plac 탠덤 프로모터, 또는 동일 또는 상이한 유기체로부터 유도되는 것이 존재한다.

조절된 프로모터는 프로모터의 일부분인 유전자의 전사를 조절하기 위해 프로모터 조절 단백질을 이용한다. 본 출원에서 조절된 프로모터가 사용되는 경우, 상응하는 프로모터 조절 단백질은 또한 본 출원의 방법에 따른 발현 시스템의 일부분이 될 것이다. 프로모터 조절 단백질의 예는 활성화제 단백질, 예를 들어 이. 콜라이 이화대사산물 활성화제 단백질, MalT 단백질; AraC 패밀리 전사 활성화제; 억제인자 단백질, 예를 들어 이. 콜라이 LacI 단백질; 및 이중 기능 조절 단백질, 예를 들어 이. 콜라이 NagC 단백질을 포함한다. 많은 조절된 프로모터/프로모터 조절 단백질 쌍은 당해 기술분야에 공지되어 있다. 한 실시양태에서, 관심 타겟 단백질(들) 및 이종성 단백질을 위한 발현 컨스트럭트는 동일한 조절 요소의 조절하에 있다.

프로모터 조절 단백질은 효과 인자 화합물, 즉 조절 단백질과 가역적으로 또는 비가역적으로 연관되어 단백질이 방출되거나 또는 프로모터의 조절하에 있는 유전자의 적어도 하나의 DNA 전사 조절 영역에 결합할 수 있도록 함으로써 상기 유전자의 전사를 개시함에 있어서 효소의 작용을 허용하거나 또는 차단하는 화합물과 상호작용한다. 효과인자(effector) 화합물은 유도인자 또는 보조 억제인자로서 분류되고, 이들 화합물은 천연 효과인자 화합물 및 무상 유도인자 화합물을 포함한다. 많은 조절된 프로모터/프로모터 조절 단백질 쌍은 당해 기술분야에 공지되어 있다. 몇몇 경우에서, 효과인자 화합물은 세포 배양 또는 발효 과정 전체에 걸쳐 사용됨에도 불구하고, 조절된 프로모터가 사용되는 한 실시양태에서, 숙주 세포 바이오매스의 원하는 양 또는 밀도의 성장 후, 적합한 효과인자 화합물이 배양물에 직접적으로 또는 간접적으로 첨가되어 관심 단백질 또는 폴리펩타이드를 코딩하는 원하는 유전자(들)의 발현을 초래한다.

lac 패밀리 프로모터가 사용되는 실시양태에서, lacI 유전자는 종종 시스템 내에 존재한다. 보통 구성적으로 발현되는 유전자인 lacI 유전자는 Lac 억제인자 단백질 LacI 단백질을 코딩하는데, 이는 lac 패밀리 프로모터의 lac 오퍼레이터에 결합한다. 따라서, lac 패밀리 프로모터가 사용되는 경우, lacI 유전자는 또한 종종 발현 시스템 내에 포함되고 발현된다.

슈도모나스에 유용한 프로모터 시스템은 문헌, 예를 들어 참고적으로 상기 언급한 미국 특허 출원 공보 제2008/0269070호에 기재되어 있다.

다른 조절 요소

실시양태에서, 발현 벡터는 최적 리보좀 결합 서열을 함유한다. 관심 단백질의 번역 개시 영역을 변경시킴으로써 번역 강도를 조절하는 것은 너무 빠른 번역 속도에 기인하는 봉입체로서 주로 축적되는 이종성의 세포질 단백질의 생산을 개선시키기 위해 사용될 수 있다. 또한, 박테리아 세포의 주변세포질 공간 내로 이종성 단백질의 분비는 단백질 번역 레벨을 최대화한다기 보다는 최적화하여 번역 속도를 단백질 분비 속도와 동조되도록 함으로써 개선될 수 있다.

번역 개시 영역은 리보좀 결합 부위(RBS)의 바로 상류에서 개시 코돈의 대략 20개 뉴클레오타이드 하류에 연장되는 서열로서 규정되어 왔다(McCarthy et al. (1990) Trends in Genetics 6:78-85, 그 전체 내용이 본 출원에 참고로 인용됨). 원핵 세포에서, 대안적인 RBS 서열은 Shine 및 Dalgarno(Proc. Natl. Acad. Sci. USA 71:1342-1346, 1974)에 의해 기재된 표준 또는 컨센서스 RBS 서열(AGGAGG; 서열 번호 11)을 이용하여 번역 레벨에 대해 감소된 번역 속도를 제공함으로써 이종성 단백질의 번역 레벨을 최적화하기 위해 사용될 수 있다. "번역 속도" 또는 "번역 효율"은 세포 내에서 단백질로의 mRNA 번역의 속도를 의미한다. 대부분의 원핵 세포에서, 샤인-달가노 서열은 16S 리보좀 RNA의 피리미딘 풍부 영역과의 상호작용을 통해 mRNA 상의 개시 코돈에 대하여 30S 리보좀 성분의 결합 및 위치결정에 조력한다. RBS(본 출원에서 샤인-달가노 서열로도 언급된)는 전사 개시로부터 하류 및 번역 개시로부터 상류의 mRNA 상에 위치되는데, 전형적으로 개시 코돈의 4 내지 14개 뉴클레오타이드 상류, 더 전형적으로 개시 코돈의 8 내지 10개 뉴클레오타이드 상류에 위치된다. 번역에서 RBS 서열의 역할 때문에, 번역 효율과 RBS 서열의 효율(또는 강도) 사이에는 직접적인 관련성이 존재한다.

몇몇 실시양태에서, RBS 서열의 변형은 이종성 단백질의 번역 속도 감소를 초래한다. 이러한 번역 속도의 감소는 생산된 단백질 1 그램당 또는 호스트 단백질 1 그램 당 적절하게 프로세싱된 단백질 또는 폴리펩타이드의 레벨 증가에 대응할 수 있다. 또한, 감소된 번역 속도는 재조합 단백질 1 그램당 또는 숙주 세포 단백질 1 그램 당 생산된 횟수 가능한 단백질 또는 폴리펩타이드의 증가된 레벨과 상관관계가 있을 수 있다. 또한, 감소된 발현 속도는 증가된 발현, 증가된 활성, 증가된 용해도, 또는 증가된 전위(예를 들어, 주변세포질 구획 또는 세포외 공간으로의 분비)의 임의의 조합에 대응할 수 있다. 이러한 실시양태에서, "증가된"은 관심 단백질 또는 폴리펩타이드가 동일한 조건 하에서 발현되는 경우 생산된, 적절하게 프로세싱된, 가용성의, 및/또는 회수 가능한 단백질 또는 폴리펩타이드의 레벨에 대한 것이고, 이때 폴리펩타이드를 코딩하는 뉴클레오타이드 서열은 표준 RBS 서열을 포함한다. 유사하게, 용어 "감소된"은 관심 단백질 또는 폴리펩타이드의 번역 속도에 대한 것이고, 이때 단백질 또는 폴리펩타이드를 코딩하는 유전자는 표준 RBS 서열을 포함한다. 번역 속도는 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 약 25%, 약 30%, 약 35%, 약 40%, 약 45%, 약 50%, 약 55%, 약 60%, 약 65%, 약 70, 적어도 약 75% 또는 그 초과, 또는 적어도 약 2배, 약 3배, 약 4배, 약 5배, 약 6배, 약 7배, 또는 그 초과만큼 감소될 수 있다.

몇몇 실시양태에서, 본 출원에 기재된 RBS 서열 변이체는 고, 중, 또는 저의 번역 효율을 초래하는 것으로서 분류될 수 있다. 한 실시양태에서, 상기 서열은 표준 RBS 서열의 번역 활성과 비교한 번역 활성의 레벨에 따라 랭킹된다. 고 RBS 서열은 표준 서열의 활성의 약 60% 내지 약 100%를 보유한다. 중 RBS 서열은 표준 서열의 활성의 약 40% 내지 약 60%를 보유한다. 저 RBS 서열은 표준 서열의 활성의 약 40% 미만을 보유한다.

RBS 서열의 예는 표 4에 기재되어 있다. 서열들은 리포터 유전자로서 COP-GDP를 이용하여 번역 강도에 대해 스크리닝 되었고, 컨센서스 RBS 형광의 백분율에 따라 랭킹되었다. 각각의 RBS 변이체는 3개의 일반적인 형광 랭크 중 하나에 위치되었다: 고("Hi" - 100% 컨센서스 RBS 형광), 중("Med" - 46-51%의 컨센서스 RBS 형광), 및 저("Lo" - 16-29%의 컨센서스 RBS 형광).

본 발명의 방법을 실시하는데 유용한 발현 컨스트럭트는 단백질 코딩 서열 이외에 상기 서열에 작동 가능하게 연결된 후술하는 조절 요소를 포함한다: 프로모터, 리보좀 결합 부위(RBS), 전자 종결자, 및 번역 개시 및 종결 신호. 유용한 RBS는 예를 들어 미국 특허 출원 공보 제2008/0269070호 및 미국 특허 출원 제12/610,207호에 따라 발현 시스템 내에 숙주 세포로서 유용한 종 중에서 임의의 종으로부터 수득된다. 다수의 특이적인 및 다양한 컨센서스 RBS는 공지되어 있는데, 예를 들어 D. Frishman et al., Gene 234(2):257-65 (8 Jul. 1999); and B. E. Suzek et al., Bioinformatics 17(12):1123-30 (December 2001)에 기재 및 인용된 것들이다. 또한, 천연 또는 합성 RBS가 사용될 수 있는데, 예를 들어 EP 0207459(합성 RBS); O. Ikehata et al., Eur. J. Biochem. 181(3):563-70 (1989)에 기재된 것들이다. 본 출원의 방법에 유용한 방법, 벡터, 및 번역 및 전사 요소, 및 다른 요소는 예들 들어 미국 특허 제5,055,294호(Gilroy) 및 미국 특허 제5,128,130호(Gilroy et al.); 미국 특허 제5,281,532호(Rammler et al.); 미국 특허 제4,695,455호 및 제4,861,595호(Barnes et al.); 미국 특허 제4,755,465호(Gray et al.); 및 미국 특허 제5,169,760호(Wilcox)에 기재되어 있다.

호스트 균주

슈도모나드(Pseudomonads) 및 밀접하게 관련된 박테리아 유기체를 포함하는 박테리아 호스트는 본 출원의 방법을 실시하는데 사용하기 위해 고려된다. 특정 실시양태에서, 슈도모나드 숙주 세포는 슈도모나스 플루오레센스이다. 몇몇 경우에서, 숙주 세포는 이. 콜라이 세포이다.

본 출원의 방법을 실시하는데 유용한 숙주 세포 및 컨스트럭트는 문헌, 예를 들어 당해 기술분야에 공지된, 및 그 전체 내용이 본 출원에 참고로 인용된 "단백질 발현 시스템"이라는 명칭의 미국 특허 출원 공보 제2009/0325230호에 기재된 방법 및 시약을 이용하여 동정되거나, 또는 제조된다. 이러한 공보는 염색체 lacI 유전자 삽입물을 포함하는 영양요구성 슈도모나스 플루오레센스 숙주 세포 내로의 핵산 컨스트럭트의 도입에 의해 재조합 폴리펩타이드를 생산하는 것에 대해 기재되어 있다. 핵산 컨스트럭트는 숙주 세포 내에서 핵산의 발현을 유도할 수 있는 프로모터에 작동 가능하게 연결된 재조합 폴리펩타이드를 코딩하는 뉴클레오타이드 서열을 포함하고, 또한 영양요구성 선택 마커를 코딩하는 뉴클레오타이드 서열을 포함한다. 상기 영양요구성 선택 마커는 영양요구성 숙주 세포에 대해 독립영양성을 회복하는 폴리펩타이드이다. 실시양태에서, 상기 세포는 프롤린, 우라실, 또는 이의 조합에 대한 영양요구성이다. 실시양태에서, 숙주 세포는 MB101(ATCC 기탁번호 PTA-7841)로부터 유도된다. 둘 다 그 전체 내용이 본 출원에 참고로 인용된, "단백질 발현 시스템"이라는 명칭의 미국 특허 출원 공보 제2009/0325230호 및 Schneider, et al., 2005, "Auxotrophic markers pyrF and proC, in some cases, replace antibiotic markers on protein production plasmids in high-cell-density Pseudomonas fluorescens fermentation," Biotechnol. Progress 21(2): 343-8은 균주 MB101에서 pyrF 유전자를 결실시킴으로써 구축된 우라실에 대한 영양요구성인 생산 호스트 균주를 기재하고 있다. pyrF 유전자는 독립영양성을 회복하기 위해 pyrF 결실을 보충하는 플라스미드를 생성하기 위해 균주 MB214(ATCC 기탁번호 PTA-7840)로부터 클로닝되었다. 특정 실시양태에서, 피. 플루오레센스 숙주 세포 내의 이중 pyrF-proC 이중 영양요구성 선택 마커 시스템이 사용된다. 기재된 바와 같이 pyrF 결실된 생산 호스트 균주는 종종 본 출원의 방법을 실시하는데 유용한 것으로 본 출원에 기재된 것을 포함하는 다른 원하는 게놈 변화를 도입하기 위한 배경으로서 사용된다.

실시양태에서, 숙주 세포는 슈도모나달레(Pseudomonadales) 목의 것이다. 숙주 세포가 슈도모나달레 목의 것인 경우, 슈도모나스 속을 포함하는 슈도모나다세아에(Pseudomonadaceae) 과의 구성원일 수 있다. 감마 프로테오박테리아 호스트는 에스케리치아 콜라이 종의 구성원 및 슈도모나스 플루오레센스 종의 구성원을 포함한다. 슈도모나달레 목의 숙주 세포, 슈도모나다세아에 과의 숙주 세포, 또는 슈도모나스 속의 숙주 세포는 당해 기술분야의 통상의 기술자에 의해 동정될 수 있고, 문헌(예를 들어, Bergey's Manual of Systematics of Archaea and Bacteria (온라인 간행, 2015))에 기재되어 있다. 아울러, 그러한 균주에서, 당해 기술분야에 널리 알려진 방법을 이용하여, 프로테아제는 불활성화될 수 있고, 폴딩 조절자 과발현 컨스트럭트는 도입될 수 있다.

당해 기술분야의 통상의 기술자는, 본 발명의 방법에 유용한 생산 호스트 균주가 공적으로 이용 가능한 숙주 세포, 예를 들어 피. 플루오레센스를 이용하여, 예를 들어 당해 기술분야에 공지된 및 문헌에 기재된 적절한 방법을 이용하여 pyrF 유전자를 불활성화시킴으로써 생성될 수 있다는 것을 이해할 것이다. 또한, 독립영양성 회복 플라스미드는 균주 내로 형질전환될 수 있는데, 예를 들어 플라스미드는 당해 기술분야에 공지된 및 문헌에 기재된 다수의 적합한 방법 중 임의의 방법을 이용하여 균주 MB214로부터 pyrF 유전자를 운반하는 플라스미드이다. 아울러, 그러한 균주에서, 당해 기술분야에 널리 알려진 방법을 이용하여, 프로테아제는 불활성화될 수 있고, 폴딩 조절자 과발현 컨스트럭트는 도입될 수 있다.

또한, 다른 슈도모나스 유기체도 유용할 수 있다. 슈도모나드 및 밀접하게 관련된 종은 그람 음성 프로테오박테리아 서브그룹 1을 포함하는데, 이는 Bergey's Manual of Systematics of Archaea and Bacteria(온라인 간행, 2015)에 기재된 과 및/또는 속에 속하는 프로테오박테리아의 그룹을 포함한다. 표 5는 이들 유기체의 과 및 속을 나타낸다.

슈도모나스 및 밀접하게 관련된 박테리아는 일반적으로 "그람(-) 프로테오박테리아 서브그룹 1" 또는 "그람 음성 호기성 간균 및 구균"으로 정의된 그룹의 일부분이다(Bergey's Manual of Systematics of Archaea and Bacteria(온라인 간행, 2015)). 슈도모나스 호스트 균주는 문헌, 예를 들어 상기 인용된 미국 특허 출원 공보 제2006/0040352호에 기재되어 있다.

또한, "그람 음성 프로테오박테리아 서브그룹 1"은 분류에 사용된 기준에 따라 이러한 표제로 분류되는 프로테오박테리아를 포함한다. 또한, 상기 표제는 이전에는 이러한 섹션으로 분류되었지만 더 이상은 그렇지 않은 군, 예를 들어 애시도보락스(Acidovorax) 속, 브레분디모나스(Brevundimonas) 속, 부르크홀데리아(Burkholderia) 속, 히드로게노파가(Hydrogenophaga) 속, 오세아니모나스(Oceanimonas) 속, 랄스토니아(Ralstonia) 속 및 스테노트로포모나스(Stenotrophomonas) 속; 크산토모나스(Xanthomonas) 속에 속하는 (그리고 이전에는 크산토모나스 속의 종으로 칭해진) 유기체를 재분류하여 생성된 스핑고모나스(Sphingomonas) 속(및 이로부터 유래된 블라스토모나스(Blastomonas) 속); Bergey's Manual of Systematics of Archaea and Bacteria(온라인 간행, 2015)에 정의된 아세토박터(Acetobacter) 속에 속하는 유기체를 재분류하여 생성된 애시도모나스(Acidomonas) 속을 포함한다. 또한, 호스트는 슈도모나스 속, 슈도모나스 에날리아(Pseudomonas enalia)(ATCC 14393), 슈도모나스 니그리파시엔스(Pseudomonas nigrifaciens)(ATCC 19375) 및 슈도모나스 푸트레파시엔스(Pseudomonas putrefaciens)(ATCC 8071)로부터의 세포를 또한 포함할 수 있고, 이들은 각각 알테로모나스 할로플란크티스(Alteromonas haloplanktis), 알테로모나스 니그리파시엔스(Alteromonas nigrifaciens) 및 알테로모나스 푸트레파시엔스(Alteromonas putrefaciens)로 재분류되었다. 유사하게, 예를 들어, 슈도모나스 애시도보란스(Pseudomonas acidovorans)(ATCC 15668) 및 슈도모나스 테스토스테로니(Pseudomonas testosteroni)(ATCC 11996)는 각각 코마모나스 애시도보란스(Comamonas acidovorans) 및 코마모나스 테스토스테로니(Comamonas testosteroni)로 재분류되었고; 슈도모나스 니그리파시엔스(ATCC 19375) 및 슈도모나스 피스시시다(Pseudomonas piscicida)(ATCC 15057)는 각각 슈도알테로모나스 니그리파시엔스(Pseudoalteromonas nigrifaciens) 및 슈도알테로모나스 피스시다(Pseudoalteromonas piscicida)로 재분류되었다. 또한, "그람 음성 프로테오박테리아 서브그룹 1"은 임의의 하기 과에 속하는 것으로 분류된 프로토박테리아를 또한 포함한다: 슈도모나다세아에, 아조토박테라세아에(현재 슈도모나다세아에의 "아조토박터 그룹"이라는 동의어로 종종 칭해짐), 리조비아세아에, 및 메틸로모나다세아에(현재 "메틸로코카세아에(Methylococcaceae)"라는 동의어로 종종 언급됨) 따라서, 본원에 달리 기술된 속들에 더하여, "그람 음성 프로테오박테리아 서브그룹 1"에 속하는 추가적인 프로테오박테리아 속은: 1) 아조리조필루스(Azorhizophilus) 속의 아조토박터 그룹 박테리아; 2) 셀비브리오(Cellvibrio) 속, 올리겔라(Oligella) 속 및 테레디니박터(Teredinibacter) 속의 슈도모나다세아에 과 박테리아; 3) 켈라토박터(Chelatobacter) 속, 엔시페르(Ensifer) 속, 리베리박터(Liberibacter) 속("칸디다투스 리베리박터(Candidatus Liberibacter)"로 또한 칭해짐), 및 시노리조비움(Sinorhizobium) 속의 리조비아세아에 과 박테리아; 및 4) 메틸로박터(Methylobacter) 속, 메틸로칼둠(Methylocaldum) 속, 메틸로마이크로비움(Methylomicrobium) 속, 메틸로사르시나(Methylosarcina) 속 및 메틸로스파에라(Methylosphaera) 속의 메틸로코카세아에(Methylococcaceae) 과 박테리아를 포함한다.

몇몇 경우에서, 숙주 세포는 "그람 음성 프로테오박테리아 서브그룹 16"으로부터 선택될 수 있다. "그람 음성 프로테오박테리아 서브그룹 16"은 하기의 슈도모나스 종의 프로테오박테리아의 그룹으로서 정의된다(예시적인 균주(들)의 ATCC 또는 기타 기탁 번호가 괄호 안에 제시됨): 슈도모나스 아비에타니필라(Pseudomonas abietaniphila)(ATCC 700689); 슈도모나스 아에루지노사(Peudomonas aeruginosa)(ATCC 10145); 슈도모나스 알칼리게네스(Peudomonas alcaligenes)(ATCC 14909); 슈도모나스 안귈리셉티카(Pseudomonas anguilliseptica)(ATCC 33660); 슈도모나스 시트로넬로리스(Pseudomonas citronellolis)(ATCC 13674); 슈도모나스 플라베센스(Pseudomonas flavescens)(ATCC 51555); 슈도모나스 멘도시나(Pseudomonas mendocina)(ATCC 25411); 슈도모나스 니트로레두센스(Pseudomonas nitroreducens)(ATCC 33634); 슈도모나스 올레오보란스(Pseudomonas oleovorans)(ATCC 8062); 슈도모나스 슈도알칼리게네스(Pseudomonas pseudoalcaligenes)(ATCC 17440); 슈도모나스 레시노보란스(Pseudomonas resinovorans)(ATCC 14235); 슈도모나스 스트라미네아(Pseudomonas straminea)(ATCC 33636); 슈도모나스 아가리치(Pseudomonas agarici)(ATCC 25941); 슈도모나스 알칼리필라(Pseudomonas alcaliphila); 슈도모나스 알기노보라(Pseudomonas alginovora); 슈도모나스 안데르소니이(Pseudomonas andersonii); 슈도모나스 아스플레니이(Pseudomonas asplenii)(ATCC 23835); 슈도모나스 아젤라이카(Pseudomonas azelaica)(ATCC 27162); 슈도모나스 베이제린키이(Pseudomonas beijerinckii)(ATCC 19372); 슈도모나스 보레알리스(Pseudomonas borealis); 슈도모나스 보레오폴리스(Pseudomonas boreopolis)(ATCC 33662); 슈도모나스 브라시카세아룸(Pseudomonas brassicacearum); 슈도모나스 부타노보라(Pseudomonas butanovora)(ATCC 43655); 슈도모나스 셀룰로사(Pseudomonas cellulosa)(ATCC 55703); 슈도모나스 아우란티아카(Pseudomonas aurantiaca)(ATCC 33663); 슈도모나스 클로로라피스(Pseudomonas chlororaphis)(ATCC 9446, ATCC 13985, ATCC 17418, ATCC 17461); 슈도모나스 프라기(Pseudomonas fragi)(ATCC 4973); 슈도모나스 룬덴시스(Pseudomonas lundensis)(ATCC 49968); 슈도모나스 타에트롤렌스(Pseudomonas taetrolens)(ATCC 4683); 슈도모나스 시스시콜라(Pseudomonas cissicola)(ATCC 33616); 슈도모나스 코로나파시엔스(Pseudomonas coronafaciens); 슈도모나스 디테르페니필라(Pseudomonas diterpeniphila); 슈도모나스 엘롱가타(Pseudomonas elongata)(ATCC 10144); 슈도모나스 플렉텐스(Pseudomonas flectens)(ATCC 12775); 슈도모나스 아조토포르만스(Pseudomonas azotoformans); 슈도모나스 브렌네리(Pseudomonas brenneri); 슈도모나스 세드렐라(Pseudomonas cedrella); 슈도모나스 코루가타(Pseudomonas corrugata)(ATCC 29736); 슈도모나스 엑스트레모리엔탈리스(Pseudomonas extremorientalis); 슈도모나스 플루오레센스(ATCC 35858); 슈도모나스 게사르디이(Pseudomonas gessardii); 슈도모나스 리바넨시스(Pseudomonas libanensis); 슈도모나스 만델리이(Pseudomonas mandelii)(ATCC 700871); 슈도모나스 마르기날리스(Pseudomonas marginalis)(ATCC 10844); 슈도모나스 미굴라에(Pseudomonas migulae); 슈도모나스 무시돌렌스(Pseudomonas mucidolens)(ATCC 4685); 슈도모나스 오리엔탈리스(Pseudomonas orientalis); 슈도모나스 로데시아에(Pseudomonas rhodesiae); 슈도모나스 신잔타(Pseudomonas synxantha)(ATCC 9890); 슈도모나스 톨라아시이(Pseudomonas tolaasii)(ATCC 33618); 슈도모나스 베로니이(Pseudomonas veronii)(ATCC 700474); 슈도모나스 프레데릭스베르겐시스(Pseudomonas frederiksbergensis); 슈도모나스 게니쿨라타(Pseudomonas geniculata)(ATCC 19374); 슈도모나스 긴게리(Pseudomonas gingeri); 슈도모나스 그라미니스(Pseudomonas graminis); 슈도모나스 그리몬티(Pseudomonas grimontii); 슈도모나스 할로데니트리피칸스(Pseudomonas halodenitrificans); 슈도모나스 할로필라(Pseudomonas halophila); 슈도모나스 히비스시콜라(Pseudomonas hibiscicola)(ATCC 19867); 슈도모나스 후티엔시스(Pseudomonas huttiensis)(ATCC 14670); 슈도모나스 히드로게노보라(Pseudomonas hydrogenovora); 슈도모나스 제세니이(Pseudomonas jessenii)(ATCC 700870); 슈도모나스 킬로넨시스(Pseudomonas kilonensis); 슈도모나스 란세올라타(Pseudomonas lanceolata)(ATCC 14669); 슈도모나스 리니(Pseudomonas lini); 슈도모나스 마르기나타(Pseudomonas marginata)(ATCC 25417); 슈도모나스 메피티카(Pseudomonas mephitica)(ATCC 33665); 슈도모나스 데니트리피칸스(Pseudomonas denitrificans)(ATCC 19244); 슈도모나스 페르투치노게나(Pseudomonas pertucinogena)(ATCC 190); 슈도모나스 픽토룸(Pseudomonas pictorum)(ATCC 23328); 슈도모나스 사이크로필라(Pseudomonas psychrophila); 슈도모나스 필바(Pseudomonas filva)(ATCC 31418); 슈도모나스 몬테일리이(Pseudomonas monteilii)(ATCC 700476); 슈도모나스 모셀리이(Pseudomonas mosselii); 슈도모나스 오리지하비탄스(Pseudomonas oryzihabitans)(ATCC 43272); 슈도모나스 플레코글로시시다(Pseudomonas plecoglossicida)(ATCC 700383); 슈도모나스 푸티다(Pseudomonas putida)(ATCC 12633); 슈도모나스 레악탄스(Pseudomonas reactans); 슈도모나스 스피노사(Pseudomonas spinosa)(ATCC 14606); 슈도모나스 발레아리카(Pseudomonas balearica); 슈도모나스 루테올라(Pseudomonas luteola)(ATCC 43273); 슈도모나스 스투트제리(Pseudomonas stutzeri)(ATCC 17588); 슈도모나스 아미그달리(Pseudomonas amygdali)(ATCC 33614); 슈도모나스 아벨라나에(Pseudomonas avellanae)(ATCC 700331); 슈도모나스 카리카파파야에(Pseudomonas caricapapayae)(ATCC 33615); 슈도모나스 시코리이(Pseudomonas cichorii)(ATCC 10857); 슈도모나스 피쿠세렉타에(Pseudomonas ficuserectae)(ATCC 35104); 슈도모나스 푸스코바기나에(Pseudomonas fuscovaginae); 슈도모나스 멜리아에(Pseudomonas meliae)(ATCC 33050); 슈도모나스 시링가에(Pseudomonas syringae)(ATCC 19310); 슈도모나스 비리디플라바(Pseudomonas viridiflava)(ATCC 13223); 슈도모나스 테르모카록시도보란스(Pseudomonas thermocarhoxydovorans)(ATCC 35961); 슈도모나스 테르모톨레란스(Pseudomonas thermotolerans); 슈도모나스 티베르발렌시스(Pseudomonas thivervalensis); 슈도모나스 반코우베렌시스(Pseudomonas vancouverensis)(ATCC 700688); 슈도모나스 위스콘시넨시스(Pseudomonas wisconsinensis); 및 슈도모나스 시아메넨시스(Pseudomonas xiamenensis). 한 실시양태에서, 관심 폴리펩타이드 또는 단백질의 발현을 위한 숙주 세포는 슈도모나스 플루오레센스이다.

숙주 세포는 "그람 음성 프로테오박테리아 서브그룹 17"로부터 선택될 수 있다. "그람 음성 프로테오박테리아 서브그룹 17"은 예를 들어 하기의 슈도모나스 종에 속하는 것들을 포함하여 "형광성 슈도모나드"로 당해 기술분야에 공지된 프로테오박테리아의 그룹으로서 정의된다: 슈도모나스 아조토포르만스(Pseudomonas azotoformans); 슈도모나스 브렌네리(Pseudomonas brenneri); 슈도모나스 세드렐라(Pseudomonas cedrella); 슈도모나스 세드리나(Pseudomonas cedrina); 슈도모나스 코루가타(Pseudomonas corrugata); 슈도모나스 엑스트레모리엔탈리스(Pseudomonas extremorientalis); 슈도모나스 플루오레센스; 슈도모나스 게사르디이(Pseudomonas gessardii); 슈도모나스 리바넨시스(Pseudomonas libanensis); 슈도모나스 만델리이(Pseudomonas mandelii); 슈도모나스 마르기날리스(Pseudomonas marginalis); 슈도모나스 미굴라에(Pseudomonas migulae); 슈도모나스 무시돌렌스(Pseudomonas mucidolens); 슈도모나스 오리엔탈리스(Pseudomonas orientalis); 슈도모나스 로데시아에(Pseudomonas rhodesiae); 슈도모나스 신잔타(Pseudomonas synxantha); 슈도모나스 톨라아시이(Pseudomonas tolaasii); 및 슈도모나스 베로니이(Pseudomonas veronii).

프로테아제

한 실시양태에서, 본 출원에 제공된 방법은 관심 폴리펩타이드 또는 단백질을 생산하기 위해 하나 이상의 프로테아제 유전자에 하나 이상의 돌연변이(예를 들어, 부분적인 또는 완전한 결실)를 포함하는 슈도모나스 숙주 세포를 이용하는 것을 포함한다. 몇몇 실시양태에서, 프로테아제 유전자의 돌연변이는 가용성의 관심 폴리펩타이드 또는 단백질의 생성을 용이하게 한다.

예시적인 타겟 프로테아제 유전자는 아미노펩티다아제; 디펩티다아제; 디펩티딜-펩티다아제 및 트리펩티딜 펩티다아제; 펩티딜-디펩티다아제; 세린-타입 카르복시펩티다아제; 메탈로카르복시펩티다아제; 시스테인-타입 카르복시펩티다아제; 오메가펩티다아제; 세린 프로테이나아제; 시스테인 프로테이나아제; 아스파틱 프로테이나아제; 메탈로 프로테이나아제; 또는 미지 메카니즘의 프로테이나아제로서 분류된 프로테아제를 포함한다.

아미노펩티다아제는 세포질 아미노펩티다아제(루실 아미노펩티다아제), 막 알라닐 아미노펩티다아제, 시스티닐 아미노펩티다아제, 트리펩타이드 아미노펩티다아제, 프롤릴 아미노펩티다아제, 아르기닐 아미노펩티다아제, 글루타밀 아미노펩티다아제, x-pro 아미노펩티다아제, 박테리아 루실 아미노펩티다아제, 호열성 아미노펩티다아제, 클로스트리디얼 아미노펩티다아제, 세포질 알라닐 아미노펩티다아제, 라이실 아미노펩티다아제, x-trp 아미노펩티다아제, 트립토파닐 아미노펩티다아제, 메티오닐 아미노펩티다아제, d-입체특이적 아미노펩티다아제, 아미노펩티다아제 ey를 포함한다. 디펩티다아제는 x-his 디펩티다아제, x-arg 디펩티다아제, x-메틸-his 디펩티다아제, cys-gly 디펩티다아제, glu-glu 디펩티다아제, pro-x 디펩티다아제, x-pro 디펩티다아제, met-x 디펩티다아제, 비입체특이적 디펩티다아제, 세포질 비특이적 디펩티다아제, 막 디펩티다아제, 베타-ala-his 디펩티다아제를 포함한다. 디펩티딜-펩티다아제 및 트리펩티딜 펩티다아제는 디펩티딜-펩티다아제 i, 디펩티딜-펩티다아제 ii, 디펩티딜 펩티다아제 iii, 디펩티딜-펩티다아제 iv, 디펩티딜-디펩티다아제, 트리펩티딜-펩티다아제 I, 트리펩티딜-펩티다아제 II를 포함한다. 펩티딜-디펩티다아제는 펩티딜-디펩티다아제 a 및 펩티딜-디펩티다아제 b를 포함한다. 세린-타입 카르복시펩티다아제는 라이소좀 pro-x 카르복시펩티다아제, 세린-타입 D-ala-D-ala 카르복시펩티다아제, 카르복시펩티다아제 C, 카르복시펩티다아제 D를 포함한다. 메탈로르복시펩티다아제는 카르복시펩티다아제 a, 카르복시펩티다아제 B, 라이신(아르기닌) 카르복시펩티다아제, gly-X 카르복시펩티다아제, 알라닌 카르복시펩티다아제, 무라모일펜타펩타이드 카르복시펩티다아제, 카르복시펩티다아제 h, 글루타메이트 카르복시펩티다아제, 카르복시펩티다아제 M, 무라모일테트라펩타이드 카르복시펩티다아제, 아연 d-ala-d-ala 카르복시펩티다아제, 카르복시펩티다아제 A2, 막 pro-x 카르복시펩티다아제, 튜불리닐-tyr 카르복시펩티다아제, 카르복시펩티다아제 t를 포함한다. 오메가펩티다아제는 아실아미노아실-펩티다아제, 펩티딜-글라이신아미다아제, 파이로글루타밀-펩티다아제 I, beta-아스파르틸-펩티다아제, 파이로글루타밀-펩티다아제 II, n-포르밀메티오닐-펩티다아제, 프테로일폴리-[감마]-글루타메이트 카르복시펩티다아제, 감마-glu-X 카르복시펩티다아제, 아실무라모일-ala 펩티다아제를 포함한다. 세린 프로테이나아제는 키모트립신, 키모트립신 c, 메트리딘, 트립신, 트롬빈, 응고 인자 Xa, 플라스민, 엔테로펩티다아제, 아크로신, 알파-용해 프로테아제, 글루타밀 엔도펩티다아제, 카텝신 G, 응고 인자 viia, 응고 인자 ixa, 쿠쿠미시, 프롤릴 올리고펩티다아제, 응고 인자 xia, 브라키우린, 혈장 칼리크레인, 조직 칼리크레인, 췌장 엘라스타아제, 백혈구 엘라스타아제, 응고 인자 xiia, 키마아제, 보체 성분 c1r55, 보체 성분 c1s55, 고전적인 보체 경로 c3/c5 컨버타아제, 보체 인자 I, 보체 인자 D, 대안적인 보체 경로 c3/c5 컨버타아제, 세레비신, 하이포데르민 C, 라이실 엔도펩티다아제, 엔도펩티다아제 1a, 감마-레니, 베놈빈 ab, 루실 엔도펩티다아제, 트립타아제, 스쿠텔라린, 케신, 섭틸리신, 오리진, 엔도펩티다아제 k, 써모마이콜린, 써미타아제, 엔도펩티다아제 SO, T-플라스미노겐 활성제, 단백질 C, 췌장 엔도펩티다아제 E, 췌장 엘라스타아제 ii, IGA-특이적 세린 엔도펩티다아제, U-플라스미노겐 활성화제, 베놈빈 A, 푸린, 미엘로블라스틴, 세메노겔라아제, 그랜자임 A 또는 세포독성 T-림프구 프로테이나아제 1, 그랜자임 B 또는 세포독성 T-림프구 프로테아나아제 2, 스트렙토그리신 A, 트렙토그리신 B, 글루타밀 엔도펩티다아제 II, 올리고펩티다아제 B, 리물러스 응고 인자 c, 리물러스 응고 인자, 리물러스 응고 효소, 옴프틴, 억제인자 lexa, 세균 리더 펩티다아제 I, 토가비린, 플라비린을 포함한다. 시스테인 프로테이나아제는 카텝신 B, 파파인, 피신, 키모파파인, 아스클레파인, 클로스트리파인, 스트렙토파인, 액티나이드, 카텝신 1, 카텝신 H, 칼파인, 카텝신 t, 글라이실 엔도펩티다아제, 암 응고촉진제, 카텝신 S, 피코르나인 3C, 피코르나인 2A, 카리카인, 아나나인, 줄기 브로멜라인, 과일 브로멜라인, 레구마인, 히스톨리사인, 인터루킨 1-베타 전환 효소를 포함한다. 아스파르틱 프로테이나아제는 펩신 A, 펩신 B, 가스트리신, 키모신, 카텝신 D, 네오펜테신, 레닌, 레트로펩신, 프로-오피오멜라노코르틴 전환 효소, 아스퍼길로펩신 I, 아스퍼길로펩신 II, 페니실로펩신, 리조푸스펩신, 엔도티아펩신, 뮤코로펩신, 칸디다펩신, 사카로펩신, 로도토룰라펩신, 피사로펩신, 아크로실린드로펩신, 폴리포로펩신, 피크노포로펩신, 사이탈리도펩신 a, 사이탈리도펩신 b, 크산토모나펩신, 카텝신 e, 배리어펩신, 박테리아 리더 펩티다아제 I, 슈도모나펩신, 플라스멥신을 포함한다. 메탈로 프로테이나제는 아트로라이신 a, 미생물 콜라게나아제, 류코라이신, 장 콜라게나아제, 네프릴라이신, 엔벨라이신, iga-특이적 메탈로엔도펩티다아제, 프로콜라겐 N-엔도펩티다아제, 티메트 올리고펩티다아제, 뉴로라이신, 스트로메라이신 1, 메프린 A, 프로콜라겐 C-엔도펩티다아제, 펩티딜-lys 메탈로엔도펩티다아제, 아스타신, 스트로메라이신 2, 마트리라이신 겔라티나아제, 에어로모노라이신, 슈도라이신, 써모라이신, 바실로라이신, 아우레오라이신, 코코라이신, 마이코라이신, 베타-용해 메탈로엔도펩티다아제, 펩티딜-asp 메탈로엔도펩티다아제, 호중성 콜라게나아제, 겔라티나아제 B, 레쉬마노라이신, 사카로라이신, 오토라이신, 듀테로라이신, 세라라이신, 아트로라이신 B, 아트로라이신 C, 아트록사아제, 아트로라이신 E, 아트로라이신 F, 아다마라이신, 호리라이신, 루버라이신, 보트로파신, 보트로라이신, 오피오라이신, 트리메레라이신 I, 트리메레라이신 II, 뮤크로라이신, 피트리라이신, 인슐라이신, O-시알로글리코단백질 엔도펩티다아제, 러셀라이신, 미토콘드리아 중간 펩티다아제, 닥티라이신, 나르디라이신, 마그노라이신, 메프린 B, 미토콘드리아 프로세싱 펩티다아제, 마크로파지 엘라스타아제, 코리오라이신, 톡시라이신을 포함한다. 미지 메커니즘의 프로테이나아제는 써모프신 및 다중촉매성 엔도펩티다아제 복합체를 포함한다.

특정 프로테아제는 프로테아제 및 샤페론 유사 활성 둘 다를 보유한다. 이들 프로테아제가 단백질 수율 및/또는 품질에 부정적인 영향을 미치는 경우, 종종 그들의 프로테아제 활성을 특이적으로 결실시키는 것이 유용하고, 그들의 샤페론 활성이 단백질 수율 및/또는 품질에 긍정적인 영향을 미치는 경우 그들은 과발현된다. 이들 프로테아제는 Hsp100(Clp/Hsl) 패밀리 구성원 RXF04587.1(clpA), RXF08347.1, RXF04654.2(clpX), RXF04663.1, RXF01957.2(hslU), RXF01961.2(hslV); 펩티딜-프롤릴 시스-트랜스 아이소머라아제 패밀리 구성원 RXF05345.2(ppiB); 메탈로펩티다아제 M20 패밀리 구성원 RXF04892.1(아미노하이드롤라아제); 메탈로펩티다아제 M24 패밀리 구성원 RXF04693.1(메티오닌 아미노펩티다아제) 및 RXF03364.1(메티오닌 아미노펩티다아제); 및 세린 펩티다아제 S26 신호 펩티다아제 I 패밀리 구성원 RXF01181.1(신호 펩티다아제)를 포함하나, 이들로 한정되는 것은 아니다.

이들 및 다른 프로테아제 및 폴딩 조절자는 당해 기술분야에 공지되어 있고, 문헌, 예를 들어 미국 특허 제8,603,824호에 기재되어 있다. 예를 들어, 상기 특허의 표 D는 Tig(tig, 트리거 인자, FKBP 파입 PPIase(ec 5.2.1.8) RXF04655, UniProtKB - P0A850 (TIG_ECOLI))를 기재하고 있다. 본 출원에 그 전체 내용이 참고로 인용된 WO 2008/134461호 및 "이종성 단백질의 발현에서 개선된 수율 및/또는 품질을 보유하는 특정 균주를 동정하기 위해 미생물 균주를 신속하게 스크리닝하기 위한 방법"이라는 명칭의 미국 특허 제9,394,571호는 Tig(RXF04655.2, 상기 특허의 서열 번호 34), LepB(RXF01181.1, 상기 특허의 서열 번호 56), DegP1(RXF01250, 상기 특허의 서열 번호 57), AprA(RXF04304.1, 상기 특허의 서열 번호 86), Prc1(RXF06586.1, 상기 특허의 서열 번호 120), DegP2(RXF07210.1, 상기 특허의 서열 번호 124), Lon(RXF04653, 상기 특허의 서열 번호 92); DsbA(RXF01002.1, 상기 특허의 서열 번호 25), 및 DsbC(RXF03307.1, 상기 특허의 서열 번호 26)를 기재하고 있다. 또한, 이들 서열 및 다른 프로테아제에 대한 것들 및 폴딩 조절자는 미국 특허 제9,580,719호(컬럼 93-98의 서열 번호의 표)에 기재되어 있다. 예를 들어, 미국 특허 제9,580,719호는 각각 서열 번호 18 및 19로서 HslU(RXF01957.2) 및 HslV(RXF01961.2)를 코딩하는 서열을 제공한다.

고 처리량 스크린

실시양태에서, 고 처리량 스크린은 관심 재조합 단백질 또는 폴리펩타이드를 발현하기 위한 최적 조건을 결정하기 위해 수행된다. 스크린에서 변경될 수 있는 조건은 예를 들어, 숙주 세포, 숙주 세포의 유전적 배경(예를 들어, 상이한 프로테아제의 결실), 발현 컨스트럭트 내의 프로모터의 타입, 코딩된 관심 폴리펩타이드 또는 단백질에 융합된 분리 리더의 타입, 성장 온도, 유도성 프로모터가 사용되는 경우 유도의 OD, 첨가된 유도인자의 양(예를 들어, lacZ 프로모터 또는 이의 유도체가 사용되는 경우 유도를 위해 사용된 IPTG의 양), 단백질 유도의 지속기간, 배양물에 유도인자의 첨가 후 성장 온도, 배양물의 교반 속도, 플라스미드 유지를 위한 선택 방법, 용기의 배양 부피, 및 세포 용해 방법을 포함한다.

몇몇 실시양태에서, 호스트 균주의 라이브러리("어레이")가 제공되는데, 라이브러리 내의 각각의 균주(또는 "숙주 세포의 집단")는 숙주 세포 내에서 하나 이상의 타겟 유전자의 발현을 조절하기 위해 유전적으로 변경된다. "최적 호스트 균주" 또는 "최적 발현 시스템"은 종종 어레이 내에서 표현형적으로 구별되는 숙주 세포의 다른 집단과 비교하여 발현된 관심 단백질의 양, 질, 및/또는 위치에 기초하여 확인 또는 선택된다. 따라서, 최적 호스트 균주는 원하는 사양에 따라 관심 폴리펩타이드를 생산하는 균주이다. 원하는 사양은 생산하려는 폴리펩타이드에 따라 달라질 것이지만, 상기 사양은 단백질의 양 및/또는 질, 단백질이 격리 또는 분비되는지 여부, 단백질 폴딩 등을 포함한다. 예를 들어, 최적 호스트 균주 또는 최적 발현 시스템은 특정의 절대적인 레벨 또는 지표 균주, 즉 비교를 위해 사용된 균주에 의해 생산된 것에 대한 특정 레벨의 가용성의 이종성 단백질의 양, 회수 가능한 이종성 단백질의 양, 적절하게 프로세싱된 이종성 단백질의 양, 적절하게 폴딩된 이종성 단백질의 양, 활성의 이종성 단백질의 양, 및/또는 이종성 단백질의 총량을 특징으로 하는 수득량을 생산한다.

이종성 단백질의 발현에서 개선된 수율 및/또는 품질을 보유하는 균주를 확인하기 위한 미생물 호스트 스크리닝 방법은 예를 들어 미국 특허 출원 공보 제2008/0269070호에 기재되어 있다.

박테리아 성장 조건

본 출원의 방법에 유용한 성장 조건은 종종 약 4℃ 내지 약 42℃의 온도 및 약 5.7 내지 약 8.8의 pH를 포함한다. lacZ 프로모터 또는 이의 유도체를 보유하는 발현 컨스트럭트가 사용되는 경우, 발현은 종종 배양물에 약 0.01 mM 내지 약 1.0 mM의 최종 농도로 IPTG를 첨가함으로써 유도된다.

배양물의 pH는 종종 당해 기술분야의 통상의 기술자에게 공지된 방법 및 pH 완충액을 이용하여 유지된다. 또한, 배양 중 pH의 조절은 수성 암모니아를 이용하여 달성된다. 실시양태에서, 배양물의 pH는 약 5.7 내지 약 8.8이다. 특정 실시양태에서, 상기 pH는 약 5.7, 5.8, 5.9, 6.0, 6.1, 6.2, 6.3, 6.4, 6.5, 6.6, 6.7, 6.8, 6.9, 7.0, 7.1, 7.2, 7.3, 7.4, 7.5, 7.6, 7.7, 7.8, 7.9, 8.0, 8.1, 8.2, 8.3, 8.4, 8.5, 8.6, 8.7, 또는 8.8이다. 다른 실시양태에서, 상기 pH는 약 5.7 내지 5.9, 5.8 내지 6.0, 5.9 내지 6.1, 6.0 내지 6.2, 6.1 내지 6.3, 6.2 내지 6.5, 6.4 내지 6.7, 6.5 내지 6.8, 6.6 내지 6.9, 6.7 내지 7.0, 6.8 내지 7.1, 6.9 내지 7.2, 7.0 내지 7.3, 7.1 내지 7.4, 7.2 내지 7.5, 7.3 내지 7.6, 7.4 내지 7.7, 7.5 내지 7.8, 7.6 내지 7.9, 7.7 내지 8.0, 7.8 내지 8.1, 7.9 내지 8.2, 8.0 내지 8.3, 8.1 내지 8.4, 8.2 내지 8.5, 8.3 내지 8.6, 8.4 내지 8.7, 또는 8.5 내지 8.8이다. 여전히 다른 실시양태에서, 상기 pH는 약 5.7 내지 6.0, 5.8 내지 6.1, 5.9 내지 6.2, 6.0 내지 6.3, 6.1 내지 6.4, 또는 6.2 내지 6.5이다. 특정 실시양태에서, 상기 pH는 약 5.7 내지 약 6.25이다.

실시양태에서, 성장 온도는 약 4℃ 내지 약 42℃에서 유지된다, 특정 실시양태에서, 상기 성장 온도는 약 4℃, 약 5℃, 약 6℃, 약 7℃, 약 8℃, 약 9℃, 약 10℃, 약 11℃, 약 12℃, 약 13℃, 약 14℃, 약 15℃, 약 16℃, 약 17℃, 약 18℃, 약 19℃, 약 20℃, 약 21℃, 약 22℃, 약 23℃, 약 24℃, 약 25℃, 약 26℃, 약 27℃, 약 28℃, 약 29℃, 약 30℃, 약 31℃, 약 32℃, 약 33℃, 약 34℃, 약 35℃, 약 36℃, 약 37℃, 약 38℃, 약 39℃, 약 40℃, 약 41℃, 또한 약 42℃이다. 다른 실시양태에서, 상기 성장 온도는 약 25℃ 내지 약 27℃, 약 25℃ 내지 약 28℃, 약 25℃ 내지 약 29℃, 약 25℃ 내지 약 30℃, 약 25℃ 내지 약 31℃, 약 25℃ 내지 약 32℃, 약 25℃ 내지 약 33℃, 약 26℃ 내지 약 28℃, 약 26℃ 내지 약 29℃, 약 26℃ 내지 약 30℃, 약 26℃ 내지 약 31℃, 약 26℃ 내지 약 32℃, 약 27℃ 내지 약 29℃, 약 27℃ 내지 약 30℃, 약 27℃ 내지 약 31℃, 약 27℃ 내지 약 32℃, 약 26℃ 내지 약 33℃, 약 28℃ 내지 약 30℃, 약 28℃ 내지 약 31℃, 약 28℃ 내지 약 32℃, 약 29℃ 내지 약 31℃, 약 29℃ 내지 약 32℃, 약 29℃ 내지 약 33℃, 약 30℃ 내지 약 32℃, 약 30℃ 내지 약 33℃, 약 31℃ 내지 약 33℃, 약 31℃ 내지 약 32℃, 약 30℃ 내지 약 33℃, 또는 약 32℃ 내지 약 33℃로 유지된다. 다른 실시양태에서, 상기 온도는 배양 중에 변화된다. 특정 실시양태에서, 상기 온도는 관심 폴리펩타이드 또는 단백질을 코딩하는 컨스트럭트로부터 발현을 유도하기 위한 제제를 배양물에 첨가하기 이전에 약 30℃ 내지 약 32℃로 유지되고, 상기 온도는 발현을 유도하기 위한 제제, 예를 들어 IPTG를 배양물에 첨가한 이후에 약 25℃ 내지 약 27℃로 강하된다. 한 실시양태에서, 상기 온도는 관심 폴리펩타이드 또는 단백질을 코딩하는 컨스트럭트로부터 발현을 유도하기 위한 제제를 배양물에 첨가하기 이전에 약 30℃로 유지되고, 상기 온도는 발현을 유도하는 제제를 배양물에 첨가한 이후에 약 25℃로 강하된다.

유도

본 출원의 다른 곳에 기재된 바와 같이, 유도성 프로모터, 예를 들어 lac 프로모터는 관심 폴리펩타이드 또는 단백질의 발현을 조절하기 위해 발현 컨스트럭트 내에서 종종 사용된다. lac 프로모터 유도체 또는 패밀리 구성원, 예를 들어 tac 프로모터의 경우, 효과인자 화합물은 유도인자, 예를 들어 IPTG(이소프로필-β-D-1-티오갈락토피라노사이드; "이소프로필티오갈락토사이드"로도 언급된)와 같은 무상 유도인자이다. 실시양태에서, lac 프로모터 유도체가 사용되고, 관심 폴리펩타이드 또는 단백질 발현은, 세포 밀도가 OD575에 의해 확인된 레벨로서 약 25 내지 약 160에 도달하는 경우, IPTG를 약 0.01 mM 내지 약 1.0 mM의 최종 농도로 첨가함으로써 유도된다. 실시양태에서, 관심 폴리펩타이드 또는 단백질을 위한 배양 유도 시의 OD575는 약 25, 약 50, 약 55, 약 60, 약 65, 약 70, 약 80, 약 90, 약 100, 약 110, 약 120, 약 130, 약 140, 약 150, 약 160, 약 170, 또는 약 180이다. 다른 실시양태에서, OD575는 약 80 내지 약 100, 약 100 내지 약 120, 약 120 내지 약 140, 또는 약 140 내지 약 160이다. 다른 실시양태에서, OD575는 약 80 내지 약 140, 또는 약 100 내지 160이다. 세포 밀도는 종종 다른 방법에 의해 측정되고, 다른 단위, 예를 들어 단위 부피 당 세포로 표현된다. 예를 들어, 슈도모나스 플루오레센스 배양물의 약 25 내지 약 160의 OD575는 1 mL 당 대략 4 x 10¹⁰ 내지 약 1.6 x 10¹¹ 콜로니 형성 유닛 또는 11 내지 70 g/L 건조 세포 중량과 균등하다. 실시양태에서, 관심 폴리펩타이드 또는 단백질의 발현은, 세포 밀도가 약 0.05 g/g 내지 약 0.4 g/g의 습윤 중량에 도달하는 경우, 약 0.01 mM 내지 약 1.0 mM의 최종 농도로 IPTG를 첨가함으로써 유도된다. 실시양태에서, 습윤 중량은 약 0.05 g/g, 약 0.1 g/g, 약 0.15 g/g, 약 0.2 g/g, 약 0.25 g/g, 약 0.30 g/g, 약 0.35 g/g, 약 0.40 g/g, 약 0.05 g/g 내지 약 0.1 g/g, 약 0.05 g/g 내지 약 0.15 g/g, 약 0.05 g/g 내지 약 0.20 g/g, 약 0.05 g/g 내지 약 0.25 g/g, 약 0.05 g/g 내지 약 0.30 g/g, 약 0.05 g/g 내지 약 0.35 g/g, 약 0.1 g/g 내지 약 0.40 g/g, 약 0.15 g/g 내지 약 0.40 g/g, 약 0.20 g/g 내지 약 0.40 g/g, 약 0.25 g/g 내지 약 0.40 g/g, 약 0.30 g/g 내지 약 0.40 g/g, 또는 약 0.35 g/g 내지 약 0.40 g/g이다. 실시양태에서, 배양 유도 시의 세포 밀도는 세포 밀도를 결정하기 위해 사용된 방법 또는 측정값의 단위와는 무관하게 OD575에서의 흡광도에 의해 기술된 바와 같은 세포 밀도와 균등하다. 당해 기술분야의 통상의 기술자는 임의의 세포 배양을 위한 적합한 전환을 어떻게 수행하는지 알 것이다.

실시양태에서, 배양물의 최종 IPTG 농도는 약 0.01 mM, 약 0.02 mM, 약 0.03 mM, 약 0.04 mM, 약 0.05 mM, 약 0.06 mM, 약 0.07 mM, 약 0.08 mM, 약 0.09 mM, 약 0.1 mM, 약 0.2 mM, 약 0.3 mM, 약 0.4 mM, 약 0.5 mM, 약 0.6 mM, 약 0.7 mM, 약 0.8 mM, 약 0.9 mM, 또는 약 1 mM이다. 다른 실시양태에서, 배양물의 최종 IPTG 농도는 약 0.08 mM 내지 약 0.1 mM, 약 0.1 mM 내지 약 0.2 mM, 약 0.2 mM 내지 약 0.3 mM, 약 0.3 mM 내지 약 0.4 mM, 약 0.2 mM 내지 약 0.4 mM, 약 0.08 내지 약 0.2mM, 또는 약 0.1 내지 1 mM이다.

본 출원 및 문헌에 기재된 바와 같이, lac 타입이 아닌 프로모터가 사용되는 실시양태에서, 다른 유도인자 또는 효과인자가 종종 사용된다. 한 실시양태에서, 프로모터는 구성적 프로모터이다.

유도인자를 첨가한 후, 배양물은 종종 일정 시간, 예를 들어 약 24 시간 동안 성장되는데, 그동안에 관심 폴리펩타이드 또는 단백질이 발현된다. 유도인자를 첨가한 후, 배양물은 종종 약 1 hr, 약 2 hr, 약 3 hr, 약 4 hr, 약 5 hr, 약 6 hr, 약 7 hr, 약 8 hr, 약 9 hr, 약 10 hr, 약 11 hr, 약 12 hr, 약 13 hr, 약 14 hr, 약 15 hr, 약 16 hr, 약 17 hr, 약 18 hr, 약 19 hr, 약 20 hr, 약 21 hr, 약 22 hr, 약 23 hr, 약 24 hr, 약 36 hr, 또는 약 48 hr 동안 성장된다. 유도인자가 배양물에 첨가된 후, 배양물은 약 1 내지 48 hr, 약 1 내지 24 hrs, 약 10 내지 24 hrs, 약 15 내지 24 hr, 또는 약 20 내지 24 hr 동안 성장된다. 세포 배양물은 종종 원심분리에 의해 농축되고, 배양 펠렛은 후속 세포 용해 절차를 위해 적합한 용액 또는 완충액 내에 재현탁된다.

실시양태에서, 세포는 고압 기계적 세포 파쇄를 위한 장비(예를 들어, 시판되는 Microfluidics 마이크로플루이다이저, Constant 세포파쇄기, Niro-Soavi 균질환기 또는 APV-Gaulin 균질화기)를 이용하여 파쇄된다. 종종 관심 폴리펩타이드 또는 단백질을 발현하는 세포는 예를 들어 초음파 처리를 이용하여 파쇄된다. 세포를 용해하기 위해 당해 기술분야에 공지된 임의의 적합한 방법은 종종 가용성 분획을 방출하기 위해 사용된다. 예를 들어, 실시양태에서, 화학적 및/또는 효소적 세포 용해 시약, 예를 들어 세포벽 용해 효소 및 EDTA가 종종 사용된다. 또한, 동결 또는 이전에 저장된 배양물의 이용도 본 출원의 방법에서 고려된다. 배양물은 종종 OD-표준화된다. 예를 들어, 세포는 종종 약 10, 약 11, 약 12, 약 13, 약 14, 약 15, 약 16, 약 17, 약 18, 약 19, 또는 약 20의 OD600으로 표준화된다.

원심분리는 임의의 적합한 장비 및 방법을 이용하여 수행된다. 불용성 분획으로부터 가용성 분획의 분리를 목적으로 하는 세포 배양물 또는 용해물의 원심분리는 당해 기술분야에 널리 공지되어 있다. 예를 들어, 용해된 세포는 종종 20,800 x g에서 20분 동안(4℃에서) 원심분리되고, 상등액은 수동 또는 자동 액체 취급을 이용하여 제거된다. 펠렛(불용성) 분획은 완충처리된 용액, 예를 들어 인산염 완충처리된 염수(PBS), pH 7.4 내에 재현탁된다. 재현탁은 종종 예를 들어 오버헤드 혼합기에 연결된 임펠러, 마그네틱 스터-바, 로킹 쉐이커 등을 이용하여 수행된다.

배양물의 용해 및 원심분리에 의해 "가용성 분획", 즉 용해물의 원심분리 후 수득된 가용성 상등액 및 "불용성 분획", 즉 용해물의 원심분리 후 수득된 펠렛이 수득된다.

발효 포맷

한 실시양태에서, 발효는 본 출원의 관심 폴리펩타이드 및 단백질을 생산하는 방법에서 사용된다. 본 개시내용에 따른 발현 시스템은 임의의 발효 포맷으로 배양된다. 예를 들어, 회분식, 유가식, 반연속식 및 연속식 발효 모드가 본 출원에서 사용될 수 있다.

실시양태에서, 발효 배지는 리치 배지, 최소 배지, 및 미네랄 염 배지 중에서 선택될 수 있다. 다른 실시양태에서, 최소 배지 또는 미네랄 염 배지가 선택된다. 특정 실시양태에서, 미네랄 염 배지가 선택된다.

미네랄 염 배지는 미네랄 염 및 예를 들어 글루코오스, 수크로오스 또는 글리세롤과 같은 탄소원으로 구성된다. 미네랄 염 배지의 예는, 예를 들어 M9 배지, 슈도모나스 배지(ATCC 179), 및 데이비스 및 민기올리 배지를 포함한다(참조: B D Davis & E S Mingioli (1950) J. Bact. 60:17-28). 미네랄 염 배지를 제조하기 위해 사용된 미네랄 염은 예를 들어 포타슘 포스페이트, 암모늄 설페이트 또는 클로라이드, 마그네슘 설페이트 또는 클로라이드, 및 미량 미네랄, 예를 들어 칼슘 클로라이드, 보레이트, 및 철, 구리, 망간, 및 아연의 설페이트 중에서 선택된 것들을 포함한다. 전형적으로, 유기 질소원, 예를 들어 펩톤, 트립톤, 아미노산, 또는 효모 추출물은 미네랄 염 배지에는 포함되지 않는다. 대신에, 무기 질소원이 사용되고, 이는 예를 들어 암모늄 염, 수성 암모니아, 및 기체상 암모니아 중에서 선택될 수 있다. 미네랄 염 배지는 전형적으로 탄소원으로서 글루코오스 또는 글리세롤을 함유할 것이다. 미네랄 염 배지와 비교하여, 최소 배지는 종종 미네랄 염 및 탄소원을 함유하지만, 예를 들어 낮은 레벨의 아미노산, 비타민, 펩톤, 또는 다른 성분으로 보충되고, 이들은 매우 최소 레벨로 첨가된다. 배지는 종종 당해 기술분야에 기재된 방법, 예를 들어 상기 참고로 인용된 미국 특허 출원 공보 제2006/0040352호의 방법을 이용하여 제조된다. 본 출원의 방법에 유용한 미네랄 염 배지 및 배양 절차의 상세한 내용은 Riesenberg, D. et al., 1991, "High cell density cultivation of Escherichia coli at controlled specific growth rate," J. Biotechnol. 20 (1):17-27에 기재되어 있다.

발효는 임의의 규모로 수행될 수 있다. 본 개시내용에 따른 발현 시스템은 임의의 규모로 재조합 단백질 발현을 위해 유용하다. 따라서, 예를 들어 마이크로리터 규모, 밀리리터 규모, 센티리터 규모, 및 데시리터 규모 발효 부피가 사용될 수 있고, 1 리터 규모 및 더 대규모의 발효 부피도 종종 사용된다.

실시양태에서, 발효 부피는 약 1 리터 또는 그 초과이다. 실시양태에서, 발효 부피는 약 0.5 리터 내지 약 100 리터이다. 실시양태에서, 발효 부피는 약 1 리터, 약 2 리터, 약 3 리터, 약 4 리터, 약 5 리터, 약 6 리터, 약 7 리터, 약 8 리터, 약 9 리터, 또는 약 10 리터이다. 실시양태에서, 발효 부피는 약 0.5 리터 내지 약 2 리터, 약 0.5 리터 내지 약 5 리터, 약 0.5 리터 내지 약 10 리터, 약 0.5 리터 내지 약 25 리터, 약 0.5 리터 내지 약 50 리터, 약 0.5 리터 내지 약 75 리터, 약 10 리터 내지 약 25 리터, 약 25 리터 내지 약 50 리터, 또는 약 50 리터 내지 약 100 리터이다. 다른 실시양태에서, 발효 부피는 5 리터, 10 리터, 15 리터, 20 리터, 25 리터, 50 리터, 75 리터, 100 리터, 200 리터, 500 리터, 1,000 리터, 2,000 리터, 5,000 리터, 10,000 리터, 또는 50,000 리터 또는 그 초과이다.

단백질 분석

실시양태에서, 본 출원에서 제공된 방법에 의해 생산된 관심 폴리펩타이드 및 단백질이 분석된다. 관심 폴리펩타이드 및 단백질은 당해 기술분야의 통상의 기술자에게 공지된 임의의 적절한 방법, 예를 들어 생물층 간섭계, SDS-PAGE, 웨스턴 블롯, 파 웨스턴 블롯, ELISA, 흡광도, 또는 질량분석법(예를 들어, 탠덤 질량분석법)에 의해 분석될 수 있다.

몇몇 실시양태에서, 관심 폴리펩타이드 또는 단백질의 농도 및/또는 양은 예를 들어 브래드포드 어세이, 흡광도, 쿠마시 염색, 질량분석법 등에 의해 결정된다.

본 출원에 기재된 바와 같이 불용성 및 가용성 분획에서의 단백질 수율은 종종 당해 기술분야의 통상의 기술자에게 공지된 방법, 예를 들어 모세관 겔 전기영동(CGE), SDS-PAGE, 및 웨스턴 블롯 분석에 의해 결정된다. 가용성 분획은 종종 예를 들어 생물층 간섭계를 이용하여 평가된다.

단백질 수율의 유용한 측정치는 예를 들어, 배양 부피 당 재조합 단백질의 양(예를 들어, 배양물 1 리터 당 단백질 밀리그램 또는 그램), 세포 용해 후 수득된 불용성 펠렛에서 측정된 재조합 단백질의 백분율 또는 분율(예를 들어, 추출 상등액 내 재조합 단백질의 양/불용성 분획 내 단백질의 양), 활성 단백질의 백분율 또는 분율(예를 들어, 활성 단백질의 양/어세이에 사용된 단백질의 양), 전체 세포 단백질(tcp)의 백분율 또는 분율, 단백질의 양/세포, 및 건조 바이오매스 백분율을 포함한다.

실시양태에서, 본 출원의 방법은 약 20% 내지 약 90% 전체 세포 단백질의 가용성의 관심 폴리펩타이드 또는 단백질의 수율을 수득하기 위해 사용된다. 특정 실시양태에서, 가용성의 관심 폴리펩타이드 또는 단백질의 수율은 약 20% 전체 세포 단백질, 약 25% 전체 세포 단백질, 약 30% 전체 세포 단백질, 약 31% 전체 세포 단백질, 약 32% 전체 세포 단백질, 약 33% 전체 세포 단백질, 약 34% 전체 세포 단백질, 약 35% 전체 세포 단백질, 약 36% 전체 세포 단백질, 약 37% 전체 세포 단백질, 약 38% 전체 세포 단백질, 약 39% 전체 세포 단백질, 약 40% 전체 세포 단백질, 약 41% 전체 세포 단백질, 약 42% 전체 세포 단백질, 약 43% 전체 세포 단백질, 약 44% 전체 세포 단백질, 약 45% 전체 세포 단백질, 약 46% 전체 세포 단백질, 약 47% 전체 세포 단백질, 약 48% 전체 세포 단백질, 약 49% 전체 세포 단백질, 약 50% 전체 세포 단백질, 약 51% 전체 세포 단백질, 약 52% 전체 세포 단백질, 약 53% 전체 세포 단백질, 약 54% 전체 세포 단백질, 약 55% 전체 세포 단백질, 약 56% 전체 세포 단백질, 약 57% 전체 세포 단백질, 약 58% 전체 세포 단백질, 약 59% 전체 세포 단백질, 약 60% 전체 세포 단백질, 약 65% 전체 세포 단백질, 약 70% 전체 세포 단백질, 약 75% 전체 세포 단백질, 약 80% 전체 세포 단백질, 약 85% 전체 세포 단백질, 또는 약 90% 전체 세포 단백질이다. 몇몇 실시양태에서, 가용성의 관심 폴리펩타이드 또는 단백질의 수율은 약 20% 내지 약 25% 전체 세포 단백질, 약 20% 내지 약 30% 전체 세포 단백질, 약 20% 내지 약 35% 전체 세포 단백질, 약 20% 내지 약 40% 전체 세포 단백질, 약 20% 내지 약 45% 전체 세포 단백질, 약 20% 내지 약 50% 전체 세포 단백질, 약 20% 내지 약 55% 전체 세포 단백질, 약 20% 내지 약 60% 전체 세포 단백질, 약 20% 내지 약 65% 전체 세포 단백질, 약 20% 내지 약 70% 전체 세포 단백질, 약 20% 내지 약 75% 전체 세포 단백질, 약 20% 내지 약 80% 전체 세포 단백질, 약 20% 내지 약 85% 전체 세포 단백질, 약 20% 내지 약 90% 전체 세포 단백질, 약 25% 내지 약 90% 전체 세포 단백질, 약 30% 내지 약 90% 전체 세포 단백질, 약 35% 내지 약 90% 전체 세포 단백질, 약 40% 내지 약 90% 전체 세포 단백질, 약 45% 내지 약 90% 전체 세포 단백질, 약 50% 내지 약 90% 전체 세포 단백질, 약 55% 내지 약 90% 전체 세포 단백질, 약 60% 내지 약 90% 전체 세포 단백질, 약 65% 내지 약 90% 전체 세포 단백질, 약 70% 내지 약 90% 전체 세포 단백질, 약 75% 내지 약 90% 전체 세포 단백질, 약 80% 내지 약 90% 전체 세포 단백질, 약 85% 내지 약 90% 전체 세포 단백질, 약 31% 내지 약 60% 전체 세포 단백질, 약 35% 내지 약 60% 전체 세포 단백질, 약 40% 내지 약 60% 전체 세포 단백질, 약 45% 내지 약 60% 전체 세포 단백질, 약 50% 내지 약 60% 전체 세포 단백질, 약 55% 내지 약 60% 전체 세포 단백질, 약 31% 내지 약 55% 전체 세포 단백질, 약 31% 내지 약 50% 전체 세포 단백질, 약 31% 내지 약 45% 전체 세포 단백질, 약 31% 내지 약 40% 전체 세포 단백질, 약 31% 내지 약 35% 전체 세포 단백질, 약 35% 내지 약 55% 전체 세포 단백질, 또는 약 40% 내지 약 50% 전체 세포 단백질이다.

실시양태에서, 본 출원의 방법은 1 리터 당 약 1 그램 내지 1 리터 당 약 50 그램의 가용성의 관심 폴리펩타이드 또는 단백질을 수득하기 위해 사용된다. 특정 실시양태에서, 가용성의 관심 폴리펩타이드 또는 단백질의 수율은 1 리터 당 약 1 그램, 1 리터 당 약 2 그램, 1 리터 당 약 3 그램, 1 리터 당 약 4 그램, 1 리터 당 약 5 그램, 1 리터 당 약 6 그램, 1 리터 당 약 7 그램, 1 리터 당 약 8 그램, 1 리터 당 약 9 그램, 1 리터 당 약 10 그램, 1 리터 당 약 11 그램, 1 리터 당 약 12 그램, 1 리터 당 약 13 그램, 1 리터 당 약 14 그램, 1 리터 당 약 15 그램, 1 리터 당 약 16 그램, 1 리터 당 약 17 그램, 1 리터 당 약 18 그램, 1 리터 당 약 19 그램, 1 리터 당 약 20 그램, 1 리터 당 약 21 그램, 1 리터 당 약 22 그램, 1 리터 당 약 23 그램 1 리터 당 약 24 그램, 1 리터 당 약 25 그램, 1 리터 당 약 26 그램, 1 리터 당 약 27 그램, 1 리터 당 약 28 그램, 1 리터 당 약 30 그램, 1 리터 당 약 35 그램, 1 리터 당 약 40 그램, 1 리터 당 약 45 그램, 1 리터 당 약 50 그램, 1 리터 당 약 1 그램 내지 1 리터 당 약 5 그램, 1 리터 당 약 1 그램 내지 1 리터 당 약 10 그램, 1 리터 당 약 10 그램 내지 1 리터 당 약 12 그램, 1 리터 당 약 10 그램 내지 1 리터 당 약 13 그램, 1 리터 당 약 10 그램 내지 1 리터 당 약 14 그램, 1 리터 당 약 10 그램 내지 1 리터 당 약 15 그램, 1 리터 당 약 10 그램 내지 1 리터 당 약 16 그램, 1 리터 당 약 10 그램 내지 1 리터 당 약 17 그램, 1 리터 당 약 10 그램 내지 1 리터 당 약 18 그램, 1 리터 당 약 10 그램 내지 1 리터 당 약 19 그램, 1 리터 당 약 10 그램 내지 1 리터 당 약 20 그램, 1 리터 당 약 10 그램 내지 1 리터 당 약 21 그램, 1 리터 당 약 10 그램 내지 1 리터 당 약 22 그램, 1 리터 당 약 10 그램 내지 1 리터 당 약 23 그램, 1 리터 당 약 10 그램 내지 1 리터 당 약 24 그램, 1 리터 당 약 10 그램 내지 1 리터 당 약 25 그램, 1 리터 당 약 10 그램 내지 1 리터 당 약 30 그램, 1 리터 당 약 10 그램 내지 1 리터 당 약 40 그램, 1 리터 당 약 10 그램 내지 1 리터 당 약 50 그램, 1 리터 당 약 10 그램 내지 1 리터 당 약 12 그램, 1 리터 당 약 12 그램 내지 1 리터 당 약 14 그램, 1 리터 당 약 14 그램 내지 1 리터 당 약 16 그램, 1 리터 당 약 16 그램 내지 1 리터 당 약 18 그램, 1 리터 당 약 18 그램 내지 1 리터 당 약 20 그램, 1 리터 당 약 20 그램 내지 1 리터 당 약 22 그램, 1 리터 당 약 22 그램 내지 1 리터 당 약 24 그램, 1 리터 당 약 23 그램 내지 1 리터 당 약 25 그램, 1 리터 당 약 10 그램 내지 1 리터 당 약 25 그램, 1 리터 당 약 11 그램 내지 1 리터 당 약 25 그램, 1 리터 당 약 12 그램 내지 1 리터 당 약 25 그램, 1 리터 당 약 13 그램 내지 1 리터 당 약 25 그램, 1 리터 당 약 14 그램 내지 1 리터 당 약 25 그램, 1 리터 당 약 15 그램 내지 1 리터 당 약 25 그램, 1 리터 당 약 16 그램 내지 1 리터 당 약 25 그램, 1 리터 당 약 17 그램 내지 1 리터 당 약 25 그램, 1 리터 당 약 18 그램 내지 1 리터 당 약 25 그램, 1 리터 당 약 19 그램 내지 1 리터 당 약 25 그램, 1 리터 당 약 20 그램 내지 1 리터 당 약 25 그램, 1 리터 당 약 21 그램 내지 1 리터 당 약 25 그램, 1 리터 당 약 22 그램 내지 1 리터 당 약 25 그램, 1 리터 당 약 23 그램 내지 1 리터 당 약 25 그램, 또는 1 리터 당 약 24 그램 내지 1 리터 당 약 25 그램이다. 실시양태에서, 가용성 재조합 단백질 수율은 1 리터 당 약 10 그램 내지 1 리터 당 약 13 그램, 1 리터 당 약 12 그램 내지 1 리터 당 약 14 그램, 1 리터 당 약 13 그램 내지 1 리터 당 약 15 그램, 1 리터 당 약 14 그램 내지 1 리터 당 약 16 그램, 1 리터 당 약 15 그램 내지 1 리터 당 약 17 그램, 1 리터 당 약 16 그램 내지 1 리터 당 약 18 그램, 1 리터 당 약 17 그램 내지 1 리터 당 약 19 그램, 1 리터 당 약 18 그램 내지 1 리터 당 약 20 그램, 1 리터 당 약 20 그램 내지 1 리터 당 약 22 그램, 1 리터 당 약 22 그램 내지 1 리터 당 약 24 그램, 또는 1 리터 당 약 23 그램 내지 1 리터 당 약 25 그램이다. 실시양태에서, 가용성 재조합 단백질 수율은 1 리터 당 약 10 그램 내지 1 리터 당 약 25 그램, 1 리터 당 약 12 그램 내지 1 리터 당 약 24 그램, 1 리터 당 약 14 그램 내지 1 리터 당 약 22 그램, 1 리터 당 약 16 그램 내지 1 리터 당 약 20 그램, 또는 1 리터 당 약 18 그램 내지 1 리터 당 약 20 그램이다. 실시양태에서, 추출된 단백질 수율은 1 리터 당 약 5 그램 내지 1 리터 당 약 15 그램, 1 리터 당 약 5 그램 내지 1 리터 당 약 25 그램, 1 리터 당 약 10 그램 내지 1 리터 당 약 15 그램, 1 리터 당 약 10 그램 내지 1 리터 당 약 25 그램, 1 리터 당 약 15 그램 내지 1 리터 당 약 20 그램, 1 리터 당 약 15 그램 내지 1 리터 당 약 25 그램, 또는 1 리터 당 약 18 그램 내지 1 리터 당 약 25 그램이다.

실시양태에서, 가용성 분획 내에서 검출된 가용성의 관심 폴리펩타이드 또는 단백질의 양은 생산된 전체 가용성의 관심 폴리펩타이드 또는 단백질의 약 10% 내지 약 100%이다. 실시양태에서, 이 양은 생산된 가용성의 관심 폴리펩타이드 또는 단백질의 양의 약 10%, 약 15%, 약 20%, 약 25%, 약 30%, 약 35%, 약 40%, 약 45%, 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95% 또는 약 99%, 또는 약 100%이다. 실시양태에서, 이 양은 생산된 전체 가용성의 관심 폴리펩타이드 또는 단백질의 약 10% 내지 약 20%, 20% 내지 약 50%, 약 25% 내지 약 50%, 약 25% 내지 약 50%, 약 25% 내지 약 95%, 약 30% 내지 약 50%, 약 30% 내지 약 40%, 약 30% 내지 약 60%, 약 30% 내지 약 70%, 약 35% 내지 약 50%, 약 35% 내지 약 70%, 약 35% 내지 약 75%, 약 35% 내지 약 95%, 약 40% 내지 약 50%, 약 40% 내지 약 95%, 약 50% 내지 약 75%, 약 50% 내지 약 95%, 약 70% 내지 약 95%, 또는 약 80 내지 약 100%이다.

몇몇 실시양태에서, 가용성의 관심 폴리펩타이드 또는 단백질은 배양으로 생산된 전체 가용성 단백질의 백분율로서 표현된다. 주어진 세포 밀도에서 가용성의 관심 폴리펩타이드 또는 단백질 중량/세포 배양물의 부피로 표현된 데이터는 전체 세포 단백질 중 재조합 단백질의 백분율로서 표현된 데이터로 전환될 수 있다. 주어진 세포 밀도에서 세포 배양물의 부피 당 전체 세포 단백질의 양을 알고 있는 경우, 부피로 측정된 단백질 수율을 % 전체 세포 단백질로 전환하는 것은 통상의 기술자의 능력 범위 내에 있다. 이러한 수치는 1) 주어진 세포 밀도에서 세포 중량/배양물의 부피, 및 2) 전체 단백질에 의해 포함된 세포 중량의 백분율을 아는 경우 결정될 수 있다. 예를 들어, 1.0의 OD550에서, 이. 콜라이의 건조 세포 중량은 0.5 그램/리터로 보고되어 있다("Production of Heterologous Proteins from Recombinant DNA Escherichia coli in Bench Fermentors," Lin, N.S., and Swartz, J.R., 1992, METHODS: A Companion to Methods in Enzymology 4: 159-168). 박테리아 세포는 다당류, 지질, 및 핵산뿐만 아니라 단백질로 구성되어 있다. 이. 콜라이 세포는 이. 콜라이 세포의 52.4 중량%를 구성하는 단백질을 추산하는 Da Silva, N.A., et al., 1986, "Growth Yield Estimates for Recombinant Cells," Biotechnology and Bioengineering, Vol. XXVIII: 741-746, 및 55%의 건조 세포 중량으로서 이. 콜라이 내의 단백질 함량을 보고하는 "Escherichia coli and Salmonella typhimurium Cellular and Molecular Biology," 1987, Ed. in Chief Frederick C. Neidhardt, Vol. 1, pp. 3-6을 포함하지만, 이들로 한정되는 것은 아닌 참고 문헌에 의해 단백질이 약 52.4 내지 55%인 것으로 보고된다. 상기 측정값(즉, 0.5 그램/리터의 건조 세포 중량 및 55% 세포 중량으로서의 단백질)을 이용하면, 이. 콜라이의 경우 1.0의 A550에서 세포 배양물 부피 당 전체 세포 단백질의 양은 275 μg 전체 세포 단백질/ml/A550로 계산된다. 습윤 세포 중량에 기초한 세포 배양물의 부피 당 전체 세포 단백질의 계산은 예를 들어 이. 콜라이의 경우 1.0의 A600은 1.7 그램/리터의 습윤 세포 중량 및 0.39 그램/리터의 건조 세포 중량을 초래한다는 Glazyrina, et al. (Microbial Cell Factories 2010, 9:42, 본 출원에 참고로 인용됨)을 이용할 수 있다. 예를 들어, 이러한 습윤 세포 중량 대 건조 세포 중량 비교 및 상기한 바와 같은 55% 건조 세포 중량으로서의 단백질을 이용하면, 이. 콜라이의 경우 1.0의 A600에서 세포 배양물의 부피 당 전체 세포 단백질의 양은 215 μg 전체 세포 단백질/ml/A600로 계산될 수 있다. 슈도모나스 플루오레센스의 경우, 주어진 세포 밀도에서 세포 배양물의 부피 당 전체 세포 단백질의 양은 이. 콜라이의 경우에 확인된 것과 유사하다. 이. 콜라이와 같이 피. 플루오레센스는 그람 음성의 막대 모양의 박테리아이다. Edwards, et al., 1972, "Culture of Pseudomonas fluorescens with Sodium Maleate as a Carbon Source, "Biotechnology and Bioengineering, Vol. XIV, pages 123-147에 의해 보고된 바와 같이, 피. 플루오레센스 ATCC 11150의 건조 세포 중량은 0.5 그램/리터/A500이다. 이는 1.0의 A550에서 이. 콜라이의 경우 Lin, et al.에 의해 보고된 동일한 중량이다. 500 nm 및 550 nm에서 이루어진 빛 산란 측정값은 매우 유사한 것으로 예상된다. 피. 플루오레센스 HK44에 대해 전체 세포 단백질에 의해 포함된 세포 중량의 백분율은 예를 들어 Yarwood, et al., July 2002, "Quantitative Measurement of Bacterial Growth in Porous Media under Unsaturated-Flow Conditions, Applied and Environmental Microbiology 68(7): 3597-3605"에 의해 55%로서 기재된다. 이러한 백분율은 상기한 참고문헌에 의해 이. 콜라이의 경우에 제시된 것과 유사 또는 동일하다.

실시양태에서, 가용성의 관심 폴리펩타이드 또는 단백질의 양은 배양으로 생산된 전체 가용성 단백질의 약 0.1% 내지 약 95%이다. 실시양태에서, 이러한 양은 배양으로 생산된 전체 가용성 단백질의 약 0.1%, 0.5%, 1%, 5%, 10%, 15%, 20%, 25%, 30%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 초과이다. 실시양태에서, 이러한 양은 배양으로 생산된 전체 가용성 단백질의 약 0.1%, 0.5%, 1%, 5%, 10%, 15%, 20%, 25%, 30%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%이다. 실시양태에서, 이러한 양은 배양으로 생산된 전체 가용성 단백질의 약 5% 내지 약 95%, 약 10% 내지 약 85%, 약 20% 내지 약 75%, 약 30% 내지 약 65%, 약 40% 내지 약 55%, 약 1% 내지 약 95%, 약 5% 내지 약 30%, 약 1% 내지 약 10%, 약 10% 내지 약 20%, 약 20% 내지 약 30%, 약 30% 내지 약 40%, 약 40% 내지 약 50%, 약 50 내지 약 60%, 약 60% 내지 약 70%, 또는 약 80% 내지 약 90%이다.

실시양태에서, 생산된 가용성의 관심 폴리펩타이드 또는 단백질의 양은 건조 세포 중량(DCW)의 약 0.1% 내지 약 50%이다. 실시양태에서, 이러한 양은 약 0.1%, 0.5%, 1%, 5%, 10%, 15%, 20%, 25%, 30%, 40%, 45%, 또는 50% 초과이다. 실시양태에서, 이러한 양은 DCW의 약 0.1%, 0.5%, 1%, 5%, 10%, 15%, 20%, 25%, 30%, 40%, 45%, 또는 50%이다. 실시양태에서, 이러한 양은 배양으로 생산된 전체 가용성 단백질의 약 5% 내지 약 50%, 약 10% 내지 약 40%, 약 20% 내지 약 30%, 약 1% 내지 약 20%, 약 5% 내지 약 25%, 약 1% 내지 약 10%, 약 10% 내지 약 20%, 약 20% 내지 약 30%, 약 30% 내지 약 40%, 또는 약 40% 내지 약 50%이다.

실시양태에서, 본 발명의 방법을 이용하여 생산된 분비 리더와 이종성인 가용성의 관심 폴리펩타이드 또는 단백질은, 실질적으로 유사한 조건, 예를 들어 숙주 세포를 포함하는 성장 조건 하에서 생산되는 경우, 분비 리더 태생인 단백질의 양을 초과한다. 실시양태에서, 본 발명에 따른 AnsB, 8484, 또는 5193 분비 리더에 작동 가능하게 연결된 가용성의 관심 폴리펩타이드 또는 단백질은 각각의 리더 태생인 단백질의 양을 초과하는 양으로 생산된다. 실시양태에서, AnsB, 8484, 또는 5193 분비 리더에 작동 가능하게 연결된 가용성의 이종성 관심 폴리펩타이드 또는 단백질은 실질적으로 유사한 조건 하에서 생산된 리더 태생인 단백질의 양보다 약 1.2배 내지 약 5배 초과, 약 1.2배 내지 약 2.5배, 약 1.2배 내지 약 2배, 약 1.2배 내지 약 1.5배, 약 1.4배 내지 약 3배 초과, 약 1.4배 내지 약 2.5배, 약 1.4배 내지 약 2배, 약 1.5배 내지 약 3배, 약 1.5배 내지 약 2.5배, 약 1.5배 내지 약 2배, 약 2배 내지 약 3배, 약 1.2배, 약 1.3배, 약 1.4배, 약 1.5배, 약 1.6배, 약 1.7배, 약 1.8배, 약 1.9배, 약 2배, 약 2.5배, 약 3배, 약 4배, 또는 약 5배 초과인 수율로 생산된다.

실시양태에서, 본 발명의 방법을 이용하여 생산된 분비 리더에 작동 가능하게 연결된 가용성의 관심 폴리펩타이드 또는 단백질의 양은, 실질적으로 유사한 조건, 예를 들어 성장 조건 하에서 생산되는 경우, 분비 리더 없이 또는 상이한 분비 리더를 이용하여 생산된 관심 폴리펩타이드 또는 단백질의 양을 초과한다. 성장 조건은, 예를 들어 사용된 배양 배지 및 숙주 세포를 포함할 수 있다. 실시양태에서, 본 발명에 따른 AnsB, 8484, 또는 5193 분비 리더에 작동 가능하게 연결된 가용성의 이종성 관심 폴리펩타이드 또는 단백질은 분비 리더 없이 또는 상이한 분비 리더를 이용하여 생산된 관심 폴리펩타이드 또는 단백질의 양을 초과하는 양으로 생산된다. 실시양태에서, AnsB, 8484, 또는 5193 분비 리더에 작동 가능하게 연결된 가용성의 이종성 관심 폴리펩타이드 또는 단백질은 실질적으로 유사한 조건 하에서 분비 리더 없이 또는 상이한 분비 리더를 이용하여 생산된 단백질의 양보다 약 1.2배 내지 약 20배 초과, 약 1.2배 내지 약 2.5배, 약 1.2배 내지 약 2배, 약 1.2배 내지 약 1.5배, 약 1.4배 내지 약 3배 초과, 약 1.4배 내지 약 2.5배, 약 1.4배 내지 약 2배, 약 1.5배 내지 약 3배, 약 1.5배 내지 약 2.5배, 약 1.5배 내지 약 2배, 약 2배 내지 약 5배, 약 2배 내지 약 10배, 약 5배 내지 약 15배, 약 10배 내지 약 20배, 약 1.2배, 약 1.3배, 약 1.4배, 약 1.5배, 약 1.6배, 약 1.7배, 약 1.8배, 약 1.9배, 약 2배, 약 2.5배, 약 3배, 약 4배, 약 5배 초과, 약 10배 초과, 약 15배 초과, 또는 약 20배 초과인 수율로 생산된다.

용해도 및 활성

양과 관련되어 있지만 단백질의 "용해도" 및 "활성"은 일반적으로 상이한 수단에 의해 결정된다. 단백질, 특히 소수성 단백질의 용해도는 소수성 아미노산 잔기가 폴딩된 단백질의 외부에 부적절하게 위치됨을 나타낸다. 상이한 방법, 예를 들어 후술하는 바와 같은 방법을 이용하여 종종 평가되는 단백질 활성은 적절한 단백질 형태의 다른 지표이다. 본 출원에 사용된 바와 같이 "가용성, 활성, 또는 둘 다"는 당해 기술분야의 통상의 기술자에게 공지된 방법에 의해 가용성, 활성, 또는 가용성 및 활성 둘 다로 결정된 단백질을 의미한다.

활성 어세이

관심 펩타이드, 폴리펩타이드 또는 단백질의 활성을 평가하기 위한 어세이는 당해 기술분야에 공지되어 있고, 형광측정, 비색측정, 화학발광, 분광광도측정, 및 당해 기술분야의 통상의 기술자가 이용할 수 있는 다른 효소 어세이를 포함하나, 이들로 한정되는 것은 아니다. 이들 어세이는 펩타이드, 폴리펩타이드 또는 단백질의 상업적인 또는 다른 제조물에 대해 관심 펩타이드, 폴리펩타이드 또는 단백질의 활성을 비교하기 위해 사용된다.

실시양태에서, 활성은 어세이된 총량과 비교하여 추출 상등액 중 활성 단백질의 백분율에 의해 표현된다. 이는 어세이에 사용된 단백질의 총량에 대한 어세이에 의해 활성으로 결정된 단백질의 양에 기초한다. 다른 실시양태에서, 활성은 표준, 예를 들어 천연 단백질과 비교한 단백질의 활성 레벨 %에 의해 표현된다. 이는 표준 샘플 중 활성 단백질의 양에 대한 상등액 추출 샘플 중 활성 단백질의 양에 기초한다(각각의 샘플로부터 동일한 양의 단백질이 어세이에 사용되는 경우).

실시양태에서, 관심 펩타이드, 폴리펩타이드 또는 단백질의 약 40% 내지 약 100%는 활성인 것으로 결정된다. 실시양태에서, 관심 펩타이드, 폴리펩타이드 또는 단백질의 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90%, 또는 약 100%는 활성인 것으로 결정된다. 실시양태에서, 관심 펩타이드, 폴리펩타이드 또는 단백질의 약 40% 내지 약 50%, 약 50% 내지 약 60%, 약 60% 내지 약 70%, 약 70% 내지 약 80%, 약 80% 내지 약 90%, 약 90% 내지 약 100%, 약 50% 내지 약 100%, 약 60% 내지 약 100%, 약 70% 내지 약 100%, 약 80% 내지 약 100%, 약 40% 내지 약 90%, 약 40% 내지 약 95%, 약 50% 내지 약 90%, 약 50% 내지 약 95%, 약 50% 내지 약 100%, 약 60% 내지 약 90%, 약 60% 내지 약 95%, 약 60% 내지 약 100%, 약 70% 내지 약 90%, 약 70% 내지 약 95%, 약 70% 내지 약 100%, 또는 약 70% 내지 약 100%는 활성인 것으로 결정된다.

다른 실시양태에서, 관심 펩타이드, 폴리펩타이드 또는 단백질의 약 75% 내지 약 100%는 활성인 것으로 결정된다. 실시양태에서, 관심 펩타이드, 폴리펩타이드 또는 단백질의 약 75% 내지 약 80%, 약 75% 내지 약 85%, 약 75% 내지 약 90%, 약 75% 내지 약 95%, 약 80% 내지 약 85%, 약 80% 내지 약 90%, 약 80% 내지 약 95%, 약 80% 내지 약 100%, 약 85% 내지 약 90%, 약 85% 내지 약 95%, 약 85% 내지 약 100%, 약 90% 내지 약 95%, 약 90% 내지 약 100%, 또는 약 95% 내지 약 100% 는 활성인 것으로 결정된다.

관심 단백질(POI)

본 출원의 방법 및 조성물은 세포 발현 시스템에서 높은 수준의 적절하게 프로세싱된 관심 재조합 단백질 또는 폴리펩타이드를 생산하는데 유용하다. 실시양태에서, 관심 단백질 또는 폴리펩타이드(본 출원에서 "타겟 단백질" 또는 "타겟 폴리펩타이드"로도 언급됨)는 임의의 종 및 임의 크기의 것일 수 있다. 특정 실시양태에서, 관심 단백질 또는 폴리펩타이드는 치료적으로 유용한 단백질 또는 폴리펩타이드이다. 몇몇 실시양태에서, 단백질은 포유류 단백질, 예를 들어 인간 단백질, 예를 들어 성장 인자, 사이토카인, 케모카인 또는 혈액 단백질일 수 있다. 실시양태에서, 관심 단백질 또는 폴리펩타이드는 참조 단백질 또는 폴리펩타이드와 유사한 방식으로 프로세싱된다. 특정 실시양태에서, 단백질 또는 폴리펩타이드는 코딩 서열 내에 분비 신호를 포함하지 않는다. 실시양태에서, 관심 단백질 또는 폴리펩타이드는 크기가 100 kD 미만, 50 kD 미만, 또는 30 kD 미만이다. 실시양태에서, 관심 단백질 또는 폴리펩타이드는 적어도 약 5개, 10개, 15개, 20개, 30개, 40개, 50개 또는 100개의 아미노산으로 구성된다.

분자 유전학 및 유전 공학 기술에 필요한 광범위한 서열 정보는 널리 공개적으로 입수 가능하다. 포유류, 뿐만 아니라 인간의 완전한 뉴클레오타이드 서열, 유전자, cDNA 서열, 아미노산 서열 및 게놈에 대한 액세스는 GenBank로부터 웹사이트 www.ncbi.nlm.nih.gov/Entrez에서 얻을 수 있다. 또한, 추가적인 정보는 유전자 및 이의 생성물 및 생물의학 용도에 관한 정보가 통합되어 있는 전자 백과사전인 Weizmann Institute of Science Genome and Bioinformatics의 GeneCards로부터 얻을 수 있고, 또한 뉴클레오타이드 서열 정보는 EMBL Nucleotide Sequence Database 또는 DNA Databank of Japan으로부터 얻을 수 있으며; 아미노산 서열에 관한 정보에 대한 추가적인 사이트는 Georgetown의 단백질 정보 리소스 웹사이트 및 Swiss-Prot을 포함한다.

본 출원의 조성물 및 방법으로 발현될 수 있는 단백질의 예는, 예를 들어 레닌, 인간 성장 호르몬, 소 성장 호르몬을 포함하는 성장 호르몬; 성장 호르몬 방출 인자; 부갑상선 호르몬; 갑상선 자극 호르몬; 지단백질; α-1-항트립신; 인슐린 A-사슬; 인슐린 B-사슬; 프로인슐린; 트롬보포이에틴; 난포 자극 호르몬; 칼시토닌; 황체형성 호르몬; 글루카곤; 응고 인자, 예를 들어 VIIIC 인자, IX 인자, 조직 인자, 및 폰 빌레브란트 인자; 항-응고 인자, 예를 들어 단백질 C; 심방 나트륨이뇨 인자; 폐 계면활성제; 플리스미노겐 활성화제, 예를 들어 유로키나제 또는 인간 소변 또는 조직 타입 플라스미노겐 활성화제(t-PA); 봄베신; 트롬빈; 조혈 성장 인자; 종양 괴사 인자-알파 및 -베타; 엔케팔리나아제; 혈청 알부민, 예를 들어 인간 혈청 알부민; 뮬러관 억제 물질; 릴랙신 A-사슬; 릴랙신 B-사슬; 프로릴랙신; 마우스 고나도트로핀-관련 폴리펩타이드; 미생물 단백질, 예를 들어 베타-락타마아제; DNase; 인히빈; 액티빈; 혈관 내피 성장 인자(VEGF); 호르몬 또는 성장 인자에 대한 수용체; 인테그린; 단백질 A 또는 D; 류머티스 인자; 향신경 인자, 예를 들어 뇌-유래 향신경 인자(BDNF), 뉴로트로핀-3, -4, -5, 또는 -6(NT-3, NT-4, NT-5, 또는 NT-6), 또는 신경 성장 인자, 예를 들어 NGF-β; 카디오트로핀(심장 비대 인자), 예를 들어 카디오트로핀-1(CT-1); 혈소판-유래 성장 인자(PDGF); 섬유모세포 성장 인자, 예를 들어 aFGF 및 bFGF; 표피 성장 인자(EGF); 전환 성장 인자(TGF), 예를 들어 TGF-알파 및 TGF-β(TGF-β1, TGF-β2, TGF-β3, TGF-β4, 또는 TGF-β5 포함); 인슐린 유사 성장 인자-I 및 -II(IGF-I 및 IGFII); des(1-3)-IGF-I(대뇌 IGF-I), 인슐린 유사 성장인자 결합 단백질; CD 단백질, 예를 들어 CD-3, CD-4, CD-8, 및 CD-19; 에리트로포이에틴; 골유도성 인자; 면역독소; 골 형태형성 단백질(BMP); 인터페론, 예를 들어 인터페론-알파, -베타 및 -감마; 콜로니 자극 인자(CSF), 예를 들어 M-CSF, GM-CSF, 및 G-CSF; 인터루킨(IL), 예를 들어 IL-1 내지 IL-10; 항-HER-2 항체; 과산화물 디스뮤타제; T-세포 수용체; 표면 막 단백질; 붕괴(decay) 가속화 인자; 바이러스 항원, 예를 들어 AIDS 외피의 일부분; 운송 단백질; 귀소(homing) 수용체; 어드레신; 조절 단백질; 항체; 및 상기 목록화된 폴리펩타이드들 중 임의의 폴리펩타이드의 단편과 같은 분자를 포함하나, 이들로 한정되는 것은 아니다.

특정 실시양태에서, 단백질 또는 폴리펩타이드는 IL-1, IL-1a, IL-1b, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12, IL-12 엘라스티(elasti), IL-13, IL-15, EL-16, IL-18, IL-18BPa, IL-23, IL-24, VIP, 에리트로포이에틴, GM-CSF, G-CSF, M-CSF, 혈소판 유래 성장인자(PDGF), MSF, FLT-3 리간드, EGF, 섬유모세포 성장인자(FGF; 예를 들어, α-FGF(FGF-1), β-FGF(FGF-2), FGF-3, FGF-4, FGF-5, FGF-6, 또는 FGF-7), 인슐린 유사 성장인자(예를 들어, IGF-1, IGF-2); 종양 괴사 인자(예를 들어, TNF, 림프독소), 신경 성장인자(예를 들어, NGF), 혈관 내피 성장 인자(VEGF); 인터페론(예를 들어, IFN-α, IFN-β, IFN-γ); 백혈병 억제 인자(LIF); 섬모 향신경 인자(CNTF); 옹코스타틴 M; 줄기 세포 인자(SCF); 전환 성장 인자(예를 들어, TGF-α, TGF-β1, TGF-β2, TGF-β3); TNF 수퍼패밀리(예를 들어, LIGHT/TNFSF14, STALL-1/TNFSF13B(BLy5, BAFF, THANK), TNF알파/TNFSF2 및 TWEAK/TNFSF12); 또는 케모카인(BCA-1/BLC-1, BRAK/Kec, CXCL16, CXCR3, ENA-78/LIX, 이오탁신(Eotaxin)-1, 이오탁신-2/MPIF-2, 엑소더스(Exodus)-2/SLC, 프락탈킨(Fractalkine)/뉴로탁틴(Neurotactin), GRO알파/MGSA, HCC-1, I-TAC, 림포탁틴(Lymphotactin)/ATAC/SCM, MCP-1/MCAF, MCP-3, MCP-4, MDC/STCP-1/ABCD-1, MIP-1쿼드러츄어(quadrature), MIP-2쿼드러츄어./GRO쿼드러츄어., MIP-3쿼드러츄어./엑소더스/LARC, MIP-3/엑소더스-3/ELC, MIP-4/PARC/DC-CK1, PF-4, RANTES, SDF1, TARC, TECK 또는 톡신(예를 들어, ω-아가톡신, μ-아가톡신, 아이톡신, 알로푸밀로톡신 267A, ω-아트라코톡신-HV1, δ-아트라코톡신-Hv1b, 바트라코톡신, 보토세틴, 아레노부파긴, 부포탈린, 부포테닌, 시노부파긴, 마리노부파긴, 분가로톡신, 칼시루딘, 칼시스프틴, 카르디오톡신 III, 카트로콜라스타틴 C, 카리브도톡신, 코브라 베놈 사이토톡신, 코노톡신, 에치노이딘, 엘레도이신, 에피바티딘, 피브롤라아제, 헤푸톡신, 히스트리오니코톡신, 후웬톡신 I, 후웬톡신 II, J-ACTX-Hv1c 쿠니츠 타입 톡신, 덴트로톡신 K, 덴드로톡신 1, 라트로톡신, 마르가톡신, 마우로톡신, 온치달, PhTx3, 푸밀로톡신 251D, 방울뱀 렉틴, 로버스톡신, 삭시톡신, 스킬라톡신, 슬로톡신, 스트로마톡신, 타이카톡신, 타리카톡신, 테트로도톡신, 리신, 겔로닌, 아플라톡신, 아마톡신, 시트리린, 사이토칼라신, 에르고타민, 푸마길린, 푸모니신, 글리오톡신, 헬볼산, 이토텐산, 무스키몰, 오크라톡신, 파툴린, 스테리그마토시스스틴, 트리코테센, 보미톡신, 제라놀, 제아랄레논, 안트락스 톡신, 아데닐레이트 보호 항원 사이클라아제, rPA, 크라이 톡신, 보르데텔라 페르투시스(Bordetella pertussis) 톡신, 클로스트리디움 보툴리눔(Clostridium botulinum) 톡신, 클로스트리디움 디피실레(Clostridium difficile) 톡신, 클로스트리디움 페르프린겐스(Clostridium perfringens) 톡신, 파상풍 톡신, 디프테리아 톡신, 베로톡신/시가 유사 톡신, 열 안정성 엔도톡신, 열 불안정성 엔데로톡신, 엔테로톡신, 리스테리올라이신 O, 마이코박테리움 투베르쿨로시스(Mycobacterium tuberculosis) 코드 팩터, 슈도모나스 엑소톡신, 살모넬라(Salmonella) 엔도톡신, 살모넬라 엑소톡신, 시가 톡신, 스타필로콕커스 아우레우스(Staphylococcus aureus) 알파 톡신, 스타필로콕커스 아우레우스 베타 톡신, 스타필로콕커스 아우레우스 델타 톡신, 엑스폴리아틴 톡신, 독성 쇼크 증후군 톡신, 엔테로톡신, 류코시딘, 스트렙토라이신, 또는 콜레라 톡신)으로부터 선택된다.

한 실시양태에서, 관심 단백질은 멀티-서브유닛 단백질 또는 폴리펩타이드이다. 발현되는 멀티서브유닛 단백질은 호모머성(homomeric) 및 헤테로머성(heteromeric) 단백질을 포함한다. 멀티서브유닛 단백질은 동일하거나 상이할 수 있는 2개 이상의 서브유닛을 포함할 수 있다. 예를 들어, 단백질은 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개 또는 그 초과의 서브유닛을 포함하는 호모머성 단백질일 수 있다. 또한, 단백질은 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개 또는 그 초과 서브유닛을 포함하는 헤테로머성 단백질일 수 있다. 예시적인 멀티서브유닛 단백질은 수용체(이온 채널 수용체 포함); 세포외 매트릭스 단백질(콘드로이틴 포함); 콜라겐; MHC 단백질, 완전 사슬 항체, 및 항체 단편 포함을 포함하는 면역조절인자; RNA 폴리머라아제 및 DNA 폴리머라아제를 포함하는 효소; 및 막 단백질을 포함한다.

다른 실시양태에서, 관심 단백질은 종종 혈액 단백질일 수 있다. 이러한 실시양태에서 발현되는 혈액 단백질은 캐리어 단백질, 예를 들어 인간 및 소 알부민을 포함하는 알부민, 트랜스페린, 재조합 트랜스페린 반-분자, 햅토글로빈, 피브리노겐 및 다른 응고 인자, 보체 성분, 면역글로불린, 효소 억제제, 안지오텐신 및 브라디키닌과 같은 물질의 전구체, 인슐린, 엔도텔린, 및 알파, 베타 및 감마-글로불린을 포함하는 글로불린, 및 포유동물의 혈액에서 주로 발견되는 다른 타입의 단백질, 폴리펩타이드 및 이들의 단편을 포함하나, 이들로 한정되는 것을 아니다. 인간 혈청 알부민(Lawn, L. M., et al., 1981, Nucleic Acids Research, 9:6103-6114) 및 인간 혈청 트랜스페린(Yang, F, et al., 1984, Proc. Natl. Acad. Sci. USA 81:2752- 2756)에 대한 아미노산 서열을 포함하여, 수많은 혈액 단백질에 대한 아미노산 서열이 보고되어 있다(참조: S. S. Baldwin, 1993, Comp. Biochem. Physiol. 106b:203-218).

다른 실시양태에서, 관심 단백질은 종종 재조합 효소 또는 보조인자일 수 있다. 이러한 실시양태에서 발현된 효소 및 보조인자는 알돌라아제, 아민 옥시다아제, 아미노산 옥시다아제, 아스파르타아제, B12 의존성 효소, 카르복시펩티다아제, 카르복시에스테라아제, 카르복실라아제, 케모트립신, CoA 요구 효소, 시아노히드린 신테타아제, 시스타치온 신테타아제, 데카르복실라아제, 데하이드로게나아제, 알코올 데하이드로게나아제, 데히드라타아제, 디아포라아제, 디옥시게나아제, 에노에이트 리덕타아제, 에폭시드 하이드라아제, 푸머라아제, 갈락토오스 옥시다아제, 글루코오스 아이소머라아제, 글루코오스 옥시다아제, 글리코실트랜스퍼라아제, 메틸트랜스퍼라아제, 니트릴히드라아제, 뉴클레오시드 포스포릴라아제, 옥시도리덕타아제, 옥시니틸라아제, 펩티다아제, 글리코실트랜스퍼라아제, 퍼옥시다아제, 및 치료적으로 활성인 폴리펩타이드에 융합된 효소; 유로키나아제, 렙틸라아제, 스트렙토키나아제; 카탈라아제, 퍼옥사이드 디스뮤타아제; DNase, 아미노산 히드롤라아제(예를 들어, 아스파라기나아제, 아미도히드롤라아제); 카르복시펩티다아제; 프로테아제, 트립신, 펩신, 키모트립신, 파파인, 브로멜라인, 콜라게나아제; 뉴라미니다아제; 락타아제, 말타아제, 수크라아제, 및 아라비노푸라노시다아제를 포함하지만, 이들로 한정되는 것은 아니다.

다른 실시양태에서, 관심 단백질은 종종 항체 또는 항체 유도체이다. 실시양태에서, 항체 또는 항체 유도체는 인간화 항체, 변형된 항체, 단일 도메인 항체(예를 들어, 나노바디, 샤크 단일 도메인 IgNAR 또는 VNAR 항체, 카멜리드 단일 도메인 항체), 이종 특이성 항체, 3가 항체, 이중 특이성 항체(예를 들어, BiTE 분자), 단일 사슬 항체, Fab, Fab 단편, 선형 항체, 디아바디, 전체 사슬 항체 또는 이의 단편 또는 일부분이다. 단일 사슬 항체는 종종 안정적으로 폴딩된 단일 폴리펩타이드 사슬 상의 항체의 항원 결합 영역을 포함한다. Fab 단편은 종종 특정 항체의 조각이다. 통상 Fab 단편은 항원 결합 부위를 함유한다. Fab 단편은 종종 경쇄 및 중쇄 단편인 2개의 사슬을 함유한다. 이들 단편들은 링커 또는 다이설파이드 결합에 의해 연결된다. 본 발명의 방법에 유용한 항체 및 항체 유도체는 당해 기술분야에 공지되어 있고, 문헌, 예를 들어 본 출원의 다른 곳에서 참고로 인용된 미국 특허 제9,580,719호의 표 9에 기재되어 있다.

관심 단백질 또는 폴리펩타이드에 대한 코딩 서열은 입수 가능한 경우 타겟 폴리펩타이드에 대한 천연 코딩 서열일 수 있지만, 더욱 바람직하게는, 예를 들어, 슈도모나스 플루오레센스와 같은 슈도모나스 종 또는 기타 적절한 유기체의 코돈 사용 경향을 반영하도록 유전자를 합성함으로써, 선택된 숙주 세포에서 사용하기 위해 선택, 개선, 또는 최적화된 코딩 서열일 것이다. 결과적인 유전자(들)는 하나 이상의 벡터 내에 구축되거나, 또는 벡터 내로 삽입될 것이고, 그 후 벡터가 발현 숙주 세포 내로 형질전환될 것이다. "발현 가능한 형태"로 제공되는 것으로 언급되는 핵산 또는 폴리뉴클레오타이드는 선택된 발현 숙주 세포에 의해 발현될 수 있는 하나 이상의 유전자를 함유하는 핵산 또는 폴리뉴클레오타이드를 의미한다.

특정 실시양태에서, 관심 단백질은 천연 단백질, 예를 들어 천연 포유류 또는 인간 단백질이거나, 또는 이에 대해 실질적으로 상동성이다. 이들 실시양태에서, 단백질은 콘카타머(concatamer) 형태로 발견되지 않고, 분비 신호, 및 경우에 따라 정제 및/또는 인식을 위한 태그에만 연결된다.

다른 실시양태에서, 관심 단백질은 약 20℃ 내지 약 42℃의 온도에서 활성인 단백질이다. 한 실시양태에서, 단백질은 생리학적 온도에서 활성이고, 고온 또는 극한 온도, 예를 들어 65℃를 초과하는 온도로 가열되는 경우 불활성화된다.

한 실시양태에서, 관심 단백질은 약 20℃ 내지 약 42℃의 온도에서 활성이고/이거나 고온 또는 극한 온도, 예를 들어 65℃를 초과하는 온도로 가열되는 경우 불활성화되는 단백질이고; 천연 단백질, 예를 들어 천연 포유류 또는 인간 단백질이거나 이에 대해 상동성이며, 콘카타머 형태로 핵산으로부터 발현되지 않고; 프로모터는 슈도모나스 플루오레센스에서의 천연 프로모터가 아니고 다른 유기체, 예를 들어 이. 콜라이으로부터 유래된다.

다른 실시양태에서, 단백질은, 생산되는 경우, 추가적인 타겟팅 서열, 예를 들어 단백질을 세포외 배지로 타겟팅하는 서열을 또한 포함한다. 한 실시양태에서, 추가적인 타겟팅 서열은 단백질의 카르복시 말단에 작동 가능하게 연결된다. 다른 실시양태에서, 단백질은 오토트랜스포터, 2-파트너 분비 시스템, 메인 터미널 브랜치 시스템 또는 핌브리알 어셔 포린에 대한 분비 신호를 포함한다.

하기 실시예는 예시를 위해 제공되는 것이지 제한을 위해 제공되는 것은 아니다.

실시예

하기 실시예는 본 개시내용의 다양한 실시양태를 예시하기 위한 목적으로 제공되는 것이며, 어떤 형태로든 본 개시내용을 제한하려는 의도는 없다. 본 출원에 기재된 방법과 함께 본 실시예는 현재의 대표적이 실시양태이고, 예시이며, 범위에 대한 제한으로서 의도되지 않는다. 청구범위에 의해 한정되는 바와 같은 개시내용의 사상의 범위 내에 포함되는 변경 및 다른 사용은 당해 기술분야의 통상의 기술자에게 가능할 것이다.

실시예 1: 단백질 발현 분석

3개의 상이한 재조합 단백질의 가용성 발현을 유도하기 위한 3가지 피. 플루오레센스 분비 리더, AnsB, 8484, 및 5193 각각의 효율은 0.5 mL 배양 규모에서 평가되었다.

각각의 분비 리더 코딩 서열은 이. 콜라이 K-12 티오레독신 1(Trx-1 또는 TrxA, 11.9 kDa), Gal2 단일 사슬 항체(gal2 scFv, 29.6 kDa) 및 바실러스 안트라시스(Bacillus anthracis) 돌연변이체 재조합 보호성 항원(mrPA, 83.7 kDa)을 코딩하는 유전자와 함께 프레임내 융합되었다. 이들 컨스트럭트로부터의 단백질 발현은 동일한 재조합 단백질 각각에 융합된 Pbp 분비 리더 코딩 서열을 보유하는 컨스트럭트로부터의 발현뿐만 아니라 각각의 단백질의 세포질 발현을 위해 구축된 균주와 비교되었다. 세포질 발현 균주 컨스트럭트는 TrxA, Gal2 또는 mrPA 코딩 서열에 융합된, 알라닌을 수반하는 개시자 메티오닌을 코딩하였다. 플라스미드 컨스트럭트는 피. 플루오레센스 균주 DC454 내로 형질전환되었고, 포지티브 클론을 분리하기 위해 선택 배지(M9 글루코오스)에서 성장되었다. 본 테스트의 결과는 하기 표 6에 나타낸다. 예시적인 SDS-CGE 이미지는 도 1(TrxA), 도 2(Gal2 scFv), 및 도 3(mrPA)에 나타낸다.

각각의 균주는 미네랄 염 배지에서 24 시간 동안 3회 성장시켰고, 이어서 IPTG를 이용하여 유도하고, 추가로 24 시간 동안 항온처리되었다. 브로스는 수집되고, PBS로 3배 희석되고, 초음파 처리되고, 원심분리되었다. 상등액은 가용성 단백질 분획으로서 수집되었고, SDS-CGE(Caliper LabChip^® GXII 시스템)에 의해 분석되었다. 유도된 밴드는 시스템 내부 래더와 비교하여 정량되었다. Gal2 scFv 및 mrPA 단백질은 AnsB, 8484 및 5193 리더에 융합되는 경우 더 높은 레벨로 발현되었지만, 상기 단백질들이 세포질로 타겟팅된 경우 Gal2 또는 mrPA의 발현은 검출되지 않았다.

실시예 2: 96웰 포맷에서 크리산타스파아제 단계(Tier) 1 발현 플라스미드 스크리닝

또한, 에르위니아(Erwinia) 타입 II L-아스파라기나아제(크리산타스파아제)-리더 융합 컨스트럭트가 평가되었다.

발현 플라스미드 스크리닝을 위해, 최적화된 크리산타스파아제 단백질 코딩 서열은 피. 플루오레센스에서의 발현을 위해 디자인되고 합성되었다, 크리산타스파아제 펩타이드 서열을 코딩하는 DNA(도 4, 서열 번호 7로서 기재된 아미노산 서열 및 서열 번호 8로서 기재된 핵산 서열)는 피. 플루오레센스를 위한 적합한 코돈 용법을 반영하도록 디자인되었다. 독특한 제한 효소 부위(SapI 또는 LguI)를 함유하는 DNA 영역은 발현 벡터 내에 존재하는 분비 리더 코딩 서열과 함께 프레임 내에 직접 융합을 위해 디자인된 크리산타스파아제 코딩 서열의 상류에 첨가되었다. 3개의 종결 코돈 및 독특한 제한 효소 부위(SapI)를 함유하는 DNA 영역은 코딩 서열의 하류에 첨가되었다. 37개의 상이한 피. 플루오레센스 분비 리더에 융합된 최적화된 크리산타스파아제 유전자 및 2가지의 리보좀 결합 부위(RBS) 친화도를 보유하는 플라스미드가 구축되었다(표 7). 추가의 플라스미드는 세포의 세포질 내에 크리산타스파아제 단백질을 국부화하기 위해 주변세포질 리더 없이 크리산타스파아제 단백질을 발현하도록 구축되었다. 타겟의 발현은 Ptac 프로모터로부터 구동되었고, 번역은 고 활성 리보좀 결합 부위(RBS)로부터 개시되었다. 생성된 40개의 플라스미드는 단계(tier) 1(발현 전략) 스크리닝을 위한 80가지의 발현 균주를 생산하기 위해, 2가지의 피. 플루오레센스 호스트 균주, DC454(WT) 및 DC441(PD) 내로 형질전환었다. 발현 전략의 랭킹은 크리산타스파아제 모노머의 SDS-CGE 추정된 역가에 기초하였다. 발현 전략 스크린의 일차적인 목표는 발현 플라스미드 및 그들의 통합된 유전적 요소의 대형 서브셋을 평가하는 것, 및 낮은 또는 불량한 품질의 타겟 발현을 나타낸 발현 전략들을 제거하는 것이었다.

80개의 형질전환물(40가지의 발현 전략 x 2가지의 호스트 균주)로부터 생성된 결과적인 배양물은 실시예 2에 기재된 바와 같이 96웰 플레이트에서 성장외었다. 유도 후 24 시간에 수확된 전체 브로스 배양물 유래의 초음파 처리 샘플은 SDS-CGE에 의해 분석되었다. 크리산타스파아제 단량체에 대해 예측된 분자량(35 kDa)과 일치하고, 또한 이. 콜라이 L-Asp(Sigma 제품 #A3809)와 함께 이동된 유도된 단백질의 발현이 정량되었다. 환원된 샘플의 SDS-CGE 정량은 유도된 밴드와 이. 콜라이 L-Asp 표준 곡선을 비교함으로써 완료되었다. DC454 및 DC441 호스트 균주 둘 다로부터의 20개의 최고 성능 샘플이 추정 가용성 크리산타스파아제 모노머 역가에 기초하여 랭킹되었다(표 9). 도 5는 96웰 배양 가용성 초음파 처리 샘플의 분석으로부터 생성된 SDS-CGE 겔-유사 도면을 나타낸다. 표 9는 DC454(표의 좌측) 및 DC441(표의 우측) 호스트 균주에서 발현된 플라스미드에 대해 환원된 가용성 초음파 처리물의 SDS-CGE 분석에 의해 추정되고, LabChip^® 내부 래더에 의해 정량된 바와 같은 유도 후 24 시간(I24) 역가를 나타낸다. 또한, 각각의 p743 발현 플라스미드로부터 생산된 분비 리더 융합도 나타낸다.

DC454 및 DC441 호스트 균주 둘 다로부터 유도된 상위 10개의 최고 성능 발현 균주에서 관찰된 6개의 플라스미드 및 통합된 분비 리더(p743-013(FlgI), p743-038(8484), p743-020(LolA), p743-018(DsbC), p743-009(Ibp-S31A) 및 p743-034(5193))는 표 9에 **로 표시되어 있다. 추가로, 크리산타스파아제 단백질의 세포질 발현을 위해 디자인된 p743-001 발현 플라스미드는 호스트 둘 다에서 상위 2개의 최고 가용성 성능으로 랭킹되었다. 호스트 균주 둘 다를 조합하면, 상위 10개의 최고 가용성 역가 범위는 525 내지 1,523 μg/mL였다. 불용성 성능은 p743-013 플라스미드를 이용하여 230 μg/mL를 달성하는 최고 불용성 성능으로 관찰된 모든 발현에 대해 낮았다. SDS-CGE 밴드 패턴의 관찰(도 5)은 가장 완전한 분비 리더 프로세싱(주변세포질로 유출 시 제거)이 p743-013, p743-033(리더 O), p743-038, p743-009 및 p743-018 발현 플라스미드를 이용하여 발생되었고, 반면 p743-016 및 p743-017 플라스미드는 현저한 저분자량 절단 생성물을 생산하는 것이 관찰되었음을 나타낸다. 표 8에 나타낸 10개의 발현 플라스미드는 SDS-CGE 추정 높은 가용성 역가에 기초하여 96웰 HTP 규모에서 후속 호스트 균주 스크리닝을 위해 선택되었다. 이어서, 10가지의 선택된 발현 전략은 크리산타스파아제 단백질 역가 및 품질에 추가로 영향을 미칠 수 있는 24가지의 독특한 호스트 균주와 조합되었다.

표 9는 DC454(표의 좌측) 및 DC441(표의 우측) 호스트 균주에서 발현된 플라스미드에 대해 환원된 가용성 초음파 처리물의 SDS-CGE 분석에 의해 추정되고, LabChip^® 내부 래더에 의해 정량된 바와 같은 유도 후 24 시간(I24) 역가를 나타낸다. 또한, 각각의 p743 발현 플라스미드로부터 생산된 분비 리더 융합도 나타낸다.

실시예 3: 이. 콜라이 아스파라기나아제 발현 구조체의 제조

이. 콜라이 아스파라기나아제-리더 융합 컨스트럭트로부터 단백질 발현이 평가되었다.

이. 콜라이 A-1-3 L-아스파라기나아제 II 유전자는 피. 플루오레센스에서의 발현을 위해 최적화되었고, 세포질 및 주변세포질 발현을 위해 한 세트의 발현 벡터 내로 클로닝되었다. 사용된 아미노산 서열은 본 출원에 서열 번호 9로서 개시되어 있다. 사용된 핵산 서열은 본 출원에 서열 번호 10으로서 개시되어 있다.

발현은 일련의 분비 리더 서열을 이용하여 평가되었는데, 그 중 일부는 고 RBS 서열을 이용하였고, 일부는 중 RBS 서열을 이용하였다. 아울러, 리더를 이용하지 않는 세포질 발현이 평가되었다.

각각의 컨스트럭트는 피. 플루오레센스 호스트 균주 DC454(pyrF 결손, PD 또는 FMO 없음) 및 DC441(pyrF 결손 PD) 내로 형질전환되었고, 생성된 발현 균주는 0.5 mL 배양에서 이. 콜라이 A-1-3 L-아스파라기나아제 II 생산에 대해 평가되었다. 전체 브로스는 초음파 처리되었고, 원심분리되었고, 가용성 분획은 SDS-CGE에 의해 분석되었다.

96웰 포맷에서 성장 및 발현

발현 플라스미드 스크리닝을 위해, 이. 콜라이 A-1-3 L-아스파라기나아제 II 발현 플라스미드 각각에 대한 라이게이션 혼합물은 다음과 같이 피. 플루오레센스 호스트 균주 DC454 및 DC441 세포 내로 형질전환되었다. 25 마이크로리터의 컴피턴트 세포는 해동되었고, 96 멀티웰 Nucleovette^®(Lonza) 내로 이전되었으며, 라이게이션 혼합물은 각각의 웰에 첨가되었다. 세포는 Nicleofector^TM 96-well Shuttle^TM 시스템(Lonza AG)을 이용하여 전기천공되었다. 이어서, 세포는 400 μl의 M9 염 1% 글루코오스 배지 및 미량 원소와 함께 96웰 딥 웰에 이전되었다. 96웰 플레이트(시드 플레이트)는 30℃에서 진탕하면서 48 시간 동안 항온처리되었다. 10 μl의 시드 배양물은 각각의 웰이 미량 원소 및 5% 글리세롤이 보충된 500 μl의 HTP 배지를 함유하는 96웰 딥 웰 플레이트에 2회 이전되었고, 이전과 같이 24 시간 동안 항온처리되었다. 타겟 단백질의 발현을 유도하기 위해, 이소프로필-β-D-1-티오갈락토피라노사이드(IPTG)가 24 시간 시점에서 각각의 웰에 최종 농도 0.3 mM로 첨가되었다. 폴딩 조절자 과발현 균주에서 폴딩 조절자의 발현을 유도하기 위해, 만니톨(Sigma)이 각각의 웰에 최종 농도 1%로 첨가되었다. 세포 밀도는 성장을 모니터링하기 위해 유도 후 24 시간에 600 nm(OD600)에서 광학 밀도에 의해 측정되었다. 유도 후 24시간에 세포는 수확되었고, 최종 부피 400 μl를 위해 1X PBS 내에서 1:3으로 희석되었고, 이어서 동결되었다. 샘플은 후술하는 바와 같이 제조 및 분석되었다.

발현 플라스미드 스크리닝에서 확인된 상위 샘플에 대한 발현 결과는 표 10 및 11에서 확인된다.

호스트 균주 스크리닝을 위해, 발현 플라스미드 스크리닝 결과에 기초하여 선택된 발현 플라스미드는 각각 야생형(WT) 또는 모 DC454 균주, 프로테아제 결실(PD) 균주, 폴딩 조절자 과발현(FMO) 균주 및 프로테아제 결실 + 폴딩 조절자 과발현자(PD/FMO) 균주를 포함하는 어레이 내에서 24가지의 피. 플루오레센스 호스트 균주 내로 형질전환되었다. 피. 플루오레센스 아스파라기나아제 분비 리더(AnsB)에 융합된 이. 콜라이 아스파라기나아제는 상기 어레이 내에 포함되었다(서열 번호 1에 기재된 바와 같은 아미노산 서열; 서열 번호 4에 기재된 바와 같은 코딩 서열). 폴딩 조절자가 존재하는 경우, 이는 제2 플라스미드 상에서 코딩되었고, 발현은 피. 플루오레센스 천연 만니톨 유도성 프로모터에 의해 구동되었다. 호스트 균주 스크린 형질전환은 다음과 같이 수행되었다: 25 마이크로리터의 피. 플루오레센스 호스트 균주 컴피턴트 세포는 해동되었고, 96 멀티웰 Nucleovette^® 플레이트 내로 이전되었으며, 10 μl의 플라스미드 DNA(10 ng)가 각각의 웰에 첨가되었다. 세포들은 상기 플라스미드 발현 스크리닝에 대해 기재된 바와 같이 전기천공되었고, 배양되었고, HTP 포맷으로 유도되었고, 수확되었다. 샘플은 후술하는 바와 같이 제조되었고, 분석되었다.

분석을 위한 샘플의 제조

가용성 분획은 초음파 처리 후 원심분리에 의해 제조되었다. 배양 브로스 샘플(400 μL)은 24 프로브 팁 혼이 구비된 셀 라이시스 자동화 초음파 처리 시스템(CLASS, Scinomix)을 이용하여 하기 조건 하에서 초음파 처리되었다: 펄스 당 10초로 웰 당 20 펄스, 및 각각의 펄스 사이에 10초 동안 60% 파워(Sonics Ultra-Cell). 용해물은 5,500 x g에서 15분(4℃) 동안 원심분리되었고, 상등액은 수집되었다(가용성 분획).

SDS-CGE 분석

단백질 샘플은 HT 단백질 익스프레스 칩 및 상응하는 시약(PerkinElmer)과 함께 L뮤Chip GXII 장비(PerkinElmer)를 이용하여 마이크로칩 SDS 모세관 겔 전기영동에 의해 분석되었다. 샘플은 하기 제조사의 프로토콜(단백질 사용자 가이드 문서 번호 450589, Rev. 3)에 따라 제조되었다. 개략적으로, 96웰 폴리프로필렌 원추형 웰 PCR 플레이트 내에서, 4 μL의 샘플은 14 μL의 샘플 버퍼, 70 mM DTT 환원제와 함께 혼합되었고, 가열되었다.

유도 후 24 시간에 샘플링된 전체적인 브로스는 상기한 바와 같이 처리되었고, 가용성 분획은 SDS-CGE에 의해 분석되었다.

시판되는 L-아스파라기나아제 활성 어세이 키트(Sigma)는 눌 샘플과 비교하는 경우 최고 성능 균주 STR55382(Lao 리더) 유래의 HTP 배양 용해물 샘플에서 유의미한 L-아스파라기나아제 활성을 검출하였다.

발현 플라스미드 스크리닝 실험에서 스크리닝된 플라스미드 및 상응하는 분비 리더는 다음을 포함한다:

p742-006 (Azu)

p742-008 (LAO)

p742-009 (Ibp-S31A)

p742-016 (Pbp)

p742-017 (PbpA20V)

p742-021 (리더 D)

p742-037 (리더 R)

p742-038 (8484)

p742-041 (피. 플루오레센스 AnsB).

발현 균주들은 상기한 바와 같이 배양되었고, 유도되었다. 가용성 및 불용성 분획의 SDS-CGE 분석은 높은 레벨의 아스파라기나아제 발현을 나타냈다(도 6). 높은 역가는 표 12에 기재된 균주들을 포함하는 발현 균주에서 관찰되었다.

실시예 4: 균주의 구축

하기 피. 플루오레센스 아스파라기나아제 KO 호스트 균주가 생성되었다.

PF1433(PyrF, AspG1, 및 AspG2 결손)은 호스트 균주 DC454(PryF 결손)에서 aspG2 및 aspG1 유전자의 순차적인 결실에 의해 구축되었다.

PF1434(PyrF, ProC, AspG1, 및 AspG2 결손)는 호스트 균주 DC455(pyrF proC)에서 aspG1 및 aspG2 유전자의 순차적인 결실에 의해 구축되었다. 균주 DC455는 DC542 및 DC549 둘 다의 모 균주이다.

PF1442(PyrF, ProC, AspG1, AspG2, Lon, DegP1, DegP2 S219A, Prc1, 및 AprA 결손)는 호스트 균주 PF1201(PyrF, ProC, 프로테아제 Lon, DegP1, DegP2 S219A, Prc1, 및 AprA 결손)에서 aspG2 및 aspG1 유전자의 순차적인 결실에 의해 구축되었다.

PF1443(PyrF, ProC, AspG1, 및 AspG2 결손; pDOW3700로부터 발현된 FMO LepB)은 PF1434 내로 LepB-코딩 FMO 플라스미드 pDOW3700을 형질전환함으로써 구축되었다.

PF1444(PyrF, ProC, AspG1, 및 AspG2 결손; pDOW3707로부터 발현된 FMO Tig)는 PF1434 내로 Tig-코딩 FMO 플라스미드 pDOW3700을 형질전환함으로써 구축되었다.

PF1445(PyrF, ProC, AspG1, AspG2, Lon, DegP1, DegP2, S219A, Prc1, 및 AprA 결손; pFNX4142로부터 발현된 FMO DsbAC-Skp)는 DsbAC-Skp-코딩 플라스미드 pFNX4142를 이용하는 PF1442의 형질전환에 의해 구축되었다.

사용된 균주는 표 13에 기재되어 있다.

실시예 5: 선택된 발현 균주의 발효 및 가용성 %TCP의 계산

실시예 3에 기재된 균주 STR57863 및 STR57860은 2 L 발효로 스케일링되었고, 각각 최대 8가지의 상이한 발효 조건 하에서 스크리닝되었다. 2 L 규모의 발효(대략 1 L의 최종 발효 부피)는 선택된 균주의 동결 배양물 스탁을 이용하여 효모 추출물과 글리세롤로 보충된 화학적으로 한정된 배지 600 mL를 함유하는 진탕 플라스크를 접종함으로써 생성되었다. 30℃에서 진탕하면서 16 내지 24 시간 항온처리 후, 각각의 진탕 플라스크 배양물의 균일한 부분은 고 바이오매스를 지원하도록 디자인된 화학적으로 한정된 배지를 함유하는 8 유닛 멀티플렉스 발효 시스템 각각에 무균적으로 이전되었다. 2 L 발효기 내에서, 배양은 글리세롤 유가 배양 모드로 pH, 온도, 및 용존 산소에 대한 제어된 조건 하에서 수행되었다. 유가 배양 고 세포 밀도 발효 공정은 성장기, 이어서 일단 배양이 타겟 바이오매스에 도달하면(습윤 세포 중량) IPTG 및 5 g/L의 만니톨 첨가에 의해 개시된 유도기로 구성되었다. 유도기 중의 조건은 실험 디자인에 따라 변경되었다. 발효의 유도기는 대략 24 시간 동안 진행되도록 하였다. 분석 샘플은 세포 밀도(575 nm에서 광학 밀도)를 측정하기 위해 발효조로부터 채취되었고, 이어서 타겟 유전자 발현의 레벨을 평가하기 위한 후속 분석을 위해 동결되었다. 유도 후 24 시간의 최종 시점에서, 각 용기의 전체적인 발효 브로스는 15,900 x g에서 60 내지 90분 동안 원심분리에 의해 수확되었다. 세포 페이스트 및 상등액은 분리되었고, 페이스트는 -80℃에서 유지 및 동결되었다.

표 14는 몇 가지 발효 조건 하에서 균주 STR57863 및 STR57860을 이용한 발현 결과를 나타낸다. 확인할 수 있는 바와 같이, 초기 균주/발효 조건의 몇 가지 조합은 >30% TCP 아스파라기나아제 발현을 나타냈다. 총 세포 단백질은 다음과 같이 계산되었다:

0.55 DCW 총 세포 단백질 x A550에서 500 μg/mL DCW = A550=1에서 275 μg 총 세포 단백질/ml(또는 mg/L)

최종 시점(I24)에서 TCP = OD575 * 275mg/L TCP

가용성 % TCP = 100 * (가용성 역가 / TCP)

실시예 6: 아스파라기나아제 진탕 플라스크 발현

진탕 플라스크 발현(200 mL)은 크리산타스파아제, 이. 콜라이 타입 II L-아스파라기나아제, 및 피. 플루오레센스 타입 II L-아스파라기나아제 발현 균주로부터의 단백질 생산을 평가하기 위해 수행되었다. 아스파라기나아제 발현 플라스미드는, 표 15에서 확인할 수 있는 바와 같이, 발현 균주를 생성하기 위해 아스파라기나아제 결손 호스트 균주 PF1433 내로 형질전환되었다. 진탕 플라스크 샘플로부터 생성된 용해물은 LC-MS 분석에 의한 원형 질량의 확인 및 초기 활성 분석을 위해 사용되었다.

표 15는 200 mL 작용 부피 진탕 플라스크 스케일에서 분석된 PF1433 호스트 균주(천연 아스파라기나아제 결손, 야생형 균주)를 이용하여 구축된 3개의 크리산타스파아제 발현 균주의 환원된 가용성 및 불용성 초음파 처리 분획의 SDS-CGE 분석(10회의 상이한 반복)에 의해 결정된 바와 같이 평균 추정 역가를 나타낸다. SDS-CGE 역가는 이. 콜라이 L-Asp(Sigma) 표준 곡선에 대한 비교에 기초하여 추정되었다. 각각의 균주의 가용성 및 불용성 초음파 처리 분석 둘 다로부터 촬영한 SDS-CGE 겔-유사 이미지는 도 7에 나타낸다. AsnB 리더를 포함하는 컨스트럭트(STR55981, 천연 분비 리더-천연 아스파라기나아제 단백질 융합)로부터 생산된, 피. 플루오레센스 천연 L-Asp2 단백질의 역가가 AsnB 리더를 포함하는 컨스트럭트(STR55976)로부터 생산된 이. 콜라이 아스파라기나아제 단백질의 역가에 비해 실질적으로 낮았다는 점은 주목할 만한데, 즉 이때 AnsB 리더는 이종성 아스파라기나아제 단백질에 융합되었다(1011 μg/ml과 비교하여 677 μg/ml, 약 1.5배 차이).

상기 분석에는 2가지 눌 균주, 즉 STR55982 및 DC432로부터 진탕 플라스크 성장이 포함되었다. DC432 균주는 피. 플루오레센스 호스트 균주 내에 플라스미드 pDOW1169를 보유하는데, 이는 야생형 크리산타스파아제 코딩 영역을 함유하지 않는다. STR55982는 천연 아스파라기나아제 코딩 서열 둘 다의 염색체 결실을 함유하는 호스트 균주 PF1433 내에 플라스미드 pDOW1169를 보유한다. 모두 3가지의 크리산타스파아제 발현 균주는 대부분 가용성 크리산타스파아제 단백질 발현을 나타냈는데, 균주 STR55978이 최대 14 g/L의 가장 높은 가용성 역가를 나타냈다. 더구나, 유도 후 24 시간에서 각각 21.7 및 23.7의 OD600을 나타내는 STR55982 및 DC432 눌 균주와 비교하는 경우, 모두 3가지의 크리산타스파아제 발현 균주는 유도 후 24 시간에서 유사한 세포 밀도(OD600 = 23.0, 27.0 및 27.8)를 달성했기 때문에, 성장 패널티는 관찰되지 않았다.

5가지의 진탕 플라스크 발현 균주 각각으로부터 생성된 가용성 초음파 처리 샘플은 Sigma로부터 구입한 상용 키트(아스파라기나아제 활성 어세이 키트)를 이용하여 아스파라기나아제 활성에 대해 분석되었다. 이러한 키트는 생성된 아스파르테이트에 비례하는 비색 최종 생성물을 생성하는 커플링된 효소 반응을 이용하여 활성을 측정한다. Sigma의 이. 콜라이 아스파라기나아제 타입 II(A3809)는 양성 대조군으로서 STR55982 눌 용해물 내로 스파이킹되었다(최종 열).

활성 결과는 표 16에 나타낸다.

눌 샘플 둘 다는 1:25,000 희석 배수에서 측정 가능한 활성을 나타내지 않았지만, 1:25,000 희석된 균주 STR55976, STR55977, STR55978, STR55979 및 STR55980 유래의 가용성 초음파 처리 샘플은 Sigma의 이. 콜라이 L-아스파라기나아제(A3809) 250 μg/mL으로 스파이크된 유사하게 희석된 STR55982 눌 균주에 필적하는 활성을 나타냈다. 시판되는 키트를 이용하는 이들 초기 활성 결과는 피. 플루오레센스에서 발현된 크리산타스파아제 단백질 및 이. 콜라이 아스파라기나아제 단백질이 생성된 초음파 처리물 내에서 활성인 사량체 아스파라기나아제 효소를 용이하게 형성할 수 있음을 나타내는 것으로 생각된다.

표 17은 진탕 플라스크 내의 균주 STR55978, STR55979 및 STR55980에 의해 생성된 가용성 초음파 처리물 유래의 크리산타스파아제, 및 균주 STR55976 및 STR55977에 의해 생성된 가용성 초음파 처리물 유래의 이. 콜라이 아스파라기나아제의 분석으로부터의 LC-MS 원형(intact) 질량분석 결과를 나타낸다. 각각의 균주 유래의 크리산타스파아제 단백질의 관찰된 분자량(35,053 Da)은 이론적인 분자량(35054.2 Da)과 일치하는데, 이는 세 가지 균주 모두가 예측된 아미노산 서열의 생성 및 완전한 프로세싱, 또는 존재하는 경우 분비 리더의 제거를 수행하고 있음을 나타낸다. 각각의 균주 유래의 이. 콜라이 아스파라기나아제의 관찰된 분자량(34591 Da)은 이론적인 분자량(34591.96 Da)과 일치하는데, 이는 균주 둘 다 예측된 아미노산 서열의 생성 및 완전한 프로세싱, 또는 발생된 분비 리더의 제거를 수행하고 있음을 나타낸다. Sigma 이. 콜라이 L-Asp는 대조군으로서 분석되었다. 도 8은 STR55978에 대한 질량분석 판독치를 나타내는데, 이는 AnsB 리더로부터 크리산타스파아제의 적절한 절단을 나타낸다. STR55976 및 STR55977에서 발현된 이. 콜라이 Asp2는 LC-MS에 의해 각각 AnsB 및 Ibp-S31A 리더로부터 적절하게 절단되는 것으로 확인되었다.

본 출원에서 본 개시내용의 바람직한 실시양태를 제시하고 기재하였지만, 그러한 실시양태는 단지 예로서 제공된다. 이제 당해 기술분야의 통상의 기술자는 본 개시내용을 벗어나지 않으면서 다수의 변이, 변화 및 치환이 가능할 것이다. 본 출원에 기재된 본 개시내용의 실시양태들에 대한 다양한 대안은 본 출원의 방법을 실시하는데 이용될 수 있음을 이해하여야 한다. 후술하는 청구범위는 본 발명의 범위를 규정하며, 이로써 이들 청구범위 및 그의 균등물의 범위 내의 방법 및 구성을 포함하는 것으로 의도된다.

SEQUENCE LISTING <110> PFENEX INC. <120> BACTERIAL LEADER SEQUENCES FOR PERIPLASMIC PROTEIN EXPRESSION <130> 38194-752.601 <140> <141> <150> 62/578,304 <151> 2017-10-27 <160> 20 <170> PatentIn version 3.5 <210> 1 <211> 25 <212> PRT <213> Pseudomonas fluorescens <400> 1 Met Lys Ser Ala Leu Lys Asn Val Ile Pro Gly Ala Leu Ala Leu Leu 1 5 10 15 Leu Leu Phe Pro Val Ala Ala Gln Ala 20 25 <210> 2 <211> 18 <212> PRT <213> Pseudomonas fluorescens <400> 2 Met Arg Gln Leu Phe Phe Cys Leu Met Leu Met Val Ser Leu Thr Ala 1 5 10 15 His Ala <210> 3 <211> 29 <212> PRT <213> Pseudomonas fluorescens <400> 3 Met Gln Ser Leu Pro Phe Ser Ala Leu Arg Leu Leu Gly Val Leu Ala 1 5 10 15 Val Met Val Cys Val Leu Leu Thr Thr Pro Ala Arg Ala 20 25 <210> 4 <211> 75 <212> DNA <213> Pseudomonas fluorescens <400> 4 atgaaatctg cattgaagaa cgttattccg ggcgccctgg cccttctgct gctattcccc 60 gtcgccgccc aggcc 75 <210> 5 <211> 54 <212> DNA <213> Pseudomonas fluorescens <400> 5 atgcgacaac tatttttctg tttgatgctg atggtgtcgc tcacggcgca cgcc 54 <210> 6 <211> 87 <212> DNA <213> Pseudomonas fluorescens <400> 6 atgcaaagcc tgccgttctc tgcgttacgc ctgctcggtg tgctggcagt catggtctgc 60 gtgctgttga cgacgccagc ccgtgcc 87 <210> 7 <211> 327 <212> PRT <213> Erwinia chrysanthemi <400> 7 Ala Asp Lys Leu Pro Asn Ile Val Ile Leu Ala Thr Gly Gly Thr Ile 1 5 10 15 Ala Gly Ser Ala Ala Thr Gly Thr Gln Thr Thr Gly Tyr Lys Ala Gly 20 25 30 Ala Leu Gly Val Asp Thr Leu Ile Asn Ala Val Pro Glu Val Lys Lys 35 40 45 Leu Ala Asn Val Lys Gly Glu Gln Phe Ser Asn Met Ala Ser Glu Asn 50 55 60 Met Thr Gly Asp Val Val Leu Lys Leu Ser Gln Arg Val Asn Glu Leu 65 70 75 80 Leu Ala Arg Asp Asp Val Asp Gly Val Val Ile Thr His Gly Thr Asp 85 90 95 Thr Val Glu Glu Ser Ala Tyr Phe Leu His Leu Thr Val Lys Ser Asp 100 105 110 Lys Pro Val Val Phe Val Ala Ala Met Arg Pro Ala Thr Ala Ile Ser 115 120 125 Ala Asp Gly Pro Met Asn Leu Leu Glu Ala Val Arg Val Ala Gly Asp 130 135 140 Lys Gln Ser Arg Gly Arg Gly Val Met Val Val Leu Asn Asp Arg Ile 145 150 155 160 Gly Ser Ala Arg Tyr Ile Thr Lys Thr Asn Ala Ser Thr Leu Asp Thr 165 170 175 Phe Lys Ala Asn Glu Glu Gly Tyr Leu Gly Val Ile Ile Gly Asn Arg 180 185 190 Ile Tyr Tyr Gln Asn Arg Ile Asp Lys Leu His Thr Thr Arg Ser Val 195 200 205 Phe Asp Val Arg Gly Leu Thr Ser Leu Pro Lys Val Asp Ile Leu Tyr 210 215 220 Gly Tyr Gln Asp Asp Pro Glu Tyr Leu Tyr Asp Ala Ala Ile Gln His 225 230 235 240 Gly Val Lys Gly Ile Val Tyr Ala Gly Met Gly Ala Gly Ser Val Ser 245 250 255 Val Arg Gly Ile Ala Gly Met Arg Lys Ala Met Glu Lys Gly Val Val 260 265 270 Val Ile Arg Ser Thr Arg Thr Gly Asn Gly Ile Val Pro Pro Asp Glu 275 280 285 Glu Leu Pro Gly Leu Val Ser Asp Ser Leu Asn Pro Ala His Ala Arg 290 295 300 Ile Leu Leu Met Leu Ala Leu Thr Arg Thr Ser Asp Pro Lys Val Ile 305 310 315 320 Gln Glu Tyr Phe His Thr Tyr 325 <210> 8 <211> 981 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 8 gcagacaaac tccctaacat cgtaatcctc gcaactggtg gtaccatcgc aggcagcgcc 60 gccaccggca cgcagaccac tggctacaag gccggcgcgc tgggcgtaga cacgctgatc 120 aacgccgtcc cggaagtgaa gaaactggcc aacgtcaagg gtgagcaatt ctccaacatg 180 gccagcgaga acatgactgg cgatgtggta ctgaagctct cgcagcgcgt gaacgaactg 240 ctcgcccgcg acgacgtgga cggcgtggtg atcacccacg gcactgatac cgtcgaagag 300 tcggcgtact ttctccacct gaccgtgaag tccgataagc ccgtggtgtt tgtcgccgcg 360 atgcgcccgg cgaccgccat cagcgccgac gggccgatga atctgttgga agccgtgcgc 420 gtggcgggtg acaagcaaag ccgcggtcgg ggcgtaatgg tcgtcctgaa cgatcggatc 480 ggtagcgcgc ggtacatcac caagacgaac gcctccacgc tggacacctt caaggcgaac 540 gaagaggggt acctgggggt gatcattggc aatcgtatct attaccagaa ccgcatcgac 600 aagctgcaca ccacccgctc ggtgttcgac gtgcgcggtc tgactagcct gcccaaggtc 660 gacatcctgt acggctacca agacgacccg gagtacctct acgacgcggc gatccagcat 720 ggcgtgaagg gcatcgtcta cgccggtatg ggtgccggct cggtgtcggt ccgcggcatc 780 gcgggtatgc gcaaggccat ggagaaaggc gtggtcgtga ttcgctcgac ccggactggc 840 aatggcatcg taccgcccga tgaagaactc ccggggctcg tgagcgatag cctcaacccc 900 gcgcacgccc ggatcctgct gatgctggcg ctcacgcgga ccagcgaccc caaggtcatt 960 caagagtact tccacaccta c 981 <210> 9 <211> 326 <212> PRT <213> Escherichia coli <400> 9 Leu Pro Asn Ile Thr Ile Leu Ala Thr Gly Gly Thr Ile Ala Gly Gly 1 5 10 15 Gly Asp Ser Ala Thr Lys Ser Asn Tyr Thr Ala Gly Lys Val Gly Val 20 25 30 Glu Asn Leu Val Asn Ala Val Pro Gln Leu Lys Asp Ile Ala Asn Val 35 40 45 Lys Gly Glu Gln Val Val Asn Ile Gly Ser Gln Asp Met Asn Asp Asp 50 55 60 Val Trp Leu Thr Leu Ala Lys Lys Ile Asn Thr Asp Cys Asp Lys Thr 65 70 75 80 Asp Gly Phe Val Ile Thr His Gly Thr Asp Thr Met Glu Glu Thr Ala 85 90 95 Tyr Phe Leu Asp Leu Thr Val Lys Cys Asp Lys Pro Val Val Met Val 100 105 110 Gly Ala Met Arg Pro Ser Thr Ser Met Ser Ala Asp Gly Pro Phe Asn 115 120 125 Leu Tyr Asn Ala Val Val Thr Ala Ala Asp Lys Ala Ser Ala Asn Arg 130 135 140 Gly Val Leu Val Val Met Asn Asp Thr Val Leu Asp Gly Arg Asp Val 145 150 155 160 Thr Lys Thr Asn Thr Thr Asp Val Ala Thr Phe Lys Ser Val Asn Tyr 165 170 175 Gly Pro Leu Gly Tyr Ile His Asn Gly Lys Ile Asp Tyr Gln Arg Thr 180 185 190 Pro Ala Arg Lys His Thr Ser Asp Thr Pro Phe Asp Val Ser Lys Leu 195 200 205 Asn Glu Leu Pro Lys Val Gly Ile Val Tyr Asn Tyr Ala Asn Ala Ser 210 215 220 Asp Leu Pro Ala Lys Ala Leu Val Asp Ala Gly Tyr Asp Gly Ile Val 225 230 235 240 Ser Ala Gly Val Gly Asn Gly Asn Leu Tyr Lys Thr Val Phe Asp Thr 245 250 255 Leu Ala Thr Ala Ala Lys Asn Gly Thr Ala Val Val Arg Ser Ser Arg 260 265 270 Val Pro Thr Gly Ala Thr Thr Gln Asp Ala Glu Val Asp Asp Ala Lys 275 280 285 Tyr Gly Phe Val Ala Ser Gly Thr Leu Asn Pro Gln Lys Ala Arg Val 290 295 300 Leu Leu Gln Leu Ala Leu Thr Gln Thr Lys Asp Pro Gln Gln Ile Gln 305 310 315 320 Gln Ile Phe Asn Gln Tyr 325 <210> 10 <211> 978 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 10 ctccctaaca ttactattct ggccactggc ggtacgattg caggcggcgg tgactcagcc 60 accaagtcga attacaccgc cggtaaggtc ggtgtcgaaa acctcgtcaa cgccgtgccg 120 cagctgaaag atatcgccaa cgtcaagggc gagcaagtgg tgaacatcgg ctcccaagat 180 atgaacgatg acgtgtggct gacgctggcc aagaaaatca acaccgattg cgacaagacg 240 gacgggtttg tcatcaccca cggcaccgac actatggaag agactgccta cttcctcgac 300 ctcacggtga agtgcgataa accggtagtg atggtgggcg ccatgcgccc gagcacctcg 360 atgagcgcgg acggcccgtt caatctgtac aacgccgtgg taaccgcagc ggacaaggcg 420 tccgcgaacc gcggtgtatt ggtagtgatg aacgatacgg tgctcgatgg gcgcgatgtg 480 accaagacca ataccactga tgtggccacc ttcaagagcg tgaactatgg cccgctgggc 540 tacatccata acggcaagat cgattaccag cgtactcccg cccggaagca cacctcggac 600 acccccttcg acgtgtcgaa actgaacgaa ctgcccaagg tcggcatcgt ctacaactac 660 gccaatgcga gcgatctgcc cgcgaaggcc ctggtggacg ccggctacga cgggatcgta 720 tcggcgggtg tgggcaatgg taacctgtac aagaccgtgt ttgacaccct ggcgacggcg 780 gcgaagaacg gcaccgccgt ggtccgcagc agccgcgtgc ccactggggc gaccacccaa 840 gacgccgagg tcgacgacgc gaagtacggc ttcgtagcca gcggcaccct gaacccgcaa 900 aaggcccggg tcctgctgca gctggcgctc acgcagacga aggacccgca gcaaatccaa 960 cagatcttca accagtac 978 <210> 11 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 11 aggagg 6 <210> 12 <211> 6 <212> DNA <213> Unknown <220> <223> Description of Unknown: RBS2 sequence <400> 12 ggagcg 6 <210> 13 <211> 6 <212> DNA <213> Unknown <220> <223> Description of Unknown: RBS34 sequence <400> 13 ggagcg 6 <210> 14 <211> 6 <212> DNA <213> Unknown <220> <223> Description of Unknown: RBS41 sequence <400> 14 aggagt 6 <210> 15 <211> 6 <212> DNA <213> Unknown <220> <223> Description of Unknown: RBS43 sequence <400> 15 ggagtg 6 <210> 16 <211> 6 <212> DNA <213> Unknown <220> <223> Description of Unknown: RBS48 sequence <400> 16 gagtaa 6 <210> 17 <211> 6 <212> DNA <213> Unknown <220> <223> Description of Unknown: RBS1 sequence <400> 17 agagag 6 <210> 18 <211> 6 <212> DNA <213> Unknown <220> <223> Description of Unknown: RBS35 sequence <400> 18 aaggca 6 <210> 19 <211> 6 <212> DNA <213> Unknown <220> <223> Description of Unknown: RBS49 sequence <400> 19 ccgaac 6 <210> 20 <211> 1020 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 20 atatgctctt cagccgcaga caaactccct aacatcgtaa tcctcgcaac tggtggtacc 60 atcgcaggca gcgccgccac cggcacgcag accactggct acaaggccgg cgcgctgggc 120 gtagacacgc tgatcaacgc cgtcccggaa gtgaagaaac tggccaacgt caagggtgag 180 caattctcca acatggccag cgagaacatg actggcgatg tggtactgaa gctctcgcag 240 cgcgtgaacg aactgctcgc ccgcgacgac gtggacggcg tggtgatcac ccacggcact 300 gataccgtcg aagagtcggc gtactttctc cacctgaccg tgaagtccga taagcccgtg 360 gtgtttgtcg ccgcgatgcg cccggcgacc gccatcagcg ccgacgggcc gatgaatctg 420 ttggaagccg tgcgcgtggc gggtgacaag caaagccgcg gtcggggcgt aatggtcgtc 480 ctgaacgatc ggatcggtag cgcgcggtac atcaccaaga cgaacgcctc cacgctggac 540 accttcaagg cgaacgaaga ggggtacctg ggggtgatca ttggcaatcg tatctattac 600 cagaaccgca tcgacaagct gcacaccacc cgctcggtgt tcgacgtgcg cggtctgact 660 agcctgccca aggtcgacat cctgtacggc taccaagacg acccggagta cctctacgac 720 gcggcgatcc agcatggcgt gaagggcatc gtctacgccg gtatgggtgc cggctcggtg 780 tcggtccgcg gcatcgcggg tatgcgcaag gccatggaga aaggcgtggt cgtgattcgc 840 tcgacccgga ctggcaatgg catcgtaccg cccgatgaag aactcccggg gctcgtgagc 900 gatagcctca accccgcgca cgcccggatc ctgctgatgc tggcgctcac gcggaccagc 960 gaccccaagg tcattcaaga gtacttccac acctactgat aatagttcag aagagcatat 1020

Claims

관심 단백질 또는 폴리펩타이드에 작동 가능하게 연결된 리더 펩타이드를 포함하는 폴리펩타이드로서, 리더 펩타이드는 서열 번호 1, 2 또는 3에 기재된 아미노산 서열을 보유하는 것인 폴리펩타이드.
제1항에 있어서, 리더 펩타이드는 관심 단백질 또는 폴리펩타이드 태생이 아닌 것인 폴리펩타이드.
제1항에 있어서, 관심 단백질 또는 폴리펩타이드는 항체 또는 항체 유도체, 효소, 사이토카인, 케모카인, 성장 인자, 및 백신 항원으로부터 선택되는 것인 폴리펩타이드.
제2항에 있어서, 항체 또는 항체 유도체는 scFv, Fab, 인간화 항체, 변형된 항체, 단일 도메인 항체, 이종 특이성 항체, 3가 항체, 이중 특이성 항체, 단일 사슬 항체, Fab 단편, 선형 항체, 디아바디, 또는 완전 사슬 항체인 폴리펩타이드.
제1항에 있어서 링커를 추가로 포함하는 폴리펩타이드.
제1항에 있어서, 절단 도메인을 추가로 포함하는 폴리펩타이드.
제1항에 있어서, 제1 부분이, 원핵 숙주 세포의 주변세포질로 관심 단백질 또는 폴리펩타이드의 발현을 유도하는 리더 펩타이드인 폴리펩타이드.
제7항에 있어서, 원핵 숙주 세포는 슈도모나드(Pseudomonad) 세포 또는 이. 콜라이(E. coli) 세포로부터 선택되는 것인 폴리펩타이드.
원핵 세포 배양으로 관심 단백질 또는 폴리펩타이드를 생산하는 방법으로서, 상기 방법은 (a) 세포 배양 성장 배지에서 원핵 세포를 배양하는 단계로서, 원핵 세포는 리더 펩타이드에 작동 가능하게 연결된 관심 단백질 또는 폴리펩타이드를 코딩하는 핵산을 포함하는 것인 단계; 및 (b) 원핵 세포의 주변세포질로부터 관심 단백질 또는 폴리펩타이드를 단리하는 단계를 포함하고, 여기서 리더 펩타이드는 서열 번호 1, 2 및 3으로부터 선택된 아미노산 서열을 포함하는 것인 방법.
제9항에 있어서, 관심 단백질 또는 폴리펩타이드는 항체 또는 항체 유도체, 효소, 사이토카인, 케모카인, 성장 인자, 및 백신 항원으로부터 선택되는 것인 방법.
제10항에 있어서, 항체 또는 항체 유도체는 scFv, Fab, 인간화 항체, 변형된 항체, 단일 도메인 항체, 이종 특이성 항체, 3가 항체, 이중 특이성 항체, 단일 사슬 항체, Fab 단편, 선형 항체, 디아바디, 또는 완전 사슬 항체인 방법.
제9항에 있어서, 핵산은 링커를 코딩하는 것인 방법.
제9항에 있어서, 핵산은 절단 도메인을 코딩하는 것인 방법.
제9항에 있어서, 원핵 세포는 슈도모나드 세포 또는 이. 콜라이 세포로부터 선택되는 것인 방법.
원핵 세포의 주변세포질에서 관심 단백질 또는 폴리펩타이드를 발현하는 방법으로서, 상기 방법은 세포 배양 성장 배지에서 리더 펩타이드에 작동 가능하게 연결된 관심 단백질 또는 폴리펩타이드를 코딩하는 핵산을 포함하는 원핵 세포를 배양하는 단계를 포함하고, 여기서 리더 펩타이드는 서열 번호 1, 2 및 3으로부터 선택된 아미노산 서열을 포함하는 것인 방법.
제15항에 있어서, 관심 단백질 또는 폴리펩타이드는 항체 또는 항체 유도체, 효소, 사이토카인, 케모카인, 성장 인자, 및 백신 항원으로부터 선택되는 것인 방법.
제16항에 있어서, 항체 또는 항체 유도체는 scFv, Fab, 인간화 항체, 변형된 항체, 단일 도메인 항체, 이종 특이성 항체, 3가 항체, 이중 특이성 항체, 단일 사슬 항체, Fab 단편, 선형 항체, 디아바디, 또는 완전 사슬 항체인 방법.
제15항에 있어서, 핵산은 링커를 코딩하는 것인 방법.
제15항에 있어서, 핵산은 절단 도메인을 코딩하는 것인 방법.
제15항에 있어서, 원핵 세포는 슈도모나드 세포 또는 이. 콜라이 세포로부터 선택되는 것인 방법.