KR20220105157A

KR20220105157A - 스플릿 인테인 시스템을 사용하는 단백질 정제

Info

Publication number: KR20220105157A
Application number: KR1020227016527A
Authority: KR
Inventors: 크리스토퍼 제임스 세빈스키; 피터 런드백; 조한 오만; 그레고리 그로스먼; 션 알 딘
Original assignee: 씨티바 바이오프로세스 알＆디 에이비
Priority date: 2019-11-22
Filing date: 2020-11-20
Publication date: 2022-07-26
Also published as: CN114698379A; WO2021099607A1; CA3155170A1; GB201917046D0; EP4061932A1; JP2023502335A

Abstract

본 발명은 주로 크로마토그래피 분야에서 단백질 정제에 관한 것이다. 보다 밀접하게, 본 발명은 개선된 C-인테인 태그 및 N-인테인 리간드를 갖는 스플릿 인테인 시스템을 사용하는 친화성 크로마토그래피에 관한 것이며, 여기서 표적 단백질은 천연 N-말단을 갖는 태그 없는 최종 생성물로서 정제될 수 있다.

Description

스플릿 인테인 시스템을 사용하는 단백질 정제

본 발명은, 주로 크로마토그래피 분야에서, 단백질 정제에 관한 것이다. 보다 밀접하게, 본 발명은 개선된 C-인테인 태그 및 N-인테인 리간드를 갖는 스플릿 인테인 시스템을 사용하는 친화성 크로마토그래피에 관한 것이며, 여기서 표적 단백질은 천연 N-말단을 갖는 태그 없는 최종 생성물로서 정제될 수 있다.

인테인은 효소 서열을 방해하고 2개의 플랭킹 폴리펩티드의 자체 절단 및 라이게이션을 촉매하여 활성 단백질을 생성하는 인-프레임 삽입으로서 발현되는 단백질 요소이다. 유전적으로, 인테인은 두 가지 별개의 방식으로 코딩된다: 2개의 플랭킹 엑스테인 서열을 방해하는 무손상 인테인으로서, 또는 스플릿 인테인으로서 (여기서 각 엑스테인 및 인테인의 일부는 2개의 상이한 유전자에 의해 코딩됨). 이들은 생명공학 및 단백질 정제 도구로서 큰 가능성을 갖고 있지만, 자연에서 발견되는 신속한 동력학 특성을 갖는 스플릿 인테인은 인테인-엑스테인 접합부의 특정 아미노산에 의존하여, 천연 단백질 서열의 친화성 정제 및 회수를 위해 인테인에 융합될 수 있는 단백질을 심각하게 제한한다. 특히, 노스톡 푼크티포르메(Nostoc punctiforme)로부터의 프로토타입 스플릿 인테인 DNAE는 단백질 정제 적용에 적합한 동력학 특성을 나타낸다. 그러나, 그의 활성은 C-엑스테인의 +2 위치에서의 페닐알라닌에 의존한다. 이 의존성은 심각하게 좁혀지고 그의 일반적인 적용가능성을 손상시킨다.

인테인은 재조합 단백질 정제를 위한 자기-절단 단백질로서의 적용을 포함하여 생명공학에서 여러 중요한 기능을 성취하도록 조작되었다. 스플릿 인테인은 친화성 리간드 및 자기-절단 특성을 동시에 제공할 수 있기 때문에 이와 관련하여 특히 유망하다. 단백질 정제에서, 정제의 대상체인 표적 단백질은 어느 하나의 엑스테인으로 치환될 수 있다. 현재까지, 스플릿 인테인의 DNAE 패밀리는 C-말단 절단 단백질 정제 접근법에서 가장 가능성이 높은 것으로 제시되어 있다.

WO2014/004336은 지지체에 부착될 수 있는 스플릿 인테인 N-단편 및 스플릿 인테인 C-단편에 융합된 단백질을 기재하고 있다. 고체 지지체는 입자, 비드, 수지 또는 슬라이드일 수 있다.

WO2014/110393은 스플릿 인테인 N-단편 및 정제 태그와 접촉되는 스플릿 인테인 C-단편에 융합된 관심 단백질을 기재하고 있다. N-단편은 정제 태그를 통해 고체상에 부착될 수 있으며, 친화성 정제 방법이 논의된다.

US 10 066027은 단백질 정제 시스템 및 상기 시스템을 사용하는 방법을 기재하고 있다. 고정화될 수 있는 N-말단 인테인 세그먼트, 및 자기-절단 특성을 가지며 관심 단백질에 부착될 수 있는 C-말단 인테인 세그먼트를 포함하는 스플릿 인테인이 개시되어 있다. N-말단 인테인 세그먼트에는 외인성 조건에 더 민감하게 만드는 민감도 향상 모티프가 제공되어 있다.

US 10 308 679는 N-인테인 폴리펩티드 및 N-인테인 가용화 파트너를 포함하는 융합 단백질, 및 이러한 융합 단백질을 포함하는 친화성 매트릭스를 기재하고 있다.

WO 2018/091424는 하기 단계를 포함하는, 아미노-말단, (N-말단), 스플릿 인테인 단편을 친화성 리간드로서 포함하는 친화성 크로마토그래피 수지의 제조 방법을 기재하고 있다: a) 박테리아 세포, 바람직하게는 이. 콜라이(E. coli)의 봉입체에서 불용성 단백질로서 N-말단 스플릿 인테인 단편 단백질을 발현하는 단계, b) 상기 봉입체를 수확하는 단계; c) 상기 봉입체를 가용화하고 발현된 단백질을 방출하는 단계; d) 고체 지지체 상에 상기 단백질을 결합시키는 단계; e) 상기 단백질을 리폴딩하는 단계; f) 고체 지지체로부터 상기 단백질을 방출하는 단계; 및 g) 친화성 크로마토그래피 수지를 형성하기 위해 크로마토그래피 수지 상에 리간드로서 상기 단백질을 고정화시키는 단계. 이 절차는 2-10 mg/ml 수지의 리간드 밀도의 고정화를 가능하게 할 수 있다.

상기 기재된 바와 같이, 스플릿 인테인은 조합된 친화성 태그 및 태그 절단 메커니즘을 사용하여 단백질 정제에 사용되었다. 그러나, 이러한 시스템의 유용성은 여러 인자에 의해 제한된다. 첫째, 절단을 수행하고 태그 없는 단백질의 정제를 달성하기 위해 의도된 생성물의 스플라이스 접합부에 아미노산 요구사항, 즉 C-엑스테인의 +2 위치에서의 Phe의 요구사항이 있다. N-말단에 무관한 아미노산이 없는 재조합 단백질 생산이 매우 바람직하다. 둘째, 단백질 방출 절단은 충분히 신속해야 하고, 허용가능한 수율을 제공해야 한다. 셋째, 고체 지지체에 부착하기 위한 스플릿 인테인 N- 또는 C-단편의 용해성 요구사항이 있다. 넷째, 지금까지 태그 없는 단백질의 대규모 정제에 적합한 이용가능한 스플릿 인테인 시스템이 없다.

본 발명은 선행 기술의 단점을 극복하고, 스플릿 인테인 시스템을 사용하는 단 하나의 신속한 친화성 크로마토그래피 단계에서 태그 없는/천연 단백질의 일반적인 정제를 가능하게 한다.

본 발명은 천연 스플릿 인테인의 N-인테인 단백질 변이체 서열 또는 천연 인테인 및 스플릿 인테인으로부터 유래된 컨센서스 서열을 제공하며, 여기서 N-인테인 변이체는 서열에 존재하는 모든 아스파라긴 (N) 아미노산 잔기를 제거하도록 천연 서열 또는 컨센서스 서열과 비교하여 변형된다. 바람직하게는 모든 이러한 N-인테인 변이체 서열은 위치 1에서의 시스테인 (C)을 시스테인이 아닌 임의의 다른 아미노산으로 치환하도록 추가로 변형된다.

본 발명은 천연 스플릿 인테인의 N-인테인 단백질 변이체 또는 인테인/스플릿 인테인으로부터 유래된 컨센서스 서열을 제공하며, 여기서 N-인테인 단백질 변이체는 변이체 서열의 위치 36에 아스파라긴 (N)을 포함하지 않는다. 이 위치는 1번인 초기 촉매 시스테인으로부터 시작하여 천연 스플릿 인테인과의 통상적인 클러스터 정렬에 따라 계산된다. 이 위치는 선행 기술 및 천연 N-인테인 서열에서 N으로 보존되지만, 본 발명자들은 이 위치가 탈아미드화에 덜 민감한 다른 아미노산, 예컨대 히스티딘 (H 또는 His) 또는 글루타민 (Q 또는 Gln)으로 돌연변이되어, 이에 의해 예를 들어 크로마토그래피 절차 동안 증가된 pH 값에 대한 저항성을 제공하기 때문에 중요한 증가된 알칼리 안정성을 달성할 수 있음을 발견하였다. 적어도 위치 36에서의 N은 돌연변이되어야 하지만, N-인테인 서열에서 더 많은 N이 바람직하게는 H 또는 Q로 돌연변이될 수 있다는 것도 고려된다.

본 발명은 또한 관심 표적 단백질 (POI)의 +2 위치에서의 페닐알라닌의 절대 요구사항을 극복하는 N- 및 C-인테인을 제공한다. 본 발명의 N- 및 C-인테인은 임의의 재조합 단백질의 생산에 사용될 수 있다. 본 발명의 N- 및 C-인테인을 사용함으로써, 태그 절단은 태그 인테인 및 POI의 정확한 접합부에서 발생할 것이며, 이는 POI가 친화성 태그에 의해 코딩되는 무관한 아미노산 없이 천연 형태로 발현될 것임을 의미한다. 더욱이, 본 발명의 인테인 서열을 사용하여, POI가 높은 수율 및 빠른 절단 동력학으로 생산된다. N-인테인은 알칼리 조건 하에 재생될 수 있는 고체상에 커플링된다.

본 발명은 첨부된 청구범위에 정의된 바와 같은 N-인테인, C-인테인, 스플릿 인테인 시스템 및 이를 사용하는 방법을 제공한다.

도 1은 SPR 바이오센서 칩에 커플링된 본 발명에 따른 N-인테인 리간드 (A40, A41 및 A48)에 대한 상대적 결합 용량을 제시하는 그래프이다.
도 2는 SPR 센서 칩에 커플링된 본 발명에 따른 N-인테인 리간드 (B72, B22, A48) 및 비교 리간드 (A53)에 대한 상대적 결합 용량을 제시하는 스테이플 다이어그램이다.
도 3은 본 발명의 N-인테인 리간드의 정적 결합 용량을 제시한다. 아미노산 분석 (AAA)은 통상적인 방법에 의해 수행된다. A48 프로토타입은 에폭시 화학에 의해 다공성 아가로스 입자에 커플링된다.
도 4a는 실험 6의 정제 결과의 크로마토그램이다.
도 4b는 실험 6으로부터의 SDS PAGE 결과를 제시한다.
도 5는 SPR 바이오센서 칩에 커플링된 본 발명에 따른 N-인테인 리간드 (A40 및 A48)에 대한 상대적 결합 용량을 제시하는 그래프이다.

정의

명세서 및 첨부된 청구범위에서 사용된 바와 같이, 단수형 "하나"는 문맥이 명백하게 달리 언급하지 않는 한 복수의 지시대상을 포함한다. 그러므로, 예를 들어 "관능기", "알킬" 또는 "잔기"에 대한 언급은 2개 이상의 이러한 관능기, 알킬 또는 잔기 등의 혼합물을 포함한다.

범위는 "약" 하나의 특정 값 및/또는 "약" 또 다른 특정 값으로 본원에서 표현될 수 있다. 이러한 범위가 표현될 때, 추가 측면은 하나의 특정 값 및/또는 다른 특정 값을 포함한다. 유사하게, 값이 근사치로서 표현될 때, 선행사 "약"을 사용하여, 특정 값이 추가 측면을 형성한다는 것이 이해될 것이다. 범위의 각각의 종점은 다른 종점과 관련하여 그리고 다른 종점과는 독립적으로 둘 다의 경우에 유의하다는 것이 추가로 이해될 것이다. 또한, 본원에 수많은 값이 개시되어 있고, 각각의 값은 또한 그 값 자체에 더하여 "약" 해당 특정 값으로서 본원에 개시되어 있는 것으로 이해된다. 예를 들어, 값 "10"이 개시되면, "약 10"도 개시되는 것이다. 또한, 2개의 특정 단위 사이의 각 단위가 또한 개시되는 것으로 이해된다. 예를 들어, 10 및 15가 개시되면, 11, 12, 13 및 14도 개시된다.

구체적으로 달리 언급하지 않는 한, 구성성분의 중량 퍼센트 (wt. %)는 구성성분이 포함된 제형 또는 조성물의 총 중량을 기준으로 한다.

본원에서 사용된 바와 같은 용어 "임의의" 또는 "임의로"는 후속적으로 기재된 사건 또는 상황이 발생할 수 있거나 발생할 수 없음을 의미하고, 설명은 상기 사건 또는 상황이 발생하는 경우 및 발생하지 않는 경우를 포함한다.

본원에서 사용된 바와 같은 용어 "접촉"은 화합물이 표적의 활성에 직접적으로 영향을 미칠 수 있는 방식으로; 즉, 표적 자체와 상호작용함으로써, 또는 간접적으로; 즉, 표적의 활성이 의존하는 또 다른 분자, 보조인자, 인자 또는 단백질과 상호작용함으로써, 2개의 생물학적 실체를 함께 가져오는 것을 지칭한다. "접촉"은 또한 공유결합적으로 또는 다른 방식으로 결합하는 2개의 생물학적 실체, 예컨대 펩티드의 상호작용을 용이하게 하는 것을 의미할 수 있다.

본원에서 사용된 바와 같은 "키트"는 키트를 구성하는 적어도 2개의 구성성분의 집합체를 의미한다. 함께, 구성성분은 주어진 목적을 위한 기능 단위를 구성한다. 개별 구성원 구성성분은 물리적으로 함께 또는 별도로 패키징될 수 있다. 예를 들어, 키트 사용 지침서를 포함하는 키트는 물리적으로 다른 개별 구성원 구성성분과 함께 지침서를 포함하거나 포함하지 않을 수 있다. 대신에, 지침서는 종이 형태 또는 컴퓨터 판독가능 메모리 장치에 공급되거나 인터넷 웹사이트로부터 다운로드될 수 있는 전자 형태의 별도의 구성원 구성성분으로서 또는 녹음된 프레젠테이션으로서 공급될 수 있다.

본원에서 사용된 바와 같은 "지침서(들)"는 키트와 관련된 관련 물질 또는 방법론을 설명하는 문서를 의미한다. 이들 물질은 하기의 임의의 조합을 포함할 수 있다: 배경 정보, 구성성분의 목록 및 이들의 이용가능성 정보 (구매 정보 등), 키트 사용을 위한 간략한 또는 상세한 프로토콜, 문제 해결, 참고문헌, 기술 지원, 및 임의의 다른 관련 문서. 지침서는 키트와 함께, 또는 종이 형태 또는 컴퓨터 판독가능 메모리 장치에 공급되거나 인터넷 웹사이트로부터 다운로드될 수 있는 전자 형태의 별도의 구성원 구성성분으로서 또는 녹음된 프레젠테이션으로서 공급될 수 있다. 지침서는 하나 이상의 문서로 구성될 수 있으며, 향후 업데이트를 포함하기 위한 것이다.

용어 "펩티드", "폴리펩티드" 및 "단백질"은 본원에서 상호교환가능하게 사용되며, 단백질 및 그의 단편을 포함한다. 폴리펩티드는 아미노산 잔기 서열로서 본원에 개시되어 있다. 이러한 서열은 아미노에서 카르복시 말단의 방향으로 왼쪽에서 오른쪽으로 작성된다. 표준 명명법에 따라, 아미노산 잔기 서열은 하기와 같이 표시된 바와 같이 세 글자 또는 한 글자 코드에 의해 명명된다: 알라닌 (Ala, A), 아르기닌 (Arg, R), 아스파라긴 (Asn, N), 아스파르트산 (Asp, D), 시스테인 (Cys, C), 글루타민 (Gln, Q), 글루탐산 (Glu, E), 글리신 (Gly, G), 히스티딘 (His, H), 이소류신 (Ile, I), 류신 (Leu, L), 리신 (Lys, K), 메티오닌 (Met, M), 페닐알라닌 (Phe, F), 프롤린 (Pro, P), 세린 (Ser, S), 트레오닌 (Thr, T), 트립토판 (Trp, W), 티로신 (Tyr, Y), 및 발린 (Val, V). 펩티드는 임의의 올리고펩티드, 폴리펩티드, 유전자 생성물, 발현 생성물 또는 단백질을 포함한다. 펩티드는 연속적인 아미노산으로 구성되며, 자연 발생 또는 합성 분자를 포함한다.

또한, 본원에서 사용된 바와 같은 용어 "펩티드"는 펩티드 결합 또는 변형된 펩티드 결합에 의해 서로 연결된 아미노산, 예를 들어 펩티드 동배체 등을 지칭하며, 20개의 유전자-코딩된 아미노산 이외의 변형된 아미노산을 함유할 수 있다. 펩티드는 자연적 프로세스, 예컨대 번역 후 프로세싱에 의해, 또는 관련 기술분야에 널리 공지된 화학적 변형 기술에 의해 변형될 수 있다. 변형은 펩티드 백본, 아미노산 측쇄 및 아미노 또는 카르복실 말단을 포함하여 펩티드의 어느 곳에서나 발생할 수 있다. 동일한 유형의 변형이 주어진 폴리펩티드의 여러 부위에서 동일하거나 다양한 정도로 존재할 수 있다. 또한, 주어진 펩티드는 많은 유형의 변형을 가질 수 있다. 변형은 제한 없이, 별개의 도메인 또는 모티프의 연결, 아세틸화, 아실화, ADP-리보실화, 아미드화, 공유결합 가교 또는 고리화, 플라빈의 공유결합 부착, 헴 모이어티의 공유결합 부착, 뉴클레오티드 또는 뉴클레오티드 유도체의 공유결합 부착, 지질 또는 지질 유도체의 공유결합 부착, 포스파티딜이노시톨의 공유결합 부착, 디술피드 결합 형성, 탈메틸화, 시스테인 또는 피로글루타메이트의 형성, 포르밀화, 감마-카르복실화, 글리코실화, GPI 앵커 형성, 히드록실화, 아이오딘화, 메틸화, 미리스토일화, 산화, 페길화, 단백질분해성 프로세싱, 인산화, 프레닐화, 라세미화, 셀레노일화, 황산화, 및 단백질에 아미노산의 운반-RNA 매개 첨가, 예컨대 아르기닐화를 포함한다. (문헌 [Proteins-Structure and Molecular Properties 2nd Ed., T. E. Creighton, W.H. Freeman and Company, New York (1993)]; [Posttranslational Covalent Modification of Proteins, B. C. Johnson, Ed., Academic Press, New York, pp. 1-12 (1983)] 참조).

본원에서 사용된 바와 같은 "변이체"는 원래 서열의 것과 동일하거나 실질적으로 유사한 생물학적 활성을 보유하는 분자를 지칭한다. 변이체는 동일하거나 상이한 종으로부터 유래하거나 천연 또는 이전 분자에 기초한 합성 서열일 수 있다. 더욱이, 본원에서 사용된 바와 같은 "변이체"는 부모 분자 (예를 들어, 본원에 개시된 단백질 또는 펩티드)의 구조로부터 획득된 구조를 갖고 구조 또는 서열이 본원에 개시된 것과 충분히 유사한 분자를 지칭하며, 그 유사성에 기초하여 관련 기술분야의 통상의 기술자는 모 분자와 비교하여 동일하거나 유사한 활성 및 유용성을 나타낼 것으로 예상할 것이다. 예를 들어, 주어진 펩티드에서 특정 아미노산을 치환하는 것은 모체와 유사한 활성을 갖는 변이체 펩티드를 생성할 수 있다.

본 발명의 문맥에서, 변이체 단백질의 치환은 하기와 같이 표시된다: [원래 아미노산/서열에서의 위치/치환된 아미노산]. 예를 들어, 히스티딘 (H)으로 돌연변이된 아미노산 서열의 위치 36에서의 아스파라긴 (N)은 "N36H" 또는 "N36에서 H"로서 상호교환가능하게 표시된다.

본원에서 사용된 바와 같은 용어 "관심 단백질 (POI)"은 임의의 합성 또는 자연 발생 단백질 또는 펩티드를 포함한다. 따라서 이 용어는 약물, 백신, 및 분자, 예컨대 단백질, 펩티드 등을 포함하는 생물약제로서 전통적으로 간주되는 화합물을 포함한다. 치료제의 예는 널리 공지된 문헌 참고문헌, 예컨대 머크 인덱스(Merck Index) (14판), 의사용 탁상 편람(Physicians' Desk Reference) (64판), 및 치료제의 약리학적 기초(The Pharmacological Basis of Therapeutics) (1판)에 기재되어 있으며, 제한 없이, 의약; 질환 또는 질병의 치료, 예방, 진단, 치유 또는 완화에 사용되는 물질; 신체의 구조 또는 기능에 영향을 미치는 물질, 또는 생리학적 환경에 배치된 후 생물학적으로 활성이 되거나 더 활성이 되는 전구약물을 포함한다.

본원에서 사용된 바와 같은 "단리된 펩티드" 또는 "정제된 펩티드"는 발현 숙주 세포 용해물, 성장 배지 구성성분, 완충액 구성성분, 세포 배양 상청액, 또는 합성 시험관내 번역 시스템의 구성성분을 포함하나 이에 제한되지는 않는, 펩티드가 자연에서 정상적으로 회합되는 물질, 또는 펩티드가 인공 발현 또는 생산 시스템에서 회합되는 물질이 실질적으로 없는 펩티드 (또는 그의 단편)를 의미하는 것으로 의도된다. 본원에 개시된 펩티드 또는 그의 단편은 예를 들어 천연 공급원 (예를 들어, 포유동물 세포)으로부터의 추출에 의해, 펩티드를 코딩하는 재조합 핵산의 발현 (예를 들어, 세포에서 또는 무세포 번역 시스템에서)에 의해, 또는 펩티드의 화학적 합성에 의해 수득될 수 있다. 또한, 펩티드 단편은 이들 방법 중 임의의 것에 의해 또는 전장 단백질 및/또는 펩티드를 절단함으로써 수득될 수 있다.

본원에서 사용된 바와 같은 단어 "또는"은 특정 목록의 임의의 한 구성원을 의미하고, 또한 해당 목록의 구성원들의 임의의 조합을 포함한다.

본원에서 사용된 바와 같은 어구 "핵산"은 왓슨-크릭 염기-쌍형성에 의해 상보적인 핵산에 혼성화할 수 있는 자연 발생 또는 합성 올리고뉴클레오티드 또는 폴리뉴클레오티드 (DNA 또는 RNA 또는 DNA-RNA 하이브리드, 단일-가닥 또는 이중-가닥, 센스 또는 안티센스 여부에 관계없이)를 지칭한다. 본 발명의 핵산은 또한 뉴클레오티드 유사체 (예를 들어, BrdU), 및 비-포스포디에스테르 뉴클레오시드간 연결 (예를 들어, 펩티드 핵산 (PNA) 또는 티오디에스테르 연결)을 포함할 수 있다. 특히, 핵산은 제한 없이, DNA, RNA, cDNA, gDNA, ssDNA, dsDNA 또는 이들의 임의의 조합을 포함할 수 있다.

본원에서 사용된 바와 같은 "단리된 핵산" 또는 "정제된 핵산"은 본 발명의 DNA가 유래된 유기체의 자연-발생 게놈에서 유전자를 플랭킹하는 유전자가 없는 DNA를 의미하는 것으로 의도된다. 따라서 이 용어는 예를 들어 벡터, 예컨대 자가 복제 플라스미드 또는 바이러스에 혼입되거나; 또는 원핵생물 또는 진핵생물의 게놈 DNA (예를 들어, 트랜스진)에 혼입되거나; 또는 별도의 분자 (예를 들어, PCR, 제한 엔도뉴클레아제 소화, 또는 화학적 또는 시험관내 합성에 의해 생산된 cDNA 또는 게놈 또는 cDNA 단편)로서 존재하는 재조합 DNA를 포함한다. 이것은 또한 추가 폴리펩티드 서열을 코딩하는 하이브리드 유전자의 일부인 재조합 DNA를 포함한다. 용어 "단리된 핵산"은 또한 단리된 DNA 분자에 의해 코딩되거나, 또는 화학적으로 합성되거나, 또는 적어도 일부 세포 구성성분, 예를 들어 다른 유형의 RNA 분자 또는 펩티드 분자로부터 분리되거나 실질적으로 없는 RNA, 예를 들어 mRNA 분자를 지칭한다.

본원에서 사용된 바와 같은 "엑스테인"은 인테인의 일부가 아니고 인테인의 절단 시 스플라이싱되거나 절단될 수 있는 인테인-변형 단백질의 부분을 지칭한다.

"인테인"은 단백질에서 인-프레임 개재 서열을 지칭한다. 인테인은 유리 인테인 및 성숙 단백질을 생성하기 위해 번역 후 단백질 스플라이싱 프로세스를 통해 단백질로부터 그의 자체 절단을 촉매할 수 있다. 인테인은 또한 인테인 N-말단 또는 인테인 C-말단 중 어느 하나, 또는 인테인-엑스테인 말단 둘 다에서 인테인-엑스테인 결합의 절단을 촉매할 수 있다. 본원에서 사용된 바와 같은 "인테인"은 미니-인테인, 변형된 또는 돌연변이된 인테인, 및 스플릿 인테인을 포함한다.

본원에서 사용된 바와 같은 용어 "스플릿 인테인"은 N-말단 및 C-말단 인테인 세그먼트가 스플라이싱 또는 절단 반응에 대해 기능적인 인테인으로 비공유결합적으로 재회합하거나 재구성할 수 있는 별도의 분자가 되도록 N-말단 인테인 세그먼트 및 C-말단 인테인 세그먼트 사이에 하나 이상의 펩티드 결합 파단이 존재하는 임의의 인테인을 지칭한다. 임의의 촉매적으로 활성인 인테인 또는 그의 단편은 본원에 개시된 시스템 및 방법에서 사용하기 위한 스플릿 인테인을 유도하는데 사용될 수 있다. 예를 들어, 한 측면에서 스플릿 인테인은 진핵생물 인테인으로부터 유래될 수 있다. 또 다른 측면에서, 스플릿 인테인은 박테리아 인테인으로부터 유래될 수 있다. 또 다른 측면에서, 스플릿 인테인은 고세균 인테인으로부터 유래될 수 있다. 바람직하게는, 그렇게 유래된 스플릿 인테인은 스플라이싱 반응을 촉매하는데 필수적인 아미노산 서열만을 보유할 것이다.

본원에서 사용된 바와 같은 "N-말단 인테인 세그먼트" 또는 "N-인테인"은 상응하는 C-말단 인테인 세그먼트와 조합될 때 스플라이싱 및/또는 절단 반응에 대해 기능적인 N-말단 아미노산 서열을 포함하는 임의의 인테인 서열을 지칭한다. 그러므로 N-말단 인테인 세그먼트는 또한 스플라이싱이 발생할 때 스플라이싱되는 서열을 포함한다. N-말단 인테인 세그먼트는 자연 발생 (천연) 인테인 서열의 N-말단 부분의 변형인 서열을 포함할 수 있다. 비-인테인 잔기는 또한 추가 기능성, 예컨대 친화성 정제되거나 공유결합적으로 고정화되는 능력을 제공하기 위해 인테인 세그먼트에 유전적으로 융합될 수 있다.

본원에서 사용된 바와 같은 "C-말단 인테인 세그먼트" 또는 "C-인테인"은 상응하는 N-말단 인테인 세그먼트와 조합될 때 스플라이싱 또는 절단 반응에 대해 기능적인 C-말단 아미노산 서열을 포함하는 임의의 인테인 서열을 지칭한다. 한 측면에서, C-말단 인테인 세그먼트는 스플라이싱이 발생할 때 스플라이싱되는 서열을 포함한다. 또 다른 측면에서, C-말단 인테인 세그먼트는 그의 C-말단에 융합된 펩티드 서열로부터 절단된다. C-말단 인테인의 C-말단으로부터 절단된 서열은 본원에서 "관심 단백질 POI"로 지칭되며, 이하에서 더 자세히 논의된다. C-말단 인테인 세그먼트는 자연 발생 (천연) 인테인 서열의 C-말단 부분의 변형인 서열을 포함할 수 있다. 예를 들어, C 말단 인테인 세그먼트는 이러한 추가 및/또는 돌연변이된 잔기의 포함이 C-말단 인테인 세그먼트가 스플라이싱 또는 절단에 대해 비기능적이게 하지 않는 한 추가 아미노산 잔기 및/또는 돌연변이된 잔기를 포함할 수 있다.

컨센서스 서열은 정렬된 관련 서열을 나타내는 DNA, RNA 또는 단백질의 서열이다. 관련 서열의 컨센서스 서열은 상이한 방식으로 정의될 수 있지만, 정상적으로 각 위치에서 가장 흔한 뉴클레오티드(들) 또는 아미노산 잔기(들)에 의해 정의된다. 본 발명의 컨센서스 서열의 예는 서열식별번호(SEQ ID NO): 6의 N-인테인 컨센서스 서열이다.

본원에서 사용된 바와 같은 용어 "스플라이싱하다" 또는 "스플라이싱한다"는 폴리펩티드의 중앙 부분을 절단하여 2개 이상의 더 작은 폴리펩티드 분자를 형성하는 것을 의미한다. 일부 경우에, 스플라이싱은 또한 2개 이상의 더 작은 폴리펩티드를 함께 융합하여 새로운 폴리펩티드를 형성하는 단계를 포함한다. 스플라이싱은 또한 스플릿 인테인의 작용을 통해 2개의 별도의 유전자 생성물에 코딩된 2개의 폴리펩티드의 연결을 지칭할 수 있다.

본원에서 사용된 바와 같은 용어 "절단하다" 또는 "절단한다"는 단일 폴리펩티드를 분할하여 2개 이상의 더 작은 폴리펩티드 분자를 형성하는 것을 의미한다. 일부 경우에, 절단은 종종 "단백질분해성 절단"으로 지칭되는 외인성 엔도펩티다제의 첨가에 의해 매개된다. 다른 경우에, 절단은 종종 "자기-절단"으로 지칭되는 절단된 펩티드 서열 중 하나 또는 둘 다의 고유 활성에 의해 매개될 수 있다. 절단은 또한 본원에 기재된 스플릿 인테인 시스템의 작용에서와 같이 비-단백질분해성 제3 펩티드의 첨가에 의해 유도되는 2개의 폴리펩티드의 자기-절단을 지칭할 수 있다.

용어 "융합된"은 공유결합적으로 결합된 것을 의미한다. 예를 들어, 제1 펩티드는 두 펩티드가 서로 공유결합적으로 결합될 때 (예를 들어, 펩티드 결합을 통해) 제2 펩티드에 융합된다.

본원에서 사용된 바와 같은 "단리된" 또는 "실질적으로 순수한" 물질은 자연적으로 동반되는 구성성분으로부터 분리된 것이다. 전형적으로, 폴리펩티드는 자연적으로 연관된 다른 단백질 및 자연-발생 유기 분자가 적어도 50 중량% (예를 들어, 60 중량%, 70 중량%, 80 중량%, 90 중량%, 95 중량% 및 99 중량%) 없을 때 실질적으로 순수하다.

본원에서, "결합하다" 또는 "결합한다"는 한 분자가 샘플 내의 또 다른 분자를 인식하여 이에 접착하지만, 샘플 내의 다른 분자를 실질적으로 인식하거나 접착하지 않는 것을 의미한다. 한 분자는 다른 분자에 대해 약 10⁵ 내지 10⁶ 리터/몰 초과의 결합 친화성을 갖는 경우 또 다른 분자에 "특이적으로 결합한다".

본원에 언급된 핵산, 뉴클레오티드 서열, 단백질 또는 아미노산 서열은 단리되거나 정제되거나 화학적으로 합성되거나 재조합 DNA 기술을 통해 생산될 수 있다. 이들 방법 모두는 관련 기술분야에 널리 공지되어 있다.

본원에서 사용된 바와 같은 용어 "변형된" 또는 "돌연변이된" ("변형된 인테인" 또는 "돌연변이된 인테인"에서와 같이)은 천연 또는 자연 발생 구조와 비교할 때 언급되는 핵산 또는 아미노산 서열, 예컨대 인테인에서의 하나 이상의 변형을 지칭한다. 이러한 변형은 치환, 첨가 또는 결실일 수 있다. 변형은 언급되는 구조, 예컨대 인테인의 하나 이상의 아미노산 잔기 또는 하나 이상의 뉴클레오티드에서 발생할 수 있다.

본원에서 사용된 바와 같은 용어 "변형된 펩티드", "변형된 단백질" 또는 "변형된 관심 단백질" 또는 "변형된 표적 단백질"은 변형된 단백질을 지칭한다.

본원에서 사용된 바와 같은 "작동가능하게 연결된"은 생체분자의 정상적인 기능이 수행될 수 있도록 서로에 대한 구성으로 2개 이상의 생체분자의 회합을 지칭한다. 뉴클레오티드 서열과 관련하여, "작동가능하게 연결된"은 서열의 정상적인 기능이 수행될 수 있도록 서로에 대한 구성으로 효소적 라이게이션에 의해 또는 다른 방식으로 2개 이상의 핵산 서열의 회합을 지칭한다. 예를 들어, 프리-서열 또는 분비성 리더를 코딩하는 뉴클레오티드 서열은 폴리펩티드의 분비에 참여하는 프리-단백질로서 발현되는 경우 폴리펩티드에 대한 뉴클레오티드 서열에 작동가능하게 연결되고; 프로모터 또는 인핸서는 코딩 서열의 전사에 영향을 미치는 경우 코딩 서열에 작동가능하게 연결되고; 리보솜 결합 부위는 서열의 번역을 용이하게 하도록 위치되는 경우 코딩 서열에 작동가능하게 연결된다.

"서열 상동성"은 핵산 또는 단백질 서열이 공통의 진화적 기원을 갖기 때문에 유사한 상황을 지칭할 수 있다. "서열 상동성"은 서열이 매우 유사함을 표시할 수 있다. 서열 유사성은 관찰가능하며; 상동성은 관찰에 기초할 수 있다. "매우 유사한"은 적어도 70% 동일성, 상동성 또는 유사성; 적어도 75% 동일성, 상동성 또는 유사성; 적어도 80% 동일성, 상동성 또는 유사성; 적어도 85% 동일성, 상동성 또는 유사성; 적어도 90% 동일성, 상동성 또는 유사성; 예컨대 적어도 93% 또는 적어도 95% 또는 심지어 적어도 97% 동일성, 상동성 또는 유사성을 의미할 수 있다. 뉴클레오티드 서열 유사성 또는 상동성 또는 동일성은 NCBI에서 입수가능한 문헌 [Myers et al. (1988) CABIOS 4:11-17]의 "Align" 프로그램을 사용하여 결정될 수 있다. 추가적으로 또는 대안적으로, 아미노산 서열 유사성 또는 동일성 또는 상동성은 NCBI에서 이용가능한 BlastP 프로그램 (Altschul et al. Nucl. Acids Res. 25:3389-3402)을 사용하여 결정될 수 있다. 대안적으로 또는 추가적으로, 용어 "유사성" 또는 "동일성" 또는 "상동성"은 예를 들어 뉴클레오티드 서열과 관련하여 두 서열 간의 상동성의 정량적 측정을 표시하는 것으로 의도된다.

대안적으로 또는 추가적으로, 서열과 관련하여 "유사성"은 동일한 뉴클레오티드를 갖는 위치의 수를 두 서열 중 더 짧은 것의 뉴클레오티드의 수로 나눈 것을 지칭하며, 여기서 두 서열의 정렬은 문헌 [Wilbur and Lipman algorithm. (1983) Proc. Natl. Acad. Sci. USA 80:726]에 따라 결정될 수 있다. 예를 들어, 20개 뉴클레오티드의 윈도우 크기, 4개 뉴클레오티드의 단어 길이, 및 4의 갭 페널티의 사용, 및 정렬을 포함한 서열 데이터의 컴퓨터-지원 분석 및 해석은 상업적으로 이용가능한 프로그램 (예를 들어, 인텔리제네틱스™ 스위트(Intelligenetics™ Suite), 인텔리제네틱스 인크.(Intelligenetics Inc.) (CA))을 사용하여 편리하게 수행될 수 있다. RNA 서열이 유사하다고 언급되거나 DNA 서열과 서열 동일성 정도를 갖는 경우, DNA 서열의 티미딘 (T)은 RNA 서열의 우라실 (U)과 동일한 것으로 간주된다. 하기 참고문헌은 또한 두 단백질의 아미노산 잔기의 상대적 동일성 또는 상동성 또는 유사성을 비교하기 위한 알고리즘을 제공하고, 추가적으로 또는 대안적으로 전술한 것과 관련하여, 퍼센트 상동성 또는 동일성 또는 유사성을 결정하기 위해 참고문헌을 사용할 수 있다. 문헌 [Needleman et al. (1970) J. Mol. Biol. 48:444-453]; [Smith et al. (1983) Advances App. Math. 2:482-489]; [Smith et al. (1981) Nuc. Acids Res. 11:2205-2220]; [Feng et al. (1987) J. Molec. Evol. 25:351-360]; [Higgins et al. (1989) CABIOS 5:151-153]; [Thompson et al. (1994) Nuc. Acids Res. 22:4673-480]; 및 [Devereux et al. (1984) 12:387-395]. "엄격한 혼성화 조건"은 관련 기술분야에 널리 공지된 용어이며; 예를 들어 문헌 [Sambrook, "Molecular Cloning, A Laboratory Manual" second ed., CSH Press, Cold Spring Harbor, 1989]; ["Nucleic Acid Hybridization, A Practical Approach", Hames and Higgins eds., IRL Press, Oxford, 1985]을 참조하며; 또한 서열 비교가 있는 도 2 및 그의 설명을 참조한다.

용어 "플라스미드" 및 "벡터" 및 "카세트"는 종종 세포의 중앙 대사의 일부가 아니며 대개 원형 이중-가닥 DNA 분자의 형태로 유전자를 보유하는 염색체외 요소를 지칭한다. 이러한 요소는 임의의 공급원으로부터 유래된 단일- 또는 이중-가닥 DNA 또는 RNA의 자가 복제 서열, 게놈 통합 서열, 파지 또는 뉴클레오티드 서열 (선형 또는 원형)일 수 있으며, 여기서 수많은 뉴클레오티드 서열은 세포 내로 적절한 3' 비번역된 서열과 함께 선택된 유전자 생성물에 대한 프로모터 단편 및 DNA 서열을 도입할 수 있는 고유한 구축물로 연결되거나 재조합된다. 전형적으로, "벡터"는 클로닝을 위한 추가적인 다중 삽입 부위를 함유하는 변형된 플라스미드 및 숙주 세포에서의 발현을 위해 선택된 유전자 생성물 (즉, 트랜스진)에 대한 DNA 서열을 함유하는 "발현 카세트"이다. 이 "발현 카세트"는 전형적으로 ORF의 전사 및 번역에 필요한 모든 필수 조절 서열과 함께 5' 프로모터 영역, 트랜스진 ORF 및 3' 종결자 영역을 포함한다. 그러므로, 발현 카세트의 숙주로의 통합은 카세트에서 트랜스진 ORF의 발현을 허용한다.

용어 "완충액" 또는 "완충된 용액"은 그의 짝산-염기 범위의 작용에 의해 pH 변화에 저항하는 용액을 지칭한다.

용어 "로딩 완충액" 또는 "평형 완충액"은 칼럼에 단백질 제제를 로딩하기 위해 단백질 제제와 혼합되는 염 또는 염들을 함유하는 완충액을 지칭한다. 이 완충액은 또한 로딩 전에 칼럼을 평형화하고 단백질을 로딩한 후 칼럼으로 세척하는데 사용된다.

용어 "세척 완충액"은 관심 단백질 (예를 들어 C-말단 인테인 단편에 커플링된 것과 같음)의 로딩 후에 및 관심 단백질의 용리 전에 칼럼 (예를 들어) 위로 통과되는 완충액을 지칭하기 위해 본원에서 사용된다. 세척 완충액은 원하는 단백질의 실질적인 용리 없이 하나 이상의 오염물질을 제거하는 역할을 할 수 있다.

용어 "용리 완충액"은 칼럼으로부터 원하는 단백질을 용리하는데 사용되는 완충액을 지칭한다. 본원에서 사용된 바와 같은 용어 "용액"은 물을 포함하는 완충된 또는 비완충된 용액을 지칭한다.

용어 "세척"은 고체 지지체, 예컨대 크로마토그래피 수지를 통해 또는 그 위로 적절한 완충액을 통과시키는 것을 의미한다.

고체 지지체로부터 분자 (예를 들어 원하는 단백질 또는 오염물질)를 "용리"한다는 용어는 이러한 물질로부터 분자를 제거하는 것을 의미한다.

용어 "오염물질" 또는 "불순물"은 정제될 단백질의 샘플에 존재하는 임의의 외래 또는 불쾌한 분자, 특히 생물학적 거대분자, 예컨대 DNA, RNA 또는 정제될 단백질이 아닌 단백질을 지칭한다. 오염물질은 예를 들어 정제될 단백질을 발현 및/또는 분비하는 세포로부터의 다른 단백질을 포함한다.

단백질 정제와 관련하여 사용된 바와 같은 용어 "분리하다" 또는 "단리하다"는 원하는 단백질 및 제2 단백질 또는 다른 오염물질 또는 불순물 혼합물을 모두 포함하는 혼합물에서 제2 단백질 또는 다른 오염물질 또는 불순물의 혼합물로부터 원하는 단백질을 분리하여, 원하는 단백질의 분자의 적어도 대부분이 제2 단백질의 분자 또는 다른 오염물질 또는 불순물의 혼합물의 적어도 대부분을 포함하는 혼합물의 부분으로부터 제거되도록 하는 것을 지칭한다.

원하는 단백질 및 하나 이상의 오염물질을 포함하는 조성물 또는 용액으로부터 원하는 단백질을 "정제하다" 또는 "정제하는"이라는 용어는 조성물 또는 용액으로부터 적어도 하나의 오염물질을 (완전히 또는 부분적으로) 제거함으로써 조성물 또는 용액 중 원하는 단백질의 순도 정도를 증가시키는 것을 의미한다.

N-인테인 단백질 변이체

본 발명은 광범위한 아미노산 저항성으로 절단하여 최종 생성물로서 태그 없는 관심 단백질 (POI)을 생성하는 본 발명에 따른 스플릿 인테인 시스템을 사용하는 단일 단계의 친화성 크로마토그래피 및 친화성 태그 절단 메커니즘에 관한 것이다. 인테인의 2개의 절반은 친화성 리간드 (N-인테인) 및 친화성 태그 (C-인테인)이며 빠르게 회합한다. 크로마토그래피 수지에 하나의 절반 (N-인테인)을 고정화시키는 것은 용액으로부터 POI에 커플링된 다른 절반 (C-인테인)의 캡처를 가능하게 한다. Zn²⁺ 이온의 존재 하에, 절단 반응이 억제되어, 불순물을 세척하면서 안정적인 복합체가 형성되는 것을 가능하게 한다. 불순물을 제거한 후, 킬레이트제 또는 환원제를 첨가하고, 절단 반응을 진행하여, POI의 수집을 가능하게 하는 반면, 인테인 태그는 크로마토그래피 수지에 연결된 동족 인테인에 비공유결합적으로 결합된 상태로 유지된다.

바람직하게는 본 발명은 천연 스플릿 인테인의 N-인테인 단백질 변이체 서열 또는 천연 인테인 및 스플릿 인테인으로부터 유래된 컨센서스 서열을 제공하며, 여기서 N-인테인 변이체는 서열에 존재하는 모든 아스파라긴 (N) 아미노산 잔기를 제거하도록 천연 서열 또는 컨센서스 서열과 비교하여 변형된다. 바람직하게는 모든 이러한 서열은 N-인테인 변이체 서열의 위치 1에 시스테인 (C)을 포함하지 않는다.

바람직하게는, 본 발명은 변이체 서열의 위치 36에 아스파라긴 (N)을 포함하지 않는 N-인테인 단백질 변이체 서열을 제공한다. 이 위치는 1번인 초기 촉매 시스테인으로부터 시작하여 천연 스플릿 인테인과의 통상적인 클러스터 정렬에 따라 계산된다. 이 위치는 선행 기술 및 천연 N-인테인 서열에서 N으로 보존되지만, 본 발명자들은 이 위치가 천연 N-인테인 단백질 서열과 비교하여 증가된 알칼리 안정성을 제공하는 아미노산으로 돌연변이될 수 있으며, 이는 예를 들어 크로마토그래피 절차 동안 증가된 pH 값에 대한 저항성을 제공하기 때문에 중요하다는 것을 발견하였다. 바람직하게는 증가된 알칼리 안정성을 제공하는 아미노산은 히스티딘 (H 또는 His) 또는 글루타민 (Q 또는 Gln)이다.

천연 인테인은 관련 기술분야에 공지되어 있다. 인테인 목록은 하기 표 1에서 볼 수 있다. 모든 인테인은 스플릿 인테인으로 만들어질 잠재성을 갖는 반면, 일부 인테인은 자연적으로 스플릿 형태로 존재한다. 표에서 볼 수 있는 모든 인테인은 스플릿 인테인으로 존재하거나, 보존된 N이 알칼리 안정성을 부여하는 또 다른 아미노산, 예컨대 H 또는 Q로 대체되도록 위치 36에서 본 발명에 따라 변형된 스플릿 인테인으로 만들어질 잠재성을 갖는다.

표 1-자연 발생 인테인

개시된 조성물의 스플릿 인테인 또는 개시된 방법에서 사용될 수 있는 스플릿 인테인은 변형된 또는 돌연변이된 인테인일 수 있다. 변형된 인테인은 N-말단 인테인 세그먼트, C-말단 인테인 세그먼트, 또는 둘 다에 대한 변형을 포함할 수 있다. 변형은 스플릿 인테인의 어느 한 부분의 N-말단 C-말단에 추가 아미노산을 포함할 수 있거나, 스플릿 인테인의 어느 한 부분 내에 있을 수 있다. 표 2는 아미노산, 이들의 약자, 극성 및 전하의 목록을 제시한다.

표 2-아미노산의 목록

바람직하게는, 본 발명은 노스톡 푼크티포르메 (Npu)의 천연 N-인테인 도메인의 N-인테인 단백질 변이체를 제공하며, 여기서 천연 N-인테인 도메인은 하기 서열을 가지며:

여기서 단백질 변이체는 서열식별번호: 1의 천연 N-인테인의 알칼리 안정성과 비교하여 N-인테인 단백질 변이체의 알칼리 안정성을 증가시키는 아미노산으로의 서열식별번호: 1의 위치 36에서의 아스파라긴 (N)의 아미노산 치환을 포함한다.

바람직하게는, 본 발명은 서열식별번호: 1의 N-인테인 단백질 변이체를 제공하며, 여기서 단백질 변이체는 서열식별번호: 1의 천연 N-인테인의 알칼리 안정성과 비교하여 N-인테인 단백질 변이체의 알칼리 안정성을 증가시키는 아미노산으로의 서열식별번호: 1의 위치 36에서의 아스파라긴 (N)의 아미노산 치환에 더하여, 시스테인이 아닌 임의의 다른 아미노산으로의 서열식별번호: 1의 위치 1에서의 시스테인 (C)의 아미노산 치환을 포함한다.

본 발명은 또한 참조 단백질의 N-인테인 단백질 변이체를 제공하며, 여기서 참조 단백질은 서열식별번호: 1과 적어도 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖고, 바람직하게는 여기서 참조 단백질은 서열식별번호: 1과 적어도 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖고, 여기서 본 발명의 N-인테인 단백질 변이체는 서열식별번호: 1의 천연 N-인테인의 알칼리 안정성과 비교하여 N-인테인 단백질 변이체의 알칼리 안정성을 증가시키는 아미노산으로의 참조 단백질의 위치 36에서의 아스파라긴 (N)의 아미노산 치환을 포함한다.

또 다른 실시양태에서, N-인테인은 N-인테인 컨센서스 유래 서열인 서열식별번호: 2의 아미노산 서열을 포함한다. 서열식별번호: 2에 기초한 N-인테인 변이체 서열은 또한 서열식별번호: 1의 천연 N-인테인의 알칼리 안정성과 비교하여 N-인테인 단백질 변이체의 알칼리 안정성을 증가시키는 N 이외의 위치 36에서의 아미노산을 포함한다. 바람직하게는 알칼리 안정성을 증가시키는 아미노산은 아스파라긴 (N)과 비교하여 탈아미드화에 덜 민감한 아미노산이다. 서열식별번호: 2의 아미노산 서열은 하기와 같다:

여기서

위치 20, 35, 70, 73 및 95에서의 X는 각각 독립적으로 K, R 또는 A로부터 선택되고;

위치 28에서의 X는 C, A 또는 S이고;

위치 36에서의 X는 N, H 또는 Q이고;

위치 25에서의 X는 N 또는 R이고;

위치 59에서의 X는 D 또는 C이고;

위치 80에서의 X는 E 또는 Q이고;

위치 90에서의 X는 Q, R 또는 K이다.

본 발명에 따른 N-인테인의 바람직한 실시양태는 본원에서 A48, B22, B72 및 A41로 지칭되는 N-인테인 변이체의 군으로부터 선택되며, 여기서: A48은 서열식별번호: 2의 서열을 가지며, 여기서:

위치 20, 35, 70, 73 및 95에서의 X는 R이고;

위치 28에서의 X는 A이고;

위치 36에서의 X는 H이고;

위치 25에서의 X는 N이고;

위치 59에서의 X는 D이고;

위치 80에서의 X는 E이고;

위치 90에서의 X는 Q이고;

B22는 서열식별번호: 2의 서열을 가지며, 여기서:

위치 20, 35, 70, 73 및 95에서의 X는 A이고;

위치 28에서의 X는 A이고;

위치 36에서의 X는 H이고;

위치 25에서의 X는 N이고;

위치 59에서의 X는 D이고;

위치 80에서의 X는 E이고;

위치 90에서의 X는 Q이고;

B72는 서열식별번호: 2의 서열을 가지며, 여기서:

위치 20, 35, 70, 73 및 95에서의 X는 K이고;

위치 28에서의 X는 C이고;

위치 36에서의 X는 H이고;

위치 25에서의 X는 N이고;

위치 59에서의 X는 D이고;

위치 80에서의 X는 E이고;

위치 90에서의 X는 Q이다.

A40은 서열식별번호: 2의 서열을 가지며, 여기서:

위치 20, 35, 70, 73 및 95에서의 X는 R이고;

위치 28에서의 X는 A이고;

위치 36에서의 X는 N이고;

위치 25에서의 X는 N이고;

위치 59에서의 X는 D이고;

위치 80에서의 X는 E이고;

위치 90에서의 X는 Q이다.

A41은 서열식별번호: 2의 서열을 가지며, 여기서:

위치 20, 35, 70, 73 및 95에서의 X는 K이고;

위치 28에서의 X는 A이고;

위치 36에서의 X는 N이고;

위치 25에서의 X는 N이고;

위치 59에서의 X는 D이고;

위치 80에서의 X는 E이고;

위치 90에서의 X는 Q이고;

비교 리간드 A53은 서열식별번호: 2의 서열을 가지며, 여기서:

위치 20, 35, 70, 73 및 95에서의 X는 K이고;

위치 28에서의 X는 C이고;

위치 36에서의 X는 N이고;

위치 25에서의 X는 N이고;

위치 59에서의 X는 D이고;

위치 80에서의 X는 E이고;

위치 90에서의 X는 Q이다.

본 발명의 N-인테인은 고체상, 예컨대 멤브레인, 섬유, 입자, 비드 또는 칩에 커플링될 수 있다. 고체상은 천연 또는 합성 기원의 크로마토그래피 수지, 예컨대 천연 또는 합성 수지, 바람직하게는 폴리사카라이드, 예컨대 아가로스일 수 있다. 고체상, 예컨대 크로마토그래피 수지에는 매립된 자성 입자가 제공되어 있을 수 있다. 또 다른 실시양태에서 고체상은 비확산 제한 수지/섬유질 물질이다.

이 경우에 고체상은 하나 이상의 중합체성 나노섬유 기질, 예컨대 전기방사된 중합체 나노섬유로부터 형성될 수 있다. 본 발명에서 사용하기 위한 중합체 나노섬유는 전형적으로 10 nm 내지 1000 nm의 평균 직경을 갖는다. 중합체 나노섬유의 길이는 특별히 제한되지 않는다. 중합체 나노섬유는 적합하게는 모노필라멘트 나노섬유일 수 있고, 예를 들어 원형, 타원형 또는 본질적으로 원형/타원형 단면을 가질 수 있다. 전형적으로, 하나 이상의 중합체 나노섬유는 각각 하나 이상의 중합체 나노섬유를 포함하는 하나 이상의 부직포 시트의 형태로 제공된다. 하나 이상의 중합체 나노섬유를 포함하는 부직포 시트는 각각의 나노섬유가 본질적으로 무작위로 배향된 상기 하나 이상의 중합체 나노섬유의 매트이며, 즉 나노섬유 또는 나노섬유들이 특정 패턴을 채택하도록 제작되지 않았다. 부직포 시트는 전형적으로 1 내지 40 g/m2의 면적 밀도를 갖는다. 부직포 시트는 전형적으로 5 내지 120 μm의 두께를 갖는다. 중합체는 크로마토그래피 방법에서 크로마토그래피 매질, 즉 흡착제로서 사용하기에 적합한 중합체여야 한다. 적합한 중합체는 폴리아미드, 예컨대 나일론, 폴리아크릴산, 폴리메타크릴산, 폴리아크릴로니트릴, 폴리스티렌, 폴리술폰, 예를 들어 폴리에테르술폰 (PES), 폴리카프로락톤, 콜라겐, 키토산, 폴리에틸렌 옥시드, 아가로스, 아가로스 아세테이트, 셀룰로스, 셀룰로스 아세테이트, 및 이들의 조합을 포함한다.

본 발명에 따른 N-인테인은 고체 지지체에 매우 높은 정도로 고정화될 수 있으며, 수지 (팽윤된 겔) ml당 0.2-2 μmole/ml N-인테인이 커플링된다.

본 발명에 따른 N-인테인은 C-말단 상의 하나 이상, 예컨대 적어도 2개의 Lys를 포함하는 Lys-꼬리를 통해 고체상에 커플링될 수 있다. 대안적으로, N-인테인은 C-말단 상의 Cys-꼬리를 통해 고체상에 커플링된다.

C-인테인 단백질 변이체

바람직하게는 본 발명은 또한 하기와 같은 하기 서열식별번호: 3의 서열 또는 이와 적어도 50%, 60%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 서열 및 바람직하게는 이와 적어도 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 서열을 포함하는 C-인테인을 제공한다:

N-인테인 및 C-인테인의 선택은 동일한 야생형 스플릿 인테인으로부터 유래될 수 있거나 (예를 들어, 둘 다 Npu로부터 유래됨, 또는 N- 또는 C-인테인의 변이체), 또는 대안적으로 상이한 야생형 스플릿 인테인 또는 컨센서스 스플릿 인테인 서열로부터 선택될 수 있음이 이해될 것이며, 이는 상이한 C-단편 (예를 들어, Ssp C-단편 또는 그의 변이체를 갖는 Npu N-단편 또는 그의 변이체)에 대한 N-단편의 친화성이 개시된 방법에서 사용하기에 충분한 결합 친화성을 여전히 유지한다는 것이 발견되었기 때문이다.

본 발명의 인테인 변이체를 포함하는 벡터

제3 측면에서, 본 발명은 서열식별번호: 3의 상기 C-인테인 및 관심 단백질 (POI)을 코딩하는 유전자를 포함하는 벡터에 관한 것이다. 또한, C-말단 인테인 세그먼트를 코딩하는 핵산을 포함하는 벡터, 뿐만 아니라 상기 벡터를 포함하는 세포주가 본원에 개시되어 있다. 본원에서 사용된 바와 같이, 플라스미드 또는 바이러스 벡터는 개시된 핵산, 예컨대 C-말단 인테인 세그먼트 및 관심 펩티드를 코딩하는 것을 분해 없이 세포 내로 수송하고 이들이 전달될 수 있는 세포에서 유전자의 발현을 제공하는 프로모터를 포함하는 작용제이다. 한 예에서, C-말단 인테인 세그먼트 및 관심 펩티드는 바이러스 또는 레트로바이러스로부터 유래된다. 레트로바이러스 벡터는 다른 바이러스 벡터보다 더 큰 유전적 페이로드, 즉 트랜스진 또는 마커 유전자를 운반할 수 있으며, 이러한 이유로 일반적으로 사용되는 벡터이다. 그러나, 비증식 세포에서는 유용하지 않다. 아데노바이러스 벡터는 상대적으로 안정적이고, 작업하기 쉽고, 높은 역가를 갖고, 에어로졸 제형으로 전달될 수 있고, 비분열 세포를 형질감염시킬 수 있다. 폭스 바이러스 벡터는 크고, 유전자 삽입을 위한 여러 부위를 가지며; 이들은 열안정적이고, 실온에서 저장될 수 있다.

스플릿 인테인 시스템

바람직하게는, 본 발명은 상기 기재된 바와 같은 N-인테인 및 C-인테인을 포함하는, 관심 단백질 (POI)의 친화성 정제를 위한 스플릿 인테인 시스템을 제공한다.

바람직하게는 N-인테인은 증가된 알칼리 안정성을 위한 N36H 돌연변이를 포함한다.

바람직하게는 N-인테인은 고체상에 부착되고, C-인테인은 POI와 공동-발현되고, POI의 친화성 정제를 위한 태그로서 사용된다. 그 반대의 경우도 가능하며, 즉, C-인테인을 고체상에 부착하고 N-인테인을 태그로서 사용하지만, 전자가 바람직하다.

본 발명에 따른 스플릿 인테인 시스템에서 N-인테인 리간드의 알칼리 안정성은 알칼리 조건, 예컨대 0.05-0.5 M NaOH 하에 고체상으로부터 POI의 절단 후 재생을 가능하게 한다. 고체상은 최대 100회 재생될 수 있다.

한 실시양태에서, C-인테인 및 추가 태그는 POI와 공동-발현된다. 추가 태그는 임의의 통상적인 크로마토그래피 태그, 예컨대 IEX 태그 또는 친화성 태그일 수 있다.

관심 단백질 (POI)을 정제하는 방법

제5 측면에서, 본 발명은 본 발명에 따른 스플릿 인테인 시스템을 사용하여 관심 단백질 (POI)을 정제하는 방법에 관한 것이며, 방법은 중성 pH, 예컨대 6-8에서 및 (자발적 절단을 손상시키는) 2가 양이온의 존재 하에 C-인테인 및 N-인테인을 회합시키는 단계; 2가 양이온의 존재 하에 상기 고체상을 세척하는 단계; C-인테인 및 POI 사이의 자발적 절단을 허용하도록 킬레이트제를 첨가하는 단계; 태그 없는 POI를 수집하는 단계; 및 알칼리 조건, 예컨대 0.5M NaOH 하에 상기 고체상을 재생하는 단계를 포함한다.

이 프로토콜은 Zn에 민감하지 않은 단백질에 적합하다. 장점은 수지와의 긴 접촉 시간 및 큰 샘플 부피의 첨가이다. 샘플 로딩은 긴 시간 동안, 예컨대 최대 1.5시간 동안 이루어질 수 있다.

본 발명에 따라 30% 초과, 바람직하게는 50% 초과, 가장 바람직하게는 80% 초과의 POI 수율이 4시간 미만의 절단에서 달성된다.

본 발명은 N-인테인이 고체상에 고정화될 때 높은 리간드 밀도를 가능하게 한다. 바람직하게는 N-인테인은 단백질 정제를 위한 크로마토그래피 수지, 예컨대 아가로스 또는 임의의 다른 적합한 수지에 부착된다. 본 발명에 따라 침강된 수지 ml당 0.2-2 μmole/ml C-인테인 결합된 POI의 정적 결합 용량을 달성하는 것이 가능하다.

친화성 태그

본 발명은 또한 관심 단백질 (POI)의 정제 방법으로서, POI를 본 발명에 따른 C-인테인 및 추가 태그와 공동-발현하는 단계; 상기 추가 태그를 고체상 상의 그의 결합 파트너에 결합시키는 단계; POI 및 C-인테인을 절단하는 단계; 중성 pH에서 고체상에 부착된 N-인테인에 상기 C-인테인을 결합시키고, 상기 POI로부터 상기 결합된 C-인테인 및 N-인테인을 절단하는 단계; 및 알칼리 조건, 예컨대 0.5M NaOH 하에 상기 고체상을 재생하는 단계를 포함하는 방법에 관한 것이다. 이 트윈 태그의 목적: 증가된 순도 (이중 친화성 정제를 가능하게 함), 용해성, 검출능.

친화성 태그는 단백질의 거동을 변화시키는 단백질 코딩 서열과 함께 프레임에서 클로닝된 펩티드 또는 단백질 서열일 수 있다. 친화성 태그는 세포로부터 단백질을 정제하는 방법에서 사용될 수 있는 단백질의 N- 또는 C-말단에 첨부될 수 있다. 친화성 태그를 포함하는 펩티드를 발현하는 세포는 상청액/세포 배양 배지에서 신호 서열로 발현될 수 있다. 친화성 태그를 포함하는 펩티드를 발현하는 세포는 또한 펠릿화, 용해될 수 있으며, 세포 용해물은 친화성 태그에 리간드를 표시하는 칼럼, 수지 또는 기타 고체 지지체에 적용될 수 있다. 친화성 태그 및 임의의 융합된 펩티드는 고체 지지체에 결합되어 있으며, 이는 또한 비결합된 (오염물질) 단백질을 제거하기 위해 완충액을 사용하여 수 차례 세척될 수 있다. 관심 단백질은 친화성 태그에 부착된 경우, 친화성 태그가 리간드로부터 해리되어 정제된 단백질을 생성하도록 완충액을 통해 고체 지지체로부터 용리될 수 있거나, 또는 가용성 프로테아제를 사용하여 결합된 친화성 태그로부터 절단될 수 있다. 본원에 개시된 바와 같이, 친화성 태그는 활성 인테인 복합체에서 C-인테인 세그먼트의 자기-절단 메커니즘을 통해 절단된다.

친화성의 예는 융합된 표적 단백질의 정제를 용이하게 하기 위해 고정화된 말토스에 결합할 수 있는 말토스 결합 단백질; 고정화된 키틴에 결합할 수 있는 키틴 결합 단백질; 고정화된 글루타티온에 결합할 수 있는 글루타티온 S 트랜스퍼라제; 고정화된 킬레이트된 금속에 결합할 수 있는 폴리-히스티딘; 고정화된 항-FLAG 항체에 결합할 수 있는 FLAG 옥타펩티드를 포함하나 이에 제한되지는 않는다.

친화성 태그는 또한 선택적 침전, 이온 교환 크로마토그래피, 침전-가능 리간드에 대한 결합, 투석 (표적 단백질의 크기 및/또는 전하를 변화시킴으로써) 및 기타 고도로 선택적인 분리 방법을 포함하나 이에 제한되지는 않는 다양한 방법을 통해 개시된 변형된 펩티드를 사용하여 관심 단백질의 정제를 용이하게 하기 위해 사용될 수 있다.

일부 측면에서, 리간드에 실제로 결합하지 않지만 대신에 선택적으로 침전되거나 고정화된 상응하는 결합 도메인에 대한 리간드로서 작용하는 친화성 태그가 사용될 수 있다. 이들 경우에, 태그는 보다 일반적으로 정제 태그로 지칭된다. 예를 들어, ELP 태그는 특정 염 및 온도 조건 하에 선택적으로 침전되어, 융합된 펩티드가 원심분리에 의해 정제되도록 한다. 또 다른 예는 고정화된 단백질 A 또는 단백질 G-결합 도메인에 대한 리간드 역할을 하는 항체 Fc 도메인이다.

관심 단백질

모든 프로토콜에 대한 표적 단백질은 하기와 같다: 임의의 재조합 단백질, 특별히 천연 또는 거의 천연 N-말단 서열을 필요로 하는 단백질, 예를 들어 치료 단백질 후보, 생물제제, 항체 단편, 항체 모방체, 단백질 스캐폴드, 효소, 재조합 단백질 또는 펩티드, 예컨대 성장 인자, 시토카인, 케모카인, 호르몬, 항원 (바이러스, 박테리아, 효모, 포유동물) 생산, 백신 생산, 세포 표면 수용체, 융합 단백질.

본 발명은 이제 일부 비제한적인 실시예 및 첨부 도면과 관련하여 더 자세히 설명될 것이다.

실시예

실험 1: 본 발명의 N-인테인 리간드의 알칼리 안정성

본 발명에 따른 N-인테인 리간드 A40, A41 및 A48을, 약 450 반응 단위 (RU) 이상의 고정화된 수준을 제공하기에 충분한 양으로 비아코어(Biacore)™ CM5 센서 칩 (씨티바, 스웨덴) 상에 고정화시켰다. 고정화된 표면에 대한 C-인테인 태그부착된 POI의 상대적 결합 용량을 추적하기 위해, 20 μg/ml C-인테인 (서열식별번호: 3) 태그부착된 녹색 형광 단백질 (GFP)을 칩 위로 1분 동안 유동시키고, 신호 강도를 주목하였다. 그 후, 표면을 제자리 세정 (CIP), 즉 10분 동안 실온 22 ± 3℃에서 100 mM NaOH, 4 M 구아니딘-HCl로 플러싱하였다. 이것을 50 사이클 동안 반복하였고, 고정화된 리간드 알칼리 안정성은 각 사이클 후에 상대적 C-인테인 태그부착된 GFP 결합 용량 (신호 강도)의 상대적 손실로 이어졌다.

결과는 도 1에 제시되어 있고, 리간드 A48 (N36H 돌연변이 포함)이 리간드 A41 및 A40과 비교하여 개선된 알칼리 안정성을 가짐을 표시한다. 알칼리 안정성은 천연 서열과 비교하여 추가로 개선되었다. 또한, N36H 돌연변이는 야생형 Npu N-인테인 서열 (서열식별번호: 1과 비교하여 C1A 돌연변이를 갖는 A52)과 비교하여 알칼리 안정성을 유의하게 개선하였다.

50 CIP 사이클 후 상대적 잔여 결합 용량 (%)는 A40 및 A41의 경우 55%인 반면, A48의 경우 69%였다. 0.5M NaOH를 사용한 알칼리 안정성은 도 5에 제시되어 있다.

도 5는 20 사이클 동안 A40 및 A48에 대한 결과를 제시한다. 상대적 잔여 결합 용량 (%)

CIP: 2분. 100 mM NaOH, 4 M Gdn-HCl, 이어서 2분. 0.5 M NaOH.

실험 2: 본 발명의 N-인테인 리간드의 알칼리 안정성

정제된 N-인테인 리간드 A53, B72, B22 및 A48을, 약 450 반응 단위 (RU) 이상의 고정화된 수준을 제공하기에 충분한 양으로 비아코어™ CM5 센서 칩 (씨티바, 스웨덴) 상에 고정화시켰다. 고정화된 표면에 대한 비절단가능한 C-인테인 태그부착된 POI의 상대적 결합 용량을 추적하기 위해, 20 μg/ml 비절단가능한 C-인테인 (서열식별번호: 3) 태그부착된 IL-1b를 칩 위로 1분 동안 유동시키고, 신호 강도를 주목하였다. 그 후, 표면을 제자리 세정 (CIP), 즉 10분 동안 실온 22 ± 3℃에서 100 mM NaOH, 4 M 구아니딘-HCl로 플러싱하였다. 이것을 50 사이클 동안 반복하였고, 고정화된 리간드 알칼리 안정성은 각 사이클 후에 비절단가능한 C-인테인 태그부착된 IL-1b 결합 용량 (신호 강도)의 상대적 손실로 이어졌다.

결과는 도 2에 제시되어 있고, N36H 돌연변이를 갖는 3개의 리간드 (A48, B22 및 B72) 모두가 리간드 A53과 비교하여 개선된 알칼리 안정성을 가짐을 표시한다. 50 CIP 사이클 후 상대적 잔여 결합 용량 (%)은 A53의 경우 오직 20%인 반면, B72의 경우 28%, B22의 경우 30% 및 A48의 경우 35%였다.

실험 3: 아가로스 겔 수지에 대한 N-인테인 리간드 A48의 고정화

5 밀리리터의 에폭시 활성화된 가교된 활성화된 겔 수지를 폴리프로필렌 테스트-튜브에 첨가하였다. 포스페이트 완충액 중 C-말단 Lys-꼬리를 갖는 N-인테인 리간드 A48 135 밀리그램에 상응하는 2.7 밀리리터를 튜브에 첨가한 후, 1.3 밀리리터의 포스페이트 완충액 (pH 12.1)을 첨가하여 아가로스 수지 슬러리를 약 50%로 조절한 후, 2 그램의 황산나트륨을 첨가하였다. 생성된 반응 혼합물의 pH를 11.5로 조절하였다. 그리고 반응 혼합물을 진탕 테이블에서 33℃까지 가열하고, 33℃에서 4시간 동안 계속 진탕하였다. 그 후, 슬러리를 유리 필터로 옮기고, 10 밀리리터의 증류수로 3회 세척하였다. 세척 후, 겔을 3구 둥근 바닥 플라스크 (RBF)로 옮기고, 375 마이크로리터의 티오글리세롤을 갖는 5 밀리리터의 Tris 완충액 (pH 8.6)을 첨가하였다. 반응 혼합물을 45℃에서 2시간 동안 진탕 테이블에 두었다. 반응 후, 슬러리를 유리 필터로 옮겼다. 겔을 5 밀리리터의 염기성 세척 완충액으로 3회 세척한 후, 5 밀리리터의 산성 세척 완충액으로 3회 세척하였다. 이 염기/산 세척을 2회 더 반복하여, 이 단계에서 총 18회 세척하였다. 그 후, 겔 수지를 5 밀리리터의 증류수로 10회 세척하였다. 세척되고 배수된 겔을 분석 전에 냉장고에서 20% 에탄올에서 보관하였다.

겔 수지의 건조 중량은 겔 1 밀리리터의 중량을 측정함으로써 결정하였다. 샘플 준비에서, 2 그램의 배수된 겔 수지를 2 그램의 물과 잘 혼합하여 약 50% 수지 슬러리를 제공한 후, 슬러리를 1 mL 테프론 큐브에 첨가하였다. 그 후, 진공을 적용하여 큐브의 겔을 배수하였으며, 그러므로 1 mL의 겔을 수득하였다. 겔을 건조 중량 저울로 옮겼다. 건조 온도를 105℃로 설정하고 35분 후에 중량을 결정하였다.

건조 중량 결정 후 아미노산 분석을 측정하였다. 상응하는 건조 중량 및 단백질의 크기 및 1차 아미노 서열의 정보를 사용하여, 리간드 밀도를 mg/mL 겔 수지에서 유도할 수 있었다.

커플링된 아가로스 수지에 대한 결과는 90.6 mg/ml의 건조-중량 및 1.38 umole/ml에 상응하는 18.4 mg/ml의 리간드 함량이었다.

실험 4: 리간드 밀도와 관련된 정적 결합 용량

본원에 제시된 제안된 용량 방법은 테스트 튜브에서 수지의 결합 용량을 측정할 수 있다.

반응 설정

간단히 말해서, 다양한 리간드 밀도를 갖는 고정화된 A48 리간드를 갖는 프로토타입 수지 및 이중 태그부착된 테스트-단백질 A43 (서열식별번호: 5)을 검정 완충액 (2x PBS)에서 각각 2.5% 수지 슬러리 및 0.4mg/mL로 별도로 희석하였다. 50μL의 2.5% 수지 슬러리를 일루스트라(ILLUSTRA)™ 마이크로스핀 칼럼에 첨가한 다음, 150μL의 희석된 A43 (서열식별번호: 5)을 첨가하였다. 반응물을 3000rcf에서 1분 동안 원심분리하기 전에 2시간 고정된 시점 동안 22℃에서 1450rpm에서 진탕하면서 인큐베이션하도록 하였다.

SDS-PAGE

원심분리된 샘플 (절단된 단백질 및 비결합된 비절단된 단백질 함유)을 2x SDS-PAGE 환원 샘플 완충액과 1:1 혼합하고, 5분 동안 95℃에서 끓이고, SDS-PAGE (18μL 로딩)를 수행하였다. 밀도계 부피로부터 농도를 계산할 수 있기 위해, C-인테인 태그부착된 테스트-단백질, A43 (서열식별번호: 5) 표준을 첨가하였다 (대개 18.75-300μg/mL 사이의 5점 표준). 겔을 60분 동안 쿠마시 염색 (~100mL/겔)한 후, 온화하게 진탕하면서 120-180분 동안 실온에서 탈색하였다 (배경이 완전히 깨끗해질 때까지). IQ TL 소프트웨어를 사용하여 비절단된/비결합된 및 절단된 테스트-단백질의 밀도계 정량화를 수행하였다. 그 후, 밀도계 원시 데이터를 마이크로소프트 엑셀로 내보냈다.

SBC 계산

반응에서 테스트-단백질 입력이 알려져 있기 때문에, 하기 방정식에 의해 정적 결합 용량 (SBC)을 간접적으로 계산할 수 있다:

도 3은 본 발명의 N-인테인 리간드의 정적 결합 용량을 제시한다. 아미노산 분석 (AAA)은 통상적인 방법에 의해 수행되었다. A48 프로토타입은 에폭시 화학에 의해 다공성 아가로스 입자에 커플링되었다.

실험 5: Zn 프로토콜을 사용한 및 이를 사용하지 않은 신장 인자 G의 정제

써모아나에로박터 텡콘겐시스(Thermoanaerobacter tengcongensis)로부터의 신장 인자 G (Ef-G)를 고정화된 리간드 A48을 갖는 수지 프로토타입을 사용하여 이 실시예에서 정제하였다. C-인테인 (서열식별번호: 3) 태그부착된 EfG를 이. 콜라이 균주 BL21 (DE3)에서 세포내에서 발현하였다.

발효 수확 후 동결된 세포-펠릿을 해동하고, 자성 교반에 의해 추출 완충액 (20 mM Tris-HCl, pH 8.0)으로 재현탁시켰다. DNAse I (소 췌장) 및 1 mM MgSO₄를 첨가한 후, 리소자임 (계란)을 첨가하였다. 30분 동안 실온에서 교반한 후, 재현탁되고 리소자임 처리된 세포 현탁액을 수조에서 70-75℃로 가열하고, 이 온도에서 5분 동안 유지하였다. 추출물을 얼음 위에서 잠시 냉각한 후, 추출물을 원심분리에 의해 정화하였다.

Zn-비함유 프로토콜을 사용한 정제는 AKTA™ 아반트(Avant) 시스템에서 샘플 로딩 및 세척 동안 2 ml/분으로 수행한 후 1 ml/분으로 수행하였다. 고정화된 A48 리간드를 함유하는 1 ml 하이트랩™ 칼럼을 사용하였다. C-인테인 태그부착된 표적 단백질의 평형화 및 결합을 pH 6.3에서 100 mM NaCl로 보충된 20 mM MES 완충액에서 수행하였고, 2M 아세트산을 사용하여 샘플을 pH 6.3으로 조절하였다. 샘플 적용 후 칼럼 세척 및 후속 용리를 pH 8.0에서 400 mM NaCl로 보충된 20 mM Tris-HCl 완충액으로 수행하였다. 칼럼 세척 후, 유동을 실온에서 4시간의 인큐베이션 동안 중단한 다음, 절단된 EfG를 용리하였다. 유동의 제2 정지를 첨가하여 제2 용리를 허용하였으며, 이를 추가 16시간의 인큐베이션 후에 수행하였다.

하이트랩(HiTrap)™ 칼럼에서 4시간 인큐베이션 후에 17.8 mg 순수한, 태그-비함유 EfG를 용리하였다. 용리된 단백질 및 CIPed 단백질 간의 질량 차이는 질량 분광광도법 분석에 따른 C-인테인 태그의 질량과 동일하였다. SDS-PAGE에 따른 순도는 슈퍼덱스(Superdex)™ 200 증가에 대한 SEC-분석에서와 마찬가지로 높았다. 총 단백질 양을 280 nm에서의 이론적 UV 흡수 계수 및 희석된 용리 및 CIP 분획에 대한 UV-신호로부터 계산하였다.

평형화 완충액 및 정화된 샘플에 대한 Zn-이온을 포함하는 프로토콜을 사용하여 정제를 반복하였다. 최종 Zn-농도는 1.6 mM이었다. 유속을 샘플 적용 동안 0.5 ml/분으로 감소시킨 후, 세척 및 용리 동안 1 ml/분으로 증가시켰다. 세척 및 용리를 50 mM Tris-HCl, 20 mM 이미다졸 완충액 pH 7.5로 수행하였다. 이 정제에서 단 하나의 용리 피크만이 수집되었으며, 이는 칼럼 세척 후 4시간의 인큐베이션 후였다.

하이트랩™ 칼럼에서 4시간 인큐베이션 후 16.6 mg 순수한, 태그-비함유 EfG를 용리하였다. 슈퍼덱스™ 200 증가에 대한 SEC-분석에 따른 순도는 92%였다. 총 단백질 양을 280 nm에서의 이론적 UV 흡수 계수 및 희석된 용리 분획에 대한 UV-신호로부터 계산하였다.

실험 6: IL-1β의 정제

고정화된 A48 리간드를 함유하는 1 ml 하이트랩™ 칼럼을 이. 콜라이 BL21 (DE3)에서 세포내에서 발현되고 초음파처리에 의해 용해된 C-인테인 태그부착된 표적 단백질 IL-1β (서열식별번호: 5)의 정제에 사용하였다. 가용성 단백질을 원심분리에 의해 수확하고, A48 리간드로 고정화된 1mL 하이트랩™ 칼럼에 로딩하였다. Zn-비함유 프로토콜 (실험 4에서와 같이)을 샘플 로딩 및 세척 동안 4 ml/분 (600cm/h 선형 유속)으로 AKTA™ 아반트 시스템에서 사용하였다. 그 후, 실행을 4시간 동안 일시 중지한 다음, 1 mL/분으로 다시 유동을 개시하여 절단된 단백질 (4h 절단 분획)을 용리하였다. 그 후, 실행을 추가 12시간 동안 다시 일시 중지한 다음, 1 mL/분으로 유동을 시작하여 4시간 후에 비절단된 단백질을 용리하였다. 세척 및 용리의 평형화 및 결합을 하나의 단일 완충액으로 수행하였다. 정제로부터의 크로마토그램은 도 4a에 제시되어 있다. 출발 물질, 플로우 스루, 세척 분획, 4h 및 16h 용리 분획은 SDS-PAGE 및 쿠마시 염색 및 IQTL 소프트웨어를 사용한 후속 분석을 거쳤다 (도 4b).

하이트랩™ 칼럼에서 4시간 인큐베이션 후에 9.4 mg 절단된 IL-1β가 용리되었고, 16시간 후에 추가적인 1.1mg이 용리되었다. 순도는 SDS-PAGE 분석에 따라 99.5 (4시간) 및 99.8% (16시간)였다. 총 단백질 양을 280 nm에서 절단된 단백질의 이론적 UV 흡수 계수로부터 계산하였다.

실험 7: SARS-COV-2의 수용체 결합 도메인의 정제

C-인테인으로 태그부착된 SARS-COV-2 NCBI의 수용체 결합 도메인 (RBD)은 ExpiHEK 세포에서 발현되었고, 세포 배양 배지에서 분비되었다. AKTA™ 아반트 FPLC 시스템을 사용하여 세포 배양 상청액에 염 또는 기타 첨가제를 첨가하지 않고 고정화된 A48 리간드를 갖는 1mL 하이트랩 칼럼에 대략 210mL 상청액을 로딩하였다. 샘플 적용 및 세척을 4mL/분 (로드 시간 ~52.5분 (600cm/h 선형 유속))으로 수행한 다음, 6 칼럼 부피의 세척 후, 4시간 동안 일시 중지/유지 단계를 수행하였다. 용리 단계를 1mL/분으로 수행하였다. 칼럼을 추가 68시간 동안 방치한 후 제2 용리를 수행하였다. 300mM NaCl로 보충된 단일 40mM 포스페이트 완충액 pH 7.4 완충액을 모든 크로마토그래피 단계에 사용하였다.

이론적 흡광도 0.1% 계수를 사용하여 유니콘(Unicorn)™ 소프트웨어 (씨티바 스웨덴 아베) 내에서 단백질 농도 및 수율을 결정하였다. 순도를 밀도계 SDS-PAGE 분석에 의해 결정하였다. 이 실험을 위해 총 14.1mg의 절단된 단백질이 96% 초과의 순도로 수득되었다. 이론적 분자량은 ~25kDa인 반면, 실험적 SDS-PAGE 분석은 33 kDa의 분자량을 나타내며, 이는 2개의 글리코실화에 의해 설명되고, 또한 질량 분광광도법 분석에 의해 결정되었다.

CCT-RBD 단백질은 하기 서열을 갖는다:

신호 서열- 굵은 밑줄.

CCT-태그- 점선 밑줄.

RBD 도메인은 이중 밑줄임.

His Tag- 파선 밑줄

절단된 단백질로부터의 순도 결과는 표 3에서 볼 수 있다.

표 3

실험 8: 2개의 칼럼에 대한 탠덤 태그부착 및 친화성 정제

이. 콜라이 BL21(DE3)을 A43 발현 플라스미드 트윈스트렙(TwinStrep)™ 및 C-인테인 (서열식별번호: 3) 태그부착된 IL-1b로 형질전환하고, 50 μg/ml 카나마이신을 함유하는 한천 플레이트에 플레이팅하였다. 다음날, 단일 콜로니를 고르고, 5 ml의 루리아-버타니(Luria-Bertani) (LB) 브로쓰에서 OD600 0.6으로 성장시켰다. 배양물을 동일한 항생제를 함유하는 200 ml LB 브로쓰로 옮기고, OD600이 0.6이 될 때까지 37℃에서 성장시켰다. 이소프로필 b-D-1-티오갈락토피라노사이드 (IPTG, 0.5 mM)를 첨가함으로써 22℃에서 16시간 동안 단백질 발현을 유도하였다. 발현 후, 세포를 15분 동안 4,000 x g에서 원심분리에 의해 수확하고, 사용할 때까지 -80℃에서 저장하였다.

정제를 위해, 세포 펠릿을 습윤-중량 그램당 10 ml로 완충액 A1 (100 mM Tris-HCl, 150 mM NaCl, 1 mM EDTA, pH 8.0)에 재현탁하고, 초음파처리 (소닉스 비브라셀(Sonics Vibracell), 마이크로팁, 30% 진폭, 2초 켜기, 4초 끄기, 총 3분)에 의해 파괴하였다.

가용성 분획을 함유하는 상청액을 4℃에서 20분 동안 40,000 x g에서 원심분리 후 수집하고, 5 ml 하이트랩™ 칼럼, 스트렙탁틴™ XT (지이 헬스케어(GE Healthcare), 스웨덴)를 통해 통과하였다. 280 nm에서 UV-흡광도가 20 mAU 미만이 될 때까지 칼럼을 동일한 완충액 A1로 세척하였다. 결합된 C-인테인 태그부착된 IL-1b를 완충액 B1 (100 mM Tris-HCl, 150 mM NaCl, 1 mM EDTA, 50 mM 비오틴, pH 8.0)에서 용리하고 수집하였다.

억제제 ZnCl₂를 첨가하지 않고 고정화된 N-인테인 리간드 A48을 함유하는 수지로 패킹된 1 ml 하이트랩™ 칼럼에 정제된 단백질을 즉시 적용하였다. 절단된, 태그-비함유 IL-1b를 플로우-스루에서 수집하였다.

트윈스트렙 - 점선 밑줄

CCT - 굵은 밑줄

IL1b (테스트-단백질) - 밑줄

본원에 언급된 특허 및 과학 문헌은 관련 기술분야의 통상의 기술자가 이용할 수 있는 지식을 확립한다. 본원에 인용된 모든 미국 특허 및 공개된 또는 비공개된 미국 특허 출원은 참조로 포함된다. 본원에 인용된 모든 공개된 외국 특허 및 특허 출원은 본원에 참조로 포함된다. 본원에 인용된 다른 모든 공개된 참고문헌, 문서, 원고 및 과학 문헌은 본원에 참조로 포함된다.

본 발명은 그의 바람직한 실시양태를 참조하여 구체적으로 제시되고 설명되었지만, 첨부된 청구범위에 의해 포함된 본 발명의 범위를 벗어나지 않으면서 형태 및 세부사항의 다양한 변화가 이루어질 수 있다는 것이 관련 기술분야의 통상의 기술자에 의해 이해될 것이다. 또한, 본원에 기재된 실시양태는 상호 배타적이지 않으며, 다양한 실시양태로부터의 특징이 본 발명에 따라 전체적으로 또는 부분적으로 조합될 수 있음을 이해해야 한다.

SEQUENCE LISTING <110> CYTIVA BIOPROCESS R&D AB <120> IMPROVED PROTEIN PURIFICATION <130> 100001.00164 <140> PCT/EP2020/082966 <141> 2020-11-20 <150> GB 1917046.3 <151> 2019-11-22 <160> 5 <170> PatentIn version 3.5 <210> 1 <211> 97 <212> PRT <213> Nostoc punctiforme <400> 1 Cys Leu Ser Tyr Glu Thr Glu Ile Leu Thr Val Glu Tyr Gly Leu Leu 1 5 10 15 Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys Thr Val Tyr Ser 20 25 30 Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val Ala Gln Trp His 35 40 45 Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp Gly Ser 50 55 60 Leu Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Val Asp Gly Gln 65 70 75 80 Met Leu Pro Ile Asp Glu Ile Phe Glu Arg Glu Leu Asp Leu Met Arg 85 90 95 Val <210> 2 <211> 97 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <220> <221> VARIANT <222> (20)..(20) <223> /replace="R" or "A" <220> <221> VARIANT <222> (25)..(25) <223> /replace="R" <220> <221> VARIANT <222> (28)..(28) <223> /replace="A" or "S" <220> <221> VARIANT <222> (35)..(35) <223> /replace="R" or "A" <220> <221> VARIANT <222> (36)..(36) <223> /replace="H" or "Q" <220> <221> VARIANT <222> (59)..(59) <223> /replace="C" <220> <221> VARIANT <222> (70)..(70) <223> /replace="R" or "A" <220> <221> VARIANT <222> (73)..(73) <223> /replace="R" or "A" <220> <221> VARIANT <222> (80)..(80) <223> /replace="Q" <220> <221> VARIANT <222> (90)..(90) <223> /replace="R" or "K" <220> <221> VARIANT <222> (95)..(95) <223> /replace="R" or "A" <220> <221> SITE <222> (1)..(97) <223> /note="Variant residues given in the sequence have no preference with respect to those in the annotations for variant positions" <400> 2 Ala Leu Ser Tyr Asp Thr Glu Ile Leu Thr Val Glu Tyr Gly Phe Leu 1 5 10 15 Pro Ile Gly Lys Ile Val Glu Glu Asn Ile Glu Cys Thr Val Tyr Ser 20 25 30 Val Asp Lys Asn Gly Phe Val Tyr Thr Gln Pro Ile Ala Gln Trp His 35 40 45 Asn Arg Gly Glu Gln Glu Val Phe Glu Tyr Asp Leu Glu Asp Gly Ser 50 55 60 Ile Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Thr Asp Gly Glu 65 70 75 80 Met Leu Pro Ile Asp Glu Ile Phe Glu Gln Gly Leu Asp Leu Lys Gln 85 90 95 Val <210> 3 <211> 35 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: C-intein sequence" <400> 3 Val Lys Ile Val Ser Arg Lys Ser Leu Gly Val Gln Asn Val Tyr Asp 1 5 10 15 Ile Gly Val Glu Lys Asp His Asn Phe Leu Leu Ala Asn Gly Leu Ile 20 25 30 Ala Ser Asn 35 <210> 4 <211> 284 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 4 Met Glu Thr Asp Thr Leu Leu Leu Trp Val Leu Leu Leu Trp Val Pro 1 5 10 15 Gly Ser Thr Gly Val Lys Ile Val Ser Arg Lys Ser Leu Gly Val Gln 20 25 30 Asn Val Tyr Asp Ile Gly Val Glu Lys Asp His Asn Phe Leu Leu Ala 35 40 45 Asn Gly Leu Ile Ala Ser Asn Arg Val Gln Pro Thr Glu Ser Ile Val 50 55 60 Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn 65 70 75 80 Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser 85 90 95 Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser 100 105 110 Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys 115 120 125 Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val 130 135 140 Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr 145 150 155 160 Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn 165 170 175 Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu 180 185 190 Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu 195 200 205 Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn 210 215 220 Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val 225 230 235 240 Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His 245 250 255 Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys 260 265 270 Asn Lys Cys Val Asn Phe His His His His His His 275 280 <210> 5 <211> 230 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 5 Met Ser Ala Trp Ser His Pro Gln Phe Glu Lys Gly Gly Gly Ser Gly 1 5 10 15 Gly Gly Ser Gly Gly Ser Ala Trp Ser His Pro Gln Phe Glu Lys Gly 20 25 30 Gly Gly Ser Gly Gly Gly Ser Val Lys Ile Val Ser Arg Lys Ser Leu 35 40 45 Gly Val Gln Asn Val Tyr Asp Ile Gly Val Glu Lys Asp His Asn Phe 50 55 60 Leu Leu Ala Asn Gly Leu Ile Ala Ser Asn Ala Phe Val Arg Ser Leu 65 70 75 80 Asn Cys Thr Leu Arg Asp Ser Gln Gln Lys Ser Leu Val Met Ser Gly 85 90 95 Pro Tyr Glu Leu Lys Ala Leu His Leu Gln Gly Gln Asp Met Glu Gln 100 105 110 Gln Val Val Phe Ser Met Ser Phe Val Gln Gly Glu Glu Ser Asn Asp 115 120 125 Lys Ile Pro Val Ala Leu Gly Leu Lys Glu Lys Asn Leu Tyr Leu Ser 130 135 140 Cys Val Leu Lys Asp Asp Lys Pro Thr Leu Gln Leu Glu Ser Val Asp 145 150 155 160 Pro Lys Asn Tyr Pro Lys Lys Lys Met Glu Lys Arg Phe Val Phe Asn 165 170 175 Lys Ile Glu Ile Asn Asn Lys Leu Glu Phe Glu Ser Ala Gln Phe Pro 180 185 190 Asn Trp Tyr Ile Ser Thr Ser Gln Ala Glu Asn Met Pro Val Phe Leu 195 200 205 Gly Gly Thr Lys Gly Gly Gln Asp Ile Thr Asp Phe Thr Met Gln Phe 210 215 220 Val Ser Ser Ala Ala Ala 225 230

Claims

천연 스플릿 인테인의 적어도 하나의 아미노산 치환을 포함하는 N-인테인 변이체로서, 여기서 N-인테인 단백질 변이체 서열은 초기 촉매 시스테인으로부터 측정된 바와 같이 적어도 위치 36에 아스파라긴 (N)을 포함하지 않고, 여기서 치환된 아미노산은 천연 N-인테인 단백질 서열 또는 컨센서스 N-인테인 서열과 비교하여 증가된 알칼리 안정성을 제공하는 것인 N-인테인 변이체.
제1항에 있어서, 증가된 알칼리 안정성을 제공하는 치환된 아미노산이 H 또는 Q인 N-인테인 변이체.
노스톡 푼크티포르메(Nostoc punctiforme) (Npu)의 야생형 N-인테인 도메인의 N-인테인 단백질 변이체로서, 여기서 야생형 Npu N-인테인 도메인은 하기 서열을 포함하며:

여기서 단백질 변이체는 야생형 N-인테인 도메인 및 변이체 또는 야생형 N-인테인 도메인의 알칼리 안정성과 비교하여 N-인테인 단백질 변이체의 알칼리 안정성을 증가시키는 아미노산으로의 서열식별번호: 1의 적어도 위치 36에서의 아스파라긴 (N)의 아미노산 치환을 포함하는 것인
N-인테인 단백질 변이체.
제3항에 있어서, 알칼리 안정성을 증가시키는 아미노산 치환이 히스티딘 (H) 또는 글루타민 (Q)인 N-인테인 단백질 변이체.
제4항에 있어서, 알칼리 안정성을 증가시키는 아미노산 치환이 히스티딘 (H)인 N-인테인 단백질 변이체.
하기를 포함하는 N-인테인 변이체 서열:

여기서
위치 20, 35, 70, 73 및 95에서의 X는 각각 독립적으로 K, R 또는 A로부터 선택되고;
위치 28에서의 X는 C, A 또는 S이고;
위치 36에서의 X는 N, H 또는 Q이고;
위치 25에서의 X는 N 또는 R이고;
위치 59에서의 X는 D 또는 C이고;
위치 80에서의 X는 E 또는 Q이고;
위치 90에서의 X는 Q, R 또는 K이고;
여기서 알칼리 안정성은 서열식별번호: 1과 비교하여 증가된다.
제6항에 있어서,
위치 20, 35, 70, 73 및 95에서의 X는 R이고;
위치 28에서의 X는 A이고;
위치 36에서의 X는 H이고;
위치 25에서의 X는 N이고;
위치 59에서의 X는 D이고;
위치 80에서의 X는 E이고;
위치 90에서의 X는 Q인
N-인테인 변이체 서열.
제6항에 있어서,
위치 20, 35, 70, 73 및 95에서의 X는 A이고;
위치 28에서의 X는 A이고;
위치 36에서의 X는 H이고;
위치 25에서의 X는 N이고;
위치 59에서의 X는 D이고;
위치 80에서의 X는 E이고;
위치 90에서의 X는 Q인
N-인테인 변이체 서열.
제6항에 있어서,
위치 20, 35, 70, 73 및 95에서의 X는 K이고;
위치 28에서의 X는 C이고;
위치 36에서의 X는 H이고;
위치 25에서의 X는 N이고;
위치 59에서의 X는 D이고;
위치 80에서의 X는 E이고;
위치 90에서의 X는 Q인
N-인테인 변이체 서열.
제6항에 있어서,
위치 20, 35, 70, 73 및 95에서의 X는 R이고;
위치 28에서의 X는 A이고;
위치 36에서의 X는 N이고;
위치 25에서의 X는 N이고;
위치 59에서의 X는 D이고;
위치 80에서의 X는 E이고;
위치 90에서의 X는 Q인
N-인테인 변이체 서열.
제6항에 있어서,
위치 20, 35, 70, 73 및 95에서의 X는 K이고;
위치 28에서의 X는 A이고;
위치 36에서의 X는 N이고;
위치 25에서의 X는 N이고;
위치 59에서의 X는 D이고;
위치 80에서의 X는 E이고;
위치 90에서의 X는 Q인
N-인테인 변이체 서열.
제1항 내지 제11항 중 어느 한 항에 있어서, 고체상, 예컨대 멤브레인, 섬유, 입자, 비드 또는 칩에 커플링된 N-인테인 변이체 서열.
제12항에 있어서, 고체상이 천연 또는 합성 기원의 크로마토그래피 수지인 N-인테인 변이체 서열.
제12항 또는 제13항에 있어서, 고체상이 크로마토그래피 수지, 예컨대 천연 또는 합성 수지, 바람직하게는 폴리사카라이드, 예컨대 아가로스인 N-인테인 변이체 서열.
제13항에 있어서, 고체상에는 매립된 자성 입자가 제공되어 있는 것인 N-인테인 변이체 서열.
제12항에 있어서, 고체상이 비확산 제한 수지/섬유질 물질인 N-인테인 변이체 서열.
제12항 또는 제13항에 있어서, N-인테인이 C-말단 상의 하나 이상의 Lys를 포함하는 Lys-꼬리를 통해 고체상에 커플링된 것인 N-인테인 변이체 서열.
제12항 또는 제13항에 있어서, N-인테인이 C-말단 상의 Cys-꼬리를 통해 고체상에 커플링된 것인 N-인테인 변이체 서열.
제12항 내지 제18항 중 어느 한 항에 있어서, 고체상, 바람직하게는 크로마토그래피 수지 ml당 (팽윤된 겔 ml당) 0.2-2 μmole/ml N-인테인이 커플링된 것인 N-인테인 변이체 서열.
제1항 내지 제19항 중 어느 한 항에 있어서, N-인테인이 0.05M-0.5M, 바람직하게는 0.1-0.5M NaOH에 상응하는 알칼리 조건 하에 안정적인 것인 N-인테인 서열.
하기 아미노산 서열 또는 이와 적어도 85% 동일성을 갖는 서열을 포함하는 C-인테인 변이체 서열:

.
제21항에 따른 C-인테인 및 관심 단백질 (POI)을 코딩하는 유전자를 포함하는 벡터.
천연 N-인테인의 N-인테인 변이체 서열 및 C-인테인을 포함하는, 관심 단백질 (POI)의 친화성 정제를 위한 스플릿 인테인 시스템으로서, 여기서 N-인테인 변이체 서열은 천연 N-인테인과 비교하여 N36H 또는 N36Q 돌연변이를 갖는 것인 스플릿 인테인 시스템.
제23항에 있어서, 제1항 내지 제20항 중 어느 한 항의 N-인테인 서열 변이체 및 서열식별번호: 3의 C-인테인 변이체 서열을 포함하는 스플릿 인테인 시스템.
제23항 또는 제24항에 있어서, C-인테인 및 추가 태그가 POI와 공동-발현되는 것인 스플릿 인테인 시스템.
제23항 내지 제25항 중 어느 한 항에 있어서, N-인테인이 고체상에 고정화되고, 고체상이 고체상으로부터 POI의 절단 후 재생되는 것인 스플릿 인테인 시스템.
제26항에 있어서, 고체상이 알칼리 조건, 예컨대 0.05-0.5 M NaOH 하에 재생되는 것인 스플릿 인테인 시스템.
제26항 또는 제27항에 있어서, 고체상이 최대 100 사이클, 예컨대 최대 50 사이클 재생되는 것인 스플릿 인테인 시스템.
하나 이상의 N-인테인 변이체 서열 리간드를 포함하는 크로마토그래피 수지를 포함하는 크로마토그래피 칼럼으로서, 여기서 N-인테인 변이체 서열은 제1항 내지 제20항 중 어느 한 항에 정의된 바와 같은 것인 크로마토그래피 칼럼.
제23항 내지 제29항 중 어느 한 항에 따른 스플릿 인테인 시스템을 사용하여 C-인테인 태그부착된 관심 단백질 (POI)을 정제하는 방법으로서, 여기서 N-인테인은 고체상에 고정화되며; 중성 pH, 예컨대 6-8에서 및 2가 양이온의 존재 하에 C-인테인 및 N-인테인을 접촉시키는 단계; 2가 양이온의 존재 하에 상기 고체상을 세척하는 단계; C-인테인 및 POI 사이의 자발적 절단을 허용하도록 킬레이트제를 첨가하는 단계; 태그 없는 POI를 수집하는 단계; 및 알칼리 조건, 예컨대 0.05-0.5M NaOH 하에 상기 고체상을 재생하는 단계를 포함하는 방법.
제23항 내지 제29항 중 어느 한 항에 따른 스플릿 인테인 시스템을 사용하여 C-인테인 태그부착된 관심 단백질 (POI)을 정제하는 방법으로서, 여기서 N-인테인은 고체상에 고정화되며; 중성 pH, 예컨대 6-8에서, 바람직하게는 높은 유속 하에 C-인테인 및 N-인테인을 접촉시키는 단계; 상기 고체상을 세척하는 단계; C-인테인 및 POI 사이의 절단 후 태그 없는 POI를 수집하는 단계; 및 알칼리 조건, 예컨대 0.05-0.5M NaOH 하에 상기 고체상을 재생하는 단계를 포함하는 방법.
관심 단백질 (POI)의 정제 방법으로서, POI를 서열식별번호: 3에 따른 C-인테인 및 추가 태그와 공동-발현하는 단계; 상기 추가 태그를 제1 고체상 상의 그의 결합 파트너에 결합시키는 단계; POI 및 C-인테인을 절단하는 단계; 중성 pH에서 제2 고체상에 부착된 N-인테인에 상기 C-인테인을 결합시키고, 상기 POI로부터 상기 결합된 C-인테인 및 N-인테인을 절단하는 단계; 및 알칼리 조건, 예컨대 0.05-0.5M NaOH 하에 상기 제2 고체상을 재생하는 단계를 포함하는 방법.
제32항에 있어서, 추가 태그가 친화성 태그, 이온 교환, 소수성 상호작용, 용해성, 다중모드인 방법.
제30항 내지 제33항 중 어느 한 항에 있어서, 알칼리 조건이 카오트로프제, 예컨대 구아니딘 또는 우레아와 조합되고, 고체상이 최대 100회 재생될 수 있는 것인 방법.
제30항 내지 제34항 중 어느 한 항에 있어서, POI가 천연 또는 거의 천연 N-말단 서열을 필요로 하는 단백질, 예를 들어 치료 단백질 후보, 생물제제, 항체 단편, 항체 모방체, 효소, 재조합 단백질 또는 펩티드, 예컨대 성장 인자, 시토카인, 케모카인, 호르몬, 항원 (바이러스, 박테리아, 효모, 포유동물) 생산, 백신 생산, 세포 표면 수용체, 융합 단백질인 방법.
제30항 내지 제35항 중 어느 한 항에 있어서, 30% 초과, 바람직하게는 50% 초과, 가장 바람직하게는 80% 초과의 POI 수율이 4시간 미만의 절단에서 달성되는 것인 방법.
제30항 내지 제36항 중 어느 한 항에 있어서, N-인테인이 크로마토그래피 수지 상에 고정화되고, 정적 결합 용량이 침강된 수지 ml당 0.2-2 μmole/ml C-인테인 결합된 POI인 방법.
제1항 내지 제5항 중 어느 한 항에 있어서, 모든 아스파라긴 (N) 아미노산 잔기가 천연 N-인테인 단백질 서열과 비교하여 증가된 알칼리 안정성을 제공하는 아미노산 잔기로 치환된 것인 N-인테인 변이체.
제1항 내지 제5항 중 어느 한 항에 있어서, 모든 아스파라긴 (N) 아미노산 잔기가 증가된 알칼리 안정성을 제공하는 아미노산 잔기로 치환되고, 제1 잔기의 시스테인이 임의의 다른 아미노산으로 치환된 것인 N-인테인 변이체.