KR20240007210A - 개선된 단백질 정제 - Google Patents

개선된 단백질 정제 Download PDF

Info

Publication number
KR20240007210A
KR20240007210A KR1020237042305A KR20237042305A KR20240007210A KR 20240007210 A KR20240007210 A KR 20240007210A KR 1020237042305 A KR1020237042305 A KR 1020237042305A KR 20237042305 A KR20237042305 A KR 20237042305A KR 20240007210 A KR20240007210 A KR 20240007210A
Authority
KR
South Korea
Prior art keywords
intein
protein
sequence
amino acid
split
Prior art date
Application number
KR1020237042305A
Other languages
English (en)
Inventor
피터 룬드백
요한 프레드릭 오만
Original Assignee
씨티바 바이오프로세스 알&디 에이비
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 씨티바 바이오프로세스 알&디 에이비 filed Critical 씨티바 바이오프로세스 알&디 에이비
Publication of KR20240007210A publication Critical patent/KR20240007210A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1252DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • C07K1/14Extraction; Separation; Purification
    • C07K1/16Extraction; Separation; Purification by chromatography
    • C07K1/22Affinity chromatography or related techniques based upon selective absorption processes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N11/00Carrier-bound or immobilised enzymes; Carrier-bound or immobilised microbial cells; Preparation thereof
    • C12N11/02Enzymes or microbial cells immobilised on or in an organic carrier
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N11/00Carrier-bound or immobilised enzymes; Carrier-bound or immobilised microbial cells; Preparation thereof
    • C12N11/02Enzymes or microbial cells immobilised on or in an organic carrier
    • C12N11/08Enzymes or microbial cells immobilised on or in an organic carrier the carrier being a synthetic polymer
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/90Fusion polypeptide containing a motif for post-translational modification
    • C07K2319/92Fusion polypeptide containing a motif for post-translational modification containing an intein ("protein splicing")domain
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Analytical Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Peptides Or Proteins (AREA)

Abstract

본 발명은 주로 크로마토그래피 분야에서 단백질 정제에 관한 것이다. 보다 상세하게는, 본 발명은 C-인테인 태그 및 N-인테인 리간드를 포함하는 스플릿 인테인 시스템을 사용하는 친화성 크로마토그래피에 관한 것이며, 여기서 N-인테인 리간드는 임의의 재조합 표적 단백질의 대규모 정제에 적합한 증가된 용해도를 제공한다.

Description

개선된 단백질 정제
본 발명은 주로 크로마토그래피 분야에서 단백질 정제에 관한 것이다. 보다 상세하게는, 본 발명은 C-인테인 태그 및 N-인테인 리간드를 포함하는 스플릿 인테인 시스템을 사용하는 친화성 크로마토그래피에 관한 것이며, 여기서 N-인테인 리간드는 높은 용해도를 가지며, 대규모 단백질 정제에 적합한 높은 정도로 고체상에 고정화될 수 있다.
인테인은 효소 서열을 방해하고 2개의 플랭킹 폴리펩티드의 자체 절단 및 라이게이션을 촉매하여 활성 단백질을 생성하는 인-프레임 삽입으로서 발현되는 단백질 요소이다. 유전적으로, 인테인은 두 가지 별개의 방식으로 코딩된다: 2개의 플랭킹 엑스테인 서열을 방해하는 무손상 인테인으로서, 또는 스플릿 인테인으로서 (여기서 각 엑스테인 및 인테인의 일부는 2개의 상이한 유전자에 의해 코딩됨). 이들은 생명공학 및 단백질 정제 도구로서 큰 가능성을 갖고 있지만, 자연에서 발견되는 신속한 동력학 특성을 갖는 스플릿 인테인은 인테인-엑스테인 접합부의 특정 아미노산에 의존하여, 천연 단백질 서열의 친화성 정제 및 회수를 위해 인테인에 융합될 수 있는 단백질을 심각하게 제한한다. 특히, 노스톡 푼크티포르메(Nostoc punctiforme)로부터의 프로토타입 스플릿 인테인 DNAE는 단백질 정제 적용에 적합한 동력학 특성을 나타낸다. 그러나, 그의 활성은 C-엑스테인의 +2 위치에서의 페닐알라닌에 의존한다. 이 의존성은 심각하게 좁혀지고 그의 일반적인 적용가능성을 손상시킨다.
인테인은 재조합 단백질 정제를 위한 자기-절단 단백질로서의 적용을 포함하여 생명공학에서 여러 중요한 기능을 성취하도록 조작되었다. 스플릿 인테인은 친화성 리간드 및 자기-절단 특성을 동시에 제공할 수 있기 때문에 이와 관련하여 특히 유망하다. 단백질 정제에서, 정제의 대상체인 표적 단백질은 어느 하나의 엑스테인으로 치환될 수 있다. 현재까지, 스플릿 인테인의 DNAE 패밀리는 C-말단 절단 단백질 정제 접근법에서 가장 가능성이 높은 것으로 제시되어 있다.
WO2014/004336은 지지체에 부착될 수 있는 스플릿 인테인 N-단편 및 스플릿 인테인 C-단편에 융합된 단백질을 기재하고 있다. 고체 지지체는 입자, 비드, 수지 또는 슬라이드일 수 있다.
WO2014/110393은 스플릿 인테인 N-단편 및 정제 태그와 접촉되는 스플릿 인테인 C-단편에 융합된 관심 단백질을 기재하고 있다. N-단편은 정제 태그를 통해 고체상에 부착될 수 있으며, 친화성 정제 방법이 논의된다.
US 10 066027은 단백질 정제 시스템 및 상기 시스템을 사용하는 방법을 기재하고 있다. 고정화될 수 있는 N-말단 인테인 세그먼트, 및 자기-절단 특성을 가지며 관심 단백질에 부착될 수 있는 C-말단 인테인 세그먼트를 포함하는 스플릿 인테인이 개시되어 있다. N-말단 인테인 세그먼트에는 외인성 조건에 더 민감하게 만드는 민감도 향상 모티프가 제공되어 있다.
US 10 308 679는 N-인테인 폴리펩티드 및 N-인테인 가용화 파트너를 포함하는 융합 단백질, 및 이러한 융합 단백질을 포함하는 친화성 매트릭스를 기재하고 있다.
WO 2018/091424는 하기 단계를 포함하는, 아미노-말단, (N-말단), 스플릿 인테인 단편을 친화성 리간드로서 포함하는 친화성 크로마토그래피 수지의 제조 방법을 기재하고 있다: a) 박테리아 세포, 바람직하게는 이. 콜라이(E. coli)의 봉입체에서 불용성 단백질로서 N-말단 스플릿 인테인 단편 단백질을 발현하는 단계, b) 상기 봉입체를 수확하는 단계; c) 상기 봉입체를 가용화하고 발현된 단백질을 방출하는 단계; d) 고체 지지체 상에 상기 단백질을 결합시키는 단계; e) 상기 단백질을 리폴딩하는 단계; f) 고체 지지체로부터 상기 단백질을 방출하는 단계; 및 g) 친화성 크로마토그래피 수지를 형성하기 위해 크로마토그래피 수지 상에 리간드로서 상기 단백질을 고정화시키는 단계. 이 절차는 2-10 mg/ml 수지의 리간드 밀도의 고정화를 가능하게 할 수 있다.
상기 기재된 바와 같이, 스플릿 인테인은 조합된 친화성 태그 및 태그 절단 메커니즘을 사용하여 단백질 정제에 사용되었다. 그러나, 이러한 시스템의 유용성은 여러 인자에 의해 제한된다. 첫째, 절단을 수행하고 태그 없는 단백질의 정제를 달성하기 위해 의도된 생성물의 스플라이스 접합부에 아미노산 요구사항, 즉 C-엑스테인의 +2 위치에서의 Phe의 요구사항이 있다. N-말단에 무관한 아미노산이 없는 재조합 단백질 생산이 매우 바람직하다. 둘째, 단백질 방출 절단은 충분히 신속해야 하고, 허용가능한 수율을 제공해야 한다. 셋째, 고체 지지체에 부착하기 위한 스플릿 인테인 N- 또는 C-단편의 용해성 요구사항이 있다. 넷째, 지금까지 태그 없는 단백질의 대규모 정제에 적합한 이용가능한 스플릿 인테인 시스템이 없다.
용해도를 개선하기 위한 한 가지 방법은 용해도 융합체-태그를 스플릿-인테인에 부착하는 것이다 (US 10 308 679). 단백질 발현 및 정제를 위한 방법의 개발은 일반적으로 정제 프로토콜을 표준화하고 검출을 단순화하고 표적 단백질의 용해도를 증가시킬 수 있는 가능성을 제공하는 융합체 태그를 사용함으로써 용이하게 된다. 그러나 융합체 태그는 단백질 기능 및 구조를 방해할 수 있다. 따라서, 사용하기 전에 융합체 태그를 제거하는 것이 유리하다. 표적 단백질에 비해 큰 융합체 태그는 또한 융합체 태그에 추가 에너지가 소비되기 때문에 이들 융합 단백질을 발현하는 숙주 세포에 대한 증가된 대사 부담을 초래한다.
고도로 불용성인 스플릿-인테인을 생산하는 효율을 증가시키기 위한 상이한 접근법은 변성 화학 시약으로 단백질을 가용화한 후 리폴딩 프로세스 (미국 출원 번호 16/348,534)를 통해 생활성 단백질을 회복하는 것이다. 단백질 리폴딩에 사용되는 다양한 방법의 기술적 측면과 이들의 장점 및 한계를 이해하려는 시도가 있었지만, 일반적으로 이러한 방법의 효율 및 수율은 예측하기가 매우 어려우며 각 단백질에 대한 경험적 연구를 통해 결정되어야 한다. 리폴딩 방법의 일반적인 문제는 리폴딩 동안 변성 화학물질이 제거되거나 희석될 때 단백질 응집체가 형성된다는 것이다. 이들 응집체는 공정의 수율을 낮추고, 생산 공정의 후속 정제 단계 동안 복잡성을 가중시킨다. 더욱이, 변성 화학물질은 일반적으로 환경에 부담을 주기 때문에 적절하게 취급해야 한다.
본 발명은 선행 기술의 단점을 극복하고, 용해도 융합체-태그가 필요 없이 가용성이며 친화성 정제 공정에서의 후속 사용을 위해 환경 친화적인 생산 공정에서 산업적 규모로 생산될 수 있는 N-인테인 폴리펩티드를 제공한다.
특히, 본 발명은 단백질 정제 적용에 적합한 동역학적 특성을 나타내는 노스톡 푼크티포르메로부터의 프로토타입 스플릿 인테인 DnaE의 용해도를 증가시키는 방법을 제공한다. 그러나, 이 방법은 노스톡 푼크티포르메로부터의 DnaE 스플릿 인테인으로 제한되지 않으며, 또한 다른 종으로부터의 상동성 스플릿 인테인에 적용가능하다. 용해도는 폴리펩티드 쇄에서 하나 또는 바람직하게는 2개의 아미노산의 치환 후 이들 아미노산 치환의 부재 하의 가용성 N-인테인 비율에 비해 이. 콜라이에서 발현되는 더 높은 비율의 가용성 N-인테인을 갖는 단백질을 지칭한다.
본 발명은 천연 스플릿 인테인의 N-인테인 단백질 변이체 또는 인테인/스플릿 인테인으로부터 유래된 컨센서스 서열을 제공하며, 여기서 N-인테인 단백질 변이체는 증가된 용해도를 위해 하나 이상의 돌연변이를 갖는다.
제1 측면에서, 본 발명은 천연 스플릿 인테인의 적어도 하나의 아미노산 치환을 포함하는, 천연 노스톡 푼크티포르메 (Npu) 또는 이와 적어도 95% 상동성을 갖는 서열로부터 유래된 N-인테인 변이체에 관한 것이며, 여기서 N-인테인 단백질 변이체 서열은 초기 촉매 시스테인으로부터 측정된 바와 같이 적어도 위치 24 및/또는 위치 25에 돌연변이를 포함하고, 여기서 치환된 아미노산은 천연 N-인테인 단백질 서열 또는 컨센서스 N-인테인 서열과 비교하여 수성 완충액에서의 증가된 용해도를 제공한다. 본 발명은 또한 위치 24에 자연 발생 E를 갖는 인테인, 예컨대 림노라피스 로부스타(Limnorafis robusta)로부터의 N-인테인을 포함한다.
바람직하게는 증가된 용해도를 제공하는 치환된 아미노산(들)은 비-양성 아미노산이다. 바람직한 실시양태에서 증가된 용해도를 제공하는 치환된 아미노산은 K24E이다. 또 다른 실시양태에서 증가된 용해도를 제공하는 치환된 아미노산은 R25N이다. 가장 바람직한 실시양태에서 N-인테인은 이들 돌연변이 둘 다를 포함한다.
본 발명은 노스톡 푼크티포르메 (Npu)의 야생형 N-인테인 도메인의 N-인테인 단백질 변이체에 관한 것이며, 여기서 야생형 Npu N-인테인 도메인은 하기 서열을 포함하며:
CLSYETEILTVEYGLLPIGKIVEKRIECTVYSVDNNGNIYTQPVAQWHDRGEQEVFEYCLEDGSLIRATKDHKFMTVDGQMLPIDEIFERELDLMRV (서열식별번호: 1) (실시예에서 구축물 A52), 여기서 단백질 변이체는 봉입체의 형성을 최소화하기 위해 수성 완충액에서의 용해도를 증가시키기 위해 위치 24에 K에서 E로의 아미노산 치환 및 위치 25에 R에서 N으로의 아미노산 치환을 포함하고 (실시예에서 구축물 B97), 여기서 임의로 하나 이상의 C (Cys)는 비-시스테인 잔기, 바람직하게는 S (Ser) 또는 A (Ala)로 돌연변이된다. 본 발명에 포함되는 추가 구축물은 아래 실시예 섹션에 기재되어 있다.
상기 기재된 바와 같은 N-인테인 단백질 변이체는 위치 25에서 R의 단일-점 돌연변이, 바람직하게는 N 또는 비-양성 아미노산을 갖는 적어도 10-40% 가용성 N-인테인; 위치 24에서 K의 단일-점 돌연변이, 바람직하게는 E 또는 비-양성 아미노산을 갖는 적어도 46-52% 가용성 N-인테인; 및 위치 24 및 25에서 돌연변이, 바람직하게는 K24E 및 R25N 또는 비-양성 아미노산을 갖는 적어도 76-88% 가용성 N-인테인의 수성 완충액에서의 용해도를 갖는다.
N-인테인 변이체는 고체상, 예컨대 멤브레인, 섬유, 입자, 비드 또는 칩, 예컨대 천연 또는 합성 기원의 크로마토그래피 수지에 커플링될 수 있다.
고체상에는 임의로 매립된 자성 입자가 제공될 수 있다.
대안적 실시양태에서 고체상은 비확산 제한 수지/섬유질 물질이다.
본 발명에 따라, 고체상, 바람직하게는 크로마토그래피 수지 ml당 (팽윤된 겔 ml당) 0.2-2 μmole/ml N-인테인이 커플링된다.
제2 측면에서 본 발명은 상기 기재된 바와 같은 N-인테인 및 POI (관심 단백질)와 공동-발현되는 C-인테인 서열을 포함하는 스플릿 인테인 시스템에 관한 것이다. C-인테인은 고체상에 부착된 N-인테인에 대한 결합을 위해 POI 상의 태그로서 작용한다. 결합 후, POI는 조합된 N-인테인 및 C-인테인으로부터 절단되고 태그 없는 POI를 전달한다. C-인테인 변이체는 스플릿 인테인 C-인테인 서열 또는 그의 조작된 변이체이다. 바람직한 C-인테인 서열은 WO2021/099607 A1에 언급되어 있다.
POI는 임의의 재조합 단백질: 천연 또는 거의 천연 N-말단 서열을 필요로 하는 단백질, 예를 들어 치료 단백질 후보, 생물제제, 항체 단편, 항체 모방체, 효소, 재조합 단백질 또는 펩티드, 예컨대 성장 인자, 시토카인, 케모카인, 호르몬, 항원 (바이러스, 박테리아, 효모, 포유동물) 생산, 백신 생산, 세포 표면 수용체, 융합 단백질일 수 있다.
도 1은 상이한 기술을 사용하여 추출한 후 상이한 구축물로부터의 상청액의 SDS-PAGE 분석을 제시한다.
도 2는 SDS-PAGE 분석의 밀도계 평가 후 결정된 상이한 구축물의 용해도를 제시한다. 각 구축물에 대한 3개의 상이한 세포-배양물로부터의 추출물을 분석하였다. 막대는 전체 세포 용해물과 비교한 평균 용해도를 제시하고 (SDS), 막대는 표준 편차를 제시한다.
도 3은 비아코어(Biacore) CFCA 분석에 의해 결정된 상이한 추출물로부터의 상청액 중 N-인테인 농도를 제시한다. 각 구축물에 대한 3개의 상이한 세포-배양물로부터의 추출물을 분석하였다. 막대는 평균 농도를 제시하고, 오차 막대는 표준 편차를 제시한다.
도 4는 상이한 추출 방법을 사용하여 상이한 구축물의 추출물로부터의 상청액 중 N-인테인의 비율을, SDS 및 가열에 의해 가용화된 N-인테인의 총량에 대한 %로서 비교하여 제시한다.
정의
명세서 및 첨부된 청구범위에서 사용된 바와 같이, 단수형 "하나"는 문맥이 명백하게 달리 언급하지 않는 한 복수의 지시대상을 포함한다. 그러므로, 예를 들어 "관능기", "알킬" 또는 "잔기"에 대한 언급은 2개 이상의 이러한 관능기, 알킬 또는 잔기 등의 혼합물을 포함한다.
범위는 "약" 하나의 특정 값 및/또는 "약" 또 다른 특정 값으로 본원에서 표현될 수 있다. 이러한 범위가 표현될 때, 추가 측면은 하나의 특정 값 및/또는 다른 특정 값을 포함한다. 유사하게, 값이 근사치로서 표현될 때, 선행사 "약"을 사용하여, 특정 값이 추가 측면을 형성한다는 것이 이해될 것이다. 범위의 각각의 종점은 다른 종점과 관련하여 그리고 다른 종점과는 독립적으로 둘 다의 경우에 유의하다는 것이 추가로 이해될 것이다. 또한, 본원에 수많은 값이 개시되어 있고, 각각의 값은 또한 그 값 자체에 더하여 "약" 해당 특정 값으로서 본원에 개시되어 있는 것으로 이해된다.
구체적으로 달리 언급하지 않는 한, 구성성분의 중량 퍼센트 (wt. %)는 구성성분이 포함된 제형 또는 조성물의 총 중량을 기준으로 한다.
본원에서 사용된 바와 같은 용어 "임의의" 또는 "임의로"는 후속적으로 기재된 사건 또는 상황이 발생할 수 있거나 발생할 수 없음을 의미하고, 설명은 상기 사건 또는 상황이 발생하는 경우 및 발생하지 않는 경우를 포함한다.
본원에서 사용된 바와 같은 용어 "접촉"은 화합물이 표적의 활성에 직접적으로 영향을 미칠 수 있는 방식으로; 즉, 표적 자체와 상호작용함으로써, 또는 간접적으로; 즉, 표적의 활성이 의존하는 또 다른 분자, 보조인자, 인자 또는 단백질과 상호작용함으로써, 2개의 생물학적 실체를 함께 가져오는 것을 지칭한다. "접촉"은 또한 공유결합적으로 또는 다른 방식으로 결합하는 2개의 생물학적 실체, 예컨대 펩티드의 상호작용을 용이하게 하는 것을 의미할 수 있다.
용어 "펩티드", "폴리펩티드" 및 "단백질"은 본원에서 상호교환가능하게 사용되며, 단백질 및 그의 단편을 포함한다. 폴리펩티드는 아미노산 잔기 서열로서 본원에 개시되어 있다. 이러한 서열은 아미노에서 카르복시 말단의 방향으로 왼쪽에서 오른쪽으로 작성된다. 표준 명명법에 따라, 아미노산 잔기 서열은 하기와 같이 표시된 바와 같이 세 글자 또는 한 글자 코드에 의해 명명된다: 알라닌 (Ala, A), 아르기닌 (Arg, R), 아스파라긴 (Asn, N), 아스파르트산 (Asp, D), 시스테인 (Cys, C), 글루타민 (Gln, Q), 글루탐산 (Glu, E), 글리신 (Gly, G), 히스티딘 (His, H), 이소류신 (Ile, I), 류신 (Leu, L), 리신 (Lys, K), 메티오닌 (Met, M), 페닐알라닌 (Phe, F), 프롤린 (Pro, P), 세린 (Ser, S), 트레오닌 (Thr, T), 트립토판 (Trp, W), 티로신 (Tyr, Y), 및 발린 (Val, V). 펩티드는 임의의 올리고펩티드, 폴리펩티드, 유전자 생성물, 발현 생성물 또는 단백질을 포함한다. 펩티드는 연속적인 아미노산으로 구성되며, 자연 발생 또는 합성 분자를 포함한다.
또한, 본원에서 사용된 바와 같은 용어 "펩티드"는 펩티드 결합 또는 변형된 펩티드 결합에 의해 서로 연결된 아미노산, 예를 들어 펩티드 동배체 등을 지칭하며, 20개의 유전자-코딩된 아미노산 이외의 변형된 아미노산을 함유할 수 있다. 펩티드는 자연적 프로세스, 예컨대 번역 후 프로세싱에 의해, 또는 관련 기술분야에 널리 공지된 화학적 변형 기술에 의해 변형될 수 있다. 변형은 펩티드 백본, 아미노산 측쇄 및 아미노 또는 카르복실 말단을 포함하여 펩티드의 어느 곳에서나 발생할 수 있다. 동일한 유형의 변형이 주어진 폴리펩티드의 여러 부위에서 동일하거나 다양한 정도로 존재할 수 있다. 또한, 주어진 펩티드는 많은 유형의 변형을 가질 수 있다. 변형은 제한 없이, 별개의 도메인 또는 모티프의 연결, 아세틸화, 아실화, ADP-리보실화, 아미드화, 공유결합 가교 또는 고리화, 플라빈의 공유결합 부착, 헴 모이어티의 공유결합 부착, 뉴클레오티드 또는 뉴클레오티드 유도체의 공유결합 부착, 지질 또는 지질 유도체의 공유결합 부착, 포스파티딜이노시톨의 공유결합 부착, 디술피드 결합 형성, 탈메틸화, 시스테인 또는 피로글루타메이트의 형성, 포르밀화, 감마-카르복실화, 글리코실화, GPI 앵커 형성, 히드록실화, 아이오딘화, 메틸화, 미리스토일화, 산화, 페길화, 단백질분해성 프로세싱, 인산화, 프레닐화, 라세미화, 셀레노일화, 황산화, 및 단백질에 아미노산의 운반-RNA 매개 첨가, 예컨대 아르기닐화를 포함한다. (문헌 [Proteins-Structure and Molecular Properties 2nd Ed., T. E. Creighton, W.H. Freeman and Company, New York (1993)]; [Posttranslational Covalent Modification of Proteins, B. C. Johnson, Ed., Academic Press, New York, pp. 1-12 (1983)] 참조).
본원에서 사용된 바와 같은 "변이체"는 원래 서열의 것과 동일하거나 실질적으로 유사한 생물학적 활성을 보유하는 분자를 지칭한다. 변이체는 동일하거나 상이한 종으로부터 유래하거나 천연 또는 이전 분자에 기초한 합성 서열일 수 있다. 더욱이, 본원에서 사용된 바와 같은 "변이체"는 모체 분자 (예를 들어, 본원에 개시된 단백질 또는 펩티드)의 구조로부터 획득된 구조를 갖고 구조 또는 서열이 본원에 개시된 것과 충분히 유사한 분자를 지칭하며, 그 유사성에 기초하여 관련 기술분야의 통상의 기술자는 모 분자와 비교하여 동일하거나 유사한 활성 및 유용성을 나타낼 것으로 예상할 것이다. 예를 들어, 주어진 펩티드에서 특정 아미노산을 치환하는 것은 모체와 유사한 활성을 갖는 변이체 펩티드를 생성할 수 있다.
본 발명의 문맥에서, 변이체 단백질의 치환은 하기와 같이 표시된다: [원래 아미노산/서열에서의 위치/치환된 아미노산].
본원에서 사용된 바와 같은 용어 "관심 단백질 (POI)"은 임의의 합성 또는 자연 발생 단백질 또는 펩티드를 포함한다. 따라서 이 용어는 약물, 백신, 및 분자, 예컨대 단백질, 펩티드 등을 포함하는 생물약제로서 전통적으로 간주되는 화합물을 포함한다. 치료제의 예는 널리 공지된 문헌 참고문헌, 예컨대 머크 인덱스(Merck Index) (14판), 의사용 탁상 편람(Physicians' Desk Reference) (64판), 및 치료제의 약리학적 기초(The Pharmacological Basis of Therapeutics) (1판)에 기재되어 있으며, 제한 없이, 의약; 질환 또는 질병의 치료, 예방, 진단, 치유 또는 완화에 사용되는 물질; 신체의 구조 또는 기능에 영향을 미치는 물질, 또는 생리학적 환경에 배치된 후 생물학적으로 활성이 되거나 더 활성이 되는 전구약물을 포함한다.
본원에서 사용된 바와 같은 "단리된 펩티드" 또는 "정제된 펩티드"는 발현 숙주 세포 용해물, 성장 배지 구성성분, 완충액 구성성분, 세포 배양 상청액, 또는 합성 시험관내 번역 시스템의 구성성분을 포함하나 이에 제한되지는 않는, 펩티드가 자연에서 정상적으로 회합되는 물질, 또는 펩티드가 인공 발현 또는 생산 시스템에서 회합되는 물질이 실질적으로 없는 펩티드 (또는 그의 단편)를 의미하는 것으로 의도된다. 본원에 개시된 펩티드 또는 그의 단편은 예를 들어 천연 공급원 (예를 들어, 포유동물 세포)으로부터의 추출에 의해, 펩티드를 코딩하는 재조합 핵산의 발현 (예를 들어, 세포에서 또는 무세포 번역 시스템에서)에 의해, 또는 펩티드의 화학적 합성에 의해 수득될 수 있다. 또한, 펩티드 단편은 이들 방법 중 임의의 것에 의해 또는 전장 단백질 및/또는 펩티드를 절단함으로써 수득될 수 있다.
본원에서 사용된 바와 같은 단어 "또는"은 특정 목록의 임의의 한 구성원을 의미하고, 또한 해당 목록의 구성원들의 임의의 조합을 포함한다.
본원에서 사용된 바와 같은 어구 "핵산"은 왓슨-크릭 염기-쌍형성에 의해 상보적인 핵산에 혼성화할 수 있는 자연 발생 또는 합성 올리고뉴클레오티드 또는 폴리뉴클레오티드 (DNA 또는 RNA 또는 DNA-RNA 하이브리드, 단일-가닥 또는 이중-가닥, 센스 또는 안티센스 여부에 관계없이)를 지칭한다. 본 발명의 핵산은 또한 뉴클레오티드 유사체 (예를 들어, BrdU), 및 비-포스포디에스테르 뉴클레오시드간 연결 (예를 들어, 펩티드 핵산 (PNA) 또는 티오디에스테르 연결)을 포함할 수 있다. 특히, 핵산은 제한 없이, DNA, RNA, cDNA, gDNA, ssDNA, dsDNA 또는 이들의 임의의 조합을 포함할 수 있다.
본원에서 사용된 바와 같은 "엑스테인"은 인테인의 일부가 아니고 인테인의 절단 시 스플라이싱되거나 절단될 수 있는 인테인-변형 단백질의 부분을 지칭한다.
"인테인"은 단백질에서 인-프레임 개재 서열을 지칭한다. 인테인은 유리 인테인 및 성숙 단백질을 생성하기 위해 번역 후 단백질 스플라이싱 프로세스를 통해 단백질로부터 그의 자체 절단을 촉매할 수 있다. 인테인은 또한 인테인 N-말단 또는 인테인 C-말단 중 어느 하나, 또는 인테인-엑스테인 말단 둘 다에서 인테인-엑스테인 결합의 절단을 촉매할 수 있다. 본원에서 사용된 바와 같은 "인테인"은 미니-인테인, 변형된 또는 돌연변이된 인테인, 및 스플릿 인테인을 포함한다.
본원에서 사용된 바와 같은 용어 "스플릿 인테인"은 N-말단 및 C-말단 인테인 세그먼트가 스플라이싱 또는 절단 반응에 대해 기능적인 인테인으로 비공유결합적으로 재회합하거나 재구성할 수 있는 별도의 분자가 되도록 N-말단 인테인 세그먼트 및 C-말단 인테인 세그먼트 사이에 하나 이상의 펩티드 결합 파단이 존재하는 임의의 인테인을 지칭한다. 임의의 촉매적으로 활성인 인테인 또는 그의 단편은 본원에 개시된 시스템 및 방법에서 사용하기 위한 스플릿 인테인을 유도하는데 사용될 수 있다. 예를 들어, 한 측면에서 스플릿 인테인은 진핵생물 인테인으로부터 유래될 수 있다. 또 다른 측면에서, 스플릿 인테인은 박테리아 인테인으로부터 유래될 수 있다. 또 다른 측면에서, 스플릿 인테인은 고세균 인테인으로부터 유래될 수 있다. 바람직하게는, 그렇게 유래된 스플릿 인테인은 스플라이싱 반응을 촉매하는데 필수적인 아미노산 서열만을 보유할 것이다.
본원에서 사용된 바와 같은 "N-말단 인테인 세그먼트" 또는 "N-인테인"은 상응하는 C-말단 인테인 세그먼트와 조합될 때 스플라이싱 및/또는 절단 반응에 대해 기능적인 N-말단 아미노산 서열을 포함하는 임의의 인테인 서열을 지칭한다. 그러므로 N-말단 인테인 세그먼트는 또한 스플라이싱이 발생할 때 스플라이싱되는 서열을 포함한다. N-말단 인테인 세그먼트는 자연 발생 (천연) 인테인 서열의 N-말단 부분의 변형인 서열을 포함할 수 있다. 비-인테인 잔기는 또한 추가 기능성, 예컨대 친화성 정제되거나 공유결합적으로 고정화되는 능력을 제공하기 위해 인테인 세그먼트에 유전적으로 융합될 수 있다.
본원에서 사용된 바와 같은 "C-말단 인테인 세그먼트" 또는 "C-인테인"은 상응하는 N-말단 인테인 세그먼트와 조합될 때 스플라이싱 또는 절단 반응에 대해 기능적인 C-말단 아미노산 서열을 포함하는 임의의 인테인 서열을 지칭한다. 한 측면에서, C-말단 인테인 세그먼트는 스플라이싱이 발생할 때 스플라이싱되는 서열을 포함한다. 또 다른 측면에서, C-말단 인테인 세그먼트는 그의 C-말단에 융합된 펩티드 서열로부터 절단된다. C-말단 인테인의 C-말단으로부터 절단된 서열은 본원에서 "관심 단백질 POI"로 지칭되며, 이하에서 더 자세히 논의된다. C-말단 인테인 세그먼트는 자연 발생 (천연) 인테인 서열의 C-말단 부분의 변형인 서열을 포함할 수 있다. 예를 들어, C 말단 인테인 세그먼트는 이러한 추가 및/또는 돌연변이된 잔기의 포함이 C-말단 인테인 세그먼트가 스플라이싱 또는 절단에 대해 비기능적이게 하지 않는 한 추가 아미노산 잔기 및/또는 돌연변이된 잔기를 포함할 수 있다.
컨센서스 서열은 정렬된 관련 서열을 나타내는 DNA, RNA 또는 단백질의 서열이다. 관련 서열의 컨센서스 서열은 상이한 방식으로 정의될 수 있지만, 정상적으로 각 위치에서 가장 흔한 뉴클레오티드(들) 또는 아미노산 잔기(들)에 의해 정의된다.
본원에서 사용된 바와 같은 용어 "스플라이싱하다" 또는 "스플라이싱한다"는 폴리펩티드의 중앙 부분을 절단하여 2개 이상의 더 작은 폴리펩티드 분자를 형성하는 것을 의미한다. 일부 경우에, 스플라이싱은 또한 2개 이상의 더 작은 폴리펩티드를 함께 융합하여 새로운 폴리펩티드를 형성하는 단계를 포함한다. 스플라이싱은 또한 스플릿 인테인의 작용을 통해 2개의 별도의 유전자 생성물에 코딩된 2개의 폴리펩티드의 연결을 지칭할 수 있다.
본원에서 사용된 바와 같은 용어 "절단하다" 또는 "절단한다"는 단일 폴리펩티드를 분할하여 2개 이상의 더 작은 폴리펩티드 분자를 형성하는 것을 의미한다. 일부 경우에, 절단은 종종 "단백질분해성 절단"으로 지칭되는 외인성 엔도펩티다제의 첨가에 의해 매개된다. 다른 경우에, 절단은 종종 "자기-절단"으로 지칭되는 절단된 펩티드 서열 중 하나 또는 둘 다의 고유 활성에 의해 매개될 수 있다. 절단은 또한 본원에 기재된 스플릿 인테인 시스템의 작용에서와 같이 비-단백질분해성 제3 펩티드의 첨가에 의해 유도되는 2개의 폴리펩티드의 자기-절단을 지칭할 수 있다.
용어 "융합된"은 공유결합적으로 결합된 것을 의미한다. 예를 들어, 제1 펩티드는 두 펩티드가 서로 공유결합적으로 결합될 때 (예를 들어, 펩티드 결합을 통해) 제2 펩티드에 융합된다.
본원에서 사용된 바와 같은 "단리된" 또는 "실질적으로 순수한" 물질은 자연적으로 동반되는 구성성분으로부터 분리된 것이다. 전형적으로, 폴리펩티드는 자연적으로 연관된 다른 단백질 및 자연-발생 유기 분자가 적어도 50 중량% (예를 들어, 60 중량%, 70 중량%, 80 중량%, 90 중량%, 95 중량% 및 99 중량%) 없을 때 실질적으로 순수하다.
본원에서, "결합하다" 또는 "결합한다"는 한 분자가 샘플 내의 또 다른 분자를 인식하여 이에 접착하지만, 샘플 내의 다른 분자를 실질적으로 인식하거나 접착하지 않는 것을 의미한다. 한 분자는 다른 분자에 대해 약 105 내지 106 리터/몰 초과의 결합 친화성을 갖는 경우 또 다른 분자에 "특이적으로 결합한다".
본원에 언급된 핵산, 뉴클레오티드 서열, 단백질 또는 아미노산 서열은 단리되거나 정제되거나 화학적으로 합성되거나 재조합 DNA 기술을 통해 생산될 수 있다. 이들 방법 모두는 관련 기술분야에 널리 공지되어 있다.
본원에서 사용된 바와 같은 용어 "변형된" 또는 "돌연변이된" ("변형된 인테인" 또는 "돌연변이된 인테인"에서와 같이)은 천연 또는 자연 발생 구조와 비교할 때 언급되는 핵산 또는 아미노산 서열, 예컨대 인테인에서의 하나 이상의 변형을 지칭한다. 이러한 변형은 치환, 첨가 또는 결실일 수 있다. 변형은 언급되는 구조, 예컨대 인테인의 하나 이상의 아미노산 잔기 또는 하나 이상의 뉴클레오티드에서 발생할 수 있다.
본원에서 사용된 바와 같은 용어 "변형된 펩티드", "변형된 단백질" 또는 "변형된 관심 단백질" 또는 "변형된 표적 단백질"은 변형된 단백질을 지칭한다.
본원에서 사용된 바와 같은 "작동가능하게 연결된"은 생체분자의 정상적인 기능이 수행될 수 있도록 서로에 대한 구성으로 2개 이상의 생체분자의 회합을 지칭한다. 뉴클레오티드 서열과 관련하여, "작동가능하게 연결된"은 서열의 정상적인 기능이 수행될 수 있도록 서로에 대한 구성으로 효소적 라이게이션에 의해 또는 다른 방식으로 2개 이상의 핵산 서열의 회합을 지칭한다. 예를 들어, 프리-서열 또는 분비성 리더를 코딩하는 뉴클레오티드 서열은 폴리펩티드의 분비에 참여하는 프리-단백질로서 발현되는 경우 폴리펩티드에 대한 뉴클레오티드 서열에 작동가능하게 연결되고; 프로모터 또는 인핸서는 코딩 서열의 전사에 영향을 미치는 경우 코딩 서열에 작동가능하게 연결되고; 리보솜 결합 부위는 서열의 번역을 용이하게 하도록 위치되는 경우 코딩 서열에 작동가능하게 연결된다.
"서열 상동성"은 핵산 또는 단백질 서열이 공통의 진화적 기원을 갖기 때문에 유사한 상황을 지칭할 수 있다. "서열 상동성"은 서열이 매우 유사함을 표시할 수 있다. 서열 유사성은 관찰가능하며; 상동성은 관찰에 기초할 수 있다. "매우 유사한"은 적어도 70% 동일성, 상동성 또는 유사성; 적어도 75% 동일성, 상동성 또는 유사성; 적어도 80% 동일성, 상동성 또는 유사성; 적어도 85% 동일성, 상동성 또는 유사성; 적어도 90% 동일성, 상동성 또는 유사성; 예컨대 적어도 93% 또는 적어도 95% 또는 심지어 적어도 97% 동일성, 상동성 또는 유사성을 의미할 수 있다. 뉴클레오티드 서열 유사성 또는 상동성 또는 동일성은 NCBI에서 입수가능한 문헌 [Myers et al. (1988) CABIOS 4:11-17]의 "Align" 프로그램을 사용하여 결정될 수 있다. 추가적으로 또는 대안적으로, 아미노산 서열 유사성 또는 동일성 또는 상동성은 NCBI에서 이용가능한 BlastP 프로그램 (Altschul et al. Nucl. Acids Res. 25:3389-3402)을 사용하여 결정될 수 있다. 대안적으로 또는 추가적으로, 용어 "유사성" 또는 "동일성" 또는 "상동성"은 예를 들어 뉴클레오티드 서열과 관련하여 두 서열 간의 상동성의 정량적 측정을 표시하는 것으로 의도된다.
대안적으로 또는 추가적으로, 서열과 관련하여 "유사성"은 동일한 뉴클레오티드를 갖는 위치의 수를 두 서열 중 더 짧은 것의 뉴클레오티드의 수로 나눈 것을 지칭하며, 여기서 두 서열의 정렬은 문헌 [Wilbur and Lipman algorithm. (1983) Proc. Natl. Acad. Sci. USA 80:726]에 따라 결정될 수 있다. 예를 들어, 20개 뉴클레오티드의 윈도우 크기, 4개 뉴클레오티드의 단어 길이, 및 4의 갭 페널티의 사용, 및 정렬을 포함한 서열 데이터의 컴퓨터-지원 분석 및 해석은 상업적으로 이용가능한 프로그램 (예를 들어, 인텔리제네틱스™ 스위트(Intelligenetics™ Suite), 인텔리제네틱스 인크.(Intelligenetics Inc.) (CA))을 사용하여 편리하게 수행될 수 있다. RNA 서열이 유사하다고 언급되거나 DNA 서열과 서열 동일성 정도를 갖는 경우, DNA 서열의 티미딘 (T)은 RNA 서열의 우라실 (U)과 동일한 것으로 간주된다. 하기 참고문헌은 또한 두 단백질의 아미노산 잔기의 상대적 동일성 또는 상동성 또는 유사성을 비교하기 위한 알고리즘을 제공하고, 추가적으로 또는 대안적으로 전술한 것과 관련하여, 퍼센트 상동성 또는 동일성 또는 유사성을 결정하기 위해 참고문헌을 사용할 수 있다. 문헌 [Needleman et al. (1970) J. Mol. Biol. 48:444-453]; [Smith et al. (1983) Advances App. Math. 2:482-489]; [Smith et al. (1981) Nuc. Acids Res. 11:2205-2220]; [Feng et al. (1987) J. Molec. Evol. 25:351-360]; [Higgins et al. (1989) CABIOS 5:151-153]; [Thompson et al. (1994) Nuc. Acids Res. 22:4673-480]; 및 [Devereux et al. (1984) 12:387-395]. "엄격한 혼성화 조건"은 관련 기술분야에 널리 공지된 용어이며; 예를 들어 문헌 [Sambrook, "Molecular Cloning, A Laboratory Manual" second ed., CSH Press, Cold Spring Harbor, 1989]; ["Nucleic Acid Hybridization, A Practical Approach", Hames and Higgins eds., IRL Press, Oxford, 1985]을 참조하며; 또한 서열 비교가 있는 도 2 및 그의 설명을 참조한다.
용어 "완충액" 또는 "완충된 용액"은 그의 짝산-염기 범위의 작용에 의해 pH 변화에 저항하는 용액을 지칭한다.
용어 "로딩 완충액" 또는 "평형 완충액"은 칼럼에 단백질 제제를 로딩하기 위해 단백질 제제와 혼합되는 염 또는 염들을 함유하는 완충액을 지칭한다. 이 완충액은 또한 로딩 전에 칼럼을 평형화하고 단백질을 로딩한 후 칼럼으로 세척하는데 사용된다.
용어 "세척 완충액"은 관심 단백질 (예를 들어 C-말단 인테인 단편에 커플링된 것과 같음)의 로딩 후에 및 관심 단백질의 용리 전에 칼럼 (예를 들어) 위로 통과되는 완충액을 지칭하기 위해 본원에서 사용된다. 세척 완충액은 원하는 단백질의 실질적인 용리 없이 하나 이상의 오염물질을 제거하는 역할을 할 수 있다.
용어 "용리 완충액"은 칼럼으로부터 원하는 단백질을 용리하는데 사용되는 완충액을 지칭한다. 본원에서 사용된 바와 같은 용어 "용액"은 물을 포함하는 완충된 또는 비완충된 용액을 지칭한다.
용어 "세척"은 고체 지지체, 예컨대 크로마토그래피 수지를 통해 또는 그 위로 적절한 완충액을 통과시키는 것을 의미한다.
고체 지지체로부터 분자 (예를 들어 원하는 단백질 또는 오염물질)를 "용리"한다는 용어는 이러한 물질로부터 분자를 제거하는 것을 의미한다.
용어 "오염물질" 또는 "불순물"은 정제될 단백질의 샘플에 존재하는 임의의 외래 또는 불쾌한 분자, 특히 생물학적 거대분자, 예컨대 DNA, RNA 또는 정제될 단백질이 아닌 단백질을 지칭한다. 오염물질은 예를 들어 정제될 단백질을 발현 및/또는 분비하는 세포로부터의 다른 단백질을 포함한다.
단백질 정제와 관련하여 사용된 바와 같은 용어 "분리하다" 또는 "단리하다"는 원하는 단백질 및 제2 단백질 또는 다른 오염물질 또는 불순물 혼합물을 모두 포함하는 혼합물에서 제2 단백질 또는 다른 오염물질 또는 불순물의 혼합물로부터 원하는 단백질을 분리하여, 원하는 단백질의 분자의 적어도 대부분이 제2 단백질의 분자 또는 다른 오염물질 또는 불순물의 혼합물의 적어도 대부분을 포함하는 혼합물의 부분으로부터 제거되도록 하는 것을 지칭한다.
원하는 단백질 및 하나 이상의 오염물질을 포함하는 조성물 또는 용액으로부터 원하는 단백질을 "정제하다" 또는 "정제하는"이라는 용어는 조성물 또는 용액으로부터 적어도 하나의 오염물질을 (완전히 또는 부분적으로) 제거함으로써 조성물 또는 용액 중 원하는 단백질의 순도 정도를 증가시키는 것을 의미한다.
N-인테인 단백질 변이체
본 발명은 광범위한 아미노산 저항성으로 절단하여 최종 생성물로서 태그 없는 관심 단백질 (POI)을 생성하는 본 발명에 따른 스플릿 인테인 시스템을 사용하는 단일 단계의 친화성 크로마토그래피 및 친화성 태그 절단 메커니즘에 관한 것이다. 인테인의 2개의 절반은 친화성 리간드 (N-인테인) 및 친화성 태그 (C-인테인)이며 빠르게 회합한다. 크로마토그래피 수지에 하나의 절반 (N-인테인)을 고정화시키는 것은 용액으로부터 POI에 커플링된 다른 절반 (C-인테인)의 캡처를 가능하게 한다. Zn2+ 이온의 존재 하에, 절단 반응이 억제되어, 불순물을 세척하면서 안정적인 복합체가 형성되는 것을 가능하게 한다. 불순물을 제거한 후, 킬레이트제 또는 환원제를 첨가하고, 절단 반응을 진행하여, POI의 수집을 가능하게 하는 반면, 인테인 태그는 크로마토그래피 수지에 연결된 동족 인테인에 비공유결합적으로 결합된 상태로 유지된다.
바람직하게는 본 발명은 천연 스플릿 인테인의 N-인테인 단백질 변이체 서열 또는 천연 인테인 및 스플릿 인테인으로부터 유래된 컨센서스 서열을 제공하며, 여기서 N-인테인 변이체는 위치 24 및/또는 25에 돌연변이를 가짐으로써 증가된 용해도를 제공하도록 천연 서열 또는 컨센서스 서열과 비교하여 변형된다. 이들 위치는 1번인 초기 촉매 시스테인으로부터 시작하여 천연 스플릿 인테인과의 통상적인 클러스터 정렬에 따라 계산된다.
천연 인테인은 관련 기술분야에 공지되어 있다. 인테인 목록은 하기 표 1에서 볼 수 있다. 모든 인테인은 스플릿 인테인으로 만들어질 잠재성을 갖는 반면, 일부 인테인은 자연적으로 스플릿 형태로 존재한다. 표에서 볼 수 있는 모든 인테인은 스플릿 인테인으로 존재하거나, 천연 서열과 비교하여 증가된 용해도가 달성되도록 위치 24 및/또는 25에서 본 발명에 따라 변형된 스플릿 인테인으로 만들어질 잠재성을 갖는다.
표 1-자연 발생 인테인
개시된 조성물의 스플릿 인테인 또는 개시된 방법에서 사용될 수 있는 스플릿 인테인은 변형된 또는 돌연변이된 인테인일 수 있다. 변형된 인테인은 N-말단 인테인 세그먼트, C-말단 인테인 세그먼트, 또는 둘 다에 대한 변형을 포함할 수 있다. 변형은 스플릿 인테인의 어느 한 부분의 N-말단 C-말단에 추가 아미노산을 포함할 수 있거나, 스플릿 인테인의 어느 한 부분 내에 있을 수 있다. 표 2는 아미노산, 이들의 약자, 극성 및 전하의 목록을 제시한다.
표 2-아미노산의 목록
본 발명의 N-인테인은 고체상, 예컨대 멤브레인, 섬유, 입자, 비드 또는 칩에 커플링될 수 있다. 고체상은 천연 또는 합성 기원의 크로마토그래피 수지, 예컨대 천연 또는 합성 수지, 바람직하게는 폴리사카라이드, 예컨대 아가로스일 수 있다. 고체상, 예컨대 크로마토그래피 수지에는 매립된 자성 입자가 제공되어 있을 수 있다. 또 다른 실시양태에서 고체상은 비확산 제한 수지/섬유질 물질이다.
이 경우에 고체상은 하나 이상의 중합체성 나노섬유 기질, 예컨대 전기방사된 중합체 나노섬유로부터 형성될 수 있다. 본 발명에서 사용하기 위한 중합체 나노섬유는 전형적으로 10 nm 내지 1000 nm의 평균 직경을 갖는다. 중합체 나노섬유의 길이는 특별히 제한되지 않는다. 중합체 나노섬유는 적합하게는 모노필라멘트 나노섬유일 수 있고, 예를 들어 원형, 타원형 또는 본질적으로 원형/타원형 단면을 가질 수 있다. 전형적으로, 하나 이상의 중합체 나노섬유는 각각 하나 이상의 중합체 나노섬유를 포함하는 하나 이상의 부직포 시트의 형태로 제공된다. 하나 이상의 중합체 나노섬유를 포함하는 부직포 시트는 각각의 나노섬유가 본질적으로 무작위로 배향된 상기 하나 이상의 중합체 나노섬유의 매트이며, 즉 나노섬유 또는 나노섬유들이 특정 패턴을 채택하도록 제작되지 않았다. 부직포 시트는 전형적으로 1 내지 40 g/m2의 면적 밀도를 갖는다. 부직포 시트는 전형적으로 5 내지 120 μm의 두께를 갖는다. 중합체는 크로마토그래피 방법에서 크로마토그래피 매질, 즉 흡착제로서 사용하기에 적합한 중합체여야 한다. 적합한 중합체는 폴리아미드, 예컨대 나일론, 폴리아크릴산, 폴리메타크릴산, 폴리아크릴로니트릴, 폴리스티렌, 폴리술폰, 예를 들어 폴리에테르술폰 (PES), 폴리카프로락톤, 콜라겐, 키토산, 폴리에틸렌 옥시드, 아가로스, 아가로스 아세테이트, 셀룰로스, 셀룰로스 아세테이트, 및 이들의 조합을 포함한다.
본 발명에 따른 N-인테인은 고체 지지체에 매우 높은 정도로 고정화될 수 있으며, 수지 (팽윤된 겔) ml당 0.2-2 μmole/ml N-인테인이 커플링된다.
본 발명에 따른 N-인테인은 C-말단 상의 하나 이상, 예컨대 적어도 2개의 Lys를 포함하는 Lys-꼬리를 통해 고체상에 커플링될 수 있다. 대안적으로, N-인테인은 C-말단 상의 Cys-꼬리를 통해 고체상에 커플링된다.
C-인테인 단백질 변이체
바람직하게는 본 발명은 또한 스플릿 인테인 C-인테인 서열 또는 그의 조작된 변이체를 포함하는 C-인테인을 제공한다.
N-인테인 및 C-인테인의 선택은 동일한 야생형 스플릿 인테인으로부터 유래될 수 있거나 (예를 들어, 둘 다 Npu로부터 유래됨, 또는 N- 또는 C-인테인의 변이체), 또는 대안적으로 상이한 야생형 스플릿 인테인 또는 컨센서스 스플릿 인테인 서열로부터 선택될 수 있음이 이해될 것이며, 이는 상이한 C-단편 (예를 들어, Ssp C-단편 또는 그의 변이체를 갖는 Npu N-단편 또는 그의 변이체)에 대한 N-단편의 친화성이 개시된 방법에서 사용하기에 충분한 결합 친화성을 여전히 유지한다는 것이 발견되었기 때문이다.
스플릿 인테인 시스템
바람직하게는, 본 발명은 상기 기재된 바와 같은 N-인테인 및 C-인테인을 포함하는, 관심 단백질 (POI)의 친화성 정제를 위한 스플릿 인테인 시스템을 제공한다.
바람직하게는 N-인테인은 고체상에 부착되고, C-인테인은 POI와 공동-발현되고, POI의 친화성 정제를 위한 태그로서 사용된다. 그 반대의 경우도 가능하며, 즉, C-인테인을 고체상에 부착하고 N-인테인을 태그로서 사용하지만, 전자가 바람직하다.
한 실시양태에서, C-인테인 및 추가 태그는 POI와 공동-발현된다. 추가 태그는 임의의 통상적인 크로마토그래피 태그, 예컨대 IEX 태그 또는 친화성 태그일 수 있다.
관심 단백질 (POI)을 정제하는 방법
본 발명은 본 발명에 따른 스플릿 인테인 시스템을 사용하여 관심 단백질 (POI)을 정제하는 방법에 관한 것이며, 방법은 중성 pH, 예컨대 6-8에서 및 (자발적 절단을 손상시키는) 2가 양이온의 존재 하에 C-인테인 및 N-인테인을 회합시키는 단계; 2가 양이온의 존재 하에 상기 고체상을 세척하는 단계; C-인테인 및 POI 사이의 자발적 절단을 허용하도록 킬레이트제를 첨가하는 단계; 태그 없는 POI를 수집하는 단계를 포함한다.
이 프로토콜은 Zn에 민감하지 않은 단백질에 적합하다. 장점은 수지와의 긴 접촉 시간 및 큰 샘플 부피의 첨가이다. 샘플 로딩은 긴 시간 동안, 예컨대 최대 1.5시간 동안 이루어질 수 있다.
본 발명에 따라 30% 초과, 바람직하게는 50% 초과, 가장 바람직하게는 80% 초과의 POI 수율이 4시간 미만의 절단에서 달성된다.
본 발명은 N-인테인이 고체상에 고정화될 때 높은 리간드 밀도를 가능하게 한다. 바람직하게는 N-인테인은 단백질 정제를 위한 크로마토그래피 수지, 예컨대 아가로스 또는 임의의 다른 적합한 수지에 부착된다. 본 발명에 따라 침강된 수지 ml당 0.2-2 μmole/ml C-인테인 결합된 POI의 정적 결합 용량을 달성하는 것이 가능하다.
친화성 태그
본 발명은 또한 관심 단백질 (POI)의 정제 방법으로서, POI를 본 발명에 따른 C-인테인 및 추가 태그와 공동-발현하는 단계; 상기 추가 태그를 고체상 상의 그의 결합 파트너에 결합시키는 단계; POI 및 C-인테인을 절단하는 단계; 중성 pH에서 고체상에 부착된 N-인테인에 상기 C-인테인을 결합시키고, 상기 POI로부터 상기 결합된 C-인테인 및 N-인테인을 절단하는 단계; 및 알칼리 조건, 예컨대 0.5M NaOH 하에 상기 고체상을 재생하는 단계를 포함하는 방법에 관한 것이다. 이 트윈 태그의 목적: 증가된 순도 (이중 친화성 정제를 가능하게 함), 용해성, 검출능.
친화성 태그는 단백질의 거동을 변화시키는 단백질 코딩 서열과 함께 프레임에서 클로닝된 펩티드 또는 단백질 서열일 수 있다. 친화성 태그는 세포로부터 단백질을 정제하는 방법에서 사용될 수 있는 단백질의 N- 또는 C-말단에 첨부될 수 있다. 친화성 태그를 포함하는 펩티드를 발현하는 세포는 상청액/세포 배양 배지에서 신호 서열로 발현될 수 있다. 친화성 태그를 포함하는 펩티드를 발현하는 세포는 또한 펠릿화, 용해될 수 있으며, 세포 용해물은 친화성 태그에 리간드를 표시하는 칼럼, 수지 또는 기타 고체 지지체에 적용될 수 있다. 친화성 태그 및 임의의 융합된 펩티드는 고체 지지체에 결합되어 있으며, 이는 또한 비결합된 (오염물질) 단백질을 제거하기 위해 완충액을 사용하여 수 차례 세척될 수 있다. 관심 단백질은 친화성 태그에 부착된 경우, 친화성 태그가 리간드로부터 해리되어 정제된 단백질을 생성하도록 완충액을 통해 고체 지지체로부터 용리될 수 있거나, 또는 가용성 프로테아제를 사용하여 결합된 친화성 태그로부터 절단될 수 있다. 본원에 개시된 바와 같이, 친화성 태그는 활성 인테인 복합체에서 C-인테인 세그먼트의 자기-절단 메커니즘을 통해 절단된다.
친화성의 예는 융합된 표적 단백질의 정제를 용이하게 하기 위해 고정화된 말토스에 결합할 수 있는 말토스 결합 단백질; 고정화된 키틴에 결합할 수 있는 키틴 결합 단백질; 고정화된 글루타티온에 결합할 수 있는 글루타티온 S 트랜스퍼라제; 고정화된 킬레이트된 금속에 결합할 수 있는 폴리-히스티딘; 고정화된 항-FLAG 항체에 결합할 수 있는 FLAG 옥타펩티드를 포함하나 이에 제한되지는 않는다.
친화성 태그는 또한 선택적 침전, 이온 교환 크로마토그래피, 침전-가능 리간드에 대한 결합, 투석 (표적 단백질의 크기 및/또는 전하를 변화시킴으로써) 및 기타 고도로 선택적인 분리 방법을 포함하나 이에 제한되지는 않는 다양한 방법을 통해 개시된 변형된 펩티드를 사용하여 관심 단백질의 정제를 용이하게 하기 위해 사용될 수 있다.
일부 측면에서, 리간드에 실제로 결합하지 않지만 대신에 선택적으로 침전되거나 고정화된 상응하는 결합 도메인에 대한 리간드로서 작용하는 친화성 태그가 사용될 수 있다. 이들 경우에, 태그는 보다 일반적으로 정제 태그로 지칭된다. 예를 들어, ELP 태그는 특정 염 및 온도 조건 하에 선택적으로 침전되어, 융합된 펩티드가 원심분리에 의해 정제되도록 한다. 또 다른 예는 고정화된 단백질 A 또는 단백질 G-결합 도메인에 대한 리간드 역할을 하는 항체 Fc 도메인이다.
관심 단백질
모든 프로토콜에 대한 표적 단백질은 하기와 같다: 임의의 재조합 단백질, 특별히 천연 또는 거의 천연 N-말단 서열을 필요로 하는 단백질, 예를 들어 치료 단백질 후보, 생물제제, 항체 단편, 항체 모방체, 단백질 스캐폴드, 효소, 재조합 단백질 또는 펩티드, 예컨대 성장 인자, 시토카인, 케모카인, 호르몬, 항원 (바이러스, 박테리아, 효모, 포유동물) 생산, 백신 생산, 세포 표면 수용체, 융합 단백질.
본 발명은 이제 일부 비제한적인 실시예 및 첨부 도면과 관련하여 더 자세히 설명될 것이다.
실험 파트
본 발명은 일부 비제한적인 실시예 및 첨부 도면과 관련하여 보다 상세하게는 설명될 것이다.
본 발명에서는 하기 5개의 구축물을 평가하였다:
표 1
구축물 배양 및 발현:
시작 배양물을 진탕 플라스크에서 100mL LB+neo에 1:100 희석하고 (5개 구축물 모두에 대해 삼중으로 수행함), OD600이 0.6-1이 될 때까지 37℃에서 인큐베이션하였다. 표적 OD에 도달하면, 플라스크를 냉각된 인큐베이터 (22℃)로 옮기고, 유도를 위해 밤새 (정확히 18시간) 0.5mM IPTG를 첨가하였다. 유도된 배양물을 50mL 팔콘 튜브에서 5000g (+7℃)에서 순차적으로 펠릿화하고, 펠릿을 칭량하였다.
용해도 시험
칭량된 펠릿 (약 0.8그램)을 20 부피의 1x PBS에 재현탁시켰다. 각 구축물에 대해;
1. SDS-PAGE (전체 세포 용해물/WCL)를 위해 20μL를 저장하였음
2. 50mL 팔콘 튜브에 5mL를 첨가하였음 그리고
a. 20분 동안 5000g (6℃)에서 원심분리하였음
b. 펠릿을 5mL 8M 우레아에 재현탁시켰음
c. 실온에서 ~1시간 동안 끝까지 인큐베이션하였음
d. 20000g에서 20분 동안 6℃에서 원심분리하였음
e. SDS-PAGE (우레아)를 위해 20μL의 상청액을 저장하였음
f. 나머지 상청액을 비아코어 CFCA 분석에 사용하였음
3. 10mL를 50mL 팔콘 튜브에 첨가하였음 그리고
a. 30% 진폭에서 1분 동안 정각에 얼음 위에서 음파처리하였음 (2초 켜짐/4초 꺼짐 펄스).
b. 20000g에서 20분 동안 6℃에서 원심분리하였음
c. SDS-PAGE (음파처리)를 위해 20μL의 상청액을 저장하였음
d. 나머지 상청액을 비아코어 CFCA 분석에 사용하였음
4. 1.5mL 튜브에 500μL를 첨가하였음 그리고
a. 20분 동안 5000g에서 6℃에서 원심분리하였음
b. 500μL 1% NP40 완충액에 펠릿을 재현탁시켰음
c. 실온에서 1200rpm 진탕(Mathilda 블록)하면서 40분 동안 인큐베이션하였음
d. 20분 동안 12000g에서 6℃에서 원심분리하였음
e. 약 250μL의 상청액을 저장하였음
f. SDS-PAGE (NP40)를 위해 20μL의 상청액을 저장하였음
g. 나머지 상청액을 비아코어 CFCA 분석에 사용하였음
20μL 샘플에 40μL SDS-PAGE 완충액을 첨가하고, 95℃에서 5분 동안 비등시킨 후, 샘플을 15% 겔에 로딩하였다.
용해도는 SDS-PAGE 분석 샘플에 의해 평가하고 그에 따라 계산하였다:
추출 방법 밀도계 신호/전체 세포 용해물 (WCL) 밀도계 신호 *100%
도 1은 상이한 추출 기술을 사용한 후 대표적인 상청액의 SDS-PAGE 분석을 제시한다. 20μL의 상청액을 40μL의 2x Laemmli 샘플 완충액과 혼합하고, 5분 동안 95℃에서 비등시킨 후, 15% 균질한 SDS-PAGE 겔에 로딩하였다. 겔을 600V에서 1시간 50분 동안 전기영동하고 대략 2시간 동안 쿠마시에 의해 염색하였다. 광범위한 탈색 후, 아머샴(Amersham) AI600 이미저를 사용하여 겔을 이미지화하였다.
도 2는 SDS-PAGE 분석의 밀도계 평가 후 결정된 용해도를 제시한다. 각 구축물에 대한 3개의 상이한 세포-배양물로부터의 추출물을 분석하고, ImageQuant TL 소프트웨어를 사용하여 리간드 밴드 밀도계측을 측정하였다. 하기 공식에 기초하여 용해도를 계산하였다:
밀도계측(추출 방법 X)/ 밀도계측(WCL)*100% = % 용해도
막대는 전체 세포 용해물과 비교하여 상이한 추출 방법의 평균 용해도를 제시하고, 오차 막대는 표준 편차를 제시한다. 모든 구축물은 분석된 음파처리된 샘플에 대해 A52보다 유의하게 더 나은 용해도를 나타내었다. A53, B97 및 B82는 A52 샘플과 비교하여 유의하게 더 높은 용해도를 나타내었다. A52를 대조군 샘플로서 사용하여 던넷 사후 검정을 사용한 일원 ANOVA에 의해 통계적 유의성을 결정하였다. *p-값 <0.05, ** p-값 <0.01, *** p-값 <0.001, **** p-값 <0.0001.
Figure pct00033
우레아 추출 방법은 WCL과 비교하여 분석된 구축물과 무관하게 유의한 차이를 나타내지 않았다.
비아코어 CFCA 분석
다양한 단백질 추출물의 가용성 N-인테인 비율의 결정은 구축물의 C-말단에서 검출-태그로서 FLAG-에피토프 (DYKDDDDK)를 사용하는 SPR 결합 분석에 의해 추가로 분석하였다. 마우스 모노클로날 항-FLAG M2 항체를 사용하여 비아코어 T200 기기에서 무보정 농도 분석 (CFCA)을 수행하였다. 센서 칩인 CM5 시리즈 S를 아민 커플링 키트를 사용하여 항-FLAG 항체로 고정화하였다. 10 mM 아세트산나트륨 pH 4.0을 고정화 완충액으로 사용하고, HBS-EP+ pH 7.4를 런닝 완충액으로 사용하고, 글리신-HCl pH 2.5를 재생 완충액으로 사용하였다. 고정화 수준은 약 8000-10000 RU였다. 상기 기재된 상이한 추출로부터의 상청액 샘플을 HBS-EP+ 런닝 완충액에서 150-5000배로 희석한 후, CFCA 방법에 의해 분석하였다. 상이한 단백질 구축물의 분자량은 13.5-13.6 kDa 범위였으며, 이는 20℃에서 확산 계수 (1.13389E-10 m2/s)를 계산하는데 사용되었다. CFCA에 대한 디폴트 비아코어 방법은 최종 방법 설정을 위한 시작점으로 사용되었다. 비아코어 T200 평가 소프트웨어를 사용하여 샘플 농도를 결정하였다.
도 3은 비아코어 CFCA 분석에 의해 결정된 상이한 추출물로부터의 상청액 중 N-인테인 농도를 제시한다. 각 구축물에 대한 3개의 상이한 세포-배양물로부터의 추출물을 분석하였다. 막대는 평균 농도를 제시하고, 오차 막대는 표준 편차를 제시한다.
상이한 추출 방법을 사용한 추출 및 정화 후 상청액 중 N-인테인 농도는 가용성 N-인테인 비율의 계산에 사용된다. NP40 세제 완충액은 세포로부터 가용성 단백질의 온화한 방출을 야기한다. 초음파처리는 격렬한 세포 파괴를 야기하여 가용성 단백질을 방출하는 기계적 추출 기술이다. 고농도의 우레아는 세포로부터 봉입체에서 발견되는 가용성 단백질 및 불용성 단백질 둘 다의 방출을 야기하는 변성 추출 방법이다. SDS 샘플 완충액에서 세포 펠릿을 비등시키는 것은 가용성 및 불용성 N-인테인 둘 다의 완전한 가용화를 야기하고, 발현된 N-인테인의 총량에 대한 참조로서 사용된다. 변성 방법 (우레아 및 SDS)과 비교하여 비-변성 추출 방법 (NP40 및 음파처리)으로 추출한 후 상청액 중 높은 N-인테인 농도는 높은 용해도를 나타낸다. CFCA 분석은 A53 및 B97 구축물은 높은 용해도를 갖는 반면 A52는 매우 불량한 용해도를 갖는다는 것을 제시한다 (도 4).
통계적 분석은 변형된 구축물 B82, B83 및 B97이 온화한 비-변성 추출 방법을 사용할 때 비-변형된 A52 구축물과 비교하여 유의하게 더 가용성임을 제시한다.
SPR 결합 분석에 의해 평가된 용해도는 그에 따라 계산된다:
추출 방법 N-인테인 농도/SDS 추출된 N-인테인 농도 *100%
결과
나트륨 도데실 술페이트 (SDS)는 이온성 및 소수성 상호작용을 통해 단백질에 결합하고 이들의 2차 및 3차 구조를 변경함으로써 단백질을 가용화하는 이온성 세제이다. SDS는 단백질을 분리, 특징화 및 정량화하기 위해 폴리아크릴아미드 겔 전기영동 (SDS-PAGE)에서 일상적으로 사용된다. SDS는 SDS-PAGE 겔의 밀도계 분석 및 비아코어 무보정 농도 분석 (CFCA)에 의한 후속 분리, 검출 및 정량화를 위해 가용성 및 불용성 둘 다의 상이한 추출물의 단백질 총량의 정량화에 사용되는 보편적인 단백질 가용화 시약으로서 이들 예시 실험에서 사용되었다. 상이한 방법을 사용하여 추출물의 원심분리 정화 후 상청액에서 유래된 상이한 단백질 구축물의 농도와 비교하기 위해 SDS 가용화된 샘플 추출물 중 상이한 구축물의 농도를 100%로 정규화한다.
가용성 단백질만을 추출하기 위한 온화한 방법은 비-이온성 세제 NP40을 사용하는 것이다. 1% (w/v)의 NP40을 150 mM 염화나트륨을 함유하는 Tris-HCl 완충액 (pH 7.5)에 첨가하고, 수확된 박테리아 세포 펠릿을 재현탁시킨 후 1시간 동안 혼합함으로써 간단히 사용한다. 인큐베이션 후 세포 현탁액을 원심분리에 의해 정화하여 불용성 물질을 제거한다.
초음파처리 또는 음파처리는 가용성 세포 구성성분의 방출을 위해 세포를 붕괴하기 위해 프로브로부터의 기계적 에너지를 사용하는 단백질 추출 방법이다. 세포를 포스페이트 완충된 식염수, pH 7.4의 PBS와 같은 비-변성 완충액에 재현탁시켜 세포 구성성분의 방출 동안 pH를 제어한다. 음파처리는 음파처리 파라미터를 완전하게 제어하도록 허용하는 세포 붕괴를 위한 매우 효율적이고 신뢰할 수 있는 도구이다. 이는 물질 방출 및 생성물 순도에 대한 높은 선택성을 보장한다. 음파처리 후, 용해물을 상청액에 의해 정화하고, 불용성 펠릿을 제거한다.
우레아와 같은 카오트로픽 염은 세포로부터 가용성 및 불용성 단백질 둘 다의 방출을 위해 사용될 수 있다. 우레아는 일반적으로 사용되는 일부 분석 방법을 방해할 가능성이 높은 SDS 세제와 대조적으로 광범위한 분석 방법과 호환가능하다. 우레아는 일반적으로 최대 변성 조건을 보장하기 위해 8 M에서 사용되며 물에 용해될 수 있다. 세포를 우레아 용액에 재현탁시킨 후, 1시간 동안 혼합한다. 그 후, 추출물을 원심분리에 의해 정화하여 불용성 펠릿을 제거한다.
SDS는 가열되면 단백질을 변성시키고 모든 단백질에 강한 음전하를 부여한다. SDS는 아미노산 2개당 SDS 분자 1개의 비율로 단백질에 강력하게 결합한다. 이는 SDS 추출을 가용성 및 불용성 둘 다의 총 단백질의 양을 평가하기 위한 매우 효율적인 방법으로 만든다. 일반적으로, pH 6.7-7.5 사이의 완충 용액 중 2% (w/v) SDS 농도를 세포 수확물로부터의 동일한 부피의 세포 현탁액에 첨가한 후, 혼합하고, 95℃에서 5분 동안 가열한다. 그 후, 원심분리 및 분석 전에 샘플을 실온으로 냉각시킨다.
도 3은 상이한 방법을 사용하여 세포 수확물에서 단백질을 추출한 후 상청액 중 상이한 N-인테인 구축물의 농도를 제시한다. 추출 전 세포의 양 및 추출 부피를 정규화하여, 실제 농도를 직접 비교할 수 있도록 하였다. 각 막대는 3개의 상이한 세포 배양물로부터의 세포의 추출로부터 유래된 특정 구축물에 대한 평균 농도를 제시한다. 오차 막대는 표준 편차를 제시한다. 도 3에서 볼 수 있는 바와 같이, 단백질 구축물의 농도는 SDS 및 우레아를 사용하여 추출한 후 상청액에서 가장 높다. 상이한 구축물의 농도 사이의 상대적 차이는 상이한 세포 배양물로부터의 다양한 정도의 발현을 반영한다. 구축물 A52 및 B97은 SDS 추출물의 농도에 따라 총 가장 높은 N-인테인 발현을 가졌다 (각각 871 및 803 μg/ml). 우레아 추출물로부터의 N-인테인 농도는 일반적으로 SDS 추출물과 비교하여 더 낮지만, 대략 동일한 패턴을 따른다. 흥미로운 발견은 가용성 단백질만이 발견되는 음파처리 및 NP40 추출물로부터의 N-인테인 농도에서 볼 수 있다. 치환 돌연변이 K24E 또는 R25N을 포함하지 않는 구축물인 A52는 다른 구축물과 비교하여 가장 낮은 농도의 N-인테인을 가지며, NP40 추출물에서 27.5 μg/ml 및 음파처리된 샘플에서 37.9 μg/ml이다. K24E 및 R25N 치환을 포함하는 구축물 B97은 NP40 추출물에서 180.3 μg/ml 및 음파처리된 추출물에서 662.3 μg/ml의 상대적으로 높은 농도의 가용성 N-인테인을 갖는다. 이러한 차이는 도 4에서 더 뚜렷하게 나타나며, 여기서 각각의 구축물 및 추출 방법에 대한 N-인테인 농도를 각각의 구축물의 SDS 추출 후 N-인테인 농도와 비교한다. SDS 막대는 모두 비율 1 (100%)을 제공하므로 생략된다. 위치 24 및 25에서 돌연변이가 결여된 구축물 A52는 SDS 추출물과 비교하여 NP40 및 음파처리로부터의 추출물에서 N-인테인이 각각 3 및 4%에 불과하다. 구축물 B83의 단일 치환인 R25N은 SDS 추출물에 비해 더 높은 비율을 초래한다 (NP40 및 음파처리 추출물의 경우 각각 11% 및 25%). 구축물 B82의 단일 치환인 K24E는 SDS 추출물에 비해 더 높은 비율을 초래한다 (NP40 및 음파처리 추출물의 경우 각각 19% 및 49%). 위치 24 및 25에 2개의 아미노산 치환 (K24E 및 R25N)을 갖는 구축물 B97은 SDS 추출물에 비해 더 높은 비율을 초래한다 (NP40 및 음파처리 추출물의 경우 각각 22% 및 82%).
요약하면, 상기 실험에서 본 발명에 따라 달성된 용해도 범위는 하기와 같다:
위치 25에서 R의 단일-점 돌연변이, 바람직하게는 N 또는 비-양성 아미노산을 갖는 적어도 10-40% 가용성 N-인테인. 위치 24에서 K의 단일-점 돌연변이, 바람직하게는 E 또는 비-양성 아미노산을 갖는 적어도 46-52% 가용성 N-인테인. 위치 24 및 25에서 돌연변이, 바람직하게는 K24E 및 R25N 또는 비-양성 아미노산을 갖는 적어도 76-88% 가용성 N-인테인. 이들 값은 음파처리된 샘플의 비아코어 CFCA 데이터에 기초한다.
SEQUENCE LISTING <110> CYTIVA BIOPROCESS R&D AB <120> IMPROVED PROTEIN PURIFICATION <130> 100001.00164 <140> <141> <150> GB 2106771.5 <151> 2021-05-12 <160> 1 <170> PatentIn version 3.5 <210> 1 <211> 97 <212> PRT <213> Nostoc punctiforme <400> 1 Cys Leu Ser Tyr Glu Thr Glu Ile Leu Thr Val Glu Tyr Gly Leu Leu 1 5 10 15 Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys Thr Val Tyr Ser 20 25 30 Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val Ala Gln Trp His 35 40 45 Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp Gly Ser 50 55 60 Leu Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Val Asp Gly Gln 65 70 75 80 Met Leu Pro Ile Asp Glu Ile Phe Glu Arg Glu Leu Asp Leu Met Arg 85 90 95 Val

Claims (17)

  1. 천연 스플릿 인테인의 적어도 하나의 아미노산 치환을 포함하는, 야생형 노스톡 푼크티포르메(Nostoc punctiforme) (Npu) 또는 이와 적어도 95% 상동성을 갖는 서열로부터 유래된 N-인테인 단백질 변이체로서, 여기서 N-인테인 단백질 변이체 서열은 초기 촉매 시스테인으로부터 측정된 바와 같이 적어도 위치 24 및/또는 위치 25에 돌연변이를 포함하고, 여기서 치환된 아미노산은 천연 N-인테인 단백질 서열 또는 컨센서스 N-인테인 서열과 비교하여 수성 완충액에서의 증가된 용해도를 제공하는 것인 N-인테인 단백질 변이체.
  2. 제1항에 있어서, 증가된 용해도를 제공하는 치환된 아미노산(들)이 비-양성 아미노산인 N-인테인 단백질 변이체.
  3. 제1항 또는 제2항에 있어서, 증가된 용해도를 제공하는 치환된 아미노산이 K24E인 N-인테인 단백질 변이체.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 증가된 용해도를 제공하는 치환된 아미노산이 R25N인 N-인테인 단백질 변이체.
  5. 노스톡 푼크티포르메 (Npu)의 야생형 N-인테인 도메인의 N-인테인 단백질 변이체로서, 여기서 야생형 Npu N-인테인 도메인은 하기 서열을 포함하며:
    CLSYETEILTVEYGLLPIGKIVEKRIECTVYSVDNNGNIYTQPVAQWHDRGEQEVFEYCLEDGSLIRATKDHKFMTVDGQMLPIDEIFERELDLMRV (서열식별번호: 1), 여기서 단백질 변이체는 수성 완충액에서의 용해도를 증가시키기 위해 서열식별번호: 1의 위치 24에 K에서 E로의 아미노산 치환 및 서열식별번호: 1의 위치 25에 R에서 N으로의 아미노산 치환을 포함하고, 여기서 임의로 하나 이상의 C는 비-시스테인 잔기, 바람직하게는 S 또는 A로 돌연변이되는 것인 N-인테인 단백질 변이체.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 수성 완충액에서의 용해도가 위치 25에서 R의 단일-점 돌연변이, 바람직하게는 N 또는 비-양성 아미노산을 갖는 적어도 10-40% 가용성 N-인테인; 위치 24에서 K의 단일-점 돌연변이, 바람직하게는 E 또는 비-양성 아미노산을 갖는 적어도 46-52% 가용성 N-인테인; 및 위치 24 및 25에서 돌연변이, 바람직하게는 K24E 및 R25N 또는 비-양성 아미노산을 갖는 적어도 76-88% 가용성 N-인테인인 N-인테인 단백질 변이체.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 고체상, 예컨대 멤브레인, 섬유, 입자, 비드 또는 칩에 부착된 N-인테인 단백질 변이체.
  8. 제7항에 있어서, 고체상이 천연 또는 합성 기원의 크로마토그래피 수지인 N-인테인 단백질 변이체 서열.
  9. 제7항 또는 제8항에 있어서, 고체상이 크로마토그래피 수지, 예컨대 천연 또는 합성 수지, 바람직하게는 폴리사카라이드, 예컨대 아가로스인 N-인테인 단백질 변이체.
  10. 제9항에 있어서, 고체상에는 매립된 자성 입자가 제공되어 있는 것인 N-인테인 단백질 변이체.
  11. 제9항에 있어서, 고체상이 비확산 제한 수지/섬유질 물질인 N-인테인 단백질 변이체.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, N-인테인이 C-말단 상의 하나 이상의 Lys를 포함하는 Lys-꼬리를 통해 고체상에 커플링된 것인 N-인테인 단백질 변이체.
  13. 제1항 내지 제11항 중 어느 한 항에 있어서, N-인테인이 C-말단 상의 Cys-꼬리를 통해 고체상에 커플링된 것인 N-인테인 단백질 변이체.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, 고체상, 바람직하게는 크로마토그래피 수지 ml당 (팽윤된 겔 ml당) 0.2-2 μmole/ml N-인테인이 커플링된 것인 N-인테인 단백질 변이체.
  15. 고체상에 부착된 제1항 내지 제14항 중 어느 한 항에 따른 N-인테인 단백질 변이체, 및 POI (관심 단백질)와 공동-발현되는 C-인테인 서열을 포함하는 스플릿 인테인 시스템으로서, 여기서 C-인테인은 POI 상의 태그로서 작용하고, 발현된 C-인테인은 상기 N-인테인 단백질 변이체에 결합하는 것인 스플릿 인테인 시스템.
  16. 제15항에 있어서, C-인테인 서열이 천연 스플릿 인테인 C-인테인 서열 또는 그의 조작된 변이체인 스플릿 인테인 시스템.
  17. 제15항 또는 제16항에 있어서, POI가 천연 또는 거의 천연 N-말단 서열을 필요로 하는 단백질, 예를 들어 치료 단백질 후보, 생물제제, 항체 단편, 항체 모방체, 효소, 재조합 단백질 또는 펩티드, 예컨대 성장 인자, 시토카인, 케모카인, 호르몬, 항원 (바이러스, 박테리아, 효모, 포유동물) 생산, 백신 생산, 세포 표면 수용체, 융합 단백질인 스플릿 인테인 시스템.
KR1020237042305A 2021-05-12 2022-05-09 개선된 단백질 정제 KR20240007210A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB202106771 2021-05-12
GB2106771.5 2021-05-12
PCT/EP2022/062467 WO2022238319A1 (en) 2021-05-12 2022-05-09 Improved protein purification

Publications (1)

Publication Number Publication Date
KR20240007210A true KR20240007210A (ko) 2024-01-16

Family

ID=81975152

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237042305A KR20240007210A (ko) 2021-05-12 2022-05-09 개선된 단백질 정제

Country Status (6)

Country Link
EP (1) EP4337670A1 (ko)
JP (1) JP2024516907A (ko)
KR (1) KR20240007210A (ko)
CN (1) CN117355536A (ko)
CA (1) CA3216901A1 (ko)
WO (1) WO2022238319A1 (ko)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2930185T3 (es) 2012-06-27 2022-12-07 Univ Princeton Inteínas divididas, conjugados y usos de las mismas
US10087213B2 (en) 2013-01-11 2018-10-02 The Texas A&M University System Intein mediated purification of protein
SG10201801320UA (en) * 2014-11-03 2018-04-27 Merck Patent Gmbh Soluble intein fusion proteins and methods for purifying biomolecules
US10066027B2 (en) 2015-01-09 2018-09-04 Ohio State Innovation Foundation Protein production systems and methods thereof
CN108884154A (zh) * 2016-01-29 2018-11-23 普林斯顿大学理事会 具有独特剪接活性的断裂内含肽
EP3541508B1 (en) 2016-11-16 2023-07-12 Cytiva BioProcess R&D AB Production method for affinity chromatography resin
GB201917046D0 (en) 2019-11-22 2020-01-08 Ge Healthcare Bioprocess R&D Ab Improved protein production

Also Published As

Publication number Publication date
WO2022238319A1 (en) 2022-11-17
EP4337670A1 (en) 2024-03-20
JP2024516907A (ja) 2024-04-17
CN117355536A (zh) 2024-01-05
CA3216901A1 (en) 2022-11-17

Similar Documents

Publication Publication Date Title
CA1339208C (en) Fusion proteins containing a hinge region for enhanced cleavage
US6852834B2 (en) Fusion peptides isolatable by phase transition
US9353161B2 (en) Streptavidin mutein exhibiting reversible binding for biotin and streptavidin binding peptide tagged proteins
JP2023502335A (ja) スプリットインテインシステムを使用したタンパク質精製
WO2013142859A2 (en) Fusion proteins of superfolder green fluorescent protein and use thereof
NZ553420A (en) Refolding transforming growth factor beta family proteins
KR20140007394A (ko) 면역 글로불린 결합성 신규 폴리펩티드
KR20190015240A (ko) 보툴리눔 신경독소의 정제 및 활성화 방법
JP2011092197A (ja) グランザイムbプロテアーゼを使用した融合タンパク質の開裂
US20210372948A1 (en) Versatile display scaffolds for proteins
CN113195521A (zh) Mtu ΔI-CM内含肽变体和其应用
CA2206848A1 (en) Production of peptides using recombinant fusion protein constructs
JP4088584B2 (ja) 融合タンパク質から目的タンパク質を分離する方法。
KR20240007210A (ko) 개선된 단백질 정제
US11267863B2 (en) N-terminal fusion partner for producing recombinant polypeptide, and method for producing recombinant polypeptide using same
KR101485646B1 (ko) Igf―ⅰ 폴리(에틸렌 글리콜) 컨쥬게이트
JP2009536821A5 (ko)
JP4481260B2 (ja) 抗体結合性ペプチド
JPWO2016063926A1 (ja) 精製方法、精製キット、および、これらに用いられる酸化ケイ素結合タグ
JP2004520056A (ja) 可溶性ssaoの精製のための方法
AU768111B2 (en) Method of removing N-terminal alanine residues from polypeptides with Aeromonas aminopeptidase
KR102637595B1 (ko) 알칼리내성이 증가된 면역글로불린-결합 단백질 변이체 및 이의 용도
KR100535265B1 (ko) 융합 단백질로부터 목적 단백질을 분리하는 방법
JP5020487B2 (ja) 融合タンパク質発現用新規dna及び該dnaを用いたタンパク質の製造方法
JPH03218397A (ja) ポリペプチドおよびその製造法