KR20220098129A

KR20220098129A - 단백질 발현을 위한 시스템 및 방법

Info

Publication number: KR20220098129A
Application number: KR1020227012283A
Authority: KR
Inventors: 바바라 머틴스; 토마스 폴리어드
Original assignee: 익셉젠 인크.
Priority date: 2019-09-16
Filing date: 2020-09-15
Publication date: 2022-07-11
Also published as: WO2021055369A1; EP4031670A1; BR112022004920A2; JP2022548644A; EP4031670A4; IL291284A; US20230056404A1; CN114761565A; MX2022002956A; US20220307037A1; CA3153942A1; AU2020351130A1

Abstract

본 개시내용은 인핸서 단백질과 함께 표적 단백질의 발현을 위한 시스템을 제공한다. 인핸서 단백질은 핵세포질 수송을 차단하는 바이러스 단백질일 수 있다. 또한 표적 단백질 및 인핸서 단백질 핵산 서열을 포함하는 폴리뉴클레오타이드, 벡터 및 세포가 제공된다.

Description

단백질 발현을 위한 시스템 및 방법

관련 출원에 대한 상호 참조

본 출원은 2019년 9월 16일에 출원된 미국 가출원 제62/901,043호와 2020년 2월 5일에 출원된 미국 가출원 제62/970,628호의 이익을 주장하며, 이들 각각의 내용은 모든 목적을 위해 그 전체가 참조로 본원에 포함된다.

서열 목록의 포함

전자적으로 제출된 텍스트 파일의 내용은 그 전체가 참조로 본원에 포함된다: 서열 목록의 컴퓨터 판독가능한 포맷 사본(파일명: EXCI_001_02WO_SeqList_ST25.txt, 기록일 2020년 9월 15일, 파일 크기 84.8 kb).

배양에서 성장한 진핵 세포에서의 단백질의 재조합 발현은 과학 연구 및 의학에 응용된다. 재조합으로 생산된 단백질(예컨대, 항체, 효소, G-단백질 결합 수용체(GPCR), 분비 단백질, 이온 채널, 바이러스 단백질 및 성장 인자)은 신약을 개발하기 위해 제약 산업 내에서(예컨대, 소분자 발견), 치료제(예컨대, 항체 및 기타 생물학적 약물)로서, 및 분석 방법을 위한 중요한 자산으로서 사용된다. 제약 산업에서의 이들의 용도 외에도, 재조합으로 생산된 포유동물 단백질은 식품 산업에서(예컨대, 소위 청정육 생산을 위해) 점점 더 많이 사용되고 있다. 많은 재조합 단백질의 경우, 기능적 형태로 재조합 단백질의 발현을 달성하는 것은 여전히 도전적이다.

재조합 단백질의 생산에 유용한 조성물 및 방법에 대한 요구는 아직 충족되지 않고 있다.

본 발명자들은 특정 인핸서 단백질과 표적 단백질의 동시 발현이 재조합으로 생성된 단백질을 개선한다는 것을 인식하였다. 다양한 구현예에서, 개시된 조성물 및 방법은 선행 기술에 비해 다음의 이점 중 하나 이상을 나타낸다: (1) 이들은 세포주(예컨대, 진핵 세포주) 내에서 표적 단백질의 단백질 발현(수율)을 증가시키고; (2) 이들은 표적 단백질의 발현 조절을 제어하며; (3) 이들은 개선된 특성(예컨대, 미스폴딩 감소, 활성 변경, 부정확한 번역 후 변형 및/또는 독성)을 나타내는 표적 단백질을 발현하고; (4) 이들은 재조합 단백질의 정확한 폴딩 및/또는 높은 수율을 증가시키며; (5) 이들은 하류 활성화 경로의 성능(예컨대, GPCR 신호전달)을 개선하고/하거나; (6) 인핸서 단백질의 동시 발현은 표적 단백질의 기능 및/또는 세포의 하류 대사에 영향을 미치지 않는다. 일부 구현예는 이러한 이점을 전혀 나타내지 않거나 이러한 이점 중 일부 또는 전부를 나타내기 때문에, 본 발명은 이러한 열거된 이점에 제한되지 않는다.

일 양태에서, 본 개시내용은 하나 이상의 벡터를 포함하는, 진핵 세포 내 표적 단백질의 재조합 발현을 위한 시스템을 제공한다. 벡터들(또는 벡터)는 표적 단백질을 코딩하는 제1 폴리뉴클레오타이드 및 인핸서 단백질을 코딩하는 제2 폴리뉴클레오타이드를 갖는다. 인핸서 단백질은 핵세포질 수송(nucleocytoplasmic transport, NCT)의 억제제이고/이거나 인핸서 단백질은 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 단순 포진 바이러스(HSV) ICP27 단백질, 및 랍도바이러스 기질(M) 단백질로 이루어진 군으로부터 선택된다. 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드는 하나 이상의 프로모터에 작동가능하게 연결된다.

또 다른 양태에서, 본 개시내용은 표적 단백질의 발현을 위한 진핵 세포를 제공하며, 세포는 인핸서 단백질을 코딩하는 외인성 폴리뉴클레오타이드를 포함한다. 인핸서 단백질은 핵세포질 수송(NCT)의 억제제이고/이거나 인핸서 단백질은 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 코로나바이러스 ORF6 단백질, 에볼라바이러스 VP24 단백질, 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질, 단순 포진 바이러스(HSV) ICP27 단백질 및 랍도바이러스 기질(M) 단백질로 이루어진 군으로부터 선택된다. 외인성 폴리뉴클레오타이드는 프로모터(선택적으로 천연 프로모터 또는 외인성 프로모터)에 작동가능하게 연결된다. 또 다른 양태에서, 본 개시내용은 프로모터에 작동가능하게 연결된 표적 단백질을 코딩하는 폴리뉴클레오타이드를 이러한 진핵 세포 내로 도입하는 단계를 포함하는, 표적 단백질의 재조합 발현 방법을 제공한다. 또 다른 양태에서, 본 개시내용은 본 개시내용의 벡터 시스템을 진핵 세포 내로 도입하는 단계를 포함하는, 표적 단백질의 재조합 발현 방법을 제공한다. 또 다른 양태에서, 본 개시내용은 본 개시내용의 벡터 시스템(또는 벡터)을 진핵 세포 내로 도입함으로써 생성된 세포를 제공한다. 또 다른 양태에서, 본 개시내용은 본 개시내용의 벡터 시스템(또는 벡터)을 진핵 세포 내로 도입함으로써 발현된 단백질을 제공한다. 또 다른 양태에서, 본 개시내용은 표적 단백질을 코딩하는 폴리뉴클레오타이드(프로모터에 작동가능하게 연결된 폴리뉴클레오타이드)를 진핵 세포 내로 도입하는 단계를 포함하는, 진핵 세포 내 표적 단백질을 발현시키기 위한 방법을 제공한다. 이 방법은 표적 단백질의 발현 수준, 용해도 및/또는 활성을 향상시키기 위해 인핸서 단백질의 동시 발현을 이용한다. 인핸서 단백질은 핵세포질 수송(NCT)의 억제제이고/이거나 인핸서 단백질은 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 코로나바이러스 ORF6 단백질, 에볼라바이러스 VP24 단백질, 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질, 단순 포진 바이러스(HSV) ICP27 단백질 및 랍도바이러스 기질(M) 단백질로 이루어진 군으로부터 선택된다.

또 다른 양태에서, 본 개시내용은 본 개시내용의 시스템 또는 방법을 사용하여 생성된 세포 또는 표적 단백질로 대상체를 면역화하는 단계를 포함하는, 표적 단백질에 대한 항체를 생성하기 위한 방법을 제공한다. 또 다른 양태에서, 본 개시내용은 본 개시내용의 시스템 또는 방법을 사용하여 생성된 표지된 세포 또는 표지된 표적 단백질, 및 재조합 세포의 집단을 포함하는 용액을 제공하는 단계로서, 재조합 세포는 각각 항체 또는 이의 항원 결합 단편을 포함하는 폴리펩타이드의 라이브러리를 발현하는 것인 단계; 및 표지된 세포 또는 표지된 표적 단백질에 결합된 재조합 세포를 검출함으로써 용액으로부터 하나 이상의 재조합 세포를 분류하는 단계를 포함하는, 세포 분류에 의한 항체 발견 방법을 제공한다. 추가 양태에서, 본 개시내용은 파지 디스플레이 라이브러리를 본 개시내용의 시스템 또는 방법을 사용하여 생성된 세포 또는 표적 단백질과 혼합하는 단계; 및 세포 또는 표적 단백질에 결합하는 파지 디스플레이 라이브러리의 구성원을 정제 및/또는 농축하는 단계를 포함하는, 파지 디스플레이 라이브러리를 패닝(panning)하는 방법을 제공한다.

추가 양태 및 구현예는 다음의 상세한 개시내용에 의해 제공된다. 본 발명은 이러한 요약에 제한되지 않는다.

도 1은 진핵 세포에서 유전자 발현을 조절하는 6가지 예시적인 방법을 도시한다.
도 2a-2y는 비제한적이고 예시적인 작제물의 개략도이다: EG1, 도 2a; EG2, 도 2b; EG3 및 EG4, 도 2c; EG5, 도 2d; EG6, 도 2e; EG7, 도 2f; EG8, 도 2g; EG9, 도 2h; EG10 및 EG11, 도 2i; EG12 및 EG4, 도 2j; EG10, 도 2k; EG13, 도 2l; EG14, 도 2m; EG15, 도 2n; EG16, 도 2o; EG17, 도 2p; EG18, 도 2q; EG19, 도 2r; EG20, 도 2s; EG21, 도 2t; EG22, 도 2u; EG23, 도 2v; EG24, 도 2w; 및 EG25, 도 2x.
도 3a-3d는 대조군 벡터 EG1과 비교하여 작제물 EG2(CMV-GFP-IRES-L)를 사용하여 발현된 GFP를 발현하는 세포의 광학 및 형광 현미경 검사의 이미지를 보여준다. 도 3a: EG1을 포함하는 세포의 광학 현미경 검사. 도 3b: EG1을 포함하는 세포의 형광 현미경 검사. 도 3c: EG2를 포함하는 세포의 광학 현미경 검사. 도 3d: EG2를 포함하는 세포의 형광 현미경 검사. EG2 작제물로부터의 형광 GFP 단백질의 발현은 시스템의 실행가능성을 입증한다. EG1을 포함하는 세포(도 3b)와 비교하여 EG2를 포함하는 세포(도 3d)에서의 유해한 과발현의 감소는 L-단백질의 도입에 의한 GFP 발현의 개선된 조절을 입증한다. 도 3a-3d의 막대는 400 마이크론을 나타낸다.
도 4a-4d는 대조군 벡터 EG1과 비교하여 작제물 EG3 및 EG4(각각 T7-IRES-L-GFP 및 CMV-T7)를 사용하여 발현된 GFP를 발현하는 세포의 광학 및 형광 현미경 검사의 이미지를 보여준다. 도 4a: EG1을 포함하는 세포의 광학 현미경 검사. 도 4b: EG1을 포함하는 세포의 형광 현미경 검사. 도 4c: EG3+EG4를 포함하는 세포의 광학 현미경 검사. 도 4d: EG3+EG4를 포함하는 세포의 형광 현미경 검사. EG3+EG4 작제물로부터의 형광 GFP 단백질의 발현은 시스템의 실행가능성을 입증한다. EG1을 포함하는 세포(도 4b)와 비교하여 EG3+EG4를 포함하는 세포(도 4d)에서의 발현 감소는 L-단백질의 도입에 의한 GFP 발현의 개선된 조절을 입증한다. 도 4a-4d의 막대는 400 마이크론을 나타낸다.
도 5a-5d는 작제물 EG10(CMV-[DRD1-GFP])(도 5a) 또는 EG8(CMV-[DRD1-GFP]-IRES-L)(도 5c)로부터 DRD1-GFP 융합을 발현하는 세포의 형광 현미경 검사의 이미지를 보여준다. DRD1-GFP는 작제물 EG10을 사용하여 발현되지만 수용체를 외막으로 수송하지 못하여, 봉입체의 형성을 유도한다(도 5b, 화살표). DRD1-GFP는 작제물 EG8을 사용하여 발현되고 막 내로 확실히 수송되어 고품질로 외막에서 높은 수율의 GPCR을 유도한다(도 5d).
도 6a-6b는 작제물 EG10(CMV-[DRD1-GFP])(도 6a) 또는 EG12 및 EG4(각각 T7-IRES-L-DRD1-GFP 및 CMV-T7)(도 6b)로부터 발현된 DRD1-GFP 융합 단백질을 발현하는 세포의 형광 현미경 검사의 이미지를 보여준다. EG10을 사용하여 발현된 DRD1-GFP는 발현되지만 수용체를 외막으로 정확하게 수송하지 못하여, 봉입체의 형성을 유도한다(도 6a, 화살표). EG4와 조합된 EG12를 사용하여 발현된 DRD1-GFP는 발현되고 막 내로 확실히 수송되어 고품질로 외막에서 높은 수율의 GPCR을 유도한다(도 6b).
도 7은 항-CFTR 웨스턴 블롯의 결과를 보여준다. PCR 산물로서 또는 벡터로서 전달된 L-단백질과 CFTR의 동시 발현(점선의 왼쪽)은 L-단백질의 동시 발현이 없는 CFTR의 대조군 발현(점선의 오른쪽)과 비교하여 수율 감소를 유도하지만 더 균질한 샘플을 유도한다.
도 8a-8b는 NADase의 정제 및 활성 시험의 결과를 보여준다. 도 8a는 FLAG 태그를 사용하여 정제된 NADase 친화도의 SDS-PAGE를 보여준다. (표준, SeeBlue2 plus; 레인 2, 용해물/로드; 레인 3, 통과액; 레인 4, 컬럼 용출 분획 1; 레인 5, 컬럼 용출 분획 2; 레인 6, 컬럼 용출 분획 3; 레인 7, 컬럼 용출 분획 4; 8, 수지). 도 8b는 상이한 농도의 정제된 NADase를 사용하여 고성능 액체 크로마토그래피(HPLC)에 의해 분석한 NAD+ 전환 활성의 그래프를 보여준다.
도 9a-9b는 ITK의 His-태그 정제의 결과를 보여준다. 도 9a는 His 태그를 사용하여 정제된 ITK 친화도의 SDS-PAGE를 나타낸다. 레인: 레인 1, 사전 염색된 SeeBlue2 plus; 레인 2, 500 ng GFP; 레인 3, 2 μg ITK; 레인 4, 5 μg ITK; 레인 5, 10 μg ITK. 도 9b는 도 9a의 SDS-PAGE 후 웨스턴 블롯 분석 결과를 보여주며, 화살표는 ITK의 단량체 및 이량체를 가리킨다.
도 10은 작제물 EG10(CMV-[DRD1-GFP])(도 10a) 또는 EG10 및 EG11(도 10b)로부터 발현된 DRD1-GFP 융합 단백질을 발현하는 세포의 형광 현미경 검사의 이미지를 보여준다. 화살표는 수용체를 외막 내로 정확하게 수송하지 못하는 EG10으로부터 발현된 DRD1-GFP에 의해 형성된 봉입체를 가리킨다.
도 11은 도파민의 존재 또는 부재하에 HEK293 세포에서 E5 작제물(CMV-DRD1-Strp) 또는 E6 작제물(CMV-DRD1-Strp-IRES-L)을 발현하는 세포에서의 cAMP 수준을 나타내는 cAMP-Glo™ 분석의 발광 결과를 보여주는 그래프를 나타낸다. 더 높은 발광 신호는 DRD1-Strep의 더 높은 기능적 활성을 나타낸다.
도 12는 CMV 프로모터를 사용하여 발현된 DRD1-GFP 융합 단백질(도 12a), CMV 프로모터를 사용하여 L 단백질과 조합하여 발현된 DRD1-GFP 융합 단백질(도 12b), EF1-α 프로모터를 사용하여 L 단백질과 조합하여 발현된 DRD1-GFP 융합 단백질(도 12c), 및 SV40 프로모터를 사용하여 L 단백질과 조합하여 발현된 DRD1-GFP 융합 단백질(도 12d)을 발현하는 세포의 형광 현미경 검사의 이미지를 보여준다.
도 13은 DRD1-GFP 융합 단백질(도 13a), EMCV로부터의 L 단백질과 조합하여 발현된 DRD1-GFP 융합 단백질(도 13b), 타일러 바이러스로부터의 L 단백질과 조합하여 발현된 DRD1-GFP 융합 단백질(도 13c), 폴리오 바이러스의 2A 프로테아제와 조합하여 발현된 DRD1-GFP 융합 단백질(도 13d) 및 수포성 구내염 바이러스의 M 단백질과 조합하여 발현된 DRD1-GFP 융합 단백질(도 13e)을 발현하는 HEK293 세포의 형광 현미경 검사 이미지를 보여준다. 하단 패널은 상단 패널에 표시된 일부 세포의 확대도를 보여준다.
도 14는 DRD1-GFP 융합 단백질(도 14a), 및 타일러 바이러스로부터의 L 단백질과 조합하여 발현된 DRD1-GFP 융합 단백질(도 14b)을 발현하는 CHO-K1 세포의 형광 현미경 검사의 이미지를 보여준다. 화살표는 수용체를 외막 내로 정확하게 수송하지 못하는 EG10으로부터 발현된 DRD1-GFP에 의해 형성된 봉입체를 가리킨다.
도 15는 DRD1-GFP 융합 단백질(도 15a), 및 EMCV로부터의 L 단백질과 조합하여 발현된 DRD1-GFP 융합 단백질(도 15b)을 발현하는 CHO-K1 세포의 형광 현미경 검사의 이미지를 보여준다. 도 15a에서, 화살표는 수용체를 외막 내로 정확하게 수송하지 못하는 EG10으로부터 발현된 DRD1-GFP에 의해 형성된 봉입체를 가리킨다. 도 15b에서, 화살표는 정확하게 국소화되고 막 통합된 DRD1-GFP를 가리킨다.
도 16은 니켈 충전된 친화성 수지(도 16a), 또는 크기 배제 크로마토그래피(도 16b)를 사용하여 정제된 HEK293 세포에서 발현된 ITK 단백질, 및 니켈 충전된 친화성 수지(도 16c), 또는 크기 배제 크로마토그래피(도 16d)를 사용하여 정제된 HEK293 세포에서 발현된 ITK-L 융합 단백질의 SDS-PAGE 분석의 이미지를 보여준다. P1은 ITK의 이량체성 형태를 지칭하는 반면, P2는 ITK의 단량체성 형태를 지칭한다.
도 17a는 정제된 ITK 단백질, 및 HEK293 세포에서 L 단백질과 조합하여 발현된 정제된 ITK 단백질의 SDS-PAGE 분석의 결과를 보여준다. 도 17b는 SDS PAGE 이미지에 표시된 바와 같이, P1 및 P2 ITK 정제된 단백질 샘플의 발광 측정의 그래프를 보여준다.
도 18은 니켈 충전된 친화성 수지(도 18a), 또는 크기 배제 크로마토그래피(도 18b)를 사용하여 정제된 CHO 세포에서 발현된 ITK 단백질, 및 니켈 충전된 친화성 수지(도 18c), 또는 크기 배제 크로마토그래피(도 18d)를 사용하여 정제된 CHO 세포에서 L 단백질과 조합하여 발현된 ITK 단백질의 SDS-PAGE 분석의 이미지를 보여준다. P1은 ITK의 이량체성 형태를 지칭하는 반면, P2는 ITK의 단량체성 형태를 지칭한다.
도 19는 CHO 세포에서 L 단백질과 조합하여 발현되고 크기 배제 크로마토그래피 실험을 사용하여 정제된 P1 및 P2 ITK 단백질 샘플의 발광 측정의 그래프를 보여준다.
도 20a는 인핸서 L 단백질의 부재(왼쪽) 또는 존재(오른쪽)하에 발현된 정제된 C1-억제제의 SDS-PAGE 분석의 이미지를 보여준다. 도 20b는 표시된 인핸서 L 단백질의 존재 또는 부재하에 발현된, 정제된 C1-억제제 단백질 샘플에 존재하는 기능적으로 활성인 C1-억제제의 농도를 도시하는 그래프를 나타낸다. 데이터는 제조업체의 프로토콜에 따라 양성 대조군(100% 활성)으로서 C1-억제제를 함유하는 건강한 인간 혈장을 사용하여, 상업적인 Quidel MicroVue Complement C1-Inhibitor Plus Enzyme Immunoassay를 사용하여 얻었다.
도 21은 PSG1의 이온 교환 크로마토그래피를 보여준다. 단백질 함유 분획(도 21a, 빨간색 상자)을 모으고 농축시킨 후 SDS-PAGE 및 웨스턴 블롯에 의해 PSG1의 존재를 확인하였다(도 21b, 빨간색 화살표).

본 개시내용에 따르면, 인핸서 단백질과 표적 단백질의 동시 발현에 유용한 벡터 시스템, 벡터 또는 진핵 세포가 제공된다. 일부 구현예에서, 하나 이상의 벡터를 포함하는, 진핵 세포 내 표적 단백질의 재조합 발현을 위한 시스템이 제공된다. 일부 구현예에서, 벡터들(또는 벡터)은 표적 단백질을 코딩하는 제1 폴리뉴클레오타이드 및 인핸서 단백질을 코딩하는 제2 폴리뉴클레오타이드를 갖는다. 인핸서 단백질은 핵세포질 수송(NCT)의 억제제이고/이거나 인핸서 단백질은 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 단순 포진 바이러스(HSV) ICP27 단백질, 및 랍도바이러스 기질(M) 단백질로 이루어진 군으로부터 선택된다. 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드는 하나 이상의 프로모터에 작동가능하게 연결된다.

이론에 얽매이지 않고, 본 개시내용의 조성물 및 방법은 세포의 조절 기전이 재조합 표적 단백질의 발현에 반응하여 활성화되는 것을 방지하고, 이는 표적 단백질의 수율 및/또는 기능을 개선시키는 것으로 여겨진다. 본 개시내용의 방법 및 시스템은 비제한적으로 (1) 전사 개시의 억제, (2) 전사 종결 및 폴리아데닐화의 억제; (3) mRNA 가공 및 스플라이싱의 억제, (4) mRNA 수출의 억제; (5) 번역 개시의 억제; 및 (6) 스트레스 반응을 포함하는 하나 이상의 세포 기전을 억제하거나 방해할 수 있다(도 1).

다양한 구현예가 도 2a-2y 및 표 1에 도시되어 있다. 일부 구현예에서, 제1 벡터는 표적 단백질을 코딩하는 폴리뉴클레오타이드를 포함하고, 제2 벡터는 인핸서 단백질을 코딩하는 폴리뉴클레오타이드를 포함한다. 다른 구현예에서, 단일 벡터는 표적 단백질 및 인핸서 단백질을 코딩하는 하나 이상의 폴리뉴클레오타이드를 포함한다. 벡터는 표적 단백질 및 인핸서 단백질 모두를 코딩하는 단일 폴리뉴클레오타이드를 포함할 수 있다. 대안적으로, 하나 초과의 인핸서 단백질 및/또는 하나 초과의 표적 단백질이 벡터 또는 벡터들에 의해 코딩된다.

폴리뉴클레오타이드

본 개시내용은 하나 이상의 표적 단백질 및 하나 이상의 인핸서 단백질의 발현을 위한 재조합 폴리뉴클레오타이드에 관한 것이다. 폴리뉴클레오타이드(또는 핵산 또는 핵산 분자)는 하나 이상의 관심 유전자를 포함할 수 있고 본 개시내용의 조성물 및 방법을 사용하여 세포(예컨대, 진핵 세포)에 전달된다. 본 개시내용의 폴리뉴클레오타이드는 DNA, RNA, 및 DNA-RNA 혼성화물 분자를 포함할 수 있다. 일부 구현예에서, 폴리뉴클레오타이드는 천연 공급원으로부터 단리되거나; PCR 증폭 또는 화학적 합성과 같은 기술을 사용하여 시험관내에서 제조되거나; 예컨대, 재조합 DNA 기술을 통해 생체내에서 제조되거나; 또는 임의의 적절한 방법에 의해 제조되거나 수득된다. 일부 구현예에서, 폴리뉴클레오타이드는 임의의 모양(선형, 원형 등) 또는 기하학(단일 가닥, 이중 가닥, 선형, 원형, 초나선형, 비틀림형, 틈새형 등)을 갖는다. 폴리뉴클레오타이드는 또한 펩타이드 핵산(PNAS) 및 폴리펩타이드-핵산 접합체와 같은 핵산 유도체; 적어도 하나의 화학적으로 변형된 당 잔기, 골격, 뉴클레오타이드간 연결, 염기, 뉴클레오타이드, 뉴클레오사이드, 또는 뉴클레오타이드 유사체 또는 유도체뿐만 아니라 화학적으로 변형된 5' 또는 3' 말단을 갖는 핵산; 및 2개 이상의 이러한 변형을 갖는 핵산을 포함할 수 있다. 폴리뉴클레오타이드에서의 모든 연결은 동일할 필요는 없다.

폴리뉴클레오타이드의 예는 올리고뉴클레오타이드(비제한적으로, 안티센스 올리고뉴클레오타이드, 리보자임 및 RNA 간섭(RNAi)에 유용한 올리고뉴클레오타이드 포함), 앱타머, 핵산, 인공 염색체, 클로닝 벡터 및 작제물, 발현 벡터 및 작제물, 유전자 치료 벡터 및 작제물, rRNA, tRNA, mRNA, mtRNA 및 tmRNA 등을 포함한다. 일부 구현예에서, 폴리뉴클레오타이드는 시험관내 전사된(IVT) mRNA이다. 일부 구현예에서, 폴리뉴클레오타이드는 플라스미드이다.

폴리뉴클레오타이드는 단백질의 아미노산 서열에 상응하는 아미노산 서열을 생성하기 위해 전사 및 번역(예컨대, DNA→RNA→단백질) 또는 번역(RNA→단백질)될 수 있는 핵산 서열을 포함할 때 단백질을 "코딩"한다고 한다. 생체내(예컨대, 진핵 세포 내) 전사 및/또는 번역은 내인성 또는 외인성 효소에 의해 수행된다. 일부 구현예에서, 본 개시내용의 폴리뉴클레오타이드의 전사는 진핵 세포의 내인성 중합효소 II(polII)에 의해 수행된다. 일부 구현예에서, 외인성 RNA 중합효소는 동일하거나 상이한 벡터 상에 제공된다. 일부 구현예에서, RNA 중합효소는 T3 RNA 중합효소, T5 RNA 중합효소, T7 RNA 중합효소, 및 H8 RNA 중합효소로부터 선택된다.

본 개시내용에 따른 예시적인 폴리뉴클레오타이드는 표적 단백질을 코딩하는 "제1 폴리뉴클레오타이드"; 인핸서 단백질을 코딩하는 "제2 폴리뉴클레오타이드"; 및 하나 이상의 표적 단백질, 하나 이상의 인핸서 단백질, 및/또는 하나 이상의 분리 요소를 코딩하는 "코딩 폴리뉴클레오타이드"를 포함한다.

표적 단백질

본 개시내용에 따른 폴리뉴클레오타이드는 하나 이상의 표적 단백질을 코딩하는 핵산 서열을 포함할 수 있다. 표적 단백질을 코딩하는 핵산 서열은 관심 유전자("gene of interest, GOI")로 지칭된다. 표적 단백질은 발현을 원하는 임의의 단백질이다. 일부 구현예에서, 단백질은 막 단백질이다. 일부 구현예에서, 단백질의 발현은 참조 발현 시스템에서 발현될 때 세포 독성을 유발할 수 있다. 일부 구현예에서, 단백질은 전통적인 발현 시스템에서 낮은 수율 발현을 갖는 단백질이다. 일부 구현예에서, 단백질의 발현 또는 품질은, 예컨대 하나 이상의 인핸서 단백질과 함께, 개시된 방법에 따른 발현에 의해 유의하게 개선된다. 일부 구현예에서, 표적 단백질은 AAV 캡시드 단백질이다. AAV 캡시드 표적 단백질은 천연 AAV 캡시드 단백질, 또는 천연 AAV 캡시드 단백질 서열 내에 하나 이상의 돌연변이를 포함하는 돌연변이 AAV 캡시드 단백질일 수 있다.

본 발명의 조성물 및 방법을 사용하여 발현시키기 위한 표적 단백질은 효소 치환과 관련된 단백질, 예를 들어 아갈시다제 베타(Agalsidase beta), 아갈시다제 알파, 이미글루세라제(Imiglucerase), 탈리굴세라제 알파(Taligulcerase alfa), 벨라글루세라제 알파(Velaglucerase alfa), 알글루세라제(Alglucerase), 세벨리파제 알파(Sebelipase alpha), 라노니다제(Laronidase), 이두르설파제(Idursulfase), 엘로설파제 알파(Elosulfase alpha), 갈설파제(Galsulfase), 알글루코시다제 알파(Alglucosidase alpha), 인자 VIII, C3 억제제, 헐러 및 헌터 교정 인자(Hurler and Hunter corrective factor)를 포함할 수 있다. 일부 구현예에서, 표적 단백질은 바이오시밀러이다. 일부 구현예에서, 표적 단백질은 분비 단백질, 예컨대 C1-Inh일 수 있다. 일부 구현예에서, 표적 단백질은 항체이다. 일부 구현예에서, 본 발명의 조성물 및 방법은 효소 생성에 사용된다. 이러한 효소는 임상 시험 키트 또는 기타 진단 분석의 생성에 유용할 수 있다. 일부 구현예에서, 본 발명의 조성물 및 방법은 치료 단백질을 생성하는 데 사용된다. 일부 구현예에서, 단백질은 인간 단백질이고 발현을 위한 숙주 세포는 인간 세포이다.

일부 구현예에서, 표적 단백질은 아바렐릭스(Abarelix), 아바타셉트(Abatacept), 압식시맙(Abciximab), 아달리무맙(Adalimumab), 아플리버셉트(Aflibercept), 아갈시다제 베타(Agalsidase beta), 알비글루티드(Albiglutide), 알데스류킨(Aldesleukin), 알레파셉트(Alefacept), 알렘투주맙(Alemtuzumab), 알글루세라제(Alglucerase), 알글루코시다제 알파(Alglucosidase alfa), 알리로코우맙(Alirocoumab), 알리스키렌(Aliskiren), 알파-1-프로테이나제 억제제(Alpha-1-proteinase inhibitor), 알테플라제(Alteplase), 아나킨라(Anakinra), 안세스팀(Ancestim), 아니스트레플라제(Anistreplase), 탄저병 면역글로불린 인간(Anthrax immune globulin human), 항혈우병 인자, 항트롬빈 알파, 항트롬빈 III 인간, 항흉선세포 글로불린, 항흉선세포 글로불린(말), 항흉선세포 글로불린(토끼), 아프로티닌(Aprotinin), 아르시투모맙(Arcitumomab), 아스포타제 알파(Asfotase Alfa), 아스파라기나제, 아스파라기나제 에르위니아 크리산테미(Asparaginase erwinia chrysanthemi), 아테졸리주맙(Atezolizumab), 자가 배양 연골세포, 바실릭시맙(Basiliximab), 베카플러민(Becaplermin), 벨라타셉트(Belatacept), 벨리무맙(Belimumab), 베락탄트(Beractant), 베바시주맙(Bevacizumab), 비발리루딘(Bivalirudin), 블리나투모맙(Blinatumomab), 보툴리눔 톡신 A형(Botulinum Toxin Type A), 보툴리눔 톡신 B형, 브렌툭시맙 베도틴(Brentuximab vedotin), 브로달루맙(Brodalumab), 부세렐린(Buserelin), C1 에스테라제 억제제(인간), C1 에스테라제 억제제, 카나키누맙(Canakinumab), 카나키누맙, 카프로맙(Capromab), 세르톨리주맙 페골(Certolizumab pegol), 세툭시맙(Cetuximab), 융모생식샘자극호르몬 알파(Choriogonadotropin alfa), 융모생식샘자극호르몬(인간), 융모생식샘자극호르몬, 응고 인자 IX, 응고 인자 VIIa, 응고 인자 X 인간, 응고 인자 XIII A-서브유닛, 콜라게나아제, 코네스타트 알파(Conestat alfa), 코르티코트로핀(Corticotropin), 코신트로핀(Cosyntropin), 다클리주맙(Daclizumab), 답토마이신(Daptomycin), 다라투무맙(Daratumumab), 다르베포에틴 알파(Darbepoetin alfa), 데피브로티드(Defibrotide), 데닐류킨 디프티톡스(Denileukin diftitox), 데노수맙(Denosumab), 데시루딘(Desirudin), 디누툭시맙(Dinutuximab), 도르나제 알파(Dornase alfa), 드로트레코긴 알파(Drotrecogin alfa), 둘라글루티드(Dulaglutide), 에쿨리주맙(Eculizumab), 에팔리주맙(Efalizumab), 에프모록토코그 알파(Efmoroctocog alfa), 엘로설파제 알파(Elosulfase alfa), 엘로투주맙(Elotuzumab), 엔푸비르티드(Enfuvirtide), 에포에틴 알파(Epoetin alfa), 에포에틴 제타(Epoetin zeta), 엡티피바티드(Eptifibatide), 에타네르셉트(Etanercept), 에볼로쿠맙(Evolocumab), 엑세나티드(Exenatide), 인자 IX 복합체(인간), 피브리노겐 농축물(인간), 피브리노리신(플라스민), 필그라스팀(Filgrastim), 필그라스팀-sndz, 폴리트로핀 알파(Follitropin alpha), 폴리트로핀 베타, 갈설파제(Galsulfase), 위 내인성 인자(Gastric intrinsic factor), 젬투주맙 오조가미신(Gemtuzumab ozogamicin), 글라티라머 아세테이트(Glatiramer acetate), 글루카곤 재조합(Glucagon recombinant), 글루카르피다제(Glucarpidase), 골리무맙(Golimumab), 그라미시딘 D(Gramicidin D), A형 간염 백신(Hepatitis A Vaccine), B형 간염 면역글로불린, 인간 칼시토닌, 인간 클로스트리듐 테타니 톡소이드 면역글로불린(Human clostridium tetani toxoid immune globulin), 인간 광견병 바이러스 면역글로불린(Human rabies virus immune globulin). 인간 로(D) 면역글로불린(Human Rho(D) immune globulin), 인간 혈청 알부민, 인간 수두-대상포진 면역글로불린, 히알루로니다제, 히알루로니다제, 이브리투모맙(Ibritumomab), 이브리투모맙 티욱세탄(Ibritumomab tiuxetan), 이다루시주맙(Idarucizumab), 이두르설파제(Idursulfase), 이미글루세라제(Imiglucerase), 면역글로불린 인간, 인플릭시맙(Infliximab), 인슐린 아스파르트(Insulin aspart), 인슐린 비프(Insulin Beef), 인슐린 데구덱(Insulin Degludec), 인슐린 데테미르(Insulin detemir), 인슐린 글라진(Insulin Glargine), 인슐린 글루리신(Insulin glulisine), 인슐린 리스프로(Insulin Lispro), 인슐린 포크(Insulin Pork), 인슐린 레귤러(Insulin Regular), 인슐린 레귤러, 인슐린 돼지, 인슐린, 이소판, 인터페론 알파-2a, 재조합 인터페론 알파-2b, 인터페론 알파콘-1, 인터페론 알파-n1, 인터페론 인터페론 알파-n9, 인터페론 베타-1a, 인터페론 베타-1b, 인터페론 감마-1b, 정맥내 면역글로불린, 이필리무맙(Ipilimumab), 익세키주맙(Ixekizumab), 라로니다제(Laronidase), 레노그라스팀(Lenograstim), 레피루딘(Lepirudin), 류프롤리드(Leuprolide), 리라글루티드(Liraglutide), 루시낙탄트(Lucinactant), 루트로핀 알파, 루트로핀 알파, 메카세르민(Mecasermin), 메노트로핀스(Menotropins), 메폴리주맙(Mepolizumab), 에포에틴 베타(Epoetin beta), 메트렐렙틴(Metreleptin), 무로모납(Muromonab), 나탈리주맙(Natalizumab), 알파 인터페론, 네시투무맙(Necitumumab), 네시리티드(Nesiritide), 니볼루맙(Nivolumab), 오빌톡사시맙(Obiltoxaximab), 오비누투주맙(Obinutuzumab), 오크리플라스민(Ocriplasmin), 오파투무맙(Ofatumumab), 오말리주맙(Omalizumab), 오프렐베킨(Oprelvekin), OspA 지질단백질(OspA lipoprotein), 옥시토신(Oxytocin), 팔리퍼민(Palifermin), 팔리비주맙(Palivizumab), 판크레리파제(Pancrelipase), 파니투무맙(Panitumumab), 펨브롤리주맙(Pembrolizumab), 페르투주맙(Pertuzumab), 포락탄트 알파(Poractant alfa), 프람린티드(Pramlintide), 프레오탁트(Preotact), 단백질 S 인간(Protein S human), 라무시루맙(Ramucirumab), 라니비주맙(Ranibizumab), 라스부리카제(Rasburicase), 락시바쿠맙(Raxibacumab), 레테플라제(Reteplase), 릴로나셉트(Rilonacept), 리툭시맙(Rituximab), 로미플로스팀(Romiplostim), 사크로시다제(Sacrosidase), 연어 칼시토닌(Salmon Calcitonin), 사르그라모스팀(Sargramostim), 사투모맙 펜데티드(Satumomab Pendetide), 세벨리파제 알파(Sebelipase alfa), 세크레틴(Secretin), 세쿠키누맙(Secukinumab), 세르모렐린(Sermorelin), 혈청 알부민, 요오드화 혈청 알부민, 실툭시맙(Siltuximab), 시목토코그 알파(Simoctocog Alfa), 시풀류셀-T(Sipuleucel-T), 소마토트로핀 재조합(Somatotropin Recombinant), 소마토트로핀 재조합, 스트렙토키나제(Streptokinase), 술로덱시드(Sulodexide), 수속토코그 알파(Susoctocog alfa), 탈리글루세라제 알파(Taliglucerase alfa), 테두글루티드(Teduglutide), 테이코플라닌(Teicoplanin), 테넥테플라제(Tenecteplase), 테리파라티드(Teriparatide), 테사모렐린(Tesamorelin), 트롬보모둘린 알파(Thrombomodulin alfa), 티말파신(Thymalfasin), 티로글로불린(Thyroglobulin), 티로트로핀 알파(Thyrotropin Alfa), 티로트로핀 알파, 토실리주맙(Tocilizumab), 토시투모맙(Tositumomab), 트라스투주맙(Trastuzumab), 투베르쿨린 정제 단백질 유도체(Tuberculin Purified Protein Derivative), 투록토코그 알파(Turoctocog alfa), 우로폴리트로핀(Urofollitropin), 우로키나제(Urokinase), 우스테키누맙(Ustekinumab), 바소프레신(Vasopressin), 베돌리주맙(Vedolizumab), 및 벨라글루세라제 알파(Velaglucerase alfa)로 이루어진 군으로부터 선택된다.

일부 구현예에서, 표적 단백질은, 비제한적으로 가용성 단백질, 분비 단백질, 또는 막 단백질이다. 일부 구현예에서, 표적 단백질은, 비제한적으로 도파민 수용체 1(DRD1), 낭포성 섬유증 막관통 전도도 조절자(CFTR), C1 에스테라제 억제제(C1-Inh), IL2 유도성 T 세포 키나제(ITK) 또는 NADase이다. 일부 구현예에서, NADase는 SARM1이다. 일부 구현예에서, SARM1은 성숙 단백질을 나타내는 결실 변이체이다.

일부 구현예에서, 표적 단백질은 막 단백질이다. 예시적인 막 단백질은 이온 채널, 갭 접합, 이온성(ionotropic) 수용체, 수송체, 내재 막 단백질, 예컨대 세포 표면 수용체(예컨대, G-단백질 결합 수용체(GPCR), 티로신 키나제 수용체, 인테그린 등), 신호전달에 반응하여 막과 세포질 사이를 왕복하는 단백질(예컨대, Ras, Rac, Raf, Gα 서브유닛, 정지, Src 및 기타 효과기 단백질) 등을 포함한다. 일부 구현예에서, 막 단백질은 G 단백질 결합 수용체이다. 일부 구현예에서, 표적 단백질은 7-(통과)-막관통 도메인 수용체, 7TM 수용체, 칠중나선 수용체, 세르펜틴 수용체(serpentine receptor), 또는 G 단백질 연결 수용체(GPLR)이다. 일부 구현예에서, 표적 단백질은 부류 A GPCR, 부류 B GPCR, 부류 C GPCR, 부류 D GPCR, 부류 E GPCR, 또는 부류 F GPCR이다. 일부 구현예에서, 표적 단백질은 부류 1 GPCR, 부류 2 GPCR, 부류 3 GPCR, 부류 4 GPCR, 부류 5 GPCR, 또는 부류 6 GPCR이다. 일부 구현예에서, 표적 단백질은 로돕신 유사 GPCR, 세크레틴 수용체 패밀리 GPCR, 대사형 글루타메이트/페로몬 GPCR, 진균 교배 페로몬 수용체, 사이클릭 AMP 수용체, 또는 프리즐드/스무든드(Frizzled/Smoothened) GPCR이다.

일부 구현예에서, 표적 단백질은 뉴클레오시다제, NAD+ 뉴클레오시다제, 하이드롤라제, 글리코실라제, N-글리코실 화합물을 가수분해하는 글리코실라제, NAD+ 글리코하이드롤라제, NADase, DPNase, DPN 하이드롤라제, NAD 하이드롤라제, 디포스포피리딘 뉴클레오시다제, 니코틴아마이드 아데닌 디뉴클레오타이드 뉴클레오시다제, NAD 글리코하이드롤라제, NAD 뉴클레오시다제, 또는 니코틴아마이드 아데닌 디뉴클레오타이드 글리코하이드롤라제이다. 일부 구현예에서, 표적 단백질은 니코틴산 및 니코틴아미드 대사 및 칼슘 신호전달 경로에 참여하는 효소이다.

일부 구현예에서, 본 개시내용은 본 개시내용의 벡터 시스템(또는 벡터)을 진핵 세포 내로 도입함으로써 발현된 단백질을 제공한다. 일부 구현예에서, 본 개시내용은 본 개시내용의 폴리뉴클레오타이드를 포함하는 진핵 세포에 의해 생성된 표적 단백질을 제공한다.

인핸서 단백질

본 개시내용은 표적 단백질 및 인핸서 단백질의 동시 발현에 관한 것이다. 일부 구현예에서, 인핸서 단백질은 비제한적으로 수율, 품질, 폴딩, 번역 후 변형, 활성, 국소화, 및 하류 활성을 포함하는 표적 단백질 발현의 하나 이상의 측면을 개선할 수 있거나, 또는 미스폴딩, 변경된 활성, 부정확한 번역 후 변형 및/또는 독성 중 하나 이상을 감소시킬 수 있다.

일부 구현예에서, 인핸서 단백질은 핵 기공 차단 바이러스 단백질이다. 일부 구현예에서, 인핸서 단백질은 핵 기공을 차단하여 핵세포질 수송("NCT")을 억제할 수 있는 천연 또는 합성 펩타이드이다. 일부 구현예에서, 인핸서 단백질은 바이러스 단백질이다. 일부 양태에서, 바이러스 단백질은 NCT 억제제이다.

일부 구현예에서, 인핸서 단백질은 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 코로나바이러스 ORF6 단백질, 에볼라바이러스 VP24 단백질, 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질, 단순 포진 바이러스(HSV) ICP27 단백질 및 랍도바이러스 기질(M) 단백질로 이루어진 군으로부터 선택된다.

인핸서 단백질은 본원에 개시된 임의의 단백질의 기능적 변이체이다. 본원에 사용된 바와 같이, 용어 "기능적 변이체"는 원래 단백질과 상동성이고/이거나 원래 단백질과 실질적인 서열 유사성을 공유하고(예컨대, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 90%, 95% 또는 99% 초과의 서열 동일성) 원래 단백질의 하나 이상의 기능적 특성을 공유하는 단백질을 지칭한다. 예를 들어, NCT 억제제인 인핸서 단백질의 기능적 변이체는 NCT를 억제하는 능력을 유지한다.

일부 구현예에서, 인핸서 단백질은 피코르나바이러스로부터의 리더(L) 단백질 또는 그의 기능적 변이체이다. 일부 구현예에서, 인핸서 단백질은 카디오바이러스(Cardiovirus), 헤파토바이러스(Hepatovirus) 또는 아프토바이러스(Aphthovirus) 속으로부터의 리더 단백질이다. 예를 들어, 인핸서 단백질은 소 비염 A 바이러스(Bovine rhinitis A virus), 소 비염 B 바이러스, 말 비염 A 바이러스, 구제역 바이러스(Foot-and-mouth disease virus), 헤파토바이러스 A, 헤파토바이러스 B, 마모타 히말라야나 헤파토바이러스(Marmota himalayana hepatovirus), 포피바이러스(Phopivirus), 카디오바이러스 A, 카디오바이러스 B, 타일러 쥣과 뇌척수염 바이러스(TMEV), 빌류이스크 인간 뇌척수염 바이러스(Vilyuisk human encephalomyelitis virus, VHEV), 타일러 유사 랫트 바이러스(TRV) 또는 사폴드(Saffold) 바이러스(SAF-V)로부터 유래될 수 있다.

일부 구현예에서, 인핸서 단백질은 타일러 바이러스의 L 단백질 또는 그의 기능적 변이체이다. 일부 구현예에서, L 단백질은 서열번호: 1과 적어도 90% 동일성을 공유한다. 일부 구현예에서, 인핸서 단백질은 서열번호: 1을 포함하거나, 구성되거나, 또는 본질적으로 구성될 수 있다. 인핸서 단백질은 서열번호: 1과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 100% 동일성을 공유할 수 있다.

일부 구현예에서, L 단백질은 뇌심근염 바이러스(EMCV)의 L 단백질 또는 그의 기능적 변이체이다. 일부 구현예에서, L 단백질은 서열번호: 2와 적어도 90% 동일성을 공유할 수 있다. 일부 구현예에서, 인핸서 단백질은 서열번호: 2를 포함하거나, 구성되거나, 또는 본질적으로 구성될 수 있다. 인핸서 단백질은 서열번호: 2와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 100% 동일성을 공유할 수 있다.

일부 구현예에서, L 단백질은 폴리오바이러스의 L 단백질, HRV16의 L 단백질, 멩고 바이러스의 L 단백질, 및 사폴드 바이러스 2의 L 단백질 또는 그의 기능적 변이체로 이루어진 군으로부터 선택된다.

일부 구현예에서, 인핸서 단백질은 피코르나바이러스 2A 프로테아제 또는 그의 기능적 변이체이다. 일부 구현예에서, 인핸서 단백질은 엔테로바이러스, 라이노바이러스, 아프토바이러스 또는 카디오바이러스로부터의 2A 프로테아제이다.

일부 구현예에서, 인핸서 단백질은 라이노바이러스 3C 프로테아제 또는 그의 기능적 변이체이다. 일부 구현예에서, 인핸서 단백질은 피코르나인(Picornain) 3C 프로테아제이다. 일부 구현예에서, 인핸서 단백질은 엔테로바이러스, 라이노바이러스, 아프토바이러스 또는 카디오바이러스로부터의 3C 프로테아제이다. 예를 들어, 일부 비제한적 구현예에서, 인핸서 단백질은 폴리오바이러스, 콕사키바이러스, 라이노바이러스, 구제역 바이러스 또는 헤파토바이러스 A로부터의 3C 프로테아제이다.

일부 구현예에서, 인핸서 단백질은 코로나바이러스 ORF6 단백질 또는 그의 기능적 변이체이다. 일부 구현예에서, 인핸서 단백질은 핵 도입 복합체 형성을 방해하고/하거나 핵 내로의 STAT1 수송을 방해하는 바이러스 단백질이다.

일부 구현예에서, 인핸서 단백질은 에볼라바이러스 VP24 단백질 또는 그의 기능적 변이체이다. 일부 구현예에서, 인핸서 단백질은 에볼라바이러스 VP40 단백질 또는 VP35 단백질이다. 일부 구현예에서, 인핸서 단백질은 임포틴 단백질 카리오페린-α(importin protein karyopherin-α, KPNA)에 결합하는 바이러스 단백질이다. 일부 구현예에서, 인핸서 단백질은 KPNA에 대한 STAT1의 결합을 억제하는 바이러스 단백질이다.

일부 구현예에서, 인핸서 단백질은 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질 또는 그의 기능적 변이체이다. 일부 구현예에서, 인핸서 단백질은 핵 기공 복합체와 상호작용하는 바이러스 캡시드 단백질이다.

일부 구현예에서, 인핸서 단백질은 단순 포진 바이러스(HSV) ICP27 단백질 또는 그의 기능적 변이체이다. 일부 구현예에서, 인핸서 단백질은 HSV ORF57 단백질이다.

일부 구현예에서, 인핸서 단백질은 랍도바이러스 기질(M) 단백질 또는 그의 기능적 변이체이다. 일부 구현예에서, 인핸서 단백질은 사이토랍도바이러스(Cytorhabdovirus), 디코라바이러스(Dichorhavirus), 에페메로바이러스(Ephemerovirus), 리사바이러스(Lyssavirus), 노비랍도바이러스(Novirhabdovirus), 뉴클레오랍도바이러스(Nucleorhabdovirus), 페랍도바이러스(Perhabdovirus), 시그마바이러스(Sigmavirus), 스프리비바이러스(Sprivivirus), 티브로바이러스(Tibrovirus), 투파바이러스(Tupavirus), 바리코사바이러스(Varicosavirus), 또는 베시큘로바이러스(Vesiculovirus)로부터의 M 단백질이다.

일부 구현예에서, 인핸서 단백질은 표 1에 열거된 단백질 또는 그의 기능적 변이체로부터 선택된다. 인핸서 단백질을 코딩하는 폴리뉴클레오타이드는 표 1에 열거된 아미노산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 100% 동일한 아미노산 서열을 코딩할 수 있다. 인핸서 단백질의 아미노산 서열은 표 1에 열거된 아미노산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 100% 동일할 수 있다. 인핸서 단백질의 아미노산 서열은 서열번호: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 11의 아미노산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 100% 동일할 수 있다. 일부 구현예에서, 인핸서 단백질은 표 1에 열거된 아미노산 서열 중 하나를 포함하거나, 구성되거나, 또는 본질적으로 구성되는 아미노산 서열을 가질 수 있다. 일부 구현예에서, 인핸서 단백질은 서열번호: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 11의 아미노산 서열을 포함하거나, 구성되거나, 또는 본질적으로 구성되는 아미노산 서열을 가질 수 있다.

표 1: 예시적인 인핸서 단백질

융합 단백질

일부 구현예에서, 표적 단백질 및 인핸서 단백질은 단일 융합 단백질에 포함된다. 일부 구현예에서, 융합 단백질은 연결 요소를 포함할 수 있다. 일부 구현예에서, 연결 요소는 효소적 절단을 위한 절단 부위를 포함할 수 있다. 다른 구현예에서, 융합 단백질 또는 연결 요소는 절단 부위를 포함하지 않고 발현된 융합 단백질은 표적 단백질 및 인핸서 단백질 둘 모두를 포함한다.

단백질 변형

표적 단백질, 인핸서 단백질, 및/또는 융합 단백질, 또는 이를 코딩하는 폴리뉴클레오타이드는 하나 이상의 마커, 표지 또는 태그를 포함하도록 변형될 수 있다. 예를 들어, 일부 구현예에서, 본 개시내용의 단백질은 그의 검출을 허용할 임의의 표지, 예를 들어 방사성 표지, 형광 제제, 비오틴, 펩타이드 태그, 효소 단편 등으로 표지될 수 있다. 단백질은 친화성 태그, 예컨대 His-태그, FLAG 태그, GST-태그, Strep-태그, 비오틴-태그, 면역글로불린 결합 도메인, 예컨대 IgG 결합 도메인, 칼모둘린 결합 펩타이드 등을 포함할 수 있다. 일부 구현예에서, FLAG 태그는 아미노산 서열 DYKDDDDK(서열번호: 21)를 포함한다. 일부 구현예에서, 본 개시내용의 폴리뉴클레오타이드는 선택가능한 마커, 예컨대 항생제 내성 마커를 포함한다.

중합효소

표적 단백질(들) 및 인핸서 단백질(들)을 코딩하는 폴리뉴클레오타이드의 전사를 위해, 내인성 또는 외인성 중합효소가 사용될 수 있다. 일부 구현예에서, 폴리뉴클레오타이드(들)의 전사는 세포(예컨대, 진핵 세포)에 의해 포함된 천연 중합효소에 의해 수행된다. 바이러스 중합효소가 대안적으로 또는 추가로 사용될 수 있다. 일부 구현예에서, 바이러스 프로모터는 하나 이상의 바이러스 중합효소와 조합하여 사용된다. 일부 구현예에서, 진핵 프로모터는 하나 이상의 진핵 중합효소와 조합하여 사용된다. 예시적인 바이러스 중합효소는, 비제한적으로 T7, T5, EMCV, HIV, 인플루엔자, SP6, CMV, T3, T1, SP01, SP2, Phi15 등을 포함한다. 바이러스 중합효소는 RNA 프라이밍 또는 캡핑 중합효소이다. 일부 구현예에서, IRES 요소는 바이러스 중합효소와 함께 사용된다.

본 개시내용에 따른 벡터 또는 벡터들은 중합효소를 코딩하는 폴리뉴클레오타이드 서열을 포함할 수 있다. 일부 구현예에서, 중합효소는 바이러스 중합효소이다. 중합효소를 코딩하는 폴리뉴클레오타이드 서열은 표적 단백질 코딩 폴리뉴클레오타이드 및/또는 인핸서 단백질 코딩 폴리뉴클레오타이드를 포함하는 벡터에 의해 포함될 수 있다. 일부 구현예에서, 중합효소는 표적 단백질 또는 인핸서 단백질 코딩 폴리뉴클레오타이드를 포함하지 않는 벡터에 의해 포함될 수 있다.

일부 구현예에서, 본원에 개시된 시스템, 방법 또는 세포에 의해 포함된 하나 이상의 벡터 중 적어도 하나는 T7 RNA 중합효소를 코딩하는 폴리뉴클레오타이드 서열을 포함할 수 있다.

벡터

일부 양태에서, 본 개시내용은 하나 이상의 표적 단백질 및 하나 이상의 인핸서 단백질의 발현을 위한 핵산 서열을 포함하는 벡터에 관한 것이다. 일부 구현예에서, 벡터들(또는 벡터)은 표적 단백질을 코딩하는 제1 폴리뉴클레오타이드 및 인핸서 단백질을 코딩하는 제2 폴리뉴클레오타이드를 갖는다. 일부 구현예에서, 벡터들(또는 벡터)은 본원에 개시된 발현 카세트 중 어느 하나, 예를 들어 5' 역위 말단 반복(ITR)을 포함하는 아데노 관련 바이러스(AAV) 발현 카세트, 하나 이상의 표적 단백질 및 하나 이상의 인핸서 단백질의 발현을 위한 본원에 개시된 핵산 서열 중 어느 하나, 및 3' ITR, 및/또는 AAV 캡시드 단백질을 코딩하는 핵산 서열을 포함한다.

본 개시내용에 따라 사용하기 위한 벡터는 당업계에 공지된 임의의 벡터를 포함할 수 있다. 특정 구현예에서, 벡터는 관심 단백질 또는 폴리펩타이드 또는 그의 단편을 발현할 수 있는 임의의 재조합 벡터, 예를 들어, 아데노 관련 바이러스(AAV) 벡터, 렌티바이러스 벡터, 레트로바이러스 벡터, 복제 적격 아데노바이러스 벡터, 복제 결핍 아데노바이러스 벡터, 헤르페스 바이러스 벡터, 배큘로바이러스 벡터 또는 비바이러스 플라스미드이다. 일부 구현예에서, 벡터는 바이러스 벡터, 플라스미드, 파지, 파지미드, 코스미드, 포스미드, 박테리오파지 또는 인공 염색체이다. 일부 구현예에서, 벡터는 아데노바이러스 벡터, 레트로바이러스 벡터 또는 아데노 관련 바이러스 벡터를 포함하는 바이러스 벡터이다. 일부 구현예에서, 벡터는 박테리아 인공 염색체(BAC), 플라스미드, 박테리오파지 P1 유래 벡터(PAC), 효모 인공 염색체(YAC), 또는 포유동물 인공 염색체(MAC)이다.

본원에 개시된 세포, 시스템 및 방법은 하나의 벡터를 포함할 수 있다. 일부 구현예에서, 세포, 시스템, 및 방법은 표적 단백질을 코딩하는 제1 폴리뉴클레오타이드 및 인핸서 단백질을 코딩하는 제2 폴리뉴클레오타이드를 포함하는 단일 벡터를 포함할 수 있다.

본원에 개시된 세포, 시스템 및 방법은 2개의 벡터를 포함할 수 있다. 일부 구현예에서, 세포, 시스템, 및 방법은 제1 프로모터에 작동가능하게 연결된 제1 폴리뉴클레오타이드를 포함하는 제1 벡터; 및 제2 프로모터에 작동가능하게 연결된 제2 폴리뉴클레오타이드를 포함하는 제2 벡터를 포함한다.

본원에 개시된 세포, 시스템 및 방법은 2개 초과의 벡터를 포함할 수 있으며, 벡터는 다양한 조합 또는 구성으로 표적 단백질(들) 및 인핸서 단백질(들)을 코딩할 수 있다.

일부 구현예에서, 본 개시내용의 벡터 또는 벡터들을 포함하는 세포가 제공된다. 일부 구현예에서, 본 개시내용의 폴리뉴클레오타이드를 포함하는 세포가 제공된다. 일부 구현예에서, 본 개시내용의 표적 단백질(들) 및 인핸서 단백질(들)을 발현하는 세포가 제공된다.

프로모터

본 개시내용에 따른 벡터는 하나 이상의 프로모터를 포함할 수 있다. 용어 "프로모터"는 전사를 개시하기 위해 RNA 중합효소 및 기타 단백질의 인식 및 결합에 관여하는 전사 시작으로부터 상류 또는 하류에 위치한 영역 또는 서열을 지칭한다. 본 개시내용에 따른 폴리뉴클레오타이드(들) 또는 벡터(들)는 하나 이상의 프로모터를 포함할 수 있다. 프로모터는 당업계에 공지된 임의의 프로모터일 수 있다. 프로모터는 정방향 프로모터 또는 역방향 프로모터일 수 있다. 일부 구현예에서, 프로모터는 포유류 프로모터이다. 일부 구현예에서, 하나 이상의 프로모터는 천연 프로모터이다. 일부 구현예에서, 하나 이상의 프로모터는 비천연 프로모터이다. 일부 구현예에서, 하나 이상의 프로모터는 비포유류 프로모터이다. 개시된 조성물 및 방법에 사용하기 위한 RNA 프로모터의 비제한적인 예는 U1, 인간 신장 인자-1 알파(EF-1 알파), 거대세포바이러스(CMV), 인간 유비퀴틴, 비장 초점 형성 바이러스(SFFV), U6, H1, tRNA^Lys, tRNA^Ser 및 tRNA^Arg, CAG, PGK, TRE, UAS, UbC, SV40, T7, Sp6, lac, araBad, trp 및 Ptac 프로모터를 포함한다.

본원에 사용된 바와 같이 용어 "작동가능하게 연결된"은 물리적 위치가 아니라 작동 능력에 의해 연결된 핵산 서열 내의 요소 또는 구조를 지칭한다. 요소 또는 구조는 원하는 작업을 수행할 수 있거나 이를 특징으로 한다. 핵산 서열 내의 요소 또는 구조가 작동가능하게 연결되도록 일렬로 또는 인접한 순서로 있을 필요는 없다는 것이 당업자에 의해 인식된다.

일부 구현예에서, 프로모터는 하나 이상의 표적 단백질 및/또는 하나 이상의 인핸서 단백질의 발현을 항시적으로 유도하고, 즉, 프로모터는 항시적 프로모터이다. 일부 구현예에서, 프로모터는 유도성 프로모터이다. 유도성 프로모터는 제한되지 않으며, 당업계에 공지된 임의의 유도성 프로모터일 수 있다. 일부 구현예에서, 유도성 프로모터의 발현은 하나 이상의 환경적 또는 화학적 자극의 존재에 의해 촉진된다. 예를 들어, 일부 구현예에서, 유도성 프로모터는 화학 분자, 예컨대 테트라사이클린 및 이의 유도체(예컨대, 독시사이클린), 큐메이트 및 이의 유도체; 또는 환경적 자극, 예컨대 열 또는 빛의 존재 하에 발현을 구동한다.

일부 구현예에서, 유도성 프로모터는 테트라사이클린 제어된 전사 활성화 시스템, 큐메이트 억제인자 시스템, lac 억제인자 시스템, 아라비노스 조절된 pBad 프로모터 시스템, 알코올 조절된 AlcA 프로모터 시스템, 스테로이드 조절된 LexA 프로모터 시스템, 열 충격 유도성 Hsp70 또는 Hsp90 프로모터 시스템, 또는 청색광 유도성 pR 프로모터 시스템을 기반으로 한다. 따라서, 일부 구현예에서, 유도성 프로모터는 테트라사이클린 반응 요소와 같은 테트라사이클린 전사활성화제에 결합하는 핵산 서열을 포함한다. 일부 구현예에서, 유도성 프로모터의 발현은 테트라사이클린 및 이의 유도체의 존재 하에 켜지는 반면(Tet-On 시스템), 다른 구현예에서, 유도성 프로모터의 발현은 테트라사이클린 및 이의 유도체의 존재 하에 꺼진다(Tet-Off 시스템). 일부 구현예에서, 유도성 프로모터는 큐메이트 억제인자 시스템을 기반으로 한다. 따라서, 일부 구현예에서, 유도성 프로모터는 큐메이트 작동자 서열과 같은 CymR 억제인자에 결합하는 핵산 서열을 포함한다.

일부 구현예에서, 유도성 프로모터의 발현은 전사 인자의 이량체화에 의해 구동된다. 일부 구현예에서, 전사는 C120 프로모터 또는 그의 조절 요소로부터 발현을 유도하기 위해 청색광의 존재 하에 이량체화하는 박테리아 EL222이다. 일부 구현예에서, 유도성 프로모터는 C120 프로모터 또는 조절 요소로부터 유래된 핵산 서열을 포함한다.

본 개시내용에 따른 벡터는 하나 이상의 바이러스 중합효소에 의해 하나 이상의 폴리뉴클레오타이드의 전사를 가능하게 하는 하나 이상의 바이러스 프로모터를 포함할 수 있다. 일부 구현예에서, 예를 들어, 벡터는 T7 RNA 중합효소에 의해 제1 폴리뉴클레오타이드(즉, 표적 단백질 코딩 폴리뉴클레오타이드) 또는 제2 폴리뉴클레오타이드(즉, 인핸서 단백질 코딩 폴리뉴클레오타이드) 중 어느 하나 또는 둘 모두의 전사를 위해 구성된 T7 프로모터를 포함할 수 있다.

발현 카세트

본 개시내용에 따른 벡터 또는 벡터들은 하나 이상의 발현 카세트를 포함할 수 있다. 본원에 사용된 바와 같이 문구 "발현 카세트"는 핵산 분자에 의해 코딩된 또 다른 핵산 또는 단백질의 생성에 필요한 최소 요소를 포함하는 핵산 분자의 정의된 세그먼트를 지칭한다. 일부 구현예에서, 벡터는 표적 단백질을 코딩하는 제1 폴리뉴클레오타이드 및 인핸서 단백질을 코딩하는 제2 폴리뉴클레오타이드를 포함하는 발현 카세트를 포함할 수 있다. 일부 구현예에서, 발현 카세트는 제1 폴리뉴클레오타이드에 작동가능하게 연결된 제1 프로모터; 및 제2 폴리뉴클레오타이드에 작동가능하게 연결된 제2 프로모터를 포함한다. 일부 구현예에서, 발현 카세트는 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드 모두에 작동가능하게 연결된 공유 프로모터를 포함한다.

일부 구현예에서, 발현 카세트는 분리 요소(예컨대, 리보솜 스키핑 부위 또는 2A 요소)를 코딩하는 폴리뉴클레오타이드에 의해 연결된 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드를 포함하는 코딩 폴리뉴클레오타이드를 포함하고, 코딩 폴리뉴클레오타이드는 공유 프로모터에 작동가능하게 연결된다.

일부 구현예에서, 발현 카세트는 코딩 폴리뉴클레오타이드를 포함하고, 코딩 폴리뉴클레오타이드는 분리 요소(예를 들어, 리보솜 스키핑 부위 또는 2A 요소)에 의해 연결된 인핸서 단백질 및 표적 단백질을 코딩하며, 코딩 폴리뉴클레오타이드는 공유 프로모터에 작동가능하게 연결된다.

일부 구현예에서, 발현 카세트는 분리 요소(예를 들어, 리보솜 스키핑 부위 또는 2A 요소)에 의해 연결된 표적 단백질 및 인핸서 단백질 둘 모두를 코딩하는 단일 메신저 RNA의 전사를 위해 구성되고; 메신저 RNA의 번역은 별개의 폴리펩타이드로서 표적 단백질 및 인핸서 단백질(예컨대, L 단백질)의 발현을 유도한다.

일부 구현예에서, 발현 카세트는 코딩 폴리뉴클레오타이드를 포함하고, 코딩 폴리뉴클레오타이드는 폴리펩타이드 링커가 있거나 없는 융합 단백질로서 인핸서 단백질 및 표적 단백질을 코딩하며, 선택적으로 폴리펩타이드 링커는 절단가능한 링커이다.

일부 구현예에서, 발현 카세트는 5' 역위 말단 반복(ITR), 하나 이상의 표적 단백질 및 하나 이상의 인핸서 단백질의 발현을 위한 본원에 개시된 핵산 서열 중 어느 하나, 및 3' ITR을 포함하는 아데노 관련 바이러스(AAV) 발현 카세트이다. 일부 구현예에서, AAV 발현 카세트는 코작(Kozak) 서열, 폴리아데닐화 서열, 및/또는 스터퍼(stuffer) 서열을 포함한다.

분리 요소

일부 구현예에서, 본 개시내용에 따른 표적 단백질(들) 및 인핸서 단백질(들)은 동일한 벡터 상에 코딩되거나 별개의 벡터 상에 코딩된다. 일부 구현예에서, 하나 이상의 표적 단백질 및 하나 이상의 인핸서 단백질에 대한 핵산 서열이 동일한 벡터에 의해 포함되는 경우, 벡터는 단백질의 개별 발현을 위한 분리 요소를 포함할 수 있다. 다양한 구현예에서, 벡터는 바이시스트론(bicistronic) 벡터 또는 폴리시스트론(polycistronic) 벡터이다. 분리 요소는 내부 리보솜 진입 부위(IRES) 또는 2A 요소일 수 있다. 일부 구현예에서, 벡터는 2A 자가 절단 펩타이드를 코딩하는 핵산을 포함할 수 있다. 예시적인 2A 자가 절단 펩타이드는 P2A, E2A, F2A, 및 T2A를 포함한다.

일부 구현예에서, 제1 폴리뉴클레오타이드 또는 제2 폴리뉴클레오타이드, 또는 둘 모두는 내부 리보솜 진입 부위(IRES)에 작동가능하게 연결된다.

일부 구현예에서, 제1 폴리뉴클레오타이드 또는 제2 폴리뉴클레오타이드, 또는 둘 모두는 2A 요소에 작동가능하게 연결된다.

재조합 AAV 입자

본 개시내용은 본원에 개시된 발현 카세트 중 어느 하나를 포함하는 재조합 바이러스 벡터를 제공한다. 일부 구현예에서, 바이러스 벡터는 아데노 관련 바이러스(AAV) 벡터, 렌티바이러스 벡터, 레트로바이러스 벡터, 복제 적격 아데노바이러스 벡터, 복제 결핍 아데노바이러스 벡터, 헤르페스 바이러스 벡터, 또는 배큘로바이러스 벡터이다.

본 개시내용은 아데노 관련 바이러스(AAV) 생산자 세포(예컨대, HEK293 세포)를 본원에 개시된 AAV 발현 카세트 중 어느 하나, 또는 본원에 개시된 AAV 발현 카세트 중 어느 하나를 포함하는 벡터(예컨대, 플라스미드 또는 바크미드(bacmid))와 접촉시키는 단계를 포함하는, 재조합 AAV(rAAV) 벡터를 생성하기 위한 방법을 제공한다. 일부 구현예에서, 본원에 개시된 벡터(예컨대, 플라스미드 또는 바크미드)는, 예를 들어 AAV rep 및 cap 유전자를 포함하는 AAV의 생성 동안 사용된 하나 이상의 유전 요소를 추가로 포함하고/하거나 헬퍼 바이러스 단백질 서열을 코딩한다.

일부 구현예에서, 방법은 AAV 생산자 세포를, 예를 들어 AAV rep 및 cap 유전자를 포함하고/하거나 헬퍼 바이러스 단백질 서열을 코딩하는 하나 이상의 추가적인 플라스미드와 접촉시키는 단계를 포함한다. 일부 구현예에서, 방법은 AAV가 생성되도록 하는 조건 하에 AAV 생산자 세포를 유지시키는 단계를 추가로 포함한다.

본 개시내용은 본원에 개시된 방법 중 어느 하나를 사용하여 생성된 rAAV 벡터를 제공한다. 생성된 rAAV 벡터는 임의의 혈청형, 예를 들어 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAVrh8, AAVrh10, AAVrh32.33, AAVrh74, 조류 AAV 또는 소 AAV의 벡터일 수 있다. 일부 구현예에서, 생성된 재조합 AAV 벡터는 천연 AAV 캡시드와 비교하여 하나 이상의 아미노산 변형(예컨대, 치환 및/또는 결실)을 포함할 수 있다. 일부 구현예에서, 재조합 AAV 벡터는 단일 가닥 AAV(ssAAV)이다. 일부 구현예에서, 재조합 AAV 벡터는 자가 상보성 AAV(scAAV)이다.

본 개시내용은 발현 카세트 중 어느 하나, 벡터 중 어느 하나(예컨대, 재조합 AAV 벡터 중 어느 하나), 또는 본원에 개시된 AAV 생산자 세포 중 어느 하나를 포함하는 조성물, 예컨대 약제학적 조성물을 추가로 제공한다. 일부 구현예에서, 약제학적 조성물은 하나 이상의 약제학적으로 허용가능한 담체를 포함한다.

본 개시내용은 발현 카세트 중 어느 하나, 벡터 중 어느 하나(예컨대, 재조합 AAV 벡터 중 어느 하나), 또는 본원에 개시된 AAV 생산자 세포 중 어느 하나를 포함하는 백신 조성물을 추가로 제공하며, 표적 단백질은 대상체에서 발현시 대상체에서 병원체에 대한 면역 반응을 유발할 수 있거나 다른 치료적 성질일 수 있는 단백질이다.

일부 구현예에서, 표적 단백질은 병원체로부터 유래된다. 병원체는 바이러스, 박테리아, 진균 또는 기생충일 수 있다. 일부 구현예에서, 바이러스는 SARS-CoV-2, SARS-CoV-1, MERS-CoV, 치쿤구니야(chikungunya) 바이러스, 아프리카 돼지열병 바이러스, 뎅기열 바이러스, 지카 바이러스, 인플루엔자 바이러스(예컨대, A, B, C), 인간 면역결핍 바이러스(HIV), 에볼라 바이러스, 간염 바이러스(예컨대, A형 간염, B형 간염, C형 간염, D형 간염 및 E형 간염), 단순 포진 바이러스 1형(HSV-1), 단순 포진 바이러스 유형 2(HSV-2) 및 인유두종 바이러스로 이루어진 군으로부터 선택된다. 일부 구현예에서, 병원성 기생충은 플라스모디움 팔시파룸(Plasmodium falciparum), 플라스모디움 비박스(Plasmodium vivax), 플라스모디움 말라리아에(Plasmodium malariae), 플라스모디움 오발레(Plasmodium ovale), 엔타모에바 히스톨리티카(Entamoeba histolytica), 라이쉬마니아 도노바니(Leishmania donovani), 트리파노소마 브루세이(Trypanosoma brucei), 지아르디아 람블리아(Giardia lamblia)이다. 일부 구현예에서, 병원성 박테리아는 바실러스 서브틸리스, 클로스트리디움 보툴리눔, 코리네박테리움 디프테리아, 엔테로코커스 패칼리스, 에세리키아 콜리, 프란시셀라 툴라렌시스(Francisella tularensis), 헤모필루스 인플루엔자, 헬리코박터 파일로리, 리스테리아 모노사이토게네스, 마이코박테리움 투버쿨로시스(Mycobacterium tuberculosis), 마이코박테리움 레프라에(Mycobacterium leprae), 슈모모나스 애루지노사(Pseudomonas aeruginosa), 리케차 리케차(Rickettsia rickettsia), 살모넬라 타이피(Salmonella typhi), 스타필로코커스 아우레우스(Staphylococcus aureus), 스타필로코커스 뉴모니아(Streptococcus pneumonia), 비브리오 콜레라(Vibrio cholera)로 이루어진 군으로부터 선택된다. 일부 구현예에서, 백신 조성물은 하나 이상의 보조제를 포함한다.

형질감염, 형질도입, 형질전환

용어 "형질감염", "형질도입" 및 "형질전환"은 핵산을 세포(예컨대, 진핵 세포) 내로 도입하는 과정을 지칭한다. 본원에 기재된 폴리뉴클레오타이드 또는 벡터는 당업계에 공지된 임의의 방법을 사용하여 세포(예컨대, 진핵 세포) 내로 도입될 수 있다. 폴리뉴클레오타이드 또는 벡터는 당업계에 잘 알려져 있고 부분적으로 특정 숙주 세포에 기초하여 선택되는 다양한 방법에 의해 세포 내로 도입될 수 있다. 예를 들어, 폴리뉴클레오타이드는 화학적, 물리적, 생물학적 또는 바이러스 수단을 사용하여 세포 내로 도입될 수 있다. 폴리뉴클레오타이드 또는 벡터를 세포 내로 도입하는 방법은, 비제한적으로 인산칼슘, 덴드리머, 양이온성 중합체, 리포펙션, 푸진(fugene), 펩타이드 덴드리머, 전기천공, 세포 압착, 초음파천공(sonoporation), 광학 형질감염, 원형질체 융합, 임페일펙션(impalefection), 유체역학적 전달, 유전자 총, 마그네토펙션(magnetofection), 입자 충격, 뉴클레오펙션 및 바이러스 형질도입을 포함한다.

표적화 DNA 및/또는 표적 단백질 및 인핸서 단백질을 코딩하는 핵산을 포함하는 벡터는 다양한 방법(예컨대, 주사, 형질전환, 형질감염, 직접 흡수, 발사체 충격, 리포솜)에 의해 세포 내로 도입될 수 있다. 표적 단백질 및 인핸서 단백질은 발현 벡터를 사용하여 세포에서 안정적으로 또는 일시적으로 발현될 수 있다. 진핵 세포에서의 발현 기술은 당업자에게 잘 알려져 있다(Current Protocols in Human Genetics: Chapter 12 "Vector Therapy" & Chapter 13 "Delivery Systems for Gene Therapy" 참고).

일부 구현예에서, 폴리뉴클레오타이드 또는 벡터는, 선택적으로 렌티바이러스 형질감염, 포유동물 세포 내로 배큘로바이러스 유전자 전달(BacMam), 레트로바이러스 형질감염, CRISPR/Cas9 및/또는 트랜스포존의 사용을 통해, 안정한 세포주를 생성하기 위한 표준 방법을 사용하여 게놈 내로 삽입됨으로써 숙주 세포 내로 도입될 수 있다. 일부 구현예에서, 폴리뉴클레오타이드 또는 벡터는 일시적 형질감염을 위해 숙주 세포 내로 도입될 수 있다. 일부 구현예에서, 일시적 형질감염은 바이러스 벡터, 헬퍼 지질, 예컨대, PEI, 리포펙타민 및/또는 펙타민 293의 사용을 통해 수행될 수 있다. 유전 요소는, 예컨대 벡터 상의 DNA로서 또는 예컨대 PCR로부터의 RNA로서 코딩될 수 있다. 유전 요소는 상이한 벡터에서 분리되거나 동일한 벡터 상에서 조합될 수 있다.

세포, 세포주, 숙주 세포

본 개시내용의 또 다른 양태는 하나 이상의 표적 단백질 및 하나 이상의 인핸서 단백질을 코딩하는 폴리뉴클레오타이드 및/또는 벡터를 포함하는 세포에 관한 것이다. 폴리뉴클레오타이드, 벡터, 표적 단백질, 및 인핸서 단백질은 본원에 기재된 것 중 어느 것일 수 있다. 본 개시내용은 하나 이상의 인핸서 단백질을 코딩하는 폴리뉴클레오타이드 및/또는 벡터를 포함하는 세포 또는 세포주를 추가로 제공하고, 이들 세포 또는 세포주는 본원에서 "수퍼 생산자 세포" 또는 "수퍼 생산자 세포주"로 지칭될 수 있다. 일부 구현예에서, 수퍼 생산자 세포는 하나 이상의 표적 단백질을 코딩하는 폴리뉴클레오타이드 및/또는 벡터를 추가로 포함한다. 임의의 하나의 이론에 얽매이지 않고, 본원에 개시된 바와 같은 하나 이상의 인핸서 단백질을 발현하는 세포는 하나 이상의 표적 단백질의 발현을 위한 숙주 세포로서 작용할 수 있는 것으로 생각된다.

일부 구현예에서, 세포는 임의의 진핵 세포 또는 세포주이다. 개시된 폴리뉴클레오타이드, 벡터, 시스템 및 방법은 임의의 진핵 세포주에서 사용될 수 있다. 진핵 세포주는 인간 및 동물 세포주와 같은 포유류 세포주를 포함할 수 있다. 진핵 세포주는 또한 곤충, 식물 또는 진균 세포주를 포함할 수 있다. 이러한 세포 또는 이러한 세포로부터 생성된 세포주의 비제한적 예는 Bc HROC277, COS, CHO(예컨대, CHO-S, CHO-K1, CHO-DG44, CHO-DUXB11, CHO-DUKX, CHOK1SV), VERO, MDCK, WI38, V79, B14AF28-G3, BHK, HaK, NSO, 5P2/0-Ag14, HeLa, HEK293(예컨대, HEK293-F, HEK293-H, HEK293-T), 및 perC6 세포뿐만 아니라 곤충 세포, 예컨대 스포돕테라 푸지페르다(Spodoptera fugiperda)(Sf, 예컨대, Sf9), 또는 진균 세포, 예컨대 사카로마이세스(Saccharomyces), 피키아(Pichia) 및 쉬조사카로마이세스(Schizosaccharomyces)를 포함한다.

일부 구현예에서, 표적 단백질(들) 및 인핸서 단백질(들)을 발현하기 위한 세포 또는 세포주는 인간 세포 또는 세포주이다. 특정 양태에서, 인간 세포주의 선택은, 예컨대 표적 단백질에서 글리코실화, 인산화, 이황화 결합과 같은 번역 후 변형("PTM")에 유리하다. 일부 구현예에서, 인간 세포 또는 세포주는 인간 표적 단백질의 발현에 사용된다.

일부 구현예에서, 세포주는 안정한 세포주이다. 일부 구현예에서, 세포는 본원에 개시된 폴리뉴클레오타이드 및/또는 벡터 중 어느 하나 이상으로 일시적으로 형질감염된다.

일부 구현예에서, 본 개시내용은 표적 단백질의 발현을 위한 진핵 세포를 제공하며, 세포는 인핸서 단백질을 코딩하는 외인성 폴리뉴클레오타이드를 포함한다. 일부 구현예에서, 인핸서 단백질을 코딩하는 외인성 폴리뉴클레오타이드는 일시적으로 형질도입되고/되거나 세포의 게놈 내로 통합되지 않는다. 일부 구현예에서, 인핸서 단백질을 코딩하는 외인성 폴리뉴클레오타이드는 안정적으로 통합된다. 일부 구현예에서, 인핸서 단백질은 핵세포질 수송(NCT)의 억제제이다. 일부 구현예에서, 인핸서 단백질은 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 코로나바이러스 ORF6 단백질, 에볼라바이러스 VP24 단백질, 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질, 단순 포진 바이러스(HSV) ICP27 단백질 및 랍도바이러스 기질(M) 단백질로 이루어진 군으로부터 선택된다. 외인성 폴리뉴클레오타이드는 프로모터(선택적으로 천연 프로모터 또는 외인성 프로모터)에 작동가능하게 연결된다. 일부 구현예에서, 폴리뉴클레오타이드는 내부 리보솜 진입 부위(IRES)에 작동가능하게 연결된다.

단백질 발현 방법

본 개시내용은 진핵 세포 내 표적 단백질을 발현시키는 방법을 제공한다. 상기 방법은 표적 단백질을 코딩하는 폴리뉴클레오타이드(프로모터에 작동가능하게 연결된 폴리뉴클레오타이드)를 진핵 세포 내로 도입하는 단계를 포함할 수 있다. 이 방법은 인핸서 단백질의 동시 발현을 이용하여 표적 단백질의 발현 수준, 용해도 및/또는 활성을 향상시킨다.

일부 구현예에서, 본 개시내용의 방법에 따른 하나 이상의 인핸서와 조합하여 발현되는 표적 단백질의 발현 수준은 하나 이상의 인핸서의 부재 하에 발현되는 표적 단백질의 발현 수준보다 더 높다. 일부 구현예에서, 본 개시내용의 방법에 따른 하나 이상의 인핸서와 조합하여 발현되는 표적 단백질의 발현 수준은 하나 이상의 인핸서의 부재 하에 발현되는 표적 단백질의 발현 수준과 비교하여 적어도 약 1.1배(예를 들어, 약 1.2배, 약 1.3배, 약 1.4배, 약 1.5배, 약 1.6배, 약 1.7배, 약 1.8배, 약 1.9배, 약 2배, 약 2.5배, 약 3배, 약 3.5배, 약 4배, 약 4.5배, 약 5배, 약 6배, 약 7배, 약 8배, 약 9배, 또는 약 10배) 더 높다.

일부 구현예에서, 본 개시내용의 방법에 따른 하나 이상의 인핸서와 조합하여 발현되는 표적 단백질의 활성은 하나 이상의 인핸서의 부재 하에 발현되는 표적 단백질의 활성보다 더 높다. 일부 구현예에서, 본 개시내용의 방법에 따른 하나 이상의 인핸서와 조합하여 발현되는 표적 단백질의 활성은 하나 이상의 인핸서의 부재 하에 발현되는 표적 단백질의 활성과 비교하여 적어도 약 1.1배(예를 들어, 약 1.2배, 약 1.3배, 약 1.4배, 약 1.5배, 약 1.6배, 약 1.7배, 약 1.8배, 약 1.9배, 약 2배, 약 2.5배, 약 3배, 약 3.5배, 약 4배, 약 4.5배, 약 5배, 약 6배, 약 7배, 약 8배, 약 9배, 또는 약 10배) 더 높다.

일부 구현예에서, 인핸서 단백질은 핵세포질 수송(NCT)의 억제제이다. 일부 구현예에서, 인핸서 단백질은 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 코로나바이러스 ORF6 단백질, 에볼라바이러스 VP24 단백질, 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질, 단순 포진 바이러스(HSV) ICP27 단백질 및 랍도바이러스 기질(M) 단백질로 이루어진 군으로부터 선택된다.

일부 양태에서, 본 개시내용은 하나 이상의 표적 단백질 및 하나 이상의 인핸서 단백질을 코딩하는 폴리뉴클레오타이드를 포함하는 세포의 사용을 통해 표적 단백질을 생산하는 방법에 관한 것이다. 일부 구현예에서, 방법은 하나 이상의 벡터를 포함하는 진핵 세포에서 수행된다. 일부 구현예에서, 방법은 전술한 섹션에 기재된 폴리뉴클레오타이드, 벡터 및 세포를 사용하여 수행된다. 일부 구현예에서, 벡터들(또는 벡터)은 표적 단백질을 코딩하는 제1 폴리뉴클레오타이드 및 인핸서 단백질을 코딩하는 제2 폴리뉴클레오타이드를 가질 수 있다. 일부 구현예에서, 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드는 하나 이상의 프로모터에 작동가능하게 연결된다.

프로모터에 작동가능하게 연결된 표적 단백질을 코딩하는 폴리뉴클레오타이드를 진핵 세포 내로 도입하는 단계를 포함하는 표적 단백질의 재조합 발현 방법이 추가로 제공된다. 일부 구현예에서, 표적 단백질 발현 방법은 본 개시내용의 벡터 시스템을 진핵 세포 내로 도입하는 단계를 포함한다. 일부 구현예에서, 표적 단백질은 막 단백질이다. 일부 구현예에서, 막 단백질의 세포막으로의 국소화는 막 단백질이 인핸서 단백질 없이 발현될 때 관찰되는 국소화와 비교하여 증가된다. 일부 구현예에서, 본 개시내용의 방법에 따른 하나 이상의 인핸서와 조합하여 발현되는 막 결합된 막 단백질의 수준은 하나 이상의 인핸서의 부재 하에 발현되는 막 결합된 막 단백질의 수준과 비교하여 적어도 약 1.1배(예를 들어, 약 1.2배, 약 1.3배, 약 1.4배, 약 1.5배, 약 1.6배, 약 1.7배, 약 1.8배, 약 1.9배, 약 2배, 약 2.5배, 약 3배, 약 3.5배, 약 4배, 약 4.5배, 약 5배, 약 6배, 약 7배, 약 8배, 약 9배, 또는 약 10배) 더 높다.

일부 구현예에서, 본원에 개시된 방법을 사용한 본원에 개시된 하나 이상의 인핸서 단백질의 발현은, 하나 이상의 인핸서 단백질을 발현하지 않는 야생형 세포와 비교하여 특정 세포 주기 단계에서 인핸서 발현 숙주 세포의 수가 변경되도록, 숙주 세포의 세포 주기에 대한 효과와 연관되거나, 상관관계가 있거나, 유도할 수 있다. 일부 구현예에서, 본원에 개시된 방법을 사용한 본원에 개시된 하나 이상의 인핸서 단백질의 발현은 세포 주기의 특정 단계에서 숙주 세포의 정지와 연관되거나, 상관관계가 있거나, 유도할 수 있다. 일부 구현예에서, 특정 세포 단계는 G1, S 또는 G2 단계와 같은 세포 주기의 성장 단계이다. 일부 구현예에서, 본원에 개시된 방법을 사용한 본원에 개시된 하나 이상의 인핸서 단백질의 발현은 세포에서 클론 드리프트(clonal drift)의 감소 또는 제거와 연관되거나, 상관관계가 있거나, 유도할 수 있다.

일부 구현예에서, 방법은 프로모터에 작동가능하게 연결된 인핸서 단백질을 코딩하는 폴리뉴클레오타이드를 진핵 세포 내로 도입하는 단계를 포함할 수 있다. 일부 구현예에서, 방법은 하나 이상의 DNA 분자를 이용한 진핵 세포의 형질감염, 단일 바이러스 벡터를 이용한 진핵 세포의 형질도입, 및/또는 2개 이상의 바이러스 벡터를 이용한 진핵 세포의 형질도입을 포함할 수 있다.

하류 적용

일부 구현예에서, 본 발명의 조성물, 시스템 및 방법의 사용을 통해 생성된 표적 단백질, 및 이러한 단백질을 발현하는 세포는 하류 적용을 위해 단리, 정제 및/또는 사용된다. 예시적인 적용은, 비제한적으로 소분자 스크리닝, 구조 결정(예컨대, X선 결정학, 극저온 전자 현미경 검사 등), 활성 분석, 치료제, 효소 대체 요법, 스크리닝 분석, 진단 분석, 임상 시험 키트, 약물 발견, 항체 발견 등을 포함한다. 일부 구현예에서, 본 발명의 조성물 및 방법은 항체를 생성하거나 항체 스크리닝 분석을 위한 항원을 생성하는 데 사용된다. 일부 구현예에서, 표적 단백질을 발현하는 세포는, 예컨대 전체 세포 시스템에서 세포 상호작용, 항체 결합, 또는 소분자 영향을 스크리닝하기 위한 분석 시스템으로서 사용될 수 있다.

일부 구현예에서, 본 개시내용은 항체 발견을 위한 시스템 및 방법을 제공한다. 일부 구현예에서, 본 개시내용은 본 개시내용의 시스템 또는 방법을 사용하여 생성된 세포 또는 표적 단백질로 대상체를 면역화하는 단계를 포함하는, 표적 단백질에 대한 항체를 생성하는 방법을 제공한다. 다양한 구현예에서, 면역화된 대상체는 마우스, 랫트, 토끼, 비인간 영장류, 라마, 낙타 또는 인간이다. 대상체로부터 단리된 세포는 단리된 세포로서, 또는 선택적으로 단리된 세포로부터 하이브리도마의 생성 후에 추가 선택 라운드에 적용될 수 있다. 유전자 클로닝 및/또는 시퀀싱은 단리된 세포 또는 하이브리도마로부터 중쇄 및 경쇄를 코딩하는 폴리뉴클레오타이드 서열(들)을 단리하는 데 사용될 수 있다. 유전자 클로닝 및/또는 시퀀싱은 단일 세포 또는 세포 집단에 적용될 수 있다. 일부 구현예에서, 본 개시내용의 조성물 및 방법은 대상체의 면역화 후 대상체로부터 혈청을 채취하는 것을 통해 다클론성 항체를 생성하는 데 사용된다.

본 개시내용은 본 개시내용의 시스템 또는 방법을 사용하여 생성된 표지된 세포 또는 표적 단백질, 및 재조합 세포의 집단을 포함하는 용액을 제공하는 단계로서, 재조합 세포는 각각 항체 또는 이의 항원 결합 단편을 포함하는 폴리펩타이드의 라이브러리를 발현하는 것인 단계; 및 표지된 세포 또는 표지된 표적 단백질에 결합된 재조합 세포를 검출함으로써 용액으로부터 하나 이상의 재조합 세포를 분류하는 단계를 포함하는, 세포 분류에 의한 항체 발견 방법을 추가로 제공한다. 다른 변형에서, 세포 분류는 면역화된 대상체로부터 유래된 세포에서 수행된다. 대상체는 본 개시내용의 방법에 따라 생성된 세포 또는 표적 단백질로, 또는 또 다른 적합한 면역원을 사용하여 면역화될 수 있다. 일부 구현예에서, 재조합 세포는 나이브 항체 라이브러리, 선택적으로 인간 나이브 항체 라이브러리를 포함한다. 다양한 항체 라이브러리 생성 방법은 당업계에 공지되어 있으며 본 개시내용의 방법과 조합될 수 있다. 본원에 사용된 바와 같이, 용어 "분류" 또는 "세포 분류"는 형광 활성화 세포 분류, 자기 보조 세포 분류, 및 표지 및 비표지 세포 집단에서 표지된 세포를 선택하는 다른 수단을 지칭한다.

본 개시내용은 파지 디스플레이 라이브러리를 본 개시내용의 시스템 또는 방법을 사용하여 생성된 세포 또는 표적 단백질과 혼합하는 단계; 및 세포 또는 표적 단백질에 결합하는 파지 디스플레이 라이브러리의 구성원을 정제 및/또는 농축하는 단계를 포함하는, 파지 디스플레이 라이브러리를 패닝(panning)하는 방법을 추가로 제공한다. 일부 구현예에서, 파지 디스플레이 라이브러리는 단쇄 가변 단편(scFv) 또는 다른 유형의 항체/항체 단편(Fab 등)의 집단을 발현한다.

추가 구현예에서, 본 개시내용은 임의의 유형의 단백질 결합제를 스크리닝하는 방법을 제공한다. 본 개시내용의 세포 및 표적 단백질은 표적 단백질에 대한 결합 파트너를 확인하기 위해 약물 및 거대분자(단백질, 핵산, 및 단백질:핵산 복합체)를 포함하는 다양한 유형의 분자의 라이브러리를 스크리닝하는 데 사용될 수 있다. 다른 구현예에서, 본 개시내용의 시스템 및 방법은 단일 웰, 여러 서열의 풀, 또는 유전자 서열의 라이브러리에서 표적 단백질의 라이브러리를 발현하는 데 사용된다.

항원을 천연 또는 질병 관련 형태로 높은 수율로 발현하고/하거나 세포의 표면에 제시하는 능력은 선행 기술 방법보다 항체, 항체 단편 및 기타 분자의 보다 신뢰할 수 있는 발견 및/또는 생성을 가능하게 한다. 이러한 항체, 항체 단편, 및 기타 분자는 치료제 및/또는 연구 도구로서, 또는 다른 적용에 유용할 수 있다.

일부 구현예에서, 본 개시내용의 시스템 및 방법은 표적 분자(예컨대, 당단백질) 상의 특정 글리코실화 패턴에 결합하고/하거나 이에 특이적인 항체의 발견에 사용하기에 적합하다. 일부 구현예에서, 항체 라이브러리는 천연 글리코실화된 단백질에 대해 분류되고 부적절하게 글리코실화되거나 탈글리코실화된 동족 단백질에 대해 반대 분류된다. 유사하게, 탈글리코실화 효소를 사용하여, 항체는 글리코실화 패턴에 대해 특이적으로 분류될 수 있다. 추가 구현예에서, 본 개시내용의 세포 및/또는 표적 단백질은 신규 항체 또는 다른 거대분자의 결합 및/또는 기능적 활성을 확인하는 데 사용된다.

일부 구현예에서, 본 개시내용의 시스템 및 방법은 본원에 개시되거나 당업계에 공지된 임의의 숙주 세포에서 임의의 표적 단백질의 생합성에 사용하기에 적합하다. 예를 들어, 본 개시내용의 시스템 및 방법은 포유류 세포에서 임의의 표적 단백질의 생합성에 사용하거나 박테리아, 효모 및 기타 미생물에서 발효를 사용하는 데 적합하다. 일부 구현예에서, 본 개시내용의 시스템 및 방법은 특정 대사 경로를 숙주 세포 내로 도입함으로써 비단백질 분자의 생합성에 사용하기에 적합하다. 예를 들어, 비단백질 분자는 오피오이드 분자 또는 또 다른 대사산물이다.

예시적인 이점

본 발명의 조성물, 시스템 및 방법은 많은 이점을 가질 수 있다. 예를 들어, 실시예 11에서 입증된 바와 같이, 일반적으로 세포자멸사를 유도하여 인간 세포주에서 과발현될 때 검출불가능한 수율을 생성하는 인간 NADase는 인핸서 단백질이 이 표적 단백질과 함께 동시 발현될 때 20 mg/L 초과의 수율을 생성하도록 신뢰성 있게 발현될 수 있다. 또한, 이 예시적인 방법을 통해 발현된 NADase는 기능적이며(인산염 방출 분석에 의해 입증됨) 낮은 배치간 변동을 나타낸다.

유사하게, 일부 구현예에서, 본 발명의 방법, 시스템 및 세포는 발현하기 어려운 단백질의 신뢰성 있는 발현에 사용된다. 일부 구현예에서, 본 개시내용은 낮은 배치간 변동을 갖는 단백질의 생성에 관한 것이다. 본 개시내용에 따라 생성된 단백질은 하기 개선: 정제 태그 융합이 없는 정제; 개선된 기능적 활성; 신뢰성 있는 생성; 일관된 활성; 및 치료 적용에 대한 적합성 중 하나 이상을 나타낼 수 있다.

본 개시내용의 세포는 표적 단백질 발현의 관점에서 하기 이점: 막에서 표적 막 단백질의 더 높은 농도; 더 느린/감소된 표적 단백질 분해; 전체 세포 분석에서 개선된 신호 대 잡음비; 하류 세포 대사에 영향을 미치지 않으면서 표적 단백질 및/또는 인핸서 단백질 발현; 막 결합된 막 단백질의 탈감작에 대한 증가된 안정성; 및 더 높은 표적 단백질 수율 중 하나 이상을 가질 수 있다. 실시예 1은 세포의 하류 대사에 영향을 미치지 않는 인핸서 단백질의 발현의 예시적인 예를 제공한다. 실시예 1에 예시된 GPCR은 그의 천연 기질과 상호작용하고 시험관내에서 측정될 수 있는 활성화를 생성할 수 있었다.

일부 구현예에서, 본 발명의 시스템 및 방법은 다음 이점: 임의의 진핵 세포 유형에 대한 적합성; 표적 단백질 발현 최적화의 필요성 감소; 발현하기 어려운 단백질의 신뢰성 있는 발현 중 하나 이상을 가질 수 있다.

시스템

본 개시내용의 일 양태는 하나 이상의 벡터를 포함하는 진핵 세포 내 표적 단백질의 재조합 발현을 위한 시스템을 제공한다. 벡터들(또는 벡터)은 표적 단백질을 코딩하는 제1 폴리뉴클레오타이드 및 인핸서 단백질을 코딩하는 제2 폴리뉴클레오타이드를 가질 수 있다. 인핸서 단백질은 핵세포질 수송(NCT)의 억제제일 수 있다. 일부 구현예에서, 인핸서 단백질은 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 단순 포진 바이러스(HSV) ICP27 단백질, 및 랍도바이러스 기질(M) 단백질로 이루어진 군으로부터 선택될 수 있다. 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드는 하나 이상의 프로모터에 작동가능하게 연결될 수 있다.

일부 구현예에서, 인핸서 단백질은 핵세포질 수송(NCT)의 억제제이다. 일부 구현예에서, NCT 억제제는 바이러스 단백질이다.

일부 구현예에서, 인핸서 단백질은 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 코로나바이러스 ORF6 단백질, 에볼라바이러스 VP24 단백질, 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질, 단순 포진 바이러스(HSV) ICP27 단백질, 및 랍도바이러스 기질(M) 단백질로 이루어진 군으로부터 선택되는 NCT 억제제이다.

NCT 억제제는 피코르나바이러스 리더(L) 단백질 또는 그의 기능적 변이체일 수 있다. 일부 구현예에서, NCT 억제제는 피코르나바이러스 2A 프로테아제 또는 그의 기능적 변이체일 수 있다. 일부 구현예에서, NCT 억제제는 라이노바이러스 3C 프로테아제 또는 그의 기능적 변이체일 수 있다. 일부 구현예에서, NCT 억제제는 코로나바이러스 ORF6 단백질 또는 그의 기능적 변이체일 수 있다. 일부 구현예에서, NCT 억제제는 에볼라바이러스 VP24 단백질 또는 그의 기능적 변이체일 수 있다. 일부 구현예에서, NCT 억제제는 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질 또는 그의 기능적 변이체일 수 있다. 일부 구현예에서, NCT 억제제는 단순 포진 바이러스(HSV) ICP27 단백질 또는 그의 기능적 변이체이다. 일부 구현예에서, NCT 억제제는 랍도바이러스 기질(M) 단백질 또는 그의 기능적 변이체이다.

일부 구현예에서, 인핸서 단백질은 L 단백질이고, 이는 타일러 바이러스(Theiler's virus)의 L 단백질 또는 그의 기능적 변이체이다. 일부 구현예에서, L 단백질은 서열번호: 1과 적어도 90% 동일성을 공유할 수 있다.

일부 구현예에서, L 단백질은 뇌심근염 바이러스(EMCV)의 L 단백질 또는 그의 기능적 변이체이다. 일부 구현예에서, L 단백질은 서열번호: 2와 적어도 90% 동일성을 공유할 수 있다.

시스템은 발현 카세트를 포함하는 단일 벡터를 포함할 수 있으며, 발현 카세트는 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드를 포함한다. 일부 구현예에서, 발현 카세트는 제1 폴리뉴클레오타이드에 작동가능하게 연결된 제1 프로모터; 및 제2 폴리뉴클레오타이드에 작동가능하게 연결된 제2 프로모터를 포함한다. 일부 구현예에서, 발현 카세트는 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드 모두에 작동가능하게 연결된 공유 프로모터를 포함한다.

일부 구현예에서, 발현 카세트는 리보솜 스키핑 부위(ribosome skipping site)를 코딩하는 폴리뉴클레오타이드에 의해 연결된 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드를 포함하는 코딩 폴리뉴클레오타이드를 포함하고, 코딩 폴리뉴클레오타이드는 공유 프로모터에 작동가능하게 연결된다.

일부 구현예에서, 발현 카세트는 코딩 폴리뉴클레오타이드를 포함하고, 코딩 폴리뉴클레오타이드는 리보솜 스키핑 부위에 의해 연결된 인핸서 단백질 및 표적 단백질을 코딩하며, 코딩 폴리뉴클레오타이드는 공유 프로모터에 작동가능하게 연결된다.

일부 구현예에서, 발현 카세트는 리보솜 스키핑 부위에 의해 연결된 표적 단백질 및 인핸서 단백질 둘 모두를 코딩하는 단일 메신저 RNA의 전사를 위해 구성되고; 메신저 RNA의 번역은 별개의 폴리펩타이드로서 표적 단백질 및 인핸서 단백질(예컨대, L 단백질)의 발현을 유도한다.

시스템은 하나의 벡터를 포함할 수 있다. 일부 구현예에서, 시스템은 표적 단백질을 코딩하는 제1 폴리뉴클레오타이드 및 인핸서 단백질을 코딩하는 제2 폴리뉴클레오타이드를 포함하는 단일 벡터를 포함할 수 있다.

시스템은 2개의 벡터를 포함할 수 있다. 일부 구현예에서, 시스템은 제1 프로모터에 작동가능하게 연결된 제1 폴리뉴클레오타이드를 포함하는 제1 벡터; 및 제2 프로모터에 작동가능하게 연결된 제2 폴리뉴클레오타이드를 포함하는 제2 벡터를 포함할 수 있다.

일부 구현예에서, 시스템에 의해 포함된 하나 이상의 벡터 중 적어도 하나는 T7 RNA 중합효소에 의한 제1 폴리뉴클레오타이드 또는 제2 폴리뉴클레오타이드 중 어느 하나 또는 둘 모두의 전사를 위해 구성된 T7 프로모터를 포함할 수 있다.

일부 구현예에서, 시스템에 의해 포함된 하나 이상의 벡터 중 적어도 하나는 T7 RNA 중합효소를 코딩하는 폴리뉴클레오타이드 서열을 포함할 수 있다.

본 명세서에 인용된 모든 논문, 간행물 및 특허는 각각의 개별 논문, 간행물 또는 특허가 구체적이고 개별적으로 참조로 포함되는 것으로 표시된 것처럼 참조로 본원에 포함되고, 간행물이 인용되는 것과 관련된 방법 및/또는 물질을 개시하고 설명하기 위해 참조로 본원에 포함된다. 그러나, 본원에 인용된 임의의 참고문헌, 기사, 간행물, 특허, 특허 공개, 및 특허 출원의 언급은 이들이 유효한 선행 기술을 구성하거나 세계의 어느 국가에서의 일반 상식의 일부를 형성한다는 인정 또는 임의의 형태의 시사로서 간주되지 않거나 간주되지 않아야 한다.

문맥이 달리 나타내지 않는 한, 본원에 설명된 다양한 특징은 임의의 조합으로 사용될 수 있는 것으로 구체적으로 의도된다.

달리 정의되지 않는 한, 본원에 사용된 모든 기술 및 과학 용어는 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다.

실시예

표 4: 실시예 내용의 표

물질 및 방법

DNA 분자의 제작

모든 조립체를 높은 복제 수 복제 기점(ColE1)을 제어하는 프로모터에 이어 터미네이터(rrnB T1 및 T2 터미네이터)를 포함하는, E. coli에서 증식할 수 있는 플라스미드 백본으로 만들었다. 그 다음에는 두 번째 터미네이터(파지 람다로부터의 전사 터미네이터)에 의해 벡터의 나머지로부터 단리된 항생제 내성 유전자를 제어하는 프로모터가 뒤따른다. 백본의 요소를 포함하는 유전자를 포스포라미다이트 화학에 의해 합성하였다.

플라스미드 제작에 사용된 구조 유전자를 포스포라미다이트 화학, 화학에 의해 합성하고, 표 2에 열거된 프라이머를 사용한 NEB HI-FI 또는 Gibson Assembly와 같은 등온 조립 반응을 사용하여 상기 기재된 벡터 내로 증폭 및 클로닝하였다. 이들 실시예에 사용된 예시적인 작제물에 의해 포함된 선택된 아미노산 서열이 표 3에 제공되어 있다.

표 2: 작제물 설계

표 3: 일부 작제물에 의해 포함된 예시적인 아미노산 서열

세포주 - 배양 및 형질감염

인간 진핵 세포에서의 본 발명의 시스템, 방법 및 조성물의 적용을 예시하기 위해 HEK293 세포를 사용하였다. HEK293 부착 세포(CLS)를 10% 우태아 혈청(Gibco) 및 50,000 U Pen Strep(Gibco)이 보충된 Dulbecco의 변형 이글 배지 고 글루코스(Gibco)에서 배양하였다. HEK293 세포를 37℃ 및 5% CO₂에서 80% 컨플루언시까지 성장시킨 후, 제조사의 지침에 따라 293 fectin(ThermoFisher)을 사용하여 일시적으로 형질감염시켰다. 37℃에서 5분간 0.5% 트립신 용액을 사용하여 세포를 떼어내고 긁어냄으로써 48시간 후에 단백질 발현 세포를 채취하였다. 세포를 펠렛화하고(5,000 x g, 15분, 4℃), 상층액을 버렸다. 세포 펠렛을 추가 사용시까지 -80℃에서 보관하였다.

인간 진핵 세포에서 본 발명의 시스템, 방법 및 조성물의 적용을 예시하기 위해 현탁액 HEK293 세포를 사용하였다. 현탁액 적응된 HEK293 세포(CLS)를 보충된 Expi293 발현 배지(Gibco)에서 배양하였다. 형질감염 1일 전에, 세포를 1.75 x 10⁶개 세포/ml로 시딩하고 37℃ 및 5% CO₂에서 밤새 인큐베이션한 후 제조사의 지침에 따라 Expi293 발현 시스템 키트(Gibco)를 사용하여 일시적으로 형질감염시켰다. 단백질 발현 세포를 원심분리(5,000 x g, 15분, 4℃)에 의해 48-96시간 후에 채취하였다. 가용성 또는 막 단백질의 경우 상층액을 버리고, 세포 펠렛을 추가 사용시까지 -80℃에서 보관하였다. 분비된 단백질의 경우, 상층액을 즉시 추가 정제에 사용하였다.

진핵 동물 세포에서 본 발명의 시스템, 방법 및 조성물의 적용을 예시하기 위해 CHO-K1 세포를 사용한다. CHO-K1 부착 세포(CLS)를 10% 우태아 혈청(Gibco)이 보충된 DMEM/F-12 GlutaMAX 배지(Gibco)에서 배양하였다. CHO-K1 세포를 37℃ 및 5% CO2에서 80% 컨플루언시로 성장시킨 후, 제조사의 지침에 따라 Lipofectamine LTX(ThermoFisher)를 사용하여 일시적으로 형질감염시켰다. 37℃에서 5분 동안 0.5% 트립신 용액을 사용하여 세포를 떼어내고 긁어냄으로써 단백질 발현 세포를 48시간 후에 채취하였다. 세포를 펠렛화하고(5,000 x g, 15분, 4℃) 상층액을 버렸다. 세포 펠렛을 추가 사용시까지 -80℃에서 보관하였다.

진핵 곤충 세포에서 본 발명의 시스템, 방법 및 조성물의 적용을 예시하기 위해 SF9 세포를 사용하였다. SF9 현탁 세포(CLS)를 Sf9-900 III 배지(Gibco)에서 배양하였다. SF9 세포를 26℃및 130 rpm에서 성장시킨 후 제조사의 지침에 따라 Cellfectin II(ThermoFisher)를 사용한 일시적 형질감염을 위해 6 웰 플레이트에 시딩하였다. 단백질 발현 세포를 떼어내고 펠렛화(5,000 x g, 15분, 4℃)하여 48시간 후에 채취하고, 상층액을 버렸다. 세포 펠렛을 추가 사용시까지 -80℃에서 보관하였다.

실시예 1: HEK293 세포에서의 GFP 발현

CMV 프로모터 시스템

발현 동안 바이러스 핵 기공 차단 단백질의 도입의 영향을 입증하기 위해, HEK293 세포를 EG1, EG2 중 하나로 형질감염시키거나 EG3 및 EG4 작제물로 동시 형질감염시켰다(작제물 세부내용의 경우 표 2 및 도 2 참조). 바이러스 기공 차단 단백질의 발현은 단백질 발현의 제어된 조절을 유도하였다. 결과적으로, 획득된 GFP 신호가 감소하였다. 기공 차단 단백질과 협력하는 관심 유전자의 제어된 조절의 이유는 바이러스 단백질의 작용 방식 때문이다. 이론에 얽매이지 않고, 단백질 조절을 위한 가능한 메커니즘은 기공 차단 단백질을 발현함으로써 mRNA의 핵 수출이 억제될 수 있고 결과적으로 표적 단백질의 번역이 하향조절될 것이라는 것이다. 안정화 후, 기공 차단 단백질이 분해될 것이고, mRNA 수송이 재개될 것이다. 이것은 다시 표적 단백질 및 인핸서 단백질, 예컨대 기공 차단 단백질 모두의 발현으로 이어진다. 이러한 엄격하게 제어되는 피드백은 표적 단백질의 안정화와 영구적인 발현을 보장하고 단백질 발현의 정지로 이어지는 진핵 세포의 일반적인 조절을 방지한다.

도 3a-3d는 본 개시내용에 따른 예시적인 인핸서 단백질로서 ECMV로부터의 L-단백질의 부재 및 존재 하에 GFP 발현에 대한 효과를 나타낸다. HEK293 세포를 24 웰 플레이트에 0.05 x 10⁶개 세포/웰로 시딩하고 37℃및 5% CO₂에서 밤새 인큐베이션한 후 상기 기재된 바와 같이 EG1 또는 EG2 중 하나로 일시적으로 형질감염시켰다. GFP 발현을 형광 현미경 검사를 사용하여 24시간 및 48시간 후에 모니터링하였다. CCD 카메라(Amscope)를 사용하여 이미지를 촬영하고 ISCapture(Amscope)로 분석하였다. 본 실시예는 본 개시내용에 따른 표적 단백질 폴리뉴클레오타이드 및 인핸서 단백질 폴리뉴클레오타이드를 포함하는 예시적인 시스템에서 표적 단백질 발현의 개선된 조절을 입증한다.

T7 중합효소 시스템

EG2는 진핵 숙주의 천연 중합효소를 사용하지만, T7과 같은 다른 바이러스 중합효소는 핵 외부에서 전사를 개시하는 데 사용될 수 있다. 바이러스 중합효소는 표준 진핵 프로모터의 제어 하에 있으며, 상응하는 mRNA는 핵 수출에 의존할 것이다. 세포질에서, 바이러스 중합효소는 번역된 다음 표적 단백질 폴리뉴클레오타이드 및 인핸서 단백질 폴리뉴클레오타이드의 전사를 개시한다. 일부 구현예에서, 인핸서 단백질의 발현의 결과로서, 바이러스 중합효소의 핵 수송이 감소할 것이다. 시스템의 안정화는 인핸서 단백질의 분해로 이어질 것이고, 바이러스 중합효소의 mRNA 수송이 재개될 것이다. 이론에 얽매이지 않고, 이 피드백은 재조합 단백질을 과발현하는 동안 세포의 일반적인 조절을 방지할 수 있다. 일부 상황에서, 바이러스 중합효소의 사용은 진핵 중합효소를 사용하는 시스템과 비교하여 세포 대 세포 기반으로 더 높은 발현 수준의 이점을 제공한다.

도 4a-4d는 T7 보유 벡터로 동시 형질감염될 때 T7 프로모터로부터 ECMV로부터의 L 단백질과 협력한 GFP의 성공적인 발현을 보여준다. HEK293 세포를 24 웰 플레이트에 0.05 x 10⁶개 세포/웰로 시딩하고 37℃ 및 5% CO₂에서 밤새 인큐베이션한 후, 상기 기재된 바와 같이 EG1 또는 EG3 및 EG4 중 하나로 일시적으로 형질감염시켰다. GFP 발현을 형광 현미경 검사를 사용하여 24시간 및 48시간 후에 모니터링하였다. CCD 카메라(Amscope)를 사용하여 이미지를 촬영하고 ISCapture(Amscope)로 분석하였다. 본 실시예는 표적 단백질로서 GFP 및 인핸서 단백질로서 ECMV의 L-단백질과 협력하는 예시적인 바이러스 중합효소로서 T7의 성공적인 사용을 입증한다. 상기 실시예와 유사하게, L-단백질의 도입은 발현의 더 엄격한 조절 및 이에 따라 과발현의 전반적인 감소를 유도하였다.

실시예 2: 도파민 수용체 1(DRD1)의 생성

고밀도의 활성 막 수용체를 생성하기 위해 인핸서 단백질로서 기공 차단 단백질과 조합된 표적 단백질로서 막 단백질의 동시 발현에 대한 개시된 시스템 및 방법의 적용을 예시하기 위해 DRD1을 사용하였다. DRD1은 G-단백질 결합 수용체이며, 학술 표준을 사용하여 발현하기 어려운 것으로 알려져 있다. 세포 외막 내로의 정확한 이동을 시각화하기 위해, DRD1-GFP 융합체(EG8)를 본 시스템에 사용하였다. 학술 및 산업 환경에서의 GPCR의 문제를 예시하기 위해, 학술 표준(EG10)을 대조군으로 사용하였다.

개선된 막 단백질 발현 및 막 국소화

DRD1-GFP 융합체를 HEK293 세포에서 발현시켰다. HEK293 세포를 24 웰 플레이트에 0.05 x 10⁶개 세포/웰로 시딩하고 37℃ 및 5% CO₂에서 밤새 인큐베이션한 후, 상기 기재된 바와 같이 EG10 또는 EG8 중 하나로 일시적으로 형질감염시켰다. DRD1-GFP 발현을 형광 현미경 검사를 사용하여 24시간 및 48시간 후에 모니터링하였다. CCD 카메라(Amscope)를 사용하여 이미지를 촬영하고 ISCapture(Amscope)로 분석하였다.

도 5a-5d는 EG10이 발현된 수용체를 정확하게 이동시키지 못한다는 것을 입증한다. 이론에 얽매이지 않고, EG10 작제물로 인간 세포에서 인간 DRD1 수용체를 과발현한 결과로서, 세포는 발현된 표적 단백질을 분해하거나 제어하기 시작하는 것으로 여겨진다. 이러한 형태의 조절은 봉입체로서 변성 단백질의 형성을 유도한다(도 5b, 빨간색 화살표). 이러한 방식의 세포에 의한 막 단백질 발현의 제어는 불활성의 미스폴딩된 단백질을 유도할 수 있고 결과적으로 사용할 수 없고 품질이 불량한 발현된 단백질을 유도할 수 있다. 대조적으로, 예시적인 인핸서 단백질과 표적 막 단백질의 동시 발현은 막 내로의 정확한 삽입 및 봉입체의 부재에 의해 알 수 있는 바와 같이, 정확하게 이동된 DRD1-GFP를 유도하였다(도 5c-5d). 본 실시예는 예시적인 표적 막 단백질(DRD1)과 함께 예시적인 인핸서 단백질(ECMV의 L-단백질)의 동시 발현이 막 단백질의 개선된 발현 및 국소화를 유도하였음을 입증한다. 이론에 얽매이지 않고, 본 발명의 시스템은 표적 단백질 발현의 엄격한 조절을 야기하여 발현된 막 단백질의 분해를 유도할 세포의 정상적인 조절을 우회하는 것으로 여겨진다. 따라서, 본 발명의 시스템은 GPCR의 고수율 발현 및 정제에 적합하다.

상이한 작제물로부터 표적 단백질 및 인핸서 단백질의 발현

인핸서 단백질이 별도의 DNA 분자에 의해 코딩될 수 있음을 예시하기 위해, DRD1-GFP(EG10) 작제물을 별도의 벡터 상의 별도의 프로모터의 제어 하에 ECMV로부터의 L-단백질(EG11)과 함께 동시 발현시켰다. HEK293 세포를 24 웰 플레이트에 0.05 x 10⁶개 세포/웰로 시딩하고 37℃및 5% CO₂에서 밤새 인큐베이션한 후, 상기 기재된 바와 같이 EG10 및 EG11로 일시적으로 형질감염시켰다. DRD1-GFP 발현을 형광 현미경 검사를 사용하여 48시간 후에 모니터링하였다. Echo Revolve 현미경 검사 시스템에 의해 이미지를 촬영하고 분석하였다.

도 10a 및 b는 2개의 개별 벡터로부터의 DRD1-GFP와 L-단백질의 동시 발현이 정확한 막 결합을 보장한다는 것을 입증한다. DRD1-GFP의 발현은 봉입체의 형성으로 이어지지만(도 10a, 빨간색 화살표), 정확한 막 결합은 L-단백질의 동시 발현에 의해 달성될 수 있다. 도 10b는 L-단백질이 개별 벡터 및 프로모터로부터 발현되는 경우에도 L-단백질의 조절 효과가 DRD1의 정확한 막 결합을 회복하기에 충분함을 입증한다.

이들 결과는 본원에 개시된 인핸서 단백질 및 표적 단백질이 본원에 개시된 방법을 사용하여 발현된 표적 단백질의 수율 및/또는 기능의 개선을 달성하기 위해 개별 작제물로부터 발현될 수 있음을 입증한다. 또한, 이러한 결과는 동일한 작제물 또는 상이한 작제물로부터, 본원에 개시된 인핸서 단백질 중 하나 이상의 발현과 조합된 당업계에 현재 알려져 있거나 사용되는 임의의 작제물 또는 벡터로부터의 임의의 표적 단백질의 발현이 발현된 표적 단백질의 수율 및/또는 기능을 향상시킬 수 있음을 시사한다. 이것은 본원에 개시된 방법 및 조성물의 다재다능성을 극적으로 향상시킨다.

막 단백질의 기능적 활성

DRD1과 같이 정확하게 이동된 GPCR의 예시 외에도, DRD1-Strep 융합체를 사용하여 활성 시험을 수행하였다. 더 작은 strep-태그는 세포질에 위치한 G-단백질과의 상호 작용을 온전하게 하고 기능적 분석이 수행될 수 있게 한다. 도파민의 결합시에, DRD1은 이종삼량체 G-단백질을 그의 Gα 서브유닛과 그의 Gβγ 복합체로 방출한다. 휴지 상태에서, Gα는 GDP에 결합하지만 활성화시에 GDP를 GTP로 교환한다. Gα-GTP 복합체는 아데닐레이트 사이클라제(AC)와 상호작용하여 AC 활성의 활성화를 유도하고 결과적으로 cAMP 수준을 증가시킨다. 세포내 cAMP 수준의 변화는 표준 cAMP 분석에 의해 측정될 수 있다. 학술 및 산업 표준(EG5)을 ECMV의 L-단백질과의 동시 발현에서 동일한 표적 단백질과 비교하였다.

DRD1-Strep 융합체를 HEK293 세포에서 발현시켰다. HEK293 세포를 96 웰 흰색 투명 바닥 플레이트에 5,000개 세포/웰로 시딩하고 37℃ 및 5% CO₂에서 밤새 인큐베이션한 후, 상기 기재된 바와 같이 EG5 또는 EG6 중 하나로 일시적으로 형질감염시켰다. 단백질을 48시간 동안 발현시키고, DRD1 활성을 제조사의 지침에 따라 cAMP-Glo^TM 분석(Promega)을 사용하여 분석하였다. 48시간 후, 세포를 멸균 PBS pH 7.2로 세척하고 세포를 37℃에서 20 μl의 1 mM 도파민 기질 용액(+ 도파민; ON) 또는 PBS pH 7.2(- 도파민; OFF)와 함께 2시간 동안 인큐베이션하였다. 인큐베이션 후, 세포를 PBS pH 7.2로 세척한 후 20 μl 용해 완충액을 첨가하였다. 용해를 진탕하면서 실온(RT)에서 15분 동안 수행하였다. 이어서, 40 μl 검출 용액을 첨가하고 세포를 진탕하면서 RT에서 20분 동안 인큐베이션하였다. 반응을 RT에서 15분 동안 인큐베이션된 80 μl Kinase-Glo® 시약을 사용하여 정지시킨 후 분석하였다. 플레이트 판독기(BioTek Synergy™ LX)를 사용하여 발광을 측정하고, 표준 분석 프로그램을 사용하여 데이터를 분석하였다.

도 11은 EMCV로부터의 L 단백질과 함께 DRD1-Strep을 발현하는 이점을 입증한다. 도파민을 DRD1을 발현하는 세포에 첨가하는 경우, 내부 cAMP 방출의 결과로 상응하는 발광 신호가 떨어진다. 도 11은 DRD1을 EMCV로부터의 L 단백질과 동시 발현함으로써, 도파민의 부재 하의 OFF 상태와 도파민의 존재 하의 ON 상태 사이의 차이에 의해 나타난 바와 같이, 강한 활성화 신호가 있음을 보여준다. 분석의 중요한 측면은 활성제인 도파민의 부재 하에 DRD1의 잘못된 활성화 또는 cAMP 방출을 배제하는 것이다. 분석이 "누설(leaky)" 신호를 생성하면, 이를 약물 발견 스크리닝에 사용할 가능성은 낮다. 도 11은 DRD1을 EMCV로부터의 L 단백질과 동시 발현함으로써, 단지 OFF 신호를 형질전환되지 않은 세포와 비교할 때 "누설" 활성화 및 이에 따라 위음성 판독이 크게 감소된다는 것을 보여준다. 따라서, 본원에 개시된 방법을 사용한 인핸서 단백질의 동시 발현은 표적 DRD1 단백질의 활성화의 보다 엄격한 조절을 유도한다. 따라서, 본원에 개시된 방법은 약물 발견 스크리닝에 적용할 수 있다.

실시예 3: 바이러스 중합효소와 조합된 바이러스 프로모터를 사용한 DRD1-GFP의 발현

본 실시예의 경우, T7과 같은 바이러스 중합효소가 핵 외부에서 전사를 개시하는 데 사용될 수 있음을 입증하기 위해 예시적인 발현하기 어려운 표적 막 단백질로서 DRD1-GFP를 T7 프로모터를 사용하여 발현시켰다. 실시예 1에서와 같이, 바이러스 중합효소는 표준 진핵 프로모터의 제어 하에 있었고, 상응하는 mRNA는 핵 수출에 의존하였다.

도 6a-6b는 T7 보유 벡터로 동시 형질감염될 때 T7 프로모터로부터 ECMV로부터의 L 단백질과 함께 DRD1-GFP의 성공적인 발현을 입증한다. HEK293 세포를 24 웰 플레이트에 0.05 x 10⁶개 세포/웰로 시딩하고 37℃ 및 5% CO₂에서 밤새 인큐베이션한 후, EG10 또는 EG12 및 EG4 중 하나로 일시적으로 형질감염시켰다. DRD1-GFP 발현을 형광 현미경 검사를 사용하여 24시간 및 48시간 후에 모니터링하였다. CCD 카메라(Amscope)를 사용하여 이미지를 촬영하고 ISCapture(Amscope)로 분석하였다. 본 실시예는 표적 단백질로서 DRD1-GFP 및 인핸서 단백질로서 ECMV의 L-단백질과 함께 바이러스 중합효소로서 T7의 성공적인 사용을 입증한다.

실시예 4: 상이한 포유동물 프로모터를 사용한 DRD1-GFP의 발현

본 개시내용에 따른 시스템, 방법 및 조성물은 광범위한 포유동물 프로모터와 양립가능하다. 상이한 프로모터로부터 표적 단백질 및 인핸서 단백질의 동시 발현의 양립가능성을 입증하기 위해, DRD1-GFP를 예시적인 표적 단백질로서 사용하였다. 실시예 2에 기술된 바와 같이, DRD1-GFP의 정확한 발현 및 이동은 형광 현미경 검사에 의해 쉽게 검출될 수 있다. 실험에 사용된 작제물을 CMV 프로모터(EG8), EF1-α 프로모터(EG22) 또는 SV40 프로모터(EG23) 중 하나로부터 DRD1을 발현하고 다음 요소인 DRD1-GFP를 코딩하는 핵산 서열, IRES를 코딩하는 핵산 서열 및 L 단백질 서열을 코딩하는 핵산 서열을 갖도록 조작하였다. 정확한 막 결합과 부정확한 막 결합의 차이를 예시하기 위해 학술 표준 시스템(EG10)을 사용하였다.

상이한 포유동물 프로모터의 제어 하에 DRD1-GFP 융합체를 HEK293 세포에서 발현시켰다. HEK293 세포를 24 웰 플레이트에 0.05 x 10⁶개 세포/웰로 시딩하고 37℃ 및 5% CO₂에서 밤새 인큐베이션한 후, 상기 기재된 바와 같이 EG8, EG10, EG22 또는 EG23 중 하나로 일시적으로 형질감염시켰다. DRD1-GFP 발현을 형광 현미경 검사를 사용하여 48시간 후에 모니터링하였다. Echo Revolve 현미경 검사 시스템에 의해 이미지를 촬영하고 분석하였다.

도 12는 상이한 프로모터가 인핸서 단백질의 발현과 조합하여 표적 단백질 발현을 유도하는 데 사용될 수 있음을 입증한다. 대조군 작제물로부터의 DRD1-GFP의 발현이 DRD1이 세포의 외막에 국소되지 못하고 오히려 봉입체(연녹색 점, 도 12a)에 국소된다는 것을 보여주지만, CMV, EF1α 및 SV40(도 12b-d) 프로모터로부터 발현된 L-단백질 인핸서와 조합하여 발현되는 DRD1-GFP는 봉입체의 부재에 의해 판단되는 막과 모두 정확하게 결합되어 있다. 예상대로, 상이한 프로모터는 상이한 발현 수준을 유도하므로 막에서 DRD1-GFP의 양(형광의 총량)은 다양하다.

실시예 5: 상이한 바이러스 기공 차단 단백질을 사용한 DRD1-GFP의 발현

예시적인 표적 융합 단백질인 DRD1-GFP를 HEK293 세포에서 상이한 인핸서 단백질과 조합하여 발현시켰다. 이 실험에 사용된 작제물은 DRD1-GFP와 ECMV의 리더 단백질(EG8), 타일러 바이러스의 리더 단백질(EG19), 폴리오 바이러스의 2A 프로테아제(EG21) 및 수포성 구내염 바이러스의 M 단백질(EG20)로부터 선택된 인핸서 단백질 중 하나를 코딩하였다. 실시예 2에 기재된 바와 같이, DRD1-GFP의 정확한 발현 및 이동은 형광 현미경 검사에 의해 쉽게 검출될 수 있다. 정확한 막 결합과 부정확한 막 결합의 차이를 예시하기 위해 학술 표준 시스템(EG10)을 사용하였다. HEK293 세포를 24 웰 플레이트에 0.05 x 10⁶개 세포/웰로 시딩하고 37℃ 및 5% CO₂에서 밤새 인큐베이션한 후, 상기 기재된 바와 같이 EG8, EG10, EG19, EG20 또는 EG21 중 하나로 일시적으로 형질감염시켰다. DRD1-GFP 발현을 형광 현미경 검사를 사용하여 48시간 후에 모니터링하였다. Echo Revolve 현미경 검사 시스템에 의해 이미지를 촬영하고 분석하였다.

도 13은 ECMV의 리더 단백질(도 13b), 타일러 바이러스의 리더 단백질(도 13c), 폴리오 바이러스의 2A 프로테아제(도 13d) 및 수포성 구내염 바이러스의 M 단백질(도 13e)이 모두 임의의 인핸서 단백질이 없는 DRD1-GFP(도 13a)와 대조적으로 DRD1-GFP의 정확한 막 혼입을 보장하기에 충분하다는 것을 입증한다.

이러한 결과는 여러 상이한 바이러스 기공 차단 단백질이 숙주 세포에서 표적 단백질과 함께 발현될 때 표적 단백질의 수율, 국소화 및/또는 기능을 개선하는 능력을 공유한다는 것을 보여준다. 이론에 얽매이지 않고, 이들 인핸서 단백질 중 어느 하나로부터의 발현으로 인한 핵 기공의 차단이 발현된 표적 단백질의 분해를 유도할 세포의 정상적인 조절을 우회할 수 있는 것으로 생각된다. 따라서, 바이러스 기공 차단 단백질이 표적 단백질 발현, 국소화 및 활성을 향상시키는 이러한 공통 메커니즘은 본원에 개시된 방법이 당업계에 공지되거나, 미래에 발견되거나, 본원에 개시된 임의의 기공 차단 단백질을 이용하여 실시될 수 있게 한다.

실시예 6: CHO 세포에서 DRD1-GFP의 발현

HEK293 대신 CHO-K1(Chinese Hamster Ovary) 세포를 사용하여 실시예 2의 실험을 반복하였다. DRD1-GFP를 또한 인핸서 단백질을 코딩하는 EG19 작제물로부터 또는 대조군 EG10 작제물로부터 발현시켰다.

DRD1-GFP 융합 단백질을 CHO-K1 세포에서 발현시켰다. CHO-K1 세포를 24 웰 플레이트에 0.05 x 10⁶개 세포/웰로 시딩하고 37℃ 및 5% CO₂에서 밤새 배양한 후, 제조사의 지침에 따라 Lipofectamine 3000(Thermofisher)을 사용하여 EG10 또는 EG19 중 하나로 일시적으로 형질감염시켰다. DRD1-GFP 발현을 형광 현미경 검사를 사용하여 48시간 후에 모니터링하였다. Echo Revolve 현미경 검사 시스템에 의해 이미지를 촬영하고 분석하였다.

도 14는 EG10이 발현된 수용체를 정확하게 이동시키지 못한다는 것을 입증한다. 흥미롭게도, CHO 세포에서 인간 DRD1 수용체를 과발현하는 결과는 HEK 세포와 비교하여 더 심각한 것으로 보인다. EG10 작제물을 사용하면, 세포는 발현된 표적 단백질을 분해하거나 제어하기 시작하여 봉입체로서 변성 단백질의 형성을 유도한다(도 14a, 빨간색 화살표). 이러한 방식의 세포에 의한 막 단백질 발현의 제어는 불활성의 미스폴딩된 단백질 및 결과적으로 사용할 수 없고 품질이 불량한 발현된 단백질을 유도할 수 있다. 대조적으로, 표적 막 단백질과 예시적인 인핸서 단백질의 동시 발현은 막으로의 정확한 삽입 및 봉입체의 부재에 의해 알 수 있는 바와 같이 정확하게 이동된 DRD1-GFP를 유도하였다(도 14b). 본 실시예는 예시적인 표적 막 단백질(DRD1)과 함께 예시적인 인핸서 단백질(타일러 바이러스의 L-단백질)의 동시 발현이 막 단백질의 개선된 발현 및 국소화를 유도한다는 것을 입증한다. 추가로, 본 실시예는 다양한 진핵 세포 유형(예를 들어, HEK293 또는 CHO 세포)이 개시된 방법의 실시에 사용될 수 있음을 입증한다.

실시예 7: Sf9 세포에서 DRD1-GFP 발현의 생성

HEK293 대신 Sf9(Spodoptera frugiperda) 세포를 사용하여 실시예 2의 실험을 반복하였다. DRD1-GFP를 EG8 작제물 또는 산업 및 학술 표준 작제물인 EG10으로부터 발현시켰다.

DRD1-GFP 융합체를 Sf9 세포에서 발현시켰다. Sf9 세포를 6 웰 플레이트에 0.4 x 10⁶개 세포/웰로 시딩하고 RT에서 15분 동안 인큐베이션한 후, 제조사의 지침에 따라 Cellfectin Reagent II(Thermofisher)를 사용하여 EG10 또는 EG8 중 하나로 일시적으로 형질감염시켰다. DRD1-GFP 발현을 형광 현미경 검사를 사용하여 72시간 후에 모니터링하였다. Echo Revolve 현미경 검사 시스템에 의해 이미지를 촬영하고 분석하였다.

도 15는 EG10이 발현된 수용체를 정확하게 이동시키지 못할 뿐만 아니라 발현된 수용체가 세포에 대해 높은 독성이 있음을 입증한다. 발현된 유전자의 독성으로 인해 죽은 세포에서 가장 높은 형광 신호가 관찰되었다(도 15a, 빨간색 화살표). 대조적으로, 개시된 방법을 사용한 DRD1-GFP의 발현은 DRD1-GFP의 발현에 의해 유발되는 세포 독성을 방지하고 막 혼입된 수용체가 관찰된다(도 15b, 빨간색 화살표). 흥미롭게도, Sf9 세포에서 인간 DRD1 수용체의 과발현의 결과는 HEK 세포와 비교하여 더 심각한 것으로 보인다. 표준 시스템 EG10에서와 같은 조절되지 않은 발현은 높은 세포 사멸 및 결과적으로 사용할 수 없는 단백질을 유발한다. 독성 효과는 전반적인 세포 건강 및 막 결합 수용체에 의해 명백한 바와 같이 DRD1-GFP 및 EG8로부터의 L 단백질을 발현할 때 극적으로 더 약하다. 본 실시예는 예시적인 표적 막 단백질(DRD1)과 함께 예시적인 인핸서 단백질(EMCV의 L-단백질)의 동시 발현이 독성 효과의 명확하게 개선된 제어와 함께 막 단백질의 개선된 발현 및 국소화를 유도하였음을 입증한다. 추가로, 본 실시예는 개시된 방법이 다양한 진핵 세포 유형과 양립가능하다는 것을 입증한다.

실시예 8: IL2 유도성 T 세포 키나제(ITK)의 생성

ITK를 전형적으로 발현하기 어려운 가용성 단백질을 발현하기 위한 개시된 시스템의 적용을 예시하기 위해 예시적인 표적 단백질로서 사용하였다. ITK는 키나제의 TEC 패밀리의 구성원이며 T 세포에서 T 세포 증식 및 분화에 역할을 하는 것으로 여겨진다. 또한, ITK를 배치간의 효소 활성의 일관성 및 본원에 개시된 방법의 확장성을 입증하는 데 사용하였다. ITK를 3 x 10 ml, 100 ml 및 1000 ml 성장 배지에서 발현시켰다. 추가로, ITK-L-his 단백질 융합 작제물(EG9)을 사용하여 인핸서 단백질이 조절을 제어하는 능력을 잃지 않으면서 재조합으로 발현된 표적 단백질에 융합될 수 있음을 입증하였다. ITK-his 융합체를 EG17로부터, 및 비교로서 학술 및 산업 표준(EG18)으로부터 발현시켰다.

ITK-his 및 ITK-L-his 융합체를 HEK293 세포에서 발현시켰다. HEK293 세포를 10 ml, 100 ml 또는 1000 ml Expi293 배지에 2 x 10⁶개 세포/ml로 시딩하고 37℃, 120 rpm 및 5% CO₂에서 밤새 인큐베이션한 후, 상기 기재된 바와 같이 EG9, EG17 또는 EG18 중 하나로 일시적으로 형질감염시켰다. 세포를 48시간 후에 채취하고(5,000 x g, 15분, 4C), 세포 펠렛을 추가 사용시까지 -80℃에서 보관하였다.

ITK를 정제하기 위해, 세포를 용해 완충액(40 mM Tris, 7.5, 20 mM MgCl₂, 0.1 mg/ml BSA, 50 μM DTT, 2 mM MnCl₂, 프로테아제 억제제, DNAse)에 재현탁하고, 초음파 처리(2분, 10초 ON, 10초 OFF, 40% 진폭)에 의해 용해시키고, 조 세포 추출물을 제거하였다(5,000 x g, 20분, 4℃). 5 ml His-수지 컬럼(GE Healthcare HisTrap)을 세척 완충액(40 mM Tris, 7.5, 20 mM MgCl2, 0.1 mg/ml BSA, 50 μM DTT 및 2 mM MnCl2)으로 평형화시킨 후 연동 펌프를 사용하여 제거된 용해물에 로딩하였다. 로딩 후, AKTA™ 시스템(Cytiva Life Sciences(이전에 GE Healthcare))에서 정제를 수행하였다. 컬럼을 5CV 세척 완충액으로 세척한 후, 25 CV에 걸쳐 연속 구배 0-100% 용출 완충액(세척 완충액 + 300 mM 이미다졸)으로 용출시켰다. 단백질 함유 분획을 SDS-PAGE(6-12% BOLT, ThermoFisher)에 의해 분석하고 단백질 함유 분획을 모아 농축하였다.

단백질을 SEC 완충액(40 mM Tris, 7.5; 20 mM MgCl₂, 150 mM NaCl)을 사용하여 크기 배제 크로마토그래피(SEC)(Superdex 200, ThermoFisher)에 의해 추가로 정제하고, 분획을 SDS-PAGE(6-12% BOLT, ThermoFisher)에 의해 분석하였다. 단백질 함유 분획을 이들의 외관에 따라 모으고 제조사의 지침에 따라 ADP-Glo^TM 분석(Promega)과 조합하여 ITK 키나제 효소 시스템을 사용하여 활성에 대해 분석하였다. 요컨대, EG17 및 EG18로부터 발현된 전장 ITK를 200 ng, 100 ng, 50 ng 및 0 ng의 총 효소 농도로 분석에 사용하였다. 기질 PolyE4Y1을 0.2 μg/μl의 농도로 사용하였고, ATP를 25 μM로 반응에 첨가하였다. 96 웰 플레이트에서, 5 μl 반응 완충액(키트와 함께 제공됨)을 10 μl의 효소 희석액 및 10 μl의 ATP/PolyE4Y1 혼합물과 조합하였다. 플레이트를 실온에서 60분 동안 인큐베이션하였다. 25 μl ADP-Glo 시약을 첨가하고 플레이트를 다시 실온에서 40분 동안 인큐베이션하였다. 50 μl 키나제 검출 시약을 첨가하고 실온에서 추가로 30분 동안 인큐베이션하여 반응을 중단시켰다. 반응을 1초의 노출 시간(integration time)으로 발광에 의해 판독하였다.

도 16은 ITK 단백질 및 인핸서 단백질 L과 융합된 ITK 단백질에 대한 정제 과정을 보여준다. SEC를 사용하여 정제하는 동안, 두 개의 피크(P1 및 P2)가 웨스턴 블롯에 의해 단량체(P2) 및 이량체(P1) 종으로 식별될 수 있는 표적 단백질로 식별될 수 있었다(데이터는 표시되지 않음). 이론에 얽매이지 않고, ITK는 활성 형태를 달성하기 위해 이량체를 형성할 필요가 있다고 여겨진다. ITK는 과발현될 때 세포에 독성이 있는 알려진 키나제이다. 따라서, ITK의 활성이 높을수록 발현은 숙주 세포에 의해 더 하향 조절되거나 단량체성 불활성 형태로 될 것이다.

도 17a는 식별된 종의 정제의 최종 SDS-PAGE를 보여준다. P1 종만이 활성이므로 ITK와 조합된 인핸서 단백질의 발현은 활성 ITK 종의 발현을 크게 증가시킨다는 점에 유의한다. 도 17b는 1차 판독으로서 발광의 사용에 의한 활성의 차이를 입증한다. EG17로부터 발현된 P1만이 높은 활성을 나타내므로 이 키나제에 대한 약물 스크리닝에 유일하게 사용가능한 단백질이다. 두 시스템은 유사한 양의 관심 단백질을 발현하는 것으로 보이지만, 본원에 개시된 방법을 사용하여 발현된 ITK는 인핸서 단백질의 부재 하에 발현된 ITK 단백질보다 더 많은 활성을 나타낸다. 본 실시예는 본원에 개시된 방법이 그렇지 않으면 독성이거나 숙주 세포에 의해 불활성화될 활성 단백질을 생성하는 데 사용될 수 있음을 입증한다. 또한, 개시된 방법은 그렇지 않으면 독성일 활성 단백질을 생성하는 데 사용될 수 있을 뿐만 아니라 이러한 단백질은 새로운 치료제를 발견하기 위한 소분자 스크리닝과 같은 약물 스크리닝에 사용될 수 있다.

실시예 9: CHO-K1 세포에서 IL2 유도성 T 세포 키나제(ITK)의 생성

HEK293 대신에 CHO 세포를 사용하여 실시예 8의 실험을 반복하였다. ITK-his를 EG17, 또는 대조군 작제물인 EG18로부터 발현시켰다.

ITK-his 융합체를 CHO-K1 세포에서 발현시켰다. CHO-K1 세포의 각 작제물의 총 8개의 150 mm 플레이트를 디쉬당 5 x 10⁶개 세포로 시딩하고 37℃ 및 5% CO₂에서 밤새 배양한 후, 제조사의 지침에 따라 Lipofectamine 3000(Thermofisher)을 사용하여 EG17 또는 EG18 중 하나로 일시적으로 형질감염시켰다. 48시간 후에 세포를 긁어내고 스핀 다운시켜 상층액을 제거하였다(5,000 xg, 15분, 4C). 세포 펠렛을 추가 사용시까지 -80℃에서 보관하였다. ITK를 정제하기 위해, 세포를 용해 완충액(40 mM Tris, 7.5, 20 mM MgCl₂, 0.1 mg/ml BSA, 50 μM DTT, 2 mM MnCl₂, 프로테아제 억제제, DNAse)에 재현탁하고, 초음파 처리(2분, 10초 ON, 10초 OFF, 40% 진폭)에 의해 용해시키고, 조 세포 추출물을 제거하였다(5,000 x g, 20분, 4℃). 5 ml His-수지 컬럼(GE Healthcare HisTrap)을 세척 완충액(40 mM Tris, 7.5, 20 mM MgCl2, 0.1 mg/ml BSA, 50 μM DTT 및 2 mM MnCl2)으로 평형화한 후 연동 펌프를 사용하여 제거된 용해물에 로딩하였다. 로딩 후, AEKTA 시스템에서 정제를 수행하였다. 컬럼을 5CV 세척 완충액으로 세척한 후 20 CV에 걸쳐 연속 구배 0-75% 용출 완충액(세척 완충액 + 300 mM 이미다졸)으로 용출시켰다. 용출을 5 CV 100% 용출 완충액에 의해 완료하였다.

단백질 함유 분획을 SDS-PAGE(6-12% SurePAGE, Bis-Tris, GenScript)에 의해 분석하고 단백질 함유 분획을 모아 농축하였다. 단백질을 SEC 완충액(40 mM Tris, 7.5; 20 mM MgCl₂, 150 mM NaCl)을 사용한 크기 배제 크로마토그래피(SEC)(Superdex 200, ThermoFisher)에 의해 추가로 정제하고, 분획을 SDS-PAGE(6-12% SurePAGE, Bis-Tris, GenScript)에 의해 분석하였다. 단백질 함유 분획을 외관에 따라 모으고 제조사의 지침에 따라 ADP-Glo Assay™(Promega)와 조합된 ITK 키나제 효소 시스템을 사용하여 활성에 대해 분석하였다.

Sf9 곤충 세포에서 발현되는 △ITK를 표준으로 사용하였다. △ITK뿐만 아니라 EG17 및 EG18로부터 발현된 전장 ITK를 200 ng, 100 ng, 50 ng 및 0 ng의 총 효소 농도로 사용하였다. 기질 PolyE4Y1을 0.2 μg/μl의 농도로 사용하였고, ATP를 25 μM으로 반응에 첨가하였다. 96 웰 플레이트에서, 5 μl 반응 완충액(키트와 함께 제공됨)을 10 μl의 효소 희석액 및 10 μl의 ATP/PolyE4Y1 혼합물과 조합하였다. 플레이트를 실온에서 60분 동안 인큐베이션하였다. 25 μl ADP-Glo 시약을 첨가하고 플레이트를 다시 실온에서 40분 동안 인큐베이션하였다. 50 μl 키나제 검출 시약을 첨가하고 실온에서 추가로 30분 동안 인큐베이션하여 반응을 중단시켰다. 반응을 1초의 노출 시간으로 발광에 의해 판독하였다.

도 18은 인핸서 단백질 L과 함께 또는 없이 발현된 ITK의 정제 과정을 나타낸다. 상기 언급된 바와 같이, SEC를 사용한 정제 동안, 2개의 피크(P1 및 P2)가 표적 단백질로서 식별될 수 있었다. 이론에 얽매이지 않고, ITK는 활성 형태를 달성하기 위해 이량체를 형성할 필요가 있다고 여겨진다. ITK는 과발현될 때 세포에 독성이 있는 알려진 키나제이다. 따라서, ITK의 활성이 높을수록 발현은 숙주 세포에 의해 더 하향 조절되거나 단량체성 불활성 형태로 될 것이다.

도 19는 1차 판독으로서 발광의 사용에 의한 활성의 차이를 입증한다. EG17로부터 발현된 P1만이 제공된 △ITK 양성 대조군과 양립가능한 활성을 입증한다. 두 시스템은 유사한 양의 관심 단백질을 발현하는 것으로 보이지만, 제시된 시스템만이 숙주 세포의 조절을 제어하여 활성 단백질 생성을 달성한다. 본 실시예는 본원에 개시된 방법이 그렇지 않으면 독성이거나 숙주 세포에 의해 불활성화될 활성 단백질을 생성하는 데 사용될 수 있음을 입증한다.

실시예 10: Sf9 세포에서 IL2 유도성 T 세포 키나제(ITK)의 생성

HEK293 대신에 Sf9 세포를 사용하여 실시예 8을 반복한다. ITK-his는 EG17 작제물로부터 또는 산업 및 학술 표준 EG18 작제물로부터 발현된다. Sf9 세포에서의 발현을 실시예 7에 기술된 바와 같이 수행하고, His-태그된 ITK 단백질의 단백질 정제를 실시예 8 및 9에 기술된 바와 같이 수행한다.

실시예 11: 낭포성 섬유증 막관통 전도도 조절자(CFTR)의 발현

인핸서 단백질로서의 기공 차단 단백질과 조합된 표적 단백질로서의 막 단백질의 동시 발현이 고밀도 활성 이온 채널을 생성하였음을 입증하기 위해 CFTR을 추가 예로 사용하였다. CFTR은 클로라이드 이온을 상피 세포막을 가로질러 전도하는 ABC-수송체 클래스의 막관통 수송체이다. CFTR은 학술 표준(EG24)을 사용할 때 이질적인 방식으로 발현되는 것으로 알려져 있다. 이질성은 ABC 수송체를 정제하거나 분석하는 어려움을 증가시킨다. 균질성 개선을 입증하기 위해, CFTR을 예시적인 시스템(EG25)의 백본 내로 클로닝하거나 PCR 산물로서 사용하였다. 비교로서, 학술 표준(EG24)을 대조군으로 함께 사용하였다.

CFTR 작제물을 HEK293 세포에서 발현시켰다. HEK293 세포를 6 웰 플레이트에 0.3 x 10⁶개 세포/웰로 시딩하고 37℃ 및 5% CO₂에서 밤새 인큐베이션한 후, EG25 삽입물의 PCR 산물인 EG25 또는 상기 기재된 바와 같은 EG24 중 하나로 일시적으로 형질감염시켰다. CFTR 발현을 현미경 검사를 사용하여 24시간 및 48시간 후에 모니터링하였다. 세포를 채취하고 48시간 후에 RIPA(Radio-Immunoprecipitation Assay) 완충액(CellGene)을 사용하여 용해시켰다. 용해물을 제거하고 SDS-PAGE(6-12% BOLT, ThermoFisher)에 이어 항-CFTR(Abcam, 2차 항체 - 항-마우스-HRP)을 사용한 웨스턴 블롯(Nitrocellulose membrane, ThermoFisher)에 의해 분석하였다.

도 7은 L-단백질과 CFTR의 동시 발현의 영향을 입증한다. 학술 표준은 웨스턴 블롯에서 넓은 밴드를 생성한 반면, EG25 작제물을 기반으로 하는 전사 및 번역은 ABC-수송체의 매우 균질한 발현을 입증하는 윤곽이 뚜렷한 밴드를 생성하였다. 또한, 이 실시예는 발현 시스템이 벡터로서 또는 PCR 산물로서 세포 내로 전달될 수 있음을 입증한다.

실시예 12: NADase의 발현

발현하기 어려운 독성 용해성 단백질을 위한 개시된 시스템의 적용을 예시하기 위해 예시적인 표적 단백질로서 NADase를 사용하였다. NADase는 NAD+로부터 ADP-리보스 및 니코틴아미드로의 반응을 촉매하는 효소 단백질이다. NADase의 과발현은 일반적으로 세포가 그의 자연 에너지원인 NAD+로부터 제거된다는 사실로 인해 증가된 세포 사멸로 이어진다. 본 발명의 시스템이 높은 수율의 활성 NADase를 생성할 수 있음을 입증하기 위해, NADase-Flag 융합체를 예시적인 시스템(EG13)의 백본 내로 클로닝하였다.

NADase-flag 작제물을 HEK293 세포에서 발현시켰다. HEK293 세포를 T225 플라스크에 5 x 10⁶개 세포로 시딩하고 37℃ 및 5% CO₂에서 밤새 인큐베이션한 후, 상기 기재된 바와 같이 EG13으로 일시적으로 형질감염시켰다. NADase-flag 발현을 현미경 검사를 사용하여 24시간 및 48시간 후에 모니터링하였다. 세포를 37℃에서 5분 동안 0.5% 트립신 용액을 사용하여 떼어내고 긁어내어 48시간 후에 채취하였다. 세포를 펠렛화하고(5,000 x g, 15분, 4℃) 상층액을 버렸다. 세포 펠렛을 추가 사용시까지 -80℃에서 보관하였다. NADase-flag를 정제하기 위해, 세포를 용해 완충액(50 mM NaHPO4 pH 8.0, 300 mM NaCl, 0.01% Tween20, 프로테아제 억제제, DNAse)에 재현탁하고 초음파 처리(2분, 10초 ON, 10초 OFF, 40% 진폭)에 의해 용해시키고, 조 세포 추출물을 제거하였다(100,000 x g, 45분, 4℃). ANTI-FLAG M2 친화성 겔(Sigma)을 세척 완충액(50 mM NaHPO4 pH 8.0, 300 mM NaCl, 0.01% Tween20)으로 평형화시킨 후 제거된 용해물에 첨가하였다. 용해물을 진탕하면서 4℃에서 2시간 동안 수지와 함께 인큐베이션하였다. 수지를 침전시키고 5 CV 세척 완충액으로 세척하고 단백질을 스핀 컬럼을 사용하여 4x 1 CV 용출 완충액(세척 완충액 + 0.2 mg/ml 3x Flag-펩타이드(Sigma))으로 용출시켰다. 정제를 SDS-PAGE(6-12% BOLT, ThermoFisher)에 의해 분석하고(도 8a), 단백질 함유 분획을 모았다. 단백질 농도를 A280(NanoDrop One, FisherScientific)을 사용하여 측정하였다. 단백질 수율은 26 mg/L 발현 배지인 것으로 결정되었다. NADase의 활성을 HPLC에 의해 NAD+에서 ADP-리보스로의 전환율을 분석하여 시험하였다(도 8b).

실시예 13: 분비된 단백질, C1 에스테라제 억제제(C1-Inh)의 생성

정확한 번역 후 변형으로 분비된 단백질을 발현하기 위한 개시된 방법의 적용을 예시하기 위해 예시적인 표적 단백질로서 C1-Inh를 사용하였다. C1-Inh는 세르핀(serpin) 슈퍼패밀리에 속하는 프로테아제 억제제이다. 분비된 단백질로서, C1-Inh는 고도로 글리코실화되어 있으므로 재조합 발현하기 어려운 표적임을 입증한다. C1-Inh-myc-flag 융합 단백질을 별도의 작제물로부터 발현된 EMCV로부터의 L 단백질의 존재 또는 부재 하에 발현시켰다. 본 실시예에서 EMCV로부터의 L-단백질을 CMV 프로모터의 제어 하에 별도의 작제물로부터 동시 발현시켰다.

C1-Inh-Myc-Flag 융합체를 HEK293 세포에서 발현시켰다. HEK293 세포를 100 ml 진탕 플라스크에 1.75 x 10⁶개/ml 세포로 시딩하고 37℃, 5% CO₂ 및 120 rpm에서 밤새 인큐베이션한 후, 당업계에 공지되어 있고/있거나 본원에 개시된 방법을 사용한 현탁 세포의 형질감염에 의해 단독 또는 EG11과 조합된 C1-Inh를 코딩하는 벡터(OriGene; CAT#: RC203767)로 일시적으로 형질감염시켰다. 발현된 재조합 C1-Inh 단백질을 함유하는 상층액을 72시간 후에 채취하고, 상층액을 원심분리 후 여과(22 um, 니트로셀룰로오스)하여 제거하였다. C1-Inh를 정제하기 위해, 항-Flag 수지(ANTI-FLAG M2 Affinity Gel, Millipore Sigma)를 20 mM Tris pH 7.5, 50 mM NaCl로 평형화한 후, 상층액에 첨가하였다. 상층액을 진탕하면서 4℃에서 2시간 동안 수지와 함께 인큐베이션하였다. 수지를 침전시키고 5 CV 20 mM Tris pH 7.5, 50 mM NaCl로 세척하고 단백질을 4 CV 20 mM Tris pH 7.5, 50 mM NaCl, 0.2 mg/ml 3x 플래그 펩타이드로 용출시켰다. 정제를 SDS-PAGE(SurePAGE, Bis-Tris, GenScript)에 의해 분석하고 단백질 함유 분획을 모았다. 단백질 농도를 제조사의 지침에 따라 BCA 분석(ThermoFisher)에 의해 분석하고 정규화된 C1-Inh를 제조사의 지침에 따라 면역분석(MicroVue C1-Inihibitor Plus EIA, Quidel)을 사용하여 활성에 대해 시험하였다.

도 20a는 인핸서 단백질의 부재(좌) 및 존재(우) 하에 C1-억제제의 정제를 나타낸다. 생성된 C1-억제제의 총량은 인핸서 단백질의 존재 하에 >30%만큼 증가한다. 도 20b는 정제된 샘플 내에서 활성 C1-억제제의 총량의 개선을 입증한다. 활성 분석을 위해, 단백질 농도를 정규화한 후, 활성 C1-억제제에 대해 시험하였다. 활성 C1-억제제의 양은 GOI와 동시에 인핸서 단백질을 동시 발현함으로써 >10%만큼 증가할 수 있다. 이들 결과는 본원에 개시된 방법이 C1-억제제와 같은 분비된 표적 단백질의 더 높은 수율 및 개선된 활성을 유도한다는 것을 입증한다.

실시예 14: 분비된 단백질, 임신 특이적 당단백질 1(PSG1)의 생성

정확한 번역 후 변형으로 분비된 단백질을 발현하기 위한 개시된 방법의 적용을 예시하기 위해 예시적인 표적 단백질로서 PSG1을 사용하였다. PSG1은 암배아 항원 슈퍼패밀리 내의 인간 PSG 패밀리의 고도로 글리코실화된 분비된 단백질이다. PSG1은 임신 중 모체 혈액에서 발견되는 가장 풍부한 태아 단백질 중 하나이다. PSG1은 대식세포, 단핵구 및 영양막(trophoblast)에서 TGF-베타를 상향 조절함으로써 면역조절제 역할을 하는 것으로 나타났다. 또한, PSG1은 인간 단핵구에서 항염증성 사이토카인 IL-10 및 IL-6의 분비를 유도하는 것으로 나타났다. 이러한 기능은 PSG1을 매력적인 약제학적 타겟으로 만들었다. PSG1 발현 동안의 어려운 점은 비인간 세포를 사용하는 동안 재현할 수 없는 올바른 글리코실화 패턴이다. 본 실시예에서, EMCV로부터의 L-단백질을 CMV 프로모터의 제어 하에 PSG1과 동시 발현시켰다.

PSG1을 HEK293 세포에서 발현시켰다. HEK293 세포를 100 ml 진탕 플라스크에 1.75 x 10⁶개/ml 세포로 시딩하고 37℃, 5% CO₂ 및 120 rpm에서 밤새 인큐베이션한 후, EMCV로부터의 L-단백질과 함께 PSG1을 코딩하는 벡터로 일시적으로 형질감염시켰다. 발현된 재조합 PSG1 단백질을 함유하는 상층액을 72시간 후에 채취하고, 상층액을 원심분리에 이어 여과(22 um, 니트로셀룰로오스)하여 제거하였다. PSG1을 정제하기 위해, HiTrap™ DEAE Sepharose Fast Flow IEX 컬럼(Cytiva(이전에 GE Healthcare Life Sciences))을 세척 완충액(10 mM Tris pH 7.6)으로 평형화한 다음, 연동 펌프를 사용하여 상층액을 컬럼에 로딩하였다. 로딩 후, AKTA™ 시스템(Cytiva Life Sciences(이전에 GE Healthcare))에서 정제를 수행하였다. 컬럼을 5 CV 세척 완충액으로 세척한 후, 다단계 구배 10%, 20%, 30%, 50% 및 100% 용출 완충액(세척 완충액 + 200 mM NaCl)으로 용출하였다. 단백질 함유 분획을 모으고, 농축하고, 항-PSG1(Invitrogen, 2차 항체 - 항-토끼-HRP)을 사용하여 SDS-PAGE(6-12% BOLT, ThermoFisher) 및 웨스턴 블롯(Nitrocellulose membrane, ThermoFisher)에 의해 분석하였다.

도 21은 PSG1의 이온 교환 크로마토그래피(좌측)를 나타낸다. 단백질 함유 분획(도 21a, 빨간색 상자)을 모으고 농축한 후, SDS-PAGE 및 웨스턴 블롯(도 21b, 빨간색 화살표)에 의해 PSG1의 존재 및 신원을 확인하였다.

추가 번호의 구현예

본 발명의 추가 구현예는 하기 번호의 구현예에서 제공된다:

구현예 1. 하나 이상의 벡터를 포함하는, 진핵 세포 내 표적 단백질의 재조합 발현을 위한 시스템으로서, 하나 이상의 벡터는:

a. 표적 단백질을 코딩하는 제1 폴리뉴클레오타이드; 및

b. 인핸서 단백질을 코딩하는 제2 폴리뉴클레오타이드로서,

i. 인핸서 단백질은 핵세포질 수송(nucleocytoplasmic transport, NCT)의 억제제이고/이거나

ii. 인핸서 단백질은 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 단순 포진 바이러스(HSV) ICP27 단백질, 및 랍도바이러스 기질(M) 단백질로 이루어진 군으로부터 선택되는 것인 제2 폴리뉴클레오타이드

를 포함하고,

제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드는 하나 이상의 프로모터에 작동가능하게 연결되는 것인 시스템.

구현예 2. 구현예 1에 있어서, 인핸서 단백질은 핵세포질 수송(NCT)의 억제제인 시스템.

구현예 3. 구현예 2에 있어서, NCT 억제제는 바이러스 단백질인 시스템.

구현예 4. 구현예 1 내지 3 중 어느 한 구현예에 있어서, NCT 억제제는 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 코로나바이러스 ORF6 단백질, 에볼라바이러스 VP24 단백질, 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질, 단순 포진 바이러스(HSV) ICP27 단백질 및 랍도바이러스 기질(M) 단백질로 이루어진 군으로부터 선택되는 것인 시스템.

구현예 5. 구현예 4에 있어서, NCT 억제제는 피코르나바이러스 리더(L) 단백질 또는 그의 기능적 변이체인 시스템.

구현예 6. 구현예 4에 있어서, NCT 억제제는 피코르나바이러스 2A 프로테아제 또는 그의 기능적 변이체인 시스템.

구현예 7. 구현예 4에 있어서, NCT 억제제는 라이노바이러스 3C 프로테아제 또는 그의 기능적 변이체인 시스템.

구현예 8. 구현예 4에 있어서, NCT 억제제는 코로나바이러스 ORF6 단백질 또는 그의 기능적 변이체인 시스템.

구현예 9. 구현예 4에 있어서, NCT 억제제는 에볼라바이러스 VP24 단백질 또는 그의 기능적 변이체인 시스템.

구현예 10. 구현예 4에 있어서, NCT 억제제는 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질 또는 그의 기능적 변이체인 시스템.

구현예 11. 구현예 4에 있어서, NCT 억제제는 단순 포진 바이러스(HSV) ICP27 단백질 또는 그의 기능적 변이체인 시스템.

구현예 12. 구현예 4에 있어서, NCT 억제제는 랍도바이러스 기질(M) 단백질 또는 그의 기능적 변이체인 시스템.

구현예 13. 구현예 5에 있어서, L 단백질은 타일러 바이러스의 L 단백질 또는 그의 기능적 변이체인 시스템.

구현예 14. 구현예 5에 있어서, L 단백질은 서열번호: 1과 적어도 90% 동일성을 공유하는 것인 시스템.

구현예 15. 구현예 5에 있어서, L 단백질은 뇌심근염 바이러스(EMCV)의 L 단백질 또는 그의 기능적 변이체인 시스템.

구현예 16. 구현예 5에 있어서, L 단백질은 서열번호: 2와 적어도 90% 동일성을 공유하는 것인 시스템.

구현예 17. 구현예 5에 있어서, L 단백질은 폴리오바이러스의 L 단백질, HRV16의 L 단백질, 멩고 바이러스의 L 단백질, 및 사폴드 바이러스 2의 L 단백질 또는 그의 기능적 변이체로 이루어진 군으로부터 선택되는 것인 시스템.

구현예 18. 구현예 1 내지 구현예 17 중 어느 한 구현예에 있어서, 시스템은 발현 카세트를 포함하는 단일 벡터를 포함하고, 발현 카세트는 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드를 포함하는 것인 시스템.

구현예 19. 구현예 18에 있어서, 발현 카세트는 제1 폴리뉴클레오타이드에 작동가능하게 연결된 제1 프로모터; 및 제2 폴리뉴클레오타이드에 작동가능하게 연결된 제2 프로모터를 포함하는 것인 시스템.

구현예 20. 구현예 18에 있어서, 발현 카세트는 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드 모두에 작동가능하게 연결된 공유 프로모터를 포함하는 것인 시스템.

구현예 21. 구현예 20에 있어서, 발현 카세트는 리보솜 스키핑 부위(ribosome skipping site)를 코딩하는 폴리뉴클레오타이드에 의해 연결된 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드를 포함하는 코딩 폴리뉴클레오타이드를 포함하고, 코딩 폴리뉴클레오타이드는 공유 프로모터에 작동가능하게 연결된 것인 시스템.

구현예 22. 구현예 20에 있어서, 발현 카세트는 코딩 폴리뉴클레오타이드를 포함하고, 코딩 폴리뉴클레오타이드는 리보솜 스키핑 부위에 의해 연결된 인핸서 단백질 및 표적 단백질을 코딩하며, 코딩 폴리뉴클레오타이드는 공유 프로모터에 작동가능하게 연결된 것인 시스템.

구현예 23. 구현예 18 내지 22 중 어느 한 구현예에 있어서, 발현 카세트는 리보솜 스키핑 부위에 의해 연결된 표적 단백질 및 인핸서 단백질 모두를 코딩하는 단일 메신저 RNA의 전사를 위해 구성되고; 메신저 RNA의 번역은 별개의 폴리펩타이드로서 표적 단백질 및 L 단백질의 발현을 유도하는 것인 시스템.

구현예 24. 구현예 1 내지 구현예 23 중 어느 한 구현예에 있어서, 시스템은 하나의 벡터를 포함하는 것인 시스템.

구현예 25. 구현예 1 내지 구현예 17 중 어느 한 구현예에 있어서, 시스템은

a. 제1 프로모터에 작동가능하게 연결된 제1 폴리뉴클레오타이드를 포함하는 제1 벡터; 및

b. 제2 프로모터에 작동가능하게 연결된 제2 폴리뉴클레오타이드를 포함하는 제2 벡터

를 포함하는 것인 시스템.

구현예 26. 구현예 1 내지 구현예 17 또는 구현예 25 중 어느 한 구현예에 있어서, 시스템은 2개의 벡터를 포함하는 것인 시스템.

구현예 27. 구현예 1 내지 구현예 26 중 어느 한 구현예에 있어서, 제1 폴리뉴클레오타이드 또는 제2 폴리뉴클레오타이드, 또는 둘 모두는 내부 리보솜 진입 부위(IRES)에 작동가능하게 연결된 것인 시스템.

구현예 28. 구현예 1 내지 구현예 27 중 어느 한 구현예에 있어서, 하나 이상의 벡터 중 적어도 하나는 T7 RNA 중합효소에 의한 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드 중 어느 하나 또는 둘 모두의 전사를 위해 구성된 T7 프로모터를 포함하는 것인 시스템.

구현예 29. 구현예 1 내지 구현예 28 중 어느 한 구현예에 있어서, 하나 이상의 벡터 중 적어도 하나는 T7 RNA 중합효소를 코딩하는 폴리뉴클레오타이드 서열을 포함하는 것인 시스템.

구현예 30. a. 표적 단백질을 코딩하는 제1 폴리뉴클레오타이드; 및

b. 인핸서 단백질을 코딩하는 제2 폴리뉴클레오타이드로서,

i. 인핸서 단백질은 핵세포질 수송(NCT)의 억제제이고/이거나

ii. 인핸서 단백질은 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 코로나바이러스 ORF6 단백질, 에볼라바이러스 VP24 단백질, 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질, 단순 포진 바이러스(HSV) ICP27 단백질, 및 랍도바이러스 기질(M) 단백질로 이루어진 군으로부터 선택되는 것인 제2 폴리뉴클레오타이드

를 포함하는, 진핵 세포 내 표적 단백질의 재조합 발현을 위한 벡터로서,

제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드는 적어도 하나의 프로모터에 작동가능하게 연결된 것인 벡터.

구현예 31. 구현예 30에 있어서, 발현 카세트는 제1 폴리뉴클레오타이드에 작동가능하게 연결된 제1 프로모터; 및 제2 폴리뉴클레오타이드에 작동가능하게 연결된 제2 프로모터를 포함하는 것인 벡터.

구현예 32. 구현예 30에 있어서, 발현 카세트는 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드 모두에 작동가능하게 연결된 공유 프로모터를 포함하는 것인 벡터.

구현예 33. 인핸서 단백질을 코딩하는 외인성 폴리뉴클레오타이드를 포함하는 표적 단백질의 발현을 위한 진핵 세포로서,

a. 인핸서 단백질은 핵세포질 수송(NCT)의 억제제이고/이거나

b. 인핸서 단백질은 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 코로나바이러스 ORF6 단백질, 에볼라바이러스 VP24 단백질, 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질, 단순 포진 바이러스(HSV) ICP27 단백질 및 랍도바이러스 기질(M) 단백질로 이루어진 군으로부터 선택되고,

외인성 폴리뉴클레오타이드는 프로모터에 작동가능하게 연결된 것인 진핵 세포.

구현예 34. 구현예 33에 있어서, 폴리뉴클레오타이드는 내부 리보솜 진입 부위(IRES)에 작동가능하게 연결된 것인 진핵 세포.

구현예 35. 구현예 33 또는 구현예 34에 있어서, 프로모터는 유도성 프로모터인 진핵 세포.

구현예 36. 프로모터에 작동가능하게 연결된 표적 단백질을 코딩하는 폴리뉴클레오타이드를 구현예 33 내지 35 중 어느 한 구현예의 세포 내로 도입하는 단계를 포함하는, 표적 단백질의 재조합 발현 방법.

구현예 37. 구현예 1 내지 구현예 29 중 어느 한 구현예의 시스템 또는 구현예 30 내지 구현예 32 중 어느 한 구현예의 벡터를 진핵 세포 내로 도입하는 단계를 포함하는, 표적 단백질의 재조합 발현 방법.

구현예 38. 구현예 36 또는 구현예 37에 있어서, 표적 단백질은 막 단백질인 방법.

구현예 39. 구현예 38에 있어서, 막 단백질의 세포막으로의 국소화는 막 단백질이 인핸서 단백질 없이 발현될 때 관찰된 국소화와 비교하여 증가되는 것인 방법.

구현예 40. 구현예 1 내지 구현예 29 중 어느 한 구현예의 시스템, 또는 구현예 30 내지 32 중 어느 한 구현예의 벡터를 진핵 세포 내로 도입함으로써 생성된 진핵 세포.

구현예 41. 구현예 1 내지 구현예 29 중 어느 한 구현예의 시스템 또는 구현예 30 내지 구현예 32 중 어느 한 구현예의 벡터를 진핵 세포 내로 도입함으로써 발현되는 표적 단백질.

구현예 42. 표적 단백질을 코딩하는, 프로모터에 작동가능하게 연결된 폴리뉴클레오타이드를 진핵 세포 내로 도입하는 단계를 포함하는, 진핵 세포 내 표적 단백질을 발현시키는 방법으로서, 방법은 표적 단백질의 발현 수준, 용해도 및/또는 활성을 향상시키기 위해 인핸서 단백질의 동시 발현을 이용하며, (a) 인핸서 단백질은 핵세포질 수송(NCT)의 억제제이고/이거나 (b) 인핸서 단백질은 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 코로나바이러스 ORF6 단백질, 에볼라바이러스 VP24 단백질, 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질, 단순 포진 바이러스(HSV) ICP27 단백질 및 랍도바이러스 기질(M) 단백질로 이루어진 군으로부터 선택되는 것인 방법.

구현예 43. 구현예 42에 있어서, 인핸서 단백질의 동시 발현은 프로모터에 작동가능하게 연결된 인핸서 단백질을 코딩하는 폴리뉴클레오타이드를 진핵 세포 내로 도입하는 것을 포함하는 것인 방법.

구현예 44. 구현예 42 또는 구현예 43에 있어서, 도입 단계(들)는 하나 이상의 DNA 분자를 이용한 진핵 세포의 형질감염, 단일 바이러스 벡터를 이용한 진핵 세포의 형질도입, 및/또는 2개의 바이러스 벡터를 이용한 진핵 세포의 형질도입을 포함하는 것인 방법.

구현예 45. 구현예 1 내지 구현예 29, 구현예 30 내지 구현예 32, 구현예 33 내지 35, 구현예 36 내지 39 및 42-44, 구현예 40, 및 구현예 41 중 어느 한 구현예에 있어서, 표적 단백질은 가용성 단백질인 시스템, 벡터, 진핵 세포, 방법, 진핵 세포, 및 표적 단백질.

구현예 46. 구현예 1 내지 구현예 29, 구현예 30 내지 구현예 32, 구현예 33 내지 35, 또는 구현예 36 내지 44 중 어느 한 구현예에 있어서, 표적 단백질은 분비 단백질인 시스템, 벡터, 세포, 또는 방법.

구현예 47. 구현예 1 내지 구현예 29, 구현예 30 내지 구현예 32, 구현예 33 내지 35, 구현예 36 내지 39 및 42-44, 구현예 40, 및 구현예 41 중 어느 한 구현예에 있어서, 표적 단백질은 막 단백질인 시스템, 벡터, 진핵 세포, 방법, 진핵 세포, 및 표적 단백질.

구현예 48. 구현예 1 내지 구현예 29, 구현예 30 내지 구현예 32, 구현예 33 내지 35, 구현예 36 내지 39 및 42-44, 구현예 40, 및 구현예 41 중 어느 한 구현예에 있어서, 표적 단백질은 도파민 수용체 1(DRD1)이고, 선택적으로 DRD1은 서열번호: 19의 아미노산 서열과 적어도 90% 동일성을 갖는 아미노산 서열을 포함하는 것인 시스템, 벡터, 진핵 세포, 방법, 진핵 세포, 및 표적 단백질.

구현예 49. 구현예 1 내지 구현예 29, 구현예 30 내지 구현예 32, 구현예 33 내지 35, 구현예 36 내지 39 및 42-44, 구현예 40, 및 구현예 41 중 어느 한 구현예에 있어서, 표적 단백질은 낭포성 섬유증 막관통 전도도 조절자(Cystic fibrosis transmembrane conductance regulator, CFTR)이고, 선택적으로 CFTR은 서열번호: 18의 아미노산 서열과 적어도 90% 동일성을 갖는 아미노산 서열을 포함하는 것인 시스템, 벡터, 진핵 세포, 방법, 진핵 세포, 및 표적 단백질.

구현예 50. 구현예 1 내지 구현예 29, 구현예 30 내지 구현예 32, 구현예 33 내지 35, 구현예 36 내지 39 및 42-44, 구현예 40, 및 구현예 41 중 어느 한 구현예에 있어서, 표적 단백질은 C1 에스테라제 억제제(C1-Inh)이고, 선택적으로 C1-Inh는 서열번호: 16의 아미노산 서열과 적어도 90% 동일성을 갖는 아미노산 서열을 포함하는 것인 시스템, 벡터, 진핵 세포, 방법, 진핵 세포, 및 표적 단백질.

구현예 51. 구현예 1 내지 구현예 29, 구현예 30 내지 구현예 32, 구현예 33 내지 35, 구현예 36 내지 39 및 42-44, 구현예 40, 및 구현예 41 중 어느 한 구현예에 있어서, 표적 단백질은 ITK이고, 선택적으로 ITK는 서열번호: 15의 아미노산 서열과 적어도 90% 동일성을 갖는 아미노산 서열을 포함하는 것인 시스템, 벡터, 진핵 세포, 방법, 진핵 세포, 및 표적 단백질.

구현예 52. 구현예 1 내지 구현예 29, 구현예 30 내지 구현예 32, 구현예 33 내지 35, 구현예 36 내지 39 및 42-44, 구현예 40, 및 구현예 41 중 어느 한 구현예에 있어서, 표적 단백질은 NADase이고, 선택적으로 NADase는 서열번호: 20의 아미노산 서열과 적어도 90% 동일성을 갖는 아미노산 서열을 포함하는 것인 시스템, 벡터, 진핵 세포, 방법, 진핵 세포, 및 표적 단백질.

구현예 53. 구현예 33 내지 35 중 어느 한 구현예의 세포, 구현예 40의 세포, 또는 구현예 41의 표적 단백질로 대상체를 면역화하는 단계를 포함하는, 표적 단백질에 대한 항체를 생성하는 방법.

구현예 54. 구현예 53에 있어서, 표적 단백질에 특이적인 면역글로불린 단백질을 발현하는 하나 이상의 면역 세포를 단리하는 단계를 추가로 포함하는 방법.

구현예 55. 구현예 53 또는 구현예 54에 있어서, 하나 이상의 면역 세포로부터 하나 이상의 하이브리도마를 생성하는 단계를 포함하는 방법.

구현예 56. 구현예 53 내지 55 중 어느 한 구현예에 있어서, 하나 이상의 면역 세포로부터의 하나 이상의 면역글로불린 유전자를 클로닝하는 단계를 포함하는 방법.

구현예 57. a. 구현예 33 내지 35 중 어느 한 구현예의 세포, 구현예 40의 진핵 세포, 또는 구현예 41의 표적 단백질로서, 세포 또는 표적 단백질은 표지된 것인 세포, 진핵 세포 또는 표적 단백질, 및

b. 재조합 세포의 집단으로서, 재조합 세포는 각각 항체 또는 이의 항원 결합 단편을 포함하는 폴리펩타이드의 라이브러리를 발현하는 것인 재조합 세포의 집단

을 포함하는 용액을 제공하는 단계; 및

표지된 세포 또는 표지된 표적 단백질에 결합된 재조합 세포를 분류함으로써 용액으로부터 하나 이상의 재조합 세포를 단리하는 단계

를 포함하는, 세포 분류에 의한 항체 발견 방법.

구현예 58. a. 파지 디스플레이 라이브러리를 구현예 33 내지 35 중 어느 한 구현예의 진핵 세포, 구현예 40의 진핵 세포, 또는 구현예 41의 표적 단백질과 혼합하는 단계; 및

b. 세포 또는 표적 단백질에 결합하는 파지 디스플레이 라이브러리의 구성원을 정제 및/또는 농축하는 단계

를 포함하는, 파지 디스플레이 라이브러리를 패닝(panning)하는 방법.

구현예 59. 구현예 33-35 및 40 중 어느 한 구현예에 있어서, 진핵 세포는 인간 세포, 동물 세포, 곤충 세포, 식물 세포 또는 진균 세포인 진핵 세포.

구현예 60. 구현예 33-35, 40 및 59 중 어느 한 구현예에 있어서, 진핵 세포는 진핵 세포주인 진핵 세포.

구현예 61. 구현예 33-35, 40, 59 및 60 중 어느 한 구현예에 있어서, 진핵 세포는 Bc HROC277, COS, CHO, CHO-S, CHO-K1, CHO-DG44, CHO-DUXB11, CHO-DUKX, CHOK1SV, VERO, MDCK, WI38, V79, B14AF28-G3, BHK, HaK, NSO, 5P2/0-Ag14, HeLa, HEK293, HEK293-F, HEK293-H, HEK293-T, perC6 세포, Sf9 세포, 사카로마이세스 세포, 피치아 세포 또는 쉬조사카로마이세스 세포인 진핵 세포.

구현예 62. 구현예 60에 있어서, 진핵 세포주는 안정한 세포주인 진핵 세포.

구현예 63. 구현예 1-29 및 45-52 중 어느 한 구현예에 있어서, 하나 이상의 벡터는 아데노 관련 바이러스(AAV) 벡터, 렌티바이러스 벡터, 레트로바이러스 벡터, 복제 적격 아데노바이러스 벡터, 복제 결핍 아데노바이러스 벡터, 헤르페스 바이러스 벡터, 배큘로바이러스 벡터 또는 비바이러스성 플라스미드로 이루어진 군으로부터 선택되는 것인 시스템.

구현예 64. 구현예 63에 있어서, 하나 이상의 벡터 중 적어도 하나는 AAV 벡터인 시스템.

구현예 65. 구현예 30-32 중 어느 한 구현예에 있어서, 벡터는 아데노 관련 바이러스(AAV) 벡터, 렌티바이러스 벡터, 레트로바이러스 벡터, 복제 적격 아데노바이러스 벡터, 복제 결핍 아데노바이러스 벡터, 헤르페스 바이러스 벡터, 배큘로바이러스 벡터 또는 비바이러스 플라스미드인 벡터.

구현예 66. 구현예 65에 있어서, 벡터는 AAV 벡터인 벡터.

구현예 67. 구현예 4에 있어서, 랍도바이러스 기질(M) 단백질은 수포성 구내염 바이러스(VSV)의 M 단백질인 시스템.

구현예 68. 구현예 67에 있어서, M 단백질은 서열번호: 9와 적어도 90% 동일성을 공유하는 것인 시스템.

구현예 69. 하나 이상의 벡터를 포함하는, 진핵 세포 내 표적 단백질의 재조합 발현을 위한 시스템으로서, 하나 이상의 벡터는

a. 표적 단백질을 코딩하는 제1 폴리뉴클레오타이드; 및

b. 뇌심근염 바이러스(EMCV)의 L 단백질을 코딩하는 제2 폴리뉴클레오타이드로서, 선택적으로 L 단백질은 서열번호: 2와 적어도 90% 동일성을 공유하는 것인 제2 폴리뉴클레오타이드

를 포함하고,

제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드는 하나 이상의 프로모터에 작동가능하게 연결된 것인 시스템.

구현예 70. 하나 이상의 벡터를 포함하는, 진핵 세포 내 표적 단백질의 재조합 발현을 위한 시스템으로서, 하나 이상의 벡터는

a. 표적 단백질을 코딩하는 제1 폴리뉴클레오타이드; 및

b. 타일러 바이러스의 L 단백질을 코딩하는 제2 폴리뉴클레오타이드로서, 선택적으로 L 단백질은 서열번호: 1과 적어도 90% 동일성을 공유하는 것인 제2 폴리뉴클레오타이드

를 포함하고,

구현예 71. 하나 이상의 벡터를 포함하는, 진핵 세포 내 표적 단백질의 재조합 발현을 위한 시스템으로서, 하나 이상의 벡터는

a. 표적 단백질을 코딩하는 제1 폴리뉴클레오타이드; 및

b. 피코르나바이러스 2A 프로테아제를 코딩하는 제2 폴리뉴클레오타이드로서, 선택적으로 피코르나바이러스 2A 프로테아제는 서열번호: 7과 적어도 90% 동일성을 공유하는 것인 제2 폴리뉴클레오타이드

를 포함하고,

구현예 72. 하나 이상의 벡터를 포함하는, 진핵 세포 내 표적 단백질의 재조합 발현을 위한 시스템으로서, 하나 이상의 벡터는

a. 표적 단백질을 코딩하는 제1 폴리뉴클레오타이드; 및

b. 수포성 구내염 바이러스(VSV)의 M 단백질을 코딩하는 제2 폴리뉴클레오타이드로서, 선택적으로 M 단백질은 서열번호: 9와 적어도 90% 동일성을 공유하는 것인 제2 폴리뉴클레오타이드

를 포함하고,

구현예 73. 구현예 69-72 중 어느 한 구현예에 있어서, 표적 단백질은 도파민 수용체 1(DRD1)이고, 선택적으로 DRD1은 서열번호: 19의 아미노산 서열과 적어도 90% 동일성을 갖는 아미노산 서열을 포함하는 것인 시스템.

구현예 74. 구현예 69-72 중 어느 한 구현예에 있어서, 표적 단백질은 낭포성 섬유증 막관통 전도도 조절자(CFTR)이고, 선택적으로 CFTR은 서열번호: 18의 아미노산 서열과 적어도 90% 동일성을 갖는 아미노산 서열을 포함하는 것인 시스템.

구현예 75. 구현예 69-72 중 어느 한 구현예에 있어서, 표적 단백질은 C1 에스테라제 억제제(C1-Inh)이고, 선택적으로 C1-Inh는 서열번호: 16의 아미노산 서열과 적어도 90% 동일성을 갖는 아미노산 서열을 포함하는 것인 시스템.

구현예 76. 구현예 69-72 중 어느 한 구현예에 있어서, 표적 단백질은 ITK이고, 선택적으로 ITK는 서열번호: 15의 아미노산 서열과 적어도 90% 동일성을 갖는 아미노산 서열을 포함하는 것인 시스템.

구현예 77. 구현예 69-72 중 어느 한 구현예에 있어서, 표적 단백질은 NADase이고, 선택적으로 NADase는 서열번호: 20의 아미노산 서열과 적어도 90% 동일성을 갖는 아미노산 서열을 포함하는 것인 시스템.

SEQUENCE LISTING <110> Excepgen Inc. <120> SYSTEMS AND METHODS FOR PROTEIN EXPRESSION <130> EXCI-001/02WO 336721-2006 <150> US 62/970,628 <151> 2020-02-05 <150> US 62/901,043 <151> 2019-09-16 <160> 96 <170> PatentIn version 3.5 <210> 1 <211> 71 <212> PRT <213> Cardiovirus Theiler's-like cardiovirus <400> 1 Met Ala Cys Lys His Gly Tyr Pro Leu Met Cys Pro Leu Cys Thr Ala 1 5 10 15 Leu Asp Lys Thr Ser Asp Gly Leu Phe Thr Leu Leu Phe Asp Asn Glu 20 25 30 Trp Tyr Pro Thr Asp Leu Leu Thr Val Asp Leu Glu Asp Glu Val Phe 35 40 45 Tyr Pro Asp Asp Pro His Met Glu Trp Thr Asp Leu Pro Leu Ile Gln 50 55 60 Asp Ile Glu Met Glu Pro Gln 65 70 <210> 2 <211> 67 <212> PRT <213> Cardiovirus Encephalomyocarditis virus <400> 2 Met Ala Thr Thr Met Glu Gln Glu Thr Cys Ala His Ser Leu Thr Phe 1 5 10 15 Glu Glu Cys Pro Lys Cys Ser Ala Leu Gln Tyr Arg Asn Gly Phe Tyr 20 25 30 Leu Leu Lys Tyr Asp Glu Glu Trp Tyr Pro Glu Glu Leu Leu Thr Asp 35 40 45 Gly Glu Asp Asp Val Phe Asp Pro Glu Leu Asp Met Glu Val Val Phe 50 55 60 Glu Leu Gln 65 <210> 3 <211> 127 <212> PRT <213> Enterovirus Enterovirus C <400> 3 Asn Tyr His Leu Ala Thr Gln Asp Asp Leu Gln Asn Ala Val Asn Val 1 5 10 15 Met Trp Ser Arg Asp Leu Leu Val Thr Glu Ser Arg Ala Gln Gly Thr 20 25 30 Asp Ser Ile Ala Arg Cys Asn Cys Asn Ala Gly Val Tyr Tyr Cys Glu 35 40 45 Ser Arg Arg Lys Tyr Tyr Pro Val Ser Phe Val Gly Pro Thr Phe Gln 50 55 60 Tyr Met Glu Ala Asn Asn Tyr Tyr Pro Ala Arg Tyr Gln Ser His Met 65 70 75 80 Leu Ile Gly His Gly Phe Ala Ser Pro Gly Asp Cys Gly Gly Ile Leu 85 90 95 Arg Cys His His Gly Val Ile Gly Ile Ile Thr Ala Gly Gly Glu Gly 100 105 110 Leu Val Ala Phe Ser Asp Ile Arg Asp Leu Tyr Ala Tyr Glu Glu 115 120 125 <210> 4 <211> 219 <212> PRT <213> Erbovirus Equine rhinitis B virus 1 <400> 4 Met Val Thr Met Ala Gly Asn Met Ile Cys Asn Val Phe Ala Gly Leu 1 5 10 15 Ala Thr Glu Ile Cys Ser Pro Lys Gln Gly Pro Leu Leu Asp Asn Glu 20 25 30 Leu Pro Leu Pro Leu Glu Leu Ala Glu Phe Pro Asn Lys Asp Asn Asn 35 40 45 Cys Trp Val Ala Ala Leu Ser His Tyr Tyr Thr Leu Cys Asp Val Thr 50 55 60 Asn His Val Thr Lys Val Thr Pro Thr Thr Ser Gly Ile Arg Tyr Tyr 65 70 75 80 Leu Thr Ala Trp Gln Ser Ile Leu Gln Thr Asp Leu Phe Asn Gly Tyr 85 90 95 Tyr Pro Ala Ala Phe Ala Val Glu Thr Gly Leu Cys His Gly Pro Phe 100 105 110 Pro Met Gln Gln His Gly Tyr Val Arg Asn Ala Thr Ser His Pro Tyr 115 120 125 Asn Phe Cys Leu Cys Ser Glu Pro Val Pro Gly Glu Asp Tyr Trp His 130 135 140 Ala Val Val Lys Val Asp Leu Ser Arg Thr Glu Ala Arg Val Asp Lys 145 150 155 160 Trp Leu Cys Ile Asp Asp Asp Arg Met Tyr Leu Ser Gly Pro Pro Thr 165 170 175 Arg Val Lys Leu Ala Ser Ser Tyr Lys Ile Pro Thr Trp Ile Glu Ser 180 185 190 Leu Ala Gln Phe Cys Leu Gln Leu His Pro Val Gln His Arg Arg Thr 195 200 205 Leu Ala Asn Ser Leu Arg Asn Glu Gln Cys Arg 210 215 <210> 5 <211> 67 <212> PRT <213> Cardiovirus Encephalomyocarditis virus <400> 5 Met Ala Thr Thr Met Glu Gln Glu Ile Cys Ala His Ser Met Thr Phe 1 5 10 15 Glu Glu Cys Pro Lys Cys Ser Ala Leu Gln Tyr Arg Asn Gly Phe Tyr 20 25 30 Leu Leu Lys Tyr Asp Glu Glu Trp Tyr Pro Glu Glu Ser Leu Thr Asp 35 40 45 Gly Glu Asp Asp Val Phe Asp Pro Asp Leu Asp Met Glu Val Val Phe 50 55 60 Glu Thr Gln 65 <210> 6 <211> 71 <212> PRT <213> Cardiovirus Cardiovirus B <400> 6 Met Ala Cys Lys His Gly Tyr Pro Phe Leu Cys Pro Leu Cys Thr Ala 1 5 10 15 Ile Asp Thr Thr His Asp Gly Ser Phe Thr Leu Leu Ile Asp Asn Glu 20 25 30 Trp Tyr Pro Thr Asp Leu Leu Thr Val Asp Leu Asp Asp Asp Val Phe 35 40 45 His Pro Asp Asp Ser Val Met Glu Trp Thr Asp Leu Pro Leu Ile Gln 50 55 60 Asp Val Val Met Glu Pro Gln 65 70 <210> 7 <211> 149 <212> PRT <213> Enterovirus Enterovirus C <400> 7 Gly Phe Gly His Gln Asn Lys Ala Val Tyr Thr Ala Gly Tyr Lys Ile 1 5 10 15 Cys Asn Tyr His Leu Ala Thr Gln Asp Asp Leu Gln Asn Ala Val Asn 20 25 30 Val Met Trp Ser Arg Asp Leu Leu Val Thr Glu Ser Arg Ala Gln Gly 35 40 45 Thr Asp Ser Ile Ala Arg Cys Asn Cys Asn Ala Gly Val Tyr Tyr Cys 50 55 60 Glu Ser Arg Arg Lys Tyr Tyr Pro Val Ser Phe Val Gly Pro Thr Phe 65 70 75 80 Gln Tyr Met Glu Ala Asn Asn Tyr Tyr Pro Ala Arg Tyr Gln Ser His 85 90 95 Met Leu Ile Gly His Gly Phe Ala Ser Pro Gly Asp Cys Gly Gly Ile 100 105 110 Leu Arg Cys His His Gly Val Ile Gly Ile Ile Thr Ala Gly Gly Glu 115 120 125 Gly Leu Val Ala Phe Ser Asp Ile Arg Asp Leu Tyr Ala Tyr Glu Glu 130 135 140 Glu Ala Met Glu Gln 145 <210> 8 <211> 182 <212> PRT <213> Enterovirus Human rhinovirus 16 <400> 8 Gly Pro Glu Glu Glu Phe Gly Met Ser Ile Ile Lys Asn Asn Thr Cys 1 5 10 15 Val Val Thr Thr Thr Asn Gly Lys Phe Thr Gly Leu Gly Ile Tyr Asp 20 25 30 Arg Ile Leu Ile Leu Pro Thr His Ala Asp Pro Gly Ser Glu Ile Gln 35 40 45 Val Asn Gly Ile His Thr Lys Val Leu Asp Ser Tyr Asp Leu Phe Asn 50 55 60 Lys Glu Gly Val Lys Leu Glu Ile Thr Val Leu Lys Leu Asp Arg Asn 65 70 75 80 Glu Lys Phe Arg Asp Ile Arg Lys Tyr Ile Pro Glu Ser Glu Asp Asp 85 90 95 Tyr Pro Glu Cys Asn Leu Ala Leu Val Ala Asn Gln Thr Glu Pro Thr 100 105 110 Ile Ile Lys Val Gly Asp Val Val Ser Tyr Gly Asn Ile Leu Leu Ser 115 120 125 Gly Thr Gln Thr Ala Arg Met Leu Lys Tyr Asn Tyr Pro Thr Lys Ser 130 135 140 Gly Tyr Cys Gly Gly Val Leu Tyr Lys Ile Gly Gln Ile Leu Gly Ile 145 150 155 160 His Val Gly Gly Asn Gly Arg Asp Gly Phe Ser Ser Met Leu Leu Arg 165 170 175 Ser Tyr Phe Thr Glu Gln 180 <210> 9 <211> 229 <212> PRT <213> Vesiculovirus Indiana vesiculovirus <400> 9 Met Ser Ser Leu Lys Lys Ile Leu Gly Leu Lys Gly Lys Gly Lys Lys 1 5 10 15 Ser Lys Lys Leu Gly Ile Ala Pro Pro Pro Tyr Glu Glu Asp Thr Ser 20 25 30 Met Glu Tyr Ala Pro Ser Ala Pro Ile Asp Lys Ser Tyr Phe Gly Val 35 40 45 Asp Glu Met Asp Thr Tyr Asp Pro Asn Gln Leu Arg Tyr Glu Lys Phe 50 55 60 Phe Phe Thr Val Lys Met Thr Val Arg Ser Asn Arg Pro Phe Arg Thr 65 70 75 80 Tyr Ser Asp Val Ala Ala Ala Val Ser His Trp Asp His Met Tyr Ile 85 90 95 Gly Met Ala Gly Lys Arg Pro Phe Tyr Lys Ile Leu Ala Phe Leu Gly 100 105 110 Ser Ser Asn Leu Lys Ala Thr Pro Ala Val Leu Ala Asp Gln Gly Gln 115 120 125 Pro Glu Tyr His Thr His Cys Glu Gly Arg Ala Tyr Leu Pro His Arg 130 135 140 Met Gly Lys Thr Pro Pro Met Leu Asn Val Pro Glu His Phe Arg Arg 145 150 155 160 Pro Phe Asn Ile Gly Leu Tyr Lys Gly Thr Ile Glu Leu Thr Met Thr 165 170 175 Ile Tyr Asp Asp Glu Ser Leu Glu Ala Ala Pro Met Ile Trp Asp His 180 185 190 Phe Asn Ser Ser Lys Phe Ser Asp Phe Arg Glu Lys Ala Leu Met Phe 195 200 205 Gly Leu Ile Val Glu Lys Lys Ala Ser Gly Ala Trp Val Leu Asp Ser 210 215 220 Ile Ser His Phe Lys 225 <210> 10 <211> 230 <212> PRT <213> Alphainfluenzavirus Influenza A virus <400> 10 Met Asp Pro Asn Thr Val Ser Ser Phe Gln Val Asp Cys Phe Leu Trp 1 5 10 15 His Val Arg Lys Arg Val Ala Asp Gln Glu Leu Gly Asp Ala Pro Phe 20 25 30 Leu Asp Arg Leu Arg Arg Asp Gln Lys Ser Leu Arg Gly Arg Gly Ser 35 40 45 Thr Leu Gly Leu Asp Ile Glu Thr Ala Thr Arg Ala Gly Lys Gln Ile 50 55 60 Val Glu Arg Ile Leu Lys Glu Glu Ser Asp Glu Ala Leu Lys Met Thr 65 70 75 80 Met Ala Ser Val Pro Ala Ser Arg Tyr Leu Thr Asp Met Thr Leu Glu 85 90 95 Glu Met Ser Arg Asp Trp Ser Met Leu Ile Pro Lys Gln Lys Val Ala 100 105 110 Gly Pro Leu Cys Ile Arg Met Asp Gln Ala Ile Met Asp Lys Asn Ile 115 120 125 Ile Leu Lys Ala Asn Phe Ser Val Ile Phe Asp Arg Leu Glu Thr Leu 130 135 140 Ile Leu Leu Arg Ala Phe Thr Glu Glu Gly Ala Ile Val Gly Glu Ile 145 150 155 160 Ser Pro Leu Pro Ser Leu Pro Gly His Thr Ala Glu Asp Val Lys Asn 165 170 175 Ala Val Gly Val Leu Ile Gly Gly Leu Glu Trp Asn Asp Asn Thr Val 180 185 190 Arg Val Ser Glu Thr Leu Gln Arg Phe Ala Trp Arg Ser Ser Asn Glu 195 200 205 Asn Gly Arg Pro Pro Leu Thr Pro Lys Gln Lys Arg Glu Met Ala Gly 210 215 220 Thr Ile Arg Ser Glu Val 225 230 <210> 11 <211> 512 <212> PRT <213> Unknown <220> <223> Simplexvirus sp. <400> 11 Met Ala Thr Asp Ile Asp Met Leu Ile Asp Leu Gly Leu Asp Leu Ser 1 5 10 15 Asp Ser Asp Leu Asp Glu Asp Pro Pro Glu Pro Ala Glu Ser Arg Arg 20 25 30 Asp Asp Leu Glu Ser Asp Ser Ser Gly Glu Cys Ser Ser Ser Asp Glu 35 40 45 Asp Met Glu Asp Pro His Gly Glu Asp Gly Pro Glu Pro Ile Leu Asp 50 55 60 Ala Ala Arg Pro Ala Val Arg Pro Ser Arg Pro Glu Asp Pro Gly Val 65 70 75 80 Pro Ser Thr Gln Thr Pro Arg Pro Thr Glu Arg Gln Gly Pro Asn Asp 85 90 95 Pro Gln Pro Ala Pro His Ser Val Trp Ser Arg Leu Gly Ala Arg Arg 100 105 110 Pro Ser Cys Ser Pro Glu Gln His Gly Gly Lys Val Ala Arg Leu Gln 115 120 125 Pro Pro Pro Thr Lys Ala Gln Pro Ala Arg Gly Gly Arg Arg Gly Arg 130 135 140 Arg Arg Gly Arg Gly Arg Gly Gly Pro Gly Ala Ala Asp Gly Leu Ser 145 150 155 160 Asp Pro Arg Arg Arg Ala Pro Arg Thr Asn Arg Asn Pro Gly Gly Pro 165 170 175 Arg Pro Gly Ala Gly Trp Thr Asp Gly Pro Gly Ala Pro His Gly Glu 180 185 190 Ala Trp Arg Gly Ser Glu Gln Pro Asp Pro Pro Gly Gly Gln Arg Thr 195 200 205 Arg Gly Val Arg Gln Ala Pro Pro Pro Leu Met Thr Leu Ala Ile Ala 210 215 220 Pro Pro Pro Ala Asp Pro Arg Ala Pro Ala Pro Glu Arg Lys Ala Pro 225 230 235 240 Ala Ala Asp Thr Ile Asp Ala Thr Thr Arg Leu Val Leu Arg Ser Ile 245 250 255 Ser Glu Arg Ala Ala Val Asp Arg Ile Ser Glu Ser Phe Gly Arg Ser 260 265 270 Ala Gln Val Met His Asp Pro Phe Gly Gly Gln Pro Phe Pro Ala Ala 275 280 285 Asn Ser Pro Trp Ala Pro Val Leu Ala Gly Gln Gly Gly Pro Phe Asp 290 295 300 Ala Glu Thr Arg Arg Val Ser Trp Glu Thr Leu Val Ala His Gly Pro 305 310 315 320 Ser Leu Tyr Arg Thr Phe Ala Gly Asn Pro Arg Ala Ala Ser Thr Ala 325 330 335 Lys Ala Met Arg Asp Cys Val Leu Arg Gln Glu Asn Phe Ile Glu Ala 340 345 350 Leu Ala Ser Ala Asp Glu Thr Leu Ala Trp Cys Lys Met Cys Ile His 355 360 365 His Asn Leu Pro Leu Arg Pro Gln Asp Pro Ile Ile Gly Thr Thr Ala 370 375 380 Ala Val Leu Asp Asn Leu Ala Thr Arg Leu Arg Pro Phe Leu Gln Cys 385 390 395 400 Tyr Leu Lys Ala Arg Gly Leu Cys Gly Leu Asp Glu Leu Cys Ser Arg 405 410 415 Arg Arg Leu Ala Asp Ile Lys Asp Ile Ala Ser Phe Val Phe Val Ile 420 425 430 Leu Ala Arg Leu Ala Asn Arg Val Glu Arg Gly Val Ala Glu Ile Asp 435 440 445 Tyr Ala Thr Leu Gly Val Gly Val Gly Glu Lys Met His Phe Tyr Leu 450 455 460 Pro Gly Ala Cys Met Ala Gly Leu Ile Glu Ile Leu Asp Thr His Arg 465 470 475 480 Gln Glu Cys Ser Ser Arg Val Cys Glu Leu Thr Ala Ser His Ile Val 485 490 495 Ala Pro Pro Tyr Val His Gly Lys Tyr Phe Tyr Cys Asn Ser Leu Phe 500 505 510 <210> 12 <211> 700 <212> PRT <213> Artificial Sequence <220> <223> target protein sequence <400> 12 Met Arg Thr Leu Asn Thr Ser Ala Met Asp Gly Thr Gly Leu Val Val 1 5 10 15 Glu Arg Asp Phe Ser Val Arg Ile Leu Thr Ala Cys Phe Leu Ser Leu 20 25 30 Leu Ile Leu Ser Thr Leu Leu Gly Asn Thr Leu Val Cys Ala Ala Val 35 40 45 Ile Arg Phe Arg His Leu Arg Ser Lys Val Thr Asn Phe Phe Val Ile 50 55 60 Ser Leu Ala Val Ser Asp Leu Leu Val Ala Val Leu Val Met Pro Trp 65 70 75 80 Lys Ala Val Ala Glu Ile Ala Gly Phe Trp Pro Phe Gly Ser Phe Cys 85 90 95 Asn Ile Trp Val Ala Phe Asp Ile Met Cys Ser Thr Ala Ser Ile Leu 100 105 110 Asn Leu Cys Val Ile Ser Val Asp Arg Tyr Trp Ala Ile Ser Ser Pro 115 120 125 Phe Arg Tyr Glu Arg Lys Met Thr Pro Lys Ala Ala Phe Ile Leu Ile 130 135 140 Ser Val Ala Trp Thr Leu Ser Val Leu Ile Ser Phe Ile Pro Val Gln 145 150 155 160 Leu Ser Trp His Lys Ala Lys Pro Thr Ser Pro Ser Asp Gly Asn Ala 165 170 175 Thr Ser Leu Ala Glu Thr Ile Asp Asn Cys Asp Ser Ser Leu Ser Arg 180 185 190 Thr Tyr Ala Ile Ser Ser Ser Val Ile Ser Phe Tyr Ile Pro Val Ala 195 200 205 Ile Met Ile Val Thr Tyr Thr Arg Ile Tyr Arg Ile Ala Gln Lys Gln 210 215 220 Ile Arg Arg Ile Ala Ala Leu Glu Arg Ala Ala Val His Ala Lys Asn 225 230 235 240 Cys Gln Thr Thr Thr Gly Asn Gly Lys Pro Val Glu Cys Ser Gln Pro 245 250 255 Glu Ser Ser Phe Lys Met Ser Phe Lys Arg Glu Thr Lys Val Leu Lys 260 265 270 Thr Leu Ser Val Ile Met Gly Val Phe Val Cys Cys Trp Leu Pro Phe 275 280 285 Phe Ile Leu Asn Cys Ile Leu Pro Phe Cys Gly Ser Gly Glu Thr Gln 290 295 300 Pro Phe Cys Ile Asp Ser Asn Thr Phe Asp Val Phe Val Trp Phe Gly 305 310 315 320 Trp Ala Asn Ser Ser Leu Asn Pro Ile Ile Tyr Ala Phe Asn Ala Asp 325 330 335 Phe Arg Lys Ala Phe Ser Thr Leu Leu Gly Cys Tyr Arg Leu Cys Pro 340 345 350 Ala Thr Asn Asn Ala Ile Glu Thr Val Ser Ile Asn Asn Asn Gly Ala 355 360 365 Ala Met Phe Ser Ser His His Glu Pro Arg Gly Ser Ile Ser Lys Glu 370 375 380 Cys Asn Leu Val Tyr Leu Ile Pro His Ala Val Gly Ser Ser Glu Asp 385 390 395 400 Leu Lys Lys Glu Glu Ala Ala Gly Ile Ala Arg Pro Leu Glu Lys Leu 405 410 415 Ser Pro Ala Leu Ser Val Ile Leu Asp Tyr Asp Thr Asp Val Ser Leu 420 425 430 Glu Lys Ile Gln Pro Ile Thr Gln Asn Gly Gln His Pro Thr Gly Gly 435 440 445 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Met Val Ser 450 455 460 Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val Glu Leu 465 470 475 480 Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu Gly Glu 485 490 495 Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys Thr Thr 500 505 510 Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu Thr Tyr 515 520 525 Gly Val Gln Cys Phe Ala Arg Tyr Pro Asp His Met Lys Gln His Asp 530 535 540 Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile 545 550 555 560 Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val Lys Phe 565 570 575 Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe 580 585 590 Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn Tyr Asn 595 600 605 Ser His Lys Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn Gly Ile Lys 610 615 620 Val Asn Phe Lys Thr Arg His Asn Ile Glu Asp Gly Ser Val Gln Leu 625 630 635 640 Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu 645 650 655 Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Lys Leu Ser Lys Asp 660 665 670 Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala 675 680 685 Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys 690 695 700 <210> 13 <211> 239 <212> PRT <213> Artificial Sequence <220> <223> target protein sequence <400> 13 Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu 1 5 10 15 Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly 20 25 30 Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile 35 40 45 Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr 50 55 60 Leu Thr Tyr Gly Val Gln Cys Phe Ala Arg Tyr Pro Asp His Met Lys 65 70 75 80 Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu 85 90 95 Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu 100 105 110 Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly 115 120 125 Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr 130 135 140 Asn Tyr Asn Ser His Lys Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn 145 150 155 160 Gly Ile Lys Val Asn Phe Lys Thr Arg His Asn Ile Glu Asp Gly Ser 165 170 175 Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly 180 185 190 Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Lys Leu 195 200 205 Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe 210 215 220 Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys 225 230 235 <210> 14 <211> 460 <212> PRT <213> Artificial Sequence <220> <223> target protein sequence <400> 14 Met Arg Thr Leu Asn Thr Ser Ala Met Asp Gly Thr Gly Leu Val Val 1 5 10 15 Glu Arg Asp Phe Ser Val Arg Ile Leu Thr Ala Cys Phe Leu Ser Leu 20 25 30 Leu Ile Leu Ser Thr Leu Leu Gly Asn Thr Leu Val Cys Ala Ala Val 35 40 45 Ile Arg Phe Arg His Leu Arg Ser Lys Val Thr Asn Phe Phe Val Ile 50 55 60 Ser Leu Ala Val Ser Asp Leu Leu Val Ala Val Leu Val Met Pro Trp 65 70 75 80 Lys Ala Val Ala Glu Ile Ala Gly Phe Trp Pro Phe Gly Ser Phe Cys 85 90 95 Asn Ile Trp Val Ala Phe Asp Ile Met Cys Ser Thr Ala Ser Ile Leu 100 105 110 Asn Leu Cys Val Ile Ser Val Asp Arg Tyr Trp Ala Ile Ser Ser Pro 115 120 125 Phe Arg Tyr Glu Arg Lys Met Thr Pro Lys Ala Ala Phe Ile Leu Ile 130 135 140 Ser Val Ala Trp Thr Leu Ser Val Leu Ile Ser Phe Ile Pro Val Gln 145 150 155 160 Leu Ser Trp His Lys Ala Lys Pro Thr Ser Pro Ser Asp Gly Asn Ala 165 170 175 Thr Ser Leu Ala Glu Thr Ile Asp Asn Cys Asp Ser Ser Leu Ser Arg 180 185 190 Thr Tyr Ala Ile Ser Ser Ser Val Ile Ser Phe Tyr Ile Pro Val Ala 195 200 205 Ile Met Ile Val Thr Tyr Thr Arg Ile Tyr Arg Ile Ala Gln Lys Gln 210 215 220 Ile Arg Arg Ile Ala Ala Leu Glu Arg Ala Ala Val His Ala Lys Asn 225 230 235 240 Cys Gln Thr Thr Thr Gly Asn Gly Lys Pro Val Glu Cys Ser Gln Pro 245 250 255 Glu Ser Ser Phe Lys Met Ser Phe Lys Arg Glu Thr Lys Val Leu Lys 260 265 270 Thr Leu Ser Val Ile Met Gly Val Phe Val Cys Cys Trp Leu Pro Phe 275 280 285 Phe Ile Leu Asn Cys Ile Leu Pro Phe Cys Gly Ser Gly Glu Thr Gln 290 295 300 Pro Phe Cys Ile Asp Ser Asn Thr Phe Asp Val Phe Val Trp Phe Gly 305 310 315 320 Trp Ala Asn Ser Ser Leu Asn Pro Ile Ile Tyr Ala Phe Asn Ala Asp 325 330 335 Phe Arg Lys Ala Phe Ser Thr Leu Leu Gly Cys Tyr Arg Leu Cys Pro 340 345 350 Ala Thr Asn Asn Ala Ile Glu Thr Val Ser Ile Asn Asn Asn Gly Ala 355 360 365 Ala Met Phe Ser Ser His His Glu Pro Arg Gly Ser Ile Ser Lys Glu 370 375 380 Cys Asn Leu Val Tyr Leu Ile Pro His Ala Val Gly Ser Ser Glu Asp 385 390 395 400 Leu Lys Lys Glu Glu Ala Ala Gly Ile Ala Arg Pro Leu Glu Lys Leu 405 410 415 Ser Pro Ala Leu Ser Val Ile Leu Asp Tyr Asp Thr Asp Val Ser Leu 420 425 430 Glu Lys Ile Gln Pro Ile Thr Gln Asn Gly Gln His Pro Thr Thr Gly 435 440 445 Thr Arg Pro Leu Trp Ser His Pro Gln Phe Glu Lys 450 455 460 <210> 15 <211> 635 <212> PRT <213> Artificial Sequence <220> <223> target protein sequence <400> 15 Met Asn Asn Phe Ile Leu Leu Glu Glu Gln Leu Ile Lys Lys Ser Gln 1 5 10 15 Gln Lys Arg Arg Thr Ser Pro Ser Asn Phe Lys Val Arg Phe Phe Val 20 25 30 Leu Thr Lys Ala Ser Leu Ala Tyr Phe Glu Asp Arg His Gly Lys Lys 35 40 45 Arg Thr Leu Lys Gly Ser Ile Glu Leu Ser Arg Ile Lys Cys Val Glu 50 55 60 Ile Val Lys Ser Asp Ile Ser Ile Pro Cys His Tyr Lys Tyr Pro Phe 65 70 75 80 Gln Val Val His Asp Asn Tyr Leu Leu Tyr Val Phe Ala Pro Asp Arg 85 90 95 Glu Ser Arg Gln Arg Trp Val Leu Ala Leu Lys Glu Glu Thr Arg Asn 100 105 110 Asn Asn Ser Leu Val Pro Lys Tyr His Pro Asn Phe Trp Met Asp Gly 115 120 125 Lys Trp Arg Cys Cys Ser Gln Leu Glu Lys Leu Ala Thr Gly Cys Ala 130 135 140 Gln Tyr Asp Pro Thr Lys Asn Ala Ser Lys Lys Pro Leu Pro Pro Thr 145 150 155 160 Pro Glu Asp Asn Arg Arg Pro Leu Trp Glu Pro Glu Glu Thr Val Val 165 170 175 Ile Ala Leu Tyr Asp Tyr Gln Thr Asn Asp Pro Gln Glu Leu Ala Leu 180 185 190 Arg Arg Asn Glu Glu Tyr Cys Leu Leu Asp Ser Ser Glu Ile His Trp 195 200 205 Trp Arg Val Gln Asp Arg Asn Gly His Glu Gly Tyr Val Pro Ser Ser 210 215 220 Tyr Leu Val Glu Lys Ser Pro Asn Asn Leu Glu Thr Tyr Glu Trp Tyr 225 230 235 240 Asn Lys Ser Ile Ser Arg Asp Lys Ala Glu Lys Leu Leu Leu Asp Thr 245 250 255 Gly Lys Glu Gly Ala Phe Met Val Arg Asp Ser Arg Thr Ala Gly Thr 260 265 270 Tyr Thr Val Ser Val Phe Thr Lys Ala Val Val Ser Glu Asn Asn Pro 275 280 285 Cys Ile Lys His Tyr His Ile Lys Glu Thr Asn Asp Asn Pro Lys Arg 290 295 300 Tyr Tyr Val Ala Glu Lys Tyr Val Phe Asp Ser Ile Pro Leu Leu Ile 305 310 315 320 Asn Tyr His Gln His Asn Gly Gly Gly Leu Val Thr Arg Leu Arg Tyr 325 330 335 Pro Val Cys Phe Gly Arg Gln Lys Ala Pro Val Thr Ala Gly Leu Arg 340 345 350 Tyr Gly Lys Trp Val Ile Asp Pro Ser Glu Leu Thr Phe Val Gln Glu 355 360 365 Ile Gly Ser Gly Gln Phe Gly Leu Val His Leu Gly Tyr Trp Leu Asn 370 375 380 Lys Asp Lys Val Ala Ile Lys Thr Ile Arg Glu Gly Ala Met Ser Glu 385 390 395 400 Glu Asp Phe Ile Glu Glu Ala Glu Val Met Met Lys Leu Ser His Pro 405 410 415 Lys Leu Val Gln Leu Tyr Gly Val Cys Leu Glu Gln Ala Pro Ile Cys 420 425 430 Leu Val Phe Glu Phe Met Glu His Gly Cys Leu Ser Asp Tyr Leu Arg 435 440 445 Thr Gln Arg Gly Leu Phe Ala Ala Glu Thr Leu Leu Gly Met Cys Leu 450 455 460 Asp Val Cys Glu Gly Met Ala Tyr Leu Glu Glu Ala Cys Val Ile His 465 470 475 480 Arg Asp Leu Ala Ala Arg Asn Cys Leu Val Gly Glu Asn Gln Val Ile 485 490 495 Lys Val Ser Asp Phe Gly Met Thr Arg Phe Val Leu Asp Asp Gln Tyr 500 505 510 Thr Ser Ser Thr Gly Thr Lys Phe Pro Val Lys Trp Ala Ser Pro Glu 515 520 525 Val Phe Ser Phe Ser Arg Tyr Ser Ser Lys Ser Asp Val Trp Ser Phe 530 535 540 Gly Val Leu Met Trp Glu Val Phe Ser Glu Gly Lys Ile Pro Tyr Glu 545 550 555 560 Asn Arg Ser Asn Ser Glu Val Val Glu Asp Ile Ser Thr Gly Phe Arg 565 570 575 Leu Tyr Lys Pro Arg Leu Ala Ser Thr His Val Tyr Gln Ile Met Asn 580 585 590 His Cys Trp Lys Glu Arg Pro Glu Asp Arg Pro Ala Phe Ser Arg Leu 595 600 605 Leu Arg Gln Leu Ala Glu Ile Ala Glu Ser Gly Leu Gly Gly Gly Gly 610 615 620 Gly Gly Gly Gly His His His His His His Val 625 630 635 <210> 16 <211> 500 <212> PRT <213> Artificial Sequence <220> <223> target protein sequence <400> 16 Met Ala Ser Arg Leu Thr Leu Leu Thr Leu Leu Leu Leu Leu Leu Ala 1 5 10 15 Gly Asp Arg Ala Ser Ser Asn Pro Asn Ala Thr Ser Ser Ser Ser Gln 20 25 30 Asp Pro Glu Ser Leu Gln Asp Arg Gly Glu Gly Lys Val Ala Thr Thr 35 40 45 Val Ile Ser Lys Met Leu Phe Val Glu Pro Ile Leu Glu Val Ser Ser 50 55 60 Leu Pro Thr Thr Asn Ser Thr Thr Asn Ser Ala Thr Lys Ile Thr Ala 65 70 75 80 Asn Thr Thr Asp Glu Pro Thr Thr Gln Pro Thr Thr Glu Pro Thr Thr 85 90 95 Gln Pro Thr Ile Gln Pro Thr Gln Pro Thr Thr Gln Leu Pro Thr Asp 100 105 110 Ser Pro Thr Gln Pro Thr Thr Gly Ser Phe Cys Pro Gly Pro Val Thr 115 120 125 Leu Cys Ser Asp Leu Glu Ser His Ser Thr Glu Ala Val Leu Gly Asp 130 135 140 Ala Leu Val Asp Phe Ser Leu Lys Leu Tyr His Ala Phe Ser Ala Met 145 150 155 160 Lys Lys Val Glu Thr Asn Met Ala Phe Ser Pro Phe Ser Ile Ala Ser 165 170 175 Leu Leu Thr Gln Val Leu Leu Gly Ala Gly Glu Asn Thr Lys Thr Asn 180 185 190 Leu Glu Ser Ile Leu Ser Tyr Pro Lys Asp Phe Thr Cys Val His Gln 195 200 205 Ala Leu Lys Gly Phe Thr Thr Lys Gly Val Thr Ser Val Ser Gln Ile 210 215 220 Phe His Ser Pro Asp Leu Ala Ile Arg Asp Thr Phe Val Asn Ala Ser 225 230 235 240 Arg Thr Leu Tyr Ser Ser Ser Pro Arg Val Leu Ser Asn Asn Ser Asp 245 250 255 Ala Asn Leu Glu Leu Ile Asn Thr Trp Val Ala Lys Asn Thr Asn Asn 260 265 270 Lys Ile Ser Arg Leu Leu Asp Ser Leu Pro Ser Asp Thr Arg Leu Val 275 280 285 Leu Leu Asn Ala Ile Tyr Leu Ser Ala Lys Trp Lys Thr Thr Phe Asp 290 295 300 Pro Lys Lys Thr Arg Met Glu Pro Phe His Phe Lys Asn Ser Val Ile 305 310 315 320 Lys Val Pro Met Met Asn Ser Lys Lys Tyr Pro Val Ala His Phe Ile 325 330 335 Asp Gln Thr Leu Lys Ala Lys Val Gly Gln Leu Gln Leu Ser His Asn 340 345 350 Leu Ser Leu Val Ile Leu Val Pro Gln Asn Leu Lys His Arg Leu Glu 355 360 365 Asp Met Glu Gln Ala Leu Ser Pro Ser Val Phe Lys Ala Ile Met Glu 370 375 380 Lys Leu Glu Met Ser Lys Phe Gln Pro Thr Leu Leu Thr Leu Pro Arg 385 390 395 400 Ile Lys Val Thr Thr Ser Gln Asp Met Leu Ser Ile Met Glu Lys Leu 405 410 415 Glu Phe Phe Asp Phe Ser Tyr Asp Leu Asn Leu Cys Gly Leu Thr Glu 420 425 430 Asp Pro Asp Leu Gln Val Ser Ala Met Gln His Gln Thr Val Leu Glu 435 440 445 Leu Thr Glu Thr Gly Val Glu Ala Ala Ala Ala Ser Ala Ile Ser Val 450 455 460 Ala Arg Thr Leu Leu Val Phe Glu Val Gln Gln Pro Phe Leu Phe Val 465 470 475 480 Leu Trp Asp Gln Gln His Lys Phe Pro Val Phe Met Gly Arg Val Tyr 485 490 495 Asp Pro Arg Ala 500 <210> 17 <211> 883 <212> PRT <213> Artificial Sequence <220> <223> target protein sequence <400> 17 Met Asn Thr Ile Asn Ile Ala Lys Asn Asp Phe Ser Asp Ile Glu Leu 1 5 10 15 Ala Ala Ile Pro Phe Asn Thr Leu Ala Asp His Tyr Gly Glu Arg Leu 20 25 30 Ala Arg Glu Gln Leu Ala Leu Glu His Glu Ser Tyr Glu Met Gly Glu 35 40 45 Ala Arg Phe Arg Lys Met Phe Glu Arg Gln Leu Lys Ala Gly Glu Val 50 55 60 Ala Asp Asn Ala Ala Ala Lys Pro Leu Ile Thr Thr Leu Leu Pro Lys 65 70 75 80 Met Ile Ala Arg Ile Asn Asp Trp Phe Glu Glu Val Lys Ala Lys Arg 85 90 95 Gly Lys Arg Pro Thr Ala Phe Gln Phe Leu Gln Glu Ile Lys Pro Glu 100 105 110 Ala Val Ala Tyr Ile Thr Ile Lys Thr Thr Leu Ala Cys Leu Thr Ser 115 120 125 Ala Asp Asn Thr Thr Val Gln Ala Val Ala Ser Ala Ile Gly Arg Ala 130 135 140 Ile Glu Asp Glu Ala Arg Phe Gly Arg Ile Arg Asp Leu Glu Ala Lys 145 150 155 160 His Phe Lys Lys Asn Val Glu Glu Gln Leu Asn Lys Arg Val Gly His 165 170 175 Val Tyr Lys Lys Ala Phe Met Gln Val Val Glu Ala Asp Met Leu Ser 180 185 190 Lys Gly Leu Leu Gly Gly Glu Ala Trp Ser Ser Trp His Lys Glu Asp 195 200 205 Ser Ile His Val Gly Val Arg Cys Ile Glu Met Leu Ile Glu Ser Thr 210 215 220 Gly Met Val Ser Leu His Arg Gln Asn Ala Gly Val Val Gly Gln Asp 225 230 235 240 Ser Glu Thr Ile Glu Leu Ala Pro Glu Tyr Ala Glu Ala Ile Ala Thr 245 250 255 Arg Ala Gly Ala Leu Ala Gly Ile Ser Pro Met Phe Gln Pro Cys Val 260 265 270 Val Pro Pro Lys Pro Trp Thr Gly Ile Thr Gly Gly Gly Tyr Trp Ala 275 280 285 Asn Gly Arg Arg Pro Leu Ala Leu Val Arg Thr His Ser Lys Lys Ala 290 295 300 Leu Met Arg Tyr Glu Asp Val Tyr Met Pro Glu Val Tyr Lys Ala Ile 305 310 315 320 Asn Ile Ala Gln Asn Thr Ala Trp Lys Ile Asn Lys Lys Val Leu Ala 325 330 335 Val Ala Asn Val Ile Thr Lys Trp Lys His Cys Pro Val Glu Asp Ile 340 345 350 Pro Ala Ile Glu Arg Glu Glu Leu Pro Met Lys Pro Glu Asp Ile Asp 355 360 365 Met Asn Pro Glu Ala Leu Thr Ala Trp Lys Arg Ala Ala Ala Ala Val 370 375 380 Tyr Arg Lys Asp Lys Ala Arg Lys Ser Arg Arg Ile Ser Leu Glu Phe 385 390 395 400 Met Leu Glu Gln Ala Asn Lys Phe Ala Asn His Lys Ala Ile Trp Phe 405 410 415 Pro Tyr Asn Met Asp Trp Arg Gly Arg Val Tyr Ala Val Ser Met Phe 420 425 430 Asn Pro Gln Gly Asn Asp Met Thr Lys Gly Leu Leu Thr Leu Ala Lys 435 440 445 Gly Lys Pro Ile Gly Lys Glu Gly Tyr Tyr Trp Leu Lys Ile His Gly 450 455 460 Ala Asn Cys Ala Gly Val Asp Lys Val Pro Phe Pro Glu Arg Ile Lys 465 470 475 480 Phe Ile Glu Glu Asn His Glu Asn Ile Met Ala Cys Ala Lys Ser Pro 485 490 495 Leu Glu Asn Thr Trp Trp Ala Glu Gln Asp Ser Pro Phe Cys Phe Leu 500 505 510 Ala Phe Cys Phe Glu Tyr Ala Gly Val Gln His His Gly Leu Ser Tyr 515 520 525 Asn Cys Ser Leu Pro Leu Ala Phe Asp Gly Ser Cys Ser Gly Ile Gln 530 535 540 His Phe Ser Ala Met Leu Arg Asp Glu Val Gly Gly Arg Ala Val Asn 545 550 555 560 Leu Leu Pro Ser Glu Thr Val Gln Asp Ile Tyr Gly Ile Val Ala Lys 565 570 575 Lys Val Asn Glu Ile Leu Gln Ala Asp Ala Ile Asn Gly Thr Asp Asn 580 585 590 Glu Val Val Thr Val Thr Asp Glu Asn Thr Gly Glu Ile Ser Glu Lys 595 600 605 Val Lys Leu Gly Thr Lys Ala Leu Ala Gly Gln Trp Leu Ala Tyr Gly 610 615 620 Val Thr Arg Ser Val Thr Lys Arg Ser Val Met Thr Leu Ala Tyr Gly 625 630 635 640 Ser Lys Glu Phe Gly Phe Arg Gln Gln Val Leu Glu Asp Thr Ile Gln 645 650 655 Pro Ala Ile Asp Ser Gly Lys Gly Leu Met Phe Thr Gln Pro Asn Gln 660 665 670 Ala Ala Gly Tyr Met Ala Lys Leu Ile Trp Glu Ser Val Ser Val Thr 675 680 685 Val Val Ala Ala Val Glu Ala Met Asn Trp Leu Lys Ser Ala Ala Lys 690 695 700 Leu Leu Ala Ala Glu Val Lys Asp Lys Lys Thr Gly Glu Ile Leu Arg 705 710 715 720 Lys Arg Cys Ala Val His Trp Val Thr Pro Asp Gly Phe Pro Val Trp 725 730 735 Gln Glu Tyr Lys Lys Pro Ile Gln Thr Arg Leu Asn Leu Met Phe Leu 740 745 750 Gly Gln Phe Arg Leu Gln Pro Thr Ile Asn Thr Asn Lys Asp Ser Glu 755 760 765 Ile Asp Ala His Lys Gln Glu Ser Gly Ile Ala Pro Asn Phe Val His 770 775 780 Ser Gln Asp Gly Ser His Leu Arg Lys Thr Val Val Trp Ala His Glu 785 790 795 800 Lys Tyr Gly Ile Glu Ser Phe Ala Leu Ile His Asp Ser Phe Gly Thr 805 810 815 Ile Pro Ala Asp Ala Ala Asn Leu Phe Lys Ala Val Arg Glu Thr Met 820 825 830 Val Asp Thr Tyr Glu Ser Cys Asp Val Leu Ala Asp Phe Tyr Asp Gln 835 840 845 Phe Ala Asp Gln Leu His Glu Ser Gln Leu Asp Lys Met Pro Ala Leu 850 855 860 Pro Ala Lys Gly Asn Leu Asn Leu Arg Asp Ile Leu Glu Ser Asp Phe 865 870 875 880 Ala Phe Ala <210> 18 <211> 1480 <212> PRT <213> Artificial Sequence <220> <223> target protein sequence <400> 18 Met Gln Arg Ser Pro Leu Glu Lys Ala Ser Val Val Ser Lys Leu Phe 1 5 10 15 Phe Ser Trp Thr Arg Pro Ile Leu Arg Lys Gly Tyr Arg Gln Arg Leu 20 25 30 Glu Leu Ser Asp Ile Tyr Gln Ile Pro Ser Val Asp Ser Ala Asp Asn 35 40 45 Leu Ser Glu Lys Leu Glu Arg Glu Trp Asp Arg Glu Leu Ala Ser Lys 50 55 60 Lys Asn Pro Lys Leu Ile Asn Ala Leu Arg Arg Cys Phe Phe Trp Arg 65 70 75 80 Phe Met Phe Tyr Gly Ile Phe Leu Tyr Leu Gly Glu Val Thr Lys Ala 85 90 95 Val Gln Pro Leu Leu Leu Gly Arg Ile Ile Ala Ser Tyr Asp Pro Asp 100 105 110 Asn Lys Glu Glu Arg Ser Ile Ala Ile Tyr Leu Gly Ile Gly Leu Cys 115 120 125 Leu Leu Phe Ile Val Arg Thr Leu Leu Leu His Pro Ala Ile Phe Gly 130 135 140 Leu His His Ile Gly Met Gln Met Arg Ile Ala Met Phe Ser Leu Ile 145 150 155 160 Tyr Lys Lys Thr Leu Lys Leu Ser Ser Arg Val Leu Asp Lys Ile Ser 165 170 175 Ile Gly Gln Leu Val Ser Leu Leu Ser Asn Asn Leu Asn Lys Phe Asp 180 185 190 Glu Gly Leu Ala Leu Ala His Phe Val Trp Ile Ala Pro Leu Gln Val 195 200 205 Ala Leu Leu Met Gly Leu Ile Trp Glu Leu Leu Gln Ala Ser Ala Phe 210 215 220 Cys Gly Leu Gly Phe Leu Ile Val Leu Ala Leu Phe Gln Ala Gly Leu 225 230 235 240 Gly Arg Met Met Met Lys Tyr Arg Asp Gln Arg Ala Gly Lys Ile Ser 245 250 255 Glu Arg Leu Val Ile Thr Ser Glu Met Ile Glu Asn Ile Gln Ser Val 260 265 270 Lys Ala Tyr Cys Trp Glu Glu Ala Met Glu Lys Met Ile Glu Asn Leu 275 280 285 Arg Gln Thr Glu Leu Lys Leu Thr Arg Lys Ala Ala Tyr Val Arg Tyr 290 295 300 Phe Asn Ser Ser Ala Phe Phe Phe Ser Gly Phe Phe Val Val Phe Leu 305 310 315 320 Ser Val Leu Pro Tyr Ala Leu Ile Lys Gly Ile Ile Leu Arg Lys Ile 325 330 335 Phe Thr Thr Ile Ser Phe Cys Ile Val Leu Arg Met Ala Val Thr Arg 340 345 350 Gln Phe Pro Trp Ala Val Gln Thr Trp Tyr Asp Ser Leu Gly Ala Ile 355 360 365 Asn Lys Ile Gln Asp Phe Leu Gln Lys Gln Glu Tyr Lys Thr Leu Glu 370 375 380 Tyr Asn Leu Thr Thr Thr Glu Val Val Met Glu Asn Val Thr Ala Phe 385 390 395 400 Trp Glu Glu Gly Phe Gly Glu Leu Phe Glu Lys Ala Lys Gln Asn Asn 405 410 415 Asn Asn Arg Lys Thr Ser Asn Gly Asp Asp Ser Leu Phe Phe Ser Asn 420 425 430 Phe Ser Leu Leu Gly Thr Pro Val Leu Lys Asp Ile Asn Phe Lys Ile 435 440 445 Glu Arg Gly Gln Leu Leu Ala Val Ala Gly Ser Thr Gly Ala Gly Lys 450 455 460 Thr Ser Leu Leu Met Met Ile Met Gly Glu Leu Glu Pro Ser Glu Gly 465 470 475 480 Lys Ile Lys His Ser Gly Arg Ile Ser Phe Cys Ser Gln Phe Ser Trp 485 490 495 Ile Met Pro Gly Thr Ile Lys Glu Asn Ile Ile Phe Gly Val Ser Tyr 500 505 510 Asp Glu Tyr Arg Tyr Arg Ser Val Ile Lys Ala Cys Gln Leu Glu Glu 515 520 525 Asp Ile Ser Lys Phe Ala Glu Lys Asp Asn Ile Val Leu Gly Glu Gly 530 535 540 Gly Ile Thr Leu Ser Gly Gly Gln Arg Ala Arg Ile Ser Leu Ala Arg 545 550 555 560 Ala Val Tyr Lys Asp Ala Asp Leu Tyr Leu Leu Asp Ser Pro Phe Gly 565 570 575 Tyr Leu Asp Val Leu Thr Glu Lys Glu Ile Phe Glu Ser Cys Val Cys 580 585 590 Lys Leu Met Ala Asn Lys Thr Arg Ile Leu Val Thr Ser Lys Met Glu 595 600 605 His Leu Lys Lys Ala Asp Lys Ile Leu Ile Leu His Glu Gly Ser Ser 610 615 620 Tyr Phe Tyr Gly Thr Phe Ser Glu Leu Gln Asn Leu Gln Pro Asp Phe 625 630 635 640 Ser Ser Lys Leu Met Gly Cys Asp Ser Phe Asp Gln Phe Ser Ala Glu 645 650 655 Arg Arg Asn Ser Ile Leu Thr Glu Thr Leu His Arg Phe Ser Leu Glu 660 665 670 Gly Asp Ala Pro Val Ser Trp Thr Glu Thr Lys Lys Gln Ser Phe Lys 675 680 685 Gln Thr Gly Glu Phe Gly Glu Lys Arg Lys Asn Ser Ile Leu Asn Pro 690 695 700 Ile Asn Ser Ile Arg Lys Phe Ser Ile Val Gln Lys Thr Pro Leu Gln 705 710 715 720 Met Asn Gly Ile Glu Glu Asp Ser Asp Glu Pro Leu Glu Arg Arg Leu 725 730 735 Ser Leu Val Pro Asp Ser Glu Gln Gly Glu Ala Ile Leu Pro Arg Ile 740 745 750 Ser Val Ile Ser Thr Gly Pro Thr Leu Gln Ala Arg Arg Arg Gln Ser 755 760 765 Val Leu Asn Leu Met Thr His Ser Val Asn Gln Gly Gln Asn Ile His 770 775 780 Arg Lys Thr Thr Ala Ser Thr Arg Lys Val Ser Leu Ala Pro Gln Ala 785 790 795 800 Asn Leu Thr Glu Leu Asp Ile Tyr Ser Arg Arg Leu Ser Gln Glu Thr 805 810 815 Gly Leu Glu Ile Ser Glu Glu Ile Asn Glu Glu Asp Leu Lys Glu Cys 820 825 830 Leu Phe Asp Asp Met Glu Ser Ile Pro Ala Val Thr Thr Trp Asn Thr 835 840 845 Tyr Leu Arg Tyr Ile Thr Val His Lys Ser Leu Ile Phe Val Leu Ile 850 855 860 Trp Cys Leu Val Ile Phe Leu Ala Glu Val Ala Ala Ser Leu Val Val 865 870 875 880 Leu Trp Leu Leu Gly Asn Thr Pro Leu Gln Asp Lys Gly Asn Ser Thr 885 890 895 His Ser Arg Asn Asn Ser Tyr Ala Val Ile Ile Thr Ser Thr Ser Ser 900 905 910 Tyr Tyr Val Phe Tyr Ile Tyr Val Gly Val Ala Asp Thr Leu Leu Ala 915 920 925 Met Gly Phe Phe Arg Gly Leu Pro Leu Val His Thr Leu Ile Thr Val 930 935 940 Ser Lys Ile Leu His His Lys Met Leu His Ser Val Leu Gln Ala Pro 945 950 955 960 Met Ser Thr Leu Asn Thr Leu Lys Ala Gly Gly Ile Leu Asn Arg Phe 965 970 975 Ser Lys Asp Ile Ala Ile Leu Asp Asp Leu Leu Pro Leu Thr Ile Phe 980 985 990 Asp Phe Ile Gln Leu Leu Leu Ile Val Ile Gly Ala Ile Ala Val Val 995 1000 1005 Ala Val Leu Gln Pro Tyr Ile Phe Val Ala Thr Val Pro Val Ile 1010 1015 1020 Val Ala Phe Ile Met Leu Arg Ala Tyr Phe Leu Gln Thr Ser Gln 1025 1030 1035 Gln Leu Lys Gln Leu Glu Ser Glu Gly Arg Ser Pro Ile Phe Thr 1040 1045 1050 His Leu Val Thr Ser Leu Lys Gly Leu Trp Thr Leu Arg Ala Phe 1055 1060 1065 Gly Arg Gln Pro Tyr Phe Glu Thr Leu Phe His Lys Ala Leu Asn 1070 1075 1080 Leu His Thr Ala Asn Trp Phe Leu Tyr Leu Ser Thr Leu Arg Trp 1085 1090 1095 Phe Gln Met Arg Ile Glu Met Ile Phe Val Ile Phe Phe Ile Ala 1100 1105 1110 Val Thr Phe Ile Ser Ile Leu Thr Thr Gly Glu Gly Glu Gly Arg 1115 1120 1125 Val Gly Ile Ile Leu Thr Leu Ala Met Asn Ile Met Ser Thr Leu 1130 1135 1140 Gln Trp Ala Val Asn Ser Ser Ile Asp Val Asp Ser Leu Met Arg 1145 1150 1155 Ser Val Ser Arg Val Phe Lys Phe Ile Asp Met Pro Thr Glu Gly 1160 1165 1170 Lys Pro Thr Lys Ser Thr Lys Pro Tyr Lys Asn Gly Gln Leu Ser 1175 1180 1185 Lys Val Met Ile Ile Glu Asn Ser His Val Lys Lys Asp Asp Ile 1190 1195 1200 Trp Pro Ser Gly Gly Gln Met Thr Val Lys Asp Leu Thr Ala Lys 1205 1210 1215 Tyr Thr Glu Gly Gly Asn Ala Ile Leu Glu Asn Ile Ser Phe Ser 1220 1225 1230 Ile Ser Pro Gly Gln Arg Val Gly Leu Leu Gly Arg Thr Gly Ser 1235 1240 1245 Gly Lys Ser Thr Leu Leu Ser Ala Phe Leu Arg Leu Leu Asn Thr 1250 1255 1260 Glu Gly Glu Ile Gln Ile Asp Gly Val Ser Trp Asp Ser Ile Thr 1265 1270 1275 Leu Gln Gln Trp Arg Lys Ala Phe Gly Val Ile Pro Gln Lys Val 1280 1285 1290 Phe Ile Phe Ser Gly Thr Phe Arg Lys Asn Leu Asp Pro Tyr Glu 1295 1300 1305 Gln Trp Ser Asp Gln Glu Ile Trp Lys Val Ala Asp Glu Val Gly 1310 1315 1320 Leu Arg Ser Val Ile Glu Gln Phe Pro Gly Lys Leu Asp Phe Val 1325 1330 1335 Leu Val Asp Gly Gly Cys Val Leu Ser His Gly His Lys Gln Leu 1340 1345 1350 Met Cys Leu Ala Arg Ser Val Leu Ser Lys Ala Lys Ile Leu Leu 1355 1360 1365 Leu Asp Glu Pro Ser Ala His Leu Asp Pro Val Thr Tyr Gln Ile 1370 1375 1380 Ile Arg Arg Thr Leu Lys Gln Ala Phe Ala Asp Cys Thr Val Ile 1385 1390 1395 Leu Cys Glu His Arg Ile Glu Ala Met Leu Glu Cys Gln Gln Phe 1400 1405 1410 Leu Val Ile Glu Glu Asn Lys Val Arg Gln Tyr Asp Ser Ile Gln 1415 1420 1425 Lys Leu Leu Asn Glu Arg Ser Leu Phe Arg Gln Ala Ile Ser Pro 1430 1435 1440 Ser Asp Arg Val Lys Leu Phe Pro His Arg Asn Ser Ser Lys Cys 1445 1450 1455 Lys Ser Lys Pro Gln Ile Ala Ala Leu Lys Glu Glu Thr Glu Glu 1460 1465 1470 Glu Val Gln Asp Thr Arg Leu 1475 1480 <210> 19 <211> 446 <212> PRT <213> Artificial Sequence <220> <223> target protein sequence <400> 19 Met Arg Thr Leu Asn Thr Ser Ala Met Asp Gly Thr Gly Leu Val Val 1 5 10 15 Glu Arg Asp Phe Ser Val Arg Ile Leu Thr Ala Cys Phe Leu Ser Leu 20 25 30 Leu Ile Leu Ser Thr Leu Leu Gly Asn Thr Leu Val Cys Ala Ala Val 35 40 45 Ile Arg Phe Arg His Leu Arg Ser Lys Val Thr Asn Phe Phe Val Ile 50 55 60 Ser Leu Ala Val Ser Asp Leu Leu Val Ala Val Leu Val Met Pro Trp 65 70 75 80 Lys Ala Val Ala Glu Ile Ala Gly Phe Trp Pro Phe Gly Ser Phe Cys 85 90 95 Asn Ile Trp Val Ala Phe Asp Ile Met Cys Ser Thr Ala Ser Ile Leu 100 105 110 Asn Leu Cys Val Ile Ser Val Asp Arg Tyr Trp Ala Ile Ser Ser Pro 115 120 125 Phe Arg Tyr Glu Arg Lys Met Thr Pro Lys Ala Ala Phe Ile Leu Ile 130 135 140 Ser Val Ala Trp Thr Leu Ser Val Leu Ile Ser Phe Ile Pro Val Gln 145 150 155 160 Leu Ser Trp His Lys Ala Lys Pro Thr Ser Pro Ser Asp Gly Asn Ala 165 170 175 Thr Ser Leu Ala Glu Thr Ile Asp Asn Cys Asp Ser Ser Leu Ser Arg 180 185 190 Thr Tyr Ala Ile Ser Ser Ser Val Ile Ser Phe Tyr Ile Pro Val Ala 195 200 205 Ile Met Ile Val Thr Tyr Thr Arg Ile Tyr Arg Ile Ala Gln Lys Gln 210 215 220 Ile Arg Arg Ile Ala Ala Leu Glu Arg Ala Ala Val His Ala Lys Asn 225 230 235 240 Cys Gln Thr Thr Thr Gly Asn Gly Lys Pro Val Glu Cys Ser Gln Pro 245 250 255 Glu Ser Ser Phe Lys Met Ser Phe Lys Arg Glu Thr Lys Val Leu Lys 260 265 270 Thr Leu Ser Val Ile Met Gly Val Phe Val Cys Cys Trp Leu Pro Phe 275 280 285 Phe Ile Leu Asn Cys Ile Leu Pro Phe Cys Gly Ser Gly Glu Thr Gln 290 295 300 Pro Phe Cys Ile Asp Ser Asn Thr Phe Asp Val Phe Val Trp Phe Gly 305 310 315 320 Trp Ala Asn Ser Ser Leu Asn Pro Ile Ile Tyr Ala Phe Asn Ala Asp 325 330 335 Phe Arg Lys Ala Phe Ser Thr Leu Leu Gly Cys Tyr Arg Leu Cys Pro 340 345 350 Ala Thr Asn Asn Ala Ile Glu Thr Val Ser Ile Asn Asn Asn Gly Ala 355 360 365 Ala Met Phe Ser Ser His His Glu Pro Arg Gly Ser Ile Ser Lys Glu 370 375 380 Cys Asn Leu Val Tyr Leu Ile Pro His Ala Val Gly Ser Ser Glu Asp 385 390 395 400 Leu Lys Lys Glu Glu Ala Ala Gly Ile Ala Arg Pro Leu Glu Lys Leu 405 410 415 Ser Pro Ala Leu Ser Val Ile Leu Asp Tyr Asp Thr Asp Val Ser Leu 420 425 430 Glu Lys Ile Gln Pro Ile Thr Gln Asn Gly Gln His Pro Thr 435 440 445 <210> 20 <211> 702 <212> PRT <213> Artificial Sequence <220> <223> target protein sequence <400> 20 Met Thr Arg Pro Leu Leu Ala Val Pro Gly Pro Asp Gly Gly Gly Gly 1 5 10 15 Thr Gly Pro Trp Trp Ala Ala Gly Gly Arg Gly Pro Arg Glu Val Ser 20 25 30 Pro Gly Ala Gly Thr Glu Val Gln Asp Ala Leu Glu Arg Ala Leu Pro 35 40 45 Glu Leu Gln Gln Ala Leu Ser Ala Leu Lys Gln Ala Gly Gly Ala Arg 50 55 60 Ala Val Gly Ala Gly Leu Ala Glu Val Phe Gln Leu Val Glu Glu Ala 65 70 75 80 Trp Leu Leu Pro Ala Val Gly Arg Glu Val Ala Gln Gly Leu Cys Asp 85 90 95 Ala Ile Arg Leu Asp Gly Gly Leu Asp Leu Leu Leu Arg Leu Leu Gln 100 105 110 Ala Pro Glu Leu Glu Thr Arg Val Gln Ala Ala Arg Leu Leu Glu Gln 115 120 125 Ile Leu Val Ala Glu Asn Arg Asp Arg Val Ala Arg Ile Gly Leu Gly 130 135 140 Val Ile Leu Asn Leu Ala Lys Glu Arg Glu Pro Val Glu Leu Ala Arg 145 150 155 160 Ser Val Ala Gly Ile Leu Glu His Met Phe Lys His Ser Glu Glu Thr 165 170 175 Cys Gln Arg Leu Val Ala Ala Gly Gly Leu Asp Ala Val Leu Tyr Trp 180 185 190 Cys Arg Arg Thr Asp Pro Ala Leu Leu Arg His Cys Ala Leu Ala Leu 195 200 205 Gly Asn Cys Ala Leu His Gly Gly Gln Ala Val Gln Arg Arg Met Val 210 215 220 Glu Lys Arg Ala Ala Glu Trp Leu Phe Pro Leu Ala Phe Ser Lys Glu 225 230 235 240 Asp Glu Leu Leu Arg Leu His Ala Cys Leu Ala Val Ala Val Leu Ala 245 250 255 Thr Asn Lys Glu Val Glu Arg Glu Val Glu Arg Ser Gly Thr Leu Ala 260 265 270 Leu Val Glu Pro Leu Val Ala Ser Leu Asp Pro Gly Arg Phe Ala Arg 275 280 285 Cys Leu Val Asp Ala Ser Asp Thr Ser Gln Gly Arg Gly Pro Asp Asp 290 295 300 Leu Gln Arg Leu Val Pro Leu Leu Asp Ser Asn Arg Leu Glu Ala Gln 305 310 315 320 Cys Ile Gly Ala Phe Tyr Leu Cys Ala Glu Ala Ala Ile Lys Ser Leu 325 330 335 Gln Gly Lys Thr Lys Val Phe Ser Asp Ile Gly Ala Ile Gln Ser Leu 340 345 350 Lys Arg Leu Val Ser Tyr Ser Thr Asn Gly Thr Lys Ser Ala Leu Ala 355 360 365 Lys Arg Ala Leu Arg Leu Leu Gly Glu Glu Val Pro Arg Pro Ile Leu 370 375 380 Pro Ser Val Pro Ser Trp Lys Glu Ala Glu Val Gln Thr Trp Leu Gln 385 390 395 400 Gln Ile Gly Phe Ser Lys Tyr Cys Glu Ser Phe Arg Glu Gln Gln Val 405 410 415 Asp Gly Asp Leu Leu Leu Arg Leu Thr Glu Glu Glu Leu Gln Thr Asp 420 425 430 Leu Gly Met Lys Ser Gly Ile Thr Arg Lys Arg Phe Phe Arg Glu Leu 435 440 445 Thr Glu Leu Lys Thr Phe Ala Asn Tyr Ser Thr Cys Asp Arg Ser Asn 450 455 460 Leu Ala Asp Trp Leu Gly Ser Leu Asp Pro Arg Phe Arg Gln Tyr Thr 465 470 475 480 Tyr Gly Leu Val Ser Cys Gly Leu Asp Arg Ser Leu Leu His Arg Val 485 490 495 Ser Glu Gln Gln Leu Leu Glu Asp Cys Gly Ile His Leu Gly Val His 500 505 510 Arg Ala Arg Ile Leu Thr Ala Ala Arg Glu Met Leu His Ser Pro Leu 515 520 525 Pro Cys Thr Gly Gly Lys Pro Ser Gly Asp Thr Pro Asp Val Phe Ile 530 535 540 Ser Tyr Arg Arg Asn Ser Gly Ser Gln Leu Ala Ser Leu Leu Lys Val 545 550 555 560 His Leu Gln Leu His Gly Phe Ser Val Phe Ile Asp Val Glu Lys Leu 565 570 575 Glu Ala Gly Lys Phe Glu Asp Lys Leu Ile Gln Ser Val Met Gly Ala 580 585 590 Arg Asn Phe Val Leu Val Leu Ser Pro Gly Ala Leu Asp Lys Cys Met 595 600 605 Gln Asp His Asp Cys Lys Asp Trp Val His Lys Glu Ile Val Thr Ala 610 615 620 Leu Ser Cys Gly Lys Asn Ile Val Pro Ile Ile Asp Gly Phe Glu Trp 625 630 635 640 Pro Glu Pro Gln Val Leu Pro Glu Asp Met Gln Ala Val Leu Thr Phe 645 650 655 Asn Gly Ile Lys Trp Ser His Glu Tyr Gln Glu Ala Thr Ile Glu Lys 660 665 670 Ile Ile Arg Phe Leu Gln Gly Arg Ser Ser Arg Asp Ser Ser Ala Gly 675 680 685 Ser Asp Thr Ser Leu Glu Gly Ala Ala Pro Met Gly Pro Thr 690 695 700 <210> 21 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> FLAG tag <400> 21 Asp Tyr Lys Asp Asp Asp Asp Lys 1 5 <210> 22 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 22 gcccgggatc caccggtcgc caccatggtg agcaagggcg aggagc 46 <210> 23 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 23 agatggctgg caactagaag gcacagttac ttgtacagct cgtccatgcc gag 53 <210> 24 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 24 cactctcggc atggacgagc tgtacaagta actgtgcctt ctagttgcca gccatctgt 59 <210> 25 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 25 cagctcctcg cccttgctca ccatggtggc gaccggtgga tccc 44 <210> 26 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 26 cggccagtaa cgttaggggg gggggattac ttgtacagct cgtccatgcc gag 53 <210> 27 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 27 cggtaccgcg ggcccgggat ccaccggtcg ccaccatggt gagcaagggc gaggagc 57 <210> 28 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 28 ctcggcatgg acgagctgta caagtaatcc ccccccccta acgttactgg 50 <210> 29 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 29 acgggggagg ggcaaacaac agatggctgg caactagaag gcacagctgt aactcgaaaa 60 cgacttccat gtctaattcg g 81 <210> 30 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 30 cgcgggcccg ggatccaccg gtcgccacca tgaacaccat caatattgcc aagaacgact 60 tttctgacat cg 72 <210> 31 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 31 agatggctgg caactagaag gcacagttag ggtcaggcaa atgcgaaatc ggactccag 59 <210> 32 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 32 cctggagtcc gatttcgcat ttgcctgacc ctaactgtgc cttctagttg ccagccatct 60 gt 62 <210> 33 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 33 cgttcttggc aatattgatg gtgttcatgg tggcgaccgg tggatcccgg gcc 53 <210> 34 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 34 accttggccg actctggtaa tggtaatacg actcactata ggaaaaa 47 <210> 35 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 35 agtcagtgag cgaggaagcc caaaaaaccc ctcaagaccc gttta 45 <210> 36 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 36 aaacgggtct tgaggggttt tttgggcttc ctcgctcact gac 43 <210> 37 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 37 tagtgagtcg tattaccatt accagagtcg gccaaggt 38 <210> 38 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 38 gcccgggatc caccggtcgc cacctcgcca ccatgaggac tctgaacacc tctgccatgg 60 <210> 39 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 39 cttttcgaac tgcgggtggc tccagagcgg ccgcgttccc gtggttgggt gctgaccgtt 60 ttgtgtg 67 <210> 40 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 40 acgcggccgc tctggagcca cccgcagttc gaaaagtaaa gcggccgcga ctctagatca 60 <210> 41 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 41 gtgttcagag tcctcatggt ggcgaggtgg cgacc 35 <210> 42 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 42 atccaccggt cgccaccatg aggactctga acacctctgc catgg 45 <210> 43 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 43 tgtggtatgg ctgattatga tttactgtaa ctcgaaaacg acttccatgt ctaattcggg 60 <210> 44 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 44 gttttcgagt tacagtaaat cataatcagc cataccacat ttgtagaggt tttacttgct 60 <210> 45 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 45 tggcagaggt gttcagagtc ctcatggtgg cgaccggtgg 40 <210> 46 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 46 caccatcacc atcaccatgt tatggccaca accatggaac aagagactt 49 <210> 47 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 47 tcttgatgag ctgttcttcc aggaggataa agttgttcat ggtggcgacc ggtggatccc 60 <210> 48 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 48 cgggcccggg atccaccggt cgccaccatg aacaacttta tcctcctgga agaacagctc 60 <210> 49 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 49 aagtctcttg ttccatggtt gtggccataa catggtgatg gtgatggtg 49 <210> 50 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 50 ctctcggcat ggacgagctg tacaag 26 <210> 51 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 51 ttacttgtac agctcgtcca tgccgagag 29 <210> 52 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 52 tgcgcgcaag tctcttgttc catggttgtg gccatggtgg cgaccggtgg atccc 55 <210> 53 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 53 cccgaattag acatggaagt cgttttcgag ttacag 36 <210> 54 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 54 gggatccacc ggtcgccacc atggccacaa ccatggaaca agagacttg 49 <210> 55 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 55 ctgtaactcg aaaacgactt ccatgtctaa ttcggg 36 <210> 56 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 56 tctcttgttc catggttgtg gccatggtgg cgaccggtgg 40 <210> 57 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 57 acgtggtttt cctttgaaaa acacgatgat aaatgaggac tctgaacacc tctgccatgg 60 <210> 58 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 58 gcagaggtgt tcagagtcct catttatcat cgtgtttttc aaaggaaaac cacg 54 <210> 59 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 59 agtcgttttc gagttacagt aatccccccc ccctaacgtt actgg 45 <210> 60 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 60 ccagtaacgt tagggggggg ggattactgt aactcgaaaa cgacttccat gt 52 <210> 61 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 61 ccaccggtcg ccaccatggc cacaaccatg gaacaagag 39 <210> 62 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 62 gatggtgtcc cccgccacct ccgccacctc caagtcctga ttctgcaatt tcagccagtt 60 <210> 63 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 63 aattgcagaa tcaggacttg gaggtggcgg aggtggcggg ggacaccatc accatcacca 60 tgtttaatcc ccccccccta acgttactgg 90 <210> 64 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 64 ttataggcgg acagcagcag ggtcagcacc atggtggcga ggtggcgacc 50 <210> 65 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 65 cggccgctcg attacaagga tgacgacgat aaggtttaaa gcggccgcga ctctagatca 60 <210> 66 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 66 taaaccttat cgtcgtcatc cttgtaatcg agcggccgcg ttgtagggcc catgggggcg 60 <210> 67 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 67 gcgggcccgg gatccaccgg tcgccacctc gccaccatgg tgctgaccct gctgctgtcc 60 <210> 68 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 68 ccctgtcttc atggggcgag tatatgaccc cagggccgga ggtggcggag gtggc 55 <210> 69 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 69 ggagggtcag cagggtcagc ctggaggcca tggtggcgac cggtggatcc 50 <210> 70 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 70 cggtaccgcg ggcccgggat ccaccggtcg ccaccatggc ctccaggctg accctg 56 <210> 71 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 71 tggtgtcccc cgccacctcc gccacctccg gccctggggt catatactcg cc 52 <210> 72 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 72 aattgcagaa tcaggacttg gaggtggcgg aggtggcggg ggacacc 47 <210> 73 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 73 cataatcagc cataccacat ttgtagaggt tttacttgc 39 <210> 74 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 74 tacttgtaca gctcgtccat gccgagag 28 <210> 75 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 75 ctctcggcat ggacgagctg tacaagta 28 <210> 76 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 76 gcaagtaaaa cctctacaaa tgtggtatgg ctgattatg 39 <210> 77 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 77 tcctctctgc ttctagaata aatcataatc agccatacca catttgtaga ggttttactt 60 gct 63 <210> 78 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 78 tgtcatgaat cagtaggtcc gcaaagtaac cagcgtagtg cttgtacagc tcgtccatgc 60 cgagag 66 <210> 79 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 79 actttgcgga cctactgatt catgacattg agacaaatcc agggatgaac tttctacgta 60 agatagtgaa aaatt 75 <210> 80 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 80 acctctacaa atgtggtatg gctgattatg atttattcta gaagcagaga ggaatctttg 60 <210> 81 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 81 gctggttact ttgcggacct actgattcat gacattgaga caaatccagg gggattcgga 60 caccaaaaca aagcggtgta cactg 85 <210> 82 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 82 aaacctctac aaatgtggta tggctgatta tgatttgttc catggcttct tcttcgtagg 60 catacaagtc 70 <210> 83 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 83 tgtctcaatg tcatgaatca gtaggtccgc aaagtaacca gcgtagtgct tgtacagctc 60 gtccatgccg agagtgatcc c 81 <210> 84 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 84 gagacttgta tgcctacgaa gaagaagcca tggaacaaat cataatcagc cataccacat 60 ttgtagaggt tttacttgct 80 <210> 85 <211> 73 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 85 catggcagag gtgttcagag tcctcatggt ggcgaccggt ggattcacga cacctgaaat 60 ggaagaaaaa aac 73 <210> 86 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 86 attaccgcca tgcattagtt attaggctcc ggtgcccgtc agtgggcaga gcg 53 <210> 87 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 87 agtttttttc ttccatttca ggtgtcgtga atccaccggt cgccaccatg aggactctga 60 acacctc 67 <210> 88 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 88 gtgcgctctg cccactgacg ggcaccggag cctaataact aatgcatggc ggtaat 56 <210> 89 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 89 gaggccgagg ccgcctcggc ctctgagcta atccaccggt cgccaccatg aggactctga 60 acacctc 67 <210> 90 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 90 ataaccgtat taccgccatg cattagttat taggtgtgga aagtccccag gctccccagc 60 aggcaga 67 <210> 91 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 91 ttcagagtcc tcatggtggc gaccggtgga ttagctcaga ggccgaggcg gcctcggcct 60 ct 62 <210> 92 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 92 tctgcctgct ggggagcctg gggactttcc acacctaata actaatgcat ggcggtaata 60 cggtta 66 <210> 93 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 93 ggaggtggcg gaggtggcgg gggacaccat caccatca 38 <210> 94 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 94 agacaacgct ggccttttcc agaggcgacc tctgcatggt ggcgaccggt ggatcccggg 60 cccg 64 <210> 95 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 95 cgggcccggg atccaccggt cgccaccatg cagaggtcgc ctctggaaaa ggccagcgtt 60 gtctc 65 <210> 96 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 96 ccccgccacc tccgccacct ccaagccttg tatcttgcac ctcttcttct gtctcc 56

Claims

하나 이상의 벡터를 포함하는, 진핵 세포 내 표적 단백질의 재조합 발현을 위한 시스템으로서, 하나 이상의 벡터는
a) 표적 단백질을 코딩하는 제1 폴리뉴클레오타이드; 및
b) 인핸서 단백질을 코딩하는 제2 폴리뉴클레오타이드로서,
i) 인핸서 단백질은 핵세포질 수송(nucleocytoplasmic transport, NCT)의 억제제이고/이거나
ii) 인핸서 단백질은 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 단순 포진 바이러스(HSV) ICP27 단백질, 및 랍도바이러스 기질(M) 단백질로 이루어진 군으로부터 선택되는 것인 제2 폴리뉴클레오타이드
를 포함하고,
제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드는 하나 이상의 프로모터에 작동가능하게 연결된 것인 시스템.
제1항에 있어서, 인핸서 단백질은 핵세포질 수송(NCT)의 억제제인 시스템.
제2항에 있어서, NCT 억제제는 바이러스 단백질인 시스템.
제1항 내지 제3항 중 어느 한 항에 있어서, NCT 억제제는 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 코로나바이러스 ORF6 단백질, 에볼라바이러스 VP24 단백질, 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질, 단순 포진 바이러스(HSV) ICP27 단백질 및 랍도바이러스 기질(M) 단백질로 이루어진 군으로부터 선택되는 것인 시스템.
제4항에 있어서, NCT 억제제는 피코르나바이러스 리더(L) 단백질 또는 그의 기능적 변이체인 시스템.
제4항에 있어서, NCT 억제제는 피코르나바이러스 2A 프로테아제 또는 그의 기능적 변이체인 시스템.
제4항에 있어서, NCT 억제제는 라이노바이러스 3C 프로테아제 또는 그의 기능적 변이체인 시스템.
제4항에 있어서, NCT 억제제는 코로나바이러스 ORF6 단백질 또는 그의 기능적 변이체인 시스템.
제4항에 있어서, NCT 억제제는 에볼라바이러스 VP24 단백질 또는 그의 기능적 변이체인 시스템.
제4항에 있어서, NCT 억제제는 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질 또는 그의 기능적 변이체인 시스템.
제4항에 있어서, NCT 억제제는 단순 포진 바이러스(HSV) ICP27 단백질 또는 그의 기능적 변이체인 시스템.
제4항에 있어서, NCT 억제제는 랍도바이러스 기질(M) 단백질 또는 그의 기능적 변이체인 시스템.
제5항에 있어서, L 단백질은 타일러 바이러스의 L 단백질 또는 그의 기능적 변이체인 시스템.
제5항에 있어서, L 단백질은 서열번호: 1과 적어도 90% 동일성을 공유하는 것인 시스템.
제5항에 있어서, L 단백질은 뇌심근염 바이러스(EMCV)의 L 단백질 또는 그의 기능적 변이체인 시스템.
제5항에 있어서, L 단백질은 서열번호: 2와 적어도 90% 동일성을 공유하는 것인 시스템.
제5항에 있어서, L 단백질은 폴리오바이러스의 L 단백질, HRV16의 L 단백질, 멩고 바이러스의 L 단백질, 및 사폴드 바이러스 2의 L 단백질 또는 그의 기능적 변이체로 이루어진 군으로부터 선택되는 것인 시스템.
제1항 내지 제17항 중 어느 한 항에 있어서, 시스템은 발현 카세트를 포함하는 단일 벡터를 포함하고, 발현 카세트는 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드를 포함하는 것인 시스템.
제18항에 있어서, 발현 카세트는 제1 폴리뉴클레오타이드에 작동가능하게 연결된 제1 프로모터; 및 제2 폴리뉴클레오타이드에 작동가능하게 연결된 제2 프로모터를 포함하는 것인 시스템.
제18항에 있어서, 발현 카세트는 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드 모두에 작동가능하게 연결된 공유 프로모터를 포함하는 것인 시스템.
제20항에 있어서, 발현 카세트는 리보솜 스키핑 부위(ribosome skipping site)를 코딩하는 폴리뉴클레오타이드에 의해 연결된 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드를 포함하는 코딩 폴리뉴클레오타이드를 포함하고, 코딩 폴리뉴클레오타이드는 공유 프로모터에 작동가능하게 연결된 것인 시스템.
제20항에 있어서, 발현 카세트는 코딩 폴리뉴클레오타이드를 포함하고, 코딩 폴리뉴클레오타이드는 리보솜 스키핑 부위에 의해 연결된 인핸서 단백질 및 표적 단백질을 코딩하며, 코딩 폴리뉴클레오타이드는 공유 프로모터에 작동가능하게 연결된 것인 시스템.
제18항 내지 제22항 중 어느 한 항에 있어서, 발현 카세트는 리보솜 스키핑 부위에 의해 연결된 표적 단백질 및 인핸서 단백질 모두를 코딩하는 단일 메신저 RNA의 전사를 위해 구성되고; 메신저 RNA의 번역은 별개의 폴리펩타이드로서 표적 단백질 및 L 단백질의 발현을 유도하는 것인 시스템.
제1항 내지 제23항 중 어느 한 항에 있어서, 시스템은 하나의 벡터를 포함하는 것인 시스템.
제1항 내지 제17항 중 어느 한 항에 있어서,
a) 제1 프로모터에 작동가능하게 연결된 제1 폴리뉴클레오타이드를 포함하는 제1 벡터; 및
b) 제2 프로모터에 작동가능하게 연결된 제2 폴리뉴클레오타이드를 포함하는 제2 벡터
를 포함하는 시스템.
제1항 내지 제17항 또는 제25항 중 어느 한 항에 있어서, 시스템은 2개의 벡터를 포함하는 것인 시스템.
제1항 내지 제26항 중 어느 한 항에 있어서, 제1 폴리뉴클레오타이드 또는 제2 폴리뉴클레오타이드, 또는 둘 모두는 내부 리보솜 진입 부위(IRES)에 작동가능하게 연결된 것인 시스템.
제1항 내지 제27항 중 어느 한 항에 있어서, 하나 이상의 벡터 중 적어도 하나는 T7 RNA 중합효소에 의한 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드 중 어느 하나 또는 둘 모두의 전사를 위해 구성된 T7 프로모터를 포함하는 것인 시스템.
제1항 내지 제28항 중 어느 한 항에 있어서, 하나 이상의 벡터 중 적어도 하나는 T7 RNA 중합효소를 코딩하는 폴리뉴클레오타이드 서열을 포함하는 것인 시스템.
진핵 세포 내 표적 단백질의 재조합 발현을 위한 벡터로서,
a) 표적 단백질을 코딩하는 제1 폴리뉴클레오타이드; 및
b) 인핸서 단백질을 코딩하는 제2 폴리뉴클레오타이드로서,
i) 인핸서 단백질은 핵세포질 수송(NCT)의 억제제이고/이거나
ii) 인핸서 단백질은 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 코로나바이러스 ORF6 단백질, 에볼라바이러스 VP24 단백질, 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질, 단순 포진 바이러스(HSV) ICP27 단백질, 및 랍도바이러스 기질(M) 단백질로 이루어진 군으로부터 선택되는 것인 제2 폴리뉴클레오타이드
를 포함하고,
제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드는 적어도 하나의 프로모터에 작동가능하게 연결된 것인 벡터.
제30항에 있어서, 발현 카세트는 제1 폴리뉴클레오타이드에 작동가능하게 연결된 제1 프로모터; 및 제2 폴리뉴클레오타이드에 작동가능하게 연결된 제2 프로모터를 포함하는 것인 벡터.
제30항에 있어서, 발현 카세트는 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드 모두에 작동가능하게 연결된 공유 프로모터를 포함하는 것인 벡터.
인핸서 단백질을 코딩하는 외인성 폴리뉴클레오타이드를 포함하는 표적 단백질의 발현을 위한 진핵 세포로서,
a) 인핸서 단백질은 핵세포질 수송(NCT)의 억제제이고/이거나
b) 인핸서 단백질은 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 코로나바이러스 ORF6 단백질, 에볼라바이러스 VP24 단백질, 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질, 단순 포진 바이러스(HSV) ICP27 단백질 및 랍도바이러스 기질(M) 단백질로 이루어진 군으로부터 선택되고,
외인성 폴리뉴클레오타이드는 프로모터에 작동가능하게 연결된 것인 진핵 세포.
제33항에 있어서, 폴리뉴클레오타이드는 내부 리보솜 진입 부위(IRES)에 작동가능하게 연결된 것인 진핵 세포.
제33항 또는 제34항에 있어서, 프로모터는 유도성 프로모터인 진핵 세포.
프로모터에 작동가능하게 연결된 표적 단백질을 코딩하는 폴리뉴클레오타이드를 제33항 내지 제35항 중 어느 한 항의 세포 내로 도입하는 단계를 포함하는, 표적 단백질의 재조합 발현 방법.
제1항 내지 제29항 중 어느 한 항의 시스템 또는 제30항 내지 제32항 중 어느 한 항의 벡터를 진핵 세포 내로 도입하는 단계를 포함하는, 표적 단백질의 재조합 발현 방법.
제36항 또는 제37항에 있어서, 표적 단백질은 막 단백질인 방법.
제38항에 있어서, 막 단백질의 세포막으로의 국소화는 막 단백질이 인핸서 단백질 없이 발현될 때 관찰된 국소화와 비교하여 증가되는 것인 방법.
제1항 내지 제29항 중 어느 한 항의 시스템, 또는 제30항 내지 제32항 중 어느 한 항의 벡터를 진핵 세포 내로 도입함으로써 생성된 진핵 세포.
제1항 내지 제29항 중 어느 한 항의 시스템 또는 제30항 내지 제32항 중 어느 한 항의 벡터를 진핵 세포 내로 도입함으로써 발현되는 표적 단백질.
표적 단백질을 코딩하는, 프로모터에 작동가능하게 연결된 폴리뉴클레오타이드를 진핵 세포 내로 도입하는 단계를 포함하는, 진핵 세포 내 표적 단백질을 발현시키는 방법으로서,
상기 방법은 표적 단백질의 발현 수준, 용해도 및/또는 활성을 향상시키기 위해 인핸서 단백질의 동시 발현을 이용하며,
a) 인핸서 단백질은 핵세포질 수송(NCT)의 억제제이고/이거나
b) 인핸서 단백질은 피코르나바이러스 리더(L) 단백질, 피코르나바이러스 2A 프로테아제, 라이노바이러스 3C 프로테아제, 코로나바이러스 ORF6 단백질, 에볼라바이러스 VP24 단백질, 베네수엘라 말 뇌염 바이러스(VEEV) 캡시드 단백질, 단순 포진 바이러스(HSV) ICP27 단백질 및 랍도바이러스 기질(M) 단백질로 이루어진 군으로부터 선택되는 것인 진핵 세포 내 표적 단백질을 발현시키는 방법.
제42항에 있어서, 인핸서 단백질의 동시 발현은 프로모터에 작동가능하게 연결된 인핸서 단백질을 코딩하는 폴리뉴클레오타이드를 진핵 세포 내로 도입하는 것을 포함하는 방법.
제42항 또는 제43항에 있어서, 도입 단계(들)는 하나 이상의 DNA 분자를 이용한 진핵 세포의 형질감염, 단일 바이러스 벡터를 이용한 진핵 세포의 형질도입, 및/또는 2개의 바이러스 벡터를 이용한 진핵 세포의 형질도입을 포함하는 것인 방법.
제1항 내지 제44항 중 어느 한 항에 있어서, 표적 단백질은 가용성 단백질인 시스템, 벡터, 진핵 세포, 방법, 및 표적 단백질.
제1항 내지 제44항 중 어느 한 항에 있어서, 표적 단백질은 분비 단백질인 시스템, 벡터, 세포, 또는 방법.
제1항 내지 제44항 중 어느 한 항에 있어서, 표적 단백질은 막 단백질인 시스템, 벡터, 진핵 세포, 방법, 및 표적 단백질.
제1항 내지 제44항 중 어느 한 항에 있어서, 표적 단백질은 도파민 수용체 1(DRD1)이고, 선택적으로 DRD1은 서열번호: 19의 아미노산 서열과 적어도 90% 동일성을 갖는 아미노산 서열을 포함하는 것인 시스템, 벡터, 진핵 세포, 방법, 및 표적 단백질.
제1항 내지 제44항 중 어느 한 항에 있어서, 표적 단백질은 낭포성 섬유증 막관통 전도도 조절자(Cystic fibrosis transmembrane conductance regulator, CFTR)이고, 선택적으로 CFTR은 서열번호: 18의 아미노산 서열과 적어도 90% 동일성을 갖는 아미노산 서열을 포함하는 것인 시스템, 벡터, 진핵 세포, 방법, 및 표적 단백질.
제1항 내지 제44항 중 어느 한 항에 있어서, 표적 단백질은 C1 에스테라제 억제제(C1-Inh)이고, 선택적으로 C1-Inh는 서열번호: 16의 아미노산 서열과 적어도 90% 동일성을 갖는 아미노산 서열을 포함하는 것인 시스템, 벡터, 진핵 세포, 방법, 및 표적 단백질.
제1항 내지 제44항 중 어느 한 항에 있어서, 표적 단백질은 ITK이고, 선택적으로 ITK는 서열번호: 15의 아미노산 서열과 적어도 90% 동일성을 갖는 아미노산 서열을 포함하는 것인 시스템, 벡터, 진핵 세포, 방법, 및 표적 단백질.
제1항 내지 제44항 중 어느 한 항에 있어서, 표적 단백질은 NADase이고, 선택적으로 NADase는 서열번호: 20의 아미노산 서열과 적어도 90% 동일성을 갖는 아미노산 서열을 포함하는 것인 시스템, 벡터, 진핵 세포, 방법, 및 표적 단백질.
제33항 내지 제35항 중 어느 한 항의 세포, 제40항의 세포, 또는 제41항의 표적 단백질로 대상체를 면역화하는 단계를 포함하는, 표적 단백질에 대한 항체를 생성하는 방법.
제53항에 있어서, 표적 단백질에 특이적인 면역글로불린 단백질을 발현하는 하나 이상의 면역 세포를 단리하는 단계를 추가로 포함하는 방법.
제53항 또는 제54항에 있어서, 하나 이상의 면역 세포로부터 하나 이상의 하이브리도마를 생성하는 단계를 포함하는 방법.
제53항 내지 제55항 중 어느 한 항에 있어서, 하나 이상의 면역 세포로부터의 하나 이상의 면역글로불린 유전자를 클로닝하는 단계를 포함하는 방법.
세포 분류에 의한 항체 발견 방법으로서,
a) 제33항 내지 제35항 중 어느 한 항의 세포, 제40항의 진핵 세포, 또는 제41항의 표적 단백질로서, 세포 또는 표적 단백질은 표지된 것, 및
b) 재조합 세포의 집단으로서, 재조합 세포는 각각 항체 또는 이의 항원 결합 단편을 포함하는 폴리펩타이드의 라이브러리를 발현하는 것
을 포함하는 용액을 제공하는 단계; 및
표지된 세포 또는 표지된 표적 단백질에 결합된 재조합 세포를 분류함으로써 용액으로부터 하나 이상의 재조합 세포를 단리하는 단계
를 포함하는, 세포 분류에 의한 항체 발견 방법.
파지 디스플레이 라이브러리를 패닝(panning)하는 방법으로서,
a) 파지 디스플레이 라이브러리를 제33항 내지 제35항 중 어느 한 항의 진핵 세포, 제40항의 진핵 세포, 또는 제41항의 표적 단백질과 혼합하는 단계; 및
b) 세포 또는 표적 단백질에 결합하는 파지 디스플레이 라이브러리의 구성원을 정제 및/또는 농축하는 단계
를 포함하는, 파지 디스플레이 라이브러리를 패닝하는 방법.
제33항 내지 제35항 및 제40항 중 어느 한 항에 있어서, 인간 세포, 동물 세포, 곤충 세포, 식물 세포 또는 진균 세포인 진핵 세포.
제33항 내지 제35항, 제40항 및 제59항 중 어느 한 항에 있어서, 진핵 세포주인 진핵 세포.
제33항 내지 제35항, 제40항, 제59항 및 제60항 중 어느 한 항에 있어서, Bc HROC277, COS, CHO, CHO-S, CHO-K1, CHO-DG44, CHO-DUXB11, CHO-DUKX, CHOK1SV, VERO, MDCK, WI38, V79, B14AF28-G3, BHK, HaK, NSO, 5P2/0-Ag14, HeLa, HEK293, HEK293-F, HEK293-H, HEK293-T, perC6 세포, Sf9 세포, 사카로마이세스(Saccharomyces) 세포, 피치아(Pichia) 세포 또는 쉬조사카로마이세스(Schizosaccharomyces) 세포인 진핵 세포.
제60항에 있어서, 진핵 세포주는 안정한 세포주인 진핵 세포.
제1항 내지 제29항 및 제45항 내지 제52항 중 어느 한 항에 있어서, 하나 이상의 벡터는 아데노 관련 바이러스(AAV) 벡터, 렌티바이러스 벡터, 레트로바이러스 벡터, 복제 적격 아데노바이러스 벡터, 복제 결핍 아데노바이러스 벡터, 헤르페스 바이러스 벡터, 배큘로바이러스 벡터 또는 비바이러스성 플라스미드로 이루어진 군으로부터 선택되는 것인 시스템.
제63항에 있어서, 하나 이상의 벡터 중 적어도 하나는 AAV 벡터인 시스템.
제30항 내지 제32항 중 어느 한 항에 있어서, 아데노 관련 바이러스(AAV) 벡터, 렌티바이러스 벡터, 레트로바이러스 벡터, 복제 적격 아데노바이러스 벡터, 복제 결핍 아데노바이러스 벡터, 헤르페스 바이러스 벡터, 배큘로바이러스 벡터 또는 비바이러스 플라스미드인 벡터.
제65항에 있어서, AAV 벡터인 벡터
제4항에 있어서, 랍도바이러스 기질(M) 단백질은 수포성 구내염 바이러스(VSV)의 M 단백질인 시스템.
제67항에 있어서, M 단백질은 서열번호: 9와 적어도 90% 동일성을 공유하는 것인 시스템.
하나 이상의 벡터를 포함하는, 진핵 세포 내 표적 단백질의 재조합 발현을 위한 시스템으로서, 하나 이상의 벡터는
a) 표적 단백질을 코딩하는 제1 폴리뉴클레오타이드; 및
b) 뇌심근염 바이러스(EMCV)의 L 단백질을 코딩하는 제2 폴리뉴클레오타이드로서, 선택적으로 L 단백질은 서열번호: 2와 적어도 90% 동일성을 공유하는 것
을 포함하고,
제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드는 하나 이상의 프로모터에 작동가능하게 연결된 것인 시스템.
하나 이상의 벡터를 포함하는, 진핵 세포 내 표적 단백질의 재조합 발현을 위한 시스템으로서, 하나 이상의 벡터는
a) 표적 단백질을 코딩하는 제1 폴리뉴클레오타이드; 및
b) 타일러 바이러스의 L 단백질을 코딩하는 제2 폴리뉴클레오타이드로서, 선택적으로 L 단백질은 서열번호: 1과 적어도 90% 동일성을 공유하는 것
을 포함하고,
제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드는 하나 이상의 프로모터에 작동가능하게 연결된 것인 시스템.
하나 이상의 벡터를 포함하는, 진핵 세포 내 표적 단백질의 재조합 발현을 위한 시스템으로서, 하나 이상의 벡터는
a) 표적 단백질을 코딩하는 제1 폴리뉴클레오타이드; 및
b) 피코르나바이러스 2A 프로테아제를 코딩하는 제2 폴리뉴클레오타이드로서, 선택적으로 피코르나바이러스 2A 프로테아제는 서열번호: 7과 적어도 90% 동일성을 공유하는 것
을 포함하고,
제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드는 하나 이상의 프로모터에 작동가능하게 연결된 것인 시스템.
하나 이상의 벡터를 포함하는, 진핵 세포 내 표적 단백질의 재조합 발현을 위한 시스템으로서, 하나 이상의 벡터는
a) 표적 단백질을 코딩하는 제1 폴리뉴클레오타이드; 및
b) 수포성 구내염 바이러스(VSV)의 M 단백질을 코딩하는 제2 폴리뉴클레오타이드로서, 선택적으로 M 단백질은 서열번호: 9와 적어도 90% 동일성을 공유하는 것
을 포함하고,
제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드는 하나 이상의 프로모터에 작동가능하게 연결된 것인 시스템.
제69항 내지 제72항 중 어느 한 항에 있어서, 표적 단백질은 도파민 수용체 1(DRD1)이고, 선택적으로 DRD1은 서열번호: 19의 아미노산 서열과 적어도 90% 동일성을 갖는 아미노산 서열을 포함하는 것인 시스템.
제69항 내지 제72항 중 어느 한 항에 있어서, 표적 단백질은 낭포성 섬유증 막관통 전도도 조절자(CFTR)이고, 선택적으로 CFTR은 서열번호: 18의 아미노산 서열과 적어도 90% 동일성을 갖는 아미노산 서열을 포함하는 것인 시스템.
제69항 내지 제72항 중 어느 한 항에 있어서, 표적 단백질은 C1 에스테라제 억제제(C1-Inh)이고, 선택적으로 C1-Inh는 서열번호: 16의 아미노산 서열과 적어도 90% 동일성을 갖는 아미노산 서열을 포함하는 것인 시스템.
제69항 내지 제72항 중 어느 한 항에 있어서, 표적 단백질은 ITK이고, 선택적으로 ITK는 서열번호: 15의 아미노산 서열과 적어도 90% 동일성을 갖는 아미노산 서열을 포함하는 것인 시스템.
제69항 내지 제72항 중 어느 한 항에 있어서, 표적 단백질은 NADase이고, 선택적으로 NADase는 서열번호: 20의 아미노산 서열과 적어도 90% 동일성을 갖는 아미노산 서열을 포함하는 것인 시스템.