KR20240021906A

KR20240021906A - 발현 벡터, 박테리아 서열-무함유 벡터, 및 이를 제조하고 사용하는 방법

Info

Publication number: KR20240021906A
Application number: KR1020247001300A
Authority: KR
Inventors: 로데릭 슬라브체브; 나피세 나피씨
Original assignee: 메디파지 바이오슈티컬스, 인크.
Priority date: 2021-06-16
Filing date: 2022-06-16
Publication date: 2024-02-19
Also published as: MX2023014628A; WO2022264095A1; EP4355883A1; CA3222578A1; BR112023026176A2; JP2024523343A; AU2022292197A1; US20240229071A1

Abstract

본 개시내용은 발현 벡터, 박테리아 서열-무함유 벡터, 예컨대 미니스트링 DNA (msDNA), 및 벡터 생산 시스템을 사용하는 것을 포함하는, 박테리아 서열-무함유 벡터를 제조하는 방법을 제공한다. 본 개시내용은 또한 벡터를 포함하는 조성물, 및 벡터 및 조성물의 용도를 제공한다.

Description

발현 벡터, 박테리아 서열-무함유 벡터, 및 이를 제조하고 사용하는 방법

서열 목록에 대한 참조

EFS-WEB을 통해 전자적으로 제출됨

전자적으로 제출된 서열 목록 (명칭: 4471_007PC03_Seqlisting_ST25.txt; 크기: 216,898 바이트; 및 생성 날짜: 2022년 6월 15일)의 내용은 그 전문이 본원에 참조로 포함된다.

개시내용의 분야

본 개시내용은 발현 벡터, 박테리아 서열-무함유 벡터, 박테리아 서열-무함유 벡터를 제조하기 위한 벡터 생산 시스템, 및 이의 용도를 제공한다.

유전자 요법은 상당한 치료 가능성을 가지고 있지만, 그 잠재성을 실현하는 데는 여전히 과제가 남아있다.

대부분의 임상 시험은 바이러스 전달 시스템, 예컨대 아데노바이러스 벡터, 렌티바이러스 벡터, 및 아데노-연관 바이러스 벡터를 활용해 왔다. 진전이 이루어졌지만, 바이러스 시스템은 형질도입 및 트랜스진 발현 효율이 다양하며, 바람직하지 않은 효과, 예컨대 염증 및 면역 반응 또는 삽입 돌연변이유발에 대한 우려가 여전히 남아있다. 더욱이, 바이러스 벡터의 생산, 정제 및 저장은 종종 비용이 많이 들고 가변성이 높으며 비효율적이다. 예를 들어, 문헌 [Lingelbach, D., Drug Development & Delivery 20(5): 50-54 (2020)]; [Wright, J.F., Gene Therapy 15:840-848 (2008)]을 참조한다.

비바이러스 벡터가 또한 유전자 요법 전달 시스템으로서 조사되어 왔다. 바이러스 대응물보다 안전하지만, 비바이러스 벡터의 유효성은 예를 들어 낮은 트랜스진 발현 수준 및 발현 내구성에 의해 제한될 수 있다. 예를 들어, 문헌 [Kay, M., Nature Reviews Genetics 12: 316-328 (2011)]을 참조한다.

본원에 기재된 것과 같은 개선된 벡터가 필요하다.

간단한 요약

본 개시내용은 하기를 포함하는 발현 벡터에 관한 것이다: (a) 백본 서열, (b) 하기를 포함하는 서열: (i) 관심 핵산 서열을 포함하는 발현 카세트, (ii) 발현 카세트의 5' 측면을 플랭킹하는 제1 레콤비나제에 대한 제1 표적 서열, (iii) 발현 카세트의 3' 측면을 플랭킹하는 제1 레콤비나제에 대한 제2 표적 서열, 및 (iv) 제1 레콤비나제에 대한 비-결합 영역 내 제1 및 제2 표적 서열 내에 통합된 하나 이상의 추가 레콤비나제에 대한 하나 이상의 추가 표적 서열, 및 (c) 하기 중 하나 이상: (i) 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 비-결합 영역 내 제1 레콤비나제에 대한 제1 및/또는 제2 표적 서열 내에 통합된 엔도뉴클레아제 표적 서열, 여기서 엔도뉴클레아제 표적 서열은 백본 서열과 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 절단 부위 사이에 있음, (ii) 제1 레콤비나제에 대한 제1 표적 서열의 3' 말단과 발현 카세트 내 또 다른 인핸서 또는 프로모터의 5' 말단 사이에 통합된 서열식별번호: 12와 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서, (iii) 제1 레콤비나제에 대한 제1 표적 서열의 3' 말단과 발현 카세트 내 프로모터의 5' 말단 사이에 통합된 사이토메갈로바이러스 (CMV) 인핸서, (iv) 인트론을 포함하는 5' 비번역 영역 (5'UTR), 여기서 5'UTR은 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합됨, (v) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 척추동물 염색질 인슐레이터, (vi) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 우드척 간염 바이러스 전사후 조절 요소 (WPRE), (vii) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 스캐폴드/매트릭스 부착 영역 (S/MAR), 또는 (viii) 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 비-결합 영역 내 제1 레콤비나제에 대한 제1 및/또는 제2 표적 서열 내에 통합된 DNA 핵 표적화 서열 (DTS), 여기서 DTS는 발현 카세트와 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 절단 부위 사이에 있음.

일부 측면에서, 발현 벡터는 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 비-결합 영역 내 제1 레콤비나제에 대한 제1 및/또는 제2 표적 서열 내에 통합된 엔도뉴클레아제 표적 서열을 포함하고, 여기서 엔도뉴클레아제 표적 서열은 백본 서열과 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 절단 부위 사이에 있다. 일부 측면에서, 엔도뉴클레아제 표적 서열은 제1 레콤비나제에 대한 제1 및 제2 표적 서열 내에 통합된다. 일부 측면에서, 엔도뉴클레아제 표적 서열은 귀소 엔도뉴클레아제에 대한 것이다. 일부 측면에서, 엔도뉴클레아제 표적 서열은 I-AniI, I-CeuI, I-ChuI, I-CpaI, I-CpaII, I-CreI, I-DmoI, H-DreI, I-HmuI, I-HmuII, I-LlaI, I-MsoI, PI-PfuI, PI-PkoII, I-PorI, I-PpoI, PI-PspI, I-ScaI, I-SceI, PI-SceI, I-SceII, I-SecIII, I-SceIV, I-SceV, I-SceVI, I-SceVII, I-Ssp6803I, I-TevI, I-TevII, I-TevIII, PI-TliI, PI-TliII, I-Tsp061I 또는 I-Vdi141I에 대한 것이다. 일부 측면에서, 엔도뉴클레아제 표적 서열은 I-SceI에 대한 것이다. 일부 측면에서, 엔도뉴클레아제 표적 서열은 PI-SceI에 대한 것이다. 일부 측면에서, 엔도뉴클레아제 표적 서열은 Cas 엔도뉴클레아제에 대한 것이다. 일부 측면에서, Cas 엔도뉴클레아제는 Cas9이다.

일부 측면에서, 발현 벡터는 제1 레콤비나제에 대한 제1 표적 서열의 3' 말단과 발현 카세트 내 또 다른 인핸서 또는 프로모터의 5' 말단 사이에 통합된 서열식별번호: 12와 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서를 포함한다. 일부 측면에서, 합성 인핸서는 서열식별번호: 12와 적어도 약 90% 동일한 핵산 서열의 다중 인접 카피를 포함한다. 일부 측면에서, 합성 인핸서는 서열식별번호: 46과 적어도 약 90% 동일한 핵산 서열을 포함한다. 일부 측면에서, 합성 인핸서는 닭 β-액틴 프로모터의 5' 말단에 통합된다. 일부 측면에서, 서열식별번호: 47과 적어도 약 90% 동일한 핵산 서열을 포함하는 키메라 인트론은 닭 β-액틴 프로모터의 3' 말단 및 관심 핵산 서열의 5'에 통합된다.

일부 측면에서, 발현 벡터는 제1 레콤비나제에 대한 제1 표적 서열의 3' 말단과 발현 카세트 내 프로모터의 5' 말단 사이에 통합된 CMV 인핸서를 포함한다. 일부 측면에서, CMV 인핸서는 서열식별번호: 12 또는 서열식별번호: 46과 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서의 3' 말단에 통합된다. 일부 측면에서, CMV 프로모터는 CMV 인핸서의 3' 말단 및 관심 핵산 서열의 5'에 통합된다.

일부 측면에서, 발현 벡터는 제1 레콤비나제에 대한 제1 표적 서열과 관심 핵산 서열 사이에 통합된 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38 또는 서열식별번호: 39와 적어도 약 90% 동일한 핵산 서열을 포함한다.

일부 측면에서, 발현 벡터는 인트론을 포함하는 5'UTR을 포함하고, 여기서 5'UTR은 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합된다. 일부 측면에서, 인트론은 서열식별번호: 1과 적어도 약 90% 동일한 핵산 서열을 포함한다. 일부 측면에서, 5'UTR은 인트론 내에 통합된 비-코딩 서열을 추가로 포함한다. 일부 측면에서, 5'UTR은 서열식별번호: 1의 위치 25 내지 55로부터의 임의의 2개의 뉴클레오티드에 상응하는 인트론 내 2개의 뉴클레오티드 사이에 통합된 비-코딩 서열을 포함한다. 일부 측면에서, 비-코딩 서열은 S/MAR이다. 일부 측면에서, S/MAR은 MAR-5이다. 일부 측면에서, 5'UTR은 서열식별번호: 3과 적어도 약 90% 동일한 핵산 서열을 포함한다. 일부 측면에서, 5'UTR은 서열식별번호: 5와 적어도 약 90% 동일한 핵산 서열을 포함한다. 일부 측면에서, 프로모터는 닭 β-액틴 프로모터이다. 일부 측면에서, 프로모터는 CMV 프로모터이다. 일부 측면에서, 프로모터는 CMV 인핸서의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 서열식별번호: 12 또는 서열식별번호: 46과 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서의 3' 말단에 통합된다.

일부 측면에서, 발현 벡터는 관심 핵산 서열의 3' 말단에 통합된 폴리아데닐화 신호를 포함한다. 일부 측면에서, 폴리아데닐화 신호는 서열식별번호: 13, 서열식별번호: 14 또는 서열식별번호: 15와 적어도 약 90% 동일한 핵산 서열을 포함한다.

일부 측면에서, 발현 벡터는 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 척추동물 염색질 인슐레이터를 포함한다. 일부 측면에서, 척추동물 염색질 인슐레이터는 5'-HS4 닭-β-글로빈 인슐레이터 (cHS4)이다. 일부 측면에서, 폴리아데닐화 신호는 서열식별번호: 13, 서열식별번호: 14 또는 서열식별번호: 15와 적어도 약 90% 동일한 핵산 서열을 포함한다.

일부 측면에서, 발현 벡터는 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 WPRE를 포함한다. 일부 측면에서, 폴리아데닐화 신호는 서열식별번호: 13, 서열식별번호: 14 또는 서열식별번호: 15와 적어도 약 90% 동일한 핵산 서열을 포함한다.

일부 측면에서, 발현 벡터는 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 S/MAR을 포함한다. 일부 측면에서, S/MAR은 MAR-5이다. 일부 측면에서, 폴리아데닐화 신호는 서열식별번호: 13, 서열식별번호: 14 또는 서열식별번호: 15와 적어도 약 90% 동일한 핵산 서열을 포함한다.

일부 측면에서, 발현 벡터는 제1 레콤비나제에 대한 제1 및 제2 표적 서열의 각 측면을 플랭킹하는 인핸서 서열을 포함한다. 일부 측면에서, 발현 벡터는 제1 레콤비나제에 대한 제1 및 제2 표적 서열의 각 측면을 플랭킹하는 적어도 2개의 인핸서 서열을 포함한다. 일부 측면에서, 인핸서 서열은 SV40 인핸서 서열이다.

일부 측면에서, 발현 벡터는 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 비-결합 영역 내 제1 레콤비나제에 대한 제1 및/또는 제2 표적 서열 내에 통합된 DTS를 포함하고, 여기서 DTS는 발현 카세트와 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 절단 부위 사이에 있다. 일부 측면에서, DTS는 SV40 인핸서 서열이다. 일부 측면에서, DTS는 세포-특이적이다.

일부 측면에서, 제1 및 제2 표적 서열 및 하나 이상의 추가 표적 서열은 PY54 pal 부위, N15 telRL 부위, loxP 부위, φK02 telRL 부위, FRT 부위, phiC31 attP 부위 및 λ attP 부위로 이루어진 군으로부터 선택된다. 일부 측면에서, 발현 벡터는 각각의 표적 서열을 포함한다. 일부 측면에서, 발현 벡터는 pal 부위 및 pal 부위 내에 통합된 telRL, loxP 및 FRT 레콤비나제 표적 결합 서열을 포함한다. 일부 측면에서, 제1 레콤비나제에 대한 제1 및 제2 표적 서열은 각각 서열식별번호: 33의 핵산 서열을 포함한다.

일부 측면에서, 발현 벡터는 박테리아 서열-무함유 벡터를 생산하기 위한 것이다. 일부 측면에서, 박테리아 서열-무함유 벡터는 원형 공유 폐쇄형 벡터이다. 일부 측면에서, 박테리아 서열-무함유 벡터는 선형 공유 폐쇄형 벡터이다.

본 개시내용은 유도성 프로모터의 제어 하에 레콤비나제를 코딩하는 재조합 세포를 포함하는 벡터 생산 시스템에 관한 것이며, 여기서 재조합 세포는 임의의 상기 발현 벡터를 포함하고, 여기서 레콤비나제는 제1 레콤비나제에 대한 제1 및 제2 표적 서열 또는 발현 벡터 내 하나 이상의 추가 레콤비나제에 대한 하나 이상의 추가 표적 서열 중 하나를 표적화한다. 일부 측면에서, 레콤비나제는 TelN, Tel, Cre 또는 Flp이다.

일부 측면에서, 재조합 세포는 유도성 프로모터의 제어 하에 엔도뉴클레아제를 추가로 코딩하고, 여기서 엔도뉴클레아제는 엔도뉴클레아제 표적 서열을 포함하는 발현 벡터 내 엔도뉴클레아제 표적 서열을 표적화한다. 일부 측면에서, 엔도뉴클레아제는 귀소 엔도뉴클레아제이다. 일부 측면에서, 귀소 엔도뉴클레아제는 I-AniI, I-CeuI, I-ChuI, I-CpaI, I-CpaII, I-CreI, I-DmoI, H-DreI, I-HmuI, I-HmuII, I-LlaI, I-MsoI, PI-PfuI, PI-PkoII, I-PorI, I-PpoI, PI-PspI, I-ScaI, I-SceI, PI-SceI, I-SceII, I-SecIII, I-SceIV, I-SceV, I-SceVI, I-SceVII, I-Ssp6803I, I-TevI, I-TevII, I-TevIII, PI-TliI, PI-TliII, I-Tsp061I 또는 I-Vdi141I이다. 일부 측면에서, 엔도뉴클레아제는 I-SceI이다. 일부 측면에서, 엔도뉴클레아제는 PI-SceI이다. 일부 측면에서, 재조합 세포는 엔도뉴클레아제를 포함하는 뉴클레아제 게놈 편집 시스템을 코딩한다. 일부 측면에서, 뉴클레아제 게놈 편집 시스템은 가이드 RNA 및 Cas 엔도뉴클레아제를 포함하는 클러스터링된 규칙적 간격의 짧은 회문구조 반복부 (CRISPR) 뉴클레아제 시스템이다. 일부 측면에서, Cas 엔도뉴클레아제는 Cas9이다. 일부 측면에서, 유도성 프로모터는 열-조절성, 화학적-조절성, IPTG 조절성, 글루코스-조절성, 아라비노스 유도성, T7 폴리머라제 조절성, 저온-충격 유도성, pH 유도성, 또는 이들의 조합이다.

본 개시내용은 레콤비나제의 발현에 적합한 조건 하에 임의의 상기 벡터 생산 시스템을 인큐베이션하는 것을 포함하는, 박테리아 서열-무함유 벡터를 생산하는 방법에 관한 것이다. 일부 측면에서, 방법은 엔도뉴클레아제의 발현에 적합한 조건 하에 엔도뉴클레아제를 코딩하는 임의의 상기 벡터 생산 시스템을 인큐베이션하는 것을 추가로 포함한다. 일부 측면에서, 방법은 뉴클레아제 게놈 편집 시스템의 발현에 적합한 조건 하에 뉴클레아제 게놈 편집 시스템을 코딩하는 임의의 상기 벡터 생산 시스템을 인큐베이션하는 것을 추가로 포함한다. 일부 측면에서, 방법은 박테리아 서열-무함유 벡터를 수확하는 것을 추가로 포함한다.

본 개시내용은 박테리아 서열-무함유 벡터를 생산하는 임의의 상기 방법에 의해 생산된 박테리아 서열-무함유 벡터에 관한 것이다.

본 개시내용은 하기를 포함하는 박테리아 서열-무함유 벡터에 관한 것이다: (a) 관심 핵산 서열을 포함하는 발현 카세트, 및 (b) 하기 중 하나 이상: (i) 발현 카세트 내 또 다른 인핸서 또는 프로모터에 대해 5'에 위치된 서열식별번호: 12와 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서, (ii) 발현 카세트 내 프로모터에 대해 5'에 위치된 CMV 인핸서, (iii) 인트론을 포함하는 5'UTR, 여기서 5'UTR은 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합됨, (iv) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 척추동물 염색질 인슐레이터, (v) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 WPRE, (vi) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 S/MAR, 또는 (vii) 발현 카세트에 대해 5'에 위치된 DTS.

일부 측면에서, 박테리아 서열-무함유 벡터는 발현 카세트 내 또 다른 인핸서 또는 프로모터에 대해 5'에 위치된 서열식별번호: 12와 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서를 포함한다. 일부 측면에서, 합성 인핸서는 서열식별번호: 12와 적어도 약 90% 동일한 핵산 서열의 다중 인접 카피를 포함한다. 일부 측면에서, 합성 인핸서는 서열식별번호: 46과 적어도 약 90% 동일한 핵산 서열을 포함한다. 일부 측면에서, 합성 인핸서는 닭 β-액틴 프로모터의 5' 말단에 통합된다. 일부 측면에서, 서열식별번호: 47과 적어도 약 90% 동일한 핵산 서열을 포함하는 키메라 인트론은 닭 β-액틴 프로모터의 3' 말단 및 관심 핵산 서열의 5'에 통합된다.

일부 측면에서, 박테리아 서열-무함유 벡터는 발현 카세트 내 프로모터에 대해 5'에 위치된 CMV 인핸서를 포함한다. 일부 측면에서, CMV 인핸서는 서열식별번호: 12 또는 서열식별번호: 46과 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서의 3' 말단에 통합된다. 일부 측면에서, CMV 프로모터는 CMV 인핸서의 3' 말단 및 관심 핵산 서열의 5'에 통합된다.

일부 측면에서, 박테리아 서열-무함유 벡터는 관심 핵산 서열에 대해 5'에 위치된 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38 또는 서열식별번호: 39와 적어도 약 90% 동일한 핵산 서열을 포함한다.

일부 측면에서, 박테리아 서열-무함유 벡터는 인트론을 포함하는 5'UTR을 포함하고, 여기서 5'UTR은 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합된다. 일부 측면에서, 인트론은 서열식별번호: 1과 적어도 약 90% 동일한 핵산 서열을 포함한다. 일부 측면에서, 5'UTR은 인트론 내에 통합된 비-코딩 서열을 추가로 포함한다. 일부 측면에서, 5'UTR은 서열식별번호: 1의 뉴클레오티드 위치 25 및 55로부터의 임의의 2개의 뉴클레오티드에 상응하는 인트론 내 2개의 뉴클레오티드 사이에 통합된 비-코딩 서열을 추가로 포함한다. 일부 측면에서, 비-코딩 서열은 S/MAR이다. 일부 측면에서, S/MAR은 MAR-5이다. 일부 측면에서, 5'UTR은 서열식별번호: 3과 적어도 약 90% 동일한 핵산 서열을 포함한다. 일부 측면에서, 5'UTR은 서열식별번호: 5와 적어도 약 90% 동일한 핵산 서열을 포함한다. 일부 측면에서, 프로모터는 닭 β-액틴 프로모터이다. 일부 측면에서, 프로모터는 CMV 프로모터이다. 일부 측면에서, 프로모터는 CMV 인핸서의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 서열식별번호: 12 또는 서열식별번호: 46과 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서의 3' 말단에 통합된다.

일부 측면에서, 박테리아 서열-무함유 벡터는 관심 핵산 서열의 3' 말단에 통합된 폴리아데닐화 신호를 포함한다. 일부 측면에서, 폴리아데닐화 신호는 서열식별번호: 13, 서열식별번호: 14 또는 서열식별번호: 15와 적어도 약 90% 동일한 핵산 서열을 포함한다.

일부 측면에서, 박테리아 서열-무함유 벡터는 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 척추동물 염색질 인슐레이터를 포함한다. 일부 측면에서, 척추동물 염색질 인슐레이터는 cHS4이다. 일부 측면에서, 폴리아데닐화 신호는 서열식별번호: 13, 서열식별번호: 14 또는 서열식별번호: 15와 적어도 약 90% 동일한 핵산 서열을 포함한다.

일부 측면에서, 박테리아 서열-무함유 벡터는 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 WPRE를 포함한다. 일부 측면에서, 폴리아데닐화 신호는 서열식별번호: 13, 서열식별번호: 14 또는 서열식별번호: 15와 적어도 약 90% 동일한 핵산 서열을 포함한다.

일부 측면에서, 박테리아 서열-무함유 벡터는 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 S/MAR을 포함한다. 일부 측면에서, S/MAR은 MAR-5이다.

일부 측면에서, 박테리아 서열-무함유 벡터는 발현 카세트의 각 측면을 플랭킹하는 인핸서 서열을 포함한다. 일부 측면에서, 박테리아 서열-무함유 벡터는 발현 카세트의 각 측면을 플랭킹하는 적어도 2개의 인핸서 서열을 포함한다. 일부 측면에서, 인핸서 서열은 SV40 인핸서 서열이다.

일부 측면에서, 박테리아 서열-무함유 벡터는 발현 카세트에 대해 5'에 위치된 DTS를 포함한다. 일부 측면에서, DTS는 SV40 인핸서 서열이다. 일부 측면에서, DTS는 세포-특이적이다.

일부 측면에서, 박테리아 서열-무함유 벡터는 원형 공유 폐쇄형 벡터이다.

일부 측면에서, 박테리아 서열-무함유 벡터는 선형 공유 폐쇄형 벡터이다.

본 개시내용은 임의의 상기 발현 벡터 또는 임의의 상기 박테리아 서열-무함유 벡터를 포함하는 재조합 세포에 관한 것이다.

본 개시내용은 임의의 상기 발현 벡터 또는 임의의 상기 박테리아 서열-무함유 벡터를 포함하는 조성물에 관한 것이다. 일부 측면에서, 조성물은 전달제를 추가로 포함한다. 일부 측면에서, 전달제는 나노입자이다. 일부 측면에서, 전달제는 표적화 리간드를 포함한다. 일부 측면에서, 조성물은 제약상 허용되는 담체를 추가로 포함하는 제약 조성물이다.

본 개시내용은 임의의 상기 발현 벡터, 임의의 상기 박테리아 서열-무함유 벡터, 또는 상기 제약 조성물을 대상체에게 투여하는 것을 포함하는, 질환 또는 장애의 치료를 필요로 하는 대상체에서 질환 또는 장애를 치료하는 방법에 관한 것이다.

본 개시내용은 서열식별번호: 1과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드에 관한 것이다.

본 개시내용은 서열식별번호: 2와 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드에 관한 것이다.

본 개시내용은 서열식별번호: 3과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드에 관한 것이다.

본 개시내용은 서열식별번호: 5와 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드에 관한 것이다.

본 개시내용은 서열식별번호: 12와 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드에 관한 것이다.

본 개시내용은 서열식별번호: 46과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드에 관한 것이다.

본 개시내용은 서열식별번호: 13과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드에 관한 것이다.

본 개시내용은 서열식별번호: 14와 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드에 관한 것이다.

본 개시내용은 서열식별번호: 15와 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드에 관한 것이다.

일부 측면에서, 서열식별번호: 13-15 중 어느 하나와 적어도 약 90% 동일한 핵산 서열을 포함하는 임의의 상기 폴리뉴클레오티드는 핵산 서열의 3' 말단에 100 내지 120개의 아데닌 뉴클레오티드를 추가로 포함한다.

본 개시내용은 서열식별번호: 16과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드에 관한 것이다.

본 개시내용은 서열식별번호: 17과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드에 관한 것이다.

본 개시내용은 서열식별번호: 18과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드에 관한 것이다.

본 개시내용은 서열식별번호: 35와 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드에 관한 것이다.

본 개시내용은 서열식별번호: 36과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드에 관한 것이다.

본 개시내용은 서열식별번호: 37과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드에 관한 것이다.

본 개시내용은 서열식별번호: 38과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드에 관한 것이다.

본 개시내용은 서열식별번호: 39와 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드에 관한 것이다.

본 개시내용은 임의의 상기 폴리뉴클레오티드를 포함하는 발현 벡터에 관한 것이다.

본 개시내용은 서열식별번호: 2, 3 또는 5 중 어느 하나와 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드, 및 (i) 서열식별번호: 13-18 중 어느 하나와 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드, 또는 (ii) 서열식별번호: 13-15 중 어느 하나와 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드 및 핵산 서열의 3' 말단에 100 내지 120개의 아데닌 뉴클레오티드를 포함하는 발현 벡터에 관한 것이다.

본 개시내용은 임의의 상기 발현 벡터, 임의의 박테리아 서열-무함유 벡터, 또는 임의의 상기 제약 조성물로부터의 관심 핵산 서열을 유전자 편집을 위한 표적 부위에 삽입하는 것을 포함하는 유전자 편집 방법에 관한 것이다. 일부 측면에서, 유전자 편집은 비-상동성 말단 연결에 의해 이루어진다. 일부 측면에서, 유전자 편집은 상동성-지정 복구에 의해 이루어진다.

도 1은 발현 벡터 pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS*의 벡터 맵을 보여준다.
도 2는 발현 벡터 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA의 벡터 맵을 보여준다.
도 3은 라이브 이미지화를 통해 HEK-293 세포 내 형광을 평가하는 현미경사진을 보여준다. (A)는 플라스미드 없이 리포펙타민에 노출된 음성 대조군 세포를 보여주고, (B)는 도 1의 발현 벡터로 형질감염된 세포를 보여주고, (C)는 도 2의 발현 벡터로 형질감염된 세포를 보여주고, (D)는 CAG 프로모터의 제어 하에 eGFP를 발현하는 부모 발현 벡터 pGL2-SS*-CAG-eGFP-BGpA-SS* (PP-CAG-GFP)로 형질감염된 양성 대조군 세포를 보여준다.
도 4는 도 3(A)-(D)에 따라 절개된 세포의 상대적 형광 강도의 막대 그래프를 보여준다. 도 4-5에서 "pGL2-SecNLuc-eGFP"는 도 1의 pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS* 발현 벡터로 형질감염된 세포를 나타낸다. 도 4-5에서 "pcDNA-SecNLuc-eGFP"는 도 2의 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA 발현 벡터로 형질감염된 세포를 나타낸다.
도 5는 도 3(A)-(C)에 따라 형질감염된 세포의 배지 내 상대적 루시퍼라제 강도의 막대 그래프를 보여준다.
도 6은 발현 벡터 pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS*의 벡터 맵을 보여준다.
도 7은 발현 벡터 pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*의 벡터 맵을 보여준다.
도 8은 발현 벡터 pGL2-SS*-CMV-UTR2-SecNLuc-2A-eGFP-WPRE-BGpA-SS*의 벡터 맵을 보여준다.
도 9는 포유동물 발현 카세트가 결여된 puc57 플라스미드로 세포를 전기천공한 음성 대조군 (Neg. Ctl. (플라스미드 없음))과 비교하여 도 1 (pGL2-SecNLuc-eGFP), 도 6 (WPRE), 도 7 (5'UTR1+WPRE) 및 도 8 (5'UTR2+WPRE)의 발현 벡터로 세포를 전기천공한 후 2, 6, 10, 14, 17, 20, 27 및 34일차에 HEK-293 세포의 배지에서 상대적 루미노미터 단위 (상대적 빛 단위, RLU라고도 함)의 발광에 의해 표시된 바와 같은 장기간 루시퍼라제 활성의 선 그래프를 보여준다. * = p<0.05, ** = p<0.01, *** = p<0.001, 및 **** = p<0.0001.
도 10은 계대 번호 1, 2, 3 및 5에서 도 9에 기재된 바와 같이 형질감염된 및 음성 대조군 HEK-293 세포의 배지에서 RLU의 발광에 의해 표시된 바와 같은 루시퍼라제 활성의 막대 그래프를 보여준다.
도 11은 도 7의 발현 벡터 (2nd gen pDNA (CMV+U1+W)), 도 7의 발현 벡터로부터 생산된 msDNA (2nd gen msDNA (CMV+U1+W)), 또는 루시퍼라제 트랜스진 (통상적인 pcDNA)을 함유하는 도 2의 발현 벡터로 세포를 전기천공한 후 각각 8, 15, 24, 31, 38, 45 및 52일차에 상응하는 계대 번호 1, 2, 3, 4, 5, 6 및 7에서 HEK-293 세포 내 상대적 루시퍼라제 강도의 선 그래프를 보여준다. 통상적인 pcDNA 데이터세트와 비교하여 ** = p<0.01, *** = p<0.001, 및 **** = p<0.0001.
도 12는 도 9에 기재된 바와 같이 도 1 또는 도 7의 발현 벡터로 형질감염된 세포 내 형광을 보여준다. (A)는 계대 번호 1, 2, 3 및 5에서 라이브 이미지화를 통해 HEK-293 세포 내 형광을 평가하는 현미경사진을 보여준다. (B)는 각 계대 번호에서 3개의 라이브 형광 이미지로부터 관측 시야에서 관찰된 eGFP 양성 (GFP+) 세포의 선 그래프를 보여준다; 유의하지 않음 (ns) = p>0.05. (C)는 계대 번호 5에서 3개의 라이브 형광 이미지로부터 측정된 GFP+ 세포에 대한 평균 형광 강도 (MFI)를 도시하는 도트 플롯을 보여준다. 각 구축물에 대한 기본 막대 그래프는 모든 측정된 GFP+ 세포로부터의 평균 MFI 값을 보여준다. **** = p<0.0001.
도 13은 50 μg의 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA (양성 대조군, PSNLuc), pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS* (pCAGLuc), 또는 pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (pGSNLuc-WPRE)의 단일 유체역학적 꼬리 정맥 주사 후 1, 3, 7, 10, 15, 22, 28, 42 및 56일차에 야생형 마우스로부터 수집된 혈장 내 RLU/mg 단백질의 선 그래프를 보여준다.
도 14는 50 μg의 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA (양성 대조군, PSNLuc), pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS* (pCAGLuc), 또는 pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (pCAGLucWPRE)의 단일 유체역학적 꼬리 정맥 주사 후 1, 3, 7, 10, 15, 22, 28, 42 및 56일차에 야생형 마우스로부터 수집된 혈장 내 RLU/mg 단백질의 선 그래프를 보여준다.
도 15는 5 μg의 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA (양성 대조군, pDNA CMV-U (SSeq 없음)), pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS* (SSeq pDNA CAG), 또는 pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (SSeq pDNA CAG-W)의 단일 유체역학적 꼬리 정맥 주사 후 1, 3, 7, 10, 15, 22, 28, 42 및 56일차에 야생형 마우스로부터 수집된 혈장 내 RLU/mg 단백질의 선 그래프를 보여준다.
도 16은 5 μg의 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA (양성 대조군, No-SSeq pDNA CMV-U), pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (2XSSeq pDNA CAG-W), 또는 msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA (2XSSeq msDNA CAG-W)의 단일 유체역학적 꼬리 정맥 주사 후 1, 3, 7, 10, 15, 22, 28, 42 및 56일차에 야생형 마우스로부터 수집된 혈장 내 RLU/mg 단백질의 선 그래프를 보여준다.
도 17A-D는 벡터 주사 없는 음성 대조군 마우스 뿐만 아니라 도 16에 기재된 벡터 5 μg의 단일 유체역학적 꼬리 정맥 주사 후 56일차에 야생형 마우스로부터의 간에서 ELISA에 의해 결정된 바와 같은 GFP 발현의 막대 그래프를 보여준다. (A)는 GFP 농도 (μg/mL)를 보여준다. (B)는 총 단백질 μg로 정규화된 GFP μg을 보여준다. (C)는 총 조직 g으로 정규화된 GFP μg을 보여준다. (D)는 대조군에 비해 GFP의 발현 수준을 보여준다. *P<0.05, ** P<0.01, ***P<0.001, ****P<0.0001.
도 18은 벡터 주사 없는 음성 대조군 마우스 뿐만 아니라 도 16에 기재된 바와 같은 벡터 5 μg의 단일 유체역학적 꼬리 정맥 주사 후 56일차에 야생형 마우스로부터의 간에서 세포질성 GFP 단백질 농도 (pg/mL)의 막대 그래프를 보여준다.
도 19는 각 주사에 대해 왼쪽에서 오른쪽으로 막대 그래프에 의해 표시된 바와 같이 1, 3, 10, 30, 58, 92, 119 및 174일차에 지질 나노입자 (LNP) 담체 (비히클(대조군)) 또는 LNP 및 msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA (LNP-2G msDNA-CAG-SecretedNanoLuc), pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (LNP-2G ppDNA-CAG-SecretedNanoLuc), msDNA-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA (LNP-2G msDNA-CMV-SecretedNanoLuc), pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (LNP-2G ppDNA-CMV-SecretedNanoLuc), 또는 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA (LNP-Conv.pDNA-CMV-SecretedNanoLuc)의 리포플렉스를 사용하여 마우스에서 단일 정맥내 꼬리 정맥 주사 후 생체내 전신 생물발광 이미지화로부터 총 플럭스 (광자/초)의 막대 그래프를 보여준다. LNP-2G msDNA-CAG-SecretedNanoLuc 주사에 대한 막대 그래프는 해시선으로 묶여 있다.
도 20은 msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA를 주사받은 마우스로부터의 피질, 시상, 뇌간 및 소뇌로부터의 시상면 뇌 섹션에서 녹색 형광 단백질 (GFP) 발현의 현미경사진을 보여준다. 백색 화살표는 트랜스진 발현을 나타낸다. 핵은 디아미디노-2-페닐인돌 (DAPI)을 사용한 염색에 의해 표시된다.
도 21-22는 msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA를 주사받은 마우스로부터의 피질 및 시상 (도 21) 및 소뇌 및 뇌간 (도 22)으로부터의 시상면 뇌 섹션 내 GFP 발현의 현미경사진을 보여준다. 뉴런은 뉴런 마커 NeuN으로 표시된다.
도 23-24는 msDNA-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA를 주사받은 마우스로부터의 피질 및 시상 (도 23) 및 소뇌 및 뇌간 (도 24)으로부터의 시상면 뇌 섹션 내 GFP 발현의 현미경사진을 보여준다. 뉴런은 뉴런 마커 NeuN으로 표시된다.
도 25-26은 지질 나노입자 담체 (LNP) 및 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA (양성 대조군, LNP-Conv.pDNA-CMV-SecretedNLuc), pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (LNP-ppDNA-CMV-SecretedNLuc), msDNA-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA (LNP-msDNA-CMV-SecretedNLuc), pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (LNP-ppDNA-CAG-SecretedNLuc), 또는 msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA (LNP-msDNA-CAG-SecretedNLuc)의 리포플렉스를 사용한 형질감염 후 3 및 5일에 인간 T 세포 (Pan-T(TA+) 세포, 도 25) 또는 간세포 (Huh7 세포, 도 26), PBS 대조군 또는 미처리 세포 내 루시퍼라제 발현과 연관된 발광의 막대 그래프를 보여준다.
도 27A-C, 도 28A-C 및 도 29A-B는 CRISPR 유전자 편집 시스템 및 통상적인 플라스미드 또는 5' 및 3' 상동성 아암에 의해 플랭킹된 GOI (HDR-GOI-HDR)를 운반하는 msDNA의 형질감염 후 3일 (도 27A-C), 7일 (도 28A-C) 및 15일 (도 29A-B)에 관심 유전자 (GOI)에 대한 녹인 (KI) 효율 (Q3)의 형광 활성화 세포 분류 (FACS) 산점도를 보여준다. 도 27 및 28의 (A)는 GOI의 임의의 HDR KI가 없는 대조군, 야생형 (WT) 유도 만능 줄기 세포 (iPSC)에 대한 FACS 산점도를 보여준다. 도 27-28의 (A) 및 도 29의 (B)는 통상적인 플라스미드 (플라스미드 DNA HDR-GOI-HDR)를 사용하여 GOI의 HDR KI에 따른 iPSC의 FACS 산점도를 보여준다. 도 27-28의 (C) 및 도 29의 (B)는 msDNA (msDNA HDR-GOI-HDR)를 사용하여 GOI의 HDR KI에 따른 iPSC의 FACS 산점도를 보여준다.
도 30은 발현 벡터 SS*-CMV-UTR1-SecNLuc-2A-eGFP-3'UTR[2hBGpA-A120]-SS*의 벡터 맵을 보여준다.
도 31은 발현 벡터 SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-3'UTR[2hBGpA-A120]-SS*의 벡터 맵을 보여준다.
도 32는 발현 벡터 SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR[2hBGpA-A120]-SS*의 벡터 맵을 보여준다.
도 33은 발현 벡터 SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR[2hBGpA-A120]-SS*의 벡터 맵을 보여준다.
도 34는 발현 벡터 SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-huMAR-3'UTR[2hBGpA-A120]-SS*의 벡터 맵을 보여준다.
도 35는 발현 벡터 SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-huMAR-3'UTR[2hBGpA-A120]-SS*의 벡터 맵을 보여준다.
도 36은 발현 벡터 SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR[2hBGpA-A120]-SS*의 벡터 맵을 보여준다.
도 37은 발현 벡터 SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-huMAR-WPRE-3'UTR[2hBGpA-A120]-SS*의 벡터 맵을 보여준다.
도 38은 발현 벡터 SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-huMAR-WPRE-3'UTR[2hBGpA-A120]-SS*의 벡터 맵을 보여준다.
도 39는 도 2 (통상적인 pDNA CMV-U), 도 30 (A: CMV-U1-3'UTR), 도 31 (B: E1-CMV-U1-3'UTR) 및 도 32 (C: E1-CMV-U1-WPRE-3'UTR)의 발현 벡터로 세포를 전기천공한 후 2, 3, 7, 10, 14, 21 및 28일차에 HEK-293 세포의 배지에서 RLU의 발광에 의해 표시된 바와 같은 루시퍼라제 활성의 선 그래프를 보여준다. * = p<0.05 및 ** = p<0.01.
도 40은 도 39에 기재된 발현 벡터로 0일차에 세포를 전기천공한 후 7일마다 계대 후 계대 번호 1, 2, 3, 4 및 5에서 HEK-293 세포 내 상대적 루시퍼라제 강도의 선 그래프를 보여준다. * = p<0.05 및 ** = p<0.01.
도 41은 발현 벡터 pGL2-CAG-SecNLuc-2A-eGFP-WPRE-b글로빈 폴리A의 벡터 맵을 보여준다.
도 42는 발현 벡터 4-1 pGL2-SS*-CAG [CMV 인핸서+CBA 프로모터+인트론]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*의 벡터 맵을 보여준다.
도 43은 발현 벡터 4-2 pGL2-SS*-CAG [E1 X3+CBA 프로모터+인트론]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*의 벡터 맵을 보여준다.
도 44는 발현 벡터 4-3 pGL2-SS*-CAG [E2(U100)+CBA 프로모터+인트론]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*의 벡터 맵을 보여준다.
도 45는 발현 벡터 4-4 pGL2-SS*-CAG [E1 X3+CBA 프로모터+UTR1]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*의 벡터 맵을 보여준다.
도 46은 발현 벡터 4-5-pGL2-SS*-CAG [E2 (U100)+CBA 프로모터+UTR1]-SecNLuc-2A-eGFP-WPRE-3'UTR (108 - 120 폴리A)-SS*의 벡터 맵을 보여준다.
도 47은 발현 벡터 4-6-pGL2-SS*-CMV 인핸서-EF1-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*의 벡터 맵을 보여준다.
도 48은 도 41 (통상적인 SSeq pDNA CAG-W 없음) 및 도 42-47 (각각 4-1 내지 4-6)에 표시된 발현 벡터로 형질감염시킨 후 3 및 6일에 HEK-293 세포의 배지에서 RLU의 발광에 의해 표시된 바와 같은 루시퍼라제 활성의 막대 그래프를 보여준다.
도 49는 플랭킹 슈퍼 서열 (SSeq), 합성 인핸서 (E1), CMV 프로모터 (PCMV), tRNA-gRNA-PAM 삽입을 갖는 최적화된 내부 인트론을 함유하는 합성 5'UTR (UTR-tRNA-gRNA-PAM-1), Casβ2 유전자, 및 인간 베타-글로빈 폴리아데닐화 신호 및 gRNA-PAM 삽입을 함유하는 3'UTR (HBg3'UTR-gRNA-PAM)을 함유하는 자기-제한 CRISPR 유전자 편집 시스템에 대한 예시적인 서열의 다이어그램을 보여준다.
도 50은 상동성 아암에 의해 플랭킹된 치료용 GOI를 갖는 염색체 DNA의 상동성-지정 복구 (HDR) 동안 도 52의 서열로부터의 자기-제한 Cas 발현의 다이어그램을 보여준다.
도 51은 자기-제한 CRISPR 유전자 편집 시스템을 사용한 2개의 유전자-편집 시나리오에 대한 다이어그램을 보여준다. 시나리오 1에서, 인간 발현 카세트 (예를 들어, 치료용 GOI)를 함유하는 msDNA는 일시적 발현을 위해 먼저 형질감염된 후, HDR 녹인을 위해 도 42의 유전자 편집 시스템이 뒤따른다. 시나리오 2에서, HDR 녹인은 자기-제한 CRISPR 유전자 편집 시스템 및 상동성 아암에 의해 플랭킹된 인간 발현 카세트를 모두 함유하는 단일 msDNA에 의해 매개된다.

상세한 설명

본 개시내용은 발현 벡터, 박테리아 서열-무함유 벡터 (예를 들어, 미니스트링 DNA (msDNA)), 벡터 생산 시스템, 박테리아 서열-무함유 벡터를 제조하는 방법, 조성물, 및 이의 용도를 제공한다.

본원에 인용된 모든 저널 기사, 도서, 매뉴얼, 특허 출원 및 특허를 제한 없이 포함하여 본원에 인용된 모든 간행물은 각각의 개별 간행물이 참조로 포함되도록 구체적이고 개별적으로 표시된 것과 동일한 정도로 그 전문이 본원에 참조로 포함된다.

I. 용어

본 개시내용을 보다 쉽게 이해할 수 있도록, 먼저 특정 용어를 정의한다. 본 출원에서 사용된 바와 같이, 본원에 달리 명시적으로 제공된 경우를 제외하고, 하기 용어는 각각 아래에 제시된 의미를 가질 수 있다. 추가적인 정의는 출원 전반에 걸쳐 제시된다.

용어 "a" 또는 "an" 실체는 해당 실체 중 하나 이상을 지칭한다는 점에 유의해야 하며; 예를 들어 "뉴클레오티드 서열"은 하나 이상의 뉴클레오티드 서열을 나타내는 것으로 이해된다. 이와 같이, 용어 "a" (또는 "an"), "하나 이상" 및 "적어도 하나"는 본원에서 상호교환적으로 사용될 수 있다.

본원에서 사용된 용어 "및/또는"은 서로의 유무에 관계없이 명시된 특색 또는 구성성분 각각의 특정 개시내용으로서 받아들여져야 한다. 그러므로, "A 및/또는 B"와 같은 문구에서 사용된 바와 같은 용어 "및/또는"은 "A 및 B", "A 또는 B", "A" (단독) 및 "B" (단독)를 포함하도록 의도된다. 마찬가지로, "A, B 및/또는 C"와 같은 문구에서 사용된 바와 같은 용어 "및/또는"은 하기 측면 각각을 포함하도록 의도된다: A, B 및 C; A, B 또는 C; A 또는 C; A 또는 B; B 또는 C; A 및 C; A 및 B; B 및 C; A (단독); B (단독); 및 C (단독).

본원에서 측면이 표현 "포함하는"으로 기재된 경우에는 "로 이루어진" 및/또는 "로 본질적으로 이루어진"의 용어로 기재된 달리 유사한 측면도 제공되는 것으로 이해되어야 한다.

용어 "약" 또는 "로 본질적으로 구성된"은 관련 기술분야의 통상의 기술자에 의해 결정된 바와 같이 특정 값 또는 조성에 대해 허용가능한 오차 범위 내에 있는 값 또는 조성을 지칭하며, 이는 부분적으로 값 또는 조성이 측정되거나 결정되는 방법, 즉 측정 시스템의 한계에 따라 달라질 것이다. 예를 들어, "약" 또는 "로 본질적으로 구성된"은 관련 기술분야의 실시에 따라 1 또는 1 초과의 표준 편차 이내를 의미할 수 있다. 대안적으로, "약" 또는 "로 본질적으로 구성된"은 최대 10% (즉, ±10%) 범위를 의미할 수 있다. 더욱이, 특히 생물학적 시스템 또는 프로세스와 관련하여, 이 용어는 값의 최대 10배 또는 최대 5배를 의미할 수 있다. 달리 언급되지 않는 한, 특정 값 또는 조성이 출원 및 청구범위에 제공되는 경우, "약" 또는 "로 본질적으로 구성된"의 의미는 해당 특정 값 또는 조성에 대해 허용가능한 오차 범위 내에 있는 것으로 가정되어야 한다.

본원에 기재된 바와 같이, 임의의 농도 범위, 백분율 범위, 비율 범위 또는 정수 범위는 달리 명시되지 않는 한 인용된 범위 내의 임의의 정수 값 및 적절한 경우 그 분수 (예컨대 정수의 10분의 1 및 100분의 1)를 포함하는 것으로 이해되어야 한다. 숫자 범위는 범위를 정의하는 숫자를 포함한다.

달리 정의되지 않는 한, 본원에서 사용된 모든 기술 및 과학 용어는 본 개시내용과 관련된 기술분야의 통상의 기술자가 일반적으로 이해하는 것과 동일한 의미를 갖는다. 예를 들어, 문헌 [the Concise Dictionary of Biomedicine and Molecular Biology, Juo, Pei-Show, 2nd ed., 2002, CRC Press]; [The Dictionary of Cell and Molecular Biology, 5th ed., 2013, Academic Press]; 및 [the Oxford Dictionary Of Biochemistry And Molecular Biology, 2006, Oxford University Press]은 본 개시내용에서 사용된 많은 용어의 일반 사전을 통상의 기술자에게 제공한다.

단위, 접두사 및 기호는 국제단위계 (SI) 승인 형태로 표시된다.

달리 명시되지 않는 한, 뉴클레오티드 서열은 5'에서 3' 방향으로 왼쪽에서 오른쪽으로 기록된다. 아미노산 서열은 아미노에서 카르복시 방향으로 왼쪽에서 오른쪽으로 기록된다.

본원에 제공된 표제는 전체로서 명세서를 참조하여 가질 수 있는 본 개시내용의 다양한 측면의 제한이 아니다. 따라서, 바로 아래에 정의된 용어들은 본 명세서 전체를 참조하여 보다 완전하게 정의된다.

"아미노산"은 중심 탄소 원자 (알파-탄소 원자)가 수소 원자, 카르복실산 기 (이의 탄소 원자는 본원에서 "카르복실 탄소 원자"로 지칭됨), 아미노 기 (이의 질소 원자는 본원에서 "아미노 질소 원자"로 지칭됨), 및 측쇄 기 R에 연결된 구조를 갖는 분자이다. 펩티드, 폴리펩티드 또는 단백질에 혼입되면, 아미노산은 하나의 아미노산을 또 다른 아미노산에 연결하는 탈수 반응에서 아미노산 카르복실 기의 하나 이상의 원자를 잃는다. 결과적으로, 단백질에 혼입되면, 아미노산은 "아미노산 잔기"로 지칭된다.

"단백질" 또는 "폴리펩티드"는 펩티드 결합을 통해 연결된 2개 이상의 개별 아미노산 (자연 발생 여부에 관계없이)의 임의의 중합체를 지칭하며, 하나의 아미노산 (또는 아미노산 잔기)의 알파-탄소에 결합된 카르복실산 기의 카르복실 탄소 원자가 인접한 아미노산의 비-알파-탄소에 결합된 아미노 기의 아미노 질소 원자에 공유결합적으로 결합될 때 발생한다. 용어 "단백질" 및 "폴리펩티드"는 본원에서 상호교환적으로 사용될 수 있다. 유사하게, 단백질 및 폴리펩티드의 단편은 또한 본 개시내용의 범위 내에 속하며, 본원에서 "단백질" 또는 "폴리펩티드"로 지칭될 수 있다. 본 개시내용의 한 측면에서, 폴리펩티드는 2개 이상의 부모 펩티드 세그먼트 또는 단백질의 키메라를 포함한다. 용어 "폴리펩티드"는 또한 제한 없이 디술피드 결합 형성, 글리코실화, 카르바밀화, 지질화, 아세틸화, 인산화, 아미드화, 공지된 보호기/차단기에 의한 유도체화, 단백질분해 절단, 비-자연 발생 아미노산에 의한 변형, 또는 임의의 다른 조작 또는 변형, 예컨대 라벨링 구성성분과의 접합을 포함하는 폴리펩티드의 번역후 변형 ("PTM")의 생성물을 지칭하고 포함하도록 의도된다. 폴리펩티드는 천연 생물학적 공급원으로부터 유래되거나 재조합 기술에 의해 생산될 수 있지만, 반드시 지정된 핵산 서열로부터 번역될 필요는 없다. 이는 화학적 합성을 포함하여 어떤 방식으로든 생성될 수 있다. "단리된" 폴리펩티드 또는 이의 단편, 변이체 또는 유도체는 자연 환경에 존재하지 않는 폴리펩티드를 지칭한다. 특정 수준의 정제가 필요하지 않는다. 예를 들어, 단리된 폴리펩티드는 천연 또는 자연 환경으로부터 간단히 제거될 수 있다. 숙주 세포에서 발현된 재조합적으로 생산된 폴리펩티드 및 단백질은 임의의 적합한 기술에 의해 분리되거나 분획화되거나 부분적으로 또는 실질적으로 정제된 천연 또는 재조합 폴리펩티드와 마찬가지로 본 개시내용의 목적을 위해 단리된 것으로 간주된다.

본원에 개시된 바와 같은 2개 이상의 단백질을 포함하는 재조합 폴리펩티드 (즉, 재조합 단백질)는 각 단백질을 코딩하는 폴리뉴클레오티드 서열을 포함하는 단일 코딩 서열에 의해 코딩될 수 있다. 달리 언급되지 않는 한, 각 단백질을 코딩하는 폴리뉴클레오티드 서열은 폴리뉴클레오티드 서열을 포함하는 단일 mRNA의 번역이 각 단백질을 포함하는 단일 폴리펩티드를 초래하도록 "프레임 내"에 있다. 전형적으로, 본원에 기재된 바와 같은 재조합 폴리펩티드 내의 단백질은 서로 직접 융합되거나 펩티드 링커에 의해 분리될 것이다. 펩티드 링커를 코딩하는 다양한 폴리뉴클레오티드 서열은 관련 기술분야에 공지되어 있으며, 예를 들어 자기-절단 펩티드를 포함한다.

본원에서 사용된 바와 같은 "폴리뉴클레오티드" 또는 "핵산"은 뉴클레오티드의 중합체 형태를 지칭한다. 일부 예에서, 폴리뉴클레오티드는 코딩 서열과 바로 옆에 인접하지 않거나 그로부터 유래된 유기체의 자연 발생 게놈 내 코딩 서열과 바로 옆에 인접한 (5' 말단 또는 3' 말단에서) 서열을 포함한다. 따라서 이 용어는 예를 들어 벡터, 자율 복제 플라스미드 또는 바이러스, 또는 원핵생물 또는 진핵생물의 게놈 DNA에 혼입되거나, 또는 다른 서열과 독립적으로 별도의 분자 (예를 들어, cDNA)로 존재하는 재조합 DNA를 포함한다. 본 개시내용의 뉴클레오티드는 리보뉴클레오티드, 데옥시리보뉴클레오티드, 또는 어느 하나의 뉴클레오티드의 변형된 형태일 수 있다. 본원에서 사용된 바와 같은 폴리뉴클레오티드는 특히 단일- 및 이중-가닥 DNA, 단일- 및 이중-가닥 영역의 혼합물인 DNA, 단일- 및 이중-가닥 RNA, 및 단일- 및 이중-가닥 영역의 혼합물인 RNA, 단일-가닥 또는 보다 전형적으로 이중-가닥 또는 단일- 및 이중-가닥 영역의 혼합물일 수 있는 DNA 및 RNA를 포함하는 하이브리드 분자를 지칭한다. 용어 폴리뉴클레오티드는 게놈 DNA 또는 RNA (유기체에 따라 다름, 즉, 바이러스의 RNA 게놈), 뿐만 아니라 게놈 DNA에 의해 코딩된 mRNA, 및 cDNA를 포함한다. 특정 측면에서, 폴리뉴클레오티드는 통상적인 포스포디에스테르 결합 또는 비-통상적인 결합 (예를 들어, 아미드 결합, 예컨대 펩티드 핵산 (PNA)에서 발견되는 것)을 포함한다. "단리된" 핵산 또는 폴리뉴클레오티드는 천연 환경으로부터 제거된 핵산 분자, 예를 들어 DNA 또는 RNA를 의미한다. 예를 들어, 벡터에 함유된 재조합 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 핵산 분자는 본 개시내용의 목적을 위해 "단리된" 것으로 간주된다. 단리된 폴리뉴클레오티드의 추가 예는 이종 숙주 세포에서 유지되거나 용액 내의 다른 폴리뉴클레오티드로부터 (부분적으로 또는 실질적으로) 정제된 재조합 폴리뉴클레오티드를 포함한다. 단리된 RNA 분자는 본 개시내용의 폴리뉴클레오티드의 생체내 또는 시험관내 RNA 전사체를 포함한다. 본 개시내용에 따른 단리된 폴리뉴클레오티드 또는 핵산은 합성적으로 생산된 폴리뉴클레오티드 및 핵산 (예를 들어, 핵산 분자)을 추가로 포함한다.

본원에서 사용된 바와 같은 "코딩 영역" 또는 "코딩 서열"은 아미노산으로 번역가능한 코돈으로 이루어진 폴리뉴클레오티드의 일부이다. "정지 코돈" (TAG, TGA 또는 TAA)은 전형적으로 아미노산으로 번역되지 않지만, 이는 코딩 영역의 일부로 간주될 수 있지만, 임의의 플랭킹 서열, 예를 들어 프로모터, 리보솜 결합 부위, 전사 종결자, 인트론 등은 코딩 영역의 일부가 아니다. 코딩 영역의 경계는 전형적으로 생성된 폴리펩티드의 아미노-말단을 코딩하는 5' 말단의 시작 코돈, 및 생성된 폴리펩티드의 카르복실-말단을 코딩하는 3' 말단의 번역 정지 코돈에 의해 결정된다.

본원에서 사용된 바와 같은 "발현 카세트"는 관심 핵산 서열 (예를 들어, 폴리펩티드, DNA 또는 RNA의 발현을 위한 핵산 서열) 및 발현 제어 영역을 포함한다.

본원에서 사용된 바와 같은 "트랜스진"은 "관심 유전자 (GOI)"와 상호교환적으로 사용될 수 있고, 아미노산으로 번역가능한 코돈을 함유하는 폴리뉴클레오티드의 일부를 지칭한다. "정지 코돈" (TAG, TGA 또는 TAA)은 전형적으로 아미노산으로 번역되지 않지만, 트랜스진의 일부로 간주될 수 있지만, 임의의 플랭킹 서열, 예를 들어 프로모터, 리보솜 결합 부위, 전사 종결자, 인트론 등은 트랜스진의 일부가 아니다. 트랜스진의 경계는 전형적으로 생성된 폴리펩티드의 아미노-말단을 코딩하는 5' 말단의 시작 코돈, 및 생성된 폴리펩티드의 카르복실-말단을 코딩하는 3' 말단의 번역 정지 코돈에 의해 결정된다.

본원에서 사용된 바와 같은 용어 "발현 제어 영역"은 코딩 영역에 의해 코딩된 생성물의 발현을 지시하거나 제어하기 위해 코딩 영역과 작동가능하게 연관된 전사 제어 요소를 지칭하며, 예를 들어 시스-조절성 모듈 (CRM), 프로모터 (예를 들어, 조직 특이적 프로모터 및/또는 유도성 프로모터), 인핸서, 오퍼레이터, 억제자, 리보솜 결합 부위, 번역 리더 서열, 인트론, 전사후 요소, 폴리아데닐화 인식 서열, RNA 프로세싱 부위, 이펙터 결합 부위, 스템-루프 구조, 및 전사 종결 신호, miRNA 결합 부위, 및 이들의 조합을 포함한다. 발현 제어 영역은 관심 핵산 서열의 상류 (5'), 내부 또는 하류 (3')에 위치된 뉴클레오티드 서열을 포함하며, 이는 연관 관심 핵산 서열의 전사, RNA 프로세싱, 안정성 또는 번역에 영향을 미친다. 트랜스진이 진핵 세포에서 발현되도록 의도된 경우, 폴리아데닐화 신호 및 전사 종결 서열은 일반적으로 트랜스진에 대해 3'에 위치될 것이다.

프로모터 기능의 유도가 생성물을 코딩하는 코딩 영역을 포함하는 mRNA의 전사를 초래하는 경우, 및 프로모터와 코딩 영역 사이의 연결의 성질이 코딩 영역에 의해 코딩된 생성물의 발현을 지시하는 프로모터의 능력을 방해하지 않거나 전사되는 DNA 주형의 능력을 방해하지 않는 경우, 코딩 영역 및 프로모터는 "작동가능하게 연관" (즉, "작동가능하게 연결")된다. 발현 제어 영역은 코딩 영역의 상류 (5' 비-코딩 서열), 내부 또는 하류 (3' 비-코딩 서열)에 위치된 뉴클레오티드 서열을 포함하며, 이는 연관된 코딩 영역의 전사, RNA 프로세싱, 안정성 또는 번역에 영향을 미친다. 코딩 영역이 진핵 세포에서 발현되도록 의도된 경우, 폴리아데닐화 신호 및 전사 종결 서열은 일반적으로 코딩 서열에 대해 3'에 위치될 것이다.

본원에서 사용된 바와 같은 용어 "숙주 세포" 및 "세포"는 상호교환적으로 사용될 수 있으며, 핵산 분자 (예를 들어, 재조합 핵산 분자)를 보유하거나 보유할 수 있는 임의의 유형의 세포 또는 세포 집단, 예를 들어 일차 세포, 배양 중인 세포, 또는 세포주로부터의 세포를 지칭할 수 있다. 숙주 세포는 원핵 세포일 수 있거나, 대안적으로 숙주 세포는 진핵 세포, 예를 들어 진균 세포, 예컨대 효모 세포, 및 다양한 동물 세포, 예컨대 곤충 세포 또는 포유동물 세포일 수 있다.

본원에서 사용된 바와 같은 "배양" "배양하다" 및 "배양하는"은 세포 성장 또는 분열을 허용하거나 세포를 살아있는 상태로 유지하는 시험관내 조건 하에 세포를 인큐베이션하는 것을 의미한다. 본원에서 사용된 바와 같은 "배양된 세포"는 시험관내에서 증식되는 세포를 의미한다.

"대상체"는 임의의 인간 또는 비인간 동물을 포함한다. 용어 "비인간 동물"은 척추동물, 예컨대 포유동물, 조류, 애완동물, 농장 동물, 비인간 영장류, 양, 소, 염소, 돼지, 닭, 개, 고양이, 및 설치류, 예컨대 마우스, 래트 및 기니피그를 포함하나 이에 제한되지는 않는다. 바람직한 측면에서, 대상체는 인간이다. 용어 "대상체" 및 "환자"는 본원에서 상호교환적으로 사용된다.

"투여하는"은 관련 기술분야의 통상의 기술자에게 공지된 임의의 다양한 방법 및 전달 시스템을 사용하여 대상체에게 치료제를 물리적으로 도입하는 것을 지칭한다.

본원에서 사용된 바와 같은 대상체의 용어 "치료하다", "치료하는", "치료" 또는 "요법"은 질환과 연관된 증상, 합병증, 병태 또는 생화학적 징후의 진행, 발달, 중증도 또는 재발을 역전, 경감, 호전, 억제 또는 둔화 또는 예방하거나 전반적 생존을 향상시키는 목적으로 대상체에게 수행되거나 활성제를 투여하는 임의의 유형의 중재 또는 프로세스를 지칭한다. 치료는 질환을 갖는 대상체 또는 질환을 갖지 않는 대상체에 대한 것일 수 있다 (예를 들어, 예방, 예컨대 백신접종).

용어 "유효 용량" "유효 투여량" 또는 "유효량"은 원하는 효과를 달성하거나 적어도 부분적으로 달성하기에 충분한 작용제의 양으로서 정의된다. 약물 또는 치료제의 "치료 유효량" 또는 "치료 유효 투여량"은 단독으로 또는 또 다른 치료제와 조합하여 사용되는 경우 질환 증상의 중증도의 감소, 질환 증상이 없는 기간의 빈도 및 지속시간의 증가, 전반적 생존 (질환 진단일 또는 질환 치료 시작일로부터 해당 질환으로 진단된 환자가 여전히 생존하는 시간의 길이)의 증가, 또는 질환 고통으로 인한 손상 또는 장애의 예방에 의해 입증되는 질환 퇴행을 촉진하는 약물의 임의의 양이다. 약물의 치료 유효량 또는 투여량은 "예방적 유효량" 또는 "예방적 유효 투여량"을 포함하며, 이는 질환이 발생할 위험이 있거나 질환이 재발할 위험이 있는 대상체에게 단독으로 또는 또 다른 치료제와 조합하여 투여될 때 질환의 발병 또는 재발을 억제하는 약물의 임의의 양이다. 질환 퇴행을 촉진하거나 질환의 발병 또는 재발을 억제하는 치료제의 능력은 숙련된 전문가에게 공지된 다양한 방법을 사용하여, 예컨대 임상 시험 동안 인간 대상체에서, 인간에서 효능을 예측하는 동물 모델 시스템에서, 또는 시험관내 검정에서 작용제의 활성을 검정함으로써 평가될 수 있다.

본 개시내용의 다양한 측면은 하기 하위섹션에서 더 자세히 설명된다.

II. 박테리아 서열-무함유 벡터를 생산하기 위한 발현 벡터 및 벡터 생산 시스템

박테리아 서열-무함유 벡터 및 이의 생산은 미국 특허 번호 9,290,778 및 9,862,954; 문헌 [Nafissi and Slavcev, Microbial Cell Factories 11:154 (2012)]; 및 [Nafissi et al., Nucleic Acids 3(6):e165 (2014)] (그 전문이 본원에 참조로 포함됨)에 기재되어 있다. 이들 박테리아 서열-무함유 벡터는 관심 핵산 서열(들)을 함유하는 발현 카세트의 각 측면 (즉, 5' 및 3' 측면)을 플랭킹하는 레콤비나제에 대한 표적 서열을 포함하는 특수화된 "슈퍼 서열" ("SS" 또는 대안적으로 "SSeq") 부위를 함유하는 발현 벡터 (예를 들어, 플라스미드)로부터 생산된다. 구체적으로, 각각의 SS는 제1 레콤비나제에 대한 표적 서열을 함유하며, 제1 레콤비나제에 대한 비-결합 영역 내에 통합된 하나 이상의 추가 레콤비나제에 대한 추가 표적 서열을 함유한다. 발현 벡터가 적절한 레콤비나제를 발현하는 재조합 세포에 존재하는 경우, 발현 카세트를 함유하는 박테리아 서열-무함유 벡터가 발현 벡터의 백본 DNA로부터 분리된다. 원형 공유 폐쇄형 (CCC) 박테리아 서열-무함유 벡터를 생산하기 위해, 발현 벡터는 예를 들어 SS의 표적 서열을 통해 작용하는 레콤비나제, 예컨대 Cre 또는 Flp를 발현하는 재조합 세포에 배치된다. 선형 공유 폐쇄형 (LCC) 박테리아 서열-무함유 벡터 (본원에서 미니스트링 DNA (msDNA)로도 지칭됨)를 생산하기 위해, 발현 벡터는 예를 들어 SS의 표적 서열을 통해 작용하는 레콤비나제, 예컨대 TelN 또는 Tel을 발현하는 재조합 세포에 배치된다. 그 후, 재조합으로부터 생성된 박테리아 서열-무함유 벡터는 세포로부터 정제되고 전달 벡터로서 직접 사용될 수 있다. 미국 특허 번호 9,290,778 및 9,862,954, 문헌 [Nafissi and Slavcev], 및 [Nafissi et al.]을 참조한다.

LCC 말단을 갖는 msDNA 벡터는 비틀림이 없으며 이. 콜라이에서 생산되는 동안 기라제-지정 음성 슈퍼코일링이 발생하지 않는다. 더욱이, 이중 가닥 LCC 토폴로지로 인해, msDNA의 세포의 염색체로의 통합은 염색체 파단을 야기하여, 이에 의해 집단으로부터 세포를 제거한다. 그러므로, msDNA는 삽입 돌연변이유발의 임의의 위험을 제거하여, msDNA를 투여받은 환자를 잠재적 유전독성 및 암으로부터 보호한다 (Nafissi et al.).

본 개시내용은 박테리아 서열-무함유 벡터의 개선된 생산 및 개선된 박테리아 서열-무함유 벡터를 제공한다. 일부 측면에서, 박테리아 서열-무함유 벡터의 생산은 오염성 발현 벡터 서열의 제거에 의해 개선된다. 일부 측면에서, 박테리아 서열-무함유 벡터는 세포 내 확립 능력 (즉, 형질감염 효율), 개선된 트랜스진 발현 (예를 들어, 향상된 전사 및 번역의 조합에 의해 매개됨), 및 세포 내 개선된 확장 (예를 들어, 벡터의 딸 세포로의 복제 및 분할)을 통해 개선된다.

일부 측면에서, 본원에 개시된 개선은 관련 기술분야에 공지된 다른 방법에 따라 생산된 CCC 또는 LCC 벡터에 적응될 수 있다.

A. 발현 벡터

하기를 포함하는 발현 벡터가 본원에 제공된다: (a) 백본 서열, (b) 하기를 포함하는 서열: (i) 관심 핵산 서열을 포함하는 발현 카세트, (ii) 발현 카세트의 5' 측면을 플랭킹하는 제1 레콤비나제에 대한 제1 표적 서열, (iii) 발현 카세트의 3' 측면을 플랭킹하는 제1 레콤비나제에 대한 제2 표적 서열, 및 (iv) 제1 레콤비나제에 대한 비-결합 영역 내 제1 및 제2 표적 서열 내에 통합된 하나 이상의 추가 레콤비나제에 대한 하나 이상의 추가 표적 서열, 및 (c) 하기 중 하나 이상: (i) 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 비-결합 영역 내 제1 레콤비나제에 대한 제1 및/또는 제2 표적 서열 내에 통합된 엔도뉴클레아제 표적 서열, 여기서 엔도뉴클레아제 표적 서열은 백본 서열과 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 절단 부위 사이에 있음, (ii) 제1 레콤비나제에 대한 제1 표적 서열의 3' 말단과 발현 카세트 내 또 다른 인핸서 또는 프로모터의 5' 말단 사이에 통합된 서열식별번호: 12와 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서, (iii) 제1 레콤비나제에 대한 제1 표적 서열의 3' 말단과 발현 카세트 내 프로모터의 5' 말단 사이에 통합된 사이토메갈로바이러스 (CMV) 인핸서, (iv) 인트론을 포함하는 5' 비번역 영역 (5'UTR), 여기서 5'UTR은 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합됨, (v) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 척추동물 염색질 인슐레이터, (vi) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 우드척 간염 바이러스 전사후 조절 요소 (WPRE), (vii) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 스캐폴드/매트릭스 부착 영역 (S/MAR), 또는 (viii) 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 비-결합 영역 내 제1 레콤비나제에 대한 제1 및/또는 제2 표적 서열 내에 통합된 DNA 핵 표적화 서열 (DTS), 여기서 DTS는 발현 카세트와 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 절단 부위 사이에 있음.

본원에서 언급된 바와 같은 "백본" 서열은 발현 카세트의 서열 및 제1 레콤비나제의 제1 및 제2 표적 서열을 포함하는 플랭킹 SS 부위 외부의 발현 벡터의 서열이다. 백본 서열은 예를 들어 본원에 기재된 바와 같이 숙주 세포 (예를 들어, 이. 콜라이)에서 발현 벡터의 증폭 및 항생제 선택을 위한 서열을 포함할 수 있다.

레콤비나제에 대한 "비-결합" 영역은 본원에 기재된 바와 같은 레콤비나제에 의해 작용하지 않는 (예를 들어, 레콤비나제에 의해 결합 및/또는 절단되지 않는) 제1 레콤비나제에 대한 표적 서열 내의 영역이다.

레콤비나제에 대한 "절단 부위"는 레콤비나제가 재조합과 연관된 DNA에서 이중-가닥 파단 또는 단일-가닥 틈을 개시하는 부위이다.

일부 측면에서, 발현 벡터는 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 비-결합 영역 내 제1 레콤비나제에 대한 제1 및/또는 제2 표적 서열 내에 통합된 엔도뉴클레아제 표적 서열을 포함하고, 여기서 엔도뉴클레아제 표적 서열은 백본 서열과 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 절단 부위 사이에 있다. 일부 측면에서, 엔도뉴클레아제 표적 서열은 제1 레콤비나제에 대한 제1 표적 서열 내에 통합된다. 일부 측면에서, 엔도뉴클레아제 표적 서열은 제1 레콤비나제에 대한 제2 표적 서열 내에 통합된다. 일부 측면에서, 엔도뉴클레아제 표적 서열은 제1 레콤비나제에 대한 제1 및 제2 표적 서열 내에 통합된다. 일부 측면에서, 동일한 엔도뉴클레아제 표적 서열은 제1 레콤비나제에 대한 제1 및 제2 표적 서열 내에 통합된다. 일부 측면에서, 제1 레콤비나제에 대한 제1 및 제2 표적 서열 내에 통합된 엔도뉴클레아제 표적 서열은 동일한 엔도뉴클레아제에 대한 것이다. 일부 측면에서, 제1 레콤비나제에 대한 제1 표적 서열 내에 통합된 엔도뉴클레아제 표적 서열은 제1 레콤비나제에 대한 제2 표적 서열 내에 통합된 엔도뉴클레아제 표적 서열과 상이하다. 일부 측면에서, 제1 레콤비나제에 대한 제1 표적 서열 내에 통합된 엔도뉴클레아제 표적 서열은 제1 레콤비나제에 대한 제2 표적 서열 내에 통합된 엔도뉴클레아제 표적 서열과 상이한 엔도뉴클레아제에 대한 것이다.

발현 벡터 내 백본 서열과 레콤비나제에 대한 절단 부위 사이의 엔도뉴클레아제 표적 서열의 위치는 본원에 기재된 바와 같은 재조합 후에 엔도뉴클레아제 표적 서열이 박테리아 서열-무함유 벡터가 아닌 백본 서열과 계속 연관되어 있음을 보장한다. 그러므로, 재조합 후에, 백본 서열 및 엔도뉴클레아제 표적 부위를 함유하는 서열은 엔도뉴클레아제에 노출시킴으로써 박테리아 서열-무함유 벡터를 함유하는 제제로부터 제거되어, 박테리아 서열-무함유 벡터를 생산하는 방법에서 백본 서열을 제거하기 위한 정제 단계의 필요성을 감소시키거나 회피할 수 있다. 일부 측면에서, 엔도뉴클레아제는 본원에 기재된 바와 같은 벡터 생산 시스템의 숙주 세포에서 재조합 후에 발현되며, 여기서 엔도뉴클레아제는 엔도뉴클레아제 표적 부위에서 DNA를 절단하고, 백본 서열 및 엔도뉴클레아제 표적 부위를 함유하는 서열은 엑소뉴클레아제 (예를 들어, 엑소뉴클레아제 V)에 의해 분해된다.

일부 측면에서, 발현 벡터는 귀소 엔도뉴클레아제에 대한 엔도뉴클레아제 표적 서열을 포함한다. 일부 측면에서, 엔도뉴클레아제 표적 서열은 I-AniI, I-CeuI, I-ChuI, I-CpaI, I-CpaII, I-CreI, I-DmoI, H-DreI, I-HmuI, I-HmuII, I-LlaI, I-MsoI, PI-PfuI, PI-PkoII, I-PorI, I-PpoI, PI-PspI, I-ScaI, I-SceI, PI-SceI, I-SceII, I-SecIII, I-SceIV, I-SceV, I-SceVI, I-SceVII, I-Ssp6803I, I-TevI, I-TevII, I-TevIII, PI-TliI, PI-TliII, I-Tsp061I 또는 I-Vdi141I에 대한 것이다. 일부 측면에서, 엔도뉴클레아제 표적 서열은 I-SceI에 대한 것이다. 일부 측면에서, 엔도뉴클레아제 표적 서열은 PI-SceI에 대한 것이다. 귀소 엔도뉴클레아제에 대한 표적 서열은 관련 기술분야에 널리 공지되어 있다.

일부 측면에서, 발현 벡터는 뉴클레아제 게놈 편집 시스템의 일부인 엔도뉴클레아제를 포함하여 게놈 편집에 사용되는 엔도뉴클레아제에 대한 엔도뉴클레아제 표적 서열을 포함한다. 일부 측면에서, 뉴클레아제 게놈 편집 시스템은 클러스터링된 규칙적 간격의 짧은 회문구조 반복부-Cas (CRISPR-Cas) 시스템, 전사 활성화제-유사 이펙터 뉴클레아제 (TALEN) 시스템, 아연-핑거 뉴클레아제 (ZFN) 시스템, 또는 메가뉴클레아제 시스템이다.

일부 측면에서, 발현 벡터는 Cas 엔도뉴클레아제에 대한 엔도뉴클레아제 표적 서열을 포함한다. 일부 측면에서, Cas 엔도뉴클레아제는 Cas9 (예를 들어, 스트렙토코쿠스 피오게네스(Streptococcus pyogenes) Cas 9 (SpCas9), 스타필로코쿠스 아우레우스(Staphylococcus aureus) Cas9 (SaCas9), 프란시셀라 노비시다(Francisella novicida) Cas9 (FnCas9), 또는 네이세리아 메닝기티디스(Neisseria meningitidis) Cas9 (NmCas9)), Cas9 변이체 (예를 들어, Cas9β2, xCas9, SpCas9-NG, SpCas9-NRRH, SpCas9-NRCH, SpCas9-NRTH, SpG, SpRY), Cas3, Cas12 (예를 들어, Cas12a, Cas12b, Cas12c, Cas12d, 또는 Cas12e), Cas13 (예를 들어, Cas13a, Cas13b, Cas13c 또는 Cas13d), 또는 Cas14이다. 일부 측면에서, 본원에서 사용된 바와 같은 Cas 엔도뉴클레아제에 대한 엔도뉴클레아제 표적 서열은 가이드 RNA (gRNA) 표적화 서열과 상동성이고, Cas 엔도뉴클레아제에 의해 인식되는 프로토스페이서 인접 모티프 (PAM)를 포함한다. PAM 부위를 갖는 gRNA 표적화 서열과 상동성인 서열은 널리 공지된 CRISPR 시스템에 기초하여 일상적으로 설계될 수 있다. gRNA는 표적화 RNA (crRNA) 서열 및 트랜스-활성화 RNA (tracrRNA) 서열의 융합체를 포함하며, 이는 Cas 엔도뉴클레아제를 엔도뉴클레아제 표적 부위로 지정하고 절단을 촉매작용하는 상호작용 및 기능을 한다.

일부 측면에서, 발현 벡터는 제1 레콤비나제에 대한 제1 표적 서열의 3' 말단과 발현 카세트 내 또 다른 인핸서 또는 프로모터의 5' 말단 사이에 통합된 서열식별번호: 12와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함하는 합성 인핸서를 포함한다. 일부 측면에서, 발현 벡터는 제1 레콤비나제에 대한 제1 표적 서열의 3' 말단과 발현 카세트 내 또 다른 인핸서 또는 프로모터의 5' 말단 사이에 통합된 서열식별번호: 12의 핵산 서열을 포함하는 합성 인핸서를 포함한다. 일부 측면에서, 합성 인핸서는 핵산 서열의 다중 인접 카피, 예컨대, 예를 들어 1, 2, 3, 4, 5개 이상의 인접 카피를 포함한다. 일부 측면에서, 합성 인핸서는 핵산 서열의 3개 인접 카피를 포함한다. 일부 측면에서, 합성 인핸서는 서열식별번호: 46과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 합성 인핸서는 서열식별번호: 46의 핵산 서열을 포함한다. 일부 측면에서, 합성 인핸서는 닭 β-액틴 프로모터의 5' 말단에 통합된다. 일부 측면에서, 서열식별번호: 47과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함하는 키메라 인트론은 닭 β-액틴 프로모터의 3' 말단 및 관심 핵산 서열의 5'에 통합된다. 일부 측면에서, 서열식별번호: 47의 핵산 서열을 포함하는 키메라 인트론은 닭 β-액틴 프로모터의 3' 말단 및 관심 핵산 서열의 5'에 통합된다.

일부 측면에서, 발현 벡터는 제1 레콤비나제에 대한 제1 표적 서열의 3' 말단과 발현 카세트 내 프로모터의 5' 말단 사이에 통합된 CMV 인핸서를 포함한다. 일부 측면에서, CMV 인핸서는 서열식별번호: 12와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함하는 합성 인핸서의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 서열식별번호: 12의 핵산 서열을 포함하는 합성 인핸서의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 합성 인핸서의 다중 인접 카피의 3' 말단에, 예컨대, 예를 들어 합성 인핸서의 1, 2, 3, 4, 5개 이상의 인접 카피의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 합성 인핸서의 3개 인접 카피의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 서열식별번호: 46과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 서열식별번호: 46의 핵산 서열의 3' 말단에 통합된다. 일부 측면에서, CMV 프로모터는 CMV 인핸서의 3' 말단 및 관심 핵산 서열의 5'에 통합된다.

일부 측면에서, 발현 벡터는 제1 레콤비나제에 대한 제1 표적 서열과 관심 핵산 서열 사이에 통합된 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38 또는 서열식별번호: 39와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 발현 벡터는 제1 레콤비나제에 대한 제1 표적 서열과 관심 핵산 서열 사이에 통합된 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38 또는 서열식별번호: 39의 핵산 서열을 포함한다. 일부 측면에서, 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38 또는 서열식별번호: 39, 또는 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38 또는 서열식별번호: 39의 핵산 서열와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열은 관심 핵산 서열에 대해 5'에 위치된 발현 카세트 내 모든 조절 요소를 포함한다.

일부 측면에서, 발현 벡터는 인트론을 포함하는 5'UTR을 포함하고, 여기서 5'UTR (즉, 인트론을 포함하는 5'UTR)은 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합된다.

일부 측면에서, 5'UTR은 각각 5'UTR이 결여된 동일한 발현 벡터 또는 박테리아 서열-무함유 벡터와 비교하여 발현 벡터 또는 발현 벡터로부터 생산된 박테리아 서열-무함유 벡터로부터의 트랜스진 전사체 스플라이싱 및 번역을 개선하기 위한 것이다.

일부 측면에서, 인트론은 서열식별번호: 1과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 인트론은 서열식별번호: 1의 핵산 서열을 포함한다.

일부 측면에서, 5'UTR은 서열식별번호: 2와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함하며, 이는 내부 최소 인트론을 갖는 최적화된 5'UTR (본원에서 "5'UTR1"로도 지칭됨)이다. 일부 측면에서, 5'UTR은 서열식별번호: 2의 핵산 서열을 포함한다.

일부 측면에서, 5'UTR은 서열식별번호: 4와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 5'UTR은 서열식별번호: 4의 핵산 서열을 포함한다.

일부 측면에서, 5'UTR은 인트론 내에 통합된 비-코딩 서열을 추가로 포함한다.

일부 측면에서, 인트론은 서열식별번호: 1과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일하거나 서열식별번호: 1을 포함하고, 비-코딩 서열은 서열식별번호: 1의 위치 25 내지 55로부터의 임의의 2개의 뉴클레오티드에 상응하는 인트론 내 2개의 뉴클레오티드 사이에 통합된다.

일부 측면에서, 비-코딩 서열은 비-원핵생물성 및 비-바이러스성이다. 일부 측면에서, 비-코딩 서열은 진핵생물 서열이다. 일부 측면에서, 비-코딩 서열은 인트론, 유비쿼터스 염색질 개방 요소 (UCOE), S/MAR, SV40 인핸서 서열 (예를 들어, 하나 또는 하나 초과의 SV40 인핸서 서열, 예컨대 2, 3, 4, 5개 이상의 SV40 인핸서 서열), 척추동물 염색질 인슐레이터 (예를 들어, cHS4), WPRE, 또는 이들의 임의의 조합을 포함한다.

일부 측면에서, 비-코딩 서열은 S/MAR을 포함한다. 일부 측면에서, S/MAR은 서열식별번호: 9로서 본원에 제공된 MAR-5이다.

일부 측면에서, 5'UTR은 서열식별번호: 3과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 5'UTR은 서열식별번호: 3을 포함한다.

일부 측면에서, 5'UTR은 서열식별번호: 5와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 5'UTR은 서열식별번호: 5를 포함한다.

일부 측면에서, 5'UTR은 닭 β-액틴 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합된다.

일부 측면에서, 5'UTR은 CMV 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합된다.

일부 측면에서, 5'UTR은 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합되고, 여기서 프로모터는 CMV 인핸서의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 서열식별번호: 12와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함하는 합성 인핸서의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 서열식별번호: 12의 핵산 서열을 포함하는 합성 인핸서의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 합성 인핸서의 다중 인접 카피의 3' 말단에, 예컨대, 예를 들어 합성 인핸서의 1, 2, 3, 4, 5개 이상의 인접 카피의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 합성 인핸서의 3개 인접 카피의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 서열식별번호: 46과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 서열식별번호: 46의 핵산 서열의 3' 말단에 통합된다.

일부 측면에서, 발현 벡터는 관심 핵산 서열의 3' 말단에 통합된 폴리아데닐화 신호를 포함한다. 일부 측면에서, 폴리아데닐화 신호는 제노푸스 라에비스(Xenopus laevis) 베타-글로빈 폴리아데닐화 신호, 인간 베타-글로빈 폴리아데닐화 신호, 또는 하이브리드 제노푸스 라에비스 및 인간 베타-글로빈 폴리아데닐화 신호를 포함한다. 일부 측면에서, 폴리아데닐화 신호는 제노푸스 라에비스 베타-글로빈 폴리아데닐화 신호, 인간 베타-글로빈 폴리아데닐화 신호, 또는 하이브리드 제노푸스 라에비스 및 인간 베타-글로빈 폴리아데닐화 신호의 다중 카피, 예컨대, 예를 들어 1, 2, 3, 4 또는 5개 카피를 포함한다. 일부 측면에서, 폴리아데닐화 신호는 서열식별번호: 13, 서열식별번호: 14 또는 서열식별번호: 15와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 폴리아데닐화 신호는 서열식별번호: 13, 서열식별번호: 14 또는 서열식별번호: 15의 핵산 서열을 포함한다. 일부 측면에서, 폴리아데닐산 꼬리 (즉, 폴리(A) 꼬리는 폴리아데닐화 신호의 3' 말단에 위치된다. 일부 측면에서, 폴리(A) 꼬리는 길이가 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120개 이상의 잔기이다. 일부 측면에서, 폴리아데닐화 신호 및 폴리(A) 꼬리를 포함하는 서열은 서열식별번호: 16, 서열식별번호: 17 또는 서열식별번호: 18과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일하다. 일부 측면에서, 폴리아데닐화 신호 및 폴리(A) 꼬리를 포함하는 서열은 서열식별번호: 16, 서열식별번호: 17 또는 서열식별번호: 18을 포함한다.

일부 측면에서, 발현 벡터는 발현 카세트 내 척추동물 염색질 인슐레이터를 포함한다. 일부 측면에서, 척추동물 염색질 인슐레이터는 5'-HS4 닭-β-글로빈 인슐레이터 (cHS4)이다. 예를 들어 문헌 [Benabdellah et al., PLoS ONE 9(1): e84268 (2014)]; [Lu et al., FEBS Open Bio 10: 644-656 (2020)]; [Hanawa et al., Mol. Ther. 17(4): 667-674 (2009)]; [Walters et al., Mol. Cell. Biol. 19(5): 3714-3726 (1999)]을 참조한다. 일부 측면에서, 척추동물 염색질 인슐레이터는 본원에 기재된 바와 같은 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된다. 일부 측면에서, 척추동물 염색질 인슐레이터는 본원에 기재된 바와 같은 5'UTR의 인트론 내에 통합된다.

일부 측면에서, 척추동물 염색질 인슐레이터는 서열식별번호: 8과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 척추동물 염색질 인슐레이터는 서열식별번호: 8을 포함한다.

일부 측면에서, 척추동물 염색질 인슐레이터는 각각 척추동물 염색질 인슐레이터 없이 동일한 발현 벡터 또는 박테리아 서열-무함유 벡터와 비교하여 발현 벡터 또는 발현 벡터로부터 생산된 박테리아 서열-무함유 벡터의 확립 (즉, 형질감염 효율)을 개선하기 위한 것이다.

일부 측면에서, 발현 벡터는 발현 카세트 내 WPRE를 포함한다. 예를 들어 문헌 [Higashimoto et al., Gene Therapy 14: 1298-1304 (2007)]을 참조한다. 일부 측면에서, WPRE는 본원에 기재된 바와 같은 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된다. 일부 측면에서, WPRE는 본원에 기재된 바와 같은 S/MAR의 3' 말단 및 본원에 기재된 바와 같은 폴리아데닐화 신호의 5' 말단에서 발현 카세트에 통합된다. 일부 측면에서, WPRE는 본원에 기재된 바와 같은 5'UTR의 인트론 내에 통합된다.

일부 측면에서, WPRE는 서열식별번호: 11과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, WPRE는 서열식별번호: 11을 포함한다.

일부 측면에서, WPRE는 각각 WPRE가 결여된 동일한 발현 벡터 또는 박테리아 서열-무함유 벡터와 비교하여 발현 벡터 또는 발현 벡터로부터 생산된 박테리아 서열-무함유 벡터로부터의 트랜스진의 발현을 개선한다.

일부 측면에서, 발현 벡터는 발현 카세트 내 S/MAR을 포함한다. 예를 들어 문헌 [Martens et al., Mol. Cell. Biol. 22(8): 2598-2606 (2002)]; [Narwade et al., Nucleic Acids Res. 47(14): 7247-7261 (2019)]을 참조한다. 일부 측면에서, S/MAR은 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된다. 일부 측면에서, S/MAR은 본원에 기재된 바와 같은 관심 핵산 서열의 3' 말단 및 WPRE의 5' 말단에서 발현 카세트에 통합된다. 일부 측면에서, S/MAR은 본원에 기재된 바와 같은 5'UTR의 인트론 내에 통합된다.

일부 측면에서, S/MAR은 인간 베타-인터페론 MAR의 단편인 MAR-3, MAR-4 또는 MAR-5이다. 예를 들어 문헌 [Wang et al., Mol. Biol. Cell 30: 2761-2770 (2019)]을 참조한다. 일부 측면에서, S/MAR은 서열식별번호: 9와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, S/MAR은 서열식별번호: 9를 포함한다.

일부 측면에서, S/MAR은 인간 세포독성 세린 프로테아제-B (CSP-B) MAR 또는 CSP-C MAR이다. 예를 들어 문헌 [Hanson and Ley, Blood 79(3):610-618 (1992)]; [Klein et al., Tissue Antigens 35(5):220-228 (1990)]을 참조한다. 일부 측면에서, S/MAR은 서열식별번호: 10과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, S/MAR은 서열식별번호: 10을 포함한다.

일부 측면에서, S/MAR은 각각 S/MAR이 결여된 동일한 발현 벡터 또는 박테리아 서열-무함유 벡터와 비교하여 발현 벡터 또는 발현 벡터로부터 생산된 박테리아 서열-무함유 벡터의 발현 수준, 안정성 및/또는 내구성을 개선하기 위한 것이다 (예를 들어, 에피솜 유지 및 복제, 예컨대 딸 세포로의 벡터의 확장 및 분할에 의해, 및/또는 후성유전학적 침묵 방지에 의해).

일부 측면에서, 상기 기재된 바와 같은 (c)(i)-(c)(vii) 중 임의의 하나 이상을 포함하는 발현 벡터 (즉, DTS 없이)는 제1 레콤비나제에 대한 제1 및 제2 표적 서열의 각 측면을 플랭킹하는 인핸서 서열을 추가로 포함한다. 일부 측면에서, 제1 레콤비나제에 대한 제1 및 제2 표적 서열의 각 측면을 플랭킹하는 인핸서 서열은 제1 레콤비나제에 대한 제1 및 제2 표적 서열의 각 측면을 플랭킹하는 적어도 2개의 인핸서 서열이다. 일부 측면에서, 인핸서 서열은 SV40 인핸서 서열이다.

일부 측면에서, 발현 벡터는 DTS를 포함한다. 일부 측면에서, DTS는 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 비-결합 영역 내 제1 레콤비나제에 대한 제1 및/또는 제2 표적 서열 내에 통합되고, 여기서 DTS는 발현 카세트와 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 절단 부위 사이에 있다. 일부 측면에서, DTS는 SV40 인핸서 서열이다. 일부 측면에서, DTS는 세포-특이적이다. 일부 측면에서, DTS는 평활근 세포, 배아 줄기 세포, 유형 II 폐포세포, 내피 세포 또는 골모세포에 특이적이다.

발현 카세트와 발현 벡터 내 레콤비나제에 대한 절단 부위 사이의 DTS의 위치는 DTS가 본원에 기재된 바와 같은 재조합 후에 백본 서열이 아닌 박테리아 서열-무함유 벡터와 회합된 상태로 유지되도록 보장한다.

일부 측면에서, 발현 벡터는 발현 카세트 내 UCOE를 포함한다. 예를 들어 문헌 [Muller-Kuller et al., Nucleic Acids Res. 43(3): 1577-1592 (2015)]; [Skipper et al., BMC Biotechnol. 19:75 (2019)]; [Rudina et al., bioRxiv, doi.org/10.1101/626713 (2019)]; [Neville et al., Biotechnol. Adv. 35(5): 557-564 (2017)]을 참조한다. 일부 측면에서, UCOE는 제1 레콤비나제에 대한 제1 표적 서열의 3' 말단과 발현 카세트 내 프로모터 또는 임의의 인핸서의 5' 말단 사이에 위치된다. 일부 측면에서, UCOE는 본원에 기재된 바와 같은 5'UTR의 인트론 내에 통합된다.

일부 측면에서, UCOE는 A2UCOE이다. 일부 측면에서, UCOE는 서열식별번호: 6과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, UCOE는 서열식별번호: 6이다.

일부 측면에서, UCOE는 SRF-UCOE이다. 예를 들어 국제 공개 번호 WO2020223160을 참조한다. 일부 측면에서, UCOE는 서열식별번호: 7과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, UCOE는 서열식별번호: 7이다.

일부 측면에서, UCOE는 각각 UCOE가 결여된 동일한 발현 벡터 또는 박테리아 서열-무함유 벡터와 비교하여 발현 벡터 또는 발현 벡터로부터 생산된 박테리아 서열-무함유 벡터로부터의 트랜스진의 발현을 개선한다.

일부 측면에서, 발현 벡터는 발현 카세트 내 인핸서-1을 포함한다. 일부 측면에서, 인핸서-1은 제1 레콤비나제에 대한 제1 표적 서열의 3' 말단과 발현 카세트 내 프로모터 또는 임의의 다른 인핸서의 5' 말단 사이에 통합된다. 일부 측면에서, 인핸서-1은 UCOE의 3' 말단과 CMV 인핸서의 5' 말단 사이에 통합된다. 일부 측면에서, 인핸서-1은 서열식별번호: 12와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 인핸서-1은 서열식별번호: 12이다.

일부 측면에서, 발현 벡터는 발현 카세트 내 CMV, EF1, SV40, CAG, Rho, VDM2, HCR 또는 HLP 프로모터, 또는 이의 변이체를 포함한다. 일부 측면에서, 발현 벡터는 발현 카세트 내 CMV 프로모터 변이체를 포함한다. 예를 들어 국제 공개 번호 WO2012099540; 문헌 [Xu et al., Bioengineered 10(1): 548-560, DOI: 10.1080/21655979.2019.1684863 (2019)]을 참조한다.

일부 측면에서, 발현 벡터는 발현 카세트 내 EF1-알파 프로모터를 포함한다. 일부 측면에서, 발현 벡터는 발현 카세트 내 CMV 인핸서 및 EF1-알파 프로모터를 포함한다.

일부 측면에서, 발현 벡터는 베타-글로빈 폴리아데닐화 신호의 2개 카피를 포함하는 발현 카세트 내 3'UTR을 포함한다. 일부 측면에서, 3'UTR은 관심 핵산 서열과 제1 레콤비나제에 대한 제2 표적 서열의 5' 말단 사이에 통합된다.

일부 측면에서, 3'UTR은 제노푸스 라에비스 베타-글로빈 폴리아데닐화 신호의 2개 카피를 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 13과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 13이다.

일부 측면에서, 3'UTR은 인간 베타-글로빈 폴리아데닐화 신호의 2개 카피를 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 14와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 14이다.

일부 측면에서, 3'UTR은 제노푸스 라에비스 베타-글로빈 폴리아데닐화 신호의 1개 카피 및 인간 베타-글로빈 폴리아데닐화 신호의 1개 카피를 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 15와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 15이다.

일부 측면에서, 3'UTR은 100 내지 120개의 아데닌 뉴클레오티드, 즉, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119 또는 120개의 아데닌 뉴클레오티드를 포함하는 폴리(A) 꼬리를 추가로 포함한다 (즉, 3'UTR의 3' 말단에).

일부 측면에서, 3'UTR은 서열식별번호: 16과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 16이다.

일부 측면에서, 3'UTR은 서열식별번호: 17과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 17이다.

일부 측면에서, 3'UTR은 서열식별번호: 18과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 18이다.

발현 벡터는 본원에 기재된 바와 같은 제1 및/또는 제2 표적 서열 및/또는 발현 카세트에 대한 상기 변형의 임의의 조합을 함유할 수 있다. 일부 측면에서, 조합은 상승작용적 효과를 제공한다.

일부 측면에서, 제1 레콤비나제에 대한 제1 및 제2 표적 서열 및 하나 이상의 추가 레콤비나제에 대한 하나 이상의 추가 표적 서열은 PY54 pal 부위, N15 telRL 부위, loxP 부위, φK02 telRL 부위, FRT 부위, phiC31 attP 부위 및 λ attP 부위로 이루어진 군으로부터 선택된다. 일부 측면에서, 발현 벡터는 각각의 표적 서열을 포함한다. 일부 측면에서, 발현 벡터는 pal 부위 및 pal 부위 내에 통합된 telRL, loxP 및 FRT 레콤비나제 표적 결합 서열을 포함한다. 일부 측면에서, 제1 레콤비나제에 대한 제1 및 제2 표적 서열은 각각 서열식별번호: 33의 핵산 서열을 포함한다.

일부 측면에서, 본원에 기재된 임의의 발현 카세트 내 관심 핵산 서열은 하기를 코딩하는 서열을 포함한다: 폴리펩티드, RNA (메신저 RNA (mRNA), 마이크로-RNA (miRNA), 작은 간섭 RNA (siRNA), 작은 헤어핀 RNA (shRNA), 리보자임 또는 안티센스 RNA), 또는 비-코딩 DNA (예를 들어, 안티센스 올리고뉴클레오티드). 일부 측면에서, 관심 핵산 서열은 인트론 및/또는 엑손을 포함하는 게놈 DNA 서열이다. 일부 측면에서, 관심 핵산 서열은 하기를 코딩하는 서열을 포함한다: 항암제, 종양 서프레서, 아폽토시스 작용제, 항혈관신생제, 효소, 세포독성제, 자살 유전자, 시토카인, 인터페론, 인터루킨, 면역조정제, 면역자극제, 면역억제제, 케모카인, 항원-제시 세포 자극용 항원, 항체 (예를 들어, 항체의 중쇄 및/또는 경쇄, 예컨대 모노클로날, 키메라, 인간화 또는 인간 항체, 또는 이의 항원-결합 단편), 게놈 편집 시스템 또는 이의 일부 (예를 들어, CRISPR-Cas, TALEN, ZFN 또는 메가뉴클레아제 시스템 또는 이의 일부, 예컨대 Cas 엔도뉴클레아제 또는 gRNA), 또는 면역원성 작용제 (예를 들어, VLP 및/또는 백신으로서). 일부 측면에서, 관심 핵산 서열은 핵산 서열이 세포내에서 발현될 때 VLP를 형성할 수 있는 폴리펩티드를 코딩하는 서열을 포함한다.

예시적인 치료적 표적 및 적응증은 하기를 포함한다: 단일유전자 장애와 연관된 유전자, 예를 들어 간, 혈액 또는 눈 장애, 갈락토시다제 알파 (GLA, 예를 들어 파브리병 치료용), 나트륨 전압-개폐 채널 알파 서브유닛 1 (SCN1A, 예를 들어 드라베 증후군 치료용), ATP 결합 카세트 서브패밀리 A 구성원 4 (ABCA4, 예를 들어 스타가르트병 치료용), 계면활성제 단백질 B (SP-B, 예를 들어 계면활성제 기능장애 장애 치료용), 계면활성제 단백질 C (SP-C, 예를 들어 계면활성제 기능장애 장애 치료용), ATP-결합 카세트 서브패밀리 A 구성원 3 (ABCA3, 예를 들어 계면활성제 기능장애 장애 치료용), 용질 담체 패밀리 34 구성원 2 (SLC34A2, 예를 들어 폐포 미세결석증 및/또는 고환 미세결석증 치료용), 낭포성 섬유증 막횡단 전도도 조절제 (CFTR, 예를 들어 낭포성 섬유증 치료용), 글루타메이트 데카르복실라제 (GAD, 예를 들어 GAD65 또는 GAD67, 예를 들어 파킨슨병 치료용), 아스파르토아실라제 유전자 (ASPA, 아미노아실라제 (AAC)로도 공지됨, 예를 들어 카나반병 치료용), 방향족 L-아미노산 데카르복실라제 (AADC, 예를 들어 파킨슨병 치료용 및/또는 AADC 결핍증 치료용), 뉴르투린 (NRTN, 예를 들어 파킨슨병 치료용), 신경교세포주-유래 신경영양 인자 (GDNF, 예를 들어 파킨슨병 치료용), 신경 성장 인자 (NGF, 예를 들어 알츠하이머병 치료용), 트리펩티딜 펩티다제 I (TPP1, 세로이드 리포푸시노시스 뉴런-2 (CLN2)로도 공지됨, 예를 들어 바텐병, 예를 들어 CLN2 질환 치료용), 아릴술파타제 A (ARSA, 예를 들어 이염백색질장애 치료용), N-술포글루코사민 술포히드롤라제 (SGSH, 예를 들어 산필리포 증후군, 유형 A 치료용), 술파타제-변형 인자 1 (SUMF1, 예를 들어 산필리포 증후군, 유형 A 치료용), N-아세틸-알파-글루코사미니다제 (NAGLU, 예를 들어 산필리포 증후군, 유형 B 치료용), 운동 뉴런 1의 생존 (SMN1, 예를 들어 척수성 근위축증 1 치료용), 망막 색소 상피-특이적 65 kDa 단백질 (RPE65, 레티노이드 이소메로히드롤라제로도 공지됨, 예를 들어 레버 선천 흑내장증 치료용), Rab 에스코트 단백질 1 (REP1, 예를 들어 맥락막혈증 치료용), 레티노시신 1 (RS1, 예를 들어 X-연관 청소년 망막분리증 치료용), 알파-1 항트립신 (AAT, 예를 들어 유전성 폐기종 또는 AAT 결핍증 치료용), 미니디스트로핀 (예를 들어 뒤센 근이영양증 치료용), α-사르코글리칸 (αSG, 예를 들어 뒤센 근이영양증 또는 지대 근이영양증 유형 2 치료용), β-사르코글리칸 (βSG), γ-사르코글리칸 (γSG, 예를 들어 지대 근이영양증 유형 2 치료용), δ-사르코글리칸 (γSG), 이포단백질 리파제 (LPL, 예를 들어 가족성 LPL 결핍증 치료용), 산 알파-글루코시다제 (GAA, 예를 들어 폼페병 치료용), 종양 괴사 인자 수용체:Fc (TNFR:Fc, 예를 들어 관절염, 예를 들어 염증성 관절염 치료용), 근형질/소포체 Ca(2+)ATPase 2a (SERCA2a, 예를 들어 울혈성 심부전 치료용), 인자 VIII 또는 인자 IX (FVIII 또는 FIX, 예를 들어 혈우병 B 치료용), 포르포빌리노겐 데아미나제 유전자 (PBGD, 예를 들어 급성 간헐성 포르피린증 치료용), 가용성 fms-유사 티로신 키나제-1 (sFLT1, 예를 들어 연령-관련 황반 변성 또는 암, 예를 들어 난소암 치료용), VEGFR-1 및 VEGF-R2의 도메인을 포함하는 가용성 키메라 혈관 내피 성장 인자 (VEGF) 수용체 (예를 들어 암, 예를 들어 흑색종 또는 결장암 치료용), 가용성 VEGFR3 (예를 들어 암, 예를 들어 자궁내막암 치료용), 가용성 VEGF-C 미끼 수용체 (sVEGFR3-Fc, 예를 들어 암, 예를 들어 흑색종, 신장 세포 암종 또는 전립선암 치료용), 색소 상피-유래 성장 인자 (PEDF, 예를 들어 암, 예를 들어 루이스 폐암종 치료용), VEGFR2에 대한 중화 모노클로날 항체 (예를 들어, DC101, 예를 들어 암, 예를 들어 흑색종 또는 교모세포종 치료용), 엔도스타틴 (예를 들어 암, 예를 들어 방광암 또는 췌장암 치료용), 안지오스타틴 (예를 들어 암, 예를 들어 간암 치료용), 엔도스타틴 및 안지오스타틴 둘 모두 (즉, 바이시스트론 서열로서, 예를 들어 암, 예를 들어 난소암 또는 전립선암 치료용), 엔도스타틴 돌연변이체 (즉, P1254A-엔도스타틴, 예를 들어 암, 예를 들어 난소암 치료용), TSP-1의 항혈관신생 도메인 (3TSR, 예를 들어 암, 예를 들어 췌장암 치료용), 조직 인자 경로 억제제-2 (TFPI-2, 예를 들어 암, 예를 들어 교모세포종 치료용), 플라스미노겐의 단편 (예를 들어, 크링글 5, 예를 들어 암, 예를 들어 난소암 치료용), 플라스미노겐 크링글 1-5 (예를 들어 암, 예를 들어 흑색종 또는 폐암 치료용), 폴딩되지 않은 단백질 반응 단백질에 대한 siRNA (UPR; 예를 들어, IRE1α, XBP-1 또는 ATF6, 예를 들어 암, 예를 들어 유방암 치료용), 바소스타틴 (예를 들어 암, 예를 들어 폐암 치료용), 헤르페스 심플렉스 바이러스 유형 1 티미딘 키나제 (HSV-TK, 예를 들어 암, 예를 들어 유방암 치료용), sc39TK (예를 들어 암, 예를 들어 자궁경부암 치료용), 디프테리아 독소 A (DTA, 예를 들어 암, 예를 들어 자궁경부암 또는 골수종 치료용), 아폽토시스의 p53 상향조절된 조정제 (PUMA, 예를 들어 암, 예를 들어 자궁경부암 또는 골수종 치료용), 종양 괴사 인자 (TNF)-관련 아폽토시스-유도 리간드 (TRAIL, 예를 들어 암, 예를 들어 림프종, 간세포 암종, 두경부 편평 세포 암종 (즉, 두경부 암), 또는 교모세포종 치료용), 가용성 TRAIL (예를 들어 암, 예를 들어 간암 또는 폐 선암종 치료용), IFN-β (예를 들어 암, 예를 들어 결장직장암, 폐암, 신경모세포종, 또는 다형성 교모세포종 치료용), IFN-α (예를 들어 암, 예를 들어 전이성 흑색종 치료용), CD-40 리간드 (CD40L) 또는 CD40L 돌연변이체 (예를 들어 암, 예를 들어 폐암 치료용), 흑색종 분화-연관 유전자-7 및 인터루킨 24 (mda-7 및 IL24, 예를 들어 암, 예를 들어 에를리히 복수 종양 치료용), 아폽토틴 및 IL24 (예를 들어 암, 예를 들어 간암 치료용), IL24 (예를 들어 암, 예를 들어 혼합형-계통 백혈병 (MLL)/AF4 양성 급성 림프모구성 백혈병 (ALL) 치료용), IL15 (예를 들어 암, 예를 들어 전이성 간세포 암종 치료용), 이차 림프 조직 케모카인 (SLC, 예를 들어 암, 예를 들어 간암 치료용), Nk4 (간세포 성장 인자 (HGF)의 N-말단 헤어핀 및 후속 4개의 크링글 도메인, 예를 들어 암, 예를 들어 전이성 루이스 폐암종 치료용), 종양 괴사 인자 슈퍼패밀리 구성원 14 (TNFSF14, LIGHT로도 공지됨, 예를 들어 암, 예를 들어 자궁경부암 치료용), 과립구-대식세포 콜로니-자극 인자 (GM-CSF, 예를 들어 암 치료용), TNF-α (예를 들어 암, 예를 들어 신경교종 치료용), 서바이빈의 우성 음성 돌연변이체 (예를 들어, C84A 또는 T34A, 예를 들어 암, 예를 들어 결장암 또는 위암 치료용), 인간 텔로머라제 역전사효소의 C-말단 단편 (hTERTC27, 예를 들어 암, 예를 들어 다형성 교모세포종 치료용), 마스핀 (예를 들어 암, 예를 들어 전립선암 치료용), nm23H1 (예를 들어 암, 예를 들어 전이성 난소암 치료용), 인간 간세포 성장 인자의 크링글 1 도메인 (HGFK1, 예를 들어 암, 예를 들어 결장직장암종 치료용), 항-칼시토닌 리보자임 (예를 들어 암, 예를 들어 전립선암 치료용), 진핵생물 번역 개시 인자 4E-결합 단백질 1 (4EBP1, 예를 들어 암, 예를 들어 폐암 치료용), C-X-C 모티프 케모카인 수용체 2 (CXCR2) C-꼬리 서열 (예를 들어 암, 예를 들어 췌장암 치료용), 알파-토코페롤-연관 단백질 (TAP, 예를 들어 암, 예를 들어 전립선암 치료용), 트리코산틴 (예를 들어 암, 예를 들어 간세포 암종 치료용), 데코린 (예를 들어 암, 예를 들어 다형성 교모세포종 치료용), 카텔리시딘 (예를 들어 암, 예를 들어 결장암 치료용), 니만-피크 유형 C2 (NPC2, 예를 들어 암, 예를 들어 간세포 암종 치료용), 뮬러리안 억제 성분 (MIS, 예를 들어 암, 예를 들어 난소암 치료용), p53 (예를 들어 암, 예를 들어 기관지폐포암 치료용), 암 1에서 고도로 발현되는 shRNA (Hec1, 예를 들어 암, 예를 들어 신경교종 치료용), 엡스타인-바 바이러스 잠복막 단백질-1에 대한 shRNA (EBV LMP-1, 예를 들어 암, 예를 들어 비인두암 치료용), 인간 유두종 바이러스 16 E7 종양유전자에 대한 안티센스 RNA (HPV16-E7, 예를 들어 암, 예를 들어 자궁경부암 치료용), 안드로겐 수용체에 대한 shRNA (AR, 예를 들어 암, 예를 들어 전립선암 치료용), 달팽이에 대한 siRNA (SNA1로도 공지됨, 예를 들어 암, 예를 들어 췌장암 치료용), Slug에 대한 siRNA (즉, SNAI2의 단백질 생성물, 예를 들어 암, 예를 들어 담관암종 (간암) 치료용), 4.5 LIM-전용 단백질 2에 대한 shRNA (FHL2, 예를 들어 암, 예를 들어 결장암 치료용), miR-26a (예를 들어 암, 예를 들어 간세포 암종 치료용), HPV 16 구조적 단백질 L1 (HPV16-L1, 예를 들어 암, 예를 들어 자궁경부암 치료용), HPV 16 E5, E6, 및 E7 종양유전자 (HPV16 E5/E6/E7, 예를 들어 암, 예를 들어 자궁경부암 치료용), B-세포 백혈병/림프종 1 (BLC1) 이디오타입 (예를 들어 암, 예를 들어 B 세포 백혈병/림프종 1 치료용), 열 충격 단백질에 융합된 EBV LMP1 및 LMP2 (EBV LMP2/1-hsp, 예를 들어 암, 예를 들어 비인두 암종 치료용), 암종배아 항원 (CEA, 예를 들어 암, 예를 들어 결장암 치료용), 열 충격 단백질과 조합된 가용성 형태의 B 및 T 림프구 감쇠제 (BTLA 및 HSP70, 예를 들어 암, 예를 들어 흑색종 폐전이 치료용), HPV16-L1/E7 (예를 들어 암, 예를 들어 자궁경부암 치료용), HPV16-L1 (예를 들어 암, 예를 들어 자궁경부암 치료용), 항-EGFR 항체 (예를 들어, 14D1, 예를 들어 암, 예를 들어 외음부 암종 치료용), 항-사멸 수용체 5 (DR5) 항체 (예를 들어, 아드엑시맙(adximab), 예를 들어 암, 예를 들어 간암 또는 결장암 치료용), 항-에놀라제 1 (ENOI1) 항체 (예를 들어 암, 예를 들어 췌관 선암종 치료용), 항-VEGFA 항체 (예를 들어, 베바시주맙, 예를 들어 암, 예를 들어 전이성 폐암 또는 난소암 치료용), 뮤신 1 (MUC1) 항원 (예를 들어 암, 예를 들어 위암 치료용), 또는 아쿠아포린 (예를 들어, hAQP1, 예를 들어 방사선조사 유도 이하선 타액 기능저하, 즉, 구강건조증 치료용).

일부 측면에서, 관심 핵산 서열은 유전자 편집 (예를 들어, 유전적 결핍증, 장애 또는 질환의 치료를 포함하는 유전자 요법)에서 사용하기 위한 것이다.

일부 측면에서, 관심 핵산 서열은 유전자 편집을 위한 표적 부위 (즉, 유전자 편집의 표적인 DNA 또는 RNA 서열 내의 부위)에 삽입하기 위한 것이다. 유전자 편집을 위한 표적 부위는 임의의 유전적 요소, 예컨대 임의의 시스 요소를 포함한다. 일부 측면에서, 유전자 편집을 위한 표적 부위는 유전자의 엑손, 유전자의 인트론, 또는 유전자의 조절 요소 내에 위치된다.

일부 측면에서, 유전자 편집은 엔도뉴클레아제를 포함한다. 일부 측면에서, 엔도뉴클레아제는 게놈 편집 시스템과 연관된다. 일부 측면에서, 엔도뉴클레아제는 예를 들어 귀소 엔도뉴클레아제, 부위-특이적 뉴클레아제, 구조-가이드 뉴클레아제, 또는 RNA-가이드 뉴클레아제 (예를 들어, 트랜스포존-코딩된 RNA-가이드 뉴클레아제)이다.

일부 측면에서, 유전자 편집은 유전자 편집을 위한 표적 부위 내에 이중-가닥 파단을 생성하는 게놈 편집 시스템을 포함한다. 일부 측면에서, 게놈 편집 시스템은 CRISPR-Cas, TALEN, ZFN 또는 메가뉴클레아제 유전자 편집 시스템이다.

일부 측면에서, 관심 핵산 서열은 이중-가닥 파단에서 비-상동성 말단 연결에 의해 유전자 편집을 위한 표적 부위에 삽입된다. 일부 측면에서, 이중-가닥 파단은 CRISPR-Cas 시스템에 의해 생성된다. 일부 측면에서, 본원에 기재된 바와 같은 발현 벡터는 제1 레콤비나제에 대한 제1 및 제2 표적 서열과 관심 핵산 서열 사이 (즉, 5' 슈퍼 서열과 관심 핵산 서열 사이 및 3' 슈퍼 서열과 관심 핵산 서열 사이)에 위치된 Cas 엔도뉴클레아제 표적 서열 (즉, gRNA 표적화 서열과 상동성인 서열)을 포함하며, 여기서 유전자 편집을 위한 표적 부위 (예를 들어, 염색체 내 표적 부위)는 동일한 Cas 엔도뉴클레아제 표적 서열을 포함한다. 예를 들어, 발현 벡터로부터 생성된 박테리아 서열-무함유 벡터 (예를 들어, msDNA) 내 핵산 서열을 플랭킹하는 Cas 엔도뉴클레아제 표적 서열의 프로세싱은 슈퍼 서열의 제거를 초래하며, 선형 공유 폐쇄형 박테리아 서열-무함유 벡터, 예컨대 msDNA를 대신 선형 및 개방형으로 만들고, 비-상동성 말단-연결 사건을 처리할 수 있는 반응성 말단이 갖도록 한다.

일부 측면에서, 관심 핵산 서열은 상동성-지정 복구에 의해 유전자 편집을 위한 표적 부위에 삽입되며, 이는 이중-가닥 파단을 플랭킹하는 서열과 관심 핵산 서열과 연관된 상동성 서열 사이의 재조합을 통해 발생한다.

일부 측면에서, 관심 핵산 서열은 상동성-지정 복구를 뒷받침하기 위해 이중-가닥 파단을 플랭킹하는 서열과 충분한 상동성을 갖는다.

일부 측면에서, 관심 핵산 서열은 5' 및 3' 상동성 아암 (즉, 상동성-지정 복구를 매개하기 위해 이중-가닥 파단을 플랭킹하는 서열과 충분한 상동성을 갖는 서열)에 의해 플랭킹된다.

일부 측면에서, 상동성-지정 복구를 매개하기에 충분한 상동성은 관심 핵산 서열과 이중-가닥 파단을 플랭킹하는 서열 사이 또는 관심 핵산 서열을 플랭킹하는 상동성 아암과 이중-가닥 파단을 플랭킹하는 서열 사이에 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95% 또는 약 100% 상동성을 포함한다. 일부 측면에서, 이중-가닥 파단을 플랭킹하는 서열은 이중-가닥 파단의 약 100개 염기, 약 90개 염기, 약 80개 염기, 약 70개 염기, 약 60개 염기, 약 50개 염기, 약 45개 염기, 약 40개 염기, 약 35개 염기, 약 30개 염기, 약 25개 염기, 약 20개 염기, 약 15개 염기, 약 10개 염기 또는 약 5개 염기 내에 있거나, 이중-가닥 파단을 바로 옆에 플랭킹한다.

일부 측면에서, 상동성-지정 복구는 CRISPR-Cas 시스템에 의해 이루어진다. 일부 측면에서, 본원에 기재된 바와 같은 발현 벡터는 CRISPR-Cas 시스템을 포함한다. 일부 측면에서, 발현 벡터는 Cas 엔도뉴클레아제 (예를 들어, 면역침묵된 Cas9-β2)를 코딩하는 서열의 각 측면을 플랭킹하는 tRNA-gRNA 폴리시스트론을 포함한다. 예시적인 측면은 도 49에 표시된다. 일부 측면에서, 발현 벡터는 인트론 내 tRNA-gRNA 폴리시스트론을 포함하는 본원에 기재된 바와 같은 5'UTR (예를 들어, 5'UTR1)을 포함한다. 일부 측면에서, 발현 벡터는 tRNA-gRNA 폴리시스트론을 포함하는 본원에 기재된 바와 같은 키메라 인트론을 포함한다. 일부 측면에서, 본원에 기재된 바와 같은 EF1-알파 프로모터는 고유 인트론에 tRNA-gRNA 폴리시스트론을 포함한다. 일부 측면에서, 본원에 기재된 바와 같은 폴리아데닐화 신호 또는 3'UTR은 tRNA-gRNA 폴리시스트론을 포함한다. 예를 들어, 플랭킹 tRNA-gRNA 폴리시스트론을 포함하는 벡터 (즉, 발현 벡터 또는 박테리아 서열-무함유 벡터 (예를 들어, msDNA))로부터 Cas 엔도뉴클레아제의 발현 시, gRNA는 유리 RNA로서 절개되고, 유전자 편집을 위한 표적 부위 (예를 들어, 염색체 내 표적 부위) 뿐만 아니라 벡터 상의 플랭킹 gRNA 부위로 Cas 엔도뉴클레아제를 표적화한다. 이는 벡터로부터 Cas 엔도뉴클레아제의 자기-제한을 초래하고, 이는 Cas 엔도뉴클레아제의 추가 발현을 제한한다. 이 프로세스의 개략도는 도 50에 나타냈으며, 이는 또한 별도의 벡터 상에 상동성 아암에 의해 플랭킹된 관심 핵산 (즉, 관심 유전자, GOI)을 사용한 상동성-지정 복구의 매개를 보여준다. 일부 측면에서, 본원에 기재된 바와 같은 발현 벡터는 예를 들어 도 51의 시나리오 1에 나타낸 바와 같이 상동성 아암에 의해 플랭킹된 관심 핵산 서열을 포함한다. 일부 측면에서, 본원에 기재된 바와 같은 관심 핵산 서열 및 자기-제한 CRISPR-Cas 시스템은 도 51의 시나리오 2에 나타낸 바와 같이 본원에 기재된 바와 같은 단일 발현 벡터에 위치된다. 후자의 측면에서, 자기-제한 CRISPR-Cas 시스템을 포함하는 서열은 상동성 아암에 의해 플랭킹된 관심 핵산 서열을 포함하는 서열에 대해 5'에 위치된다.

일부 측면에서, 관심 핵산 서열은 유전자 편집을 위한 표적 부위와 상동성이고, 표적 부위와 비교하여 하나 이상의 뉴클레오티드 삽입, 결실, 역위 또는 재배열을 포함한다. 일부 측면에서, 관심 핵산은 게놈 서열, 코딩 영역, 엑손, 인트론, 또는 표적 부위에서 상동성 서열을 대체하는 이의 임의의 부분이다.

일부 측면에서, 관심 핵산 서열은 유전자 편집을 위한 표적 부위와 비-상동성이다.

일부 측면에서, 관심 핵산 서열은 누락된 기능을 복원하거나, 비정상적인 기능을 수정하거나, 유전자 편집을 위한 표적 부위와 연관된 추가 기능을 제공한다.

일부 측면에서, 관심 핵산 서열은 유전자 편집을 위한 표적 부위와 연관된 유전자 발현의 녹아웃을 위한 것이다 (즉, 유전자 침묵).

일부 측면에서, 관심 핵산 서열은 생체내 유전자 편집을 위한 것이다.

일부 측면에서, 관심 핵산 서열은 시험관내 유전자 편집을 위한 것이다.

일부 측면에서, 관심 핵산 서열은 생체외 유전자 편집을 위한 것이다 (예를 들어, 세포 요법, 예컨대 키메라 항원 수용체 (CAR) T 세포 요법).

일부 측면에서, 유전자 편집은 후성유전학적 변형을 포함하고, 본원에 기재된 바와 같은 발현 벡터는 관심 핵산으로서 후성유전학적 이펙터 분자를 포함한다. 일부 측면에서, 후성유전학적 이펙터 분자는 예를 들어 아세틸화 또는 탈아세틸화, 메틸화 또는 탈메틸화, 또는 인산화 또는 탈인산화를 매개한다. 일부 측면에서, 후성유전학적 이펙터 분자는 아세틸화 또는 탈아세틸화, 메틸화 또는 탈메틸화, 또는 인산화 또는 탈인산화를 억제한다. 일부 측면에서, 후성유전학적 변형은 히스톤 변형이다. 일부 측면에서, 히스톤 변형은 히스톤 아세틸화이고, 관심 핵산은 히스톤 아세틸트랜스퍼라제이다. 일부 측면에서, 히스톤 변형은 히스톤 탈아세틸화이고, 관심 핵산은 히스톤 데아세틸라제이다. 일부 측면에서, 후성유전학적 변형은 DNA 변형이다. 일부 측면에서, DNA 변형은 DNA 메틸화이고, 관심 핵산은 DNA 메틸라제이다. 일부 측면에서, DNA 변형은 DNA 탈메틸화이고, 관심 핵산은 DNA 탈메틸라제이다. 일부 측면에서, 후성유전학적 이펙터 분자는 염색체 상의 한 위치에 이펙터를 표적화하기 위해 표적화 분자, 예컨대 DNA-결합 분자에 융합된다.

일부 측면에서, 발현 카세트는 다유전자성이며, 즉, 발현 카세트는 각각 2개 이상의 폴리펩티드를 코딩하는 2개 이상의 관심 핵산 서열을 포함한다.

일부 측면에서, 발현 카세트는 폴리펩티드를 코딩하는 각 핵산 서열 사이에 자기-절단 펩티드를 코딩하는 핵산 서열을 포함하는 단일 오픈 리딩 프레임을 포함하여, 발현 카세트의 번역 생성물이 세포내에서 2개 이상의 폴리펩티드로 절단되도록 한다. 일부 측면에서, 자기-절단 펩티드는 2A 자기-절단 펩티드이다. 일부 측면에서, 2A 자기-절단 펩티드는 돼지 테스코바이러스-1로부터의 P2A이다. 일부 측면에서, 2A 자기-절단 펩티드는 토세아 아시그나(thosea asigna) 바이러스 2A로부터의 T2A이다. 일부 측면에서, 자기-절단 펩티드는 2A, P2A 및 T2A 중 임의의 하나 이상을 포함한다. 일부 측면에서, 자기-절단 펩티드는 P2A 및 T2A를 포함한다.

일부 측면에서, 발현 카세트는 유전자 발현에 대한 마커를 코딩하는 핵산 서열을 추가로 포함한다. 일부 측면에서, 유전자 발현에 대한 마커는 형광 리포터 유전자, 예컨대 녹색 형광 단백질 (GFP, 예를 들어 향상된 GFP (eGFP)), 적색 형광 단백질 (RFP), 황색 형광 단백질 (YFP), 또는 근적외선 형광 단백질 (iRFP); 생물발광 리포터 유전자, 예컨대 루시퍼라제 (예를 들어, 나노루시퍼라제, 즉, NanoLuc® (NLuc), England et al., Bioconjug. Chem. 27(5):1175-1187 (2016), 프로메가 코포레이션); 선택가능한 항생제 마커; 또는 LacZ이다. 일부 측면에서, 발현 카세트는 유전자 발현에 대한 마커를 코딩하는 핵산 서열과 폴리펩티드를 코딩하는 임의의 다른 핵산 서열 사이에 자기-절단 펩티드를 코딩하는 핵산 서열을 포함한다.

발현 카세트는 관심 핵산 서열(들)에 작동가능하게 연결된 관련 기술분야의 통상의 기술자에게 공지된 임의의 발현 제어 영역을 함유할 수 있다. 일부 측면에서, 발현 제어 영역은 프로모터, 인핸서, 오퍼레이터, 리프레서, 리보솜 결합 부위, 번역 리더 서열, 인트론, 폴리아데닐화 인식 서열, RNA 프로세싱 부위, 이펙터 결합 부위, 스템-루프 구조, 전사 종결 신호, 또는 이들의 조합이다.

B. 벡터 생산 시스템

유도성 프로모터의 제어 하에 레콤비나제를 코딩하는 재조합 세포를 포함하는 벡터 생산 시스템이 본원에 제공되며, 여기서 재조합 세포는 제1 레콤비나제에 대한 제1 및 제2 표적 서열 및 하나 이상의 추가 레콤비나제에 대한 하나 이상의 추가 표적 서열을 함유하는 본원에 기재된 바와 같은 발현 벡터를 포함하고, 여기서 레콤비나제는 제1 레콤비나제에 대한 제1 및 제2 표적 서열 또는 하나 이상의 추가 레콤비나제에 대한 하나 이상의 추가 표적 서열 중 하나를 표적화한다.

벡터 생산 시스템에 사용하기에 적합한 숙주 세포는 미생물 세포, 예를 들어 박테리아 세포, 예컨대 이. 콜라이 세포, 및 효모 세포, 예컨대 에스. 세레비시아에(S. cerevisiae)를 포함한다. 차이니즈 햄스터 난소 (CHO) 세포 (예를 들어, K1 계통 (ATCC CCL 61) 또는 Pro5 변이체 (ATCC CRL 1281)); CV-1 계통 (ATCC CCL 70), COS-1 계통 (ATCC CRL 1650) 또는 COS-7 계통 (ATCC CRL 1651; 뮤린 L-세포; 뮤린 3T3 세포 (ATCC CRL 1658)의 SV40-형질전환된 아프리카 녹색 원숭이 신장으로부터 유래된 섬유모세포-유사 세포; 뮤린 C127 세포; 293 계통의 인간 배아 신장 세포 (ATCC CRL 1573); HeLa 계통의 것을 포함하는 인간 암종 세포 (ATCC CCL 2); 및 계통 IMR-32 (ATCC CCL 127), SK-N-MC (ATCC HTB 10) 또는 SK-N-SH (ATCC HTB 11)의 신경모세포종 세포를 포함하는 포유동물 숙주 세포가 또한 사용될 수 있다.

적합한 레콤비나제는 TelN, Tel, Tel (gp26 K02 파지), Cre, Flp, phiC31, Int, 및 다른 람도이드 파지 인테그라제, 예를 들어 phi 80, HK022 및 HP1 레콤비나제를 포함하나 이에 제한되지는 않는 본원에 기재된 바와 같은 레콤비나제에 대한 표적 서열에서 DNA 교환을 촉매작용한다. 일부 측면에서, 레콤비나제는 TelN, Tel, Cre 또는 Flp이다.

일부 측면에서, 재조합 세포는 유도성 프로모터의 제어 하에 엔도뉴클레아제를 추가로 코딩하고, 여기서 엔도뉴클레아제는 발현 벡터에서 엔도뉴클레아제 표적 서열을 표적화한다.

적합한 엔도뉴클레아제는 엔도뉴클레아제 표적 서열에서 폴리뉴클레오티드를 절단한다. 일부 측면에서, 엔도뉴클레아제는 귀소 엔도뉴클레아제이다. 일부 측면에서, 귀소 엔도뉴클레아제는 I-AniI, I-CeuI, I-ChuI, I-CpaI, I-CpaII, I-CreI, I-DmoI, H-DreI, I-HmuI, I-HmuII, I-LlaI, I-MsoI, PI-PfuI, PI-PkoII, I-PorI, I-PpoI, PI-PspI, I-ScaI, I-SceI, PI-SceI, I-SceII, I-SecIII, I-SceIV, I-SceV, I-SceVI, I-SceVII, I-Ssp6803I, I-TevI, I-TevII, I-TevIII, PI-TliI, PI-TliII, I-Tsp061I 또는 I-Vdi141I이다. 일부 측면에서, 엔도뉴클레아제는 I-SceI이다. 일부 측면에서, 엔도뉴클레아제는 PI-SceI이다. 일부 측면에서, 재조합 세포는 엔도뉴클레아제를 포함하는 뉴클레아제 게놈 편집 시스템을 코딩한다. 일부 측면에서, 게놈 편집 시스템은 CRISPR-Cas, TALEN, ZFN 또는 메가뉴클레아제 시스템이다. 일부 측면에서, 뉴클레아제 게놈 편집 시스템은 부류 1 또는 부류 2 CRISPR-Cas 시스템이다. 일부 측면에서, 뉴클레아제 게놈 편집 시스템은 유형 I, II, III, IV, V, 또는 VI CRISPR-Cas 시스템이다. 일부 측면에서, CRISPR-Cas 시스템 중 Cas 엔도뉴클레아제는 Cas9 (예를 들어, SpCas9, SaCas9, FnCas9 또는 NmCas9), Cas9 변이체 (예를 들어, Casβ9, xCas9, SpCas9-NG, SpCas9-NRRH, SpCas9-NRCH, SpCas9-NRTH, SpG, SpRY), Cas3, Cas12 (예를 들어, Cas12a, Cas12b, Cas12c, Cas12d 또는 Cas12e), Cas13 (예를 들어, Cas13a, Cas13b, Cas13c 또는 Cas13d), 또는 Cas14이다.

레콤비나제, 또는 레콤비나제 및 엔도뉴클레아제를 코딩하는 재조합 숙주 세포는 널리 공지된 기술을 사용하여 제조된다. 예를 들어, 선택된 레콤비나제 또는 엔도뉴클레아제를 코딩하는 핵산 서열은 세포 형질전환을 위한 적절한 조건 하에 적합한 벡터를 사용하여 세포에 도입된다. 재조합 숙주 세포는 발현 벡터를 통해, 또는 레콤비나제-코딩 및/또는 엔도뉴클레아제-코딩 핵산 서열의 숙주 세포 게놈으로의 통합에 의해 형질전환될 수 있다. 엔도뉴클레아제가 뉴클레아제 게놈 편집 시스템과 연관된 측면에서, 숙주 세포는 모든 구성성분을 포함하는 하나 이상의 발현 벡터를 사용한 숙주 세포의 형질전환, 모든 구성성분의 숙주 세포 게놈으로의 통합, 또는 구성성분의 형질전환 및 통합의 혼합물에 의해 뉴클레아제 게놈 편집 시스템의 모든 구성성분을 코딩하도록 설계될 수 있다. 일부 측면에서, 숙주 세포는 Cas 또는 Cas-유사 엔도뉴클레아제 및 gRNA를 코딩한다.

뉴클레아제 게놈 편집 시스템의 엔도뉴클레아제를 포함하는 레콤비나제 또는 엔도뉴클레아제의 발현은 유도성 프로모터, 즉 특정 물리적 또는 화학적 조건 또는 자극 하에 활성화되는 프로모터의 제어 하에 이루어진다. 일부 측면에서, 유도성 프로모터는 열-조절성, 화학적-조절성, IPTG 조절성, 글루코스-조절성, 아라비노스 유도성, T7 폴리머라제 조절성, 저온-충격 유도성, pH 유도성, 또는 이들의 조합이다.

제1 레콤비나제에 대한 제1 및 제2 표적 서열 및 하나 이상의 추가 레콤비나제에 대한 하나 이상의 추가 표적 서열을 함유하는 본원에 기재된 바와 같은 발현 벡터를 포함하는 재조합 세포가 본원에 제공된다. 일부 측면에서, 재조합 세포는 제1 레콤비나제 및/또는 본원에 기재된 바와 같은 하나 이상의 레콤비나제 중 하나 이상을 코딩한다. 일부 측면에서, 재조합 세포는 본원에 기재된 바와 같은 하나 이상의 엔도뉴클레아제를 코딩한다. 일부 측면에서, 재조합 세포는 본원에 기재된 바와 같은 뉴클레아제 게놈 편집 시스템을 코딩한다.

레콤비나제의 발현에 적합한 조건 하에 본원에 기재된 바와 같은 벡터 생산 시스템을 인큐베이션하는 것을 포함하는, 박테리아 서열-무함유 벡터를 생산하는 방법이 본원에 제공된다. 일부 측면에서, 방법은 재조합 세포에 의해 코딩된 엔도뉴클레아제의 발현에 적합한 조건 하에 벡터 생산 시스템을 인큐베이션하는 것을 추가로 포함한다. 일부 측면에서, 방법은 재조합 세포에 의해 코딩된 뉴클레아제 게놈 편집 시스템의 발현에 적합한 조건 하에 벡터 생산 시스템을 인큐베이션하는 것을 추가로 포함한다. 일부 측면에서, 방법은 박테리아 서열-무함유 벡터를 수확하는 것을 추가로 포함한다.

본원에 기재된 바와 같은 박테리아 서열-무함유 벡터를 생산하는 방법에 의해 생산된 박테리아 서열-무함유 벡터가 본원에 제공된다.

III. 박테리아 서열-무함유 벡터

하기를 포함하는 박테리아 서열-무함유 벡터가 본원에 제공된다: (a) 관심 핵산 서열을 포함하는 발현 카세트, 및 (b) 하기 중 하나 이상: (i) 발현 카세트 내 또 다른 인핸서 또는 프로모터에 대해 5'에 위치된 서열식별번호: 12와 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서, (ii) 발현 카세트 내 프로모터에 대해 5'에 위치된 CMV 인핸서, (iii) 인트론을 포함하는 5'UTR, 여기서 5'UTR은 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합됨, (iv) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 척추동물 염색질 인슐레이터, (v) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 WPRE, (vi) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 S/MAR, 또는 (vii) 발현 카세트에 대해 5'에 위치된 DTS.

일부 측면에서, 박테리아 서열-무함유 벡터는 발현 카세트 내 또 다른 인핸서 또는 프로모터에 대해 5'에 위치된 서열식별번호: 12와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함하는 합성 인핸서를 포함한다. 일부 측면에서, 박테리아 서열-무함유 벡터는 발현 카세트 내 또 다른 인핸서 또는 프로모터에 대해 5'에 위치된 서열식별번호: 12의 핵산 서열을 포함하는 합성 인핸서를 포함한다. 일부 측면에서, 합성 인핸서는 핵산 서열의 다중 인접 카피, 예컨대, 예를 들어 1, 2, 3, 4, 5개 이상의 인접 카피를 포함한다. 일부 측면에서, 합성 인핸서는 핵산 서열의 3개 인접 카피를 포함한다. 일부 측면에서, 합성 인핸서는 서열식별번호: 46과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 합성 인핸서는 서열식별번호: 46의 핵산 서열을 포함한다. 일부 측면에서, 합성 인핸서는 닭 β-액틴 프로모터의 5' 말단에 통합된다. 일부 측면에서, 서열식별번호: 47과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함하는 키메라 인트론은 닭 β-액틴 프로모터의 3' 말단 및 관심 핵산 서열의 5'에 통합된다. 일부 측면에서, 서열식별번호: 47의 핵산 서열을 포함하는 키메라 인트론은 닭 β-액틴 프로모터의 3' 말단 및 관심 핵산 서열의 5'에 통합된다.

일부 측면에서, 박테리아 서열-무함유 벡터는 발현 카세트 내 프로모터에 대해 5'에 위치된 CMV 인핸서를 포함한다. 일부 측면에서, CMV 인핸서는 서열식별번호: 12와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함하는 합성 인핸서의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 서열식별번호: 12의 핵산 서열을 포함하는 합성 인핸서의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 합성 인핸서의 다중 인접 카피의 3' 말단에, 예컨대, 예를 들어 합성 인핸서의 1, 2, 3, 4, 5개 이상의 인접 카피의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 합성 인핸서의 3개 인접 카피의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 서열식별번호: 46과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 서열식별번호: 46의 핵산 서열의 3' 말단에 통합된다. 일부 측면에서, CMV 프로모터는 CMV 인핸서의 3' 말단 및 관심 핵산 서열의 5'에 통합된다.

일부 측면에서, 박테리아 서열-무함유 벡터는 관심 핵산 서열에 대해 5'에 위치된 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38 또는 서열식별번호: 39와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 박테리아 서열-무함유 벡터는 관심 핵산 서열에 대해 5'에 위치된 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38 또는 서열식별번호: 39의 핵산 서열을 포함한다. 일부 측면에서, 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38 또는 서열식별번호: 39와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열, 또는 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38 또는 서열식별번호: 39의 핵산 서열은 관심 핵산 서열에 대해 5'에 위치된 발현 카세트 내 모든 조절 요소를 포함한다.

일부 측면에서, 박테리아 서열-무함유 벡터는 인트론을 포함하는 5'UTR을 포함하고, 여기서 5'UTR (즉, 인트론을 포함하는 5'UTR)은 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합된다.

일부 측면에서, 5'UTR은 5'UTR이 결여된 동일한 박테리아 서열-무함유 벡터와 비교하여 박테리아 서열-무함유 벡터로부터의 트랜스진 전사체 스플라이싱 및 번역을 개선하기 위한 것이다.

일부 측면에서, 5'UTR은 서열식별번호: 2와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 5'UTR은 서열식별번호: 2의 핵산 서열을 포함한다.

일부 측면에서, 비-코딩 서열은 비-원핵생물성 및 비-바이러스성이다. 일부 측면에서, 비-코딩 서열은 진핵생물이다. 일부 측면에서, 비-코딩 서열은 인트론, UCOE, S/MAR, SV40 인핸서 서열 (예를 들어, 하나 또는 하나 초과의 SV40 인핸서 서열, 예컨대 2, 3, 4, 5개 이상의 SV40 인핸서 서열), 척추동물 염색질 인슐레이터 (예를 들어, cHS4), WPRE, 또는 이들의 임의의 조합을 포함한다.

일부 측면에서, 박테리아 서열-무함유 벡터는 관심 핵산 서열의 3' 말단에 통합된 폴리아데닐화 신호를 포함한다. 일부 측면에서, 폴리아데닐화 신호는 제노푸스 라에비스 베타-글로빈 폴리아데닐화 신호, 인간 베타-글로빈 폴리아데닐화 신호, 또는 하이브리드 제노푸스 라에비스 및 인간 베타-글로빈 폴리아데닐화 신호를 포함한다. 일부 측면에서, 폴리아데닐화 신호는 제노푸스 라에비스 베타-글로빈 폴리아데닐화 신호, 인간 베타-글로빈 폴리아데닐화 신호, 또는 하이브리드 제노푸스 라에비스 및 인간 베타-글로빈 폴리아데닐화 신호의 다중 카피, 예컨대, 예를 들어 1, 2, 3, 4 또는 5개 카피를 포함한다. 일부 측면에서, 폴리아데닐화 신호는 서열식별번호: 13, 서열식별번호: 14 또는 서열식별번호: 15와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 폴리아데닐화 신호는 서열식별번호: 13, 서열식별번호: 14 또는 서열식별번호: 15의 핵산 서열을 포함한다. 일부 측면에서, 폴리아데닐산 꼬리 (즉, 폴리(A) 꼬리는 폴리아데닐화 신호의 3' 말단에 위치된다. 일부 측면에서, 폴리(A) 꼬리는 길이가 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120개 이상의 잔기이다. 일부 측면에서, 폴리아데닐화 신호 및 폴리(A) 꼬리를 포함하는 서열은 서열식별번호: 16, 서열식별번호: 17 또는 서열식별번호: 18과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일하다. 일부 측면에서, 폴리아데닐화 신호 및 폴리(A) 꼬리를 포함하는 서열은 서열식별번호: 16, 서열식별번호: 17 또는 서열식별번호: 18을 포함한다.

일부 측면에서, 박테리아 서열-무함유 벡터는 발현 카세트 내 척추동물 염색질 인슐레이터를 포함한다. 일부 측면에서, 척추동물 염색질 인슐레이터는 cHS4이다. 일부 측면에서, 척추동물 염색질 인슐레이터는 본원에 기재된 바와 같은 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된다. 일부 측면에서, 척추동물 염색질 인슐레이터는 본원에 기재된 바와 같은 5'UTR의 인트론 내에 통합된다.

일부 측면에서, 척추동물 염색질 인슐레이터는 척추동물 염색질 인슐레이터 없이 동일한 박테리아 서열-무함유 벡터와 비교하여 박테리아 서열-무함유 벡터의 확립 (즉, 형질감염 효율)을 개선하기 위한 것이다.

일부 측면에서, 박테리아 서열-무함유 벡터는 발현 카세트 내 WPRE를 포함한다. 일부 측면에서, WPRE는 본원에 기재된 바와 같은 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된다. 일부 측면에서, WPRE는 본원에 기재된 바와 같은 S/MAR의 3' 말단 및 본원에 기재된 바와 같은 폴리아데닐화 신호의 5' 말단에서 발현 카세트에 통합된다. 일부 측면에서, WPRE는 본원에 기재된 바와 같은 5'UTR의 인트론 내에 통합된다.

일부 측면에서, WPRE는 WPRE가 결여된 동일한 박테리아 서열-무함유 벡터와 비교하여 박테리아 서열-무함유 벡터로부터의 트랜스진의 발현을 개선한다.

일부 측면에서, 박테리아 서열-무함유 벡터는 발현 카세트 내 S/MAR을 포함한다. 일부 측면에서, S/MAR은 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된다. 일부 측면에서, S/MAR은 본원에 기재된 바와 같은 관심 핵산 서열의 3' 말단 및 WPRE의 5' 말단에서 발현 카세트에 통합된다. 일부 측면에서, S/MAR은 본원에 기재된 바와 같은 5'UTR의 인트론 내에 통합된다.

일부 측면에서, S/MAR은 MAR-3, MAR-4 또는 MAR-5이다. 일부 측면에서, S/MAR은 서열식별번호: 9와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, S/MAR은 서열식별번호: 9를 포함한다.

일부 측면에서, S/MAR은 인간 CSP-B MAR 또는 CSP-C MAR이다. 일부 측면에서, S/MAR은 서열식별번호: 10과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, S/MAR은 서열식별번호: 10을 포함한다.

일부 측면에서, S/MAR은 S/MAR이 결여된 동일한 박테리아 서열-무함유 벡터와 비교하여 박테리아 서열-무함유 벡터의 발현 수준, 안정성 및/또는 내구성을 개선하기 위한 것이다 (예를 들어, 에피솜 유지 및 복제, 예컨대 딸 세포로의 벡터의 확장 및 분할에 의해, 및/또는 후성유전학적 침묵 방지에 의해).

일부 측면에서, 상기 기재된 바와 같은 (b)(i)-(b)(v) 중 임의의 하나 이상을 포함하는 박테리아 서열-무함유 벡터 (즉, DTS 없이)는 발현 카세트의 각 측면을 플랭킹하는 인핸서 서열을 추가로 포함한다. 일부 측면에서, 발현 카세트의 각 측면을 플랭킹하는 인핸서 서열은 발현 카세트의 각 측면을 플랭킹하는 적어도 2개의 인핸서 서열이다. 일부 측면에서, 인핸서 서열은 SV40 인핸서 서열이다.

일부 측면에서, 박테리아 서열-무함유 벡터는 DTS를 포함한다. 일부 측면에서, DTS는 발현 카세트에 대해 5'에 위치된다. 일부 측면에서, DTS는 SV40 인핸서 서열이다. 일부 측면에서, DTS는 세포-특이적이다. 일부 측면에서, DTS는 평활근 세포, 배아 줄기 세포, 유형 II 폐포세포, 내피 세포 또는 골모세포에 특이적이다.

일부 측면에서, 본원에 기재된 바와 같은 박테리아 서열-무함유 벡터는 발현 카세트 내 UCOE를 추가로 포함한다. 일부 측면에서, UCOE는 발현 카세트 내 프로모터 또는 임의의 인핸서에 대해 5'에 위치된다. 일부 측면에서, UCOE는 본원에 기재된 바와 같은 5'UTR의 인트론 내에 통합된다.

일부 측면에서, UCOE는 SRF-UCOE이다. 일부 측면에서, UCOE는 서열식별번호: 7과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, UCOE는 서열식별번호: 7이다.

일부 측면에서, UCOE는 UCOE가 결여된 동일한 박테리아 서열-무함유 벡터와 비교하여 박테리아 서열-무함유 벡터로부터의 트랜스진의 발현을 개선한다.

일부 측면에서, 박테리아 서열-무함유 벡터는 발현 카세트 내 인핸서-1을 포함한다. 일부 측면에서, 인핸서-1은 발현 카세트 내 프로모터 또는 임의의 다른 인핸서에 대해 5'에 통합된다. 일부 측면에서, 인핸서-1은 UCOE의 3' 말단과 CMV 인핸서의 5' 말단 사이에 통합된다. 일부 측면에서, 인핸서-1은 서열식별번호: 12와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 인핸서-1은 서열식별번호: 12이다.

일부 측면에서, 박테리아 서열-무함유 벡터는 발현 카세트 내 CMV, EF1, SV40, CAG, Rho, VDM2, HCR 또는 HLP 프로모터, 또는 이의 변이체를 포함한다. 일부 측면에서, 박테리아 서열-무함유 벡터는 발현 카세트 내 CMV 프로모터 변이체를 포함한다.

일부 측면에서, 박테리아 서열-무함유 벡터는 발현 카세트 내 EF1-알파 프로모터를 포함한다. 일부 측면에서, 박테리아 서열-무함유 벡터는 발현 카세트 내 CMV 인핸서 및 EF1-알파 프로모터를 포함한다.

일부 측면에서, 박테리아 서열-무함유 벡터는 베타-글로빈 폴리아데닐화 신호의 2개 카피를 포함하는 발현 카세트 내 3'UTR을 포함한다. 일부 측면에서, 3'UTR은 관심 핵산 서열에 대해 3'에 통합된다.

일부 측면에서, 3'UTR은 100 내지 120개의 아데닌 뉴클레오티드, 즉, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119 또는 120개의 아데닌 뉴클레오티드를 포함하는 폴리(A) 꼬리를 추가로 포함한다.

본원에 기재된 바와 같은 박테리아 서열-무함유 벡터의 관심 핵산 서열은 박테리아 서열-무함유 벡터를 생산하기 위한 발현 벡터와 관련하여 본원에 기재된 임의의 핵산 서열을 포함한다.

일부 측면에서, 본원에 기재된 바와 같은 박테리아 서열-무함유 벡터는 관심 핵산 서열에 대해 5' 및 3'에 위치된 Cas 엔도뉴클레아제 표적 서열 (즉, gRNA 표적화 서열과 상동성인 서열)을 포함하며, 여기서 유전자 편집을 위한 표적 부위 (예를 들어, 염색체 내 표적 부위)는 동일한 Cas 엔도뉴클레아제 표적 서열을 포함한다.

일부 측면에서, 본원에 기재된 바와 같은 박테리아 서열-무함유 벡터는 CRISPR-Cas 시스템을 포함한다. 일부 측면에서, 박테리아 서열-무함유 벡터는 Cas 엔도뉴클레아제 (예를 들어, 면역침묵된 Cas9-β2)를 코딩하는 서열의 각 측면을 플랭킹하는 tRNA-gRNA 폴리시스트론을 포함한다. 일부 측면에서, 박테리아 서열-무함유 벡터는 인트론 내 tRNA-gRNA 폴리시스트론을 포함하는 본원에 기재된 바와 같은 5'UTR (예를 들어, 5'UTR1)을 포함한다. 일부 측면에서, 박테리아 서열-무함유 벡터는 tRNA-gRNA 폴리시스트론을 포함하는 본원에 기재된 바와 같은 키메라 인트론을 포함한다. 일부 측면에서, 본원에 기재된 바와 같은 EF1-알파 프로모터는 고유 인트론에 tRNA-gRNA 폴리시스트론을 포함한다. 일부 측면에서, 본원에 기재된 바와 같은 폴리아데닐화 신호 또는 3'UTR은 tRNA-gRNA 폴리시스트론을 포함한다. 일부 측면에서, 본원에 기재된 바와 같은 관심 핵산 서열 및 자기-제한 CRISPR-Cas 시스템은 본원에 기재된 바와 같은 단일 박테리아 서열-무함유 벡터에 위치된다. 후자의 측면에서, 자기-제한 CRISPR-Cas 시스템을 포함하는 서열은 상동성 아암에 의해 플랭킹된 관심 핵산 서열을 포함하는 서열에 대해 5'에 위치된다.

본원에 기재된 바와 같은 박테리아 서열-무함유 벡터는 상기 변형의 임의의 조합을 함유할 수 있다. 일부 측면에서, 조합은 상승작용적 효과를 제공한다.

본원에 개시된 바와 같은 박테리아 서열-무함유 벡터를 포함하는 재조합 세포가 본원에 제공된다.

IV. 다른 발현 벡터

상기 기재된 개선 및 변형은 또한 다른 발현 벡터, 예컨대 박테리아 서열-무함유 벡터의 생산보다는 직접적인 유전자 발현을 위해 활용되는 발현 벡터 (그러나 이에 제한되지는 않음)에 적용될 수 있다. 일부 측면에서, 본원에 기재된 핵산 서열은 DNA 서열로서 제공되고, 발현 벡터는 DNA 발현 벡터이다. 일부 측면에서, 본원에 기재된 핵산 서열은 RNA 서열로서 제공되고, 발현 벡터는 RNA 발현 벡터이다. RNA 서열은 본원에 임의의 서열식별번호로서 제공된 DNA 서열에 상응할 수 있거나, 본원에 임의의 서열식별번호로서 제공된 DNA 서열에 상보적인 DNA 서열에 상응할 수 있다.

본원에 기재된 바와 같은 핵산 서열의 임의의 조합을 포함하는 폴리뉴클레오티드가 본원에 제공된다.

인트론, 인트론을 포함하는 5'UTR, 및/또는 본원에 기재된 바와 같은 3'UTR의 핵산 서열을 포함하는 폴리뉴클레오티드가 본원에 제공된다.

서열식별번호: 1, 2, 3, 5, 13, 14, 15, 16, 17 또는 18 중 어느 하나와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드가 본원에 제공된다. 일부 측면에서, 폴리뉴클레오티드는 핵산 서열의 3' 말단에 100 내지 120개의 아데닌 뉴클레오티드를 포함한다. 일부 측면에서, 폴리뉴클레오티드는 서열식별번호: 13, 14 또는 15 중 어느 하나와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열, 및 핵산 서열의 3' 말단에 100 내지 120개의 아데닌 뉴클레오티드를 포함한다. 일부 측면에서, 폴리뉴클레오티드는 서열식별번호: 1, 2, 3, 5, 13, 14, 15, 16, 17 또는 18 중 어느 하나의 핵산 서열을 포함한다.

본원에 기재된 폴리뉴클레오티드 중 하나 이상을 포함하는 발현 벡터가 본원에 제공된다. 일부 측면에서, 발현 벡터는 서열식별번호: 1, 2, 3, 5, 13, 14, 15, 16, 17 또는 18 중 어느 하나와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드를 포함한다. 일부 측면에서, 폴리뉴클레오티드는 핵산 서열의 3' 말단에 100 내지 120개의 아데닌 뉴클레오티드를 포함한다. 일부 측면에서, 폴리뉴클레오티드는 서열식별번호: 13, 14 또는 15 중 어느 하나와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열, 및 핵산 서열의 3' 말단에 100 내지 120개의 아데닌 뉴클레오티드를 포함한다. 일부 측면에서, 발현 벡터는 서열식별번호: 1, 2, 3, 5, 13, 14, 15, 16, 17 또는 18 중 어느 하나의 핵산 서열을 포함하는 폴리뉴클레오티드를 포함한다. 일부 측면에서, 발현 벡터는 서열식별번호: 2, 3 또는 5 중 어느 하나의 핵산 서열을 포함하는 폴리뉴클레오티드, 및 (a) 서열식별번호: 13, 14, 15, 16, 17 또는 18 중 어느 하나의 핵산 서열을 포함하는 폴리뉴클레오티드, 또는 (b) 서열식별번호: 13, 14 또는 15 중 어느 하나의 핵산 서열을 포함하는 폴리뉴클레오티드 및 핵산 서열의 3' 말단에 100 내지 120개의 아데닌 뉴클레오티드를 포함한다.

하기를 포함하는 발현 벡터가 본원에 제공된다: 인트론을 포함하는 5'UTR, 여기서 5'UTR은 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합됨, 및/또는 관심 핵산 서열에 대해 3'에 있는 발현 카세트에 통합된 베타-글로빈 폴리아데닐화 신호의 2개 카피를 포함하는 3'UTR.

일부 측면에서, 비-코딩 서열은 비-원핵생물성 및 비-바이러스성이다. 일부 측면에서, 비-코딩 서열은 진핵생물 서열이다. 일부 측면에서, 비-코딩 서열은 인트론, UCOE, S/MAR, SV40 인핸서 서열 (예를 들어, 하나 또는 하나 초과의 SV40 인핸서 서열, 예컨대 2, 3, 4, 5개 이상의 SV40 인핸서 서열), 척추동물 염색질 인슐레이터 (예를 들어, cHS4), WPRE, 또는 이들의 임의의 조합을 포함한다.

일부 측면에서, 비-코딩 서열은 S/MAR이다. 일부 측면에서, S/MAR은 서열식별번호: 9로서 본원에 제공된 MAR-5이다.

서열식별번호: 12와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함하는 합성 인핸서를 포함하는 발현 벡터가 본원에 제공된다. 일부 측면에서, 발현 벡터는 서열식별번호: 12의 핵산 서열을 포함하는 합성 인핸서를 포함한다. 일부 측면에서, 합성 인핸서는 핵산 서열의 다중 인접 카피, 예컨대, 예를 들어 1, 2, 3, 4, 5개 이상의 인접 카피를 포함한다. 일부 측면에서, 합성 인핸서는 핵산 서열의 3개 인접 카피를 포함한다. 일부 측면에서, 합성 인핸서는 서열식별번호: 46과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 합성 인핸서는 서열식별번호: 46의 핵산 서열을 포함한다.

서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38 또는 서열식별번호: 39와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함하는 발현 벡터가 본원에 제공된다. 일부 측면에서, 발현 벡터는 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38 또는 서열식별번호: 39의 핵산 서열을 포함한다. 일부 측면에서, 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38 또는 서열식별번호: 39와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열, 또는 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38 또는 서열식별번호: 39의 핵산 서열은 발현 벡터 내 관심 핵산 서열에 대해 5'에 위치된 발현 카세트 내 모든 조절 요소를 포함한다.

V. 조성물

본원에 기재된 바와 같은 발현 벡터 또는 박테리아 서열-무함유 벡터를 포함하는 조성물이 본원에 제공된다.

다양한 방법이 관련 기술분야에 공지되어 있으며, 핵산의 세포로의 도입에 적합하다. 예는 전기천공, 인산칼슘 매개 전달, 뉴클레오펙션, 초음파천공, 열 충격, 자기감염, 리포솜 매개 전달, 미세주사, 미세투사체 매개 전달 (나노입자), 양이온성 중합체 매개 전달 (DEAE-덱스트란, 폴리에틸렌이민, 폴리에틸렌 글리콜 (PEG) 등), 또는 세포 융합을 포함하나 이에 제한되지는 않는다.

나노입자 담체, 예컨대 리포솜, 미셀 및 중합체성 나노입자는 다양한 메커니즘, 예를 들어 향상된 투과성 및 체류 (EPR) 효과를 통해 치료제의 생체이용률 및 약동학적 특성을 개선하기 위해 조사되었다.

표적 세포로의 선택적 전달을 달성하기 위해 표적화 리간드의 나노입자로의 접합에 의해 추가 개선이 달성될 수 있다. 예를 들어, 수용체-표적화된 나노입자 전달은 시험관내 및 생체내 모두에서 치료 반응을 개선하는 것으로 나타났다. 조사된 표적화 리간드는 폴레이트, 트랜스페린, 항체, 펩티드 및 압타머를 포함한다. 추가적으로, 다중 기능성은 예를 들어 이미지화를 가능하게 하고 세포내 약물 방출을 촉발하기 위해 나노입자의 설계에 혼입될 수 있다.

일부 측면에서, 조성물은 전달제를 추가로 포함한다. 일부 측면에서, 전달제는 나노입자이다. 일부 측면에서, 전달제는 리포솜, 비-지질 중합체성 분자, 엔도솜 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된다.

일부 측면에서, 전달제 (예를 들어, 나노입자)는 표적화 리간드를 포함한다.

일부 측면에서, 조성물은 생리학적으로 허용되는 담체, 부형제 또는 안정화제를 추가로 포함한다. 예를 들어 문헌 [Remington: The Science and Practice of Pharmacy, 22^nd ed. (2013)]을 참조한다. 허용가능한 담체, 부형제 또는 안정화제는 대상체에게 무독성인 것들을 포함할 수 있다. 일부 측면에서, 조성물 또는 조성물의 하나 이상의 구성성분은 멸균이다. 멸균 구성성분은 예를 들어 여과 (예를 들어, 멸균 여과막) 또는 방사선조사 (예를 들어, 감마 방사선조사)에 의해 제조될 수 있다.

일부 측면에서, 본원에 기재된 바와 같은 발현 벡터 또는 박테리아 서열-무함유 벡터를 포함하는 조성물은 제약상 허용되는 담체를 추가로 포함하는 제약 조성물이다.

본 발명의 부형제는 제약 조성물에 첨가될 때 "제약상 허용되는" 부형제로서 기재될 수 있으며, 이는 부형제가 건전한 의학적 판단의 범위 내에서 합리적 이익/위험 비율에 상응하는 원하는 접촉 지속시간에 걸쳐 과도한 독성, 자극, 알레르기 반응 또는 다른 문제가 되는 합병증 없이 인간 및 동물의 조직과의 접촉에 적합한 화합물, 물질, 조성물, 염 및/또는 투여 형태임을 의미한다. 일부 측면에서, 용어 "제약상 허용되는"은 연방 또는 주 정부의 규제 기관에 의해 승인되거나 미국 약전 또는 기타 일반적으로 인정되는 국제 약전에 동물, 더욱 특히 인간에 사용하기 위해 등재된 것을 의미한다. 다양한 부형제가 사용될 수 있다. 일부 측면에서, 부형제는 알칼리제, 안정화제, 항산화제, 접착제, 분리제, 코팅제, 외부 상 구성성분, 제어-방출 구성성분, 용매, 계면활성제, 습윤제, 완충제, 충전제, 연화제 또는 이들의 조합일 수 있지만 이에 제한되지는 않는다. 본원에 논의된 것 이외에 부형제는 문헌 [Remington: The Science and Practice of Pharmacy, 22^nd ed. (2013)]에 나열된 부형제 (그러나 이에 제한되지는 않음)를 포함할 수 있다. 본원의 특정 분류에 부형제 (예를 들어, "용매")의 포함은 부형제의 역할을 제한하기보다는 예시하기 위한 것이다. 특정 부형제는 여러 분류에 속할 수 있다.

본 개시내용의 제약 조성물은 그의 의도된 투여 경로에 호환가능하도록 제형화된다. 예시적인 투여 경로는 장내, 국소, 비경구, 경구, 폐, 비강내, 정맥내, 표피, 경피, 피하, 근육내 또는 복강내 투여 또는 흡입을 포함한다. 본원에서 사용된 바와 같은 "비경구 투여"는 일반적으로 주사 또는 주입에 의한 장내 및 국소 투여 이외의 투여 방식을 의미하며, 제한 없이 정맥내, 근육내, 동맥내, 척수강내, 림프내, 병변내, 피막내, 안와내, 심장내, 피내, 복강내, 경기관, 피하, 표피하, 관절내, 피막하, 거미막하, 척수내, 경막외, 흉막내 및 흉골내 주사 및 주입, 뿐만 아니라 생체내 전기천공을 포함한다. 일부 측면에서, 제형은 비-비경구 경로를 통해, 일부 측면에서 경구로 투여된다. 다른 비-비경구 경로는 국소, 표피 또는 점막 투여 경로, 예를 들어 비강내, 질, 직장, 설하 또는 국소 경로를 포함한다.

일부 측면에서, 제약 조성물은 동결건조된다.

VI. 치료 용도 및 방법

본원에 기재된 바와 같은 발현 벡터, 박테리아 서열-무함유 벡터 또는 제약 조성물을 대상체에게 투여하는 것을 포함하는, 질환 또는 장애의 치료를 필요로 하는 대상체에서 질환 또는 장애를 치료하는 방법이 본원에 제공된다.

발현 벡터, 박테리아 서열-무함유 벡터 또는 조성물은 질환 또는 장애를 치료하는데 효과적인 임의의 투여 경로에 의해 대상체에게 투여될 수 있다.

일부 측면에서, 투여는 장내, 국소, 비경구, 경구, 폐, 비강내, 정맥내, 표피, 경피, 피하, 근육내, 척수강내 또는 복강내 투여, 흡입, 또는 뇌실내 (ICV) 주사, 거대 대조 투여 (ICM) 또는 요추 척수강내 천자 (LIT)를 통한 뇌척수액 (CSF)-기반 전달에 의해 이루어진다.

일부 측면에서, 투여는 비경구 또는 비-비경구 투여에 의해 이루어진다.

일부 측면에서, 비경구 투여는 주사 또는 주입에 의해 이루어진다.

일부 측면에서, 비경구 투여는 정맥내, 근육내, 동맥내, 척수강내, 림프내, 병변내, 피막내, 안와내, 심장내, 피내, 복강내, 경기관, 피하, 표피하, 관절내, 피막하, 안와뒤, 뇌실내, 거미막하, 척수내, 경막외, 흉막내 또는 흉골내 주사 또는 주입, 또는 생체내 전기천공, 뉴클레오펙션, 미세기포 또는 초음파에 의해 이루어진다.

일부 측면에서, 비-비경구 투여는 경구, 국소, 표피, 점막, 비강내, 질, 직장 또는 설하 투여이다.

일부 측면에서, 투여는 경구, 폐, 비강내, 정맥내, 표피, 경피, 피하, 근육내 또는 복강내 투여, 또는 흡입에 의해 이루어진다.

일부 측면에서, 투여는 경구, 비강 또는 폐 투여에 의해 이루어진다. 일부 측면에서, 투여는 비강 투여에 의해 이루어진다.

투여는 예를 들어 1회, 복수회 및/또는 1회 이상의 연장된 기간에 걸쳐 수행될 수 있다. 일부 측면에서, 투여는 1회, 2회 (예를 들어, 제1 투여 후 약 1주, 약 2주, 약 3주, 약 4주 또는 그 이상 후에 제2 투여), 약 1주마다 1회, 약 1개월마다 1회, 약 2개월마다 1회, 약 3개월마다 1회, 약 4개월마다 1회, 약 6개월마다 1회, 약 1년마다 1회 또는 약 10년마다 1회이다.

본원에 기재된 바와 같은 발현 벡터, 박테리아 서열-무함유 벡터 또는 제약 조성물로부터의 관심 핵산 서열을 유전자 편집을 위한 표적 부위에 삽입하는 것을 포함하는 유전자 편집 방법이 본원에 제공된다.

일부 측면에서, 삽입은 비-상동성 말단 연결에 의해 이루어진다.

일부 측면에서, 삽입은 상동성 지정 복구에 의해 이루어진다. 일부 측면에서, 관심 핵산 서열은 본원에 기재된 바와 같은 5' 및 3' 상동성 아암에 의해 플랭킹된다.

일부 측면에서, 관심 핵산 서열은 유전자 편집을 위한 표적 부위와 상동성이고, 표적 부위와 비교하여 하나 이상의 뉴클레오티드 삽입, 결실, 역위 또는 재배열을 포함한다.

일부 측면에서, 관심 핵산 서열은 유전자 편집을 위한 표적 부위와 연관된 유전자 발현의 녹아웃을 위한 것이다.

일부 측면에서, 유전자 편집 방법은 질환 또는 장애의 치료를 필요로 하는 대상체에서 질환 또는 장애를 치료하는 방법이다.

일부 측면에서, 관심 핵산 서열은 생체외 유전자 편집을 위한 것이다 (예를 들어, 세포 요법, 예컨대 CAR T 세포 요법).

일부 측면에서, 방법은 시험관내 방법이다. 일부 측면에서, 시험관내 방법은 발현 벡터, 박테리아 서열-무함유 벡터 또는 제약 조성물을 세포에 투여하는 것을 추가로 포함한다 (예를 들어, 시험관내 또는 생체외 유전자 편집을 위해). 일부 측면에서, 시험관내 방법은 유전자 편집을 위한 엔도뉴클레아제, 또는 게놈 편집 시스템 또는 이의 구성성분 (예를 들어, CRISPR-Cas 시스템을 위한 Cas 엔도뉴클레아제 및 gRNA)을 세포에 투여하는 것을 추가로 포함한다. 일부 측면에서, 게놈 편집 시스템은 CRISPR-Cas, TALEN, ZFN 또는 메가뉴클레아제 유전자 편집 시스템이다.

일부 측면에서, 방법은 생체내 방법이다. 일부 측면에서, 생체내 방법은 발현 벡터, 박테리아 서열-무함유 벡터 또는 제약 조성물을 대상체에게 투여하는 것을 추가로 포함한다. 일부 측면에서, 생체내 방법은 유전자 편집을 위한 엔도뉴클레아제, 또는 게놈 편집 시스템 또는 이의 구성성분 (예를 들어, CRISPR-Cas 시스템을 위한 Cas 엔도뉴클레아제 및 gRNA)을 대상체에게 투여하는 것을 추가로 포함한다. 일부 측면에서, 게놈 편집 시스템은 CRISPR-Cas, TALEN, ZFN 또는 메가뉴클레아제 유전자 편집 시스템이다.

유전자 편집을 위한 엔도뉴클레아제, 또는 게놈 편집 시스템 또는 이의 구성성분은 전기천공 또는 투여에 적용가능한 벡터를 통한 방법을 포함하여 세포 또는 대상체에 핵산 서열 및/또는 폴리펩티드를 투여하기 위해 본원에 기재되거나 관련 기술분야에 공지된 바와 같은 임의의 방법에 의해 투여될 수 있다. 예를 들어, CRISPR-Cas 시스템을 포함하는 측면에서, Cas 및/또는 gRNA를 코딩하는 RNA가 투여될 수 있거나, Cas 및/또는 gRNA가 직접 투여될 수 있거나, Cas 및/또는 gRNA를 코딩하는 본원에 기재된 바와 같은 박테리아 서열-무함유 벡터 또는 발현 벡터가 투여될 수 있거나, 또는 Cas 및/또는 gRNA를 코딩하는 관련 기술분야에 공지된 임의의 다른 적합한 벡터가 투여될 수 있다.

일부 측면에서, 관심 핵산은 본원에 기재된 바와 같은 선형 공유 폐쇄형 박테리아 서열-무함유 벡터 (즉, msDNA)로 제공된다. 일부 측면에서, 유전자 편집에서 선형 공유 폐쇄형 박테리아 서열-무함유 벡터의 사용은 박테리아 서열-무함유 벡터의 말단이 폐쇄되고 이중 가닥 파단과 비-반응성이기 때문에 임의의 원치않는 비-상동성 말단 연결을 회피한다. 일부 측면에서, 유전자 편집에서 선형 공유 폐쇄형 박테리아 서열-무함유 벡터의 사용은 상동성-지정 복구를 향상시킨다. 일부 측면에서, 상동성-지정 복구를 위한 재조합 비율은 관심 핵산 서열이 원형 슈퍼코일링된 벡터에 의해 제공되는 경우보다 관심 핵산 서열이 본원에 기재된 바와 같은 선형 공유 폐쇄형 박테리아 서열-무함유 벡터에 의해 제공되는 경우 더 높다.

하기 실시예는 제한이 아닌 예시를 위해 제공된다.

실시예

실시예 1 - 키메라 인트론 또는 5'UTR을 함유하는 발현 벡터

A. 발현 벡터

부모 미니스트링 발현 벡터 (메디파지 바이오슈티칼스, 인크.(Mediphage Bioceuticals, Inc.), 캐나다 토론토, 미국 특허 번호 9,290,778 및 9,862,954)의 eGFP 코딩 서열인 pGL2-SS*-CAG-eGFP-BGpA-SS*를, 부모 벡터의 2개의 특수화된 슈퍼 서열 (SS*) 부위 사이의 향상된 녹색 형광 단백질 (eGFP) 및 세포외 발현을 위한 분비 서열로 변형된 NanoLuc® 루시퍼라제 리포터 (NLuc, 프로메가 코포레이션)를 코딩하는 발현 카세트로 대체함으로써 다유전자성 발현 벡터를 제조하였다.

부모 벡터 및 다유전자성 벡터의 발현 카세트는 CAG 프로모터를 함유하였으며, 이는 사이토메갈로바이러스 (CMV) 인핸서, 닭 β-액틴으로부터의 프로모터 및 키메라 인트론을 포함하는 합성 프로모터이다.

다유전자성 발현 벡터의 맵은 도 1에 표시되어 있으며 (pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS*), 이는 CAG 프로모터를 함유하는 다유전자성 발현 카세트를 플랭킹하는 레콤비나제 표적 서열 (telL, FRT (minimal)(FRT (최소)) 및 loxP)을 갖는 특수화된 슈퍼 서열 부위 (SS*), P2A 및 T2A 자기-절단 펩티드에 의해 연결된 향상된 녹색 형광 단백질 (eGFP) 및 분비된 나노-루시퍼라제 (SecNLuc)를 코딩하는 서열 (SecNLuc-2A-eGFP), 및 토끼 베타-글로빈 폴리아데닐화 신호 (BGpA)를 함유한다. 벡터에 대한 핵산 서열은 서열식별번호: 19로서 제공된다.

5'UTR과 함께 동일한 eGFP 및 Nluc 서열을 pcDNA3.1 벡터 (써모피셔 사이언티픽)에 클로닝함으로써 제2 다유전자성 발현 벡터를 제조하였다. 발현 벡터의 맵은 도 2에 표시되어 있으며 (벡터 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA), 이는 CMV 인핸서/프로모터를 함유하는 다유전자성 발현 카세트, P2A 자기-절단 펩티드에 의해 연결된 eGFP 및 SecNLuc를 코딩하는 서열 (SecNLuc-P2A-eGFP), 및 소 성장 호르몬 폴리아데닐화 신호 (bGHpA)를 함유한다. 벡터에 대한 핵산 서열은 서열식별번호: 20으로서 제공된다.

B. HEK293 세포의 형질감염

접착성 인간 배아 신장 293 (HEK293) 세포를 1x10⁵개 세포/웰로 24-웰 플레이트에 시딩하였다.

발현 벡터 (1 μg) 및 리포펙타민 (3 μL)의 복합체를 제조하고, (1) pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS*, (2) pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA, 및 (3) pGL2-SS*-CAG-eGFP-BGpA-SS* 각각에 대한 표준 작업 절차를 사용하여 인큐베이션하였다.

3개의 복합체를 사용하여 개별 웰에서 전기천공을 통해 HEK293 세포를 별도로 형질감염시킨 후, 48시간 동안 인큐베이션하였다. 다른 웰의 HEK293 세포를 음성 대조군으로서 플라스미드를 함유하지 않는 3 μL 리포펙타민으로 처리하였다.

형질감염 48시간 후 세포질성 GFP 발현 및 루시퍼라제 발현에 대해 세포를 평가하였다.

C. 세포질성 GFP 발현

다유전자성 발현 벡터에 의한 형질감염 효율 및 유전자 발현 수준의 척도로서 세포질성 GFP 발현을 사용하였다. 형광 현미경검사에 의해 발현을 평가하고, 실험적 발현 벡터 (pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS* 및 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA)의 평균 GFP 발현/강도를 음성 대조군 (플라스미드 없이 리포펙타민으로 처리된 세포) 및 양성 대조군 (pGL2-SS*-CAG-eGFP-BGpA-SS*) (본원에서 부모 플라스미드 CAG-GFP, 즉, PP-CAG-GFP로도 지칭됨)에 비해 측정하였다.

자동 노출 모드 하에 형광 세포의 라이브 이미지화는 실험적 발현 벡터가 유사한 발현을 갖는 pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS*의 키메라 인트론 및 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA의 5'UTR과 함께 GFP를 생산하였음을 나타내었다. 도 3 및 4를 참조한다. 실험적 발현 벡터에 의한 다유전자성 발현은 양성 대조군과 비교하여 평균 상대적 형광 강도에 기초한 GFP 발현에 영향을 미치지 않았다. Id. 실험적 발현 벡터로 형질감염된 세포의 평균 형광 강도는 음성 대조군 세포보다 적어도 3배 더 높았다. 도 4를 참조한다.

D. 루시퍼라제 발현

제조업체 프로토콜에 따라 나노-글로(Nano-Glo)® 루시퍼라제 검정 시스템 (프로메가)을 사용하여 형질감염된 세포 및 음성 대조군 세포의 배지에서 분비된 루시퍼라제의 강도를 측정함으로써 루시퍼라제 발현을 평가하였다. 두 실험적 발현 벡터는 모두 루시퍼라제를 발현하였다. 도 5를 참조한다. 실험적 발현 벡터로 형질감염된 세포의 배지에서 평균 상대적 루시퍼라제 강도는 음성 대조군 세포의 배지에서보다 적어도 300배 더 높았다. Id.

실시예 2 - WPRE 및 조작된 5'UTR을 함유하는 발현 벡터

A. 발현 벡터

도 1의 발현 벡터에서 eGFP 및 BGpA를 코딩하는 서열 사이에 우드척 간염 바이러스 전사후 조절 요소 (WPRE)를 클로닝함으로써 다유전자성 발현 벡터를 제조하였다. 생성된 발현 벡터의 맵은 도 6에 표시되어 있다 (pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS*). 벡터에 대한 핵산 서열은 서열식별번호: 21로서 제공된다.

도 6의 CAG 프로모터 대신 CMV 인핸서/프로모터 및 내부 최소 인트론 서열을 함유하는 조작된 5'UTR (즉, 5'UTR1, 서열식별번호: 2)을 함유하는 또 다른 다유전자성 발현 벡터를 제조하였다. 생성된 발현 벡터의 맵은 도 7에 표시되어 있다 (pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*). 벡터에 대한 핵산 서열은 서열식별번호: 22로서 제공된다.

도 6의 CAG 프로모터 대신 CMV 인핸서/프로모터 및 통합된 MAR-5를 갖는 인트론을 함유하는 조작된 5'UTR (즉, 5'UTR2, 서열식별번호: 5)을 함유하는 추가의 다유전자성 발현 벡터를 제조하였다. 생성된 발현 벡터의 맵은 도 8에 표시되어 있다 (pGL2-SS*-CMV-UTR2-SecNLuc-2A-eGFP-WPRE-BGpA-SS*). 벡터에 대한 핵산 서열은 서열식별번호: 23으로서 제공된다.

B. 루시퍼라제 발현 수준 및 내구성

접착성 HEK293 세포를 분리하고, 전기천공 배지에서 분해하고, 1x10⁶개 세포/튜브로 계수하였다.

발현 벡터 (1 μg)를 제조하고, (1) pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS* (실시예 1 참조), (2) pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS*, (3) pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*, 및 (4) pGL2-SS*-CMV-UTR2-SecNLuc-2A-eGFP-WPRE-BGpA-SS* 각각에 대한 표준 작업 절차를 사용하여 세포와 함께 인큐베이션하였다.

포유동물 발현 카세트가 결여된 puc57 플라스미드로 전기천공된 HEK293 세포는 음성 대조군으로서 사용되었다.

전기천공 후, HEK293 세포를 시딩하고, 3x10⁵개 세포/웰로 웰에 접착시켰다.

전기천공 후 2, 6, 10, 14, 17, 20, 27 및 34일차에, 제조업체 프로토콜에 따라 나노-글로® 루시퍼라제 검정 시스템 (프로메가)을 사용하여 4회의 형질감염 각각 및 음성 대조군에 대해 삼중으로 20 μL의 세포 배양 배지에서 분비된 루시퍼라제의 강도를 측정함으로써 루시퍼라제 발현을 평가하였다. 바이오텍(BioTek)® 플레이트 판독기를 사용하여 루시퍼라제 활성을 측정하고, 상대적 루미노미터 단위 (RLU)로 표시하였다. 루시퍼라제 활성의 통계적 분석을 스튜던트 T-테스트에 의해 수행하였다. 도 9를 참조하며, 이는 음성 대조군 (Neg. Ctl. (플라스미드 없음))과 비교하여 pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS* (pGL2-SecNLuc-eGFP), pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (WPRE), pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (5'UTR1+WPRE), 또는 pGL2-SS*-CMV-UTR2-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (5'UTR2+WPRE)로 형질감염된 세포로부터의 배지 내 발현 수준을 보여준다. * = p<0.05, ** = p<0.01, *** = p<0.001 및 **** = p<0.0001.

4개의 발현 벡터 중 임의의 것으로 형질감염된 세포로부터 실험 지속시간 내내 루시퍼라제 발현을 검출하였다. pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS*, pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*, 및 pGL2-SS*-CMV-UTR2-SecNLuc-2A-eGFP-WPRE-BGpA-SS*는 모두 pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS*와 비교하여 유의하게 더 높은 루시퍼라제 발현을 나타내었으며, pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*는 가장 높은 발현 향상을 나타내었다.

C. 딸 세포로의 벡터 확장 및 루시퍼라제 발현

본 실시예의 파트 B에 기재된 바와 같이 음성 대조군으로서 4개의 발현 벡터 또는 puc57 플라스미드로 HEK293 세포를 형질감염시켰다. 세포를 계대 동안 매주 5회 계대배양하였다. 세포 계대 시, 계대 번호 1-3의 경우 세포를 원래 세포 밀도의 1/6로, 계대 번호 4-5의 경우 원래 세포 밀도의 1/10로 재시딩하였다. 각 세포 계대에 대해, 분비된 루시퍼라제 발현을 본 실시예의 파트 B에 기재된 바와 같이 세포 재시딩 후 6-8일에 측정하였다. 도 10을 참조하며, 이는 각 계대 번호에서 음성 대조군과 비교하여 벡터로 형질감염된 세포로부터의 배지 내 발현 수준을 보여준다. 통계적 분석 및 p 값은 본 실시예의 파트 B에 언급된 바와 같다.

각 계대 번호에서 4개의 발현 벡터 중 임의의 것으로 형질감염된 세포로부터 루시퍼라제 발현을 검출하였으며, 이는 벡터가 루시퍼라제의 내구성 있는 발현을 갖는 딸 세포로 계대되었음을 보여준다. pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS*, pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*, 및 pGL2-SS*-CMV-UTR2-SecNLuc-2A-eGFP-WPRE-BGpA-SS*는 모두 각 계대 번호에서 pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS*와 비교하여 유의하게 더 높은 루시퍼라제 발현을 나타내었으며, pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*는 가장 높은 발현 향상을 나타내었다.

후속 연구에서, 루시퍼라제의 내구성 있는 발현을 갖는 딸 세포로의 msDNA 확장이 또한 관찰되었다.

간략하게, 본원 및 미국 특허 번호 9,290,778 및 9,862,954에 기재된 방법을 사용하여 유도성 이. 콜라이 벡터 생산 시스템에서 pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*로부터 msDNA를 생산하였다. (1) msDNA (즉, msDNA-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA) (2) 부모 플라스미드 (즉, pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*), 및 (3) 루시퍼라제 발현 카세트를 갖는 통상적인 플라스미드 (즉, pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA)를 사용하여 리포펙타민과의 별도의 복합체를 제조하였다. HEK293 세포를 총 0.25 pmol 벡터/웰에 대해 개별 웰에서 전기천공을 통해 벡터로 별도로 형질감염시켰다. 세포를 7회 계대배양하였으며, 각 계대마다 10배 세포 희석을 수행하였다. 상대적 루시퍼라제 강도를 계대 번호 1, 2, 3, 4, 5, 6 및 7에 대해 각각 8, 15, 24, 31, 38, 45 및 52일차에 결정하였다.

도 11에 나타낸 바와 같이, pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (즉, pDNA (CMV+U1+W)) 및 msDNA-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA (즉, msDNA (CMV+U1+W)는 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA (즉, 슈퍼서열을 함유하지 않는 통상적인 플라스미드 (통상적인 pcDNA))보다 모든 계대 번호에 걸쳐 훨씬 더 높은 수준에서 내구성 있는 트랜스진 발현을 나타내었다. 통상적인 플라스미드 데이터세트와 비교하여 ** = p<0.01, *** = p<0.001 및 **** = p<0.0001.

D. 딸 세포로의 벡터 확장 및 eGFP 발현

pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS* (pGL2-SecNLuc-eGFP) 또는 pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (5'UTR1+WPRE)로 형질감염되고 본 실시예의 파트 C에 따라 계대된 세포를 eGFP 발현에 대해 분석하였다.

각 계대 번호에 대해 세포 계대 후 6 내지 8일에 이미지화를 수행하였다. 바이오텍® 사이테이션™ 5 플레이트 판독기를 사용하여 라이브 세포 이미지화를 수행하였다. 도 12A를 참조하며, 이는 계대 번호 1, 2, 3 및 5에서 HEK-293 세포 내 형광의 대표적인 현미경사진을 보여준다. 각 계대 번호에서 발현 벡터 중 하나로 형질감염된 세포로부터 eGFP 발현을 검출하였으며, 이는 벡터가 eGFP의 내구성 있는 발현을 갖는 딸 세포로 계대되었음을 보여준다. pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*는 pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS*와 비교하여 각 계대 번호에서 가장 강한 형광 신호를 나타내었으며, 이는 더 높은 형질감염 효율을 나타낸다.

각 발현 벡터에 대해 각 삼중 웰로부터 하나의 대표적인 이미지를 채취하고, 이미지제이(ImageJ) 컴퓨터 소프트웨어를 사용하여 수동 세포 계수에 의해 eGFP 발현 세포 (GFP+)를 정량화하였다. 스튜던트 t-테스트를 사용하여 GFP+ 세포의 통계적 분석을 수행하였다. 도 12B를 참조하며, 이는 각 계대 번호에서 삼중 라이브 형광 이미지로부터 관측 시야에서 관찰된 GFP+ 세포의 선 그래프를 보여준다 (삼중 이미지의 변동으로 인해 유의하지 않음 (ns) = p>0.05).

이미지제이 소프트웨어를 사용하여 각 GFP+ 세포를 수동으로 선택하고, 픽셀 강도에 기초하여 각 세포에 대한 평균 형광 강도 (MFI)를 측정하였다. 각 세포에 대한 최종 MFI 값을 계산하기 위해, 하기 공식을 사용하였다 (최종 MFI = 세포 MFI - 배경 MFI). 각 처리군에 대해 촬영된 3개의 이미지 각각으로부터 적어도 50개의 세포에 대해 MFI 측정을 수득하였다. 그 후, 모든 MFI 측정을 풀링하고, 도트 플롯을 생성하는데 사용하였다. 스튜던트 t-테스트를 사용하여 통계적 분석을 수행하였다. 도 12C를 참조하며, 이는 계대 번호 5에서 MFI의 도트 플롯을 보여준다 (pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS*의 경우 n = 257 세포 및 pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*의 경우 n = 414 세포, ****=p<0.0001). 도 12C의 기본 막대 그래프는 모든 측정된 GFP+ 세포에 대한 평균 MFI 값을 보여준다. pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*의 MFI는 pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS*보다 약 3배 더 높은 것으로 측정되었다.

실시예 4 - 동물 모델에서 msDNA를 사용한 비바이러스 전달

msDNA의 간, 망막 및 뇌로의 표적화된 전달을 평가하기 위한 연구를 수행하였다. 각 표적 조직에 대해, 상이한 투여 경로 (ROA), 용량, 투약 요법 및 전달 기술을 평가하였다. 분비된 루시퍼라제 발현 동역학, 세포질성 eGFP 발현 수준, 및 형질감염 효율 (TE)을 평가하였다. 또한, 생리학적 평가, 조직 형태학 분석, 혈장 시토카인 검정 및 간 독성 분석에 의해 단일 또는 다중 주사 후 msDNA에 대한 관용성을 평가하였다.

모든 전달 기술에 걸쳐, msDNA는 각각 다중 뇌실내 (ICV) 또는 유체역학적 주사 (HDI) 및 정맥내 (IV) 주사를 통해 뇌 및 간 조직에서 강한 효능 및 관용성 프로파일을 나타내었다. msDNA로 처리된 성체 마우스는 단일 IV 주사 후 지속적인 분비된 루시퍼라제 수준 (>10⁸ RLU/mg 단백질)을 나타내었다. msDNA는 단일 IV 주사 후 간 조직에서 내구성 있는 (>100일) 발현을 나타내었다. 심부 조직 영역에 대한 유의한 생체분포가 또한 입증되었으며, 뇌간, 소뇌, 피질 및 시상에서 80% 내지 97% TE가 있다. 나노담체-msDNA 복합체를 사용한 삼중 ICV 주사는 어떠한 부작용도 나타내지 않았다.

A. 간

1. 담체-무함유 네이키드 플라스미드의 단일 높은 용량, 2 mg/kg (50 μg), 유체역학적 주사로부터 루시퍼라제의 발현

C57BL/6J 수컷 야생형 성체 8-12주령 마우스는 꼬리 정맥을 통해 유체역학적 주사 (HDI)에 의해 2 mg/kg (50 μg)의 담체-무함유 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA (슈퍼서열을 함유하지 않는 양성 대조군), pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS*, pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*, 또는 pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS*의 단일 높은 용량을 투여받았다. 루시퍼라제 유전자 발현을 검사하기 위해 HDI 후 1, 3, 7, 10, 15, 22, 28, 42 및 56일차에 처리된 마우스의 혈장을 수집하였다. 벡터 투여 후 1일차에, 모든 마우스는 높은 수준의 루시퍼라제 발현을 나타내었다 (혈장 단백질 mg당 10⁸ - 10⁹ RLU). -7일차에, pCAGLuc 및 pCAGLuc-WPRE 처리된 마우스는 10⁷ - 10⁸ RLU/mg의 혈장 단백질을 생성하였지만, pGSNLuc-WPRE 처리된 마우스는 더 낮은 루시퍼라제 수준을 생성하였다 (~10⁶ RLU/mg 단백질). 벡터 투여 후 8주 후에, 모든 마우스는 낮은 수준의 루시퍼라제 발현을 나타내었다 (약 10⁵ RLU/mg 단백질). 루시퍼라제 수준의 급격한 감소는 플라스미드 처리된 마우스에서 유도된 체액성 또는 세포-매개 면역 반응으로부터 발생하였을 수 있다. 도 13-14를 참조한다.

2. 담체-무함유 네이키드 플라스미드의 단일 낮은 용량, 0.2 mg/kg (5 μg), 유체역학적 주사로부터 루시퍼라제의 발현

동물 모델에서 비바이러스 유전자 전달 후 플라스미드 DNA의 용량 반응을 테스트하기 위해, C57BL/6J 수컷 야생형 성체 8-12주령 마우스는 꼬리 정맥을 통해 HDI에 의해 0.2 mg/kg (5 μg)의 담체-무함유 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA (슈퍼서열을 함유하지 않는 양성 대조군, 2마리 마우스), pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS* (2마리 마우스), 또는 pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (2마리 마우스)의 단일 낮은 용량을 투여받았다. 추가 2마리의 마우스는 주사받지 않았으며 음성 대조군으로서 사용되었다. 루시퍼라제 유전자 발현을 검사하기 위해 HDI 후 1, 3, 7, 10, 15, 22, 28, 42 및 56일차에 마우스의 혈장을 수집하였다. pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS* 및 pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS*로 처리된 마우스는 벡터 투여 후 8주 초과 동안 지속적인 높은 수준의 루시퍼라제 발현 (10⁷ -10⁸ RLU/mg 단백질)을 나타내었고, 동질유전자 발현 카세트를 갖지만 슈퍼서열 (SS)을 갖지 않는 통상적인 대조군 플라스미드보다 100배 이상 더 높은 발현을 나타내었다. 도 15를 참조한다.

벡터의 HDI 24시간 후 플루오로푸리마진 (FFz)의 1:5 희석액을 복강내로 주사함으로써 IVIS를 사용한 생체내 전신 생물발광 이미지화 (BLI)를 수행하였다. BLI는 혈장 샘플 내 루시퍼라제 수준과 상관관계가 있는 것으로 나타났다 (데이터는 표시되지 않음).

3. 담체-무함유 네이키드 msDNA의 단일 낮은 용량, 0.2 mg/kg (5 μg), 유체역학적 주사로부터 루시퍼라제의 발현

본원 및 미국 특허 번호 9,290,778 및 9,862,954에 기재된 방법을 사용하여 유도성 이. 콜라이 벡터 생산 시스템에서 pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS* 및 pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*로부터 msDNA를 생산하였다.

C57BL/6J 수컷 야생형 성체 8-12주령 마우스는 꼬리 정맥을 통해 유체역학적 주사 (HDI)에 의해 0.2 mg/kg (5 μg)의 담체-무함유 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA (양성 대조군, 5마리 마우스), msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA (5마리 마우스), 또는 msDNA-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA (5마리 마우스)의 단일 낮은 용량을 투여받았다. 추가 2마리의 마우스는 주사받지 않았으며 음성 대조군으로서 사용되었다. 루시퍼라제 유전자 발현을 검사하기 위해 HDI 후 1, 3, 7, 10, 15, 22, 28, 42 및 56일차에 처리된 마우스의 혈장을 수집하였다.

플라스미드 처리된 마우스와 유사하게, msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA 처리된 마우스는 벡터 투여 후 8주 초과 동안 지속적인 높은 수준의 루시퍼라제 발현 (10⁷ - 10⁸ RLU/mg 단백질)을 생성한 반면, msDNA-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA 처리된 마우스의 루시퍼라제 발현은 1개월도 안되어 낮은 수준 (~10⁶ RLU/mg 단백질)으로 떨어졌다. msDNA-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA 처리된 마우스에서 루시퍼라제 발현의 급격한 감소는 간세포에서 CMV 프로모터의 침묵으로 인한 것 같다.

IVIS를 사용한 전신 라이브 이미지화를 통해 루시퍼라제 유전자 발현을 확인하였다.

하기 표 1은 혈장 샘플 내 루시퍼라제 발현 (RLU/mg 단백질) 및 BLI (광자/초)에 의해 검출된 바와 같이 1, 7 및 28일차에 개별 마우스로부터의 데이터를 제공한다.

<표 1>

도 16에 나타낸 바와 같이, msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA로 처리된 마우스는 HDI 후 56일차에 부모 플라스미드, pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS*와 비교하여 루시퍼라제 발현의 10배 증가를 나타내었다.

데이터는 마우스에서 msDNA를 사용한 비바이러스 전달이 고도로 효율적이었고 생성된 유전자 발현이 2개월 초과 동안 안정적이었음을 보여준다.

4. 담체-무함유 네이키드 msDNA의 단일 낮은 용량, 0.2 mg/kg (5 μg), 유체역학적 주사로부터의 eGFP의 발현

세포내 세포질성 eGFP 발현 수준을 ELISA에 의해 평가하였다. 간략하게, 파트 3에 기재된 바와 같이 0.2 mg/kg (5 μg)의 벡터의 단일 낮은 용량을 사용하여 HDI 후 56일에 마우스로부터 간 샘플을 수집하고, 단백질 추출을 위해 균질화하였다. 간 용해물로부터 총 단백질 농도를 결정하였다. 그 후, GFP 단백질 수준을 ELISA에 의해 분석하였다.

도 17의 데이터를 루시퍼라제에 대한 데이터와 비교함으로써 분명한 바와 같이, 세포질성 GFP 발현 수준은 동일한 구축물로부터의 루시퍼라제의 분비 수준과 직접적으로 상관관계가 있었다.

도 18에 나타낸 바와 같이, 5 μg의 담체-무함유 msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BgpA의 단일 HDI 꼬리 정맥 주사는 HDI 후 최소 56일 동안 간 조직에서 강하고 내구성 있는 세포질성 eGFP 발현을 보여주었다.

5. 낮은 용량 단일 정맥내 주사 후 간에서의 msDNA 발현 및 관용성 프로파일

C57BL/6J 수컷 야생형 성체 8-12주령 마우스는 단일 정맥내 꼬리 정맥 주사를 통해 지질 나노입자 담체로 리포플렉스된 0.3 mg/kg pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA (슈퍼서열을 함유하지 않는 양성 대조군), msDNA-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA, pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*, msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA, 또는 pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS*를 투여받았다. 담체는 또한 음성 비히클 대조군으로서 사용되었다.

벡터의 단일 IV 주사 후 1, 3, 10, 30, 58, 92, 119 및 174일차에 상기 기재된 바와 같이 IVIS를 사용한 생체내 전신 생물발광 이미지화 (BLI)를 수행하였다. 도 19에 나타낸 바와 같이, msDNA 구축물은 전구체 및 통상적인 플라스미드보다 성능이 뛰어나며 높고 지속적인 루시퍼라제 분비를 보여준다.

혈청 알라닌 아미노트랜스퍼라제 (ALT) 수준, 간 세포독성 및 시토카인 반응을 또한 벡터 주사 후 평가하였다. CAG 프로모터를 함유하는 전구체 플라스미드 및 msDNA는 CMV 프로모터를 함유하는 구축물와 비교하여 더 높은 관용성 프로파일을 나타내었다. 그러나, CMV 프로모터를 함유하는 msDNA는 CMV 전구체 부모 및 통상적인 플라스미드와 비교하여 극적으로 더 낮은 시토카인 및 간 독성 반응을 나타내었다. 주사 후 4시간 및 14일에 간 기능 마커의 시토카인 농도 (pg/mL) 및 효소 농도 (U/L)를 보여주는 하기 표 2를 참조한다.

<표 2>

B. 뇌

성체 야생형 마우스는 이식 후 0, 14 및 28일차에 이식된 캐뉼라를 통해 각각 1 μg DNA의 3회 뇌실내 (ICV) 주사에 의해 나노담체로 제형화된 msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA (3마리 마우스) 또는 나노담체로 제형화된 msDNA-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA (3마리 마우스)를 투여받았다. 이식 후 42일차에 동물을 안락사시키고, 피질, 시상, 뇌간 및 소뇌로부터 시상면 뇌 섹션을 수집하였다.

도 20은 msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA를 주사받은 처리군의 마우스 #1로부터의 피질, 시상, 뇌간 및 소뇌 섹션을 보여준다. 섹션의 msDNA에 대한 형질감염 효율은 피질, 시상, 뇌간 및 소뇌 (푸르킨예 세포)에서 각각 81.9%, 73.0%, 69.2% 및 96.0%로 결정되었다. 형질감염 효율은 모든 DAPI-양성 세포 중 GFP 및 DAPI 모두에 양성인 세포의 백분율로서 계산되었다.

msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA를 주사받은 처리군의 마우스 #1 및 대조군 플라스미드, pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA를 주사받은 마우스로부터의 피질, 시상 및 뇌간 섹션에서의 GFP 발현 간의 비교는 형질감염 효율 및 생성된 GFP 발현이 통상적인 플라스미드에 비해 msDNA에서 더 높았음을 나타내었다 (데이터는 표시되지 않음).

도 21은 피질 및 시상으로부터의 섹션을 보여주고, 도 22는 msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA를 주사받은 처리군의 마우스 #2로부터의 뇌간 및 소뇌로부터의 섹션을 보여준다. 뉴런은 뉴런 마커 NeuN으로 표시되었으며 형질감염된 세포는 GFP를 발현하는 것으로 나타났다. 형질감염 효율은 피질, 시상, 뇌간 및 소뇌 (푸르킨예 세포)에서 각각 99.6%, 98.8%, 98.5% 및 80.8%로 결정되었다. 형질감염 효율은 모든 NeuN-양성 세포 중 GFP 및 NeuN 모두에 대해 양성인 세포의 백분율로서 계산되었다.

도 23은 피질 및 시상으로부터의 섹션을 보여주고, 도 24는 msDNA-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA를 주사받은 처리군의 마우스 #1로부터의 뇌간 및 소뇌로부터의 섹션을 보여준다. 뉴런은 뉴런 마커 NeuN으로 표시되었으며 형질감염된 세포는 GFP를 발현하는 것으로 나타났다. 형질감염 효율은 피질, 시상, 뇌간 및 소뇌 (푸르킨예 세포)에서 각각 91.1%, 88.8%, 73.7% 및 92.1%로 결정되었다. 형질감염 효율은 모든 NeuN-양성 세포 중 GFP 및 NeuN 모두에 대해 양성인 세포의 백분율로서 계산되었다.

하기 표 3은 msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA ("CAG-WPRE") 또는 msDNA-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA ("CMV-WPRE")를 주사받은 마우스에 대해 상기 논의된 형질감염 효율을 요약한다.

<표 3>

이식된 캐뉼라를 통한 반복된 ICV 주사는 세포독성 또는 신경변성의 징후 없이 우수한 전체 조직 무결성을 초래하였다.

데이터는 msDNA가 재투여 가능하고 형태학적 유해 효과 없이 다중 뇌 영역에서 높은 형질감염 효율, 생체분포 및 트랜스진 발현을 초래하였음을 보여준다.

실시예 5 - 인간 세포에서의 효능 및 안전성

pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA (양성 대조군), msDNA-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA, pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*, msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA, 또는 pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS*를 각각 지질 나노입자 담체로 리포플렉스시켰다.

인간 T 세포 (Pan-T(TA+)) 및 간세포 (Huh7)를 0.3 μg/mL 또는 1 μg/mL 용량의 리포플렉스된 벡터에 의해 형질감염시켰다.

리포플렉스된 msDNA 벡터는 부모 및 통상적인 플라스미드와 비교하여 형질감염 후 3 및 5일차에 두 세포 유형 모두에서 높은 발현을 나타내었다. 도 25-26을 참조한다.

리포플렉스된 msDNA는 생체외 인간 말초 혈액 단핵 세포 (PBMC)에서도 잘 관용되었다. 특히, msDNA는 통상적인 플라스미드와 비교하여 인간 PBMC에서 유의하게 더 낮은 시토카인 프로파일 수준을 나타내었다 (데이터는 표시되지 않음).

실시예 6 - msDNA를 사용한 상동성 지정 복구

통상적인 플라스미드 DNA와 비교하여 msDNA에 의해 매개되는 상동성 지정 복구를 평가하기 위한 연구를 수행하였다.

5' 및 3' 상동성 아암에 의해 플랭킹된 관심 유전자 (GOI)를 함유하는 발현 카세트 (플라스미드 DNA HDR-GOI-HDR)를 사용하여 통상적인 플라스미드를 생산하였다.

2개의 슈퍼 서열 부위에 의해 플랭킹된 통상적인 플라스미드에서 사용된 바와 동일한 HDR-GOI-HDR 서열을 사용하여 msDNA 발현 벡터를 생산하였다. 그 후, 본원 및 미국 특허 번호 9,290,778 및 9,862,954에 기재된 방법을 사용하여 유도성 이. 콜라이 벡터 생산 시스템에서 HDR-GOI-HDR을 함유하는 msDNA (msDNA HDR-GOI-HDR)를 생산하였다.

GOI의 상동성 지정 복구 녹인 (HDR KI)을 매개하기 위해 CRISPR 유전자 편집 시스템과 함께 동일한 몰량의 플라스미드 DNA HDR-GOI-HDR 또는 msDNA HDR-GOI-HDR로 유도 만능 줄기 세포 (iPSC)를 형질감염시켰다.

GOI의 상동성 지정 복구 녹인 (HDR KI) 효율은 형질감염 후 3, 7 및 15일차에 형질감염된 세포의 총 수에 비해 표면에 GOI를 발현한 통합된 건강한 iPSC의 총 수를 계수함으로써 형광 활성화 세포 분류 (FACS)로 평가되었다. 도 27B, 28B 및 29A의 Q3에 나타낸 바와 같이, HDR KI 효율은 각각 형질감염 후 3, 7 및 15일에 통상적인 플라스미드에 대해 각각 8.60%, 7.76% 및 8.05%였다. 도 27C, 28C 및 29B의 Q3에 나타낸 바와 같이, 각각 15.4%, 15.4% 및 15.7%의 더 높은 HDR KI 효율이 각각 형질감염 후 3, 7 및 15일에 msDNA에 대해 관찰되었다.

실시예 7 - 조절 서열 변형을 함유하는 발현 벡터

A. 발현 벡터

실시예 1 및 2에 기재된 바와 같은 2개의 슈퍼 서열 부위, CMV 인핸서/프로모터, 내부 최소 인트론 서열을 함유하는 조작된 5'UTR, 및 eGFP 및 Nluc를 코딩하는 다유전자성 발현 카세트를 함유하는 발현 벡터는 또한 인간 베타-글로빈 폴리아데닐화 신호의 2개 카피 및 120개의 아데닌 뉴클레오티드 (즉, 2huBGpA-A120, 서열식별번호: 17) 및 하기 중 하나 이상을 함유하는 3'UTR을 함유하도록 설계되었다: (1) CMV 인핸서의 5' 말단에 위치된 합성 인핸서 (즉, 인핸서-1 (E1), 서열식별번호: 12), (2) 3'UTR의 5' 말단에 위치된 WPRE, (3) 5' 슈퍼 서열의 3' 말단에 위치된 SRF-UCOE; 및 (4) eGFP의 3' 말단에 위치된 인간 CSP-B MAR (huMAR). 설계된 벡터의 맵은 도 30-38에 표시되어 있다. 도 30은 3'UTR을 함유하는 발현 벡터의 맵을 보여준다 (SS*-CMV-UTR1-SecNLuc-2A-eGFP-3'UTR[2hBGpA-A120]-SS*, 서열식별번호: 24). 도 31은 E1 및 3'UTR을 함유하는 발현 벡터의 맵을 보여준다 (SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-3'UTR[2hBGpA-A120]-SS*, 서열식별번호: 25). 도 32는 E1, WPRE 및 3'UTR을 함유하는 발현 벡터의 맵을 보여준다 (SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR[2hBGpA-A120]-SS*, 서열식별번호: 26). 도 33은 UCOE, E1, WPRE 및 3'UTR을 함유하는 발현 벡터의 맵을 보여준다 (SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR[2hBGpA-A120]-SS*, 서열식별번호: 27). 도 34는 E1, huMAR 및 3'UTR을 함유하는 발현 벡터의 맵을 보여준다 (SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-huMAR-3'UTR[2hBGpA-A120]-SS*, 서열식별번호: 28). 도 35는 UCOE, E1, huMAR 및 3'UTR을 함유하는 발현 벡터의 맵을 보여준다 (SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-huMAR-3'UTR[2hBGpA-A120]-SS*, 서열식별번호: 29). 도 36은 UCOE, E1, WPRE 및 3'UTR을 함유하는 발현 벡터의 맵을 보여준다 (SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR[2hBGpA-A120]-SS*, 서열식별번호: 30). 도 37은 E1, huMAR, WPRE 및 3'UTR을 함유하는 발현 벡터의 맵을 보여준다 (SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-huMAR-WPRE-3'UTR[2hBGpA-A120]-SS*, 서열식별번호: 31). 도 38은 UCOE, E1, huMAR, WPRE 및 3'UTR을 함유하는 발현 벡터의 맵을 보여준다 (SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-huMAR-WPRE-3'UTR[2hBGpA-A120]-SS*, 서열식별번호: 32).

B. 루시퍼라제 발현 수준

HEK293 세포를 표준 작업 절차를 사용하여 (1) 도 2에 나타낸 바와 같은 통상적인 플라스미드, pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA, (2) SS*-CMV-UTR1-SecNLuc-2A-eGFP-3'UTR[2hBGpA-A120]-SS*, (3) S*-E1-CMV-UTR1-SecNLuc-2A-eGFP-3'UTR[2hBGpA-A120]-SS*, 및 (4) SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR[2hBGpA-A120]-SS*로 별도로 형질감염시켰다.

전기천공 후 2, 3, 7, 10, 14, 21 및 28일차에, 실시예 2B에 기재된 바와 같이 배양된 세포의 배지로부터 분비된 루시퍼라제의 강도를 측정함으로써 루시퍼라제 발현을 평가하였다. 도 39를 참조하며, 이는 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA (통상적인 pDNA CMV-U), SS*-CMV-UTR1-SecNLuc-2A-eGFP-3'UTR[2hBGpA-A120]-SS* (A: CMV-U1-3'UTR), SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-3'UTR[2hBGpA-A120]-SS* (B: E1-CMV-U1-3'UTR), 및 SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR[2hBGpA-A120]-SS* (C: E1-CMV-U1-WPRE-3'UTR)로 형질감염된 세포로부터의 배지 내 발현 수준을 보여준다.

도 39에 나타낸 바와 같이, 동일한 프로모터 및 다유전자성 발현 카세트를 갖는 통상적인 플라스미드와 비교하여 3'UTR을 함유하는 msDNA 발현 벡터에서 루시퍼라제 발현이 증가되고 내구성 있었다. msDNA 발현 벡터에 E1 (A 대 B) 및 WPRE (B 대 C) 유전적 요소의 첨가에 따라 발현이 더욱 증가되었으며, E1 및 WPRE 유전적 요소의 부가적 효과는 구축물 C와 연관된 가장 높은 루시퍼라제 발현을 초래하였다. t-테스트를 사용하여 통계적 분석을 수행하였다. * = p<0.05 및 ** = p<0.01.

C. 딸 세포로의 벡터 확장 및 루시퍼라제 발현

본 실시예의 파트 B에 기재된 4개의 발현 벡터로 HEK293 세포를 형질감염시켰다. 세포를 계대 동안 7일마다 5회 계대배양하였다. 세포 계대 시, 세포를 원래 세포 밀도의 1/10로 재시딩하였다. 각 세포 계대에 대해, 분비된 루시퍼라제 발현을 실시예 2B에 기재된 바와 같이 측정하였다. 도 40을 참조하며, 이는 통상적인 플라스미드와 비교하여 msDNA 발현 벡터로 형질감염된 세포로부터의 배지 내 발현 수준을 보여준다. 통계적 분석 및 p 값은 본 실시예의 파트 B에 언급된 바와 같다.

각 계대 번호에서 msDNA 발현 벡터 중 임의의 것으로 형질감염된 세포로부터 루시퍼라제 발현을 검출하였으며, 이는 벡터가 루시퍼라제의 내구성 있는 발현을 갖는 딸 세포로 계대되었음을 보여준다.

도 40에 나타낸 바와 같이, E1 및 WPRE 유전적 요소의 부가적 효과는 각 계대 번호에서 구축물 C와 연관된 가장 높은 루시퍼라제 발현을 초래하였으며, 다중 계대 후에 가장 내구성 있는 발현을 초래하였다.

실시예 8 - 합성 프로모터 서열을 함유하는 발현 벡터

A. 발현 벡터

5개의 합성 프로모터 서열을 생산하였다: (1) 합성 인핸서 E1의 3개 카피 (즉, 서열식별번호: 12의 3개 카피), 닭 β-액틴 프로모터 및 키메라 인트론을 함유하는 CAG [E1X3+CBA 프로모터+인트론] (서열식별번호: 35), (2) E2 (U100), 닭 β-액틴 프로모터 및 키메라 인트론을 함유하는 CAG [E2+CBA 프로모터+인트론] (서열식별번호: 36), (3) 합성 인핸서 E1의 3개 카피, 닭 β-액틴 프로모터 및 5'UTR1 (즉, 서열식별번호: 2)을 함유하는 CAG [E1X3+CBA 프로모터+UTR1] (서열식별번호: 37), (4) E2 (U100), 닭 β-액틴 프로모터 및 5'UTR1을 함유하는 CAG [E2 (U100)+CBA 프로모터+UTR1] (서열식별번호: 38), 및 (5) CMV 인핸서, EF1a 짧은 프로모터 및 5'UTR1을 함유하는 CMV 인핸서-EF1-UTR1 (서열식별번호: 39).

실시예 1 및 2에 기재된 바와 같은 CMV 인핸서, 닭 β-액틴 프로모터, 및 키메라 인트론 및 eGFP 및 Nluc를 코딩하는 다유전자성 발현 카세트를 함유하는 통상적인 플라스미드를 생산하였다. 통상적인 플라스미드의 맵은 도 41에 표시되어 있다 (pGL2-CAG-SecNLuc-2A-eGFP-WPRE-b글로빈 폴리A, 서열식별번호: 34).

2개의 슈퍼 서열 부위, CMV 인핸서, 닭 β-액틴 프로모터, 키메라 인트론, eGFP 및 Nluc를 코딩하는 다유전자성 발현 카세트, WPRE 및 3'UTR을 함유하는 msDNA 발현 벡터를 생산하였다. 벡터의 맵은 도 42에 표시되어 있다 (4-1 pGL2-SS*-CAG [CMV 인핸서+CBA 프로모터+인트론]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*, 서열식별번호: 40).

상기 기재된 바와 같은 합성 프로모터 (1)-(5) 중 하나와 함께 2개의 슈퍼 서열 부위, eGFP 및 Nluc를 코딩하는 다유전자성 발현 카세트, WPRE 및 3'UTR을 함유하는 5개의 msDNA 발현 벡터를 생산하였으며, 각각의 벡터 맵은 도 43 (4-2 pGL2-SS*-CAG [E1 X3+CBA 프로모터+인트론]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*, 서열식별번호: 41), 도 44 (4-3 pGL2-SS*-CAG [E2(U100)+CBA 프로모터+인트론]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*, 서열식별번호: 42), 도 45 (4-4 pGL2-SS*-CAG [E1 X3+CBA 프로모터+UTR1]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*, 서열식별번호: 43), 도 46 (4-5-pGL2-SS*-CAG [E2 (U100)+CBA 프로모터+UTR1]-SecNLuc-2A-eGFP-WPRE-3'UTR (108 - 120 폴리A)-SS*, 서열식별번호: 44), 및 도 47 (4-6-pGL2-SS*-CMV 인핸서-EF1-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*, 서열식별번호: 45)에 표시되어 있다.

B. 루시퍼라제 발현 수준

HEK293 세포를 1x10⁵개 세포/웰로 24-웰 플레이트에 시딩하고, 본 실시예의 파트 A에 기재된 벡터 및 리포펙타민의 복합체로 0.25 pmol DNA/웰로 별도로 형질감염시켰다. 형질감염 후 3 및 6일에 실시예 2B에 기재된 바와 같이 분비된 루시퍼라제 발현을 측정하였다. 도 48을 참조하며, 이는 통상적인 플라스미드와 비교하여 msDNA 발현 벡터로 형질감염된 세포로부터의 배지 내 발현 수준을 보여준다. 통상적인 플라스미드에 비해 이원 Anova 분석을 사용하여 통계적 분석을 수행하였다. * = p<0.05, ** = p<0.01, 및 ****= p<0.0001.

루시퍼라제 발현 수준은 통상적인 플라스미드와 비교하여 모든 msDNA 발현 벡터에 대해 더 높았다. 가장 높은 발현은 4-6-pGL2-SS*-CMV 인핸서-EF1-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A (4-6: CMV-EF1-UTR1-W-3'UTR)에서 관찰되었으며, 이는 CMV 인핸서 및 5'UTR1과 조합하여 EF-1 프로모터 요소를 함유한다.

실시예 9 - SS 및 발현 카세트 변형

본 개시내용에 기재된 바와 같은 발현 벡터의 슈퍼 서열 (SS) 및 발현 카세트에 대한 변형의 영향은 형질감염 효율, 관심 핵산 서열의 발현 (리포터 유전자, 예컨대 실시예 1 및 2에 기재된 바와 같은 다유전자성 GFP 및 루시퍼라제 발현 카세트 포함), 및 분열하는 세포에서 벡터의 내구성/확장 (신속 및 느린 분열 세포 포함) 측면에서 평가될 것이다. SS에 대한 변형은 또한 이들 부위에 대한 제한 효소 활성에 대해 평가될 것이다.

변형은 개별 변형 및 조합, 예컨대 벡터 백본과 레콤비나제에 대한 절단 부위 사이의 SS에서 레콤비나제에 대한 비-결합 영역에 통합된 엔도뉴클레아제 표적 서열, 제1 레콤비나제에 대한 제1 표적 서열의 3' 말단 (즉, 5' SS의 3' 말단)과 발현 카세트 내 프로모터의 5' 사이에 통합된 CAG 프로모터, 제1 레콤비나제에 대한 제1 표적 서열의 3' 말단 (즉, 5' SS의 3' 말단)과 발현 카세트 내 프로모터의 5' 사이에 통합된 CMV 인핸서, CMV 인핸서에 대해 5' 및/또는 UCOE, CMV, EF1, SV40, CAG, Rho, VDM2, HCR 또는 HLP 프로모터 또는 이의 변이체에 대해 3'에 위치된 인핸서-1 서열, CMV 프로모터 변이체, EF1-알파 프로모터, 합성 프로모터, 인트론 내에 통합된 비-코딩 서열을 갖는 또는 갖지 않는 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합된 인트론을 포함하는 5'UTR (예를 들어, 서열식별번호: 2-5 중 어느 하나의 핵산 서열을 포함하는 5'UTR), 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 척추동물 염색질 인슐레이터, 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 우드척 간염 바이러스 전사후 조절 요소, 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 스캐폴드/매트릭스 부착 영역, 발현 카세트 내 프로모터에 대해 5'에 위치된 유비쿼터스 염색질 개방 요소 (예를 들어, 5' SS의 3'에 및 발현 카세트 내 다른 서열 앞), 관심 핵산과 3' SS 사이에서 발현 카세트에 통합된 3'UTR (예컨대 정지 코돈 바로 후에) (예를 들어, 서열식별번호: 13-16 중 어느 하나의 핵산 서열을 포함하는 3'UTR), 및/또는 100 내지 120개의 아데닌 뉴클레오티드를 포함하는 폴리(A) 꼬리 (예를 들어, 3'UTR의 3' 말단으로서) (그러나 이에 제한되지는 않음)를 포함할 것이다.

서열

서열식별번호: 1 인공 인트론

서열식별번호: 2 5'UTR1

서열식별번호: 3 MAR-5 삽입을 갖는 5'UTR1

서열식별번호: 4 5'UTR

서열식별번호: 5 5'UTR2 (MAR-5 삽입을 갖는 서열식별번호: 4의 5'UTR)

서열식별번호: 6 A2UCOE 요소

서열식별번호: 7 SRF-UCOE

서열식별번호: 8 cHS4 인슐레이터

서열식별번호: 9 MAR-5

서열식별번호: 10 인간 CSP-B MAR (huMAR)

서열식별번호: 11 WPRE

서열식별번호: 12 인핸서-1

서열식별번호: 13 제노푸스 라에비스 베타-글로빈 폴리아데닐화 신호의 2개 카피 (2xlBGpA)

서열식별번호: 14 인간 베타-글로빈 폴리아데닐화 신호의 2개 카피 (2huBGpA)

서열식별번호: 15 하이브리드 제노푸스 라에비스 및 인간 베타-글로빈 폴리아데닐화 신호 (xlhuBGpA)

서열식별번호: 16 2xlBGpA-A120

서열식별번호: 17 2huBGpA-A120

서열식별번호: 18 xlhuBGpA-A120

서열식별번호: 19 pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS*

서열식별번호: 20 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA

서열식별번호: 21 pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS*

서열식별번호: 22 pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*

서열식별번호: 23 pGL2-SS*-CMV-UTR2-SecNLuc-2A-eGFP-WPRE-BGpA-SS*

서열식별번호: 24 SS*-CMV-UTR1-SecNLuc-2A-eGFP-3'UTR[2huBGpA-A120]-SS*

서열식별번호: 25 SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-3'UTR[2huBGpA-A120]-SS*

서열식별번호: 26 SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR[2huBGpA-A120]-SS*

서열식별번호: 27 SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR[2huBGpA-A120]-SS*

서열식별번호: 28 SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-huMAR-3'UTR[2huBGpA-A120]-SS*

서열식별번호: 29 SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-huMAR-3'UTR[2huBGpA-A120]-SS*

서열식별번호: 30 SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR[2huBGpA-A120]-SS*

서열식별번호: 31 SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-MAR-WPRE-3'UTR[2huBGpA-A120]-SS*

서열식별번호: 32 SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-MAR-WPRE-3'UTR[2huBGpA-A120]-SS*

서열식별번호: 33 (슈퍼 서열, SS*)

서열식별번호: 34 pGL2-CAG-SecNLuc-2A-eGFP-WPRE-b글로빈 폴리A

서열식별번호: 35 CAG [E1X3+CBA 프로모터+인트론]

서열식별번호: 36 CAG [E2+CBA 프로모터+인트론]

서열식별번호: 37 CAG [E1X3+CBA 프로모터+UTR1]

서열식별번호: 38 CAG [E2 (U100)+CBA 프로모터+UTR1]

서열식별번호: 39 CMV 인핸서-EF1-UTR1

서열식별번호: 40 4-1 pGL2-SS*-CAG [CMV 인핸서+CBA 프로모터+인트론]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*

서열식별번호: 41 4-2 pGL2-SS*-CAG [E1 X3+CBA 프로모터+인트론]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*

서열식별번호: 42 4-3 pGL2-SS*-CAG [E2(U100)+CBA 프로모터+인트론]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*

서열식별번호: 43 4-4 pGL2-SS*-CAG [E1 X3+CBA 프로모터+UTR1]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*

서열식별번호: 44 4-5-pGL2-SS*-CAG [E2 (U100)+CBA 프로모터+UTR1]-SecNLuc-2A-eGFP-WPRE-3'UTR (108 - 120 폴리A)-SS*

서열식별번호: 45 4-6-pGL2-SS*-CMV 인핸서-EF1-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*

서열식별번호: 46 인핸서-1의 3개 카피

서열식별번호: 47 키메라 인트론

* * *

본 개시내용은 본원에 기재된 특정 측면에 의해 범위가 제한되지 않아야 한다. 실제로, 설명된 것 외에 본 개시내용의 다양한 변형이 전술한 설명 및 첨부 도면으로부터 관련 기술분야의 통상의 기술자에게 명백해질 것이다. 이러한 변형은 첨부된 청구범위의 범위 내에 속하도록 의도된다.

다른 측면은 하기 청구범위 내에 있다.

SEQUENCE LISTING <110> MEDIPHAGE BIOCEUTICALS, INC. SLAVCEV, RODERICK NAFISSI, NAFISEH <120> EXPRESSION VECTORS, BACTERIAL SEQUENCE-FREE VECTORS, AND METHODS OF MAKING AND USING THE SAME <130> 4471.007PC03 <150> US 63/331,638 <151> 2022-04-15 <150> US 63/306,015 <151> 2022-02-02 <150> US 63/211,343 <151> 2021-06-16 <160> 47 <170> PatentIn version 3.5 <210> 1 <211> 144 <212> DNA <213> Artificial Sequence <220> <223> Artificial intron <400> 1 gtaagtcgac gggccgggcc tgggccgggt ccgggccggg tcgttggatc cccactacag 60 cccgatactc aagcttgacg aattcgagta tccaaggtag tggactagtg tgacgctgct 120 gacccctttc tttcccttct gcag 144 <210> 2 <211> 190 <212> DNA <213> Artificial Sequence <220> <223> 5'UTR1 <400> 2 ctgccttctc cctcctgtga gtttggtaag tcgacgggcc gggcctgggc cgggtccggg 60 ccgggtcgtt ggatccccac tacagcccga tactcaagct tgacgaattc gagtatccaa 120 ggtagtggac tagtgtgacg ctgctgaccc ctttctttcc cttctgcagg ttggtgtaca 180 gtagcttcca 190 <210> 3 <211> 771 <212> DNA <213> Artificial Sequence <220> <223> 5'UTR1 with MAR-5 insertion <400> 3 ctgccttctc cctcctgtga gtttggtaag tcgacgggcc gggcctgggc cgggtccggg 60 ccgggtatcc atagctgatt ggtctaaaat gagatacatc aacgctcctc catgtttttt 120 gttttctttt taaatgaaaa actttatttt ttaagaggag tttcaggttc atagcaaaat 180 tgagaggaag gtacattcaa gctgaggaag ttttcctcta ttcctagttt actgagagat 240 tgcatcatga atgggtgtta aattttgtca aatgcttttt ctgtgtctat caatatgacc 300 atgtgatttt cttctttaac ctgttgatgg gacaaattac gttaattgat tttcaaacgt 360 tgaaccaccc ttacatatct ggaataaatt ctacttggtt gtggtgtata ttttttgata 420 cattcttgga ttctttttgc taatattttg ttgaaaatgt ttgtatcttt gttcatgaga 480 gatattggtc tgttgttttc ttttcttgta atgtcatttt ctagttccgg tattaaggta 540 atgctggcct agttgaatga tttaggaagt attccctctg cttctgtctt ctgaaagaga 600 ttgtagaaag ttgatacaat ttttttttct ttaaatatct tgatagtcgt tggatcccca 660 ctacagcccg atactcaagc ttgacgaatt cgagtatcca aggtagtgga ctagtgtgac 720 gctgctgacc cctttctttc ccttctgcag gttggtgtac agtagcttcc a 771 <210> 4 <211> 117 <212> DNA <213> Artificial Sequence <220> <223> 5'UTR <400> 4 attgggatct tcacacagca ggtaaggttg cgggccgggc ctgggccggg tccgggccgg 60 gccgcactga cccctggtgt tgcttttttt ttttaggccg caagctgaag cgtgtcc 117 <210> 5 <211> 698 <212> DNA <213> Artificial Sequence <220> <223> 5'UTR2 (5'UTR of SEQ ID NO:4 with MAR-5 insertion) <400> 5 attgggatct tcacacagca ggtaaggttg cgggccgggc ctgggccggg tccgggccgg 60 gtatccatag ctgattggtc taaaatgaga tacatcaacg ctcctccatg ttttttgttt 120 tctttttaaa tgaaaaactt tattttttaa gaggagtttc aggttcatag caaaattgag 180 aggaaggtac attcaagctg aggaagtttt cctctattcc tagtttactg agagattgca 240 tcatgaatgg gtgttaaatt ttgtcaaatg ctttttctgt gtctatcaat atgaccatgt 300 gattttcttc tttaacctgt tgatgggaca aattacgtta attgattttc aaacgttgaa 360 ccacccttac atatctggaa taaattctac ttggttgtgg tgtatatttt ttgatacatt 420 cttggattct ttttgctaat attttgttga aaatgtttgt atctttgttc atgagagata 480 ttggtctgtt gttttctttt cttgtaatgt cattttctag ttccggtatt aaggtaatgc 540 tggcctagtt gaatgattta ggaagtattc cctctgcttc tgtcttctga aagagattgt 600 agaaagttga tacaattttt ttttctttaa atatcttgat agccgcactg acccctggtg 660 ttgctttttt tttttaggcc gcaagctgaa gcgtgtcc 698 <210> 6 <211> 1579 <212> DNA <213> Artificial Sequence <220> <223> A2UCOE element <400> 6 gcggccgcac gcgtggccct ccgcgcctac agctcaagcc acatccgaag ggggagggag 60 ccgggagctg cgcgcggggc cgccgggggg aggggtggca ccgcccacgc cgggcggcca 120 cgaagggcgg ggcagcgggc gcgcgcgcgg cggggggagg ggccggcgcc gcgcccgctg 180 ggaattgggg ccctaggggg agggcggagg cgccgacgac cgcggcactt accgttcgcg 240 gcgtggcgcc cggtggtccc caaggggagg gaagggggag gcggggcgag gacagtgacc 300 ggagtctcct cagcggtggc ttttctgctt ggcagcctca gcggctggcg ccaaaaccgg 360 actccgccca cttcctcgcc cgccggtgcg agggtgtgga atcctccaga cgctggggga 420 gggggagttg ggagcttaaa aactagtacc cctttgggac cactttcagc agcgaactct 480 cctgtacacc aggggtcagt tccacagacg cgggccaggg gtgggtcatt gcggcgtgaa 540 caataatttg actagaagtt gattcgggtg tttccggaag gggccgagtc aatccgccga 600 gttggggcac ggaaaacaaa aagggaaggc tactaagatt tttctggcgg gggttatcat 660 tggcgtaact gcagggacca cctcccgggt tgagggggct ggatctccag gctgcggatt 720 aagcccctcc cgtcggcgtt aatttcaaac tgcgcgacgt ttctcacctg ccttcgccaa 780 ggcaggggcc gggaccctat tccaagaggt agtaactagc aggactctag ccttccgcaa 840 ttcattgagc gcatttacgg aagtaacgtc gggtactgtc tctggccgca agggtgggag 900 gagtacgcat ttggcgtaag gtggggcgta gagccttccc gccattggcg gcggataggg 960 cgtttacgcg acggcctgac gtagcggaag acgccttagt gggggggaag gttctagaaa 1020 agcggcggca gcggctctag cggcagtagc agcagcgccg ggtcccgtgc ggaggtgctc 1080 ctcgcagagt tgtttctcca gcagcggcag ttctcactac agcgccagga cgagtccggt 1140 tcgtgttcgt ccgcggagat ctctctcatc tcgctcggct gcgggaaatc gggctgaagc 1200 gactgagtcc gcgatggagg taacgggttt gaaatcaatg agttattgaa aagggcatgg 1260 cgaggccgtt ggcgcctcag tggaagtcgg ccagccgcct ccgtgggaga gaggcaggaa 1320 atcggaccaa ttcagtagca gtggggctta aggtttatga acggggtctt gagcggaggc 1380 ctgagcgtac aaacagcttc cccaccctca gcctcccggc gccatttccc ttcactgggg 1440 gtgggggatg gggagctttc acatggcgga cgctgccccg ctggggtgaa agtggggcgc 1500 ggaggcggga cttcttattc cctttctaaa gcacgctgct tcgggggcca cggcgtctcc 1560 tcggacggcc gggcgcgcc 1579 <210> 7 <211> 761 <212> DNA <213> Artificial Sequence <220> <223> SRF-UCOE <400> 7 gcacacgacc acaattccac tgaaagcatt ttaatacgga acttgtcact cccagggagc 60 ctccgctcag ccggcagttg gttcatttca atccccacga caacccttca aagtgcaggg 120 cagacagcag gtggctctgc ccaggcgcct ggatcacagc ccggcctgca gccctcacct 180 gggcgcgggg agaccctgag gacgctcctc caggcggcgc tggccggggc ctgcggacac 240 ggacgggcgg gctgagctcc gggacccctc cccgcgcccc gcaccccgca ccccgcaccc 300 cgcaccccgc acccggcgct cacccgtccc agccccgccg cccgcagccc cagctgcaac 360 gcagccaccg ccgccatcgc acccggcccc gcgggcgctt ccgggacgca ggaggcatct 420 gcatccgggg cgccgctgag tcccgcccag agccccgccc ccggctccag gttctgcgag 480 cggcttccgc cgggctgctc cgcgggcgcg tcggccatga gcgagttgcc gggcgacgtg 540 cgggcgtttc tgcgggagca cccgagcctg cggctccaga cggacgcccg caaggttcgc 600 agcgcgggag gggaacggag tggcggagaa gggcgcagtt gggatgaggg gctgagggga 660 gggcagggga gaggagaggg caggggagag gggagagggg agagcaggag agaggggaag 720 gcaggggaga gggcgcggcg ggatcagggg aggagaggga a 761 <210> 8 <211> 478 <212> DNA <213> Artificial Sequence <220> <223> cHS4 insulator <400> 8 ggggagctca cggggacagc ccccccccaa agcccccagg gatgtaatta cgtccctccc 60 ccgctagggg gcagcagcga ccgcccgggg ctccgctccg gtccggcgct ccccccgcat 120 cccgagccgg cagcgtgcgg ggacagcccg ggcacgggga aggtggcacg ggatcgcttt 180 cctctgaacg cttctcgctg ctctttgagc ctgcagacac ctgggggata cggggaaaag 240 gggagctcac ggggacagcc cccccccaaa gcccccaggg atgtaattac gtccctcccc 300 cgctaggggg cagcagcgac cgcccggggc tccgctccgg tccggcgctc cccccgcatc 360 ccgagccggc agcgtgcggg gacagcccgg gcacggggaa ggtggcacgg gatcgctttc 420 ctctgaacgc ttctcgctgc tctttgagcc tgcagacacc tgggggatac ggggaaaa 478 <210> 9 <211> 581 <212> DNA <213> Artificial Sequence <220> <223> MAR-5 <400> 9 tatccatagc tgattggtct aaaatgagat acatcaacgc tcctccatgt tttttgtttt 60 ctttttaaat gaaaaacttt attttttaag aggagtttca ggttcatagc aaaattgaga 120 ggaaggtaca ttcaagctga ggaagttttc ctctattcct agtttactga gagattgcat 180 catgaatggg tgttaaattt tgtcaaatgc tttttctgtg tctatcaata tgaccatgtg 240 attttcttct ttaacctgtt gatgggacaa attacgttaa ttgattttca aacgttgaac 300 cacccttaca tatctggaat aaattctact tggttgtggt gtatattttt tgatacattc 360 ttggattctt tttgctaata ttttgttgaa aatgtttgta tctttgttca tgagagatat 420 tggtctgttg ttttcttttc ttgtaatgtc attttctagt tccggtatta aggtaatgct 480 ggcctagttg aatgatttag gaagtattcc ctctgcttct gtcttctgaa agagattgta 540 gaaagttgat acaatttttt tttctttaaa tatcttgata g 581 <210> 10 <211> 1233 <212> DNA <213> Artificial Sequence <220> <223> Human CSP-B MAR (huMAR) <400> 10 ggatcccatt ctccttgatg tactaatttt tctttaaaag tgataataat agctcccatt 60 tagaattttt aaataacaca acaaatgtaa agtaactaat gtgtcctctg gatcatggta 120 agtaatgaat aaatttaact ccctttacct tctccctttg ctattttttc catgctagga 180 tttatacatt tttaaaaaac taaatctgct atcaaatgac agctttaaat ttacttttta 240 aaatttgtta ttgtatatat ttatggggta taaagtgatg ttatgatata tatatacaca 300 atgtacactg attaaatcaa gccaattaac attttatcat ctcaaatact taacattttt 360 tgtagtgaga acatttgaaa tttactttta gcaatttcaa aacatacatt attattatta 420 actatagtca ccatgatgta ccatagatct ttaaaaactt attcttcctg cctaactgaa 480 actttgtact ctttgactaa catcttttca ttcccccact tcccagcctc tggtaatcac 540 cattacacac tctgcttcta tgagttcaat tgctttagac tccacgtaat aaatgagatc 600 atgcagcatt tggctttctg tgcctggctt atccttgctt agcatggtgt cttacaggtt 660 catccatgtt gcaacaaata acagaatctc attctttgtt aaggctgaat actattccat 720 tgggtatata taccacattt tccttatcca ttaatccact gatggaccct taggttgttg 780 attccatata ttggctattg taaatagtgc agcaatgaac atgagagtgc aactatctct 840 tcaatgtact gatttcgaat ccttcggatc tatctcagaa gtgagattgc aggatcatat 900 aattctactt ttagtctttt gaggagctcc atacagcttt ccatatggcc atactaatta 960 cattctcatc aacagtgtac aatggtttcc ttttctccac atcctcacca acatttataa 1020 ttttttgtct ttttgataat agccatctga caggtgtaaa gtgatagctc attgcagttt 1080 taatttgcat tttttgatga ttagtaatgt tgagaatttt ttcatatatc tcttggccag 1140 ttgcatgtct tctttggaaa aatgtctatt cagttccttt gcccattttt taattgggat 1200 ttttggtttc ttgctattga gttgtttgaa ttc 1233 <210> 11 <211> 597 <212> DNA <213> Artificial Sequence <220> <223> WPRE <400> 11 tcgacaatca acctctggat tacaaaattt gtgaaagatt gactggtatt cttaactatg 60 ttgctccttt tacgctatgt ggatacgctg ctttaatgcc tttgtatcat gctattgctt 120 cccgtatggc tttcattttc tcctccttgt ataaatcctg gttgctgtct ctttatgagg 180 agttgtggcc cgttgtcagg caacgtggcg tggtgtgcac tgtgtttgct gacgcaaccc 240 ccactggttg gggcattgcc accacctgtc agctcctttc cgggactttc gctttccccc 300 tccctattgc cacggcggaa ctcatcgccg cctgccttgc ccgctgctgg acaggggctc 360 ggctgttggg cactgacaat tccgtggtgt tgtcggggaa gctgacgtcc tttccatggc 420 tgctcgcctg tgttgccacc tggattctgc gcgggacgtc cttctgctac gtcccttcgg 480 ccctcaatcc agcggacctt ccttcccgcg gcctgctgcc ggctctgcgg cctcttccgc 540 gtcttcgcct tcgccctcag acgagtcgga tctccctttg ggccgcctcc ccgcctg 597 <210> 12 <211> 111 <212> DNA <213> Artificial Sequence <220> <223> Enhancer-1 <400> 12 gggactttcc ggggcggggc acgtggtgca cgggactttc cgtgcacgtg cacgggactt 60 tccgggactt tccgggactt tccgtgcacc acgtggggac tttccgtgca c 111 <210> 13 <211> 252 <212> DNA <213> Artificial Sequence <220> <223> 2 copies of Xenopus leavis beta-globin polyadenylation signal (2xlBGpA) <400> 13 aaccagcctc aagaacaccc gaatggagtc tctaagctac ataataccaa cttacacttt 60 acaaaatgtt gtcccccaaa atgtagccat tcgtatctgc tcctaataaa aagaaagttt 120 cttcacaacc agcctcaaga acacccgaat ggagtctcta agctacataa taccaactta 180 cactttacaa aatgttgtcc cccaaaatgt agccattcgt atctgctcct aataaaaaga 240 aagtttcttc ac 252 <210> 14 <211> 268 <212> DNA <213> Artificial Sequence <220> <223> 2 copies of human beta-globin polyadenylation signal (2huBGpA) <400> 14 gctcgctttc ttgctgtcca atttctatta aaggttcctt tgttccctaa gtccaactac 60 taaactgggg gatattatga agggccttga gcatctggat tctgcctaat aaaaaacatt 120 tattttcatt gcaagctcgc tttcttgctg tccaatttct attaaaggtt cctttgttcc 180 ctaagtccaa ctactaaact gggggatatt atgaagggcc ttgagcatct ggattctgcc 240 taataaaaaa catttatttt cattgcaa 268 <210> 15 <211> 260 <212> DNA <213> Artificial Sequence <220> <223> Hybrid Xenopus leavis and human beta-globin polyadenylation signal (xlhuBGpA) <400> 15 aaccagcctc aagaacaccc gaatggagtc tctaagctac ataataccaa cttacacttt 60 acaaaatgtt gtcccccaaa atgtagccat tcgtatctgc tcctaataaa aagaaagttt 120 cttcacgctc gctttcttgc tgtccaattt ctattaaagg ttcctttgtt ccctaagtcc 180 aactactaaa ctgggggata ttatgaaggg ccttgagcat ctggattctg cctaataaaa 240 aacatttatt ttcattgcaa 260 <210> 16 <211> 372 <212> DNA <213> Artificial Sequence <220> <223> 2xlBGpA-A120 <400> 16 aaccagcctc aagaacaccc gaatggagtc tctaagctac ataataccaa cttacacttt 60 acaaaatgtt gtcccccaaa atgtagccat tcgtatctgc tcctaataaa aagaaagttt 120 cttcacaacc agcctcaaga acacccgaat ggagtctcta agctacataa taccaactta 180 cactttacaa aatgttgtcc cccaaaatgt agccattcgt atctgctcct aataaaaaga 240 aagtttcttc acaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 300 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 360 aaaaaaaaaa aa 372 <210> 17 <211> 388 <212> DNA <213> Artificial Sequence <220> <223> 2huBGpA-A120 <400> 17 gctcgctttc ttgctgtcca atttctatta aaggttcctt tgttccctaa gtccaactac 60 taaactgggg gatattatga agggccttga gcatctggat tctgcctaat aaaaaacatt 120 tattttcatt gcaagctcgc tttcttgctg tccaatttct attaaaggtt cctttgttcc 180 ctaagtccaa ctactaaact gggggatatt atgaagggcc ttgagcatct ggattctgcc 240 taataaaaaa catttatttt cattgcaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 300 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 360 aaaaaaaaaa aaaaaaaaaa aaaaaaaa 388 <210> 18 <211> 380 <212> DNA <213> Artificial Sequence <220> <223> xlhuBGpA-A120 <400> 18 aaccagcctc aagaacaccc gaatggagtc tctaagctac ataataccaa cttacacttt 60 acaaaatgtt gtcccccaaa atgtagccat tcgtatctgc tcctaataaa aagaaagttt 120 cttcacgctc gctttcttgc tgtccaattt ctattaaagg ttcctttgtt ccctaagtcc 180 aactactaaa ctgggggata ttatgaaggg ccttgagcat ctggattctg cctaataaaa 240 aacatttatt ttcattgcaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 300 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 360 aaaaaaaaaa aaaaaaaaaa 380 <210> 19 <211> 7011 <212> DNA <213> Artificial Sequence <220> <223> pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS* <400> 19 ccgggaggta ccgagctctt acgcgtgcta gaattaaagt aacccaatca gcacacaatt 60 gccattatac gcgcgtataa tggactattg tgtgctgata aacctatttc agcatactac 120 gcgcgtagta tgctgaaata ggtgactaga agttcctata ctttctagag aataggaact 180 tcataacttc gtataatgta tgctatacga agttatgggt tactttaatt tggttgctga 240 ctaattgaga tgcatgcttt gcatacttct gcctgctggg gagcctgggg actttccaca 300 cctggttgct gactaattga gatgcatgct ttgcatactt ctgcctgctg gggagcctgg 360 ggactttcca cacccctggg tcgacattga ttattgacta gttattaata gtaatcaatt 420 acggggtcat tagttcatag cccatatatg gagttccgcg ttacataact tacggtaaat 480 ggcccgcctg gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt 540 cccatagtaa cgccaatagg gactttccat tgacgtcaat gggtggagta tttacggtaa 600 actgcccact tggcagtaca tcaagtgtat catatgccaa gtacgccccc tattgacgtc 660 aatgacggta aatggcccgc ctggcattat gcccagtaca tgaccttatg ggactttcct 720 acttggcagt acatctacgt attagtcatc gctattacca tggtcgaggt gagccccacg 780 ttctgcttca ctctccccat ctcccccccc tccccacccc caattttgta tttatttatt 840 ttttaattat tttgtgcagc gatgggggcg gggggggggg gggcgcgcgc caggcggggc 900 ggggcggggc gaggggcggg gcggggcgag gcggaaaggt gcggcggcag ccaatcagag 960 cggcgcgctc cgaaagtttc cttttatggc gaggcggcgg cggcggcggc cctataaaaa 1020 gcgaagcgcg cggcgggcgg gagtcgctgc gttgccttcg ccccgtgccc cgctccgcgc 1080 cgcctcgcgc cgcccgcccc ggctctgact gaccgcgtta ctcccacagg tgagcgggcg 1140 ggacggccct tctcctccgg gctgtaatta gcgcttggtt taatgacggc tcgtttcttt 1200 tctgtggctg cgtgaaagcc ttaaagggct ccgggagggc cctttgtgcg ggggggagcg 1260 gctcgggggg tgcgtgcgtg tgtgtgtgcg tggggagcgc cgcgtgcggc tccgcgctgc 1320 ccggcggctg tgagcgctgc gggcgcggcg cggggctttg tgcgctccgc agtgtgcgcg 1380 aggggagcgc ggccgggggc ggtgccccgc ggtgcggggg gggctgcgag gggaacaaag 1440 gctgcgtgcg gggtgtgtgc gtgggggggt gagcaggggg tgtgggcgcg gcggtcgggc 1500 tgtaaccccc ccctgcaccc ccctccccga gttgctgagc acggcccggc ttcgggtgcg 1560 gggctccgta cggggcgtgg cgcggggctc gccgtgccgg gcggggggtg gcggcaggtg 1620 ggggtgccgg gcggggcggg gccgcctcgg gccggggagg gctcggggga ggggcgcggc 1680 ggcccccgga gcgccggcgg ctgtcgaggc gcggcgagcc gcagccattg ccttttatgg 1740 taatcgtgcg agagggcgca gggacttcct ttgtcccaaa tctgtgcgga gccgaaatct 1800 gggaggcgcc gccgcacccc ctctagcggg cgcggggcga agcggtgcgg cgccggcagg 1860 aaggaaatgg gcggggaggg ccttcgtgcg tcgccgcgcc gccgtcccct tctccctctc 1920 cagcctcggg gctgtccgcg gggggacggc tgccttcggg ggggacgggg cagggcgggg 1980 ttcggcttct ggcgtgtgac cggcggctct agagcctctg ctaaccatgt tcatgccttc 2040 ttctttttcc tacagctcct gggcaacgtg ctggttattg tgctgtctca tcattttggc 2100 aaagaattga ttaattcgag cgaacgcgtc gccaccatga actccttctc cacaagcgcc 2160 ttcggtccag ttgccttctc cctgggcctg ctcctggtgt tgcctgctgc cttccctgcc 2220 ccagtcttca cactcgaaga tttcgttggg gactggcgac agacagccgg ctacaacctg 2280 gaccaagtcc ttgaacaggg aggtgtgtcc agtttgtttc agaatctcgg ggtgtccgta 2340 actccgatcc aaaggattgt cctgagcggt gaaaatgggc tgaagatcga catccatgtc 2400 atcatcccgt atgaaggtct gagcggcgac caaatgggcc agatcgaaaa aatttttaag 2460 gtggtgtacc ctgtggatga tcatcacttt aaggtgatcc tgcactatgg cacactggta 2520 atcgacgggg ttacgccgaa catgatcgac tatttcggac ggccgtatga aggcatcgcc 2580 gtgttcgacg gcaaaaagat cactgtaaca gggaccctgt ggaacggcaa caaaattatc 2640 gacgagcgcc tgatcaaccc cgacggctcc ctgctgttcc gagtaaccat caacggagtg 2700 accggctggc ggctgtgcga acgcattctg gcggctagcg ctactaactt cagcctgctg 2760 aagcaggctg gagacgtgga ggagaaccct ggacctggaa gcggagaggg cagaggaagt 2820 ctgctaacat gcggtgacgt cgaggagaat cctggacctg gatccggaat ggtgagcaag 2880 ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg agctggacgg cgacgtaaac 2940 ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg ccacctacgg caagctgacc 3000 ctgaagttca tctgcaccac cggcaagctg cccgtgccct ggcccaccct cgtgaccacc 3060 ctgacctacg gcgtgcagtg cttcagccgc taccccgacc acatgaagca gcacgacttc 3120 ttcaagtccg ccatgcccga aggctacgtc caggagcgca ccatcttctt caaggacgac 3180 ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg acaccctggt gaaccgcatc 3240 gagctgaagg gcatcgactt caaggaggac ggcaacatcc tggggcacaa gctggagtac 3300 aactacaaca gccacaacgt ctatatcatg gccgacaagc agaagaacgg catcaaggtg 3360 aacttcaaga tccgccacaa catcgaggac ggcagcgtgc agctcgccga ccactaccag 3420 cagaacaccc ccatcggcga cggccccgtg ctgctgcccg acaaccacta cctgagcacc 3480 cagtccgccc tgagcaaaga ccccaacgag aagcgcgatc acatggtcct gctggagttc 3540 gtgaccgccg ccgggatcac tctcggcatg gacgagctgt acaagtaagc ggccgcactc 3600 ctcaggtgca ggctgcctat cagaaggtgg tggctggtgt ggccaatgcc ctggctcaca 3660 aataccactg agatcttttt ccctctgcca aaaattatgg ggacatcatg aagccccttg 3720 agcatctgac ttctggctaa taaaggaaat ttattttcat tgcaatagtg tgttggaatt 3780 ttttgtgtct ctcactcgga aggacatggt gtggaaagtc cccaggctcc ccagcaggca 3840 gaagtatgca aagcatgcat ctcaattagt cagcaaccaa attaaagtaa cccataactt 3900 cgtatagcat acattatacg aagttatgaa gttcctattc tctagaaagt ataggaactt 3960 ctagtcacct atttcagcat actacgcgcg tagtatgctg aaataggttt atcagcacac 4020 aatagtccat tatacgcgcg tataatggca attgtgtgct gattgggtta ctttaattgg 4080 tgtggaaagt ccccaggctc cccagcaggc agaagtatgc aaagcatgca tctcaattag 4140 tcagcaacca tggatccgtc gaccgatgcc cttgagagcc ttcaacccag tcagctcctt 4200 ccggtgggcg cggggcatga ctatcgtcgc cgcacttatg actgtcttct ttatcatgca 4260 actcgtagga caggtgccgg cagcgctctt ccgcttcctc gctcactgac tcgctgcgct 4320 cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca 4380 cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga 4440 accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc 4500 acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg 4560 cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat 4620 acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt 4680 atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc 4740 agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg 4800 acttatcgcc actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg 4860 gtgctacaga gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg 4920 gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg 4980 gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca 5040 gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga 5100 acgaaaactc acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga 5160 tccttttaaa ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt 5220 ctgacagtta ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt 5280 catccatagt tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat 5340 ctggccccag tgctgcaatg ataccgcgag acccacgctc accggctcca gatttatcag 5400 caataaacca gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct 5460 ccatccagtc tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt 5520 tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg 5580 cttcattcag ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca 5640 aaaaagcggt tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt 5700 tatcactcat ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat 5760 gcttttctgt gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac 5820 cgagttgctc ttgcccggcg tcaatacggg ataataccgc gccacatagc agaactttaa 5880 aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt 5940 tgagatccag ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt 6000 tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa 6060 gggcgacacg gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt 6120 atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa 6180 taggggttcc gcgcacattt ccccgaaaag tgccacctga cgcgccctgt agcggcgcat 6240 taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc tacacttgcc agcgccctag 6300 cgcccgctcc tttcgctttc ttcccttcct ttctcgccac gttcgccggc tttccccgtc 6360 aagctctaaa tcgggggctc cctttagggt tccgatttag tgctttacgg cacctcgacc 6420 ccaaaaaact tgattagggt gatggttcac gtagtgggcc atcgccctga tagacggttt 6480 ttcgcccttt gacgttggag tccacgttct ttaatagtgg actcttgttc caaactggaa 6540 caacactcaa ccctatctcg gtctattctt ttgatttata agggattttg ccgatttcgg 6600 cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaatttt aacaaaatat 6660 taacgcttac aatttgccat tcgccattca ggctgcgcaa ctgttgggaa gggcgatcgg 6720 tgcgggcctc ttcgctatta cgccagccca agctaccatg ataagtaagt aatattaagg 6780 tacgtggagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 6840 aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 6900 agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 6960 ttgtccaaac tcatcaatgt atcttatggt actgtaactg agctaacata a 7011 <210> 20 <211> 6991 <212> DNA <213> Artificial Sequence <220> <223> pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA <400> 20 gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagc 900 gtttaaactt aagcttggta ccgagctcgg atccctgcct tctccctcct gtgagtttgg 960 taagtcactg actgtctatg cctgggaaag ggtgggcagg agatggggca gtgcaggaaa 1020 agtggcacta tgaaccctgc agccctagga atgcatctag acaattgtac taaccttctt 1080 ctctttcctc tcctgacagg ttggtgtaca gtagcttcca ctcctgccac catgaactcc 1140 ttctccacaa gcgccttcgg tccagttgcc ttctccctgg gcctgctcct ggtgttgcct 1200 gctgccttcc ctgccccagt cttcacactc gaagatttcg ttggggactg gcgacagaca 1260 gccggctaca acctggacca agtccttgaa cagggaggtg tgtccagttt gtttcagaat 1320 ctcggggtgt ccgtaactcc gatccaaagg attgtcctga gcggtgaaaa tgggctgaag 1380 atcgacatcc atgtcatcat cccgtatgaa ggtctgagcg gcgaccaaat gggccagatc 1440 gaaaaaattt ttaaggtggt gtaccctgtg gatgatcatc actttaaggt gatcctgcac 1500 tatggcacac tggtaatcga cggggttacg ccgaacatga tcgactattt cggacggccg 1560 tatgaaggca tcgccgtgtt cgacggcaaa aagatcactg taacagggac cctgtggaac 1620 ggcaacaaaa ttatcgacga gcgcctgatc aaccccgacg gctccctgct gttccgagta 1680 accatcaacg gagtgaccgg ctggcggctg tgcgaacgca ttctggcgga attctgcaga 1740 tatccagcac agtggcggcc gctcgagtct agaggaagcg gagctactaa cttcagcctg 1800 ctgaagcagg ctggagacgt ggaggagaac cctggaccta tgagcaaggg cgaggagctg 1860 ttcaccgggg tggtgcccat cctggtcgag ctggacggcg acgtaaacgg ccacaagttc 1920 agcgtgtccg gcgagggcga gggcgatgcc acctacggca agctgaccct gaagttcatc 1980 tgcaccaccg gcaagctgcc cgtgccctgg cccaccctcg tgaccaccct gacctacggc 2040 gtgcagtgct tcagccgcta ccccgaccac atgaagcagc acgacttctt caagtccgcc 2100 atgcccgaag gctacgtcca ggagcgcacc atcttcttca aggacgacgg caactacaag 2160 acccgcgccg aggtgaagtt cgagggcgac accctggtga accgcatcga gctgaagggc 2220 atcgacttca aggaggacgg caacatcctg gggcacaagc tggagtacaa ctacaacagc 2280 cacaacgtct atatcatggc cgacaagcag aagaacggca tcaaggtgaa cttcaagatc 2340 cgccacaaca tcgaggacgg cagcgtgcag ctcgccgacc actaccagca gaacaccccc 2400 atcggcgacg gccccgtgct gctgcccgac aaccactacc tgagcaccca gtccgccctg 2460 agcaaagacc ccaacgagaa gcgcgatcac atggtcctgc tggagttcgt gaccgccgcc 2520 gggatcactc acggcatgga cgagctgtac aagtaagggc ccgtttaaac ccgctgatca 2580 gcctcgactg tgccttctag ttgccagcca tctgttgttt gcccctcccc cgtgccttcc 2640 ttgaccctgg aaggtgccac tcccactgtc ctttcctaat aaaatgagga aattgcatcg 2700 cattgtctga gtaggtgtca ttctattctg gggggtgggg tggggcagga cagcaagggg 2760 gaggattggg aagacaatag caggcatgct ggggatgcgg tgggctctat ggcttctgag 2820 gcggaaagaa ccagctgggg ctctaggggg tatccccacg cgccctgtag cggcgcatta 2880 agcgcggcgg gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg 2940 cccgctcctt tcgctttctt cccttccttt ctcgccacgt tcgccggctt tccccgtcaa 3000 gctctaaatc gggggctccc tttagggttc cgatttagtg ctttacggca cctcgacccc 3060 aaaaaacttg attagggtga tggttcacgt agtgggccat cgccctgata gacggttttt 3120 cgccctttga cgttggagtc cacgttcttt aatagtggac tcttgttcca aactggaaca 3180 acactcaacc ctatctcggt ctattctttt gatttataag ggattttgcc gatttcggcc 3240 tattggttaa aaaatgagct gatttaacaa aaatttaacg cgaattaatt ctgtggaatg 3300 tgtgtcagtt agggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca 3360 tgcatctcaa ttagtcagca accaggtgtg gaaagtcccc aggctcccca gcaggcagaa 3420 gtatgcaaag catgcatctc aattagtcag caaccatagt cccgccccta actccgccca 3480 tcccgcccct aactccgccc agttccgccc attctccgcc ccatggctga ctaatttttt 3540 ttatttatgc agaggccgag gccgcctctg cctctgagct attccagaag tagtgaggag 3600 gcttttttgg aggcctaggc ttttgcaaaa agctcccggg agcttgtata tccattttcg 3660 gatctgatca agagacagga tgaggatcgt ttcgcatgat tgaacaagat ggattgcacg 3720 caggttctcc ggccgcttgg gtggagaggc tattcggcta tgactgggca caacagacaa 3780 tcggctgctc tgatgccgcc gtgttccggc tgtcagcgca ggggcgcccg gttctttttg 3840 tcaagaccga cctgtccggt gccctgaatg aactgcagga cgaggcagcg cggctatcgt 3900 ggctggccac gacgggcgtt ccttgcgcag ctgtgctcga cgttgtcact gaagcgggaa 3960 gggactggct gctattgggc gaagtgccgg ggcaggatct cctgtcatct caccttgctc 4020 ctgccgagaa agtatccatc atggctgatg caatgcggcg gctgcatacg cttgatccgg 4080 ctacctgccc attcgaccac caagcgaaac atcgcatcga gcgagcacgt actcggatgg 4140 aagccggtct tgtcgatcag gatgatctgg acgaagagca tcaggggctc gcgccagccg 4200 aactgttcgc caggctcaag gcgcgcatgc ccgacggcga ggatctcgtc gtgacccatg 4260 gcgatgcctg cttgccgaat atcatggtgg aaaatggccg cttttctgga ttcatcgact 4320 gtggccggct gggtgtggcg gaccgctatc aggacatagc gttggctacc cgtgatattg 4380 ctgaagagct tggcggcgaa tgggctgacc gcttcctcgt gctttacggt atcgccgctc 4440 ccgattcgca gcgcatcgcc ttctatcgcc ttcttgacga gttcttctga gcgggactct 4500 ggggttcgaa atgaccgacc aagcgacgcc caacctgcca tcacgagatt tcgattccac 4560 cgccgccttc tatgaaaggt tgggcttcgg aatcgttttc cgggacgccg gctggatgat 4620 cctccagcgc ggggatctca tgctggagtt cttcgcccac cccaacttgt ttattgcagc 4680 ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc 4740 actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg tctgtatacc 4800 gtcgacctct agctagagct tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg 4860 ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta aagcctgggg 4920 tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg ctttccagtc 4980 gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt 5040 gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct 5100 gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga 5160 taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc 5220 cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg 5280 ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg 5340 aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt 5400 tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt 5460 gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg 5520 cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact 5580 ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt 5640 cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta tctgcgctct 5700 gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac 5760 cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc 5820 tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg 5880 ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta 5940 aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca 6000 atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc 6060 ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc 6120 tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc 6180 agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat 6240 taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt 6300 tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc 6360 cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag 6420 ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt 6480 tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac 6540 tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg 6600 cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat 6660 tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc 6720 gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc 6780 tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa 6840 atgttgaata ctcatactct tcctttttca atattattga agcatttatc agggttattg 6900 tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg 6960 cacatttccc cgaaaagtgc cacctgacgt c 6991 <210> 21 <211> 4555 <212> DNA <213> Artificial Sequence <220> <223> pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS* <400> 21 taaagtaacc caatcagcac acaattgcca ttatacgcgc gtataatgga ctattgtgtg 60 ctgataaacc tatttcagca tactacgcgc gtagtatgct gaaataggtg actagaagtt 120 cctatacttt ctagagaata ggaacttcat aacttcgtat aatgtatgct atacgaagtt 180 atgggttact ttaatttggt tgctgactaa ttgagatgca tgctttgcat acttctgcct 240 gctggggagc ctggggactt tccacacctg gttgctgact aattgagatg catgctttgc 300 atacttctgc ctgctgggga gcctggggac tttccacacc cctgggtcga cattgattat 360 tgactagtta ttaatagtaa tcaattacgg ggtcattagt tcatagccca tatatggagt 420 tccgcgttac ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc 480 cattgacgtc aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac 540 gtcaatgggt ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata 600 tgccaagtac gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc 660 agtacatgac cttatgggac tttcctactt ggcagtacat ctacgtatta gtcatcgcta 720 ttaccatggt cgaggtgagc cccacgttct gcttcactct ccccatctcc cccccctccc 780 cacccccaat tttgtattta tttatttttt aattattttg tgcagcgatg ggggcggggg 840 gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg ggcgaggcgg 900 aaaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt tatggcgagg 960 cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcgggagt cgctgcgttg 1020 ccttcgcccc gtgccccgct ccgcgccgcc tcgcgccgcc cgccccggct ctgactgacc 1080 gcgttactcc cacaggtgag cgggcgggac ggcccttctc ctccgggctg taattagcgc 1140 ttggtttaat gacggctcgt ttcttttctg tggctgcgtg aaagccttaa agggctccgg 1200 gagggccctt tgtgcggggg ggagcggctc ggggggtgcg tgcgtgtgtg tgtgcgtggg 1260 gagcgccgcg tgcggctccg cgctgcccgg cggctgtgag cgctgcgggc gcggcgcggg 1320 gctttgtgcg ctccgcagtg tgcgcgaggg gagcgcggcc gggggcggtg ccccgcggtg 1380 cggggggggc tgcgagggga acaaaggctg cgtgcggggt gtgtgcgtgg gggggtgagc 1440 agggggtgtg ggcgcggcgg tcgggctgta acccccccct gcacccccct ccccgagttg 1500 ctgagcacgg cccggcttcg ggtgcggggc tccgtacggg gcgtggcgcg gggctcgccg 1560 tgccgggcgg ggggtggcgg caggtggggg tgccgggcgg ggcggggccg cctcgggccg 1620 gggagggctc gggggagggg cgcggcggcc cccggagcgc cggcggctgt cgaggcgcgg 1680 cgagccgcag ccattgcctt ttatggtaat cgtgcgagag ggcgcaggga cttcctttgt 1740 cccaaatctg tgcggagccg aaatctggga ggcgccgccg caccccctct agcgggcgcg 1800 gggcgaagcg gtgcggcgcc ggcaggaagg aaatgggcgg ggagggcctt cgtgcgtcgc 1860 cgcgccgccg tccccttctc cctctccagc ctcggggctg tccgcggggg gacggctgcc 1920 ttcggggggg acggggcagg gcggggttcg gcttctggcg tgtgaccggc ggctctagag 1980 cctctgctaa ccatgttcat gccttcttct ttttcctaca gctcctgggc aacgtgctgg 2040 ttattgtgct gtctcatcat tttggcaaag aattgattaa ttcgagcgaa cgcgtcgcca 2100 ccatgaactc cttctccaca agcgccttcg gtccagttgc cttctccctg ggcctgctcc 2160 tggtgttgcc tgctgccttc cctgccccag tcttcacact cgaagatttc gttggggact 2220 ggcgacagac agccggctac aacctggacc aagtccttga acagggaggt gtgtccagtt 2280 tgtttcagaa tctcggggtg tccgtaactc cgatccaaag gattgtcctg agcggtgaaa 2340 atgggctgaa gatcgacatc catgtcatca tcccgtatga aggtctgagc ggcgaccaaa 2400 tgggccagat cgaaaaaatt tttaaggtgg tgtaccctgt ggatgatcat cactttaagg 2460 tgatcctgca ctatggcaca ctggtaatcg acggggttac gccgaacatg atcgactatt 2520 tcggacggcc gtatgaaggc atcgccgtgt tcgacggcaa aaagatcact gtaacaggga 2580 ccctgtggaa cggcaacaaa attatcgacg agcgcctgat caaccccgac ggctccctgc 2640 tgttccgagt aaccatcaac ggagtgaccg gctggcggct gtgcgaacgc attctggcgg 2700 ctagcgctac taacttcagc ctgctgaagc aggctggaga cgtggaggag aaccctggac 2760 ctggaagcgg agagggcaga ggaagtctgc taacatgcgg tgacgtcgag gagaatcctg 2820 gacctggatc cggaatggtg agcaagggcg aggagctgtt caccggggtg gtgcccatcc 2880 tggtcgagct ggacggcgac gtaaacggcc acaagttcag cgtgtccggc gagggcgagg 2940 gcgatgccac ctacggcaag ctgaccctga agttcatctg caccaccggc aagctgcccg 3000 tgccctggcc caccctcgtg accaccctga cctacggcgt gcagtgcttc agccgctacc 3060 ccgaccacat gaagcagcac gacttcttca agtccgccat gcccgaaggc tacgtccagg 3120 agcgcaccat cttcttcaag gacgacggca actacaagac ccgcgccgag gtgaagttcg 3180 agggcgacac cctggtgaac cgcatcgagc tgaagggcat cgacttcaag gaggacggca 3240 acatcctggg gcacaagctg gagtacaact acaacagcca caacgtctat atcatggccg 3300 acaagcagaa gaacggcatc aaggtgaact tcaagatccg ccacaacatc gaggacggca 3360 gcgtgcagct cgccgaccac taccagcaga acacccccat cggcgacggc cccgtgctgc 3420 tgcccgacaa ccactacctg agcacccagt ccgccctgag caaagacccc aacgagaagc 3480 gcgatcacat ggtcctgctg gagttcgtga ccgccgccgg gatcactctc ggcatggacg 3540 agctgtacaa gtaaaatcaa cctctggatt acaaaatttg tgaaagattg actggtattc 3600 ttaactatgt tgctcctttt acgctatgtg gatacgctgc tttaatgcct ttgtatcatg 3660 ctattgcttc ccgtatggct ttcattttct cctccttgta taaatcctgg ttgctgtctc 3720 tttatgagga gttgtggccc gttgtcaggc aacgtggcgt ggtgtgcact gtgtttgctg 3780 acgcaacccc cactggttgg ggcattgcca ccacctgtca gctcctttcc gggactttcg 3840 ctttccccct ccctattgcc acggcggaac tcatcgccgc ctgccttgcc cgctgctgga 3900 caggggctcg gctgttgggc actgacaatt ccgtggtgtt gtcggggaaa tcatcgtcct 3960 ttccttggct gctcgcctgt gttgccacct ggattctgcg cgggacgtcc ttctgctacg 4020 tcccttcggc cctcaatcca gcggaccttc cttcccgcgg cctgctgccg gctctgcggc 4080 ctcttccgcg tcttcgcctt cgccctcaga cgagtcggat ctccctttgg gccgcctccc 4140 cgcaataaag gaaatttatt ttcattgcaa tagtgtgttg gaattttttg tgtctctcac 4200 tcggaaggac atggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca 4260 tgcatctcaa ttagtcagca accaaattaa agtaacccat aacttcgtat agcatacatt 4320 atacgaagtt atgaagttcc tattctctag aaagtatagg aacttctagt cacctatttc 4380 agcatactac gcgcgtagta tgctgaaata ggtttatcag cacacaatag tccattatac 4440 gcgcgtataa tggcaattgt gtgctgattg ggttacttta attggtgtgg aaagtcccca 4500 ggctccccag caggcagaag tatgcaaagc atgcatctca attagtcagc aacca 4555 <210> 22 <211> 3610 <212> DNA <213> Artificial Sequence <220> <223> pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS* <400> 22 taaagtaacc caatcagcac acaattgcca ttatacgcgc gtataatgga ctattgtgtg 60 ctgataaacc tatttcagca tactacgcgc gtagtatgct gaaataggtg actagaagtt 120 cctatacttt ctagagaata ggaacttcat aacttcgtat aatgtatgct atacgaagtt 180 atgggttact ttaatttggt tgctgactaa ttgagatgca tgctttgcat acttctgcct 240 gctggggagc ctggggactt tccacacctg gttgctgact aattgagatg catgctttgc 300 atacttctgc ctgctgggga gcctggggac tttccacacc cctgggtcga cgacattgat 360 tattgactag ttattaatag taatcaatta cggggtcatt agttcatagc ccatatatgg 420 agttccgcgt tacataactt acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc 480 gcccattgac gtcaataatg acgtatgttc ccatagtaac gccaataggg actttccatt 540 gacgtcaatg ggtggagtat ttacggtaaa ctgcccactt ggcagtacat caagtgtatc 600 atatgccaag tacgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg 660 cccagtacat gaccttatgg gactttccta cttggcagta catctacgta ttagtcatcg 720 ctattaccat ggtgatgcgg ttttggcagt acatcaatgg gcgtggatag cggtttgact 780 cacggggatt tccaagtctc caccccattg acgtcaatgg gagtttgttt tggcaccaaa 840 atcaacggga ctttccaaaa tgtcgtaaca actccgcccc attgacgcaa atgggcggta 900 ggcgtgtacg gtgggaggtc tatataagca gagctctgcc ttctccctcc tgtgagtttg 960 gtaagtcgac gggccgggcc tgggccgggt ccgggccggg tcgttggatc cccactacag 1020 cccgatactc aagcttgacg aattcgagta tccaaggtag tggactagtg tgacgctgct 1080 gacccctttc tttcccttct gcaggttggt gtacagtagc ttccaaattg attaattcga 1140 gcgaacgcgt cgccaccatg aactccttct ccacaagcgc cttcggtcca gttgccttct 1200 ccctgggcct gctcctggtg ttgcctgctg ccttccctgc cccagtcttc acactcgaag 1260 atttcgttgg ggactggcga cagacagccg gctacaacct ggaccaagtc cttgaacagg 1320 gaggtgtgtc cagtttgttt cagaatctcg gggtgtccgt aactccgatc caaaggattg 1380 tcctgagcgg tgaaaatggg ctgaagatcg acatccatgt catcatcccg tatgaaggtc 1440 tgagcggcga ccaaatgggc cagatcgaaa aaatttttaa ggtggtgtac cctgtggatg 1500 atcatcactt taaggtgatc ctgcactatg gcacactggt aatcgacggg gttacgccga 1560 acatgatcga ctatttcgga cggccgtatg aaggcatcgc cgtgttcgac ggcaaaaaga 1620 tcactgtaac agggaccctg tggaacggca acaaaattat cgacgagcgc ctgatcaacc 1680 ccgacggctc cctgctgttc cgagtaacca tcaacggagt gaccggctgg cggctgtgcg 1740 aacgcattct ggcggctagc gctactaact tcagcctgct gaagcaggct ggagacgtgg 1800 aggagaaccc tggacctgga agcggagagg gcagaggaag tctgctaaca tgcggtgacg 1860 tcgaggagaa tcctggacct ggatccggaa tggtgagcaa gggcgaggag ctgttcaccg 1920 gggtggtgcc catcctggtc gagctggacg gcgacgtaaa cggccacaag ttcagcgtgt 1980 ccggcgaggg cgagggcgat gccacctacg gcaagctgac cctgaagttc atctgcacca 2040 ccggcaagct gcccgtgccc tggcccaccc tcgtgaccac cctgacctac ggcgtgcagt 2100 gcttcagccg ctaccccgac cacatgaagc agcacgactt cttcaagtcc gccatgcccg 2160 aaggctacgt ccaggagcgc accatcttct tcaaggacga cggcaactac aagacccgcg 2220 ccgaggtgaa gttcgagggc gacaccctgg tgaaccgcat cgagctgaag ggcatcgact 2280 tcaaggagga cggcaacatc ctggggcaca agctggagta caactacaac agccacaacg 2340 tctatatcat ggccgacaag cagaagaacg gcatcaaggt gaacttcaag atccgccaca 2400 acatcgagga cggcagcgtg cagctcgccg accactacca gcagaacacc cccatcggcg 2460 acggccccgt gctgctgccc gacaaccact acctgagcac ccagtccgcc ctgagcaaag 2520 accccaacga gaagcgcgat cacatggtcc tgctggagtt cgtgaccgcc gccgggatca 2580 ctctcggcat ggacgagctg tacaagtaaa atcaacctct ggattacaaa atttgtgaaa 2640 gattgactgg tattcttaac tatgttgctc cttttacgct atgtggatac gctgctttaa 2700 tgcctttgta tcatgctatt gcttcccgta tggctttcat tttctcctcc ttgtataaat 2760 cctggttgct gtctctttat gaggagttgt ggcccgttgt caggcaacgt ggcgtggtgt 2820 gcactgtgtt tgctgacgca acccccactg gttggggcat tgccaccacc tgtcagctcc 2880 tttccgggac tttcgctttc cccctcccta ttgccacggc ggaactcatc gccgcctgcc 2940 ttgcccgctg ctggacaggg gctcggctgt tgggcactga caattccgtg gtgttgtcgg 3000 ggaaatcatc gtcctttcct tggctgctcg cctgtgttgc cacctggatt ctgcgcggga 3060 cgtccttctg ctacgtccct tcggccctca atccagcgga ccttccttcc cgcggcctgc 3120 tgccggctct gcggcctctt ccgcgtcttc gccttcgccc tcagacgagt cggatctccc 3180 tttgggccgc ctccccgcaa taaaggaaat ttattttcat tgcaatagtg tgttggaatt 3240 ttttgtgtct ctcactcgga aggacatggt gtggaaagtc cccaggctcc ccagcaggca 3300 gaagtatgca aagcatgcat ctcaattagt cagcaaccaa attaaagtaa cccataactt 3360 cgtatagcat acattatacg aagttatgaa gttcctattc tctagaaagt ataggaactt 3420 ctagtcacct atttcagcat actacgcgcg tagtatgctg aaataggttt atcagcacac 3480 aatagtccat tatacgcgcg tataatggca attgtgtgct gattgggtta ctttaattgg 3540 tgtggaaagt ccccaggctc cccagcaggc agaagtatgc aaagcatgca tctcaattag 3600 tcagcaacca 3610 <210> 23 <211> 4092 <212> DNA <213> Artificial Sequence <220> <223> pGL2-SS*-CMV-UTR2-SecNLuc-2A-eGFP-WPRE-BGpA-SS* <400> 23 aattaaagta acccaatcag cacacaattg ccattatacg cgcgtataat ggactattgt 60 gtgctgataa acctatttca gcatactacg cgcgtagtat gctgaaatag gtgactagaa 120 gttcctatac tttctagaga ataggaactt cataacttcg tataatgtat gctatacgaa 180 gttatgggtt actttaattt ggttgctgac taattgagat gcatgctttg catacttctg 240 cctgctgggg agcctgggga ctttccacac ctggttgctg actaattgag atgcatgctt 300 tgcatacttc tgcctgctgg ggagcctggg gactttccac acccctgggt cgacattgat 360 tattgactag ttattaatag taatcaatta cggggtcatt agttcatagc ccatatatgg 420 agttccgcgt tacataactt acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc 480 gcccattgac gtcaataatg acgtatgttc ccatagtaac gccaataggg actttccatt 540 gacgtcaatg ggtggagtat ttacggtaaa ctgcccactt ggcagtacat caagtgtatc 600 atatgccaag tacgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg 660 cccagtacat gaccttatgg gactttccta cttggcagta catctacgta ttagtcatcg 720 ctattaccat ggtgatgcgg ttttggcagt acatcaatgg gcgtggatag cggtttgact 780 cacggggatt tccaagtctc caccccattg acgtcaatgg gagtttgttt tggcaccaaa 840 atcaacggga ctttccaaaa tgtcgtaaca actccgcccc attgacgcaa atgggcggta 900 ggcgtgtacg gtgggaggtc tatataagca gagctattgg gatcttcaca cagcaggtaa 960 ggttgcgggc cgggcctggg ccgggtccgg gccgggtatc catagctgat tggtctaaaa 1020 tgagatacat caacgctcct ccatgttttt tgttttcttt ttaaatgaaa aactttattt 1080 tttaagagga gtttcaggtt catagcaaaa ttgagaggaa ggtacattca agctgaggaa 1140 gttttcctct attcctagtt tactgagaga ttgcatcatg aatgggtgtt aaattttgtc 1200 aaatgctttt tctgtgtcta tcaatatgac catgtgattt tcttctttaa cctgttgatg 1260 ggacaaatta cgttaattga ttttcaaacg ttgaaccacc cttacatatc tggaataaat 1320 tctacttggt tgtggtgtat attttttgat acattcttgg attctttttg ctaatatttt 1380 gttgaaaatg tttgtatctt tgttcatgag agatattggt ctgttgtttt cttttcttgt 1440 aatgtcattt tctagttccg gtattaaggt aatgctggcc tagttgaatg atttaggaag 1500 tattccctct gcttctgtct tctgaaagag attgtagaaa gttgatacaa tttttttttc 1560 tttaaatatc ttgatagccg cactgacccc tggtgttgct tttttttttt aggccgcaag 1620 ctgaagcgtg tccgccacca tgaactcctt ctccacaagc gccttcggtc cagttgcctt 1680 ctccctgggc ctgctcctgg tgttgcctgc tgccttccct gccccagtct tcacactcga 1740 agatttcgtt ggggactggc gacagacagc cggctacaac ctggaccaag tccttgaaca 1800 gggaggtgtg tccagtttgt ttcagaatct cggggtgtcc gtaactccga tccaaaggat 1860 tgtcctgagc ggtgaaaatg ggctgaagat cgacatccat gtcatcatcc cgtatgaagg 1920 tctgagcggc gaccaaatgg gccagatcga aaaaattttt aaggtggtgt accctgtgga 1980 tgatcatcac tttaaggtga tcctgcacta tggcacactg gtaatcgacg gggttacgcc 2040 gaacatgatc gactatttcg gacggccgta tgaaggcatc gccgtgttcg acggcaaaaa 2100 gatcactgta acagggaccc tgtggaacgg caacaaaatt atcgacgagc gcctgatcaa 2160 ccccgacggc tccctgctgt tccgagtaac catcaacgga gtgaccggct ggcggctgtg 2220 cgaacgcatt ctggcggcta gcgctactaa cttcagcctg ctgaagcagg ctggagacgt 2280 ggaggagaac cctggacctg gaagcggaga gggcagagga agtctgctaa catgcggtga 2340 cgtcgaggag aatcctggac ctggatccgg aatggtgagc aagggcgagg agctgttcac 2400 cggggtggtg cccatcctgg tcgagctgga cggcgacgta aacggccaca agttcagcgt 2460 gtccggcgag ggcgagggcg atgccaccta cggcaagctg accctgaagt tcatctgcac 2520 caccggcaag ctgcccgtgc cctggcccac cctcgtgacc accctgacct acggcgtgca 2580 gtgcttcagc cgctaccccg accacatgaa gcagcacgac ttcttcaagt ccgccatgcc 2640 cgaaggctac gtccaggagc gcaccatctt cttcaaggac gacggcaact acaagacccg 2700 cgccgaggtg aagttcgagg gcgacaccct ggtgaaccgc atcgagctga agggcatcga 2760 cttcaaggag gacggcaaca tcctggggca caagctggag tacaactaca acagccacaa 2820 cgtctatatc atggccgaca agcagaagaa cggcatcaag gtgaacttca agatccgcca 2880 caacatcgag gacggcagcg tgcagctcgc cgaccactac cagcagaaca cccccatcgg 2940 cgacggcccc gtgctgctgc ccgacaacca ctacctgagc acccagtccg ccctgagcaa 3000 agaccccaac gagaagcgcg atcacatggt cctgctggag ttcgtgaccg ccgccgggat 3060 cactctcggc atggacgagc tgtacaagta aaatcaacct ctggattaca aaatttgtga 3120 aagattgact ggtattctta actatgttgc tccttttacg ctatgtggat acgctgcttt 3180 aatgcctttg tatcatgcta ttgcttcccg tatggctttc attttctcct ccttgtataa 3240 atcctggttg ctgtctcttt atgaggagtt gtggcccgtt gtcaggcaac gtggcgtggt 3300 gtgcactgtg tttgctgacg caacccccac tggttggggc attgccacca cctgtcagct 3360 cctttccggg actttcgctt tccccctccc tattgccacg gcggaactca tcgccgcctg 3420 ccttgcccgc tgctggacag gggctcggct gttgggcact gacaattccg tggtgttgtc 3480 ggggaaatca tcgtcctttc cttggctgct cgcctgtgtt gccacctgga ttctgcgcgg 3540 gacgtccttc tgctacgtcc cttcggccct caatccagcg gaccttcctt cccgcggcct 3600 gctgccggct ctgcggcctc ttccgcgtct tcgccttcgc cctcagacga gtcggatctc 3660 cctttgggcc gcctccccgc aataaaggaa atttattttc attgcaatag tgtgttggaa 3720 ttttttgtgt ctctcactcg gaaggacatg gtgtggaaag tccccaggct ccccagcagg 3780 cagaagtatg caaagcatgc atctcaatta gtcagcaacc aaattaaagt aacccataac 3840 ttcgtatagc atacattata cgaagttatg aagttcctat tctctagaaa gtataggaac 3900 ttctagtcac ctatttcagc atactacgcg cgtagtatgc tgaaataggt ttatcagcac 3960 acaatagtcc attatacgcg cgtataatgg caattgtgtg ctgattgggt tactttaatt 4020 ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt 4080 agtcagcaac ca 4092 <210> 24 <211> 6249 <212> DNA <213> Artificial Sequence <220> <223> SS*-CMV-UTR1-SecNLuc-2A-eGFP-3'UTR[2huBGpA-A120]-SS* <400> 24 cccgggaggt accgagctct tacgcgtgct agaattaaag taacccaatc agcacacaat 60 tgccattata cgcgcgtata atggactatt gtgtgctgat aaacctattt cagcatacta 120 cgcgcgtagt atgctgaaat aggtgactag aagttcctat actttctaga gaataggaac 180 ttcataactt cgtataatgt atgctatacg aagttatggg ttactttaat ttggttgctg 240 actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 300 acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 360 gggactttcc acacccctgg gtcgacgaca ttgattattg actagttatt aatagtaatc 420 aattacgggg tcattagttc atagcccata tatggagttc cgcgttacat aacttacggt 480 aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta 540 tgttcccata gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg 600 gtaaactgcc cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga 660 cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt 720 tcctacttgg cagtacatct acgtattagt catcgctatt accatggtga tgcggttttg 780 gcagtacatc aatgggcgtg gatagcggtt tgactcacgg ggatttccaa gtctccaccc 840 cattgacgtc aatgggagtt tgttttggca ccaaaatcaa cgggactttc caaaatgtcg 900 taacaactcc gccccattga cgcaaatggg cggtaggcgt gtacggtggg aggtctatat 960 aagcagagct ctgccttctc cctcctgtga gtttggtaag tcgacgggcc gggcctgggc 1020 cgggtccggg ccgggtcgtt ggatccccac tacagcccga tactcaagct tgacgaattc 1080 gagtatccaa ggtagtggac tagtgtgacg ctgctgaccc ctttctttcc cttctgcagg 1140 ttggtgtaca gtagcttcca aattgattaa ttcgagcgaa cgcgtcgcca ccatgaactc 1200 cttctccaca agcgccttcg gtccagttgc cttctccctg ggcctgctcc tggtgttgcc 1260 tgctgccttc cctgccccag tcttcacact cgaagatttc gttggggact ggcgacagac 1320 agccggctac aacctggacc aagtccttga acagggaggt gtgtccagtt tgtttcagaa 1380 tctcggggtg tccgtaactc cgatccaaag gattgtcctg agcggtgaaa atgggctgaa 1440 gatcgacatc catgtcatca tcccgtatga aggtctgagc ggcgaccaaa tgggccagat 1500 cgaaaaaatt tttaaggtgg tgtaccctgt ggatgatcat cactttaagg tgatcctgca 1560 ctatggcaca ctggtaatcg acggggttac gccgaacatg atcgactatt tcggacggcc 1620 gtatgaaggc atcgccgtgt tcgacggcaa aaagatcact gtaacaggga ccctgtggaa 1680 cggcaacaaa attatcgacg agcgcctgat caaccccgac ggctccctgc tgttccgagt 1740 aaccatcaac ggagtgaccg gctggcggct gtgcgaacgc attctggcgg ctagcgctac 1800 taacttcagc ctgctgaagc aggctggaga cgtggaggag aaccctggac ctggaagcgg 1860 agagggcaga ggaagtctgc taacatgcgg tgacgtcgag gagaatcctg gacctggatc 1920 cggaatggtg agcaagggcg aggagctgtt caccggggtg gtgcccatcc tggtcgagct 1980 ggacggcgac gtaaacggcc acaagttcag cgtgtccggc gagggcgagg gcgatgccac 2040 ctacggcaag ctgaccctga agttcatctg caccaccggc aagctgcccg tgccctggcc 2100 caccctcgtg accaccctga cctacggcgt gcagtgcttc agccgctacc ccgaccacat 2160 gaagcagcac gacttcttca agtccgccat gcccgaaggc tacgtccagg agcgcaccat 2220 cttcttcaag gacgacggca actacaagac ccgcgccgag gtgaagttcg agggcgacac 2280 cctggtgaac cgcatcgagc tgaagggcat cgacttcaag gaggacggca acatcctggg 2340 gcacaagctg gagtacaact acaacagcca caacgtctat atcatggccg acaagcagaa 2400 gaacggcatc aaggtgaact tcaagatccg ccacaacatc gaggacggca gcgtgcagct 2460 cgccgaccac taccagcaga acacccccat cggcgacggc cccgtgctgc tgcccgacaa 2520 ccactacctg agcacccagt ccgccctgag caaagacccc aacgagaagc gcgatcacat 2580 ggtcctgctg gagttcgtga ccgccgccgg gatcactctc ggcatggacg agctgtacaa 2640 gtaagctcgc tttcttgctg tccaatttct attaaaggtt cctttgttcc ctaagtccaa 2700 ctactaaact gggggatatt atgaagggcc ttgagcatct ggattctgcc taataaaaaa 2760 catttatttt cattgcaagc tcgctttctt gctgtccaat ttctattaaa ggttcctttg 2820 ttccctaagt ccaactacta aactggggga tattatgaag ggccttgagc atctggattc 2880 tgcctaataa aaaacattta ttttcattgc aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2940 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3000 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aactcggaag gacatggtgt ggaaagtccc 3060 caggctcccc agcaggcaga agtatgcaaa gcatgcatct caattagtca gcaaccaggt 3120 gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat ctcaattagt 3180 cagcaaccaa attaaagtaa cccataactt cgtatagcat acattatacg aagttatgaa 3240 gttcctattc tctagaaagt ataggaactt ctagtcacct atttcagcat actacgcgcg 3300 tagtatgctg aaataggttt atcagcacac aatagtccat tatacgcgcg tataatggca 3360 attgtgtgct gattgggtta ctttaatttg gatccgtcga ccgatgccct tgagagcctt 3420 caacccagtc agctccttcc ggtgggcgcg gggcatgact atcgtcgccg cacttatgac 3480 tgtcttcttt atcatgcaac tcgtaggaca ggtgccggca gcgctcttcc gcttcctcgc 3540 tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 3600 cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 3660 gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 3720 gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 3780 gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 3840 ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 3900 atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 3960 tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 4020 ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca 4080 gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca 4140 ctagaagaac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag 4200 ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 4260 agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 4320 ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg agattatcaa 4380 aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca atctaaagta 4440 tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca cctatctcag 4500 cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag ataactacga 4560 tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac ccacgctcac 4620 cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc agaagtggtc 4680 ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct agagtaagta 4740 gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac 4800 gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg cgagttacat 4860 gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc gttgtcagaa 4920 gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg 4980 tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag 5040 aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc 5100 cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct 5160 caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat 5220 cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg 5280 ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatactc ttcctttttc 5340 aatattattg aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta 5400 tttagaaaaa taaacaaata ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg 5460 cgccctgtag cggcgcatta agcgcggcgg gtgtggtggt tacgcgcagc gtgaccgcta 5520 cacttgccag cgccctagcg cccgctcctt tcgctttctt cccttccttt ctcgccacgt 5580 tcgccggctt tccccgtcaa gctctaaatc gggggctccc tttagggttc cgatttagtg 5640 ctttacggca cctcgacccc aaaaaacttg attagggtga tggttcacgt agtgggccat 5700 cgccctgata gacggttttt cgccctttga cgttggagtc cacgttcttt aatagtggac 5760 tcttgttcca aactggaaca acactcaacc ctatctcggt ctattctttt gatttataag 5820 ggattttgcc gatttcggcc tattggttaa aaaatgagct gatttaacaa aaatttaacg 5880 cgaattttaa caaaatatta acgcttacaa tttgccattc gccattcagg ctgcgcaact 5940 gttgggaagg gcgatcggtg cgggcctctt cgctattacg ccagcccaag ctaccatgat 6000 aagtaagtaa tattaaggta cgtggaggtt ttacttgctt taaaaaacct cccacacctc 6060 cccctgaacc tgaaacataa aatgaatgca attgttgttg ttaacttgtt tattgcagct 6120 tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc atttttttca 6180 ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatggtac tgtaactgag 6240 ctaacataa 6249 <210> 25 <211> 6360 <212> DNA <213> Artificial Sequence <220> <223> SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-3'UTR[2huBGpA-A120]-SS* <400> 25 cccgggaggt accgagctct tacgcgtgct agaattaaag taacccaatc agcacacaat 60 tgccattata cgcgcgtata atggactatt gtgtgctgat aaacctattt cagcatacta 120 cgcgcgtagt atgctgaaat aggtgactag aagttcctat actttctaga gaataggaac 180 ttcataactt cgtataatgt atgctatacg aagttatggg ttactttaat ttggttgctg 240 actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 300 acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 360 gggactttcc acacccctgg gtcgacggga ctttccgggg cggggcacgt ggtgcacggg 420 actttccgtg cacgtgcacg ggactttccg ggactttccg ggactttccg tgcaccacgt 480 ggggactttc cgtgcacgac attgattatt gactagttat taatagtaat caattacggg 540 gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc 600 gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 660 agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 720 ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 780 cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 840 gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 900 caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 960 caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 1020 cgccccattg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata taagcagagc 1080 tctgccttct ccctcctgtg agtttggtaa gtcgacgggc cgggcctggg ccgggtccgg 1140 gccgggtcgt tggatcccca ctacagcccg atactcaagc ttgacgaatt cgagtatcca 1200 aggtagtgga ctagtgtgac gctgctgacc cctttctttc ccttctgcag gttggtgtac 1260 agtagcttcc aaattgatta attcgagcga acgcgtcgcc accatgaact ccttctccac 1320 aagcgccttc ggtccagttg ccttctccct gggcctgctc ctggtgttgc ctgctgcctt 1380 ccctgcccca gtcttcacac tcgaagattt cgttggggac tggcgacaga cagccggcta 1440 caacctggac caagtccttg aacagggagg tgtgtccagt ttgtttcaga atctcggggt 1500 gtccgtaact ccgatccaaa ggattgtcct gagcggtgaa aatgggctga agatcgacat 1560 ccatgtcatc atcccgtatg aaggtctgag cggcgaccaa atgggccaga tcgaaaaaat 1620 ttttaaggtg gtgtaccctg tggatgatca tcactttaag gtgatcctgc actatggcac 1680 actggtaatc gacggggtta cgccgaacat gatcgactat ttcggacggc cgtatgaagg 1740 catcgccgtg ttcgacggca aaaagatcac tgtaacaggg accctgtgga acggcaacaa 1800 aattatcgac gagcgcctga tcaaccccga cggctccctg ctgttccgag taaccatcaa 1860 cggagtgacc ggctggcggc tgtgcgaacg cattctggcg gctagcgcta ctaacttcag 1920 cctgctgaag caggctggag acgtggagga gaaccctgga cctggaagcg gagagggcag 1980 aggaagtctg ctaacatgcg gtgacgtcga ggagaatcct ggacctggat ccggaatggt 2040 gagcaagggc gaggagctgt tcaccggggt ggtgcccatc ctggtcgagc tggacggcga 2100 cgtaaacggc cacaagttca gcgtgtccgg cgagggcgag ggcgatgcca cctacggcaa 2160 gctgaccctg aagttcatct gcaccaccgg caagctgccc gtgccctggc ccaccctcgt 2220 gaccaccctg acctacggcg tgcagtgctt cagccgctac cccgaccaca tgaagcagca 2280 cgacttcttc aagtccgcca tgcccgaagg ctacgtccag gagcgcacca tcttcttcaa 2340 ggacgacggc aactacaaga cccgcgccga ggtgaagttc gagggcgaca ccctggtgaa 2400 ccgcatcgag ctgaagggca tcgacttcaa ggaggacggc aacatcctgg ggcacaagct 2460 ggagtacaac tacaacagcc acaacgtcta tatcatggcc gacaagcaga agaacggcat 2520 caaggtgaac ttcaagatcc gccacaacat cgaggacggc agcgtgcagc tcgccgacca 2580 ctaccagcag aacaccccca tcggcgacgg ccccgtgctg ctgcccgaca accactacct 2640 gagcacccag tccgccctga gcaaagaccc caacgagaag cgcgatcaca tggtcctgct 2700 ggagttcgtg accgccgccg ggatcactct cggcatggac gagctgtaca agtaagctcg 2760 ctttcttgct gtccaatttc tattaaaggt tcctttgttc cctaagtcca actactaaac 2820 tgggggatat tatgaagggc cttgagcatc tggattctgc ctaataaaaa acatttattt 2880 tcattgcaag ctcgctttct tgctgtccaa tttctattaa aggttccttt gttccctaag 2940 tccaactact aaactggggg atattatgaa gggccttgag catctggatt ctgcctaata 3000 aaaaacattt attttcattg caaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3060 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3120 aaaaaaaaaa aaaaaaaaaa aaactcggaa ggacatggtg tggaaagtcc ccaggctccc 3180 cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccagg tgtggaaagt 3240 ccccaggctc cccagcaggc agaagtatgc aaagcatgca tctcaattag tcagcaacca 3300 aattaaagta acccataact tcgtatagca tacattatac gaagttatga agttcctatt 3360 ctctagaaag tataggaact tctagtcacc tatttcagca tactacgcgc gtagtatgct 3420 gaaataggtt tatcagcaca caatagtcca ttatacgcgc gtataatggc aattgtgtgc 3480 tgattgggtt actttaattt ggatccgtcg accgatgccc ttgagagcct tcaacccagt 3540 cagctccttc cggtgggcgc ggggcatgac tatcgtcgcc gcacttatga ctgtcttctt 3600 tatcatgcaa ctcgtaggac aggtgccggc agcgctcttc cgcttcctcg ctcactgact 3660 cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac 3720 ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa 3780 aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg 3840 acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa 3900 gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 3960 ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac 4020 gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac 4080 cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg 4140 taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt 4200 atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagaa 4260 cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct 4320 cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga 4380 ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg 4440 ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct 4500 tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 4560 aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 4620 tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg 4680 gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag 4740 atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt 4800 tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag 4860 ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt 4920 ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca 4980 tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg 5040 ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat 5100 ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta 5160 tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca 5220 gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct 5280 taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat 5340 cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa 5400 agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt 5460 gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 5520 ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac gcgccctgta 5580 gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca 5640 gcgccctagc gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct 5700 ttccccgtca agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc 5760 acctcgaccc caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat 5820 agacggtttt tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc 5880 aaactggaac aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc 5940 cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta 6000 acaaaatatt aacgcttaca atttgccatt cgccattcag gctgcgcaac tgttgggaag 6060 ggcgatcggt gcgggcctct tcgctattac gccagcccaa gctaccatga taagtaagta 6120 atattaaggt acgtggaggt tttacttgct ttaaaaaacc tcccacacct ccccctgaac 6180 ctgaaacata aaatgaatgc aattgttgtt gttaacttgt ttattgcagc ttataatggt 6240 tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc actgcattct 6300 agttgtggtt tgtccaaact catcaatgta tcttatggta ctgtaactga gctaacataa 6360 <210> 26 <211> 6949 <212> DNA <213> Artificial Sequence <220> <223> SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR[2huBGpA-A120]-SS* <400> 26 cccgggaggt accgagctct tacgcgtgct agaattaaag taacccaatc agcacacaat 60 tgccattata cgcgcgtata atggactatt gtgtgctgat aaacctattt cagcatacta 120 cgcgcgtagt atgctgaaat aggtgactag aagttcctat actttctaga gaataggaac 180 ttcataactt cgtataatgt atgctatacg aagttatggg ttactttaat ttggttgctg 240 actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 300 acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 360 gggactttcc acacccctgg gtcgacggga ctttccgggg cggggcacgt ggtgcacggg 420 actttccgtg cacgtgcacg ggactttccg ggactttccg ggactttccg tgcaccacgt 480 ggggactttc cgtgcacgac attgattatt gactagttat taatagtaat caattacggg 540 gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc 600 gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 660 agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 720 ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 780 cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 840 gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 900 caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 960 caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 1020 cgccccattg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata taagcagagc 1080 tctgccttct ccctcctgtg agtttggtaa gtcgacgggc cgggcctggg ccgggtccgg 1140 gccgggtcgt tggatcccca ctacagcccg atactcaagc ttgacgaatt cgagtatcca 1200 aggtagtgga ctagtgtgac gctgctgacc cctttctttc ccttctgcag gttggtgtac 1260 agtagcttcc aaattgatta attcgagcga acgcgtcgcc accatgaact ccttctccac 1320 aagcgccttc ggtccagttg ccttctccct gggcctgctc ctggtgttgc ctgctgcctt 1380 ccctgcccca gtcttcacac tcgaagattt cgttggggac tggcgacaga cagccggcta 1440 caacctggac caagtccttg aacagggagg tgtgtccagt ttgtttcaga atctcggggt 1500 gtccgtaact ccgatccaaa ggattgtcct gagcggtgaa aatgggctga agatcgacat 1560 ccatgtcatc atcccgtatg aaggtctgag cggcgaccaa atgggccaga tcgaaaaaat 1620 ttttaaggtg gtgtaccctg tggatgatca tcactttaag gtgatcctgc actatggcac 1680 actggtaatc gacggggtta cgccgaacat gatcgactat ttcggacggc cgtatgaagg 1740 catcgccgtg ttcgacggca aaaagatcac tgtaacaggg accctgtgga acggcaacaa 1800 aattatcgac gagcgcctga tcaaccccga cggctccctg ctgttccgag taaccatcaa 1860 cggagtgacc ggctggcggc tgtgcgaacg cattctggcg gctagcgcta ctaacttcag 1920 cctgctgaag caggctggag acgtggagga gaaccctgga cctggaagcg gagagggcag 1980 aggaagtctg ctaacatgcg gtgacgtcga ggagaatcct ggacctggat ccggaatggt 2040 gagcaagggc gaggagctgt tcaccggggt ggtgcccatc ctggtcgagc tggacggcga 2100 cgtaaacggc cacaagttca gcgtgtccgg cgagggcgag ggcgatgcca cctacggcaa 2160 gctgaccctg aagttcatct gcaccaccgg caagctgccc gtgccctggc ccaccctcgt 2220 gaccaccctg acctacggcg tgcagtgctt cagccgctac cccgaccaca tgaagcagca 2280 cgacttcttc aagtccgcca tgcccgaagg ctacgtccag gagcgcacca tcttcttcaa 2340 ggacgacggc aactacaaga cccgcgccga ggtgaagttc gagggcgaca ccctggtgaa 2400 ccgcatcgag ctgaagggca tcgacttcaa ggaggacggc aacatcctgg ggcacaagct 2460 ggagtacaac tacaacagcc acaacgtcta tatcatggcc gacaagcaga agaacggcat 2520 caaggtgaac ttcaagatcc gccacaacat cgaggacggc agcgtgcagc tcgccgacca 2580 ctaccagcag aacaccccca tcggcgacgg ccccgtgctg ctgcccgaca accactacct 2640 gagcacccag tccgccctga gcaaagaccc caacgagaag cgcgatcaca tggtcctgct 2700 ggagttcgtg accgccgccg ggatcactct cggcatggac gagctgtaca agtaaaatca 2760 acctctggat tacaaaattt gtgaaagatt gactggtatt cttaactatg ttgctccttt 2820 tacgctatgt ggatacgctg ctttaatgcc tttgtatcat gctattgctt cccgtatggc 2880 tttcattttc tcctccttgt ataaatcctg gttgctgtct ctttatgagg agttgtggcc 2940 cgttgtcagg caacgtggcg tggtgtgcac tgtgtttgct gacgcaaccc ccactggttg 3000 gggcattgcc accacctgtc agctcctttc cgggactttc gctttccccc tccctattgc 3060 cacggcggaa ctcatcgccg cctgccttgc ccgctgctgg acaggggctc ggctgttggg 3120 cactgacaat tccgtggtgt tgtcggggaa atcatcgtcc tttccttggc tgctcgcctg 3180 tgttgccacc tggattctgc gcgggacgtc cttctgctac gtcccttcgg ccctcaatcc 3240 agcggacctt ccttcccgcg gcctgctgcc ggctctgcgg cctcttccgc gtcttcgcct 3300 tcgccctcag acgagtcgga tctccctttg ggccgcctcc ccgcgctcgc tttcttgctg 3360 tccaatttct attaaaggtt cctttgttcc ctaagtccaa ctactaaact gggggatatt 3420 atgaagggcc ttgagcatct ggattctgcc taataaaaaa catttatttt cattgcaagc 3480 tcgctttctt gctgtccaat ttctattaaa ggttcctttg ttccctaagt ccaactacta 3540 aactggggga tattatgaag ggccttgagc atctggattc tgcctaataa aaaacattta 3600 ttttcattgc aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3660 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3720 aaaaaaaaaa aactcggaag gacatggtgt ggaaagtccc caggctcccc agcaggcaga 3780 agtatgcaaa gcatgcatct caattagtca gcaaccaggt gtggaaagtc cccaggctcc 3840 ccagcaggca gaagtatgca aagcatgcat ctcaattagt cagcaaccaa attaaagtaa 3900 cccataactt cgtatagcat acattatacg aagttatgaa gttcctattc tctagaaagt 3960 ataggaactt ctagtcacct atttcagcat actacgcgcg tagtatgctg aaataggttt 4020 atcagcacac aatagtccat tatacgcgcg tataatggca attgtgtgct gattgggtta 4080 ctttaatttg gatccgtcga ccgatgccct tgagagcctt caacccagtc agctccttcc 4140 ggtgggcgcg gggcatgact atcgtcgccg cacttatgac tgtcttcttt atcatgcaac 4200 tcgtaggaca ggtgccggca gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg 4260 gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca 4320 gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac 4380 cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac 4440 aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg 4500 tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac 4560 ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg ctgtaggtat 4620 ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag 4680 cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac 4740 ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt 4800 gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaagaac agtatttggt 4860 atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc 4920 aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga 4980 aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac 5040 gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc 5100 cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct 5160 gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca 5220 tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg cttaccatct 5280 ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga tttatcagca 5340 ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc 5400 atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt taatagtttg 5460 cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct 5520 tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa 5580 aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta 5640 tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc 5700 ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg 5760 agttgctctt gcccggcgtc aatacgggat aataccgcgc cacatagcag aactttaaaa 5820 gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg 5880 agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc 5940 accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg 6000 gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat 6060 cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata 6120 ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg cgccctgtag cggcgcatta 6180 agcgcggcgg gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg 6240 cccgctcctt tcgctttctt cccttccttt ctcgccacgt tcgccggctt tccccgtcaa 6300 gctctaaatc gggggctccc tttagggttc cgatttagtg ctttacggca cctcgacccc 6360 aaaaaacttg attagggtga tggttcacgt agtgggccat cgccctgata gacggttttt 6420 cgccctttga cgttggagtc cacgttcttt aatagtggac tcttgttcca aactggaaca 6480 acactcaacc ctatctcggt ctattctttt gatttataag ggattttgcc gatttcggcc 6540 tattggttaa aaaatgagct gatttaacaa aaatttaacg cgaattttaa caaaatatta 6600 acgcttacaa tttgccattc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 cgggcctctt cgctattacg ccagcccaag ctaccatgat aagtaagtaa tattaaggta 6720 cgtggaggtt ttacttgctt taaaaaacct cccacacctc cccctgaacc tgaaacataa 6780 aatgaatgca attgttgttg ttaacttgtt tattgcagct tataatggtt acaaataaag 6840 caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt 6900 gtccaaactc atcaatgtat cttatggtac tgtaactgag ctaacataa 6949 <210> 27 <211> 7121 <212> DNA <213> Artificial Sequence <220> <223> SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR[2huBGpA-A120]-SS* <400> 27 cccgggaggt accgagctct tacgcgtgct agaattaaag taacccaatc agcacacaat 60 tgccattata cgcgcgtata atggactatt gtgtgctgat aaacctattt cagcatacta 120 cgcgcgtagt atgctgaaat aggtgactag aagttcctat actttctaga gaataggaac 180 ttcataactt cgtataatgt atgctatacg aagttatggg ttactttaat ttggttgctg 240 actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 300 acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 360 gggactttcc acacccctgg gtcgacgcac acgaccacaa ttccactgaa agcattttaa 420 tacggaactt gtcactccca gggagcctcc gctcagccgg cagttggttc atttcaatcc 480 ccacgacaac ccttcaaagt gcagggcaga cagcaggtgg ctctgcccag gcgcctggat 540 cacagcccgg cctgcagccc tcacctgggc gcggggagac cctgaggacg ctcctccagg 600 cggcgctggc cggggcctgc ggacacggac gggcgggctg agctccggga cccctccccg 660 cgccccgcac cccgcacccc gcaccccgca ccccgcaccc ggcgctcacc cgtcccagcc 720 ccgccgcccg cagccccagc tgcaacgcag ccaccgccgc catcgcaccc ggccccgcgg 780 gcgcttccgg gacgcaggag gcatctgcat ccggggcgcc gctgagtccc gcccagagcc 840 ccgcccccgg ctccaggttc tgcgagcggc ttccgccggg ctgctccgcg ggcgcgtcgg 900 ccatgagcga gttgccgggc gacgtgcggg cgtttctgcg ggagcacccg agcctgcggc 960 tccagacgga cgcccgcaag gttcgcagcg cgggagggga acggagtggc ggagaagggc 1020 gcagttggga tgaggggctg aggggagggc aggggagagg agagggcagg ggagagggga 1080 gaggggagag caggagagag gggaaggcag gggagagggc gcggcgggat caggggagga 1140 gagggaaggg actttccggg gcggggcacg tggtgcacgg gactttccgt gcacgtgcac 1200 gggactttcc gggactttcc gggactttcc gtgcaccacg tggggacttt ccgtgcacga 1260 cattgattat tgactagtta ttaatagtaa tcaattacgg ggtcattagt tcatagccca 1320 tatatggagt tccgcgttac ataacttacg gtaaatggcc cgcctggctg accgcccaac 1380 gacccccgcc cattgacgtc aataatgacg tatgttccca tagtaacgcc aatagggact 1440 ttccattgac gtcaatgggt ggagtattta cggtaaactg cccacttggc agtacatcaa 1500 gtgtatcata tgccaagtac gccccctatt gacgtcaatg acggtaaatg gcccgcctgg 1560 cattatgccc agtacatgac cttatgggac tttcctactt ggcagtacat ctacgtatta 1620 gtcatcgcta ttaccatggt gatgcggttt tggcagtaca tcaatgggcg tggatagcgg 1680 tttgactcac ggggatttcc aagtctccac cccattgacg tcaatgggag tttgttttgg 1740 caccaaaatc aacgggactt tccaaaatgt cgtaacaact ccgccccatt gacgcaaatg 1800 ggcggtaggc gtgtacggtg ggaggtctat ataagcagag ctctgccttc tccctcctgt 1860 gagtttggta agtcgacggg ccgggcctgg gccgggtccg ggccgggtcg ttggatcccc 1920 actacagccc gatactcaag cttgacgaat tcgagtatcc aaggtagtgg actagtgtga 1980 cgctgctgac ccctttcttt cccttctgca ggttggtgta cagtagcttc caaattgatt 2040 aattcgagcg aacgcgtcgc caccatgaac tccttctcca caagcgcctt cggtccagtt 2100 gccttctccc tgggcctgct cctggtgttg cctgctgcct tccctgcccc agtcttcaca 2160 ctcgaagatt tcgttgggga ctggcgacag acagccggct acaacctgga ccaagtcctt 2220 gaacagggag gtgtgtccag tttgtttcag aatctcgggg tgtccgtaac tccgatccaa 2280 aggattgtcc tgagcggtga aaatgggctg aagatcgaca tccatgtcat catcccgtat 2340 gaaggtctga gcggcgacca aatgggccag atcgaaaaaa tttttaaggt ggtgtaccct 2400 gtggatgatc atcactttaa ggtgatcctg cactatggca cactggtaat cgacggggtt 2460 acgccgaaca tgatcgacta tttcggacgg ccgtatgaag gcatcgccgt gttcgacggc 2520 aaaaagatca ctgtaacagg gaccctgtgg aacggcaaca aaattatcga cgagcgcctg 2580 atcaaccccg acggctccct gctgttccga gtaaccatca acggagtgac cggctggcgg 2640 ctgtgcgaac gcattctggc ggctagcgct actaacttca gcctgctgaa gcaggctgga 2700 gacgtggagg agaaccctgg acctggaagc ggagagggca gaggaagtct gctaacatgc 2760 ggtgacgtcg aggagaatcc tggacctgga tccggaatgg tgagcaaggg cgaggagctg 2820 ttcaccgggg tggtgcccat cctggtcgag ctggacggcg acgtaaacgg ccacaagttc 2880 agcgtgtccg gcgagggcga gggcgatgcc acctacggca agctgaccct gaagttcatc 2940 tgcaccaccg gcaagctgcc cgtgccctgg cccaccctcg tgaccaccct gacctacggc 3000 gtgcagtgct tcagccgcta ccccgaccac atgaagcagc acgacttctt caagtccgcc 3060 atgcccgaag gctacgtcca ggagcgcacc atcttcttca aggacgacgg caactacaag 3120 acccgcgccg aggtgaagtt cgagggcgac accctggtga accgcatcga gctgaagggc 3180 atcgacttca aggaggacgg caacatcctg gggcacaagc tggagtacaa ctacaacagc 3240 cacaacgtct atatcatggc cgacaagcag aagaacggca tcaaggtgaa cttcaagatc 3300 cgccacaaca tcgaggacgg cagcgtgcag ctcgccgacc actaccagca gaacaccccc 3360 atcggcgacg gccccgtgct gctgcccgac aaccactacc tgagcaccca gtccgccctg 3420 agcaaagacc ccaacgagaa gcgcgatcac atggtcctgc tggagttcgt gaccgccgcc 3480 gggatcactc tcggcatgga cgagctgtac aagtaagctc gctttcttgc tgtccaattt 3540 ctattaaagg ttcctttgtt ccctaagtcc aactactaaa ctgggggata ttatgaaggg 3600 ccttgagcat ctggattctg cctaataaaa aacatttatt ttcattgcaa gctcgctttc 3660 ttgctgtcca atttctatta aaggttcctt tgttccctaa gtccaactac taaactgggg 3720 gatattatga agggccttga gcatctggat tctgcctaat aaaaaacatt tattttcatt 3780 gcaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3840 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3900 aaaactcgga aggacatggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca 3960 aagcatgcat ctcaattagt cagcaaccag gtgtggaaag tccccaggct ccccagcagg 4020 cagaagtatg caaagcatgc atctcaatta gtcagcaacc aaattaaagt aacccataac 4080 ttcgtatagc atacattata cgaagttatg aagttcctat tctctagaaa gtataggaac 4140 ttctagtcac ctatttcagc atactacgcg cgtagtatgc tgaaataggt ttatcagcac 4200 acaatagtcc attatacgcg cgtataatgg caattgtgtg ctgattgggt tactttaatt 4260 tggatccgtc gaccgatgcc cttgagagcc ttcaacccag tcagctcctt ccggtgggcg 4320 cggggcatga ctatcgtcgc cgcacttatg actgtcttct ttatcatgca actcgtagga 4380 caggtgccgg cagcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg 4440 gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg 4500 ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa 4560 ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 4620 acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 4680 tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 4740 ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 4800 ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 4860 ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 4920 actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 4980 gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc 5040 tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 5100 caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 5160 atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 5220 acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa 5280 ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta 5340 ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt 5400 tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag 5460 tgctgcaatg ataccgcgag acccacgctc accggctcca gatttatcag caataaacca 5520 gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc 5580 tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt 5640 tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag 5700 ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt 5760 tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat 5820 ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt 5880 gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc 5940 ttgcccggcg tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat 6000 cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag 6060 ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt 6120 ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg 6180 gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta 6240 ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc 6300 gcgcacattt ccccgaaaag tgccacctga cgcgccctgt agcggcgcat taagcgcggc 6360 gggtgtggtg gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc 6420 tttcgctttc ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa 6480 tcgggggctc cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact 6540 tgattagggt gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt 6600 gacgttggag tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa 6660 ccctatctcg gtctattctt ttgatttata agggattttg ccgatttcgg cctattggtt 6720 aaaaaatgag ctgatttaac aaaaatttaa cgcgaatttt aacaaaatat taacgcttac 6780 aatttgccat tcgccattca ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc 6840 ttcgctatta cgccagccca agctaccatg ataagtaagt aatattaagg tacgtggagg 6900 ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat aaaatgaatg 6960 caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa agcaatagca 7020 tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac 7080 tcatcaatgt atcttatggt actgtaactg agctaacata a 7121 <210> 28 <211> 7593 <212> DNA <213> Artificial Sequence <220> <223> SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-huMAR-3'UTR[2huBGpA-A120]-SS* <400> 28 cccgggaggt accgagctct tacgcgtgct agaattaaag taacccaatc agcacacaat 60 tgccattata cgcgcgtata atggactatt gtgtgctgat aaacctattt cagcatacta 120 cgcgcgtagt atgctgaaat aggtgactag aagttcctat actttctaga gaataggaac 180 ttcataactt cgtataatgt atgctatacg aagttatggg ttactttaat ttggttgctg 240 actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 300 acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 360 gggactttcc acacccctgg gtcgacggga ctttccgggg cggggcacgt ggtgcacggg 420 actttccgtg cacgtgcacg ggactttccg ggactttccg ggactttccg tgcaccacgt 480 ggggactttc cgtgcacgac attgattatt gactagttat taatagtaat caattacggg 540 gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc 600 gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 660 agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 720 ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 780 cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 840 gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 900 caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 960 caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 1020 cgccccattg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata taagcagagc 1080 tctgccttct ccctcctgtg agtttggtaa gtcgacgggc cgggcctggg ccgggtccgg 1140 gccgggtcgt tggatcccca ctacagcccg atactcaagc ttgacgaatt cgagtatcca 1200 aggtagtgga ctagtgtgac gctgctgacc cctttctttc ccttctgcag gttggtgtac 1260 agtagcttcc aaattgatta attcgagcga acgcgtcgcc accatgaact ccttctccac 1320 aagcgccttc ggtccagttg ccttctccct gggcctgctc ctggtgttgc ctgctgcctt 1380 ccctgcccca gtcttcacac tcgaagattt cgttggggac tggcgacaga cagccggcta 1440 caacctggac caagtccttg aacagggagg tgtgtccagt ttgtttcaga atctcggggt 1500 gtccgtaact ccgatccaaa ggattgtcct gagcggtgaa aatgggctga agatcgacat 1560 ccatgtcatc atcccgtatg aaggtctgag cggcgaccaa atgggccaga tcgaaaaaat 1620 ttttaaggtg gtgtaccctg tggatgatca tcactttaag gtgatcctgc actatggcac 1680 actggtaatc gacggggtta cgccgaacat gatcgactat ttcggacggc cgtatgaagg 1740 catcgccgtg ttcgacggca aaaagatcac tgtaacaggg accctgtgga acggcaacaa 1800 aattatcgac gagcgcctga tcaaccccga cggctccctg ctgttccgag taaccatcaa 1860 cggagtgacc ggctggcggc tgtgcgaacg cattctggcg gctagcgcta ctaacttcag 1920 cctgctgaag caggctggag acgtggagga gaaccctgga cctggaagcg gagagggcag 1980 aggaagtctg ctaacatgcg gtgacgtcga ggagaatcct ggacctggat ccggaatggt 2040 gagcaagggc gaggagctgt tcaccggggt ggtgcccatc ctggtcgagc tggacggcga 2100 cgtaaacggc cacaagttca gcgtgtccgg cgagggcgag ggcgatgcca cctacggcaa 2160 gctgaccctg aagttcatct gcaccaccgg caagctgccc gtgccctggc ccaccctcgt 2220 gaccaccctg acctacggcg tgcagtgctt cagccgctac cccgaccaca tgaagcagca 2280 cgacttcttc aagtccgcca tgcccgaagg ctacgtccag gagcgcacca tcttcttcaa 2340 ggacgacggc aactacaaga cccgcgccga ggtgaagttc gagggcgaca ccctggtgaa 2400 ccgcatcgag ctgaagggca tcgacttcaa ggaggacggc aacatcctgg ggcacaagct 2460 ggagtacaac tacaacagcc acaacgtcta tatcatggcc gacaagcaga agaacggcat 2520 caaggtgaac ttcaagatcc gccacaacat cgaggacggc agcgtgcagc tcgccgacca 2580 ctaccagcag aacaccccca tcggcgacgg ccccgtgctg ctgcccgaca accactacct 2640 gagcacccag tccgccctga gcaaagaccc caacgagaag cgcgatcaca tggtcctgct 2700 ggagttcgtg accgccgccg ggatcactct cggcatggac gagctgtaca agtaaggatc 2760 ccattctcct tgatgtacta atttttcttt aaaagtgata ataatagctc ccatttagaa 2820 tttttaaata acacaacaaa tgtaaagtaa ctaatgtgtc ctctggatca tggtaagtaa 2880 tgaataaatt taactccctt taccttctcc ctttgctatt ttttccatgc taggatttat 2940 acatttttaa aaaactaaat ctgctatcaa atgacagctt taaatttact ttttaaaatt 3000 tgttattgta tatatttatg gggtataaag tgatgttatg atatatatat acacaatgta 3060 cactgattaa atcaagccaa ttaacatttt atcatctcaa atacttaaca ttttttgtag 3120 tgagaacatt tgaaatttac ttttagcaat ttcaaaacat acattattat tattaactat 3180 agtcaccatg atgtaccata gatctttaaa aacttattct tcctgcctaa ctgaaacttt 3240 gtactctttg actaacatct tttcattccc ccacttccca gcctctggta atcaccatta 3300 cacactctgc ttctatgagt tcaattgctt tagactccac gtaataaatg agatcatgca 3360 gcatttggct ttctgtgcct ggcttatcct tgcttagcat ggtgtcttac aggttcatcc 3420 atgttgcaac aaataacaga atctcattct ttgttaaggc tgaatactat tccattgggt 3480 atatatacca cattttcctt atccattaat ccactgatgg acccttaggt tgttgattcc 3540 atatattggc tattgtaaat agtgcagcaa tgaacatgag agtgcaacta tctcttcaat 3600 gtactgattt cgaatccttc ggatctatct cagaagtgag attgcaggat catataattc 3660 tacttttagt cttttgagga gctccataca gctttccata tggccatact aattacattc 3720 tcatcaacag tgtacaatgg tttccttttc tccacatcct caccaacatt tataattttt 3780 tgtctttttg ataatagcca tctgacaggt gtaaagtgat agctcattgc agttttaatt 3840 tgcatttttt gatgattagt aatgttgaga attttttcat atatctcttg gccagttgca 3900 tgtcttcttt ggaaaaatgt ctattcagtt cctttgccca ttttttaatt gggatttttg 3960 gtttcttgct attgagttgt ttgaattcgc tcgctttctt gctgtccaat ttctattaaa 4020 ggttcctttg ttccctaagt ccaactacta aactggggga tattatgaag ggccttgagc 4080 atctggattc tgcctaataa aaaacattta ttttcattgc aagctcgctt tcttgctgtc 4140 caatttctat taaaggttcc tttgttccct aagtccaact actaaactgg gggatattat 4200 gaagggcctt gagcatctgg attctgccta ataaaaaaca tttattttca ttgcaaaaaa 4260 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4320 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaactcg 4380 gaaggacatg gtgtggaaag tccccaggct ccccagcagg cagaagtatg caaagcatgc 4440 atctcaatta gtcagcaacc aggtgtggaa agtccccagg ctccccagca ggcagaagta 4500 tgcaaagcat gcatctcaat tagtcagcaa ccaaattaaa gtaacccata acttcgtata 4560 gcatacatta tacgaagtta tgaagttcct attctctaga aagtatagga acttctagtc 4620 acctatttca gcatactacg cgcgtagtat gctgaaatag gtttatcagc acacaatagt 4680 ccattatacg cgcgtataat ggcaattgtg tgctgattgg gttactttaa tttggatccg 4740 tcgaccgatg cccttgagag ccttcaaccc agtcagctcc ttccggtggg cgcggggcat 4800 gactatcgtc gccgcactta tgactgtctt ctttatcatg caactcgtag gacaggtgcc 4860 ggcagcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 4920 gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 4980 caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 5040 tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 5100 gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 5160 ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 5220 cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 5280 tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 5340 tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 5400 cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 5460 agtggtggcc taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga 5520 agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5580 gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5640 aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5700 ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5760 gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5820 taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 5880 tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 5940 tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 6000 gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 6060 gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 6120 ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 6180 cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 6240 tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 6300 cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 6360 agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 6420 cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 6480 aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6540 aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6600 gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6660 gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 6720 tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6780 ttccccgaaa agtgccacct gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 6840 tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 6900 tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 6960 tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 7020 gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 7080 agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 7140 cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 7200 agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttgcc 7260 attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 7320 tacgccagcc caagctacca tgataagtaa gtaatattaa ggtacgtgga ggttttactt 7380 gctttaaaaa acctcccaca cctccccctg aacctgaaac ataaaatgaa tgcaattgtt 7440 gttgttaact tgtttattgc agcttataat ggttacaaat aaagcaatag catcacaaat 7500 ttcacaaata aagcattttt ttcactgcat tctagttgtg gtttgtccaa actcatcaat 7560 gtatcttatg gtactgtaac tgagctaaca taa 7593 <210> 29 <211> 8354 <212> DNA <213> Artificial Sequence <220> <223> SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-huMAR-3'UTR[2huBGpA-A120]-SS * <400> 29 cccgggaggt accgagctct tacgcgtgct agaattaaag taacccaatc agcacacaat 60 tgccattata cgcgcgtata atggactatt gtgtgctgat aaacctattt cagcatacta 120 cgcgcgtagt atgctgaaat aggtgactag aagttcctat actttctaga gaataggaac 180 ttcataactt cgtataatgt atgctatacg aagttatggg ttactttaat ttggttgctg 240 actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 300 acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 360 gggactttcc acacccctgg gtcgacgcac acgaccacaa ttccactgaa agcattttaa 420 tacggaactt gtcactccca gggagcctcc gctcagccgg cagttggttc atttcaatcc 480 ccacgacaac ccttcaaagt gcagggcaga cagcaggtgg ctctgcccag gcgcctggat 540 cacagcccgg cctgcagccc tcacctgggc gcggggagac cctgaggacg ctcctccagg 600 cggcgctggc cggggcctgc ggacacggac gggcgggctg agctccggga cccctccccg 660 cgccccgcac cccgcacccc gcaccccgca ccccgcaccc ggcgctcacc cgtcccagcc 720 ccgccgcccg cagccccagc tgcaacgcag ccaccgccgc catcgcaccc ggccccgcgg 780 gcgcttccgg gacgcaggag gcatctgcat ccggggcgcc gctgagtccc gcccagagcc 840 ccgcccccgg ctccaggttc tgcgagcggc ttccgccggg ctgctccgcg ggcgcgtcgg 900 ccatgagcga gttgccgggc gacgtgcggg cgtttctgcg ggagcacccg agcctgcggc 960 tccagacgga cgcccgcaag gttcgcagcg cgggagggga acggagtggc ggagaagggc 1020 gcagttggga tgaggggctg aggggagggc aggggagagg agagggcagg ggagagggga 1080 gaggggagag caggagagag gggaaggcag gggagagggc gcggcgggat caggggagga 1140 gagggaaggg actttccggg gcggggcacg tggtgcacgg gactttccgt gcacgtgcac 1200 gggactttcc gggactttcc gggactttcc gtgcaccacg tggggacttt ccgtgcacga 1260 cattgattat tgactagtta ttaatagtaa tcaattacgg ggtcattagt tcatagccca 1320 tatatggagt tccgcgttac ataacttacg gtaaatggcc cgcctggctg accgcccaac 1380 gacccccgcc cattgacgtc aataatgacg tatgttccca tagtaacgcc aatagggact 1440 ttccattgac gtcaatgggt ggagtattta cggtaaactg cccacttggc agtacatcaa 1500 gtgtatcata tgccaagtac gccccctatt gacgtcaatg acggtaaatg gcccgcctgg 1560 cattatgccc agtacatgac cttatgggac tttcctactt ggcagtacat ctacgtatta 1620 gtcatcgcta ttaccatggt gatgcggttt tggcagtaca tcaatgggcg tggatagcgg 1680 tttgactcac ggggatttcc aagtctccac cccattgacg tcaatgggag tttgttttgg 1740 caccaaaatc aacgggactt tccaaaatgt cgtaacaact ccgccccatt gacgcaaatg 1800 ggcggtaggc gtgtacggtg ggaggtctat ataagcagag ctctgccttc tccctcctgt 1860 gagtttggta agtcgacggg ccgggcctgg gccgggtccg ggccgggtcg ttggatcccc 1920 actacagccc gatactcaag cttgacgaat tcgagtatcc aaggtagtgg actagtgtga 1980 cgctgctgac ccctttcttt cccttctgca ggttggtgta cagtagcttc caaattgatt 2040 aattcgagcg aacgcgtcgc caccatgaac tccttctcca caagcgcctt cggtccagtt 2100 gccttctccc tgggcctgct cctggtgttg cctgctgcct tccctgcccc agtcttcaca 2160 ctcgaagatt tcgttgggga ctggcgacag acagccggct acaacctgga ccaagtcctt 2220 gaacagggag gtgtgtccag tttgtttcag aatctcgggg tgtccgtaac tccgatccaa 2280 aggattgtcc tgagcggtga aaatgggctg aagatcgaca tccatgtcat catcccgtat 2340 gaaggtctga gcggcgacca aatgggccag atcgaaaaaa tttttaaggt ggtgtaccct 2400 gtggatgatc atcactttaa ggtgatcctg cactatggca cactggtaat cgacggggtt 2460 acgccgaaca tgatcgacta tttcggacgg ccgtatgaag gcatcgccgt gttcgacggc 2520 aaaaagatca ctgtaacagg gaccctgtgg aacggcaaca aaattatcga cgagcgcctg 2580 atcaaccccg acggctccct gctgttccga gtaaccatca acggagtgac cggctggcgg 2640 ctgtgcgaac gcattctggc ggctagcgct actaacttca gcctgctgaa gcaggctgga 2700 gacgtggagg agaaccctgg acctggaagc ggagagggca gaggaagtct gctaacatgc 2760 ggtgacgtcg aggagaatcc tggacctgga tccggaatgg tgagcaaggg cgaggagctg 2820 ttcaccgggg tggtgcccat cctggtcgag ctggacggcg acgtaaacgg ccacaagttc 2880 agcgtgtccg gcgagggcga gggcgatgcc acctacggca agctgaccct gaagttcatc 2940 tgcaccaccg gcaagctgcc cgtgccctgg cccaccctcg tgaccaccct gacctacggc 3000 gtgcagtgct tcagccgcta ccccgaccac atgaagcagc acgacttctt caagtccgcc 3060 atgcccgaag gctacgtcca ggagcgcacc atcttcttca aggacgacgg caactacaag 3120 acccgcgccg aggtgaagtt cgagggcgac accctggtga accgcatcga gctgaagggc 3180 atcgacttca aggaggacgg caacatcctg gggcacaagc tggagtacaa ctacaacagc 3240 cacaacgtct atatcatggc cgacaagcag aagaacggca tcaaggtgaa cttcaagatc 3300 cgccacaaca tcgaggacgg cagcgtgcag ctcgccgacc actaccagca gaacaccccc 3360 atcggcgacg gccccgtgct gctgcccgac aaccactacc tgagcaccca gtccgccctg 3420 agcaaagacc ccaacgagaa gcgcgatcac atggtcctgc tggagttcgt gaccgccgcc 3480 gggatcactc tcggcatgga cgagctgtac aagtaaggat cccattctcc ttgatgtact 3540 aatttttctt taaaagtgat aataatagct cccatttaga atttttaaat aacacaacaa 3600 atgtaaagta actaatgtgt cctctggatc atggtaagta atgaataaat ttaactccct 3660 ttaccttctc cctttgctat tttttccatg ctaggattta tacattttta aaaaactaaa 3720 tctgctatca aatgacagct ttaaatttac tttttaaaat ttgttattgt atatatttat 3780 ggggtataaa gtgatgttat gatatatata tacacaatgt acactgatta aatcaagcca 3840 attaacattt tatcatctca aatacttaac attttttgta gtgagaacat ttgaaattta 3900 cttttagcaa tttcaaaaca tacattatta ttattaacta tagtcaccat gatgtaccat 3960 agatctttaa aaacttattc ttcctgccta actgaaactt tgtactcttt gactaacatc 4020 ttttcattcc cccacttccc agcctctggt aatcaccatt acacactctg cttctatgag 4080 ttcaattgct ttagactcca cgtaataaat gagatcatgc agcatttggc tttctgtgcc 4140 tggcttatcc ttgcttagca tggtgtctta caggttcatc catgttgcaa caaataacag 4200 aatctcattc tttgttaagg ctgaatacta ttccattggg tatatatacc acattttcct 4260 tatccattaa tccactgatg gacccttagg ttgttgattc catatattgg ctattgtaaa 4320 tagtgcagca atgaacatga gagtgcaact atctcttcaa tgtactgatt tcgaatcctt 4380 cggatctatc tcagaagtga gattgcagga tcatataatt ctacttttag tcttttgagg 4440 agctccatac agctttccat atggccatac taattacatt ctcatcaaca gtgtacaatg 4500 gtttcctttt ctccacatcc tcaccaacat ttataatttt ttgtcttttt gataatagcc 4560 atctgacagg tgtaaagtga tagctcattg cagttttaat ttgcattttt tgatgattag 4620 taatgttgag aattttttca tatatctctt ggccagttgc atgtcttctt tggaaaaatg 4680 tctattcagt tcctttgccc attttttaat tgggattttt ggtttcttgc tattgagttg 4740 tttgaattcg ctcgctttct tgctgtccaa tttctattaa aggttccttt gttccctaag 4800 tccaactact aaactggggg atattatgaa gggccttgag catctggatt ctgcctaata 4860 aaaaacattt attttcattg caagctcgct ttcttgctgt ccaatttcta ttaaaggttc 4920 ctttgttccc taagtccaac tactaaactg ggggatatta tgaagggcct tgagcatctg 4980 gattctgcct aataaaaaac atttattttc attgcaaaaa aaaaaaaaaa aaaaaaaaaa 5040 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 5100 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaactc ggaaggacat ggtgtggaaa 5160 gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt agtcagcaac 5220 caggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca tgcatctcaa 5280 ttagtcagca accaaattaa agtaacccat aacttcgtat agcatacatt atacgaagtt 5340 atgaagttcc tattctctag aaagtatagg aacttctagt cacctatttc agcatactac 5400 gcgcgtagta tgctgaaata ggtttatcag cacacaatag tccattatac gcgcgtataa 5460 tggcaattgt gtgctgattg ggttacttta atttggatcc gtcgaccgat gcccttgaga 5520 gccttcaacc cagtcagctc cttccggtgg gcgcggggca tgactatcgt cgccgcactt 5580 atgactgtct tctttatcat gcaactcgta ggacaggtgc cggcagcgct cttccgcttc 5640 ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc 5700 aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc 5760 aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag 5820 gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc 5880 gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt 5940 tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct 6000 ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg 6060 ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct 6120 tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat 6180 tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg 6240 ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa 6300 aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt 6360 ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc 6420 tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt 6480 atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta 6540 aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat 6600 ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac 6660 tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg 6720 ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag 6780 tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt 6840 aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt 6900 gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt 6960 tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt 7020 cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct 7080 tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt 7140 ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac 7200 cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa 7260 actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa 7320 ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca 7380 aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct 7440 ttttcaatat tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga 7500 atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc 7560 tgacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac 7620 cgctacactt gccagcgccc tagcgcccgc tcctttcgct ttcttccctt cctttctcgc 7680 cacgttcgcc ggctttcccc gtcaagctct aaatcggggg ctccctttag ggttccgatt 7740 tagtgcttta cggcacctcg accccaaaaa acttgattag ggtgatggtt cacgtagtgg 7800 gccatcgccc tgatagacgg tttttcgccc tttgacgttg gagtccacgt tctttaatag 7860 tggactcttg ttccaaactg gaacaacact caaccctatc tcggtctatt cttttgattt 7920 ataagggatt ttgccgattt cggcctattg gttaaaaaat gagctgattt aacaaaaatt 7980 taacgcgaat tttaacaaaa tattaacgct tacaatttgc cattcgccat tcaggctgcg 8040 caactgttgg gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc ccaagctacc 8100 atgataagta agtaatatta aggtacgtgg aggttttact tgctttaaaa aacctcccac 8160 acctccccct gaacctgaaa cataaaatga atgcaattgt tgttgttaac ttgtttattg 8220 cagcttataa tggttacaaa taaagcaata gcatcacaaa tttcacaaat aaagcatttt 8280 tttcactgca ttctagttgt ggtttgtcca aactcatcaa tgtatcttat ggtactgtaa 8340 ctgagctaac ataa 8354 <210> 30 <211> 7710 <212> DNA <213> Artificial Sequence <220> <223> SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR[2huBGpA-A120]-SS* <400> 30 cccgggaggt accgagctct tacgcgtgct agaattaaag taacccaatc agcacacaat 60 tgccattata cgcgcgtata atggactatt gtgtgctgat aaacctattt cagcatacta 120 cgcgcgtagt atgctgaaat aggtgactag aagttcctat actttctaga gaataggaac 180 ttcataactt cgtataatgt atgctatacg aagttatggg ttactttaat ttggttgctg 240 actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 300 acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 360 gggactttcc acacccctgg gtcgacgcac acgaccacaa ttccactgaa agcattttaa 420 tacggaactt gtcactccca gggagcctcc gctcagccgg cagttggttc atttcaatcc 480 ccacgacaac ccttcaaagt gcagggcaga cagcaggtgg ctctgcccag gcgcctggat 540 cacagcccgg cctgcagccc tcacctgggc gcggggagac cctgaggacg ctcctccagg 600 cggcgctggc cggggcctgc ggacacggac gggcgggctg agctccggga cccctccccg 660 cgccccgcac cccgcacccc gcaccccgca ccccgcaccc ggcgctcacc cgtcccagcc 720 ccgccgcccg cagccccagc tgcaacgcag ccaccgccgc catcgcaccc ggccccgcgg 780 gcgcttccgg gacgcaggag gcatctgcat ccggggcgcc gctgagtccc gcccagagcc 840 ccgcccccgg ctccaggttc tgcgagcggc ttccgccggg ctgctccgcg ggcgcgtcgg 900 ccatgagcga gttgccgggc gacgtgcggg cgtttctgcg ggagcacccg agcctgcggc 960 tccagacgga cgcccgcaag gttcgcagcg cgggagggga acggagtggc ggagaagggc 1020 gcagttggga tgaggggctg aggggagggc aggggagagg agagggcagg ggagagggga 1080 gaggggagag caggagagag gggaaggcag gggagagggc gcggcgggat caggggagga 1140 gagggaaggg actttccggg gcggggcacg tggtgcacgg gactttccgt gcacgtgcac 1200 gggactttcc gggactttcc gggactttcc gtgcaccacg tggggacttt ccgtgcacga 1260 cattgattat tgactagtta ttaatagtaa tcaattacgg ggtcattagt tcatagccca 1320 tatatggagt tccgcgttac ataacttacg gtaaatggcc cgcctggctg accgcccaac 1380 gacccccgcc cattgacgtc aataatgacg tatgttccca tagtaacgcc aatagggact 1440 ttccattgac gtcaatgggt ggagtattta cggtaaactg cccacttggc agtacatcaa 1500 gtgtatcata tgccaagtac gccccctatt gacgtcaatg acggtaaatg gcccgcctgg 1560 cattatgccc agtacatgac cttatgggac tttcctactt ggcagtacat ctacgtatta 1620 gtcatcgcta ttaccatggt gatgcggttt tggcagtaca tcaatgggcg tggatagcgg 1680 tttgactcac ggggatttcc aagtctccac cccattgacg tcaatgggag tttgttttgg 1740 caccaaaatc aacgggactt tccaaaatgt cgtaacaact ccgccccatt gacgcaaatg 1800 ggcggtaggc gtgtacggtg ggaggtctat ataagcagag ctctgccttc tccctcctgt 1860 gagtttggta agtcgacggg ccgggcctgg gccgggtccg ggccgggtcg ttggatcccc 1920 actacagccc gatactcaag cttgacgaat tcgagtatcc aaggtagtgg actagtgtga 1980 cgctgctgac ccctttcttt cccttctgca ggttggtgta cagtagcttc caaattgatt 2040 aattcgagcg aacgcgtcgc caccatgaac tccttctcca caagcgcctt cggtccagtt 2100 gccttctccc tgggcctgct cctggtgttg cctgctgcct tccctgcccc agtcttcaca 2160 ctcgaagatt tcgttgggga ctggcgacag acagccggct acaacctgga ccaagtcctt 2220 gaacagggag gtgtgtccag tttgtttcag aatctcgggg tgtccgtaac tccgatccaa 2280 aggattgtcc tgagcggtga aaatgggctg aagatcgaca tccatgtcat catcccgtat 2340 gaaggtctga gcggcgacca aatgggccag atcgaaaaaa tttttaaggt ggtgtaccct 2400 gtggatgatc atcactttaa ggtgatcctg cactatggca cactggtaat cgacggggtt 2460 acgccgaaca tgatcgacta tttcggacgg ccgtatgaag gcatcgccgt gttcgacggc 2520 aaaaagatca ctgtaacagg gaccctgtgg aacggcaaca aaattatcga cgagcgcctg 2580 atcaaccccg acggctccct gctgttccga gtaaccatca acggagtgac cggctggcgg 2640 ctgtgcgaac gcattctggc ggctagcgct actaacttca gcctgctgaa gcaggctgga 2700 gacgtggagg agaaccctgg acctggaagc ggagagggca gaggaagtct gctaacatgc 2760 ggtgacgtcg aggagaatcc tggacctgga tccggaatgg tgagcaaggg cgaggagctg 2820 ttcaccgggg tggtgcccat cctggtcgag ctggacggcg acgtaaacgg ccacaagttc 2880 agcgtgtccg gcgagggcga gggcgatgcc acctacggca agctgaccct gaagttcatc 2940 tgcaccaccg gcaagctgcc cgtgccctgg cccaccctcg tgaccaccct gacctacggc 3000 gtgcagtgct tcagccgcta ccccgaccac atgaagcagc acgacttctt caagtccgcc 3060 atgcccgaag gctacgtcca ggagcgcacc atcttcttca aggacgacgg caactacaag 3120 acccgcgccg aggtgaagtt cgagggcgac accctggtga accgcatcga gctgaagggc 3180 atcgacttca aggaggacgg caacatcctg gggcacaagc tggagtacaa ctacaacagc 3240 cacaacgtct atatcatggc cgacaagcag aagaacggca tcaaggtgaa cttcaagatc 3300 cgccacaaca tcgaggacgg cagcgtgcag ctcgccgacc actaccagca gaacaccccc 3360 atcggcgacg gccccgtgct gctgcccgac aaccactacc tgagcaccca gtccgccctg 3420 agcaaagacc ccaacgagaa gcgcgatcac atggtcctgc tggagttcgt gaccgccgcc 3480 gggatcactc tcggcatgga cgagctgtac aagtaaaatc aacctctgga ttacaaaatt 3540 tgtgaaagat tgactggtat tcttaactat gttgctcctt ttacgctatg tggatacgct 3600 gctttaatgc ctttgtatca tgctattgct tcccgtatgg ctttcatttt ctcctccttg 3660 tataaatcct ggttgctgtc tctttatgag gagttgtggc ccgttgtcag gcaacgtggc 3720 gtggtgtgca ctgtgtttgc tgacgcaacc cccactggtt ggggcattgc caccacctgt 3780 cagctccttt ccgggacttt cgctttcccc ctccctattg ccacggcgga actcatcgcc 3840 gcctgccttg cccgctgctg gacaggggct cggctgttgg gcactgacaa ttccgtggtg 3900 ttgtcgggga aatcatcgtc ctttccttgg ctgctcgcct gtgttgccac ctggattctg 3960 cgcgggacgt ccttctgcta cgtcccttcg gccctcaatc cagcggacct tccttcccgc 4020 ggcctgctgc cggctctgcg gcctcttccg cgtcttcgcc ttcgccctca gacgagtcgg 4080 atctcccttt gggccgcctc cccgcgctcg ctttcttgct gtccaatttc tattaaaggt 4140 tcctttgttc cctaagtcca actactaaac tgggggatat tatgaagggc cttgagcatc 4200 tggattctgc ctaataaaaa acatttattt tcattgcaag ctcgctttct tgctgtccaa 4260 tttctattaa aggttccttt gttccctaag tccaactact aaactggggg atattatgaa 4320 gggccttgag catctggatt ctgcctaata aaaaacattt attttcattg caaaaaaaaa 4380 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4440 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaactcggaa 4500 ggacatggtg tggaaagtcc ccaggctccc cagcaggcag aagtatgcaa agcatgcatc 4560 tcaattagtc agcaaccagg tgtggaaagt ccccaggctc cccagcaggc agaagtatgc 4620 aaagcatgca tctcaattag tcagcaacca aattaaagta acccataact tcgtatagca 4680 tacattatac gaagttatga agttcctatt ctctagaaag tataggaact tctagtcacc 4740 tatttcagca tactacgcgc gtagtatgct gaaataggtt tatcagcaca caatagtcca 4800 ttatacgcgc gtataatggc aattgtgtgc tgattgggtt actttaattt ggatccgtcg 4860 accgatgccc ttgagagcct tcaacccagt cagctccttc cggtgggcgc ggggcatgac 4920 tatcgtcgcc gcacttatga ctgtcttctt tatcatgcaa ctcgtaggac aggtgccggc 4980 agcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag 5040 cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag 5100 gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc 5160 tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc 5220 agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc 5280 tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt 5340 cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg 5400 ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat 5460 ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag 5520 ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt 5580 ggtggcctaa ctacggctac actagaagaa cagtatttgg tatctgcgct ctgctgaagc 5640 cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta 5700 gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag 5760 atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga 5820 ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa 5880 gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa 5940 tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc 6000 ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga 6060 taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa 6120 gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt 6180 gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg 6240 ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc 6300 aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg 6360 gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag 6420 cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt 6480 actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt 6540 caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac 6600 gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac 6660 ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag 6720 caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa 6780 tactcatact cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga 6840 gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc 6900 cccgaaaagt gccacctgac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg 6960 ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct 7020 tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc 7080 ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg 7140 atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt 7200 ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg 7260 tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc 7320 tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgcttaca atttgccatt 7380 cgccattcag gctgcgcaac tgttgggaag ggcgatcggt gcgggcctct tcgctattac 7440 gccagcccaa gctaccatga taagtaagta atattaaggt acgtggaggt tttacttgct 7500 ttaaaaaacc tcccacacct ccccctgaac ctgaaacata aaatgaatgc aattgttgtt 7560 gttaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc 7620 acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta 7680 tcttatggta ctgtaactga gctaacataa 7710 <210> 31 <211> 8182 <212> DNA <213> Artificial Sequence <220> <223> SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-MAR-WPRE-3'UTR[2huBGpA-A120]-SS* <400> 31 cccgggaggt accgagctct tacgcgtgct agaattaaag taacccaatc agcacacaat 60 tgccattata cgcgcgtata atggactatt gtgtgctgat aaacctattt cagcatacta 120 cgcgcgtagt atgctgaaat aggtgactag aagttcctat actttctaga gaataggaac 180 ttcataactt cgtataatgt atgctatacg aagttatggg ttactttaat ttggttgctg 240 actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 300 acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 360 gggactttcc acacccctgg gtcgacggga ctttccgggg cggggcacgt ggtgcacggg 420 actttccgtg cacgtgcacg ggactttccg ggactttccg ggactttccg tgcaccacgt 480 ggggactttc cgtgcacgac attgattatt gactagttat taatagtaat caattacggg 540 gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc 600 gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 660 agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 720 ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 780 cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 840 gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 900 caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 960 caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 1020 cgccccattg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata taagcagagc 1080 tctgccttct ccctcctgtg agtttggtaa gtcgacgggc cgggcctggg ccgggtccgg 1140 gccgggtcgt tggatcccca ctacagcccg atactcaagc ttgacgaatt cgagtatcca 1200 aggtagtgga ctagtgtgac gctgctgacc cctttctttc ccttctgcag gttggtgtac 1260 agtagcttcc aaattgatta attcgagcga acgcgtcgcc accatgaact ccttctccac 1320 aagcgccttc ggtccagttg ccttctccct gggcctgctc ctggtgttgc ctgctgcctt 1380 ccctgcccca gtcttcacac tcgaagattt cgttggggac tggcgacaga cagccggcta 1440 caacctggac caagtccttg aacagggagg tgtgtccagt ttgtttcaga atctcggggt 1500 gtccgtaact ccgatccaaa ggattgtcct gagcggtgaa aatgggctga agatcgacat 1560 ccatgtcatc atcccgtatg aaggtctgag cggcgaccaa atgggccaga tcgaaaaaat 1620 ttttaaggtg gtgtaccctg tggatgatca tcactttaag gtgatcctgc actatggcac 1680 actggtaatc gacggggtta cgccgaacat gatcgactat ttcggacggc cgtatgaagg 1740 catcgccgtg ttcgacggca aaaagatcac tgtaacaggg accctgtgga acggcaacaa 1800 aattatcgac gagcgcctga tcaaccccga cggctccctg ctgttccgag taaccatcaa 1860 cggagtgacc ggctggcggc tgtgcgaacg cattctggcg gctagcgcta ctaacttcag 1920 cctgctgaag caggctggag acgtggagga gaaccctgga cctggaagcg gagagggcag 1980 aggaagtctg ctaacatgcg gtgacgtcga ggagaatcct ggacctggat ccggaatggt 2040 gagcaagggc gaggagctgt tcaccggggt ggtgcccatc ctggtcgagc tggacggcga 2100 cgtaaacggc cacaagttca gcgtgtccgg cgagggcgag ggcgatgcca cctacggcaa 2160 gctgaccctg aagttcatct gcaccaccgg caagctgccc gtgccctggc ccaccctcgt 2220 gaccaccctg acctacggcg tgcagtgctt cagccgctac cccgaccaca tgaagcagca 2280 cgacttcttc aagtccgcca tgcccgaagg ctacgtccag gagcgcacca tcttcttcaa 2340 ggacgacggc aactacaaga cccgcgccga ggtgaagttc gagggcgaca ccctggtgaa 2400 ccgcatcgag ctgaagggca tcgacttcaa ggaggacggc aacatcctgg ggcacaagct 2460 ggagtacaac tacaacagcc acaacgtcta tatcatggcc gacaagcaga agaacggcat 2520 caaggtgaac ttcaagatcc gccacaacat cgaggacggc agcgtgcagc tcgccgacca 2580 ctaccagcag aacaccccca tcggcgacgg ccccgtgctg ctgcccgaca accactacct 2640 gagcacccag tccgccctga gcaaagaccc caacgagaag cgcgatcaca tggtcctgct 2700 ggagttcgtg accgccgccg ggatcactct cggcatggac gagctgtaca agtaaggatc 2760 ccattctcct tgatgtacta atttttcttt aaaagtgata ataatagctc ccatttagaa 2820 tttttaaata acacaacaaa tgtaaagtaa ctaatgtgtc ctctggatca tggtaagtaa 2880 tgaataaatt taactccctt taccttctcc ctttgctatt ttttccatgc taggatttat 2940 acatttttaa aaaactaaat ctgctatcaa atgacagctt taaatttact ttttaaaatt 3000 tgttattgta tatatttatg gggtataaag tgatgttatg atatatatat acacaatgta 3060 cactgattaa atcaagccaa ttaacatttt atcatctcaa atacttaaca ttttttgtag 3120 tgagaacatt tgaaatttac ttttagcaat ttcaaaacat acattattat tattaactat 3180 agtcaccatg atgtaccata gatctttaaa aacttattct tcctgcctaa ctgaaacttt 3240 gtactctttg actaacatct tttcattccc ccacttccca gcctctggta atcaccatta 3300 cacactctgc ttctatgagt tcaattgctt tagactccac gtaataaatg agatcatgca 3360 gcatttggct ttctgtgcct ggcttatcct tgcttagcat ggtgtcttac aggttcatcc 3420 atgttgcaac aaataacaga atctcattct ttgttaaggc tgaatactat tccattgggt 3480 atatatacca cattttcctt atccattaat ccactgatgg acccttaggt tgttgattcc 3540 atatattggc tattgtaaat agtgcagcaa tgaacatgag agtgcaacta tctcttcaat 3600 gtactgattt cgaatccttc ggatctatct cagaagtgag attgcaggat catataattc 3660 tacttttagt cttttgagga gctccataca gctttccata tggccatact aattacattc 3720 tcatcaacag tgtacaatgg tttccttttc tccacatcct caccaacatt tataattttt 3780 tgtctttttg ataatagcca tctgacaggt gtaaagtgat agctcattgc agttttaatt 3840 tgcatttttt gatgattagt aatgttgaga attttttcat atatctcttg gccagttgca 3900 tgtcttcttt ggaaaaatgt ctattcagtt cctttgccca ttttttaatt gggatttttg 3960 gtttcttgct attgagttgt ttgaattcaa tcaacctctg gattacaaaa tttgtgaaag 4020 attgactggt attcttaact atgttgctcc ttttacgcta tgtggatacg ctgctttaat 4080 gcctttgtat catgctattg cttcccgtat ggctttcatt ttctcctcct tgtataaatc 4140 ctggttgctg tctctttatg aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg 4200 cactgtgttt gctgacgcaa cccccactgg ttggggcatt gccaccacct gtcagctcct 4260 ttccgggact ttcgctttcc ccctccctat tgccacggcg gaactcatcg ccgcctgcct 4320 tgcccgctgc tggacagggg ctcggctgtt gggcactgac aattccgtgg tgttgtcggg 4380 gaaatcatcg tcctttcctt ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac 4440 gtccttctgc tacgtccctt cggccctcaa tccagcggac cttccttccc gcggcctgct 4500 gccggctctg cggcctcttc cgcgtcttcg ccttcgccct cagacgagtc ggatctccct 4560 ttgggccgcc tccccgcgct cgctttcttg ctgtccaatt tctattaaag gttcctttgt 4620 tccctaagtc caactactaa actgggggat attatgaagg gccttgagca tctggattct 4680 gcctaataaa aaacatttat tttcattgca agctcgcttt cttgctgtcc aatttctatt 4740 aaaggttcct ttgttcccta agtccaacta ctaaactggg ggatattatg aagggccttg 4800 agcatctgga ttctgcctaa taaaaaacat ttattttcat tgcaaaaaaa aaaaaaaaaa 4860 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4920 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaactcgg aaggacatgg 4980 tgtggaaagt ccccaggctc cccagcaggc agaagtatgc aaagcatgca tctcaattag 5040 tcagcaacca ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg 5100 catctcaatt agtcagcaac caaattaaag taacccataa cttcgtatag catacattat 5160 acgaagttat gaagttccta ttctctagaa agtataggaa cttctagtca cctatttcag 5220 catactacgc gcgtagtatg ctgaaatagg tttatcagca cacaatagtc cattatacgc 5280 gcgtataatg gcaattgtgt gctgattggg ttactttaat ttggatccgt cgaccgatgc 5340 ccttgagagc cttcaaccca gtcagctcct tccggtgggc gcggggcatg actatcgtcg 5400 ccgcacttat gactgtcttc tttatcatgc aactcgtagg acaggtgccg gcagcgctct 5460 tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca 5520 gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac 5580 atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt 5640 ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg 5700 cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc 5760 tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc 5820 gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc 5880 aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac 5940 tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt 6000 aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct 6060 aactacggct acactagaag aacagtattt ggtatctgcg ctctgctgaa gccagttacc 6120 ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt 6180 ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg 6240 atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc 6300 atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg aagttttaaa 6360 tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt aatcagtgag 6420 gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg 6480 tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcga 6540 gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg aagggccgag 6600 cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg ttgccgggaa 6660 gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat tgctacaggc 6720 atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc ccaacgatca 6780 aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg 6840 atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc agcactgcat 6900 aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga gtactcaacc 6960 aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc gtcaatacgg 7020 gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa acgttcttcg 7080 gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta acccactcgt 7140 gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg agcaaaaaca 7200 ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg aatactcata 7260 ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac 7320 atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa 7380 gtgccacctg acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc 7440 agcgtgaccg ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc 7500 tttctcgcca cgttcgccgg ctttccccgt caagctctaa atcgggggct ccctttaggg 7560 ttccgattta gtgctttacg gcacctcgac cccaaaaaac ttgattaggg tgatggttca 7620 cgtagtgggc catcgccctg atagacggtt tttcgccctt tgacgttgga gtccacgttc 7680 tttaatagtg gactcttgtt ccaaactgga acaacactca accctatctc ggtctattct 7740 tttgatttat aagggatttt gccgatttcg gcctattggt taaaaaatga gctgatttaa 7800 caaaaattta acgcgaattt taacaaaata ttaacgctta caatttgcca ttcgccattc 7860 aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagccc 7920 aagctaccat gataagtaag taatattaag gtacgtggag gttttacttg ctttaaaaaa 7980 cctcccacac ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt 8040 gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa 8100 agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatgg 8160 tactgtaact gagctaacat aa 8182 <210> 32 <211> 8943 <212> DNA <213> Artificial Sequence <220> <223> SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-MAR-WPRE-3'UTR[2huBGpA-A120] -SS* <400> 32 cccgggaggt accgagctct tacgcgtgct agaattaaag taacccaatc agcacacaat 60 tgccattata cgcgcgtata atggactatt gtgtgctgat aaacctattt cagcatacta 120 cgcgcgtagt atgctgaaat aggtgactag aagttcctat actttctaga gaataggaac 180 ttcataactt cgtataatgt atgctatacg aagttatggg ttactttaat ttggttgctg 240 actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 300 acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 360 gggactttcc acacccctgg gtcgacgcac acgaccacaa ttccactgaa agcattttaa 420 tacggaactt gtcactccca gggagcctcc gctcagccgg cagttggttc atttcaatcc 480 ccacgacaac ccttcaaagt gcagggcaga cagcaggtgg ctctgcccag gcgcctggat 540 cacagcccgg cctgcagccc tcacctgggc gcggggagac cctgaggacg ctcctccagg 600 cggcgctggc cggggcctgc ggacacggac gggcgggctg agctccggga cccctccccg 660 cgccccgcac cccgcacccc gcaccccgca ccccgcaccc ggcgctcacc cgtcccagcc 720 ccgccgcccg cagccccagc tgcaacgcag ccaccgccgc catcgcaccc ggccccgcgg 780 gcgcttccgg gacgcaggag gcatctgcat ccggggcgcc gctgagtccc gcccagagcc 840 ccgcccccgg ctccaggttc tgcgagcggc ttccgccggg ctgctccgcg ggcgcgtcgg 900 ccatgagcga gttgccgggc gacgtgcggg cgtttctgcg ggagcacccg agcctgcggc 960 tccagacgga cgcccgcaag gttcgcagcg cgggagggga acggagtggc ggagaagggc 1020 gcagttggga tgaggggctg aggggagggc aggggagagg agagggcagg ggagagggga 1080 gaggggagag caggagagag gggaaggcag gggagagggc gcggcgggat caggggagga 1140 gagggaaggg actttccggg gcggggcacg tggtgcacgg gactttccgt gcacgtgcac 1200 gggactttcc gggactttcc gggactttcc gtgcaccacg tggggacttt ccgtgcacga 1260 cattgattat tgactagtta ttaatagtaa tcaattacgg ggtcattagt tcatagccca 1320 tatatggagt tccgcgttac ataacttacg gtaaatggcc cgcctggctg accgcccaac 1380 gacccccgcc cattgacgtc aataatgacg tatgttccca tagtaacgcc aatagggact 1440 ttccattgac gtcaatgggt ggagtattta cggtaaactg cccacttggc agtacatcaa 1500 gtgtatcata tgccaagtac gccccctatt gacgtcaatg acggtaaatg gcccgcctgg 1560 cattatgccc agtacatgac cttatgggac tttcctactt ggcagtacat ctacgtatta 1620 gtcatcgcta ttaccatggt gatgcggttt tggcagtaca tcaatgggcg tggatagcgg 1680 tttgactcac ggggatttcc aagtctccac cccattgacg tcaatgggag tttgttttgg 1740 caccaaaatc aacgggactt tccaaaatgt cgtaacaact ccgccccatt gacgcaaatg 1800 ggcggtaggc gtgtacggtg ggaggtctat ataagcagag ctctgccttc tccctcctgt 1860 gagtttggta agtcgacggg ccgggcctgg gccgggtccg ggccgggtcg ttggatcccc 1920 actacagccc gatactcaag cttgacgaat tcgagtatcc aaggtagtgg actagtgtga 1980 cgctgctgac ccctttcttt cccttctgca ggttggtgta cagtagcttc caaattgatt 2040 aattcgagcg aacgcgtcgc caccatgaac tccttctcca caagcgcctt cggtccagtt 2100 gccttctccc tgggcctgct cctggtgttg cctgctgcct tccctgcccc agtcttcaca 2160 ctcgaagatt tcgttgggga ctggcgacag acagccggct acaacctgga ccaagtcctt 2220 gaacagggag gtgtgtccag tttgtttcag aatctcgggg tgtccgtaac tccgatccaa 2280 aggattgtcc tgagcggtga aaatgggctg aagatcgaca tccatgtcat catcccgtat 2340 gaaggtctga gcggcgacca aatgggccag atcgaaaaaa tttttaaggt ggtgtaccct 2400 gtggatgatc atcactttaa ggtgatcctg cactatggca cactggtaat cgacggggtt 2460 acgccgaaca tgatcgacta tttcggacgg ccgtatgaag gcatcgccgt gttcgacggc 2520 aaaaagatca ctgtaacagg gaccctgtgg aacggcaaca aaattatcga cgagcgcctg 2580 atcaaccccg acggctccct gctgttccga gtaaccatca acggagtgac cggctggcgg 2640 ctgtgcgaac gcattctggc ggctagcgct actaacttca gcctgctgaa gcaggctgga 2700 gacgtggagg agaaccctgg acctggaagc ggagagggca gaggaagtct gctaacatgc 2760 ggtgacgtcg aggagaatcc tggacctgga tccggaatgg tgagcaaggg cgaggagctg 2820 ttcaccgggg tggtgcccat cctggtcgag ctggacggcg acgtaaacgg ccacaagttc 2880 agcgtgtccg gcgagggcga gggcgatgcc acctacggca agctgaccct gaagttcatc 2940 tgcaccaccg gcaagctgcc cgtgccctgg cccaccctcg tgaccaccct gacctacggc 3000 gtgcagtgct tcagccgcta ccccgaccac atgaagcagc acgacttctt caagtccgcc 3060 atgcccgaag gctacgtcca ggagcgcacc atcttcttca aggacgacgg caactacaag 3120 acccgcgccg aggtgaagtt cgagggcgac accctggtga accgcatcga gctgaagggc 3180 atcgacttca aggaggacgg caacatcctg gggcacaagc tggagtacaa ctacaacagc 3240 cacaacgtct atatcatggc cgacaagcag aagaacggca tcaaggtgaa cttcaagatc 3300 cgccacaaca tcgaggacgg cagcgtgcag ctcgccgacc actaccagca gaacaccccc 3360 atcggcgacg gccccgtgct gctgcccgac aaccactacc tgagcaccca gtccgccctg 3420 agcaaagacc ccaacgagaa gcgcgatcac atggtcctgc tggagttcgt gaccgccgcc 3480 gggatcactc tcggcatgga cgagctgtac aagtaaggat cccattctcc ttgatgtact 3540 aatttttctt taaaagtgat aataatagct cccatttaga atttttaaat aacacaacaa 3600 atgtaaagta actaatgtgt cctctggatc atggtaagta atgaataaat ttaactccct 3660 ttaccttctc cctttgctat tttttccatg ctaggattta tacattttta aaaaactaaa 3720 tctgctatca aatgacagct ttaaatttac tttttaaaat ttgttattgt atatatttat 3780 ggggtataaa gtgatgttat gatatatata tacacaatgt acactgatta aatcaagcca 3840 attaacattt tatcatctca aatacttaac attttttgta gtgagaacat ttgaaattta 3900 cttttagcaa tttcaaaaca tacattatta ttattaacta tagtcaccat gatgtaccat 3960 agatctttaa aaacttattc ttcctgccta actgaaactt tgtactcttt gactaacatc 4020 ttttcattcc cccacttccc agcctctggt aatcaccatt acacactctg cttctatgag 4080 ttcaattgct ttagactcca cgtaataaat gagatcatgc agcatttggc tttctgtgcc 4140 tggcttatcc ttgcttagca tggtgtctta caggttcatc catgttgcaa caaataacag 4200 aatctcattc tttgttaagg ctgaatacta ttccattggg tatatatacc acattttcct 4260 tatccattaa tccactgatg gacccttagg ttgttgattc catatattgg ctattgtaaa 4320 tagtgcagca atgaacatga gagtgcaact atctcttcaa tgtactgatt tcgaatcctt 4380 cggatctatc tcagaagtga gattgcagga tcatataatt ctacttttag tcttttgagg 4440 agctccatac agctttccat atggccatac taattacatt ctcatcaaca gtgtacaatg 4500 gtttcctttt ctccacatcc tcaccaacat ttataatttt ttgtcttttt gataatagcc 4560 atctgacagg tgtaaagtga tagctcattg cagttttaat ttgcattttt tgatgattag 4620 taatgttgag aattttttca tatatctctt ggccagttgc atgtcttctt tggaaaaatg 4680 tctattcagt tcctttgccc attttttaat tgggattttt ggtttcttgc tattgagttg 4740 tttgaattca atcaacctct ggattacaaa atttgtgaaa gattgactgg tattcttaac 4800 tatgttgctc cttttacgct atgtggatac gctgctttaa tgcctttgta tcatgctatt 4860 gcttcccgta tggctttcat tttctcctcc ttgtataaat cctggttgct gtctctttat 4920 gaggagttgt ggcccgttgt caggcaacgt ggcgtggtgt gcactgtgtt tgctgacgca 4980 acccccactg gttggggcat tgccaccacc tgtcagctcc tttccgggac tttcgctttc 5040 cccctcccta ttgccacggc ggaactcatc gccgcctgcc ttgcccgctg ctggacaggg 5100 gctcggctgt tgggcactga caattccgtg gtgttgtcgg ggaaatcatc gtcctttcct 5160 tggctgctcg cctgtgttgc cacctggatt ctgcgcggga cgtccttctg ctacgtccct 5220 tcggccctca atccagcgga ccttccttcc cgcggcctgc tgccggctct gcggcctctt 5280 ccgcgtcttc gccttcgccc tcagacgagt cggatctccc tttgggccgc ctccccgcgc 5340 tcgctttctt gctgtccaat ttctattaaa ggttcctttg ttccctaagt ccaactacta 5400 aactggggga tattatgaag ggccttgagc atctggattc tgcctaataa aaaacattta 5460 ttttcattgc aagctcgctt tcttgctgtc caatttctat taaaggttcc tttgttccct 5520 aagtccaact actaaactgg gggatattat gaagggcctt gagcatctgg attctgccta 5580 ataaaaaaca tttattttca ttgcaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 5640 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 5700 aaaaaaaaaa aaaaaaaaaa aaaaaactcg gaaggacatg gtgtggaaag tccccaggct 5760 ccccagcagg cagaagtatg caaagcatgc atctcaatta gtcagcaacc aggtgtggaa 5820 agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa 5880 ccaaattaaa gtaacccata acttcgtata gcatacatta tacgaagtta tgaagttcct 5940 attctctaga aagtatagga acttctagtc acctatttca gcatactacg cgcgtagtat 6000 gctgaaatag gtttatcagc acacaatagt ccattatacg cgcgtataat ggcaattgtg 6060 tgctgattgg gttactttaa tttggatccg tcgaccgatg cccttgagag ccttcaaccc 6120 agtcagctcc ttccggtggg cgcggggcat gactatcgtc gccgcactta tgactgtctt 6180 ctttatcatg caactcgtag gacaggtgcc ggcagcgctc ttccgcttcc tcgctcactg 6240 actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa 6300 tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc 6360 aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc 6420 ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat 6480 aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc 6540 cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct 6600 cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg 6660 aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc 6720 cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga 6780 ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa 6840 gaacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta 6900 gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc 6960 agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg 7020 acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga 7080 tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg 7140 agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct 7200 gtctatttcg ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg 7260 agggcttacc atctggcccc agtgctgcaa tgataccgcg agacccacgc tcaccggctc 7320 cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa 7380 ctttatccgc ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc 7440 cagttaatag tttgcgcaac gttgttgcca ttgctacagg catcgtggtg tcacgctcgt 7500 cgtttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc 7560 ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt 7620 tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc 7680 catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt 7740 gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg ggataatacc gcgccacata 7800 gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa ctctcaagga 7860 tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag 7920 catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa 7980 aaaagggaat aagggcgaca cggaaatgtt gaatactcat actcttcctt tttcaatatt 8040 attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga 8100 aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct gacgcgccct 8160 gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg 8220 ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc acgttcgccg 8280 gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt agtgctttac 8340 ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg ccatcgccct 8400 gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ggactcttgt 8460 tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta taagggattt 8520 tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt aacgcgaatt 8580 ttaacaaaat attaacgctt acaatttgcc attcgccatt caggctgcgc aactgttggg 8640 aagggcgatc ggtgcgggcc tcttcgctat tacgccagcc caagctacca tgataagtaa 8700 gtaatattaa ggtacgtgga ggttttactt gctttaaaaa acctcccaca cctccccctg 8760 aacctgaaac ataaaatgaa tgcaattgtt gttgttaact tgtttattgc agcttataat 8820 ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat 8880 tctagttgtg gtttgtccaa actcatcaat gtatcttatg gtactgtaac tgagctaaca 8940 taa 8943 <210> 33 <211> 340 <212> DNA <213> Artificial Sequence <220> <223> Super Sequence, SS* <400> 33 taaagtaacc caatcagcac acaattgcca ttatacgcgc gtataatgga ctattgtgtg 60 ctgataaacc tatttcagca tactacgcgc gtagtatgct gaaataggtg actagaagtt 120 cctatacttt ctagagaata ggaacttcat aacttcgtat aatgtatgct atacgaagtt 180 atgggttact ttaatttggt tgctgactaa ttgagatgca tgctttgcat acttctgcct 240 gctggggagc ctggggactt tccacacctg gttgctgact aattgagatg catgctttgc 300 atacttctgc ctgctgggga gcctggggac tttccacacc 340 <210> 34 <211> 6326 <212> DNA <213> Artificial Sequence <220> <223> pGL2-CAG-SecNLuc-2A-eGFP-WPRE-bGlobin polyA <400> 34 cccgggaggt accgagctct tacgcgtgct agcctgggtc gacattgatt attgactagt 60 tattaatagt aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt 120 acataactta cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg 180 tcaataatga cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg 240 gtggagtatt tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt 300 acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg 360 accttatggg actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg 420 gtcgaggtga gccccacgtt ctgcttcact ctccccatct cccccccctc cccaccccca 480 attttgtatt tatttatttt ttaattattt tgtgcagcga tgggggcggg gggggggggg 540 gcgcgcgcca ggcggggcgg ggcggggcga ggggcggggc ggggcgaggc ggaaaggtgc 600 ggcggcagcc aatcagagcg gcgcgctccg aaagtttcct tttatggcga ggcggcggcg 660 gcggcggccc tataaaaagc gaagcgcgcg gcgggcggga gtcgctgcgt tgccttcgcc 720 ccgtgccccg ctccgcgccg cctcgcgccg cccgccccgg ctctgactga ccgcgttact 780 cccacaggtg agcgggcggg acggcccttc tcctccgggc tgtaattagc gcttggttta 840 atgacggctc gtttcttttc tgtggctgcg tgaaagcctt aaagggctcc gggagggccc 900 tttgtgcggg ggggagcggc tcggggggtg cgtgcgtgtg tgtgtgcgtg gggagcgccg 960 cgtgcggctc cgcgctgccc ggcggctgtg agcgctgcgg gcgcggcgcg gggctttgtg 1020 cgctccgcag tgtgcgcgag gggagcgcgg ccgggggcgg tgccccgcgg tgcggggggg 1080 gctgcgaggg gaacaaaggc tgcgtgcggg gtgtgtgcgt gggggggtga gcagggggtg 1140 tgggcgcggc ggtcgggctg taaccccccc ctgcaccccc ctccccgagt tgctgagcac 1200 ggcccggctt cgggtgcggg gctccgtacg gggcgtggcg cggggctcgc cgtgccgggc 1260 ggggggtggc ggcaggtggg ggtgccgggc ggggcggggc cgcctcgggc cggggagggc 1320 tcgggggagg ggcgcggcgg cccccggagc gccggcggct gtcgaggcgc ggcgagccgc 1380 agccattgcc ttttatggta atcgtgcgag agggcgcagg gacttccttt gtcccaaatc 1440 tgtgcggagc cgaaatctgg gaggcgccgc cgcaccccct ctagcgggcg cggggcgaag 1500 cggtgcggcg ccggcaggaa ggaaatgggc ggggagggcc ttcgtgcgtc gccgcgccgc 1560 cgtccccttc tccctctcca gcctcggggc tgtccgcggg gggacggctg ccttcggggg 1620 ggacggggca gggcggggtt cggcttctgg cgtgtgaccg gcggctctag agcctctgct 1680 aaccatgttc atgccttctt ctttttccta cagctcctgg gcaacgtgct ggttattgtg 1740 ctgtctcatc attttggcaa agaattgatt aattcgagcg aacgcgtcgc caccatgaac 1800 tccttctcca caagcgcctt cggtccagtt gccttctccc tgggcctgct cctggtgttg 1860 cctgctgcct tccctgcccc agtcttcaca ctcgaagatt tcgttgggga ctggcgacag 1920 acagccggct acaacctgga ccaagtcctt gaacagggag gtgtgtccag tttgtttcag 1980 aatctcgggg tgtccgtaac tccgatccaa aggattgtcc tgagcggtga aaatgggctg 2040 aagatcgaca tccatgtcat catcccgtat gaaggtctga gcggcgacca aatgggccag 2100 atcgaaaaaa tttttaaggt ggtgtaccct gtggatgatc atcactttaa ggtgatcctg 2160 cactatggca cactggtaat cgacggggtt acgccgaaca tgatcgacta tttcggacgg 2220 ccgtatgaag gcatcgccgt gttcgacggc aaaaagatca ctgtaacagg gaccctgtgg 2280 aacggcaaca aaattatcga cgagcgcctg atcaaccccg acggctccct gctgttccga 2340 gtaaccatca acggagtgac cggctggcgg ctgtgcgaac gcattctggc ggctagcgct 2400 actaacttca gcctgctgaa gcaggctgga gacgtggagg agaaccctgg acctggaagc 2460 ggagagggca gaggaagtct gctaacatgc ggtgacgtcg aggagaatcc tggacctgga 2520 tccggaatgg tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag 2580 ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc 2640 acctacggca agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg 2700 cccaccctcg tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac 2760 atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc 2820 atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac 2880 accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg 2940 gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag 3000 aagaacggca tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag 3060 ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac 3120 aaccactacc tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac 3180 atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctgtac 3240 aagtaagcgg ccgcactcct caggtgcagg ctgcctatca gaaggtggtg gctggtgtgg 3300 ccaatgccct ggctcacaaa taccactgag atctttttcc ctctgccaaa aattatgggg 3360 acatcatgaa gccccttgag catctgactt ctggctaata aaggaaattt attttcattg 3420 caatagtgtg ttggaatttt ttgtgtctct cactcggaag gacattggat ccgtcgaccg 3480 atgcccttga gagccttcaa cccagtcagc tccttccggt gggcgcgggg catgactatc 3540 gtcgccgcac ttatgactgt cttctttatc atgcaactcg taggacaggt gccggcagcg 3600 ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt 3660 atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa 3720 gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc 3780 gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag 3840 gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt 3900 gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg 3960 aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg 4020 ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg 4080 taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac 4140 tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg 4200 gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt 4260 taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg 4320 tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc 4380 tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt 4440 ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt 4500 taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag 4560 tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt 4620 cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg caatgatacc 4680 gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc 4740 cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg 4800 ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac 4860 aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg 4920 atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc 4980 tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact 5040 gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc 5100 aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat 5160 acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc 5220 ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac 5280 tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa 5340 aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact 5400 catactcttc ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg 5460 atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg 5520 aaaagtgcca cctgacgcgc cctgtagcgg cgcattaagc gcggcgggtg tggtggttac 5580 gcgcagcgtg accgctacac ttgccagcgc cctagcgccc gctcctttcg ctttcttccc 5640 ttcctttctc gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt 5700 agggttccga tttagtgctt tacggcacct cgaccccaaa aaacttgatt agggtgatgg 5760 ttcacgtagt gggccatcgc cctgatagac ggtttttcgc cctttgacgt tggagtccac 5820 gttctttaat agtggactct tgttccaaac tggaacaaca ctcaacccta tctcggtcta 5880 ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa atgagctgat 5940 ttaacaaaaa tttaacgcga attttaacaa aatattaacg cttacaattt gccattcgcc 6000 attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc tattacgcca 6060 gcccaagcta ccatgataag taagtaatat taaggtacgt ggaggtttta cttgctttaa 6120 aaaacctccc acacctcccc ctgaacctga aacataaaat gaatgcaatt gttgttgtta 6180 acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 6240 ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 6300 atggtactgt aactgagcta acataa 6326 <210> 35 <211> 1626 <212> DNA <213> Artificial Sequence <220> <223> CAG [E1X3+CBA promoter+intron] <400> 35 gggactttcc ggggcggggc acgtggtgca cgggactttc cgtgcacgtg cacgggactt 60 tccgggactt tccgggactt tccgtgcacc acgtggggac tttccgtgca cgggactttc 120 cggggcgggg cacgtggtgc acgggacttt ccgtgcacgt gcacgggact ttccgggact 180 ttccgggact ttccgtgcac cacgtgggga ctttccgtgc acgggacttt ccggggcggg 240 gcacgtggtg cacgggactt tccgtgcacg tgcacgggac tttccgggac tttccgggac 300 tttccgtgca ccacgtgggg actttccgtg cacgtcgagg tgagccccac gttctgcttc 360 actctcccca tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta 420 ttttgtgcag cgatgggggc gggggggggg ggggcgcgcg ccaggcgggg cggggcgggg 480 cgaggggcgg ggcggggcga ggcggaaagg tgcggcggca gccaatcaga gcggcgcgct 540 ccgaaagttt ccttttatgg cgaggcggcg gcggcggcgg ccctataaaa agcgaagcgc 600 gcggcgggcg ggagtcgctg cgttgccttc gccccgtgcc ccgctccgcg ccgcctcgcg 660 ccgcccgccc cggctctgac tgaccgcgtt actcccacag gtgagcgggc gggacggccc 720 ttctcctccg ggctgtaatt agcgcttggt ttaatgacgg ctcgtttctt ttctgtggct 780 gcgtgaaagc cttaaagggc tccgggaggg ccctttgtgc gggggggagc ggctcggggg 840 gtgcgtgcgt gtgtgtgtgc gtggggagcg ccgcgtgcgg ctccgcgctg cccggcggct 900 gtgagcgctg cgggcgcggc gcggggcttt gtgcgctccg cagtgtgcgc gaggggagcg 960 cggccggggg cggtgccccg cggtgcgggg ggggctgcga ggggaacaaa ggctgcgtgc 1020 ggggtgtgtg cgtggggggg tgagcagggg gtgtgggcgc ggcggtcggg ctgtaacccc 1080 cccctgcacc cccctccccg agttgctgag cacggcccgg cttcgggtgc ggggctccgt 1140 acggggcgtg gcgcggggct cgccgtgccg ggcggggggt ggcggcaggt gggggtgccg 1200 ggcggggcgg ggccgcctcg ggccggggag ggctcggggg aggggcgcgg cggcccccgg 1260 agcgccggcg gctgtcgagg cgcggcgagc cgcagccatt gccttttatg gtaatcgtgc 1320 gagagggcgc agggacttcc tttgtcccaa atctgtgcgg agccgaaatc tgggaggcgc 1380 cgccgcaccc cctctagcgg gcgcggggcg aagcggtgcg gcgccggcag gaaggaaatg 1440 ggcggggagg gccttcgtgc gtcgccgcgc cgccgtcccc ttctccctct ccagcctcgg 1500 ggctgtccgc ggggggacgg ctgccttcgg gggggacggg gcagggcggg gttcggcttc 1560 tggcgtgtga ccggcggctc tagagcctct gctaaccatg ttcatgcctt cttctttttc 1620 ctacag 1626 <210> 36 <211> 1559 <212> DNA <213> Artificial Sequence <220> <223> CAG [E2+CBA promoter+intron] <400> 36 tgggactttc cactagacat gacacagcaa tctgatatgc ttgcgtgaga agaggattca 60 tatcctggga ctttccacag attttaccgg aagttgttag atgcttgcgt gagaagatct 120 aacatgacac agcaatcctt agtgggactt tccaagtatg tggggcgggg agtatacatg 180 acacagcaat tgatcattac cggaagttta taggtgggac tttccagacc tatgcttgcg 240 tgagaagaaa ggtctgggac tttccagtcg aggtgagccc cacgttctgc ttcactctcc 300 ccatctcccc cccctcccca cccccaattt tgtatttatt tattttttaa ttattttgtg 360 cagcgatggg ggcggggggg gggggggcgc gcgccaggcg gggcggggcg gggcgagggg 420 cggggcgggg cgaggcggaa aggtgcggcg gcagccaatc agagcggcgc gctccgaaag 480 tttcctttta tggcgaggcg gcggcggcgg cggccctata aaaagcgaag cgcgcggcgg 540 gcgggagtcg ctgcgttgcc ttcgccccgt gccccgctcc gcgccgcctc gcgccgcccg 600 ccccggctct gactgaccgc gttactccca caggtgagcg ggcgggacgg cccttctcct 660 ccgggctgta attagcgctt ggtttaatga cggctcgttt cttttctgtg gctgcgtgaa 720 agccttaaag ggctccggga gggccctttg tgcggggggg agcggctcgg ggggtgcgtg 780 cgtgtgtgtg tgcgtgggga gcgccgcgtg cggctccgcg ctgcccggcg gctgtgagcg 840 ctgcgggcgc ggcgcggggc tttgtgcgct ccgcagtgtg cgcgagggga gcgcggccgg 900 gggcggtgcc ccgcggtgcg gggggggctg cgaggggaac aaaggctgcg tgcggggtgt 960 gtgcgtgggg gggtgagcag ggggtgtggg cgcggcggtc gggctgtaac ccccccctgc 1020 acccccctcc ccgagttgct gagcacggcc cggcttcggg tgcggggctc cgtacggggc 1080 gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca ggtgggggtg ccgggcgggg 1140 cggggccgcc tcgggccggg gagggctcgg gggaggggcg cggcggcccc cggagcgccg 1200 gcggctgtcg aggcgcggcg agccgcagcc attgcctttt atggtaatcg tgcgagaggg 1260 cgcagggact tcctttgtcc caaatctgtg cggagccgaa atctgggagg cgccgccgca 1320 ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg caggaaggaa atgggcgggg 1380 agggccttcg tgcgtcgccg cgccgccgtc cccttctccc tctccagcct cggggctgtc 1440 cgcgggggga cggctgcctt cgggggggac ggggcagggc ggggttcggc ttctggcgtg 1500 tgaccggcgg ctctagagcc tctgctaacc atgttcatgc cttcttcttt ttcctacag 1559 <210> 37 <211> 826 <212> DNA <213> Artificial Sequence <220> <223> CAG [E1X3+CBA promoter+UTR1] <400> 37 gggactttcc ggggcggggc acgtggtgca cgggactttc cgtgcacgtg cacgggactt 60 tccgggactt tccgggactt tccgtgcacc acgtggggac tttccgtgca cgggactttc 120 cggggcgggg cacgtggtgc acgggacttt ccgtgcacgt gcacgggact ttccgggact 180 ttccgggact ttccgtgcac cacgtgggga ctttccgtgc acgggacttt ccggggcggg 240 gcacgtggtg cacgggactt tccgtgcacg tgcacgggac tttccgggac tttccgggac 300 tttccgtgca ccacgtgggg actttccgtg cacgtcgagg tgagccccac gttctgcttc 360 actctcccca tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta 420 ttttgtgcag cgatgggggc gggggggggg ggggcgcgcg ccaggcgggg cggggcgggg 480 cgaggggcgg ggcggggcga ggcggaaagg tgcggcggca gccaatcaga gcggcgcgct 540 ccgaaagttt ccttttatgg cgaggcggcg gcggcggcgg ccctataaaa agcgaagcgc 600 gcggcgggcg ctgccttctc cctcctgtga gtttggtaag tcgacgggcc gggcctgggc 660 cgggtccggg ccgggtcgtt ggatccccac tacagcccga tactcaagct tgacgaattc 720 gagtatccaa ggtagtggac tagtgtgacg ctgctgaccc ctttctttcc cttctgcagg 780 ttggtgtaca gtagcttcca aattgattaa ttcgagcgaa cgcgtc 826 <210> 38 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> CAG [E2 (U100)+CBA promoter+UTR1] <400> 38 tgggactttc cactagacat gacacagcaa tctgatatgc ttgcgtgaga agaggattca 60 tatcctggga ctttccacag attttaccgg aagttgttag atgcttgcgt gagaagatct 120 aacatgacac agcaatcctt agtgggactt tccaagtatg tggggcgggg agtatacatg 180 acacagcaat tgatcattac cggaagttta taggtgggac tttccagacc tatgcttgcg 240 tgagaagaaa ggtctgggac tttccagtcg aggtgagccc cacgttctgc ttcactctcc 300 ccatctcccc cccctcccca cccccaattt tgtatttatt tattttttaa ttattttgtg 360 cagcgatggg ggcggggggg gggggggcgc gcgccaggcg gggcggggcg gggcgagggg 420 cggggcgggg cgaggcggaa aggtgcggcg gcagccaatc agagcggcgc gctccgaaag 480 tttcctttta tggcgaggcg gcggcggcgg cggccctata aaaagcgaag cgcgcggcgg 540 gcgctgcctt ctccctcctg tgagtttggt aagtcgacgg gccgggcctg ggccgggtcc 600 gggccgggtc gttggatccc cactacagcc cgatactcaa gcttgacgaa ttcgagtatc 660 caaggtagtg gactagtgtg acgctgctga cccctttctt tcccttctgc aggttggtgt 720 acagtagctt ccaaattgat taattcgagc gaacgcgtc 759 <210> 39 <211> 808 <212> DNA <213> Artificial Sequence <220> <223> CMV enhancer-EF1-UTR1 <400> 39 gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60 catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120 acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180 ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240 aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300 ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360 tagtcatcgc tattaccatg gggcagagcg cacatcgccc acagtccccg agaagttggg 420 gggaggggtc ggcaattgaa ccggtgccta gagaaggtgg cgcggggtaa actgggaaag 480 tgatgtcgtg tactggctcc gcctttttcc cgagggtggg ggagaaccgt atataagtgc 540 agtagtcgcc gtgaacgttc tttttcgcaa cgggtttgcc gccagaacac agctgccttc 600 tccctcctgt gagtttggta agtcgacggg ccgggcctgg gccgggtccg ggccgggtcg 660 ttggatcccc actacagccc gatactcaag cttgacgaat tcgagtatcc aaggtagtgg 720 actagtgtga cgctgctgac ccctttcttt cccttctgca ggttggtgta cagtagcttc 780 caaattgatt aattcgagcg aacgcgtc 808 <210> 40 <211> 7772 <212> DNA <213> Artificial Sequence <220> <223> 40 4-1 pGL2-SS*-CAG [CMV enhancer+CBA Promoter+intron]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 to 120 polyA)-SS* <400> 40 cccgggaggt accgagctct tacgcgtgct agaattaaag taacccaatc agcacacaat 60 tgccattata cgcgcgtata atggactatt gtgtgctgat aaacctattt cagcatacta 120 cgcgcgtagt atgctgaaat aggtgactag aagttcctat actttctaga gaataggaac 180 ttcataactt cgtataatgt atgctatacg aagttatggg ttactttaat ttggttgctg 240 actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 300 acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 360 gggactttcc acacccctgg gtcgacgaca ttgattattg actagttatt aatagtaatc 420 aattacgggg tcattagttc atagcccata tatggagttc cgcgttacat aacttacggt 480 aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta 540 tgttcccata gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg 600 gtaaactgcc cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga 660 cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt 720 tcctacttgg cagtacatct acgtattagt catcgctatt accatggtcg aggtgagccc 780 cacgttctgc ttcactctcc ccatctcccc cccctcccca cccccaattt tgtatttatt 840 tattttttaa ttattttgtg cagcgatggg ggcggggggg gggggggcgc gcgccaggcg 900 gggcggggcg gggcgagggg cggggcgggg cgaggcggaa aggtgcggcg gcagccaatc 960 agagcggcgc gctccgaaag tttcctttta tggcgaggcg gcggcggcgg cggccctata 1020 aaaagcgaag cgcgcggcgg gcgggagtcg ctgcgttgcc ttcgccccgt gccccgctcc 1080 gcgccgcctc gcgccgcccg ccccggctct gactgaccgc gttactccca caggtgagcg 1140 ggcgggacgg cccttctcct ccgggctgta attagcgctt ggtttaatga cggctcgttt 1200 cttttctgtg gctgcgtgaa agccttaaag ggctccggga gggccctttg tgcggggggg 1260 agcggctcgg ggggtgcgtg cgtgtgtgtg tgcgtgggga gcgccgcgtg cggctccgcg 1320 ctgcccggcg gctgtgagcg ctgcgggcgc ggcgcggggc tttgtgcgct ccgcagtgtg 1380 cgcgagggga gcgcggccgg gggcggtgcc ccgcggtgcg gggggggctg cgaggggaac 1440 aaaggctgcg tgcggggtgt gtgcgtgggg gggtgagcag ggggtgtggg cgcggcggtc 1500 gggctgtaac ccccccctgc acccccctcc ccgagttgct gagcacggcc cggcttcggg 1560 tgcggggctc cgtacggggc gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca 1620 ggtgggggtg ccgggcgggg cggggccgcc tcgggccggg gagggctcgg gggaggggcg 1680 cggcggcccc cggagcgccg gcggctgtcg aggcgcggcg agccgcagcc attgcctttt 1740 atggtaatcg tgcgagaggg cgcagggact tcctttgtcc caaatctgtg cggagccgaa 1800 atctgggagg cgccgccgca ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg 1860 caggaaggaa atgggcgggg agggccttcg tgcgtcgccg cgccgccgtc cccttctccc 1920 tctccagcct cggggctgtc cgcgggggga cggctgcctt cgggggggac ggggcagggc 1980 ggggttcggc ttctggcgtg tgaccggcgg ctctagagcc tctgctaacc atgttcatgc 2040 cttcttcttt ttcctacagc tcctgggcaa cgtgctggtt attgtgctgt ctcatcattt 2100 tggcaaagaa ttgattaatt cgagcgaacg cgtcgccacc atgaactcct tctccacaag 2160 cgccttcggt ccagttgcct tctccctggg cctgctcctg gtgttgcctg ctgccttccc 2220 tgccccagtc ttcacactcg aagatttcgt tggggactgg cgacagacag ccggctacaa 2280 cctggaccaa gtccttgaac agggaggtgt gtccagtttg tttcagaatc tcggggtgtc 2340 cgtaactccg atccaaagga ttgtcctgag cggtgaaaat gggctgaaga tcgacatcca 2400 tgtcatcatc ccgtatgaag gtctgagcgg cgaccaaatg ggccagatcg aaaaaatttt 2460 taaggtggtg taccctgtgg atgatcatca ctttaaggtg atcctgcact atggcacact 2520 ggtaatcgac ggggttacgc cgaacatgat cgactatttc ggacggccgt atgaaggcat 2580 cgccgtgttc gacggcaaaa agatcactgt aacagggacc ctgtggaacg gcaacaaaat 2640 tatcgacgag cgcctgatca accccgacgg ctccctgctg ttccgagtaa ccatcaacgg 2700 agtgaccggc tggcggctgt gcgaacgcat tctggcggct agcgctacta acttcagcct 2760 gctgaagcag gctggagacg tggaggagaa ccctggacct ggaagcggag agggcagagg 2820 aagtctgcta acatgcggtg acgtcgagga gaatcctgga cctggatccg gaatggtgag 2880 caagggcgag gagctgttca ccggggtggt gcccatcctg gtcgagctgg acggcgacgt 2940 aaacggccac aagttcagcg tgtccggcga gggcgagggc gatgccacct acggcaagct 3000 gaccctgaag ttcatctgca ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac 3060 caccctgacc tacggcgtgc agtgcttcag ccgctacccc gaccacatga agcagcacga 3120 cttcttcaag tccgccatgc ccgaaggcta cgtccaggag cgcaccatct tcttcaagga 3180 cgacggcaac tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc tggtgaaccg 3240 catcgagctg aagggcatcg acttcaagga ggacggcaac atcctggggc acaagctgga 3300 gtacaactac aacagccaca acgtctatat catggccgac aagcagaaga acggcatcaa 3360 ggtgaacttc aagatccgcc acaacatcga ggacggcagc gtgcagctcg ccgaccacta 3420 ccagcagaac acccccatcg gcgacggccc cgtgctgctg cccgacaacc actacctgag 3480 cacccagtcc gccctgagca aagaccccaa cgagaagcgc gatcacatgg tcctgctgga 3540 gttcgtgacc gccgccggga tcactctcgg catggacgag ctgtacaagt aaaatcaacc 3600 tctggattac aaaatttgtg aaagattgac tggtattctt aactatgttg ctccttttac 3660 gctatgtgga tacgctgctt taatgccttt gtatcatgct attgcttccc gtatggcttt 3720 cattttctcc tccttgtata aatcctggtt gctgtctctt tatgaggagt tgtggcccgt 3780 tgtcaggcaa cgtggcgtgg tgtgcactgt gtttgctgac gcaaccccca ctggttgggg 3840 cattgccacc acctgtcagc tcctttccgg gactttcgct ttccccctcc ctattgccac 3900 ggcggaactc atcgccgcct gccttgcccg ctgctggaca ggggctcggc tgttgggcac 3960 tgacaattcc gtggtgttgt cggggaaatc atcgtccttt ccttggctgc tcgcctgtgt 4020 tgccacctgg attctgcgcg ggacgtcctt ctgctacgtc ccttcggccc tcaatccagc 4080 ggaccttcct tcccgcggcc tgctgccggc tctgcggcct cttccgcgtc ttcgccttcg 4140 ccctcagacg agtcggatct ccctttgggc cgcctccccg cgctcgcttt cttgctgtcc 4200 aatttctatt aaaggttcct ttgttcccta agtccaacta ctaaactggg ggatattatg 4260 aagggccttg agcatctgga ttctgcctaa taaaaaacat ttattttcat tgcaagctcg 4320 ctttcttgct gtccaatttc tattaaaggt tcctttgttc cctaagtcca actactaaac 4380 tgggggatat tatgaagggc cttgagcatc tggattctgc ctaataaaaa acatttattt 4440 tcattgcaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4500 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaactcgg 4560 aaggacatgg tgtggaaagt ccccaggctc cccagcaggc agaagtatgc aaagcatgca 4620 tctcaattag tcagcaacca ggtgtggaaa gtccccaggc tccccagcag gcagaagtat 4680 gcaaagcatg catctcaatt agtcagcaac caaattaaag taacccataa cttcgtatag 4740 catacattat acgaagttat gaagttccta ttctctagaa agtataggaa cttctagtca 4800 cctatttcag catactacgc gcgtagtatg ctgaaatagg tttatcagca cacaatagtc 4860 cattatacgc gcgtataatg gcaattgtgt gctgattggg ttactttaat ttggatccgt 4920 cgaccgatgc ccttgagagc cttcaaccca gtcagctcct tccggtgggc gcggggcatg 4980 actatcgtcg ccgcacttat gactgtcttc tttatcatgc aactcgtagg acaggtgccg 5040 gcagcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg 5100 agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc 5160 aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt 5220 gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag 5280 tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc 5340 cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc 5400 ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt 5460 cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt 5520 atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc 5580 agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa 5640 gtggtggcct aactacggct acactagaag aacagtattt ggtatctgcg ctctgctgaa 5700 gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg 5760 tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga 5820 agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg 5880 gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg 5940 aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt 6000 aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact 6060 ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat 6120 gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg 6180 aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg 6240 ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat 6300 tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc 6360 ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt 6420 cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc 6480 agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga 6540 gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc 6600 gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa 6660 acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta 6720 acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg 6780 agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg 6840 aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat 6900 gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt 6960 tccccgaaaa gtgccacctg acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt 7020 ggttacgcgc agcgtgaccg ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt 7080 cttcccttcc tttctcgcca cgttcgccgg ctttccccgt caagctctaa atcgggggct 7140 ccctttaggg ttccgattta gtgctttacg gcacctcgac cccaaaaaac ttgattaggg 7200 tgatggttca cgtagtgggc catcgccctg atagacggtt tttcgccctt tgacgttgga 7260 gtccacgttc tttaatagtg gactcttgtt ccaaactgga acaacactca accctatctc 7320 ggtctattct tttgatttat aagggatttt gccgatttcg gcctattggt taaaaaatga 7380 gctgatttaa caaaaattta acgcgaattt taacaaaata ttaacgctta caatttgcca 7440 ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 7500 acgccagccc aagctaccat gataagtaag taatattaag gtacgtggag gttttacttg 7560 ctttaaaaaa cctcccacac ctccccctga acctgaaaca taaaatgaat gcaattgttg 7620 ttgttaactt gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt 7680 tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg 7740 tatcttatgg tactgtaact gagctaacat aa 7772 <210> 41 <211> 7725 <212> DNA <213> Artificial Sequence <220> <223> 4-2 pGL2-SS*-CAG [E1 X3+CBA promoter+introne]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 to 120 polyA)-SS* <400> 41 cccgggaggt accgagctct tacgcgtgct agaattaaag taacccaatc agcacacaat 60 tgccattata cgcgcgtata atggactatt gtgtgctgat aaacctattt cagcatacta 120 cgcgcgtagt atgctgaaat aggtgactag aagttcctat actttctaga gaataggaac 180 ttcataactt cgtataatgt atgctatacg aagttatggg ttactttaat ttggttgctg 240 actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 300 acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 360 gggactttcc acacccctgg gtcgacggga ctttccgggg cggggcacgt ggtgcacggg 420 actttccgtg cacgtgcacg ggactttccg ggactttccg ggactttccg tgcaccacgt 480 ggggactttc cgtgcacggg actttccggg gcggggcacg tggtgcacgg gactttccgt 540 gcacgtgcac gggactttcc gggactttcc gggactttcc gtgcaccacg tggggacttt 600 ccgtgcacgg gactttccgg ggcggggcac gtggtgcacg ggactttccg tgcacgtgca 660 cgggactttc cgggactttc cgggactttc cgtgcaccac gtggggactt tccgtgcacg 720 tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa 780 ttttgtattt atttattttt taattatttt gtgcagcgat gggggcgggg gggggggggg 840 cgcgcgccag gcggggcggg gcggggcgag gggcggggcg gggcgaggcg gaaaggtgcg 900 gcggcagcca atcagagcgg cgcgctccga aagtttcctt ttatggcgag gcggcggcgg 960 cggcggccct ataaaaagcg aagcgcgcgg cgggcgggag tcgctgcgtt gccttcgccc 1020 cgtgccccgc tccgcgccgc ctcgcgccgc ccgccccggc tctgactgac cgcgttactc 1080 ccacaggtga gcgggcggga cggcccttct cctccgggct gtaattagcg cttggtttaa 1140 tgacggctcg tttcttttct gtggctgcgt gaaagcctta aagggctccg ggagggccct 1200 ttgtgcgggg gggagcggct cggggggtgc gtgcgtgtgt gtgtgcgtgg ggagcgccgc 1260 gtgcggctcc gcgctgcccg gcggctgtga gcgctgcggg cgcggcgcgg ggctttgtgc 1320 gctccgcagt gtgcgcgagg ggagcgcggc cgggggcggt gccccgcggt gcgggggggg 1380 ctgcgagggg aacaaaggct gcgtgcgggg tgtgtgcgtg ggggggtgag cagggggtgt 1440 gggcgcggcg gtcgggctgt aacccccccc tgcacccccc tccccgagtt gctgagcacg 1500 gcccggcttc gggtgcgggg ctccgtacgg ggcgtggcgc ggggctcgcc gtgccgggcg 1560 gggggtggcg gcaggtgggg gtgccgggcg gggcggggcc gcctcgggcc ggggagggct 1620 cgggggaggg gcgcggcggc ccccggagcg ccggcggctg tcgaggcgcg gcgagccgca 1680 gccattgcct tttatggtaa tcgtgcgaga gggcgcaggg acttcctttg tcccaaatct 1740 gtgcggagcc gaaatctggg aggcgccgcc gcaccccctc tagcgggcgc ggggcgaagc 1800 ggtgcggcgc cggcaggaag gaaatgggcg gggagggcct tcgtgcgtcg ccgcgccgcc 1860 gtccccttct ccctctccag cctcggggct gtccgcgggg ggacggctgc cttcgggggg 1920 gacggggcag ggcggggttc ggcttctggc gtgtgaccgg cggctctaga gcctctgcta 1980 accatgttca tgccttcttc tttttcctac agctcctggg caacgtgctg gttattgtgc 2040 tgtctcatca ttttggcaaa gaattgatta attcgagcga acgcgtcgcc accatgaact 2100 ccttctccac aagcgccttc ggtccagttg ccttctccct gggcctgctc ctggtgttgc 2160 ctgctgcctt ccctgcccca gtcttcacac tcgaagattt cgttggggac tggcgacaga 2220 cagccggcta caacctggac caagtccttg aacagggagg tgtgtccagt ttgtttcaga 2280 atctcggggt gtccgtaact ccgatccaaa ggattgtcct gagcggtgaa aatgggctga 2340 agatcgacat ccatgtcatc atcccgtatg aaggtctgag cggcgaccaa atgggccaga 2400 tcgaaaaaat ttttaaggtg gtgtaccctg tggatgatca tcactttaag gtgatcctgc 2460 actatggcac actggtaatc gacggggtta cgccgaacat gatcgactat ttcggacggc 2520 cgtatgaagg catcgccgtg ttcgacggca aaaagatcac tgtaacaggg accctgtgga 2580 acggcaacaa aattatcgac gagcgcctga tcaaccccga cggctccctg ctgttccgag 2640 taaccatcaa cggagtgacc ggctggcggc tgtgcgaacg cattctggcg gctagcgcta 2700 ctaacttcag cctgctgaag caggctggag acgtggagga gaaccctgga cctggaagcg 2760 gagagggcag aggaagtctg ctaacatgcg gtgacgtcga ggagaatcct ggacctggat 2820 ccggaatggt gagcaagggc gaggagctgt tcaccggggt ggtgcccatc ctggtcgagc 2880 tggacggcga cgtaaacggc cacaagttca gcgtgtccgg cgagggcgag ggcgatgcca 2940 cctacggcaa gctgaccctg aagttcatct gcaccaccgg caagctgccc gtgccctggc 3000 ccaccctcgt gaccaccctg acctacggcg tgcagtgctt cagccgctac cccgaccaca 3060 tgaagcagca cgacttcttc aagtccgcca tgcccgaagg ctacgtccag gagcgcacca 3120 tcttcttcaa ggacgacggc aactacaaga cccgcgccga ggtgaagttc gagggcgaca 3180 ccctggtgaa ccgcatcgag ctgaagggca tcgacttcaa ggaggacggc aacatcctgg 3240 ggcacaagct ggagtacaac tacaacagcc acaacgtcta tatcatggcc gacaagcaga 3300 agaacggcat caaggtgaac ttcaagatcc gccacaacat cgaggacggc agcgtgcagc 3360 tcgccgacca ctaccagcag aacaccccca tcggcgacgg ccccgtgctg ctgcccgaca 3420 accactacct gagcacccag tccgccctga gcaaagaccc caacgagaag cgcgatcaca 3480 tggtcctgct ggagttcgtg accgccgccg ggatcactct cggcatggac gagctgtaca 3540 agtaaaatca acctctggat tacaaaattt gtgaaagatt gactggtatt cttaactatg 3600 ttgctccttt tacgctatgt ggatacgctg ctttaatgcc tttgtatcat gctattgctt 3660 cccgtatggc tttcattttc tcctccttgt ataaatcctg gttgctgtct ctttatgagg 3720 agttgtggcc cgttgtcagg caacgtggcg tggtgtgcac tgtgtttgct gacgcaaccc 3780 ccactggttg gggcattgcc accacctgtc agctcctttc cgggactttc gctttccccc 3840 tccctattgc cacggcggaa ctcatcgccg cctgccttgc ccgctgctgg acaggggctc 3900 ggctgttggg cactgacaat tccgtggtgt tgtcggggaa atcatcgtcc tttccttggc 3960 tgctcgcctg tgttgccacc tggattctgc gcgggacgtc cttctgctac gtcccttcgg 4020 ccctcaatcc agcggacctt ccttcccgcg gcctgctgcc ggctctgcgg cctcttccgc 4080 gtcttcgcct tcgccctcag acgagtcgga tctccctttg ggccgcctcc ccgcgctcgc 4140 tttcttgctg tccaatttct attaaaggtt cctttgttcc ctaagtccaa ctactaaact 4200 gggggatatt atgaagggcc ttgagcatct ggattctgcc taataaaaaa catttatttt 4260 cattgcaagc tcgctttctt gctgtccaat ttctattaaa ggttcctttg ttccctaagt 4320 ccaactacta aactggggga tattatgaag ggccttgagc atctggattc tgcctaataa 4380 aaaacattta ttttcattgc aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4440 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4500 aaaaaaaact cggaaggaca tggtgtggaa agtccccagg ctccccagca ggcagaagta 4560 tgcaaagcat gcatctcaat tagtcagcaa ccaggtgtgg aaagtcccca ggctccccag 4620 caggcagaag tatgcaaagc atgcatctca attagtcagc aaccaaatta aagtaaccca 4680 taacttcgta tagcatacat tatacgaagt tatgaagttc ctattctcta gaaagtatag 4740 gaacttctag tcacctattt cagcatacta cgcgcgtagt atgctgaaat aggtttatca 4800 gcacacaata gtccattata cgcgcgtata atggcaattg tgtgctgatt gggttacttt 4860 aatttggatc cgtcgaccga tgcccttgag agccttcaac ccagtcagct ccttccggtg 4920 ggcgcggggc atgactatcg tcgccgcact tatgactgtc ttctttatca tgcaactcgt 4980 aggacaggtg ccggcagcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 5040 ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 5100 caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 5160 aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 5220 atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 5280 cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 5340 ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 5400 gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 5460 accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 5520 cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 5580 cagagttctt gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct 5640 gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 5700 aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 5760 aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 5820 actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 5880 taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 5940 gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 6000 tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc 6060 ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 6120 accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc 6180 agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca 6240 acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat 6300 tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag 6360 cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac 6420 tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt 6480 ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt 6540 gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc 6600 tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat 6660 ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca 6720 gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 6780 cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 6840 gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 6900 ttccgcgcac atttccccga aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg 6960 cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg 7020 ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 7080 taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 7140 aacttgatta gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 7200 ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 7260 tcaaccctat ctcggtctat tcttttgatt tataagggat tttgccgatt tcggcctatt 7320 ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc 7380 ttacaatttg ccattcgcca ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg 7440 cctcttcgct attacgccag cccaagctac catgataagt aagtaatatt aaggtacgtg 7500 gaggttttac ttgctttaaa aaacctccca cacctccccc tgaacctgaa acataaaatg 7560 aatgcaattg ttgttgttaa cttgtttatt gcagcttata atggttacaa ataaagcaat 7620 agcatcacaa atttcacaaa taaagcattt ttttcactgc attctagttg tggtttgtcc 7680 aaactcatca atgtatctta tggtactgta actgagctaa cataa 7725 <210> 42 <211> 7658 <212> DNA <213> Artificial Sequence <220> <223> 4-3 pGL2-SS*-CAG [E2(U100)+CBA promoter+introne]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 to 120 polyA)-SS* <400> 42 cccgggaggt accgagctct tacgcgtgct agaattaaag taacccaatc agcacacaat 60 tgccattata cgcgcgtata atggactatt gtgtgctgat aaacctattt cagcatacta 120 cgcgcgtagt atgctgaaat aggtgactag aagttcctat actttctaga gaataggaac 180 ttcataactt cgtataatgt atgctatacg aagttatggg ttactttaat ttggttgctg 240 actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 300 acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 360 gggactttcc acacccctgg gtcgactggg actttccact agacatgaca cagcaatctg 420 atatgcttgc gtgagaagag gattcatatc ctgggacttt ccacagattt taccggaagt 480 tgttagatgc ttgcgtgaga agatctaaca tgacacagca atccttagtg ggactttcca 540 agtatgtggg gcggggagta tacatgacac agcaattgat cattaccgga agtttatagg 600 tgggactttc cagacctatg cttgcgtgag aagaaaggtc tgggactttc cagtcgaggt 660 gagccccacg ttctgcttca ctctccccat ctcccccccc tccccacccc caattttgta 720 tttatttatt ttttaattat tttgtgcagc gatgggggcg gggggggggg gggcgcgcgc 780 caggcggggc ggggcggggc gaggggcggg gcggggcgag gcggaaaggt gcggcggcag 840 ccaatcagag cggcgcgctc cgaaagtttc cttttatggc gaggcggcgg cggcggcggc 900 cctataaaaa gcgaagcgcg cggcgggcgg gagtcgctgc gttgccttcg ccccgtgccc 960 cgctccgcgc cgcctcgcgc cgcccgcccc ggctctgact gaccgcgtta ctcccacagg 1020 tgagcgggcg ggacggccct tctcctccgg gctgtaatta gcgcttggtt taatgacggc 1080 tcgtttcttt tctgtggctg cgtgaaagcc ttaaagggct ccgggagggc cctttgtgcg 1140 ggggggagcg gctcgggggg tgcgtgcgtg tgtgtgtgcg tggggagcgc cgcgtgcggc 1200 tccgcgctgc ccggcggctg tgagcgctgc gggcgcggcg cggggctttg tgcgctccgc 1260 agtgtgcgcg aggggagcgc ggccgggggc ggtgccccgc ggtgcggggg gggctgcgag 1320 gggaacaaag gctgcgtgcg gggtgtgtgc gtgggggggt gagcaggggg tgtgggcgcg 1380 gcggtcgggc tgtaaccccc ccctgcaccc ccctccccga gttgctgagc acggcccggc 1440 ttcgggtgcg gggctccgta cggggcgtgg cgcggggctc gccgtgccgg gcggggggtg 1500 gcggcaggtg ggggtgccgg gcggggcggg gccgcctcgg gccggggagg gctcggggga 1560 ggggcgcggc ggcccccgga gcgccggcgg ctgtcgaggc gcggcgagcc gcagccattg 1620 ccttttatgg taatcgtgcg agagggcgca gggacttcct ttgtcccaaa tctgtgcgga 1680 gccgaaatct gggaggcgcc gccgcacccc ctctagcggg cgcggggcga agcggtgcgg 1740 cgccggcagg aaggaaatgg gcggggaggg ccttcgtgcg tcgccgcgcc gccgtcccct 1800 tctccctctc cagcctcggg gctgtccgcg gggggacggc tgccttcggg ggggacgggg 1860 cagggcgggg ttcggcttct ggcgtgtgac cggcggctct agagcctctg ctaaccatgt 1920 tcatgccttc ttctttttcc tacagctcct gggcaacgtg ctggttattg tgctgtctca 1980 tcattttggc aaagaattga ttaattcgag cgaacgcgtc gccaccatga actccttctc 2040 cacaagcgcc ttcggtccag ttgccttctc cctgggcctg ctcctggtgt tgcctgctgc 2100 cttccctgcc ccagtcttca cactcgaaga tttcgttggg gactggcgac agacagccgg 2160 ctacaacctg gaccaagtcc ttgaacaggg aggtgtgtcc agtttgtttc agaatctcgg 2220 ggtgtccgta actccgatcc aaaggattgt cctgagcggt gaaaatgggc tgaagatcga 2280 catccatgtc atcatcccgt atgaaggtct gagcggcgac caaatgggcc agatcgaaaa 2340 aatttttaag gtggtgtacc ctgtggatga tcatcacttt aaggtgatcc tgcactatgg 2400 cacactggta atcgacgggg ttacgccgaa catgatcgac tatttcggac ggccgtatga 2460 aggcatcgcc gtgttcgacg gcaaaaagat cactgtaaca gggaccctgt ggaacggcaa 2520 caaaattatc gacgagcgcc tgatcaaccc cgacggctcc ctgctgttcc gagtaaccat 2580 caacggagtg accggctggc ggctgtgcga acgcattctg gcggctagcg ctactaactt 2640 cagcctgctg aagcaggctg gagacgtgga ggagaaccct ggacctggaa gcggagaggg 2700 cagaggaagt ctgctaacat gcggtgacgt cgaggagaat cctggacctg gatccggaat 2760 ggtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg agctggacgg 2820 cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg ccacctacgg 2880 caagctgacc ctgaagttca tctgcaccac cggcaagctg cccgtgccct ggcccaccct 2940 cgtgaccacc ctgacctacg gcgtgcagtg cttcagccgc taccccgacc acatgaagca 3000 gcacgacttc ttcaagtccg ccatgcccga aggctacgtc caggagcgca ccatcttctt 3060 caaggacgac ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg acaccctggt 3120 gaaccgcatc gagctgaagg gcatcgactt caaggaggac ggcaacatcc tggggcacaa 3180 gctggagtac aactacaaca gccacaacgt ctatatcatg gccgacaagc agaagaacgg 3240 catcaaggtg aacttcaaga tccgccacaa catcgaggac ggcagcgtgc agctcgccga 3300 ccactaccag cagaacaccc ccatcggcga cggccccgtg ctgctgcccg acaaccacta 3360 cctgagcacc cagtccgccc tgagcaaaga ccccaacgag aagcgcgatc acatggtcct 3420 gctggagttc gtgaccgccg ccgggatcac tctcggcatg gacgagctgt acaagtaaaa 3480 tcaacctctg gattacaaaa tttgtgaaag attgactggt attcttaact atgttgctcc 3540 ttttacgcta tgtggatacg ctgctttaat gcctttgtat catgctattg cttcccgtat 3600 ggctttcatt ttctcctcct tgtataaatc ctggttgctg tctctttatg aggagttgtg 3660 gcccgttgtc aggcaacgtg gcgtggtgtg cactgtgttt gctgacgcaa cccccactgg 3720 ttggggcatt gccaccacct gtcagctcct ttccgggact ttcgctttcc ccctccctat 3780 tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc tggacagggg ctcggctgtt 3840 gggcactgac aattccgtgg tgttgtcggg gaaatcatcg tcctttcctt ggctgctcgc 3900 ctgtgttgcc acctggattc tgcgcgggac gtccttctgc tacgtccctt cggccctcaa 3960 tccagcggac cttccttccc gcggcctgct gccggctctg cggcctcttc cgcgtcttcg 4020 ccttcgccct cagacgagtc ggatctccct ttgggccgcc tccccgcgct cgctttcttg 4080 ctgtccaatt tctattaaag gttcctttgt tccctaagtc caactactaa actgggggat 4140 attatgaagg gccttgagca tctggattct gcctaataaa aaacatttat tttcattgca 4200 agctcgcttt cttgctgtcc aatttctatt aaaggttcct ttgttcccta agtccaacta 4260 ctaaactggg ggatattatg aagggccttg agcatctgga ttctgcctaa taaaaaacat 4320 ttattttcat tgcaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4380 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4440 actcggaagg acatggtgtg gaaagtcccc aggctcccca gcaggcagaa gtatgcaaag 4500 catgcatctc aattagtcag caaccaggtg tggaaagtcc ccaggctccc cagcaggcag 4560 aagtatgcaa agcatgcatc tcaattagtc agcaaccaaa ttaaagtaac ccataacttc 4620 gtatagcata cattatacga agttatgaag ttcctattct ctagaaagta taggaacttc 4680 tagtcaccta tttcagcata ctacgcgcgt agtatgctga aataggttta tcagcacaca 4740 atagtccatt atacgcgcgt ataatggcaa ttgtgtgctg attgggttac tttaatttgg 4800 atccgtcgac cgatgccctt gagagccttc aacccagtca gctccttccg gtgggcgcgg 4860 ggcatgacta tcgtcgccgc acttatgact gtcttcttta tcatgcaact cgtaggacag 4920 gtgccggcag cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct 4980 gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga 5040 taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc 5100 cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg 5160 ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg 5220 aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt 5280 tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt 5340 gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg 5400 cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact 5460 ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt 5520 cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta tctgcgctct 5580 gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac 5640 cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc 5700 tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg 5760 ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta 5820 aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca 5880 atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc 5940 ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc 6000 tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc 6060 agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat 6120 taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt 6180 tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc 6240 cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag 6300 ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt 6360 tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac 6420 tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg 6480 cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat 6540 tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc 6600 gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc 6660 tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa 6720 atgttgaata ctcatactct tcctttttca atattattga agcatttatc agggttattg 6780 tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg 6840 cacatttccc cgaaaagtgc cacctgacgc gccctgtagc ggcgcattaa gcgcggcggg 6900 tgtggtggtt acgcgcagcg tgaccgctac acttgccagc gccctagcgc ccgctccttt 6960 cgctttcttc ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg 7020 ggggctccct ttagggttcc gatttagtgc tttacggcac ctcgacccca aaaaacttga 7080 ttagggtgat ggttcacgta gtgggccatc gccctgatag acggtttttc gccctttgac 7140 gttggagtcc acgttcttta atagtggact cttgttccaa actggaacaa cactcaaccc 7200 tatctcggtc tattcttttg atttataagg gattttgccg atttcggcct attggttaaa 7260 aaatgagctg atttaacaaa aatttaacgc gaattttaac aaaatattaa cgcttacaat 7320 ttgccattcg ccattcaggc tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc 7380 gctattacgc cagcccaagc taccatgata agtaagtaat attaaggtac gtggaggttt 7440 tacttgcttt aaaaaacctc ccacacctcc ccctgaacct gaaacataaa atgaatgcaa 7500 ttgttgttgt taacttgttt attgcagctt ataatggtta caaataaagc aatagcatca 7560 caaatttcac aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca 7620 tcaatgtatc ttatggtact gtaactgagc taacataa 7658 <210> 43 <211> 6850 <212> DNA <213> Artificial Sequence <220> <223> 4-4 pGL2-SS*-CAG [E1 X3+CBA promoter+UTR1]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 to 120 polyA)-SS* <400> 43 cccgggaggt accgagctct tacgcgtgct agaattaaag taacccaatc agcacacaat 60 tgccattata cgcgcgtata atggactatt gtgtgctgat aaacctattt cagcatacta 120 cgcgcgtagt atgctgaaat aggtgactag aagttcctat actttctaga gaataggaac 180 ttcataactt cgtataatgt atgctatacg aagttatggg ttactttaat ttggttgctg 240 actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 300 acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 360 gggactttcc acacccctgg gtcgacggga ctttccgggg cggggcacgt ggtgcacggg 420 actttccgtg cacgtgcacg ggactttccg ggactttccg ggactttccg tgcaccacgt 480 ggggactttc cgtgcacggg actttccggg gcggggcacg tggtgcacgg gactttccgt 540 gcacgtgcac gggactttcc gggactttcc gggactttcc gtgcaccacg tggggacttt 600 ccgtgcacgg gactttccgg ggcggggcac gtggtgcacg ggactttccg tgcacgtgca 660 cgggactttc cgggactttc cgggactttc cgtgcaccac gtggggactt tccgtgcacg 720 tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa 780 ttttgtattt atttattttt taattatttt gtgcagcgat gggggcgggg gggggggggg 840 cgcgcgccag gcggggcggg gcggggcgag gggcggggcg gggcgaggcg gaaaggtgcg 900 gcggcagcca atcagagcgg cgcgctccga aagtttcctt ttatggcgag gcggcggcgg 960 cggcggccct ataaaaagcg aagcgcgcgg cgggcgctgc cttctccctc ctgtgagttt 1020 ggtaagtcga cgggccgggc ctgggccggg tccgggccgg gtcgttggat ccccactaca 1080 gcccgatact caagcttgac gaattcgagt atccaaggta gtggactagt gtgacgctgc 1140 tgaccccttt ctttcccttc tgcaggttgg tgtacagtag cttccaaatt gattaattcg 1200 agcgaacgcg tcgccaccat gaactccttc tccacaagcg ccttcggtcc agttgccttc 1260 tccctgggcc tgctcctggt gttgcctgct gccttccctg ccccagtctt cacactcgaa 1320 gatttcgttg gggactggcg acagacagcc ggctacaacc tggaccaagt ccttgaacag 1380 ggaggtgtgt ccagtttgtt tcagaatctc ggggtgtccg taactccgat ccaaaggatt 1440 gtcctgagcg gtgaaaatgg gctgaagatc gacatccatg tcatcatccc gtatgaaggt 1500 ctgagcggcg accaaatggg ccagatcgaa aaaattttta aggtggtgta ccctgtggat 1560 gatcatcact ttaaggtgat cctgcactat ggcacactgg taatcgacgg ggttacgccg 1620 aacatgatcg actatttcgg acggccgtat gaaggcatcg ccgtgttcga cggcaaaaag 1680 atcactgtaa cagggaccct gtggaacggc aacaaaatta tcgacgagcg cctgatcaac 1740 cccgacggct ccctgctgtt ccgagtaacc atcaacggag tgaccggctg gcggctgtgc 1800 gaacgcattc tggcggctag cgctactaac ttcagcctgc tgaagcaggc tggagacgtg 1860 gaggagaacc ctggacctgg aagcggagag ggcagaggaa gtctgctaac atgcggtgac 1920 gtcgaggaga atcctggacc tggatccgga atggtgagca agggcgagga gctgttcacc 1980 ggggtggtgc ccatcctggt cgagctggac ggcgacgtaa acggccacaa gttcagcgtg 2040 tccggcgagg gcgagggcga tgccacctac ggcaagctga ccctgaagtt catctgcacc 2100 accggcaagc tgcccgtgcc ctggcccacc ctcgtgacca ccctgaccta cggcgtgcag 2160 tgcttcagcc gctaccccga ccacatgaag cagcacgact tcttcaagtc cgccatgccc 2220 gaaggctacg tccaggagcg caccatcttc ttcaaggacg acggcaacta caagacccgc 2280 gccgaggtga agttcgaggg cgacaccctg gtgaaccgca tcgagctgaa gggcatcgac 2340 ttcaaggagg acggcaacat cctggggcac aagctggagt acaactacaa cagccacaac 2400 gtctatatca tggccgacaa gcagaagaac ggcatcaagg tgaacttcaa gatccgccac 2460 aacatcgagg acggcagcgt gcagctcgcc gaccactacc agcagaacac ccccatcggc 2520 gacggccccg tgctgctgcc cgacaaccac tacctgagca cccagtccgc cctgagcaaa 2580 gaccccaacg agaagcgcga tcacatggtc ctgctggagt tcgtgaccgc cgccgggatc 2640 actctcggca tggacgagct gtacaagtaa aatcaacctc tggattacaa aatttgtgaa 2700 agattgactg gtattcttaa ctatgttgct ccttttacgc tatgtggata cgctgcttta 2760 atgcctttgt atcatgctat tgcttcccgt atggctttca ttttctcctc cttgtataaa 2820 tcctggttgc tgtctcttta tgaggagttg tggcccgttg tcaggcaacg tggcgtggtg 2880 tgcactgtgt ttgctgacgc aacccccact ggttggggca ttgccaccac ctgtcagctc 2940 ctttccggga ctttcgcttt ccccctccct attgccacgg cggaactcat cgccgcctgc 3000 cttgcccgct gctggacagg ggctcggctg ttgggcactg acaattccgt ggtgttgtcg 3060 gggaaatcat cgtcctttcc ttggctgctc gcctgtgttg ccacctggat tctgcgcggg 3120 acgtccttct gctacgtccc ttcggccctc aatccagcgg accttccttc ccgcggcctg 3180 ctgccggctc tgcggcctct tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc 3240 ctttgggccg cctccccgcg ctcgctttct tgctgtccaa tttctattaa aggttccttt 3300 gttccctaag tccaactact aaactggggg atattatgaa gggccttgag catctggatt 3360 ctgcctaata aaaaacattt attttcattg caagctcgct ttcttgctgt ccaatttcta 3420 ttaaaggttc ctttgttccc taagtccaac tactaaactg ggggatatta tgaagggcct 3480 tgagcatctg gattctgcct aataaaaaac atttattttc attgcaaaaa aaaaaaaaaa 3540 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3600 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaactcggaa ggacatggtg tggaaagtcc 3660 ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccagg 3720 tgtggaaagt ccccaggctc cccagcaggc agaagtatgc aaagcatgca tctcaattag 3780 tcagcaacca aattaaagta acccataact tcgtatagca tacattatac gaagttatga 3840 agttcctatt ctctagaaag tataggaact tctagtcacc tatttcagca tactacgcgc 3900 gtagtatgct gaaataggtt tatcagcaca caatagtcca ttatacgcgc gtataatggc 3960 aattgtgtgc tgattgggtt actttaattt ggatccgtcg accgatgccc ttgagagcct 4020 tcaacccagt cagctccttc cggtgggcgc ggggcatgac tatcgtcgcc gcacttatga 4080 ctgtcttctt tatcatgcaa ctcgtaggac aggtgccggc agcgctcttc cgcttcctcg 4140 ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag 4200 gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa 4260 ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc 4320 cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca 4380 ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg 4440 accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct 4500 catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt 4560 gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag 4620 tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc 4680 agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac 4740 actagaagaa cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga 4800 gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc 4860 aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg 4920 gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca 4980 aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt 5040 atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca 5100 gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg 5160 atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca 5220 ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt 5280 cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt 5340 agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca 5400 cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca 5460 tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga 5520 agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact 5580 gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga 5640 gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg 5700 ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc 5760 tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga 5820 tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat 5880 gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt 5940 caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt 6000 atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac 6060 gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct 6120 acacttgcca gcgccctagc gcccgctcct ttcgctttct tcccttcctt tctcgccacg 6180 ttcgccggct ttccccgtca agctctaaat cgggggctcc ctttagggtt ccgatttagt 6240 gctttacggc acctcgaccc caaaaaactt gattagggtg atggttcacg tagtgggcca 6300 tcgccctgat agacggtttt tcgccctttg acgttggagt ccacgttctt taatagtgga 6360 ctcttgttcc aaactggaac aacactcaac cctatctcgg tctattcttt tgatttataa 6420 gggattttgc cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac 6480 gcgaatttta acaaaatatt aacgcttaca atttgccatt cgccattcag gctgcgcaac 6540 tgttgggaag ggcgatcggt gcgggcctct tcgctattac gccagcccaa gctaccatga 6600 taagtaagta atattaaggt acgtggaggt tttacttgct ttaaaaaacc tcccacacct 6660 ccccctgaac ctgaaacata aaatgaatgc aattgttgtt gttaacttgt ttattgcagc 6720 ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc 6780 actgcattct agttgtggtt tgtccaaact catcaatgta tcttatggta ctgtaactga 6840 gctaacataa 6850 <210> 44 <211> 6783 <212> DNA <213> Artificial Sequence <220> <223> 4-5-pGL2-SS*-CAG [E2 (U100)+CBA promoter+UTR1]-SecNLuc-2A-eGFP-WPRE-3'UTR (108 to 120 polyA)-SS* <400> 44 cccgggaggt accgagctct tacgcgtgct agaattaaag taacccaatc agcacacaat 60 tgccattata cgcgcgtata atggactatt gtgtgctgat aaacctattt cagcatacta 120 cgcgcgtagt atgctgaaat aggtgactag aagttcctat actttctaga gaataggaac 180 ttcataactt cgtataatgt atgctatacg aagttatggg ttactttaat ttggttgctg 240 actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 300 acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 360 gggactttcc acacccctgg gtcgactggg actttccact agacatgaca cagcaatctg 420 atatgcttgc gtgagaagag gattcatatc ctgggacttt ccacagattt taccggaagt 480 tgttagatgc ttgcgtgaga agatctaaca tgacacagca atccttagtg ggactttcca 540 agtatgtggg gcggggagta tacatgacac agcaattgat cattaccgga agtttatagg 600 tgggactttc cagacctatg cttgcgtgag aagaaaggtc tgggactttc cagtcgaggt 660 gagccccacg ttctgcttca ctctccccat ctcccccccc tccccacccc caattttgta 720 tttatttatt ttttaattat tttgtgcagc gatgggggcg gggggggggg gggcgcgcgc 780 caggcggggc ggggcggggc gaggggcggg gcggggcgag gcggaaaggt gcggcggcag 840 ccaatcagag cggcgcgctc cgaaagtttc cttttatggc gaggcggcgg cggcggcggc 900 cctataaaaa gcgaagcgcg cggcgggcgc tgccttctcc ctcctgtgag tttggtaagt 960 cgacgggccg ggcctgggcc gggtccgggc cgggtcgttg gatccccact acagcccgat 1020 actcaagctt gacgaattcg agtatccaag gtagtggact agtgtgacgc tgctgacccc 1080 tttctttccc ttctgcaggt tggtgtacag tagcttccaa attgattaat tcgagcgaac 1140 gcgtcgccac catgaactcc ttctccacaa gcgccttcgg tccagttgcc ttctccctgg 1200 gcctgctcct ggtgttgcct gctgccttcc ctgccccagt cttcacactc gaagatttcg 1260 ttggggactg gcgacagaca gccggctaca acctggacca agtccttgaa cagggaggtg 1320 tgtccagttt gtttcagaat ctcggggtgt ccgtaactcc gatccaaagg attgtcctga 1380 gcggtgaaaa tgggctgaag atcgacatcc atgtcatcat cccgtatgaa ggtctgagcg 1440 gcgaccaaat gggccagatc gaaaaaattt ttaaggtggt gtaccctgtg gatgatcatc 1500 actttaaggt gatcctgcac tatggcacac tggtaatcga cggggttacg ccgaacatga 1560 tcgactattt cggacggccg tatgaaggca tcgccgtgtt cgacggcaaa aagatcactg 1620 taacagggac cctgtggaac ggcaacaaaa ttatcgacga gcgcctgatc aaccccgacg 1680 gctccctgct gttccgagta accatcaacg gagtgaccgg ctggcggctg tgcgaacgca 1740 ttctggcggc tagcgctact aacttcagcc tgctgaagca ggctggagac gtggaggaga 1800 accctggacc tggaagcgga gagggcagag gaagtctgct aacatgcggt gacgtcgagg 1860 agaatcctgg acctggatcc ggaatggtga gcaagggcga ggagctgttc accggggtgg 1920 tgcccatcct ggtcgagctg gacggcgacg taaacggcca caagttcagc gtgtccggcg 1980 agggcgaggg cgatgccacc tacggcaagc tgaccctgaa gttcatctgc accaccggca 2040 agctgcccgt gccctggccc accctcgtga ccaccctgac ctacggcgtg cagtgcttca 2100 gccgctaccc cgaccacatg aagcagcacg acttcttcaa gtccgccatg cccgaaggct 2160 acgtccagga gcgcaccatc ttcttcaagg acgacggcaa ctacaagacc cgcgccgagg 2220 tgaagttcga gggcgacacc ctggtgaacc gcatcgagct gaagggcatc gacttcaagg 2280 aggacggcaa catcctgggg cacaagctgg agtacaacta caacagccac aacgtctata 2340 tcatggccga caagcagaag aacggcatca aggtgaactt caagatccgc cacaacatcg 2400 aggacggcag cgtgcagctc gccgaccact accagcagaa cacccccatc ggcgacggcc 2460 ccgtgctgct gcccgacaac cactacctga gcacccagtc cgccctgagc aaagacccca 2520 acgagaagcg cgatcacatg gtcctgctgg agttcgtgac cgccgccggg atcactctcg 2580 gcatggacga gctgtacaag taaaatcaac ctctggatta caaaatttgt gaaagattga 2640 ctggtattct taactatgtt gctcctttta cgctatgtgg atacgctgct ttaatgcctt 2700 tgtatcatgc tattgcttcc cgtatggctt tcattttctc ctccttgtat aaatcctggt 2760 tgctgtctct ttatgaggag ttgtggcccg ttgtcaggca acgtggcgtg gtgtgcactg 2820 tgtttgctga cgcaaccccc actggttggg gcattgccac cacctgtcag ctcctttccg 2880 ggactttcgc tttccccctc cctattgcca cggcggaact catcgccgcc tgccttgccc 2940 gctgctggac aggggctcgg ctgttgggca ctgacaattc cgtggtgttg tcggggaaat 3000 catcgtcctt tccttggctg ctcgcctgtg ttgccacctg gattctgcgc gggacgtcct 3060 tctgctacgt cccttcggcc ctcaatccag cggaccttcc ttcccgcggc ctgctgccgg 3120 ctctgcggcc tcttccgcgt cttcgccttc gccctcagac gagtcggatc tccctttggg 3180 ccgcctcccc gcgctcgctt tcttgctgtc caatttctat taaaggttcc tttgttccct 3240 aagtccaact actaaactgg gggatattat gaagggcctt gagcatctgg attctgccta 3300 ataaaaaaca tttattttca ttgcaagctc gctttcttgc tgtccaattt ctattaaagg 3360 ttcctttgtt ccctaagtcc aactactaaa ctgggggata ttatgaaggg ccttgagcat 3420 ctggattctg cctaataaaa aacatttatt ttcattgcaa aaaaaaaaaa aaaaaaaaaa 3480 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3540 aaaaaaaaaa aaaaaaaaaa aaaaaactcg gaaggacatg gtgtggaaag tccccaggct 3600 ccccagcagg cagaagtatg caaagcatgc atctcaatta gtcagcaacc aggtgtggaa 3660 agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa 3720 ccaaattaaa gtaacccata acttcgtata gcatacatta tacgaagtta tgaagttcct 3780 attctctaga aagtatagga acttctagtc acctatttca gcatactacg cgcgtagtat 3840 gctgaaatag gtttatcagc acacaatagt ccattatacg cgcgtataat ggcaattgtg 3900 tgctgattgg gttactttaa tttggatccg tcgaccgatg cccttgagag ccttcaaccc 3960 agtcagctcc ttccggtggg cgcggggcat gactatcgtc gccgcactta tgactgtctt 4020 ctttatcatg caactcgtag gacaggtgcc ggcagcgctc ttccgcttcc tcgctcactg 4080 actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa 4140 tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc 4200 aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc 4260 ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat 4320 aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc 4380 cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct 4440 cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg 4500 aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc 4560 cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga 4620 ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa 4680 gaacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta 4740 gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc 4800 agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg 4860 acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga 4920 tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg 4980 agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct 5040 gtctatttcg ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg 5100 agggcttacc atctggcccc agtgctgcaa tgataccgcg agacccacgc tcaccggctc 5160 cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa 5220 ctttatccgc ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc 5280 cagttaatag tttgcgcaac gttgttgcca ttgctacagg catcgtggtg tcacgctcgt 5340 cgtttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc 5400 ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt 5460 tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc 5520 catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt 5580 gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg ggataatacc gcgccacata 5640 gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa ctctcaagga 5700 tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag 5760 catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa 5820 aaaagggaat aagggcgaca cggaaatgtt gaatactcat actcttcctt tttcaatatt 5880 attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga 5940 aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct gacgcgccct 6000 gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg 6060 ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc acgttcgccg 6120 gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt agtgctttac 6180 ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg ccatcgccct 6240 gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ggactcttgt 6300 tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta taagggattt 6360 tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt aacgcgaatt 6420 ttaacaaaat attaacgctt acaatttgcc attcgccatt caggctgcgc aactgttggg 6480 aagggcgatc ggtgcgggcc tcttcgctat tacgccagcc caagctacca tgataagtaa 6540 gtaatattaa ggtacgtgga ggttttactt gctttaaaaa acctcccaca cctccccctg 6600 aacctgaaac ataaaatgaa tgcaattgtt gttgttaact tgtttattgc agcttataat 6660 ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat 6720 tctagttgtg gtttgtccaa actcatcaat gtatcttatg gtactgtaac tgagctaaca 6780 taa 6783 <210> 45 <211> 6832 <212> DNA <213> Artificial Sequence <220> <223> 4-6-pGL2-SS*-CMV enhancer-EF1-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR(108 to 120 polyA)-SS* <400> 45 cccgggaggt accgagctct tacgcgtgct agaattaaag taacccaatc agcacacaat 60 tgccattata cgcgcgtata atggactatt gtgtgctgat aaacctattt cagcatacta 120 cgcgcgtagt atgctgaaat aggtgactag aagttcctat actttctaga gaataggaac 180 ttcataactt cgtataatgt atgctatacg aagttatggg ttactttaat ttggttgctg 240 actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 300 acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 360 gggactttcc acacccctgg gtcgacgaca ttgattattg actagttatt aatagtaatc 420 aattacgggg tcattagttc atagcccata tatggagttc cgcgttacat aacttacggt 480 aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta 540 tgttcccata gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg 600 gtaaactgcc cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga 660 cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt 720 tcctacttgg cagtacatct acgtattagt catcgctatt accatggggc agagcgcaca 780 tcgcccacag tccccgagaa gttgggggga ggggtcggca attgaaccgg tgcctagaga 840 aggtggcgcg gggtaaactg ggaaagtgat gtcgtgtact ggctccgcct ttttcccgag 900 ggtgggggag aaccgtatat aagtgcagta gtcgccgtga acgttctttt tcgcaacggg 960 tttgccgcca gaacacagct gccttctccc tcctgtgagt ttggtaagtc gacgggccgg 1020 gcctgggccg ggtccgggcc gggtcgttgg atccccacta cagcccgata ctcaagcttg 1080 acgaattcga gtatccaagg tagtggacta gtgtgacgct gctgacccct ttctttccct 1140 tctgcaggtt ggtgtacagt agcttccaaa ttgattaatt cgagcgaacg cgtcgccacc 1200 atgaactcct tctccacaag cgccttcggt ccagttgcct tctccctggg cctgctcctg 1260 gtgttgcctg ctgccttccc tgccccagtc ttcacactcg aagatttcgt tggggactgg 1320 cgacagacag ccggctacaa cctggaccaa gtccttgaac agggaggtgt gtccagtttg 1380 tttcagaatc tcggggtgtc cgtaactccg atccaaagga ttgtcctgag cggtgaaaat 1440 gggctgaaga tcgacatcca tgtcatcatc ccgtatgaag gtctgagcgg cgaccaaatg 1500 ggccagatcg aaaaaatttt taaggtggtg taccctgtgg atgatcatca ctttaaggtg 1560 atcctgcact atggcacact ggtaatcgac ggggttacgc cgaacatgat cgactatttc 1620 ggacggccgt atgaaggcat cgccgtgttc gacggcaaaa agatcactgt aacagggacc 1680 ctgtggaacg gcaacaaaat tatcgacgag cgcctgatca accccgacgg ctccctgctg 1740 ttccgagtaa ccatcaacgg agtgaccggc tggcggctgt gcgaacgcat tctggcggct 1800 agcgctacta acttcagcct gctgaagcag gctggagacg tggaggagaa ccctggacct 1860 ggaagcggag agggcagagg aagtctgcta acatgcggtg acgtcgagga gaatcctgga 1920 cctggatccg gaatggtgag caagggcgag gagctgttca ccggggtggt gcccatcctg 1980 gtcgagctgg acggcgacgt aaacggccac aagttcagcg tgtccggcga gggcgagggc 2040 gatgccacct acggcaagct gaccctgaag ttcatctgca ccaccggcaa gctgcccgtg 2100 ccctggccca ccctcgtgac caccctgacc tacggcgtgc agtgcttcag ccgctacccc 2160 gaccacatga agcagcacga cttcttcaag tccgccatgc ccgaaggcta cgtccaggag 2220 cgcaccatct tcttcaagga cgacggcaac tacaagaccc gcgccgaggt gaagttcgag 2280 ggcgacaccc tggtgaaccg catcgagctg aagggcatcg acttcaagga ggacggcaac 2340 atcctggggc acaagctgga gtacaactac aacagccaca acgtctatat catggccgac 2400 aagcagaaga acggcatcaa ggtgaacttc aagatccgcc acaacatcga ggacggcagc 2460 gtgcagctcg ccgaccacta ccagcagaac acccccatcg gcgacggccc cgtgctgctg 2520 cccgacaacc actacctgag cacccagtcc gccctgagca aagaccccaa cgagaagcgc 2580 gatcacatgg tcctgctgga gttcgtgacc gccgccggga tcactctcgg catggacgag 2640 ctgtacaagt aaaatcaacc tctggattac aaaatttgtg aaagattgac tggtattctt 2700 aactatgttg ctccttttac gctatgtgga tacgctgctt taatgccttt gtatcatgct 2760 attgcttccc gtatggcttt cattttctcc tccttgtata aatcctggtt gctgtctctt 2820 tatgaggagt tgtggcccgt tgtcaggcaa cgtggcgtgg tgtgcactgt gtttgctgac 2880 gcaaccccca ctggttgggg cattgccacc acctgtcagc tcctttccgg gactttcgct 2940 ttccccctcc ctattgccac ggcggaactc atcgccgcct gccttgcccg ctgctggaca 3000 ggggctcggc tgttgggcac tgacaattcc gtggtgttgt cggggaaatc atcgtccttt 3060 ccttggctgc tcgcctgtgt tgccacctgg attctgcgcg ggacgtcctt ctgctacgtc 3120 ccttcggccc tcaatccagc ggaccttcct tcccgcggcc tgctgccggc tctgcggcct 3180 cttccgcgtc ttcgccttcg ccctcagacg agtcggatct ccctttgggc cgcctccccg 3240 cgctcgcttt cttgctgtcc aatttctatt aaaggttcct ttgttcccta agtccaacta 3300 ctaaactggg ggatattatg aagggccttg agcatctgga ttctgcctaa taaaaaacat 3360 ttattttcat tgcaagctcg ctttcttgct gtccaatttc tattaaaggt tcctttgttc 3420 cctaagtcca actactaaac tgggggatat tatgaagggc cttgagcatc tggattctgc 3480 ctaataaaaa acatttattt tcattgcaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3540 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3600 aaaaaaaaaa aaaaactcgg aaggacatgg tgtggaaagt ccccaggctc cccagcaggc 3660 agaagtatgc aaagcatgca tctcaattag tcagcaacca ggtgtggaaa gtccccaggc 3720 tccccagcag gcagaagtat gcaaagcatg catctcaatt agtcagcaac caaattaaag 3780 taacccataa cttcgtatag catacattat acgaagttat gaagttccta ttctctagaa 3840 agtataggaa cttctagtca cctatttcag catactacgc gcgtagtatg ctgaaatagg 3900 tttatcagca cacaatagtc cattatacgc gcgtataatg gcaattgtgt gctgattggg 3960 ttactttaat ttggatccgt cgaccgatgc ccttgagagc cttcaaccca gtcagctcct 4020 tccggtgggc gcggggcatg actatcgtcg ccgcacttat gactgtcttc tttatcatgc 4080 aactcgtagg acaggtgccg gcagcgctct tccgcttcct cgctcactga ctcgctgcgc 4140 tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc 4200 acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg 4260 aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 4320 cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 4380 gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 4440 tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 4500 tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 4560 cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 4620 gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 4680 ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag aacagtattt 4740 ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 4800 ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 4860 agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 4920 aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 4980 atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 5040 tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt 5100 tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca 5160 tctggcccca gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca 5220 gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc 5280 tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt 5340 ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg 5400 gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc 5460 aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg 5520 ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga 5580 tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga 5640 ccgagttgct cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta 5700 aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg 5760 ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact 5820 ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata 5880 agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt 5940 tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 6000 ataggggttc cgcgcacatt tccccgaaaa gtgccacctg acgcgccctg tagcggcgca 6060 ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg ctacacttgc cagcgcccta 6120 gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca cgttcgccgg ctttccccgt 6180 caagctctaa atcgggggct ccctttaggg ttccgattta gtgctttacg gcacctcgac 6240 cccaaaaaac ttgattaggg tgatggttca cgtagtgggc catcgccctg atagacggtt 6300 tttcgccctt tgacgttgga gtccacgttc tttaatagtg gactcttgtt ccaaactgga 6360 acaacactca accctatctc ggtctattct tttgatttat aagggatttt gccgatttcg 6420 gcctattggt taaaaaatga gctgatttaa caaaaattta acgcgaattt taacaaaata 6480 ttaacgctta caatttgcca ttcgccattc aggctgcgca actgttggga agggcgatcg 6540 gtgcgggcct cttcgctatt acgccagccc aagctaccat gataagtaag taatattaag 6600 gtacgtggag gttttacttg ctttaaaaaa cctcccacac ctccccctga acctgaaaca 6660 taaaatgaat gcaattgttg ttgttaactt gtttattgca gcttataatg gttacaaata 6720 aagcaatagc atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg 6780 tttgtccaaa ctcatcaatg tatcttatgg tactgtaact gagctaacat aa 6832 <210> 46 <211> 333 <212> DNA <213> Artificial Sequence <220> <223> 3 copies of Enhancer-1 <400> 46 gggactttcc ggggcggggc acgtggtgca cgggactttc cgtgcacgtg cacgggactt 60 tccgggactt tccgggactt tccgtgcacc acgtggggac tttccgtgca cgggactttc 120 cggggcgggg cacgtggtgc acgggacttt ccgtgcacgt gcacgggact ttccgggact 180 ttccgggact ttccgtgcac cacgtgggga ctttccgtgc acgggacttt ccggggcggg 240 gcacgtggtg cacgggactt tccgtgcacg tgcacgggac tttccgggac tttccgggac 300 tttccgtgca ccacgtgggg actttccgtg cac 333 <210> 47 <211> 1016 <212> DNA <213> Artificial Sequence <220> <223> chimeric intron <400> 47 ggagtcgctg cgttgccttc gccccgtgcc ccgctccgcg ccgcctcgcg ccgcccgccc 60 cggctctgac tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg 120 ggctgtaatt agcgcttggt ttaatgacgg ctcgtttctt ttctgtggct gcgtgaaagc 180 cttaaagggc tccgggaggg ccctttgtgc gggggggagc ggctcggggg gtgcgtgcgt 240 gtgtgtgtgc gtggggagcg ccgcgtgcgg ctccgcgctg cccggcggct gtgagcgctg 300 cgggcgcggc gcggggcttt gtgcgctccg cagtgtgcgc gaggggagcg cggccggggg 360 cggtgccccg cggtgcgggg ggggctgcga ggggaacaaa ggctgcgtgc ggggtgtgtg 420 cgtggggggg tgagcagggg gtgtgggcgc ggcggtcggg ctgtaacccc cccctgcacc 480 cccctccccg agttgctgag cacggcccgg cttcgggtgc ggggctccgt acggggcgtg 540 gcgcggggct cgccgtgccg ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg 600 ggccgcctcg ggccggggag ggctcggggg aggggcgcgg cggcccccgg agcgccggcg 660 gctgtcgagg cgcggcgagc cgcagccatt gccttttatg gtaatcgtgc gagagggcgc 720 agggacttcc tttgtcccaa atctgtgcgg agccgaaatc tgggaggcgc cgccgcaccc 780 cctctagcgg gcgcggggcg aagcggtgcg gcgccggcag gaaggaaatg ggcggggagg 840 gccttcgtgc gtcgccgcgc cgccgtcccc ttctccctct ccagcctcgg ggctgtccgc 900 ggggggacgg ctgccttcgg gggggacggg gcagggcggg gttcggcttc tggcgtgtga 960 ccggcggctc tagagcctct gctaaccatg ttcatgcctt cttctttttc ctacag 1016

Claims

하기를 포함하는 발현 벡터:
(a) 백본 서열,
(b) 하기를 포함하는 서열:
(i) 관심 핵산 서열을 포함하는 발현 카세트,
(ii) 발현 카세트의 5' 측면을 플랭킹하는 제1 레콤비나제에 대한 제1 표적 서열,
(iii) 발현 카세트의 3' 측면을 플랭킹하는 제1 레콤비나제에 대한 제2 표적 서열, 및
(iv) 제1 레콤비나제에 대한 비-결합 영역 내 제1 및 제2 표적 서열 내에 통합된 하나 이상의 추가 레콤비나제에 대한 하나 이상의 추가 표적 서열, 및
(c) 하기 중 하나 이상:
(i) 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 비-결합 영역 내 제1 레콤비나제에 대한 제1 및/또는 제2 표적 서열 내에 통합된 엔도뉴클레아제 표적 서열, 여기서 엔도뉴클레아제 표적 서열은 백본 서열과 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 절단 부위 사이에 있음,
(ii) 제1 레콤비나제에 대한 제1 표적 서열의 3' 말단과 발현 카세트 내 또 다른 인핸서 또는 프로모터의 5' 말단 사이에 통합된 서열식별번호: 12와 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서,
(iii) 제1 레콤비나제에 대한 제1 표적 서열의 3' 말단과 발현 카세트 내 프로모터의 5' 말단 사이에 통합된 사이토메갈로바이러스 (CMV) 인핸서,
(iv) 인트론을 포함하는 5' 비번역 영역 (5'UTR), 여기서 5'UTR은 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합됨,
(v) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 척추동물 염색질 인슐레이터,
(vi) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 우드척 간염 바이러스 전사후 조절 요소 (WPRE),
(vii) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 스캐폴드/매트릭스 부착 영역 (S/MAR), 또는
(viii) 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 비-결합 영역 내 제1 레콤비나제에 대한 제1 및/또는 제2 표적 서열 내에 통합된 DNA 핵 표적화 서열 (DTS), 여기서 DTS는 발현 카세트와 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 절단 부위 사이에 있음.
제1항에 있어서, 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 비-결합 영역 내 제1 레콤비나제에 대한 제1 및/또는 제2 표적 서열 내에 통합된 엔도뉴클레아제 표적 서열을 포함하고, 여기서 엔도뉴클레아제 표적 서열이 백본 서열과 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 절단 부위 사이에 있는 것인 발현 벡터.
제1항 또는 제2항에 있어서, 제1 레콤비나제에 대한 제1 및 제2 표적 서열 내에 통합된 엔도뉴클레아제 표적 서열을 포함하는 발현 벡터.
제1항 내지 제3항 중 어느 한 항에 있어서, 엔도뉴클레아제 표적 서열이 귀소 엔도뉴클레아제에 대한 것인 발현 벡터.
제1항 내지 제4항 중 어느 한 항에 있어서, 엔도뉴클레아제 표적 서열이 I-AniI, I-CeuI, I-ChuI, I-CpaI, I-CpaII, I-CreI, I-DmoI, H-DreI, I-HmuI, I-HmuII, I-LlaI, I-MsoI, PI-PfuI, PI-PkoII, I-PorI, I-PpoI, PI-PspI, I-ScaI, I-SceI, PI-SceI, I-SceII, I-SecIII, I-SceIV, I-SceV, I-SceVI, I-SceVII, I-Ssp6803I, I-TevI, I-TevII, I-TevIII, PI-TliI, PI-TliII, I-Tsp061I 또는 I-Vdi141I에 대한 것인 발현 벡터.
제1항 내지 제5항 중 어느 한 항에 있어서, 엔도뉴클레아제 표적 서열이 I-SceI에 대한 것인 발현 벡터.
제1항 내지 제5항 중 어느 한 항에 있어서, 엔도뉴클레아제 표적 서열이 PI-SceI에 대한 것인 발현 벡터.
제1항 내지 제3항 중 어느 한 항에 있어서, 엔도뉴클레아제 표적 서열이 Cas 엔도뉴클레아제에 대한 것인 발현 벡터.
제8항에 있어서, Cas 엔도뉴클레아제가 Cas9인 발현 벡터.
제1항 내지 제9항 중 어느 한 항에 있어서, 제1 레콤비나제에 대한 제1 표적 서열의 3' 말단과 발현 카세트 내 또 다른 인핸서 또는 프로모터의 5' 말단 사이에 통합된 서열식별번호: 12와 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서를 포함하는 발현 벡터.
제10항에 있어서, 합성 인핸서가 서열식별번호: 12와 적어도 약 90% 동일한 핵산 서열의 다중 인접 카피를 포함하는 것인 발현 벡터.
제11항에 있어서, 합성 인핸서가 서열식별번호: 46과 적어도 약 90% 동일한 핵산 서열을 포함하는 것인 발현 벡터.
제10항 내지 제12항 중 어느 한 항에 있어서, 합성 인핸서가 닭 β-액틴 프로모터의 5' 말단에 통합되는 것인 발현 벡터.
제13항에 있어서, 닭 β-액틴 프로모터의 3' 말단 및 관심 핵산 서열의 5'에 통합된 서열식별번호: 47과 적어도 약 90% 동일한 핵산 서열을 포함하는 키메라 인트론을 포함하는 발현 벡터.
제1항 내지 제14항 중 어느 한 항에 있어서, 제1 레콤비나제에 대한 제1 표적 서열의 3' 말단과 발현 카세트 내 프로모터의 5' 말단 사이에 통합된 CMV 인핸서를 포함하는 발현 벡터.
제15항에 있어서, CMV 인핸서가 서열식별번호: 12 또는 서열식별번호: 46과 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서의 3' 말단에 통합되는 것인 발현 벡터.
제15항 또는 제16항에 있어서, CMV 프로모터가 CMV 인핸서의 3' 말단 및 관심 핵산 서열의 5'에 통합되는 것인 발현 벡터.
제1항 내지 제9항 중 어느 한 항에 있어서, 제1 레콤비나제에 대한 제1 표적 서열과 관심 핵산 서열 사이에 통합된 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38 또는 서열식별번호: 39와 적어도 약 90% 동일한 핵산 서열을 포함하는 발현 벡터.
제1항 내지 제9항 중 어느 한 항에 있어서, 인트론을 포함하는 5'UTR을 포함하고, 여기서 5'UTR이 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합되는 것인 발현 벡터.
제19항에 있어서, 인트론이 서열식별번호: 1과 적어도 약 90% 동일한 핵산 서열을 포함하는 것인 발현 벡터.
제19항 또는 제20항에 있어서, 인트론 내에 통합된 비-코딩 서열을 추가로 포함하는 발현 벡터.
제20항에 있어서, 서열식별번호: 1의 위치 25 내지 55로부터의 임의의 2개의 뉴클레오티드에 상응하는 인트론 내 2개의 뉴클레오티드 사이에 통합된 비-코딩 서열을 추가로 포함하는 발현 벡터.
제21항 또는 제22항에 있어서, 비-코딩 서열이 S/MAR인 발현 벡터.
제23항에 있어서, S/MAR이 MAR-5인 발현 벡터.
제19항에 있어서, 5'UTR이 서열식별번호: 3과 적어도 약 90% 동일한 핵산 서열을 포함하는 것인 발현 벡터.
제19항에 있어서, 5'UTR이 서열식별번호: 5와 적어도 약 90% 동일한 핵산 서열을 포함하는 것인 발현 벡터.
제19항 내지 제26항 중 어느 한 항에 있어서, 프로모터가 닭 β-액틴 프로모터인 발현 벡터.
제19항 내지 제26항 중 어느 한 항에 있어서, 프로모터가 CMV 프로모터인 발현 벡터.
제19항 내지 제28항 중 어느 한 항에 있어서, 프로모터가 CMV 인핸서의 3' 말단에 통합되는 것인 발현 벡터.
제29항에 있어서, CMV 인핸서가 서열식별번호: 12 또는 서열식별번호: 46과 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서의 3' 말단에 통합되는 것인 발현 벡터.
제1항 내지 제30항 중 어느 한 항에 있어서, 폴리아데닐화 신호가 관심 핵산 서열의 3' 말단에 통합되는 것인 발현 벡터.
제31항에 있어서, 폴리아데닐화 신호가 서열식별번호: 13, 서열식별번호: 14 또는 서열식별번호: 15와 적어도 약 90% 동일한 핵산 서열을 포함하는 것인 발현 벡터.
제1항 내지 제30항 중 어느 한 항에 있어서, 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 척추동물 염색질 인슐레이터를 포함하는 발현 벡터.
제33항에 있어서, 척추동물 염색질 인슐레이터가 5'-HS4 닭-β-글로빈 인슐레이터 (cHS4)인 발현 벡터.
제1항 내지 제30항, 제33항 및 제34항 중 어느 한 항에 있어서, 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 WPRE를 포함하는 발현 벡터.
제1항 내지 제30항 및 제33항 내지 제35항 중 어느 한 항에 있어서, 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 S/MAR을 포함하는 발현 벡터.
제36항에 있어서, S/MAR이 MAR-5인 발현 벡터.
제33항 내지 제37항 중 어느 한 항에 있어서, 폴리아데닐화 신호가 서열식별번호: 13, 서열식별번호: 14 또는 서열식별번호: 15와 적어도 약 90% 동일한 핵산 서열을 포함하는 것인 발현 벡터.
제2항 내지 제38항 중 어느 한 항에 있어서, 제1 레콤비나제에 대한 제1 및 제2 표적 서열의 각 측면을 플랭킹하는 인핸서 서열을 추가로 포함하는 발현 벡터.
제39항에 있어서, 제1 레콤비나제에 대한 제1 및 제2 표적 서열의 각 측면을 플랭킹하는 적어도 2개의 인핸서 서열을 포함하는 발현 벡터.
제39항 또는 제40항에 있어서, 인핸서 서열이 SV40 인핸서 서열인 발현 벡터.
제1항 내지 제38항 중 어느 한 항에 있어서, 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 비-결합 영역 내 제1 레콤비나제에 대한 제1 및/또는 제2 표적 서열 내에 통합된 DTS를 포함하고, 여기서 DTS는 발현 카세트와 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 절단 부위 사이에 있는 것인 발현 벡터.
제42항에 있어서, DTS가 SV40 인핸서 서열인 발현 벡터.
제42항에 있어서, DTS가 세포-특이적인 발현 벡터.
제1항 내지 제44항 중 어느 한 항에 있어서, 제1 및 제2 표적 서열 및 하나 이상의 추가 표적 서열이 PY54 pal 부위, N15 telRL 부위, loxP 부위, φK02 telRL 부위, FRT 부위, phiC31 attP 부위 및 λ attP 부위로 이루어진 군으로부터 선택되는 것인 발현 벡터.
제45항에 있어서, 각각의 표적 서열을 포함하는 발현 벡터.
제45항 또는 제46항에 있어서, pal 부위 및 pal 부위 내에 통합된 telRL, loxP 및 FRT 레콤비나제 표적 결합 서열을 포함하는 발현 벡터.
제1항 내지 제47항 중 어느 한 항에 있어서, 제1 레콤비나제에 대한 제1 및 제2 표적 서열이 각각 서열식별번호: 33의 핵산 서열을 포함하는 것인 발현 벡터.
제1항 내지 제48항 중 어느 한 항에 있어서, 박테리아 서열-무함유 벡터를 생산하기 위한 발현 벡터.
제49항에 있어서, 박테리아 서열-무함유 벡터가 원형 공유 폐쇄형 벡터인 발현 벡터.
제49항에 있어서, 박테리아 서열-무함유 벡터가 선형 공유 폐쇄형 벡터인 발현 벡터.
유도성 프로모터의 제어 하에 레콤비나제를 코딩하는 재조합 세포를 포함하는 벡터 생산 시스템으로서, 재조합 세포는 제1항 내지 제51항 중 어느 한 항의 발현 벡터를 포함하고, 여기서 레콤비나제는 제1 레콤비나제에 대한 제1 및 제2 표적 서열 또는 발현 벡터 내 하나 이상의 추가 레콤비나제에 대한 하나 이상의 추가 표적 서열 중 하나를 표적화하는 것인 벡터 생산 시스템.
제52항에 있어서, 레콤비나제가 TelN, Tel, Cre 또는 Flp인 벡터 생산 시스템.
제52항 또는 제53항에 있어서, 재조합 세포가 유도성 프로모터의 제어 하에 엔도뉴클레아제를 추가로 코딩하고, 여기서 엔도뉴클레아제가 엔도뉴클레아제 표적 서열을 포함하는 발현 벡터 내 엔도뉴클레아제 표적 서열을 표적화하는 것인 벡터 생산 시스템.
제54항에 있어서, 엔도뉴클레아제가 귀소 엔도뉴클레아제인 벡터 생산 시스템.
제55항에 있어서, 귀소 엔도뉴클레아제가 I-AniI, I-CeuI, I-ChuI, I-CpaI, I-CpaII, I-CreI, I-DmoI, H-DreI, I-HmuI, I-HmuII, I-LlaI, I-MsoI, PI-PfuI, PI-PkoII, I-PorI, I-PpoI, PI-PspI, I-ScaI, I-SceI, PI-SceI, I-SceII, I-SecIII, I-SceIV, I-SceV, I-SceVI, I-SceVII, I-Ssp6803I, I-TevI, I-TevII, I-TevIII, PI-TliI, PI-TliII, I-Tsp061I 또는 I-Vdi141I인 벡터 생산 시스템.
제54항 내지 제56항 중 어느 한 항에 있어서, 엔도뉴클레아제가 I-SceI인 벡터 생산 시스템.
제54항 내지 제56항 중 어느 한 항에 있어서, 엔도뉴클레아제가 PI-SceI인 벡터 생산 시스템.
제54항에 있어서, 재조합 세포가 엔도뉴클레아제를 포함하는 뉴클레아제 게놈 편집 시스템을 코딩하는 것인 벡터 생산 시스템.
제59항에 있어서, 뉴클레아제 게놈 편집 시스템이 가이드 RNA 및 Cas 엔도뉴클레아제를 포함하는 클러스터링된 규칙적 간격의 짧은 회문구조 반복부 (CRISPR) 뉴클레아제 시스템인 벡터 생산 시스템.
제60항에 있어서, Cas 엔도뉴클레아제가 Cas9인 벡터 생산 시스템.
제52항 내지 제61항 중 어느 한 항에 있어서, 유도성 프로모터가 열-조절성, 화학적-조절성, IPTG 조절성, 글루코스-조절성, 아라비노스 유도성, T7 폴리머라제 조절성, 저온-충격 유도성, pH 유도성, 또는 이들의 조합인 벡터 생산 시스템.
레콤비나제의 발현에 적합한 조건 하에 제52항 내지 제62항 중 어느 한 항의 벡터 생산 시스템을 인큐베이션하는 것을 포함하는, 박테리아 서열-무함유 벡터를 생산하는 방법.
제63항에 있어서, 엔도뉴클레아제의 발현에 적합한 조건 하에 제38항 내지 제46항 중 어느 한 항의 벡터 생산 시스템을 인큐베이션하는 것을 추가로 포함하는 방법.
제63항 또는 제64항에 있어서, 뉴클레아제 게놈 편집 시스템의 발현에 적합한 조건 하에 제59항 내지 제62항 중 어느 한 항의 벡터 생산 시스템을 인큐베이션하는 것을 추가로 포함하는 방법.
제63항 내지 제65항 중 어느 한 항에 있어서, 박테리아 서열-무함유 벡터를 수확하는 것을 추가로 포함하는 방법.
제63항 내지 제66항 중 어느 한 항의 방법에 의해 생산된 박테리아 서열-무함유 벡터.
하기를 포함하는 박테리아 서열-무함유 벡터:
(a) 관심 핵산 서열을 포함하는 발현 카세트, 및
(b) 하기 중 하나 이상:
(i) 발현 카세트 내 또 다른 인핸서 또는 프로모터에 대해 5'에 위치된 서열식별번호: 12와 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서,
(ii) 발현 카세트 내 프로모터에 대해 5'에 위치된 CMV 인핸서,
(iii) 인트론을 포함하는 5'UTR, 여기서 5'UTR은 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합됨,
(iv) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 척추동물 염색질 인슐레이터,
(v) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 WPRE,
(vi) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 S/MAR, 또는
(vii) 발현 카세트에 대해 5'에 위치된 DTS.
제68항에 있어서, 발현 카세트 내 또 다른 인핸서 또는 프로모터에 대해 5'에 위치된 서열식별번호: 12와 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서를 포함하는 박테리아 서열-무함유 벡터.
제69항에 있어서, 합성 인핸서가 서열식별번호: 12와 적어도 약 90% 동일한 핵산 서열의 다중 인접 카피를 포함하는 것인 박테리아 서열-무함유 벡터.
제70항에 있어서, 합성 인핸서가 서열식별번호: 46과 적어도 약 90% 동일한 핵산 서열을 포함하는 것인 박테리아 서열-무함유 벡터.
제69항 내지 제71항 중 어느 한 항에 있어서, 합성 인핸서가 닭 β-액틴 프로모터의 5' 말단에 통합되는 것인 박테리아 서열-무함유 벡터.
제72항에 있어서, 닭 β-액틴 프로모터의 3' 말단 및 관심 핵산 서열의 5'에 통합된 서열식별번호: 47과 적어도 약 90% 동일한 핵산 서열을 포함하는 키메라 인트론을 포함하는 박테리아 서열-무함유 벡터.
제68항에 있어서, 발현 카세트 내 프로모터에 대해 5'에 위치된 CMV 인핸서를 포함하는 박테리아 서열-무함유 벡터.
제74항에 있어서, CMV 인핸서가 서열식별번호: 12 또는 서열식별번호: 46과 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서의 3' 말단에 통합되는 것인 박테리아 서열-무함유 벡터.
제74항 또는 제75항에 있어서, CMV 프로모터가 CMV 인핸서의 3' 말단 및 관심 핵산 서열의 5'에 통합되는 것인 박테리아 서열-무함유 벡터.
제68항에 있어서, 관심 핵산 서열에 대해 5'에 위치된 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38 또는 서열식별번호: 39와 적어도 약 90% 동일한 핵산 서열을 포함하는 박테리아 서열-무함유 벡터.
제68항에 있어서, 인트론을 포함하는 5'UTR을 포함하고, 여기서 5'UTR이 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합되는 것인 박테리아 서열-무함유 벡터.
제78항에 있어서, 인트론이 서열식별번호: 1과 적어도 약 90% 동일한 핵산 서열을 포함하는 것인 박테리아 서열-무함유 벡터.
제78항 또는 제79항에 있어서, 인트론 내에 통합된 비-코딩 서열을 추가로 포함하는 박테리아 서열-무함유 벡터.
제79항에 있어서, 서열식별번호: 1의 뉴클레오티드 위치 25 및 55로부터의 임의의 2개의 뉴클레오티드에 상응하는 인트론 내 2개의 뉴클레오티드 사이에 통합된 비-코딩 서열을 추가로 포함하는 박테리아 서열-무함유 벡터.
제80항 또는 제81항에 있어서, 비-코딩 서열이 S/MAR인 박테리아 서열-무함유 벡터.
제82항에 있어서, S/MAR이 MAR-5인 박테리아 서열-무함유 벡터.
제78항에 있어서, 5'UTR이 서열식별번호: 3과 적어도 약 90% 동일한 핵산 서열을 포함하는 것인 박테리아 서열-무함유 벡터.
제78항에 있어서, 5'UTR이 서열식별번호: 5와 적어도 약 90% 동일한 핵산 서열을 포함하는 것인 박테리아 서열-무함유 벡터.
제78항 내지 제85항 중 어느 한 항에 있어서, 프로모터가 닭 β-액틴 프로모터인 박테리아 서열-무함유 벡터.
제78항 내지 제85항 중 어느 한 항에 있어서, 프로모터가 CMV 프로모터인 박테리아 서열-무함유 벡터.
제78항 내지 제87항 중 어느 한 항에 있어서, 프로모터가 CMV 인핸서의 3' 말단에 통합되는 것인 박테리아 서열-무함유 벡터.
제88항에 있어서, CMV 인핸서가 서열식별번호: 12 또는 서열식별번호: 46과 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서의 3' 말단에 통합되는 것인 박테리아 서열-무함유 벡터.
제68항 내지 제89항 중 어느 한 항에 있어서, 폴리아데닐화 신호가 관심 핵산 서열의 3' 말단에 통합되는 것인 박테리아 서열-무함유 벡터.
제90항에 있어서, 폴리아데닐화 신호가 서열식별번호: 13, 서열식별번호: 14 또는 서열식별번호: 15와 적어도 약 90% 동일한 핵산 서열을 포함하는 것인 박테리아 서열-무함유 벡터.
제68항 내지 제89항 중 어느 한 항에 있어서, 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 척추동물 염색질 인슐레이터를 포함하는 박테리아 서열-무함유 벡터.
제92항에 있어서, 척추동물 염색질 인슐레이터가 cHS4인 박테리아 서열-무함유 벡터.
제68항 내지 제89항, 제92항 및 제93항 중 어느 한 항에 있어서, 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 WPRE를 포함하는 박테리아 서열-무함유 벡터.
제68항 내지 제89항 및 제92항 내지 제94항 중 어느 한 항에 있어서, 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 S/MAR을 포함하는 박테리아 서열-무함유 벡터.
제95항에 있어서, S/MAR이 MAR-5인 박테리아 서열-무함유 벡터.
제92항 내지 제96항 중 어느 한 항에 있어서, 폴리아데닐화 신호가 서열식별번호: 13, 서열식별번호: 14 또는 서열식별번호: 15와 적어도 약 90% 동일한 핵산 서열을 포함하는 것인 박테리아 서열-무함유 벡터.
제68항 내지 제97항 중 어느 한 항에 있어서, 발현 카세트의 각 측면을 플랭킹하는 인핸서 서열을 추가로 포함하는 박테리아 서열-무함유 벡터.
제98항에 있어서, 발현 카세트의 각 측면을 플랭킹하는 적어도 2개의 인핸서 서열을 포함하는 박테리아 서열-무함유 벡터.
제98항 또는 제99항에 있어서, 인핸서 서열이 SV40 인핸서 서열인 박테리아 서열-무함유 벡터.
제68항 내지 제97항 중 어느 한 항에 있어서, 발현 카세트에 대해 5'에 위치된 DTS를 포함하는 박테리아 서열-무함유 벡터.
제101항에 있어서, DTS가 SV40 인핸서 서열인 박테리아 서열-무함유 벡터.
제101항에 있어서, DTS가 세포-특이적인 박테리아 서열-무함유 벡터.
제68항 내지 제103항 중 어느 한 항에 있어서, 원형 공유 폐쇄형 벡터인 박테리아 서열-무함유 벡터.
제68항 내지 제103항 중 어느 한 항에 있어서, 선형 공유 폐쇄형 벡터인 박테리아 서열-무함유 벡터.
제1항 내지 제51항 중 어느 한 항의 발현 벡터 또는 제67항 내지 제105항 중 어느 한 항의 박테리아 서열-무함유 벡터를 포함하는 재조합 세포.
제1항 내지 제51항 중 어느 한 항의 발현 벡터 또는 제67항 내지 제105항 중 어느 한 항의 박테리아 서열-무함유 벡터를 포함하는 조성물.
제107항에 있어서, 전달제를 추가로 포함하는 조성물.
제108항에 있어서, 전달제가 나노입자인 조성물.
제108항 또는 제109항에 있어서, 전달제가 표적화 리간드를 포함하는 것인 조성물.
제107항 내지 제110항 중 어느 한 항에 있어서, 제약상 허용되는 담체를 추가로 포함하는 제약 조성물인 조성물.
제1항 내지 제51항 중 어느 한 항의 발현 벡터, 제67항 내지 제105항 중 어느 한 항의 박테리아 서열-무함유 벡터, 또는 제111항의 제약 조성물을 질환 또는 장애의 치료를 필요로 하는 대상체에게 투여하는 것을 포함하는, 상기 대상체에서 질환 또는 장애를 치료하는 방법.
서열식별번호: 1과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드.
서열식별번호: 2와 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드.
서열식별번호: 3과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드.
서열식별번호: 5와 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드.
서열식별번호: 12와 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드.
서열식별번호: 46과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드.
서열식별번호: 13과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드.
서열식별번호: 14와 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드.
서열식별번호: 15와 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드.
제86항 내지 제88항 중 어느 한 항에 있어서, 핵산 서열의 3' 말단에 100 내지 120개의 아데닌 뉴클레오티드를 추가로 포함하는 폴리뉴클레오티드.
서열식별번호: 16과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드.
서열식별번호: 17과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드.
서열식별번호: 18과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드.
서열식별번호: 35와 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드.
서열식별번호: 36과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드.
서열식별번호: 37과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드.
서열식별번호: 38과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드.
서열식별번호: 39와 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드.
제113항 내지 제130항 중 어느 한 항의 폴리뉴클레오티드를 포함하는 발현 벡터.
제114항 내지 제116항 중 어느 한 항의 폴리뉴클레오티드 및 제119항 내지 제125항 중 어느 한 항의 폴리뉴클레오티드를 포함하는 발현 벡터.
제1항 내지 제51항 중 어느 한 항의 발현 벡터, 제67항 내지 제105항 중 어느 한 항의 박테리아 서열-무함유 벡터, 또는 제107항 내지 제111항 중 어느 한 항의 제약 조성물로부터의 관심 핵산 서열을 유전자 편집을 위한 표적 부위에 삽입하는 것을 포함하는 유전자 편집 방법.
제133항에 있어서, 유전자 편집이 비-상동성 말단 연결에 의한 것인 방법.
제133항에 있어서, 유전자 편집이 상동성-지정 복구에 의한 것인 방법.