KR102655641B1

KR102655641B1 - 유전자 발현을 향상시키기 위한 조성물 및 방법

Info

Publication number: KR102655641B1
Application number: KR1020197016015A
Authority: KR
Inventors: 컬트 이버 캠러드; 마웅 니안 윈; 나타니엘 스티픈 왕; 제이슨 디하트
Original assignee: 얀센 파마슈티칼즈, 인코포레이티드
Priority date: 2016-12-05
Filing date: 2017-12-04
Publication date: 2024-04-05
Also published as: KR20190134590A; CN110352247A; BR112019011661A2; CA3045650A1; WO2018106615A3; JP2020500536A; MX2019006467A; WO2018106615A2; US20180171340A1; EP3548625A2; JP2023156294A; AU2017372731A1; US11845939B2

Abstract

본 개시내용은 일반적으로 유전자 발현을 조절하는데 사용하기 위한 핵산분자에 관한 것이다. 본 명세서에서 개시된 것은 관심 유전자의 코딩 서열에 작동가능하게 연결된 바이러스성 캡시드 향상제의 하나 이상의 구조 요소를 함유하는 핵산분자를 포함한다. 일부 구현예에서, 본 바이러스성 캡시드 향상제는 바이러스성 캡시드 단백질로부터의 다운스트림 루프 (DLP), 또는 DLP의 변이체를 포함한다.

Description

유전자 발현을 향상시키는 조성물 및 방법

관련 출원

본원은 2016년 12월 5일 출원된 미국 가출원 일련번호 62/430,250; 2017년 4월 17일 출원된 미국 가출원 일련번호 62/486,361; 및 2017년 11월 17일 출원된 미국 가출원 일련번호 62/587,954에 대한 우선권을 주장한다. 상기-언급된 출원의 내용은 그것의 전체로 이로써 명시적으로 참고로 편입된다.

서열목록의 편입

첨부하는 서열목록의 물질은 이로써 참고로 본원에 편입된다. SGI012WO_SeqListing.txt로 명명된 첨부하는 서열목록 텍스트 파일은 2017년 12월 4일 만들어졌으며, 169KB이다.

분야

본 개시내용은 유전자 발현을 조절하는데 유용한 핵산 분자 및, 예를 들어, 세포 배양물에서 또는 대상체에서 적합한 숙주 세포에서 원하는 생성물의 생산을 위해, 그리고 숙주 세포 또는 대상체에게 유익한 특성을 부여하기 위해 상기 핵산 분자의 사용을 포함하는 분자 생물할 및 유전공학의 분야에 관한 것이다.

생물공학 및 분자 생물학의 진보는 상업적으로 바람직한 특성 또는 형질을 갖는 재조합 세포 및 유기체를 개발할 수 있는 많은 기회를 제공해왔다. 특히, 현대의 유전 공학 기술은 유전자의 도입을 크게 가속화시켰으며, 따라서 재조합 세포와 유기체에 새로운 특성을 가속화시켰다. 예를 들어, 숙주 세포 또는 형질전환 유기체에서 바람직한 유전자의 적절한 발현 수준은 이 목표를 달성하는데 도움이 된다.

그러나, 많은 분자 도구의 이용가능성에도 불구하고, 숙주 세포 및 유기체의 유전적 변형은 종종 불충분한 발현 수준 또는 관심 유전자의 조절되지 않은 발현에 의해 제한된다. 따라서, 숙주 세포 및 유기체에서 이식유전자 발현을 향상시킬 수 있는 조절 인자에 대한 필요성이 여전하다. 다양한 유형의 유기체에서 기능하는 조절 인자, 발현 벡터 및 발현 시스템을 포함하는 신규한 분자 도구의 확인은 유전자적으로 향상된 세포 및 유기체를 개발하는 데 유용할 수 있다.

이 부문은 본원의 일반적인 요약을 제공하고, 그것의 전체 범위 또는 그것의 특징 전부를 포괄하지는 않는다.

본 개시내용은 일반적으로 시험관내, 생체외, 또는 생체내에서 유전자 발현을 조절, 예를 들어, 증가시키는데 유용한 방법 및 조성물에 관한 것이다. 유전자 발현은, 예를 들어, 동물 세포 및 다른 진핵 세포에서 될 수 있다. 유전자는, 예를 들어, 관심 있는 단백질을 인코딩하는 이종성 유전자일 수 있다.

일 양태에서, 본 명세서에서 개시된 일부 구현예는 (i) 바이러스성 캡시드 향상제(enhancer) 또는 그것의 변이체의 하나 이상의 RNA 스템-루프를 인코딩하는 제1 핵산 서열; 및 (ii) 상기 제1 핵산 서열에 작동 가능하게 연결된 제2 핵산 서열을 포함하는 핵산 분자에 관한 것으로, 여기서 상기 제2 핵산 서열은 관심 유전자 (GOI)에 대한 코딩 서열을 포함한다.

본 개시내용에 따른 핵산 분자의 구현예의 실행은 하기 특징 중 하나 이상을 포함할 수 있다. 일부 구현예에서, 제1 핵산 서열은 GOI에 대한 코딩 서열에 업스트림으로 작동가능하게 연결된다. 일부 구현예에서, 핵산 분자는 추가로 제1 핵산 서열에 업스트림으로 작동가능하게 연결된 프로모터를 포함한다. 일부 구현예에서, 핵산분자는 추가로 제1 핵산 서열에 업스트림으로 작동가능하게 연결된 5' UTR 서열을 포함한다. 일부 구현예에서, 5' UTR 서열은 프로모터에 다운스트림으로 그리고 제1 핵산 서열에 대한 업스트림으로 작동가능하게 연결된다. 일부 구현예에서, 핵산분자는 추가로 제2 핵산 서열에 업스트림으로 작동가능하게 연결된 오토프로테아제 펩타이드에 대한 코딩 서열을 포함한다. 일부 구현예에서, 오토프로테아제 펩타이드에 대한 코딩 서열은 제1 핵산 서열에 다운스트림으로 그리고 제2 핵산 서열에 업스트림으로 작동가능하게 연결된다. 일부 구현예에서, 오토프로테아제 펩타이드는 돼지 테스코바이러스-1 2A (P2A), 구제역 바이러스 (FMDV) 2A (F2A), 말 비염 A 바이러스 (ERAV) 2A (E2A), 토사 아시냐 바이러스 2A (T2A), 세포질 다각체병 바이러스 2A (BmCPV2A), 연화병 바이러스 2A (BmIFV2A), 및 이들의 조합으로 구성된 군으로부터 선택된 펩타이드 서열을 포함한다. 일부 구현예에서, 핵산 분자는 추가로 제2 서열 핵산 서열에 다운스트림으로 작동가능하게 연결된 3' UTR 서열을 포함한다.

일부 구현예에서, 바이러스성 캡시드 향상제는 토가비리다에 ( Togaviridae ) 계열에 속하는 바이러스 종의 캡시드 유전자로부터 유래된다. 일부 구현예에서, 바이러스 종은 토가비리다에 계열의 알파바이러스 속에 속한다. 일부 구현예에서, 알파바이러스 종은 동부말 뇌염 바이러스 (EEEV), 베네주엘라말 뇌염 바이러스 (VEEV), 에버글레이즈 바이러스 (EVEV), 뮤캄보 바이러스 (MUCV), 셈리키포레스트 바이러스 (SFV), 픽수나 바이러스 (PIXV), 미들버그 바이러스 (MIDV), 치쿤군야 바이러스 (CHIKV), O'니옹-니옹 바이러스 (ONNV), 로스리버 바이러스 (RRV), 바마포레스트 바이러스 (BF), 게타 바이러스 (GET), 사기야마 바이러스 (SAGV), 베바루 바이러스 (BEBV), 마야로 바이러스 (MAYV), 우나 바이러스 (UNAV), 신드비스 바이러스 (SINV), 아우라 바이러스 (AURAV), 화타로아 바이러스 (WHAV), 바반키 바이러스 (BABV), 키질라가크 바이러스 (KYZV), 웨스턴말 뇌염 바이러스 (WEEV), 하이랜드 J 바이러스 (HJV), 포트모건 바이러스 (FMV), 느두무 (NDUV), 연어과 알파바이러스 (SAV), 또는 버기크릭 바이러스이다. 일부 구현예에서, 바이러스성 캡시드 향상제는 바이러스 종의 다운스트림 루프 (DLP) 모티프를 포함하고, 및 여기서 DLP 모티프는 하나 이상의 RNA 스템-루프 중 적어도 하나를 포함한다. 일부 구현예에서, 바이러스성 캡시드 향상제는 서열번호: 1 및 46-52 중 적어도 하나에 적어도 80% 서열 동일성을 나타내는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 서열은 서열번호: 1 및 46-52 중 적어도 하나에 적어도 95% 서열 동일성을 나타낸다.

일부 구현예에서, GOI에 대한 코딩 서열은 폴리펩타이드를 인코딩한다. 일부 구현예에서, 폴리펩타이드는 치료적 폴리펩타이드, 예방적 폴리펩타이드, 진단적 폴리펩타이드, 기능식품 폴리펩타이드, 산업 효소, 리포터 폴리펩타이드, 또는 이들의 조합이다. 일부 구현예에서, 폴리펩타이드는 항체, 항원, 면역조절제, 사이토카인, 효소, 또는 이들의 조합이다.

일부 구현예에서, 본 개시내용의 핵산분자는 추가로 제2 바이러스성 캡시드 향상제 또는 그것의 변이체의 하나 이상의 RNA 스템-루프를 인코딩하는 제3 핵산 서열; 및 제3 핵산 서열에 작동가능하게 연결된 제4 핵산 서열을 포함하고, 여기서 제4 핵산 서열은 제2 관심 유전자 (GOI)에 대한 코딩 서열을 포함한다. 일부 구현예에서, 핵산분자는 추가로 제3 핵산 서열에 다운스트림으로 그리고 제4 핵산 서열에 업스트림으로 작동가능하게 연결된 제2 오토프로테아제 펩타이드에 대한 코딩 서열을 포함한다.

일부 구현예에서, 본 개시내용의 핵산분자는 mRNA 분자 또는 RNA 레플리콘이다. 일부 구현예에서, 본 핵산분자는 발현벡터 또는 전사벡터이다. 일부 구현예에서, 본 발현벡터 또는 전사벡터는 추가로 하나 이상의 추가의 전사 조절 서열을 포함한다. 일부 구현예에서, 본 발현벡터 또는 전사벡터는 추가로 하나 이상의 추가의 전사 조절 서열을 포함한다. 일부 구현예에서, 본 발현벡터 또는 전사벡터는 추가로 하나 이상의 추가의 번역 조절 서열을 포함한다. 일부 구현예에서, 본 핵산분자는 플라스미드, 박테리오파아지 벡터, 코스미드, 포스미드, 바이러스성 레플리콘, 셔틀 벡터, 또는 이들의 조합이다. 일부 구현예에서, 본 핵산분자는 원핵 벡터 또는 진핵 벡터이다. 일부 구현예에서, 본 핵산분자는 새로운(de novo) 합성을 통해 생산된다.

또한 개시된 바와 같이 일부 구현예에서는 세포 안으로 본 개시내용에 따른 핵산분자를 도입하고, 그것에 의해 세포에 GOI에 의해 인코딩된 폴리펩타이드를 생산하는 것을 포함하는, 세포에 관심 있는 폴리펩타이드를 생산하는 방법을 포함한다. 여전히 또 다른 관련된 양태에서, 본 명세서에서 개시된 일부 구현예는 세포 안으로 RNA 분자를 도입하는 것을 포함하는, 세포에 관심 있는 폴리펩타이드를 생산하는 방법에 관한 것으로, 여기서 상기 RNA 분자는 바이러스성 캡시드 향상제 또는 그것의 변이체의 하나 이상의 RNA 스템-루프, 및 관심 있는 폴리펩타이드에 대한 코딩 서열을 포함하고, 그것에 의해 세포에 관심 있는 폴리펩타이드를 생산한다.

일부 구현예에서, RNA 분자는 메신저 RNA (mRNA) 분자 또는 레플리시온 RNA 분자이다. 일부 구현예에서, RNA 분자는 세포 안으로 도입되기 전에 새로운 합성 및/또는 시험관내 전사를 통해 생산된다. 일부 구현예에서, RNA 분자는 바이러스 종의 다운스트림 루프 (DLP) 모티프를 포함하고, 여기서 상기 DLP 모티프는 바이러스성 캡시드 향상제의 하나 이상의 RNA 스템-루프 중 적어도 하나를 포함한다. 일부 구현예에서, RNA 분자는 하나 이상의 RNA 스템-루프 중 적어도 하나에 다운스트림이고 관심 있는 폴리펩타이드에 대한 코딩 서열에 업스트림인 오토프로테아제 펩타이드에 대한 코딩 서열을 추가로 포함한다. 일부 구현예에서, 상기 오토프로테아제 펩타이드는 돼지 테스코바이러스-1 2A (P2A), 구제역 바이러스 (FMDV) 2A (F2A), 말 비염 A 바이러스 (ERAV) 2A (E2A), 토사 아시냐 바이러스 2A (T2A), 세포질 다각체병 바이러스 2A (BmCPV2A), 연화병 바이러스 2A (BmIFV2A), 및 이들의 조합으로 구성된 군으로부터 선택된 펩타이드 서열을 포함한다. 일부 구현예에서, 본 폴리펩타이드는 치료적 폴리펩타이드, 예방적 폴리펩타이드, 진단적 폴리펩타이드, 기능식품 폴리펩타이드, 산업 효소, 리포터 폴리펩타이드, 또는 이들의 조합이다. 일부 구현예에서, 본 폴리펩타이드는 항체, 항원, 면역조절제, 사이토카인, 효소, 또는 이들의 조합이다. 일부 구현예에서, 세포는 조직, 장기, 또는 대상체에 존재한다. 일부 구현예에서, 상기 대상체는 인간, 말, 돼지, 영장류, 마우스, 흰담비, 랫트, 코튼 랫트, 소, 돼지, 양, 토끼, 고양이, 개, 새, 물고기, 염소, 당나귀, 햄스터, 또는 버팔로이다.

일부 구현예는 세포에 메신저 RNA (mRNA)를 생산하는 방법을 개시한다. 일부 구현예에서, 본 방법은 바이러스성 캡시드 향상제 또는 그것의 변이체의 하나 이상의 RNA 스템-루프를 인코딩하는 제1 핵산 서열, 및 상기 제1 핵산 서열에 작동가능하게 연결된 제2 핵산 서열을 포함하는 핵산분자를 세포에 투여하는 것을 포함하고, 여기서 상기 제2 핵산 서열은 관심 유전자 (GOI)에 대한 코딩 서열을 포함하고, 그것에 의해 GOI의 mRNA를 생산한다.

일부 구현예에서, 제1 핵산 서열은 GOI에 대한 코딩 서열에 업스트림으로 작동가능하게 연결된다. 일부 구현예에서, 핵산분자는 제1 핵산 서열에 업스트림으로 작동가능하게 연결된 프로모터를 추가로 포함한다. 일부 구현예에서, 핵산분자는 제1 핵산 서열에 업스트림으로 작동가능하게 연결된 5' UTR 서열을 추가로 포함한다. 일부 구현예에서, 5' UTR 서열은 프로모터에 다운스트림으로 그리고 제1 핵산 서열에 업스트림으로 작동가능하게 연결된다. 일부 구현예에서, 핵산분자는 제2 핵산 서열에 업스트림으로 작동가능하게 연결된 오토프로테아제 펩타이드에 대한 코딩 서열을 추가로 포함한다. 일부 구현예에서, 오토프로테아제 펩타이드에 대한 코딩 서열은 제1 핵산 서열에 다운스트림으로 그리고 제2 핵산 서열에 업스트림으로 작동가능하게 연결된다. 일부 구현예에서, 오토프로테아제 펩타이드는 돼지 테스코바이러스-1 2A (P2A), 구제역 바이러스 (FMDV) 2A (F2A), 말 비염 A 바이러스 (ERAV) 2A (E2A), 토사 아시냐 바이러스 2A (T2A), 세포질 다각체병 바이러스 2A (BmCPV2A), 연화병 바이러스 2A (BmIFV2A), 및 이들의 조합으로 구성된 군으로부터 선택된 펩타이드 서열을 포함한다. 일부 구현예에서, 핵산분자는 제2 서열 핵산 서열에 다운스트림으로 작동가능하게 연결된 3' UTR 서열을 추가로 포함한다.

본 명세서에서 개시된 일부 구현예에서, 바이러스성 캡시드 향상제는 토가비리다에 계열에 속하는 바이러스 종의 캡시드 유전자로부터 유래된다. 일부 구현예에서, 바이러스 종은 토가비리다에 계열의 알파바이러스 속에 속한다. 일부 구현예에서, 알파바이러스 종은 동부 말 뇌염 바이러스 (EEEV), 베네주엘라 말 뇌염 바이러스 (VEEV), 에버글레이즈 바이러스 (EVEV), 뮤캄보 바이러스 (MUCV), 셈리키 포레스트 바이러스 (SFV), 픽수나 바이러스 (PIXV), 미들버그 바이러스 (MIDV), 치쿤군야 바이러스 (CHIKV), O'니옹-니옹 바이러스 (ONNV), 로스 리버 바이러스 (RRV), 바마 포레스트 바이러스 (BF), 게타 바이러스 (GET), 사기야마 바이러스 (SAGV), 베바루 바이러스 (BEBV), 마야로 바이러스 (MAYV), 우나 바이러스 (UNAV), 신드비스 바이러스 (SINV), 아우라 바이러스 (AURAV), 화타로아 바이러스 (WHAV), 바반키 바이러스 (BABV), 키질라가크 바이러스 (KYZV), 웨스턴 말 뇌염 바이러스 (WEEV), 하이랜드 J 바이러스 (HJV), 포트 모건 바이러스 (FMV), 느두무 (NDUV), 연어과 알파바이러스 (SAV), 또는 버기 크릭 바이러스이다. 일부 구현예에서, 바이러스성 캡시드 향상제는 바이러스 종의 다운스트림 루프 (DLP) 모티프를 포함하고, 그리고 여기서 상기 DLP 모티프는 하나 이상의 RNA 스템-루프 중 적어도 하나를 포함한다. 일부 구현예에서, 바이러스성 캡시드 향상제는 서열번호: 1 및 46-52 중 적어도 하나에 적어도 80% 서열 동일성을 나타내는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 서열은 서열번호: 1 및 46-52 중 적어도 하나에 적어도 95% 서열 동일성을 나타낸다.

본 명세서에서 개시된 일부 구현예에서, GOI에 대한 코딩 서열은 폴리펩타이드를 인코딩한다. 일부 구현예에서, 본 폴리펩타이드는 치료적 폴리펩타이드, 예방적 폴리펩타이드, 진단적 폴리펩타이드, 기능식품 폴리펩타이드, 산업 효소, 리포터 폴리펩타이드, 및 이들의 조합으로구성된 군으로부터 선택된다. 일부 구현예에서, 본 폴리펩타이드는 항체, 항원, 면역조절제, 사이토카인, 효소, 또는 이들의 조합이다. 본 개시내용에 따른 메신저 RNA (mRNA)를 생산하기 위한 방법의 일부 구현예에서, 핵산분자는 추가로 제2 바이러스성 캡시드 향상제 또는 그것의 변이체의 하나 이상의 RNA 스템-루프를 인코딩하는 제3 핵산 서열; 및 상기 제3 핵산 서열에 작동가능하게 연결된 제4 핵산 서열을 포함하고, 여기서 상기 제4 핵산 서열은 제2 관심 유전자 (GOI)에 대한 코딩 서열을 포함한다. 일부 구현예에서, 본 핵산분자는 추가로 제3 핵산 서열에 다운스트림으로 그리고 제4 핵산 서열에 업스트림으로 작동가능하게 연결된 제2 오토프로테아제 펩타이드에 대한 코딩 서열을 포함한다.

일부 구현예에서, 본 개시내용의 핵산분자는 RNA 레플리콘일 수 있다. 일부 구현예에서, 본 핵산분자는 발현벡터 또는 전사벡터이다. 일부 구현예에서, 핵산분자는 추가로 하나 이상의 추가의 전사 조절 서열을 포함한다. 일부 구현예에서, 핵산분자 추가로 포함한다. 일부 구현예에서, 하나 이상의 추가의 번역 조절 서열. 일부 구현예에서, 본 핵산분자는 플라스미드, 박테리오파아지 벡터, 코스미드, 포스미드, 바이러스성 레플리콘, 셔틀 벡터, 및 이들의 조합으로 구성된 군으로부터 선택된 발현벡터이다. 일부 구현예에서, 본 핵산분자는 원핵 발현벡터 또는 진핵 발현벡터이다. 일부 구현예에서, 세포는 조직, 장기, 또는 대상체에 존재한다. 일부 구현예에서, 상기 대상체는 인간, 말, 돼지, 영장류, 마우스, 흰담비, 랫트, 코튼 랫트, 소, 돼지, 양, 토끼, 고양이, 개, 새, 물고기, 염소, 당나귀, 햄스터, 또는 버팔로이다. 본 개시내용에 따른 메신저 RNA (mRNA)를 생산하기 위한 방법의 일부 구현예에서는 세포에 GOI의 mRNA에 의해 인코딩된 폴리펩타이드를 생산하는 것을 추가로 포함한다. 일부 구현예에서, 본 방법은 GOI의 생산된 mRNA를 수득하는 단계 및 제2 세포에서 GOI의 mRNA에 의해 인코딩된 폴리펩타이드의 발현을 위해 제2 세포 안으로 수득된 mRNA를 도입하는 단계를 추가로 포함한다.

일 양태에서, 본 개시내용의 일부 구현예는 변형된 바이러스성 RNA 레플리콘을 인코딩하는 핵산 서열을 포함하는 핵산분자에 관한 것으로, 여기서 상기 변형된 바이러스성 RNA 레플리콘은 (i) 바이러스성 캡시드 향상제 또는 그것의 변이체의 하나 이상의 구조 요소를 인코딩하는 제1 핵산 서열로, 여기서 상기 바이러스성 캡시드 향상제는 바이러스성 RNA 레플리콘에 이종성인, 제1 핵산 서열, 및 (ii) 적어도 하나의 비구조적 바이러스성 단백질 또는 이들의 부분을 인코딩하는 제2 핵산 서열을 포함하고, 여기서 상기 제1 핵산 서열은 제2 핵산 서열에 업스트림으로 작동가능하게 연결된다.

일부 구현예에서, 바이러스성 캡시드 향상제의 하나 이상의 구조 요소 중 적어도 하나는 하나 이상의 RNA 스템-루프를 포함한다. 일부 구현예에서, 바이러스성 캡시드 향상제는 토가비리다에 계열에 속하는 바이러스 종의 캡시드 유전자로부터 유래된다. 일부 구현예에서, 본 바이러스 종은 토가비리다에 계열의 알파바이러스 속에 속한다. 일부 구현예에서, 본 알파바이러스 종은 동부 말 뇌염 바이러스 (EEEV), 베네주엘라 말 뇌염 바이러스 (VEEV), 에버글레이즈 바이러스 (EVEV), 뮤캄보 바이러스 (MUCV), 셈리키 포레스트 바이러스 (SFV), 픽수나 바이러스 (PIXV), 미들버그 바이러스 (MIDV), 치쿤군야 바이러스 (CHIKV), O'니옹-니옹 바이러스 (ONNV), 로스 리버 바이러스 (RRV), 바마 포레스트 바이러스 (BF), 게타 바이러스 (GET), 사기야마 바이러스 (SAGV), 베바루 바이러스 (BEBV), 마야로 바이러스 (MAYV), 우나 바이러스 (UNAV), 신드비스 바이러스 (SINV), 아우라 바이러스 (AURAV), 화타로아 바이러스 (WHAV), 바반키 바이러스 (BABV), 키질라가크 바이러스 (KYZV), 웨스턴 말 뇌염 바이러스 (WEEV), 하이랜드 J 바이러스 (HJV), 포트 모건 바이러스 (FMV), 느두무 (NDUV), 또는 버기 크릭 바이러스이다. 일부 구현예에서, 본 바이러스성 캡시드 향상제는 바이러스 종의 다운스트림 루프 (DLP) 모티프를 포함하고, 그리고 여기서 상기 DLP 모티프는 하나 이상의 RNA 스템-루프 중 적어도 하나를 포함한다. 일부 구현예에서, 본 바이러스성 캡시드 향상제는 서열번호: 1 및 46-52에 적어도 80% 서열 동일성을 나타내는 핵산 서열 중 적어도 하나를 포함한다. 일부 구현예에서, 핵산 서열은 서열번호: 1 및 46-52 중 적어도 하나에 적어도 95% 서열 동일성을 나타낸다.

일부 구현예에서, 변형된 바이러스성 RNA 레플리콘을 인코딩하는 핵산 서열은 추가로 제1 핵산 서열에 다운스트림으로 그리고 제2 핵산 서열에 업스트림으로 작동가능하게 연결된 오토프로테아제 펩타이드에 대한 코딩 서열을 추가로 포함함. 일부 구현예에서, 본 오토프로테아제 펩타이드는 돼지 테스코바이러스-1 2A (P2A), 구제역 바이러스 (FMDV) 2A (F2A), 말 비염 A 바이러스 (ERAV) 2A (E2A), 토사 아시냐 바이러스 2A (T2A), 세포질 다각체병 바이러스 2A (BmCPV2A), 연화병 바이러스 2A (BmIFV2A), 또는 이들의 조합으로 구성된 군으로부터 선택된 펩타이드 서열을 포함한다. 일부 구현예에서, 제1 핵산 서열은 변형된 바이러스성 RNA 레플리콘의 5'-말단의 다운스트림으로 약 1 내지 1000 뉴클레오타이드의 영역 내에 작동가능하게 배치된다. 제2 핵산 서열은 상응하는 비변형된 바이러스성 RNA 레플리콘의 천연 바이러스성 비구조 단백질에 대한 코딩 서열을 실질적으로 모두 포함한다.

본 명세서에서 개시된 일부 구현예에서, 변형된 바이러스성 RNA 레플리콘은 토가비리다에 계열의 알파바이러스 속 또는 아테리비리다에 계열의 아테리바이러스 속에 속하는 바이러스 종으로부터 유래된 변형된 RNA 레플리콘을 포함한다.

일부 구현예에서, 아테리바이러스 바이러스 종은 말 동맥염 바이러스 (EAV), 돼지 호흡 및 생식 증후군 바이러스 (PRRSV), 락테이트 탈수소효소 증진 바이러스 (LDV), 또는 유인원 출혈열 바이러스 (SHFV)이다. 일부 구현예에서, 제1 핵산 서열은 변형된 아테리바이러스 RNA 레플리콘의 일부 또는 전체의 pp1ab 비구조 단백질을 인코딩하는 제2 핵산 서열에 업스트림으로 작동가능하게 배치된다. 일부 구현예에서, 변형된 아테리바이러스 RNA 레플리콘을 인코딩하는 핵산 서열은 하나 이상의 발현 카세트를 추가로 포함하고, 여기서 하나 이상의 발현 카세트 중 적어도 하나는 관심 유전자 (GOI)에 대한 코딩 서열에 작동가능하게 연결된 프로모터를 포함한다. 일부 구현예에서, 변형된 아테리바이러스 RNA 레플리콘은 적어도 2개, 3개, 4개, 5개, 또는 6개의 발현 카세트를 포함한다. 일부 구현예에서, 하나 이상의 발현 카세트 중 적어도 하나는 변형된 아테리바이러스 RNA 레플리콘의 일부 또는 전체의 pp1ab 비구조 단백질을 인코딩하는 제2 핵산 서열의 다운스트림으로 작동가능하게 연결된다. 일부 구현예에서, 하나 이상의 발현 카세트 중 적어도 하나는 변형된 아테리바이러스 RNA 레플리콘의 전사 조절 서열 (TRS)에 다운스트림으로 작동가능하게 배치되고, 여기서 상기 TRS는 TRS1, TRS2, TRS3, TRS4, TRS5, TRS6, 또는 TRS7이다. 일부 구현예에서, 하나 이상의 발현 카세트 중 적어도 하나는 바이러스성 캡시드 향상제의 하나 이상의 구조 요소를 인코딩하는 제3 핵산 서열을 추가로 포함하고, 여기서 상기 제3 핵산 서열은 GOI에 대한 코딩 서열에 업스트림으로 작동가능하게 연결된다.

일부 구현예에서, 변형된 아테리바이러스 RNA 레플리콘을 인코딩하는 핵산 서열은 제3 핵산 서열에 다운스트림으로 그리고 GOI에 대한 코딩 서열에 업스트림으로 작동가능하게 연결된 오토프로테아제 펩타이드에 대한 코딩 서열을 추가로 포함한다. 일부 구현예에서, GOI에 대한 코딩 서열은 치료적 폴리펩타이드, 예방적 폴리펩타이드, 진단적 폴리펩타이드, 기능식품 폴리펩타이드, 산업 효소, 리포터 폴리펩타이드, 또는 이들의 임의의 조합을 인코딩한다. 일부 구현예에서, GOI에 대한 코딩 서열은 항체, 항원, 면역 조절제, 사이토카인, 효소, 또는 이들의 임의의 조합을 인코딩한다.

일부 구현예에서, 변형된 바이러스성 RNA 레플리콘은 동부 말 뇌염 바이러스 (EEEV), 베네주엘라 말 뇌염 바이러스 (VEEV), 에버글레이즈 바이러스 (EVEV), 뮤캄보 바이러스 (MUCV), 셈리키 포레스트 바이러스 (SFV), 픽수나 바이러스 (PIXV), 미들버그 바이러스 (MIDV), 치쿤군야 바이러스 (CHIKV), O'니옹-니옹 바이러스 (ONNV), 로스 리버 바이러스 (RRV), 바마 포레스트 바이러스 (BF), 게타 바이러스 (GET), 사기야마 바이러스 (SAGV), 베바루 바이러스 (BEBV), 마야로 바이러스 (MAYV), 우나 바이러스 (UNAV), 신드비스 바이러스 (SINV), 아우라 바이러스 (AURAV), 화타로아 바이러스 (WHAV), 바반키 바이러스 (BABV), 키질라가크 바이러스 (KYZV), 웨스턴 말 뇌염 바이러스 (WEEV), 하이랜드 J 바이러스 (HJV), 포트 모건 바이러스 (FMV), 느두무 (NDUV), 연어과 알파바이러스 (SAV), 및 버기 크릭 바이러스로 구성된 군으로부터 선택된 알파바이러스 바이러스 종으로부터 유래된 변형된 RNA 레플리콘을 포함한다. 일부 구현예에서, 제1 핵산 서열은 변형된 알파바이러스 RNA 레플리콘의 하나 이상의 비구조 단백질 nsp1-4 또는 이들의 일부를 인코딩하는 제2 핵산 서열에 업스트림으로 작동가능하게 배치된다. 일부 구현예에서, 변형된 알파바이러스 RNA 레플리콘을 인코딩하는 핵산 서열은 하나 이상의 발현 카세트를 추가로 포함하고, 여기서 각각의 발현 카세트는 관심 유전자 (GOI)에 대한 코딩 서열에 작동가능하게 연결된 프로모터를 포함한다. 일부 구현예에서, 변형된 알파바이러스 RNA 레플리콘은 적어도 2개, 3개, 4개, 5개, 또는 6개의 발현 카세트를 포함한다. 일부 구현예에서, 적어도 하나 이상의 발현 카세트는 변형된 알파바이러스 RNA 레플리콘의 하나 이상의 비구조 단백질 nsp1-4 또는 이들의 일부를 인코딩하는 핵산 서열의 다운스트림으로 작동가능하게 연결된다. 일부 구현예에서, 하나 이상의 발현 카세트 중 적어도 하나는 바이러스성 캡시드 향상제의 하나 이상의 구조 요소를 인코딩하는 제3 핵산 서열을 추가로 포함하고, 여기서 상기 제3 핵산 서열은 GOI에 대한 코딩 서열의 업스트림으로 작동가능하게 연결된다. 일부 구현예에서, 변형된 알파바이러스 RNA 레플리콘을 인코딩하는 핵산 서열은 제3 핵산 서열에 다운스트림으로 그리고 GOI에 대한 코딩 서열에 업스트림으로 작동가능하게 연결된 오토프로테아제 펩타이드에 대한 코딩 서열을 추가로 포함한다. 일부 구현예에서, GOI에 대한 코딩 서열은 치료적 폴리펩타이드, 예방적 폴리펩타이드, 진단적 폴리펩타이드, 기능식품 폴리펩타이드, 산업 효소, 리포터 폴리펩타이드, 또는 이들의 조합을 인코딩한다. 일부 구현예에서, GOI에 대한 코딩 서열은 항체, 항원, 면역 조절제, 효소, 사이토카인, 또는 이들의 조합을 인코딩한다.

일 양태에서, 본 개시내용의 일부 구현예는 변형된 비-알파바이러스 RNA 레플리콘을 인코딩하는 핵산 서열을 포함하는 핵산분자에 관한 것이고, 여기서 상기 변형된 비-알파바이러스 RNA 레플리콘은 바이러스성 캡시드 향상제 또는 그것의 변이체의 하나 이상의 구조 요소를 인코딩하는 제1 핵산 서열을 포함함. 일부 구현예에서, 변형된 비-알파바이러스 RNA 레플리콘을 인코딩하는 핵산 서열은 적어도 하나의 비구조적 바이러스성 단백질 또는 이들의 부분을 인코딩하는 제2 핵산 서열을 추가로 포함하고, 여기서 제1 핵산 서열은 제2 핵산 서열에 업스트림으로 작동가능하게 연결된다. 일부 구현예에서, 변형된 비-알파바이러스 RNA 레플리콘을 인코딩하는 핵산 서열은 제1 핵산 서열에 다운스트림으로 그리고 제2 핵산 서열에 업스트림으로 작동가능하게 연결된 오토프로테아제 펩타이드에 대한 코딩 서열을 추가로 포함한다. 일부 구현예에서, 오토프로테아제 펩타이드는 돼지 테스코바이러스-1 2A (P2A), 구제역 바이러스 (FMDV) 2A (F2A), 말 비염 A 바이러스 (ERAV) 2A (E2A), 토사 아시냐 바이러스 2A (T2A), 세포질 다각체병 바이러스 2A (BmCPV2A), 연화병 바이러스 2A (BmIFV2A), 또는 이들의 조합으로 구성된 군으로부터 선택된 펩타이드 서열을 포함한다. 일부 구현예에서, 변형된 비-알파바이러스 RNA 레플리콘을 인코딩하는 핵산 서열은 양성-가닥 RNA 바이러스로부터 유래된 변형된 RNA 레플리콘을 포함한다. 일부 구현예에서, 양성-가닥 RNA 바이러스는 토가비리다에 계열, 플라비비리다에 계열, 오토믹소비리다에 계열, 라브도비리다에 계열, 및 파라믹소비리다에 계열로 구성된 군으로부터 선택된 계열에 속하는 바이러스 종이다. 일부 구현예에서, 양성-가닥 RNA 바이러스는 아테리비리다에 계열의 아테리바이러스 속에 속하는 바이러스 종이다.

본 명세서에서 개시된 일부 구현예에서, 변형된 비-알파바이러스 RNA 레플리콘을 인코딩하는 핵산 서열은 하나 이상의 발현 카세트를 추가로 포함하고, 여기서 각각의 상기 발현 카세트는 관심 유전자 (GOI)에 대한 코딩 서열에 작동가능하게 연결된 프로모터를 포함한다. 일부 구현예에서, 변형된 비-알파바이러스 RNA 레플리콘은 적어도 2개, 3개, 4개, 5개, 또는 6개의 발현 카세트를 포함한다. 일부 구현예에서, 하나 이상의 발현 카세트 중 적어도 하나는 적어도 하나의 비구조적 바이러스성 단백질 또는 이들의 부분을 인코딩하는 제2 핵산 서열의 다운스트림으로 작동가능하게 연결된다. 일부 구현예에서, 하나 이상의 발현 카세트 중 적어도 하나는 바이러스성 캡시드 향상제의 하나 이상의 구조 요소를 인코딩하는 제3 핵산 서열을 추가로 포함하고, 여기서 상기 제3 핵산 서열은 GOI에 대한 코딩 서열에 업스트림으로 작동가능하게 연결된다. 일부 구현예에서, 변형된 비-알파바이러스 RNA 레플리콘을 인코딩하는 핵산 서열은 제3 핵산 서열에 다운스트림으로 그리고 GOI에 대한 코딩 서열에 업스트림으로 작동가능하게 연결된 오토프로테아제 펩타이드에 대한 코딩 서열을 추가로 포함함. 일부 구현예에서, 본 핵산분자는 새로운 합성을 통해 생산된다.

일 양태에서, 본 명세서에서 개시된 일부 구현예는 본 명세서에서 개시된 바와 같은 핵산분자를 포함하는 재조합 세포에 관한 것이다. 일부 구현예에서, 본 재조합 세포는 원핵세포 또는 진핵세포이다. 일부 구현예에서, 본 재조합 세포는 동물세포이다. 일부 구현예에서, 핵산분자는 변형된 RNA 레플리콘을 인코딩하는 핵산 서열을 포함하고, 그리고 여기서 변형된 레플리콘 RNA의 발현은 재조합 세포에서 선천적인 면역반응에 대한 내성을 부여한다. 관련된 양태에서, 본 명세서에서 개시된 일부 구현예는 본 명세서에서 개시된 바와 같은 적어도 하나의 재조합 세포를 포함하는 세포 배양물에 관한 것이다.

일부 양태에서, 본 명세서에서 개시된 일부 구현예는 변형된 바이러스성 RNA 레플리콘을 인코딩하는 핵산 서열을 포함하는 핵산분자를 대상체에게 투여하는 것을 포함하는 대상체의 선천적인 면역계에 대한 내성을 부여하는 방법에 관한 것으로, 여기서 상기 변형된 바이러스성 RNA 레플리콘은 (i) 바이러스성 캡시드 향상제 또는 그것의 변이체의 하나 이상의 구조 요소를 인코딩하는 제1 핵산 서열로서, 여기서 상기 바이러스성 캡시드 향상제는 바이러스성 RNA 레플리콘에 이종성인, 제1 핵산 서열, 및 (ii) 적어도 하나의 비구조 단백질 또는 이들의 일부를 인코딩하는 제2 핵산 서열을 포함하고, 여기서 상기 제1 핵산 서열은 제2 핵산 서열에 업스트림으로 작동가능하게 연결되고, 그리고 핵산분자에 의해 인코딩된 변형된 레플리콘 RNA의 발현은 대상체에게 선천적인 면역반응에 대한 내성을 부여한다. 일부 구현예에서, 상기 대상체는 인간, 말, 돼지, 영장류, 마우스, 흰담비, 랫트, 코튼 랫트, 소, 돼지, 양, 토끼, 고양이, 개, 새, 물고기, 염소, 당나귀, 햄스터, 및 버팔로로 구성된 군으로부터 선택된다

일부 양태에서, 본 명세서에서 개시된 일부 구현예는 변형된 바이러스성 RNA 레플리콘을 인코딩하는 핵산 서열을 포함하는 핵산분자를 대상체에게 투여하는 것을 포함하는 대상체에서 관심 있는 폴리펩타이드를 생산하는 방법에 관한 것으로, 여기서 상기 변형된 바이러스성 RNA 레플리콘은 (i) 바이러스성 캡시드 향상제 또는 그것의 변이체의 하나 이상의 구조 요소를 인코딩하는 제1 핵산 서열로서, 여기서 상기 바이러스성 캡시드 향상제는 바이러스성 RNA 레플리콘에 이종성인, 제1 핵산 서열, 및 (ii) 적어도 하나의 비구조 단백질 또는 이들의 일부를 인코딩하는 제2 핵산 서열을 포함하고, 여기서 상기 제1 핵산 서열은 제2 핵산 서열에 업스트림으로 작동가능하게 연결된다. 일부 구현예에서, 상기 대상체는 인간, 말, 돼지, 영장류, 마우스, 흰담비, 랫트, 코튼 랫트, 소, 돼지, 양, 토끼, 고양이, 개, 새, 물고기, 염소, 당나귀, 햄스터, 또는 버팔로이다.

일부 양태에서, 본 명세서에서 개시된 일부 구현예는 변형된 바이러스성 RNA 레플리콘을 인코딩하는 핵산 서열을 포함하는 핵산분자를 포함하는 숙주세포를 배양하는 것을 포함하는, 관심 있는 폴리펩타이드를 생산하는 방법에 관한 것으로, 여기서 상기 변형된 바이러스성 RNA 레플리콘은 (i) 바이러스성 캡시드 향상제 또는 그것의 변이체의 하나 이상의 구조 요소를 인코딩하는 제1 핵산 서열로서, 여기서 상기 바이러스성 캡시드 향상제는 바이러스성 RNA 레플리콘에 이종성인, 제1 핵산 서열, 및 (ii) 적어도 하나의 비구조 단백질 또는 이들의 일부를 인코딩하는 제2 핵산 서열을 포함하고, 여기서 상기 제1 핵산 서열은 제2 핵산 서열에 업스트림으로 작동가능하게 연결된다.

본 개시내용에 따른 관심 있는 폴리펩타이드를 생산하는 방법의 일부 구현예에서, 대상체는 인간, 말, 돼지, 영장류, 마우스, 흰담비, 랫트, 코튼 랫트, 소, 돼지, 양, 토끼, 고양이, 개, 새, 물고기, 염소, 당나귀, 햄스터, 및 버팔로로 구성된 군으로부터 선택된다. 일부 구현예에서, 바이러스성 캡시드 향상제의 하나 이상의 구조 요소 중 적어도 하나는 하나 이상의 RNA 스템-루프를 포함한다. 일부 구현예에서, 바이러스성 캡시드 향상제는 토가비리다에 계열에 속하는 바이러스 종의 캡시드 유전자로부터 유래된다. 일부 구현예에서, 바이러스 종은 토가비리다에 계열의 알파바이러스 속에 속한다. 일부 구현예에서, 알파바이러스 종은 동부 말 뇌염 바이러스 (EEEV), 베네주엘라 말 뇌염 바이러스 (VEEV), 에버글레이즈 바이러스 (EVEV), 뮤캄보 바이러스 (MUCV), 셈리키 포레스트 바이러스 (SFV), 픽수나 바이러스 (PIXV), 미들버그 바이러스 (MIDV), 치쿤군야 바이러스 (CHIKV), O'니옹-니옹 바이러스 (ONNV), 로스 리버 바이러스 (RRV), 바마 포레스트 바이러스 (BF), 게타 바이러스 (GET), 사기야마 바이러스 (SAGV), 베바루 바이러스 (BEBV), 마야로 바이러스 (MAYV), 우나 바이러스 (UNAV), 신드비스 바이러스 (SINV), 아우라 바이러스 (AURAV), 화타로아 바이러스 (WHAV), 바반키 바이러스 (BABV), 키질라가크 바이러스 (KYZV), 웨스턴 말 뇌염 바이러스 (WEEV), 하이랜드 J 바이러스 (HJV), 포트 모건 바이러스 (FMV), 느두무 (NDUV), 또는 버기 크릭 바이러스이다. 일부 구현예에서, 바이러스성 캡시드 향상제는 바이러스 종의 다운스트림 루프 (DLP) 모티프를 포함하고, 그리고 여기서 상기 DLP 모티프는 하나 이상의 RNA 스템-루프 중 적어도 하나를 포함한다. 일부 구현예에서, 바이러스성 캡시드 향상제는 서열번호: 1 및 46-52 중 적어도 하나에 적어도 80% 서열 동일성을 나타내는 핵산 서열을 포함한다. 일부 구현예에서, 본 핵산 서열은 서열번호: 1 및 46-52 중 적어도 하나에 적어도 95% 서열 동일성을 나타낸다.

본 명세서에서 개시된 일부 구현예에서, 변형된 바이러스성 RNA 레플리콘을 인코딩하는 핵산 서열은 제1 핵산 서열에 다운스트림으로 그리고 제2 핵산 서열에 업스트림으로 작동가능하게 연결된 오토프로테아제 펩타이드에 대한 코딩 서열을 추가로 포함함. 일부 구현예에서, 오토프로테아제 펩타이드는 돼지 테스코바이러스-1 2A (P2A), 구제역 바이러스 (FMDV) 2A (F2A), 말 비염 A 바이러스 (ERAV) 2A (E2A), 토사 아시냐 바이러스 2A (T2A), 세포질 다각체병 바이러스 2A (BmCPV2A), 연화병 바이러스 2A (BmIFV2A), 또는 이들의 조합으로 구성된 군으로부터 선택된 펩타이드 서열을 포함한다. 일부 구현예에서, 제1 핵산 서열은 변형된 바이러스성 RNA 레플리콘의 5'-말단의 다운스트림으로 약 1 내지 1000 뉴클레오타이드의 영역 내에 작동가능하게 배치된다. 제2 핵산 서열은 상응하는 비변형된 바이러스성 RNA 레플리콘의 천연 바이러스성 비구조 단백질에 대한 코딩 서열을 실질적으로 모두 포함한다.

일부 구현예에서, 변형된 바이러스성 RNA 레플리콘은 토가비리다에 계열의 알파바이러스 속 또는 아테리비리다에 계열의 아테리바이러스 속에 속하는 바이러스 종으로부터 유래된 변형된 RNA 레플리콘을 포함한다. 일부 구현예에서, 아테리바이러스 바이러스 종은 말 동맥염 바이러스 (EAV), 돼지 호흡 및 생식 증후군 바이러스 (PRRSV), 락테이트 탈수소효소 증진 바이러스 (LDV), 또는 유인원 출혈열 바이러스 (SHFV)이다.

본 명세서에서 개시된 일부 구현예에서, 변형된 아테리바이러스 RNA 레플리콘을 인코딩하는 핵산 서열은 하나 이상의 발현 카세트를 추가로 포함하고, 그리고 여기서 발현 카세트 중 적어도 하나는 관심 유전자 (GOI)에 대한 코딩 서열에 작동가능하게 연결된 프로모터를 포함한다. 일부 구현예에서, 바이러스 종은 아테리바이러스이고, 여기서 제1 핵산 서열은 변형된 아테리바이러스 RNA 레플리콘의 일부 또는 전체의 pp1ab 비구조 단백질을 인코딩하는 핵산 서열에 업스트림으로 작동가능하게 배치된다. 일부 구현예에서, 변형된 아테리바이러스 RNA 레플리콘은 적어도 2개, 3개, 4개, 5개, 또는 6개의 발현 카세트를 추가로 포함한다. 일부 구현예에서, 하나 이상의 발현 카세트 중 적어도 하나는 변형된 아테리바이러스 RNA 레플리콘의 일부 또는 전체의 pp1ab 비구조 단백질을 인코딩하는 제2 핵산 서열의 다운스트림으로 작동가능하게 연결된다. 일부 구현예에서, 하나 이상의 발현 카세트 중 적어도 하나는 변형된 아테리바이러스 RNA 레플리콘의 전사 조절 서열 (TRS)에 다운스트림으로 작동가능하게 배치되고, 여기서 상기 TRS는 TRS1, TRS2, TRS3, TRS4, TRS5, TRS6, 또는 TRS7이다. 일부 구현예에서, 하나 이상의 발현 카세트 중 적어도 하나는 바이러스성 캡시드 향상제의 하나 이상의 구조 요소를 인코딩하는 제3 핵산 서열을 추가로 포함하고, 여기서 상기 제3 핵산 서열은 GOI에 대한 코딩 서열에 업스트림으로 작동가능하게 연결된다. 일부 구현예에서, 변형된 아테리바이러스 RNA 레플리콘을 인코딩하는 핵산 서열은 제3 핵산 서열에 다운스트림으로 그리고 GOI에 대한 코딩 서열에 업스트림으로 작동가능하게 연결된 오토프로테아제 펩타이드에 대한 코딩 서열을 추가로 포함함. 일부 구현예에서, GOI에 대한 코딩 서열은 치료적 폴리펩타이드, 예방적 폴리펩타이드, 진단적 폴리펩타이드, 기능식품 폴리펩타이드, 산업 효소, 리포터 폴리펩타이드, 또는 이들의 임의의 조합을 인코딩한다. 일부 구현예에서, GOI에 대한 코딩 서열은 항체, 항원, 면역 조절제, 사이토카인, 효소, 또는 이들의 임의의 조합을 인코딩한다.

일부 구현예에서, 변형된 바이러스성 RNA 레플리콘은 동부 말 뇌염 바이러스 (EEEV), 베네주엘라 말 뇌염 바이러스 (VEEV), 에버글레이즈 바이러스 (EVEV), 뮤캄보 바이러스 (MUCV), 셈리키 포레스트 바이러스 (SFV), 픽수나 바이러스 (PIXV), 미들버그 바이러스 (MIDV), 치쿤군야 바이러스 (CHIKV), O'니옹-니옹 바이러스 (ONNV), 로스 리버 바이러스 (RRV), 바마 포레스트 바이러스 (BF), 게타 바이러스 (GET), 사기야마 바이러스 (SAGV), 베바루 바이러스 (BEBV), 마야로 바이러스 (MAYV), 우나 바이러스 (UNAV), 신드비스 바이러스 (SINV), 아우라 바이러스 (AURAV), 화타로아 바이러스 (WHAV), 바반키 바이러스 (BABV), 키질라가크 바이러스 (KYZV), 웨스턴 말 뇌염 바이러스 (WEEV), 하이랜드 J 바이러스 (HJV), 포트 모건 바이러스 (FMV), 느두무 (NDUV), 연어과 알파바이러스 (SAV), 및 버기 크릭 바이러스로 구성된 군으로부터 선택된 알파바이러스바이러스 종으로부터 유래된 변형된 RNA 레플리콘을 포함한다. 일부 구현예에서, 제1 핵산 서열은 변형된 알파바이러스 RNA 레플리콘의 하나 이상의 비구조 단백질 nsp1-4 또는 이들의 일부를 인코딩하는 핵산 서열에 업스트림으로 작동가능하게 배치된다.

일부 구현예에서, 변형된 알파바이러스 RNA 레플리콘을 인코딩하는 핵산 서열은 하나 이상의 발현 카세트를 추가로 포함하고, 여기서 각각의 발현 카세트는 관심 유전자 (GOI)에 대한 코딩 서열에 작동가능하게 연결된 프로모터를 포함한다. 일부 구현예에서, 변형된 알파바이러스 RNA 레플리콘은 적어도 2개, 3개, 4개, 5개, 또는 6개의 발현 카세트를 포함한다. 일부 구현예에서, 하나 이상의 발현 카세트 중 적어도 하나는 변형된 알파바이러스 RNA 레플리콘의 하나 이상의 비구조 단백질 nsp1-4 또는 이들의 일부를 인코딩하는 핵산 서열의 다운스트림으로 작동가능하게 연결된다. 일부 구현예에서, 하나 이상의 발현 카세트 중 적어도 하나는 바이러스성 캡시드 향상제의 하나 이상의 구조 요소를 인코딩하는 제3 핵산 서열을 추가로 포함하고, 여기서 상기 제3 핵산 서열은 GOI에 대한 코딩 서열의 업스트림으로 작동가능하게 연결된다. 일부 구현예에서, 변형된 알파바이러스 RNA 레플리콘은 제3 핵산 서열에 다운스트림으로 그리고 GOI에 대한 코딩 서열에 업스트림으로 작동가능하게 연결된 오토프로테아제 펩타이드에 대한 코딩 서열을 추가로 포함함. 일부 구현예에서, GOI에 대한 코딩 서열은 치료적 폴리펩타이드, 예방적 폴리펩타이드, 진단적 폴리펩타이드, 기능식품 폴리펩타이드, 산업 효소, 리포터 폴리펩타이드, 또는 이들의 임의의 조합을 인코딩한다. 일부 구현예에서, GOI에 대한 코딩 서열은 항체, 항원, 면역 조절제, 사이토카인, 효소, 또는 이들의 임의의 조합을 인코딩한다.

또 다른 양태에서, 본 명세서에서 개시된 일부 구현예는 변형된 비-알파바이러스 RNA 레플리콘을 인코딩하는 핵산 서열을 포함하는 핵산분자를 대상체에게 투여하는 것을 포함하는, 대상체의 선천적인 면역계에 내성을 부여하는 방법에 관한 것으로, 여기서 상기 변형된 비-알파바이러스 RNA 레플리콘은 알파바이러스 캡시드 향상제의 하나 이상의 구조 요소를 인코딩하는 제1 핵산 서열을 포함하고 그리고 상기 핵산분자에 의해 인코딩된 변형된 비-알파바이러스 RNA 레플리콘의 발현은 대상체의 선천적인 면역계에 내성을 부여한다. 일부 구현예에서, 상기 대상체는 인간, 말, 돼지, 영장류, 마우스, 흰담비, 랫트, 코튼 랫트, 소, 돼지, 양, 토끼, 고양이, 개, 새, 물고기, 염소, 당나귀, 햄스터, 및 버팔로로 구성된 군으로부터 선택된다.

또한 본 명세서에서 개시된 것은 대상체에 관심 있는 폴리펩타이드를 생산하는 방법을 포함하며, 여기서 상기 방법은 상기 대상체에게 변형된 비-알파바이러스 RNA 레플리콘을 인코딩하는 핵산 서열을 포함하는 핵산분자를 투여하는 것을 포함하고, 여기서 상기 변형된 비-알파바이러스 RNA 레플리콘은 알파바이러스 캡시드 향상제의 하나 이상의 구조 요소를 인코딩하는 제1 핵산 서열을 포함한다. 일부 구현예에서, 상기 대상체는 인간, 말, 돼지, 영장류, 마우스, 흰담비, 랫트, 코튼 랫트, 소, 돼지, 양, 토끼, 고양이, 개, 새, 물고기, 염소, 당나귀, 햄스터, 또는 버팔로이다.

본 명세서에서 개시된 일부 구현예는 관심 있는 폴리펩타이드를 생산하는 방법에 관한 것으로, 여기서 상기 방법은 변형된 비-알파바이러스 RNA 레플리콘을 인코딩하는 핵산 서열을 포함하는 핵산분자를 포함하는 숙주세포를 배양하는 것을 포함하고, 여기서 상기 변형된 비-알파바이러스 RNA 레플리콘은 알파바이러스 캡시드 향상제의 하나 이상의 구조 요소를 인코딩하는 제1 핵산 서열을 포함한다.

본 개시내용의 상기 양태에 따른 일부 구현예에서, 변형된 비-알파바이러스 RNA 레플리콘은 적어도 하나의 비구조적 바이러스성 단백질 또는 이들의 부분을 인코딩하는 제2 핵산 서열을 추가로 포함하며, 여기서 제1 핵산 서열은 제2 핵산 서열에 업스트림으로 작동가능하게 연결된다. 일부 구현예에서, 변형된 비-알파바이러스 RNA 레플리콘은 제1 핵산 서열에 다운스트림으로 그리고 제2 핵산 서열에 업스트림으로 작동가능하게 연결된 오토프로테아제 펩타이드에 대한 코딩 서열을 추가로 포함한다. 일부 구현예에서 오토프로테아제 펩타이드는 돼지 테스코바이러스-1 2A (P2A), 구제역 바이러스 (FMDV) 2A (F2A), 말 비염 A 바이러스 (ERAV) 2A (E2A), 토사 아시냐 바이러스 2A (T2A), 세포질 다각체병 바이러스 2A (BmCPV2A), 연화병 바이러스 2A (BmIFV2A), 및 이들의 조합으로 구성된 군으로부터 선택된 펩타이드 서열을 포함한다. 일부 구현예에서, 변형된 비-알파바이러스 RNA 레플리콘은 양성-가닥 RNA 바이러스로부터 유래된 변형된 RNA 레플리콘을 포함한다. 일부 구현예에서, 본 변형된 비-알파바이러스 RNA 레플리콘은 토가비리다에 계열, 플라비비리다에 계열, 오토믹소비리다에 계열, 라브도비리다에 계열, 또는 파라믹소비리다에 계열에 속하는 바이러스 종으로부터 유래된 변형된 RNA 레플리콘을 포함한다. 일부 구현예에서, 변형된 비-알파바이러스 RNA 레플리콘은 아테리비리다에 계열의 아테리바이러스 속에 속하는 바이러스 종으로부터 유래된 변형된 RNA 레플리콘을 포함한다. 일부 구현예에서, 비-알파바이러스 변형된 RNA 레플리콘을 인코딩하는 서열은 하나 이상의 발현 카세트를 추가로 포함하고, 여기서 각각의 발현 카세트는 관심 유전자 (GOI)에 대한 코딩 서열에 작동가능하게 연결된 프로모터를 포함한다. 일부 구현예에서, 변형된 비-알파바이러스 RNA 레플리콘은 적어도 2개, 3개, 4개, 5개, 또는 6개의 발현 카세트를 포함한다. 일부 구현예에서, 하나 이상의 발현 카세트 중 적어도 하나는 변형된 비-알파바이러스 RNA 레플리콘의 적어도 하나의 비구조적 바이러스성 단백질 또는 이들의 부분을 인코딩하는 제2 핵산 서열의 다운스트림으로 작동가능하게 연결된다. 일부 구현예에서, 하나 이상의 발현 카세트 중 적어도 하나는 알파바이러스 캡시드 향상제의 하나 이상의 구조 요소를 인코딩하는 제3 핵산 서열을 추가로 포함하고, 여기서 상기 제3 핵산 서열은 GOI에 대한 코딩 서열에 업스트림으로 작동가능하게 연결된다. 일부 구현예에서, 변형된 비-알파바이러스 RNA 레플리콘은 제3 핵산 서열에 다운스트림으로 그리고 GOI에 대한 코딩 서열에 업스트림으로 작동가능하게 연결된 오토프로테아제 펩타이드에 대한 코딩 서열을 추가로 포함한다.

일부 양태에서, 본 명세서에서 개시된 일부 구현예는 본 명세서에 기재된 하나 이상의 구현예에 따른 방법에 의해 생산된 재조합 폴리펩타이드에 관한 것이다.

본 명세서에서 개시된 일부 구현예는 본 명세서에서 기재된 바와 같은 재조합 폴리펩타이드 및 약제학적으로 허용가능한 담체를 포함하는 조성물에 관한 것이다.

본 명세서에서 개시된 일부 구현예는 본 명세서에서 개시된 바와 같은 핵산분자 및 약제학적으로 허용가능한 담체를 포함하는 조성물에 관한 것이다.

일부 구현예에서, 본원의 조성물 및/또는 분자, 예를 들어 핵산분자, RNA 레플리콘, 및 폴리펩타이드 중 하나 이상은 약제학적 제형으로 추가로 제형화된다. 일부 구현예에서, 본원의 조성물 및/또는 분자 중 하나 이상은 공유 화합물, 비-공유 화합물, 물리적 조성물, 또는 약제학적으로 허용가능한 완충액과 함께 약제학적 제형으로 제형화된다.

본 명세서에서 개시된 일부 구현예에서, 본원의 조성물 및/또는 분자, 예를 들어 핵산분자, RNA 레플리콘, 및 폴리펩타이드 중 하나 이상은 보호성 조성물 (예를 들어, 백신) 또는 치료적 조성물로 사용하기 위해 추가로 제형화된다. 특히, 본 개시내용에 따라 제조된 보호성 조성물은, 비제한적으로, 백신 및 다른 치료제로서 사용, 진단제로서 사용 및 다클론성 또는 단클론성 항체의 생산에서 항원으로서 사용을 포함하여 다양한 용도를 갖는다.

전술한 요약은 단지 예시적이고 어떤 식으로든 제한하기 위한 것은 아니다. 본 명세서에 기재된 예시적 구현예 및 특징에 부가하여, 본원의 추가 양태, 구현예, 목적 및 특징은 도면과 상세한 설명 그리고 청구항들로부터 완전하게 분명히 될 것이다.

도 1은 알파바이러스 캡시드 향상제의 비제한적인 예시적인 스템-루프 RNA 구조의 그래픽 도시이다.
도 2A-2D는 본 개시내용의 4개의 비제한적인 예시적인 핵산분자의 그래픽 표현으로, 여기서 각각의 핵산분자는 알파바이러스 캡시드 향상제 (예를 들어, DLP 모티프)에 대한 코딩 서열 및 관심 유전자 (GOI), 예를 들어, 붉은 개똥벌레 (rFF) 리포터 유전자에 대한 코딩 서열을 포함한다. 도 2A: rEx-DLP-rFF; 도 2B: rEx-DLP-pp1ab-rFF; 도 2C: rEx-DLP-2A-pp1ab-rFF; 및 도 2D: rEx-DLP-2A-pp1ab-DLP-rFF. DLP: 다운스트림 루프 서열; 2A: 오토프로테아제 펩타이드; pp1ab: 비구조적 폴리펩타이드 서열; 및 rFF: 붉은 개똥벌레 리포터 유전자에 대한 코딩 서열.
도 3A-3D는 본 개시내용의 4개의 비제한적인 예시적인 핵산분자의 그래픽 도시로, 여기서 각각의 핵산분자는 알파바이러스 캡시드 향상제(예를 들어, DLP 모티프)에 대한 코딩 서열 및 관심 유전자 (GOI), 예를 들어, 붉은 개똥벌레 (rFF) 리포터 유전자에 대한 코딩 서열을 포함한다. 도 3A: 알파-R-rFF; 도 3B: 알파-R-DLP-rFF; 도 3C: 알파-R-DLP-2A-nsp-rFF; 및 도 3D: 알파-R-DLP-2A-nsp-DLP-rFF. DLP: 다운스트림 루프 서열; 2A: 오토프로테아제 펩타이드; nsp1-4: 비구조적 폴리펩타이드 서열; 및 rFF: 붉은 개똥벌레 리포터 유전자에 대한 코딩 서열.
도 4A-4B는 본 개시내용의 2개의 다른 비제한적인 예시적인 핵산분자의 그래픽 도시로, 여기서 각각의 핵산분자는 알파바이러스 캡시드 향상제(예를들어, a DLP 모티프)에 대한 코딩 서열 및 관심 유전자 (GOI), 예를 들어, 붉은 개똥벌레 (rFF) 리포터 유전자에 대한 코딩 서열을 인코딩하는 것을 포함한다. 도 4A: 알파-R-DLP-2A-rFF; 및 도 4B: 알파-R-DLP-2A-nsp-DLP-2A-rFF. DLP: 다운스트림 루프 서열; 2A: 오토프로테아제 펩타이드; nsp1-4: 비구조적 폴리펩타이드 서열; 및 rFF: 붉은 개똥벌레 리포터 유전자에 대한 코딩 서열.
도 5A-5B는 서브게놈 RNA, 즉 rFF 리포터 유전자에 배치된 관심 유전자 또는 EAV 비구조적 단백질 유전자 중 어느 하나를 인코딩하는 핵산 서열의 업스트림으로 DLP 모티프를 합체시키는 것은 게놈 RNA 복제에 부정적으로 영향을 미치지 않는다는 것을 입증하기 위해 수행된 유세포측정분석 및 벌크 루시퍼라아제 분석의 결과를 그래프로 요약한다. 이들 실험에서, FACS 분석 (도 5A) 및 벌크-세포 루시퍼라아제 검정 (도 5B)은 전기천공된 세포 상에서 수행되었다.
도 6A-B는 비구조적 단백질 유전자를 인코딩하는 서열의 업스트림 편입된 DLP 모티프를 갖는 변형된 아테리바이러스 레플리콘 RNA는 세포의 선천적인 면역계를 유도하도록 IFN으로 처리된 숙주세포에서 효율적으로 복제 및 발현될 수 있다는 것을 입증하기 위해 수행된 또 다른 예시적인 유세포측정분석 및 벌크 루시퍼라아제 분석의 결과를 그래프로 요약한다. 이들 실험에서, FACS 분석 (도 6A) 및 벌크-세포 루시퍼라아제 검정 (도 6B)은 전기천공된 세포 상에서 수행되었다. IFN은 전기천공 5시간 후 세포 배양 배지에 첨가되었다. 샘플은 분석을 위해 전기천공 18시간 후 3중으로 수집되었다.
도 7A-C는 비구조적 단백질 유전자를 인코딩하는 서열의 업스트림 편입된 DLP 모티프를 갖는 변형된 알파바이러스 레플리콘 RNA는 세포의 선천적인 면역계를 유도하도록 IFN으로 처리된 숙주세포에서 효율적으로 복제 및 발현될 수 있다는 것을 입증하기 위해 수행된 또 다른 예시적인 벌크 루시퍼라아제 분석의 결과를 그래프로 요약한다. 이들 실험에서, 벌크-세포 루시퍼라아제 검정은 전기천공된 세포 상에서 수행되었다. IFN은 전기천공 후 즉시 또는 전기천공 3시간 후 세포 배양 배지에 첨가되었다. 샘플은 분석을 위해 전기천공 18시간 후 3중으로 수집되었다. 도 7A: α-rFF 대 알파-R-rFF 작제물; 도 7B: α-rFF 대 α-DLP-2A-nsp-rFF; 및 도 7C: α-rFF 대 알파-R-DLP-2A-nsp-rFF 작제물.
도 8은 비구조적 단백질 유전자를 인코딩하는 서열의 업스트림 편입된 DLP 모티프를 갖는 변형된 알파바이러스 레플리콘 RNA는 Balb/c 마우스에서 효율적으로 복제 및 발현될 수 있다는 것을 입증하기 위해 수행된 예시적인 생체내 실험의 결과를 그래프로 요약한다. 이들 실험에서, 변형된 알파바이러스 레플리콘 RNA가 주입된 동물의 전신 이미지형성이 수행되었다. 각각의 동물에는 7.5 μg의 레플리콘 RNA가 근육내로 주사되었다. 개별 동물은 1일째, 3일째 및 7일째에 이미지화되었다. 원형: 알파-R-rFF 작제물이 주사된 마우스; DLP: 알파-R-DLP-2A-nsp-rFF 작제물이 주사된 마우스.
도 9는 비제한적인 예시적인 알파바이러스 게놈의 구조 및 게놈 발현을 개략적으로 묘사한다 (문헌 [Strauss et al., Microbiological Reviews, pp. 491-562, September 1994]으로부터 적응됨). 신드비스 바이러스 (SINV)의 게놈 조직이 도시되어 있다. 비구조적 유전자 및 구조적 단백질 유전자의 명칭이 주어진다. 유전자 및 단백질의 명명법에 대한 참조는 아래에서 발견될 수 있다: Strauss et al.(상동), 1994. 49S 게놈 RNA는 개방 박스로 도시된 그것의 번역된 ORF와 함께 중심에서 개략적으로 설명된다. 작은 흑색 박스는 보존 서열 요소이고; 개방 다이아몬드는 누설 오팔 종료 코돈을 나타낸다. 비구조적 다단백질 및 그것의 가공된 생성물이 상기에서 나타나 있다. 오팔 코돈에서의 종결은 P123을 생산하고, 이것은 복제에서의 그것의 주요한 기능이 활성 RNA 레플리카제에서 다단백질을 처리하기 위해 트랜스에서 작용하는 프로테이나제인 것으로 여겨진다; 이 프로테이나제 도메인은 nsP2 영역에서 발견된다. 오팔 정지 코돈의 초과번역은 활성 레플리카제를 형성할 수 있는 P1234를 생산한다. 26S 서브게놈 mRNA는 구조적 ORF 및 그것의 번역 생성물을 나타내기 위해 아래에 확대되어 있다. 비리온에 존재하는 폴리펩타이드가 음영되어 있다. vcRNA는 게놈 RNA의 마이너스-가닥 보체이다.
도 10은 EAV 게놈 구조 및 게놈 발현 전략을 개략적으로 묘사한다. 레플리카제 유전자 및 구조적 단백질 유전자의 명칭은 주어져 있다 (유전자 및 단백질의 명명법에 대한 참조는 아래에서 발견될 수 있다: Snijder 등, 2005). 게놈 조직 아래, 게놈 및 sg mRNA의 구조적 관계가 묘사되어 있다. EAV mRNA의 5' 말단에서 발견된 선도 서열 및 TRS는 각각 청색 및 오렌지 박스로 표시되어 있다. 게놈-길이 mRNA1에서 발견된 리보솜 프레임이동 요소 (RFS)가 표시되어 있고 각각의 mRNA의 번역된 영역은 녹색선으로 강조되고, 반면에 번역이 침묵한 영역은 적색선에 의해 표시된다. 단지 번역된 열린 해독틀 만이 각각의 mRNA에 대해 표시되어 있다. 우측 패널은 감염된 세포로부터 단리된 EAV mRNAdnk 전형적인 패턴을 도시하고, 게놈의 3'말단에 상보적인 탐침에 하이브리드화하고 따라서 모든 바이러스성 mRNA 종을 인식함에 의해 시각화된다.
도 11A-B는 밸리-피크 위상기하학으로 알파바이러스 mRNA 26S의 5' CDS 영역의 예상된 스템-루프 RNA 구조를 개략적으로 도시한다. 7개의 대표적인 알파바이러스 mRNA (SINV, SFV, RRV, SAGV, GETV, MIDV, UNAV, BEBV, MAYV 및 AURAV)로부터 CDS의 제1 70-140 뉴클레오타이드에 기반한 RNA 구조의 이차원 (2D) 모델. 서열은 A가 +1 위치에 있는 것으로 하여 개시 코돈 (AUGi)으로부터 넘버링되었다. 예상된 구조는 SHAPE (선택적 2'-하이드록실 아실화 및 프라이머 연장) 데이터에 기반하여 구성된다 (Toribio et al., 2016).
도 12A-C는 DLP 모티프를 갖는 변형된 알파바이러스 레플리콘 RNA가 Balb/c 마우스에서의 면역원성에 대해 효과를 미치는 것을 입증하기 위해 수행된 예시적인 생체내 실험의 결과를 그래프로 요약한다. 이들 실험에서, 6-8 주령 BALB/c 동물은 가변 용량의 레플리콘 RNA를 사용하여 0 및 42일째에 프라이밍되었다. 비장 및 혈청은 56일째에 수집되었고, 그리고 (a) 검출용 덱스트라머 (H-2 Kd [IYSTVASSL; 서열번호: 44])를 사용한 HA-특이적 T 세포 메모리 (CD8⁺CD44⁺CD62L^LoKLRG-1^LoIL-7Ra^HiCXCR3^Hi)에 대한 유세포측정 및 (b, c) CD8⁺및 CD4⁺T 세포 효과기 반응을 정량하기 위한 IFN-γ ELISpot을 실시했다. 통계는 변동의 통상적인 원-웨이 분석 (ANOVA)을 사용하여 매칭된 용량 간의 다중 비교를 사용한 것이었다. 도 12A: 메모리 전구체 효과기 세포 (MPECs)에서의 유의미한 증가가 비변형된 레플리콘의 각각의 비교할만한 용량과 비교하여 DLP 모티프를 함유하는 작제물에서 관측되었다. 도 12B: 효과기 T 세포 반응은 CD8+ T 세포 펩타이드로의 자극에 따라 IFN-γ를 분비하였던 다수의 항원-특이적 HA 세포에 의해 측정되었다. 도 12C: 효과기 T 세포 반응은 CD4+ T 세포 펩타이드로의 자극에 따라 IFN-γ를 분비하였던 다수의 항원-특이적 HA 세포에 의해 측정되었다.
도 13은 비구조적 단백질 유전자를 인코딩하는 서열의 업스트림 편입된 DLP 모티프를 갖는 변형된 알파바이러스 레플리콘 RNA가 Balb/c mic에서의 바이러스성감염을 시뮬레이션하는 제제로 전처리에 의한 면역반응의 억제를 효과적으로 방지하는 것을 입증하기 위해 수행된 예시적인 생체내 실험의 결과를 그래프로 요약한다. 6-8 주령 BALB/c 동물은 진행중인 바이러스성 감염을 시뮬레이션하기 위해 백신접종 24시간 전 유체역학적 꼬리 정맥 주사를 통해 투여된 20 μg의 폴리(I:C) 또는 염수로 전처리되었다. 마우스는 그런 다음 0일째에서 프라이밍되고 그리고 HA를 인코딩하는 RNA 레플리콘 1.5 μg 용량을 사용하여 28일째에 부스팅되었다. 혈청은 42일째에 수집되었고, 혈청 내의 HA-특이적 항체가 측정되었다. 혈청 항체 농도는 표준으로 8D2 HA-특이적 단클론성 항체를 사용하고 4개-매개변수의 로지스틱 퇴행 상에서 광학 밀도 대 희석의 보간에 의해 계산되었다. 개별 군 간의 통계는 Mann-Whitney (비-매개변수) 테스트를 사용하여 수행되었다.
도14A -14C는 본 개시내용에 따른 DLP-함유 레플리콘이 LNP (양이온성 지질 나노입자) 제형과 양립가능하다는 것을 입증하기 위해 수행된 생체내 실험의 결과를 그래프로 요약한다. 이 실험에서, 6-8 주령 BALB/c 동물은 0일째에서 프라이밍되고 그리고 HA를 인코딩하는 가변 용량의 anRNA 레플리콘을 사용하여 28일째에 부스팅되었다. 비장 및 혈청은 42일째에 수집되었다. 도14A: HA-특이적 항체는 혈청에서 측정되었다. 혈청 항체 역가는 EC20%의 역수이며, 4개-매개변수의 로지스틱 퇴행 상에서 광학 밀도 대 희석의 보간에 의해 계산되었다. 도 14B: CD8+ 세포 효과기 반응을 정량하기 위해 IFN-γ ELISpot을 사용했다. 항원-특이적 CD8+ T 세포의 검출을 위해, 비장 세포가 H-2 Kd (IYSTVASSL; 서열번호: 44) 펩타이드로 인큐베이션되었다. 도 14C: CD4+ T 세포 효과기 반응을 정량하기 위해 IFN-γ ELISpot을 사용했다. 항원-특이적 CD4+ T 세포의 검출을 위해, 비장 세포가 H2-D 제한된 CD4 T 세포 에피토프 KSSFFRNVVWLIKKN (서열번호: 45)로 인큐베이션되었다. 개별 군 간의 통계는 Mann-Whitney (비-매개변수) 테스트를 사용하여 수행되었다.
도 15는 DLP-함유 mRNA의 비제한적인 예시적인 배치형태를 그래프로 도시하고, 여기서 신드비스 바이러스 DLP 인자는 관심 유전자 (GOI; dsGFP)에 대한 코딩 서열의 업스트림으로 배치되고, 그리고 5' UTR 서열은 T7 프로모터의 바로 다운스트림으로 그리고 신드비스 바이러스 DLP 서열의 업스트림으로 배치된다. dsGFP에 대한 코딩 서열은 돼지 테스코바이러스-1로부터 유래된 자가촉매 자가-절단 펩타이드 (예를 들어, 오토프로테아제 펩타이드)인 P2A 신호를 통해 DLP 인자에 연결된다. GOI로 사용된 EGFP 리포터 유전자의 탈안정화된 형태 (dsGFP)에 대한 코딩 서열이 마우스오르니틴 탈탄산효소 유전자 (MODC)로부터 유래된 단백질분해 PEST 열화 신호에 작동가능하게 연결된, DLP-함유 mRNA의 또 다른 비제한적인 예시적인 배치형태가 도면의 바닥부에 또한 도시되어 있다.
도 16A-D는 DLP-함유 변형된 mRNA가 인터페론 내성을 부여할 수 있다는 것을 입증하기 위해 수행된 실험의 결과를 그래프로 요약한다. 도 16A: mRNA 안에 DLP의 봉입은 IFN의 존재에서 GFP 양성 세포의 빈도에서의 통계적으로 유의미한 증가를 초래한다. Kruskai-Wallist 테스트 (비-매개변수)에서 95% 신뢰 구간을 갖는 평균. 도 16B: 비변형된 mRNA는 IFN 처리에 민감하다 (2-웨이 ANOVA에서 95% 신뢰 구간을 갖는 평균. 상호작용: p=0.0083. Row: p=<0.0001. 칼럼: p=0.0273. * p=0.0217 및 # p=<0.0241을 갖는 Sidak의 다중 비교 테스트). 도 16C: DLP 변형된 mRNA는 IFN의 존재에서 비변형된 mRNA에 비교하여 세포당 단백질 생산에서 통계적으로 상당한 30% 증가율을 생성한다 (2-웨이 ANOVA에서 95% 신뢰 구간을 갖는 평균: p=<0.0001. *** p=<0.0002 및 **** p=<0.0001을 갖는 Sidak의 다중 비교 테스트). 도 16D: IFN의 존재에서 DLP 변형된 mRNA는 IFN 처리의 부재에서 비변형된 mRNA에 비교하여 동등량의 단백질을 생산한다 (2-웨이 ANOVA에서 95% 신뢰 구간을 갖는 평균. 상호작용: p=<0.0001. Row: p=<0.0001. 칼럼: p=0.0023. **** p=<0.0001 및 ** p=<0.0023을 갖는 Sidak의 다중 비교 테스트).
본 개시내용의 전술한 및 다른 특징들은 수반되는 도면들과 연계하여 하기 설명 및 첨부된 청구항들로부터 더욱 완전하게 명백해질 것이다. 이들 도면은 본 개시내용에 따른 몇 개의 구현예만을 도시하고 그것의 범위를 제한하는 것으로 간주되어서는 안된다는 것을 이해해야한다; 본 개시내용은 수반되는 도면들의 사용을 통하여 추가의 특이성 및 세부사항을 가지고 기재될 것이다.

본 개시내용은 일반적으로 세포에서 유전자 발현을 조절하는데 사용하기 위한 조성물 및 방법에 관한 것이다. 본 개시내용의 일부 구현예는 재조합 세포에서 이종성 분자 예컨대, 예를 들어, 백신 및 치료적 폴리펩타이드를 발현시키기에 적합한 우월한 발현 포텐셜을 갖는 발현 시스템, 예컨대 바이러스성-기반 발현 시스템에 관한 것이다. 예를 들어, 본 개시내용의 일부 구현예는 바이러스성 캡시드 향상제 또는 그것의 변이체의 하나 이상의 구조 요소를 함유하는 핵산분자에 관한 것이다. 일부 구현예에서, 하나 이상의 구조 요소 중 적어도 하나는 RNA 스템-루프를 포함한다. 일부 구현예에서, 하나 이상의 구조 요소 중 적어도 하나는 관심 유전자의 코딩 서열에 작동가능하게 연결된다. 본 개시내용의 일부 구현예는 바이러스성 캡시드 향상제의 하나 이상의 구조 요소를 인코딩하는 핵산 서열을 함유하는, 핵산분자 예컨대 전사 및/또는 발현 작제물 및 벡터에 관한 것이다. 관심 유전자의 코딩 서열을 포함하는 전사벡터 및 발현벡터, 예컨대 바이러스성-기재 벡터가 또한 본 명세서의 일부 구현예에서 개시된다. 일부 구현예에서, 본 개시내용의 핵산분자, 예를 들어, 메신저 (mRNA) 및 RNA 레플리콘은 새로운 합성 및/또는 시험관내 전사를 통해 생성된다. 본 명세서에서 개시된 핵산분자 중 하나 이상을 포함하도록 유전자적으로 변형된 재조합 세포뿐만 아니라 이러한 세포로부터 유래된 생체 적합물질 및 재조합 생성물이 또한 본원의 범위 내이다. 본 명세서에서 개시된 핵산분자 및/또는 재조합 세포 중 하나 이상을 포함하는 조성물 및 키트뿐만 아니라 숙주 세포에서 선천적인 면역계에 내성을 부여하는 방법이 본 명세서에 추가로 제공된다.

하기 상세한 설명에서, 본 명세서의 일부를 형성하는 수반되는 도면들에 대해 언급된다. 도면들에서, 유사한 기호는 문맥상 달리 지시되지 않는 한 전형적으로 유사한 구성분을 나타낸다. 상세한 설명, 도면, 및 청구항들에 기재된 예시적인 대안은 제한하는 것으로 의미되지 않는다. 본 명세서에 제시된 요지의 정신 또는 범위로부터 벗어남이 없이, 다른 대안이 사용될 수 있고, 다른 변경이 이루어질 수 있다. 본 명세서에 일반적으로 기술되고 도면들에 예시된 바와 같은 양태들은 다양한 상이한 배치형태로 배열되고, 대체되고, 조합되고, 설계될 수 있음을 쉽게 이해할 것이고, 이들 모두는 본원의 일부로 명백하게 고려되고 그 일부가 된다.

달리 정의되지않는 한, 본 명세서에서 사용되는 모든 기술의 용어들, 표기법 및 다른 과학적 용어들 또는 전문용어는 본원이 속하는 당해 분야의 숙련가에 의해 통상적으로 이해되는 의미를 갖는 것으로 의도된다. 일부 경우에, 통상적으로 이해되는 의미를 갖는 용어들은 명백하게 하기 위해 및/또는 용이한 참조를 위해 본 명세서에서 정의되며, 본 명세서에서의 그러한 정의의 봉입은 반드시 당 업계에서 일반적으로 이해되는 것 이상의 실질적인 차이를 나타내는 것으로 해석되어서는 안된다. 본 명세서에 기재되거나 언급된 많은 기술 및 절차는 당해 분야의 숙련가에 의해 통상적인 방법론을 사용하여 잘 이해되고 일반적으로 사용된다.

일부 정의

단수 형태 "a", "an", 및 "the"는 문맥에서 달리 명확히 명시되지 않는 한 복수의 참조를 포함한다. 예를 들어, 용어 "세포"는 이들의 혼합물을 포함하여, 하나 이상의 세포를 포함한다.

본 명세서에서 사용된 바와 같이 용어 "약"은 대략의 그것의 통상적인 의미를 갖는다. 근사치 정도가 문맥상 달리 명확하지 않은 경우, "약"은 제공된 값을 포함하여 모든 경우에, 제공된 값의 플러스 또는 마이너스 10% 이내이거나 또는 가장 근접한 유효 숫자로 반올림한 값을 의미한다. 범위가 제공되는 경우, 이들은 경계 값을 포괄한다.

본 명세서에서 사용된 바와 같이 용어들, "세포", "세포 배양물", "세포주", "재조합 숙주 세포", "수령체 세포" 및 "숙주 세포"는 계대 수에 무관하게, 일차 대상체 세포 및 이들의 임의의 자손을 포함한다. 일부 상황에서, 자손은 (의도적이거나 또는 우연한 돌연변이 또는 환경의 차이에 기인하여) 친계 세포에 정확히 동일하지는 않다; 그러나, 이러한 변형된 자손은 상기 자손이 본래 전환된 세포의 것과 동일 또는 실질적으로 유사한 기능성을 보유하는 한 이들 용어들에 포함된다.

본 명세서에서 사용된 바와 같이, 용어 "작제물"은 핵산 서열이 기능적으로 작동하는 방식으로 연결된, 예를 들어 작동가능하게 연결된 핵산분자를 포함하는, 게놈 통합 또는 자율적 복제를 할 수 있는, 임의의 공급원으로부터 유래된, 임의의 재조합 핵산 분자 예컨대 발현 카세트, 플라스미드, 코스미드, 포스미드, 바이러스성 레플리콘, 셔틀 벡터, 자율적으로 복제하는 폴리뉴클레오타이드 분자, 박테리오파아지, 또는 선형 또는 원형, 단일-가닥 또는 이중-가닥, DNA 또는 RNA 폴리뉴클레오타이드 분자를 의미하는 것으로 의도된다.

본 명세서에서 사용된 용어 "으로부터 유래된"은 기원 또는 공급원을 지칭하고, 자연발생, 재조합, 정제되지 않은 또는 정제된 분자를 포함할 수 있다. 본 개시내용의 분자는 바이러스성 또는 비-바이러스성 분자로부터 유래될 수 있다. 최초 단백질 또는 폴리펩타이드로부터 유래된 단백질 또는 폴리펩타이드는 부분적으로 또는 전체적으로 최초 단백질 또는 폴리펩타이드를 포함할 수 있고 그리고 최초 단백질 또는 폴리펩타이드의 단편 또는 변이체일 수 있다.

용어 "유전자"는 단백질을 인코딩하거나 또는 기능적 RNA로 전사될 수 있는 핵산분자의 임의의 분절을 지칭하기 위해 광범위하게 사용된다. 유전자는 전사되지만 최종, 성숙한, 및/또는 기능적 RNA 전사체의 일부가 아닌 서열, 및 전사되지만 번역되지 않은 서열, 예를 들어, 5' 미번역된 영역, 3' 미번역된 영역, 인트론, 등을 추가로 포함할 수 있는 단백질을 인코딩하는 유전자를 포함할 수 있다. 또한, 유전자는 그것의 발현을 위해 필요한 조절 서열을 선택적으로 추가로 포함할 수 있고, 이러한 서열은, 예를 들어, 전사 또는 번역되지 않은 서열일 수 있다. 유전자는 관심 있는 공급원로부터 클로닝 또는 알려지거나 예상된 서열 정보로부터 합성을 포함하여 다양한 공급원으로부터 수득될 수 있고, 원하는 파라미터를 가지도록 설계된 서열을 포함할 수 있다.

용어 "선천적"은 이들이 숙주에서 자연적으로 발생하는 것과 같은 핵산 서열 또는 아미노산 서열을 지칭하기 위해 본 명세서에서 사용된다. 용어 "비-선천적"은 숙주에서 자연적으로 발생하지 않거나 또는 이들이 숙주에서 자연적으로 구성되는 것과 같이 구성되지 않는 핵산 서열 또는 아미노산 서열을 지칭하기 위해 본 명세서에서 사용된다. 숙주 세포로부터 제거되고, 실험실 조작을 거치치고 그리고 숙주 세포로 도입 또는 재도입된 핵산 서열 또는 아미노산 서열이 "비-선천적"인 것으로 간주된다. 숙주 세포 또는 유기체 안으로 도입된 합성 유전자 또는 부분적으로 합성 유전자는 "비-선천적"이다. 비-선천적 유전자는 호스트 게놈 안으로 재조합된 하나 이상의 이종성 조절 서열에 작동가능하게 연결된 숙주 세포에 내인성인 유전자 또는 이들이 자연적으로 발생하는 경우 이외에 게놈의 유전자좌에 있는 숙주 세포 또는 유기체에 내인성인 유전자를 추가로 포함한다.

본 명세서에서 사용된 바와 같이 용어들 "자연발생" 및 "야생형"은 자연에서 발견된 형태를 지칭한다. 예를 들어, 자연발생 또는 야생형 핵산분자, 핵산 서열 또는 단백질은 천연 공급원에 존재하고 이로부터 단리될 수 있고, 그리고 인간 조작에 의하여 의도적으로 변형되지 않는다. 아래에 상세히 기재된 바와 같이, 본 개시내용의 일부 구현예에 따른 핵산분자는 비-자연적으로 발생한 핵산분자이다.

폴리뉴클레오타이드, 유전자, 또는 핵산분자와 관련하여 사용될 때 용어 "이종성"은 숙주 종으로부터 유래되지 않은 폴리뉴클레오타이드, 유전자, 또는 핵산분자를 지칭한다. 예를 들어, 본 명세서에서 사용된 바와 같은 "이종성 유전자" 또는 "이종성 핵산 서열"은 이것이 그 안으로 도입된 숙주 유기체의 종과 상이한 종으로부터의 유전자 또는 핵산 서열을 지칭한다. 유전자 조절 서열 예컨대, 예를 들어, 향상제 서열에 대해, 또는 유전자 서열의 발현을 조작하기 위해 사용된 보조 핵산 서열 (예를 들어, 5' 미번역된 영역, 3' 미번역된 영역, 폴리 A 첨가 서열, 등)에 대해, 또는 단백질 도메인 또는 단백질 국재화 서열을 인코딩하는 핵산 서열에 대해 언급할 때, "이종성"은 단백질 도메인 또는 국재화 서열을 인코딩하는 서열 또는 조절 또는 보조 서열은 단백질 도메인 또는 국재화 서열을 인코딩하는 핵산 서열 또는 조절 또는 보조 핵산 서열이 게놈 안에 나란히 놓인 유전자와 상이한 공급원으로부터의 것이다는 것을 의미한다. 따라서, 그것의 천연 상태 (예를 들어, 비-유전자적으로 조작된 유기체의 게놈)에 작동가능하게 연결되지 않은 유전자에 작동가능하게 연결된 프로모터는, 본 프로모터가 이것이 연결되는 유전자와 동일한 종 (또는, 일부 경우에, 동일한 유기체)으로부터 유래될 수 있는 경우에조차도, 본 명세서에서 "이종성 프로모터"로 지칭된다. 예를 들어, 본 명세서에서 개시된 일부 구현예에서, 이종성 관심 유전자 (GOI)의 코딩 서열은 그것의 천연 상태에서 재조합 RNA 레플리콘 서열에 연결되지 않는다. 일부 구현예에서, 코딩 GOI 서열은 또 다른 유기체, 예컨대 또 다른 바이러스, 박테리아, 진균, 인간 세포 (종양 Ag), 기생충 (말라리아), 등으로부터 유래된다.

용어들 "핵산분자" 및 "폴리뉴클레오타이드"는 본 명세서에서 상호교환적으로 사용되고, cDNA, 게놈 DNA, 합성 DNA, 및 핵산 유사체를 함유하는 DNA 또는 RNA 분자를 포함하는 핵산분자를 포함하는, RNA 및 DNA 분자 양자를 지칭한다. 핵산분자는 임의의 3차원 구조일 수 있다. 핵산분자는 이중-가닥 또는 단일-가닥 (예를 들어, 센스 가닥 또는 안티센스 가닥)일 수 있다. 핵산분자의 비-제한적인 예는 유전자, 유전자 단편, 엑손, 인트론, 메신저 RNA (mRNA), 운반 RNA, 리보솜 RNA, siRNA, 마이크로-RNA, tracrRNA, crRNA, 가이드 RNA, 리보자임, cDNA, 재조합 폴리뉴클레오타이드, 분지형 폴리뉴클레오타이드, 핵산 탐침 및 핵산 프라이머를 포함한다. 핵산분자는 통상적이지 않은 또는 변형된 뉴클레오타이드를 함유할 수 있다. 본 명세서에서 사용된 바와 같이 용어들 "폴리뉴클레오타이드 서열" 및 "핵산 서열"은 상호교환적으로 폴리뉴클레오타이드 분자의 서열을 지칭한다. 37 CFR §1.822에서 제시된 바와 같은 뉴클레오타이드 염기에 대한 명명법이 본 명세서에서 사용된다. 본 개시내용의 핵산분자는 당 업계에서 알려진 임의의 수단에 의해, 예를 들어, 핵산분자의 하나 이상의 화학적 또는 효소적 기술을 사용하여 (예를 들어, 화학적 핵산 합성의 사용에 의해, 또는 복제, 중합, 핵산 외부 분해소화, 엔도뉴클레오라이틱 소화, 결찰, 역전사, 전사, 염기 변형 (예를 들어, 메틸화를 포함함), 또는 재조합 (상동성 및 부위-특이적인 재조합을 포함함)을 위한 효소의 사용에 의해 생체외에서 합성될 수 있다. 일부 구현예에서, 본 개시내용의 핵산분자는 새로운 합성으로부터 생성된다. 일부 구현예에서, 핵산분자는 알려진 화학적 방법, 알려진 효소적 기술, 또는 이들의 임의의 조합을 사용하여 전체적으로 또는 부분적으로 새로이 합성될 수 있다. 예를 들어, 성분 핵산 서열은 고상 기술에 의해 합성되고, 수지로부터 제거되고, 그리고 분취용 고성능 액체 크로마토그래피와 이어서 화학적 연결 및/또는 효소적 결찰에 의해 정제되어 키메라 핵산분자를 형성할 수 있다. 합성 핵산분자의 조성물은 핵산분석 또는 서열분석에 의해 확인될 수 있다. 일부 구현예에서, 본 개시내용의 핵산분자는 당 업계에서 알려진 기술을 사용하여 화학적으로 합성된 올리고뉴클레오타이드로부터 효소적으로 조립될 수 있다.

본 개시내용의 핵산분자는 임의의 길이, 예를 들어 약 0.5 Kb 내지 약 1000 Kb, 약 0.5 Kb 내지 약 500 Kb, 약 1 Kb 내지 약 100 Kb, 약 2 Kb 내지 약 50 Kb, 또는 약 5 Kb 내지 약 20 Kb의 핵산분자일 수 있다. 일부 구현예에서, 핵산분자는 또는 약, 0.5 Kb, 1 Kb, 2 Kb, 3 Kb, 4 Kb, 5 Kb, 6 Kb, 7 Kb, 8 Kb, 9 Kb, 10 Kb, 15 Kb, 20 Kb, 25 Kb, 30 Kb, 40 Kb, 50 Kb, 100 Kb, 200 Kb, 500 Kb, 1 Mb, 또는 그 이상, 또는 임의의 두 개의 이들 값 사이의 범위이다.

본 개시내용의 폴리뉴클레오타이드는 또 다른 핵산에 혼성화되는 핵산의 능력과 같은 구조적 속성, 또는 전사 인자, 리보솜, 및 핵산 중합효소 중 하나 이상에 의해 인식되고 결합되는 폴리뉴클레오타이드 서열의 능력에 관하여 "생물학적 활성"일 수있다.

본 명세서에서 사용된 바와 같은 용어 "재조합" 또는 "조작된" 핵산분자는 인간 개입을 통해 변경된 핵산분자를 지칭한다. 비-제한적인 예로서, cDNA는 실험관내 중합효소 반응(들)에 의해 생성되거나, 또는 링커가 부착되거나, 또는 벡터, 예컨대 클로닝 벡터 또는 발현 벡터 안으로 통합된 임의의 핵산분자인 것과 같은 재조합 DNA 분자이다. 비-제한적인 예로서, 재조합 핵산분자는: 1) 예를 들어, 핵산분자의 화학적 또는 효소적 기술을 사용하여 (예를 들어, 화학적 핵산 합성의 사용에 의해, 또는 복제, 중합, 핵산 외부 분해소화, 엔도뉴클레오라이틱 소화, 결찰, 역전사, 전사, 염기 변형 (예를 들어, 메틸화를 포함함), 또는 재조합 (상동성 및 부위-특이적인 재조합을 포함함)을 위한 효소의 사용에 의해 실험관내에서 합성 또는 변형되고; 2) 자연에서는 연합되지 않는 연합된 뉴클레오타이드 서열을 포함하고, 3) 자연발생 핵산분자 서열에 관하여 하나 이상의 뉴클레오타이드를 결하도록 분자 클로닝 기술을 사용하여 조작되고, 및/또는 4) 자연발생 핵산 서열에 관하여 하나 이상의 서열 변화 또는 재배열을 갖도록 분자 클로닝 기술을 사용하여 조작되었다. 비-제한적인 예로서, cDNA는 실험관내 중합효소 반응(들)에 의해 생성되거나, 또는 링커가 부착되거나, 또는 벡터, 예컨대 클로닝 벡터 또는 발현 벡터 안으로 통합된 임의의 핵산분자인 것과 같은 재조합 DNA 분자이다. 본 명세서에서 개시된 일부 구현예에서, 본원의 재조합 핵산분자는 새로운 합성으로부터 생성된다.

본 명세서에서 사용된 용어 단백질의 "변이체"는 변형된, 예를 들어, 각각 결실된, 삽입된, 또는 대체된 적어도 하나의 아미노산을 갖는 것을 제외하고 참조 단백질의 것과 동일 또는 본질적으로 동일한 아미노산 서열을 갖는 폴리펩타이드를 지칭한다. 아미노산 대체는 바람직하게는 단백질에서의 비-필수 아미노산 잔기에서 보존적 아미노산 치환일 수 있다. "보존적 아미노산 치환"은 아미노산 잔기가 유사한 측쇄를 갖는 아미노산 잔기로 대체된 것이다. 유사한 측쇄를 갖는 아미노산 잔기의 계열은 당해 기술에 공지되어 있다. 이들 계열은 염기성 측쇄 (예를 들어, 라이신, 아르기닌, 히스티딘), 산성 측쇄 (예를 들어, 아스파르트산, 글루탐산), 무전하 극성 측쇄 (예를 들어, 글리신, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 시스테인), 무극성 측쇄 (예를 들어, 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 메티오닌, 트립토판), 베타-분지형 측쇄 (예를 들어 , 트레오닌, 발린, 이소류신) 및 방향족 측쇄 (예를 들어, 티로신, 페닐알라닌, 트립토판, 히스티딘)를 갖는 아미노산을 포함한다. 단백질의 변이체는 단백질의 아미노산 서열에 적어도 약 80%, 90%, 95%, 또는 99%, 바람직하게는 적어도 약 90%, 더 바람직하게는 적어도약 95% 동일한 아미노산 서열을 가질 수 있다. 바람직하게는, 변이체는 단백질과 동일한 기능을 보유하는 단백질의 기능적 변이체이다. 핵산 서열과 관련하여 사용될 때 용어 "변이체"는 또 다른 일반적으로 관련된 뉴클레오타이드산 서열과 하나 이상의 뉴클레오타이드가 다른 핵산 서열을 지칭한다. 이와 같이, 용어 "변이체"는 하나 이상의 신규한 뉴클레오타이드의 삽입, 하나 이상의 뉴클레오타이드의 결실 및 하나 이상의 현존하는 뉴클레오타이드의 치환을 포함하는 참조 핵산의 하나 이상의 뉴클레오타이드의 변화를 지칭할 수 있다. "변이"는 전형적으로, 하나의 서열이 기준 서열인; 2개의 상이한 뉴클레오타이드 서열 사이의 차이이다. 광범위하게, 본 명세서에서 사용된 바와 같은 용어 "뉴클레오타이드 변이"는 점돌연변이, 다중돌연변이, 단일 뉴클레오타이드 다형성 (SNP), 결실, 삽입, 및 전좌를 포함한다. 용어 "기준 핵산"은 관심 있는 알려진 기준 서열을 갖는 뉴클레오타이드 서열을 기술하기 위해 본 명세서에서 사용된다.

본 명세서에서 사용된 바와 같이, 둘 또는 그 초과 핵산 또는 폴리펩타이드 서열의 맥락에서, 용어들, "동일한" 또는 퍼센트 "동일성"은 비교 윈도우 상에서 최대 관련성에 대해 비교되고 정렬될 때, 동일이거나 또는 동일한 아미노산 잔기 또는 뉴클레오타이드의 명시된 백분율을 갖는 두 개 또는 그 초과 서열 또는 하위서열을 지칭한다. 달리 구체화되지 않는 한, 선택된 서열, 예를 들어, "서열번호: X"에 대한 비교 윈도우는 서열번호: X의 전장이고, 그리고, 예를 들어, "서열번호: X의 100 bp"에 대한 비교 윈도우는 언급된 100 bp이다. 아미노산 또는 핵산 서열 동일성의 정도는 지정된 프로그램 파라미터에 기초하여 비교되어지는 서열을 정렬하는 다양한 컴퓨터 프로그램에 의해 결정될 수 있다. 예를 들어, 서열은 문헌 [Smith & Waterman Adv . Appl . Math. 2:482-89, 1981]의 국소 상동성 알고리즘, 문헌 [Needleman & Wunsch J. Mol . Biol . 48:443-53, 1970]의 상동성 정렬 알고리즘, 또는 문헌 [Pearson & Lipman Proc . Nat'l . Acad . Sci . USA 85:2444-48, 1988]의 유사성 방법에 대한 조사를 사용하여 정렬되고 비교될 수 있고, 그리고 육안 검사에 기초하여 정렬되고 비교될 수 있거나 또는 분석을 위한 컴퓨터 프로그램 (예를 들어, 위스콘신 주, 매디슨, 사이언스 닥터 575 소재의 Genetics Computer Group의 위스콘신 유전적 소프트웨어 패키지에서의 GAP, BESTFIT, FASTA, 및 TFASTA)을 사용할 수 있다.

퍼센트 서열 동일성을 계산하는 것에 부가하여, BLAST 알고리즘은 또한 두 서열 사이의 유사성의 통계적인 분석을 수행한다(예를 들어, Karlin & Altschul, Proc. Nat'l . Acad . Sci . USA 90:5873-87, 1993 참고). 최소 합계 확률 (P(N))은 두 뉴클레오타이드 또는 아미노산 서열 사이의 일치가 우연히 일어나는 개연성의 조짐을 제공한다. 예를 들어, 기준 핵산에 대해 시험 핵산의 비교에서 최소 합계 확률이 약 0.1 미만, 바람직하게는 약 0.01 미만, 그리고 더 바람직하게는 약 0.001 미만인 경우 핵산은 기준 서열에 유사한 것으로 간주된다.

본 명세서에서 사용된 바와 같이, 용어 "벡터"는 숙주 세포로, 또는 숙주 세포 사이에서 전달하기 위해 설계되고, 전환, 예를 들어 숙주 세포 안으로 이종성 DNA의 도입의 목적을 위해 사용될 수 있는 재조합 폴리뉴클레오타이드 작제물을 지칭한다. 벡터는, 예를 들어, 삽입된 분절의 복제를 일으키기 위해 또 다른 DNA 분절이 삽입될 수 있는, 레플리콘, 예컨대 플라스미드, 박테리오파아지, 또는 코스미드일 수 있다. 일반적으로, 벡터는 적절한 조절 요소와 연관될 때 복제할 수 있다. 용어 "벡터"는 클로닝 벡터 및 발현 벡터뿐만 아니라 바이러스 벡터 및 통합 벡터를 포함한다. "발현 벡터"는 조절 영역을 포함하고, 그것에 의해 예를 들어 실험관내, 생체외, 및 생체내에서 DNA 서열 및 단편을 발현할 수 있는 벡터이다. 일부 구현예에서, 벡터는 플라스미드, 박테리오파아지 벡터, 코스미드, 포스미드, 바이러스성 레플리콘, 또는 이들의 조합이다. 일부 구현예에서, 벡터는 진핵 벡터, 원핵 벡터 (예를 들어, 박테리아 플라스미드), 또는 셔틀 벡터이다. 발현 시스템은, 예를 들어, 발현 벡터 또는 발현 카세트일 수 있다. 일부 구현예에서, 벡터는 전사 벡터이다. 용어 "전사 벡터"는 전사될 수 있지만 번역되지 않는 벡터를 지칭한다. 예를 들어, 전사 벡터는 그것의 삽입물을 증폭시키기 위해 사용될 수 있다.

바이러스-계 "레플리콘" 발현 벡터는, 예를 들어, 백신 및 치료적 조성물로서 사용될 수 있다. 레플리콘 벡터는 DNA, RNA, 및 재조합 바이러스성 입자를 포함하여 몇 개의 포맷에 이용될 수 있다. 다양한 문헌이 백신과 같은 적용에 대해 바이러스성 레플리콘 벡터의 효능을 이제 실증했다. 또한, 이들 용어들은 벡터, 벡터 작제물 또는 유전자 전달 벡터로 집합적으로 지칭될 수 있다.

당해 분야의 숙련가에 의해 이해되는 것과 같이, 서술된 설명을 제공하는 관점에서와 같은 임의의 및 모든 목적을 위해, 본 명세서에서 개시된 모든 범위는 또한 임의의 및 모든 가능한 하위-범위 및 그것의 하위-범위의 조합을 포괄한다. 임의의 열거된 범위는 동일한 범위가 적어도 동등한 것의 절반, 3분의 1, 4분의 1, 5분의 1, 10분의 1 등으로 분할될 수 있다는 것을 충분히 설명하고 가능하게 하는 것으로 쉽게 인식될 수 있다. 비제한적인 예로서, 본 명세서에서 논의된 각각의 범위는 하위 3분의 1, 중앙 3분의 1 및 상위 3분의 1 등으로 분할될 수 있다. 당해 분야의 숙련가에 의해 또한 이해되는 것과 같이, "최대", "적어도," "보다 큰", "미만" 및 기타 동종의 것과 같은 모든 언어는 인용된 수를 포함하고 상기에서 논의된 바와 같이 하위-범위로 후속으로 분할될 수 있는 범위를 지칭한다. 마지막으로, 당해 분야의 숙련가에 의해 이해되는 것과 같이, 범위는 각각의 개별 수를 포함한다. 따라서, 예를 들어, 1-3 항목을 갖는 군은 1, 2, 또는 3 항목을 갖는 군을 지칭한다. 유사하게, 1-5 항목을 갖는 군은 1, 2, 3, 4, 또는 5 항목을 갖는 군을 지칭하고, 등등 같다.

바이러스성 캡시드 향상제

일부 바이러스는 캡시드 유전자 발현을 조절, 예를 들어 증가시키는 하나 이상의 스템-루프 구조를 형성할 수 있는 서열을 갖는다. 용어 "바이러스성 캡시드 향상제"는 이러한 스템-루프 구조를 형성할 수 있는 서열을 포함하는 조절 인자를 지칭하기 위해 본 명세서에서 사용된다. 일부 예에서, 스템-루프 구조는 캡시드 단백질의 코딩 서열 내의 서열에 형성되고 다운스트림 루프 (DLP) 서열로 명명된다. 본 명세서에서 개시된 바와 같이, 이들 스템-루프 구조 또는 이들의 변이체는 관심 유전자의 발현 수준을 조절, 예를 들어 증가시키기 위해 사용될 수 있다. 예를 들어, 이들 스템-루프 구조 또는 이들의 변이체는 여기에 다운스트림으로 작동가능하게 연결된 코딩 서열의 전사 및/또는 번역을 향상시키기 위해 재조합 벡터 (예를 들어, 이종성 바이러스 게놈)에 사용될 수 있다. 예로서, 알파바이러스 속의 구성원은 이들 mRNA의 eIF2-독립적인 번역 개시를 허용하는, 바이러스성 26S 전사체 내에 존재하는 두드러진 RNA 구조의 수단에 의해 항바이러스 RNA-활성화된 단백질 키나제 (PKR)의 활성화에 내성일 수 있다. 다운스트림 루프 (DLP)로 불리는 이 구조는 SINV 26S mRNA에서 그리고 알파바이러스 속의 다른 구성원에서 AUG로부터 다운스트림으로 위치된다. 신드비스 바이러스의 경우에 있어, DLP 모티프는 신드비스 서브게놈 RNA의 제1 ~150 nt에서 발견된다. 헤어핀은 신드비스 캡시드 AUG 개시 코돈의 다운스트림으로 위치된다 (AUG는 신드비스 서브게놈 RNA의 nt 50에서 수집분석되었다). 서열 비교 및 구조적 RNA 분석의 이전의 연구는 SINV에서의 DLP의 진화론적 보존을 밝혀냈고 알파바이러스 속의 많은 구성원에서 동등한 DLP 구조의 존재를 예상했다 (예를 들어, Ventoso, J. Virol. 9484-9494, Vol. 86, Sept. 2012 참고).

PKR은 진핵 번역 개시 인자 2α (eIF2 α)를 인산화시킨다. eIF2 α의 인산화는 mRNA의 번역 개시를 차단하고 그렇게 함으로 바이러스가 생산적인 복제 사이클을 완성하는 것을 막는다. PKR은 인터페론 및 이중 가닥 RNA에 의해 활성화된다. 숙주 세포에서의 알파바이러스 복제는 이중-가닥 RNA-의존적 단백질 키나제 (PKR)를 유도하는 것으로 알려져 있다. 예를 들어, 세포의 신드비스 바이러스 감염은 모든 다른 세포 mRNA의 번역이 제한되면서 바이러스성 서브게놈 mRNA가 여전히 효율적으로 번역되는 eIF2 α의 인산화를 초래하는 PKR을 유도한다.

신드비스 바이러스의 서브게놈 mRNA는 바이러스 캡시드 단백질 (예를 들어, 캡시드 향상제)에 대한 야생형 AUG 개시 코돈의 다운스트림으로 위치한 안정한 RNA 헤어핀 루프를 갖는다. 이 헤어핀 루프, 또한 소위 스템-루프, RNA 구조는 종종 다운스트림 루프 구조 (또는 DLP 모티프)로 지칭된다. DLP 구조가 야생형 AUG 상에 리보솜을 고착시킬 수 있고 이것이 기능적 eIF2 α에 대한 요구 없이 서브게놈 mRNA의 번역을 지지한다고 보고되었다. 따라서, 신드비스 바이러스 (SINV)뿐만 아니라 다른 알파바이러스의 서브게놈 mRNA는 eIF2 α의 완전한 인산화를 초래하는 고도로 활성인 PKR을 갖는 세포에서도 효율적으로 번역된다.

알파바이러스 DLPs의 구조

DLP 구조는 먼저 신드비스 바이러스 (SINV) 26S mRNA에서 특성규명되었고 셈리키 포레스트 바이러스 (SFV)에서 또한 검출되었다. 유사한 DLP 구조가 신대륙 (예를 들어, MAYV, UNAV, EEEV (NA), EEEV (SA), AURAV) 및 구대륙 (SV, SFV, BEBV, RRV, SAG, GETV, MIDV, CHIKV, 및 ONNV) 구성원을 포함한 적어도 14개 다른 구성원의 알파바이러스 속에 존재한다고 보고되었다. 이들 알파바이러스 26S mRNA의 예상된 구조는 SHAPE (선택적 2'-하이드록실 아실화 및 프라이머 연장) 데이터에 기반하여 구축되었다 (Toribio et al., Nucleic Acids Res. May 19;44(9):4368-80, 2016), 그 내용은 이로써 참고로 편입됨). 안정한 스템-루프 구조는 CHIKV 및 ONNV를 제외한 모든 경우에 검출되었고, 반면에 MAYV 및 EEEV는 낮은 안정성의 DLP를 나타냈다 (도 11A-B 및 Toribio et al., 2016 supra 참고). 최고 DLP 활성은 가장 안정한 DLP 구조를 함유한 이들 알파바이러스에 대해 보고되었다. 일부 사례에서, DLP 활성은 DLP 모티프와 개시 코돈 AUG (AUGi) 사이의 거리에 좌우된다. 알파바이러스 26S mRNA에서 AUG-DLP 간격은 DLP에 의해 고착된 40S 서브유닛의 P 부위에서 AUGi의 배치를 허용하는 방식으로 리보솜 18S rRNA의 ES6S 영역의 위상기하학을 조정하여, eIF2의 참여 없이 Met-tRNA의 편입을 허용한다. 2개의 주요 위상기하학이 검출되었다: SFV 분기군에서 조밀하고 안정한 구조, 및 SINV 군에서 보다 연장된 구조. 둘 모두의 경우에, DLP 구조가 강렬한 SHAPE 반응성의 영역에 선행되어, AUG-DLP 스트레치에 대한 단일 가닥 형태를 시사한다는 것이 관측되었다. 따라서, 이 영역은 전체의 마우스 mRNA 전사체 또는 DLP를 결한 이들 알파바이러스 mRNA에서의 동등한 위치와 비교할 때 이차 구조를 형성하는 낮은 경향을 초래하는 A의 높은 함량과 G의 낮은 함량을 나타냈다. Toribio et al. (2016(상동))에 의해 보고된 이들 결과는 알파바이러스에서 DLP의 발생이 이전의 영역의 평탄화와 아마 관련되며, mRNA의 이 영역에 대한 밸리-피크 위상기하학을 유도한다는 것을 시사한다.

신드비스 바이러스의 경우에, DLP 모티프는 신드비스 서브게놈 RNA의 제1 ~150 nt에서 발견된다. 헤어핀은 신드비스 캡시드 AUG 개시 코돈 (신드비스 서브게놈 RNA의 nt 50에서의 AUG)의 다운스트림으로 위치되고 바른 캡시드 유전자 AUG가 번역을 개시하기 위해 사용되도록 리보솜을 고착하도록 한다. 이것은 헤어핀이 리보솜을 eIF2α가 번역 개시를 지지하는 것을 요구하지 않도록 일시 중단을 야기하기 때문이다. 임의의 특정 이론에 구속됨 없이, 임의의 GOI에 대한 코딩 서열의 업스트림으로 DLP 모티프를 위치시키는 것은 전형적으로 개시가 GOI AUG가 아닌 캡시드 AUG 상에서 일어나기 때문에 GOI 인코딩된 단백질로 헤어핀 영역에서 인코딩된 N-말단 캡시드 아미노산의 융합-단백질을 초래한다고 여겨진다. 본 명세서에서 개시된 일부 구현예에서, 돼지 테스코바이러스-1 2A (P2A) 펩타이드 서열은 DLP 서열 직후 프레임 안에서 그리고 모든 GOI의 업스트림 직후 프레임 안에서 조작되었다. 본 개시내용의 변형된 바이러스성 RNA 레플리콘에 P2A 펩타이드의 편입은 캡시드-GOI 융합으로부터 거의 원래의 GOI 단백질의 방출을 허용한다; 단일 프롤린 잔기를 모든 GOI 단백질에 첨가된다.

임의의 특정 이론에 구속됨 없이, DLP는 번역이 eIF2α 독립 방식으로 일어나도록 하고, 이것을 사용하도록 조작된 핵산분자 및 발현 벡터 (예를 들어, RNA 레플리콘 벡터)가 선천적인 면역계가 활성화된 세포에서 증가된 기능성을 갖는 비-구조 단백질의 번역을 개시하도록 하는 것으로 여겨진다. 따라서, DLP-조작된 핵산분자 및 발현 벡터 (예를 들어, RNA 레플리콘 벡터)는 또한, 각각의 선천적인 면역 활성화의 수준에서의 차이는 자연스럽게 변동성을 야기하기 때문에, 상이한 세포, 개체 또는 개체의 모집단에서 보다 균일하게 기능하는 것으로 고려된다. 일부 구현예에서, DLP는 레플리콘 벡터의 번역 및 복제 (뿐만 아니라 GOI 발현)가 기존의 선천적인 면역반응에 의해 덜 영향을 받을 수 있기 때문에 그 가변성을 제거하는데 도움이 될 수 있다. 본 명세서에서 개시된 조성물 및 방법 중 상당한 가치 중 하나는 면역 활성화의 만성 또는 급성 상태에 있는 개체에서 백신 효능이 증가될 수 있다는 것이다. 만성 또는 급성 면역 활성화의 원인은 준임상 또는 임상 감염을 앓고 있는 개체 또는 암 또는 다른 병 (예를 들어, 당뇨병, 영양실조, 높은 혈압, 심장병, 크론병, 근육 경화증, 등)에 대한 의료적 치료를 받은 개체에서 발견될 수 있다.

본 명세서에서 기재된 바와 같이, 본 명세서에서 개시된 DLP-함유 핵산 분자 (예를 들어, 전사 및 발현벡터 (예를 들어, RNA 바이러스성 레플리콘))는 대상체에서 선천적인 면역계에 내성을 부여하는데 유용할 수 있다. 비변형된 RNA 레플리콘은 이들이 도입되는 세포의 초기 선천적인 면역계 상태에 대해 감수성이다. 만일 세포/개체가 매우 활성인 선천적인 면역계 상태에 있으면, RNA 레플리콘 성능 (예를 들어, GOI의 복제 및 발현)은 부정적으로 영향을 받을 수 있다. 단백질 번역, 특히 비-구조 단백질의 개시를 제어하기 위해 DLP를 조작함에 의해, 효율적인 RNA 레플리콘 복제에 영향을 미치는 선천적인 면역계의 기존의 활성화 상태의 충격은 제거되거나 또는 줄어든다. 결과는 백신 효능 또는 처리의 치료적 효과에 영향을 미칠 수 있는 GOI의 보다 균일한 및/또는 향상된 발현이다.

아테리바이러스

아테리바이러스 (계열 아테리비리다에 속 아테리바이러스)는 가축 및 야생 동물을 감염시키는 외피 보유한, 단일-가닥, 양성-센스 RNA 바이러스의 중요한 군을 포괄한다. 아테리바이러스는 계열 코로나비리다에 (속 코로나바이러스 및 토로바이러스)의 구성원의 것과 유사한 게놈 조직 및 복제 전략을 공유하지만 그것의 유전적 복잡성, 게놈 길이, 생체 물리학적 특성, 크기, 구조, 및 바이러스성 입자 (예를 들어, 비리온)의 구조 단백질 조성물에서 상당히 다르다. 현재, 아테리바이러스 속은 말 동맥염 바이러스 (EAV), 돼지 생식 및 호흡 증후군 바이러스 (PRRSV), 마우스의 락테이트 탈수소효소-증진 바이러스 (LDV), 유인원 출혈열 바이러스 (SHFV), 및 우울병 포섬 질환 바이러스 (WPDV)를 포함하는 것으로 간주된다.

전형적인 아테리바이러스 게놈은 길이에서 12.7 내지 15.7 kb로 다양하지만 그것의 게놈 조직은 일부 사소한 변이로 상대적으로 일치한다. 아테리바이러스의 예시적인 게놈 조직 및 비리온 구조는 도 10에 도시되어 있다. 아테리바이러스 게놈은 10-15개 알려진 ORF가 배열된 5' 및 3' 비-번역된 영역 (NTR)을 갖는 다시트론성 +RNA이다. 큰 레플리카제 ORF 1a 및 1b는 ORF1b의 것보다 훨씬 더 가변성인 ORF1a의 크기로, 게놈의 5'-근위 4분의 3을 점한다. ORF1a의 번역은 레플리카제 다단백질 (pp) 1a를 생산하고, 반면에 ORF1b는 pp1a가 pp1ab 안으로 C-말단으로 신장하는 －1 프로그래밍된 리보솜 프레임이동 (PRF)에 의해 발현된다. 또한, 짧은 트랜스프레임 ORF은 +1 프레임에서 ORF1a의 nsp2-코딩 영역을 중첩하고 －2 PRF에 의해 발현되는 것으로 보고되었다. 3'-근위 게놈 일부는 조밀한 조직화를 가지고 8 내지 12개의 비교적 작은 유전자를 함유하며, 그 대부분은 인접하는 유전자와 중첩한다. 이들 ORF는 구조 단백질을 인코딩하고 sg mRNA의 3'-공동-말단 내포된 세트로부터 발현된다. 이들 ORF의 조직화는 보존되지만, ORF1b, SHFV 및 모든 최근에 확인된 SHFV-유사바이러스의 다운스트림은 ORF 2-4개의 오래된 중복으로부터 유래될 수 있는 3개 또는 4개의 추가의 ORF (~1.6 kb)를 함유한다. ORF1a에서의 크기 변이와 함께, 이 추정된 중복은 아테리바이러스 간의 게놈 크기 차이를 설명한다.

말 동맥염 바이러스 (EAV)에 관하여, 야생형 EAV 게놈은 크기가 대략 12.7 Kb이다. 2개의 큰 레플리카제 단백질 1a 및 1ab에 대한 게놈 코드의 5' 사분의 3; 2개 단백질의 아미노산 서열은 N-말단으로 동일하지만 리보솜 프레임이동에 기인하여 1ab의 C-말단 영역의 아미노산 서열은 고유하다. 바이러스의 구조적 단백질 유전자에 대한 EAV 게놈 코드의 3' 사분의 1인, 이들 모두는 서브게놈 RNA로부터 발현된다. 서브게놈 RNA는 불연속 전사 기전을 통해 생성된 3' 공동-말단 RNA의 내포된 세트를 형성한다. 서브게놈 RNA는 게놈 RNA와 인접하지 않는 서열로 구성된다. 모든 EAV 서브게놈 RNA는 게놈 5' 서열과 동일한 공통 5' 선도 서열 (길이에서 156 내지 221 nt)을 공유한다. 서브게놈 RNA의 리더 및 바디 일부는 일명 전사-조절 서열 (TRS)인 보존 서열에 의해 연결된다. TRS는 리더의 3' 말단 (리더 TRS)뿐만 아니라 각각의 구조 단백질 유전자의 업스트림으로 위치한 서브게놈 프로모터 영역 (바디 TRS)에서 발견된다. 서브게놈 RNA는 음성 가닥 복제 중간 RNA가 전사됨에 따라 생성된다. 전사가 일어날 때 복제 복합체는 각각의 바디 TRS에 올 때 일시 정지하고 그 다음 발생기 음성 염기 RNA가 음성 가닥 RNA 전사가 계속되는 상보적 양성 가닥 리더 TRS와 연관되게 된다. 이 불연속 전사 기전은 5' 및 3' EAV 보존 서열 둘 모두를 갖는 서브게놈 RNA를 초래한다. 음성 가닥 서브게놈 RNA는 그런 다음 서브게놈 양성 센스 mRNA의 생산을 위한 템플레이트가 된다.

EAV의 전체 게놈을 대표하는 감염성 cDNA 클론이 보고되었고, 이들은 거의 이십년 동안 EAV RNA 복제 및 전사를 연구하는데 사용되어 왔다. 또한, ORF2 및 ORF7 대신에 삽입된 클로르암페니콜 아세틸전달효소 (CAT) 유전자를 함유하는 감염성 클론이 생성되어 왔고, 그리고 CAT 단백질은 이들 RNA로 전기천공된 세포에서 발현되는 것으로 나타났다. 구조 단백질 유전자 영역의 부위 지향된 돌연변이 유발 및 결실을 통해 감염성 클론의 변형은 RNA 복제의 지지에서 각각의 구조 유전자에 대한 요건을 결정하기 위해 사용되어 왔다 (Molenkamp 2000). Molenkamp 2000에 의해 보고된 연구는 구조적 유전자가 RNA 복제를 지지하기 위해 요구되지 않는다고 결론지었다. 서브게놈 RNA 생산에서 TRS 활성에 대한 서열 상동성 요건의 분석은 불연속적 전사가 어떻게 기계론적으로 일어나는지 (van Marle 1999, Pasternak 2000, Pasternak 2001, Pasternak 2003, van den Born 2005)와 바이러스 입자 안으로 RNA의 복제 및 패키징을 위해 필요한 최소 유전자 서열을 이해하기 위해 결함있는 간섭하는 RNA가 어떻게 사용되는지 (Molenkamp 2000a)를 더 잘 정의하기 위해 수행되고 사용되었다.

알파바이러스

알파바이러스는 바이러스성 스파이크 단백질을 함유하는 외피로 둘러싸인 뉴클레오캡시드에 봉입된 양성 극성의 단일 가닥 RNA 게놈을 각각 갖는 적어도 30개 구성원을 포함하는 그룹 IV 토가비리다에 계열의 유전자적으로, 구조적으로, 그리고 혈청학적으로 관련된 바이러스의 속이다. 현재, 알파바이러스 속은 그 중에서도 신드비스 바이러스 (SIN), 셈리키 포레스트 바이러스 (SFV), 로스 리버 바이러스 (RRV), 베네주엘라 말 뇌염 바이러스 (VEEV), 및 동부 말 뇌염 바이러스 (EEEV)를 포함하고, 이들은 모두 밀접하게 관련되고 다양한 척추동물 예컨대 포유동물, 설치류, 물고기, 조류 종, 및 더 큰 포유동물 예컨대 인간 및 말뿐만 아니라 무척추 동물 예컨대 곤충을 감염시킬 수 있다. 종과 개체 사이의 전염은 알파바이러스를 아르보바이러스 -또는 절지동물-발생 바이러스의 수집에 대해 원인제공자로 만드는 모기를 통해 주로 일어난다. 특히, 신드비스 및 셈리키 포레스트 바이러스가 널리 연구되어 왔고, 따라서, 이들 바이러스의 수명 주기, 복제 방식, 등이 잘 특성규명되어 있다. 특히, 알파바이러스는 동물 세포에서 아주 효율적으로 복제되는 것으로 밝혀져 동물 세포에서 단백질 및 핵산의 생산을 위한 벡터로 이들을 가치있게 한다.

알파바이러스 입자는 외피보유하고, 70 nm 직경을 가지고, (비록 약간 다형성이지만) 구형인 경향이 있고, 그리고 대략 40 nm 아이소메트릭 뉴클레오캡시드를 갖는다. 도 9는 전형적인 알파바이러스 게놈 구조 및 게놈 발현을 묘사한다. 알파바이러스 게놈은 길이가 대략 11- 12 kb인 양성 극성의 단일-가닥 RNA로, 5' 캡, 3' 폴리-A 테일, 및 효소적 기능을 갖는 비구조 단백질을 인코딩하는 제1 프레임 및 바이러스성 구조 단백질 (예를 들어, 캡시드 단백질 C, E1 당단백질, E2 당단백질, E3 단백질 및 6K 단백질)을 인코딩하는 제2 프레임을 갖는 두 개의 열린 해독틀을 포함한다.

알파바이러스 게놈의 5' 삼분의 2는 바이러스성 RNA의 전사 및 복제에 필요한 수많은 비구조 단백질을 인코딩한다. 이들 단백질은 RNA로부터 직접적으로 번역되고 이와 함께 세포 단백질은 서브게놈 RNA의 바이러스 게놈 복제 및 전사에 필수적인 RNA-의존적 RNA 중합효소를 형성한다. 4개의 비구조 단백질 (nsP1-4)은 바이러스의 복제 기구를 구성하는 단일 다단백질로 생산된다. 다단백질의 과정은 게놈 복제 동안 RNA 템플레이트 사용에 영향을 미치는 P2/3 접합에서의 절단으로 고도로 조절된 방식으로 발생한다. 이 부위는 좁은 틈의 베이스에 위치하고 쉽게 접근가능하지 않다. 일단 절단되면, nsP3은 nsP2를 둘러싸는 고리 구조를 만든다. 이들 두 단백질은 광범위한 계면을 갖는다. P2/P3 계면 영역에서 비세포병리적 바이러스 또는 온도 감수성 표현형 클러스터를 생성하는 nsP2의 돌연변이. nsP2 비세포병리적 돌연변이의 위치에 반대되는 P3 돌연변이는 P2/3의 효율적인 절단을 방해한다. 이것은 차례로 바이러스성 RNA 생산 수준을 변화시키는 RNA 감염성에 영향을 줄 수 있다.

게놈의 3' 삼분의 1은 바이러스성 입자를 형성하는데 필요한 모든 구조단백질: 코어 뉴클레오캡시드 단백질 C, 및 이종이량체로 결합하는 외피막 단백질 P62 및 E1의 번역을 위한 템플레이트로 작용하는 서브게놈 RNA를 포함한다. 바이러스성막-고정된 표면 당단백질은 수용체 인식 및 막 융합을 통한 표적 세포로의 도입을 담당한다. 서브게놈 RNA는 nsp4 단백질을 인코딩하는 RNA 서열의 3' 말단에 존재하는 p26S 서브게놈 프로모터로부터 전사된다. E2 및 E3으로 P62의 단백질 분해성숙은 바이러스성 표면에서의 변화를 야기한다. E1, E2, 및 때때로 E3과 함께, 당단백질 "스파이크"는 E1/E2 이량체 또는 E1/E2/E3 삼량체를 형성하고, 여기서 E2는 중심에서 정점으로 연장되고, E1은 정점 사이의 공간을 채우고, 존재한다면, E3은 스파이크의 원위 말단에 위치한다. 엔도솜의 산도에 바이러스의 노출시, E1은 E2에서 해리되어 E1 동종삼량체를 형성하며, 이는 세포와 바이러스성 막을 함께 구동하는 융합단계에 필요하다. 알파바이러스성 당단백질 E1은 인플루엔자 바이러스 및 HIV에서 발견되는 부류 I 융합 단백질과 구조적으로 다른 부류 II 바이러스성 융합 단백질이다. E2 당단백질은 그것의 세포질 도메인을 통해 뉴클레오캡시드와 상호작용하도록 기능하는 반면 그것의 도메인외는 세포 수용체를 결합시키는 역할을 한다. 대부분의 알파바이러스는 주변 단백질 E3을 손실하는 반면 셈리키 바이러스에서는 바이러스성 표면과 연관되어 있다.

알파바이러스 복제는 숙주 세포 내 막성 표면상에서 일어나는 것으로 보고되었다. 감염성 주기의 제1 단계에서, 게놈 RNA의 5' 말단은 게놈 RNA에 상보성인 음성 가닥을 생성하는 RNA 중합효소 활성을 갖는 다단백질 (nsP1-4)로 번역된다. 제2 단계에서, 음성 가닥은 각각 2개의 RNA인: (1) 번역에 의해 다른 nsp 단백질을 생산하고 바이러스에 대한 게놈으로 작용하는 이차 바이러스의 게놈에 상응하는 양성 게놈 RNA; 및 (2) 감염성 입자를 형성하는 바이러스의 구조 단백질을 인코딩하는 서브게놈 RNA의 생산을 위한 템플레이트로 사용된다. 양성 게놈 RNA/서브게놈 RNA 비는 nsp 1, nsp 2, nsp 3 및 nsp 4로 다단백질의 단백질분해 자가절단에 의해 조절된다. 실제로, 바이러스성 유전자 발현은 2개의 상에서 발생한다. 제1 상에서는, 양성 게놈 가닥 및 음성 가닥의 주요 합성이 있다. 제2 상 동안, 서브게놈 RNA의 합성은 사실상 배타적이고, 따라서 다량의 구조 단백질의 생산을 초래한다.

선천적인 면역력

선천적인 면역 활성화는 많은 상이한 자극에 기인하여 발생할 수 있기 때문에, 항원 또는 치료적 GOI를 발현하기 위해 자기-증폭 RNA 레플리콘에 의존하는 백신 접근법은 eIF2α의 PKR 인산화와 연관된 전반적인 숙주 단백질 폐쇄에 의해 부정적으로 영향을 받을 수 있다. 숙주 단백질 번역이 억제된 세포 환경에서 작용하도록 RNA 레플리콘을 조작하는 것은 표준 RNA 레플리콘 시스템에 비해 상당한 이점을 갖는 이들 시스템을 제공할 것이다.

따라서, 선천적인 면역반응에 의해 부정적으로 영향을 받는 RNA 레플리콘 시스템, 예컨대 알파바이러스 및 아테리바이러스로부터 유래된 시스템은 DLP 모티프를 함유하도록 조작될 때 그것의 인코딩된 GOI를 발현하는데 더 효과적일 수 있다. DLP 모티프는 세포 mRNA 번역이 억제된 세포 환경에서 효율적인 mRNA 번역을 부여한다. DLP가 레플리콘 벡터 비-구조적 단백질 유전자의 번역과 연결될 때, 레플리카제 및 전사효소 단백질은 PKR 활성화된 세포 환경에서 기능적 복제를 개시할 수 있다. DLP가 서브게놈 mRNA의 번역과 연결될 때, 선천적인 면역 활성화에 기인하여 세포 mRNA가 제한될 때에 조차도 강력한 GOI 발현이 가능하다. 따라서, 비-구조적 단백질 유전자 및 서브게놈 mRNA 둘 모두의 번역을 유도하는데 도움이 되도록 DLP 구조를 함유하는 레플리콘을 조작하는 것은 선천적인 면역 활성화를 극복하기 위한 여전히 또 다른 강력한 방식을 제공한다.

본 개시내용의 일부 구현예는 2개의 상이한 바이러스인, 베네주엘라 말 뇌염 바이러스 (VEEV) 및 말 동맥염 바이러스 (EAV)로부터 유래된 레플리콘 벡터의 바이러스성 비-구조적 유전자의 번역을 지지하도록 조작되고, 따라서 시스템에 선천적인 면역 반응 회피를 전달하는 DLP 구조에 관한 것이다. 아래에 더 상세히 기재되는 바와 같이, 레플리콘 벡터 안으로 DLP 구조의 편입은 이들이 인터페론 (IFN) 처리에 대해 둘 모두 내성으로 되게 하고 그리고 예상외로 또한 GOI 발현 잠재성에서의 전반적인 증가를 초래한다. RNA 레플리콘 시스템 안으로 DLP를 조작함에 의해 부여된 IFN 내성 및 우월한 단백질 발현 잠재성의 조합은 이들을 선천적인 면역 활성화가 급성으로 또는 만성적으로 존재하는 개체 또는 모집단에서의 사용에 적합하게 만든다.

본 개시내용의 핵산분자

본 개시내용의 일부 양태는 하나 이상의 DLP 모티프, 하나 이상의 DLP 모티프의 코딩 서열, 또는 이들의 조합을 포함하는 핵산분자, 예컨대 합성 또는 재조합 핵산분자에 관한 것이다. 일부 구현예에서, 본 개시내용의 핵산분자는 DLP 모티프(들)에 작동가능하게 연결된 관심 유전자 (GOI)에 대한 코딩 서열 및/또는 DLP 모티프에 대한 코딩 서열을 포함할 수 있다.

일 양태에서, (i) 바이러스성 캡시드 향상제 또는 그것의 변이체의 하나 이상의 구조 요소를 인코딩하는 제1 핵산 서열; 및(ii) 제1 핵산 서열에 작동가능하게 연결된 제2 핵산 서열을 포함하는 핵산분자가 본 명세서에서 개시되고, 여기서 상기 제2 핵산 서열은 관심 유전자 (GOI)에 대한 코딩 서열을 포함한다. 일부 구현예에서, 바이러스성 캡시드 향상제의 하나 이상의 구조 요소 중 적어도 하나는 하나 이상의 RNA 스템-루프를 포함한다. 일부 구현예에서, 하나 이상의 RNA 스템-루프 중 적어도 하나는 제1 핵산 서열에 존재하는 DLP 모티프를 포함한다. 일부 구현예에서, 바이러스성 캡시드 향상제의 하나 이상의 구조 요소 중 적어도 하나는 임의의 RNA 스템-루프를 포함하지 않는다.

상기에 기재된 바와 같이, 바이러스성 캡시드 향상제는 5' 비-코딩 및/또는 5' 코딩 서열 (바람직하게는, 5' 코딩 서열) 내에 이들과 작동가능하게 연결된 서열의 발현 (예를 들어, 전사 및/또는 번역)을 증진하는 서열을 포함한다. 본 개시내용의 일부 구현예에서, 바이러스성 캡시드 향상제의 하나 이상의 구조 요소는 바이러스성 캡시드 향상제의 1 또는 2개 RNA 스템-루프를 포함한다. 일부 구현예에서, 본 개시내용의 바이러스성 캡시드 향상제는 26S 서브게놈 프로모터를 함유하는 서열을 포함한다. 일부 구현예에서, 본 개시내용의 바이러스성 캡시드 향상제는 헤어핀 구조를 형성할 수 있는, 바이러스성 26S RNA의 약 뉴클레오타이드 20 내지 250, 약 뉴클레오타이드 20 내지 200, 약 뉴클레오타이드 20 내지 150, 약 뉴클레오타이드 20 내지 100, 또는 약 뉴클레오타이드 50 내지 250, 약 뉴클레오타이드 100 내지 250, 약 뉴클레오타이드 50 내지 200, 약 뉴클레오타이드 75 내지 250, 약 뉴클레오타이드 75 내지 200, 약 뉴클레오타이드 75 내지 150, 약 뉴클레오타이드 77 내지 139, 또는 약 뉴클레오타이드 100 내지 250, 약 뉴클레오타이드 150 내지 250, 약 뉴클레오타이드 100 내지 150, 약 뉴클레오타이드 100 내지 200에서 5' 코딩 서열을 함유한다. 일부 구현예에서, 제1 핵산 서열에 작동가능하게 연결된 이종성 서열의 발현을 향상시키는 데 중요한 바이러스성 캡시드 향상제의 하나 이상의 구조 요소를 인코딩하는 제1 핵산 서열. 일부 구현예에서, 제1 핵산 서열은 바이러스성 캡시드 향상제의 하나 이상의RNA 스템-루프에 대한 인코딩 서열을 포함한다. 일부 구현예에서, 제1 핵산 서열에 작동가능하게 연결된 이종성 서열의 번역을 향상시키는 데 중요한 바이러스성 캡시드 향상제의 하나 이상의 구조 요소를 인코딩하는 제1 핵산 서열. 일부 구현예에서, 제1 핵산 서열에 작동가능하게 연결된 이종성 서열의 전사를 향상시키는 데 중요한 바이러스성 캡시드 향상제의 하나 이상의 구조 요소를 인코딩하는 제1 핵산 서열.

일부 구현예에서, 핵산분자의 제1 핵산 서열은 바이러스성 캡시드 단백질에 대한 5' 코딩 서열로부터 적어도 약 50, 약 75, 약 100, 약 150, 약 200, 약 300, 또는 그 초과의 뉴클레오타이드를 포함한다. 일부 구현예에서, 핵산분자의 제1 핵산 서열은 바이러스성 캡시드 단백질에 대한 5' 코딩 서열로부터 약 50, 약 75, 약 100, 약 150, 약 200, 약 300, 그 이상, 또는 이들 값 중 임의의 두 값 사이의 범위인 뉴클레오타이드를 포함한다. 일부 구현예에서, 바이러스성 캡시드 향상제는 동부 말 뇌염 바이러스 (EEEV), 베네주엘라 말 뇌염 바이러스 (VEEV), 에버글레이즈 바이러스 (EVEV), 뮤캄보 바이러스 (MUCV), 셈리키 포레스트 바이러스 (SFV),픽수나 바이러스 (PIXV), 미들버그 바이러스 (MIDV), 치쿤군야 바이러스 (CHIKV), O'니옹-니옹 바이러스 (ONNV), 로스 리버 바이러스 (RRV), 바마 포레스트 바이러스 (BF), 게타 바이러스 (GET), 사기야마 바이러스 (SAGV), 베바루 바이러스 (BEBV), 마야로 바이러스 (MAYV), 우나 바이러스 (UNAV), 신드비스 바이러스 (SINV), 아우라 바이러스 (AURAV), 화타로아 바이러스 (WHAV), 바반키 바이러스 (BABV), 키질라가크 바이러스 (KYZV), 웨스턴 말 뇌염 바이러스 (WEEV), 하이랜드 J 바이러스 (HJV), 포트 모건 바이러스 (FMV), 느두무 (NDUV), 및 버기 크릭 바이러스로 구성된 군으로부터 선택된 알파바이러스 종의 캡시드유전자로부터 유래된다. 일부 구현예에서, 바이러스성 캡시드 향상제는 신드비스 바이러스 종 또는 셈리키 포레스트 바이러스 종의 캡시드 유전자로부터 유래된다. 일부 특정 구현예에서, 바이러스성 캡시드 향상제는 신드비스 바이러스 종의 캡시드 유전자로부터 유래된다. 추가로, 당해 분야의 숙련가는 그것의 향상시키는 활성을 실질적으로 감소시킴 없이 바이러스성 캡시드 단백질로부터 5' 코딩 서열에서의 변형이 이루어질 수 있다는 것을 인정할 것이다. 이와 관련하여 보다 많은 정보는 아래에서 발견될 수 있다: 예를 들어, Frolov et al., J. Virology 70:1182, 1994; Frolov et al., J. Virology 68:8111, 1994. 일부 구현예에서, 이러한 돌연변이는 5' 캡시드 코딩 서열에 의해 형성된 RNA 헤어핀 구조를 실질적으로 보전하는데 이점이 있을 수 있다.

일부 구현예에서, 본 명세서에서 개시된 바이러스성 캡시드 향상제는 헤어핀 구조의 업스트림인 캡시드 단백질의 5' 코딩 서열 중 하나 이상, 또는 모두를 함유하지 않는다. 일부 구현예에서, 본 명세서에서 개시된 바이러스성 캡시드 향상제는 헤어핀 구조의 업스트림인 바이러스성 캡시드 단백질의 모든 5' 코딩 서열을 함유하지 않는다. 일부 구현예에서, 바이러스성 캡시드 향상제 서열은 캡시드 단백질의 모두 또는 일부를 인코딩할 수 있다. 따라서, 본 명세서에서 개시된 일부 구현예에서, 캡시드 향상제 영역은 전체 바이러스성 캡시드 단백질을 인코딩하지 않을 것이다. 일부 구현예에서, 바이러스성 캡시드 향상제 서열은 바이러스성 캡시드 단백질로부터 아미노 말단 단편을 인코딩한다. 다른 기능적 캡시드 단백질이 캡시드 향상제 서열에 의해 인코딩되는 이들 구현예에서, 캡시드 오토프로테아제 활성을 제거하는 것이 바람직할 수 있다. 캡시드 단백질의 오토프로테아제 활성을 감소시키거나 제거하는 캡시드 돌연변이는 당해 기술에 공지되어 있다 (예를 들어, WO1996/37616 참고). 첨가하여 또는 대안적으로, 캡시드 단백질에서의 아미노산 잔기 중 하나 이상은 캡시드 프로테아제 활성을 감소시키도록 변경될 수 있다.

상기에서 나타낸 바와 같이, 서열 비교 및 구조적 RNA 분석의 이전의 연구는 알파바이러스 속의 많은 구성원에서 DLP 모티프의 진화론적 보존을 밝혔다 (예를 들어, Ventoso, 2012 supra 참고). 따라서, 일부 추가 구현예에서, 본 개시내용의 바이러스성 캡시드 향상제 서열은 임의의 다른 변이체 서열 예컨대, 예를 들어, 합성 서열 또는 이종성 서열일 수 있어, 바이러스성 캡시드 향상제에 대해 예상된 RNA 스템-루프 중 하나 이상에 기능적으로 또는 구조적으로 동등한 RNA 헤어핀을 형성할 수 있고 그리고 여기에 다운스트림으로 작동가능하게 연결된 RNA 서열 (예를 들어, 관심 유전자에 대한 코딩 서열)의 번역을 향상시키기 위해 작용할 수 있다. 전사 및/또는 번역 향상제로서 작용할 수 있는 RNA 스템-루프의 비-제한적인 예는 도 11A-B에 도시된 것들을 포함한다. 일부 구현예에서, 본 개시내용의 핵산분자는, 그 내용이 이로써 전체적으로 참고로 편입되는, 위의 Toribio et al., 2016에서 기재된 바와 같은, 신드비스 바이러스 (SINV; NC 001547.1), 아우라 바이러스 (AURAV; AF126284), 치쿤군야 바이러스 (CHIKV; NC 004162), O'니옹-니옹 바이러스 (ONNV; NC 001512), 동부 말 뇌염 바이러스 (EEEV(SA); AF159559 및 EEEV (NA); U01558), 마야로 바이러스 (MAYV; DQ001069), 셈리키 포레스트 바이러스 (SFV; NC 003215), 로스 리버 바이러스 (RRV; DQ226993 및 사기야마 바이러스 (SAGV; AB032553), 게타 바이러스 (GETV; NC 006558), 미들버그 바이러스 (MIDV; EF536323), 우나 바이러스 (UNAV; AF33948), 또는 베바루 바이러스 (BEBV; AF339480) 또는 그것의 변이체로부터 유래된 알파바이러스 캡시드 향상제를 포함한다.

본 명세서에서 개시된 바이러스성 캡시드 향상제에 대한 코딩 서열에 고도의 서열 동일성 (예를 들어, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성)을 갖는 핵산분자는 본 명세서에 기재된 서열 (예를 들어, 서열번호: 1) 또는 당해 기술에 공지되어 있는 바와 같은 임의의 다른 알파바이러스 캡시드 단백질을 사용함에 의해, 예를 들어, 신드비스 바이러스 (SINV; NC 001547.1), 아우라 바이러스 (AURAV; AF126284), 치쿤군야 바이러스 (CHIKV; NC 004162), O'니옹-니옹 바이러스 (ONNV; NC 001512), 동부 말 뇌염 바이러스 (EEEV(SA); AF159559 및 EEEV (NA); U01558), 마야로 바이러스 (MAYV; DQ001069), 셈리키 포레스트 바이러스 (SFV; NC 003215), 로스 리버 바이러스 (RRV; DQ226993 및사기야마 바이러스 (SAGV; AB032553), 게타 바이러스 (GETV; NC 006558), 미들버그바이러스 (MIDV;EF536323), 우나 바이러스 (UNAV; AF33948),및 베바루 바이러스 (BEBV; AF339480)의 서열을 사용함에 의해, 각각의 알파바이러스 게놈에서 확인된 서열로부터 프라이머 또는 유전자-특이적 프라이머를 퇴화함으로 게놈 서열 분석, 하이브리드화, 및/또는 PCR에 의해, 확인 및/또는 단리될 수 있다. 예를 들어, 바이러스성 캡시드 향상제는 토가비리다에 계열에 속하는 바이러스 종, 예를 들어 알파바이러스 종 또는 루비바이러스 종으로부터의 DLP 모티프를 포함하거나 이들로 구성될 수 있다. 일부 구현예에서, 본 개시내용의 핵산분자는 알파바이러스 캡시드 단백질의 5' CDS 부분에 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 나타내는 핵산 서열을 갖는 바이러스성 캡시드 향상제를 포함한다. 일부 구현예에서, 알파바이러스 캡시드 단백질의 5' CDS 부분은 알파바이러스 캡시드 단백질에 대한 코딩 서열의 적어도 제1 25, 50, 75, 80, 100, 150, 또는 200 뉴클레오타이드를 포함한다. 일부 구현예에서, 본 개시내용의 핵산분자는 서열번호: 1 및 46-52 중 어느 하나의 핵산 서열에 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 나타내는 핵산 서열을 갖는 바이러스성 캡시드 향상제를 포함한다. 일부 구현예에서, 핵산분자는 서열번호: 1 및 46-52 중 어느 하나의 핵산 서열에 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, 또는 이들 값 중 임의의 두 값 사이의 범위의 서열 동일성을 나타내는 핵산 서열을 갖는 바이러스성 캡시드 향상제를 포함한다. 일부 구현예에서, 본 개시내용의 핵산분자는 본 명세서에서 개시된 서열번호: 1의 서열에 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 나타내는 핵산 서열을 갖는 바이러스성 캡시드 향상제를 포함한다. 일부 구현예에서, 본 개시내용의 핵산분자는 도 11A-B 및/또는, 그 내용이 전체적으로 본 명세서에 참고로 편입되는, Toribio et al. (2016 supra)의 공보에서의 도 1A에 기재된 서열 중 어느 하나에 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 나타내는 핵산 서열을 갖는 바이러스성 캡시드 향상제를 포함한다.

따라서, 일부 구현예에서, 본 개시내용의 핵산분자는 본 명세서에서 개시된 서열번호: 46-52 중 임의의 하나의 서열에 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 나타내는 핵산 서열을 갖는 바이러스성 캡시드 향상제를 포함한다. 일부 구현예에서, 본 개시내용의 핵산분자는 본 명세서에서 개시된 서열번호: 46에서 제시된 서열에 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 나타내는 핵산 서열을 갖는 바이러스성 캡시드 향상제를 포함한다. 일부 구현예에서, 본 개시내용의 핵산분자는 본 명세서에서 개시된 서열번호: 47에서 제시된 서열에 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 나타내는 핵산 서열을 갖는 바이러스성 캡시드 향상제를 포함한다. 일부 구현예에서, 본 개시내용의 핵산분자는 본 명세서에서 개시된 서열번호: 48에서 제시된 서열에 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 나타내는 핵산 서열을 갖는 바이러스성 캡시드 향상제를 포함한다. 일부 구현예에서, 본 개시내용의 핵산분자는 본 명세서에서 개시된 서열번호: 49에서 제시된 서열에 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 나타내는 핵산 서열을 갖는 바이러스성 캡시드 향상제를 포함한다. 일부 구현예에서, 본 개시내용의 핵산분자는 본 명세서에서 개시된 서열번호: 50에서 제시된 서열에 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 나타내는 핵산 서열을 갖는 바이러스성 캡시드 향상제를 포함한다. 일부 구현예에서, 본 개시내용의 핵산분자는 본 명세서에서 개시된 서열번호: 51에서 제시된 서열에 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 나타내는 핵산 서열을 갖는 바이러스성 캡시드 향상제를 포함한다. 일부 구현예에서, 본 개시내용의 핵산분자는 본 명세서에서 개시된 서열번호: 52에서 제시된 서열에 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 나타내는 핵산 서열을 갖는 바이러스성 캡시드 향상제를 포함한다.

본 개시내용의 일부 구현예에 따른 핵산분자에서, 하나 이상의 RNA 스템-루프는 제2 핵산 서열의 GOI에 대한 코딩 서열의 업스트림으로 작동가능하게 배치된다. 일부 구현예에서, 하나 이상의 RNA 스템-루프는 GOI에 대한 코딩 서열의 업스트림으로 약 1 내지 약 50 뉴클레오타이드, 약 10 내지 약 75 뉴클레오타이드, 약 30 내지 약 100 뉴클레오타이드, 약 40 내지 약 150 뉴클레오타이드, 약 50 내지 약 200 뉴클레오타이드, 약 60 내지 약 250 뉴클레오타이드, 약 100 내지 약 300 뉴클레오타이드, 또는 약 150 내지 약 500 뉴클레오타이드로 작동가능하게 배치된다. 일부 구현예에서, 하나 이상의 RNA 스템-루프는 GOI에 대한 코딩 서열의 업스트림으로 약 1, 약 2, 약 5, 약 10, 약 15, 약 20, 약 25, 약 30, 약 40, 약 50, 약 60, 약 70, 약 80, 약 90, 약 100, 약 200, 약 300, 약 400, 약 500, 또는 이들 값 중 임의의 두 값 사이의 범위의 뉴클레오타이드로 작동가능하게 배치된다. 일부 구현예에서, 하나 이상의 RNA 스템-루프는 GOI에 대한 코딩 서열의 업스트림으로 바로 작동가능하게 배치된다.

일부 구현예에서, 핵산분자는 제1 핵산 서열에 업스트림으로 작동가능하게 배치된 5'-비번역된 영역 (5'-UTR) 서열을 추가로 포함한다. 일부 구현예에서, 5'-UTR 서열은 제1 핵산 서열의 업스트림으로 약 1 내지 약 50, 약 10 내지 약 75, 약 30 내지 약 100, 약 40 내지 약 150, 약 50 내지 약 200, 약 60 내지 약 250, 약 100 내지 약 300, 또는 약 150 내지 약 500 뉴클레오타이드로 작동가능하게 배치된다. 일부 구현예에서, 5'-UTR 서열은 제1 핵산 서열의 업스트림으로 약 1, 약 2, 약 5, 약 10, 약 15, 약 20, 약 25, 약 30, 약 40, 약 50, 약 60, 약 70, 약 80, 약 90, 또는 100 뉴클레오타이드로 작동가능하게 배치된다. 일부 구현예에서, 5'-UTR 서열은 제1 핵산 서열의 업스트림으로 바로 작동가능하게 배치된다.

일부 구현예에서, 5' UTR 서열은 프로모터에 다운스트림으로 작동가능하게 배치된다. 일부 구현예에서, 5'-UTR 서열은 프로모터 서열의 다운스트림으로 약 1 내지 약 50, 약 10 내지 약 75, 약 30 내지 약 100, 약 40 내지 약 150, 약 50 내지 약 200, 약 60 내지 약 250, 약 100 내지 약 300, 또는 약 150 내지 약 500 뉴클레오타이드로 작동가능하게 배치된다. 일부 구현예에서, 5' UTR 서열은 프로모터 서열의 다운스트림으로 약 1, 약 2, 약 5, 약 10, 약 15, 약 20, 약 25, 약 30, 약 40, 약 50, 약 60, 약 70, 약 80, 약 90, 또는 100 뉴클레오타이드로 작동가능하게 배치된다. 일부 구현예에서, 5' UTR 서열은 프로모터 서열의 다운스트림으로 바로 작동가능하게 배치된다. 일부 구현예에서, 5' UTR 서열은 프로모터에 다운스트림으로 그리고 제1 핵산 서열에 업스트림으로 작동가능하게 배치된다.

일부 구현예에서, 핵산분자는 제2 핵산 서열의 다운스트림으로 작동가능하게 배치된 3' 비번역된 영역 (3' UTR) 서열을 포함한다. 일부 구현예에서, 3' UTR 서열은 제2 서열 핵산 서열의 다운스트림으로 약 1 내지 약 50 뉴클레오타이드, 약 10 내지 약 75 뉴클레오타이드, 약 30 내지 약 100 뉴클레오타이드, 약 40 내지 약 150 뉴클레오타이드, 약 50 내지 약 200 뉴클레오타이드, 약 60 내지 약 250 뉴클레오타이드, 약 100 내지 약 300 뉴클레오타이드, 또는 약 150 내지 약 500 뉴클레오타이드로 작동가능하게 배치된다. 일부 구현예에서, 3' UTR 서열은 제2 핵산 서열의 다운스트림으로 약 1, 약 2, 약 5, 약 10, 약 15, 약 20, 약 25, 약 30, 약 40, 약 50, 약 60, 약 70, 약 80, 약 90, 약 100, 약 200, 약 300, 약 400, 약 500, 또는 이들 값 중 임의의 두 값 사이의 범위의 뉴클레오타이드로 작동가능하게 배치된다. 일부 구현예에서, 3' UTR 서열은 제2 핵산 서열의 다운스트림으로 바로 작동가능하게 배치된다.

본 명세서에서 개시된 일부 구현예에서, GOI에 대한 코딩 서열은 메신저 RNA (mRNA) 또는 mRNA의 일부로 전사된다. 본 명세서에서 사용된 바와 같이, 용어 "mRNA" 또는 "메신저 RNA"는 전사 동안 합성되고, 이중-가닥 DNA의 가닥 중 하나에 상보적이고, 단백질 합성을 위한 리보솜에 DNA에 함유된 유전적 정보를 전달하는 작용을 하는 단일 가닥 RNA 분자를 지칭한다. mRNA는 스플라이싱될 수 있거나, 부분적으로 스플라이싱될 수 있거나 또는 스플라이싱되지 않을 수 있고, 및 진핵 또는 원핵 mRNA일 수 있다. 상기에 논의된 바와 같이, 본 개시내용의 일부 구현예에 따른 mRNA 분자는 새로운 합성을 통해 생산될 수 있다. 본 명세서에서 개시된 일부 구현예에서, GOI에 대한 코딩 서열은 폴리펩타이드를 인코딩한다. 일부 구현예에서, 본 폴리펩타이드는 치료적 폴리펩타이드, 예방적 폴리펩타이드, 진단적 폴리펩타이드, 기능식품 폴리펩타이드, 산업 효소, 리포터 폴리펩타이드, 또는 이들의 임의의 조합이다. 일부 구현예에서, 본 폴리펩타이드는 항체, 항원, 면역 조절제, 사이토카인, 효소, 또는 이들의 임의의 조합이다.

일부 구현예에서, 본 개시내용의 핵산분자는 오토프로테아제 펩타이드 (예를 들어, 자가촉매 자가-절단 펩타이드)에 대한 코딩 서열을 추가로 포함하고, 여기서 오토프로테아제에 대한 코딩 서열은 제2 핵산 서열에 업스트림으로 선택적으로 작동가능하게 연결된다. 일반적으로, 당 업계에서 알려진 임의의 단백질분해 절단 부위는 본 개시내용의 핵산분자 안으로 편입될 수 있고, 예를 들어, 프로테아제에 의해 절단된 후-생산인 단백질분해 절단 서열일 수 있다. 추가의 적합한 단백질분해 절단 부위는 또한 외부 프로테아제의 첨가에 따라서 절단될 수 있는 단백질분해 절단 서열을 포함한다. 본 명세서에서 사용된 바와 같이 용어 "오토프로테아제"는 자가단백분해 활성을 보유하고 더 큰 폴리펩타이드 모이어티로부터 자체 절단할 수 있는 "자가-절단" 펩타이드를 지칭한다. 피코나바이러스 그룹의 구성원인 구제역 바이러스 (FMDV)에서 1차로 확인된, 몇 개의 오토프로테아제는, 예를 들어, 말 비염 A 바이러스 (E2A), 돼지 테스코바이러스-1 (P2A) 및 토사 아시냐 바이러스 (T2A)로부터 "2A 유사" 펩타이드와 같이 후속으로 확인되었고, 그리고 단백질분해 절단에서의 그것의 활성은 다양한 실험관내 및 생체내 진핵 시스템에서 나타났다. 이와 같이, 오토프로테아제의 개념은 확인된 많은 자연발생 오토프로테아제 시스템으로 당해 분야의 숙련가에게 이용가능하다. 잘 연구된 오토프로테아제 시스템은 예를 들어 바이러스성 프로테아제, 발달 단백질 (예를 들어 HetR, 헤지혹 단백질), RumA 오토프로테아제 도메인, UmuD, 등이다). 본 개시내용의 조성물 및 방법에 대해 적합한 오토프로테아제 펩타이드의 비-제한적인 예는 돼지 테스코바이러스-1 2A (P2A), 구제역 바이러스 (FMDV) 2A (F2A), 말 비염 A 바이러스 (ERAV) 2A (E2A), 토사 아시냐 바이러스 2A (T2A), 세포질 다각체병 바이러스 2A (BmCPV2A), 연화병 바이러스 2A (BmIFV2A), 또는 이들의 조합으로부터의 펩타이드 서열을 포함한다.

일부 구현예에서, 오토프로테아제 펩타이드에 대한 코딩 서열은 제1 핵산 서열에 다운스트림으로 그리고 제2 핵산 서열에 업스트림으로 작동가능하게 연결된다. 일부 구현예에서, 오토프로테아제 펩타이드는 돼지 테스코바이러스-1 2A (P2A), 구제역 바이러스 (FMDV) 2A (F2A), 말 비염 A 바이러스 (ERAV) 2A (E2A), 토사 아시냐 바이러스 2A (T2A), 세포질 다각체병 바이러스 2A (BmCPV2A), 연화병 바이러스 2A (BmIFV2A), 및 이들의 조합으로 구성된 군으로부터 선택된 펩타이드 서열을 포함하거나 또는 이들로 구성된다. 일부 구현예에서, 오토프로테아제 펩타이드는 돼지 테스코바이러스-1 2A (P2A)의 펩타이드 서열을 포함한다.

당해 분야의 숙련가는 캡시드 향상제 서열이 캡시드 향상제 서열의 부재에서 나타난 수준과 비교하여 이종성 핵산 서열(들), 예를 들어 GOI에 대한 코딩 서열의 발현을 향상시키는 한, 바이러스성 캡시드 향상제 서열의 상이한 배치형태, 오토프로테아제 펩타이드를 인코딩하는 서열, 및 관심 유전자를 인코딩하는 서열이 이용될 수 있다는 것을 인정할 것이다. 이들 서열은 관심 유전자에 의해 인코딩된 폴리펩타이드가 오토프로테아제에 의해 절단 후 프로테아제 및 임의의 캡시드 단백질 서열로부터 방출될 수 있도록 전형적으로 구성될 것이다.

본 명세서에 기재된 하나 이상의 바이러스성 캡시드 향상제 서열을 갖는 본 명세서에 기재된 오토프로테아제 펩타이드 (예컨대 P2A, F2A, E2A, T2A, BmCPV2A, 및 BmIFV2A)의 예시적인 조합의 비제한적인 목록이 표 1 및 2에 제공되어 있다. 표 1은 각각의 바이러스성 캡시드 향상제에 대한 속기 명칭 (예를 들어, "CE01") 및 각각의 오토프로테아제 펩타이드에 대한 속기 명칭 (예를 들어, "AP01")을 제공한다. 표 2에서 각각의 넘버링된 'X' 펩타이드는 표 1에 제공된 상응하는 오토프로테아제 펩타이드를 갖는다. 마찬가지로, 표 2에서 각각의 넘버링된 'Y' 향상제는 표 1에 제공된 상응하는 바이러스성 캡시드 향상제를 갖는다. 따라서, 표 2에서 각각의 "X:Y" 도입은 본 개시내용의 분자, 조성물, 및 방법에서 사용될 수 있는 바이러스성 캡시드 향상제와 오토프로테아제 펩타이드의 조합의 예를 제공한다. 예를 들어, 표 2에서 "AP01:CE16"으로 지정된 조합은 신드비스 바이러스 (SINV)로부터 유래된 바이러스성 캡시드 향상제와 돼지 테스코바이러스-1 2A (P2A)로부터의 오토프로테아제 펩타이드의 조합을 제공한다.

표 2:

일 양태에서, 변형된 바이러스성 RNA 레플리콘을 인코딩하는 핵산 서열을 포함하는 신규한 핵산분자가 본 명세서에서 개시되고, 여기서 상기 변형된 바이러스성 RNA 레플리콘은 바이러스성 캡시드 향상제 (예를 들어, DLP 모티프) 또는 그것의 변이체의 하나 이상의 구조 요소를 인코딩하는 제1 핵산 서열을 포함하고, 여기서 상기 바이러스성 캡시드 향상제는 바이러스성 RNA 레플리콘, 및 적어도 하나의 비구조적 바이러스성 단백질 또는 이들의 부분을 인코딩하는 제2 핵산 서열에 이종성이고, 여기서 상기 제1 핵산 서열은 제2 핵산 서열에 업스트림으로 작동가능하게 연결된다.

본 명세서에서 상호교환적으로 사용되는 용어들 "레플리콘 RNA" 및 "RNA 레플리콘"은 허용된 세포 내에 그 자체의 증폭 또는 자기-복제를 지시하기 위해 필요한 모든 유전적 정보를 함유하는 RNA를 지칭한다. 그것의 자체의 복제를 지시하기 위해, RNA 분자는 1) RNA 증폭 과정을 촉매화하기 위해 바이러스성 또는 숙주 세포-유래된 단백질, 핵산 또는 리보핵단백질과 상호작용할 수 있는 중합효소, 레플리카제, 또는 다른 단백질을 인코딩하고; 그리고 2) 서브게놈 레플리콘-인코딩된 RNA의 복제 및 전사를 위해 필요한 시스-작용 RNA 서열을 함유한다. 이들 서열은 그것의 자기-인코딩된 단백질, 또는 비-자기-인코딩된 세포-유래된 단백질, 핵산 또는 리보핵단백질, 또는 임의의 이들 성분 사이의 복합체로 복제의 과정 동안 결합될 수 있다. 본 개시내용의 일부 구현예에서, 변형된 바이러스성 레플리콘 RNA 분자는 전형적으로 하기 정렬된 요소를 함유한다: 복제를 위해 시스로 요구된 5' 바이러스성 또는 결함있는-간섭하는 RNA 서열(들), 생물학적 활성 비구조 단백질에 대해 코딩하는 서열, 서브게놈 RNA에 대한 프로모터, 복제를 위해 시스로 요구된 3' 바이러스성 서열, 및 폴리아데닐레이트 트랙. 또한, 용어 레플리콘 RNA는 일반적으로 양성 극성의 분자, 또는 "메신저" 센스를 지칭하고, 그리고 레플리콘 RNA는 임의의 알려진, 자연발생 RNA 바이러스의 것과 상이한 길이의 것일 수 있다. 본 개시내용의 일부 구현예에서, 레플리콘 RNA는 구조적 바이러스성 단백질 중 적어도 하나의 코딩 서열을 함유하지 않는다. 이들 사례에서, 구조적 유전자를 인코딩하는 서열은 하나 이상의 이종성 서열 예컨대, 예를 들어, 관심 유전자 (GOI)에 대한 코딩 서열로 치환될 수 있다. 레플리콘 RNA가 재조합 알파바이러스 입자 안으로 팩킹되어 지는 이들 사례에서, 이것은 입자 형성으로 이어지는 알파바이러스 구조 단백질과 상호작용을 개시하도록 하는 역할을 하는, 소위 패키징 신호인 하나 이상의 서열을 함유하여야 한다.

본 명세서에서 사용된 바와 같이, "서브게놈 RNA"는 유래되어 지는 게놈 RNA보다 더 작은 길이 또는 크기의 RNA 분자를 지칭한다. 바이러스성 서브게놈 RNA는 그 서열이 게놈 RNA 또는 그것의 보체 내에 머무는 내부 프로모터로부터 전사되어야 한다. 서브게놈 RNA의 전사는 숙주 세포-인코딩된 단백질, 리보핵단백질(들), 또는 이들의 조합과 연관된 바이러스성-인코딩된 중합효소(들)에 의해 매개될 수 있다. 본 개시내용의 일부 구현예에서, 서브게놈 RNA는 본 명세서에서 개시된 바와 같은 변형된 레플리콘 RNA로부터 생산되고 하나 이상의 관심 유전자 (GOI)를 인코딩하거나 발현한다. 선천적 서브게놈 프로모터 대신에, 서브게놈 RNA는 엔세팔로마이오카디티스 바이러스 (EMCV), 소과 바이러스성 설사 바이러스 (BVDV), 폴리오바이러스, 구제역 바이러스 (FMD), 에테로바이러스 71, 또는 간염 C 바이러스로부터 유래된 내부 리보솜 유입 부위 (IRES)의 조절 하에 배치될 수 있다.

일부 구현예에서, 변형된 바이러스성 RNA 레플리콘의 제2 핵산 서열은 적어도 하나, 적어도 둘, 적어도 셋, 또는 적어도 네 개 비구조적 바이러스성 단백질에 대한 코딩 서열을 포함한다. 일부 구현예에서, 변형된 바이러스성 RNA 레플리콘의 제2 핵산 서열은 적어도 하나의 비구조적 바이러스성 단백질에 대한 코딩 서열을 포함한다. 예를 들어, 변형된 바이러스성 RNA 레플리콘의 제2 핵산 서열은 적어도 하나의 비구조적 바이러스성 단백질에 대한 인코딩 서열의 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 100%, 또는 이들 값 중 임의의 두 값 사이의 범위를 포함할 수 있다. 일부 구현예에서, 변형된 바이러스성 RNA 레플리콘의 제2 핵산 서열은 적어도 하나의 비구조적 바이러스성 단백질의 상당한 부분에 대한 코딩 서열을 포함할 수 있다. 본 명세서에서 사용된 바와 같이, 비구조적 바이러스성 단백질을 인코딩하는 핵산 서열의 "상당한 부분"은 당해 분야의 숙련가에 의한 서열의 매뉴얼 평가에 의하거나, 또는 알고리즘 예컨대 BLAST를 사용한 컴퓨터-자동화 서열 비교 및 확인에 의해 그 단백질의 추정 확인을 부여하기에 충분한 비구조적 바이러스성 단백질을 인코딩하는 핵산 서열을 포함한다 (예를 들어, "Basic Local Alignment Search Tool"; Altschul SF et al., J. Mol. Biol. 215:403-410, 1993에서, 참고). 일부 구현예에서, 변형된 바이러스성 RNA 레플리콘의 제2 핵산 서열은 적어도 하나의 비구조 단백질에 대한 전체 코딩 서열을 포함할 수 있다. 일부 구현예에서, 제2 핵산 서열은 천연 바이러스성 비구조 단백질에 대한 모든 코딩 서열을 실질적으로 포함한다.

이들 신규한 핵산분자가 구축되고 특성규명되어 지는 분자 기술 및 방법은 본원의 본 명세서에서의 실시예에 보다 완전하게 기재되어 있다. 비-제한적인 예로서, 실시예 부문에서, 베네주엘라 말 뇌염 바이러스 (VEEV) 및 말 동맥염 바이러스 (EAV)는 본 명세서에서 개시된 조성물 및 방법을 예시하기 위해 사용되었다.

일부 구현예에서, 본 명세서에서 개시된 핵산분자는 재조합 핵산분자이다. 본 명세서에서 사용된 바와 같이, 용어 재조합은 임의의 분자 (예를 들어 DNA, RNA, 등), 즉, 또는 폴리뉴클레오타이드의 인간조작으로부터의 결과물로, 그러나 간접적인 것을 의미한다. 비-제한적인 예로서, cDNA는 실험관내 중합효소 반응(들)에 의해 생성되거나, 또는 링커가 부착되거나, 또는 벡터, 예컨대 클로닝 벡터 또는 발현 벡터 안으로 통합된 임의의 핵산분자인 것과 같은 재조합 DNA 분자이다. 비-제한적인 예로서, 재조합 핵산분자는: 1) 예를 들어, 핵산분자의 화학적 또는 효소적 기술을 사용하여 (예를 들어, 화학적 핵산 합성의 사용에 의해, 또는 복제, 중합, 핵산 외부 분해소화, 엔도뉴클레오라이틱 소화, 결찰, 역전사, 전사, 염기 변형 (예를 들어, 메틸화를 포함함), 또는 재조합 (상동성 및 부위-특이적인 재조합을 포함함)을 위한 효소의 사용에 의해 실험관내에서 합성 또는 변형되고; 2) 자연에서는 연합되지 않는 연합된 뉴클레오타이드 서열을 포함하고, 3) 자연발생 핵산분자 서열에 관하여 하나 이상의 뉴클레오타이드를 결하도록 분자 클로닝 기술을 사용하여 조작되고, 및/또는 4) 자연발생 핵산 서열에 관하여 하나 이상의 서열 변화 또는 재배열을 갖도록 분자 클로닝 기술을 사용하여 조작되었다.

자연발생 핵산 서열의 변이체를 포함한 핵산분자는 당해 분야의 숙련가에게 알려진 수많은 방법을 사용하여 생산될 수 있다. 핵산분자의 서열은 비제한적으로, 고전적 돌연변이 유발 기술 및 재조합 DNA 기법, 예컨대 비제한적으로 부위 지향적 돌연변이 유발, 돌연변이를 유도하기 위해 핵산분자의 화학적 처리, 핵산 단편의 제한 효소 절단, 핵산 단편의 결찰, 핵산 서열의 선택된 영역의 PCR 증폭 및/또는 돌연변이 유발, 재조합 클로닝, 및 올리고뉴클레오타이드 혼합물의 화학적 합성 및 핵산분자의 혼합물을 "구성"하기 위한 혼합물 그룹의 결찰을 비롯한 화학적 합성, 및 이들의 조합을 포함한 다양한 기술을 사용하여 이것이 유래되어 지는 자연발생 서열에 관하여 변형될 수 있다. 핵산분자 동족체는 핵산분자에 의해 인코딩된 및/또는 야생형 유전자 또는 이의 단편과 하이브리드화에 의한 단백질 또는 레플리콘의 기능을 스크리닝함에 의해, 또는 표적 또는 야생형 핵산분자 또는 서열에 상동성을 갖는 프라이머를 사용한 PCR에 의해 변형된 핵산분자의 혼합물로부터 선택될 수 있다.

본 명세서에서 개시된 다양한 구현예에서, 본 명세서에서 개시된 핵산분자는 하기 특징 중 하나 이상을 포함할 수 있다.

일부 구현예에서, 변형된 바이러스성 RNA 레플리콘은 토가비리다에 계열의 알파바이러스 속 또는 아테리비리다에 계열의 아테리바이러스 속에 속하는 바이러스 종으로부터 유래된 변형된 RNA 레플리콘을 포함한다. 적합한 아테리바이러스 종은 말 동맥염 바이러스 (EAV), 돼지 호흡 및 생식 증후군 바이러스 (PRRSV), 락테이트 탈수소효소 증진 바이러스 (LDV), 유인원 출혈열 바이러스 (SHFV), 및 우울병 포섬 질환 바이러스 (WPDV)를 포함한다. 독성의 및 무독성의 아테리바이러스 균주 둘 모두가 적합하다. 바람직한 아테리바이러스 균주의 비-제한적인 예는, 비제한적으로, EAV-독성의 버시러스 균주 (VBS), LDV-플라게만, LDV-C, PRRSV-유형 1, 및 PRRSV-유형 2를 포함한다. 예시적인 바람직한 EAV 균주는, 비제한적으로, EAV VB53, EAV ATCC VR-796, EAV HK25, EAV HK116, EAV ARVAC MLV, EAV 버시러스 균주 (오하이오), 변형된 EAV 버시러스, 무독성의 균주 CA95, 레드 마일 (켄터키), 84KY-A1 (켄터키), 브로추아프-2 (폴란드), 비버나 (스위스), 및 비엔나 (호주)를 포함한다. PRRSV 균주의 비제한적인 바람직한 예는 PRRSV LV4.2.1, PRRSV 16244B, PRRSV HB-1(sh)/2002, PRRSV HB-2(sh)/2002, PRRSV HN1, PRRSV SD 01-08, PRRSV SD0802, PRRSV SD0803, PRRSV, 및 VR2332를 포함한다. SHFV 균주 및 변이체의 비제한적인 바람직한 예는 SHFV 변이체 SHFV-krtg1a 및 -krtg1b (SHFV-krtg1a/b), SHFVkrtg2a/b (유전자 은행 수탁 # JX473847 내지 JX473850), SHFV-LVR, SHFV 원형 변이체 LVR 42-0/M6941 (NC_003092); 키발레 붉은 콜로부스로부터의 SHFV-krc1 및 SHFVkrc2 (각각, HQ845737 및 HQ845738)를 포함한다. 바람직한 아테리바이러스의 다른 비-제한적인 예는 PRRSV-렐리스타트, 유럽인 (유형 1) 유형 균주 (M96262); PRRSVVR2332, 북미인 (유형 2) 유형 균주 (U87392); EAV-버시러스 (NC_002532); EAV-s3685 (GQ903794); LDV-P, 플라게만 균주 (U15146); 및 LDV-C, 신경독성의 유형 C 균주 (L13298)를 포함한다.

일부 구현예에서, 제1 핵산 서열은 변형된 아테리바이러스 RNA 레플리콘의 일부 또는 전체의 pp1ab 비구조 단백질을 인코딩하는 핵산 서열에 업스트림으로 배치된다. 일부 구현예에서, 제1 핵산 서열은 변형된 바이러스성 RNA 레플리콘의 5'-말단의 다운스트림으로 약 1 내지 1000 뉴클레오타이드의 영역 내에 작동가능하게 배치된다. 일부 구현예에서, 제1 핵산 서열은 변형된 바이러스성 RNA 레플리콘의 5'-말단의 다운스트림으로 약 1 내지 25, 약 1 내지 40, 약 10 내지 25, 10 내지 50, 약 10 내지 100, 약 20 내지 50, 약 20 내지 75, 약 25 내지 100, 약 25 내지 100 뉴클레오타이드의 영역 내에 작동가능하게 배치된다. 일부 구현예에서, 제1 핵산 서열은 변형된 바이러스성 RNA 레플리콘의 5'-말단의 다운스트림으로 약 1, 2, 5, 10, 15, 20, 25, 30, 40, 50, 75, 100, 125, 150, 200, 250, 300, 그 이상, 또는 이들 값 중 임의의 두 값 사이의 범위 뉴클레오타이드의 영역 내에 작동가능하게 배치된다. 일부 구현예에서, 제1 핵산 서열은 변형된 바이러스성 RNA 레플리콘의 5'-말단의 다운스트림으로 약 1 내지 100, 약 1 내지 500, 약 25 내지 800, 약 50 내지 900, 약 50 내지 300, 약 25 내지 200, 약 25 내지 100, 약 50 내지 400, 약 100 내지 500, 약 100 내지 300, 약 100 내지 200, 약 200 내지 500, 약 200 내지 600, 약 200 내지 400, 약 150 내지 700, 약 150 내지 400, 또는 약 500 내지 1000 뉴클레오타이드의 영역 내에 작동가능하게 배치된다.

임의의 특정 이론에 구속됨 없이, 바이러스성 DLP 모티프의 번역을 향상시키는 활성은, 일부 구현예에서, 바이러스성 DLP 모티프와 개시 AUGi 코돈 사이의 거리에 의존할 수 있는 것으로 여겨진다 (Toribio et al., 2016 supra). 따라서, 일부 구현예에서, 제1 핵산 서열은 변형된 바이러스성 RNA 레플리콘의 개시 코돈 AUGi의 다운스트림으로 약 10 내지 100 뉴클레오타이드의 영역에 작동가능하게 배치된다. 일부 구현예에서, 제1 핵산 서열은 변형된 바이러스성 RNA 레플리콘의 개시 코돈 AUGi의 다운스트림으로 약 10 내지 75, 약 10 내지 50, 약 10 내지 25, 15 내지 75, 약 15 내지 50, 약 15 내지 25, 약 25 내지 75, 약 25 내지 50, 약 25 내지 100 뉴클레오타이드의 영역 내에 작동가능하게 배치된다. 일부 구현예에서, 제1 핵산 서열은 변형된 바이러스성 RNA 레플리콘의 개시 코돈 AUGi의 다운스트림으로 약 25, 28, 31, 34, 37, 37, 40, 43, 46, 49, 50, 또는 이들 값 중 임의의 두 값 사이의 범위 뉴클레오타이드의 영역 내에 작동가능하게 배치된다.

일부 구현예에서, 변형된 바이러스성 RNA 레플리콘을 인코딩하는 서열은 하나 이상의 발현 카세트를 추가로 포함하고, 여기서 각각의 발현 카세트는 관심 유전자 (GOI)에 대한 코딩 서열에 작동가능하게 연결된 프로모터를 포함한다. 본 명세서에서 사용된 바와 같이, 용어 "발현 카세트"는 코딩 서열 및 생체내 및/또는 생체외에서 수령체 세포에서 코딩 서열의 직접적인 적절한 전사 및/또는 번역을 위한 충분한 조절 정보를 함유하는 유전 물질의 작제물을 지칭한다. 발현 카세트는 원하는 숙주 세포를 표적으로 하기 위한 벡터 및/또는 대상체 안으로 삽입될 수 있다. 또한, 용어 발현 카세트는 용어 "발현 작제물"과 상호교환가능하게 사용될 수 있다. 본 명세서에서 사용된 바와 같은 용어 "발현 카세트"는 발현 조절 요소, 예컨대 프로모터에 작동가능하게 연결된 단백질 또는 기능적 RNA, 및, 선택적으로, 유전자의 전사 또는 번역에 영향을 주는 임의의 다른 핵산 서열의 또는 그 조합을 인코딩하는 핵산 작제물을 지칭한다.

본 명세서에서 사용된 바와 같은 용어 "작동가능하게 연결된"은 둘 또는 그 초과 서열 사이의 기능적 연결을 나타낸다. 예를 들어, 관심 있는 폴리뉴클레오타이드와 조절 서열 (예를 들어, 프로모터) 사이에 작동가능하게 연결은 관심 있는 폴리뉴클레오타이드의 발현을 허용하는 기능적 연결이다. 이 관점에서, 용어 "작동가능하게 연결된"은 조절 영역이 관심 있는 코딩 서열의 전사 또는 번역을 조절하는데 효과적이도록 전사되는 코딩 서열과 조절 영역의 위치 결정을 지칭한다. 본 명세서에서 개시된 일부 구현예에서, 용어 "작동가능하게 연결된"은 조절 서열이 폴리펩타이드를 인코딩하는 mRNA, 폴리펩타이드, 및/또는 기능적 RNA의 발현 또는 세포 국재화를 지시하거나 조절하도록 조절 서열이 폴리펩타이드 또는 기능적 RNA를 인코딩하는 서열에 비하여 적절한 위치에 배치된 배치형태를 나타낸다. 따라서, 프로모터는 핵산 서열의 전사를 매개할 수 있다면 핵산 서열과 작동 가능하게 연결되어 있다. 작동가능하게 연결된 요소는 인접 또는 비-인접일 수 있다.

DNA의 둘 또는 그 초과 서열을 함께 작동가능하게 연결하는 기본적인 기술은 당해 분야의 숙련가에게 익숙하고, 그와 같은 방법은 표준 분자 생물학적 조작에 관한 많은 서적에 기재되어 있다 (예를 들어, Maniatis et al., "Molecular Cloning: A Laboratory Manual" 2nd ed. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.; and Gibson et al., Nature Methods 6:343-45, 2009 참고).

본 명세서에서 개시된 일부 구현예에서, 본 명세서에서 개시된 핵산분자는 1 초과 발현 카세트를 포함할 수 있다. 원칙적으로, 본 명세서에서 개시된 핵산분자는 일반적으로 임의의 수의 발현 카세트를 포함할 수 있다. 일부 특정 구현예에서, 변형된 바이러스성 RNA 레플리콘은 적어도 2개, 3개, 4개, 5개, 또는 6개의 발현 카세트를 포함한다. 일부 구현예에서, 하나 이상의 발현 카세트 중 적어도 하나는 변형된 아테리바이러스 RNA 레플리콘의 전사 조절 서열 (TRS)에 다운스트림으로 작동가능하게 배치되고, 여기서 상기 TRS는 TRS1, TRS2, TRS3, TRS4, TRS5, TRS6, TRS7, 또는 이들의 조합일 수 있다. 일부 특정 구현예에서, 하나 이상의 발현 카세트 중 적어도 하나는 변형된 아테리바이러스 RNA 레플리콘의 TRS7의 다운스트림으로 작동가능하게 배치된다.

본 명세서에서 제공된 바와 같은 핵산분자는, 예를 들어, 이종성 핵산 서열 예컨대, 예를 들어, 관심 유전자 (GOI)의 코딩 서열에 작동가능하게 연결될 때 GOI의 발현에 영향을 미칠 수 있는 발현 또는 전사 벡터로서 용도를 찾을 수 있다. 일부 구현예에서, GOI의 코딩 서열은 기준 코딩 서열의 발현 수준보다 더 높은 수준에서의 발현을 위해 최적화된다. 일부 구현예에서, 기준 코딩 서열은 코돈-최적화되지 않은 것이다. 일부 구현예에서, GOI 코딩 서열은 코돈 최적화를 포함한다. 핵산 서열의 코돈-최적화에 관하여, 유전자 암호의 축퇴는 유전자의 서열을 인코딩하는 단백질 중 적어도 하나의 염기를 유전자로부터 생산된 폴리펩타이드의 아미노산 서열이 변화되어 지도록 함이 없이 상이한 염기로 치환하는 가능성을 제공한다. 그러므로, 본 개시내용의 핵산분자는 또한 유전자 암호의 축퇴에 따라 하나 이상의 뉴클레오타이드 치환을 가질 수 있다. 코돈 용법을 기술하는 참고문헌은 쉽게 공공연하게 이용가능하다. 본 개시내용의 일부 추가 구현예에서, 폴리뉴클레오타이드 서열 변이체가 다양한 이유, 예를 들어, 특정 숙주에 대한 코돈 발현을 최적화하기 위해 생산될 수 있다 (예를 들어, 다른 유기체 예컨대 인간, 햄스터, 마우스, 또는 원숭이에 의해 바람직한 것들로 아테리바이러스 mRNA에서의 코돈 변화).

본 명세서에서 개시된 일부 구현예에서, GOI의 서열은 폴리펩타이드를 인코딩한다. 폴리펩타이드의 유형은 특이적 적용에 의존하여 다양할 수 있다. 예를 들어, 폴리펩타이드는 치료적 폴리펩타이드, 예방적 폴리펩타이드, 진단적 폴리펩타이드, 기능식품 폴리펩타이드, 산업 효소, 리포터 폴리펩타이드, 또는 이들의 임의의 조합일 수 있다. 일부 구현예에서, 본 폴리펩타이드는 항체, 항원, 면역 조절제, 사이토카인, 효소, 또는 이들의 조합이다.

일부 구현예에서, 본 명세서에서 개시된 바와 같은 핵산분자는 제2 바이러스성 캡시드 향상제 (예를들어, a DLP 모티프)의 하나 이상의 구조 요소를 인코딩하는 제3 핵산 서열을 추가로 포함할 수 있고, 여기서 상기 제3 핵산 서열은 GOI에 대한 코딩 서열에 업스트림으로 작동가능하게 연결된다. 제2 DLP 모티프는 비구조 단백질에 대한 코딩 서열의 업스트림으로 배치된 제1 DLP 모티프와 동일할 수 있거나 또는 상이할 수 있다. 따라서, 일부 구현예에서, 제2 DLP 모티프는 비구조 단백질에 대한 코딩 서열의 업스트림으로 배치된 제1 DLP 모티프와 동일하다. 일부 구현예에서, 제2 DLP 모티프는 비구조 단백질에 대한 코딩 서열의 업스트림으로 배치된 제1 DLP 모티프와 상이하다.

일부 구현예에서, 변형된 바이러스성 RNA 레플리콘을 인코딩하는 서열은 제3 핵산 서열에 다운스트림으로 그리고 GOI에 대한 코딩 서열에 업스트림으로 작동가능하게 연결된 단백질분해 절단 부위에 대한 코딩 서열을 추가로 포함함. 일반적으로, 당 업계에서 알려진 임의의 단백질분해 절단 부위가 본 개시내용의 핵산분자에 편입될 수 있고, 예를 들어, 프로테아제에 의해 절단된 후-생산인 단백질분해 절단 서열일 수 있다. 추가의 적합한 단백질분해 절단 부위는 또한 외부 프로테아제의 첨가에 따라서 절단될 수 있는 단백질분해 절단 서열을 포함한다. 일부 구현예에서, 변형된 바이러스성 RNA 레플리콘을 인코딩하는 서열은 제3 핵산 서열에 다운스트림으로 그리고 GOI에 대한 코딩 서열에 업스트림으로 작동가능하게 연결된 오토프로테아제 펩타이드에 대한 코딩 서열을 추가로 포함함. 일부 구현예에서, 오토프로테아제 펩타이드는 돼지 테스코바이러스-1 2A (P2A), 구제역 바이러스 (FMDV) 2A (F2A), 말 비염 A 바이러스 (ERAV) 2A (E2A), 토사 아시냐 바이러스 2A (T2A), 세포질 다각체병 바이러스 2A (BmCPV2A), 연화병 바이러스 2A (BmIFV2A), 및 이들의 조합으로 구성된 군으로부터 선택된 펩타이드 서열을 포함한다. 일부 구현예에서, 오토프로테아제 펩타이드는 돼지 테스코바이러스-1 2A (P2A)로부터의 펩타이드 서열을 포함한다.

당해 분야의 숙련가는 캡시드 향상제 서열이 캡시드 향상제 서열의 부재에서 나타난 수준과 비교하여 이종성 핵산 서열(들)의 발현을 확대시키는 한, 바이러스성 캡시드 향상제 서열의 상이한 배치형태, 비구조 단백질에 대한 코딩 서열, 오토프로테아제 펩타이드를 인코딩하는 서열, 및 관심 유전자를 인코딩하는 서열이 이용될 수 있다는 것을 인정할 것이다. 이들 서열은 관심 유전자에 의해 인코딩된 폴리펩타이드가 오토프로테아제에 의해 절단 후 프로테아제 및 임의의 캡시드 단백질 서열로부터 방출될 수 있도록 전형적으로 구성될 것이다.

일부 구현예에서, 본 명세서에서 개시된 바와 같은 핵산분자의 서열은 알파바이러스바이러스 종의 변형된 RNA 레플리콘을 포함한다. 일부 구현예에서, 변형된 알파바이러스 RNA 레플리콘은 VEEV/EEEV 그룹, 또는 SF 그룹, 또는 SIN 그룹에 속하는 알파바이러스의 것이다. SF 그룹 알파바이러스의 비-제한적인 예는 셈리키 포레스트 바이러스, O'니옹-니옹 바이러스, 로스 리버 바이러스, 미들버그 바이러스, 치쿤군야 바이러스, 바마 포레스트 바이러스, 게타 바이러스, 마야로 바이러스, 사기야마 바이러스, 베바루 바이러스, 및 우나 바이러스를 포함한다. SIN 그룹 알파바이러스의 비-제한적인 예는 신드비스 바이러스, 거드우드 S.A. 바이러스, 남미인 아르보 바이러스 No. 86, 옥켈보 바이러스, 아우라 바이러스, 바반키 바이러스, 화타로아 바이러스, 및 키질라가크 바이러스를 포함한다. VEEV/EEEV 그룹 알파바이러스의 비-제한적인 예는 동부 말 뇌염 바이러스 (EEEV), 베네주엘라 말 뇌염 바이러스 (VEEV), 에버글레이즈 바이러스 (EVEV), 뮤캄보 바이러스 (MUCV), 픽수나 바이러스 (PIXV), 미들버그 바이러스 (MIDV), 치쿤군야 바이러스 (CHIKV), O'니옹-니옹 바이러스 (ONNV), 로스 리버 바이러스 (RRV), 바마 포레스트 바이러스 (BF), 게타 바이러스 (GET), 사기야마 바이러스 (SAGV), 베바루 바이러스 (BEBV), 마야로 바이러스 (MAYV), 및 우나 바이러스 (UNAV)를 포함한다.

알파바이러스 종의 비-제한적인 예는 동부 말 뇌염 바이러스 (EEEV), 베네주엘라 말 뇌염 바이러스 (VEEV), 에버글레이즈 바이러스 (EVEV), 뮤캄보 바이러스 (MUCV), 셈리키 포레스트 바이러스 (SFV), 픽수나 바이러스 (PIXV), 미들버그 바이러스 (MIDV), 치쿤군야 바이러스 (CHIKV), O'니옹-니옹 바이러스 (ONNV), 로스 리버 바이러스 (RRV), 바마 포레스트 바이러스 (BF), 게타 바이러스 (GET), 사기야마 바이러스 (SAGV), 베바루 바이러스 (BEBV), 마야로 바이러스 (MAYV), 우나 바이러스 (UNAV), 신드비스 바이러스 (SINV), 아우라 바이러스 (AURAV), 화타로아 바이러스 (WHAV), 바반키 바이러스 (BABV), 키질라가크 바이러스 (KYZV), 웨스턴 말 뇌염 바이러스 (WEEV), 하이랜드 J 바이러스 (HJV), 포트 모건 바이러스 (FMV), 느두무 (NDUV), 및 버기 크릭 바이러스를 포함한다. 독성의 및 무독성의 알파바이러스 균주 둘 모두가 적합하다. 일부 구현예에서, 변형된 알파바이러스 RNA 레플리콘은 신드비스 바이러스 (SIN), 셈리키 포레스트 바이러스 (SFV), 로스 리버 바이러스 (RRV), 베네주엘라 말 뇌염 바이러스 (VEEV), 또는 동부 말 뇌염 바이러스 (EEEV)의 것이다. 일부 구현예에서, 변형된 알파바이러스 RNA 레플리콘은 베네주엘라 말 뇌염 바이러스 (VEEV)의 것이다.

본 명세서에서 개시된 바와 같은 핵산분자가 알파바이러스 바이러스 종의 변형된 RNA 레플리콘을 포함하는 일부 사례에서, 제1 핵산 서열은 변형된 알파바이러스 RNA 레플리콘의 하나 이상의 비구조 단백질 nsp1-4 또는 이들의 일부를 인코딩하는 핵산 서열에 업스트림으로 배치된다. 따라서, 일부 구현예에서, 제1 핵산 서열은 변형된 알파바이러스 RNA 레플리콘의 비구조 단백질 nsp1, nsp1-2, nsp1-3, nsp1-4, nsp2-4, nsp3-4, nsp2-3, nsp2, nsp3, nsp4, 또는 이들의 일부를 인코딩하는 핵산 서열에 업스트림으로 배치된다. 일부 구현예에서, 변형된 알파바이러스 RNA 레플리콘을 인코딩하는 서열은 하나 이상의 발현 카세트를 추가로 포함하고, 여기서 각각의 발현 카세트는 관심 유전자 (GOI)에 대한 코딩 서열에 작동가능하게 연결된 프로모터를 포함한다. 일부 구현예에서, 변형된 알파바이러스 RNA 레플리콘은 적어도 2개, 3개, 4개, 5개, 또는 6개의 발현 카세트를 포함한다. 일부 구현예에서, 하나 이상의 발현 카세트 중 적어도 하나는 변형된 알파바이러스 RNA 레플리콘의 하나 이상의 비구조 단백질 nsp1-4 또는 이들의 일부를 인코딩하는 핵산 서열의 다운스트림으로 작동가능하게 연결된다. 따라서, 일부 구현예에서, 하나 이상의 발현 카세트 중 적어도 하나는 변형된 알파바이러스 RNA 레플리콘의 비구조 단백질 nsp1, nsp1-2, nsp1-3, nsp1-4, nsp2-4, nsp3-4, nsp2-3, nsp2, nsp3, nsp4, 또는 이들의 일부를 인코딩하는 핵산 서열의 다운스트림으로 작동가능하게 연결된다.

일부 구현예에서, 하나 이상의 발현 카세트 중 적어도 하나는 제2 바이러스성 캡시드 향상제 (예를 들어, DLP 모티프)의 하나 이상의 구조 요소를 인코딩하는 제3 핵산 서열을 추가로 포함하고, 여기서 상기 제3 핵산 서열은 GOI에 대한 코딩 서열에 업스트림으로 작동가능하게 연결된다. 제2 DLP 모티프는 적어도 비구조 단백질 nsp1-4 또는 이들의 일부에 대한 코딩 서열의 업스트림으로 배치된 제1 DLP 모티프와 동일하거나 또는 상이할 수 있다. 따라서, 일부 구현예에서, 제2 DLP 모티프는 비구조 단백질에 대한 코딩 서열의 업스트림으로 배치된 제1 DLP 모티프와 동일하다. 일부 구현예에서, 제2 DLP 모티프는 비구조 단백질에 대한 코딩 서열의 업스트림으로 배치된 제1 DLP 모티프와 상이하다.

일부 구현예에서, 본 개시내용의 핵산 서열은 제3 핵산 서열에 다운스트림으로 그리고 GOI에 대한 코딩 서열에 업스트림으로 작동가능하게 연결된 오토프로테아제 펩타이드에 대한 코딩 서열을 추가로 포함한다. 오토프로테아제 펩타이드는 일반적으로 당업계에서 알려진 임의의 오토프로테아제 펩타이드일 수 있다. 오토프로테아제 펩타이드의 비-제한적인 예는 돼지 테스코바이러스-1 2A (P2A), 구제역 바이러스 (FMDV) 2A (F2A), 말 비염 A 바이러스 (ERAV) 2A (E2A), 토사 아시냐 바이러스 2A (T2A), 세포질 다각체병 바이러스 2A (BmCPV2A), 연화병 바이러스 2A (BmIFV2A), 및 이들의 임의의 조합으로부터의 펩타이드 서열을 포함한다.

추가 양태에서, 본 명세서에서 개시된 일부 구현예는 변형된 비-알파바이러스 RNA 레플리콘을 인코딩하는 핵산 서열을 포함하는 핵산분자에 관한 것으로, 여기서 상기 변형된 비-알파바이러스 RNA 레플리콘은 바이러스성 캡시드 향상제 (예를들어, a DLP 모티프)를 인코딩하는 제1 핵산 서열을 포함함. 일부 구현예에서, 변형된 비-알파바이러스 RNA 레플리콘은 적어도 하나의 비구조적 바이러스성 단백질 또는 이들의 부분을 인코딩하는 제2 핵산 서열을 추가로 포함하고, 여기서 제1 핵산 서열은 제2 핵산 서열에 업스트림으로 작동가능하게 연결된다.

일부 구현예에서, 변형된 비-알파바이러스 RNA 레플리콘은 제1 핵산 서열에 다운스트림으로 그리고 제2 핵산 서열에 업스트림으로 작동가능하게 연결된 오토프로테아제 펩타이드에 대한 코딩 서열을 추가로 포함함. 일부 구현예에서, 변형된 비-알파바이러스 RNA 레플리콘은 양성-가닥 RNA 바이러스의 변형된 RNA 레플리콘을 포함한다. 일부 구현예에서, 변형된 비-알파바이러스 RNA 레플리콘은 음성-가닥 RNA 바이러스의 변형된 RNA 레플리콘을 포함한다.

변형된 비-알파바이러스 RNA 레플리콘의 비-제한적인 예는 토가비리다에 계열, 플라비비리다에 계열, 오토믹소비리다에 계열, 라브도비리다에 계열, 또는 파라믹소비리다에 계열에 속하는 바이러스 종의 변형된 RNA 레플리콘을 포함한다. 따라서, 일부 구현예에서, 변형된 비-알파바이러스 RNA 레플리콘은 음성-가닥 RNA 바이러스의 변형된 RNA 레플리콘을 포함한다. 적합한 음성-가닥 RNA 바이러스 종은, 비제한적으로 계열 오토믹소비리다에, 라브도비리다에 , 및 파라믹소비리다에의 바이러스성 종을 포함한다. 일부 구현예에서, 변형된 비-알파바이러스 RNA 레플리콘은 토가비리다에 계열 또는 플라비비리다에 계열에 속하는 양성-가닥 바이러스 종의 변형된 RNA 레플리콘을 포함한다. 일부 구현예에서, 변형된 비-알파바이러스 RNA 레플리콘은 아테리비리다에 계열의 아테리바이러스 속에 속하는 양성-가닥 바이러스 종의 변형된 RNA 레플리콘을 포함한다. 적합한 아테리바이러스 종은, 비제한적으로, 말 동맥염 바이러스 (EAV), 돼지 호흡 및 생식 증후군 바이러스 (PRRSV), 락테이트 탈수소효소 증진 바이러스 (LDV), 유인원 출혈열 바이러스 (SHFV), 및 우울병 포섬 질환바이러스 (WPDV)의 종을 포함한다.

일부 구현예에서, 비-알파바이러스 변형된 RNA 레플리콘을 인코딩하는 서열은 하나 이상의 발현 카세트를 추가로 포함하고, 여기서 각각의 발현 카세트는 관심 유전자 (GOI)에 대한 코딩 서열에 작동가능하게 연결된 프로모터를 포함한다. 일부 구현예에서, 변형된 비-알파바이러스 RNA 레플리콘은 적어도 2개, 3개, 4개, 5개, 또는 6개의 발현 카세트를 포함한다. 일부 구현예에서, 하나 이상의 발현 카세트 중 적어도 하나는 적어도 하나의 비구조적 바이러스성 단백질 또는 이들의 부분을 인코딩하는 제2 핵산 서열의 다운스트림으로 작동가능하게 연결된다. 일부 구현예에서, 하나 이상의 발현 카세트 중 적어도 하나는 바이러스성 캡시드 향상제의 하나 이상의 구조 요소를 인코딩하는 제3 핵산 서열을 추가로 포함하고, 여기서 상기 제3 핵산 서열은 GOI에 대한 코딩 서열에 업스트림으로 작동가능하게 연결된다. 일부 구현예에서, 변형된 비-알파바이러스 RNA 레플리콘은 제3 핵산 서열에 다운스트림으로 그리고 GOI에 대한 코딩 서열에 업스트림으로 작동가능하게 연결된 오토프로테아제 펩타이드에 대한 코딩 서열을 추가로 포함한다.

본 개시내용의 일부 구현예는 5' －>3' 방향으로 신드비스 바이러스로부터 캡시드 향상제를 인코딩하는 제1 핵산 서열, 오토프로테아제 펩타이드를 인코딩하는 제2 핵산 서열, 및 모든 바이러스성 비구조 단백질을 인코딩하는 제3 핵산 서열을 포함하는 변형된 바이러스성 RNA 레플리콘을 인코딩하는 핵산 서열을 포함하는 핵산분자에 관한 것이다. 본 개시내용의 일부 구현예는 변형된 바이러스성 RNA 레플리콘을 인코딩하는 핵산 서열을 포함하는 핵산분자에 관한 것으로, 여기서 상기 변형된 바이러스성 RNA 레플리콘은 바이러스성 캡시드 향상제를 포함하고 그리고 여기서 상기 변형된 바이러스성 RNA 레플리콘의 서열은 서열번호: 15-18 및 27-29 중 적어도 하나의 서열에 적어도 80% 서열 동일성을 나타낸다.

본 명세서에 제공된 폴리뉴클레오타이드의 변이체가 본 개시내용의 범위 내로 고려된다. 이러한 변이체는, 동일 또는 상이한 종으로부터의 상동성 폴리뉴클레오타이드를 포함하여, 자연발생일 수 있거나, 또는 비-천연 변이체, 예를 들어 화학적 합성 방법을 사용하여 합성되거나, 또는 재조합 DNA 기법을 사용하여 생성된 폴리뉴클레오타이드일 수 있다. 핵산 서열에 관하여, 유전자 암호의 축퇴는 유전자로부터 생산된 폴리펩타이드의 아미노산 서열이 변화되는 것을 야기함이 없이 유전자의 서열을 인코딩하는 단백질의 적어도 하나의 염기가 다른 염기로 치환되는 가능성을 제공한다. 그러므로, 본 개시내용의 핵산분자는 또한 유전자 암호의 축퇴에 따른 치환에 의해 본 명세서에서 개시된 임의의 폴리뉴클레오타이드 서열로부터 변화된 임의의 염기 서열을 가질 수 있다. 코돈 용법을 기술하는 참고문헌은 쉽게 공공연하게 이용가능하다. 추가 구현예에서, 폴리뉴클레오타이드 서열 변이체가 다양한 이유, 예를 들어, 특정 숙주에 대한 코돈 발현을 최적화하기 위해 생산될 수 있다 (예를 들어, 다른 유기체 예컨대 포유동물 또는 물고기 종에 의해 바람직한 것들로 바이러스성 mRNA에서의 코돈 변화).

일부 구현예에서, 본 개시내용의 핵산분자는 5' －>3' 방향으로 신드비스 바이러스로부터 캡시드 향상제를 인코딩하는 핵산 서열, 오토프로테아제 펩타이드를 인코딩하는 핵산 서열, 및 변형된 바이러스성 RNA 레플리콘의 모든 바이러스성 비구조 단백질을 인코딩하는 핵산 서열을 포함한다. 일부 구현예에서, 핵산분자는 5' －>3' 방향으로 5-UTR 서열, 신드비스 바이러스로부터의 제1 캡시드 향상제, 오토프로테아제 펩타이드, 변형된 바이러스성 RNA 레플리콘의 모든 바이러스성 비구조 단백질을 인코딩하는 서열, 하나 이상의 발현 카세트, 및 3'UTR 서열을 포함하고, 여기서 하나 이상의 발현 카세트 중 적어도 하나는 관심 유전자 (GOI)에 대한 코딩 서열의 업스트림으로 작동가능하게 연결된 신드비스 바이러스로부터의 제2 캡시드 향상제를 포함한다.

따라서, 일부 구현예에서, 본 개시내용의 핵산분자는 변형된 바이러스성 RNA 레플리콘을 인코딩하는 핵산 서열을 포함하고, 여기서 상기 서열은 서열번호: 15-18 및 27-29 중 적어도 하나의 서열에 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 나타낸다.

일부 구현예에서, 본 개시내용의 핵산분자는 발현 벡터이다. 일부 구현예에서, 본 발현 벡터는 전사 조절 인자 또는 번역 조절 인자일 수 있는 하나 이상의 추가의 조절 서열을 추가로 포함한다. 본 개시내용에서 상호교환적으로 사용되는 바와 같은 용어들 "조절 인자" 및 "조절 영역"은 전사 또는 번역 개시 및 전사 또는 번역 생산의 속도와 안정성 및/또는 이동도에 영향을 미치는 핵산 서열을 지칭한다. 이러한 조절 인자는 자연 발생 서열의 것일 필요는 없다. 조절 서열은 비제한적으로 프로모터 서열, 향상제 서열, 반응 인자, 단백질 인식 부위, 유도성 요소, 단백질 결합 서열, 5' 및 3' 미번역된 영역 (UTR), 전사 개시 부위, 종결 서열, 폴리아데닐화 서열, 인트론, 및 이들의 조합을 포함한다. 일부 구현예에서, 본 개시내용의 발현 벡터는 하기 중 하나 이상을 추가로 포함한다: 복제의 기원, 호스트 게놈 안으로 발현 카세트의 통합을 촉진하기 위한 하나 이상의 서열, 종결자 서열.

일부 구현예에서, 발현 벡터는 세포에서 복제를 위한 적어도 하나의 기원의 복제 ("ORI") 서열을 포함한다. 본 벡터는 더욱이 선택적으로 하나 이상의 진핵 프로모터의 제어하에서 하나 이상의 선별 마커, 하나 이상의 원핵 프로모터의 제어 하에서 하나 이상의 선별 마커, 및/또는 표적 세포의 게놈 안으로 외인성 핵산 서열의 재조합을 조정하는 하나 이상의 서열을 포함할 수 있다.

ORI는 복제가 시작되는 DNA 분자에서의 서열이다. ORI는 사전-복제 복합체에 대한 어셈블리의 베이스로 작용한다. ORI에 의존하여, 이러한 복제는 단일-방향성으로 또는 2-방향성으로 진행할 수 있다. 본 명세서에서 제공된 바와 같은 발현 벡터는 클로닝 숙주, 예컨대 E. 콜리 또는 효모에서 발현 벡터의 복제에 대한 ORI를 포함할 수 있고, 및/또는 예를 들어, 포유동물 세포일 수 있는 표적 세포에서 발현 벡터의 복제에 대한 ORI를 포함할 수 있다. ORI의 구조 생물학은 원핵 생물, 진핵 생물 및 바이러스 사이에서 널리 보존되어있다. 대부분의 ORI는 단순한 3중, 4중 또는 더 높은 뉴클레오타이드 반복 패턴을 갖는다. 대부분은 AT가 풍부하고 역전된 반복을 함유한다. 당해 분야의 숙련가는 P15A 및 pUC의 ORI와 같은 보다 일반적인 ORI에 익숙할 것이다.

일부 구현예에서, 본 발현 벡터는 또한 선별 마커를 보유한다. 예로써, 발현 카세트를 포함하는 벡터는 선별 마커로서, 항생제, 제초제, 또는 일부 다른 독소와 같이 유독한 물질에 대한 저항성을 부여하는 유전자를 포함할 수 있어, 형질전환체는 세포를 독소에 노출하고, 독소와 만나 살아남은 이들 세포를 선정함에 의해 선택될 수 있다. 일부 구현예에서, 선별 마커는 프로모터의 제어하에 있을 수 있다. 일부 구현예에서, 선별 마커의 발현을 조절하는 프로모터는 조건성 또는 유도성일 수 있다. 일부 구현예에서, 선별 마커의 발현을 조절하는 프로모터는 바람직하게는 구성적일 수 있고, 그리고, 예를 들어, 본 명세서에 기재된 임의의 프로모터 또는 또 다른 프로모터일 수 있다.

일부 구현예에서, 발현 벡터는 플라스미드, 박테리오파아지 벡터, 코스미드, 포스미드, 바이러스성 레플리콘, 셔틀 벡터, 또는 이들의 조합이다. 일부 구현예에서, 발현 벡터는 RNA 레플리콘이다. 일부 구현예에서, 발현 벡터는 원핵 발현 벡터이다. 일부 구현예에서, 발현 벡터는 진핵 발현 벡터이다. 일부 구현예에서, 본 개시내용의 핵산분자는 새로운 합성을 통해 생산된다. 본 개시내용의 일부 구현예에서, 새로운 합성은 합성 mRNA 분자를 생성하기 위해 사용될 수 있다.

재조합 세포

일 양태에서, 본 명세서에서 개시된 일부 구현예는 숙주 세포, 예컨대 동물 세포 안으로, 본 명세서에서 제공된 바와 같은 핵산분자를 도입하는 단계, 및 전환된 세포를 선정 또는 스크리닝하는 단계를 포함하는 세포를 형질전환하는 방법에 관한 것이다. 용어들 "숙주 세포" 및 "재조합 숙주 세포"는 본 명세서에서 상호교환적으로 사용된다. 이러한 용어들은 특정한 대상체 세포뿐만 아니라 그와 같은 세포의 자손 또는 잠재적 자손을 지칭하는 것으로 이해된다. 돌연변이 또는 환경적 영향으로 인해 다음 세대에서 특정 변형이 일어날 수 있기 때문에, 이러한 자손은 사실상, 모세포와 동일하지는 않을 수 있지만, 본 명세서에서 사용된 바와 같은 용어의 범위에 여전히 포함된다. 일부 구현예에서, 본 핵산분자는 전기천공 절차 또는 바이오리스틱 절차에 의해 숙주 세포 안으로 도입된다.

관련된 양태에서, 일부 구현예는 본 명세서에 기재된 핵산분자를 포함하는 재조합 숙주 세포, 예를 들어, 재조합 동물 세포에 관한 것이다. 핵산분자는 호스트 게놈에 안정적으로 통합될 수 있거나, 또는 에피솜상태로 복제될 수 있거나, 또는 재조합 숙주 세포에 안정한 또는 일시적인 발현을 위한 미니-서클 발현 벡터로서 존재할 수 있다. 따라서, 본 명세서에서 개시된 일부 구현예에서, 본 핵산분자는 에피솜 단위로서 재조합 숙주 세포에서 유지되고 복제된다. 일부 구현예에서, 본 핵산분자는 재조합 세포의 게놈 안으로 안정적으로 통합된다. 안정한 통합은 고전적 랜덤 게놈 재조합 기술을 사용하거나 또는 보다 정확한 게놈 편집 기술 예컨대 가이드 RNA 지향된 CRISPR/Cas9, 또는 DNA-유도된 엔도뉴클레아제 게놈 편집 NgAgo (나트로노박테리움 그레고리 아르고노트), 또는 TALEN 게놈 편집 (전사 활성제-유사 효과기 뉴클레아제)을 사용하여 완료될 수 있다. 일부 구현예에서, 본 핵산분자는 안정한 또는 일시적인 발현을 위한 미니-서클 발현 벡터로서 재조합 숙주 세포에 존재한다.

일부 구현예에서, 예를 들어, 숙주 세포는 예를 들어 숙주 세포의 게놈의 일부분에 상동성인 핵산 서열을 포함하는 상동성 재조합을 위한 벡터일 수 있거나, 또는 관심 있는 임의의 유전자 또는 조합의 발현을 위한 발현 벡터일 수 있는 본원의 벡터 작제물로 유전자적으로 조작 (예를 들어 형질도입 또는 전환 또는 형질감염)될 수 있다. 벡터는, 예를 들어, 플라스미드, 바이러스 입자, 파아지, 등의 형태로 될 수 있다. 일부 구현예에서, 관심 있는 폴리펩타이드의 발현을 위한 벡터는 또한, 예를 들어, 상동성 재조합에 의해 숙주 안으로 통합을 위해 설계될 수 있다. 본 명세서에서 기재된 바와 같은 폴리뉴클레오타이드 서열, 예를 들어, 변형된 알파바이러스 게놈 또는 레플리콘 RNA뿐만 아니라, 선택적으로, 선별 마커 또는 리포터 유전자를 포함하는 핵산분자를 함유하는 벡터가 이용되어 적절한 숙주 세포를 형질전환할 수 있다.

본 명세서에서 개시된 방법 및 조성물은, 비제한적으로, 원핵 및 진핵 종을 포함하여 임의의 종의 유전 공학에 대해 전개될 수 있다. 본 개시내용에 따른 조성물 및 방법을 사용하여 변형되는 적합한 숙주 세포는, 비제한적으로, 조류 세포, 박테리아 세포, 부등편모조류, 진균 세포, 항아리 세포, 미세진균, 미세조류, 및 동물 세포를 포함할 수 있다. 일부 구현예에서, 동물 세포는 무척추동물 세포이다. 일부 구현예에서, 척추동물 세포는 포유동물 세포이다. 숙주 세포는 비전환된 세포 또는 적어도 하나의 핵산분자로 이미 형질감염된 세포 중 어느 하나이다.

본 명세서에서 개시된 방법 및 조성물은, 예를 들어 양식, 농업, 축산에 중요하고 흥미로운 대상체 및/또는 숙주 세포와 함께 사용될 수 있고, 및/또는 백신, 의약품, 공산품, 화학물질, 및 기타 동종의 것의 제조에 사용되는 폴리펩타이드의 생산을 포함하여, 치료적 및 의료적 응용에 사용될 수 있다. 일부 구현예에서, 본 명세서에서 개시된 방법 및 조성물은 설치류, 마우스, 물고기, 새, 및 더 큰 포유동물 예컨대 인간, 말, 돼지, 원숭이, 및 유인원뿐만 아니라 무척추동물과 같은 알파바이러스의 천연 숙주인 종으로부터의 숙주 세포와 함께 사용될 수 있다. 적용의 일부 구현예에서, 특히 바람직한 종은 척추동물 종 및 무척추동물 종이다. 원칙적으로, 임의의 동물 종이 일반적으로 사용될 수 있고, 예를 들어, 인간, 개, 새, 물고기, 말, 돼지, 영장류, 마우스, 코튼 랫트, 흰 담비, 소, 돼지, 양, 토끼, 고양이, 염소, 당나귀, 햄스터, 또는 버팔로일 수 있다. 적합한 새 종의 비-제한적인 예는 닭, 오리, 거위, 칠면조, 타조, 에뮤, 백조, 공작, 꿩, 자고, 및 뿔닭을 포함한다. 일부 특정 구현예에서, 물고기는 연어과 계열의 임의의 종이다. 일차 포유동물 세포 및 연속적/불멸화된 세포 유형이 또한 적합하다. 적합한 동물 숙주 세포의 비-제한적인 예는, 비제한적으로, 폐의 말 동맥 내피 세포, 말 진피 세포, 어린 햄스터 신장 (BHK) 세포, 토끼 신장 세포, 마우스 근육 세포, 마우스 결합 조직 세포, 인간 자궁경부 세포, 인간 표피모양 후두 세포, 차이니즈 햄스터 난소 세포 (CHO), 인간 HEK-293 세포, 마우스 3T3 세포, 베로 세포, 메이딘-다비 갯과 신장상피 세포 (MDCK), 일차 닭 섬유아세포, HuT78 세포, A549 폐세포, HeLa 세포, PER.C6® 세포, WI-38 세포, MRC-5 세포, FRhL-2, 및 CEM T-세포를 포함한다. 일부 구현예에서, 숙주 세포는 어린 햄스터 신장 세포이다. 일부 구현예에서, 어린 햄스터 신장 세포는 BHK-21 세포이다.

상기-언급된 다양한 숙주 세포 및 종을 형질전환하는 기술은 당해 기술에 공지되어 있고 기술 및 과학 문헌에 기재되어 있다. 따라서, 본 명세서에서 개시된 바와 같은 적어도 하나의 재조합 세포를 포함하는 세포 배양물은 또한 본원의 범위 이내이다. 세포 배양물을 생성하고 유지하기에 적합한 방법 및 시스템은 당해 기술에 공지되어 있다.

이종성 핵산 서열

본 개시내용의 일부 구현예에 따르면, 다양한 핵산 서열이 본 개시내용의 핵산분자에 수반될 수 있다. 일부 구현예에서, 본 명세서에서 기재된 바와 같은 핵산분자는 임의의 추가의 이종성 핵산 서열을 함유하지 않는다. 일부 구현예에서, 본 개시내용의 핵산분자는 하나 이상의 추가의 이종성 또는 외래 핵산 서열을 함유한다. 일부 구현예에서, 하나 이상의 추가의 이종성 또는 외래 핵산 서열은 관심 유전자 (GOI)에 대한 코딩 서열을 포함한다. 본 명세서에서 개시된 일부 구현예에서, GOI에 대한 코딩 서열은 폴리펩타이드 또는 기능적 RNA를 인코딩한다. 일부 구현예에서, GOI에 대한 코딩 서열은 리보솜 RNA, tRNA, 리보자임, CRISPR 시스템의 전사촉진 (tr) RNA, CRISPR 시스템의 크리스퍼 (cr) RNA, CRISPR 시스템의 키메라 가이드 RNA, 마이크로 RNA, 간섭 RNA (RNAi) 분자, 짧은 헤어핀 (sh) RNA, 또는 안티센스 RNA 분자로부터 선택된 기능성 RNA를 인코딩한다. 일부 구현예에서, GOI에 대한 코딩 서열은 치료적 폴리펩타이드, 예방적 폴리펩타이드, 진단적 폴리펩타이드, 기능식품 폴리펩타이드, 산업 효소, 리포터 폴리펩타이드, 또는 이들의 임의의 조합으로 구성된 군으로부터 선택된 폴리펩타이드를 인코딩한다. 일부 구현예에서, GOI에 대한 코딩 서열은 항체, 항원, 면역 조절제, 및 사이토카인으로 구성된 군으로부터 선택된 폴리펩타이드를 인코딩한다.

일부 구현예에서, 이종성 핵산 서열은 적어도 약 100 염기, 2 kb, 3.5 kb, 5 kb, 7 kb, 또는 8 kb의 이종성 핵산 서열을 포함한다. 이종성 RNA 또는 이종성 핵산 서열은 바이러스, 원핵생물 또는 진핵생물로부터 유래된 다양한 서열로부터 선택될 수 있다. 이종성 서열의 카테고리의 예는, 비제한적으로, 면역원 (선천적, 변형된 또는 합성 항원성 단백질, 펩타이드, 에피토프 또는 면역원성 단편을 포함함), 사이토카인, 독소, 치료적 단백질, 효소, 안티센스 서열, 및 면역반응 조절제를 포함한다.

다양한 GOI는 비제한적으로, 사이토카인, 독소, 전구 약물, 면역 반응을 자극하는 항원, 리보자임, 및 면역 반응을 돕거나 억제하는 단백질뿐만 아니라 안티센스 서열 (또는 "안티센스 적용"을 위한 센스 서열)을 포함한 GOI의 폴리펩타이드를 발현하도록 본 개시내용의 핵산분자에 포함될 수 있다. 전술한 바와 같이, 본 개시내용의 다양한 구현예 내에서 본 명세서에 제공된 변형된 RNA 레플리콘은 관심 있는 두 개 또는 그 초과 폴리펩타이드의 코딩 영역을 함유할 수 있다 (그리고, 일부 구현예에서 발현한다).

1) 사이토카인

본 명세서에서 개시된 일부 구현예에서, GOI는 사이토카인을 인코딩한다. 일반적으로, 사이토카인은 면역 효과기 세포를 증식하고, 활성화하고, 및/또는 분화하는 작용을 한다. 사이토카인의 예는, 비제한적으로 대식세포, B 림프구, T 림프구, 내피 세포, 섬유모세포, 감마 인터페론 유사 림포카인, 종양 괴사 인자, 인터류킨, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL- 1, IL-12, IL-13, IL-14, IL-15, GM-CSF, CSF-1 및 G-CSF를 포함한다.

일부 관련된 구현예에서, GOI는 면역조절 보조인자를 인코딩한다. 본 개시내용의 맥락 내에서 이용된 바와 같이, "면역조절 보조인자"는 면역 반응에 관여된 세포 중 하나 이상에 의해 제조되거나, 또는 세포에 외인성으로 첨가될 때, 보조인자의 부재에서 발생하는 것과 품질 또는 효력에서 상이하게 되는 면역 반응을 야기하는 인자를 지칭한다. 반응의 품질 또는 효력은, 예를 들어, 세포 증식을 측정하는 실험관내 검정 (예를 들어, 3 H 티미딘 흡수) 및 실험관내 세포독성 검정 (예를 들어, 51 Cr 방출을 측정함) (Warner et al., AIDS Res. and Human Retroviruses 7:645-655, 1991 참고)을 포함하여 당해 분야의 숙련가에게 알려진 다양한 검정에 의해 측정될 수 있다.

면역조절 보조인자의 예는, 비제한적으로, 알파 인터페론, 감마 인터페론, G-CSF, GM-CSF, TNFs, 인터류킨-2 (IL-2), IL-4, IL-6, IL-12, IL-15, ICAM-1, ICAM-2, LFA-1, LFA-3, MHC 부류 I 분자, MHC 부류 II 분자, 2 -마이크로글로불린, 차페론, CD3, B7/BB 1, MHC 연결된 수송체 단백질, 및 그것의 유사체를 포함한다.

본 개시내용의 핵산분자 내에 포함되는 면역조절 보조인자의 선택은 보조인자의 알려진 치료적 효과에 기반될 수 있거나, 또는 실험적으로 결정될 수 있다. 예를 들어, 만성 간염 B 감염에서 알파 인터페론은 환자의 면역학적 결손을 보충하고 그것에 의해 질환에서의 회복을 돕는데 유효한 것으로 밝혀졌다. 일부 상황에서, 적합한 면역조절 보조인자는 실험적으로 결정될 수 있다. 간단히, 간질병이 있는 환자로부터 먼저 혈액 샘플이 취해진다. 말초 혈액 림프구 (PBL)가 자가 또는 HLA-매칭된 세포 (예를 들어, EBV 전환된 세포)로 실험실내에서 재자극되고 간염 항원의 면역원성 부분과 면역조절 보조인자의 발현을 지시하는 본 개시내용의 변형된 아테리바이러스 게놈 또는 레플리콘 RNA로 형질도입된다. 자극된 PBL은 표적으로 BLA-매칭된 형질도입된 세포와 함께 CTL 검정에서 효과기로서 사용된다. 항원 단독을 인코딩하는 벡터로 형질도입된 표적 세포와 HLA-매칭된 자극 인자를 사용하여 수행된 동일한 검정에서 나타난 것에 비하여 CTL 반응에서의 증가는 유용한 면역조절 보조인자를 나타낸다. 일부 구현예에서, 면역조절 보조인자 감마 인터페론이 특히 바람직하다.

면역조절 보조인자의 또 다른 비-제한적인 예는 B7/BB1 공동자극 인자이다. T 세포의 전체 기능적 활성의 활성화는 2개의 신호를 필요로 한다. 일 신호는 주 조직적합성 복합체 (MHC) 분자에 결합된 펩타이드와 항원-특이적 T 세포 수용체의 상호작용에 의해 제공되고, 그리고 상호자극으로 지칭되는 제2 신호는 항원-제시 세포에 의해 T 세포로 전달된다. 상기 제2 신호는 T 세포에 의한 인터류킨-2 (IL-2) 생산을 위해 필요하고 T 림프구 상의 CD28 및 CTLA-4 수용체와 항원-제시 세포 상의 B7/BB 1 분자의 상호작용을 포함하는 것으로 보인다. 일부 구현예에서, B7/BB 1은 CD8+T 세포가 충분한 IL-2를 생산하여 팽창되고 완전하게 활성화되도록 CD8+T 세포의 상호자극을 야기하기 위해 종양 세포안으로 도입될 수 있다. 이들 CD8+T 세포는 상호자극이 추가의 CTL 기능을 위해 더 이상 필요하지 않기 때문에 B7을 발현하지 않는 종양 세포를 사멸시킬 수 있다. 공동자극 B7/BB1 인자 및, 예를 들어, 면역원성 HBV 코어 단백질 둘 모두를 발현하는 벡터는 본 명세서에 기재되어 있는 방법을 이용하여 구축될 수 있다. 이들 벡터로 형질도입된 세포는 더 효과적인 항원-제시 세포가 될 것이다. HBV 코어-특이적 CTL 반응은 공동자극 리간드 B7/BB 1을 통해 완전하게 활성화된 CD8+T 세포로부터 증강될 것이다.

2) 독소

본 명세서에서 개시된 일부 구현예에서, GOI는 독소를 인코딩한다. 일부 구현예에서, 독소는 세포의 성장을 직접적으로 억제하는 작용을 한다. 독소의 예는, 비제한적으로, 리신, 아브린, 디프테리아 독소, 콜레라 독소, 젤로닌, 미국자리공, 항바이러스 단백질, 트리틴, 시겔라 독소, 슈도모나스 외독소 A, 단순 포진 바이러스 티미딘 키나제 (HSVTK), 및 E. 콜리 구아닌 포스포리보실 전달효소를 포함한다.

3) 전구약물

본 명세서에서 개시된 일부 구현예에서, GOI는 "전구약물"을 인코딩한다. 본 개시내용의 맥락 내에서 이용된 바와 같이, "전구약물"은 세포 독성이 거의 또는 전혀 없는 화합물을 독성 생성물로 활성화시키는 유전자 산물을 지칭한다. 이러한 유전자 산물의 대표적인 예는 HSVTK 및 VZVTK (뿐만 아니라 그것의 유사체 및 유도체)를 포함하여, 이것은 특정 퓨린 아라비노시드 및 치환된 피리미딘 화합물을 선택적으로 단일 인산화하여, 이들을 세포독성 또는 세포증식 억제성 대사물로 전환시킨다. 더 구체적으로, HSVTK에 약물 강시클로비르, 아사이클로비르, 또는 임의의 그것의 유사체 (예를 들어, FIAU, FIAC, 및 DHPG)의 노출은 상기 약물을 그것의 상응하는 활성 뉴클레오타이드 삼인산 형태로 인산화한다.

본 개시내용의 맥락 내에서 이용될 수 있는 전구약물의 비-제한적인 예는 하기를 포함한다: 티오잔틴을 독성 티오잔틴 모노포스페이트로 전환시키는 E. 콜리 구아닌 포스포리보실 전달효소; 불활성 인산화된 화합물 예컨대 미토마이신 포스페이트 및 독소루비신-포스페이트를 독성 탈인산화된 화합물로 전환시킬, 알칼리성 포스파타제; 5-플루오로시토신을 독성 화합물 5-플루오로우라실로 전환시키는, 진균 (예를 들어, 푸사리움 옥시스포럼) 및 박테리아 시토신 데아미나제; 파라-N-비스 (2-클로로에틸) 아미노벤조일 글루탐산으로부터 글루탐산을 단리하고, 그것에 의해 독성 벤조산 머스타드를 생성하는, 카복시펩티다아제 G2; 및 독소루비신 및 멜팔란의 페녹시아세타비드 유도체를 독성 화합물로 전환시킬, 페니실린-V 아미다아제.

4) 안티센스 서열

본 명세서에서 개시된 일부 구현예에서, GOI에 대한 코딩 서열은 안티센스 서열이다. 안티센스 서열은 RNA 전사체에 결합하도록 설계되어, 그것에 의해 특정 단백질의 세포 합성을 방지하거나 또는 세포에 의한 그 RNA 서열의 사용을 방지한다. 이러한 서열의 비-제한적인 예는 안티센스 티미딘 키나제, 안티센스 디하이드로폴레이트 환원효소, 안티센스 HER2, 안티센스 ABL, 안티센스 Myc, 안티센스 ras, 뿐만아니라 뉴클레오타이드 생합성 경로에서 임의의 효소를 차단하는 안티센스 서열을 포함한다. 또한, 본 명세서에서 개시된 일부 구현예에 따르면, 면역 반응을 감소시키기 위해 인터페론 및 2 마이크로글로불린에 대한 안티센스 서열이 이용될 수 있다.

일부 구현예에서, 안티센스 RNA는 강력한 부류 I 제한된 반응을 유도하기 위해 항종양 제제로서 이용될 수 있다. RNA 결합과 그것에 의해 특이적 mRNA의 번역을 방지하는 것에 부가하여, 특이적 안티센스 서열의 높은 수준은 이중-가닥 RNA의 많은 양의 형성에 기인하여 인터페론 (감마-인터페론을 포함함)의 증가된 발현을 유도하는 것으로 여겨진다. 감마 인터페론의 증가된 발현은, 차례로, MHC 부류 I 항원의 발현을 증가한다. 이와 관련하여 사용하기에 바람직한 안티센스 서열은 액틴 RNA, 미오신 RNA, 및 히스톤 RNA를 포함한다. 액틴 RNA와 미스매치를 형성하는 안티센스 RNA가 특히 바람직하다.

5) 리보자임

본 명세서에서 개시된 일부 구현예에서, 숙주세포의 감염 시 리보자임을 생산하는 하나 이상의 RNA 스템-루프 구조를 포함하는 핵산분자가 제공된다. 리보자임은 특이적 RNA을 단리하기 위해 사용되고, 단지 하나의 특이적 RNA 서열에만 영향을 줄 수 있도록 설계된다. 일반적으로, 리보자임의 기질 결합 서열은 10 내지 20 뉴클레오타이드 길이이다. 이 서열의 길이는 표적 RNA와 하이브리드화 및 절단된 RNA로부터 리보자임의 분해를 허용하기에 충분하다. 리보자임을 만드는 대표적인 예는 미국 특허 번호 5,116,742; 5,225,337 및 5,246,921에 기재된 것들을 포함한다.

6) 단백질 및 다른 세포 구성성분

본 명세서에서 개시된 일부 구현예에서, 다양한 단백질 또는 다른 세포 구성성분은 본 개시내용의 핵산분자를 담지할 수 있다. 이러한 단백질의 비-제한적인 예는 선천적 또는 변화된 세포성분뿐만 아니라, 예를들어,바이러스, 박테리아, 기생충, 진균 또는 동물 예컨대 포유동물에서 발견되는 외래 단백질 또는 세포 구성성분을 포함한다.

폴리펩타이드를 생산하는 방법

본 개시내용의 숙주 세포, 예컨대 원핵 또는 진핵생물 숙주 세포가 관심 있는 분자 예컨대, 예를 들어, 본 명세서에서 개시된 바와 같은 관심 유전자 (GOI)의 열린 해독틀에서 인코딩된 폴리펩타이드를 생산하기 위해 (예를 들어, 발현하기 위해) 사용될 수 있다. 따라서, 본원은 본 개시내용의 숙주세포 및/또는 핵산분자를 사용하여 관심 있는 분자 예컨대, 예를 들어, 폴리펩타이드를 생산하는 방법을 추가로 제공한다. 숙주 세포는, 예를 들어, 단리된 세포, 세포 배양에서의 세포, 살아있는 신체에서의 세포, 또는 이들의 조합일 수 있다.

본 명세서에서 개시된 일부 구현예는 관심 있는 폴리펩타이드를 생산하는 방법을 제공한다. 상기 방법은 숙주 세포 안으로 본 개시내용의 임의의 하나의 양태 및 구현예에 따른 핵산분자의 도입과, 그것에 의해 상기 숙주 세포에서 GOI에 의해 인코딩된 폴리펩타이드를 생산하는 것을 포함할 수 있다. 일부 구현예에서 도입된 핵산분자는 RNA 분자, 예를 들어 mRNA 분자 또는 RNA 레플리콘이다. RNA 분자는 당해 분야에 알려진 임의의 방법, 예를 들어 전체적으로 또는 부분적으로 새로운 합성에 의해 생성될 수 있다. 예를 들어, 비제한적으로 mRNA 분자 및 RNA 레플리콘을 포함한 RNA 분자는 화학적 방법, 효소적 기술, 또는 이들의 임의의 조합을 사용하여, 예를 들어, (예컨대 올리고뉴클레오타이드로) 드노보 어셈블리를 통한 화학적 합성 또는 (적절한 효소, 완충액, 뉴클레오타이드, 등을 사용한) 시험관내 전사 반응에 의해 생산될 수 있다. 도입된 핵산분자가 mRNA인 일부 사례에서, mRNA는 세포에서 관심 있는 폴리펩타이드 (예를 들어, 약물, 항원, 등)를 생산하기 위해 생체내 세포로 직접적으로 전달될 수 있다. 세포는 단리된 세포; 세포 배양물에서의 세포; 조직, 장기, 및/또는 대상체에서의 세포; 또는 이들의 임의의 조합일 수 있다. 일부 구현예에서, 세포에서 신규한 mRNA 복제본이 만들어 지지 않는다, 본 명세서에서 개시된 바와 같이, 화학적으로 합성된 RNA 안으로 바이러스성 캡시드 향상제 (예를들어, DLP 모티프)로부터의 하나 이상의 RNA 스템-루프의 편입은 일단 DLP-함유 mRNA가 세포 안으로 도입되면 유전자 발현의 의도된 향상을 부여할 수 있다.

도입된 핵산분자가 벡터 예컨대, 예를 들어, RNA 레플리콘인 일부 구현예에서, 하나 이상의 DLP 모티프에 작동가능하게 연결된 관심 유전자에 대한 코딩 서열을 포함하는 신규한 mRNA 복제본이 생성될 수 있다. 벡터, 예를 들어, RNA 레플리콘 안으로 하나 이상의 DLP 모티프의 편입은 그런 다음 일단 DLP-함유 벡터 또는 레플리콘이 세포 안으로 도입되면 유전자 발현의 의도된 향상을 부여할 수 있다.

본 명세서에서 개시된 일부 구현예는 숙주 세포에서 관심 있는 폴리펩타이드를 생산하는 방법을 제공한다. 그와 같은 방법은 본 개시내용의 임의의 하나의 양태 및 구현예에 따른 핵산분자를 포함한 재조합 숙주 세포의 배양을 포함한다. 일부 구현예에서, 본 방법은 관심 있는 분자가 생산되도록 적합한 배지에서 (관심 있는 분자를 인코딩하는 재조합 발현 벡터가 그 안으로 도입된) 본 개시내용의 숙주 세포를 배양하는 것을 포함한다. 일부 구현예에서, 본 방법은 추가로 상기 배지 또는 숙주 세포로부터 관심 있는 분자를 분리하는 것을 포함한다.

또한 임의의 하나의 양태 및 구현예에 따른 핵산분자를 대상체에게 투여하는 것을 포함하는 상기 대상체에서 관심 있는 폴리펩타이드를 생산하는 방법이 개시된다.

본 명세서에서 개시된 방법 및 조성물에 사용하기 위한 적합한 숙주 세포 및/또는 대상체는, 비제한적으로, 원핵 및 진핵 종을 포함한다. 본 개시내용에 따른 조성물 및 방법을 사용하여 변형되기에 적합한 숙주 세포는, 비제한적으로, 조류 세포, 박테리아 세포, 부등편모조류, 진균 세포, 항아리 세포, 미세진균, 미세조류, 및 동물 세포를 포함할 수 있다. 일부 구현예에서, 동물 세포는 무척추동물 세포이다. 일부 구현예에서, 척추동물 세포는 포유동물 세포이다. 숙주 세포는 비전환된 세포 또는 적어도 하나의 핵산분자로 이미 형질감염된 세포 중 어느 하나일 수 있다. 따라서, 임의의 하나의 양태 및 구현예에 따른 재조합 세포의 생물학적 샘플, 바이오매스, 및 자손은 또한 본원의 범위 이내이다. 따라서, 아래에 더 상세히 논의된 바와 같이, 본원의 이 양태에 따른 방법에 의해 생산된 폴리펩타이드도 또한 본원의 범위 이내이다.

일부 구현예에서, 재조합 세포는 동물 세포이다. 작은 규모 및 대규모로 치료적 단백질 생산은 동물 세포에서 생산된 단백질이 일반적으로 적절한 가공, 번역 후 변형을 가지고 따라서 생리적 병태의 치료에 대해 적절한 활성을 가지는 것으로 여겨지기 때문에 약제학적 산업에서의 발달의 중요한 분야이다. 원칙적으로, 임의의 동물 종이 일반적으로 사용될 수 있고, 예를 들어, 인간, 개, 새, 물고기, 말, 돼지, 영장류, 마우스, 코튼 랫트, 흰 담비, 소, 돼지, 양, 토끼, 고양이, 염소, 당나귀, 햄스터, 또는 버팔로일 수 있다. 적합한 새 종의 비-제한적인 예는 닭, 오리, 거위, 칠면조, 타조, 에뮤, 백조, 공작, 꿩, 자고, 및 뿔닭을 포함한다. 일부 특정 구현예에서, 물고기는 연어과 계열의 임의의 종이다. 일차 포유동물 세포 및 연속적/불멸화된 세포 유형이 또한 적합하다. 적합한 동물 숙주 세포의 비-제한적인 예는, 비제한적으로, 폐의 말 동맥 내피 세포, 말 진피 세포, 어린 햄스터 신장 (BHK) 세포, 토끼 신장 세포, 마우스 근육 세포, 마우스 결합 조직 세포, 인간 자궁경부 세포, 인간 표피모양 후두 세포, 차이니즈 햄스터 난소 세포 (CHO), 인간 HEK-293 세포, 마우스 3T3 세포, 베로 세포, 메이딘-다비 갯과 신장상피 세포 (MDCK), 일차 닭 섬유아세포, HuT78 세포, A549 폐세포, HeLa 세포, PER.C6® 세포, WI-38 세포, MRC-5 세포, FRhL-2, 및 CEM T-세포를 포함한다. 일부 구현예에서, 숙주 세포는 어린 햄스터 신장 세포이다. 일부 구현예에서, 어린 햄스터 신장 세포는 BHK-21 세포이다.

재조합 폴리펩타이드

본 명세서에서 개시된 일부 구현예는 본 명세서에서 기재된 하나 이상의 구현예에 따른 방법에 의해 생산된 재조합 폴리펩타이드에 관한 것이다. 본원의 재조합 폴리펩타이드는 일반적으로 임의의 재조합 폴리펩타이드일 수 있고, 예를 들어, 치료적 폴리펩타이드, 예방적 폴리펩타이드, 진단 폴리펩타이드, 기능식품 폴리펩타이드, 산업효소, 및 리포터 폴리펩타이드 중 하나 이상일 수 있다. 일부 구현예에서, 재조합 폴리펩타이드는 항체, 항원, 면역 조절제, 및 사이토카인 중 하나 이상일 수 있다. 일부 구현예에서, 관심 있는 폴리펩타이드는 치료적 또는 예방적 활성을 가질 수 있다.

조성물 및 제형

본 명세서에서 개시된 일부 구현예는 본 명세서에 기재된 임의의 재조합 폴리펩타이드를 포함하는 조성물에 관한 것이다. 본 조성물은, 예를 들어, 기능식품 조성물, 예방적 조성물, 약제학적으로 허용가능한 담체를 포함하는 약제학적 조성물, 또는 이들의 혼합물일 수 있다. 일부 구현예에서, 본원의 조성물은 백신으로서 사용될 수 있다.

본 명세서에서 개시된 일부 구현예는 본 명세서에 기재된 임의의 핵산분자 (예를 들어, 발현 벡터)를 포함하는 조성물에 관한 것이다. 본 조성물은, 예를 들어, 기능식품 조성물, 예방적 조성물, 약제학적으로 허용가능한 담체를 포함하는 약제학적 조성물, 또는 이들의 혼합물일 수 있다. 일부 구현예에서, 본원의 조성물은 백신으로서 사용될 수 있다.

본 명세서에서 개시된 일부 구현예는 본 명세서에 기재된 임의의 재조합 세포를 포함하는 조성물에 관한 것이다. 본 조성물은, 예를 들어, 기능식품 조성물, 예방적 조성물, 약제학적으로 허용가능한 담체를 포함하는 약제학적 조성물, 또는 이들의 혼합물일 수 있다. 일부 구현예에서, 본원의 조성물은 백신으로서 사용될 수 있다.

본 명세서에서 사용된 바와 같이, 용어 "약제학적으로-허용가능한 담체"는 일반적으로 안전하고, 무독성이고, 그리고 생물학적으로도 또는 달리는 바람직하지 않지도 않고, 그리고 수의적 용도뿐만 아니라 인간 약제학적 용도에 허용가능한 담체를 포함하는 약제학적 조성물 또는 제형을 제조하는데 유용한 담체를 의미한다. 일부 구현예에서, 약제학적으로 허용가능한 담체는 간단하게는 물이지만, 또한, 예를 들어, 생리적 염 농도의 용액을 포함할 수 있다. 일부 구현예에서, 약제학적으로 허용가능한 담체는 안정화제, 희석제 및 완충액일 수 있거나 또는 포함할 수 있다. 적합한 안정화제는 예를 들어 SPGA, 탄수화물 (예컨대 건조된 밀크, 혈청 알부민 또는 카세인) 또는 이들의 열화 생성물이다. 적합한 완충액은 예를 들어 알칼리금속 포스페이트이다. 희석제는 물, 수성 완충액 (예컨대 완충 식염수), 알코올 및 폴리올 (예컨대 글리세롤)을 포함한다. 동물 또는 인간에 투여를 위해, 본원에 따른 조성물은 특히 분무에 의해 비강내로, 진피내로, 피하로, 에어로졸에 의해 경구로, 근육내로, 또는 이들의 임의의 조합을 포함하여, 임의의 장관 또는 비경구 경로로 주어질 수 있다.

일부 구현예에서, 본 개시내용의 핵산분자 (예를 들어, mRNA 및/또는 발현 벡터), 단백질분자, 및/또는 조성물은 적합한 제형, 예를 들어 약제학적 제형으로 된다. 약제학적으로 허용가능한 비히클에 본 명세서에서 개시된 분자 및/또는 조성물 중 하나 이상을 함유하는 약제학적 제형이 본 명세서에 제공된다. 본 개시내용의 일부 구현예는 본 명세서에서 개시된 발현 벡터 중 하나 이상을 함유하는 약제학적 제형에 관한 것이다. 본 개시내용의 일부 구현예는 본 명세서에서 개시된 핵산분자 중 하나 이상을 함유하는 약제학적 제형에 관한 것이다. 본 개시내용의 일부 구현예는 본 명세서에서 개시된 폴리펩타이드 중 하나 이상을 함유하는 약제학적 제형에 관한 것이다. 본 개시내용의 일부 구현예는 본 명세서에서 개시된 재조합 세포 중 하나 이상을 함유하는 약제학적 제형에 관한 것이다.

본 명세서에서 개시된 분자 (예를 들어, 단백질 및 핵산분자) 및 조성물은 다양한 제형, 예 를들어 약제학적 제형으로 될 수 있다. 예를 들어, 본 개시내용의 핵산분자 (예를 들어, 레플리콘, mRNA 및 발현 벡터), 단백질 분자, 및/또는 조성물은 하나 이상의 공유 화합물 (예를 들어, 직접적인 연결을 통해), 비-공유 화합물 (예를 들어, LNP 또는 양이온성 나노-에멀션으로부터 하전 기반 회합), 물리적 조성물 (예를들어, 볼트 단백질, 비-하전 지질 캡슐화), 약제학적으로 허용가능한 완충액 (예를 들어, 염수, 락테이트화된 링거), 및 이들의 임의의 조합과, 예를 들어 약제학적 제형으로, 제형화될 수 있다. 전술한 약제학적 제형을 생성하는데 적합한 많은 방법, 시약, 및 시스템이 당해 기술에 공지되어 있다.

일부 구현예에서, 본 명세서에서 개시된 분자 및/또는 조성물은 염수 또는 지질 제형으로 제형화된다. 지질 제형은, 비제한적으로, 리포좀, 리포플렉스, 공중합체 예컨대 PLGA, 및 지질 나노입자로부터선택될 수 있다.

입자 및 나노입자

일부 구현예에서, 본 명세서에서 개시된 핵산분자, 폴리펩타이드 분자, 및/또는 조성물 중 하나 이상이 입자 또는 나노입자 안으로 편입될 수 있다. 본 명세서에서 개시된 분자 및 조성물 중 하나 이상을 포함하는 입자는 중합체 입자, 지질 입자, 고형 지질 입자, 자기-조립된 입자, 콘주게이트 인지질의 복합체 나노 입자, 계면활성제, 단백질, 폴리아미노산, 무기 입자, 또는 이들의 조합 (예를 들어, 지질 안정화된 중합체 입자)일 수 있다. 일부 구현예에서, 본 명세서에서 개시된 분자 및/또는 조성물은 입자에서 실질적으로 캡슐화 또는 부분적으로 캡슐화된다. 일부 구현예에서, 본 명세서에서 개시된 분자 및/또는 조성물은 입자의 표면상에 침착 및/또는 흡수된다. 일부 구현예에서, 본 명세서에서 개시된 분자 및/또는 조성물은 입자에 편입된다. 일부 구현예에서, 본 명세서에서 개시된 분자 및/또는 조성물은 입자의 일부 또는 입자의 성분이다. 본 개시내용의 분자 및/또는 조성물은, 일부 구현예에서, 공유결합, 또는 비-공유 상호작용으로 입자의 표면에 부착될 수 있다. 일부 구현예에서, 본 개시내용의 분자 및/또는 조성물은 입자 안으로 자기-조립한다.

본 명세서에서 사용된 바와 같이, 용어 "캡슐화되다"는 봉입되거나, 둘러싸이거나 또는 케이스에 넣는 것을 의미한다. 본 개시내용의 분자 및/또는 조성물의 제형에 관련하여, 캡슐화는 실질적인, 완전한 또는 부분적인 것일 수 있다. 용어 "실질적으로 캡슐화된"은 본 개시내용의 분자 및/또는 조성물의 적어도 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.9%, 99.99%, 또는 99.999% 초과가 입자 내에 봉입되거나, 둘러싸이거나 또는 케이스에 넣어 질 수 있다는 것을 의미한다. "부분적으로 캡슐화"는 본 개시내용의 분자 및/또는 조성물의 10%, 15%, 20%, 30%, 40%, 50% 미만이 입자 내에 봉입되거나, 둘러싸이거나 또는 케이스에 넣어 질 수 있다는 것을 의미한다. 예를 들어, 본 개시내용의 분자 및/또는 조성물의 적어도 1%, 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.9%, 99.99%, 또는 99.999%가 입자에 캡슐화된다. 캡슐화는 임의의 알려진 방법에 의해 결정될 수 있다.

일부 구현예에서, 입자는 중합체 입자이거나 또는 중합체 매트릭스를 함유한다. 입자는 일반적으로 당 업계에서 알려진 임의의 폴리머를 함유할 수 있다. 입자는 일반적으로 하나 이상의 생체적합성 폴리머를 함유할 것이다. 폴리머는 생분해성 폴리머일 수 있다. 폴리머는 소수성 폴리머, 친수성 폴리머, 또는 양친매성 폴리머일 수 있다. 일부 구현예에서, 입자는 여기에 부착된 추가의 표적화 모이어티를 갖는 하나 이상의 폴리머를 함유한다. 일부 구현예에서, 입자는 무기 입자, 예컨대 비제한적으로, 금 나노입자 및 산화철 나노입자이다.

입자의 크기는 의도된 적용에 대해 조정될 수 있다. 입자는 나노입자 또는 극미립자일 수 있다. 입자는 약 10 nm 내지 약 10 마이크론, 약 10 nm 내지 약 1 마이크론, 약 10 nm 내지 약 500 nm, 약 20 nm 내지 약 500 nm, 또는 약 25 nm 내지 약 250 nm의 직경을 가질 수 있다. 일부 구현예에서 입자는 직경 약 25 nm 내지 약 250 nm를 갖는 나노입자이다. 일부 구현예에서, 입자는 직경 약 50 nm 내지 약 150 nm를 갖는 나노입자이다. 일부 구현예에서, 입자는 직경 약 70 nm 내지 약 130 nm를 갖는 나노입자이다. 일부 구현예에서, 입자는 약 100 nm의 직경을 갖는 나노입자이다. 복수의 입자는 크기의 범위를 가질 것이고, 직경은 입자 크기 분포의 중앙 직경으로 이해된다는 것이 당해 기술의 숙련가에 의해 이해된다.

일부 구현예에서, 본 명세서에서 개시된 분자 및/또는 조성물은 온도, pH, 및 이온성 조건에 대해 반응성인 입자 안으로 편입될 수 있다. 예를 들어, 입자는 공유적으로 가교결합된 단일중합체 이온화가능 단량체의 이온화가능 네트워크를 포함할 수 있고 여기서 상기 이온화가능 네트워크는 양친매성 공중합체의 단일 말단 영역에 공유결합되어 복수의 "현수 사슬"을 형성하고 여기서 상기 양친매성 공중합체의 "현수 사슬"은 미국 특허 번호 7,204,997에서 개시된 바와 같이, 수용액에서 불가동 인트라-네트워크 응집체를 형성한다.

리포좀 , 리포플렉스 , 및 지질 나노입자 ( LNP )

본 개시내용의 분자 및/또는 조성물은 하나 이상의 리포좀, 리포플렉스, 및/또는 지질 나노입자를 사용하여 제형화될 수 있다. 일 구현예에서, 본 개시내용의 분자 및/또는 조성물의 약제학적 제형은 리포좀을 포함한다. 리포좀은 지질 이중층으로 주로 구성될 수 있고 영양소 및 약제학적 제형의 투여를 위한 전달 비히클로서 사용될 수 있는 인공적으로-제조된 소포이다. 리포좀은 상이한 크기의 것, 예컨대, 비제한적으로, 직경이 수백 나노미터일 수 있고 그리고 좁은 수성 구획에 의해 분리된 일련의 동심성 이중층을 함유할 수 있는 다중층 소포 (MLV), 직경이 50 nm보다 더 작을 수 있는 작은 단세포 소포 (SUV), 및 직경이 50 내지 500 nm 사이일 수 있는 큰 단일 라멜라 소포 (LUV)일 수 있다. 리포좀 디자인은, 비제한적으로, 건강하지 않은 조직에 리포좀의 부착을 개선하거나 또는 사건 예컨대, 비제한적으로, 세포내이입을 활성화시키기 위해 옵소닌 또는 리간드를 포함할 수 있다. 리포좀은 약제학적 제형의 전달을 개선하기 위해 낮은 또는 높은 pH를 함유할 수 있다.

리포좀의 형성은 물리화학적 특성 예컨대, 비제한적으로, 포획된 약제학적 제형 및 리포좀 성분, 지질 소포가 분산되는 배지의 특성, 포획된 서브스턴스의 효과적인 농도 및 그것의 포텐셜 독성, 소포의 적용 및/또는 전달 동안 관여된 임의의 추가의 공정, 최적화 크기, 의도된 적용을 위한 소포의 다분산도 및 저장 수명, 및 안전하고 효율적인 리포좀 생성물의 배치-대-배치 재현성과 대규모 생산의 가능성에 의존할 수 있다.

일부 구현예에서, 본 개시내용의 분자 및/또는 조성물은 작용화된 지질 이중층 사이에 가교결합을 가질 수 있는 지질 소포에서 제형화될 수 있다. 일부 구현예에서, 본 개시내용의 분자 및/또는 조성물은 지질-다중 양이온 복합체에서 제형화될 수 있다. 지질-다중 양이온 복합체의 형성은 당해 분야에서 알려진 방법에 의해 달성될 수 있다. 비제한적인 예로서, 다중 양이온은 양이온성 펩타이드 또는 폴리펩타이드 예컨대, 비제한적으로, 폴리라이신, 폴리오르니틴 및/또는 폴리아르기닌 및 양이온성 펩타이드를 포함할 수 있다. 일부 구현예에서, 본 명세서에서 개시된 핵산분자 및/또는 조성물은 중성 지질 예컨대, 비제한적으로, 콜레스테롤 또는 디올레오일 포스파티딜에탄올아민 (DOPE)을 추가로 포함할 수 있는 지질-다중 양이온 복합체에서 제형화될 수 있다. 리포좀 제형은, 비제한적으로, 양이온성 지질 성분의 선택, 양이온성 지질 포화도, 페길화의 특성, 모든 성분 및 생체물리학적 파라미터 예컨대 크기의 비에 의해 영향을 받을 수 있다.

일부 구현예에서, 지질 나노입자 (LNP) 제형에서 PEG의 비는 증가될 수 있거나 또는 줄어들 수 있고, 및/또는 PEG 지질의 탄소 사슬 길이는 C14로부터 C18로 변형될 수 있어 LNP 제형의 약동학 및/또는 체내 분포를 변화시킨다. 비제한적인 예로서, LNP 제형은 양이온성 지질, DSPC 및 콜레스테롤에 비교하여 PEG-c-DOMG의 1-5%의 지질 몰비를 함유할 수 있다. 또 다른 구현예에서, PEG-c-DOMG는 PEG 지질 예컨대, 비제한적으로, PEG-DSG (1,2-디스테아로일-sn-글리세롤, 메톡시폴리에틸렌 글리콜) 또는 PEG-DPG (1,2-디팔미토일-sn-글리세롤, 메톡시폴리에틸렌 글리콜)로 대체될 수 있다. 양이온성 지질은, 비제한적으로, DLin-MC3-DMA, DLin-DMA, C12-200, 및 DLin-KC2-DMA와 같은 당업계에서 알려진 임의의 지질로부터 선택될 수 있다.

일부 구현예에서, 본 명세서에서 기재된 LNP 제형은 다중양이온성 조성물을 포함할 수 있다. 일부 구현예에서, 다중양이온성 조성물을 포함하는 LNP 제형은 생체내 및/또는 실험실내에서 본 명세서에서 기재된 변형된 RNA의 전달을 위해 사용될 수 있다. 일부 구현예에서, 본 명세서에 기재된 LNP 제형은 추가로 투과성 향상제 분자를 포함할 수 있다. 나노입자 제형은 탄수화물 담체 및 변형된 핵산분자 (예를들어, mRNA)를 포함하는 탄수화물 나노입자일 수 있다. 비제한적인 예로서, 탄수화물 담체는, 비제한적으로, 무수물-변형된 파이토글리코겐 또는 글리코겐-형 물질, 파이토글리코겐 옥테닐 석시네이트, 파이토글리코겐 베타-덱스트린, 및 무수물-변형된 파이토글리코겐 베타-덱스트린을 포함할 수 있다.

지질 나노입자 제형은 빠르게 제거된 지질 나노입자 (reLNP)로 알려진 생분해성 양이온성 지질로 양이온성 지질을 대체함에 의해 개선될 수 있다. 이온화가능 양이온성 지질, 예컨대, 비제한적으로, DLinDMA, DLin-KC2-DMA, 및 DLin-MC3-DMA는 혈장 및 조직에서 경시적으로 축적하는 것으로 밝혀졌고, 그리고 독성의 잠정적인 공급원일 수 있다. 빠르게 제거된 지질의 신속한 대사는 랫트에서 1 mg/kg 용량부터 10 mg/kg 용량까지의 크기 정도로 지질 나노입자의 내성 및 치료 지수를 개선할 수 있다. 효소적으로 분해된 에스테르 결합의 함입은 reLNP 제형의 활성을 여전히 유지하면서 양이온성 성분의 열화 및 대사 프로파일을 개선할 수 있다. 에스테르 결합은 지질 사슬 내에 내부적으로 위치될 수 있거나 또는 이것은 지질 사슬의 말단에서 말단으로 위치할 수 있다. 내부 에스테르 결합은 지질 사슬에서 임의의 탄소를 대체할 수 있다.

LNP 제형에 대해 적합한 양이온성 지질에 관한 추가의 정보는, 예를 들어, 본 명세서에 전체적으로 참고로 편입되는. 미국 공개 번호 US2017/0151339에서 발견될 수 있다.

본 개시내용의 분자 및/또는 조성물은 또한 폴리머, 지질, 및/또는 다른 생분해성 제제, 예컨대, 비제한적으로, 인산 칼슘의 조합을 사용하여 나노입자로 제형화될 수 있다. 본 성분은 나노입자의 미세한-조정을 가능하게 하는 코어-쉘, 하이브리드, 및/또는 층별 구조에 조합될 수 있어, 본 개시내용의 분자 및/또는 조성물의 전달이 향상될 수 있다.

본 개시내용의 약제학적 제형은, 본 명세서에서 사용된 바와 같이, 원하는 특정한 투약 형태에 적합하게, 임의의 및 모든 용매, 분산매, 희석제, 또는 다른 액체 비히클, 분산물 또는 현탁액 보조제, 계면활성제, 등장제, 증점 및 유화제, 보존제, 고형결합제, 윤활제, 및 동종의 것을 포함하는, 하나 이상의 약제학적으로 허용가능한 부형제를 추가로 포함할 수 있다. 이와 관련하여 보다 많은 정보는 문헌 [Remington's The Science and Practice of Pharmacy, 21st Edition, A. R. Gennaro (Lippincott, Williams & Wilkins, Baltimore, Md., 2006)]에서 발견될 수 있고 이것은 약제학적 조성물을 제형화하는데 사용된 다양한 부형제와 이들의 조제에 대한 알려진 기술을 개시한다. 임의의 통상적인 부형제 배지가 임의의 바람직하지 않은 생물학적 효과를 생성하거나 또는 달리는 유해한 방식으로 약제학적 조성물의 임의의 다른 성분(들)과 상호작용함에 의해서와 같이, 물질 또는 그것의 유도체와 양립불가능한 경우를 제외하고는, 그것의 사용은 본 개시내용의 범위 내인 것으로 고려된다.

실시예

추가의 대안은 청구항의 범위를 어떤 식으로든 한정하고자 하는 것이 아닌 하기 실시예에서 보다 상세히 개시되어있다.

실시예 1

일반적인 실험적 절차

DNA 템플레이트 제조

플라스미드 DNA 템플레이트를 50ng/ml 카바미실린 (Teknova Cat. no. NC9730116)이 보충된 LB 액체 배지 (Teknova Cat. no. L8000 06)에서 성장된 300 mL의 포화된 E. 콜리 TransforMax Epi300 (Epicentre Cat. no. EC300105) 배양물로부터 정제하였다 (Qiagen Cat. no. 12163). 플라스미드 DNA는 37℃에서 1시간 동안 Not-I 소화 (New England Biolabs NEB cat. no. R3189S)로 선형화하였다. 선형화된 템플레이트 DNA는 그런 다음 재-정제하고 (Zymo Cat. no. D4003), 그리고 상업적 2-log DNA 사다리 (New England Biolabs, NEB Cat. no. N3200S)에 대해 0.8% 아가로스겔 (Life Technologies Cat. no. G5018-08)로 분석하였다. 실험실내 전사를 진행하기 전에, 선형 DNA 템플레이트의 예상된 단편 크기에 상응하는 단일 밴드의 존재가 각각의 샘플에서 확인되었다.

실험실내 전사

실험실내 전사 (IVT) 반응을 37℃에서 1시간 인큐베이션에 걸쳐 20μl 반응물에서 상기에 기재된 바와 같이 제조된 1μg의 DNA 템플레이트를 사용하여 수행하였다 (NEB cat. no. E2065S). 공급자에 의해 제공된 1 단위의 DNase I을 그런 다음 IVT 반응물에 직접적으로 첨가하고, 추가의 15분 동안 37℃에서 인큐베이션하였다. 반응물을 그런 다음 얼음 상에 배치하고, 제작자 제안 방법 (Qiagen Cat. no. 74104)에 따라 정제하였다. 정제된 RNA는 그런 다음 NanoDrop 2000c UV-Vis 분광측정기를 사용하여 정량화되었다. RNA는 0.8% 아가로스 겔 (Life Technologies Cat. no. G5018-08)를 통한 전기영동에 의해 시각화되고, 그리고 전기천공으로 진행하기 전에 밀레니엄 RNA 마커 (Ambion Cat. No. AM7150)와 비교되었다.

형질감염 및 분석

전형적인 세포 형질감염 실험에서, 레플리콘 RNA는 4D-Nucleofector? 시스템 (Lonza)에 대해 SF 세포주 Nucleofector? 키트를 사용하여 전기천공에 의해 BHK-21 세포 안으로 도입되었다. BHK-21 세포는 0.25% 트립신을 사용하여 수확되었고 차가운 PBS로 한번 세정되었다. 세포는 20μL 전기천공 반응물 당 1 Υ 10⁶세포의 세포밀도에서 SF 완충액에서 재현탁되었다. 3 마이크로그램의 RNA는 16-웰 큐벳 스트립에서 3중으로 세포 안으로 전기천공되고 10분 동안 실온에서 인큐베이션되었다. 전기천공된 세포는 10% 우태혈청을 함유하는 둘베코변형 이글 배지를 함유한 플레이트 안으로 회수되고, 이어서 표준 세포 배양 조건에서 16 - 18 h 동안 인큐베이되었다.

레플리콘 형질감염 효율 및 단백질 생산의 세포내 분석은 유세포측정에 의해 수행되었다. 이들 검정에서, 형질감염된 BHK-21 세포가 고정/투과 농축물 및 투과화 완충액 (eBioscience)을 사용하여 고정되고 투과되었다. 세포는 그런 다음 R-파이코에리트린 (Innova Biosciences)과 접합된 이중-가닥 RNA 생산 (J2 항-dsRNA IgG2A 단클론성 항체, English & Scientific Company)을 위해 항체로 인큐베이션되었다. 항원 생산은 PE-Cy5 (Innova Biosciences)와 접합된 항원-특이적항체 (예를들어항체 for 붉은 개똥벌레, 녹색레닐라, HA, 또는 RSV-F0 (Abcam))로 추가의 인큐베이션에 의해 평가되었다. 세포는 그런 다음 한번 세정되고 FACSAria? 융합 세포 정렬기 (BD Biosciences) 또는 FACSAria? II 세포 정렬기 (BD Biosciences)를 사용하여 분석되었다. 보상 제어를 위해 단일 색상으로 염색된 형질감염된 BHK-21 세포가 샘플 수집에 앞서 수행되었다. 데이터는 FACSDiva (BD Biosciences)를 사용하여 수집되었고 FlowJo 소프트웨어를 사용하여 추가로 분석되었다. 초기 게이팅을 수행하여 전방 및 측면 산포도를 사용하여 죽은 세포 및 잔해를 배제하였다. 추가의 게이팅을 수행하여 dsRNA (R-PE-양성) 및 단백질 발현 (GFP 발현에 대해 PE-Cy5-양성 또는 FITC-양성) 둘 모두에 대해 양성인 세포 모집단을 동정하였다. 빈도와 평균 형광 강도를 수집하여 작제물 비교 및 최적화에 이용했다.

실시예 2

DLP-함유 EAV 레플리콘 디자인의 구축

본 실시예는 다단백질/비-구조적 단백질 유전자 및/또는 리포터 유전자의 업스트림으로 작동가능하게 배치된 DLP 모티프를 갖는 수많은 아테리바이러스 RNA 레플리콘-기반 발현 벡터의 생성을 기술한다. 이들 아테리바이러스 RNA 레플리콘-기반 발현 벡터는 후속으로 특성규명되고 실시예 4에서 기재된 유세포측정 분석 및 벌크 루시퍼라아제 분석을 사용하여 분석되었다.

A. 디자인

4개의 EAV-기반 DLP 레플리콘 작제물의 각각의 디자인 특징은 아래에 기재되어 있다.

(1) rEX -DLP- rFF

이 작제물에서, rFF의 바로 업스트림으로 그리고 TRS7의 다운스트림으로 배치된 바와 같은 DLP 모티프는 rFF의 전사를 구동함.

(2) rEX -DLP- pp1ab - rFF

이 작제물에서, DLP 모티프는 복제 및 서브게놈 mRNA 전사에 필수적인 것으로 알려진 레플리콘의 5'UTR에서 스템 루프 구조를 유지하기 위해 아래에 기재된 소수의 주의깊은 디자인 변형을 갖는 pp1ab 유전자의 바로 업스트림으로 배치되었다.

(i) 비구조적 바이러스성 유전자 1a의 제1 79 뉴클레오타이드는 "ATG-전이 영역" (하기 서열번호: 2의 서열에서 굵은 글씨체)으로 표시된 ATG에서부터 TAG로 돌연변이된 그것의 시작 코돈으로 복제된다.

(ii) 그것의 시작 코돈 ATG와 염기쌍을 이루고 스템을 형성하는 1a 유전자의 업스트림으로 위치한, 상응하는 뉴클레오타이드는 또한 따라서 CAT로부터 CTA로 변화되었다 (하기 서열번호: 2의 서열에서 밑줄친 부분).

(iii) DLP (하기 서열에서 이탤릭체)는 "ATG-전이 영역"의 바로 다운스트림으로 그리고 다단백질 1ab 유전자 (하기 서열번호: 2의 서열에서 도시된 시작 코돈 ATG)의 업스트림으로 배치되었다.

서열번호: 2 (부분서열)

이 작제물은 제2 작제물에 본질적으로 동일하고, 여기서 DLP는, 번역될 때, 다단백질이 프로테아제에 의한 선택적 절단을 통해 DLP-유래된 펩타이드로부터 방출될 수 있도록 DLP의 3' 말단에서 바로 2A 프로테아제 서열 (서열번호: 3)이 첨가되는 것을 제외하고 동일한 3개의 디자인 변형에 따라 배치된다. 레플리콘 작제물 2 (상기에 기재됨) 및 작제물 3에 의한 성능의 비교 분석은 2A 프로테아제가 기능적 레플리콘 (하기 실시예 4 참고)에 필요한지 여부에 대한 정보를 제공할 수 있다.

서열번호: 3

(4) rEX -DLP-2A- pp1ab -DLP- rFF

이 작제물은 또 다른 DLP가 리포터 rFF 유전자의 바로 업스트림으로 배치되었다는 것을 제외하고는 상기에 기재된 제3 작제물과 본질적으로 동일하였다 (DLP 모티프가 작제물 1에서 위치되었던 것과 동일한 방식). 레플리콘 작제물 3 (상기에 기재됨) 및 작제물 4에 의한 성능의 비교 분석은 리포터 유전자의 업스트림으로 배치된 추가의 DLP가 리포터 유전자의 발현에 대해 첨가된 값을 갖는지 여부에 대한 정보를 제공할 수 있다.

B. 구축

rEx-DLP-rFF는 벡터로서 SphI 및 EcoRI로 단리된 rEx-rFF (c4; 서열번호: 34)와 인서트로서 DLP-함유 g-블록으로 Gibson 등 (Enzymatic assembly of DNA molecules up to several hundred kilobases. Nat. Methods 6, 343-345, 2009)에서 기재된 3-피스 Gibson 어셈블리® 절차에 따라 구축되었다. rEx-DLP-rFF의 구축을 위해 사용된 g-블록의 핵산 서열은 서열목록에서 서열번호: 4에 제시되어 있다.

하기 프라이머는 상기에 기재된 3개 신규한 EAV-기반 DLP 레플리콘 작제물을 구축하기 위해 요구된 상응하는 단편을 증폭하기 위해 설계되었다.

rEx -DLP- pp1ab - rFF의 구축

rEx-DLP-pp1ab-rFF 벡터의 구축을 위하여, 아래와 같이 3-피스 Gibson 어셈블리® 절차를 사용하여 3개의 핵산 단편을 생성하였다.

단편 1은 프라이머 RP114와 RP115 및 템플레이트 백본 rEx-rFF로 생성되었다.

단편 2는 프라이머 RP116과 RP117 및 템플레이트 백본 rEx-rFF로 생성되었다.

단편 3은 서열목록에서 서열번호: 10에서 제시된 핵산 서열을 갖는 rEx-DLP-pp1ab-rFF에 대한 g-블록이었다.

rEx -DLP-2A- pp1ab - rFF의 구축

rEx-DLP-2A-pp1ab-rFF 벡터의 구축을 위해, 아래와 같이 3-피스 Gibson 어셈블리® 절차를 사용하여 3개의 핵산 단편을 생성하였다.

단편 4는 프라이머 RP118과 RP115 및 템플레이트 백본 rEx-rFF로 생성되었다.

단편 5는 프라이머 RP116과 RP117 및 템플레이트 백본 rEx-rFF로 생성되었다.

단편 6은 서열목록에서 서열번호: 11에서 제시된 핵산 서열을 갖는 rEx-DLP-2A-pp1ab-rFF에 대한 g-블록이었다.

rEx -DLP-2A- pp1ab -DLP- rFF의 구축

rEx-DLP-2A-pp1ab-DLP-rFF 벡터의 구축을 위해, 아래와 같이 3-피스 Gibson 어셈블리® 절차를 사용하여 3개의 핵산 단편을 생성하였다.

단편 7은 프라이머 RP118과 RP115 및 템플레이트 백본 rEx-DLP-rFF로 생성되었다.

단편 8은 프라이머 RP116과 RP117 및 템플레이트 백본 rEx-DLP-rFF로 생성되었다.

단편 9는 서열목록에서 서열번호: 12에서 제시된 핵산 서열을 갖는 rEx-DLP-2A-pp1ab-DLP-rFF에 대한 g-블록이었다.

작제물 어셈블리는 Gibson 등 (2009(상동))에서 기재된 3-피스 Gibson 어셈블리® 절차에 따라 수행되었다. 특히, rEx-DLP-pp1ab-rFF 작제물은 단편 1, 2, 및 3을 사용하여 구축되었고; rEx-DLP-2A-pp1ab-rFF 작제물은 단편 4, 5, 및 6을 사용하여 구축되었고; 그리고 rEx-DLP-2A-pp1ab-DLP-rFF 작제물은 단편 7, 8, 및 9를 사용하여 구축되었다. 조립된 생성물은 후속으로 에피센터로부터의 EPI300 세포 안으로 형질전환되었다. 총 144개 콜로니가 각각의 형질전환에 대해 프라이머 RP126 (서열번호: 13) 및 RP127 (서열번호: 14)을 사용하여 선별되어, rEx-DLP-pp1ab-rFF에 대한 4개의 PCR-양성 클론, rEx-DLP-2A-pp1ab-rFF에 대한 3개의 PCR-양성 클론, 및 rEx-DLP-2A-pp1ab-DLP-rFF에 대한 2개의 PCR-양성 클론을 초래했다. 후속적인 MiSeq 결과는 클론 4, 클론 3 및 15, 및 클론 18 및 20은 각각 rEx-DLP-pp1ab-rFF, rEx-DLP-2A-pp1ab-rFF, 및 rEx-DLP-2A-pp1ab-DLP-rFF에 대해 완전히 서열이 정확하였다는 것을 밝혔다.

rEx-DLP-rFF, rEx-DLP-pp1ab-rFF, rEx-DLP-2A-pp1ab-rFF, 및 rEx-DLP-2A-pp1ab-DLP-rFF의 지도가 또한 도 2A-2D에 도시되어 있다.

얻어진 레플리콘의 서열은 서열목록에 아래와 같이 T7 프로모터 및 65 A들의 폴리A 꼬리로 개시되어있다: rEx-DLP-rFF (서열번호: 15), rEx-DLP-pp1ab-rFF (서열번호: 16), rEx-DLP-2A-pp1ab-rFF (서열번호: 17), 및 rEx-DLP-2A-pp1ab-DLP-rFF (서열번호: 18).

실시예 3

DLP-함유 알파바이러스 레플리콘 디자인의 구축

본 실시예는 다단백질/비-구조적 단백질 유전자 및/또는 리포터 유전자의 업스트림으로 배치된 DLP 모티프를 갖는 수많은 알파바이러스 RNA 레플리콘-기반 발현 벡터의 생성을 기술한다. 이들 알파바이러스 RNA 레플리콘-기반 발현 벡터는 후속으로 특성규명되고 실시예 5에서 기재된 유세포측정 분석 및 벌크 루시퍼라아제 분석에서 분석되었다.

A. 디자인

3개의 알파바이러스-기반 DLP 레플리콘 작제물의 각각의 디자인 특징은 아래에 기재되어 있다.

(1) 알파-R-DLP- rFF

이 작제물에서, 이 작제물에서, DLP는 리포터 유전자 rFF의 시작 코돈의 바로 업스트림으로 배치되었다.

(2) 알파-R-DLP-2A- nsp - rFF

이 작제물에서, DLP 모티프를 인코딩하는 서열 및 2A 펩타이드 서열 (상기 실시예 2에서 기재된 rEx-DLP-2A-pp1ab-rFF 레플리콘에서 사용된 동일한 서열임)이 복제 및 서브게놈 mRNA 전사를 위해 서열-구조 요건을 잠재적으로 유지하도록 아래에 기재된 소수의 주의깊은 디자인 변형을 갖는 레플리콘의 5' 말단 내에 배치되었다.

(i) nsp1 유전자의 제1 195 뉴클레오타이드는 ATG로부터 TAG까지 (하기 서열번호: 19의 서열에서 굵은 글씨체) 돌연변이된 그것의 시작 코돈으로 복제된다.

(ii) 이 195-뉴클레오타이드 복제된 서열은 야생형 알파바이러스의 5' UTR (하기 서열번호: 19의 서열에서 밑줄친 부분)에 바로 이어서 배치된 이어서 DLP-2A 서열 (하기 서열에서 이탤릭체 부분)이 따른다.

(iii) DLP-2A 서열이 따르는 nsp1 유전자의 시작 코돈은 제거되었다 (하기 서열번호: 19의 서열에서 취소선).

서열번호: 19 (부분서열)

(3) 알파-R-DLP-2A- nsp -DLP- rFF

이 작제물은 또 다른 DLP 모티프가 리포터 rFF 유전자의 바로 업스트림으로 배치되었다는 것을 제외하고는 동일한 3개의 디자인 변형이 이어지는 작제물 2에 본질적으로 동일하였다 (DLP 모티프가 작제물 1에서 위치되었던 것과 동일한 방식). 레플리콘 작제물 2 및 3에 의한 성능의 비교 분석은 리포터 유전자의 업스트림으로 배치된 추가의 DLP가 리포터 유전자의 발현에 대해 첨가된 값을 갖는지 여부에 대한 정보를 제공할 수 있다 (하기 실시예 5 참고).

B. 구축

알파-R-DLP- rFF의 구축

알파-R-DLP-rFF는 eGFP를 DLP-rFF로 대체하기 위해 프라이머 RP112 (서열번호: 20) 및 RP113 (서열번호: 21)을 사용하여 템플레이트 rEx-DLP-rFF (c2, 서열번호: 15)로부터 PCR-증폭된 인서트로서 DLP-rFF와 벡터로서 EcoRI/SapI로 단리된 알파-R-eGFP (c6; 서열번호: 35)를 사용하여, Gibson 어셈블리® 절차를 통해 구축하였다. 클론 2 및 3은 MiSeq 서열분석을 통해 완전히 올바른 것으로 서열-확인되었다.

알파-R-DLP-2A- nsp - rFF 및 알파-R-DLP-2A- nsp -DLP- rFF의 구축

알파-R-DLP-2A-nsp-rFF (작제물 2) 및 알파-R-DLP-2A-nsp-DLP-rFF (작제물 3)는 프라이머 RP124 (서열번호: 22) 및 RP125 (서열번호: 23)를 사용하여, 각각의 템플레이트인, 알파-R-rFF (c6; 서열번호: 35) 및 알파-R-DLP-rFF (c2; 서열번호: 26)로부터 PCR-증폭된 벡터와 인서트로서 각각의 g-블록을 사용하여, Gibson 어셈블리® 절차를 통해 구축되었다. 알파-R-DLP-2A-nsp-rFF의 클론 1 및 3과 알파-R-DLP-2A-nsp-DLP-rFF의 클론 8 및 32는 MiSeq를 통해 완전히 올바른 것으로 서열-확인되었다.

알파-R-DLP-2A-nsp-rFF의 구축을 위해 사용된 g-블록의 서열은 서열번호: 24로 서열목록에 제공되어 있다. 알파-R-DLP-2A-nsp-DLP-rFF의 구축을 위해 사용된 g-블록의 서열은 또한 서열번호: 25로 서열목록에 제공되어 있다.

알파-R-rFF, 알파-R-DLP-rFF, 알파-R-DLP-2A-nsp-rFF, 및 알파-R-DLP-2A-nsp-DLP-rFF의 지도는 도 3A-3D에 도시되어 있다.

얻어진 레플리콘의 서열은 아래와 같이 T7 프로모터 및 40 A들의 폴리A 꼬리로 또한 제공되어 있다: 알파-R-rFF (서열번호: 26), 알파-R-DLP-rFF (서열번호: 27), 알파-R-DLP-2A-nsp-rFF (서열번호: 28), 및 알파-R-DLP-2A-nsp-DLP-rFF (서열번호: 29).

알파-R-DLP-2A- rFF 및 알파-R-DLP-2A- nsp -DLP-2A- rFF의 구축

임의의 특정 이론에 구속됨 없이, 이들 사이에 2A 프로테아제의 함입 없이 리포터 유전자 rFF의 바로 업스트림으로 DLP 모티프를 위치시키는 것은 GOI의 단백질 발현에 부정적으로 영향을 미칠 수 있고; 이 부정적 영향은 rFF가 이제 rFF의 5' 말단에서 펩타이드로 번역된 DLP 서열의 존재로부터 초래된, "융합" 단백질로 된다는 사실에 기인할 수 있는 것으로 여겨진다. 따라서, 알파-R-DLP-2A-rFF 및 알파-R-DLP-2A-nsp-DLP-2A-rFF를 각각 생성하기 위해, 2개의 알파바이러스-레플리콘 작제물인, 알파-R-DLP-rFF 및 알파-R-DLP-2A-nsp-DLP-rFF에 대한 rFF 유전자와 DLP 모티프 사이에 2A 프로테아제 서열을 포함한 2개의 신규한 작제물이 설계되고 구축되었다. 2A 프로테아제 펩타이드 서열의 함입은 rFF로부터 DLP 서열에 의해 인코딩된 펩타이드의 절단을 가능하게 할 것이다 (하기 실시예 5 참고).

이러한 목적을 위해, 2개의 g-블록 단편이 합성되고 (서열번호: 30 및 31) Gibson 어셈블리를 통해 EcoRV/SbfI로 단리된 그것의 각각의 벡터 안으로 클로닝되었다. 알파-R-DLP-2A-rFF의 클론 1 및 알파-R-DLP-2A-nsp-DLP-2A-rFF의 클론 8 및 9는 RP123 (서열번호: 32) 및 RP96 (P89; 서열번호: 96)을 사용한 Sanger 서열분석을 통해 완전히 올바른 것으로 서열-확인되었다.

알파-R-DLP-2A-rFF 및 알파-R-DLP-2A-nsp-DLP-2A-rFF의 도식적 지도가 도 4A-4B에 제공되어 있다.

실시예 4

EAV -기반 DLP 함유 레플리콘의 발현 분석

상기 실시예 2 및 3에서 제시된 바와 같이, 수많은 EAV-기반 DLP 함유 레플리콘이 서브게놈 mRNA 상의 레플리콘 비구조적 단백질 유전자 또는 GOI 유전자 중 어느 하나의 업스트림으로 배치된 DLP 모티프를 조작하는 영향을 결정하기 위해 구축되었다 (표 8).

DLP 레플리콘 작제물의 초기 특성규명이 실험실내에서 수행되었다. RNA가 생산되었고 그리고 상기 실시예 1에서 기재된 바와 같이 BHK 세포를 전기천공하기 위해 사용되었다. 전기천공 후 세포는 FAC 분석, 웨스턴 블랏 또는 벌크 루시퍼라아제 검정에 의해 단백질 발현에 대해 분석되었다.

EAV-기반 DLP 레플리콘으로부터, 예시적인 관심 유전자 (GOI)인 rFF 루시퍼라아제 리포터의 발현 수준을 측정하기 위해 수행된 실험의 결과의 그래픽 요약은 도 5에 도시되어 있다. FACs 분석 및 벌크 루시퍼라아제 데이터가 제시되어 있다. 이들 실험에서, 4개의 상이한 EAV DLP 레플리콘이 아래와 같이 분석되었다:

1) rEx-DLP-rFF: 서브게놈 mRNA rFF 전사체에 업스트림으로 배치된 DLP 모티프를 갖는 EAV-기반 레플리콘);

2) rEx-DLP-pp1ab-rFF: 비-구조적 pp1ab 유전자에 업스트림으로 배치된 DLP를 갖는 EAV-기반 레플리콘);

3) rEx-DLP-2A-pp1ab-rFF: 비구조 단백질에 업스트림으로 배치된 DLP 모티프와 DLP와 pp1ab 영역 사이에 배치된 2A 프로테아제 펩타이드를 갖는 EAV-기반 레플리콘); 및

4) rEx-DLP-2A-pp1ab-DLP-rFF: 비구조 단백질에 업스트림으로 배치된 제1 DLP 모티프 및 DLP와 pp1ab 영역 사이에 배치된 2A 프로테아제 펩타이드뿐만 아니라 rFF 서브게놈 mRNA 전사체에 업스트림 배치된 제2 DLP 모티프를 갖는 EAV-기반 레플리콘).

도 5A-5B에 제시된 결과는 EAV 비구조적 단백질 유전자 (예를 들어, rEx-DLP-pp1ab-rFF, rEx-DLP-2A-pp1ab-rFF 또는 rEx-DLP-2A-pp1ab-DLP-rFF) 또는 rFF 리포터 유전자 서브게놈 RNA (예를 들어, rEx-DLP-rFF 및 rEx-DLP-2A-pp1ab-DLP-rFF) 중 어느 하나에 업스트림으로 DLP 모티프를 조작하는 것은 4개의 작제물 모두가 거의 동일한 전기천공 효율성을 실증한 바와 같이 게놈 RNA 복제에 부정적으로 영향을 미치지 않았다는 것을 실증했다 (도 5A). 흥미롭게도, 벌크 루시퍼라아제 활성 분석은 rEx-DLP-pp1ab-rFF 레플리콘이 다른 3개의 레플리콘 디자인보다 상당히 낮은 루시퍼라아제를 발현했다는 것을 실증했다 (도 5B). 상기에서 언급된 바와 같이, 임의의 GOI의 업스트림으로 DLP 모티프의 함입은 DLP 서열에서 발견된 인프레임 코돈에서 인코딩된 신드비스 캡시드 아미노산의 N 말단 융합을 초래할 것이다. DLP및 EAV nsP1 단백질을 인코딩하는 아미노산으로 생성된 융합 단백질은 서브게놈 RNA를 효율적으로 생산하는 EAV 복제 복합체에 영향을 미치고 현저히 감소된 rFF GOI 발현 수준을 초래하는 것으로 여겨진다. 이 연구로부터 가장 현저한 결과 중 하나는 비구조적 단백질 유전자의 번역을 제어하는 DLP를 갖는 EAV 레플리콘 작제물 (rEx-DLP-pp1ab-rFF, rEx-DLP-2A-pp1ab-rFF 및 rEx-DLP-2A-pp1ab-DLP-rFF)은 이 위치에서 DLP를 갖지 않는 레플리콘 RNA (rEx-DLP-rFF)와 마찬가지로 효율적으로 번역되었다는 것이었다. 이 결과는 다른 연구자에 의해 수행된 연구를 기준으로 예상할 수 없다. 이전에 5' 신드비스 바이러스 서브게놈 RNA 서열 (DLP 영역을 포함함) 함입이 바이러스로 감염된 세포에서만 효율적으로 번역되었음이 보고되었다. 달리 말하면, 리포터 유전자와 연관된 DLP 모티프를 함유하는 mRNA는 신드비스 바이러스에 감염되지 않은 세포에서 저조하게 번역되는 것으로 보고되었다. 이들 세포에서 선천적인 면역 활성화의 부재는 DLP 변형 (모든 세포의 mRNA)이 없는 mRNA의 번역과 비교하여 뚜렷한 번역 약점에서의 DLP 변형된 mRNA를 만들었다. 선천적인 면역계는 DLP-함유 레플리콘 벡터가 도입되었을 때 이들 세포에서 활성화되지 않았기 때문에 이들 DLP-함유 mRNA (자기-증폭 가능)는 매우 비효율적으로 번역되어야 한다. 예상외로, 그것은 본 명세서에 제시된 실험에서 지지되지 않았다.

후속으로, rEx-DLP-2A-pp1ab-rFF EAV 레플리콘은 세포의 선천적인 면역계를 유도하기 위해 IFN으로 처리된 세포에서 검사되었다. BHK 세포의 IFN 처리는 eIF2α의 PKR 활성화 및 인산화를 유도하여, 차례로 전반적인 세포의 mRNA 번역의 종료를 초래할 것이다. 이전에 아테리바이러스가 IFN 처리에 민감하다는 것이 보고되었으며 (Luo et al. Antiviral Res. Aug;91(2):99-101, 2011), 따라서 IFN 노출에 반응할 수 있고 선천적인 면역계를 유도하는 BHK 세포의 IFN 처리는 아테리바이러스 복제의 종료를 초래할 수 있다. 선천적인 면역계 활성화의 존재에서 DLP 변형된 EAV 레플리콘의 발현 능력의 대표적인 예가 도 6에 도시되어 있다. rEx-DLP-2A-pp1ab-rFF 레플리콘은 DLP 모티프를 함유하도록 변형되지 않은 EAV 레플리콘, 즉 rEx-rFF에 비교할 때 선천적인 면역계 활성화에 대해 상당한 내성을 실증했다. rEx-DLP-2A-pp1ab-rFF 레플리콘의 복제 (도 6A) 및 발현 (도 6B) 둘 모두는 대조군 rEx-rFF 레플리콘에 비교할 때 IFN 처리된 세포에서 상당히 더 높았다. 이들 데이터는 DLP 변형된 EAV 레플리콘이 선천적인 면역계 종료를 극복할 수 있다는 것과 이 레플리콘 벡터가 자기-증폭하는 RNA 기술에서 상당한 진보를 나타낸다는 것을 입증한다.

실시예 5

DLP-함유 VEEV 레플리콘의 발현 분석

상기 실시예 2 및 3에서 제시된 바와 같이, 수많은 VEEV-기반 DLP 함유 레플리콘이 서브게놈 mRNA 상의 레플리콘 비구조적 단백질 유전자 또는 GOI 유전자 중 어느 하나의 업스트림으로 배치된 DLP 모티프를 조작하는 영향을 결정하기 위해 구축되었다

VEEV 알파바이러스 레플리콘 벡터는 EAV-기반 레플리콘 벡터의 구축에 대한 유사한 전략을 사용함에 의해 하나 이상의 DLP 모티프를 함유하도록 조작되었다. 중요하게는, 알파바이러스 속 (대부분 구대륙 바이러스 구성원)의 다른 구성원과 달리, VEEV의 게놈은 그것의 서브게놈 mRNA의 번역과 연관된 DLP 모티프를 함유하지 않는다. VEEV DLP 레플리콘의 초기 분석은 상기 실시예 1에서 기재된 바와 같이 BHK-21 세포에서 수행되었다. BHK-21 세포는 RNA 복제를 위해 반응에서 IFN를 분비하지 않지만 이들 세포는 선천적인 면역 활성화를 유도하도록 외인성 IFN에 반응할 수 있다. 이 실험에서, 4개의 상이한 알파바이러스 레플리콘 작제물이 시험되었다. 도 7에 제시된 실험적 데이터는 1000 U/ml의 외인성 IFN으로 전기천공 시 (0시간)또는 전기천공 3시간 후 중 어느 하나에서 처리된 BHK 세포에서의 DLP-함유 알파바이러스 레플리콘 복제 및 rFF 루시퍼라아제유전자의 발현을 도시한다. 시험된 레플리콘 RNA는 다음과 같았다:

1) 알파-R-rFF: 존재하는 DLP가 없는 대조군 VEEV-기반 레플리콘;

2) 알파-R-DLP-rFF: 서브게놈 mRNA rFF 전사체에 업스트림으로 배치된 DLP 모티프를 갖는 VEEV-기반 레플리콘;

3) 알파-R-DLP-2A-nsp-rFF: DLP와 nsp 영역 사이에 2A 프로테아제를 갖는 비구조 단백질에 업스트림으로 배치된 DLP 모티프를 갖는 VEEV-기반 레플리콘; 및

4) 알파-R-DLP-2A-nsp-DLP-rFF: DLP와 nsp 영역 사이에 2A 프로테아제를 갖는 비구조 단백질에 업스트림으로 배치된 제1 DLP 모티프뿐만 아니라 rFF 서브게놈 mRNA 전사체에 업스트림으로 배치된 제2 DLP 모티프를 갖는 VEEV-기반 레플리콘.

FACs 분석에 의해 검출된 양성 세포의 수에 대해 정규화된 루시퍼라아제 발현의 결과는 도 7에 도시되어 있다. VEEV 비-구조적 단백질 유전자의 번역을 조절하는 DLP 모티프의 존재는 전기천공 후 IFN 처리의 부재 및 존재 둘 모두에서 더 높은 리포터 유전자 발현을 초래했다는 것이 관측되었다 (도 7A-7C). rFF 발현에서의 증가가 통계적으로 무의미한 것으로 간주될 수 있었지만, 모든 조건에서의 추세는 증가된 단백질 발현에 대한 것이었다. DLP-함유 EAV 레플리콘에 관하여 실시예 4에서 상기에서 언급된 바와 같이, DLP 모티프는 선천적인 면역 반응 활성 상태에 있지 않은 세포에서 mRNA 번역에 대해 부정적 영향을 가질 것이다는 것이 기대될 수 있었다. 그 기대에 직접 대조적으로, 이들 실험에서 IFN으로 처리되지 않은 BHK 세포 (도 7A)는 DLP 모티프의 함입에 최대 이점을 갖는 샘플을 나타낸다.

후속으로, 2개의 RNA 레플리콘 알파-R-rFF 및 알파-DLP-2A-nsp-rFF가 Balb/c 마우스에서 생체내 시험되었다. 이 실험에서, 마우스는 10마리의 동물 군으로 시험되었다. 이들 실험에서, 동등 용량의 RNA를 마우스에 근육 내로 주사하여 전신 IVIS (생체내 이미지형성 시스템) 분석을 1주일의 과정에 걸쳐 수행했다. 전신 이미지형성은 주사 후 1일, 3일 및 7일째에 수행되었다. 주사 부위에서 측정된 총 유입은 도 8에 도시된다. DLP 변형된 VEEV 레플리콘으로부터 단백질 발현에서의 단지 보통의 증가만이 실험실내에서 관찰되었지만 (도 8), DLP 변형된 VEEV 레플리콘 RNA로부터 측정된 모든 시점에서 통계적으로 상당히 더 높은 단백질 발현이 검출되었다 (도 8). 이 관찰은 비변형된 VEEV 레플리콘 벡터가 총 세포 단백질의 20%까지 도달할 수 있는 매우 높은 단백질 발현을 할 수 있기 때문에 상당한 이점을 나타낸다 (Pushko et al 1997). DLP로 변형된 VEEV 레플리콘은 이 발현 가능성조차 능가하였고 우월한 단백질 발현을 실증했다; 이러한 이유로, DLP 변형된 알파바이러스 레플리콘 벡터는 현존하는 알파바이러스 레플리콘 RNA 기술에 비해 상당한 진보를 나타낸다.

상기 실시예에 제시된 실험적 데이터로부터 도출될 수 있는 적어도 3가지 예기치 못한 결과가 있다. 첫째로, 세포가 선천적인 면역계 활성 상태에 있지 않을 때, DLP 모티프가 mRNA의 번역에 부정적으로 영향을 미친다는 것이 밝혀졌다. 본 명세서에서 개시된 DLP-함유 레플리콘 RNA는 선천적인 활성화의 기초 상태에서 세포에서 부정적으로 영향을 받지 않는 것으로 밝혀졌다. 둘째로, 특히 DLP-함유 VEEV 레플리콘에 대한 발현 수준은 생체내에서 비변형된 레플리콘보다 더욱 더 높은 것으로 밝혀졌다; 이 관찰은 알파바이러스 레플리콘으로부터의 발현 수준조차도 이전에 높은 역사적인 발현 수준으로부터 증가될 수 있음을 실증했다. 셋째로, 모든 양성 가닥 RNA 바이러스는 그것의 게놈의 5' 및 3' 말단 둘 모두에서 상당한 서열 보존성을 갖는다. VEEV 레플리콘 및 EAV 레플리콘 둘 모두가 그것의 RNA의 5' 말단에 스템 루프 구조 (DLP)의 함입을 수용할 만큼 충분히 유연하다는 사실은 예기치 못했다.

실시예 6

DLP 레플리콘 발현 시스템을 사용한 생체내 면역원성 반응

알파바이러스 레플리콘 벡터는 상기에 기재된 바와 같이 하나 이상의 DLP 모티프를 함유하도록 조작되었다. DLP 서열을 함유하는, RNA 레플리콘인, 알파-R-gDLP-HA는 Balb/c 마우스에서 추가로 생체내 분석되었다. 이 실험에서, 15μg, 1.5 g, 또는 0.15μg의 인플루엔자 A/Vietnam/1203/2004 (H5N1)로부터 혈구응집소를 인코딩하는 RNA를 6주 간격으로 마우스 안으로 주사하였다. 최종 부스트 14일 후, HA에 대한 면역 반응을 분석하기 위해 비장 및 혈청을 수집하였다. 이들 실험의 결과의 요약은 도 12A-12C에 제시되어 있다. 도 12A에서, 메모리 전구체 효과기 세포 (MPEC)에서의 유의미한 증가가 비변형된 레플리콘의 각각의 비교할만한 용량과 비교하여 DLP 모티프를 함유하는 작제물에서 관측되었다. HA-특이적 MPEC는 다른 모집단-특이적 마커 (CD8⁺CD44⁺CD62L^LoKLRG-1^LoIL-7Ra^HiCXCR3^Hi)와 함께 덱스트라머 (H-2 Kd (IYSTVASSL; 서열번호: 44))를 사용하여 검출되었다. 참고로 이 이점은 저용량에서도 또한 관측가능하였다. 도 12B 및 12C에서, 효과기 T 세포 반응은 CD4⁺ T 세포 또는 CD8⁺ T 세포 펩타이드로 자극에 이어서 IFN-γ를 분비하는 항원-특이적 HA 세포의 수에 의해 측정되었다. DLP 모티프를 함유하는 레플리콘으로 면역화된 동물은 15ug 및 1.5ug 용량인 사이토카인-발현 CD4⁺및 CD8⁺ T 세포의 상당히 더 높은 빈도를 가졌다. 종합하여, 이들 데이터는 비변형된 버전에 비교하여 DLP 모티프를 함유하는 레플리콘에 의해 발현된 항원으로 면역화에 대한 반응에서 효과기 및 메모리 T 세포 반응 둘 모두에서 유의미한 증가를 나타낸다.

상기 DLP-함유 레플리콘은 LNP 제형과의 혼용성에 대해 Balb/c 마우스에서 추가로 생체내 분석되었다. 이 실험에서, 2μg 또는 0.2μg의 인플루엔자 A/Vietnam/1203/2004 (H5N1)로부터 혈구응집소를 인코딩하는 RNA를 4주 간격으로 마우스 안으로 주사하였다. 최종 부스트 14일 후, HA에 대한 면역 반응을 분석하기 위해 비장 및 혈청을 수집하였다. 이들 실험의 결과의 요약은 도 14A-14C에 제시되어 있다. 도 14A-14C에서, T-세포 및 B-세포 반응에서의 증가는 LNP (양이온성 지질 나노입자) 제형과 조합될 때 DLP 모티프를 함유한 작제물을 사용하여 관측되었다. 도 14A에서, HA-특이적인 총 IgG 역가는 염수에 투여된 레플리콘을 갖는 군에 비교하여 LNP 제형을 사용한 모든 용량군에서 상당히 더 높았다. 게다가, 도 14B 및 14C에서, HA-특이적 CD8+ 및 CD4+ T 세포는 염수에 투여된 레플리콘을 갖는 군에 비교하여 LNP 제형을 사용한 모든 용량군에서 또한 상당히 더 높았다는 것이 관측되었다. 종합하여, 이 데이터는 DLP 모티프를 함유하는 레플리콘 작제물이 대표적인 제형과 양립가능하다는 것을 입증한다.

실시예 7

DLP-함유 레플리콘을 사용한 면역 반응의 억제 방지

상기에 기재된 바와 같이 구축된 DLP-함유 레플리콘은 Balb/c 마우스에서 면역 반응의 억제를 방지하는 능력에 대해 추가로 생체내 평가되었다. 이들 실험에서, DLP 모티프가 있거나 없고, 그리고 인플루엔자 A/Vietnam/1203/2004 (H5N1)로부터 유래된 혈구응집소에 대한 코딩 서열을 담지하는 1.5μg의 mRNA가 4주 간격으로 마우스 안으로 주사된다. 주사 대략 24시간 이전에, 6-8 주령 BALB/c 마우스는 바이러스성 감염을 시뮬레이션하기 위해 유체역학적 꼬리 정맥주사에 의해 20μg의 폴리(I:C) 또는 염수로 전처리된다. 최종 부스트 14일 후, 혈구응집소 (HA)에 대한 면역 반응을 분석하기 위해 이들 마우스로부터 혈청을 수집하였다. 이들 실험의 요약은 도 13에 제시되어 있다. 도 13에서, 폴리(I:C)로 전처리되고 비변형된 레플리콘의 용량을 투여받은 마우스에서 HA-특이적 항체의 혈청 농도에서의 상당한 감소가 관측된다. 폴리(I:C) 군에서의 수준은 배경보다 상당히 높지 않았다. 그에 반해서, 폴리(I:C)로 전처리되고 DLP 모티프를 함유하는 작제물이 투약된 동물은 혈청 항원-특이적 총 IgG 농도에서의 상당한 감소를 나타내지 않았다. 종합하면, 이들 데이터는 DLP 모티프는 비변형된 버전에 비교하여 모의실험된 바이러스성 감염 후 백신접종에 대한 반응에서 혈청 항체 수준의 억제에 대해 보호한다는 것을 보여준다.

실시예 8

DLP-함유 발현 카세트의 구축

본 실시예는 본 개시내용의 일부 구현예에 따른 관심 유전자, 예를 들어, 리포터 유전자의 업스트림으로 신드비스 바이러스 DLP 인자를 함유하는 mRNA의 실험실내 전사를 위한 플라스미드 벡터의 생성을 기술한다. 이들 실험에서 사용된 5' 및 3' 미번역된 영역 (UTR) (각각 서열번호: 36 및 서열번호: 41)은 인간 베타 글로빈 유전자로부터 유래되었다. 5' UTR 서열은 T7 프로모터 (서열번호: 37)의 바로 다운스트림으로 그리고 신드비스 바이러스 DLP 서열 (서열번호: 38)의 업스트림으로 배치되었다. 일부 실험에서, 관심 유전자 (GOI)에 대한 코딩 서열은 돼지 테스코바이러스-1로부터 유래된 자가촉매적 자가-절단 펩타이드 (예를 들어, 오토프로테아제 펩타이드)인 P2A 신호를 통해 DLP에 연결된다. 일부 실험에서, 이 경우에 GOI로 사용된 EGFP 리포터 유전자 (dsGFP)의 탈안정화된 형태에 대한 코딩 서열은 마우스오르니틴 탈탄산효소 유전자 (MODC)로부터 유래된 단백질분해 PEST 열화 신호에 작동가능하게 연결된다. 일부 다른 실험에서, 붉은 개똥벌레 루시퍼라아제 보고된 유전자의 코딩 서열이 관심 유전자로서 사용되었다 (또한 하기 실시예 9 참고). 그러나, 임의의 관심 유전자에 대한 코딩 서열이 이 배치형태에서 전개될 수 있다는 것이 고려된다. 또한, 도 15에서 예시된 바와 같이, 인간 베타 글로빈으로부터 유래된 3' UTR 서열, 120 아데닌 잔기로 구성된 폴리A 꼬리, 및 T7 종결자가 dsGFP의 정지코돈에 인접하여 다운스트림으로 삽입되었다. 상기에 기재된 각각의 성분의 핵산 서열은 아래와 같다:

상기 실험에서, 신드비스 바이러스로부터의 DLP 서열이 사용되었다. 추가의 실험은 다른 구대륙 알파바이러스 구성원 예컨대 SV, SFV, BEBV, RRV, SAG, GETV, MIDV, CHIKV, 및 ONNV로부터의 DLP 서열을 본 개시내용의 핵산분자 안으로 합체하기 위해 수행된다. 관심 유전자에 DLP의 연결은 자가-절단 펩타이드 예컨대 P2A로 또는 없이 구성될 수 있다. 임의의 특정 이론에 구속됨이 없이, 2A 서열 또는 다른 자가-절단 펩타이드에 대한 요건은 유전자 카셋트 안으로 삽입되어 지는 개별 유전자와 DLP의 함입에 의해 첨가된 추가의 아미노산이 번역된 단백질 기능에 영향을 주는지 여부에 의존적이라고 여겨진다. 여기서 사용된 5' 및 3' UTR 서열은 또한 기원에 무관하게 임의의 다른 세트의 기능적 UTR에 대해 변화될 수 있다는 것이 추가로 고려된다.

실시예 9

DLP-함유 발현 카세트에서 유전자 발현의 생체외 평가

상기에 기재된 바와 같이, 하나 이상의 DLP 모티프를 함유하도록 조작된 DLP-함유 발현 카세트로부터 유래된 mRNA는 BHK-21 세포에서 관심 유전자의 발현을 증진시키는 능력에 대해 생체외 평가되었다. 대조군으로, DLP 서열을 결하지만 달리는 상기에 기재된 DLP-함유 mRNA와 동일한 mRNA 샘플을 동일한 조건하에서 병렬적으로 분석하였다. 이들 실험에서, BHK-21 세포는 300, 600 또는 1000 U/mL의 보편적인 유형 I 인터페론 또는 비히클 대조군으로 2시간 동안 전처리되었다. 전처리에 이어서 세포는 DLP 모티프를 함유하거나 결하는 2.5μg의 mRNA로 3중으로 전기천공되었다. 세포는 전처리 동안 사용된 동일한 농도의 인터페론을 함유하는 배지 안으로 다시 배치되었다. GFP 양성 세포의 빈도 및 평균 형광 강도 (MFI)가 유세포측정에 의하여 전기천공 2, 4 및 24시간 후에 분석되었다. DLP-함유 mRNA는 인터페론의 존재에서 비-DLP mRNA에 비교하여 상당히 더 높은 빈도의 GFP 양성 세포를 생성한다는 것이 관측되었다 (도 16A).

게다가, GFP의 MFI가 GFP 양성 세포의 빈도로 정규화되고 시간에 대해 플롯 팅된 경우, 비변형된 mRNA는 24-시간의 시간 경과 동안 생산된 전반적인 단백질에서 30%의 통계적으로 상당한 감소를 나타낸 바와 같이 인터페론 처리에 민감한 것으로 관측되었다 (도 16B). 그에 반해서, DLP-함유 변형된 mRNA는 동일한 24-시간의 시간 경과 동안 대조군 비변형된 mRNA에 비하여 전반적인 단백질 생산에서 30%의 통계적으로 유의미한 증가를 나타낸 바와 같이 인터페론 처리에 대한 내성을 실증했다 (도 16C). DLP 모티프의 존재에 의해 부여된 인터페론 처리에 대한 내성은 인터페론으로 처리되고 DLP-함유 mRNA로 전기천공된 세포가 비변형된 mRNA로 전기천공된 미처리된 세포만큼 많은 단백질을 생성한다는 발견에 의해 더욱 강화되었다 (도 16C).

실시예 10

DLP-함유 발현 카세트에서 유전자 발현의 생체내 평가

상기에 기재된 바와 같이, 하나 이상의 DLP 모티프를 함유하도록 조작된 DLP-함유 발현 카세트로부터 유래된 mRNA는 Balb/c 마우스에서 관심 유전자의 발현을 증진시키는 능력에 대해 추가로 생체내 평가되었다. 이 실험에서, 30μg, 15μg, 또는 1.5μg의 붉은 개똥벌레 루시퍼라아제를 인코딩하는 DLP-함유 mRNA가 6주 간격으로 마우스 안으로 주사된다. 붉은 개똥벌레 루시퍼라아제 발현은 주사 후 1, 3, 7, 10, 14, 21 및 28일째에 IVIS (생체내 이미지형성 시스템) 분석에 의해 후속적으로 모니터링하였다. 루시퍼라아제 발현에서의 유의미한 증가는 DLP 모티프를 결한 mRNA를 투여받은 대조군 동물에 비교될 때 DLP-함유 mRNA를 투여받은 마우스에서 관측되었다.

실시예 11

DLP-함유 mRNA를 사용한 면역 반응의 억제 방지

상기에 기재된 바와 같이 DLP-함유 mRNA는 Balb/c 마우스에서 관심 유전자의 발현을 증진시키는 능력에 대해 추가로 생체내 평가되었다. 이 실험에서, DLP 모티프가 있거나 없고, 그리고 인플루엔자 A/Vietnam/1203/2004 (H5N1)로부터 유래된 혈구응집소에 대한 코딩 서열을 담지하는, 30μg, 15μg, 또는 1.5μg의 mRNA가 4주 간격으로 마우스 안으로 주사된다. 주사 대략 24시간 이전에, 마우스는 바이러스성 감염을 시뮬레이션하기 위해 유체역학적 꼬리 정맥주사에 의해 20μg의 폴리(I:C) 또는 염수로 전처리된다. 최종 부스트 14일 후, 혈구응집소 (HA)에 대한 면역 반응을 분석하기 위해 이들 마우스로부터 혈청을 수집하였다. HA-특이적 항체의 혈청 농도에서의 상당한 감소는 폴리(I:C)로 전처리되고 DLP 서열을 결하는 mRNA의 용량을 투여받은 마우스에서 관측될 것으로 기대된다. 그에 반해서, 폴리(I:C)로 전처리되고 DLP 모티프를 함유하는 mRNA가 투약된 동물은 혈청 항원-특이적 총 IgG 농도에서의 상당한 감소를 나타내지 않을 것으로 기대된다.

본 개시내용의 특정 대안이 개시되었지만, 첨부된 청구항들의 진정한 사상 및 범위 내에서 다양한 변경 및 조합이 가능하고 고려된다는 것을 이해해야 한다. 따라서, 본 명세서에서 제시된 정확한 요약 및 개시내용으로 제한하고자 하는 의도는 없다.

비제한적으로 신문기사, 교과서, 공보, 특허 및 특허출원을 포함하여 본 명세서에서 개시된 모든 참조문헌은, 각각의 참조문헌이 구체적으로 및 개별적으로 참고로 편입되도록 지시된 것과 동일한 정도로 그것의 전체로 이로써 참고로 편입된다.

본 명세서에 인용된 임의의 참조문헌이 선행 기술을 구성한다는 인정을 하는 것은 아니다. 참조문헌의 논의는 그것의 저자들이 주장하는 바를 기술하고 본 발명자는 인용된 문서의 정확도와 적합성에 이의를 제기할 권리를 보유한다. 과학적 신문기사, 특허문서, 및 교과서를 비롯한 수많은 정보 공급원이 본 명세서에서 언급되어 있지만; 특이적 정보 공급원에서의 임의의 논의와 코멘트는 이러한 코멘트가 해당 분야의 일반적인 의견으로 널리 받아들여졌음을 인정하는 것으로 간주되어서는 안된다는 것이 분명하게 이해될 것이다.

본 명세서에서 주어진 일반적인 조성물 및 방법의 논의는 단지 예시적인 목적을 위한 것이다. 그것은 포괄적이거나 개시내용을 제한하기 위한 것이 아니다. 특정 구현예의 개별 양태 또는 특징은 일반적으로 그 특정 구현예에 한정되지 않지만, 적용 가능한 경우, 상호교환 가능하며, 구체적으로 도시 또는 기재되지 않더라도, 선택된 예에서 사용될 수 있다. 본 개시내용의 임의의 양태 또는 특징이 본 명세서에 개시된 임의의 다른 양태, 특징 또는 양태와 특징의 조합과 조합될 수 있음이 명시적으로 고려된다. 다른 대안적인 조성물, 방법 및 구현예는 본 개시 내용의 검토에 의해 당해 분야의 숙련가에게 분명할 것이며, 본원의 사상 및 영역 내에 포함되어야 한다.

<110> SYNTHETIC GENOMICS INC <120> COMPOSITIONS AND METHODS FOR ENHANCING GENE EXPRESSION <130> SGI.012WO <150> 62/430,250 <151> 2016-12-05 <150> 62/486,361 <151> 2017-04-17 <150> 62/587,954 <151> 2017-11-17 <160> 52 <170> PatentIn version 3.5 <210> 1 <211> 145 <212> DNA <213> Sindbis virus <220> <223> Synthetic polypeptide <220> <221> old_sequence <222> (1)..(15) <223> CD4 T cell epitope <400> 1 atagtcagca tagtacattt catctgacta atactacaac accaccacca tgaatagagg 60 attctttaac atgctcggcc gccgcccctt cccggccccc actgccatgt ggaggccgcg 120 gagaaggagg caggcggccc cgatg 145 <210> 2 <211> 480 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 2 gctcgaagtg tgtatggtgc catatacggc tcaccaccat atacactgca agaattacta 60 ttcttgtggg cccctctcgg taaatcctag agggctttcc tctcgttatt gcgagattcg 120 tcgttagata acggcaagtt ccctttctta ctatcctatt ttcatcttgt ggcttgacgg 180 gtcactgcct acgtcgtcga tctctatcaa ctacccttgc gacttaggca accttctccg 240 ctactggatt tggagggagt tttgttaggg actggtccct ggacttaccc gacgcttgtg 300 agcatagtca gcatagtaca tttcatctga ctaatactac aacaccacca ccatgaatag 360 aggattcttt aacatgctcg gccgccgccc cttcccggcc cccactgcca tgtggaggcc 420 gcggagaagg aggcaggcgg ccccgatgat ggcaaccttc tccgctactg gatttggagg 480 480 <210> 3 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> 2A proteolytic cleavage site <400> 3 ggaagcggag ctactaactt cagcctgctg aagcaggctg gagacgtgga ggagaaccct 60 ggacct 66 <210> 4 <211> 1749 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> g-block for construction of rEx-DLP-rFF <400> 4 cagaggcgca ggacttgatc catggcccac ctacagcatg ccacctgggc caagaaattg 60 acctttggtc caatgagggc ctcgaatatt acaaggaagt caacctgctg tacacacacg 120 tccccatcaa ggatggtgta atacacagtt accctaattg tggccctgcc tgtggctggg 180 aaaagcaatc caacaaaatt tcgtgcctcc cgagagtggc acaaaatttg ggctaccact 240 attccccaga cttaccagga ttttgcccca taccaaaaga actcgctgag cattggcccg 300 tagtgtccaa tgatagatac ccgaattgct tgcaaattac cttacagcaa gtatgtgaac 360 tcagtaaacc gtgctcagcg ggctatatgg ttggacaatc ggttttcgtg cagacgcctg 420 gtgtgacatc ttactggctt actgaatggg tcgacggcaa agcgcgtgct ctaccagatt 480 ccttattctc gtccggtagg ttcgagacta acagccgcgc tttcctcgat gaagccgagg 540 aaaagtttgc cgccgctcac cctcatgcct gtttgggaga aattaataag tccaccgtgg 600 gaggatccca cttcatcttt tcccaatatt taccaccatt gctacccgca gacgctgttg 660 ccctggtagg tgcttcattg gctgggaaag ctgctaaagc tgcttgcagc gttgttgatg 720 tctatgctcc atcatttgaa ccttatctac accctgagac actgagtcgc gtgtacaaga 780 ttatgatcga tttcaagccg tgtaggctta tggtgtggag aaacgcgacc ttttatgtcc 840 aagagggtgt tgatgcagtt acatcagcac tagcagctgt gtccaaactc atcaaagtgc 900 cggccaatga gcctgtttca ttccatgtgg catcagggta cagaaccaac gcgctggtag 960 cgccccaggc taaaatttca attggagcct acgccgccga gtgggcactg tcaactgaac 1020 cgccacctgc tggttatgcg atcgtgcggc gatatattgt aaagaggctc ctcagctcaa 1080 cagaagtgtt cttgtgccgc aggggtgttg tgtcttccac ctcagtgcag accatttgtg 1140 cactagaggg atgtaaacct ctgttcaact tcttacaaat tggttcagtc attgggcccg 1200 tgtgactcta gagtggacct gttcccatcc cccgctcaac tactcaggta gtggttcgcg 1260 gcaacgggta caccgcagtt ggtaacaagc ttgtcgatag tcagcatagt acatttcatc 1320 tgactaatac tacaacacca ccaccatgaa tagaggattc tttaacatgc tcggccgccg 1380 ccccttcccg gcccccactg ccatgtggag gccgcggaga aggaggcagg cggccccgat 1440 gatggaaaat atggaaaacg acgagaacat cgtggtgggc cccaagccct tctaccccat 1500 cgaggaaggc agcgccggca cccagctgcg gaagtacatg gaaagatacg ccaagctggg 1560 cgccattgcc ttcaccaacg ccgtgaccgg cgtggactac agctacgccg agtacctgga 1620 aaagagctgc tgcctgggca aggctctgca gaactacggc ctggtggtgg acggccggat 1680 cgccctgtgc agcgagaact gcgaggaatt cttcatcccc gtgatcgccg gcctgttcat 1740 cggcgtggg 1749 <210> 5 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> primer pp1a-DLP-F <220> <221> misc_feature <223> RP114 <400> 5 gccatgtgga ggccgcggag aaggaggcag gcggccccga tgatggcaac cttctccgct 60 actggat 67 <210> 6 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> primer pBR322-3'SrfI-R <220> <221> misc_feature <223> RP115 <400> 6 acaatgttgc ctcccacatc tgcaa 25 <210> 7 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> primer pBR322-3'SrfI-F <220> <221> misc_feature <223> RP116 <400> 7 gggtcacaag gtagtcgccg tggtt 25 <210> 8 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> primer pBR322-bla-R <220> <221> misc_feature <223> RP117 <400> 8 cgtcaggtgg cacttttcgg ggaa 24 <210> 9 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> primer pp1a-DLP-2A-F <400> 9 agcctgctga agcaggctgg agacgtggag gagaaccctg gacctatggc aaccttctcc 60 gctactggat 70 <210> 10 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> g-block for rEx-DLP-pp1ab-rFF <400> 10 aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc 60 attattatca tgacattaag catccgcctt tcgttttatt tgaccatgtt ggtatgtaat 120 acgactcact atagctcgaa gtgtgtatgg tgccatatac ggctcaccac catatacact 180 gcaagaatta ctattcttgt gggcccctct cggtaaatcc tagagggctt tcctctcgtt 240 attgcgagat tcgtcgttag ataacggcaa gttccctttc ttactatcct attttcatct 300 tgtggcttga cgggtcactg cctacgtcgt cgatctctat caactaccct tgcgacttag 360 gcaaccttct ccgctactgg atttggaggg agttttgtta gggactggtc cctggactta 420 cccgacgctt gtgagcatag tcagcatagt acatttcatc tgactaatac tacaacacca 480 ccaccatgaa tagaggattc tttaacatgc tcggccgccg ccccttcccg gcccccactg 540 ccatgtggag gccgcggaga aggaggcagg cggccccgat gatggcaac 589 <210> 11 <211> 655 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> g-block for rEx-DLP-2A-pp1ab-rFF <400> 11 aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc 60 attattatca tgacattaag catccgcctt tcgttttatt tgaccatgtt ggtatgtaat 120 acgactcact atagctcgaa gtgtgtatgg tgccatatac ggctcaccac catatacact 180 gcaagaatta ctattcttgt gggcccctct cggtaaatcc tagagggctt tcctctcgtt 240 attgcgagat tcgtcgttag ataacggcaa gttccctttc ttactatcct attttcatct 300 tgtggcttga cgggtcactg cctacgtcgt cgatctctat caactaccct tgcgacttag 360 gcaaccttct ccgctactgg atttggaggg agttttgtta gggactggtc cctggactta 420 cccgacgctt gtgagcatag tcagcatagt acatttcatc tgactaatac tacaacacca 480 ccaccatgaa tagaggattc tttaacatgc tcggccgccg ccccttcccg gcccccactg 540 ccatgtggag gccgcggaga aggaggcagg cggccccgat gggaagcgga gctactaact 600 tcagcctgct gaagcaggct ggagacgtgg aggagaaccc tggacctatg gcaac 655 <210> 12 <211> 655 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> g-block for rEx-DLP-2A-pp1ab-DLP-rFF <400> 12 aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc 60 attattatca tgacattaag catccgcctt tcgttttatt tgaccatgtt ggtatgtaat 120 acgactcact atagctcgaa gtgtgtatgg tgccatatac ggctcaccac catatacact 180 gcaagaatta ctattcttgt gggcccctct cggtaaatcc tagagggctt tcctctcgtt 240 attgcgagat tcgtcgttag ataacggcaa gttccctttc ttactatcct attttcatct 300 tgtggcttga cgggtcactg cctacgtcgt cgatctctat caactaccct tgcgacttag 360 gcaaccttct ccgctactgg atttggaggg agttttgtta gggactggtc cctggactta 420 cccgacgctt gtgagcatag tcagcatagt acatttcatc tgactaatac tacaacacca 480 ccaccatgaa tagaggattc tttaacatgc tcggccgccg ccccttcccg gcccccactg 540 ccatgtggag gccgcggaga aggaggcagg cggccccgat gggaagcgga gctactaact 600 tcagcctgct gaagcaggct ggagacgtgg aggagaaccc tggacctatg gcaac 655 <210> 13 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> primer DLP-pp1ab-screen-F <220> <221> misc_feature <223> RP126 <400> 13 cagcatcttt tactttcacc agcgtttctg 30 <210> 14 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> primer DLP-pp1ab-screen-R <220> <221> misc_feature <223> RP127 <400> 14 ggaactggcg aagccagttt taaca 25 <210> 15 <211> 12529 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Construct rEx-DLP-rFF <220> <221> misc_feature <222> (1)..(18) <223> T7 promoter <400> 15 taatacgact cactatagct cgaagtgtgt atggtgccat atacggctca ccaccatata 60 cactgcaaga attactattc ttgtgggccc ctctcggtaa atcctagagg gctttcctct 120 cgttattgcg agattcgtcg ttagataacg gcaagttccc tttcttacta tcctattttc 180 atcttgtggc ttgacgggtc actgccatcg tcgtcgatct ctatcaacta cccttgcgac 240 tatggcaacc ttctccgcta ctggatttgg agggagtttt gttagggact ggtccctgga 300 cttacccgac gcttgtgagc atggcgcggg attgtgctgc gaagtggacg gctccacctt 360 atgcgccgag tgttttcgcg gttgcgaagg aatggagcaa tgtcctggct tgttcatggg 420 actgttaaaa ctggcttcgc cagttccagt gggacataag ttcctgattg gttggtatcg 480 agctgccaaa gtcaccgggc gttacaattt ccttgagctg ttgcaacacc ctgctttcgc 540 ccagctgcgt gtggttgatg ctaggttagc cattgaagag gcaagtgtgt ttatttccac 600 tgaccacgcg tctgctaagc gtttccctgg cgctagattt gcgctgacac cggtgtatgc 660 taacgcttgg gttgtgagcc cggctgctaa cagtttgata gtgaccactg accaggaaca 720 agatgggttc tgctggttaa aacttttgcc acctgaccgc cgtgaggctg gtttgcggtt 780 gtattacaac cattaccgcg aacaaaggac cgggtggctg tctaaaacag gacttcgctt 840 atggcttgga gacctgggtt tgggcatcaa tgcgagctct ggagggctga aattccacat 900 tatgaggggt tcgcctcagc gagcttggca tatcacaaca cgcagctgca agctgaagag 960 ctactacgtt tgtgacatct ctgaagcaga ctggtcctgt ttgcctgctg gcaactacgg 1020 cggctacaat ccaccagggg acggagcttg cggttacagg tgcttggcct tcatgaatgg 1080 cgccactgtt gtgtcggctg gttgcagttc tgacttgtgg tgtgatgatg agttggctta 1140 tcgagtcttt caattgtcac ccacgttcac ggttaccatc ccaggtgggc gagtttgtcc 1200 gaatgccaag tacgcaatga tttgtgacaa gcagcactgg cgcgtcaaac gtgcaaaggg 1260 cgtcggcctg tgtctcgatg aaagctgttt caggggcatc tgcaattgcc aacgcatgag 1320 tggaccacca cctgcacccg tgtcagccgc cgtgttagat cacatactgg aggcggcgac 1380 gtttggcaac gttcgcgtgg ttacacctga agggcagcca cgccccgtac cagcgccgcg 1440 agttcgtccc agcgccaact cttctggaga tgtcaaagat ccggcgcccg ttccgccagt 1500 accaaaacca aggaccaagc ttgccacacc gaacccaact caggcgccca tcccagcacc 1560 gcgcacgcga cttcaagggg cctcaacaca ggagccactg gcgagtgcag gagttgcttc 1620 tgactcggca cctaaatggc gtgtggccaa aactgtgtac agctccgcgg agcgctttcg 1680 gaccgaactg gtacaacgtg ctcggtccgt tggggacgtt cttgttcaag cgctaccgct 1740 caaaacccca gcagtgcagc ggtataccat gactctgaag atgatgcgtt cacgcttcag 1800 ttggcactgc gacgtgtggt accctttggc tgtaatcgct tgtttgctcc ctatatggcc 1860 atctcttgct ttgctcctta gctttgccat tgggttgata cccagtgtgg gcaataatgt 1920 tgttctgaca gcgcttctgg tttcatcagc taattatgtt gcgtcaatgg accatcaatg 1980 tgaaggtgcg gcttgcttag ccttgctgga agaagaacac tattatagag cggtccgttg 2040 gcgcccgatt acaggcgcgc tgtcgcttgt gctcaattta ctggggcagg taggctatgt 2100 agctcgttcc acctttgatg cagcttatgt tccttgcact gtgttcgatc tttgcagctt 2160 tgctattctg tacctctgcc gcaatcgttg ctggagatgc ttcggacgct gtgtgcgagt 2220 tgggcctgcc acgcatgttt tgggctccac cgggcaacga gtttccaaac tggcgctcat 2280 tgatttgtgt gaccactttt caaagcccac catcgatgtt gtgggcatgg caactggttg 2340 gagcggatgt tacacaggaa ccgccgcaat ggagcgtcag tgtgcctcta cggtggaccc 2400 tcactcgttc gaccagaaga aggcaggagc gactgtttac ctcacccccc ctgtcaacag 2460 cgggtcagcg ctgcagtgcc tcaatgtcat gtggaagcga ccaattgggt ccactgtcct 2520 tggggaacaa acaggagctg ttgtgacggc ggtcaagagt atctctttct cacctccctg 2580 ctgcgtctct accactttgc ccacccgacc cggtgtgacc gttgtcgacc atgctcttta 2640 caaccggttg actgcttcag gggtcgatcc cgctttattg cgtgttgggc aaggtgattt 2700 tctaaaactt aatccggggt tccggctgat aggtggatgg atttatggga tatgctattt 2760 tgtgttggtg gttgtgtcaa cttttacctg cttacctatc aaatgtggca ttggcacccg 2820 cgaccctttc tgccgcagag tgttttctgt acccgtcacc aagacccaag agcactgcca 2880 tgctggaatg tgtgctagcg ctgaaggcat ctctctggac tctctggggt taactcagtt 2940 acaaagttac tggatcgcag ccgtcactag cggattagtg atcttgttgg tctgccaccg 3000 cctggccatc agcgccttgg acttgttgac tctagcttcc cctttagtgt tgcttgtgtt 3060 cccttgggca tctgtggggc ttttacttgc ttgcagtctc gctggtgctg ctgtgaaaat 3120 acagttgttg gcgacgcttt ttgtgaatct attctttccc caagctaccc ttgtcactat 3180 gggatactgg gcgtgcgtgg cggctttggc cgtttacagt ttgatgggct tgcgagtgaa 3240 agtgaatgtg cccatgtgtg tgacacctgc ccattttctg ctgctggcga ggtcagctgg 3300 acagtcaaga gagcagatgc tccgggtcag cgctgctgcc cccaccaatt cactgcttgg 3360 agtggctcgt gattgttatg tcacaggcac aactcggctg tacataccca aggaaggcgg 3420 gatggtgttt gaagggctat tcaggtcacc gaaggcgcgc ggcaacgtcg gcttcgtggc 3480 tggtagcagc tacggcacag ggtcagtgtg gaccaggaac aacgaggtcg tcgtactgac 3540 agcgtcacac gtggttggcc gcgctaacat ggccactctg aagatcggtg acgcaatgct 3600 gactctgact ttcaaaaaga atggcgactt cgccgaggca gtgacgacac agtccgagct 3660 cccaggcaat tggccacagt tgcatttcgc ccaaccaaca accgggcccg cttcatggtg 3720 cactgccaca ggagatgaag aaggcttgct cagtggcgag gtttgtctgg cgtggactac 3780 tagtggcgac tctggatctg cagtggttca gggtgacgct gtggtagggg tccacaccgg 3840 ttcgaacaca agtggtgttg cctacgtgac caccccaagc ggaaaactcc ttggcgccga 3900 caccgtgact ttgtcatcac tgtcaaagca tttcacaggc cctttgacat caatcccgaa 3960 ggacatccct gacaacatta ttgccgatgt tgatgctgtt cctcgttctc tggccatgct 4020 gattgatggc ttatccaata gagagagcag cctttctgga cctcagttgt tgttaattgc 4080 ttgttttatg tggtcttatc ttaaccaacc tgcttacttg ccttatgtgc tgggcttctt 4140 tgccgctaac ttcttcctgc caaaaagtgt tggccgccct gtggtcactg ggcttctatg 4200 gttgtgctgc ctcttcacac cgctttccat gcgcttgtgc ttgttccatc tggtctgtgc 4260 taccgtcacg ggaaacgtga tatctttgtg gttctacatc actgccgctg gcacgtctta 4320 cctttctgag atgtggttcg gaggctatcc caccatgttg tttgtgccac ggttcctagt 4380 gtaccagttc cccggctggg ctattggcac agtactagcg gtatgcagca tcaccatgct 4440 ggctgctgcc ctcggtcaca ccctgttact ggatgtgttc tccgcctcag gtcgctttga 4500 caggactttc atgatgaaat acttcctgga gggaggagtg aaagagagtg tcaccgcctc 4560 agtcacccgc gcttatggca aaccaattac ccaggagagt ctcactgcaa cattagctgc 4620 cctcactgat gatgacttcc aattcctctc tgatgtgctt gactgtcggg ccgtccgatc 4680 ggcaatgaat ctgcgtgccg ctctcacaag ttttcaagtg gcgcagtatc gtaacatcct 4740 taatgcatcc ttgcaagtcg atcgtgacgc tgctcgtagt cgcagactaa tggcaaaact 4800 ggctgatttt gcggttgaac aagaagtaac agctggagac cgtgttgtgg ttatcgacgg 4860 tctggaccgc atggctcact tcaaagacga tttggtgctg gttcctttga ccaccaaagt 4920 agtaggcggt tctaggtgca ccatttgtga cgtcgttaag gaagaagcca atgacacccc 4980 agttaagcca atgcccagca ggagacgccg caagggcctg cctaaaggtg ctcagttgga 5040 gtgggaccgt caccaggaag agaagaggaa cgccggtgat gatgattttg cggtctcgaa 5100 tgattatgtc aagagagtgc caaagtactg ggatcccagc gacacccgag gcacgacagt 5160 gaaaatcgcc ggcactacct atcagaaagt ggttgactat tcaggcaatg tgcattacgt 5220 ggagcatcag gaagatctgc tagactacgt gctgggcaag gggagctatg aaggcctaga 5280 tcaggacaaa gtgttggacc tcacaaacat gcttaaagtg gaccccacgg agctctcctc 5340 caaagacaaa gccaaggcgc gtcagcttgc tcatctgctg ttggatctgg ctaacccagt 5400 tgaggcagtg aatcagttaa actgagagcg ccccacatct ttcccggcga tgtggggcgt 5460 cggacctttg ctgactctaa agacaagggt ttcgtggctc tacacagtcg cacaatgttt 5520 ttagctgccc gggacttttt atttaacatc aaatttgtgt gcgacgaaga gttcacaaag 5580 accccaaaag acacactgct tgggtacgta cgcgcctgcc ctggttactg gtttattttc 5640 cgtcgtacgc accggtcgct gattgatgca tactgggaca gtatggagtg cgtttacgcg 5700 cttcccacca tatctgattt tgatgtgagc ccaggtgacg tcgcagtgac gggcgagcga 5760 tgggattttg aatctcccgg aggaggccgt gcaaaacgtc tcacagctga tctggtgcac 5820 gcttttcaag ggttccacgg agcctcttat tcctatgatg acaaggtggc agctgctgtc 5880 agtggtgacc cgtatcggtc ggacggcgtc ttgtataaca cccgttgggg caacattcca 5940 tattctgtcc caaccaatgc tttggaagcc acagcttgct accgtgctgg atgtgaggcc 6000 gttaccgacg ggaccaacgt catcgcaaca attgggccct tcccggagca acaacccata 6060 ccggacatcc caaagagcgt gcttgacaac tgcgctgaca tcagctgtga cgctttcata 6120 gcgcccgctg cagagacagc cctgtgtgga gatttagaga aatacaacct atccacgcag 6180 ggttttgtgt tgcctagtgt tttctccatg gtgcgggcgt acttaaaaga ggagattgga 6240 gacgctccac cactctactt gccatctact gtaccatcta aaaattcaca agccggaatt 6300 aacggcgctg agtttcctac aaagtcttta cagagctact gtttgattga tgacatggtg 6360 tcacagtcca tgaaaagcaa tctacaaacc gccaccatgg cgacttgtaa acggcaatac 6420 tgttccaaat acaagattag gagcattctg ggcaccaaca attacattgg cctaggtttg 6480 cgtgcctgcc tttcgggggt tacggccgca ttccaaaaag ctggaaagga tgggtcaccg 6540 atttatttgg gcaagtcaaa attcgacccg ataccagctc ctgacaagta ctgccttgaa 6600 acagacctgg agagttgtga tcgctccacc ccggctttgg tgcgttggtt cgctactaat 6660 cttatttttg agctagctgg ccagcccgag ttggtgcaca gctacgtgtt gaattgctgt 6720 cacgatctag ttgtggcggg tagtgtagca ttcaccaaac gcgggggttt gtcatctgga 6780 gaccctatca cttccatttc caataccatc tattcattgg tgctgtacac ccagcacatg 6840 ttgctatgtg gacttgaagg ctatttccca gagattgcag aaaaatatct tgatggcagc 6900 ctggagctgc gggacatgtt caagtacgtt cgagtgtaca tctactcgga cgatgtggtt 6960 ctaaccacac ccaaccagca ttacgcggcc agctttgacc gctgggtccc ccacctgcag 7020 gcgctgctag gtttcaaggt tgacccaaag aaaactgtga acaccagctc cccttccttt 7080 ttgggctgcc ggttcaagca agtggacggc aagtgttatc tagccagtct tcaggaccgc 7140 gttacacgct ctctgttata ccacattggt gcaaagaatc cctcagagta ctatgaagct 7200 gctgtttcca tctttaagga ctccattatc tgctgtgatg aagactggtg gacggacctc 7260 catcgacgta tcagtggcgc tgcgcgtacc gacggagttg agttccccac cattgaaatg 7320 ttaacatcct tccgcaccaa gcagtatgag agtgccgtgt gcacagtttg tggggccgcc 7380 cccgtggcca agtctgcttg tggagggtgg ttctgtggca attgtgtccc gtaccacgcg 7440 ggtcattgtc acacaacctc gctcttcgcc aactgcgggc acgacatcat gtaccgctcc 7500 acttactgca caatgtgtga gggttcccca aaacagatgg taccaaaagt gcctcacccg 7560 atcctggatc atttgctgtg ccacattgat tacggcagta aagaggaact aactctggta 7620 gtggcggatg gtcgaacaac atcaccgccc gggcgctaca aagtgggtca caaggtagtc 7680 gccgtggttg cagatgtggg aggcaacatt gtgtttgggt gcggtcctgg atcacacatc 7740 gcagtaccac ttcaggatac gctcaagggc gtggtggtga ataaagctct gaagaacgcc 7800 gccgcctctg agtacgtgga aggaccccct gggagtggga agacttttca cctggtcaaa 7860 gatgtgctag ccgtggtcgg tagcgcgacc ttggttgtgc ccacccacgc gtccatgctg 7920 gactgcatca acaagctcaa acaagcgggc gccgatccat actttgtggt gcccaagtat 7980 acagttcttg actttccccg gcctggcagt ggaaacatca cagtgcgact gccacaggtc 8040 ggaaccagtg agggagaaac ctttgtggat gaggtggcct acttctcacc agtggatctg 8100 gcgcgcattt taacccaggg tcgagtcaag ggttacggtg atttaaatca gctcgggtgc 8160 gtcggacccg cgagcgtgcc acgtaacctt tggctccgac attttgtcag cctggagccc 8220 ttgcgagtgt gccatcgatt cggcgctgct gtgtgtgatt tgatcaaggg catttatcct 8280 tattatgagc cagctccaca taccactaaa gtggtgtttg tgccaaatcc agactttgag 8340 aaaggtgtag tcatcaccgc ctaccacaaa gatcgcggtc ttggtcaccg cacaattgat 8400 tcaattcaag gctgtacatt ccctgttgtg actcttcgac tgcccacacc ccaatcactg 8460 acgcgcccgc gcgcagttgt ggcggttact agggcgtctc aggaattata catctacgac 8520 ccctttgatc agcttagcgg gttgttgaag ttcaccaagg aagcagaggc gcaggacttg 8580 atccatggcc cacctacagc atgccacctg ggccaagaaa ttgacctttg gtccaatgag 8640 ggcctcgaat attacaagga agtcaacctg ctgtacacac acgtccccat caaggatggt 8700 gtaatacaca gttaccctaa ttgtggccct gcctgtggct gggaaaagca atccaacaaa 8760 atttcgtgcc tcccgagagt ggcacaaaat ttgggctacc actattcccc agacttacca 8820 ggattttgcc ccataccaaa agaactcgct gagcattggc ccgtagtgtc caatgataga 8880 tacccgaatt gcttgcaaat taccttacag caagtatgtg aactcagtaa accgtgctca 8940 gcgggctata tggttggaca atcggttttc gtgcagacgc ctggtgtgac atcttactgg 9000 cttactgaat gggtcgacgg caaagcgcgt gctctaccag attccttatt ctcgtccggt 9060 aggttcgaga ctaacagccg cgctttcctc gatgaagccg aggaaaagtt tgccgccgct 9120 caccctcatg cctgtttggg agaaattaat aagtccaccg tgggaggatc ccacttcatc 9180 ttttcccaat atttaccacc attgctaccc gcagacgctg ttgccctggt aggtgcttca 9240 ttggctggga aagctgctaa agctgcttgc agcgttgttg atgtctatgc tccatcattt 9300 gaaccttatc tacaccctga gacactgagt cgcgtgtaca agattatgat cgatttcaag 9360 ccgtgtaggc ttatggtgtg gagaaacgcg accttttatg tccaagaggg tgttgatgca 9420 gttacatcag cactagcagc tgtgtccaaa ctcatcaaag tgccggccaa tgagcctgtt 9480 tcattccatg tggcatcagg gtacagaacc aacgcgctgg tagcgcccca ggctaaaatt 9540 tcaattggag cctacgccgc cgagtgggca ctgtcaactg aaccgccacc tgctggttat 9600 gcgatcgtgc ggcgatatat tgtaaagagg ctcctcagct caacagaagt gttcttgtgc 9660 cgcaggggtg ttgtgtcttc cacctcagtg cagaccattt gtgcactaga gggatgtaaa 9720 cctctgttca acttcttaca aattggttca gtcattgggc ccgtgtgact ctagagtgga 9780 cctgttccca tcccccgctc aactactcag gtagtggttc gcggcaacgg gtacaccgca 9840 gttggtaaca agcttgtcga tagtcagcat agtacatttc atctgactaa tactacaaca 9900 ccaccaccat gaatagagga ttctttaaca tgctcggccg ccgccccttc ccggccccca 9960 ctgccatgtg gaggccgcgg agaaggaggc aggcggcccc gatgatggaa aatatggaaa 10020 acgacgagaa catcgtggtg ggccccaagc ccttctaccc catcgaggaa ggcagcgccg 10080 gcacccagct gcggaagtac atggaaagat acgccaagct gggcgccatt gccttcacca 10140 acgccgtgac cggcgtggac tacagctacg ccgagtacct ggaaaagagc tgctgcctgg 10200 gcaaggctct gcagaactac ggcctggtgg tggacggccg gatcgccctg tgcagcgaga 10260 actgcgagga attcttcatc cccgtgatcg ccggcctgtt catcggcgtg ggcgtggctc 10320 ccaccaacga gatctacacc ctgcgggagc tggtgcacag cctgggcatc agcaagccca 10380 ccatcgtgtt cagcagcaag aagggcctgg acaaagtcat caccgtgcag aaaaccgtga 10440 ccaccatcaa gaccatcgtg atcctggaca gcaaggtgga ctaccggggc taccagtgcc 10500 tggacacctt catcaagcgg aacacccccc ctggcttcca ggccagcagc ttcaagaccg 10560 tggaggtgga ccggaaagaa caggtggccc tgatcatgaa cagcagcggc agcaccggcc 10620 tgcccaaggg cgtgcagctg acccacgaga acaccgtgac ccggttcagc cacgccaggg 10680 accccatcta cggcaaccag gtgtcccccg gcaccgccgt gctgaccgtg gtgcccttcc 10740 accacggctt cggcatgttc accaccctgg gctacctgat ctgcggcttc cgggtggtga 10800 tgctgaccaa gttcgacgag gaaaccttcc tgaaaaccct gcaggactac aagtgcacct 10860 acgtgattct ggtgcccacc ctgttcgcca tcctgaacaa gagcgagctg ctgaacaagt 10920 acgacctgag caacctggtg gagatcgcca gcggcggagc ccccctgagc aaagaagtgg 10980 gagaggccgt cgccaggcgg ttcaatctgc ccggcgtgcg gcagggctac ggcctgaccg 11040 agacaaccag cgccatcatc atcacccccg agggcgacga caagcctgga gccagcggca 11100 aggtggtgcc cctgttcaag gccaaagtga tcgacctgga caccaagaag agcctgggcc 11160 ccaacagacg gggcgaagtg tgcgtgaagg gccccatgct gatgaagggc tacgtgaaca 11220 accccgaggc caccaaagag ctgatcgacg aagagggctg gctgcacacc ggcgacatcg 11280 gctactacga cgaagagaag cacttcttca tcgtggaccg gctgaagagc ctgatcaagt 11340 acaagggcta tcaggtgccc cctgccgagc tggaaagcgt cctgctgcag caccccagca 11400 tcttcgacgc cggcgtggcc ggggtgccag atcctgtggc cggcgagctg cctggcgccg 11460 tggtggtgct ggaatccggc aagaacatga ccgagaaaga agtgatggac tacgtcgcca 11520 gccaggtgtc caacgccaag cggctgagag gcggcgtgag attcgtggac gaagtgccaa 11580 agggcctgac cggcaagatc gacggcaggg ccatccggga gatcctgaag aaacccgtgg 11640 ccaagatgtg attataactc gagggagcca tagattcatt ttgtggtgac gggattttag 11700 gtgagtatct agattacttt attctgtccg tcccactctt gctgttgctt actaggtatg 11760 tagcatctgg gttagtgtat gttttgactg ccttgttcta ttcctttgta ttagcagctt 11820 atatttggtt tgttatagtt ggaagagcct tttctactgc ttatgctttt gtgcttttgg 11880 ctgcttttct gttattagta atgaggatga ttgtgggtat gatgcctcgt cttcggtcca 11940 ttttcaacca tcgccaactg gtggtagctg attttgtgga cacacctagt ggacctgttc 12000 ccatcccccg cccaaccact caggtagtgg ttcgcggcaa cgggtacacc gcagttggta 12060 acaagcttgt cgatggcgtc aagacgatca cgtccgcagg ccgcctcttt tcgaaacgga 12120 cggcggcgac agcctacaag ctacaatgac ctactgcgca tgtttggtca gatgcgggtc 12180 cgcaaaccgc ccgcgcaacc cactcaggct attattgcag agcctggaga ccttaggcat 12240 gatttaaatc aacaggagcg cgccaccctt tcgtcgaacg tacaacggtt cttcatgatt 12300 gggcatggtt cactcactgc agatgccgga ggactcacgt acaccgtcag ttgggttcct 12360 accaaacaaa tccagcgcaa agttgcgcct ccagcagggc cgtaagacgt ggatattctc 12420 ctgtgtggcg tcatgttgaa gtagttatta gccacccagg aaccaaaaaa aaaaaaaaaa 12480 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaa 12529 <210> 16 <211> 12608 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Construct rEx-DLP-pp1ab-rFF <220> <221> misc_feature <222> (1)..(18) <223> T7 promoter <400> 16 taatacgact cactatagct cgaagtgtgt atggtgccat atacggctca ccaccatata 60 cactgcaaga attactattc ttgtgggccc ctctcggtaa atcctagagg gctttcctct 120 cgttattgcg agattcgtcg ttagataacg gcaagttccc tttcttacta tcctattttc 180 atcttgtggc ttgacgggtc actgcctacg tcgtcgatct ctatcaacta cccttgcgac 240 ttaggcaacc ttctccgcta ctggatttgg agggagtttt gttagggact ggtccctgga 300 cttacccgac gcttgtgagc atagtcagca tagtacattt catctgacta atactacaac 360 accaccacca tgaatagagg attctttaac atgctcggcc gccgcccctt cccggccccc 420 actgccatgt ggaggccgcg gagaaggagg caggcggccc cgatgatggc aaccttctcc 480 gctactggat ttggagggag ttttgttagg gactggtccc tggacttacc cgacgcttgt 540 gagcatggcg cgggattgtg ctgcgaagtg gacggctcca ccttatgcgc cgagtgtttt 600 cgcggttgcg aaggaatgga gcaatgtcct ggcttgttca tgggactgtt aaaactggct 660 tcgccagttc cagtgggaca taagttcctg attggttggt atcgagctgc caaagtcacc 720 gggcgttaca atttccttga gctgttgcaa caccctgctt tcgcccagct gcgtgtggtt 780 gatgctaggt tagccattga agaggcaagt gtgtttattt ccactgacca cgcgtctgct 840 aagcgtttcc ctggcgctag atttgcgctg acaccggtgt atgctaacgc ttgggttgtg 900 agcccggctg ctaacagttt gatagtgacc actgaccagg aacaagatgg gttctgctgg 960 ttaaaacttt tgccacctga ccgccgtgag gctggtttgc ggttgtatta caaccattac 1020 cgcgaacaaa ggaccgggtg gctgtctaaa acaggacttc gcttatggct tggagacctg 1080 ggtttgggca tcaatgcgag ctctggaggg ctgaaattcc acattatgag gggttcgcct 1140 cagcgagctt ggcatatcac aacacgcagc tgcaagctga agagctacta cgtttgtgac 1200 atctctgaag cagactggtc ctgtttgcct gctggcaact acggcggcta caatccacca 1260 ggggacggag cttgcggtta caggtgcttg gccttcatga atggcgccac tgttgtgtcg 1320 gctggttgca gttctgactt gtggtgtgat gatgagttgg cttatcgagt ctttcaattg 1380 tcacccacgt tcacggttac catcccaggt gggcgagttt gtccgaatgc caagtacgca 1440 atgatttgtg acaagcagca ctggcgcgtc aaacgtgcaa agggcgtcgg cctgtgtctc 1500 gatgaaagct gtttcagggg catctgcaat tgccaacgca tgagtggacc accacctgca 1560 cccgtgtcag ccgccgtgtt agatcacata ctggaggcgg cgacgtttgg caacgttcgc 1620 gtggttacac ctgaagggca gccacgcccc gtaccagcgc cgcgagttcg tcccagcgcc 1680 aactcttctg gagatgtcaa agatccggcg cccgttccgc cagtaccaaa accaaggacc 1740 aagcttgcca caccgaaccc aactcaggcg cccatcccag caccgcgcac gcgacttcaa 1800 ggggcctcaa cacaggagcc actggcgagt gcaggagttg cttctgactc ggcacctaaa 1860 tggcgtgtgg ccaaaactgt gtacagctcc gcggagcgct ttcggaccga actggtacaa 1920 cgtgctcggt ccgttgggga cgttcttgtt caagcgctac cgctcaaaac cccagcagtg 1980 cagcggtata ccatgactct gaagatgatg cgttcacgct tcagttggca ctgcgacgtg 2040 tggtaccctt tggctgtaat cgcttgtttg ctccctatat ggccatctct tgctttgctc 2100 cttagctttg ccattgggtt gatacccagt gtgggcaata atgttgttct gacagcgctt 2160 ctggtttcat cagctaatta tgttgcgtca atggaccatc aatgtgaagg tgcggcttgc 2220 ttagccttgc tggaagaaga acactattat agagcggtcc gttggcgccc gattacaggc 2280 gcgctgtcgc ttgtgctcaa tttactgggg caggtaggct atgtagctcg ttccaccttt 2340 gatgcagctt atgttccttg cactgtgttc gatctttgca gctttgctat tctgtacctc 2400 tgccgcaatc gttgctggag atgcttcgga cgctgtgtgc gagttgggcc tgccacgcat 2460 gttttgggct ccaccgggca acgagtttcc aaactggcgc tcattgattt gtgtgaccac 2520 ttttcaaagc ccaccatcga tgttgtgggc atggcaactg gttggagcgg atgttacaca 2580 ggaaccgccg caatggagcg tcagtgtgcc tctacggtgg accctcactc gttcgaccag 2640 aagaaggcag gagcgactgt ttacctcacc ccccctgtca acagcgggtc agcgctgcag 2700 tgcctcaatg tcatgtggaa gcgaccaatt gggtccactg tccttgggga acaaacagga 2760 gctgttgtga cggcggtcaa gagtatctct ttctcacctc cctgctgcgt ctctaccact 2820 ttgcccaccc gacccggtgt gaccgttgtc gaccatgctc tttacaaccg gttgactgct 2880 tcaggggtcg atcccgcttt attgcgtgtt gggcaaggtg attttctaaa acttaatccg 2940 gggttccggc tgataggtgg atggatttat gggatatgct attttgtgtt ggtggttgtg 3000 tcaactttta cctgcttacc tatcaaatgt ggcattggca cccgcgaccc tttctgccgc 3060 agagtgtttt ctgtacccgt caccaagacc caagagcact gccatgctgg aatgtgtgct 3120 agcgctgaag gcatctctct ggactctctg gggttaactc agttacaaag ttactggatc 3180 gcagccgtca ctagcggatt agtgatcttg ttggtctgcc accgcctggc catcagcgcc 3240 ttggacttgt tgactctagc ttccccttta gtgttgcttg tgttcccttg ggcatctgtg 3300 gggcttttac ttgcttgcag tctcgctggt gctgctgtga aaatacagtt gttggcgacg 3360 ctttttgtga atctattctt tccccaagct acccttgtca ctatgggata ctgggcgtgc 3420 gtggcggctt tggccgttta cagtttgatg ggcttgcgag tgaaagtgaa tgtgcccatg 3480 tgtgtgacac ctgcccattt tctgctgctg gcgaggtcag ctggacagtc aagagagcag 3540 atgctccggg tcagcgctgc tgcccccacc aattcactgc ttggagtggc tcgtgattgt 3600 tatgtcacag gcacaactcg gctgtacata cccaaggaag gcgggatggt gtttgaaggg 3660 ctattcaggt caccgaaggc gcgcggcaac gtcggcttcg tggctggtag cagctacggc 3720 acagggtcag tgtggaccag gaacaacgag gtcgtcgtac tgacagcgtc acacgtggtt 3780 ggccgcgcta acatggccac tctgaagatc ggtgacgcaa tgctgactct gactttcaaa 3840 aagaatggcg acttcgccga ggcagtgacg acacagtccg agctcccagg caattggcca 3900 cagttgcatt tcgcccaacc aacaaccggg cccgcttcat ggtgcactgc cacaggagat 3960 gaagaaggct tgctcagtgg cgaggtttgt ctggcgtgga ctactagtgg cgactctgga 4020 tctgcagtgg ttcagggtga cgctgtggta ggggtccaca ccggttcgaa cacaagtggt 4080 gttgcctacg tgaccacccc aagcggaaaa ctccttggcg ccgacaccgt gactttgtca 4140 tcactgtcaa agcatttcac aggccctttg acatcaatcc cgaaggacat ccctgacaac 4200 attattgccg atgttgatgc tgttcctcgt tctctggcca tgctgattga tggcttatcc 4260 aatagagaga gcagcctttc tggacctcag ttgttgttaa ttgcttgttt tatgtggtct 4320 tatcttaacc aacctgctta cttgccttat gtgctgggct tctttgccgc taacttcttc 4380 ctgccaaaaa gtgttggccg ccctgtggtc actgggcttc tatggttgtg ctgcctcttc 4440 acaccgcttt ccatgcgctt gtgcttgttc catctggtct gtgctaccgt cacgggaaac 4500 gtgatatctt tgtggttcta catcactgcc gctggcacgt cttacctttc tgagatgtgg 4560 ttcggaggct atcccaccat gttgtttgtg ccacggttcc tagtgtacca gttccccggc 4620 tgggctattg gcacagtact agcggtatgc agcatcacca tgctggctgc tgccctcggt 4680 cacaccctgt tactggatgt gttctccgcc tcaggtcgct ttgacaggac tttcatgatg 4740 aaatacttcc tggagggagg agtgaaagag agtgtcaccg cctcagtcac ccgcgcttat 4800 ggcaaaccaa ttacccagga gagtctcact gcaacattag ctgccctcac tgatgatgac 4860 ttccaattcc tctctgatgt gcttgactgt cgggccgtcc gatcggcaat gaatctgcgt 4920 gccgctctca caagttttca agtggcgcag tatcgtaaca tccttaatgc atccttgcaa 4980 gtcgatcgtg acgctgctcg tagtcgcaga ctaatggcaa aactggctga ttttgcggtt 5040 gaacaagaag taacagctgg agaccgtgtt gtggttatcg acggtctgga ccgcatggct 5100 cacttcaaag acgatttggt gctggttcct ttgaccacca aagtagtagg cggttctagg 5160 tgcaccattt gtgacgtcgt taaggaagaa gccaatgaca ccccagttaa gccaatgccc 5220 agcaggagac gccgcaaggg cctgcctaaa ggtgctcagt tggagtggga ccgtcaccag 5280 gaagagaaga ggaacgccgg tgatgatgat tttgcggtct cgaatgatta tgtcaagaga 5340 gtgccaaagt actgggatcc cagcgacacc cgaggcacga cagtgaaaat cgccggcact 5400 acctatcaga aagtggttga ctattcaggc aatgtgcatt acgtggagca tcaggaagat 5460 ctgctagact acgtgctggg caaggggagc tatgaaggcc tagatcagga caaagtgttg 5520 gacctcacaa acatgcttaa agtggacccc acggagctct cctccaaaga caaagccaag 5580 gcgcgtcagc ttgctcatct gctgttggat ctggctaacc cagttgaggc agtgaatcag 5640 ttaaactgag agcgccccac atctttcccg gcgatgtggg gcgtcggacc tttgctgact 5700 ctaaagacaa gggtttcgtg gctctacaca gtcgcacaat gtttttagct gcccgggact 5760 ttttatttaa catcaaattt gtgtgcgacg aagagttcac aaagacccca aaagacacac 5820 tgcttgggta cgtacgcgcc tgccctggtt actggtttat tttccgtcgt acgcaccggt 5880 cgctgattga tgcatactgg gacagtatgg agtgcgttta cgcgcttccc accatatctg 5940 attttgatgt gagcccaggt gacgtcgcag tgacgggcga gcgatgggat tttgaatctc 6000 ccggaggagg ccgtgcaaaa cgtctcacag ctgatctggt gcacgctttt caagggttcc 6060 acggagcctc ttattcctat gatgacaagg tggcagctgc tgtcagtggt gacccgtatc 6120 ggtcggacgg cgtcttgtat aacacccgtt ggggcaacat tccatattct gtcccaacca 6180 atgctttgga agccacagct tgctaccgtg ctggatgtga ggccgttacc gacgggacca 6240 acgtcatcgc aacaattggg cccttcccgg agcaacaacc cataccggac atcccaaaga 6300 gcgtgcttga caactgcgct gacatcagct gtgacgcttt catagcgccc gctgcagaga 6360 cagccctgtg tggagattta gagaaataca acctatccac gcagggtttt gtgttgccta 6420 gtgttttctc catggtgcgg gcgtacttaa aagaggagat tggagacgct ccaccactct 6480 acttgccatc tactgtacca tctaaaaatt cacaagccgg aattaacggc gctgagtttc 6540 ctacaaagtc tttacagagc tactgtttga ttgatgacat ggtgtcacag tccatgaaaa 6600 gcaatctaca aaccgccacc atggcgactt gtaaacggca atactgttcc aaatacaaga 6660 ttaggagcat tctgggcacc aacaattaca ttggcctagg tttgcgtgcc tgcctttcgg 6720 gggttacggc cgcattccaa aaagctggaa aggatgggtc accgatttat ttgggcaagt 6780 caaaattcga cccgatacca gctcctgaca agtactgcct tgaaacagac ctggagagtt 6840 gtgatcgctc caccccggct ttggtgcgtt ggttcgctac taatcttatt tttgagctag 6900 ctggccagcc cgagttggtg cacagctacg tgttgaattg ctgtcacgat ctagttgtgg 6960 cgggtagtgt agcattcacc aaacgcgggg gtttgtcatc tggagaccct atcacttcca 7020 tttccaatac catctattca ttggtgctgt acacccagca catgttgcta tgtggacttg 7080 aaggctattt cccagagatt gcagaaaaat atcttgatgg cagcctggag ctgcgggaca 7140 tgttcaagta cgttcgagtg tacatctact cggacgatgt ggttctaacc acacccaacc 7200 agcattacgc ggccagcttt gaccgctggg tcccccacct gcaggcgctg ctaggtttca 7260 aggttgaccc aaagaaaact gtgaacacca gctccccttc ctttttgggc tgccggttca 7320 agcaagtgga cggcaagtgt tatctagcca gtcttcagga ccgcgttaca cgctctctgt 7380 tataccacat tggtgcaaag aatccctcag agtactatga agctgctgtt tccatcttta 7440 aggactccat tatctgctgt gatgaagact ggtggacgga cctccatcga cgtatcagtg 7500 gcgctgcgcg taccgacgga gttgagttcc ccaccattga aatgttaaca tccttccgca 7560 ccaagcagta tgagagtgcc gtgtgcacag tttgtggggc cgcccccgtg gccaagtctg 7620 cttgtggagg gtggttctgt ggcaattgtg tcccgtacca cgcgggtcat tgtcacacaa 7680 cctcgctctt cgccaactgc gggcacgaca tcatgtaccg ctccacttac tgcacaatgt 7740 gtgagggttc cccaaaacag atggtaccaa aagtgcctca cccgatcctg gatcatttgc 7800 tgtgccacat tgattacggc agtaaagagg aactaactct ggtagtggcg gatggtcgaa 7860 caacatcacc gcccgggcgc tacaaagtgg gtcacaaggt agtcgccgtg gttgcagatg 7920 tgggaggcaa cattgtgttt gggtgcggtc ctggatcaca catcgcagta ccacttcagg 7980 atacgctcaa gggcgtggtg gtgaataaag ctctgaagaa cgccgccgcc tctgagtacg 8040 tggaaggacc ccctgggagt gggaagactt ttcacctggt caaagatgtg ctagccgtgg 8100 tcggtagcgc gaccttggtt gtgcccaccc acgcgtccat gctggactgc atcaacaagc 8160 tcaaacaagc gggcgccgat ccatactttg tggtgcccaa gtatacagtt cttgactttc 8220 cccggcctgg cagtggaaac atcacagtgc gactgccaca ggtcggaacc agtgagggag 8280 aaacctttgt ggatgaggtg gcctacttct caccagtgga tctggcgcgc attttaaccc 8340 agggtcgagt caagggttac ggtgatttaa atcagctcgg gtgcgtcgga cccgcgagcg 8400 tgccacgtaa cctttggctc cgacattttg tcagcctgga gcccttgcga gtgtgccatc 8460 gattcggcgc tgctgtgtgt gatttgatca agggcattta tccttattat gagccagctc 8520 cacataccac taaagtggtg tttgtgccaa atccagactt tgagaaaggt gtagtcatca 8580 ccgcctacca caaagatcgc ggtcttggtc accgcacaat tgattcaatt caaggctgta 8640 cattccctgt tgtgactctt cgactgccca caccccaatc actgacgcgc ccgcgcgcag 8700 ttgtggcggt tactagggcg tctcaggaat tatacatcta cgaccccttt gatcagctta 8760 gcgggttgtt gaagttcacc aaggaagcag aggcgcagga cttgatccat ggcccaccta 8820 cagcatgcca cctgggccaa gaaattgacc tttggtccaa tgagggcctc gaatattaca 8880 aggaagtcaa cctgctgtac acacacgtcc ccatcaagga tggtgtaata cacagttacc 8940 ctaattgtgg ccctgcctgt ggctgggaaa agcaatccaa caaaatttcg tgcctcccga 9000 gagtggcaca aaatttgggc taccactatt ccccagactt accaggattt tgccccatac 9060 caaaagaact cgctgagcat tggcccgtag tgtccaatga tagatacccg aattgcttgc 9120 aaattacctt acagcaagta tgtgaactca gtaaaccgtg ctcagcgggc tatatggttg 9180 gacaatcggt tttcgtgcag acgcctggtg tgacatctta ctggcttact gaatgggtcg 9240 acggcaaagc gcgtgctcta ccagattcct tattctcgtc cggtaggttc gagactaaca 9300 gccgcgcttt cctcgatgaa gccgaggaaa agtttgccgc cgctcaccct catgcctgtt 9360 tgggagaaat taataagtcc accgtgggag gatcccactt catcttttcc caatatttac 9420 caccattgct acccgcagac gctgttgccc tggtaggtgc ttcattggct gggaaagctg 9480 ctaaagctgc ttgcagcgtt gttgatgtct atgctccatc atttgaacct tatctacacc 9540 ctgagacact gagtcgcgtg tacaagatta tgatcgattt caagccgtgt aggcttatgg 9600 tgtggagaaa cgcgaccttt tatgtccaag agggtgttga tgcagttaca tcagcactag 9660 cagctgtgtc caaactcatc aaagtgccgg ccaatgagcc tgtttcattc catgtggcat 9720 cagggtacag aaccaacgcg ctggtagcgc cccaggctaa aatttcaatt ggagcctacg 9780 ccgccgagtg ggcactgtca actgaaccgc cacctgctgg ttatgcgatc gtgcggcgat 9840 atattgtaaa gaggctcctc agctcaacag aagtgttctt gtgccgcagg ggtgttgtgt 9900 cttccacctc agtgcagacc atttgtgcac tagagggatg taaacctctg ttcaacttct 9960 tacaaattgg ttcagtcatt gggcccgtgt gactctagag tggacctgtt cccatccccc 10020 gctcaactac tcaggtagtg gttcgcggca acgggtacac cgcagttggt aacaagcttg 10080 tcgatggaaa atatggaaaa cgacgagaac atcgtggtgg gccccaagcc cttctacccc 10140 atcgaggaag gcagcgccgg cacccagctg cggaagtaca tggaaagata cgccaagctg 10200 ggcgccattg ccttcaccaa cgccgtgacc ggcgtggact acagctacgc cgagtacctg 10260 gaaaagagct gctgcctggg caaggctctg cagaactacg gcctggtggt ggacggccgg 10320 atcgccctgt gcagcgagaa ctgcgaggaa ttcttcatcc ccgtgatcgc cggcctgttc 10380 atcggcgtgg gcgtggctcc caccaacgag atctacaccc tgcgggagct ggtgcacagc 10440 ctgggcatca gcaagcccac catcgtgttc agcagcaaga agggcctgga caaagtcatc 10500 accgtgcaga aaaccgtgac caccatcaag accatcgtga tcctggacag caaggtggac 10560 taccggggct accagtgcct ggacaccttc atcaagcgga acaccccccc tggcttccag 10620 gccagcagct tcaagaccgt ggaggtggac cggaaagaac aggtggccct gatcatgaac 10680 agcagcggca gcaccggcct gcccaagggc gtgcagctga cccacgagaa caccgtgacc 10740 cggttcagcc acgccaggga ccccatctac ggcaaccagg tgtcccccgg caccgccgtg 10800 ctgaccgtgg tgcccttcca ccacggcttc ggcatgttca ccaccctggg ctacctgatc 10860 tgcggcttcc gggtggtgat gctgaccaag ttcgacgagg aaaccttcct gaaaaccctg 10920 caggactaca agtgcaccta cgtgattctg gtgcccaccc tgttcgccat cctgaacaag 10980 agcgagctgc tgaacaagta cgacctgagc aacctggtgg agatcgccag cggcggagcc 11040 cccctgagca aagaagtggg agaggccgtc gccaggcggt tcaatctgcc cggcgtgcgg 11100 cagggctacg gcctgaccga gacaaccagc gccatcatca tcacccccga gggcgacgac 11160 aagcctggag ccagcggcaa ggtggtgccc ctgttcaagg ccaaagtgat cgacctggac 11220 accaagaaga gcctgggccc caacagacgg ggcgaagtgt gcgtgaaggg ccccatgctg 11280 atgaagggct acgtgaacaa ccccgaggcc accaaagagc tgatcgacga agagggctgg 11340 ctgcacaccg gcgacatcgg ctactacgac gaagagaagc acttcttcat cgtggaccgg 11400 ctgaagagcc tgatcaagta caagggctat caggtgcccc ctgccgagct ggaaagcgtc 11460 ctgctgcagc accccagcat cttcgacgcc ggcgtggccg gggtgccaga tcctgtggcc 11520 ggcgagctgc ctggcgccgt ggtggtgctg gaatccggca agaacatgac cgagaaagaa 11580 gtgatggact acgtcgccag ccaggtgtcc aacgccaagc ggctgagagg cggcgtgaga 11640 ttcgtggacg aagtgccaaa gggcctgacc ggcaagatcg acggcagggc catccgggag 11700 atcctgaaga aacccgtggc caagatgtga ttataactcg agggagccat agattcattt 11760 tgtggtgacg ggattttagg tgagtatcta gattacttta ttctgtccgt cccactcttg 11820 ctgttgctta ctaggtatgt agcatctggg ttagtgtatg ttttgactgc cttgttctat 11880 tcctttgtat tagcagctta tatttggttt gttatagttg gaagagcctt ttctactgct 11940 tatgcttttg tgcttttggc tgcttttctg ttattagtaa tgaggatgat tgtgggtatg 12000 atgcctcgtc ttcggtccat tttcaaccat cgccaactgg tggtagctga ttttgtggac 12060 acacctagtg gacctgttcc catcccccgc ccaaccactc aggtagtggt tcgcggcaac 12120 gggtacaccg cagttggtaa caagcttgtc gatggcgtca agacgatcac gtccgcaggc 12180 cgcctctttt cgaaacggac ggcggcgaca gcctacaagc tacaatgacc tactgcgcat 12240 gtttggtcag atgcgggtcc gcaaaccgcc cgcgcaaccc actcaggcta ttattgcaga 12300 gcctggagac cttaggcatg atttaaatca acaggagcgc gccacccttt cgtcgaacgt 12360 acaacggttc ttcatgattg ggcatggttc actcactgca gatgccggag gactcacgta 12420 caccgtcagt tgggttccta ccaaacaaat ccagcgcaaa gttgcgcctc cagcagggcc 12480 gtaagacgtg gatattctcc tgtgtggcgt catgttgaag tagttattag ccacccagga 12540 accaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 12600 aaaaaaaa 12608 <210> 17 <211> 12674 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Construct rEx-DLP-2A-pp1ab-rFF <220> <221> misc_feature <222> (1)..(18) <223> T7 promoter <400> 17 taatacgact cactatagct cgaagtgtgt atggtgccat atacggctca ccaccatata 60 cactgcaaga attactattc ttgtgggccc ctctcggtaa atcctagagg gctttcctct 120 cgttattgcg agattcgtcg ttagataacg gcaagttccc tttcttacta tcctattttc 180 atcttgtggc ttgacgggtc actgcctacg tcgtcgatct ctatcaacta cccttgcgac 240 ttaggcaacc ttctccgcta ctggatttgg agggagtttt gttagggact ggtccctgga 300 cttacccgac gcttgtgagc atagtcagca tagtacattt catctgacta atactacaac 360 accaccacca tgaatagagg attctttaac atgctcggcc gccgcccctt cccggccccc 420 actgccatgt ggaggccgcg gagaaggagg caggcggccc cgatgggaag cggagctact 480 aacttcagcc tgctgaagca ggctggagac gtggaggaga accctggacc tatggcaacc 540 ttctccgcta ctggatttgg agggagtttt gttagggact ggtccctgga cttacccgac 600 gcttgtgagc atggcgcggg attgtgctgc gaagtggacg gctccacctt atgcgccgag 660 tgttttcgcg gttgcgaagg aatggagcaa tgtcctggct tgttcatggg actgttaaaa 720 ctggcttcgc cagttccagt gggacataag ttcctgattg gttggtatcg agctgccaaa 780 gtcaccgggc gttacaattt ccttgagctg ttgcaacacc ctgctttcgc ccagctgcgt 840 gtggttgatg ctaggttagc cattgaagag gcaagtgtgt ttatttccac tgaccacgcg 900 tctgctaagc gtttccctgg cgctagattt gcgctgacac cggtgtatgc taacgcttgg 960 gttgtgagcc cggctgctaa cagtttgata gtgaccactg accaggaaca agatgggttc 1020 tgctggttaa aacttttgcc acctgaccgc cgtgaggctg gtttgcggtt gtattacaac 1080 cattaccgcg aacaaaggac cgggtggctg tctaaaacag gacttcgctt atggcttgga 1140 gacctgggtt tgggcatcaa tgcgagctct ggagggctga aattccacat tatgaggggt 1200 tcgcctcagc gagcttggca tatcacaaca cgcagctgca agctgaagag ctactacgtt 1260 tgtgacatct ctgaagcaga ctggtcctgt ttgcctgctg gcaactacgg cggctacaat 1320 ccaccagggg acggagcttg cggttacagg tgcttggcct tcatgaatgg cgccactgtt 1380 gtgtcggctg gttgcagttc tgacttgtgg tgtgatgatg agttggctta tcgagtcttt 1440 caattgtcac ccacgttcac ggttaccatc ccaggtgggc gagtttgtcc gaatgccaag 1500 tacgcaatga tttgtgacaa gcagcactgg cgcgtcaaac gtgcaaaggg cgtcggcctg 1560 tgtctcgatg aaagctgttt caggggcatc tgcaattgcc aacgcatgag tggaccacca 1620 cctgcacccg tgtcagccgc cgtgttagat cacatactgg aggcggcgac gtttggcaac 1680 gttcgcgtgg ttacacctga agggcagcca cgccccgtac cagcgccgcg agttcgtccc 1740 agcgccaact cttctggaga tgtcaaagat ccggcgcccg ttccgccagt accaaaacca 1800 aggaccaagc ttgccacacc gaacccaact caggcgccca tcccagcacc gcgcacgcga 1860 cttcaagggg cctcaacaca ggagccactg gcgagtgcag gagttgcttc tgactcggca 1920 cctaaatggc gtgtggccaa aactgtgtac agctccgcgg agcgctttcg gaccgaactg 1980 gtacaacgtg ctcggtccgt tggggacgtt cttgttcaag cgctaccgct caaaacccca 2040 gcagtgcagc ggtataccat gactctgaag atgatgcgtt cacgcttcag ttggcactgc 2100 gacgtgtggt accctttggc tgtaatcgct tgtttgctcc ctatatggcc atctcttgct 2160 ttgctcctta gctttgccat tgggttgata cccagtgtgg gcaataatgt tgttctgaca 2220 gcgcttctgg tttcatcagc taattatgtt gcgtcaatgg accatcaatg tgaaggtgcg 2280 gcttgcttag ccttgctgga agaagaacac tattatagag cggtccgttg gcgcccgatt 2340 acaggcgcgc tgtcgcttgt gctcaattta ctggggcagg taggctatgt agctcgttcc 2400 acctttgatg cagcttatgt tccttgcact gtgttcgatc tttgcagctt tgctattctg 2460 tacctctgcc gcaatcgttg ctggagatgc ttcggacgct gtgtgcgagt tgggcctgcc 2520 acgcatgttt tgggctccac cgggcaacga gtttccaaac tggcgctcat tgatttgtgt 2580 gaccactttt caaagcccac catcgatgtt gtgggcatgg caactggttg gagcggatgt 2640 tacacaggaa ccgccgcaat ggagcgtcag tgtgcctcta cggtggaccc tcactcgttc 2700 gaccagaaga aggcaggagc gactgtttac ctcacccccc ctgtcaacag cgggtcagcg 2760 ctgcagtgcc tcaatgtcat gtggaagcga ccaattgggt ccactgtcct tggggaacaa 2820 acaggagctg ttgtgacggc ggtcaagagt atctctttct cacctccctg ctgcgtctct 2880 accactttgc ccacccgacc cggtgtgacc gttgtcgacc atgctcttta caaccggttg 2940 actgcttcag gggtcgatcc cgctttattg cgtgttgggc aaggtgattt tctaaaactt 3000 aatccggggt tccggctgat aggtggatgg atttatggga tatgctattt tgtgttggtg 3060 gttgtgtcaa cttttacctg cttacctatc aaatgtggca ttggcacccg cgaccctttc 3120 tgccgcagag tgttttctgt acccgtcacc aagacccaag agcactgcca tgctggaatg 3180 tgtgctagcg ctgaaggcat ctctctggac tctctggggt taactcagtt acaaagttac 3240 tggatcgcag ccgtcactag cggattagtg atcttgttgg tctgccaccg cctggccatc 3300 agcgccttgg acttgttgac tctagcttcc cctttagtgt tgcttgtgtt cccttgggca 3360 tctgtggggc ttttacttgc ttgcagtctc gctggtgctg ctgtgaaaat acagttgttg 3420 gcgacgcttt ttgtgaatct attctttccc caagctaccc ttgtcactat gggatactgg 3480 gcgtgcgtgg cggctttggc cgtttacagt ttgatgggct tgcgagtgaa agtgaatgtg 3540 cccatgtgtg tgacacctgc ccattttctg ctgctggcga ggtcagctgg acagtcaaga 3600 gagcagatgc tccgggtcag cgctgctgcc cccaccaatt cactgcttgg agtggctcgt 3660 gattgttatg tcacaggcac aactcggctg tacataccca aggaaggcgg gatggtgttt 3720 gaagggctat tcaggtcacc gaaggcgcgc ggcaacgtcg gcttcgtggc tggtagcagc 3780 tacggcacag ggtcagtgtg gaccaggaac aacgaggtcg tcgtactgac agcgtcacac 3840 gtggttggcc gcgctaacat ggccactctg aagatcggtg acgcaatgct gactctgact 3900 ttcaaaaaga atggcgactt cgccgaggca gtgacgacac agtccgagct cccaggcaat 3960 tggccacagt tgcatttcgc ccaaccaaca accgggcccg cttcatggtg cactgccaca 4020 ggagatgaag aaggcttgct cagtggcgag gtttgtctgg cgtggactac tagtggcgac 4080 tctggatctg cagtggttca gggtgacgct gtggtagggg tccacaccgg ttcgaacaca 4140 agtggtgttg cctacgtgac caccccaagc ggaaaactcc ttggcgccga caccgtgact 4200 ttgtcatcac tgtcaaagca tttcacaggc cctttgacat caatcccgaa ggacatccct 4260 gacaacatta ttgccgatgt tgatgctgtt cctcgttctc tggccatgct gattgatggc 4320 ttatccaata gagagagcag cctttctgga cctcagttgt tgttaattgc ttgttttatg 4380 tggtcttatc ttaaccaacc tgcttacttg ccttatgtgc tgggcttctt tgccgctaac 4440 ttcttcctgc caaaaagtgt tggccgccct gtggtcactg ggcttctatg gttgtgctgc 4500 ctcttcacac cgctttccat gcgcttgtgc ttgttccatc tggtctgtgc taccgtcacg 4560 ggaaacgtga tatctttgtg gttctacatc actgccgctg gcacgtctta cctttctgag 4620 atgtggttcg gaggctatcc caccatgttg tttgtgccac ggttcctagt gtaccagttc 4680 cccggctggg ctattggcac agtactagcg gtatgcagca tcaccatgct ggctgctgcc 4740 ctcggtcaca ccctgttact ggatgtgttc tccgcctcag gtcgctttga caggactttc 4800 atgatgaaat acttcctgga gggaggagtg aaagagagtg tcaccgcctc agtcacccgc 4860 gcttatggca aaccaattac ccaggagagt ctcactgcaa cattagctgc cctcactgat 4920 gatgacttcc aattcctctc tgatgtgctt gactgtcggg ccgtccgatc ggcaatgaat 4980 ctgcgtgccg ctctcacaag ttttcaagtg gcgcagtatc gtaacatcct taatgcatcc 5040 ttgcaagtcg atcgtgacgc tgctcgtagt cgcagactaa tggcaaaact ggctgatttt 5100 gcggttgaac aagaagtaac agctggagac cgtgttgtgg ttatcgacgg tctggaccgc 5160 atggctcact tcaaagacga tttggtgctg gttcctttga ccaccaaagt agtaggcggt 5220 tctaggtgca ccatttgtga cgtcgttaag gaagaagcca atgacacccc agttaagcca 5280 atgcccagca ggagacgccg caagggcctg cctaaaggtg ctcagttgga gtgggaccgt 5340 caccaggaag agaagaggaa cgccggtgat gatgattttg cggtctcgaa tgattatgtc 5400 aagagagtgc caaagtactg ggatcccagc gacacccgag gcacgacagt gaaaatcgcc 5460 ggcactacct atcagaaagt ggttgactat tcaggcaatg tgcattacgt ggagcatcag 5520 gaagatctgc tagactacgt gctgggcaag gggagctatg aaggcctaga tcaggacaaa 5580 gtgttggacc tcacaaacat gcttaaagtg gaccccacgg agctctcctc caaagacaaa 5640 gccaaggcgc gtcagcttgc tcatctgctg ttggatctgg ctaacccagt tgaggcagtg 5700 aatcagttaa actgagagcg ccccacatct ttcccggcga tgtggggcgt cggacctttg 5760 ctgactctaa agacaagggt ttcgtggctc tacacagtcg cacaatgttt ttagctgccc 5820 gggacttttt atttaacatc aaatttgtgt gcgacgaaga gttcacaaag accccaaaag 5880 acacactgct tgggtacgta cgcgcctgcc ctggttactg gtttattttc cgtcgtacgc 5940 accggtcgct gattgatgca tactgggaca gtatggagtg cgtttacgcg cttcccacca 6000 tatctgattt tgatgtgagc ccaggtgacg tcgcagtgac gggcgagcga tgggattttg 6060 aatctcccgg aggaggccgt gcaaaacgtc tcacagctga tctggtgcac gcttttcaag 6120 ggttccacgg agcctcttat tcctatgatg acaaggtggc agctgctgtc agtggtgacc 6180 cgtatcggtc ggacggcgtc ttgtataaca cccgttgggg caacattcca tattctgtcc 6240 caaccaatgc tttggaagcc acagcttgct accgtgctgg atgtgaggcc gttaccgacg 6300 ggaccaacgt catcgcaaca attgggccct tcccggagca acaacccata ccggacatcc 6360 caaagagcgt gcttgacaac tgcgctgaca tcagctgtga cgctttcata gcgcccgctg 6420 cagagacagc cctgtgtgga gatttagaga aatacaacct atccacgcag ggttttgtgt 6480 tgcctagtgt tttctccatg gtgcgggcgt acttaaaaga ggagattgga gacgctccac 6540 cactctactt gccatctact gtaccatcta aaaattcaca agccggaatt aacggcgctg 6600 agtttcctac aaagtcttta cagagctact gtttgattga tgacatggtg tcacagtcca 6660 tgaaaagcaa tctacaaacc gccaccatgg cgacttgtaa acggcaatac tgttccaaat 6720 acaagattag gagcattctg ggcaccaaca attacattgg cctaggtttg cgtgcctgcc 6780 tttcgggggt tacggccgca ttccaaaaag ctggaaagga tgggtcaccg atttatttgg 6840 gcaagtcaaa attcgacccg ataccagctc ctgacaagta ctgccttgaa acagacctgg 6900 agagttgtga tcgctccacc ccggctttgg tgcgttggtt cgctactaat cttatttttg 6960 agctagctgg ccagcccgag ttggtgcaca gctacgtgtt gaattgctgt cacgatctag 7020 ttgtggcggg tagtgtagca ttcaccaaac gcgggggttt gtcatctgga gaccctatca 7080 cttccatttc caataccatc tattcattgg tgctgtacac ccagcacatg ttgctatgtg 7140 gacttgaagg ctatttccca gagattgcag aaaaatatct tgatggcagc ctggagctgc 7200 gggacatgtt caagtacgtt cgagtgtaca tctactcgga cgatgtggtt ctaaccacac 7260 ccaaccagca ttacgcggcc agctttgacc gctgggtccc ccacctgcag gcgctgctag 7320 gtttcaaggt tgacccaaag aaaactgtga acaccagctc cccttccttt ttgggctgcc 7380 ggttcaagca agtggacggc aagtgttatc tagccagtct tcaggaccgc gttacacgct 7440 ctctgttata ccacattggt gcaaagaatc cctcagagta ctatgaagct gctgtttcca 7500 tctttaagga ctccattatc tgctgtgatg aagactggtg gacggacctc catcgacgta 7560 tcagtggcgc tgcgcgtacc gacggagttg agttccccac cattgaaatg ttaacatcct 7620 tccgcaccaa gcagtatgag agtgccgtgt gcacagtttg tggggccgcc cccgtggcca 7680 agtctgcttg tggagggtgg ttctgtggca attgtgtccc gtaccacgcg ggtcattgtc 7740 acacaacctc gctcttcgcc aactgcgggc acgacatcat gtaccgctcc acttactgca 7800 caatgtgtga gggttcccca aaacagatgg taccaaaagt gcctcacccg atcctggatc 7860 atttgctgtg ccacattgat tacggcagta aagaggaact aactctggta gtggcggatg 7920 gtcgaacaac atcaccgccc gggcgctaca aagtgggtca caaggtagtc gccgtggttg 7980 cagatgtggg aggcaacatt gtgtttgggt gcggtcctgg atcacacatc gcagtaccac 8040 ttcaggatac gctcaagggc gtggtggtga ataaagctct gaagaacgcc gccgcctctg 8100 agtacgtgga aggaccccct gggagtggga agacttttca cctggtcaaa gatgtgctag 8160 ccgtggtcgg tagcgcgacc ttggttgtgc ccacccacgc gtccatgctg gactgcatca 8220 acaagctcaa acaagcgggc gccgatccat actttgtggt gcccaagtat acagttcttg 8280 actttccccg gcctggcagt ggaaacatca cagtgcgact gccacaggtc ggaaccagtg 8340 agggagaaac ctttgtggat gaggtggcct acttctcacc agtggatctg gcgcgcattt 8400 taacccaggg tcgagtcaag ggttacggtg atttaaatca gctcgggtgc gtcggacccg 8460 cgagcgtgcc acgtaacctt tggctccgac attttgtcag cctggagccc ttgcgagtgt 8520 gccatcgatt cggcgctgct gtgtgtgatt tgatcaaggg catttatcct tattatgagc 8580 cagctccaca taccactaaa gtggtgtttg tgccaaatcc agactttgag aaaggtgtag 8640 tcatcaccgc ctaccacaaa gatcgcggtc ttggtcaccg cacaattgat tcaattcaag 8700 gctgtacatt ccctgttgtg actcttcgac tgcccacacc ccaatcactg acgcgcccgc 8760 gcgcagttgt ggcggttact agggcgtctc aggaattata catctacgac ccctttgatc 8820 agcttagcgg gttgttgaag ttcaccaagg aagcagaggc gcaggacttg atccatggcc 8880 cacctacagc atgccacctg ggccaagaaa ttgacctttg gtccaatgag ggcctcgaat 8940 attacaagga agtcaacctg ctgtacacac acgtccccat caaggatggt gtaatacaca 9000 gttaccctaa ttgtggccct gcctgtggct gggaaaagca atccaacaaa atttcgtgcc 9060 tcccgagagt ggcacaaaat ttgggctacc actattcccc agacttacca ggattttgcc 9120 ccataccaaa agaactcgct gagcattggc ccgtagtgtc caatgataga tacccgaatt 9180 gcttgcaaat taccttacag caagtatgtg aactcagtaa accgtgctca gcgggctata 9240 tggttggaca atcggttttc gtgcagacgc ctggtgtgac atcttactgg cttactgaat 9300 gggtcgacgg caaagcgcgt gctctaccag attccttatt ctcgtccggt aggttcgaga 9360 ctaacagccg cgctttcctc gatgaagccg aggaaaagtt tgccgccgct caccctcatg 9420 cctgtttggg agaaattaat aagtccaccg tgggaggatc ccacttcatc ttttcccaat 9480 atttaccacc attgctaccc gcagacgctg ttgccctggt aggtgcttca ttggctggga 9540 aagctgctaa agctgcttgc agcgttgttg atgtctatgc tccatcattt gaaccttatc 9600 tacaccctga gacactgagt cgcgtgtaca agattatgat cgatttcaag ccgtgtaggc 9660 ttatggtgtg gagaaacgcg accttttatg tccaagaggg tgttgatgca gttacatcag 9720 cactagcagc tgtgtccaaa ctcatcaaag tgccggccaa tgagcctgtt tcattccatg 9780 tggcatcagg gtacagaacc aacgcgctgg tagcgcccca ggctaaaatt tcaattggag 9840 cctacgccgc cgagtgggca ctgtcaactg aaccgccacc tgctggttat gcgatcgtgc 9900 ggcgatatat tgtaaagagg ctcctcagct caacagaagt gttcttgtgc cgcaggggtg 9960 ttgtgtcttc cacctcagtg cagaccattt gtgcactaga gggatgtaaa cctctgttca 10020 acttcttaca aattggttca gtcattgggc ccgtgtgact ctagagtgga cctgttccca 10080 tcccccgctc aactactcag gtagtggttc gcggcaacgg gtacaccgca gttggtaaca 10140 agcttgtcga tggaaaatat ggaaaacgac gagaacatcg tggtgggccc caagcccttc 10200 taccccatcg aggaaggcag cgccggcacc cagctgcgga agtacatgga aagatacgcc 10260 aagctgggcg ccattgcctt caccaacgcc gtgaccggcg tggactacag ctacgccgag 10320 tacctggaaa agagctgctg cctgggcaag gctctgcaga actacggcct ggtggtggac 10380 ggccggatcg ccctgtgcag cgagaactgc gaggaattct tcatccccgt gatcgccggc 10440 ctgttcatcg gcgtgggcgt ggctcccacc aacgagatct acaccctgcg ggagctggtg 10500 cacagcctgg gcatcagcaa gcccaccatc gtgttcagca gcaagaaggg cctggacaaa 10560 gtcatcaccg tgcagaaaac cgtgaccacc atcaagacca tcgtgatcct ggacagcaag 10620 gtggactacc ggggctacca gtgcctggac accttcatca agcggaacac cccccctggc 10680 ttccaggcca gcagcttcaa gaccgtggag gtggaccgga aagaacaggt ggccctgatc 10740 atgaacagca gcggcagcac cggcctgccc aagggcgtgc agctgaccca cgagaacacc 10800 gtgacccggt tcagccacgc cagggacccc atctacggca accaggtgtc ccccggcacc 10860 gccgtgctga ccgtggtgcc cttccaccac ggcttcggca tgttcaccac cctgggctac 10920 ctgatctgcg gcttccgggt ggtgatgctg accaagttcg acgaggaaac cttcctgaaa 10980 accctgcagg actacaagtg cacctacgtg attctggtgc ccaccctgtt cgccatcctg 11040 aacaagagcg agctgctgaa caagtacgac ctgagcaacc tggtggagat cgccagcggc 11100 ggagcccccc tgagcaaaga agtgggagag gccgtcgcca ggcggttcaa tctgcccggc 11160 gtgcggcagg gctacggcct gaccgagaca accagcgcca tcatcatcac ccccgagggc 11220 gacgacaagc ctggagccag cggcaaggtg gtgcccctgt tcaaggccaa agtgatcgac 11280 ctggacacca agaagagcct gggccccaac agacggggcg aagtgtgcgt gaagggcccc 11340 atgctgatga agggctacgt gaacaacccc gaggccacca aagagctgat cgacgaagag 11400 ggctggctgc acaccggcga catcggctac tacgacgaag agaagcactt cttcatcgtg 11460 gaccggctga agagcctgat caagtacaag ggctatcagg tgccccctgc cgagctggaa 11520 agcgtcctgc tgcagcaccc cagcatcttc gacgccggcg tggccggggt gccagatcct 11580 gtggccggcg agctgcctgg cgccgtggtg gtgctggaat ccggcaagaa catgaccgag 11640 aaagaagtga tggactacgt cgccagccag gtgtccaacg ccaagcggct gagaggcggc 11700 gtgagattcg tggacgaagt gccaaagggc ctgaccggca agatcgacgg cagggccatc 11760 cgggagatcc tgaagaaacc cgtggccaag atgtgattat aactcgaggg agccatagat 11820 tcattttgtg gtgacgggat tttaggtgag tatctagatt actttattct gtccgtccca 11880 ctcttgctgt tgcttactag gtatgtagca tctgggttag tgtatgtttt gactgccttg 11940 ttctattcct ttgtattagc agcttatatt tggtttgtta tagttggaag agccttttct 12000 actgcttatg cttttgtgct tttggctgct tttctgttat tagtaatgag gatgattgtg 12060 ggtatgatgc ctcgtcttcg gtccattttc aaccatcgcc aactggtggt agctgatttt 12120 gtggacacac ctagtggacc tgttcccatc ccccgcccaa ccactcaggt agtggttcgc 12180 ggcaacgggt acaccgcagt tggtaacaag cttgtcgatg gcgtcaagac gatcacgtcc 12240 gcaggccgcc tcttttcgaa acggacggcg gcgacagcct acaagctaca atgacctact 12300 gcgcatgttt ggtcagatgc gggtccgcaa accgcccgcg caacccactc aggctattat 12360 tgcagagcct ggagacctta ggcatgattt aaatcaacag gagcgcgcca ccctttcgtc 12420 gaacgtacaa cggttcttca tgattgggca tggttcactc actgcagatg ccggaggact 12480 cacgtacacc gtcagttggg ttcctaccaa acaaatccag cgcaaagttg cgcctccagc 12540 agggccgtaa gacgtggata ttctcctgtg tggcgtcatg ttgaagtagt tattagccac 12600 ccaggaacca aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 12660 aaaaaaaaaa aaaa 12674 <210> 18 <211> 12819 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Construct rEx-DLP-2A-pp1ab-DLP-rFF <220> <221> misc_feature <222> (1)..(18) <223> T7 promoter <400> 18 taatacgact cactatagct cgaagtgtgt atggtgccat atacggctca ccaccatata 60 cactgcaaga attactattc ttgtgggccc ctctcggtaa atcctagagg gctttcctct 120 cgttattgcg agattcgtcg ttagataacg gcaagttccc tttcttacta tcctattttc 180 atcttgtggc ttgacgggtc actgcctacg tcgtcgatct ctatcaacta cccttgcgac 240 ttaggcaacc ttctccgcta ctggatttgg agggagtttt gttagggact ggtccctgga 300 cttacccgac gcttgtgagc atagtcagca tagtacattt catctgacta atactacaac 360 accaccacca tgaatagagg attctttaac atgctcggcc gccgcccctt cccggccccc 420 actgccatgt ggaggccgcg gagaaggagg caggcggccc cgatgggaag cggagctact 480 aacttcagcc tgctgaagca ggctggagac gtggaggaga accctggacc tatggcaacc 540 ttctccgcta ctggatttgg agggagtttt gttagggact ggtccctgga cttacccgac 600 gcttgtgagc atggcgcggg attgtgctgc gaagtggacg gctccacctt atgcgccgag 660 tgttttcgcg gttgcgaagg aatggagcaa tgtcctggct tgttcatggg actgttaaaa 720 ctggcttcgc cagttccagt gggacataag ttcctgattg gttggtatcg agctgccaaa 780 gtcaccgggc gttacaattt ccttgagctg ttgcaacacc ctgctttcgc ccagctgcgt 840 gtggttgatg ctaggttagc cattgaagag gcaagtgtgt ttatttccac tgaccacgcg 900 tctgctaagc gtttccctgg cgctagattt gcgctgacac cggtgtatgc taacgcttgg 960 gttgtgagcc cggctgctaa cagtttgata gtgaccactg accaggaaca agatgggttc 1020 tgctggttaa aacttttgcc acctgaccgc cgtgaggctg gtttgcggtt gtattacaac 1080 cattaccgcg aacaaaggac cgggtggctg tctaaaacag gacttcgctt atggcttgga 1140 gacctgggtt tgggcatcaa tgcgagctct ggagggctga aattccacat tatgaggggt 1200 tcgcctcagc gagcttggca tatcacaaca cgcagctgca agctgaagag ctactacgtt 1260 tgtgacatct ctgaagcaga ctggtcctgt ttgcctgctg gcaactacgg cggctacaat 1320 ccaccagggg acggagcttg cggttacagg tgcttggcct tcatgaatgg cgccactgtt 1380 gtgtcggctg gttgcagttc tgacttgtgg tgtgatgatg agttggctta tcgagtcttt 1440 caattgtcac ccacgttcac ggttaccatc ccaggtgggc gagtttgtcc gaatgccaag 1500 tacgcaatga tttgtgacaa gcagcactgg cgcgtcaaac gtgcaaaggg cgtcggcctg 1560 tgtctcgatg aaagctgttt caggggcatc tgcaattgcc aacgcatgag tggaccacca 1620 cctgcacccg tgtcagccgc cgtgttagat cacatactgg aggcggcgac gtttggcaac 1680 gttcgcgtgg ttacacctga agggcagcca cgccccgtac cagcgccgcg agttcgtccc 1740 agcgccaact cttctggaga tgtcaaagat ccggcgcccg ttccgccagt accaaaacca 1800 aggaccaagc ttgccacacc gaacccaact caggcgccca tcccagcacc gcgcacgcga 1860 cttcaagggg cctcaacaca ggagccactg gcgagtgcag gagttgcttc tgactcggca 1920 cctaaatggc gtgtggccaa aactgtgtac agctccgcgg agcgctttcg gaccgaactg 1980 gtacaacgtg ctcggtccgt tggggacgtt cttgttcaag cgctaccgct caaaacccca 2040 gcagtgcagc ggtataccat gactctgaag atgatgcgtt cacgcttcag ttggcactgc 2100 gacgtgtggt accctttggc tgtaatcgct tgtttgctcc ctatatggcc atctcttgct 2160 ttgctcctta gctttgccat tgggttgata cccagtgtgg gcaataatgt tgttctgaca 2220 gcgcttctgg tttcatcagc taattatgtt gcgtcaatgg accatcaatg tgaaggtgcg 2280 gcttgcttag ccttgctgga agaagaacac tattatagag cggtccgttg gcgcccgatt 2340 acaggcgcgc tgtcgcttgt gctcaattta ctggggcagg taggctatgt agctcgttcc 2400 acctttgatg cagcttatgt tccttgcact gtgttcgatc tttgcagctt tgctattctg 2460 tacctctgcc gcaatcgttg ctggagatgc ttcggacgct gtgtgcgagt tgggcctgcc 2520 acgcatgttt tgggctccac cgggcaacga gtttccaaac tggcgctcat tgatttgtgt 2580 gaccactttt caaagcccac catcgatgtt gtgggcatgg caactggttg gagcggatgt 2640 tacacaggaa ccgccgcaat ggagcgtcag tgtgcctcta cggtggaccc tcactcgttc 2700 gaccagaaga aggcaggagc gactgtttac ctcacccccc ctgtcaacag cgggtcagcg 2760 ctgcagtgcc tcaatgtcat gtggaagcga ccaattgggt ccactgtcct tggggaacaa 2820 acaggagctg ttgtgacggc ggtcaagagt atctctttct cacctccctg ctgcgtctct 2880 accactttgc ccacccgacc cggtgtgacc gttgtcgacc atgctcttta caaccggttg 2940 actgcttcag gggtcgatcc cgctttattg cgtgttgggc aaggtgattt tctaaaactt 3000 aatccggggt tccggctgat aggtggatgg atttatggga tatgctattt tgtgttggtg 3060 gttgtgtcaa cttttacctg cttacctatc aaatgtggca ttggcacccg cgaccctttc 3120 tgccgcagag tgttttctgt acccgtcacc aagacccaag agcactgcca tgctggaatg 3180 tgtgctagcg ctgaaggcat ctctctggac tctctggggt taactcagtt acaaagttac 3240 tggatcgcag ccgtcactag cggattagtg atcttgttgg tctgccaccg cctggccatc 3300 agcgccttgg acttgttgac tctagcttcc cctttagtgt tgcttgtgtt cccttgggca 3360 tctgtggggc ttttacttgc ttgcagtctc gctggtgctg ctgtgaaaat acagttgttg 3420 gcgacgcttt ttgtgaatct attctttccc caagctaccc ttgtcactat gggatactgg 3480 gcgtgcgtgg cggctttggc cgtttacagt ttgatgggct tgcgagtgaa agtgaatgtg 3540 cccatgtgtg tgacacctgc ccattttctg ctgctggcga ggtcagctgg acagtcaaga 3600 gagcagatgc tccgggtcag cgctgctgcc cccaccaatt cactgcttgg agtggctcgt 3660 gattgttatg tcacaggcac aactcggctg tacataccca aggaaggcgg gatggtgttt 3720 gaagggctat tcaggtcacc gaaggcgcgc ggcaacgtcg gcttcgtggc tggtagcagc 3780 tacggcacag ggtcagtgtg gaccaggaac aacgaggtcg tcgtactgac agcgtcacac 3840 gtggttggcc gcgctaacat ggccactctg aagatcggtg acgcaatgct gactctgact 3900 ttcaaaaaga atggcgactt cgccgaggca gtgacgacac agtccgagct cccaggcaat 3960 tggccacagt tgcatttcgc ccaaccaaca accgggcccg cttcatggtg cactgccaca 4020 ggagatgaag aaggcttgct cagtggcgag gtttgtctgg cgtggactac tagtggcgac 4080 tctggatctg cagtggttca gggtgacgct gtggtagggg tccacaccgg ttcgaacaca 4140 agtggtgttg cctacgtgac caccccaagc ggaaaactcc ttggcgccga caccgtgact 4200 ttgtcatcac tgtcaaagca tttcacaggc cctttgacat caatcccgaa ggacatccct 4260 gacaacatta ttgccgatgt tgatgctgtt cctcgttctc tggccatgct gattgatggc 4320 ttatccaata gagagagcag cctttctgga cctcagttgt tgttaattgc ttgttttatg 4380 tggtcttatc ttaaccaacc tgcttacttg ccttatgtgc tgggcttctt tgccgctaac 4440 ttcttcctgc caaaaagtgt tggccgccct gtggtcactg ggcttctatg gttgtgctgc 4500 ctcttcacac cgctttccat gcgcttgtgc ttgttccatc tggtctgtgc taccgtcacg 4560 ggaaacgtga tatctttgtg gttctacatc actgccgctg gcacgtctta cctttctgag 4620 atgtggttcg gaggctatcc caccatgttg tttgtgccac ggttcctagt gtaccagttc 4680 cccggctggg ctattggcac agtactagcg gtatgcagca tcaccatgct ggctgctgcc 4740 ctcggtcaca ccctgttact ggatgtgttc tccgcctcag gtcgctttga caggactttc 4800 atgatgaaat acttcctgga gggaggagtg aaagagagtg tcaccgcctc agtcacccgc 4860 gcttatggca aaccaattac ccaggagagt ctcactgcaa cattagctgc cctcactgat 4920 gatgacttcc aattcctctc tgatgtgctt gactgtcggg ccgtccgatc ggcaatgaat 4980 ctgcgtgccg ctctcacaag ttttcaagtg gcgcagtatc gtaacatcct taatgcatcc 5040 ttgcaagtcg atcgtgacgc tgctcgtagt cgcagactaa tggcaaaact ggctgatttt 5100 gcggttgaac aagaagtaac agctggagac cgtgttgtgg ttatcgacgg tctggaccgc 5160 atggctcact tcaaagacga tttggtgctg gttcctttga ccaccaaagt agtaggcggt 5220 tctaggtgca ccatttgtga cgtcgttaag gaagaagcca atgacacccc agttaagcca 5280 atgcccagca ggagacgccg caagggcctg cctaaaggtg ctcagttgga gtgggaccgt 5340 caccaggaag agaagaggaa cgccggtgat gatgattttg cggtctcgaa tgattatgtc 5400 aagagagtgc caaagtactg ggatcccagc gacacccgag gcacgacagt gaaaatcgcc 5460 ggcactacct atcagaaagt ggttgactat tcaggcaatg tgcattacgt ggagcatcag 5520 gaagatctgc tagactacgt gctgggcaag gggagctatg aaggcctaga tcaggacaaa 5580 gtgttggacc tcacaaacat gcttaaagtg gaccccacgg agctctcctc caaagacaaa 5640 gccaaggcgc gtcagcttgc tcatctgctg ttggatctgg ctaacccagt tgaggcagtg 5700 aatcagttaa actgagagcg ccccacatct ttcccggcga tgtggggcgt cggacctttg 5760 ctgactctaa agacaagggt ttcgtggctc tacacagtcg cacaatgttt ttagctgccc 5820 gggacttttt atttaacatc aaatttgtgt gcgacgaaga gttcacaaag accccaaaag 5880 acacactgct tgggtacgta cgcgcctgcc ctggttactg gtttattttc cgtcgtacgc 5940 accggtcgct gattgatgca tactgggaca gtatggagtg cgtttacgcg cttcccacca 6000 tatctgattt tgatgtgagc ccaggtgacg tcgcagtgac gggcgagcga tgggattttg 6060 aatctcccgg aggaggccgt gcaaaacgtc tcacagctga tctggtgcac gcttttcaag 6120 ggttccacgg agcctcttat tcctatgatg acaaggtggc agctgctgtc agtggtgacc 6180 cgtatcggtc ggacggcgtc ttgtataaca cccgttgggg caacattcca tattctgtcc 6240 caaccaatgc tttggaagcc acagcttgct accgtgctgg atgtgaggcc gttaccgacg 6300 ggaccaacgt catcgcaaca attgggccct tcccggagca acaacccata ccggacatcc 6360 caaagagcgt gcttgacaac tgcgctgaca tcagctgtga cgctttcata gcgcccgctg 6420 cagagacagc cctgtgtgga gatttagaga aatacaacct atccacgcag ggttttgtgt 6480 tgcctagtgt tttctccatg gtgcgggcgt acttaaaaga ggagattgga gacgctccac 6540 cactctactt gccatctact gtaccatcta aaaattcaca agccggaatt aacggcgctg 6600 agtttcctac aaagtcttta cagagctact gtttgattga tgacatggtg tcacagtcca 6660 tgaaaagcaa tctacaaacc gccaccatgg cgacttgtaa acggcaatac tgttccaaat 6720 acaagattag gagcattctg ggcaccaaca attacattgg cctaggtttg cgtgcctgcc 6780 tttcgggggt tacggccgca ttccaaaaag ctggaaagga tgggtcaccg atttatttgg 6840 gcaagtcaaa attcgacccg ataccagctc ctgacaagta ctgccttgaa acagacctgg 6900 agagttgtga tcgctccacc ccggctttgg tgcgttggtt cgctactaat cttatttttg 6960 agctagctgg ccagcccgag ttggtgcaca gctacgtgtt gaattgctgt cacgatctag 7020 ttgtggcggg tagtgtagca ttcaccaaac gcgggggttt gtcatctgga gaccctatca 7080 cttccatttc caataccatc tattcattgg tgctgtacac ccagcacatg ttgctatgtg 7140 gacttgaagg ctatttccca gagattgcag aaaaatatct tgatggcagc ctggagctgc 7200 gggacatgtt caagtacgtt cgagtgtaca tctactcgga cgatgtggtt ctaaccacac 7260 ccaaccagca ttacgcggcc agctttgacc gctgggtccc ccacctgcag gcgctgctag 7320 gtttcaaggt tgacccaaag aaaactgtga acaccagctc cccttccttt ttgggctgcc 7380 ggttcaagca agtggacggc aagtgttatc tagccagtct tcaggaccgc gttacacgct 7440 ctctgttata ccacattggt gcaaagaatc cctcagagta ctatgaagct gctgtttcca 7500 tctttaagga ctccattatc tgctgtgatg aagactggtg gacggacctc catcgacgta 7560 tcagtggcgc tgcgcgtacc gacggagttg agttccccac cattgaaatg ttaacatcct 7620 tccgcaccaa gcagtatgag agtgccgtgt gcacagtttg tggggccgcc cccgtggcca 7680 agtctgcttg tggagggtgg ttctgtggca attgtgtccc gtaccacgcg ggtcattgtc 7740 acacaacctc gctcttcgcc aactgcgggc acgacatcat gtaccgctcc acttactgca 7800 caatgtgtga gggttcccca aaacagatgg taccaaaagt gcctcacccg atcctggatc 7860 atttgctgtg ccacattgat tacggcagta aagaggaact aactctggta gtggcggatg 7920 gtcgaacaac atcaccgccc gggcgctaca aagtgggtca caaggtagtc gccgtggttg 7980 cagatgtggg aggcaacatt gtgtttgggt gcggtcctgg atcacacatc gcagtaccac 8040 ttcaggatac gctcaagggc gtggtggtga ataaagctct gaagaacgcc gccgcctctg 8100 agtacgtgga aggaccccct gggagtggga agacttttca cctggtcaaa gatgtgctag 8160 ccgtggtcgg tagcgcgacc ttggttgtgc ccacccacgc gtccatgctg gactgcatca 8220 acaagctcaa acaagcgggc gccgatccat actttgtggt gcccaagtat acagttcttg 8280 actttccccg gcctggcagt ggaaacatca cagtgcgact gccacaggtc ggaaccagtg 8340 agggagaaac ctttgtggat gaggtggcct acttctcacc agtggatctg gcgcgcattt 8400 taacccaggg tcgagtcaag ggttacggtg atttaaatca gctcgggtgc gtcggacccg 8460 cgagcgtgcc acgtaacctt tggctccgac attttgtcag cctggagccc ttgcgagtgt 8520 gccatcgatt cggcgctgct gtgtgtgatt tgatcaaggg catttatcct tattatgagc 8580 cagctccaca taccactaaa gtggtgtttg tgccaaatcc agactttgag aaaggtgtag 8640 tcatcaccgc ctaccacaaa gatcgcggtc ttggtcaccg cacaattgat tcaattcaag 8700 gctgtacatt ccctgttgtg actcttcgac tgcccacacc ccaatcactg acgcgcccgc 8760 gcgcagttgt ggcggttact agggcgtctc aggaattata catctacgac ccctttgatc 8820 agcttagcgg gttgttgaag ttcaccaagg aagcagaggc gcaggacttg atccatggcc 8880 cacctacagc atgccacctg ggccaagaaa ttgacctttg gtccaatgag ggcctcgaat 8940 attacaagga agtcaacctg ctgtacacac acgtccccat caaggatggt gtaatacaca 9000 gttaccctaa ttgtggccct gcctgtggct gggaaaagca atccaacaaa atttcgtgcc 9060 tcccgagagt ggcacaaaat ttgggctacc actattcccc agacttacca ggattttgcc 9120 ccataccaaa agaactcgct gagcattggc ccgtagtgtc caatgataga tacccgaatt 9180 gcttgcaaat taccttacag caagtatgtg aactcagtaa accgtgctca gcgggctata 9240 tggttggaca atcggttttc gtgcagacgc ctggtgtgac atcttactgg cttactgaat 9300 gggtcgacgg caaagcgcgt gctctaccag attccttatt ctcgtccggt aggttcgaga 9360 ctaacagccg cgctttcctc gatgaagccg aggaaaagtt tgccgccgct caccctcatg 9420 cctgtttggg agaaattaat aagtccaccg tgggaggatc ccacttcatc ttttcccaat 9480 atttaccacc attgctaccc gcagacgctg ttgccctggt aggtgcttca ttggctggga 9540 aagctgctaa agctgcttgc agcgttgttg atgtctatgc tccatcattt gaaccttatc 9600 tacaccctga gacactgagt cgcgtgtaca agattatgat cgatttcaag ccgtgtaggc 9660 ttatggtgtg gagaaacgcg accttttatg tccaagaggg tgttgatgca gttacatcag 9720 cactagcagc tgtgtccaaa ctcatcaaag tgccggccaa tgagcctgtt tcattccatg 9780 tggcatcagg gtacagaacc aacgcgctgg tagcgcccca ggctaaaatt tcaattggag 9840 cctacgccgc cgagtgggca ctgtcaactg aaccgccacc tgctggttat gcgatcgtgc 9900 ggcgatatat tgtaaagagg ctcctcagct caacagaagt gttcttgtgc cgcaggggtg 9960 ttgtgtcttc cacctcagtg cagaccattt gtgcactaga gggatgtaaa cctctgttca 10020 acttcttaca aattggttca gtcattgggc ccgtgtgact ctagagtgga cctgttccca 10080 tcccccgctc aactactcag gtagtggttc gcggcaacgg gtacaccgca gttggtaaca 10140 agcttgtcga tagtcagcat agtacatttc atctgactaa tactacaaca ccaccaccat 10200 gaatagagga ttctttaaca tgctcggccg ccgccccttc ccggccccca ctgccatgtg 10260 gaggccgcgg agaaggaggc aggcggcccc gatgatggaa aatatggaaa acgacgagaa 10320 catcgtggtg ggccccaagc ccttctaccc catcgaggaa ggcagcgccg gcacccagct 10380 gcggaagtac atggaaagat acgccaagct gggcgccatt gccttcacca acgccgtgac 10440 cggcgtggac tacagctacg ccgagtacct ggaaaagagc tgctgcctgg gcaaggctct 10500 gcagaactac ggcctggtgg tggacggccg gatcgccctg tgcagcgaga actgcgagga 10560 attcttcatc cccgtgatcg ccggcctgtt catcggcgtg ggcgtggctc ccaccaacga 10620 gatctacacc ctgcgggagc tggtgcacag cctgggcatc agcaagccca ccatcgtgtt 10680 cagcagcaag aagggcctgg acaaagtcat caccgtgcag aaaaccgtga ccaccatcaa 10740 gaccatcgtg atcctggaca gcaaggtgga ctaccggggc taccagtgcc tggacacctt 10800 catcaagcgg aacacccccc ctggcttcca ggccagcagc ttcaagaccg tggaggtgga 10860 ccggaaagaa caggtggccc tgatcatgaa cagcagcggc agcaccggcc tgcccaaggg 10920 cgtgcagctg acccacgaga acaccgtgac ccggttcagc cacgccaggg accccatcta 10980 cggcaaccag gtgtcccccg gcaccgccgt gctgaccgtg gtgcccttcc accacggctt 11040 cggcatgttc accaccctgg gctacctgat ctgcggcttc cgggtggtga tgctgaccaa 11100 gttcgacgag gaaaccttcc tgaaaaccct gcaggactac aagtgcacct acgtgattct 11160 ggtgcccacc ctgttcgcca tcctgaacaa gagcgagctg ctgaacaagt acgacctgag 11220 caacctggtg gagatcgcca gcggcggagc ccccctgagc aaagaagtgg gagaggccgt 11280 cgccaggcgg ttcaatctgc ccggcgtgcg gcagggctac ggcctgaccg agacaaccag 11340 cgccatcatc atcacccccg agggcgacga caagcctgga gccagcggca aggtggtgcc 11400 cctgttcaag gccaaagtga tcgacctgga caccaagaag agcctgggcc ccaacagacg 11460 gggcgaagtg tgcgtgaagg gccccatgct gatgaagggc tacgtgaaca accccgaggc 11520 caccaaagag ctgatcgacg aagagggctg gctgcacacc ggcgacatcg gctactacga 11580 cgaagagaag cacttcttca tcgtggaccg gctgaagagc ctgatcaagt acaagggcta 11640 tcaggtgccc cctgccgagc tggaaagcgt cctgctgcag caccccagca tcttcgacgc 11700 cggcgtggcc ggggtgccag atcctgtggc cggcgagctg cctggcgccg tggtggtgct 11760 ggaatccggc aagaacatga ccgagaaaga agtgatggac tacgtcgcca gccaggtgtc 11820 caacgccaag cggctgagag gcggcgtgag attcgtggac gaagtgccaa agggcctgac 11880 cggcaagatc gacggcaggg ccatccggga gatcctgaag aaacccgtgg ccaagatgtg 11940 attataactc gagggagcca tagattcatt ttgtggtgac gggattttag gtgagtatct 12000 agattacttt attctgtccg tcccactctt gctgttgctt actaggtatg tagcatctgg 12060 gttagtgtat gttttgactg ccttgttcta ttcctttgta ttagcagctt atatttggtt 12120 tgttatagtt ggaagagcct tttctactgc ttatgctttt gtgcttttgg ctgcttttct 12180 gttattagta atgaggatga ttgtgggtat gatgcctcgt cttcggtcca ttttcaacca 12240 tcgccaactg gtggtagctg attttgtgga cacacctagt ggacctgttc ccatcccccg 12300 cccaaccact caggtagtgg ttcgcggcaa cgggtacacc gcagttggta acaagcttgt 12360 cgatggcgtc aagacgatca cgtccgcagg ccgcctcttt tcgaaacgga cggcggcgac 12420 agcctacaag ctacaatgac ctactgcgca tgtttggtca gatgcgggtc cgcaaaccgc 12480 ccgcgcaacc cactcaggct attattgcag agcctggaga ccttaggcat gatttaaatc 12540 aacaggagcg cgccaccctt tcgtcgaacg tacaacggtt cttcatgatt gggcatggtt 12600 cactcactgc agatgccgga ggactcacgt acaccgtcag ttgggttcct accaaacaaa 12660 tccagcgcaa agttgcgcct ccagcagggc cgtaagacgt ggatattctc ctgtgtggcg 12720 tcatgttgaa gtagttatta gccacccagg aaccaaaaaa aaaaaaaaaa aaaaaaaaaa 12780 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaa 12819 <210> 19 <211> 464 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Construct Alpha-R-DLP-2A-nsp-rFF <400> 19 gataggcggc gcatgagaga agcccagacc aattacctac ccaaatagga gaaagttcac 60 gttgacatcg aggaagacag cccattcctc agagctttgc agcggagctt cccgcagttt 120 gaggtagaag ccaagcaggt cactgataat gaccatgcta atgccagagc gttttcgcat 180 ctggcttcaa aactgatcga aacggaggtg gacccatccg acacgatcct tgacattgga 240 atagtcagca tagtacattt catctgacta atactacaac accaccacca tgaatagagg 300 attctttaac atgctcggcc gccgcccctt cccggccccc actgccatgt ggaggccgcg 360 gagaaggagg caggcggccc cgggaagcgg agctactaac ttcagcctgc tgaagcaggc 420 tggagacgtg gaggagaacc ctggacctat ggagaaagtt cacg 464 <210> 20 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> primer DLP-rFF-F <220> <221> misc_feature <223> RP112 <400> 20 cctgaatgga ctacgacata gtctagtccg ccaagatatc gcaccatagt cagcatagta 60 catttcatct gactaatact 80 <210> 21 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> primer DLP-rFF-R <220> <221> misc_feature <223> RP113 <400> 21 gcagcttgcc aattgctgct gtatcgatca attaatcaca tcttggccac gggtttcttc 60 60 <210> 22 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> primer 5'Alpha-P2A-F <220> <221> misc_feature <223> RP124 <400> 22 gaagcaggct ggagacgtgg aggagaaccc tggacctgag aaagttcacg ttgacatcga 60 ggaagac 67 <210> 23 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> primer 5'ScaI-R <220> <221> misc_feature <223> RP125 <400> 23 caccagtcac agaaaagcat cttacggatg 30 <210> 24 <211> 1014 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> g-block for Alpha-R-DLP-2A-nsp-rFF <400> 24 tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 60 agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaacacggg ataataccgc 120 gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 180 ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 240 atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 300 tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 360 tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 420 tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga 480 cgtctaagaa accattatta tcatgacatt aagcatccgc ctttcgtttt atttgaccat 540 gttggtatgt aatacgactc actatagata ggcggcgcat gagagaagcc cagaccaatt 600 acctacccaa ataggagaaa gttcacgttg acatcgagga agacagccca ttcctcagag 660 ctttgcagcg gagcttcccg cagtttgagg tagaagccaa gcaggtcact gataatgacc 720 atgctaatgc cagagcgttt tcgcatctgg cttcaaaact gatcgaaacg gaggtggacc 780 catccgacac gatccttgac attggaatag tcagcatagt acatttcatc tgactaatac 840 tacaacacca ccaccatgaa tagaggattc tttaacatgc tcggccgccg ccccttcccg 900 gcccccactg ccatgtggag gccgcggaga aggaggcagg cggccccggg aagcggagct 960 actaacttca gcctgctgaa gcaggctgga gacgtggagg agaaccctgg acct 1014 <210> 25 <211> 1014 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> g-block for Alpha-R-DLP-2A-nsp-DLP-rFF <400> 25 tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 60 agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaacacggg ataataccgc 120 gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 180 ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 240 atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 300 tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 360 tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 420 tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga 480 cgtctaagaa accattatta tcatgacatt aagcatccgc ctttcgtttt atttgaccat 540 gttggtatgt aatacgactc actatagata ggcggcgcat gagagaagcc cagaccaatt 600 acctacccaa ataggagaaa gttcacgttg acatcgagga agacagccca ttcctcagag 660 ctttgcagcg gagcttcccg cagtttgagg tagaagccaa gcaggtcact gataatgacc 720 atgctaatgc cagagcgttt tcgcatctgg cttcaaaact gatcgaaacg gaggtggacc 780 catccgacac gatccttgac attggaatag tcagcatagt acatttcatc tgactaatac 840 tacaacacca ccaccatgaa tagaggattc tttaacatgc tcggccgccg ccccttcccg 900 gcccccactg ccatgtggag gccgcggaga aggaggcagg cggccccggg aagcggagct 960 actaacttca gcctgctgaa gcaggctgga gacgtggagg agaaccctgg acct 1014 <210> 26 <211> 9476 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> construct Alpha-R-rFF <220> <221> misc_feature <222> (1)..(18) <223> T7 promoter <400> 26 taatacgact cactatagat aggcggcgca tgagagaagc ccagaccaat tacctaccca 60 aaatggagaa agttcacgtt gacatcgagg aagacagccc attcctcaga gctttgcagc 120 ggagcttccc gcagtttgag gtagaagcca agcaggtcac tgataatgac catgctaatg 180 ccagagcgtt ttcgcatctg gcttcaaaac tgatcgaaac ggaggtggac ccatccgaca 240 cgatccttga cattggaagt gcgcccgccc gcagaatgta ttctaagcac aagtatcatt 300 gtatctgtcc gatgagatgt gcggaagatc cggacagatt gtataagtat gcaactaagc 360 tgaagaaaaa ctgtaaggaa ataactgata aggaattgga caagaaaatg aaggagctcg 420 ccgccgtcat gagcgaccct gacctggaaa ctgagactat gtgcctccac gacgacgagt 480 cgtgtcgcta cgaagggcaa gtcgctgttt accaggatgt atacgcggtt gacggaccga 540 caagtctcta tcaccaagcc aataagggag ttagagtcgc ctactggata ggctttgaca 600 ccaccccttt tatgtttaag aacttggctg gagcatatcc atcatactct accaactggg 660 ccgacgaaac cgtgttaacg gctcgtaaca taggcctatg cagctctgac gttatggagc 720 ggtcacgtag agggatgtcc attcttagaa agaagtattt gaaaccatcc aacaatgttc 780 tattctctgt tggctcgacc atctaccacg agaagaggga cttactgagg agctggcacc 840 tgccgtctgt atttcactta cgtggcaagc aaaattacac atgtcggtgt gagactatag 900 ttagttgcga cgggtacgtc gttaaaagaa tagctatcag tccaggcctg tatgggaagc 960 cttcaggcta tgctgctacg atgcaccgcg agggattctt gtgctgcaaa gtgacagaca 1020 cattgaacgg ggagagggtc tcttttcccg tgtgcacgta tgtgccagct acattgtgtg 1080 accaaatgac tggcatactg gcaacagatg tcagtgcgga cgacgcgcaa aaactgctgg 1140 ttgggctcaa ccagcgtata gtcgtcaacg gtcgcaccca gagaaacacc aataccatga 1200 aaaattacct tttgcccgta gtggcccagg catttgctag gtgggcaaag gaatataagg 1260 aagatcaaga agatgaaagg ccactaggac tacgagatag acagttagtc atggggtgtt 1320 gttgggcttt tagaaggcac aagataacat ctatttataa gcgcccggat acccaaacca 1380 tcatcaaagt gaacagcgat ttccactcat tcgtgctgcc caggataggc agtaacacat 1440 tggagatcgg gctgagaaca agaatcagga aaatgttaga ggagcacaag gagccgtcac 1500 ctctcattac cgccgaggac gtacaagaag ctaagtgcgc agccgatgag gctaaggagg 1560 tgcgtgaagc cgaggagttg cgcgcagctc taccaccttt ggcagctgat gttgaggagc 1620 ccactctgga agccgatgtc gacttgatgt tacaagaggc tggggccggc tcagtggaga 1680 cacctcgtgg cttgataaag gttaccagct acgatggcga ggacaagatc ggctcttacg 1740 ctgtgctttc tccgcaggct gtactcaaga gtgaaaaatt atcttgcatc caccctctcg 1800 ctgaacaagt catagtgata acacactctg gccgaaaagg gcgttatgcc gtggaaccat 1860 accatggtaa agtagtggtg ccagagggac atgcaatacc cgtccaggac tttcaagctc 1920 tgagtgaaag tgccaccatt gtgtacaacg aacgtgagtt cgtaaacagg tacctgcacc 1980 atattgccac acatggagga gcgctgaaca ctgatgaaga atattacaaa actgtcaagc 2040 ccagcgagca cgacggcgaa tacctgtacg acatcgacag gaaacagtgc gtcaagaaag 2100 aactagtcac tgggctaggg ctcacaggcg agctggtgga tcctcccttc catgaattcg 2160 cctacgagag tctgagaaca cgaccagccg ctccttacca agtaccaacc ataggggtgt 2220 atggcgtgcc aggatcaggc aagtctggca tcattaaaag cgcagtcacc aaaaaagatc 2280 tagtggtgag cgccaagaaa gaaaactgtg cagaaattat aagggacgtc aagaaaatga 2340 aagggctgga cgtcaatgcc agaactgtgg actcagtgct cttgaatgga tgcaaacacc 2400 ccgtagagac cctgtatatt gacgaagctt ttgcttgtca tgcaggtact ctcagagcgc 2460 tcatagccat tataagacct aaaaaggcag tgctctgcgg ggatcccaaa cagtgcggtt 2520 tttttaacat gatgtgcctg aaagtgcatt ttaaccacga gatttgcaca caagtcttcc 2580 acaaaagcat ctctcgccgt tgcactaaat ctgtgacttc ggtcgtctca accttgtttt 2640 acgacaaaaa aatgagaacg acgaatccga aagagactaa gattgtgatt gacactaccg 2700 gcagtaccaa acctaagcag gacgatctca ttctcacttg tttcagaggg tgggtgaagc 2760 agttgcaaat agattacaaa ggcaacgaaa taatgacggc agctgcctct caagggctga 2820 cccgtaaagg tgtgtatgcc gttcggtaca aggtgaatga aaatcctctg tacgcaccca 2880 cctctgaaca tgtgaacgtc ctactgaccc gcacggagga ccgcatcgtg tggaaaacac 2940 tagccggcga cccatggata aaaacactga ctgccaagta ccctgggaat ttcactgcca 3000 cgatagagga gtggcaagca gagcatgatg ccatcatgag gcacatcttg gagagaccgg 3060 accctaccga cgtcttccag aataaggcaa acgtgtgttg ggccaaggct ttagtgccgg 3120 tgctgaagac cgctggcata gacatgacca ctgaacaatg gaacactgtg gattattttg 3180 aaacggacaa agctcactca gcagagatag tattgaacca actatgcgtg aggttctttg 3240 gactcgatct ggactccggt ctattttctg cacccactgt tccgttatcc attaggaata 3300 atcactggga taactccccg tcgcctaaca tgtacgggct gaataaagaa gtggtccgtc 3360 agctctctcg caggtaccca caactgcctc gggcagttgc cactggaaga gtctatgaca 3420 tgaacactgg tacactgcgc aattatgatc cgcgcataaa cctagtacct gtaaacagaa 3480 gactgcctca tgctttagtc ctccaccata atgaacaccc acagagtgac ttttcttcat 3540 tcgtcagcaa attgaagggc agaactgtcc tggtggtcgg ggaaaagttg tccgtcccag 3600 gcaaaatggt tgactggttg tcagaccggc ctgaggctac cttcagagct cggctggatt 3660 taggcatccc aggtgatgtg cccaaatatg acataatatt tgttaatgtg aggaccccat 3720 ataaatacca tcactatcag cagtgtgaag accatgccat taagcttagc atgttgacca 3780 agaaagcttg tctgcatctg aatcccggcg gaacctgtgt cagcataggt tatggttacg 3840 ctgacagggc cagcgaaagc atcattggtg ctatagcgcg gcagttcaag ttttcccggg 3900 tatgcaaacc gaaatcctca cttgaagaga cggaagttct gtttgtattc attgggtacg 3960 atcgcaaggc ccgtacgcac aatccttaca agctttcatc aaccttgacc aacatttata 4020 caggttccag actccacgaa gccggatgtg caccctcata tcatgtggtg cgaggggata 4080 ttgccacggc caccgaagga gtgattataa atgctgctaa cagcaaagga caacctggcg 4140 gaggggtgtg cggagcgctg tataagaaat tcccggaaag cttcgattta cagccgatcg 4200 aagtaggaaa agcgcgactg gtcaaaggtg cagctaaaca tatcattcat gccgtaggac 4260 caaacttcaa caaagtttcg gaggttgaag gtgacaaaca gttggcagag gcttatgagt 4320 ccatcgctaa gattgtcaac gataacaatt acaagtcagt agcgattcca ctgttgtcca 4380 ccggcatctt ttccgggaac aaagatcgac taacccaatc attgaaccat ttgctgacag 4440 ctttagacac cactgatgca gatgtagcca tatactgcag ggacaagaaa tgggaaatga 4500 ctctcaagga agcagtggct aggagagaag cagtggagga gatatgcata tccgacgact 4560 cttcagtgac agaacctgat gcagagctgg tgagggtgca tccgaagagt tctttggctg 4620 gaaggaaggg ctacagcaca agcgatggca aaactttctc atatttggaa gggaccaagt 4680 ttcaccaggc ggccaaggat atagcagaaa ttaatgccat gtggcccgtt gcaacggagg 4740 ccaatgagca ggtatgcatg tatatcctcg gagaaagcat gagcagtatt aggtcgaaat 4800 gccccgtcga agagtcggaa gcctccacac cacctagcac gctgccttgc ttgtgcatcc 4860 atgccatgac tccagaaaga gtacagcgcc taaaagcctc acgtccagaa caaattactg 4920 tgtgctcatc ctttccattg ccgaagtata gaatcactgg tgtgcagaag atccaatgct 4980 cccagcctat attgttctca ccgaaagtgc ctgcgtatat tcatccaagg aagtatctcg 5040 tggaaacacc accggtagac gagactccgg agccatcggc agagaaccaa tccacagagg 5100 ggacacctga acaaccacca cttataaccg aggatgagac caggactaga acgcctgagc 5160 cgatcatcat cgaagaggaa gaagaggata gcataagttt gctgtcagat ggcccgaccc 5220 accaggtgct gcaagtcgag gcagacattc acgggccgcc ctctgtatct agctcatcct 5280 ggtccattcc tcatgcatcc gactttgatg tggacagttt atccatactt gacaccctgg 5340 agggagctag cgtgaccagc ggggcaacgt cagccgagac taactcttac ttcgcaaaga 5400 gtatggagtt tctggcgcga ccggtgcctg cgcctcgaac agtattcagg aaccctccac 5460 atcccgctcc gcgcacaaga acaccgtcac ttgcacccag cagggcctgc tcgagaacca 5520 gcctagtttc caccccgcca ggcgtgaata gggtgatcac tagagaggag ctcgaggcgc 5580 ttaccccgtc acgcactcct agcaggtcgg tctcgagaac cagcctggtc tccaacccgc 5640 caggcgtaaa tagggtgatt acaagagagg agtttgaggc gttcgtagca caacaacaat 5700 gacggtttga tgcgggtgca tacatctttt cctccgacac cggtcaaggg catttacaac 5760 aaaaatcagt aaggcaaacg gtgctatccg aagtggtgtt ggagaggacc gaattggaga 5820 tttcgtatgc cccgcgcctc gaccaagaaa aagaagaatt actacgcaag aaattacagt 5880 taaatcccac acctgctaac agaagcagat accagtccag gaaggtggag aacatgaaag 5940 ccataacagc tagacgtatt ctgcaaggcc tagggcatta tttgaaggca gaaggaaaag 6000 tggagtgcta ccgaaccctg catcctgttc ctttgtattc atctagtgtg aaccgtgcct 6060 tttcaagccc caaggtcgca gtggaagcct gtaacgccat gttgaaagag aactttccga 6120 ctgtggcttc ttactgtatt attccagagt acgatgccta tttggacatg gttgacggag 6180 cttcatgctg cttagacact gccagttttt gccctgcaaa gctgcgcagc tttccaaaga 6240 aacactccta tttggaaccc acaatacgat cggcagtgcc ttcagcgatc cagaacacgc 6300 tccagaacgt cctggcagct gccacaaaaa gaaattgcaa tgtcacgcaa atgagagaat 6360 tgcccgtatt ggattcggcg gcctttaatg tggaatgctt caagaaatat gcgtgtaata 6420 atgaatattg ggaaacgttt aaagaaaacc ccatcaggct tactgaagaa aacgtggtaa 6480 attacattac caaattaaaa ggaccaaaag ctgctgctct ttttgcgaag acacataatt 6540 tgaatatgtt gcaggacata ccaatggaca ggtttgtaat ggacttaaag agagacgtga 6600 aagtgactcc aggaacaaaa catactgaag aacggcccaa ggtacaggtg atccaggctg 6660 ccgatccgct agcaacagcg tatctgtgcg gaatccaccg agagctggtt aggagattaa 6720 atgcggtcct gcttccgaac attcatacac tgtttgatat gtcggctgaa gactttgacg 6780 ctattatagc cgagcacttc cagcctgggg attgtgttct ggaaactgac atcgcgtcgt 6840 ttgataaaag tgaggacgac gccatggctc tgaccgcgtt aatgattctg gaagacttag 6900 gtgtggacgc agagctgttg acgctgattg aggcggcttt cggcgaaatt tcatcaatac 6960 atttgcccac taaaactaaa tttaaattcg gagccatgat gaaatctgga atgttcctca 7020 cactgtttgt gaacacagtc attaacattg taatcgcaag cagagtgttg agagaacggc 7080 taaccggatc accatgtgca gcattcattg gagatgacaa tatcgtgaaa ggagtcaaat 7140 cggacaaatt aatggcagac aggtgcgcca cctggttgaa tatggaagtc aagattatag 7200 atgctgtggt gggcgagaaa gcgccttatt tctgtggagg gtttattttg tgtgactccg 7260 tgaccggcac agcgtgccgt gtggcagacc ccctaaaaag gctgtttaag cttggcaaac 7320 ctctggcagc agacgatgaa catgatgatg acaggagaag ggcattgcat gaagagtcaa 7380 cacgctggaa ccgagtgggt attctttcag agctgtgcaa ggcagtagaa tcaaggtatg 7440 aaaccgtagg aacttccatc atagttatgg ccatgactac tctagctagc agtgttaaat 7500 cattcagcta cctgagaggg gcccctataa ctctctacgg ctaacctgaa tggactacga 7560 catagtctag tccgccaaga tatcgcacca tggaaaatat ggaaaacgac gagaacatcg 7620 tggtgggccc caagcccttc taccccatcg aggaaggcag cgccggcacc cagctgcgga 7680 agtacatgga aagatacgcc aagctgggcg ccattgcctt caccaacgcc gtgaccggcg 7740 tggactacag ctacgccgag tacctggaaa agagctgctg cctgggcaag gctctgcaga 7800 actacggcct ggtggtggac ggccggatcg ccctgtgcag cgagaactgc gaggaattct 7860 tcatccccgt gatcgccggc ctgttcatcg gcgtgggcgt ggctcccacc aacgagatct 7920 acaccctgcg ggagctggtg cacagcctgg gcatcagcaa gcccaccatc gtgttcagca 7980 gcaagaaggg cctggacaaa gtcatcaccg tgcagaaaac cgtgaccacc atcaagacca 8040 tcgtgatcct ggacagcaag gtggactacc ggggctacca gtgcctggac accttcatca 8100 agcggaacac cccccctggc ttccaggcca gcagcttcaa gaccgtggag gtggaccgga 8160 aagaacaggt ggccctgatc atgaacagca gcggcagcac cggcctgccc aagggcgtgc 8220 agctgaccca cgagaacacc gtgacccggt tcagccacgc cagggacccc atctacggca 8280 accaggtgtc ccccggcacc gccgtgctga ccgtggtgcc cttccaccac ggcttcggca 8340 tgttcaccac cctgggctac ctgatctgcg gcttccgggt ggtgatgctg accaagttcg 8400 acgaggaaac cttcctgaaa accctgcagg actacaagtg cacctacgtg attctggtgc 8460 ccaccctgtt cgccatcctg aacaagagcg agctgctgaa caagtacgac ctgagcaacc 8520 tggtggagat cgccagcggc ggagcccccc tgagcaaaga agtgggagag gccgtcgcca 8580 ggcggttcaa tctgcccggc gtgcggcagg gctacggcct gaccgagaca accagcgcca 8640 tcatcatcac ccccgagggc gacgacaagc ctggagccag cggcaaggtg gtgcccctgt 8700 tcaaggccaa agtgatcgac ctggacacca agaagagcct gggccccaac agacggggcg 8760 aagtgtgcgt gaagggcccc atgctgatga agggctacgt gaacaacccc gaggccacca 8820 aagagctgat cgacgaagag ggctggctgc acaccggcga catcggctac tacgacgaag 8880 agaagcactt cttcatcgtg gaccggctga agagcctgat caagtacaag ggctatcagg 8940 tgccccctgc cgagctggaa agcgtcctgc tgcagcaccc cagcatcttc gacgccggcg 9000 tggccggggt gccagatcct gtggccggcg agctgcctgg cgccgtggtg gtgctggaat 9060 ccggcaagaa catgaccgag aaagaagtga tggactacgt cgccagccag gtgtccaacg 9120 ccaagcggct gagaggcggc gtgagattcg tggacgaagt gccaaagggc ctgaccggca 9180 agatcgacgg cagggccatc cgggagatcc tgaagaaacc cgtggccaag atgtgattaa 9240 ttgatcgata cagcagcaat tggcaagctg cttacataga aggcgcgccg tttaaacggc 9300 cggccttaat taagtaacga tacagcagca attggcaagc tgcttacata gaactcgcgg 9360 cgattggcat gccgctttaa aatttttatt ttatttttct tttcttttcc gaatcggatt 9420 ttgtttttaa tatttcaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa 9476 <210> 27 <211> 9621 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> construct Alpha-R-DLP-rFF <220> <221> misc_feature <222> (1)..(18) <223> T7 promoter <400> 27 taatacgact cactatagat aggcggcgca tgagagaagc ccagaccaat tacctaccca 60 aaatggagaa agttcacgtt gacatcgagg aagacagccc attcctcaga gctttgcagc 120 ggagcttccc gcagtttgag gtagaagcca agcaggtcac tgataatgac catgctaatg 180 ccagagcgtt ttcgcatctg gcttcaaaac tgatcgaaac ggaggtggac ccatccgaca 240 cgatccttga cattggaagt gcgcccgccc gcagaatgta ttctaagcac aagtatcatt 300 gtatctgtcc gatgagatgt gcggaagatc cggacagatt gtataagtat gcaactaagc 360 tgaagaaaaa ctgtaaggaa ataactgata aggaattgga caagaaaatg aaggagctcg 420 ccgccgtcat gagcgaccct gacctggaaa ctgagactat gtgcctccac gacgacgagt 480 cgtgtcgcta cgaagggcaa gtcgctgttt accaggatgt atacgcggtt gacggaccga 540 caagtctcta tcaccaagcc aataagggag ttagagtcgc ctactggata ggctttgaca 600 ccaccccttt tatgtttaag aacttggctg gagcatatcc atcatactct accaactggg 660 ccgacgaaac cgtgttaacg gctcgtaaca taggcctatg cagctctgac gttatggagc 720 ggtcacgtag agggatgtcc attcttagaa agaagtattt gaaaccatcc aacaatgttc 780 tattctctgt tggctcgacc atctaccacg agaagaggga cttactgagg agctggcacc 840 tgccgtctgt atttcactta cgtggcaagc aaaattacac atgtcggtgt gagactatag 900 ttagttgcga cgggtacgtc gttaaaagaa tagctatcag tccaggcctg tatgggaagc 960 cttcaggcta tgctgctacg atgcaccgcg agggattctt gtgctgcaaa gtgacagaca 1020 cattgaacgg ggagagggtc tcttttcccg tgtgcacgta tgtgccagct acattgtgtg 1080 accaaatgac tggcatactg gcaacagatg tcagtgcgga cgacgcgcaa aaactgctgg 1140 ttgggctcaa ccagcgtata gtcgtcaacg gtcgcaccca gagaaacacc aataccatga 1200 aaaattacct tttgcccgta gtggcccagg catttgctag gtgggcaaag gaatataagg 1260 aagatcaaga agatgaaagg ccactaggac tacgagatag acagttagtc atggggtgtt 1320 gttgggcttt tagaaggcac aagataacat ctatttataa gcgcccggat acccaaacca 1380 tcatcaaagt gaacagcgat ttccactcat tcgtgctgcc caggataggc agtaacacat 1440 tggagatcgg gctgagaaca agaatcagga aaatgttaga ggagcacaag gagccgtcac 1500 ctctcattac cgccgaggac gtacaagaag ctaagtgcgc agccgatgag gctaaggagg 1560 tgcgtgaagc cgaggagttg cgcgcagctc taccaccttt ggcagctgat gttgaggagc 1620 ccactctgga agccgatgtc gacttgatgt tacaagaggc tggggccggc tcagtggaga 1680 cacctcgtgg cttgataaag gttaccagct acgatggcga ggacaagatc ggctcttacg 1740 ctgtgctttc tccgcaggct gtactcaaga gtgaaaaatt atcttgcatc caccctctcg 1800 ctgaacaagt catagtgata acacactctg gccgaaaagg gcgttatgcc gtggaaccat 1860 accatggtaa agtagtggtg ccagagggac atgcaatacc cgtccaggac tttcaagctc 1920 tgagtgaaag tgccaccatt gtgtacaacg aacgtgagtt cgtaaacagg tacctgcacc 1980 atattgccac acatggagga gcgctgaaca ctgatgaaga atattacaaa actgtcaagc 2040 ccagcgagca cgacggcgaa tacctgtacg acatcgacag gaaacagtgc gtcaagaaag 2100 aactagtcac tgggctaggg ctcacaggcg agctggtgga tcctcccttc catgaattcg 2160 cctacgagag tctgagaaca cgaccagccg ctccttacca agtaccaacc ataggggtgt 2220 atggcgtgcc aggatcaggc aagtctggca tcattaaaag cgcagtcacc aaaaaagatc 2280 tagtggtgag cgccaagaaa gaaaactgtg cagaaattat aagggacgtc aagaaaatga 2340 aagggctgga cgtcaatgcc agaactgtgg actcagtgct cttgaatgga tgcaaacacc 2400 ccgtagagac cctgtatatt gacgaagctt ttgcttgtca tgcaggtact ctcagagcgc 2460 tcatagccat tataagacct aaaaaggcag tgctctgcgg ggatcccaaa cagtgcggtt 2520 tttttaacat gatgtgcctg aaagtgcatt ttaaccacga gatttgcaca caagtcttcc 2580 acaaaagcat ctctcgccgt tgcactaaat ctgtgacttc ggtcgtctca accttgtttt 2640 acgacaaaaa aatgagaacg acgaatccga aagagactaa gattgtgatt gacactaccg 2700 gcagtaccaa acctaagcag gacgatctca ttctcacttg tttcagaggg tgggtgaagc 2760 agttgcaaat agattacaaa ggcaacgaaa taatgacggc agctgcctct caagggctga 2820 cccgtaaagg tgtgtatgcc gttcggtaca aggtgaatga aaatcctctg tacgcaccca 2880 cctctgaaca tgtgaacgtc ctactgaccc gcacggagga ccgcatcgtg tggaaaacac 2940 tagccggcga cccatggata aaaacactga ctgccaagta ccctgggaat ttcactgcca 3000 cgatagagga gtggcaagca gagcatgatg ccatcatgag gcacatcttg gagagaccgg 3060 accctaccga cgtcttccag aataaggcaa acgtgtgttg ggccaaggct ttagtgccgg 3120 tgctgaagac cgctggcata gacatgacca ctgaacaatg gaacactgtg gattattttg 3180 aaacggacaa agctcactca gcagagatag tattgaacca actatgcgtg aggttctttg 3240 gactcgatct ggactccggt ctattttctg cacccactgt tccgttatcc attaggaata 3300 atcactggga taactccccg tcgcctaaca tgtacgggct gaataaagaa gtggtccgtc 3360 agctctctcg caggtaccca caactgcctc gggcagttgc cactggaaga gtctatgaca 3420 tgaacactgg tacactgcgc aattatgatc cgcgcataaa cctagtacct gtaaacagaa 3480 gactgcctca tgctttagtc ctccaccata atgaacaccc acagagtgac ttttcttcat 3540 tcgtcagcaa attgaagggc agaactgtcc tggtggtcgg ggaaaagttg tccgtcccag 3600 gcaaaatggt tgactggttg tcagaccggc ctgaggctac cttcagagct cggctggatt 3660 taggcatccc aggtgatgtg cccaaatatg acataatatt tgttaatgtg aggaccccat 3720 ataaatacca tcactatcag cagtgtgaag accatgccat taagcttagc atgttgacca 3780 agaaagcttg tctgcatctg aatcccggcg gaacctgtgt cagcataggt tatggttacg 3840 ctgacagggc cagcgaaagc atcattggtg ctatagcgcg gcagttcaag ttttcccggg 3900 tatgcaaacc gaaatcctca cttgaagaga cggaagttct gtttgtattc attgggtacg 3960 atcgcaaggc ccgtacgcac aatccttaca agctttcatc aaccttgacc aacatttata 4020 caggttccag actccacgaa gccggatgtg caccctcata tcatgtggtg cgaggggata 4080 ttgccacggc caccgaagga gtgattataa atgctgctaa cagcaaagga caacctggcg 4140 gaggggtgtg cggagcgctg tataagaaat tcccggaaag cttcgattta cagccgatcg 4200 aagtaggaaa agcgcgactg gtcaaaggtg cagctaaaca tatcattcat gccgtaggac 4260 caaacttcaa caaagtttcg gaggttgaag gtgacaaaca gttggcagag gcttatgagt 4320 ccatcgctaa gattgtcaac gataacaatt acaagtcagt agcgattcca ctgttgtcca 4380 ccggcatctt ttccgggaac aaagatcgac taacccaatc attgaaccat ttgctgacag 4440 ctttagacac cactgatgca gatgtagcca tatactgcag ggacaagaaa tgggaaatga 4500 ctctcaagga agcagtggct aggagagaag cagtggagga gatatgcata tccgacgact 4560 cttcagtgac agaacctgat gcagagctgg tgagggtgca tccgaagagt tctttggctg 4620 gaaggaaggg ctacagcaca agcgatggca aaactttctc atatttggaa gggaccaagt 4680 ttcaccaggc ggccaaggat atagcagaaa ttaatgccat gtggcccgtt gcaacggagg 4740 ccaatgagca ggtatgcatg tatatcctcg gagaaagcat gagcagtatt aggtcgaaat 4800 gccccgtcga agagtcggaa gcctccacac cacctagcac gctgccttgc ttgtgcatcc 4860 atgccatgac tccagaaaga gtacagcgcc taaaagcctc acgtccagaa caaattactg 4920 tgtgctcatc ctttccattg ccgaagtata gaatcactgg tgtgcagaag atccaatgct 4980 cccagcctat attgttctca ccgaaagtgc ctgcgtatat tcatccaagg aagtatctcg 5040 tggaaacacc accggtagac gagactccgg agccatcggc agagaaccaa tccacagagg 5100 ggacacctga acaaccacca cttataaccg aggatgagac caggactaga acgcctgagc 5160 cgatcatcat cgaagaggaa gaagaggata gcataagttt gctgtcagat ggcccgaccc 5220 accaggtgct gcaagtcgag gcagacattc acgggccgcc ctctgtatct agctcatcct 5280 ggtccattcc tcatgcatcc gactttgatg tggacagttt atccatactt gacaccctgg 5340 agggagctag cgtgaccagc ggggcaacgt cagccgagac taactcttac ttcgcaaaga 5400 gtatggagtt tctggcgcga ccggtgcctg cgcctcgaac agtattcagg aaccctccac 5460 atcccgctcc gcgcacaaga acaccgtcac ttgcacccag cagggcctgc tcgagaacca 5520 gcctagtttc caccccgcca ggcgtgaata gggtgatcac tagagaggag ctcgaggcgc 5580 ttaccccgtc acgcactcct agcaggtcgg tctcgagaac cagcctggtc tccaacccgc 5640 caggcgtaaa tagggtgatt acaagagagg agtttgaggc gttcgtagca caacaacaat 5700 gacggtttga tgcgggtgca tacatctttt cctccgacac cggtcaaggg catttacaac 5760 aaaaatcagt aaggcaaacg gtgctatccg aagtggtgtt ggagaggacc gaattggaga 5820 tttcgtatgc cccgcgcctc gaccaagaaa aagaagaatt actacgcaag aaattacagt 5880 taaatcccac acctgctaac agaagcagat accagtccag gaaggtggag aacatgaaag 5940 ccataacagc tagacgtatt ctgcaaggcc tagggcatta tttgaaggca gaaggaaaag 6000 tggagtgcta ccgaaccctg catcctgttc ctttgtattc atctagtgtg aaccgtgcct 6060 tttcaagccc caaggtcgca gtggaagcct gtaacgccat gttgaaagag aactttccga 6120 ctgtggcttc ttactgtatt attccagagt acgatgccta tttggacatg gttgacggag 6180 cttcatgctg cttagacact gccagttttt gccctgcaaa gctgcgcagc tttccaaaga 6240 aacactccta tttggaaccc acaatacgat cggcagtgcc ttcagcgatc cagaacacgc 6300 tccagaacgt cctggcagct gccacaaaaa gaaattgcaa tgtcacgcaa atgagagaat 6360 tgcccgtatt ggattcggcg gcctttaatg tggaatgctt caagaaatat gcgtgtaata 6420 atgaatattg ggaaacgttt aaagaaaacc ccatcaggct tactgaagaa aacgtggtaa 6480 attacattac caaattaaaa ggaccaaaag ctgctgctct ttttgcgaag acacataatt 6540 tgaatatgtt gcaggacata ccaatggaca ggtttgtaat ggacttaaag agagacgtga 6600 aagtgactcc aggaacaaaa catactgaag aacggcccaa ggtacaggtg atccaggctg 6660 ccgatccgct agcaacagcg tatctgtgcg gaatccaccg agagctggtt aggagattaa 6720 atgcggtcct gcttccgaac attcatacac tgtttgatat gtcggctgaa gactttgacg 6780 ctattatagc cgagcacttc cagcctgggg attgtgttct ggaaactgac atcgcgtcgt 6840 ttgataaaag tgaggacgac gccatggctc tgaccgcgtt aatgattctg gaagacttag 6900 gtgtggacgc agagctgttg acgctgattg aggcggcttt cggcgaaatt tcatcaatac 6960 atttgcccac taaaactaaa tttaaattcg gagccatgat gaaatctgga atgttcctca 7020 cactgtttgt gaacacagtc attaacattg taatcgcaag cagagtgttg agagaacggc 7080 taaccggatc accatgtgca gcattcattg gagatgacaa tatcgtgaaa ggagtcaaat 7140 cggacaaatt aatggcagac aggtgcgcca cctggttgaa tatggaagtc aagattatag 7200 atgctgtggt gggcgagaaa gcgccttatt tctgtggagg gtttattttg tgtgactccg 7260 tgaccggcac agcgtgccgt gtggcagacc ccctaaaaag gctgtttaag cttggcaaac 7320 ctctggcagc agacgatgaa catgatgatg acaggagaag ggcattgcat gaagagtcaa 7380 cacgctggaa ccgagtgggt attctttcag agctgtgcaa ggcagtagaa tcaaggtatg 7440 aaaccgtagg aacttccatc atagttatgg ccatgactac tctagctagc agtgttaaat 7500 cattcagcta cctgagaggg gcccctataa ctctctacgg ctaacctgaa tggactacga 7560 catagtctag tccgccaaga tatcgcacca tagtcagcat agtacatttc atctgactaa 7620 tactacaaca ccaccaccat gaatagagga ttctttaaca tgctcggccg ccgccccttc 7680 ccggccccca ctgccatgtg gaggccgcgg agaaggaggc aggcggcccc gatgatggaa 7740 aatatggaaa acgacgagaa catcgtggtg ggccccaagc ccttctaccc catcgaggaa 7800 ggcagcgccg gcacccagct gcggaagtac atggaaagat acgccaagct gggcgccatt 7860 gccttcacca acgccgtgac cggcgtggac tacagctacg ccgagtacct ggaaaagagc 7920 tgctgcctgg gcaaggctct gcagaactac ggcctggtgg tggacggccg gatcgccctg 7980 tgcagcgaga actgcgagga attcttcatc cccgtgatcg ccggcctgtt catcggcgtg 8040 ggcgtggctc ccaccaacga gatctacacc ctgcgggagc tggtgcacag cctgggcatc 8100 agcaagccca ccatcgtgtt cagcagcaag aagggcctgg acaaagtcat caccgtgcag 8160 aaaaccgtga ccaccatcaa gaccatcgtg atcctggaca gcaaggtgga ctaccggggc 8220 taccagtgcc tggacacctt catcaagcgg aacacccccc ctggcttcca ggccagcagc 8280 ttcaagaccg tggaggtgga ccggaaagaa caggtggccc tgatcatgaa cagcagcggc 8340 agcaccggcc tgcccaaggg cgtgcagctg acccacgaga acaccgtgac ccggttcagc 8400 cacgccaggg accccatcta cggcaaccag gtgtcccccg gcaccgccgt gctgaccgtg 8460 gtgcccttcc accacggctt cggcatgttc accaccctgg gctacctgat ctgcggcttc 8520 cgggtggtga tgctgaccaa gttcgacgag gaaaccttcc tgaaaaccct gcaggactac 8580 aagtgcacct acgtgattct ggtgcccacc ctgttcgcca tcctgaacaa gagcgagctg 8640 ctgaacaagt acgacctgag caacctggtg gagatcgcca gcggcggagc ccccctgagc 8700 aaagaagtgg gagaggccgt cgccaggcgg ttcaatctgc ccggcgtgcg gcagggctac 8760 ggcctgaccg agacaaccag cgccatcatc atcacccccg agggcgacga caagcctgga 8820 gccagcggca aggtggtgcc cctgttcaag gccaaagtga tcgacctgga caccaagaag 8880 agcctgggcc ccaacagacg gggcgaagtg tgcgtgaagg gccccatgct gatgaagggc 8940 tacgtgaaca accccgaggc caccaaagag ctgatcgacg aagagggctg gctgcacacc 9000 ggcgacatcg gctactacga cgaagagaag cacttcttca tcgtggaccg gctgaagagc 9060 ctgatcaagt acaagggcta tcaggtgccc cctgccgagc tggaaagcgt cctgctgcag 9120 caccccagca tcttcgacgc cggcgtggcc ggggtgccag atcctgtggc cggcgagctg 9180 cctggcgccg tggtggtgct ggaatccggc aagaacatga ccgagaaaga agtgatggac 9240 tacgtcgcca gccaggtgtc caacgccaag cggctgagag gcggcgtgag attcgtggac 9300 gaagtgccaa agggcctgac cggcaagatc gacggcaggg ccatccggga gatcctgaag 9360 aaacccgtgg ccaagatgtg attaattgat cgatacagca gcaattggca agctgcttac 9420 atagaaggcg cgccgtttaa acggccggcc ttaattaagt aacgatacag cagcaattgg 9480 caagctgctt acatagaact cgcggcgatt ggcatgccgc tttaaaattt ttattttatt 9540 tttcttttct tttccgaatc ggattttgtt tttaatattt caaaaaaaaa aaaaaaaaaa 9600 aaaaaaaaaa aaaaaaaaaa a 9621 <210> 28 <211> 9876 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> construct Alpha-R-DLP-2A-nsp-rFF <220> <221> misc_feature <222> (1)..(18) <223> T7 promoter <400> 28 taatacgact cactatagat aggcggcgca tgagagaagc ccagaccaat tacctaccca 60 aataggagaa agttcacgtt gacatcgagg aagacagccc attcctcaga gctttgcagc 120 ggagcttccc gcagtttgag gtagaagcca agcaggtcac tgataatgac catgctaatg 180 ccagagcgtt ttcgcatctg gcttcaaaac tgatcgaaac ggaggtggac ccatccgaca 240 cgatccttga cattggaata gtcagcatag tacatttcat ctgactaata ctacaacacc 300 accaccatga atagaggatt ctttaacatg ctcggccgcc gccccttccc ggcccccact 360 gccatgtgga ggccgcggag aaggaggcag gcggccccgg gaagcggagc tactaacttc 420 agcctgctga agcaggctgg agacgtggag gagaaccctg gacctgagaa agttcacgtt 480 gacatcgagg aagacagccc attcctcaga gctttgcagc ggagcttccc gcagtttgag 540 gtagaagcca agcaggtcac tgataatgac catgctaatg ccagagcgtt ttcgcatctg 600 gcttcaaaac tgatcgaaac ggaggtggac ccatccgaca cgatccttga cattggaagt 660 gcgcccgccc gcagaatgta ttctaagcac aagtatcatt gtatctgtcc gatgagatgt 720 gcggaagatc cggacagatt gtataagtat gcaactaagc tgaagaaaaa ctgtaaggaa 780 ataactgata aggaattgga caagaaaatg aaggagctcg ccgccgtcat gagcgaccct 840 gacctggaaa ctgagactat gtgcctccac gacgacgagt cgtgtcgcta cgaagggcaa 900 gtcgctgttt accaggatgt atacgcggtt gacggaccga caagtctcta tcaccaagcc 960 aataagggag ttagagtcgc ctactggata ggctttgaca ccaccccttt tatgtttaag 1020 aacttggctg gagcatatcc atcatactct accaactggg ccgacgaaac cgtgttaacg 1080 gctcgtaaca taggcctatg cagctctgac gttatggagc ggtcacgtag agggatgtcc 1140 attcttagaa agaagtattt gaaaccatcc aacaatgttc tattctctgt tggctcgacc 1200 atctaccacg agaagaggga cttactgagg agctggcacc tgccgtctgt atttcactta 1260 cgtggcaagc aaaattacac atgtcggtgt gagactatag ttagttgcga cgggtacgtc 1320 gttaaaagaa tagctatcag tccaggcctg tatgggaagc cttcaggcta tgctgctacg 1380 atgcaccgcg agggattctt gtgctgcaaa gtgacagaca cattgaacgg ggagagggtc 1440 tcttttcccg tgtgcacgta tgtgccagct acattgtgtg accaaatgac tggcatactg 1500 gcaacagatg tcagtgcgga cgacgcgcaa aaactgctgg ttgggctcaa ccagcgtata 1560 gtcgtcaacg gtcgcaccca gagaaacacc aataccatga aaaattacct tttgcccgta 1620 gtggcccagg catttgctag gtgggcaaag gaatataagg aagatcaaga agatgaaagg 1680 ccactaggac tacgagatag acagttagtc atggggtgtt gttgggcttt tagaaggcac 1740 aagataacat ctatttataa gcgcccggat acccaaacca tcatcaaagt gaacagcgat 1800 ttccactcat tcgtgctgcc caggataggc agtaacacat tggagatcgg gctgagaaca 1860 agaatcagga aaatgttaga ggagcacaag gagccgtcac ctctcattac cgccgaggac 1920 gtacaagaag ctaagtgcgc agccgatgag gctaaggagg tgcgtgaagc cgaggagttg 1980 cgcgcagctc taccaccttt ggcagctgat gttgaggagc ccactctgga agccgatgtc 2040 gacttgatgt tacaagaggc tggggccggc tcagtggaga cacctcgtgg cttgataaag 2100 gttaccagct acgatggcga ggacaagatc ggctcttacg ctgtgctttc tccgcaggct 2160 gtactcaaga gtgaaaaatt atcttgcatc caccctctcg ctgaacaagt catagtgata 2220 acacactctg gccgaaaagg gcgttatgcc gtggaaccat accatggtaa agtagtggtg 2280 ccagagggac atgcaatacc cgtccaggac tttcaagctc tgagtgaaag tgccaccatt 2340 gtgtacaacg aacgtgagtt cgtaaacagg tacctgcacc atattgccac acatggagga 2400 gcgctgaaca ctgatgaaga atattacaaa actgtcaagc ccagcgagca cgacggcgaa 2460 tacctgtacg acatcgacag gaaacagtgc gtcaagaaag aactagtcac tgggctaggg 2520 ctcacaggcg agctggtgga tcctcccttc catgaattcg cctacgagag tctgagaaca 2580 cgaccagccg ctccttacca agtaccaacc ataggggtgt atggcgtgcc aggatcaggc 2640 aagtctggca tcattaaaag cgcagtcacc aaaaaagatc tagtggtgag cgccaagaaa 2700 gaaaactgtg cagaaattat aagggacgtc aagaaaatga aagggctgga cgtcaatgcc 2760 agaactgtgg actcagtgct cttgaatgga tgcaaacacc ccgtagagac cctgtatatt 2820 gacgaagctt ttgcttgtca tgcaggtact ctcagagcgc tcatagccat tataagacct 2880 aaaaaggcag tgctctgcgg ggatcccaaa cagtgcggtt tttttaacat gatgtgcctg 2940 aaagtgcatt ttaaccacga gatttgcaca caagtcttcc acaaaagcat ctctcgccgt 3000 tgcactaaat ctgtgacttc ggtcgtctca accttgtttt acgacaaaaa aatgagaacg 3060 acgaatccga aagagactaa gattgtgatt gacactaccg gcagtaccaa acctaagcag 3120 gacgatctca ttctcacttg tttcagaggg tgggtgaagc agttgcaaat agattacaaa 3180 ggcaacgaaa taatgacggc agctgcctct caagggctga cccgtaaagg tgtgtatgcc 3240 gttcggtaca aggtgaatga aaatcctctg tacgcaccca cctctgaaca tgtgaacgtc 3300 ctactgaccc gcacggagga ccgcatcgtg tggaaaacac tagccggcga cccatggata 3360 aaaacactga ctgccaagta ccctgggaat ttcactgcca cgatagagga gtggcaagca 3420 gagcatgatg ccatcatgag gcacatcttg gagagaccgg accctaccga cgtcttccag 3480 aataaggcaa acgtgtgttg ggccaaggct ttagtgccgg tgctgaagac cgctggcata 3540 gacatgacca ctgaacaatg gaacactgtg gattattttg aaacggacaa agctcactca 3600 gcagagatag tattgaacca actatgcgtg aggttctttg gactcgatct ggactccggt 3660 ctattttctg cacccactgt tccgttatcc attaggaata atcactggga taactccccg 3720 tcgcctaaca tgtacgggct gaataaagaa gtggtccgtc agctctctcg caggtaccca 3780 caactgcctc gggcagttgc cactggaaga gtctatgaca tgaacactgg tacactgcgc 3840 aattatgatc cgcgcataaa cctagtacct gtaaacagaa gactgcctca tgctttagtc 3900 ctccaccata atgaacaccc acagagtgac ttttcttcat tcgtcagcaa attgaagggc 3960 agaactgtcc tggtggtcgg ggaaaagttg tccgtcccag gcaaaatggt tgactggttg 4020 tcagaccggc ctgaggctac cttcagagct cggctggatt taggcatccc aggtgatgtg 4080 cccaaatatg acataatatt tgttaatgtg aggaccccat ataaatacca tcactatcag 4140 cagtgtgaag accatgccat taagcttagc atgttgacca agaaagcttg tctgcatctg 4200 aatcccggcg gaacctgtgt cagcataggt tatggttacg ctgacagggc cagcgaaagc 4260 atcattggtg ctatagcgcg gcagttcaag ttttcccggg tatgcaaacc gaaatcctca 4320 cttgaagaga cggaagttct gtttgtattc attgggtacg atcgcaaggc ccgtacgcac 4380 aatccttaca agctttcatc aaccttgacc aacatttata caggttccag actccacgaa 4440 gccggatgtg caccctcata tcatgtggtg cgaggggata ttgccacggc caccgaagga 4500 gtgattataa atgctgctaa cagcaaagga caacctggcg gaggggtgtg cggagcgctg 4560 tataagaaat tcccggaaag cttcgattta cagccgatcg aagtaggaaa agcgcgactg 4620 gtcaaaggtg cagctaaaca tatcattcat gccgtaggac caaacttcaa caaagtttcg 4680 gaggttgaag gtgacaaaca gttggcagag gcttatgagt ccatcgctaa gattgtcaac 4740 gataacaatt acaagtcagt agcgattcca ctgttgtcca ccggcatctt ttccgggaac 4800 aaagatcgac taacccaatc attgaaccat ttgctgacag ctttagacac cactgatgca 4860 gatgtagcca tatactgcag ggacaagaaa tgggaaatga ctctcaagga agcagtggct 4920 aggagagaag cagtggagga gatatgcata tccgacgact cttcagtgac agaacctgat 4980 gcagagctgg tgagggtgca tccgaagagt tctttggctg gaaggaaggg ctacagcaca 5040 agcgatggca aaactttctc atatttggaa gggaccaagt ttcaccaggc ggccaaggat 5100 atagcagaaa ttaatgccat gtggcccgtt gcaacggagg ccaatgagca ggtatgcatg 5160 tatatcctcg gagaaagcat gagcagtatt aggtcgaaat gccccgtcga agagtcggaa 5220 gcctccacac cacctagcac gctgccttgc ttgtgcatcc atgccatgac tccagaaaga 5280 gtacagcgcc taaaagcctc acgtccagaa caaattactg tgtgctcatc ctttccattg 5340 ccgaagtata gaatcactgg tgtgcagaag atccaatgct cccagcctat attgttctca 5400 ccgaaagtgc ctgcgtatat tcatccaagg aagtatctcg tggaaacacc accggtagac 5460 gagactccgg agccatcggc agagaaccaa tccacagagg ggacacctga acaaccacca 5520 cttataaccg aggatgagac caggactaga acgcctgagc cgatcatcat cgaagaggaa 5580 gaagaggata gcataagttt gctgtcagat ggcccgaccc accaggtgct gcaagtcgag 5640 gcagacattc acgggccgcc ctctgtatct agctcatcct ggtccattcc tcatgcatcc 5700 gactttgatg tggacagttt atccatactt gacaccctgg agggagctag cgtgaccagc 5760 ggggcaacgt cagccgagac taactcttac ttcgcaaaga gtatggagtt tctggcgcga 5820 ccggtgcctg cgcctcgaac agtattcagg aaccctccac atcccgctcc gcgcacaaga 5880 acaccgtcac ttgcacccag cagggcctgc tcgagaacca gcctagtttc caccccgcca 5940 ggcgtgaata gggtgatcac tagagaggag ctcgaggcgc ttaccccgtc acgcactcct 6000 agcaggtcgg tctcgagaac cagcctggtc tccaacccgc caggcgtaaa tagggtgatt 6060 acaagagagg agtttgaggc gttcgtagca caacaacaat gacggtttga tgcgggtgca 6120 tacatctttt cctccgacac cggtcaaggg catttacaac aaaaatcagt aaggcaaacg 6180 gtgctatccg aagtggtgtt ggagaggacc gaattggaga tttcgtatgc cccgcgcctc 6240 gaccaagaaa aagaagaatt actacgcaag aaattacagt taaatcccac acctgctaac 6300 agaagcagat accagtccag gaaggtggag aacatgaaag ccataacagc tagacgtatt 6360 ctgcaaggcc tagggcatta tttgaaggca gaaggaaaag tggagtgcta ccgaaccctg 6420 catcctgttc ctttgtattc atctagtgtg aaccgtgcct tttcaagccc caaggtcgca 6480 gtggaagcct gtaacgccat gttgaaagag aactttccga ctgtggcttc ttactgtatt 6540 attccagagt acgatgccta tttggacatg gttgacggag cttcatgctg cttagacact 6600 gccagttttt gccctgcaaa gctgcgcagc tttccaaaga aacactccta tttggaaccc 6660 acaatacgat cggcagtgcc ttcagcgatc cagaacacgc tccagaacgt cctggcagct 6720 gccacaaaaa gaaattgcaa tgtcacgcaa atgagagaat tgcccgtatt ggattcggcg 6780 gcctttaatg tggaatgctt caagaaatat gcgtgtaata atgaatattg ggaaacgttt 6840 aaagaaaacc ccatcaggct tactgaagaa aacgtggtaa attacattac caaattaaaa 6900 ggaccaaaag ctgctgctct ttttgcgaag acacataatt tgaatatgtt gcaggacata 6960 ccaatggaca ggtttgtaat ggacttaaag agagacgtga aagtgactcc aggaacaaaa 7020 catactgaag aacggcccaa ggtacaggtg atccaggctg ccgatccgct agcaacagcg 7080 tatctgtgcg gaatccaccg agagctggtt aggagattaa atgcggtcct gcttccgaac 7140 attcatacac tgtttgatat gtcggctgaa gactttgacg ctattatagc cgagcacttc 7200 cagcctgggg attgtgttct ggaaactgac atcgcgtcgt ttgataaaag tgaggacgac 7260 gccatggctc tgaccgcgtt aatgattctg gaagacttag gtgtggacgc agagctgttg 7320 acgctgattg aggcggcttt cggcgaaatt tcatcaatac atttgcccac taaaactaaa 7380 tttaaattcg gagccatgat gaaatctgga atgttcctca cactgtttgt gaacacagtc 7440 attaacattg taatcgcaag cagagtgttg agagaacggc taaccggatc accatgtgca 7500 gcattcattg gagatgacaa tatcgtgaaa ggagtcaaat cggacaaatt aatggcagac 7560 aggtgcgcca cctggttgaa tatggaagtc aagattatag atgctgtggt gggcgagaaa 7620 gcgccttatt tctgtggagg gtttattttg tgtgactccg tgaccggcac agcgtgccgt 7680 gtggcagacc ccctaaaaag gctgtttaag cttggcaaac ctctggcagc agacgatgaa 7740 catgatgatg acaggagaag ggcattgcat gaagagtcaa cacgctggaa ccgagtgggt 7800 attctttcag agctgtgcaa ggcagtagaa tcaaggtatg aaaccgtagg aacttccatc 7860 atagttatgg ccatgactac tctagctagc agtgttaaat cattcagcta cctgagaggg 7920 gcccctataa ctctctacgg ctaacctgaa tggactacga catagtctag tccgccaaga 7980 tatcgcacca tggaaaatat ggaaaacgac gagaacatcg tggtgggccc caagcccttc 8040 taccccatcg aggaaggcag cgccggcacc cagctgcgga agtacatgga aagatacgcc 8100 aagctgggcg ccattgcctt caccaacgcc gtgaccggcg tggactacag ctacgccgag 8160 tacctggaaa agagctgctg cctgggcaag gctctgcaga actacggcct ggtggtggac 8220 ggccggatcg ccctgtgcag cgagaactgc gaggaattct tcatccccgt gatcgccggc 8280 ctgttcatcg gcgtgggcgt ggctcccacc aacgagatct acaccctgcg ggagctggtg 8340 cacagcctgg gcatcagcaa gcccaccatc gtgttcagca gcaagaaggg cctggacaaa 8400 gtcatcaccg tgcagaaaac cgtgaccacc atcaagacca tcgtgatcct ggacagcaag 8460 gtggactacc ggggctacca gtgcctggac accttcatca agcggaacac cccccctggc 8520 ttccaggcca gcagcttcaa gaccgtggag gtggaccgga aagaacaggt ggccctgatc 8580 atgaacagca gcggcagcac cggcctgccc aagggcgtgc agctgaccca cgagaacacc 8640 gtgacccggt tcagccacgc cagggacccc atctacggca accaggtgtc ccccggcacc 8700 gccgtgctga ccgtggtgcc cttccaccac ggcttcggca tgttcaccac cctgggctac 8760 ctgatctgcg gcttccgggt ggtgatgctg accaagttcg acgaggaaac cttcctgaaa 8820 accctgcagg actacaagtg cacctacgtg attctggtgc ccaccctgtt cgccatcctg 8880 aacaagagcg agctgctgaa caagtacgac ctgagcaacc tggtggagat cgccagcggc 8940 ggagcccccc tgagcaaaga agtgggagag gccgtcgcca ggcggttcaa tctgcccggc 9000 gtgcggcagg gctacggcct gaccgagaca accagcgcca tcatcatcac ccccgagggc 9060 gacgacaagc ctggagccag cggcaaggtg gtgcccctgt tcaaggccaa agtgatcgac 9120 ctggacacca agaagagcct gggccccaac agacggggcg aagtgtgcgt gaagggcccc 9180 atgctgatga agggctacgt gaacaacccc gaggccacca aagagctgat cgacgaagag 9240 ggctggctgc acaccggcga catcggctac tacgacgaag agaagcactt cttcatcgtg 9300 gaccggctga agagcctgat caagtacaag ggctatcagg tgccccctgc cgagctggaa 9360 agcgtcctgc tgcagcaccc cagcatcttc gacgccggcg tggccggggt gccagatcct 9420 gtggccggcg agctgcctgg cgccgtggtg gtgctggaat ccggcaagaa catgaccgag 9480 aaagaagtga tggactacgt cgccagccag gtgtccaacg ccaagcggct gagaggcggc 9540 gtgagattcg tggacgaagt gccaaagggc ctgaccggca agatcgacgg cagggccatc 9600 cgggagatcc tgaagaaacc cgtggccaag atgtgattaa ttgatcgata cagcagcaat 9660 tggcaagctg cttacataga aggcgcgccg tttaaacggc cggccttaat taagtaacga 9720 tacagcagca attggcaagc tgcttacata gaactcgcgg cgattggcat gccgctttaa 9780 aatttttatt ttatttttct tttcttttcc gaatcggatt ttgtttttaa tatttcaaaa 9840 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa 9876 <210> 29 <211> 10021 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> construct Alpha-R-DLP-2A-nsp-DLP-rFF <220> <221> misc_feature <222> (1)..(18) <223> T7 promoter <400> 29 taatacgact cactatagat aggcggcgca tgagagaagc ccagaccaat tacctaccca 60 aataggagaa agttcacgtt gacatcgagg aagacagccc attcctcaga gctttgcagc 120 ggagcttccc gcagtttgag gtagaagcca agcaggtcac tgataatgac catgctaatg 180 ccagagcgtt ttcgcatctg gcttcaaaac tgatcgaaac ggaggtggac ccatccgaca 240 cgatccttga cattggaata gtcagcatag tacatttcat ctgactaata ctacaacacc 300 accaccatga atagaggatt ctttaacatg ctcggccgcc gccccttccc ggcccccact 360 gccatgtgga ggccgcggag aaggaggcag gcggccccgg gaagcggagc tactaacttc 420 agcctgctga agcaggctgg agacgtggag gagaaccctg gacctgagaa agttcacgtt 480 gacatcgagg aagacagccc attcctcaga gctttgcagc ggagcttccc gcagtttgag 540 gtagaagcca agcaggtcac tgataatgac catgctaatg ccagagcgtt ttcgcatctg 600 gcttcaaaac tgatcgaaac ggaggtggac ccatccgaca cgatccttga cattggaagt 660 gcgcccgccc gcagaatgta ttctaagcac aagtatcatt gtatctgtcc gatgagatgt 720 gcggaagatc cggacagatt gtataagtat gcaactaagc tgaagaaaaa ctgtaaggaa 780 ataactgata aggaattgga caagaaaatg aaggagctcg ccgccgtcat gagcgaccct 840 gacctggaaa ctgagactat gtgcctccac gacgacgagt cgtgtcgcta cgaagggcaa 900 gtcgctgttt accaggatgt atacgcggtt gacggaccga caagtctcta tcaccaagcc 960 aataagggag ttagagtcgc ctactggata ggctttgaca ccaccccttt tatgtttaag 1020 aacttggctg gagcatatcc atcatactct accaactggg ccgacgaaac cgtgttaacg 1080 gctcgtaaca taggcctatg cagctctgac gttatggagc ggtcacgtag agggatgtcc 1140 attcttagaa agaagtattt gaaaccatcc aacaatgttc tattctctgt tggctcgacc 1200 atctaccacg agaagaggga cttactgagg agctggcacc tgccgtctgt atttcactta 1260 cgtggcaagc aaaattacac atgtcggtgt gagactatag ttagttgcga cgggtacgtc 1320 gttaaaagaa tagctatcag tccaggcctg tatgggaagc cttcaggcta tgctgctacg 1380 atgcaccgcg agggattctt gtgctgcaaa gtgacagaca cattgaacgg ggagagggtc 1440 tcttttcccg tgtgcacgta tgtgccagct acattgtgtg accaaatgac tggcatactg 1500 gcaacagatg tcagtgcgga cgacgcgcaa aaactgctgg ttgggctcaa ccagcgtata 1560 gtcgtcaacg gtcgcaccca gagaaacacc aataccatga aaaattacct tttgcccgta 1620 gtggcccagg catttgctag gtgggcaaag gaatataagg aagatcaaga agatgaaagg 1680 ccactaggac tacgagatag acagttagtc atggggtgtt gttgggcttt tagaaggcac 1740 aagataacat ctatttataa gcgcccggat acccaaacca tcatcaaagt gaacagcgat 1800 ttccactcat tcgtgctgcc caggataggc agtaacacat tggagatcgg gctgagaaca 1860 agaatcagga aaatgttaga ggagcacaag gagccgtcac ctctcattac cgccgaggac 1920 gtacaagaag ctaagtgcgc agccgatgag gctaaggagg tgcgtgaagc cgaggagttg 1980 cgcgcagctc taccaccttt ggcagctgat gttgaggagc ccactctgga agccgatgtc 2040 gacttgatgt tacaagaggc tggggccggc tcagtggaga cacctcgtgg cttgataaag 2100 gttaccagct acgatggcga ggacaagatc ggctcttacg ctgtgctttc tccgcaggct 2160 gtactcaaga gtgaaaaatt atcttgcatc caccctctcg ctgaacaagt catagtgata 2220 acacactctg gccgaaaagg gcgttatgcc gtggaaccat accatggtaa agtagtggtg 2280 ccagagggac atgcaatacc cgtccaggac tttcaagctc tgagtgaaag tgccaccatt 2340 gtgtacaacg aacgtgagtt cgtaaacagg tacctgcacc atattgccac acatggagga 2400 gcgctgaaca ctgatgaaga atattacaaa actgtcaagc ccagcgagca cgacggcgaa 2460 tacctgtacg acatcgacag gaaacagtgc gtcaagaaag aactagtcac tgggctaggg 2520 ctcacaggcg agctggtgga tcctcccttc catgaattcg cctacgagag tctgagaaca 2580 cgaccagccg ctccttacca agtaccaacc ataggggtgt atggcgtgcc aggatcaggc 2640 aagtctggca tcattaaaag cgcagtcacc aaaaaagatc tagtggtgag cgccaagaaa 2700 gaaaactgtg cagaaattat aagggacgtc aagaaaatga aagggctgga cgtcaatgcc 2760 agaactgtgg actcagtgct cttgaatgga tgcaaacacc ccgtagagac cctgtatatt 2820 gacgaagctt ttgcttgtca tgcaggtact ctcagagcgc tcatagccat tataagacct 2880 aaaaaggcag tgctctgcgg ggatcccaaa cagtgcggtt tttttaacat gatgtgcctg 2940 aaagtgcatt ttaaccacga gatttgcaca caagtcttcc acaaaagcat ctctcgccgt 3000 tgcactaaat ctgtgacttc ggtcgtctca accttgtttt acgacaaaaa aatgagaacg 3060 acgaatccga aagagactaa gattgtgatt gacactaccg gcagtaccaa acctaagcag 3120 gacgatctca ttctcacttg tttcagaggg tgggtgaagc agttgcaaat agattacaaa 3180 ggcaacgaaa taatgacggc agctgcctct caagggctga cccgtaaagg tgtgtatgcc 3240 gttcggtaca aggtgaatga aaatcctctg tacgcaccca cctctgaaca tgtgaacgtc 3300 ctactgaccc gcacggagga ccgcatcgtg tggaaaacac tagccggcga cccatggata 3360 aaaacactga ctgccaagta ccctgggaat ttcactgcca cgatagagga gtggcaagca 3420 gagcatgatg ccatcatgag gcacatcttg gagagaccgg accctaccga cgtcttccag 3480 aataaggcaa acgtgtgttg ggccaaggct ttagtgccgg tgctgaagac cgctggcata 3540 gacatgacca ctgaacaatg gaacactgtg gattattttg aaacggacaa agctcactca 3600 gcagagatag tattgaacca actatgcgtg aggttctttg gactcgatct ggactccggt 3660 ctattttctg cacccactgt tccgttatcc attaggaata atcactggga taactccccg 3720 tcgcctaaca tgtacgggct gaataaagaa gtggtccgtc agctctctcg caggtaccca 3780 caactgcctc gggcagttgc cactggaaga gtctatgaca tgaacactgg tacactgcgc 3840 aattatgatc cgcgcataaa cctagtacct gtaaacagaa gactgcctca tgctttagtc 3900 ctccaccata atgaacaccc acagagtgac ttttcttcat tcgtcagcaa attgaagggc 3960 agaactgtcc tggtggtcgg ggaaaagttg tccgtcccag gcaaaatggt tgactggttg 4020 tcagaccggc ctgaggctac cttcagagct cggctggatt taggcatccc aggtgatgtg 4080 cccaaatatg acataatatt tgttaatgtg aggaccccat ataaatacca tcactatcag 4140 cagtgtgaag accatgccat taagcttagc atgttgacca agaaagcttg tctgcatctg 4200 aatcccggcg gaacctgtgt cagcataggt tatggttacg ctgacagggc cagcgaaagc 4260 atcattggtg ctatagcgcg gcagttcaag ttttcccggg tatgcaaacc gaaatcctca 4320 cttgaagaga cggaagttct gtttgtattc attgggtacg atcgcaaggc ccgtacgcac 4380 aatccttaca agctttcatc aaccttgacc aacatttata caggttccag actccacgaa 4440 gccggatgtg caccctcata tcatgtggtg cgaggggata ttgccacggc caccgaagga 4500 gtgattataa atgctgctaa cagcaaagga caacctggcg gaggggtgtg cggagcgctg 4560 tataagaaat tcccggaaag cttcgattta cagccgatcg aagtaggaaa agcgcgactg 4620 gtcaaaggtg cagctaaaca tatcattcat gccgtaggac caaacttcaa caaagtttcg 4680 gaggttgaag gtgacaaaca gttggcagag gcttatgagt ccatcgctaa gattgtcaac 4740 gataacaatt acaagtcagt agcgattcca ctgttgtcca ccggcatctt ttccgggaac 4800 aaagatcgac taacccaatc attgaaccat ttgctgacag ctttagacac cactgatgca 4860 gatgtagcca tatactgcag ggacaagaaa tgggaaatga ctctcaagga agcagtggct 4920 aggagagaag cagtggagga gatatgcata tccgacgact cttcagtgac agaacctgat 4980 gcagagctgg tgagggtgca tccgaagagt tctttggctg gaaggaaggg ctacagcaca 5040 agcgatggca aaactttctc atatttggaa gggaccaagt ttcaccaggc ggccaaggat 5100 atagcagaaa ttaatgccat gtggcccgtt gcaacggagg ccaatgagca ggtatgcatg 5160 tatatcctcg gagaaagcat gagcagtatt aggtcgaaat gccccgtcga agagtcggaa 5220 gcctccacac cacctagcac gctgccttgc ttgtgcatcc atgccatgac tccagaaaga 5280 gtacagcgcc taaaagcctc acgtccagaa caaattactg tgtgctcatc ctttccattg 5340 ccgaagtata gaatcactgg tgtgcagaag atccaatgct cccagcctat attgttctca 5400 ccgaaagtgc ctgcgtatat tcatccaagg aagtatctcg tggaaacacc accggtagac 5460 gagactccgg agccatcggc agagaaccaa tccacagagg ggacacctga acaaccacca 5520 cttataaccg aggatgagac caggactaga acgcctgagc cgatcatcat cgaagaggaa 5580 gaagaggata gcataagttt gctgtcagat ggcccgaccc accaggtgct gcaagtcgag 5640 gcagacattc acgggccgcc ctctgtatct agctcatcct ggtccattcc tcatgcatcc 5700 gactttgatg tggacagttt atccatactt gacaccctgg agggagctag cgtgaccagc 5760 ggggcaacgt cagccgagac taactcttac ttcgcaaaga gtatggagtt tctggcgcga 5820 ccggtgcctg cgcctcgaac agtattcagg aaccctccac atcccgctcc gcgcacaaga 5880 acaccgtcac ttgcacccag cagggcctgc tcgagaacca gcctagtttc caccccgcca 5940 ggcgtgaata gggtgatcac tagagaggag ctcgaggcgc ttaccccgtc acgcactcct 6000 agcaggtcgg tctcgagaac cagcctggtc tccaacccgc caggcgtaaa tagggtgatt 6060 acaagagagg agtttgaggc gttcgtagca caacaacaat gacggtttga tgcgggtgca 6120 tacatctttt cctccgacac cggtcaaggg catttacaac aaaaatcagt aaggcaaacg 6180 gtgctatccg aagtggtgtt ggagaggacc gaattggaga tttcgtatgc cccgcgcctc 6240 gaccaagaaa aagaagaatt actacgcaag aaattacagt taaatcccac acctgctaac 6300 agaagcagat accagtccag gaaggtggag aacatgaaag ccataacagc tagacgtatt 6360 ctgcaaggcc tagggcatta tttgaaggca gaaggaaaag tggagtgcta ccgaaccctg 6420 catcctgttc ctttgtattc atctagtgtg aaccgtgcct tttcaagccc caaggtcgca 6480 gtggaagcct gtaacgccat gttgaaagag aactttccga ctgtggcttc ttactgtatt 6540 attccagagt acgatgccta tttggacatg gttgacggag cttcatgctg cttagacact 6600 gccagttttt gccctgcaaa gctgcgcagc tttccaaaga aacactccta tttggaaccc 6660 acaatacgat cggcagtgcc ttcagcgatc cagaacacgc tccagaacgt cctggcagct 6720 gccacaaaaa gaaattgcaa tgtcacgcaa atgagagaat tgcccgtatt ggattcggcg 6780 gcctttaatg tggaatgctt caagaaatat gcgtgtaata atgaatattg ggaaacgttt 6840 aaagaaaacc ccatcaggct tactgaagaa aacgtggtaa attacattac caaattaaaa 6900 ggaccaaaag ctgctgctct ttttgcgaag acacataatt tgaatatgtt gcaggacata 6960 ccaatggaca ggtttgtaat ggacttaaag agagacgtga aagtgactcc aggaacaaaa 7020 catactgaag aacggcccaa ggtacaggtg atccaggctg ccgatccgct agcaacagcg 7080 tatctgtgcg gaatccaccg agagctggtt aggagattaa atgcggtcct gcttccgaac 7140 attcatacac tgtttgatat gtcggctgaa gactttgacg ctattatagc cgagcacttc 7200 cagcctgggg attgtgttct ggaaactgac atcgcgtcgt ttgataaaag tgaggacgac 7260 gccatggctc tgaccgcgtt aatgattctg gaagacttag gtgtggacgc agagctgttg 7320 acgctgattg aggcggcttt cggcgaaatt tcatcaatac atttgcccac taaaactaaa 7380 tttaaattcg gagccatgat gaaatctgga atgttcctca cactgtttgt gaacacagtc 7440 attaacattg taatcgcaag cagagtgttg agagaacggc taaccggatc accatgtgca 7500 gcattcattg gagatgacaa tatcgtgaaa ggagtcaaat cggacaaatt aatggcagac 7560 aggtgcgcca cctggttgaa tatggaagtc aagattatag atgctgtggt gggcgagaaa 7620 gcgccttatt tctgtggagg gtttattttg tgtgactccg tgaccggcac agcgtgccgt 7680 gtggcagacc ccctaaaaag gctgtttaag cttggcaaac ctctggcagc agacgatgaa 7740 catgatgatg acaggagaag ggcattgcat gaagagtcaa cacgctggaa ccgagtgggt 7800 attctttcag agctgtgcaa ggcagtagaa tcaaggtatg aaaccgtagg aacttccatc 7860 atagttatgg ccatgactac tctagctagc agtgttaaat cattcagcta cctgagaggg 7920 gcccctataa ctctctacgg ctaacctgaa tggactacga catagtctag tccgccaaga 7980 tatcgcacca tagtcagcat agtacatttc atctgactaa tactacaaca ccaccaccat 8040 gaatagagga ttctttaaca tgctcggccg ccgccccttc ccggccccca ctgccatgtg 8100 gaggccgcgg agaaggaggc aggcggcccc gatgatggaa aatatggaaa acgacgagaa 8160 catcgtggtg ggccccaagc ccttctaccc catcgaggaa ggcagcgccg gcacccagct 8220 gcggaagtac atggaaagat acgccaagct gggcgccatt gccttcacca acgccgtgac 8280 cggcgtggac tacagctacg ccgagtacct ggaaaagagc tgctgcctgg gcaaggctct 8340 gcagaactac ggcctggtgg tggacggccg gatcgccctg tgcagcgaga actgcgagga 8400 attcttcatc cccgtgatcg ccggcctgtt catcggcgtg ggcgtggctc ccaccaacga 8460 gatctacacc ctgcgggagc tggtgcacag cctgggcatc agcaagccca ccatcgtgtt 8520 cagcagcaag aagggcctgg acaaagtcat caccgtgcag aaaaccgtga ccaccatcaa 8580 gaccatcgtg atcctggaca gcaaggtgga ctaccggggc taccagtgcc tggacacctt 8640 catcaagcgg aacacccccc ctggcttcca ggccagcagc ttcaagaccg tggaggtgga 8700 ccggaaagaa caggtggccc tgatcatgaa cagcagcggc agcaccggcc tgcccaaggg 8760 cgtgcagctg acccacgaga acaccgtgac ccggttcagc cacgccaggg accccatcta 8820 cggcaaccag gtgtcccccg gcaccgccgt gctgaccgtg gtgcccttcc accacggctt 8880 cggcatgttc accaccctgg gctacctgat ctgcggcttc cgggtggtga tgctgaccaa 8940 gttcgacgag gaaaccttcc tgaaaaccct gcaggactac aagtgcacct acgtgattct 9000 ggtgcccacc ctgttcgcca tcctgaacaa gagcgagctg ctgaacaagt acgacctgag 9060 caacctggtg gagatcgcca gcggcggagc ccccctgagc aaagaagtgg gagaggccgt 9120 cgccaggcgg ttcaatctgc ccggcgtgcg gcagggctac ggcctgaccg agacaaccag 9180 cgccatcatc atcacccccg agggcgacga caagcctgga gccagcggca aggtggtgcc 9240 cctgttcaag gccaaagtga tcgacctgga caccaagaag agcctgggcc ccaacagacg 9300 gggcgaagtg tgcgtgaagg gccccatgct gatgaagggc tacgtgaaca accccgaggc 9360 caccaaagag ctgatcgacg aagagggctg gctgcacacc ggcgacatcg gctactacga 9420 cgaagagaag cacttcttca tcgtggaccg gctgaagagc ctgatcaagt acaagggcta 9480 tcaggtgccc cctgccgagc tggaaagcgt cctgctgcag caccccagca tcttcgacgc 9540 cggcgtggcc ggggtgccag atcctgtggc cggcgagctg cctggcgccg tggtggtgct 9600 ggaatccggc aagaacatga ccgagaaaga agtgatggac tacgtcgcca gccaggtgtc 9660 caacgccaag cggctgagag gcggcgtgag attcgtggac gaagtgccaa agggcctgac 9720 cggcaagatc gacggcaggg ccatccggga gatcctgaag aaacccgtgg ccaagatgtg 9780 attaattgat cgatacagca gcaattggca agctgcttac atagaaggcg cgccgtttaa 9840 acggccggcc ttaattaagt aacgatacag cagcaattgg caagctgctt acatagaact 9900 cgcggcgatt ggcatgccgc tttaaaattt ttattttatt tttcttttct tttccgaatc 9960 ggattttgtt tttaatattt caaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 10020 a 10021 <210> 30 <211> 1150 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> g-block for Alpha-R-DLP-2A-rFF <400> 30 tctacggcta acctgaatgg actacgacat agtctagtcc gccaagatat cgcaccatag 60 tcagcatagt acatttcatc tgactaatac tacaacacca ccaccatgaa tagaggattc 120 tttaacatgc tcggccgccg ccccttcccg gcccccactg ccatgtggag gccgcggaga 180 aggaggcagg cggccccggg aagcggagct actaacttca gcctgctgaa gcaggctgga 240 gacgtggagg agaaccctgg acctatggaa aatatggaaa acgacgagaa catcgtggtg 300 ggccccaagc ccttctaccc catcgaggaa ggcagcgccg gcacccagct gcggaagtac 360 atggaaagat acgccaagct gggcgccatt gccttcacca acgccgtgac cggcgtggac 420 tacagctacg ccgagtacct ggaaaagagc tgctgcctgg gcaaggctct gcagaactac 480 ggcctggtgg tggacggccg gatcgccctg tgcagcgaga actgcgagga attcttcatc 540 cccgtgatcg ccggcctgtt catcggcgtg ggcgtggctc ccaccaacga gatctacacc 600 ctgcgggagc tggtgcacag cctgggcatc agcaagccca ccatcgtgtt cagcagcaag 660 aagggcctgg acaaagtcat caccgtgcag aaaaccgtga ccaccatcaa gaccatcgtg 720 atcctggaca gcaaggtgga ctaccggggc taccagtgcc tggacacctt catcaagcgg 780 aacacccccc ctggcttcca ggccagcagc ttcaagaccg tggaggtgga ccggaaagaa 840 caggtggccc tgatcatgaa cagcagcggc agcaccggcc tgcccaaggg cgtgcagctg 900 acccacgaga acaccgtgac ccggttcagc cacgccaggg accccatcta cggcaaccag 960 gtgtcccccg gcaccgccgt gctgaccgtg gtgcccttcc accacggctt cggcatgttc 1020 accaccctgg gctacctgat ctgcggcttc cgggtggtga tgctgaccaa gttcgacgag 1080 gaaaccttcc tgaaaaccct gcaggactac aagtgcacct acgtgattct ggtgcccacc 1140 ctgttcgcca 1150 <210> 31 <211> 1150 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> g-block for Alpha-R-DLP-2A-nsp-DLP-2A-rFF <400> 31 tctacggcta acctgaatgg actacgacat agtctagtcc gccaagatat cgcaccatag 60 tcagcatagt acatttcatc tgactaatac tacaacacca ccaccatgaa tagaggattc 120 tttaacatgc tcggccgccg ccccttcccg gcccccactg ccatgtggag gccgcggaga 180 aggaggcagg cggccccggg aagcggagct actaacttca gcctgctgaa gcaggctgga 240 gacgtggagg agaaccctgg acctatggaa aatatggaaa acgacgagaa catcgtggtg 300 ggccccaagc ccttctaccc catcgaggaa ggcagcgccg gcacccagct gcggaagtac 360 atggaaagat acgccaagct gggcgccatt gccttcacca acgccgtgac cggcgtggac 420 tacagctacg ccgagtacct ggaaaagagc tgctgcctgg gcaaggctct gcagaactac 480 ggcctggtgg tggacggccg gatcgccctg tgcagcgaga actgcgagga attcttcatc 540 cccgtgatcg ccggcctgtt catcggcgtg ggcgtggctc ccaccaacga gatctacacc 600 ctgcgggagc tggtgcacag cctgggcatc agcaagccca ccatcgtgtt cagcagcaag 660 aagggcctgg acaaagtcat caccgtgcag aaaaccgtga ccaccatcaa gaccatcgtg 720 atcctggaca gcaaggtgga ctaccggggc taccagtgcc tggacacctt catcaagcgg 780 aacacccccc ctggcttcca ggccagcagc ttcaagaccg tggaggtgga ccggaaagaa 840 caggtggccc tgatcatgaa cagcagcggc agcaccggcc tgcccaaggg cgtgcagctg 900 acccacgaga acaccgtgac ccggttcagc cacgccaggg accccatcta cggcaaccag 960 gtgtcccccg gcaccgccgt gctgaccgtg gtgcccttcc accacggctt cggcatgttc 1020 accaccctgg gctacctgat ctgcggcttc cgggtggtga tgctgaccaa gttcgacgag 1080 gaaaccttcc tgaaaaccct gcaggactac aagtgcacct acgtgattct ggtgcccacc 1140 ctgttcgcca 1150 <210> 32 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> primer Alpha-3'nsp4-F <220> <221> misc_feature <223> RP123 <400> 32 ggctgtttaa gcttggcaaa cctct 25 <210> 33 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> primer Alpha-3'nsp4-F <220> <221> misc_feature <223> rFF-seq1 <400> 33 agcgagaact gcgaggaatt ctt 23 <210> 34 <211> 12342 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> misc_feature <223> Construct rEx-rFF <400> 34 gctcgaagtg tgtatggtgc catatacggc tcaccaccat atacactgca agaattacta 60 ttcttgtggg cccctctcgg taaatcctag agggctttcc tctcgttatt gcgagattcg 120 tcgttagata acggcaagtt ccctttctta ctatcctatt ttcatcttgt ggcttgacgg 180 gtcactgcca tcgtcgtcga tctctatcaa ctacccttgc gactatggca accttctccg 240 ctactggatt tggagggagt tttgttaggg actggtccct ggacttaccc gacgcttgtg 300 agcatggcgc gggattgtgc tgcgaagtgg acggctccac cttatgcgcc gagtgttttc 360 gcggttgcga aggaatggag caatgtcctg gcttgttcat gggactgtta aaactggctt 420 cgccagttcc agtgggacat aagttcctga ttggttggta tcgagctgcc aaagtcaccg 480 ggcgttacaa tttccttgag ctgttgcaac accctgcttt cgcccagctg cgtgtggttg 540 atgctaggtt agccattgaa gaggcaagtg tgtttatttc cactgaccac gcgtctgcta 600 agcgtttccc tggcgctaga tttgcgctga caccggtgta tgctaacgct tgggttgtga 660 gcccggctgc taacagtttg atagtgacca ctgaccagga acaagatggg ttctgctggt 720 taaaactttt gccacctgac cgccgtgagg ctggtttgcg gttgtattac aaccattacc 780 gcgaacaaag gaccgggtgg ctgtctaaaa caggacttcg cttatggctt ggagacctgg 840 gtttgggcat caatgcgagc tctggagggc tgaaattcca cattatgagg ggttcgcctc 900 agcgagcttg gcatatcaca acacgcagct gcaagctgaa gagctactac gtttgtgaca 960 tctctgaagc agactggtcc tgtttgcctg ctggcaacta cggcggctac aatccaccag 1020 gggacggagc ttgcggttac aggtgcttgg ccttcatgaa tggcgccact gttgtgtcgg 1080 ctggttgcag ttctgacttg tggtgtgatg atgagttggc ttatcgagtc tttcaattgt 1140 cacccacgtt cacggttacc atcccaggtg ggcgagtttg tccgaatgcc aagtacgcaa 1200 tgatttgtga caagcagcac tggcgcgtca aacgtgcaaa gggcgtcggc ctgtgtctcg 1260 atgaaagctg tttcaggggc atctgcaatt gccaacgcat gagtggacca ccacctgcac 1320 ccgtgtcagc cgccgtgtta gatcacatac tggaggcggc gacgtttggc aacgttcgcg 1380 tggttacacc tgaagggcag ccacgccccg taccagcgcc gcgagttcgt cccagcgcca 1440 actcttctgg agatgtcaaa gatccggcgc ccgttccgcc agtaccaaaa ccaaggacca 1500 agcttgccac accgaaccca actcaggcgc ccatcccagc accgcgcacg cgacttcaag 1560 gggcctcaac acaggagcca ctggcgagtg caggagttgc ttctgactcg gcacctaaat 1620 ggcgtgtggc caaaactgtg tacagctccg cggagcgctt tcggaccgaa ctggtacaac 1680 gtgctcggtc cgttggggac gttcttgttc aagcgctacc gctcaaaacc ccagcagtgc 1740 agcggtatac catgactctg aagatgatgc gttcacgctt cagttggcac tgcgacgtgt 1800 ggtacccttt ggctgtaatc gcttgtttgc tccctatatg gccatctctt gctttgctcc 1860 ttagctttgc cattgggttg atacccagtg tgggcaataa tgttgttctg acagcgcttc 1920 tggtttcatc agctaattat gttgcgtcaa tggaccatca atgtgaaggt gcggcttgct 1980 tagccttgct ggaagaagaa cactattata gagcggtccg ttggcgcccg attacaggcg 2040 cgctgtcgct tgtgctcaat ttactggggc aggtaggcta tgtagctcgt tccacctttg 2100 atgcagctta tgttccttgc actgtgttcg atctttgcag ctttgctatt ctgtacctct 2160 gccgcaatcg ttgctggaga tgcttcggac gctgtgtgcg agttgggcct gccacgcatg 2220 ttttgggctc caccgggcaa cgagtttcca aactggcgct cattgatttg tgtgaccact 2280 tttcaaagcc caccatcgat gttgtgggca tggcaactgg ttggagcgga tgttacacag 2340 gaaccgccgc aatggagcgt cagtgtgcct ctacggtgga ccctcactcg ttcgaccaga 2400 agaaggcagg agcgactgtt tacctcaccc cccctgtcaa cagcgggtca gcgctgcagt 2460 gcctcaatgt catgtggaag cgaccaattg ggtccactgt ccttggggaa caaacaggag 2520 ctgttgtgac ggcggtcaag agtatctctt tctcacctcc ctgctgcgtc tctaccactt 2580 tgcccacccg acccggtgtg accgttgtcg accatgctct ttacaaccgg ttgactgctt 2640 caggggtcga tcccgcttta ttgcgtgttg ggcaaggtga ttttctaaaa cttaatccgg 2700 ggttccggct gataggtgga tggatttatg ggatatgcta ttttgtgttg gtggttgtgt 2760 caacttttac ctgcttacct atcaaatgtg gcattggcac ccgcgaccct ttctgccgca 2820 gagtgttttc tgtacccgtc accaagaccc aagagcactg ccatgctgga atgtgtgcta 2880 gcgctgaagg catctctctg gactctctgg ggttaactca gttacaaagt tactggatcg 2940 cagccgtcac tagcggatta gtgatcttgt tggtctgcca ccgcctggcc atcagcgcct 3000 tggacttgtt gactctagct tcccctttag tgttgcttgt gttcccttgg gcatctgtgg 3060 ggcttttact tgcttgcagt ctcgctggtg ctgctgtgaa aatacagttg ttggcgacgc 3120 tttttgtgaa tctattcttt ccccaagcta cccttgtcac tatgggatac tgggcgtgcg 3180 tggcggcttt ggccgtttac agtttgatgg gcttgcgagt gaaagtgaat gtgcccatgt 3240 gtgtgacacc tgcccatttt ctgctgctgg cgaggtcagc tggacagtca agagagcaga 3300 tgctccgggt cagcgctgct gcccccacca attcactgct tggagtggct cgtgattgtt 3360 atgtcacagg cacaactcgg ctgtacatac ccaaggaagg cgggatggtg tttgaagggc 3420 tattcaggtc accgaaggcg cgcggcaacg tcggcttcgt ggctggtagc agctacggca 3480 cagggtcagt gtggaccagg aacaacgagg tcgtcgtact gacagcgtca cacgtggttg 3540 gccgcgctaa catggccact ctgaagatcg gtgacgcaat gctgactctg actttcaaaa 3600 agaatggcga cttcgccgag gcagtgacga cacagtccga gctcccaggc aattggccac 3660 agttgcattt cgcccaacca acaaccgggc ccgcttcatg gtgcactgcc acaggagatg 3720 aagaaggctt gctcagtggc gaggtttgtc tggcgtggac tactagtggc gactctggat 3780 ctgcagtggt tcagggtgac gctgtggtag gggtccacac cggttcgaac acaagtggtg 3840 ttgcctacgt gaccacccca agcggaaaac tccttggcgc cgacaccgtg actttgtcat 3900 cactgtcaaa gcatttcaca ggccctttga catcaatccc gaaggacatc cctgacaaca 3960 ttattgccga tgttgatgct gttcctcgtt ctctggccat gctgattgat ggcttatcca 4020 atagagagag cagcctttct ggacctcagt tgttgttaat tgcttgtttt atgtggtctt 4080 atcttaacca acctgcttac ttgccttatg tgctgggctt ctttgccgct aacttcttcc 4140 tgccaaaaag tgttggccgc cctgtggtca ctgggcttct atggttgtgc tgcctcttca 4200 caccgctttc catgcgcttg tgcttgttcc atctggtctg tgctaccgtc acgggaaacg 4260 tgatatcttt gtggttctac atcactgccg ctggcacgtc ttacctttct gagatgtggt 4320 tcggaggcta tcccaccatg ttgtttgtgc cacggttcct agtgtaccag ttccccggct 4380 gggctattgg cacagtacta gcggtatgca gcatcaccat gctggctgct gccctcggtc 4440 acaccctgtt actggatgtg ttctccgcct caggtcgctt tgacaggact ttcatgatga 4500 aatacttcct ggagggagga gtgaaagaga gtgtcaccgc ctcagtcacc cgcgcttatg 4560 gcaaaccaat tacccaggag agtctcactg caacattagc tgccctcact gatgatgact 4620 tccaattcct ctctgatgtg cttgactgtc gggccgtccg atcggcaatg aatctgcgtg 4680 ccgctctcac aagttttcaa gtggcgcagt atcgtaacat ccttaatgca tccttgcaag 4740 tcgatcgtga cgctgctcgt agtcgcagac taatggcaaa actggctgat tttgcggttg 4800 aacaagaagt aacagctgga gaccgtgttg tggttatcga cggtctggac cgcatggctc 4860 acttcaaaga cgatttggtg ctggttcctt tgaccaccaa agtagtaggc ggttctaggt 4920 gcaccatttg tgacgtcgtt aaggaagaag ccaatgacac cccagttaag ccaatgccca 4980 gcaggagacg ccgcaagggc ctgcctaaag gtgctcagtt ggagtgggac cgtcaccagg 5040 aagagaagag gaacgccggt gatgatgatt ttgcggtctc gaatgattat gtcaagagag 5100 tgccaaagta ctgggatccc agcgacaccc gaggcacgac agtgaaaatc gccggcacta 5160 cctatcagaa agtggttgac tattcaggca atgtgcatta cgtggagcat caggaagatc 5220 tgctagacta cgtgctgggc aaggggagct atgaaggcct agatcaggac aaagtgttgg 5280 acctcacaaa catgcttaaa gtggacccca cggagctctc ctccaaagac aaagccaagg 5340 cgcgtcagct tgctcatctg ctgttggatc tggctaaccc agttgaggca gtgaatcagt 5400 taaactgaga gcgccccaca tctttcccgg cgatgtgggg cgtcggacct ttgctgactc 5460 taaagacaag ggtttcgtgg ctctacacag tcgcacaatg tttttagctg cccgggactt 5520 tttatttaac atcaaatttg tgtgcgacga agagttcaca aagaccccaa aagacacact 5580 gcttgggtac gtacgcgcct gccctggtta ctggtttatt ttccgtcgta cgcaccggtc 5640 gctgattgat gcatactggg acagtatgga gtgcgtttac gcgcttccca ccatatctga 5700 ttttgatgtg agcccaggtg acgtcgcagt gacgggcgag cgatgggatt ttgaatctcc 5760 cggaggaggc cgtgcaaaac gtctcacagc tgatctggtg cacgcttttc aagggttcca 5820 cggagcctct tattcctatg atgacaaggt ggcagctgct gtcagtggtg acccgtatcg 5880 gtcggacggc gtcttgtata acacccgttg gggcaacatt ccatattctg tcccaaccaa 5940 tgctttggaa gccacagctt gctaccgtgc tggatgtgag gccgttaccg acgggaccaa 6000 cgtcatcgca acaattgggc ccttcccgga gcaacaaccc ataccggaca tcccaaagag 6060 cgtgcttgac aactgcgctg acatcagctg tgacgctttc atagcgcccg ctgcagagac 6120 agccctgtgt ggagatttag agaaatacaa cctatccacg cagggttttg tgttgcctag 6180 tgttttctcc atggtgcggg cgtacttaaa agaggagatt ggagacgctc caccactcta 6240 cttgccatct actgtaccat ctaaaaattc acaagccgga attaacggcg ctgagtttcc 6300 tacaaagtct ttacagagct actgtttgat tgatgacatg gtgtcacagt ccatgaaaag 6360 caatctacaa accgccacca tggcgacttg taaacggcaa tactgttcca aatacaagat 6420 taggagcatt ctgggcacca acaattacat tggcctaggt ttgcgtgcct gcctttcggg 6480 ggttacggcc gcattccaaa aagctggaaa ggatgggtca ccgatttatt tgggcaagtc 6540 aaaattcgac ccgataccag ctcctgacaa gtactgcctt gaaacagacc tggagagttg 6600 tgatcgctcc accccggctt tggtgcgttg gttcgctact aatcttattt ttgagctagc 6660 tggccagccc gagttggtgc acagctacgt gttgaattgc tgtcacgatc tagttgtggc 6720 gggtagtgta gcattcacca aacgcggggg tttgtcatct ggagacccta tcacttccat 6780 ttccaatacc atctattcat tggtgctgta cacccagcac atgttgctat gtggacttga 6840 aggctatttc ccagagattg cagaaaaata tcttgatggc agcctggagc tgcgggacat 6900 gttcaagtac gttcgagtgt acatctactc ggacgatgtg gttctaacca cacccaacca 6960 gcattacgcg gccagctttg accgctgggt cccccacctg caggcgctgc taggtttcaa 7020 ggttgaccca aagaaaactg tgaacaccag ctccccttcc tttttgggct gccggttcaa 7080 gcaagtggac ggcaagtgtt atctagccag tcttcaggac cgcgttacac gctctctgtt 7140 ataccacatt ggtgcaaaga atccctcaga gtactatgaa gctgctgttt ccatctttaa 7200 ggactccatt atctgctgtg atgaagactg gtggacggac ctccatcgac gtatcagtgg 7260 cgctgcgcgt accgacggag ttgagttccc caccattgaa atgttaacat ccttccgcac 7320 caagcagtat gagagtgccg tgtgcacagt ttgtggggcc gcccccgtgg ccaagtctgc 7380 ttgtggaggg tggttctgtg gcaattgtgt cccgtaccac gcgggtcatt gtcacacaac 7440 ctcgctcttc gccaactgcg ggcacgacat catgtaccgc tccacttact gcacaatgtg 7500 tgagggttcc ccaaaacaga tggtaccaaa agtgcctcac ccgatcctgg atcatttgct 7560 gtgccacatt gattacggca gtaaagagga actaactctg gtagtggcgg atggtcgaac 7620 aacatcaccg cccgggcgct acaaagtggg tcacaaggta gtcgccgtgg ttgcagatgt 7680 gggaggcaac attgtgtttg ggtgcggtcc tggatcacac atcgcagtac cacttcagga 7740 tacgctcaag ggcgtggtgg tgaataaagc tctgaagaac gccgccgcct ctgagtacgt 7800 ggaaggaccc cctgggagtg ggaagacttt tcacctggtc aaagatgtgc tagccgtggt 7860 cggtagcgcg accttggttg tgcccaccca cgcgtccatg ctggactgca tcaacaagct 7920 caaacaagcg ggcgccgatc catactttgt ggtgcccaag tatacagttc ttgactttcc 7980 ccggcctggc agtggaaaca tcacagtgcg actgccacag gtcggaacca gtgagggaga 8040 aacctttgtg gatgaggtgg cctacttctc accagtggat ctggcgcgca ttttaaccca 8100 gggtcgagtc aagggttacg gtgatttaaa tcagctcggg tgcgtcggac ccgcgagcgt 8160 gccacgtaac ctttggctcc gacattttgt cagcctggag cccttgcgag tgtgccatcg 8220 attcggcgct gctgtgtgtg atttgatcaa gggcatttat ccttattatg agccagctcc 8280 acataccact aaagtggtgt ttgtgccaaa tccagacttt gagaaaggtg tagtcatcac 8340 cgcctaccac aaagatcgcg gtcttggtca ccgcacaatt gattcaattc aaggctgtac 8400 attccctgtt gtgactcttc gactgcccac accccaatca ctgacgcgcc cgcgcgcagt 8460 tgtggcggtt actagggcgt ctcaggaatt atacatctac gacccctttg atcagcttag 8520 cgggttgttg aagttcacca aggaagcaga ggcgcaggac ttgatccatg gcccacctac 8580 agcatgccac ctgggccaag aaattgacct ttggtccaat gagggcctcg aatattacaa 8640 ggaagtcaac ctgctgtaca cacacgtccc catcaaggat ggtgtaatac acagttaccc 8700 taattgtggc cctgcctgtg gctgggaaaa gcaatccaac aaaatttcgt gcctcccgag 8760 agtggcacaa aatttgggct accactattc cccagactta ccaggatttt gccccatacc 8820 aaaagaactc gctgagcatt ggcccgtagt gtccaatgat agatacccga attgcttgca 8880 aattacctta cagcaagtat gtgaactcag taaaccgtgc tcagcgggct atatggttgg 8940 acaatcggtt ttcgtgcaga cgcctggtgt gacatcttac tggcttactg aatgggtcga 9000 cggcaaagcg cgtgctctac cagattcctt attctcgtcc ggtaggttcg agactaacag 9060 ccgcgctttc ctcgatgaag ccgaggaaaa gtttgccgcc gctcaccctc atgcctgttt 9120 gggagaaatt aataagtcca ccgtgggagg atcccacttc atcttttccc aatatttacc 9180 accattgcta cccgcagacg ctgttgccct ggtaggtgct tcattggctg ggaaagctgc 9240 taaagctgct tgcagcgttg ttgatgtcta tgctccatca tttgaacctt atctacaccc 9300 tgagacactg agtcgcgtgt acaagattat gatcgatttc aagccgtgta ggcttatggt 9360 gtggagaaac gcgacctttt atgtccaaga gggtgttgat gcagttacat cagcactagc 9420 agctgtgtcc aaactcatca aagtgccggc caatgagcct gtttcattcc atgtggcatc 9480 agggtacaga accaacgcgc tggtagcgcc ccaggctaaa atttcaattg gagcctacgc 9540 cgccgagtgg gcactgtcaa ctgaaccgcc acctgctggt tatgcgatcg tgcggcgata 9600 tattgtaaag aggctcctca gctcaacaga agtgttcttg tgccgcaggg gtgttgtgtc 9660 ttccacctca gtgcagacca tttgtgcact agagggatgt aaacctctgt tcaacttctt 9720 acaaattggt tcagtcattg ggcccgtgtg actctagagt ggacctgttc ccatcccccg 9780 ctcaactact caggtagtgg ttcgcggcaa cgggtacacc gcagttggta acaagcttgt 9840 cgatggaaaa tatggaaaac gacgagaaca tcgtggtggg ccccaagccc ttctacccca 9900 tcgaggaagg cagcgccggc acccagctgc ggaagtacat ggaaagatac gccaagctgg 9960 gcgccattgc cttcaccaac gccgtgaccg gcgtggacta cagctacgcc gagtacctgg 10020 aaaagagctg ctgcctgggc aaggctctgc agaactacgg cctggtggtg gacggccgga 10080 tcgccctgtg cagcgagaac tgcgaggaat tcttcatccc cgtgatcgcc ggcctgttca 10140 tcggcgtggg cgtggctccc accaacgaga tctacaccct gcgggagctg gtgcacagcc 10200 tgggcatcag caagcccacc atcgtgttca gcagcaagaa gggcctggac aaagtcatca 10260 ccgtgcagaa aaccgtgacc accatcaaga ccatcgtgat cctggacagc aaggtggact 10320 accggggcta ccagtgcctg gacaccttca tcaagcggaa caccccccct ggcttccagg 10380 ccagcagctt caagaccgtg gaggtggacc ggaaagaaca ggtggccctg atcatgaaca 10440 gcagcggcag caccggcctg cccaagggcg tgcagctgac ccacgagaac accgtgaccc 10500 ggttcagcca cgccagggac cccatctacg gcaaccaggt gtcccccggc accgccgtgc 10560 tgaccgtggt gcccttccac cacggcttcg gcatgttcac caccctgggc tacctgatct 10620 gcggcttccg ggtggtgatg ctgaccaagt tcgacgagga aaccttcctg aaaaccctgc 10680 aggactacaa gtgcacctac gtgattctgg tgcccaccct gttcgccatc ctgaacaaga 10740 gcgagctgct gaacaagtac gacctgagca acctggtgga gatcgccagc ggcggagccc 10800 ccctgagcaa agaagtggga gaggccgtcg ccaggcggtt caatctgccc ggcgtgcggc 10860 agggctacgg cctgaccgag acaaccagcg ccatcatcat cacccccgag ggcgacgaca 10920 agcctggagc cagcggcaag gtggtgcccc tgttcaaggc caaagtgatc gacctggaca 10980 ccaagaagag cctgggcccc aacagacggg gcgaagtgtg cgtgaagggc cccatgctga 11040 tgaagggcta cgtgaacaac cccgaggcca ccaaagagct gatcgacgaa gagggctggc 11100 tgcacaccgg cgacatcggc tactacgacg aagagaagca cttcttcatc gtggaccggc 11160 tgaagagcct gatcaagtac aagggctatc aggtgccccc tgccgagctg gaaagcgtcc 11220 tgctgcagca ccccagcatc ttcgacgccg gcgtggccgg ggtgccagat cctgtggccg 11280 gcgagctgcc tggcgccgtg gtggtgctgg aatccggcaa gaacatgacc gagaaagaag 11340 tgatggacta cgtcgccagc caggtgtcca acgccaagcg gctgagaggc ggcgtgagat 11400 tcgtggacga agtgccaaag ggcctgaccg gcaagatcga cggcagggcc atccgggaga 11460 tcctgaagaa acccgtggcc aagatgtgat tataactcga gggagccata gattcatttt 11520 gtggtgacgg gattttaggt gagtatctag attactttat tctgtccgtc ccactcttgc 11580 tgttgcttac taggtatgta gcatctgggt tagtgtatgt tttgactgcc ttgttctatt 11640 cctttgtatt agcagcttat atttggtttg ttatagttgg aagagccttt tctactgctt 11700 atgcttttgt gcttttggct gcttttctgt tattagtaat gaggatgatt gtgggtatga 11760 tgcctcgtct tcggtccatt ttcaaccatc gccaactggt ggtagctgat tttgtggaca 11820 cacctagtgg acctgttccc atcccccgcc caaccactca ggtagtggtt cgcggcaacg 11880 ggtacaccgc agttggtaac aagcttgtcg atggcgtcaa gacgatcacg tccgcaggcc 11940 gcctcttttc gaaacggacg gcggcgacag cctacaagct acaatgacct actgcgcatg 12000 tttggtcaga tgcgggtccg caaaccgccc gcgcaaccca ctcaggctat tattgcagag 12060 cctggagacc ttaggcatga tttaaatcaa caggagcgcg ccaccctttc gtcgaacgta 12120 caacggttct tcatgattgg gcatggttca ctcactgcag atgccggagg actcacgtac 12180 accgtcagtt gggttcctac caaacaaatc cagcgcaaag ttgcgcctcc agcagggccg 12240 taagacgtgg atattctcct gtgtggcgtc atgttgaagt agttattagc cacccaggaa 12300 ccaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aa 12342 <210> 35 <211> 8554 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> misc_feature <223> Construct Alpha-R-eGFP <400> 35 ataggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60 ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120 aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180 tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240 gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300 gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360 aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420 ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480 aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540 ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600 agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660 cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720 ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780 ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840 tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900 tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960 cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020 tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080 tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140 tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200 tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260 ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320 acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380 atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440 caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500 acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560 tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620 tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680 aggttaccag ctacgatggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740 ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800 taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860 tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920 ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980 gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040 aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100 ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160 cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220 gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280 aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340 ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400 ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460 ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520 tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580 gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640 cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700 aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760 aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820 ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctctgaa catgtgaacg 2880 tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940 taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000 cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060 agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120 tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180 cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240 gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300 cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360 cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420 gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480 tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540 gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600 tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660 tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720 agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780 tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840 gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900 cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960 acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020 aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080 gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140 tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200 tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260 cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320 acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380 acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440 cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500 ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560 atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620 caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680 atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740 tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800 aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860 gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920 tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980 caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040 acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100 cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160 aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220 aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280 ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340 gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400 gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460 gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520 caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580 ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640 ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700 catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760 cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820 tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880 acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940 ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000 tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060 cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120 ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180 ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240 ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300 ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360 cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420 ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480 aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540 taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600 aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660 cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720 acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780 tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840 acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900 tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960 aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020 tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080 cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140 acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200 aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260 gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320 aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380 gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440 tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500 gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560 gatatcgcac catgggaaga gccggcgtga gcaagggcga ggagctgttc accggggtgg 7620 tgcccatcct ggtcgagctg gacggcgacg taaacggcca caagttcagc gtgtccggcg 7680 agggcgaggg cgatgccacc tacggcaagc tgaccctgaa gctgatctgc accaccggca 7740 agctgcccgt gccctggccc accctcgtga ccaccctggg ctacggcctg cagtgcttcg 7800 cccgctaccc cgaccacatg aagcagcacg acttcttcaa gtccgccatg cccgaaggct 7860 acgtccagga gcgcaccatc ttcttcaagg acgacggcaa ctacaagacc cgcgccgagg 7920 tgaagttcga gggcgacacc ctggtgaacc gcatcgagct gaagggcatc gacttcaagg 7980 aggacggcaa catcctgggg cacaagctgg agtacaacta caacagccac aacgtctata 8040 tcaccgccga caagcagaag aacggcatca aggccaactt caagatccgc cacaacatcg 8100 aggacggcgg cgtgcagctc gccgaccact accagcagaa cacccccatc ggcgacggcc 8160 ccgtgctgct gcccgacaac cactacctga gctaccagtc cgccctgagc aaagacccca 8220 acgagaagcg cgatcacatg gtcctgctgg agttcgtgac cgccgccggg atcactctcg 8280 gcatggacga gctgtacaag taggctcttc gtaattaatt gatcgataca gcagcaattg 8340 gcaagctgct tacatagaag gcgcgccgtt taaacggccg gccttaatta agtaacgata 8400 cagcagcaat tggcaagctg cttacataga actcgcggcg attggcatgc cgctttaaaa 8460 tttttatttt atttttcttt tcttttccga atcggatttt gtttttaata tttcaaaaaa 8520 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaa 8554 <210> 36 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> 5 human beta globin UTR <400> 36 acatttgctt ctgacacaac tgtgttcact agcaacctca aacagacacc gccgccacc 59 <210> 37 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> T7 Promoter <400> 37 taatacgact cactatag 18 <210> 38 <211> 142 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> DLP <400> 38 atagtcagca tagtacattt catctgacta atactacaac accaccacca tgaatagagg 60 attctttaac atgctcggcc gccgcccctt cccggccccc actgccatgt ggaggccgcg 120 gagaaggagg caggcggccc cg 142 <210> 39 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> P2A <400> 39 ggaagcggag ctactaactt cagcctgctg aagcaggctg gagacgtgga ggagaaccct 60 ggacct 66 <210> 40 <211> 846 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> dsGFP <400> 40 atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60 ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120 ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180 ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240 cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300 ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360 gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420 aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480 ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540 gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600 tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660 ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagaag 720 cttagccatg gcttcccgcc ggaggtggag gagcaggatg atggcacgct gcccatgtct 780 tgtgcccagg agagcgggat ggaccgtcac cctgcagcct gtgcttctgc taggatcaat 840 gtgtag 846 <210> 41 <211> 134 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> 3 Human beta globin UTR <400> 41 gctcgctttc ttgctgtcca atttctatta aaggttcctt tgttccctaa gtccaactac 60 taaactgggg gatattatga agggccttga gcatctggat tctgcctaat aaaaaacatt 120 tattttcatt gcaa 134 <210> 42 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> T7 Terminator <400> 42 aacccctctc taaacggagg ggttttttt 29 <210> 43 <211> 1412 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Sequence of DLP dsGFP Mrna <400> 43 taatacgact cactatagac atttgcttct gacacaactg tgttcactag caacctcaaa 60 cagacaccgc cgccaccata gtcagcatag tacatttcat ctgactaata ctacaacacc 120 accaccatga atagaggatt ctttaacatg ctcggccgcc gccccttccc ggcccccact 180 gccatgtgga ggccgcggag aaggaggcag gcggccccgg gaagcggagc tactaacttc 240 agcctgctga agcaggctgg agacgtggag gagaaccctg gacctatggt gagcaagggc 300 gaggagctgt tcaccggggt ggtgcccatc ctggtcgagc tggacggcga cgtaaacggc 360 cacaagttca gcgtgtccgg cgagggcgag ggcgatgcca cctacggcaa gctgaccctg 420 aagttcatct gcaccaccgg caagctgccc gtgccctggc ccaccctcgt gaccaccctg 480 acctacggcg tgcagtgctt cagccgctac cccgaccaca tgaagcagca cgacttcttc 540 aagtccgcca tgcccgaagg ctacgtccag gagcgcacca tcttcttcaa ggacgacggc 600 aactacaaga cccgcgccga ggtgaagttc gagggcgaca ccctggtgaa ccgcatcgag 660 ctgaagggca tcgacttcaa ggaggacggc aacatcctgg ggcacaagct ggagtacaac 720 tacaacagcc acaacgtcta tatcatggcc gacaagcaga agaacggcat caaggtgaac 780 ttcaagatcc gccacaacat cgaggacggc agcgtgcagc tcgccgacca ctaccagcag 840 aacaccccca tcggcgacgg ccccgtgctg ctgcccgaca accactacct gagcacccag 900 tccgccctga gcaaagaccc caacgagaag cgcgatcaca tggtcctgct ggagttcgtg 960 accgccgccg ggatcactct cggcatggac gagctgtaca agaagcttag ccatggcttc 1020 ccgccggagg tggaggagca ggatgatggc acgctgccca tgtcttgtgc ccaggagagc 1080 gggatggacc gtcaccctgc agcctgtgct tctgctagga tcaatgtgta ggctcgcttt 1140 cttgctgtcc aatttctatt aaaggttcct ttgttcccta agtccaacta ctaaactggg 1200 ggatattatg aagggccttg agcatctgga ttctgcctaa taaaaaacat ttattttcat 1260 tgcaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1320 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1380 aaaaacccct ctctaaacgg aggggttttt tt 1412 <210> 44 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <223> H-2 Kd peptide <400> 44 Ile Tyr Ser Thr Val Ala Ser Ser Leu 1 5 <210> 45 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <223> CD4 T cell epitope <400> 45 Ile Tyr Ser Thr Val Ala Ser Ser Leu 1 5 <210> 46 <211> 104 <212> DNA <213> Sindbis virus <400> 46 atgaatagag gattctttaa catgctcggc cgccgcccct tcccggcccc cactgccatg 60 tggaggccgc ggagaaggag gcaggcggcc ccgatgcctg cccg 104 <210> 47 <211> 120 <212> DNA <213> Aura virus <400> 47 atgaactctg tcttttacaa tccgtttggc cgaggtgcct acgctcaacc tccaatagca 60 tggaggccaa gacgtagggc tgcacctgcg cctcgaccat ccgggttgac tacccagatc 120 120 <210> 48 <211> 71 <212> DNA <213> Eastern Equine Encephalitis virus SA <400> 48 atgtttccgt atccaacatt gaactacccg cctatggcac cggttaatcc gatggcatac 60 agggacccca a 71 <210> 49 <211> 91 <212> DNA <213> O'Nyong-Nyong virus <400> 49 atggagttca taccagcaca aacttactac aatagaagat accagcctag accctggact 60 caacgcccta ctatccaggt gatcaggcca a 91 <210> 50 <211> 67 <212> DNA <213> Semliki Forest virus <400> 50 atgaattaca tccctacgca aacgttttac ggccgccggt ggcgcccgcg cccggcggcc 60 cgtcctt 67 <210> 51 <211> 69 <212> DNA <213> Ross River virus <400> 51 atgaattaca taccaaccca gactttttac ggacgccgtt ggcggcctcg cccggcgttc 60 cgtccatgg 69 <210> 52 <211> 91 <212> DNA <213> Mayaro virus <400> 52 atggatttcc taccaacaca agtgttttat ggcaggcgat ggagaccacg aatgccgcca 60 cgcccttgga ggccacgccc acctacaatt c 91

Claims

변형된 바이러스성 RNA 레플리콘을 인코딩하는 핵산 서열을 포함하는 핵산 분자로서, 상기 변형된 바이러스성 RNA 레플리콘은
바이러스성 캡시드 향상제를 인코딩하는 제1 핵산 서열, 및
하나 이상의 레플리카제 및 전사효소를 인코딩하는 서열을 포함하는 제2 핵산 서열을 포함하고,
상기 바이러스성 캡시드 향상제는 하나 이상의 RNA 스템-루프를 포함하는 다운스트림 루프(DLP)를 포함하고, 바이러스성 RNA 레플리콘에 이종성이며,
상기 제1 핵산 서열은 바이러스성 RNA 레플리콘의 5' 말단의 1 내지 300 뉴클레오타이드 다운스트림의 영역 내에 작동가능하게 배치되고,
상기 영역은 제1 핵산 서열에 작동가능하게 연결된 5' 비번역된 영역(5'-UTR)을 포함하고,
상기 제1 핵산 서열은 제2 핵산 서열의 업스트림에 작동가능하게 연결되고,
상기 변형된 바이러스성 RNA 레플리콘은 토가비리다에(Togaviridae) 계열에 속하는 바이러스 종 또는 아테리비리다에 계열의 아테리바이러스 속에 속하는 바이러스 종으로부터 유래되고;
상기 바이러스성 캡시드 향상제는 서열번호 1 및 서열번호 46 내지 52 중 어느 하나의 뉴클레오타이드 서열을 포함하는 것인, 핵산 분자.
삭제
삭제
제1항에 있어서, 변형된 바이러스성 RNA 레플리콘을 인코딩하는 핵산 서열은 제1 핵산 서열에 다운스트림으로, 그리고 제2 핵산 서열에 업스트림으로 작동가능하게 연결된 오토프로테아제 펩타이드에 대한 코딩 서열을 추가로 포함하는 것인, 핵산 분자.
제1항에 있어서, 제2 핵산 서열은, 베네주엘라 말 뇌염 바이러스 (VEEV) 또는 말 동맥염 바이러스 (EAV)로 부터의, 상응하는 비변형 바이러스성 RNA 레플리콘의 천연 바이러스성 비구조 단백질에 대한 코딩 서열을 포함하는 핵산 분자.
제5항에 있어서,
변형된 바이러스성 RNA 레플리콘이 동부 말 뇌염 바이러스 (EEEV), 베네주엘라 말 뇌염 바이러스 (VEEV), 에버글레이즈 바이러스 (EVEV), 뮤캄보 바이러스 (MUCV), 셈리키 포레스트 바이러스 (SFV), 픽수나 바이러스 (PIXV), 미들버그 바이러스 (MIDV), 치쿤군야 바이러스 (CHIKV), O'니옹-니옹 바이러스 (ONNV), 로스 리버 바이러스 (RRV), 바마 포레스트 바이러스 (BF), 게타 바이러스 (GET), 사기야마 바이러스 (SAGV), 베바루 바이러스 (BEBV), 마야로 바이러스 (MAYV), 우나 바이러스 (UNAV), 신드비스 바이러스 (SINV), 아우라 바이러스 (AURAV), 화타로아 바이러스 (WHAV), 바반키 바이러스 (BABV), 키질라가크 바이러스 (KYZV), 웨스턴 말 뇌염 바이러스 (WEEV), 하이랜드 J 바이러스 (HJV), 포트 모건 바이러스 (FMV), 느두무 (NDUV), 연어과 알파바이러스 (SAV), 또는 버기 크릭 바이러스에 속하는 바이러스 종으로부터 유래된 변형된 RNA 레플리콘을 포함하거나, 또는
변형된 바이러스성 RNA 레플리콘이 말 동맥염 바이러스 (EAV), 돼지 호흡 및 생식 증후군 바이러스 (PRRSV), 락테이트 탈수소효소 증진 바이러스 (LDV) 또는 유인원 출혈열 바이러스 (SHFV)으로부터 유래된 변형된 RNA 레플리콘을 포함하는,
핵산 분자.
제6항에 있어서, 변형된 바이러스성 RNA 레플리콘은 VEEV로부터 유래되고, 핵산 분자는 5'-에서 3'-말단 순서로
(1) 5' 비번역 영역 (5'-UTR),
(2) VEEV의 nsp1의 아미노-말단 단편을 인코딩하는 뉴클레오타이드 서열,
(3) 신드비스 바이러스 (SINV)에서 유래된 다운스트림 루프 (DLP) 모티프, 및
(4) VEEV의 비구조 단백질 nsp1, nsp2, nsp3 및 nsp4 중 하나 이상의 서열을 포함하는 다단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는 핵산 분자.
제7항에 있어서, (3) 신드비스 바이러스 (SINV)에서 유래된 다운스트림 루프 (DLP) 모티프 및 (4) VEEV의 비구조 단백질 nsp1, nsp2, nsp3 및 nsp4 중 하나 이상의 서열을 포함하는 다단백질을 인코딩하는 뉴클레오타이드 서열 사이에 위치하는, 2A 프로테아제 서열 (P2A)을 인코딩하는 뉴클레오타이드 서열을 추가로 포함하는 것인, 핵산 분자.
제7항에 있어서, 변형된 바이러스성 RNA 레플리콘은 VEEV로부터 유래되고, 핵산 분자는 5'-에서 3'-말단 순서로
(1) 서열번호 19의 뉴클레오타이드 1 내지 45를 포함하는 5'-UTR,
(2) 서열번호 19의 뉴클레오타이드 46 내지 240을 포함하는 뉴클레오타이드 서열,
(3) 서열번호 38의 뉴클레오타이드 서열을 포함하는 DLP 모티프,
(4) 서열번호 3의 뉴클레오타이드를 가지는 P2A를 인코딩하는 뉴클레오타이드 서열, 및
(5) VEEV의 비구조 단백질 nsp1, nsp2, nsp3 및 nsp4의 서열을 포함하는 다단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는 핵산 분자.
제9항에 있어서, 상기 핵산 분자가 서열번호 19의 뉴클레오타이드 서열을 포함하는 것인, 핵산 분자.
제6항에 있어서, 변형된 RNA 레플리콘은 EAV로부터 유래되고, 핵산 분자는 5'-에서 3'-말단 순서로
(1) 5 '비번역 영역 (5'-UTR),
(2) EAV의 비구조 pp1ab의 아미노-말단 단편을 인코딩하는 뉴클레오타이드 서열,
(3) 신드비스 바이러스 (SINV)에서 유래된 다운스트림 루프 (DLP) 모티프,
(4) 2A 프로테아제 서열 (P2A)을 인코딩하는 뉴클레오타이드 서열, 및
(5) EAV의 비구조 pp1ab의 서열을 포함하는 폴리펩타이드를 인코딩하는 뉴클레오타이드 서열을 포함하는 핵산 분자.
제11항에 있어서, 상기 핵산 분자가 서열번호 2의 핵산을 포함하는 것인, 핵산 분자.
제1항 및 제4항 내지 제12항 중 어느 한 항에 있어서, 변형된 RNA 레플리콘은 하나 이상의 발현 카세트를 추가로 포함하고, 여기서 하나 이상의 발현 카세트 중 적어도 하나는 관심 유전자 (GOI)에 대한 코딩 서열에 작동가능하게 연결된 프로모터를 포함하는, 핵산 분자.
제13항에 있어서, 하나 이상의 발현 카세트 중 적어도 하나는 변형된 아테리 바이러스성 RNA 레플리콘의 전사 조절 서열 (TRS)의 다운스트림에 작동가능하게 위치하며, 여기서 TRS는 TRS1, TRS2, TRS3, TRS4, TRS5, TRS6 및 TRS7로 구성된 군으로부터 선택되는, 핵산 분자.
제13항에 있어서, 하나 이상의 발현 카세트 중 적어도 하나는 하나 이상의 RNA 스템-루프를 포함하는 바이러스성 캡시드 향상제의 하나 이상의 구조적 요소를 인코딩하는 제3 핵산 서열을 추가로 포함하고, 상기 제3 핵산 서열은 GOI에 대한 코딩 서열에 업스트림으로 작동가능하게 연결되는 것인, 핵산 분자.
제13항에 있어서, GOI에 대한 코딩 서열은 치료적 폴리펩타이드, 예방적 폴리펩타이드, 진단적 폴리펩타이드, 기능식품 폴리펩타이드, 산업 효소, 리포터 폴리펩타이드 및 이들의 임의의 조합으로 구성된 군에서 선택된 폴리펩타이드를 인코딩하는, 핵산 분자.
제13항의 핵산 분자를 포함하는 재조합 세포.
제13항의 핵산 분자, 및 약제학적으로 허용가능한 담체를 포함하는 조성물.
제13항의 핵산 분자를 인간이 아닌 동물인 대상체에게 투여하는 단계를 포함하여 이를 필요로 하는, 인간이 아닌 동물에서 관심 폴리펩타이드를 생산하는 방법으로서, 관심 폴리펩타이드가 GOI에 의해 인코딩되는, 방법.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제