KR102459458B1

KR102459458B1 - 스텔스성을 가지는 rna를 사용한 유전자 발현계 및 당해 rna를 포함하는 유전자 도입ㆍ발현벡터

Info

Publication number: KR102459458B1
Application number: KR1020177018246A
Authority: KR
Inventors: 마히토 나카니시; 미노루 이지마
Original assignee: 고쿠리츠켄큐카이하츠호진 상교기쥬츠 소고켄큐쇼; 도키와-바이오 가부시키가이샤
Priority date: 2015-01-16
Filing date: 2016-01-18
Publication date: 2022-10-25
Also published as: JP7174958B2; EP3246406B1; US20200190537A1; US11926840B2; US20170369903A1; EP3246406A1; JP2021006032A; US11834667B2; TW201636426A; US10544431B2; JP2022141733A; JP6770224B2; TWI696700B; JPWO2016114405A1; CN107109400A; SG11201705820UA; KR20170101926A; WO2016114405A1; CN107109400B; CA2973943A1

Abstract

본 발명은 하기(1)에서부터 (8)을 포함하는 마이너스 싱글-스트랜드 RNA와, 싱글-스트랜드 RNA 결합 단백질, RNA 의존성RNA 합성효소로 이루어지고, 자연면역기구를 활성화시키지 않는 복합체인 스텔스형 RNA 유전자 발현계를 사용해서, 복수의 외래 유전자를 동시에, 또 안정되게 발현하는 것을 가능하게 한다. (1) 임의의 단백질 또는 기능성 RNA 을 코딩하는 표적RNA 서열, (2) 비코딩영역을 구성하는 동물세포에서 발현하고 있는 mRNA 유래의 RNA 서열, (3) 상기 RNA 의존성RNA 합성효소가 인식하는 전사개시 시그널 서열, (4) 해당 효소가 인식하는 전사종결 시그널 서열, (5) 해당 효소가 인식하는 복제기점을 포함하는 RNA 서열, (6) 해당 효소를 코딩하는 RNA 서열로써, 도입 대상세포가 유래하는 생물 종에 코돈이 최적화된 RNA 서열, (7) 해당 효소의 활성을 조절하는 단백질을 코딩하는 RNA 서열로써, 도입 대상세포가 유래하는 생물종에 코돈이 최적화된 RNA 서열, (8) 상기 싱글-스트랜드 RNA 결합 단백질을 코딩하는 RNA 서열로써, 도입 대상세포가 유래하는 생물종에 코돈이 최적화된 RNA 서열.

Description

스텔스성을 가지는 RNA를 사용한 유전자 발현계 및 당해 RNA를 포함하는 유전자 도입ㆍ발현벡터{GENE EXPRESSION SYSTEM USING STEALTHY RNA, AND GENE INTRODUCTION/EXPRESSION VECTOR INCLUDING SAID RNA}

본 발명은 동물세포에 외래 유전자를 도입하고, 지속적으로 발현하기 위한 벡터에 관한 것이다.

인간 세포를 포함하는 동물세포에 외부로부터 임의의 유전자를 도입해서 당해 세포에서 지속적으로 발현하는 기술은 바이오 테크놀러지를 사용한 여러 가지의 산업에 있어서 필수적인 기술이다. 예를 들면, 의약품으로서 사용되는 인간ㆍ모노클로널 항체를 산업용으로 대량생산하기 위해서는 면역글로블린의 H 체인과 L 체인의 유전자를 동등한 레벨로 지속적으로 발현하는 기술이 필요하다. 또 선천성 대사 질환의 유전자 치료에서는 치료용 유전자를 인간의 조직 세포에 도입하고, 체내에서 장기간에 걸쳐서 안정적으로 발현하는 기술이 필요하다.

1. 세포 재프로그래밍 기술에 대해서

최근, 유전자를 사용해서 정상 조직 세포의 성질을 전환해서 유용한 세포를 만들어내는 세포 재프로그래밍 기술이 주목을 받고 있지만, 동물세포에 유전자를 도입해서 지속적으로 발현하는 기술은 세포 재프로그래밍에 있어서도 없어서는 안되는 기반 기술이 되고 있다. 예를 들면, OCT4, SOX2, KLF4, c-MYC 또는 OCT4, SOX2, NANOG, LIN28이라는 4개의 유전자를 조합시켜서 인간 정상 섬유아세포에 도입하고, 당해 유전자를 21일간에 걸쳐서 지속적으로 발현시킴으로써 인간 인공 다능성 세포(iPS 세포)을 제작할 수 있다(특허문헌 1, 특허문헌 2, 비특허문헌 1, 비특허문헌 2). 또, 인간의 섬유아세포에 FOXA3, HNF1A, HNF4A라는 3개의 유전자를 도입해서 14일간 지속적으로 발현시킴으로써 간세포를 제작할 수 있다(비특허문헌 3). 또, 인간의 섬유아세포에 ASCL1, BRN2, MYT1L, LMX1A, FOXA2라는 5개의 유전자를 도입하고, 24일간 지속적으로 발현시킴으로써 도파민 작동성 뉴런을 제작할 수 있는 것도 보고되고 있다(비특허문헌 4). 이렇게, 여러가지의 세포 재프로그래밍에 있어서, 복수의 유전자를 동시에 세포에 도입해서 발현시키고, 재프로그래밍에 필요한 기간 그 발현을 유지할 수 있는 기술이 필요하게 되었다.

세포의 재프로그래밍은 생체 내에서도 유도될 수 있음이 알려져 있다. 예를 들면, 마우스의 심근경색 모델에서, GATA4, MEF2C, TBX5에 3개의 유전자, 혹은 GATA4, HAND2, MEF2C, TBX5에 4개의 유전자를 경색부위에 투여하면, 침윤하고 있는 섬유아 세포가 심근세포로 변화되는 것이 보고되고 있다(비특허문헌 5, 비특허문헌 6). 이 때문에, 세포 재프로그래밍 기술은 장래, 심근경색이나 척수손상 등의 재생의료의 기반이 되는 것이 기대되고 있다.

2. 세포의 재프로그래밍 효율의 향상

또, 체외에서의 세포 재프로그래밍을 의료에 사용하는 것을 상정하면, 소재가 되는 세포는 인체로부터 침습을 가하지 않고 채취할 수 있으며, 또 생체외의 미생물에 오염되지 않는 상태에서 채취할 수 있음이 바람직하다. 이것들의 조건을 만족시키는 세포는 거의 말초혈 중의 단핵세포에 한정되어 있고, 이것들의 세포에 적응한 유전자 도입 벡터가 소망된다.

일반적으로, 외부로부터 도입한 유전자에 의해 동물세포가 재프로그래밍되는 효율은 매우 낮지만, 당해 유전자 전부를 1개의 벡터에 탑재하고, 한번에 세포에 도입해서 발현시킴으로써, 그 효율을 높일 수 있다(특허문헌 3, 특허문헌 4, 비특허문헌 7, 비특허문헌 8).

또, 세포 재프로그래밍에 사용하는 유전자의 수를 늘리는 것으로도 그 효율이 상승하는 것도 알려져 있다. 예를 들면, 마우스 섬유아세포를 인공 다능성 세포(iPS 세포)에 전환하는 기술에 있어서는 OCT4, SOX2, KLF4, c-MYC의 4개의 유전자에 BRG1과 BAF155에 2개의 유전자를 추가해서 계 6개의 유전자를 사용함으로써 전환 효율이 5배 상승하는 것이 알려져 있다(비특허문헌 9). 또, 인간의 섬유아세포를 운동신경에 재프로그래밍하는 기술에 있어서는 LHX3, ASCL1, BRN2, MYT1L이라는 4개의 유전자에, HB9, ISL1, NGN2라는 3개의 유전자를 추가해서 계 7개의 유전자를 사용함으로써, 재프로그래밍의 효율이 100배 향상하는 것이 알려져 있다(비특허문헌 10).

세포 재프로그래밍에 사용하는 유전자의 수를 늘리면, 탑재해야 할 유전자의 사이즈도 증대한다. iPS 세포의 제작 경우를 예로 하면, KLF4, OCT4, SOX2, c-MYC의 4개의 유전자의 합계로는 4,774염기쌍이지만, 상기의 BRG1(5,040염기쌍)과 BAF155(3,318염기쌍)의 2개의 유전자를 추가하면 합계로 13,132염기쌍이 된다(비특허문헌 9). 또, KLF4, OCT4, SOX2, c-MYC의 4개의 유전자에, 배아 줄기세포에서 특이적으로 발현하고 있고 iPS 세포로의 초기화를 가속화되는 것이 예상되고 있는 크로마틴 재구성 인자를 코딩하는 CHD1 유전자(5,133염기쌍)을 추가하면 합계로 9,907염기쌍, DNA 탈메틸화 효소를 코딩하는 TET1 유전자(6,429염기쌍)을 추가하면 합계로 11,203염기쌍이 된다. 또, 인간의 섬유아세포를 운동신경에 재프로그래밍하는 기술에 있어서는 사용되는 LHX3, ASCL1, BRN2, MYT1L, HB9, ISL1, NGN2에 7개의 유전자를 합계하면 9,887염기쌍이 된다(비특허문헌 10).

이와 같이, 세포 재프로그래밍의 효율을 올리기 위해서는, 적어도 6개 이상의 유전자를 사용하는 것이 바람직하고, 이것들의 유전자를 전부 한 번에 탑재할 수 있는 벡터가 소망된다. 또, 도입한 외래 유전자의 사이즈가 합쳐서 5,000염기 이상, 바람직하게는 8,000염기 이상이더라도 발현할 수 있는 벡터가 소망된다.

또, 본 명세서에 있어서 벡터란, 외래 유전자를 포함하는 핵산을 성분으로 하고, 당해 핵산을 동물세포에 도입해서 당해 유전자를 발현할 수 있는 유전자 재조합 바이러스 또는 비바이러스성의 핵산ㆍ고분자 물질 복합체를 가리키는 것으로 한다.

또, 외래 유전자를 발현시켜서 동물세포의 재프로그래밍을 실시하는 경우에, 당해 유전자의 발현 레벨이 재프로그래밍에 의해 제작된 세포의 성질에 크게 영향을 주는 것이 알려져 있다. 예를 들면, OCT4, SOX2, KLF4, c-MYC라는 4개의 유전자를 마우스 섬유아세포에서 발현시켰을 경우, 당해 유전자의 발현이 약한 경우에는 iPS 세포가 발생하는 것에 대해, 당해 유전자의 발현이 강한 경우에는 iPS 세포와는 완전히 성질이 다른 세포가 발생하는 것이 알려져 있다(비특허문헌 11). 이 때문에, 외부로부터 도입한 유전자를 발현시켜서 인간 세포를 포함하는 동물세포를 재프로그래밍하는 기술에는 목적에 맞춰서 당해 유전자의 발현을 최적인 레벨로 설정할 수 있는 벡터가 필요하다.

3. 재프로그래밍용 유전자의 제거

또, 외부로부터 유전자를 도입해서 세포 재프로그래밍에 의해 제작한 세포가 그 기능을 완전하게 발휘하기 위해서는, 당해 재프로그래밍용 유전자를 당해 세포로부터 완전하게 제거할 필요가 있다. 또, 제작한 인간 세포를 재생의료의 재료로 해서 사용할 때에도, 안전성을 확보하기 위해서 당해 유전자를 당해 세포로부터 완전하게 제거할 필요가 있다. 예를 들면, OCT4, SOX2, KLF4, c-MYC의 4개의 유전자를 사용해서 제작한 인공 다능성 세포(iPS 세포)에서는 이것들 4개의 유전자가 발현한 상태에서는 다능성을 발휘할 수 없으므로, 적어도 그 발현을 완전하게 억제하거나, 더 바람직하게는 당해 세포로부터 완전하게 제거할 필요가 있다(특허문헌 1, 특허문헌 2, 특허문헌 3, 비특허문헌 1, 비특허문헌 2, 비특허문헌 7). 또, iPS 세포 제작시에 사용한 c-MYC 유전자를 당해 iPS 세포 중에 남겨 두면, 당해 iPS 세포를 재분화시켜서 제작한 조직 세포가 고빈도로 암화하는 것이 알려져 있다(비특허문헌 12). 그 때문에 안전성을 담보하기 위해서는 당해 c-MYC 유전자를 iPS 세포로부터 완전하게 제거할 필요가 있다.

이와 같이, 세포 재프로그래밍에 필요한 유전자 발현 기술은 재프로그래밍의 달성을 위해서는 최적인 레벨에서의 지속적인 유전자 발현이 소망되는 한편, 일단 재프로그래밍이 종료하면 간단 또한 완전하게 제거될 수 있음이 요구된다는 모순된 성질을 양립시킬 필요가 있다.

4. 자연면역기구의 활성화 회피 중요성

현재, 동물세포에서 사용되고 있는 대부분의 유전자 도입ㆍ발현벡터에서는 동물에 감염하는 바이러스나, 대장균 등의 미생물을 사용해서 제조한 플라스미드 DNA가 소재로 사용되고 있다. 그러나 동물세포는 외부로부터 침입해 온 병원체를 격퇴하기 위한 자연면역기구를 구비하고 있으며(비특허문헌 13), 세포외로부터 도입된 바이러스나 미생물 유래의 핵산은 이물로서 인식되고, 자연면역기구가 활성화된다. 자연면역기구의 활성화 정도가 어느 레벨을 넘으면 세포사에 의한 세포사가 유도되기 때문에 재프로그래밍의 효율이 저하된다. 또, 자연면역기구의 활성화에 의해 인터페론이나 염증성 사이토카인의 발현이 유도되면, 생체 내에서는 염증이 발생된다. 이러한 바람직하지 않은 반응을 방지하기 위해서, 세포의 재프로그래밍을 실시하는 유전자 도입ㆍ발현 기술에는 자연면역기구의 활성화를 회피하는 것이 요구된다. 이 성질은 특히, 상기 1.에서 기술한 생체 내에서의 세포 재프로그래밍을 포함하는 재생의료로의 응용에 있어서 중요하다.

5. 이상적인 세포 재프로그래밍을 위한 유전자 도입ㆍ발현계

이상의 검토로부터, 유전자를 사용해서 인간 세포를 포함하는 동물세포를 재프로그래밍하는 기술을 추가로 개량해서 산업에 응용하기 위해서는 상기 1.∼4.에서 검토한 바와 같이, 적어도 이하에 5개의 조건을 만족하는 유전자 도입ㆍ발현 기술이 필요하다.

(1) 인간 말초혈 세포를 포함하는 동물세포에 외래 유전자를 효율적으로 도입할 수 있다.

(2) 필요한 임의의 기간, 당해 유전자를 지속적으로 발현할 수 있다.

(3) 해당 유전자의 발현에 있어서, 세포가 가지는 자연면역기구를 회피할 수 있다.

(4) 도입한 외래 유전자 길이가 합쳐서 5,000염기 이상, 바람직하게는 8,000염기 이상이더라도 발현할 수 있다.

(5) 적어도 6개, 바람직하게는 8개 이상의 당해 유전자를 동시에 발현할 수 있다.

그리고 추가로, 이하의 점이 달성되고 있을 것도 강하게 소망된다.

(6) 해당 유전자의 발현 레벨을 조절할 수 있다. 특히, 도입 유전자가 복수일 경우, 각 유전자의 발현 레벨을 개별적으로 조절 가능한 것이 바람직하다.

또, 특히 유전자 도입세포를 이식 기술에 응용하는 경우에는 이하의 점도 매우 중요한 포인트가 된다.

(7) 해당 유전자가 불필요해진 시점에서, 간단한 수법으로 제거할 수 있다.

6. 동물세포로의 복수 유전자 도입기술

인간 세포를 포함하는 동물세포에 외부로부터 복수의 유전자를 도입해 당해 세포에 있어서 지속적으로 발현하는 기술로써, 세포의 재프로그래밍에 사용될 수 있음이 보고되어 있는 기술로서는,

(1) 핵내에 있는 게놈 DNA에 당해 유전자를 삽입하는 방법

(2) 핵내에서 게놈 DNA와는 독립적으로 안정되게 존재할 수 있는 DNA에 당해 유전자를 탑재하는 방법

(3) 세포질에 존재하는 RNA에 당해 유전자를 탑재하는 방법

의 3가지가 알려져 있다.

6-1. 핵내의 게놈 DNA에 복수 유전자를 삽입하는 방법

렌티바이러스 벡터(비특허문헌 8, 비특허문헌 14)ㆍ트랜스포존(비특허문헌 15, 비특허문헌 16)ㆍ비상동 재조합ㆍ상동 재조합 등을 사용해서, 세포의 핵내에 있는 게놈 DNA에 외래 유전자를 삽입하는 방법에서는 당해 유전자는 게놈 DNA와 동등하게 안정되게 존재할 수 있다. 그러나 일단 게놈 DNA에 삽입되면, 당해 유전자만을 게놈 DNA로부터 선택적으로 제거하기 위해서는 서열 특이적 재조합 효소를 세포에 도입하는 등의 번잡한 작업이 필요하게 되는 동시에, 모든 세포에서 확실하게 제거할 수 있는 것은 아니다(비특허문헌 15). 또, 게놈 DNA로의 외래 유전자의 삽입은 숙주세포의 DNA 복제를 필요로 하기 때문에, 혈액세포 등의 증식능이 낮은 세포에의 유전자 도입은 효율이 매우 낮다. 또한, 외래 유전자가 게놈 DNA에 랜덤으로 삽입됨으로써, 숙주의 유전자 파괴나 이상한 활성화를 일으키는 「삽입 변이」라고 하는 현상이 알려져 있기 때문에 의료응용을 위해서는 안전성의 우려가 존재한다(비특허문헌 17).

6-2. 핵내에서 게놈 DNA와는 독립적인 DNA에 복수 유전자를 탑재하는 방법

세포의 핵내에서, 게놈 DNA와는 독립적으로 안정되게 존재할 수 있는 DNA에 외래 유전자를 탑재하는 방법으로서는 Epstein-Barr 바이러스의 게놈 복제기점을 탑재한 환상 DNA를 사용하는 방법이나(비특허문헌 18), 직쇄상의 거대한 DNA를 포함하는 인공 염색체를 사용하는 방법이 알려져 있다(비특허문헌 19). 이것들의 DNA 분자는 인간 세포의 핵 내에서 복제를 를 계속해서 안정되게 유지되지만, 그 기구는 숙주세포의 게놈 DNA가 복제하는 기구에 의존하고 있다. 그 때문에 외래 유전자가 탑재된 DNA의 복제만을 특이적으로 저해할 수 없고, 당해 DNA를 세포로부터 적극적으로 제거하는 기술은 보고되지 않고 있다. 또, 당해 DNA 분자를 세포핵내로 도입하기 위해서는 숙주세포의 분열이 필요하기 때문에 혈액세포 등의 증식능이 낮은 세포로의 유전자 도입은 효율이 매우 낮다. 또, 세포핵 내의 환상 DNA는 고빈도로 당해 세포의 게놈 DNA에 합입되는 것이 알려져 있기 때문에, 삽입 변이의 위험성을 배제할 수 없다(비특허문헌 20).

6-3. 동일한 벡터 DNA로부터 복수 유전자를 발현하는 기술

또, 상기 6-1. 및 6-2.에서 기술한 바와 같이 DNA를 유전자 발현의 플랫폼으로 사용하는 경우, 복수의 유전자를 동일한 벡터 DNA로부터 발현하는 기술이 필요하게 된다. 당해 기술로서는 1) 복수의 베돈 유전자를 단순하게 연결해서 발현하는 방법, 2) Internal Ribosome Entry Site(IRES)라고 불리는 RNA 구조를 사용해서, 1개의 메신저 RNA(mRNA)로부터 복수의 단백질을 발현하는 방법, 3) 복수의 단백질을 2A 펩티드로 연결한 융합 단백질을 발현하는 방법의 3가지가 알려져 있다.

복의가 베돈 유전자를 연결하는 방법에서는 유전자 간의 상호간섭에 의해 유전자의 발현이 강하게 억제되는 것이 알려져 있다(비특허문헌 21). 이것을 방지하기 위해서는 절연체(insulator)라 불리는 구조를 유전자 사이에 삽입할 필요가 있어, 벡터 DNA의 사이즈가 커지는 동시에, 구조도 복잡해진다. 이 방법에서는 4개의 유전자를 1개의 DNA 분자에 탑재해서 발현시킨 예가 보고되고 있지만(비특허문헌 22), 5개 이상의 유전자를 동시에 발현한 예는 보고되지 않고 있다.

IRES 서열을 사용해서 1개의 메신저 RNA(mRNA)로부터 복수의 단백질을 발현하는 방법에서는 IRES 서열의 하류에 두어진 단백질의 번역효율은 IRES 서열의 상류에 배치된 단백질의 번역효율보다도 낮아, 10% 이하가 되는 경우도 있다(비특허문헌 23). 또, IRES 서열은 비교적 사이즈가 크고 복잡한 구조이므로, IRES 서열을 사용한 방법은 주로 2개의 단백질을 동시에 발현시키기 위해서 사용되고 있다.

2A 펩티드는 플러스 싱글-스트랜드 RNA 바이러스에서 발견된 18에서 22 아미노산 잔기로 이루어지는 구조로, 복수의 단백질을 2A 펩티드로 접속한 융합 단백질은 합성시에 자동적으로 절단되고, 원래의 복수의 단백질로 분해된다. 이 기술에서는 절단 후에 발생하는 각 단백질의 N말단에는 1개의 프롤린이, C말단에는 17에서 21 아미노산 잔기가 남고, 이것들의 여분의 아미노산 잔기가 당해 단백질의 기능에 영향을 끼칠 가능성이 있다(비특허문헌 24). 또, 2A 펩티드 부위에서의 절단효율은 융합 단백질의 구조에 크게 영향을 주기 때문에 복수의 단백질을 효율적으로 제작하기 위해서는 노력이 필요로 하는 시행착오가 필요하다(비특허문헌 25). 2A 펩티드로 복수의 단백질을 접속하는 방법에서는 4개의 단백질을 동시에 발현한 예(비특허문헌 8)이나 5개의 단백질을 동시에 발현한 예(비특허문헌 16)가 보고되고 있다. 또, IRES 서열과 2A 펩티드를 조합시켜서 4개의 단백질을 발현한 예도 보고되고 있다(비특허문헌 14).

6-4. 세포질에 존재하는 RNA에 복수 유전자를 탑재하는 방법

상기 6-1.∼6-3.에서 기술한 바와 같이, DNA를 유전자 발현의 플랫폼으로 사용하는 기존의 유전자 도입ㆍ발현 기술에서는 4개에서 5개의 유전자를 사용한 세포의 재프로그래밍이 보고되고 있다. 그러나 DNA를 유전자 발현의 플랫폼으로 사용하는 한, 6개 이상의 유전자를 동시에 탑재하는 것이나, 간편한 방법으로 유전자의 제거를 달성하는 것은 용이하지 않고, 상기 5.에서 나타낸 이상적인 재프로그래밍에 요구되는 5개의 조건조차도 전부 만족시키는 기술은 보고되지 않고 있다.

한편, RNA를 플랫폼으로서, 인간 세포를 포함하는 동물세포에 외부로부터 복수의 유전자를 도입해서 발현하고, 세포를 재프로그래밍하는 기술로서는 플러스-스트랜드 RNA를 사용하는 기술(비특허문헌 26, 비특허문헌 27)과, 마이너스-스트랜드 RNA를 사용하는 기술(특허문헌 3, 특허문헌 4, 특허문헌 5, 특허문헌 6, 비특허문헌 7, 비특허문헌 28, 비특허문헌 29, 비특허문헌 30)이 보고되고 있다.

6-4-1. 플러스-스트랜드 RNA를 사용하는 방법

세포질에서 안정되게 존재할 수 있는 플러스-스트랜드 RNA를 사용해서 세포를 재프로그래밍하는 기술로서는 베네수엘라 말 뇌염 바이러스(VEEV) 유래의 플러스 싱글-스트랜드 게놈 RNA를 사용한 기술(비특허문헌 26)이 보고되고 있다. 이 기술에서는 VEEV의 게놈 RNA 3’측의 구조 유전자를 2A 펩티드로 연결한 단백질을 코딩하는 유전자로 바꿔 놓는 것에　의해, 4개의 단백질의 발현을 실현시키고 있다. 이 시스템은 매우 강한 인터페론 발현의 유도를 발생시키고, 반드시 항 인터페론 물질(백시니아 바이러스 유래의 B18R 단백질)과 조합시킬 필요가 있다(비특허문헌 26). 또, 유전자 도입의 효율은 조합시키는 유전자 도입시약에 의존하고, 재프로그래밍이 가능한 것은 섬유아세포 등 접착성의 세포로 한정된다. 외래 유전자를 탑재한 RNA는 불안정해서, B18R 단백질을 배지로부터 제거함으로써 소실한다.

플러스-스트랜드 RNA를 사용해서 세포를 재프로그래밍하는 기술로서는 화학합성한 메신저 RNA(mRNA)를 사용한 기술(비특허문헌 27)도 보고되고 있다. 이 선행기술은 최대 5개의 외래 유전자를 각각 탑재한 복수의 mRNA를 혼합하고 나서 유전자 도입시약을 사용해서 세포에 도입하는 것으로, 유전자 발현은 일과성이기 때문에 당해 세포에 매일 새롭게 도입할 필요가 있다. 또, 유전자 도입이 가능한 것은 섬유아세포 등 접착성의 세포로 한정된다. 이 기술에 있어서도 자연면역기구가 강력하게 활성화되기 때문에 반드시 항 인터페론 물질(백시니아 바이러스 유래의 B18R 단백질)과 조합시킬 필요가 있다(비특허문헌 27).

6-4-2. 마이너스-스트랜드 RNA를 사용하는 방법

마이너스-스트랜드 RNA를 사용해서 세포를 재프로그래밍하는 기술로서는 파라믹소 바이러스의 일종인 센다이바이러스 야생주에, 외래 유전자를 각각 탑재한 벡터를 혼합해서 사용하는 방법(특허문헌 5, 비특허문헌 28, 비특허문헌 29)이나, 3개의 유전자를 동시에 탑재하는 방법(특허문헌 6, 비특허문헌 30)이 선행기술로서 보고되고 있다. 이것들의 마이너스-스트랜드 RNA를 사용한 유전자 발현계에서는, F유전자를 결실함으로써 야생형 바이러스의 자율 복제능을 감쇠시키고, 외래 유전자는 각각 단독의 유전자 발현 카세트로서 탑재된다. 자연면역기구의 활성화에 대해서는 기술되어 있지 않지만, 소재인 센다이바이러스는 강한 인터페론 유도능을 가지고 있는 것이 알려져 있기(비특허문헌 31) 때문에 당해 벡터도 이것에 준한 자연면역기구의 활성화능을 가지는 것으로 예상된다. 또, 야생형 바이러스의 게놈에 온도감수성 변이를 도입하고, 배양 온도를 상승시켜서 벡터를 제거할 수 있음이 보고되고 있다(특허문헌 6, 비특허문헌 29, 비특허문헌 30). 야생형 센다이바이러스를 기초로 한 벡터에서 발현가능한 유전자의 사이즈는, 3,078염기쌍(대장균 베타ㆍ갈락토시다아제) (비특허문헌 32)부터 3,450염기쌍(KLF4, OCT4, SOX2에 3개의 유전자의 합계)으로 보고되고 있다(특허문헌 6, 비특허문헌 30).

또, 마이너스-스트랜드 RNA를 사용해서 세포를 재프로그래밍하는 기술로서는 지속 감염 변이 센다이바이러스를 기초로 한 기술이 보고되고 있다(특허문헌 3, 특허문헌 4, 비특허문헌 7). 이 기술에 있어서는, 벡터의 소재가 된 바이러스의 게놈에 있어서 장기 지속성에 관계하는 점돌연변이가 복수 동정되고 있고, 이것들의 변이가 자연면역기구의 활성화 회피(인터페론 발현의 저하)에 관여하고 있는 것이 나타나 있다. 또, 바이러스 게놈으로부터 3개의 유전자를 결실한 후 새로운 유전자를 탑재함으로써 4개의 외래 유전자를 동시에 발현시킬 수 있다. 또, RNA 의존성 RNA 합성효소를 코딩하는 L 유전자의 발현을 short interfering RNA(siRNA)로 억제함으로써, 벡터를 능동적으로 세포로부터 제거하는 것이 보고되고 있다. 지속 감염 변이 센다이바이러스를 기초로 한 벡터에서는 발현가능한 유전자의 사이즈는 4,774염기쌍(KLF4, OCT4, SOX2, c-MYC의 4개의 유전자의 합계)으로 보고되고 있다(특허문헌 3, 특허문헌 4, 비특허문헌 7).

7. 복수 유전자 도입기술의 향후의 과제

상기 6-4.에서 기술한 RNA를 유전자 발현의 플랫폼으로 사용하는 기존의 유전자 도입ㆍ발현 기술에서는 4개에서 5개의 유전자를 사용한 세포의 재프로그래밍이 보고되고 있다. 이것들 중에서는 상기 6-4-2.에서 기술한 결손 지속 발현형 센다이바이러스 벡터가 가장 뛰어난 성질을 가지고 있지만, 탑재 가능하다고 보고되고 있는 유전자의 수는 4개가 최대이다. 또, RNA 바이러스를 소재로 한 기술에서는 유전자 발현의 레벨을 변화시키는 것은 어렵다.

상기 6.에 나타내는 바와 같이, 인간 세포를 포함하는 동물세포에 외부로부터 복수의 유전자를 도입해서 당해 세포에 있어서 지속적으로 발현하는 기술은 유전자를 사용해서 정상 조직 세포의 성질을 전환해 유용한 세포를 만들어내는 세포 재프로그래밍에 최적화하는 것을 목표로 하고, 여러 가지의 개량이 이루어져 왔다. 그러나, 상기 5.에 나타낸 이상적인 재프로그래밍에 요구되는 5개의 조건을 전부 만족하는 기술은 지금까지 보고되지 않고 있다.

WO2007/069666 WO2008/118820 WO2010/134526 WO2012/063817 WO2010/008054 WO2012/029770 미국특허 제8, 326, 547호 명세서 미국특허 제8, 401, 798호 명세서 미국특허 제7, 561, 973호 명세서

Takahashi, et al., Cell, 131, 861-872, 2007 Yu, et al., Science, 318, 1917-1920, 2007 Huang, et al., Cell Stem Cell, 14370-384, 2014 Son, et al., Cell Stem Cell, 9, 205-218, 2011 Qian, et al., Nature, 485, 593-598, 2012 Song, et al., Nature, 485, 599-604, 2012 Nishimura, et al., J. Biol. Chem., 286, 4760-4771, 2011 Carey, et al., Proc. Natl. Acad. Sci. USA, 106, 157-162, 2009 Singhal, et al., Cell, 141, 943-955, 2010 Son, et al., Cell Stem Cell, 9, 205-218, 2011 Tonge, et al., Nature, 516, 192-197, 2014 Miura, et al., Nature Biotechnology, 27, 743-745, 2009 Randall, J. Gen Virol., 89, 1-47, 2008 Sommer, et al., Stem Cells, 28, 64-74, 2010 Kaji, et al., Nature, 458, 771-775, 2009 Grabundzjia, et al., Nuc. Acids Res., 41, 1829-1847, 2013 Hacein-Bey-Abina, et al., Science, 302, 415-419, 2003 Wu, et al., Proc. Natl. Acad. Sci. USA, 111, 10678-10683, 2014 Hiratsuka, et al., Plos One, 6, e25961, 2011 Hurley, et al., J. Virol., 65, 1245-1254, 1991 Yahata, et al., J. Mol. Biol., 374, 580-590, 2007 Nishiumi, et al., Cell Struct. Funct., 34, 47-59, 2009 Balvay, et al., Biochi. Biophys. Acta, 1789, 542-557, 2009 Felipe, et al., Trends Biotech., 24, 68-75, 2006 Lengler, et al., Anal. Biochem., 343, 116-124, 2005 Yoshioka, et al., Cell Stem Cell, 13, 246-254, 2013 Warren, et al., Cell Stem Cell, 7, 1-13, 2010 Fusaki, et al., Proc. Jpn. Acad. Ser. B85, 348-362, 2009 Ban, et al., Proc. Natl. Acad. Sci. USA, 108, 14234-14239, 2011 Fujie, et al., Plos One, 9, e113052, 2014 Hua, et al., J. Leukocyte Biol., 60, 125-128, 1996 Sakai, et al., FEBS Lett., 456, 221-226, 1999 Kondo, et al., J. Biol. Chem., 268, 21924-21930, 1993 Ward, et al., Proc. Natl. Acad. Sci. USA, 108, 331-336, 2011 Saito, et al., Nature, 454, 523-527, 2008 Vabret, et al., Plos One, 7, e33502, 2012 Rehwinkel, et al., Cell, 140, 397-408, 2010 Shioda, et al., Nuc. Acids Res., 14, 1545-1563, 1986 Vidal, et al., J. Virol., 64, 239-246, 1990 Irie, et al., J. Virol., 86, 7136-7145, 2012 Kato, et al., EMBO J., 16, 578-587, 1997 Tapparel, et al., J. Virol., 72, 3117-3128. 1998 Park, et al., Proc. Natl. Acad. Sci. USA, 88, 5537-5541, 1991 Harty, et al., J. Virol., 69, 5128-5131, 1995 Willenbrink et al., J. Virol., 68, 8413-8417, 1994 Sharp, et al., Nuc. Acids Res., 15, 1281-1295, 1987 Guigo, et al., J. Mol. Biol., 253, 51-60, 1995 Vabret, et al., J. Virol., 88, 4161-4172, 2014 Raab, et al., Syst. Synth. Biol., 4, 215-225, 2010 Alan, H., Gene, 56125-135, 1987 Kuo, et al., J. Virol., 62, 4439-4444, 1988 Sengupta, et al., J. Biol. Chem., 264, 14246-14255, 1989 Melton, et al., Nuc. Acids Res., 12, 7035-7056, 1984 Hampel, A., et al., Biochemistry 28, 4929-4933, 1989 Tuschl, et al., Genes Dev., 13, 3191-3197, 1999 Chang, et al., J. Bacteriol., 134, 1141-1156, 1978 Garcin, et al., EMBO J., 14, 6087-6094, 1995 Gotoh, et al., Virology, 171, 434-443, 1989 Lopez, et al., Mol. Microbiol., 33, 188-199, 1999 Kozak, Cell, 44, 283-292, 1986 Kozak, Mol. Cell Biol., 7, 3438-3445, 1987 Vara, et al., Gene, 33, 197-206, 1985 Nakajima, et al., Biosci. Biotechnol. Biochem., 68, 565-570, 2004 Ai, et al., Biochemistry, 46, 5904-5910, 2007 Drocourt, et al., Nuc. Acids Res., 18, 4009, 1990 Kogure, et al., Nat. Biotechnol., 24, 577-581, 2006 Gritz, et al., Gene, 25, 179-188, 1983 Studier, et al., J. Mol. Biol., 189, 113-130, 1986 Nawa, et al., Biol. Pharm. Bull, 21, 893-898, 1998 Karasawa, et al., Biochem. J., 381, 307-312, 2004 Yoneyama, et al., Nature Immunol., 5, 730-737, 2004 Sakaguchi, et al., Microbiol. Immunol., 55, 760-767, 2011 Jia, et al., J. Immunol., 183, 4241-4248, 2009 Studier, et al., J. Mol. Biol., 189, 113-130, 1986 Akagi, et al., Proc. Natl. Acad. Sci. USA, 100, 13567-13572, 2003 Hatsuzawa, et al., J. Biol. Chem., 265, 22075-22078, 1990 Boshart, et al., Cell, 41, 521-530, 1985 Taira, et al., Arch. Virol., 140, 187-194, 1995 Takebe, et al., Mol. Cell Biol., 8, 466-472, 1988 Recillas-Targa, et al., Proc. Natl. Acad. Sci. USA, 99, 6883-6888, 2002 Fujita, et al., Cell, 41, 489-496, 1985 Yi and Lemon, J. Virol., 77, 3557-3568, 2003 You and Rice, J. Virol., 82, 184-195, 2008 Chromikova, et al., Cytotechnology, 67, 343-356, 2015 Brandlein and Vollmers, Histol. Histopathol., 19, 897-905, 2004 Okada, et al., Microbiol. Immunol., 49, 447-459, 2005 Lewis, et al., Nature Biotech., 32, 191-198, 2014 Wurm. Nature Biotech., 22, 1393-1398, 2004

이상에서 설명한 바와 같이, 본발명이 해결하려고 하는 과제의 하나는 유전자를 사용해서 인간 세포를 포함하는 동물세포를 재프로그래밍하기 위해서 바람직한 유전자 도입ㆍ발현 기술, 그것을 위한 벡터를 개발하는 것이다. 또한, 재프로그래밍 유전자에 한하지 않고, 전장 5,000염기 이상 또는 적어도 6개 이상의 외래 유전자를 탑재할 수 있으며, 또 동물세포에서 자연면역기구를 활성화시키지 않고 지속적으로 발현 가능한 벡터를 제공하는 것이다. 또, 벡터 상에 6개 이상의 외래 유전자를 탑재하기 위한 효율적인 수법도 제공한다.

그리고 특히 재프로그래밍 기술에 있어서 바람직한 이하의 (1)∼(5)의 조건, 바람직하게는 추가로 (6), (7)을 포함시킨 조건을 만족하는 유전자 도입ㆍ발현 기술을 제공한다.

(1) 인간 말초혈 세포를 포함하는 동물세포에 외래의 유전자를 효율적으로 도입할 수 있다.

(6) 해당 유전자의 발현 레벨을 조절할 수 있다. 특히, 도입 유전자가 복수인 경우, 개별적으로 조절 가능하다.

또, 특히 이식 기술에 응용하는 경우에는, 이하의 점도 중요한 포인트가 된다.

(7) 해당 유전자가 불필요해진 시점에서, 간단한 수법으로 유전자 발현계를 제거할 수 있다.

배경기술의 6-1.∼6-3.에서 기술한 바와 같이, DNA를 유전자 발현의 플랫폼으로 사용하는 경우, 발명이 해결하려고 하는 과제로서 나타낸 이상적인 재프로그래밍에 요구되는 5개의 조건, 추가로 바람직한 7개의 조건을 전부 구비하는 것은 원리적으로 매우 곤란하다. 한편, 배경기술의 6-4.에서 기술한 바와 같이, RNA를 유전자 발현의 플랫폼으로 사용하는 경우, 동일 벡터 상에 탑재 가능한 유전자 수의 상한을 6개 이상, 또 전체 유전자 길이 5,000염기 이상으로 끌어올리는 동시에, 바이러스 유래의 RNA가 세포 내의 자연면역기구의 활성화를 발생시키는 문제를 어떻게 회피할 것인지가 최대의 과제가 된다.

그래서, 본 발명에서는 자연면역기구를 활성화하지 않는 동물세포 유래의 mRNA를 소재로 사용하고, 이것들의 RNA를 RNA 의존성 RNA 합성효소가 인식하는 전사개시 시그널ㆍ전사종결 시그널ㆍ복제기점과 조합시킨 마이너스 싱글-스트랜드 RNA를 우선 설계했다. 다음에, 이 마이너스 싱글-스트랜드 RNA에, RNA 의존성 RNA 합성효소 등 전사와 복제에 필요한 4개의 단백질을 코딩하는 유전자를, 자연면역기구에 이물로 인식되지 않도록 구조를 최적화한 후에 탑재했다. 또, 5종류의 제한효소를 사용해서 10개의 유전자를 설계대로 결합하는 새로운 방법을 개발하고, 이 10개의 유전자와 상보적인 cRNA를 상기의 마이너스 싱글-스트랜드 RNA에 탑재했다.

상기의 방법에 의해 완성한 마이너스 싱글-스트랜드 RNA를 유전자 발현의 플랫폼으로 사용함으로써, 적어도 10개의 외래 유전자(합계의 사이즈가 적어도 13.5킬로 염기)를 탑재하고, 자연면역기구를 활성화하지 않고 장기간에 걸쳐서 지속적으로 발현하는 것에 성공했다. 또, 유전자 발현에 필요한 N단백질이나 C 단백질의 발현효율을 바꿈으로써, 탑재하고 있는 유전자의 발현을 최대 80배의 범위에서 조절 가능하게 했다. 이렇게, 바이러스 유래의 구조를 가지는 RNA를 가능한 한 배제함으로써, 종래의 RNA 바이러스 게놈을 사용한 유전자 발현계의 능력 한계를 대폭적으로 넘어선 신규 유전자 발현계의 제작에 성공했다.

또, 본 발명에서 제작한 외래 유전자를 탑재한 마이너스 싱글-스트랜드 RNA를 가지는 세포에 있어서, 특허문헌 3 및 비특허문헌 33ㆍ비특허문헌 7에 기재되어 있는 방법에 따라서 파라믹소 바이러스의 외막 단백질과 매트릭스ㆍ단백질을 발현시킴으로써, 당해 RNA 분자를 봉입하고, 다른 세포에 도입하는 활성을 가지는 입자를 제작했다. 이 입자는 인간 혈액세포를 포함하는 여러가지의 동물의 세포에 있어서, 자연면역기구의 활성화를 낮게 억제한 상태에서, 당해 RNA 분자에 탑재된 10개의 유전자를 지속적으로 발현할 수 있었다. 또 당해 RNA 분자에 탑재되어 있는, 구조최적화된 RNA 의존성 RNA 합성효소의 유전자와 상보적인 siRNA를 당해 세포에 도입함으로써, 외래 유전자를 탑재한 RNA 분자를 제거할 수 있었다. 이상의 방법에 의해, [발명이 해결하려고 하는 과제]에서 나타낸, (1)∼ (5)의 5개의 과제에 부가해서, 전술의 바람직한 경우의 과제(6), (7)도 포함시키고, 7개의 과제를 전부 해결할 수 있음을 확인하고, 본 발명을 완성했다.

본 발명에서 사용한 RNA 분자는 자연면역기구가 「병원미생물에 특징적인 분자 패턴(Pathogen-associated molecular pattern, PAMP)」으로 인식하기 위해서 필요한 특이적인 구조를 결실하고 있기 때문에, 자연면역기구에 포착되기 어려운 「스텔스성」을 나타낸다. 그 때문에 이후, 당해 RNA 분자를 「스텔스성을 가지는 RNA」, 당해 RNA를 소재로 사용한 유전자 발현계를 「스텔스형 RNA 유전자 발현계」, 당해 유전자 발현계를 봉입해서 동물세포에 당해 유전자 발현계를 도입하는 활성을 가지는 구조물을 「스텔스형 RNA 벡터」라고 부른다.

즉, 본 발명은 아래와 같다.

[1] 하기(1)에서 (8)의 RNA 서열을 포함하는 마이너스 싱글-스트랜드 RNA(A)와, 싱글-스트랜드 RNA 결합 단백질(B), RNA 의존성 RNA 합성효소(C)로 이루어지고, 자연면역기구를 활성화시키지 않는 복합체인 스텔스형 RNA 유전자 발현계;

(1) 임의의 단백질 또는 기능성 RNA를 코딩하는 표적 RNA 서열,

(2) 비코딩영역을 구성하는 동물세포에서 발현하고 있는 mRNA 유래의 RNA 서열,

(3) 상기 RNA 의존성 RNA 합성효소가 인식하는 전사개시 시그널 서열,

(4) 해당 효소가 인식하는 전사종결 시그널 서열,

(5) 해당 효소가 인식하는 복제기점을 포함하는 RNA 서열,

(6) 해당 효소를 코딩하는 RNA 서열로써, 도입대상 세포가 유래하는 생물종에 코돈이 최적화된 RNA 서열,

(7) 해당 효소의 활성을 조절하는 단백질을 코딩하는 RNA 서열로써, 도입대상 세포가 유래하는 생물종에 코돈이 최적화된 RNA 서열,

(8) 상기 싱글-스트랜드 RNA 결합 단백질을 코딩하는 RNA 서열로써, 도입 대상세포가 유래하는 생물종에 코돈이 최적화된 RNA 서열.

여기에서, 전형적인 도입 대상세포는 인간 세포이기 때문에, 그 바람직한 경우에는 이하와 같이 기재할 수 있다.

[1’] 하기(1)에서 (8)의 RNA 서열을 포함하는 마이너스 싱글-스트랜드 RNA(A)와, 싱글-스트랜드 RNA 결합 단백질(B), RNA 의존성 RNA 합성효소(C)로 이루어지고, 자연면역기구를 활성화시키지 않는 복합체인 스텔스형 RNA 유전자 발현계;

(1) 임의의 단백질 또는 기능성 RNA를 코딩하는 표적 RNA 서열,

(2) 비코딩영역을 구성하는 인간 mRNA 유래 RNA 서열,

(4) 해당 효소가 인식하는 전사종결 시그널 서열,

(5) 해당 효소가 인식하는 복제기점을 포함하는 RNA 서열,

(6) 해당 효소를 코딩하는 RNA 서열이며, 인간 세포에 코돈이 최적화된 RNA 서열,

(7) 해당 효소의 활성을 조절하는 단백질을 코딩하는 RNA 서열로써, 인간 세포에 코돈이 최적화된 RNA 서열,

(8) 상기 싱글-스트랜드 RNA 결합 단백질을 코딩하는 RNA 서열로써, 인간 세포에 코돈이 최적화된 RNA 서열.

[2] 상기 [1]에서, 상기 (1)의 표적 RNA 서열이 적어도 6개의 유전자를 포함하거나, 또는 전장 5000염기 이상 길이의 RNA 서열인 스텔스형 RNA 유전자 발현계.

여기에서, 표적 RNA 서열은 7∼10개의 유전자를 포함할 수 있고, 또, 전장 5,000∼15,000염기 길이의 길이 RNA 서열이다.

[3] 상기 [1] 또는 [2]에서, 상기 (2)의 RNA 서열이 인간 유전자의 mRNA 서열 중의 5∼49염기 길이의 RNA 서열인 스텔스형 RNA 유전자 발현계.

여기에서, 상기 인간 유전자의 mRNA 서열로서, 바람직하게는 인간 House-keeping 유전자의 mRNA 서열이고, 더 바람직하게는 인간 House-keeping 유전자의 mRNA 서열 중의 비코딩영역 서열, 예를 들면 (표 1)에 기재된 RNA 서열 혹은 그 가운데의 연속한 5∼49염기 길이의 부분서열, 또는 그것을 복수 연결해서 사용할 수 있다.

[4] 상기 [1] 내지 [3] 중 어느 하나에서, 동일 혹은 다른 서열로 이루어지는 상기 (2)의 RNA 서열이 상기 (1)의 표적 RNA 서열에 포함되는 각 유전자 서열의 3’말단측 및/또는 5’말단측에 인접해서 배치되는 것을 특징으로 하는 스텔스형 RNA 유전자 발현계.

[5] 상기 [1] 내지 [4] 중 어느 하나에서, 상기 (6)의 RNA 서열이 코딩하는 RNA 의존성 RNA 합성효소가 파라믹소 바이러스과에 속하는 RNA 바이러스 유래의 L 단백질 및 P 단백질이고,

상기 (7)의 RNA 서열이 코딩하는 당해 효소의 활성을 조절하는 단백질이 당해 RNA 바이러스와 동일한 바이러스 유래의 C 단백질이고,

상기 (8)의 RNA 서열이 코딩하는 싱글-스트랜드 RNA 결합 단백질이, 당해 RNA 바이러스와 동일한 바이러스 유래의 NP 단백질이며, 또

상기 (3)∼(5)의 RNA 서열의 모두가, 당해 RNA 바이러스와 동일한 바이러스 유래의 게놈 서열 중의 전사개시 시그널, 전사종결 시그널, 및 복제기점을 포함하는 RNA 서열인 것을 특징으로 하는 스텔스형 RNA 유전자 발현계.

[6] 상기 [5]에서, 상기 L 단백질, P 단백질, C 단백질 및 NP 단백질을 코딩하는 RNA 서열이 인간 세포에 최적화되어 있으며, 또 그 GC함량이 50∼60%의 범위 내로 조정되고 있는 스텔스형 RNA 유전자 발현계.

[7] 상기 [6]에서, 상기 파라믹소 바이러스과에 속하는 RNA 바이러스가 센다이바이러스, 인간ㆍ파라인플루엔자 바이러스, 및 뉴캐슬병 바이러스 중 어느 하나로부터 선택된 RNA 바이러스인 스텔스형 RNA 유전자 발현계.

[8] 상기 [1] 내지 [7] 중 어느 하나에서, 상기 (3)의 전사개시 시그널 서열이 3’-UCCCACUUUC-5’(서열번호 1), 3’-UCCCUAUUUC-5’(서열번호 2), 3’-UCCCACUUAC-5’(서열번호 3), 3’-UCCUAAUUUC-5’(서열번호 7), 및 3’-UGCCCAUCUUC-5’(서열번호 9) 중 어느 하나에 나타나는 RNA 서열로부터 선택되는 RNA 서열이고, 상기 (4)의 전사종결 시그널 서열이 3’-AAUUCUUUUU-5’(서열번호 4), 3’-CAUUCUUUUU-5’(서열번호 5), 3’-UAUUCUUUUU-5’(서열번호 6), 및 3’-UUAUUCUUUUU-5’(서열번호 8)중 어느 하나에 나타나는 RNA 서열로부터 선택되는 RNA 서열인 것을 특징으로 하는 스텔스형 RNA 유전자 발현계.

[9] 상기 [4] 내지 [8] 중 어느 하나에서, 동일 혹은 다른 서열로 이루어지는 상기 (3)의 전사개시 시그널 서열이, 상기 (1)의 표적 RNA 서열에 포함되는 각 유전자 서열의 3’말단측에 인접해서 배치된 상기 (2)의 RNA 서열의 더욱더 3’말단측에 인접해서 배치되어 있으며, 또 상기 (4) 전사종결 시그널 서열이 상기 (1)의 표적 RNA 서열에 포함되는 각 유전자 서열의 5’말단측에 인접해서 배치된 RNA 서열의 더욱더 5’말단측에 인접해서 배치되고 있는 것을 특징으로 하는 스텔스형 RNA 유전자 발현계.

[10] 상기 [7] 내지 [10] 중 어느 하나에서, 상기 (5)의 복제기점을 포함하는 RNA 서열이 하기의 서열을 포함하는 것을 특징으로 하는 상기 스텔스형 RNA 유전자 발현계;

(a) 3’-UGGUCUGUUCUC-5’(서열번호 11) 또는 3’-UGGUUUGUUCUC-5’(서열번호 12)의RNA 서열,

(b) 3’-GAGAACAGACCA-5’(서열번호 13) 또는 3’-GAGAACAAACCA-5’(서열번호 14)의 RNA 서열,

(ｃ) 3’-(CNNNNN)₃-5’ (서열번호15)의 RNA 서열

(d) 3’- (NNNNNG)₃-5’(서열번호 16)의RNA 서열.

[11] 상기 [10]에서, 상기 (a)의 RNA 서열이 마이너스 싱글-스트랜드 RNA(A)의 3’말단에 위치하고 있으며, 또 상기 (b)의 RNA 서열이 5’말단에 위치하고 있는 것을 특징으로 하는 스텔스형 RNA 유전자 발현계.

[12] 상기 [10] 또는 [11]에서, 상기 (c)의 RNA 서열이 마이너스 싱글-스트랜드 RNA(A)의 3’말단으로부터 79염기째로부터 시작되며, 또, 상기 (d)의 RNA 서열이 5’말단으로부터 96염기째로부터 시작되는 것을 특징으로 하는 스텔스형 RNA 유전자 발현계.

[13] 상기 [10] 내지 [12] 중 어느 하나에서, 상기 (5)의 복제기점을 포함하는 RNA 서열이 추가로 마이너스 싱글-스트랜드 RNA(A)의 3’말단으로부터 97∼116염기째까지의 위치에, (e) 3’-AAAGAAACGACGGUUUCA-5’(서열번호 17)의 RNA 서열 또는 그 동일 염기 길이인 18염기 길이의 RNA 서열을 포함하는 것을 특징으로 하는 스텔스형 RNA 유전자 발현계.

[14] 상기 [1] 내지 [13]에 기재된 스텔스형 RNA 유전자 발현계를 구성하는 복합체를 포함하고, 동물세포에 당해 복합체를 도입하는 활성을 가지는 RNA 벡터로써, 자연면역기구를 활성화시키지 않는 스텔스형 RNA 벡터.

[15] 상기 [14]에서, 동물세포로의 감염능을 가지는 바이러스입자를 형성하고 있는 스텔스형 RNA 벡터.

[16] 상기 [14] 또는 [15]에 기재된 스텔스형 RNA 벡터가 도입된 동물세포.

[17] 하기(1)에서 (8)의 RNA 서열을 포함하는 마이너스 싱글-스트랜드 RNA(A)로써, 싱글-스트랜드 RNA 결합 단백질(B), 및 RNA 의존성 RNA 합성효소(C)와 함께, 자연면역기구를 활성화시키지 않는 복합체를 형성할 수 있는 스텔스형 RNA;

(1) 임의의 단백질 또는 기능성 RNA를 코딩하는 표적 RNA 서열,

(2) 비코딩영역을 구성하는 자연면역기구를 인식할 수 없는 RNA 서열,

(3) RNA 의존성 RNA 합성효소가 인식하는 전사개시 시그널 서열,

(4) 해당 효소가 인식하는 전사종결 시그널 서열,

(5) 해당 효소가 인식하는 복제기점을 포함하는 RNA 서열,

(6) 해당 효소를 코딩하는 RNA 서열로써, 자연면역기구를 인식할 수 없도록 구조 최적화한 RNA 서열,

(7) 해당 효소의 활성을 조절하는 단백질을 코딩하는 RNA 서열로써, 자연면역기구를 인식할 수 없도록 구조 최적화한RNA 서열,

(8) 싱글-스트랜드 RNA 결합 단백질을 코딩하는 RNA 서열로써, 자연면역기구를 인식할 수 없도록 구조 최적화한 RNA 서열.

본 발명은 이하의 형태도 포함한다.

[17’] 하기 (1)에서 (8)의 RNA 서열을 포함하는 마이너스 싱글-스트랜드 RNA(A)로써, 싱글-스트랜드 RNA 결합 단백질(B), 및 RNA 의존성 RNA 합성효소(C)와 함께, 자연면역기구를 활성화시키지 않는 복합체를 형성할 수 있는 스텔스형 RNA;

(1) 임의의 단백질 또는 기능성 RNA를 코딩하는 표적 RNA 서열,

(2) 비코딩영역을 구성하는, 동물세포에서 발현하고 있는 mRNA 유래의 RNA 서열,

(4) 해당 효소가 인식하는 전사종결 시그널 서열,

(5) 해당 효소가 인식하는 복제기점을 포함하는 RNA 서열,

(6) 해당 효소를 코딩하는 RNA 서열로써, 도입 대상세포가 유래하는 생물종에 코돈이 최적화된 RNA 서열,

(7) 해당 효소의 활성을 조절하는 단백질을 코딩하는 RNA 서열로써, 도입 대상세포가 유래하는 생물종에 코돈이 최적화된 RNA 서열,

[17”] 하기(1)에서 (8)의 RNA 서열을 포함하는 마이너스 싱글-스트랜드 RNA(A)로써, 싱글-스트랜드 RNA 결합 단백질(B), 및 RNA 의존성 RNA 합성효소(C)와 함께, 자연면역기구를 활성화시키지 않는 복합체를 형성할 수 있는 스텔스형 RNA;

(1) 임의의 단백질 또는 기능성 RNA를 코딩하는 표적 RNA 서열,

(2) 비코딩영역을 구성하는 인간 mRNA 유래 RNA 서열,

(4) 해당 효소가 인식하는 전사종결 시그널 서열,

(5) 해당 효소가 인식하는 복제기점을 포함하는 RNA 서열,

(6) 해당 효소를 코딩하는 RNA 서열로써, 인간 세포에 코돈이 최적화된 RNA 서열,

[18] 상기 [17]에서, 상기 마이너스 싱글-스트랜드 RNA(A)의 3’말단측 및 5’말단측에는 상기 (5)의 RNA 의존성 RNA 합성효소가 인식하는 복제기점을 포함하는 RNA 서열로써, 3’말단측의 RNA 서열 및 5’말단측의 RNA 서열에는 각각 상보하는 RNA 서열이 포함되어 있는 스텔스형 RNA.

[19] 상기 [17] 또는 [18]에서, 동일 혹은 다른 서열로 이루어지는 상기 (3)의 전사개시 시그널 서열이 상기 (1)의 표적 RNA 서열에 포함되는 복수의 유전자 서열 각각 3’말단측에 인접해서 배치된 상기 (2)의 RNA 서열의 또한 3’말단측에 인접해서 배치되어 있으며, 또 상기 (4) 전사종결 시그널 서열이, 상기 (1)의 표적 RNA 서열에 포함되는 복수의 유전자 서열 각각 유전자 서열 5’말단측에 인접해서 배치된 RNA 서열의 또한 5’말단측에 인접해서 배치되어 있는 것을 특징으로 하는 스텔스형 RNA.

[20] 상기 [17] 내지 [19] 중 어느 하나에서, 동일 혹은 다른 서열로 이루어지는 상기 (3)의 전사개시 시그널 서열이 상기 (1)의 표적 RNA 서열에 포함되는 복수의 유전자 서열 각각 3’말단측에 인접해서 배치된 상기 (2)의 RNA 서열의 더욱더 3’말단측에 인접해서 배치되어 있으며, 또 상기 (4) 전사종결 시그널 서열이 상기 (1)의 표적 RNA 서열에 포함되는 복수의 유전자 서열 각각 유전자 서열 5’말단측에 인접해서 배치된 RNA 서열의 더욱더 5’말단측에 인접해서 배치되어 있고, 추가로 그 양단에 복수의 제한효소에 의해 절단 가능한 제한효소 사이트를 가진 카세트 구조를 구성하고 있고, 당해 카세트 구조가 복수결합하고 있는 것을 특징으로 하는 스텔스형 RNA.

[21] 스텔스형 RNA 유전자 발현계를 재구성하는 방법으로써, 하기의 (1)∼ (5)의 공정을 포함하는 방법;

(1) T7 RNA polymerase를 발현하고 있는 대장균을 준비하는 공정,

(2) 상기 [1] 내지 [13]중 어느 하나에 기재된 마이너스 싱글-스트랜드 RNA(A)와 함께, 적어도 RNA 의존성 RNA 합성효소 및 RNA 결합 활성 단백질을 코딩하는 RNA가 탑재된 대장균용 벡터와, RNA 결합 활성 단백질을 코딩하는 DNA를 발현하는 대장균용 벡터를 (1)의 대장균 숙주 내로 도입해서 형질전환하는 공정,

(3) (2)의 형질전환 대장균 내에서, T7 RNA polymerase에 의해 발현시킨 외래의 유전자 RNA를 포함하는 마이너스 싱글-스트랜드 RNA와, RNA 결합 활성 단백질과의 복합체를 형성시키는 공정,

(4) RNA 의존성 RNA 합성효소를 발현하고 있는 동물세포를 준비하는 공정,

(5) (3)로 수득된 마이너스 싱글-스트랜드 RNA와, RNA 결합 활성 단백질과의 복합체를, (4)의 동물세포 숙주 내로 도입하고, 마이너스 싱글-스트랜드 RNA와, RNA 결합 활성 단백질 및 RNA 의존성 RNA 합성효소와의 복합체로 이루어지는 스텔스형 RNA 유전자 발현계를 재구성하는 공정.

[22] 2개소의 클로닝부위 A, B를 가지는 DNA베이스의 탠덤형 카세트로써,

당해 탠덤형 카세트는 5’말단측으로부터 차례로, (1) 멀티머화(multimerization) 부위 A, (2) 전사개시 시그널 A, (3) 비코딩서열 A1, (4) 클로닝 부위 A, (5) 비코딩영역 A2, (6) 전사종결 시그널 A, (7) 전사개시 시그널 B, (8) 비코딩서열 B1, (9) 클로닝 부위 B, (10) 비코딩영역 B2, (11) 전사종결 시그널 B, 및 (12) 멀티머화(multimerization) 부위 B에 의해 구성되고 있고,

상기 (1) 멀티머화(multimerization) 부위 A, 및 (12) 멀티머화(multimerization) 부위 B는 각각 제한효소 인식서열 및/또는 부위 특이적 재조합 효소 인식서열을 포함하고, 서로 동일 혹은 다른 DNA이고,

상기 (2) 전사개시 시그널 A, 및 (7) 전사개시 시그널 B는, 각각 RNA에 전사되었을 경우에 RNA 의존성 RNA 합성효소가 인식하는 전사개시 시그널을 포함한, 서로 동일 혹은 다른 DNA이고,

상기 (3) 비코딩서열 A1, (5) 비코딩영역 A2, (8) 비코딩서열 B, 및 (10) 비코딩영역 B2는 각각 RNA에 전사되었을 경우에 숙주세포의 자연면역기구에 인식되지 않는 RNA가 되는, 서로 동일 혹은 다른 DNA이고,

상기 (4) 클로닝 부위 A, 및 (9) 클로닝 부위 B는 각각 1 이상의 제한효소 인식서열 및/또는 부위 특이적 재조합 효소 인식서열을 포함하는, 서로 동일 혹은 다른 DNA이고,

상기 (6) 전사종결 시그널 A, 및 (11) 전사종결 시그널 B는 각각 RNA에 전사되었을 경우에 RNA 의존성 RNA 합성효소가 인식하는 전사종결 시그널을 포함하는 서로 동일 혹은 다른 DNA인, 탠덤형 카세트.

[23] 상기 [22]에서, 상기 (4) 클로닝 부위 A는 5’말단측으로부터 차례로 제한효소 A 인식서열, 및 제한효소 C 인식서열을 포함하고,

상기 (9) 클로닝 부위 B는 5’말단측으로부터 차례로 제한효소 D 인식서열, 및 제한효소B 인식서열을 포함하고 있고,

여기에서 제한효소 A와 제한효소 D는 동일서열의 싱글-스트랜드 돌출말단을 발생하는 것이고, 제한효소 C와 제한효소 B는 동일서열의 싱글-스트랜드 돌출말단을 발생하는 것인, 탠덤형 카세트.

[24] 상기 [[22] 또는 [23]에서, 상기 (1) 멀티머화(multimerization) 부위 A, 및 (12) 멀티머화(multimerization) 부위 B는 모두 NN 또는 NNN의 서열 임의의 싱글-스트랜드 돌출말단을 발생하는 제한효소의 인식서열을 포함하는 DNA인, 탠덤형 카세트.

[25] 상기 [22] 내지 [24] 중 어느 하나에서, 상기 (3) 비코딩서열 A1, (5) 비코딩영역 A2, (8) 비코딩서열 B, 및 (10) 비코딩영역 B2가 각각 동물세포에서 발현하고 있는 mRNA 유래 RNA 서열의 부분서열에 대응하는 동일 혹은 다른 cDNA로써,

상기 (4) 클로닝 부위 A, 및 (9) 클로닝 부위 B에, 동일 혹은 다른 인간 유래 유전자가 삽입된 탠덤형 카세트.

본 발명의 스텔스형 RNA 유전자 발현계는 자연면역기구에 포착되기 어렵기 때문에, 세포 장해성이 매우 낮고, 10개의 유전자를 탑재해서 여러 가지의 조직세포에 도입하고, 필요한 기간, 언제까지나 지속적으로 발현할 수 있다. 또, 본 발명에서 자연면역기구를 회피할 수 있는, 또는 면역 기구에 인식되지 않는 다고 할 때, 도입한 유전자 또는 기타의 벡터 등이 숙주의 자연면역을 실질적으로 자극하지 않는 것을 가리킨다. 구체적으로는, 인터페론β 유도능을 지표로 해서, 정상세포에 있어서의 IFN-β mRNA의 발현량을 1.0으로 했을 때에 30 이하, 바람직하게는 20 이하, 더 바람직하게는 10 이하인 것을 말한다.

또, 스텔스형 RNA 유전자 발현계는 세포질에서 기능하기 때문에, 당해 유전자 발현계를 봉입한 스텔스형 RNA 벡터를 사용하면, 증식능을 가지지 않고 세포분열을 하지 않고 있는 말초혈의 세포에 도입해서 탑재 유전자를 발현할 수 있다. 또, 최대 80배의 폭으로 발현의 강도가 다른 유전자 발현계를 선택할 수 있고, 불필요해지면 RNA 의존성 RNA 합성효소의 활성을 억제함으로써 간단하게 제거할 수 있다. 이 때문에, 이 기술은 지금까지는 불가능했던, 6개 이상의 유전자를 사용해서, 인간 세포를 포함하는 동물세포의 성질을 효율적으로 재프로그래밍하는 목적에 최적이다.

예를 들면, 인간의 말초혈 세포를 재료로 해서, 동물성분 비함유(Xeno-free)ㆍ피더세포 비사용(Feeder-free)과 같은 곤란한 조건하에서, 재생의료의 임상용으로 사용하는 고품질의 iPS 세포를 고효율로 제작한다는 응용이 생각된다. 또 6개 이상의 유전자를 사용해서, 인간의 조직 세포(혈액ㆍ피부ㆍ태반 등)로부터 신경 세포ㆍ신경줄기세포ㆍ줄기세포ㆍ췌장 베타 세포 등의 유용한 유전자를 만들어내는 다이렉트ㆍ재프로그래밍이라 불리는 기술로의 응용도 가능하다. 또, 세포사나 염증을 발생시킬 가능성이 낮기 때문에 거대유전자도 포함하는 각종 유전자에 의한 유전자치료나 생체 내에서의 재프로그래밍에 의한 재생의료로의 응용이 기대된다.

스텔스형 RNA 유전자 발현계는 복수 개의 유전자를 동시에 탑재해서 일정한 비율로 발현할 수 있기 위해서, 복수의 서브 유닛으로 이루어지는 바이오 의약품의 제조에도 효과를 발휘한다. 예를 들면, 인간 면역글로블린G를 생산하는 경우에는 각서브 유닛이 같은 세포에서 동시에 발현할 필요가 있다. 더구나, 인간 면역글로블린G를 생산하는 경우에는, H 체인과 L 체인을 1:1의 비율로, 인간 면역글로블린M을 생산하는 경우에는, H 체인: L 체인: μ 체인을 1:1:0.2의 비율로, 동일 세포에서 동시에 발현하는 것이 소망되지만, 스텔스형 RNA 유전자 발현계는 이러한 요구를 용이하게 만족시킬 수 있다.

또, 스텔스형 RNA 유전자 발현계는 유전자 발현의 레벨을 바꿀 수 있기 때문에, 바이오 의약품의 제조에 필요한 강한 유전자 발현을 용이하게 실현된다. 지금까지의 동물세포를 사용한 바이오 의약품의 제조공정에서는 염색체에 합입된 유전자의 카피수가 증폭된 안정된 세포주를 수립한다는 막대한 시간과 노력을 필요로 하는 과정이 필요했지만, 스텔스형 RNA 유전자 발현계를 채용하면, 이러한 노력은 불필요하게 된다.

또, 스텔스형 RNA 유전자 발현계는 바이오 의약품의 제조에 즈음하여 문제가 되는 유전자 변이를 억제하기 위해서도 효과를 발휘한다. 최근, RNA 바이러스의 게놈이 변이를 일으키는 주된 요인이 세포질의 아데노신데아미나제(Adenosine deaminase acting on RNA, ADAR1)인 것이 보고되고 있다(비특허문헌 39). ADAR1은 자연면역기구의 활성화에 의해 유도되기 때문에, 스텔스형 RNA 유전자 발현계에서는 ADAR1의 유도를 최소한으로 억제해서 유전자의 변이를 억제하는 것이 가능하다.

스텔스형 RNA 유전자 발현계는 또, 복수의 서브 유닛으로 이루어지는 신약개발 표적 단백질의 발현에도 최적이다. 예를 들면, 신약개발 표적효소의 NADPH 산화효소(Nox2)를 발현하기 위해서는 gp91phoxㆍp22phoxㆍRacㆍp47phoxㆍp67phoxㆍp40phox의 6개의 서브 유닛을 동시에 발현할 필요가 있지만, 스텔스형 RNA 유전자 발현계에서는 용이하게 실현된다. 또한, 스텔스형 RNA 벡터를 사용하면, 초대배양 혈관내피세포나 신경세포 등, 세포분열을 일으키지 않기 때문에 유전자 도입이나 발현이 곤란했던 표적세포에도 신약개발 표적 단백질을 발현시킬 수 있고, 용이하게 목적을 달성할 수 있다.

또, 스텔스형 RNA 유전자 발현계나 스텔스형 RNA 벡터는 세포장해나 염증을 발생시킬 가능성이 낮기 때문에, 생체 내에서의 유전자 발현에 의해 치료효과를 얻는 유전자치료의 플랫폼으로서의 응용이 가능하다. 특히, 종래의 유전자 도입ㆍ발현벡터에서는 불가능했던, 혈우병A의 원인 유전자 산물인 혈액응고 제8인자의 cDNA(7053염기)나 뒤센형 근디스트로피의 원인 유전자 산물인 지스트로핀의 cDNA(11058염기) 등이 거대한 유전자를 탑재해서 지속적으로 발현하는 것이 가능하므로, 이것들의 질환의 유전자 치료용 벡터로서의 응용이 기대된다.

또, 본 발명에 있어서 벡터 위로 6개 이상, 바람직하게는 8개 이상의 외래 유전자를 탑재하기 위해서 개발된 탠덤형 카세트 연결법에 사용하는 탠덤형 카세트는 DNA베이스에서 구축되므로, 당해 수법은 본 발명의 스텔스형 RNA 벡터뿐만 아니라, 일반적인 DNA 발현 벡터 등 폭넓게 응용가능하다.

도 1은 동물세포에서 발현하는 mRNA에 유래하는 RNA와, RNA 의존성 RNA 합성효소가 인식하는 전사개시 시그널ㆍ전사종결 시그널ㆍ복제기점을 조합시켜서 제작한 마이너스 싱글-스트랜드 RNA 분자의 구조를 나타내는 도면이다.
도 2는 마이너스 싱글-스트랜드 RNA 분자의 복제에 필요한 핵산의 3’말단과 5’말단의 구조를 나타내는 도면이다.
도 3은 마이너스 싱글-스트랜드 RNA 분자의 복제에 필요한 핵산의 3’말단의 구조를 나타내는 도면이다.
도 4는 마이너스 싱글-스트랜드 RNA 분자의 복제에 필요한 핵산의 5’말단의 구조를 나타내는 도면이다.
도 5는 RNA 바이러스 유래의 mRNA에 있어서의 Codon adaptation index의 해석이다.
도 6은 RNA 바이러스 유래의 mRNA에 있어서의 GC함량의 해석이다.
도 7은 스텔스형 RNA 유전자 발현계에 탑재하는 외래 유전자 cDNA의 설계법을 나타내는 도면이다.
도 8은 2개의 외래 유전자 cDNA를 결합하는 방법을 나타낸 도면이다.
도 9는 10개의 외래 유전자 cDNA를 결합하는 방법을 나타낸 도면이다.
도 10은 10개의 외래 유전자를 탑재한 스텔스형 RNA 유전자 발현계를 제작하기 위한 주형 cDNA를 구축하는 방법을 나타낸 도면이다.
도 11은 주형 cDNA로부터 스텔스형 RNA 유전자 발현계를 재구성하기 위한 제1 방법을 나타낸 도면이다.
도 12는 주형 cDNA로부터 스텔스형 RNA 유전자 발현계를 재구성하기 위한 제2 방법을 나타낸 도면이다.
도 13은 10개의 외래 유전자 cDNA를 탑재한 스텔스형 RNA 유전자 발현계의 제놈 구조를 나타낸 도면이다.
도 14는 10개의 외래 유전자 cDNA를 탑재한 스텔스형 RNA 유전자 발현계의 유전자 발현 활성을 나타낸 도면이다.
도 15는 도 13과는 다른 방법으로 핵산의 염기서열을 최적화해서 제작한 10개의 외래 유전자 cDNA를 탑재한 스텔스형 RNA 유전자 발현계의 제놈 구조를 나타낸 도면이다.
도 16은 N, C, PolS(P) 유전자의 배치를 바꾸어서 제작한 10개의 외래 유전자 cDNA를 탑재한 스텔스형 RNA 유전자 발현계의 제놈 구조를 나타낸 도면이다.
도 17은 스텔스형 RNA 벡터의 인터페론 유도 활성을 나타내는 도면이다.
도 18은 자연면역활성 유도능을 완전하게 회피하기 위한 추가 인자를 탑재한 스텔스형 RNA 유전자 발현계의 게놈 구조를 나타낸 도면이다.
도 19는 추가 인자를 탑재한 스텔스형 RNA 벡터에 의한 인터페론 유도능을 나타낸 도면이다.
도 20은 다른 유전자 발현 레벨을 가진 스텔스형 RNA 유전자 발현계의 구조를 나타내는 도면(플러스-스트랜드 RNA 서열로 표기하고 있다.)이다.
도 21은 C 유전자를 결실 또는 번역 억제한 스텔스형 RNA 유전자 발현계의 제놈 구조와 유전자 발현을 나타내는 도면이다.
도 22는 스텔스형 RNA 유전자 발현계의 패키징ㆍ시그널의 활성을 나타내는 도면이다.
도 23은 스텔스형 RNA 유전자 발현계를 세포로부터의 제거를 나타내는 도면이다.
도 24는 지금까지에 제작한 스텔스형 RNA 벡터의 제놈 구조를 나타내는 도면이다.
도 25는 6개의 초기화유전자를 탑재한 스텔스형 RNA 벡터에 의한 인공 다능성 줄기세포(iPS 세포)의 제작 효율을 나타낸 도면이다.
도 26은 스텔스형 RNA 유전자 발현계에 의한 면역글로블린M의 발현을 나타낸 도면이다.
도 27은 스텔스형 RNA 유전자 발현계에 의한 이중 특이성 항체의 발현을 나타낸 도면이다.

1. 본 발명의 「스텔스형 RNA 유전자 발현계」의 구성요소

본 발명에서 사용한 RNA 분자는 자연면역기구에 포착되기 어려운 「스텔스성」을 나타낸다. 그 때문에 본 발명에서는 당해 RNA 분자를 「스텔스성을 가지는 RNA」, 당해 RNA를 소재로서 사용한 유전자 발현계를 「스텔스형 RNA 유전자 발현계」, 당해 유전자 발현계를 봉입해서 동물세포에 당해 유전자 발현계를 도입하는 활성을 가지는 구조물을 「스텔스형 RNA 벡터」라고 부른다.

본 발명에서의 스텔스형 RNA 유전자 발현계란, 이하의 (1)에서 (8)의 RNA 서열을 포함하는 마이너스 싱글-스트랜드 RNA(A)와, 싱글-스트랜드 RNA 결합 단백질(B), RNA 의존성 RNA 합성효소(C)로 이루어지며, 또 자연면역기구를 활성화시키지 않는 복합체이다. 스텔스형 RNA 벡터란 당해 복합체를 포함해 동물세포에 당해 복합체를 도입하는 활성을 가지는 입자이다. 또, 본 발명에 있어서 마이너스 싱글-스트랜드 RNA의 RNA 서열을 표기할 때에 즈음해서, 단백질을 코딩하는 서열이라고 할 때, 안티센스 스트랜드측의 RNA 서열을 가리킨다.

(1) 임의의 단백질 또는 기능성 RNA를 코딩하는 표적 RNA 서열,

(4) 해당 효소가 인식하는 전사종결 시그널 서열,

(5) 해당 효소가 인식하는 복제기점을 포함하는 RNA 서열,

(7) 해당 효소의 활성을 조절하는 단백질을 코딩하는 RNA 서열로써, 자연면역기구를 인식할 수 없도록 구조 최적화한 RNA 서열,

(8) 상기 싱글-스트랜드 RNA 결합 단백질을 코딩하는 RNA 서열로써, 자연면역기구를 인식할 수 없도록 구조 최적화한 RNA 서열.

(이하, 유전자 RNA 또는, 단순하게 유전자 라고 하는 경우도 있다.).

여기에서, (2)의 RNA는 5∼49염기 길이를 가지고 있는 것이 바람직하고, (1)이 도입된 외래 유전자 RNA의 각각의 3’말단측 및 5’말단측의 비코딩영역으로서 배치된다.

또, (1)의 도입하는 외래 유전자 RNA의 개수는 6개 미만, 예를 들면 1∼5개이더라도, 전염기 길이가 5,000염기 길이 미만이더라도 당연하게 스텔스형 RNA 유전자 발현계로서 기능하지만, 본 발명의 RNA 유전자 발현계가 현저한 효과를 발휘하는 것은, 특히 외래 유전자 RNA의 개수가 6개 이상, 바람직하게는 8개 이상, 더 바람직하게는 10개 이상의 유전자를, 또 전체 염기 길이에서는 5,000염기 길이, 바람직하게는 8,000염기 길이, 더 바람직하게는 10,000염기 길이의 RNA를 포함하는 경우이다.

또, 본원 명세서에 있어서, 유전자 혹은 유전자 재료라고 할 때, 마이너스-스트랜드 RNA 또는 cDNA, 및 이것과 상보의 플러스-스트랜드 RNA 또는 cDNA를 포함한다. 즉 전사 혹은 역전사에 의해, 상기 중 어느 하나의 유전자 혹은 유전자 재료를 합성할 수 있는 것은 본 발명에 포함된다.

2. 본 발명의 스텔스형 RNA 발현계의 구성요소

2-1. 외래 유전자 RNA 도입을 위한 탠덤형 카세트의 작성

본 발명의 스텔스형 RNA 유전자 발현계에 있어서의 외래 유전자 RNA는 그 3’말단 및 5’말단의 비코딩영역에 5∼49염기의 동일 혹은 다른 「(1) 자연면역기구에 인식되지 않는 RNA」를 가지고 있고, 그 더욱더 외측의 3’말단 및 5’말단에 각각 (3)의 「전사개시 시그널」 및 (4)의 「전사종결 시그널」이 설치되고, 가장 외측의 양단에는 멀티머화(multimerization) 부위를 설치해서 카세트화할 수 있다.

본 발명의 스텔스형 RNA 유전자 발현계에 사용할 수 있는 마이너스-스트랜드 싱글-스트랜드 RNA는, 하기에 나타내는 DNA 베이스의 탠덤형 카세트를 사용하는 것에　의해 용이하게 구축할 수 있다.

본 발명의 탠덤형 카세트는 5’말단측으로부터 차례로, (1) 멀티머화(multimerization) 부위 A, (2) 전사개시 시그널 A, (3) 비코딩서열 A1, (4) 클로닝 부위 A, (5) 비코딩영역 A2, (6) 전사종결 시그널 A, (7) 전사개시 시그널 B, (8) 비코딩서열 B1, (9) 클로닝 부위 B, (10) 비코딩영역 B2, (11) 전사종결 시그널 B, 및 (12) 멀티머화(multimerization) 부위 B에 의해 구성된다. 당해 탠덤형 카세트를 모식적으로 도시한 것으로서, 도 7의 아래 도면을 들 수 있다.

상기 멀티머화(multimerization) 부위 A 및 B는 서로 동일 또는 다를 수도 있고, 당해 카세트의 멀티머화(multimerization), 혹은 다른 핵산과의 결합에 사용할 수 있는 서열인 한, 임의의 서열을 사용할 수 있다. 멀티머화(multimerization) 부위의 바람직한 예로서, 제한효소 인식서열, 및 부위 특이적 재조합 효소의 인식서열을 들 수 있다. 바람직한 제한효소의 예로서, 절단면에 NN이나 NNN과 같이 나타나는 서열 임의의 싱글-스트랜드돌출끝을 생성하는 성질을 가지는 SapI, BbsI, BbvI, BcoDI, BfuAI, BsaI, BsmBI, BsmFI, BtgZI, EarI, FokI, HgaI, SfaNI를 들 수 있다. 또 다른 바람직한 예로서, 인식서열의 내부에 부정형의 서열을 가지는 AlwNI, BglI, BstAPI, BstXI, DraIII, SfiI 등을 들 수 있다. 또, 상동 재조합을 이용하는 경우에는 재조합 효소의 인식서열로서, attB1 및 attB2 등의 서열을 들 수 있다. 추가로, Gibson Assembly System(New England Biolabs, Inc)을 이용하는 경우에는, 연결시키는 상대가 되는 다른 탠덤형 카세트의 말단부와 오버랩 서열과 동일서열로 하는 것을 전제로 해서, 멀티머화(multimerization) 부위로서 임의의 15염기 이상의 서열을 사용할 수 있다.

전사개시 시그널 A 및 B는 서로 동일 또는 다를 수도 있고, RNA에 전사되었을 경우에 RNA 의존성 RNA 합성효소가 인식하는 전사개시 시그널로서 기능적이라면 어떠한 서열일 수도 있다. RNA 의존성 RNA 합성효소가 인식하는 전사개시 시그널의 예는 이하의 단락에서 구체적으로 기재한다. 바람직하게는 서열번호 1∼3의 서열을 들 수 있다.

비코딩서열 A1, A2, B1 및 B2는 서로 동일 또는 다를 수도 있다. RNA에 전사되었을 경우에 상기에서 정의되는 「자연면역기구에 인식되지 않는 RNA」라면 어떠한 서열일 수도 있고, 바람직한 예는 5∼49염기 길이의 서열이며 표 1에 나타내는 각각의 서열을 들 수 있다.

클로닝 부위 A 및 B는, 소망의 외래 유전자를 삽입 가능한 한 어떤 서열일 수도 있다. 바람직하게는, 하나의 클로닝 부위는 1 또는 2 이상의 제한효소 인식서열을 포함할 것인가, 1 또는 2 이상의 부위 특이적 재조합 효소의 인식서열을 포함하는 것이다. 클로닝 부위가 바람직한 예로서, Acc65I 인식부위와 SalI 인식부위를 포함하는 서열, Acc65I 인식부위와 XhoI 인식부위를 포함하는 서열, BsiWI 인식부위와 SalI 인식부위를 포함하는 서열, 및 BsiWI 인식부위와 XhoI 인식부위를 포함하는 서열을 들 수 있다.

전사종결 시그널 A 및 B는 서로 동일 또는 다를 수도 있고, RNA에 전사되었을 경우에 RNA 의존성 RNA 합성효소가 인식하는 전사종결 시그널로서 기능적이라면 어떠한 서열일 수도 있다. RNA 의존성 RNA 합성효소가 인식하는 전사종결 시그널의 예는 이하의 단락에서 구체적으로 기재한다. 바람직하게는, 서열번호 4∼6의 서열을 들 수 있다.

당해 1의 탠덤형 카세트에는 적어도 2개의 외래 유전자를 삽입시킬 수 있다. 2개의 외래 유전자가 삽입된 카세트를 5개 연결시킨 카세트멀티머는 10의 외래 유전자를 담지한 것이 된다. 하기의 실시예에서는, 이러한 탠덤형 카세트를 멀티머화(multimerization)하는 것을 이용해서 외래 유전자를 4, 6 또는 10 담지한 DNA 프래그먼트를 작성하고, 플라스미드에 서브 클로닝시켰다. 또 바이러스 유래의 RNA 의존성 RNA 합성효소 유전자나 RNA 결합 단백질 유전자와 조합시키는 것에　의해, 본원 발명에서 소망되는 RNA 발현계가 구축된다.

2-2. RNA 의존성 RNA 합성효소와 당해 효소를 인식하는 전사개시 시그널 및 전사종결 시그널

「RNA 의존성 RNA 합성효소」 및 당해 효소를 인식하는 전사개시 시그널 및 전사종결 시그널은 동일한 마이너스-스트랜드 RNA 바이러스 유래서열로부터 선택되는 것이 바람직하고, 전형적으로는 파라믹소 바이러스과에 속하는 바이러스 게놈 유래 서열이다. 파라믹소 바이러스과에 속하는 바이러스의 게놈 「RNA 의존성 RNA 합성효소」, 「당해 효소가 인식하는 전사개시 시그널」 및 「당해 효소가 인식하는 전사종결 시그널」의 조합은 전부 같은 기본구조를 가지고 있기 때문에, 어떠한 바이러스 유래의 서열 조합이더라도 사용할 수 있다.

본 발명의 실시예에 있어서는 「RNA 의존성 RNA 합성효소」로서 센다이바이러스의 L 단백질(RNA 합성효소의 large subunit, PolL)과 P 단백질(RNA 합성효소의 small subunit, PolS)의 조합을 선택하고, 「RNA 의존성 RNA 합성효소가 인식하는 전사개시 시그널인 RNA」로서 「3’-UCCCACUUUC-5’(서열번호 1)」, 「RNA 의존성 RNA 합성효소가 인식하는 전사종결 시그널인 RNA」로서 「3’-AAUUCUUUUU-5’(서열번호 4)」을 선택하고, 전사개시 시그널과 전사종결 시그널을 각 유전자의 3’측과 5’측에 각각 배치했다(도 1). 그리고 「RNA 합성효소의 활성을 조절하는 단백질」로서는 센다이바이러스의 C 단백질(C)를, 또, 「싱글-스트랜드 RNA 결합 단백질」라고서는, 센다이바이러스의 NP 단백질(N)을 사용하고 있다.

또, 본 명세서에서 개시되는 기술에 있어서, RNA는 주로 마이너스-스트랜드의 싱글-스트랜드 RNA 형태로 사용되기 때문에, RNA 서열은 특별히 주석이 없는 한, 마이너스-스트랜드의 서열정보로서 3’말단측으로부터 개시된다. 단, 본 명세서의 일부를 구성하는 서열목록의 서열정보는 가이드라인에 따라 5’말단측으로부터 기재되어 있다.

「RNA 의존성 RNA 합성효소」로서 센다이바이러스의 L 단백질과 P 단백질의 조합을 선택한 경우에는, 전사개시 시그널로서 「3’-UCCCACUUUC-5’(서열번호 1)」, 「3’-UCCCUAUUUC-5’(서열번호 2)」, 「3’-UCCCACUUAC-5’(서열번호 3)」 이외에, 이것들의 서열과 동등한 기능을 가지는 RNA를 사용할 수 있다. 또 전사종결 시그널에 관해서도 동일하게, 「3’-AAUUCUUUUU-5’(서열번호 4)」「3’-CAUUCUUUUU-5’(서열번호 5)」, 「3’-UAUUCUUUUU-5’(서열번호 6)」이외에, 이것들의 서열과 동등한 기능을 가지는 RNA를 사용할 수 있다. 또, 「RNA 의존성 RNA 합성효소」로서 인간ㆍ파라인플루엔자 바이러스 3형의 L 단백질과 P 단백질의 조합을 선택한 경우에는, 전사개시 시그널로서 「3’-UCCUAAUUUC-5’(서열번호 7)」 또는 동등한 기능을 가지는 RNA를, 전사종결 시그널로서 「3’-UUAUUCUUUUU-5’(서열번호 8)」 또는 동등한 기능을 가지는 RNA를 사용할 수 있다. 또, 「RNA 의존성 RNA 합성효소」로서 뉴캐슬병 바이러스의 L 단백질과 P 단백질의 조합을 선택한 경우에는, 전사개시 시그널로서 「3’-UGCCCAUCUUC-5’(서열번호 9)」 또는 동등한 기능을 가지는 RNA를, 전사종결 시그널로서 「3’-AAUCUUUUUU-5’(서열번호 10)」 또는 동등한 기능을 가지는 RNA를 사용할 수 있다.

2-3. 본 발명의 스텔스형 RNA 유전자 발현계의 복제 기능 위한 요소

본 발명의 스텔스형 RNA 유전자 발현계의 복제기능을 위한 필수적인 요소로서는 RNA 의존성 RNA 합성효소가 인식하는 복제기점 및 3’말단측의 (CNNNNN)₃- 및 5’말단측의 (NNNNNG)₃- 이라는 구조를 가지는 서열이 있다.

본 발명의 실시예에 있어서는 「RNA 의존성 RNA 합성효소」로서 센다이바이러스의 L 단백질과 P 단백질의 조합을 선택했기 때문에, 「RNA 의존성 RNA 합성효소가 인식하는 복제기점을 포함하는 RNA」로서는 센다이바이러스의 게놈 3’말단에 존재하는 114염기의 RNA, 및 센다이바이러스의 게놈 5’말단에 존재하는 96염기의 RNA를 선택했다. 이 구조 가운데, 스텔스형 RNA 유전자 발현계의 복제 기능에 필수적인 것은 아래와 같다(도 2, 도 3, 도 4).

(1) 게놈 3’말단에 존재하는 「3’-UGGUCUGUUCUC-5’(서열번호 11)」 또는 동등한 기능을 가지는 12염기의 RNA 서열(예를 들면, 「3’-UGGUUUGUUCUC-5’(서열번호 12)」)

(2) 게놈 5’말단에 존재하는 「3’-GAGAACAGACCA-5’(서열번호 13)」 또는 동등한 기능을 가지는 12염기의 RNA 서열(예를 들면, 「3’-GAGAACAAACCA-5’(서열번호 14)」)

(3) 게놈 3’말단으로부터 79염기째로부터 시작되는 「3’- (CNNNNN)₃-5’(서열번호 15) 」라는 구조를 가지는 18염기의 RNA 서열

(4) 게놈 5’말단으로부터 96염기째로부터 시작되는 「3’- (NNNNNG)₃-5’(서열번호 16) 」라는 구조를 가지는 18염기의 RNA 서열

이 중, (1)과 (2)는 서로 상보적인 서열이고, 게놈 RNA의 3’말단과 안티게놈 RNA(게놈 RNA에 상보적인 RNA)의 3’말단이 동일하기 때문에, RNA 의존성 RNA 합성효소가 인식하는 복제기점이라고 생각되고 있다. 또, (3)과 (4)는 기능이 불분명하지만, RNA 의존성 RNA 합성효소에 의한 싱글-스트랜드 RNA의 복제에 필수적인 서열인 것이 알려져 있다(비특허문헌 42).

2-4. 마이너스 싱글-스트랜드 RNA에서의 입자화에 필수적인 패키징ㆍ시그널 영역

또, 본 발명에서는 처음으로 마이너스 싱글-스트랜드 RNA에 있어서의 입자화를 위한 패키징ㆍ시그널이 되는 영역으로 게놈 3’말단으로부터 97염기째로부터 114염기째까지의 영역을 동정했다.

실시예 18(도 22)에 나타내는 바와 같이 해당영역 (「서열 D」로서 표기)의 모두를 삭제해버리면, 패키지 세포 내에서의 유전자 발현에는 영향은 없지만, 스텔스형 RNA 벡터의 입자화 효율이 매우 저하되어버리는 결과가 수득되었다.

이 것은, 이 18염기의 서열 혹은 그 18염기 길이 영역 또는 그 일부가 바이러스 유사입자에 합입되기 때문에 필수적인 서열 또는 영역인 것을 나타내고 있다.

그래서, 추가로 이 18염기의 서열을 하기(표 1)에 거론되고 있는 House-keeping 유전자 유래 mRNA의 부분서열로부터 임의로 선택해서 치환해 본바 (도 3의 (5), 서열번호 75), 입자화 효율에 변화가 없는 것을 확인했다.

이것으로부터, 게놈 3’말단으로부터 97∼114염기째까지의 18염기 길이 또는 그 일부의 길이 영역이, 마이너스 싱글-스트랜드 RNA에 있어서의 입자화를 위한 패키징에 필수적이라고 생각된다. 즉, 당해 영역은 마이너스 싱글-스트랜드 RNA를 주형으로 한 전사와 복제에는 필수적이지 않지만, 스텔스형 RNA 유전자 발현계가 바이러스 유사입자에 합입되기 위해서 필수적인 「패키징ㆍ시그널 영역」이라고 할 수 있다.

(5) 게놈 3’말단으로부터 97∼114염기째까지의 「3’-AAAGAAACGACGGUUUCA-5’(서열번호 17)」에 대응하는 18염기 길이의 RNA, 또는 그 적어도 연속한 8염기 이상, 바람직하게는 10염기 이상, 더 바람직하게는 15염기 이상의 길이가 임의의 RNA.

상기 (5)의 18염기 길이 혹은 그 일부영역을 결한 스텔스형 RNA 유전자 발현계는 가령 숙주세포에 동종 혹은 이종 바이러스가 감염되었다고 해도, 당해 스텔스형 RNA 유전자 발현계를 포함한 바이러스 유사입자의 생산에 이어질 가능성이 매우 낮다.

따라서 당해 18염기 길이 또는 그 일부영역은 본 발명의 스텔스형 RNA 유전자 발현계를 감염성의 입자로 하고, 스텔스형 RNA 유전자 발현 벡터로서 사용하는 경우에는, 필수적인 영역이지만, 바이러스 유사입자의 혼입을 극한까지 배제해서 안전성을 확보하고 싶은 바이오 의약품 제조에는 오히려 배제해야만 하는 서열이 된다.

2-5. 마이너스 싱글-스트랜드 RNA의 유전자 발현 주형 구축

「RNA 의존성 RNA 합성효소가 인식하는 전사개시 시그널인 RNA」, 「RNA 의존성 RNA 합성효소가 인식하는 전사종결 시그널인 RNA」 및 마이너스 싱글-스트랜드 RNA의 3’말단과 5’말단에 존재하는 「RNA 의존성 RNA 합성효소가 인식하는 복제기점을 포함하는 RNA」를 조합시키고, 전사개시 시그널과 전사종결 시그널의 사이에 임의의 외래 유전자를 탑재한 RNA 분자는 트랜스에 공급되는 바이러스 유래의 RNA 의존성 RNA 합성효소 등 필요한 인자의 존재 하에서, 전사나 복제의 주형이 되는 것이 알려져 있다(비특허문헌 43, 비특허문헌 44, 비특허문헌 45). 예를 들면, 센다이바이러스 유래의 전사개시 시그널, 전사종결 시그널과 복제기점을 조합시키고, 외래 유전자로서 대장균의 Chloramphenicol acetyltransferase(CAT) 유전자를 탑재한 상기의 구조를 가지는 마이너스 싱글-스트랜드 RNA는 센다이바이러스가 감염한 세포 중에서 전사와 복제의 주형이 되고, CAT가 만들어지는 것이 나타나 있다(비특허문헌 43, 비특허문헌 44). 또, 같은 구조를 가지는 마이너스 싱글-스트랜드 RNA는 센다이바이러스의 NP(싱글-스트랜드 RNA 결합 단백질), P(RNA 의존성 RNA 합성효소의 small subunit) 및 L(RNA 의존성 RNA 합성효소의 large subunit) 단백질을 안정적으로 발현하는 세포에서 지속적으로 복제를 계속하는 것이 나타나 있다(비특허문헌 45).

이것들의 보고는 본 발명에서 제작한 마이너스 싱글-스트랜드 RNA가 유전자 발현의 주형이 되는 것을 나타내고 있지만, 이 상태로는 전사나 복제의 활성은 바이러스의 유전자를 포함하는 세포로부터 트랜스에 공급되는 NP, P, L 단백질에 의존하기 때문에, 임의의 세포에서 유전자 발현을 실시할 수 있는 범용적인 유전자 발현계로는 되지 않는다. 그래서 다음에, 상기 2-3.(도 1)로 나타낸 구조를 가지는 자연면역기구에 인식되지 않는 성분으로 구성된 RNA 분자에, 전사와 복제에 필요한 유전자를 탑재하는 것을 시도했다.

3. 동물세포에 있어서의 자연면역기구의 활성화(PAMP)의 회피에 관한 지견

3-1. 바이러스 유래 RNA의 PAMP에 대해서

동물세포가 가지는 자연면역기구는 세포 내로 침입한 바이러스의 게놈 RNA나 바이러스 유전자의 mRNA에 존재하는 「병원미생물에 특징적인 분자 패턴(Pathogen-associated molecular pattern, PAMP)」을 인식해서 활성화된다. PAMP의 구조는 지금까지 C형 간염바이러스와 인간 면역부전 바이러스에 있어서 동정되고 있다. C형 간염바이러스에서는 게놈 3’말단의 비코딩영역에 있는 Uridine이 풍부한 서열이 PAMP인 것이 보고되고 있다(비특허문헌 35). 한편, 인간 면역부전 바이러스에서는 Gag, Pol, Env의 3개의 유전자로부터 전사된 mRNA에 존재하는 Adenine 함량이 높은 영역이 PAMP가 되는 것이 보고되고 있다(비특허문헌 36). 이밖에, 센다이바이러스에서는 감염 세포 중에 존재하는 600염기보다 긴 장쇄 RNA 분획에 강한 PAMP의 활성이 검출되고 있고(비특허문헌 37), FㆍHNㆍL의 각 유전자의 비코딩영역에도 PAMP로서 기능할 가능성이 있는 고도의 2차구조가 존재하는 것이 알려져 있다(비특허문헌 38). 이렇게, 대부분의 바이러스 유래의 RNA는 PAMP를 포함하고 있다고 예상된다.

3-2. 바이러스 유래 RNA에 대한 최적화의 검토

RNA 바이러스 게놈 중의 단백질을 코딩하고 있는 영역의 코돈을 인간 세포에 최적화함으로써 PAMP 구조를 파괴하고, 자연면역기구의 활성화를 회피하려고 하는 시도는 종래부터 복수 수행되고 있었다. 예를 들면, 인간 면역부전 바이러스(HIV)의 Gag, Pol, Env의 각 유전자로부터 전사되는 각 mRNA에는 각각 PAMP가 존재하고 있기 때문에, 어느 쪽의 유전자도 그대로 동물세포에서 발현시키면 인터페론을 유도하지만, 인간 세포에 최적화해서 발현시킨 Gag, Pol, Env 단백질은 모두 인터페론 유도가 억제되는 것이 보고되고 있다(비특허문헌 36). 또, 원숭이 면역 부전 바이러스(SIV)에 있어서도 HIV와 마찬가지로 Gag, Pol, Env의 mRNA에 PAMP가 존재하고, 각 유전자의 PAMP를 포함하는 영역의 코돈을 인간 세포에 최적화함으로써, 인터페론 유도능은 저하되는 것이 알려져 있다(비특허문헌 48). 그러나, SIV 게놈 서열 중의 Pol 유전자의 PAMP를 포함하는 영역의 코돈을 최적화한 것만으로는 SIV의 인터페론 유도능은 거의 변화되지 않는다. 그래서, Pol 유전자의 최적화에 부가해서 Gag 유전자의 PAMP를 포함하는 영역의 코돈도 최적화해버리면, 바이러스의 복제능이 1% 이하로 저하되고, 바이러스의 전사ㆍ복제의 기능이 크게 손상되는 결과가 나타나 있다(비특허문헌 48). 이 결과는 SIV의 Pol 유전자나 Gag 유전자는 단지 PoL 단백질이나 Gag 단백질을 코딩하고 있을뿐만 아니라, 단백질을 코딩하고 있는 핵산서열 자체에 바이러스의 전사 혹은 복제의 기능에 필요한 정보가 존재하고 있는 것을 나타내고 있다.

또, C형간 염바이러스의 게놈 3’말단의 비코딩영역 중의 PAMP를 포함하는 영역에 대해서도, 당해 영역을 파괴해버리면, 그 바이러스 복제능이 손상된다(비특허문헌 82, 비특허문헌 83)고 하는 보고가 있다.

이것들의 결과는 RNA 바이러스 게놈 중의 「PAMP를 포함하는 영역」이 동시에 바이러스의 복제 등의 기능에 있어서 필수적인 영역일 가능성이 높은 것을 나타내는 것이다.

이와 같이, RNA 바이러스의 기능을 손상시키지 않고 게놈 핵산으로부터 PAMP의 기능을 가지는 구조를 제거하는 보편적인 방법은 알려져 있지 않기 때문에, 바이러스 RNA 중의 PAMP를 포함하는 영역의 코돈을 인간 세포에 최적화하는 기술을 RNA 바이러스 벡터에 적용하는 것은 오히려 부정적인 결과가 되고 있다.

3-3. 바이러스 유래의 자연면역 저해인자의 이용

RNA 바이러스의 게놈이나 합성 RNA를 유전자 발현의 플랫폼으로 사용한 종래의 기술에서는 PAMP로 인식되는 구조를 밝혀서 당해 구조를 제거하는 것이 아니라, 각종 바이러스가 구비하고 있는 자연면역기구에 길항하는 인자의 작용으로 PAMP에 의한 자연면역기구의 활성화를 저해하고, 세포 장해성을 감쇠시키고 있다. 예를 들면, 비특허문헌 26이나 비특허문헌 27에서 필수적인 구성요소로서 사용되고 있는 B18R 단백질은 백시니아 바이러스의 게놈 DNA에 코딩되어 있는 인터페론 결합 단백질에서, 인터페론의 활성을 저해함으로써 자연면역기구의 활성화를 저해하는 기능을 갖는다.

또, 특허문헌 3ㆍ특허문헌 4ㆍ비특허문헌 7에서 기술되어 있는 센다이바이러스를 기초로 한 벡터에서는 RNA 의존성 RNA 합성효소(L 단백질과 P 단백질)의 변이와 함께, 센다이바이러스 유래의 V단백질의 발현이 자연면역기구의 억제역할을 담당하고 있다. V단백질은 센다이바이러스의 P 유전자 영역으로부터 전사된 mRNA로 만들어지는 단백질의 하나이고, P 단백질과 공통인 N말단(317 아미노산 잔기)과, V단백질에 고유한 구조를 가지는 염기성의 C말단(67 아미노산 잔기)을 갖는다(비특허문헌 39). V 단백질은 전사인자 IRF-3의 저해를 통해서 자연면역기구의 활성화를 억제한다(비특허문헌 40). 또, P 유전자의 염기서열에 인공적으로 변이를 도입해서 제작한 V 단백질 결실 센다이바이러스에서는 자연면역기구의 활성화를 억제하는 기능이 상실되고, 감염 개체로부터 용이하게 배제되는 것이 알려져 있다(비특허문헌 40, 비특허문헌 41).

이와 같이, 바이러스 유래의 자연면역 저해 인자를 병용하는 경우, 외래 유전자가 도입된 세포에 별종의 병원미생물이 감염되어도 자연면역기구를 활성화할 수 없다는 안전성의 우려가 발생한다. 예를 들면, 센다이바이러스 벡터의 게놈을 안정되게 홀딩하고 있는 세포에서는 V 단백질이 항상적으로 발현하고 있으므로, 생체의 조직 세포에서 이 벡터를 사용할 경우에는, 당해 세포에 다른 바이러스가 감염되어도 자연면역기구를 활성화할 수 없을 가능성이 있다. 그 때문에 바이러스 유래의 인자에 의한 자연면역기구의 억제에 의지하지 않는 방법으로 자연면역기구의 활성화를 회피하는 기술이 소망된다.

4. 본 발명의 RNA 유전자 발현계에 있어서의 PAMP회피를 위한 수법

4-1. 비코딩영역서열에 있어서의 「자연면역기구에 인식되지 않는 RNA」

본 발명의 열쇠를 쥐고 있는 것은 동물세포가 가지는 자연면역기구의 활성화를 회피할 수 있는 RNA의 선택이다. 또, 본 발명에서 자연면역기구의 활성화 회피라고 할 때, 인터페론β 유도능을 지표로 해서, 정상세포에 있어서의 IFN-β mRNA의 발현량을 1.0으로 했을 때에 30 이하, 바람직하게는 20 이하, 더 바람직하게는 10 이하인 점은 전술한 바와 같다.

그래서, 본 발명에서는 「자연면역기구에 인식되지 않는 RNA」의 소재로서 인간 등 동물세포에서 발현하고 있는 mRNA 유래의 RNA 서열을 사용하는 것으로 하고, 그 가운데서 폭넓은 인간 세포에서 발현하고 있는 House-keeping 유전자 유래 mRNA를 선택했다. 당해 mRNA는 대부분의 인간 세포에서 비교적 대량으로 발현하고 있고, 인간의 자연면역기구에 인식되는 모티브를 포함하지 않고 있다. 또, 당해 mRNA의 단백질을 코딩하지 않고 있는 비코딩영역으로부터, 고도의 2차 구조를 취하지 않는 5염기로부터 49염기의 RNA를 선택하고(표 1), 벡터에 탑재되는 각 유전자의 5’측 비코딩영역과 3’측 비코딩영역에 배치했다(도 1).

하기(표 1)에 열거되어 있는 House-keeping 유전자 유래 mRNA의 부분서열 모두 본 발명의 비코딩영역서열에 있어서의 「자연면역기구에 인식되지 않는 RNA」의 「동물세포에서 발현하고 있는 mRNA 유래의 RNA 서열」 가운데에서도 특히 바람직한 서열로서 사용할 수 있다. 그러한 바람직한 서열의 다른 예로서, 알부민 유전자 등 생체 내 에서 대량으로 발현하고 있는 유전자의 mRNA에 유래하는 RNA 서열의 일부서열도 바람직하게 사용할 수 있다.

이렇게, 본 발명의 실시예에서는 재생의료로의 응용을 생각해서 인간 세포에서 발현하고 있는 mRNA 유래의 비코딩영역서열을 선택하고, 그 부분서열을 사용했지만, 「자연면역기구에 인식되지 않는 RNA」로서는 실시예 또는 (표 1)에 열거한 인간 mRNA 유래의 비코딩영역서열 유래의 서열에 한정되지 않는다. 예를 들면, OptimumGen Gene Design System(특허문헌 7, GenScript USA Inc.)에 있어서, 기준 CAI값을 산출하기 위해서 채용된 인간에서의 발현량이 높은 인간 mRNA 그룹으로부터 적당하게 선택한 인간 mRNA가 가지고 있는 비코딩서열의 부분서열을 사용할 수 있다. 기타, 벡터를 사용하는 숙주세포의 자연면역기구에 인식되지 않으면, mRNA 이외의 인간 RNA, 다른 동물종의 세포에서 발현하고 있는 RNA, 비천연의 합성 RNA에서도 상관없다.

4-2. RNA 벡터ㆍ게놈의 3’말단 및 5’말단 영역에서의 「자연면역기구에 인식되지 않는 RNA」로의 치환

도 2, 도 3 및 도 4에 나타나 있는 바와 같이 본 발명의 스텔스형 RNA 벡터를 구성하는 게놈 RNA 서열 가운데, 3’말단 영역 및 5’말단 영역에는 상기 2-2.∼2-3. 등에서 나타낸 전사, 복제 등에 관계하는 필수적인 구성요소 이외에 임의의 기능 불명의 서열영역이 존재하고 있고, 이들 서열 중에는 복수의 부분에 House-keeping 유전자 유래 mRNA의 부분 서열 등의 「자연면역기구에 인식되지 않는 RNA」로 치환 가능한 영역이 존재한다.

예를 들면, 도 3의 실시예에서 나타나 있는 바와 같이 천연의 바이러스 게놈 3’말단에 존재하는 구조 가운데, (1)에서 (6)의 영역은 표 1의 House-keeping 유전자 유래 mRNA의 부분서열을 포함하는 상동성이 없는 다른 염기서열로 치환하는 것이 가능하고, 스텔스형 RNA 유전자 발현계에 3’ Variant 1로부터 3’ Variant 6은 모두, 안정된 유전자 발현과 벡터 입자의 생산을 실시할 수 있다. 또, 도 4의 실시예에서 나타나 있는 바와 같이 천연의 바이러스 게놈 5’말단에 존재하는 구조 가운데, (1)에서 (4)의 영역은 상동성이 없는 다른 염기서열로 치환 혹은 삽입하는 것이 가능하고, 스텔스형 RNA 유전자 발현계에 5’ Variant 1로부터 5’ Variant 5는 모두 안정된 유전자 발현을 실시할 수 있다.

그리고 이것들의 위치의 서열을 (표 1)의 House-keeping 유전자 유래 mRNA의 부분 서열 등의 「자연면역기구에 인식되지 않는 RNA」로 바꿔 놓음으로써 추가로, 인터페론 유도능을 억제할 가능이 높을 것으로 생각된다.

5. 전사, 복제에 필수적인 단백질에 의한 자연면역기구의 활성화(PAMP) 회피를 위한 수법

5-1. 전사, 복제에 필수적인 단백질을 코딩하는 유전자 중의 PAMP 구조의 지표가 되는 값의 검토

본 발명의 실시예에 있어서는 「RNA 의존성 RNA 합성효소」로서 센다이바이러스의 L 단백질(RNA 합성효소의 large subunit, PolL)과 P 단백질(RNA 합성효소의 small subunit, PolS), 「RNA 합성효소의 활성을 조절하는 단백질」로서 센다이바이러스의 C 단백질(C), 「싱글-스트랜드 RNA 결합 단백질」로서 센다이바이러스의 NP 단백질(N)을 선정했다. 이것들의 단백질은 마이너스 싱글-스트랜드 RNA로부터의 전사나 복제에 필수적이지만, 그것을 코딩하는 센다이바이러스의 게놈 RNA나 mRNA에는 비특허문헌 37에 나타나 있는 바와 같이, 「병원미생물에 특징적인 분자 패턴(PAMP)」이 존재할 가능성이 높다. 그 때문에 자연면역기구를 활성화하지 않는 스텔스형 RNA 유전자 발현계를 구축하기 위해서는 이것들의 단백질을 코딩하는 RNA로부터, PAMP의 가능성이 있는 구조를 제거할 필요가 있다.

센다이바이러스를 구성하는 게놈 RNA나 mRNA에 PAMP의 활성이 존재하는 것은 확실하지만, 실제로 어느 영역에 PAMP의 활성이 존재하는 것인지는 분명하지 않다. 그러나, PAMP의 활성을 가지고 있는 RNA는 숙주세포에서 발현하고 있는 RNA와는 명확하게 다른 구조를 가지고 있을 것이다. 그래서 우선, RNA 바이러스 유래의 mRNA와 인간 세포의 mRNA의 구조의 차이를 검토하기 위해서, 코딩영역의 코돈 최적화 지수(Codon adaptation index, CAI)를 지표로 해서 비교했다. CAI는 어떤 생물종의 세포에 있어서 가장 강하게 발현하고 있는 단백질 100개를 코딩하는 mRNA의 코돈의 출현 빈도로부터의 해리를 나타내는 지표로써, CAI=1.0의 경우에는 코돈 사용빈도가 이것들 100종의 mRNA와 동일하다는 것을 나타내고 있다(비특허문헌 46). 「OptimumGen Gene Design System(특허문헌 7, GenScript USA Inc.)」에 의한 해석의 결과, 임의로 선택한 151개의 인간 mRNA의 코딩영역의 CAI의 평균값이 0.778인 것에 대해서, 센다이바이러스에 7종의 mRNA에 있어서의 CAI의 평균값은 0.704, 동일한 파라믹소 바이러스과의 홍역바이러스 7종의 mRNA에 있어서의 CAI의 평균값은 0.697이 되고, 파라믹소 바이러스의 mRNA의 CAI는 인간 세포의 mRNA가 평균적인 CAI보다 유의하게 낮다는 결과를 얻었다(도 5). 또, 참고로서 해석한 대장균에서 발현하고 있는 임의의 11종의 mRNA에 있어서의 CAI의 평균값은 0.698이었다(도 5). 이것으로부터, 인간 세포에서 사용하는 경우, 파라믹소 바이러스의 mRNA는 원핵생물의 대장균 mRNA에 필적하는 구조의 지우침이 있고, 이것이 PAMP로서 인식되고 있을 가능성이 생각되었다.

또, 별도의 시점으로부터 RNA 바이러스 유래의 mRNA와 인간 세포의 mRNA의 구조의 차이를 검토하기 위해서, 코딩영역의 GC함량을 계산했다. 그 결과, 천연의 파라믹소 바이러스 유래의 RNA의 GC함량의 평균값은 47.7%에서 48.5%이고, 인간의 mRNA의 코딩영역의 GC함량 평균값인 56.3%(비특허문헌 47)보다 유의하게 낮았다(도 6). RNA 바이러스의 게놈은 GC함량이 비교적 낮고, Adenine나 Uridine이 많은 서열이 PAMP가 될 가능성이 높은 것(비특허문헌 43)을 고려하면, GC함량도 PAMP의 존재를 시사하는 지표가 될 가능성이 생각되었다.

5-2. 센다이바이러스 유래의 전사ㆍ복제에 관계하는 유전자의 「코돈 최적화」적용 실험

이러한 CAI값 및 GC함량을 인간 세포의 mRNA의 평균값에 가까이 하기 위한 「코돈의 최적화」가 바이러스 유래 코딩영역 중의 PAMP구조의 파괴 및 PAMP의 회피에 유효한 것은 상기 3-2.에서 나타나 있는 바와 같이 HIV, SIV나 간염바이러스 등에서 확인되고 있다.

그렇지만, 상기 3-2.에서는 동시에, 이들 바이러스에서는 전사ㆍ복제에 필수적인 유전자의 서열 내의 PAMP 영역에 「코돈의 최적화」를 실시하면 복제능이 크게 손상되는 결과도 나타나 있다. 이것으로부터, 전사ㆍ복제에 필수적인 유전자의 서열 내의 PAMP 구조는 전사ㆍ복제에 필수적인 2차 구조의 역할을 담당하고 있을 가능성이 높음은 종래의 기술상식이었다고 할 수 있다.

일반적으로 바이러스 게놈은 각종 기능이 조밀하게 적재되어 있는 것을 합쳐서 생각하면, 이러한 종래의 지견으로부터 보아, 센다이바이러스의 경우도 이들 바이러스 게놈과 마찬가지로, 전사ㆍ복제에 필수적인 유전자 서열내의 PAMP 구조가 바이러스의 기능에 중요할 가능성은 높다고 생각된다. 즉, 본 발명의 RNA 유전자 발현계에 사용하기 위한 센다이바이러스 유래 「RNA 의존성 RNA 합성효소」등의 전사ㆍ복제에 관계하는 단백질의 코딩영역 중의 코돈을 인간 세포에 최적화했을 경우, PAMP는 회피할 수 있다고 해도, 본래의 전사ㆍ복제능도 동시에 크게 손상되는 것이 강하게 예상되었다.

그러한 상황 하, 본 발명자들은 굳이 「RNA 의존성 RNA 합성효소」, 「RNA결합 단백질」등 전사ㆍ복제에 관계하는 단백질을 코딩하는 RNA를 모두 인간 세포에 코돈 최적화를 실시했다.

본 발명에서는 「RNA 의존성 RNA 합성효소」로서 센다이바이러스의 L 단백질(RNA 합성효소의 large subunit, PolL)과 P 단백질(RNA 합성효소의 small subunit, PolS), 「RNA 합성효소의 활성을 조절하는 단백질」로서 센다이바이러스의 C 단백질(C), 「싱글-스트랜드 RNA 결합 단백질」로서 센다이바이러스의 NP 단백질(N)을 사용하므로, 이것들을 코딩하는 RNA로부터 PAMP를 제외하는 것을 목적으로, 코돈 최적화법으로서 범용되고 있는 프로그램의 하나인 「OptimumGen Gene Design System(특허문헌 7, GenScript USA Inc.)」에 의해 코돈 최적화를 실시했다. 그 결과, CAI값은 모두 0.86에서 0.88이 되고, 인간 세포에서 고발현하고 있는 단백질을 코딩하고 있는 mRNA에 가까운 수치를 나타냈다.

이하, (표 2)로서, 센다이바이러스의 L, P, C 및 N단백질 유전자에 대해서 「OptimumGen Gene Design System(OGGDS법이라고도 한다.) 」에 의하는 코돈 최적화를 적용한 결과를 나타낸다.

상기 (표 2)에서는, 추가로 별도의 시점으로부터 최적화한 RNA의 구조를 해석하기 위해서, 코돈 최적화 후의 RNA에 대해서, CAI값과 함께 GC함량을 계산했다. 그 결과, 최적화 전의 RNA의 GC함량이 44.0%에서 50.1%이었던 것에 대해서, 최적화 후의 RNA의 GC함량은 52.5%에서 55.5%로 상승하고, 인간의 mRNA의 코딩영역의 GC함량 평균값인 56.3%(비특허문헌 47)에 근접했다(표 2) (도 6). RNA 바이러스에서는 Adenine나 Uridine이 많은 서열이 PAMP가 될 가능성이 높음(비특허문헌 36)이 알려지고 있고, 코돈 최적화의 수법에 의해 바이러스 유래의 RNA의 구조가 인간 mRNA의 구조에 근접하고, 동시에 PAMP의 활성을 가지는 영역이 제거될 가능성이 강하게 시사되었다.

그리고 본 발명에서는 실제로, 이 수법으로 인간 세포에 최적화된 센다이바이러스 유래의 NP 단백질, P 단백질, C 단백질, L 단백질을 코딩하는 RNA를, 10개의 외래 유전자와 함께 탑재한 RNA 벡터(도 13)를 구축하고(실시예 8), Hela 세포 내에서 발현시켜서 검증한 결과(실시예 9), 10개의 외래 유전자 전부가 관찰 가능한 충분한 양이 발현하는 것을 확인했다. 또, 당해 RNA 벡터가 인간 섬유아세포 내의 INF-β유도를 회피할 수 있음을 확인했다(실시예 13, 도 17).

이것은, 본 발명의 인간 세포에 최적화된 센다이바이러스 유래의 전사ㆍ복제에 관계하는 유전자 RNA를 탑재한 RNA 벡터가, PAMP 회피효과를 구비한 뛰어난 스텔스형 RNA 벡터로서 기능하는 것을 나타내는 것이다.

또 이 결과는, 센다이바이러스의 경우에는 전사ㆍ복제에 필수적인 유전자의 서열내에 존재하고 있는 PAMP 구조는 모두 전사ㆍ복제에 필수적인 구조가 아니었던 것을 나타내는 것으로, 굳이 실험을 실시한 본 발명자들에 있어서도, 예상외의 놀라운 결과이었다.

5-3. 코돈 최적화방법의 검토

상기 (표 2)의 결과에 의하면, PAMP의 활성을 가지는 영역을 제거해서 자연면역반응의 유도를 억제하기 위한 「코돈 최적화」를 위해서는 「CAI값」 및 「GC함량」의 2종류의 수치범위의 설정이 중요한 요건임이 시사된다. 그래서, 양자의 요건 가운데, 어느 쪽이 보다 본질적인 요건인지에 대해서 검토하기 위해서, 별도의 코돈 최적화방법을 적용한 실험을 실시하는 것으로 했다. 코돈 최적화 방법으로서는 상기OGGDS법 이외에도, GeneOptimizer Process(비특허문헌 49)나 GeneGPS Expression Optimization Technology(특허문헌 8, 특허문헌 9) 등, 여러 방법이 제안되고 있기 때문에, 이 추시 실험에 의해, 상기 OGGDS법 이외의 방법을 적용해도, 동일한 효과가 있음을 확인할 수도 있다.

그래서, OGGDS법과 마찬가지로 범용되고 있는 「코돈 최적화」수법인 GeneGPS Expression Optimization Technology (이하, ‘GGEOT법’이라도 한다.)에 의한 코돈 최적화방법을, 센다이바이러스의 NP 단백질, P 단백질, C 단백질, L 단백질을 코딩하는 주형 DNA에 적용하고, 동일하게 10개의 외래 유전자를 탑재 가능한 RNA 벡터(도 15)를 제작했다. 실시예 9의 방법으로 검증한 바, OGGDS법으로 최적화된 스텔스형 RNA 벡터와 마찬가지로 자연면역반응의 유도를 회피할 수 있는 스텔스형 RNA 벡터인 것을 확인할 수 있었다(data not shown).

OGGDS법에 의한 최적화와, GGEOT법에 의한 최적화는 완전히 다른 알고리즘이 사용되고 있고, 이 2개의 방법으로 최적화된 핵산의 염기서열을 비교하면, 양자의 동일성은 77% ∼80%가 되고, 코돈 최적화를 위해서 상당히 다른 염기가 선택된 것을 알아챌 수 있다(표 4).

이상의 것으로부터, 「RNA 의존성 RNA 합성효소」, 「RNA 합성효소의 활성을 조절하는 단백질」, 「싱글-스트랜드 RNA 결합 단백질」을 코딩하는 유전자를, 스텔스형 RNA 유전자 발현계를 제작하기 위해서 최적화하는 방법은 특정한 코돈 최적화법에는 의존하고 있지 않고, 어떠한 알고리즘에 의거하는 코돈 최적화방법이더라도 본 발명의 코돈 최적화법으로서 적용할 수 있음이 실증되었다.

이하, (표 3)로서, 센다이바이러스의 L, P, C 및 N단백질 유전자에 대해서 GGEOT법에 의한 코돈 최적화 후의 GC함량과, CAI값의 값을, 상기 (표 2)에 나타낸 OGGDS법에 의한 값과 대비시킨 표를 나타낸다. 또, GGEOT법에는 「CAI값」의 계산 프로그램이 없기 때문에 OGGDS법의 「CAI값」의 계산 프로그램에 따라서 계산했다.

또, (표 4)로서, L, P, C 및 N 단백질 유전자 각각에 대해서, 아래의 서열, OGGDS 적용 후 서열, 및 GGEOT 적용후 서열 사이의 상동성(동일성)의 값을 나타낸다.

5-4. 「코돈의 최적화」를 위해서 필수 지표

CAI는 인간 세포 내에서의 mRNA의 번역효율을 추정하는 지표의 하나로서 사용되고 있지만(비특허문헌 46), 본 발명에서는 코돈 최적화는 바이러스 유래의 RNA로부터 PAMP의 활성을 가지는 구조를 소거하는 수단으로 1개로서 사용하고 있으며, 반드시 번역효율의 상승이 수득되지 않아도 좋다.

또, CAI는 「있는 생물종의 세포에 있어서 무엇보다 강하게 발현하고 있는 단백질 100개를 코딩하는 mRNA의 코돈의 출현 빈도로부터의 해리를 나타내는 지표」이지만, 표준이 되는 100개의 단백질을 선택하는 객관적인 기준은 나타나 있지 않다. 본 발명에 있어서 인간 유래 배양세포 내에서 동등한 자연면역반응의 유도를 억제한 10개의 유전자 발현을 달성할 수 있었던 OGGDS법에 의한 최적화와, GGEOT법에 의한 최적화를 비교했을 경우, 후자의 CAI 값(OGGDS법에 의해 계산)의 경우, 최적화 후도 최적화 전과 그다지 변함없는 결과가 되어 있다(표 3).

한편, GC함량에 대해서는, 어느 쪽의 최적화법을 적용해도 51% 이상, 최대로 약 60%의 값을 나타냈다. 이것으로부터, PAMP의 활성을 가지는 구조가 제거된 가능성을 나타내는 지표로서는, CAI 값보다도 GC함량이 보다 유효한 것을 알았다. 즉, 자연면역반응의 유도를 억제할 수 있었던 「스텔스형 RNA 유전자 발현계」를 위한 「코돈 최적화」에 있어서의 지표로서는 GC함량이 가장 뛰어난 지표이고, 바이러스 유래 단백질의 코돈 최적화 후의 GC함량이 적어도 50.0% 이상, 바람직하게는 52.0% 이상이라면 PAMP의 활성을 가지는 구조가 제거된 가능성이 추측된다.

이상의 것으로부터, 본 발명에서 RNA 유전자 발현계를 위한 「코돈 최적화 」라고 할 때, RNA 유전자 발현계에 필요한 단백질을 코딩하는 모든 염기서열을, GC함량으로 50∼60%, 바람직하게는 52∼56%로 조정하는 것을 말한다.

또, 코돈 최적화에 의한 염기서열의 개변 결과, P유전자 영역에 존재하고 있었던 C 단백질과 V단백질을 코딩하는 서열은 소실하고, 최적화한 P유전자로부터는 C 단백질도 V단백질도 발현하지 않는다. C 단백질 및 V단백질을 코딩하는 RNA는 완전하게 제거되어도 유전자 발현은 수행되기 때문에 필수는 아니지만, 특히 C 단백질의 경우, 본 발명의 RNA 벡터의 발현량을 적정하게 조절하기 위해서는 중요하기 때문에, 상기한 바와 같이 최적화한 C 단백질 유전자 RNA를 서열 중에 첨가하는 것이 바람직하다. V단백질 RNA에 대해서도, 필요에 따라, 적당하게 동일한 코돈 최적화해서 서열 중에 첨가할 수 있다.

6. 본 발명에서의 다수의 외래 유전자를 스텔스형 RNA에 탑재하기 위한 방법(전사 카세트 연결법)

6-1. 6개 이상의 유전자를 동일 벡터 상에 탑재하는 방법의 검토

다음에, 6개 이상, 예를 들면 10개의 외래 유전자를 간편한 방법으로 스텔스형 RNA에 탑재하는 방법을 검토했다. 또, RNA 분자 그 자체는 유전자 재조합에 의한 조작을 실시할 수 없기 때문에, 5-4.에서 최적화한 바이러스 유래의 유전자 탑재를 포함시키고, 전부 cDNA로서 구축하고, 이 cDNA를 주형으로 해서 T7살균 바이러스 유래의 T7 RNA polymerase 등의 DNA의존성 RNA 합성효소에 의해 RNA를 제작하는 것으로 한다.

가장 단순하게 10개의 유전자를 탑재한 DNA 분자를 제작하기 위해서는, 각각의 유전자의 cDNA의 상류와 하류에 각 유전자에 고유한 제한효소 절단부위를 도입하고, 이 제한효소로 절단한 cDNA를 차례로 삽입해 가는 방법을 생각할 수 있다. 그러나 이 경우에는 적어도 20개의 다른 제한효소가 필요하게 되는데다가, 유전자의 조합이나 스텔스형 RNA 상의 위치를 변경하기 위해서는 cDNA를 전부 만들어내는 필요가 있어, 비현실적이다.

6-2. 2개씩의 유전자를 탑재한 「탠덤형 전사 카세트」의 제작

본 발명에서는 상기 2-1.(도 1)에서 기술한 바와 같이, 2개씩의 유전자를 탑재한 「탠덤형 전사 카세트」를 제작하고, 그것들을 복수 개 연결해 가는 수법을 채용하지만, 그 때, 탑재하는 유전자가 전부 같은 구조를 가지도록 설계하고, 스텔스형 RNA의 어떤 위치에도 탑재할 수 있는 것과 같은 연구를 실시했다(도 7). 이 설계법에서는 탑재하는 유전자의 5’ 상류측에 제한효소 A, 3’ 하류측에 제한효소B와 별도의 제한효소 절단부위를 설정하고, 여기에서 절단한 cDNA를 주형이 되는 DNA 분자에 삽입하는 것으로 했다. 삽입되는 주형 DNA에는 제한효소 A와 제한효소 B에 의한 인식서열에 부가해서 제한효소 C와 제한효소 D에 의한 인식서열도 설정되어 있다. 이것들의 제한효소의 조합은 제한효소 A로 절단한 DNA 단편이 제한효소 D로 절단된 DNA 단편과도 공유결합 할 수 있도록, 또 제한효소 B로 절단한 DNA 단편이 제한효소C로 절단된 DNA 단편과도 공유결합할 수 있도록 선택한다. 이러한 조합은 수많이 존재하고, 실시예에서 언급한 Acc65I와 BsiWI, XhoI와 SalI의 조합 이외에도, XbaI와 SpeI나 NheI의 조합, BamHI와 BglII의 조합 등이 생각된다. 이 경우, 탑재하는 유전자의 cDNA에 대해서는 제한효소 Aㆍ제한효소 Bㆍ제한효소 Cㆍ제한효소 D의 인식서열을 그 내부에 포함하지 않는 것이 구조 상의 제약이 된다. 이러한 제한효소의 조합을 사용하는 것에　의해, 2개씩의 cDNA를 탑재한 DNA 단편을 우선 제작한다(도 8).

6-3. 「전사 카세트」연결법

다음에, 이렇게 제작한 2개의 cDNA를 연결한 DNA 단편을 5개 접속해서 계10개의 cDNA를 탑재한 DNA를 제작한다(도 7, 도 8, 도 9). 실시예에서는 상기 6-2.에서 제작한 2개의 cDNA를 연결한 DNA 단편을, SapI라는 제한효소로 절단해서 단리했다. SapI로 절단된 DNA의 절단면은 5’측이 3염기 돌출한 구조를 가지고 있지만, 이 3염기의 서열을 임의로 설정함으로써 4×4×4=64가지의 절단면을 선택할 수 있다(도 7) (도 9). 이 때문에, 5개의 DNA 단편을 설계한 바대로 정확하게 결합해서 1개의 DNA 분자로서 회수할 수 있다(도 9). 이 때, 탑재하는 유전자의 cDNA에 대해서는 제한효소 Aㆍ제한효소 Bㆍ제한효소 Cㆍ제한효소D의 인식서열에 부가해서 SapI의 인식서열도 포함하지 않도록 설계한다(도 7).

이러한, 절단면에 NN이나 NNN과 같이 나타나는 서열 중의 임의의 싱글-스트랜드 돌출단을 생성하는 성질을 가지는 제한효소는 SapI에 한정되지 않고, BbsI, BbvI, BcoDI, BfuAI, BsaI, BsmBI, BsmFI, BtgZI, EarI, FokI, HgaI, SfaNI 등 많은 제한효소에서 동일한 결과가 수득된다. 또 인식서열의 내부에 부정형의 서열을 가지는 AlwNI, BglI, BstAPI, BstXI, DraIII, SfiI 등도 동일한 효과가 수득된다. 또, 이 단계는 반드시 제한효소를 사용한 클로닝이 아니더라도 좋으며, 상동 재조합을 이용한 방법(In-Fusion HD Cloning System(TAKARA-Bio, Inc)이나 Gibson Assembly System(New England Biolabs, Inc))을 이용할 수도 있다. 또, 10개의 cDNA를 결합한 후에 환상의 플라스미드 DNA에 편입하는 단계는 실시예에 나타낸 상동 재조합에 의해 pDONR-221 등에 편입하는 방법(Gateway System (Life Technologies, Inc.))을 사용하지 않아도, 통상의 T4 DNA ligase를 사용한 공유결합에 의한 방법으로도 가능하다. 또, 도 9에 나타낸 방법에 의해, 1개에서 10개의 임의의 유전자를 탑재한 DNA 분자를 제작하는 것이 가능하다.

6-4. 외래 유전자 발현량의 조절

일반적으로, 1세트의 RNA 의존성 RNA 합성효소(PolS, PolL), 싱글-스트랜드 RNA 결합 단백질(N), RNA 합성효소 활성의 조절 단백질(C)을 각각 코딩하는 유전자를 포함하는 마이너스-스트랜드 싱글-스트랜드 RNA 유전자 발현계에 있어서, 복수의 외래 유전자를 삽입하는 경우, 상류의 3’말단측에 가까울수록 발현량이 많은 것이 알려져 있다. 본 발명의 스텔스형 RNA 유전자 발현계에서도 같은 경향이 있다. 본 발명에서는 다수의 외래 유전자를 임의의 순서로 카세트 형상으로 편입해 갈 수 있기 때문에, 각각의 유전자를 취득하고 싶은 발현량순으로 정렬시키는 것을 간편하게 할 수 있다. 또, 개개의 유전자로 만들어지는 단백질의 발현량은 번역효율을 변화시키는 것으로도 조절이 가능하다(도 20).

7. 스텔스형 RNA의 합성

다음에, 상기 6.에서 제작한 10개의 cDNA를 연결한 DNA 단편과, 상기 5.에서 기술한 방법으로 인간 세포에 코돈을 최적화한(이하, 「인간화」라고도 칭하며, 각 단백질의 약호에 h를 붙여서 표기한다.) 싱글-스트랜드 RNA 결합 단백질을 코딩하는 유전자(hN), RNA 합성효소의 활성을 조절하는 단백질을 코딩하는 유전자(hC), RNA 의존성 RNA 합성효소를 코딩하는 유전자(hPolL, hPolS)를 연결하고, 스텔스형 RNA를 합성하기 위한 환상 주형 cDNA를 제작했다(도 10). 스텔스형 RNA의 구조는 RNA polymerase가 인식하는 프로모터의 위치에 의해 마이너스-스트랜드와 플러스-스트랜드로부터 선택할 수 있다. 여기에서는 스텔스형 RNA에 탑재되고 있는 유전자로부터 발현하는 mRNA와 동일한 방향의 RNA를 플러스-스트랜드, mRNA와 상보적인 방향의 RNA를 마이너스-스트랜드라고 정의하고, 도 10에서는 T7 RNA polymerase를 사용해서 마이너스-스트랜드 RNA를 합성하기 위한 주형 제작을 예시하고 있다. T7프로모터(비특허문헌 50)로부터 보아 하류측에는 RNA를 절단해서 정확한 말단을 만들기 위한 인간 D형 간염바이러스의 안티게놈 유래의 리보자임(비특허문헌 51)과 T7 RNA polymerase의 전사종결 시그널(비특허문헌 50)을 배치하고, 스텔스형 RNA의 전장에 상당하는 RNA가 합성할 수 있도록 되어 있다. RNA의 합성에 사용하는 효소는 T7 RNA polymerase에 한정되는 것은 아니고, 대장균이나 동물세포에서 사용할 수 있는 DNA의존성 RNA 폴리머라아제라면 어떠한 것이라도 사용할 수 있다. 예를 들면, 대장균 T3 살균바이러스 유래의 T3 RNA polymerase(비특허문헌 52)나 salmonellaSP6 파지 유래의 SP6 RNA polymerase(비특허문헌 53)도, 이것들의 효소가 인식하는 프로모터와 전사종결점과 조합시켜서 사용할 수 있다. 또 리보자임은 RNA의 3’말단을 정확하게 절단하기 위해서 사용하고, 실시예의 인간 D형 간염바이러스의 안티게놈 유래의 리보자임에 한정하지 않고, 인간 D형 간염바이러스의 게놈 유래의 리보자임(비특허문헌 51)이나 담배둥근무늬 바이러스의 머리핀형 리보자임(비특허문헌 54), 게다가 세포 내에서 RNA를 절단할 수 있는 short inhibitory RNA(siRNA) (특허문헌 55)를 사용할 수도 있다.

또, 스텔스형 RNA의 전장에 상보적인 cDNA는 p15A 유래의 복제기점을 가지는 플라스미드(비특허문헌 56)에 클로닝한다. p15A 유래의 복제기점을 가지는 플라스미드는 대장균 중에서 저 카피의 상태로 유지되므로 큰 DNA 단편을 대장균 중에서 안정되게 홀딩시키기 위해서 유리할 뿐만 아니라, 스텔스형 RNA 유전자 발현계를 재구성하기 위한 방법 2에서, ColE1 유래의 복제기점을 가지는 N단백질 발현 플라스미드와 대장균 중에서 공존시키는 것이 가능하다(비특허문헌 56). 실시예에서는 p15A 유래의 복제기점을 가지는 플라스미드에 암피실린 내성, ColE1 유래의 복제기점을 가지는 플라스미드에 카나마이신 내성을 탑재하고, 암피실린과 카나마이신의 이중선택에 의해 2개의 플라스미드를 동일한 대장균내에서 유지하고 있지만, 항생물질의 조합은 이예에는 한정되지 않는다. 또 플라스미드의 조합도 p15A 유래 복제기점 대신에 F인자 유래 복제기점을 가지는 플라스미드, ColE1 유래 복제기점 대신에 pUC 유래 복제기점을 가지는 플라스미드를 사용할 수 있다.

8. 스텔스형 RNA 유전자 발현계의 재구축

8-1. 종래형의 재구축법

마이너스 싱글-스트랜드 RNA와 당해 RNA에 결합하는 단백질로 이루어지는 스텔스형 RNA 유전자 발현계의 재구축은 2가지의 방법에 의해 가능하다. 첫번째 의 방법은 이미 마이너스 싱글-스트랜드 RNA의 게놈을 가지는 바이러스나 당해 바이러스를 이용한 벡터의 재구성법으로 알려져 있는 기술로써, 마이너스 싱글-스트랜드 RNA에 상보적인 플러스 싱글-스트랜드 RNA를 T7 RNA polymerase를 사용해서 동물세포 내에서 발현시키고, 동시에, NP(N), P(PolS), L(PolL)의 3개의 단백질을 당해 세포에서 발현시킴으로써 플러스-스트랜드 RNA의 스텔스형 RNA 유전자 발현계를 재구성한다(도 11) (비특허문헌 57, 특허문헌 3). 이 방법에서는 T7 RNA polymerase를 안정되게 발현하고 있는 동물세포를 사용하는 것에　의해, 재료가 되는 플라스미드 DNA를 세포에 도입하는 것만으로 재구성을 할 수 있다는 간편함이 장점이다. 한편, 플러스 싱글-스트랜드 RNA를 합성하기 위한 주형 cDNA를 포함하는 플라스미드와, NP, P, L의 3개의 단백질을 발현하는 유전자를 탑재한 3개의 플라스미드를 동시에 세포에 도입하기 위해서, 이것들의 DNA 분자 사이에서 종종 유전자 재조합이 발생하고, 제작하려고 하는 마이너스 싱글-스트랜드 RNA의 구조에 변이가 삽입되는 것이 알려져 있다(비특허문헌 57). 또 특허문헌 3의 실시예에서는 재구성의 효율을 상승시키기 위해서, 추가로 M, F, HN 단백질을 발현하는 플라스미드를 추가하고 있다.

8-2. 본 발명으로 개발한 재구축법

두 번째의 방법에서는 마이너스 싱글-스트랜드 RNA와 싱글-스트랜드 RNA 결합능을 가지는 NP 단백질(N)의 복합체를 우선 대장균 중에서 제작하고, 이 복합체를 P(PolS) 단백질과 L(PolL) 단백질을 발현하고 있는 동물세포에 도입해서 스텔스형 RNA 유전자 발현계를 재구성한다(도 12). 이 방법에서는 우선, 대장균 중에서 공존 가능한 2개의 플라스미드로부터, N단백질을 코딩하는 mRNA와 스텔스형 RNA를 각각 T7 RNA polymerase에 의해 합성하고, 대장균 내에서 싱글-스트랜드 RNA 결합 단백질(N)과 스텔스형 RNA를 동시에 발현하는 것에 의해서 복합체를 만든다. 천연에 존재하는 RNA 바이러스에서 단리한 RNA-단백질 복합체를 재료로 RNA 바이러스를 재구성하는 방법은 비특허문헌 58에 개시되어 있지만, 이번에 개발한 방법에서는, 유전자 재조합 기술에 의해 합성한 스텔스형 RNA를 재료로 재구성하는 것이 가능하게 되었다. 이 방법은, 첫 번째의 방법에 비해서 순서가 많이 복잡한 것이 단점이지만, 상동 재조합에 관계하는 유전자(RecA)나 RNA 분해효소를 코딩하는 유전자(RNaseE)를 파괴한 대장균(비특허문헌 59)을 사용함으로써, 게놈 RNA에 변이를 가하지 않고 스텔스형 RNA 유전자 발현계의 재구성을 하는 것이 가능하다.

즉, 본 발명에서 개발된 스텔스형 RNA 유전자 발현계의 재구성법은 T7 RNA polymerase를 발현하고 있는 숙주세포 내에서, 미리 마이너스 싱글-스트랜드 RNA와 싱글-스트랜드 RNA 결합능을 가지는 단백질(예를 들면, NP 단백질(N))과의 복합체를 제작하고, 당해 복합체를 RNA 의존성 RNA 합성효소(예를 들면, P(PolS) 단백질과 L(PolL)단백질)을 발현하고 있는 동물세포에 도입해서 스텔스형 RNA 유전자 발현계를 재구성하는 방법이다. 바람직하게는 숙주세포로서, RecA 유전자 및 RNaseE 유전자가 파괴되며, 또 T7 RNA polymerase를 발현하고 있는 대장균을 사용한다.

이어서, 상기 7.에 기재한 방법으로 합성한 10개의 유전자를 탑재한 스텔스형 RNA를 사용하고, 상기 8.에 기재된 어느 하나의 방법으로 스텔스형 RNA 유전자 발현계를 구축한다(도 13). 이렇게 해서 제작한 마이너스 싱글-스트랜드 RNA를 가지는 유전자 발현계가, 탑재한 10개의 유전자를 전부 지속적으로 발현할 수 있는 것은, 3종류의 약제 내성형질(퓨로마이신 내성, ZEOCIN 내성, 하이그로마이신 내성), 4종류의 형광 단백질(EGFP, E2-Crimson, EBFP2, Keima-Red), 3종류의 루시페라아제(반딧불이ㆍ루시페라아제, Renilla 루시페라아제, Cypridina noctiluca 루시페라아제)를 안정되게 발현하고 있는 것으로 확인할 수 있다(도 14).

8-3. 스텔스형 RNA 유전자 발현계에 있어서의 RNA결합 단백질(hN, hC, hPol) 유전자의 연결 순서

본 발명의 스텔스형 RNA 유전자 발현계에 있어서, 싱글-스트랜드 RNA 결합 단백질을 코딩하는 유전자(hN), RNA 합성효소의 활성을 조절하는 단백질을 코딩하는 유전자(hC), RNA 의존성 RNA 합성효소를 코딩하는 유전자(hPolS)의 스텔스형 RNA 상의 위치는 3’말단측에서 hN-hC-hPolS라고 하는 도 13에서 나타낸 순서에 한정되지 않는다. 예를 들면, hN-hPolS-hC나, hPolS-hN-hC와 같이 순서를 바꾸어도 스텔스형 RNA 유전자 발현계를 구축할 수 있다(도 16).

8-4. 스텔스형 RNA 유전자 발현계에 있어서의 바이러스 유래 단백질 유전자 중의 변이의 필요성

또, 이 스텔스형 RNA 유전자 발현계에 있어서, 싱글-스트랜드 RNA 결합 단백질을 코딩하는 인간화 유전자(hN), RNA 합성효소의 활성을 조절하는 단백질을 코딩하는 인간화 유전자(hC), RNA 의존성 RNA 합성효소를 코딩하는 인간화 유전자(hPolS, hPolL)로부터 발현하는 단백질에는 특별한 변이가 존재할 필요는 없다.

상기 3-3.에서 기술한 바와 같이, 종래기술에 있어서는 자연면역기구의 회피 방법으로서, 바이러스 유래 RNA 의존성 RNA 합성효소 유전자 등으로의 PAMP 활성을 억제하는 변이의 도입이 가장 유효한 수단으로 사용되고 있었다.

그러나, 본 발명에서는 바이러스 유래 단백질 유전자는 상기 5.에 나타낸 방법에 의해 모두 코돈 최적화에 의해 PAMP 활성이 제외되기 때문에, 미리 바이러스 유래 단백질에 단백질 레벨에서의 변이의 도입은 불필요하다. 예를 들면, 강한 인터페론 유도능을 가지는 것이 알려진 야생형 파라믹소 바이러스인 센다이바이러스 Z주 유래의 NP, P, C 및 L 단백질을 발현하는 유전자를 사용한 경우에도, 상기 5.에 나타낸 방법에서의 최적화에 의해, 스텔스형 RNA 유전자 발현계의 소재로서 사용할 수 있다. 예를 들면, (도 16)에서 「hPol」로 나타낸 L 단백질을 발현하는 유전자로서는 Z주 유래의 유전자 서열을 인간 세포에 최적화해서 사용하고 있다.

9. 자연면역기구의 유도 활성에 관한 검증

9-1. 종래기술에서의 자연면역기구활성화의 회피 효과와의 비교

다음에, 유전자 도입을 할 때에 자연면역기구를 유도하는 활성에 대해서, 스텔스형 RNA 유전자 발현계를 탑재한 스텔스형 RNA 벡터를 종래기술과 비교하기 위해서, 비특허문헌 7의 도 1B에서 기술되고 있는 종래기술인 지속 발현형 센다이바이러스 벡터와, 완전히 동일한 4개의 유전자(Keima-Red, 블라스티시딘S 내성 유전자, EGFP, Kusabira-Orange)를 탑재한 스텔스형 RNA 벡터를 제작했다. 이 2종류의 벡터를 사용해서 인간 초대배양 섬유아세포에 유전자 도입하고, 24시간 후의 인터페론ㆍ베타 mRNA의 양을, Real-Time PCR법을 사용해서 정량했다(도 17). 그 결과, 스텔스형 RNA 벡터에서는 자연면역기구를 억제하는 V 유전자를 탑재하지 않음에도 불구하고, 정상세포에 있어서의 인터페론β mRNA의 양의 5배 이내의 유도에 머물렀다. 한편, 종래기술에서는 V유전자를 홀딩하고 있음에도 불구하고, 정상세포에 47배의 유도가 관찰되었다(도 17). 이 결과로부터 스텔스형 RNA 유전자 발현계에서는 자연면역기구를 저해하는 인자가 존재하지 않는 조건 하에서도, 자연면역기구의 활성화를 회피할 수 있었다.

9-2. 가일층의 자연면역기구의 활성화 회피

자연면역기구를 유도하는 활성은 스텔스형 RNA 유전자 발현계를 홀딩하는 세포의 종류나, 스텔스형 RNA 유전자 발현계로부터의 유전자 발현의 (강함)세기에 의해서도 영향을 받는다. 예를 들면, 인간 유래 HeLa 세포에서는 거의 인터페론ㆍ베타가 유도되지 않는 것에 대해, 동일하게 인간 유래에 293 세포에서는 강하게 유도된다. 또, 바이오 의약품을 제조하기 위해서 유전자 발현을 강화할 수록 인터페론ㆍ베타의 유도도 강하게 된다. 스텔스형 RNA 유전자 발현계를 사용한 바이오 의약품 제조의 경우에는 인터페론에 의해 유도되는 세포질의 아데노신데아미나제(Adenosine deaminase acting on RNA, ADAR1)의 활성에 의한 RNA 게놈의 변이(비특허문헌 39)가 문제가 되기 때문에, 스텔스형 RNA 유전자 발현계에 잔존하는 자연면역기구유도 활성을 더욱 억제하는 것이 바람직하다.

이 목표는 스텔스형 RNA 유전자 발현계에, 자연면역기구를 억제하는 인자를 추가 탑재함으로써 달성할 수 있다(도 18, 도 19). 이러한 인자로서는 세포질에 존재하는 「병원미생물에 특징적인 분자 패턴(Pathogen-associated molecular pattern, PAMP)」수용체 RIG-I의 결실 변이체(RIG-IC) (비특허문헌 71), 센다이바이러스ㆍV단백질의 C말단 영역(비특허문헌 72), 프로테아좀의 구성성분인 PSMA7(비특허문헌 73) 등을 들 수 있다.

10. 유전자 발현 레벨의 조절

다음에, 스텔스형 RNA 유전자 발현계에 있어서의 유전자 발현의 레벨이 당해 벡터에 탑재되어 있는 전사ㆍ복제에 관계하는 인자의 발현을 조절함으로써 어떻게 변화되는 것인지를 검토했다(도 20, 도 21). 또, 도 20에서는 플러스-스트랜드 RNA 서열로 표기하고 있다. 개개의 인자 발현은 mRNA로부터 단백질이 번역되는 효율을 바꿈으로써 조절할 수 있다. 또, 번역효율을 변화시키는 가장 간단한 수단은 번역 개시 코돈(AUG)의 바로 상류의 5’ 비코딩서열을 변경하는 것이다. 동물세포에서 가장 번역효율이 높다고 생각되고 있는 것은, AUG의 직전이 5’-CCACC-3’(서열번호 18)이라는 구조를 취하는 경우이다(비특허문헌 60). 한편, 5’ 상류측에 짧은 코딩영역을 삽입함으로써 번역효율을 저하시킬 수 있다(비특허문헌 61). 실시예에서는 RNA 의존성 RNA 폴리머라아제(hPolS와 hPolL)의 발현을 일정하게 해서, 싱글-스트랜드 RNA 결합 단백질(hN)과 RNA 합성효소의 활성을 조절하는 단백질(hC)의 발현을 각각 40% 및 23%로 억제한 벡터를 제작하고, 탑재되어 있는 반딧불이 루시페라아제의 발현을 비교했다(도 20). 그 결과, hN과 hC 모두 그 발현을 억제함으로써 탑재하고 있는 루시페라아제 유전자의 발현은 상승하고, hN과 hC의 발현 억제를 조합시킴으로써 최대 79배나 되는 유전자 발현의 상승을 관찰했다.

이러한 유전자 발현 레벨의 조절은 RNA 합성효소의 활성을 조절하는 단백질(hC)의 발현 레벨의 조절만으로 실시할 수 있다(도 21). 이 경우, hC 유전자를 결실해도 스텔스형 RNA 유전자 발현계를 재구축할 수 있고, 유전자 발현의 레벨은 최대가 되기 때문에, hC 유전자는 스텔스형 RNA 유전자 발현계가 필수적인 요소가 아니다. 그러나, 탑재 유전자의 발현이 너무 강하면 세포의 증식이 강하게 저해되기 때문에, hC 단백질을 적절한 레벨로 발현시켜서 목적에 맞춘 유전자 발현을 실현시키는 것이 실용적이다.

유전자 발현계에 있어서 중요한 성질로서, 목적에 따라서 최적인 발현 레벨을 선택할 수 있는 것을 들 수 있다. 예를 들면, 세포 재프로그래밍에 있어서는 전사인자의 발현을 너무 강하게 하면 세포사가 유도된다. 또, 바이오 의약품의 제조에서는 발현이 약하면 생산 효율이 떨어진다. RNA 바이러스를 사용한 유전자 발현계에서는 일반적으로, 벡터의 발현 레벨을 바꾸는 것은 곤란하지만, 스텔스형 RNA 유전자 발현계에서는 개개의 구성성분 발현 밸런스를 미세 조절함으로써, 사용하는 목적에 따라서 발현의 강도를 자유롭게 바꿀 수 있다.

다음에, 이렇게 해서 완성한 스텔스형 RNA 유전자 발현계를 내부에 봉입하고, 여러 종류의 동물세포에 스텔스형 RNA 유전자 발현계를 도입할 수 있는 벡터 입자를 제작하는 것을 시도했다. 스텔스형 RNA 유전자 발현계를 세포질에 가지는 BHK 세포에서, 강한 SRα 프로모터를 사용해서 파라믹소 바이러스의 M, F, HN의 3종류의 단백질을 발현시키면, 세포의 배양 상청에 유전자 도입활성을 가지는 벡터 입자가 검출되었다. 그 감염가는 약 10⁷ infectious units/㎖로 종래형의 지속 발현형 센다이바이러스 벡터와 동등하게 높은 활성이 수득되었다. 이 벡터 입자는 F와 HN 단백질의 활성으로 세포 표면에 흡착하고, 막 상호간의 융합에 의해 세포질에 내용물, 즉 스텔스형 RNA 유전자 발현계를 도입할 수 있다. 이 과정은 세포분열을 필요로 하지 않기 때문에, 분열되지 않고 있는 세포에도 유전자 도입할 수 있다.

또, 도입할 수 있는 세포의 세포 특이성ㆍ종특이성은 사용하는 F와 HN 단백질의 유래로 결정되지만, 센다이바이러스의 F와 HN 단백질을 사용하는 경우에는, 말초혈의 혈액세포를 포함하는 매우 광범위한 인간 세포나 동물세포에 유전자 도입할 수 있었다.

11. 벡터의 제거

또, 종래기술인 지속 발현형 센다이바이러스 벡터에서는 RNA 의존성 RNA 폴리머라아제의 활성을 siRNA에 의해 억제함으로써 신속한 벡터의 제거에 성공하고 있다(특허문헌 3, 비특허문헌 7). 그래서, 스텔스형 RNA 유전자 발현계에서도 동일한 방법으로 제거를 할 수 있는 것인지 검토했다(도 23). 스텔스형 RNA 유전자 발현계가 가지는 인간화 RNA 의존성 RNA 폴리머라아제(hPolL)의 염기서열은 종래기술인 지속 발현형 센다이바이러스 벡터와는 다르기 때문에, 새롭게 3종류의 siRNA를 합성하고, 그 활성을 검토했다. 그 결과, 3종 가운데 1종의 siRNA(표적 서열은 서열번호 46)를 사용해서 종래기술과 동일하게 제거가 할 수 있음을 확인했다(도 23). 이렇게, 본 발명의 스텔스형 RNA 유전자 발현계는 종래의 지속 발현형 센다이바이러스 벡터로 사용되고 있었던 RNAi에 의한 벡터 제거방법이 적용될 수 있음을 알 수 있었다. 동일하게, microRNA(miRNA)를 사용하는 제거방법도 적용 가능하고, 예를 들면, 특허문헌 3에 기재된 바와 같이, 외래 유전자의 3’ 비코딩영역 또는 5’ 비코딩영역에 microRNA(miRNA)의 표적 서열을 삽입함으로써, 내재성의 miRNA에 반응해서 제거하는 것도 가능하다.

12. 본 발명의 스텔스형 RNA 발현계의 용도

본 발명의 스텔스형 RNA 발현계에 사용하는 마이너스 싱글-스트랜드 스텔스성 RNA 벡터에는 인간 유래 유전자 등 임의의 유전자를 6개 이상, 게다가 10개까지 탑재 가능하고, 길이 5,000염기 길이, 게다가 15,000염기 길이까지 탑재 가능하다.

그리고 인간 세포 등 동물세포에서의 자연면역기구의 활성화를 회피할 수 있는 스텔스성을 가지고 있고, 벡터의 제거도 간편하게 실시할 수 있기 때문에 복수 유전자의 동시 도입이 필요한 세포의 재프로그래밍 기술, 거대유전자를 포함하는 유전자치료, 재생의료, 바이오 의약품의 제조 등 폭넓은 용도가 생각된다.

구체적으로는 이하의 실시형태가 생각된다.

(1) 재생의료의 임상용으로 사용하는 고품질의 iPS 세포를 고효율로 제작하는 기술로의 응용.

인간 세포 등 동물세포를 재프로그래밍하기 위한 6개 이상의 유전자, 예를 들면 iPS 세포로 전환하기 위한 산중 4인자(KLF4, OCT4, SOX2, c-Myc)+BRG1+BAF155에 6유전자를 탑재하는 경우에는 13,132염기 길이가 된다. 또, OCT4, KLF4, SOX2, c-MYC, NANOG, LIN28에 6유전자를 탑재하는 경우에는 7,000염기 길이가 된다.

실제로, 이들 6유전자를 본 발명의 스텔스성 RNA 벡터에 탑재하고(도 25), 인간 태아 섬유아세포에서 발현시킨바, 40%를 넘는 초기화 효율이 실현된다는 결과를 얻었다(실시예 21). 또, 그때 산중 4인자(KLF4, OCT4, SOX2, c-Myc)의 탑재 순서는 적당하게 변경 가능한 것을 확인하고 있다(data not shown).

또, 인간의 말초혈 세포를 재료로 해서 동물성분 비함유(Xeno-free)ㆍ피더 세포 사용하지 않음(Feeder-free)의 조건 하에서도 동일한 실험을 실시한 결과, 동일하게 종래법보다도 높은 초기화를 실시할 수 있다는 결과가 수득되고 있다(data not shown).

또, KLF4, OCT4, SOX2, c-MYC의 4유전자에, 크로마틴 재구성 인자를 코딩하는 CHD1유전자를 탑재(합계 9,907염기 길이), 추가로 DNA 탈메틸화 효소를 코딩하는 TET1유전자(계 11,203염기 길이)을 추가해서 초기화 효율을 높일 수도 있다.

다른 가능성이 있는 조합으로서는 추가로 난모세포 특이적 히스톤 2종류를 조합시킨 8개의 유전자를 인간 체세포에서 발현시키고, 효율적으로 인간 iPS 세포를 제작하는 것이 가능하다.

(2) 인간의 조직 세포(혈액ㆍ피부ㆍ태반 등)로부터 신경 세포ㆍ신경줄기세포ㆍ줄기세포ㆍ췌장 베타 세포 등이 유용한 유전자를 만들어내는 다이렉트ㆍ재프로그래밍 기술을 이용한 재생의료로의 응용.

예를 들면, 인간 섬유아세포를 운동신경에 재프로그래밍하는 기술에 있어서, LHX3, ASCL1, BRN2, MYT1L이라는 4개의 유전자에, HB9, ISL1, NGN2이라는 3개의 유전자를 추가해서 계 7개의 유전자(9,887염기 길이)을 탑재할 수 있다.

(3) 복수의 서브 유닛으로 이루어지는 바이오 의약품의 제조

거대유전자이고, 더구나, 서브 유닛이 동일한 세포에서 동시에 발현할 필요가 있고, 각 서브 유닛의 발현량 조정도 필요한 면역글로블린G, M을 생산하기 위해서 유용하다.

실제로, 본 발명의 스텔스성 RNA 벡터에 인간 면역글로블린의 H(μ)체인 유전자, L(κ, λ)체인 유전자 및 J유전자를 탑재(도 24)하고, BHK 세포를 사용해서 인간 면역글로블린M을 제조했다(실시예 22). 그 때, 유전자를 탑재하는 순서를 궁리함으로써 거의 H 체인: L 체인: μ 체인을 1:1:0.2의 비율로 발현시키는 것에도 성공했다.

또 본 발명의 스텔스성 RNA 벡터에, 인간 면역글로블린에 4개의 cDNA (2개의 H 체인과 2개의 L 체인)를 탑재하고, 인간 이중 특이성 항체의 발현에도 성공했다(실시예 23).

(4) 복수의 서브 유닛으로 이루어지는 신약개발 표적 단백질의 발현으로의 응용.

예를 들면, gp91phoxㆍp22phoxㆍRacㆍp47phoxㆍp67phoxㆍp40phox의 6개의 서브 유닛을 본 발명의 스텔스성 RNA 벡터에 탑재하고, 동시에 발현시킴으로써, 신약개발 표적효소의 NADPH 산화효소(Nox2)를 발현시킬 수 있다.

(5) 질환의 원인 유전자가 거대한 유전자인 경우, 본 발명의 스텔스성RNA 벡터에 이것들 거대유전자를 탑재해서 지속적으로 발현시키는, 이것들의 질환의 유전자치료용 벡터로서의 응용.

구체적으로는, 혈우병A의 원인 유전자 산물인 혈액응고 제8인자의 cDNA(7053염기 길이)나 뒤센형 근디스트로피의 원인 유전자 산물인 지스트로핀의 cDNA(11058염기 길이)를 본 발명의 스텔스성 RNA 벡터에 탑재(도 24)하고, 사용할 수 있다.

실시예

이하에 실시예에 의해 본 발명을 더 상세하게 설명하지만, 본 발명은 이것들의 실시예에 의해 한정되는 것은 아니다.

본 발명에서의 기타의 용어나 개념은 당해 분야에 있어서 관용적으로 사용되는 용어의 의미에 의거하는 것이고, 본 발명을 실시하기 위해서 사용하는 여러가지 기술은 특히 그 출전을 명시한 기술을 제외하고는 공지의 문헌 등에 의거해서 당업자라면 용이 또한 확실하게 실시 가능하다. 또, 각종 분석 등은 사용한 분석기기 또는 시약, 키트의 취급 설명서, 카탈로그 등에 기재된 방법을 준용해 실시했다.

또, 본 명세서 중에 인용한 선행기술문헌, 특허공보 및 특허출원명세서 중의 기재내용은 본 발명의 기재 내용으로서 참조되는 것으로 한다.

( 실시예 1) 10개의 외래 유전자를 탑재한 DNA 단편 의 제작(1)

이하의 유전자를 PCR에 의해 Acc65I-cDNA-XhoI의 구조가 되도록 증폭해서 서브 클로닝했다(도 7).

1) 반딧불이 루시페라아제(Firefly Luciferase): (GenBank Accession Number AY738224)

2) Renilla 루시페라아제(Renilla Luciferase): (GenBank Accession Number AY738228)

3) Enhanced Green Fluorescent Protein (EGFP): (GenBank Accession Number U55761)

4) 퓨로마이신 내성 유전자(인간 세포에 코돈 최적화해서 합성): 비특허문헌 62, 서열번호 47

5) Cypridina noctiluca 루시페라아제: 비특허문헌 63(GenBank Accession Number AB177531)

6) E2-Crimson: pE2-Crimson(Clontech Laboratories, Inc)에 유래한다. 서열번호 48

7) Enhanced Blue Fluorescent Protein 2(EBFP2): 비특허문헌 64(GenBank Accession Number EF517318)

8) ZEOCIN 내성 유전자(인간 세포에 코돈 최적화해서 합성): 비특허문헌 65, 서열번호 49

9) dKeima-Red: 비특허문헌 66(GenBank Accession Number AB209968)

10) 하이그로마이신B 내성 유전자(인간 세포에 코돈 최적화해서 합성): 비특허문헌 67, 서열번호 50

( 실시예 2) 10개의 외래 유전자를 탑재한 DNA 단편 의 제작(2)

다음에, 이하의 플라스미드를 제작했다.

또, 본 실시예에서 사용한 핵산은 전부 DNA 단편이고, 서열번호 1 또는 서열번호 4 등, 서열목록에 있어서 마이너스-스트랜드 RNA 서열로서 특정된 서열에 대해서는 대응하는 DNA 서열을 의미하는 것으로 한다. DNA 단편을 사용하는 다른 실시예에 있어서도 동일하다.

1) 플라스미드 #1:

플라스미드 LITMUS38i(New England BioLab, Inc)의 ApaI 절단부위와 StuI 절단부위 사이에, 이하의 구조를 가지는 DNA를 클로닝한다: SapI 절단부위-attB1(서열번호 51)-서열번호 1-서열번호 24-Acc65I 절단부위-SalI 절단부위-서열번호 25-서열번호 4-ctt-서열번호 1-서열번호 26-BsiWI 절단부위-XhoI 절단부위-서열번호 27-서열번호 4-SapI 절단부위

2) 플라스미드 #2

플라스미드 LITMUS38i의 ApaI 절단부위와 StuI 절단부위 사이에, 이하의 구조를 가지는 DNA를 클로닝한다: SapI 절단부위-서열번호 1-서열번호 28-Acc65I 절단부위-SalI 절단부위-서열번호 29-서열번호 4-ctt-서열번호 1-서열번호 30-BsiWI 절단부위-XhoI 절단부위-서열번호 31-서열번호 4-SapI 절단부위

3) 플라스미드 #3

플라스미드 LITMUS38i의 ApaI 절단부위와 StuI 절단부위 사이에, 이하의 구조를 가지는 DNA를 클로닝한다: SapI 절단부위-서열번호 1-서열번호 32-Acc65I 절단부위-SalI절단부위서열번호 33-서열번호 4-ctt-서열번호 1-서열번호 34-BsiWI 절단부위-XhoI 절단부위-서열번호 35-서열번호 4-SapI 절단부위

4) 플라스미드 # 4

플라스미드 LITMUS38i의 ApaI 절단부위와 StuI 절단부위 사이에, 이하의 구조를 가지는 DNA를 클로닝한다: SapI 절단부위-서열번호 1-서열번호 36-Acc65I 절단부위-SalI절단부위-서열번호 37-서열번호 4-ctt-서열번호 1-서열번호 38-BsiWI 절단부위-XhoI 절단부위-서열번호 39-서열번호 4-SapI 절단부위

5) 플라스미드 #5

LITMUS38i의 ApaI 절단부위와 StuI 절단부위 사이에, 이하의 구조를 가지는 DNA를 클로닝한다: SapI 절단부위-서열번호 1-서열번호 36-Acc65I 절단부위-SalI절단부위서열번호 37-서열번호 4-ctt-서열번호 1-서열번호 38-BsiWI 절단부위-XhoI 절단부위-서열번호 39-서열번호 4-attB2(서열번호 52)-SapI 절단부위

( 실시예 3) 10개의 외래 유전자를 탑재한 DNA 단편 의 제작(3)(도 8 참조)

다음에, 이하의 플라스미드를 제작했다.

1) 플라스미드 #1C

플라스미드 #1의 Acc65I-SalI 사이에, 반딧불이 루시페라아제 유전자를 포함하는 Acc65I-XhoI 프래그먼트를 클로닝해서 플라스미드 #1B를 제작했다. 또, 플라스미드 #1B의 BsiWI-XhoI 사이에, Renilla 루시페라아제 유전자를 포함하는 Acc65I-XhoI 프래그먼트를 클로닝해서 플라스미드 #1C를 제작했다.

2) 플라스미드 #2C

플라스미드 #2의 Acc65I-SalI 사이에, EGFP 유전자를 포함하는 Acc65I-XhoI 프래그먼트를 클로닝해서 플라스미드 #2B를 제작했다. 또, 플라스미드 #2B의 BsiWI-XhoI 사이에, 퓨로마이신 내성 유전자를 포함하는 Acc65I-XhoI 프래그먼트를 클로닝해서 플라스미드 #2C를 제작했다.

3) 플라스미드 #3C

플라스미드 #3의 Acc65I-SalI 사이에, Cypridina noctiluca 루시페라아제 유전자를 포함하는 Acc65I-XhoI 프래그먼트를 클로닝해서 플라스미드 #3B를 제작했다. 또한, 플라스미드 #3B의 BsiWI-XhoI 사이에, E2-Crimson 유전자를 포함하는 Acc65I-XhoI 프래그먼트를 클로닝해서 플라스미드 #3C를 제작했다.

4) 플라스미드 #4C

플라스미드 #4의 Acc65I-SalI 사이에, EBFP2 유전자를 포함하는 Acc65I-XhoI 프래그먼트를 클로닝해서 플라스미드 #4B를 제작했다. 또, 플라스미드 #4B의 BsiWI-XhoI 사이에, ZEOCIN 내성 유전자를 포함하는 Acc65I-XhoI 프래그먼트를 클로닝해서 플라스미드 #4C를 제작했다.

5) 플라스미드 #5C

플라스미드 #5의 Acc65I-SalI 사이에, dKeima-Red 유전자를 포함하는 Acc65I-XhoI 프래그먼트를 클로닝해서 플라스미드 #5B를 제작했다. 또한, 플라스미드 #5B의 BsiWI-XhoI 사이에, 하이그로마이신B 내성 유전자를 포함하는 Acc65I-XhoI 프래그먼트를 클로닝해서 플라스미드 #5C를 제작했다.

( 실시예 4) 10개의 외래 유전자를 탑재한 DNA 단편 의 제작(4)(도 9 참조)

플라스미드 #1C로부터 SapI로 잘라낸 반딧불이 루시페라아제 유전자와 Renilla루시페라아제 유전자를 포함하는 DNA 단편 100ng, 플라스미드 #2C로부터 SapI로 잘라낸 EGFP 유전자와 퓨로마이신 내성 유전자를 포함하는 DNA 단편 100ng, 플라스미드 #3C로부터 SapIㄹ 잘라낸 Cypridina noctiluca 루시페라아제 유전자와 E2-Crimson유전자를 포함하는 DNA 단편 100ng, 플라스미드 #4C로부터 SapI로 잘라낸 EBFP2 유전자와 ZEOCIN 내성 유전자를 포함하는 DNA 단편 100ng, 플라스미드 #5C로부터 SapI로 잘라낸 dKeima-Red 유전자와 하이그로마이신B 내성 유전자를 포함하는 DNA 단편 100ng의 계 500ng를, 5㎕의 H₂O에 녹이고, Ligation-Convenience Kit(NIPPON GENE Co., Ltd.) 5㎕을 혼합해서 16℃에서 60분 반응시켰다. 정제 후, 7㎕의 H₂O에 녹이고, 1㎕의 플라스미드 #6(pDONR-221, Life Technologies, Inc.) (150ng)과 2㎕의 BP Clonase2(Life Technologies, Inc.)를 첨가해서 25℃에서 2시간 반응시키고 나서 대장균 DH-5α에 도입해서 카나마이신 내성 콜로니를 단리하고, 플라스미드 #7을 제작했다.

( 실시예 5) 10개의 외래 유전자를 탑재한 스텔스형 RNA를 만드는 주형 DNA의 제작(도 10 참조)

플라스미드 #8은 p15A의 복제기점을 가지는 플라스미드 pACYC177(비특허문헌 56)의 카나마이신 내성 유전자를, pDONR-221의 attB1-클로람페니콜 내성 유전자-attB2를 포함하는 DNA 단편으로 치환해서 제작한다. OptimumGen Gene Design System에서 최적화한 hN-hC-hPolS를 포함하는 DNA(서열번호 53)의 5’측에 attB1과 T7 terminator, HDV ribozyme를 이 순서로 접속한 DNA 단편은 GenScript사에서 합성했다. 동일하게, OptimumGen Gene Design System에서 최적화한 hPolL을 포함하는 DNA(서열번호 54)의 3’측에 T7 promoter와 attB2를 접속한 DNA를 합성했다. BamHI와 XmaI로 잘라낸 attB1-T7 terminator-HDV ribozyme- hN-hC-hPolS를 이 차례로 포함하는 DNA 단편 100ng, XmaI와 NotI로 플라스미드 #7로부터 잘라낸 10개의 유전자를 포함하는 DNA 단편 100ng, NotI와 SalI로 잘라낸 hPolL-T7 promoter-attB2를 이 차례로 포함하는 DNA 단편 100ng의 계 300ng를, 5㎕의 H₂O에 녹이고, Ligation-Convenience Kit 5㎕을 혼합해서 16℃에서 60분 반응시켰다. 정제 후, 7㎕의 H₂O에 녹이고, 1㎕의 플라스미드 #8(150ng)과 2㎕의 BP Clonase2를 첨가해서 25℃에서 16시간 반응시키고 나서 대장균 HST-08(Takara Bio Co.)에 도입해서 암피실린 내성 콜로니를 단리하고, 마이너스-스트랜드의 스텔스형 RNA를 합성하는 주형이 되는 플라스미드 #9B를 제작했다.

플러스-스트랜드의 스텔스형 RNA를 합성하는 주형 DNA는 T7 promoter와 T7 terminator를 교체해서 제작한다. 구체적으로는, attB1-T7 promoter - hN-hC-hPolS를 이 차례로 포함하는 DNA 단편 100ng, XmaI와 NotI로 플라스미드 #7로부터 잘라낸 10개의 유전자를 포함하는 DNA 단편 100ng, NotI와 SalI로 잘라낸 hPolL- HDV ribozyme-T7 terminator-attB2를 이 차례로 포함하는 DNA 단편 100ng의 계 300ng를, 5㎕의 H₂O에 녹이고, Ligation-Convenience Kit 5㎕를 혼합해서 16℃에서 60분 반응시켰다. 정제후, 7㎕의 H₂O에 녹이고, 1㎕의 플라스미드 #8(150ng)과 2㎕의 BP Clonase2를 첨가해서 25℃에서 16시간 반응시키고 나서 대장균 HST-08에 도입해서 암피실린 내성 콜로니를 단리하고, 플러스-스트랜드의 스텔스형 RNA를 합성하는 주형이 되는 플라스미드 #9A를 제작했다.

( 실시예 6) 10개의 외래 유전자를 탑재한 스텔스형 RNA 유전자 발현계의 재구성(방법 1)(도 11 참조)

방법 1은 특허문헌 3과 비특허문헌 7에 기술된 방법에 준해서 실시했다.

구체적으로는, BHK/T7/151M(SE) 세포로서, T7 RNA polymerase와 M단백질을 안정되게 발현하는 햄스터 유래 BHK-21 세포를 이하의 방법으로 제작했다. BHK-21세포는 이화학연구소 바이오 리소스 센터로부터 입수했다. T7 RNA polymerase 유전자(비특허문헌 74)를 동물세포에 코돈 최적화해서 합성한 cDNA(서열정보 77)을 레트로바이러스 벡터 pCX4neo(비특허문헌 75, GenBank Accession Number AB086385)에 탑재하고, BHK-21 세포에 도입후, G-418 800㎍/㎖를 포함하는 10% FCS 함유 DMEM 배지에서 선택하고, BHK/T7 세포를 얻었다. 다음에, 센다이바이러스 온도 감수성 변이주 Clone 151주의 M유전자(GenBank Accession Number NM_011046)를 레트로바이러스 벡터 pCX4pur(비특허문헌 75, GenBank Accession Number AB086386)에 탑재하고, BHK-21/T7 세포에 도입후, Puromycin 200㎍/㎖를 포함하는 10% FCS 함유 DMEM 배지에서 선택하고, BHK/T7/151M(SE) 세포를 얻었다.

재구성에 사용한 발현벡터는 이하의 방법으로 제작했다. NP 단백질 발현 플라스미드 pCMV-NP, P 단백질 발현 플라스미드 pCMV-P, L 단백질 발현 플라스미드 pCMV-L, 마우스 Furin 발현 플라스미드 pCMV-Furin은 센다이바이러스 Z주의 NP유전자, P 유전자, L 유전자(GenBank Accession Number M30202.1) 및 마우스Furin cDNA(비특허문헌 76, GenBank Accession Number NM_011046)를, Cytomegalovirus의 Immediate Early 유전자의 인핸서ㆍ프로모터(비특허문헌 77)의 하류에 접속해서 제작했다. F 및 HN 단백질 발현 플라스미드 pSRD-HN-Fmut(비특허문헌 78)는 센다이바이러스Z주의 F 및 HN유전자를, SRα 프로모터(비특허문헌 79)의 하류에 접속한 플라스미드이다. pMKIT-151M은 SRα 프로모터의 하류에 센다이바이러스 온도 감수성 변이주 Clone 151주의 M유전자를 접속해서 제작했다.

M단백질을 안정되게 발현하는 BHK/T7/151M(SE) 세포를 5×10⁵ cells/well로 6-well플레이트에 파종하고, 24시간 배양한 후에 세정했다. 플라스미드 #9A, NP 단백질 발현 플라스미드 pCMV-NP, P 단백질 발현 플라스미드 pCMV-P, L 단백질 발현 플라스미드 pCMV-L, F 및 HN 단백질 발현 플라스미드 pSRD-HN-Fmut, 마우스Furin발현 플라스미드 pCMV-Furin을 각각 2㎍, 1㎍, 1㎍, 1㎍, 2㎍, 20 ng의 량비로 OptiMEM(Life Technologies, Inc.) 300㎕에 현탁하고, 10㎕의 Lipofectamine LTX(Life Technologies, Inc.)를 포함하는 300㎕의 OptiMEM과 혼합해서 20분간 실온 방치한 배지를, 세포에 첨가해서 4시간 배양했다. 세포를 재차 세정후, 10% FCS 함유 DMEM배지를 첨가해서 추가로 32℃에서 3일간 배양했다. 그 후에 하이그로마이신B 300㎍/㎖을 포함하는 10% FCS 함유 DMEM 배지에 세포를 이동해서 배양을 계속하고, BHK/#9A 세포를 분리했다. 스텔스형 RNA 유전자 발현계의 재구성이 일어난 것은 EGFP과 Keima-Red의 발현에 의해 확인했다.

( 실시예 7) 10개의 외래 유전자를 탑재한 스텔스형 RNA 유전자 발현계의 재구성(방법 2)(도 12 참조)

RecA와 RNaseE의 이중 결손 변이주인 대장균 E-AIST7주는 대장균 BL21(DE3)주 (비특허문헌 68)의 RNase E유전자와 Rec A 유전자를 이 순서로 파괴해서 제작했다. RNase E 유전자에는 RNase E의 C말단의 결손변이(rne131) (비특허문헌 59)을, Rec A 유전자에는 완전결손변이를 도입했다. 유전자파괴는 Gene Bridges GmbH사의 Quick & Easy E. coli Gene Deletion Kit를 사용하고, 동키트의 프로토콜에 따라서 실시했다. 대장균에서 싱글-스트랜드 RNA 결합 단백질(N)을 발현하는 플라스미드 #10은 플라스미드 pET-24a (+) (Merck KGaA)에 대장균에 합쳐서 코돈 최적화한 N유전자(eN) (서열번호 55)을 탑재해서 제작했다.

대장균 E-AIST7주에 플라스미드 #9B와 플라스미드 #10을 도입하고, 암피실린과 카나마이신에서 선택해서 E-AIST7/N/9B주를 제작했다. E-AIST7/N/9B주를 30℃에서 배양하고, OD₆₀₀=0.3이 된 시점에서 0.5mM IPTG를 첨가해서 T7 RNA polymerase의 발현을 유도하고, 3시간 배양해서 대장균을 회수했다. 회수한 균을 10㎖의 10% Sucrose, 50mM Tris-HCl (pH7.5), 2mM MgCl₂에 현탁하고, 150 kunits의 rLysozome(Merck KGaA)과 25 units의 Benzonase(Merck KGaA)를 첨가한 후, 30℃에서 30분 처리해서 프로토플라스트를 회수했다. 프로토플라스트를 50mM Tris-HCl (pH7.5), 2mM MgCl₂, 50mM CHAPS로 파괴하고, 4,500 rpm 10분의 원심 상청액을 Beckman SW41Ti로터로 25,000 rpm 60분 원심하고, RNA-N 단백질 복합체를 침전물로서 회수했다. RNA-N 단백질 복합체는 추가로, 28% 염화세슘 용액에 현탁하고, Beckman SW41Ti로터로 37,000 rpm 45시간 원심해서 RNA-N 단백질 복합체를 정제했다.

BHK/T7/151M(SE)세포를 5×10⁵ cells/well로 6-well 플레이트에 파종하고, 24시간 배양한 후에 P 단백질 발현 플라스미드 pCMV-P, L 단백질 발현 플라스미드 pCMV-L 각 1㎍를 Lipofectamine LTX에서 도입했다. 또 24시 간후, 5㎍의 RNA-N 단백질 복합체를 10㎕의 Pro-DeliverIN reagent(OZ Biosciences)와 혼합해서 세포에 도입했다. 24시간 후에서 하이그로마이신B 300㎍/㎖을 포함하는 10% FCS 함유 DMEM배지에 세포를 이동해서 배양을 계속하고, BHK/#9A2 세포를 분리했다. 스텔스형 RNA 유전자 발현계의 재구성이 발생한 것은 EGFP과 Keima-Red의 발현에 의해 확인했다.

( 실시예 8) 10개의 외래 유전자를 탑재한 스텔스형 RNA 벡터 #1의 제작

5.0×10⁵개의 BHK/#9A 세포 (혹은 BHK/#9A2 세포)에 대해서, 결손 유전자 발현 플라스미드인 pMKIT-151M, pSRD-HN-Fmut, pCMV-Furin을, 2㎍, 2㎍, 30 ng의 비율로 Lipofectamine LTX를 사용해서 도입하고, 4시간 후에 세포를 세정한 후, 10% FCS 함유 DMEM배지를 첨가해서 추가로 32℃에서 4일간 배양했다. 그 후에 스텔스형 RNA 벡터#1(도 13)을 포함하는 배양 상청을 회수하고, 0.45μm의 필터로 여과후, 필요하다면 초원심법에 의해 벡터를 농축했다. 벡터 현탁액은 액체질소로 급속냉동하고, -80℃에서 보존했다. 벡터의 활성은 원숭이 신장 유래 LLCMK₂ 세포를 사용해서 항NP 단백질 항체에 의한 간접 형광 항체법으로 검정했다(비특허문헌 7). 이 방법으로 수득된 스텔스형 RNA 벡터의 감염가는 약 10⁷ infectious units/㎖이고, 종래형의 지속 발현형 센다이바이러스 벡터와 동등 혹은 그 이상의 활성이 수득되었다.

( 실시예 9) 10개의 외래 유전자를 탑재한 스텔스형 RNA 벡터에 의한 유전자 발현(도 14 참조)

(실시예 8)에서 제작한 스텔스형 RNA 벡터#1을 HeLa 세포에 MOI=3으로로 감염하고, 하이그로마이신B 100㎍/㎖을 포함하는 10% FCS 함유 DMEM 배지에서 선택해서 HeLa/#9 세포를 수립했다. 이 세포의 약제 내성능은 퓨로마이신(1.5㎍/㎖), ZEOCIN(100㎍/㎖), 하이그로마이신B(100㎍/㎖), G418(800㎍/㎖), 블라스티시딘S(10㎍/㎖)로 선택해서 생존률을 콜로니 어세이로 측정했다. 음성대조의 HeLa 세포는 이것들의 항생물질에 대해서 전부 감수성인 것에 대해서, HeLa/#9 세포는 퓨로마이신, ZEOCIN, 하이그로마이신B에 선택적으로 내성을 나타내고, 이들 3종류의 약제에 대한 내성 형질을 발현하고 있는 것이 확인되었다(도 14, 상단).

HeLa/#9 세포에 있어서의 형광 단백질의 발현은 플로우 사이토미터(Gallios, Beckman Coulter)에 의해 계측했다. 각 형광 단백질의 관찰조건은 아래와 같다. EBFP2: 여기 405nm, 검출 450nm; Keima-Red: 여기 405nm, 검출 620nm; EGFP: 여기 488nm, 검출 530nm; E2-Crimson: 여기 638nm, 검출 660nm. HeLa/#9 세포는 벡터를 홀딩하지 않는 HeLa 세포에 비해서 유의하게 4개의 형광 단백질을 발현하고 있는 것이 확인되었다(도 14, 중단).

HeLa/#9 세포에 있어서의 루시페라아제의 발현은 이하의 시약을 사용해서 발광을 루미노미터(Promega, Corp.)로 검출했다. 반딧불이 루시페라아제 및 Renilla루시페라아제: Dual-Luciferase Reporter Assay System(Promega, Corp.); Cypridina noctiluca루시페라아제: BioLux Cypridina Luciferase Assay Kit(New England Biolabs, Inc.). 어느 쪽의 루시페라아제의 활성도 벡터를 홀딩하지 않는 HeLa세포에서는 검출되지 않았지만, HeLa/#9 세포에서는 높은 활성이 검출되었다(도 14, 하단).

( 실시예 10) 10개의 외래 유전자를 탑재한 스텔스형 RNA 벡터#2(도 15)의 제작

주형 cDNA의 제작에 사용하는 hN, hC, hPolS, hPolL 유전자를 GeneGPS Expression Optimization Technology에 의해 최적화한 것, hN, hC, hPolS의 3개의 유전자를 hN-hPolS-hC의 순번에서 탑재한 것 이외는, (실시예 8)에 기재한 것과 동일한 방법으로 벡터를 제작하고, (실시예 9)에 기재된 방법으로 검증했다. hN-hPolS-hC를 포함하는 DNA(서열번호 78)의 5’측에 attB1과 T7 promoter를 이 차례로 접속한 DNA 단편은 DNA 2.0사에서 합성했다. 동일하게, hPolL을 포함하는 DNA(서열번호 79)의 3’측에 HDV ribozyme, T7 terminator와 attB2을 접속한 DNA 단편을 DNA 2.0사에서 합성했다.

(실시예 11) 10개의 외래 유전자를 탑재한 스텔스형 RNA 벡터#3, #4(도 16)의 제작

OptimumGen Gene Design System에서 최적화한 hN, hC, hPolS의 3개의 유전자를 hN-hPolS-hC의 순번(#3) 또는 hPolS-hN-hC의 순번(#4) 탑재한 것 이외는, (실시예8)에 기재한 것과 동일한 방법으로 벡터를 제작하고, (실시예9)에 기재한 방법으로 검증했다. hN-hPolS-hC를 포함하는 DNA(서열번호 80)의 5’측에 attB1과 T7 promoter를 이 차례로 접속한 DNA 단편, 및 hPolS-hN-hC를 포함하는 DNA(서열번호 81)의 5’측에 attB1과 T7 promoter를 이 차례로 접속한 DNA 단편, 및 hPolL을 포함하는 DNA(서열번호 82)의 3’측에 HDV ribozyme, T7 terminator와 attB2를 접속한 DNA 단편은 GenScript사에서 합성했다.

( 실시예 12) 4개의 외래 유전자를 탑재한 스텔스형 RNA 벡터#5의 제작

블라스티시딘S 내성 유전자(비특허문헌 69) (서열번호 56) 및 Kusabira-Orange 유전자(비특허문헌 70)(GenBank Accession Number AB128819)는 PCR에 의해 Acc65I-cDNA-XhoI의 구조가 되도록 증폭해서 서브 클로닝했다(도 7). 플라스미드 #5D는 LITMUS38i의 ApaI 절단부위와 StuI 절단부위의 사이에, 이하의 구조를 가지는 DNA를 클로닝한다. 단, 플라스미드 #5와는 SapI절단 단면이 다르다: SapI 절단부위-서열번호 1-서열번호 36-Acc65I 절단부위-SalI절단부위-서열번호 37-서열번호 4-ctt-서열번호 1-서열번호 38-BsiWI 절단부위-XhoI 절단부위-서열번호 39-서열번호 4-attB2-SapI 절단부위.

플라스미드 #1의 Acc65I-SalI 사이에, dKeima-Red 유전자를 포함하는 Acc65I-XhoI 프래그먼트를 클로닝해서 플라스미드 #1D를 제작했다. 추가로, 플라스미드 #1D의 BsiWI-XhoI 사이에, 블라스티시딘S 내성 유전자를 포함하는 Acc65I-XhoI 프래그먼트를 클로닝해서 플라스미드 #1E를 제작했다. 또, 플라스미드 #5D의 Acc65I-SalI 사이에 EGFP 유전자를 포함하는 Acc65I-XhoI 프래그먼트를 클로닝해서 플라스미드 #5E를 제작했다. 또, 플라스미드 #5E의 BsiWI-XhoI 사이에, Kusabira-Orange 유전자를 포함하는 Acc65I-XhoI 프래그먼트를 클로닝해서 플라스미드 #5F를 제작했다.

플라스미드 #1E으로부터 SapI로 잘라낸 dKeima-Red 유전자와 블라스티시딘S 내성 유전자를 포함하는 DNA 단편 100ng, 플라스미드 #5F로부터 SapI로 잘라낸 EGFP 유전자와 Kusabira-Orange 유전자를 포함하는 DNA 단편 100ng의 계 200ng를, 5㎕의 H₂O에 녹이고, Ligation-Convenience Kit 5㎕을 혼합해서 16℃에서 60분 반응시켰다. 정제후, 7㎕의 H₂O에 녹이고, 1㎕의 플라스미드 #6(150ng)과 2㎕의 BP Clonase2를 첨가해서 25℃에서 2시간 반응시키고 나서 대장균 DH-5α에 도입해서 카나마이신 내성 콜로니를 단리하고, 플라스미드 #11을 제작했다. 플라스미드 #11로부터 XmaI와 NotI로 잘라낸 4유전자를 포함하는 DNA 단편을 사용한 스텔스형 RNA 벡터 #5의 제작은 (실시예5)∼(실시예 8)에 기술한 방법에 따라서 실시했다.

( 실시예 13) 스텔스형 RNA 벡터에 의한 IFN - β유전자의 유도(도 17)

결손 지속 발현형 센다이바이러스 벡터 SeVdp(KR/Bsr/EGFP/KO)는 비특허문헌 7에 기술되어 있다. (실시예 12)에서 제작한 스텔스형 RNA 벡터 #5와, SeVdp(KR/Bsr/EGFP/KO) 벡터를, 함께 MOI=3로 초대배양 인간 피부 유래 섬유아세포에 감염시켰다. 이 조건에서, 어느 쪽의 벡터도 약 80%의 세포에 유전자 도입할 수 있었다. 벡터 감염후 24시간째에, ISOGEN Kit(NIPPON GENE Co., Ltd.)를 사용해서 세포의 전체 RNA를 추출하고, Deoxyribonuclease (RT Grade) (NIPPON GENE Co., Ltd.)를 사용해서 게놈 DNA를 분해했다. 다음에, 이 RNA를 주형으로 해서, SuperScriptIII First-Strand Synthesis System for RT-PCR (Life Technologies, Inc.)와 oligo(dT) 20을 사용해서, 역전사 반응에 의해 First strand cDNA 합성을 실시했다. 또, SsoAdvanced Universal SYBR Green Supermix (Bio-Rad)를 사용해서, first strand cDNA를 주형에, 레퍼런스 유전자 또는 인터페론ㆍ베타 유전자의 Gene Specific Primers (GSP)와 CFX96 Real-Time System (Bio-Rad)을 사용해서 리얼타임 PCR법에 의해 IFN-β mRNA의 발현량의 해석을 실시했다.

( 실시예 14) 6개의 외래 유전자를 탑재한 스텔스형 RNA 유전자 발현계 #6, #7, #8, #9, #10의 제작(도 20, 도 2 2)

플라스미드 #2D는 플라스미드 LITMUS38i의 ApaI 절단부위와 StuI 절단부위 사이에, 이하의 구조를 가지는 DNA를 클로닝했다. 단, 플라스미드 #2와는 SapI에 의한 절단 단면의 서열이 다르다: SapI 절단부위-서열번호 1-서열번호 28-Acc65I 절단부위-SalI절단부위-서열번호 29-서열번호 4-ctt-서열번호 1-서열번호 30-BsiWI 절단부위-XhoI 절단부위-서열번호 31-서열번호 4-SapI 절단부위.

플라스미드 #2D의 Acc65I-SalI 사이에, EGFP 유전자를 포함하는 Acc65I-XhoI 프래그먼트를 클로닝해서 플라스미드 #2E를 제작했다. 또, 플라스미드 #2E의 BsiWI-XhoI 사이에, 퓨로마이신 내성 유전자를 포함하는 Acc65I-XhoI 프래그먼트를 클로닝해서 플라스미드 #2F를 제작했다.

플라스미드 #1C로부터 SapI로 잘라낸 반딧불이 루시페라아제 유전자와 Renilla루시페라아제 유전자를 포함하는 DNA 단편 100ng, 플라스미드 #2F로부터 SapI로 잘라낸 EGFP 유전자와 퓨로마이신 내성 유전자를 포함하는 DNA 단편 100ng, 플라스미드 #5 C로부터 SapI로 잘라낸 dKeima-Red 유전자와 하이그로마이신B 내성 유전자를 포함하는 DNA 단편 100ng의 계300ng를, 5㎕의 H2O에 녹이고, Ligation-Convenience Kit 5㎕를 혼합해서 16℃에서 60분 반응시켰다. 정제 후, 7㎕의 H₂O에 녹이고, 1㎕의 플라스미드 #6(150ng)과 2㎕의 BP Clonase2을 첨가해서 25℃에서 2시간 반응시키고 나서 대장균 DH-5α에 도입해서 카나마이신 내성 콜로니를 단리하고, 플라스미드 #12를 제작했다. 플라스미드 #12로부터 XmaI와 NotI로 잘라낸 6유전자를 포함하는 DNA 단편을 사용한 스텔스형 RNA 유전자 발현계#6, #7, #8(도 20) (실시예16) 및 #9, #10(도 22) (실시예 18)의 제작은 (실시예5) (실시예6) 및 (실시예8)에 기술한 방법에 따라서 실시했다.

( 실시예 15) 5개의 외래 유전자를 탑재한 스텔스형 RNA 유전자 발현계 #11, #12, #13, #14, #15의 제작(도 18)

5개의 유전자를 탑재한 플라스미드 #13은 (실시예 14)의 플라스미드 #12의 탑재 유전자 가운데, 반딧불이 루시페라아제 유전자를 삭제하고, 퓨로마이신 내성 유전자를 플라스미드 pBR322 유래의 테트라사이클린 내성 유전자(GenBank Accession Number J01749.1)로 바꿔 놓은 이외는, (실시예 14)에 기재된 방법으로 제작했다.

이 5개의 외래 유전자를 hN, hC, hPolS의 3개의 유전자를 hN-hPolS-hC의 차례로 탑재한 스텔스형 RNA 벡터 #3(도 16)에 탑재하고, 5개의 외래 유전자를 탑재한 스텔스형 RNA 유전자 발현계 #11을 제작했다. 또, 이 스텔스형 RNA 유전자 발현계의 XmaI 부위에, 코돈 최적화한 RIG-IC를 포함하는 유전자 카세트(서열번호 83), 코돈 최적화한 센다이바이러스ㆍV단백질의 C말단영역을 포함하는 유전자 카세트(서열번호 84), 코돈 최적화한 프로테아좀의 구성성분인 PSMA7을 포함하는 유전자 카세트(서열번호 85)를 삽입하고, 5개의 외래 유전자를 탑재한 스텔스형 RNA 유전자 발현계 #12, #13, #14을 제작했다. 또, 5개의 외래 유전자를 탑재한 스텔스형 RNA 유전자 발현계 #15는 hN-hPolS-hC 유전자 가운데 hPolS 유전자의 일부를 최적화하지 않는 센다이바이러스 Z주의 P유전자와 바꿔 놓고(서열번호 86), V단백질이 발현하도록 한 것이다.

이것들의 스텔스형 RNA 유전자 발현계를 포함하는 세포로부터 실시예 8을 따라서 스텔스형 RNA 벡터를 제작하고, 인간 유래 293세포에 도입하고, 인터페론 유도능을 측정했다. 도 19에서는 대표예 로서 스텔스형 RNA 벡터#11과 #12의 비교를 실시했지만, RIG-IC 유전자를 추가하는 것에　의해, 스텔스형 RNA 벡터에서 잔존하고 있는 인터페론ㆍ베타의 유도가 거의 완전하게 억제되는 것이 나타났다.

( 실시예 16) N 단백질과 C 단백질의 발현 효율의 변화가 스텔스형 RNA 유전자 발현계에 탑재된 외래 유전자의 발현에 제공하는 영향의 해석(도 20 참조)

pGL4.12(Promega Corporation) (GenBank Accession Number AY738224)가 코딩하고 있는 반딧불이 루시페라아제 cDNA의 번역 개시 코돈(AUG)의 상류에, 서열번호 56, 서열번호 57, 서열번호 58에 대응하는 RNA 서열을 삽입하고, CMV프로모터를 사용해서 HeLa세포로 발현시키고, Dual-Luciferase Reporter Assay System을 사용해서 루시페라아제의 활성을 조사했다(도 20). 그 결과, 본래의 번역 개시 코돈 상류에 다른 개시 코돈을 아웃 프레임에 두면 본래의 단백질과 번역 서열이 어긋나서 번역효율이 저하되고 있음을 알았다.

다음에, hN mRNA와 hC mRNA의 번역 개시 코돈의 5’ 상류측의 염기서열을 개변한 스텔스형 RNA 유전자 발현계 #6, #7, #8의 유전자 발현 능력을 조사했다. 스텔스형 RNA 유전자 발현계#6에서는 hN mRNA와 hC mRNA의 번역 개시 코돈(AUG)의 5’ 상류측이, 번역효율이 가장 높다고 여겨지는 소위 「Kozak 서열(서열번호 57)」이다. 스텔스형 RNA 유전자 발현계 #7에서는 hN mRNA의 번역 개시 코돈의 5’ 상류측은 「Kozak서열(서열번호 57)」 (비특허문헌60), hC mRNA의 번역 개시 코돈의 5’ 상류측은 번역효율이 23%로 내려 가는 서열번호 59의 염기서열로 바꿔 놓아져 있다. 또 스텔스형 RNA 유전자 발현계#8에서는 hN mRNA의 번역 개시 코돈의 5’ 상류측은 번역효율이 40%로 내려 가는 서열번호 58의 염기서열, hC mRNA의 번역 개시 코돈의 5’ 상류측은 번역효율이 23%로 내려 가는 서열번호 59의 염기서열에 바뀌어 있다. 이 실험에서는 스텔스형 RNA 유전자 발현계 #6, #7, #8을 안정되게 홀딩하고 있는 BHK/T7/151M(SE) 세포에 있어서, Dual-Luciferase Reporter Assay System을 사용해서 루시페라아제의 활성을 조사했다(도 20).

( 실시예 17) 5개의 외래 유전자를 탑재한 스텔스형 RNA 유전자 발현계 #16, #17의 제작(도 21)

hN, hC, hPolS의 3개의 유전자를 hN-hPolS-hC의 차례로 탑재하고, 5개의 외래 유전자를 탑재한 스텔스형 RNA 유전자 발현계 #11은 (실시예15)로 기술했다. 이 벡터의 hC유전자는, 5’측 비번역 영역의 서열을 개변해서 번역효율을 23%로 낮추고 있다(도 21). 스텔스형 RNA 유전자 발현계 #16은 #11로부터 hC유전자를 제외한 것이다. 스텔스형 RNA 유전자 발현계 #17은 #11의 hC유전자의 5’ 비번역서열을 Kozak 서열로 해서 번역효율을 100%로 한 것이다.

도 21에서 나타낸 EGFP의 발현으로부터 알 수 있는 바와 같이, 스텔스형 RNA 유전자 발현계의 유전자 발현 레벨은 hC 유전자의 번역효율을 변경함으로써 조절할 수 있다. 또, hC 유전자는 스텔스형 RNA 유전자 발현계의 재구성에 필수적인 요소는 아니지만, hC 유전자가 없으면 외래 유전자의 발현이 매우 강하게 되기 때문에, 세포의 증식이 억제된다. 이 때문에, hC유전자를 어느 정도 발현시킴으로써 실용적인 레벨의 유전자 발현을 얻는 것이 현실적이다.

( 실시예 18) 스텔스형 RNA 유전자 발현계의 게놈 3’측에 있는 패키징 시그널이 벡터 입자생산에 제공하는 영향의 해석(도 22참조)

스텔스형 RNA 유전자 발현계#9는 스텔스형 RNA 유전자 발현계 #6(도 20)부터 게놈 RNA3’측의 서열 D(서열번호 17)을 결실한 것이다. 또, 스텔스형 RNA 유전자 발현계 #10은 스텔스형 RNA 유전자 발현계 #7(도 20)로부터 게놈 RNA3’측의 서열D(서열번호 17)을 결실한 것이다. 이것들의 스텔스형 RNA 유전자 발현계를 안정되게 홀딩하고 있는 BHK/T7/151M(SE) 세포에, (실시예 5)에 기재된 방법으로 M, F, HN의 각 단백질을 발현하고, 상청액에 회수되는 스텔스형 RNA 벡터의 유전자 도입능을, LLCMK₂ 세포를 사용한 항NP 단백질 항체에 의한 간접 형광 항체법으로 검정했다(비특허문헌 7).

또, 이 18염기의 서열을 (표 1)에 나타나 있는 House-keeping 유전자 유래 mRNA의 부분서열로부터 임의로 선택해서 치환해 본(도 2의 (5) (서열번호 75))바, 입자화 효율에 변화가 없는 것을 확인했다(data not shown).

이것으로부터, 게놈 3’말단으로부터 97∼114염기째까지의 18염기 길이 또는 그 일부의 길이 영역이 마이너스 싱글-스트랜드 RNA에 있어서의 입자화를 위한 패키징에 필수라고 생각할 수 있다. 어떻든 간에, 이 위치에 18염기 길이 또는 그 일부의 길이 영역은 마이너스 싱글-스트랜드 RNA를 주형으로 한 전사와 복제에는 필수는 아니지만, 스텔스형 RNA 유전자 발현계가 바이러스 유사입자에 합입되기 때문에 필수적인 「패키징ㆍ시그널 영역」이라고 할 수 있다.

( 실시예 19) 스텔스형 RNA 유전자 발현계를 홀딩하고 있는 HeLa세포를 siRNA 로 처리했을 때의 루시페라아제 활성의 경시변화(도 23 참조)

스텔스형 RNA 유전자 발현계 #6(도 20)으로부터 스텔스형 RNA 벡터 #6을 제작하고, HeLa 세포에 유전자 도입해서 하이그로마이신B에서 선택하는 것에 의해 HeLa/#3 세포주를 수립했다. HeLa/#3 세포를 1.0×10⁴/well이 되도록 48 well 플레이트에 파종하고, 다음날, 최종농도 100 nM가 되도록 PolL 유전자의 표적서열(서열번호 46)을 표적으로 한 siRNA를 도입시약 RNAiMAX(Life Technologies, Inc.)과 혼합해서 도입했다. 루시페라아제 활성을 경시적으로 측정한 결과, 4회의 독립한 실험에서 모두, 10일에서 약 0.1%로까지 루시페라아제의 활성이 억제되고, 스텔스형 RNA 유전자 발현계가 효율적으로 세포로부터 제거되고 있는 것이 밝혀졌다.

( 실시예 20) 큰 유전자를 탑재한 스텔스형 RNA 벡터의 제작(도 24참조)

각종 외래 유전자를 탑재한 스텔스형 RNA 벡터의 제작은 (실시예1)∼ (실시예2)과 동일하게 2개씩의 유전자로부터 「전사 카세트」를 제조하고, (실시예3)∼ 실시예5)와 동일하게 「전사 카세트」를 차례로 연결하고, (실시예 6) 혹은 (실시예 7) 및 (실시예 8)과 동일한 방법으로 제작할 수 있다. 이러한 큰 외래 유전자로서 탑재 가능한 외래 유전자의 명칭과 그 염기서열은 아래와 같다. 인간 KLF4: 서열번호 60, 인간 OCT4: 서열번호 61, 인간 SOX2: 서열번호 62, 인간 c-Myc: 서열번호 63, 인간 BRG1: 서열번호 64, 인간 BAF155: 서열번호 65, 인간 면역글로블린GㆍH 체인: 서열번호 66, 인간 면역글로블린GㆍL 체인: 서열번호 67, 인간 면역글로블린M clone 2G9ㆍH 체인: 서열번호 68, 인간 면역글로블린M clone 2G9ㆍL 체인: 서열번호 69, 인간 면역글로블린MㆍJ 체인: 서열번호 70, 인간 혈액응고 제VIII인자: 서열번호 71, 인간ㆍ지스트로핀: 서열번호 72.

이것들의 유전자를 외래 유전자로서 담지한 RNA 발현계는 상기 각 실시예에 기재된 순서에 준한 수법으로 소망하는 세포에 도입할 수 있다. 그리고 외래 유전자를 동일세포에 있어서 동시에 복수 개 발현시키는 것에　의해, 세포 재프로그래밍 등, 도입세포에 대해서 소망하는 변경을 첨가하는 것이 가능하게 된다.

( 실시예 21) 6개의 초기화 유전자를 탑재한 스텔스형 RNA 벡터에 의한 인공 다능성 줄기세포( iPS 세포)의 유도(도 25)

6개 이상의 유전자를 탑재해서 확실하게 발현시킬 수 있다는 스텔스형 RNA 벡터의 특징은 인간의 체세포를 초기화해서 iPS 세포로 전환하는 것과 같은 세포 재프로그래밍에서 특히 유효할 것으로 생각된다. 그래서, 인간 인공 다능성 줄기세포를 만들기 위한 방법으로서 최초로 보고된 KLF4, OCT4, SOX2, c-MYC의 4개의 초기화 유전자의 조합(특허문헌 1, 비특허문헌 1)에, 보완적인 기능을 가지는 초기화 유전자NANOG과 LIN28(특허문헌 2, 비특허문헌 2)을 추가하고, 합계 6개의 초기화 유전자를 동시에 발현하는 스텔스형 RNA 벡터를 제작하고, 지금까지 보고되고 있는 iPS 세포의 제작 기술 중에서 가장 초기화 효율이 높은, 「4개의 초기화 유전자(KLF4, OCT4, SOX2, c-MYC)을 동시에 탑재한 지속 발현형 센다이바이러스 벡터」 (특허문헌 3, 특허문헌 4, 비특허문헌 7) (도 25A)과의 사이에서, 세포의 초기 화활성을 비교했다.

6개의 초기화 유전자를 탑재한 스텔스형 RNA 벡터#23(도 25B)은 실시예 14에 나타낸 방법을 사용해서 인간 KLF4(서열번호 60), 인간 OCT4(서열번호 61), 인간 SOX2(서열번호 62), 인간 c-MYC(서열번호 63), 인간 NANOG(서열번호 87), 인간 LIN28(서열번호 88)을 이 차례로 결합하고, 도 16의 스텔스형 RNA 벡터#3에 편입하고, 실시예 6 및 실시예 8에 따라서 제작했다.

iPS 세포의 제작은 특허문헌 3에 준해서 실시했다. 구체적으로는, 인간 태아 유래 섬유아세포인 TIG3 세포를 12 well plate에 1.0 x 10⁵ cells/well로 파종하고, 다음날에 KLF4, OCT4, SOX2, c-MYC를 탑재한 지속 발현용 센다이바이러스 벡터(도 25의 A), 및 KLF4, OCT4, SOX2, c-MYC, NANOG, LIN28을 탑재한 스텔스형 RNA 벡터(도 25의 B)을 각각 MOI (Multiplicity of Infection)=3의 조건으로 배지 중에 첨가하고, 실온에서 2시간 방치한 후에 37℃에서 하룻밤 배양하는 것에 의해서 감염시켰다. 미토마이신C 처리를 한 MEF를 피더 세포로서 젤라틴 코팅한 dish 상에 준비하고, 상기 벡터 감염 세포를 그 위에 뿌리고, 인간 다능성 줄기세포용 배지 StemFit AK03(Ajinomoto, Co., Inc.) 중에서 배양했다. 유전자 도입후 11일째에, AlexaFluor488 표지 항TRA-1-60 항원 항체(Merck-Millipore)로 염색하고, 1x10⁴개의 TIG-3 세포로부터 출현한 TRA-1-60 양성의 iPS 세포의 클론 수를 셌다(도 25의 C). 그 결과, 4인자 탑재 벡터에 의해 출현한 iPS 세포는 85클론(초기화 효율 0.85%)이었던 것에 대해서, 6인자 탑재 벡터에서는 4290클론(초기화 효율 42.9%)의 iPS 세포 클론이 출현하고, 6개의 유전자를 동시에 탑재한 스텔스형 RNA 벡터의 유효성이 나타났다. 또, 이 실시예에서 사용한 유전자의 합계 염기 길이는 7.0 kb가 되어, 종래의 RNA 벡터를 사용한 방법에서는 실현되지 않는 사이즈이다.

( 실시예 22) 인간 면역글로블린M(IgM)의 H 체인ㆍL 체인ㆍJ 체인의 동시 발현에 의한 인간 면역글로블린M의 생산(도 26)

바이오 의약품 제조의 분야에서, 복수의 폴리펩티드를 동시에 발현시킬 필요가 있는 대표적인 제품으로서는 항체 의약품이 있다. H 체인과 L 체인을 발현해서 제조할 수 있는 면역글로블린G(IgG)의 상업 생산기술은 이미 확립되어 있지만, H 체인ㆍL 체인ㆍJ 체인를 코딩하는 3개의 유전자를 동시에 발현시킬 필요가 있는 IgM의 제조는 현재에 있어서 용이하지 않다(비특허문헌 84). IgM 중에는, IgG에는 없는 강한 항종양 활성을 가지는 항체가 존재하는 것이 알려지고 있고(비특허문헌85), IgM의 제조법의 확립은 산업적인 의의가 크다. 그래서, 인간 IgM의 H 체인ㆍL 체인ㆍJ 체인을 코딩하는 3개의 유전자를 스텔스형 RNA 벡터에 탑재해서 한번에 발현시키는 것에　의해, 분자량 950k Dalton의 IgM의 제조를 시도했다.

실시예 22에서는 인간 면역부전 바이러스(HIV) 감염 세포와 반응하는 인간ㆍ모노클로널 IgM 항체 9F11과 2G9(비특허문헌 86)를 재료로서 선택하고, 9F11 항체의 H 체인 유전자(서열번호 89)와 L 체인 유전자(서열번호 90), J 체인 유전자(서열번호 70), 하이그로마이신B 내성 유전자(서열번호 50), 또는 2G9항 체의 H 체인 유전자(서열번호 68)와 L 체인 유전자(서열번호 69), J 체인 유전자(서열번호 70), 하이그로마이신B 내성 유전자(서열번호 50)을 실시예 12을 따라서 이 차례로 연결하고, 도 20의 스텔스형 RNA 벡터 #8에 탑재하고, 스텔스형 RNA 벡터 #23 및 #20을 얻었다. 다음에, MOI=3의 조건으로 단백질 제조용 무혈청배지 Opti-Pro SFM(Life Technologies, Inc.)에 순화한 햄스터 유래 BHK세포에 유전자 도입하고, 하이그로마이신B를 100㎍/㎖ 첨가하고 선택했다. 새로운 배지교환 후, 24시간으로 회수하고, 그 배양 상청을 회수했다.

배양 상청 중의 인간 IgM의 양을 항 인간 IgMㆍELISA 키트(Bethyl Laboratories, Inc.)로 정량한바, 2G9의 유전자 세트를 도입한 경우에는 9.17㎍/㎖, 9F11의 유전자 세트를 도입한 경우에는 11.15㎍/㎖의 IgM이 검출되었다. 유전자를 도입하지 않은 BHK 세포의 배양 상청 중의 IgM은 검출한계 이하이었다. 이것을 세포 1개당 ㆍ1일당의 발현 효율(pg/cell/day)로 환산하면, 2G9는 16.38 pg/cell/day, 9F11은 19.91 pg/cell/day이었다(도 26).

다음에, 300 ng 및 100 ng의 IgM을 포함하는 배양 상청을, 4-20% Gradient Gel(Bio-Rad)을 사용해서 SDS 폴리아크릴아마이드 전기영동에서 해석하고, BioSafe Coomasie G250 stain(Bio-Rad)으로 염색했다. 그 결과, 비환원 상태에서는 천연의 인간 IgM과 같은 970k 달톤의 위치에, 또 환원 상태에서는 분자량 75k달톤의 H 체인과 25k 달톤의 L 체인 위치에 밴드가 검출되고, 천연과 같은 21개의 폴리펩티드가 결합한 IgM 분자가 되어있는 것이 밝혀졌다.

비특허문헌 84에는 CHO-DG44 세포와 HEK293 세포를 사용해서 메토트렉세이트에 의한 유전자 증폭한 결과 수득된 IgM 안정 발현 세포 4클론에서의 해석결과가 기술되어 있지만, 발현 효율은 25.00, 3.59, 4.60, 0.21 pg/cell/day이었다. 이것으로부터, 스텔스형 RNA 벡터를 사용하면, 수 개월을 요하는 유전자 증폭에 의해 달성한 IgM의 발현과 동등 혹은 더 높은 레벨의 생산을 용이하게 실현되는 것이 밝혀졌다.

( 실시예 23) 4개의 cDNA를 동시 발현하는 것에 의한 인간 이중 특이성 항체의 생산(도 27)

2개의 다른 항원을 인식할 수 있는 이중 특이성 항체는 지금까지의 항체 의약품의 가능성을 대폭 확장하는 분자로서, 바이오 의약품의 분야에서 최근 주목받고 있다. 이중 특이성 항체는 항원A를 인식하는 H 체인(A)과 L 체인(A)과, 항원B를 인식하는 H 체인(B)과 L 체인(B)으로 이루어지는 4량체에서, H 체인(A)과 L 체인(B) 혹은 H 체인(B)과 L 체인(A)이 결합하기 어렵도록 변이를 도입하고, 또 H 체인(A) 끼리 혹은 H 체인(B) 끼리의 결합보다도 H 체인(A)과 H 체인(B)의 결합이 강하게 되도록 변이를 도입한 후에, H 체인(A)ㆍL 체인(A)ㆍH 체인(B)ㆍL 체인(B)을 코딩하는 4개의 유전자를 동시에 발현시켜서 제작한다(비특허문헌 87). 이러한 4개의 유전자를 동시에 세포에 도입한 후, 유전자 증폭해서 4개의 폴리펩티드가 동시에 고발현하는 세포주를 얻는 것은 매우 어렵기 때문에, 통상은 일과성의 유전자 발현으로 생산되고 있다. 본 실시예에서는 비특허문헌 87에 기술되어 있는 이중 특이성 항체 가운데, HER2와 상피 세포 증식 인자 리셉터(EGFR)를 동시에 인식하는 HEDesignLK의 제작을 시도했다.

비특허문헌 87에 개시되어 있는 항HER2 항체의 H 체인 HC1(VH_VRD1CH1_CRD2) 유전자(서열번호 91) 및 L 체인 LC1(VL_VRD1Cλ_CRD2) 유전자(서열번호 92), 및 항EGFR 항체의 H 체인 HC2(VH_VRD2CH1_WT) 유전자(서열번호 93)과 L 체인 LC2(VL_VRD2Cκ_WT) 유전자(서열번호 94)을, EGFP 유전자 및 하이그로마이신B 내성 유전자와 함께, 실시예 14에 따라서 연결하고, 스텔스형 RNA 벡터#8(도 20)에 탑재해서 스텔스형 RNA 벡터 #24를 제작했다. 또, 비교를 위해서, 항HER2 항체의 H 체인과 L 체인만을 발현하는 벡터#25(도 27의 (B)) 및 항EGFR 항체의 H 체인과 L 체인만을 발현하는 벡터 #26(도 27의 (C))을, 실시예 12에 따라서 제작했다.

이것들의 벡터를 사용하고, 실시예 22의 방법으로 Opti-Pro SFM(Life Technologies, Inc.)에 순화한 햄스터 유래 BHK세포에 유전자 도입하고, 안정 발현 세포의 배양 상청 중의 인간 IgG의 양을 항 인간 IgGㆍELISA 키트(Bethyl Laboratories, Inc.)로 정량했다. 그 결과, 4량체를 만드는 활성이 낮은 HC1과 LC1만의 조합(12.93 pg/cell/day)이나, HC2과 LC2의 조합(14.02 pg/cell/day)에 비해서 HC1ㆍLC1ㆍHC2ㆍLC2에 4개의 유전자를 동시에 탑재한 경우에는 유의하게 높은(37.45 pg/cell/day) 항체생산이 관찰되어, 이중 특이성 항체가 효율 높은(효율적으로) 생산되고 있는 것이 시사되었다. 또, 이 발현 레벨은 유전자 증폭을 사용해서 CHO세포로 수립하는 일반적인 세포주에서의 유전자 발현 레벨(최대로 약 90 pg/cell/day) (비특허문헌 88)에 필적한다. 이것으로부터, 종래의 방법에서는 안정 발현 세포주를 얻는 것이 곤란했던 이중 특이성 항체를 안정적으로 생산하기 위한 방법으로서, 스텔스형 RNA 벡터가 매우 유효한 것이 시사되었다. 또, 이 실시예에서 사용한 유전자의 합계 염기 길이는 6.7 k염기가 되어, 종래의 RNA 벡터를 사용한 방법에서는 실현되지 않는 사이즈이다.

본 발명은 인공 다능성 세포(iPS 세포)의 제작을 포함하는 인간 세포의 재프로그래밍, 단백질의약품의 제조, 거대유전자를 포함하는 각종 유전자에 의한 유전자 치료, 신약개발 표적분자의 발현 등, 많은 산업분야에서 유용한 기술이다.

SEQUENCE LISTING <110> NATIONAL INSTITUTE OF ADVANCED INDUSTRIAL SCIENCE AND TECHNOLOGY TOKIWA-BIO INC. <120> A Gene expression system by the use of stealth-type RNA and a gene introduction vector including the same <130> SJU5167979WO <150> JP2015-007288 <151> 2015-01-16 <160> 94 <170> PatentIn version 3.5 <210> 1 <211> 10 <212> RNA <213> Artificial Sequence <220> <223> Sendai virus transcription initiation signal, minus strand sequence <400> 1 cuuucacccu 10 <210> 2 <211> 10 <212> RNA <213> Artificial Sequence <220> <223> Sendai virus transcription initiation signal, minus strand sequence <400> 2 cuuuaucccu 10 <210> 3 <211> 10 <212> RNA <213> Artificial Sequence <220> <223> Sendai virus transcription initiation signal, minus strand sequence <400> 3 cauucacccu 10 <210> 4 <211> 10 <212> RNA <213> Artificial Sequence <220> <223> Sendai virus transcription termination signal, minus strand sequence <400> 4 uuuuucuuaa 10 <210> 5 <211> 10 <212> RNA <213> Artificial Sequence <220> <223> Sendai virus transcription termination signal, minus strand sequence <400> 5 uuuuucuuac 10 <210> 6 <211> 10 <212> RNA <213> Artificial Sequence <220> <223> Sendai virus transcription termination signal, minus strand sequence <400> 6 uuuuucuuau 10 <210> 7 <211> 10 <212> RNA <213> Artificial Sequence <220> <223> human parainfluenza virus III transcription initiation signal, minus strand sequence <400> 7 cuuuaauccu 10 <210> 8 <211> 11 <212> RNA <213> Artificial Sequence <220> <223> human parainfluenza virus III transcription termination signal <400> 8 uuuuucuuau u 11 <210> 9 <211> 11 <212> RNA <213> Artificial Sequence <220> <223> Newcastle disease virus transcription initiation signal, minus strand sequence <400> 9 cuucuacccg u 11 <210> 10 <211> 10 <212> RNA <213> Artificial Sequence <220> <223> Newcastle disease virus transcription termination signal, minus strand sequence <400> 10 uuuuuucuaa 10 <210> 11 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> Sendai virus genomic RNA 3' end replication origin, minus strand sequence <400> 11 cucuugucug gu 12 <210> 12 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> Sendai virus genomic RNA 3' end replication origin, minus strand sequence <400> 12 cucuuguuug gu 12 <210> 13 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> Sendai virus genomic RNA 5' end replication origin, minus strand sequence <400> 13 accagacaag ag 12 <210> 14 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> Sendai virus genomic RNA 5' end replication origin, minus strand sequence <400> 14 accaaacaag ag 12 <210> 15 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Sendai virus (CNNNNN)3-BOX, minus strand sequence <220> <221> misc_feature <222> (1)..(5) <223> n is a, c, g, or u <220> <221> misc_feature <222> (7)..(11) <223> n is a, c, g, or u <220> <221> misc_feature <222> (13)..(17) <223> n is a, c, g, or u <400> 15 nnnnncnnnn ncnnnnnc 18 <210> 16 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Sendai virus (NNNNNG)3-BOX, minus strand sequence <220> <221> misc_feature <222> (2)..(6) <223> n is a, c, g, or u <220> <221> misc_feature <222> (8)..(12) <223> n is a, c, g, or u <220> <221> misc_feature <222> (14)..(18) <223> n is a, c, g, or u <400> 16 gnnnnngnnn nngnnnnn 18 <210> 17 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Sendai virus packaging signal, minus strand sequence <400> 17 acuuuggcag caaagaaa 18 <210> 18 <211> 5 <212> RNA <213> Artificial Sequence <220> <223> non-coding sequence from Homo sapiens glyceraldehyde-3-phosphate dehydrogenase <400> 18 ccacc 5 <210> 19 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> non-coding sequence from Homo sapiens eukaryotic translation elongation factor 1 alpha-1 <400> 19 acgaggcctc agtttgtcta cttggtc 27 <210> 20 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> non-coding sequence from Homo sapiens hydroxymethylbilane synthase <400> 20 cctcagtgcc ccattctcac tgct 24 <210> 21 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> non-coding sequence from Homo sapiens glyceraldehyde-3-phosphate dehydrogenase <400> 21 ggagccgcac cttgtcatgt accatcaata 30 <210> 22 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> non-coding sequence from Homo sapiens glyceraldehyde-3-phosphate dehydrogenase <400> 22 tctcccctcc tcaca 15 <210> 23 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> non-coding sequence from Homo sapiens mitochondrial ribosomal protein L32 <400> 23 taatagccca cttactcctg aatctttaa 29 <210> 24 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> non-coding sequence from Homo sapiens beta-actin <400> 24 cgttacaccc tttcttgaca aaacctaact 30 <210> 25 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> non-coding sequence from Homo sapiens beta-actin <400> 25 cttccccctt ttttgtcccc caacttgag 29 <210> 26 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> non-coding sequence from Homo sapiens phosphoglycerate kinase 1 <400> 26 cgacctctct ccccagctgt atttccaaa 29 <210> 27 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> non-coding sequence from Homo sapiens phosphoglycerate kinase 1 <400> 27 aggctctgtt ccacatatat ttccacttc 29 <210> 28 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> non-coding sequence from Homo sapiens peptidylprolyl isomerase A <400> 28 accgccgagg aaaaccgtgt actattagc 29 <210> 29 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> non-coding sequence from Homo sapiens peptidylprolyl isomerase A <400> 29 gtttgacttg tgttttatct taaccacca 29 <210> 30 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> non-coding sequence from Homo sapiens tubulin, alpha-1b <400> 30 tgtctgctcc tgtcgccttc gcctcctaa 29 <210> 31 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> non-coding sequence from Homo sapiens tubulin, beta-1 <400> 31 agcactgcca tctcttccag caccatcag 29 <210> 32 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> non-coding sequence from Homo sapiens transferrin receptor <400> 32 cccaactcct ataattccct atcttttag 29 <210> 33 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> non-coding sequence from Homo sapiens eukaryotic translation elongation factor 2 <400> 33 gatgtccaaa ctaattttaa caaacgcat 29 <210> 34 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> non-coding sequence from Homo sapiens ubiquitin C <400> 34 gtatcagcag aaggacattt taggacggg 29 <210> 35 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> non-coding sequence from Homo sapiens transferrin receptor <400> 35 gagttacttc ctatcaagcc agtacgtgc 29 <210> 36 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> non-coding sequence from Homo sapiens TATA box binding protein <400> 36 ctaggaaaaa attgaatagt gagacgagt 29 <210> 37 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> non-coding sequence from Homo sapiens lamin B2 <400> 37 cagaaccccc caccctacat ttgccttgg 29 <210> 38 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> non-coding sequence from Homo sapiens alpha-actin, cardiac muscle 1 <400> 38 cgccgacgaa ccccctgaag ctgtgccaa 29 <210> 39 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> non-coding sequence from Homo sapiens alpha-actin, cardiac muscle 1 <400> 39 gatgccttct ctctccatct accttccag 29 <210> 40 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> non-coding sequence from Homo sapiens tubulin, beta-1 <400> 40 gacaggcaga aagcagagaa gggccagga 29 <210> 41 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> non-coding sequence from Homo sapiens tubulin, beta-1 <400> 41 caccccccaa aatgctctgc agcctctct 29 <210> 42 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> non-coding sequence from Homo sapiens 1-acylglycerol-3-phosphate O-acyltransferase 1 <400> 42 ccaacctccc actcccacct cccctccat 29 <210> 43 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> non-coding sequence from Homo sapiens 1-acylglycerol-3-phosphate O-acyltransferase 1 <400> 43 ccactcttga cccccacctc c 21 <210> 44 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> non-coding sequence from Homo sapiens tubulin, alpha-1b <400> 44 taaagctttc tgg 13 <210> 45 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> non-coding sequence from Homo sapiens glyceraldehyde-3-phosphate dehydrogenase <400> 45 agccgcacct tgtcatgtac catcaataaa gtaccctgtg ctcaac 46 <210> 46 <211> 19 <212> RNA <213> Artificial Sequence <220> <223> siRNA target sequence for hPolL suppression <400> 46 gggacagaug agauuucuu 19 <210> 47 <211> 600 <212> DNA <213> Artificial Sequence <220> <223> codon optimized Puromycin resistance gene <400> 47 atgaccgagt acaagcctac cgtgcggctg gccacaaggg atgacgtgcc tcgggccgtg 60 aggaccctgg ccgccgcttt cgccgactac cccgccacaa gacacaccgt ggacccagac 120 agacacatcg agagggtgac cgagctgcag gagctgttcc tgaccagagt gggcctggac 180 atcggaaagg tgtgggtggc cgacgacggc gccgccgtgg ctgtgtggac aacccccgag 240 tccgtggagg ccggcgctgt gttcgctgag atcggacctc ggatggccga gctgagcgga 300 agcagactgg ccgcccagca gcagatggag ggcctgctgg ctcctcacag acctaaggag 360 ccagcttggt tcctggctac cgtgggcgtg tcccctgatc accagggcaa gggcctgggc 420 agcgccgtgg tgctgcctgg agtggaggcc gccgagcgcg ccggagtgcc tgcttttctg 480 gagaccagcg cccctcgcaa cctgccattc tatgagagac tgggcttcac cgtgacagct 540 gacgtggagg tgcctgaggg ccccagaaca tggtgtatga cccggaagcc tggcgcctga 600 <210> 48 <211> 678 <212> DNA <213> Artificial Sequence <220> <223> E2-Crimson fluorescent protein gene <400> 48 atggatagca ctgagaacgt catcaagccc ttcatgcgct tcaaggtgca catggagggc 60 tccgtgaacg gccacgagtt cgagatcgag ggcgtgggcg agggcaagcc ctacgagggc 120 acccagaccg ccaagctgca agtgaccaag ggcggccccc tgcccttcgc ctgggacatc 180 ctgtcccccc agttcttcta cggctccaag gcgtacatca agcaccccgc cgacatcccc 240 gactacctca agcagtcctt ccccgagggc ttcaagtggg agcgcgtgat gaacttcgag 300 gacggcggcg tggtgaccgt gacccaggac tcctccctgc aggacggcac cctcatctac 360 cacgtgaagt tcatcggcgt gaacttcccc tccgacggcc ccgtaatgca gaagaagact 420 ctgggctggg agccctccac tgagcgcaac tacccccgcg acggcgtgct gaagggcgag 480 aaccacatgg cgctgaagct gaagggcggc ggccactacc tgtgtgagtt caagtccatc 540 tacatggcca agaagcccgt gaagctgccc ggctaccact acgtggacta caagctcgac 600 atcacctccc acaacgagga ctacaccgtg gtggagcagt acgagcgcgc cgaggcccgc 660 caccacctgt tccagtag 678 <210> 49 <211> 375 <212> DNA <213> Artificial Sequence <220> <223> codon optimized Zeocin resistance gene <400> 49 atggctaagc tgaccagcgc cgtgcccgtg ctgacagcga gggacgtggc tggagctgtg 60 gagttctgga cagacaggct gggcttcagc agggacttcg tggaggacga cttcgccggc 120 gtggtgaggg acgacgtgac cctgttcatc agcgccgtgc aggaccaggt ggtgcccgac 180 aacacactgg cttgggtgtg ggtgagggga ctggatgagc tgtatgctga gtggtctgag 240 gtggtgagca ccaacttcag ggatgcttct ggacctgcta tgacagagat tggagagcag 300 ccttggggaa gagagtttgc cctgagggac cctgctggaa actgcgtgca ctttgtggct 360 gaggagcagg actga 375 <210> 50 <211> 1026 <212> DNA <213> Artificial Sequence <220> <223> codon optimized Hygromycin resistance gene <400> 50 atgaagaagc ccgagctgac cgctaccagc gtggagaagt tcctgatcga gaagttcgac 60 agcgtgagcg acctgatgca gctgagcgag ggcgaggaga gcagggcctt cagcttcgac 120 gtgggcggca ggggctacgt gctgagggtg aacagctgcg ccgacggctt ctacaaggac 180 agatacgtgt acagacactt tgctagcgcc gccctgccca tccctgaggt gctggacatt 240 ggagagttca gcgagagcct gacctactgc atcagcagga gagctcaggg agtgaccctg 300 caggacctgc ctgagacaga gctgcctgcc gtgctgcagc ctgtggctga ggctatggat 360 gctattgctg ccgcagacct gagccagacc agcggatttg gacccttcgg ccctcagggt 420 atcggacagt acaccacctg gagggacttc atctgcgcca tcgccgaccc ccacgtgtac 480 cactggcaga ccgtgatgga tgacaccgtg agcgcctctg tggctcaggc cctggatgag 540 ctgatgctgt gggctgagga ctgccctgag gtgaggcacc tggtgcacgc cgacttcggc 600 agcaacaacg tgctgaccga caacggcagg atcaccgccg tgatcgactg gagcgaggcc 660 atgttcggcg acagccagta cgaggtggcc aacatcttct tctggaggcc ctggctggcc 720 tgcatggagc agcagaccag gtactttgag aggaggcacc ctgagctggc tggaagccca 780 aggctgaggg cttacatgct gaggattgga ctggaccagc tgtaccagag cctggtggac 840 ggcaacttcg acgatgctgc ttgggctcag ggaaggtgcg atgctatcgt gaggagcgga 900 gctggcaccg tgggaaggac ccagattgct aggaggagcg ccgccgtgtg gacagatgga 960 tgcgtggagg tgctggctga ctctggaaac cgtaggccta gcacccgacc aagagctaag 1020 gagtga 1026 <210> 51 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> recombination sequence attB1 <400> 51 acaagtttgt acaaaaaagc aggct 25 <210> 52 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> recombination sequence attB2 <400> 52 acccagcttt cttgtacaaa gtggt 25 <210> 53 <211> 4212 <212> DNA <213> Artificial Sequence <220> <223> A DNA fragment including hN gene, hCgene and hPolS gene <400> 53 accagacaag agtttaagag atatgtatcc ttttaaattt tcttaagaaa aacttagggt 60 gaaagtatcc accctgagga gcaggttcca gatccttttc tttgctgcca aagtccacca 120 tggctggcct gctgtcaacc ttcgatacct tttcaagtag gaggagcgag tcaatcaaca 180 aatctggggg cggagctgtc atccctggac agcggtccac cgtgtctgtc ttcgtgctgg 240 gcccctctgt gacagacgat gccgacaagc tgttcatcgc caccacattt ctggctcaca 300 gtctggacac agataaacag cattcacaga gaggcgggtt tctggtgagc ctgctggcta 360 tggcatacag ctccccagaa ctgtatctga ctaccaacgg agtgaatgcc gacgtgaagt 420 acgtgatcta taacattgag aaggacccca aaaggactaa gaccgatggc ttcatcgtga 480 agacacggga tatggaatac gagagaacaa ctgagtggct gttcgggcct atggtgaaca 540 agagcccact gtttcaggga cagcgagacg cagctgaccc cgataccctg ctgcaaatct 600 acggctatcc tgcctgcctg ggggctatca ttgtccaagt gtggatcgtc ctggtgaaag 660 caattacctc tagtgccggc ctgcggaagg ggttctttaa ccgcctggag gctttccgac 720 aggatggaac agtgaagggc gcactggtct ttaccggcga aacagtggag ggaatcggct 780 ctgtcatgag aagtcagcag tcactggtca gcctgatggt ggaaactctg gtcaccatga 840 acacagccag aagtgacctg accacactgg agaaaaacat ccagattgtg gggaattaca 900 tcagggatgc cggcctggcc agcttcatga ataccatcaa gtatggggtg gaaacaaaga 960 tggcagccct gactctgtcc aacctgagac ccgacatcaa caagctgcgg agcctgattg 1020 atacctacct gtctaagggc cccagggccc ctttcatctg tattctgaaa gacccagtgc 1080 acggggagtt tgctccagga aactaccccg cactgtggtc ctatgcaatg ggcgtggccg 1140 tggtccagaa taaggccatg cagcagtacg tcactggccg cacctatctg gacatggaaa 1200 tgtttctgct ggggcaggcc gtggctaaag atgccgagag caagatcagc agcgccctgg 1260 aggacgagct gggagtcaca gatactgcca aggggcgact gcggcaccat ctggcaaacc 1320 tgtccggagg cgacggagca tatcacaaac ctacaggggg aggcgctatc gaagtggcac 1380 tggataatgc cgacattgat ctggagacta aggcacatgc agaccaggat gctcgcggat 1440 ggggaggaga ttccggcgaa agatgggcca ggcaggtgtc tggcgggcac tttgtcactc 1500 tgcatggcgc tgagcgactg gaggaagaga ccaatgacga agatgtgagt gacatcgagc 1560 ggagaattgc tatgcgactg gcagaaaggc gccaggagga ctcagccacc catggggatg 1620 agggacggaa caatggagtg gaccatgacg aagatgatga cgccgccgca gtcgcaggca 1680 ttggaggaat ttgaggatct acgaggcctc agtttgtcta cttggtctta agaaaaactt 1740 agggtgaaag cctcagtgcc ccattctcac tgctactaga ggagcccacc atgcccagct 1800 ttctgaagaa gattctgaaa ctgagaggac gaagacagga agatgagtct cgaagtcgga 1860 tgctgtccga cagctccatg ctgtcttgca gggtgaacca gctgactagc gagggaaccg 1920 aagctggctc aaccacaccc agcacactgc ctaaagacca ggccctgctg atcgagccaa 1980 aggtccgggc taaggaaaaa tcccagcacc ggagacccaa gatcattgat caggtgaggc 2040 gcgtcgagag tctgggggaa caggcatcac agcggcagaa acatatgctg gagaccctga 2100 tcaacaaaat ctacacaggc cctctggggg aggaactggt gcagactctg tatctgagaa 2160 tctgggccat ggaggaaacc ccagagtctc tgaaaatcct gcagatgcgc gaagacattc 2220 gagatcaggt cctgaagatg aaaacagaga gatggctgag gactctgatt aggggcgaaa 2280 agaccaaact gaaggatttc cagaagcggt acgaggaagt gcacccctat ctgatgaaag 2340 agaaggtgga acaggtcatc atggaagagg cttggtcact ggcagctcat attgtgcagg 2400 agtaatgact cgacggagcc gcaccttgtc atgtaccatc aatattaaga aaaacttagg 2460 gtgaaagtct cccctcctca cacctagagc cgccaccatg gaccaggacg cttttattct 2520 gaaggaggat tctgaagtgg aacgggaggc accaggggga agggagagtc tgagtgatgt 2580 cattggcttc ctggacgccg tgctgagctc cgagccaaca gatatcggag gggaccggag 2640 ctggctgcac aacactatta atacccccca ggggcctgga agtgcacata gagccaagtc 2700 agagggcgaa ggggaggtgt caacacccag cactcaggat aacaggtctg gggaggaatc 2760 cagagtctct ggaaggacca gtaagcctga agcagaggcc cacgctggca acctggacaa 2820 acagaatatc catcgagctt ttggaggccg gaccgggaca aactctgtga gtcaggacct 2880 gggagatggg ggagactctg gcatcctgga aaacccccct aatgagcgcg gctaccctcg 2940 atccgggatt gaagatgaga atagggagat ggccgctcac ccagataagc gaggagaaga 3000 ccaggcagag ggactgcctg aggaagtgcg gggctcaacc agcctgccag acgaaggaga 3060 gggaggagcc tccaacaatg gccggtctat ggaacctggg tctagtcatt ccgctagagt 3120 gacaggcgtg ctggtcattc cttctccaga gctggaggaa gcagtcctgc ggagaaacaa 3180 gaggcgccca accaattccg gatctaaacc actgacccca gcaacagtgc ccggcacacg 3240 gagcccaccc ctgaacagat ataatagtac cgggtcacct ccaggaaagc ccccttctac 3300 acaggatgag cacatcaaca gtggggacac tccagctgtg cgggtcaagg atagaaaacc 3360 acccattgga actcggagcg tgagcgactg cccagcaaac ggaagaccta tccaccccgg 3420 cctggagact gattccacca agaaaggaat tggcgaaaat acctcaagca tgaaggagat 3480 ggccacactg ctgactagcc tgggcgtgat ccagtccgca caggaattcg agagcagccg 3540 ggacgccagt tacgtctttg ctcgacgggc actgaaatca gccaactatg ctgagatgac 3600 cttcaacgtg tgcggcctga ttctgagcgc cgaaaagagt tcagctagaa aagtggatga 3660 gaataagcag ctgctgaaac agatccagga aagcgtcgag tccttcagag acatctacaa 3720 gaggttttca gaatatcaga aagagcagaa cagcctgctg atgtctaatc tgagtacact 3780 gcacatcatt actgataggg gaggcaagac cgataacaca gacagcctga cacgcagccc 3840 ttccgtgttc gctaagtcca aagagaataa gactaaagca acccgctttg acccctccat 3900 ggaaactctg gaggatatga agtacaaacc tgacctgatc cgggaagatg agtttaggga 3960 cgaaattcgc aacccagtgt atcaggaacg cgatactgag ccccgagcat caaatgccag 4020 cagactgctg ccctccaagg agaaacctac catgcattct ctgaggctgg tcatcgaaag 4080 ctccccactg agccgcgctg agaaggtggc atacgtcaaa tctctgagta agtgcaaaac 4140 cgaccaggag gtgaaggctg tgatggaact ggtggaggaa gacattgaat ctctgacaaa 4200 ctaaatcccg gg 4212 <210> 54 <211> 6884 <212> DNA <213> Artificial Sequence <220> <223> A DNA fragment including hPolL gene <400> 54 gcggccgctt aagaaaaact tagggtgaat gtaaagcttt ctggccacca tggacgggca 60 ggagtcatcc cagaatcctt ccgatatcct gtatcccgaa tgtcatctga actcacctat 120 tgtgcgaggc aaaatcgccc agctgcacgt gctgctggac gtgaaccagc catataggct 180 gaaggacgat tccatcatta atatcacaaa gcataagatt cgcaacggcg ggctgtctcc 240 cagacagatc aagatcagga gtctgggcaa ggccctgcag agaactatca aggatctgga 300 caggtacaca ttcgagcctt acccaactta ttctcaggaa ctgctgcggc tggacattcc 360 agagatctgc gataaaatcc ggagcgtgtt cgccgtcagt gaccggctga ccagagagct 420 gagctccggc ttccaggatc tgtggctgaa tatcttcaag cagctgggga acatcgaggg 480 acgcgaaggc tatgatccac tgcaggacat tggcacaatc cccgagatta ctgacaaata 540 ctcacgcaac cgatggtatc ggcccttcct gacctggttt agcatcaaat acgacatgag 600 gtggatgcag aagacccgcc ccggaggacc tctggataca agtaactcac acaatctgct 660 ggagtgcaag agctacacac tggtgactta tggagatctg attatgatcc tgaacaagct 720 gactctgacc ggctacatcc tgacccccga actggtgctg atgtattgtg acgtggtcga 780 gggaagatgg aacatgagcg ccgctggcca tctggacaag aagtccattg gcatcacaag 840 caagggggag gaactgtggg aactggtgga cagcctgttc tctagtctgg gagaggaaat 900 ctataatgtc attgccctgc tggagcctct gagcctggct ctgattcagc tgaacgatcc 960 agtgatcccc ctgcgcggcg cattcatgcg acacgtcctg accgagctgc aggccgtgct 1020 gacctccagg gatgtctaca cagacgcaga ggccgatact atcgtggaat ccctgctggc 1080 tatctttcat gggacatcta ttgacgagaa ggcagaaatc ttcagtttct ttaggacctt 1140 tggacacccc tcactggagg ccgtgacagc agccgataaa gtccgcgctc atatgtacgc 1200 acagaaggcc atcaaactga agactctgta tgaatgccac gccgtgttct gtaccatcat 1260 tatcaatggc taccgggaga gacacggagg acagtggcca ccttgcgatt ttcctgacca 1320 cgtgtgcctg gaactgcgca acgctcaggg gtccaatact gcaatctctt acgagtgtgc 1380 cgtggacaac tataccagct tcattggatt caaatttcgc aagtttatcg agccacagct 1440 ggatgaagac ctgaccatct acatgaaaga taaggcactg agcccccgga aggaagcctg 1500 ggacagcgtg taccctgatt caaatctgta ctataaagcc ccagagagcg aggaaacacg 1560 gagactgatc gaggtgttca ttaatgacga aaactttaat cccgaggaaa ttatcaacta 1620 cgtcgaaagc ggggactggc tgaaagatga gaagttcaac attagctatt ccctgaaaga 1680 gaaggaaatc aagcaggaag gaagactgtt tgccaaaatg acatacaaga tgagggctgt 1740 gcaggtcctg gcagagactc tgctggccaa aggaatcggc gagctgttct ccgaaaacgg 1800 gatggtgaaa ggagagattg acctgctgaa gaggctgacc acactgtctg tgagtggcgt 1860 ccctcgcacc gatagcgtgt ataacaattc caaatcaagc gagaagagga atgaagggat 1920 gaagaaaaag aactctggcg ggtattggga cgagaaaaag aggagtcgcc acgaattcaa 1980 ggccacagac tcctctactg atggctacga gactctgagc tgctttctga ctaccgatct 2040 gaaaaagtat tgtctgaatt ggcgcttcga aagcaccgct ctgtttgggc agcgatgcaa 2100 tgagatcttc ggcttcaaga ccttcttcaa ctggatgcat cccgtgctgg agagatgcac 2160 catctacgtg ggcgaccctt attgtccagt cgccgatagg atgcaccgcc agctgcagga 2220 tcatgctgac agcgggattt tcatccacaa ccctagggga ggcatcgagg gatactgtca 2280 gaagctgtgg accctgattt caatcagcgc aattcatctg gctgcagtgc gggtcggagt 2340 gagagtcagt gccatggtgc agggcgacaa tcaggctatc gcagtcactt caagagtgcc 2400 cgtcgcccag acctataagc agaaaaagaa ccacgtgtat aaggagatta caaagtattt 2460 cggcgctctg aggcacgtga tgtttgatgt cgggcatgag ctgaaactga atgaaactat 2520 catcagttca aagatgttcg tgtactccaa gagaatctac tatgacggca aaatcctgcc 2580 acagtgcctg aaggcactga cacggtgcgt gttctggtct gagactctgg tcgatgaaaa 2640 cagatccgcc tgctctaata tctccacttc tattgccaag gctatcgaga acggctactc 2700 ccccatcctg gggtactgta ttgccctgta taaaacctgc cagcaggtgt gcatctcact 2760 gggcatgacc attaatccca caatcagccc tactgtgcga gaccagtact tcaaagggaa 2820 gaactggctg cgatgcgctg tgctgatccc agcaaacgtc gggggattca attatatgag 2880 tacctcaagg tgttttgtgc gcaacatcgg ggaccctgca gtcgccgctc tggctgatct 2940 gaagcgattc attcgggccg atctgctgga caaacaggtg ctgtaccgcg tgatgaatca 3000 ggagcctgga gatagctcct ttctggactg ggcttctgat ccctatagtt gcaacctgcc 3060 tcacagccag tccatcacaa ctattatcaa gaatatcacc gcaaggtctg tgctgcaaga 3120 aagtcccaac cctctgctga gcgggctgtt cacagagact tccggagagg aagacctgaa 3180 tctggcttcc tttctgatgg atcgaaaagt gatcctgcca cgggtcgcac atgaaatcct 3240 gggaaactct ctgaccggcg tgcgggaggc aatcgcagga atgctggaca ccacaaagag 3300 tctggtgaga tctagtgtca aaaagggcgg gctgtcatac ggcatcctga ggcgcctggt 3360 gaattacgac ctgctgcagt atgaaaccct gacaagaact ctgaggaaac ccgtgaagga 3420 taacatcgag tacgaatata tgtgcagcgt ggagctggca gtcggactga gacagaagat 3480 gtggattcac ctgacatacg ggaggcctat ccatggactg gagactccag atcccctgga 3540 actgctgagg ggcaccttca tcgaggggtc agaagtgtgc aagctgtgcc gcagcgaggg 3600 agcagaccct atctacacct ggttttatct gccagataat attgatctgg acaccctgac 3660 aaacggatgt cctgctattc gcatcccata cttcggctct gctacagacg agcgaagtga 3720 agcacagctg ggctatgtgc ggaatctgag caaacctgcc aaggcagcca ttcggatcgc 3780 tatggtgtat acctgggcat atgggacaga tgagatttct tggatggaag ctgcactgat 3840 cgcacagaca agagccaacc tgagtctgga gaatctgaag ctgctgactc cagtgtctac 3900 tagtaccaac ctgtcccaca ggctgaaaga cacagccact cagatgaagt tctcaagcgc 3960 aactctggtg cgcgccagcc ggttcatcac catcagcaac gacaatatgg ctctgaaaga 4020 ggcaggagaa tctaaggata caaatctggt gtaccagcag atcatgctga ctggcctgag 4080 cctgttcgag tttaacatgc gctataaaaa ggggtccctg ggaaagcctc tgatcctgca 4140 cctgcatctg aacaatggct gctgtattat ggagtcccca caggaagcca atatcccacc 4200 ccggtctacc ctggacctgg agattacaca ggaaaacaac aagctgatct atgatcctga 4260 cccactgaag gatgtggacc tggaactgtt ctccaaagtg cgggacgtgg tccacaccgt 4320 cgatatgaca tactggagcg acgatgaagt gatcagagcc acctccattt gcaccgccat 4380 gacaatcgct gacacaatga gccagctgga tcgggacaac ctgaaggaaa tgattgctct 4440 ggtgaacgac gatgacgtga atagcctgat taccgagttc atggtcatcg atgtcccact 4500 gttctgttcc acatttggag gcatcctggt gaatcagttt gcctactctc tgtatggact 4560 gaacattcga ggccgggagg aaatctgggg ccacgtggtc cgcatcctga aagacaccag 4620 ccatgcagtg ctgaaggtcc tgtcaaatgc cctgagccac cccaaaattt tcaagcggtt 4680 ttggaacgca ggagtggtcg agccagtgta cggacccaac ctgagcaatc aggataagat 4740 cctgctggcc ctgtcagtgt gcgaatatag cgtggacctg ttcatgcacg attggcaggg 4800 gggagtgccc ctggagatct tcatctgtga taatgaccct gatgtcgctg acatgcgacg 4860 gtcctctttc ctggcacgcc atctggccta cctgtgctcc gtggcagaaa tcagccggga 4920 cggaccacga ctggagagta tgaactcact ggagaggctg gaaagcctga agtcctacct 4980 ggagctgact ttcctggatg accccgtgct gcgctattct cagctgaccg gcctggtcat 5040 caaggtcttt cctagtaccc tgacatacat ccggaaaagt tcaattaagg tgctgagaac 5100 cagggggatt ggagtgcccg aggtcctgga agactgggat cctgaagctg acaatgcact 5160 gctggatggc attgccgctg agatccagca gaacattcca ctgggacacc agacacgcgc 5220 cccattttgg ggactgcgag tgtcaaagag ccaggtcctg cgcctgcgag ggtacaaaga 5280 gatcaccaga ggcgaaattg ggagaagcgg cgtggggctg acactgccat tcgacggccg 5340 gtatctgtcc catcagctga gactgtttgg gatcaattcc acatcttgcc tgaaggccct 5400 ggaactgact tacctgctgt cccccctggt ggacaaagat aaggacagac tgtacctggg 5460 agagggcgct ggggcaatgc tgtcttgcta tgacgctacc ctgggccctt gtatcaacta 5520 ctataattcc ggcgtgtact cttgtgatgt caacgggcag agagagctga atatctaccc 5580 agccgaagtg gctctggtcg ggaaaaagct gaacaatgtg acctcactgg gacagagggt 5640 gaaggtcctg ttcaacggaa atcccggcag cacatggatt ggaaacgacg agtgcgaagc 5700 cctgatctgg aacgagctgc agaatagctc cattggcctg gtgcactgtg acatggaagg 5760 cggggatcat aaggatgacc aggtggtcct gcacgagcat tacagcgtga ttaggatcgc 5820 ctatctggtc ggcgatcgcg acgtggtcct gatctccaaa attgctccta ggctggggac 5880 tgactggacc cgccagctgt ctctgtacct gcgatattgg gatgaagtga atctgatcgt 5940 cctgaagact agtaacccag cctcaaccga aatgtacctg ctgagtaggc accccaaatc 6000 agacattatc gaggattcca agaccgtgct ggcttctctg ctgccactga gcaaggagga 6060 cagcatcaag atcgaaaagt ggattctgat cgagaaagcc aaggctcacg aatgggtgac 6120 cagagagctg agagaagggt ctagttcaag cggaatgctg cggccttacc atcaggccct 6180 gcagacattc ggctttgagc caaacctgta taagctgagc agagacttcc tgtccacaat 6240 gaacattgct gatactcata attgcatgat cgcattcaac agggtgctga aggacaccat 6300 ttttgagtgg gcccggatca cagaatccga taaaagactg aagctgacag gaaaatacga 6360 cctgtatcct gtgcgcgatt ctggcaaact gaagactgtg agtagaaggc tggtcctgtc 6420 atggatcagt ctgtcaatga gcactcggct ggtgaccggg agtttcccag accagaagtt 6480 tgaagccaga ctgcagctgg gaatcgtgtc tctgtcctct agggagattc gcaatctgcg 6540 agtcatcact aaaaccctgc tggaccgctt cgaagatatt atccacagca tcacttaccg 6600 atttctgacc aaagagatta agatcctgat gaaaattctg ggagccgtga agatgtttgg 6660 cgctcggcag aacgagtaca ccactgtgat tgacgacggc agcctgggcg acattgaacc 6720 ttacgattcc tcctaaaccg gtagccgcac cttgtcatgt accatcaata aagtaccctg 6780 tgctcaacga agtcttggac tgatccatat gacaatagta agaaaaactt acaagaagac 6840 aagaaaattt aaaagaatac atatctctta aactcttgtc tggt 6884 <210> 55 <211> 1575 <212> DNA <213> Artificial Sequence <220> <223> codon optimized N gene for expression in E.Coli <400> 55 atggcaggtt tactcagcac gttcgacact tttagcagca gacgcagcga gagcatcaac 60 aaatccggtg gtggcgcggt gatccctggt cagcgctcta ccgtgagcgt gtttattctg 120 ggcccgtctg tcaccgatga tgccgataag ctgttcattg ccaccacctt tctggcccac 180 agcctggaca cggacaaaca gcactctcaa cgtggcggtt tcctggtttc gttgctggcg 240 atggcgtata gcagcccgga gctgtacttg accaccaacg gcgtgaacgc ggatgtgaag 300 tatgtgattt acaacatcga gaaagatccg aagcgtacga aaaccgacgg ttttatcgtt 360 aagacccgcg atatggaata cgagcgtacc acggagtggc tgttcggtcc gatggtcaat 420 aagagcccgc tgttccaagg ccagcgcgac gcagcggacc cggacaccct gctgcagatc 480 tatggctacc ctgcgtgtct gggcgcgatc attgttcaag tatggatcgt tctggtcaag 540 gcgattacca gcagcgcagg tctgcgtaag ggctttttca atcgcctgga ggcgttccgt 600 caggatggca ccgtgaaagg tgcactggtt tttaccggtg aaaccgtcga aggtattggc 660 tctgttatgc gttcccagca gagcttggtc agcctgatgg ttgagactct ggttacgatg 720 aatactgccc gcagcgatct gacgaccctg gagaaaaaca ttcaaattgt cggcaactac 780 atccgtgatg cgggtctggc atccttcatg aatacgatca aatatggcgt ggaaacgaag 840 atggcggcct tgaccctgtc caatctgcgt ccggacatta acaaattgcg tagcctgatt 900 gacacgtacc tgagcaaagg tccgcgtgcc ccgttcatct gcattctgaa agatccagtt 960 cacggtgagt tcgcaccggg taactatccg gccctgtgga gctatgcaat gggcgtggct 1020 gtcgtccaga acaagagcat gcagcagtac gttacgggtc gtacctacct ggatatggag 1080 atgtttctgc tgggtcaagc agttgcaaaa gacgcggagt ccaaaatcag cagcgccctg 1140 gaggacgagt tgggtgtcac cgacaccgcg aaggaacgtc tgcgtcatca tctggctaat 1200 ctgagcggtg gtgatggcgc gtaccacaag ccgacgggtg gtggtgctat cgaagttgcg 1260 ctggataatg cggacatcga tttggaaact gaagcacacg cggatcaaga cgcgcgtggc 1320 tggggtggtg atagcggcga acgctgggcg cgtcaagtgt cgggcggtca ctttgtgacc 1380 ctgcatggtg cggagcgtct ggaagaagaa accaatgatg aggacgttag cgatattgag 1440 cgccgtattg ctatgcgcct ggcggaacgt cgtcaagagg acagcgctac gcacggtgac 1500 gagggccgca acaatggcgt cgaccatgaa gaggacgacg acgctgcagc cgcagcgggt 1560 attggtggca tctaa 1575 <210> 56 <211> 423 <212> DNA <213> Artificial Sequence <220> <223> Blastcidin S resistance gene <400> 56 atgaagacct tcaatattag ccagcaggac ctggagctgg tggaggtggc caccgagaaa 60 atcaccatgc tgtacgagga caataagcac cacgtggggg ccgccattcg caccaagaca 120 ggcgagatca tcagcgccgt gcacatcgag gcctacatcg gccgggtgac cgtgtgcgcc 180 gaggccatcg ccatcggctc cgccgtgtcc aacggccaga aggattttga taccattgtg 240 gccgtgaggc acccatacag cgacgaggtg gatcggagca tccgggtggt gtccccttgc 300 gggatgtgca gagagctgat ttccgattac gcccctgact gcttcgtgct gatcgagatg 360 aatgggaagc tggtgaaaac aacaatcgag gagctgatcc ccctgaagta taccaggaac 420 tga 423 <210> 57 <211> 5 <212> RNA <213> Artificial Sequence <220> <223> Kozak sequence <400> 57 ccacc 5 <210> 58 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> 5' non-coding sequence #1 <400> 58 ccaccatgaa attgccagaa gactgacact agagccgcca cc 42 <210> 59 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 5' non-coding sequence #2 <400> 59 caccatggcc caggcttcat a 21 <210> 60 <211> 1440 <212> DNA <213> Artificial Sequence <220> <223> codon optimized human KLF4 gene <400> 60 atgcgacagc ctcctggcga atccgatatg gccgtctccg atgctctgct gccttctttc 60 tctacttttg cctctggacc tgctggcagg gagaagacac tgcgacaggc aggagctccc 120 aacaatcgat ggcgggagga actgtctcac atgaaaagac tgccccctgt cctgcctggg 180 aggccatacg acctggccgc tgcaaccgtg gccacagatc tggagtccgg aggagctgga 240 gcagcttgcg gaggaagcaa cctggcacca ctgcctcgga gagaaaccga ggaattcaac 300 gatctgctgg acctggattt tatcctgtct aatagtctga cccacccacc agagtccgtc 360 gcagcaacag tgagctcctc tgcatctgcc agttcaagct cctctccaag ttcaagcggc 420 ccagcttcag cacccagcac ttgttccttc acctacccca ttcgggcagg gaatgaccct 480 ggagtggccc cagggggaac aggaggggga ctgctgtatg gcagagaatc tgcacctcca 540 cccactgccc ctttcaacct ggctgacatc aatgatgtct caccaagcgg aggatttgtg 600 gcagagctgc tgaggcccga actggatcct gtctatattc ctccacagca gcctcagccc 660 cctggaggag gactgatggg caagttcgtg ctgaaagcct ccctgtctgc tccaggcagc 720 gagtacggga gtccctcagt catcagcgtg tccaagggat ctcctgacgg aagtcaccca 780 gtggtcgtgg caccatataa cggaggccca cccaggactt gccccaagat caagcaggaa 840 gctgtgtcct cttgtaccca tctgggggca ggacctccac tgagcaatgg ccaccgcccc 900 gctgcacatg actttcctct ggggcgacag ctgccttccc ggaccacacc aaccctggga 960 ctggaggaag tgctgagttc acgcgattgc cacccagccc tgcctctgcc ccctgggttc 1020 cacccacatc ccggacctaa ctacccaagc tttctgccag accagatgca gccacaggtg 1080 ccacccctgc actatcagga gctgatgcct ccaggaagtt gtatgcccga ggaaccaaag 1140 ccaaaacggg gcaggcgcag ctggcctaga aagaggactg ctacccatac atgcgattac 1200 gcaggctgtg ggaagactta taccaaaagc tcccacctga aggcccatct gagaacacac 1260 actggcgaga aaccttacca ctgcgactgg gatggatgtg gctggaagtt cgctcgctcc 1320 gacgaactga cacgccatta tcgaaagcac actgggcatc gaccattcca gtgccagaaa 1380 tgtgaccggg cattttctag aagtgatcat ctggccctgc acatgaaacg gcatttttga 1440 <210> 61 <211> 1083 <212> DNA <213> Artificial Sequence <220> <223> codon optimized human OCT4 gene <400> 61 atggccggac acctggcttc agattttgcc ttctcaccac cacctggggg agggggcgac 60 ggacctgggg gacccgaacc tggatgggtg gaccccagaa cctggctgag ctttcaggga 120 ccccctggcg ggccaggaat cggccctggc gtgggacctg gctccgaggt ctgggggatt 180 ccaccctgcc ctccacccta cgaattctgc ggaggcatgg cttattgtgg accacaagtg 240 ggagtcggac tggtgcctca ggggggactg gagacatctc agcctgaggg agaagcagga 300 gtgggagtcg agagcaactc cgatggcgct agtcccgaac cttgcaccgt gactccaggg 360 gcagtcaagc tggagaagga aaaactggag cagaatcccg aggaatccca ggacatcaag 420 gctctgcaga aagagctgga acagtttgca aagctgctga agcagaaacg cattaccctg 480 ggctacacac aggccgatgt ggggctgact ctgggagtgc tgttcggcaa agtcttttcc 540 cagaccacaa tctgccgatt cgaggcactg cagctgagct tcaagaacat gtgtaaactg 600 aggcccctgc tgcagaagtg ggtggaggaa gccgacaaca atgagaatct gcaggaaatc 660 tgcaaagcag aaacactggt gcaggccagg aagcgcaaac gaactagcat tgagaaccgg 720 gtcagaggca acctggaaaa tctgtttctg cagtgcccaa agcccacact gcagcagatc 780 agccacattg cccagcagct ggggctggag aaagatgtgg tccgggtgtg gttctgtaat 840 cggagacaga agggaaaaag gagctcctct gactatgctc agcgcgagga tttcgaagcc 900 gctggctctc cttttagtgg cgggccagtg agtttccccc tggcacctgg gccacacttt 960 ggaactcctg gatacggctc accacatttc accgccctgt atagttcagt gcccttccct 1020 gagggagaag cttttcctcc agtgtctgtc actaccctgg gctcaccaat gcatagcaac 1080 tga 1083 <210> 62 <211> 954 <212> DNA <213> Artificial Sequence <220> <223> codon optimized human SOX gene <400> 62 atgtataata tgatggaaac cgaactgaag ccacctggac cacagcagac aagcggggga 60 ggggggggaa actcaacagc agcagcagcc ggcgggaacc agaagaatag tccagacaga 120 gtgaaaaggc ccatgaacgc attcatggtc tggtcccgag gccagcggag aaagatggcc 180 caggagaacc ccaaaatgca caatagtgaa atctcaaagc ggctgggggc cgagtggaaa 240 ctgctgagcg agactgaaaa gagacctttt attgacgaag caaaacgact gcgggccctg 300 cacatgaagg agcatcctga ttacaaatat cgcccaaggc gcaagaccaa aacactgatg 360 aagaaagaca agtacaccct gcccggagga ctgctggctc ctgggggaaa cagcatggca 420 tccggagtgg gagtcggagc tggactggga gcaggagtga atcagaggat ggactcatat 480 gcccacatga acgggtggag caatggaagt tactcaatga tgcaggatca gctgggctat 540 ccccagcacc ctggactgaa cgctcatggc gccgctcaga tgcagcctat gcatcgctac 600 gatgtgtctg cactgcagta taacagtatg actagctccc agacctacat gaatggctct 660 cctacctaca gcatgtccta ttctcagcag ggcacaccag ggatggccct gggatctatg 720 ggcagtgtgg tcaagtccga agcttctagt tcaccccctg tggtcacaag ctcctctcac 780 tcccgcgccc catgccaggc tggggacctg cgagatatga tctctatgta cctgccagga 840 gcagaggtgc cagaaccagc agcaccctca agactgcaca tgagccagca ttatcagtcc 900 ggccctgtcc cagggacagc tattaatggc actctgcccc tgagccatat gtga 954 <210> 63 <211> 1320 <212> DNA <213> Artificial Sequence <220> <223> codon optimized human c-Myc gene <400> 63 atgcccctga atgtgagctt tactaacaga aactacgacc tggactacga cagcgtgcag 60 ccctattttt attgtgacga agaagagaac ttctaccagc agcagcagca gagcgagctg 120 cagccacctg caccttccga ggacatttgg aagaaatttg aactgctgcc tacaccaccc 180 ctgtctccaa gtcggagaag cggcctgtgc tcacccagct atgtggccgt cactcctttc 240 agcctgcgag gggacaatga tggaggagga ggatcctttt ctacagccga tcagctggag 300 atggtgactg aactgctggg gggagacatg gtcaaccaga gcttcatttg cgatccagac 360 gatgagactt ttatcaagaa tatcatcatc caggactgta tgtggtcagg cttcagcgcc 420 gctgcaaagc tggtgtctga aaaactggca agttaccagg ccgctcgcaa agatagtggg 480 tcacctaacc cagccagagg ccactccgtg tgctctacaa gctccctgta cctgcaggac 540 ctgagcgcag ccgcttccga gtgtattgat ccctccgtgg tcttccccta tcctctgaat 600 gactctagtt cacccaagag ttgtgcatca caggacagct ccgccttttc accttctagt 660 gatagcctgc tgtcaagcac tgagtcctct ccacagggca gcccagaacc cctggtgctg 720 catgaggaaa cccctccaac cacaagttca gattccgagg aggagcagga ggacgaagag 780 gaaatcgatg tggtctctgt ggagaagcgg caggctccag gaaaaagaag cgaatccgga 840 tctccaagtg caggaggaca ctccaagcca cctcattctc ccctggtgct gaaaaggtgc 900 cacgtctcca cccaccagca taactacgca gccccaccct ctacaagaaa ggactatccc 960 gctgcaaaga gggtgaaact ggatagcgtg cgcgtcctgc gacagatcag taacaatagg 1020 aagtgtactt cacctcgcag ctccgacacc gaggaaaacg tgaaaaggcg cacccataat 1080 gtcctggagc gccagcgacg gaatgaactg aagcgatcct tctttgccct gcgggatcag 1140 attcctgagc tggaaaacaa tgagaaggct ccaaaagtgg tcattctgaa gaaagccaca 1200 gcttatatcc tgtctgtgca ggccgaggaa cagaagctga tcagtgagga agacctgctg 1260 cggaaaagaa gggagcagct gaagcacaaa ctggaacagc tgagaaacag ctgcgcctga 1320 <210> 64 <211> 5040 <212> DNA <213> Artificial Sequence <220> <223> codon optimized human BRG1 gene <400> 64 atgagcaccc cagaccctcc tctgggcggc acacctagac caggcccaag ccctggacca 60 gggccaagcc ccggcgctat gctgggacca tcccccggac ctagccccgg ctccgcacat 120 tctatgatgg gacctagtcc tggaccaccc tcagcaggac acccaatccc aacacaggga 180 ccagggggct acccacagga taatatgcac cagatgcata agccaatgga gtcaatgcac 240 gaaaaaggca tgagcgacga tcccaggtat aaccagatga agggcatggg aatgagatcc 300 ggagggcacg caggaatggg ccctccaccc tctcctatgg accagcatag ccagggatac 360 ccttccccac tgggcggatc tgagcacgct agctccccag tgcctgcaag cggaccttct 420 agtggcccac agatgtcaag cggccccggc ggcgcccctc tggatggagc tgacccacag 480 gcactggggc agcagaacag aggcccaacc cccttcaatc agaaccagct gcaccagctg 540 cgcgcccaga tcatggctta caagatgctg gcaaggggcc agcctctgcc agaccatctg 600 cagatggcag tccagggcaa gcgaccaatg cctggaatgc agcagcagat gcccacactg 660 cctccaccca gtgtgtcagc cactggacca gggcccggcc ctggaccagg gcccggccct 720 ggaccagggc cggctcctcc aaattattcc agaccacacg gaatgggagg gccaaacatg 780 ccccctccag ggccatctgg agtgccccct ggaatgcctg ggcagccacc cggcggacct 840 ccaaagcctt ggccagaggg acctatggcc aacgccgctg caccaacctc tacaccccag 900 aagctgatcc ctccccagcc tacaggcagg cccagtcctg caccacccgc agtccctcca 960 gcagctagcc cagtgatgcc ccctcagact cagagccccg gccagcctgc tcagccagca 1020 cccatggtcc cactgcacca gaagcagagc cgcatcaccc ctattcagaa accacgaggc 1080 ctggatcccg tggagattct gcaggaacgc gagtaccgac tgcaggcccg aattgctcat 1140 aggatccagg aactggagaa tctgcccgga tccctggccg gggatctgag aactaaggcc 1200 accatcgagc tgaaagctct gcggctgctg aactttcaga ggcagctgag acaggaggtg 1260 gtcgtgtgca tgaggagaga caccgcactg gaaacagccc tgaatgcaaa agcctataag 1320 cggtccaaac gccagtctct gcgagaggct aggattacag aaaagctgga gaaacagcag 1380 aagatcgaac aggagaggaa gcggcgccag aaacaccagg agtacctgaa cagtattctg 1440 cagcacgcca aagacttcaa ggaatatcat agatcagtca ccggcaaaat ccagaagctg 1500 acaaaagctg tggcaactta ccatgctaat accgaacggg agcagaagaa agaaaacgag 1560 cgcattgaaa aggagcgaat gcgaaggctg atggccgagg atgaggaagg ctatcggaag 1620 ctgatcgatc agaagaaaga caaacgcctg gcatacctgc tgcagcagac tgacgagtat 1680 gtcgccaacc tgaccgaact ggtgagacag cacaaggcag cccaggtggc taaggagaag 1740 aaaaagaaaa agaaaaagaa aaaggcagaa aatgcagagg gacagacccc agcaatcgga 1800 cctgatggag agccactgga cgaaacaagt cagatgtcag atctgcccgt caaagtgatc 1860 cacgtggagt ccggaaaaat cctgactggg accgacgctc ctaaggcagg gcagctggag 1920 gcttggctgg aaatgaaccc tggctacgag gtggcaccac gcagcgactc cgaggaatct 1980 ggcagtgagg aagaagagga ggaagaggaa gaggaacagc cacaggctgc acagccaccc 2040 acactgcctg tcgaggagaa gaagaagatc cctgatccag acagtgacga tgtctcagag 2100 gtggatgcaa ggcacatcat tgaaaatgcc aagcaggacg tggacgatga gtatggagtg 2160 tctcaggccc tggctagagg gctgcagagt tactatgcag tcgcccatgc tgtgaccgag 2220 cgggtcgata agcagagcgc cctgatggtc aatggcgtgc tgaagcagta ccagatcaag 2280 ggactggagt ggctggtgtc cctgtataac aataacctga acggcatcct ggctgacgaa 2340 atgggcctgg gaaaaacaat ccagactatt gcactgatca cctacctgat ggagcacaag 2400 agaatcaatg gaccctttct gatcattgtg cctctgagca cactgtccaa ctgggcttac 2460 gagttcgaca agtgggcacc ctccgtcgtg aaggtgagct ataaaggatc cccagccgct 2520 agacgggctt ttgtccccca gctgcggtct gggaagttca acgtgctgct gaccacatac 2580 gagtacatca ttaaggataa gcatattctg gccaagatcc gctggaaata catgatcgtg 2640 gacgagggac acaggatgaa gaatcaccat tgcaaactga cacaggtcct gaacactcat 2700 tatgtggcac ctcgccgact gctgctgaca gggactccac tgcagaataa gctgcccgag 2760 ctgtgggccc tgctgaactt tctgctgcca actattttca agtcatgtag caccttcgag 2820 cagtggttta atgccccctt cgctatgaca ggcgaaaagg tggatctgaa cgaggaagag 2880 actatcctga tcattaggag actgcacaag gtcctgcggc cctttctgct gcggcgcctg 2940 aagaaagaag tggaggccca gctgcctgaa aaggtcgagt acgtgatcaa atgcgacatg 3000 tctgccctgc agagagtcct gtatcggcat atgcaggcta aaggggtgct gctgacagat 3060 ggcagcgaga aggacaagaa aggcaagggc ggcaccaaaa cactgatgaa tactattatg 3120 cagctgcgca agatctgtaa ccacccatac atgttccagc atattgaaga gtccttttct 3180 gagcacctgg gcttcactgg agggatcgtg cagggactgg atctgtatag ggcatctggg 3240 aagtttgagc tgctggacag gattctgccc aagctgagag ccaccaacca taaagtgctg 3300 ctgttctgcc agatgacttc cctgatgacc atcatggagg attactttgc ctatcggggc 3360 ttcaagtacc tgcgcctgga tggaactacc aaagctgagg accgcgggat gctgctgaag 3420 accttcaacg agcctggctc cgaatatttc atttttctgc tgtctactag ggccggcgga 3480 ctgggactga atctgcagtc agctgacacc gtgatcattt tcgatagcga ctggaaccct 3540 caccaggatc tgcaggctca ggacagagca catcggatcg gccagcagaa tgaggtccgc 3600 gtgctgcgac tgtgcaccgt caacagcgtg gaagagaaga ttctggcagc cgctaagtac 3660 aaactgaacg tggatcagaa agtcatccag gccggaatgt ttgaccagaa gtcctctagt 3720 cacgagcgaa gggccttcct gcaggctatc ctggagcacg aggagcagga cgaatctcgc 3780 cattgtagta ccgggagtgg ctcagcaagc ttcgcacata cagctcctcc acccgcagga 3840 gtgaatcctg acctggagga gcctcccctg aaggaagagg acgaggtccc agacgatgaa 3900 accgtgaacc agatgatcgc tcgacacgaa gaggaattcg atctgtttat gcggatggat 3960 ctggacagac ggcgcgagga agcccggaat cccaagagga aacctagact gatggaggaa 4020 gacgagctgc ccagctggat cattaaggac gatgccgaag tggagcgcct gacctgcgag 4080 gaagaggaag agaaaatgtt cggaagggga tcccggcacc gaaaggaggt ggattactcc 4140 gactctctga cagaaaaaca gtggctgaag aaaattacag gaaaggatat ccatgacact 4200 gcatcaagcg tggcccgagg actgcagttt cagagggggc tgcagttctg tactcgcgca 4260 agcaaggcca ttgaagaggg gaccctggaa gagatcgaag aggaagtgag gcagaagaaa 4320 tcctctcgaa agaggaaaag agattccgac gccggcagtt caacccctac aacttctaca 4380 cggagtcgcg acaaggacga tgagagcaag aagcagaaga aacgaggaag gccccctgct 4440 gaaaagctga gcccaaatcc acccaacctg accaagaaaa tgaagaaaat tgtcgatgcc 4500 gtgatcaagt acaaagacag ctcctctggc cgccagctga gtgaggtgtt tattcagctg 4560 ccttcaagaa aagaactgcc agagtactat gaactgatcc ggaagcctgt ggatttcaag 4620 aaaattaagg agagaatccg gaatcacaaa tacaggtccc tgaacgatct ggaaaaggac 4680 gtgatgctgc tgtgtcagaa tgcccagact tttaacctgg aggggtctct gatctacgaa 4740 gacagtatcg tgctgcagtc agtcttcacc agcgtgagac agaagattga aaaagaggac 4800 gatagtgagg gcgaggaatc agaggaagag gaagagggcg aagaggaagg aagtgaatca 4860 gagagccggt ccgtcaaggt gaaaatcaag ctggggagaa aagagaaggc tcaggaccgg 4920 ctgaaagggg gccgaaggag accttcacgg ggcagccgcg caaagccagt cgtgtccgac 4980 gatgactctg aggaggagca ggaagaggat aggtctggca gtggatcaga agaggactga 5040 <210> 65 <211> 3318 <212> DNA <213> Artificial Sequence <220> <223> codon optimized human BAF155 gene <400> 65 atggcagctg cagccggcgg agggggcccc ggcacagccg tgggagctac tggatccgga 60 atcgctgcag cagctgcagg actggctgtg taccggagaa aagacggagg gcctgcaaca 120 aagttctggg aatctccaga gactgtgtcc cagctggact ctgtgcgggt ctggctgggg 180 aaacactaca agaaatatgt gcatgcagat gcccctacaa acaagactct ggctggcctg 240 gtggtccagc tgctgcagtt ccaggaggat gcatttggaa agcacgtgac caatccagct 300 tttacaaaac tgcccgcaaa gtgcttcatg gactttaagg caggcggagc cctgtgtcat 360 atcctgggag ccgcttacaa atacaagaac gagcagggat ggcgacgatt cgacctgcag 420 aatccctcca ggatggatag aaacgtggaa atgttcatga acatcgagaa gaccctggtc 480 cagaacaatt gcctgacacg gcctaacatc tacctgatcc cagacattga tctgaaactg 540 gccaacaagc tgaaggacat cattaagcgc caccagggaa ccttcacaga tgagaaaagt 600 aaagcttcac accatatcta cccttatagc tcctctcagg acgatgagga atggctgcgg 660 ccagtgatgc gcaaagagaa gcaggtgctg gtccactggg gcttttaccc cgactcctat 720 gatacctggg tccattctaa cgacgtggat gccgaaatcg aggatccccc tattccagag 780 aaaccctgga aggtgcacgt caagtggatc ctggacactg atattttcaa cgagtggatg 840 aatgaggaag actacgaagt cgatgagaac cggaaacctg tgtcatttcg gcagcgcatc 900 agcacaaaga atgaggaacc tgtgcgatct ccagagcgaa gggacaggaa ggctagtgca 960 aacgcccgaa aaaggaagca tagcccatcc ccaccccctc caactcctac cgagagtcgc 1020 aagaaatcag gaaagaaagg gcaggccagt ctgtatggca aaagacggtc acagaaggag 1080 gaagacgaac aggaggatct gacaaaggac atggaggatc ctactccagt gcccaacatt 1140 gaggaagtgg tcctgcccaa gaacgtcaat ctgaagaaag actctgaaaa tactcctgtc 1200 aagggcggca ccgtggcaga cctggatgag caggatgagg aaacagtgac tgcaggaggg 1260 aaagaagacg aggatccagc caagggggac cagtctagga gtgtggacct gggcgaagat 1320 aacgtgaccg agcagacaaa tcacatcatt atccccagct acgcctcctg gttcgactat 1380 aactgcatcc atgtgattga acgccgagct ctgccagagt tctttaacgg caaaaataag 1440 agcaaaacac ccgagatcta cctggcctat cgcaacttta tgattgatac ttaccgactg 1500 aatcctcagg agtatctgac cagcacagct tgcaggagaa acctgaccgg agacgtgtgt 1560 gccgtcatga gggtgcacgc tttcctggaa cagtgggggc tggtcaacta ccaggtggat 1620 cccgagagca gacctatggc catgggccct cctcccactc cacactttaa tgtcctggct 1680 gacaccccat caggactggt gcccctgcat ctgagaagcc ctcaggtccc agcagcccag 1740 cagatgctga acttcccaga gaagaacaag gagaagcccg tggacctgca gaactttggc 1800 ctgcgaaccg atatctacag caagaaaaca ctggccaaaa gcaagggagc ttccgcagga 1860 cgagagtgga ctgaacagga gaccctgctg ctgctggaag ccctggagat gtataaagac 1920 gattggaata aggtctctga acacgtgggc agtaggaccc aggatgagtg tatcctgcat 1980 ttcctgagac tgccaattga agacccctac ctggagaact ctgatgcaag tctgggacct 2040 ctggcctatc agcctgtgcc attctcacag agcgggaatc cagtcatgag cacagtggct 2100 tttctggcat ccgtggtgga ccccagagtg gcatccgctg cagcaaaggc tgcactggag 2160 gaattctcta gagtccggga ggaagtgccc ctggaactgg tggaggcaca cgtcaagaaa 2220 gtgcaggagg cagctcgcgc cagcggaaag gtggacccta catacgggct ggagagttca 2280 tgcatcgccg gaactgggcc cgatgaacct gagaaactgg aaggggccga ggaagagaag 2340 atggaggctg accctgatgg ccagcagcca gaaaaagccg agaacaaggt ggaaaatgag 2400 accgacgagg gggataaggc tcaggatggc gaaaacgaga aaaatagcga aaaggagcag 2460 gactcagaag tgagcgagga tactaaatcc gaagagaagg aaaccgaaga gaacaaagag 2520 ctgactgaca cctgtaagga aagggagagt gatacaggca agaaaaaggt cgaacacgag 2580 atctcagagg gaaatgtcgc aaccgcagca gctgcagcac tggcttctgc tgcaacaaaa 2640 gcaaagcatc tggccgctgt ggaagagaga aaaattaaga gtctggtcgc cctgctggtg 2700 gaaacccaga tgaaaaagct ggagatcaag ctgcggcact tcgaggagct ggagacaatt 2760 atggaccgcg aaaaggaggc cctggaacag cagagacagc agctgctgac cgagcggcag 2820 aactttcaca tggaacagct gaagtacgcc gagctgcgcg ctcgacagca gatggagcag 2880 cagcagcatg ggcagaatcc acagcaggca caccagcatt ccggcggacc tggcctggct 2940 ccactgggcg cagcaggaca ccccggcatg atgcctcatc agcagccccc tccatatcct 3000 ctgatgcacc atcagatgcc ccctccccac cctccccagc caggccagat ccccggccct 3060 ggatctatga tgcctggcca gcacatgcct ggaaggatga tcccaactgt ggctgcaaac 3120 attcatccat ccggatctgg acctacccct cccggcatgc ctccaatgcc aggaaacatt 3180 ctgggaccaa gagtgccact gaccgcacca aatggcatgt accctccccc tccccagcag 3240 cagcctccac cccctccacc cgctgacggc gtgcctccac cccctgcacc cggaccaccc 3300 gccagcgccg ctccttga 3318 <210> 66 <211> 1431 <212> DNA <213> Artificial Sequence <220> <223> codon optimized human Immunoglobulin G H chain gene <400> 66 atggattgga cttggagatt cctgttcgtc gtcgcagcag caaccggcgt gcagagccag 60 atgcaggtcg tgcagagcgg ggcagaagtg aagaaaccag gcagctccgt cactgtgagt 120 tgcaaggcct caggcgggac cttcagcaac tacgcaatct cctgggtgcg gcaggccccc 180 ggacagggac tggaatggat gggaggcatc attcccctgt tcggaactcc tacctattct 240 cagaattttc agggccgcgt gacaatcact gctgataaga gtacctcaac agcacacatg 300 gagctgattt ctctgcgaag tgaagacact gctgtgtact attgcgcaac cgaccggtac 360 agacaggcca acttcgatag ggctcgcgtg gggtggtttg acccttgggg gcagggaacc 420 ctggtcacag tgtctagtgc atctaccaag ggaccaagtg tgtttccact ggccccctca 480 agcaaaagca cttccggagg aaccgcagct ctgggatgtc tggtgaagga ttatttccca 540 gagcccgtca cagtgtcatg gaacagcgga gcactgacca gcggggtcca tacatttccc 600 gctgtgctgc agtcctctgg cctgtactcc ctgagttcag tggtcaccgt ccctagctcc 660 tctctgggga ctcagaccta tatctgcaac gtgaatcaca agccttctaa tacaaaagtg 720 gacaagaagg tggaaccaaa gagttgtgac aaaacacata cttgcccccc ttgtcctgca 780 ccagagctgc tgggaggacc aagcgtgttc ctgtttccac ccaagcccaa agataccctg 840 atgattagca ggacaccaga agtcacttgc gtggtcgtgg acgtgtccca cgaggatccc 900 gaagtcaagt tcaactggta cgtggacggc gtcgaggtgc ataatgctaa gaccaaaccc 960 agagaggagc agtacaattc aacctatcgg gtcgtgagcg tcctgacagt gctgcaccag 1020 gattggctga acggcaaaga gtataagtgc aaagtgtcta ataaggcact gcccgcccct 1080 atcgagaaaa caattagcaa ggctaaaggg cagcctagag aaccacaggt gtataccctg 1140 cctccaagca gggatgagct gacaaagaac caggtctccc tgacttgtct ggtgaaaggg 1200 ttctatccca gtgacattgc agtggagtgg gaatcaaatg gacagcctga aaacaattac 1260 aagaccacac cccctgtgct ggactccgat ggatctttct ttctgtattc caagctgact 1320 gtggacaaat ctcggtggca gcagggcaac gtcttttctt gtagtgtgat gcatgaggcc 1380 ctgcacaatc attacacaca gaagtcactg agcctgtccc ccggcaaatg a 1431 <210> 67 <211> 708 <212> DNA <213> Artificial Sequence <220> <223> codon optimized human Immunoglobulin G L chain gene <400> 67 atggcttggg cactgctgct gctgacactg ctgacacagg atactgggtc ttgggcacag 60 agcgcactga cacagcctgc ttccgtgtcc ggctctcctg ggcagtctat caccattagt 120 tgcaccggga caaacaatga cgtgggaagt tacaacctgg tctcatggta tcagcagcac 180 ccaggcaagg cccccaaaat catgatctac gaggtgtcca agcggccaag tggggtctca 240 aaccggttca gcggatcaaa aagcggcaat acagcctcac tgactatcag cggactgcag 300 gcagaggacg aagccgatta ctattgctgt tcctacgctg gctcttatac agtggtcttc 360 ggcgggggaa ctaagctgac cgtgctgggg cagcctaaag ccgctccatc tgtgactctg 420 tttcccccta gctccgagga actgcaggct aataaggcaa ccctggtgtg tctgattagc 480 gacttctacc ccggagctgt gacagtcgcc tggaaggctg attctagtcc cgtgaaagca 540 ggggtcgaga ccacaactcc tagcaagcag tccaacaaca agtacgcagc ctcaagctat 600 ctgtccctga ctccagaaca gtggaagtct cacaggtcct attcttgcca ggtgacccat 660 gagggcagta ccgtggaaaa aacagtcgcc cccactgaat gttcctga 708 <210> 68 <211> 1773 <212> DNA <213> Artificial Sequence <220> <223> codon optimized human Immunoglobulin M H chain gene <400> 68 atggaactgg gcctgagatg ggtctttctg gtcgctatcc tggagggagt gcagtgtgaa 60 gtgcagctgg tcgagtctgg cgggggactg gtgaaaccag gcggatctct gcgactgagt 120 tgcgcagctt caggcttcac cttcagcact tactcaatga actgggtccg acaggccccc 180 ggcaagggac tggaatgggt gagctccatc tctagttcaa gctcctacat ctactatgct 240 gacagcgtga aagggcgatt cactatctct cgggataacg caaagaatag tctgtatctg 300 cagatgaatt cactgagagc cgaggacaca gctgtctact attgtgccag ggatctgctg 360 attgctgtgg caggacactg gggacagggg accctggtga cagtctctag tggcagcgcc 420 tccgctccaa ctctgttccc cctggtgtcc tgcgaaaact ctcctagtga cacctcaagc 480 gtggcagtcg gatgtctggc ccaggacttc ctgccagata gcatcacatt ttcctggaag 540 tacaaaaaca acagtgatat ttcctctact cgcggctttc cctctgtgct gcgaggaggc 600 aaatatgcag ccaccagtca ggtcctgctg ccttcaaagg acgtgatgca ggggacagat 660 gagcacgtgg tctgcaaagt gcagcatccc aacggaaata aggagaagaa cgtcccactg 720 cccgtgatcg ctgagctgcc acctaaggtg agcgtcttcg tgccacccag agacgggttc 780 tttggaaatc ccagaaagag caaactgatc tgtcaggcca ccggctttag ccctaggcag 840 attcaggtgt cctggctgcg cgaagggaag caggtcggat ccggcgtgac cacagatcag 900 gtccaggcag aagccaagga gtctgggccc actacctaca aagtgacctc tacactgact 960 atcaaggaga gtgactggct gtcacagagc atgttcacct gccgggtgga tcatagagga 1020 ctgacatttc agcagaatgc cagttcaatg tgtgtccctg accaggatac cgctatcagg 1080 gtgttcgcaa ttcctccaag cttcgcttcc atttttctga ctaagtccac caaactgaca 1140 tgcctggtca ccgacctgac aacttatgat tctgtgacca tcagttggac acgccagaac 1200 ggcgaagccg tgaagaccca cacaaacatt tccgagtctc atcccaatgc aaccttcagc 1260 gccgtgggcg aagcttccat ctgcgaggac gattggaata gcggggagcg gtttacttgt 1320 accgtgacac acactgacct gccttcacca ctgaagcaga ccattagccg acctaaaggc 1380 gtcgccctgc atcggccaga tgtgtacctg ctgccccctg caagagaaca gctgaacctg 1440 agggagagcg ccaccatcac atgtctggtg accggattca gccctgcaga cgtctttgtg 1500 cagtggatgc agcgaggaca gccactgtcc cctgaaaagt acgtgacatc tgcaccaatg 1560 cctgagccac aggccccagg cagatatttt gctcactcca ttctgacagt gtctgaggaa 1620 gagtggaaca ctggggagac ttatacctgc gtggtcgctc atgaagcact gccaaatagg 1680 gtcactgagc gcaccgtgga caagagcact gggaaaccca ccctgtataa cgtctcactg 1740 gtcatgagcg atacagccgg aacttgttat tga 1773 <210> 69 <211> 711 <212> DNA <213> Artificial Sequence <220> <223> codon optimized human Immunoglobulin M L chain gene <400> 69 atggacatgc gagtgcctgc tcagctgctg ggactgctgc tgctgtggct gcccgataca 60 agatgcgaca ttcagatgac tcagagccca agctccctga gtgcctcagt gggagaccgg 120 gtcaccatca catgcagagc ttcacagggc attagcaact acctggcatg gtatcagcag 180 aagccaggca aagtgcccaa gctgctgatc tacgcagctt ccaccctgca gtctggggtg 240 cccagtcgat tcagcggatc cggatctgga acagacttta ctctgaccat ttctagtctg 300 cagcctgagg atgtggctac ttactattgc cagaaataca attctgcacc atataccttc 360 ggccagggga caaaactgga gatcaagagg acagtggcag ccccctctgt cttcattttt 420 ccccctagcg acgaacagct gaagtccggc accgcttccg tggtctgtct gctgaacaat 480 ttttaccctc gcgaagccaa agtgcagtgg aaggtcgata acgctctgca gagtggcaat 540 tcacaggaga gcgtgactga acaggactcc aaagattcta cctatagtct gtcaagcaca 600 ctgactctga gcaaggcaga ttacgagaag cacaaactgt atgcctgcga agtgacacat 660 caggggctgt cctctcctgt cactaagtcc ttcaacagag gagagtgttg a 711 <210> 70 <211> 480 <212> DNA <213> Artificial Sequence <220> <223> codon optimized human Immunoglobulin M J chain gene <400> 70 atgaagaacc atctgctgtt ttggggagtg ctggctgtgt ttatcaaggc tgtccatgtg 60 aaggctcagg aagacgagag aattgtgctg gtggacaaca agtgcaaatg tgctagaatc 120 acctccagga tcattcgcag ctccgaggac cctaacgaag acatcgtgga gcgaaatatt 180 cggatcattg tcccactgaa caatcgcgaa aatatttctg atcccaccag tcctctgcgg 240 acaagattcg tgtaccacct gagtgacctg tgcaagaaat gtgatcccac agaggtggaa 300 ctggacaacc agatcgtcac cgcaacacag tcaaatattt gcgacgaaga tagcgccact 360 gagacctgct acacttatga taggaacaag tgttacaccg cagtggtccc tctggtgtat 420 ggaggagaaa ctaaaatggt cgagacagcc ctgactccag acgcttgtta tcccgattga 480 <210> 71 <211> 7056 <212> DNA <213> Artificial Sequence <220> <223> codon optimized human coagulation factor VIII gene <400> 71 atgcagattg aactgtccac ctgtttcttc ctgtgcctgc tgagattttg tttttccgct 60 actcgcagat actacctggg ggctgtggaa ctgtcttggg attacatgca gagtgacctg 120 ggagagctgc cagtggacgc acgatttcca cctcgggtgc caaagtcatt cccctttaac 180 acaagcgtgg tctacaagaa gaccctgttc gtggagttca ccgatcacct gttcaatatc 240 gctaagcccc ggccaccctg gatgggactg ctggggccta ccatccaggc agaggtgtac 300 gacaccgtgg tcattacact gaaaaacatg gcatcacacc cagtgagcct gcatgccgtc 360 ggagtgtctt actggaaggc tagtgagggc gcagaatatg acgatcagac ctctcagaga 420 gagaaggaag acgataaagt gtttcccggc gggagccata catatgtctg gcaggtgctg 480 aaggagaacg gcccaatggc tagcgacccc ctgtgcctga cctactcata tctgagccac 540 gtggacctgg tgaaggatct gaatagcgga ctgatcggcg ccctgctggt gtgcagggag 600 ggatccctgg ctaaagaaaa gacacagact ctgcataagt tcattctgct gttcgccgtg 660 tttgacgagg ggaaatcctg gcactctgaa accaagaact cactgatgca ggaccgagat 720 gcagctagcg cacgagcctg gcccaaaatg cacacagtca acggctacgt gaatagatca 780 ctgcctgggc tgatcggatg ccacaggaag tctgtctatt ggcatgtgat cgggatggga 840 accacaccag aggtccacag cattttcctg gaagggcata cctttctggt gcgcaaccac 900 cgacaggctt ccctggagat ctctcccatt acattcctga ctgcacagac cctgctgatg 960 gatctgggcc agttcctgct gttttgccac atcagctccc accagcatga tgggatggag 1020 gcttacgtca aagtggactc ctgtcctgag gaaccacagc tgcggatgaa gaacaatgag 1080 gaagccgaag actatgacga tgacctgaca gactctgaga tggatgtggt caggttcgat 1140 gacgataaca gcccctcctt tatccagatt cgcagcgtcg ccaagaaaca ccctaagacc 1200 tgggtgcatt acatcgcagc cgaggaagag gactgggatt atgctcctct ggtgctggca 1260 ccagacgata gaagttacaa atcacagtat ctgaacaatg gccctcagcg gattgggaga 1320 aagtacaaga aagtgcgatt catggcatac acagatgaaa cttttaagac cagagaggcc 1380 atccagcacg aaagcggcat tctggggcca ctgctgtacg gagaagtggg cgacactctg 1440 ctgatcatct tcaagaacca ggccagccgg ccctacaata tctatcctca tggaattacc 1500 gatgtcagac cactgtactc ccggagactg cccaaaggag tgaagcacct gaaagacttc 1560 cccatcctgc ctggcgaaat cttcaagtat aagtggaccg tcacagtgga ggatggccca 1620 actaagtccg accccagatg cctgaccagg tactattcta gtttcgtgaa catggaaagg 1680 gatctggcct ctgggctgat cggaccactg ctgatttgtt acaaagagag tgtggatcag 1740 aggggcaacc agatcatgtc agacaagcgc aatgtcattc tgttcagcgt gtttgacgag 1800 aatcgctcct ggtatctgac cgaaaacatc cagcgattcc tgccaaatcc cgctggcgtg 1860 cagctggagg atcccgaatt tcaggcatca aacatcatgc atagcattaa tggctacgtg 1920 ttcgacagtc tgcagctgtc agtctgcctg cacgaggtgg cttactggta tatcctgagc 1980 attggggcac agacagattt cctgagcgtc ttcttttccg gatacacttt taaacataag 2040 atggtgtacg aggacactct gaccctgttc ccattttctg gcgagaccgt gtttatgagt 2100 atggaaaacc ccggactgtg gatcctgggc tgccacaact ccgatttcag gaatcgcgga 2160 atgactgccc tgctgaaagt gtcaagctgt gacaagaata ccggcgacta ctatgaggat 2220 tcctacgaag acatctctgc ttatctgctg agtaaaaaca atgcaattga gccacgctct 2280 tttagtcaga actctaggca ccccagtacc cgccagaagc agttcaacgc cactaccatc 2340 cctgagaatg atattgaaaa aacagaccca tggtttgctc atcggactcc tatgccaaag 2400 atccagaacg tgagcagcag cgatctgctg atgctgctga gacagagccc cactcctcac 2460 gggctgtcac tgagcgacct gcaggaggca aagtacgaaa ccttctcaga cgatccaagc 2520 cccggagcca tcgattccaa caattccctg tctgagatga cccacttccg gccacagctg 2580 caccattccg gggacatggt gtttacaccc gagtctggac tgcagctgag actgaacgaa 2640 aaactgggca caactgctgc aacagagctg aagaaactgg actttaaggt gtcaagcact 2700 agcaacaatc tgatctccac cattccctct gataacctgg ccgctgggac agacaatact 2760 tcctctctgg gacctccatc aatgcctgtg cactacgata gccagctgga caccacactg 2820 ttcggcaaga aaagttcacc tctgaccgag tctggaggcc cactgagtct gtcagaagag 2880 aacaatgatt caaaactgct ggagagcgga ctgatgaact cccaggaaag ctcctggggc 2940 aagaacgtga gcagcaccga gtccgggcgg ctgtttaaag gaaagagagc ccatggccct 3000 gctctgctga ctaaagacaa cgctctgttc aaggtgagca tctccctgct gaagaccaac 3060 aaaacaagca acaattccgc aactaatcgg aagacccaca tcgatggccc atccctgctg 3120 attgagaact ctcccagtgt ctggcagaat atcctggagt ctgacacaga gttcaagaag 3180 gtcactccac tgattcatga tcggatgctg atggacaaga atgctaccgc actgagactg 3240 aaccacatga gcaataagac tacctcaagc aaaaacatgg agatggtgca gcagaagaaa 3300 gaaggaccta tcccccctga tgcacagaat ccagacatga gcttctttaa aatgctgttc 3360 ctgcctgagt ccgcccgctg gattcagcga acacacggca agaactctct gaatagtggc 3420 caggggcctt ccccaaaaca gctggtctct ctgggcccag agaagagtgt ggaagggcag 3480 aactttctgt ccgagaaaaa taaggtggtc gtgggaaagg gcgaattcac caaagatgtc 3540 ggcctgaagg agatggtgtt cccctcctct aggaatctgt ttctgactaa cctggacaat 3600 ctgcacgaga acaataccca taaccaggaa aagaaaatcc aggaagagat tgagaagaaa 3660 gaaacactga tccaggagaa cgtcgtgctg ccccagattc acacagtgac tggcaccaag 3720 aacttcatga aaaatctgtt tctgctgtct acccgccaga atgtcgaggg cagttacgac 3780 ggggcctatg ctcctgtgct gcaggatttt cgcagtctga acgactcaac taatcgaacc 3840 aagaaacaca ccgcccattt cagcaagaaa ggggaagagg aaaacctgga agggctggga 3900 aatcagacaa aacagatcgt ggagaagtac gcttgcacaa ctagaattag cccaaacaca 3960 tcccagcaga atttcgtgac tcagaggagc aagcgcgccc tgaaacagtt taggctgccc 4020 ctggaggaaa ctgagctgga aaagcgcatc attgtggacg atacatctac tcagtggagc 4080 aagaacatga agcatctgac cccctccacc ctgacacaga tcgattataa cgagaaagaa 4140 aagggcgcca ttacccagtc acctctgagc gactgtctga cacgatcaca cagcatccca 4200 caggccaacc ggtctcccct gcctattgct aaggtgagtt cattccctag catcaggcca 4260 atctacctga cccgcgtgct gtttcaggat aatagctccc atctgcctgc agcctcatat 4320 aggaagaaag acagcggggt gcaggagtct agtcacttcc tgcagggagc aaagaaaaac 4380 aatctgtccc tggccatcct gacactggag atgactgggg atcagcgcga agtcggctca 4440 ctggggacaa gcgccactaa ctccgtgacc tacaagaaag tcgaaaatac agtgctgcca 4500 aagcccgacc tgcctaagac atctggaaaa gtcgagctgc tgccaaaagt gcatatctat 4560 cagaaggatc tgtttcccac tgaaacctcc aacggatctc ctggccacct ggacctggtg 4620 gagggaagcc tgctgcaggg gaccgaggga gcaatcaaat ggaacgaagc caatcggccc 4680 ggcaaggtcc ctttcctgag agtggccacc gagtcaagcg ccaagacacc ctccaaactg 4740 ctggatcctc tggcttggga caatcattac ggcacccaga tcccaaagga ggaatggaaa 4800 tctcaggaga agagtcccga aaaaactgcc ttcaagaaaa aggacaccat tctgtccctg 4860 aacgcttgcg aatctaatca cgcaatcgct gcaattaacg aggggcagaa caagcccgag 4920 atcgaagtga catgggccaa gcagggacga actgagcggc tgtgcagcca gaacccaccc 4980 gtgctgaaga gacatcagag ggagattaca aggaccacac tgcagtccga tcaggaggaa 5040 atcgactacg acgatactat ttctgtggag atgaaaaagg aagacttcga tatctatgac 5100 gaggatgaaa atcagagtcc tagatcattc cagaaaaaga ccaggcatta ctttattgcc 5160 gctgtggagc gcctgtggga ttatgggatg tcctctagtc ctcacgtcct gcgaaaccgg 5220 gcccagtccg gatctgtgcc acagttcaaa aaggtcgtgt tccaggagtt tactgacggc 5280 agctttaccc agccactgta ccggggggag ctgaatgaac acctgggact gctgggacca 5340 tatatccgag ctgaggtcga agataacatt atggtgacat tccgaaatca ggcatcacgg 5400 ccctacagct tttattcaag cctgatctcc tacgaggaag accagcgaca gggcgctgaa 5460 ccccggaaga acttcgtcaa gcctaacgag acaaagactt acttctggaa ggtgcagcac 5520 catatggccc ctaccaaaga cgaattcgat tgcaaggcat gggcctattt ttctgacgtg 5580 gacctggaga aggacgtgca cagtggactg atcggccctc tgctggtgtg ccataccaac 5640 acactgaatc cagcacacgg ccggcaggtc acagtgcagg aattcgctct gttctttaca 5700 atctttgatg agactaagag ctggtacttc actgagaaca tggaacgcaa ttgccgagcc 5760 ccatgtaaca ttcagatgga ggaccccact ttcaaggaaa actacagatt tcacgccatc 5820 aatggctata ttatggatac cctgcccggc ctggtcatgg ctcaggacca gagaatcagg 5880 tggtatctgc tgagcatggg ctccaacgag aatatccact ccattcattt ctctgggcat 5940 gtctttacag tgcggaaaaa ggaggaatat aaaatggccc tgtataacct gtatcccgga 6000 gtcttcgaga ctgtggaaat gctgccttcc aaggcaggca tctggagagt ggagtgcctg 6060 attggagaac acctgcatgc cggcatgtcc accctgtttc tggtgtactc taacaagtgt 6120 cagacacctc tgggaatggc aagtggccat atcagggatt tccagattac cgcatccgga 6180 cagtacggac agtgggcacc aaagctggcc cgcctgcact atagtgggtc aatcaatgcc 6240 tggagtacca aagagccctt ctcatggatt aaggtggacc tgctggcccc tatgatcatt 6300 cacgggatca aaacacaggg agctaggcag aagttctcct ctctgtatat cagtcagttt 6360 atcatcatgt attcactgga tggaaaaaag tggcagacct accgcgggaa tagcactgga 6420 accctgatgg tcttctttgg gaacgtggac agttcaggaa tcaagcataa cattttcaat 6480 cctccaatca ttgcccggta catcagactg caccccaccc attattctat tcggagtaca 6540 ctgagaatgg aactgatggg ctgcgatctg aacagctgtt ccatgcctct ggggatggag 6600 agtaaggcta tctcagacgc acagattacc gccagctcct atttcaccaa catgtttgcc 6660 acatggtctc ccagtaaagc tagactgcac ctgcagggca gaagcaatgc ctggaggcct 6720 caggtcaaca atccaaagga gtggctgcag gtggattttc agaagaccat gaaagtcaca 6780 ggcgtgacta cccagggggt caaaagcctg ctgacttcca tgtacgtgaa ggagttcctg 6840 atctctagtt cacaggacgg ccaccagtgg accctgttct ttcagaacgg aaaagtcaag 6900 gtgttccagg gcaatcagga tagctttaca cctgtcgtga actccctgga cccccctctg 6960 ctgactaggt atctgcgcat ccatccacag tcctgggtgc atcagattgc tctgcgaatg 7020 gaagtgctgg ggtgcgaagc tcaggacctg tattga 7056 <210> 72 <211> 11058 <212> DNA <213> Artificial Sequence <220> <223> codon optimized human dystrophin gene <400> 72 atgctgtggt gggaagaggt cgaggattgc tacgagagag aagatgtcca gaagaagact 60 tttactaaat gggtcaacgc tcagttctca aaattcggca agcagcatat cgagaacctg 120 tttagcgacc tgcaggatgg gcggagactg ctggacctgc tggagggact gactggccag 180 aaactgccca aagaaaaggg ctctaccaga gtgcacgccc tgaacaatgt caataaggct 240 ctgagggtgc tgcagaacaa taacgtggat ctggtcaata tcgggagcac cgacattgtg 300 gatggaaacc acaagctgac actgggcctg atctggaata tcattctgca ttggcaggtg 360 aaaaatgtca tgaagaacat catggccggc ctgcagcaga caaacagcga gaagattctg 420 ctgtcctggg tgaggcagtc tactcgcaat taccctcaag tgaatgtcat caacttcacc 480 acaagctggt ccgacggact ggccctgaac gctctgattc actcccatcg cccagacctg 540 ttcgattgga attccgtggt ctgccagcag tctgccaccc agaggctgga gcacgccttt 600 aacatcgctc gctatcagct gggcattgag aagctgctgg acccagaaga cgtggatact 660 acctaccccg acaagaagtc catcctgatg tatattacaa gtctgttcca ggtgctgcca 720 cagcaggtca gcatcgaggc cattcaggaa gtggagatgc tgccccggcc ccctaaagtc 780 accaaggagg aacactttca gctgcaccat cagatgcatt acagtcagca gatcaccgtg 840 agcctggctc agggatatga gcgaaccagc tccccaaaac cccggttcaa gtcctacgca 900 tatacacagg ccgcttacgt gacaacttct gacccaacta gatccccttt cccatctcag 960 catctggagg ctcccgaaga caagtctttt ggctctagtc tgatggaaag tgaggtgaac 1020 ctggataggt atcagactgc cctggaggaa gtcctgagtt ggctgctgtc agccgaggat 1080 accctgcagg ctcagggcga gatcagcaac gacgtggaag tggtcaagga tcagttccac 1140 acacatgagg ggtacatgat ggacctgact gcccaccagg ggagagtggg aaatatcctg 1200 cagctggggt caaaactgat tggaaccggc aagctgagcg aggatgagga aacagaggtg 1260 caggaacaga tgaatctgct gaactcccgg tgggagtgcc tgagagtggc cagtatggaa 1320 aagcagtcaa atctgcatag ggtcctgatg gacctgcaga atcagaaact gaaggagctg 1380 aacgattggc tgaccaagac agaggaaagg acccgcaaaa tggaggagga gcccctggga 1440 ccagacctgg aggatctgaa gcggcaggtg cagcagcaca aagtcctgca ggaagacctg 1500 gaacaggagc aggtgagagt caacagcctg acacacatgg tggtcgtggt ggacgagtca 1560 agcggagatc atgctactgc cgccctggag gagcagctga aggtgctggg cgatcgctgg 1620 gcaaatatct gtaggtggac tgaggaccgc tgggtgctgc tgcaggatat tctgctgaag 1680 tggcagcggc tgaccgagga gcagtgcctg ttcagcgcct ggctgtccga aaaagaggac 1740 gcagtgaaca agatccacac cacaggcttt aaggatcaga atgagatgct gtcctctctg 1800 cagaaactgg cagtgctgaa ggccgacctg gagaagaaaa agcagagcat ggggaaactg 1860 tactccctga agcaggatct gctgtctaca ctgaaaaaca agagtgtgac tcagaagacc 1920 gaggcatggc tggacaattt cgccagatgt tgggataacc tggtgcagaa actggagaag 1980 tccaccgcac agatctccca ggccgtgact accacacagc ctagcctgac ccagactacc 2040 gtcatggaga cagtgacaac tgtcaccaca cgcgaacaga ttctggtgaa gcatgcacag 2100 gaggagctgc caccacctcc accacagaaa aagcggcaga tcaccgtgga ctccgagatt 2160 cgaaagcggc tggacgtgga catcactgaa ctgcactctt ggattaccag gagtgaggcc 2220 gtgctgcaga gcccagaatt cgctatcttt cgcaaggagg ggaatttctc cgatctgaaa 2280 gagaaggtga acgctattga aagagagaaa gcagaaaagt ttaggaaact gcaggacgcc 2340 tctcgcagtg ctcaggcact ggtggagcag atggtcaatg aaggagtgaa cgccgattca 2400 atcaagcagg ctagcgagca gctgaactcc aggtggattg aattctgcca gctgctgagc 2460 gagcgcctga actggctgga ataccagaat aacatcattg ccttctacaa tcagctgcag 2520 cagctggaac agatgactac cacagccgag aactggctga aaatccagcc cactacccct 2580 tcagagccaa cagccatcaa gagccagctg aagatttgta aagacgaagt gaatagactg 2640 tctggcctgc agcctcagat tgagaggctg aagatccaga gtattgccct gaaagaaaag 2700 gggcagggac caatgtttct ggacgctgat ttcgtggcct tcaccaacca cttcaagcag 2760 gtcttttccg acgtgcaggc tcgcgaaaaa gagctgcaga caatcttcga tactctgcct 2820 ccaatgcgat accaggagac tatgtctgcc attcggacct gggtgcagca gtctgaaaca 2880 aagctgagta tccctcagct gtcagtcact gactatgaga ttatggaaca gcggctggga 2940 gagctgcagg ctctgcagag ttcactgcag gaacagcagt caggactgta ctatctgagc 3000 acaactgtga aagagatgtc aaaaaaggcc ccatccgaaa tctctcgcaa gtaccagagc 3060 gagtttgaag agattgaagg acgatggaaa aagctgagct cccagctggt ggagcattgt 3120 cagaagctgg aggagcagat gaataagctg cgcaaaatcc agaaccacat tcagacactg 3180 aaaaagtgga tggccgaggt ggacgtgttc ctgaaggaag agtggcctgc tctgggcgat 3240 tctgagatcc tgaaaaagca gctgaagcag tgccggctgc tggtgagtga catccagacc 3300 attcagccaa gtctgaattc agtcaacgag ggcgggcaga aaatcaagaa cgaagctgag 3360 cccgaatttg caagcagact ggagacagaa ctgaaggagc tgaatactca gtgggaccat 3420 atgtgccagc aggtgtacgc caggaaagaa gctctgaagg gaggcctgga gaaaaccgtc 3480 tccctgcaga aggatctgtc tgagatgcac gaatggatga cacaggccga agaggaatac 3540 ctggagcggg acttcgaata taagactcca gatgagctgc agaaagccgt ggaggaaatg 3600 aagagagcaa aagaggaagc ccagcagaag gaggctaaag tgaagctgct gacagaaagc 3660 gtgaactccg tcatcgcaca ggctccacct gtggcacagg aggccctgaa aaaggagctg 3720 gaaactctga ccacaaatta ccagtggctg tgcacccggc tgaacggcaa atgcaagaca 3780 ctggaggaag tgtgggcatg ctggcatgag ctgctgtcct atctggaaaa ggccaacaag 3840 tggctgaacg aggtggaatt caaactgaag actaccgaga acatccccgg cggagccgag 3900 gaaattagcg aggtgctgga ctccctggaa aatctgatgc gccacagcga ggataatcct 3960 aaccagatcc gaattctggc acagactctg accgacggag gcgtgatgga tgaactgatc 4020 aatgaggaac tggagacctt taactccaga tggagggagc tgcatgagga agctgtgagg 4080 cgccagaaac tgctggaaca gtctatccag agtgcacagg agacagaaaa gtccctgcac 4140 ctgatccagg agtctctgac tttcattgac aagcagctgg ctgcatacat tgctgacaaa 4200 gtggatgccg ctcagatgcc ccaggaggca cagaagatcc agtctgatct gaccagtcac 4260 gaaatttcac tggaggaaat gaaaaagcat aaccagggca aggaggcagc ccagagagtc 4320 ctgtcccaga tcgacgtggc acagaaaaag ctgcaggacg tgagcatgaa attccgactg 4380 tttcagaagc cagccaattt cgagctgcgg ctgcaggaaa gcaagatgat cctggacgag 4440 gtgaaaatgc atctgcccgc cctggaaacc aagtcagtcg agcaggaagt ggtccagagc 4500 cagctgaatc actgcgtgaa cctgtataag tcactgagcg aggtcaagtc cgaggtggaa 4560 atggtcatca agaccggaag gcagattgtg cagaaaaagc agacagagaa cccaaaggag 4620 ctggacgaac gcgtgaccgc cctgaaactg cactataatg agctgggcgc taaagtcaca 4680 gagagaaagc agcagctgga aaagtgtctg aaactgagcc ggaagatgag aaaagagatg 4740 aacgtgctga ccgaatggct ggctgcaacc gacatggagc tgacaaagag gtccgccgtg 4800 gaagggatgc ccagcaatct ggattccgag gtcgcttggg gaaaagcaac ccagaaggag 4860 atcgaaaaac agaaggtgca cctgaagtct attacagagg tcggggaagc cctgaaaacc 4920 gtgctgggaa aaaaggagac actggtggaa gacaagctgt ctctgctgaa tagtaactgg 4980 atcgccgtca caagccgcgc tgaggaatgg ctgaacctgc tgctggagta ccagaaacac 5040 atggaaactt ttgaccagaa tgtggatcat attactaagt ggatcattca ggccgacacc 5100 ctgctggatg agagcgagaa gaagaagccc cagcagaaag aggacgtgct gaagcggctg 5160 aaagctgaac tgaacgatat ccgacctaag gtggactcta cacgggatca ggccgctaat 5220 ctgatggcca accgagggga ccactgccga aagctggtgg agccacagat cagcgaactg 5280 aaccacagat tcgcagccat ctcccatagg attaagaccg gaaaagcttc tattcccctg 5340 aaggagctgg aacagtttaa ttccgatatc cagaaactgc tggagcctct ggaggccgaa 5400 attcagcagg gcgtgaatct gaaagaggaa gacttcaaca aggatatgaa tgaggacaac 5460 gaagggactg tgaaagagct gctgcagcgc ggagacaacc tgcagcagcg aatcaccgat 5520 gagcgcaagc gagaggaaat caaaattaag cagcagctgc tgcagaccaa acataatgcc 5580 ctgaaggacc tgaggagtca gcgacggaag aaagctctgg agatctcaca ccagtggtat 5640 cagtataagc gccaggctga cgatctgctg aaatgcctgg acgatattga gaagaaactg 5700 gcatccctgc ccgagcctag ggacgaacgc aaaatcaagg agattgatag agaactgcag 5760 aagaaaaagg aggaactgaa cgcagtgaga aggcaggccg agggactgtc tgaagacggc 5820 gctgcaatgg ccgtggagcc tacccagatc cagctgtcca agcggtggag agagattgaa 5880 tctaaattcg cacagtttcg ccgactgaat tttgcccaga tccatactgt cagggaggaa 5940 accatgatgg tcatgacaga ggacatgcca ctggaaatct catacgtgcc cagcacatat 6000 ctgactgaga ttacccacgt cagccaggcc ctgctggagg tggaacagct gctgaacgct 6060 cccgacctgt gcgcaaagga cttcgaggat ctgtttaaac aggaagaaag tctgaagaat 6120 atcaaagact cactgcagca gtctagtggg cggattgata tcattcacag taaaaagact 6180 gccgctctgc agtcagctac ccctgtggag agagtcaagc tgcaggaagc actgagtcag 6240 ctggacttcc agtgggagaa ggtgaacaaa atgtataagg accgacaggg acggtttgat 6300 agatcagtcg agaagtggcg gagattccat tacgatatca aaatcttcaa ccagtggctg 6360 actgaggcag aacagttcct gcgcaaaacc cagatccccg agaattggga acacgccaaa 6420 tacaagtggt atctgaagga gctgcaggac ggcattgggc agagacagac cgtggtcagg 6480 acactgaacg ccactggaga ggaaatcatt cagcagtcaa gcaagaccga cgctagcatc 6540 ctgcaggaga aactgggctc cctgaatctg cgctggcagg aagtgtgcaa acagctgagc 6600 gataggaaaa agcgcctgga ggaacagaag aacatcctgt ccgaattcca gcgggacctg 6660 aatgagtttg tgctgtggct ggaggaagcc gataacatcg cttccattcc cctggagcct 6720 ggcaaagaac agcagctgaa agagaagctg gaacaggtca agctgctggt ggaggaactg 6780 cctctgcggc aggggatcct gaagcagctg aatgaaaccg gaggaccagt gctggtctcc 6840 gccccaattt ctcccgagga acaggacaag ctggagaaca agctgaagca gacaaacctg 6900 cagtggatca aggtgtctag agcactgcct gagaaacagg gcgagatcga agcccagatt 6960 aaggacctgg ggcagctgga gaaaaagctg gaagatctgg aggaacagct gaaccatctg 7020 ctgctgtggc tgagcccaat caggaatcag ctggagatct acaatcagcc aaaccaggaa 7080 ggacccttcg acgtgcagga gacagaaatc gctgtgcagg caaagcagcc cgatgtcgag 7140 gaaattctgt ccaaaggcca gcacctgtat aaagagaagc ccgccaccca gcctgtgaaa 7200 cgcaagctgg aggacctgtc ctctgaatgg aaagctgtca acaggctgct gcaggagctg 7260 cgcgcaaagc agccagatct ggcccctggc ctgacaacta tcggagctag tccaacacag 7320 actgtgaccc tggtcaccca gcccgtggtc acaaaagaaa ctgccatttc aaagctggag 7380 atgcctagtt cactgatgct ggaggtgcca gcactggccg acttcaacag ggcctggacc 7440 gaactgacag actggctgtc tctgctggat caggtcatca agagtcagcg cgtgatggtc 7500 ggcgacctgg aggatattaa tgaaatgatc atcaagcaga aggccaccat gcaggatctg 7560 gagcagaggc gcccacagct ggaggaactg atcacagcag cccagaatct gaaaaacaag 7620 actagcaacc aggaggccag gactatcatt accgaccgaa tcgaacggat tcagaatcag 7680 tgggatgagg tgcaggaaca cctgcagaat cgacggcagc agctgaacga gatgctgaag 7740 gactctaccc agtggctgga ggcaaaagag gaagcagaac aggtgctggg acaggctcgc 7800 gcaaaactgg agagttggaa ggaagggccc tacactgtgg acgcaatcca gaaaaagatt 7860 acagagacta aacagctggc caaggatctg cggcagtggc agaccaatgt ggatgtcgct 7920 aacgacctgg cactgaaact gctgagagac tatagcgccg acgatacaag gaaggtgcac 7980 atgatcactg agaatattaa cgcttcatgg aggagcatcc ataagcgagt gtccgagcgg 8040 gaagctgcac tggaggaaac ccaccgcctg ctgcagcagt tccctctgga cctggagaag 8100 tttctggcat ggctgactga ggccgaaacc acagctaacg tgctgcagga cgccaccaga 8160 aaagagaggc tgctggaaga ttccaaagga gtgaaggagc tgatgaagca gtggcaggat 8220 ctgcagggcg agatcgaagc tcacaccgac gtgtaccata atctggatga gaactcccag 8280 aagattctga ggagtctgga aggctcagac gatgccgtgc tgctgcagag aaggctggac 8340 aatatgaact ttaagtggtc tgagctgcgg aaaaagtctc tgaacatcag aagtcacctg 8400 gaagccagct ccgatcagtg gaaaagactg catctgtcac tgcaggagct gctggtgtgg 8460 ctgcagctga aggacgatga gctgagcagg caggctccta tcgggggaga cttcccagca 8520 gtccagaagc agaatgatgt gcacagagcc tttaaaaggg agctgaaaac aaaggaacca 8580 gtgatcatga gcacactgga gactgtcaga attttcctga ctgaacagcc tctggagggc 8640 ctggaaaagc tgtaccagga gccaagggaa ctgccacccg aggaacgcgc acagaacgtg 8700 acccgactgc tgcgaaagca ggctgaggaa gtcaatacag agtgggaaaa actgaacctg 8760 cactccgccg actggcagcg caagatcgat gagaccctgg aacgactgca ggagctgcag 8820 gaagcaacag acgagctgga tctgaagctg aggcaggccg aagtgatcaa aggatcttgg 8880 cagcccgtcg gcgatctgct gattgacagt ctgcaggatc atctggagaa agtgaaggct 8940 ctgcgggggg agatcgcacc actgaaggaa aatgtgagcc acgtcaacga cctggccaga 9000 cagctgacta ccctgggaat tcagctgtca ccctataatc tgagcacact ggaggatctg 9060 aacactcggt ggaagctgct gcaggtggca gtcgaggaca gggtgcgcca gctgcacgaa 9120 gcacatagag atttcggccc tgcctcccag cactttctgt ccacatctgt gcagggacca 9180 tgggagaggg ccatctctcc taacaaggtg ccctactata ttaaccacga gactcagaca 9240 acttgctggg accatcccaa gatgaccgaa ctgtaccaga gcctggccga tctgaataac 9300 gtgcgctttt ccgcatatcg aaccgccatg aaactgcgcc gactgcagaa ggccctgtgc 9360 ctggacctgc tgagtctgtc agccgcttgc gacgccctgg atcagcataa tctgaagcag 9420 aacgaccagc ccatggatat cctgcagatc attaactgtc tgaccacaat ctacgatcgg 9480 ctggagcagg aacacaataa cctggtgaat gtccctctgt gcgtggacat gtgcctgaat 9540 tggctgctga acgtctatga taccggcaga acagggcgaa tccgggtgct gagcttcaag 9600 actggcatca tttccctgtg caaagctcat ctggaggaca agtacaggta tctgttcaaa 9660 caggtggcat ctagtaccgg cttttgcgac cagcggagac tgggactgct gctgcacgat 9720 agcatccaga ttcccaggca gctgggagag gtggctagct tcggcggatc caacatcgaa 9780 ccctccgtcc gctcttgctt ccagtttgcc aataacaagc ctgagattga agcagccctg 9840 tttctggact ggatgcggct ggagcctcag agcatggtct ggctgccagt gctgcacaga 9900 gtcgctgcag ccgagacagc taaacatcag gcaaagtgca acatctgtaa agaatgccct 9960 atcattggct tcagatacag gtccctgaag cactttaatt acgatatctg tcagtcttgc 10020 ttctttagtg gcagagtggc caaagggcac aagatgcatt accccatggt cgagtattgt 10080 acccctacta cctctgggga agacgtgcgg gattttgcca aggtgctgaa aaacaagttc 10140 cggaccaaaa gatactttgc taagcatccc cggatgggat atctgcctgt gcagacagtc 10200 ctggagggcg acaatatgga aactcccgtg accctgatca acttctggcc tgtcgatagc 10260 gcccccgctt caagccctca gctgagtcac gacgataccc attcacgaat tgagcactac 10320 gcctcccggc tggctgagat ggaaaatagt aacggctcat atctgaatga cagcatctcc 10380 cctaacgagt ctattgacga tgaacacctg ctgatccagc attactgcca gagtctgaat 10440 caggatagcc cactgtccca gcctaggtca ccagcccaga tcctgatttc tctggagagt 10500 gaggaacggg gggagctgga aagaatcctg gctgacctgg aggaagagaa tcggaacctg 10560 caggcagagt atgatagact gaagcagcag cacgaacata aaggactgtc accactgccc 10620 agccctccag agatgatgcc cacctcacct cagagcccac gggacgctga gctgatcgca 10680 gaagccaagc tgctgagaca gcacaaagga cgcctggaag cccgaatgca gattctggag 10740 gatcacaaca agcagctgga aagccagctg catcgactgc gacagctgct ggagcagcca 10800 caggctgaag caaaagtgaa tggcacaact gtctcctctc cctctaccag tctgcagcgg 10860 agtgacagtt cacagcctat gctgctgaga gtggtcggat cacagacatc agacagcatg 10920 ggcgaagagg atctgctgag cccccctcag gatacctcca caggcctgga agaagtgatg 10980 gagcagctga ataactcctt cccatccagc agaggcagaa ataccccagg aaaaccaatg 11040 agagaggaca ctatgtga 11058 <210> 73 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Part of human ATP synthase, mitochondrial Fo complex subunit B1 mRNA <400> 73 gctacctgga ct 12 <210> 74 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Part of human ATP synthase, mitochondrial Fo complex subunit B1 mRNA <400> 74 gcagcaggcc aggcacag 18 <210> 75 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Part of human peptidylprolyl isomerase A (cyclophilin A) mRNA <400> 75 tggcctccca aactgctg 18 <210> 76 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Part of human ribosomal protein, large, P1 (RPLP1) mRNA <400> 76 cagccctaca ct 12 <210> 77 <211> 2652 <212> DNA <213> Artificial Sequence <220> <223> T7 RNA polymerase cDNA <400> 77 atgaacacca tcaacatcgc aaaaaacgac tttagtgaca tcgaactggc tgctatcccc 60 ttcaatactc tggctgacca ttacggggag cgactggcca gagagcagct ggctctggag 120 cacgaaagct acgagatggg ggaagcccga ttccggaaga tgtttgagcg gcagctgaaa 180 gctggagaag tggcagacaa cgccgctgca aagccactga ttaccacact gctgcccaaa 240 atgatcgcca gaattaatga ttggttcgag gaagtgaagg caaaaagagg caagaggcct 300 accgccttcc agtttctgca ggagatcaag ccagaagcag tggcctacat caccatcaag 360 actaccctgg catgcctgac aagcgccgac aacacaactg tgcaggctgt cgcatccgcc 420 atcgggaggg ctattgagga cgaagcacgc tttggaagaa tcagggatct ggaggccaag 480 cacttcaaga agaacgtgga ggagcagctg aacaagcggg tgggacacgt ctacaagaag 540 gccttcatgc aggtggtcga ggccgacatg ctgtcaaagg gactgctggg aggagaggca 600 tggagctcct ggcacaaaga agatagcatc catgtggggg tcaggtgcat cgagatgctg 660 attgaatcta ccggaatggt gagtctgcac cgacagaacg caggagtggt cggacaggac 720 tctgagacaa tcgaactggc tcccgagtac gctgaagcaa ttgccactag agctggggca 780 ctggccggaa tcagtcccat gttccagcct tgcgtggtgc cccctaagcc atggactggc 840 atcaccggag gcgggtactg ggctaatggg cggagacccc tggcactggt gaggacacac 900 agcaagaaag ccctgatgcg ctacgaggat gtctatatgc ctgaagtgta taaggccatc 960 aacattgctc agaatacagc atggaaaatt aacaagaaag tgctggctgt cgcaaatgtg 1020 atcactaagt ggaaacattg tcctgtggag gacatcccag ccattgaaag ggaggaactg 1080 cctatgaagc cagaggacat cgatatgaac ccagaagccc tgaccgcttg gaaacgagcc 1140 gctgcagccg tgtatagaaa ggatcgcgcc cgaaaatcca ggcgcatttc tctggagttc 1200 atgctggaac aggccaacaa gtttgctaat cataaagcaa tctggttccc ttacaacatg 1260 gactggcggg ggagagtcta tgccgtgtcc atgttcaacc cacagggaaa tgatatgaca 1320 aagggcctgc tgactctggc taagggcaaa cccattggaa aggagggcta ctattggctg 1380 aaaatccacg gagcaaattg cgcaggagtg gacaaggtgc cattcccaga gcggatcaag 1440 ttcatcgagg aaaaccatga aaatattatg gcctgtgcta agtctcccct ggagaacaca 1500 tggtgggccg aacaggatag tcctttctgc tttctggcct tctgttttga gtacgctggg 1560 gtgcagcacc atggactgag ttataattgc tcactgcccc tggcctttga cggctcttgt 1620 agtgggatcc agcacttctc cgcaatgctg cgggatgagg tcggaggcag agccgtgaac 1680 ctgctgcctt ctgagactgt gcaggacatc tacggcattg tcgccaagaa agtgaatgag 1740 atcctgcagg cagacgccat taacggaacc gataatgagg tggtcaccgt cacagatgaa 1800 aacactggcg agatctctga aaaggtgaaa ctggggacca aggctctggc aggacagtgg 1860 ctggcacatg gagtcacccg ctcagtgaca aagcgaagcg tgatgacact ggcttacggc 1920 agcaaagagt tcgggtttag acagcaggtg ctggaagaca ccatccagcc cgccattgat 1980 tccgggaagg gacccatgtt tacacagcct aaccaggctg caggctatat ggccaagctg 2040 atctgggagt cagtgagcgt cactgtggtc gccgctgtgg aagctatgaa ttggctgaag 2100 tccgccgcca aactgctggc tgcagaggtg aaggacaaga aaactggcga aattctgagg 2160 aaacgctgcg ccgtccactg ggtgacccca gatgggttcc ccgtgtggca ggagtacaag 2220 aaacctatcc agacccggct gaacctgatg ttcctgggcc agtttagact gcagccaaca 2280 atcaacacta ataaggacag tgagattgat gctcataaac aggaatcagg aattgcacca 2340 aattttgtgc acagccagga cggctcccat ctgaggaaga ccgtggtctg ggctcacgag 2400 aaatatggca tcgaatcctt cgcactgatt catgactctt ttgggacaat ccccgccgat 2460 gccgctaatc tgttcaaggc tgtccgcgag actatggtgg acacctacga aagttgtgat 2520 gtgctggccg acttctatga tcagtttgct gaccagctgc acgagtcaca gctggataag 2580 atgcctgccc tgcccgctaa gggcaacctg aacctgaggg acattctgga gtctgatttc 2640 gcattcgctt ga 2652 <210> 78 <211> 4242 <212> DNA <213> Artificial Sequence <220> <223> hN-hPolS-hC cDNA <400> 78 accagacaag agtttaagag atatgtatcc ttttaaattt tcttaagaaa aacttagggt 60 gaaagtatcc accctgagga gcaggttcca gatccttttc tttgctgcca aagtccacca 120 tggccggcct tctgtccact ttcgacacct ttagctcacg gcgctccgag tccatcaaca 180 agtccggcgg tggagccgtg atccctggac agcgctccac tgtctccgtg ttcgtcctcg 240 ggccgtcggt gaccgacgac gccgacaagc tgttcatcgc cactactttc ctcgctcatt 300 ccctggatac cgataagcag cactcccagc gcggaggttt tttggtgtct ctcctggcaa 360 tggcctactc gtccccggag ctgtacctga caactaacgg agtgaacgcg gacgtgaaat 420 acgtgatcta caacatcgaa aaggacccga agcggaccaa gaccgacggt ttcattgtca 480 agactcggga tatggagtac gagaggacca ccgagtggct tttcggccca atggtcaaca 540 agagcccgct gttccaagga cagcgggacg ccgcggaccc cgacaccctg ctgcaaatct 600 acggctaccc tgcttgcctg ggagccatca tcgtccaagt ctggattgtg ctcgtgaagg 660 ccattaccag ctccgccggt ctgagaaagg ggtttttcaa ccgcctggag gcgttcagac 720 aggacggcac cgtgaagggg gcactggtgt tcaccggcga aaccgtggaa ggaatcggct 780 cagtgatgcg gtcccagcag tccctggtgt cgctgatggt ggaaactctc gtgaccatga 840 acacggcccg gtcggacctg accaccctgg agaagaacat ccagattgtg ggcaactaca 900 ttcgggatgc cggactcgct agcttcatga acactattaa gtacggagtg gaaaccaaga 960 tggccgccct gactctctcc aacctgaggc ccgatatcaa caagctgcgc tcgctgatcg 1020 atacctacct gtcaaagggg cccagggccc cattcatttg catacttaaa gaccctgtgc 1080 acggagagtt cgcccctgga aactatcccg ctctgtggag ctacgcaatg ggagtggccg 1140 tggtgcagaa caaggccatg cagcaatacg tcaccgggag gacctatctc gatatggaga 1200 tgttcctgct ggggcaggcc gtggcgaagg acgcagaaag caaaatctcg tcggcccttg 1260 aagatgaact gggtgtcact gacaccgcga agggcagact cagacaccac ttggccaacc 1320 tcagcggagg agatggagct taccacaagc cgactggggg tggagcgatt gaagtcgccc 1380 tggataacgc cgacatcgac cttgagacta aggcgcatgc ggaccaggac gccaggggat 1440 ggggcgggga cagcggcgaa cgctgggccc gccaagtgtc cggcggtcac ttcgtgacct 1500 tgcatggcgc ggagcgcctg gaagaggaaa ccaatgatga ggacgtgtca gacatcgaaa 1560 gacggatcgc catgcgactg gctgaacggc gccaggagga ttccgcgacg cacggggacg 1620 agggacggaa caatggagtg gaccacgacg aagatgacga cgccgcagcc gtggccggaa 1680 tcggcggaat ctagcggttt atttattgat ccttatttat tcaaagatct acgaggcctc 1740 agtttgtcta cttggtctta agaaaaactt agggtgaaag cctcagtgcc ccattctcac 1800 tgctactagt cgccaacatg gaccaggacg cattcattct gaaagaagat tcagaagtcg 1860 aacgcgaagc ccccggtgga agggagtctc tcagcgacgt gatcggattc ctggacgccg 1920 tgctgtcatc ggaaccgacc gacattgggg gagacaggtc gtggctgcac aacactatca 1980 acaccccgca agggcctggc tccgcgcatc gggccaagtc ggagggagaa ggagaagtgt 2040 caaccccgag cacccaggac aaccgctcag gggaagagtc cagagtctcc ggtagaacgt 2100 caaagcctga agccgaggcc catgccggaa acctggataa gcagaacatt caccgggcct 2160 ttggtggccg caccgggaca aactccgtgt cgcaagacct gggcgatggc ggcgattccg 2220 gtatcctgga gaatccccca aacgagaggg gatacccaag atccggaatc gaggacgaaa 2280 accgggaaat ggcagcccac cctgataagc ggggcgaaga tcaggccgaa ggcctgcctg 2340 aggaggtccg gggatcgacc tccttgcctg acgaagggga aggcggcgcc tcgaacaacg 2400 gccggtcaat ggagcccggc agctcccatt ccgctcgggt cactggagtc ctcgtgattc 2460 cttccccgga actggaggaa gccgtgctga ggcggaacaa gcggcggccg accaactccg 2520 gatcaaagcc tctgactccc gccaccgtgc ccggaactag gtccccgccc ctgaaccgat 2580 acaactcgac cgggtcacca cccggaaagc cgccgtccac ccaagacgag cacatcaaca 2640 gcggggacac tccggccgtg cgcgtgaagg accggaagcc acccatcggc actcggagcg 2700 tgtctgactg tcctgcgaat ggtagaccca tccaccctgg cctggaaacc gactccacca 2760 agaagggaat aggggagaac acctccagca tgaaggagat ggctactctg ctcacctcgc 2820 ttggcgtgat ccagtccgcg caagagttcg aatccagccg cgacgcctcc tacgtgttcg 2880 cgcggcgcgc cctgaagtcc gcgaactacg ccgagatgac tttcaacgtg tgcggattga 2940 tcctgtccgc ggaaaagagc tccgcaagaa aagtggacga gaacaagcag ctgctcaagc 3000 agatccagga gagcgtggag tccttccgcg acatctacaa acgcttctcc gagtatcaga 3060 aggagcagaa ctcccttctc atgtccaacc tgtccaccct tcacatcatc actgatcggg 3120 gtggaaagac ggataacacc gattcgttga cccgctcccc gagcgtgttc gccaagtcca 3180 aagagaacaa gactaaggcc accagatttg atccttcgat ggaaaccctg gaggacatga 3240 agtacaagcc cgacctcatt cgggaggacg aattccggga cgagatcaga aacccggtgt 3300 accaagagag ggacaccgaa ccccgcgcta gcaatgctag ccgcctcctg ccgtcaaagg 3360 agaagccaac catgcactcg ctgcggctgg tcattgaaag ctctcccctg tcccgcgcgg 3420 aaaaggtcgc ctacgtgaaa agcctctcga agtgcaagac cgaccaggaa gtgaaggccg 3480 tgatggaact ggtggaggag gacatcgaat ccctcaccaa ttgaaccggt gtcgacggag 3540 ccgcaccttg tcatgtacca tcaatattaa gaaaaactta gggtgaaagt ctcccctcct 3600 cacacctagg agaccaccat gcccagcttt ctcaagaaga ttttgaaact tcggggacga 3660 cgccaggagg acgagtcgcg gagccggatg ctttccgatt cctcaatgtt gtcatgccgc 3720 gtgaatcagc tgacatcaga agggacggaa gccggatcga cgacgccctc gactttgccg 3780 aaagaccagg cattgctgat cgagccgaaa gtccgcgcga aagaaaagtc gcagcaccga 3840 aggcccaaga ttatcgatca agtgagaagg gtcgaatccc ttggtgagca ggcgagccag 3900 agacaaaaac atatgcttga aacgctgatc aacaagattt acaccgggcc tcttggagaa 3960 gagctggtgc agacactcta tcttcggatt tgggcgatgg aagagactcc ggaatcgctg 4020 aagatcctcc aaatgagaga ggacattcgc gatcaggtac tgaagatgaa aaccgaaaga 4080 tggttgagga ctctcatcag gggcgagaaa acaaagttga aagacttcca aaagcgatac 4140 gaggaggtgc atccctatct catgaaggaa aaggtagaac aggtcattat ggaggaggcg 4200 tggtcactcg ccgcacacat cgtgcaagag tgataacccg gg 4242 <210> 79 <211> 6884 <212> DNA <213> Artificial Sequence <220> <223> hPolL cDNA <400> 79 gcggccgctt aagaaaaact tagggtgaat gtaaagcttt ctggccacca tggacggtca 60 ggaatcaagc cagaatccgt ccgacatcct ctacccggag tgccatctta acagcccgat 120 cgtacgcggg aagatcgcac agcttcacgt cctgttggat gtcaatcagc cgtacagatt 180 gaaagatgac tcaatcatta acattaccaa gcacaagatt cgaaatggag gtttgtcacc 240 tcggcagatt aaaatccggt cactggggaa ggcgcttcag aggaccatca aagaccttga 300 ccgctacacc ttcgagccct acccgacgta ctcccaagaa cttttgcggc tcgacatccc 360 ggagatctgc gataagatcc ggtcggtgtt tgccgtatcc gataggctta cgcgcgagtt 420 gtcgtcgggg ttccaagacc tctggctcaa tatctttaaa cagcttggga atatcgaagg 480 ccgagaaggc tacgacccgc ttcaggatat cggcacgatt cccgagatca ccgacaaata 540 ctcaaggaat cgatggtaca gacccttcct tacatggttc tcaatcaaat acgatatgag 600 gtggatgcag aaaactaggc cgggagggcc tcttgacacg agcaattcgc ataacctctt 660 ggagtgtaag tcctacacgc tggtgacgta cggcgacctt atcatgattt tgaacaaact 720 cacgcttacg gggtacatct tgacaccaga attggtactt atgtactgtg acgtagtgga 780 aggaaggtgg aacatgtcag cagcgggcca cctcgacaag aagtccatcg gaattacttc 840 caaaggggag gaattgtggg agttggtgga ctcgttgttt agcagccttg gtgaggagat 900 ctacaacgta atcgcccttt tggagccgct ttcactcgcg ttgatccaac tcaacgatcc 960 cgtcattcct ttgcggggtg cgtttatgag acacgtactg actgagcttc aggcagtgtt 1020 gacatcgaga gatgtctaca cggatgccga agcggatact atcgtggagt cactccttgc 1080 aatcttccac ggcaccagca tcgacgagaa agctgaaatc tttagcttct ttcggacttt 1140 cgggcacccc tcacttgaag ccgtcaccgc ggctgacaaa gtacgggcgc acatgtacgc 1200 gcagaaggcg attaaactta agacgttgta cgagtgccat gctgtgttct gcacaatcat 1260 tattaatggt tacagagagc ggcacggggg tcagtggccc ccttgcgact ttccagacca 1320 cgtctgcttg gagctcagaa atgcacaggg ttcgaacacg gcgatcagct acgaatgtgc 1380 ggtggacaac tatactagct tcatcgggtt caaattcagg aaattcatcg aaccacagct 1440 ggacgaagac ctgactatct acatgaagga taaggcgctg tcaccgagga aagaagcatg 1500 ggatagcgtg taccccgact caaatttgta ctataaagcg ccagagtccg aggagacacg 1560 gcggttgatt gaggtgttca ttaacgatga gaattttaac ccagaagaga tcatcaacta 1620 tgtcgagtcg ggcgactggc tcaaggacga gaagttcaac atctcgtact ccttgaaaga 1680 aaaagaaatc aagcaggagg ggcgactgtt cgctaagatg acatacaaga tgcgagccgt 1740 gcaagtcttg gcggaaacct tgttggcaaa ggggatcgga gaattgttct cggaaaacgg 1800 aatggtcaag ggagagatcg accttttgaa acgcctgaca accttgtcgg tctcgggagt 1860 cccgcgcact gactcggtgt ataacaacag caagtcctcg gagaagcgaa acgaggggat 1920 gaagaagaag aattcaggtg gatactggga cgagaaaaag agatccaggc atgagttcaa 1980 ggccacagac tcgtcaacgg atggttatga aacgctttcg tgcttcctga cgaccgatct 2040 caaaaagtac tgcctcaact ggcggttcga aagcacagca ctttttgggc agagatgtaa 2100 cgaaatcttt gggtttaaga ccttctttaa ctggatgcac cccgtcttgg agcggtgcac 2160 aatctacgta ggagatccat actgtccggt ggctgaccga atgcataggc aactccagga 2220 ccatgcggat tccggaattt tcatccacaa cccgagagga ggaatcgagg ggtattgcca 2280 gaaactctgg accctgattt cgattagcgc gattcacctt gctgcggtgc gagtgggggt 2340 cagggtgtca gcgatggtgc agggagataa tcaggcaatc gcggtcactt cgcgagtgcc 2400 ggtcgcgcag acgtacaaac agaagaaaaa tcatgtatac aaggaaatca ccaagtactt 2460 tggggctctg cggcacgtca tgtttgacgt gggacacgag ttgaaactta atgaaacgat 2520 catcagctcg aaaatgtttg tatacagcaa gagaatttac tacgacggaa agattctccc 2580 gcagtgcttg aaggctctga ctcgatgtgt attctggagc gaaacgctgg tcgatgaaaa 2640 caggtcagca tgtagcaata tctcgacatc gatcgcaaaa gcgattgaaa atggttattc 2700 gccaattttg ggatactgta tcgcgcttta caaaacgtgt cagcaagtgt gtatctcgct 2760 gggtatgacc attaacccca ccatttcgcc tacggtgcgg gatcagtact tcaagggaaa 2820 gaattggctg aggtgcgcgg tgttgatccc agcaaatgtg ggaggtttta actatatgtc 2880 cacgtcacga tgctttgtcc ggaatatcgg tgatccagcc gtggccgctc tggccgattt 2940 gaaaagattc atccgagctg acttgctcga caagcaggtg ttgtatcggg tgatgaatca 3000 ggagccgggt gactcctcat ttttggattg ggcgtccgac ccgtactcgt gcaatctgcc 3060 gcactcccaa tcgatcacca ctatcatcaa gaacatcaca gccaggtcag tgttgcaaga 3120 aagcccgaat cctctgttgt caggtctctt cacagagact tcgggggagg aagatttgaa 3180 cttggcgtcg tttctcatgg atcgcaaggt gatcctccca cgggtcgcgc atgagatcct 3240 tggaaacagc ctgacagggg tgcgagaagc gattgcgggc atgttggata ctacgaagag 3300 cctcgtccgc tcctccgtga aaaagggagg actctcgtac gggatcttgc ggagacttgt 3360 caattacgac ttgctccagt atgagacgct gacaaggaca ctgaggaaac ccgtgaagga 3420 caatatcgaa tacgaataca tgtgctcagt ggaattggcc gtggggctga ggcaaaagat 3480 gtggatccac ctgacatacg gacgcccgat ccacggactg gagacacctg accctcttga 3540 gttgttgagg gggacgttca tcgaagggtc ggaggtctgc aaactctgta gatcggaggg 3600 agccgacccc atctacacgt ggttttatct ccccgataat attgatcttg acacacttac 3660 aaatggatgc cctgcgatta gaatcccgta tttcgggtca gcaacggacg agaggtccga 3720 ggctcagctt gggtacgtgc gcaaccttag caagcccgcg aaagccgcca tcagaatcgc 3780 tatggtgtat acgtgggcct acgggaccga tgaaatttca tggatggaag ccgcgctcat 3840 tgctcagaca agagcgaatc tctcgctgga aaatctgaag ctcctgacac ccgtatcaac 3900 atccacgaac ctttcccatc ggttgaaaga caccgccacc cagatgaagt tttcctcggc 3960 aacgctcgtc agggcgtcac gcttcatcac gatctcgaat gataacatgg cgcttaaaga 4020 agccggagag tcgaaagaca cgaacctcgt ctatcaacag atcatgttga ctggactgtc 4080 gctttttgag ttcaatatga ggtacaagaa gggatcgctc ggcaaacctc tcatcctcca 4140 cttgcacctc aataacgggt gctgcatcat ggagtcacct caagaggcga acatcccgcc 4200 tagaagcaca ttggacttgg agattacaca agagaataac aaactcatct acgatcccga 4260 tcccctcaag gatgtggacc ttgaactttt ctcgaaagta cgcgatgtcg tccacaccgt 4320 tgacatgaca tattggtccg acgacgaggt aatccgcgca acctcgatct gcaccgcgat 4380 gacaatcgca gacaccatgt cccagcttga ccgggataac cttaaggaga tgattgcgct 4440 ggtcaatgac gacgacgtaa actcgctgat tacggagttc atggtcatcg acgtgcctct 4500 cttctgcagc acattcggag gcatcctggt caaccagttc gcctacagcc tttatggtct 4560 taacatccga ggaagagaag agatttgggg gcacgtggtg agaatcttga aggacacgtc 4620 ccatgcggta cttaaggtgc tgagcaacgc cctcagccac cccaaaattt ttaagagatt 4680 ttggaatgcc ggggtggtgg aacctgtgta cggacccaat ctttcgaatc aagacaaaat 4740 cctgcttgca ctcagcgtct gtgagtattc cgtggacctt ttcatgcacg attggcaagg 4800 gggagtcccc ttggaaatct tcatctgcga caatgacccc gacgtggcgg atatgcggag 4860 atcgtcattt cttgctcgcc atcttgcata cttgtgctcc gtagcagaga tctcacggga 4920 cgggcctcgc ctggagtcaa tgaactcatt ggaacggctc gaatccctga aatcgtacct 4980 cgaattgact ttcctggacg atccggtcct taggtattcg cagctcactg ggcttgtaat 5040 caaggtattt ccctcgacat tgacgtacat caggaagtcg tccattaaag tattgcgcac 5100 tcgcgggatc ggcgtaccgg aagtgcttga ggattgggac ccggaggcgg ataacgcatt 5160 gctcgatggt atcgctgcgg agattcagca gaatatcccc ctcgggcatc agaccagagc 5220 tcccttttgg gggctgcggg tatcgaaaag ccaggtcctc cgactgaggg gatacaaaga 5280 gattaccaga ggagagattg ggagatcagg agtcggattg acacttccgt ttgacggacg 5340 ctatctctcc caccaactgc gcctctttgg gattaactcg acttcgtgcc tcaaggccct 5400 tgagcttacg tatctcctgt ccccgttggt ggacaaggac aaagaccgct tgtatctggg 5460 ggaaggggcg ggtgcaatgc tttcgtgtta cgatgcgacg cttggtccgt gcattaacta 5520 ttacaactcg ggagtgtact cgtgtgacgt caacggccaa agagaattga atatctaccc 5580 agcagaggta gcgctcgtgg gaaagaaact gaacaatgtc acctcactcg gacagcgcgt 5640 gaaggtgctc ttcaatggta accccggatc gacgtggatt ggtaatgatg agtgcgaagc 5700 tttgatttgg aacgaactcc aaaattcctc gattggattg gtgcactgtg acatggaggg 5760 aggggaccac aaggatgatc aagtagtact ccacgagcac tacagcgtga ttcggatcgc 5820 ttatttggtg ggcgatcggg acgtcgtact catctccaag atcgcccctc gactgggaac 5880 agactggact cgccaattgt ccctctacct ccgctactgg gatgaagtca atcttatcgt 5940 ccttaagaca tcgaacccgg cttcgactga aatgtacctc ctcagcagac accccaagtc 6000 ggacatcatt gaggatagca aaacagtact cgcgtcactg ctccccctct cgaaggagga 6060 ttccattaag atcgagaaat ggattctcat cgagaaagca aaggcccatg aatgggtaac 6120 gagagagctg cgcgagggaa gctcgtcatc gggcatgctt agaccctacc accaggcgct 6180 gcagactttt ggattcgaac ccaatctgta taaacttagc cgcgacttcc tcagcaccat 6240 gaacatcgct gacacacata actgcatgat cgctttcaac cgggtactca aagacacgat 6300 ttttgagtgg gccagaatca cggagtcgga caagcggctg aaacttacag ggaagtacga 6360 cctttatccc gtcagagaca gcggtaaact gaaaacagtg tccagaagac tggttctgtc 6420 atggatctca ctgtcaatga gcacgcgatt ggtcacgggt tcgttccctg atcaaaagtt 6480 tgaggcgaga ctccaattgg gcattgtctc gctctcgtca agagagatca ggaacctccg 6540 agtcattact aaaacgctcc tcgacagatt cgaggacatt attcacagca tcacttatcg 6600 atttttgacg aaggagatca agatccttat gaagattctc ggtgccgtga aaatgttcgg 6660 ggcgagacaa aatgagtaca caacagtcat tgatgacggt tcgctcggag atatcgagcc 6720 atacgatagc tcgtgaaccg gtagccgcac cttgtcatgt accatcaata aagtaccctg 6780 tgctcaacga agtcttggac tgatccatat gacaatagta agaaaaactt acaagaagac 6840 aagaaaattt aaaagaatac atatctctta aactcttgtc tggt 6884 <210> 80 <211> 4248 <212> DNA <213> Artificial Sequence <220> <223> hN-hPolS-hC cDNA <400> 80 accaaacaag agaaaaaaca tgtatgggat atgtaatgaa gtttaagaaa aacttagggt 60 gaaagtatcc accctgagga gcaggttcca gatccttttc tttgctgcca aagtccacca 120 tggctggcct gctgtcaacc ttcgatacct tttcaagtag gaggagcgag tcaatcaaca 180 aatctggggg cggagctgtc atccctggac agcggtccac cgtgtctgtc ttcgtgctgg 240 gcccctctgt gacagacgat gccgacaagc tgttcatcgc caccacattt ctggctcaca 300 gtctggacac agataaacag cattcacaga gaggcgggtt tctggtgagc ctgctggcta 360 tggcatacag ctccccagaa ctgtatctga ctaccaacgg agtgaatgcc gacgtgaagt 420 acgtgatcta taacattgag aaggacccca aaaggactaa gaccgatggc ttcatcgtga 480 agacacggga tatggaatac gagagaacaa ctgagtggct gttcgggcct atggtgaaca 540 agagcccact gtttcaggga cagcgagacg cagctgaccc cgataccctg ctgcaaatct 600 acggctatcc tgcctgcctg ggggctatca ttgtccaagt gtggatcgtc ctggtgaaag 660 caattacctc tagtgccggc ctgcggaagg ggttctttaa ccgcctggag gctttccgac 720 aggatggaac agtgaagggc gcactggtct ttaccggcga aacagtggag ggaatcggct 780 ctgtcatgag aagtcagcag tcactggtca gcctgatggt ggaaactctg gtcaccatga 840 acacagccag aagtgacctg accacactgg agaaaaacat ccagattgtg gggaattaca 900 tcagggatgc cggcctggcc agcttcatga ataccatcaa gtatggggtg gaaacaaaga 960 tggcagccct gactctgtcc aacctgagac ccgacatcaa caagctgcgg agcctgattg 1020 atacctacct gtctaagggc cccagggccc ctttcatctg tattctgaaa gacccagtgc 1080 acggggagtt tgctccagga aactaccccg cactgtggtc ctatgcaatg ggcgtggccg 1140 tggtccagaa taaggccatg cagcagtacg tcactggccg cacctatctg gacatggaaa 1200 tgtttctgct ggggcaggcc gtggctaaag atgccgagag caagatcagc agcgccctgg 1260 aggacgagct gggagtcaca gatactgcca aggggcgact gcggcaccat ctggcaaacc 1320 tgtccggagg cgacggagca tatcacaaac ctacaggggg aggcgctatc gaagtggcac 1380 tggataatgc cgacattgat ctggagacta aggcacatgc agaccaggat gctcgcggat 1440 ggggaggaga ttccggcgaa agatgggcca ggcaggtgtc tggcgggcac tttgtcactc 1500 tgcatggcgc tgagcgactg gaggaagaga ccaatgacga agatgtgagt gacatcgagc 1560 ggagaattgc tatgcgactg gcagaaaggc gccaggagga ctcagccacc catggggatg 1620 agggacggaa caatggagtg gaccatgacg aagatgatga cgccgccgca gtcgcaggca 1680 ttggaggaat ttgacggttt atttattgat ccttatttat tcaaagatct acgaggcctc 1740 agtttgtcta cttggtctta agaaaaactt agggtgaaag cctcagtgcc ccattctcac 1800 tgctactagt cgccaccatg gaccaggacg cttttattct gaaggaggat tctgaagtgg 1860 aacgggaggc accaggggga agggagagtc tgagtgatgt cattggcttc ctggacgccg 1920 tgctgagctc cgagccaaca gatatcggag gggaccggag ctggctgcac aacactatta 1980 atacccccca ggggcctgga agtgcacata gagccaagtc agagggcgaa ggggaggtgt 2040 caacacccag cactcaggat aacaggtctg gggaggaatc cagagtctct ggaaggacca 2100 gtaagcctga agcagaggcc cacgctggca acctggacaa acagaatatc catcgagctt 2160 ttggaggccg gaccgggaca aactctgtga gtcaggacct gggagatggg ggagactctg 2220 gcatcctgga aaacccccct aatgagcgcg gctaccctcg atccgggatt gaagatgaga 2280 atagggagat ggccgctcac ccagataagc gaggagaaga ccaggcagag ggactgcctg 2340 aggaagtgcg gggctcaacc agcctgccag acgaaggaga gggaggagcc tccaacaatg 2400 gccggtctat ggaacctggg tctagtcatt ccgctagagt gacaggcgtg ctggtcattc 2460 cttctccaga gctggaggaa gcagtcctgc ggagaaacaa gaggcgccca accaattccg 2520 gatctaaacc actgacccca gcaacagtgc ccggcacacg gagcccaccc ctgaacagat 2580 ataatagtac cgggtcacct ccaggaaagc ccccttctac acaggatgag cacatcaaca 2640 gtggggacac tccagctgtg cgggtcaagg atagaaaacc acccattgga actcggagcg 2700 tgagcgactg cccagcaaac ggaagaccta tccaccccgg cctggagact gattccacca 2760 agaaaggaat tggcgaaaat acctcaagca tgaaggagat ggccacactg ctgactagcc 2820 tgggcgtgat ccagtccgca caggaattcg agagcagccg ggacgccagt tacgtctttg 2880 ctcgacgggc actgaaatca gccaactatg ctgagatgac cttcaacgtg tgcggcctga 2940 ttctgagcgc cgaaaagagt tcagctagaa aagtggatga gaataagcag ctgctgaaac 3000 agatccagga aagcgtcgag tccttcagag acatctacaa gaggttttca gaatatcaga 3060 aagagcagaa cagcctgctg atgtctaatc tgagtacact gcacatcatt actgataggg 3120 gaggcaagac cgataacaca gacagcctga cacgcagccc ttccgtgttc gctaagtcca 3180 aagagaataa gactaaagca acccgctttg acccctccat ggaaactctg gaggatatga 3240 agtacaaacc tgacctgatc cgggaagatg agtttaggga cgaaattcgc aacccagtgt 3300 atcaggaacg cgatactgag ccccgagcat caaatgccag cagactgctg ccctccaagg 3360 agaaacctac catgcattct ctgaggctgg tcatcgaaag ctccccactg agccgcgctg 3420 agaaggtggc atacgtcaaa tctctgagta agtgcaaaac cgaccaggag gtgaaggctg 3480 tgatggaact ggtggaggaa gacattgaat ctctgacaaa ctaagtcgac ggagccgcac 3540 cttgtcatgt accatcaata ttaagaaaaa cttagggtga aagtctcccc tcctcacacc 3600 taggaccatg gcccaggctt cataatgccc agctttctga agaagattct gaaactgaga 3660 ggacgaagac aggaagatga gtctcgaagt cggatgctgt ccgacagctc catgctgtct 3720 tgcagggtga accagctgac tagcgaggga accgaagctg gctcaaccac acccagcaca 3780 ctgcctaaag accaggccct gctgatcgag ccaaaggtcc gggctaagga aaaatcccag 3840 caccggagac ccaagatcat tgatcaggtg aggcgcgtcg agagtctggg ggaacaggca 3900 tcacagcggc agaaacatat gctggagacc ctgatcaaca aaatctacac aggccctctg 3960 ggggaggaac tggtgcagac tctgtatctg agaatctggg ccatggagga aaccccagag 4020 tctctgaaaa tcctgcagat gcgcgaagac attcgagatc aggtcctgaa gatgaaaaca 4080 gagagatggc tgaggactct gattaggggc gaaaagacca aactgaagga tttccagaag 4140 cggtacgagg aagtgcaccc ctatctgatg aaagagaagg tggaacaggt catcatggaa 4200 gaggcttggt cactggcagc tcatattgtg caggagtaat gacccggg 4248 <210> 81 <211> 4242 <212> DNA <213> Artificial Sequence <220> <223> hPolS-hN-hC cDNA <400> 81 accagacaag agtttaagag atatgtatcc ttttaaattt tcttaagaaa aacttagggt 60 gaaagtatcc accctgagga gcaggttcca gatccttttc tttgctgcca aagtccacca 120 tggaccagga cgcattcatt ctgaaagaag attcagaagt cgaacgcgaa gcccccggtg 180 gaagggagtc tctcagcgac gtgatcggat tcctggacgc cgtgctgtca tcggaaccga 240 ccgacattgg gggagacagg tcgtggctgc acaacactat caacaccccg caagggcctg 300 gctccgcgca tcgggccaag tcggagggag aaggagaagt gtcaaccccg agcacccagg 360 acaaccgctc aggggaagag tccagagtct ccggtagaac gtcaaagcct gaagccgagg 420 cccatgccgg aaacctggat aagcagaaca ttcaccgggc ctttggtggc cgcaccggga 480 caaactccgt gtcgcaagac ctgggcgatg gcggcgattc cggtatcctg gagaatcccc 540 caaacgagag gggataccca agatccggaa tcgaggacga aaaccgggaa atggcagccc 600 accctgataa gcggggcgaa gatcaggccg aaggcctgcc tgaggaggtc cggggatcga 660 cctccttgcc tgacgaaggg gaaggcggcg cctcgaacaa cggccggtca atggagcccg 720 gcagctccca ttccgctcgg gtcactggag tcctcgtgat tccttccccg gaactggagg 780 aagccgtgct gaggcggaac aagcggcggc cgaccaactc cggatcaaag cctctgactc 840 ccgccaccgt gcccggaact aggtccccgc ccctgaaccg atacaactcg accgggtcac 900 cacccggaaa gccgccgtcc acccaagacg agcacatcaa cagcggggac actccggccg 960 tgcgcgtgaa ggaccggaag ccacccatcg gcactcggag cgtgtctgac tgtcctgcga 1020 atggtagacc catccaccct ggcctggaaa ccgactccac caagaaggga ataggggaga 1080 acacctccag catgaaggag atggctactc tgctcacctc gcttggcgtg atccagtccg 1140 cgcaagagtt cgaatccagc cgcgacgcct cctacgtgtt cgcgcggcgc gccctgaagt 1200 ccgcgaacta cgccgagatg actttcaacg tgtgcggatt gatcctgtcc gcggaaaaga 1260 gctccgcaag aaaagtggac gagaacaagc agctgctcaa gcagatccag gagagcgtgg 1320 agtccttccg cgacatctac aaacgcttct ccgagtatca gaaggagcag aactcccttc 1380 tcatgtccaa cctgtccacc cttcacatca tcactgatcg gggtggaaag acggataaca 1440 ccgattcgtt gacccgctcc ccgagcgtgt tcgccaagtc caaagagaac aagactaagg 1500 ccaccagatt tgatccttcg atggaaaccc tggaggacat gaagtacaag cccgacctca 1560 ttcgggagga cgaattccgg gacgagatca gaaacccggt gtaccaagag agggacaccg 1620 aaccccgcgc tagcaatgct agccgcctcc tgccgtcaaa ggagaagcca accatgcact 1680 cgctgcggct ggtcattgaa agctctcccc tgtcccgcgc ggaaaaggtc gcctacgtga 1740 aaagcctctc gaagtgcaag accgaccagg aagtgaaggc cgtgatggaa ctggtggagg 1800 aggacatcga atccctcacc aattgaaccg gtagatctac gaggcctcag tttgtctact 1860 tggtcttaag aaaaacttag ggtgaaagcc tcagtgcccc attctcactg ctactagtcg 1920 ccaacatggc cggccttctg tccactttcg acacctttag ctcacggcgc tccgagtcca 1980 tcaacaagtc cggcggtgga gccgtgatcc ctggacagcg ctccactgtc tccgtgttcg 2040 tcctcgggcc gtcggtgacc gacgacgccg acaagctgtt catcgccact actttcctcg 2100 ctcattccct ggataccgat aagcagcact cccagcgcgg aggttttttg gtgtctctcc 2160 tggcaatggc ctactcgtcc ccggagctgt acctgacaac taacggagtg aacgcggacg 2220 tgaaatacgt gatctacaac atcgaaaagg acccgaagcg gaccaagacc gacggtttca 2280 ttgtcaagac tcgggatatg gagtacgaga ggaccaccga gtggcttttc ggcccaatgg 2340 tcaacaagag cccgctgttc caaggacagc gggacgccgc ggaccccgac accctgctgc 2400 aaatctacgg ctaccctgct tgcctgggag ccatcatcgt ccaagtctgg attgtgctcg 2460 tgaaggccat taccagctcc gccggtctga gaaaggggtt tttcaaccgc ctggaggcgt 2520 tcagacagga cggcaccgtg aagggggcac tggtgttcac cggcgaaacc gtggaaggaa 2580 tcggctcagt gatgcggtcc cagcagtccc tggtgtcgct gatggtggaa actctcgtga 2640 ccatgaacac ggcccggtcg gacctgacca ccctggagaa gaacatccag attgtgggca 2700 actacattcg ggatgccgga ctcgctagct tcatgaacac tattaagtac ggagtggaaa 2760 ccaagatggc cgccctgact ctctccaacc tgaggcccga tatcaacaag ctgcgctcgc 2820 tgatcgatac ctacctgtca aaggggccca gggccccatt catttgcata cttaaagacc 2880 ctgtgcacgg agagttcgcc cctggaaact atcccgctct gtggagctac gcaatgggag 2940 tggccgtggt gcagaacaag gccatgcagc aatacgtcac cgggaggacc tatctcgata 3000 tggagatgtt cctgctgggg caggccgtgg cgaaggacgc agaaagcaaa atctcgtcgg 3060 cccttgaaga tgaactgggt gtcactgaca ccgcgaaggg cagactcaga caccacttgg 3120 ccaacctcag cggaggagat ggagcttacc acaagccgac tgggggtgga gcgattgaag 3180 tcgccctgga taacgccgac atcgaccttg agactaaggc gcatgcggac caggacgcca 3240 ggggatgggg cggggacagc ggcgaacgct gggcccgcca agtgtccggc ggtcacttcg 3300 tgaccttgca tggcgcggag cgcctggaag aggaaaccaa tgatgaggac gtgtcagaca 3360 tcgaaagacg gatcgccatg cgactggctg aacggcgcca ggaggattcc gcgacgcacg 3420 gggacgaggg acggaacaat ggagtggacc acgacgaaga tgacgacgcc gcagccgtgg 3480 ccggaatcgg cggaatctag cggtttattt attgatcctt atttattcaa gtcgacggag 3540 ccgcaccttg tcatgtacca tcaatattaa gaaaaactta gggtgaaagt ctcccctcct 3600 cacacctagg agaccaccat gcccagcttt ctgaagaaga ttctgaaact gagaggacga 3660 agacaggaag atgagtctcg aagtcggatg ctgtccgaca gctccatgct gtcttgcagg 3720 gtgaaccagc tgactagcga gggaaccgaa gctggctcaa ccacacccag cacactgcct 3780 aaagaccagg ccctgctgat cgagccaaag gtccgggcta aggaaaaatc ccagcaccgg 3840 agacccaaga tcattgatca ggtgaggcgc gtcgagagtc tgggggaaca ggcatcacag 3900 cggcagaaac atatgctgga gaccctgatc aacaaaatct acacaggccc tctgggggag 3960 gaactggtgc agactctgta tctgagaatc tgggccatgg aggaaacccc agagtctctg 4020 aaaatcctgc agatgcgcga agacattcga gatcaggtcc tgaagatgaa aacagagaga 4080 tggctgagga ctctgattag gggcgaaaag accaaactga aggatttcca gaagcggtac 4140 gaggaagtgc acccctatct gatgaaagag aaggtggaac aggtcatcat ggaagaggct 4200 tggtcactgg cagctcatat tgtgcaggag taatgacccg gg 4242 <210> 82 <211> 6884 <212> DNA <213> Artificial Sequence <220> <223> hPolL cDNA <400> 82 gcggccgctt aagaaaaact tagggtgaat gtaaagcttt ctggccacca tggacggaca 60 ggaatctagc cagaatccca gcgacatcct gtatcccgag tgccacctga atagcccaat 120 cgtgagagga aaaatcgccc agctgcacgt gctgctggac gtgaaccagc catataggct 180 gaaggacgat tccatcatta atatcacaaa gcataagatt cgcaacggcg ggctgtctcc 240 ccgccagatt aagatccgaa gtctgggcaa agccctgcag cgcactatca aagatctgga 300 ccgatacacc ttcgagcctt acccaacata tagccaggaa ctgctgaggc tggacattcc 360 agagatctgc gataagatcc gcagcgtgtt tgctgtctcc gaccggctga ccagagagct 420 gagctccggc ttccaggatc tgtggctgaa tatcttcaag cagctgggga acatcgaggg 480 aagagaaggc tatgatccac tgcaggacat tggcaccatc cccgagatta cagacaagta 540 ctctcgcaac cgatggtata ggcccttcct gacctggttt agtatcaagt acgacatgcg 600 atggatgcag aaaacacggc ccggaggccc tctggatact tccaactctc acaatctgct 660 ggagtgcaaa agctacacac tggtgactta tggagatctg gtcatgatcc tgaataagct 720 gactctgacc ggctacattc tgacccccga actggtgctg atgtattgtg acgtggtcga 780 gggaagatgg aacatgagcg ccgctggcca tctggacaag aagagcattg gcatcaccag 840 taagggggag gaactgtggg aactggtgga ctccctgttc tctagtctgg gagaggaaat 900 ctataatgtg attgccctgc tggagcctct gtctctggct ctgattcagc tgaacgatcc 960 agtgatcccc ctgcggggcg ccttcatgag acacgtcctg accgagctgc agaccgtgct 1020 gacaagcagg gatgtctaca ctgacgcaga ggccgatacc atcgtggaat ccctgctggc 1080 aatctttcat gggacatcta ttgacgagaa ggccgaaatc ttcagtttct ttcggacatt 1140 tggacacccc tcactggagg ccgtgactgc agccgataag gtcagagctc atatgtacgc 1200 acagaaagcc atcaagctga aaaccctgta tgaatgccac gccgtgttct gcaccatcat 1260 tatcaatggc taccgggaga gacacggggg acagtggcca ccttgcgatt ttcctgacca 1320 cgtgtgcctg gaactgcgca acgctcaggg gtcaaatact gcaatcagct acgagtgtgc 1380 cgtggacaac tataccagct tcattggatt caagtttaga aagttcatcg agccacagct 1440 ggatgaagac ctgaccatct acatgaagga taaagcactg tcccccagga aagaagcctg 1500 ggactccgtg tatcctgatt ctaatctgta ctataaggcc ccagagtctg aggaaacacg 1560 gagactgatc gaggtgttca ttaatgacga aaactttaat cccgaggaaa ttatcaacta 1620 cgtggagagc ggggactggc tgaaggatga ggaattcaac attagttatt cactgaagga 1680 gaaagaaatc aagcaggaag gacgcctgtt tgccaagatg acatacaaaa tgcgagctgt 1740 gcaggtcctg gcagagactc tgctggccaa gggaatcggc gagctgttct ccgaaaatgg 1800 gatggtgaag ggagagattg acctgctgaa acgactgacc acactgagcg tgtccggcgt 1860 ccctcggacc gatagcgtgt ataacaattc aaagtcaagc gagaaaagga acgaggggat 1920 ggaaaacaaa aattctggcg ggtattggga cgagaagaaa aggagtcgcc acgaattcaa 1980 ggccaccgac tcctctacag atggctacga gactctgagt tgctttctga ctaccgatct 2040 gaagaaatat tgtctgaatt ggcggttcga atctaccgct ctgtttgggc agagatgcaa 2100 tgagatcttc ggcttcaaga ccttcttcaa ctggatgcat cccgtgctgg agagatgcac 2160 catctacgtg ggcgaccctt attgtccagt cgctgatagg atgcaccgcc agctgcagga 2220 tcatgcagac tccgggattt tcatccacaa ccctagggga ggcatcgagg gatactgtca 2280 gaagctgtgg accctgattt ctatcagtgc cattcatctg gctgcagtgc gggtcggagt 2340 gagagtctcc gctatggtgc agggcgacaa tcaggctatc gcagtcacct ctcgcgtgcc 2400 cgtcgctcag acatataaac agaagaaaaa ccacgtgtac gaggaaatta caaagtattt 2460 cggcgcactg cggcacgtga tgtttgatgt cgggcatgag ctgaaactga atgaaactat 2520 catcagttca aagatgttcg tgtactccaa aagaatctac tatgacggca agatcctgcc 2580 acagtgcctg aaggccctga ctaaatgcgt gttctggagc gagaccctgg tcgatgaaaa 2640 caggtcagct tgcagcaata tctcaactag cattgccaaa gctatcgaga acggctacag 2700 ccccatcctg gggtactgta ttgccctgta taagacctgc cagcaggtgt gcatctcact 2760 gggcatgact attaatccca ccatcagccc tacagtgaga gaccagtact tcaaggggaa 2820 aaactggctg aggtgcgctg tgctgatccc cgcaaacgtc gggggattca attatatgtc 2880 cacctctagg tgttttgtgc gcaacatcgg ggaccctgca gtcgccgctc tggctgatct 2940 gaaacgattc attcgggccg atctgctgga caagcaggtg ctgtaccgcg tgatgaatca 3000 ggagcctgga gatagctcct ttctggactg ggcaagcgat ccctattcct gcaacctgcc 3060 tcacagtcag tcaatcacaa ctattatcaa gaatatcacc gccaggagcg tgctgcagga 3120 atcccccaac cctctgctga gcgggctgtt cacagagact tccggagagg aagacctgaa 3180 tctggccagc ttcctgatgg atagaaaagt gatcctgcca agggtcgccc atgaaatcct 3240 gggaaacagc ctgaccggcg tgagagaggc aatcgccgga atgctggaca ccacaaagtc 3300 tctggtgcga gccagtgtcc ggaaaggagg actgagctac ggcatcctga ggcgcctggt 3360 gaattacgac ctgctgcagt atgaaaccct gacaagaact ctgaggaagc ccgtgaaaga 3420 taacatcgag tacgaatata tgtgcagcgt ggagctggca gtcggactgc gacagaagat 3480 gtggattcac ctgacttacg ggcgacctat ccacggcctg gagaccccag atcccctgga 3540 actgctgagg ggcattttca tcgaggggtc agaagtgtgc aagctgtgcc gcagcgaggg 3600 agctgaccct atctacacct ggttttatct gccagataat attgatctgg acaccctgac 3660 aaacggatgt cctgcaattc gcatcccata cttcggctct gctacagacg agagaagtga 3720 agcacagctg ggctatgtga ggaatctgag caagcctgcc aaagcagcca ttcggatcgc 3780 tatggtgtat acctgggcat atgggaccga tgagattagc tggatggaag ctgcactgat 3840 cgcacagaca cgcgccaacc tgtccctgga gaatctgaag ctgctgactc cagtgagcac 3900 ttccaccaac ctgtcccacc ggctgaagga cacagccact cagatgaaat tctctagtgc 3960 aaccctggtg cgcgccagcc ggttcatcac aatcagcaac gacaatatgg ctctgaagga 4020 ggcaggagaa tctaaagata caaatctggt gtaccagcag atcatgctga ctggcctgag 4080 tctgttcgag tttaacatgc gctacaagaa ggggtcactg ggaaagcctc tgatcctgca 4140 cctgcatctg aacaatggct gctgtattat ggagtcccca caggaagcca atatcccacc 4200 ccggtctaca ctggacctgg agattactca ggaaaacaat aagctgatct atgatcctga 4260 cccactgaaa gatgtggacc tggaactgtt ctccaaggtg agggacgtgg tccacactgt 4320 cgatatgacc tactggagcg acgatgaagt gatccgcgcc acctccattt gcactgccat 4380 gaccatcgct gacacaatgt cccagctgga tcgggacaac ctgaaggaaa tgattgctct 4440 ggtgaacgac gatgacgtga attctctgat taccgagttc atggtcatcg atgtcccact 4500 gttctgttca acatttggag gcatcctggt gaatcagttt gcctacagcc tgtatggact 4560 gaacattcga ggccgggagg aaatctgggg ccacgtggtc agaatcctga aggacacctc 4620 ccatgcagtg ctgaaagtcc tgtctaatgc cctgagtcac cccaagattt tcaaaaggtt 4680 ttggaacgca ggagtggtcg agccagtgta cggacccaac ctgtctaatc aggataagat 4740 cctgctggct ctgtcagtgt gcgaatatag cgtggacctg ttcatgcacg attggcaggg 4800 gggagtgccc ctggagatct tcatctgtga taatgaccct gatgtcgcag acatgcggcg 4860 gagcagcttc ctggcacgcc atctggccta cctgtgctcc ctggccgaaa tctctagaga 4920 tggccccagg ctggagtcca tgaactctct ggagcggctg gaaagtctga aatcatacct 4980 ggagctgact ttcctggatg accccgtgct gagatatagc cagctgaccg gcctggtcat 5040 caaggtcttt ccttccaccc tgacatacat ccggaagtcc agcatcaagg tgctgagaac 5100 cagggggatc ggagtgcccg aggtcctgga agactgggat cctgaagctg acaatgcact 5160 gctggatggc attgccgctg agatccagca gaacattcca ctgggacacc agacacgggc 5220 cccattttgg ggactgagag tgtctaaaag tcaggtcctg cgcctgcgag ggtacaagga 5280 gatcaccagg ggcgaaattg ggcgcagtgg agtgggactg acactgccat tcgacggcag 5340 gtatctgtca catcagctgc gcctgtttgg gatcaactca actagctgcc tgaaggccct 5400 ggaactgacc tacctgctga gccccctggt ggacaaggat aaagacagac tgtacctggg 5460 agagggcgct ggggcaatgc tgagctgcta tgacgctacc ctgggccctt gtatcaacta 5520 ctataattca ggcgtgtact cctgtgatgt caacgggcag cgcgagctga atatctaccc 5580 agccgaagtg gctctggtcg ggaagaaact gaacaatgtg acctctctgg gacagcgggt 5640 gaaggtcctg ttcaacggaa atcccggcag tacatggatt ggaaacgacg agtgcgaagc 5700 cctgatctgg aacgagctgc agaatagttc aattggcctg gtgcactgtg acatggaagg 5760 cggggatcat aaagatgacc aggtggtcct gcacgagcat tacagcgtga ttcgaatcgc 5820 ttatctggtc ggcgatcggg acgtggtcct gatctcaaag attgcacctc gactggggac 5880 agactggact cggcagctga gcctgtacct gagatattgg gatgaagtga atctgatcgt 5940 cctgaaaacc tccaacccag cctctacaga aatgtacctg ctgagtaggc accccaagtc 6000 agacattatc gaggattcca aaaccgtgct ggcttctctg ctgccactga gtaaggagga 6060 ctcaattaag atcgaaaaat ggattctgat cgagaaggcc aaagctcacg aatgggtgac 6120 cagagagctg agggaaggga gctcctctag tggaatgctg aggccttacc atcaggccct 6180 gcagacattc ggctttgagc caaacctgta taagctgagc cgcgacttcc tgtccactat 6240 gaacattgct gatacccata attgcatgat cgcattcaac cgggtgctga aagacacaat 6300 ttttgagtgg gccaggatca ctgaaagcga taagcgcctg aaactgacag gaaagtacga 6360 cctgtatcct gtgcgcgata gcggcaagct gaaaactatc agtagaaggc tggtgctgtc 6420 atggatttcc ctgtctatga gtacacggct ggtcactggg tccttcccag accagaaatt 6480 tgaagccaga ctgcagctgg gaatcgtgtc tctgtcaagc agggagattc gcaatctgcg 6540 agtcatcact aagaccctgc tggacagatt cgaagatatt atccacagca tcacatacag 6600 atttctgact aaggagatca agatcctgat gaagattctg ggagccgtga aaatgtttgg 6660 cgctcggcag aacgagtaca ccactgtgat tgatgatggc agcctggggg acattgaacc 6720 ctacgactcc tcctaaaccg gtagccgcac cttgtcatgt accatcaata aagtaccctg 6780 tgctcaacga agtcttggac tgatccatat gacaatagta agaaaaactt acaagaagac 6840 aagaaaattt aaaagaatac atatctctta aactcttgtc tggt 6884 <210> 83 <211> 2237 <212> DNA <213> Artificial Sequence <220> <223> hRIG-IC cDNA <400> 83 ccggtagcag aaatagactg ggaagatgca caacttaaga aaaacttagg gtgaaagcct 60 gcgacaaaac ctcctccttt tccaagtgta ccaccatgga atgtcagaac ctgtcagaaa 120 actcctgtcc ccccagcgaa gtgtcagata ctaacctgta ctcccctttc aagccacgga 180 attaccagct ggagctggcc ctgcccgcta tgaagggcaa aaacaccatc atttgcgctc 240 ctaccggatg tggcaagaca ttcgtgtctc tgctgatttg tgaacaccat ctgaagaaat 300 ttcctcaggg gcagaaggga aaagtggtct tctttgccaa ccagatccca gtgtatgagc 360 agcagaagag tgtcttctca aaatactttg aacgacacgg ctatcgggtg acaggcatca 420 gcggggcaac tgccgagaat gtgcccgtcg agcagattgt ggaaaacaat gacatcatta 480 tcctgacccc acagatcctg gtgaacaatc tgaagaaagg gaccattccc tcactgagca 540 tcttcacact gatgattttt gacgagtgcc acaatacatc taagcagcat ccttacaaca 600 tgatcatgtt caactatctg gatcagaaac tgggagggag ctccggacca ctgcctcagg 660 tcatcggcct gacagcaagc gtgggagtcg gagacgccaa gaacactgac gaggctctgg 720 attacatctg caagctgtgc gcttctctgg atgcaagtgt gattgccact gtcaagcaca 780 atctggagga actggagcag gtggtctaca agcctcagaa attctttagg aaggtggaaa 840 gcaggatctc cgataagttc aaatatatta tcgcacagct gatgcgggac accgagagcc 900 tggccaagag aatctgtaaa gatctggaaa acctgtccca gattcagaat agagagtttg 960 ggactcagaa gtatgaacag tggattgtga ccgtccagaa agcctgcatg gtgttccaga 1020 tgccagacaa ggatgaagaa agtcgaatct gtaaggccct gttcctgtat acctcacacc 1080 tgcggaagta taacgacgct ctgattatct cagagcatgc aagaatgaag gacgccctgg 1140 attacctgaa agatttcttt agcaatgtga gggccgctgg cttcgacgag atcgaacagg 1200 atctgactca gaggtttgag gaaaagctcc aggagctgga atccgtgtct cgcgacccaa 1260 gcaacgagaa tcccaaactg gaagatctgt gcttcatcct ccaggaggaa tatcacctga 1320 acccagagac cattacaatc ctgtttgtga agaccagagc tctggtggac gcactgaaaa 1380 actggattga agggaatcct aagctgtcct tcctgaaacc aggaatcctg actggcaggg 1440 ggaagaccaa ccagaatact ggaatgaccc tgcccgctca gaagtgcatt ctggacgcct 1500 tcaaggccag cggagatcat aacattctga tcgccacatc tgtggctgac gagggcattg 1560 atatcgccca gtgtaacctg gtcatcctgt acgaatatgt gggcaatgtc attaagatga 1620 tccagactcg gggaagaggc agggctcgcg gctcaaagtg cttcctgctg accagcaatg 1680 caggcgtgat cgagaaggaa cagattaaca tgtataagga gaagatgatg aacgacagta 1740 ttctgaggct ccagacatgg gatgaggccg tgttccgcga aaagattctg cacatccaga 1800 ctcatgagaa gttcatccgc gactcccagg aaaagccaaa acccgtgcct gataaggaga 1860 acaagaaact gctgtgccga aagtgtaaag ctctggcatg ctacaccgca gacgtgcggg 1920 tcatcgagga atgtcactat acagtgctgg gcgatgcctt caaggagtgc tttgtctccc 1980 ggccacatcc caagcctaaa cagttctcta gttttgaaaa gcgcgctaaa atcttctgcg 2040 cacgacagaa ttgttctcac gactggggca tccacgtgaa gtacaaaacc ttcgagattc 2100 ccgtcattaa gatcgagtct tttgtggtcg aagatatcgc cacaggagtg cagactctgt 2160 atagtaagtg gaaagatttt cattttgaga agattccctt tgacccagca gagatgtcta 2220 agtaactcga ccccggg 2237 <210> 84 <211> 317 <212> DNA <213> Artificial Sequence <220> <223> hV-Unique Region cDNA <400> 84 ccggtagcag aaatagactg ggaagatgca caacttaaga aaaacttagg gtgaaagcct 60 gcgacaaaac ctcctccttt tccaagtgta ccaccatggg ccaccgacgg gaacatatca 120 tctacgagcg ggatgggtat atcgtggacg aatcttggtg caatccagtc tgtagtcgca 180 ttcgaatcat tcccagaagg gagctgtgcg tgtgtaaaac ctgtcctaag gtctgcaaac 240 tgtgtaggga cgatatccag tgcatgcgcc ccgacccttt ctgtagagaa atttttagga 300 gctgactcga ccccggg 317 <210> 85 <211> 857 <212> DNA <213> Artificial Sequence <220> <223> hPSMA7 cDNA <400> 85 ccggtagcag aaatagactg ggaagatgca caacttaaga aaaacttagg gtgaaagcct 60 gcgacaaaac ctcctccttt tccaagtgta ccaccatgag ttacgataga gcaatcacag 120 tgttctcccc cgatggacat ctgtttcagg tcgagtatgc ccaggaagcc gtcaaaaaag 180 ggtccactgc cgtgggggtc cgaggacggg acatcgtggt cctgggggtg gagaagaaat 240 ctgtcgcaaa gctccaggat gaacgcaccg tgcgaaaaat ttgcgccctg gacgataacg 300 tctgtatggc cttcgctggc ctgacagcag acgcacgaat cgtgattaat agagccaggg 360 tcgagtgcca gagccaccgc ctgactgtgg aggaccccgt gactgtcgaa tacatcacca 420 ggtatattgc cagcctgaag cagcggtaca cccagtccaa cggccggaga cccttcggga 480 tcagcgccct gattgtggga ttcgactttg atggcacacc cagactgtac cagacagacc 540 cttcaggcac ttatcatgcc tggaaagcta acgcaatcgg acggggcgct aagagcgtga 600 gagagttcct ggagaagaac tacaccgatg aggctattga aaccgacgat ctgaccatca 660 agctggtcat caaggccctg ctggaggtgg tccagtctgg agggaagaac atcgaactgg 720 cagtgatgag gcgcgaccag agtctgaaga tcctgaatcc cgaggaaatt gagaaatatg 780 tggctgagat tgagaaagaa aaggaggaga atgagaaaaa gaaacagaag aaagccagtt 840 gataactcga ccccggg 857 <210> 86 <211> 1707 <212> DNA <213> Artificial Sequence <220> <223> hPolS cDNA <400> 86 atggaccagg acgcattcat tctgaaagaa gattcagaag tcgaacgcga agcccccggt 60 ggaagggagt ctctcagcga cgtgatcgga ttcctggacg ccgtgctgtc atcggaaccg 120 accgacattg ggggagacag gtcgtggctg cacaacacta tcaacacccc gcaagggcct 180 ggctccgcgc atcgggccaa gtcggaggga gaaggagaag tgtcaacccc gagcacccag 240 gacaaccgct caggggaaga gtccagagtc tccggtagaa cgtcaaagcc tgaagccgag 300 gcccatgccg gaaacctgga taagcagaac attcaccggg cctttggtgg ccgcaccggg 360 acaaactccg tgtcgcaaga cctgggcgat ggcggcgatt ccggtatcct ggagaatccc 420 ccaaacgaga ggggataccc aagatccgga atcgaggacg aaaaccggga aatggcagcc 480 caccctgata agcggggcga agatcaggcc gaaggcctgc ctgaggaggt ccggggatcg 540 acctccttgc ctgacgaagg ggaaggcggc gcctcgaaca acggccggtc aatggagccc 600 ggcagctccc attccgctcg ggtcactgga gtcctcgtga ttccttcccc ggaactggag 660 gaagccgtgc tgaggcggaa caagcggcgg ccgaccaact ccggatcaaa gcctctgact 720 cccgccaccg tgcccggaac taggtccccg cccctgaacc gatacaactc gaccgggtca 780 ccacccggaa agccgccgtc cacccaagac gagcacatca acagcgggga cactccggcc 840 gtgcgcgtga aggaccggaa gccacccatc ggcactcgga gcgtgtctga ctgtcctgcg 900 aatggtagac ccatccaccc tggcctggaa accgactcaa caaaaaaggg cataggagag 960 aacacatcat ctatgaaaga gatggctaca ttgttgacga gtcttggtgt aatccagtct 1020 gctcaagaat tcgaatcatc ccgagacgcg agttatgtgt ttgcaagacg tgccctaaag 1080 tctgcaaact atgcagagat gacattcaat gtatgcggcc tgatcctttc tgccgagaaa 1140 tcttccgctc gtaaagtgga cgagaacaag cagctgctca agcagatcca ggagagcgtg 1200 gagtccttcc gcgacatcta caaacgcttc tccgagtatc agaaggagca gaactccctt 1260 ctcatgtcca acctgtccac ccttcacatc atcactgatc ggggtggaaa gacggataac 1320 accgattcgt tgacccgctc cccgagcgtg ttcgccaagt ccaaagagaa caagactaag 1380 gccaccagat ttgatccttc gatggaaacc ctggaggaca tgaagtacaa gcccgacctc 1440 attcgggagg acgaattccg ggacgagatc agaaacccgg tgtaccaaga gagggacacc 1500 gaaccccgcg ctagcaatgc tagccgcctc ctgccgtcaa aggagaagcc aaccatgcac 1560 tcgctgcggc tggtcattga aagctctccc ctgtcccgcg cggaaaaggt cgcctacgtg 1620 aaaagcctct cgaagtgcaa gaccgaccag gaagtgaagg ccgtgatgga actggtggag 1680 gaggacatcg aatccctcac caattga 1707 <210> 87 <211> 918 <212> DNA <213> Artificial Sequence <220> <223> Human NANOG cDNA <400> 87 atgagtgtgg atccagcttg tccccaaagc ttgccttgct ttgaagcatc cgactgtaaa 60 gaatcttcac ctatgcctgt gatttgtggg cctgaagaaa actatccatc cttgcaaatg 120 tcttctgctg agatgcctca cacggagact gtctctcctc ttccttcctc catggatctg 180 cttattcagg acagccctga ttcttccacc agtcccaaag gcaaacaacc cacttctgca 240 gagaagagtg tcgcaaaaaa ggaagacaag gtcccggtca agaaacagaa gaccagaact 300 gtgttctctt ccacccagct gtgtgtactc aatgatagat ttcagagaca gaaatacctc 360 agcctccagc agatgcaaga actctccaac atcctgaacc tcagctacaa acaggtgaag 420 acctggttcc agaaccagag aatgaaatct aagaggtggc agaaaaacaa ctggccgaag 480 aatagcaatg gtgtgacgca gaaggcctca gcacctacct accccagcct ttactcttcc 540 taccaccagg gatgcctggt gaacccgact gggaaccttc caatgtggag caaccagacc 600 tggaacaatt caacctggag caaccagacc cagaacatcc agtcctggag caaccactcc 660 tggaacactc agacctggtg cacccaatcc tggaacaatc aggcctggaa cagtcccttc 720 tataactgtg gagaggaatc tctgcagtcc tgcatgcagt tccagccaaa ttctcctgcc 780 agtgacttgg aggctgcctt ggaagctgct ggggaaggcc ttaatgtaat acagcagacc 840 actaggtatt ttagtactcc acaaaccatg gatttattcc taaactactc catgaacatg 900 caacctgaag acgtgtga 918 <210> 88 <211> 630 <212> DNA <213> Artificial Sequence <220> <223> Human LIN28 cDNA <400> 88 atgggctccg tgtccaacca gcagtttgca ggtggctgcg ccaaggcggc agaagaggcg 60 cccgaggagg cgccggagga cgcggcacgg gcggcggacg agcctcagct gctgcacggt 120 gcgggcatct gtaagtggtt caacgtgcgc atggggttcg gcttcctgtc catgaccgcc 180 cgcgccgggg tcgcgctcga ccccccagtg gatgtctttg tgcaccagag taagctgcac 240 atggaagggt tccggagctt gaaggagggt gaggcagtgg agttcacctt taagaagtca 300 gccaagggtc tggaatccat ccgtgtcacc ggacctggtg gagtattctg tattgggagt 360 gagaggcggc caaaaggaaa gagcatgcag aagcgcagat caaaaggaga caggtgctac 420 aactgtggag gtctagatca tcatgccaag gaatgcaagc tgccacccca gcccaagaag 480 tgccacttct gccagagcat cagccatatg gtagcctcat gtccgctgaa ggcccagcag 540 ggccctagtg cacagggaaa gccaacctac tttcgagagg aagaagaaga aatccacagc 600 cctaccctgc tcccggaggc acagaattga 630 <210> 89 <211> 1800 <212> DNA <213> Artificial Sequence <220> <223> Human IgM 9F11 heavy chain cDNA <400> 89 atgtcagtgt catttctgat ttttctgcca gtcctggggc tgccttgggg ggtcctgtca 60 caggtccagc tgcagcagtc cgggccagga ctggtgaaac ctgctcagac actgtccctg 120 acttgcgcaa tcagtggcga ctcagtgagc tccaactctg ctacctggaa ttggattaga 180 cagagtccac tgaggggact ggagtggctg ggacggacat actatagaag caaatggtac 240 aacgactatg ccgtgagcgt caagtcccgg atcaccatta accctgatac aagcaagaat 300 cagttctccc tgcagctgaa ttctgtcacc ccagaagaca cagcagtgta ctattgtgcc 360 agggagaact actatggatc cggccgctac aattggttcg atccttgggg gcagggaaca 420 ctggtgactg tctctagtgg aagcgcatcc gccccaaccc tgtttcccct ggtgagctgc 480 gaaaactctc ccagtgacac atcaagcgtg gctgtcggct gtctggcaca ggacttcctg 540 cctgattcaa tcacttttag ctggaagtac aaaaacaatt cagacatcag cagcaccaga 600 ggctttccat ctgtgctgag aggcgggaaa tatgccgcta caagccaggt cctgctgccc 660 tccaaggacg tgatgcaggg aactgatgag cacgtggtct gcaaagtgca gcatcccaac 720 ggcaataagg agaagaacgt cccactgccc gtgatcgctg agctgccacc taaggtgtcc 780 gtcttcgtgc caccccgaga cggattcttt ggcaatcccc ggaagtctaa actgatctgt 840 caggccaccg ggttttcacc tagacagatt caggtgagct ggctgaggga aggaaagcag 900 gtcggctctg gggtgaccac agatcaggtc caggctgaag caaaggagag cgggccaact 960 acctacaaag tgacctccac actgactatc aaggagtctg actggctgtc acagagcatg 1020 ttcacatgca gggtggatca ccgcggcctg acttttcagc agaatgcaag ttcaatgtgt 1080 gtccccgacc aggataccgc catcagggtg ttcgctattc ctccatcttt cgccagtatt 1140 tttctgacca agtccacaaa actgacttgc ctggtcacag acctgacaac ttatgattcc 1200 gtgactatct cttggacccg ccagaacggc gaagccgtga agacccacac aaacatttcc 1260 gagtctcatc ccaatgcaac cttctctgcc gtgggcgaag ctagtatctg cgaggacgat 1320 tggaatagcg gggagcggtt cacctgtacc gtgacacaca ctgacctgcc tagtccactg 1380 aagcagacca tttcacgccc taaaggcgtc gccctgcatc gaccagatgt gtacctgctg 1440 ccacctgccc gcgaacagct gaacctgcga gagagtgcta ccatcacatg tctggtgacc 1500 ggcttctccc ccgctgatgt ctttgtgcag tggatgcagc gaggacagcc actgagccct 1560 gaaaagtacg tgacatccgc acccatgcct gagccacagg cacctggcag atattttgcc 1620 cacagtattc tgactgtgtc agaggaagag tggaacaccg gggagactta tacctgcgtg 1680 gtcgcccatg aagctctgcc aaatcgagtc accgagcgga cagtggacaa gagcacaggg 1740 aaacccactc tgtataacgt cagtctggtc atgtcagata ctgccggaac ctgttattga 1800 <210> 90 <211> 714 <212> DNA <213> Artificial Sequence <220> <223> Human IgM 9F11 light chain cDNA <400> 90 atggatatgc gagtgcccgc tcagctgctg ggactgctgc tgctgtggtt ccccggatca 60 agatgcgaca ttcagatgac tcagagccca agctccgtgt ctgcaagtgt cggcgaccga 120 gtgaccatca catgcagagc ctcccagggg atttctagtt ggctggcttg gtatcagcag 180 aagccaggga aagctcccaa gctgctgatc tatgatgcat caagcctgca gagtggagtg 240 ccctcacgat tctcaggcag cgggtccgga accgacttta ctctgaccat ttcctctctg 300 cagcctgagg atttcgcaac atactattgc cagcaggcca acagcttccc actgaccttt 360 ggcgggggaa caaaagtgga gatcaagagg actgtcgccg ctccctctgt gttcattttt 420 ccccctagtg acgaacagct gaaaagcggc acagcttccg tggtctgtct gctgaacaat 480 ttttaccctc gcgaagcaaa agtccagtgg aaggtggata acgccctgca gtctgggaat 540 agtcaggagt cagtgactga acaggacagc aaagattcca cctattctct gagttcaaca 600 ctgactctgt ccaaggctga ctacgagaag cacaaactgt atgcatgcga agtcacacat 660 cagggactga gctcccctgt gactaagtct ttcaatagag gcgagtgttg ataa 714 <210> 91 <211> 1410 <212> DNA <213> Artificial Sequence <220> <223> Human IgG HC1 heavy chain cDNA <400> 91 atggattgga cttggagatt cctcttcgtc gtagcagcag ctacaggtgt ccagtccgag 60 gtgcagctgg tggaatcagg ggggggactg gtgcagcctg gagggtcact gcgactgtct 120 tgtgccgctt ctgggttcac ttttaccgac tacacaatgg attgggtgcg caaggcacct 180 ggcaagggac tggagtgggt cgctgatgtg aacccaaata gcggcgggtc catctacaac 240 caggagttca agggccggtt caccctgtcc gtggaccgat ctaaaaacac cctgtatctg 300 cagatgaata gcctgcgagc tgaagatact gcagtgtact attgcgcccg gaatctgggc 360 cccagcttct actttgacta ttggggacag ggcactctgg tcaccgtgag ctccgctagt 420 acaaagggcc cttcagtgtt cccactggca ccctctagta aatccacatc tggaggcact 480 gccgctctgg ggtgtctggt gaaggactac ttcccagagc ccgtcaccgt gtcttggaac 540 agtggggcac tgactagcgg agtcgcaacc ggacctgccg tgctgcagtc aagcggactg 600 tactccctgt cctctgtggt caccgtccca agttcaagcc tgggcactca gacctatatc 660 tgcaacgtga atcacaagcc aagtaataca aaagtggaca agaaagtgga gcccaagtct 720 tgtgataaaa cacatacttg ccccccttgt cctgcaccag aactgctggg gggaccctcc 780 gtgttcctgt ttccacccaa gcctaaagat accctgatga ttagcaggac cccagaggtc 840 acatgcgtgg tcgtggacgt gagccacgag gaccccgaag tcaagtttaa ctggtacgtg 900 gacggcgtcg aagtgcataa tgctaagaca aaacccaggg aggaacagta caacagcacc 960 tatcgcgtcg tgtccgtcct gacagtgctg catcaggatt ggctgaacgg aaaagagtat 1020 aagtgcaaag tgtccaataa ggcactgccc gcccctatcg agaaaacaat ttctaaggcc 1080 aaaggccagc ctagagaacc acaggtgtat accctgcctc catccaggga tgaactgaca 1140 aagaaccagg tctctctgac ttgtctggtg aaaggcttct atccctcaga tattgctgtg 1200 gagtgggaaa gcaatgggca gcctgagaac aattacaaga ccacaccccc tgtgctggac 1260 tcagatggga gcttctttct gtattctaag ctgaccgtgg acaaaagtcg gtggcagcag 1320 ggaaatgtct ttagttgttc agtgatgcac gaagcactgc acaaccatta cactcagaaa 1380 tcactgtcac tgtcccctgg caagtgataa 1410 <210> 92 <211> 702 <212> DNA <213> Artificial Sequence <220> <223> Human IgG LC1 light chain cDNA <400> 92 atggcttggg ctctgctgct gctgacactg ctgacccagg atacaggatc ttgggctcgc 60 attcagatga cccagtcccc tagttctctg tccgcctctg tgggcgacag ggtcaccatc 120 acatgcaagg ctagccagga cgtgagcatt ggagtcgcat ggtatcagga taagccaggc 180 aaagcaccca agctgctgat ctatagtgcc tcataccggt ataccggggt gcccagcaga 240 ttcagcggat ccgggtctgg aacagacttt actctgacca ttagctccct gcagccagag 300 gatttcgcca catactattg ccagcagtac tatatctacc cctatacatt tggccagggg 360 actaaagtgg aaattaaggg ccagcctaaa gccgctccat ccgtcactct gttcccccct 420 tctagtgagg aactgcaggc taacaaggcc accctggtgt gctacatctc tgacttttat 480 cctggggcag tgaccgtcgc atggaaggct gattcaagcc ccgtgaaagc tggagtcgag 540 accacaactc ctagcaagca gtccaacaac aagtacgcag cctggtctta tctgagtctg 600 acaccagaac agtggaaaag ccaccggagt tactcatgtc aggtcactca cgaaggcagc 660 actgtggaaa aaactgtggc tcctaccgaa tgttcttgat aa 702 <210> 93 <211> 1416 <212> DNA <213> Artificial Sequence <220> <223> Human IgG HC2 heavy chain cDNA <400> 93 atggattgga catggcgctt tctgttcgtc gtcgcagccg caaccggagt gcagtctcag 60 gtgcagctgg tgcagtcagg agccgaggtg aagaaacctg gcgcctccgt caaagtgtct 120 tgcaaggcta gtgggtacac tttcacctct cactggatgc attgggtgag atatgcccct 180 gggcagggac tggagtggat cggagaattc aacccaagca atggaaggac taactacaac 240 gagaagttta aatctaaggc tacaatgact gtggatacca gtacaaacac tgcatatatg 300 gagctgagct ccctgaggtc agaggacacc gccgtgtact attgcgcaag ccgggactac 360 gattatgacg gaagatactt cgattattgg ggccagggga cactggtcac cgtgagcagc 420 gccagcacca aaggccctag cgtgtttcca ctggctccct caagcaagag tacctcagga 480 gggacagccg ctctgggatg tctggtgaag gactacttcc cagagcccgt caccgtgtct 540 tggaacagtg gagcactgac aagcggcgtc cacacttttc ctgccgtgct gcagtcctct 600 gggctgtact ccctgagttc agtggtcacc gtcccaagct cctctctggg aacccagaca 660 tatatctgca acgtgaatca caaaccaagt aatacaaagg tggacaagaa ggtggaaccc 720 aaaagctgtg acaagactca tacctgccca ccttgtcctg caccagagct gctgggagga 780 ccaagcgtgt tcctgtttcc acccaaacct aaggataccc tgatgattag ccgcactcca 840 gaagtcacct gcgtggtcgt ggacgtgagc cacgaggacc ccgaagtcaa gtttaactgg 900 tacgtggacg gcgtcgaggt gcataatgcc aaaacaaagc ccagggagga acagtacaac 960 tccacttatc gcgtcgtgtc tgtcctgacc gtgctgcacc aggattggct gaacggcaag 1020 gaatataaat gcaaggtgtc taacaaggcc ctgcccgccc ctatcgagaa gacaattagc 1080 aaagcaaagg gccagcccag agagccacag gtgtataccc tgcctcccag ccgggacgag 1140 ctgaccaaaa accaggtctc tctgacatgt ctggtgaagg gattctatcc cagcgacatt 1200 gctgtggagt gggaatccaa tggccagcct gagaacaatt acaagaccac accccctgtg 1260 ctggattcag acggcagctt ctttctgtat agtaaactga ccgtggacaa gtcacgatgg 1320 cagcagggga atgtctttag ctgttccgtg atgcatgaag cactgcataa tcactacacc 1380 cagaaatcac tgtcactgag cccaggaaaa taatga 1416 <210> 94 <211> 696 <212> DNA <213> Artificial Sequence <220> <223> Human IgG LC2 light chain cDNA <400> 94 atggcttggg ctctgctgct gctgaccctg ctgacccagg acaccgggag ttgggctgac 60 atccagatga cccagtcccc ttcttccctg agtgcatcag tgggcgaccg ggtcaccatc 120 acatgcagcg ccagctcctc tgtgacatac atgtattggt atcagagaaa gccaggaaaa 180 gctcccaagc tgctgatcta cgatacttct aacctggcaa gtggcgtgcc aagcaggttc 240 agcggatccg gatctggaac tgactacact tttaccatca gttcactgca gcccgaggat 300 attgccacct actattgcca gcagtggagc tcccacatct tcacatttgg ccaggggact 360 aaagtggaaa ttaaggggca gcctaaagcc gctccaagcg tcacactgtt ccccccttct 420 agtgaggaac tgcaggctaa taaggccacc ctggtgtgcc tgatctccga cttttatcct 480 ggggccgtga cagtcgcctg gaaggctgat tcaagccccg tgaaagctgg agtcgagacc 540 acaactccta gcaagcagtc caacaacaag tatgcagcct cctcttacct gtccctgacc 600 cccgaacagt ggaaatctca tcggagttac tcatgtcagg tcactcacga agggagcact 660 gtggaaaaaa ccgtcgcacc aaccgaatgt tcataa 696

Claims

하기 (1)에서 (8)의 RNA 서열을 포함하는 마이너스 싱글-스트랜드 RNA(A)와, 싱글-스트랜드 RNA 결합 단백질(B), RNA 의존성 RNA 합성효소(C)로 이루어지고, 자연면역기구를 활성화시키지 않는 복합체인 스텔스형 RNA 유전자 발현계;
(1) 임의의 단백질 또는 기능성 RNA를 코딩하는 표적 RNA 서열,
(2) 비코딩영역을 구성하는 인간세포에서 발현하고 있는 mRNA 유래의 RNA 서열,
(3) 상기 RNA 의존성 RNA 합성효소가 인식하는, 파라믹소 바이러스과에 속하는 바이러스 게놈에 유래하는 전사개시 시그널 서열,
(4) 해당 효소가 인식하는, 파라믹소 바이러스과에 속하는 바이러스 게놈에 유래하는 전사종결 시그널 서열,
(5) 해당 효소가 인식하는 복제기점을 포함하는 RNA 서열,
(6) 해당 효소를 코딩하는 RNA 서열로서, 도입 대상세포가 유래하는 생물종에 코돈이 최적화된 RNA 서열,
(7) 해당 효소의 활성을 조절하는 단백질을 코딩하는 RNA 서열로서, 도입 대상세포가 유래하는 생물종에 코돈이 최적화된 RNA 서열,
(8) 상기 싱글-스트랜드 RNA 결합 단백질을 코딩하는 RNA 서열로서, 도입 대상세포가 유래하는 생물종에 코돈이 최적화된 RNA 서열;
여기에서,
상기 (6)의 RNA 서열이 코딩하는 RNA 의존성 RNA 합성효소가 파라믹소 바이러스과에 속하는 RNA 바이러스 유래의 L 단백질 및 P 단백질이고,
상기 (7)의 RNA 서열이 코딩하는 당해 효소의 활성을 조절하는 단백질이 당해 RNA 바이러스와 동일한 바이러스 유래의 C 단백질이고,
상기 (8)의 RNA 서열이 코딩하는 싱글-스트랜드 RNA 결합 단백질이 당해 RNA 바이러스와 동일한 바이러스 유래의 NP 단백질이며,
상기 (3)∼(5)의 RNA 서열 모두가 당해 RNA 바이러스와 동일한 바이러스 유래의 게놈 서열 중의 전사개시 시그널, 전사종결 시그널, 및 복제기점을 포함하는 RNA 서열이고,
상기 L 단백질, P 단백질, C 단백질 및 NP 단백질을 코딩하는 RNA 서열이 인간 세포에 최적화되어 있으며, 또 그 GC함량이 50∼60%의 범위 내로 조정되어 있다.
제1항에 있어서,
상기 (1)의 표적 RNA 서열이 적어도 6개의 유전자를 포함하거나, 또는 전장 5,000∼15,000염기 길이의 RNA 서열인 스텔스형 RNA 유전자 발현계.
제1항에 있어서,
상기 (2)의 RNA 서열이 인간의 mRNA 서열에 유래하는 5∼49염기 길이의 RNA 서열인 스텔스형 RNA 유전자 발현계.
제1항에 있어서,
동일 혹은 다른 서열로 이루어지는 상기 (2)의 RNA 서열이, 상기 (1)의 표적 RNA 서열에 포함되는 각 유전자 서열의 3’말단측 및/또는 5’말단측에 인접해서 배치되는 것을 특징으로 하는 스텔스형 RNA 유전자 발현계.
제1항에 있어서,
상기 (3)의 전사개시 시그널 서열이 3’-UCCCACUUUC-5’(서열번호 1), 3’-UCCCUAUUUC-5’(서열번호 2), 3’-UCCCACUUAC-5’(서열번호 3), 3’-UCCUAAUUUC-5’(서열번호 7), 및 3’-UGCCCAUCUUC-5’(서열번호 9) 중 어느 하나에 나타나는 RNA 서열로부터 선택되는 RNA 서열이고,
상기 (4)의 전사종결 시그널 서열이 3’-AAUUCUUUUU-5’(서열번호 4), 3’-CAUUCUUUUU-5’(서열번호 5), 3’-UAUUCUUUUU-5’(서열번호 6), 및 3’-UUAUUCUUUUU-5’(서열번호 8) 중 어느 하나에 나타나는 RNA 서열로부터 선택되는 RNA 서열인 것을 특징으로 하는 스텔스형 RNA 유전자 발현계.
제4항에 있어서,
동일 혹은 다른 서열로 이루어지는 상기 (3)의 전사개시 시그널 서열이, 상기 (1)의 표적 RNA 서열에 포함되는 각 유전자 서열의 3’말단측에 인접해서 배치된 상기 (2)의 RNA 서열의 더욱더 3’말단측에 인접해서 배치되고 있으며, 또 상기 (4) 전사종결 시그널 서열이 상기 (1)의 표적 RNA 서열에 포함되는 각 유전자 서열의 5’말단측에 인접해서 배치된 RNA 서열의 더욱더 5’말단측에 인접해서 배치되고 있는 것을 특징으로 하는 스텔스형 RNA 유전자 발현계.
제1항에 있어서,
상기 (5)의 복제기점을 포함하는 RNA 서열이 하기의 서열을 포함하는 것을 특징으로 하는 스텔스형 RNA 유전자 발현계;
(a) 3’-UGGUCUGUUCUC-5’(서열번호 11) 또는 3’-UGGUUUGUUCUC-5’(서열번호 12)의 RNA 서열,
(b) 3’-GAGAACAGACCA-5’(서열번호 13) 또는 3’-GAGAACAAACCA-5’(서열번호 14)의 RNA 서열,
(c) 3’-(CNNNNN)₃-5’(서열번호 15)의 RNA 서열,
(d) 3’-(NNNNNG)₃-5’(서열번호 16)의 RNA 서열.
제7항에 있어서,
상기 (a)의 RNA 서열이 마이너스 싱글-스트랜드 RNA(A)의 3’말단에 위치하고 있으며, 또 상기 (b)의 RNA 서열이 5’말단에 위치하고 있는 것을 특징으로 하는 스텔스형 RNA 유전자 발현계.
제7항에 있어서,
상기 (c)의 RNA 서열이 마이너스 싱글-스트랜드 RNA(A)의 3’말단으로부터 79염기째로부터 시작되며, 또 상기 (d)의 RNA 서열이 5’말단으로부터 96염기째로부터 시작되는 것을 특징으로 하는 스텔스형 RNA 유전자 발현계.
제7항에 있어서,
상기 (5)의 복제기점을 포함하는 RNA 서열이 추가로 마이너스 싱글-스트랜드 RNA(A)의 3’말단으로부터 97∼116염기째까지의 위치에, (e) 3’-AAAGAAACGACGGUUUCA-5’(서열번호 17)의 RNA 서열 또는 그 동일 염기 길이인 18염기 길이의 RNA 서열을 포함하는 것을 특징으로 하는 스텔스형 RNA 유전자 발현계.
제1항 내지 제10항 중 어느 한 항에 있어서,
상기 파라믹소 바이러스과에 속하는 RNA 바이러스가 센다이바이러스, 인간ㆍ파라인플루엔자 바이러스, 및 뉴캐슬병 바이러스 중 어느 하나로부터 선택된 RNA 바이러스인 스텔스형 RNA 유전자 발현계.
제1항 내지 제10항 중 어느 한 항에 기재된 스텔스형 RNA 유전자 발현계를 구성하는 복합체를 포함하고, 동물세포에 당해 복합체를 도입하는 활성을 가지는 RNA 벡터로서, 자연면역기구를 활성화시키지 않는 스텔스형 RNA 벡터.
제11항에 기재된 스텔스형 RNA 유전자 발현계를 구성하는 복합체를 포함하고, 동물세포에 당해 복합체를 도입하는 활성을 가지는 RNA 벡터로서, 자연면역기구를 활성화시키지 않는 스텔스형 RNA 벡터.
제12항에 있어서,
동물세포로의 감염능을 가지는 바이러스 입자를 형성하고 있는 스텔스형 RNA 벡터.
제13항에 있어서,
동물세포로의 감염능을 가지는 바이러스 입자를 형성하고 있는 스텔스형 RNA 벡터.
제12항에 기재된 스텔스형 RNA 벡터가 도입된 동물세포.
제13항에 기재된 스텔스형 RNA 벡터가 도입된 동물세포.
제14항에 기재된 스텔스형 RNA 벡터가 도입된 동물세포.
제15항에 기재된 스텔스형 RNA 벡터가 도입된 동물세포.
하기 (1)에서 (8)의 RNA 서열을 포함하는 마이너스 싱글-스트랜드 RNA(A)로서, 싱글-스트랜드 RNA 결합 단백질(B), 및 RNA 의존성 RNA 합성효소(C)과 함께, 자연면역기구를 활성화시키지 않는 복합체를 형성할 수 있는 스텔스형 RNA;
(1) 임의의 단백질 또는 기능성 RNA를 코딩하는 표적 RNA 서열,
(2) 비코딩영역을 구성하는 자연면역기구를 인식할 수 없는 RNA 서열로서, 인간세포에서 발현하고 있는 mRNA 유래의 RNA 서열,
(3) RNA 의존성 RNA 합성효소가 인식하는, 파라믹소 바이러스과에 속하는 바이러스 게놈에 유래하는 전사개시 시그널 서열,
(4) 해당 효소가 인식하는, 파라믹소 바이러스과에 속하는 바이러스 게놈에 유래하는 전사종결 시그널 서열,
(5) 해당 효소가 인식하는 복제기점을 포함하는 RNA 서열,
(6) 해당 효소를 코딩하는 RNA 서열로서, 자연면역기구를 인식할 수 없도록 도입 대상세포가 유래하는 생물종에 코돈 최적화한 RNA 서열,
(7) 해당 효소의 활성을 조절하는 단백질을 코딩하는 RNA 서열로서, 자연면역기구를 인식할 수 없도록 도입 대상세포가 유래하는 생물종에 코돈 최적화한 RNA 서열,
(8) 싱글-스트랜드 RNA 결합 단백질을 코딩하는 RNA 서열로서, 자연면역기구를 인식할 수 없도록 도입 대상세포가 유래하는 생물종에 코돈 최적화한 RNA 서열;
여기에서,
상기 (6)의 RNA 서열이 코딩하는 RNA 의존성 RNA 합성효소가 파라믹소 바이러스과에 속하는 RNA 바이러스 유래의 L 단백질 및 P 단백질이고,
상기 (7)의 RNA 서열이 코딩하는 당해 효소의 활성을 조절하는 단백질이 당해 RNA 바이러스와 동일한 바이러스 유래의 C 단백질이고,
상기 (8)의 RNA 서열이 코딩하는 싱글-스트랜드 RNA 결합 단백질이 당해 RNA 바이러스와 동일한 바이러스 유래의 NP 단백질이며,
상기 (3)∼(5)의 RNA 서열 모두가 당해 RNA 바이러스와 동일한 바이러스 유래의 게놈 서열 중의 전사개시 시그널, 전사종결 시그널, 및 복제기점을 포함하는 RNA 서열이고,
상기 L 단백질, P 단백질, C 단백질 및 NP 단백질을 코딩하는 RNA 서열이 인간 세포에 최적화되어 있으며, 또 그 GC함량이 50∼60%의 범위 내로 조정되어 있다.
제20항에 있어서,
상기 마이너스 싱글-스트랜드 RNA(A)의 3’말단측 및 5’말단측에는 상기 (5)의 RNA 의존성 RNA 합성효소가 인식하는 복제기점을 포함하는 RNA 서열로서, 3’말단측의 RNA 서열 및 5’말단측의 RNA 서열에는 각각 상보하는 RNA 서열이 포함되어 있는 스텔스형 RNA.
제20항에 있어서,
동일 혹은 다른 서열로 이루어지는 상기 (3)의 전사개시 시그널 서열이 상기 (1)의 표적 RNA 서열에 포함되는 복수의 유전자 서열 각각 3’말단측에 인접해서 배치된 상기 (2)의 RNA 서열의 더욱더 3’말단측에 인접해서 배치되어 있으며, 또 상기 (4) 전사종결 시그널 서열이 상기 (1)의 표적 RNA 서열에 포함되는 복수의 유전자 서열 각각 유전자 서열 5’말단측에 인접해서 배치된 RNA 서열의 더욱더 5’말단측에 인접해서 배치되어 있는 것을 특징으로 하는 스텔스형 RNA.
제20항 내지 제22항 중 어느 한 항에 있어서,
동일 혹은 다른 서열로 이루어지는 상기 (3)의 전사개시 시그널 서열이 상기 (1)의 표적 RNA 서열에 포함되는 복수의 유전자 서열 각각 3’말단측에 인접해서 배치된 상기 (2)의 RNA 서열의 더욱더 3’말단측에 인접해서 배치되어 있으며, 또 상기 (4) 전사종결 시그널 서열이, 상기 (1)의 표적 RNA 서열에 포함되는 복수의 유전자 서열 각각 유전자 서열 5’말단측에 인접해서 배치된 RNA 서열의 더욱더 5’말단측에 인접해서 배치되어 있고, 추가로 그 양단에, 복수의 제한효소에 의해 절단 가능한 제한효소 사이트를 가진 카세트 구조를 구성하고 있고, 당해 카세트 구조가 복수 결합하고 있는 것을 특징으로 하는 스텔스형 RNA.
스텔스형 RNA 유전자 발현계를 재구성하는 방법으로서,
(1) T7 RNA polymerase를 발현하고 있는 대장균을 준비하는 공정;
(2) 제1항 내지 제10항 중 어느 한 항에 기재된 마이너스 싱글-스트랜드 RNA(A)와 함께, 적어도 RNA 의존성 RNA 합성효소 및 RNA 결합 활성 단백질을 코딩하는 RNA가 탑재된 대장균용 벡터와, RNA 결합 활성 단백질을 코딩하는 DNA를 발현하는 대장균용 벡터를 (1)의 대장균 숙주 내로 도입해서 형질전환하는 공정;
(3) (2)의 형질전환 대장균 내에서, T7 RNA polymerase에 의해 발현시킨 외래의 유전자 RNA를 포함하는 마이너스 싱글-스트랜드 RNA와, RNA 결합 활성 단백질과의 복합체를 형성시키는 공정;
(4) RNA 의존성 RNA 합성효소를 발현하고 있는 동물세포를 준비하는 공정; 및
(5) (3)에서 수득된 마이너스 싱글-스트랜드 RNA와, RNA 결합 활성 단백질과의 복합체를, (4)의 동물세포 숙주 내로 도입해서 마이너스 싱글-스트랜드 RNA와, RNA 결합 활성 단백질 및 RNA 의존성 RNA 합성효소의 복합체로 이루어지는 스텔스형 RNA 유전자 발현계를 재구성하는 공정;
을 포함하는 방법.
스텔스형 RNA 유전자 발현계를 재구성하는 방법으로서,
(1) T7 RNA polymerase를 발현하고 있는 대장균을 준비하는 공정;
(2) 제11항에 기재된 마이너스 싱글-스트랜드 RNA(A)와 함께, 적어도 RNA 의존성 RNA 합성효소 및 RNA 결합 활성 단백질을 코딩하는 RNA가 탑재된 대장균용 벡터와, RNA 결합 활성 단백질을 코딩하는 DNA를 발현하는 대장균용 벡터를 (1)의 대장균 숙주 내로 도입해서 형질전환하는 공정;
(3) (2)의 형질전환 대장균 내에서, T7 RNA polymerase에 의해 발현시킨 외래의 유전자 RNA를 포함하는 마이너스 싱글-스트랜드 RNA와, RNA 결합 활성 단백질과의 복합체를 형성시키는 공정;
(4) RNA 의존성 RNA 합성효소를 발현하고 있는 동물세포를 준비하는 공정; 및
(5) (3)에서 수득된 마이너스 싱글-스트랜드 RNA와, RNA 결합 활성 단백질과의 복합체를, (4)의 동물세포 숙주 내로 도입해서 마이너스 싱글-스트랜드 RNA와, RNA 결합 활성 단백질 및 RNA 의존성 RNA 합성효소의 복합체로 이루어지는 스텔스형 RNA 유전자 발현계를 재구성하는 공정;
을 포함하는 방법.
2개소의 클로닝 부위 A, B를 가지는 DNA 베이스의 탠덤형 카세트로서,
당해 탠덤형 카세트는 5’말단측으로부터 차례로, (1) 멀티머화(multimerization) 부위 A, (2) 전사개시 시그널 A, (3) 비코딩서열 A1, (4) 클로닝 부위 A, (5) 비코딩영역 A2, (6) 전사종결 시그널 A, (7) 전사개시 시그널 B, (8) 비코딩서열 B1, (9) 클로닝 부위 B, (10) 비코딩영역 B2, (11) 전사종결 시그널 B, 및 (12) 멀티머화(multimerization) 부위 B에 의해 구성되어 있고,
상기 (1) 멀티머화 부위 A, 및 (12) 멀티머화 부위 B는 각각 제한효소 인식서열 및/또는 부위 특이적 재조합 효소 인식서열을 포함하고, 서로 동일 혹은 다른 DNA이고,
상기 (2) 전사개시 시그널 A, 및 (7) 전사개시 시그널 B는 각각 RNA에 전사되었을 경우에 RNA 의존성 RNA 합성효소가 인식하는 전사개시 시그널을 포함하는, 서로 동일 혹은 다른 DNA이고,
상기 (3) 비코딩서열 A1, (5) 비코딩영역 A2, (8) 비코딩서열 B, 및 (10) 비코딩영역 B2는 각각 RNA에 전사되었을 경우에 숙주세포의 자연면역기구에 인식되지 않는 RNA가 되는 서로 동일 혹은 다른 DNA이고,
상기 (4) 클로닝 부위 A, 및 (9) 클로닝 부위 B는 각각 1 이상의 제한효소 인식서열 및/또는 부위 특이적 재조합 효소 인식서열을 포함하는 서로 동일 혹은 다른 DNA이고,
상기 (6) 전사종결 시그널 A, 및 (11) 전사종결 시그널 B는 각각 RNA에 전사되었을 경우에 RNA 의존성 RNA 합성효소가 인식하는 전사종결 시그널을 포함하는 서로 동일 혹은 다른 DNA인, 탠덤형 카세트.
제26항에 있어서,
상기 (4) 클로닝 부위 A는 5’말단측으로부터 차례로 제한효소 A 인식서열, 및 제한효소 C 인식서열을 포함하고,
상기 (9) 클로닝 부위 B는 5’말단측으로부터 차례로 제한효소 D 인식서열, 및 제한효소 B 인식서열을 포함하고 있고,
여기에서 제한효소 A와 제한효소 D는 동일서열의 싱글-스트랜드 돌출말단을 발생하는 것이고, 제한효소 C와 제한효소 B는 동일서열의 싱글-스트랜드 돌출말단을 발생하는 것인 탠덤형 카세트.
제26항 또는 제27항에 있어서,
상기 (1) 멀티머화 부위 A, 및 (12) 멀티머화 부위 B는 모두 NN 또는 NNN의 서열임의의 싱글-스트랜드 돌출말단을 발생하는 제한효소의 인식서열을 포함하는 DNA인 탠덤형 카세트.
제26항 또는 제27항에 있어서,
상기 (3) 비코딩서열 A1, (5) 비코딩영역 A2, (8) 비코딩서열 B, 및 (10) 비코딩영역 B2가 각각 동물세포에서 발현하고 있는 mRNA 유래 RNA 서열의 부분서열에 대응하는 동일 혹은 다른 cDNA로서,
상기 (4) 클로닝 부위 A, 및 (9) 클로닝 부위 B에, 동일 혹은 다른 인간 유래 유전자가 삽입된 탠덤형 카세트.
제28항에 있어서,
상기 (3) 비코딩서열 A1, (5) 비코딩영역 A2, (8) 비코딩서열 B, 및 (10) 비코딩영역 B2가 각각 동물세포에서 발현하고 있는 mRNA 유래 RNA 서열의 부분서열에 대응하는 동일 혹은 다른 cDNA로서,
상기 (4) 클로닝 부위 A, 및 (9) 클로닝 부위 B에, 동일 혹은 다른 인간 유래 유전자가 삽입된 탠덤형 카세트.