KR102554374B1

KR102554374B1 - 변형된 헤파티티스 전사-후 조절 요소

Info

Publication number: KR102554374B1
Application number: KR1020177022738A
Authority: KR
Inventors: 세미 유 태린
Original assignee: 주노 쎄러퓨티크스 인코퍼레이티드
Priority date: 2015-01-12
Filing date: 2016-01-12
Publication date: 2023-07-11
Also published as: RU2017126975A; US20160199412A1; AU2016206868A1; EP3245292A1; RU2017126975A3; AU2016206868B2; ES2877367T3; JP6868560B2; US10363269B2; BR112017014917A2; CN107429260B; CN107429260A; WO2016115177A1; SG11201705692SA; EP3245292B1; CA2973483A1; HK1246347A1; MY187559A; JP2018502583A; SA517381912B1

Abstract

비변형된, 예컨대 야생형 헤파티티스 X 유전자에는 존재치 않는 하나 이상의 종결 코돈을 포함하는 변이체 X 유전자를 갖는, 변형된 PRE를 함유하는 폴리뉴클레오티드가 제공된다. 또한, 비변형된, 예컨대 야생형의 헤파티티스 X 유전자에는 존재치 않는 하나 이상의 분해 서열 (degradation sequence)를 포함하는 변이체 X 유전자를 갖는, 변형된 PRE를 함유하는 폴리뉴클레오티드가 제공된다. 상기 변형된 PRE는 재조합 단백질을 코딩하는 핵산에 작동적으로 연결될 수 있다. 또한, 상기 폴리뉴클레오티드를 함유하는 발현 카세트, 바이러스 벡터 및 세포, 및 조성물과 그 이용 방법이 제공된다.

Description

변형된 헤파티티스 전사-후 조절 요소

관련 출원에 대한 상호 참조

[0001] 본 출원은, 그 내용 전부가 참조로서 포함되는, "변형된 헤파티티스 전사-후 조절 요소"라는 표제의 2015년 1월 12일자 미국 가출원 62/102,569호로부터의 우선권을 주장한다.

참조로서 서열 목록의 포함

[0002] 본 출원은 전자적 형식의 서열 목록과 함께 출원된다. 상기 서열 목록은 152,051 바이트 크기의, 2016년 1월 12자 생성된, 735042001840SeqList.txt라는 표제의 파일로 제공된다. 상기 서열 목록의 전자적 형식 내 정보는 그 전부가 참조로서 포함된다.

분야

[0003] 본 명세서는 재조합 분자를 발현하는 방법 및 이러한 방법에 사용하기 위한 폴리뉴클레오티드에 관한 것이다. 특히, 본 명세서는 그에 작동적으로 연결된 재조합 분자의 발현을 증가시킬 수 있는 전사-후 조절 요소 (post-transcriptional regulatory elements, PREs), 예컨대 시스-작용성 전사-후 조절 요소를 함유하는 폴리뉴클레오티드와 그의 변형된 변이체에 관한 것이다. 상기 변형된 전사-후 조절 요소는 헤파티티스 바이러스, 예컨대 우드척 헤파티티스 바이러스 (WHV)로부터 유래된 것들, 예컨대 우드척 헤파티티스 바이러스 전사-후 조절 요소 (WPRE)의 변형된 변이체를 포함한다. 변형된 PRE는 통상, 재조합 분자의 발현을 위하여 대상체로의 도입에 따른 종양형성 및/또는 면역원성의 가능성을 감소시키는 하나 이상의 변형을 포함하는데, 예컨대 특정 단백질의 발현을 저지함으로써 그러하다. 몇 가지 구현예에 있어서, 이러한 변형은 바이러스 X 단백질 또는 그 일부를 코딩하는 PRE 내 서열 내에 포함된 하나 이상의 종결 코돈을 포함한다. 몇 가지 구현예에 있어서, 상기 폴리뉴클레오티드는 번역-후 변형, 예컨대 분해를 촉진하는 부위를 코딩하는 하나 이상의 서열을 포함하는데, 예컨대 유비퀴틴화 (ubiquitination) 부위가 그러하다.

[0004] 바이러스 벡터는 유전적 재료를 세포 내로 전달하기 위한 효과적인 전달 시스템을 제공할 수 있다. 많은 바이러스 벡터, 예컨대 감마-레트로바이러스 및 렌티바이러스 벡터 내 핵산은 숙주 세포의 게놈에 삽입될 수 있다. 시스-작용성 요소, 예컨대 바이러스 전사-후 조절 요소, 예컨대 헤파티티스 바이러스 PRE 및 그들의 변이체는 유전자 발현을 증가시키기 위하여 바이러스 벡터들에서 사용되어 왔다. 이러한 요소를 함유하는 핵산, 발현 카세트 및 벡터가 이용 가능하다. 개선된 PRE-함유 핵산, 카세트 및 벡터에 대한 요구가 있다. 이러한 요구를 해결하는 구현예들이 제공된다.

요약

[0005] 비변형된 또는 야생형 헤파티티스 바이러스 X 유전자에는 존재치 않는, 예컨대 야생형 포유류 헤파티티스 바이러스, 예컨대 WHV 또는 HBV의 X 유전자에는 존재치 않는 종결 코돈 및/또는 번역-후 분해 서열을 포함하는 변이체 X 유전자를 함유하는 변형된 전사-후 조절 요소를 함유하는 폴리뉴클레오티드가 제공된다. 상기 제공되는 폴리뉴클레오티드 중에서, 비변형된 또는 야생형 WHV X 유전자에서는 존재치 않는 종결 코돈 및/또는 번역-후 분해 서열을 포함하는 변이체 X 유전자를 함유하는 변형된 WPRE를 함유하는 것들이 있다. 상기 제공되는 폴리 뉴클레오티드는 이러한 변형된 PRE를 함유하는 발현 카세트 및 바이러스 벡터를 포함한다. 특정 구현예에 있어서, 상기 변형된 PRE는 재조합 단백질, 예컨대 이종 단백질을 코딩하는 핵산과 작동적으로 연결되어 있다.

[0006] 그 변이체 X 유전자가 야생형 X 유전자에서는 존재치 않는 종결 코돈, 예컨대 하나 이상의 종결 코돈을 함유하는 것인 야생형 헤파티티스 바이러스 X 유전자의 변이체를 포함하는 변형된 PRE를 함유하는 폴리뉴클레오티드가 제공된다. 몇 가지 구현예에 있어서, 하나 이상의 종결 코돈, 예컨대 상기 변이체 X 유전자 내에 존재하는 첫번째 종결 코돈 또는 복수개의 종결 코돈 각각은 야생형 X 단백질 오픈 리딩 프레임 (open reading frame)의 개시 코돈의 5' 위치에 대응하는 상기 변이체 X 유전자 중의 위치로부터 3' 방향으로 36개 또는 24개 뉴클레오티드 내 위치에서 시작한다. 몇 가지 구현예에 있어서, 하나 이상의 종결 코돈, 예컨대 상기 변이체 X 유전자 내에 존재하는 첫번째 종결 코돈 또는 복수개의 종결 코돈 중 하나 이상은 SEQ ID NO:1 또는 SEQ ID NO:125에 기재된 WHV PRE 서열의 잔기 411 및/또는 SEQ ID NO:2에 기재된 서열의 잔기 1503에 대응하는 위치로부터 3' 방향으로 36개 또는 24개 뉴클레오티드 내 위치에서 시작한다. 이러한 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는 길이 39개 뉴클레오티드 또는 약 39개 뉴클레오티드보다 큰, 또는 길이 27개 뉴클레오티드 또는 약 27개 뉴클레오티드보다 큰 오픈 리딩 프레임을 함유하지 않는다.

[0007] 야생형 헤파티티스 바이러스 X 유전자의 변이체를 함유하는 변형된 PRE를 함유하는 폴리뉴클레오티드가 제공되는데, 그 변이체 X 유전자는 야생형 X 유전자에는 존재치 않는 종결 코돈, 예컨대 하나 이상의 종결 코돈을 함유하고 이것은 X 유전자의 개시 코돈의 32개 또는 30개 뉴클레오티드 내 위치에서 시작한다. 몇 가지 구현예에 있어서, 상기 하나 이상의 종결 코돈, 예컨대 상기 변이체 X 유전자에 존재하는 첫번째 종결 코돈 또는 복수개의 종결 코돈 중 하나 이상은 야생형 X 단백질 오픈 리딩 프레임의 개시 코돈의 5' 위치에 대응하는 상기 변이체 X 유전자의 위치로부터 3' 방향으로 32개 또는 30개 뉴클레오티드 내의 위치에서 시작한다. 몇 가지 구현예에 있어서, 상기 하나 이상의 종결 코돈, 예컨대 상기 변이체 X 유전자에 존재하는 첫번째 종결 코돈 또는 복수개의 종결 코돈 중 하나 이상은 SEQ ID NO:1 또는 SEQ ID NO:125에 기재된 WHV PRE 서열의 잔기 411 및/또는 SEQ ID NO:2에 기재된 서열의 잔기 1503에 대응하는 위치로부터 3' 방향으로 32개 또는 30개 뉴클레오티드 내 위치에서 시작한다. 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는 길이 33개 뉴클레오티드 또는 그보다 작은 오픈 리딩 프레임을 갖는다.

[0008] 이러한 변형된 PRE의 구현예 중 하나에 있어서, 상기 야생형 X 유전자에는 존재치 않는 하나 이상의 종결 코돈은 복수개의 종결 코돈을 포함한다. 야생형 헤파티티스 바이러스 X 유전자의 변이체를 함유하는 변형된 PRE를 포함하는 폴리뉴클레오티드가 제공되는데, 그 변이체 X 유전자는 상기 야생형 X 유전자에는 존재치 않는 복수개의 종결 코돈을 함유한다. 이러한 구현예들 중 하나에 있어서, 상기 변형된 PRE는 2, 3, 4, 5 또는 6개의 종결 코돈을 함유한다. 몇 가지 구현예에 있어서, 상기 복수개의 종결 코돈은 상기 변이체 X 유전자 내에 존재하는 각각의 리딩 프레임 내에서 하나 이상의 종결 코돈을 포함한다. 몇 가지 구현예에 있어서, 상기 복수개의 종결 코돈은 상기 동일한 리딩 프레임 내에서 2개 이상의 종결 코돈을 포함한다.

[0009] 복수개의 종결 코돈을 함유하는 변형된 PRE의 이러한 구현예들 중 하나에 있어서, 복수개 중 첫번째 종결 코돈 또는 하나 이상의 복수개의 종결 코돈은 야생형 X 단백질 오픈 리딩 프레임의 개시 코돈의 5' 위치에 대응하는 상기 변이체 X 유전자의 위치로부터 3' 방향으로 36개, 30개 또는 24개 뉴클레오티드 내 위치에서 시작한다. 복수개의 종결 코돈을 함유하는 변형된 PRE의 몇 가지 구현예에 있어서, 복수개 중 첫번째 종결 코돈 또는 하나 이상의 복수개의 종결 코돈은 SEQ ID NO:1 또는 SEQ ID NO:125에 기재된 WHV 전사-후 조절 요소 (WPRE) 서열의 잔기 411 및/또는 SEQ ID NO:2에 기재된 WHV 서열의 잔기 1503에 대응하는 상기 변이체 X 유전자의 위치로부터 3' 방향으로 36개, 30개 또는 24개 뉴클레오티드 내 위치에서 시작한다. 이러한 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는 길이 39개 뉴클레오티드 또는 약 39개 뉴클레오티드보다 큰 오픈 리딩 프레임, 길이 30개 뉴클레오티드 또는 약 30개 뉴클레오티드보다 큰 오픈 리딩 프레임, 길이 27개 뉴클레오티드 또는 약 27개 뉴클레오티드보다 큰 오픈 리딩 프레임을 포함하지 않는다.

[0010] 이러한 구현예들 중 하나에 있어서, 상기 제공되는 폴리뉴클레오티드는 또한 재조합 단백질을 코딩하는 핵산을 포함할 수 있다. 특정 구현예에 있어서, 상기 변형된 PRE는 상기 재조합 단백질을 코딩하는 핵산과 작동적으로 연결된다.

[0011] 상기 제공되는 폴리뉴클레오티드들 중 몇 가지 구현예에 있어서, 상기 하나 이상의 종결 코돈, 예컨대 변이체 X 유전자에 존재하는 첫번째 종결 코돈 또는 하나 이상의 복수개의 종결 코돈은 야생형 X 단백질 오픈 리딩 프레임의 개시 코돈의 5' 위치에 대응하는 상기 변이체 X 유전자의 위치로부터 3' 방향으로 9, 12, 15, 18 또는 21개 또는 그 이상의 뉴클레오티드 내 위치에서 시작한다. 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 하나 이상의 종결 코돈, 예컨대 상기 변이체 X 유전자에 존재하는 첫번째 종결 코돈 또는 하나 이상의 복수개의 종결 코돈은 SEQ ID NO:1 또는 SEQ ID NO:125에 기재된 WHV 전사-후 조절 요소 (WPRE) 서열의 잔기 411 및/또는 SEQ ID NO:2에 기재된 WHV 서열의 잔기 1503에 대응하는 상기 변이체 X 유전자의 위치로부터 3' 방향으로 9, 12, 15, 18 또는 21개 또는 그 이상의 뉴클레오티드 내 위치에서 시작한다. 몇 가지 구현예에 있어서, 상기 변형된 PRE는 하나 이상의 종결 코돈, 예컨대 1, 2, 3, 4 또는 5개의 종결 코돈을 함유하는데, 여기서 하나 이상의 복수개의 종결 코돈은 SEQ ID NO:1 또는 125에 기재된 서열의 위치 420, 423, 426, 429 또는 432에 대응하는 뉴클레오티드 위치 또는 적어도 그 위치 내에서 시작한다. 이러한 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는 길이 24개 뉴클레오티드 또는 약 24개 뉴클레오티드보다 큰, 길이 21개 뉴클레오티드 또는 약 21개 뉴클레오티드보다 큰, 길이 18개 뉴클레오티드 또는 약 18개 뉴클레오티드보다 큰, 길이 15개 뉴클레오티드 또는 약 15개 뉴클레오티드보다 큰, 길이 12개 뉴클레오티드 또는 약 12개 뉴클레오티드보다 큰, 오픈 리딩 프레임을 포함하지는 않는다.

[0012] 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 하나 이상의 종결 코돈, 예컨대 변이체 X 유전자에 존재하는 첫번째 종결 코돈 또는 하나 이상의 복수개의 종결 코돈은 야생형 X 단백질 오픈 리딩 프레임의 개시 코돈의 5' 위치에 대응하는 상기 변이체 X 유전자의 위치로부터 3' 방향으로 9, 13, 17 또는 21개 또는 그 이상의 뉴클레오티드 내 위치에서 시작한다. 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 하나 이상의 종결 코돈, 예컨대 상기 변이체 X 유전자에 존재하는 첫번째 종결 코돈 또는 하나 이상의 복수개의 종결 코돈은 SEQ ID NO:1 또는 SEQ ID NO:125에 기재된 WHV 전사-후 조절 요소 (WPRE) 서열의 잔기 411 및/또는 SEQ ID NO:2에 기재된 WHV 서열의 잔기 1503에 대응하는 상기 변이체 X 유전자의 위치로부터 3' 방향으로 9, 13, 17 또는 21개 또는 그 이상의 뉴클레오티드 내 위치에서 시작한다. 몇 가지 구현예에 있어서, 상기 변형된 PRE는 하나 이상의 종결 코돈, 예컨대 1, 2, 3 또는 4개의 종결 코돈을 함유하는데, 여기서 하나 이상의 복수개의 종결 코돈은 SEQ ID NO:1 또는 125에 기재된 서열의 위치 420, 424, 428 또는 432에 대응하는 뉴클레오티드 위치 또는 적어도 그 위치 내에서 시작한다. 이러한 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는 길이 24개 뉴클레오티드 또는 약 24개 뉴클레오티드보다 큰, 길이 21개 뉴클레오티드 또는 약 21개 뉴클레오티드보다 큰, 길이 16개 뉴클레오티드 또는 약 16개 뉴클레오티드보다 큰, 길이 12개 뉴클레오티드 또는 약 12개 뉴클레오티드보다 큰, 오픈 리딩 프레임을 포함하지는 않는다.

[0013] 몇 가지 구현예에 있어서, 비변형된 또는 야생형 X 유전자는 SEQ ID NO: 221에 기재된 뉴클레오티드 서열을 포함하고, 상기 변이체 X 유전자는 그에 도입된 하나 이상의 종결 코돈, 예컨대 1, 2, 3, 4 또는 5개의 종결 코돈을 함유한다. 몇 가지 구현예에 있어서, 복수개의 종결 코돈이 도입되는데, 여기서 하나 이상의 종결 코돈은 그 안의 각각의 리딩 프레임 내에 도입된다. 몇 가지 구현예에 있어서, 복수개의 종결 코돈이 도입되는데, 여기서 2 이상의 종결 코돈은 그 안에 존재하는 동일한 리딩 프레임 내에 도입된다. 몇 가지 구현예에 있어서, 상기 변현된 PRE는 하나 이상의 종결 코돈, 예컨대 1, 2, 3 또는 4개의 종결 코돈을 함유하는 변이체 X 유전자를 함유하는데, 여기서 종결 코돈 중 하나 이상은 SEQ ID NO:221에 기재된 ATG 개시 코돈의 5' 위치에 대응하는 상기 변이체 X 유전자의 위치로부터 3' 방향으로 9, 13, 17 또는 21 위치 또는 적어도 그 위치 내 위치에서 시작한다. 몇 가지 구현예에 있어서, 상기 변형된 PRE는 SEQ ID NO:28에 기재된 뉴클레오티드 서열을 포함하는 변이체 X 유전자를 함유한다.

[0014] 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변형된 PRE는 SEQ ID NO:1 또는 SEQ ID NO:125의 뉴클레오티드 잔기 448-470에 대응하는 베타 스템 루프를 함유한다. 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변형된 PRE는 SEQ ID NO:1 또는 SEQ ID NO:125의 뉴클레오티드 448-470에 대응하는 베타 스템 루프 내 위치에 있어서 뉴클레오티드 변화를 함유하지 않는다. 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 종결 코돈(들)은 SEQ ID NO:1 또는 SEQ ID NO:125의 뉴클레오티드 위치 448-470 중 하나 이상에 대응하는 베타 스템 루프 내 위치에서 뉴클레오티드를 포함하지 않는다.

[0015] 이러한 구현예 중 하나에 있어서, 상기 변형된 PRE는 야생형 X 단백질 오픈 리딩 프레임의 개시 코돈의 5' 위치에 대응하는 상기 변이체 X 유전자의 위치로부터 3' 방향으로 위치 9에서 시작 및/또는 SEQ ID NO:1 또는 SEQ ID NO:125에 기재된 서열 중 위치 420에 대응하는 뉴클레오티드 위치에서 시작하는 종결 코돈; 야생형 X 단백질 오픈 리딩 프레임의 개시 코돈의 5' 위치에 대응하는 상기 변이체 X 유전자의 위치로부터 3' 방향으로 위치 13에서 시작 및/또는 SEQ ID NO:1 또는 SEQ ID NO:125에 기재된 서열 중 위치 424에 대응하는 뉴클레오티드 위치에서 시작하는 종결 코돈; 야생형 X 단백질 오픈 리딩 프레임의 개시 코돈의 5' 위치에 대응하는 상기 변이체 X 유전자의 위치로부터 3' 방향으로 위치 17에서 시작 및/또는 SEQ ID NO:1 또는 SEQ ID NO:125에 기재된 서열 중 위치 428에 대응하는 뉴클레오티드 위치에서 시작하는 종결 코돈; 및/또는 야생형 X 단백질 오픈 리딩 프레임의 개시 코돈의 5' 위치에 대응하는 상기 변이체 X 유전자의 위치로부터 3' 방향으로 위치 21에서 시작 및/또는 SEQ ID NO:1 또는 SEQ ID NO:125에 기재된 서열 중 위치 432에 대응하는 뉴클레오티드 위치에서 시작하는 종결 코돈 중에서 선택되는 종결 코돈을 함유한다.

[0016] 이러한 구현예 중 하나에 있어서, 상기 종결 코돈은 앰버 (TAG), 오커 (TAA) 또는 오팔 (TGA) 종결 코돈일 수 있다. 몇 가지 구현예에 있어서, 상기 종결 코돈은 앰버 (TAG) 또는 오팔 (TGA) 종결 코돈일 수 있다. 이러한 구현예 중 하나에 있어서, 상기 종결 코돈, 예컨대 복수개의 종결 코돈 각각은 뉴클레오티드 치환, 결실 또는 삽입에 의하여 도입된다.

[0017] 이러한 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변형된 PRE 내 변이체 X 유전자는 180개 뉴클레오티드 이하의 길이이거나, 210개 뉴클레오티드 또는 약 210개 뉴클레오티드 이하의 길이이다. 이러한 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는 90개 뉴클레오티드 또는 약 90개 뉴클레오티드 이상의 길이이거나, 120개 뉴클레오티드 또는 약 120개 뉴클레오티드 이상의 길이이거나, 180개 뉴클레오티드 또는 약 180개 뉴클레오티드 이상의 길이이다.

[0018] 이러한 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는 야생형 또는 비변형된 포유류 헤파티티스 X 유전자의 변이체이거나, 그의 부분적 또는 절단 부분일 수 있다. 몇 가지 구현예에 있어서, 상기 야생형 또는 비변형된 X 유전자는, 야생형 또는 비변형된 PRE에 존재하는 것과 같은, 절단된 X 단백질을 코딩하는 부분적 X 유전자를 포함할 수 있다. 몇 가지 구현예에 있어서, 상기 야생형 또는 비변형된 포유류 헤파티티스 X 유전자 또는 부분적 X 유전자는 야생형 우드척 헤파티티스 바이러스 (WHV) X 유전자이거나 이로부터 유래된 것이다. 몇 가지 구현예에 있어서, 상기 야생형 또는 비변형된 WHV X 유전자는 SEQ ID NO:9의 뉴클레오티드 서열을 포함하거나 또는 그의 부분적 X 유전자이다. 몇 가지 구현예에 있어서, 상기 야생형 또는 비변형된 WHV X 유전자는 SEQ ID NOS: 1 및 12-20 중 하나의 뉴클레오티드 411-592로서 기재된 또는 SEQ ID NO:125의 뉴클레오티드 411-589로서 기재된 뉴클레오티드 서열을 함유한다.

[0019] 이러한 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변형된 PRE는 야생형 헤파티티스 바이러스 PRE 또는 그 기능적 변이체(들)의 시스-작용성 전사-후 조절 하위요소 2 이상 또는 3 이상을 함유할 수 있다. 이러한 몇 가지 구현예에 있어서, 상기 2 이상 또는 3 이상의 하위요소는 야생형 PRE 알파 하위요소 또는 그 기능적 변이체, 야생형 PRE 베타 하위요소의 기능적 변이체, 및 또는 야생형 PRE 감마 하위요소 또는 그 기능적 변이체를 포함한다. 몇 가지 구현예에 있어서, 상기 변형된 PRE는 야생형 헤파티티스 바이러스 PRE의 알파 하위요소 또는 그 기능적 변이체 및 야생형 PRE 베타 하위요소의 기능적 변이체를 포함한다. 이러한 구현예들 중 하나에 있어서, 상기 알파 하위요소는 SEQ ID NO: 3, SEQ ID NO:4 또는 SEQ ID NO:5의 서열 또는 그 변이체를 포함할 수 있고, 상기 베타 하위요소는 SEQ ID NO: 6 또는 SEQ ID NO:7의 서열의 변이체를 포함할 수 있고, 및/또는 상기 감마 서브유닛은 SEQ ID NO: 8의 서열 또는 그 변이체를 포함할 수 있다.

[0020] 이러한 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 야생형 또는 비변형된 헤파티티스 바이러스 PRE는 야생형 포유류 헤파티티스 PRE일 수 있다. 몇 가지 구현예에 있어서, 상기 야생형 또는 비변형된 포유류 헤파티티스 바이러스 PRE는 SEQ ID NOS: 1 및 12-27 중 하나에 기재된 뉴클레오티드 서열을 함유하거나, 번역-후 활성을 나타내는 그의 기능적 부분이다. 몇 가지 경우에, 하나 이상의 N- 또는 C-말단 아미노산 잔기는 PRE의 활성에 실질적인 영향없이 결실되거나 제거될 수 있다. 몇 가지 구현예에 있어서, 상기 야생형 또는 비변형된 헤파티티스 바이러스 PRE는 SEQ ID NO:125에 기재된 서열을 갖는다. 몇 가지 구현예에 있어서, 상기 야생형 포유류 헤파티티스 PRE는 야생형 우드척 헤파티티스 바이러스 PRE (WPRE)이다.

[0021] 상기 제공된 폴리뉴클레오티드의 이러한 구현예 중 하나에 있어서, 상기 변형된 PRE는, 그 변이체 X 유전자가 대응하는 야생형 헤파티티스 PRE에 존재치 않는 하나 이상의 종결 코돈을 함유하는 한, SEQ ID NO:1 또는 SEQ ID NO:125에 기재된 뉴클레오티드 서열, SEQ ID NO:1 또는 SEQ ID NO:125과 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 상동성을 나타내는 뉴클레오티드 서열, 또는 전사-후 활성을 나타내는 그들의 기능적으로 활성인 부분을 포함하는 야생형 또는 비변형된 헤파티티스 PRE를 참조하여 변형될 수 있다.

[0022] 상기 제공되는 폴리뉴클레오티드의 이러한 구현예 중 하나에 있어서, 상기 야생형 또는 비변형된 헤파티티스 PRE는 SEQ ID NOS: 1,12-20 또는 125 중 하나에 기재된 뉴클레오티드 서열을 함유할 수 있다. 몇 가지 구현예에 있어서, 상기 야생형 또는 비변형된 헤파티티스 PRE는 SEQ ID NO: 1의 뉴클레오티드 서열을 함유할 수 있다. 몇 가지 구현예에 있어서, 상기 야생형 또는 비변형된 헤파티티스 PRE는 SEQ ID NO: 125의 뉴클레오티드 서열을 함유할 수 있다.

[0023] 상기 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 변이체 X 유전자는 SEQ ID NO: 1 또는 SEQ ID NO:125의 위치 411에 대응하는 위치에서 시작하는 개시 코돈을 함유할 수 있다. 몇 가지 구현예에 있어서, 상기 개시 코돈은 ATG 개시 코돈이다.

[0024] 상기 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 변이체 X 유전자는 상기 변이체 X 유전자와 작동적으로 연결된 프로모터를 더 함유할 수 있다. 몇 가지 구현예에 있어서, 상기 프로모터는 SEQ ID NO: 11에 기재된 서열 또는 야생형 WHV X 유전자 프로모터 서열을 포함하는 야생형 X-유전자 프로모터이다.

[0025] 상기 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변형된 PRE는 a) SEQ ID NO:1 또는 SEQ ID NO:125와 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 상동성을 나타내는 뉴클레오티드 서열을 포함하는 변형된 PRE로서, 상기 변형된 PRE는 SEQ ID NO:1 또는 SEQ ID NO:125에 존재치 않는 하나 이상의 종결 코돈을 갖는 변이체 X 유전자를 함유하는 것인 변형된 PRE; 또는 b) a)의 뉴클레오티드 서열의 일부를 포함하는 변형된 PRE로서, 상기 일부는 하나 이상의 종결 코돈 및 전사-후 활성을 나타내는 일부를 포함하는 변이체 X 유전자를 함유하는 것인 변형된 PRE로부터 선택될 수 있다. 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는 상기 변이체 X 유전자 내에 존재하는 각각의 리딩 프레임 내 종결 코돈을 포함한다.

[0026] 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는 SEQ ID NOS: 44-58 또는 141-155 중 하나에 기재된 뉴클레오티드 서열을 포함한다. 몇 가지 구현예에 있어서, 상기 변형된 PRE는 SEQ ID NOS:29-43 또는 126-140 중 하나에 기재된 뉴클레오티드 서열을 포함한다.

[0027] 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변형된 PRE는 야생형 또는 비변형된 PRE에 존재치 않는 하나 이상의 종결 코돈 외에는 예컨대 SEQ ID NO:1 또는 SEQ ID NO:125에 존재치 않는 것과 같은 어떠한 변형을 함유하지 않는다. 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변형된 PRE는 야생형 또는 비변형된 PRE의 서열과 비교하여, 예컨대 SEQ ID NO:1 또는 SEQ ID NO:125과 비교하여, 하나 이상의 종결 코돈 외에 추가적인 변형을 함유한다.

[0028] 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는 또한 야생형 헤파티티스 바이러스 X 유전자 개시 코돈과 비교하여 하나 이상의 뉴클레오티드 차이를 포함하는 변이체 개시 코돈을 함유한다. 몇 가지 구현예에 있어서, 상기 변이체 개시 코돈은 SEQ ID NO: 1 또는 SEQ ID NO:125의 뉴클레오티드 위치 411-413에 대응하는 개시 코돈과 비교하여 하나 이상의 뉴클레오티드 차이를 함유한다. 이러한 몇 가지 구현예에 있어서, 상기 하나 이상의 차이는 상기 개시 코돈으로부터의 번역 개시 제한 또는 저지라는 결과를 낳는다. 이러한 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는 SEQ ID NOS: 74-88 또는 171-185 중 하나에 기재된 뉴클레오티드 서열을 포함하고 및/또는 상기 ㅂ변형된 PRE는 SEQ ID NOS:59-73 또는 156-170 중 하나에 기재된 뉴클레오티드 서열을 포함한다.

[0029] 상기 제공된 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는 상기 변이체 X 유전자에 작동적으로 연결된 변이체 프로모터를 함유하는데, 여기서 상기 변이체 프로모터는 야생형 헤파티티스 바이러스 X 유전자 프로모터와 비교하여 하나 이상의 뉴클레오티드 차이를 포함한다. 몇 가지 구현예에 있어서, 상기 변이체 프로모터는 SEQ ID NO: 11에 기재된 프로모터와 비교하여 하나 이상의 뉴클레오티드 차이를 함유한다. 몇 가지 구현예에 있어서, 상기 하나 이상의 차이는 상기 프로모터로부터의 전사 제한 또는 저지라는 결과를 낳는다. 이러한 몇 가지 구현예에 있어서, 상기 변형된 PRE는 SEQ ID NOS: 89-118 또는 186-215 중 하나에 기재된 뉴클레오티드 서열을 포함한다.

[0030] 상기 제공된 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 폴리뉴클레오티드의 진행 세포로의 도입으로, 상기 변이체 X 유전자에 의하여 코딩되는 12, 11, 10, 9, 또는 8개 아미노산 길이보다 긴 길이의 폴리펩타이드는 어떤 것도 생산되지 않는다. 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 폴리뉴클레오티드는 상기 변이체 X 유전자에 의하여 코딩되는 12, 11, 10, 9, 또는 8개 아미노산 길이보다 긴 길이의 폴리펩타이드를 생산할 수 없다.

[0031] 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변형된 PRE는 핵 RNA 수송을 촉진하고 및/또는 mRNA 안정성을 증가시키는 RNA를 코딩한다. 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변형된 PRE는 핵 RNA 수송을 촉진하고 및/또는 mRNA 안정성을 증가시키는 RNA 폴리뉴클레오티드를 코딩하는데, 여기서 상기 핵 RNA 수송 촉진 및/또는 mRNA 안정성은 재조합 단백질의 발현을 증가시킨다. 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변형된 PRE는 해당 야생형 또는 비변형된 헤파티티스 PRE 및/또는 SEQ ID NO:1, SEQ ID NO:125, SEQ ID NO:119, SEQ ID NO:120 및/또는 SEQ ID NO:216에 기재된 PRE의 전사-후 활성을 보유한다. 이러한 몇 가지 구현예에 있어서, 상기 변형된 PRE는 해당 야생형 또는 비변형된 헤파티티스 PRE 및/또는 SEQ ID NO:1, SEQ ID NO:125, SEQ ID NO:119, SEQ ID NO:120 및/또는 SEQ ID NO:216에 기재된 PRE의 전사-후 활성을 75%, 80%, 85%, 90%, 95%, 100%, 110%, 120% 또는 130% 이상 또는 그 이상 나타낸다. 몇 가지 구현예에 있어서, ㅅ상기 변형된 PRE의 전사-후 활성은 재조합 단백질을 코딩하는 작동적으로 연결된 핵산의 유전자 발현을 모니터링함으로써 평가될 수 있다.

[0032] 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는 또한 야생형 헤파티티스 바이러스 X 유전자에 존재치 않는 번역-후 변형 신호를 코딩하는 서열을 포함한다.

[0033] 또한, 야생형 또는 비변형된 헤파티티스 바이러스 X 유전자의 변이체를 포함하는 변형된 PRE를 함유하는 폴리뉴클레오티드가 제공되는데, 여기서 상기 변이체 X 유전자는 야생형 또는 비변형된 헤파티티스 X 유전자에는 존재치 않는 번역-후 변형 신호를 코딩하는 서열을 포함한다. 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 번역-후 변형 신호는 유비퀴틴화 부위를 함유한다.

[0034] 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 번역-후 변형 신호는, X 단백질 오픈 리딩 프레임의 개시 코돈의 5' 위치에 대응하는 상기 변이체 X 유전자의 위치로부터 3' 방향으로 2, 3, 4, 5 또는 6개 이상의 뉴클레오티드 내 위치에서 시작되는 첫번째 코돈을 함유하는데, 상기 첫번째 코돈은 N-말단 법칙에 따라 글리신, 아르기닌, 글루탐산, 페닐알라닌, 아스파테이트, 시스테인, 리신, 아스파라긴, 세린, 티로신, 트립토판, 히스티딘 또는 류신 잔기를 코딩하고; 및 필요에 따라 X 단백질 오픈 리딩 프레임의 개시 코돈의 5' 위치에 대응하는 상기 변이체 X 유전자의 위치로부터 3' 방향으로 2, 3, 4, 5 또는 6개 이상의 뉴클레오티드 내 위치에서 시작되는 두번째 코돈을 함유하는데, 상기 두번째 코돈은 N-말단 법칙에 따라 글루탐산 또는 아스파라긴 잔기를 코딩한다.

[0035] 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 번역-후 변형 신호는 하나 이상의 PEST 서열을 함유한다.

[0036] 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 폴리뉴클레오티드는 상기 변형된 PRE에 작동적으로 연결된 재조합 단백질을 코딩하는 핵산 및 야생형 또는 비변형된 헤파티티스 바이러스 X 유전자에는 존재치 않는 번역-후 변형 신호를 코딩하는 서열을 함유하는 변이체 X 유전자를 함유한다.

[0037] 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는 SEQ ID NO:1 또는 SEQ ID NO:125의 뉴클레오티드 잔기 448-470에 대응하는 베타 스템 루프를 함유하는 번역-후 변형 신호를 인코딩하는 서열을 함유한다. 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는 SEQ ID NO:1 또는 SEQ ID NO:125의 뉴클레오티드 잔기 448-470에 대응하는 베타 스템 루프 내 위치에서 뉴클레오티드 변화를 함유하지 않는 번역-후 변형 신호를 코딩하는 서열을 함유한다.

[0038] 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는 180개 뉴클레오티드 길이 이하이거나, 210개 뉴클레오티드 길이 또는 약 210개 뉴클레오티드 길이 이하이다. 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는 90개 뉴클레오티드 길이 또는 약 90개 뉴클레오티드 길이 이상이거나, 약 120개 뉴클레오티드 길이 이상이거나 180개 뉴클레오티드 길이 또는 약 180개 뉴클레오티드 길이 이상이다.

[0039] 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는 야생형 또는 비변형된 포유류 헤파티티스 X 유전자ㅢ 변이체 또는 그의 부분적 또는 절단 일부일 수 있다. 몇 가지 구현예에 있어서, 상기 야생형 또는 비변형된 X 유전자는 절단된 X 단백질을 코딩하는 부분적 X 유전자를 포함할 수 있는데, 예컨대 야생형 또는 비변형된 PRE에 존재하는 것이다. 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 야생형 또는 비변형된 포유류 헤파티티스 X 유전자 또는 부분적 X 유전자는 야생형 우드척 헤파티티스 바이러스 (WHV) X 유전자이거나 또는 그로부터 유래된다. 몇 가지 구현예에 있어서, 상기 야생형 또는 비변형된 WHV X 유전자는 SEQ ID NO:9의 뉴클레오티드 서열, SEQ ID NO: 2의 뉴클레오티드 1503-1928로서 기재되는 뉴클레오티드 서열을 함유하거나, 그의 부분적 X 유전자이다. 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 야생형 또는 비변형된 WHV X 유전자는 SEQ ID NOS: 1 및 12-20 중 하나의 뉴클레오티드 411-592로서 기재된 뉴클레오티드 서열 또는 SEQ ID NO:125의 뉴클레오티드 411-589로서 기재되는 뉴클레오티드 서열을 함유한다.

[0040] 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변형된 PRE는 야생형 헤파티티스 바이러스 PRE의 시스-작용성 전사-후 조절 하위요소 또는 그 기능적 변이체(들) 2 이상 또는 3 이상을 함유한다. 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 2 이상 또는 3 이상의 하위요소는 야생형 PRE 알파 하위요소 또는 그의 기능적 변이체, 야생형 PRE 베타 하위요소의 기능적 변이체, 및 또는 야생형 PRE 감마 하위요소 또는 그의 기능적 변이체를 함유한다. 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변형된 PRE는 야생형 헤파티티스 바이러스 PRE의 알파 하위요소 또는 그의 기능적 변이체 및 야생형 PRE 베타 하위요소의 기능적 변이체를 함유한다. 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 알파 하위요소는 SEQ ID NO: 3, SEQ ID NO:4 또는 SEQ ID NO:5의 서열 또는 그 변이체를 함유하고, 상기 베타 하위요소는 SEQ ID NO: 6 또는 SEQ ID NO:7 서열의 변이체를 함유하고, 및/또는 상기 감마 하위유닛은 SEQ ID NO: 8의 서열 또는 그의 변이체를 함유한다.

[0041] 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 야생형 또는 비변형된 헤파티티스 바이러스 PRE는 야생형 포유류 헤파티티스 PRE이다. 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 야생형 또는 비변형된 포유류 헤파티티스 바이러스 PRE는 SEQ ID NOS: 1,12-27 또는 125 중 하나에 기재된 뉴클레오티드 서열을 함유한다. 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 야생형 포유류 헤파티티스 PRE는 야생형 우드척 헤파티티스 바이러스 PRE (WPRE)이다.

[0042] 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변형된 PRE는 다음 중에서 선택된다: a) 야생형 또는 비변형된 헤파티티스 PRE의 변이체 X 유전자를 포함하는 변형된 PRE로서, 상기 야생형 또는 비변형된 헤파티티스 PRE는 SEQ ID NO:1 또는 SEQ ID NO:125에 기재되는 뉴클레오티드 서열 또는 SEQ ID NO:1 또는 SEQ ID NO:125와 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 상동성을 나타내는 뉴클레오티드 서열을 함유하고, 상기 변이체 X 유전자는 상기 야생형 또는 비변형된 헤파티티스 바이러스 X 유전자에는 존재치 않는 번역-후 변형 신호를 코딩하는 서열을 함유하는 것이고; 및 b) a)의 뉴클레오티드 서열의 일부를 함유하는 변형된 PRE로서, 상기 일부는 번역-후 변형 신호를 코딩하는 서열을 함유하는 변이체 X 유전자를 함유하고, 전사-후 활성을 나타내는 것이다.

[0043] 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는 SEQ ID NO: 1 또는 SEQ ID NO:125의 위치 411에 대응하는 위치에서 시작하는 개시 코돈을 함유한다. 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 개시 코돈은 ATG 개시 코돈이다. 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는 상기 변이체 X 유전자에 작동적으로 연결된 프로모터를 함유한다. 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 프로모터는 SEQ ID NO: 11에 기재되는 서열 또는 야생형 WHV X 유전자 프로모터 서열을 함유하는 야생형 X 유전자 프로모터이다.

[0044] 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변형된 PRE는 다음 중에서 선택된다: a) SEQ ID NO:1 또는 SEQ ID NO:125와 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 상동성을 나타내는 뉴클레오티드 서열을 함유하는 변형된 PRE로서, 상기 변형된 PRE는 SEQ ID NO:1 또는 SEQ ID NO:125에는 존재치 않는 번역-후 변형 신호를 코딩하는 서열을 함유하는 것이고; 및 b) a)의 뉴클레오티드 서열의 일부를 함유하는 변형된 PRE로서, 상기 일부는 번역-후 변형 신호를 코딩하는 서열을 함유하는 변이체 X 유전자를 함유하고, 전사-후 활성을 나타내는 것이다.

[0045] 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 또는 12개 이하의 뉴클레오티드 변화를 함유한다.

[0046] 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변형된 PRE는 번역-후 변형 신호를 코딩하는 서열 외에는 어떠한 변형을 함유하지 않는다. 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변형된 PRE는 야생형 또는 비변형된 헤파티티스 바이러스 X 유전자에 존재치 않는 번역-후 변형 신호를 코딩하는 서열 외에 추가적인 변형(들)을 함유한다. 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 추가적인 변형(들)은 변이체 X 유전자에 있다. 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 추가적인 변형(들)은 비활성 X 단백질 및/또는 절단된 X 단백질을 코딩하는 변이체 X 유전자라는 결과를 낳는다.

[0047] 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변형된 PRE는 핵 RNA 수송을 촉진하고 및/또는 mRNA 안정성을 증가시키는 RNA를 코딩한다. 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 핵 RNA 수송 촉진하고 및/또는 mRNA 안정성은 재조합 단백질의 발현을 증가시킨다.

[0048] 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변형된 PRE는 야생형 또는 비변형된 헤파티티스 PRE 및/또는 SEQ ID NO:1, SEQ ID NO: 119, SEQ ID NO: 120, SEQ ID NO: 125 또는 SEQ ID NO:216에 기재되는 PRE에 대응하는 전사-후 활성을 보유한다. 이러한 몇 가지 구현예에 있어서, 상기 변형된 PRE는 대응하는 야생형 또는 비변형된 헤파티티스 PRE 및/또는 SEQ ID NO:1, SEQ ID NO:125, SEQ ID NO:119, SEQ ID NO:120 및/또는 SEQ ID NO:216에 기재된 PRE의 전사-후 활성을 75%, 80%, 85%, 90%, 95%, 100%, 110%, 120% 또는 130% 이상 또는 그 이상 나타낸다. 몇 가지 구현예에 있어서, 상기 변형된 PRE의 전사-후 활성은 재조합 단백질을 코딩하는 작동적으로 연결된 핵산의 유전자 발현을 모니터링함으로써 평가될 수 있다.

[0049] 몇 가지 구현예에 있어서, 상기 제공되는 폴리뉴클레오티드 중 하나는 변이체 Flap을 함유하는 바이러스 핵산을 더 함유할 수 있는데, 상기 변이체 Flap은 야생형 또는 비변형된 Flap 서열의 중심 폴리퓨린 트랙 (cPPT) 및/또는 중심 종결 서열 (CTS) 영역에 해당하는 뉴클레오티드 전부 또는 일부의 결실을 함유한다. 이러한 구현예에 있어서, 상기 폴리뉴클레오티드는 변형된 PRE 및 변이체 Flap을 함유한다. 몇 가지 구현예에 있어서, 이러한 요소들은 재조합 단백질을 코딩하는 핵산과 작동적으로 연결되고 및/또는 이러한 요소들의 부재시와 비교할 때, 재조합 단백질을 코딩하는 이종 핵산의 유전자 전이 효율의 증가를 결과한다.

[0050] 또한, 변이체 Flap을 함유하는 폴리뉴클레오티드가 제공되는데, 상기 변이체 Flap은 야생형 또는 비변형된 Flap 서열의 중심 폴리퓨린 트랙 (cPPT) 및/또는 중심 종결 서열 (CTS) 영역에 해당하는 뉴클레오티드 전부 또는 일부의 결실을 함유한다. 몇 가지 구현예에 있어서, 변이체 Flap을 함유하는 상기 폴리뉴클레오티드는 재조합 단백질을 코딩하는 핵산을 더 함유할 수 있다. 몇 가지 구현예에 있어서, 변이체 Flap을 함유하는 폴리뉴클레오티드의 존재는, Flap 구조를 형성하는데 관여된 cPPT 및 CTS의 전체 또는 일부가 결실되었지만, 그럼에도 불구하고 상기 재조합 단백질을 코딩하는 핵산을 이용하여 성공적으로 형질도입 또는 세포로의 전이를 가능하게 할 수 있다.

[0051] 변이체 Flap을 함유하는 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변이체 Flap은 cPPT 및 CTS에 대응하는 뉴클레오티드의 전체 또는 일부 결실을 함유한다. 몇 가지 구현예에 있어서, cPPT에 대응하는 뉴클레오티드 잔기 모두 및 CTS에 대응하는 뉴클레오티드 잔기 모두가 결실되고 및/또는 상기 변이체 Flap은 cPPT에 대응하는 뉴클레오티드 잔기 및 CTS에 대응하는 뉴클레오티드 잔기를 함유하지 않는다. 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변이체 Flap은 SEQ ID NO: 123에 기재된 cPPT 영역의 뉴클레오티드에 대응하는 뉴클레오티드의 전부 또는 인접한 일부의 결실을 함유한다. 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변이체 Flap은 SEQ ID NO: 124에 기재된 CTS 영역의 뉴클레오티드에 대응하는 뉴클레오티드의 전부 또는 인접한 일부의 결실을 함유한다. 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변이체 Flap은 SEQ ID NO: 123에 기재된 cPPT 영역의 뉴클레오티드에 대응하는 뉴클레오티드의 전부 또는 인접한 일부의 결실 및 SEQ ID NO: 124에 기재된 CTS 영역의 뉴클레오티드에 대응하는 뉴클레오티드의 전부 또는 인접한 일부의 결실을 함유한다.

[0052] 변이체 Flap을 함유하는 폴리뉴클레오티드의 이러한 구현예 중 하나에 있어서, 상기 변이체 Flap은 야생형 또는 비변형된 Flap을 함유하는 서열과 비교하여 변형되거나 변형을 포함한다. 몇 가지 구현예에 있어서, 상기 야생형 또는 비변형된 Flap 서열은 레트로바이러스, 필요에 따라 렌티바이러스인 레트로바이러스의 cPPT 또는 CTS 영역을 포함하는 80 내지 200개 또는 약 80 내지 200개의 ㅇ이인접한 뉴클레오티드를 함유한다. 몇 가지 구현예에 있어서, 상기 레트로바이러스는 렌티바이러스이다. 몇 가지 구현예에 있어서, 상기 렌티바이러스는 HIV-1이다. 몇 가지 구현예에 있어서, 상기 야생형 또는 비변형된 Flap은 a) SEQ ID NO:121에 기재되는 뉴클레오티드 서열; b) cPPT 및 CTS 영역을 함유하는 SEQ ID NO:121에 기재되는 뉴클레오티드 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 상동성을 갖는 뉴클레오티드 서열; 또는 c) cPPT 및 CTS 영역을 포함하는 a) 또는 b)의 인접한 일부를 함유한다.

[0053] 몇 가지 구현예에 있어서, 상기 변이체 Flap을 함유하는 바이러스 핵산은 SEQ ID NO:121과 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 85%, 90% 또는 95% 이상의 서열 상동성을 나타내는 뉴클레오티드 서열이거나 이이를 포함하고, 상기 변이체 Flap은 cPPT 및 CTS 영역의 전부 또는 일부를 결여하는 것이다. 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 바이러스 핵산은 SEQ ID NO:122에 기재되는 서열이거나 이를 함유한다.

[0054] 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 폴리뉴클레오티드는 a) SEQ ID NO: 122의 서열 또는 SEQ ID NO: 122의 서열과 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상의 서열 상동성 또는 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상의 서열 상동성을 갖는 서열이거나 그를 포함하는 변이체 Flap으로서, 상기 변이체 Flap은 대응하는 야생형 또는 비변형된 Flap 또는 SEQ ID NO:121에 기재되는 서열의 cPPT 및 CTS 영역의 전부 또는 일부를 결여하는 것이고; b) SEQ ID NO:29 또는 126의 서열 또는 SEQ ID NO:29 또는 126의 서열과 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상의 서열 상동성 또는 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상의 서열 상동성을 갖는 서열이거나 그를 포함하는 변형된 PRE로서, 상기 변형된 PRE는 상기 변형된 PRE의 상기 변이체 X 유전자 내에 야생형 또는 비변형된 X 유전자에는 존재치 않거나, X 유전자를 함유하는 야생형 또는 비변형된 PRE에는 존재치 않는, 예컨대 SEQ ID NO:1 또는 SEQ ID NO:125에는 존재치 않는 하나 이상의 종결 코돈을 함유하는 것을 함유한다.

[0055] 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 변형된 WPRE 및/또는 변이체 Flap은 재조합 수용체이거나 그를 함유하는 재조합 단백질을 코딩하는 뉴클레오티드와 작동적으로 연결된다. 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 재조합 수용체는 항원 수용체 및/또는 키머라 수용체이다. 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 재조합 수용체는 기능적 비(非)-TCR 항원 수용체 또는 트랜스제닉 TCR이다. 상기 제공되는 폴리뉴클레오티드 중 하나의 몇 가지 구현예에 있어서, 상기 재조합 수용체는 키메라 항원 수용체 (CAR)이다.

[0056] 몇 가지 구현예에 있어서, 상기 제공된 폴리뉴클레오티드 중 하나와 재조합 단백질을 코딩하는 핵산과 작동적으로 연결된 프로모터를 함유하는 발현 카세트가 또한 제공된다. 몇 가지 구현예에 있어서, 상기 제공되는 폴리뉴클레오티드 중 하나 또는 발현 카세터를 함유하는 벡터가 또한 제공된다. 상기 제공되는 벡터 중 하나의 몇 가지 구현예에 있어서, 상기 벡터는 바이러스 벡터이다. 상기 제공되는 벡터 중 하나의 몇 가지 구현예에 있어서, 상기 벡터는 레트로바이러스 벡터이다. 상기 제공되는 벡터 중 하나의 몇 가지 구현예에 있어서, 상기 벡터는 렌티바이러스 벡터이다. 몇 가지 구현예에 있어서, 상기 바이러스 벡터는 HIV-1으로부터 유래하는 렌티바이러스 벡터이다.

[0057] 몇 가지 구현예에 있어서, 상기 제공되는 폴리뉴클레오티드 중 하나, 발현 카세트 또는 상기 제공되는 벡터 중 하나를 함유하는 세포가 또한 제공된다. 상기 제공되는 세포 중 하나의 몇 가지 구현예에 있어서, 상기 세포는 T 세포, 자연 살해 세포 (NK cell), iPS 세포, 또는 iPS-유래 세포이다.

[0058] 몇 가지 구현예에 있어서, 상기 제공되는 벡터 중 하나를 함유하는 바이러스 입자가 또한 제공된다.

[0059] 몇 가지 구현예에 있어서, 그에 의하여 재조합 단백질의 발현이 세포 내에서 유효하게 되는 조건 하에서, 상기 세포 내로 상기 제공되는 폴리뉴클레오티드 중 하나, 발현 카세트, 벡터 또는 바이러스 입자를 도입하는 단계를 포함하는 방법이 또한 제공된다. 상기 제공되는 방법 중 하나의 몇 가지 구현예에 있어서, 도입은 상기 세포를 상기 벡터나 바이러스 입자를 형질도입함으로써 유효하다. 몇 가지 구현예에 있어서, 상기 도입은 상기 벡터로 상기 세포를 형질전환함으로써 유효하고; 및/또는 상기 도입은 상기 벡터로 상기 세포를 전기천공 (electroporation)함으로써 유효하다. 상기 제공되는 방법 중 하나의 몇 가지 구현예에 있어서, 상기 재조합 단백질은, 상기 벡터를 변형된 PRE 부존재하에 도입하거나 상기 변형된 PRE 또는 PRE를 함유하지 않는 대응 벡터를 도입함으로써 얻어지는 것과 비교하였을 때 증가된 수준으로 발현된다.

[0060] 또한, 상기 제공되는 방법 중 하나에 의하여 제조되는 세포 또는 세포들이 제공된다.

[0061] 또한, 상기 제공되는 구현예 중 하나의 세포와 약학적으로 유효한 캐리어를 함유하는 약학적 조성물이 제공된다.

[0062] 또한, 질병 또는 질환을 가지는 대상체에게 상기 제공되는 폴리뉴클레오티드 중 하나, 벡터, 바이러스 입자, 세포 또는 약학적 조성물을 투여하는 단계를 포함하는 치료 방법이 제공된다.

[0063] 상기 제공되는 치료 방법 중 하나의 몇 가지 구현예에 있어서, 상기 방법은 상기 폴리뉴클레오티드에 의하여 코딩되는 재조합 단백질의 발현이라는 결과를 낳는다. 몇 가지 구현예에 있어서, 상기 재조합 단백질은 상기 질병 또는 질환에 의하여 발현되는 리간드 또는 그의 세포 또는 조직에 특이적으로 결합하는 재조합 수용체를 포함한다. 상기 제공되는 방법 중 하나의 몇 가지 구현예에 있어서, 상기 수용체는 항원 수용체이고 상기 리간드는 상기 질병 또는 질환에 대한 항원 특이적이고 및/또는 그와 관련된 것이다. 상기 제공되는 방법 중 하나의 몇 가지 구현예에 있어서, 상기 질병 또는 질환은 암, 및 자가면역 장애 또는 감염성 질병이다.

[0064] 도 1은 SEQ ID NO:1에 기재되는 예시적 WPRE 핵산 서열을 도시한다. 보고된 PRE 하위요소 (Donello et al. (1998) J. Virol., 72:5085; Smith et al. (1998) Nucleic Acids Research, 26:4818)는 다음과 같이 나타난다: 감마 하위요소, 알파 하위요소, 및 베타 하위요소가 그 시작과 끝 위치를 표시하는 화살표와 함께 실선으로 표시된다; 각각, 알파와 베타 하위요소의 예시적 스템 루프-형성 부분에 대응하는 뉴클레오티드가 파선과 이탤릭으로 표시된다; WHX 단백질 프로모터에 대응하는 뉴클레오티드는 파점선과 이탤릭으로 표시된다; 이러한 WPRE 내에 함유되는 절단된 X 유전자에 대응하는 뉴클레오티드는 밑줄 그어져 있다. 그 요소들에 대한 개시는 이론적으로 또는 경험적으로 얻어지는 것으로 이해된다. 따라서, 정확한 위치는 변할 수 있고 (예컨대, 길거나 짧게), 대응하는 요소는 각 PRE에 대하여, 예컨대 각각의 종 또는 하위종의 PRE에 대하여 반드시 같지 않다.
[0065] 도 2A-2E는 SEQ ID NO:1에 기재되는 WPRE 서열과 다른 예시적 헤파티티스 PRE들과의 예시적 서열정렬을 도시하며, 대응하는 잔기들을 확인하고 있다. 정렬된 두 뉴클레오티드 간 심볼 "|"은 정렬된 뉴클레오티드들이 동일하다는 것을 표시한다. 정렬된 두 뉴클레오티드 간에 "|"가 없으면 정렬된 뉴클레오티드들이 동일하지 않다는 것을 표시한다. 심볼 "-"는 정렬 내의 갭을 표시한다. X 유전자 개시 코돈에 대응하는 예시적, 비제한적 위치는 굵고 이탤릭인 텍스트로 표시된다. 그 안으로 종결 코돈이 도입될 수 있는 위치에 해당하는 X 유전자 내의 예시적, 비제한적 위치는 박스 표시된다. 이러한 위치들은 도입되는 종결 코돈의 위치화를 위한 예시적 개시 잔기에 해당한다 (예컨대, 종결 코돈의 3' 위치). 예컨대, 도 2A는 SEQ ID NO:1에 기재되는 예시적 WPRE와 SEQ ID NO:12에 기재되는 예시적 WPRE에 대응하는 핵산과의 서열정렬을 도시한다. 도 2B는 SEQ ID NO:1에 기재되는 예시적 WPRE와 SEQ ID NO:13에 기재되는 예시적 WPRE에 대응하는 핵산과의 서열정렬을 도시한다. 도 2C는 SEQ ID NO:1에 기재되는 예시적 WPRE와 SEQ ID NO:119에 기재되는 예시적 WPRE에 대응하는 핵산과의 서열정렬을 도시한다. 도 2D는 SEQ ID NO:1에 기재되는 예시적 WPRE와 SEQ ID NO:27에 기재되는 Ground Squirrel 헤파티티스 B 바이러스 PRE에 대응하는 핵산과의 서열정렬을 도시한다. 도 2E는 SEQ ID NO:1에 기재되는 예시적 WPRE와 SEQ ID NO:21에 기재되는 인간 헤파티티스 B 바이러스 (HBV) PRE에 대응하는 핵산과의 서열정렬을 도시한다.

상세한 설명

I. 변형된 전사-후 조절 요소 (PRE)를 함유하는 폴린뉴클레오티드 및 바이러스 벡터

[0066] 재조합 분자, 예컨대 재조합 단백질의 발현을 증가시키는데 유용한 폴리뉴클레오티드가 제공된다. 상기 폴리뉴클레오티드는 변형된 전사-후 조절 요소 (변형된 PRE), 예컨대 시스-작용성 전사-후 조절 요소, 예컨대 변형된 버전의 바이러스 전사-후 조절 요소, 예컨대 변형된 버전의 헤파티티스 바이러스 유래, 예컨대 우드척 헤파티티스 바이러스 (WHV) 및 헤파티티스 B 바이러스 (HBV) 유래의 PRE를 함유한다.

[0067] 몇 가지 구현예에 있어서, 상기 변형된 PRE는 변형된 버전의 야생형 WHV 전사-후 조절 요소 (WPRE) 또는 변형된 버전의 HBV 전사-후 조절 요소 (HBVPRE), 예컨대 단백질(들) 또는 폴리펩타이드(들), 특히 숙주 대상체에게 종양생성 또는 면역원성 가능성을 갖는 것들이 상기 PRE 내 코딩 서열로부터 발현될 위험 및/또는 생성된다면, 그러한 단백질이 계속하여 유지될 위험을 감소시키는 변형을 갖는 것들을 포함한다. 일반적으로, 야생형 PRE 서열은 절단된 X 단백질을 코딩하는 부분 X 유전자를 코딩하는 오픈 리딩 프레임 (ORF)를 함유하는데, 이는, 어떤 경우에는, 발현되는 경우 종양 발생과 연관될 수 있는 것이다. 또한, PRE는 일반적으로 발현 벡터로부터 전이유전자 (transgene) 발현을 증가시키는데 이용되기 때문에, PRE를 함유하는 벡터의 전달은 대상체에 투여되는 경우 면역원성의 원인이 될 수 있는 절단된 X 단백질의 외인성 발현을 결과할 수도 있다.

[0068] 상기 제공되는 변형된 PRE는 변이체 X 유전자를 포함하는데, 상기 변이체 X 유전자는 비변형된 또는 야생형 헤파티티스 바이러스 X 유전자와 비교하여 하나 이상의 뉴클레오티드 변형을 포함한다. 이러한 변형은 일반적으로, 예컨대 상기 PRE에 의하여 코딩되는 특정 단백질의 발현을 저지함으로써 재조합 분자의 발현을 위한 재조합 분자를 코딩하는 핵산과 작동적으로 연결되는 이러한 변형된 PRE를 함유하는 폴리뉴클레오티드 (예컨대, 바이러스 벡터)를 대상체에 도입함에 따른 종양생성 및/또는 면역원성 가능성을 감소시킨다. 예컨대, 상기 변형(들)은 일반적으로 상기 변형된 PRE의 변이체 X 유전자로부터의 폴리펩타이드 발현 가능성을 저지하거나 감소시키기 위하여 설계된 것들을 포함한다. 상기 변형은 이른바 상기 변형된 PRE가 적어도 일부의 전사-후 조절 활성, 예컨대 대응하는 야생형 PRE의 전사-후 조절 활성의 전부 또는 일부를 보유하는 것이다. 몇 가지 구현예에 있어서, 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 이상 또는 그 이상 또는 약 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 이상 또는 그 이상의 전사-후 조절 활성이 보유된다.

[0069] 바이러스 벡터가 유전전 재로의 세포로의 도입에 있어서 효율적인 시스템을 제공할 수 있지만, 특정 바이러스 벡터의 이용이 그러한 유전적 재료의 원하는 수준의 발현을 항상 생성할 수 있는 것은 아니다. 어떤 맥락에서는 인트론 삽입이 이용되지만, 특정 바이러스 벡터에서 항상 적절한 것은 아닐 수 있다. 헤파티티스 전사-후 조절 요소 (HPRE), 예컨대 우드척 헤파티티스 바이러스 전사-후 조절 요소 (WPRE)는 유전자 발현을 증가시키기 위하여 이용되었다.

[0070] 헤파티티스 바이러스-유래 PRE, 예컨대 WPRE 및 HBVPRE는 일반적으로 핵으로부터 전사-후 RNA 수송을 용이하게 함으로써 그에 작동적으로 연결된 전이유전자의 발현을 촉진, 예컨대 증가시킨다. PRE 내 함유되는 시스-작용성 서열 또는 요소에 의하여 형성되는 2차 및 3차 구조가 이러한 기능을 촉진할 수 있다. 예컨대, 야생형 헤파티티스 바이러스-유래 PRE는 일반적으로 알파 하위요소 및 베타 하위요소를 포함하는데, 이들은 각각 독립적으로 스템 루프 구조를 형성하며, 전체적인 PRE 전사-후 활성에 영향을 미치고 및/또는 그에 관여되어 있다 (Smith et al. (1998) Nucleic Acids Research, 26:4818-4827). 몇몇 야생형 비(非) 인간 헤파티티스 바이러스 PRE, 예컨대 WPRE는 전사-후 활성을 더욱 증가시킬 수 있는 감마 하위요소도 포함한다. 이러한 하위요소는, 예컨대 CRM1-의존성 및/또는 비의존성 수송 장치와의 상호작용을 통하여 핵으로부터의 RNA 수송을 촉진하는 구조를 갖는 RNA를 갖거나 코딩할 수 있고, 세포 단백질의 결합 부위를 제공하며, RNA, 예컨대 재조합 및/또는 이종 RNA, 전사물의 총량을 증가시키고, RNA 안정성을 증가시키고, 폴리-아데닐화된 전사물의 수를 증가시키고 및/또는 그러한 전사물에서 폴리-아데닐화 꼬리의 크기를 늘릴 수 있다.

[0071] 이들 시스-작용성 서열을 통하여 발현-증가 기능을 제공하는 것 외에, 야생셩 및 비변형된 헤파티티스-바이러스 PRE, 예컨대 포유류 헤파티티스 바이러스-유래 PRE, 예컨대 HBVPRE 또는 WPRE는 바이러스 X 유전자의 일부분, 예컨대 적어도 절단된 X 단백질을 코딩하는 부분적 오픈 리딩 프레임을 적어도 일부분 포함하는 일부분을 함유한다. 이 영역은 일반적으로 상기 시스-작용성 조절 하위요소와 적어도 부분적으로 중복된다. 그러나, X-단백질 - 심지어 특정한 절단된 X-단백질이라도 - X-단백질은 대상체에서 유전자 발현을 위한 벡터 내에 포함되는 경우 종양생성 가능성을 나타낼 수 있다. PRE의 X-유전자 영역 내, 예컨대 개시 부위 및/또는 프로모터 영역에 만들어진 돌연변이가 이들 우려를 해결하기에 반드시 전부 충분하지는 않다. 예컨대, 감소된 활성을 갖는 돌연변이 프로모터조차 PRE의 X 단백질 또는 그 영역에 의하여 코딩되는 다른 폴리펩타이드의 어느 정도의 발현을 허할 수 있다. X 유전자 내 하나 이상의 위치에서의 역전 또는 추가적인 돌연변이는 상기 X 단백질의 발현 수준을 복구하거나 증가시켜, 종양생성을 촉진시킬 수 있다. 종양생성 가능성과 별개라 하더라도, 상기 X 단백질 또는 이 영역 내 또는 상기 프로모터와 작동적으로 연결된 다른 리딩 프레임으로부터, 임의의 폴리펩타이드, 특히 특정 길이 이상의 임의의 폴리펩타이드 (예컨대, 8, 9, 10, 11, 또는 12개 아미노산 이상 길이 또는 그 이상)의 발현 위험성은 대상체에 투여되는 경우 면역원성을 촉진할 수 있다. 이러한 문제점들을 해결하는 변형된 PRE를 갖는 핵산들이 제공된다.

[0072] 통상, PRE의 X 영역은 전장 길이 헤파티티스 X 단백질보다 작은 절단된 X 단백질을 코딩하는 부분적 리딩 프레임을 포함하는데, 예컨대 141개 아미노산 길이보다 작은, 예컨대 130개 뉴클레오티드보다 작은, 120개 뉴클레오티드보다 작은, 110개 뉴클레오티드보다 작은, 100개 뉴클레오티드보다 작은, 90개 뉴클레오티드보다 작은, 80개 뉴클레오티드보다 작은, 70개 뉴클레오티드보다 작은, 및 일반적으로 60, 50, 40, 30, 20, 10개보다 적은 또는 더 적은 뉴클레오티드 길이인 것들이다. 도 1에 도시되는 예시적 야생형 WPRE에 나타나 있듯이, X 프로모터 및 부분적 리딩 프레임은 알파 및 베타 시스-작용성 서열과 중복된다. 이러한 부분적 오픈 리딩 프레임의 번역은 절단된 X 단백질의 코딩이라는 결과를 낳을 수 있는데, 이는 대상체로 도입시 종양 형성 및/또는 면역원성 반응을 촉진할 가능성을 가질 수 있다.

[0073] 예컨대, SEQ ID NO:1에 기재되는 예시적 WPRE를 참고하면 (SEQ ID NO:2 또는 GenBank Acc. No. J04514.1의 뉴클레오티드 1093-1684에 대응), 뉴클레오티드 411-592는 뉴클레오티드 391-410으로 기재되는 X 프로모터의 작동적 제어하의 부분적 ㅌ 단백질 오픈 리딩 프레임에 해당한다. X 프로모터로부터 시작되는 전사체의 번역은 절단된 X 단백질을 코딩한다. 일반적으로 전부가 PRE에 나타나지는 않지만, 대응하는 예시적 전장 길이 X 단백질 오픈 리딩 프레임은 425 염기쌍이고, 뉴클레오티드 1483-1502에 대응하는 X 프로모터의 작동적 제어하에서 SEQ ID NO:2에 기재되는 예시적 헤파티티스 바이러스 서열의 뉴클레오티드1503-1928에 대응한다. 다른 야생형 또는 비변형된 포유류 헤파티티스 바이러스 PRE도 또한 부분적 X 단백질 오픈 리딩 프레임을 함유할 수 있다. 예시적인 비변형된 또는 야생형 포유류 헤파티티스 바이러스 PRE, 및 대응하는 부분적 X 단백질 오픈 리딩 프레임이 표 1에 기재된다. SEQ ID NO:1 또는 SEQ ID NO:125 (SEQ ID NO:1의 뉴클레오티드 1-589를 함유)에 기재되는 예시적 WPRE의 잔기에 대응하는 임의의 PRE 내 잔기, 예컨대 임의의 포유류 PRE의 잔기들이 예시적 서열에 대하여 도 2A-2B에 예시되어 있듯이 각각의 PRE의 전장 길이 서열의 정렬에 의하여 확인될 수 있다. 확인될 수 있는 ㄷ대 잔기들의 비제한적인 예는, 예컨대 임의의 시스-작용성 요소 또는 그 일부분의 잔기 (예컨대, 알파, 베타 또는 감마 또는 그들의 일부분), X 단백질 오픈 리딩 프레임의 잔기, 개시 코돈의 잔기, 종결 코돈의 도입을 위한 잔기를 들 수 있다.

[0074] 상기 제공되는 변형된 PRE의 구현예에 있어서, 그에 함유되는 상기 변이체 X 유전자는 비변형된 또는 야생형 X 유전자의 변이체이다. 상기 비변형된 X 유전자는 부분적 X 유전자 리딩 프레임, 예컨대 비변형된 또는 야생형 PRE에 존재하는 X 유전자 오픈 리딩 프레임을 포함하는 임의의 것일 수 있다. 예컨대, 상기 변형된 PRE의 X 유전자의 변이체는 포유류 헤파티티스 바이러스 X 유전자의 일부분을 포함하는데, 이는 부분적인 X 단백질 오픈 리딩 프레임을 함유하고 절단된 X 단백질을 코딩할 수 있는 것으로, 통상 더욱 변형되어 종양생성 및/또는 면역원성의 위험을 감소시키기 위한 하나 이상의 종결 코돈 또는 다른 변형을 포함할 수 있다. 예컨대, 상기 변이체 X 유전자는 야생형 X 유전자의 일부분의 변이체를 포함한다. 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는 180개 이상 길이이나 전장 헤파티티스 바이러스 X 유전자에 함유된 것보다 적은 뉴클레오티드를 함유할 수 있는데, 예컨대 425 뉴클레오티드 길이보다 적은 것이다. 일반적으로, 상기 변이체 X 유전자가 함유되는 상기 변형된 PRE는 RNA 전자체의 전사-후 활성을 조절하기 위하여 충분한 부분의 시스-조절 서열을 함유한다 (예컨대, 하나 이상의 알파, 베타 및/또는 감마 하위요소, 그 부분(들) 및/또는 그 기능적 변이체(들)).

[0075] 변형된 PRE의 변이체 X 유전자 내 뉴클레오티드 변형은 뉴클레오티드 결실, 삽입 및/또는 치환을 포함한다. 이러한 변형은 상기 바이러스 X 단백질 또는 그 일부분을 코딩하는 PRE의 영역에서의 뉴클레오티드 변화를 포함할 수 있는데, 이는 종결 코돈, 절단을 위하여 단백질을 표적하는 서열, 및 이들의 조합을 결과하는 뉴클레오티드 변화를 포함하지만 이에 국한되는 것은 아니다. 상기 변형은 통상 이른바 상기 변형된 PRE가 적어도 일부 전사-후 조절 활성을 보유하는 것인데, 예컨대 대응하는 야생형 PRE 또는 비변형된 PRE (예컨대, SEQ ID NO:1 또는 SEQ ID NO:125) 또는 바이러스 벡터 형질도입에 사용하기에 충분한 정도의 활성을 갖는 이 기술 분야에 공지된 또 다른 변형된 PRE, 예컨대 SEQ ID NO: 119 또는 SEQ ID NO:120에 기재된 서열을 갖는 PRE의 전사-후 조절 활성의 전부 또는 일부이다. 몇 가지 구현예에 있어서, 상기 변형된 PRE는 재조합 단백질, 예컨대 이종 단백질을 코딩하는 핵산에 작동적으로 연결된 발현 벡터 (예컨대, 바이러스 벡터) 내에서 제공된다. 본 발명의 문맥상 이종이라는 용어에 의하여는 바이러스로부터는 일반적으로 발현되지 않는 및/또는 바이러스 게놈에 의하여 코딩되지 않는 단백질을 지칭하게 된다. 몇 가지 구현예에 있어서, 상기 이종 단백질은 상기 PRE가 유래하는 헤파티티스 바이러스에 의하여는 발현되지 않는 것이다. 이러한 구현예 중 하나에 있어서, 상기 제공되는 변형된 PRE는, 예컨대 PRE를 함유하지 않는 발현 벡터로부터의 재조합 단백질 발현과 비교하여 상기 재조합 단백질을 코딩하는 핵산의 발현을 증가시킬 수 있다.

[0076] 몇 가지 구현예에 있어서, 상기 제공되는 변형된 PRE는 전사-후 활성을 나타내어, 예컨대 대상체로의 도입 및/또는 발현시 종양생성의 가능성을 회피하거나 감소시키면서, 작동적으로 연결된 핵산의 발현을 증가시킨다. 예컨대, PRE에 의하여 코딩되는 기능적 전장 X 단백질 또는 절단된 X 단백질의 원치 않는 발현은 종양생성을 촉진할 수 있다. 몇 가지 구현예에 있어서, 상기 변형된 PRE는 원치 않는 단백질, 예컨대 바이러스 X 단백질 또는 그의 기능적 일부분의 발현 가능성을 저지하거나 감소시키는 변형들을 포함하는 변이체 X 유전자를 포함함으로써 종양생성의 위험을 감소시킨다. 예컨대, 이러한 변형은 상기 변이체 X 유전자 내에 하나 이상의 종결 코돈, 예컨대 비변형된 또는 야생형 X 유전자에는 존재치 않는 종결 코돈(들)을 도입하는 뉴클레오티드 변화를 포함할 수 있고, 그로써 원치 않는 단백질, 예컨대 종양생성을 야기하기에 충분한 X 단백질 또는 그의 기능적 일부분 및/또는 종양생성 가능성을 갖는 임의의 펩타이드가 발현되지 않는다. 다른 예에 있어서, 이러한 변형은 비변형 또는 야생형 X 유전자에는 존재치 않는 번역-후 변형 신호, 예컨대 유비퀴틴화 부위를 상기 변이체 X 유전자에 도입하는 뉴클레오티드 변화를 포함하고, 그로써 코딩되는 X 단백질은 절단을 위한 표적이 된다.

[0077] 몇 가지 구현예에 있어서, 상기 제공되는 변형된 PRE는 또한, 비변형된 또는 야생형 PRE에 비하여 X 유전자 프로모터 및/또는 개시 코돈 내 변형(들) (예컨대, 뉴클레오티드 삽입, 치환 또는 교체 또는 결실)을 포함한다. 몇 가지 구현예에 있어서, 상기 제공되는 변형된 PRE는 X 유전자 프로모터 내 변형을 포함하지 않는다. 몇 가지 구현예에 있어서, 상기 제공되는 변형된 PRE는 X 유전자 개시 코돈 내 변형을 포함하지 않는다. 몇 가지 구현예에 있어서, 상기 제공되는 변형된 PRE는 X 유전자 프로모터 및 X 유전자 개시 코돈 내 변형을 포함하지 않는다. 다른 구현예에 있어서, 상기 X 유전자 프로모터 및/또는 개시 코돈은 야생형이다.

[0078] 몇 가지 구현예에 있어서, 변형된 PRE의 변이체 X 유전자에 의하여 코딩되는 X 단백질의 발현에 영향을 미치는 변형은 하나 이상 존재한다. 예컨대, 몇 가지 구현예에 있어서, 상기 변형된 PRE는 대응하는 비변형된 또는 야생형 PRE에 존재치 않는 복수개의 종결 코돈, 예컨대 2, 3, 4, 5, 6개 또는 그 이상의 종결 코돈을 함유하는 변이체 X 유전자를 함유한다. 예컨대, 복수개의 종결 코돈의 도입을 효과하는 것과 같은 다수의 뉴클레오티드 변화가 존재하기 때문에, 상기 제공되는 변형된 PRE는 상기 비변형된 서열, 예컨대 야생형 서열로의 회귀로부터 결과하는 X 단백질 발현의 가능성을 감소시킬 수 있다. 몇 가지 구현예에 있어서, 복수개의 종결 코돈은 변이체 X 유전자의 각각의 리딩 프레임 내 종결 코돈 및/또는 하나의 리딩 프레임 내 다수개의 종결 코돈을 포함할 수 있고, 그에 따라 원치 않는 단백질 발현의 가능성을 감소시킬 수 있다. 몇 가지 구현예에 있어서, 3개 이상의 종결 코돈은, 예컨대 모든 3개의 리딩 프레임, 몇 가지 구현예에 있어서는 순차적일 수 있는 모든 3개의 리딩 프레임에 포함된다.

[0079] 상기 제공되는 변형된 PRE는 PRE에 존재하는 X-유전자의 야생형 서열로의 회귀 또는 개시 위치 또는 그 프로모터 및/또는 다른 돌연변이로 인한 다른 발암성 폴리펩타이드의 발현에서 기인하는 발암 위험을 감소시킬 수 있는 특징들을 함유한다. 이러한 특징들은 시중의 변형된 전사-후 조절 서열들, 예컨대 X 단백질 프로모터 및/또는 개시 코돈에만 변형을 함유하는 것들 (U.S. Patent No: 7,419,829 참조)을 넘어서는 이점을 제공할 수 있다. 예컨대, 돌연변이된 프로모터들이라도 반드시 그 프로모터로부터 단백질 발현을 완전히 없애는 결과를 낳을 수 있는 것은 아니다. 상기 변이체 X 유전자 내에 다수의 종결 코돈을 생성하는 다수의 변형을 포함함으로써, 몇 가지 구현예에 있어서 상기 제공되는 변형된 PRE는 그러한 약한 프로모터의 맥락에서도 발암성 또는 면역원성 펩타이드의 가능성을 저지하거나 감소시킨다.

[0080] 몇 가지 구현예에 있어서, 변이체 X 유전자를 함유하는 상기 제공되는 변형된 PRE는 대상체로의 도입시 X 단백질 면역원성의 가능성을 감소시킬 수 있다. 예컨대, 발현되는 변이체 X 단백질로부터 면역원성 에피토프의 생성 확률을 낮추기 위하여, 상기 하나 또는 복수개의 종결 코돈은 상기 X 단백질 오픈 리딩 프레임의 개시 코돈에 충분히 가까이에서 시작하여 원치 않는 면역 반응을 유도할 수 있는 에피토프를 함유하는 폴리펩타이드의 발현을 저지할 수 있다. 몇 가지 구현예에 있어서, 이러한 특징들은, 대상체로 도입시, 상기 변형된 PRE 내 상기 변이체 X 유전자가 잠재적으로 면역원성 에피토프를 갖는 임의의 폴리펩타이드의 발현이라는 결과를 낳지 않을 가능성을 보장하거나 증가시킨다. 몇 가지 구현예에 있어서, 변형된 PRE를 함유하는 상기 폴리뉴클레오티드는, 상기 변이체 X 유전자의 개시 코돈 (예컨대, 이러한 개시 코돈의 첫번째 위치) 또는 대응하는 야생형 또는 비변형된 서열의 개시 코돈에 대응하는 코돈의 18 또는 21 또는 24 또는 27 또는 30 또는 33 또는 36개 이상의 뉴클레오티드 내 위치에서 시작하는, 하나 이상의 종결 코돈, 예컨대, 상기 변형된 PRE의 변이체 X 유전자에 존재하는 첫번째 종결 코돈 또는 복수개의 도입된 종결 코돈들 각각을 함유한다. 이러한 구현예의 몇 가지 예시에 있어서, 이러한 특징들은, 예컨대 야생형 또는 비변형된 개시 코돈 또는 프로모터 또는 그로의 회귀 또는 다른 돌연변이가 기능적 개시 코돈 및/또는 프로모터를 결과하는 경우에 있어서도, 상기 PRE에 의하여 코딩되는 6 또는 7 또는 8 또는 9 또는 10 또는 11 또는 12개 아미노산 길이보다 긴 어떠한 폴리펩타이드도 생산되지 않음을 보장한다. 몇 가지 구현예에 있어서, 변형된 PRE를 함유하는 상기 폴리뉴클레오티드는, 상기 변이체 X 유전자의 개시 코돈 (예컨대, 이러한 개시 코돈의 첫번째 위치) 또는 대응하는 야생형 또는 비변형된 서열의 개시 코돈에 대응하는 코돈의 9, 12 또는 15개 이상의 뉴클레오티드 내 위치에서 시작하는, 종결 코돈, 예컨대, 상기 변형된 PRE의 변이체 X 유전자에 존재하는 첫번째 종결 코돈 또는 복수개의 도입된 종결 코돈들 각각을 함유한다.

[0081] 상기 제공되는 폴리뉴클레오티드는, 충분한 정도의 전사-후 활성을 유지하면서, 예컨대 발현-증가 기능을 유지하면서, 안전성 이점, 예컨대 발암성 및/또는 면역원성의 감소를 촉진하도록 설계된 변형된 PRE를 갖는 것들을 포함한다. 따라서, 상기 제공되는 폴리뉴클레오티드의 상기 변형된 PRE는 또한 일반적으로, 대응하는 상기 비변형된 또는 야생형 PRE의 전사-후 활성, 예컨대 발현-증가 기능을 충분한 양으로 보유하도록 설계된다. 전술된대로, 상기 X-단잭질을 코딩하는 헤파티티스 바이러스, 예컨대 WHV의 영역은 일반적으로 그 발현-증가 기능에 중요한 이러한 바이러스의 PRE의 구조적 특징들과 중복된다. 몇 가지 구현예에 있어서, 상기 변형된 PRE 내의 변형의, 예컨대 전술한 바와 같이 종결 코돈(들) 및/또는 번역-후 신호-코딩 서열(들)을 도입하는 것들과 같은 변형의 위치 및/또는 성질은, 상기 PRE에 의하여 코딩되는 특정한 2차 또는 3차 구조에 변화를 최소화하도록 설계된다. 몇 가지 구현예에 있어서, 이러한 변형들은 PRE 하위요소의 스템-루프 구조, 예컨대 PRE의 알파 및/또는 베타 하위요소의 스템-루프 구조를 코딩하는 것들 외의 PRE 영역에 도입된다. 몇 가지 구현예에 있어서, 어떠한 종결 코돈도 도입되지 않거나, 변형은 알파 스템-루프 구조를 코딩하는 최소한의 알파 하위요소 내 또는 베타 스템-루프 구조를 코딩하는 베타 하위요소의 일부분 내에 만들어진다. 몇 가지 구현예에 있어서, 변형이 스템-루프 구조 내에 도입되면, 상기 변형은 대응하는 야생형 또는 비변형된 뉴클레오베이스와 다르지만 상기 PRE의 2차 또는 3차 구조(들)을 유지하는 뉴클레오베이스를 선택함으로써 이루어진다. 예컨대, 몇 가지 구현예에 있어서, 스템-루프 형성 구조 내 특정 위치에 변형, 예컨대 종결 코돈을 도입하는 변형이 이루어지는 경우, 야생형 또는 비변형된 서열의 그것, 예컨대 스템-루프 구조와 동일하거나 유사한 2차 또는 3차 구조의 형성을 허하는 다른 위치에 상보적인 변형이 만들어진다.

[0082] 또한, 상기 제공되는 폴리뉴클레오티드 중 변이체 Flap 서열 ("변이체 Flap" 폴리뉴클레오티드)를 함유하는 폴리뉴클레오티드가 있다. 상기 변이체 Flap 폴리뉴클레오티드는 하나 이상의 Flap 서열 또는 그 일부분이 결실된 하나 이상의 바이러스 핵산을 함유하는 것들과 같은 폴리뉴클레오티드를 포함한다. 이러한 변이체 Flap 폴리뉴클레오티드는 재조합 분자, 예컨대 재조합, 예컨대 이종 단백질의 바현을 위하여, 발현 카세트 및 벡터, 예컨대 바이러스 벡터를 포함한다. 몇 가지 구현예에 있어서, 상기 변형된 PRE를 포함하는 상기 폴리뉴클레오티드는 또한 Flap 서열의 변형을 포함하고 및/또는 변이체 Flap 폴리뉴클레오티드이다. 일반적으로, 상기 Flap의 변형(들)은 예컨대 숙주 세포 내에서 상기 재조합 분자의 발현 또는 바이러스성 전달을 실질적으로 방해하지 않고 및/또는 여전히 이를 허하는 것들이다.

[0083] 또한, 일반적으로, 이종 단백질과 같은 재조합 단백질을 코딩하는 서열과 작동적으로 연결되는 프로모터를 더 포함하는 폴리뉴클레오티드를 함유하는 발현 카세트, 및 이러한 폴리뉴클레오티드 및 발현 카세트, 예컨대 렌티바이러스 및 감마-레트로바이러스 벡터와 같은 레트로바이러스 벡터를 포함하는 벡터가 제공된다. 또한, 이러한 폴리뉴클레오티드, 카세트, 및/또는 벡터를 함유하는 바이러스 및 세포, 예컨대 패키징 세포 및 숙주 세포, 예컨대 T 세포 및 이들을 함유하는 조성물이 제공된다. 또한, 이러한 구현예들의 용도와 방법, 예컨대 치료 방법과 용도, 예컨대 상기 바이러스, 벡터 및/또는 세포를 질병 또는 질환을 치료 또는 예방하기에 유효한 양으로 대상체에게 투여하는 것을 포함하는 것들이 제공된다.

A. 변형된 PRE

[0084] 상기 제공되는 폴리뉴클레오티드의 변형된 PRE는 변이체 X 유전자를 함유한다. 상기 변이체 X 유전자는 비변형된, 통상의 야생형, 헤파티티스 X 유전자의 변이체이다. 상기 변이체 X 유전자는 상기 야생형 또는 다른 비변형된 X 유전자와 비교하여 하나 및 통상 하나 이상의 변형을 포함한다. 특히, 상기 변이체 X 유전자는 일반적으로 상기 X 유전자 내 서열에 의하여 코딩되는 원치 않는 단백질 또는 펩타이드 및/또는 PRE가, 예컨대 대상체로의 도입시 발현 및/또는 유지될 가능성을 저지하거나 감소시키도록 설계된 하나 이상의 변형을 포함한다. 상기 변형은 상기 비변형된, 예컨대 야생형 서열과 비교하여 결실(들), 치환들, 및/또는 삽입을 포함할 수 있다.

[0085] 몇 가지 구현예에 있어서, 상기 변형은 대응하는 야생형 또는 달리는 비변형된 X 유전자에는 존재치 않는, 예컨대 부분적 X 유전자를 함유하는 대응하는 야생형 또는 달리는 비변형된 PRE에는 존재치 않는 변형된 PRE의 변이체 X 유전자 내 종결 코돈의 존재를 결과하는 돌연변이를 포함한다. 몇 가지 구현예에 있어서, 이러한 변형은 야생형 또는 비변형된 PRE 내 야생형 X 유전자 또는 X 유전자 단편과 비교하여 X 단백질 코딩 오픈 리딩 프레임을 단축시킨다. 몇 가지 구현예에 있어서, 상기 변형은 그 변이체 X 유전자가 9, 12, 15, 18, 또는 21개 뉴클레오티드 길이보다 긴 X 단백질 오플 리딩 프레임을 함유하는 변형된 PRE라는 결과를 낳는다. 몇 가지 구현예에 있어서, 상기 변형된 PRE의 변이체 X 유전자의 변형은 그에 함유되는 3, 4, 5, 6, 또는 7개 아미노산 길이보다 긴, 또는 대상체에게 면역원성이거나 발암 가능성 또는 활성을 가질 수 있는 X 단백질 리딩 프레임으로부터의 임의의 단백질 발현을 저지한다. 몇 가지 구현예에 있어서, 상기 변이체 X 유전자가 또한 돌연변이된 또는 변형된 개시 부위 또는 프로모터를 함유한다면, 상기 종결 코돈 변형은 기능적 프로모터 또는 개시 부위로의 회귀를 결과하는 돌연변이의 경우라 하더라도 이러한 발현을 저지한다.

[0086] 몇 가지 구현예에 있어서, 상기 변형된 PRE의 변이체 X 유전자 내 변형은, X 단백질 코딩 리딩 프레임 내이거나 아니거나, 임의의 원치 않는 폴리펩타이드의 발현을 저지한다. 예컨대, 몇 가지 구현예에 있어서, 상기 변형된 PRE의 변이체 X 유전자 내 변형은 특정 길이보다 긴, 예컨대 3, 4, 5, 6, 또는 7개 아미노산 길이보다 긴 및/또는 대상체에서 발현시 면역원성일 그에 함유되는 임의의 펩타이드(들) 또는 X 유전자로부터의 펩타이드(들)의 발현을 저지한다.

[0087] 몇 가지 구현예에 있어서, 상기 변형은 분해를 위하여 상기 변형된 PRE의 변이체 X 유전자 또는 그 일부분에 의하여 코딩되는 발현되는 단백질(들)을 표적하는 번역-후 분해 아미노산 서열을 결과하거나 도입하는 코딩 서열을 도입하는 것들을 포함한다. 예시적인 분해 서열은 유비퀴틴화 신호를 포함한다. 따라서, 상기 변형된 ORE의 변이체 X 유전자 내 변형은 비변형된 또는 야생형 X 유전자에 의하여 코딩되는 대응하는 단백질에는 존재치 않는, 예컨대 부분적 X 유전자를 함유하는 대응하는 야생형 또는 비변형된 PRE에는 존재치 않는 유비퀴틴화 서열과 같은 번역-후 분해 서열을 결과하는 것들을 더 포함할 수 있다.

[0088] 상기 변형된 PRE의 변이체 X 유전자는 일반적으로, 대응하는 야생형 헤파티티스 바이러스에 존재하는 대응하는 야생형 전장 길이 X 유전자보다 더 적은 뉴클레오베이스 길이를 포함하는 X 유전자의 일부분을 함유한다. 몇 가지 구현예에 있어서, 상기 X 유전자의 일부분은 상기 PRE의 전사-후 조절 기능(들)과 중첩되지 않고 및/또는 그에 중요하거나 필수적이지 않은 X 유전자 뉴클레오티드를 결여하고 있다. 몇 가지 구현예에 있어서, 상기 X 유전자의 일부분은 상기 PRE의 알파, 베타 및/또는 감마 하위요소(들) 및/또는 그 기능적 영역 내 잔기들이 아닌 야생형 헤파티티스 바이러스의 X 유전자 잔기들을 결여하고 있다. 따라서, 본 발명의 상기 변형된 PRE는 일반적으로 전장 길이 X 유전자 또는 그 전장 길이 변이체를 포함하지 않는다. 이러한 구현예들 중 몇 가지에 있어서, 상기 변형된 PRE 내 변이체 X 유전자는 일반적으로 425, 400, 300, 200, 또는 180개 뉴클레오베이스 길이 또는 약 425, 400, 300, 200, 또는 180개 뉴클레오베이스 길이보다 적게 포함한다.

[0089] 상기 변형된 PRE는 일반적으로 하나 이상의 알파, 베타 및/또는 감마 하위요소를 함유하는데, 이들은, 어떤 경우에는, 야생형 또는 비변형된 PRE 또는 그 기능적 일부분의 이러한 하위요소의 변이체, 예컨대 전사-후 활성 및/또는 스템-루프 또는 기타 2차 또는 3차 구조의 형성에 충분한 것일 수 있다. 몇 가지 경우에 있어서, 이러한 부분(들) 중 적어도 일부는 일반적으로 상기 변형된 PRE의 상기 변이체 X 유전자 일부분과 중첩된다. 따라서, 어떤 경우에, 상기 변이체 X 유전자의 일부분은 상기 알파 하위요소의 일부분 내에 함유될 수 있고 및/또는 상기 X 유전자의 일부분은 상기 베타 하위요소 내에 함유되거나 그와 중첩될 수 있다. 몇 가지 구현예에 있어서, 야생형 또는 비변형된 X 유전자 또는 PRE에 비하여 상기 제공되는 변형된 PRE의 변이체 X 유전자 내 변형은 상기 변형된 PRE의 상기 알파 및/또는 베타 및/또는 감마 하위요소(들)에 의하여 매개되는 작동적으로 연결되는 핵산 (예컨대, 재조합 분자 또는 전이 유전자)의 발현을 조절하는 전사-후 활성을 제거, 감소 및/또는 방해하지 않고, 및/또는 상기 변형(들)을 갖지 않는 대응하는 야생형 또는 비변형된 PRE의 하위요소(들)에 의하여 매개되는 전사-후 활성과 비교하여 또는 충분한 활성을 보유하는 것으로 알려진 다른 변형된 PRE, 예컨대 SEQ ID NO: 119, 120 또는 216의 서열을 갖는 것과 비교하여 실질적으로 그러하지 않다.

[0090] 한가지 구현예에 있어서, 종결 코돈 및/또는 번역 후 분해 서열을 도입하는 상기 뉴클레오티드 변화는, RNA 수준에서, 대응하는 야생형 또는 비변형된 PRE 및/또는 그러한 변형을 함유하지 않는 PRE와 비교하여, 그들이 상기 PRE 내 시스-요소 서열의 2차 및/또는 3차 구조를 변화시키지 않는 및/또는 그들이 상기 PRE 내 시스-요소 서열의 2차 및/또는 3차 구조의 실질적인 수준을 보유하는 그러한 것들이다. 또 다른 구현예에 있어서, 종결 코돈 및/또는 번역 후 분해 서열을 도입하는 상기 뉴클레오티드 변화는, RNA 수준에서, 대응하는 야생형 PRE 및/또는 그러한 변형을 함유하지 않는 PRE와 비교할 때, 및/또는 바이러스 벡터 형질도입에 사용하기에 충분한 정도의 활성을 갖는 것으로 이 기술 분야에 알려진 또는 그에 사용하기에 용인된 및/또는 유전자 요법의 맥락에서 그러한 용도로 용인된 또 다른 변형된 PRE와 비교할 때 상기 뉴클레오티드 변화가 상기 PRE의 활성, 예컨대 핵으로부터 RNA 수송을 촉진하는 그들의 능력, 예컨대 CRM1-의존성 및/또는 비의존성 수송 장치와의 상호작용을 통한 그 능력, 세포 단백질에 대한 결합 위치를 제공하는, RNA, 예컨대 전이 유전자 RNA, 전사물의 총량을 증가시키는, RNA 안정성을 증가시키는, 폴리-아데닐화 전사물의 수를 증가 및/또는 그러한 전사물에서 폴리-아데닐화 꼬리의 크기를 증가시키는 능력을 변화시키지 않는 그러한 것들이다. 몇 가지 구현예에 있어서, 상기 또 다른 비변형된 PRE는 SEQ ID NO: 119, SEQ ID NO:120 또는 SEQ ID NO:216에 기재되는 서열을 갖는다.

[0091] 몇 가지 구현예에 있어서, 상기 변형된 PRE 내 베타 하위요소는 하나 이상의 상기 변이체 X 유전자의 일부분을 포함한다. 이러한 몇 가지 구현예에 있어서, 상기 베타 하위요소는 야생형 또는 비변형된 PRE의 베타 하위요소의 기능적 변이체 또는 그 일부분으로써, 상기 베타 하위요소의 상기 기능적 변이체 또는 일부를 함유하는 상기 변형된 PRE가 전사-후 활성을 나타내는 것이다. 몇 가지 구현예에 있어서, 상기 베타 하위요소의 기능적 변이체는 SEQ ID NO:6에 기재되는 베타 하위요소의 변이체 또는 그 기능적 일부분이다. 몇 가지 구현예에 있어서, 베타 하위요소의 기능적 변이체 또는 일부분은 베타 스템-루프를 형성하기에 충분한 뉴클레오티드 잔기를 함유한다. 예컨대, 몇 가지 구현예에 있어서, 베타 하위요소의 기능적 변이체 또는 일부분은 SEQ ID NO:1 또는 SEQ ID NO:125의 뉴클레오티드 잔기 448-470에 대응하는 뉴클레오티드 잔기를 함유하는데, 예컨대 SEQ ID NO:7에 기재된 뉴클레오티드의 서열이다. 본 발명에서 제공되는 변형된 PRE의 관점에서, 상기 변이체 X 유전자는 SEQ ID NO:1 또는 SEQ ID NO:125의 뉴클레오티드 448-470에 대응하는 임의의 뉴클레오티드 내 및/또는 SEQ ID NO:7에 기재된 뉴클레오티드에 대응하는 뉴클레오티드 영역에서 뉴클레오티드 변화를 함유하지 않는다. 몇 가지 구현예에 있어서, 예컨대 종결 코돈을 도입하는 변형이 SEQ ID NO:1 또는 SEQ ID NO:125의 하나 이상의 뉴클레오티드 448-470에 대응하는 뉴클레오티드 베이스 및/또는 SEQ ID NO:7에 기재되는 뉴클레오티드에 대응하는 하나 이상의 뉴클레오티드에 대응하는 뉴클레오티드 베이스에 있다면, 상기 야생형 또는 비변형된 서열의 베타-스템 루프와 동일하거나 유사한 2차 또는 3차 구조의 형성을 허하는 또 다른 위치에 상보적인 변형이 이루어질 수 있다.

[0092] 알파 하위요소를 함유하는 변형된 PRE의 몇 가지 구현예에 있어서, 상기 변형된 알파 하위요소는 비변형된 헤파티티스 PRE, 예컨대 야생형 헤파티티스 PRE로부터 올 수 있고, 또는 그 기능적 변이체일 수 있는데 상기 알파 하위요소의 기능적 변이체를 함유하는 상기 변형된 PRE는 전사-후 활성을 나타내는 것들이다. 몇 가지 구현예에 있어서, 상기 알파 하위요소는 SEQ ID NO:3에 기재되거나 또는 SEQ ID NO:4에 기재되거나, 또는 SEQ ID NO:3 또는 SEQ ID NO:4의 기능적 변이체 또는 일부분이다. 몇 가지 구현예에 있어서, 알파 하위요소의 기능적 변이체 또는 일부분은 알파 스템-루프를 형성하기에 충분한 뉴클레오티드 잔기를 함유한다. 예컨대, 몇 가지 구현예에 있어서, 알파 하위요소의 기능적 변이체는 SEQ ID NO:1 또는 SEQ ID NO:125의 뉴클레오티드 잔기 329-366에 대응하는 뉴클레오티드 잔기, 예컨대 SEQ ID NO:5에 기재되는 뉴클레오티드 서열을 함유한다. 본 발명에서 제공되는 변형된 PRE의 측면에서, 상기 변형된 PRE는 SEQ ID NO:1 또는 SEQ ID NO:125의 뉴클레오티드 잔기 329-366에 대응하는 임의의 뉴클레오티드 내, 및/또는 SEQ ID NO:5에 기재되는 뉴클레오티드에 대응하는 뉴클레오티드의 영역에서 뉴클레오티드 변화를 함유하지 않는다. 몇 가지 구현예에 있어서, 상기 변형이 SEQ ID NO:1 또는 SEQ ID NO:125의 하나 이상의 뉴클레오티드 329-366에 대응하는 뉴클레오티드 베이스, 및/또는 SEQ ID NO:5에 기재되는 뉴클레오티드에 대응하는 하나 이상의 뉴클레오티드에 대응하는 뉴클레오티드 베이스에 있다면, 상기 야생형 또는 비변형된 서열의 알파-스템 루프와 동일하거나 유사한 2차 또는 3차 구조의 형성을 허하는 또 다른 위치에 상보적인 변형이 이루어질 수 있다.

[0093] 한 가지 구현예에 있어서, 상기 변형된 PRE는 적어도, 알파 및 베타 하위요소, 예컨대 알파 및 베타 하위요소의 기능적 변이체, 그 일부분이 일반적으로 상기 변이체 X 유전자와 중첩되는 적어도 일부분을 함유한다. 몇 가지 구현예에 있어서, 상기 변형된 PRE는 감마 하위요소 또는 그 기능ㅈ억 변이체를 함유한다. 감마 하위요소를 함유하는 변형된 PRE의 구현예에 있어서, 상기 변형된 감마 하위요소는 비변형된 헤파티티스 PRE, 예컨대 야생형 헤파티티스 PRE로부터 올 수 있고, 또는 그 기능적 변이체일 수 있는데, 상기 감마 하위요소의 기능적 변이체를 함유하는 상기 변형된 PRE가 전사-후 활성을 보유하는 것이다. 몇 가지 구현예에 있어서, 상기 감마 하위요소는 SEQ ID NO:8에 기재되거나, 또는 SEQ ID NO:8의 기능적 변이체 또는 일부분이다.

[0094] 변형된 PRE의 뉴클레오티드 변형, 예컨대 상기 변이체 X 유전자 내의 것들은 뉴클레오티드 결실, 삽입, 및/또는 치환을 포함할 수 있다. 상기 변이체 X 유전자는 비변형된 PRE, 예컨대 야생형 PRE와 비교하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45 또는 50개 이상의 뉴클레오티드 변화를 함유할 수 있다. 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는 4, 5, 6, 7, 8, 9, 10, 11 또는 12개 이하의 뉴클레오티드 변화를 포함한다. 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는, 그 변이체 X 유전자가 그에 존재치 않는 하나 이상의 종결 코돈 및/또는 그에 존재치 않는 번역-후 변형 신호 또는 분해 서열을 코딩하는 서열을 함유하는, SEQ ID NO: 10에 기재되는 X 유전자와, 또는 SEQ ID NOS:1, 12-20, 119 또는 120 중 하나의 뉴클레오티드 391-592의 서열과, 또는 SEQ ID NO:125 또는 216의 뉴클레오티드 391-589의 서열과 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 상동성을 나타내는 뉴클레오티드의 서열을 갖는다. 예컨대, 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는, 그 변이체 X 유전자가 그에 존재치 않는 하나 이상의 종결 코돈 및/또는 그에 존재치 않는 번역-후 변형 신호 또는 분해 서열을 코딩하는 서열을 함유하는, SEQ ID NO: 10에 기재되는 X 유전자와, 또는 SEQ ID NOS:1의 뉴클레오티드 391-592의 서열과, 또는 SEQ ID NO:125의 뉴클레오티드 391-589의 서열과 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 상동성을 나타내는 뉴클레오티드의 서열을 갖는다. 몇 가지 구현예에 있어서, 상기 변형된 PRE는, 그 변형된 PRE가 그에 존재치 않는 하나 이상의 종결 코돈 및/또는 그에 존재치 않는 번역-후 변형 신호 또는 분해 서열을 코딩하는 서열을 함유하는, SEQ ID NOS:1, 12-20, 119, 120, 125 또는 216 중 하나에 기재된 PRE와 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 상동성을 나타내는 뉴클레오티드의 서열을 갖는다. 예컨대, 몇 가지 구현예에 있어서, 상기 변형된 PRE는, 그 변형된 PRE가 그에 존재치 않는 하나 이상의 종결 코돈 및/또는 그에 존재치 않는 번역-후 변형 신호 또는 분해 서열을 코딩하는 서열을 함유하는, SEQ ID NO:1 또는 SEQ ID NO:125에 기재되는 PRE와 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 상동성을 나타내는 뉴클레오티드의 서열을 갖는다.

[0095] 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는 부분적 X 유전자, 헤파티티스 바이러스, 예컨대 야생형 헤파티티스 바이러스, 예컨대 포유류 헤파티티스 바이러스의 X 유전자의 전장 길이 서열보다 적은 서열을 갖는 예컨대 야생형 X 유전자의 일부분이다. 예컨대, 몇 가지 구현예에 있어서, 상기 변형된 PRE는 250개 또는 약 250개 뉴클레오티드 길이 미만 또는 이하인 변이체 X, 또는 240개 또는 약 240개 뉴클레오티드 길이, 또는 230개 또는 약 230개 뉴클레오티드 길이, 또는 220개 또는 약 220개 뉴클레오티드 길이, 또는 210개 또는 약 210개 뉴클레오티드 길이, 또는 200개 또는 약 200개 뉴클레오티드 길이, 또는 190개 또는 약 190개 뉴클레오티드 길이, 또는 180개 또는 약 180개 뉴클레오티드 길이, 또는 170개 또는 약 170개 뉴클레오티드 길이, 또는 160개 또는 약 160개 뉴클레오티드 길이, 또는 150개 또는 약 150개 뉴클레오티드 길이, 또는 140개 또는 약 140개 뉴클레오티드 길이, 또는 130개 또는 약 130개 뉴클레오티드 길이, 또는 120개 또는 약 120개 뉴클레오티드 길이, 또는 110개 또는 약 110개 뉴클레오티드 길이, 또는 100개 또는 약 100개 뉴클레오티드 길이, 또는 90개 또는 약 90개 뉴클레오티드 길이, 또는 80개 또는 약 80개 뉴클레오티드 길이, 또는 70개 또는 약 70개 뉴클레오티드 길이 미만 또는 이하인 변이체 X를 함유한다. 몇 가지 구현예에 있어서, 상기 변형된 PRE는 60개 뉴클레오티드 길이 이상이지만 헤파티티스 바이러스, 예컨대 야생형 헤파티티스 바이러스, 예컨대 포유류 헤파티티스 바이러스의 X 유전자의 전장 길이 서열 미만인 변이체 X 유전자를 함유한다. 예컨대, 몇 가지 구현예에 있어서, 상기 변형된 PRE는 60개 뉴클레오티드 길이 이상이지만 250개 또는 약 250개 뉴클레오티드 길이 미만이거나 이하인 변이체 X 유전자, 예컨대 240개 또는 약 240개 뉴클레오티드 길이 미만이거나 이하인, 230개 또는 약 230개 뉴클레오티드 길이 미만이거나 이하인, 220개 또는 약 220개 뉴클레오티드 길이 미만이거나 이하인, 210개 또는 약 210개 뉴클레오티드 길이 미만이거나 이하인, 200개 또는 약 200개 뉴클레오티드 길이 미만이거나 이하인, 190개 또는 약 190개 뉴클레오티드 길이 미만이거나 이하인, 180개 또는 약 180개 뉴클레오티드 길이 미만이거나 이하인, 170개 또는 약 170개 뉴클레오티드 길이 미만이거나 이하인, 160개 또는 약 160개 뉴클레오티드 길이 미만이거나 이하인, 150개 또는 약 150개 뉴클레오티드 길이 미만이거나 이하인, 140개 또는 약 140개 뉴클레오티드 길이 미만이거나 이하인, 130개 또는 약 130개 뉴클레오티드 길이 미만이거나 이하인, 120개 또는 약 120개 뉴클레오티드 길이 미만이거나 이하인, 110개 또는 약 110개 뉴클레오티드 길이 미만이거나 이하인, 100개 또는 약 100개 뉴클레오티드 길이 미만이거나 이하인, 90개 또는 약 90개 뉴클레오티드 길이 미만이거나 이하인, 80개 또는 약 80개 뉴클레오티드 길이 미만이거나 이하인, 70개 또는 약 70개 뉴클레오티드 길이 미만이거나 이하인 변이체 X 유전자를 함유한다. 몇 가지 구현예에 있어서, 상기 변형된 PRE는 180개 또는 약 180개 뉴클레오티드 길이 이상인 변이체 X 유전자를 함유한다.

[0096] 몇 가지 구현예에 있어서, 상기 변이체 X 유전자를 함유하는 상기 변형된 PRE는 X 유전자 또는 그 일부분을 함유하는, 비변형된 PRE, 예컨대 야생형 헤파티티스 PRE의 변이체이다. 예컨대, 상기 변이체 X 유전자는 상기 헤파티티스 바이러스, 예컨대 야생형 헤파티티스 바이러스, 예컨대 포유류 헤파티티스 바이러스의 대응하는 X 유전자의 전장 길이 서열보다 적은 X 유전자를 갖는 야생형 헤파티티스 PRE의 변이체일 수 있다. 상기 비변형된 또는 야생형 X 유전자는 250개 또는 약 250개 뉴클레오티드 길이 미만 또는 그 이하인, 예컨대 240개 또는 약 240개 뉴클레오티드 길이 미만 또는 그 이하인, 예컨대 230개 또는 약 230개, 예컨대 220개 또는 약 220개, 예컨대 210개 또는 약 210개, 예컨대 200개 또는 약 200개, 예컨대 190개 또는 약 190개, 예컨대 180개 또는 약 180개, 예컨대 170개 또는 약 170개, 예컨대 160개 또는 약 160개, 예컨대 150개 또는 약 150개, 예컨대 140개 또는 약 140개, 예컨대 130개 또는 약 130개, 예컨대 120개 또는 약 120개, 예컨대 110개 또는 약 110개, 예컨대 100개 또는 약 100개, 예컨대 90개 또는 약 90개, 예컨대 80개 또는 약 80개, 예컨대 70개 또는 약 70개 뉴클레오티드 길이 미만 또는 그 이하인 X 유전자를 함유할 수 있다.

[0097] 몇 가지 구현예에 잇어서, 상기 비변형된 PRE, 예컨대 야생형 헤파티티스 PRE는 기능적 X 단백질, 예컨대 절단된 X 단백질을 코딩하는 오픈 리딩 프레임을 갖는 X 유전자를 함유하는 것이다. 이러한 구현예에 있어서, 상기 변이체 X 유전자는 X 단백질의 번역을 개시하기 위한 개시 코돈을 함유한다. 몇 가지 구현예에 있어서, 상기 개시 코돈은 ATG 개시 코돈이다. 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는 SEQ ID NO:1 또는 SEQ ID NO:125의 위치 411에 대응하는 위치에서 시작하는 개시 코돈에 대응하는 개시 코돈을 함유한다. 몇 가지 구현예에 있어서, 상기 비변형된 PRE, 예컨대 야생형 PRE는 30개 아미노산 길이 이상인 X 단백질, 예컨대 40개 아미노산 길이 이상인, 50개 아미노산 길이 이상인, 60개 아미노산 길이 이상인, 70개 아미노산 길이 이상인, 또는 80개 아미노산 길이 이상인 X ek단잭질을 코딩하는 오픈 리딩 프레임을 함유할 수 있다.

[0098] 상기 변형된 PRE는 일반적으로 변형, 예컨대 비변형된 헤파티티스 X 유전자에는 존재치 않는, 예컨대 야생형 헤파티티스 X 유전자 또는 대응하는 그들의 절단된 버전에는 존재치 않는 (예컨대, PRE에는 존재), 하나 이상의 종결 코돈 및/또는 번역 후 분해 서열을 도입하는 하나 이상의 뉴클레오티드 변형을 함유하는 변이체 X 유전자를 함유한다. 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는 야생형 포유류 헤파티티스 X 유전자 또는 대응하는 그들의 절단된 버전에는 존재치 않는 (예컨대, PRE에는 존재) 변형을 함유한다. 몇 가지 구현예에 있어서, 상기 비변형된 또는 야생형 헤파티티스 X 유전자 또는 그 절단된 버전은 SEQ ID NO:9 또는 SEQ ID NO:10와, 또는 SEQ ID NO:1의 뉴클레오티드 411-592와, 또는 SEQ ID NO:125의 뉴클레오티드 411-589와 65%, 70%, 75%, 80%, 85%, 90%, 95% 이상, 또는 약 65%, 70%, 75%, 80%, 85%, 90%, 95% 이상, 또는 그 이상의 서열 상동성을 나타내는 X 유전자이다. 몇 가지 구현예에 있어서, 상기 야생형 또는 비변형된 포유류 헤파티티스 X 유전자 또는 대응하는 그 절단된 버전은 SEQ ID NOS: 1 또는 12-20 중 하나의 뉴클레오티드 411-592, SEQ ID NO:125의 뉴클레오티드 411-589, SEQ ID NO:21-23 중 하나의 뉴클레오티드 412-722, SEQ ID NO:25의 뉴클레오티드 411-721, SEQ ID NO:26의 뉴클레오티드 401-582 또는 SEQ ID NO:27의 뉴클레오티드 411-592에 대응하는 뉴클레오티드 서열을 갖는다. 몇 가지 구현예에 있어서, 상기 비변형된 또는 야생형 헤파티티스 X 유전자는 SEQ ID NO:9와, 또는 SEQ ID NO:1의 뉴클레오티드 411-592와, 또는 SEQ ID NO:125의 뉴클레오티드 411-589와 94%, 95%, 96%, 97%, 98% 또는 99% 이상 또는 약 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 상동성을 나타내는 WHV X 유전자 또는 대응하는 그 절단된 버전이다. 몇 가지 구현예에 있어서, 상기 비변형된 또는 야생형 WHV X 유전자 또는 대응하는 그 절단된 버전은 SEQ ID NOS: 1, 12-20, 119 또는 120 중 하나의 뉴클레오티드 411-592, 또는 SEQ ID NO:125 또는 216의 뉴클레오티드 411-589에 대응하는 뉴클레오티드 서열을 갖는다. 몇 가지 구현예에 있어서, 상기 헤파티티스 X 유전자는 SEQ ID NO:9에 기재된 WHV X 유전자 또는 SEQ ID NO:10에 기재되는 대응하는 그 절단된 버전이다.

[0099] 몇 가지 구현예에 있어서, 상기 변형된 PRE의 변이체 X 유전자는 비변형된 헤파티티스 PRE, 예컨대 야생형 헤파티티스 PRE 내에 함유되는 X 유전자 또는 그 일부분에 비해 차이점(들)을 함유한다. 몇 가지 구현예에 있어서, 이러한 야생형 헤파티티스 PRE는 포유류 헤파티티스 PRE이다. 몇 가지 구현예에 있어서, 상기 야생형 또는 비변형된 포유류 PRE는 SEQ ID NO:1 또는 SEQ ID NO:125와 65%, 70%, 75%, 80%, 85%, 90%, 95% 이상, 또는 약 65%, 70%, 75%, 80%, 85%, 90%, 95% 이상, 또는 그 이상의 서열 상동성을 갖는 뉴클레오티드 서열을 갖는다. 몇 가지 구현예에 있어서, 상기 야생형 또는 비변형된 포유류 헤파티티스 PRE는 SEQ ID NOS: 1 또는 12-27 중 하나에 기재된 뉴클레오티드 서열을 갖는다. 몇 가지 구현예에 있어서, 상기 비변형된 또는 야생형 헤파티티스 PRE는 SEQ ID NO:1 또는 SEQ ID NO:125와 94%, 95%, 96%, 97%, 98% 또는 99% 이상, 또는 약 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 상동성을 나타내는 WPRE이다. 예컨대, 몇 가지 구현예에 있어서, 상기 비변형된 또는 야생형 WPRE는 SEQ ID NOS: 1, 12-20, 119, 120, 125 또는 216 중 하나에 기재된 뉴클레오티드 서열을 갖는다.

[0100] 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는 프로모터에 작동적으로 커플링된다. 몇 가지 구현예에 있어서, 상기 프로모터는 비변형된 또는 야생형 X 유전자 프로모터이다. 예컨대, 상기 프로모터는 SEQ ID NO: 11에 기재된 뉴클레오티드 서열 또는 그 기능적 변이체 또는 일부를 가질 수 있다. 상기 프로모터는 SEQ ID NO:11의 뉴클레오티드 7-20의 서열을 가질 수 있다. 몇 가지 구현예에 있어서, 상기 프로모터는 예컨대 하기 하위 섹션 I.A.3에 기재된 돌연변이 또는 비변형된 X 유전자 프로모터이다.

[0101] 몇 가지 구현예에 있어서, 상기 변형된 PRE는, 예컨대 상기 PRE와 작동적으로 연결되어 있지 않은 및/또는 임의의 시스-조절 서열과 연결되어 있지 않은 핵산의 발현과 비교하여, 그에 작동적으로 연결된, 재조합 단백질, 예컨대 이종 단백질을 코딩하는 핵산의 발현을 매개, 예컨대 증가시키는 전사-후 활성을 나타낸다. 몇 가지 구현예에 있어서, 상기 변형된 PRE는 핵으로부터 RNA 수송을 촉진하는, 세포 단백질에 결합 위치를 제공하는, RNA 전사체의 총량을 증가시키는, RNA 안정성을 증가시키는, 폴리-아데닐화 전사체의 수를 증가시키는 및/또는 그러한 전사체에서 상기 폴리-아데닐화된 꼬리를 늘리는활성을 나타낸다. 몇 가지 구현예에 있어서, 상기 변형된 PRE는 대응하는 비변형된 헤파티티스 PRE, 예컨대 야생형 헤파티티스 PRE의, 및/또는 바이러스 벡터 형질도입에 사용하기에 충분한 정도의 활성을 가지는 것으로 이 기술 분야에 알려진 다른 변형된 PRE의, 예컨대 SEQ ID NO: 119, SEQ ID NO:120 또는 SEQ ID NO:216에 기재된 서열을 갖는 PRE의 활성 또는 실질적 및/또는 충분한 활성 정도를 보유한다. 몇 가지 구현예에 있어서, 상기 변형된 PRE는 SEQ ID NOS: 1, 12-27, 119,120, 125 또는 216 중 하나에 기재된 비변형된 또는 야생형 PRE의 전사-후 활성의 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100%, 110%, 120%, 130%, 140%, 150%, 160%, 170%, 180%, 190%, 200% 이상 또는 약 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100%, 110%, 120%, 130%, 140%, 150%, 160%, 170%, 180%, 190%, 200% 이상 또는 그 이상을 나타낸다. 몇 가지 구현예에 있어서, 상기 변형된 PRE는 SEQ ID NO:1 또는 SEQ ID NO:125에 기재된 WPRE의 활성의 80%, 85%, 90%, 95%, 또는 100% 이상 또는 약 80%, 85%, 90%, 95%, 또는 100% 이상을 나타낸다.

[0102] 이러한 몇 가지 구현예에 있어서, 관련 활성 (예컨대, 상기 변형된 PRE 및/또는 다른 PRE, 예컨대 활성이 비교되는 비변형된 또는 야생형 PRE의 활성)은 상기 변형된 PRE가 작동적으로 연결되는 핵산에 의하여 코딩되는 재조합 단백질 발현의 증가 또는 촉진이다. 몇 가지 구현예에 있어서, 이러한 증가 또는 촉진은 숙주로의 벡터의 형질도입이나 다른 형태의 전이 후에, 상기 벡터 내 상기 변형된 PRE와 작동적으로 연결된 재조합 단백질의 발현 수준을 측정함으로써 평가된다. 상기 증가는 각각의 PRE를 함유하지 않는 벡터와 비교하여 그러한 발현의 상대적 정도를 결정함으로써 측정될 수 있다. 변형된 PRE가 비변형된 PRE에 비하여 그와 동일한 수준이나 정도 또는 실질적이거나 허용되는 정도로 활성을 갖는지의 문제는 상기 각각의 PRE를 함유하는 벡터를 이용하여 평가될 수 있다. 재조합 분자의 발현 수준을 평가하기 위한 다수의 잘 알려진 방법들이 이용될 수 있는데, 예컨대 세포 표면 단백질의 맥락에서, 예컨대 유세포 분석에 의하여, 예컨대 친화력-기반 방법, 예컨대 면역친화력-기반 방법에 의한 검출이 이용될 수 있다. 몇 가지 예시에 있어서, 상기 발현은 형질도입 마커 및/또는 리포터 컨스트럭트의 검출에 의하여 측정된다. 몇 가지 구현예에 있어서, 절단된 표면 단백질을 코딩하는 핵산이 상기 벡터 내에 포함되어 상기 변형된 PRE에 의한 그의 발현 및/또는 증가의 마커로서 사용된다.

1. 종결 코돈

[0103] 상기 변형된 PRE 내, 예컨대 상기 변이체 X 유전자 내 종결 코돈 (예컨대 대응하는 야생형 또는 비변형된 X 유전자 또는 PRE의 대응하는 위치에서는 존재치 않는 것)은 앰버 (TAG), 오커 (TAA), 또는 오팔 (TGA) 종결 코돈일 수 있다. 한 가지 구현예에 있어서, 상기 종결 코돈은 앰버 (TAG) 종결 코돈이다. 한 가지 구현예에 있어서, 상기 종결 코돈은 오팔 (TGA) 종결 코돈이다.

[0104] 상기 종결 코돈은 뉴클레오티드 치환, 결실 또는 삽입에 의하여 도입될 수 있다. 한 가지 구현예에 있어서, 상기 종결 코돈은 뉴클레오티드 치환에 의하여 도입된다. 뉴클레오티드 치환은 뉴클레오티드 잔기의 결실이나 삽입에 의하여 발생할 수 있는 뉴클레오티드 변화, 예컨대 프레임 시프트를 최소화한다. 따라서, 뉴클레오티드 치환은 PRE 활성과 관련된 시스-조절 서열, 예컨대 베타-요소 또는 그 기능적 일부분에의 구조적 변화를 최소화할 수 있다. 몇 가지 구현예에 있어서, 상기 종결 코돈은 오직 하나의 뉴클레오티드 치환에 의하여 형성되는데, 그렇게 상기 종결 코돈 내 2개 위치는 야생형 또는 비변형된 서열에서 대응하는 위치에 존재하는 비변형된 뉴클레오티드를 나타내게 된다. 몇 가지 구현예에 있어서, 상기 종결 코돈은 2개 뉴클레오티드의 치환에 의하여 형성되는데, 그렇게 상기 종결 코돈 내 오직 하나의 위치가 상기 야생형 또는 비변형된 서열 내 대응하는 위치에 존재하는 비변형된 뉴클레오티드를 나타낸다. 몇 가지 구현예에 있어서, 상기 종결 코돈은 3개 뉴클레오티드의 치환에 의하여 형성되는데, 이렇게 상기 종결 코돈 내 모든 위치는 상기 야생형 또는 비변형된 서열의 대응하는 코돈에 비해 달라진다.

[0105] 상기 변이체 X 유전자는 상기 비변형된 또는 야생형 X 유전자에는 존재치 않는 또는 상기 비변형된 또는 야생형 PRE에는 존재치 않는 1, 2, 3, 4, 5, 6개 이상 또는 그 이상의 종결 코돈을 함유할 수 있다. 일반적으로, 하나 이상의 종결 코돈은 X 단백질 리딩 프레임과 인-프레임 (in-frame)이다. 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는 복수개의 종결 코돈, 예컨대 2, 3, 4, 5 또는 6개 이상의 종결 코돈을 함유한다.

[0106] 몇 가지 구현예에 있어서, 상기 복수개의 종결 코돈은 그 중 하나는 X 단백질 리딩 프레임과 인-프레임이고 다른 하나는 다른 리딩 프레임에 존재하는 2개 이상의 종결 코돈을 포함한다. 다른 구현예에 있어서, 상기 복수개의 종결 코돈은 상기 변이체 X 유전자에 존재하는 각각의 리딩 프레임 내 3개 이상의 종결 코돈을 포함한다.

[0107] 몇 가지 구현예에 있어서, 상기 복수개의 종결 코돈은 동일한 리딩 프레임 내 2개 이상의 종결 코돈을 포함한다. 통상, 상기 2개 이상의 종결 코돈은 X 단백질 리딩 프레임과 동일한 리딩 프레임에 있다.

[0108] 몇 가지 구현예에 있어서, 상기 하나 이상의 종결 코돈(들) 각각은 상기 X 단백질 오픈 리딩 프레임의 개시 코돈, 예컨대 대응하는 야생형 또는 비변형된 X 단백질 오픈 리딩 프레임에서 개시코돈에 대응하는 코돈, 예컨대 위치 411에서 시작하는 SEQ ID NO:1 또는 SEQ ID NO:125에 기재되는 X 단백질 오픈 리딩 프레임 내 개시 코돈에 대응하는 것과 같은 코돈의 5' 위치에 대응하는 위치로부터 3' 방향으로 36개 뉴클레오티드 또는 그 이하의 뉴클레오티드 내 위치에서 시작한다. 통상, 상기 X 단백질 오픈 리딩 프레임의 개시 코돈의 5' 위치 뒤에 변이체 X 유전자에 존재하는 첫번째 종결 코돈 및, 어떤 경우에는, 도입된 복수개의 종결 코돈들 각각은 상기 개시 코돈의 5' 위치에 대응하는 위치로부터 3' 방향으로 36개 뉴클레오티드 또는 그 이하의 뉴클레오티드 내에서 시작한다. 예컨대, 몇 가지 구현예에 있어서, 하나 이상의 종결 코돈 각각, 예컨대 상기 X 단백질 오픈 리딩 프레임의 개시 코돈의 5' 위치 뒤에 변이체 X 유전자에 존재하는 첫번째 종결 코돈 또는 하나 이상의 복수개의 종결 코돈들은 상기 X 단백질 오픈 리딩 프레임의 개시 코돈의 5' 위치에 대응하는 위치로부터 3' 방향으로 35, 34, 33, 32, 31, 30, 29, 28, 27, 26, 25, 24, 23, 22, 21, 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10 또는 9개 뉴클레오티드 또는 그 이하의 뉴클레오티드 내에서 시작한다. 몇 가지 구현예에 있어서, 상기 하나 이상의 종결 코돈 각각은 상기 X 단백질 오픈 리딩 프레임의 개시 코돈의 5' 위치에 대응하는 위치로부터 3' 방향으로 9, 12, 15, 18, 또는 21개 이하의 뉴클레오티드 내 위치에서, 예컨대 그러한 위치로부터 21개 뉴클레오티드 이하의 위치에서 시작한다.

[0109] SEQ ID NO:1 또는 SEQ ID NO:125에 기재된 예시적 WPRE를 참고하여, X 단백질 오픈 리딩 프레임의 개시 코돈의 5' 위치에 대응하는 위치는 잔기 411 (SEQ ID NO:2에 기재된 WHV 서열의 1503 잔기에 대응)에 대응한다. 몇 가지 구현예에 있어서, 상기 하나 이상의 종결 코돈, 예컨대 상기 X 단백질 오픈 리딩 프레임의 개시 코돈의 5' 위치 뒤에 변이체 X 유전자에 존재하는 첫번째 종결 코돈 또는 하나 이상의 복수개의 종결 코돈들은 SEQ ID NO:1 또는 SEQ ID NO:125에 기재되는 WPRE의 잔기 411에 대응하는 위치로부터 3' 방향으로 36, 35, 34, 33, 32, 31, 30, 29, 28, 27, 26, 25, 24, 23, 22, 21, 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10 또는 9개 뉴클레오티드 또는 그 이하의 뉴클레오티드 이내의 위치에서 시작하는데, 예컨대 그러한 위치로부터 3' 방향으로 9, 12, 15, 18, 또는 21개 이하, 예컨대 21개 뉴클레오티드 이하의 뉴클레오티드 이내의 위치에서 시작한다. SEQ ID NO:1 또는 SEQ ID NO:125 (잔기 1-589를 함유하는 SEQ ID NO:1 또는 SEQ ID NO:1의 일부분)에 기재되는 예시적 야생형 PRE의 개시 코돈에 대응하는 코돈의 5' 위치를 확인하기 위하여 잔기 411에 대응하는 다른 헤파티티스 PRE, 예컨대 다른 WPRE 내 잔기를 확인하는 것은 이 분야 숙련된 기술자의 수준에 있는 용이한 것이다. 도 2A-2E가 예시적 헤파티티스 PRE 내 대응하는 잔기들의 동정을 예시하고 있다.

[0110] 복수개의 종결 코돈을 갖는 변이체 X 유전자를 함유하는 변형된 PRE의 몇 가지 구현예에 있어서, 상기 조결 코돈은 상기 X 유전자의 각각의 리딩 프레임 내에 순차적으로 존재할 수 있다. 복수개의 종결 코돈을 갖는 변이체 X 유전자를 함유하는 변형된 PRE의 몇 가지 구현예에 있어서, 상기 종결 코돈은 동일한 리딩 프레임에 순차적으로 존재할 수 있다.

[0111] 변형된 PRE의 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는 39개 또는 약 39개 뉴클레오티드 길이보다 큰, 예컨대 36개 또는 약 36개, 33개 또는 약 33개, 30개 또는 약 30개, 27개 또는 약 27개, 24개 또는 약 24개, 21개 또는 약 21개, 18개 또는 약 18개, 15개 또는 약 15개, 12개 또는 약 12개 뉴클레오티드 길이보다 큰 오픈 리딩 프레임을 함유하지 않는다.

[0112] 몇 가지 구현예에 있어서, 상기 하나 이상의 종결 코돈, 예컨대 상기 X 단백질 오픈 리딩 프레임의 개시 코돈의 5' 위치에 대응하는 위치 뒤에 변이체 X 유전자에 존재하는 첫번째 종결 코돈 또는 하나 이상의 복수개의 종결 코돈들은 상기 X 단백질 리딩 프레임과 인-프레임에 있는 위치에서 시작한다. 예컨대, 몇 가지 구현예에 있어서, 상기 하나 이상의 종결 코돈, 예컨대 상기 X 단백질 오픈 리딩 프레임의 개시 코돈의 5' 위치에 대응하는 위치 뒤에 변이체 X 유전자에 존재하는 첫번째 종결 코돈 또는 하나 이상의 복수개의 종결 코돈들은 상기 X 단백질 오픈 리딩 프레임의 개시 코돈의 5' 위치에 대응하는 위치로부터 3' 방향으로 36, 33, 30, 27, 24, 21, 18, 15, 12, 또는 9개 뉴클레오티드 또는 그 이하의 뉴클레오티드 이내의 위치에서 시작하는데, 예컨대 그러한 위치로부터 3' 방향으로 9, 12, 15, 18, 또는 21개 이하, 예컨대 21개 뉴클레오티드 이하의 뉴클레오티드 이내의 위치에서 시작한다. 몇 가지 구현예에 있어서, 상기 하나 이상의 종결 코돈, 예컨대 상기 X 단백질 오픈 리딩 프레임의 개시 코돈의 5' 위치에 대응하는 위치 뒤에 변이체 X 유전자에 존재하는 첫번째 종결 코돈 또는 하나 이상의 복수개의 종결 코돈들은 SEQ ID NO:1 또는 SEQ ID NO:125에 기재되는 WPRE의 잔기 411에 대응하는 위치로부터 3' 방향으로 36, 33, 30, 27, 24, 21, 18, 15, 12, 또는 9 개 뉴클레오티드 또는 그 이하의 뉴클레오티드 이내의 위치에서 시작한다.

[0113] 몇 가지 구현예에 있어서, 상기 변형된 PRE는 상기 X 단백질 오픈 리딩 프레임의 개시 코돈의 5' 위치에 대응하는 위치로부터 3' 방향으로 위치 9, 13, 17 및/또는 21에서 시작하는 종결 코돈 또는 복수개의 종결 코돈들을 함유하는 변이체 X 유전자를 함유한다. SEQ ID NO:1 또는 SEQ ID NO:125에 기재되는 예시적 WPRE를 참고하여, 상기 변형된 PRE는 SEQ ID NO:1 또는 SEQ ID NO:125에 기재되는 서열에서 위치 420, 424, 428 및/또는 432에 대응하는 뉴클레오티드 위치에서 시작하는 종결 코돈 또는 복수개의 종결 코돈들을 함유하는 변이체 X 유전자를 함유한다. 이러한 구현예에 있어서, 하나, 둘, 셋 또는 모든 네개의 위치들이 종결 코돈의 시작일 수 있다.

[0114] 몇 가지 구현예에 있어서, 상기 변형된 PRE는 상기 X 단백질 오픈 리딩 프레임의 개시 코돈의 5' 위치에 대응하는 위치로부터 3' 방향으로 각각 위치 9, 13, 17 및 21에서 시작하는 4개의 종결 코돈을 함유하는 변이체 X 유전자를 함유한다. SEQ ID NO:1 또는 SEQ ID NO:125에 기재되는 예시적 WPRE를 참조하면, 상기 변형된 PRE는 SEQ ID NO:1 또는 SEQ ID NO:125에 기재되는 서열의 위치 420, 424, 428 및 432에 대응하는 뉴클레오티드 위치에서 시작하는 종결 코돈을 함유하는 변이체 X 유전자를 함유한다.

[0115] 몇 가지 구현예에 있어서, 상기 변형된 PRE는 상기 변형된 PRE가 SEQ ID NO:1 또는 SEQ ID NO:125에 기재되는 X 유전자에 존재치 않는 하나 이상의 종결 코돈을 함유하는 변이체 X 유전자를 함유하는 한, SEQ ID NO:1 또는 SEQ ID NO:125과 65% 이상의 서열 상동성, 예컨대 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 그 이상의 서열 상동성을 나타내는 뉴클레오티드 서열을 포함한다. 몇 가지 구현예에 있어서, 상기 변형된 PRE는 SEQ ID NO:1 또는 SEQ ID NO:125와, 오직 뉴클레오티드 치환에 의하여만 상이하다. 다른 구현예에 있어서, 상기 변형된 PRE는 뉴클레오티드 삽입 또는 결실에 의하여 SEQ ID NO:1 또는 125와 상이하다. 몇 가지 구현예에 있어서, 상기 변형된 PRE는 SEQ ID NO:1 또는 SEQ ID NO:125보다 길거나 짧을 수 있다.

[0116] 몇 가지 구현예에 있어서, 상기 변형된 PRE는 야생형 또는 비변형된 PRE에는 존재치 않는 하나 이상의 종결 코돈 이외의 어떠한 변형을 함유하지 않는다.

[0117] 표 2A 및 2B가 변이체 X 유전자 또는 변형된 PRE 내 하나 이상의 종결 코돈 각각을 도입하기 위한 예시적 위치를 보여주고 있다. 상기 예시적 폴리뉴클레오티드의 서열에 대한 대응하는 SEQ ID NO 또한 보여진다. 몇 가지 구현예에 있어서, SEQ ID NOS: 44-58 또는 141-155 중 하나에 기재되는 뉴클레오티드 서열을 포함하는 변이체 X 유전자를 함유하는 변형된 PRE를 포함하는 폴리뉴클레오티드가 제공된다. 몇 가지 구현예에 있어서, SEQ ID NOS: 29-43 또는 126-140 중 하나에 기재된 뉴클레오티드 서열을 갖는 변형된 PRE를 포함하는 폴리뉴클레오티드가 제공된다. 몇 가지 구현예에 있어서, 재조합 분자, 예컨대 재조합 항원 수용체, CAR, TCR, 키메라 수용체, 면역조절자, 면역자극 분자, 및/또는 형질도입 또는 발현 마커를 코딩하는 핵산과 작동적으로 연결되는 이러한 PRE를 함유하는 폴리뉴클레오티드, 및 그를 함유하는 발현 카세트 및 벡터가 제공된다.

2. 분해 서열

[0118] 몇 가지 구현예에 이써서, 상기 절단된 X 유전자는 번역-후 변형 신호를 포함하는데, 이는 그에 의하여 단백질이 프로테아좀에 의해 분해되는 속도를 증가시키고 그로써 단백질의 반감기를 감소시키는 것으로 알려져 있는 분해 서열을 포함할 수 있다. 이러한 서열의 비제한적인 예는 PEST 서열을 코딩하는 뉴클레오티드의 포함, 유비퀴틴 결합 도메인 또는 N-말단 법칙 이후의 아미노산을 들 수 있다.

[0119] Pest 서열은 프롤린 (P), 글루탐산 (E), 세린 (S), 및 트레오닌 (T)가 풍부한 아미노산 영역이다. (Rogers S, Wells R, Rechsteiner M (1986). "Amino acid sequences common to rapidly degraded proteins: the PEST hypothesis". Science (journal) 234 (4774): 364-8. doi:10.1126/science.2876518.) PEST 영역의 존재는 그를 함유하는 단백질의 신속한 세포 내 분해라는 결과를 낳을 수 있다. 따라서, 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는 PEST 영역을 코딩하는 핵산을 포함한다.

[0120] 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는 유비퀴틴 결합 도메인을 코딩하는 핵산을 포함한다. 유비퀴틴-결합 도메인 (UBD)는 유비퀴틴에 비공유적으로 결합하는 모듈 단백질 도메인의 집합이다. 이들 모티프는 단백질 유비퀴틴화에 의하여 주어지는 정보를 해석하고 전달하여 다양한 세포 내 사건들을 제어하는데, 예컨대 프로테아좀에서의 분해이다. 따라서, 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는 유비퀴틴 결합 도메인을 코딩하는 핵산에 작동적으로 연결될 수 있는데, 이로써 유비퀴틴 리가아제들이 유비퀴틴 표지를 위하여 상기 변이체 X 단백질을 표적하고 따라서 상기 프로테아좀에 의한 분해를 더욱 신속하게 표적한다. 유비퀴틴 결합 도메인의 비제한적인 예시로서 CUE, GAT, GLUE, NZF, PAZ, UBA, UEV, UIM, 및 VHS를 들 수 있다. (Hicke, Ubiquitin-Binding Domains, doi:10.1038/nrm1701 참조).

[0121] 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는 N-말단 법칙에 따라 X 단백질 안전성을 감소시키는 아미노산 치환에 대응하는 돌연변이를 포함한다. 상기 N-말단 법칙에서, 개시 메티오닌의 제거 후 폴리펩타이드의 N-말단에 노출되는 아미노산의 동정은 그 폴리펩타이드의 대사 안정성과 반감기를 결정할 수 있다. (Varshavsky, A, 1996 The N-end rule: functions, mysteries, uses. Proc Natl Acad. Sci. USA 93(22):12142-12149). 이러한 아미노산은 불안정화 아미노산이라고 불릴 수 있다. 따라서, 몇 가지 구현예에 있어서, 상기 변형된 PRE는, 개시 코돈 뒤에 불안정화 아미노산을 코딩하는 코돈이 바로 이어지는 돌연변이를 변이체 X 유전자 내에 포함한다. 불안정화 아미노산의 비제한적 예시는 글리신, 아르기닌, 글루탐산, 페닐알라닌, 아스파테이트, 시스테인, 리신, 아스파라긴, 세린, 티로신, 트립토판, 히스티딘 및 류신을 들 수 있다. (Varshavsky 1996; Gonda et al. (1989). "Universality and Structure of the N-end Rule.". Journal of Biological Chemistry 264 (28): 16700-16712 참조). 몇 가지 구현예에 있어서, 상기 변형된 PRE는 개시 코돈 뒤에 1차 불안정화 아미노산 및 2차 불안정화 아미노산을 코딩하는 코돈이 바로 이어지는 돌연변이를 변이체 X 유전자 내에 포함한다. 이러한 돌연변이는 아미노산 쌍, 예컨대 아르기닌-글루탐산, 또는 아르기닌-아스파라긴에 해당할 수 있다. 몇 가지 구현예에 있어서, 아르기닌은 1차 불안정화 아미노산이고 글루탐산 또는 아스파라긴은 2차 불안정화 아미노산이다.

3. 기타 변형

[0122] 전술한 것들 외에 추가적인 변형을 함유하는 변형된 PRE를 함유하는 폴리뉴클레오티드가 제공된다. 몇 가지 구현예에 있어서, 상기 추가적인 변형은 X 유전자 또는 코딩되는 X 단백질의 발현, 분해, 안정성, 발암성 및/또는 면역원성 중 하나 이상을 감소시키거나 저지하는 상기 변형된 PRE에 함유되는 X 유전자의 임의의 변형일 수 있다. 몇 가지 구현예에 있어서, 상기 추가적인 변형은 상기 변이체 X 유전자의 전사 및/또는 상기 변이체 X 유전자에 의하여 코딩되는 X 단백질의 번역을 변화, 예컨대 감소시킨다.

[0123] 한 가지 구현예에 있어서, 상기 변형된 PRE는, 어떤 경우에는 번역 개시를 제한하거나 저지하기 위하여 도입되는 X 유전자 개시 코돈의 변이체를 추가적으로 함유한다. 몇 가지 구현예에 있어서, 상기 개시 코돈의 변이체는 비변형된 X 유전자 개시 코돈, 예컨대 야생형 헤파티티스 바이러스 X 유전자 개시 코돈에 비하여 하나 이상의 뉴클레오티드 상이점을 함유한다. 예컨대, SEQ ID NO:1 또는 SEQ ID NO:125를 참조하여, 상기 변형된 PRE는 SEQ ID NO:1 또는 SEQ ID NO:125의 뉴클레오티드 위치 411-413에 대응하는 개시 코돈에 비하여 하나 이상의 뉴클레오티드 차이를 함유하는 변이체 개시 코돈을 추가적으로 함유한다. SEQ ID NO:1 또는 SEQ ID NO:125의 개시 코돈 위치 411-413에 대응하는 다른 헤파티티스 PRE, 예컨대 또 다른 WPRE의 잔기를 확인하는 것은 이 기술 분야의 숙련자의 수준 내에서 용이한 것이다 (예컨대, 도 2A-2E 참조). 상기 뉴클레오티드 차이가 제한되거나 저지된 번역 개시를 결과할 수 있다.

[0124] 몇 가지 구현예에 있어서, 상기 개시 코돈의 변이체는 SEQ ID NO:119 또는 SEQ ID NO:216에 기재되는 변형된 WPRE의 변이체 X 유전자 리딩 프레임 내 X db유전자 개시 코돈에 대응하는 위치에서 발견되는 변이체 코돈일 수 있다. 예컨대, 상기 개시 코돈의 변이체는 SEQ ID NO:119 또는 SEQ ID NO:216에 기재되는 뉴클레오티드 서열의 뉴클레오티드 잔기 411-413 (TTG)에 대응하는 코돈일 수 있다. 몇 가지 구현예에 있어서, 개시 코돈의 상기 변이체는 SEQ ID NO:120에 기재되는변형된 WPRE 내 X 유전자 리딩 프레임의 코돈일 수 있다. 예컨대, 개시 코돈의 변이체는 SEQ ID NO:120에 기재되는 뉴클레오티드 서열의 뉴클레오티드 잔기 411-413 (GGG)에 대응하는 코돈일 수 있다.

[0125] 표 3A 및 3B는, 각각 그 안에 야생형 또는 비변형된 X 유전자나 PRE에는 존재치 않는 종결 코돈 및 변이체 개시 코돈이 하나 이상 도입된, 변이체 X 유전자를 함유하는 예시적 변이체 X 유전자 및 변형된 PRE 폴리뉴클레오티드를 설명하고 있다. 상기 표는 상기 변이체 X 유전자 또는 변형된 PRE 내 하나 이상의 종결 코돈의 도입을 위한 예시적 위치를 설명한다. 예시적 폴리뉴클레오티드 서열에 대한 대응하는 SEQ ID NO 역시 나타나 있다. 몇 가지 구현예에 있어서, 상기 변이체 X 유전자는 SEQ ID NOS: 74-88 또는 171-185 중 하나에 기재된 뉴클레오티드 서열을 포함한다. 몇 가지 구현예에 있어서, 상기 변형된 PRE는 SEQ ID NOS: 59-73 또는 156-170 중 하나에 기재된 뉴클레오티드 서열을 포함한다. 몇 가지 구현예에 있어서, 재조합 분자, 예컨대 재조합 항원 수용체, CAR, TCR, 키메라 수용체, 면역조절자, 면역자극 분자, 및/또는 형질도입 또는 발현 마커를 코딩하는 핵산에 작동적으로 연결되는 이러한 PRE를 함유하는 폴리뉴클레오티드, 및 그를 함유하는 발현 카세트 및 벡터가 제공된다.

[0126] 또 다른 구현예에 있어서, 상기 변형된 PRE는 그 안에서 변이체 X 유전자에 작동적으로 연결되는 변이체 프로모터를 추가적으로 함유할 수 있다. 상기 변이체 프로모터는 비변형된 헤파티티스 바이러스 X 유전자 프로모터, 예컨대 야생형 헤파티티스 바이러스 X 유전자 프로모터에 비하여 하나 이상의 뉴클레오티드 차이를 함유할 수 있다. 예컨대, SEQ ID NO:1 또는 SEQ ID NO:125를 참조하여, 상기 변이체 X 유전자는 SEQ ID NO:11에 기재되는 또는 SEQ ID NO:11의 뉴클레오티드 7-20으로 기재되는 WPRE X 유전자 프로모터에 비하여 하나 이상의 뉴클레오티드 차이를 함유할 수 있다. 몇 가지 구현예에 있어서, 상기 뉴클레오티드 차이는 상기 프로모터로부터의 전사를 제한하거나 저지하는 결과를 낳는 하나 이상의 차이를 결과할 수 있다.

[0127] 몇 가지 구현예에 있어서, 상기 변형된 PRE는 SEQ ID NO:119 또는 SEQ ID NO:216에 기재되는 변형된 PRE 서열 내 변형된 X 유전자에 작동적으로 연결되는 변이체 프로모터의 서열을 갖는 변이체 프로모터를 함유할 수 있다. 예컨대, 상기 변이체 프로모터는 각각의 서열이 SEQ ID NO:119 또는 SEQ ID NO:216에 기재되는 뉴클레오티드 서열인, 잔기 391-411 (GGGGAAATCATCGTCCTTTCC; SEQ ID NO:217) 또는 뉴클레오티드 잔기 397-410 (ATCATCGTCCTTTC; SEQ ID NO:218)에 대응하는 뉴클레오티드 잔기를 포함하는 변이체 프로모터일 수 있다. 몇 가지 구현예에 있어서, 상기 변형된 PRE는 SEQ ID NO:120에 기재되는 변형된 PRE 내 변형된 X 유전자와 작동적으로 연결된 변이체 프로모터의 서열을 갖는 변이체 프로모터를 함유할 수 있다. 예컨대, 상기 변이체 프로모터는, 가각의 서열이 SEQ ID NO:120에 기재되는 뉴클레오티드서열인 잔기 391-411 (GGGGAAGGTCTGCTGAGACTC; SEQ ID NO:219) 또는 뉴클레오티드 잔기 397-410 (GGTCTGCTGAGACT; SEQ ID NO:220)에 대응하는 뉴클레오티드 잔기를 포함하는 변이체 프로모터일 수 있다.

[0128] 몇 가지 구현예에 있어서, 상기 변이체 프로모터는 이 기술 분야에 공지된 헤파티티스 X 단백질 프로모터, 예컨대 [Sugata et al. (1994) Virology, 205:314-320]에 개시된 임의의 것과 같은 변이체 프로모터일 수 있다. 몇 가지 구현예에 있어서, 상기 변이체 X 프로모터는 SEQ ID NO:11에 기재되는 프로모터, 또는 SEQ ID NO:10의 위치 9에 대응하는 위치에서 트레오닌 (T)의 돌연변이를 포함하거나 SEQ ID NO:10의 위치 10에 대응하는 위치에서 글리신 (G)의 돌연변이를 포함하는 SEQ ID NO:10의 뉴클레오티드 6-22를 포함하는 프로모터의 변이체일 수 있다.

[0129] 표 3A 및 3B는, 각각 그 안에 야생형 또는 비변형된 PRE에는 존재치 않는 하나 이상의 도입되는 종결 코돈, 변이체 프로모터 및, 필요에 따라, 변이체 개시 코돈이 함유된 변이체 X 유전자를 함유하는 예시적 변이체 X 유전자 및 변형된 PRE 폴리뉴클레오티드를 설명한다. 상기 표는 변이체 X 유전자 또는 변형된 PRE 내 하나 이상의 종결 코돈의 도입을 위한 예시적 위치를 설명한다. 상기 예시적 폴리뉴클레오티드의 서열을 위한 대응하는 SEQ ID NO 역시 나타나 있다. 몇 가지 구현예에 있어서, 상기 변형된 PRE는 SEQ ID NOS: 89-118 또는 186-215 중 하나에 기재되는 뉴클레오티드 서열을 포함한다. 몇 가지 구현예에 있어서, 재조합 분자, 예컨대 재조합 항원 수용체, CAR, TCR, 키메라 수용체, 면역조절자, 면역자극 분자, 및/또는 형질도입 또는 발현 마커를 코딩하는 핵산에 작동적으로 연결된 이러한 PRE를 함유하는 폴리뉴클레오티드, 및 그를 함유하는 발현 카세트 및 벡터가 제공된다.

B. 재조합 분자를 코딩하는 핵산

[0130] 몇 가지 구현예에 있어서, 상기 제공되는 폴리뉴클레오티드 내 변형된 PRE는 하나 이상의 관심 분자, 예컨대 하나 이상의 재조합 및/또는 이종 분자, 예컨대 재조합 단백질(들), 예컨대 이종 단백질(들)을 코딩하는 하나 이상의 핵산과 작동적으로 연결된다. 이러한 재조합 및/또는 이종 분자는 용해성 단백질, 예컨대 분비 단백질, 및/또는 세포 표면 단백질을 포함할 수 있다. 몇 가지 구현예에 있어서, 상기 분자는 재조합 수용체이거나 이를 포함한다. 이러한 재조합 수용체는 항원 수용체, 예컨대 기능적 비-TCR 항원 수용체, 예컨대 키메라 항원 수용체 (CAR) 및 기타 항원-결합 수용체, 예컨대 전이유전자성 T 세포 수용체 (TCR)을 포함할 수 있다. 상기 수용체들은 또한 다른 수용체, 예컨대 다른 키메라 수용체, 예컨대 특정 리간드에 결합하는 수용체 및 CAR에 존재하는 것과 유사한 막관통 및/또는 세포내 신호전달 도메인을 갖는 수용체를 포함할 수도 있다.

[0131] 몇 가지 구현예에 있어서, 상기 분자는 용해성 분자, 예컨대 면역조절 및/또는 면역자극 분자, 예컨대 사이토카인, 예컨대 IL-2, IL-12, IL-6, 41BBL, CD40L, 및/또는 용해성 리간드 또는 수용체, 예컨대 면역 세포 공자극 분자용 용해성의 리간드, 예컨대 CD40L, 41BBL, 또는 용해성 항원-결합 분자, 예컨대 scFv이다. 또한, 상기 분자들 중에는 발현 또는 형질도입 마커 및 발현 벡터 및/또는 카세트 용도로 알려진 임의의 다른 분자(들)이 있다.

[0132] 몇 가지 구현예에 있어서, 상기 재조합 항원 수용체, 예컨대 CAR은 표적되는 질병, 예컨대 암, 감염성 질병, 염증성 또는 자가면역 질병, 또는 다른 질병 또는 질환, 예컨대 상기 제공되는 방법 및 조성물로 표적하기 위한 본 발명에 개시되는 것들의 세포 상의 하나 이상의 리간드에 특이적으로 결합한다. 예시적 항원은 희귀 티로신 키나아제 수용체 RORl, tEGFR, Her2, Ll-CAM, CD19, CD20, CD22, 메소텔린, CEA, 및 헤파티티스 B 표면 항원, 항-엽산 수용체, CD23, CD24, CD30, CD33, CD38, CD44, EGFR, EGP-2, EGP-4, 0EPHa2, ErbB2, 3, 또는 4, FBP, 태아 아세틸콜린 e 수용체, GD2, GD3, HMW-MAA, IL-22R-알파, IL-13R-알파2, kdr, 카파 경쇄, 루이스 Y, L1-세포 부착 분자, MAGE-A1, 메소텔린, MUC1, MUC16, PSCA, NKG2D 리간드, NY-ESO-1, MART-1, gp100, 태아발암 항원 (oncofetal antigen), ROR1, TAG72, VEGF-R2, 암배아 항원 (carcinoembryonic antigen, CEA), 전립성 특이 항원, PSMA, Her2/neu, 에스트로겐 수용체, 프로게스테론 수용체, ephrinB2, CD123, CS-1, c-Met, GD-2, 및 MAGE A3, CE7, Wilms 종양 1 (WT-1), 사이클린, 예컨대 사이클린 A1 (CCNA1), 및/또는 비오틴화 분자, 및/또는 HIV, HCV, HBV, HPV 및/또는 그 병원체 및/또는 발암성 버전에 의하여 발현 및/또는 그를 특징으로 하거나 그에 특이적인 분자이다.

1. 키메라 항원 수용체

[0133] 몇 가지 구현예에 있어서, 상기 재조합 분자는 키메라 항원 수용체 (CAR)이거나 그를 포함한다. CAR은 일반적으로 하나 이상의 세포내 신호전달 요소와 연결된 세포외 리간드 결합 도메인을 이용하여 유전적으로 조작된 수용체이다. 이러한 분자는 통상 천연 항원 수용체를 통한 신호 및/또는 공자극 수용체와 그러한 수용체의 조합을 통한 신호를 모방하거나 그 근사치를 제공한다.

[0134] 몇 가지 구현예에 있어서, CAR은 특정 마커, 예컨대 입양 치료 (adoptive therapy)에 의하여 표적화되는 특정 세포 유형에서 발현되는 마커, 예컨대 암 마커 및 /또는 본 발명에서 기재되는 임의의 항원에 대하여 특이성을 갖고 구현된다. 따라서, CAR은 통상 하나 이상의 항체의 항원-결합 단편, 도메인, 또는 일부분, 또는 하나 이상의 항체 가변 도메인, 및/또는 항체 분자를 포함한다. 몇 가지 구현예에 있어서, CAR은 항체 분자의 항원-결합 부분 또는 부분들, 예컨대 가변 중쇄 (VH) 또는 그 항원-결합 부분, 또는 단일클론 항체 (mAb)의 가변 중쇄 (VH) 및 가변 경쇄 (VL)로부터 유래하는 단일쇄 항체 단편 (scFv)을 포함한다.

[0135] 상기 항원-특이적 결합 또는 인식 요소는 일반적으로 하나 이상의 막관통 및 세포내 신호전달 도메인과 연결되어 있다. 몇 가지 구현예에 있어서, CAR은 상기 세포외 도메인과 융합된 막관통 도메인을 포함한다. 몇 가지 구현예에 있어서, 상기 수용체, 예컨대 CAR 내 도메인 중 하나와 천연적으로 결합된 막관통 도메인이 이용된다. 몇 가지 예시에 있어서, 상기 막관통 도메인은 이러한 도메인의 동일하거나 상이한 표면 막 단백질의 막관통 도메인으로의 결합을 막아서 상기 수용체 복합체의 다른 구성성분과의 상호 작용을 최소화하기 위하여 선택되거나 아미노산 치환에 의하여 변형된다.

[0136] 몇 가지 구현예에 있어서, 상기 막관통 도메인은 천연 또는 합성 원으로부터 유래된다. 출처원이 천연인 경우, 상기 도메인은, 몇 가지 측면에 있어서, 임의의 막-결합 또는 막관통 단백질로부터 유래한다. 막관통 영역은 T-세포 수용체, CD28, CD3 엡실론, CD45, CD4, CD5, CDS, CD9, CD 16, CD22, CD33, CD37, CD64, CD80, CD86, CD 134, CD137, CD154의 알파, 베타 또는 제타쇄로부터 유래한 것들 (즉, 상기 사슬들의 막관통 영역(들) 하나 이상을 포함하는 것들)을 포함한다. 상기 막관통 도메인은 몇 가지 구현예에 있어서는 합성이다. 몇 가지 측면에 있어서, 상기 합성 막관통 도메인은 소수성 잔기, 예컨대 류신 및 발린을 우세하게 포함한다. 몇 가지 측면에 있어서, 페닐알라닌, 트립토판 및 발린의 3체가 합성 막관통 도메인의 각 말단에서 발견될 것이다. 몇 가지 구현예에 있어서, 그 연결자는 링커, 스페이서 및/또는 막관통 도메인(들)이다.

[0137] 몇 가지 구현예에 있어서, 짧은 올리고- 또는 폴리펩타이드 링커, 예컨대 2 내지 10개 아미노산 길이의 링커, 예커대 글리신 및 세린을 함유하는 것, 예컨대 글리신-세린 2체를 포함하는 것이 존재하여 CAR의 막관통 도메인과 세포질 신호전달 도메인 사이의 연결자를 형성한다.

[0138] 수용체, 예컨대 CAR은 일반적으로 하나 이상의 세포내 신호전달 요소 또는 요소(들)을 포함한다. 몇 가지 구현예에 있어서, 상기 수용체는 TCR 복합체, T-세포 활성화 및 세포독성을 매개하는 TCR CD3 사슬, 예컨대 CD3 제타쇄를 포함한다. 따라서, 몇 가지 측면에 있어서, 상기 항원-결합 부분은 하나 이상의 세포 신호전달 모듈에 연결된다. 몇 가지 구현예에 있어서, 세포 신호전달 모듈은 CD3 막관통 도메인, CD3 세포내 신호전달 도메인, 및/또는 기타 CD 막관통 도메인을 포함한다. 몇 가지 구현예에 있어서, 상기 수용체, 예컨대 CAR은 또한 Fc 수용체 γ, CD8, CD4, CD25, 또는 CD16과 같은 하나 이상의 추가적인 분자의 일부분을 포함한다. 예컨대, 몇 가지 측면에 있어서, 상기 CAR 또는 다른 키메라 수용체는 CD3-제타 (CD3-ζ) 또는 Fc 수용체 γ와, CD8, CD4, CD25 또는 CD16 사이의 키메라 분자를 포함한다.

[0139] 몇 가지 구현예에 있어서, CAR 또는 다른 키메라 수용체의 연결 (ligation)시, 상기 수용체의 세포질 도메인 또는 세포내 신호전달 도메인은 면역 세포, 예컨대 CAR을 발현하는 조작된 T 세포의 통상적인 효과자 기능이나 반응 중 하나 이상을 활성화시킨다. 예컨대, 어떤 맥락에 있어서, 상기 CAR은 T 세포의 기능, 예컨대 세포분해 활성 또는 T-헬퍼 활성, 예컨대 사이토카인이나 다른 인자들의 분비를 유도한다. 몇 가지 구현예에 있어서, 항원 수용체 요소 또는 공자극 분자의 세포내 신호전달 도메인의 절단된 일부분은, 예컨대 그것이 효과자 기능 신호를 전달한다면 온전한 면역자극 사슬을 대신하여 사용된다. 몇 가지 구현예에 있어서, 상기 세포내 신호전달 도메인 또는 도메인들은 T 세포 수용체 (TCR)의 세포질 서열, 몇 가지 측면에 있어서는 천연의 맥락에서 이러한 수용체들과 협동하여 작용하는 공수용체들의 서열 및/또는 그러한 분자들의 임의의 유도체 또는 변이체를 포함하여, 및/또는 동일한 기능적 능력을 갖는 임의의 합성 서열을 포함하여 항원 수용체 합체 후 신호 전달이 개시된다.

[0140] 천연의 TCR의 맥락에서, 완전한 활성화는 일반적으로 TCR을 통한 신호전달 뿐 아니라 공자극 신호도 필요로 한다. 따라서, 몇 가지 구현예에 있어서, 완전한 활성화를 촉진하기 위하여는, 2차 또는 공자극 신호를 생성하기 위한 요소도 CAR에 포함된다. T 세포 활성화는 어떤 측면에서는 두 부류의 세포질 신호전달 서열에 의하여 매개되는 것으로 설명된다: TCR을 통하여 항원-의존성 1차 활성화를 개시하는 것들 (1차 세포질 신호전달 서열), 및 2차 또는 공자극 신호 (2차 세포질 신호전달 서열)을 제공하는 항원-비의존성 방식으로 작용하는 것들 (2차 세포질 신호전달 서열). 몇 가지 측면에 있어서, CAR은 그러한 신호전달 성분을 하나 또는 양자 모두 포함한다.

[0141] 1차 세포질 신호전달 서열은, 어떤 측면에서는 자극 경로 또는 억제 경로 중 하나로 TCR 복합체의 1차 활성화를 조절할 수 있다. 자극 방식으로 작용하는 1차 세포질 신호전달 서열은 면역수용체 티로신-기반 활성화 모티프 또는 ITAM으로 알려진 신호전달 모티프를 함유할 수 있다. 1차 세포질 신호전달 서열을 함유하는 ITAM의 예시로는 TCR 제타, FcR 감마, FcR 베타, CD3 감마, CD3 델타, CD3 엡실론, CDS, CD22, CD79a, CD79b, 및 CD66d로부터 유래하는 것들을 들 수 있다. 몇 가지 구현예에 있어서, CAR의 세포질 신호전달 분자(들)은 CD3 제타로부터 유래하는 세포질 신호전달 도메인, 그 일부분 또는 서열을 포함한다.

[0142] 몇 가지 구현예에 있어서, CAR은 공자극 수용체, 예컨대 CD28, 4-1BB, OX40, DAP10, 및 ICOS의 신호전달 도메인 및/또는 막관통 일부분을 포함한다.

[0143] 어떤 구현예에 있어서, 세포내 신호전달 도메인은 CD3에 연결된 CD28 막관통 및 신호전달 도메인을 포함한다. 몇 가지 구현예에 있어서, 상기 세포내 신호절달 도메인은, CD3 세포내 도메인에 연결되는, 키메라 CD28 및 CD137 공자극 ㄷ도메인을 포함한다. 몇 가지 구현예에 있어서, CAR은 또한 형질도입 마커 (예컨대, tEGFR)을 포함할 수 있다. 몇 가지 구현예에 있어서, CD8⁺ 세포독성 T 세포의 상기 세포내 신호전달 도메인은 CD4⁺ 헬퍼 T 세포의 세포내 신호전달 도메인과 동일하다. 몇 가지 구현예에 있어서, 상기 CD8⁺ 세포독성 T 세포의 상기 세포내 신호전달 도메인은 CD4⁺ 헬퍼 T 세포의 세포내 신호전달 도메인과 상이하다.

[0144] 몇 가지 구현예에 있어서, CAR은, 상기 세포질 부분에서, 하나 이상의, 예컨대 2 이상의 공자극 도메인 및 활성화 도메인, 예컨대 1차 활성화 도메인을 포함한다. 한 가지 예시는 CD3-zeta, CD28, 및 4-1BB의 세포내 요소를 포함하는 수용체이다.

[0145] 몇 가지 구현예에 있어서, 상기 제공되는 폴리뉴클레오티드 내 핵산(들)에 의하여 코딩되는 재조합 분자(들)은, 예컨대 상기 수용체를 발현하는 세포의 형질도입이나 조작을 확인 및/또는 상기 폴리뉴클레오티드에 의하여 코딩되는 분자(들)을 발현하는 세포의 선별 및/또는 표적화라는 목적을 위하여, 하나 이상의 마커를 또한 포함한다. 몇 가지 측면에 있어서, 이러한 마커는 여러 가지 핵산 또는 폴리뉴클레오티드에 의하여 코딩될 수 있는데, 이들은 또한 통상 동일한 방법을 통하여, 예컨대 동일한 벡터나 동일한 유형의 벡터에 의한 형질도입을 통하여 유전자 조작 공정 중에 도입될 수 있다.

[0146] 몇 가지 측면에 있어서, 상기 마커, 예컨대 형ㅇ질도입 마커는 단백질 및/또는 세포 표면 분자이다. 예시적인 마커는 천연에서 존재하는, 예컨대 내인성 마커, 예컨대 천연에서 존재하는 세포 표면 분자의 절단된 변이체이다. 몇 가지 측면에 있어서, 상기 변이체는 천연 또는 내인성 세포 표면 분자에 비하여 감소된 면역원성, 감소된 수송 (trafficking) 기능, 및/또는 감소된 신호전달 기능을 갖는다.

[0147] 몇 가지 측면에 있어서, 상기 마커는 CD34, NGFR, 또는 표피 성장 인자 수용체 (예컨대, tEGFR)의 전부 또는 일부 (예컨대, 절단된 형태)를 포함한다.

[0148] 몇 가지 구현예에 있어서, 상기 마커는 T 세포에서는 천연으로 발견되지 않는 또는 T 세포의 표면에서는 천연으로 발견되지 않는 분자, 예컨대 세포 표면 단백질, 또는 그 일부분이다.

[0149] 몇 가지 구현예에 있어서, 상기 분자는 상기 분자는 비(非)-자가 분자, 예컨대 비-자가 단백질, 즉 그 안으로 세포가 입양되어 전달되는 (adoptively transferred) 숙주의 면역계에 의하여 "자가"로 인식되지 않는 것이다.

[0150] 몇 가지 구현예에 있어서, 상기 마커는, 어떠한 치료적 기능을 나타내고 및/또는 유전자 조작을 위한 마커로서 사용되기 위한 것 외에는, 예컨대 성공적으로 조작된 세포를 선별하기 위한 것 외에는 어떠한 효과도 생성하지 않는다. 또 다른 구현예에 있어서, 상기 마커는 치료적 분자 또는 어떤 원하는 효과를 달리 실행하는 분자, 예컨대 세포가 생체 내에서 만나게 되는 리간드, 예컨대 공자극 분자, 또는 입양 전달 및 리간드와의 만남시 상기 세포의 반응을 강화 및/또는 약화시키는 면역 체크포인트 분자일 수 있다.

[0151] 항원 수용체, 예컨대 CAR 및 재조합 TCR, 및 그 생성과 도입은 몇 가지 구현예에 있어서, 예컨대 국제특허출원 공개 번호 WO200014257, WO2013126726, WO2012/129514, WO2014031687, WO2013/166321, WO2013/071154, WO2013/123061, U.S.특허출원 공개 번호 US2002131960, US2013287748, US20130149337, U.S. 특허 번호: 6,451,995, 7,446,190, 8,252,592, 8,339,645, 8,398,282, 7,446,179, 6,410,319, 7,070,995, 7,265,209, 7,354,762, 7,446,191, 8,324,353, 및 8,479,118, 및 유럽특허출원 번호 EP2537416, 및/또는 문헌 [Sadelain et al., Cancer Discov. 2013 April; 3(4): 388-398; Davila et al. (2013) PLoS ONE 8(4): e61338; Turtle et al., Curr . Opin . Immunol., 2012 October; 24(5): 633-39; Wu et al., Cancer, 2012 March 18(2): 160-75]에 기재된 것들을 포함한다.

2. T 세포 수용체 ( TCR )

[0152] 몇 가지 구현예에 있어서, 상기 핵산(들)에 의하여 코딩되는 재조합 분자(들)은 재조합 T 세포 수용체 (TCR)이거나 이를 포함한다. 몇 가지 구현예에 있어서, 상기 재조합 TCR은 항원 특이적, 일반적으로 표적 세포 상에 존재하는 항원, 예컨대 종양-특이적 항원, 자가면역 또는 염증성 질병과 관련된 특정 세포 유형에서 발현되는 항원, 또는 바이러스 병원체 또는 박테리아 병원체로부터 유래하는 항원에 특이적이다.

[0153] 몇 가지 구현예에 있어서, 상기 TCR은 천연적으로 존재하는 T 세포로부터 클로닝된 것이다. 몇 가지 구현예에 있어서, 표적 항원 (예컨대, 암 항원)에 대한 고-친화 T 세포 클론은 환자로부터 동정되고 단리된다. 몇 가지 구현예에 있어서, 상기 표적 항원에 대한 TCR 클론은 인간 면역계 유전자 (예컨대, 인간 백혈구 항원계, 또는 HLA)를 이용하여 조작된 트랜스제닉 마우스에서 생성되었다. 예컨대, 종양 항원 참조 (예컨대, Parkhurst et al. (2009) Clin Cancer Res. 15:169-180 및 Cohen et al. (2005) J Immunol . 175:5799-5808 참조). 몇 가지 구현예에 있어서, 파지 디스플레이가 표적 항원에 대한 TCR을 단리하는데 이용된다 (예컨대, Varela-Rohena et al. (2008) Nat Med . 14:1390-1395 및 Li (2005) 　Nat Biotechnol. 23:349-354 참조).

[0154] 몇 가지 구현예에 있어서, T-세포 클론이 얻어진 후, TCR 알파 및 베타 사슬은 단리되어 유전자 발현 벡터 내로 클로닝된다. 몇 가지 구현예에 있어서, TCR 알파 및 베타 유전자는 피코르나바이러스 2A 리보좀 스킵 펩타이드를 통하여 연결되어 있어서 양 사슬은 공발현이다. 몇 가지 구현예에 있어서, TCR을 코딩하는 핵산은 또한 상기 수용체를 발현하는 세포의 형질도입 또는 조작을 확인하기 위한 마커를 포함한다.

[0155] 몇 가지 구현예에 있어서, 상기 제공되는 폴리뉴클레오티드 내 핵산에 의하여 코딩되는 재조합 또는 이종 분자(들)은 핵산 분자, 예컨대 RNA, DNA 또는 인공의 핵산 분자이거나 이를 포함하는데, 예컨대 표적 mRNA, 예컨대 단간섭 RNA (siRNA), 짧은 헤어핀 RNA (shRNA( 또는 마이크로-RNA (miRNA)의 발현이나 활성을 간섭하기 위하여 설계된 것이다. 이러한 분자들은 면역 세포, 예컨대 면역조절자, 면역억제 분자, 및 면역 체크포인트 분자의 활성과 관계된, 이를 촉진하거나 억제하는 분자의 발현 또는 활성을 간섭하기 위하여 설계된 것들을 포함할 수 있다. 몇 가지 구현예에 있어서, 뉴클레오티드 siRNA 또는 miRNA 서열 (예컨대, 21-25개 뉴클레오티드 길이)는, 예컨대 짧은 헤어핀 RNA (shRNA) 서열, 보다 긴 (예컨대 60-80개 뉴클레오티드) 전구체 서열의 전사에 의한 발현 벡터로부터 생성될 수 있는데, 이는 순차적으로 세포의 RNAi 장치에 의하여 처리되어 siRNA 또는 miRNA 서열 중 하나를 생성한다. 또는, 뉴클레오티드 siRNA 또는 miRNA 서열 (예컨대 21-25개 뉴클레오티드 길이)는, 예컨대 화학적으로 합성될 수 있다. siRNA 또는 miRNA 서열의 화학적 합성은 Dharmacon, Inc. (Lafayette, CO), Qiagen (Valencia, CA), 및 Ambion (Austin, TX)와 같은 회사로부터 구득 가능하다. 상기 RNA는 10 내지 30개 뉴클레오티드 길이, 예컨대 19-25 또는 21-25개 뉴클레오티드 길이이다. 예컨대, siRNA 서열은 통상 정확한 상보성으로 표적 mRNA 내 고유 서열에 결합하고 그 표적 mRNA 분자의 분해를 결과한다. siRNA 서열은 상기 mRNA 분자 내 어디에나 ㄱ결합할 수 있는데; 상기 siRNA에 의하여 표적화되는 서열은 대상 폴리펩타이드를 발현하는 유전자, 또는 그러한 유전자의 상류 또는 하류 조절자, 예컨대 유전자의 상류 또는 하류 조절자를 포함하는데, 예컨대 유전자 프로모터에 결합하는 전사 인자, 대상 폴리펩타이드와 상호작용하는 키나아제 또는 포스파타아제, 및 상기 대상 폴리펩타이드에 영향을 미칠 수 있는 조절 경로에 관여되는 폴리펩타이드이다. miRNA 서열은 통상 정확한 상보성 또는 다소 낮은 정확성의 상보성으로 표적 mRNA 내 고유의 서열에 결합하여 표적 mRNA 분자의 번역을 억제하는 결과를 낳는다. miRNA 서열은 mRNA 서열 내 어디에나 결합할 수 있으나 일반적으로 그 mRNA 분자의 3' 비번역 영역 내에 결합한다.

C. 발현 카세트 및 바이러스 벡터

[0156] 몇 가지 구현예에 있어서, 상기 폴리뉴클레오티드는 발현 카세트로서 또는 그 내로 제공된다. 상기 폴리뉴클레오티드 또는 발현 카세트는 상기 핵산에 의하여 코딩되는 재조합 및/또는 이종 분자의 발현을 위하여 발현 벡터, 예컨대 바이러스 벡터에 함유될 수 있다.

1. 발현 카세트

[0157] 몇 가지 구현예에 있어서, 상기 발현 카세트는 프로모터의 제어 하에서 및 전술된 임의의 것과 같은 상기 변형된 PRE에 작동적으로 연결된 이종 및/또는 재조합 핵산을 함유할 수 있다. 상기 발현 카세트는 또한 하나 이상의 다른 조절 요소를 함유할 수 있다. 상기 변형된 PRE 외에, 상기 핵산은 다른 핵산 서열들, 예컨대 프로모터, 인핸서, 다른 전사-후 조절 요소, 폴리아데닐화 신호, 제한 효소 부위, 다중 클로닝 부위 또는 코딩 분절 등과 작동적으로 연결될 수 있으나, 이에 국한되는 것은 아니다.

a. 프로모터

[0158] 몇 가지 구현예에 있어서, 상기 발현 카세트는 사기 재조합 또는 이종 단백질을 코딩하는 핵산 분자와 작동적으로 연결되는 프로모터를 포함한다. 상기 프로모터는 사용자가 상기 발현 맥락에 적합한 것으로서 원하는 임의의 프로모터를 포함할 수 있다. 몇 가지 구현예에 있어서, 프로모터는 광범위한 세포 부류에 걸쳐 고수준의 구성적 발현을 제공할 수 있는 진핵 또는 원핵 기원 프로모터를 포함할 수 있고, 세포에서 상기 재조합 또는 이종 단백질을 코딩하는 핵산의 전사를 이끄는데 충분할 것이다. 몇 가지 구현예에 있어서, 상기 재조합 또는 이종 단백질을 코딩하는 핵산은 서로 떨어져 위치하는 서열로, 이는 상기 프로모터 서열의 5' 말단에 작동적으로 연결되는 서열이다. 상기 프로모터 영역은 또한 전사 증가 또는 억제를 위하여 제어 요소를 포함할 수 있고 사용자가 원하는대로 및 맥락에 따라 변형될 수 있다.

[0159] 몇 가지 구현예에 있어서, 프로모터는 RNA 합성을 위한 개시 부위의 위치화에 기능하는 서열을 포함한다. 몇 가지 구현예에 있어서, 상기 프로모터는 TATA 박스를 포함한다. 몇 가지 구현예에 있어서, 상기 프로모터는 예컨대 포유츄 말단 디옥시뉴클레오티딜 트랜스퍼라아제 유전자에 대한 프로모터 및 SV40 후기 유전자를 위한 프로모터와 같은 TATA 박스를 결여한다. 이러한 구현예에 있어서, 상기 프로모터는 개시 위치를 잡는데 도움을 주는, 개시 부위를 덮는 분리 요소 자체를 함유할 수 있다. 추가적인 프로모터 요소는 전사 개시의 빈도를 조절한다. 몇 가지 구현예에 있어서, 다수의 프로모터들이 개시 부위의 하류에도 기능적 요소들을 함유하는 것으로 밝혀졌지만, 이들은 개시 부위의 30-110 bp 상류 영역에 위치한다. 코딩 서열을 프로모터의 "제어 하에" 들게 하기 위하여, 실시자는 상기 전사 리딩 프레임의 전사 개시 부위의 5' 말단을 상기 선택된 프로모터의 "하류" (즉, 3')에 위치시킨다. "상류" 프로모터는 DNA의 전사를 자극하고 그 코딩되는 RNA의 발현을 촉진한다.

[0160] 몇 가지 구현예에 있어서, 프로모터 요소들 사이의 거리 (spacing)는 유동적인데, 그로써 프로모터 기능은 요소들이 서로 뒤집히거나 이동하는 경우에도 보존된다. 프로모터가 tk 프로모터인 몇 가지 구현예에 있어서, 상기 프로모터 요소들 간의 거리는 활성이 감소하기 시작하기 전, 50 bp 떨어지기까지 증가될 수 있다. 프로모터에 따라, 각각의 요소들은 전사를 활성화하기에 협조적으로 또는 독립적으로 기능할 수 있다. 몇 가지 구현예에 있어서, 프로모터는 "인핸서"와 결부되어 사용될 수 있는데, 이는 핵산 서열의 전사 활성화에 관여하는 시스-작용성 조절 서열을 말한다.

[0161] 몇 가지 구현예에 있어서, 프로모터는 코딩 분절 및/또는 엑손의 상류에 위치하는 5' 비코딩 서열을 단리함으로써 얻어질 수 있기 때문에, 핵산 서열과 천연적으로 관련된 것일 수 있다. 이러한 프로모터를 "내인성"이라고 부를 수 있다. 몇 가지 구현예에 있어서, 인핸서는 그 서열의 하류 또는 상류 중 하나에 위치하는, 핵산 서열과 천연적으로 관련된 것일 수 있다.

[0162] 또는, 몇 가지 구현예에 있어서, 코딩 핵산 분절은, 일반적으로 천연 세팅에서는 코딩 핵산 서열과 관련되지 않는, 재조합 및/또는 이종 프로모터 및/또는 인핸서의 제어 하에 위치될 수 있다. 이러한 프로모터 또는 인핸서는, 천연에서는 상기 핵산이 유래되는 종 내 다른 유전자와 작동적으로 연결되는 프로모터 또는 인핸서, 및 다른 종, 예컨대 다른 원핵 또는 진핵 세포로부터 단리된 프로모터 또는 인핸서, 및 "천연에서는 존재치" 않는, 즉 여러 전사 조절 영역들의 여러 요소들 및/또는 천연의 프로모터 또는 인핸서 중에 존재하는 것들과 비교하여 발현을 변경시키는 돌연변이를 함유하는 프로모터 또는 인핸서를 포함할 수 있다. 예컨대, 재조합 DNA 컨스트럭트에 사용되는 예시적 프로모터는 β-락타마아제 (페니실리나아제), 락토오스, 트립토판 (trp), RNA 폴리머라아제 (pol) III 프로모터, 예컨대 인간 및 쥐과 U6 pol III 프로모터 뿐 아니라 인간 및 쥐과 H1 RNA pol III 프로모터; RNA 폴리머라아제 (pol) II 프로모터; 사이토메갈로바이러스 극초기 프로모터 (pCMV), 신장 인자-1 알파 (EF-1 알파), 및 라우스 육종 바이러스 긴 말단 반복 (long terminal repeat promotor)(pRSV) 프로모터 시스템을 들 수 있으나 이에 국한되는 것은 아니다. 프로모터와 인핸서의 핵산 서열을 합성 생산하는 것 외에도, 본 발명에서 기재되는 조성물과 방법과 관련하여 서열은 재조합 클로닝 및/또는 핵산 증폭 기술, 예컨대 PCR™을 이용하여 제조될 수 있다 (각각 본 발명에 참조로서 포함되는 U.S. Pat. Nos. 4,683,202 및 5,928,906 참조). 또한, 몇 가지 구현예에 있어서, 비(非)-핵 기관, 예컨대 미토콘드리아, 엽록체 등등의 세포기관 내 서열의 전사 및/또는 발현을 이끄는 제어 서열도 역시 이용될 수 있다. 프로모터, 인핸서 및 다른 위치 (locus) 또는 전사 제어/조절 요소들 또한 "전사 카세트"라고 불릴 수 있다.

[0163] 몇 가지 구현예에 있어서, 상기 프로모터 및/또는 인핸서는 발현을 위하여 선택된 세포기관, 세포 유형, 조직, 기관 또는 생물 내에서 DNA 분절의 발현을 효과적으로 지시하도록 작동적으로 연결된다. 분자 생물학 기술분야의 숙련자는 일반적으로 단백질 발현을 위한 프로모터, 인핸서 및 세포 유형 조합의 이용을 인지하고 있다 (예컨대, 본 발명에 참조로 포함되는 Sambrook et al., 1989 참조). 이용되는 프로모터는 적절한 조건 하에서 도입되는 DNA 분절의 고수준 발현을 이끌어 내기에 구성적, 조직-특이적, 유도 가능 (inducible) 및/또는 유용, 예컨대 유전자 치료에 또는 대규모의 재조합 단백질 및/또는 펩타이드의 제조와 같은 응용에 장점을 가질 수 있다. 상기 프로모터는 이종 또는 내인성일 수 있다.

[0164] 몇 가지 구현예에 있어서, T3, T7 또는 SP6 세포질 발현 시스템이 이용될 수 있다. 진핵 세포가, 전달 복합체의 일부로서 또는 추가적인 유전자 발현 컨스트럭트로서, 적절한 박테리아 폴리머라아제가 제공된다면, 특정한 박테리아 프로모터로부터의 세포질에서의 전사를 뒷받침할 수 있다.

[0165] 몇 가지 구현예에 있어서, 유도 가능한 프로모터가 사용될 수 있다. 본 발명에서 사용되는바, "유도 가능한 프로모터"는 특정한 신호에 반응하여 조절될 수 있는 전사 제어 요소를 말한다. 유도 가능한 프로모터는 전사 활성화인자에 결합되는 경우 전사적으로 활성인데, 이는 차례로 특정한 일련의 조건들, 예컨대 상기 전사 활성화인자의 상기 유도 가능한 프로모터에의 결합에 영향을 미치는 및/또는 상기 전사 활성화인자 자체의 기능에 영향을 미치는 화학적 신호의 특정한 조합의 존재 하에서 활성화된다. 따라서, 유도 가능한 프로모터는, 유도자의 부재시에, 상기 유도 가능 프로모터가 작동적으로 연결된 핵산 서열의 발현을 지시하지 않거나 낮은 수준의 발현을 지시하는; 또는, 그를 제거시, 그 프로모터, 예컨대 tet 시스템으로부터의 고 수준 발현을 가능하게 하는 조절 인자의 존재 하에 낮은 수준의 발현을 나타내는 프로모터이다. 유도자의 존재 하에서, 유도 가능 프로모터는 증가된 수준으로 전사체를 이끌어 낸다.

[0166] 몇 가지 구현예에 있어서, tet 작동자 서열 (TECO) 상에서 대장균의 tet 억제 (tetr)의 억제 작용에 기반하는 테트라사이클린-(tet)-조절 시스템이 포유류계에 사용되기 위하여 변형되고 발현 카세트용 조절 요소로서 사용될 수 있다. 이러한 시스템은 이 기술 분야의 숙련자에게는 잘 알려져 있다 (Goshen and Badgered, Proc. Natl. Acad. Sci. USA 89: 5547-51 (1992), Shockett et al., Proc. Natl. Acad. Sci. USA 92:6522-26 (1996), Lindemann et al., Mol. Med. 3:466-76 (1997) 참조).

b. 기타 조절 요소

[0167] 몇 가지 구현예에 있어서, 상기 발현 카세트는 상기 재조합 단백질, 예컨대 이종 단백질을 코딩하는 핵산과 작동적으로 연결되는 인핸서를 추가적으로 포함할 수 있다.

[0168] 몇 가지 구현예에 있어서, 내부 리보좀 결합 부위 (IRES) 요소가 발현 카세트에 작동적으로 연결되어 다중유전자, 또는 폴리시스트로닉 메시지를 생성한다. IRES 요소는 5'-메틸화된 캡-의존성 번역의 리보좀 스캐닝 모델을 우회하여 내부 위치에서 번역이 시작될 수 있다 (Pelletier and Sonenberg, 1988). IRES 요소의 비제한적 예로는 피코르나바이러스 패밀리 (폴리오 및 뇌심근염)의 IRES 요소 (Pelletier and Sonenberg, 1988) 또는 포유류 메시지로부터의 IRES (Macejak and Sarnow, 1991)를 들 수 있으나 이에 국한되는 것은 아니다. IRES 요소는 이종 오픈 리딩 프레임에 연결될 수 있다. 각각 IRES에 의하여 분리된 다중 오픈 리딩 프레임은 같이 전사되어 폴리시스트로닉 메시지를 생성할 수 있다. IRES 요소 덕분에, 각각의 오픈 리딩 프레임은 효율적인 번역을 위하여 리보좀에 접근 가능하다. 다중 유전자는 하나의 메시지를 전사하기 위하여 하나의 프로모터/인핸서를 이용하여 효율적으로 발현될 수 있다.

[0169] 몇 가지 구현예에 있어서, 상기 벡터나 컨스트럭트는 재조합 단백질, 예컨대 이종 단백질을 코딩하는 핵산에 작동적으로 연결된 하나 이상의 종결 신호를 포함할 것이다. "종결 신호" 또는 "종결자"는 RNA 폴리머라아제에 의한 RNA 전사체의 특정한 종결에 관여되는 DNA 서열로 이루어진다. 따라서, 특정한 구현예에 있어서, RNA 전사체의 생성을 끝내는 종결 신호가 고려된다. 몇 가지 구현예에 있어서, 종결자는 생체 내에서 이용되어 바람직한 메시지 수준을 달성한다.

[0170] 진핵 시스템을 포함하는 몇 가지 구현예에 있어서, 상기 종결자 영역은 또한 폴리아데닐화 부위를 노출하기 위하여 새로운 전사체의 위치-특이적 절단을 허하는 특정한 DNA 서열을 포함할 수 있다. 이것은 상기 전사체의 3' 말단에 약 200 A 잔기 (폴리A)의 확장부를 더하기 위한 특화된 내인성 폴리머라아제를 신호한다. 이러한 폴리A 꼬리로 변형된 RNA 분자는 더 안정해 보이고, 더 효율적으로 번역된다. 따라서, 진핵생물과 관련된 몇 가지 구현예에 있어서, 상기 종결자는 RNA의 절단을 위한 신호를 포함한다. 몇 가지 구현예에 있어서, 상기 종결자 신호는 상기 메시지의 폴리아데닐화를 촉진한다. 상기 종결자 및/또는 폴리아데닐화 부위 요소는 메시지 수준을 증가시키고, 상기 카세트로부터 다른 서열로의 초과번역 (read through)을 최소화하기 위하여 기능할 수 있다.

[0171] 종결자는 본 발명에서 기술하는 임의의 공지된 전사 종결자 또는 이 기술 분야의 숙련자에게 알려진 임의의 종결자를 포함하는데, 예컨대 유전자 종결 서열, 예컨대 보바인 성장 호르몬 종결자 또는 바이러스 종결 서열, 예컨대 SV 40 종결자를 들 수 있으나 이에 국한되는 것은 아니다. 특정 구현예에 있어서, 상기 종결 신호는, 예컨대 서열 절단으로 인하여 전사가능한 또는 번역가능한 서열을 결여할 수 있다.

[0172] 진핵 유전자 발현과 관련된 몇 가지 구현예에 있어서, 상기 발현 카세트는 폴리아데닐화 신호와 작동적으로 연결되어 상기 전사체의 적절한 폴리아데닐화를 유효하게 한다. 이러한 임의의 서열이 이용될 수 있다. 몇 가지 예시는 다양한 표적 세포에서 편리하고 잘 기능하는 것으로 알려진, SV 40 폴리아데닐화 신호 또는 보바인 성장 호르몬 폴리아데닐화 신호를 포함한다. 폴리아데닐화는 전사체의 안정성을 증가시키고 세포질 수송을 촉질할 수 있다.

[0173] 몇 가지 구현예에 있어서, 상기 발현 카세트 또는 벡터는 숙주 세포에서의 전파를 위하여 하나 이상의 복제 부위 기점 (origin)(종종 "ori"로 칭해짐)을 함유한다. 복제 기점은 복제가 개시되는 특정한 핵산 서열이다. 또는, 숙주 세포가 효모이면 자율 복제 서열 (autonomously replicating sequence, ARS)가 이용될 수 있다.

2. 바이러스 벡터

[0174] 몇 가지 구현예에 있어서, 상기 변형된 PRE, 핵산 및/또는 카세트는 바이러스 벡터 내에 제공된다. 상기 벡터 내 핵산은 프로모터의 제어하에서 발현 카세터로서 제공될 수 있다. 상기 바이러스 벡터는 그 안에 이종 또는 재조합 단백질의 발현을 위하여 세포로 핵산 분자를 이동시키기 위하여 사용될 수 있다.

[0175] 예시적 바이러스 벡터는 레트로바이러스 벡터, 예컨대 렌티바이러스 또는 감마레트로바이러스 벡터, 유인원 바이러스 40 (SV 40), 아데노바이러스 및 아데노-관련 바이러스 (AAV)를 포함한다. 몇 가지 구현예에 있어서, 재조합 핵산은 레트로바이러스 벡터, 예컨대 렌티바이러스 벡터 또는 감마-레트로바이러스 벡터를 이용하여 세포로 전달된다 (예컨대, Koste et al. (2014) Gene Therapy 2014 Apr 3. doi: 10.1038/gt.2014.25; Carlens et al. (2000) Exp Hematol 28(10): 1137-46; Alonso-Camino et al. (2013) Mol Ther Nucl Acids 2, e93; Park et al., Trends Biotechnol. 2011 November 29(11): 550-557 참조). 숙주 게놈으로 그들의 유전자를 혼입시켜, 다량의 외래 유전 물질을 전달, 광범위 스펙트럼의 종 및 세포 유형 및 특별 세포주 패키징을 감염시킬 수 있는 능력으로 인하여 레트로바이러스가 전달 벡터로서 유용하다 (Miller, 1992).

[0176] 몇 가지 구현예에 있어서, 유전자 전달은 렌트바이러스 벡터를 통하여 달성된다. 렌티바이러스는, 다른 레트로바이러스들과는 달리, 몇 가지 맥락에서 특정한 비(非)-분열 세포에 형질도입을 위하여 이용될 수 있다.

[0177] 렌티바이러스 벡터의 비제한적 예시는 렌티바이러스, 예컨대 인간 면역결핍 바이러스 1 (HIV-1), HIV-2, 유인원 면역결핍 바이러스 (SIV), 인간 T-림프구 바이러스 1 (HTLV-1), HTLV-2 또는 말 감염 빈혈 바이러스 (E1AV)로부터 유래된 것들을 들 수 있다. 예컨대, 렌티바이러스 벡터는 HIV 독성 유전자 약독화를 반복함으로써 생성되었는데, 예컨대 유전자 env, vif, vpr, vpu 및 nef는 결실되어 상기 벡터를 치료 목적으로 더 안전하게 만든다. 렌티바이러스 벡터는 이 기술 분야에 알려져 있다 (Naldini et al., (1996 및 1998); Zufferey et al., (1997); Dull et al., 1998, U.S. Pat. Nos. 6,013,516; 및 5,994,136 참조). 몇 가지 구현예에 있어서, 이들 바이러스 벡터는 플라스미드계 또는 바이러스계이고, 외래 핵산 혼입을 위하여, 선별을 위하여 및 핵산의 숙주 세포로의 전달을 위하여 필수적인 서열을 갖게끔 형성된다. 공지된 렌티바이러스는 American Type Culture Collection ("ATCC"; 10801 University Blvd., Manassas, Va. 20110-2209)와 같은 기탁소 또는 컬렉션으로부터 쉽게 얻을 수 있거나, 통상 이용 가능한 기법을 이용하여 알려진 원으로부터 단리될 수 있다.

[0178] 몇 가지 구현예에 있어서, 두 가지 요소가 바이러스계 유전자 전달 시스템을 만드는데 관여된다: 첫째, 구조 단백질 뿐 아니라 바이러스 벡터 입자를 생성하는데 필요한 효소를 포함하는 패키징 플라스미드, 및 둘째, 바이러스 벡터 그 자체, 즉 전달될 유전 물질. 생안전성 안전장치가 이들 요소 중 하나 또는 양자 모두의 설계에 도입될 수 있다. 몇 가지 구현예에 있어서, 상기 패키징 플라스미드는 엔벨로프 단백질 외 모든 HIV-1 단백질을 함유할 수 있다 (Naldini et al., 1998). 몇 가지 구현예에 있어서, 바이러스 벡터는 추가적인 바이러스 유전자, 예컨대 독성과 관련된 것들, 예컨대 vpr, vif, vpu 및 nef, 및/또는 HIV의 1차트랜스 활성인자 (transactivator)인 Tat을 결여할 수 있다. 몇 가지 구현예에 있어서, 렌티바이러스 벡터, 예컨대 HIV계 렌티바이러스 벡터를 위한 패키징 시스템은 부모 바이러스의 단 3가지 유전자: gag, pol 및 rev를 함께 포함하는 독립적인 패키징 플라스미드를 포함하는데, 이는 재조합을 통한 야생형 바이러스의 재구성 가능성을 감소시키거나 제거한다.

[0179] 상기 제공되는 바이러스 벡터의 몇 가지 측면에 있어서, 프로모터의 제어 하에 상기 전이유전자를 함유하는 발현 카세트의 일부로서 제공되는 것과 같은 재조합 단백질을 코딩하는 상기 이종 핵산은 상기 벡터 게놈의 5' LTR과 3' LTR 서열, 예컨대 야생형 LTR 또는 그의 일부분 또는 키메라 일부 사이에 함유되고 및/또는 위치한다. 몇 가지 구현예에 있어서, 상기 바이러스 벡터, 예컨대 HIV 바이러스 벡터는 추가적인 전사 유닛을 결여한다. 몇 가지 구현예에 있어서, 상기 벡터 게놈은 상기 바이러스 벡터 RNA를 생성하는데 사용되는 DNA의 3' LTR의 U3 영역에 결실을 포함하는데, 이는 자가-비활성화 (SIN) 벡터를 생성할 수 있다. 이러한 결실은 그 후, 역전사 중에 프로바이러스 (proviral) DNA의 5' LTR로 이동될 수 있다. 몇 가지 구현예에 있어서, 상기 3' LTR은 U3의 프로모터와 인핸서를 위하여 결실된다. 몇 가지 구현예에 있어서, 상기 LTR의 전사 활성을 없애기 위하여 TATA 박스의 제거를 포함하여, 충분한 서열이 제거될 수 있다. 이것은 형질도입된 세포에서 전장 길이 벡터 RNA의 생성을 방지할 수 있다. 따라서, 몇 가지 구현예는 상기 DNA의 3' LTR의 U3 영역에 결실을 포함한다. 몇 가지 구현예에 있어서, 이것은 벡터 역가 또는 상기 벡터의 시험관 내 또는 생체 내 성질에 영향을 미치지 않는다.

[0180] 몇 가지 구현예에 있어서, 상기 바이러스 벡터 게놈은 또한 추가적인 유전자 요소를 함유할 수 있다. 컨스트럭트 내에 포함될 수 있는 요소 유형은 어떠한 방식으로도 국한되지 않고, 이 기술 분야의 숙련자에 의하여 선택될 수 있다. 몇 가지 구현예에 있어서, 상기 벡터 게놈은 DNA 또는 RNA 합성 및 처리를 위한 인식 신호를 촉진하거나 제공하는 상기 게놈의 비-코딩 영역인 바이러스 게놈 (예컨대, 렌티바이러스 게놈)으로부터 유래하는 서열을 함유한다. 몇 가지 구현예에 있어서, 이러한 서열은 패키징 또는 캡시드 이입 (encapsidation), 역전사 및 전사 및/또는 유전자 전이 또는 혼힙에 관여될 수 있는 시스-작용성 서열을 포함할 수 있다. 몇 가지 구현예에 있어서, 상기 바이러스 벡터의 일부로서 제공되는 시스-활성화 서열은 동일한 렌티바이러스 또는 레트로바이러스-유사 생물로부터 유래한다.

[0181] 몇 가지 구현예에 있어서, 표적 세포 내 바이러스 게놈의 핵 진입을 촉진하는 신호가 포함될 수 있다. 이러한 신호의 예시가 바이러스 벡터 게놈, 예컨대 렌티바이러스 벡터 게놈의 pol 유전자의 일부인 cPPT 및 CTS 요소들로부터 형성되는 Flap 서열 (DNA Flap 서열이라고도 불림)이다. 몇 가지 구현예에 있어서, Flap 서열은 cPPT 및/또는 CTS 영역을 함유하는 바이러스 핵산의 일부분을 포함하지만, 여기서 Flap 기능에 필요치 않은 pol 유전자의 5' 및 3' 일부분은 결실되어 있다. 몇 가지 경우에 있어서, 상기 바이러스 벡터는 기능적 Flap 영역을 함유하지 않는다. 후술하듯이, 몇 가지 구현예에 있어서, 바이러스 벡터는 cPPT 및 CTS 영역 중 하나 또는 양자 모두의 전부 또는 일부분을 결여하는 변이체 Flap을 함유하는 바이러스 핵산을 함유한다.

[0182] 몇 가지 구현예에 있어서, 상기 렌티바이러스 벡터 게놈은 스플라이스 주개 부위 (SD), 스플라이스 받개 부위 (SA) 및/또는 Rev-반응성 요소 (RRE) 중에서 선택되는 요소를 함유할 수 있다. 몇 가지 구현예에 있어서, RRE는, 바이러스 패키징 중에 헬퍼 플라스미드의 일부로서 제공되는 Rev 단백질의 결합 후 핵으로부터 세포질로의 바이러스 메신저 RNA의 수송을 가능하게 하기 위하여 제공된다. 몇 가지 구현예에 있어서, 상기 벡터 게놈은 사이 (Ψ) 패키징 신호를 함유할 수 있는데, 이는, 몇 가지 경우에, gag ORF의 N-말단 단편으로부터 유래할 수 있다. 몇 가지 구현예에 있어서, 상기 사이 패키징 신호 서열은, 전이유전자의 그것에 대해 가능한 gag 펩타이드의 임의의 전사/번역 간섭을 방지하기 위하여 프레임시프트 돌연변이(들)로 변형될 수 있다.

[0183] 몇 가지 구현예에 있어서, 상기 벡터 게놈의 5' 및 3' LTR 서열 사이에 순서대로 다음을 함유하는 재조합 게놈을 함유하는 바이러스 벡터, 예컨대 렌티바이러스 벡터가 제공된다: RRE; 재조합 단백질을 코딩하는 폴리뉴클레오티드의 발현을 제어하는 프로모터의 상류에 삽입되는 cPPT 및 CTS를 함유하는 기능적 DNA Flap을 포함하는 바이러스 핵산을 함유하는 폴리뉴클레오티드; 상기 재조합 단백질, 예컨대 전술한 것들 중 하나를 코딩하는 폴리뉴클레오티드 및 상기 재조합 단백질, 예컨대 항원 수용체 (예컨대, CAR)을 코딩하는 폴리뉴클레오티드의 발현을 제어하는 프로모터를 함유하는 전이유전자; 및 본 발명에서 제공되는 임의의 것과 같은 상기 재조합 단백질을 코딩하는 핵산에 작동적으로 연결된, 본 발명에서 제공되는 임의의 것과 같은 변형된 PRE를 함유하는 폴리뉴클레오티드. 몇 가지 구현예에 있어서, 상기 재조합 게놈은 서열 5' LTR-RRE-cPPT-CTS-전이유전자(들)-변형된 PRE-3' LTR를 포함한다. 몇 가지 구현예에 있어서, 상기 바이러스 벡터, 예컨대 렌티바이러스 벡터 내의 변형된 PRE는 SEQ ID NOS: 29-43, 59-73, 89-118, 126-140, 156-170 또는 186-215 중 하나에 기재된 뉴클레오티드 서열을 갖는다. 몇 가지 구현예에 있어서, 상기 변형된 PRE는 EQ ID NO:29 또는 SEQ ID NO:126에 기재된 뉴클레오티드 서열이거나 그를 포함한다. 몇 가지 구현예에 있어서, 상기 cPPT 및 CTS는 비변형된 또는 야생형 DNA Flap을 함유하는 바이러스 핵산 서열의 단편, 예컨대 SEQ ID NO:121에 기재되는 예시적 서열이거나 이를 포함하는 것 또는 상기 cPPT 및 CTS 서열을 함유하는 그 기능적 단편으로서 삽입된다. 몇 가지 구현예에 있어서, 상기 렌티바이러스 벡터는 HIV-1 유래 렌티바이러스 벡터이다.

[0184] 몇 가지 구현예에 있어서, 바이러스 벡터를 포함하는, 상기 제공되는 폴리뉴클레오티드 중에서, 바이러스 Flap 서열에 변경을 함유하는 것들이 있다 ("변이체 Flap" 폴리뉴클레오티드 또는 서열이라고 여김). 이러한 폴리뉴클레오티드는 상기 폴리뉴클레오티드 내 바이러스 Flap 서열 내에 하나 이상의 변형, 예컨대 결실(들)을 함유하는 것들을 포함한다. 상기 변경은 상기 폴리뉴클레오티드의 바이러스 서열 내에, 바이러스 Flap 서열, 또는 그의 하위 부분의 완전한 결실을 포함할 수 있다. 이러한 폴리뉴클레오티드는 이러한 변이체 Flap 서열을 함유하는 바이러스 벡터, 예컨대 렌티바이러스 벡터를 포함한다.

[0185] 일반적으로, 바이러스 Flap 서열은 두 가지 요소를 포함하는 폴리뉴클레오티드 서열을 함유하는 바이러스 조절 영역이다: 중앙 폴리퓨린 트랙 (cPPT) 및 중앙 종결 서열 (CTS). 예컨대, Iglesias et al., Retrovirology 2011, 8:92 참조. 비제한적, 예시적 cPPT 서열이 SEQ ID NO:123에 제공된다. 비제한적, 예시적 CTS 서열이 SEQ ID NO:124에 제공된다. 예시적 야생형 HIV-1에 있어서, 상기 cPPT 및 CTS는 대략 70-100 뉴클레오티드에 의하여 작동적으로 연결될 수 있다. 상기 cPPT 및 CTS는 상기 렌티바이러스 벡터 게놈의 중앙 또는 약 중앙에 위치하는데, 그로써 역전사 후 상기 cPPT 및 CTS 서열에 의하여 코딩되는 DNA가 대략 100개 뉴클레오티드 중첩, 또는 "DNA Flap"을 상기 게놈의 중앙에 형성한다. 바이러스 벡터, 예컨대 렌티바이러스 유래 벡터에 삽입되는 경우, 역-전사 중에 생성되는 DNA Flap을 허하는 상기 폴리뉴클레오티드는 유전자 전이 효율을 자극하고, 야생형 수준으로 핵 도입 수준을 보완한다.

[0186] 몇 가지 구현예에 있어서, 상기 변이체 Flap 폴리뉴클레오티드는 야생형 또는 비변형된 Flap 서열을 참조할 때, CTS, cPPT, CTS와 cPPT 양자 모두의 뉴클레오티드 전부 또는 그 일부의 결실을 함유한다. 몇 가지 구현예에 있어서, 야생형 또는 비변형된 Flap 서열의 서열은, 레트로바이러스, 예컨대 렌티바이러스로부터 유래하는, 또는 레트로바이러스-유사 생물로부터 유래하는 cPPT 및 CTS를 함유하는 바이러스 핵산 서열, 예컨대 레트로트랜스포존 (retrotransposon)이다. 몇 가지 구현예에 있어서, 야생형 또는 비변형된 Flap의 서열은 인간 레트로바이러스 또는 렌티바이러스, 예컨대 HIV 레트로바이러스 (예컨대, HIV-1 또는 HIV-2)로부터 유래한다. 몇 가지 구현예에 있어서, 야생형 또는 비변형된 DNA Flap 서열은 CAEV 바이러스 (Caprine Arthritis Encephalitis Virus), EIAV 바이러스 (Equine Infectious Anaemia Virus), VI SNA 바이러스, SIV 바이러스 (Simian Immunodeficiency Virus) 또는 FIV 바이러스 (Feline Immunodeficiency Virus)로부터 유래한다. 몇 가지 구현예에 있어서, 상기 야생형 또는 비변형된 Flap을 함유하는 바이러스 핵산 서열은 상기 바이러스 게놈에 존재하는 추가적인 측면 서열을 함유할 수 있다. 몇 가지 구현예에 있어서, 야생형 또는 비변형된 Flap을 함유하는 상기 폴리뉴클레오티드는, 그 기원 및 제조에 따라, 약 80 내지 약 200개 뉴클레오티드 서열을 가질 수 있다. 몇 가지 구현예에 있어서, 상기 야생형 또는 비변형된 Flap 서열은 합성에 의하여 (화학적 합성) 또는 임의의 레트로바이러스, 예컨대 렌티바이러스 핵산으로부터의 Flap을 함유하는 폴리뉴클레오티드의 증폭에 의하여, 예컨대 폴리머라아제 중쇄 반응 (PCR)에 의하여 제조될 수 있다.

[0187] 몇 가지 구현예에 있어서, 야생형 또는 비변형된 Flap 서열은 HIV-1에 존재하는 폴리뉴클레오티드 서열, 예컨대 예시적 HIV-1 벡터 pNL4-3 (GenBank No. AF324493)의 위치 4757 내지 4935부터의 178개 염기쌍 단편 또는 위치 4746 내지 4935부터의 179개 염기쌍 단편, 또는 역전사시 상기 Flap을 생성할 수 있는 cPPT 및 CTS을 함유하는 그 안에 존재하는 더 짧거나 더 긴 서열로부터 유래될 수 있다. 몇 가지 구현예에 있어서, 야생형 또는 비변형된 Flap을 함유하는 예시적 폴리뉴클레오티드 서열은 역전사시 상기 Flap 구조를 생성하기 위한 상기 cPPT 및 CTS을 함유하는, SEQ ID NO:121에 기재되는 서열, SEQ ID NO:121과 85%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 상동성을 나타내는 서열 또는 그 기능적 단편이거나 그를 포함한다. 몇 가지 구현예에 있어서, 상기 cPPT는 SEQ ID NO:121의 뉴클레오티드 30-45 (SEQ ID NO:123에 기재)에 대응하는 서열이거나 이를 포함하고, 상기 CTS는 SEQ ID NO:121의 뉴클레오티드 117-143 (SEQ ID NO:124에 기재)에 대응하는 서열이거나 이를 포함한다.

[0188] 변이체, 예컨대 결실된, Flap 서열을 포함하는 상기 제공되는 폴리뉴클레오티드 또는 바이러스 벡터의 몇 가지 구현예에 있어서, 상기 변이체 Flap 서열은 그 안에서 상기 벡터 내 바이러스 핵산(들)의 Flap 영역의 전부 또는 일부분, 예컨대 상기 cPPT 및/또는 CTS의 전부 또는 일부분이 결실 및/또는 돌연변이된 것일 수 있다. 몇 가지 구현예에 있어서, 상기 변이체 Flap 서열은 전체 Flap 서열 또는 그 일부분을 완전히 결여 또는 실질적으로 결여하는 바이러스 서열을 포함한다. 몇 가지 구현예에 있어서, 상기 변이체 Flap은 cPPT, CTS, 또는 cPPT와 CTS 양자 모두의 결실(들)을 함유한다. 몇 가지 구현예에 있어서, 상기 변이체 Flap은 야생형 또는 비변형된 cPPT 서열과 비교하여, 예컨대 SEQ ID NO:123에 기재되는 예시적 비변형된 cPPT 서열과 비교하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 또는 16개 이상의 뉴클레오티드 결실을 갖는 cPPT를 함유할 수 있는데, 이들은 인접한 뉴클레오티드 결실일 수 있다. 몇 가지 구현예에 있어서, 상기 cPPT는 전체로 결실될 수 있다. 몇 가지 구현예에 있어서, 상기 변이체 DNA Flap은 야생형 또는 비변형된 CTS 서열과 비교하여, 예컨대 SEQ ID NO:124에 기재되는 예시적 비변형된 CTS 서열과 비교하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 또는 27개 이상의 뉴클레오티드 결실을 갖는 CTS를 함유할 수 있는데, 이들은 인접한 뉴클레오티드 결실일 수 있다. 몇 가지 구현예에 있어서, 상기 CTS는 전체로 결실될 수 있다.

[0189] 몇 가지 구현예에 있어서, 상기 변이체 Flap 폴리뉴클레오티드는 상기 cPPT의 전부 또는 인접한 일부분의 결실을 함유하고 야생형 CTS를 함유한다. 몇 가지 구현예에 있어서, 상기 변이체 Flap 폴리뉴클레오티드는 야생형 cPPT를 함유하고 상기 CTS의 전부 또는 인접한 일부분의 결실을 함유한다.

[0190] 몇 가지 구현예에 있어서, 상기 변이체 Flap은 상기 cPPT의 전부 또는 일부분의 결실을 함유하고 상기 CTS의 전부 또는 일부분의 결실을 함유한다. 몇 가지 구현예에 있어서, 상기 변이체 DNA Flap은 야생형 또는 비변형된 cPPT 서열과 비교하여, 예컨대 SEQ ID NO:123에 기재되는 예시적 비변형된 cPPT 서열과 비교하여, 인접한 뉴클레오티드 결실일 수 있는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 또는 16개 이상의 뉴클레오티드 결실을 갖는 cPPT를 함유할 수 있거나, 또는 전체로 결실된 cPPT를 가질 수 있고, 상기 변이체 DNA Flap은 야생형 또는 비변형된 CTS 서열과 비교하여, 예컨대 SEQ ID NO:124에 기재되는 예시적 비변형된 CTS 서열과 비교하여, 인접한 뉴클레오티드 결실일 수 있는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 또는 27개 이상의 뉴클레오티드 결실을 갖는 CTS를 함유할 수 있거나, 또는 전체로 결실된 CTS를 가질 수 있다.

[0191] 몇 가지 구현예에 있어서, 변이체 Flap 서열을 함유하는 상기 폴리뉴클레오티드는 SEQ ID NO:121과 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 78%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 90% 또는 95% 이상의 서열 상동성을 나타내지만, SEQ ID NO:121에 존재하는 cPPT 및/또는 CTS의 전부 또는 일부분을 결여하는 뉴클레오티드 서열이거나 이를 포함한다. 몇 가지 구현예에 있어서, 변이체 Flap 서열을 함유하는 상기 폴리뉴클레오티드는, 그 안에서 cPPT 및/또는 CTS의 전부 또는 일부분이 결실된 SEQ ID NO:122와 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 이상 또는 약 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 이상 또는 그 이상의 서열 상동성을 갖는 뉴클레오티드 서열을 갖는 일부분이거나 이를 포함하거나 이를 함유한다. 비제한적인 예시적 변이체 Flap 폴리뉴클레오티드는 SEQ ID NO:122로서 제공된다.

[0192] 몇 가지 구현예에 있어서, 제공되는 변이체 Flap 내 CTS 및/또는 cPPT의 뉴클레오티드 전부 또는 일부분의 결실은 재조합 DNA 기법에 의하여 비변형된 또는 야생형 Flap을 함유하는 폴리뉴클레오티드 서열 내로 도입된다. 몇 가지 구현예에 있어서, 상기 변이체 Flap 폴리뉴클레오티드는 예컨대 화학적 합성에 의하여 합성으로 제조된다.

[0193] 몇 가지 구현예에 있어서, 상기 폴리뉴클레오티드, 예Ozjs대 바이러스 벡터는 변이체 Flap 서열 및 PRE를 함유한다. 몇 가지 구현예에 있어서, 상기 PRE는 변형된 PRE, 예컨대 전술된 것들일 수 있다. 따라서, 몇 가지 구현예에 있어서, 상기 폴리뉴클레오티드는 변이체 Flap 폴리뉴클레오티드 및 변형된 PRE 폴리뉴클레오티드를 함유하는 뉴클레오티드 서열을 함유한다. 몇 가지 구현예에 있어서, 이러한 폴리뉴클레오티드 및/또는 바이러스 벡터는, 그 안에서 cPPT 및 CTS의 전부 또는 일부분이 결실된, SEQ ID NO: 122의 서열 또는 SEQ ID NO: 122와 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상 또는 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상의 서열 상동성을 갖는 것을 함유하고, 도입된 종결 코돈 변형을 함유하는, SEQ ID NO:29 또는 SEQ ID NO:126에 기재되는 변형된 PRE에 대한 서열 또는 SEQ ID NO:29 또는 SEQ ID NO:126과 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상 또는 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상의 서열 상동성을 갖는 것을 함유한다.

[0194] 몇 가지 구현예에 있어서, 상기 벡터 게놈의 5' 및 3' LTR 서열 사이에 순서대로 다음을 함유하는 재조합 게놈을 함유하는 바이러스 벡터, 예컨대 렌티바이러스 벡터가 제공된다: RRE; 재조합 단백질을 코딩하는 폴리뉴클레오티드의 발현을 제어하는 프로모터의 상류에 삽입되는 cPPT 및 CTS의 전부 또는 일부의 결실을 함유하는 변이체 DNA Flap을 포함하는 바이러스 핵산을 함유하는 폴리뉴클레오티드; 상기 재조합 단백질, 예컨대 전술한 것들 중 하나를 코딩하는 폴리뉴클레오티드 및 상기 재조합 단백질, 예컨대 항원 수용체 (예컨대, CAR)을 코딩하는 폴리뉴클레오티드의 발현을 제어하는 프로모터를 함유하는 전이유전자; 및 본 발명에서 제공되는 임의의 것과 같은 상기 재조합 단백질을 코딩하는 핵산에 작동적으로 연결된, 본 발명에서 제공되는 임의의 것과 같은 변형된 PRE를 함유하는 폴리뉴클레오티드. 몇 가지 구현예에 있어서, 상기 재조합 게놈은 서열 5' LTR-RRE-변이체 DNA Flap-전이유전자(들)-변형된 PRE-3' LTR를 포함한다. 몇 가지 구현예에 있어서, 상기 바이러스 벡터, 예컨대 렌티바이러스 벡터 내의 변형된 PRE는 SEQ ID NOS: 29-43, 59-73, 89-118, 126-140, 156-170 또는 186-215 중 하나에 기재된 뉴클레오티드 서열을 갖는다. 몇 가지 구현예에 있어서, 상기 변형된 PRE는 EQ ID NO:29 또는 SEQ ID NO:126에 기재된 뉴클레오티드 서열이거나 그를 포함한다. 몇 가지 구현예에 있어서, 변이체 DNA Flap을 함유하는 바이러스 핵산을 함유하는 상기 폴래뉴클레오티드는 SEQ ID NO:122에 기재되는 뉴클레오티드 서열이거나 그를 포함한다. 몇 가지 구현예에 있어서, 상기 렌티바이러스 벡터는 HIV-1 유래 렌티바이러스 벡터이다.

[0195] 몇 가지 구현예에 있어서, 제공되는바 변이체 DNA Flap 및/또는 제공되는바 변형된 PRE를 함유하는 폴리뉴클레오티드, 예컨대 바이러스 벡터는 재조합 또는 이종 단백질의 형질도입 및 발현을 위하여 그에 함유되는 그러한 단백질을 코딩하는 핵산 분자를 세포 내로 전이시키기 위하여 사용될 수 있다. 몇 가지 구현예에 있어서, 여전히 성공적인 세포의 형질도입을 결과하지만, 이러한 상기 제공되는 바이러스 벡터에 의한 형질도입은, 몇 가지 경우에 있어서, 실질적으로 동일한 게놈을 함유하지만 DNA Flap 구조의 형성을 위하여 cPPT 및 CTS가 존재하는 비변형된 또는 야생형 DNA Flap 서열을 함유하는 대응하는 바이러스 벡터의 동일 또는 실질적으로 유사한 양과 농도를 이용한 형질도입에 비하여 형질도입이 적은 또는 감소된, 예컨대 1.1-배, 1.2-배, 1.5-배, 2.0-배, 3.0-배, 4.0-배 또는 약 1.1-배, 1.2-배, 1.5-배, 2.0-배, 3.0-배, 4.0-배 또는 그보다 큰 배수 이하인 형질도입일 수 있다. 몇 가지 구현예에 있어서, 더 높은 형질도입 효율을 원한다면, 세포에 형질도입하기 위해 사용되는 바이러스 벡터의 부피 또는 농도를 증가시킴으로써 형질도입 효율을 증가시킬 수 있다. 다른 경우에 있어서, 형질도입된 세포 수는 세포 선별 (sorting) 및 형질도입된 세포의 증식에 의하여 농축 또는 증가될 수 있다.

[0196] 몇 가지 구현예에 있어서, 상기 벡터는 또한 숙주 세포, 예컨대 원핵 숙주 세포에서의 전파를 위한 서열을 함유할 수 있다. 몇 가지 구현예에 있어서, 상기 바이러스 벡터의 핵산은 원핵 세포, 예커대 박테리아 세포에서의 전파를 위한 하나 이상의 복제 기점을 함유한다. 몇 가지 구현예에 있어서, 원핵 복제 기점을 포함하는 벡터는 또한 그 발현이 약물 내성과 같은 검출가능한 또는 선별가능한 마커를 나타내는 유전자를 함유할 수 있다.

3. 바이러스 벡터 입자의 제조

[0197] 몇 가지 구현예에 있어서, 핵산, 예컨대 원하는 서열, 예컨대 폴리뉴클레오티드 또는 발현 카세트를 코딩하는 핵산은, 복제 결함인 바이러스를 만들기 위하여 특정한 바이러스 서열을 대신하여 바이러스 게놈 내에 삽입될 수 있다. 비리온을 만들기 위하여, gag, pol, 및 env 유전자를 함유하지만 LTR 및 패키징 요소는 없는 패키징 세포주가 제작될 수 있다. 변형된 PRE의 작동적 제어 하에서 재조합 단백질을 코딩하는 핵산을 함유하는 폴리뉴클레오티드, 예컨대 발현 카세트를 함유하는 재조합 플라스미드가 또한 이용될 수 있다. 레트로바이러스 LTR 및 패키징 서열과 함께 재조합 플라스미드가 특별한 세포주 내로 도입되면 (예컨대, 칼슘 포스페이트 침전에 의하여), 상기 패키징 서열은 상기 재조합 플라스미드의 RNA 전사체가 바이러스 입자 내로 패키징되는 것을 허할 수 있고, 이는 그 후 배양 배지 내로 분비될 수 있다. 몇 가지 구현예에 있어서, 상기 재조합 레트로바이러스를 함유하는 배지는 그 후 수집되어, 필요에 따라 농축되고 유전자 전이를 위하여 사용된다.

[0198] 몇 가지 구현예에 있어서, 패키징 세포주는 상기 입자 생성에 필요한 요소들을 함유하는 하나 이상의 플라스미드 벡터로 트랜스펙션된다. 상기 패키징 세포주는 렌티바이러스 입자 생성을 가능케 하기 위하여 필수 렌티바이러스 (예컨대, HIV-1) 유전자를 발현 또는 발현토록 만들어질 수 있다. 이들 유전자는 몇 개의 플라스미드에 의하여 발현될 수 있다. 몇 가지 구현예에 있어서, 다수의 벡터가 이용되어 상기 레트로바이러스 벡터 입자를 생성하는 다양한 유전자 요소를 분리한다. 이러한 몇 가지 구현예에 있어서, 상기 패키징 세포에 개별적인 벡터들을 제공하는 것은 달리 복제 경쟁적 바이러스를 생성할 수도 있는 재조합 사건의 확률을 낮춘다.

[0199] 몇 가지 구현예에 있어서, 패키징 세포주는 시스-작용성 사이 (Y) 패키징 서열 및 표적 세포 혼입을 가능하기 하는 상기 렌티바이러스 LTR 사이에 삽입된 전이유전자를 함유하는 렌티바이러스 발현 플라스미드; 패키징 플라스미드 또는 pol, gag, rev 및/또는 tat 바이러스 유전자를 코딩하는, 몇 가지 경우에 있어서는 rev-반응성 요소 (RRE)를 함유하는 플라스미드 및 수도타이핑 (pseudotyping) 플라스미드, 예컨대 엔벨로프 단백질, 예컨대 수포성 구내염 바이러스 (VSV-G) 엔벨로프 유전자의 G 단백질을 코딩하는 플라스미드로 트랜스펙션될 수 있다.

[0200] 몇 가지 구현예에 있어서, 패키징 세포주는, 바이러스 효소적 및/또는 구조적 요소, 예컨대 Env, Gag, pol 및/또는 rev를 코딩하는 몇 가지 헬퍼 플라스미드와 함께, LTR, 시스-작용성 패키징 서열 및 대상 서열, 즉 재조합 단백질을 코딩하는 핵산 (예컨대, 항원 수용체, 예컨대 CAR)을 포함하는, 바이러스 벡터 게놈을 함유하는 플라스미드로 트랜스펙션된다. 몇 가지 구현예에 있어서, 구조적 및 효소적 요소들을 코딩하는 gag 및 pol 유전자를 함유하는 GagPol 패키징 플라스미드 및 Rev 조절 단백질을 코딩하는 rev 유전자를 함유하는 Rev 플라스미드는 패키징 세포주에 별개로 도입된다. 몇 가지 구현예에 있어서, 모든 레트로바이러스 ㅅ성분을 갖는 하나의 플라스미드 벡터가 이용될 수 있다. 몇 가지 구현예에 있어서, env 유전자를 코딩하는 엔벨로프 플라스미드가 또한 도입될 수 있는데, 이는, 몇 가지 경우에 있어서, 대체 Env 단백질과 수도타입을 이루는 바이러스 입자를 결과할 수 있다. 몇 가지 구현예에 있어서, 상기 레트로바이러스 벡터 입자, 예컨대 렌티바이러스 벡터 입자는 숙주 세포의 형질도입 효율을 높이기 위하여 수도타입화된다. 예컨대, 레트로바이러스 벡터 입자, 예컨대 렌티바이러스 벡터 입자는 VSV-G 당단백질과 수도타입회되는데, 이는 형질도입될 수 있는 세포 유형이 확장된, ㄱ고광범위한 세포 숙주 범위를 제공한다.

[0201] env 유전자는 임의의 적절한 바이러스, 예컨대 레트로바이러스로부터 유래할 수 있다. 몇 가지 구현예에 있어서, 상기 env는 인간 및 다른 종 세포의 형질도입을 가능하게 하는 암포트로픽 (amphotropic) 엔벨로프 단백질이다. 몇 가지 구현예는 레트로바이러스-유래 env 유전자를 이용하는데, 예컨대: 몰로니 쥐과 백혈병 바이러스 (MoMuLV 또는 MMLV), 하비 쥐과 육종 바이러스 (HaMuSV 또는 HSV), 쥐과 유방 종양 바이러스 (MuMTV 또는 MMTV), 긴팔 원숭이 백혈병 바이러스 (GaLV 또는 GALV), 인간 면역결핍 바이러스 (HIV) 및 라우스 육종 바이러스 (RSV)를 들 수 있으나 이에 국한되는 것은 아니다. 몇 가지 구현예에 있어서, 다른 env 유전자, 예컨대 수포성 구내염 바이러스 (VSV) 단백질 G (VSVG), 헤파티티스 바이러스의 그것, 및 인플루엔자의 그것 역시 사용될 수 있다.

[0202] 몇 가지 구현예에 있어서, 상기 바이러스 env 핵산 서열을 제공하는 패키징 플라스미드는 조절 서열, 예컨대 프로모터 또는 인핸서와 작동적으로 연결되어 결합된다. 몇 가지 구현예에 있어서, 상기 조절 서열은 임의의 진핵 므로모터 또는 인핸서, 예컨대 EF1α, PGK, 몰로니 쥐과 백혈병 바이러스 프로모터-인핸서 요소, 인간 거대세포바이러스 인핸서, 백시니아 P7.5 프로모터 또는 등등일 수 있다. 몰로니 쥐과 백혈병 바이러스 프로모터-인핸서 요소와 같은 몇 가지 경우에 있어서, 그 프로모터-인핸서 요소는 상기 LTR 서열 내 또는 그에 인접하여 위치한다. 몇 가지 구현예에 있어서, 상기 조절 서열은 그로부터 상기 벡터가 구축되는 렌티바이러스에 내인성이지 않은 것이다. 따라서, 상기 벡터가 SIV로부터 만들어진 것이면, SIV LTR에서 발견되는 SIV 조절 서열은 SIV로부터 기원하지 않는 조절 요소에 의하여 교체될 수 있다.

[0203] 몇 가지 구현예에 있어서, 상기 바이러스 벡터 및 패키징 플라스미드는 상기 패키징 세포주 내로 트랜스펙션 또는 감염을 통하여 도입된다. 상기 패키징 세포주는 상기 바이러스 벡터 게놈을 함유하는 바이러스 벡터 입자를 생성한다. 트랜스펙션 또는 감염 방법은 잘 알려져 있다. 비제한적인 예시로는 칼슘 포스페이트, DEAE-덱스트란 및 리포펙션 방법, 전기천공 및 마이크로인젝션을 들 수 있다. 패키징 플라스미드와 전이 벡터의 패키징 세포주로의 공트랜스펙션 이후, 상기 바이러스 벡터 입자는 배양 배지로부터 회수되어 이 기술 분야의 숙련자들에 의하여 사용되는 표준 방법으로 역가 측정된다. 따라서, 몇 가지 구현예에 있어서, 상기 패키징 플라스미드는 이들 방법에 의하여, 일반적으로 우위 선별 마커 (dominant selectable marker), 예컨대 네오마이신, DHFR, 글루타민 합성효소 또는 ADA와 함께 인간 세포도 도입되고, 적절한 약제의 존재 하에서의 선별 및 클론의 단리가 뒤따른다. 상기 선별 유전자는 상기 구조체 내에서 상기 패키징 유전자와 물리적으로 연결될 수 있다.

[0204] 몇 가지 구현예에 있어서, 바이러스 벡터 입자는, 상기 패키징 기능이 발현되도록 구성된, 안정한 세포주에 의하여 생성될 수 있다. 적절한 패키징 세포는, 예컨대 U.S. Pat. No. 5,686,279; 및 Ory et al., (1996)에 알려져 있다. 그 안에 포함된 렌티바이러스 벡터를 갖는 패키징 세포는 생산자 세포 (producer cell)를 형성한다. 따라서, 생산자 세포는 관심 대상 유전자를 옮기는 바이러스 벡터 입자를 생산하거나 방출할 수 있는 세포 또는 세포주이다. 몇 가지 구현예에 있어서, 이들 세포는 또한 정박지 (anchorage) 의존성일 수 있는데, 이는 이들 세포가 유리나 플라스틱과 같은 표면에 부착시에 성장, 생존 또는 최적으로 기능을 유지할 것이라는 것을 의미한다. 몇 가지 구현예에 있어서, 상기 생산자 세포는 신생물적으로 (neoplastically) 형질전환된 세포일 수 있다. 몇 가지 구현예에 있어서, 상기 렌티바이러스 벡터 및 패키징 플라스미드로 트랜스펙션하기 위한 숙주 세포는, 예컨대 포유류 1차 세포; 확립된 포유류 세포주, 예컨대s COS, CHO, HeLa, NIH3T3, 293T 및 PC12 세포; 양서류 세포, 예컨대 개구리 (Xenopus) 배아 및 난모세포; 다른 척추동물 세포; 곤충 세포 (예컨대, 초파리 (Drosophila)), 효모 세포 (예컨대, S. cerevisiae, S. pombe, 또는 Pichia pastoris) 및 원핵 세포 (예컨대, E. coli)를 포함한다.

[0205] 몇 가지 구현예에 있어서, 렌티바이러스 벡터는, 렌티바이러스 입자의 생성을 가능케 하는 플라스미드의 도입에 의하여, 패키징 세포주, 예컨대 예시적 HEK 293T 세포주에서 생산될 수 있다. 세포, 예컨대 HEK 293T 세포의 트랜스펙션 대략 2일 후, 상기 세포 상층액은 재조합 렌티바이러스 벡터를 함유하고, 이는 표적 세포를 형질도입하기 위하여 사용될 수 있다. 일단 표적 세포 내에서, 상기 바이러스 RNA는 역전사되고 핵으로 인입되며 숙주 게톰 내로 안정적으로 끼어들어 간다. 바이러스 RNA가 끼어들어간 1일 또는 2일 후, 상기 재조합 단백질의 발현은 검출될 수 있다.

D. 세포 생산 방법 및 조작 방법

[0206] 또한, 변형된 PRE를 함유하는 폴리뉴클레오티드 및/또는 그를 함유하는 카세트, 벡터, 및/또는 조작된 세포를 생산하는 방법이 제공된다. 몇 가지 구현예에 있어서, 상기 방법은 상기 변형(들)을 야생형 또는 비변형된 PRE 서열 또는 다른 개시 변현된 PRE 서열, 예컨대 특정 수준의 활성을 갖는 것으로 알려진 것으로 도입하는 단계를 포함한다. 몇 가지 구현예에 있어서, 이러한 변형은 기존의 벡터를 돌연변이시킴으로써 유효하다.

[0207] 상기 방법은 또한, 세포에 본 발명에서 제공되는바 재조합 분자, 예컨대 재조합 단백질, 예컨대 이종 단백질, 예컨대 항원 수용체, 예컨대 TCR 또는 CAR 또는 다른 키메라 수용체를 코딩하는 핵산과 작동적으로 연결되는, 변형된 PRE를 함유하는 폴리뉴클레오티드를 도입함으로써 세포를 조작하는 방법을 포함한다. 상기 폴리뉴클레오티드는, 그 게놈에 상기 제공되는 폴리뉴클레오티드, 예컨대 상기 재조합 분자, 예컨대 이종 단백질을 코딩하는 핵산을 함유하는 바이러스 벡터 입자의 맥락에서 상기 세포 안으로 도입될 수 있다. 또한, 상기 변형된 PRE를 갖는 상기 폴리뉴클레오티드, 카세트 및/또는 벡터 및 그를 함유하고 및/또는 상기 제공되는 방법에 의하여 생산되는 핵산 및 조성물이 제공된다.

[0208] 상기 세포는 일반적으로 진핵 세포, 예컨대 포유류 세포, 및 통상적으로 인간 세포이다. 몇 가지 구현예에 있어서, 상기 세포는 혈액, 골수, 림프 또는 림프 기관으로부터 유래되고, 면역계 세포, 예컨대 선천성 또는 후천성 면역 세포, 예컨대 골수 또는 림프 세포, 예컨대 림프구, 통상 T 세포 및/또는 NK 세포이다. 다른 예시적 세포로 줄기 세포, 예컨대 다능성 (multipotent and pluripotent) 줄기 세포, 예컨대 유도 다능성 줄기 세포 (iPSCs)를 들 수 있다. 몇 가지 구현예에 있어서, 상기 세포는 1차 세포, 예컨대 대상체로부터 직접적으로 단리된 것들 및/또는 대상체로부터 단리되고 냉동된 것들이다. 몇 가지 구현예에 있어서, 상기 세포들은 하나 이상의 하위세트의 T 세포 또는 다른 세포 유형을 포함하는데, 예컨대 전체 T 세포 집단, CD4+ 세포, CD8+ 세포, 및 그들의 하위집단, 예컨대 기능, 활성화 상태, 성숙도, 분화 잠재능, 증식, 재순환, 위치화, 및/또는 지속능, 항원 특이성, 항원 수용체의 유형, 특정 장기 또는 구획에서의 존재, 마커 또는 사이토 카인 분비 프로필 및/또는 분화 정도에 의하여 정의되는 것들을 포함한다. 치료될 대상체를 참조하여, 상기 세포는 동종 및/또는 자가일 수 있다. 상기 방법들 중에는, 기성 (off-the-shelf) 방법이 포함된다. 기성 방식과 같은 몇 가지 측면에 있어서, 상기 세포는 다능성 (pluripotent and/or multipotent), 예컨대 줄기 세포, 예컨대 유도 다능 줄기 세포 (iPSCs)이다. 몇 가지 구현예에 있어서, 상기 방법은 세포를 냉동보존 전 또는 후에, 상기 대상체로부터 단리, 준비, 처리, 배양, 및/또는 조작하고, 이들을 상기 동일한 대상체 내로 재도입하는 단계를 포함한다.

[0209] T 세포의 및/또는 CD4+의 및/또는 CD8+ T 세포의 하위-유형 또는 하위집단 중에는 순수한 (naive) T 세포 (T_N), 효과자 T 세포 (T_EFF), 기억 T 세포 및 그들의 하위-유형인, 예컨대 줄기세포 기억 T 세포 (T_SCM), 중앙 기억 T 세포 (T_CM), 효과자 메모리 T 세포 (T_EM), 또는 최종 분화된 효과자 기억 T 세포, 종양-침윤 림프구 (TIL), 미성숙 T 세포, 성숙 T 세포, 헬퍼 T 세포, 세포독성 T 세포, 점막-관련 불변 (MAIT) 세포, 천연적으로 존재하고 후천적인 조절 T (Treg) 세포, 헬퍼 T 세포, 예컨대 TH1 세포, TH2 세포, TH3 세포, TH17 세포, TH9 세포, TH22 세포, 여포성 헬퍼 T 세포 (follicular helper T cell), 알파/베타 T 세포, 및 델타/감마 T 세포가 있다.

[0210] 몇 가지 구현예에 있어서, 상기 세포는 자연 살해 (NK) 세포이다. 몇 가지 구현예에 있어서, 상기 세포는 단핵구 또는 과립구, 예컨대 골수 세포, 대식세포, 호중구, 수지상 세포, 비만 세포, 호산구 및/또는 호염구이다.

[0211] 상기 유전자 조작은 일반적으로 전술한 바와 같이 예컨대 레트로바이러스 형질도입, 트랜스펙션 또는 형질전환에 의한 상기 폴리뉴클레오티드(들)의 상기 세포로의 도입을 포함한다.

[0212] 몇 가지 구현예에 있어서, 유전자 전이는 우선 상기 세포를, 예컨대 증식, 생존 및/또는 활성화, 예컨대 사이토카인 또는 활성화 마커의 발현으로 측정되는 활성화와 같은 반응을 유도하는 자극과 함께 조합함으로써 그를 자극한 후, 상기 활성화된 세포의 형질도입 및 임상적 적용을 위한 충분한 수로 배양으로 증식시킴으로써 달성된다.

[0213] 어떤 맥락에서, 자극 인자 (예컨대, 림포카인 또는 사이토카인)의 과발현은 대상체에게 독성일 수 있다. 따라서, 어떤 맥락에서, 상기 조작된 세포는, 예컨대 입양 면역용법에 적용시, 상기 세포로 하여금 생체 내 음성 선택에 민감하게 하는 유전자 분절을 포함한다. 예컨대, 어떤 측면에 있어서, 상기 세포는 조작되어, 그들이 투여되는 대상체의 생체 내 조건 변화의 결과로서 그들이 제거된다. 상기 음성 선택적 표현형은 투여되는 제제, 예컨대 화합물에 대한 민감성을 부여하는 유전자의 삽입으로부터 결과할 수 있다. 음성 선택 유전자로는, 간사이클로비어 민감성을 부여하는 단순 포진 바이러스 타입 I 티미딘 키나아제 (HSV-I TK) 유전자 (Wigler et al., Cell II :223, 1977); 세포 히포크산틴 포스포리보실전달효소 (HPRT) 유전자, 세포 아데닌 포스포리보실전이효소 (APRT) 유전자, 박테리아 시토신 데아미나아제 (Mullen et al., Proc. Natl. Acad. Sci. USA. 89:33 (1992))를 들 수 있다.

[0214] 몇 가지 측면에 있어서, 상기 세포는 또한 조작되어 사이토카인 또는 기타 인자들의 발현을 촉진한다. 유전적으로 조작된 요소, 예컨대 항원 수용체, 예컨대 CAR의 도입을 위한 다양한 방법이 잘 알려져 있고 상기 제공되는 방법 및 조성물과 함께 이용될 수 있다.

[0215] 몇 가지 구현예에 있어서, 재조합 핵산은 전기천공을 통하여 T 세포 내로 전이된다 (예컨대, Chicaybam et al, (2013) PLoS ONE 8(3): e60298 and Van Tedeloo et al. (2000) Gene Therapy 7(16): 1431-1437 참조). 몇 가지 구현예에 있어서, 몇 가지 구현예에 있어서, 재조합 핵산은 전위 (transposition)을 통하여 T 세포 내로 전이된다 (예컨대, Manuri et al. (2010) Hum Gene Ther 21(4): 427-437; Sharma et al. (2013) Molec Ther Nucl Acids 2, e74; 및 Huang et al. (2009) Methods Mol Biol 506: 115-126 참조). 면역 세포에 유전 물질을 도입하고 발현하는 다른 방법으로는 칼슘 포스페이트 트랜스펙션 (예컨대, Current Protocols in Molecular Biology, John Wiley & Sons, New York. N.Y.에 기술된대로), 원형질 융합, 양이온성 리포좀-매개 트랜스펙션; 텅스텐 입자-촉진 미립자 충격 (Johnston, Nature, 346: 776-777 (1990)); 및 스트론튬 포스페이트 DNA 공-침전 (Brash et al., Mol. Cell Biol., 7: 2031-2034 (1987))을 들 수 있다.

[0216] 상기 재조합 산물을 코딩하는 핵산의 전이를 위한 다른 장치 및 벡터는, 예컨대 국제특허출원, 공개 No.: WO2014055668, 및 U.S. Patent No. 7,446,190에 기술된 것들이다.

[0217] 추가적인 핵산 중에, 예컨대 도입을 위한 유전자는, 예컨대 전이되는 세포의 생존능 및/또는 기능을 촉진함으로써 요법의 효율을 증가시키기 위한 것들이 있고; 상기 세포의 선별 및/또는 평가를 위한, 예컨대 생체 내 생존 또는 위치화를 평가하기 위한 유전자 마커를 제공하기 위한 유전자가 있고; 예컨대, 세포를, Lupton S. D. et al., Mol . and Cell Biol ., 11:6 (1991); 및 Riddell et al., Human Gene Therapy 3:319-338 (1992)에 의하여 기술된대로 생체 내 음성 선별에 민감하게 만듦으로써 안정성을 높이기 위한 유전자가 있다; 또한 우위 양성 선별 마커를 음성 선별 마커와 융합함으로써 유래되는 2기능성 선별 융합 유전자의 사용을 기술하는 Lupton et al.에 의한 간행물 PCT/US91/08442 및 PCT/US94/05601을 참조. 예컨대, Riddell et al., US Patent No. 6,040,177, 컬럼 14-17 참조.

[0218] 몇 가지 구현예에 있어서, 상기 조작된 세포의 제조는 하나 이상의 배양 및/또는 준비 단계를 포함한다. 상기 변형된 PRE를 코딩하는 핵산의 도입을 위한 세포는 시료, 예컨대 생물학적 시료, 예컨대 대상체로부터 얻어지는 또는 유래하는 것으로부터 단리될 수 있다. 몇 가지 구현예에 있어서, 그로부터 상기 세포가 단리되는 상기 대상체는 세포 치료를 요하는 질병 또는 질환을 갖거나 세포 치료가 적용될 대상체이다. 몇 가지 구현예에 있어서, 상기 대상체는 특정한 치료적 개입, 예컨대 그를 위하여 세포가 단리, 처리 및/또는 조작되는 입양 세포 치료를 필요로 하는 인간이다.

[0219] 따라서, 몇 가지 구현예에 있어서, 상기 세포는 1차 세포, 예컨대 1차 인간 세포이다. 시료는 상기 대상체로부터 직접적으로 취한 조직, 유액, 및 기타 시료들 뿐 아니라, 하나 이상의 단계, 예컨대 분리, 원심분리, 유전자 조작 (예컨대, 바이러스 벡터를 이용한 형질도입), 수세, 및/또는 배양으로부터 결과한 시료를 포함한다. 생물학적 시료는 생물학적 원으로부터 직접적으로 얻은 시료 또는 가공된 시료일 수 있다. 생물학적 시료는 체액, 예컨대, 혈액, 혈장, 혈청, 뇌척수액, 활액, 소변 및 땀, 조직 및 기관 시료, 예컨대 그들로부터 가공된 시료를 들 수 있으나 이에 국한되는 것은 아니다.

[0220] 몇 가지 측면에 있어서, 그로부터 상기 세포가 유래하거나 단리되는 시료는 혈액 또는 혈액-유래 시료이거나, 혈액분반법 또는 백혈구분반법 산물이거나 그로부터 유래하는 것이다. 예시적 시료는 전혈, 말초혈액단핵세포 (PBMC), 백혈구, 골수, 흉선, 조직 생검, 종양, 백혈병, 림프종, 림프절, 장 관련 림프 조직, 점막 관련 림프 조직, 비장, 기타 림프 조직, 간, 폐, 위, 소장, 결장, 신장, 췌장, 유방, 뼈, 전립선, 자궁 경부, 고환, 난소, 편도선 또는 기타 기관, 및/또는 그로부터 유래하는 세포를 들 수 있다. 세포 치료, 예컨대 입양 세포 치료의 맥락에서, 시료는, 자가 및 동종원으로부터의 시료를 들 수 있다.

[0221] 몇 가지 구현예에 있어서, 상기 세포는 세포주, 예컨대 T 세포주로부터 유래한다. 몇 가지 구현예에 있어서, 상기 세포는 이종원 (xenogeneic source), 예컨대 마우스, 래트, 비-인간 영장류, 및 돼지로부터 얻어진다.

[0222] 몇 가지 구현예에 있어서, 상기 세포의 단리는 하나 이상의 준비 및/또는 비-친화계 세포 분리 단계들을 포함한다. 어떤 예시에 있어서, 세포는 예컨대 원치 않는 성분을 제거, 원하는 성분을 농축, 특정 시약에 대해 민감성인 세포를 용해 또는 제거하기 위하여 하나 이상의 시약의 존재 하에서 수세, 원심분리, 및/또는 배양된다. 어떤 예시에 있어서, 세포는 하나 이상의 특성, 예컨대 밀도, 부착특성, 크기, 민감도 및/또는 특정 성분에 대한 내성에 기초하여 분리된다.

[0223] 몇 가지 예시에 있어서, 예컨대 혈액분반법 또는 백혈구분반법에 의하여 대상체의 순환하는 혈액으로부터 세포가 얻어진다. 몇 가지 측면에서, 상기 시료는 림프구, 예컨대 T 세포, 단핵구, 과립구, B 세포, 기타 유핵 백혈구, 적혈구 및/또는 혈소판을 함유하고, 어떤 측면에서는 적혈구 및 혈소판을 제외한 세포를 함유한다.

[0224] 몇 가지 구현예에 있어서, 상기 대상체로부터 수집된 적혈구는 예컨대 혈장 분분을 제거하고 그 세포를 후속하는 가공 단계를 위하여 적정한 완충액이나 배지에 놓이도록 수세한다. 몇 가지 구현예에 있어서, 상기 세포는 포스페이트 완충된 염액 (PBS)로 수세된다. 몇 가지 구현예에 있어서, 상기 수세 용액은 칼슘 및/또는 마그네슘 및/또는 많은 혹은 모든 2가 양이온을 결여한다. 몇 가지 측면에 있어서, 수세 단계는, 제조자의 지시에 따라 반-자동화 "플로우-쓰루 (flow-through)" 원심분리로 이루어진다 (예컨대, Cobe 2991 cell processor, Baxter). 몇 가지 측면에 있어서, 수세 단게는 제조자의 지시에 따라 접선 유동 여과 (tangential flow filtration, TFF)로 이루어진다. 몇 가지 구현예에 있어서, 상기 세포는 수세 후에 다양한 생체적합성 완충액에 재현탁되는데, 예컨대 Ca⁺⁺/Mg⁺⁺ 무함유 PBS에 재현탁된다. 특정한 구현예에 있어서, 혈구 시료의 성분은 제거되고 세포는 배양 배지에 직접 재현탁된다.

[0225] 몇 가지 구현예에 있어서, 상기 방법은 밀도-기반 세포 분리 방법을 포함하는데, 예컨대 적혈구 세포를 용해하여 Percoll 또는 Ficoll 구배를 통하여 원심분리함으로써 말초 혈액으로부터 백혈구를 준비한다.

[0226] 몇 가지 구현예에 있어서, 상기 단리 방법은 하나 이상의 특정 분자, 예컨대 표면 마커, 예컨대 표면 단백질, 세포내 마커 또는 핵산의 세포 내 발현 또는 존재에 기초하여 상이한 세포 유형을 분리하는 것을 포함한다. 몇 가지 구현예에 있어서, 이러한 마커에 기초한 임의의 공지된 분리 방법이 사용될 수 있다. 몇 가지 구현예에 있어서, 상기 분리는 친화도-기반 또는 면역친화도-기반 분리이다. 예컨대, 몇 가지 측면에 있어서, 상기 분리는, 일반적으로 수세 단계 및 세포의 분리가 뒤따르는, 하나 이상의 마커, 통상 세포 표면 마커의 세포의 발현 또는 발현 수준에 기초하여, 예컨대, 그러한 마커에 특이적으로 결합하는 항체 또는 결합 파트너와 함께 반응시킴으로써, 상기 항체 또는 결합 파트너와 결합되지 않은 세포들로부터 결합된 항체 또는 결합 파트너를 갖는 세포 및 세포 집단의 분리를 포함한다.

[0227] 이러한 분리 단계는, 시약에 결합한 세포가 추가 이용을 위하여 보유되는 양성 선별 및/또는 상기 항체 또는 결합 파트너에 결합하지 않은 세포가 보유되는 음성 선별에 기초될 수 있다. 몇 가지 예시에 있어서, 양 분획은 모두 추가 이용을 위하여 보유된다. 몇 가지 측면에 있어서, 이종 집단의 세포 유형을 특이적으로 확인해 낼 어떠한 항체가 없는 경우에는, 음성 선별이 특히 유용한데, 그로써 분리는 원하는 집단 외의 세포에 의하여 발현된 마커에 기초하여 가장 잘 수행된다.

[0228] 상기 분리는 특정 세포 집단이나 특정 마커를 발현하는 세포의 100% 농축 또는 제거라는 결과를 낳을 필요는 없다. 예컨대, 특정 유형, 예컨대 한 마커를 발현하는 유형의 세포의 양성 선별 또는 농축은 그러한 세포들의 수나 백분율을 증가시키는 것을 말하지, 그 마커를 발현하지 않는 세포의 완전한 부재를 결과할 것을 필요로 하지 않는다. 비슷하게, 특정 유형, 예컨대 한 마커를 발현하는 유형의 세포의 음성 선별, 제거 또는 감소는 그러한 세포의 수나 백분율을 감소시키는 것을 말하지, 그러한 모든 세포의 완전한 제거를 결과하여야 하는 것은 아니다.

[0229] 몇 가지 예시에 있어서, 하나의 단계로부터 양성적으로 또는 음성적으로 선별된 분획을 다른 분리 단계에 적용하는, 예컨대 후속하는 양성 또는 음성 선별에 적용하는 다회전 (multi round) 분리 단계가 수행된다. 몇 가지 예시에 있어서, 예컨대 각각이 음성 선별을 위하여 표적화되는 마커에 특이적인 복수개의 항체 또는 결합 파트너로 세포를 반응시킴으로써 하나의 분리 단계가 다수의 마커를 동시에 발현하는 세포를 감소시킬 수 있다. 비슷하게, 다수의 세포 유형은 세포를 다양한 세포 유형에서 발현되는 복수개의 항체 또는 결합 파트너와 반응시킴으로써 동시에 양성적으로 선별될 수 있다.

[0230] 예컨대, 몇 가지 측면에 있어서, 특정 하위집단의 T 세포, 예컨대 하나 이상의 표면 마커, 예컨대 CD28⁺, CD62L⁺, CCR7⁺, CD27⁺, CD127⁺, CD4⁺, CD8⁺, CD45RA⁺, 및/또는 CD45RO⁺ T 세포 양성이거나 이를 고수준으로 발현하는 세포가 양성 또는 음성 선별 기법으로 단리된다.

[0231] 예컨대, CD3⁺, CD28⁺ T 세포는 CD3/CD28 결합된 자성 비드 (예컨대., DYNABEADS® M-450 CD3/CD28 T Cell Expander)를 이용하여 양성적으로 선별될 수 있다.

[0232] 몇 가지 구현예에 있어서, 단리는 양성 선별에 의한 특정 세포 농축, 또는 음성 선별에 의한 특정 세포 집단의 감소에 의하여 수행된다. 몇 가지 구현예에 있어서, 양성 또는 음성 선별은, 각각 양성적으로 또는 음성적으로 선별되는 세포 상에서, 세포를, 발현되거나 (marker⁺) 상대적으로 높은 수준으로 발현하는 (marker^high) 하나 이상의 표면 마커와 특이적으로 결합하는 하나 이상의 항체 또는 기타 결합 제제와 반응시킴으로써 이루어진다.

[0233] 몇 가지 구현예에 있어서, T 세포는, 비-T 세포, 예컨대 B 세포, 단핵구 또는 다른 백혈구 세포, 예컨대 CD14 상에서 발현되는 마커의 음성 선별에 의하여 PBMC로부터 분리된다. 몇 가지 측면에 있어서, CD4⁺ 헬퍼 및 CD8⁺ 세포독성 T 세포를 분리하기 위하여 CD4⁺ 또는 CD8⁺ 선별 단계가 이용된다. 이러한 CD4⁺ 및 CD8⁺ 집단은, 하나 이상의 순수한, 기억, 및/또는 효과자 T 세포 하위집단 상에서 발현되거나 상대적으로 고수준으로 발현되는 마커에 대한 양성 또는 음성 선별에 의하여 하위-집단으로 더 분류될 수 있다.

[0234] 몇 가지 구현예에 있어서, CD8⁺ 세포는, 예컨대 각각의 하위집단과 관련된 표면 항원에 기초한 양성 또는 음성 선별에 의하여, 순수한, 중앙 기억, 효과자 기억 및/또는 중앙 기억 줄기 세포를 더욱 농축 또는 감소시킨다. 몇 가지 구현예에 있어서, 중앙 기억 T 세포 (T_CM)의 농축은 효능을 증가시키기 위하여, 장기간 생존, 증식, 및/또는 투여 후 생착을 향상시키기 위하여 수행되는데, 이는 어떤 측면에서는 이러한 하위-집단에서 특히 양호한 것이다. Terakuraet al. (2012) Blood.1:72-82; Wang et al. (2012) J Immunother . 35(9):689-701 참조. 몇 가지 구현예에 있어서, T_CM-농축 CD8⁺ T 세포 및 CD4⁺T 세포를 결합하는 것은 효능을 더욱 높인다.

[0235] 구현예에 있어서, 기억 T 세포는 CD8⁺ 말초 혈액 림프구의 CD62L⁺ 및 CD62L^- 양자 모두의 하위세트에 존재한다. PBMC는, 예컨대 항-CD8 및 항-CD62L 항체를 이용하여 CD62L^-CD8⁺ 및/또는 CD62L⁺CD8⁺ 분획을 농축 또는 이들을 감소시킬 수 있다.

[0236] 몇 가지 구현예에 있어서, 중앙 기억 T 세포 (T_CM)의 농축은 CD45RO, CD62L, CCR7, CD28, CD3, 및/또는 CD 127의 양성 또는 그 고수준 표면 발현에 기초하고; 어떤 측면에 있어서, 이는 CD45RA 및/또는 그랜자임 B를 발현하거나 높은 수준으로 발현하는 세포에 대한 음성 선별에 기초한다. 몇 가지 측면에 있어서, T_CM 세포에 대하여 농축된 CD8⁺ 집단의 단리는 CD4, CD14, CD45RA를 발현하는 세포를 감소시킴으로써, 그리고 CD62L을 발현하는 세포에 대한 양성 선별 또는 농축에 의함으로써 수행된다. 한 가지 측면에 있어서, 중앙 기억 T 세포 (T_CM)에 대한 농축은 CD14 및 CD45RA의 발현에 기초한 음성 선별에 처해지는 CD4 발현에 기초하여 선별되는 세포들의 음성 분획을 가지고 시작하고, CD62L에 기초한 양성 선별로 이루어진다. 몇 가지 측면에 있어서, 이러한 선별은, 동시에 이루어지고, 다른 측면에서는 둘 중 어떤 순서라도 순차적으로 이루어진다. 몇 가지 측면에 있어서, CD8⁺ 세포 집단 또는 하위집단의 준비에 사용된 동일한 CD4 발현 기반 선별 단계가 또한, CD4⁺ 세포 집단 또는 하위-집단을 생성하는데 사용되는데, 그로써 CD4-기반 분리로부터의 양성 및 음성 분획 양자 모두가 보유되어 상기 방법의 후속 단계에 사용되며, 이는 필요에 따라 하나 이상의 추가적인 양성 또는 음성 선별 단계가 뒤따른다.

[0237] 특정 예시에 있어서, PBMC 또는 다른 백혈구 세포 시료는, CD4⁺ 세포의 선별에 적용되는데, 여기서 음성 및 양성 분획이 모두 보유된다. 그 후 음성 분획은 CD14 및 CD45RA 또는 CD19의 발현에 기초한 음성 선별 및 중앙 기억 T 세포, 예컨대 CD62L 또는 CCR7의 마커 특성에 기초한 양성 선별에 적용되는데, 여기서 상기 양성 및 음성 선별은 둘 중 어떤 순서로도 수행된다.

[0238] CD4⁺ T 헬퍼 세포는 세포 표면 항원을 갖는 세포 집단을 확인해 ㄴ내냄으로써 순수한, 중앙 기억 및 효과자 세포로 분류된다. CD4⁺ 림프구는 ㅍ표mp준 방법에 의하여 얻어질 수 있다. 몇 가지 구현예에 있어서, 순수 CD4⁺ T 림프구는 CD45RO^-, CD45RA⁺, CD62L⁺, CD4⁺ T 세포이다. 몇 가지 구현예에 있어서, 중앙 기억 CD4⁺ 세포는 CD62L⁺ 및 CD45RO⁺이다. 몇 가지 구현예에 있어서, 효과자 CD4⁺ 세포는 CD62L^- 및 CD45RO^-이다.

[0239] 한 가지 예시에 있어서, 음성 선별에 의한 CD4⁺ 세포 농축을 위하여, 단일클론 항체 칵테일은 통상 CD14, CD20, CD11b, CD16, HLA-DR, 및 CD8에 대한 항체를 포함한다. 몇 가지 구현예에 있어서, 상기 항체 또는 결합 파트너는, 양성 및/또는 음성 선별을 위한 세포의 분리를 가능케 하기 위하여 고체 지지체 또는 기질, 예컨대 자성 비드 또는 상자성 비드에 결합된다. 예컨대, 몇 가지 구현예에 있어서, 상기 세포 및 세포 집단은 면역자성 (또는 친화자성) 분리 기법을 이용하여 분리되거나 단리된다 (Methods in Molecular Medicine, vol. 58: Metastasis Research Protocols, Vol. 2: Cell Behavior In Vitro and In Vivo, p 17-25 Edited by: S. A. Brooks and U. Schumacher ⓒ Humana Press Inc., Totowa, NJ에서 리뷰됨).

[0240] 몇 가지 측면에 있어서, 상기 분리될 세포의 시료 또는 조성물은 작은, 자화가능한 또는 자성 반응성 물질, 예컨대 자성 반응성 입자 또는 미립자, 예컨대 상자성 비드와 함께 반응하게 된다 (예컨대, Dynabeads 또는 MACS 비드). 상기 자성 반응성 물질, 예컨대 입자는, 일반적으로, 분리하고자 하는, 예컨대 음성 또는 양성적으로 선별코자 하는 세포, 세포들 또는 세포 집단 상에 존재하는 분자, 예컨대 표면 마커에 특이적으로 결합하는, 결합 파트너, 예컨대 항체에 직접 또는 간접적으로 부착된다.

[0241] 몇 가지 구현예에 있어서, 상기 자성 입자 또는 비드는 특이적 결합 원, 예컨대 항체 또는 기타 결합 파트너에 결합되는 자성 반응성 물질을 포함한다. 자성 분리 방법에서 사용되는 많은 잘 알려진 자성 반응성 물질들이 있다. 적절한 자성 입자로는, 참조로서 본 발명에 포함되는 Molday, U.S. Pat. No. 4,452,773, 및 유럽 특허 명세서 EP 452342 B에 기술된 것들을 들 수 있다. 콜로이드 크기 ㅇ입자들, 예컨대 Owen U.S. Pat. No. 4,795,698, 및 Liberti et al., U.S. Pat. No. 5,200,084에 기재된 것들이 다른 예시이다.

[0242] 상기 반응은 일반적으로, 상기 시료 내 세포에 존재한다면, 그 조건에 의하여 상기 자성 입자 또는 비드에 부착되는 이러한 항체 또는 결합 파트너에 특이적으로 결합하는 항체 또는 결합 파트너 또는 분자, 예컨대 2차 항체 또는 다른 제제가 세포 표면 분자에 특이적으로 결합하는 조건 하에서 수행된다.

[0243] 몇 가지 측면에 있어서, 상기 시료는 자기장 안에 위치되어, 그에 부착된 자성 반응성 또는 자화가능한 입자를 갖는 그러한 세포들이 자석에 이끌리고 비표지된 세포들로부터 분리된다. 양성 선별을 위하여, 상기 자석에 이끌린 세포는 보유되고; 음성 선별을 위하여 이끌리지 않은 세포 (비표지된 세포)가 보유된다. 몇 가지 측면에 있어서, 양성 및 음성 선별의 조합은 동일한 선별 단계 중에 수행되는데, 여기서 상기 양성 및 음성 분획은 보유되고 추가 처리되거나 추가 분리 단계에 처해지게 된다.

[0244] 특정 구현예에 있어서, 상기 자성 반응성 입자들은 1차 항체 또는 다른 결합 파트너, 2차 항체, 렉틴, 효소 또는 스트렙타비딘에 코팅된다. 특정 구현예에 있어서, 상기 자성 입자는 하나 이상의 마커에 특이적인 1차 항체의 코팅은 통하여 세포에 부착된다. 특정 구현예에 있어서, 상기 비드보다는 세포가 1차 항체 또는 결합 파트너로 표지되고 그 후 세포-유형 특이적 2차 항체 또는 다른 결합 파트너 (예컨대, 스트렙타비딘)-코팅된 자성 입자들이 첨가된다. 특정한 구현예에 있어서, 스트렙타비딘-코팅된 자성 입자가 비오틴화 1차 또는 2차 항체와 결합하여 이용된다.

[0245] 몇 가지 구현예에 있어서, 상기 자성 반응성 입자들은 후속하여 반응, 배양 및/또는 조작될 세포들에 부착되어 남겨지고; 어떤 측면에서, 상기 입자들은 환자에 투여하기 위하여 세포에 부착되어 남겨진다. 몇 가지 구현예에 있어서, 사기 자화가능한 또는 자성 반응성 입자들은 상기 세포들로부터 제거된다. 세포로부터 자화가능한 입자들을 제거하는 방법은 공지이며, 예컨대 비표지된 항체와 분리성 링커에 결합된 자화가능한 입자 또는 항체와의 경쟁 이용을 들 수 있다. 몇 가지 구현예에 있어서, 상기 자화가능한 입자는 생분해성이다.

[0246] 몇 가지 구현예에 있어서, 상기 친화-기반 선별은 자성-활성화 세포 분류 (MACS) (Miltenyi Biotech, Auburn, CA)를 통한다. 자화 활성화 세포 분류 (MACS) 시스템은 그에 부착되는 자화된 입자를 갖는 세포들의 고-순도 선별을 가가능하게 한다. 특정 구현예에 있어서, MACS는 비-표적 및 표적 종이 외부 자기장의 적용 후 순차적으로 용리되는 모드로 운전된다. 즉, 자화된 입자에 부착된 세포들은 제 위치에 잡혀있는 반면 비부착된 종들은 용리된다. 그 후, 이러한 제1 용리 단계가 완료된 후, 자기장에 붙잡혔던 종들 및 용리되지 못했던 종들이 어떤 방식으로든 풀려나고 그렇게 그들이 용리되고 회수될 수 있다. 특정 구현예에 있어서, 상기 비-표적 세포는 표지되고 이종 집단 세포들로부터 감소된다.

[0247] 특정 구현예에 있어서, 상기 단리 또는 분리는 상기 방법의 하나 이상의 단리, 세포 준비, 분리, 가공, 반응, 배양, 및/또는 제제화 단계를 수행하는 시스템, 장치 또는 장비를 이용하여 수행된다. 몇 가지 측면에 있어서, 상기 시스템은 이들 각각의 단계를 폐쇄되거나 멸균된 환경에서 수행토록, 예컨대 오류, 사용자 조작 및/또는 오염을 최소화하도록 사용된다. 한 가지 에시에 있어서, 상기 시스템은 국제 특허 출원, 공개 번호 WO2009/072003, 또는 US 20110003380 A1에 기술된 시스템이다.

[0248] 몇 가지 구현예에 있어서, 상기 시스템 또는 장비는 상기 단리, 가공, 조작, 및 제제화 단계 중 하나 이상, 예컨대 모든 단계를 통합된 또는 자가-함유된 시스템으로 및/또는 자동화된 또는 프로그램된 양식으로 수행한다. 몇 가지 측면에 있어서, 상기 시스템 또는 장비는 상기 시스템 또는 장비와 통신되는 컴퓨터 및/또는 컴퓨터 프로그램을 포함하는데, 이는 사용자에게 상기 가공, 단리, 조작 및 제제화 단계의 프로그램, 제어, 결과 평가 및/또는 다양한 측면 조정을 가능하게 한다.

[0249] 몇 가지 측면에 있어서, 상기 분리 및/또는 다른 단계는, 예컨대 폐쇄되고 멸균된 시스템에서의 임상-규모 수준의 세포 자동화 분리를 위해 CliniMACS 시스템 (Miltenyi Biotic)을 이용하여 수행된다. 구성 요소는 통합 마이크로 컴퓨터, 자기 분리 유닛, 연동 펌프 및 다양한 핀치 밸브를 포함할 수 있다. 몇 가지 측면에 있어서, 상기 통합 컴퓨터는 장비의 모든 구성 요소를 제어하고 표준화된 순서로 반복적인 과정을 수행하도록 시스템에 지시한다. 어떤 측면에 있어서, 자기 분리 유닛은 이동 가능한 영구 자석 및 선별 컬럼용 홀더를 포함한다. 상기 연동 펌프는 튜브 세트 전체의 유속을 제어하며, 핀치 밸브와 함께, 시스템을 통한 완충액의 제어된 흐름과 세포의 지속적인 현탁을 보장한다.

[0250] 몇 가지 측면에 있어서, 상기 CliniMACS 시스템은 멸균, 비(非)-화성 용액으로 공급되는 항체-커플링된 자화가능 입자를 이용한다. 몇 가지 구현예에 있어서, 자성 입자로 세포를 표지한 후, 세포는 수세되어 과량의 입자를 제거한다. 그 후, 세포 준비 백을 튜브 세트에 연결하고, 이는 차례로 완충액 및 세포 수집 백을 함유하는 백에 연결된다. 튜브 세트는 사전-조립된 멸균 튜브, 예컨대 프리-컬럼 (pre-column)과 분리 컬럼 (separation column)으로 구성되고, 오로지 일회용이다. 분리 프로그램의 개시 후, 시스템은 자동으로 세포 시료를 분리 컬럼에 적용시킨다. 표지된 세포는 컬럼 내에 보유되는 반면, 표지되지 않은 세포는 일련의 수세 단계에 의해 제거된다. 몇 가지 구현예에 있어서, 본 발명에 기재된 방법을 이용하여 사용하기 위한 세포 집단은 비표지이고 컬럼에 보유되지 않는다. 몇 가지 구현예에 있어서, 본 발명에 기재된 방법을 이용하여 사용하기 위한 세포 집단은 표지되고 컬럼에 보유된다. 몇 가지 구현예에 있어서, 본 발명에 기재된 방법을 이용하여 사용하기 위한 세포 집단은 자기장의 제거 후 컬럼으로부터 용리되어 세포 수집 백 내에 수집된다.

[0251] 특정 구현예에 있어서, 분리 및/또는 다른 단계는 CliniMACS Prodigy 시스템 (Miltenyi Biotec)을 사용하여 수행된다. 어떤 측면에 있어서, CliniMACS Prodigy 시스템에는 원심 분리에 의한 세포의 자동화 세척 및 분획화을 허용하는 세포 처리 유닛이 장착되어 있다. CliniMACS Prodigy 시스템은 또한, 기원 세포 산물의 거시적 층을 식별하여 최적의 세포 분획 종말점을 결정하는 온보드 카메라 및 이미지 인식 소프트웨어를 포함할 수도 있다. 예컨대, 말초 혈액은 적혈구, 백혈구 및 혈장층으로 자동 분리될 수 있다. CliniMACS Prodigy 시스템은 또한 세포 분화 및 증식, 항원 로딩 및 장기간 세포 배양과 같은 세포 배양 프로토콜을 달성하는 일체형 세포 배양 챔버를 포함할 수 있다. 입력 포트는 멸균 제거 및 배지 보충을 가능케 하며 세포는 통합 현미경을 사용하여 모니터링 될 수 있다. 예컨대, Klebanoff et al. (2012) J Immunother . 35(9): 651-660, Terakuraet al. (2012) Blood.1:72-82, 및 Wang et al. (2012) J Immunother . 35(9):689-701 참조.

[0252] 몇 가지 구현예에 있어서, 본 발명에 기재된 세포 집단은 유세포 분석법을 통해 수집 및 농축 (또는 감소)되고, 여기서 다수의 세포 표면 마커에 대해 염색된 세포는 유체 스트림으로 운반된다. 몇 가지 구현예에 있어서, 본 발명에 기재된 세포 집단은 제조 스케일 (FACS)-분류를 통해 수집 및 농축 (또는 감소)된다. 특정 구현예에 있어서, 본 발명에 기재된 세포 집단은 FACS-기반 검출 시스템과 조합하여 마이크로 전자기계 시스템 (MEMS) 칩을 이용하여 수집 및 농축 (또는 감소)된다. (예컨대, WO 2010/033140, Cho et al. (2010) Lab Chip 10, 1567-1573; 및 Godin et al. (2008) J Biophoton. 1(5):355-376 참조). 두 경우 모두, 세포는 여러 마커로 표지될 수 있어, 잘 정의된 T 세포 하위세트의 고순도 정제를 가능케 한다.

[0253] 몇 가지 구현예에 있어서, 항체 또는 결합 파트너는 하나 이상의 검출 가능한 마커로 표지되어 양성 및/또는 음성 선별을 위한 분리를 용이하게 한다. 예컨대, 분리는 형광 표지된 항체와의 결합에 기반할 수 있다. 몇 가지 예시에서, 하나 이상의 세포 표면 마커에 특이적인 항체 또는 다른 결합 파트너의 결합에 기반한 세포의 분리는 유동 스트림에서, 예컨대 형과-활성화 세포 분류 (FACS), 예컨대 조제 규모 (FACS) 및/또는 마이크로 전자기계 시스템 (MEMS) 칩에 의하여, 예컨대 유세포 분석 시스템과 조합하여 사용될 수 있다. 이러한 방법은 동시에 다수의 마커를 기반으로 한 양성 및 음성 선별을 허한다.

[0254] 몇 가지 구현예에 있어서, 상기 제조 방법은 단리, 반응 및/또는 조작 전 또는 후에 세포를 동결, 예컨대 냉동 보존하는 단계를 포함한다. 몇 가지 구현예에 있어서, 동결 및 후속 해동 단계는 과립구 및, 어느 정도는, 세포 집단 내의 단핵구를 제거한다. 몇 가지 구현예에 있어서, 세포는, 예컨대 혈장 및 혈소판을 제거하기 위한 수세 단계 후에, 냉동 용액에 현탁된다. 어떤 측면에서, 임의의 다양한 공지된 동결 용액 및 파라미터가 사용될 수 있다. 한 가지 예는 20% DMSO 및 8% 인간 혈청 알부민 (HSA), 또는 다른 적합한 세포 동결 배지를 함유하는 PBS를 사용하는 것을 포함한다. 그 후, 이것은 1:1로 희석되어 각각 DMSO와 HSA의 최종 농도는 10%와 4%이다. 그 후, 세포는 일반적으로 분당 1 °의 속도로 -80℃까지 동결되고 액체 질소 저장 탱크의 증기 상에 저장된다.

[0255] 몇 가지 구현예에 있어서, 상기 제공되는 방법은 배양, 반응, 배양 및/또는 유전자 조작 단계를 포함한다. 예컨대, 몇 가지 구현예에 있어서, 감소된 세포 집단을 배양 및/또는 조작하는 방법 및 배양-개시 조성물이 제공된다.

[0256] 따라서, 몇 가지 구현예에 있어서, 상기 세포 집단은 배양 개시 조성물에서 배양된다. 반응 및/또는 조작은 배양 용기, 예컨대 배양 또는 세포 배양을위한 유닛, 챔버, 웰, 컬럼, 튜브, 튜브 세트, 밸브, 바이알, 배양 디쉬, 백 또는 기타 용기에서 수행될 수 있다.

[0257] 몇 가지 구현예에 있어서, 상기 세포는 유전자 조작 전 또는 그와 관련하여 반응 및/또는 배양된다. 반응 단계는 배양 (culture), 배양 (cultivation), 자극, 활성화 및/또는 전파를 포함할 수 있다. 몇 가지 구현예에 있어서, 상기 조성물 또는 세포는 자극 조건 또는 자극제의 존재하에서 반응된다. 그러한 조건은 집단에서 세포의 증식 (proliferation), 증식 (expansion), 활성화 및/또는 생존을 유도하고, 항원 노출을 모방하고, 및/또는 재조합 항원 수용체의 도입과 같은 유전자 조작을 위해 세포를 준비하도록 설계된 것들을 포함한다.

[0258] 상기 조건은 하나 이상의 특정 배지, 온도, 산소 함량, 이산화탄소 함량, 시간, 제제, 예컨대, 영양제, 아미노산, 항생제, 이온 및/또는 자극 인자, 예컨대, 사이토 카인, 케모카인, 항원, 결합 파트너, 융합 단백질, 재조합 용해성 수용체, 및 상기 세포를 활성화 시키도록 설계된 임의의 다른 제제를 포함할 수 있다.

[0259] 몇 가지 구현예에 있어서, 상기 자극 조건 또는 제제는 하나 이상의 제제, 예컨대, TCR 복합체의 세포내 신호전달 도메인을 활성화시킬 수 있는 리간드를 포함한다. 일부 측면에서, 상기 약제는 T 세포에서 TCR/CD3 세포내 신호전달 캐스케이드를 켜거나 개시시킨다. 이러한 제제는 항체, 예컨대 TCR 성분 및/또는 공자극 수용체에 특이적인 것들, 예컨대 비드와 같은 고체 지지체에 결합된 항-CD3, 항-CD28 및/또는 하나 이상의 사이토카인을 포함할 수 있다. 필요에 따라, 상기 증식 방법은 항-CD3 및/또는 항 CD28 항체를 배양 배지에 첨가하는 단계를 더 포함할 수 있다 (예컨대, 약 0.5 ng/ml 이상의 농도로). 몇 가지 구현예에 있어서, 상기 자극 제제는 IL-2 및/또는 IL-15, 예컨대, 약 10 유닛/mL 이상의 IL-2 농도를 포함한다.

[0260] 몇 가지 측면에 있어서, 반응은 US Patent No. 6,040,1 77 Riddell et al., Klebanoff et al.(2012) J Immunother. 35(9): 651-660, Terakuraet al. (2012) Blood.1:72-82, 및/또는 Wang et al. (2012) J Immunother. 35(9):689-701에 기술된 것들과 같은 기법에 따라 수행된다.

[0261] 몇 가지 구현예에 있어서, 상기 T-세포는 상기 배양-개시 조성물에 피더 세포, 예컨대 비-분할 말초 혈액 단핵구 세포 (PBMC)를 첨가함으로써 (그로써, 결과하는 세포 집단이 증식될 초기 집단의 각 T 림프구에 대해 약 5, 10, 20, 또는 40개 또는 그 이상의 PBMC 피더 세포를 함유한다); 및 상기 배양체를 배양함으로써 (예컨대, T 세포의 수를 증식시키기에 충분한 시간 동안) 증식한다. 몇 가지 구현예에 있어서, 상기 비-분할 피더 세포는 감마-조사된 PBMC 피더 세포를 포함할 수 있다. 몇 가지 구현예에 있어서, 상기 PBMC는 세포 분열을 방지하기 위해 약 3000 내지 3600 rad 범위의 감마선 조사된다. 일부 측면에 있어서, 피더 세포는 T 세포 집단의 첨가 전에 배양 배지에 첨가된다.

[0262] 몇 가지 구현예에 있어서, 상기 자극 조건은 인간 T 림프구의 성장에 적합한 온도, 예컨대, 약 25℃ 이상, 일반적으로 약 30℃ 및 일반적으로 37℃ 또는 약 37℃를 포함한다. 필요에 따라, 상기 반응은 피더 세포로서 비-분할 EBV-형질 전환 림프아구 세포 (LCL)를 첨가하는 것을 더 포함할 수 있다. LCL은 약 6000 내지 10,000 rad 범위의 감마선 조사될 수 있다. 일부 측면에 있어서, 상기 LCL 피더 세포는 임의의 적합한 양으로, 예컨대 LCL 피더 세포 대 초기 T 림프구의 비율이 약 10 : 1 이상으로 제공된다.

[0263] 구현예에 있어서, 항원-특이적 T 세포, 예컨대 항원-특이적 CD4+ 및/또는 CD8+ T 세포는 항원으로 순수 또는 항원 특이적 T 림프구를 자극함으로써 수득된다. 예컨대, 항원 특이적 T 세포주 또는 클론은, T 세포를 감염된 대상체로부터 단리하고 시험관 내에서 상기 동일한 항원으로 세포를 자극함으로써 거대세포바이러스 항원에 대하여 생성될 수 있다.

II. 조성물, 방법 및 용도

A. 약학적 조성물 및 제제

[0264] 또한, 상기 폴리뉴클레오티드, 카세트, 벡터, 바이러스 입자 및/또는 그 안으로 이러한 폴리뉴클레오티드가 도입되거나 달리는 이를 함유하는 세포를 포함하는 조성물이 제공된다. 몇 가지 구현예에 있어서, 이를 함유하는 상기 제공된 벡터 또는 바이러스 입자의 하나를 이용하는 형질도입 방법에 의하여 재조합 단백질을 발현하도록 조작된 세포를 함유하는 약학적 조성물이 제공된다. 조성물 중에는, 투여용 조성물, 예컨대 약학적 조성물 및 제제, 예컨대 주어진 양 또는 그 분획으로 투여하기 위한 세포 수를 포함하는 단위 투여형 조성물이 있다. 상기 약학적 조성물 및 제제는 일반적으로 하나 이상의 임의적 약학적 허용 담체 또는 부형제를 포함한다. 몇 가지 구현예에 있어서, 상기 조성물은 하나 이상의 추가적인 치료 제제를 포함한다.

[0265] "약학적 제제"라는 용어는 그러한 형태로서 그 안에 함유된 활성 성분의 생물학적 활성이 효과적이도록 하는, 그 제제가 투여될 대상체에 허용될 수 없을만큼 독성인 어떠한 추가 성분을 함유하지 않는 제제를 말한다.

[0266] "약학적 허용 담체"는 활성 성분 이외의, 약학적 제제의 성분을 말하며, 이는 대상체에게 비독성이다. 약학적 허용 담체는 완충액, 부형제, 안정화제 또는 보존제를 포함하지만, 이에 국한되는 것은 아니다.

[0267] 몇 가지 측면에 있어서, 담체의 선택은 부분적으로 특정 세포에 의해 및/또는 투여 방법에 의해 결정된다. 따라서, 다양한 적절한 제제가 있다. 예컨대, 상기 약학적 조성물은 보존제를 함유할 수있다. 적합한 보존제는 예컨대, 메틸파라벤, 프로필파라벤, 소듐 벤조에이트 및 벤즈알코늄 클로라이드를 들 수 있다. 몇 가지 측면에 있어서, 2 이상의 보존제의 혼합물이 사용된다. 보존제 또는 이들의 혼합물은 통상 총 조성물의 약 0.0001 중량% 내지 약 2 중량%의 양으로 존재한다. 담체는, 예컨대 Remington's Pharmaceutical Sciences 16th edition, Osol, A. Ed. (1980)에 의하여 기술된다. 약학적 허용 담체는 일반적으로 사용된 투여량 및 농도에서 수혜자에게 비독성이고, 완충액, 예컨대 인산염, 시트레이트 및 기타 유기산; 항산화제, 예컨대 아스코르브산 및 메티오닌; 보존제 (예컨대 옥타데실디메틸벤질 암모늄 클로라이드; 헥사메토늄 클로라이드; 벨즈알코늄 클로라이드; 벤제토늄 클로라이드; 페놀, 부틸 또는 벤질 알코올; 알킬 파라벤, 예컨대 메틸 또는 프로필 파라벤; 카테콜; 레조르시놀; 시클로헥산올; 3-펜탄올; 및 m-크레졸); 저 분자량 (약 10 잔기 미만) 폴리펩타이드; 단백질, 예컨대 혈청 알부민, 젤라틴 또는 면역 글로불린; 친수성 고분자, 예컨대 폴리비닐피롤리돈; 아미노산, 예컨대 글리신, 글루타민, 아스파라긴, 히스티딘, 아르기닌 또는 리신; 단당류, 이당류 및 기타 탄수화물, 예컨대 글루코오스, 만노오스 또는 덱스트린; 킬레이트제, 예컨대 EDTA; 당, 예컨대 수크로오스, 만니톨, 트레할로스 또는 소르비톨; 염-형성 반대-이온, 예컨대 소듐; 금속 착물 (예컨대, Zn-단백질 복합체); 및/또는 비-이온성 계면활성제, 예컨대 폴리에틸렌 글리콜 (PEG)를 포함하지만 이에 국한되지는 않는다.

[0268] 몇 가지 측면에 있어서, 완충제가 조성물에 포함된다. 적합한 완충제는, 예컨대 시트르산, 소듐 시트레이트, 인산, 인산 칼륨 및 다양한 다른 산 및 염을 포함한다. 몇 가지 측면에 있어서, 2 이상의 완충제의 혼합물이 사용된다. 완충제 또는 이들의 혼합물은 통상 총 조성물의 약 0.001 중량% 내지 약 4 중량%의 양으로 존재한다. 투여 가능한 약학적 조성물의 제조 방법은 공지되어 있다. 예시적인 방법은, 예컨대, Remington: The Science and Practice of Pharmacy, Lippincott Williams & Wilkins; 21st ed. (May 1, 2005)에 보다 자세히 기술되어 있다.

[0269] 상기 제제는 수용액을 포함할 수 있다. 상기 제제 또는 조성물은 또한, 상기 세포로 치료되는 특정 징후, 질병 또는 질환에 유용한 하나 이상의 활성 성분, 좋기로는 각각의 활성이 서로 부정적인 영향을 미치지 않는, 상기 세포에 대해 상보적인 활성을 갖는 활성 성분을 함유할 수 있다. 이러한 활성 성분은 적절하게 의도된 목적에 유효한 양으로 조합하여 존재한다. 따라서, 몇 가지 구현예에 있어서, 상기 약학적 조성물은 다른 약학적 활성 제제 또는 약물, 예컨대 화학치료 제제, 예컨대 아스파라기나제, 부술판, 카보플라틴, 시스플라틴, 다우노루비신, 독소루비신, 플루오로우라실, 겜시타빈, 하이드록시우레아, 메토트렉세이트, 파클리탁셀, 리툭시맙, 빈블라스틴, 및/또는 빈크리스틴을 더 포함한다.

[0270] 몇 가지 구현예에 있어서, 상기 약학적 조성물은 질병 또는 질환을 치료하거나 예방하기에 유효한 양, 예컨대 치료적 유효량 또는 예방적 유효량으로 상기 세포를 함유한다. 몇 가지 구현예에 있어서, 치료 또는 예방 효능은 치료되는 대상체의 주기 평가에 의해 모니터링된다. 원하는 투여량은 상기 세포의 단일 볼 루스 투여, 상기 세포의 다중 볼루스 투여에 의해, 또는 상기 세포의 연속 주입 투여에 의해 전달될 수 있다.

[0271] 몇 가지 구현예에 있어서, 상기 조성물은 질병 또는 질환의 부담을 감소시키는데 효과적인 양으로, 및/또는 대상체에서 CRS 또는 중증의 CRS를 초래하지 않는 양으로 및/또는 본 발명에 기술된 방법의 임의의 다른 결과에 영향을 미치지 않는 양으로 세포를 포함한다.

[0272] 상기 세포 및 조성물은 표준 투여 기법, 제제 및/또는 장치를 사용하여 투여될 수 있다. 상기 세포의 투여는 자가 또는 동종일 수 있다. 예컨대, 면역반응 세포 또는 전구체는 한 대상체에서 얻을 수 있으며 동일한 대상체 또는 다른 호환가능한 대상체에 투여할 수 있다. 말초 혈액 유래 면역반응 세포 또는 이들의 자손 (예컨대, 생체 내, 생체 외 또는 시험관 내 유래)는 국부화 주입, 예컨대 카테터 투여, 전신 주사, 국소 주사, 정맥 주사 또는 비경구 투여를 통해 투여될 수 있다. 치료적 조성물 (예컨대, 유전적으로 변형된 면역반응 세포를 함유하는 약학 조성물)을 투여하는 경우, 이는 일반적으로 단위 투야 주사 형태 (용액, 현탁액, 에멀전)으로 제제화될 것이다.

[0273] 제제는 경구, 정맥 내, 복강 내, 피하, 폐, 경피, 근육 내, 비강 내, 볼내 (buccal), 설하, 또는 좌제형 투여용의 그것을 포함한다. 몇 가지 구현예에 있어서, 상기 세포 집단은 비경구로 투여된다. 비경구 주입은 근육 내, 정맥 내, 동맥 내, 복강 내, 흉강 내, 두개 내 및/또는 피하 투여를 포함할 수 있다. 몇 가지 구현예에 있어서, 주어지는 투여량은 세포의 단일 볼루스 투여에 의해 투여된다. 몇 가지 구현예에 있어서, 상기 세포는 정맥 내, 복강 내 또는 피하 주사에 의한 말초 전신 전달을 이용하여 대상체에게 투여된다.

[0274] 몇 가지 구현예에 있어서, 조성물은 어떤 측면에서 선택된 pH로 완충 될 수 있는 멸균 액체 제제, 예컨대 등장성 수용액, 현탁액, 에멀전, 분산액 또는 점성 조성물로서 제공된다. 액체 제제는 일반적으로 겔, 다른 점성 조성물 및 고체 조성물보다 제조하기 쉽다. 또한, 액체 조성물은 특히 주사에 의해 투여하기에 다소 편리하다. 한편, 점성 조성물은 특정 조직과의 접촉 시간을 연장하기 위해 적절한 점도 범위 내에서 제제화될 수 있다. 액체 또는 점성 조성물은, 예컨대 물, 염용액, 인산 완충 염용액, 폴리올 (예컨대, 글리세롤, 프로필렌 글리콜, 액체 폴리에틸렌 글리콜) 및 이들의 적합한 혼합물을 함유하는 용매 또는 분산 매질일 수 있는 담체를 포함할 수 있다.

[0275] 멸균 주사용 용액은 예컨대 적합한 담체, 희석제 또는 부형제, 예컨대 멸균수, 생리 식염수, 글루코오스, 덱스트로스 등등과의 혼합물로, 세포를 용매에 혼입시킴으로써 제조될 수 있다. 상기 조성물은 투여 경로 및 원하는 제법에 따라 추가 물질, 예컨대 습윤제, 분산제 또는 에먼전화제 (예컨대, 메틸셀룰로오스), pH 완충제, 겔화 또는 점도 증가 첨가제, 보존제, 향료 및/또는 색소과 같은 보조 물질를 함유할 수 있다. 몇 가지 측면에 있어서, 적절한 조제물을 제고하기 위하여 표준 교재가 참고될 수 있다.

[0276] 상기 조성물의 안정성 및 무균성을 증가시키는 다양한 첨가제, 예컨대 항균 보존제, 항산화제, 킬레이트제 및 완충제가 첨가될 수 있다. 미생물 작용의 예방은 다양한 항균 및 항진균제, 예컨대 파라벤, 클로로부탄올, 페놀 및 소르 브산에 의해 보장될 수 있다. 주사용 약학 형태의 장기간 흡수는, 흡수를 지연시키는 제제, 예컨대 알루미늄 모노스테아레이트 및 젤라틴의 사용에 의해 가져올 수 있다.

[0277] 생체 내 투여에 사용되는 제제는 일반적으로 무균이다. 무균성은, 예컨대 멸균 여과막을 통한 여과에 의해 쉽게 달성될 수 있다.

B. 치료적 및 예방적 방법 및 용도

[0278] 상기 제공되는 폴리뉴클레오티드, 카세트, 벡터, 이를 함유하는 세포, 그로써 코딩되는 단백질 및 기타 분자, 및 그 조성물, 예컨대 그 안에서 상기 핵산에 의하여 코딩되는 상기 재조합 또는 이종 분자는 재조합 수용체, 예컨대 CAR 또는 TCR인 것들을 이용하여 대상체에서 질병 또는 질환을 치료하는 방법이 제공된다. 몇 가지 구현예에 있어서, 상기 제공되는 방법은, 상기 제공되는 벡터 또는 그를 함유하는 바이러스 입자 중 하나를 이용하는 형질도입 방법에 의해 재조합 단백질을 발현하도록 조작된, 상기 제공되는 세포 또는 세포 집단, 또는 그의 약학적 조성물을, 질병 또는 질환을 갖는 대상체에게 투여하는 단계를 포함한다. 또한, 재조합 수용체, 예컨대 항원 수용체, 예컨대 CAR 또는 TCR을 함유하도록 조작된, 상기 제공되는 세포 또는 세포 집단, 또는 그의 조성물을 이용하는, 대상체에서 질병 또는 질환을 치료하는데 사용되는 용도 및 조성물이 제공된다.

[0279] 몇 가지 구현예에 있어서, 상기 치료 또는 예방되는 질병 또는 질환은 암, 자가면역 장애 및/또는 감염성 질병, 예컨대 바이러스성 질병, 및/또는 하나 이상의 다른 질병, 질환 및/또는 장애이다.

[0280] 몇 가지 구현예에 있어서, 상기 세포, 조성물 및/또는 폴리뉴클레오티드, 예컨대 벡터는 치료될 특정 질병 또는 질환을 갖는 대상체 또는 환자에게, 예컨대 입양 세포 치료, 예컨대 입양 T 세포 치료를 통하여 투여된다. 몇 가지 구현예에 있어서, 상기 제공되는 방법에 의하여 제조된 세포 및 조성물, 예컨대 반응 및/또는 다른 가공 단계 후에 제조된 조성물 및 최종 생산 조성물은 대상체, 예컨대 상기 질병 또는 질환을 갖거나 그 위험이 있는 대상체에게 투여된다. 몇 가지 측면에 있어서, 그에 의하여 상기 방법은, 예컨대 조작된 T 세포에 의해 인식되는 항원을 발현하는 암에서 종양 부담을 줄임으로써, 상기 질병 또는 질환을 치료, 예컨대 하나 이상의 그 징후를 개선시킨다.

[0281] 상기 제공되는 방법 또는 용도에 있어서, 상기 재조합 또는 이종 단백질은 상기 질병 또는 질환에 의하여 발현되는 리간드 또는 그의 세포 또는 조직에 특이적으로 결합하는 재조합 수용체, 예컨대 항원 수용체, 예컨대 CAR 또는 TCR을 포함한다. 예컨대, 몇 가지 구현예에 있어서, 상기 수용체는 항원 수용체이고, 상기 리간드는 상기 질병 또는 질환에 특이적인 및/또는 그와 관련된 항원이다.

[0282] 입양 세포 치료를 위한 세포의 투여 방법은 공지되어 있으며 상기 제공되는 방법 및 조성물과 관련하여 사용될 수 있다. 예컨대, 입양 T 세포 요법은, 예컨대 US 특허 출원 공개 No. 2003/0170238 Gruenberg et al; US 특허 No. 4,690,915 Rosenberg; Rosenberg (2011) Nat Rev Clin Oncol. 8(10):577-85)에 기재되어 있다. 예컨대, Themeli et al. (2013) Nat Biotechnol . 31(10): 928-933; Tsukahara et al. (2013) Biochem Biophys Res Commun 438(1): 84-9; Davila et al. (2013) PLoS ONE 8(4): e61338 참조.

[0283] 몇 가지 구현예에 있어서, 상기 세포 치료, 예컨대 입양 세포 치료, 예컨대 입양 T 세포 치료는 자가 전달에 의해 수행되며, 여기서 상기 세포는 상기 세포 치료를 받는 대상체로부터, 또는 그러한 대상체로부터 유래하는 시료로부터 단리 및/또는 달리는 준비된다. 따라서, 몇 가지 측면에 있어서, 상기 세포는, 치료를 필요로 하는 대상체, 예컨대 환자 및 동일한 대상체에게 적용되는 단리 및 가공 후의 세포로부터 유래한다.

[0284] 몇 가지 구현예에 있어서, 상기 세포 치료, 예컨대 입양 세포 치료, 예컨대 입양 T 세포 치료는 동종 전달에 의해 수행되며, 여기서 상기 세포는 상기 세포 치료를 받는 또는 궁극적으로 받는 대상체, 예컨대 제1 대상체 이외의 대상체로부터 단리 및/또는 달리는 준비된다. 몇 가지 구현예에 있어서, 그 후, 상기 세포는 동일한 종의 다른 대상체, 예컨대 제2 대상체에게 투여된다. 몇 가지 구현예에 있어서, 상기 제1 및 제2 대상체는 유전적으로 동일하다. 몇 가지 구현예에 있어서, 상기 제1 및 제2 대상체는 유전적으로 유사하다. 몇 가지 구현예에 있어서, 상기 제2 대상체는 상기 제1 대상체와 동일한 HLA 클래스 또는 수퍼타입을 발현한다.

[0285] 상기 세포, 세포 집단, 또는 조성물이 투여되는 대상체, 예컨대 환자는 포유류이고, 통상 인간과 같은 영장류이다. 몇 가지 구현예에 있어서, 상기 영장류는 원숭이 또는 유인원이다. 상기 대상체는 남성 또는 여성일 수 있으며 임의의 적절한 연령, 예컨대 유아, 연소자, 청소년, 성인 및 노인 대상체일 수 있다. 몇 가지 구현예에 있어서, 상기 대상체는 비-영장류 포유동물, 예컨대 설치류이다. 몇 가지 예시에 있어서, 상기 환자 또는 대상체는 질병, 입양 세포 치료에 대한, 및/또는 예컨대, 사이토카인 방출 증후군 (CRS)과 같은 독성 결과를 평가하기 위한 검증된 동물 모델이다.

[0286] 상기 질병, 질환 및 장애 중에는, 종양, 예컨대 고형 종양, 혈액 종양 및 흑색종 및 감염성 질병, 예컨대 바이러스나 다른 병원체, 예컨대 HIV, HCV, HBV, HPV, CMV로 인한 감염, 기생충 질병이 있다. 몇 가지 구현예에 있어서, 상기 질병 또는 질환은 종양, 암, 악성 종양, 신생물 또는 다른 증식성 질병이다. 이러한 질병은, 백혈병, 림프종, 예컨대 만성 림프구성 백혈병 (CLL), ALL, 비호지킨 림프종, 급성 골수성 백혈병, 다발성 골수종, 내화 여포성 림프종, 외투 세포 림프종, 지연형 B 세포 림프종, B 세포 악성종양, 대장, 폐, 간, 유방, 전립선, 난소, 피부 (흑색종 포함), 뼈의 암, 및 뇌암, 난소암, 상피암, 신세포암, 췌장선암, 호 지킨 림프종, 자궁 경부암, 대장암, 아교 모세포종, 신경 모세포종, 유잉 육종, 모세포종, 골육종, 활막 육종, 및/또는 중피종을 포함하지만 이에 국한되는 것은 아니다.

[0287] 몇 가지 구현예에 있어서, 상기 질병 또는 질환은 감염성 질병 또는 질환, 예컨대, 바이러스성, 레트로바이러스성, 세균성 및 원충 감염, 면역결핍증, 거대세포바이러스 (CMV), 엡스타인-바 바이러스 (EBV), 아데노바이러스, BK 폴리오 바이러스이지만 이에 국한되는 것은 아니다. 몇 가지 구현예에 있어서, 상기 질병 또는 질환은 자가면역 또는 감염성 질병 또는 질환, 예컨대 관절염, 예컨대 류마티스성 관절염 (RA), I형 당뇨병, 전신 홍반성 루푸스 (SLE), 염증성 장 질환, 건선, 경피증, 자가면역 갑상선 질병, 그레이브병, 크론병, 다발성 경화증, 천식 및/또는 이식과 관련된 질병 또는 질환이다.

[0288] 몇 가지 구현예에 있어서, 상기 질병 또는 질환과 관련된 항원은 희귀 티로신 키나아제 수용체 ROR1, tEGFR, Her2, L1-CAM, CD19, CD20, CD22, 메소 텔린, CEA 및 헤파티티스B 표면 항원, 항-엽산 수용체, CD23, CD24, CD30, CD33, CD38, CD44, EGFR, EGP-2, EGP-4, 0EPHa2, ErbB2, 3, 또는 4, FBP, 태아 아세틸 콜린 e 수용체, GD2, GD3, HMW-MAA, IL-22R-알파, IL-13R-알파2, kdr, 카파 경쇄, 루이스 Y, L1-세포 부착 분자, MAGE-A1, 메소텔린, MUC1, MUC16, PSCA, NKG2D 리간드, NY-ESO-1, MART-1, gp100, 태아발암 항원, ROR1, TAG72, VEGF-R2, 암배 항원 (CEA), 전립선 특이 항원, PSMA, Her2/neu, 에스트로겐 수용체, 프로게스테론 수용체, 에프린B2, CD123, CS-1, c-Met, GD-2, 및 MAGE A3, CE7, Wilms Tumor 1 (WT-1), 사이클린, 예컨대 사이클린 A1 (CCNA1), 및/또는 비오틴화 분자, 및/또는 HIV, HCV, HBV 또는 다른 병원체에 의하여 발현되는 분자로 이루어지는 군으로부터 선택된다.

[0289] 본 발명에서 사용되는바, "전사-후 조절 요소 (PRE)", 예컨대 헤파티티스 PRE는, 전사될 때 그에 작동적으로 연결된 관련된 유전자의 발현을 증가시키거나 촉진하는 전사-후 활성을 나타낼 수 있는 3차 구조를 생성하는 DNA 서열을 말한다.

[0290] 본 발명에서 사용되는바, "전사 후 활성"은 RNA 수준에서 유전자 발현을 제어 또는 조절하기 위한 조절 요소의 활성을 말한다. 전사 후 활성은 핵으로부터의 RNA 방출을 촉진하고, 세포 단백질에 대한 결합 부위를 제공하고, RNA, 예컨대 재조합 및/또는 이종 RNA, 전사체의 총량을 증가시키고, RNA 안정성을 증가시키고, 폴리 아데닐화 전사체의 수를 증가시키고 및/또는 그러한 전사체에서 폴리 아데닐화 꼬리의 크기를 증가시키는 활성에 의하여 나타날 수 있다.

[0291] 본 발명에서 사용되는바, "작동적으로 연결된"은 요소, 예컨대 DNA t서열, 예컨대 이종 핵산(들) 및 조절 서열(들)의 결합을 말하며, 이런 방식으로 적절한 분자 (예컨대, 전사 활성화 단백질)이 상기 조절 서열에 결합될 때 유전자 발현을 허하는 것을 말한다. 따라서, 기재되는 요소는 그들을 의도된 방식으로 기능 할 수 있게 하는 관계에 있음을 의미한다.

[0292] 본 발명에서 사용되는바, PRE, X 유전자 또는 Flap 서열과 관련하여 "비변형된"은 제공되는대로 변형을 위하여 선택되는 출발 폴리뉴클레오티드를 말한다. 사기 출발 폴리뉴클레오티드는 천연으로 존재하는, 야생형의 폴리뉴클레오티드일 수 있다. 몇 가지 구현예에 있어서, 상기 출발 폴리뉴클레오티드는 변경되거나 돌연변이될 수 있는데, 그로써 그것은 순수한 야생형과는 달라지지만 그럼에도 불구하고 제공되는바 후속하여 변형되는 폴리뉴클레오티드에 상대적으로, 출발 비변형된 폴리뉴클레오티드로서 일컬어진다. 비변형된 폴리뉴클레오티드는 제공되는 변형 (예컨대, 제공되는바 종결 코돈, 분해 서열 또는 cPPT 또는 CTS의 전부 또는 일부의 결실)을 함유하지 않는다. 몇 가지 구현예에 있어서, 상기 비변형된 핵산, 예컨대 PRE는 원하는 정도의 기능성 또는 활성을 갖거나 나타내는 것으로 알려진 것, 예컨대 공지된 정도의 전사-후 활성을 갖는 PRE, 예컨대 유전자 발현을 증가시키는 활성을 갖는 PRE이다. 예시적 비변형된 PRE 서열은 SEQ ID NOS:1,12-27, 119, 120, 125 또는 216에 기재되는 것들이다. 예시적 비변형된 Flap 서열은 SEQ ID NOS: 121에 기재된다.

[0293] 본 발명에서 사용되는바, PRE 또는 X 유전자와 관련하여 "야생형"은 바이러스 또는 바이러스 게놈, 예컨대 헤파드나바이러스, 예컨대 오르소헤파드나바이러스, 예컨대 천연에서 포유류로부터 단리되는 헤파드나바이러스에서 존재하는 PRE 또는 X 유전자의 천연으로 존재하는 핵산 서열로부터 유래하는 서열을 말한다. 종과 관계없는 야생형이라는 언급은 임의의 종으로부터 단리된 X 유전자를 포함하는 바이러스 서열을 포함하는 것으로 의도된다. 예시적인 야생형 PRE 또는 X 유전자는 헤파드나바이러스, 예컨대 포유류 종, 예컨대 인간, 유인원, 또는 다람쥐, 예컨대 우드척으로부터 발견되거나 단리되는 임의의 헤파드나바이러스로부터 얻어지는 또는 그에 존재하는 PRE나 X 유전자 서열과 같은 서열을 갖는 핵산 서열을 갖는 임의의 것이다. 예시적인 야생형 PRE는 SEQ ID NOS:1, 12-27 또는 125에 기재된 것들이다.

[0294] 본 발명에서 사용되는바, Flap 서열과 관련하여 "야생형"은 예컨대 바이러스 또는 바이러스 게놈에서, 예컨대 레트로바이러스, 예컨대 렌티바이러스, 예컨대 HIV-1에서 DNA Flap 을 형성하기 위한 cPPT 및 CTS 영역을 함유하는 천연으로 존재하는 바이러스 핵산 서열로부터 유래하는 서서열을 말한다. 예시적인 야생형 Flap 서열은 레트로바이러스, 예컨대 렌티바이러스 (예컨대, HIV-1)로부터 얻어지는 또는 그에 존재하는 cPPT 및 CTS 영역을 함유하는 바이러스 핵산 서열과 동일한 서열을 갖는 핵산 서열을 갖는 임의의 것이다. 야생형 DNA Flap을 함유하는 예시적인 바이러스 핵산은 SEQ ID NOS:121에 기재된다. .

[0295] 본 발명에서 사용되는바, 뉴클레오티드 서열 (기준 뉴클레오티드 서열)에 대해 사용되는 경우, "백분율 (%) 서열 상동성" 및 "백분율 상동성"은, 서열들과, 최대치의 백분율 서열 상동성을 얻기 위하여 필요하다면 도입되는 갭을 정렬한 후, 상기 기준 서열 내 뉴클레오티드 잔기와 동일한 후보 서열 (예컨대, 대상 PRE 또는 X 유전자, 예컨대 변형된 PRE 또는 변이체 X 유전자) 내 뉴클레오티드 잔기의 백분율로서 정의된다. 백분율 서열 상동성을 결정하는 목적을 위한 서열정렬은 이 기술 분야의 기술 범위 내 다양한 방식, 예컨대 BLAST, BLAST-2, ALIGN 또는 메갈리안 (DNASTAR) 소프트웨어와 같은 공중이 이용 가능한 컴퓨터 소프트웨어를 이용하여 달성될 수 있다. 이 기술 분야의 숙련자는 비교되는 서열의 전체 길이에 대해 최대 정렬을 달성하는데 필요한 임의의 알고리즘을 포함하여, 서열을 정렬하기 위한 적절한 파라미터를 결정할 수있다.

[0296] 본 발명에서 사용되는바, "에 대응하는 위치에서" 또는 뉴클레오티드, 아미노산 위치 또는 영역이, 기재된 서열, 예컨대 서열 목록에 기재된 서열 내 뉴클레오티드, 아미노산 위치 또는 영역"에 대응한다"는, 표준 정렬 알고리즘, 예컨대 GAP 알고리즘을 사용하여 상기 기재된 서열과 상동성을 최대화하는 정렬시 확인된 뉴클레오티드 또는 아미노산을 함유하는 뉴클레오티드 또는 아미노산 또는 영역을 말한다. 예시적인 대응하는 잔기 또는 영역은 SEQ ID NO:1 (또는 SEQ ID NO:125, 이것은 SEQ ID NO:1의 잔기 1-589임)에 기재된 예시적인 PRE 서열과 서열의 정렬에 의해 동정될 수 있다. 서열을 정렬시킴으로써, 이 기술 분야의 숙련자는 예컨대, 보존된 아미노산 잔기 및 동일한 아미노산 잔기를 가이드로서 사용하여 대응하는 잔기를 확인할 수 있다. 일반적으로, 대응하는 위치를 확인하기 위해, 가장 높은 정도의 매치가 얻어지도록 아미노산 서열을 정렬한다 (예컨대, Computational Molecular Biology, Lesk, A.M., ed., Oxford University Press, New York, 1988; Biocomputing: Informatics and Genome Projects, Smith, D.W., ed., Academic Press, New York, 1993; Computer Analysis of Sequence Data, Part I, Griffin, A.M., and Griffin, H.G., eds., Humana Press, New Jersey, 1994; Sequence Analysis in Molecular Biology, von Heinje, G., Academic Press, 1987; 및 Sequence Analysis Primer, Gribskov, M. and Devereux, J., eds., M Stockton Press, New York, 1991; Carrillo et al. (1988) SIAM J Applied Math 48: 1073 참조). 도 2A 내지 도 2E는 예시적인 대응 잔기의 예시적인 정렬 및 확인을 예시한다.

[0297] 본 발명에 사용되는바, 용어 "벡터"는 그것이 연결된 다른 핵산을 전파시킬 수 있는 핵산 분자를 말한다. 상기 용어는 그것이 도입된 숙주 세포의 게놈에 혼입된 벡터뿐만 아니라 자기 복제 핵산 구조로서의 벡터를 포함한다. 특정 벡터는 그들이 작동적으로 연결된 핵산의 발현을 지시할 수 있다. 이러한 벡터를 본 발명에서는 "발현 벡터"라 지칭한다. 벡터 중에는 렌티 바이러스 벡터와 같은 바이러스 벡터가 있다.

[0298] 용어 "숙주 세포", "숙주 세포주" 및 "숙주 세포 배양체"는 상호교환적으로 사용되며, 이러한 세포의 자손을 포함하여 외인성 핵산이 도입된 세포를 지칭한다. 숙주 세포는 "형질 전환체" 및 "형질전환된 세포"를 포함하는데, 여기에는 최초의 형질전환된 세포 및 계대의 수에 관계없이 그로부터 유래된 자손이 포함된다. 자손은 핵산 함량이 부모 세포와 완전히 동일하지는 않을 수 있고, 돌연변이를 포함할 수 있다. 본래의 형질전환 된 세포에서 스크리닝되거나 선택된 것과 동일한 기능 또는 생물학적 활성을 갖는 돌연변이 자손이 본 발명에 포함된다.

[0299] 본 발명에서 사용되는바, 단수 형태 "a", "an" 및 "the"는 문맥상 분명히 다르게 지시하지 않는 한 복수의 대상을 포함한다. 예컨대, "a" 또는 "an"은 "적어도 하나" 또는 "하나 이상"을 의미한다. 본 발명에서 기술된 측면 및 변형은 측면들 및 변형들"로 이루어지는" 및/또는 "필수적으로 그로 이루어지는"을 포함하는 것으로 이해된다.

[0300] 본 명세서에 걸쳐, 청구된 주제의 다양한 측면이 범위 형식으로 제시된다. 범위 형식에서의 설명은 편의상 및 간략화를 위한 것이며 청구된 주제의 범위에 대한 융통성 없는 제한으로 해석되어서는 안됨을 이해해야 한다. 따라서, 범위의 설명은 가능한 모든 하위 범위 및 그 범위 내의 개별적인 수치를 구체적으로 개시한 것으로 간주되어야 한다. 예컨대, 값의 범위가 제공되는 경우, 그 범위의 상한과 하한 사이의 각각의 개재된 값 및 언급된 범위 내 임의의 언급된 또는 개재 된 값이 청구된 주제 내에 포함되는 것으로 이해된다. 이들과 같은 보다 작은 범위의 상한 및 하한은 독립적으로보다 더욱 작은 범위에 포함될 수 있으며, 기술된 범위 내에서 특별히 배제된 한계에 따라 청구된 대상 내에 포함된다. 명시된 범위가 하나의 한계 또는 두 한계를 포함하는 경우, 포함된 한계들 중 하나 또는 둘 모두를 제외한 범위는 청구 대상에 포함된다. 이는 범위의 폭에 관계없이 적용된다.

[0301] 본 발명에서 사용되는 "약"이라는 용어는 이 기술 분야의 숙련자에게 용이하게 공지된 각각의 값에 대한 통상적인 오차 범위를 나타낸다. 본 발명에서 어떠한 값 또는 파라미터와 관련한 "약"의 언급은 그 값 또는 매개 변수 자체에 대한 구현예를 포함 (및 설명)한다. 예컨대, "약 X"을 언급하는 설명은 "X"에 대한 설명을 포함한다.

[0302] 본 발명에서 사용되는바, 조성물은 세포를 비롯한 2 이상의 산물, 물질 또는 화합물의 임의의 혼합물을 지칭한다. 이는 용액, 현탁액, 액체, 분말, 페이스트, 수성, 비수성 또는 이들의 임의의 조합일 수 있다.

[0303] 본 발명에서 사용되는바, "대상체"는 인간 또는 다른 동물과 같은 포유류이고, 통상 인간이다.

[0304] 달리 정의되지 않는 한, 본 발명에서 사용되는 모든 기술 용어, 표기 및 다른 기술적 및 과학적 용어 또는 용어는 청구된 주제가 속하는 기술 분야의 숙련자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는 것으로 의도된다. 몇 가지 경우에 있어서, 일반적으로 이해되는 의미를 갖는 용어는 명확성 및/또는 용이한 참조를 위해 본 발명에서 정의되며, 본 발명에서의 그러한 정의의 포함은 반드시 당업계에서 일반적으로 이해되는 것 이상의 실질적인 차이를 나타내는 것으로 해석되어서는 안된다.

[0305] 본 출원에 언급된 모든 간행물, 예컨대 특허 문헌, 과학 기사 및 데이터베이스는 각 개별 간행물이 개별적으로 참고 문헌으로 인용된 것과 동일한 정도로 모든 목적을 위해 그 전체가 참고 문헌으로 포함된다. 본 발명에서 기재된 정의가 본 발명에 참고로 인용된 특허, 출원, 공개된 출원 및 기타 간행물에 기재된 정의와 상반되거나 또는 달리 불일치하는 경우, 본 발명에 기재된 정의가 본 발명에 참고로 인용된 정의에 우선한다.

[0306] 본 발명에서 사용된 섹션 표제는 단지 조직적인 목적을 위한 것이며 설명된 주제를 제한하는 것으로 해석되어서는 안된다.

III. 예시적 구현예

[0307] 본 발명에서 제공되는 구현예들은 하기와 같다:

1. 폴리뉴클레오티드로서,

재조합 단백질을 코딩하는 핵산;

상기 핵산과 작동적으로 연결되는 변형된 전사-후 조절 인자 (PRE)로서, 상기 변형된 PRE는 야생형 또는 비변형된 헤파티티스 바이러스 X 유전자의 변이체를 포함하고, 상기 변이체 X 유전자는 상기 야생형 또는 비변형된 X 유전자에는 존재치 않는 종결 코돈

을 포함하는 것인 폴리뉴클레오티드.

2. 구현예 1에 있어서, 상기 종결 코돈은:

상기 야생형 X 단백질 오픈 리딩 프레임의 개시 코돈의 5' 위치에 대응하는 상기 변이체 X 유전자의 위치로부터 3' 방향으로 36 또는 24개 뉴클레오티드 내 위치에서 시작하는 종결 코돈; 및/또는

SEQ ID NO: 1 또는 SEQ ID NO:125에 기재되는 WHV 전사-후 조절 요소 (WPRE)의 잔기 411 및 또는 SEQ ID NO: 2에 기재되는 WHV의 잔기 1503에 대응하는 위치로부터 3' 방향으로 36 또는 24개 뉴클레오티드 내 위치에서 시작하는 종결 코돈

중에서 선택되는 하나 이상의 종결 코돈을 포함하는 것인 폴리뉴클레오티드.

3. 구현예 1 또는 구현예 2에 있어서, 상기 변이체 X 유전자는 39개 또는 약 39개 뉴클레오티드 길이 또는 27개 또는 약 27개 뉴클레오티드 길이보다 큰 오픈 리딩 프레임을 포함하지 않는 것인 폴리뉴클레오티드.

4. 변형된 전사-후 조절 요소 (PRE)를 포함하는 폴리뉴클레오티드로서, 상기 변형된 PRE는 야생형 또는 비변형된 헤파티티스 바이러스 X 유전자의 변이체를 포함하고, 상기 변이체 X 유전자는 상기 야생형 또는 비변형된 X 유전자에는 존재치 않는 종결 코돈을 포함하며, 상기 종결 코돈은:

상기 야생형 X 단백질 오픈 리딩 프레임의 개시 코돈의 5' 위치에 대응하는 상기 변이체 X 유전자의 위치로부터 3' 방향으로 33 또는 30개 뉴클레오티드 내 위치에서 시작하는 종결 코돈; 및/또는

SEQ ID NO: 1 또는 SEQ ID NO:125에 기재되는 WHV 전사-후 조절 요소 (WPRE)의 잔기 411 및 또는 SEQ ID NO: 2에 기재되는 WHV의 잔기 1503에 대응하는 위치로부터 3' 방향으로 32 또는 30개 뉴클레오티드 내 위치에서 시작하는 종결 코돈

중에서 선택되는 하나 이상을 포함하는 것인 폴리뉴클레오티드.

5. 구현예 4에 있어서, 상기 변이체 X 유전자는 33개 뉴클레오티드 길이와 같거나 그 미만인 오픈 리딩 프레임을 포함하는 것인 폴리뉴클레오티드.

6. 구현예 1 내지 5 중 어느 하나에 있어서, 상기 종결 코돈은 복수개의 종결 코돈을 포함하는 것인 폴리뉴클레오티드.

7. 구현예 6에 있어서, 상기 복수개의 종결 코돈은 상기 변이체 X 유전자에 존재하는 각각의 리딩 프레임 내 하나 이상의 종결 코돈을 포함 및/또는 동일한 리딩 프레임 내 2 이상의 종결 코돈을 포함하는 것인 폴리뉴클레오티드.

8. 변형된 전사-후 조절 요소 (PRE)를 포함하는 폴리뉴클레오티드로서, 상기 변형된 PRE는 야생형 또는 비변형된 헤파티티스 바이러스 X 유전자의 변이체를 포함하고, 상기 변이체 X 유전자는 상기 야생형 또는 비변형된 X 유전자에는 존재치 않는 복수개의 종결 코돈을 포함하는 것인 폴리뉴클레오티드.

9. 구현예 8에 있어서, 상기 복수개의 종결 코돈은:

상기 야생형 X 단백질 오픈 리딩 프레임의 개시 코돈의 5' 위치에 대응하는 상기 변이체 X 유전자의 위치로부터 3' 방향으로 36, 30 또는 24개 뉴클레오티드 내 위치에서 시작하는 종결 코돈; 및/또는

SEQ ID NO: 1 또는 SEQ ID NO:125에 기재되는 WHV 전사-후 조절 요소 (WPRE)의 잔기 411 및 또는 SEQ ID NO: 2에 기재되는 WHV의 잔기 1503에 대응하는 위치로부터 3' 방향으로 36, 30 또는 24개 뉴클레오티드 내 위치에서 시작하는 종결 코돈

10. 구현예 9에 있어서, 상기 변이체 X 유전자는 39개 또는 약 39개 뉴클레오티드 길이, 33개 또는 약 33개 뉴클레오티드 길이, 또는 27개 또는 약 27개 뉴클레오티드 길이보다 큰 오픈 리딩 프레임을 포함하지 않는 것인 폴리뉴클레오티드.

11. 구현예 8-10 중 어느 하나에 있어서, 상기 변이체 X 유전자는 2 이상의 종결 코돈, 3 이상의 종결 코돈, 또는 4 이상의 종결 코돈을 포함하는 것인 폴리뉴클레오티드.

12. 구현예 8-11 중 어느 하나에 있어서, 상기 변이체 X 유전자는 상기 변이체 X 유전자에 존재하는 각각의 리딩 프레임 내에 종결 코돈을 포함하는 것인 폴리뉴클레오티드.

13. 구현예 4-12 중 어느 하나에 있어서, 상기 변형된 PRE에 작동적으로 연결된 재조합 단백질을 코딩히는 핵산을 더 포함하는 것인 폴리뉴클레오티드.

14. 구현예 1-13 중 어느 하나에 있어서, 상기 종결 코돈은:

상기 야생형 또는 비변형된 X 단백질 오픈 리딩 프레임의 개시 코돈의 5' 위치에 대응하는 상기 변이체 X 유전자의 위치로부터 3' 방향으로 9, 12, 15 또는 18개 이상 뉴클레오티드 내 위치에서 시작하는 종결 코돈; 및/또는

SEQ ID NO: 1 또는 SEQ ID NO:125에 기재되는 WHV 전사-후 조절 요소 (WPRE)의 잔기 411 및 또는 SEQ ID NO: 2에 기재되는 WHV의 잔기 1503에 대응하는 위치로부터 3' 방향으로 9, 12, 15 또는 18개 이상 뉴클레오티드 내 위치에서 시작하는 종결 코돈

15. 구현예 14에 있어서, 상기 변이체 X 유전자는 21개 또는 약 21개 뉴클레오티드 길이, 18개 또는 약 18개 뉴클레오티드 길이, 15개 또는 약 15개 뉴클레오티드 길이, 12개 또는 약 12개 뉴클레오티드 길이보다 큰 오픈 리딩 프레임을 포함하지 않는 것인 폴리뉴클레오티드.

16. 구현예 1-15 중 어느 하나에 있어서,

상기 변형된 PRE는 SEQ ID NO:1 또는 SEQ ID NO:125의 뉴클레오티드 잔기 448-470에 대응하는 베타 스템 루프를 함유하고; 및/또는

상기 변형된 PRE는 SEQ ID NO:1 또는 SEQ ID NO:125의 뉴클레오티드 448-470에 대응하는 상기 베타 스템 루프 내 위치에 뉴클레오티드 변화를 함유하지 않고; 및/또는

상기 종결 코돈 또는 종결 코돈들은 SEQ ID NO:1 또는 SEQ ID NO:125의 뉴클레오티드 448-470에 대응하는 상기 베타 스템 루프 내 위치에 뉴클레오티드를 포함하지 않는 것인 폴리뉴클레오티드.

17. 구현예 1-16 중 어느 하나에 있어서, 상기 종결 코돈은 앰버 (TAG), 오커 (TAA), 또는 오팔 (TGA) 종결 코돈 중에서 선택되는 것인 폴리뉴클레오티드.

18. 구현예 1-17 중 어느 하나에 있어서, 상기 종결 코돈은 핵산 치환, 결실 또는 삽입에 의하여 도입되는 것인 폴리뉴클레오티드.

19. 구현예 1-18 중 어느 하나에 있어서, 상기 종결 코돈은:

상기 야생형 또는 비변형된 X 단백질 오픈 리딩 프레임의 개시 코돈의 5' 위치에 대응하는 상기 변이체 X 유전자의 위치로부터 3' 방향으로 위치 9 및/또는 SEQ ID NO:1 또는 SEQ ID NO:125에 기재되는 서열에서 위치 420에 대응하는 뉴클레오티드 위치에서 시작하는 종결 코돈;

상기 야생형 또는 비변형된 X 단백질 오픈 리딩 프레임의 개시 코돈의 5' 위치에 대응하는 상기 변이체 X 유전자의 위치로부터 3' 방향으로 위치 13 및/또는 SEQ ID NO:1 또는 SEQ ID NO:125에 기재되는 서열에서 위치 424에 대응하는 뉴클레오티드 위치에서 시작하는 종결 코돈;

상기 야생형 또는 비변형된 X 단백질 오픈 리딩 프레임의 개시 코돈의 5' 위치에 대응하는 상기 변이체 X 유전자의 위치로부터 3' 방향으로 위치 17 및/또는 SEQ ID NO:1 또는 SEQ ID NO:125에 기재되는 서열에서 위치 428에 대응하는 뉴클레오티드 위치에서 시작하는 종결 코돈;

상기 야생형 또는 비변형된 X 단백질 오픈 리딩 프레임의 개시 코돈의 5' 위치에 대응하는 상기 변이체 X 유전자의 위치로부터 3' 방향으로 위치 21 및/또는 SEQ ID NO:1 또는 SEQ ID NO:125에 기재되는 서열에서 위치 432에 대응하는 뉴클레오티드 위치에서 시작하는 종결 코돈

중에서 선택되는 것인 폴리뉴클레오티드.

20. 구현예 17-19 중 어느 하나에 있어서, 상기 종결 코돈은 앰버 (TAG) 또는 오팔 (TGA) 종결 코돈인 것인 폴리뉴클레오티드.

21. 구현예 1-20 중 어느 하나에 있어서,

상기 변이체 X 유전자는 180개 이하의 뉴클레오티드 길이이거나 210개 또는 약 210개 뉴클레오티드 길이 이하이고; 및/또는

상기 변이체 X 유전자는 90개 또는 약 90개 뉴클레오티드 길이 이상 또는 약 120개 뉴클레오티드 길이 이상 또는 180개 또는 약 180개 뉴클레오티드 길이 이상인 것인 폴리뉴클레오티드.

22. 구현예 1-21 중 어느 하나에 있어서,

상기 변이체 X 유전자는, 야생형 또는 비변형된 포유류 헤파티티스 X 유전자의 변이체 또는 그의 절단된 일부분인데, 이는 필요에 따라 PRE에 존재하는 절단된 부분이거나

상기 변형된 PRE는 SEQ ID NO:28를 포함하는 변이체 X 유전자를 포함하는 것인 폴리뉴클레오티드.

23. 구현예 22에 있어서, 상기 야생형 또는 비변형된 포유류 헤파티티스 X 유전자는 야생형 우드척 헤파티티스 바이러스 (WHV) X 유전자 또는 그의 절단된 일부분인데, 이는 필요에 따라 야생형 또는 비변형된 PRE에 존재하는 절단된 일부분인 것인 폴리뉴클레오티드.

24. 구현예 23에 있어서, 상기 야생형 또는 비변형된 WHV X 유전자 또는 상기 PRE에 존재하는 야생형 X 유전자의 절단된 일부분은 SEQ ID NOS: 1 및 12-20 중 어느 하나의 뉴클레오티드 411-592에 기재되는 또는 SEQ ID NO:125의 뉴클레오티드 411-589에 기재되는 뉴클레오티드 서열을 포함하는 것인 폴리뉴클레오티드.

25. 구현예 23 또는 구현예 24에 있어서, 상기 야생형 WHV X 유전자는 SEQ ID NO: 9의 뉴클레오티드 서열을 포함하거나 또는 그의 절단된 일부분인데, 이는 필요에 따라 SEQ ID NO:10에 기재되거나 야생형 또는 비변형된 PRE에 존재하는 절단된 일부분인 것인 폴리뉴클레오티드.

26. 구현예 1-25 중 어느 하나에 있어서, 상기 변형된 PRE는 야생형 또는 비변형된 헤파티티스 바이러스 PRE의 시스-작용성 전사-후 조절 요소 또는 그 기능적 변이체(들)을 2 이상 또는 3 이상 포함하는 것인 폴리뉴클레오티드.

27. 구현예 26에 있어서, 상기 2 이상 또는 3 이상의 하위요소들은 야생형 또는 비변형된 PRE 알파 하위요소 또는 그의 기능적 변이체, 야생형 또는 비변형된 PRE 베타 하위요소의 기능적 변이체, 및/또는 야생형 또는 비변형된 PRE 감마 하위요소 또는 그의 기능적 변이체를 포함하는 것인 폴리뉴클레오티드.

28. 구현예 1-27 중 어느 하나에 있어서, 상기 변형된 PRE는 야생형 또는 비변형된 헤파티티스 바이러스 PRE의 알파 하위요소 또는 그의 기능적 변이체 및 야생형 또는 비변형된 PRE 베타 하위요소의 기능적 변이체를 포함하는 것인 폴리뉴클레오티드.

29. 구현예 27 또는 구현예 28에 있어서, 상기 알파 하위요소는 SEQ ID NO: 3의 서열 또는 그의 변이체를 포함, 상기 베타 하위요소는 SEQ ID NO: 6의 서열의 변이체를 포함, 및/또는 상기 감마 하위유닛은 SEQ ID NO: 8의 서열 또는 그의 변이체를 포함하는 것인 폴리뉴클레오티드.

30. 구현예 1-29 중 어느 하나에 있어서, 상기 변형된 PRE는 야생형 포유류 헤파티티스 PRE인 야생형 또는 비변형된 헤파티티스 바이러스 PRE에 비해 뉴클레오티드 변형을 포함하는 것인 폴리뉴클레오티드.

31. 구현예 30에 있어서, 상기 야생형 또는 비변형된 포유류 헤파티티스 바이러스 PRE는 SEQ ID NOS: 1,12-27 및 125 중 하나에 기재된 뉴클레오티드 서열을 포함하는 것인 폴리뉴클레오티드.

32. 구현예 30 또는 구현예 31에 있어서, 상기 야생형 또는 비변형된 포유류 헤파티티스 PRE는 야생형 우드척 헤파티티스 바이러스 PRE (WPRE)인 것인 폴리뉴클레오티드.

33. 구현예 1-32 중 어느 하나에 있어서, 상기 야생형 또는 비변형된 헤파티티스 PRE는:

a) SEQ ID NO:1 또는 SEQ ID NO:125에 기재되는 뉴클레오티드 서열, 또는 SEQ ID NO:1 또는 SEQ ID NO:125의 전사-후 활성과 실질적으로 동일한, 예컨대 그의 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상을 나타내는, SEQ ID NO:1 또는 SEQ ID NO:125와 94% 이상의 서열 상동성을 나타내는 뉴클레오티드 서열; 및

b) a)의 뉴클레오티드 서열의 일부분을 포함하는 변형된 PRE로서, 상기 일부분은 상기 전사-후 활성을 나타내거나 보유하는 것인 변형된 PRE

를 포함하는 것인 폴리뉴클레오티드.

34. 구현예 33에 있어서, 상기 야생형 또는 비변형된 헤파티티스 PRE는 SEQ ID NO:1 또는 SEQ ID NO:125과 95%, 96%, 97%, 98%, 99% 이상의 서열 상동성을 나타내는 뉴클레오티드 서열을 포함하는 것인 폴리뉴클레오티드.

35. 구현예 1-34 중 어느 하나에 있어서, 상기 야생형 또는 비변형된 헤파티티스 PRE는 SEQ ID NOS: 1,12-20 및 125 중 하나에 기재된 뉴클레오티드 서열을 포함하는 것인 폴리뉴클레오티드.

36. 구현예 1-35 중 어느 하나에 있어서, 상기 야생형 또는 비변형된 헤파티티스 PRE는 SEQ ID NO: 1 또는 SEQ ID NO:125의 뉴클레오티드 서열을 포함하는 것인 폴리뉴클레오티드.

37. 구현예 1-36 중 어느 하나에 있어서, 상기 변이체 X 유전자는 SEQ ID NO: 1 또는 SEQ ID NO:125의 위치 411에 대응ㅇ하는 위치에서 시작하는 개시 코돈을 포함하는 것인 폴리뉴클레오티드.

38. 구현예 37에 있어서, 상기 개시 코돈은 ATG 개시 코돈인 것인 폴리뉴클레오티드.

39. 구현예 1-38 중 어느 하나에 있어서, 상기 변이체 X 유전자는 상기 변이체 X 유전자와 작동적으로 연결된 프로모터를 더 포함하는 것인 폴리뉴클레오티드.

40. 구현예 39에 있어서, 상기 프로모터는 SEQ ID NO: 11에 기재되는 서열 또는 야생형 WHV X 유전자 프로모터 서열을 포함하는 야생형 또는 비변형된 X 유전자 프로모터인 것인 폴리뉴클레오티드.

41. 구현예 1-40 중 어느 하나에 있어서, 상기 변형된 PRE는:

a) SEQ ID NO:1 또는 SEQ ID NO:125과 65% 이상의 서열 상동성을 나타내는 뉴클레오티드 서열을 포함하는 변형된 PRE로서, 상기 변형된 PRE는 SEQ ID NO:1 또는 SEQ ID NO:125에 존재치 않는 하나 이상의 종결 코돈을 포함하는 변이체 X 유전자를 함유하는 것인 변형된 PRE; 및

b) a)의 뉴클레오티드 서열의 일부분을 포함하는 변형된 PRE로서, 상기 일부분은 하나 이상의 종결 코돈을 포함하는 변이체 X 유전자를 포함하고, 상기 일부분은 전사-후 활성을 나타내는 것인 변형된 PRE

중에서 선택되는 것인 폴리뉴클레오티드.

42. 구현예 41에 있어서, 상기 변형된 PRE는 SEQ ID NO:1 또는 SEQ ID NO:125와 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 상동성을 나타내는 뉴클레오티드 서열을 포함하는 것인 폴리뉴클레오티드.

43. 구현예 41 또는 구현예 42에 있어서, 상기 변이체 X 유전자는 2 이상의 종결 코돈, 3 이상의 종결 코돈 또는 4 이상의 종결 코돈을 포함하는 것인 폴리뉴클레오티드.

44. 구현예 41-43 중 어느 하나에 있어서, 상기 변이체 X 유전자는 상기 변이체 X 유전자 내 각각의 오픈 리딩 프레임에 종결 코돈을 포함하는 것인 폴리뉴클레오티드.

45. 구현예 1-44 중 어느 하나에 있어서, 상기 변이체 X 유전자는 SEQ ID NOS: 44-58 또는 SEQ ID NOS: 141-155 중 하나에 기재된 뉴클레오티드 서열을 포함 및/또는 상기 변형된 PRE는 SEQ ID NOS:29-43 또는 SEQ ID NOS: 126-140 중 하나에 기재된 뉴클레오티드 서열을 포함하는 것인 폴리뉴클레오티드.

46. 구현예 1-45 중 어느 하나에 있어서, 상기 변형된 PRE는 상기 야생형 또는 비변형된 PRE에 존재치 않는 하나 이상의 종결 코돈 외에 어떠한 변형을 함유하지 않는 것인 폴리뉴클레오티드.

47. 구현예 1-46 중 어느 하나에 있어서, 상기 변형된 PRE는 상기 야생형 또는 비변형된 PRE에 존재치 않는 하나 이상의 종결 코돈 외에 추가적인 변형을 함유하는 것인 폴리뉴클레오티드.

48. 구현예 1-47 중 어느 하나에 있어서, 상기 변이체 X 유전자는 야생형 또는 비변형된 헤파티티스 바이러스 X 유전자 개시 코돈과 비교하여 및/또는 SEQ ID NO: 1 또는 SEQ ID NO:125의 뉴클레오티드 위치 411-413에 대응하는 개시 코돈과 비교하여 하나 이상의 뉴클레오티드 차이를 포함하는 개시 코돈의 변이체를 더 포함하는 것인 폴리뉴클레오티드.

49. 구현예 48에 있어서, 상기 하나 이상의 차이는 상기 개시 코돈으로부터의 번역 개시를 제한하거나 저지하는 결과를 낳는 것인 폴리뉴클레오티드.

50. 구현예 47-49 중 어느 하나에 있어서, 상기 변이체 X 유전자는 SEQ ID NOS: 74-88 또는 171-185 중 하나에 기재된 뉴클레오티드 서열을 포함 및/또는 상기 변형된 PRE는 SEQ ID NOS:59-73 또는 156-170 중 하나에 기재된 뉴클레오티드 서열을 포함하는 것인 폴리뉴클레오티드.

51. 구현예 1-50 중 어느 하나에 있어서, 상기 변이체 X 유전자는 상기 변이체 X 유전자에 작동적으로 연결된 변이체 프로모터를 포함하고, 상기 변이체 프로모터는 야생형 또는 비변형된 헤파티티스 바이러스 X 유전자 프로모터와 비교하여 및/또는 SEQ ID NO: 11의 프로모터와 비교하여 하나 이상의 뉴클레오티드 차이를 포함하는 것인 폴리뉴클레오티드.

52. 구현예 51에 있어서, 상기 하나 이상의 차이는 상기 프로모터로부터의 전사를 제한하거나 저지하는 결과를 낳는 것인 폴리뉴클레오티드.

53. 구현예 51 또는 52에 있어서, 상기 변형된 PRE는 SEQ ID NOS: 89-118 또는 186-215 중 하나에 기재된 뉴클레오티드 서열을 포함하는 것인 폴리뉴클레오티드.

54. 구현예 1-53 중 어느 하나에 있어서,

진핵 세포에 도입시, 상기 변이체 X 유전자에 의하여 코딩되는 12, 11, 10, 9, 또는 8개 아미노산 길이보다 큰 길이의 어떠한 폴리펩타이드도 생성되지 않고; 및/또는

상기 폴리뉴클레오티드는 상기 변이체 X 유전자에 의하여 코딩되는 12, 11, 10, 9, 또는 8개 아미노산보다 큰 길이의 폴리펩타이드를 생성할 수 없는 것인 폴리뉴클레오티드.

55. 구현예 1-54 중 어느 하나에 있어서, 상기 변형된 PRE는 핵 RNA 방출을 촉진 및/또는 mRNA 안정성을 증가시키는 RNA를 코딩하는 것인 폴리뉴클레오티드.

56. 구현예 1-55 중 어느 하나에 있어서, 상기 변형된 PRE는 핵 RNA 방출을 촉진 및/또는 mRNA 안정성을 증가시키는 RNA 폴리뉴클레오티드를 코딩하고, 상기 핵 RNA 방출의 촉진 및/또는 mRNA 안정성은 상기 재조합 단백질의 발현을 증가시키는 것인 폴리뉴클레오티드.

57. 구현예 1-56 중 어느 하나에 있어서, 상기 변형된 PRE는,

대응하는 야생형 또는 비변형된 헤파티티스 PRE 및/또는

SEQ ID NO:1, SEQ ID NO:119, SEQ ID NO:120, SEQ ID NO:125 및/또는 SEQ ID NO:216에 기재되는 PRE로서, 이는, 몇 가지 경우에 있어서, 상기 야생형 또는 비변형된 헤파티티스 PRE의 전사-후 활성의 65%, 70%, 75%, 80%, 85%, 90% 또는 95% 이상 또는 약 65%, 70%, 75%, 80%, 85%, 90% 또는 95% 이상인 PRE 및/또는

SEQ ID NO:1, SEQ ID NO:119, SEQ ID NO:120, SEQ ID NO:125 또는 SEQ ID NO:216에 기재되는 PRE

의 전사-후 활성을 보유하는 것인 폴리뉴클레오티드.

58. 구현예 1-57 중 어느 하나에 있어서, 상기 변이체 X 유전자는 상기 야생형 또는 비변형된 헤파티티스 X 유전자에는 존재치 않는 번역-후 변형 신호를 코딩하는 서열을 더 포함하는 것인 폴리뉴클레오티드.

59. 변형된 전사-후 조절 요소 (PRE)를 포함하는 폴리뉴클레오티드로서, 상기 변형된 PRE는 야생형 또는 비변형된 헤파티티스 바이러스 X 유전자의 변이체를 포함하고, 상기 변이체 X 유전자는 상기 야생형 또는 비변형된 헤파티티스 바이러스 X 유전자에는 존재치 않는 번역-후 변형을 코딩하는 서열을 포함하는 폴리뉴클레오티드.

60. 구현예 58 또는 구현예 59에 있어서, 상기 번역-후 변형 신호는 유비퀴틴화 부위를 포함하는 것인 폴리뉴클레오티드.

61. 구현예 58 또는 구현예 59에 있어서, 상기 번역-후 변형 신호는:

상기 X 단백질 오픈 리딩 프레임의 개시 코돈의 5' 위치에 대응하는 상기 변이체 X 유전자의 위치로부터 3' 방향으로 2, 3, 4, 5 또는 6개 이상의 뉴클레오티드 내 위치에서 시작하는 제1 코돈으로서, 상기 제1 코돈은 N-말단 법칙에 따라 글리신, 아르기닌, 글루탐산, 페닐알라닌, 아스파테이트, 시스테인, 리신, 아스파라긴, 세린, 티로신, 트립토판, 히스티딘 또는 류신 잔기를 코딩하는 제1 코돈; 및 필요에 따라

상기 X 단백질 오픈 리딩 프레임의 개시 코돈의 5' 위치에 대응하는 상기 변이체 X 유전자의 위치로부터 3' 방향으로 2, 3, 4, 5 또는 6개 이상의 뉴클레오티드 내 위치에서 시작하는 제2 코돈으로서, 상기 제2 코돈은 N-말단 법칙에 따라 글루탐산 또는 아스파라긴 잔기를 코딩하는 것인 제2 코돈

을 포함하는 것인 폴리뉴클레오티드.

62. 구현예 58 또는 구현예 59에 있어서, 상기 번역 후 변형 신호는 하나 이상의 PEST 서열을 포함하는 것인 폴리뉴클레오티드.

63. 구현예 59-62 중 어느 하나에 있어서, 상기 변형된 PRE에 작동적으로 연결된 재조합 또는 단백질을 코딩하는 핵산을 더 포함하는 것인 폴리뉴클레오티드.

64. 구현예 59-63 중 어느 하나에 있어서,

상기 변이체 X 유전자는 SEQ ID NO:1의 뉴클레오티드 잔기 448-470에 대응하는 베타 스템 루프를 함유하는 번역-후 변형 신호를 코딩하는 서열을 포함하고; 및/또는

상기 변이체 X 유전자는 SEQ ID NO:1의 뉴클레오티드 잔기 448-470에 대응하는 베타 스템 루프 내 위치에서 뉴클레오티드 변화를 함유하지 않는 번역-후 변형 신호를 코딩하는 서열을 포함하는 것인 폴리뉴클레오티드.

65. 구현예 59-64 중 어느 하나에 있어서,

상기 변이체 X 유전자는 180개 뉴클레오티드 길이 이하이거나 210개 또는 약 210 뉴클레오티드 길이 이하이고; 및/또는

상기 변이체 X 유전자는 90개 또는 약 90개 뉴클레오티드 길이 이상이거나 약 120개 뉴클레오티드 길이 이상이거나 180개 또는 약 180개 뉴클레오티드 길이 이상인 것인 폴리뉴클레오티드.

66. 구현예 59-65 중 어느 하나에 있어서, 상기 변이체 X 유전자는 야생형 또는 비변형된 포유류 헤파티티스 X 유전자 또는 그의 절단된 일부분인데, 이는 필요에 따라 PRE에 존재하는 절단된 일부분인 것인 폴리뉴클레오티드.

67. 구현예 66에 있어서, 상기 야생형 또는 비변형된 포유류 헤파티티스 X 유전자는 야생형 우드척 헤파티티스 바이러스 (WHV) X 유전자 또는 그의 절단된 일부분인데, 이는 필요에 따라 야생형 또는 비변형된 PRE에 존재하는 절단된 일부분인 것인 폴리뉴클레오티드.

68. 구현예 67에 있어서, 상기 야생형 또는 비변형된 WHV X 유전자 또는 상기 PRE에 존재하는 야생형 X 유전자의 절단된 일부분은 SEQ ID NO: 2의 뉴클레오티드 1503-1928로서 기재되는 뉴클레오티드 서열, SEQ ID NOS: 1 및 12-20 중 하나의 뉴클레오티드 411-592로서 기재되는 뉴클레오티드 서열, 또는 SEQ ID NO:125의 뉴클레오티드 411-589로서 기재되는 뉴클레오티드 서열을 포함하는 것인 폴리뉴클레오티드.

69. 구현예 67 또는 구현예 68에 있어서, 상기 야생형 WHV X 유전자는 SEQ ID NO: 9의 뉴클레오티드 서열을 포함하거나 그의 절단된 일부분인데, 이는 필요에 따라 SEQ ID NO:10에 기재된 것이거나 야생형 또는 비변형된 PRE에 존재하는 절단된 일부분인 것인 폴리뉴클레오티드.

70. 구현예 59-69 중 어느 하나에 있어서, 상기 변형된 PRE는 야생형 또는 비변형된 헤파티티스 바이러스 PRE의 시스-작용성 전사-후 조절 하위요소 또는 그 기능성 변이체(들)을 2 이상 또는 3 이상 포함하는 것인 폴리뉴클레오티드.

71. 구현예 70에 있어서, 상기 2 이상 또는 3 이상의 하위요소는 야생형 또는 비변형된 PRE 알파 하위요소 또는 그 기능성 변이체, 야생형 또는 비변형된 PRE 베타 하위요소의 기능성 변이체, 및/또는 야생형 또는 비변형된 PRE 감마 하위요소 또는 그 기능성 변이체를 포함하는 것인 폴리뉴클레오티드.

72. 구현예 59-71 중 어느 하나에 있어서, 상기 변형된 PRE는 야생형 또는 비변형된 헤파티티스 바이러스 PRE의 알파 하위요소 또는 그 기능성 변이체 및 야생형 또는 비변형된 PRE 베타 하위요소의 기능성 변이체를 포함하는 것인 폴리뉴클레오티드.

73. 구현예 71 또는 구현예 72에 있어서, 상기 알파 하위요소는 SEQ ID NO: 3의 서열 또는 그 변이체를 포함, 상기 베타 하위요소는 SEQ ID NO: 6의 서열의 변이체를 포함, 및/또는 상기 감마 하위유닛은 SEQ ID NO: 8의 서열 또는 그 변이체를 포함하는 것인 폴리뉴클레오티드.

74. 구현예 1-73 중 어느 하나에 있어서, 상기 변형된 PRE는 야생형 포유류 헤파티티스 PRE인 야생형 또는 비변형된 헤파티티스 바이러스 PRE와 비교하여 뉴클레오티드 변형을 포함하는 것인 폴리뉴클레오티드.

75. 구현예 74에 있어서, 상기 야생형 또는 비변형된 포유류 헤파티티스 바이러스 PRE는 SEQ ID NOS: 1,12-27 및 125 중 하나에 기재된 뉴클레오티드 서열을 포함하는 것인 폴리뉴클레오티드.

76. 구현예 74 또는 구현예 75에 있어서, 상기 야생형 또는 비변형된 포유류 헤파티티스 PRE는 야생형 우드척 바이러스 PRE (WPRE)인 것인 폴리뉴클레오티드.

77. 구현예 1-76 중 어느 하나에 있어서, 상기 야생형 또는 비변형된 헤파티티스 PRE는:

a) SEQ ID NO:1 또는 SEQ ID NO:125에 기재된 뉴클레오티드 서열, 또는 SEQ ID NO:1 또는 SEQ ID NO:125의 전사-후 활성과 실질적으로 동일한, 예컨대 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상을 나타내는 SEQ ID NO:1 또는 SEQ ID NO:125와 94% 이상의 서열 상동성을 나타내는 뉴클레오티드 서열; 및

b) a)의 뉴클레오티드 서열의 일부분을 포함하는 변형된 PRE로서, 상기 일부분은 전사-후 활성을 나타내거나 보유하는 것인 변형된 PRE

를 포함하는 것인 폴리뉴클레오티드.

78. 구현예 77에 있어서, 상기 야생형 또는 비변형된 헤파티티스 PRE는 SEQ ID NO:1 또는 SEQ ID NO:125와 95%, 96%, 97%, 98%, 99% 이상의 서열 상동성을 나타내는 뉴클레오티드 서열을 포함하는 것인 폴리뉴클레오티드.

79. 구현예 59-78 중 어느 하나에 있어서, 상기 야생형 또는 비변형된 헤파티티스 PRE는 SEQ ID NOS: 1,12-20 및 125 중 하나에 기재된 뉴클레오티드 서열을 포함하는 것인 폴리뉴클레오티드.

80. 구현예 59-79 중 어느 하나에 잇어서, 상기 야생형 또는 비변형된 헤파티티스 PRE는 SEQ ID NO: 1 또는 SEQ ID NO:125의 뉴클레오티드 서열을 포함하는 것인 폴리뉴클레오티드.

81. 구현예 59-80 중 어느 하나에 있어서, 상기 변이체 X 유전자는 SEQ ID NO: 1 또는 SEQ ID NO:125의 위치 411에 대응하는 위치에서 시작하는 개시 코돈을 포함하는 것인 폴리뉴클레오티드.

82. 구현예 81에 있어서, 상기 개시 코돈은 ATG 개시 코돈인 것인 폴리뉴클레오티드.

83. 구현예 59-82 중 어느 하나에 있어서, 상기 변이체 X 유전자는 상기 변이체 X 유전자에 작동적으로 연결된 프로모터를 더 포함하는 것인 폴리뉴클레오티드.

84. 구현예 83에 있어서, 상기 프로모터는 SEQ ID NO: 11에 기재되는 서열 또는 야생형 WHV X 유전자 프로모터 서열을 포함하는 야생형 또는 비변형된 X 유전자 프로모터인 것인 폴리뉴클레오티드.

85. 구현예 59-84 중 어느 하나에 있어서, 상기 변형된 PRE는:

a) SEQ ID NO:1 또는 SEQ ID NO:125와 65% 이상의 서열 상동성을 나타내는 뉴클레오티드 서열을 포함하는 변형된 PRE로서, 상기 변형된 PRE는 SEQ ID NO:1 또는 SEQ ID NO:125에 존재치 않는 번역-후 변형 신호를 코딩하는 서열을 포함하는 변이체 X 유전자를 함유하는 것인 변형된 PRE; 및

b) a)의 뉴클레오티드 서열의 일부분을 포함하는 변형된 PRE로서, 상기 일부분은 번역-후 변형을 코딩하는 서열을 포함하는 변이체 X 유전자를 포함하고 상기 일부분은 전사-후 활성을 나타내는 것인 변형된 PRE

중에서 선택되는 것인 폴리뉴클레오티드.

86. 구현예 85에 있어서, 상기 변형된 PRE는 SEQ ID NO:1 또는 SEQ ID NO:125와 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 상동성을 나타내는 뉴클레오티드 서열을 포함하는 것인 폴리뉴클레오티드.

87. 구현예 1-86 중 어느 하나에 있어서, 상기 변이체 X 유전자는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 또는 12개 이하의 뉴클레오티드 변화를 포함하는 것인 폴리뉴클레오티드.

88. 구현예 59-87 중 어느 하나에 있어서, 상기 변형된 PRE는 번역-후 변형 신호 외에 어떠한 변형을 함유하지 않는 것인 폴리뉴클레오티드.

89. 구현예 59-88 중 어느 하나에 있어서, 상기 변형된 PRE는 상기 야생형 또는 비변형된 헤파티티스 바이러스 X 유전자에 존재치 않는 번역-후 변형 신호를 코딩하는 서열 외 추가적인 변형(들)을 함유하는 것인 폴리뉴클레오티드.

90. 구현예 89에 있어서, 상기 추가적인 변형(들)은 변이체 X 유전자인 것인 폴리뉴클레오티드.

91. 구현예 90에 있어서, 상기 추가적인 변형(들)은 비활성화 X 단백질 및/또는 절단된 X 단백질을 코딩하는 변이체 X 유전자라는 결과를 낳는 것인 폴리뉴클레오티드.

92. 구현예 59-91 중 어느 하나에 있어서, 상기 변형된 PRE는 핵 RNA 방출을 촉진 및/또는 mRNA 안정성을 증가시키는 RNA를 코딩하는 것인 폴리뉴클레오티드.

93. 구현예 59-92 중 어느 하나에 있어서, 상기 변형된 PRE는 핵 RNA 방출을 촉진 및/또는 mRNA 안정성을 증가시키는 RNA를 코딩하고, 상기 핵 RNA 방출의 촉진 및/또는 mRNA 안정성은 상기 재조합 단백질의 발현을 증가시키는 것인 폴리뉴클레오티드.

94. 구현예 59-93 중 어느 하나에 있어서, 상기 변형된 PRE는

대응하는 야생형 또는 비변형된 헤파티티스 PRE 및/또는

의 전사-후 활성을 보유하는 것인 폴리뉴클레오티드.

95. 변이체 Flap을 포함하는 바이러스 핵산을 포함하는 폴리뉴클레오티드로서, 상기 변이체 Flap은 야생형 또는 비변형된 Flap 서열의 중앙 폴리퓨린 트랙 (cPPT) 및/또는 중앙 종결 서열 (CTS)에 대응하는 뉴클레오티드의 전부 또는 일부분의 결실을 함유하는 것인 폴리뉴클레오티드.

96. 구현예 95에 있어서, 상기 변이체 Flap은 상기 cPPT 및 CTS에 대응하는 뉴클레오티드의 전부 또는 일부분, 이는 인접한 일부일 수 있는 일부분의 결실을 포함하는 것인 폴리뉴클레오티드.

97. 야생형 또는 비변형된 Flap 서열은 레트로바이러스, 이는 필요에 따라 렌티바이러스이고, 이는 필요에 따라 HIV-1의 상기 cPPT 및 CTS 영역을 포함하는 80 내지 200개 또는 약 80 내지 200개의 인접한 뉴클레오티드를 포함하고; 및/또는

야생형 또는 비변형된 Flap 서열은 a) SEQ ID NO:121에 기재되는 뉴클레오티드 서열; b) 상기 cPPT 및/또는 CTS 영역을 함유하는 SEQ ID NO:121에 기재된 뉴클레오티드 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 상동성을 포함하는 뉴클레오티드 서열; 또는 c) 상기 cPPT 및/또는 CTS 영역을 함유하는 a) 또는 b)의 인접한 일부분을 포함하는 구현예 95 또는 96에 기재된 변이체 Flap 폴리뉴클레오티드.

98. 변이체 Flap은 SEQ ID NO: 123에 기재된 cPPT 영역의 뉴클레오티드에 대응하는 뉴클레오티드의 전부 또는 일부분, 이는 인접한 일부분일 수 있는 일부분의 결실을 포함하고; 및/또는

변이체 Flap은 SEQ ID NO: 124에 기재된 CTS 영역의 뉴클레오티드에 대응하는 뉴클레오티드의 전부 또는 일부분, 이는 인접한 일부분일 수 있는 일부분의 결실을 포함하는 구현예 95-97 중 어느 하나에 기재된 변이체 Flap 폴리뉴클레오티드.

99. 변이체 Flap은 SEQ ID NO: 123에 기재된 cPPT 영역의 전부 또는 일부분, 이는 인접한 일부분일 수 있는 일부분의 결실을 포함하고, SEQ ID NO: 124에 기재된 CTS 영역의 전부 또는 일부분, 이는 인접한 일부분일 수 있는 일부분의 결실을 포함하는 구현예 95-98 중 어느 하나에 기재된 변이체 Flap 폴리뉴클레오티드.

100. 변이체 Flap을 포함하는 바이러스 핵산은 SEQ ID NO:121과 65%, 70%, 75%, 80%, 85%, 또는 90% 이상의 서열 상동성을 나타내는 뉴클레오티드 서열을 포함하고, 상기 변이체 Flap은 상기 cPPT 및/또는 CTS 영역의 전부 또는 일부분을 결여하는 것이고; 및/또는

상기 바이러스 핵산은 SEQ ID NO:122에 기재된 서열을 포함하는 변이체 Flap을 포함하는 구현예 95-99 중 어느 하나에 기재된 변이체 Flap 폴리뉴클레오티드.

101. 구현예 1-94 중 어느 하나에 있어서, 구현예 95-100 중 어느 하나에 기재된 변이체 Flap을 포함하는 바이러스 핵산을 포함하는 폴리뉴클레오티드를 더 포함하는 것인 폴리뉴클레오티드.

102. 구현예 95-101 중 어느 하나에 있어서,

SEQ ID NO: 122의 서열 또는 SEQ ID NO:122와 90%, 95%, 96%, 97%, 98%, 또는 99% 이상 또는 약 90%, 95%, 96%, 97%, 98%, 또는 99% 이상의 서열 상동성을 갖는 서열; 및

SEQ ID NO:29또는 SEQ ID NO:126의 서열 또는 SEQ ID NO:29 또는 SEQ ID NO:126과 90%, 95%, 96%, 97%, 98%, 또는 99% 이상 또는 약 90%, 95%, 96%, 97%, 98%, 또는 99% 이상의 서열 상동성을 갖는 서열을 포함하고; 및

필요에 따라, 재조합 단백질을 코딩하는 핵산을 포함하는 것인 폴리뉴클레오티드.

103. 구현예 1-94 및 101-102 중 어느 하나에 있어서, 상기 재조합 단백질은 재조합 수용체를 포함하는 것인 폴리뉴클레오티드.

104. 구현예 103에 있어서, 상기 재조합 수용체는 항원 수용체 및/또는 키메라 수용체인 것인 폴리뉴클레오티드.

105. 구현예 104에 있어서, 상기 재조합 수용체는 기능적 비-TCR 항원 수용체 또는 전이유전자 TCR인 것인 폴리뉴클레오티드.

106. 구현예 103-105 중 어느 하나에 있어서, 상기 재조합 수용체는 키메라 항원 수용체 (CAR)인 것인 폴리뉴클레오티드.

107. 구현예 1-106 중 어느 하나에 기재된 폴리뉴클레오티드 및 재조합 단백질을 코딩하는 핵산에 작동적으로 연결된 프로모터를 포함하는 발현 카세트.

108. 구현예 1-106 중 어느 하나에 기재된 폴리뉴클레오티드 또는 구현예 107에 기재된 발현 카세트를 포함하는 벡터.

109. 구현예 108에 있어서, 바이러스 벡터인 것인 벡터.

110. 구현예 109에 있어서, 상기 바이러스 벡터는 렌티바이러스 벡터, 이는 필요에 따라 HIV-1으로부터 유래되는 것인 벡터.

111. 구현예 109에 있어서, 상기 바이러스 벡터는 레트로바이러스 벡터인 것인 벡터.

112. 구현예 107에 기재된 발현 카세트 또는 구현예 108-111 중 어느 하나에 기재되는 벡터를 포함하는 세포.

113. 구현예 112에 있어서, 상기 세포는 T 세포, 자연 살해 (NK) 세포, iPS 세포, 또는 iPS-유래 세포인 것인 세포.

114. 구현예 108-111 중 어느 하나에 기재된 벡터를 포함하는 바이러스 입자.

115. 그에 의하여 재조합 단백질의 발현이 세포 내에서 유효하게 되는 조건 하에서, 구현예 107에 기재된 발현 카세트, 구현예 108-111에 기재되는 벡터, 또는 구현예 114에 기재되는 바이러스 입자를 세포로 도입하는 단계를 포함하는 방법.

116. 구현예 115에 있어서,

상기 도입은 상기 벡터나 바이러스 입자로 상기 세포를 형질도입함에 의하여 유효하게 되고;

상기 도입은 상기 벡터로 상기 세포를 트랜스펙션함으로써 유효하게 되고; 및/또는

상기 도입은 상기 벡터로 상기 세포를 전기천공함으로써 유효하게 되는 것인 방법.

117. 구현예 116에 있어서, 동일하지만 상기 변형된 PRE를 함유하지 않거나 PRE를 함유하지 않는 벡터를 도입함에 의하여 달성되는 것과 비교하여, 상기 재조합 단백질이 증가된 수준으로 발현되는 것인 방법.

118. 구현예 115-117 중 어느 하나에 기재된 방법에 의하여 생산되는 세포.

119. 구현예 112, 113, 또는 118에 기재된 세포 및 약학적으로 유효한 담체를 포함하는 약학적 조성물.

120. 질병 또는 질환을 갖는 대상체에게, 구현예 108-111 중 어느 하나에 기재된 벡터, 구현예 114에 기재된 바이러스 입자, 구현예 112, 113 또는 118에 기재된 세포, 또는 구현예 119에 기재된 조성물을 투여하는 단계를 포함하는 치료 방법.

121. 구현예 120에 있어서, 상기 재조합 단백질은 상기 질병 또는 질환에 의하여 발현되는 리간드 또는 그 세포 또는 조직에 특이적으로 결합하는 재조합 수용체를 포함하는 것인 방법.

122. 구현예 121에 있어서, 상기 수용체는 항원 수용체이고 상기 리간드는 상기 질병 또는 질환에 특이적 및/또는 그와 관련되는 것인 방법.

123. 구현예 122에 있어서, 상기 질병 또는 질환은 암, 및 자가면역 장애, 또는 감염성 질병인 것인 방법.

124. 질병 또는 질환을 치료하기 위한, 구현예 119에 기재된 약학적 조성물의 용도.

125. 구현예 119에 있어서, 질병 또는 질환 치료용 의약의 제조에 사용하기 위한 약학적 조성물.

126. 상기 세포에 의하여 발현된 상기 재조합 단백질은 상기 질병 또는 질환에 의하여 발현되는 리간드 또는 그의 세포 또는 조직에 특이적으로 결합하는 재조합 수용체를 포함하는 것인 구현예 124에 기재된 용도 또는 구현예 125에 기재된 약학적 조성물.

127. 상기 재조합 수용체는 항원 수용체이고 상기 리간드는 상기 질병 또는 질환에 특이적 및/또는 그와 관련된 것인 구현예 124-126 중 어느 하나에 기재된 용도 또는 약학적 조성물.

128. 상기 질병 또는 질환은 암, 자가면역 장애 또는 감염성 질병인 것인 구현예 124-127 중 어느 하나에 기재된 용도 또는 약학적 조성물.

IV. 실시예

[0308] 하기 실시예는 본 발명을 설명하기 위한 목적으로 포함된 것일 뿐 그 범위를 한정하는 것으로 의도되지 않는다.

실시예 1: 변형된 우드척 헤파티티스 바이러스 전사-후 조절 요소

[0309] 예시적인 야생형 WPRE 서열 (SEQ ID NO: 1)의 위치에 대응하는 잔기에서의 변형을 함유하는, 예시적 변형된 우드척 헤파티티스 바이러스 전사-후 조절 요소 (WPRE) 폴리뉴클레오티드를 생성하였다. 상기 WHV X 단백질의 절단된 일부분을 코딩하는 SEQ ID NO: 1의 영역 (X 유전자 단편)에 대응하는 각각의 리딩 프레임 내로 종결 코돈이 도입되었다. 특히,이 영역 내에서, 상기 절단된 X 단백질을 코딩하는 오픈 리딩 프레임에 (X 유전자 개시 코돈의 5' 위치에 대응하는 부위로부터 9 및 21개 뉴클레오타이드에서 시작함) 2개의 종결 코돈이 도입되었고, 다른 두 리딩 프레임 (상기 개시 코돈의 5' 위치에 대응하는 위치로부터 13 및 17개 뉴클레오티드에서 시작함) 각각에 하나가 도입되었다. 상기 변형된 WPRE는 SEQ ID NO: 126에 기재된 뉴클레오티드 서열을 함유하였다. 이 서열의 다음 부분에서, 종결 코돈은 굵게 표시되고, SEQ ID NO: 1을 참조할 때 도입된 돌연변이에는 밑줄이 표시된다: ATGGCTGCT TAG CTG A GT A GC TGA (SEQ ID NO: 28). SEQ ID NO: 216에 기재된 서열을 함유하는, 대조군 기능적 변형 WPRE도 생성하였다. 이 대조군 기능적 변형 WPRE는 SEQ ID NO: 1의 야생형 WPRE 서열과 비교하여 WHV X 유전자 프로모터 영역 및 개시 코돈에서 돌연변이를 함유한다. 이는 형질도입을 위한 다수의 바이러스 벡터에서 사용되어, 이러한 벡터에 의하여 코딩되는 재조합 분자의 발현을 촉진하는 충분한 활성을 증명하였다 (예컨대, “Cloning vector pLV.MCS.WHVPRE, complete sequence,” GenBank: JN622008.1; US Patent No. 7,384,738 참조).

[0310] SEQ ID NO: 126에 기재된 뉴클레오티드 서열을 함유하는 변형된 WPRE 폴리뉴클레오티드 및 SEQ ID NO: 216에 기재된 뉴클레오티드 서열을 함유하는 대조군 변형된 WPRE를 각각, 바이러스 Flap 영역 내에서 돌연변이를 함유하고 있는 HIV-1 유래 예시적 렌티바이러스 벡터 내로 개별적으로 혼입시켰다. 구체적으로, 상기 렌티바이러스 벡터는 SEQ ID NO: 123 및 SEQ ID NO: 124에 대응하는 영역이 결실된 변이체 Flap 영역을 함유하고, 그 결과 SEQ ID NO: 122에 기재된 염기 서열을 함유하는 부분을 갖는 Flap 변이체 벡터를 생성하였다 (Flap -/-로 칭함).

[0311] SEQ ID NO: 119의 대조군 변형된 WPRE가 완전한 Flap 영역을 함유 하는 예시적 HIV-1 유래 렌티바이러스 벡터에 혼입된, 렌티바이러스 벡터가 생성되었다. SEQ ID NO: 121에 기재되는 뉴클레오티드 서열을 함유하는 완전한 Flap 영역 (야생형 Flap 폴리뉴클레오티드)를 함유하는 렌티바이러스 벡터 (Flap +/+로 칭함).

[0312] 생성된 렌티바이러스 벡터에 함유된 서열을 하기 표 4에 요약하였다:

표 4:

[0313] 상기 벡터는 T2A 링커에 의해 분리된 키메라 항원 수용체 및 절단된 상피 성장 인자 (EGFRt) 형질도입 마커를 코딩하는 폴리뉴클레오티드를 함유하였다 (U.S. Patent No. 8,802,374 참조). 결과하는 벡터, 헬퍼 플라스미드 (gagpol 플라스미드와 rev 플라스미드 함유) 및 수도타이핑 플라스미드를 갖는 HEK-293T 세포를 순간적으로 트랜스펙션함으로써 표준 방법에 의하여 수도타이핑된 렌티바이러스 ㅂ벡터 입자가 생성되었고, 세포에 형질도입하기 위하여 사용되었다.

실시예 2: 변형된 WPRE를 함유하는 바이러스 벡터로 세포 형질도입

[0314] 실시예 1에 기재된 렌티바이러스 벡터 입자를 사용하여 인간 섬유 육종 세포주 (HT1080 ATCC® No. CCL-121™) 및 1차 인간 T 세포로부터 세포에 형질 도입하였다. 형질도입 효율은 상기 벡터에 의해 코딩된 재조합 EGFRt 마커의 표면 발현을 측정함으로써 평가하였다.

2A. HT1080 세포

[0315] 2중 연구 (A 및 B)에서, HT1080 세포는 스핀 접종 (spinoculation)(1200 x g, 30 분)으로, 8 μg/mL의 폴리브렌의 존재하에서 바이러스 부피 250μL 또는 125μL로 24-웰 플레이트에서 형질도입되었다. 비형질도입 세포들의 시료를 음성 대조군으로 사용하였다.

[0316] 48-72 시간 동안 세포를 배양한 후, EGFRt 마커의 표면 발현을, 비 형질도입 대조 시료에 기초한 게이팅 세트 (gating set)를 이용하여 유세포 분석법으로 검출하였다. EGFRt는 비오틴 결합 항-EGFR 항체 (cetuximab)를 사용하여 검출한 후 2차 V450-결합 스트레타비딘으로 검출하였다. 표 5는 2중 연구 A 및 B의 다양한 조건 각각에 대한 표면 EGFRt 발현을 나타내는 살아있는 세포의 백분율을 열거한다.

[0317] 도시된 바와 같이, X 유전자 단편에서 변이체 Flap 영역 및 종결 코돈을 갖는 변형된 WPRE를 갖는 렌티바이러스 벡터를 사용하여 HT1080 세포에 형질도입하면 변이체 Flap 영역을 갖는 벡터 및 대조군 변형 WPRE를 사용하는 것에 비견할만한 EGFRt 발현이 나타났다. 따라서, X 유전자 개시 코돈 및 프로모터 영역에서의 변형과 비교하여, X 유전자 단편에서 종결 코돈의 존재는 그 벡터에 의해 코딩되는 재조합 단백질의 발현을 촉진시키는 WPRE의 능력을 방해하지 않았다.

[0318] 또한, 나타낸 바와 같이, 변이체 Flap 영역을 갖는 렌티바이러스 벡터는 EGFRt 발현에 의해 검출된 바와 같이 HT1080 세포에 성공적으로 형질도입되었다.

표 5:

2B. 인간 T 세포

[0319] 1차 인간 T 세포는 인간 분반법 시료로부터 수득한 말초 혈액 단핵 세포 (PBMC)로부터의 양성 선별을 통해 농축되었다. 세포를 IL-2 (100 IU/mL) 존재 하에서 항-CD3/항-CD28 비드를 사용하여 활성화시켰다. 활성화된 T 세포를 실시예 1에 기재된 각각의 벡터에 대해 24-웰 플레이트에서 스핀 접종 (1200 x g, 30 분)으로 폴리브렌 (8 μg/mL)의 존재하에서 바이러스 1 부피로 형질도입시켰다. 비형질도입된 세포 시료는 음성 대조군으로 사용하였다.

[0320] 실시예 2A에서 전술한 바와 같이 EGFRt의 표면 발현을 검출하였다. 결과는 2중 연구 (A 및 B)의 결과를 포함하여 표 6에 나와 있다. 도시된 바와 같이, X 유전자 단편에서 변이체 Flap 영역 및 종결 코돈을 갖는 변형된 WPRE를 갖는 렌티바이러스 벡터를 사용한 1차 인간 T 세포에의 형질도입은, 변이체 Flap 영역 및 대조군 변형 WPRE를 갖는 벡터를 사용하는 것에 비견할만한 EGFRt 발현을 결과하였다. 따라서, X 유전자 개시 코돈 및 프로모터 영역에서의 변형과 비교하여, X 유전자 단편에서 종결 코돈의 존재는 그 벡터에 의해 코딩되는 재조합 단백질의 발현을 촉진시키는 WPRE의 능력을 방해하지 않았다. 이러한 결과는 여러 활성화 시약에 걸쳐 일치되었고, 여러 유형의 항-CD3/항-CD28 비드로 인간 1차 T 세포가 활성화되었을 때 얻어지는 결과와 유사하였다.

[0321] 또한, 나타낸 바와 같이, 변이체 Flap 영역을 갖는 렌티바이러스 벡터는 EGFRt 발현에 의해 관찰된 바와 같이 성공적으로 T 세포에 형질도입되었다.

표 6:

실시예 3: 완전한 Flap 또는 변이체 Flap 영역을 함유하는 바이러스 벡터를 이용한 세포 형질도입

[0322] 각각 상이한 항-CD19 scFv 항원-결합 도메인을 함유하는 키메라 항원 수용체 (CAR)를 코딩하는 렌티바이러스 벡터 입자는 실시예 1에 기재된 바와 같이 실질적으로 생성되었다. 각각의 렌티바이러스 벡터는 또한, CAR을 코딩하는 폴리 뉴클레오티드에 작동적으로 연결된 X 유전자 ORF 널 (null)인 대조군 기능적 변형된 WPRE의 WPRE 폴리뉴클레오티드, 및 야생형 Flap 폴리 뉴클레오티드 (Flap +/+) (SEQ ID NO:121) 또는 변이체 Flap 폴리뉴클레오티드 (Flap -/-) (SEQ ID NO: 122)를 함유하였다. CAR의 발현을 검출하기 위해, 렌티바이러스 벡터는 또한 자가-절단 T2A 링커에 의해 CAR로부터 분리된 절단된 EGFR (EGFRt) 형질도입 마커를 코딩하였다.

[0323] 1차 인간 CD8+ T 세포는 인간 분반법 시료로부터 수득한 말초 혈액 단핵 세포 (PBMC)로부터의 양성 선별을 통해 농축되었다. 렌티바이러스 벡터 입자를 사용하여 CD8+ T 세포에 형질도입하였다 (근본적으로, Yam et al. (2002) Mol. Ther. 5:479; WO2015/095895에 기재된대로). 비형질도입된 세포 시료는 음성 대조군으로 사용되었다.

[0324] 형질도입 및 증식 후, 항-EGFR 항체를 이용한 염색으로 실시예 2A에 기재된 바와 같은 유세포 분석에 의하여 T 세포 표면상의 EGFRt 형질 도입 마커의 발현을 확인하였다. 게이팅은 비형질도입 대조 시료에 기초하여 설정되었다. 표 7은 다양한 조건 각각에 대해 표면 EGFRt 발현을 나타내는 살아있는 세포의 백분율을 열거한다. 도시된 바와 같이, 결과는 Flap -/- 폴리뉴클레오티드를 갖는 렌티바이러스 벡터가 CD8+ T 세포를 성공적으로 형질도입시킬 수 있음을 확인하였다.

표 7:

[0325] 형질도입 후, 각각의 CAR 컨스트럭트로 형질도입된 T 세포, 예컨대 변이체 Flap -/- 폴리뉴클레오티드를 함유하는 것은 조사된 CD19+ 세포주의 존재하 자극에 의하여 성공적으로 선택적 농축 및 증식되었다 (유세포 분석법에 의하여 확인된 바와 같이 100% EGFRt+로 또는 그에 근사하게).

[0326] 본 발명은 예컨대 본 발명의 다양한 측면을 설명하기 위해 제공되는 특정 개시된 구현예로 범위를 제한하려는 것이 아니다. 기술된 조성물 및 방법에 대한 다양한 변형은 본 발명의 설명 및 교시로부터 명백해질 것이다. 이러한 변형은 본 명세서의 진정한 범위 및 사상을 벗어나지 않고 실시될 수 있고 본 명세서의의 범위 내에 포함되도록 의도된다.

SEQUENCE LISTING <110> Juno Therapeutics, Inc. Tareen, Semih <120> MODIFIED HEPATITIS POST-TRANSCRIPTIONAL REGULATORY ELEMENTS (PRES) FOR ENHANCED GENE EXPRESSION <130> 735042001840 <140> Not Yet Assigned <141> Concurrently Herewith <160> 221 <170> FastSEQ for Windows Version 4.0 <210> 1 <211> 592 <212> DNA <213> Woodchuck hepatitis virus <400> 1 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctc 420 gcctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 2 <211> 3323 <212> DNA <213> Woodchuck hepatitis virus <400> 2 aattcgggac ataccacgtg gtttagttcc gcctcaaact ccaacaaatc gagatcaagg 60 gagaaagcct actcctccaa ctccacctct aagagatact cacccccact taactatgaa 120 aaatcagact tttcatctcc aggggttcgt agacggatta cgagacttga caacaacgga 180 acgccaacac aatgcctatg gagatccttt tacaacacta agccctgcgg ttcctactgt 240 atccaccata ttgtctcctc cctcgacgac tggggaccct gcactgtcac cggagatgtc 300 accatcaagt ctcctaggac tcctcgcagg attacaggtg gtgtatttct tgtggacaaa 360 aatcctaaca atagctcaga atctagattg gtggtggact tctctcagtt ttccaggggg 420 cataccagag tgcactggcc aaaattcgca gttccaaact tgcaaacact tgccaacctc 480 ctgtccacca acttgcaatg gctttcgttg gatgtatctg cggcgtttta tcatatacct 540 attagtcctg ctgctgtgcc tcatcttctt gttggttctc ctggactgga aaggtttaat 600 acctgtctgt cctcttcaac ccacaacaga aacaacagtc aattgcagac aatgcacaat 660 ctctgcacaa gacatgtata ctcctcctta ctgttgttgt ttaaaaccta cggcaggaaa 720 ttgcacttgt tggcccatcc cttcatcatg ggctttagga aattacctat gggagtgggc 780 cttagcccgt ttctcttggc tcaatttact agtgcccttg cttcaatggt taggaggaat 840 ttccctcatt gcgtggtttt tgcttatatg gatgatttgg ttttgggggc ccgcacttct 900 gagcatctta ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat 960 ttgaatgtca ataaaacaaa atggtggggc aatcatctac atttcatggg atatgtgatt 1020 actagttcag gtgtattgcc acaagacaaa catgttaaga aaatttcccg ttatttgcac 1080 tctgttcctg ttaatcaacc tctggattac aaaatttgtg aaagattgac tggtattctt 1140 aactatgttg ctccttttac gctatgtgga tacgctgctt taatgccttt gtatcatgct 1200 attgcttccc gtatggcttt cattttctcc tccttgtata aatcctggtt gctgtctctt 1260 tatgaggagt tgtggcccgt tgtcaggcaa cgtggcgtgg tgtgcactgt gtttgctgac 1320 gcaaccccca ctggttgggg cattgccacc acctgtcagc tcctttccgg gactttcgct 1380 ttccccctcc ctattgccac ggcggaactc atcgccgcct gccttgcccg ctgctggaca 1440 ggggctcggc tgttgggcac tgacaattcc gtggtgttgt cggggaagct gacgtccttt 1500 ccatggctgc tcgcctgtgt tgccacctgg attctgcgcg ggacgtcctt ctgctacgtc 1560 ccttcggccc tcaatccagc ggaccttcct tcccgcggcc tgctgccggc tctgcggcct 1620 cttccgcgtc ttcgccttcg ccctcagacg agtcggatct ccctttgggc cgcctccccg 1680 cctgtttcgc ctcggcgtcc ggtccgtgtt gcttggtctt cacctgtgca gacttgcgaa 1740 ccatggattc caccgtgaac tttgtctcct ggcatgcaaa tcgtcaactt ggcatgccaa 1800 gtaaggacct ttggactcct tatataaaag atcaattatt aactaaatgg gaggagggca 1860 gcattgatcc tagattatca atatttgtat taggaggctg taggcataaa tgcatgcgac 1920 ttctgtaacc atgtatcttt ttcacctgtg ccttgttttt gcctgtgttc catgtcctac 1980 ttttcaagcc tccaagctgt gccttggatg gctttggggc atggacatag atccctataa 2040 agaatttggt tcatcttatc agttgttgaa ttttcttcct ttggacttct ttcctgacct 2100 taatgctttg gtggacactg ctactgcctt gtatgaagaa gagctaacag gtagggaaca 2160 ttgctctccg caccatacag ctattagaca agctttagta tgctgggatg aattaactaa 2220 attgatagct tggatgagct ctaacataac ttctgaacaa gtaagaacaa tcatagtaaa 2280 tcatgtcaat gatacctggg gacttaaggt gagacaaagt ttatggtttc atttgtcatg 2340 tctcactttc ggacaacata cagttcaaga atttttagta agttttggag tatggatcag 2400 aactccagct ccatatagac ctcctaatgc acccattctc tcgactcttc cggaacatac 2460 agtcattagg agaagaggag gtgcaagagc ttctaggtcc cccagaagac gcactccctc 2520 tcctcgcagg agaagatctc aatcaccgcg tcgcagacgc tctcaatctc catctgccaa 2580 ctgctgatct tcaatgggta cataaaacta atgcaattac aggtctttac tctaaccaag 2640 ctgctcagtt caatccgaat tggattcaac ctgagtttcc tgaacttcat ttacataatg 2700 atttaattca aaaattgcaa cagtattttg gtcctttgac tataaatgaa aagagaaaat 2760 tgcaattaaa ttttcctgcc agatttttcc ccaaagctac taaatatttc cctttaatta 2820 aaggcataaa aaacaattat cctaattttg ctttagaaca tttctttgct accgcaaatt 2880 atttgtggac tttatgggaa gctggaattt tgtatttaag gaagaatcaa acaactttga 2940 cttttaaagg taaaccatat tcttgggaac acagacagct agtgcaacat aatgggcaac 3000 aacataaaag tcaccttcaa tccagacaaa atagcagcat ggtggcctgc agtgggcact 3060 tattacacaa ccacttatcc tcagaatcag tcagtgtttc aaccaggaat ttatcaaaca 3120 acatctctga taaatcccaa aaatcaacaa gaactggact ctgttcttat aaacagatac 3180 aaacagatag actggaacac ttggcaagga tttcctgtgg atcaaaaatt ttcattggtc 3240 agcagggatc ctcccccaaa accttatata aatcaatcag ctcaaacttt cgaaatcaaa 3300 cctgggccta taatagttcc cgg 3323 <210> 3 <211> 80 <212> DNA <213> Woodchuck hepatitis virus <400> 3 gccacggcgg aactcatcgc cgcctgcctt gcccgctgct ggacaggggc tcggctgttg 60 ggcactgaca attccgtggt 80 <210> 4 <211> 208 <212> DNA <213> Woodchuck hepatitis virus <400> 4 gtgtgcactg tgtttgctga cgcaaccccc actggttggg gcattgccac cacctgtcag 60 ctcctttccg ggactttcgc tttccccctc cctattgcca cggcggaact catcgccgcc 120 tgccttgccc gctgctggac aggggctcgg ctgttgggca ctgacaattc cgtggtgttg 180 tcggggaagc tgacgtcctt tccatggc 208 <210> 5 <211> 38 <212> DNA <213> Woodchuck hepatitis virus <400> 5 gccttgcccg ctgctggaca ggggctcggc tgttgggc 38 <210> 6 <211> 177 <212> DNA <213> Woodchuck hepatitis virus <400> 6 tgctcgcctg tgttgccacc tggattctgc gcgggacgtc cttctgctac gtcccttcgg 60 ccctcaatcc agcggacctt ccttcccgcg gcctgctgcc ggctctgcgg cctcttccgc 120 gtcttcgcct tcgccctcag acgagtcgga tctccctttg ggccgcctcc ccgcctg 177 <210> 7 <211> 23 <212> DNA <213> Woodchuck hepatitis virus <400> 7 gggacgtcct tctgctacgt ccc 23 <210> 8 <211> 158 <212> DNA <213> Woodchuck hepatitis virus <400> 8 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggtt 158 <210> 9 <211> 426 <212> DNA <213> Woodchuck hepatitis virus <400> 9 atggctgctc gcctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc 180 tgtttcgcct cggcgtccgg tccgtgttgc ttggtcttca cctgtgcaga cttgcgaacc 240 atggattcca ccgtgaactt tgtctcctgg catgcaaatc gtcaacttgg catgccaagt 300 aaggaccttt ggactcctta tataaaagat caattattaa ctaaatggga ggagggcagc 360 attgatccta gattatcaat atttgtatta ggaggctgta ggcataaatg catgcgactt 420 ctgtaa 426 <210> 10 <211> 182 <212> DNA <213> Woodchuck hepatitis virus <400> 10 atggctgctc gcctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc 180 tg 182 <210> 11 <211> 21 <212> DNA <213> Woodchuck hepatitis virus <400> 11 ggggaagctg acgtcctttc c 21 <210> 12 <211> 592 <212> DNA <213> Woodchuck hepatitis virus <400> 12 aatcaacctc tggattacaa aatttgtgaa agattgactg atattcttaa ctatgttgct 60 ccttttacgc tgtgtggata tgctgcttta atgcctctgt atcatgctat tgcttcccgt 120 acggctttcg ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tccgtcaacg tggcgtggtg tgctctgtgt ttgctgacgc aacccccact 240 ggctggggca ttgccaccac ctgtcaactc ctttctggga ctttcgcttt ccccctcccg 300 atcgccacgg cagaactcat cgccgcctgc cttgcccgct gctggacagg ggctaggttg 360 ctgggcactg ataattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctc 420 gcctgtgttg ccaactggat cctgcgcggg acgtccttct gctacgtccc ttcggctctc 480 aatccagcgg acctcccttc ccgaggcctt ctgccggttc tgcggcctct cccgcgtctt 540 cgctttcggc ctccgacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 13 <211> 592 <212> DNA <213> Woodchuck hepatitis virus <400> 13 aatcaacctc tggattacaa aatttctgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcaactc ctttccggga cttacgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctc 420 gcctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgac tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 14 <211> 592 <212> DNA <213> Woodchuck hepatitis virus <400> 14 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tacttcccgt 120 acggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctatcaactc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat tgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctc 420 gcctgtgttg ccaactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggttc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 15 <211> 592 <212> DNA <213> Woodchuck hepatitis virus <400> 15 aatcaacctc tagattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tgtgtggata tgctgcttta atgcctctgt atcatgctat tgcttcccgt 120 acggctttca ttttctcctc cttgtataaa tcctggttac tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggctggggca ttgccaccac ctgtcaactc ctttccggga ctttcgcttt ccccctccct 300 atcgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctc 420 gcctgtgttg ccaactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg acctcccttc ccgcggcctg ctgccggttc tgcggcctct tccacgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 16 <211> 592 <212> DNA <213> Woodchuck hepatitis virus <400> 16 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tgtgtggata tgctgcttta atacctctgt atcatgctat tgcttcccgt 120 acggctttcg ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tccgccaacg tggcgtggtg tgctctgtgt ttgctgacgc aacccccact 240 ggctggggca ttgccaccac ctgtcaactc ctttctggga ctttcgcttt ccccctcccg 300 atcgccacgg cagaactcat cgccgcctgc cttgcccgct gctggacagg ggctaggttg 360 ttgggcactg ataattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctc 420 gcctgtgttg ccaactggat cctacgcggg acgtccttct gctacgtccc ttcagctctc 480 aatccagcgg acctcccttc ccgaggcctt ctgccggttc tgcggcctct cccgcgtctt 540 cgctttcggc ctccgacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 17 <211> 592 <212> DNA <213> Woodchuck hepatitis virus <400> 17 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tgtgtggata tgctgcttta atgcctctgt atcatgctat tgcttcccgt 120 acggctttcg ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tccgccaacg tggcgtggtg tgctctgtgt ttgctgacgc aacccccact 240 ggctggggca ttgccaccac ctgtcaactc ctttctggga ctttcgcttt ccccctcccg 300 atcgccacgg cagaactcat cgccgcctgc cttgcccgct gctggacggg ggctaggttg 360 ttgggcactg ataattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctc 420 gcctgtgttg ccaactggat cctacgcggg acgtccttct gctacgtccc ttcagctctc 480 aatccagcgg acctcccttc ccgaggcctt ctgccggttc tgcggcctct cccgcgtctt 540 cgctttcggc ctccgacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 18 <211> 592 <212> DNA <213> Woodchuck hepatitis virus <400> 18 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tgtgtggata tgctgcttta atgcctctgt atcatgctat tgcttcccgt 120 acggctttcg ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tccgccaacg tggcgtggtg tgctctgtgt ttgctgacgc aacccccact 240 ggctggggca ttgccaccac ctgtcaactc ctttctggga ctttcgcttt ccccctcccg 300 atcgccacgg cagaactcat cgccgcctgc cttgcccgct gctggacggg ggctaggttg 360 ttgggcactg ataattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctc 420 gcctgtgttg ccaactggat cctacgcggg acgtccttct gctacgtccc ttcagctctc 480 aatccagcgg acctcccttc ccgaggcctt ctgccggttc tgcggcctct cccgcgtctt 540 cgctttcgac ctccgacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 19 <211> 592 <212> DNA <213> Woodchuck hepatitis virus <400> 19 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tgtgtggata tgctgcttta atacctctgt atcatgctat tgcttcccgt 120 acggctttcg ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tccgccaacg tggcgtggtg tgctctgtgt ttgctgacgc aacccccact 240 ggctggggca ttgccaccac ctgtcaactc ctttctggga ctttcgcttt ccccctcccg 300 atcgccacgg cagaactcat cgccgcctgc cttgcccgct gctggacggg ggctaggttg 360 ttgggcactg ataattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctc 420 gcctgtgttg ccaactggat cctacgcggg acgtccttct gctacgtccc ttcagctctc 480 aatccagcgg acctcccttc ccgaggcctt ctgccggttc tgcggcctct cccgcgtctt 540 cgctttcggc ctccgacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 20 <211> 592 <212> DNA <213> Woodchuck hepatitis virus <400> 20 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tgtgtggata tgctgcttta atacctctgt atcgtgctat tgcttcccgt 120 acggctttcg ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tccgccaacg tggcgtggtg tgctctgtgt ttgctgacgc aacccccact 240 ggctggggca ttgccaccac ctgtcaactc ctttctggga ctttcgcttt ccccctcccg 300 atcgccacgg cagaactcat cgccgcctgc cttgcccgct gctggacggg ggctaggttg 360 ttgggcactg ataattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctc 420 gcctgtgttg ccaactggat cctacgcggg acgtccttct gctacgtccc ttcagctctc 480 aatccagcgg acctcccttc ccgaggcctt ctgccggttc tgcggcctct cccgcgtctt 540 cgctttcggc ctccgacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 21 <211> 722 <212> DNA <213> Human hepatitis B virus <400> 21 aaacaggcct attgattgga aagtttgtca acgaattgtg ggtcttttgg ggtttgctgc 60 cccttttacg caatgtggat atcctgcttt aatgccttta tatgcatgta tacaagcaaa 120 acaggctttt actttctcgc caacttacaa ggcctttctc agtaaacagt atatgaccct 180 ttaccccgtt gctcggcaac ggcctggtct gtgccaagtg tttgctgacg caacccccac 240 tggttggggc ttggccatag gccatcagcg catgcgtgga acctttgtgt ctcctctgcc 300 gatccatact gcggaactcc tagccgcttg ttttgctcgc agcaggtctg gagcaaacct 360 catcgggacc gacaattctg tcgtactctc ccgcaagtat acatcgtttc catggctgct 420 aggctgtgct gccaactgga tcctgcgcgg gacgtccttt gtttacgtcc cgtcggcgct 480 gaatcccgcg gacgacccct cccggggccg cttggggctc taccgcccgc ttctccgtct 540 gccgtaccgt ccgaccacgg ggcgcacctc tctttacgcg gactccccgt ctgtgccttc 600 tcatctgccg gaccgtgtgc acttcgcttc acctctgcac gtcgcatgga gaccaccgtg 660 aacgcccacc ggaacctgcc caaggtcttg cataagagga ctcttggact ttcagcaatg 720 tc 722 <210> 22 <211> 722 <212> DNA <213> Human hepatitis B virus <400> 22 aaacaggcct attgattgga aagtatgtca acgaattgtg ggtctattgg ggtttgccgc 60 cccttttaca caatgtggat atcctgctct aatgccttta tatgcatgta tacaagcaaa 120 acaggctttt actttctcgc caacttacaa ggcctttcta agtaaacagt atctgaacct 180 ttaccccgtt gctcggcaac ggcctggtct gtgccaagtg tttgctgacg caacccccac 240 tggttggggc ttggcgatag gccatcagcg catgcgtggg acctttctgt ctcctctgcc 300 gatccatact gcggaactcc tagcagcttg ttttgctcgc agcaggtctg gggcaaaact 360 catcgggact gacaattctg tcgtactctc ccgcaagtat acatcatttc catggctgct 420 aggctgtgct gccaactgga tcctgcgcgg gacgtccttt gtttacgtcc cgtcggcgct 480 gaatcccgcg gacgacccct cgcggggccg cttggggctc taccgcccgc ttctccgcct 540 gttctaccga ccgaccacgg ggcgcacctc tctttacgcg gactccccgt ctgtgccttc 600 tcatctgccg gaccgtgtgc acttcgcttc acctctgcac gtcgcatgga gaccaccgtg 660 aacgcccaca ggaacctgcc caaggtcttg cataagagga ctcttggact ttcagcaatg 720 tc 722 <210> 23 <211> 722 <212> DNA <213> Orangutan hepatitis B virus <400> 23 caacaggcct attgattgga aagtatgtca acgaattgta ggactattgg gctttgccgc 60 tccttttact caatgtggct atcctgcttt aatgcctttg tataactgta tacacaatcg 120 tcaggctttt actttctcgc caacttacaa ggcctttctg cgtacacaat atctgaccct 180 ttaccccgtt gctcggcaac gaccgggact gtgccaagtg tttgctgacg caacccccac 240 tggctggggc ttggcgctag gtccccagcg catgcgtgga acctttgtgg ctcctctgcc 300 gatccatact gcggaactcc tagccgcttg ttttgctcgc agcaggtctg gagcaaacat 360 tatcggtact gacaactctg ttgtgttgtc gcggaaatat acatcttttc catggctgct 420 aggttgtgct gccaactgga tactgcgcgg gacgtccttt gtctacgtcc cgtcggcgct 480 gaatcccgcg gacgaccctt ctcggggtcg gttggggctc taccgccctc ttctccgcct 540 gccgttccgg ccgaccacgg ggcgcacctc tctttacgcg gtctccccgt ctgtgccttc 600 tcatctgccg gtccgtgtgc acttcgcttc acctctgcac gttgcatgga gaccaccgtg 660 aacgcccccc ggaacttgcc aaaggtcttg cataagagga ctcttggact gtcaacaatg 720 tc 722 <210> 24 <211> 721 <212> DNA <213> Chimpanzee hepatitis B virus <400> 24 aacagaccta tagattggaa agtatgtcaa agaattgtgg gtcttttggg atttgctgcc 60 ccttttacgc aatgtggtta tcctgcgtta atgccattgt atgcatgtat acaagcaaaa 120 caggctttca ctttctcgcc aacttataag gcctttctaa gtcaacaata ttcgaccctt 180 taccccgttg cccggcaacg gtccggtctg tgccaagtgt ttgctgacgc aacccccact 240 ggctggggct tggtcatggg ccatcagcgc atgcgtggaa cctttgtggc tcctctgccg 300 atccatactg cggaactcct agcagcttgt tttgctcgca gccggtctgg agcaaaactt 360 atcggaactg acaattctgt cgtcctctct cggaaatata catcttttcc atggctgcta 420 ggttgtgctg ccaactggat acttcgcggg acgtcctttg tttacgtccc gtcggcgctg 480 aatcctgcgg acgacccttc tcggggccgc ttagggctct accgccctct catccgtctg 540 ctcttccaac cgactacggg gcgcacctct ctttacgcgg tctccccgtc tgtgccttct 600 catctgccgg tccgtgtgca cttcgcttca cctctgcacg ttgcatggag accaccgtga 660 acgccccacg gaacctgcca aaagtcttgc ataagaggac tcttggactt tcagcaatgt 720 c 721 <210> 25 <211> 721 <212> DNA <213> Gorilla hepatitis B virus <400> 25 aacagaccta ttgattggaa ggtatgtcaa agaattgtgg gtcttttagg atttgctgcc 60 ccttttacac aatgtggtta tcctgccttg atgcctttgt atgcatgtat acaagctaag 120 caggctttca ctttctcgcc aatttacaag gcctttctaa gtaaacaata tgcaaccctt 180 taccccgttg ctcggcaacg ggccggtctg tgccaagtgt ttgctgacgc aacccccact 240 ggytggggct tggtcatagg ccagcagcgc atgcgtggaa cctttgtggc tcctctgccg 300 atccatactg cggaactcct agcagcttgt tttgctcgca gcaggtctgg ggcaaacatt 360 atcgggactg acaattctgt cgtcctttca cggaaatata catcctttcc atggctgcta 420 ggctgtgctg ccaactggat cctgcgcggg acgtcctttg tttacgtccc gtcggcgctg 480 aaccctgccg acgacccgtc tcggggtcgc ttaggactct cccgtcctct ctgccgtctg 540 ccgttccagc cgaccacggg gcgcacctct ctttacgcgg tctccccgtc tgtgccttct 600 catctgccgg accgtgtgca cttcgcttca cctctgcacg ttgcatggag accaccgtga 660 acgcccctcg gaacctgcca acagtcttac ataagaggac tcttggactt tcagcaatgt 720 c 721 <210> 26 <211> 582 <212> DNA <213> Artic ground squirrel hepatitis B virus <400> 26 aacctttaga ttataaaatc tgtgaaaggt taacaggcat tctgaattat gttgctcctt 60 ttactaaatg tggttatgct gctctccttc ctttgtatca agctacttcg cgtacggcat 120 ttgtgttttc ttctctctac cacagctggt tgctgtccct ttatgctgag ttgtggcctg 180 ttgccaggca acgtggcgtg gtgtgctctg tgtctgacgc aacccccact ggttggggca 240 tttgcaccac ctatcaactc atttccccga cgggcgcttt tgccctgccg atcgccaccg 300 cggacgtcat cgccgcctgc cttgctcgct gctggacagg agctcggctg ttgggcactg 360 acaactccgt ggttctttcg ggcaaactga cttcctatcc atggctgctc gcctgtgttg 420 ccaactggat tcttcgcggg acgtcgttct gctacgtccc ttcggcagcg aatccggcgg 480 acctgccgtc tcgaggcctt ctgccggctc tgcatcccgt gccgactctc cgcttccgtc 540 cgcagctgag tcgcatctcc ctttgggccg cctccccgcc tg 582 <210> 27 <211> 592 <212> DNA <213> Ground squirrel hepatitis B virus <400> 27 aatcaaccct tagattataa aatatgtgaa aggttgacgg gcattcttaa ttatgttgct 60 ccttttacca aatgtggtta tgctgcttta ctgcctttat atcaagctat tgcttctcat 120 actgcttttg ttttctcctc cttatataaa aactggttac tgtcacttta tggtgagttg 180 tggcccgttg ccagacaacg tggtgtggtg tgctctgtgt ttgctgacgc aactcccact 240 ggttggggca tttgcaccac ctgtcaactc atttccggta ctttcggttt ctcacttccg 300 attgctaccg cggagcttat agccgcctgc cttgctcgct gctggacagg agctcggttg 360 ttgggcactg ataactccgt ggtcctctcc ggtaagctaa cttcgtttcc atggctgctc 420 gcctgtgttg ccaactggat tcttcgcggg acgtccttct gttacgtccc ctccgcggac 480 aacccagcgg accttccgtc tcggggactt ctgccggctc tccgtcctct gccgcttctg 540 cgttttcgtc cggtcaccaa gcggatatcc ctgtgggccg cctccccgcc tg 592 <210> 28 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Modified portion of X protein ORF <400> 28 atggctgctt agctgagtag ctga 24 <210> 29 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH FOUR STOP CODONS (1,2,3,4) <400> 29 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctt 420 agctgagtag ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 30 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH THREE STOP CODONS (1,2,3) <400> 30 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctt 420 agctgagtag ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 31 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH THREE STOP CODONS (1,2,4) <400> 31 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctt 420 agctgagttg ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 32 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH THREE STOP CODONS (1,3,4) <400> 32 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctt 420 agctgtgtag ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 33 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH THREE STOP CODONS (2,3,4) <400> 33 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctc 420 gcctgagtag ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 34 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH TWO STOP CODONS (1,2) <400> 34 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctt 420 agctgagttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 35 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH TWO STOP CODONS (1,3) <400> 35 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctt 420 agctgtgtag ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 36 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH TWO STOP CODONS (1,4) <400> 36 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctt 420 agctgtgttg ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 37 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH TWO STOP CODONS (2,3) <400> 37 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctc 420 gcctgagtag ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 38 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH TWO STOP CODONS (2,4) <400> 38 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctc 420 gcctgagttg ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 39 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH TWO STOP CODONS (3,4) <400> 39 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctc 420 gcctgtgtag ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 40 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH ONE STOP CODON (1) <400> 40 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctt 420 agctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 41 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH ONE STOP CODON (2) <400> 41 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctc 420 gcctgagttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 42 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH ONE STOP CODON (3) <400> 42 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctc 420 gcctgtgtag ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 43 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH ONE STOP CODON (4) <400> 43 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctc 420 gcctgtgttg ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 44 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH FOUR STOP CODONS (1,2,3,4) <400> 44 atggctgctt agctgagtag ctgactggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc 180 tg 182 <210> 45 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE THREE STOP CODONS (1,2,3) <400> 45 atggctgctt agctgagtag ccacctggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc 180 tg 182 <210> 46 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE THREE STOP CODONS (1,2,4) <400> 46 atggctgctt agctgagttg ctgactggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc 180 tg 182 <210> 47 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH THREE STOP CODONS (1,3,4) <400> 47 atggctgctt agctgtgtag ctgactggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc 180 tg 182 <210> 48 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH THREE STOP CODONS (2,3,4) <400> 48 atggctgctc gcctgagtag ctgactggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc 180 tg 182 <210> 49 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH TWO STOP CODONS (1,2) <400> 49 atggctgctt agctgagttg ccacctggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc 180 tg 182 <210> 50 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH TWO STOP CODONS (1,3) <400> 50 atggctgctt agctgtgtag ccacctggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc 180 tg 182 <210> 51 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH TWO STOP CODONS (1,4) <400> 51 atggctgctt agctgtgttg ctgactggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc 180 tg 182 <210> 52 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH TWO STOP CODONS (2,3) <400> 52 atggctgctc gcctgagtag ccacctggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc 180 tg 182 <210> 53 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH TWO STOP CODONS (2,4) <400> 53 atggctgctc gcctgagttg ctgactggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc 180 tg 182 <210> 54 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH TWO STOP CODONS (3,4) <400> 54 atggctgctc gcctgtgtag ctgactggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc 180 tg 182 <210> 55 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH ONE STOP CODON (1) <400> 55 atggctgctt agctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc 180 tg 182 <210> 56 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH ONE STOP CODON (2) <400> 56 atggctgctc gcctgagttg ccacctggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc 180 tg 182 <210> 57 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH ONE STOP CODON (3) <400> 57 atggctgctc gcctgtgtag ccacctggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc 180 tg 182 <210> 58 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH ONE STOP CODON (4) <400> 58 atggctgctc gcctgtgttg ctgactggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc 180 tg 182 <210> 59 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH START AND STOP CODONS <400> 59 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc ggggctgctt 420 agctgagtag ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 60 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH START AND STOP CODONS <400> 60 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc ggggctgctt 420 agctgagtag ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 61 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH START AND STOP CODONS <400> 61 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc ggggctgctt 420 agctgagttg ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 62 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH START AND STOP CODONS <400> 62 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc ggggctgctt 420 agctgtgtag ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 63 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH START AND STOP CODONS <400> 63 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc ggggctgctc 420 gcctgagtag ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 64 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH START AND STOP CODONS <400> 64 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc ggggctgctt 420 agctgagttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 65 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH START AND STOP CODONS <400> 65 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc ggggctgctt 420 agctgtgtag ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 66 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH START AND STOP CODONS <400> 66 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc ggggctgctt 420 agctgtgttg ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 67 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH START AND STOP CODONS <400> 67 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc ggggctgctc 420 gcctgagtag ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 68 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH START AND STOP CODONS <400> 68 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc ggggctgctc 420 gcctgagttg ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 69 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH START AND STOP CODONS <400> 69 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc ggggctgctc 420 gcctgtgtag ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 70 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH START AND STOP CODONS <400> 70 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc ggggctgctt 420 agctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 71 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH START AND STOP CODONS <400> 71 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc ggggctgctc 420 gcctgagttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 72 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH START AND STOP <400> 72 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc ggggctgctc 420 gcctgtgtag ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 73 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH START AND STOP CODONS <400> 73 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc ggggctgctc 420 gcctgtgttg ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 74 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH MODIFIED START AND STOP CODONS <400> 74 ggggctgctt agctgagtag ctgactggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc 180 tg 182 <210> 75 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH MODIFIED START AND STOP CODONS <400> 75 ggggctgctt agctgagtag ccacctggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc 180 tg 182 <210> 76 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH MODIFIED START AND STOP CODONS <400> 76 ggggctgctt agctgagttg ctgactggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc 180 tg 182 <210> 77 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH MODIFIED START AND STOP CODONS <400> 77 ggggctgctt agctgtgtag ctgactggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc 180 tg 182 <210> 78 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH MODIFIED START AND STOP CODONS <400> 78 ggggctgctc gcctgagtag ctgactggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc 180 tg 182 <210> 79 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH MODIFIED START AND STOP CODONS <400> 79 ggggctgctt agctgagttg ccacctggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc 180 tg 182 <210> 80 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH MODIFIED START AND STOP CODONS <400> 80 ggggctgctt agctgtgtag ccacctggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc 180 tg 182 <210> 81 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH MODIFIED START AND STOP CODONS <400> 81 ggggctgctt agctgtgttg ctgactggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc 180 tg 182 <210> 82 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH MODIFIED START AND STOP CODONS <400> 82 ggggctgctc gcctgagtag ccacctggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc 180 tg 182 <210> 83 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH MODIFIED START AND STOP CODONS <400> 83 ggggctgctc gcctgagttg ctgactggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc 180 tg 182 <210> 84 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH MODIFIED START AND STOP CODONS <400> 84 ggggctgctc gcctgtgtag ctgactggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc 180 tg 182 <210> 85 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH MODIFIED START AND STOP CODONS <400> 85 ggggctgctt agctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc 180 tg 182 <210> 86 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH MODIFIED START AND STOP CODONS <400> 86 ggggctgctc gcctgagttg ccacctggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc 180 tg 182 <210> 87 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH MODIFIED START AND STOP CODONS <400> 87 ggggctgctc gcctgtgtag ccacctggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc 180 tg 182 <210> 88 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH MODIFIED START AND STOP CODONS <400> 88 ggggctgctc gcctgtgttg ctgactggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc 180 tg 182 <210> 89 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND STOP CODONS <400> 89 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc atggctgctt 420 agctgagtag ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 90 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND STOP CODONS <400> 90 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc atggctgctt 420 agctgagtag ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 91 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND STOP CODONS <400> 91 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc atggctgctt 420 agctgagttg ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 92 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND STOP CODONS <400> 92 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc atggctgctt 420 agctgtgtag ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 93 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND STOP CODONS <400> 93 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc atggctgctc 420 gcctgagtag ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 94 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND STOP CODONS <400> 94 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc atggctgctt 420 agctgagttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 95 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND STOP CODONS <400> 95 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc atggctgctt 420 agctgtgtag ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 96 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND STOP CODONS <400> 96 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc atggctgctt 420 agctgtgttg ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 97 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND STOP CODONS <400> 97 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc atggctgctc 420 gcctgagtag ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 98 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND STOP CODONS <400> 98 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc atggctgctc 420 gcctgagttg ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 99 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND STOP CODONS <400> 99 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc atggctgctc 420 gcctgtgtag ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 100 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND STOP CODON <400> 100 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc atggctgctt 420 agctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 101 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND STOP CODON <400> 101 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc atggctgctc 420 gcctgagttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 102 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND STOP CODON <400> 102 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc atggctgctc 420 gcctgtgtag ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 103 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND STOP CODON <400> 103 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc atggctgctc 420 gcctgtgttg ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 104 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND START AND STOP CODONS <400> 104 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc ggggctgctt 420 agctgagtag ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 105 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND START AND STOP CODONS <400> 105 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc ggggctgctt 420 agctgagtag ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 106 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND START AND STOP CODONS <400> 106 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc ggggctgctt 420 agctgagttg ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 107 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND START AND STOP CODONS <400> 107 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc ggggctgctt 420 agctgtgtag ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 108 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND START AND STOP CODONS <400> 108 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc ggggctgctc 420 gcctgagtag ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 109 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND START AND STOP CODONS <400> 109 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc ggggctgctt 420 agctgagttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 110 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND START AND STOP CODONS <400> 110 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc ggggctgctt 420 agctgtgtag ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 111 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND START AND STOP CODONS <400> 111 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc ggggctgctt 420 agctgtgttg ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 112 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND START AND STOP CODONS <400> 112 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc ggggctgctc 420 gcctgagtag ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 113 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND START AND STOP CODONS <400> 113 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc ggggctgctc 420 gcctgagttg ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 114 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND START AND STOP CODONS <400> 114 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc ggggctgctc 420 gcctgtgtag ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 115 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND START AND STOP CODON <400> 115 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc ggggctgctt 420 agctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 116 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND START AND STOP CODON <400> 116 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc ggggctgctc 420 gcctgagttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 117 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND START AND STOP CODON <400> 117 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc ggggctgctc 420 gcctgtgtag ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 118 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND START AND STOP CODON <400> 118 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc ggggctgctc 420 gcctgtgttg ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 119 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND START CODON <400> 119 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaatcat cgtcctttcc ttggctgctc 420 gcctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 120 <211> 593 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND START CODON <400> 120 aatcaacctc tggattacaa aaatttgtga aagattgact ggtattctta actatgttgc 60 tccttttacg ctatgtggat acgctgcttt aatgcctttg tatcatgcta ttgcttcccg 120 tatggctttc attttctcct ccttgtataa atcctggttg ctgtctcttt atgaggagtt 180 gtggcccgtt gtcaggcaac gtggcgtggt gtgcactgtg tttgctgacg caacccccac 240 tggttggggc attgccacca cctgtcagct cctttccggg actttcgctt tccccctccc 300 tattgccacg gcggaactca tcgccgcctg ccttgcccgc tgctggacag gggctcggct 360 gttgggcact gacaattccg tggtgttgtc ggggaaggtc tgctgagact cggggctgct 420 cgcctgtgtt gccacctgga ttctgcgcgg gacgtccttc tgctacgtcc cttcggccct 480 caatccagcg gaccttcctt cccgcggcct gctgccggct ctgcggcctc ttccgcgtct 540 tcgccttcgc cctcagacga gtcggatctc cctttgggcc gcctccccgc ctg 593 <210> 121 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> DNA FLAP REGION <400> 121 tacaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg gggtacagtg 60 caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa ttacaaaaac 120 aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat ccagtttgg 179 <210> 122 <211> 136 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED DNA FLAP REGION <400> 122 tacaaatggc agtattcatc cacaattttt tggggggtac agtgcagggg aaagaatagt 60 agacataata gcaacagaca tacaaactaa agaattacaa cgggtttatt acagggacag 120 cagagatcca gtttgg 136 <210> 123 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Central Polypurine Tract (cPPT) <400> 123 aaaagaaaag ggggga 16 <210> 124 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Central Termination Sequence (CTS) <400> 124 aaacaaatta caaaaattca aaatttt 27 <210> 125 <211> 589 <212> DNA <213> Woodchuck Hepatitis Virus <400> 125 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctc 420 gcctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 126 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH STOP CODONS <400> 126 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctt 420 agctgagtag ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 127 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH STOP CODONS <400> 127 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctt 420 agctgagtag ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 128 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH STOP CODONS <400> 128 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctt 420 agctgagttg ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 129 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH STOP CODONS <400> 129 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctt 420 agctgtgtag ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 130 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH STOP CODONS <400> 130 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctc 420 gcctgagtag ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 131 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH STOP CODONS <400> 131 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctt 420 agctgagttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 132 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH STOP CODONS <400> 132 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctt 420 agctgtgtag ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 133 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH STOP CODONS <400> 133 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctt 420 agctgtgttg ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 134 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH STOP CODONS <400> 134 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctc 420 gcctgagtag ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 135 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH STOP CODONS <400> 135 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctc 420 gcctgagttg ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 136 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH STOP CODONS <400> 136 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctc 420 gcctgtgtag ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 137 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH STOP CODON <400> 137 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctt 420 agctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 138 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH STOP CODON <400> 138 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctc 420 gcctgagttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 139 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH STOP CODON <400> 139 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctc 420 gcctgtgtag ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 140 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH STOP CODON <400> 140 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctc 420 gcctgtgttg ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 141 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH STOP CODONS <400> 141 atggctgctt agctgagtag ctgactggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 179 <210> 142 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH STOP CODONS <400> 142 atggctgctt agctgagtag ccacctggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 179 <210> 143 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH STOP CODONS <400> 143 atggctgctt agctgagttg ctgactggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 179 <210> 144 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH STOP CODONS <400> 144 atggctgctt agctgtgtag ctgactggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 179 <210> 145 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH STOP CODONS <400> 145 atggctgctc gcctgagtag ctgactggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 179 <210> 146 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH STOP CODONS <400> 146 atggctgctt agctgagttg ccacctggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 179 <210> 147 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH STOP CODONS <400> 147 atggctgctt agctgtgtag ccacctggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 179 <210> 148 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH STOP CODONS <400> 148 atggctgctt agctgtgttg ctgactggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 179 <210> 149 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH STOP CODONS <400> 149 atggctgctc gcctgagtag ccacctggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 179 <210> 150 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH STOP CODONS <400> 150 atggctgctc gcctgagttg ctgactggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 179 <210> 151 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH STOP CODONS <400> 151 atggctgctc gcctgtgtag ctgactggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 179 <210> 152 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH STOP CODON <400> 152 atggctgctt agctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 179 <210> 153 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH STOP CODON <400> 153 atggctgctc gcctgagttg ccacctggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 179 <210> 154 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH STOP CODON <400> 154 atggctgctc gcctgtgtag ccacctggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 179 <210> 155 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH STOP CODON <400> 155 atggctgctc gcctgtgttg ctgactggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 179 <210> 156 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH START AND STOP CODONS <400> 156 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc ggggctgctt 420 agctgagtag ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 157 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH START AND STOP CODONS <400> 157 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc ggggctgctt 420 agctgagtag ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 158 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH START AND STOP CODONS <400> 158 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc ggggctgctt 420 agctgagttg ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 159 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH START AND STOP CODONS <400> 159 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc ggggctgctt 420 agctgtgtag ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 160 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH START AND STOP CODONS <400> 160 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc ggggctgctc 420 gcctgagtag ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 161 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH START AND STOP CODONS <400> 161 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc ggggctgctt 420 agctgagttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 162 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH START AND STOP CODONS <400> 162 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc ggggctgctt 420 agctgtgtag ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 163 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH START AND STOP CODONS <400> 163 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc ggggctgctt 420 agctgtgttg ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 164 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH START AND STOP CODONS <400> 164 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc ggggctgctc 420 gcctgagtag ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 165 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH START AND STOP CODONS <400> 165 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc ggggctgctc 420 gcctgagttg ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 166 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH START AND STOP CODONS <400> 166 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc ggggctgctc 420 gcctgtgtag ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 167 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH START AND STOP CODONS <400> 167 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc ggggctgctt 420 agctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 168 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH START AND STOP CODONS <400> 168 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc ggggctgctc 420 gcctgagttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 169 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH START AND STOP CODONS <400> 169 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc ggggctgctc 420 gcctgtgtag ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 170 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH START AND STOP CODONS <400> 170 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc ggggctgctc 420 gcctgtgttg ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 171 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH MODIFIED START AND STOP CODONS <400> 171 ggggctgctt agctgagtag ctgactggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 179 <210> 172 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH MODIFIED START AND STOP CODONS <400> 172 ggggctgctt agctgagtag ccacctggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 179 <210> 173 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH MODIFIED START AND STOP CODONS <400> 173 ggggctgctt agctgagttg ctgactggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 179 <210> 174 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH MODIFIED START AND STOP CODONS <400> 174 ggggctgctt agctgtgtag ctgactggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 179 <210> 175 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH MODIFIED START AND STOP CODONS <400> 175 ggggctgctc gcctgagtag ctgactggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 179 <210> 176 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH MODIFIED START AND STOP CODONS <400> 176 ggggctgctt agctgagttg ccacctggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 179 <210> 177 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH MODIFIED START AND STOP CODONS <400> 177 ggggctgctt agctgtgtag ccacctggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 179 <210> 178 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH MODIFIED START AND STOP CODONS <400> 178 ggggctgctt agctgtgttg ctgactggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 179 <210> 179 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH MODIFIED START AND STOP CODONS <400> 179 ggggctgctc gcctgagtag ccacctggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 179 <210> 180 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH MODIFIED START AND STOP CODONS <400> 180 ggggctgctc gcctgagttg ctgactggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 179 <210> 181 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH MODIFIED START AND STOP CODONS <400> 181 ggggctgctc gcctgtgtag ctgactggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 179 <210> 182 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH MODIFIED START AND STOP CODONS <400> 182 ggggctgctt agctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 179 <210> 183 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH MODIFIED START AND STOP CODONS <400> 183 ggggctgctc gcctgagttg ccacctggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 179 <210> 184 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH MODIFIED START AND STOP CODONS <400> 184 ggggctgctc gcctgtgtag ccacctggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 179 <210> 185 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> TRUNCATED X GENE WITH MODIFIED START AND STOP CODONS <400> 185 ggggctgctc gcctgtgttg ctgactggat tctgcgcggg acgtccttct gctacgtccc 60 ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct 120 tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 179 <210> 186 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND STOP CODONS <400> 186 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc atggctgctt 420 agctgagtag ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 187 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND STOP CODONS <400> 187 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc atggctgctt 420 agctgagtag ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 188 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND STOP CODONS <400> 188 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc atggctgctt 420 agctgagttg ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 189 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND STOP CODONS <400> 189 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc atggctgctt 420 agctgtgtag ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 190 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND STOP CODONS <400> 190 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc atggctgctc 420 gcctgagtag ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 191 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND STOP CODONS <400> 191 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc atggctgctt 420 agctgagttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 192 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND STOP CODONS <400> 192 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc atggctgctt 420 agctgtgtag ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 193 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND STOP CODONS <400> 193 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc atggctgctt 420 agctgtgttg ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 194 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND STOP CODONS <400> 194 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc atggctgctc 420 gcctgagtag ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 195 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND STOP CODONS <400> 195 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc atggctgctc 420 gcctgagttg ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 196 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND STOP CODONS <400> 196 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc atggctgctc 420 gcctgtgtag ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 197 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND STOP CODON <400> 197 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc atggctgctt 420 agctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 198 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND STOP CODON <400> 198 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc atggctgctc 420 gcctgagttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 199 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND STOP CODON <400> 199 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc atggctgctc 420 gcctgtgtag ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 200 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND STOP CODON <400> 200 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc atggctgctc 420 gcctgtgttg ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 201 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND STOP CODON <400> 201 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc ggggctgctt 420 agctgagtag ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 202 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND START AND STOP CODONS <400> 202 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc ggggctgctt 420 agctgagtag ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 203 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND START AND STOP CODONS <400> 203 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc ggggctgctt 420 agctgagttg ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 204 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND START AND STOP CODONS <400> 204 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc ggggctgctt 420 agctgtgtag ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 205 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND START AND STOP CODONS <400> 205 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc ggggctgctc 420 gcctgagtag ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 206 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND START AND STOP CODONS <400> 206 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc ggggctgctt 420 agctgagttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 207 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND START AND STOP CODONS <400> 207 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc ggggctgctt 420 agctgtgtag ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 208 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND START AND STOP CODONS <400> 208 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc ggggctgctt 420 agctgtgttg ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 209 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND START AND STOP CODONS <400> 209 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc ggggctgctc 420 gcctgagtag ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 210 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND START AND STOP CODONS <400> 210 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc ggggctgctc 420 gcctgagttg ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 211 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND START AND STOP CODONS <400> 211 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc ggggctgctc 420 gcctgtgtag ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 212 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND START AND STOP CODONS <400> 212 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc ggggctgctt 420 agctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 213 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND START AND STOP CODONS <400> 213 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc ggggctgctc 420 gcctgagttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 214 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND START AND STOP CODONS <400> 214 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc ggggctgctc 420 gcctgtgtag ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 215 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND START AND STOP CODONS <400> 215 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaggtct gctgagactc ggggctgctc 420 gcctgtgttg ctgactggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 216 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED PRE WITH PROMOTER SEQUENCE AND START AND CODON <400> 216 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaatcat cgtcctttcc ttggctgctc 420 gcctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589 <210> 217 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED X GENE PROMOTER <400> 217 ggggaaatca tcgtcctttc c 21 <210> 218 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED X GENE PROMOTER <400> 218 atcatcgtcc tttc 14 <210> 219 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED X GENE PROMOTER <400> 219 ggggaaggtc tgctgagact c 21 <210> 220 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> MODIFIED X GENE PROMOTER <400> 220 ggtctgctga gact 14 <210> 221 <211> 24 <212> DNA <213> Woodchuck Hepatitis Virus <400> 221 atggctgctc gcctgtgttg ccac 24

Claims

폴리뉴클레오티드로서,
재조합 단백질을 코딩하는 핵산;
상기 핵산과 작동적으로 연결되는 변형된 전사-후 조절 인자 (PRE)로서, 상기 변형된 PRE는 야생형 헤파티티스 바이러스 X 유전자의 변이체를 포함하고, 상기 변이체 X 유전자는 상기 야생형 X 유전자에는 존재치 않는 복수개의 종결 코돈을 포함하고,
하나 이상의 종결 코돈은, SEQ ID NO: 1에 기재되는 우드척 헤파티티스 바이러스 (WHV) 전사-후 조절 요소 (WPRE) 서열의 잔기 411 에 대응하는 위치로부터 3' 방향으로 36 또는 24개 뉴클레오티드 내 위치에서 시작하는 종결 코돈 또는 SEQ ID NO: 2에 기재되는 WHV 서열의 잔기 1503에 대응하는 위치로부터 3' 방향으로 36 또는 24개 뉴클레오티드 내 위치에서 시작하는 종결 코돈인 것인 폴리뉴클레오티드.
변형된 전사-후 조절 요소 (PRE)를 포함하는 폴리뉴클레오티드로서, 상기 변형된 PRE는 야생형 헤파티티스 바이러스 X 유전자의 변이체를 포함하고, 상기 변이체 X 유전자는 상기 야생형 X 유전자에는 존재치 않는 복수개의 종결 코돈을 포함하며, 상기 복수개의 종결 코돈은 SEQ ID NO: 1에 기재되는 우드척 헤파티티스 바이러스 (WHV) 전사-후 조절 요소 (WPRE) 서열의 잔기 411 또는 SEQ ID NO: 2에 기재되는 WHV 서열의 잔기 1503에 대응하는 변이체 X의 위치로부터 3' 방향으로 32 또는 30개 뉴클레오티드 내 위치에서 시작하는 종결 코돈을 포함하는 것인 폴리뉴클레오티드.
청구항 1 또는 청구항 2에 있어서, 상기 복수개의 종결 코돈은 상기 변이체 X 유전자에 존재하는 각각의 리딩 프레임 내 하나 이상의 종결 코돈을 포함 및/또는 동일한 리딩 프레임 내 2 이상의 종결 코돈을 포함하는 것인 폴리뉴클레오티드.
변형된 전사-후 조절 요소 (PRE)를 포함하는 폴리뉴클레오티드로서, 상기 변형된 PRE는 야생형 헤파티티스 바이러스 X 유전자의 변이체를 포함하고, 상기 변이체 X 유전자는 상기 야생형 X 유전자에는 존재치 않는 복수개의 종결 코돈을 포함하고,
하나 이상의 종결 코돈은, SEQ ID NO: 1에 기재되는 우드척 헤파티티스 바이러스 (WHV) 전사-후 조절 요소 (WPRE) 서열의 잔기 411 또는 SEQ ID NO: 2에 기재되는 WHV 서열의 잔기 1503에 대응하는 위치에 대응하는 변이체 X 유전자의 위치로부터 3' 방향으로 36개 뉴클레오티드 내 위치에서 시작하는 종결 코돈인 것인 폴리뉴클레오티드.
청구항 1, 2 또는 4에 있어서, 하나 이상의 종결 코돈은,
SEQ ID NO: 1에 기재되는 WHV 전사-후 조절 요소 (WPRE) 서열의 잔기 411 및/또는 SEQ ID NO: 2에 기재되는 WHV 서열의 잔기 1503에 대응하는 변이체 X 유전자의 위치로부터 3' 방향으로 36, 30 또는 24개 뉴클레오티드 내 위치에서 시작하는 종결 코돈인 것인 폴리뉴클레오티드.
청구항 1, 2 또는 4에 있어서, 하나 이상의 종결 코돈은,
SEQ ID NO: 1에 기재되는 WHV 전사-후 조절 요소 (WPRE) 서열의 잔기 411 및 SEQ ID NO: 2에 기재되는 WHV 서열의 잔기 1503에 대응하는 변이체 X 유전자의 위치로부터 3' 방향으로 36, 30 또는 24개 뉴클레오티드 내 위치에서 시작하는 종결 코돈인 것인 폴리뉴클레오티드.
청구항 1, 2 또는 4에 있어서, 상기 변이체 X 유전자는 2 이상의 종결 코돈, 3 이상의 종결 코돈, 또는 4 이상의 종결 코돈을 포함하는 것인 폴리뉴클레오티드.
청구항 1, 2 또는 4에 있어서, 상기 변이체 X 유전자는 상기 변이체 X 유전자에 존재하는 각각의 리딩 프레임 내에 종결 코돈을 포함하는 것인 폴리뉴클레오티드.
청구항 1, 2 또는 4에 있어서,
상기 변형된 PRE에 작동적으로 연결된 재조합 단백질을 코딩하는 핵산을 더 포함하는 것인 폴리뉴클레오티드.
청구항 1에 있어서,
상기 재조합 단백질은 항원 수용체 또는 키메라 수용체인 것인 폴리뉴클레오티드.
청구항 9에 있어서,
상기 재조합 단백질은 항원 수용체 또는 키메라 수용체인 것인 폴리뉴클레오티드.
청구항 1, 2 또는 4에 있어서, 상기 복수개의 종결 코돈은:
SEQ ID NO: 1에 기재되는 WHV 전사-후 조절 요소 (WPRE) 서열의 잔기 411 및/또는 SEQ ID NO: 2에 기재되는 WHV 서열의 잔기 1503에 대응하는 변이체 X 유전자의 위치로부터 3' 방향으로 9, 12, 15 또는 18개 이상 뉴클레오티드 내 위치에서 시작하는 종결 코돈
중에서 선택되는 하나 이상의 종결 코돈을 포함하는 것인 폴리뉴클레오티드.
청구항 1, 2 또는 4에 있어서, 상기 복수개의 종결 코돈은:
SEQ ID NO:1에 기재되는 서열에서 위치 420에 대응하는 뉴클레오티드 위치에서 시작하는 종결 코돈;
SEQ ID NO:1에 기재되는 서열에서 위치 424에 대응하는 뉴클레오티드 위치에서 시작하는 종결 코돈;
SEQ ID NO:1에 기재되는 서열에서 위치 428에 대응하는 뉴클레오티드 위치에서 시작하는 종결 코돈;
SEQ ID NO:1에 기재되는 서열에서 위치 432에 대응하는 뉴클레오티드 위치에서 시작하는 종결 코돈
중에서 선택되는 것인 폴리뉴클레오티드.
청구항 1, 2 또는 4에 있어서, 상기 복수개의 종결 코돈은 독립적으로 앰버 (TAG) 또는 오팔 (TGA) 종결 코돈인 것인 폴리뉴클레오티드.
청구항 1, 2 또는 4에 있어서, 상기 변형된 PRE는 SEQ ID NO:28을 포함하는 변이체 X 유전자를 포함하는 것인 폴리뉴클레오티드.
청구항 1, 2 또는 4에 있어서, 상기 변이체 X 유전자는 상기 야생형 헤파티티스 X 유전자에는 존재치 않는 번역-후 변형 신호를 코딩하는 서열을 더 포함하는 것인 폴리뉴클레오티드.
청구항 1, 2 또는 4에 있어서, 상기 변이체 X 유전자는 야생형 포유류 헤파티티스 X 바이러스 유전자인 것인 폴리뉴클레오티드.
청구항 17에 있어서, 상기 야생형 포유류 헤파티티스 X 바이러스 유전자는 야생형 우드척 헤파티티스 바이러스 (WHV) X 유전자인 것인 폴리뉴클레오티드.
청구항 1, 2 또는 4에 있어서, 상기 변형된 PRE는 포유류 헤파티티스 PRE인 야생형 또는 비변형된 헤파티티스 바이러스 PRE와 비교하여 뉴클레오티드 변형을 포함하는 것인 폴리뉴클레오티드.
청구항 19에 있어서, 상기 야생형 또는 비변형된 포유류 헤파티티스 PRE는 야생형 우드척 바이러스 PRE (WPRE)인 것인 폴리뉴클레오티드.
청구항 19에 있어서, 상기 야생형 또는 비변형된 헤파티티스 바이러스 PRE는:
a) SEQ ID NO:1 또는 SEQ ID NO:125에 기재된 뉴클레오티드 서열, 또는 SEQ ID NO:1 또는 SEQ ID NO:125와 94%, 95%, 96%, 97%, 98%, 또는 99% 이상의 서열 상동성을 나타내는 뉴클레오티드 서열; 또는
b) a)의 뉴클레오티드 서열의 일부분으로서, 상기 일부분은 전사-후 활성을 나타내는 것인 일부분
을 포함하는 것인 폴리뉴클레오티드.
청구항 1, 2 또는 4에 있어서, 상기 변형된 PRE는:
a) SEQ ID NO:1 또는 SEQ ID NO:125와 85% 이상의 서열 상동성을 나타내는 뉴클레오티드 서열을 포함하는 변형된 PRE로서, 상기 변형된 PRE는 SEQ ID NO:1 또는 SEQ ID NO:125에 존재치 않는 하나 이상의 종결 코돈을 포함하는 변이체 X 유전자를 함유하는 것인 변형된 PRE; 및
b) a)의 뉴클레오티드 서열의 일부분을 포함하는 변형된 PRE로서, 상기 일부분은 하나 이상의 종결 코돈을 포함하는 변이체 X 유전자를 포함하고 상기 일부분은 전사-후 활성을 나타내는 것인 변형된 PRE
중에서 선택되는 것인 폴리뉴클레오티드.
청구항 1, 2 또는 4에 있어서, 상기 변이체 X 유전자는 SEQ ID NO: 44-58 또는 141-155 중 하나에 기재된 뉴클레오티드 서열을 포함 및/또는 상기 변형된 PRE는 SEQ ID NO:29-39 또는 126-136 중 하나에 기재된 뉴클레오티드 서열을 포함하는 것인 폴리뉴클레오티드.
청구항 1, 2 또는 4에 있어서,
상기 변이체 X 유전자는 야생형 헤파티티스 바이러스 X 유전자 개시 코돈과 비교하여 및/또는 SEQ ID NO: 1의 뉴클레오티드 위치 411-413에 대응하는 상기 개시 코돈과 비교하여 하나 이상의 뉴클레오티드 차이를 포함하는 개시 코돈의 변이체를 더 포함하고,
상기 하나 이상의 뉴클레오티드 차이는 상기 개시 코돈으로부터의 번역 개시를 제한 또는 저지하는 결과를 낳는 것인 폴리뉴클레오티드.
청구항 1, 2 또는 4에 있어서,
상기 변이체 X 유전자는 상기 변이체 X 유전자에 작동적으로 연결된 변이체 프로모터를 포함하고, 상기 변이체 프로모터는 야생형 헤파티티스 바이러스 X 유전자 프로모터와 비교하여 및/또는 SEQ ID NO: 11의 프로모터와 비교하여 하나 이상의 뉴클레오티드 차이를 포함하며,
상기 하나 이상의 차이는 상기 프로모터로부터의 전사의 제한 또는 저지라는 결과를 낳는 것인 폴리뉴클레오티드.
청구항 1, 2 또는 4에 있어서,
진핵 세포에 도입시, 상기 변이체 X 유전자에 의하여 코딩되는 12, 11, 10, 9, 또는 8개 아미노산 길이보다 큰 길이의 어떠한 폴리펩타이드도 생성되지 않고; 및/또는
상기 폴리뉴클레오티드는 상기 변이체 X 유전자에 의하여 코딩되는 12, 11, 10, 9, 또는 8개 아미노산보다 큰 길이의 폴리펩타이드를 생성할 수 없는 것인 폴리뉴클레오티드.
청구항 1, 2 또는 4에 있어서, 변이체 Flap을 포함하는 바이러스 핵산을 더 포함하고, 상기 변이체 Flap은 SEQ ID NO: 122에 기재된 서열을 포함하는 것인 폴리뉴클레오티드.
청구항 1, 2 또는 4에 있어서,
SEQ ID NO: 122의 서열을 포함하는 변이체 Flap; 및
SEQ ID NO:29 또는 SEQ ID NO:126의 서열 을 포함하는 변형된 PRE
를 포함하는 폴리뉴클레오티드.
청구항 1에 있어서, 상기 재조합 단백질은 재조합 수용체를 포함하는 것인 폴리뉴클레오티드.
청구항 9에 있어서, 상기 재조합 단백질은 재조합 수용체를 포함하는 것인 폴리뉴클레오티드.
청구항 1, 2 또는 4에 기재된 폴리뉴클레오티드 및 재조합 단백질을 코딩하는 핵산에 작동적으로 연결된 프로모터를 포함하는 발현 카세트.
청구항 31에 기재된 발현 카세트를 포함하는 벡터.
청구항 32에 있어서, 바이러스 벡터, 레트로바이러스 벡터 또는 렌티바이러스 벡터인 것인 벡터.
청구항 33에 있어서, 렌티바이러스 벡터는 HIV-1으로부터 유래하는 것인 벡터.
청구항 31에 기재된 발현 카세트를 포함하는 세포.
청구항 35에 있어서, 상기 세포는 T 세포, 자연 살해 (NK) 세포, iPS 세포, 또는 iPS-유래 세포인 것인 세포.
청구항 32에 기재된 벡터를 포함하는 바이러스 입자.
그에 의하여 재조합 단백질의 발현이 세포 내에서 유효하게 되는 조건 하에서, 청구항 31에 기재된 발현 카세트를 세포로 도입하는 단계를 포함하는 방법.
그에 의하여 재조합 단백질의 발현이 세포 내에서 유효하게 되는 조건 하에서, 청구항 32에 기재된 벡터를 세포로 도입하는 단계를 포함하는 방법.
그에 의하여 재조합 단백질의 발현이 세포 내에서 유효하게 되는 조건 하에서, 청구항 37에 기재된 바이러스 입자를 세포로 도입하는 단계를 포함하는 방법.
암, 및 자가면역 장애 또는 감염성 질병 중에서 선택되는 질병 또는 질환을 치료하기 위한, 청구항 35에 기재된 세포 및 약학적으로 유효한 담체를 포함하는 약학적 조성물.
청구항 41에 있어서,
상기 세포에 의하여 발현된 상기 재조합 단백질은 상기 질병 또는 질환에 의하여 발현되는 리간드 또는 그의 세포 또는 조직에 특이적으로 결합하는 재조합 수용체를 포함하는 것인, 약학적 조성물.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제