KR20230142776A

KR20230142776A - Rna 아데노 관련 바이러스(raav) 벡터 및 그 용도

Info

Publication number: KR20230142776A
Application number: KR1020237030365A
Authority: KR
Inventors: 린유 스; 웨이야 바이
Original assignee: 후이다진 테라퓨틱스 (싱가포르) 피티이. 엘티디.
Priority date: 2021-02-07
Filing date: 2022-02-07
Publication date: 2023-10-11
Also published as: WO2022166954A1; IL305002A; CA3207601A1; JP2024508696A; AU2022217349A1; CN115209924A; US20230062529A1; EP4288112A1; BR112023015769A2

Abstract

본 발명은 관심 RNA 서열 및 RNA 패키징 신호를 포함한 RNA 서열을 제공한다. RNA 서열을 포함한 재조합 DNA 바이러스의 바이러스 입자를 더 제공하고, 상기 RNA 서열은 DNA 바이러스의 단백질 쉘 내에 패키징되는 관심 RNA 서열 및 RNA 패키징 신호를 포함한다.

Description

RNA 아데노 관련 바이러스(RAAV) 벡터 및 그 용도

관련 출원의 참조

본 국체 특허 출원은 2021년 2월 7일자로 출원된 국체 특허 출원 번호 PCT/CN2021/075874의 우선권을 주장하고, 그 전체 내용은 참조를 통해 본 명세서에 포함된다.

배경기술

아데노 관련 바이러스(AAV)는 인간과 기타 영장류 종들을 감염시키는 소형(직경이 약 20 nm) 복제 결함형 비피막 바이러스이다. 이는 파르보바이러스과(Parvoviridae) 데펜도파르보바이러스속(Dependoparvovirus)에 속한다. 야생형 AAV는 분열세포 및 비분열세포 모두를 감염시킬 수 있고, 그 게놈을 숙주 세포의 게놈에 통합시킬 수 있다. 그 생명 주기는 아데노 바이러스(AdV)와 같은 헬퍼 바이러스의 존재에 의존하고, 이에 따라 명명 및 분류한다.

AAV는 인간 및 비인간 영장류(NHP)를 포함한 여러 척추 동물 종에서 발견되었다. 현재의 공통의 인식은 AAV가 어떠한 인간 질병도 일으키지 않고, 매우 경미한 면역 반응만 일으킬 수 있는 것이다. 이는 직경이 약 20-25 nm인 20면체 단백질 캡시드 및 약 4.7 kb의 단일 가닥 DNA(ssDNA) 게놈(플러스(센스) 가닥일 수도 있고, 마이너스 (안티센스)가닥일 수도 있음)으로 구성될 수 있다.

AAV 캡시드는 VP1, VP2 및 VP3의 세 가지 종류의 서브유닛, 총 60개의 복제를 포함하고, 비율은 1 : 1 : 10(VP1 : VP2 : VP3)이다. 게놈의 양측 말단에 2개의 T형 말단 역반복(ITR)을 포함하고, 주로 바이러스 복제 기점 및 패키징 신호 역할을 한다. rep유전자는 바이러스 복제에 필요한 4가지 단백질을 코딩한다. Rep 단백질은 그 분자량에 따라 Rep78, Rep68, Rep52 및 Rep40으로 명명된다. cap유전자는 상이한 개시 코돈으로부터 코딩 번역된다. 또한, 조립 활성화 단백질(AAP)을 코딩하는 제3 유전자는 상이한 리딩 프레임 중의 cap코딩 서열에서 코딩되고, 비리온 조립을 촉진하는 것으로 나타났다.

현재, 13개의 AAV 혈청형 및 수많은 변이체가 감정되었고, 이들은 상이한 세포 수용체를 인식함으로써, 상이한 조직형 및 세포형의 향성 스펙트럼을 나타낸다. AAV1-13의 생체 내 조직 향성도 여러 동물 모델에서 충분히 연구하였다.

AAV ITR 서열은 각자 145개의 뉴클레오티드를 포함한다. ITR 서열은 각각 자가 개시를 위한 헤어핀을 형성할 수 있고, 이는 제2 DNA가닥이 프리마제에 의존하지 않고 합성이 가능하도록 한다. ITR은 또한 AAV DNA를 숙주 세포 게놈(인간의 19번째 염색체)에 통합하고 상기 숙주 세포 게놈에서 AAV DNA를 구출 및 효율적으로 캡시드화하여 완전 조립된 데옥시리보뉴클레아제 내성 AAV 입자에 필요한 것을 생성하는으로 나타났다.

AAV2 ITR은 복제 기점으로서, 큰 스템 회문 서열(A-A’)에 삽입된 2개의 암 회문 서열(즉 B-B’ 및 C-C’)로 구성된다. ITR은 두 가지 배열(즉 Flip 및 Flop)을 얻을 수 있다. 도 1을 참조한다. Flip 및 Flop 배열은 각각 3’ 말단에 가장 가까운 B-B’ 및 C-C’ 회문 서열을 갖는다. 20개의 뉴클레오티드를 갖는 D 서열 또는 D 영역은 AAV 게놈의 각 말단에서만 한번 나타나기에, 단일 가닥을 유지한다.

ITR은 AAV Rep78 및 Rep68 단백질에 특정 방향으로 결합되는 약 22-bp의 서열 - Rep-결합 요소(RBE)를 더 포함한다. ITR이 회문 서열(헤어핀) 배열일 경우, Rep 단백질은 또한 짧은 회문 서열(RBE’) 중 일 말단 위치의 5-염기 서열에 접촉될 수 있고, 이로써 AAV 복제 및 패키징을 돕도록 Rep DNA 헬리카제 및 사슬 특이적 엔도뉴클레아제의 활성을 활성화하한다(도 1 참조).

RBE는 공유 서열 5’-GNGC-3’을 갖는 테트라 뉴클레오티드 반복(예를 들어, 4개 반복)을 포함한다. Rep78 및 Rep68의 ATP 의존적 DNA 헬리카제 활성은 A-A’ 영역을 리모델링하여, 스템 루프를 생성하고, 상기 스템 루프는 단일 가닥 형식으로 말단 분해 부위(trs 또는 TRS)의 정상에 위치한다. 이러한 배열에서, Rep78 및 Rep68의 가닥 특이적 및 부위 특이적 엔도뉴클레아제 촉매 도메인은 trs 위치에서 절개구에 도입된다. T형 구조 정점 위치의 뉴클레오티드는 별도의 RBE(RBE’)에 대응되고, 상기 RBE는 2개의 최대의 Rep 단백질 및 ITR 사이의 관련을 안정시킨다.

AAV생명 주기에서, AAV DNA가 세포핵에서 코팅되지 않는 경우, 유입 단일 가닥 게놈의 ITR가 헤어핀에 스냅되고, 이는 제2 가닥의 합성에 천연 3’-OH프라이머를 제공한다. 이는 공유 결합성 폐쇄(헤어핀) 말단을 갖는 이중 가닥 분자를 생성할 수 있다. 그 후, 큰 Rep 단백질은 헤어핀 내에서 RBE 및 RBE’를 결합하고, 활성화된 엔도뉴클레아제는 말단 분해 부위(trs)로 불리는 인식 서열 내의 특정 부위에서 하나의 가닥을 절단한다. 이는 새로운 3’-OH 프라이머를 생성하고, ITR을 복구하여 평활말단 이중 가닥 분자를 형성하는 데 사용된다. 절단 기간에 Rep78 또는 Rep68의 분자는 티로신-포스페이트 연결을 통해 5’-말단 인산염에 공유 부착된다. 그 후 ITR을 이중 헤어핀으로 재구성하여 3’-OH 프라이머를 생성하고, 상기 프라이머는 세포 복합체를 사용하여 게놈 길이에 따른 가닥 치환 합성을 가이드한다. 이는 패키징된 단일 가닥을 치환하고, 하나의 단말에서 공유 결합성 폐쇄된 이중 가닥 분자를 개조하여, 절단, 복구 및 가닥 치환 합성의 새로운 사이클을 시작한다. 이러한 사이클을 반복할 때마다 패키징을 위한 새로운 단일 가닥을 형성할 수 있다. 2개의 말단이 동일하기 때문에 이 과정은 2개의 말단에서 동등하게 진행되어 패키징을 위한 플러스 가닥 및 마이너스 가닥을 생성한다.

AAV가 생체 내에서 여러 종 및 조직에 형질도입될 수 있고, 독성 증거가 없으며, 상대적으로 온화한 선천적 면역 반응 및 적응적 면역 반응을 생성하기에, 유전자 요법에 광범위하게 사용되고 있다.

AAV 벡터는 야생형 AAV(wtAAV)에서 발견된 동일한 캡시드 서열 및 구조로 구성된다. 그러나, AAV 벡터는 모든 AAV 단백질 코딩 서열이 결핍되고 그 위치에 전이 유전자 발현 카세트가 설계된 게놈을 캡시드화한다. 바이러스 기점의 유일한 서열은 ITR이고, 상기 ITR이 벡터 생산 과정에서 게놈 복제 및 패키징을 가이드해야 한다. 바이러스 코딩 서열의 완전 제거는 AAV 벡터의 패키징 능력을 최대화하고, 체내 전달 시의 낮은 면역원성 및 세포 독성에 도움이 된다.

AAV 벡터는 4.7 kb 이하의 게놈을 수용하기에 가장 적합하므로, 전이 유전자 서열을 고려할 뿐만 아니라 유전자 발현에 필요한 조절 요소(예를 들어, 프로모터, 인핸서, 인트론 및 폴리아데닐화 신호)도 고려하여 유효 부하를 신중하게 설계해야 한다.

하나의 유행하는 AAV 벡터 생산 방법은 rep 및 cap유전자를 발현시키는 패키징 플라스미드, AAV 캡시드 내에 패키징되는 전이 유전자 플라스미드 및 헬퍼 작용을 하는 다른 AdV유전자(예컨대 각각 복제, 정보 RNA(mRNA) 처리 및 번역에 극히 중요한 E2A, E4 및 VA RNA유전자)를 함유하는 헬퍼 플라스미드로 HEK293T세포에 대해 삼중 형질감염하는 것이며, 상기 HEK293T세포는 구성적 발현 AdV E1a 및 E1b유전자를 함유한다. 다행히, 패키징 플라스미드 또는 헬퍼 바이러스 중의 캡시드 코딩 영역만 교체하면, AAV2 ITR로 구축한 전이 유전자 발현 카세트를 임의의 혈청형 캡시드에 패키징할 수 있다.

AAV 벡터는 상이한 세포 수용체를 인식 및 결합하고, 내재화를 통해 세포에 진입한다. 엔도솜 중 완전한 AAV 벡터 입자는 일련의 pH 의존적 구조 변화를 거치고, 상기 변화는 세포 백본 네트워크를 거쳐 사이토졸을 통해 형질도입 및 운반에 필수적이다. 엔도솜 탈출 후, AAV 벡터는 핵기공 복합물을 통해 세포핵에 진입하고, 상기 세포핵 중 상기 AAV 벡터는 캡시드 탈외피를 거쳐 게놈을 방출한다.

세포핵에서 방출되는 단일 가닥 AAV 벡터 게놈은 즉시 유전자 발현하여 전사의 요구 및 형질도입의 속도 제한 단계인 이중 가닥 형태로 전환되지 않는다.

제2 가닥 합성은 게놈 3’-말단의 ITR 자가 증폭으로부터 시작된다. 그 외, 이중 가닥 게놈은 가닥 어닐링을 통해 구현될 수 있고, 이로써 단독 비리온 중의 플러스 가닥 및 마이너스 가닥 게놈에 패키징되며, 일단 세포핵에 있으면 왓슨-크릭(Watson-Crick) 염기 페어링을 통해 어닐링된다. 그 후 이중 가닥 게놈은 ITR에서의 분자 내 또는 분자간 게놈 재조합을 거쳐 고리화된다. 이러한 고리화 및 연쇄화 과정은 AAV 벡터 게놈을 유리형 DNA로 안정화시켜, 유사 분열 후 세포에서 지속적으로 유전자 발현되도록 한다(도 2).

CRISPR은 유전자 요법에 새로운 동력을 부여하였다. CRISPR은 강력한 게놈 편집 툴이고, 유전병, 후천성 질병 및 전염병 치료에서 이미 잠재력을 보이고 있다. 그러나, CRISPR세포 성분의 전달은 여전히 임상화의 주요한 장애이다. 현재까지 가장 성공적인 CRISPR 체내 유전자 편집은 전달 벡터로서 AAV를 사용한다.

그러나, 기존 AAV 전달은 1) 연장된 Cas9 발현으로 인해 증가된 오프-타겟 효과, 2) Cas9 특이적 면역 반응 자극, 3) CRISPR에 의해 유도된 이중 가닥 절단 중 바이러스 통합의 높은 빈도를 포함한 여러 실제적 어려움에 직면하였다. 최근 연구에서는 사람들에서 광범위하게 전파한 Cas9에 대한 사전 보존 면역력이 Cas9가 지속적으로 발현되면 편집된 세포에 별도의 도전을 가져다 줄 수 있다는 것을 입증하였다.

따라서, Cas9에 의해 매개되는 유전자 편집 툴과 같은 기존의 유전자 편집 툴을 개선해야 한다.

본 발명의 일 양태는 DNA 바이러스의 바이러스 입자에 패키징될 수 있는 리보뉴클레오티드(RNA) 서열을 제공하고, 상기 RNA 서열은 (1) 관심 유전자(GOI)를 코딩하는 RNA 코딩 서열, mRNA와 같은 단백질(예를 들어, 치료성 단백질, 항원 단백질, 또는 유전자 편집 단백질 예컨대 CRISPR/Cas 이펙터 효소(“Cas 단백질”로 약칭), ZFN 단백질, TALEN 단백질)을 코딩하는 RNA, 또는 비코딩 기능적 RNA(예컨대 운반 RNA(tRNA), 리보솜 RNA(rRNA), 작은 간섭 RNA(siRNA), 짧은 헤어핀 RNA(shRNA), 안티센스 RNA, 안티센스 올리고뉴클레오티드, 마이크로 RNA(miRNA) 또는 CRISPR-Cas(예를 들어, Cas9, Cas12, Cas13)시스템의 RNA 성분(단일 가이드 RNA(또는 sgRNA, 키메릭 RNA, RNA 키메라)와 같은 가이드 RNA(또는 gRNA), CRISPR RNA(crRNA) 및 tracr RNA) 포함)) 또는 그 전구체와 같은 관심 RNA 서열(RSI); 및 (2) 직접 또는 간접적으로 RPS 상호 작용 분자와 상호 작용(예를 들어 결합)할 수 있고, 상기 RPS 상호 작용 분자가 상기 RNA 서열이 상기 DNA 바이러스의 바이러스 입자에 패키징되도록 촉진하는 RNA 패키징 신호(RPS)를 포함하고, 선택적으로, 상기 RNA 서열을 코딩하거나 이에 대응되는 DNA 서열 또는 상기 DNA 서열의 역-상보적인 서열은 상기 DNA 바이러스의 바이러스 입자에 패키징되는 능력(AAV 패키징을 위한 기능적 AAV ITR과 같은 상기 DNA 서열 또는 그 역-상보적인 서열에 DNA 패키징 신호가 결핍됨)이 감소되거나, 약화되거나 또는 거의 없다.

일부 실시 형태에 있어서, DNA 바이러스의 바이러스 입자는 AAV 바이러스 입자 또는 종양용해 바이러스 입자이다.

일부 실시 형태에 있어서, RPS는 상기 RSI의 5’ 말단에 위치하거나 가깝거나, 상기 RSI의 3’ 말단에 위치하거나 가깝거나 또는 상기 RSI의 내부(예를 들어, mRNA의 인트론 내)에 위치한다.

일부 실시 형태에 있어서, RNA 서열은 서로 같거나 다른 하나 이상의(예를 들어, 1개, 2개, 3개 이상의) RPS를 포함한다.

일부 실시 형태에 있어서, 상기 하나 이상의 RPS 중의 2개 이상(예를 들어, 3개)은 서로 같거나 다른 링커를 통해 서로 인접하거나 또는 직렬 연결된다.

일부 실시 형태에 있어서, RNA 서열은 서로 인접하지 않는(예를 들어, 각자 관심 RNA 서열(RSI)의 하나의 말단에 위치하거나 가까움) 2개 이상의 RPS를 포함한다.

일부 실시 형태에 있어서, RPS는 전사되고 변형된 AAV말단 역반복(ITR)를 포함하고, 여기서 상기 전사되고 변형된 AAV ITR은 (a) 전사된 기능적 Rep 결합 요소(RBE)를 포함하고, 선택적으로 전사된 기능적 RBE’를 더 포함하며, 또한 (b) 전사된 말단 분해 부위(TRS) 또는 전사된 역-상보적인 TRS(rcTRS) 또는 둘 모두가 결핍되고, 선택적으로, 상기 전사되고 변형된 AAV ITR은 전사된 D 영역 서열(D서열 또는 D’서열)을 더 포함하고; 및/또는 선택적으로, 상기 RPS 상호 작용 분자는 Rep78, Rep68, Rep52 및/또는 Rep40이다.

일부 실시 형태에 있어서, 상기 전사되고 변형된 AAV ITR은 상기 RNA의 3’말단 1000개의 뉴클레오티드, 800개의 뉴클레오티드, 500개의 뉴클레오티드, 300개의 뉴클레오티드 또는 200개의 뉴클레오티드 내에 존재하고, 선택적으로, 상기 전사되고 변형된 AAV ITR은 폴리A 서열, 폴리A 신호 서열(예를 들어, AAUAAA) 또는 RNA전사 종결 서열(예를 들어, 히스톤 다운스트림 요소)의 5’에 존재한다.

일부 실시 형태에 있어서, 상기 전사되고 변형된 AAV ITR은 전사된 야생형 Flip 또는 Flop ITR에 기반하여 변형된 것이고, 선택적으로, 상기 야생형 Flip 또는 Flop ITR은 AAV1, AAV2, AAV3A, AAV3B, AAV4, AAV5, AAV6, AAV7, AAVrh74, AAV8, AAV9, AAV10, AAV11, AAV12 또는 AAV13으로부터 유래된다는(선택적으로, 상기 야생형 Flop ITR은 SEQ ID NO: 1의 뉴클레오티드 서열을 가짐).

일부 실시 형태에 있어서, 상기 전사되고 변형된 AAV ITR은 전사된 TRS 및 전사된 rcTRS 둘 모두가 결핍하다.

일부 실시 형태에 있어서, 상기 전사되고 변형된 AAV ITR은 전사된 D 영역 서열을 포함한다(선택적으로, 상기 변형된 AAV ITR은 SEQ ID NO: 3의 뉴클레오티드 서열을 가짐).

일부 실시 형태에 있어서, 상기 전사되고 변형된 AAV ITR은 상기 전사된 D 영역 서열이 결핍하다(선택적으로, 상기 변형된 AAV ITR은 SEQ ID NO: 2의 뉴클레오티드 서열을 가짐).

일부 실시 형태에 있어서, RNA 서열은 제2 전사되고 변형된 AAV ITR을 더 포함하고, 상기 제2 전사되고 변형된 AAV ITR은 제2 전사된 기능적 RBE 서열을 가지나 제2 전사된 TRS 또는 제2 전사된 rcTRS 또는 둘 모두가 결핍하며, 선택적으로, 상기 제2 전사되고 변형된 AAV ITR은 제2 전사된 D 영역 서열을 더 포함한다.

일부 실시 형태에 있어서, 상기 전사되고 변형된 AAV ITR 및 상기 제2 전사되고 변형된 AAV ITR은 서로 같다(또는 서로 다르다).

일부 실시 형태에 있어서, 상기 전사되고 변형된 AAV ITR 및 상기 제2 전사되고 변형된 AAV ITR은 (만약 존재하면)대응되는 전사된 야생형 AAV ITR D 영역 서열 또는 대응되는 전사된 야생형 TRS/rcTRS 중의 결실, 대응되는 전사된 야생형 AAV ITR D 영역 서열 또는 대응되는 전사된 야생형 TRS/rcTRS 중의 돌연변이 또는 대응되는 전사된 야생형 AAV ITR D 영역 서열 또는 대응되는 전사된 야생형 TRS/rcTRS 중의 삽입을 포함한다.

일부 실시 형태에 있어서, 상기 제2 전사되고 변형된 AAV ITR은 상기 RNA 서열의 5’말단 1000개의 뉴클레오티드, 800개의 뉴클레오티드, 500개의 뉴클레오티드, 250개의 뉴클레오티드 또는 150개의 뉴클레오티드 내에 존재한다.

일부 실시 형태에 있어서, 상기 RPS는 MS2 서열, PP7 결합 부위 또는 com 결합 부위를 포함하고, 상기 RPS 상호 작용 분자는 결합과 같이 직접 또는 간접적으로 상기 RPS 상호 작용(예를 들어 결합)할 수 있는 RPS 상호 작용 단백질(RPSIP)을 포함하며, 예컨대 MS2 서열의 경우 박테리오파지 유래의 MS2 외피 단백질(MCP), PP7 결합 부위의 경우 PP7 박테리오파지 외피 단백질(PCP) 또는 com 결합 부위의 경우 박테리오파지 COM 단백질(COM)을 포함한다.

일부 실시 형태에 있어서, 상기 RPSIP는 직접 또는 간접적으로 상기 DNA 바이러스의 바이러스 입자의 바이러스 패키징 시스템의 단백질 성분(예를 들어 아데노 관련 바이러스2(AAV2)의 Rep78 및/또는 Rep68 또는 조립 활성화 단백질(AAP))과 관련된다(예를 들어 융합된다).

일부 실시 형태에 있어서, 상기 RNA 서열은 전사된 DNA 패키징 신호, 예를 들어, 전사된 야생형 AAV ITR 서열(예를 들어, 상기 RNA 서열은 전사되고 변형된 AAV ITR 서열을 포함하고, 상기 전사되고 변형된 AAV ITR 서열은 대응되는 전사된 야생형 AAV ITR 서열의 뉴클레오티드의 추가, 결실 및/또는 치환을 가져 상기 DNA 바이러스의 바이러스 입자의 DNA 패키징 능력을 저하)를 포함하거나 바람직하게는 포함하지 않는다.

일부 실시 형태에 있어서, RNA 서열은 (1) 전사된 전사 인핸서; (2) 전사된 인트론 서열 또는 엑손 서열(예를 들어 단백질 발현을 강화하기 위한 전사된 인트론 서열 또는 엑손 서열); (3) 5’ UTR 서열; (4) 3’ UTR 서열; (5) 폴리A 서열 또는 폴리아데닐화(폴리A) 신호 서열 및 선택적으로 상기 폴리A 신호 서열 다운스트림의 GU 풍부 영역; (6) 전사 후 조절 요소 또는 서열, 예를 들어 전사된 우드척 간염 바이러스(WHP) 전사 후 조절 요소(WPRE) 서열; 및/또는 (7) 전사 종결 서열(예를 들어 히스톤 다운스트림 요소)을 더 포함하고, 선택적으로, 상기 RNA 서열은 상기 전사 후 조절 요소 또는 서열의 3’ 및 상기 폴리A 서열 또는 폴리A 신호 서열의 5’에 위치하는 RPS를 포함한다.

일부 실시 형태에 있어서, RNA 서열 5’에서 3’ 방향으로 RSI, 임의의 전사된 WPRE 서열; RPS(예를 들어전사되고 변형된 AAV ITR, MS2 서열, PP7 결합 부위 또는 com 결합 부위); 및 폴리A 서열 또는 폴리A 신호 서열을 포함한다.

일부 실시 형태에 있어서, GOI는 단백질(예를 들어, 형광 단백질, 치료성 단백질, 항원 단백질, 또는 유전자 편집 단백질, 예를 들어 Cas 단백질, ZFN 단백질, TALEN 단백질), 효소(예를 들어 Cre 단백질 또는 CRISPR/Cas 이펙터 효소, 예를 들어, Cas9, Cas12, Cas13 또는 그 변이체), 구조 단백질, mRNA, 비코딩RNA(ncRNA), siRNA, piRNA, 짧은 헤어핀 RNA 또는 shRNA, 마이크로 RNA(miRNA) 또는 그 전구체(전구체 miRNA(pre-miRNA) 및 pri-miRNA(pri-miRNA) 포함), 리보솜 RNA(rRNA), 안티센스 서열 또는 올리고뉴클레오티드(ASO), CRISPR-Cas시스템의 RNA 성분(단일 가이드 RNA(또는 sgRNA, 키메릭 RNA, RNA 키메라)와 같은 가이드 RNA(또는 gRNA), CRISPR RNA(crRNA) 및 tracr RNA 포함), CRISPR/Cas 이펙터 효소를 위한 가이드 RNA 또는 gRNA, rRNA, tRNA, snoRNA, snRNA, exRNA, scaRNA, lncRNA, Xist 및 HOTAIR을 포함한다.

일부 실시 형태에 있어서, RNA 서열은 단일 가닥 RNA이고, 이는 길이가 약 8,900개의 뉴클레오티드 미만이고, 길이가 약 8,000개의 뉴클레오티드 미만이며, 길이가 약 7,000개의 뉴클레오티드 미만이고, 길이가 약 6,000개의 뉴클레오티드 미만이며, 길이가 약 5,200개의 뉴클레오티드 미만이고, 길이가 약 4,000개의 뉴클레오티드 미만이며, 길이가 약 3,000개의 뉴클레오티드 미만이고, 길이가 약 2,000개의 뉴클레오티드 미만이며, 길이가 약 4,700-5,200개의 뉴클레오티드이고, 길이가 약 4,700-5,000개의 뉴클레오티드이며, 길이가 약 4,700-4,800개의 뉴클레오티드이거나 또는 길이가 약 4,700개의 뉴클레오티드인 단일 가닥 RNA이다.

본 발명의 다른 양태는 폴리뉴클레오티드를 제공하고, 상기 폴리뉴클레오티드는 본 발명의 RNA 서열을 코딩하는 카세트를 포함하며, 선택적으로, 상기 폴리뉴클레오티드는 DNA 서열(예를 들어, DNA 플라스미드)이며, 상기 DNA 서열은 선택적으로 상기 DNA 플라스미드의 백본에 스터퍼 서열을 포함하고, 및/또는 선택적으로 AAV ITR과 같은 기능적 DNA 패키징 신호를 포함하지 않는다.

일부 실시 형태에 있어서, 폴리뉴클레오티드는 상기 카세트에 의해 코딩되는 RNA 서열에 조작 가능하게 연결되고 전사되도록 구동하는 프로모터를 더 포함한다.

일부 실시 형태에 있어서, 프로모터는 편재 프로모터이다.

일부 실시 형태에 있어서, 프로모터는 조직 특이적 프로모터이다.

일부 실시 형태에 있어서, 프로모터는 전신 발현 프로모터이다.

일부 실시 형태에 있어서, 프로모터는 유도성 프로모터이다.

일부 실시 형태에 있어서, 폴리뉴클레오티드는 프로모터에 의해 구동되는 RNA 서열의 전사를 강화하는 인핸서를 더 포함한다.

본 발명의 다른 양태는 재조합 DNA 바이러스의 바이러스 입자을 제공하고, 상기 재조합 DNA 바이러스의 바이러스 입자는 DNA 바이러스(예컨대 AAV 바이러스 또는 종양용해 바이러스)의 단백질 쉘(예컨대 캡시드)에 패키징되는 RNA 게놈(예컨대, 본 발명의 RNA 서열 또는 본 발명의 폴리뉴클레오티드로부터 전사된 RNA 서열)을 포함한다.

일부 실시 형태에 있어서, DNA 바이러스는 AAV이고, 재조합 DNA 바이러스의 바이러스 입자는 재조합 RNA 아데노 관련 바이러스(rRAAV) 입자이며, 상기 재조합 RNA 아데노 관련 바이러스 입자는 (1) AAV 캡시드; 및 (2) 상기 AAV 캡시드 내에 패키징되는 본 발명의 RNA 서열 또는 본 발명의 폴리뉴클레오티드로부터 전사된 RNA 서열을 포함한다.

일부 실시 형태에 있어서, AAV 캡시드는 혈청형 AAV1, AAV2, AAV3A, AAV3B, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, AAV-DJ, AAV PHP.eB, Anc80L65, Anc80L65AAP, AAVrh74 또는 7m8의 AAV로부터 유래된 캡시드를 포함한다.

본 발명의 다른 양태는 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체를 제공하고, 상기 군체는 복수의 본 발명의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)를 포함하며, 여기서 상기 군체 내의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 중의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 이상은 이에 패키징된 본 발명의 RNA 서열 또는 본 발명의 폴리뉴클레오티드로부터 전사된 RNA 서열을 갖는다.

본 발명의 다른 양태는 숙주 세포를 제공하고, 상기 숙주 세포는 본 발명의 RNA 서열, 본 발명의 폴리뉴클레오티드, 본 발명의 폴리뉴클레오티드로부터 전사된 RNA 서열, 본 발명의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 및/또는 본 발명의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체를 포함한다.

일부 실시 형태에 있어서, 숙주 세포는 바이러스 패키징 시스템을 더 포함하고, 상기 바이러스 패키징 시스템은 본 발명의 RNA 서열 또는 본 발명의 폴리뉴클레오티드로부터 전사된 RNA 서열이 DNA 바이러스의 바이러스 입자 중에 패키징되도록 촉진한다.

일부 실시 형태에 있어서, 바이러스 패키징 시스템은 (1) rep 유전자 및 cap 유전자의 전사를 구동하는 하나 또는 복수의 프로모터의 전사 제어 하에 있는 AAV rep 유전자(예를 들어, Rep78, Rep68, Rep52 및/또는 Rep40의 코딩 서열) 및 AAV cap 유전자(예를 들어, VP1, VP2, VP3, AAP 및/또는 MAAP의 코딩 서열) 또는 그 발현 산물; (2) 아데노 바이러스 E2A, E4 및 VA유전자 또는 상기 하나 이상의 단백질과 같이 AAV 패키징에 필요한 하나 이상의 단백질의 하나 또는 복수의 코딩 서열; 및 (3) RPS 상호 작용 분자 또는 그 코딩 서열을 포함하며, 선택적으로, 바이러스 패키징 시스템은 DNA 서열을 상기 DNA 바이러스의 바이러스 입자에 패키징하는 능력은 예를 들어 (1) 본 발명의 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 본 발명의 폴리뉴클레오티드 상의 DNA 패키징 신호(예를 들어 AAV ITR의 일부 또는 전부)를 제거하고, (2) 상기 AAV rep 유전자, 상기 AAV cap 유전자 및/또는 AAV 패키징에 필요한 하나 이상의 단백질의 상기 하나 또는 복수의 코딩 서열을 변형(예를 들어 돌연변이)시켜, 상응한 번역된 단백질이 상기 DNA 서열이 상기 DNA 바이러스의 바이러스 입자에 패키징하도록 촉진하는 능력(예를 들어, Rep78 및 Rep68 단백질의 공유 서열 중의 Y156F 돌연변이, KDE-mu 또는 EKE-mu)을 감소시키거나, 약화시키거나 또는 거의 제거하며, 및/또는 (3) 본 발명의 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 본 발명의 폴리뉴클레오티드의 크기를 확대하는 것을 통해 감소되거나, 약화되거나 또는 거의 제거된다.

일부 실시 형태에 있어서, 숙주 세포는 포유동물 세포 (예컨대 HEK293세포) 또는 곤충세포 (예컨대 Sf9 또는 Sf21세포)이다.

본 발명의 다른 양태는 본 발명의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 또는 본 발명의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체를 생성하는 방법을 제공하고, 상기 방법은 a) 본 발명의 숙주 세포를 충분한 시간 동안 배양하는 단계; 및 b) 상기 재조합 DNA 바이러스의 바이러스 입자 또는 상기 재조합 DNA 바이러스의 바이러스 입자의 군체를 수득하는 단계를 포함한다.

일부 실시 형태에 있어서, 상기 방법은 재조합 DNA 바이러스의 바이러스 입자 또는 재조합 DNA 바이러스의 바이러스 입자의 군체를 단리 또는 정제하는 단계를 더 포함한다.

본 발명의 다른 양태는 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 또는 재조합 DNA 바이러스의 바이러스 입자의 군체를 생성하는 방법을 제공하고, 상기 방법은 a) 바이러스 패키징 시스템(예를 들어, AAV 패키징 시스템)을 본 발명의 RNA 서열 또는 본 발명의 폴리뉴클레오티드로부터 전사된 RNA 서열에 상기 재조합 DNA 바이러스의 바이러스 입자 또는 상기 재조합 DNA 바이러스의 바이러스 입자의 군체를 생성하기에 충분한 시간 동안 접촉시키는 단계 및 b) 상기 재조합 DNA 바이러스의 바이러스 입자 또는 상기 재조합 DNA 바이러스의 바이러스 입자의 군체를 수득하는 단계를 포함하고; 선택적으로, c) 수득한 재조합 DNA 바이러스의 바이러스 입자 또는 재조합 DNA 바이러스의 바이러스 입자의 군체를 단리 또는 정제하는 단계를 포함한다.

일부 실시 형태에 있어서, 바이러스 패키징 시스템(예를 들어, AAV 패키징 시스템)은 (1) 상기 RNA 서열을 패키징하기 위한 상기 DNA 바이러스의 바이러스 입자의 단백질 쉘을 조립하기 위한 하나 이상의 단백질(예를 들어, AAV 캡시드를 조립하기 위한 VP1, VP2 및/또는 VP3) 또는 그 하나 또는 복수의 코딩 서열; (2) 상기 단백질 쉘의 조립 및/또는 상기 RNA 서열이 상기 DNA 바이러스의 바이러스 입자의 단백질 쉘 중에 패키징되도록 촉진하기 위한 하나 이상의 단백질(예를 들어, AAV 패키징을 위한 Rep78, Rep68, Rep52 및/또는 Rep40) 또는 그 하나 또는 복수의 코딩 서열(예를 들어, 아데노 바이러스 E2a, E4 및 VA유전자); 및 (3) RPS 상호 작용 분자 또는 그 코딩 서열을 포함하며, 선택적으로, 바이러스 패키징 시스템은 DNA 서열을 상기 DNA 바이러스의 바이러스 입자에 패키징하는 능력은 예를 들어 (1) 본 발명의 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 본 발명의 폴리뉴클레오티드 상의 DNA 패키징 신호(예를 들어 AAV ITR의 일부 또는 전부)를 제거하고, (2) 상기 AAV rep 유전자, 상기 AAV cap 유전자 및/또는 AAV 패키징에 필요한 하나 이상의 단백질의 상기 하나 또는 복수의 코딩 서열을 변형(예를 들어 돌연변이)시켜, 상응한 번역된 단백질이 상기 DNA 서열이 상기 DNA 바이러스의 바이러스 입자에 패키징하도록 촉진하는 능력(예를 들어, Rep78 및 Rep68 단백질의 공유 서열 중의 Y156F 돌연변이, KDE-mu 또는 EKE-mu)을 감소시키거나, 약화시키거나 또는 거의 제거하며, 및/또는 (3) 본 발명의 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 본 발명의 폴리뉴클레오티드의 크기를 확대하는 것을 통해 감소되거나, 약화되거나 또는 거의 제거된다.

본 발명의 다른 양태는 본 발명의 RNA 서열 또는 본 발명의 폴리뉴클레오티드로부터 전사된 RNA 서열을 DNA 바이러스의 바이러스 입자에 패키징하는 시스템을 제공하고, 상기 시스템은 (1) 상기 RNA 서열을 패키징하기 위한 상기 DNA 바이러스의 바이러스 입자의 단백질 쉘을 조립하기 위한 하나 이상의 단백질(예를 들어, AAV 캡시드를 조립하기 위한 VP1, VP2 및/또는 VP3) 또는 그 하나 또는 복수의 코딩 서열; (2) 상기 단백질 쉘의 조립 및/또는 상기 RNA 서열이 상기 DNA 바이러스의 바이러스 입자의 단백질 쉘 중에 패키징되도록 촉진하기 위한 하나 이상의 단백질(예를 들어, AAV 패키징을 위한 Rep78, Rep68, Rep52 및/또는 Rep40) 또는 그 하나 또는 복수의 코딩 서열(예를 들어, 아데노 바이러스 E2a, E4 및 VA유전자); 및 (3) RPS 상호 작용 분자 또는 그 코딩 서열을 포함하며, 선택적으로, 바이러스 패키징 시스템은 DNA 서열을 상기 DNA 바이러스의 바이러스 입자에 패키징하는 능력은 예를 들어 (1) 본 발명의 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 본 발명의 폴리뉴클레오티드 상의 DNA 패키징 신호(예를 들어 AAV ITR의 일부 또는 전부)를 제거하고, (2) 상기 AAV rep 유전자, 상기 AAV cap 유전자 및/또는 AAV 패키징에 필요한 하나 이상의 단백질의 상기 하나 또는 복수의 코딩 서열을 변형(예를 들어 돌연변이)시켜, 상응한 번역된 단백질이 상기 DNA 서열이 상기 DNA 바이러스의 바이러스 입자에 패키징하도록 촉진하는 능력(예를 들어, Rep78 및 Rep68 단백질의 공유 서열 중의 Y156F 돌연변이, KDE-mu 또는 EKE-mu)을 감소시키거나, 약화시키거나 또는 거의 제거하며, 및/또는 (3) 본 발명의 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 본 발명의 폴리뉴클레오티드의 크기를 확대하는 것을 통해 감소되거나, 약화되거나 또는 거의 제거된다.

본 발명의 다른 양태는 관심 유전자(GOI)를 세포, 식물 또는 동물에 전달하는 방법을 제공하고, 상기 방법은 상기 세포, 식물 또는 동물을 본 발명의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자), 본 발명의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체 또는 본 발명의 방법을 통해 생성된 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 또는 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체에 접촉시키는 단계를 포함하고, 여기서 상기 GOI는 본 발명의 RNA 서열에 의해 코딩된다.

본 발명의 다른 양태는 관심 RNA 서열(RSI)을 세포, 식물 또는 동물에 전달하는 방법을 제공하고, 상기 방법은 상기 세포, 식물 또는 동물을 본 발명의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자), 본 발명의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체 또는 본 발명의 방법을 통해 생성된 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 또는 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체에 접촉시키는 단계를 포함한다.

본 발명의 다른 양태는 필요한 대상체에서 질병 또는 장애를 진단, 예방 또는 치료하는 방법을 제공하고, 상기 방법은 상기 대상체에게 치료 유효량 또는 조제량의 본 발명의 또는 본 발명의 방법을 통해 생성된 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체를 투여하는 단계를 포함한다.

본 발명의 다른 양태는 필요한 대상체의 질병 또는 장애를 진단, 예방 또는 치료하기 위한 약물의 제조에서 본 발명의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자), 본 발명의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체 또는 본 발명의 방법을 통해 생성된 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 또는 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체의 용도를 제공한다.

본 명세서에서 설명한 본 발명의 임의의 하나의 실시 형태는 실시예 또는 청구항에서만 설명되거나 이하의 하나의 양태/부분에서만 설명된 그러한 실시 형태를 포함하고, 명백하게 부인하거나 부당하다고 생각하지 않는 하 본 발명의 임의의 기타 하나 또는 복수의 실시 형태와 조합할 수 있는 것을 이해해야 한다.

도 1a는 3’ITR의 Flip 및 Flop 배열 중의 A:A’ 줄기 영역 서열, B:B’ 및 C:C’T 영역 서열 및 짝을 이루지 않는 D 영역 서열을 포함하는 AAV2의 야생형 ITR의 구조 및 서열을 나타낸다. RBE, RBE’ 및 TRS를 더 나타낸다.
도 1b 및 1c는 AAV1-7의 5’(도 1b) 및 3’(도 1c) ITR 서열의 다중 서열 정렬을 나타낸다.
도 2는 AAV 벡터/바이러스 입자 및 대상 RAAV 벡터/바이러스 입자의 생명 주기를 나타낸다.
도 3은 RAAV-ITR 벡터 및 대조 벡터의 전이 유전자 플라스미드의 개략도이고, 프로모터(예컨대 CAG 프로모터 또는 “C”), GOI 코딩 서열(예컨대 리포터 유전자 tdTomato 또는 “T”의 코딩 서열), WPRE 서열(또는 “W”), SV40 폴리A 신호 서열(또는 “S”) 및 야생형 ITR, 돌연변이/최적화된 ITR(dITR 또는 dITR-D)의 상대 위치 및 방향을 나타낸다.
도 4는 삼중 플라스미드 시스템으로 AAV 벡터 및 RAAV-ITR 벡터를 생성하는 개략도를 나타낸다. 3 가지 플라스미드(예를 들어, 전이 유전자 플라스미드, 패키징 플라스미드 및 헬퍼 플라스미드)로 HEK293세포와 같은 적합한 패키징 세포에 공동 형질감염시켜, 재조합 AAV 또는 RAAV 바이러스 벡터를 생성할 수 있다. 녹색 ITR은 야생형 ITR을 나타내고, 황색 ITR은 최적화된 ITR을 나타낸다. pCAG-전이 유전자, pCAG-전이 유전자 -ITR 및 pCAG-ITR-전이 유전자 -ITR은 전이 유전자 플라스미드이고, pAAV-rep/cap은 패키징 플라스미드이며, pHelper은 헬퍼 플라스미드이다.
도 5a 및 5b는 대표적인 바이러스 벡터 적정 방법을 나타낸다. 도 5a는 RAAV 적정의 흐름도이다. 도 5b는 Q-PCR의 프라이머 및 프로브를 나타낸다.
도 6a-6c는 RAAV-ITR 벡터의 적정을 나타낸다. 도 6a는 CITWS 군의 적정을 나타낸다. 도 6b는 CTWIS 군의 적정을 나타낸다. 도 6c는 CITWIS 군의 적정을 나타낸다.
도 7a 및 7b는 RAAV-dITR-D 벡터의 적정 및 감염을 나타낸다. 도 7a는 RAAV-dITR-D 벡터의 적정을 나타낸다. 도 7b는 RAAV-dITR-D 벡터의 체외 감염을 나타낸다. 동일 부피(5 μL)의 정제된 RAAV-dITR-D 벡터는 이미 2 × 10⁵ 개의 HEK293T세포를 체외 감염시키는 데 사용되었다. 감염 후 3일 및 5일에 형광 사진을 촬영한다.
도 8a는 RNA를 고효율적으로 RAAV 입자의 여러 플라스미드 작제물에 패키징하는 것을 입증하기 위한 개략도(비율에 따르지 않음)를 나타낸다.
도 8b는 패키징된 DNA 또는 RNA 중의 WPRE 서열을 검출하여, AAV-tdTomato 및 RAAV-tdTomato 작제물의 특이적 DNA 및 RNA 패키징 결과를 나타낸다. 이종 RNA 패키징 신호(RPS) 및 그 동종 RPS 결합 단백질(RBP, 예를 들어MS2의 MCP)이 모두 존재하는 경우, 유효한 RNA 패키징이 발생할 수 있다.
도 9a-9c는 확대된 플라스미드 백본을 사용하는 경우의 감소된 DNA 패키징을 나타낸다. 도 9a는 도 9b 및 9c 중 결과의 여러 플라스미드를 생성하기 위한 개략도(비율에 따르지 않음)이고, 삽입된 스터퍼 영역(L-CTWM3S)으로 인해 긴 백본 서열을 갖는 플라스미드를 포함한다. 도 9b는 CAG 특이적 프라이머로 CAG 프로모터 서열의 존재를 검출하여, AAV-tdTomato 및 RAAV-tdTomato의 특이적 DNA 패키징을 나타낸다. 도 9c는 WPRE 특이적 프라이머로 WPRE 서열의 존재를 검출하여, AAV-tdTomato 및 RAAV-tdTomato의 특이적 DNA 및 RNA 패키징을 나타낸다. 그 결과, 스터퍼 서열을 갖는 확대/연장 플라스미드 백본 서열을 사용하여 원하지 않는 DNA 패키징이 예상 밖으로 약 2배 감소될 수 있는 것으로 나타났다.
도 10a 및 10b는 MS2/MCP패키징 시스템을 사용하여 Cre전이 유전자를 고효율적으로 RAAV에 패키징하는 것을 나타낸다. 도 10a는 CAG 특이적 프라이머로 CAG 프로모터 서열의 존재를 검출하여, AAV-Cre 및 RAAV-Cre의 특이적 DNA 패키징을 나타낸다. 유의할 점은, CAG서열은 RAAV RNA 서열에 존재하지 않고, 검출된 RNA 신호는 백그라운드 신호이다. 도 10b는 WPRE 특이적 프라이머로 WPRE 서열의 존재를 검출하여, AAV-Cre 및 RAAV-Cre의 특이적 DNA 및 RNA 패키징을 나타낸다.
도 11a-11b는 RPS/RBP가 기존 AAV의 RNA 패키징을 개선한 것을 나타낸다. 도 11a는 DNA 패키징 신호(즉, ITR)만 존재하는 경우 AAV 게놈 패키징 결과를 나타낸다. 도 11b는 DNA 패키징 신호(ITR) 및 RNA 패키징 신호(MS2X3) 둘 모두가 존재하는 경우 AAV 게놈의 패키징을 나타낸다.
도 12a-12d는 RAAV 시스템 최적화 및 최적화된 RAAV 성능을 감정하는 결과를 나타낸다. 도 12a는 WPRE 서열 검출을 통해, AAV-Cre 및 RAAV-Cre의 특이적 게놈 패키징을 나타낸다. 도 12b는 Cre 서열 검출을 통해, AAV-Cre 및 RAAV-Cre의 특이적 게놈 패키징을 나타낸다. 도 12c는 AAV 및 RAAV 입자의 조성물의 은염색 분석을 나타낸다. 도 12d는 TEM를 통해 AAV 및 RAAV 입자에 대한 모폴로지 분석을 나타내고, 스케일바는 100 nm이다.
도 13a 및 13b는 AAV 및 RAAV의 DNA 패키징을 감소시킨 결과를 나타낸다. 도 13a는 조작된 Rep가 기존 AAV의 DNA 패키징을 감소시키는 것을 나타낸다. 도 13b는 여러 돌연변이 MCP 융합 단백질(이중 돌연변이 MCP 융합 단백질 DJ-MCPX2 포함)을 사용하여 RAAV 중의 DNA 패키징를 감소시키는 것을 나타낸다.
도 14a-14d는 RAAV 바이러스 입자가 기능적 전이 유전자 코딩 단백질을 발현시키는 것을 나타낸다. 샘플은 도 14a-14c에서 동일한 방식으로 지정한다. 도 14a는 감염 세포에서 Cre mRNA 수준의 시간 과정을 나타낸다. 도 14b는 감염 20시간 후 감염 세포에서 Cre mRNA 수준의 배율 변화를 나타낸다. 도 14c는 감염 세포에서 Cre DNA의 시간 과정을 나타낸다. 도 14d는 감염 5일 후 유세포 분석법을 통해 정량한 감염 세포의 백분율을 나타내고, n = 2 개의 반복이다.
도 15a-15d는 AAV 또는 RAAV 감염된 Ai9-MEF세포의 DNA 및 mRNA 분석 결과를 나타낸다. 도 15a는 Cre mRNA의 Ct값을 나타낸다. 도 15b는 Cre DNA의 Ct값을 나타낸다. 도 15c는 GAPDH mRNA의 Ct값을 나타낸다. 도 15d는 36B4 DNA의 Ct값을 나타낸다.
도 16은 Ai9-MEF세포의 유전자형 감정을 나타낸다.
도 17a-17b는 RAAV 입자의 순간 전이를 나타낸다. 도 17a는 기존 AAV 전달 후 감염 세포에서 Cre 단백질 수명의 단백질 웨스턴 블롯 분석을 나타낸다. 도 17b는 RAAV 전달 후 감염 세포에서 Cre 단백질 수명의 단백질 웨스턴 블롯 분석을 나타낸다.
도 18은 RAAV 시스템에서 테스트한 별도의 기능적 RPS/RBP쌍 - PP7/PCP쌍 및 com/COM쌍을 나타낸다.
도 19는 RAAV 시스템을 AAV-DJ, AAV5, AAV8 및 AAV9를 포함한 각종 AAV 혈청형에 적용하는 것을 나타낸다.
도 20a 및 20b는 별도의 AAP 및 MCP 융합 단백질이 RAAV 수율을 증가시키는 것을 나타낸다. 도 20a는 Cre 서열을 검출하여, RAAV-Cre의 특이적 게놈 패키징을 나타낸다. 도 20b는 RAAV와 AAP N-말단 또는 C-말단 융합물(AM 또는 MA 융합 작제물)의 RNA 패키징 효율의 비교를 나타낸다.
도 21a-21c는 RAAV-Cre을 Ai9- 마우스의 해마에 순간 전이한 결과를 나타낸다. 도 21a는 높은 조제량의 AAV-Cre을 Ai9- 마우스의 해마에 전이하는 것을 나타낸다. 도 21b는 낮은 조제량의 AAV-Cre을 Ai9- 마우스의 해마에 전이하는 것을 나타낸다. 도 21c는 높은 조제량의 RAAV-Cre을 Ai9- 마우스의 해마에 전이하는 것을 나타낸다. 도 21d는 대조 마우스의 결과를 나타낸다. 적색 신호: tdTomato; 녹색 신호: Cre; 남색 신호: DAPI(핵염색).

1. 개요

본 명세서에 따른 본 발명은 DNA 바이러스 단백질 쉘을 포함한 재조합 바이러스 입자 및 단일 가닥 RNA(DNA가 아닌)과 같은 RNA를 포함한 “벡터 게놈”을 제공한다. “벡터 게놈”은 전형적인 바이러스 RNA가 아닐 수 있고, 이하에서 설명한 RNA 패키징 신호(RPS)를 제외하고, 이는 매우 적은(만약 있다면) 바이러스 기원의 서열을 가질 수 있기 때문이다. 다시 말해서, DNA 바이러스는 통상적으로 또는 자연적으로 DNA 바이러스 벡터 게놈을 단백질 쉘 내에 캡시드화하고, 본 명세서에 따른 DNA 바이러스의 바이러스 입자의 재조합 버전이 대체적으로 RNA를 캡시드화한다. “RNA” 또는 “리보핵산”은 각 자유 인산, 리보스 및 염기 (A(아데닌), U(우라실), G(구아닌) 또는 C(사이토신))으로 구성된 리보뉴클레오티드를 의미하고, 상기 리보뉴클레오티드 중의 각각은 모두 변형(예를 들어, 염기 변형, 글리코실 변형, 인산 변형, 예를 들어, 산소 변형, 불소 변형, 황 변형, 슈도변형(예를 들어, 슈도우리딘 변형), 메틸화, 캡핑(예를 들어, 5-캡핑))되거나 또는 변형되지 않을 수 있으며, 선택적으로 각각 자유 인산, 디옥시리보스 및 염기(A(아데닌), T(티민), G(구아닌) 또는 C(사이토신))로 구성된 디옥시뉴클레오티드와 직접 또는 간접적으로 융합되고, 상기 디옥시뉴클레오티드 중의 각각은 모두 변형(예를 들어, 염기 변형, 글리코신 변형, 인산 변형, 예를 들어, 산소 변형, 불소 변형, 황 변형, 슈도변형, 메틸화, 캡핑(예를 들어, 5-캡핑))되거나 또는 변형되지 않을 수 있으며, 예를 들어, RNA-DNA 키메라, DNA-RNA-DNA 키메라, RNA-DNA-RNA 키메라이다.

이러한 재조합 DNA 바이러스의 바이러스 입자의 전형적인(비한정적) 예시는 아데노 관련 바이러스(AAV)이고, 상기 아데노 관련 바이러스는 통상적으로/자연적으로 단일 가닥 DNA(ssDNA) 벡터 게놈을 캡시드화한다. 이러한 DNA 바이러스의 다른 하나의 비한정적 예시는 종양 용해성 DNA 바이러스이고, 예컨대 종양 용해성 헤르페스 바이러스(예를 들어, 단순 헤르페스 바이러스 또는 HSV), 종양 용해성 아데노 바이러스, 백시니아 바이러스(VACV), 수포성 구내염 바이러스(VSV) 등이다.

본 발명은 부분적으로 RNA 형태로 전사된 AAV ITR이 이러한 전사된 AAV ITR을 포함하는 전사된 RNA이 고효율적으로 직접 기존 AAV 바이러스 입자에 패키징되도록 촉진할 수 있는 놀라운 발견을 기반으로 한다.

본 명세서에 따른 본 발명은 또한 전사된 AAV ITR(RNA)을 제외하고, 일부 인공 또는 이종 RNA 서열 및 그 동종/대응/천연 RNA 결합 단백질도 야생형 패키징 신호 서열 및 DNA 바이러스 패키징에 유용한 기능을 대체하기 위해 RNA 패키징 신호(RPS)와 RPS 상호 작용 단백질(RPSIP)의 쌍으로 작용할 수 있음으로써, RNA를 DNA 바이러스 단백질 쉘에 패키징하고, 상기 DNA 바이러스 단백질 쉘은 통상적으로/자연적으로 DNA 벡터 게놈을 캡시드화하는 놀라운 발견을 기반으로 한다.

예를 들어, 야생형 AAV에서, DNA 벡터 게놈 5’ 및 3’ 말단 위치의 ITR 서열은 Rep-결합 요소(RBE) 및 RBE’와 같은 Rep 단백질(예컨대 Rep68 및 Rep78)과 상호 작용할 수 있는 서열 요소을 포함한다. Rep 단백질은 ITR을 결합하고 이러한 ITR 서열 요소를 포함하는 AAV ssDNA 벡터 게놈이 AAV 바이러스 입자에 패키징되도록 촉진한다.

발명자는 전사된 ITR 서열 및/또는 인공 또는 이종 RNA 서열, 예컨대 MS2 서열을 RPS로서 관심 RNA 서열(RSI)에 제공함으로써, 얻은 RPS 및 RSI로 구성된 RNA 서열을 MS2에 자연적으로 결합시키는 MCP - 박테리오파지 유래 MS2 외피 단백질(MCP)의 존재 하에 AAV 바이러스 단백질 쉘에 효과적으로 패키징할 수 있는 것을 이미 발견하였다. 인공 RPS/RPSIP쌍, 예를 들어 MS2/MCP는 RNA가 DNA 바이러스 단백질 쉘에 패키징되도록 촉진하는 능력은 DNA 패키징의 천연 ITR패키징 신호의 존재에 의존하지 않지만, 독립적으로 작용할 수 있다. 어떤 의미에서, 이종 MS2-MCP쌍은 RPS 및 RPSIP쌍의 인공 시스템을 구성하고, 상기 시스템은 효과적으로 천연 ITR-Rep DNA 패키징 시스템을 대체할 수 있으며, 전자는 RNA 패키징을 효과적으로 촉진하였다. 이러한 RNA를 함유하는 DNA 바이러스, 예컨대 AAV는 본 명세서에서 R-DNA 바이러스 입자(또는 AAV의 경우, RAAV임) 또는 재조합 R-DNA 바이러스 입자(또는 AAV의 경우 rRAAV로 칭함)로 칭할 수 있다.

본 발명의 R-DNA 바이러스 입자 및 RAAV 바이러스 입자는 적절한 길이(예를 들어, 각종 DNA 바이러스 또는 AAV의 패키징 한도 내)의 임의의 전이 유전자 또는 관심 유전자(GOI)의 RNA 전사체 또는 임의의 가이드 RNA를 DNA 바이러스 단백질 쉘 또는 AAV 바이러스 캡시드의 향성에 상용적인 숙주 세포에 전달하는 데 사용될 수 있다. 본 명세서에서 사용한 바와 같이, 재조합 DNA 바이러스 입자 예컨대 재조합 AAV 벡터, 벡터 게놈 및 재조합 AAV 바이러스 입자 또는 재조합 AAV 입자는 본 명세서에서 각각 rRAAV 벡터(재조합 RNA 아데노 관련 바이러스 벡터), 벡터 게놈 및 재조합 RAAV(rRAAV)바이러스 입자 또는 rRAAV 입자(“rRAAV 벡터” 및 “rRAAV 입자” 본 명세서에서 호환 가용 가능)로 칭한다.

특히, 한편으로, 임의의 정상적 또는 기존 AAV 벡터와 같이, 대상 RAAV 벡터는 DNA를 바이러스 유전재료로 포함하는 임의의 야생형 AAV에서 발견된 서로 같은 캡시드 중의 어느 하나로 구성될 수도 있다. 따라서, 대상 RAAV 벡터는 특이적/광범위한 향성 및 저면역원성과 같은 AAV외피로부터 유래된 모든 통상적인 우세를 갖는다.

그러나, 다른 한편으로, 대상 RAAV 벡터의 게놈은 수명이 짧은 RNA(예를 들어mRNA)로 구성되어, 이러한 RNA 유전 물질에서 임의의 코딩된 유전자 산물의 순간 발현을 초래한다.

적어도 일부 상황에서 이러한 순간 발현이 필요하다. 예를 들어, 본 발명의 RAAV 벡터는 체내 DNA 유전자 편집에 대해 유리하되, RAAV가 코딩하는 DNA유전자 편집기(예컨대 CRISPR/Cas시스템 이펙터 효소Cas9의 mRNA 코딩 서열 및 염기 편집기에 융합된 변이체)에 시간 제한적으로 노출되어 효과적인 유전자 편집을 실현할 수 있기 때문이다. 기존 DNA 기반 AAV 벡터에서 발현되는 동일한 DNA유전자 편집기의 지속적인 발현에 비해, 이러한 순간 발현되는 DNA 편집기는 오프-타겟 유전자 타겟팅을 줄이고 면역원성을 줄임으로써 유전자 요법의 안전성 스펙트럼도 개선한다.

그 외, 기존 DNA 기반 AAV 벡터에 비해, 대상 RAAV 벡터는 더욱 긴 전이 유전자를 포함할 수 있는데, 적어도 DNA 기반 AAV 벡터가 코딩하는 GOI에 필요한 프로모터(및 필요할 수 있는 임의의 비전사 인핸서 서열)가 발현되는 것을 배제하였기 때문이다.

비록 기존 DNA 기반 AAV 벡터에 비해, 대상 rRAAV 벡터는 다른 서열 요소 및 조직을 가지나, rRAAV 바이러스 입자는 기존 DNA 기반 AAV 벡터와 같은 진입 및 세포 내 운반 과정을 가진다. 그러나, 숙주 세포의 세포핵에 진입한 후 이들은 매우 다른 추세를 가진다. 세포핵 진입 후, 대상 RAAV 벡터의 mRNA 게놈을 방출하고, 그 후 세포질에 운반하여, 번역으로 이어진다. mRNA 수명은 통상적으로 몇분 또는 며칠 좌우로 매우 짧고, 최종적으로 복수의 세포 매커니즘을 통해 분해되는 것ㅣ으로 알려져 있다. 그러나, 제한된 mRNA 수명은 여전히 숙주 세포가 단백질 합성을 완료할 수 있도록 하고, 통상적으로 DNA 기반 AAV 벡터 중의 제2 가닥 cDNA 합성에 인해 지연되지 않으며, 코딩된 단백질이 빠르게 작용하도록 허용한다.

복수의 이러한 RPS/RPSIP쌍은 RNA를 DNA 바이러스에 패키징하는 데 사용될 수 있다. 발명자는 PP7 서열 및 PP7 박테리오파지 외피 단백질(PCP), 및 com서열 및 박테리오파지 COM 단백질(COM)을 포함하는 적어도 2개의 이러한 쌍을 입증하였고, 이들은 이종 RPS를 포함한 RNA(즉, 각각 PP7 및 com서열)을 효과적으로 패키징한다. 전시한 3 쌍의 RPS/RPSIP는 적어도 2개의 유형을 포괄한다. 천연 바이러스 패키징 시스템 MS2/MCP 및 PP7/PCP와 달리, com/COM은 천연적인 바이러스 패키징 시스템이 아니라 박테리오파지 Mu mom유전자의 전사 개시에서 역할을 하는 전사조절 인자로 알려져 있다. 복수의 전사되고 변형된 AAV ITR 서열도 본 발명의 RPS로 사용될 수 있다.

본 명세서에 따른 본 발명은 DNA 바이러스 특정 혈청형(예를 들어, 특정 AAV 혈청형)을 한정되지 않는다. 발명자는 각 상황에서 상용되는 RPSIP를 결합 사용하여, 적절한 RPS를 갖는 RNA 서열을 대표적인 AAV 바이러스(AAV5, AAV8, AAV9 및 AAV-DJ 포함)에 고효율적으로 패키징하는 것을 입증하였다.

본 명세서에 따른 본 발명은 또 여러 독립적인 방법을 통해 원하지 않는 DNA가 천연 DNA 바이러스 입자에 패키징되는 효율을 저하시킬 수 있는 발견에 기반한다.

일부 실시 형태에 있어서, 관심 RNA를 전사하는 DNA 벡터의 총 사이즈를 증가함으로써 원하지 않는 DNA의 패키징 효율을 저하시킬 수 있다. 예를 들어, 통상적으로 AAV 생산을 위한 삼중 형질감염 방법에 있어서, 관심 유전자(GOI)는 제1 플라스미드에 포함될 수 있고, 필요한 Rep 및 Cap 단백질은 제2 플라스미드의 rep 및 cap유전자에 의해 코딩되는 반면, 다른 AAV 패키징에 필요한 성분은 제3 플라스미드에서 제공한다. 본 발명의 이러한 실시 형태에 따르면, DNA 바이러스에 패키징될 RNA 서열은 제1 플라스미드로부터 전사될 수 있고, 상기 제1 플라스미드의 전체 크기는 랜덤으로 길이가 적어도 약 1 kb, 2 kb, 3 kb, 4 kb, 5 kb 이상의 스터퍼 서열과 같은 스터퍼 서열(예를 들어 인트론)을 포함시키거나 또는 제1 플라스미드의 전체 크기를 1 kb, 2 kb, 3 kb, 4 kb, 5 kb 이상의 스터퍼 서열, 예를 들어 약 6 kb, 7 kb, 8 kb, 9kb, 10 kb 이상의 스터퍼 서열 등으로 증가하는 것을 통해 인위적으로 증가할 수 있다.

일부 다른 실시 형태에 있어서, DNA 패키징을 촉진하는 전형적인 요소의 기능을 억제하는 것을 통해 원하지 않는 DNA 패키징 효율을 저하시킬 수 있다. DNA 패키징에 사용되는 이러한 전형적인 요소는 DNA 서열(예컨대 trs서열, RBE 또는 RBE’서열 또는 AAV의 전체 ITR 서열을 포함하는 DNA 패키징을 촉진하는 AAV ITR 서열의 요소); 및/또는 DNA 패키징에 참여하는 단백질 요소, 예컨대 DNA 서열과 상호 작용하는 단백질(예컨대 trs-엔도뉴클레아제 활성이 결핍하거나 약화된 활성을 갖는 돌연변이형 Rep68 또는 Rep 78 단백질)을 포함할 수 있다.

따라서, 본 발명의 하나의 양태는 DNA 바이러스의 바이러스 입자(예컨대 자연적으로 DNA를 패키징하는 DNA 바이러스)에 패키징될 수 있는 리보뉴클레오티드(RNA) 서열을 제공하고, 여기서 상기 RNA 서열은 (1) 관심 RNA 서열(RSI); 및 (2) RNA 패키징 신호(RPS)를 포함하며, 상기 RNA 패키징 신호는 직접 또는 간접적으로 RPS 상호 작용 분자(예를 들어, RPS 상호 작용 단백질 또는 RPSIP)와 상호 작용(예를 들어 결합)할 수 있고, 상기 RPS 상호 작용 분자는 상기 RNA 서열이 상기 DNA 바이러스의 바이러스 입자에 패키징되도록 촉진한다.

이러한 RNA 서열은 임의의 RSI(RNA)를 포함할 수 있고, “관심 유전자” 또는 “GOI”(DNA)에 의해 코딩될 수 있다.

본 명세서에 사용된 바와 같이, “관심 유전자” 또는 “GOI”는 단백질 또는 폴리펩티드의 임의의 코딩 서열을 포함하고, 인트론 및 엑손 서열 및/또는 임의의 비번역 RNA 또는 비코딩 RNA(ncRNA, 예컨대 siRNA, piRNA, 짧은 헤어핀 RNA 또는 shRNA, 마이크로 RNA 또는 miRNA 또는 그 전구체(전구체 miRNA 및 pri-miRNA 포함), 안티센스 서열 또는 올리고뉴클레오티드(ASO), CRISPR/Cas의 가이드 RNA 또는 gRNA, rRNA, tRNA, snoRNA, snRNA, exRNA, scaRNA, lncRNA, Xist 및 HOTAIR 등)의 코딩 서열을 포함한다.

유사하게, 대표적인(비한정적인) RSI는 예를 들어, mRNA와 같은 단백질(예를 들어, 치료성 단백질, 항원 단백질, 또는 CRISPR/Cas 이펙터 효소(“Cas 단백질”로 약칭)와 같은 유전자 편집 단백질, ZFN 단백질, TALEN 단백질)을 코딩하는 RNA, 또는 비코딩 기능적 RNA(예컨대 운반 RNA(tRNA), 리보솜 RNA(rRNA), 전이-메신저 RNA(tmRNA), 작은 간섭 RNA(siRNA), 짧은 헤어핀 RNA(shRNA), 안티센스 RNA 또는 올리고뉴클레오티드(ASO), 마이크로 RNA(miRNA), RNA어댑터, 또는 CRISPR-Cas(예를 들어, Cas9, Cas12, Cas13) 시스템의 RNA 성분(예컨대 단일 가이드 RNA(또는 sgRNA, 키메릭 RNA, RNA 키메라), CRISPR RNA(crRNA) 및 tracr RNA) 또는 그 전구체, 또는 RISC복합물 또는 RNAi 경로의 RNA 성분(예컨대 shRNA, miRNA 또는 siRNA), 조절 RNA, Piwi 상호 작용 RNA(piRNA), 소핵소체 RNA(snoRNA), 긴 비코딩 RNA(lncRNA)(유전자간 lincRNA, 인트론ncRNA 및 센스/안티센스 lncRNA 포함), long intervening/유전자간 비코딩 RNA(lincRNA), 인핸서 RNA, bacterial small RNA(sRNA), snRNA, exRNA, scaRNA, Xist 및 HOTAIR 및 그 전구체를 포함한다.

본 발명의 RNA 서열 또는 GOI는 하나의 코딩 서열 또는 하나 이상의(예를 들어, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의) 코딩 서열을 포함할 수 있다. 코딩 서열의 길이 또는 모든 코딩 서열의 조합 길이는 특정 또는 선택된 DNA 바이러스의 바이러스 입자(예를 들어, AAV 바이러스 입자)에 패키징될 수 있는 RNA의 최대 길이를 초과하지 않을 수 있고, 특정 DNA 바이러스(예를 들어, AAV) 바이러스 입자와 다른 종 사이에서 다를 수 있다.

일부 실시 형태에 있어서, 본 발명의 RNA 서열을 코딩하거나 본 발명의 RNA 서열에 대응되는 DNA 서열 또는 상기 DNA 서열의 역-상보적인 서열은 감소되거나, 약화되거나 또는 거의 DNA 바이러스의 바이러스 입자에 패키징되지 않는 능력을 갖는다. 예를 들어, DNA 서열은 본 발명의 RNA 서열(예를 들어, 상기 DNA 서열은 본 발명의 RNA 서열의 역-상보적인 서열을 가짐)을 코딩할 수 있다. DNA 서열은 본 발명의 RNA 서열에 대응될 수도 있는데, 상기 DNA 서열은 다른 측면에서 본 발명의 RNA 서열과 서로 같은 뉴클레오티드 서열을 갖고, 상기 DNA 서열을 제외하고 본 발명의 RNA 서열 중의 U가 아닌 T를 가지기 때문이다. 어쨌든, DNA 서열 또는 그 역-상보적인 서열은 AAV 패키징을 위한 AAV ITR 과 같은 DNA 바이러스의 바이러스 입자에 패키징되기 위한 기능적 DNA 패키징 신호가 결핍할 수 있어, 상기 DNA 서열 또는 그 역-상보적인 서열(DNA)이 감소되거나, 약화되거나 또는 거의 DNA 바이러스의 바이러스 입자에 패키징되지 않는 능력을 갖도록 한다.

일부 실시 형태에 있어서, 본 발명의 RNA 서열은 DNA 작제물로부터 전사되고, 예컨대 상기 RNA 서열을 코딩하는 DNA 플라스미드로부터 전사되며, 여기서 상기 DNA 작제물/플라스미드는 그 백본 서열에 스터퍼 서열(예를 들어, 인트론 서열)을 포함하여 본 발명의 RNA 서열의 패키징을 강화하고 및/또는 원하지 않는 DNA가 DNA 바이러스의 바이러스 입자에 패키징되는 것을 줄인다. 예를 들어, 본 발명의 RNA 서열은 DNA 작제물/플라스미드로부터 전사될 수 있고, 상기 DNA 작제물/플라스미드의 전체 크기는 랜덤으로 길이가 적어도 약 1 kb, 2 kb, 3 kb, 4 kb, 5 kb 이상의 스터퍼 서열과 같은 DNA스터퍼 서열을 포함시키거나, 또는 상기 DNA 작제물/플라스미드의 전체 크기를 1 kb, 2 kb, 3 kb, 4 kb, 5 kb 이상의 스터퍼 서열, 예를 들어, 약 6 kb, 7 kb, 8 kb, 9 kb, 10 kb 이상의 스터퍼 서열 등으로 증가하는 것을 통해 인위적으로 증가할 수 있다. 스터퍼 서열은 본 발명의 RNA 서열 코딩 서열을 포함하는 전사 유닛의 업스트림(예를 들어, 인접 업스트림)에 위치할 수 있다(도 9a를 참조하면, 여기서 > 3 kb의 긴 스터퍼 서열은 본 발명의 예시적 RNA 서열 전사를 구동하는 CAG 프로모터의 업스트림에 접근하여 삽입함). 일부 실시 형태에 있어서, 스터퍼 서열은 프로모터의 업스트림에 직접 삽입되고, 상기 프로모터는 본 발명의 RNA 서열의 코돈 서열에 조작 가능하게 연결된다. 선택적으로, 일부 실시 형태에 있어서, 본 발명의 RNA 서열의 코딩 서열은 DNA 바이러스의 바이러스 입자의 기능적 천연 DNA 패키징 신호가 결핍되고, 예컨대 AAV 바이러스 입자에 패키징되는 기능적 ITR 서열이 결핍된다.

일부 실시 형태에 있어서, 본 발명의 RNA 서열은 DNA 바이러스의 바이러스 입자에 패키징될 수 있고, 상기 DNA 바이러스의 바이러스 입자는 AAV 바이러스 입자이다. 임의의 AAV 바이러스는 모두 본 발명의 RNA 서열을 패키징하는 데 사용될 수 있고, AAV1, AAV2, AAV3A, AAV3B, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV 11, AAV 12, AAV 13, AAVrh10, AAVrh74, AAVhu32, AAVhu37, AAV-DJ, AAV PHP.eB, Anc80L65, Anc80L65AAP, AAVrh74 또는 7m8을 포함하나 이에 한정되지 않는다.

일부 실시 형태에 있어서, 본 발명의 RNA 서열은 DNA 바이러스의 바이러스 입자에 패키징될 수 있고, 상기 DNA 바이러스의 바이러스 입자는 종양용해 바이러스 입자이다. 예시적(비한정적) 종양용해 바이러스 입자는 종양 용해성 헤르페스 바이러스(예를 들어, 단순 헤르페스 바이러스 또는 HSV), 종양 용해성 아데노 바이러스, 백시니아 바이러스(VACV), 수포성 구내염 바이러스(VSV) 등을 포함한다.

본 발명의 RNA 서열 중 RPS의 위치는 자유로울 수 있다. 일부 실시 형태에 있어서, RPS는 본 발명의 RNA 서열의 5’ 말단에 위치하거나 가깝가나, 본 발명의 RNA 서열의 3’ 말단에 위치하거나 가깝가나, 또는 본 발명의 RNA 서열의 내부에 위치한다. 일부 실시 형태에 있어서, RPS는 관심 RNA 서열(RSI)의 5’ 말단에 위치하거나 가깝가나, 관심 RNA 서열(RSI)의 3’ 말단에 위치하거나 가깝가나, 또는 관심 RNA 서열의 내부(mRNA의 인트론 내)에 위치한다.

본 발명의 RNA 서열에는 하나 또는 복수의 RPS가 존재할 수 있다. 일부 실시 형태에 있어서, 본 발명의 RNA 서열은 같거나 대체로 같은 하나 이상의(예를 들어, 1개, 2개, 3개 이상의) RPS를 포함한다. 일부 실시 형태에 있어서, 본 발명의 RNA 서열은 하나 이상의(예를 들어, 1개, 2개, 3개 이상의) RPS를 포함하고, 여기서 적어도 2개가 서로 다르다.

본 발명의 RNA 서열에 하나 이상의 RPS가 존재하는 경우, 상기 하나 이상의 RPS 중의 적어도 2개의 직렬 연결되는 것과 같은 서로 인접하는 둘 사이에 임의의 링커 서열을 갖는다. 임의의 2개의 인접한 RPS 서열 사이의 링커는 서로 같거나 서로 다를 수 있다. 링커 서열은 랜덤 RNA 서열일 수 있고, 실질적인 2차 구조를 가지지 않으며, 공지의 기능적 서열 또는 요소를 가지지 않고 및/또는 GC 함량이 50% 보다 작을 수 있다. 링커의 길이는 1-1 kb, 1-500개의 염기, 1-200개의 염기, 1개 내지 약 100개의 염기, 1개 내지 약 60개의 염기, 약 5개 내지 약 55개의 염기, 약 10개 내지 약 30개의 염기 또는 약 15-25개의 염기 사이의 임의의 길이일 수 있다.

일부 실시 형태에 있어서, 본 발명의 RNA 서열은 서로 인접한 3개의 RPS 서열을 포함하고, 2개의 링커 서열에 의해 나뉘어지며, 각 링커 서열은 독립적으로 약 20개 또는 약 50개의 염기이다. .예를 들어, 3개의 서로 같은 RPS 서열 중의 앞 2개는 20개의 염기의 링커에 의해 나뉘어지고 및/또는 상기 RPS 서열 중의 마지막 2개는 51개의 염기의 링커에 의해 나뉘어질 수 있다.

일부 실시 형태에 있어서, 본 발명의 RNA 서열은 하나 이상의 RPS(예를 들어, 1개, 2개, 3개, 4개 또는 5개의 RPS)를 포함하고, 여기서 상기 하나 이상의 RPS 중의 적어도 2개는 서로 인접하지 않는다. 예를 들어, RPS 중의 하나는 본 발명의 RNA 서열의 5’ 말단에 위치할 수 있고, 다른 하나의 RPS는 본 발명의 RNA 서열의 3’ 말단에 위치할 수 있으며, 본 발명의 RNA 서열 내의 RSI로서 임의의 3번째 RPS는 mRNA의 인트론 내에 위치할 수 있다. 4번째 및/또는 5번째 RPS는 1번째, 2번째 또는 3번째 RPS 중의 임의의 하나에 가깝거나 인접할 수 있다.

일부 실시 형태에 있어서, 본 발명의 RNA 서열은 서로 인접하지 않는(예를 들어, 각각 관심 RNA 서열(RSI)의 하나의 말단에 위치하거나 접근하는) 적어도 2개의(예를 들어, 2 개 이상의)RPS 서열을 포함한다.

일부 실시 형태에 있어서, RPS는 전사되고 변형된 AAV말단 역반복(ITR)을 포함하고, 여기서 상기 전사되고 변형된 AAV ITR은 (a) 전사된 기능적 Rep 결합 요소(RBE)를 포함하며, 선택적으로 전사된 기능적 RBE’를 더 포함하고; (b) 전사된 말단 분해 부위(TRS) 또는 전사된 역-상보적인 TRS(rcTRS) 또는 둘 모두가 결핍된다. 일부 실시 형태에 있어서, 전사되고 변형된 AAV ITR은 전사된 D 영역 서열(D 서열 또는 D’서열)을 더 포함한다. 일부 실시 형태에 있어서, RPS 상호 작용 분자는 Rep78, Rep68, Rep52 및/또는 Rep40이다.

본 명세서에 사용된 바와 같이, “AAV 바이러스 입자”는 아데노 관련 바이러스(AAV)(데펜도파르보바이러스속에 속하고, 또한 파르보바이러스과에 속하는) 임의의 야생형 캡시드를 함유하는 바이러스 입자, 및 변형된 서열 및/또는 조직 또는 숙주 향성을 갖는 조작된 것이거나 변이체를 포함한다.

본 명세서에 사용된 바와 같이, “인트론”은 DNA 또는 RNA의 비코딩 단편을 의미하고, 통상적으로 스플라이싱을 통해 상기 비코딩 단편을 전사된 RNA에서 제거한다. 그러나, 본 발명의 RNA 서열은 인트론 서열, 예컨대 이종 유전자(관심 유전자 또는 GOI의 “이종”에 관련하여, 본 발명의 rRAAV 바이러스 입자를 통해 숙주 세포에 전달되는 전이 유전자로서 발현됨)로부터 유래된 인트론 서열을 포함하여, GOI의 발현을 강화시킬 수 있다. 본 발명의 RNA 서열 중의 이러한 인트론 서열은 스플라이싱을 통해 제거될 수 있고, 제거되지 않을 수도 있다. 그 외, 이러한 인트론 서열은 전사된 인핸서 또는 그 일부를 더 포함할 수 있는데, 일부 인핸서가 코딩DNA의 인트론 내에 위치할 수 있기 때문이다.

본 명세서에 사용된 바와 같이, “엑손”은 DNA 또는 RNA의 코딩 단편을 의미하고, 엑손은 단백질 서열로 번역된다. 그러나, 일부 실시 형태에 있어서, 본 발명의 RNA 서열 내의 엑손 서열은 GOI의 일부 또는 전부를 코딩할 수 있고, 상기 GOI는 본 발명의 rRAAV 바이러스 입자를 통해 숙주 세포에 전달되는 전이 유전자로서 발현된다. 다른 실시 형태에 있어서, 본 발명의 RNA 서열 내의 엑손 서열은 이종 유전자(GOI에 관련하여)에 속할 수 있고, 이러한 엑손의 존재는 GOI의 발현을 강화시킬 수 있다.

본 명세서에 사용된 바와 같이, “코딩 서열”은 산물을 코딩하는 DNA 또는 RNA의 폴리뉴클레오티드 서열을 포함하고, 상기 산물은 (a) 단백질 또는 폴리펩티드 또는 (2) 단백질 또는 폴리펩티드 이외의 산물(예를 들어, ncRNA, 예컨대 siRNA, piRNA, 짧은 헤어핀 RNA 또는 shRNA, 마이크로 RNA 또는 miRNA 또는 그 전구체(전구체 miRNA 및 pri-miRNA 포함), 안티센스 서열 또는 올리고뉴클레오티드(ASO), CRISPR/Cas의 가이드 RNA 또는 gRNA, rRNA, tRNA, snoRNA, snRNA, exRNA, scaRNA, lncRNA, Xist 및 HOTAIR 등)일 수 있다.

RAAV 바이러스 입자의 RNA가 AAV 캡시드 중에서 단리되어 세포에 방출되기만 하면, 관심 유전자의 리보뉴클레오티드 코딩 서열은 세포 내에서 추가 가공될 수 있다. 코딩 서열을 처리하여 하나 이상의 RNA 산물, 예컨대 siRNA, miRNA 및/또는 mRNA을 생성할 수 있고, 상기 산물은 추가로 하나 이상의 단백질산물로 번역되거나 또는 다른 세포 기계, 예컨대 RISC복합물 또는 CRISPR/Cas 이펙터 효소(예컨대 2류, II형, V형 또는 VI형 이펙터 효소)에 포함될 수 있다.

본 명세서에 사용된 바와 같이, 용어 “전사된” 및 그 문법 변체는 리보핵산(RNA) 뉴클레오티드를 포함한 뉴클레오티드 서열을 의미하고, 상기 리보핵산 뉴클레오티드는 DNA 주형(예를 들어, 이중 가닥 DNA 및/또는 단일 가닥 DNA)으로부터 전사된다. 전사된 RNA 분자는 AAV ssDNA의 플러스 가닥 또는 마이너스 가닥에 대응될 수 있고, 여기서 전사된 플러스 가닥 RNA는 DNA 주형의 마이너스 가닥으로부터 전사되며, 전사된 마이너스 가닥 RNA는 DNA 주형의 플러스 가닥으로부터 전사된다. 일부 실시 형태에 있어서, 전사된 RNA 분자는 이중 가닥 DNA 주형의 센스 또는 안티센스 가닥으로부터 전사될 수 있다. 예를 들어, 상황에 따라 결정되고, dsDNA 서열이 한 가닥의 서열(예컨대 SEQ ID NO: 1)로만 표시되는 경우, dsDNA를 주형으로 사용하는 전사된 RNA는 센스 또는 안티센스 가닥과 서로 같은 서열을 가질 수 있다. 다시 말해서, SEQ ID NO: 1로 표시되는 이중 가닥 DNA로부터 전사된 RNA는 SEQ ID NO: 1 또는 그 역-상보적인 서열과 서로 같은 서열을 가질 수 있고, 다만 RNA 중의 U가 DNA 중의 T를 치환하였다.

본 발명의 전사되고 변형된 AAV말단 역반복(ITR) 서열은 RNA 서열(AAV 바이러스 입자 내에서 캡시드화된 기존 AAV 바이러스 게놈 중의 단일 가닥 DNA 서열과 반대)이다. 야생형 AAV ITR DNA 서열로서, 전사되고 변형된 AAV ITR 서열(RNA)도 본 발명의 RNA 서열과 AAV Rep 단백질의 결합을 지지하고, 본 발명의 RNA 서열을 직접 AAV 바이러스 입자에 패키징 하는 것을 지지할 수 있다. 일부 실시 형태에 있어서, 전사되고 변형된 ITR 서열은 전사된 Rep 결합 요소(RBE)(예를 들어, 전사된 기능적 RBE) 및 선택적으로 전사된 RBE’(예를 들어, 전사된 기능적 RBE’)를 포함하여, Rep 결합에 사용된다. 일부 실시 형태에 있어서, 전사되고 변형된 ITR 서열은 RNA 서열을 AAV 바이러스 입자에 패키징하거나 캡시드화하는 것을 지지하거나 촉진한다.

일부 실시 형태에 있어서, 변형된 ITR은 야생형 RBE를 포함한다.

일부 실시 형태에 있어서, 변형된 ITR은 기능적 RBE를 포함하고, 상기 기능적 RBE는 야생형 RBE를 보류하여 AAV 패키징 능력(예컨대 Rep결합)의 적어도 약 60%, 70%, 80%, 90%, 95%, 100% 이상을 지지한다. 일부 실시 형태에 있어서, 야생형 RBE에 비해, 예를 들어 RBE의 하나 또는 복수의 뉴클레오티드의 삽입, 결실, 치환 및/또는 기타 돌연변이로 인해, 기능적 RBE는 약 30%, 25%, 20%, 15%, 10% 또는 5%에 달하는 서열 변이를 포함한다.

일부 실시 형태에 있어서, 이로부터 전사되고 변형된 AAV ITR이 전사되는 변형된 AAV ITR DNA 주형은 ITR로서 결함이 있는데, 이는 대응되는 야생형 AAV ITR의 하나 또는 복수의 기능이 결핍하고, 예컨대 TRS(전사된 말단 분해 부위, 이하 참조)에서 절단할 수 있기 때문이다. 이는 예를 들어 기능적 TRS 결핍으로 인한 것일 수 있다. 일 실시 형태에 있어서, 야생형 TRS를 완전히 결실하여, 변형된 ITR에 TRS가 없도록 한다. 일 실시 형태에 있어서, 결실, 삽입, 치환 및/또는 돌연변이를 통해 하나 또는 복수의 뉴클레오티드가 야생형 TRS로 돌연변이되어, AAV복제 기간에 더 이상 Rep에 의해 인식 및 절단되지 않는다.

일부 실시 형태에 있어서, 변형된 AAV ITR DNA 주형은 본 명세서에 따른 RBE 또는 그 기능적 변이체, 및 선택적으로 RBE’ 또는 그 기능 변이체를 보류한다. 일부 실시 형태에 있어서, RBE 및/또는 RBE’는 AAV Rep78/68 결합 측면에서 기능을 가진다.

본 발명의 전사되고 변형된 AAV말단 역반복(ITR)은 전사된 말단 분해 부위(TRS) 또는 전사된 역-상보적인 TRS(rcTRS) 또는 둘 모두가 더 결핍하다. 일부 실시 형태에 있어서, TRS는 변형된 AAV ITR의 5’ 말단에 위치한다. 일부 실시 형태에 있어서, TRS는 D 영역 서열과 RBE 사이에 위치한다.

일부 실시 형태에 있어서, 전사되고 변형된 AAV ITR은 전사된 TRS 및 전사된 rcTRS 둘 모두가 결핍하다.

본 명세서에 사용된 바와 같이, “말단 분해 부위” 또는 “TRS”는 AAV복제 기간에 AAV Rep 단백질에 의해 인식되고 절개구가 생성된 단일 가닥 AAV 벡터 게놈(플러스 가닥 또는 마이너스 가닥) 중의 단일 가닥 DNA 서열을 의미한다. 본 명세서에 사용된 바와 같이, “역-상보적인 TRS(rcTRS)”는 단일 가닥 AAV 벡터 게놈(플러스 가닥 또는 마이너스 가닥) 중의 단일 가닥 DNA 서열을 의미하고, 상기 단일 가닥 DNA 서열은 TRS의 역-상보적인 서열이다. rcTRS는 TRS와 페어링되어 A 영역 줄기의 하나의 말단에 이중 가닥 DNA 영역을 형성한다. 도 1a-1c를 참조한다.

AAV2 ITR에서, TRS는 TTGGC의 서열을 포함하고, Rep절단 부위가 2개의 T’ 사이에 위치하며; rcTRS는 GCCAA의 서열을 포함한다. 하나의 TRS가 D 영역과 A 영역 서열의 경계 위치에 위치하고, A 영역 서열의 5’ 최말단(예를 들어, D 영역 서열과 RBE 사이에 위치)에 위치한다. 대표적인 AAV의 5’ 및 3’ ITR 다중 서열 정렬에서의 TRS 및 rcTRS에 관하여, 도 1b 및 1c를 참조한다.

본 명세서에 사용된 바와 같이, “전사된 TRS”는 TRS DNA 주형을 통해 전사되어 생성된 단일 가닥 RNA 서열이다. TTGGC를 포함한 AAV2 TRS에 관하여, 전사된 TRS는 GCCAA를 포함한다.

본 명세서에 사용된 바와 같이, “전사된 rcTRS”는 rcTRS DNA 주형을 통해 전사되어 생성된 단일 가닥 RNA 서열이다. GCCAA를 포함한 AAV2 rcTRS에 관하여, 전사된 rcTRS는 UUGGC를 포함한다.

따라서, 전사되고 변형된 AAV ITR이 GCCAA 서열에서 통상적으로 대응되는 전사된 야생형 AAV2 ITR 중의 위치에 GCCAA 서열이 없고, 예를 들어, GCCAA 서열의 완전 결실 또는 상기 GCCAA 서열 중의 하나 또는 복수의 뉴클레오티드의 삽입, 결실, 치환 및/또는 기타 돌연변이가 없으면, 상기 전사되고 변형된 AAV ITR은 “전사된 AAV2 TRS가 결핍하다”. 이는 TRS(TTGGC)의 완전 결실을 갖는 변형된 AAV ITR의 전사로 인한 것이거나 또는 야생형 TRS 중의 하나 또는 복수의 뉴클레오티드의 삽입, 결실, 치환 및/또는 기타 돌연변이로 인한 것일 수 있다.

따라서, 일부 실시 형태에 있어서, 본 발명의 RNA 서열 또는 전사되고 변형된 AAV ITR은 전사된 기능적 TRS가 결핍하다.

유사하게, 만약전사되고 변형된 AAV ITR이 UUGGC서열에서 통상적으로 대응되는 전사된 야생형 AAV2 ITR 중의 위치에 UUGGC서열이 없고, 예를 들어, GCCAA 서열의 완전 결실에 인한 것이거나 또는 상기 GCCAA 서열 중의 하나 또는 복수의 뉴클레오티드의 삽입, 결실, 치환 및/또는 기타 돌연변이가 없으면, 상기 전사된 그 변형된 AAV ITR은 “전사된 AAV2 rcTRS가 결핍하다”. rcTRS의 완전 결실을 갖는 변형된 AAV ITR의 전사로 인한 것이거나 또는 야생형 rcTRS 중의 하나 또는 복수의 뉴클레오티드의 삽입, 결실, 치환 및/또는 기타 돌연변이로 인한 것일 수 있다.

일부 실시 형태에 있어서, 전사되고 변형된 AAV ITR은 전사된 D 영역 서열(야생형 AAV ITR 중의 D 또는 D’서열) 또는 돌연변이체 D 영역 서열(예를 들어, 하나 또는 복수의 뉴클레오티드 삽입, 결실, 치환 및/또는 기타 돌연변이를 갖는 서열)을 더 포함하고, 상기 돌연변이체 D 영역 서열은 거의 야생형 D 영역 서열의 기능을 보류하였다. 다른 실시 형태에 있어서, 전사되고 변형된 AAV ITR은 전사된 D 영역 서열을 포함하지 않거나 또는 돌연변이체 D 영역 서열(예를 들어, 하나 또는 복수의 뉴클레오티드 삽입, 결실, 치환 및/또는 기타 돌연변이의 서열)을 포함하지 않으며, 상기 돌연변이체 D 영역 서열은 거의 야생형 D 영역 서열의 기능을 보류하였다.

일부 실시 형태에 있어서, 전사되고 변형된 AAV ITR은 전사된(기능적) D 영역 서열을 포함한다. 선택적으로, 변형된 AAV ITR DNA 주형은 SEQ ID NO: 3의 뉴클레오티드 서열을 갖는다. 선택적으로, 전사되고 변형된 AAV ITR은 SEQ ID NO: 3의 RNA 등가물을 갖는다(즉, 상기 RNA 등가물은 SEQ ID NO: 3의 DNA 서열과 같은 염기 서열을 가짐). 선택적으로, 전사되고 변형된 AAV ITR은 SEQ ID NO: 3의 역-상보적인 서열의 RNA 등가물을 갖는다(즉, 상기 RNA 등가물은 SEQ ID NO: 3의 역-상보적인 서열의 DNA 서열과 같은 염기 서열을 가짐).

일부 실시 형태에 있어서, 전사되고 변형된 AAV ITR은 전사된(기능적) D 영역 서열이 결핍하다. 선택적으로, 변형된 AAV ITR DNA 주형은 SEQ ID NO: 2의 뉴클레오티드 서열을 갖는다. 선택적으로, 전사되고 변형된 AAV ITR은 SEQ ID NO: 2의 RNA 등가물을 갖는다(즉, 상기 RNA 등가물은 SEQ ID NO: 2의 DNA 서열과 같은 염기 서열을 가짐). 선택적으로, 전사되고 변형된 AAV ITR은 SEQ ID NO: 2의 역-상보적인 서열의RNA 등가물(즉, 상기 RNA 등가물은 SEQ ID NO: 2의 역-상보적인 서열의 DNA 서열과 같은 염기 서열을 가짐).

본 명세서에 사용된 바와 같이, “D 영역 서열”은 D 서열 또는 그 역-상보적인 서열 D’ 서열을 의미한다. D 영역 서열의 위치는 ITR이 “Flip” 또는 “Flop” 배열을 채택하는 데 의해 결정된다. 도 1A-1C를 참조한다. 예를 들어, 야생형 AAV2 ITR(Srivastava et al., J. Viol. [Virology Journal] 45(2):555-564, 1983의 도 2를 참조하고, 참조로 본 명세서에 포함됨)에서, 플러스 가닥 ssDNA 서열은 5’에서 3’으로 A, B, B’, C, C’, A’, D, . . ., D’, A, C, C, B, B’ 및 A’으로 명명된 회문 서열 단편을 포함하고, 여기서 A:A’, B:B’, C:C’ 및 D:D’는 서로의 역-상보적인 서열이고, 염기 페어링된 줄기 서열을 형성할 수 있다(비록 D 및 D’서열은 ssDNA AAV 벡터 게놈에서 실제로 서로 염기 페어링되지 않을 수 있음). 플러스 가닥의 5’ ITR의 B:B’ 줄기는 C:C’줄기보다 서열의 하나의 말단(5’ 말단)에 더 가깝고, Flip ITR로 칭한다. 플러스 가닥의 3’ ITR의 C:C’ 줄기는 B:B’줄기보다 서열의 하나의 말단(3’ 말단)에 더 가깝고, Flop ITR로 칭한다.

예를 들어 전사된 야생형 D 영역 서열의 하나 또는 복수의 뉴클레오티드에 대해 결실, 삽입, 치환 및/또는 기타 돌연변이를 수행함으로써, 본 발명의 전사되고 변형된 AAV ITR 서열은 기능적의 전사된 D 영역 서열(D 또는 D’서열)이 결핍될 수 있다.

일부 실시 형태에 있어서, 본 발명의 RNA 또는 전사되고 변형된 AAV ITR 서열은 돌연변이되고 전사된 D 영역 서열 및/또는 돌연변이된 전사된 TRS 서열을 포함한다. 일부 실시 형태에 있어서, 본 발명의 RNA 또는 전사되고 변형된 AAV ITR 서열은 전사된 D 영역 서열을 포함하지 않거나 및/또는 전사된 TRS/rcTRS 서열을 포함하지 않는다.

일부 실시 형태에 있어서, 전사된 야생형 Flip ITR 또는 야생형 Flop ITR에 기반하여 전사되고 변형된 AAV ITR를 변형시킨다.

일부 실시 형태에 있어서, 야생형 Flip ITR 또는 야생형 Flop ITR은 AAV1, AAV2, AAV3A, AAV3B, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV 11, AAV 12, AAV 13, AAVrh10, AAVrh74, AAVhu32, AAVhu37, AAV PHP.eB, Anc80L65, Anc80L65AAP, AAVrh74 또는 7m8로부터 유래된다. 선택적으로, 야생형 Flop ITR은 SEQ ID NO: 1의 뉴클레오티드 서열을 갖는다.

일부 실시 형태에 있어서, 전사된 D 영역 서열이 존재하고, 이는 RNA의 3’ 말단 50개의 뉴클레오티드(예를 들어, 40 nt, 30 nt, 25 nt 또는 20 nt) 내에 존재하지 않는다.

일부 실시 형태에 있어서, 전사된 D 영역 서열이 존재하고, 이는 RNA의 3’ 말단 50개의 뉴클레오티드(예를 들어, 40 nt, 30 nt, 25 nt 또는 20 nt) 내에 존재한다.

일부 실시 형태에 있어서, 전사되고 변형된 AAV ITR은 RNA의 3’말단 1000개의 뉴클레오티드 내에 존재한다. 일부 실시 형태에 있어서, 전사되고 변형된 AAV ITR은 RNA의 3’ 말단800개의 뉴클레오티드 내에 존재한다. 일부 실시 형태에 있어서, 전사되고 변형된 AAV ITR은 RNA의 3’ 말단500개의 뉴클레오티드 내에 존재한다. 일부 실시 형태에 있어서, 전사되고 변형된 AAV ITR은 RNA의 3’ 말단300개의 뉴클레오티드 내에 존재한다. 일부 실시 형태에 있어서, 전사되고 변형된 AAV ITR은 RNA의 3’ 말단200개의 뉴클레오티드 내에 존재한다.

일부 실시 형태에 있어서, 전사되고 변형된 AAV ITR은 폴리A 서열, 폴리A 신호 서열(예를 들어, AAUAAA) 또는 RNA전사 종결 서열(예를 들어, 히스톤 다운스트림 요소)의 5’에 존재한다.

본 명세서에 사용된 바와 같이, “폴리A 서열” 또는 “폴리A 꼬리”는 아데닌 리보뉴클레오티드 또는 아데노신일인산염의 스트링이다(예를 들어, 여기서 각 염기는 아데닌의 RNA의 스트링이다). 이러한 폴리A 꼬리는 mRNA의 핵배출, 번역 및 안정성에 매우 중요하다. 폴리A 서열의 길이는 본 발명의 상이한 mRNA 또는 RNA 서열에서 변화할 수 있고, 폴리A의 약 250개의 뉴클레오티드, 폴리A의 약 230개의 뉴클레오티드, 폴리A의 약 200개의 뉴클레오티드, 폴리A의 약 180개의 뉴클레오티드, 폴리A의 약 160개의 뉴클레오티드, 폴리A의 약 140개의 뉴클레오티드, 폴리A의 약 120개의 뉴클레오티드, 폴리A의 약 100개의 뉴클레오티드 이하일 수 있다.

본 명세서에 사용된 바와 같이, “폴리A 신호 서열”은 3’ 엑손 가장 다운스트림에 위치한 RNA 서열(예컨대 AAUAAA)을 의미하고, RNA절단 복합물을 통해 인식되며, 상기 복합물은 RNA중합 효소(예컨대 Pol II)를 통해 새로 전사된 RNA의 3’ 말단 서열을 절단함으로써, 폴리아데닐화를 생성할 수 있다. 그 후, 아데노신일인산염 유닛을 ATP에서 RNA의 새로 절단된 3’ 말단에 첨가하여, 폴리아데닐산 중합 효소가 폴리 (A)꼬리를 추가하고 연장시킨다. 초기 RNA절단은 통상적으로 CPSF 효소(절단/폴리아데닐화 특이적 인자)에 의해 촉매되고, 그 결합 부위-폴리A 신호 서열(통상적으로 전사된 RNA 상의 AAUAAA) 다운스트림 약 10-30개의 뉴클레오티드에서 발생한다. RNA절단 부위 5’ 위치에 위치하거나/또는 근접하는 서열은 보통(그러나 반드시는 아님) CA이다. RNA 절단 복합물을 통해 인식된 폴리A 신호 서열은 진핵 세포의 다른 군 사이에서 다르고, 대부분 인간 폴리아데닐화 부위는 AAUAAA 서열을 포함하며, 비록 이러한 서열은 식물 및 진균 mRNA 에서 흔한 것은 아니다. 그 외, CPSF와 더 약하게 결합하는 다른 변이체도 존재한다. RNA절단 및 후속 폴리아데닐화의 모든 이러한 서열 모티브는 모두 폴리A 신호 서열의 범위 내에 있도록 RNA 절단 복합물을 통해 인식된다.

또 본 명세서에 사용된 바와 같이, “폴리A 부위 다운스트림의 전사된 GU 풍부 영역”은 다른 단백질(예컨대 절단 자극 인자 또는 CstF)에 의해 CPSF와 폴리A 신호 서열의 결합 특이성을 강화하는 데 사용될 수 있는 서열(예를 들어, AAUAAA)을 의미한다.

일부 실시 형태에 있어서, 본 발명의 RNA 서열은 CFI(절단 인자 I)의 인식 서열, 예컨대 포유동물 중의 UGUAA 서열을 더 포함하고, AAUAAA 폴리A 신호 서열이 결실되어도 상기 서열은 CPSF를 모집할 수 있다.

본 명세서에 사용된 바와 같이, “RNA 전사 종결을 위한 서열”은 전사를 종결하는 전사 RNA(예컨대 폴리A 꼬리가 없는 전사 RNA)의 3’ 말단에 존재하거나 가까운 RNA 서열 모티브를 포함한다. 후생동물 복제 의존적 히스톤 mRNA를 제외하고, 거의 모든 진핵 mRNA를 폴리아데닐화하며, 여기서 mRNA 가공은 고도 보수적인 스템 루프 구조와 다운스트림의 약 20개의 뉴클레오티드의 퓨린 풍부 영역을 갖는 부위에서 발생한다. 이들은 소수의(만약 유일한 것이 아니면) 진핵 mRNA이고, 이들은 폴리(A) 꼬리가 결핍되어, 스템 루프 구조로 마무리되며, 이어서 퓨린 풍부 서열이고, 히스톤 다운스트림 요소(HDE) 또는 히스톤 3’ UTR줄기 -고리로 칭한다. HDE는 RNA가 전사 기간/그 후에 절단되는 위치를 가이드함으로써, 히스톤 mRNA의 3′말단을 형성한다. HDE는 히스톤 mRNA의 핵원형질 운반과, 세포질 중 안정성 및 번역효율의 조절에 참여한다.

일부 실시 형태에 있어서, 본 발명의 RNA 서열은 본 발명의 제2 전사되고 변형된 AAV ITR을 더 포함한다. 일부 실시 형태에 있어서, 제2 전사되고 변형된 AAV ITR은 전사된 기능적 RBE 서열을 가지나, 제2 전사된 TRS 또는 제2 전사된 rcTRS 또는 둘 모두가 결핍하고, 선택적으로, 상기 제2 전사되고 변형된 AAV ITR은 제2 전사된 D 영역 서열을 더 포함하거나 결핍하다. 일부 실시 형태에 있어서, 제2 전사되고 변형된 AAV ITR은 제2 전사된 돌연변이의 D 영역 서열 및/또는 제2 전사된 돌연변이의 TRS 서열을 포함한다.

일부 실시 형태에 있어서, 2개의 전사되고 변형된 AAV ITR을 갖는 본 발명의 RNA 서열에 있어서, 상기 전사되고 변형된 AAV ITR 및 제2 전사되고 변형된 AAV ITR은 서로 같다.

일부 실시 형태에 있어서, 2개의 전사되고 변형된 AAV ITR을 갖는 본 발명의 RNA 서열에 있어서, 상기 전사되고 변형된 AAV ITR 및 2차 전사변형의 AAV ITR은 서로 다르다.

일부 실시 형태에 있어서, 전사되고 변형된 AAV ITR, 제2 전사되고 변형된 AAV ITR(만약 존재하면)은 대응되는 전사된 야생형 AAV ITR D 영역 서열 또는 대응되는 전사된 야생형 TRS/rcTRS 중의 결실, 대응되는 전사된 야생형 AAV ITR D 영역 서열 또는 대응되는 전사된 야생형 TRS/rcTRS 중의 돌연변이 또는 대응되는 전사된 야생형 AAV ITR D 영역 서열 또는 대응되는 전사된 야생형 TRS/rcTRS 중의 삽입을 포함한다.

일부 실시 형태에 있어서, 2개의 전사되고 변형된 AAV ITR을 갖는 본 발명의 RNA 서열에 있어서, 제2 전사되고 변형된 AAV ITR은 RNA 서열의 5’말단 1000개의 뉴클레오티드, 800개의 뉴클레오티드, 500개의 뉴클레오티드, 250개의 뉴클레오티드 또는 150개의 뉴클레오티드 내에 있다.

일부 실시 형태에 있어서, RPS는 MS2 서열, PP7 결합 부위 또는 com 결합 부위를 포함하고, 또한 상기 RPS 상호 작용 분자는 직접 또는 간접적으로 상기 RPS 상호 작용(예를 들어 인식 및 결합)할 수 있는 RPS 상호 작용 단백질(RPSIP)을 포함하며, 예컨대 MS2 서열의 경우 박테리오파지 유래의 MS2 외피 단백질(MCP), PP7 결합 부위의 경우 PP7 박테리오파지 외피 단백질(PCP) 또는 com 결합 부위의 경우 박테리오파지 COM 단백질(COM)을 포함한다. 이러한 RPS/RPSIP쌍의 서열은 명세서의 서열 부분에서 설명된다.

상술한 하나 이상의 RPS 서열 중의 어느 하나는 전사되고 변형된 ITR 서열 중의 어느 하나, 및 MS2 서열, PP7 결합 부위 및/또는 com 결합 부위 중의 어느 하나를 포함하여, 단독적으로 또는 조합적으로, 적절/상용되는 동종 RPSIP 존재 하에서 본 발명의 RNA 서열을 DNA 바이러스의 바이러스 입자에 패키징하도록 촉진할 수 있다.

일부 실시 형태에 있어서, RPSIP는 DNA 바이러스의 바이러스 입자의 바이러스 패키징 시스템의 단백질 성분이거나 또는 그와 직접 또는 간접적으로 관련된다. 예를 들어, 일부 실시 형태에 있어서, RPSIP는 DNA 바이러스의 바이러스 패키징 시스템의 단백질 성분이고, 예컨대 AAV의 Rep78, Rep68, Rep52 및/또는 Rep40이다. 예를 들어, 일부 실시 형태에 있어서, RPSIP는 DNA 바이러스의 바이러스 패키징 시스템의 단백질 성분과 직접적으로 융합될 수 있다. AAV의 바이러스 패키징 시스템의 예시적 단백질 성분은 Rep 단백질(예컨대 아데노 관련 바이러스2(AAV2)의 Rep78 및/또는 Rep68) 중의 어느 하나 및/또는 조립 활성화 단백질(AAP) 중의 어느 하나를 포함한다.

일부 실시 형태에 있어서, 융합은 N 말단 융합이고, 여기서 RPSIP(예컨대 MCP, PCP 또는 COM)는 Rep68/78 단백질 및/또는 AAP의 N 말단에서 융합된다.

일부 실시 형태에 있어서, 융합은 N 말단 융합이고, 여기서 RPSIP(예컨대 MCP, PCP 또는 COM)는 Rep68/78 단백질 및/또는 AAP의 C 말단에서 융합된다.

일부 실시 형태에 있어서, 융합은 직접 융합이고, 그 사이에 링커 서열이 존재하지 않는다.

일부 실시 형태에 있어서, 융합은 하나 또는 복수의 링커 서열에 의하되, 예컨대 Gly 및 Ser이 풍부한 링커 또는 GS링커의 플랙시블 펩티드 링커를 포함할 수 있다. 대표적인 GS링커는 Gly 또는 Ser의 1개, 2개, 3개, 4개, 5개 이상의 반복, 예컨대 GS, GSS, GSSS, GSSSS 및 그 반복(예를 들어, (GS_p)_n, 여기서 p는 1-5 사이의 정수이고, n은 1-20 사이의 정수임)을 포함한다. 하나의 전형적인 이러한 GS링커는 GS₃링커 또는 GS₄링커이다. 일부 실시 형태에 있어서, p는 3 또는 4이고, n은 1이다.

일부 실시 형태에 있어서, 본 발명의 RNA 서열은 전사된 DNA 패키징 신호, 예를 들어, 전사된 야생형 AAV ITR 서열을 포함할 수 있으나 바람직하게는 포함하지 않는다. 예를 들어, 본 발명의 RNA 서열은 전사되고 변형된 AAV ITR 서열을 포함할 수 있고, 상기 전사되고 변형된 AAV ITR 서열은 대응되는 전사된 야생형 AAV ITR 서열의뉴클레오티드의 추가, 결실 및/또는 치환을 가져 상기 DNA 바이러스의 바이러스 입자의 DNA 패키징 능력을 저하시킨다.

일부 실시 형태에 있어서, 본 발명의 RNA 서열은 (1) 단백질의 코딩 서열(예컨대, 치료성 단백질 또는 CRISPR/Cas 이펙터 효소(Cas9 또는 그 변이체와 같은 Cas이펙터 효소 중의 어느 하나를 포함하고, 선택적으로 염기 편집기와 융합)를 코딩하는 mRNA), 비코딩 RNA(ncRNA), 또는 기능적 RNA(예컨대 tRNA, 리보솜 RNA(rRNA), RNAi 시약 또는 그 전구체, siRNA, shRNA, miRNA 또는 그 전구체(전구체 miRNA 및 pri-miRNA 포함), 안티센스 RNA(ASO), piRNA, CRISPR-Cas시스템의 RNA 성분(예컨대, 가이드 RNA(또는 gRNA), 단일 가이드 RNA(또는 sgRNA, 키메릭 RNA, RNA 키메라), CRISPR RNA(crRNA), 또는 tracr RNA), snoRNA, snRNA, exRNA, scaRNA, lncRNA, Xist 및 HOTAIR 등); (2) 전사된 전사 인핸서; (3) 전사된 인트론 서열 또는 엑손 서열(예컨대 단백질 발현을 강화시키기 위한 서열); (4) 5’UTR 서열; (5) 3’ UTR 서열; (6) 폴리A 서열 또는 (전사된)폴리아데닐화(폴리A) 신호 서열 및 선택적으로, 전사된 폴리A부위 및 상기 폴리A부위전사된 다운스트림 GU풍부 영역; (7) 전사 후 조절 요소 또는 서열, 예컨대 전사된 우드척 간염 바이러스(WHP) 전사 후 조절 요소(WPRE) 서열; 및/또는 (8) 전사 종결 서열(예컨대 히스톤 다운스트림 요소) 중의 하나 이상을 더 포함한다.

일부 실시 형태에 있어서, 본 발명의 RNA 서열은 전사 후 조절 요소 또는 서열의 3’ 및 폴리A 서열 또는 폴리A 신호 서열의 5’에 위치한 RPS를 포함한다.

예를 들어, 일부 실시 형태에 있어서, 본 발명의 RNA 서열은 5’에서 3’방향으로 RSI; 임의의 전사된 WPRE 서열(존재하거나 존재하지 않을 수 있음); RPS(예를 들어전사되고 변형된 AAV ITR, MS2 서열, PP7 결합 부위 또는 com 결합 부위); 및 폴리A 서열 또는 폴리A 신호 서열을 포함한다.

일부 실시 형태에 있어서, 본 발명의 RNA 서열 코딩 또는 GOI는 단백질(예를 들어, 형광 단백질, 치료성 단백질, 항원 단백질, 또는 유전자 편집 단백질, 예컨대 Cas 단백질, ZFN 단백질, TALEN 단백질), 효소(예컨대 Cre 단백질 또는 CRISPR/Cas 이펙터 효소, 예를 들어, Cas9, Cas12, Cas13 또는 그 변이체), 구조 단백질, mRNA, 비코딩RNA(ncRNA), siRNA, piRNA, 짧은 헤어핀 RNA 또는 shRNA, 마이크로 RNA(miRNA) 또는 그 전구체(전구체 miRNA 및 pri-miRNA 포함), 리보솜 RNA(rRNA), 안티센스 서열 또는 올리고뉴클레오티드(ASO), CRISPR-Cas시스템의 RNA 성분(단일 가이드 RNA(또는 sgRNA, 키메릭 RNA, RNA 키메라)와 같은 가이드 RNA(또는 gRNA), CRISPR RNA(crRNA) 및 tracr RNA 포함), CRISPR/Cas 이펙터 효소를 위한 가이드 RNA 또는 gRNA, rRNA, tRNA, snoRNA, snRNA, exRNA, scaRNA, lncRNA, Xist 및 HOTAIR을 포함한다.

본 발명의 RNA 서열의 총길이는 AAV 바이러스 입자의 패키징 능력에 의해 결정된다. 대다수 AAV 바이러스 입자의 패키징 능력은 약 4,700-5,200개의 뉴클레오티드이나, 일부 AAV 바이러스 입자, 예컨대 AAV5 입자는 8,900개에 달하는 뉴클레오티드를 패키징할 수 있다.

따라서, 일부 실시 형태에 있어서, AAV 바이러스 입자에 패키징되는 본 발명의 RNA 서열은 길이가 약 8,900개의 뉴클레오티드의 단일 가닥 RNA(ssRNA)보다 작다.

일부 실시 형태에 있어서, RNA 서열은 길이가 약 8,000개의 뉴클레오티드의 ssRNA보다 작다. 일부 실시 형태에 있어서, RNA 서열은 길이가 약 7,000개의 뉴클레오티드의 ssRNA보다 작다. 일부 실시 형태에 있어서, RNA 서열은 길이가 약 6,000개의 뉴클레오티드의 ssRNA보다 작다. 일부 실시 형태에 있어서, RNA 서열은 길이가 약 5,200개의 뉴클레오티드의 ssRNA보다 작다. 일부 실시 형태에 있어서, RNA 서열은 길이가 약 4,000개의 뉴클레오티드의 ssRNA보다 작다. 일부 실시 형태에 있어서, RNA 서열은 길이가 약 보다 작다약 3,000개의 뉴클레오티드의 ssRNA보다 작다. 일부 실시 형태에 있어서, RNA 서열은 길이가 약 2,000개의 뉴클레오티드의 ssRNA보다 작다.

일부 실시 형태에 있어서, RNA 서열은 길이가 약 4,700-5,200개의 뉴클레오티드의 ssRNA이다. 일부 실시 형태에 있어서, RNA 서열은 길이가 약 4,700-5,000개의 뉴클레오티드의 ssRNA이다. 일부 실시 형태에 있어서, RNA 서열은 길이가 약 4,700-4,800개의 뉴클레오티드의 ssRNA이다. 일부 실시 형태에 있어서, RNA 서열은 길이가 약 4,700개의 뉴클레오티드의 ssRNA이다.

본 발명의 다른 한 양태는 폴리뉴클레오티드를 제공하고, 상기 폴리뉴클레오티드는 본 발명의 RNA 서열의 (전사)카세트를 포함하며, 선택적으로, 상기 폴리뉴클레오티드는 DNA 서열(예를 들어, DNA 플라스미드)이며, 상기 DNA 서열은 선택적으로 상기 DNA 플라스미드의 백본에 스터퍼 서열을 포함하고, 및/또는 선택적으로 AAV ITR과 같은 기능적 DNA 패키징 신호를 포함하지 않는다.

일부 실시 형태에 있어서, 카세트를 포함하는 폴리뉴클레오티드는 본 발명의 RNA 서열을 코딩하는 DNA 벡터이다. 이러한 DNA 벡터 및/또는 그 카세트는 예를 들어 AAV 바이러스 입자에 추가로 패키징되는 데 사용되는 본 발명의 RNA 서열을 전사하고 생성하는 데 사용될 수 있다.

일부 실시 형태에 있어서, 폴리뉴클레오티드는 프로모터를 더 포함하고, 상기 프로모터는 카세트를 통해 코딩되는 본 발명의 RNA 서열에 조작 가능하게 연결되고 전사를 구동하여 본 발명의 RNA 서열을 생성하도록 한다.

일부 실시 형태에 있어서, 프로모터는 편재 프로모터이다.

일부 실시 형태에 있어서, AAV 캡시드는 혈청형AAV1, AAV2, AAV3A, AAV3B, AAV4, AAV5, AAV6, AAV7, AAVrh74, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, AAV-DJ, AAV PHP.eB, Anc80L65, Anc80L65AAP 또는 7m8의 AAV로부터 유래된 캡시드를 포함한다.

본 발명의 하나의 관련 양태는 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체를 제공하고, 상기 군체는 본 발명의 복수의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)를 포함하며, 여기서 상기 군체 내의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 중의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 이상은 패키징 그 중에 패키징되는 본 발명의 캡시드화 RNA 서열 또는 본 발명의 폴리뉴클레오티드로부터 전사된 RNA 서열을 갖는다.

일부 실시 형태에 있어서, 재조합 바이러스 입자(예를 들어, rRAAV 입자)의 군체는 적어도 1 × 10⁴개의 바이러스 입자, 적어도 2 × 10⁴개의 바이러스 입자, 적어도 5 × 10⁴개의 바이러스 입자, 적어도 1 × 10⁵개의 바이러스 입자, 적어도 2 × 10⁵개의 바이러스 입자, 적어도 5 × 10⁵개의 바이러스 입자, 적어도 1 × 10⁶개의 바이러스 입자, 적어도 2 × 10⁶개의 바이러스 입자, 적어도 5 × 10⁶개의 바이러스 입자, 적어도 1 × 10⁷개의 바이러스 입자, 적어도 2 × 10⁷개의 바이러스 입자, 적어도 5 × 10⁷개의 바이러스 입자, 적어도 1 × 10⁸개의 바이러스 입자, 적어도 2 × 10⁸개의 바이러스 입자, 적어도 5 × 10⁸개의 바이러스 입자, 적어도 1 × 10⁹개의 바이러스 입자, 적어도 2 × 10⁹개의 바이러스 입자, 적어도 5 × 10⁹개의 바이러스 입자, 적어도 1 × 10¹⁰개의 바이러스 입자, 적어도 2 × 10¹⁰개의 바이러스 입자, 적어도 5 × 10¹⁰개의 바이러스 입자, 적어도 1 × 10¹¹개의 바이러스 입자, 적어도 2 × 10¹¹개의 바이러스 입자, 적어도 5 × 10¹¹개의 바이러스 입자, 적어도 1 × 10¹²개의 바이러스 입자, 적어도 2 × 10¹²개의 바이러스 입자, 적어도 5 × 10¹²개의 바이러스 입자, 적어도 1 × 10¹³개의 바이러스 입자, 적어도 2 × 10¹³개의 바이러스 입자, 적어도 5 × 10¹³개의 바이러스 입자, 적어도 1 × 10¹⁴개의 바이러스 입자, 적어도 2 × 10¹⁴개의 바이러스 입자, 적어도 5 × 10¹⁴개의 바이러스 입자, 적어도 1 × 10¹⁵개의 바이러스 입자, 적어도 2 × 10¹⁵개의 바이러스 입자, 적어도 5 × 10¹⁵개의 바이러스 입자, 적어도 1 × 10¹⁶개의 바이러스 입자, 적어도 2 × 10¹⁶개의 바이러스 입자 또는 적어도 5 × 10¹⁶개의 바이러스 입자를 포함한다.

일부 실시 형태에 있어서, 재조합 바이러스 입자의 군체 내의 최대 50%, 45%, 40%, 35%, 30%, 25%, 20%, 15%, 10%, 5%, 3%, 2%, 1%, 0.1%, 0.01% 이하는 비RNA(예를 들어 DNA)를 바이러스 입자 내에 캡시드화한다.

본 발명의 다른 양태는 숙주 세포를 제공하고, 상기 숙주 세포는 본 발명의 RNA 서열, 본 발명의 폴리뉴클레오티드, 본 발명의 폴리뉴클레오티드로부터 전사된 RNA 서열, 본 발명의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 및/또는 본 발명의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rAAV 입자)의 군체를 포함한다.

일부 실시 형태에 있어서, 바이러스 패키징 시스템은 (1) rep 유전자 및 cap 유전자의 전사를 구동하는 하나 또는 복수의 프로모터의 전사 제어 하에 있는 AAV rep 유전자(예를 들어, Rep78, Rep68, Rep52 및/또는 Rep40의 코딩 서열) 및 AAV cap 유전자(예를 들어, VP1, VP2 및/또는 VP3, AAP 및/또는 MAAP의 코딩 서열) 또는 그 발현 산물; (2) 아데노 바이러스 E2A, E4 및 VA유전자 또는 상기 하나 이상의 단백질과 같이 AAV 패키징에 필요한 하나 이상의 단백질의 하나 또는 복수의 코딩 서열; 및 (3) RPS 상호 작용 분자 또는 그 코딩 서열을 포함한다.

일부 실시 형태에 있어서, 바이러스 패키징 시스템은 DNA 서열을 상기 DNA 바이러스의 바이러스 입자에 패키징하는 능력은 예를 들어 (1) 본 발명의 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 본 발명의 폴리뉴클레오티드 상의 DNA 패키징 신호(예를 들어 AAV ITR의 일부 또는 전부)를 제거하고, (2) 상기 AAV rep 유전자, 상기 AAV cap 유전자 및/또는 AAV 패키징에 필요한 하나 이상의 단백질의 상기 하나 또는 복수의 코딩 서열을 변형(돌연변이)시켜, 상응한 번역된 단백질이 상기 DNA 서열을 상기 DNA 바이러스의 바이러스 입자에 패키징되도록 촉진하는 능력(예를 들어, Rep78 및 Rep68 단백질의 공유 서열 중의 Y156F 돌연변이, KDE-mu 또는 EKE-mu)을 감소시키거나, 약화시키거나 또는 거의 제거하며; 및/또는 (3) 본 발명의 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 본 발명의 폴리뉴클레오티드의 크기를 확대하는 것을 통해 감소되거나, 약화되거나 또는 거의 제거된다. 실시 형태에 있어서, 스터퍼 서열(예를 들어 인트론)을 폴리뉴클레오티드(예를 들어 DNA 플라스미드)(의 예를 들어 백본)에 삽입하여 본 발명의 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 본 발명의 폴리뉴클레오티드의 크기를 확대한다.

일부 실시 형태에 있어서, AAV rep 유전자, AAV cap 유전자 및/또는 AAV 패키징에 필요한 단백질은 DNA가 DNA 바이러스의 바이러스 입자에 패키징되도록 촉진하는 능력을 약화시키거나 또는 감소시키는 돌연변이를 포함한다.

일부 실시 형태에 있어서, DNA 패키징에 필요한 Rep68/Rep 78 단백질은 돌연변이를 포함하고, 상기 돌연변이는 그 trs-엔도뉴클레아제 활성을 파괴하거나 약화시킨다. trs-엔도뉴클레아제 활성은 trs 서열 또는 부위에서 AAV복제(DNA) 중간체를 분해하는 데 필요하고, 이로써 AAV 캡시드 내에 패키징되기 전에, AAV ssDNA의 단일 유닛을 분해할 수 있는 것으로 인식된다.

일부 실시 형태에 있어서, trs-엔도뉴클레아제 돌연변이는 Rep78 및 Rep68 단백질의 공유 서열에 Y156F 돌연변이를 포함한다.

일부 실시 형태에 있어서, Rep78/Rep68 단백질은 KDE-mu 돌연변이(이하의 서열 부분 중의 서열 참조)를 포함한다.

일부 실시 형태에 있어서, Rep78/Rep68 단백질은 EKE-mu 돌연변이(이하의 서열 부분 중의 서열 참조)를 포함한다.

일부 실시 형태에 있어서, Rep78/Rep68 단백질은 Y156F 돌연변이, KDE-mu 돌연변이 및 EKE-mu 돌연변이의 2개 이상으로부터 선택되는 돌연변이를 포함한다.

일부 실시 형태에 있어서, Rep68/Rep78은 혈청형AAV1, AAV2, AAV3A, AAV3B, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, AAV-DJ, AAV PHP.eB, Anc80L65, Anc80L65AAP, AAVrh74 또는 7m8의 AAV 중의 어느 하나를 갖고, Y156F 돌연변이, KDE-mu 돌연변이 및/또는 EKE-mu 돌연변이를 갖는 대응되는 trs-엔도뉴클레아제 돌연변이로부터 유래된다.

일부 실시 형태에 있어서, 숙주 세포는 (1) rep 유전자 및 cap 유전자의 전사를 구동하는 하나 또는 복수의 프로모터의 전사 제어 하에 있는 AAV rep 유전자 및 AAV cap 유전자의 코딩 서열; 및 (2) 아데노 바이러스 E2A, E4 및 VA유전자와 같은 AAV 패키징에 필요한 단백질의 코딩 서열을 더 포함한다.

일부 실시 형태에 있어서, 숙주 세포는 포유동물 세포이고, 예컨대 HEK293세포 또는 그 변이체(예를 들어, HEK293T세포) 또는 곤충세포, 예컨대 Sf9 또는 Sf21세포이다.

본 발명의 다른 양태는 본 발명의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 또는 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체를 생성하는 방법을 제공하고, 상기 방법은 a) 본 발명의 숙주 세포를 충분한 시간 동안 배양하는 단계 및 b)상기 재조합 DNA 바이러스의 바이러스 입자 또는 상기 재조합 DNA 바이러스의 바이러스 입자의 군체를 수득하는 단계를 포함한다.

본 발명의 다른 양태는 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 또는 재조합 DNA 바이러스의 바이러스 입자의 군체를 생성하는 방법을 제공하고, 상기 방법은 a) 바이러스 패키징 시스템(예를 들어, AAV 패키징 시스템)을 본 발명의 RNA 서열 또는 본 발명의 폴리뉴클레오티드로부터 전사된 RNA 서열에 접촉시키고, 본 발명의 상기 재조합 DNA 바이러스의 바이러스 입자 또는 본 발명의 상기 재조합 DNA 바이러스의 바이러스 입자의 군체를 생성하기에 충족한 시간동안 지속하는 단계 및 b) 본 발명의 상기 재조합 DNA 바이러스의 바이러스 입자 또는 본 발명의 상기 재조합 DNA 바이러스의 바이러스 입자의 군체를 수득하는 단계; 및 선택적으로, c)본 발명의 수득한 재조합 DNA 바이러스의 바이러스 입자 또는 본 발명의 재조합 DNA 바이러스의 바이러스 입자의 군체를 단리 또는 정제하는 단계를 포함한다.

일부 실시 형태에 있어서, 바이러스 패키징 시스템(예를 들어, AAV 패키징 시스템)은 (1) 상기 RNA 서열을 패키징하기 위한 상기 DNA 바이러스의 바이러스 입자의 단백질 쉘을 조립하기 위한 하나 이상의 단백질(예를 들어, AAV 캡시드를 조립하기 위한 VP1, VP2 및/또는 VP3) 또는 그 하나 또는 복수의 코딩 서열; (2) 상기 단백질 쉘의 조립 및/또는 상기 RNA 서열이 상기 DNA 바이러스의 바이러스 입자의 단백질 쉘 중에 패키징되도록 촉진하기 위한 하나 이상의 단백질(예를 들어, AAV 패키징을 위한 Rep78, Rep68, Rep52 및/또는 Rep40) 또는 그 하나 또는 복수의 코딩 서열(예를 들어, 아데노 바이러스 E2a, E4 및 VA유전자); 및 (3) RPS 상호 작용 분자 또는 그 코딩 서열을 포함한다. 선택적으로, 바이러스 패키징 시스템은 DNA 서열을 상기 DNA 바이러스의 바이러스 입자에 패키징하는 능력은 예를 들어 (1) 본 발명의 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 본 발명의 폴리뉴클레오티드 상의 DNA 패키징 신호(예를 들어 AAV ITR의 일부 또는 전부)를 제거하고, (2) 상기 AAV rep 유전자, 상기 AAV cap 유전자 및/또는 AAV 패키징에 필요한 하나 이상의 단백질의 상기 하나 또는 복수의 코딩 서열을 변형(예를 들어 돌연변이)시켜, 상응한 번역된 단백질이 상기 DNA 서열이 상기 DNA 바이러스의 바이러스 입자에 패키징하도록 촉진하는 능력(예를 들어, Rep78 및 Rep68 단백질의 공유 서열 중의 Y156F 돌연변이, KDE-mu 또는 EKE-mu)을 감소시키거나, 약화시키거나 또는 거의 제거하며, 및/또는 (3) 본 발명의 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 본 발명의 폴리뉴클레오티드의 크기를 확대하는 것을 통해 감소되거나, 약화되거나 또는 거의 제거된다.

본 발명의 다른 양태는 본 발명의 RNA 서열 또는 본 발명의 폴리뉴클레오티드로부터 전사된 RNA 서열을 DNA 바이러스의 바이러스 입자에 패키징하는 시스템을 제공하고, 상기 시스템은 (1) 상기 RNA 서열을 패키징하기 위한 상기 DNA 바이러스의 바이러스 입자의 단백질 쉘을 조립하기 위한 하나 이상의 단백질(예를 들어, AAV 캡시드를 조립하기 위한 VP1, VP2 및/또는 VP3) 또는 그 하나 또는 복수의 코딩 서열; (2) 상기 단백질 쉘의 조립 및/또는 본 발명의 RNA 서열이 상기 DNA 바이러스의 바이러스 입자의 단백질 쉘 중에 패키징되도록 촉진하기 위한 하나 이상의 단백질(예를 들어, AAV 패키징을 위한 Rep78, Rep68, Rep52 및/또는 Rep40) 또는 그 하나 또는 복수의 코딩 서열(예를 들어, 아데노 바이러스 E2a, E4 및 VA유전자); 및 (3) RPS 상호 작용 분자 또는 그 코딩 서열을 포함한다. 선택적으로, 바이러스 패키징 시스템은 DNA 서열을 상기 DNA 바이러스의 바이러스 입자에 패키징하는 능력은 예를 들어 (1) 본 발명의 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 본 발명의 폴리뉴클레오티드 상의 DNA 패키징 신호(예를 들어 AAV ITR의 일부 또는 전부)를 제거하고, (2) 상기 AAV rep 유전자, 상기 AAV cap 유전자 및/또는 AAV 패키징에 필요한 하나 이상의 단백질의 상기 하나 또는 복수의 코딩 서열을 변형(예를 들어 돌연변이)시켜, 상응한 번역된 단백질이 상기 DNA 서열이 상기 DNA 바이러스의 바이러스 입자에 패키징하도록 촉진하는 능력(예를 들어, Rep78 및 Rep68 단백질의 공유 서열 중의 Y156F 돌연변이, KDE-mu 또는 EKE-mu)을 감소시키거나, 약화시키거나 또는 거의 제거하며, 및/또는 (3) 본 발명의 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 본 발명의 폴리뉴클레오티드의 크기를 확대하는 것을 통해 감소되거나, 약화되거나 또는 거의 제거된다.

본 발명의 다른 양태는 관심 RNA 서열(RSI)을 세포, 식물 또는 동물에 전달하는 방법을 제공하고, 상기 방은 상기 세포, 식물 또는 동물을 본 발명의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자), 본 발명의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체 또는 본 발명의 방법을 통해 생성된 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 또는 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체에 접촉시키는 단계를 포함하고, 여기서 상기 GOI는 선택적으로 본 발명의 RNA 서열에 의해 코딩된다.

본 발명의 다른 양태는 융합 단백질 또는 접합체를 제공하고, 상기 융합 단백질 또는 접합체는 DNA 바이러스의 바이러스 패키징 시스템의 단백질 성분과 융합 또는 접합되는 본 발명의 RPSIP를 포함하며, 여기서 상기 RPSIP는 본 발명의 RNA 서열 상의 RPS와 상호 작용/결합하여, 상기 RNA 서열이 DNA 바이러스에 패키징되도록 촉진한다.

일부 실시 형태에 있어서, RPS는 MS2이고, RPSIP는 MCP이다.

일부 실시 형태에 있어서, RPS는 PP7 결합 부위이고, RPSIP는 PCP이다.

일부 실시 형태에 있어서, RPS는 com이고, RPSIP는 박테리오파지 COM 단백질이다.

일부 실시 형태에 있어서, 융합물 또는 접합체는 하나 이상의 RPSIP를 포함하고, 상기 RPSIP는 각각 독립적으로 본 발명의 RNA 서열 상의 하나 이상의 RPS와 결합한다. 일부 실시 형태에 있어서, 하나 이상의 RPSIP 중의 적어도 2개는 서로 같다. 일부 실시 형태에 있어서, 하나 이상의 RPSIP 중의 적어도 2개는 서로 다르다.

일부 실시 형태에 있어서, 융합물 또는 접합체는 직렬 연결된 2개의 MCP를 포함한다.

일부 실시 형태에 있어서, DNA 바이러스의 바이러스 패키징 시스템의 단백질 성분은 AAV의 Rep 단백질, 예컨대 상기 AAV의 Rep68 또는 Rep78을 포함한다.

일부 실시 형태에 있어서, Rep 단백질은 하나 또는 복수의 돌연변이를 포함하고, 상기 하나 또는 복수의 돌연변이는 trs-엔도뉴클레아제 활성을 파괴하거나 또는 약화시킨다. 일부 실시 형태에 있어서, 돌연변이는 Y156F 돌연변이, KDE-mu 돌연변이 및/또는 EKE-mu 돌연변이를 포함한다.

일부 실시 형태에 있어서, DNA 바이러스의 바이러스 패키징 시스템의 단백질 성분은 조립 활성화 단백질(AAP)을 포함한다.

일부 실시 형태에 있어서, RPSIP를 DNA 바이러스의 바이러스 패키징 시스템의 단백질 성분(예를 들어, Rep 단백질 또는 AAP)과 직접 융합한다.

일부 실시 형태에 있어서, RPSIP를 DNA 바이러스의 바이러스 패키징 시스템의 단백질 성분(예를 들어, Rep 단백질 또는 AAP)과 펩티드 링커를 통해 융합한다.

일부 실시 형태에 있어서, 펩티드 링커는 플랙시블 링커이고, 예컨대 Gly 및 Ser를 포함한 링커이다. 일부 실시 형태에 있어서, Gly 및 Ser를 포함한 링커는 GS_n의 1-20개의 반복(예를 들어, 1-5개 또는 1-3개의 반복)을 포함하고, 여기서 n은 1, 2, 3, 4 또는 5이다. 일부 실시 형태에 있어서, GS_n링커는 GS₂, GS₃ 또는 GS₄이고, 1-4개의(예를 들어, 2개의) 반복을 갖는다. 일부 실시 형태에 있어서, 링커는 GSSGSS이다.

일부 실시 형태에 있어서, 융합 단백질은 MCP 및 Rep를 포함하고, 여기서 상기 Rep는 선택적으로 Y156F 돌연변이, KDE-mu 돌연변이 및/또는 EKE-mu 돌연변이를 포함한다. 일부 실시 형태에 있어서, MCP는 Rep의 N 말단에서 융합된다(MCP-Rep). 일부 실시 형태에 있어서, MCP와 융합되는 Rep는 Y156F 돌연변이, KDE-mu 돌연변이 및/또는 EKE-mu 돌연변이를 포함한다. 일부 실시 형태에 있어서, MCP-Rep 융합물은 GS_n링커, 예컨대 GSSGSS를 통해 연결된다. 일부 실시 형태에 있어서, MCP-Rep는 직렬 연결된 2개의 MCP(예를 들어, 2개의 MCP 부분 사이에 임의의 링커가 존재하지 않음)를 포함한다. 일부 실시 형태에 있어서, MCP는 다른 하나의 GS_n링커, 예컨대 GSSGSS의 C 말단에 위치한다.

일부 실시 형태에 있어서, 융합 단백질은 PCP 및 Rep를 포함하고, 여기서 상기 Rep은 선택적으로 Y156F 돌연변이, KDE-mu 돌연변이 및/또는 EKE-mu 돌연변이를 포함한다. 일부 실시 형태에 있어서, PCP는 Rep의 N 말단에서 융합된다(PCP-Rep). 일부 실시 형태에 있어서, PCP와 융합되는 Rep는 Y156F 돌연변이, KDE-mu 돌연변이 및/또는 EKE-mu 돌연변이를 포함한다. 일부 실시 형태에 있어서, PCP-Rep 융합물은 GS_n링커, 예컨대 GSSGSS를 통해 연결된다. 일부 실시 형태에 있어서, PCP-Rep는 직렬 연결된 2개의 PCP(예를 들어, 2개의 PCP 부분 사이에 임의의 링커가 존재하지 않음)를 포함한다. 일부 실시 형태에 있어서, PCP는 다른 하나의 GS_n링커, 예컨대 GSSGSS의 C 말단에 위치한다.

일부 실시 형태에 있어서, 융합 단백질은 COM 및 Rep를 포함하고, 여기서 상기 Rep는 선택적으로 Y156F 돌연변이, KDE-mu 돌연변이 및/또는 EKE-mu 돌연변이를 포함한다. 일부 실시 형태에 있어서, COM은 Rep의 N 말단에서 융합된다(COM-Rep). 일부 실시 형태에 있어서, COM과 융합되는 Rep는 Y156F 돌연변이, KDE-mu 돌연변이 및/또는 EKE-mu 돌연변이를 포함한다. 일부 실시 형태에 있어서, COM-Rep 융합물은 GS_n링커, 예컨대 GSSGSS를 통해 연결된다. 일부 실시 형태에 있어서, COM-Rep는 직렬 연결된 2개의 COM(예를 들어, 2개의 COM 부분 사이에 임의의 링커가 존재하지 않음)을 포함한다. 일부 실시 형태에 있어서, COM은 다른 하나의 GS_n링커, 예컨대 GSSGSS의 C 말단에 위치한다.

일부 실시 형태에 있어서, 융합 단백질은 MCP 및 AAP를 포함한다. 일부 실시 형태에 있어서, MCP는 AAP의 N 말단에서 융합된다(MCP-AAP 또는 MA). 일부 실시 형태에 있어서, MCP는 AAP의 C 말단에서 융합된다(AAP-MCP 또는 AM). 일부 실시 형태에 있어서, MCP-AAP 또는 AAP-MCP 융합물은 GS_n링커, 예컨대 GSSGSS를 통해 연결된다. 일부 실시 형태에 있어서, MCP-AAP 융합물은 다른 하나의 GS_n링커, 예컨대 GSSGSS의 C 말단에 위치한다. 일부 실시 형태에 있어서, AAP-MCP 융합물은 다른 하나의 GS_n링커, 예컨대 GSSGSS의 N 말단에 위치한다.

본 발명의 다른 양태는 폴리뉴클레오티드를 제공하고, 상기 폴리뉴클레오티드는 본 발명의 RPSIP와 DNA 바이러스의 바이러스 패키징 시스템의 단백질 성분(예를 들어, AAP 또는 Rep 단백질) 사이의 융합물 중의 어느 하나를 코딩한다.

이상 설명한 본 발명의 일반적인 양태에 대해, 이하 부분적으로 본 명세서에 따른 본 발명의 특정 요소의 별도의 세부 사항을 제공하였다. 요소의 모든 가능한 조합 또는 배열을 맹백하게 제시하지 않았으나, 각 특정 요소는 본 발명의 임의의 하나 또는 복수의 별도의 요소와 조합할 수 있을 것으로 예상된다.

2. AAV 혈청형

본 발명의 리보스폴리뉴클레오티드를 패키징하는 AAV 입자는 임의의 천연 또는 재조합 AAV 혈청형을 포함하거나 임의의 천연 또는 재조합 AAV 혈청형에서 유도될 수 있다.

본 개시에 의하면, AAV 입자는 AAV1, AAV10, AAV106.1/hu.37, AAV11, AAV114.3/hu.40, AAV 12, AAV127.2/hu.41, AAV127.5/hu.42, AAV128.1/hu.43, AAV128.3/hu.44, AAV130.4/hu.48, AAV145.1/hu.53, AAV145.5/hu.54, AAV145.6/hu.55, AAV16.12/hu.l 1, AAV16.3, AAV16.8/hu.10, AAV161.10/hu.60, AAV161.6/hu.61, AAVl-7/rh.48, AAVl-8/rh.49, AAV2, AAV2.5T, AAV2-15/rh.62, AAV223.1, AAV223.2, AAV223.4, AAV 223.5, AAV223.6, AAV223.7, AAV2-3/rh.61, AAV24.1, AAV2-4/rh.50, AAV2-5/rh.51, AAV27.3, AAV29.3/bb.l, AAV29.5/bb.2, AAV2G9, AAV-2-전구체 miRNA-101, AAV3, AAV3.1/hu.6, AAV3.1/hu.9, AAV3-11/rh.53, AAV3-3, AAV33.12/hu. l7, AAV33.4/hu. l5, AAV33.8/hu.l6, AAV3-9/rh.52, AAV3a, AAV3b, AAV4, AAV4-19/rh.55, AAV42.12, AAV42-10, AAV42-11, AAV42-12, AAV42-13, AAV42-15, AAV42-1b, AAV42-2, AAV42-3a, AAV42-3b, AAV42-4, AAV42-5a, AAV42-5b, AAV42-6b, AAV42-8, AAV42-aa, AAV43-1, AAV43-12, AAV43-20, AAV43-21, AAV43-23, AAV43-25, AAV43-5, AAV4-4, AAV44.1, AAV44.2, AAV44.5, AAV46.2/hu.28, AAV46.6/hu.29, AAV4-8/r 11.64, AAV4-8/rh.64, AAV4-9/rh.54, AAV5, AAV52.1/hu.20, AAV52/hu.19, AAV5-22/rh.58, AAV5-3/rh.57, AAV54.1/hu.21, AAV54.2/hu.22, AAV54.4R/hu.27, AAV54.5/hu.23, AAV54.7/hu.24, AAV58.2/hu.25, AAV6, AAV6.1, AAV6.1.2, AAV6.2, AAV7, AAV7.2, AAV7.3/hu.7, AAV8, AAV-8b, AAV-8h, AAV9, AAV9.11, AAV9.13, AAV9.16, AAV9.24, AAV9.45, AAV9.47, AAV9.61, AAV9.68, AAV9.84, AAV9.9, AAV A3.3, AAV A3.4, AAV A3.5, AAV A3.7, AAV-b, AAVC1, AAVC2, AAVC5, AAVCh.5, AAVCh.5R1, AAVcy.2, AAVcy.3, AAVcy.4, AAVcy.5, AAVCy.5Rl, AAVCy.5R2, AAVCy.5R3, AAVCy.5R4, AAVcy.6, AAV-DJ, AAV-DJ8, AAVF3, AAVF5, AAV-h, AAVH-1/hu.l, AAVH2, AAVH-5/hu.3, AAVH6, AAVhE1.1, AAVhER1.14, AAVhErl.16, AAVhErl.18, AAVhER1.23, AAVhErl.35, AAVhErl.36, AAVhErl.5, AAVhErl.7, AAVhErl.8, AAVhEr2.16, AAVhEr2.29, AAVhEr2.30, AAVhEr2.31, AAVhEr2.36, AAVhEr2.4, AAVhEr3.1, AAVhu. l, AAVhu.10, AAVhu.l l, AAVhu. l, AAVhu.12, AAVhu.13, AAVhu.14/9, AAVhu.15, AAVhu.16, AAVhu.17, AAVhu.18, AAVhu.19, AAVhu.2, AAVhu.20, AAVhu.21, AAVhu.22, AAVhu.23.2, AAVhu.24, AAVhu.25, AAVhu.27, AAVhu.28, AAVhu.29, AAVhu.29R, AAVhu.3, AAVhu.31, AAVhu.32, AAVhu.34, AAVhu.35, AAVhu.37, AAVhu.39, AAVhu.4, AAVhu.40, AAVhu.41, AAVhu.42, AAVhu.43, AAVhu.44, AAVhu.44Rl, AAVhu.44R2, AAVhu.44R3, AAVhu.45, AAVhu.46, AAVhu.47, AAVhu.48, AAVhu.48Rl, AAVhu.48R2, AAVhu.48R3, AAVhu.49, AAVhu.5, AAVhu.51, AAVhu.52, AAVhu.53, AAVhu.54, AAVhu.55, AAVhu.56, AAVhu.57, AAVhu.58, AAVhu.6, AAVhu.60, AAVhu.61, AAVhu.63, AAVhu.64, AAVhu.66, AAVhu.67, AAVhu.7, AAVhu.8, AAVhu.9, AAVhu.t 19, AAVLG-10/rh.40, AAVLG-4/rh.38, AAVLG-9/hu.39, AAVLG- 9/hu.39, AAV-LK01, AAV-LK02, AAVLK03, AAV-LK03, AAV-LK04, AAV-LK05, AAV-LK06, AAV-LK07, AAV-LK08, AAV-LK09, AAV-LK10, AAV-LK11, AAV- LK12, AAV-LK13, AAV-LK14, AAV-LK15, AAV-LK17, AAV-LK18, AAV-LK19, AAVN721-8/rh.43, AAV-PAEC, AAV-PAEC11, AAV-PAEC12, AAV-PAEC2, AAV- PAEC4, AAV-PAEC6, AAV-PAEC7, AAV-PAEC8, AAVpi. l, AAVpi.2, AAVpi.3, AAVrh.10, AAVrh.12, AAVrh.13, AAVrh. l3R, AAVrh.14, AAVrh.17, AAVrh.18, AAVrh.19, AAVrh.2, AAVrh.20, AAVrh.21, AAVrh.22, AAVrh.23, AAVrh.24, AAVrh.25, AAVrh.2R, AAVrh.31, AAVrh.32, AAVrh.33, AAVrh.34, AAVrh.35, AAVrh.36, AAVrh.37, AAVrh.37R2, AAVrh.38, AAVrh.39, AAVrh.40, AAVrh.43, AAVrh.44, AAVrh.45, AAVrh.46, AAVrh.47, AAVrh.48, AAVrh.48, AAVrh.48.1, AAVrh.48.1.2, AAVrh.48.2, AAVrh.49, AAVrh.50, AAVrh.51, AAVrh.52, AAVrh.53, AAVrh.54, AAVrh.55, AAVrh.56, AAVrh.57, AAVrh.58, AAVrh.59, AAVrh.60, AAVrh.61, AAVrh.62, AAVrh.64, AAVrh.64Rl, AAVrh.64R2, AAVrh.65, AAVrh.67, AAVrh.68, AAVrh.69, AAVrh.70, AAVrh.72, AAVrh.73, AAVrh.74, AAVrh.8, AAVrh.8R, AAVrh8R, AAVrh8R A586R돌연변이체, AAVrh8R R533A돌연변이체, BAAV, BNP61 AAV, BNP62 AAV, BNP63 AAV, 소 AAV, 염소 AAV, 일본 AAV 10, 트루 타입 AAV(ttAAV), UPENN AAV 10, AAV-LK16, AAAV, AAV 셔플 100-1, AAV 셔플 100-2, AAV 셔플 100-3, AAV 셔플 100-7, AAV 셔플 10-2, AAV 셔플 10-6, AAV 셔플 10-8, AAV SM 100-10, AAV SM 100-3, AAV SM 10-1, AAV SM 10- 2 및/또는 AAV SM 10-8을 포함하나 이에 한정되지 않는 혈청형 및 그 변이체 중의 어느 하나의 혈청형을 이용하거나 또는 이에 기반할 수 있다.

일부 실시 형태에 있어서, AAV 혈청형은 AAV9서열 중의 돌연변이를 포함할 수 있고, 예컨대 Pulicherla et al.이 설명한 서열(Molecular Therapy [분자 요법] 19(6): 1070-1078, 2011), 예컨대 AAV9.9, AAV9.11, AAV9.13, AAV9.16, AAV9.24, AAV9.45, AAV9.47, AAV9.61, AAV9.68, AAV9.84를 포함할 수 있다.

일부 실시 형태에 있어서, AAV 혈청형은 US 6,156,303에서 설명한 서열을 포함할 수 있고, 예컨대 AAV3B(US 6,156,303 중의 SEQ ID NO: 1 및 10), AAV6(US 6,156,303 중의 SEQ ID NO: 2, 7 및 11), AAV2(US 6,156,303 중의 SEQ ID NO: 3 및 8), AAV3A(US 6,156,303 중의 SEQ ID NO: 4 및 9) 또는 그 유도체를 포함할 수 있다.

일부 실시 형태에 있어서, 혈청형은 AAV-DJ 또는 그 변이체일 수 있고, 예컨대 Grimm et al.이 설명한 AAVDJ8(또는 AAV-DJ8)(Journal of Virology [바이러스학 저널] 82(12): 5887- 5911, 2008)일 수 있다. AAV-DJ8의 아미노산 서열은 두개 이상의 돌연변이를 포함하여 헤파린 결합 도메인(HBD)을 제거할 수 있다. 비한정적인 예시로서, US 7,588,772에 SEQ ID NO: 1의 AAV- DJ서열은 2개의 돌연변이: (1) R587Q(아미노산587 위치의 Arg가 글루타민 Gln으로 변경) 및 (2) R590T를 포함할 수 있다고 기재되어 있다. 다른 비한정적인 예시로서, AAV-DJ서열은 3개의 돌연변이: (1) K406R, (2) R587Q 및 (3) R590T를 포함할 수 있다.

일부 실시 형태에 있어서, AAV 혈청형은 WO 2015/121501에서 설명한 서열, 예컨대 트루 타입 AAV(ttAAV)(WO 2015/121501 중의 SEQ ID NO: 2), 소위 UPenn AAV10(WO 2015/121501 중의 SEQ ID NO: 8) 또는 소위 일본 AAV10(WO 2015/121501 중의 SEQ ID NO: 9) 또는 그 변이체를 포함할 수 있다.

AAV 캡시드 혈청형의 선택 또는 사용은 다양한 종으로부터 올 수 있다. 일부 실시 형태에 있어서, AAV는 조류 AAV(aAAV)일 수 있다. aAAV 혈청형은 US 9,238,800에서 설명한 서열, 예컨대 aAAV(US 9,238,800 중의 SEQ ID NO: 1, 2, 4, 6, 8, 10, 12 및 14) 또는 그 변이체를 포함할 수 있다.

일부 실시 형태에 있어서, AAV는 소 AAV(bAAV)일 수 있다. bAAV 혈청형은 US 9,193,769에서 설명한 서열, 예컨대 bAAV(US 9,193,769 중의 SEQ ID NO: 1 및 6) 또는 그 변이체를 포함할 수 있다. bAAV 혈청형은 US 7,427,396에서 설명한 서열, 예컨대 bAAV(US 7,427,396 중의 SEQ ID NO: 5 및 6) 또는 그 변이체를 포함할 수 있다.

일부 실시 형태에 있어서, AAV는 염소 AAV일 수 있다. 염소 AAV 혈청형은 US 7,427,396에서 설명한 서열, 예컨대 염소 AAV(US 7,427,396 중의 SEQ ID NO: 3) 또는 그 변이체를 포함할 수 있다.

일부 실시 형태에 있어서, AAV를 두 가지 이상의 친본 혈청형의 하이브리드 AAV로 조작할 수 있다.

일부 실시 형태에 있어서, AAV는 AAV2G9일 수 있고, AAV2 및 AAV9로부터 유래된 서열을 포함한다. AAV2G9 AAV 혈청형은 US 2016-0017005 A1에서 설명한 서열을 포함할 수 있다. (참조로 본 명세서에 포함됨).

일부 실시 형태에 있어서, AAV는 AAV9캡시드 라이브러리에서 생성한 혈청형일 수 있고, 아미노산 390-627(VP1 넘버링)에서 돌연변이를 가지며, Pulicherla et al.(Molecular Therapy [분자 요법] 19(6): 1070-1078, 2011, 참조로 본 명세서에 통합)에 기재된 바와 같다. 혈청형 및 대응되는 뉴클레오티드 및 아미노산 치환은 AAV9.1(G1594C; D532H), AAV6.2(T1418A 및 T1436X; V473D 및 I479K), AAV9.3(T1238A; F413Y), AAV9.4(T1250C 및 A1617T; F417S), AAV9.5(A1235G, A1314T, A1642G, C1760T; Q412R, T548A, A587V), AAV9.6(T1231A; F411I), AAV9.9(G1203A, G1785T, W595C), AAV9.10(A1500G, T1676C; M559T), AAV9.11(A1425T, A1702C, A1769T; T568P, Q590L), AAV9.13(A1369C, A1720T; N457H, T574S), AAV9.14(T1340A, T1362C, T1560C, G1713A; L447H), AAV9.16(A1775T; Q592L), AAV9.24(T1507C, T1521G; W503R), AAV9.26(A1337G, A1769C; Y446C, Q590P), AAV9.33(A1667C; D556A), AAV9.34(A1534G, C1794T; N512D), AAV9.35(A1289T, T1450A, C1494T, A1515T, C1794A, G1816A; Q430L, Y484N, N98K, V606I), AAV9.40(A1694T, E565V), AAV9.41(A1348T, T1362C; T450S), AAV9.44(A1684C, A1701T, A1737G; N562H, K567N), AAV9.45(A1492T, C1804T; N498Y, L602F), AAV9.46(G1441C, T1525C, T1549G; G481R, W509R, L517V), 9.47(G1241A, G1358A, A1669G, C1745T; S414N, G453D, K557E, T582I), AAV9.48(C1445T, A1736T; P482L, Q579L), AAV9.50(A1638T, C1683T, T1805A; Q546H, L602H), AAV9.53(G1301A, A1405C, C1664T, G1811T; R134Q, S469R, A555V, G604V), AAV9.54(C1531A, T1609A; L511I, L537M), AAV9.55(T1605A; F535L), AAV9.58(C1475T, C1579A; T492I, H527N), AAV.59(T1336C; Y446H), AAV9.61(A1493T; N498I), AAV9.64(C1531A, A1617T; L511I), AAV9.65(C1335T, T1530C, C1568A; A523D), AAV9.68(C1510A; P504T), AAV9.80(G1441A,; G481R), AAV9.83(C1402A, A1500T; P468T, E500D), AAV9.87(T1464C, T1468C; S490P), AAV9.90(A1196T; Y399F), AAV9.91(T1316G, A1583T, C1782G, T1806C; L439R, K528I), AAV9.93(A1273G, A1421G, A1638C, C1712T, G1732A, A1744T, A1832T; S425G, Q474R, Q546H, P571L, G578R, T582S, D611V), AAV9.94(A1675T; M559L) 및 AAV9.95(T1605A; F535L)일 수 있으나 이에 한정되지 않는다.

일부 실시 형태에 있어서, AAV는 적어도 하나의 AAV 캡시드CD8⁺ T-세포 에피토프를 포함하는 혈청형일 수 있다. 비한정적인 실시예로서, 혈청형은 AAV1, AAV2 또는 AAV 8일 수 있다.

일부 실시 형태에 있어서, AAV는 변이체, 예컨대 Deverman에서 설명한 PHP.A 또는 PHP.B(Nature Biotechnology. [네이처 바이오테크놀리지] 34(2): 204-209, 2016, 참조로 본 명세서에 포함됨)일 수 있다.

일부 실시 형태에 있어서, AAV는 Deverman et al.(Nature Biotechnology [네이처 바이오테크놀리지] 34(2): 204-209, 2016, 참조로 본 명세서에 포함됨)이 설명한 Cre재조합에 기반하여 AAV 타겟팅 진화(CREATE) 생성된 혈청형일 수 있다. 일부 실시 형태에 있어서, 다른 AAV 혈청형에 비해, 이러한 방식으로 생성된 AAV 혈청형은 개선된 CNS 형질도입 및/또는 뉴런 및 성상 세포 향성을 갖는다.

일부 실시 형태에 있어서, AAV 혈청형은 아미노산588-589 사이에 7개의 아미노산 삽입을 갖는 AAV9 유도체일 수 있다. 이러한 7개의 아미노산이 삽입된 비한정적인 예시로서 PHP.A, PHP.B, PHP.B2, PHP.B3, PHP.N, PHP.S, G2A12, G2A15, G2A3, G2B4 및 G2B5를 포함한다.

일부 실시 형태에 있어서, AAV는 SEQ ID NO: 4,734-5,302 및 WO 2018/002719 A1의 표 2로부터 선택된 임의의 혈청형(참조로 본 명세서에 포함됨)일 수 있다. 일부 실시 형태에 있어서, AAV는 예컨대 WO 2018/002719 A1의 SEQ ID NO: 4,734-5,302에 따른 서열, 단편 또는 변이체(참조로 본 명세서에 포함됨)를 통해 코딩될 수 있다.

일부 실시 형태에 있어서, AAV VP1캡시드 서열은 AAV1, AAV2, AAV3A, AAV3B, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, AAV-DJ, AAV PHP.eB, Anc80L65, Anc80L65AAP 또는 7m8 중의 하나이다.

이하 상기 대표적인 VP1 캡시드의 단백질 서열을 제공하였다.

MAADGYLPDWLEDNLSEGIREWWDLKPGAPKPKANQQKQDDGRGLVLPGYKYLGPFNGLDKGEPVNAA DAAALEHDKAYDQQLKAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPLGLVEEGA KTAPGKKRPVEQSPQEPDSSSGIGKTGQQPAKKRLNFGQTGDSESVPDPQPLGEPPATPAAVGPTTMA SGGGAPMADNNEGADGVGNASGNWHCDSTWLGDRVITTSTRTWALPTYNNHLYKQISSASTGASNDNH YFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTTNDGVTTIANNLTST VQVFSDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGN NFTFSYTFEEVPFHSSYAHSQSLDRLMNPLIDQYLYYLNRTQNQSGSAQNKDLLFSRGSPAGMSVQPK NWLPGPCYRQQRVSKTKTDNNNSNFTWTGASKYNLNGRESIINPGTAMASHKDDEDKFFPMSGVMIFG KESAGASNTALDNVMITDEEEIKATNPVATERFGTVAVNFQSSSTDPATGDVHAMGALPGMVWQDRDV YLQGPIWAKIPHTDGHFHPSPLMGGFGLKNPPPQILIKNTPVPANPPAEFSATKFASFITQYSTGQVS VEIEWELQKENSKRWNPEVQYTSNYAKSANVDFTVDNNGLYTEPRPIGTRYLTRPL (AAV1; SEQ ID NO: 6)

MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEA DAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPV KTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMA TGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHY FGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTV QVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNN FTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRN WLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGK QGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGNRQAATADVNTQGVLPGMVWQDRDVY LQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSV EIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL (AAV2; SEQ ID NO: 7)

MAADGYLPDWLEDNLSEGIREWWALKPGVPQPKANQQHQDNRRGLVLPGYKYLGPGNGLDKGEPVNEA DAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRILEPLGLVEEAA KTAPGKKGAVDQSPQEPDSSSGVGKSGKQPARKRLNFGQTGDSESVPDPQPLGEPPAAPTSLGSNTMA SGGGAPMADNNEGADGVGNSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHY FGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKKLSFKLFNIQVRGVTQNDGTTTIANNLTSTV QVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNN FQFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLNRTQGTTSGTTNQSRLLFSQAGPQSMSLQAR NWLPGPCYRQQRLSKTANDNNNSNFPWTAASKYHLNGRDSLVNPGPAMASHKDDEEKFFPMHGNLIFG KEGTTASNAELDNVMITDEEEIRTTNPVATEQYGTVANNLQSSNTAPTTGTVNHQGALPGMVWQDRDV YLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQIMIKNTPVPANPPTTFSPAKFASFITQYSTGQVS VEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL (AAV3A; SEQ ID NO: 8)

MAADGYLPDWLEDNLSEGIREWWALKPGVPQPKANQQHQDNRRGLVLPGYKYLGPGNGLDKGEPVNEA DAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRILEPLGLVEEAA KTAPGKKRPVDQSPQEPDSSSGVGKSGKQPARKRLNFGQTGDSESVPDPQPLGEPPAAPTSLGSNTMA SGGGAPMADNNEGADGVGNSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHY FGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKKLSFKLFNIQVKEVTQNDGTTTIANNLTSTV QVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNN FQFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLNRTQGTTSGTTNQSRLLFSQAGPQSMSLQAR NWLPGPCYRQQRLSKTANDNNNSNFPWTAASKYHLNGRDSLVNPGPAMASHKDDEEKFFPMHGNLIFG KEGTTASNAELDNVMITDEEEIRTTNPVATEQYGTVANNLQSSNTAPTTRTVNDQGALPGMVWQDRDV YLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQIMIKNTPVPANPPTTFSPAKFASFITQYSTGQVS VEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL (AAV3B; SEQ ID NO: 9)

MTDGYLPDWLEDNLSEGVREWWALQPGAPKPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAAD AAALEHDKAYDQQLKAGDNPYLKYNHADAEFQQRLQGDTSFGGNLGRAVFQAKKRVLEPLGLVEQAGE TAPGKKRPLIESPQQPDSSTGIGKKGKQPAKKKLVFEDETGAGDGPPEGSTSGAMSDDSEMRAAAGGA AVEGGQGADGVGNASGDWHCDSTWSEGHVTTTSTRTWVLPTYNNHLYKRLGESLQSNTYNGFSTPWGY FDFNRFHCHFSPRDWQRLINNNWGMRPKAMRVKIFNIQVKEVTTSNGETTVANNLTSTVQIFADSSYE LPYVMDAGQEGSLPPFPNDVFMVPQYGYCGLVTGNTSQQQTDRNAFYCLEYFPSQMLRTGNNFEITYS FEKVPFHSMYAHSQSLDRLMNPLIDQYLWGLQSTTTGTTLNAGTATTNFTKLRPTNFSNFKKNWLPGP SIKQQGFSKTANQNYKIPATGSDSLIKYETHSTLDGRWSALTPGPPMATAGPADSKFSNSQLIFAGPK QNGNTATVPGTLIFTSEEELAATNATDTDMWGNLPGGDQSNSNLPTVDRLTALGAVPGMVWQNRDIYY QGPIWAKIPHTDGHFHPSPLIGGFGLKHPPPQIFIKNTPVPANPATTFSSTPVNSFITQYSTGQVSVQ IDWEIQKERSKRWNPEVQFTSNYGQQNSLLWAPDAAGKYTEPRAIGTRYLTHHL (AAV4; SEQ ID NO: 10)

MSFVDHPPDWLEEVGEGLREFLGLEAGPPKPKPNQQHQDQARGLVLPGYNYLGPGNGLDRGEPVNRAD EVAREHDISYNEQLEAGDNPYLKYNHADAEFQEKLADDTSFGGNLGKAVFQAKKRVLEPFGLVEEGAK TAPTGKRIDDHFPKRKKARTEEDSKPSTSSDAEAGPSGSQQLQIPAQPASSLGADTMSAGGGGPLGDN NQGADGVGNASGDWHCDSTWMGDRVVTKSTRTWVLPSYNNHQYREIKSGSVDGSNANAYFGYSTPWGY FDFNRFHSHWSPRDWQRLINNYWGFRPRSLRVKIFNIQVKEVTVQDSTTTIANNLTSTVQVFTDDDYQ LPYVVGNGTEGCLPAFPPQVFTLPQYGYATLNRDNTENPTERSSFFCLEYFPSKMLRTGNNFEFTYNF EEVPFHSSFAPSQNLFKLANPLVDQYLYRFVSTNNTGGVQFNKNLAGRYANTYKNWFPGPMGRTQGWN LGSGVNRASVSAFATTNRMELEGASYQVPPQPNGMTNNLQGSNTYALENTMIFNSQPANPGTTATYLE GNMLITSESETQPVNRVAYNVGGQMATNNQSSTTAPATGTYNLQEIVPGSVWMERDVYLQGPIWAKIP ETGAHFHPSPAMGGFGLKHPPPMMLIKNTPVPGNITSFSDVPVSSFITQYSTGQVTVEMEWELKKENS KRWNPEIQYTNNYNDPQFVDFAPDSTGEYRTTRPIGTRYLTRPL (AAV5; SEQ ID NO: 11)

MAADGYLPDWLEDNLSEGIREWWDLKPGAPKPKANQQKQDDGRGLVLPGYKYLGPFNGLDKGEPVNAA DAAALEHDKAYDQQLKAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPFGLVEEGA KTAPGKKRPVEQSPQEPDSSSGIGKTGQQPAKKRLNFGQTGDSESVPDPQPLGEPPATPAAVGPTTMA SGGGAPMADNNEGADGVGNASGNWHCDSTWLGDRVITTSTRTWALPTYNNHLYKQISSASTGASNDNH YFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTTNDGVTTIANNLTST VQVFSDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGN NFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLNRTQNQSGSAQNKDLLFSRGSPAGMSVQPK NWLPGPCYRQQRVSKTKTDNNNSNFTWTGASKYNLNGRESIINPGTAMASHKDDKDKFFPMSGVMIFG KESAGASNTALDNVMITDEEEIKATNPVATERFGTVAVNLQSSSTDPATGDVHVMGALPGMVWQDRDV YLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPPAEFSATKFASFITQYSTGQVS VEIEWELQKENSKRWNPEVQYTSNYAKSANVDFTVDNNGLYTEPRPIGTRYLTRPL (AAV6; SEQ ID NO: 12)

MAADGYLPDWLEDNLSEGIREWWDLKPGAPKPKANQQKQDNGRGLVLPGYKYLGPFNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPLGLVEEGAKTAPAKKRPVEPSPQRSPDSSTGIGKKGQQPARKRLNFGQTGDSESVPDPQPLGEPPAAPSSVGSGTVAAGGGAPMADNNEGADGVGNASGNWHCDSTWLGDRVITTSTRTWALPTYNNHLYKQISSETAGSTNDNTYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKKLRFKLFNIQVKEVTTNDGVTTIANNLTSTIQVFSDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQSVGRSSFYCLEYFPSQMLRTGNNFEFSYSFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLARTQSNPGGTAGNRELQFYQGGPSTMAEQAKNWLPGPCFRQQRVSKTLDQNNNSNFAWTGATKYHLNGRNSLVNPGVAMATHKDDEDRFFPSSGVLIFGKTGATNKTTLENVLMTNEEEIRPTNPVATEEYGIVSSNLQAANTAAQTQVVNNQGALPGMVWQNRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGLKHPPPQILIKNTPVPANPPEVFTPAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNFEKQTGVDFAVDSQGVYSEPRPIGTRYLTRNL (AAV7; SEQ ID NO: 13)

MAADGYLPDWLEDNLSEGIREWWALKPGAPKPKANQQKQDDGRGLVLPGYKYLGPFNGLDKGEPVNAA DAAALEHDKAYDQQLQAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPLGLVEEGA KTAPGKKRPVEPSPQRSPDSSTGIGKKGQQPARKRLNFGQTGDSESVPDPQPLGEPPAAPSGVGPNTM AAGGGAPMADNNEGADGVGSSSGNWHCDSTWLGDRVITTSTRTWALPTYNNHLYKQISNGTSGGATND NTYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLSFKLFNIQVKEVTQNEGTKTIANNLT STIQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRT GNNFQFTYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTQTTGGTANTQTLGFSQGGPNTMANQ AKNWLPGPCYRQQRVSTTTGQNNNSNFAWTAGTKYHLNGRNSLANPGIAMATHKDDEERFFPSNGILI FGKQNAARDNADYSDVMLTSEEEIKTTNPVATEEYGIVADNLQQQNTAPQIGTVNSQGALPGMVWQNR DVYLQGPIWAKIPHTDGNFHPSPLMGGFGLKHPPPQILIKNTPVPADPPTTFNQSKLNSFITQYSTGQ VSVEIEWELQKENSKRWNPEIQYTSNYYKSTSVDFAVNTEGVYSEPRPIGTRYLTRNL (AAV8; SEQ ID NO: 14)

MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAA DAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAA KTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMA SGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDN AYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTS TVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTG NNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTINGSGQNQQTLKFSVAGPSNMAVQGR NYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFG KQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHQSAQAQAQTGWVQNQGILPGMVWQDRDV YLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVS VEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL (AAV9; SEQ ID NO: 15)

MAADGYLPDWLEDNLSEGIREWWDLKPGAPKPKANQQKQDDGRGLVLPGYKYLGPFNGLDKGEPVNAA DAAALEHDKAYDQQLKAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPLGLVEEAA KTAPGKKRPVEPSPQRSPDSSTGIGKKGQQPAKKRLNFGQTGESESVPDPQPIGEPPAGPSGLGSGTM AAGGGAPMADNNEGADGVGSSSGNWHCDSTWLGDRVITTSTRTWALPTYNNHLYKQISNGTSGGSTND NTYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLSFKLFNIQVKEVTQNEGTKTIANNLT STIQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRT GNNFEFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTQSTGGTQGTQQLLFSQAGPANMSAQ AKNWLPGPCYRQQRVSTTLSQNNNSNFAWTGATKYHLNGRDSLVNPGVAMATHKDDEERFFPSSGVLM FGKQGAGRDNVDYSSVMLTSEEEIKTTNPVATEQYGVVADNLQQANTGPIVGNVNSQGALPGMVWQNR DVYLQGPIWAKIPHTDGNFHPSPLMGGFGLKHPPPQILIKNTPVPADPPTTFSQAKLASFITQYSTGQ VSVEIEWELQKENSKRWNPEIQYTSNYYKSTNVDFAVNTEGTYSEPRPIGTRYLTRNL (AAV10; SEQ ID NO: 16)

MAADGYLPDWLEDNLSEGIREWWDLKPGAPKPKANQQKQDDGRGLVLPGYKYLGPFNGLDKGEPVNAA DAAALEHDKAYDQQLKAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPLGLVEEGA KTAPGKKRPLESPQEPDSSSGIGKKGKQPARKRLNFEEDTGAGDGPPEGSDTSAMSSDIEMRAAPGGN AVDAGQGSDGVGNASGDWHCDSTWSEGKVTTTSTRTWVLPTYNNHLYLRLGTTSSSNTYNGFSTPWGY FDFNRFHCHFSPRDWQRLINNNWGLRPKAMRVKIFNIQVKEVTTSNGETTVANNLTSTVQIFADSSYE LPYVMDAGQEGSLPPFPNDVFMVPQYGYCGIVTGENQNQTDRNAFYCLEYFPSQMLRTGNNFEMAYNF EKVPFHSMYAHSQSLDRLMNPLLDQYLWHLQSTTSGETLNQGNAATTFGKIRSGDFAFYRKNWLPGPC VKQQRFSKTASQNYKIPASGGNALLKYDTHYTLNNRWSNIAPGPPMATAGPSDGDFSNAQLIFPGPSV TGNTTTSANNLLFTSEEEIAATNPRDTDMFGQIADNNQNATTAPITGNVTAMGVLPGMVWQNRDIYYQ GPIWAKIPHADGHFHPSPLIGGFGLKHPPPQIFIKNTPVPANPATTFTAARVDSFITQYSTGQVAVQI EWEIEKERSKRWNPEVQFTSNYGNQSSMLWAPDTTGKYTEPRVIGSRYLTNHL (AAV11; SEQ ID NO: 17)

MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNGRGLVLPGYKYLGPFNGLDKGEPVNEA DAAALEHDKAYDKQLEQGDNPYLKYNHADAEFQQRLATDTSFGGNLGRAVFQAKKRILEPLGLVEEGV KTAPGKKRPLEKTPNRPTNPDSGKAPAKKKQKDGEPADSARRTLDFEDSGAGDGPPEGSSSGEMSHDA EMRAAPGGNAVEAGQGADGVGNASGDWHCDSTWSEGRVTTTSTRTWVLPTYNNHLYLRIGTTANSNTY NGFSTPWGYFDFNRFHCHFSPRDWQRLINNNWGLRPKSMRVKIFNIQVKEVTTSNGETTVANNLTSTV QIFADSTYELPYVMDAGQEGSFPPFPNDVFMVPQYGYCGVVTGKNQNQTDRNAFYCLEYFPSQMLRTG NNFEVSYQFEKVPFHSMYAHSQSLDRMMNPLLDQYLWHLQSTTTGNSLNQGTATTTYGKITTGDFAYY RKNWLPGACIKQQKFSKNANQNYKIPASGGDALLKYDTHTTLNGRWSNMAPGPPMATAGAGDSDFSNS QLIFAGPNPSGNTTTSSNNLLFTSEEEIATTNPRDTDMFGQIADNNQNATTAPHIANLDAMGIVPGMV WQNRDIYYQGPIWAKVPHTDGHFHPSPLMGGFGLKHPPPQIFIKNTPVPANPNTTFSAARINSFLTQY STGQVAVQIDWEIQKEHSKRWNPEVQFTSNYGTQNSMLWAPDNAGNYHELRAIGSRFLTHHL (AAV12; SEQ ID NO: 18)

MTDGYLPDWLEDNLSEGVREWWALQPGAPKPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAAD AAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRILEPLGLVEEAAK TAPGKKRPVEQSPAEPDSSSGIGKSGQQPARKRLNFGQTGDTESVPDPQPLGQPPAAPSGVGSTTMAS GGGAPMADNNEGADGVGNSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISSQSGATNDNHYF GYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQ VFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNF QFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLNRTQTASGTQQSRLLFSQAGPTSMSLQAKNWL PGPCYRQQRLSKQANDNNNSNFPWTGATKYHLNGRDSLVNPGPAMASHKDDKEKFFPMHGTLIFGKEG TNANNADLENVMITDEEEIRTTNPVATEQYGTVSNNLQNSNAGPTTGTVNHQGALPGMVWQDRDVYLQ GPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQIMIKNTPVPANPPTNFSAAKFASFITQYSTGQVSVEI EWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL (AAV13; SEQ ID NO: 19)

MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEA DAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAA KTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPIGEPPAAPSGVGSLTMA AGGGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDN AYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLSFKLFNIQVKEVTQNEGTKTIANNLTS TIQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTG NNFQFTYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTQTTGGTTNTQTLGFSQGGPNTMANQA KNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIF GKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGNRQAATADVNTQGVLPGMVWQDRD VYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPADPPTTFNQSKLNSFITQYSTGQV SVEIEWELQKENSKRWNPEIQYTSNYYKSTSVDFAVNTEGVYSEPRPIGTRYLTRNL (AAV-DJ; SEQ ID NO: 20)

MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAA DAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAA KTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMA SGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDN AYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTS TVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTG NNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTINGSGQNQQTLKFSVAGPSNMAVQGR NYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFG KQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHQSDGTLAVPFKAQAQTGWVQNQGILPGM VWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQ YSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL (AAV PHP.eB; SEQ ID NO: 21)

MAADGYLPDWLEDNLSEGIREWWDLKPGAPKPKANQQKQDDGRGLVLPGYKYLGPFNGLDKGEPVNAA DAAALEHDKAYDQQLKAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPLGLVEEGA KTAPGKKRPVEQSPQEPDSSSGIGKKGQQPARKRLNFGQTGDSESVPDPQPLGEPPAAPSGVGSNTMA AGGGAPMADNNEGADGVGNASGNWHCDSTWLGDRVITTSTRTWALPTYNNHLYKQISSQSGGSTNDNT YFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKKLNFKLFNIQVKEVTTNDGTTTIANNLTST VQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGN NFQFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTQTTSGTAGNRTLQFSQAGPSSMANQAK NWLPGPCYRQQRVSKTTNQNNNSNFAWTGATKYHLNGRDSLVNPGPAMATHKDDEDKFFPMSGVLIFG KQGAGNSNVDLDNVMITNEEEIKTTNPVATEEYGTVATNLQSANTAPATGTVNSQGALPGMVWQDRDV YLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPPTTFSPAKFASFITQYSTGQVS VEIEWELQKENSKRWNPEIQYTSNYNKSTNVDFAVDTNGVYSEPRPIGTRYLTRNL (Anc80L65; SEQ ID NO: 22)

MAADGYLPDWLEDNLSEGIREWWDLKPGAPKPKANQQKQDDGRGLVLPGYKYLGPFNGLDKGEPVNAA DAAALEHDKAYDQQLKAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPLGLVEEGA KTAPGKKRPVEQSPQEPDSSSGIGKKGQQPARKRLNFGQTGDSESVPDPQPLGEPPAAPSGVGSNTMA AGGGAPMADNNEGADGVGNASGNWHCDSTWLGDRVITTSTRTWALPTYNNHLYKQISSQSGGSTNDNT YFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKKLNFKLFNIQVKEVTTNDGTTTIANNLTST VQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGN NFQFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTQTTSGTAGNRTLQFSQAGPSSMANQAK NWLPGPCYRQQRVSKTTNQNNNSNFAWTGATKYHLNGRDSLVNPGPAMATHKDDEDKFFPMSGVLIFG KQGAGNSNVDLDNVMITNEEEIKTTNPVATEEYGTVATNLQSANTAPATGTVNSQGALPGMVWQDRDV YLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPPTTFSPAKFASFITQYSTGQVS VEIEWELQKENSKRWNPEIQYTSNYNKSTNVDFAVDTNGVYSEPRPIGTRYLTRNL (Anc80L65AAP; SEQ ID NO: 23)

MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEA DAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPV KTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMA TGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVTTTSTRTWALPTYNNHLYKQISSQSGASNDNHY FGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTV QVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNN FTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRN WLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGK QGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGNLALGETTRPARQAATADVNTQGVLP GMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFI TQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSINVDFTVDTNGVYSEPRPIGTRYLTRNL (7m8; SEQ ID NO: 24)

3. 변형된 AAV ITR

본 명세서의 개시에 의하면, 임의의 전사된 AAV ITR 서열(RNA)은 모두 코딩성의 변형된 AAV ITR DNA 주형에 대해 조작하여 변형되어, 예를 들어 TRS 또는 그 등가물을 제거 또는 비활성화하거나, 및/또는 그 D 영역 서열을 제거할 수 있다. 이러한 변형된 AAV ITR DNA 주형을 전사하여 얻은 전사되고 변형된 AAV ITR은 본 발명의 RNA 서열을 AAV 바이러스 입자에 패키징하도록 촉진하는 능력을 보류한다.

AAV DNA복제 기간에, ITR은 말단 분해 부위(TRS)에서 바이러스에 의해 코딩된 Rep 단백질에 의해 절개구가 생성된다. 이러한 시작 기능은 Rep 결합 요소(RBE), 말단 반복(RBE') 내 내부 헤어핀의 전단을 포함하는 작은 회문 서열 및 TRS의 3개의 DNA 서열 요소를 필요로 한다. TRS에 절개구개 생성되는 기간에, Rep는 특정 방향으로 RBE(DNA)에 연결된다. 이러한 방향은 Rep쌍이 AAV ITR에 정렬되도록 하고, 특정 뉴클레오티드가 RBE’에 접촉되도록 허용하며, TRS의 절개구 생성을 가이드하는 것으로 보인다. TRS 대비 RBE의 극성 또는 위치의 변경은 Rep의 절개구 생성을 크게 억제하였다. RBE’ 내의 치환도 Rep비활성을 저하시키나, 그 정도가 작다. TRS의 절개구 생성 기간에, Rep와 RBE 및 RBE’의 상호 작용은 기능 상에서 서로 다르고, Rep와 RBE의 접촉은 DNA 헬리카제 활성 및 TRS절단에 대해 모두 필수적이기 때문이다. 아울러, Rep와 RBE’의 상호 작용은 주로 ITR 풀림 및 TRS스템 루프 구조의 형성에 필수적이나, TRS 절단에 필요한 것이 아니다.

본 발명의 RNA 서열에 적어도 하나의 본 발명의 전사되고 변형된 ITR 서열(RNA)이 존재한다. 본 발명의 전사되고 변형된 ITR 서열은 본 발명의 RNA 서열의 3’ 말단에 더 가까운 것이 바람직하다.

일부 실시 형태에 있어서, 본 발명의 RNA 서열은 2개의 전사되고 변형된 ITR 서열을 포함한다.

일부 실시 형태에 있어서, 2개의 전사되고 변형된 ITR 서열은 동일한 AAV 혈청형으로부터 유래될 수 있다.

다른 하나의 실시 형태에 있어서, 2개의 전사되고 변형된 ITR 서열은 다른 혈청형의 2개의 다른 AAV로부터 유래될 수 있다.

일부 실시 형태에 있어서, 하나 또는 복수의 전사되고 변형된 ITR 서열은 삽입, 결실 및/또는 돌연변이를 포함한다.

일부 실시 형태에 있어서, 본 발명의 rRAAV RNA 서열은 하나의 전사된 변형/돌연변된 ITR 서열 및 하나의 전사된 야생형 ITR 서열을 포함한다.

일부 실시 형태에 있어서, 하나 또는 복수의 전사되고 변형된 ITR 서열은 Flip 방향 또는 Flop 방향의 야생형 ITR에 기반한다.

본 분야의 공지의 야생형 ITR 서열에 기반하여, 대상 전사되고 변형된 ITR 서열 또는 그 코딩DNA 서열을 용이하게 제조할 수 있다.

대표적인(비한정적인) 야생형 ITR 서열(DNA)은 적어도 표 1에 열거한 이하 서열을 포함한다. 도 1b 및 1c는 각각 AAV1-AAV7의 5’ ITR 서열의 다중 서열 정렬 및 3’ ITR 서열의 다중 서열 정렬을 나타내고, 공유 서열, TRS, RBE 및 D 영역 서열을 포함한다.

표 1: 대표적인 야생형 AAV말단 역반복(ITR) 서열

본 명세서에 사용된 바와 같이, “RBE 서열” 또는 “RBE”는 A:A’회문 줄기 서열 중의 AAV ITR 서열을 의미하고, 염기 페어링 시, 상기 서열은 줄기(통상적으로 약 21-23 또는 약 22 bp의 이중 가닥 영역)를 형성하고 ITR과 AAV Rep 단백질(Rep78 및 Rep68) 결합을 촉진한다. 도 1a에서 야생형 AAV2 ITR의 Flip 및 Flop 배열 둘 모두에 대표적인 RBE 서열을 나타냈다.

본 분야의 공지의 복수의 AAV 혈청형의 야생형 ITR 서열은 용이하게 얻으며, 모두 다른 AAV ITR과 정렬할 수 있고, 도 1b 및 1c에 도시된 바와 같다. 정렬 결과는 임의의 AAV ITR의 RBE 서열을 감정하는 데 사용될 수 있다.

“전사된 (기능적)RBE”는 RBE DNA 주형에 대응되는 전사된 RNA를 의미하고, 상기 RBE DNA 주형에 대응되는 것은 야생형 RBE 또는 하나 또는 복수의 뉴클레오티드 삽입, 결실, 치환 및/또는 기타 돌연변이의 기능적 변이체를 갖는 것을 의미하며, 기능적 변이체 RBE는 Rep와의 결합의 능력(예를 들어, 적어도 약 60%, 70%, 80%, 90%, 95% 또는 강화된 동일 혈청형Rep와의 결합 보류)을 거의 보류하기만 하면 된다. 일부 실시 형태에 있어서, RBE DNA 주형 또는 전사된 RBE RNA와 야생형 서열의 차이는 10, 9, 8, 7, 6, 5, 4, 3, 2, 1 개의 뉴클레오티드를 초과하지 않는다. 일부 실시 형태에 있어서, 야생형 RBE에 비해, 예를 들어 RBE의 하나 또는 복수의 뉴클레오티드의 삽입, 결실, 치환 및/또는 기타 돌연변이로 인해, 기능적 RBE는 약 30%, 25%, 20%, 15%, 10% 또는 5%에 달하는 서열 변이를 포함한다.

일부 실시 형태에 있어서, 뉴클레오티드 서열 차이는 페어링 염기쌍의 손실(예를 들어, 야생형 RBE 중의 GC쌍은 변이체 RBE 중의 CG, AT/AU 또는 TA/UA로 변경될 수 있으나, 원래의 페어링 염기쌍을 손실하지 않음)을 초래하지 않는다.

일부 실시 형태에 있어서, 전사되고 변형된 ITR 서열(RNA)은 전사된 Rep-결합 요소(전사된 RBE) 또는 그 기능적 변이체를 보류하여, Rep에 의해 매개되는 패키징을 촉진한다. 예를 들어, 야생형 AAV2 ITR의 RBE DNA 서열은 SEQ ID NO: 5이다.

일부 실시 형태에 있어서, 전사되고 변형된 ITR 서열(RNA)은 전사된 Rep-결합 요소의(전사된 RBE의) 서열을 더 보류한다. 예를 들어, 도 1a에서, Flip ITR의 B:B’ 단편에 헤어핀 또는 고리구조를 형성하는 CTTTG DNA 서열은 RBE’서열이다.

일부 실시 형태에 있어서, 전사되고 변형된 ITR 서열은 전사된 TRS 및/또는 전사된 rcTRS 또는 둘 모두가 결핍하다.

일부 실시 형태에 있어서, 이에 대응되는 DNA 서열은 야생형 TRS의 일부 서열 요소가 결핍하기에, 본 발명의 RNA 서열은 전사된 (기능적)TRS 서열이 결핍하여, 야생형 TRS기능이 DNA에서 손실된다(예를 들어, A:A’ 단편과 D 영역 서열 사이의 야생형 TRS 서열이 통상적으로 점유하는 서열 또는 내부 가닥은 AAV복제 기간에 통상적으로 엔도뉴클레아제에 의해 인식 및 절단되고, AAV ITR의 ssDNA 벡터 게놈에 존재하면, 절단되지 않는다).

예를 들어, 일부 실시 형태에 있어서, TRS의 역-상보적인 서열은 결실되거나 또는 돌연변이될 수 있고, 예를 들어 실시예에 사용되는 dITR 및 dITR-D 서열에서 결실되거나 또는 돌연변이될 수 있다.

대체 가능하게 또는 별도로, 통상적으로 A:A’ 단편 및 D 영역 서열 사이의 TRS에 하나 또는 복수의 뉴클레오티드가 결핍하거나 또는 하나 또는 복수의 뉴클레오티드 치환 또는 돌연변이를 가질 수 있다(예를 들어 실시예에 사용된 dITR 서열에서 4 개의 뉴클레오티드가 결핍 또는 치환/돌연변이됨).

일부 실시 형태에 있어서, 야생형 서열 중의 전부 또는 거의 전부의 TRS/rcTRS가 결실되어, 얻은 RNA전사체가 기능적 TRS 서열이 결핍되도록 한다.

일부 실시 형태에 있어서, 예를 들어 야생형 서열에서 삽입, 결실, 치환 및/또는 기타 돌연변이를 가져 야생형 TRS/rcTRS 서열의 일부를 변경/돌연변이하여, 돌연변이된 TRS/rcTRS에서 전사된 기능적 TRS가 결핍된 대응되는 RNA전사체가 생성되도록 한다. 예를 들어, 일부 실시 형태에 있어서, 1개, 2개, 3개, 4개 또는 5개의 연속 또는 비연속 TRS 뉴클레오티드 및/또는 rcTRS뉴클레오티드는 돌연변이된 서열에서 결실 또는 치환될 수 있다.

일부 실시 형태에 있어서, 전사되고 변형된 ITR 서열은 D 영역 서열이 결핍하거나 또는 적어도 기능적 D 영역 서열(D 서열 또는 D’서열은 Flip 또는 Flop 배열에 의해 결정)이 결핍되는 변형된 ITR로부터 전사된다. 예를 들어, 일부 실시 형태에 있어서, 전체 D 영역 서열이 결실되어, 얻은 RNA전사체가 전사된 기능적 D 영역 서열이 결핍되도록 한다. 다른 실시 형태에 있어서, D 영역 서열의 적어도 일부가 돌연변이되어(예를 들어, 결실, 삽입, 치환 및/또는 기타 돌연변이를 가져), 얻은 RNA전사체가 전사된 기능적 D 영역 서열이 결핍되도록 한다. 일부 실시 형태에 있어서, 돌연변이된 D 영역 서열은 야생형 서열의 10개, 9개, 8개, 7개, 6개, 5개, 4개, 3개, 2개 또는 1개를 초과하지 않는 뉴클레오티드를 가진다.

일부 실시 형태에 있어서, 변형된 ITR 서열(DNA 주형)은 야생형 ITR 서열 5’ 가장 말단의 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의 뉴클레오티드가 결핍하다. 예를 들어, 야생형 ITR 서열(SEQ ID NO: 1)에 비해, dITR 서열(SEQ ID NO: 2) 및 dITR-D 서열(SEQ ID NO: 3)은 모두 5’ 가장 말단의 8개의 뉴클레오티드가 결핍하다.

상기 전사된 RNA 코딩 서열(GOI의 DNA 코딩 서열), 전사되고 변형된 AAV ITR(변형의 AAV ITR), 전사된 기능적 RBE(기능적 RBE), 전사된 기능적 D 영역 서열(기능적 D 영역 서열) 및 전사된 기능적 TRS 서열(기능적 TRS 서열) 중의 어느 하나를 코딩하는 대응되는 DNA 서열은 명백하게 본 발명의 범위 내에 있는 것으로 고려된다.

4. 인트론, 엑손, UTR, 인핸서 및 기타 요소

본 발명의 rRAAV 바이러스 입자에 캡시드화될 본 발명의 RNA 서열은 GOI발현을 강화 또는 조절할 수 있는 별도의 임의의 서열 요소(예컨대 발현 제어 요소)를 더 포함할 수 있다.

본 발명의 RNA 서열에 존재하는 발현 제어 요소는 적절한 이종 폴리뉴클레오티드(예를 들어, GOI)가 전사 및/또는 번역되는 것을 촉지하고, 예를 들어 인트론의 스플라이싱 신호, 유전자의 정확한 리딩 프레임을 유지하여 mRNA 및 종결 코돈의 프레임내 번역 등을 포함한다.

전형적으로, 발현 제어 요소(일부는 본 발명의 RNA 서열에 존재하고, 나머지는 본 발명의 RNA 서열을 코딩하는 DNA에 존재)는 하나 또는 복수의 핵산 서열이고, 예컨대 조작 가능하게 연결된 이종 폴리뉴클레오티드(예를 들어, GOI) 발현에 영향을 미치는 프로모터 및 인핸서이다. 이러한 요소는 전형적으로 시스 작용할 수 있으나, 트랜스 작용할 수도 있다. 발현 제어는 전사, 번역, 스플라이싱, 정보 안정성 등 수준에서 수행될 수 있다. 전형적으로, 전사를 조절하는 발현 제어 요소는 전사된 폴리뉴클레오티드의 5'말단(즉, “업스트림”) 근처에 병렬된다. 발현 제어 요소는 전사된 서열의 3' 말단(즉 “다운스트림”) 또는 전사체 내(예를 들어, 인트론 내)에 위치할 수도 있다. 발현 제어 요소는 전사된 관심 유전자 서열에서 멀리 떨어진 거리(예를 들어, 관심 유전자 폴리뉴클레오티드100개 내지 500개, 500개 내지 1000개, 2,000개 내지 5,000개 이상의 뉴클레오티드에서 멀리 떨어짐)에 위치할 수 있다. 그러나, 바이러스 벡터(예컨대 AAV 벡터)의 폴리뉴클레오티드 길이의 제한으로 인해, 이러한 발현 제어 요소는 전형적으로 전사된 관심 유전자 서열에서 1-1,000개, 1-500, 1-250개 또는 1-100개의 뉴클레오티드 떨어진 범위 내에 있다.

본 발명의 RNA 서열 또는 본 발명의 RNA 서열을 코딩하는 DNA 상에 존재할 수 있는 일부 비한정적인 발현 제어 요소는 이하에서 추가로 설명하도록 한다.

인트론

인트론은 전사 후 조절 요소를 가지고, mRNA가 세포핵으로부터 운반되도록 효과적으로 유도할 수 있으며 mRNA안정성을 강화하는 것이 이미 알려져있다.

일부 실시 형태에 있어서, rRAAV는 하나 또는 복수의 인트론 또는 그 단편을 포함할 수 있다. 일부 실시 형태에 있어서, 하나 또는 복수의 인트론은 관심 유전자의 단편이다. 일부 실시 형태에 있어서, 하나 또는 복수의 인트론은 관심 유전자와 이종이다.

보도에 따르면, 인트론은 유전자 발현 수준에 영향을 미친다. 이러한 작용은 유전자 발현의 인트론 매개 강화(IME)로 칭한다(Lu et al., Mol Genet Genomics [분자 유전학 게놈학] 279:563-572, 2008). 일부 실시 형태에 있어서, 하나 또는 복수의 인트론을 갖지 않는 서열로부터 유래된 유전자 발현에 비해, 유전자 발현 수준은 약 1.5배, 약 2배, 약 2.5배, 약 3배, 약 3.5배, 약 4배, 약 4.5배, 약 5배, 약 5.5배, 약 6배, 약 6.5배, 약 7배, 약 7.5배, 약 8배, 약 8.5배, 약 9배, 약 9.5배 또는 약 10배 증가된다.

비한정적인 인트론은 SV40 인트론, β글로불린 인트론 및 짧은 키메릭 인트론(CIB)을 포함한다. 기타 인트론은 Lu et al., Hum Gene Ther. [인류 유전자 치료] 2017;28(1):125-134에서 설명한 ColE2-RNA-OUT, OIPR 및 R6K-RNA-OUT 인트론(참조로 포함됨); 인간 헤모글로빈 서브유닛 β(HBB2)합성 인트론(Snyder et al., Hum Gene Ther [인류 유전자 치료], 8 (1997), 제 1891-1900페이지, 참조로 포함됨)을 포함한다.

일부 실시 형태에 있어서, 하나 또는 복수의 인트론은 25개의 뉴클레오티드 미만이고, 50개의 뉴클레오티드 미만이며, 100개의 뉴클레오티드 미만이고, 150개의 뉴클레오티드 미만이며, 200개의 뉴클레오티드 미만이고, 250개의 뉴클레오티드 미만이며, 300개의 뉴클레오티드 미만이고, 350 개의 뉴클레오티드 미만이며, 400개의 뉴클레오티드 미만이고, 450개의 뉴클레오티드 미만이거나 또는 500개의 뉴클레오티드 미만일 수 있다.

일부 실시 형태에 있어서, 하나 또는 복수의 인트론은 25개의 뉴클레오티드를 초과하고, 50개의 뉴클레오티드를 초과하며, 100개의 뉴클레오티드를 초과하고, 150개의 뉴클레오티드를 초과하며, 200개의 뉴클레오티드를 초과하고, 250개의 뉴클레오티드를 초과하며, 300개의 뉴클레오티드를 초과하고, 350개의 뉴클레오티드를 초과하며, 400개의 뉴클레오티드를 초과하고, 450개의 뉴클레오티드를 초과하거나 또는 500개의 뉴클레오티드 초과할 수 있다.

일부 실시 형태에 있어서, 하나 또는 복수의 인트론은 약 50개 내지 약 100개의 뉴클레오티드, 약 50개 내지 약 200개의 뉴클레오티드, 약 50개 내지 약 300개의 뉴클레오티드, 약 50개 내지 약 400개의 뉴클레오티드, 약 50개 내지 약 500개의 뉴클레오티드, 약 100개 내지 약 200개의 뉴클레오티드, 약 100개 내지 약 300개의 뉴클레오티드, 약 100개 내지 약 400개의 뉴클레오티드, 약 100개 내지 약 500개의 뉴클레오티드, 약 200개 내지 약 300개의 뉴클레오티드, 약 200개 내지 약 400개의 뉴클레오티드, 약 200개 내지 약 500개의 뉴클레오티드, 약 300개 내지 약 400개의 뉴클레오티드, 약 300개 내지 약 500개의 뉴클레오티드 또는 약 400개 내지 약 500개의 뉴클레오티드일 수 있다.

인핸서

본 명세서에 사용된 바와 같이, 용어 “인핸서”는 관심 유전자 근처에 위치한 서열일 수 있다. 인핸서 요소는 전형적으로 본 발명의 RNA 서열을 코딩하는 DNA 중 프로모터 요소의 업스트림에 위치하나, 인트론 서열(예를 들어, 관심 유전자)의 다운스트림 또는 내부에 위치하여, 기능을 유지할 수도 있다. 따라서, 인핸서 또는 그 일부는 본 발명의 전사된 RNA 서열에 존재할 수 있다.

적합한 인핸서의 비한정적인 예시는 CMV 인핸서를 포함한다.

일부 실시 형태에 있어서, 인핸서 요소는 관심 유전자 업스트림 또는 다운스트림의 100개의 염기쌍, 200개의 염기쌍 또는 300개 이상의 염기쌍(예를 들어, 본 발명의 RNA 서열 또는 그 DNA 코딩 서열 중)에 위치할 수 있다. 인핸서 요소는 전형적으로 관심 유전자의 발현을 프로모터 요소를 통해 제공되는 증가된 발현보다 높게 증가시킨다.

비번역 영역(UTR)

본 명세서에 사용된 바와 같이, “비번역 영역”(“UTR”)은 전사 후 미번역 RNA를 의미한다. 예를 들어, 5’ UTR은 관심 유전자 개시 코돈의 업스트림에 위치하고, 3’ UTR은 관심 유전자 종결 코돈의 다운스트림에 위치한다. 일부 실시 형태에 있어서, 5’ 및/또는 3’ UTR은 삽입, 결실 또는 변형을 가져 전사된 관심 유전자의 안정성을 향상시킬 수 있다. 예를 들어, 5′ UTR은 번역 시작 서열을 포함할 수 있고, 예컨대 코작 서열 및 내부 리보솜 진입 부위(IRES)에 한정되지 않는다. 코작 서열은 공유 CCR(A/G)CCAUGG를 가지고, 여기서 R은 개시 코돈(AUG) 업스트림의 3개 염기의 퓨린(아데닌 또는 구아닌)이고, 그 뒤에는 다른 하나의 ‘G’이다.

3′ UTR에 아네노신 및 유리딘이 삽입된 것이 알려져 있다. 이러한 AU가 풍부한 특징은 높은 회전율의 유전자 중에서 특히 보편적이다. 이들의 서열 특징 및 기능 특성에 기반하여, AU 풍부 요소(ARE)는 3류(Chen et al., 1995)로 나뉜다: I류 ARE는 U 풍부 영역 내에 AUUUA 모티브의 몇개의 분산된 복사를 포함한다. C-Myc 및 MyoD는 I류 ARE를 포함한다. II류 ARE는 두 개 이상의 겹치는 UUAUUUA(U/A)(U/A) 노나머를 가진다. 이러한 ARE를 함유하는 분자는 GM-CSF 및 TNF-a를 포함한다. III류 ARES의 정의는 명확하지 않다. 이러한 U 풍부 영역은 AUUUA모티브를 함유하지 않는다. c-Jun 및 미오게닌은 이 유형 중 충분한 연구를 거친 2개의 예시이다. ARE와 결합하는 대다수의 단백질은 메신저의 안정성을 파괴할 수 있다고 이미 알려져 있으나, ELAV 패밀리의 구성원, 특히 HuR은 mRNA의 안정성을 향상시킬 수 있다고 기재되어 있다. HuR은 모든 3개 유형의 ARE와 결합한다. HuR 특이적 결합 부위를 핵산 분자의 3′ UTR에 조작하여, HuR 결합을 이룸으로써, 메신저가 체내에서 안정되도록 한다. 이러한 5’ 및/또는 3’ UTR 서열 중의 임의의 서열은 모두 본 발명의 RNA 서열에 존재할 수 있다.

일부 실시 형태에 있어서, 5’ UTR 및/또는 3’ UTR은 관심 유전자의 이종 서열을 포함할 수 있다. 일부 실시 형태에 있어서, 5’ UTR 및/또는 3’ UTR은 관심 유전자에 대해 천연적이다.

일부 실시 형태에 있어서, 폐, 간, 췌장, 내피 세포, CNS, 뉴런, 성상교세포, 골격근, 심근, 평활근, 혈액, 조혈세포 등의 특정 조직 또는 기관에서 정상적으로 발현되는 mRNA으로부터 유래되는 5’ UTR 및/또는 3’ UTR은 본 발명의 RNA 서열에 사용될 수 있고, 상기 RNA 서열은 이러한 조직 중의 하나 이상을 타겟팅하는 GOI를 포함한다.

폴리아데닐화 서열

일부 실시 형태에 있어서, 본 발명의 RNA 서열은 전사되고 변형된 AAV ITR을 포함하고, 상기 전사되고 변형된 AAV ITR은 폴리A 서열, 폴리A 신호 서열(예를 들어, AAUAAA) 또는 RNA전사 종결 서열(예를 들어, 히스톤 다운스트림 요소)의 5’에 존재한다.

이상에서 “폴리A 서열”, “폴리A 꼬리”, “폴리A 신호 서열” 및 “RNA 전사 종결을 위한 서열”을 정의하였다.

일부 실시 형태에 있어서, 본 발명의 RNA 서열은 폴리A 꼬리를 포함한다. 이러한 RNA 서열을 본 발명의 rRAAV 바이러스 입자에 패키징하고 표적 세포에 직접 전달할 수 있으며, 본 발명의 RNA 서열에 의해 코딩된 GOI를 직접 번역할 수 있다.

일부 실시 형태에 있어서, 본 발명의 RNA 서열은 폴리A 신호 서열 및 선택적으로 폴리A 부위 다운스트림의 전사된 GU 풍부 영역을 포함한다. 이러한 RNA 서열을 본 발명의 rRAAV 바이러스 입자에 패키징하고, 표적 세포에 직접 전달할 수 있다. 일단 표적 세포에 진입하면, 폴리A 신호 서열은 세포질 폴리A 첨가 효소에 의해 인식되어 가공되어 폴리A꼬리를 생성할 수 있고, 그 후 본 발명의 RNA 서열에 의해 코딩된 GOI를 번역한다.

대표적인 폴리A 신호 서열 및 주변 서열은 인간 성장 호르몬(hGH)폴리A 서열(Liu et al., Gene Ther [인류 유전자 치료] 20:308-317, 2013 참조, 참조로 포함됨), 소 성장 호르몬 폴리아데닐화 신호(bGHpA)(Goodwin 및 Rottman, J Biol Chem. [생물화학 저널] 1992년 8월 15일; 267(23):16330-4, 참조로 포함됨), SV40 초기 또는 후기 폴리아데닐화 신호 및 Choi et al.(Mol Brain. [분자 브레인] 2014;7:17, 참조로 본 명세서에 포함됨)에 사용된 합성 폴리A 신호를 포함한다.

전사 인핸서

본 명세서에 사용된 바와 같이, “전사 인핸서”는 관심 유전자 전사의 시스 작용을 증가시킬 수 있는 뉴클레오티드 서열을 의미한다. 일부 실시 형태에 있어서, 전사 인핸서는 본 발명의 전사된 RAAV RNA 서열의 인트론 중에 위치하거나 또는 일부가 엑손 영역에 위치할 수 있다.

WPRE

일부 실시 형태에 있어서, 본 발명의 RNA 서열은 코딩 DNA 상의 WPRE 서열에 의해 코딩되고 전사된 WPRE 서열을 포함한다.

우드척 간염 바이러스(WHP) 전사 후 조절 요소(WPRE)는 600 bp 좌우의 DNA 서열이고, 상기 DNA 서열은 전사 시 발현을 강화하는 3차 구조를 생성한다.

WPRE는 바이러스 벡터를 통해 전달되는 유전자의 발현을 증가시키기 위해 분자 생물학에서 자주 사용된다. 이는 γ, α 및 β 성분의 트리플 조절 요소를 갖는다. α 성분 길이는 80 bp: GCCACGGCGGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTCGGCTGTTGGGCACTGACAATTCCGTGGT(SEQ ID NO: 39)이다. 단독 사용 시, α 성분의 활성은 완전한 트리플 WPRE 서열의 9%에 불과하고, 이는 우드척 B형 간염 바이러스(WHV8) 게놈의 염기쌍 1093-1684와 100% 동일성을 갖는다.

일부 실시 형태에 있어서, 전사된 WPRE 서열 또는 그 일부(예컨대 γ, α 및 β 요소, 바람직하게는 주어진 순서에 따름)는 본 발명 rRAAV 바이러스 입자에 캡시드화된 대상 RNA 서열 상의 GOI의 3’ UTR 영역에 존재하여, 본 발명의 RNA 서열의 안정성 및 단백질 수율을 크게 향상시킨다.

일부 실시 형태에 있어서, WPRE 서열은 최소 γ 요소 및 일부 α-β 요소를 함유한 짧은 WPRE(WPRE2)이다(Kalev-Zylinska, J Neurosci. [신경 과학 저널] 2007, 27: 10456-10467 참조, 참조로 포함됨).

일부 실시 형태에 있어서, WPRE 서열은 최소 γ 및 α 요소를 함유한 짧은 WPRE(WPRE3)이다(Choi et al., Mol Brain [분자 브레인] 7, 17 (2014) 참조, 참조로 포함됨).

일부 실시 형태에 있어서, 본 발명의 RNA 서열은 WPRE 서열 및 인트론이 결핍된 GOI를 포함한다.

프로모터

본 명세서에 사용된 바와 같이, 용어 “프로모터”는 폴리뉴클레오티드 서열의 특이적 전사의 시작에 필요한 세포 합성 기계 또는 도입된 합성 기계에 의해 인식되는 DNA 서열로 정의된다.

따라서, 본 발명의 RNA 서열은 프로모터를 포함하지 않는다. 다른 한편으로, 본 발명의 RNA 서열을 코딩하는 DNA(예컨대 본 발명의 RNA 서열을 코딩하는 발현 카세트 또는 발현 벡터)는 본 발명의 RNA 서열을 전사하기 위한 프로모터를 포함한다.

본 명세서에 사용된 바와 같이, 용어 “프로모터/조절 서열”은 프로모터/조절 서열과 조작 가능하게 연결되는 유전자 산물을 발현시키는 데 필요한 핵산 서열을 의미한다. 일부 경우, 이러한 서열은 코어 프로모터 서열일 수 있다. 다른 경우, 이러한 서열은 인핸서 서열 및 유전자 산물의 발현에 필요한 기타 조절 요소를 더 포함할 수 있다. 프로모터/조절 서열은 예를 들어 조직 또는 세포 유형 특이적 방식으로 유전자 산물(예를 들어, 본 발명의 RNA 서열)을 발현시키는 프로모터/조절 서열일 수 있다.

본 명세서에 사용된 바와 같이, 용어 “조작 가능한 연결” 또는 “조작 가능하게 연결”은 이와 같이 설명되는 성분이 예상 방식으로 작용하도록 물리적 병렬 또는 기능적 병렬되는 것을 의미한다. 이종 폴리뉴클레오티드와 조작 가능하게 연결되는 발현 제어 요소의 예시에서, 이러한 관계는 제어 요소가 이종 폴리뉴클레오티드의 발현을 조절하도록 한다. 더욱 특히, 예를 들어, 2개의 조작 가능하게 연결된 DNA 서열은 2개의 DNA가 이러한 관계로 배열되어(시스 또는 트랜스), DNA 서열 중의 적어도 하나가 다른 하나의 서열에 생리적 작용을 발휘할 수 있도록 하는 것을 의미한다.

본 명세서에 사용된 바와 같이, “전신 발현” 프로모터는 유전자 산물을 코딩하거나 지정하는 폴리뉴클레오티드와 조작 가능하게 연결되는 경우, 세포의 대다수 또는 전부의 생리적 조건 하에서 유전자 산물이 세포 내에서 생성되도록 하는 뉴클레오티드 서열이다.

일부 실시 형태에 있어서, 본 발명의 RNA 서열을 코딩하는 DNA에서 전신 발현적으로 그 발현을 구동하기 위한 프로모터는 β-글루쿠로니다제(GUSB) 프로모터, 사이토메갈로바이러스(CMV) 즉시 초기 (Ie) 인핸서 및/또는 프로모터, 닭 β-액틴(CBA) 프로모터 또는 그 유도체, 예컨대 CAG 프로모터, CB프로모터, (인간) 연장인자 1α-서브유닛(EF1α) 프로모터 및 유비퀴틴 C(UBC) 프로모터를 포함할 수 있다.

본 명세서에 사용된 바와 같이, “유도성” 프로모터는 유전자 산물을 코딩 또는 지정하는 폴리뉴클레오티드와 조작 가능하게 연결되는 경우, 거의 프로모터에 대응되는 유도물이 세포에 존재할 때만이 유전자 산물이 세포에서 생성되도록 하는 뉴클레오티드 서열을 의미한다.

일부 실시 형태에 있어서, 프로모터는 조직 특이적 프로모터, 종 특이적 프로모터 또는 세포 주기 특이적 프로모터이다. Parr et al., Nat. Med. [자연의학] 3:1145-9, 1997 참조한다(전부 내용은 참조로 본 명세서에 포함된다).

본 명세서에 사용된 바와 같이, “조직 또는 세포 유형 특이적” 프로모터는 뉴클레오티드 서열이고, 코딩되거나 유전자에 의해 지정되는 폴리뉴클레오티드와 조작 가능하게 연결되는 경우, 바람직하게는 예를 들어 세포/조직은 프로모터가 통상적으로 그 중에서 활성을 갖는 세포 유형 또는 조직 유형이기에, 유전자 산물이 특정 세포 유형 또는 특정 세포에서 생성되도록 한다.

조직 또는 세포 유형 특이적 프로모터는 뉴런 조직 특이적 프로모터; CNS- 또는 PNS- 특이적 프로모터, 예컨대 성상교세포, 회돌기교세포 또는 뉴런 프로모터; 조혈 계통 특이적 프로모터, 예컨대 B세포 프로모터, T세포 프로모터, NK세포 프로모터, 단핵세포 프로모터, 백혈구 프로모터, 대식세포 프로모터; 내피 세포 프로모터; 췌장 프로모터; 간(liver/hepatic)세포 프로모터; 폐 조직 프로모터 등을 포함할 수 있다.

대표적인 조직 특이적 프로모터는 프리온 프로모터, 뉴런 특이적 엔올라제(NSE), 신경세사 경쇄(NFL) 프로모터, 신경세사 중쇄(NFH)프로모터, 혈소판 유래 성장인자(PDGF), 혈소판 유래 성장인자 B가닥(PDGF-β), 시냅신(Syn), 시냅신1(Syn1), 메틸-CpG 결합 단백질 2(MeCP2), Ca2+/칼모듈린 의존형 단백질 키나아제 II(CaMKII), 대사성 글루타메이트 수용체 2(mGluR2), 신경세사 경쇄(NFL) 또는 신경세사 중쇄(NFH), β-글로불린 꼬마유전자 nβ2, 프리프로엔케팔린(PPE), 엔케팔린(Enk) 및 흥분성 아미노산 운반체 2(EAAT2) 프로모터를 포함한다.

성상교세포 특이적 프로모터는 신경교섬유질산성 단백질(GFAP) 및 EAAT 2 프로모터를 포함한다.

회돌기교세포 특이적 프로모터는 미엘린 염기성 단백질(MBP) 프로모터를 포함한다.

일부 실시 형태에 있어서, 프로모터는 관심 유전자와 이종이다. 일부 실시 형태에 있어서, 프로모터는 관심 유전자의 천연 프로모터이다. 일부 실시 형태에 있어서, 이종 프로모터는 삽입, 결실, 치환 및/또는 기타 돌연변이를 포함한다. 일부 실시 형태에 있어서, 천연 프로모터는 삽입, 결실, 치환 및/또는 기타 돌연변이를 포함한다.

일부 실시 형태에 있어서, 프로모터는 Pol II 프로모터이다. 일부 실시 형태에 있어서, 프로모터는 Pol III 프로모터, 예컨대 U6 프로모터이다.

5. 벡터(플라스미드 또는 백미드)

본 명세서에 사용된 바와 같이, “벡터”는 통상적으로 단리된 핵산(DNA 또는 RNA)을 포함하고 세포 내부에 상기 단리된 핵산의 물질을 전달하는 데 사용될 수 있는 조성물을 의미한다.

용어 “발현 벡터”는 재조합 폴리뉴클레오티드를 포함한 벡터를 의미하고, 상기 재조합 폴리뉴클레오티드는 발현될 뉴클레오티드 서열와 조작 가능하게 연결된 발현 제어 서열를 포함한다. 발현 벡터는 충분한 발현을 위한 시스 작용 요소를 포함하고, 발현을 위한 다른 요소는 숙주 세포에서 제공되거나 또는 체외 발현 시스템에서 제공될 수 있다. 발현 벡터는 본 분야의 공지의 모든 발현 벡터, 예컨대 재조합 폴리뉴클레오티드에 혼입된 코스미드, 플라스미드, 백미드(예를 들어, 네이키드 또는 리보솜에 포함) 및 바이러스(예를 들어, 렌티바이러스, 레트로바이러스, 아데노 바이러스 및 아데노 관련 바이러스)를 포함한다.

GOI를 포함한 본 발명의 rRAAV RNA 서열은 벡터의 rRAAV 바이러스 입자를 감싸 상기 GOI를 표적/숙주 세포에 전달하는 데 사용되는 벡터이다.

일부 실시 형태에 있어서, 본 발명의 rRAAV RNA 서열은 DNA발현 벡터, 예컨대 플라스미드 또는 백미드(예를 들어, 곤충세포 내의 바큘로바이러스와 같이 유지하거나 복제할 수 있는 벡터)에 의해 코딩된다. 이러한 DNA발현 벡터는 적합한 숙주 세포에서 본 발명의 RNA 서열, 예컨대 포유동물 패키징 세포(예를 들어, HEK293T세포) 또는 곤충패키징 세포(예를 들어, Sf9세포)를 전사함으로써, rRAAV 패키징에 필요한 기타 요소(예컨대 rep 및 cap 코딩 서열)의 존재 하에서 대상 rRAAV 바이러스 입자를 생성할 수 있다.

여러 벡터는 본 분야에 공지된 것이고, 선형 폴리뉴클레오티드, 이온성 화합물 또는 양친성 화합물에 관련된 폴리뉴클레오티드, 플라스미드 및 바이러스를 포함하나 이에 한정되지 않는다. 따라서, 용어 “벡터”는 자기 복제 플라스미드 또는 바이러스를 포함한다. 상기 용어는 핵산을 세포에 전이하도록 촉진하는 비플라스미드 및 비바이러스 화합물, 예를 들어 폴리라이신 화합물, 리보솜 등을 포함하는 것으로 이해할 수도 있다. 바이러스 벡터의 예시는 아데노 바이러스 벡터, 아데노 관련 바이러스 벡터, 레트로바이러스 벡터 등을 포함하나 이에 한정되지 않는다.

일부 실시 형태에 있어서, RAAV는 플라스미드 또는 백미드로부터 전사된다. 상기 플라스미드 또는 백미드는 관심 유전자 서열을 포함할 수 있다. 일부 실시 형태에 있어서, 프로모터는 관심 유전자와 조작 가능하게 연결되고 관심 유전자의 업스트림에 위치한다. 일부 실시 형태에 있어서, 프로모터는 전사된 RAAV에 존재하지 않는다.

6. AAV 입자 및 AAV 입자의 군체

일부 실시 형태에 있어서, 본 발명은 단리된 rRAAV 바이러스 입자를 제공하고, 상기 바이러스 입자는 본 명세서에 따른 AAV 캡시드 또는 바이러스 입자 중 어느 하나 내에 캡시드화되는 본 발명의 RNA 서열 중의 어느 하나를 포함한다.

일부 실시 형태에 있어서, AAV 캡시드 또는 바이러스 입자는 본 명세서에 따른 혈청형 또는 하나 이상의 혈청형의 조합이다.

본 발명의 rRAAV 벡터 또는 RNA 서열에서, rRAAV 게놈(RNA)은 단일 가닥(ss) 핵산 또는 이중 가닥(ds), 자가 상보적(sc) 핵산일 수 있다.

본 발명의 하나의 관련 양태는 재조합 바이러스 입자(예를 들어, rRAAV 입자)의 군체를 제공하고, 상기 군체는 본 발명의 복수의 재조합 바이러스 입자(예를 들어, rRAAV 입자)를 포함하며, 여기서 상기 군체 내의 재조합 바이러스 입자(예를 들어, rRAAV 입자) 중의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 이상은 본 발명의 캡시드화RNA 서열을 갖는다.

일부 실시 형태에 있어서, rRAAV 입자의 군체는 본 발명의 복수의 rRAAV 바이러스 입자를 포함하고, 여기서 상기 군체 내의 rRAAV 입자의 약 40%, 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 이상은 본 발명의 캡시드화 RNA 서열을 갖는다.

7. 숙주 세포 및 AAV 생산

rAAV 생산의 일반 원리는 본 분야의 공지된 것이다. 이하 총론, 예를 들어, Carter(Current Opinions in Biotechnology [생물 기술 현재 견해], 1533-539, 1992); 및 Muzyczka, Curr. Topics in Microbial, and Immunol [미생물학 및 면역학의 현재 주제] 158:97-129, 1992, 모두 참조로 본 명세서에 포함됨)을 참조한다. 이하 문헌에 각종 방법이 기재되어 있다: Ratschin et al.(Mol. Cell. Biol. [분자 세포 생물학 저널] 4:2072, 1984; Hermonat et al.(Proc. Natl. Acad. Sci. USA [미국 국립 과학 아카데미 의사록] 81:6466, 1984); Tratschin et al.(Mol. Cell. Biol. [분자 세포 생물학 저널] 5:3251, 1985); McLaughlin et al.(J. Virol [바이러스학 저널] 62:1963, 1988); 및 Lebkowski et al.(Mol. Cell. Biol [ 분자세포 생물학 저널] 7:349, 1988), Samulski et al.(J. Virol [바이러스학 저널] 63:3822-3828, 1989); U.S. 5,173,414; WO 95/13365 및 U.S. 5,658,776; WO 95/13392; WO 96/17947; PCT/US98/18600; WO 97/09441; WO 97/08298; WO 97/21825; WO 97/06243; WO 99/11764; Perrin et al.(Vaccine [백신] 13:1244-1250, 1995; Paul et al.(Human Gene Therapy [인간 유전자 요법] 4:609-615, 1993); Clark et al.(Gene Therapy [유전자 요법] 3:1124-1132, 1996; U.S. 5,786,211; U.S. 5,871,982; 및 U.S. 6,258,595.

AAV 벡터 혈청형은 표적 세포 유형과 일치할 수 있다. 예를 들어, WO 2018002719 A1의 표 2에 지정된 AAV 혈청형에 의해 형질도입될 수 있는 예시적 세포 유형이 열거되어 있다(참조로 본 명세서에 포함됨).

패키징 세포는 숙주 세포를 감염시킬 수 있는 바이러스 입자를 형성하는 데 사용된다. 이러한 세포는 HEK293 및 Sf9세포를 포함하고, AAV 및 아데노 바이러스를 패키징하는 데 사용될 수 있다.

통상적으로 핵산 벡터를 바이러스 입자의 생산자 세포계에 패키징하여 유전자 요법에서 사용되는 바이러스 벡터를 생성한다. 벡터는 통상적으로 패키징 및 그 후 숙주 세포(만약 적합하다면)에 통합되는 데 필요한 최소 바이러스 서열을 함유하고, 기타 바이러스 서열은 발현될 단백질이 코딩된 발현 카세트에 의해 대체된다. 결실된 바이러스 기능은 패키징 세포계에서 트랜스 형식으로 제공될 수 있고, 통상적으로 이러한 바이러스 기능/단백질(예컨대 AAV의 rep 및 cap 유전자)가 패키징 세포에 통합되는 전이 유전자 또는 상기 패키징 세포에 도입되는 제2 바이러스 벡터 또는 발현 벡터 상의 전이 유전자로서 발현되는 결과이다.

예를 들어, 유전자 요법에 사용되는 AAV 벡터는 전형적으로 AAV 게놈으로부터 유래된 말단 역반복(ITR) 서열만 가지고, 상기 서열은 숙주 게놈에 패키징 및 통합되는 데 필요한 것이다. 바이러스 DNA를 세포계에 패키징하여, 상기 세포계에 기타 AAV 유전자 즉 rep 및 cap을 코딩하나 ITR 서열이 결핍된 헬퍼 플라스미드를 함유한다. 상기 세포계는 조력자로서의 아데노 바이러스에 의해 감염된다. 헬퍼 바이러스는 AAV 벡터 복제 및 헬퍼 플라스미드에서 유래된 AAV유전자 발현을 촉진한다. 헬퍼 플라스미드는 ITR 서열이 결핍되어 대량으로 패키징되지 않는다. 아데노 바이러스의 오염은 예를 들어 아데노 바이러스가 AAV보다 더욱 민감한 열처리를 통해 감소시킬 수 있다.

일부 실시 형태에 있어서, 삼중 형질감염 방법(미국 특허번호 6,001,650에서 상세하게 설명됨)으로 재조합 AAV를 생상할 수 있다. 전형적으로, AAV 입자에 패키징될 재조합 AAV 벡터(관심 유전자 포함), AAV헬퍼 기능 벡터 및 보조 기능 벡터로 숙주 세포를 형질감염시켜 재조합 AAV를 생성한다. AAV헬퍼 기능 벡터는 “AAV 헬퍼 기능” 서열(예를 들어, rep 및 cap)을 코딩하고, 상기 서열은 트랜스로 작용하여, 생산성 AAV 복제 및 캡시드화에 사용된다. 바람직하게는, AAV헬퍼 기능 벡터는 유효한 AAV 벡터 생산을 지지하나, 임의의 검출 가능한 야생형 AAV비리온(예를 들어, 기능적 rep 및 cap 유전자를 함유하는 AAV비리온)을 생성하지 않는다. 상기 보조 기능 벡터는 AAV가 복제를 진행하는 비AAV유도성 바이러스 및/또는 세포 기능(예를 들어, “부수적 기능”)에 의존하는 뉴클레오티드 서열을 코딩한다. 보조 기능은 AAV 복제에 필요한 기능을 포함하고, AAV 유전자 전사의 활성화 참여, 단계 특이적 AAV mRNA 스플라이싱, AAV DNA 복제, cap 발현 산물 합성 및 AAV 캡시드 조립 부분을 포함하나 이에 한정되지 않는다. 바이러스에 기반하는 보조 기능은 공지의 헬퍼 바이러스의 어느 하나, 예컨대 아데노 바이러스, 헤르페스 바이러스(단순 헤르페스 바이러스-1형 제외) 및 백시니아 바이러스에서 파생될 수 있다.

일부 실시 형태에 있어서, 곤충세포 (예컨대 Sf9세포)에 패키징된 베큘로바이러스 발현 시스템을 이용하여 대상 rRAAV를 생성한다. 예를 들어 WO 2007046703, WO 2007148971, WO 2009014445, WO 2009104964, WO 2013036118, WO 2011112089, WO 2016083560, WO 2015137802 및 WO 2019016349를 참조하고, 모두 참조로 본 명세서에 포함된다.

벡터 역가는 통상적으로 바이러스 게놈/ml(vg/ml)으로 나타낸다. 일부 실시 형태에 있어서, 바이러스 역가는 1 x 10⁹초과, 5 x 10¹⁰초과, 1 x 10¹¹초과, 5 x 10¹¹초과, 1 x 10¹²초과, 5 x 10¹²초과 또는 1 x 10¹³ vg/ml를 초과한다.

8. 관심 유전자(GOI) 또는 관심 RNA 서열(RSI)

본 발명의 rRAAV 바이러스 입자는 임의의 관심 유전자(GOI) 또는 관심 RNA 서열(RSI)을 숙주 세포에 전달하는 데 사용될 수 있고, GOI가 선택된 AAV 바이러스 캡시드 또는 AAV 바이러스 입자 쉘의 패키징 한도 내의 RNA이기만 하면 임의의 목적으로 사용될 수 있으며, 예컨대 대다수 AAV 바이러스 입자의 경우 총길이가 약 4,700개의 뉴클레오티드이고, 일부 대용량 AAV 바이러스 입자(예컨대 AAV5)의 경우 총길이가 약 8,900개의 뉴클레오티드에 달할 수 있다.

일부 실시 형태에 있어서, 대표적인(비한정적인) 관심 RNA 서열(RSI)은 예를 들어, 단백질을 코딩하는 RNA, mRNA, 비코딩RNA(ncRNA), tRNA, 리보솜 RNA(rRNA), 전이-메신저 RNA(tmRNA), 안티센스 올리고뉴클레오티드(ASO), RNA 어댑터, CRISPR-Cas시스템의 RNA 성분(예컨대, 단일 가이드 RNA(또는 sgRNA, 키메릭 RNA, RNA 키메라), CRISPR RNA(crRNA), tracr RNA), 또는 RISC 복합물 또는 RNAi 경로의 RNA 성분(예컨대 shRNA, miRNA 또는 siRNA), 조절 RNA, Piwi 상호 작용RNA(piRNA), 소핵소체 RNA(snoRNA), 긴 비코딩 RNA(lncRNA)(유전자간 lincRNA, 인트론 ncRNA 및 센스/안티센스 lncRNA 포함), long intervening/유전자 간 비코딩 RNA(lincRNA), 인핸서 RNA, bacterial small RNA(sRNA), snRNA, exRNA, scaRNA, Xist 및 HOTAIR 및 그 전구체를 포함한다.

일부 실시 형태에 있어서, 본 발명의 RNA 서열은 단백질 또는 폴리펩티드의 코딩 서열을 포함한다.

일부 실시 형태에 있어서, 단백질 또는 폴리펩티드는 표적 세포, 조직 또는 생물체 중의 결함 단백질을 대체하는 데 사용될 수 있는 야생형 단백질 또는 그 기능 등가물 또는 변이체(예컨대 효소 또는 구조 단백질)이다.

일부 실시 형태에 있어서, 단백질 또는 폴리펩티드는 표적 세포, 조직 또는 생물체 중의 화합물(소분자 화합물 또는 대분자, 예컨대 지질, 지방산, 단백질, 핵산 등)을 길항하는 데 사용될 수 있는 야생형 단백질 또는 그 기능 등가물 또는 변이체(예컨대 효소 또는 구조 단백질)이다.

예를 들어, 일부 실시 형태에 있어서, 본 발명의 RNA 서열은 CRISPR/Cas시스템의 이펙터 효소의 코딩 서열을 포함한다.

일부 실시 형태에 있어서, CRISPR-Cas시스템은 1류 시스템이고, 이펙터 효소는 I, III 또는 IV형 이펙터 효소이다.

일부 실시 형태에 있어서, CRISPR-Cas시스템은 2류 시스템이고, 이펙터 효소는 II, V 또는 VI형 이펙터 효소이다.

예를 들어, 일부 실시 형태에 있어서, 이펙터 효소는 2류 II형 효소이고, 예컨대 Cas9이며, 스트렙토코커스 피오게네스(Streptococcus pyogenes)(SpCas9) 또는 SaCas9(WO 2014/093622(PCT/US 2013/074667 참조), 참조로 포함됨)를 포함한다.

일부 실시 형태에 있어서, Cas 이펙터 효소는 2류 V형 Cas 단백질이고, Cas12a(이전에는 Cpf1으로 칭하고, 예컨대 프란시셀라 노비시다(Francisella novicida)Cas12a), C2c1 및 C2c3을 포함한다.

일부 실시 형태에 있어서, Cas 이펙터 효소는 2류 VI형 Cas 단백질이고, Cas13a(C2c2로도 칭함), Cas13b, Cas13c, Cas13d, Cas13e 및 Cas13f를 포함한다. 이러한 Cas 단백질은 이들의 crRNA를 사용하여 Cas9 및 Cas12a 중의 표적 DNA 서열이 아닌 표적 RNA 서열을 인식한다.

일부 실시 형태에 있어서, Cas 이펙터 효소는 WO 2020/028555에서 설명한 Cas 이펙터 효소 중의 어느 하나(전부 내용은 참조로 본 명세서에 통합)이고, Cas9, Cas12(예를 들어, Cas12a, Cas12b, Cas12c, Cas12d 등), Cas13(예를 들어, Cas13a, Cas13b(예를 들어 Cas13b-t1, Cas13b-t2, Cas13b-t3), Cas13c, Cas13d 등), Cas14, CasX 및 CasY 중의 어느 하나를 포함한다.

일부 실시 형태에 있어서, Cas 이펙터 효소는 DNA 및/또는 RNA염기 편집기, 예컨대 사이토신 또는 아데닌염기 편집기(CBE 또는 ABE)에 융합된다. 일부 실시 형태에 있어서, 염기 편집기는 바람직하게는 DNA 염기를 편집하고 선택적으로 오프-타겟 RNA 염기 편집 능력이 저하되거나 거의 없다. 일부 실시 형태에 있어서, 염기 편집기는 바람직하게는 RNA염기를 편집하고 선택적으로 오프-타겟 DNA염기 편집 능력이 저하되거나 또는 거의 없다. 일부 실시 형태에 있어서, 염기 편집기는 DNA 및 RNA염기 둘 모두를 편집한다.

일부 실시 형태에 있어서, 염기 편집기는 1세대, 2세대(BE2), 3세대(BE3) 또는 4세대(BE4) 염기 편집기이다. 일부 실시 형태에 있어서, 염기 편집기는 이중 염기 편집기이다.

일부 실시 형태에 있어서, 염기 편집기는 RNA 아데노신 디아미나제(ADAR), 예컨대 ADAR1, ADAR2 또는 ADAR2DD(E488Q)를 포함한 ADARDD이다.

상기 임의의 실시 형태에서, 본 발명의 RNA 서열은 가이드 RNA 서열을 더 포함할 수 있고, 상기 가이드 RNA 서열은 코딩된 CRISPR/Cas 이펙터 효소에 로딩되어, 가이드 RNA에 상보적인 표적 폴리뉴클레오티드 서열을 결합하는 데 사용되도록 설계된다. 본 발명의 rRAAV 바이러스 입자가 본 발명의 RNA 서열을 표적 숙주 세포에 전달한 후, 이러한 gRNA 서열은 세포 뉴클레아제에 의해 처리되고 본 발명의 RNA 서열로부터 방출/단리될 수 있다. 예를 들어, gRNA는 본 발명의 RNA 서열의 일부인 pri-miRNA 헤어핀 구조의 짝을 이루지 않는 5’ 또는 3’ 플랭킹 부위 서열에 존재할 수 있고, 상기 pri-miRNA은 Drosha와 같은 세포 효소 처리 후, 초기 pri-miRNA전사체로부터 방출/단리된다.

일부 실시 형태에 있어서, 본 발명의 RNA 서열은 CRISPR/Cas시스템의 이펙터 효소의 코딩 서열을 포함하고, DNA 또는 RNA 염기 편집 효소 또는 도메인의 코딩 서열을 더 포함하여, Cas 이펙터 효소 및 DNA/RNA염기 편집 효소/도메인의 융합물이 RNA 서열에 의해 코딩되도록 한다. 일부 실시 형태에 있어서, Cas 이펙터 효소의 뉴클레아제 활성에 결함이 존재하여, 이에 결합된 가이드 RNA를 통해 표적 폴리뉴클레오티드 서열에 결합될 수 있으나, DNA/RNA 폴리 폴리뉴클레오티드를 절단할 수 없다.

일부 실시 형태에 있어서, 본 발명의 RNA 서열은 CRISPR/Cas시스템 이펙터 효소의 변이체 또는 유도체의 코딩 서열을 포함하고, 여기서 상기 변이체는 야생형 CRISPR/Cas시스템 이펙터 효소의 결실(예컨대 N 및/또는 C 말단결실, 예를 들어, Cas13e 또는 Cas13f의 N 말단이 210개의 잔기 결실을 초과하지 않거나 및/또는 C 말단이 180개의 잔기 결실을 초과하지 않음), 삽입 또는 치환을 포함하나, 상기 야생형 이펙터 효소와 gRNA의 결합 및/또는 표적 폴리뉴클레오티드 절단 능력을 거의 보류한다. 일부 실시 형태에 있어서, 상기 변이체는 표적 폴리뉴클레오티드를 절단하는 활성이 결핍하다.

일부 실시 형태에 있어서, 본 발명의 RNA 서열에 의해 코딩된 상기 RNA염기 편집 도메인은 아데노신 디아미나제, 예컨대 이중 가닥 RNA 특이적 아데노신 디아미나제(예를 들어, ADAR1 또는 ADAR2); 아포지질 단백질 B mRNA 편집 효소; 촉매 폴리펩티드 유사체(catalytic polypeptide-like)(APOBEC); 또는 활성화 유도 시티딘 탈아미노효소(AID)이다.

일부 실시 형태에 있어서, 본 발명의 RNA 서열에 의해 코딩된 상기 RNA염기 편집 도메인은 아데노신 디아미나제 및/또는 시티딘 탈아미노효소, 예컨대 RNA에 작용하는 시티딘 탈아미노효소(CDAR), 예컨대 이중 가닥 RNA 특이적 아데노신 디아미나제(ADAR)(예를 들어, ADAR1 또는 ADAR2), 아포지질단백질 B mRNA 편집효소, 촉매 폴리펩티드 유사체(APOBEC, 예컨대 APOBEC1, APOBEC2, APOBEC3A, APOBEC3B, APOBEC3C, APOBEC3D, APOBEC3E, APOBEC3F, APOBEC3G, APOBEC3H 및 APOBEC4), 활성화 유도 시티딘 탈아미노효소(AID), 시티딘 탈아미노효소1(CDA1) 또는 그 돌연변이체를 포함한다.

일부 실시 형태에 있어서, ADAR은 E488Q/T375G이중 돌연변이 또는 ADAR2DD를 갖는다.

일부 실시 형태에 있어서, 상기 염기 편집 도메인을 MS2와 같은 RNA결합 도메인과 더 융합시킨다.

일부 실시 형태에 있어서, 상기 코딩된 CRISPR/Cas 이펙터 효소의 변이체 또는 유도체는 RNA 메틸트랜스퍼라제, RNA 디메틸라아제, RNA스플라이싱 개질제, 위치화 인자 또는 번역 변형 인자를 더 포함한다.

일부 실시 형태에 있어서, 상기 Cas 이펙터 효소, 상기 변이체/그 유도체 또는 기능적 단편은 핵 위치화 신호(NLS) 서열 또는 핵배출 신호(NES)를 포함한다.

일부 실시 형태에 있어서, 상기 Cas 이펙터 효소, 변이체/그 유도체 또는 그 기능적 단편을 이종 기능적 도메인과 융합시킨다. 일부 실시 형태에 있어서, 상기 이종 기능적 도메인은 핵 위치화 신호(NLS), 리포터 단백질 또는 검출 표지(예를 들어, GST, HRP, CAT, GFP, HcRed, DsRed, CFP, YFP, BFP), 위치화 신호, 단백질 타겟팅 부분, DNA 결합 도메인(예를 들어, MBP, Lex A DBD, Gal4 DBD), 에피토프 태그(예를 들어, His, myc, V5, FLAG, HA, VSV-G, Trx 등), 전사 활성화 도메인(예를 들어, VP64 또는 VPR), 전사 억제 도메인(예를 들어, KRAB 부분 또는 SID 부분), 뉴클레아제(예를 들어, FokI), 탈아미노화 도메인(예를 들어, ADAR1, ADAR2, APOBEC, AID 또는 TAD), 메틸라아제, 디메틸라아제, 전사 방출 인자, HDAC, ssRNA 절단 활성을 갖는 폴리펩티드, dsRNA 절단 활성을 갖는 폴리펩티드, ssDNA 절단 활성을 갖는 폴리펩티드, dsDNA 절단 활성을 갖는 폴리펩티드, DNA 또는 RNA 연결 효소 또는 그 임의의 조합을 포함한다. 일부 실시 형태에 있어서, 상기 이종 기능적 도메인을 상기 융합 단백질의 N-말단, C-말단 또는 내부에서 융합시킨다.

일부 실시 형태에 있어서, 본 발명의 RNA 서열은 CasPR(제1 류 전구체crRNA 처리를 위한 CRISPR 관련 단백질) 융합 단백질의 코딩 서열, 상기 융합 단백질은 이종 기능적 도메인에 융합된 CasPR(또는 그 상동체, 동원체, 이원체, 변이체, 유도체 또는 기능적 단편); 또는 그 기능적 변이체를 포함한다.

일부 실시 형태에 있어서, CasPR은 Cas5d, Cas6 또는 Csf5이다.

일부 실시 형태에 있어서, CasPR은 MtCas6(I-A)(서열 1), MmCas6(I-B)(서열 2), SpCas5d(I-C1)(서열 3), BhCas5d(I-C2)(서열 4), SaCas6 (I-D)(서열 5), EcCas6e(I-E)(서열6), PaCas6f(I-F)(서열7), MtCas6(III-A)(서열8), PfCas6(III-B)(서열9), PaCsf5(IV-A1)(서열 10) 또는 MtCsf5(IV-A2)(서열 11)이다. 모든서열을 참조로서 본 명세서에 포함된다.

MPLIFKIGYNVIPLQDVILPTPSSKVLKYLIQSGKLIPSLKDLITSRDKYKPIFISHLGFNQRRIFQT NGNLKTITKGSRLSSIIAFSTQANVLSEVADEGIFETVYGKFHIMIESIEIVEVEKLKEEVEKHMNDN IRVRFVSPTLLSSKVLLPPSLSERYKKIHAGYSTLPSVGLIVAYAYNVYCNLIGKKEVEVRAFKFGIL SNALSRIIGYDLHPVTVAIGEDSKGNLRKARGVMGWIEFDIPDERLKRRALNYLLTSSYLGIGRSRGI GFGEIRLEFRKIEEKEG (서열 1)

MDLEYMHISYPNILLNMRDGSKLRGYFAKKYIDEEIVHNHRDNAFVYKYPQIQFKIIDRSPLIIGIGS LGINFLESKRIFFEKELIISNDTNDITEVNVHKDMDHFGTTDKILKYQFKTPWMALNAKNSEIYKNSD EIDREEFLKRVLIGNILSMSKSLGYTIEEKLKVKINLKEVPVKFKNQNMVGFRGEFYINFDIPQYLGI GRNVSRGFGTVVKV (서열 2)

MYRSRDFYVRVSGQRALFTNPATKGGSERSSYSVPTRQALNGIVDAIYYKPTFTNIVTEVKVINQIQT ELQGVRALLHDYSADLSYVSYLSDVVYLIKFHFVWNEDRKDLNSDRLPAKHEAIMERSIRKGGRRDVF LGTRECLGLLDDISQEEYETTVSYYNGVNIDLGIMFHSFAYPKDKKTPLKSYFTKTVMKNGVITFKAQ SECDIVNTLSSYAFKAPEEIKSVNDECMEYDAMEKGEN (서열 3)

MRNEVQFELFGDYALFTDPLTKIGGEKLSYSVPTYQALKGIAESIYWKPTIVFVIDELRVMKPIQMES KGVRPIEYGGGNTLAHYTYLKDVHYQVKAHFEFNLHRPDLAFDRNEGKHYSILQRSLKAGGRRDIFLG ARECQGYVAPCEFGSGDGFYDGQGKYHLGTMVHGFNYPDETGQHQLDVRLWSAVMENGYIQFPRPEDC PIVRPVKEMEPKIFNPDNVQSAEQLLHDLGGE (서열 4)

MPNDPYSLYSIVIELGAAEKGFPTGILGRSLHSQVLQWFKQDNPFLATELHQSQISPFSISPLMGKRH AKLTKAGDRLFFRICLLRGDLLQPLLNGIEQTVNQSVCLDKFRFRLCQTHILPGSHPLAGASHYSLIS QTPVSSKITLDFKSSTSFKVDRKIIQVFPLGEHVFNSLLRRWNNFAPEDLHFSQVDWSIPIAAFDVKT IPIHLKKVEIGAQGWVTYIFPNTEQAKIASVLSEFAFFSGVGRKTTMGMGQVQVRS (서열 5)

MYLSKVIIARAWSRDLYQLHQGLWHLFPNRPDAARDFLFHVEKRNTPEGCHVLLQSAQMPVSTAVATV IKTKQVEFQLQVGVPLYFRLRANPIKTILDNQKRLDSKGNIKRCRVPLIKEAEQIAWLQRKLGNAARV EDVHPISERPQYFSGDGKSGKIQTVCFEGVLTINDAPALIDLVQQGIGPAKSMGCGLLSLAPL (서열 6)

MDHYLDIRLRPDPEFPPAQLMSVLFGKLHQALVAQGGDRIGVSFPDLDESRSRLGERLRIHASADDLR ALLARPWLEGLRDHLQFGEPAVVPHPTPYRQVSRVQAKSNPERLRRRLMRRHDLSEEEARKRIPDTVA RALDLPFVTLRSQSTGQHFRLFIRHGPLQVTAEEGGFTCYGLSKGGFVPWF (서열 7)

MAARRGGIRRTDLLRRSGQPRGRHRASAAESGLTWISPTLILVGFSHRGDRRMTEHLSRLTLTLEVDA PLERARVATLGPHLHGVLMESIPADYVQTLHTVPVNPYSQYALARSTTSLEWKISTLTNEARQQIVGP INDAAFAGFRLRASGIATQVTSRSLEQNPLSQFARIFYARPETRKFRVEFLTPTAFKQSGEYVFWPDP RLVFQSLAQKYGAIVDGEEPDPGLIAEFGQSVRLSAFRVASAPFAVGAARVPGFTGSATFTVRGVDTF ASYIAALLWFGEFSGCGIKASMGMGAIRVQPLAPREKCVPKP (서열 8)

MRFLIRLVPEDKDRAFKVPYNHQYYLQGLIYNAIKSSNPKLATYLHEVKGPKLFTYSLFMAEKREHPK GLPYFLGYKKGFFYFSTCVPEIAEALVNGLLMNPEVRLWDERFYLHEIKVLREPKKFNGSTFVTLSPI AVTVVRKGKSYDVPPMEKEFYSIIKDDLQDKYVMAYGDKPPSEFEMEVLIAKPKRFRIKPGIYQTAWH LVFRAYGNDDLLKVGYEVGFGEKNSLGFGMVKVEGNKTTKEAEEQEKITFNSREELKTGV (서열 9)

MFVTQVIFNIGERTYPDRARAMVAELMDGVQPGLVATLMNYIPGTSTSRTEFPTVQFGGASDGFCLLG FGDGGGAIVRDAVPLIHAALARRMPDRIIQVEHKEHSLSAEARPYVLSYTVPRMVVQKKQRHAERLLH EAEGKAHLEGLFLRSLQRQAAAVGLPLPENLEVEFKGAVGDFAAKHNPNSKVAYRGLRGAVFDVNARL GGIWTAGFMLSKGYGQFNATHQLSGAVNALSE (서열 10)

MHQTLIRINWPKGFKCPPAEFREKLAKSEMFPPEFFHYGTELAVWDKQTAEVEGKIKTVSKEKIIKTF DKPIPLNGRAPVRVIGGQAWAGVIADPEMEGMLIPHLGSILKVASSAAGCAVKIELEQRKFGISYTEY PVKYNLRELVLKRRCEDARSTDIESLIADRIWGGVSGESYYGIDGTCAKFGFEPPSREQLELRIFPMK NIGLHMKSSDGLSKEYMSLIDAEVWMNAKLEGVWQVGNLISRGYGRFIKSIGAQS (서열 11)

서열 12：GATAATCTCTTATAGAATTGAAAG

서열 13：CTAAAAGAATAACTTGCAAAATAACAAGCATTGAAAC

서열 14：GTCTCACCCTTCATGGGTGAGTGGATTGAAAT

서열 15：GTCGCACTCTTCATGGGTGCGTGGATTGAAAT

서열 16：GTTTCAGTCCCGTAGTCGGGATTTAGTGGTTGGAAAG

서열 17：GAGTTCCCCGCGCCAGCGGGGATAAACCG

서열 18：GTTCACTGCCGTATAGGCAGCTAAGAAA

서열 19：GTCGTCAGACCCAAAACCCCGAGAGGGGACGGAAAC

서열 20：GTTACAATAAGACTAAAATAGAATTGAAAG

서열 21：GTATTTCCCGCGTGCGCGGGGGTGAGCGG

서열 22：TATTGGATACACCCACTCATTGGTGGGTGGTTAGAAC

서열 23：GAUAAUCUCUUAUAGAAUUGAAAG

서열 24：CUAAAAGAAUAACUUGCAAAAUAACAAGCAUUGAAAC

서열 25：GUCUCACCCUUCAUGGGUGAGUGGAUUGAAAU

서열 26：GUCGCACUCUUCAUGGGUGCGUGGAUUGAAAU

서열 27：GUUUCAGUCCCGUAGUCGGGAUUUAGUGGUUGGAAAG

서열 28：GAGUUCCCCGCGCCAGCGGGGAUAAACCG

서열 29：GUUCACUGCCGUAUAGGCAGCUAAGAAA

서열 30：GUCGUCAGACCCAAAACCCCGAGAGGGGACGGAAAC

서열 31：GUUACAAUAAGACUAAAAUAGAAUUGAAAG

서열 32：GUAUUUCCCGCGUGCGCGGGGGUGAGCGG

서열 33：UAUUGGAUACACCCACUCAUUGGUGGGUGGUUAGAAC

일부 실시 형태에 있어서, CasPR에 융합된 상기 이종 기능적 도메인은 핵 위치화 신호(NLS), 리포터 단백질 또는 검출 표지(예를 들어, GST, HRP, CAT, GFP, HcRed, DsRed, CFP, YFP, BFP), 위치화 신호, 단백질 타겟팅 부분, DNA결합 도메인(예를 들어, MBP, Lex A DBD, Gal4 DBD), 에피토프 태그(예를 들어, His, myc, V5, FLAG, HA, VSV-G, Trx 등), 전사 활성화 도메인(예를 들어, VP64 또는 VPR), 전사 억제 도메인(예를 들어, KRAB 부분 또는 SID 부분), 뉴클레아제(예를 들어, FokI), 탈아미노화 도메인(예를 들어, ADAR1, ADAR2, APOBEC, AID 또는 TAD), 메틸라아제, 디메틸라아제, 전사 방출 인자, HDAC, ssRNA절단 활성을 갖는 폴리펩티드, dsRNA절단 활성을 갖는 폴리펩티드, ssDNA절단 활성을 갖는 폴리펩티드, dsDNA절단 활성을 갖는 폴리펩티드, DNA 또는 RNA 연결 효소 또는 그 임의의 조합을 포함한다. 일부 실시 형태에 있어서, 이종 기능적 도메인은 RNA염기 편집기를 포함한다. 일부 실시 형태에 있어서, 상기 RNA염기 편집기는 A→G 단일 염기 변화를 편집한다. 일부 실시 형태에 있어서, 상기 RNA염기 편집기는 C→U 단일 염기 변화를 편집한다. 일부 실시 형태에 있어서, 상기 RNA염기 편집기는 ADAR2DD 또는 그 유도체를 포함한다. 일부 실시 형태에 있어서, ADAR2DD 유도체는 E488Q/T375A 이중 돌연변이를 포함한다.

일부 실시 형태에 있어서, 융합 단백질은 서열 45-55 중 어느 하나의 아미노산 서열을 갖는다.

MTCAS6(I-A):

ATGCCCAAGAAGAAGCGGAAGGTGATGCCTCTGATCTTCAAGATCGGCTATAACGTGATCCCCCTGCAGGACGTGATCCTGCCCACCCCTTCCAGCAAGGTGCTGAAGTACCTGATCCAGAGCGGCAAGCTGATCCCCAGCCTGAAGGACCTGATCACCAGCCGGGACAAGTACAAGCCAATCTTCATCTCCCACCTGGGCTTCAACCAGCGGAGGATTTTCCAGACCAACGGCAATCTGAAAACCATCACCAAGGGCAGTAGACTGAGCTCCATCATCGCCTTCAGCACCCAGGCCAACGTGCTGTCCGAGGTGGCCGATGAAGGGATCTTCGAAACCGTGTACGGAAAGTTCCACATCATGATCGAAAGCATCGAGATCGTGGAGGTGGAAAAGCTGAAGGAGGAGGTGGAGAAGCACATGAACGACAACATCAGAGTGAGATTCGTGTCTCCCACACTGCTGAGCTCCAAGGTGCTGCTGCCCCCCAGCCTGTCCGAAAGATACAAGAAGATCCACGCCGGGTACAGCACCCTGCCCAGCGTGGGCCTGATCGTGGCCTACGCCTACAACGTGTACTGCAATCTGATCGGCAAGAAGGAAGTGGAAGTGCGGGCCTTCAAGTTTGGAATCCTGAGCAACGCCCTGTCCAGAATCATCGGCTACGACCTGCACCCTGTGACCGTGGCCATCGGCGAGGACAGCAAGGGGAATCTGAGAAAGGCTCGGGGCGTGATGGGCTGGATCGAGTTCGACATCCCCGACGAAAGACTGAAGCGGCGGGCCCTGAACTATCTGCTGACCAGCAGCTACCTGGGCATCGGGAGATCTCGGGGCATCGGCTTCGGCGAGATCCGGCTGGAGTTCCGGAAGATTGAAGAGAAGGAGGGACCCAAGAAGAAGCGGAAGGTGGGTGGAGGCGGAGGTTCTGGGGGAGGAGGTAGTGGCGGTGGTGGTTCAGGAGGCGGCGGAAGCCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGAGCAAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGTAA (서열 45)

MMCAS6 (I-B):

ATGCCCAAGAAGAAGCGGAAGGTGATGGACCTGGAGTACATGCACATCTCCTACCCTAACATCCTGCTGAACATGCGGGACGGCAGCAAGCTGCGGGGCTACTTCGCCAAGAAGTACATCGACGAAGAGATTGTGCACAACCACAGAGACAACGCCTTTGTGTACAAGTACCCCCAGATCCAGTTTAAGATCATCGATAGAAGCCCCCTGATCATCGGCATTGGCTCTCTGGGCATCAATTTCCTGGAGAGCAAGCGGATCTTCTTCGAGAAGGAACTGATTATCAGCAACGACACCAACGACATCACCGAGGTGAACGTGCACAAGGACATGGATCACTTCGGCACGACCGACAAGATCCTGAAGTACCAGTTCAAGACCCCTTGGATGGCACTGAACGCCAAGAATAGCGAGATCTACAAGAACTCTGACGAGATCGACCGGGAGGAGTTCCTGAAGAGAGTGCTGATTGGGAATATCCTGAGCATGTCTAAGAGCCTGGGCTATACCATCGAAGAAAAGCTGAAGGTGAAGATTAACCTGAAGGAAGTGCCCGTGAAGTTCAAGAACCAGAACATGGTGGGCTTTCGGGGCGAGTTCTACATCAACTTCGACATCCCTCAGTATCTGGGCATCGGCCGGAATGTGTCCCGGGGATTCGGCACAGTGGTGAAGGTGCCCAAGAAGAAGCGGAAGGTGGGTGGAGGCGGAGGTTCTGGGGGAGGAGGTAGTGGCGGTGGTGGTTCAGGAGGCGGCGGAAGCCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGAGCAAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGTAA (서열 46)

SPCAS5D (I-C1):

ATGCCCAAGAAGAAGCGGAAGGTGATGAGAAATGAAGTGCAGTTCGAGCTGTTCGGCGACTACGCCCTGTTCACCGACCCCCTGACCAAGATCGGCGGCGAAAAGCTGAGCTACAGCGTGCCTACCTACCAGGCCCTGAAGGGCATCGCCGAGAGCATCTACTGGAAGCCCACCATCGTGTTCGTGATCGACGAACTGCGGGTCATGAAGCCCATTCAGATGGAGTCTAAGGGCGTGAGGCCCATCGAGTACGGCGGCGGCAACACCCTGGCCCACTACACCTACCTGAAGGATGTGCACTACCAGGTGAAGGCCCACTTCGAGTTCAACCTGCACCGGCCCGACCTGGCCTTCGATAGAAACGAGGGCAAGCACTACTCCATCCTGCAGAGAAGCCTGAAGGCCGGCGGCAGAAGAGATATTTTCCTGGGCGCCCGGGAGTGCCAGGGCTACGTGGCCCCCTGCGAGTTCGGCAGCGGCGACGGCTTCTACGACGGCCAGGGCAAGTACCACCTGGGAACCATGGTGCACGGTTTCAACTACCCCGACGAAACCGGACAGCACCAGCTGGATGTGAGACTGTGGTCTGCCGTCATGGAAAACGGCTACATCCAGTTCCCCCGCCCTGAGGACTGCCCCATCGTGCGGCCTGTGAAGGAGATGGAACCCAAGATCTTCAACCCCGACAACGTGCAGTCCGCCGAACAGCTGCTGCACGACCTGGGCGGCGAACCCAAGAAGAAGCGGAAGGTGGGTGGAGGCGGAGGTTCTGGGGGAGGAGGTAGTGGCGGTGGTGGTTCAGGAGGCGGCGGAAGCCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGAGCAAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGTAA (서열 47)

BHCAS5D (I-C2):

ATGCCCAAGAAGAAGCGGAAGGTGATGTACAGAAGCCGGGACTTCTACGTGAGAGTGTCCGGCCAGCGGGCCCTGTTCACCAACCCCGCCACCAAGGGCGGCTCCGAACGGAGCTCCTACTCCGTGCCTACCCGGCAGGCCCTGAACGGGATTGTGGACGCCATCTACTACAAGCCCACGTTCACCAACATCGTGACCGAGGTGAAGGTGATTAACCAGATCCAGACCGAACTGCAGGGCGTGCGGGCCCTGCTGCATGACTACAGCGCCGACCTGAGCTACGTGTCCTACCTGAGCGACGTGGTGTACCTGATTAAGTTTCATTTCGTGTGGAACGAGGATAGAAAGGACCTGAATAGCGACCGGCTGCCAGCCAAGCATGAGGCCATCATGGAGCGGTCTATCCGGAAGGGCGGCAGACGGGACGTGTTCCTGGGCACCAGAGAATGCCTGGGCCTGCTGGACGACATCAGCCAGGAAGAATACGAAACCACAGTGAGCTATTACAATGGGGTGAACATCGACCTGGGCATCATGTTCCACAGCTTCGCTTACCCCAAGGACAAGAAAACCCCCCTGAAGTCCTACTTCACAAAGACCGTGATGAAGAACGGCGTGATCACCTTCAAGGCCCAGTCCGAATGCGATATTGTGAACACCCTGAGCTCCTACGCCTTCAAGGCCCCCGAGGAGATCAAGAGCGTGAACGACGAGTGCATGGAGTACGACGCCATGGAGAAGGGCGAAAACCCCAAGAAGAAGCGGAAGGTGGGTGGAGGCGGAGGTTCTGGGGGAGGAGGTAGTGGCGGTGGTGGTTCAGGAGGCGGCGGAAGCCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGAGCAAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGTAA (서열 48)

SACAS6 (I-D):

ATGCCCAAGAAGAAGCGGAAGGTGATGCCCAACGATCCCTACAGCCTGTACTCCATCGTGATCGAACTGGGCGCCGCCGAAAAGGGATTCCCCACAGGCATCCTGGGCAGAAGCCTGCATAGCCAGGTGCTGCAGTGGTTCAAGCAGGATAACCCCTTCCTGGCCACCGAGCTGCACCAGAGCCAGATCTCCCCCTTCTCCATCTCTCCACTGATGGGCAAGCGGCACGCCAAGCTGACCAAGGCCGGCGACCGGCTGTTCTTTCGGATCTGCCTGCTGAGAGGAGATCTGCTGCAGCCCCTGCTGAACGGCATTGAGCAGACCGTGAACCAGAGCGTGTGCCTGGACAAGTTCCGGTTCCGGCTGTGCCAGACCCACATCCTGCCCGGCAGCCACCCTCTGGCTGGCGCCTCCCACTATAGCCTGATCAGCCAGACCCCAGTGAGCTCCAAGATTACCCTGGACTTCAAGAGTTCTACCTCCTTCAAGGTGGACCGGAAGATCATCCAAGTGTTCCCTCTGGGCGAACACGTGTTCAACAGCCTGCTCAGACGCTGGAATAACTTCGCCCCCGAGGACCTGCACTTCTCTCAGGTGGACTGGAGCATCCCCATCGCCGCATTCGACGTGAAAACCATCCCCATCCACCTGAAGAAGGTCGAGATCGGCGCACAGGGCTGGGTGACCTACATCTTCCCCAACACAGAACAGGCCAAGATCGCCTCCGTGCTGAGCGAATTCGCCTTCTTCAGCGGAGTGGGACGGAAAACCACCATGGGCATGGGCCAGGTGCAGGTGCGGTCCCCCAAGAAGAAGCGGAAGGTGGGTGGAGGCGGAGGTTCTGGGGGAGGAGGTAGTGGCGGTGGTGGTTCAGGAGGCGGCGGAAGCCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGAGCAAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGTAA (서열 49)

ECCAS6E (I-E):

ATGCCTAAGAAGAAGCGGAAGGTGTACCTGAGCAAGGTGATCATCGCCAGAGCCTGGAGCAGAGACCTGTACCAGCTGCACCAGGGCCTGTGGCACCTGTTCCCCAACCGGCCCGACGCCGCCCGGGATTTCCTGTTCCACGTGGAGAAGAGAAACACCCCGGAAGGCTGCCACGTGCTGCTGCAGAGCGCACAGATGCCTGTGAGCACCGCCGTGGCCACCGTGATCAAGACCAAGCAGGTGGAGTTCCAGCTGCAGGTGGGCGTGCCCCTGTATTTCAGGCTGCGGGCGAATCCCATCAAGACCATCCTGGACAACCAGAAGCGGCTGGACAGCAAGGGCAACATCAAGAGGTGCAGAGTGCCTCTGATCAAGGAGGCCGAACAGATCGCCTGGCTGCAGCGGAAGCTGGGCAATGCCGCCAGAGTGGAGGACGTGCACCCCATCAGCGAGCGGCCCCAGTACTTCTCCGGCGACGGAAAGAGCGGAAAGATCCAGACCGTGTGCTTCGAGGGCGTGCTGACCATCAACGACGCACCCGCCCTGATCGACCTCGTGCAGCAGGGGATCGGCCCTGCCAAGTCCATGGGCTGCGGACTGCTGTCCCTGGCCCCCCTGCCCAAGAAGAAGCGGAAGGTGGGTGGAGGCGGAGGTTCTGGGGGAGGAGGTAGTGGCGGTGGTGGTTCAGGAGGCGGCGGAAGCCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGAGCAAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGTAA (서열 50)

PACAS6F (I-F):

ATGCCTAAGAAGAAGAGAAAGGTGGACCACTACCTGGACATTAGACTGCGCCCTGACCCAGAGTTCCCTCCTGCCCAGCTGATGTCTGTGCTGTTTGGCAAGCTGCACCAGGCCCTGGTGGCCCAGGGCGGTGACAGAATCGGAGTGTCTTTCCCTGATCTGGACGAATCTAGATCTAGACTGGGAGAGAGACTGAGAATCCACGCGTCTGCCGACGACCTGAGAGCTCTGCTGGCCAGACCATGGCTGGAAGGACTGCGCGACCACCTGCAGTTCGGTGAACCTGCCGTGGTGCCTCACCCAACTCCATACAGACAGGTGAGTAGAGTGCAGGCAAAGTCTAATCCAGAGAGACTGAGACGCAGACTGATGAGAAGGCATGACCTGTCCGAAGAAGAAGCCAGAAAGAGAATCCCAGACACAGTGGCCAGAGCCCTGGATCTGCCTTTTGTGACCCTGAGAAGCCAGTCTACCGGCCAGCACTTCAGACTGTTTATTCGCCACGGACCACTGCAGGTGACCGCCGAAGAGGGAGGTTTTACCTGCTACGGACTGAGCAAGGGAGGTTTCGTGCCTTGGTTCCCCAAGAAGAAGCGGAAGGTGGGTGGAGGCGGAGGTTCTGGGGGAGGAGGTAGTGGCGGTGGTGGTTCAGGAGGCGGCGGAAGCCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGAGCAAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGTAA (서열 51)

MTCAS6 (III-A):

ATGCCCAAGAAGAAGCGGAAGGTGATGGCCGCCAGAAGAGGCGGAATCCGGAGAACCGACCTGCTGCGGAGGTCTGGCCAGCCTCGGGGCAGACACCGGGCCTCCGCCGCCGAGAGCGGCCTGACATGGATCTCCCCTACCCTGATCCTGGTGGGCTTCAGCCACAGGGGCGATAGGAGAATGACCGAGCACCTGTCCAGACTGACCCTGACCCTGGAAGTGGATGCCCCCCTGGAGAGAGCCCGGGTGGCCACCCTGGGCCCCCACCTGCATGGCGTGCTGATGGAGTCTATCCCCGCCGACTACGTGCAGACACTGCACACAGTGCCGGTGAACCCTTACAGCCAGTACGCTCTGGCCCGGAGCACCACCAGCCTGGAGTGGAAGATCTCCACCCTGACAAATGAGGCCCGGCAGCAGATCGTCGGCCCCATCAACGACGCCGCCTTCGCCGGCTTCCGGCTGCGGGCCAGCGGCATCGCCACCCAGGTGACAAGCAGAAGCCTGGAGCAGAACCCCCTGTCCCAGTTTGCCAGAATCTTCTACGCCAGGCCCGAAACCCGCAAGTTCAGAGTGGAGTTCCTGACCCCCACCGCCTTCAAGCAGAGCGGCGAGTACGTGTTTTGGCCCGATCCCAGACTGGTGTTCCAGTCCCTGGCCCAGAAGTACGGCGCCATCGTGGACGGAGAAGAGCCCGACCCCGGCCTGATCGCCGAGTTTGGCCAGTCCGTGAGACTGAGCGCCTTCAGAGTGGCCAGCGCCCCTTTTGCCGTGGGCGCCGCCAGGGTGCCCGGATTCACCGGCAGCGCCACCTTCACCGTGCGGGGAGTGGACACCTTCGCCAGCTACATCGCCGCTCTGCTGTGGTTCGGCGAGTTCAGCGGATGCGGCATCAAGGCCTCCATGGGAATGGGCGCCATCCGGGTGCAGCCTCTGGCCCCCCGGGAGAAGTGCGTGCCCAAGCCCCCCAAGAAGAAGCGGAAGGTGGGTGGAGGCGGAGGTTCTGGGGGAGGAGGTAGTGGCGGTGGTGGTTCAGGAGGCGGCGGAAGCCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGAGCAAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGTAA (서열 52)

PFCAS6 (III-B):

ATGCCCAAGAAGAAGCGGAAGGTGATGAGATTCCTGATCAGACTGGTGCCCGAGGACAAGGACAGAGCCTTCAAGGTGCCTTACAACCACCAGTACTATCTGCAGGGCCTGATCTACAACGCCATCAAGTCCTCCAACCCCAAGCTGGCCACCTACCTGCACGAGGTGAAGGGCCCCAAGCTGTTCACCTACAGCCTGTTCATGGCCGAAAAGCGGGAGCACCCTAAGGGCCTGCCCTACTTTCTGGGCTACAAGAAGGGCTTCTTCTACTTCAGCACCTGCGTGCCCGAGATCGCCGAGGCCCTGGTGAACGGCCTGCTGATGAATCCCGAGGTGCGGCTGTGGGACGAGAGATTCTACCTGCACGAAATCAAGGTCCTGCGGGAGCCCAAGAAGTTCAACGGCAGCACCTTCGTGACCCTGAGCCCCATCGCCGTGACCGTGGTGAGAAAGGGCAAGTCCTACGACGTGCCCCCCATGGAAAAGGAGTTCTACAGCATTATCAAGGATGACCTGCAGGACAAGTACGTGATGGCCTACGGCGACAAGCCCCCCAGTGAGTTCGAGATGGAAGTGCTGATCGCCAAGCCCAAGCGGTTCCGGATCAAGCCCGGCATCTATCAGACCGCCTGGCACCTGGTGTTTCGGGCCTACGGCAATGACGACCTGCTGAAGGTGGGCTACGAAGTGGGATTCGGGGAGAAGAACTCCCTGGGATTCGGAATGGTCAAGGTGGAGGGCAACAAGACCACCAAGGAAGCCGAAGAACAGGAGAAGATCACCTTCAACTCCCGGGAAGAGCTGAAAACAGGCGTGCCCAAGAAGAAGCGGAAGGTGGGTGGAGGCGGAGGTTCTGGGGGAGGAGGTAGTGGCGGTGGTGGTTCAGGAGGCGGCGGAAGCCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGAGCAAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGTAA (서열 53)

PACSF5 (IV-A1):

ATGCCTAAGAAGAAGCGGAAGGTGTTCGTGACCCAGGTGATCTTCAACATCGGCGAACGGACGTACCCCGACAGGGCTCGGGCTATGGTGGCCGAGCTGATGGATGGCGTCCAGCCTGGCCTGGTGGCCACCCTGATGAACTACATCCCCGGCACCAGCACGAGCCGGACAGAGTTCCCCACCGTGCAGTTCGGCGGCGCCAGCGACGGCTTTTGCCTGCTGGGCTTCGGCGACGGCGGCGGCGCCATCGTGAGAGATGCCGTGCCCCTGATCCACGCCGCCCTGGCAAGGCGGATGCCTGATCGGATCATCCAGGTGGAACACAAGGAGCACAGCCTGTCCGCCGAGGCCCGGCCCTACGTGCTGAGCTACACCGTGCCTCGGATGGTGGTGCAGAAGAAGCAGCGGCACGCCGAGAGACTGCTGCACGAAGCCGAGGGAAAGGCTCACCTGGAGGGCCTGTTCCTGCGGAGCCTGCAGAGGCAGGCCGCCGCCGTGGGCCTGCCCCTGCCCGAGAACCTGGAGGTGGAGTTCAAGGGAGCCGTGGGCGACTTCGCCGCAAAGCACAATCCAAATAGCAAGGTGGCCTACCGGGGACTGAGAGGCGCCGTGTTCGATGTGAACGCCAGACTGGGCGGCATCTGGACCGCCGGATTCATGCTGAGCAAGGGCTACGGCCAGTTTAACGCCACCCACCAGCTGAGCGGCGCCGTGAACGCTCTGTCCGAACCCAAGAAGAAGCGGAAGGTGGGTGGAGGCGGAGGTTCTGGGGGAGGAGGTAGTGGCGGTGGTGGTTCAGGAGGCGGCGGAAGCCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGAGCAAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGTAA(서열 54)

MTCSF5 (IV-A2):

ATGCCCAAGAAGAAGAGAAAGGTGCACCAGACCCTGATCCGGATCAACTGGCCCAAGGGATTCAAGTGCCCCCCTGCCGAGTTCCGGGAAAAGCTGGCCAAGAGCGAGATGTTCCCCCCCGAGTTCTTCCACTACGGCACGGAACTGGCCGTGTGGGACAAGCAGACCGCCGAGGTGGAGGGCAAGATCAAGACCGTGTCCAAGGAGAAGATCATCAAGACCTTTGACAAGCCCATCCCCCTGAATGGCCGGGCCCCGGTCAGAGTGATCGGCGGCCAGGCCTGGGCCGGCGTGATCGCCGACCCCGAGATGGAGGGCATGCTGATCCCACACCTGGGGAGCATCCTGAAGGTGGCCAGCAGCGCGGCCGGATGCGCAGTGAAGATCGAACTGGAACAGAGAAAGTTCGGCATCAGCTACACCGAGTACCCCGTGAAGTACAACCTGCGGGAGCTGGTGCTGAAGAGAAGATGCGAGGACGCCCGGTCTACCGATATCGAGAGCCTGATTGCCGATAGAATCTGGGGCGGCGTGTCCGGCGAGAGCTACTATGGCATCGACGGCACATGCGCCAAGTTTGGCTTCGAACCCCCCAGCAGAGAGCAGCTGGAGCTGCGGATCTTCCCCATGAAGAACATCGGACTGCACATGAAGTCCAGCGACGGACTGTCCAAGGAGTACATGAGCCTGATTGACGCCGAGGTGTGGATGAACGCTAAGCTGGAAGGAGTGTGGCAGGTGGGCAACCTGATCAGCAGGGGCTACGGCCGGTTCATCAAGTCTATCGGCGCCCAGTCCCCCAAGAAGAAGCGGAAGGTGGGTGGAGGCGGAGGTTCTGGGGGAGGAGGTAGTGGCGGTGGTGGTTCAGGAGGCGGCGGAAGCCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGAGCAAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGTAA (서열 55)

일부 실시 형태에 있어서, 상기 이종 기능적 도메인을 상기 융합 단백질의 N-말단, C-말단 또는 내부에서 융합시킨다.

일부 실시 형태에 있어서, CasPR 융합물의 기능적 변이체는 단백질을 포함하고, 상기 단백질은, (1) 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 아미노산 치환, 추가 또는 결실을 제외한 서열 1-11 중의 어느 하나의 아미노산 서열(여기서 상기 단백질은 서열 1-11 중의 하나와 1류 I, III 또는 IV형 CRISPR시스템의 직접 반복 서열(예를 들어, 서열 12-33 중의 어느 하나)과 결합하는 능력을 유지함); 또는 (2) 서열 1-11 중의 어느 하나와 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 아미노산 서열(여기서 상기 단백질은 서열 1-11의 CasPR 중의 하나가 1류 I, III 또는 IV형 CRISPR시스템의 직접 반복 서열(예를 들어, 서열 12-33 중의 어느 하나)과 결합하는 능력을 유지함);을 갖고, 선택적으로, 조건은 상기 단백질은 서열 1-11 중의 어느 하나가 아닌 것이다. 모든서열을 참조로서 본 명세서에 포함된다.

일부 실시 형태에 있어서, 본 발명의 RNA 서열은 표적 RNA와 혼성화할 수 있는 가이드 서열을 포함하는 CasPR 가이드 RNA 및 상기 가이드 서열 3’(또는 5’)의 직접 반복(DR) 서열을 더 코딩한다. 일부 실시 형태에 있어서, 상기 DR 서열은 서열 12-33 중의 어느 하나의 2차 구조와 거의 동일한 2차 구조를 가진다. 일부 실시 형태에 있어서, 상기 DR 서열은 서열 12-33 중의 어느 하나 또는 동종 야생형 CasPR에 결합하는 그 기능 부분에 의해 코딩된다. 일부 실시 형태에 있어서, 상기 표적 RNA는 진핵 DNA에 의해 코딩된다. 일부 실시 형태에 있어서, 상기 진핵 DNA는 비인간 포유동물 DNA, 비인간 영장류 동물 DNA, 인간 DNA, 식물 DNA, 곤충 DNA, 조류 DNA, 파충류 DNA, 설치류 DNA, 어류 DNA, 연충/선충 DNA, 효모 DNA이다. 일부 실시 형태에 있어서, 상기 표적 RNA는 mRNA이다.

일부 실시 형태에 있어서, 상기 CasPR가이드 서열은 15-120개의 뉴클레오티드 사이, 20-100개의 뉴클레오티드 사이, 25-80개의 뉴클레오티드 사이, 15-55개의 뉴클레오티드 사이, 25-35개의 뉴클레오티드 사이 또는 약 30개의 뉴클레오티드에 존재한다.

일부 실시 형태에 있어서, 상기 CasPR가이드 서열은 상기 표적 RNA와 90%-100% 상보적이다. 일부 실시 형태에 있어서, 상기 CasPR가이드 RNA는 CasPR이 이전 crRNA전사체를 가공하여 생성되고, 여기서 상기 전구체crRNA는 2개 이상의 가이드 RNA를 포함하며, 상기 2개 이상의 가이드 RNA는 상이한 표적 RNA에 대해 상이한 가이드 서열을 갖는다.

일부 실시 형태에 있어서, 상기 CasPR 융합물의 변이체 또는 유도체는 서열 1-11 중의 어느 하나의 하나 또는 복수의 잔기의 보존된 아미노산 치환을 포함하고, 선택적으로, 상기 CasPR 융합물의 변이체 또는 유도체는 보존된 아미노산 치환만 포함한다. 일부 실시 형태에 있어서, 상기 CasPR 융합물의 유도체는 상기 표적 RNA에 혼성화되는 CasPR가이드 서열과 결합할 수 있으나, 상기 CasPR의 RNA효소 촉매 부위의 돌연변이로 인해 리보뉴클레아제 촉매 활성을 가지지 않는다. 일부 실시 형태에 있어서, 상기 CasPR 융합물의 유도체는 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개 또는 50개의 잔기를 초과하지 않는 N 말단 결실 및/또는 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개 또는 50개의 잔기를 초과하지 않는 C 말단 결실을 갖는다.

일부 실시 형태에 있어서, 상기 CasPR은 Cas5d, Cas6 또는 Csf5, 예컨대 MtCas6(I-A), MmCas6(I-B), SpCas5d(I-C1), BhCas5d(I-C2), SaCas6(I-D), EcCas6e(I-E), PaCas6f(I-F), MtCas6(III-A), PfCas6(III-B), PaCsf5(IV-A1) 또는 MtCsf5(IV-A2)이다.

일부 실시 형태에 있어서, 상기 CasPR 융합물의 이종 기능적 도메인은 RNA염기 편집 도메인을 포함한다. 일부 실시 형태에 있어서, 상기 RNA염기 편집 도메인은 아데노신 디아미나제 및/또는 시티딘 탈아미노효소, 예컨대 RNA에 작용하는 시티딘 탈아미노효소(CDAR), 예컨대 이중 가닥 RNA특이적 아데노신 디아미나제(ADAR)(예를 들어, ADAR1 또는 ADAR2), 아포지질단백질 B mRNA 편집효소, 촉매 폴리펩티드 유사체(APOBEC, 예컨대 APOBEC1, APOBEC2, APOBEC3A, APOBEC3B, APOBEC3C, APOBEC3D, APOBEC3E, APOBEC3F, APOBEC3G, APOBEC3H 및 APOBEC4), 활성화 유도 시티딘 탈아미노효소(AID), 시티딘 탈아미노효소1(CDA1) 또는 그 돌연변이체를 포함한다. 일부 실시 형태에 있어서, ADAR은 E488Q/T375G 이중 돌연변이를 포함하거나 또는 ADAR2DD를 포함한다. 일부 실시 형태에 있어서, 상기 염기 편집 도메인을 MS2와 같은 RNA결합 도메인과 더 융합시킨다.

일부 실시 형태에 있어서, 상기 CasPR 융합물의 유도체는 RNA 메틸트랜스퍼라제, RNA 디메틸라아제, RNA스플라이싱 개질제, 위치화 인자 또는 번역 변형 인자를 더 포함한다.

일부 실시 형태에 있어서, 상기 CasPR, 상동체, 동원체, 이원체, 변이체, 유도체 또는 기능적 단편은 핵 위치화 신호(NLS) 서열 또는 핵배출 신호(NES)를 포함한다.

일부 실시 형태에 있어서, 상기 표적 RNA의 타겟팅은 상기 표적 RNA의 변형으로 이어진다. 일부 실시 형태에 있어서, 상기 표적 RNA 변형은 상기 표적 RNA 절단이다. 일부 실시 형태에 있어서, 상기 표적 RNA 변형은 아데노신(A)의 이노신(I)으로의 탈아미노화 및/또는 시티딘(C)의 우라실(U)로의 탈아미노화이다.

일부 실시 형태에 있어서, 본 발명의 RNA 서열은 코돈 최적화된 폴리뉴클레오티드를 코딩하고, 상기 폴리뉴클레오티드는 야생형 CasPR(예를 들어, Cas5d, Cas6 또는 Csf5), 그 상동체, 그 동원체, 그 이원체, 그 변이체 또는 유도체 또는 그 기능적 단편을 코딩하며, 여기서 상기 폴리뉴클레오티드는 포유동물 (예를 들어, 인간)의 발현에 대해 코돈 최적화하고, 선택적으로, 상기 야생형 CasPR은 서열 1-11 중 어느 하나의 아미노산 서열을 갖는다. 일부 실시 형태에 있어서, 상기 코돈 최적화된 폴리뉴클레오티드는 서열 34-44 중 어느 하나의 아미노산 서열을 갖는다. 일부 실시 형태에 있어서, 상기 코돈 최적화된 폴리뉴클레오티드는 이종 기능적 도메인을 코딩하는 서열을 더 포함한다. 일부 실시 형태에 있어서, 이종 기능적 도메인은 RNA염기 편집기를 포함한다.

MtCas6(I-A):

ATGCCTCTGATCTTCAAGATCGGCTATAACGTGATCCCCCTGCAGGACGTGATCCTGCCCACCCCTTCCAGCAAGGTGCTGAAGTACCTGATCCAGAGCGGCAAGCTGATCCCCAGCCTGAAGGACCTGATCACCAGCCGGGACAAGTACAAGCCAATCTTCATCTCCCACCTGGGCTTCAACCAGCGGAGGATTTTCCAGACCAACGGCAATCTGAAAACCATCACCAAGGGCAGTAGACTGAGCTCCATCATCGCCTTCAGCACCCAGGCCAACGTGCTGTCCGAGGTGGCCGATGAAGGGATCTTCGAAACCGTGTACGGAAAGTTCCACATCATGATCGAAAGCATCGAGATCGTGGAGGTGGAAAAGCTGAAGGAGGAGGTGGAGAAGCACATGAACGACAACATCAGAGTGAGATTCGTGTCTCCCACACTGCTGAGCTCCAAGGTGCTGCTGCCCCCCAGCCTGTCCGAAAGATACAAGAAGATCCACGCCGGGTACAGCACCCTGCCCAGCGTGGGCCTGATCGTGGCCTACGCCTACAACGTGTACTGCAATCTGATCGGCAAGAAGGAAGTGGAAGTGCGGGCCTTCAAGTTTGGAATCCTGAGCAACGCCCTGTCCAGAATCATCGGCTACGACCTGCACCCTGTGACCGTGGCCATCGGCGAGGACAGCAAGGGGAATCTGAGAAAGGCTCGGGGCGTGATGGGCTGGATCGAGTTCGACATCCCCGACGAAAGACTGAAGCGGCGGGCCCTGAACTATCTGCTGACCAGCAGCTACCTGGGCATCGGGAGATCTCGGGGCATCGGCTTCGGCGAGATCCGGCTGGAGTTCCGGAAGATTGAAGAGAAGGAGGGA (서열 34)

MmCas6 (I-B):

ATGGACCTGGAGTACATGCACATCTCCTACCCTAACATCCTGCTGAACATGCGGGACGGCAGCAAGCTGCGGGGCTACTTCGCCAAGAAGTACATCGACGAAGAGATTGTGCACAACCACAGAGACAACGCCTTTGTGTACAAGTACCCCCAGATCCAGTTTAAGATCATCGATAGAAGCCCCCTGATCATCGGCATTGGCTCTCTGGGCATCAATTTCCTGGAGAGCAAGCGGATCTTCTTCGAGAAGGAACTGATTATCAGCAACGACACCAACGACATCACCGAGGTGAACGTGCACAAGGACATGGATCACTTCGGCACGACCGACAAGATCCTGAAGTACCAGTTCAAGACCCCTTGGATGGCACTGAACGCCAAGAATAGCGAGATCTACAAGAACTCTGACGAGATCGACCGGGAGGAGTTCCTGAAGAGAGTGCTGATTGGGAATATCCTGAGCATGTCTAAGAGCCTGGGCTATACCATCGAAGAAAAGCTGAAGGTGAAGATTAACCTGAAGGAAGTGCCCGTGAAGTTCAAGAACCAGAACATGGTGGGCTTTCGGGGCGAGTTCTACATCAACTTCGACATCCCTCAGTATCTGGGCATCGGCCGGAATGTGTCCCGGGGATTCGGCACAGTGGTGAAGGTG (서열 35)

SpCas5d (I-C1):

ATGAGAAATGAAGTGCAGTTCGAGCTGTTCGGCGACTACGCCCTGTTCACCGACCCCCTGACCAAGATCGGCGGCGAAAAGCTGAGCTACAGCGTGCCTACCTACCAGGCCCTGAAGGGCATCGCCGAGAGCATCTACTGGAAGCCCACCATCGTGTTCGTGATCGACGAACTGCGGGTCATGAAGCCCATTCAGATGGAGTCTAAGGGCGTGAGGCCCATCGAGTACGGCGGCGGCAACACCCTGGCCCACTACACCTACCTGAAGGATGTGCACTACCAGGTGAAGGCCCACTTCGAGTTCAACCTGCACCGGCCCGACCTGGCCTTCGATAGAAACGAGGGCAAGCACTACTCCATCCTGCAGAGAAGCCTGAAGGCCGGCGGCAGAAGAGATATTTTCCTGGGCGCCCGGGAGTGCCAGGGCTACGTGGCCCCCTGCGAGTTCGGCAGCGGCGACGGCTTCTACGACGGCCAGGGCAAGTACCACCTGGGAACCATGGTGCACGGTTTCAACTACCCCGACGAAACCGGACAGCACCAGCTGGATGTGAGACTGTGGTCTGCCGTCATGGAAAACGGCTACATCCAGTTCCCCCGCCCTGAGGACTGCCCCATCGTGCGGCCTGTGAAGGAGATGGAACCCAAGATCTTCAACCCCGACAACGTGCAGTCCGCCGAACAGCTGCTGCACGACCTGGGCGGCGAA (서열 36)

BhCas5d (I-C2):

ATGTACAGAAGCCGGGACTTCTACGTGAGAGTGTCCGGCCAGCGGGCCCTGTTCACCAACCCCGCCACCAAGGGCGGCTCCGAACGGAGCTCCTACTCCGTGCCTACCCGGCAGGCCCTGAACGGGATTGTGGACGCCATCTACTACAAGCCCACGTTCACCAACATCGTGACCGAGGTGAAGGTGATTAACCAGATCCAGACCGAACTGCAGGGCGTGCGGGCCCTGCTGCATGACTACAGCGCCGACCTGAGCTACGTGTCCTACCTGAGCGACGTGGTGTACCTGATTAAGTTTCATTTCGTGTGGAACGAGGATAGAAAGGACCTGAATAGCGACCGGCTGCCAGCCAAGCATGAGGCCATCATGGAGCGGTCTATCCGGAAGGGCGGCAGACGGGACGTGTTCCTGGGCACCAGAGAATGCCTGGGCCTGCTGGACGACATCAGCCAGGAAGAATACGAAACCACAGTGAGCTATTACAATGGGGTGAACATCGACCTGGGCATCATGTTCCACAGCTTCGCTTACCCCAAGGACAAGAAAACCCCCCTGAAGTCCTACTTCACAAAGACCGTGATGAAGAACGGCGTGATCACCTTCAAGGCCCAGTCCGAATGCGATATTGTGAACACCCTGAGCTCCTACGCCTTCAAGGCCCCCGAGGAGATCAAGAGCGTGAACGACGAGTGCATGGAGTACGACGCCATGGAGAAGGGCGAAAAC (서열 37)

SaCas6 (I-D):

ATGCCCAACGATCCCTACAGCCTGTACTCCATCGTGATCGAACTGGGCGCCGCCGAAAAGGGATTCCCCACAGGCATCCTGGGCAGAAGCCTGCATAGCCAGGTGCTGCAGTGGTTCAAGCAGGATAACCCCTTCCTGGCCACCGAGCTGCACCAGAGCCAGATCTCCCCCTTCTCCATCTCTCCACTGATGGGCAAGCGGCACGCCAAGCTGACCAAGGCCGGCGACCGGCTGTTCTTTCGGATCTGCCTGCTGAGAGGAGATCTGCTGCAGCCCCTGCTGAACGGCATTGAGCAGACCGTGAACCAGAGCGTGTGCCTGGACAAGTTCCGGTTCCGGCTGTGCCAGACCCACATCCTGCCCGGCAGCCACCCTCTGGCTGGCGCCTCCCACTATAGCCTGATCAGCCAGACCCCAGTGAGCTCCAAGATTACCCTGGACTTCAAGAGTTCTACCTCCTTCAAGGTGGACCGGAAGATCATCCAAGTGTTCCCTCTGGGCGAACACGTGTTCAACAGCCTGCTCAGACGCTGGAATAACTTCGCCCCCGAGGACCTGCACTTCTCTCAGGTGGACTGGAGCATCCCCATCGCCGCATTCGACGTGAAAACCATCCCCATCCACCTGAAGAAGGTCGAGATCGGCGCACAGGGCTGGGTGACCTACATCTTCCCCAACACAGAACAGGCCAAGATCGCCTCCGTGCTGAGCGAATTCGCCTTCTTCAGCGGAGTGGGACGGAAAACCACCATGGGCATGGGCCAGGTGCAGGTGCGGTCC (서열 38)

EcCas6e (I-E):

ATGTACCTGAGCAAGGTGATCATCGCCAGAGCCTGGAGCAGAGACCTGTACCAGCTGCACCAGGGCCTGTGGCACCTGTTCCCCAACCGGCCCGACGCCGCCCGGGATTTCCTGTTCCACGTGGAGAAGAGAAACACCCCGGAAGGCTGCCACGTGCTGCTGCAGAGCGCACAGATGCCTGTGAGCACCGCCGTGGCCACCGTGATCAAGACCAAGCAGGTGGAGTTCCAGCTGCAGGTGGGCGTGCCCCTGTATTTCAGGCTGCGGGCGAATCCCATCAAGACCATCCTGGACAACCAGAAGCGGCTGGACAGCAAGGGCAACATCAAGAGGTGCAGAGTGCCTCTGATCAAGGAGGCCGAACAGATCGCCTGGCTGCAGCGGAAGCTGGGCAATGCCGCCAGAGTGGAGGACGTGCACCCCATCAGCGAGCGGCCCCAGTACTTCTCCGGCGACGGAAAGAGCGGAAAGATCCAGACCGTGTGCTTCGAGGGCGTGCTGACCATCAACGACGCACCCGCCCTGATCGACCTCGTGCAGCAGGGGATCGGCCCTGCCAAGTCCATGGGCTGCGGACTGCTGTCCCTGGCCCCCCTG (서열 39)

PaCas6f (I-F):

ATGGACCACTACCTGGACATTAGACTGCGCCCTGACCCAGAGTTCCCTCCTGCCCAGCTGATGTCTGTGCTGTTTGGCAAGCTGCACCAGGCCCTGGTGGCCCAGGGCGGTGACAGAATCGGAGTGTCTTTCCCTGATCTGGACGAATCTAGATCTAGACTGGGAGAGAGACTGAGAATCCACGCGTCTGCCGACGACCTGAGAGCTCTGCTGGCCAGACCATGGCTGGAAGGACTGCGCGACCACCTGCAGTTCGGTGAACCTGCCGTGGTGCCTCACCCAACTCCATACAGACAGGTGAGTAGAGTGCAGGCAAAGTCTAATCCAGAGAGACTGAGACGCAGACTGATGAGAAGGCATGACCTGTCCGAAGAAGAAGCCAGAAAGAGAATCCCAGACACAGTGGCCAGAGCCCTGGATCTGCCTTTTGTGACCCTGAGAAGCCAGTCTACCGGCCAGCACTTCAGACTGTTTATTCGCCACGGACCACTGCAGGTGACCGCCGAAGAGGGAGGTTTTACCTGCTACGGACTGAGCAAGGGAGGTTTCGTGCCTTGGTTC(서열 40)

MtCas6 (III-A):

ATGGCCGCCAGAAGAGGCGGAATCCGGAGAACCGACCTGCTGCGGAGGTCTGGCCAGCCTCGGGGCAGACACCGGGCCTCCGCCGCCGAGAGCGGCCTGACATGGATCTCCCCTACCCTGATCCTGGTGGGCTTCAGCCACAGGGGCGATAGGAGAATGACCGAGCACCTGTCCAGACTGACCCTGACCCTGGAAGTGGATGCCCCCCTGGAGAGAGCCCGGGTGGCCACCCTGGGCCCCCACCTGCATGGCGTGCTGATGGAGTCTATCCCCGCCGACTACGTGCAGACACTGCACACAGTGCCGGTGAACCCTTACAGCCAGTACGCTCTGGCCCGGAGCACCACCAGCCTGGAGTGGAAGATCTCCACCCTGACAAATGAGGCCCGGCAGCAGATCGTCGGCCCCATCAACGACGCCGCCTTCGCCGGCTTCCGGCTGCGGGCCAGCGGCATCGCCACCCAGGTGACAAGCAGAAGCCTGGAGCAGAACCCCCTGTCCCAGTTTGCCAGAATCTTCTACGCCAGGCCCGAAACCCGCAAGTTCAGAGTGGAGTTCCTGACCCCCACCGCCTTCAAGCAGAGCGGCGAGTACGTGTTTTGGCCCGATCCCAGACTGGTGTTCCAGTCCCTGGCCCAGAAGTACGGCGCCATCGTGGACGGAGAAGAGCCCGACCCCGGCCTGATCGCCGAGTTTGGCCAGTCCGTGAGACTGAGCGCCTTCAGAGTGGCCAGCGCCCCTTTTGCCGTGGGCGCCGCCAGGGTGCCCGGATTCACCGGCAGCGCCACCTTCACCGTGCGGGGAGTGGACACCTTCGCCAGCTACATCGCCGCTCTGCTGTGGTTCGGCGAGTTCAGCGGATGCGGCATCAAGGCCTCCATGGGAATGGGCGCCATCCGGGTGCAGCCTCTGGCCCCCCGGGAGAAGTGCGTGCCCAAGCCC (서열 41)

PfCas6 (III-B):

ATGAGATTCCTGATCAGACTGGTGCCCGAGGACAAGGACAGAGCCTTCAAGGTGCCTTACAACCACCAGTACTATCTGCAGGGCCTGATCTACAACGCCATCAAGTCCTCCAACCCCAAGCTGGCCACCTACCTGCACGAGGTGAAGGGCCCCAAGCTGTTCACCTACAGCCTGTTCATGGCCGAAAAGCGGGAGCACCCTAAGGGCCTGCCCTACTTTCTGGGCTACAAGAAGGGCTTCTTCTACTTCAGCACCTGCGTGCCCGAGATCGCCGAGGCCCTGGTGAACGGCCTGCTGATGAATCCCGAGGTGCGGCTGTGGGACGAGAGATTCTACCTGCACGAAATCAAGGTCCTGCGGGAGCCCAAGAAGTTCAACGGCAGCACCTTCGTGACCCTGAGCCCCATCGCCGTGACCGTGGTGAGAAAGGGCAAGTCCTACGACGTGCCCCCCATGGAAAAGGAGTTCTACAGCATTATCAAGGATGACCTGCAGGACAAGTACGTGATGGCCTACGGCGACAAGCCCCCCAGTGAGTTCGAGATGGAAGTGCTGATCGCCAAGCCCAAGCGGTTCCGGATCAAGCCCGGCATCTATCAGACCGCCTGGCACCTGGTGTTTCGGGCCTACGGCAATGACGACCTGCTGAAGGTGGGCTACGAAGTGGGATTCGGGGAGAAGAACTCCCTGGGATTCGGAATGGTCAAGGTGGAGGGCAACAAGACCACCAAGGAAGCCGAAGAACAGGAGAAGATCACCTTCAACTCCCGGGAAGAGCTGAAAACAGGCGTG (서열 42)

PaCsf5 (IV-A1):

ATGTTCGTGACCCAGGTGATCTTCAACATCGGCGAACGGACGTACCCCGACAGGGCTCGGGCTATGGTGGCCGAGCTGATGGATGGCGTCCAGCCTGGCCTGGTGGCCACCCTGATGAACTACATCCCCGGCACCAGCACGAGCCGGACAGAGTTCCCCACCGTGCAGTTCGGCGGCGCCAGCGACGGCTTTTGCCTGCTGGGCTTCGGCGACGGCGGCGGCGCCATCGTGAGAGATGCCGTGCCCCTGATCCACGCCGCCCTGGCAAGGCGGATGCCTGATCGGATCATCCAGGTGGAACACAAGGAGCACAGCCTGTCCGCCGAGGCCCGGCCCTACGTGCTGAGCTACACCGTGCCTCGGATGGTGGTGCAGAAGAAGCAGCGGCACGCCGAGAGACTGCTGCACGAAGCCGAGGGAAAGGCTCACCTGGAGGGCCTGTTCCTGCGGAGCCTGCAGAGGCAGGCCGCCGCCGTGGGCCTGCCCCTGCCCGAGAACCTGGAGGTGGAGTTCAAGGGAGCCGTGGGCGACTTCGCCGCAAAGCACAATCCAAATAGCAAGGTGGCCTACCGGGGACTGAGAGGCGCCGTGTTCGATGTGAACGCCAGACTGGGCGGCATCTGGACCGCCGGATTCATGCTGAGCAAGGGCTACGGCCAGTTTAACGCCACCCACCAGCTGAGCGGCGCCGTGAACGCTCTGTCCGAA (서열 43)

MtCsf5 (IV-A2):

ATGCACCAGACCCTGATCCGGATCAACTGGCCCAAGGGATTCAAGTGCCCCCCTGCCGAGTTCCGGGAAAAGCTGGCCAAGAGCGAGATGTTCCCCCCCGAGTTCTTCCACTACGGCACGGAACTGGCCGTGTGGGACAAGCAGACCGCCGAGGTGGAGGGCAAGATCAAGACCGTGTCCAAGGAGAAGATCATCAAGACCTTTGACAAGCCCATCCCCCTGAATGGCCGGGCCCCGGTCAGAGTGATCGGCGGCCAGGCCTGGGCCGGCGTGATCGCCGACCCCGAGATGGAGGGCATGCTGATCCCACACCTGGGGAGCATCCTGAAGGTGGCCAGCAGCGCGGCCGGATGCGCAGTGAAGATCGAACTGGAACAGAGAAAGTTCGGCATCAGCTACACCGAGTACCCCGTGAAGTACAACCTGCGGGAGCTGGTGCTGAAGAGAAGATGCGAGGACGCCCGGTCTACCGATATCGAGAGCCTGATTGCCGATAGAATCTGGGGCGGCGTGTCCGGCGAGAGCTACTATGGCATCGACGGCACATGCGCCAAGTTTGGCTTCGAACCCCCCAGCAGAGAGCAGCTGGAGCTGCGGATCTTCCCCATGAAGAACATCGGACTGCACATGAAGTCCAGCGACGGACTGTCCAAGGAGTACATGAGCCTGATTGACGCCGAGGTGTGGATGAACGCTAAGCTGGAAGGAGTGTGGCAGGTGGGCAACCTGATCAGCAGGGGCTACGGCCGGTTCATCAAGTCTATCGGCGCCCAGTCC (서열 44)

일부 실시 형태에 있어서, 본 발명의 RNA 서열은 비천연적으로 존재하는 폴리뉴클레오티드를 코딩하고, 상기 비천연적으로 존재하는 폴리뉴클레오티드는 서열 12-33 중의 어느 하나의 유도체를 포함하며, 여기서 상기 유도체는 (i) 서열 12-33 중의 어느 하나에 비해 하나 또는 복수의(예를 들어, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의) 뉴클레오티드 추가, 결실, 치환 및/또는 기타 돌연변이를 가지고, (ii) 서열 12-33 중의 어느 하나와 적어도 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95% 또는 97%의 서열 동일성을 가지며, (iii) 엄격한 조건 하에서 서열 12-33 중의 어느 하나 또는 (i) 및 (ii) 중의 어느 하나와 혼성화하거나, 또는 (iv)는 (i) - (iii) 중의 어느 하나의 상보적 서열이고, 조건은 상기 유도체가 서열 12-33 중의 어느 하나가 아니며, 상기 유도체가 RNA을 코딩하고(또는 RNA), 상기 RNA가 서열 12-33에 의해 코딩되는 어느 RNA와 거의 동일한 2차 구조(예를 들어, 줄기, 고리, 돌기, 단일 가닥 영역)를 유지한다. 일부 실시 형태에 있어서, 상기 유도체를 본 발명의 CasPR, 그 동원체, 그 이원체, 그 변이체, 그 유도체 또는 그 기능적 단편 중의 어느 하나의 DR 서열로 한다.

일부 실시 형태에 있어서, 본 발명의 RNA 서열은 조작된 클러스터화된 규칙적인 회문 반복서열(CRISPR)-Cas13 이펙터 효소의 코딩 서열을 포함하고, 여기서 상기 조작된 Cas13은 (1) 대응되는 야생형 Cas13 이펙터 효소의 엔도뉴클레아제 촉매 도메인 공간에 접근하는 영역에서 돌연변이를 포함하고, (2) 상기 가이드 서열과 상보적인 표적 RNA에 대한 야생형 Cas13의 가이드 서열 특이적 엔도뉴클레아제 절단 활성을 거의 보류하며, 또한 (3) 상기 가이드 서열과 결합하지 않는 비표적 RNA에 대한 야생형 Cas13의 가이드 서열 비의존적 부가적 엔도뉴클레아제 절단 활성이 거의 결핍하다.

일부 실시 형태에 있어서, Cas13은 Cas13a, Cas13b, Cas13c, Cas13d(CasRx 포함), Cas13e 또는 Cas13f이다.

일부 실시 형태에 있어서, 상기 Cas13e는 PCT/CN2020/119559 중 SEQ ID NO: 4의 아미노산 서열을 갖는다(참조로 본 명세서에 포함됨).

일부 실시 형태에 있어서, 상기 영역은 Cas13의 1차 서열에서 엔도뉴클레아제 촉매 도메인(예를 들어, RXXXXH 도메인)의 임의의 잔기로부터 120개, 110개, 100개, 90개 또는 80개의 아미노산 내의 잔기를 포함한다.

일부 실시 형태에 있어서, 상기 영역은 Cas13의 1차 서열에서 엔도뉴클레아제 촉매 도메인의 임의의 잔기로부터 100개, 110개, 120개 또는 130개의 잔기를 초과하는 잔기를 포함하나, 공간적으로 상기 엔도뉴클레아제 촉매 도메인의 잔기의 1-10옹스트롬 또는 5옹스트롬 내에 있다.

일부 실시 형태에 있어서, 상기 엔도뉴클레아제 촉매 도메인은 HEPN 도메인이고, 선택적으로 RXXXXH모티브의 HEPN 도메인을 포함한다. 일부 실시 형태에 있어서, 상기 RXXXXH 모티브는 R{N/H/K}X1X2X3H서열을 포함한다. 일부 실시 형태에 있어서, 상기 R{N/H/K}X1X2X3H 서열에서, X1은 R, S, D, E, Q, N, G 또는 Y이고; X2는 I, S, T, V 또는 L이며; 또한 X3은 L, F, N, Y, V, I, S, D, E 또는 A이다. 일부 실시 형태에 있어서, 상기 RXXXXH모티브는 N 말단 RXXXXH 모티브이고, 상기 N 말단 RXXXXH 모티브는 RNXXXH서열, 예컨대 RN{Y/F}{F/Y}SH 서열을 포함한다. 일부 실시 형태에 있어서, 상기 N 말단 RXXXXH모티브는 RNYFSH 서열을 갖는다. 일부 실시 형태에 있어서, 상기 N 말단 RXXXXH 모티브는 RNFYSH 서열을 갖는다. 일부 실시 형태에 있어서, 상기 RXXXXH 모티브는 R{N/A/R}{A/K/S/F}{A/L/F}{F/H/L}H서열의C 말단 RXXXXH 모티브를 포함한다. 일부 실시 형태에 있어서, 상기 C 말단 RXXXXH 모티브는 RN(A/K)ALH 서열을 갖는다. 일부 실시 형태에 있어서, 상기 C 말단 RXXXXH 모티브는 RAFFHH 또는 RRAFFH 서열을 갖는다.

일부 실시 형태에 있어서, 상기 영역은 PCT/CN2020/119559(참조로 통합)의 SEQ ID NO: 4의 잔기2-187, 227-242 또는 634-755 사이의 잔기에 대응되는 잔기를 포함하거나, 거의 이러한 잔기로 조성되거나 또는 이러한 잔기로 조성된다. 일부 실시 형태에 있어서, 상기 영역은 PCT/CN2020/119559(참조로서 포함됨)의 SEQ ID NO: 4의 잔기 35-51, 52-67, 156-171, 666-682 또는 712-727 사이의 잔기에 대응되는 잔기를 포함하거나, 거의 이러한 잔기로 조성되거나 또는 이러한 잔기로 조성된다.

일부 실시 형태에 있어서, 상기 돌연변이는 상기 영역 내의 한 세그먼트의 15-20개의 연속 아미노산 내의 하나 또는 복수의 전하를 띄거나 또는 극성 잔기에서 전하 중성 단쇄 지방족 잔기(예컨대 A)로의 치환을 포함하거나, 거의 조성되거나 또는 조성된다. 일부 실시 형태에 있어서, 상기 세그먼트는 약 16개 또는 17개의 잔기이다. 일부 실시 형태에 있어서, 1개, 2개 또는 3개 이상을 제외하고, 상기 세그먼트 중의 거의 모든 전하를 띄고 및 극성 잔기를 모두 치환한다. 일부 실시 형태에 있어서, 상기 세그먼트 중 총 약 7개, 8개, 9개 또는 10개의 전하를 띄고 및 극성잔기를 치환한다. 일부 실시 형태에 있어서, 상기 세그먼트의 N- 및 C-말단 2개의 잔기를 그 코딩 서열에 제한효소 인식 서열을 포함하는 아미노산으로 치환한다. 일부 실시 형태에 있어서, N 말단 2개의 잔기는 VF이고, C 말단 2개의 잔기는 ED이며, 제한 효소는 BpiI이다. 일부 실시 형태에 있어서, 상기 하나 또는 복수의 전하를 띄거나 또는 극성 잔기는 N, Q, R, K, H, D, E, Y, S 및 T 잔기를 포함한다. 일부 실시 형태에 있어서, 상기 하나 또는 복수의 전하를 띄거나 또는 극성 잔기는 R, K, H, N, Y 및/또는 Q 잔기를 포함한다. 일부 실시 형태에 있어서, 상기 세그먼트 내의 하나 또는 복수의 Y 잔기를 치환한다. 일부 실시 형태에 있어서, 상기 하나 또는 복수의 Y 잔기는 야생형 Cas13e.1의 Y672, Y676 및/또는 Y751(PCT/CN2020/119559(참조로 포함됨)의 SEQ ID NO: 4)에 대응된다. 일부 실시 형태에 있어서, 상기 세그먼트는 PCT/CN2020/119559(참조로 포함됨) 중 SEQ ID NO: 4의 잔기 35-51, 52-67, 156-171, 666-682 또는 712-727이다. 일부 실시 형태에 있어서, 상기 돌연변이는 PCT/CN2020/119559(참조로 포함됨) 중 SEQ ID NO: 37-39, 45 및 48 중의 임의의 하나 또는 복수에 대응되는 하나 또는 복수의 Ala 치환을 포함한다. 일부 실시 형태에 있어서, 상기 전하 중성 단쇄 지방족 잔기는 Ala(A)이다. 일부 실시 형태에 있어서, 상기 돌연변이는, 15-20개의 연속 아미노산을 갖는 상기 영역 내의 2개, 3개, 4개 또는 5개의 세그먼트 내의 치환,을 포함하거나, 거의 이로 구성되거나 또는 이로 구성된다.

일부 실시 형태에 있어서, 조작된 Cas13은 표적 RNA에 대한 야생형 Cas13의 가이드 서열 특이적 엔도뉴클레아제 절단 활성의 적어도 약 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%를 보류한다.

일부 실시 형태에 있어서, 조작된 Cas13은 비표적 RNA의 가이드 서열에 대한 야생형 Cas13의 비의존적 부차적 엔도뉴클레아제 절단 활성의 적어도 약 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%가 결핍하다.

일부 실시 형태에 있어서, 조작된 Cas13은 표적 RNA에 대한 야생형 Cas13의 가이드 서열 특이적 엔도뉴클레아제 절단 활성의 적어도 약 80%-90%를 보류하고, 비표적 RNA에 대한 야생형 Cas13의 가이드 서열 비의존적 부차적 엔도뉴클레아제 절단 활성의 적어도 약 95%-100%가 결핍하다.

일부 실시 형태에 있어서, 본 발명의 조작된 Cas13은 PCT/CN2020/119559(참조로서 포함됨) 중 SEQ ID NO: 6-10의 어느 하나와 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8% 또는 99.86% 동일성을 갖는 아미노산 서열을 갖고, PCT/CN2020/119559(참조로 통합)의 SEQ ID NO: 16, 20, 24, 28 및 32에서 정의한 임의의 하나 또는 복수의 영역을 포함하지 않는다.

일부 실시 형태에 있어서, PCT/CN2020/119559(참조로 서 포함됨)의 SEQ ID NO: 17, 21, 25, 29 및 33에 비해, 아미노산 서열의 PCT/CN2020/119559(참조로서 포함됨)의 SEQ ID NO: 16, 20, 24, 28 및 32에서 정의한 하나 또는 복수의 영역 중의 각각에 각각 1개, 2개, 3개, 4개 또는 5개에 달하는 차이를 포함한다.

일부 실시 형태에 있어서, 본 발명의 조작된 Cas13은 PCT/CN2020/119559(참조로서 포함됨) 중 SEQ ID NO: 6-10의 어느 하나의 아미노산 서열을 갖는다. 일부 실시 형태에 있어서, 본 발명의 조작된 Cas13은 PCT/CN2020/119559(참조로서 포함됨) 중 SEQ ID NO: 9 또는 10의 아미노산 서열을 갖는다.

일부 실시 형태에 있어서, 본 발명의 조작된 Cas13은 핵 위치화 신호(NLS) 서열 또는 핵배출 신호(NES)를 더 포함한다. 일부 실시 형태에 있어서, 조작된 Cas13은 N- 및/또는 C 말단NLS를 포함한다.

일부 실시 형태에 있어서, 본 발명의 조작된 CRISPR/Cas13 이펙터 효소를 코딩하는 본 발명의 RNA 서열은 코돈 최적화를 거쳐, 진핵 생물, 포유동물 (예컨대 인간 또는 비인간 포유동물), 식물, 곤충, 조류, 파충류, 설치류(예컨대 마우스, 래트), 어류, 연충/선충 또는 효모에서 발현되는 데 사용된다.

일부 실시 형태에 있어서, 본 발명의 RNA 서열은 조작된 클러스터화된 규칙적인 짧은 회문 반복서열(CRISPR)-Cas13 이펙터 효소의 코딩 서열을 포함하고, 상기 코딩 서열은 (i) 야생형 서열에 비해 하나 또는 복수의(예를 들어, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의)뉴클레오티드 추가, 결실, 치환 및/또는 기타 돌연변이를 포함하고, (ii) 상기 야생형 서열과 적어도 50%, 60%, 70%, 80%, 90%, 95% 또는 97% 서열 동일성을 가지며, (iii) 엄격한 조건 하에서 상기 야생형 서열 또는 (i) 및 (ii) 중의 어느 하나와 혼성화되거나, 또는 (iv)는 (i) - (iii) 중 어느 하나의 상보적 서열이다.

일부 실시 형태에 있어서, 본 발명의 RNA 서열은, siRNA, piRNA, 짧은 헤어핀 RNA 또는 shRNA, 마이크로 RNA 또는 miRNA 또는 그 전구체(전구체miRNA 및 pri-miRNA 포함), 안티센스 서열 또는 올리고뉴클레오티드(ASO), CRISPR/Cas의 가이드 RNA 또는 gRNA, rRNA, tRNA, snoRNA, snRNA, exRNA, scaRNA, lncRNA, Xist 및 HOTAIR 등과 같은 비코딩RNA(ncRNA)를 포함한다.

9. 사용 방법

본 발명의 rRAAV 바이러스 입자 및 RNA 서열은 임의의 GOI/RSI을 임의의 적합한 표적 세포, 조직 또는 생물체에 전달하는 데 사용할 수 있고, 임의의 유전자 요법에 사용된다.

일부 실시 형태에 있어서, 본 발명의 rRAAV 바이러스 입자 및 RNA 서열은 치료 방법에 사용될 수 있고, 여기서 유전자의 기능 버전은 기능 결함 또는 기능 상실 질병 유전자를 대체하여 상실된 기능을 회복할 수 있다. 예를 들어, 일부 실시 형태에 있어서, 야생형 코딩 서열 또는 야생형 단백질의 변이체 단백질을 코딩하고 상기 야생형 단백질의 적어도 하나의 원하는 기능을 보류한 변이체 코딩 서열을 표적 세포 /조직/기관에 전달하여, 그 코딩된 야생형 변이체를 발현하여, 상기 질병 유전자의 상실의 기능을 보상할 수 있다.

일부 다른 실시 형태에 있어서, 본 발명의 rRAAV 바이러스 입자 및 RNA 서열은 치료 방법에 사용될 수 있고, 여기서 기능 결함 또는 기능 획득성 질병유전자는 유전자 표적 제제에 의해 녹아웃,녹다운 또는 다른 방식으로 하향 조절되어, 상기 질별 유전자의 불리한 영향을 경감시킬 수 있다. 상기 유전자 표적 제제는 CRISPR/Cas 이펙터 효소(예컨대 본 명세서에 따른 조작된 Cas9 또는 Cas13 이펙터 효소)일 수 있고, 상기 이펙터 효소는 선택적으로 동시에(또는 단독으로) 제공되는 가이드 RNA를 가지며, 상기 가이드 RNA는 상기 질병 유전자를 공동으로 타켓팅한다. 일부 실시 형태에 있어서, 상기 유전자 표적 제제는 DNA-RNA 염기 편집을 위한 DNA 또는 RNA 염기 편집기와 연결되는 Cas 이펙터 효소일 수 있다. 일부 실시 형태에 있어서, 상기 유전자 표적 제제는 siRNA, shRNA, 마이크로 RNA 또는 안티센스 RNA이다.

일부 실시 형태에 있어서, 본 발명은 표적 세포에서 표적 RNA를 변형시키는 방법을 제공하고, 상기 방법은 상기 표적 세포를 본 명세서에 따른 CasPR 또는 조작된 CRISPR/Cas 이펙터 효소(또는 그 동원체, 이원체, 변이체, 유도체 또는 기능 단편)를 코딩하는 본 발명의 rRAAV 바이러스 입자 또는 RNA 서열에 접촉시키는 단계를 포함하고, 여기서 CasPR/Cas 이펙터 효소의 가이드 서열이 표적 RNA의 적어도 15개의 뉴클레오티드와 상보적이며, 여기서 상기 CasPR/공학적 Cas 이펙터 효소가 가이드 서열과 관련되어 표적 RNA를 결합 및 변형하는 복합물을 형성한다.

일부 실시 형태에 있어서, 본 발명은 필요한 대상체에서 병증 또는 질병을 치료하는 방법을 제공하고, 상기 방법은 대상체에게 조성물을 투여하는 단계를 포함하며, 상기 조성물은 본 명세서에 따른 CasPR 또는 조작된 CRISPR/Cas 이펙터 효소(또는 그 동원체, 이원체, 변이체, 유도체 또는 기능 단편)를 코딩하는 본 발명의 rRAAV 바이러스 입자 또는 RNA 서열을 포함하고, 여기서 CasPR/Cas 이펙터 효소의 가이드 서열은 표적 RNA의 적어도 15개의 뉴클레오티드와 상보적이며, 여기서 상기 CasPR/공학적 Cas 이펙터 효소가 가이드 서열과 관련되어 표적 RNA를 결합 및 변형시키는 복합물을 형성함으로써, 상기 대상체에서 상기 병증 또는 질병을 치료한다.

일부 실시 형태에 있어서, CasPR 또는 조작된 Cas 이펙터 효소 복합물을 통한 절단을 통해 상기 표적 RNA를 변형시킨다. 일부 실시 형태에 있어서, 이중 가닥 RNA특이적 아데노신 및/또는 시티딘 탈아미노 효소를 포함한 유도체로 탈아미노화하여 상기 표적 RNA를 변형시킨다. 일부 실시 형태에 있어서, 상기 표적 RNA는 mRNA, tRNA, rRNA, 비코딩RNA, lncRNA 또는 핵 RNA이다. 일부 실시 형태에 있어서, 상기 표적 RNA는 세포 내에 있다. 일부 실시 형태에 있어서, 상기 세포 는 암세포이다. 일부 실시 형태에 있어서, 상기 세포는 감염원에 의해 감염된다. 일부 실시 형태에 있어서, 상기 감염원은 바이러스, 프라이온, 원생 동물, 진균 또는 기생충이다. 일부 실시 형태에 있어서, 상기 세포는 뉴런세포(예를 들어, 성상교세포, 신경교세포 (예를 들어, Muller 신경교세포, 회돌기교세포, 뇌실막 세포, 슈반(Schwan)세포, NG2 세포 또는 위성세포))이다.

일부 실시 형태에 있어서, 상기 병증 또는 질병은 암증 또는 감염성 질병이다. 일부 실시 형태에 있어서, 상기 암증은 빌름스종양, 유잉육종, 신경내분비종양, 교모세포종, 신경아세포종, 흑색종, 피부암, 유방암, 대장암, 직장암, 전립선암, 간암, 신장암, 췌장암, 폐암, 담도암, 자궁경부암, 자궁내막암, 식도암, 위암, 두경부암, 갑상선수질암, 난소암, 신경교종, 림프종, 백혈병, 골수암, 급성 림프구성 백혈병, 급성 골수성 백혈병, 만성 림프구성 백혈병, 만성 골수성 백혈병, 호지킨 림프종, 비호지킨 림프종 또는 방광암이다. 일부 실시 형태에 있어서, 상기 방법은 체외(in vitro) 방법, 체내(in vivo) 방법 또는 탈체(ex vivo) 방법이다. 일부 실시 형태에 있어서, 상기 복합물이 상기 표적 RNA와 결합한 후, 상기 조작된 Cas13는 대량의(또는 검출 가능한)부가적 RNA효소 활성을 나타내지 않는다.

일부 실시 형태에 있어서, 상기 병증 또는 질병은 신경 병증이고, 예컨대 녹내장, 연령 관련 RGC상실, 시신경 손상, 망막 허혈, 레버 유전 시신경 장애, RGC 뉴런의 퇴화에 관련된 신경 병증, 필요한 대상체의 선조체 중 기능적 뉴런 퇴화에 관련된 신경 병증, 파킨슨병, 알츠하이머병, 헌팅턴병, 정신분열증, 우울증, 약물 중독, 활동 장애, 예컨대 무도병, 무도 무정위 운동 및 운동 장애, 양극성 장애, 자폐증 계통 장애(ASD) 또는 기능장애이다.

일부 실시 형태에 있어서, 본 발명의 방법은 (i) 체외 또는 체내 세포 노화 유도; (ii) 체외 또는 체내 세포 주기 정체; (iii) 체외 또는 체내 세포 성장억제 및/또는 세포 성장억제; (iv) 체외 또는 체외 무반응성 유도; (v) 체외 또는 체외 세포 사멸 유도; 및 (vi) 체외 또는 체외 괴사 유도 중 이하의 하나 이상을 초래한다.

본 발명의 다른 실시 형태

1. 폴리뉴클레오티드 서열에 있어서, 리보핵산(RNA), 디옥시리보핵산(DNA), 트레오스 핵산(TNA), 글리콜핵산(GNA), 펩티드 핵산(PNA), 잠금핵산(LNA, β-D-리보스 배열을 갖는 LNA, α-L-리보스 배열을 갖는 α-LNA(LNA의 부분 입체 이성질체), 2'-아미노 기능화를 갖는 2'-아미노-LNA 및 2'-아미노 기능화를 갖는 2'-아미노-α-LNA 포함) 또는 그 하이브리드체를 포함하나 이에 한정되지 않고, DNA 바이러스의 바이러스 입자에 패키징될 수 있으며, 상기 폴리뉴클레오티드 서열은

(1) 관심 폴리뉴클레오티드 서열(PSI), 예를 들어, 관심 유전자(GOI)의 RNA 코딩 서열, mRNA와 같은 단백질(예를 들어, 치료성 단백질, 항원 단백질, 또는 유전자 편집 단백질예컨대 CRISPR/Cas 이펙터 효소(“Cas 단백질”로 약칭), ZFN 단백질, TALEN 단백질)을 코딩하는 RNA, 또는 비코딩 기능적 RNA(예를 들어 운반 RNA(tRNA), 리보솜 RNA(rRNA), 작은 간섭 RNA(siRNA), 짧은 헤어핀 RNA(shRNA), 안티센스 RNA, 안티센스 올리고뉴클레오티드, 마이크로 RNA(miRNA) 또는 CRISPR-Cas(예를 들어, Cas9, Cas12, Cas13)시스템의 RNA 성분(가이드 RNA(또는 gRNA) 예컨대 단일 가이드 RNA(또는 sgRNA, 키메릭 RNA, RNA 키메라), CRISPR RNA(crRNA) 및 tracr RNA 포함)), 또는 그 전구체; 및

(2) 직접 또는 간접적으로 PPS 상호 작용 분자와 상호 작용(예를 들어 결합)할 수 있고, 상기 RPS 상호 작용 분자가 상기 DNA 바이러스의 바이러스 입자에 패키징되도록 촉진하는 폴리뉴클레오티드 패키징 신호(PPS)를 포함하고,

선택적으로, 상기 폴리뉴클레오티드 서열을 코딩하거나 또는 대응되는 DNA 서열 또는 상기 DNA 서열의 역-상보적인 서열은 상기 DNA 바이러스의 바이러스 입자에 패키징되는 능력(예를 들어, 상기 DNA 서열 또는 그 역-상보적인 서열은 DNA 패키징 신호, 예를 들어AAV 패키징을 위한 기능적 AAV ITR 결핍)이 감소되거나, 약화되거나 또는 거의 없다.

2. 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 상기 DNA 바이러스의 바이러스 입자는 AAV 바이러스 입자 또는 종양용해 바이러스 입자이다.

3. 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 상기 PPS는 상기 PSI의 5’ 말단에 위치하거나 또는 가깝거나, 상기 PSI의 3’ 말단에 위치하거나 또는 상기 PSI의 내부(예를 들어, mRNA의 인트론 내)에 위치한다.

4. 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 서로 같거나 다른 하나 이상의(예를 들어, 1개, 2개, 3개 이상의) PPS를 포함한다.

5. 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 여기서 상기 하나 이상의 PPS 중의 2개 이상(예를 들어, 3개)은 서로 같거나 다른 링커를 거쳐 서로 인접하거나 또는 직렬 연결된다.

6. 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 서로 인접하지 않는(예를 들어, 각자 상기 관심 폴리뉴클레오티드 서열(PSI)의 하나의 말단에 위치하거나 가까움) 2개 이상의 PPS를 포함한다.

7. 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 여기서 상기 PPS는 전사되고 변형된 AAV말단 역반복(ITR)를 포함하고, 여기서 상기 전사되고 변형된 AAV ITR은

(a) 전사된 기능적 Rep 결합 요소(RBE)를 포함하고, 선택적으로 전사된 기능적 RBE’를 더 포함하며; 및

(b) 전사된 말단 분해 부위(TRS) 또는 전사된 역-상보적인 TRS(rcTRS) 또는 둘 모두가 결핍되며;

선택적으로, 상기 전사되고 변형된 AAV ITR은 전사된 D 영역 서열(D서열 또는 D’서열)을 더 포함하고; 및/또는

선택적으로, 상기 PPS 상호 작용 분자는 Rep78, Rep68, Rep52 및/또는 Rep40이다.

8. 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 상기 전사되고 변형된 AAV ITR은 상기 RNA의 3’말단 1000개의 뉴클레오티드, 800개의 뉴클레오티드, 500개의 뉴클레오티드, 300개의 뉴클레오티드 또는 200개의 뉴클레오티드 내에 존재하고; 선택적으로, 상기 전사되고 변형된 AAV ITR은 폴리A 서열, 폴리A 신호 서열(예를 들어, AAUAAA) 또는 RNA전사 종결 서열(예를 들어, 히스톤 다운스트림 요소)의 5’에 존재한다.

9. 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 여기서 상기 전사되고 변형된 AAV ITR은 전사된 야생형 Flip 또는 Flop ITR에 기반하여 변형된 것이고; 선택적으로, 상기 야생형 Flip 또는 Flop ITR은 AAV1, AAV2, AAV3A, AAV3B, AAV4, AAV5, AAV6, AAV7, AAVrh74, AAV8, AAV9, AAV10, AAV11, AAV12 또는 AAV13으로부터 유래된다(선택적으로, 상기 야생형 Flop ITR은 SEQ ID NO: 1의 뉴클레오티드 서열을 가짐).

10. 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 상기 전사되고 변형된 AAV ITR은 상기 전사된 TRS 및 상기 전사된 rcTRS 둘 모두가 결핍하다.

11. 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 상기 전사되고 변형된 AAV ITR은 상기 전사된 D 영역 서열을 포함한다(선택적으로, 상기 변형된 AAV ITR은 SEQ ID NO: 3의 뉴클레오티드 서열을 가짐).

12. 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 상기 전사되고 변형된 AAV ITR은 상기 전사된 D 영역 서열이 결핍하다(선택적으로, 상기 변형된 AAV ITR은 SEQ ID NO: 2의 뉴클레오티드 서열을 가짐).

13. 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 제2 전사되고 변형된 AAV ITR을 더 포함하고, 상기 제2 전사되고 변형된 AAV ITR은 제2 전사된 기능적 RBE 서열을 가지나 제2 전사된 TRS 또는 제2 전사된 rcTRS 또는 둘 모두가 결핍되고; 선택적으로, 상기 제2 전사되고 변형된 AAV ITR은 제2 전사된 D 영역 서열을 더 포함한다.

14. 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 상기 전사되고 변형된 AAV ITR 및 상기 제2 전사되고 변형된 AAV ITR은 서로 같다(또는 서로 다르다).

15. 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 상기 전사되고 변형된 AAV ITR 및 상기 제2 전사되고 변형된 AAV ITR은 (만약 존재하면)대응되는 전사된 야생형 AAV ITR D 영역 서열 또는 대응되는 전사된 야생형 TRS/rcTRS 중의 결실, 대응되는 전사된 야생형 AAV ITR D 영역 서열 또는 대응되는 전사된 야생형 TRS/rcTRS 중의 돌연변이 또는 대응되는 전사된 야생형 AAV ITR D 영역 서열 또는 대응되는 전사된 야생형 TRS/rcTRS 중의 삽입을 포함한다.

16. 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 상기 제2 전사되고 변형된 AAV ITR은 상기 폴리뉴클레오티드 서열의 5’말단 1000개의 뉴클레오티드, 800개의 뉴클레오티드, 500개의 뉴클레오티드, 250개의 뉴클레오티드 또는 150개의 뉴클레오티드 내에 존재한다.

17. 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 상기 PPS는 MS2 서열, PP7 결합 부위 또는 com 결합 부위를 포함하고, 상기 PPS 상호 작용 분자는 직접 또는 간접적으로 상기 PPS와 상호 작용(예를 들어 결합)할 수 있는 PPS 상호 작용 단백질(PPSIP)을 포함하며, 예컨대 MS2 서열의 경우 박테리오파지 유래의 MS2 외피 단백질(MCP), PP7 결합 부위의 경우 PP7 박테리오파지 외피 단백질(PCP) 또는 com 결합 부위의 경우 박테리오파지 COM 단백질(COM)을 포함한다.

18. 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 상기 PPSIP는 직접 또는 간접적으로 상기 DNA 바이러스의 바이러스 입자의 바이러스 패키징 시스템의 단백질 성분(예를 들어 아데노 관련 바이러스2(AAV2)의 Rep78 및/또는 Rep68 또는 조립 활성화 단백질(AAP))과 관련된다(예를 들어, 이하에 융합).

19. 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 상기 폴리뉴클레오티드 서열은 전사된 DNA 패키징 신호를 포함하거나 바람직하게는 포함하지 않고, 예를 들어, 전사된 야생형 AAV ITR 서열(예를 들어, 상기 폴리뉴클레오티드 서열은 전사되고 변형된 AAV ITR 서열을 포함하고, 상기 전사되고 변형된 AAV ITR 서열은 대응되는 전사된 야생형 AAV ITR 서열의 뉴클레오티드의 추가, 결실 및/또는 치환을 가져 상기 DNA 바이러스의 바이러스 입자의 DNA 패키징 능력을 저하시킨다) 를 포함하거나 바람직하게는 포함하지 않는다.

20. 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서,

(1) 전사된 전사 인핸서;

(2) 전사된 인트론 서열 또는 엑손 서열(예를 들어 단백질 발현을 강화하기 위한 전사된 인트론 서열 또는 엑손 서열);

(3) 5’ UTR 서열;

(4) 3’ UTR 서열;

(5) 폴리A 서열 또는 폴리아데닐화(폴리A) 신호 서열 및 선택적으로 상기 폴리A 신호 서열 다운스트림의 GU 풍부 영역;

(6) 전사 후 조절 요소 또는 서열, 예를 들어 전사된 우드척 간염 바이러스(WHP) 전사 후 조절 요소(WPRE) 서열; 및/또는

(7) 전사 종결 서열(예를 들어 히스톤 다운스트림 요소)을 더 포함하고,

선택적으로, 상기 폴리뉴클레오티드 서열은 상기 전사 후조절 요소 또는 서열의 3’ 및 상기 폴리A 서열 또는 폴리A 신호 서열의 5’에 위치한 PPS를 포함한다.

21. 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 5’에서 3’방향으로 상기 PSI, 임의의 전사된 WPRE 서열; 상기 PPS(예를 들어상기 전사되고 변형된 AAV ITR, 상기 MS2 서열, 상기 PP7 결합 부위 또는 상기 com 결합 부위); 및 상기 폴리A 서열 또는 상기 폴리A 신호 서열을 포함한다.

22. 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 여기서 상기 GOI는 단백질(예를 들어, 형광 단백질, 치료성 단백질, 항원 단백질, 또는 유전자 편집 단백질(예를 들어, Cas 단백질, ZFN 단백질, TALEN 단백질)), 효소(예를 들어 Cre 단백질 또는 CRISPR/Cas 이펙터 효소(예를 들어, Cas9, Cas12, Cas13), 또는 그 변이체), 구조 단백질, mRNA, 비코딩 RNA(ncRNA), siRNA, piRNA, 짧은 헤어핀 RNA 또는 shRNA, 마이크로 RNA(miRNA) 또는 그 전구체(전구체miRNA 및 pri-miRNA 포함), 리보솜 RNA(rRNA), 안티센스 서열 또는 올리고뉴클레오티드(ASO), CRISPR-Cas시스템의 RNA 성분(단일 가이드 RNA(또는 sgRNA, 키메릭 RNA, RNA 키메라)와 같은 가이드 RNA(또는 gRNA), CRISPR RNA(crRNA) 및 tracr RNA 포함), CRISPR/Cas 이펙터 효소를 위한 가이드 RNA 또는 gRNA, rRNA, tRNA, snoRNA, snRNA, exRNA, scaRNA, lncRNA, Xist 및 HOTAIR을 포함한다.

23. 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 길이가 약 8,900개의 뉴클레오티드 미만이고, 길이가 약 8,000개의 뉴클레오티드 미만이며, 길이가 약 7,000개의 뉴클레오티드 미만이고, 길이가 약 6,000개의 뉴클레오티드 미만이며, 길이가 약 5,200개의 뉴클레오티드 미만이고, 길이가 약 4,000개의 뉴클레오티드 미만이며, 길이가 약 3,000개의 뉴클레오티드 미만이고, 길이가 약 2,000개의 뉴클레오티드 미만이며, 길이가 약 4,700-5,200개의 뉴클레오티드이고, 길이가 약 4,700-5,000개의 뉴클레오티드이며, 길이가 약 4,700-4,800개의 뉴클레오티드이거나 또는 길이가 약 4,700개의 뉴클레오티드인 단일 가닥 RNA이다.

24. 폴리뉴클레오티드에 있어서, 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열을 코딩하는 카세트를 포함하고; 선택적으로, 상기 폴리뉴클레오티드는 DNA 서열(예를 들어, DNA 플라스미드)이며, 상기 DNA 서열은 선택적으로 상기 DNA 플라스미드의 백본에 스터퍼 서열을 포함하고, 및/또는 선택적으로 AAV ITR과 같은 기능적 DNA 패키징 신호를 포함하지 않는다.

25. 임의의 상기 실시 형태에 따른 폴리뉴클레오티드에 있어서, 상기 카세트를 통해 코딩된 폴리뉴클레오티드 서열에 조작 가능하게 열결되고 전사되도록 구동하는 프로모터를 더 포함한다.

26. 임의의 상기 실시 형태에 따른 폴리뉴클레오티드에 있어서, 상기 프로모터는 편재 프로모터이다.

27. 임의의 상기 실시 형태에 따른 폴리뉴클레오티드에 있어서, 상기 프로모터는 조직 특이적 프로모터이다.

28. 임의의 상기 실시 형태에 따른 폴리뉴클레오티드에 있어서, 상기 프로모터는 전신 발현 프로모터이다.

29. 임의의 상기 실시 형태에 따른 폴리뉴클레오티드에 있어서, 상기 프로모터는 유도성 프로모터이다.

30. 임의의 상기 실시 형태에 따른 폴리뉴클레오티드에 있어서, 상기 프로모터를 통해 구동하는 상기 폴리뉴클레오티드 서열을 강화하는 전사된 인핸서를 더 포함한다.

31. 재조합 DNA 바이러스의 바이러스 입자에 있어서, DNA 바이러스(예컨대 AAV 바이러스 또는 종양용해 바이러스)의 단백질 쉘(예컨대 캡시드) 중에 패키징되는 폴리뉴클레오티드 게놈(예를 들어, 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열 또는 임의의 상기 실시 형태에 따른 폴리뉴클레오티드로부터 전사된 폴리뉴클레오티드 서열)을 포함한다.

32. 임의의 상기 실시 형태에 따른 재조합 DNA 바이러스의 바이러스 입자에 있어서, 상기 DNA 바이러스는 AAV이고, 상기 재조합 DNA 바이러스의 바이러스 입자는 재조합 폴리뉴클레오티드 아데노 관련 바이러스(rPAAV) 입자이며, 상기 재조합 폴리뉴클레오티드 아데노 관련 바이러스 입자는

(1) AAV 캡시드; 및

(2) 상기 AAV 캡시드 내에 패키징되는 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열 또는 임의의 상기 실시 형태에 따른 폴리뉴클레오티드로부터 전사된 폴리뉴클레오티드 서열을 포함한다.

33. 임의의 상기 실시 형태에 따른 재조합 DNA 바이러스의 바이러스 입자에 있어서, 상기 AAV 캡시드는 혈청형 AAV1, AAV2, AAV3A, AAV3B, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, AAV-DJ, AAV PHP.eB, Anc80L65, Anc80L65AAP, AAVrh74 또는 7m8의 AAV로부터 유래된 캡시드를 포함한다.

34. 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자)의 군체에 있어서, 상기 군체는 복수의 임의의 상기 실시 형태에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자)를 포함하고, 여기서 상기 군체 내의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자) 중의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 이상은 이에 패키징된 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열 또는 임의의 상기 실시 형태에 따른 폴리뉴클레오티드로부터 전사된 폴리뉴클레오티드 서열을 갖는다.

35. 숙주 세포에 있어서, 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열, 임의의 상기 실시 형태에 따른 폴리뉴클레오티드, 임의의 상기 실시 형태에 따른 폴리뉴클레오티드로부터 전사된 폴리뉴클레오티드 서열, 임의의 상기 실시 형태에 따른 재조합 DNA 바이러스의 바이러스 입자 (예를 들어, rPAAV 입자) 및/또는 임의의 상기 실시 형태에 따른 재조합 DNA 바이러스의 바이러스 입자 (예를 들어, rPAAV 입자)의 군체를 포함한다.

36. 임의의 상기 실시 형태에 따른 숙주 세포에 있어서, 바이러스 패키징 시스템을 더 포함하고, 상기 바이러스 패키징 시스템은 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열 또는 임의의 상기 실시 형태에 따른 폴리뉴클레오티드로부터 전사된 폴리뉴클레오티드 서열이 상기 DNA 바이러스의 바이러스 입자에 패키징되도록 촉진한다.

37. 임의의 상기 실시 형태에 따른 숙주 세포에 있어서, 상기 바이러스 패키징 시스템은

(1) rep 유전자 및 cap 유전자의 전사를 구동하는 하나 또는 복수의 프로모터의 전사 제어 하에 있는 AAV rep 유전자(예를 들어, Rep78, Rep68, Rep52 및/또는 Rep40의 코딩 서열) 및 AAV cap 유전자(예를 들어, VP1, VP2, VP3, AAP 및/또는 MAAP의 코딩 서열) 또는 그 발현 산물;

(2) 아데노 바이러스 E2A, E4 및 VA유전자 또는 상기 하나 이상의 단백질과 같이 AAV 패키징에 필요한 하나 이상의 단백질의 하나 또는 복수의 코딩 서열; 및

(3) 상기 PPS 상호 작용 분자 또는 그 코딩 서열을 포함하고,

선택적으로, 상기 바이러스 패키징 시스템은 (1) 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열을 코딩하는 폴리뉴클레오티드 또는 임의의 상기 실시 형태에 따른 폴리뉴클레오티드 상의 DNA 패키징 신호(예를 들어AAV ITR의 일부 또는 전부)를 제거하고, (2) 상기 AAV rep 유전자, 상기 AAV cap 유전자 및/또는 AAV 패키징에 필요한 하나 이상의 단백질의 상기 하나 또는 복수의 코딩 서열을 변형(예를 들어 돌연변이)시켜, 상응한 번역된 단백질이 상기 DNA 서열을 상기 DNA 바이러스의 바이러스 입자에 패키징하도록 촉진하는 능력(예를 들어, Rep78 및 Rep68 단백질의 공유 서열 중의 Y156F 돌연변이, KDE-mu 또는 EKE-mu)을 감소시키거나, 약화시키거나 또는 거의 제거하며; 및/또는 (3) 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열을 코딩하는 폴리뉴클레오티드 또는 임의의 상기 실시 형태에 따른 폴리뉴클레오티드의 크기를 확대하는 것을 통해 DNA 서열을 상기 DNA 바이러스의 바이러스 입자에 패키징되는 능력을 감소시키거나, 약화시키거나 또는 거의 제거한다.

38. 임의의 상기 실시 형태에 따른 숙주 세포는 포유동물 세포(예컨대 HEK293세포) 또는 곤충세포(예컨대 Sf9 또는 Sf21세포)이다.

39. 임의의 상기 실시 형태에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자) 또는 임의의 상기 실시 형태에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자)의 군체를 생성하는 방법에 있어서, 상기 방법은

a) 임의의 상기 실시 형태에 따른 숙주 세포를 충분한 시간 동안 배양하는 단계, 및

b) 상기 재조합 DNA 바이러스의 바이러스 입자 또는 상기 재조합 DNA 바이러스의 바이러스 입자의 군체를 수득하는 단계를 포함한다.

40. 임의의 상기 실시 형태에 따른 방법에 있어서, 상기 재조합 DNA 바이러스의 바이러스 입자 또는 상기 재조합 DNA 바이러스의 바이러스 입자의 군체를 단리 또는 정제하는 단계를 더 포함한다.

41. 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자) 또는 재조합 DNA 바이러스의 바이러스 입자의 군체를 생성하는 방법에 있어서, 상기 방법은

a) 바이러스 패키징 시스템(예를 들어, AAV 패키징 시스템)을 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열 또는 임의의 상기 실시 형태에 따른 폴리뉴클레오티드로부터 전사된 폴리뉴클레오티드 서열에 상기 재조합 DNA 바이러스의 바이러스 입자 또는 상기 재조합 DNA 바이러스의 바이러스 입자의 군체를 생성하기에 충분한 시간 동안 접촉시키는 단계, 및

b) 상기 재조합 DNA 바이러스의 바이러스 입자 또는 상기 재조합 DNA 바이러스의 바이러스 입자의 군체를 수득하는 단계; 및 선택적으로,

c) 수득한 재조합 DNA 바이러스의 바이러스 입자 또는 재조합 DNA 바이러스의 바이러스 입자의 군체를 단리 또는 정제하는 단계를 포함한다.

42. 임의의 상기 실시 형태에 따른 방법에 있어서, 상기 바이러스 패키징 시스템(예를 들어, AAV 패키징 시스템)은

(1) 상기 폴리뉴클레오티드 서열을 패키징하기 위한 상기 DNA 바이러스의 바이러스 입자의 단백질 쉘을 조립하기 위한 하나 이상의 단백질(예를 들어, AAV 캡시드를 조립하기 위한 VP1, VP2 및/또는 VP3) 또는 그 하나 또는 복수의 코딩 서열;

(2) 상기 단백질 쉘의 조립 및/또는 상기 폴리뉴클레오티드 서열이 상기 DNA 바이러스의 바이러스 입자의 단백질 쉘에 패키징되도록 촉진하기 위한 하나 이상의 단백질(예를 들어, AAV 패키징을 위한 Rep78, Rep68, Rep52 및/또는 Rep40) 또는 그 하나 또는 복수의 코딩 서열(예를 들어, 아데노 바이러스 E2a, E4 및 VA유전자); 및

(3) 상기 PPS 상호 작용 분자 또는 그 코딩 서열을 포함하고,

43. 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열 또는 임의의 상기 실시 형태에 따른 폴리뉴클레오티드로부터 전사된 폴리뉴클레오티드 서열을 DNA 바이러스의 바이러스 입자에 패키징하는 시스템에 있어서, 상기 시스템은

(3) 상기 PPS 상호 작용 분자 또는 그 코딩 서열을 포함하고,

44. 관심 유전자(GOI)를 세포, 식물 또는 동물에 전달하는 방법에 있어서, 상기 방법은 상기 세포, 식물 또는 동물을 임의의 상기 실시 형태에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자), 임의의 상기 실시 형태에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자)의 군체 또는 임의의 상기 실시 형태에 따른 방법을 통해 생성된 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자) 또는 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자)의 군체에 접촉시키는 단계를 포함하고, 여기서 상기 GOI는 상기 폴리뉴클레오티드 서열(임의의 상기 실시 형태에 기재)에 의해 코딩된다.

45. 관심 폴리뉴클레오티드 서열(PSI)을 세포, 식물 또는 동물에 전달하는 방법에 있어서, 상기 방법은 상기 세포, 식물 또는 동물을 임의의 상기 실시 형태에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자), 임의의 상기 실시 형태에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자)의 군체 또는 임의의 상기 실시 형태에 따른 방법을 통해 생성된 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자) 또는 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자)의 군체에 접촉시키는 단계를 포함한다.

46. 필요한 대상체에서 질병 또는 장애를 진단, 예방 또는 치료하는 방법에 있어서, 상기 방법은 상기 대상체에게 치료 유효량 또는 조제량의 임의의 상기 실시 형태에 따른 또는 임의의 상기 실시 형태에 따른 방법을 통해 생성된 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자)의 군체를 투여하는 단계를 포함한다.

47. 필요한 대상체의 질병 또는 장애를 진단, 예방 또는 치료하기 위한 약물의 제조에서임의의 상기 실시 형태에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자), 임의의 상기 실시 형태에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자)의 군체 또는 임의의 상기 실시 형태에 따른 방법을 통해 생성된 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자) 또는 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자)의 군체의 용도이다.

실시예

이하 제공하는 실시예는 본 발명의 여러 예시적인 실시 형태를 설명하기 위한 것이고, 임의의 방면에서 한정하고자 하는 것이 아니다.

실시예 1 RAAV 바이러스 입자로의 RNA의 고효율적 패키징

이 실시예는 RNA 벡터 게놈이 고효율적으로 AAV 바이러스 캡시드에 패키징될 수 있는 것을 입증하고, 특히 AAV 캡시드 내에 직접 패키징되도록 설계된 변형/재조합된 RNA를 사용한다.

우선, 예상밖으로, 전사(RNA로서) 시, AAV 패키징 신호-ITR(DNA)은 특히 일부 배열로로 존재하는 경우(예를 들어, 전사되고 변형된 AAV ITR 서열이 본 발명의 전사된 RNA 서열의 3’ 말단에 접근하는 경우) 본 발명의 RNA 서열(예를 들어, rRAAV 벡터 게놈RNA)이 AAV 입자에 패키징되도록 촉진할 수 있는 것으로 나타난다.

특히, AAV 벡터 게놈 말단으로부터 유래된 야생형 및 변형된 AAV ITR 서열(DNA)을 각 상응한 전이 유전자 발현 카세트에 이동시켜, 모든 전이 유전자 전사체(RNA)가 모두 후보 패키징 신호를 함유하도록 보장한다. RAAV 생산 과정에서 ssDNA 게놈을 갖는 기존 AAV 벡터의 생산을 차단하기 위해, 최적화된 ITR(dITR 및 dITR-D)을 사용하여 야생형 ITR를 대체한다(표 2).

표 2: 테스트한 ITR의 핵산 서열

특정적으로, Flop 배열 중의 야생형 AAV2 ITR(ITR2) 서열에서, TRS(“TTGGC”)는 상기 ITR의 5’ 말단에 위치하고, 그 역-상보적인 서열 GCCAA에 이중 밑줄을 긋는다. 이러한 서열은 임의의 방향으로 코딩 플라스미드에 클론된다(즉, SEQ ID NO: 1로 표시되는 서열 또는 그 역-상보적인 서열을 주형으로 사용하여 본 발명의 RNA 서열을 전사할 수 있다). 본 명세서의 실험에서, 야생형 AAV2 ITR 서열은 이러한 방향으로 클론되어, 상기 전사된 RNA 중의 T가 U로 치환되는 것을 제외하고, 전사된 RNA가 SEQ ID NO: 1(또는 이하의 SEQ ID NO: 2 또는 3)과 동일한 서열을 갖도록 한다. 어쨌든, 이러한 서열 또는 그 역전사체를 전사한 후, 얻은 야생형 ITR2의 전사된 RNA는 회문의 전사된 RBE(회색 음영)를 포함한다. 본 명세서의 실험에서, 전사된 RNA는 모든 T가U로 치환되는 것을 제외하고, SEQ ID NO: 1과 등가적으로 전사된 야생형 AAV2 ITR을 포함한다. 만약 SEQ ID NO: 1의 역-상보적인 서열을 DNA 주형로 사용하면, 전사된 RNA는 GCCAA로 코딩된 전사된 TRS(UUGGC)를 포함할 것이다. 상기 전사된 TRS는 전사된 RBE와 전사된 D 서열 사이에 위치한다.

변형된 ITR 서열 중의 하나는 “δITR”(또는 “dITR”로 약칭)이고, 이는 결함이 있으며, 첫번째 G를 제외하고, 상기 dITR은 D 영역 서열( 볼드체 이탤릭체 ), 5’ 말단 위치의 TRS 및 역-상보적인 TRS 서열(“GCCAA”)이 결핍하다. 이러한 서열 전사 후, dITR의 전사된 RNA는 회문의 전사된 RBE(회색 음영) 및 GCCAA로 코딩된 전사된 TRS(UUGGC)가 결핍되어 있는 전사된 결함 ITR을 더 포함한다. 그러나 본 실험에서, SEQ ID NO: 2의 역-상보적인 서열을 DNA 주형으로 사용하여, 상기 전사된 RNA가 모든 T가 U에 의해 치환되는 것을 제외하고 SEQ ID NO: 2와 같은 서열을 갖는 전사되고 변형된 AAV2 ITR(전사된 dITR)을 포함하도록 한다.

다른 변형된 ITR 서열은 “dITR-D”이고, 이 또한 결함이 있으며, 이는 D 서열(“CTCCATCACTAGGGGTTCCT”, SEQ ID NO: 4)을 보류하나, 5’ 말단TRS(TTGGC)가 결핍되기 때문이다. 그 외, 역-상보적인 TRS(GCCAA) 중의 첫번째 G만 dITR-D에 보류되고, 나머지 CCAA 서열은 무관한 ACTAG서열에 의해 치환된다. 본 실험에서, SEQ ID NO: 3의 역-상보적인 서열을 DNA 주형으로 사용하여, 상기 전사된 RNA가 모든 T가 U에 의해 치환되는 것을 제외하고 SEQ ID NO: 3과 동일한 서열을 갖는 전사되고 변형된 AAV2 ITR(전사된 dITR-D)을 포함하도록 한다.

유의할 점은 dITR 및 dITR-D 서열은 모두 음영 회문 RBE 서열 SEQ ID NO: 5(CTGCGCGCTCGCTCGCTCACTG . . . CAGTGAGCGAGCGAGCGCGCAG)을 보류하고, 상응한 전사되고 변형된 ITR도 RBE 서열을 갖는다.

이러한 최적화된 ITR 코딩 서열(DNA)을 tdTomato발현 카세트의 2개의 위치에 삽입하되, 하나는 프로모터와 tdTomato 코딩 서열 사이에 위치하며, 다른 하나는 우드척 간염 바이러스(WHP) 전사 후 조절 요소(WPRE)와 SV40 폴리A 신호 사이에 위치한다.

사용된 최적화된 ITR의 서열, 수량 및 위치에 기반하여, 일련의 상이한 ITR에 기반한 RAAV 벡터를 구축하였다(도 3 참조).

ssDNA 벡터 게놈을 갖고 2개의 말단에 ITR 서열(“CTWS”: 서열 요소CAG 프로모터, tdTomato 전이 유전자, WPRE 서열 및 SV40 폴리A 신호 서열)을 갖지 않는 기존 AAV 벡터를 대조로 한다. 이 실험에 대해, AAV 혈청형 DJ를 선택한 것은 사용된 배양 세포에서 우수한 형질도입 효율을 가지기 때문이다. AAV-DJ는 합성 혈청형이고, AAV-2, 8 및 9의 키메릭 캡시드를 갖는다. 그 캡시드에 헤파린 결합 도메인을 함유하고, 상기 캡시드는 고효율적으로 여러 세포 유형을 형질도입하고 면역 중화를 피할 수 있다(Grimm et al., J. Virol. [바이러스학 저널] 82:5887-5911, 2008).

다양한 RAAV-ITR 바이러스 입자 및 대조 바이러스 입자는 모두 삼중 플라스미드 형질감염 시스템을 사용하여 생성된다(도 4).

특히, 전이 유전자 플라스미드, 패키징 플라스미드 및 헬퍼 플라스미드(중량비가 1 : 1 : 2임)를 HEK293T세포에 공동 형질감염시켜 RAAV 벡터를 생성한다. HEK293T세포를 컴피턴트 DMEM배지에서 배양하고, 형질감염 24시간 전에 세포를 접종한다. 형질감염 전, 배지를 2% FBS를 함유한 신선한 DMEM로 교체하였다. PEI-MAX을 형질감염용 시약으로 하였다. 그 후 형질감염 후 2일째 및 5일째에 상등액을 수집하고, 5일째에 형질감염된 세포를 수득하였다. RAAV 벡터를 이오딕사놀 밀도 구배를 사용하여 초원심 분리 및 정제하였다.

바이러스 역가(DNA 역가 및 RNA 역가)는 각각 Q-PCR 및 역전사-PCR(RT-PCT)을 통해 도 5a 중의 프로그램을 사용하여 확정하였다.

요컨대, 수득 및 정제된 RAAV 바이러스 입자를 우선 37°C에서 DNA효소 I 및 RNA효소 I로 2시간 동안 처리하여, 바이러스 입자 단백질 쉘 외의 모든 핵산을 제거하였다. 이어서, 뉴클레아제를 100°C에서 약 30분간 변성시키고, 그 후 RAAV 바이러스 입자를 변성 및 파열시켜 RAAV핵산 내용물을 방출하여 추가적인 분석에 사용하였다.

Q-PCR은 뉴클레아제 내성 산물을 분석에 사용하여, RAAV 바이러스 입자에 캡시드화된 DNA 벡터 게놈을 적정하였다. 특히, 한 그룹의 Q-PCR에 프로모터 서열에 특이적인 프라이머쌍을 사용하여 임의의 기능적 DNA를 검출/정량하고, 다른 그룹의 Q-PCR에 WPRE 서열에 특이적인 프라이머 쌍을 사용하여 RAAV 바이러스 입자에 캡시드화된 임의의 DNA 벡터 게놈에 검출/정량하였다. 도 5b를 참조한다.

아울러, 다른 하나의 샘플에서, 우선 데옥시리보뉴클레아제 I를 통해 임의의 RAAV 캡시드화된 DNA를 제거하고, 그 후 나머지 RNA에 대해 역전사하며, 얻은 cDNA를 Q-PCR주형으로 사용하여, RNA로 전사된 WPRE 서열을 검출/정량하였다. DNA 불완전 제거 후 존재할 수 있는 임의의 잔류 DNA를 검출/정량하기 위해, DNA 제거 단계 후의 샘플에 대해 Q-PCR을 사용하여 직접 증폭하여, 상기 샘플에 존재할 수 있는 임의의 WPRE(DNA) 서열을 검출하였다. 도 5a를 참조한다.

CITWS 작제물의 패키징 효율(도 6a를 참조)을 테스트하기 위해, 기존 pssDNA 작제물(양단에 야생형 ITR 서열을 가짐)을 사용하여 바이러스 입자를 생성하는 경우, 절대 다수의 바이러스 입자는 프로모터서열 및 WPRE 서열을 갖는 기능적 DNA 벡터 게놈을 포함한다. 아주 가끔(2개의 수량급 또는 약 1%의 시간), RNA 벡터 게놈도 바이러스 입자에 패키징된다(표지이 “RNA”의 스트립형 참조, 표지이 “DNA” 및 “기능적 DNA”인 스트립형보다 약 2개의 수량급이 낮다). 잔류 DNA는 패키징된 RNA 벡터 게놈보다 하나의 수량급이 낮다.

아울러, AAV 벡터 게놈 양단에서 ITR 서열을 제거하여 패키징을 거의 취소하였고, 즉,도 6a에서의 CTWS 작제물(무 ITR) 생성에 의한 패키징 DNA는 2-2.5개의 수량급이 낮아졌고, 심지어 RNA는 더 적다.

CTWS대조에 비해, DNA 패키징이 다소 개선되었으나, 프로모터의 3’과 GOI 코딩 서열의 5’ 사이에 하나의 최적화된 ITR 서열(dITR 또는 dITR-D 서열)만 추가하는 경우 RNA 패키징을 강화할 수 없었다. 도 6a를 참조한다.

흥미롭게도, 도 6b에서 매우 상이한 결과를 얻었고, 여기서 CTWIS 작제물을 테스트하였다. 특히, 패키징 pssDNA 작제물(도 6a 및 도 6b 비교)에 관하여, 거의 동일한 결과을 얻었다. 즉, 대다수 패키징된 바이러스 입자는 DNA(99% 이상) 및 무시할 수 있는 양(1% 이하)의 RNA를 함유하였다. 그러나, WPRE 서열의 3’ 말단과 폴리A 서열의 5’ 말단 사이에 최적화된 ITR 서열(dITR)을 추가하여 DNA와 RNA 사이의 패키징 효율의 차이를 현저히 줄이거나 심지어 역전하였다. dITR-D 서열을 사용할 때, 절대 다수의 패키징된 핵산이 RNA(패키징된 DNA보다 1-2개의 수량급이 높음)인 경우, 이러한 작용은 더욱 현저하였다.

만약 CITWIS 작제물 중의 프로모터와 GOI 코딩 서열 사이에 하나의 별도(즉 두번째)의 최적화된 ITR 서열을 삽입하면, 거의 동일한 결과를 얻는다. 도 6c를 참조한다.

이러한 결과에 따르면, 최적화된 ITR(dITR 및 dITR-D)은 기존 AAV 벡터의 복제를 파괴함으로써, RAAV 바이러스 입자에 패키징되는 DNA가 감소되는 것으로 나타났다.

대조 벡터CTWS(무 ITR) 및 RAAV-dITR 벡터에 비해, dITR-D최적화 ITR을 갖는 RAAV 벡터는 특히 dITR-D ITR이 mRNA 코딩 서열 및 WPRE 서열의 다운스트림(예를 들어, 마침 폴리A 신호의 5’에 위치함)에 위치할 때전사된 mRNA를 RAAV 입자에 더욱 우수하게 직접 갭시드화하는 능력을 가지는 것으로 보인다. 도 6a-6c를 참조한다. 이에 비해, mRNA 코딩 서열 업스트림에 위치한 dITR-D 서열(예를 들어, 마침 발현 작제물 중의 프로모터 서열 다음에 위치함)은 거의 mRNA를 RAAV 바이러스 입자에 직접 패키징되도록 촉진하지 않는다. 아울러, 만약 다른 하나의 dITR-D 서열을 mRNA 코딩 서열의 다운스트림(예를 들어, 마침 폴리A 서열의 5’위치함)에 삽입하면, 얻은 RAAV mRNA의 패키징은 유사하게 고도로 증가된다(도 6c).

결론적으로, 비록 수율(mRNA를 휴대하는 입자)이 기존 ssDNA 벡터 게놈을 갖는 AAV 벡터(pssAAV조)에 비해 20배 낮으나, 그 mRNA 게놈 양단에 dITR-D신호를 포함하는 CITWIS-D는 가장 우수한 특이적 mRNA를 캡시드화하는 능력을 가진다. 기존 AAV 벡터와 달리, RAAV 벡터CITWIS-D는 파괴된 DNA 패키징을 갖고, DNA를 포함하는 입자는 RAAV 벡터 저장량의 약 20% 이하만 차지하며, 기능적 DNA를 포함하는 입자의 백분율은 심지어 더 낮다(예를 들어, 10%)(도 6a-6c).

AAV 패키징 용량이 제한적이여서(< 4700 nt), 전이 유전자 플라스미드의 크기를 확대하는 것을 통해 원하지 않는 RAAV DNA 패키징을 줄일 수 있고, 전이 유전자 카세트의 길이를 증가시켜, 예를 들어, 시스 작용 요소(예컨대 인핸서, 인트론 등) 또는 비기능적 스터퍼 서열을 카세트에 삽입하여 기능적 DNA 패키징을 더욱 줄일 수 있다.

실시예 2 기능성을 갖는 RAAV 바이러스 입자

이 실시예는 대상 RAAV-dITR-D 벡터가 감염성을 가지고, 유전자 전달 벡터로 사용될 수 있는 것을 입증하였다.

동일 부피의 정제 RAAV-dITR-D(CITWIS-D) 벡터를 사용하여 체외에서 약 50,000의 동일 MOI(CITWIS-D 벡터의 MOI는 DNA 입자수 및 mRNA 입자수의 합으로 산출) 2 × 10⁵개로 HEK293T세포를 감염시겼다.

특히, 감염 약 24시간 전에 HEK293T세포를 24웰 플레이트에 접종하였다. 그 후 RAAV 벡터와 1 mL DMEM(2% FBS 함유)을 완전히 혼합하였다. 그 후 세포의 배지를 제거하고, 세포를 혼합된 RAAV 벡터와 함께 밤새 인큐베이션하였다. 감염 후 3일 및 5일에 형광 사진을 촬영한다.

결과에 따르면, CITWIS-D 벡터가 tdTomato에 대한 발현은 기타 벡터보다 빠르나, 발현도 신속히 하향 조절된 것으로 나타났다(도 7b 참조). 이러한 쾌속 발현 및 분해 현상은 그 mRNA 게놈의 수명이 짧기 때문일 수 있다(도 7b).

흥미롭게도, 이러한 패키징 배후의 확실한 매커니즘은 명백하지 않으나 임의의 ITR 서열을 갖지 않는 CTWS 작제물은 분명히 어느 정도 패키징되었다. CTWS 벡터를 사용할 때, 이하의 적어도 두가지 가능성으로 mRNA 벡터 게놈의 패키징을 해석할 수 있다. 과발현된 세포 mRNA는 비특이적으로 RAAV 벡터에 패키징될 수 있거나, 또는 CTWS mRNA는 Rep2 또는 Cap-DJ와 상호 작용하는 일부 RNA구조를 가질 수 있다. 아울러, CTWS DNA 패키징은 CTWS플라스미드의 사이즈가 작기 때문이고, CTWS플라스미드의 사이즈를 증가시키면 DNA 패키징을 줄일 수 있다.

실시예 3 RAAV 입자로의 RNA의 고효율적 패키징

이 실시예는 RNA 게놈이 고효율적으로 AAV 캡시드 내에 패키징될 수 있고, 특히 본 명세서에서 설계한 AAV 캡시드 내에 직접 패키징되는 변형/재조합된 RNA를 사용하여, RAAV 입자를 생성하는 것을 입증하였다.

1. 설계

여러 발명자는 박테리오파지 유래 MS2 외피 단백질(MCP)과 그 인식 스템 루프MS2 사이의 강한 상호 작용을 이종 RNA 를 DNA 바이러스의 바이러스 입자에 패키징하는 신규한 패키징 신호로 하는 전략을 설계하였다.

우선, RAAV 생산 과정에서 패키징된 ssDNA 게놈을 갖는 기존 AAV 입자의 생산을 억제/감소시키기 위해, 기존 AAV 패키징 신호,즉 ITR를 제거하였다. 반대로, RNA 패키징 신호(RPS), 즉 MS2 스템 루프(또는 “MS2”로 약칭, 그 RNA 서열은 이하 서열에서 열거됨)의 하나의 복제 또는 3개의 복제를 tdTomato발현 카세트에 삽입하고, 우드척 간염 바이러스(WHP) 전사 후 조절 요소(WPRE)와 SV40 폴리A 신호 사이에 위치시켜, 모든 전사된 mRNA가 모두 RPS를 갖도록 보장함으로써, 결합 단백질, 즉 박테리오파지 유래 MS2 외피 단백질(또는 “MCP”로 약칭, 그 아미노산 서열은 하기 표에 도시됨)(MS2에 대응됨)에 의해 인식된다(도 8a).

AAV Rep 단백질은 비구조 단백질이고, 이들은 통상적으로 AAV 패키징 과정에서 ssDNA 게놈의 ITR과 AAV 캡시드 사이의 매개 역할을 하므로, MCP를 AAV2로부터 유래된 Rep78 단백질 및 Rep68 단백질의 N 말단에 융합하였다(Rep 68은 Rep 78의 C 말단 절단이고, 두 가지 융합물의 아미노산 서열은 이하의 서열표에 열거됨). 이러한 MCP-Rep78/68 융합물과 RNA 게놈 내의 MS2 서열의 상호 작용 및 RNA 게놈이 AAV 캡시드 내에 패키징되도록 촉진하는 능력을 검증하였다.

기존 AAV 벡터pssAAV-tdTomato(2개의 야생형 기능적 ITR 구비) 및 기능적 야생형 ITR을 갖지 않는 CTWS(“CTWS”, 대표 서열 요소CAG 프로모터, tdTomato 전이 유전자, WPRE 서열 및 SV40 폴리A 신호 서열)을 대조로 사용하였다(도 8a). 본 실시예에서, AAV 혈청형 DJ(“AAV-DJ” 또는 “DJ”)는 본 실시예에 사용된 배양 세포 HEK293T 세포에서 우수한 형질도입 효율을 가지므로, 상기 AAV 혈청형DJ를 선택하여 사용하였다. AAV-DJ는 합성 혈청형이고, AAV-2, 8 및 9의 키메릭 캡시드를 갖는다.

2. RAAV 패키징과 생산

본 명세서에서 기존 삼중 플라스미드 형질감염 시스템을 사용하고 필요한 변통을 응용하여, 상응한 전이 유전자 플라스미드, 패키징 플라스미드 및 헬퍼 플라스미드를 1 : 1 : 2의 질량비로 HEK293T세포에 공동 형질감염하여, RAAV 및 대조 AAV 입자를 생성하였다.

특히, HEK293T 세포를 컴피턴트 DMEM 배지에서 배양하고, 형질감염 24 시간 전에 세포를 접종하였다. 형질감염 직전에, 배지를 2% FBS를 함유한 신선한 DMEM로 교체하였다. PEI-MAX을 형질감염용 시약으로 하였다. 감염 세포에 형질감염시킨 후, RPS를 포함하는 전이 유전자 플라스미드를 전사하여 패키징될 RNA 게놈을 생성하였다. 그 후 형질감염 후 2일째 및 5일째에 상등액을 수집하고, 5일째에 형질감염된 세포를 수득하였다. RAAV 및 대조 AAV 입자는 이오딕사놀 밀도 구배를 통해 초원심 분리 및 정제하였다.

3. 패키징된 게놈의 검출

정제된 RAAV 및 대조 AAV 입자를 우선 37°C에서 2시간 동안 뉴클레아제(데옥시리보뉴클레아제 I 및 리보뉴클레아제 I 포함)로 처리하여, 바이러스 입자를 제외하고 존재할 수 있는 핵산을 제거하였다. 그 다음, 뉴클레아제 및 RAAV 또는 대조 AAV 입자를 단백질 효소 K/SDS 소화에 의해 65°C에서 약 3시간 동안 변성시켜, 상기 바이러스 입자를 파열시켜, 그 중에 패키징된 게놈을 방출하였다. 그 후 페놀/클로로포름 추출을 통해, 방출된 바이러스 게놈을 함유한 뉴클레아제 내성 폴리뉴클레오티드를 추출 및 정제하였다.

대조 AAV 및 RAAV 입자의 DNA 게놈 역가를 검출하기 위해, Q-PCR을 사용하여 뉴클레아제 내성 폴리뉴클레오티드를 직접 분석하였다. Q-PCR에서 바이러스 게놈 상의 WPRE 서열에 특이적인 한쌍의 WPRE 프라이머(이하의 서열표에 도시된 바와 같음)를 사용하여 대조 AAV 또는 RAAV 입자에 캡시드화된 임의의 DNA 게놈을 검출 및 정량하였다.

대조 AAV 및 RAAV 입자의 RNA 게놈 역가를 검출하기 위해, 캡시드화된 RNA 게놈에 대해 역전사를 수행하기 전에, 데옥시리보뉴클레아제 I로 DNA를 소화시켜제거하여 대조 AAV- 또는 RAAV-에 캡시드화된 임의의 DNA 게놈을 제거하고, 얻은 cDNA를 Q-PCR 주형으로 사용하며, 상기 동일한 WPRE 프라이머쌍으로 WPRE 서열을 검출 및 정량하였다. 불완전한 DNA 제거로 인해 존재할 수 있는 임의의 잠재적 잔류 DNA를 검출 및 정량하기 위해, DNA 제거 단계 이후에 Q-PCR을 사용하여 직접 (역전사가 없음)샘플을 증폭시키고, 상기 동일한 WPRE 프라이머쌍으로 WPRE(DNA) 서열을 검출하며, 상기 프라이머는 모든 기타WPRE 서열에 특이적인 PCR 반응에도 사용된다.

4. 패키징 효율의 비교

pssAAV-tdTomato 작제물(양단에 야생형 ITR 구비)을 함유한 기존 전이 유전자 플라스미드 및 AAV-DJ를 위한 기존 패키징 플라스미드를 사용하여 대조AAV 입자를 생산할 때, 절때 다수 입자는 WPRE 서열을 갖는 DNA 게놈을 포함하였다. 아주 가끄ㅁ, RNA 게놈도 입자에 패키징된다(표지이 “RNA”인 스트립은 “DNA”로 표지된 스트립에 비해 약 5 개의 수량급이 낮다). 잔류 DNA의 존재는 RNA의 존재와 상당하고, 이는 역전사 이전에, 패키징된 DNA 게놈에 대한 데옥시리보뉴클레아제 I의 소화 효율이 낮기 때문일 수 있다.

흥미롭게도, 재조합 패키징 플라스미드 DJ-MCP(Rep78 및 68 단백질 N 말단에 융합된 MCP)로 DJ를 대체할 때, DNA 게놈의 패키징은 다소 저하되나(약 0.5개의 수량급이 낮음), 바이러스 게놈 분포 패턴은 거의 같고, 여기서 DNA 패키징은 RNA 패키징보다 약 5개의 수량급이 높았다. 이러한 결과에 따르면, MCP를 Rep78/68 단백질의 N 말단에 융합하는 것은 이들의 자연 기능을 현저하게 파괴하지 않는 것으로 나타났다(도 8b).

아울러, pssAAV-tdTomato 작제물 양단에서 ITR을 제거하여, CTWS 작제물을 생성하고, DNA 패키징이 현저히 제거되었다. 어떠한 패키징 플라스미드(DJ 또는 DJ-MCP)를 사용하든 CTWS 작제물(무 ITR)에 의해 생성된 패키징 DNA는 약 4개의 수량급이 낮아졌고, 심지어 패키징 RNA는 더 적다.

그 외, ITR이 없는 바이러스 게놈 상의 WPRE의 3’과 SV40 폴리A 신호의 5’ 사이에 RPS(MS2)의 하나의 또는 3개의 복제를 추가하는 것을 통해, 각각 RAAV 전이 유전자 플라스미드, CTWMS 및 CTWM3S를 얻었다. MCP가 없는 경우, CTWS의 게놈 분포 패턴과 같이 CTWMS 및 CTWM3S 작제물은 거의 DNA 또는 RNA 게놈으로 캡시드화될 수 없다. 놀랍게도, DJ 대신 DJ-MCP를 패키징 플라스미드로 사용하여 DNA와 RNA 게놈 사이의 패키징 효율 차이를 현저하게 역전하였고, 절때 다수의 패키징된 게놈은 RNA이다.

CTWS/DJ-MCP에 비해, CTWMS/DJ-MCP 및 CTWM3S/DJ-MCP의 패키징된 RNA 게놈수는 각각 100배 및 400배 높으나, 3자의 DNA 패키징수는 현저한 차이가 없다. 이러한 결과에 따르면, MCP-Rep78/68 융합물은 특이적으로 CTWMS 및 CTWM3S플라스미드의 RNA전사체에 삽입된 RPS, MS2를 인식할 수 있고, 이들의 RNA가 RAAV 입자에 패키징되도록 촉진하며, CTWM3S 작제물에서 RPS의 3개의 복제는 하나의 복제에 비해 더욱 우수한 RNA 패키징 효율을 제공하였다(도 8b).

결론적으로, MS2/MCP쌍을 기존 AAV 패키징 시스템에 도입하여 MCP-Rep78/68 융합물의 존재 하에 MS2를 포함하는 RNA 게놈을 AAV 입자에 패키징함으로써, RAAV 입자를 생성하였다. 원하지 않는 DNA 패키징은 CTWM3S/DJ-MCP를 사용하여 생성된 전체 바이러스 입자군의 약 10%만 차지하였다.

다시 말해서, 인공/이종 RNA 패키징 신호(RPS)- MS2 서열을 그 동종 결합 단백질MCP와 함께 사용하여, 천연 DNA 바이러스 패키징 신호 쌍(즉ITR 및 Rep)을 대체하여, RNA가 다른 DNA 바이러스에 패키징되는 효율을 현저하게 강화하는 동시에 동일한 DNA 바이러스에서 DNA의 고유 패키징을 억제할 수 있다.

실시예 4 RAAV의 원하지 않는 DNA 패키징을 줄이는 확대된 플라스미드 백본

이 실시예는 스터퍼 서열을 플라스미드의 백본에 삽입하여 AAV 전이 유전자 플라스미드의 백본 크기를 증가함으로써 원하지 않는 DNA가 RAAV 입자에 패키징되는 것을 줄일 수 있는 것을 입증한다.

실시예 3에서 RAAV 입자를 위한 CTWMS 및 CTWM3S 작제물은 ITR을 갖지 않고, RAAV 생산에 역방향 패키징이 존재하지 않으나, RAAV 전이 유전자 플라스미드의 상대적으로 작은 사이즈(5-6 kb)가 여전히 원하지 않는 DNA 패키징으로 이어질 수 있다고 추측된다.

따라서, 3266 bp의 비코딩 서열(스터퍼 서열; 이하 서열표 참조)을 CTWM3S의 tdTomato 발현 카세트의 업스트림에 삽입하여, CTWM3S 전이 유전자 플라스미드의 백본 길이를 늘리고, 얻은 작제물을 L-CTWM3S로 명명하였다. 플라스미드의 개략도는 도 9a에 나타낸 바와 같다.

실시예 3에 사용된 기존 AAV 게놈 작제물 pssAAV-tdTomato 및 RAAV 게놈 작제물 CTWM3S을 본 명세서의 대조로 사용하였다. 실시예 3과 동일하게, CTWM3S 또는 L-CTWM3S전이 유전자 플라스미드를 패키징 플라스미드DJ-MCP 및 헬퍼 플라스미드와 HEK293T세포에 공동 형질감염시켜 RAAV 입자를 제조하고, 얻은 RAAV 입자를 정제하며 바이러스 게놈을 정량하였다. 동일한 한쌍의 WPRE 프라이머를 AAV 및 RAAV 입자에 캡시드화된 임의의 DNA 및 RNA 게놈의 검출 및 정량에 사용하고, 바이러스 게놈에서 CAG 프로모터 서열과 특이적인 다른 한쌍의 CAG 프라이머를 Q-PCR에 사용하여, 임의의 기능적 DNA(즉 CAG 프로모터 서열을 함유하고 기능적 전이 유전자 단백질을 발현시킬 수 있는 DNA)를 검출 및 정량하였다.

패키징된 RNA 게놈은 CAG 프라이머로 검출할 수 없는 것을 유의하게 되는데, 이에 CAG 프로모터가 포함되지 않고, CAG 프라이머를 갖는 도면 중의 RNA 칼럼은 백그라운드 RNA 신호를 대표하기 때문이다(도 9b 참조).

놀랍게도, Q-PCR에 어떠한 프라이머를 사용하든 L-CTWM3S 군의DNA 게놈 역가는 모두 CTWM3S 군의 역가보다 약 2배 낮았다(도 9b 및 도 9c 참조). CTWM3S 및 L-CTWM3S 군의RNA 게놈 역가는 거의 동등하였다(도 9c 참조). CTWM3S 및 L-CTWM3S전이 유전자 플라스미드로부터 전사된 RNA에 CAG 프로모터 서열이 없으므로, 패키징된 RNA 게놈은 한쌍의 WPRE 프라이머만으로 검출할 수 밖에 없다(도 9c).

결론적으로, 전이 유전자 플라스미드의 백본 길이를 늘리면 그 RNA 패키징에 영향을 미치지 않고 RAAV 입자의 원하지 않는 DNA 패키징을 줄일 수 있고, 이는 AAV 입자에서 DNA 패키징 시스템의 해체 및 RNA 패키징 시스템의 구축은 2개의 단독적인 라인이고, 상기 긴 스터퍼 서열이 후속 실시예의 RAAV 전이 유전자 플라스미드에 사용되는 것을 보여준다.

실시예 5 별도의 전이 유전자를 위한 RAAV-MS2/MCP 시스템 사용

별도의 전이 유전자에 대한 RAAV-MS2/MCP 시스템의 보편적인 적용성을 검증하고, 관찰된 RNA 패키징이 단지 사용된 리포터 유전자와 관련된 허상이 아닌 것을 보장하기 위해, Cre재조합 효소 발현 카세트를 함유하는 일련의 AAV 및 RAAV 전이 유전자 플라스미드를 생성하였다.

기존 pssAAV-Cre(도 8a 중 pssAAV-tdTomato 작제물 중의 tdTomate 코딩 서열을 Cre 코딩 서열로 대체) 및 대응되는 L-CCWS 작제물(도 8a 중 CTWS 중의 tdTomate 코딩 서열을 Cre 코딩 서열로 대체하고, 실시예 4 중의 스터퍼 서열을 삽입)을 대조로 하고, 여기서 두번째 C는 Cre재조합 효소 전이 유전자를 대표한다. tdTomate 코딩 서열을 Cre 코딩 서열로 대체한 후, 실시예 4의 L-CTWM3S 작제물도 L-CCWM3S 작제물로 다시 설계하였다.

Cre 전이 유전자 플라스미드를 패키징 플라스미드 DJ 또는 DJ-MCP 및 헬퍼 플라스미드와 함께 HEK293T세포에 공동 형질감염시켜, 각각 AAV 및 RAAV 입자를 생성하였다. 얻은 바이러스 입자를 정제하고, 실시예 3에서와 같이 바이러스 게놈을 정량하였다.

AAV-Cre 및 RAAV-Cre의 경우, AAV-tdTomato 및 RAAV-tdTomato와 동일한 바이러스 게놈 분포 결과를 얻었다. pssAAV-Cre의 경우, 대다수 바이러스 입자는 DNA 게놈을 포함하고, DNA 게놈 역가는 RNA 게놈 역가보다 약 4-5개의 수량급이 높았다. L-CCWS의 경우, DNA 및 RNA 패키징 신호 둘 모두가 결핍되기에, DNA 및 RNA 게놈은 거의 캡시드화되지 않았다. L-CCWM3S의 경우, L-CCWS/DJ-MCP에 비해, DJ-MCP의 RNA 패키징이 약 200배 현저히 향상되었고, 원하지 않는 DNA를 포함한 바이러스 입자가 전체 바이러스 입자 군체의 약 1%만 차지하였다(도 10a 및 10b).

DJ-MCP 융합물은 RNA 패키징에 도움이 될 뿐만 아니라, DNA 패키징 능력을 보류하므로, 동시에 DNA 패키징 신호(ITR) 및 RNA 패키징 신호(MS2의 3개의 복제)를 함유한 작제물에서 그 성능을 평가하였고, 상기 작제물은 pssAAV-Cre 작제물의 WPRE와 SV40 폴리A 사이에 MS2의 3개의 복제를 삽입하여 구축되었으며, pssAAV-Cre-MS2X3으로 명명하였다. 결과에 따르면, MCP가 없는 경우, 대다수 바이러스 입자는 패키징된 DNA 게놈을 함유하고, RNA 패키징 신호가 있거나 없을 때 무시 가능한 양의 RNA 게놈이 패키징된다. DJ 대신 DJ-MCP를 패키징 플라스미드로 사용하여 RNA결합 신호와 조합하는 경우, RNA 패키징이 현저히 개선되고, 또한 놀랍게도, 증가된 RNA 패키징은 pssAAV-Cre-MS2X3 작제물의 DNA 패키징에 대해 현저한 영향을 미치지 않았다(도 11b). 다른 관점에서도, DNA 패키징 신호-ITR을 제거하지 않아도, MS2/MCP쌍의 도입은 RNA 패키징을 현저히 증가시킬 수 있는 것으로 나타났고, 이는 AAV 입자에서 DNA 패키징 시스템의 해체 및 RNA 패키징 시스템의 구축은 2개의 단독적인 라인이고, ITR을 제거는 RPS/RBP쌍의 도입을 통해 RNA 패키징을 증가시키는 필수적인 기초가 아닌 것을 나타낸다.

결론적으로, 상기 대상 RAAV-MS2/MCP 시스템은 통상적으로 상술한 Cre재조합 효소와 같은 임의의 전이 유전자에 적용될 수 있다. 흥미롭게도, RAAV-Cre 작제물은 RAAV-tdTomato 작제물에 비해 더욱 우수한 수율을 발생하였다. 어떠한 특정 이론에 얽매이기를 원하지 않지만, 이는 tdTomato mRNA에 비해, Cre mRNA의 2차 구조가 더욱 간단하기 때문일 수 있고, 이는, rna.tbi.univie.ac.at/cgi-bin/RNAWebSuite/RNAfold.cgi에서 발견한 예측과 같이 온라인 RNA 2차 구조 예측에 기초한 것이다.

실시예 6 RAAV 생산 시스템의 최적화 및 최적화된 RAAV 입자 특성의 감정

Rep68 및 Rep78 단백질(Rep68/78)의 엔도뉴클레아제 활성은 AAV 입자의 기존 DNA 패키징 과정의 DNA 게놈 복제에 지극히 중요하다. 만약 기능적 trs-엔도뉴클레아제가 없다면, 새로 합성된 바이러스 ssDNA를 방출하여 패키징에 사용할 수 없다. 본 실시예에서 trs-엔도뉴클레아제의 활성을 파괴하여 RAAV 입자의 원하지 않는 DNA 패키징을 더욱 줄일 수 있는지 여부에 대해 연구하였다.

이를 연구하기 위해, 3개의 trs-엔도뉴클레아제 음성 돌연변이체, 즉 DJ-MCP(Y156F, 여기서 Y156F 돌연변이가 Rep68 및 Rep78 단백질의 공유 서열에 위치하고, 즉 Rep68-Y156F 및 Rep78-Y156F), DJ-MCP(KDE-mu) 및 DJ-MCP(EKE-mu)(이하 서열표)를 구축하였다.

우선 DNA 및 RNA 패키징 신호 둘 모두를 함유한 전이 유전자 플라스미드 pssAAV-Cre-MS2X3으로 (실시예 5에서와 같이) DJ-MCP(Y156F)의 DNA 및 RNA 패키징 효율을 평가하였다. DJ 및 DJ-MCP를 패키징 플라스미드 대조로 설정하였다. 실시예 3에서와 같이 바이러스 입자를 생성, 정제 및 적정하였다.

결과에 따르면, DJ-MCP의 Y156F 돌연변이는 ITR에 의해 매개되는 pssAAV-Cre-MS2X3의 DNA 패키징을 현저히 감소시키고, RNA 패키징에 영향을 미치지 않는다.

따라서, 상기 실시예에 나타낸 바와 같이 DNA 패키징 신호 ITR을 제거하는 외에, DNA 패키징 과정에 참여하는 기능적 단백질(예컨대 Rep78/68 단백질)을 변형(예를 들어 돌연변이)시켜, DNA 패키징에 관련된 기능을 약화시키거나 제거하고, 이는 AAV 입자의 기존 DNA 패키징을 줄이거나 억제하는 다른 전략으로 할 수 있다(도 13a).

그 후, 실시예 5의 L-CCWM3S를 RAAV 전이 유전자 플라스미드로 사용하여 pssAAV-Cre-MS2X3을 대체하여, 바이러스 게놈을 제공하였다. trs-엔도뉴클레아제 양성의 DJ-MCP를 DJ-MCP(Y156F)에 대한 대조로 사용하였다. 실시예 3에서와 같이 바이러스 입자를 생성, 정제 및 적정하였다. 여기서 2쌍의 프라이머로 바이러스 게놈을 적정하고, 한 쌍은 상기 WPRE 서열을 타겟팅하는 데 사용되며, 다른 한 쌍(이하 서열표 참조)은 Cre 코딩 서열의 5’ 말단을 타겟팅하는 데 사용된다.

결과에 따르면, Rep78/68 단백질의 Y156F 돌연변이는 원하지 않는 DNA 패키징을 약 10배 줄일 뿐만 아니라, 원하는 RNA 패키징을 약 50% 증가시켰다. Q-PCR에서 사용된 2쌍의 프라이머(즉, WPRE 프라이머쌍 및 Cre프라이머쌍)에 대해, 패키징된 DNA와 RNA 게놈 사이의 패키징 효율 차이 패턴은 거의 같았다(도 12a-12b).

두 가지 다른 trs-엔도뉴클레아제 돌연변이체 DJ-MCP(KDE-mu) 및 DJ-MCP(EKE-mu)를 더 테스트하고, 이는 DJ-MCP(Y156F)와 같은 원하지 않는 DNA 패키징을 줄이는 능력을 가지는 것을 입증하였으나, DJ-MCP(Y156F)만이 개선된 RNA 패키징을 보인다(도 13b).

MCP의 2개의 복제를 Rep 78/68 단백질의 N 말단(MCPx2-Rep78 및 MCPx2-Rep68)에 융합하여 원하지 않는 DNA 패키징을 줄이는 결과를 구현할 수도 있는 것을 추가로 입증하였다(도 13b).

은염색 SDS-PAGE로AAV 및 RAAV 입자의 성분을 분석하고, RAAV 캡시드도 3가지 VP 단백질(VP1, VP2 및 VP3)로 구성되며, 여기서 VP1/2/3 비율은 기존 AAV 입자와 유사하였다(도 12c).

RAAV 입자의 형태를 분석하기 위해, 10 μL의 정제된 AAV 및 RAAV 입자를 300 μm의 카본 피복 피올로폼(Pioloform) 코팅 구리망에 놓고, 실온에서 2분간 인큐베이션하였다. 여분의 샘플을 여지로 흡수하고, 즉시 10 μL의 염색제(3% 포스포텅스텐산)로 대체하며, 2분간 정치시킨 후 다시 흡수하였다. Talos L120C 투과 전자 현미경을 사용하여 샘플을 시각화하였다. RAAV 입자는 형태학적으로 기존 AAV 벡터와 유사하고, 여기서 게놈을 감싼 완전 바이러스 입자는 25-nm의 실심 구체이고, 게놈을 감싸지 않은 중공 바이러스 입자는 25-nm의 도넛형 구조이다(도 12d).

결론적으로, AAV 생산의 DNA 패키징 과정에 참여하는 기능적 단백질(Rep 단백질 포함)의 돌연변이는 그 DNA 패키징 관련 기능을 약화시키거나 제거하고, DNA 패키징 신호ITR를 제거하며, 이는 RAAV 입자의 원하지 않는 DNA 패키징을 줄이거나 억제하는 최선의 전략이다. 생성된 RAAV 입자는 기존 AAV 입자와 유사한 조성 및 형태를 가진다.

실시예 7 기능적 단백질을 발현하는 RAAV 벡터

이 실시예는 대상 RAAV 벡터가 감염성을 가지고, 유전자 전달 벡터로 사용할 수 있는 것을 입증한다.

Cre-loxP 시스템는 고도 민감 시스템이고, 본 발명의 RAAV 벡터의 감염성을 연구하는 데 사용된다. homo-Ai9(loxP-tdTomato-리포터 유전자 시스템 포함) 마우스에서 단리된 마우스 배아섬유아세포(MEF)를 실시예 5에서 정제된 AAV(pssAAV-Cre/DJ) 또는 RAAV(L-CCWM3S/DJ-MCP(Y156F)) 벡터와 밤새 인큐베이션하고, 기존 AAV 벡터에 대한 7 MOI 및 RAAV 벡터에 대한 3개의 MOI를 포함한 감염 다중도(MOI)(감염 기간에 세포당 추가된 비리온수)를 설정하였다. 상기 5’ 말단 Cre 프라이머로 Cre 코딩 서열을 검출하고 정량한 우세 게놈 역가를 감염 역가로 하였다. 다시 말해서, DNA 게놈 역가를 기존 AAV 벡터에 사용하고, RNA 게놈 역가를 RAAV 벡터에 사용하였다.

특히, 감염 약 24시간 전에 Ai9-MEF세포를 약 5 × 10⁴개의 세포/웰로 48웰 플레이트에 접종하였다. 그 후 AAV 벡터 또는 RAAV 벡터를 0.5 mL의 2% FBS 함유 DMEM와 완전히 혼합하였다. 접종된 세포 배지를 제거하고, 그 후 상기 세포를 혼합된 AAV 또는 RAAV 벡터와 함께 37°C에서 밤새 인큐베이션하였다. 상이한 시점에서 감염 세포를 수집하고 RNA 및 DNA를 분석하였다. 상술한 바와 같이, Cre 코딩 서열 5’ 말단을 타겟팅하는 한 쌍의 프라이머는 벡터 유래 특이적 Cre 코딩DNA 및 mRNA를 검출하는 데 사용된다. 감염 후 (p.i) 매일 형광 사진을 촬영하고, 감염 5일 후에 유세포 분석법으로 형광 양성 세포를 정량하였다.

mRNA 분석 결과에 따르면, 감염 2시간 후에, RAAV 감염 세포에서 이미 특이적 mRNA가 검출되었고, 감염 후 6시간에 피크값에 달하고, 그후 저하된다. 기존 AAV 벡터 감염 세포에서, 감염 2 시간 후에 현저한 전사가 검출되지 않았으나, 감염 6 시간 내지 20 시간 후에 전사된 mRNA의 쾌속 증가가 관찰되고, 30 시간에 정체기에 도달하였다. RAAV 벡터의 결과와 반대로, 기존 AAV 벡터 감염 세포에서 mRNA 수준은 정체기에 도달한 후 저하되지 않았다. 모든 샘플에서 Cre mRNA의 복제수는 MOI와 유의한 상관 관계를 가진다(도 14a-14b 및 도 15A). 동시에, mGAPDH mRNA를 기준 전사물(하우스키핑 유전자)로 하여 테스트하고, 예상한 바와 같이, 모든 샘플 중의 mGAPDH mRNA 수준은 차이가 없었다(도 15c).

DNA 결과는 mRNA 결과와 완전히 다르다. 기존 AAV 및 RAAV 벡터는 거의 동일한 DNA복제수 패턴을 가지고, 대부분 DNA 게놈은 감염 2시간 후에 감염된 세포에서 검출되고, 그 후 감염 후 2시간에서 20시간에 다소 증가되는 데 이는 RAAV 감염 세포 중 mRNA 수준의 추세와 매우 유사하였다. 그 후, DNA 수준은 정체기에 도달하거나 천천히 저하된다. Cre DNA의 복제수는 모든 샘플 중의 MOI와도 유의한 상관관계를 가지나, RAAV 감염 세포에서 검출된 Cre DNA 수량은 훨씬 낮고(RAAV-CCWM3S MOI = 100 또는 300군의 DNA 복제수가 AAV-Cre MOI = 1군의DNA 복제수 미만이고, RAAV-CCWM3S MOI = 1000군의 DNA 복제수가 AAV-Cre MOI = 3군의 DNA 복제수 미만이다)(도 14c 및 도 15b). 유사하게, 다른 하나의 하우스키핑 유전자36B4의 DNA 수준을 기준 유전자로 정량하고, 예상대로, 모든 샘플에서 DNA 수준의 현저한 차이가 관찰되지 않았다(도 15d).

AAV-Cre 또는 RAAV-CCWM3S 벡터의 성공적인 감염은 기능적 Cre재조합 효소의 발현을 가져다주고 Ai9-MEF세포 중의 tdTomato발현을 구출하며, 따라서 감염 세포의 형광 사진을 촬영 및 분석하여 tdTomato적색 형광을 발산하는 세포의 계수를 통해 바이러스 벡터의 감염성을 평가하였다. 결과로부터 알 수 있다시피 RAAV-CCWM3S에 의해 생성된 형광 양성 세포의 수량은 10배 낮은 MOI를 갖는 AAV-Cre에 의해 생성된 수량에 상당하다(도 14d). RAAV 감염 세포에서 tdTomato의 낮은 형광 강도는 그 중에 전달된 Cre mRNA의 짧은 수명, 및 제한적인 양의 번역된 Cre재조합 효소가 homo-Ai9-MEF세포에서 tdTomato발현 카세트의 2개의 복제를 구출할 수 없기 때문일 수 있다(도 16).

DNA 역가 및 세포 계수 데이터의 결과를 비교하여, RAAV-CCWM3S 감염 세포의 대부분 tdTomato 적색 형광 신호는 Cre mRNA를 포함한 RAAV 입자에 의해 생성된 것을 보여준다.

결론적으로, 본 발명의 RAAV 벡터는 기능적 Cre mRNA를 세포에 전달하고, 기능적 Cre재조합 효소를 발현시킬 수 있다.

실시예 8 RAAV 입자에 의한 세포로의 기능적 유전자 체외 일시적 전이

실시예 7에서와 같이 AAV-Cre 또는 RAAV-CCWM3S 전달을 거쳐 생성된 Cre 단백질의 정확한 수명을 확정하기 위해, 감염 24시간 전에, 5 × 10⁴개의 세포/웰의 세포 컨플루언스로 Ai9-MEF세포를 접종하고, 그 후 상술한 바와 같이, AAV-Cre(MOI = 300) 또는 RAAV-CCWM3S(MOI = 10,000) 벡터와 밤새 인큐베이션하였다. 감염 후, 여러 시간점에 세포를 수집하고, 세포 수집 전에 형광 사진을 촬영하였다.

AAV-Cre의 경우, Cre 발현은 전4일에 증가하고, 그 후 저하된다. 이에 비해, RAAV-CCWM3S 전이 약 24시간 후에 이미 소량의 Cre이 검출되었고, 2일째 이후에 사라졌다. 이러한 쾌속 발현 및 분해 현상은 전달된 기능적 Cre mRNA의 즉각적인 출현 및 짧은 출연에 인한 것일 수 있다(도 17a 및 17b).

실시예 9 RAAV 입자에 의한 Ai9 마우스로의 기능적 유전자의 생체내 일시적 전이

이 실시예는 RAAV 입자를 생체내 유전자전달 공구로 사용할 수 있고 기능적 Cre재조합 효소를 일시적 발현하는 것을 입증한다.

RAAV 입자의 생체내 감염성을 연구하기 위해, Ai9- 마우스(2.5-4개월)를 마취하고 각각 우측 해마 체내(그 좌표: 전후(A/P)= -1.7 mm, 중 외측(M/L)= -1.0 mm, 배복측(D/V)= -2.1 mm)에 1 μL AAV-Cre(pssAAV-Cre/DJ)(고조제량: 1E9 vg/ 마우스; 저조제량: 3E6 vg/ 마우스) 또는 1 μL RAAV-Cre(L-CCWM3S/DJ-MCP(Y156F))(1E9 Vg/ 마우스)를 주사하였다. 그 외, 본 측청에서 AAV 캡시드-DJ를 대조로 사용하였다.

AAV 또는 RAAV 주사 후 6주에, 마우스를 마취하고 실온에서 pH 7.4의 PBS로 경심 관류한 다음 새로 제조한 인산염 완충제(PB) 중의 차가운 4% 파라포름알데히드(PFA)로 관류하였다. 뇌를 4% PFA에서 밤새 후고정하였다. 고정한 뇌는 탈수 후 OCT로 포매하여 동결 절편에 사용된다. 동결절편기(Leica CM1950)를 사용하여 뇌를 20 μm 두께로 자르고, 절편을 직접 슬라이드에 놓았다. 슬라이드는 60°C에서 1-2 시간 동안 베이킹한 후, PBS에서 5% BSA 혈청으로 1시간 동안 차단하였다. 그 후 실온에서 슬라이드와 항 Cre의 1차 항체(10536; 세포신호기술회사(Cell Signaling Technology); 1 : 800 희석)를 PBS(0.1% Triton-X)의 5% BSA에서 밤새 인큐베이션하였다. PBS로 5회 세척 후, 슬라이드를 PBS의 1% BSA에서 인큐베이션하고, 상기 PBS에 1차항체 및 DAPI에 대한 2차 항체가 함유되어 있다(D3571, Invitrogen). 사용된 2차 항체는 Alexa Fluor 488당나귀 항 토끼 IgG(711-545-152, Jackson ImmunoResearch사)(1 : 1000으로 희석). Nikon C2si+공초점 현미경으로 이미지를 획득하였다.

tdTomato발현 시스템의 형광을 도시하는 이미지에 따르면, RAAV-Cre은 Ai9- 마우스의 해마의 세포를 감염시키고 tdTomato의 발현을 구출하였다. 동일한 조제량에서 RAAV-Cre 조의 감염된 세포수는 AAV-Cre 조보다 적다. 그러나, AAV-Cre 감염의 저조제량군(30배 낮은 조제량)에 비해, RAAV-Cre감염은 더 많은 tdTomato양성 세포를 생성하였다.

매우 흥미롭게도, AAV-Cre 감염의 고조제량 및 저조제량군에서 모두 Cre발현이 용이하게 검출되었지만, 비록 검출된 tdTomato 형광은 한때 Cre의 존재만 입증하나 RAAV-Cre 감염 세포에서 현저한 Cre 발현이 검출되지 않았다.

전반적으로, 동일한 고조제량 1E9 vg/마우스에서 둘 모두의 형광 사진(양성세포 계수)에서 도시된 바와 같이(도 21a와 도 21c 대비), RAAV-Cre은 기존 AAV-Cre에 비해 낮은 형질도입 효율을 가지고, 하나의 성공적으로 형질도입된 AAV DNA 게놈에서 단백질 번역을 위한 복수의 mRNA가 전사될 수 있기 때문이다. Cre발현 수준을 추가로 평가하기 위해, 1E9 vg/ 마우스의 고조제량 AAV-Cre를 3E6 vg/ 마우스의 저조제량으로 저하시켜, AAV-Cre의 형질도입 효율을 RAAV-Cre의 형질도입 효율에 대해 정규화하고(도 21b), 또한 결과에 따르면, 비록 형광 사진(양성 세포 계수)에 도시된 바와 같이, RAAV-Cre의 형질도입 효율이 AAV-Cre의 저조제량조보다 우수하나, AAV-Cre조에 비해, RAAV-Cre 감염 세포에서 Cre 발현이 검출되지 않았고, 이는 RAAV-Cre조의 Cre 발현은 일시적이나 기능적임을 보여준다.

실시예 10 RAAV 시스템의 별도의 RPS/RBP 쌍

실시예 3-8에서 사용된 MS2/MCP 쌍을 제외하고, RAAV 패키징에 대해 별도의 두 쌍의 RNA어댑터/어댑터- 결합 단백질(또는 RNA 패키징 신호/RNA 결합 단백질, 본 명세서 중의 “RPS/RBP”)에 대해 테스트하였다: (1) PP7 결합 부위/PP7박테리오파지 외피 단백질(“PP7/PCP” 또는 “PCP” 또는 “P” 또는 L-CCW P 3S 중의 “P”로 약칭) 및 (2) Com 결합 부위/박테리오파지 COM 단백질(“com/COM” 또는 “COM” 또는 L-CCW C 3S 중의 “C”로 약칭) 천연 바이러스 패키징 시스템 MS2/MCP 및 PP7/PCP와 달리, com/COM은 천연적인 바이러스 패키징 시스템이 아니라 박테리오파지 Mu mom유전자의 전사 개시에서 역할을 하는 전사조절 인자로 알려져 있다.

RPS의 3 개의 복제를 휴대하는 전이 유전자 플라스미드(L-CCW P 3S 및 L-CCW C 3S) 및 그 대응되는 패키징 플라스미드[Rep78-Y156F 및 Rep68-Y156F의 N 말단에 융합된 PP7 박테리오파지 외피 단백질(PCP)을 갖는 DJ-PCP(Y156F) 및 Rep78-Y156F 및 Rep68-Y156F의 N 말단에 융합된 박테리오파지 COM 단백질(COM)을 갖는 DJ-COM(Y156F)]를 구축하였다. 실시예 3에서와 같이 바이러스 입자를 생성, 정제 및 적정하였다.

결과에 따르면, 실시예 3-8의 각 측면에서 잘 입증된 MS2/MCP 쌍과 유사하게, PP7/PCP 및 com/COM 이 두쌍도 RAAV 입자의 현저한 RNA 패키징을 가져다줌으로써(도 18), 각종 RAAV 패키징 시스템의 범위를 확대하였다.

실시예 11 다양한 AAV 혈청형에 대한 RAAV 시스템의 응용

실시예 3-9에서 테스트한 AAV-DJ를 제외한 각종 AAV 혈청형에 대한 본 발명 RAAV 패키징 시스템의 응용을 연구하기 위해, AAV-DJ에서 두쌍의 RPS/RBP(MS2/MCP 및 com/COM) 및 다른 3가지 상이한 AAV 혈청형(AAV5, AAV8 및 AAV9)을 검사하였다. 실시예 3에서와 같이 바이러스 입자를 생성, 정제 및 적정하였다.

RAAV-MS2/MCP 및 RAAV-com/COM 시스템은 모든 4가지 혈청형에서 작동이 양호하여, 이는 RAAV 패키징 시스템이 상이한 AAV 혈청형(즉, AAV-DJ에 한정되지 않음)에 대한 보편 적용성을 보여준다. RBP의 존재 하에, 대응되는 RPS를 함유하는 Cre RNA 게놈은 효과적으로 상응한 RAAV 입자에 캡시드화된다. RNA가 패키징된 RAAV 입자의 수율은 혈청형에 따라 다르나, RAAV5, RAAV8 및 RAAV9 입자에서 모두 RAAV-DJ보다 높은 수율을 갖는다(도 19).

실시예 12 AAP 및 MCP 융합 단백질의 RAAV 수율 향상

통상적으로 , AAV는 그 천연 바이러스 게놈에서 독특한 조립 활성화 단백질(AAP)을 코딩하고, 상기 단백질은 캡시드 조립에 대해 극히 중요하다. 특히, AAP가 캡시드 단백질 안정 및 기능적 AAV 입자 생성에 대해 극히 중요한 것으로 밝혀졌다.

AAP-MCP(AAP의 C 말단에 융합되는 MCP를 가짐) 또는 MCP-AAP(AAP의 N 말단에 융합된 MCP를 가짐) 융합 단백질 발현 카세트를 역방향으로 실시예 6-10에서 사용된 패키징 플라스미드 DJ-MCP(Y156F)의 백본에 삽입하고, 얻은 작제물을 각각 DJ-MCP(Y156F)-AM 및 DJ-MCP(Y156F)-MA로 명명하였다. 그 후, 이러한 작제물은 MCP-Rep78/68(Y156F) 융합물 및 AAP-MCP 또는 MCP-AAP 융합물 둘 모두를 발현하고, 단독 MCP-Rep78/68 융합물에 비해, RNA 패키징을 보조하는 RNA 결합 단백질(RBP)의 양을 증가하였다. 실시예 3에서와 같이 바이러스 입자를 생성, 정제 및 적정하였다.

결과에 따르면, 단독 MCP-Rep78/68 융합물에 비해, DJ-MCP(Y156F)-MA 및 DJ-MCP(Y156F)-AM에 RNA가 패키징되어 있는 RAAV 입자의 수율은 각각 약 65% 및 약 35% 향상되었고(도 20a 및 20b), 이는 RBP가 AAV 입자의 패키징 또는 조립에서 작용을 하는 임의의 기타 단백질과 별도로 융합되거나 관련되어, RAAV 입자의 RNA 패키징을 강화할 수 있는 것을 보여준다.

MCP-Rep78/68 없이 단독으로 AAP-MCP 또는 MCP-AAP를 사용하는 것도 본 발명의 범위 내에 포함된다.

서열

이하 상기 실시예에서 참조한 서열을 포함한 일부 서열을 제공한다.

표 A: RBP의 핵산 서열 및 아미노산 서열

표 B: RPS의 핵산 서열

* 서열 요소는 형식 양식(예를 들어, 볼드체 및/또는 이탤릭체 등)에 근거하여 매칭된다.

표 C: Rep 단백질의 핵산 서열 및 아미노산 서열

* 서열 요소는 형식 양식(예를 들어, 이중 밑줄, 볼드체 및/또는 이탤릭체 글꼴 등)에 근거하여 매칭된다.

표 D: AAP 및 MCP 융합 단백질의 핵산 서열 및 아미노산 서열

표 E: 프라이머 서열

* F 및 R는 각각 포워드 프라이머 및 리버스 프라이머를 나타낸다.

표 F: 스터퍼 서열

참조로서 포함

특허 출원 서류, 과학 문헌, 정부 보고, 사이트 및 본 명세서에 인용된 기타 참조 문원을 포함한 각 특허 문서의 모든 개시 내용은 모든 목적을 위해 참조로서 전체가 본 명세서에 포함된다. 용어가 서로 모순되는 경우, 본 명세서를 기준으로 한다. 본 명세서에 공개한 모든 서열표 또는 SEQ ID NO는 전체가 본 명세서에 포함된다.

본 명세서에서 서술한 내용을 보충하는 예시적 프로그램 또는 기타 세부 사항을 제공하는 의미에서 이하 참조 문헌은 명백하게 참조로서 본 명세서에 포함된다.

비록 본 명세서에서 이미 본 발명의 설명적 실시 형태에 대해 설명하였으나, 본 발명은 설명된 것에 한정되지 않고, 본 분야의 당업자가 본 발명의 범위 또는 취지를 벗어나지 않는 전제 하에서 다양한 기타 변경과 변형을 진행할 수 있는 것을 이해해야 한다.

SEQUENCE LISTING <110> HUIGENE THERAPEUTICS CO., LTD. <120> RNA ADENO-ASSOCIATED VIRUS (RAAV) VECTOR AND USES THEREOF <130> 132045-00619 <150> PCT/CN2021/075874 <151> 2021-02-07 <160> 104 <170> PatentIn version 3.5 <210> 1 <211> 145 <212> DNA <213> Adeno-associated virus - 2 <400> 1 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg 60 cgtcgggcga cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcct 145 <210> 2 <211> 113 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 2 tccctctctg cgcgctcgct cgctcactga ggccgcccgg gcaaagcccg ggcgtcgggc 60 gacctttggt cgcccggcct cagtgagcga gcgagcgcgc agagagggag tgg 113 <210> 3 <211> 138 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 3 tccctctctg cgcgctcgct cgctcactga ggccgcccgg gcaaagcccg ggcgtcgggc 60 gacctttggt cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggactagct 120 ccatcactag gggttcct 138 <210> 4 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 4 ctccatcact aggggttcct 20 <210> 5 <211> 145 <212> DNA <213> Adeno-associated virus - 2 <400> 5 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgcccgggc aaagcccggg cgtcgggcga cctttggtcg cccggcctca gtgagcgagc 120 gagcgcgcag agagggagtg gccaa 145 <210> 6 <211> 736 <212> PRT <213> Adeno-associated virus - 1 <400> 6 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly 145 150 155 160 Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro 180 185 190 Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His 260 265 270 Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe 275 280 285 His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn 290 295 300 Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln 305 310 315 320 Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn 325 330 335 Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro 340 345 350 Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala 355 360 365 Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly 370 375 380 Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro 385 390 395 400 Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe 405 410 415 Glu Glu Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp 420 425 430 Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg 435 440 445 Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser 450 455 460 Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro 465 470 475 480 Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn 485 490 495 Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn 500 505 510 Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys 515 520 525 Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly 530 535 540 Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile 545 550 555 560 Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg 565 570 575 Phe Gly Thr Val Ala Val Asn Phe Gln Ser Ser Ser Thr Asp Pro Ala 580 585 590 Thr Gly Asp Val His Ala Met Gly Ala Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu 625 630 635 640 Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn 690 695 700 Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu 705 710 715 720 Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu 725 730 735 <210> 7 <211> 735 <212> PRT <213> Adeno-associated virus - 2 <400> 7 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr 580 585 590 Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp 595 600 605 Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr 610 615 620 Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys 625 630 635 640 His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn 645 650 655 Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln 660 665 670 Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys 675 680 685 Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr 690 695 700 Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr 705 710 715 720 Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 8 <211> 736 <212> PRT <213> Adeno-associated virus - 3 <400> 8 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Gly 130 135 140 Ala Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly 145 150 155 160 Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro 180 185 190 Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Arg Gly Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr 435 440 445 Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser 450 455 460 Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro 465 470 475 480 Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn 485 490 495 Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn 500 505 510 Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly 530 535 540 Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile 545 550 555 560 Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln 565 570 575 Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr 580 585 590 Thr Gly Thr Val Asn His Gln Gly Ala Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu 625 630 635 640 Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 9 <211> 736 <212> PRT <213> Adeno-associated virus - 3 <400> 9 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly 145 150 155 160 Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro 180 185 190 Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr 435 440 445 Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser 450 455 460 Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro 465 470 475 480 Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn 485 490 495 Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn 500 505 510 Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly 530 535 540 Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile 545 550 555 560 Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln 565 570 575 Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr 580 585 590 Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu 625 630 635 640 Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 10 <211> 734 <212> PRT <213> Adeno-associated virus - 4 <400> 10 Met Thr Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser Glu 1 5 10 15 Gly Val Arg Glu Trp Trp Ala Leu Gln Pro Gly Ala Pro Lys Pro Lys 20 25 30 Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro Gly 35 40 45 Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro Val 50 55 60 Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp Gln 65 70 75 80 Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp 85 90 95 Ala Glu Phe Gln Gln Arg Leu Gln Gly Asp Thr Ser Phe Gly Gly Asn 100 105 110 Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Leu 115 120 125 Gly Leu Val Glu Gln Ala Gly Glu Thr Ala Pro Gly Lys Lys Arg Pro 130 135 140 Leu Ile Glu Ser Pro Gln Gln Pro Asp Ser Ser Thr Gly Ile Gly Lys 145 150 155 160 Lys Gly Lys Gln Pro Ala Lys Lys Lys Leu Val Phe Glu Asp Glu Thr 165 170 175 Gly Ala Gly Asp Gly Pro Pro Glu Gly Ser Thr Ser Gly Ala Met Ser 180 185 190 Asp Asp Ser Glu Met Arg Ala Ala Ala Gly Gly Ala Ala Val Glu Gly 195 200 205 Gly Gln Gly Ala Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys 210 215 220 Asp Ser Thr Trp Ser Glu Gly His Val Thr Thr Thr Ser Thr Arg Thr 225 230 235 240 Trp Val Leu Pro Thr Tyr Asn Asn His Leu Tyr Lys Arg Leu Gly Glu 245 250 255 Ser Leu Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp Gly Tyr 260 265 270 Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln 275 280 285 Arg Leu Ile Asn Asn Asn Trp Gly Met Arg Pro Lys Ala Met Arg Val 290 295 300 Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Thr Ser Asn Gly Glu 305 310 315 320 Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Val Gln Ile Phe Ala Asp 325 330 335 Ser Ser Tyr Glu Leu Pro Tyr Val Met Asp Ala Gly Gln Glu Gly Ser 340 345 350 Leu Pro Pro Phe Pro Asn Asp Val Phe Met Val Pro Gln Tyr Gly Tyr 355 360 365 Cys Gly Leu Val Thr Gly Asn Thr Ser Gln Gln Gln Thr Asp Arg Asn 370 375 380 Ala Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly 385 390 395 400 Asn Asn Phe Glu Ile Thr Tyr Ser Phe Glu Lys Val Pro Phe His Ser 405 410 415 Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile 420 425 430 Asp Gln Tyr Leu Trp Gly Leu Gln Ser Thr Thr Thr Gly Thr Thr Leu 435 440 445 Asn Ala Gly Thr Ala Thr Thr Asn Phe Thr Lys Leu Arg Pro Thr Asn 450 455 460 Phe Ser Asn Phe Lys Lys Asn Trp Leu Pro Gly Pro Ser Ile Lys Gln 465 470 475 480 Gln Gly Phe Ser Lys Thr Ala Asn Gln Asn Tyr Lys Ile Pro Ala Thr 485 490 495 Gly Ser Asp Ser Leu Ile Lys Tyr Glu Thr His Ser Thr Leu Asp Gly 500 505 510 Arg Trp Ser Ala Leu Thr Pro Gly Pro Pro Met Ala Thr Ala Gly Pro 515 520 525 Ala Asp Ser Lys Phe Ser Asn Ser Gln Leu Ile Phe Ala Gly Pro Lys 530 535 540 Gln Asn Gly Asn Thr Ala Thr Val Pro Gly Thr Leu Ile Phe Thr Ser 545 550 555 560 Glu Glu Glu Leu Ala Ala Thr Asn Ala Thr Asp Thr Asp Met Trp Gly 565 570 575 Asn Leu Pro Gly Gly Asp Gln Ser Asn Ser Asn Leu Pro Thr Val Asp 580 585 590 Arg Leu Thr Ala Leu Gly Ala Val Pro Gly Met Val Trp Gln Asn Arg 595 600 605 Asp Ile Tyr Tyr Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp 610 615 620 Gly His Phe His Pro Ser Pro Leu Ile Gly Gly Phe Gly Leu Lys His 625 630 635 640 Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro Val Pro Ala Asn Pro 645 650 655 Ala Thr Thr Phe Ser Ser Thr Pro Val Asn Ser Phe Ile Thr Gln Tyr 660 665 670 Ser Thr Gly Gln Val Ser Val Gln Ile Asp Trp Glu Ile Gln Lys Glu 675 680 685 Arg Ser Lys Arg Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Tyr Gly 690 695 700 Gln Gln Asn Ser Leu Leu Trp Ala Pro Asp Ala Ala Gly Lys Tyr Thr 705 710 715 720 Glu Pro Arg Ala Ile Gly Thr Arg Tyr Leu Thr His His Leu 725 730 <210> 11 <211> 724 <212> PRT <213> Adeno-associated virus - 5 <400> 11 Met Ser Phe Val Asp His Pro Pro Asp Trp Leu Glu Glu Val Gly Glu 1 5 10 15 Gly Leu Arg Glu Phe Leu Gly Leu Glu Ala Gly Pro Pro Lys Pro Lys 20 25 30 Pro Asn Gln Gln His Gln Asp Gln Ala Arg Gly Leu Val Leu Pro Gly 35 40 45 Tyr Asn Tyr Leu Gly Pro Gly Asn Gly Leu Asp Arg Gly Glu Pro Val 50 55 60 Asn Arg Ala Asp Glu Val Ala Arg Glu His Asp Ile Ser Tyr Asn Glu 65 70 75 80 Gln Leu Glu Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp 85 90 95 Ala Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly Asn 100 105 110 Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Phe 115 120 125 Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg Ile 130 135 140 Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp Ser 145 150 155 160 Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser Gln 165 170 175 Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp Thr 180 185 190 Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly Ala 195 200 205 Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp 210 215 220 Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu Pro 225 230 235 240 Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val Asp 245 250 255 Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr 260 265 270 Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp Gln 275 280 285 Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg Val 290 295 300 Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser Thr 305 310 315 320 Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp 325 330 335 Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly Cys 340 345 350 Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly Tyr 355 360 365 Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser Ser 370 375 380 Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn 385 390 395 400 Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser Ser 405 410 415 Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val Asp 420 425 430 Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val Gln 435 440 445 Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn Trp 450 455 460 Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser Gly 465 470 475 480 Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met Glu 485 490 495 Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met Thr 500 505 510 Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met Ile 515 520 525 Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu Glu 530 535 540 Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn Arg 545 550 555 560 Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser Ser 565 570 575 Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val Pro 580 585 590 Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp 595 600 605 Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala Met 610 615 620 Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys Asn 625 630 635 640 Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val Ser 645 650 655 Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met Glu 660 665 670 Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln 675 680 685 Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro Asp 690 695 700 Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr Leu 705 710 715 720 Thr Arg Pro Leu <210> 12 <211> 736 <212> PRT <213> Adeno-associated virus - 6 <400> 12 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Phe Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly 145 150 155 160 Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro 180 185 190 Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His 260 265 270 Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe 275 280 285 His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn 290 295 300 Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln 305 310 315 320 Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn 325 330 335 Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro 340 345 350 Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala 355 360 365 Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly 370 375 380 Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro 385 390 395 400 Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe 405 410 415 Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp 420 425 430 Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg 435 440 445 Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser 450 455 460 Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro 465 470 475 480 Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn 485 490 495 Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn 500 505 510 Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys 515 520 525 Asp Asp Lys Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly 530 535 540 Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile 545 550 555 560 Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg 565 570 575 Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp Pro Ala 580 585 590 Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn 690 695 700 Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu 705 710 715 720 Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu 725 730 735 <210> 13 <211> 737 <212> PRT <213> Adeno-associated virus - 7 <400> 13 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asn Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Ala Lys Lys Arg 130 135 140 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln 165 170 175 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro 180 185 190 Pro Ala Ala Pro Ser Ser Val Gly Ser Gly Thr Val Ala Ala Gly Gly 195 200 205 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn 210 215 220 Ala Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 Leu Tyr Lys Gln Ile Ser Ser Glu Thr Ala Gly Ser Thr Asn Asp Asn 260 265 270 Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Lys Leu Arg Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Ile Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn 370 375 380 Gly Ser Gln Ser Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr Ser 405 410 415 Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ala 435 440 445 Arg Thr Gln Ser Asn Pro Gly Gly Thr Ala Gly Asn Arg Glu Leu Gln 450 455 460 Phe Tyr Gln Gly Gly Pro Ser Thr Met Ala Glu Gln Ala Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Cys Phe Arg Gln Gln Arg Val Ser Lys Thr Leu Asp 485 490 495 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His 500 505 510 Leu Asn Gly Arg Asn Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr 515 520 525 His Lys Asp Asp Glu Asp Arg Phe Phe Pro Ser Ser Gly Val Leu Ile 530 535 540 Phe Gly Lys Thr Gly Ala Thr Asn Lys Thr Thr Leu Glu Asn Val Leu 545 550 555 560 Met Thr Asn Glu Glu Glu Ile Arg Pro Thr Asn Pro Val Ala Thr Glu 565 570 575 Glu Tyr Gly Ile Val Ser Ser Asn Leu Gln Ala Ala Asn Thr Ala Ala 580 585 590 Gln Thr Gln Val Val Asn Asn Gln Gly Ala Leu Pro Gly Met Val Trp 595 600 605 Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro 610 615 620 His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly 625 630 635 640 Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro 645 650 655 Ala Asn Pro Pro Glu Val Phe Thr Pro Ala Lys Phe Ala Ser Phe Ile 660 665 670 Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu 675 680 685 Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser 690 695 700 Asn Phe Glu Lys Gln Thr Gly Val Asp Phe Ala Val Asp Ser Gln Gly 705 710 715 720 Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn 725 730 735 Leu <210> 14 <211> 738 <212> PRT <213> Adeno-associated virus - 8 <400> 14 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln 165 170 175 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro 180 185 190 Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly 195 200 205 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ala Thr Asn Asp 260 265 270 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn 305 310 315 320 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr 405 410 415 Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly 450 455 460 Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly 485 490 495 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His 500 505 510 Leu Asn Gly Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr 515 520 525 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Gly Ile Leu Ile 530 535 540 Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val 545 550 555 560 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 Glu Glu Tyr Gly Ile Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala 580 585 590 Pro Gln Ile Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe 660 665 670 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 Asn Leu <210> 15 <211> 736 <212> PRT <213> Adeno-associated virus - 9 <400> 15 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 16 <211> 738 <212> PRT <213> Adeno-associated virus - 10 <400> 16 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 Gly Lys Lys Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln 165 170 175 Thr Gly Glu Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro 180 185 190 Pro Ala Gly Pro Ser Gly Leu Gly Ser Gly Thr Met Ala Ala Gly Gly 195 200 205 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp 260 265 270 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn 305 310 315 320 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr 405 410 415 Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 Ser Arg Thr Gln Ser Thr Gly Gly Thr Gln Gly Thr Gln Gln Leu Leu 450 455 460 Phe Ser Gln Ala Gly Pro Ala Asn Met Ser Ala Gln Ala Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser 485 490 495 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His 500 505 510 Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr 515 520 525 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met 530 535 540 Phe Gly Lys Gln Gly Ala Gly Arg Asp Asn Val Asp Tyr Ser Ser Val 545 550 555 560 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Ala Asn Thr Gly 580 585 590 Pro Ile Val Gly Asn Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 Pro Ala Asp Pro Pro Thr Thr Phe Ser Gln Ala Lys Leu Ala Ser Phe 660 665 670 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 Asn Leu <210> 17 <211> 733 <212> PRT <213> Adeno-associated virus - 11 <400> 17 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Leu Glu Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly Lys 145 150 155 160 Lys Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Glu Glu Asp Thr 165 170 175 Gly Ala Gly Asp Gly Pro Pro Glu Gly Ser Asp Thr Ser Ala Met Ser 180 185 190 Ser Asp Ile Glu Met Arg Ala Ala Pro Gly Gly Asn Ala Val Asp Ala 195 200 205 Gly Gln Gly Ser Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys 210 215 220 Asp Ser Thr Trp Ser Glu Gly Lys Val Thr Thr Thr Ser Thr Arg Thr 225 230 235 240 Trp Val Leu Pro Thr Tyr Asn Asn His Leu Tyr Leu Arg Leu Gly Thr 245 250 255 Thr Ser Ser Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp Gly Tyr 260 265 270 Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln 275 280 285 Arg Leu Ile Asn Asn Asn Trp Gly Leu Arg Pro Lys Ala Met Arg Val 290 295 300 Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Thr Ser Asn Gly Glu 305 310 315 320 Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Val Gln Ile Phe Ala Asp 325 330 335 Ser Ser Tyr Glu Leu Pro Tyr Val Met Asp Ala Gly Gln Glu Gly Ser 340 345 350 Leu Pro Pro Phe Pro Asn Asp Val Phe Met Val Pro Gln Tyr Gly Tyr 355 360 365 Cys Gly Ile Val Thr Gly Glu Asn Gln Asn Gln Thr Asp Arg Asn Ala 370 375 380 Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn 385 390 395 400 Asn Phe Glu Met Ala Tyr Asn Phe Glu Lys Val Pro Phe His Ser Met 405 410 415 Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Leu Asp 420 425 430 Gln Tyr Leu Trp His Leu Gln Ser Thr Thr Ser Gly Glu Thr Leu Asn 435 440 445 Gln Gly Asn Ala Ala Thr Thr Phe Gly Lys Ile Arg Ser Gly Asp Phe 450 455 460 Ala Phe Tyr Arg Lys Asn Trp Leu Pro Gly Pro Cys Val Lys Gln Gln 465 470 475 480 Arg Phe Ser Lys Thr Ala Ser Gln Asn Tyr Lys Ile Pro Ala Ser Gly 485 490 495 Gly Asn Ala Leu Leu Lys Tyr Asp Thr His Tyr Thr Leu Asn Asn Arg 500 505 510 Trp Ser Asn Ile Ala Pro Gly Pro Pro Met Ala Thr Ala Gly Pro Ser 515 520 525 Asp Gly Asp Phe Ser Asn Ala Gln Leu Ile Phe Pro Gly Pro Ser Val 530 535 540 Thr Gly Asn Thr Thr Thr Ser Ala Asn Asn Leu Leu Phe Thr Ser Glu 545 550 555 560 Glu Glu Ile Ala Ala Thr Asn Pro Arg Asp Thr Asp Met Phe Gly Gln 565 570 575 Ile Ala Asp Asn Asn Gln Asn Ala Thr Thr Ala Pro Ile Thr Gly Asn 580 585 590 Val Thr Ala Met Gly Val Leu Pro Gly Met Val Trp Gln Asn Arg Asp 595 600 605 Ile Tyr Tyr Gln Gly Pro Ile Trp Ala Lys Ile Pro His Ala Asp Gly 610 615 620 His Phe His Pro Ser Pro Leu Ile Gly Gly Phe Gly Leu Lys His Pro 625 630 635 640 Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ala 645 650 655 Thr Thr Phe Thr Ala Ala Arg Val Asp Ser Phe Ile Thr Gln Tyr Ser 660 665 670 Thr Gly Gln Val Ala Val Gln Ile Glu Trp Glu Ile Glu Lys Glu Arg 675 680 685 Ser Lys Arg Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Tyr Gly Asn 690 695 700 Gln Ser Ser Met Leu Trp Ala Pro Asp Thr Thr Gly Lys Tyr Thr Glu 705 710 715 720 Pro Arg Val Ile Gly Ser Arg Tyr Leu Thr Asn His Leu 725 730 <210> 18 <211> 742 <212> PRT <213> Adeno-associated virus - 12 <400> 18 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Lys Gln Leu Glu Gln Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Gln Arg Leu Ala Thr Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Gly Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Leu Glu Lys Thr Pro Asn Arg Pro Thr Asn Pro Asp Ser Gly Lys 145 150 155 160 Ala Pro Ala Lys Lys Lys Gln Lys Asp Gly Glu Pro Ala Asp Ser Ala 165 170 175 Arg Arg Thr Leu Asp Phe Glu Asp Ser Gly Ala Gly Asp Gly Pro Pro 180 185 190 Glu Gly Ser Ser Ser Gly Glu Met Ser His Asp Ala Glu Met Arg Ala 195 200 205 Ala Pro Gly Gly Asn Ala Val Glu Ala Gly Gln Gly Ala Asp Gly Val 210 215 220 Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp Ser Glu Gly 225 230 235 240 Arg Val Thr Thr Thr Ser Thr Arg Thr Trp Val Leu Pro Thr Tyr Asn 245 250 255 Asn His Leu Tyr Leu Arg Ile Gly Thr Thr Ala Asn Ser Asn Thr Tyr 260 265 270 Asn Gly Phe Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Leu Arg Pro Lys Ser Met Arg Val Lys Ile Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Thr Ser Asn Gly Glu Thr Thr Val Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Ile Phe Ala Asp Ser Thr Tyr Glu Leu Pro Tyr 340 345 350 Val Met Asp Ala Gly Gln Glu Gly Ser Phe Pro Pro Phe Pro Asn Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Cys Gly Val Val Thr Gly Lys 370 375 380 Asn Gln Asn Gln Thr Asp Arg Asn Ala Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Val Ser Tyr Gln 405 410 415 Phe Glu Lys Val Pro Phe His Ser Met Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Met Met Asn Pro Leu Leu Asp Gln Tyr Leu Trp His Leu Gln 435 440 445 Ser Thr Thr Thr Gly Asn Ser Leu Asn Gln Gly Thr Ala Thr Thr Thr 450 455 460 Tyr Gly Lys Ile Thr Thr Gly Asp Phe Ala Tyr Tyr Arg Lys Asn Trp 465 470 475 480 Leu Pro Gly Ala Cys Ile Lys Gln Gln Lys Phe Ser Lys Asn Ala Asn 485 490 495 Gln Asn Tyr Lys Ile Pro Ala Ser Gly Gly Asp Ala Leu Leu Lys Tyr 500 505 510 Asp Thr His Thr Thr Leu Asn Gly Arg Trp Ser Asn Met Ala Pro Gly 515 520 525 Pro Pro Met Ala Thr Ala Gly Ala Gly Asp Ser Asp Phe Ser Asn Ser 530 535 540 Gln Leu Ile Phe Ala Gly Pro Asn Pro Ser Gly Asn Thr Thr Thr Ser 545 550 555 560 Ser Asn Asn Leu Leu Phe Thr Ser Glu Glu Glu Ile Ala Thr Thr Asn 565 570 575 Pro Arg Asp Thr Asp Met Phe Gly Gln Ile Ala Asp Asn Asn Gln Asn 580 585 590 Ala Thr Thr Ala Pro His Ile Ala Asn Leu Asp Ala Met Gly Ile Val 595 600 605 Pro Gly Met Val Trp Gln Asn Arg Asp Ile Tyr Tyr Gln Gly Pro Ile 610 615 620 Trp Ala Lys Val Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu 625 630 635 640 Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Phe Ile Lys 645 650 655 Asn Thr Pro Val Pro Ala Asn Pro Asn Thr Thr Phe Ser Ala Ala Arg 660 665 670 Ile Asn Ser Phe Leu Thr Gln Tyr Ser Thr Gly Gln Val Ala Val Gln 675 680 685 Ile Asp Trp Glu Ile Gln Lys Glu His Ser Lys Arg Trp Asn Pro Glu 690 695 700 Val Gln Phe Thr Ser Asn Tyr Gly Thr Gln Asn Ser Met Leu Trp Ala 705 710 715 720 Pro Asp Asn Ala Gly Asn Tyr His Glu Leu Arg Ala Ile Gly Ser Arg 725 730 735 Phe Leu Thr His His Leu 740 <210> 19 <211> 733 <212> PRT <213> Adeno-associated virus - 13 <400> 19 Met Thr Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser Glu 1 5 10 15 Gly Val Arg Glu Trp Trp Ala Leu Gln Pro Gly Ala Pro Lys Pro Lys 20 25 30 Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro Gly 35 40 45 Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro Val 50 55 60 Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp Gln 65 70 75 80 Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp 85 90 95 Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly Asn 100 105 110 Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro Leu 115 120 125 Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg Pro 130 135 140 Val Glu Gln Ser Pro Ala Glu Pro Asp Ser Ser Ser Gly Ile Gly Lys 145 150 155 160 Ser Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr Gly 165 170 175 Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro Ala 180 185 190 Ala Pro Ser Gly Val Gly Ser Thr Thr Met Ala Ser Gly Gly Gly Ala 195 200 205 Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser Ser 210 215 220 Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile Thr 225 230 235 240 Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu Tyr 245 250 255 Lys Gln Ile Ser Ser Gln Ser Gly Ala Thr Asn Asp Asn His Tyr Phe 260 265 270 Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His Cys 275 280 285 His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly 290 295 300 Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val Lys 305 310 315 320 Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu Thr 325 330 335 Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr Val 340 345 350 Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp Val 355 360 365 Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser Gln 370 375 380 Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln 385 390 395 400 Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu Asp 405 410 415 Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg Leu 420 425 430 Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr Gln 435 440 445 Thr Ala Ser Gly Thr Gln Gln Ser Arg Leu Leu Phe Ser Gln Ala Gly 450 455 460 Pro Thr Ser Met Ser Leu Gln Ala Lys Asn Trp Leu Pro Gly Pro Cys 465 470 475 480 Tyr Arg Gln Gln Arg Leu Ser Lys Gln Ala Asn Asp Asn Asn Asn Ser 485 490 495 Asn Phe Pro Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly Arg Asp 500 505 510 Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp Asp Lys 515 520 525 Glu Lys Phe Phe Pro Met His Gly Thr Leu Ile Phe Gly Lys Glu Gly 530 535 540 Thr Asn Ala Asn Asn Ala Asp Leu Glu Asn Val Met Ile Thr Asp Glu 545 550 555 560 Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr Gly Thr 565 570 575 Val Ser Asn Asn Leu Gln Asn Ser Asn Ala Gly Pro Thr Thr Gly Thr 580 585 590 Val Asn His Gln Gly Ala Leu Pro Gly Met Val Trp Gln Asp Arg Asp 595 600 605 Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly 610 615 620 His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro 625 630 635 640 Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Pro 645 650 655 Thr Asn Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser 660 665 670 Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn 675 680 685 Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys 690 695 700 Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu 705 710 715 720 Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 <210> 20 <211> 737 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 20 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ala Gly Gly Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr Thr 405 410 415 Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Arg Thr Gln Thr Thr Gly Gly Thr Thr Asn Thr Gln Thr Leu Gly Phe 450 455 460 Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp Leu 465 470 475 480 Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp 485 490 495 Asn Asn Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu 500 505 510 Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His 515 520 525 Lys Asp Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe 530 535 540 Gly Lys Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met 545 550 555 560 Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu 565 570 575 Gln Tyr Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala 580 585 590 Ala Thr Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp 595 600 605 Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro 610 615 620 His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly 625 630 635 640 Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro 645 650 655 Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe Ile 660 665 670 Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu 675 680 685 Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser 690 695 700 Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu Gly 705 710 715 720 Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn 725 730 735 Leu <210> 21 <211> 743 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 21 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Arg Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Asp Gly Thr Leu Ala Val 580 585 590 Pro Phe Lys Ala Gln Ala Gln Thr Gly Trp Val Gln Asn Gln Gly Ile 595 600 605 Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro 610 615 620 Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe His Pro Ser Pro 625 630 635 640 Leu Met Gly Gly Phe Gly Met Lys His Pro Pro Pro Gln Ile Leu Ile 645 650 655 Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr Ala Phe Asn Lys Asp 660 665 670 Lys Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val 675 680 685 Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro 690 695 700 Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser Asn Asn Val Glu Phe 705 710 715 720 Ala Val Asn Thr Glu Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr 725 730 735 Arg Tyr Leu Thr Arg Asn Leu 740 <210> 22 <211> 736 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 22 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly 145 150 155 160 Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Asn Thr Met Ala Ala Gly Gly Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Gly Ser Thr Asn Asp Asn Thr 260 265 270 Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe 275 280 285 His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn 290 295 300 Trp Gly Phe Arg Pro Lys Lys Leu Asn Phe Lys Leu Phe Asn Ile Gln 305 310 315 320 Val Lys Glu Val Thr Thr Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn 325 330 335 Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro 340 345 350 Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala 355 360 365 Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly 370 375 380 Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro 385 390 395 400 Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe 405 410 415 Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp 420 425 430 Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg 435 440 445 Thr Gln Thr Thr Ser Gly Thr Ala Gly Asn Arg Thr Leu Gln Phe Ser 450 455 460 Gln Ala Gly Pro Ser Ser Met Ala Asn Gln Ala Lys Asn Trp Leu Pro 465 470 475 480 Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Thr Asn Gln Asn 485 490 495 Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His Leu Asn 500 505 510 Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Thr His Lys 515 520 525 Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Leu Ile Phe Gly 530 535 540 Lys Gln Gly Ala Gly Asn Ser Asn Val Asp Leu Asp Asn Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Glu 565 570 575 Tyr Gly Thr Val Ala Thr Asn Leu Gln Ser Ala Asn Thr Ala Pro Ala 580 585 590 Thr Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Asn Lys Ser Thr Asn Val Asp Phe Ala Val Asp Thr Asn Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 23 <211> 736 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 23 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly 145 150 155 160 Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Asn Thr Met Ala Ala Gly Gly Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Gly Ser Thr Asn Asp Asn Thr 260 265 270 Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe 275 280 285 His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn 290 295 300 Trp Gly Phe Arg Pro Lys Lys Leu Asn Phe Lys Leu Phe Asn Ile Gln 305 310 315 320 Val Lys Glu Val Thr Thr Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn 325 330 335 Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro 340 345 350 Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala 355 360 365 Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly 370 375 380 Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro 385 390 395 400 Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe 405 410 415 Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp 420 425 430 Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg 435 440 445 Thr Gln Thr Thr Ser Gly Thr Ala Gly Asn Arg Thr Leu Gln Phe Ser 450 455 460 Gln Ala Gly Pro Ser Ser Met Ala Asn Gln Ala Lys Asn Trp Leu Pro 465 470 475 480 Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Thr Asn Gln Asn 485 490 495 Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His Leu Asn 500 505 510 Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Thr His Lys 515 520 525 Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Leu Ile Phe Gly 530 535 540 Lys Gln Gly Ala Gly Asn Ser Asn Val Asp Leu Asp Asn Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Glu 565 570 575 Tyr Gly Thr Val Ala Thr Asn Leu Gln Ser Ala Asn Thr Ala Pro Ala 580 585 590 Thr Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Asn Lys Ser Thr Asn Val Asp Phe Ala Val Asp Thr Asn Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 24 <211> 745 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 24 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Thr 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Leu Gly Glu 580 585 590 Thr Thr Arg Pro Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln 595 600 605 Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln 610 615 620 Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro 625 630 635 640 Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile 645 650 655 Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser 660 665 670 Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val 675 680 685 Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp 690 695 700 Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Ile Asn Val 705 710 715 720 Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile 725 730 735 Gly Thr Arg Tyr Leu Thr Arg Asn Leu 740 745 <210> 25 <211> 143 <212> DNA <213> Adeno-associated virus - 1 <400> 25 ttgcccactc cctctctgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60 agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgcag agagggagtg 120 ggcaactcca tcactagggg taa 143 <210> 26 <211> 143 <212> DNA <213> Adeno-associated virus - 1 <400> 26 ttacccctag tgatggagtt gcccactccc tctctgcgcg ctcgctcgct cggtggggcc 60 tgcggaccaa aggtccgcag acggcagagc tctgctctgc cggccccacc gagcgagcga 120 gcgcgcagag agggagtggg caa 143 <210> 27 <211> 145 <212> DNA <213> Adeno-associated virus - 2 <400> 27 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcct 145 <210> 28 <211> 145 <212> DNA <213> Adeno-associated virus - 2 <400> 28 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120 gagcgcgcag agagggagtg gccaa 145 <210> 29 <211> 143 <212> DNA <213> Adeno-associated virus - 3 <400> 29 ttggccactc cctctatgcg cactcgctcg ctcggtgggg cctggcgacc aaaggtcgcc 60 agacggacgt gctttgcacg tccggcccca ccgagcgagc gagtgcgcat agagggagtg 120 gccaactcca tcactagagg tat 143 <210> 30 <211> 143 <212> DNA <213> Adeno-associated virus - 3 <400> 30 atacctctag tgatggagtt ggccactccc tctatgcgca ctcgctcgct cggtggggcc 60 tggcgaccaa aggtcgccag acggacgtgc tttgcacgtc cggccccacc gagcgagcga 120 gtgcgcatag agggagtggc caa 143 <210> 31 <211> 146 <212> DNA <213> Adeno-associated virus - 4 <400> 31 ttggccactc cctctatgcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60 agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcat agagggagtg 120 gccaactcca tcatctaggt ttgccc 146 <210> 32 <211> 144 <212> DNA <213> Adeno-associated virus - 4 <400> 32 ggcaaaccag atgatggagt tggccacatt agctatgcgc gctcgctcac tcactcggcc 60 ctggagacca aaggtctcca gactgccggc ctctggccgg cagggccgag tgagtgagcg 120 agcgcgcata gagggagtgg ccaa 144 <210> 33 <211> 167 <212> DNA <213> Adeno-associated virus - 5 <400> 33 ctctcccccc tgtcgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60 agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120 cgcgacaggg gggagagtgc cacactctca agcaaggggg ttttgta 167 <210> 34 <211> 167 <212> DNA <213> Adeno-associated virus - 5 <400> 34 tacaaaacct ccttgcttga gagtgtggca ctctcccccc tgtcgcgttc gctcgctcgc 60 tggctcgttt gggggggtgg cagctcaaag agctgccaga cgacggccct ctggccgtcg 120 cccccccaaa cgagccagcg agcgagcgaa cgcgacaggg gggagag 167 <210> 35 <211> 145 <212> DNA <213> Adeno-associated virus - 6 <400> 35 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcct 145 <210> 36 <211> 143 <212> DNA <213> Adeno-associated virus - 6 <400> 36 atacccctag tgatggagtt gcccactccc tctatgcgcg ctcgctcgct cggtggggcc 60 ggcagagcag agctctgccg tctgcggacc tttggtccgc aggccccacc gagcgagcga 120 gcgcgcatag agggagtggg caa 143 <210> 37 <211> 145 <212> DNA <213> Adeno-associated virus - 7 <400> 37 ttggccactc cctctatgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60 agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgcat agagggagtg 120 gccaactcca tcactagggg taccg 145 <210> 38 <211> 145 <212> DNA <213> Adeno-associated virus - 7 <400> 38 cggtacccct agtgatggag ttggccactc cctctatgcg cgctcgctcg ctcggtgggg 60 cctgcggacc aaaggtccgc agacggcaga gctctgctct gccggcccca ccgagcgagc 120 gagcgcgcat agagggagtg gccaa 145 <210> 39 <211> 80 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 39 gccacggcgg aactcatcgc cgcctgcctt gcccgctgct ggacaggggc tcggctgttg 60 ggcactgaca attccgtggt 80 <210> 40 <211> 289 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 40 Met Pro Leu Ile Phe Lys Ile Gly Tyr Asn Val Ile Pro Leu Gln Asp 1 5 10 15 Val Ile Leu Pro Thr Pro Ser Ser Lys Val Leu Lys Tyr Leu Ile Gln 20 25 30 Ser Gly Lys Leu Ile Pro Ser Leu Lys Asp Leu Ile Thr Ser Arg Asp 35 40 45 Lys Tyr Lys Pro Ile Phe Ile Ser His Leu Gly Phe Asn Gln Arg Arg 50 55 60 Ile Phe Gln Thr Asn Gly Asn Leu Lys Thr Ile Thr Lys Gly Ser Arg 65 70 75 80 Leu Ser Ser Ile Ile Ala Phe Ser Thr Gln Ala Asn Val Leu Ser Glu 85 90 95 Val Ala Asp Glu Gly Ile Phe Glu Thr Val Tyr Gly Lys Phe His Ile 100 105 110 Met Ile Glu Ser Ile Glu Ile Val Glu Val Glu Lys Leu Lys Glu Glu 115 120 125 Val Glu Lys His Met Asn Asp Asn Ile Arg Val Arg Phe Val Ser Pro 130 135 140 Thr Leu Leu Ser Ser Lys Val Leu Leu Pro Pro Ser Leu Ser Glu Arg 145 150 155 160 Tyr Lys Lys Ile His Ala Gly Tyr Ser Thr Leu Pro Ser Val Gly Leu 165 170 175 Ile Val Ala Tyr Ala Tyr Asn Val Tyr Cys Asn Leu Ile Gly Lys Lys 180 185 190 Glu Val Glu Val Arg Ala Phe Lys Phe Gly Ile Leu Ser Asn Ala Leu 195 200 205 Ser Arg Ile Ile Gly Tyr Asp Leu His Pro Val Thr Val Ala Ile Gly 210 215 220 Glu Asp Ser Lys Gly Asn Leu Arg Lys Ala Arg Gly Val Met Gly Trp 225 230 235 240 Ile Glu Phe Asp Ile Pro Asp Glu Arg Leu Lys Arg Arg Ala Leu Asn 245 250 255 Tyr Leu Leu Thr Ser Ser Tyr Leu Gly Ile Gly Arg Ser Arg Gly Ile 260 265 270 Gly Phe Gly Glu Ile Arg Leu Glu Phe Arg Lys Ile Glu Glu Lys Glu 275 280 285 Gly <210> 41 <211> 218 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 41 Met Asp Leu Glu Tyr Met His Ile Ser Tyr Pro Asn Ile Leu Leu Asn 1 5 10 15 Met Arg Asp Gly Ser Lys Leu Arg Gly Tyr Phe Ala Lys Lys Tyr Ile 20 25 30 Asp Glu Glu Ile Val His Asn His Arg Asp Asn Ala Phe Val Tyr Lys 35 40 45 Tyr Pro Gln Ile Gln Phe Lys Ile Ile Asp Arg Ser Pro Leu Ile Ile 50 55 60 Gly Ile Gly Ser Leu Gly Ile Asn Phe Leu Glu Ser Lys Arg Ile Phe 65 70 75 80 Phe Glu Lys Glu Leu Ile Ile Ser Asn Asp Thr Asn Asp Ile Thr Glu 85 90 95 Val Asn Val His Lys Asp Met Asp His Phe Gly Thr Thr Asp Lys Ile 100 105 110 Leu Lys Tyr Gln Phe Lys Thr Pro Trp Met Ala Leu Asn Ala Lys Asn 115 120 125 Ser Glu Ile Tyr Lys Asn Ser Asp Glu Ile Asp Arg Glu Glu Phe Leu 130 135 140 Lys Arg Val Leu Ile Gly Asn Ile Leu Ser Met Ser Lys Ser Leu Gly 145 150 155 160 Tyr Thr Ile Glu Glu Lys Leu Lys Val Lys Ile Asn Leu Lys Glu Val 165 170 175 Pro Val Lys Phe Lys Asn Gln Asn Met Val Gly Phe Arg Gly Glu Phe 180 185 190 Tyr Ile Asn Phe Asp Ile Pro Gln Tyr Leu Gly Ile Gly Arg Asn Val 195 200 205 Ser Arg Gly Phe Gly Thr Val Val Lys Val 210 215 <210> 42 <211> 242 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 42 Met Tyr Arg Ser Arg Asp Phe Tyr Val Arg Val Ser Gly Gln Arg Ala 1 5 10 15 Leu Phe Thr Asn Pro Ala Thr Lys Gly Gly Ser Glu Arg Ser Ser Tyr 20 25 30 Ser Val Pro Thr Arg Gln Ala Leu Asn Gly Ile Val Asp Ala Ile Tyr 35 40 45 Tyr Lys Pro Thr Phe Thr Asn Ile Val Thr Glu Val Lys Val Ile Asn 50 55 60 Gln Ile Gln Thr Glu Leu Gln Gly Val Arg Ala Leu Leu His Asp Tyr 65 70 75 80 Ser Ala Asp Leu Ser Tyr Val Ser Tyr Leu Ser Asp Val Val Tyr Leu 85 90 95 Ile Lys Phe His Phe Val Trp Asn Glu Asp Arg Lys Asp Leu Asn Ser 100 105 110 Asp Arg Leu Pro Ala Lys His Glu Ala Ile Met Glu Arg Ser Ile Arg 115 120 125 Lys Gly Gly Arg Arg Asp Val Phe Leu Gly Thr Arg Glu Cys Leu Gly 130 135 140 Leu Leu Asp Asp Ile Ser Gln Glu Glu Tyr Glu Thr Thr Val Ser Tyr 145 150 155 160 Tyr Asn Gly Val Asn Ile Asp Leu Gly Ile Met Phe His Ser Phe Ala 165 170 175 Tyr Pro Lys Asp Lys Lys Thr Pro Leu Lys Ser Tyr Phe Thr Lys Thr 180 185 190 Val Met Lys Asn Gly Val Ile Thr Phe Lys Ala Gln Ser Glu Cys Asp 195 200 205 Ile Val Asn Thr Leu Ser Ser Tyr Ala Phe Lys Ala Pro Glu Glu Ile 210 215 220 Lys Ser Val Asn Asp Glu Cys Met Glu Tyr Asp Ala Met Glu Lys Gly 225 230 235 240 Glu Asn <210> 43 <211> 236 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 43 Met Arg Asn Glu Val Gln Phe Glu Leu Phe Gly Asp Tyr Ala Leu Phe 1 5 10 15 Thr Asp Pro Leu Thr Lys Ile Gly Gly Glu Lys Leu Ser Tyr Ser Val 20 25 30 Pro Thr Tyr Gln Ala Leu Lys Gly Ile Ala Glu Ser Ile Tyr Trp Lys 35 40 45 Pro Thr Ile Val Phe Val Ile Asp Glu Leu Arg Val Met Lys Pro Ile 50 55 60 Gln Met Glu Ser Lys Gly Val Arg Pro Ile Glu Tyr Gly Gly Gly Asn 65 70 75 80 Thr Leu Ala His Tyr Thr Tyr Leu Lys Asp Val His Tyr Gln Val Lys 85 90 95 Ala His Phe Glu Phe Asn Leu His Arg Pro Asp Leu Ala Phe Asp Arg 100 105 110 Asn Glu Gly Lys His Tyr Ser Ile Leu Gln Arg Ser Leu Lys Ala Gly 115 120 125 Gly Arg Arg Asp Ile Phe Leu Gly Ala Arg Glu Cys Gln Gly Tyr Val 130 135 140 Ala Pro Cys Glu Phe Gly Ser Gly Asp Gly Phe Tyr Asp Gly Gln Gly 145 150 155 160 Lys Tyr His Leu Gly Thr Met Val His Gly Phe Asn Tyr Pro Asp Glu 165 170 175 Thr Gly Gln His Gln Leu Asp Val Arg Leu Trp Ser Ala Val Met Glu 180 185 190 Asn Gly Tyr Ile Gln Phe Pro Arg Pro Glu Asp Cys Pro Ile Val Arg 195 200 205 Pro Val Lys Glu Met Glu Pro Lys Ile Phe Asn Pro Asp Asn Val Gln 210 215 220 Ser Ala Glu Gln Leu Leu His Asp Leu Gly Gly Glu 225 230 235 <210> 44 <211> 260 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 44 Met Pro Asn Asp Pro Tyr Ser Leu Tyr Ser Ile Val Ile Glu Leu Gly 1 5 10 15 Ala Ala Glu Lys Gly Phe Pro Thr Gly Ile Leu Gly Arg Ser Leu His 20 25 30 Ser Gln Val Leu Gln Trp Phe Lys Gln Asp Asn Pro Phe Leu Ala Thr 35 40 45 Glu Leu His Gln Ser Gln Ile Ser Pro Phe Ser Ile Ser Pro Leu Met 50 55 60 Gly Lys Arg His Ala Lys Leu Thr Lys Ala Gly Asp Arg Leu Phe Phe 65 70 75 80 Arg Ile Cys Leu Leu Arg Gly Asp Leu Leu Gln Pro Leu Leu Asn Gly 85 90 95 Ile Glu Gln Thr Val Asn Gln Ser Val Cys Leu Asp Lys Phe Arg Phe 100 105 110 Arg Leu Cys Gln Thr His Ile Leu Pro Gly Ser His Pro Leu Ala Gly 115 120 125 Ala Ser His Tyr Ser Leu Ile Ser Gln Thr Pro Val Ser Ser Lys Ile 130 135 140 Thr Leu Asp Phe Lys Ser Ser Thr Ser Phe Lys Val Asp Arg Lys Ile 145 150 155 160 Ile Gln Val Phe Pro Leu Gly Glu His Val Phe Asn Ser Leu Leu Arg 165 170 175 Arg Trp Asn Asn Phe Ala Pro Glu Asp Leu His Phe Ser Gln Val Asp 180 185 190 Trp Ser Ile Pro Ile Ala Ala Phe Asp Val Lys Thr Ile Pro Ile His 195 200 205 Leu Lys Lys Val Glu Ile Gly Ala Gln Gly Trp Val Thr Tyr Ile Phe 210 215 220 Pro Asn Thr Glu Gln Ala Lys Ile Ala Ser Val Leu Ser Glu Phe Ala 225 230 235 240 Phe Phe Ser Gly Val Gly Arg Lys Thr Thr Met Gly Met Gly Gln Val 245 250 255 Gln Val Arg Ser 260 <210> 45 <211> 199 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 45 Met Tyr Leu Ser Lys Val Ile Ile Ala Arg Ala Trp Ser Arg Asp Leu 1 5 10 15 Tyr Gln Leu His Gln Gly Leu Trp His Leu Phe Pro Asn Arg Pro Asp 20 25 30 Ala Ala Arg Asp Phe Leu Phe His Val Glu Lys Arg Asn Thr Pro Glu 35 40 45 Gly Cys His Val Leu Leu Gln Ser Ala Gln Met Pro Val Ser Thr Ala 50 55 60 Val Ala Thr Val Ile Lys Thr Lys Gln Val Glu Phe Gln Leu Gln Val 65 70 75 80 Gly Val Pro Leu Tyr Phe Arg Leu Arg Ala Asn Pro Ile Lys Thr Ile 85 90 95 Leu Asp Asn Gln Lys Arg Leu Asp Ser Lys Gly Asn Ile Lys Arg Cys 100 105 110 Arg Val Pro Leu Ile Lys Glu Ala Glu Gln Ile Ala Trp Leu Gln Arg 115 120 125 Lys Leu Gly Asn Ala Ala Arg Val Glu Asp Val His Pro Ile Ser Glu 130 135 140 Arg Pro Gln Tyr Phe Ser Gly Asp Gly Lys Ser Gly Lys Ile Gln Thr 145 150 155 160 Val Cys Phe Glu Gly Val Leu Thr Ile Asn Asp Ala Pro Ala Leu Ile 165 170 175 Asp Leu Val Gln Gln Gly Ile Gly Pro Ala Lys Ser Met Gly Cys Gly 180 185 190 Leu Leu Ser Leu Ala Pro Leu 195 <210> 46 <211> 187 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 46 Met Asp His Tyr Leu Asp Ile Arg Leu Arg Pro Asp Pro Glu Phe Pro 1 5 10 15 Pro Ala Gln Leu Met Ser Val Leu Phe Gly Lys Leu His Gln Ala Leu 20 25 30 Val Ala Gln Gly Gly Asp Arg Ile Gly Val Ser Phe Pro Asp Leu Asp 35 40 45 Glu Ser Arg Ser Arg Leu Gly Glu Arg Leu Arg Ile His Ala Ser Ala 50 55 60 Asp Asp Leu Arg Ala Leu Leu Ala Arg Pro Trp Leu Glu Gly Leu Arg 65 70 75 80 Asp His Leu Gln Phe Gly Glu Pro Ala Val Val Pro His Pro Thr Pro 85 90 95 Tyr Arg Gln Val Ser Arg Val Gln Ala Lys Ser Asn Pro Glu Arg Leu 100 105 110 Arg Arg Arg Leu Met Arg Arg His Asp Leu Ser Glu Glu Glu Ala Arg 115 120 125 Lys Arg Ile Pro Asp Thr Val Ala Arg Ala Leu Asp Leu Pro Phe Val 130 135 140 Thr Leu Arg Ser Gln Ser Thr Gly Gln His Phe Arg Leu Phe Ile Arg 145 150 155 160 His Gly Pro Leu Gln Val Thr Ala Glu Glu Gly Gly Phe Thr Cys Tyr 165 170 175 Gly Leu Ser Lys Gly Gly Phe Val Pro Trp Phe 180 185 <210> 47 <211> 314 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 47 Met Ala Ala Arg Arg Gly Gly Ile Arg Arg Thr Asp Leu Leu Arg Arg 1 5 10 15 Ser Gly Gln Pro Arg Gly Arg His Arg Ala Ser Ala Ala Glu Ser Gly 20 25 30 Leu Thr Trp Ile Ser Pro Thr Leu Ile Leu Val Gly Phe Ser His Arg 35 40 45 Gly Asp Arg Arg Met Thr Glu His Leu Ser Arg Leu Thr Leu Thr Leu 50 55 60 Glu Val Asp Ala Pro Leu Glu Arg Ala Arg Val Ala Thr Leu Gly Pro 65 70 75 80 His Leu His Gly Val Leu Met Glu Ser Ile Pro Ala Asp Tyr Val Gln 85 90 95 Thr Leu His Thr Val Pro Val Asn Pro Tyr Ser Gln Tyr Ala Leu Ala 100 105 110 Arg Ser Thr Thr Ser Leu Glu Trp Lys Ile Ser Thr Leu Thr Asn Glu 115 120 125 Ala Arg Gln Gln Ile Val Gly Pro Ile Asn Asp Ala Ala Phe Ala Gly 130 135 140 Phe Arg Leu Arg Ala Ser Gly Ile Ala Thr Gln Val Thr Ser Arg Ser 145 150 155 160 Leu Glu Gln Asn Pro Leu Ser Gln Phe Ala Arg Ile Phe Tyr Ala Arg 165 170 175 Pro Glu Thr Arg Lys Phe Arg Val Glu Phe Leu Thr Pro Thr Ala Phe 180 185 190 Lys Gln Ser Gly Glu Tyr Val Phe Trp Pro Asp Pro Arg Leu Val Phe 195 200 205 Gln Ser Leu Ala Gln Lys Tyr Gly Ala Ile Val Asp Gly Glu Glu Pro 210 215 220 Asp Pro Gly Leu Ile Ala Glu Phe Gly Gln Ser Val Arg Leu Ser Ala 225 230 235 240 Phe Arg Val Ala Ser Ala Pro Phe Ala Val Gly Ala Ala Arg Val Pro 245 250 255 Gly Phe Thr Gly Ser Ala Thr Phe Thr Val Arg Gly Val Asp Thr Phe 260 265 270 Ala Ser Tyr Ile Ala Ala Leu Leu Trp Phe Gly Glu Phe Ser Gly Cys 275 280 285 Gly Ile Lys Ala Ser Met Gly Met Gly Ala Ile Arg Val Gln Pro Leu 290 295 300 Ala Pro Arg Glu Lys Cys Val Pro Lys Pro 305 310 <210> 48 <211> 264 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 48 Met Arg Phe Leu Ile Arg Leu Val Pro Glu Asp Lys Asp Arg Ala Phe 1 5 10 15 Lys Val Pro Tyr Asn His Gln Tyr Tyr Leu Gln Gly Leu Ile Tyr Asn 20 25 30 Ala Ile Lys Ser Ser Asn Pro Lys Leu Ala Thr Tyr Leu His Glu Val 35 40 45 Lys Gly Pro Lys Leu Phe Thr Tyr Ser Leu Phe Met Ala Glu Lys Arg 50 55 60 Glu His Pro Lys Gly Leu Pro Tyr Phe Leu Gly Tyr Lys Lys Gly Phe 65 70 75 80 Phe Tyr Phe Ser Thr Cys Val Pro Glu Ile Ala Glu Ala Leu Val Asn 85 90 95 Gly Leu Leu Met Asn Pro Glu Val Arg Leu Trp Asp Glu Arg Phe Tyr 100 105 110 Leu His Glu Ile Lys Val Leu Arg Glu Pro Lys Lys Phe Asn Gly Ser 115 120 125 Thr Phe Val Thr Leu Ser Pro Ile Ala Val Thr Val Val Arg Lys Gly 130 135 140 Lys Ser Tyr Asp Val Pro Pro Met Glu Lys Glu Phe Tyr Ser Ile Ile 145 150 155 160 Lys Asp Asp Leu Gln Asp Lys Tyr Val Met Ala Tyr Gly Asp Lys Pro 165 170 175 Pro Ser Glu Phe Glu Met Glu Val Leu Ile Ala Lys Pro Lys Arg Phe 180 185 190 Arg Ile Lys Pro Gly Ile Tyr Gln Thr Ala Trp His Leu Val Phe Arg 195 200 205 Ala Tyr Gly Asn Asp Asp Leu Leu Lys Val Gly Tyr Glu Val Gly Phe 210 215 220 Gly Glu Lys Asn Ser Leu Gly Phe Gly Met Val Lys Val Glu Gly Asn 225 230 235 240 Lys Thr Thr Lys Glu Ala Glu Glu Gln Glu Lys Ile Thr Phe Asn Ser 245 250 255 Arg Glu Glu Leu Lys Thr Gly Val 260 <210> 49 <211> 236 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 49 Met Phe Val Thr Gln Val Ile Phe Asn Ile Gly Glu Arg Thr Tyr Pro 1 5 10 15 Asp Arg Ala Arg Ala Met Val Ala Glu Leu Met Asp Gly Val Gln Pro 20 25 30 Gly Leu Val Ala Thr Leu Met Asn Tyr Ile Pro Gly Thr Ser Thr Ser 35 40 45 Arg Thr Glu Phe Pro Thr Val Gln Phe Gly Gly Ala Ser Asp Gly Phe 50 55 60 Cys Leu Leu Gly Phe Gly Asp Gly Gly Gly Ala Ile Val Arg Asp Ala 65 70 75 80 Val Pro Leu Ile His Ala Ala Leu Ala Arg Arg Met Pro Asp Arg Ile 85 90 95 Ile Gln Val Glu His Lys Glu His Ser Leu Ser Ala Glu Ala Arg Pro 100 105 110 Tyr Val Leu Ser Tyr Thr Val Pro Arg Met Val Val Gln Lys Lys Gln 115 120 125 Arg His Ala Glu Arg Leu Leu His Glu Ala Glu Gly Lys Ala His Leu 130 135 140 Glu Gly Leu Phe Leu Arg Ser Leu Gln Arg Gln Ala Ala Ala Val Gly 145 150 155 160 Leu Pro Leu Pro Glu Asn Leu Glu Val Glu Phe Lys Gly Ala Val Gly 165 170 175 Asp Phe Ala Ala Lys His Asn Pro Asn Ser Lys Val Ala Tyr Arg Gly 180 185 190 Leu Arg Gly Ala Val Phe Asp Val Asn Ala Arg Leu Gly Gly Ile Trp 195 200 205 Thr Ala Gly Phe Met Leu Ser Lys Gly Tyr Gly Gln Phe Asn Ala Thr 210 215 220 His Gln Leu Ser Gly Ala Val Asn Ala Leu Ser Glu 225 230 235 <210> 50 <211> 259 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 50 Met His Gln Thr Leu Ile Arg Ile Asn Trp Pro Lys Gly Phe Lys Cys 1 5 10 15 Pro Pro Ala Glu Phe Arg Glu Lys Leu Ala Lys Ser Glu Met Phe Pro 20 25 30 Pro Glu Phe Phe His Tyr Gly Thr Glu Leu Ala Val Trp Asp Lys Gln 35 40 45 Thr Ala Glu Val Glu Gly Lys Ile Lys Thr Val Ser Lys Glu Lys Ile 50 55 60 Ile Lys Thr Phe Asp Lys Pro Ile Pro Leu Asn Gly Arg Ala Pro Val 65 70 75 80 Arg Val Ile Gly Gly Gln Ala Trp Ala Gly Val Ile Ala Asp Pro Glu 85 90 95 Met Glu Gly Met Leu Ile Pro His Leu Gly Ser Ile Leu Lys Val Ala 100 105 110 Ser Ser Ala Ala Gly Cys Ala Val Lys Ile Glu Leu Glu Gln Arg Lys 115 120 125 Phe Gly Ile Ser Tyr Thr Glu Tyr Pro Val Lys Tyr Asn Leu Arg Glu 130 135 140 Leu Val Leu Lys Arg Arg Cys Glu Asp Ala Arg Ser Thr Asp Ile Glu 145 150 155 160 Ser Leu Ile Ala Asp Arg Ile Trp Gly Gly Val Ser Gly Glu Ser Tyr 165 170 175 Tyr Gly Ile Asp Gly Thr Cys Ala Lys Phe Gly Phe Glu Pro Pro Ser 180 185 190 Arg Glu Gln Leu Glu Leu Arg Ile Phe Pro Met Lys Asn Ile Gly Leu 195 200 205 His Met Lys Ser Ser Asp Gly Leu Ser Lys Glu Tyr Met Ser Leu Ile 210 215 220 Asp Ala Glu Val Trp Met Asn Ala Lys Leu Glu Gly Val Trp Gln Val 225 230 235 240 Gly Asn Leu Ile Ser Arg Gly Tyr Gly Arg Phe Ile Lys Ser Ile Gly 245 250 255 Ala Gln Ser <210> 51 <211> 24 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 51 gataatctct tatagaattg aaag 24 <210> 52 <211> 37 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 52 ctaaaagaat aacttgcaaa ataacaagca ttgaaac 37 <210> 53 <211> 32 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 53 gtctcaccct tcatgggtga gtggattgaa at 32 <210> 54 <211> 32 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 54 gtcgcactct tcatgggtgc gtggattgaa at 32 <210> 55 <211> 37 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 55 gtttcagtcc cgtagtcggg atttagtggt tggaaag 37 <210> 56 <211> 29 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 56 gagttccccg cgccagcggg gataaaccg 29 <210> 57 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 57 gttcactgcc gtataggcag ctaagaaa 28 <210> 58 <211> 36 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 58 gtcgtcagac ccaaaacccc gagaggggac ggaaac 36 <210> 59 <211> 30 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 59 gttacaataa gactaaaata gaattgaaag 30 <210> 60 <211> 29 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 60 gtatttcccg cgtgcgcggg ggtgagcgg 29 <210> 61 <211> 37 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 61 tattggatac acccactcat tggtgggtgg ttagaac 37 <210> 62 <211> 24 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 62 gauaaucucu uauagaauug aaag 24 <210> 63 <211> 37 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 63 cuaaaagaau aacuugcaaa auaacaagca uugaaac 37 <210> 64 <211> 32 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 64 gucucacccu ucauggguga guggauugaa au 32 <210> 65 <211> 32 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 65 gucgcacucu ucaugggugc guggauugaa au 32 <210> 66 <211> 37 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 66 guuucagucc cguagucggg auuuaguggu uggaaag 37 <210> 67 <211> 29 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 67 gaguuccccg cgccagcggg gauaaaccg 29 <210> 68 <211> 28 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 68 guucacugcc guauaggcag cuaagaaa 28 <210> 69 <211> 36 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 69 gucgucagac ccaaaacccc gagaggggac ggaaac 36 <210> 70 <211> 30 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 70 guuacaauaa gacuaaaaua gaauugaaag 30 <210> 71 <211> 29 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 71 guauuucccg cgugcgcggg ggugagcgg 29 <210> 72 <211> 37 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 72 uauuggauac acccacucau uggugggugg uuagaac 37 <210> 73 <211> 2133 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 73 atgcccaaga agaagcggaa ggtgatgcct ctgatcttca agatcggcta taacgtgatc 60 cccctgcagg acgtgatcct gcccacccct tccagcaagg tgctgaagta cctgatccag 120 agcggcaagc tgatccccag cctgaaggac ctgatcacca gccgggacaa gtacaagcca 180 atcttcatct cccacctggg cttcaaccag cggaggattt tccagaccaa cggcaatctg 240 aaaaccatca ccaagggcag tagactgagc tccatcatcg ccttcagcac ccaggccaac 300 gtgctgtccg aggtggccga tgaagggatc ttcgaaaccg tgtacggaaa gttccacatc 360 atgatcgaaa gcatcgagat cgtggaggtg gaaaagctga aggaggaggt ggagaagcac 420 atgaacgaca acatcagagt gagattcgtg tctcccacac tgctgagctc caaggtgctg 480 ctgcccccca gcctgtccga aagatacaag aagatccacg ccgggtacag caccctgccc 540 agcgtgggcc tgatcgtggc ctacgcctac aacgtgtact gcaatctgat cggcaagaag 600 gaagtggaag tgcgggcctt caagtttgga atcctgagca acgccctgtc cagaatcatc 660 ggctacgacc tgcaccctgt gaccgtggcc atcggcgagg acagcaaggg gaatctgaga 720 aaggctcggg gcgtgatggg ctggatcgag ttcgacatcc ccgacgaaag actgaagcgg 780 cgggccctga actatctgct gaccagcagc tacctgggca tcgggagatc tcggggcatc 840 ggcttcggcg agatccggct ggagttccgg aagattgaag agaaggaggg acccaagaag 900 aagcggaagg tgggtggagg cggaggttct gggggaggag gtagtggcgg tggtggttca 960 ggaggcggcg gaagccagct gcatttaccg caggttttag ctgacgctgt ctcacgcctg 1020 gtcataggta agtttggtga cctgaccgac aacttctcct cccctcacgc tcgcagaata 1080 ggtctggctg gagtcgtcat gacaacaggc acagatgtta aagatgccaa ggtgatatgt 1140 gtttctacag gagcaaaatg tattaatggt gaatacctaa gtgatcgtgg ccttgcatta 1200 aatgactgcc atgcagaaat agtatctcgg agatccttgc tcagatttct ttatacacaa 1260 cttgagcttt acttaaataa cgaggatgat caaaaaagat ccatctttca gaaatcagag 1320 cgaggggggt ttaggctgaa ggagaatata cagtttcatc tgtacatcag cacctctccc 1380 tgtggagatg ccagaatctt ctcaccacat gaggcaatcc tggaagaacc agcagataga 1440 cacccaaatc gtaaagcaag aggacagcta cggaccaaaa tagaggctgg tcaggggacg 1500 attccagtgc gcaacaatgc gagcatccaa acgtgggacg gggtgctgca aggggagcgg 1560 ctgctcacca tgtcctgcag tgacaagatt gcacgctgga acgtggtggg catccaggga 1620 tcactgctca gcattttcgt ggagcccatt tacttctcga gcatcatcct gggcagcctt 1680 taccacgggg accacctttc cagggccatg taccagcgga tctccaacat agaggacctg 1740 ccacctctct acaccctcaa caagcctttg ctcacaggca tcagcaatgc agaagcacgg 1800 cagccaggga aggcccccat attcagtgtc aactggacgg taggcgactc cgctattgag 1860 gtcatcaacg ccacgactgg gaagggagag ctgggccgcg cgtcccgcct gtgtaagcac 1920 gcgttgtact gtcgctggat gcgtgtgcac ggcaaggttc cctcccactt actacgctcc 1980 aagattacca agcccaacgt gtaccatgag acaaagctgg cggcaaagga gtaccaggcc 2040 gccaaggcgc gtctgttcac agccttcatc aaggcggggc tgggggcctg ggtggagaag 2100 cccaccgagc aggaccagtt ctcactcacg taa 2133 <210> 74 <211> 1920 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 74 atgcccaaga agaagcggaa ggtgatggac ctggagtaca tgcacatctc ctaccctaac 60 atcctgctga acatgcggga cggcagcaag ctgcggggct acttcgccaa gaagtacatc 120 gacgaagaga ttgtgcacaa ccacagagac aacgcctttg tgtacaagta cccccagatc 180 cagtttaaga tcatcgatag aagccccctg atcatcggca ttggctctct gggcatcaat 240 ttcctggaga gcaagcggat cttcttcgag aaggaactga ttatcagcaa cgacaccaac 300 gacatcaccg aggtgaacgt gcacaaggac atggatcact tcggcacgac cgacaagatc 360 ctgaagtacc agttcaagac cccttggatg gcactgaacg ccaagaatag cgagatctac 420 aagaactctg acgagatcga ccgggaggag ttcctgaaga gagtgctgat tgggaatatc 480 ctgagcatgt ctaagagcct gggctatacc atcgaagaaa agctgaaggt gaagattaac 540 ctgaaggaag tgcccgtgaa gttcaagaac cagaacatgg tgggctttcg gggcgagttc 600 tacatcaact tcgacatccc tcagtatctg ggcatcggcc ggaatgtgtc ccggggattc 660 ggcacagtgg tgaaggtgcc caagaagaag cggaaggtgg gtggaggcgg aggttctggg 720 ggaggaggta gtggcggtgg tggttcagga ggcggcggaa gccagctgca tttaccgcag 780 gttttagctg acgctgtctc acgcctggtc ataggtaagt ttggtgacct gaccgacaac 840 ttctcctccc ctcacgctcg cagaataggt ctggctggag tcgtcatgac aacaggcaca 900 gatgttaaag atgccaaggt gatatgtgtt tctacaggag caaaatgtat taatggtgaa 960 tacctaagtg atcgtggcct tgcattaaat gactgccatg cagaaatagt atctcggaga 1020 tccttgctca gatttcttta tacacaactt gagctttact taaataacga ggatgatcaa 1080 aaaagatcca tctttcagaa atcagagcga ggggggttta ggctgaagga gaatatacag 1140 tttcatctgt acatcagcac ctctccctgt ggagatgcca gaatcttctc accacatgag 1200 gcaatcctgg aagaaccagc agatagacac ccaaatcgta aagcaagagg acagctacgg 1260 accaaaatag aggctggtca ggggacgatt ccagtgcgca acaatgcgag catccaaacg 1320 tgggacgggg tgctgcaagg ggagcggctg ctcaccatgt cctgcagtga caagattgca 1380 cgctggaacg tggtgggcat ccagggatca ctgctcagca ttttcgtgga gcccatttac 1440 ttctcgagca tcatcctggg cagcctttac cacggggacc acctttccag ggccatgtac 1500 cagcggatct ccaacataga ggacctgcca cctctctaca ccctcaacaa gcctttgctc 1560 acaggcatca gcaatgcaga agcacggcag ccagggaagg cccccatatt cagtgtcaac 1620 tggacggtag gcgactccgc tattgaggtc atcaacgcca cgactgggaa gggagagctg 1680 ggccgcgcgt cccgcctgtg taagcacgcg ttgtactgtc gctggatgcg tgtgcacggc 1740 aaggttccct cccacttact acgctccaag attaccaagc ccaacgtgta ccatgagaca 1800 aagctggcgg caaaggagta ccaggccgcc aaggcgcgtc tgttcacagc cttcatcaag 1860 gcggggctgg gggcctgggt ggagaagccc accgagcagg accagttctc actcacgtaa 1920 <210> 75 <211> 1974 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 75 atgcccaaga agaagcggaa ggtgatgaga aatgaagtgc agttcgagct gttcggcgac 60 tacgccctgt tcaccgaccc cctgaccaag atcggcggcg aaaagctgag ctacagcgtg 120 cctacctacc aggccctgaa gggcatcgcc gagagcatct actggaagcc caccatcgtg 180 ttcgtgatcg acgaactgcg ggtcatgaag cccattcaga tggagtctaa gggcgtgagg 240 cccatcgagt acggcggcgg caacaccctg gcccactaca cctacctgaa ggatgtgcac 300 taccaggtga aggcccactt cgagttcaac ctgcaccggc ccgacctggc cttcgataga 360 aacgagggca agcactactc catcctgcag agaagcctga aggccggcgg cagaagagat 420 attttcctgg gcgcccggga gtgccagggc tacgtggccc cctgcgagtt cggcagcggc 480 gacggcttct acgacggcca gggcaagtac cacctgggaa ccatggtgca cggtttcaac 540 taccccgacg aaaccggaca gcaccagctg gatgtgagac tgtggtctgc cgtcatggaa 600 aacggctaca tccagttccc ccgccctgag gactgcccca tcgtgcggcc tgtgaaggag 660 atggaaccca agatcttcaa ccccgacaac gtgcagtccg ccgaacagct gctgcacgac 720 ctgggcggcg aacccaagaa gaagcggaag gtgggtggag gcggaggttc tgggggagga 780 ggtagtggcg gtggtggttc aggaggcggc ggaagccagc tgcatttacc gcaggtttta 840 gctgacgctg tctcacgcct ggtcataggt aagtttggtg acctgaccga caacttctcc 900 tcccctcacg ctcgcagaat aggtctggct ggagtcgtca tgacaacagg cacagatgtt 960 aaagatgcca aggtgatatg tgtttctaca ggagcaaaat gtattaatgg tgaataccta 1020 agtgatcgtg gccttgcatt aaatgactgc catgcagaaa tagtatctcg gagatccttg 1080 ctcagatttc tttatacaca acttgagctt tacttaaata acgaggatga tcaaaaaaga 1140 tccatctttc agaaatcaga gcgagggggg tttaggctga aggagaatat acagtttcat 1200 ctgtacatca gcacctctcc ctgtggagat gccagaatct tctcaccaca tgaggcaatc 1260 ctggaagaac cagcagatag acacccaaat cgtaaagcaa gaggacagct acggaccaaa 1320 atagaggctg gtcaggggac gattccagtg cgcaacaatg cgagcatcca aacgtgggac 1380 ggggtgctgc aaggggagcg gctgctcacc atgtcctgca gtgacaagat tgcacgctgg 1440 aacgtggtgg gcatccaggg atcactgctc agcattttcg tggagcccat ttacttctcg 1500 agcatcatcc tgggcagcct ttaccacggg gaccaccttt ccagggccat gtaccagcgg 1560 atctccaaca tagaggacct gccacctctc tacaccctca acaagccttt gctcacaggc 1620 atcagcaatg cagaagcacg gcagccaggg aaggccccca tattcagtgt caactggacg 1680 gtaggcgact ccgctattga ggtcatcaac gccacgactg ggaagggaga gctgggccgc 1740 gcgtcccgcc tgtgtaagca cgcgttgtac tgtcgctgga tgcgtgtgca cggcaaggtt 1800 ccctcccact tactacgctc caagattacc aagcccaacg tgtaccatga gacaaagctg 1860 gcggcaaagg agtaccaggc cgccaaggcg cgtctgttca cagccttcat caaggcgggg 1920 ctgggggcct gggtggagaa gcccaccgag caggaccagt tctcactcac gtaa 1974 <210> 76 <211> 1992 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 76 atgcccaaga agaagcggaa ggtgatgtac agaagccggg acttctacgt gagagtgtcc 60 ggccagcggg ccctgttcac caaccccgcc accaagggcg gctccgaacg gagctcctac 120 tccgtgccta cccggcaggc cctgaacggg attgtggacg ccatctacta caagcccacg 180 ttcaccaaca tcgtgaccga ggtgaaggtg attaaccaga tccagaccga actgcagggc 240 gtgcgggccc tgctgcatga ctacagcgcc gacctgagct acgtgtccta cctgagcgac 300 gtggtgtacc tgattaagtt tcatttcgtg tggaacgagg atagaaagga cctgaatagc 360 gaccggctgc cagccaagca tgaggccatc atggagcggt ctatccggaa gggcggcaga 420 cgggacgtgt tcctgggcac cagagaatgc ctgggcctgc tggacgacat cagccaggaa 480 gaatacgaaa ccacagtgag ctattacaat ggggtgaaca tcgacctggg catcatgttc 540 cacagcttcg cttaccccaa ggacaagaaa acccccctga agtcctactt cacaaagacc 600 gtgatgaaga acggcgtgat caccttcaag gcccagtccg aatgcgatat tgtgaacacc 660 ctgagctcct acgccttcaa ggcccccgag gagatcaaga gcgtgaacga cgagtgcatg 720 gagtacgacg ccatggagaa gggcgaaaac cccaagaaga agcggaaggt gggtggaggc 780 ggaggttctg ggggaggagg tagtggcggt ggtggttcag gaggcggcgg aagccagctg 840 catttaccgc aggttttagc tgacgctgtc tcacgcctgg tcataggtaa gtttggtgac 900 ctgaccgaca acttctcctc ccctcacgct cgcagaatag gtctggctgg agtcgtcatg 960 acaacaggca cagatgttaa agatgccaag gtgatatgtg tttctacagg agcaaaatgt 1020 attaatggtg aatacctaag tgatcgtggc cttgcattaa atgactgcca tgcagaaata 1080 gtatctcgga gatccttgct cagatttctt tatacacaac ttgagcttta cttaaataac 1140 gaggatgatc aaaaaagatc catctttcag aaatcagagc gaggggggtt taggctgaag 1200 gagaatatac agtttcatct gtacatcagc acctctccct gtggagatgc cagaatcttc 1260 tcaccacatg aggcaatcct ggaagaacca gcagatagac acccaaatcg taaagcaaga 1320 ggacagctac ggaccaaaat agaggctggt caggggacga ttccagtgcg caacaatgcg 1380 agcatccaaa cgtgggacgg ggtgctgcaa ggggagcggc tgctcaccat gtcctgcagt 1440 gacaagattg cacgctggaa cgtggtgggc atccagggat cactgctcag cattttcgtg 1500 gagcccattt acttctcgag catcatcctg ggcagccttt accacgggga ccacctttcc 1560 agggccatgt accagcggat ctccaacata gaggacctgc cacctctcta caccctcaac 1620 aagcctttgc tcacaggcat cagcaatgca gaagcacggc agccagggaa ggcccccata 1680 ttcagtgtca actggacggt aggcgactcc gctattgagg tcatcaacgc cacgactggg 1740 aagggagagc tgggccgcgc gtcccgcctg tgtaagcacg cgttgtactg tcgctggatg 1800 cgtgtgcacg gcaaggttcc ctcccactta ctacgctcca agattaccaa gcccaacgtg 1860 taccatgaga caaagctggc ggcaaaggag taccaggccg ccaaggcgcg tctgttcaca 1920 gccttcatca aggcggggct gggggcctgg gtggagaagc ccaccgagca ggaccagttc 1980 tcactcacgt aa 1992 <210> 77 <211> 2046 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 77 atgcccaaga agaagcggaa ggtgatgccc aacgatccct acagcctgta ctccatcgtg 60 atcgaactgg gcgccgccga aaagggattc cccacaggca tcctgggcag aagcctgcat 120 agccaggtgc tgcagtggtt caagcaggat aaccccttcc tggccaccga gctgcaccag 180 agccagatct cccccttctc catctctcca ctgatgggca agcggcacgc caagctgacc 240 aaggccggcg accggctgtt ctttcggatc tgcctgctga gaggagatct gctgcagccc 300 ctgctgaacg gcattgagca gaccgtgaac cagagcgtgt gcctggacaa gttccggttc 360 cggctgtgcc agacccacat cctgcccggc agccaccctc tggctggcgc ctcccactat 420 agcctgatca gccagacccc agtgagctcc aagattaccc tggacttcaa gagttctacc 480 tccttcaagg tggaccggaa gatcatccaa gtgttccctc tgggcgaaca cgtgttcaac 540 agcctgctca gacgctggaa taacttcgcc cccgaggacc tgcacttctc tcaggtggac 600 tggagcatcc ccatcgccgc attcgacgtg aaaaccatcc ccatccacct gaagaaggtc 660 gagatcggcg cacagggctg ggtgacctac atcttcccca acacagaaca ggccaagatc 720 gcctccgtgc tgagcgaatt cgccttcttc agcggagtgg gacggaaaac caccatgggc 780 atgggccagg tgcaggtgcg gtcccccaag aagaagcgga aggtgggtgg aggcggaggt 840 tctgggggag gaggtagtgg cggtggtggt tcaggaggcg gcggaagcca gctgcattta 900 ccgcaggttt tagctgacgc tgtctcacgc ctggtcatag gtaagtttgg tgacctgacc 960 gacaacttct cctcccctca cgctcgcaga ataggtctgg ctggagtcgt catgacaaca 1020 ggcacagatg ttaaagatgc caaggtgata tgtgtttcta caggagcaaa atgtattaat 1080 ggtgaatacc taagtgatcg tggccttgca ttaaatgact gccatgcaga aatagtatct 1140 cggagatcct tgctcagatt tctttataca caacttgagc tttacttaaa taacgaggat 1200 gatcaaaaaa gatccatctt tcagaaatca gagcgagggg ggtttaggct gaaggagaat 1260 atacagtttc atctgtacat cagcacctct ccctgtggag atgccagaat cttctcacca 1320 catgaggcaa tcctggaaga accagcagat agacacccaa atcgtaaagc aagaggacag 1380 ctacggacca aaatagaggc tggtcagggg acgattccag tgcgcaacaa tgcgagcatc 1440 caaacgtggg acggggtgct gcaaggggag cggctgctca ccatgtcctg cagtgacaag 1500 attgcacgct ggaacgtggt gggcatccag ggatcactgc tcagcatttt cgtggagccc 1560 atttacttct cgagcatcat cctgggcagc ctttaccacg gggaccacct ttccagggcc 1620 atgtaccagc ggatctccaa catagaggac ctgccacctc tctacaccct caacaagcct 1680 ttgctcacag gcatcagcaa tgcagaagca cggcagccag ggaaggcccc catattcagt 1740 gtcaactgga cggtaggcga ctccgctatt gaggtcatca acgccacgac tgggaaggga 1800 gagctgggcc gcgcgtcccg cctgtgtaag cacgcgttgt actgtcgctg gatgcgtgtg 1860 cacggcaagg ttccctccca cttactacgc tccaagatta ccaagcccaa cgtgtaccat 1920 gagacaaagc tggcggcaaa ggagtaccag gccgccaagg cgcgtctgtt cacagccttc 1980 atcaaggcgg ggctgggggc ctgggtggag aagcccaccg agcaggacca gttctcactc 2040 acgtaa 2046 <210> 78 <211> 1860 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 78 atgcctaaga agaagcggaa ggtgtacctg agcaaggtga tcatcgccag agcctggagc 60 agagacctgt accagctgca ccagggcctg tggcacctgt tccccaaccg gcccgacgcc 120 gcccgggatt tcctgttcca cgtggagaag agaaacaccc cggaaggctg ccacgtgctg 180 ctgcagagcg cacagatgcc tgtgagcacc gccgtggcca ccgtgatcaa gaccaagcag 240 gtggagttcc agctgcaggt gggcgtgccc ctgtatttca ggctgcgggc gaatcccatc 300 aagaccatcc tggacaacca gaagcggctg gacagcaagg gcaacatcaa gaggtgcaga 360 gtgcctctga tcaaggaggc cgaacagatc gcctggctgc agcggaagct gggcaatgcc 420 gccagagtgg aggacgtgca ccccatcagc gagcggcccc agtacttctc cggcgacgga 480 aagagcggaa agatccagac cgtgtgcttc gagggcgtgc tgaccatcaa cgacgcaccc 540 gccctgatcg acctcgtgca gcaggggatc ggccctgcca agtccatggg ctgcggactg 600 ctgtccctgg cccccctgcc caagaagaag cggaaggtgg gtggaggcgg aggttctggg 660 ggaggaggta gtggcggtgg tggttcagga ggcggcggaa gccagctgca tttaccgcag 720 gttttagctg acgctgtctc acgcctggtc ataggtaagt ttggtgacct gaccgacaac 780 ttctcctccc ctcacgctcg cagaataggt ctggctggag tcgtcatgac aacaggcaca 840 gatgttaaag atgccaaggt gatatgtgtt tctacaggag caaaatgtat taatggtgaa 900 tacctaagtg atcgtggcct tgcattaaat gactgccatg cagaaatagt atctcggaga 960 tccttgctca gatttcttta tacacaactt gagctttact taaataacga ggatgatcaa 1020 aaaagatcca tctttcagaa atcagagcga ggggggttta ggctgaagga gaatatacag 1080 tttcatctgt acatcagcac ctctccctgt ggagatgcca gaatcttctc accacatgag 1140 gcaatcctgg aagaaccagc agatagacac ccaaatcgta aagcaagagg acagctacgg 1200 accaaaatag aggctggtca ggggacgatt ccagtgcgca acaatgcgag catccaaacg 1260 tgggacgggg tgctgcaagg ggagcggctg ctcaccatgt cctgcagtga caagattgca 1320 cgctggaacg tggtgggcat ccagggatca ctgctcagca ttttcgtgga gcccatttac 1380 ttctcgagca tcatcctggg cagcctttac cacggggacc acctttccag ggccatgtac 1440 cagcggatct ccaacataga ggacctgcca cctctctaca ccctcaacaa gcctttgctc 1500 acaggcatca gcaatgcaga agcacggcag ccagggaagg cccccatatt cagtgtcaac 1560 tggacggtag gcgactccgc tattgaggtc atcaacgcca cgactgggaa gggagagctg 1620 ggccgcgcgt cccgcctgtg taagcacgcg ttgtactgtc gctggatgcg tgtgcacggc 1680 aaggttccct cccacttact acgctccaag attaccaagc ccaacgtgta ccatgagaca 1740 aagctggcgg caaaggagta ccaggccgcc aaggcgcgtc tgttcacagc cttcatcaag 1800 gcggggctgg gggcctgggt ggagaagccc accgagcagg accagttctc actcacgtaa 1860 <210> 79 <211> 1824 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 79 atgcctaaga agaagagaaa ggtggaccac tacctggaca ttagactgcg ccctgaccca 60 gagttccctc ctgcccagct gatgtctgtg ctgtttggca agctgcacca ggccctggtg 120 gcccagggcg gtgacagaat cggagtgtct ttccctgatc tggacgaatc tagatctaga 180 ctgggagaga gactgagaat ccacgcgtct gccgacgacc tgagagctct gctggccaga 240 ccatggctgg aaggactgcg cgaccacctg cagttcggtg aacctgccgt ggtgcctcac 300 ccaactccat acagacaggt gagtagagtg caggcaaagt ctaatccaga gagactgaga 360 cgcagactga tgagaaggca tgacctgtcc gaagaagaag ccagaaagag aatcccagac 420 acagtggcca gagccctgga tctgcctttt gtgaccctga gaagccagtc taccggccag 480 cacttcagac tgtttattcg ccacggacca ctgcaggtga ccgccgaaga gggaggtttt 540 acctgctacg gactgagcaa gggaggtttc gtgccttggt tccccaagaa gaagcggaag 600 gtgggtggag gcggaggttc tgggggagga ggtagtggcg gtggtggttc aggaggcggc 660 ggaagccagc tgcatttacc gcaggtttta gctgacgctg tctcacgcct ggtcataggt 720 aagtttggtg acctgaccga caacttctcc tcccctcacg ctcgcagaat aggtctggct 780 ggagtcgtca tgacaacagg cacagatgtt aaagatgcca aggtgatatg tgtttctaca 840 ggagcaaaat gtattaatgg tgaataccta agtgatcgtg gccttgcatt aaatgactgc 900 catgcagaaa tagtatctcg gagatccttg ctcagatttc tttatacaca acttgagctt 960 tacttaaata acgaggatga tcaaaaaaga tccatctttc agaaatcaga gcgagggggg 1020 tttaggctga aggagaatat acagtttcat ctgtacatca gcacctctcc ctgtggagat 1080 gccagaatct tctcaccaca tgaggcaatc ctggaagaac cagcagatag acacccaaat 1140 cgtaaagcaa gaggacagct acggaccaaa atagaggctg gtcaggggac gattccagtg 1200 cgcaacaatg cgagcatcca aacgtgggac ggggtgctgc aaggggagcg gctgctcacc 1260 atgtcctgca gtgacaagat tgcacgctgg aacgtggtgg gcatccaggg atcactgctc 1320 agcattttcg tggagcccat ttacttctcg agcatcatcc tgggcagcct ttaccacggg 1380 gaccaccttt ccagggccat gtaccagcgg atctccaaca tagaggacct gccacctctc 1440 tacaccctca acaagccttt gctcacaggc atcagcaatg cagaagcacg gcagccaggg 1500 aaggccccca tattcagtgt caactggacg gtaggcgact ccgctattga ggtcatcaac 1560 gccacgactg ggaagggaga gctgggccgc gcgtcccgcc tgtgtaagca cgcgttgtac 1620 tgtcgctgga tgcgtgtgca cggcaaggtt ccctcccact tactacgctc caagattacc 1680 aagcccaacg tgtaccatga gacaaagctg gcggcaaagg agtaccaggc cgccaaggcg 1740 cgtctgttca cagccttcat caaggcgggg ctgggggcct gggtggagaa gcccaccgag 1800 caggaccagt tctcactcac gtaa 1824 <210> 80 <211> 2208 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 80 atgcccaaga agaagcggaa ggtgatggcc gccagaagag gcggaatccg gagaaccgac 60 ctgctgcgga ggtctggcca gcctcggggc agacaccggg cctccgccgc cgagagcggc 120 ctgacatgga tctcccctac cctgatcctg gtgggcttca gccacagggg cgataggaga 180 atgaccgagc acctgtccag actgaccctg accctggaag tggatgcccc cctggagaga 240 gcccgggtgg ccaccctggg cccccacctg catggcgtgc tgatggagtc tatccccgcc 300 gactacgtgc agacactgca cacagtgccg gtgaaccctt acagccagta cgctctggcc 360 cggagcacca ccagcctgga gtggaagatc tccaccctga caaatgaggc ccggcagcag 420 atcgtcggcc ccatcaacga cgccgccttc gccggcttcc ggctgcgggc cagcggcatc 480 gccacccagg tgacaagcag aagcctggag cagaaccccc tgtcccagtt tgccagaatc 540 ttctacgcca ggcccgaaac ccgcaagttc agagtggagt tcctgacccc caccgccttc 600 aagcagagcg gcgagtacgt gttttggccc gatcccagac tggtgttcca gtccctggcc 660 cagaagtacg gcgccatcgt ggacggagaa gagcccgacc ccggcctgat cgccgagttt 720 ggccagtccg tgagactgag cgccttcaga gtggccagcg ccccttttgc cgtgggcgcc 780 gccagggtgc ccggattcac cggcagcgcc accttcaccg tgcggggagt ggacaccttc 840 gccagctaca tcgccgctct gctgtggttc ggcgagttca gcggatgcgg catcaaggcc 900 tccatgggaa tgggcgccat ccgggtgcag cctctggccc cccgggagaa gtgcgtgccc 960 aagcccccca agaagaagcg gaaggtgggt ggaggcggag gttctggggg aggaggtagt 1020 ggcggtggtg gttcaggagg cggcggaagc cagctgcatt taccgcaggt tttagctgac 1080 gctgtctcac gcctggtcat aggtaagttt ggtgacctga ccgacaactt ctcctcccct 1140 cacgctcgca gaataggtct ggctggagtc gtcatgacaa caggcacaga tgttaaagat 1200 gccaaggtga tatgtgtttc tacaggagca aaatgtatta atggtgaata cctaagtgat 1260 cgtggccttg cattaaatga ctgccatgca gaaatagtat ctcggagatc cttgctcaga 1320 tttctttata cacaacttga gctttactta aataacgagg atgatcaaaa aagatccatc 1380 tttcagaaat cagagcgagg ggggtttagg ctgaaggaga atatacagtt tcatctgtac 1440 atcagcacct ctccctgtgg agatgccaga atcttctcac cacatgaggc aatcctggaa 1500 gaaccagcag atagacaccc aaatcgtaaa gcaagaggac agctacggac caaaatagag 1560 gctggtcagg ggacgattcc agtgcgcaac aatgcgagca tccaaacgtg ggacggggtg 1620 ctgcaagggg agcggctgct caccatgtcc tgcagtgaca agattgcacg ctggaacgtg 1680 gtgggcatcc agggatcact gctcagcatt ttcgtggagc ccatttactt ctcgagcatc 1740 atcctgggca gcctttacca cggggaccac ctttccaggg ccatgtacca gcggatctcc 1800 aacatagagg acctgccacc tctctacacc ctcaacaagc ctttgctcac aggcatcagc 1860 aatgcagaag cacggcagcc agggaaggcc cccatattca gtgtcaactg gacggtaggc 1920 gactccgcta ttgaggtcat caacgccacg actgggaagg gagagctggg ccgcgcgtcc 1980 cgcctgtgta agcacgcgtt gtactgtcgc tggatgcgtg tgcacggcaa ggttccctcc 2040 cacttactac gctccaagat taccaagccc aacgtgtacc atgagacaaa gctggcggca 2100 aaggagtacc aggccgccaa ggcgcgtctg ttcacagcct tcatcaaggc ggggctgggg 2160 gcctgggtgg agaagcccac cgagcaggac cagttctcac tcacgtaa 2208 <210> 81 <211> 2058 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 81 atgcccaaga agaagcggaa ggtgatgaga ttcctgatca gactggtgcc cgaggacaag 60 gacagagcct tcaaggtgcc ttacaaccac cagtactatc tgcagggcct gatctacaac 120 gccatcaagt cctccaaccc caagctggcc acctacctgc acgaggtgaa gggccccaag 180 ctgttcacct acagcctgtt catggccgaa aagcgggagc accctaaggg cctgccctac 240 tttctgggct acaagaaggg cttcttctac ttcagcacct gcgtgcccga gatcgccgag 300 gccctggtga acggcctgct gatgaatccc gaggtgcggc tgtgggacga gagattctac 360 ctgcacgaaa tcaaggtcct gcgggagccc aagaagttca acggcagcac cttcgtgacc 420 ctgagcccca tcgccgtgac cgtggtgaga aagggcaagt cctacgacgt gccccccatg 480 gaaaaggagt tctacagcat tatcaaggat gacctgcagg acaagtacgt gatggcctac 540 ggcgacaagc cccccagtga gttcgagatg gaagtgctga tcgccaagcc caagcggttc 600 cggatcaagc ccggcatcta tcagaccgcc tggcacctgg tgtttcgggc ctacggcaat 660 gacgacctgc tgaaggtggg ctacgaagtg ggattcgggg agaagaactc cctgggattc 720 ggaatggtca aggtggaggg caacaagacc accaaggaag ccgaagaaca ggagaagatc 780 accttcaact cccgggaaga gctgaaaaca ggcgtgccca agaagaagcg gaaggtgggt 840 ggaggcggag gttctggggg aggaggtagt ggcggtggtg gttcaggagg cggcggaagc 900 cagctgcatt taccgcaggt tttagctgac gctgtctcac gcctggtcat aggtaagttt 960 ggtgacctga ccgacaactt ctcctcccct cacgctcgca gaataggtct ggctggagtc 1020 gtcatgacaa caggcacaga tgttaaagat gccaaggtga tatgtgtttc tacaggagca 1080 aaatgtatta atggtgaata cctaagtgat cgtggccttg cattaaatga ctgccatgca 1140 gaaatagtat ctcggagatc cttgctcaga tttctttata cacaacttga gctttactta 1200 aataacgagg atgatcaaaa aagatccatc tttcagaaat cagagcgagg ggggtttagg 1260 ctgaaggaga atatacagtt tcatctgtac atcagcacct ctccctgtgg agatgccaga 1320 atcttctcac cacatgaggc aatcctggaa gaaccagcag atagacaccc aaatcgtaaa 1380 gcaagaggac agctacggac caaaatagag gctggtcagg ggacgattcc agtgcgcaac 1440 aatgcgagca tccaaacgtg ggacggggtg ctgcaagggg agcggctgct caccatgtcc 1500 tgcagtgaca agattgcacg ctggaacgtg gtgggcatcc agggatcact gctcagcatt 1560 ttcgtggagc ccatttactt ctcgagcatc atcctgggca gcctttacca cggggaccac 1620 ctttccaggg ccatgtacca gcggatctcc aacatagagg acctgccacc tctctacacc 1680 ctcaacaagc ctttgctcac aggcatcagc aatgcagaag cacggcagcc agggaaggcc 1740 cccatattca gtgtcaactg gacggtaggc gactccgcta ttgaggtcat caacgccacg 1800 actgggaagg gagagctggg ccgcgcgtcc cgcctgtgta agcacgcgtt gtactgtcgc 1860 tggatgcgtg tgcacggcaa ggttccctcc cacttactac gctccaagat taccaagccc 1920 aacgtgtacc atgagacaaa gctggcggca aaggagtacc aggccgccaa ggcgcgtctg 1980 ttcacagcct tcatcaaggc ggggctgggg gcctgggtgg agaagcccac cgagcaggac 2040 cagttctcac tcacgtaa 2058 <210> 82 <211> 1971 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 82 atgcctaaga agaagcggaa ggtgttcgtg acccaggtga tcttcaacat cggcgaacgg 60 acgtaccccg acagggctcg ggctatggtg gccgagctga tggatggcgt ccagcctggc 120 ctggtggcca ccctgatgaa ctacatcccc ggcaccagca cgagccggac agagttcccc 180 accgtgcagt tcggcggcgc cagcgacggc ttttgcctgc tgggcttcgg cgacggcggc 240 ggcgccatcg tgagagatgc cgtgcccctg atccacgccg ccctggcaag gcggatgcct 300 gatcggatca tccaggtgga acacaaggag cacagcctgt ccgccgaggc ccggccctac 360 gtgctgagct acaccgtgcc tcggatggtg gtgcagaaga agcagcggca cgccgagaga 420 ctgctgcacg aagccgaggg aaaggctcac ctggagggcc tgttcctgcg gagcctgcag 480 aggcaggccg ccgccgtggg cctgcccctg cccgagaacc tggaggtgga gttcaaggga 540 gccgtgggcg acttcgccgc aaagcacaat ccaaatagca aggtggccta ccggggactg 600 agaggcgccg tgttcgatgt gaacgccaga ctgggcggca tctggaccgc cggattcatg 660 ctgagcaagg gctacggcca gtttaacgcc acccaccagc tgagcggcgc cgtgaacgct 720 ctgtccgaac ccaagaagaa gcggaaggtg ggtggaggcg gaggttctgg gggaggaggt 780 agtggcggtg gtggttcagg aggcggcgga agccagctgc atttaccgca ggttttagct 840 gacgctgtct cacgcctggt cataggtaag tttggtgacc tgaccgacaa cttctcctcc 900 cctcacgctc gcagaatagg tctggctgga gtcgtcatga caacaggcac agatgttaaa 960 gatgccaagg tgatatgtgt ttctacagga gcaaaatgta ttaatggtga atacctaagt 1020 gatcgtggcc ttgcattaaa tgactgccat gcagaaatag tatctcggag atccttgctc 1080 agatttcttt atacacaact tgagctttac ttaaataacg aggatgatca aaaaagatcc 1140 atctttcaga aatcagagcg aggggggttt aggctgaagg agaatataca gtttcatctg 1200 tacatcagca cctctccctg tggagatgcc agaatcttct caccacatga ggcaatcctg 1260 gaagaaccag cagatagaca cccaaatcgt aaagcaagag gacagctacg gaccaaaata 1320 gaggctggtc aggggacgat tccagtgcgc aacaatgcga gcatccaaac gtgggacggg 1380 gtgctgcaag gggagcggct gctcaccatg tcctgcagtg acaagattgc acgctggaac 1440 gtggtgggca tccagggatc actgctcagc attttcgtgg agcccattta cttctcgagc 1500 atcatcctgg gcagccttta ccacggggac cacctttcca gggccatgta ccagcggatc 1560 tccaacatag aggacctgcc acctctctac accctcaaca agcctttgct cacaggcatc 1620 agcaatgcag aagcacggca gccagggaag gcccccatat tcagtgtcaa ctggacggta 1680 ggcgactccg ctattgaggt catcaacgcc acgactggga agggagagct gggccgcgcg 1740 tcccgcctgt gtaagcacgc gttgtactgt cgctggatgc gtgtgcacgg caaggttccc 1800 tcccacttac tacgctccaa gattaccaag cccaacgtgt accatgagac aaagctggcg 1860 gcaaaggagt accaggccgc caaggcgcgt ctgttcacag ccttcatcaa ggcggggctg 1920 ggggcctggg tggagaagcc caccgagcag gaccagttct cactcacgta a 1971 <210> 83 <211> 2040 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 83 atgcccaaga agaagagaaa ggtgcaccag accctgatcc ggatcaactg gcccaaggga 60 ttcaagtgcc cccctgccga gttccgggaa aagctggcca agagcgagat gttccccccc 120 gagttcttcc actacggcac ggaactggcc gtgtgggaca agcagaccgc cgaggtggag 180 ggcaagatca agaccgtgtc caaggagaag atcatcaaga cctttgacaa gcccatcccc 240 ctgaatggcc gggccccggt cagagtgatc ggcggccagg cctgggccgg cgtgatcgcc 300 gaccccgaga tggagggcat gctgatccca cacctgggga gcatcctgaa ggtggccagc 360 agcgcggccg gatgcgcagt gaagatcgaa ctggaacaga gaaagttcgg catcagctac 420 accgagtacc ccgtgaagta caacctgcgg gagctggtgc tgaagagaag atgcgaggac 480 gcccggtcta ccgatatcga gagcctgatt gccgatagaa tctggggcgg cgtgtccggc 540 gagagctact atggcatcga cggcacatgc gccaagtttg gcttcgaacc ccccagcaga 600 gagcagctgg agctgcggat cttccccatg aagaacatcg gactgcacat gaagtccagc 660 gacggactgt ccaaggagta catgagcctg attgacgccg aggtgtggat gaacgctaag 720 ctggaaggag tgtggcaggt gggcaacctg atcagcaggg gctacggccg gttcatcaag 780 tctatcggcg cccagtcccc caagaagaag cggaaggtgg gtggaggcgg aggttctggg 840 ggaggaggta gtggcggtgg tggttcagga ggcggcggaa gccagctgca tttaccgcag 900 gttttagctg acgctgtctc acgcctggtc ataggtaagt ttggtgacct gaccgacaac 960 ttctcctccc ctcacgctcg cagaataggt ctggctggag tcgtcatgac aacaggcaca 1020 gatgttaaag atgccaaggt gatatgtgtt tctacaggag caaaatgtat taatggtgaa 1080 tacctaagtg atcgtggcct tgcattaaat gactgccatg cagaaatagt atctcggaga 1140 tccttgctca gatttcttta tacacaactt gagctttact taaataacga ggatgatcaa 1200 aaaagatcca tctttcagaa atcagagcga ggggggttta ggctgaagga gaatatacag 1260 tttcatctgt acatcagcac ctctccctgt ggagatgcca gaatcttctc accacatgag 1320 gcaatcctgg aagaaccagc agatagacac ccaaatcgta aagcaagagg acagctacgg 1380 accaaaatag aggctggtca ggggacgatt ccagtgcgca acaatgcgag catccaaacg 1440 tgggacgggg tgctgcaagg ggagcggctg ctcaccatgt cctgcagtga caagattgca 1500 cgctggaacg tggtgggcat ccagggatca ctgctcagca ttttcgtgga gcccatttac 1560 ttctcgagca tcatcctggg cagcctttac cacggggacc acctttccag ggccatgtac 1620 cagcggatct ccaacataga ggacctgcca cctctctaca ccctcaacaa gcctttgctc 1680 acaggcatca gcaatgcaga agcacggcag ccagggaagg cccccatatt cagtgtcaac 1740 tggacggtag gcgactccgc tattgaggtc atcaacgcca cgactgggaa gggagagctg 1800 ggccgcgcgt cccgcctgtg taagcacgcg ttgtactgtc gctggatgcg tgtgcacggc 1860 aaggttccct cccacttact acgctccaag attaccaagc ccaacgtgta ccatgagaca 1920 aagctggcgg caaaggagta ccaggccgcc aaggcgcgtc tgttcacagc cttcatcaag 1980 gcggggctgg gggcctgggt ggagaagccc accgagcagg accagttctc actcacgtaa 2040 <210> 84 <211> 867 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 84 atgcctctga tcttcaagat cggctataac gtgatccccc tgcaggacgt gatcctgccc 60 accccttcca gcaaggtgct gaagtacctg atccagagcg gcaagctgat ccccagcctg 120 aaggacctga tcaccagccg ggacaagtac aagccaatct tcatctccca cctgggcttc 180 aaccagcgga ggattttcca gaccaacggc aatctgaaaa ccatcaccaa gggcagtaga 240 ctgagctcca tcatcgcctt cagcacccag gccaacgtgc tgtccgaggt ggccgatgaa 300 gggatcttcg aaaccgtgta cggaaagttc cacatcatga tcgaaagcat cgagatcgtg 360 gaggtggaaa agctgaagga ggaggtggag aagcacatga acgacaacat cagagtgaga 420 ttcgtgtctc ccacactgct gagctccaag gtgctgctgc cccccagcct gtccgaaaga 480 tacaagaaga tccacgccgg gtacagcacc ctgcccagcg tgggcctgat cgtggcctac 540 gcctacaacg tgtactgcaa tctgatcggc aagaaggaag tggaagtgcg ggccttcaag 600 tttggaatcc tgagcaacgc cctgtccaga atcatcggct acgacctgca ccctgtgacc 660 gtggccatcg gcgaggacag caaggggaat ctgagaaagg ctcggggcgt gatgggctgg 720 atcgagttcg acatccccga cgaaagactg aagcggcggg ccctgaacta tctgctgacc 780 agcagctacc tgggcatcgg gagatctcgg ggcatcggct tcggcgagat ccggctggag 840 ttccggaaga ttgaagagaa ggaggga 867 <210> 85 <211> 654 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 85 atggacctgg agtacatgca catctcctac cctaacatcc tgctgaacat gcgggacggc 60 agcaagctgc ggggctactt cgccaagaag tacatcgacg aagagattgt gcacaaccac 120 agagacaacg cctttgtgta caagtacccc cagatccagt ttaagatcat cgatagaagc 180 cccctgatca tcggcattgg ctctctgggc atcaatttcc tggagagcaa gcggatcttc 240 ttcgagaagg aactgattat cagcaacgac accaacgaca tcaccgaggt gaacgtgcac 300 aaggacatgg atcacttcgg cacgaccgac aagatcctga agtaccagtt caagacccct 360 tggatggcac tgaacgccaa gaatagcgag atctacaaga actctgacga gatcgaccgg 420 gaggagttcc tgaagagagt gctgattggg aatatcctga gcatgtctaa gagcctgggc 480 tataccatcg aagaaaagct gaaggtgaag attaacctga aggaagtgcc cgtgaagttc 540 aagaaccaga acatggtggg ctttcggggc gagttctaca tcaacttcga catccctcag 600 tatctgggca tcggccggaa tgtgtcccgg ggattcggca cagtggtgaa ggtg 654 <210> 86 <211> 708 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 86 atgagaaatg aagtgcagtt cgagctgttc ggcgactacg ccctgttcac cgaccccctg 60 accaagatcg gcggcgaaaa gctgagctac agcgtgccta cctaccaggc cctgaagggc 120 atcgccgaga gcatctactg gaagcccacc atcgtgttcg tgatcgacga actgcgggtc 180 atgaagccca ttcagatgga gtctaagggc gtgaggccca tcgagtacgg cggcggcaac 240 accctggccc actacaccta cctgaaggat gtgcactacc aggtgaaggc ccacttcgag 300 ttcaacctgc accggcccga cctggccttc gatagaaacg agggcaagca ctactccatc 360 ctgcagagaa gcctgaaggc cggcggcaga agagatattt tcctgggcgc ccgggagtgc 420 cagggctacg tggccccctg cgagttcggc agcggcgacg gcttctacga cggccagggc 480 aagtaccacc tgggaaccat ggtgcacggt ttcaactacc ccgacgaaac cggacagcac 540 cagctggatg tgagactgtg gtctgccgtc atggaaaacg gctacatcca gttcccccgc 600 cctgaggact gccccatcgt gcggcctgtg aaggagatgg aacccaagat cttcaacccc 660 gacaacgtgc agtccgccga acagctgctg cacgacctgg gcggcgaa 708 <210> 87 <211> 726 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 87 atgtacagaa gccgggactt ctacgtgaga gtgtccggcc agcgggccct gttcaccaac 60 cccgccacca agggcggctc cgaacggagc tcctactccg tgcctacccg gcaggccctg 120 aacgggattg tggacgccat ctactacaag cccacgttca ccaacatcgt gaccgaggtg 180 aaggtgatta accagatcca gaccgaactg cagggcgtgc gggccctgct gcatgactac 240 agcgccgacc tgagctacgt gtcctacctg agcgacgtgg tgtacctgat taagtttcat 300 ttcgtgtgga acgaggatag aaaggacctg aatagcgacc ggctgccagc caagcatgag 360 gccatcatgg agcggtctat ccggaagggc ggcagacggg acgtgttcct gggcaccaga 420 gaatgcctgg gcctgctgga cgacatcagc caggaagaat acgaaaccac agtgagctat 480 tacaatgggg tgaacatcga cctgggcatc atgttccaca gcttcgctta ccccaaggac 540 aagaaaaccc ccctgaagtc ctacttcaca aagaccgtga tgaagaacgg cgtgatcacc 600 ttcaaggccc agtccgaatg cgatattgtg aacaccctga gctcctacgc cttcaaggcc 660 cccgaggaga tcaagagcgt gaacgacgag tgcatggagt acgacgccat ggagaagggc 720 gaaaac 726 <210> 88 <211> 780 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 88 atgcccaacg atccctacag cctgtactcc atcgtgatcg aactgggcgc cgccgaaaag 60 ggattcccca caggcatcct gggcagaagc ctgcatagcc aggtgctgca gtggttcaag 120 caggataacc ccttcctggc caccgagctg caccagagcc agatctcccc cttctccatc 180 tctccactga tgggcaagcg gcacgccaag ctgaccaagg ccggcgaccg gctgttcttt 240 cggatctgcc tgctgagagg agatctgctg cagcccctgc tgaacggcat tgagcagacc 300 gtgaaccaga gcgtgtgcct ggacaagttc cggttccggc tgtgccagac ccacatcctg 360 cccggcagcc accctctggc tggcgcctcc cactatagcc tgatcagcca gaccccagtg 420 agctccaaga ttaccctgga cttcaagagt tctacctcct tcaaggtgga ccggaagatc 480 atccaagtgt tccctctggg cgaacacgtg ttcaacagcc tgctcagacg ctggaataac 540 ttcgcccccg aggacctgca cttctctcag gtggactgga gcatccccat cgccgcattc 600 gacgtgaaaa ccatccccat ccacctgaag aaggtcgaga tcggcgcaca gggctgggtg 660 acctacatct tccccaacac agaacaggcc aagatcgcct ccgtgctgag cgaattcgcc 720 ttcttcagcg gagtgggacg gaaaaccacc atgggcatgg gccaggtgca ggtgcggtcc 780 <210> 89 <211> 597 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 89 atgtacctga gcaaggtgat catcgccaga gcctggagca gagacctgta ccagctgcac 60 cagggcctgt ggcacctgtt ccccaaccgg cccgacgccg cccgggattt cctgttccac 120 gtggagaaga gaaacacccc ggaaggctgc cacgtgctgc tgcagagcgc acagatgcct 180 gtgagcaccg ccgtggccac cgtgatcaag accaagcagg tggagttcca gctgcaggtg 240 ggcgtgcccc tgtatttcag gctgcgggcg aatcccatca agaccatcct ggacaaccag 300 aagcggctgg acagcaaggg caacatcaag aggtgcagag tgcctctgat caaggaggcc 360 gaacagatcg cctggctgca gcggaagctg ggcaatgccg ccagagtgga ggacgtgcac 420 cccatcagcg agcggcccca gtacttctcc ggcgacggaa agagcggaaa gatccagacc 480 gtgtgcttcg agggcgtgct gaccatcaac gacgcacccg ccctgatcga cctcgtgcag 540 caggggatcg gccctgccaa gtccatgggc tgcggactgc tgtccctggc ccccctg 597 <210> 90 <211> 561 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 90 atggaccact acctggacat tagactgcgc cctgacccag agttccctcc tgcccagctg 60 atgtctgtgc tgtttggcaa gctgcaccag gccctggtgg cccagggcgg tgacagaatc 120 ggagtgtctt tccctgatct ggacgaatct agatctagac tgggagagag actgagaatc 180 cacgcgtctg ccgacgacct gagagctctg ctggccagac catggctgga aggactgcgc 240 gaccacctgc agttcggtga acctgccgtg gtgcctcacc caactccata cagacaggtg 300 agtagagtgc aggcaaagtc taatccagag agactgagac gcagactgat gagaaggcat 360 gacctgtccg aagaagaagc cagaaagaga atcccagaca cagtggccag agccctggat 420 ctgccttttg tgaccctgag aagccagtct accggccagc acttcagact gtttattcgc 480 cacggaccac tgcaggtgac cgccgaagag ggaggtttta cctgctacgg actgagcaag 540 ggaggtttcg tgccttggtt c 561 <210> 91 <211> 942 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 91 atggccgcca gaagaggcgg aatccggaga accgacctgc tgcggaggtc tggccagcct 60 cggggcagac accgggcctc cgccgccgag agcggcctga catggatctc ccctaccctg 120 atcctggtgg gcttcagcca caggggcgat aggagaatga ccgagcacct gtccagactg 180 accctgaccc tggaagtgga tgcccccctg gagagagccc gggtggccac cctgggcccc 240 cacctgcatg gcgtgctgat ggagtctatc cccgccgact acgtgcagac actgcacaca 300 gtgccggtga acccttacag ccagtacgct ctggcccgga gcaccaccag cctggagtgg 360 aagatctcca ccctgacaaa tgaggcccgg cagcagatcg tcggccccat caacgacgcc 420 gccttcgccg gcttccggct gcgggccagc ggcatcgcca cccaggtgac aagcagaagc 480 ctggagcaga accccctgtc ccagtttgcc agaatcttct acgccaggcc cgaaacccgc 540 aagttcagag tggagttcct gacccccacc gccttcaagc agagcggcga gtacgtgttt 600 tggcccgatc ccagactggt gttccagtcc ctggcccaga agtacggcgc catcgtggac 660 ggagaagagc ccgaccccgg cctgatcgcc gagtttggcc agtccgtgag actgagcgcc 720 ttcagagtgg ccagcgcccc ttttgccgtg ggcgccgcca gggtgcccgg attcaccggc 780 agcgccacct tcaccgtgcg gggagtggac accttcgcca gctacatcgc cgctctgctg 840 tggttcggcg agttcagcgg atgcggcatc aaggcctcca tgggaatggg cgccatccgg 900 gtgcagcctc tggccccccg ggagaagtgc gtgcccaagc cc 942 <210> 92 <211> 792 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 92 atgagattcc tgatcagact ggtgcccgag gacaaggaca gagccttcaa ggtgccttac 60 aaccaccagt actatctgca gggcctgatc tacaacgcca tcaagtcctc caaccccaag 120 ctggccacct acctgcacga ggtgaagggc cccaagctgt tcacctacag cctgttcatg 180 gccgaaaagc gggagcaccc taagggcctg ccctactttc tgggctacaa gaagggcttc 240 ttctacttca gcacctgcgt gcccgagatc gccgaggccc tggtgaacgg cctgctgatg 300 aatcccgagg tgcggctgtg ggacgagaga ttctacctgc acgaaatcaa ggtcctgcgg 360 gagcccaaga agttcaacgg cagcaccttc gtgaccctga gccccatcgc cgtgaccgtg 420 gtgagaaagg gcaagtccta cgacgtgccc cccatggaaa aggagttcta cagcattatc 480 aaggatgacc tgcaggacaa gtacgtgatg gcctacggcg acaagccccc cagtgagttc 540 gagatggaag tgctgatcgc caagcccaag cggttccgga tcaagcccgg catctatcag 600 accgcctggc acctggtgtt tcgggcctac ggcaatgacg acctgctgaa ggtgggctac 660 gaagtgggat tcggggagaa gaactccctg ggattcggaa tggtcaaggt ggagggcaac 720 aagaccacca aggaagccga agaacaggag aagatcacct tcaactcccg ggaagagctg 780 aaaacaggcg tg 792 <210> 93 <211> 708 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 93 atgttcgtga cccaggtgat cttcaacatc ggcgaacgga cgtaccccga cagggctcgg 60 gctatggtgg ccgagctgat ggatggcgtc cagcctggcc tggtggccac cctgatgaac 120 tacatccccg gcaccagcac gagccggaca gagttcccca ccgtgcagtt cggcggcgcc 180 agcgacggct tttgcctgct gggcttcggc gacggcggcg gcgccatcgt gagagatgcc 240 gtgcccctga tccacgccgc cctggcaagg cggatgcctg atcggatcat ccaggtggaa 300 cacaaggagc acagcctgtc cgccgaggcc cggccctacg tgctgagcta caccgtgcct 360 cggatggtgg tgcagaagaa gcagcggcac gccgagagac tgctgcacga agccgaggga 420 aaggctcacc tggagggcct gttcctgcgg agcctgcaga ggcaggccgc cgccgtgggc 480 ctgcccctgc ccgagaacct ggaggtggag ttcaagggag ccgtgggcga cttcgccgca 540 aagcacaatc caaatagcaa ggtggcctac cggggactga gaggcgccgt gttcgatgtg 600 aacgccagac tgggcggcat ctggaccgcc ggattcatgc tgagcaaggg ctacggccag 660 tttaacgcca cccaccagct gagcggcgcc gtgaacgctc tgtccgaa 708 <210> 94 <211> 777 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 94 atgcaccaga ccctgatccg gatcaactgg cccaagggat tcaagtgccc ccctgccgag 60 ttccgggaaa agctggccaa gagcgagatg ttcccccccg agttcttcca ctacggcacg 120 gaactggccg tgtgggacaa gcagaccgcc gaggtggagg gcaagatcaa gaccgtgtcc 180 aaggagaaga tcatcaagac ctttgacaag cccatccccc tgaatggccg ggccccggtc 240 agagtgatcg gcggccaggc ctgggccggc gtgatcgccg accccgagat ggagggcatg 300 ctgatcccac acctggggag catcctgaag gtggccagca gcgcggccgg atgcgcagtg 360 aagatcgaac tggaacagag aaagttcggc atcagctaca ccgagtaccc cgtgaagtac 420 aacctgcggg agctggtgct gaagagaaga tgcgaggacg cccggtctac cgatatcgag 480 agcctgattg ccgatagaat ctggggcggc gtgtccggcg agagctacta tggcatcgac 540 ggcacatgcg ccaagtttgg cttcgaaccc cccagcagag agcagctgga gctgcggatc 600 ttccccatga agaacatcgg actgcacatg aagtccagcg acggactgtc caaggagtac 660 atgagcctga ttgacgccga ggtgtggatg aacgctaagc tggaaggagt gtggcaggtg 720 ggcaacctga tcagcagggg ctacggccgg ttcatcaagt ctatcggcgc ccagtcc 777 <210> 95 <211> 6 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> VARIANT <222> (3)..(3) <223> /replace="Phe" <220> <221> VARIANT <222> (4)..(4) <223> /replace="Tyr" <220> <221> SITE <222> (1)..(6) <223> /note="Variant residues given in the sequence have no preference with respect to those in the annotations for variant positions" <400> 95 Arg Asn Tyr Phe Ser His 1 5 <210> 96 <211> 6 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 96 Arg Asn Tyr Phe Ser His 1 5 <210> 97 <211> 6 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 97 Arg Asn Phe Tyr Ser His 1 5 <210> 98 <211> 6 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> VARIANT <222> (3)..(3) <223> /replace="Lys" <220> <221> SITE <222> (1)..(6) <223> /note="Variant residues given in the sequence have no preference with respect to those in the annotations for variant positions" <400> 98 Arg Asn Ala Ala Leu His 1 5 <210> 99 <211> 6 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 99 Arg Ala Phe Phe His His 1 5 <210> 100 <211> 6 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 100 Arg Arg Ala Phe Phe His 1 5 <210> 101 <211> 145 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (70)..(70) <223> a, c, t, or g <220> <221> variation <222> (145)..(145) <223> /replace=" " <220> <221> misc_feature <222> (1)..(145) <223> /note="Variant nucleotides given in the sequence have no preference with respect to those in the annotations for variant positions" <400> 101 ttggccactc cctcthtgcg cgctcgctcg ctcgctgggg cctggvgacc aaaggtcgcc 60 agacggccgn gctctgcccg gccggcccca gcgagcgagc gagcgcgcad agagggagtg 120 gccaactcca tcactagggg tdccb 145 <210> 102 <211> 144 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> variation <222> (1)..(1) <223> /replace=" " <220> <221> modified_base <222> (89)..(89) <223> a, c, t, or g <220> <221> misc_feature <222> (1)..(144) <223> /note="Variant nucleotides given in the sequence have no preference with respect to those in the annotations for variant positions" <400> 102 rdtaccccta gtgatggagt tggccactcc ctctatgcgc gctcgctcgc tcggtggggc 60 ctgcvgacca aaggtcbcca gacggcvgng ctctgchcgg ccggccccac cgagcgagcg 120 agcgcgcata gagggagtgg ccaa 144 <210> 103 <211> 22 <212> DNA <213> Adeno-associated virus - 2 <400> 103 ctgcgcgctc gctcgctcac tg 22 <210> 104 <211> 22 <212> DNA <213> Adeno-associated virus - 2 <400> 104 cagtgagcga gcgagcgcgc ag 22

Claims

DNA 바이러스의 바이러스 입자에 패키징될 수 있는 리보뉴클레오티드(RNA) 서열로서,
상기 RNA 서열은
(1) 관심 유전자(GOI)의 RNA 코딩 서열, mRNA와 같은 단백질(예를 들어, 치료성 단백질, 항원 단백질, 또는 CRISPR/Cas 이펙터 효소(“Cas 단백질”로 약칭)와 같은 유전자 편집 단백질, ZFN 단백질, TALEN 단백질)을 코딩하는 RNA, 또는 비코딩 기능적 RNA(예를 들어, 운반 RNA(tRNA), 리보솜 RNA(rRNA), 작은 간섭 RNA(siRNA), 짧은 헤어핀 RNA(shRNA), 안티센스 RNA, 안티센스 올리고뉴클레오티드, 마이크로 RNA(miRNA), 또는 CRISPR-Cas(예를 들어, Cas9, Cas12, Cas13) 시스템의 RNA 성분(단일 가이드 RNA(또는 sgRNA, 키메릭 RNA, RNA 키메라)와 같은 가이드 RNA(또는 gRNA), CRISPR RNA(crRNA) 및 tracr RNA 포함)), 또는 그 전구체와 같은 관심 RNA 서열(RSI); 및
(2) 직접 또는 간접적으로 RPS 상호 작용 분자와 상호 작용(예를 들어 결합)할 수 있고, 상기 RPS 상호 작용 분자가 상기 RNA 서열이 상기 DNA 바이러스의 바이러스 입자에 패키징되도록 촉진하는 RNA 패키징 신호(RPS);를 포함하고,
선택적으로, 상기 RNA 서열을 코딩하거나 이에 대응되는 DNA 서열 또는 상기 DNA 서열의 역-상보적인 서열은 상기 DNA 바이러스의 바이러스 입자에 패키징되는 능력(AAV 패키징을 위한 기능적 AAV ITR과 같은 상기 DNA 서열 또는 그 역-상보적인 서열은 DNA 패키징 신호가 결핍)이 감소되거나, 약화되거나 또는 거의 없는, DNA 바이러스의 바이러스 입자에 패키징될 수 있는 리보뉴클레오티드(RNA) 서열.
제1항에 있어서,
상기 DNA 바이러스의 바이러스 입자는 AAV 바이러스 입자 또는 종양용해 바이러스 입자인, RNA 서열.
제1항 또는제2항에 있어서,
상기 RPS는 상기 RSI의 5’ 말단에 위치하거나 가깝거나, 상기 RSI의 3’ 말단에 위치하거나 가깝거나 또는 상기 RSI의 내부(예를 들어, mRNA의 인트론 내)에 위치하는, RNA 서열.
제1항 내지 제3항 중 어느 한 항에 있어서,
서로 같거나 다른 하나 이상(예를 들어, 1개, 2개, 3개 이상)의 RPS를 포함하는, RNA 서열.
제4항에 있어서,
상기 하나 이상의 RPS 중의 2개 이상(예를 들어, 3개)은 서로 같거나 다른 링커를 통해 서로 인접하거나 또는 직렬 연결되는, RNA 서열.
제4항 또는 제5항에 있어서,
서로 인접하지 않는(예를 들어, 각자 상기 관심 RNA 서열(RSI)의 하나의 말단에 위치하거나 가까움) 2개 이상의 RPS를 포함하는, RNA 서열.
제2항 내지 제6항 중 어느 한 항에 있어서,
상기 RPS는 전사되고 변형된 AAV말단 역반복(ITR)을 포함하고, 상기 전사되고 변형된 AAV ITR은
(a) 전사된 기능적 Rep 결합 요소(RBE)를 포함하고, 선택적으로 전사된 기능적 RBE’를 더 포함하며; 및
(b) 전사된 말단 분해 부위(TRS) 또는 전사된 역-상보적인 TRS(rcTRS) 또는 둘 모두가 결핍되며;
선택적으로, 상기 전사되고 변형된 AAV ITR은 전사된 D 영역 서열(D서열 또는 D’서열)을 더 포함하고; 및/또는
선택적으로, 상기 RPS 상호 작용 분자는 Rep78, Rep68, Rep52 및/또는 Rep40인, RNA 서열.
제7항에 있어서,
상기 전사되고 변형된 AAV ITR은 상기 RNA의 3’말단 1000개의 뉴클레오티드, 800개의 뉴클레오티드, 500개의 뉴클레오티드, 300개의 뉴클레오티드 또는 200개의 뉴클레오티드 내에 존재하고, 선택적으로, 상기 전사되고 변형된 AAV ITR은 폴리A 서열, 폴리A 신호 서열(예를 들어, AAUAAA) 또는 RNA전사 종결 서열(예를 들어, 히스톤 다운스트림 요소)의 5’에 존재하는, RNA 서열.
제7항 내지 제8항 중 어느 한 항에 있어서,
상기 전사되고 변형된 AAV ITR은 전사된 야생형 Flip 또는 Flop ITR에 기반하여 변형된 것이고; 선택적으로, 상기 야생형 Flip 또는 Flop ITR은 AAV1, AAV2, AAV3A, AAV3B, AAV4, AAV5, AAV6, AAV7, AAVrh74, AAV8, AAV9, AAV10, AAV11, AAV12 또는 AAV13으로부터 유래되는(선택적으로, 상기 야생형 Flop ITR은 SEQ ID NO: 1의 뉴클레오티드 서열을 가짐), RNA 서열.
제7항 내지 제9항 중 어느 한 항에 있어서,
상기 전사되고 변형된 AAV ITR은 상기 전사된 TRS 및 상기 전사된 rcTRS 둘 모두가 결핍된, RNA 서열.
제7항 내지 제10항 중 어느 한 항에 있어서,
상기 전사되고 변형된 AAV ITR은 상기 전사된 D 영역 서열을 포함하는(선택적으로, 상기 변형된 AAV ITR은 SEQ ID NO: 3의 뉴클레오티드 서열을 가짐), RNA 서열.
제7항 내지 제10항 중 어느 한 항에 있어서,
상기 전사되고 변형된 AAV ITR은 상기 전사된 D 영역 서열이 결핍된(선택적으로, 상기 변형된 AAV ITR은 SEQ ID NO: 2의 뉴클레오티드 서열을 가짐), RNA 서열.
제7항 내지 제12항 중 어느 한 항에 있어서,
제2 전사되고 변형된 AAV ITR을 더 포함하고, 상기 제2 전사되고 변형된 AAV ITR은 제2 전사된 기능적 RBE 서열을 가지나 제2 전사된 TRS 또는 제2 전사된 rcTRS 또는 둘 모두가 결핍되며, 선택적으로, 상기 제2 전사되고 변형된 AAV ITR은 제2 전사된 D 영역 서열을 더 포함하는, RNA 서열.
제13항에 있어서,
상기 전사되고 변형된 AAV ITR과 상기 제2 전사되고 변형된 AAV ITR은 서로 같은(또는 다른), RNA 서열.
제7항 내지 제14항 중 어느 한 항에 있어서,
상기 전사되고 변형된 AAV ITR 및 상기 제2 전사되고 변형된 AAV ITR은 (만약 존재하면)대응되는 전사된 야생형 AAV ITR D 영역 서열 또는 대응되는 전사된 야생형 TRS/rcTRS 중의 결실, 대응되는 전사된 야생형 AAV ITR D 영역 서열 또는 대응되는 전사된 야생형 TRS/rcTRS 중의 돌연변이 또는 대응되는 전사된 야생형 AAV ITR D 영역 서열 또는 대응되는 전사된 야생형 TRS/rcTRS 중의 삽입을 포함하는, RNA 서열.
제13항 내지 제15항 중 어느 한 항에 있어서,
상기 제2 전사되고 변형된 AAV ITR은 상기 RNA 서열의 5’ 말단 1000개의 뉴클레오티드, 800개의 뉴클레오티드, 500개의 뉴클레오티드, 250개의 뉴클레오티드 또는 150개의 뉴클레오티드 내에 존재하는, RNA 서열.
제2항 내지 제6항 중 어느 한 항에 있어서,
상기 RPS는 MS2 서열, PP7 결합 부위 또는 com 결합 부위를 포함하고, 상기 RPS 상호 작용 분자는 직접 또는 간접적으로 상기 RPS와 상호 작용(예를 들어 결합)할 수 있는 RPS 상호 작용 단백질(RPSIP)을 포함하며, 예를 들어 MS2 서열의 경우 박테리오파지 유래의 MS2 외피 단백질(MCP), PP7 결합 부위의 경우 PP7 박테리오파지 외피 단백질(PCP) 또는 com 결합 부위의 경우 박테리오파지 COM 단백질(COM)을 포함하는, RNA 서열.
제17항에 있어서,
상기 RPSIP는 직접 또는 간접적으로 상기 DNA 바이러스의 바이러스 입자의 바이러스 패키징 시스템의 단백질 성분(예를 들어 아데노 관련 바이러스 2(AAV2)의 Rep78 및/또는 Rep68 또는 조립 활성화 단백질(AAP))과 관련(예를 들어, 융합)되는, RNA 서열.
제1항 내지 제18항 중 어느 한 항에 있어서,
상기 RNA 서열은 전사된 DNA 패키징 신호, 예를 들어, 전사된 야생형 AAV ITR 서열(예를 들어, 상기 RNA 서열은 전사되고 변형된 AAV ITR 서열을 포함하고, 상기 전사되고 변형된 AAV ITR 서열은 대응되는 전사된 야생형 AAV ITR 서열의 뉴클레오티드의 추가, 결실 및/또는 치환을 가져 상기 DNA 바이러스의 바이러스 입자의 DNA 패키징 능력을 저하)를 포함하거나 바람직하게는 포함하지 않는, RNA 서열.
제1항 내지 제19항 중 어느 한 항에 있어서,
(1) 전사된 전사 인핸서;
(2) 전사된 인트론 서열 또는 엑손 서열(예를 들어 단백질 발현을 강화하기 위한 전사된 인트론 서열 또는 엑손 서열);
(3) 5’ UTR 서열;
(4) 3’ UTR 서열;
(5) 폴리A 서열 또는 폴리아데닐화(폴리A) 신호 서열 및 선택적으로 상기 폴리A 신호 서열 다운스트림의 GU 풍부 영역;
(6) 전사 후 조절 요소 또는 서열, 예를 들어 전사된 우드척 간염 바이러스(WHP) 전사 후 조절 요소(WPRE) 서열; 및/또는
(7) 전사 종결 서열(예를 들어 히스톤 다운스트림 요소)을 더 포함하고,
선택적으로, 상기 RNA 서열은 상기 전사 후 조절 요소 또는 서열의 3’ 및 상기 폴리A 서열 또는 폴리A 신호 서열의 5’에 위치하는 RPS를 포함하는, RNA 서열.
제20항에 있어서,
5’ 에서 3’ 방향으로 상기 RSI, 상기 임의의 전사된 WPRE 서열; 상기 RPS(예를 들어 상기 전사되고 변형된 AAV ITR, 상기 MS2 서열, 상기 PP7 결합 부위 또는 상기 com 결합 부위); 및 상기 폴리A 서열 또는 상기 폴리A 신호 서열을 포함하는, RNA 서열.
제1항 내지 제21항 중 어느 한 항에 있어서,
상기 GOI는 단백질(예를 들어, 형광 단백질, 치료성 단백질, 항원 단백질, 또는 유전자 편집 단백질, 예를 들어 Cas 단백질, ZFN 단백질, TALEN 단백질), 효소(예를 들어 Cre 단백질 또는 CRISPR/Cas 이펙터 효소(예를 들어, Cas9, Cas12, Cas13),또는 그 변이체), 구조 단백질, mRNA, 비코딩 RNA(ncRNA), siRNA, piRNA, 짧은 헤어핀 RNA 또는 shRNA, 마이크로 RNA(miRNA) 또는 그 전구체(전구체 miRNA 및 pri-miRNA 포함), 리보솜 RNA(rRNA), 안티센스 서열 또는 올리고뉴클레오티드(ASO), CRISPR-Cas시스템의 RNA 성분(단일 가이드 RNA(또는 sgRNA, 키메릭 RNA, RNA 키메라)와 같은 가이드 RNA(또는 gRNA), CRISPR RNA(crRNA) 및 tracr RNA 포함), CRISPR/Cas 이펙터 효소를 위한 가이드 RNA 또는 gRNA, rRNA, tRNA, snoRNA, snRNA, exRNA, scaRNA, lncRNA, Xist 및 HOTAIR을 포함하는, RNA 서열.
제1항 내지 제22항 중 어느 한 항에 있어서,
길이가 약 8,900개의 뉴클레오티드 미만이고, 길이가 약 8,000개의 뉴클레오티드 미만이며, 길이가 약 7,000개의 뉴클레오티드 미만이고, 길이가 약 6,000개의 뉴클레오티드 미만이며, 길이가 약 5,200개의 뉴클레오티드 미만이고, 길이가 약 4,000개의 뉴클레오티드 미만이며, 길이가 약 3,000개의 뉴클레오티드 미만이고, 길이가 약 2,000개의 뉴클레오티드 미만이며, 길이가 약 4,700-5,200개의 뉴클레오티드이고, 길이가 약 4,700-5,000개의 뉴클레오티드이며, 길이가 약 4,700-4,800개의 뉴클레오티드이거나 또는 길이가 약 4,700개의 뉴클레오티드인 단일 가닥 RNA인, RNA 서열.
폴리뉴클레오티드로서,
제1항 내지 제23항 중 어느 한 항에 따른 RNA 서열을 코딩하는 카세트를 포함하고, 선택적으로, 상기 폴리뉴클레오티드는 DNA 서열(예를 들어, DNA 플라스미드)이며, 상기 DNA 서열은 선택적으로 상기 DNA 플라스미드의 백본에 스터퍼 서열을 포함하고, 및/또는 선택적으로 AAV ITR과 같은 기능적 DNA 패키징 신호를 포함하지 않는, 폴리뉴클레오티드.
제24항에 있어서,
상기 카세트에 의해 코딩되는 상기 RNA 서열에 조작 가능하게 연결되고 전사되도록 구동하는 프로모터를 더 포함하는, 폴리뉴클레오티드.
제25항에 있어서,
상기 프로모터는 편재 프로모터인, 폴리뉴클레오티드.
제25항에 있어서,
상기 프로모터는 조직 특이적 프로모터인, 폴리뉴클레오티드.
제25항 내지 제27항 중 어느 한 항에 있어서,
상기 프로모터는 전신 발현 프로모터인, 폴리뉴클레오티드.
제25항 내지 제27항 중 어느 한 항에 있어서,
상기 프로모터는 유도성 프로모터인, 폴리뉴클레오티드.
제25항 내지 제29항 중 어느 한 항에 있어서,
상기 프로모터에 의해 구동되는 상기 RNA 서열의 전사를 강화하는 인핸서를 더 포함하는, 폴리뉴클레오티드.
DNA 바이러스(예를 들어AAV 바이러스 또는 종양용해 바이러스)의 단백질 쉘(예를 들어 캡시드) 내에 패키징되는 RNA 게놈(예를 들어, 제1항 내지 제23항 중 어느 한 항에 따른 RNA 서열 또는 제24항 내지 제30항 중 어느 한 항에 따른 폴리뉴클레오티드로부터 전사된 RNA 서열)을 포함하는, 재조합 DNA 바이러스의 바이러스 입자.
제31항에 있어서,
상기 DNA 바이러스는 AAV이고, 상기 재조합 DNA 바이러스의 바이러스 입자는 재조합 RNA 아데노 관련 바이러스(rRAAV) 입자이며, 상기 재조합 RNA 아데노 관련 바이러스 입자는
(1) AAV 캡시드; 및
(2) 상기 AAV 캡시드 내에 패키징되는 제1항 내지 제23항 중 어느 한 항에 따른 RNA 서열 또는 제24항 내지 제30항 중 어느 한 항에 따른 폴리뉴클레오티드로부터 전사된 RNA 서열을 포함하는, 재조합 DNA 바이러스의 바이러스 입자.
제32항에 있어서,
상기 AAV 캡시드는 혈청형 AAV1, AAV2, AAV3A, AAV3B, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, AAV-DJ, AAV PHP.eB, Anc80L65, Anc80L65AAP, AAVrh74 또는 7m8의 AAV로부터 유래된 캡시드를 포함하는, 재조합 DNA 바이러스의 바이러스 입자.
재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체로서,
상기 군체는 복수의 제31항 내지 제33항 중 어느 한 항에 따는 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)를 포함하고, 상기 군체 내의 상기 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 중의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 이상은 이에 패키징된 제1항 내지 제23항 중 어느 한 항에 따른 RNA 서열 또는 제24항 내지 제30항 중 어느 한 항에 따른 폴리뉴클레오티드로부터 전사된 RNA 서열을 갖는, 재조합 DNA 바이러스의 바이러스 입자의 군체.
제1항 내지 제23항 중 어느 한 항에 따른 RNA 서열, 제24항 내지 제30항 중 어느 한 항에 따른 폴리뉴클레오티드, 제24항 내지 제30항 중 어느 한 항에 따른 폴리뉴클레오티드로부터 전사된 RNA 서열, 제31항 내지 제33항 중 어느 한 항에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 및/또는 제34항에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체를 포함하는, 숙주 세포.
제35항에 있어서,
바이러스 패키징 시스템을 더 포함하고, 상기 바이러스 패키징 시스템은 제1항 내지 제23항 중 어느 한 항에 따른 RNA 서열 또는 제24항 내지 제30항 중 어느 한 항에 따른 폴리뉴클레오티드로부터 전사된 RNA 서열이 상기 DNA 바이러스의 바이러스 입자 중에 패키징되도록 촉진하는, 숙주 세포.
제36항에 있어서,
상기 바이러스 패키징 시스템은
(1) rep 유전자 및 cap 유전자의 전사를 구동하는 하나 또는 복수의 프로모터의 전사 제어 하에 있는 AAV rep 유전자(예를 들어, Rep78, Rep68, Rep52 및/또는 Rep40의 코딩 서열) 및 AAV cap 유전자(예를 들어, VP1, VP2, VP3, AAP 및/또는 MAAP의 코딩 서열) 또는 그 발현 산물;
(2) 아데노 바이러스 E2A, E4 및 VA유전자 또는 상기 하나 이상의 단백질과 같이 AAV 패키징에 필요한 하나 이상의 단백질의 하나 또는 복수의 코딩 서열; 및
(3) 상기 RPS 상호 작용 분자 또는 그 코딩 서열;을 포함하고,
선택적으로, 상기 바이러스 패키징 시스템은 DNA 서열을 상기 DNA 바이러스의 바이러스 입자에 패키징하는 능력은 예를 들어 (1) 제1항 내지 제23항 중 어느 한 항에 따른 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 제24항 내지 제30항 중 어느 한 항에 따른 폴리뉴클레오티드 상의 DNA 패키징 신호(예를 들어 AAV ITR의 일부 또는 전부)를 제거하고, (2) 상기 AAV rep 유전자, 상기 AAV cap 유전자 및/또는 AAV 패키징에 필요한 하나 이상의 단백질의 상기 하나 또는 복수의 코딩 서열을 변형(예를 들어 돌연변이)시켜, 상응한 번역된 단백질이 상기 DNA 서열이 상기 DNA 바이러스의 바이러스 입자에 패키징되도록 촉진하는 능력(예를 들어, Rep78 및 Rep68 단백질의 공유 서열 중의 Y156F 돌연변이, KDE-mu 또는 EKE-mu)을 감소시키거나, 약화시키거나 또는 거의 제거하며; 및/또는 (3) 제1항 내지 제23항 중 어느 한 항에 따른 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 제24항 내지 제30항 중 어느 한 항에 따른 폴리뉴클레오티드의 크기를 확대하는 것을 통해 감소되거나, 약화되거나 또는 거의 제거되는, 숙주 세포.
제35항 내지 제37항 중 어느 한 항에 있어서,
포유동물 세포 (예를 들어 HEK293세포) 또는 곤충세포(예를 들어 Sf9 또는 Sf21세포)인, 숙주 세포.
제31항 내지 제33항 중 어느 한 항에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 또는 제34항에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체를 생성하는 방법에 있어서,
상기 방법은
a) 제35항 내지 제38항 중 어느 한 항에 따른 숙주 세포를 충분한 시간 동안 배양하는 단계; 및
b) 상기 재조합 DNA 바이러스의 바이러스 입자 또는 상기 재조합 DNA 바이러스의 바이러스 입자의 군체를 수득하는 단계를 포함하는, 방법.
제39항에 있어서,
상기 재조합 DNA 바이러스의 바이러스 입자 또는 상기 재조합 DNA 바이러스의 바이러스 입자의 군체를 단리 또는 정제하는 단계를 더 포함하는, 방법.
재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 또는 재조합 DNA 바이러스의 바이러스 입자의 군체를 생성하는 방법에 있어서,
상기 방법은
a) 바이러스 패키징 시스템(예를 들어, AAV 패키징 시스템)을 제1항 내지 제23항 중 어느 한 항에 따른 RNA 서열 또는 제24항 내지 제30항 중 어느 한 항에 따른 폴리뉴클레오티드로부터 전사된 RNA 서열와 상기 재조합 DNA 바이러스의 바이러스 입자 또는 상기 재조합 DNA 바이러스의 바이러스 입자의 군체를 생성하기에 충분한 시간 동안 접촉시키는 단계; 및
b) 상기 재조합 DNA 바이러스의 바이러스 입자 또는 상기 재조합 DNA 바이러스의 바이러스 입자의 군체를 수득하는 단계; 및 선택적으로,
c) 수득한 재조합 DNA 바이러스의 바이러스 입자 또는 재조합 DNA 바이러스의 바이러스 입자의 군체를 단리 또는 정제하는 단계를 포함하는, 방법.
제41항에 있어서,
상기 바이러스 패키징 시스템(예를 들어, AAV 패키징 시스템)은
(1) 상기 RNA 서열을 패키징하기 위한 상기 DNA 바이러스의 바이러스 입자의 단백질 쉘을 조립하기 위한 하나 이상의 단백질(예를 들어, AAV 캡시드를 조립하기 위한 VP1, VP2 및/또는 VP3) 또는 그 하나 또는 복수의 코딩 서열;
(2) 상기 단백질 쉘의 조립 및/또는 상기 RNA 서열이 상기 DNA 바이러스의 바이러스 입자의 단백질 쉘에 패키징되도록 촉진하기 위한 하나 이상의 단백질(예를 들어, AAV 패키징을 위한 Rep78, Rep68, Rep52 및/또는 Rep40) 또는 이의 하나 또는 복수의 코딩 서열(예를 들어, 아데노 바이러스 E2a, E4 및 VA유전자); 및
(3) 상기 RPS 상호 작용 분자 또는 그 코딩 서열;을 포함하고,
선택적으로, 상기 바이러스 패키징 시스템은 DNA 서열을 상기 DNA 바이러스의 바이러스 입자에 패키징하는 능력은 예를 들어 (1) 제1항 내지 제23항 중 어느 한 항에 따른 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 제24항 내지 제30항 중 어느 한 항에 따른 폴리뉴클레오티드 상의 DNA 패키징 신호(예를 들어 AAV ITR의 일부 또는 전부)를 제거하고, (2) 상기 AAV rep 유전자, 상기 AAV cap 유전자 및/또는 AAV 패키징에 필요한 하나 이상의 단백질의 하나 또는 복수의 코딩 서열을 변형(예를 들어 돌연변이)시켜, 상응한 번역된 단백질이 상기 DNA 서열이 상기 DNA 바이러스의 바이러스 입자에 패키징되도록 촉진하는 능력(예를 들어, Rep78 및 Rep68 단백질의 공유 서열 중의 Y156F 돌연변이, KDE-mu 또는 EKE-mu)을 감소시키거나, 약화시키거나 또는 거의 제거하며; 및/또는 (3) 제1항 내지 제23항 중 어느 한 항에 따른 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 제24항 내지 제30항 중 어느 한 항에 따른 폴리뉴클레오티드의 크기를 확대하는 것을 통해 감소되거나, 약화되거나 또는 거의 제거되는, 방법.
제1항 내지 제23항 중 어느 한 항에 따른 RNA 서열 또는 제24항 내지 제30항 중 어느 한 항에 따른 폴리뉴클레오티드로부터 전사된 RNA 서열을 DNA 바이러스의 바이러스 입자에 패키징하는 시스템에 있어서,
상기 시스템은
(1) 상기 RNA 서열을 패키징하기 위한 상기 DNA 바이러스의 바이러스 입자의 단백질 쉘을 조립하기 위한 하나 이상의 단백질(예를 들어, AAV 캡시드를 조립하기 위한 VP1, VP2 및/또는 VP3) 또는 그 하나 또는 복수의 코딩 서열;
(2) 상기 단백질 쉘의 조립 및/또는 상기 RNA 서열이 상기 DNA 바이러스의 바이러스 입자의 단백질 쉘에 패키징되도록 촉진하기 위한 하나 이상의 단백질(예를 들어, AAV 패키징을 위한 Rep78, Rep68, Rep52 및/또는 Rep40) 또는 이의 하나 또는 복수의 코딩 서열(예를 들어, 아데노 바이러스 E2a, E4 및 VA유전자); 및
(3) 상기 RPS 상호 작용 분자 또는 그 코딩 서열;을 포함하고,
선택적으로, 상기 바이러스 패키징 시스템은 DNA 서열을 상기 DNA 바이러스의 바이러스 입자에 패키징하는 능력은 예를 들어 (1) 제1항 내지 제23항 중 어느 한 항에 따른 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 제24항 내지 제30항 중 어느 한 항에 따른 폴리뉴클레오티드 상의 DNA 패키징 신호(예를 들어 AAV ITR의 일부 또는 전부)를 제거하고, (2) 상기 AAV rep 유전자, 상기 AAV cap 유전자 및/또는 AAV 패키징에 필요한 하나 이상의 단백질의 하나 또는 복수의 코딩 서열을 변형(예를 들어 돌연변이)시켜, 상응한 번역된 단백질이 상기 DNA 서열이 상기 DNA 바이러스의 바이러스 입자에 패키징되도록 촉진하는 능력(예를 들어, Rep78 및 Rep68 단백질의 공유 서열 중의 Y156F 돌연변이, KDE-mu 또는 EKE-mu)을 감소시키거나, 약화시키거나 또는 거의 제거하며; 및/또는 (3) 제1항 내지 제23항 중 어느 한 항에 따른 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 제24항 내지 제30항 중 어느 한 항에 따른 폴리뉴클레오티드의 크기를 확대하는 것을 통해 감소되거나, 약화되거나 또는 거의 제거되는, 시스템.
관심 유전자(GOI)를 세포, 식물 또는 동물에 전달하는 방법으로서,
상기 방법은 상기 세포, 상기 식물 또는 상기 동물을 제31항 내지 제33항 중 어느 한 항에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자), 제34항에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체 또는 제39항 내지 제42항 중 어느 한 항에 따른 방법으로 생성된 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 또는 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체에 접촉시키는 단계를 포함하고, 상기 GOI는 상기 RNA 서열(제1항 내지 제23항 중 어느 한 항에 따름)에 의해 코딩되는, 관심 유전자(GOI)를 세포, 식물 또는 동물에 전달하는 방법.
관심 RNA 서열(RSI)을 세포, 식물 또는 동물에 전달하는 방법으로서,
상기 방법은 상기 세포, 상기 식물 또는 상기 동물을 제31항 내지 제33항 중 어느 한 항에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자), 제34항에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체 또는 제39항 내지 제42항 중 어느 한 항에 따른 방법으로 생성한 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 또는 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체에 접촉시키는 단계를 포함하는, 관심 RNA 서열(RSI)을 세포, 식물 또는 동물에 전달하는 방법.
필요한 대상체에서 질병 또는 장애를 진단, 예방 또는 치료하는 방법으로서,
상기 방법은 상기 대상체에게 치료 유효량 또는 조제량의 제34항에 따른 재조합 DNA 바이러스의 바이러스 입자 또는 제39항 내지 제42항 중 어느 한 항에 따른 방법으로 생성된 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체를 투여하는 단계를 포함하는, 필요한 대상체에서 질병 또는 장애를 진단, 예방 또는 치료하는 방법.
필요한 대상체의 질병 또는 장애를 진단, 예방 또는 치료하기 위한 약물의 제조에서 제31항 내지 제33항 중 어느 한 항에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자), 제34항에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체 또는 제39항 내지 제42항 중 어느 한 항에 따른 방법으로 생성한 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 또는 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체의 용도.