KR20230003554A

KR20230003554A - 낮은 전사 활성을 갖는 프로모터를 사용하여 뉴클레아제 발현 및 표적-외 활성을 감소시키기 위한 조성물 및 방법

Info

Publication number: KR20230003554A
Application number: KR1020227040655A
Authority: KR
Inventors: 카밀로 브레톤; 제임스 엠. 윌슨
Original assignee: 더 트러스티스 오브 더 유니버시티 오브 펜실베니아
Priority date: 2020-04-27
Filing date: 2021-04-27
Publication date: 2023-01-06
Also published as: EP4142801A1; WO2021222249A1; JP2023524436A; US20230167464A1

Abstract

유전자 편집화 뉴클레아제 발현 카세트로서, 숙주 세포로의 전달 이후에 뉴클레아제의 발현을 안내하는 조절 서열에 작동가능하게 연결된 뉴클레아제 코딩 서열을 포함하는 핵산 서열을 포함하고, 조절 서열은 약한 프로모터를 포함하는, 뉴클레아제 발현 카세트가 제공된다. 유전자 편집화 뉴클레아제 발현 카세트를 포함하는 벡터가 제공된다. 또한, 이를 포함하는 조성물 및 사용 방법이 제공된다.

Description

낮은 전사 활성을 갖는 프로모터를 사용하여 뉴클레아제 발현 및 표적-외 활성을 감소시키기 위한 조성물 및 방법

기능부전 유전자를 편집하기 위한 조작된 뉴클레아제의 용도가 기술되어 왔다. 이러한 뉴클레아제의 AAV 매개된 전달도 역시 기술된 바 있었다. 그러나, 뉴클레아제의 AAV 매개된 전달은 반복된 재투여가 요구되지 않으면서도, 생성된 뉴클레아제는 벡터 형질도입 이후에 표적 조직에서 계속적으로 발현되고, 이것이 면역 반응 및 세포 독성을 유도할 수 있다.

또한, 시험관내 및 생체내 연구는 뉴클레아제가 전달 비히클과 상관없이, 게놈의 다른 영역에서 표적-외 활성을 나타내는 인델 (삽입 및 결실)을 생성하는 것을 확인하였다. 이러한 표적-외 활성은 바람직하지 않으며, 특히 임상 연구에서는 표적-내 효능을 유지하면서 이러한 표적-외 활성을 감소시키거나 제거하는 것이 필수적이다.

유전자 편집화를 위한 개선된 조성물 및 방법이 필요하다.

일 양태에서, 유전자 편집화 뉴클레아제 발현 카세트가 제공된다. 일 구현예에서, 발현 카세트는 뉴클레아제가 표적화되는 서열을 갖는 숙주 세포로의 전달 이후에 뉴클레아제의 발현을 안내하는 조절 서열에 작동가능하게 연결된 뉴클레아제 코딩 서열을 포함하는 핵산 서열을 포함하고, 조절 서열은 낮은 전사 활성을 갖는 프로모터를 포함한다. 일 구현예에서, 프로모터는 간-특이적 프로모터이다. 또 다른 구현예에서, 프로모터는 TBG-S1 프로모터 변이체이다. 또 다른 구현예에서, 프로모터는 TBG-S1-F64이다. 또 다른 구현예에서, 프로모터는 TBG-S1-F113이다. 또 다른 구현예에서, 프로모터는 TBG-S1-F140이다. 또 다른 구현예에서, 프로모터는 CCL16 프로모터이다. 또 다른 구현예에서, 프로모터는 SCLC22A9 프로모터이다. 또 다른 구현예에서, 프로모터는 CYP26A1 프로모터이다. 또 다른 구현예에서, 뉴클레아제는 메가뉴클레아제, CRISPR/Cas 뉴클레아제, 아연 핑거 뉴클레아제 또는 TALEN이다.

또 다른 양태에서, 유전자 편집화에 유용한 재조합 AAV이 제공된다. rAAV는 AAV 캡시드 및 AAV 캡시드에 포장된 벡터 게놈을 포함하고, 벡터 게놈은 본원에 기술된 발현 카세트, 및 발현 카세트를 캡시드 내에 포장하는데 필요한 AAV 역전된 말단 반복서열을 포함한다.

또 다른 양태에서, 표적화된 유전자를 편집하는 방법이 제공된다. 방법은 본원에 기술된 뉴클레아제 발현 카세트, 조성물 또는 바이러스성 벡터를 대상체에게 전달하는 단계를 포함한다.

또 다른 양태에서, 유전자 표적화 뉴클레아제의 표적-외 활성을 감소시키는 방법이 제공된다. 방법은 본원에 기술된 뉴클레아제 발현 카세트, 조성물 또는 바이러스성 벡터를 대상체에게 전달하는 단계를 포함한다.

또 다른 양태에서, 신규한 "약한 프로모터"가 제공된다. 또 다른 구현예에서, 프로모터는 TBG-S1-F64이다. 또 다른 구현예에서, 프로모터는 TBG-S1-F113이다. 또 다른 구현예에서, 프로모터는 TBG-S1-F140이다. 또 다른 구현예에서, 프로모터는 서열번호 6의 서열을 포함한다, 또 다른 구현예에서, 프로모터는 서열번호 7의 서열을 포함한다, 또 다른 구현예에서, 프로모터는 서열번호 8의 서열을 포함한다,

또 다른 양태에서, 본원에 기술된 뉴클레아제 발현 카세트, 조성물 또는 바이러스성 벡터를 포함하는 약제학적 조성물이 제공된다. 조성물은 담체, 현탁제 및/또는 부형제 중 하나 이상을 포함한다.

본 발명의 다른 양태 및 장점은 하기 본 발명의 상세한 설명으로부터 자명해질 것이다.

도 1은 실시예 1에서 사용된 벡터에 대한 "약한 프로모터"를 포함하는 AAV 구조물의 모식적 예시를 나타낸다 (도 2 내지 도 5에 도시된 데이터). 프로모터: 인간 타이록신 결합 글로불린 (TBG) 유전자의 단축된 버전, 또는 간 농축된 유전자의 프로모터 서열로부터 유래됨: CCL16, CYP26A1 또는 SLC22A9 (인간 단백질 아틀라스 데이터베이스를 사용하여 확인됨). M2PCSK9: 인간 PCSK9 유전자의 22개 bp 서열을 표적하는 조작된 I-CreI 메가뉴클레아제 (ARCUS 메가뉴클레아제로 때로 지칭됨). 폴리 A: 소 성장호르몬 폴리아데닐화 신호.
도 2a는 차세대 시퀸싱 검정법에 의해 정량화된, ARCUS 메가뉴클레아제의 표적 서열에 상응하는 영역에서 AAV 처리후 7주째 인델 수준을 나타낸다. 선형 척도.
도 2b는 도 2a와 동일한 수준을 나타낸다. 로그 척도.
도 2c는 ELISA 검정법에 의해 결정되는, 처리군 당 혈청에서 재조합 PCSK9의 9주째 평균 수준을 나타낸다.
도 3은 ITR-Seq로 불리는 NGS 기반의 방법을 사용하여 결정된 바, 뉴클레아제 활성의 결과로서 게놈 DNA에서 표적-외 좌위의 수를 나타낸다.
도 4는 확인된 외부 표적에 해당하는 게놈 위치 세트에서 인델을 나타낸다. 각 외부 표적에 대한 인델 수준을 TBG 대조군의 인델 수준 (임의 값 1)과 비교하여 나타낸다.
도 5는 실시예 1에서 테스트된 벡터에서 처리 이후 7주째 hPCSK9 수준을 (기저선의 백분율로서) 나타낸다.
도 6 내지 도 10은 실시예 2에 기술된 NHP 파일럿 연구에 대한 데이터를 나타낸다. NHP에게 6 × 10¹² GS/kg의 지시된 벡터를 주사하였다. 간 생검을 18일 및 128일째 수행하고, DNA/RNA 분석을 차세대 시퀸싱에 의한 표적-내 및 표적-외 게놈 편집화를 검출하도록 시행하였다. 도 7 내지 도 10에 나타낸 일부 데이터의 요약은 도 6에 나타낸다. 인델% (도 7) 및 외부 표적의 수 (도 8)를 AAV 처리후 18일째 간 생검으로부터의 DNA에서 결정하였다. PCSK9 수준 (기저성의 백분율로서)은 도 9에 나타낸다 (AAV 처리후 7주). LDL 수준 (기저성의 백분율로서)은 도 10에 나타낸다.
도 11은 실시예 3에 기술된 NHP 약제/독성 연구의 모식도를 나타낸다.
도 12는 본원에 기술된 TBG-S1 프로모터, 및 F64, F113 및 F140 프로모터의 서열 정렬을 나타낸다.

본원에 제공된 조성물 및 방법은 지속적으로 발현된 효소의 (예로, 발현 카세트의 전달 이후에) 더 낮은 발현을 생성하거나 표적-외 활성을 최소화하고/거나, 발현 효소의 활성을 조정하도록 설계된다. 세포에 축적될 수 있는 분비되지 않는 효소 또는 분비되기 이전에 바람직한 수준 이상으로 높게 축적되는 효소를 갖는 이러한 조성물 및 방법의 사용이 바람직하다. 본 발명의 조성물 및 방법은 유전자 편집화 효소, 구체적으로 메가뉴클레아제를 사용하는데 잘 맞추어져 있다. 그러나, 당업자에게라면 다른 적용도 자명할 것이다.

낮은 전사 프로모터 ("약한" 프로모터)

일 양태에서, 낮은 전사 활성을 갖는 신규한 프로모터 또는 약한 프로모터가 제공된다. 본원에 사용된 용어 "낮은 전사 활성을 갖는 프로모터" 또는 "약한 프로모터"는 코딩 서열의 낮은 발현 수준을 생성하는 발현 조절 서열을 말한다. 일 구현예에서, 용어 "낮은 전사 활성"은 기준 "강한 프로모터"에 의해 유도된 수준보다 낮은 전사 수준을 말한다. 일 구현예에서, 기준 강한 프로모터는 타이록신 결합 글로불린 (TBG) 프로모터 또는 TBG-S1 프로모터이다. 다른 기준 "강한" 프로모터는 당해 기술분야에 공지되어 있다.

일 구현예에서, 프로모터는 간-특이적 타이록신 결합 글로불린 (TBG) 프로모터의 약화된 버전이다. 일 구현예에서, 약한 프로모터는 고유의 프로모터 또는 TBG-S1 서열의 5' 또는 3' 말단에서 절단된다. 일 구현예에서, 프로모터는 TBG-S1 프로모터로부터 3' 말단의 64개 뉴클레오티드만을 보유하고, F64로 명명된다 (TBG-S1-F64로도 불림)(서열번호 6). 또 다른 구현예에서, 프로모터는 TBG-S1 프로모터로부터 3' 말단의 113개 뉴클레오티드만을 보유하고, F113으로 명명된다 (TBG-S1-F113으로도 불림)(서열번호 7). 일 구현예에서, 프로모터는 TBG-S1 프로모터로부터 3' 말단의 140개 뉴클레오티드만을 보유하고, F140으로 명명된다 (TBG-S1-F140으로도 불림)(서열번호 8). TBG-S1, F64, F113 및 F140 서열의 정렬은 도 12에 나타낸다. 일 구현예에서, 프로모터는 서열번호 6과 적어도 90%, 95%, 96%, 97%, 98%, 99% 또는 99.9%의 일치도를 공유한다. 일 구현예에서, 프로모터는 서열번호 7과 적어도 90%, 95%, 96%, 97%, 98%, 99% 또는 99.9%의 일치도를 공유한다. 일 구현예에서, 프로모터는 서열번호 8과 적어도 90%, 95%, 96%, 97%, 98%, 99% 또는 99.9%의 일치도를 공유한다.

다른 구현예에서, 본원에 유용한 약한 프로모터는 공지된 프로모터를 포함한다. 일 구현예에서, 약한 프로모터는 CCL16 프로모터 (서열번호 3)이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터 (서열번호 4)이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터 (서열번호 5)이다.

발현 카세트 및 벡터

또 다른 양태에서, 발현 카세트가 제공된다. 일 구현예에서, 발현 카세트는 본원에 기술된 바와 같이, 코딩 서열에 작동가능하게 연결된 약한 프로모터를 포함한다. 일 구현예에서, 발현 카세트는 본원에 기술된 바와 같이, 낮은 전사 활성을 갖는 프로모터를 포함하는 조절 서열의 제어 하에 뉴클레아제에 대한 코딩 서열을 포함한다. 또 다른 양태에서, 발현 카세트 (및 프로모터)를 포함하는 벡터가 제공된다.

본원의 실시예는 벡터 게놈에서 낮은 전사 활성을 갖는 프로모터 (약한 프로모터)를 포함하는 AAV 벡터의 사용을 설명하고 있다. 그러나, 약한 프로모터의 사용은 AAV 구조물에 한정되지 않으며, 다른 벡터에 사용될 수 있다. 특정 구현예에서, 벡터 게놈은 상이한 벡터 (예로, 재조합 보카바이러스) 내에 포장될 수 있다. 특정 구현예에서, 발현 카세트는 상이한 바이러스성 벡터 내에, 비-바이러스성 벡터 내에 및/또는 상이한 전달 시스템 내에 포장될 수 있다. 적합하게, 트랜스 유전자에 대한 코딩 서열은 효소에 대한 표적 부위를 포함하는 세포에서 약한 프로모터를 포함한 조절 요소에 작동가능하게 연결되도록 발현 카세트 내에 조작된다.

본원에 사용된 바, "발현 카세트"는 코딩 서열 (또는 트랜스 유전자) 및 프로모터를 포함하는 핵산 분자를 말하고, 다른 조절 서열을 포함할 수 있으며, 따라서 카세트는 유전 요소 내에 조작되고/거나 바이러스성 벡터의 캡시드 (예로, 바이러스 입자) 내에 포장될 수 있다. 전형적으로, 바이러스성 벡터를 생성하기 위한 이러한 발현 카세트는 본원에 기술된 바이러스 게놈의 포장 신호에 연접되는 서열 및 본원에 기술된 것과 같은 기타 발현 조절 서열을 포함한다. 트랜스 유전자는 트랜스 유전자에 연접된 벡터 서열에 이종유래 핵산 서열이고, 이는 관심있는 폴리펩티드, 단백질 또는 기타 산물을 인코딩한다. 핵산 코딩 서열은 표적 세포에서 트랜스 유전자의 전사, 번역 및/또는 발현을 허용하는 방식으로 조절 구성요소에 작동가능하게 연결된다. 이종유래 핵산 서열 (트랜스 유전자)은 임의의 유기체로부터 유래할 수 있다. AAV는 하나 이상의 트랜스 유전자를 포함할 수 있다. 본원에서는 유전자 편집화 뉴클레아제 (구체적으로, 메가뉴클레아제)와 조합한 본원에 기술된 약한 프로모터의 사용이 예시된다. 그러나, 약한 프로모터는 더 낮은 발현 및/또는 짧은 프로모터 서열이 바람직한 임의의 발현 카세트 내에 도입될 수 있다.

일 구현예에서, 코딩 서열은 메가뉴클레아제, 아연 핑거 뉴클레아제, 전사 활성인자 유사 (TAL) 효과기 뉴클레아제 (TALEN), 및 군집화된 규칙적 간격의 짧은 팰린드롬 반복서열 (CRISPR)/엔도뉴클레아제 (Cas9, Cpf1 등)으로부터 선택된 뉴클레아제를 인코딩한다. 적합한 메가뉴클레아제의 예는, 예로 미국 특허 제 US 8,445,251; 제 US 9,340,777호; 제 US 9,434,931호; 제 US 9,683,257호 및 국제특허출원 제 WO 2018/195449호에 기재되어 있다. 기타 적합한 효소로는 핵산 프로그램된 방식으로 RNA에 결합할 수 있는 뉴클레아제 불활성 S. 파이오제네스 CRISPR/Cas9 (Nelles et al., Programmable RNA Tracking in Live Cells with CRISPR/Cas9, Cell, 165(2): P488-96 (2016년 4월)), 및 염기 편집기 (예로, Levy et al.. Cytosine and adenine base editing of the brain, liver, retina, heart and skeletal muscle of mice via adeno-associated viruses, Nature Biomedical Engineering, 4: 97-110 (2020년 1월))를 포함한다. 특정 구현예에서, 뉴클레아제는 아연 핑거 뉴클레아제가 아니다. 특정 구현예에서, 뉴클레아제는 CRISPR 관련 뉴클레아제가 아니다. 특정 구현예에서, 뉴클레아제는 TALEN이 아니다. 일 구현예에서, 뉴클레아제는 메가뉴클레아제가 아니다.

특정 구현예에서, 뉴클레아제는 귀소 엔도뉴클레아제의 LAGLIDADG (서열번호 1) 패밀리의 구성원이다. 특정 구현예에서, 뉴클레아제는 22개 염기쌍 인식 서열, 서열번호 2 (CAAAACGTCGTGAGACAGTTTG)를 인식하여 절단하는 귀소 엔도뉴클레아제의 I-CreI 패밀리의 구성원이다. 예로, 국제특허출원 제 WO 2009/059195호 참조. 단일-LAGLIDADG 귀소 엔도뉴클레아제를 합리적으로 설계하는 방법은 기술되어 있으며, 이는 I-CreI 및 다른 귀소 엔도뉴클레아제를 광범위하게 재설계하여 포유동물, 효모, 식물, 세균 및 바이러스 게놈에 있는 부위를 포함한 매우 다양한 DNA 부위를 표적시킬 수 있다 (국제특허출원 제 WO 2007/047859호). 일 구현예에서, 뉴클레아제는 서열번호 15의 뉴클레오티드 1089번 내지 2183번에 나타낸 서열에 의해 인코딩되는 뉴클레아제가 아니다. 일 구현예에서, 뉴클레아제는 서열번호 16에 나타낸 단백질 서열이 아니다.

본 발명의 목적 중 하나는 뉴클레아제의 강한 표적-내 활성을 저하시키지 않고도 이의 표적-외 활성을 감소시키는 것이다. 형질도입된 세포에서 뉴클레아제의 높은 발현이 표적 DNA 서열의 편집화를 달성하는데 요구되지 않고, 표적-외 활성이 세포에서 뉴클레아제의 축적 상승으로부터 생성되는 것으로 가설을 세웠다. 뉴클레아제 발현을 감소시키기 위하여, 높게 발현하는 프로모터는 더 낮은 전사 활성을 갖는 프로모터로 대체되었다. 따라서, 발현 카세트는 발현 제어 서열 또는 조절 서열의 일부로서 프로모터 서열을 포함한다. 본원에 기술된 바, 프로모터는 더 낮은 전사 활성을 갖는 프로모터 또는 "약한 프로모터"이다.

일 구현예에서, 약한 프로모터는 CCL16 프로모터 (서열번호 3)이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터 (서열번호 4)이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터 (서열번호 5)이다.

또한, 또 다른 구현예에서, 프로모터는 조직 특이적 프로모터의 약화된 버전이다. 일 예에서, 조직 특이적 프로모터는 간-특이적 타이록신 결합 글로불린 (TBG) 프로모터이다. 일 구현예에서, 약한 프로모터는 고유의 프로모터 또는 TBG-S1 서열의 5' 또는 3' 말단에서 절단된다. 일 구현예에서, 프로모터는 TBG-S1 프로모터로부터 3' 말단의 64개 뉴클레오티드만을 보유하고, F64로 명명된다 (서열번호 6). 일 구현예에서, 프로모터는 TBG-S1 프로모터로부터 3' 말단의 113개 뉴클레오티드만을 보유하고, F113으로 명명된다 (서열번호 7). 일 구현예에서, 프로모터는 TBG-S1 프로모터로부터 3' 말단의 140개 뉴클레오티드만을 보유하고, F140으로 명명된다 (서열번호 8).

프로모터에 추가하여, 발현 카세트 및/또는 벡터는 하나 이상의 적절한 "조절 요소" 또는 "조절 서열"을 포함할 수 있으며, 이는 인핸서; 전사인자; 전사 종결인자; 스플라이싱 및 폴리아데닐화 신호 (폴리 A)와 같은 효율적인 RNA 가공 신호; 세포질 mRNA를 안정화하는 서열, 예를 들면 마못류 간염 바이러스 (WHP) 전사후 조절 요소 (WPRE); 번역 효율을 증진시키는 서열 (즉, 코작 공통 서열); 단백질 안정성을 증진시키는 서열; 및 바람직할 때 인코딩된 산물의 분비를 증진시키는 서열을 포함하나 이에 한정되지 않는다. 적합한 폴리 A 서열의 예로는, 예로 SV40, SV50, 소 성장호르몬 (bGH) 및 TK 폴리 A를 포함한다. 적합한 인핸서의 예로는 특히, 예로 알파 태아단백질 인핸서, TTR 최소 프로모터/인핸서, LSP (TH-결합 글로불린 프로모터/알파 1-마이크로글로불린/바이쿠닌 인핸서)를 포함한다. 이러한 제어 서열 또는 조절 서열은 뉴클레아제 코딩 서열에 작동가능하게 연결된다.

특정 구현예에서, 약한 프로모터, 이를 포함하는 구조물 및 본원에 기술된 방법은 간 안내된 요법을 표적하는데 유용하다. 따라서, 간 발현된 유전자, 뿐만 아니라 이들 유전자 또는 이들에 연접된 서열에 표적화된 뉴클레아제는 유용하다. 간 발현된 유전자는 이에 한정되지 않고도 전구단백질 전환효소 섭틸리신/제 9형 켁신 (PCSK9) (콜레스테롤 관련 장애), 트랜스타이레틴 (TTR) (트랜스타이레틴 아밀로이드증), HAO, 아포지단백질 C-Ⅲ (APOC3), 인자 Ⅷ, 인자 Ⅸ, 저밀도 지질단백질 수용체 (LDLr), 지질단백질 리파제 (LPL) (지질단백질 리파제 결핍), 레시틴-콜레스테롤 아실전이효소 (LCAT), 오르니틴 트랜스카바밀라제 (OTC), 카르노시나제 (CN1), 스핑고미엘린 포스포디에스테라제 (SMPD1) (니에만-픽 질환), 하이폭산틴-구아닌 포스포리보실전이효소 (HGPRT), 분지쇄 알파-케토산 탈수소효소 복합체 (BCKDC) (단풍시럽뇨병), 에리트로포이에틴 (EPO), 카바밀 포스페이트 합성효소 (CPS1), N-아세틸글루타메이트 합성효소 (NAGS), 아르기니노숙신산 합성효소 (시트룰린혈증), 아르기니노숙시네이트 분해효소 (ASL) (아르기니노숙신산 뇨증) 및 아르기나제 (AG)를 포함한다.

특정 구현예에서, rAAV가 유전자 편집화 시스템에 사용될 수 있고, 여기서 시스템은 하나의 rAAV 또는 다수의 rAAV 스톡의 공동-투여가 관여될 수 있다. 예를 들면, rAAV는 SpCas9, SaCas9, ARCUS, Cpf1 및 다른 적합한 유전자 편집화 구조물을 전달하도록 조작될 수 있다.

일 구현예에서, 약한 프로모터에 작동가능하게 연결된 PCSK9 메가뉴클레아제를 인코딩하는 핵산 분자가 제공된다. 일 구현예에서, 약한 프로모터는 F64이다. 또 다른 구현예에서, 약한 프로모터는 F113이다. 또 다른 구현예에서, 약한 프로모터는 F140이다. 또 다른 구현예에서, 약한 프로모터는 CCl16이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1이다. 특정 구현예에서, 메가뉴클레아제는 국제특허출원 제 WO 2018/195449A1호에 기술된 메가뉴클레아제로부터 선택될 수 있다. 일 구현예에서, 핵산 분자는 서열번호 15 또는 이와 적어도 95%, 96%, 97%, 98%, 99% 또는 99.9%의 일치도를 공유하는 서열의 뉴클레오티드 1089번 내지 2183번의 PCSK9 메가뉴클레아제 코딩 서열에 작동가능하게 연결된 F113 프로모터를 포함한다. 일 구현예에서, 핵산 분자는 서열번호 16 또는 이와 적어도 95%, 96%, 97%, 98%, 99% 또는 99.9%의 일치도를 공유하는 서열의 PCSK9 메가뉴클레아제를 인코딩하는 서열에 작동가능하게 연결된 F113 프로모터를 포함한다.

또 다른 구현예에서, 핵산 분자는 서열번호 15 또는 이와 적어도 95%, 96%, 97%, 98%, 99% 또는 99.9%의 일치도를 공유하는 서열의 뉴클레오티드 1089번 내지 2183번의 PCSK9 메가뉴클레아제 코딩 서열에 작동가능하게 연결된 F64 프로모터를 포함한다. 일 구현예에서, 핵산 분자는 서열번호 16 또는 이와 적어도 95%, 96%, 97%, 98%, 99% 또는 99.9%의 일치도를 공유하는 서열의 PCSK9 메가뉴클레아제를 인코딩하는 서열에 작동가능하게 연결된 F64 프로모터를 포함한다.

또 다른 구현예에서, 핵산 분자는 서열번호 15 또는 이와 적어도 95%, 96%, 97%, 98%, 99% 또는 99.9%의 일치도를 공유하는 서열의 뉴클레오티드 1089번 내지 2183번의 PCSK9 메가뉴클레아제 코딩 서열에 작동가능하게 연결된 F140 프로모터를 포함한다. 일 구현예에서, 핵산 분자는 서열번호 16 또는 이와 적어도 95%, 96%, 97%, 98%, 99% 또는 99.9%의 일치도를 공유하는 서열의 PCSK9 메가뉴클레아제를 인코딩하는 서열에 작동가능하게 연결된 F140 프로모터를 포함한다.

또 다른 구현예에서, 핵산 분자는 서열번호 15 또는 이와 적어도 95%, 96%, 97%, 98%, 99% 또는 99.9%의 일치도를 공유하는 서열의 뉴클레오티드 1089번 내지 2183번의 PCSK9 메가뉴클레아제 코딩 서열에 작동가능하게 연결된 SLC22A9 프로모터를 포함한다. 일 구현예에서, 핵산 분자는 서열번호 16 또는 이와 적어도 95%, 96%, 97%, 98%, 99% 또는 99.9%의 일치도를 공유하는 서열의 PCSK9 메가뉴클레아제를 인코딩하는 서열에 작동가능하게 연결된 SLC22A9 프로모터를 포함한다.

또 다른 구현예에서, 핵산 분자는 서열번호 15 또는 이와 적어도 95%, 96%, 97%, 98%, 99% 또는 99.9%의 일치도를 공유하는 서열의 뉴클레오티드 1089번 내지 2183번의 PCSK9 메가뉴클레아제 코딩 서열에 작동가능하게 연결된 CCL16 프로모터를 포함한다. 일 구현예에서, 핵산 분자는 서열번호 16 또는 이와 적어도 95%, 96%, 97%, 98%, 99% 또는 99.9%의 일치도를 공유하는 서열의 PCSK9 메가뉴클레아제를 인코딩하는 서열에 작동가능하게 연결된 CCL16 프로모터를 포함한다.

또 다른 구현예에서, 핵산 분자는 서열번호 15 또는 이와 적어도 95%, 96%, 97%, 98%, 99% 또는 99.9%의 일치도를 공유하는 서열의 뉴클레오티드 1089번 내지 2183번의 PCSK9 메가뉴클레아제 코딩 서열에 작동가능하게 연결된 CYP26A1 프로모터를 포함한다. 일 구현예에서, 핵산 분자는 서열번호 16 또는 이와 적어도 95%, 96%, 97%, 98%, 99% 또는 99.9%의 일치도를 공유하는 서열의 PCSK9 메가뉴클레아제를 인코딩하는 서열에 작동가능하게 연결된 CYP26A1 프로모터를 포함한다.

일 구현예에서, 약한 프로모터에 작동가능하게 연결된 TTR 메가뉴클레아제를 인코딩하는 핵산 분자가 제공된다. 일 구현예에서, 약한 프로모터는 F64이다. 또 다른 구현예에서, 약한 프로모터는 F113이다. 또 다른 구현예에서, 약한 프로모터는 F140이다. 또 다른 구현예에서, 약한 프로모터는 CCL16 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터이다.

일 구현예에서, 약한 프로모터에 작동가능하게 연결된 HAO 메가뉴클레아제를 인코딩하는 핵산 분자가 제공된다. 일 구현예에서, 약한 프로모터는 F64이다. 또 다른 구현예에서, 약한 프로모터는 F113이다. 또 다른 구현예에서, 약한 프로모터는 F140이다. 또 다른 구현예에서, 약한 프로모터는 CCL16 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터이다.

일 구현예에서, 약한 프로모터에 작동가능하게 연결된 BCKDC 메가뉴클레아제를 인코딩하는 핵산 분자가 제공된다. 일 구현예에서, 약한 프로모터는 F64이다. 또 다른 구현예에서, 약한 프로모터는 F113이다. 또 다른 구현예에서, 약한 프로모터는 F140이다. 또 다른 구현예에서, 약한 프로모터는 CCL16 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터이다.

일 구현예에서, 약한 프로모터에 작동가능하게 연결된 APOC3 메가뉴클레아제를 인코딩하는 핵산 분자가 제공된다. 일 구현예에서, 약한 프로모터는 F64이다. 또 다른 구현예에서, 약한 프로모터는 F113이다. 또 다른 구현예에서, 약한 프로모터는 F140이다. 또 다른 구현예에서, 약한 프로모터는 CCL16 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터이다.

일 구현예에서, 약한 프로모터에 작동가능하게 연결된 CRISPR/Cas9 뉴클레아제를 인코딩하는 핵산 분자가 제공된다. 일 구현예에서, 약한 프로모터는 F64이다. 또 다른 구현예에서, 약한 프로모터는 F113이다. 또 다른 구현예에서, 약한 프로모터는 F140이다. 또 다른 구현예에서, 약한 프로모터는 CCL16 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터이다. 일 구현예에서, 본원에 기술된 프로모터, 카세트 및 rAAV는 본원에 참고문헌으로 통합되는 국제특허출원 제 WO 2016/176191호에 기술된 CRISPR/Cas9 이중 벡터 시스템에 유용하다.

또 다른 구현예에서, 트랜스 유전자는 유전자 교정 요법의 용도를 위해 선택된다. 이것은 외인성 DNA 공여체 기질과 조합한, 예로 아연 핑거 뉴클레아제 (ZFN) 유도된 DNA 이중가닥 파손을 사용하여 달성될 수 있다. 예로, 본원에 참고문헌으로 통합되는 Ellis et al., Gene Therapy (epub 2012년 1월) 20: 35-42 참조. 당업자라면 원하는 결과를 기초로 하여 트랜스 유전자를 쉽게 선택할 수 있다.

일 구현예에서, 약한 프로모터에 작동가능하게 연결된 아연 핑커 뉴클레아제를 인코딩하는 핵산 분자가 제공된다. 일 구현예에서, 약한 프로모터는 F64이다. 또 다른 구현예에서, 약한 프로모터는 F113이다. 또 다른 구현예에서, 약한 프로모터는 F140이다. 또 다른 구현예에서, 약한 프로모터는 CCL16 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터이다.

일 구현예에서, 약한 프로모터에 작동가능하게 연결된 전사 활성인자 유사 효과기 뉴클레아제 (TALEN)를 인코딩하는 핵산 분자가 제공된다. 일 구현예에서, 약한 프로모터는 F64이다. 또 다른 구현예에서, 약한 프로모터는 F113이다. 또 다른 구현예에서, 약한 프로모터는 F140이다. 또 다른 구현예에서, 약한 프로모터는 CCL16 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터이다.

트랜스 유전자에 의해 인코딩되는 다른 유용한 산물은 결함 또는 결핍 유전자를 대체하거나, 바람직하지 않게 높은 수준으로 발현하고 있는 유전자의 발현을 불활성화하거나, "녹아웃" 또는 "녹다운"시키거나, 감소시키거나, 바람직한 치료 효과를 갖는 유전자 산물을 전달하는 다양한 유전자 산물을 포함한다. 일부 구현예에서, 치료법은 "체세포 유전자 요법", 즉 정자 또는 난자를 생산하지 않는 신체의 세포 내로 유전자의 전달일 것이다. 특정 구현예에서, 트랜스 유전자는 고유의 인간 서열의 서열을 갖는 단백질을 발현한다. 그러나, 다른 구현예에서, 합성 단백질이 발현된다. 이러한 단백질은 인간의 치료를 목적으로 하거나, 다른 구현예에서, 개 또는 고양이 집단과 같은 반려 동물을 포함한 동물의 치료를 위해, 또는 인간 집단과 접촉하는 가축 또는 기타 동물의 치료를 위해 설계될 수 있다.

적합한 유전자 산물의 예는 가족성 고콜레스테롤혈증, 근육 위축증, 낭성 섬유증 및 드문 희귀 질환과 관련된 유전자 산물을 포함할 수 있다. 이러한 희귀 질환의 예는 특히 척수 근육 위축증 (SMA), 헌팅턴병, 레트 증후군 (예로, 메틸-CpG-결합 단백질 2 (MeCP2); 유니플로트 KB - P51608), 근위축 측삭 경화증 (ALS), 듀첸 유형 근육 위축증, 프리드리히 실조증 (예로, 프라탁신), 제 2형 척수소뇌 실조증 (SCA2)/ALS와 관련된 ATXN2, ALS와 관련된 TDP-43, 프로그래눌린 (PRGN) (전두측두엽 치매 (FTD), 진행성 어눌한 실어증 (PNFA) 및 언어 치매를 포함하는 비-알츠하이머성 뇌 퇴화와 관련됨)을 포함할 수 있다. 예로, www.orpha.net/consor/cgi-bin/Disease_Search_List.php 참조.

적합한 유전자의 예는, 예로 인슐린, 글루카곤, 글루카곤 유사 펩티드-1 (GLP1), 성장호르몬 (GH), 부갑상샘 호르몬 (PTH), 성장호르몬 방출인자 (GRF), 난포 자극호흐몬 (FSH), 황체형성 호르몬 (LH), 인간 융모 생식샘자극호르몬 (hCG), 혈관 내피 성장인자 (VEGF), 엔지오포이에틴, 엔지오스타틴, 과립구 콜로니 자극인자 (GCSF), 에리트로포이에틴 (EPO) (예로, 인간, 개 또는 고양이 에리트로포이에틴을 포함함), 연결조직 성장인자 (CTGF), 예로 염기성 섬유모세포 성장인자 (bFGF), 산성 섬유모세포 성장인자 (aFGF), 표피 성장인자 (EGF), 혈소판 유래 성장인자 (PDGF), 인슐린 성장인자 I 및 Ⅱ (IGF-I 및 IGF-Ⅱ)를 포함하는 신경영양 인자, TGFα, 액티빈, 인히빈 또는 임의의 골 형태생성 단백질 (BMP) BMP 1 내지 15를 포함한 형질전환 성장인자 α 슈퍼패밀리 중 어느 하나, 성장인자의 헤레굴린/신경레굴린/ARIA/신경분화인자 (NDF) 패밀리 중 어느 하나, 신경 성장인자 (NGF), 뇌 유래 신경영양 인자 (BDNF), 뉴로트로핀 NT-3 및 NT-4/5, 섬모 신경영양 인자 (CNTF), 교아세포주 유래 신경영양 인자 (GDNF), 뉴트린, 아그린, 세마포린/콜랩신 패밀리 중 어느 하나, 네트린-1 및 네트린-2, 간세포 성장인자 (HGF), 에프린, 노긴, 음파 호저 및 타이로신 가수분해효소를 포함하나 이에 한정되지 않는, 호르몬, 및 성장 및 분화 인자를 포함할 수 있다.

다른 유용한 트랜스 유전자 산물은 프롬보포이에틴 (TPO), 인터류킨 (IL) IL-1 내지 IL-36 (예로, 인간 인터류킨 IL-1, IL-1α IL-1β, IL-2, IL-3, IL-4, IL-6, IL-8, IL-12, IL-11, IL-12, IL-13, IL-18, IL-31, IL-35를 포함함), 단핵구 화학유인제 단백질, 백혈병 억제인자, 과립구-대식구 콜로니 자극인자, Fas 리간드, 종양 괴사인자 α 및 β, 인터페론 α, β 및 γ, 줄기세포 인자, flk-2/flt3 리간드과 같은 사이토카인 및 림포카인을 포함하나 이에 한정되지 않는 면역게를 조절하는 단백질을 포함한다. 또한, 면역계에 의해 생산되는 유전자 산물도 본 발명에서 유용하다. 이들은 면역글로불린 IgG, IgM, IgA, IgD 및 IgE, 키메라 면역글로불린, 인간화 항체, 단일사슬 항체, T 세포 수용체, 키메라 T 세포 수용체, 단일사슬 T 세포 수용체, 클래스 I 및 클래스 Ⅱ MHC 분자, 뿐만 아니라 조작된 면역글로불린 및 MHC 분자를 포함하나 이에 한정되지 않는다. 예를 들면, 특정 구현예에서, rAAV 항체는 예로 항-IgE, 항-IL-31, 항-IL-33, 항-CD20, 항-NGF, 항-GnRH와 같은 개 또는 고양이 항체를 전달하도록 설계될 수 있다. 또한, 유용한 유전자 산물은 보체 조절 단백질, 단백질 보조인자 단백질 (MCP), 붕괴 가속화인자 (DAF), CR1, CF2, CD59 및 C1 에스테라제 저해제 (C1-INH)와 같은 보체 조절 단백질을 포함한다.

또 다른 유용한 유전자 산물은 호르몬, 성장인자, 사이토카인, 림포카인, 조절 단백질 및 면역계 단백질에 대한 수용체 중 어느 하나를 포함한다. 본 발명은 저밀도 지질단백질 (LDL) 수용체, 고밀도 지질단백질 (HDL) 수용체, 높은 저밀도 지질단백질 (VLDL) 수용체 및 스캐빈저 수용체를 포함하는, 콜레스테롤 조절 및/또는 지질 조절을 위한 수용체를 포괄한다. 또한, 본 발명은 글루코코르티코이드 수용체 및 에스트로겐 수용체를 포함한 스테로이드 호르몬 수용체 슈퍼패밀리의 구성원, 비타민 D 수용체 및 기타 핵 수용체와 같은 유전자 산물을 포괄한다. 또한, 유용한 유전자 산물은 jun, fos, 맥스, 매드, 혈청 반응인자 (SRF), AP-1, AP2, myb, MyoD 및 미오제닌과 같은 전사인자, ETS 박스를 포함하는 단백질, TFE3, E2F, ATF1, ATF2, ATF3, ATF4, ZF5, NFAT, CREB, HNF-4, C/EBP, SP1, CCAAT 박스를 포함하는 단백질, 인터페론 조절인자 (IRF-1), 윌름 종양 단백질, ETS 결합 단백질, STAT, GATA 박스 결합 단백질, 예로 GATA-3, 및 날개형 헬릭스 단백질의 포크헤드 패밀리를 포함한다.

다른 유용한 유전자 산물은 히드록시메틸바일란 합성효소 (HMBS), 카바모일 합성효소 I, 오르니틴 트랜스카바밀라제 (OTC), 아르기노숙시네이트 합성효소, 아르기노숙시네이트 분해효소 결핍의 치료를 위한 아르기노숙시네이트 분해효소 (ASL), 아르기나제, 퓨마릴아세테이트 가수분해효소, 페닐알라닌 가수분해효소, 알파-1 안티트립신, 레서스원숭이 알파 태아단백질 (AFP), 레서스원숭이 융모 생식샘자극호르몬 (CG), 포도당-6-포스파타제, 포르포빌리노겐 탈아미나제, 시스타치온 베타-합성효소, 분지쇄 케토산 탈카르복실라제, 알부민, 이소발레릴-CoA 탈수소효소, 프로피오닌 CoA 카르복실라제, 메틸 말로닐 CoA 뮤타제, 글루타릴 CoA 탈수소효소, 인슐린, 베타-글루코시다제, 피루베이트 카르복실레이트, 간 포스포릴라제, 포스포스릴라제 키나제, 글리신 탈카르복실라제, H-단백질, T-단백질, 낭성 섬유증 막통과 조절인자 (CFTR) 서열 및 디스트로핀 유전자 산물 (예로, 미니- 또는 마이크로-디스트로핀)을 포함한다. 또 다른 유용한 유전자 산물은 효소 대체 요법에 유용할 수 있는 것과 같은 효소를 포함하고, 이는 효소의 활성 결핍으로부터 생성된 다양한 병태에 유용하다. 예를 들면, 만노스-6-포스페이트를 포함하는 효소는 리소좀 저장 질환에 대한 요법에 사용될 수 있다 (예로, 적합한 유전자는 β-글루쿠로니다제 (GUSB)를 인코딩하는 것을 포함함). 또 다른 예에서, 유전자 산물은 유비퀴틴 단백질 리가제 E3A (UBE3A)이다. 또 다른 유용한 유전자 산물은 UDP 글루쿠로노실전이효소 패밀리 1의 구성원 A1 (UGT1A1)을 포함한다.

또 다른 유용한 유전자 산물은 혈우병 B (인자 Ⅸ를 포함함) 및 혈우병 A (인자 Ⅷ 및 이의 변이체, 예컨대 이종이량체의 경쇄 및 중쇄 및 B 결실된 도메인을 포함함; 미국 특허 제 US 6,200,560호 및 제 US 6,221,349호)를 포함한 혈우병의 치료에 사용되는 유전자 산물을 포함한다. 일부 구현예에서, 미니유전자는 10개의 아미노산 신호 서열뿐만 아니라 인간 성장호르몬 (hGH) 폴리아데닐화 서열을 인코딩하는 인자 Ⅷ 중쇄의 처음 57개 염기쌍을 포함하고, 대안의 구현예에서, 미니유전자는 A1 및 A2 도메인, 및 B 도메인의 N-말단으로부터의 5개 아미노산 및/또는 B 도메인의 C-말단의 85개 아미노산, 뿐만 아니라 A3, C1 및 C2 도메인을 추가로 포함한다. 또 다른 구현예에서, 인자 Ⅷ 중쇄 및 경쇄를 인코딩하는 핵산이 B 도메인의 14개 아미노산을 코딩하는 42개 핵산에 의해 분리된 단일한 미니유전자로 제공된다 (미국 특허 제 US 6,200,560호).

rAAV를 통해 전달될 수 있는 추가의 예시적인 유전자는 글리코겐 저장 질환 또는 결핍 제 1A형 (GSD1)과 관련된 포도당-6-포스파타제; PEPCK 결핍과 관련된 포스포에놀피루베이트 카르복시키나제 (PEPCK); 간질 및 중증 신경발생 손상과 관련된 세린/트레오닌 키나제 9 (STK9)으로도 알려진 사이클린 의존성 키나제 유사 5 (CDKL5); 갈락토스혈증과 관련된 갈락토스-1 포스페이트 우리딜 전이효소; 페닐케톤뇨증 (PKU)과 관련된 페닐알라닌 가수분해효소 (PAH); 히드록시산 옥시다제 1 (GO/HAO1) 및 AGXT를 포함하는 제 1형 일차 과다옥살뇨증과 관련된 유전자 산물; 단풍시럽뇨병과 관련된, BCKDH, BCKDH-E2, BAKDH-E1a 및 BAKDH-E1b를 포함하는 분지쇄 알파-케토산 탈수소효소; 제 1형 타이로신혈증과 관련된 퓨마릴아세토아세테이트 가수분해효소; 메틸말론산혈증과 관련된 메틸말로닐 CoA 뮤타제; 중간쇄 아세틸 CoA 결핍과 관련된 중간쇄 아실 CoA 탈수소효소; 오르니틴 트랜스카바밀라제 결핍과 관련된 오르니틴 트랜스카바밀라제 (OTC); 시트룰린혈증과 관련된 아르기니노숙신산 합성효소 (ASS1); 레시틴-콜레스테롤 아실전이효소 (LCAT) 결핍; 메틸말론산혈증 (MMA); 제 C1형 니에만-픽 질환과 관련된 NPC1; 프로피온산혈증 (PA); 트랜스타이레틴 (TTR) 관련 유전성 아밀로이드증과 관련된 TTR; 가족성 고콜레스테롤혈증 (FH)와 관련된 저밀도 지질단백질 수용체 (LDLR) 단백질, 국제특허출원 제 WO 2015/164778호에 기재된 것과 같은 LDLR 변이체; PCSK9; 치매와 관련된 ApoE 및 ApoC 단백질; 크리글러-나자르 질환과 관련된 UDP-글루코우로노실 전이효소; 중증 조합된 면역결힙 질환과 관련된 아데노신 탈아미나제; 구트 및 레쉬-나이안 증후군과 관련된 하이폭산틴 구아닌 포스포리보실 전이효소; 바이오티미다제 결핍과 관련된 바이오티미다제; 파브릴병과 관련된 알파-갈락토시다제 A (a-Gal A); GM1 갱글리오시드증과 관련된 베타-갈락토시다제 (GLB1); 윌름병과 관련된 ATP7B; 제 2형 및 제 3형 가우처병과 관련된 베타-글루코세레브로시다제; 젤웨거 증후군과 관련된 퍼옥시좀 막 단백질 70 kDa; 이염색 백질디스트로피와 관련된 아릴설파타제 A (ARSA); 크래브병과 관련된 갈락토세레브로시다제 (GALC) 효소; 폼페병과 관련된 알파글루코시다제 (GAA); 니에만 픽 질환 A형과 관련된 스핑고미엘리나제 (SMPD1) 유전자; 성인 발병 제 Ⅱ형 시트룰린혈증 (CTLN2)과 관련된 아르기니노숙시네이트 합성효소; 우레아 회로 장애와 관련된 카바모일-포스페이트 합성효소 (CPS1); 척수 근육 디스트로피와 관련된 생존 운동 뉴런 (SMN) 단백질; 파버 지질육아종증과 관련된 세라미다제; GM2 갱글리오시드증 및 데이삭스와 샌드호프병과 관련된 β-헥소사미니다제; 아스파틸-글루코사민뇨증과 관련된 아스파틸글루코사미니다제; 퓨코시드증과 관련된 α-퓨코시다제; 알파-만노시드증과 관련된 α-만노시다제; 급성 간헐 포르피린증 (AIP)와 관련된 포르포빌리노겐 탈아미나제; 알파-1 안티트립신 결핍 (폐기종)의 치료를 위한 알파-1 안티트립신; 지중해 빈혈 또는 신부전으로 인한 빈혈의 치료를 위한 에리트로포이에틴; 허혈성 질환의 치료를 위한 혈관 내피 성장인자, 안지오포이에틴-1 및 섬유모세포 성장인자; 예를 들면 죽상동맥경화증, 혈전증 또는 색전증에서 관찰되는 폐쇄된 혈관의 치료를 위한 트롬보모둘린 및 조직인자 경로 저해제; 파킨슨병의 치료를 위한 방향족 아미노산 탈카르복실라제 (AADC) 및 타이로신 가수분해효소 (TH); 포스포람반, 선천성 심부전의 치료를 위한 근육(내)세포질망 아데노신 트리포스파타제-2 (SERCA2) 및 심장 아데닐릴 사이클라제에 대한 안티센스 또는 이의 돌연변이 형태인 베타 아드레날린 수용체; 다양한 암의 치료를 위한 p53과 같은 종양 억제인자 유전자; 염증 및 면역 장애 및 암의 치료를 위한 다양한 인터류킨 중 하나와 같은 사이토카인; 근육 디스트로피의 치료를 위한 디스트로핀 또는 미니디스트로핀 및 유트로핀 또는 미니유트로핀; 및 당뇨병의 치료를 위한 인슐린 또는 GLP-1을 포함하나 이에 한정되지 않는다.

또 다른 구현예에서, 트랜스 유전자는 하나 이상의 트랜스 유전자를 포함한다. 이것은 둘 이상의 이종유래 서열을 보유하는 단일 벡터를 사용하거나, 각각 둘 이상의 이종유래 서열을 보유하는 둘 이상의 AAV를 사용하여 달성될 수 있다. 일 구현예에서, AAV는 유전자 억압 (또는 녹다운) 및 유전자 증강 보조요법에 사용된다. 녹다운/증강 보조요법에서, 관심있는 유전자의 결함성 사본은 침묵화되고, 돌연변이되지 않은 사본이 공급된다. 일 구현예에서,이것은 둘 이상의 공동-투여된 벡터를 사용하여 달성된다. 본원에 참고문헌으로 통합되는 Millington-Ward et al., Molecular Therapy, 2011년 4월, 19(4): 642-649 참조. 당업자라면 원하는 결과를 기초로 하여 트랜스 유전자를 쉽게 선택할 수 있다.

바이러스성 및 비-바이러스성 벡터

본원에 기술된 약한 프로모터 및 이종유래 코딩 서열을 포함하는 발현 카세트는 벡터와 같은 표적 세포로의 전달에 적합한 임의의 유전 요소 내로 조작될 수 있다. 본원에 사용된 "벡터"는 핵산 서열의 복제 또는 발현을 위해 적절한 숙주 세포 내로 도입될 수 있는 상기 핵산 서열을 포함하는 생물학적 또는 화학적 모이어티이다. 보편적인 벡터는 비-바이러스성 벡터 및 바이러스성 벡터를 포함한다. 본원에 사용된 바, 비-바이러스성 시스템은 나노입자, 전기천공 시스템 및 신규한 생체물질, 미가공 DNA, 파지, 트랜스포존, 플라스미드, 코스미드 (Phillip McClean, www.ndsu.edu/pubweb/~mcclean/-plsc731/cloning/cloning4.htm) 및 인공 염색체 (Gong, Shiaoching, et al., "A gene expression atlas of the central nervous system based on bacterial artificial chromosomes." Nature 425.6961 (2003): 917-925)로부터 선택될 수 있다.

본원에서 "플라스미드" 또는 "플라스미드 벡터"는 일반적으로 선행 소문자 p로 표기되고/거나, 이어서 벡터 명칭이 표기된다. 본 발명에 따라 사용될 수 있는 플라스미드, 다른 클로닝 및 발현 벡터, 이들의 성질 및 이들의 제작/조작 방법은 당업자에게는 바로 자명할 것이다. 일 구현예에서, 본원에 기술된 핵산 서열 또는 본원에 기술된 발현 카세트는 바이러스성 벡터를 생성하고/거나 숙주 세포로의 전달에 유용한 적합한 유전 요소 (벡터), 예로 미가공 DNA, 파지, 트랜스포존, 코스미드, 에피좀 등 내로 조작되고, 이는 이들에 보유된 뉴클레아제 서열을 전달한다. 선택된 벡터는 형질감염, 전기천공, 리포좀 전달, 막 융합 기법, 고속 DNA 코팅된 펠렛, 바이러스성 감염 및 원형질체 융합을 포함하는 임의의 적합한 방법에 의해 전달될 수 있다. 이러한 구조물을 제조하는데 사용된 방법은 핵산 조작 분야의 당업자에게 공지되어 있으며, 유전공학, 재조합 공학 및 합성 기법을 포함한다. 예로, Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, Cold Spring Harbor, NY 참조.

특정 구현예에서, 발현 카세트는 바이러스 캡시드 내에 포장하기 위해 벡터 게놈에 위치한다. 예를 들면, AAV 벡터 게놈의 경우, 발현 카세트의 구성요소는 AAV 역전된 말단 반복서열 서열에 의해 가장 5' 말단 및 가장 3' 말단에서 연접된다. 예를 들면, 5' AAV ITR, 발현 카세트, 3' AAV ITR이다. 다른 구현예에서, 자가-상보적인 AAV가 선택될 수 있다. 다른 구현예에서, 레트로바이러스 시스템, 렌티바이러스 벡터 시스템 또는 아데노바이러스 시스템이 사용될 수 있다. 일 구현예에서, 벡터 게놈은 임의의 서열번호 9 내지 14로 나타낸다. 일 구현예에서, 벡터 게놈은 서열번호 9에 나타낸다. 일 구현예에서, 벡터 게놈은 서열번호 10에 나타낸다. 일 구현예에서, 벡터 게놈은 서열번호 11에 나타낸다. 일 구현예에서, 벡터 게놈은 서열번호 12에 나타낸다. 일 구현예에서, 벡터 게놈은 서열번호 13에 나타낸다. 일 구현예에서, 벡터 게놈은 서열번호 14에 나타낸다.

AAV 벡터

특정 구현예에서, 재조합 AAV가 제공된다. "재조합 AAV" 또는 "rAAV"는 2가지 요소, AAV 캡시드 및 AAV 캡시드 내에 포장되는 적어도 비-AAV 코딩 서열을 포함하는 벡터 게놈를 포함하는 DNAse 저항성 바이러스 입자이다. 달리 특정되지 않은 경우라면, 이러한 용어는 용어 "rAAV 벡터"와 상호교환적으로 사용될 수 있다. rAAV는 임의의 기능적 AAV rep 유전자 또는 기능적 AAV cap 유전자가 결여되어 자손을 생성할 수 없기 때문에, "복제 결함성 바이러스" 또는 "바이러스성 벡터"이다. 특정 구현예에서, 유일한 AAV 서열은 AAV 역전된 말단 반복서열 서열 (ITR) 사이에 위치한 유전자 및 조절 서열이 AAV 캡시드 내에 포장되도록 하기 위하여 벡터 게놈의 가장 5' 및 3' 말단에 전형적으로 위치하는 ITR이다.

AAV 캡시드의 출처는 자연 발생 및 사용가능한 아데노 관련 바이러스, 뿐만 아니라 조작된 AAV 집단 중 어느 하나일 수 있다. 아데노 관련 바이러스 (AAV) 바이러스성 벡터는 표적 세포로의 전달을 위한 핵산 서열이 내부에 포장되는 AAV 단백질 캡시드를 갖는 AAV DNase 저항성 입자이다. AAV 캡시드는 60개의 캡시드 (cap) 단백질 소단위체 VP1, VP2 및 VP3으로 구성되고, 이들은 선택된 AAV에 의존하여 정 20면체 대칭으로 대략 1 : 1 : 10 내지 1 : 1 : 20의 비율로 배열된다. 다양한 AAV는 상기 확인된 AAV 바이러스성 벡터의 캡시드의 출처로서 선택될 수 있다. 예로, 미국 특허출원 공개 제 US 2007-0036760-A1호; 미국 특허출원 공개 제 US 2009-0197338-A1호; 유럽 특허 EP 1310571 참조. 또한, 국제특허출원 제 WO 2003/042397호 (AAV7 및 기타 원숭이 AAV), 미국 특허 제 US 7790449호, 미국 특허 제 US 7282199호 (AAV8), 국제특허출원 제 WO 2005/033321호, 미국 특허 제 US 7,906,111호 (AAV9), 국제특허출원 제 WO 2006/110689호, 제 WO 2003/042397호 (rh.10) 및 제 WO 2018/160582호 (AAVhu.68) 참조. 이들 문서는 AAV를 생성하기 위해 선택될 수 있는 다른 AAV를 설명하고 있으며, 참고문헌으로 통합된다. 달리 특정되지 않은 경우라면, 본원에 기술된 AAV 캡시드, ITR 및 다른 AAV 구성요소는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV8, AAV7M8, AAVAnc80, AAVrh.10 및 AAVPHP.B로 보편적으로 동정되는 AAV를 포함하나 이에 한정되지 않는 임의의 AAV, 및 임의의 공지되거나 언급된 AAV 또는 아직 발견되지 않은 AAV, 또는 이들의 변이체 또는 혼합물로부터 쉽게 선택될 수 있다. 예로, 본원에 참고문헌으로 통합되는 국제특허출원 제 WO 2005/033321호 참조. 일 구현예에서, AAV 캡시드는 AAV1 캡시드 또는 이의 변이체, AAV8 캡시드 또는 이의 변이체, AAV9 캡시드 또는 이의 변이체, AAVrh.10 캡시드 또는 이의 변이체, AAVrh.64.R1 캡시드 또는 이의 변이체, AAVhu.37 캡시드 또는 이의 변이체, 또는 AAV3B 캡시드 또는 이의 변이체이다. 또한, 본원에 이들의 전문이 참고문헌으로 통합되는 국제특허출원 제 WO 2019/168961호 및 제 WO 2019/168961호 참조.

다른 구현예에서, AAV 캡시드는 AAVrh.79 캡시드 또는 이의 변이체이다. 다른 구현예에서, AAV 캡시드는 AAVrh.90 캡시드 또는 이의 변이체이다.

특정 구현예에서, rAAV은 AAVhu.37 캡시드이다. AAVhu.37 캡시드는 서열번호 22의 아미노산 서열을 인코딩하는 핵산 서열의 산물인 vp1 단백질의 이종유래 집단, 서열번호 22의 적어도 약 138번 내지 738번 아미노산의 아미노산 서열을 인코딩하는 핵산 서열의 산물인 vp2 단백질의 이종유래 집단, 및 서열번호 22의 적어도 아미노산 204번 내지 738번을 인코딩하는 핵산 서열의 산물인 vp3 단백질의 이종유래 집단을 포함하고, 상기 vp1, vp2 및 vp3 단백질은 서열번호 22에 있는 아스파라긴-글리신 쌍에서 적어도 2개의 높게 탈아미드화된 아스파라긴 (N)을 포함하는 아미노산 변형을 갖는 하위집단을 포함하며, 선택적으로 다른 탈아미드화된 아미노산을 포함하는 하위집단을 추가로 포함하고, 여기서 탈아미드화는 아미노산 변화를 생성한다. AAVhu.37은 AAVhu.37 VP1의 번호매김 (서열번호 22)을 기초로 하여, 예로 위치 N57, N263, N385 및/또는 N514에서 높게 탈아미드화된 잔기를 갖는 것을 특징으로 한다.

탈아미드화는 하기 표에 나타낸 다른 잔기에서, 및 예로 본원에 참고문헌으로 통합되는 2019년 9월 6일에 공개된 국제특허출원 제 WO 2019/168961호에서 관찰되었다. 특정 구현예에서, AAVhu.37 캡시드는 트립신 효소와 함께 질량 분광분석법을 사용하여 결정된 바, 하기 제공된 범위에 있는 하기 위치 중 하나 이상에서 변형된다. 특정 구현예에서, 하기 위치 중 하나 이상 또는 N에 이어진 글리신은 본원에 기술된 바와 같이 변형된다. 예를 들면, 특정 구현예에서, G는 예로 위치 58번, 264번, 386번 또는 515번에서 S 또는 A로 변형될 수 있다. 일 구현예에서, AAVhu.37 캡시드는 위치 N57/G58 내지 N57Q 또는 G58A에서 변형되어 이 위치에서 탈아미드화가 감소된 캡시드를 수득한다. 또 다른 구현예에서, N57/G58은 NS57/58 또는 NA57/58로 변경된다. 그러나, 특정 구현예에서, 탈아미드화의 증가는 NG가 NS 또는 NA로 변경될 때 관찰된다. 특정 구현예에서, NG 쌍의 N은 G를 유지하면서 Q로 변형된다. 특정 구현예에서, NG 쌍의 둘 다의 아미노산이 변형된다. 특정 구현예에서, N385Q는 해당 위치에서 탈아미드화의 유의한 감소를 생성한다. 특정 구현예에서, N499Q는 해당 위치에서 탈아미드화의 유의한 증가를 생성한다.

특정 구현예에서, AAVhu.37는 탈아미드화된 이들 또는 다른 잔기를, 예로 전형적으로 10% 미만으로 갖을 수 있고/거나, 메틸화 (예로, ~ R487) (주어진 잔기에서 전형적으로 5% 미만, 더욱 전형적으로 1% 미만), 이성질체화 (예로, D97) (주어진 잔기에서 전형적으로 5% 미만, 더욱 전형적으로 1% 미만), 인산화 (예로, 존재하는 곳에서 약 10% 내지 60% 또는 약 10% 내지 30% 또는 약 20% 내지 60%의 범위로) (예로, S149, ~ S153, ~ S474, ~ T570, ~ S665 중 하나 이상에서), 또는 산화 (예로, W248, W307, W307, M405, M437, M473, W480, W480, W505, M526, M544, M561, W621, M637 및/또는 W697 중 하나 이상에서)를 포함하는 다른 변형을 갖을 수 있다. 선택적으로, W는 카이누레닌으로 산화될 수 있다.

또 다른 위치가 이러한 이들 또는 다른 변형 (예로, 아세틸화 또는 추가의 탈아미드화)을 갖을 수 있다. 특정 구현예에서, AAVhu.37 vp1 캡시드 단백질을 인코딩하는 핵산 서열은 서열번호 21에 제공된다. 다른 구현예에서, 서열번호 21과 70% 내지 99.9% 일치도의 핵산 서열은 AAVhu.37 vp1 캡시드 단백질을 발현하도록 선택될 수 있다. 특정 다른 구현예에서, 핵산 서열은 서열번호 21과 적어도 약 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97% 또는 적어도 99% 일치한다. 그러나, 서열번호 22의 아미노산 서열을 인코딩하는 다른 핵산 서열은 rAAVhu.37 캡시드를 생산하는 용도를 위해 선택될 수 있다. 특정 구현예에서, 핵산 서열은 서열번호 21, 또는 서열번호 22를 인코딩하는 서열번호 21과 적어도 70% 내지 적어도 99% 일치하는, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97% 또는 적어도 99% 일치하는 서열의 핵산 서열을 갖는다. 특정 구현예에서, 핵산 서열은 서열번호 21, 또는 서열번호 22의 vp2 캡시드 단백질 (아미노산 약 138번 내지 738번)을 인코딩하는 서열번호 21의 뉴클레오티드 약 412번 내지 약 2214번과 적어도 70% 내지 99%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97% 또는 적어도 99% 일치하는 서열의 핵산 서열을 갖는다. 특정 구현예에서, 핵산 서열은 서열번호 21의 뉴클레오티드 약 610번 내지 약 2214번, 또는 서열번호 22의 vp3 캡시드 단백질 (아미노산 약 204번 내지 738번)을 인코딩하는 서열번호 21과 적어도 70% 내지 99%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97% 또는 적어도 99% 일치하는 서열의 핵산 서열을 갖는다. 유럽 특허 제 EP 2 345 731 B1호 및 본원의 서열번호 88 참조, 이들은 본원에 참고문헌으로 통합된다.

특정 구현예에서, rAAV는 AAV8 캡시드를 포함한다. AAV8 캡시드는 질량 분광분석법을 사용하여 결정된 바, 캡시드에 있는 VP 단백질의 총량을 기초로 하여 하기 표에 정의된 바와 같이 탈아미드화된 VP 이소형의 이종유래 집단을 포함한다. 적합한 변형은 탈아미드화의 조정이 표시된 상기 단락에 설명된 변형을 포함하고, 이는 본원에 통합된다. 특정 구현예에서, AAV 캡시드는 질량 분광분석법을 사용하여 결정된 바, 하기 제공된 범위에 있는 하기 위치 중 하나 이상에서 변형된다. 특정 구현예에서, 하기 위치 중 하나 이상, 또는 N에 이어진 글리신은 본원에 설명된 바와 같이 변형된다. 특정 구현예에서, 인공적 NG는 하기에 확인된 하나의 위치와 상이한 위치 내에 도입된다. 특정 구현예에서, 하기 위치 중 하나 이상, 또는 N에 이어진 글리신은 본원에 설명된 바와 같이 변형된다. 예를 들면, 특정 구현예에서, G는 예로 위치 58번, 67번, 95번, 216번, 264번, 386번, 411번, 460번, 500번, 515번 또는 541번에서 S 또는 A로 변형된다. 탈아미드화의 유의한 감소는 NG57/58이 NS57/58 또는 NA57/58로 변경될 때 관찰된다. 그러나, 특정 구현예에서, 탈아미드화의 유의한 증가는 NG가 NS 또는 NA로 변경될 때 관찰된다. 특정 구현예에서, NG 쌍의 N은 G를 유지하면서 Q로 변형된다. 특정 구현예에서, NG 쌍의 둘 다의 아미노산이 변형된다. 특정 구현예에서, N385Q는 해당 위치에서 탈아미드화의 유의한 감소를 생성한다. 특정 구현예에서, N499Q는 해당 위치에서 탈아미드화의 유의한 증가를 생성한다. 특정 구현예에서, NG 돌연변이는 N263에 위치한 쌍에서 만들어진다 (예로, N263A). 특정 구현예에서, NG 돌연변이는 N514에 위치한 쌍에서 만들어진다 (예로, N514A). 특정 구현예에서, NG 돌연변이는 N540에 위치한 쌍에서 만들어진다 (예로, N540A). 특정 구현예에서, 이들 위치에서 다수의 돌연변이 및 적어도 하나의 돌연변이를 포함하는 AAV 돌연변이체가 조작된다. 특정 구현예에서, 돌연변이체는 위치 N57에서 만들어지지 않는다. 특정 구현예에서, 돌연변이체는 위치 N94에서 만들어지지 않는다. 특정 구현예에서, 돌연변이체는 위치 N305에서 만들어지지 않는다. 특정 구현예에서, 돌연변이체는 위치 G386에서 만들어지지 않는다. 특정 구현예에서, 돌연변이체는 위치 Q467에서 만들어지지 않는다. 특정 구현예에서, 돌연변이체는 위치 N479에서 만들어지지 않는다. 특정 구현예에서, 돌연변이체는 위치 N653에서 만들어지지 않는다. 특정 구현예에서, 캡시드는 "NG" 쌍이 아닌 위치에서 "N" 또는 "Q"를 감소시키도록 변형된다. 잔기 번호는 서열번호 20에 기재된 공개된 AAV8 서열을 기초로 한다.

특정 구현예에서, rAAV는 본원에 참고문헌으로 통합되는 2019년 9월 6일에 공개된 국제특허출원 제 WO 2019/169004호에 기술된 AAVrh.79 캡시드를 포함한다. 일 구현예에서, AAVrh.79 캡시드는 AAVrh.79 vp1 단백질, AAVrh.79 vp2 단백질 및 AAVrh.79 vp3 단백질의 이종유래 집단을 포함한다. 일 구현예에서, AAVrh.79 캡시드는 서열번호 18의 예측된 아미노산 서열 1번 내지 738번을 인코딩하는 핵산 서열로부터의 발현에 의해 생산된다. 선택적으로, vp1 고유의 영역 (아미노산 약 1번 내지 137번) 또는 vp2 고유의 영역 (아미노산 약 1번 내지 203번)을 제외한 핵산으로부터의 vp3 단백질, 서열번호 17로부터 생산된 vp1 단백질, 또는 서열번호 17과 적어도 70% 일치하는 서열번호 18의 1번 내지 738번의 예측된 핵산 서열을 인코딩하는 핵산 서열로부터 생산된 vp1 단백질을 공동-발현하는 서열. 다른 구현예에서. 서열번호 18의 적어도 아미노산 약 138번 내지 738번의 예측된 아미노산 서열을 인코딩하는 핵산 서열로부터의 발현에 의해 생산된 AAVrh.79 vp2 단백질, 서열번호 17의 적어도 뉴클레오티드 412번 내지 2214번을 포함하는 서열로부터 생산된 vp2 단백질, 또는 서열번호 17의 적어도 뉴클레오티드 412번 내지 2214번과 적어도 70% 일치하는, 서열번호 18의 적어도 아미노산 약 138번 내지 738번의 예측된 아미노산 서열을 인코딩하는 핵산 서열로부터 생산된 vp2 단백질, 서열번호 18의 적어도 아미노산 약 204번 내지 738번의 예측된 아미노산 서열을 인코딩하는 핵산 서열로부터의 발현에 의해 생산된 AAVrh.79 vp3 단백질, 서열번호 17의 적어도 뉴클레오티드 610번 내지 2214번을 포함하는 서열로부터 생산된 vp3 단백질, 또는 서열번호 17의 적어도 뉴클레오티드 610번 내지 2214번과 적어도 70% 일치하는, 서열번호 18의 적어도 아미노산 약 204번 내지 738번의 예측된 아미노산 서열을 인코딩하는 핵산 서열로부터 생산된 vp3 단백질.

특정 구현예에서, AAVrh.79 캡시드는 서열번호 18의 아미노산 서열을 인코딩하는 핵산 서열의 산물인 vp1 단백질의 이종유래 집단, 서열번호 18의 적어도 아미노산 약 138번 내지 738번의 아미노산 서열을 인코딩하는 핵산 서열의 산물인 vp2 단백질의 이종유래 집단, 및 서열번호 18의 적어도 아미노산 204번 내지 738번의 아미노산 서열을 인코딩하는 핵산 서열의 산물인 vp3 단백질의 이종유래 집단을 포함한다.

AAVrh.79 vp1, vp2 및 vp3 단백질은 서열번호 18에 있는 아스파라긴-글리신 쌍에서 적어도 2개의 높게 탈아미드화된 아스파라긴 (N)을 포함하는 아미노산 변형을 갖는 하위집단을 포함하고, 선택적으로 다른 탈아미드화된 아미노산을 포함하는 하위집단을 추가로 포함하며, 여기서 탈아미드화는 아미노산 변화를 생성한다. N-G 쌍, N57, N263, N385 및/또는 N514에서 서열번호 18의 수와 비교하여 높은 수준의 탈아미드화가 관찰된다. 탈아미드화는 하기 표 및 실시예에 나타낸 바와 같이 다른 잔기에서 관찰되었다. 특정 구현예에서, AAVrh.79는 탈아미드화된 다른 잔기를, 예로 전형적으로 10% 미만으로 갖을 수 있고/거나, 메틸화 (예로, ~ R487) (주어진 잔기에서 전형적으로 5% 미만, 더욱 전형적으로 1% 미만), 이성질체화 (예로, D97) (주어진 잔기에서 전형적으로 5% 미만, 더욱 전형적으로 1% 미만), 인산화 (예로, 존재하는 곳에서 약 10% 내지 약 60% 또는 약 10% 내지 약 30% 또는 약 20% 내지 약 60%의 범위로) (예로, S149, ~ S153, ~ S474, ~ T570, ~ S665 중 하나 이상), 또는 산화 (예로, W248, W307, W307, M405, M437, M473, W480, W480, W505, M526, M544, M561, W621, M637 및/또는 W697 중 하나 이상)를 포함하는 다른 변형을 갖을 수 있다. 선택적으로, W는 카이누레닌으로 산화할 수 있다.

특정 구현예에서, AAVrh.79 캡시드는 트립신 효소와 함께 질량 분광분석법을 사용하여 결정된 바, 하기 제공된 범위에 있는 상기 표에서 확인된 위치 중 하나 이상에서 변형된다. 특정 구현예에서, 하기 위치 중 하나 이상 또는 N에 이어진 글리신은 본원에 기술된 바와 같이 변형된다. 잔기 번호는 본원에 제공된 AAVrh.79 서열을 기초로 한다. 서열번호 18 참조.

특정 구현예에서, AAVrh.79 vp1 캡시드 단백질을 인코딩하는 핵산 서열은 서열번호 17에 제공된다. 다른 구현예에서, 서열번호 17과 70% 내지 99.9% 일치도의 핵산 서열은 AAVrh.79 vp1 캡시드 단백질을 발현하도록 선택될 수 있다. 특정 다른 구현예에서, 핵산 서열은 서열번호 17과 적어도 약 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 99% 또는 적어도 99.9% 일치한다. 그러나, 서열번호 18의 아미노산 서열을 인코딩하는 다른 핵산 서열은 rAAV 캡시드를 생산하는 용도를 위해 선택될 수 있다. 특정 구현예에서, 핵산 서열은 서열번호 17, 또는 서열번호 18을 인코딩하는 서열번호 17과 적어도 70% 내지 99% 일치하는, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 99% 또는 적어도 99.9% 일치하는 서열의 핵산 서열을 갖는다. 특정 구현예에서, 핵산 서열은 서열번호 17, 또는 서열번호 18의 vp2 캡시드 단백질 (아미노산 약 138번 내지 738번)을 인코딩하는 서열번호 17의 뉴클레오티드 약 412번 내지 약 2214번과 적어도 70% 내지 99%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 99% 또는 적어도 99.9% 일치하는 서열의 핵산 서열을 갖는다. 특정 구현예에서, 핵산 서열은 서열번호 17의 뉴클레오티드 약 610번 내지 약 2214번, 또는 서열번호 18의 vp3 캡시드 단백질 (아미노산 약 204번 내지 738번)을 인코딩하는 서열번호 17과 적어도 70% 내지 99%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 99% 또는 적어도 99.9% 일치하는 서열의 핵산 서열을 갖는다.

또한, 본 발명은 하나 이상의 잔기가 탈아미드화 또는 본원에서 확인된 다른 변형을 감소시키기 위해 변형되었던 돌연변이체 AAVrh.79를 인코딩하는 핵산 서열을 포괄한다. 이러한 핵산 서열은 돌연변이체 rAAVrh.79 캡시드의 생산에 사용될 수 있다.

특정 구현예에서, rAAV는 본원에 참고문헌으로 통합되는 2020년 11월 5일에 공개된 국제특허출원 제 WO 2020/223232호에 기술된 AAVrh.90 캡시드를 포함한다. 추가의 양태에서, 재조합 아데노 관련 바이러스 (rAAV)로서, (A)(1) 서열번호 24의 1번 내지 738번의 예측된 아미노산 서열을 인코딩하는 핵산 서열로부터의 발현에 의해 생산된 vp1 단백질, 서열번호 23으로부터 생산된 vp1 단백질, 또는 서열번호 24의 예측된 아미노산 서열의 1번 내지 738번을 인코딩하는 서열번호 23과 적어도 70% 일치하는 핵산 서열로부터 생산된 vp1 단백질로부터 선택된 AAVrh.90 vp1 단백질 이종유래 집단, 서열번호 24의 적어도 아미노산 약 138번 내지 738번의 예측된 아미노산 서열을 인코딩하는 핵산 서열로부터의 발현에 의해 생산된 vp2 단백질, 서열번호 23의 적어도 뉴클레오티드 412번 내지 2214번을 포함하는 서열로부터 생산된 vp2 단백질, 또는 서열번호 24의 적어도 아미노산 약 138번 내지 738번의 예측된 아미노산 서열을 인코딩하는 서열번호 23의 적어도 뉴클레오티드 412번 내지 2214번과 적어도 70% 일치하는 핵산 서열로부터 생산된 vp2 단백질로부터 선택된 AAVrh.90 vp2 단백질의 이종유래 집단, 서열번호 24의 적어도 아미노산 약 204번 내지 738번의 예측된 아미노산 서열을 인코딩하는 핵산 서열로부터의 발현에 의해 생산된 vp3 단백질, 서열번호 23의 적어도 뉴클레오티드 610번 내지 2214번을 포함하는 서열로부터 생산된 vp3 단백질, 또는 서열번호 24의 적어도 아미노산 약 204번 내지 738번의 예측된 아미노산 서열을 인코딩하는, 서열번호 23의 적어도 뉴클레오티드 610번 내지 2214번과 적어도 70% 일치하는 핵산 서열로부터 생산된 vp3 단백질로부터 선택된 AAVrh.90 vp3 단백질의 이종유래 집단을 포함하는 AAVrh.90 캡시드 단백질; 및/또는 (2) 서열번호 24의 아미노산 서열을 인코딩하는 핵산 서열의 산물인 vp1 단백질의 이종유래 집단, 서열번호 24의 적어도 아미노산 약 138번 내지 738번의 아미노산 서열을 인코딩하는 핵산 서열의 산물인 vp2 단백질의 이종유래 집단, 및 서열번호 24의 적어도 아미노산 204번 내지 738번의 아미노산 서열을 인코딩하는 핵산 서열의 산물인 vp3 단백질의 이종유래 집단으로서, vp1, vp2 및 vp3 단백질은 서열번호 24에 있는 아스파라긴-글리신 쌍에서 적어도 2개의 높게 탈아미드화된 아스파라긴 (N)을 포함하는 아미노산 변형을 갖는 하위집단을 포함하고, 선택적으로 다른 탈아미드화된 아미노산을 포함하는 하위집단을 추가로 포함하며, 탈아미드화는 아미노산 변화를 생성하는, 이종유래 집단 중 하나 이상을 포함하는 AAVrh.90 캡시드; 및 (B) AAVrh.90 캡시드의 벡터 게놈, AAV 역전된 말단 반복서열 서열을 포함하는 핵산 분자를 포함하는 벡터 게놈, 및 숙주 세포에서 발현을 안내하는 서열에 작동가능하게 연결된 산물을 인코딩하는 비-AAV 핵산 서열을 포함하는, 재조합 아데노 관련 바이러스가 제공된다.

특정 구현예에서, AAVrh.90 vp1, vp2 및 vp3 단백질은 서열번호 24에 있는 아스파라긴-글리신 쌍에서 적어도 2개의 높게 탈아미드화된 아스파라긴 (N)을 포함하는 아미노산 변형을 갖는 하위집단을 포함하고, 선택적으로 다른 탈아미드화된 아미노산을 포함하는 하위집단을 추가로 포함하며, 여기서 탈아미드화는 아미노산 변화를 생성한다. N-G 쌍, N57, ~ N263, ~ N385 및/또는 ~ N514에서 서열번호 24의 수와 비교하여 높은 수준의 탈아미드화가 관찰된다. 탈아미드화는 하기 표에 나타낸 바와 같이 다른 잔기에서 관찰되었다. 특정 구현예에서, AAVrh.90은 탈아미드화된 다른 잔기를 (예로, ~ N305, ~ N499 및/또는 ~ N599, 전형적으로 20% 미만으로) 갖을 수 있고/거나, 인산화 (예로, 존재하는 곳에서 약 2% 내지 약 30% 또는 약 2% 내지 약 20% 또는 약 2% 내지 약 10%의 범위로) (예로, S149), 또는 산화 (예로, ~ W23, ~ M204, ~ M212, W248, W282, M405, M473, W480, W505, M526, ~ N544, M561 및/또는 ~ M607 중 하나 이상)를 포함하는 다른 변형을 갖을 수 있다. 선택적으로, W는 카이누레닌으로 산화할 수 있다.

특정 구현예에서, AAVhu.90 캡시드는 트립신 효소와 함께 질량 분광분석법을 사용하여 결정된 바, 제공된 범위에 있는 선행 표에서 확인된 하나 이상의 위치에서 변형된다. 특정 구현예에서, 하나 이상의 위치 또는 N에 이어진 글리신은 본원에 기술된 바와 같이 변형된다. 잔기 번호는 본원에 제공된 AAVrh.90 서열을 기초로 한다. 서열번호 24 참조.

특정 구현예에서, AAVrh.90 캡시드는 서열번호 24의 아미노산 서열을 인코딩하는 핵산 서열의 산물인 vp1 단백질의 이종유래 집단, 서열번호 24의 적어도 아미노산 약 138번 내지 738번의 아미노산 서열을 인코딩하는 핵산 서열의 산물인 vp2 단백질의 이종유래 집단, 및 서열번호 24의 적어도 아미노산 204번 내지 738번의 아미노산 서열을 인코딩하는 핵산 서열의 산물인 vp3 단백질의 이종유래 집단을 포함한다.

본원에 사용된 바, "벡터 게놈"은 바이러스 입자를 형성하는 rAAV 캡시드 내부에 포장된 핵산 서열을 말한다. 이러한 핵산 서열은 AAV 역전된 말단 반복서열 서열 (ITR)을 포함한다. 본원의 실시예에서, 벡터 게놈은 5'부터 3' 말단으로 최소한의 AAV 5' ITR, 코딩 서열의 발현을 안내하는 조절 서열에 작동가능하게 연결된 트랜스 유전자 또는 코딩 서열(들)을 포함하는 발현 카세트 및 AAV 3' ITR을 포함한다. ITR은 벡터 생산 동안 게놈의 복제 및 포장을 책임지는 유전 요소이고, rAAV를 생성하는데 요구되는 유일한 바이러스성 시스 요소이다. 일 구현예에서, ITR은 캡시드를 공급하는 것과 상이한 AAV로부터 나온다. 바람직한 구현예에서, AAV로부터의 ITR 서열 또는 이의 결실된 버전 (△ITR)이 편의상 사용될 수 있다. 그러나, 다른 AAV 출처로부터 나온 ITR이 선택될 수 있다. ITR의 출처가 AAV2로부터 나오고, AAV 캡시드는 또 다른 AAV 출처로부터 나오는 경우에, 생성된 벡터는 슈도유형으로 명명될 수 있다. 전형적으로, AAV 벡터 게놈은 AAV 5' ITR, 유전자 산물(들) 및 임의의 조절 서열을 인코딩하는 핵산 서열 및 AAV 3' ITR을 포함한다. 그러나, 이들 요소의 다른 입체구조가 적합할 수 있다. 일 구현예에서, 자가-상보적인 AAV가 제공된다. D-서열 및 말단 분할 부위 (trs)가 결실되어 △ITR로 명명된 5' ITR의 단축된 버전이 기재되어 왔다. 특정 구현예에서, 벡터 게놈은 외부 "a" 요소가 결실된, 130개 염기쌍의 단축된 AAV2 ITR를 포함한다. 단축된 ITR은 내부 A 요소를 주형으로서 사용한 벡터 DNA의 증폭 동안 145개 염기쌍의 야생형 길이로 재역전된다. 다른 구현예에서, 전장의 AAV 5' 및 3' LTR이 사용된다. 다른 구현예에서, 전장의 또는 조작된 ITR이 선택될 수 있다. 또한, 벡터 게놈은 유전자 산물의 발현을 조정하는 (예로, 직접적으로 또는 간접적으로 전사 및/또는 번역을 조정함) 조절 서열을 포함한다. 벡터 게놈의 적합한 구성요소는 본원에서 더욱 자세하게 논의된다.

AAV 바이러스성 벡터 (예로, 재조합 (r)AAV)를 생성하는데 사용하기 위해, 발현 카세트는 포장하는 숙주 세포에 전달된 임의의 적합한 벡터, 예로 플라스미드 상에 운반될 수 있다. 본 발명에 유용한 플라스미드는 특히 원핵 세포, 곤충 세포, 포유동물 세포에서의 시험관내 복제 및 포장에 적합하도록 조작될 수 있다. 적합한 형질감염 기법 및 숙주 세포를 포장하는 것은 공지되고/거나, 당업자에 의해 쉽게 설계될 수 있다. 일 구현예에서, 서열번호 13에 나타낸 벡터 게놈은 AAVhu.37 캡시드 내에 포장된다.

벡터로서의 용도에 적합한 AAV를 생성하고 단리하는 방법은 당해 기술분야에 공지되어 있다. 일반적으로, 예로 본원에 각각의 전문이 참고문헌으로 통합되는, Grieger & Samulski, 2005, "Adeno-associated virus as a gene therapy vector: Vector development, production and clinical applications," Adv. Biochem. Engin/Biotechnol. 99: 119-145; Buning et al., 2008, "Recent developments in adeno-associated virus vector technology," J. Gene Med. 10: 717-733; 및 하기에 인용된 참고문헌 참조. 트랜스 유전자를 비리온 내에 포장하기 위해, ITR은 발현 카세트를 포함하는 핵산 분자와 동일한 구조물에서 시스 형태로 요구되는 유일한 AAV 구성요소이다. cap 및 rep 유전자는 트랜스 형태로 공급될 수 있다.

용어 "AAV 중간물" 또는 "AAV 벡터 중간물"은 내부에 포장되는 원하는 게놈 서열이 결여된 조립된 rAAV 캡시드를 말한다. 또한, 이들은 "빈" 캡시드로도 명명될 수 있다. 이러한 캡시드는 발현 카세트의 검출가능한 게놈 서열이 없거나, 유전자 산물의 발현을 달성하기에 불충분한 단지 부분적으로 포장된 게놈 서열만을 포함할 수 있다. 이러한 빈 캡시드는 관심있는 유전자를 숙주 세포로 전달하는 기능이 없다.

본원에 기술된 재조합 아데노 관련 바이러스 (AAV)는 공지되어 있는 기법을 사용하여 생성될 수 있다. 예로, 국제특허출원 제 WO 2003/042397호; 제 WO 2005/033321호; 제 WO 2006/110689호; 미국 특허 제 US 7588772 B2호 참조. 이러한 방법은 AAV 캡시드 단백질을 인코딩하는 핵산 서열; 기능적 rep 유전자; 최소한의 AAV 역전된 말단 반복서열 (ITR) 및 트랜스 유전자로 구성된 발현 카세트; 및 AAV 캡시드 단백질 내에 발현 카세트의 포장을 허용하는 충분한 헬퍼 기능을 포함하는 숙주 세포를 배양하는 것이 관여한다. 캡시드, 이에 따른 코딩 서열을 생성하는 방법, 및 rAAV 바이러스성 벡터의 생산 방법은 기술되어 왔다. 예로, Gao, et al., Proc. Natl. Acad. Sci. U.S.A. 100(10): 6081-6086 (2003) 및 미국 특허 제 US 2013/0045186A1호 참조.

일 구현예에서, 재조합 AAV를 생산하는데 유용한 생산 세포 배양물이 제공된다. 이러한 세포 배양물은 숙주 세포에서 AAV 캡시드 단백질을 발현하는 핵산; AAV 캡시드 내로의 포장에 적합한 핵산 분자, 예로 AAV ITR 및 숙주 세포에서 산물의 발현을 안내하는 서열에 작동가능하게 연결된 유전자 산물을 인코딩하는 비-AAV 핵산 서열을 포함하는 벡터 게놈; 및 재조합 AAV 캡시드 내에 핵산 분자의 포장을 허용하기에 충분한 AAV rep 기능 및 아데노바이러스 헬퍼 기능을 포함한다. 일 구현예에서, 세포 배양물은 포유동물 세포 (예로, 특히 인간 배아 신장 293 세포) 또는 곤충 세포 (예로, 배쿨로바이러스)로 구성된다.

선택적으로, rep 기능은 캡시드를 제공하는 AAV가 아닌 AAV에 의해 제공된다. 예를 들면, rep은 이에 한정되지는 않지만 AAV1 rep 단백질, AAV2 rep 단백질, AAV3 rep 단백질, AAV4 rep 단백질, AAV5 rep 단백질, AAV6 rep 단백질, AAV7 rep 단백질, AAV8 rep 단백질; 또는 rep 78, rep 68, rep 52, rep 40, rep 68/78 및 rep 40/52; 또는 이들의 단편; 또는 또 다른 출처일 수 있다. 선택적으로, rep 및 cap 서열은 세포 배양물에서 동일한 유전 요소 상에 있다. rep 유전자 및 cap 유전자 사이에 스페이서가 존재할 수 있다. 임의의 이러한 AAV 또는 돌연변이체 AAV 캡시드 서열은 숙주 세포에서 이들의 발현을 안내하는 외인성 조절 제어 서열의 통제 하에 있을 수 있다.

일 구현예에서, 세포는 적합한 세포 배양물 (예로, HEK 293) 세포로 제조된다. 본원에 기술된 유전자 요법 벡터를 제조하는 방법은 유전자 요법 벡터의 생산에 사용되는 플라스미드 DNA의 생성, 벡터의 생성 및 벡터의 정제와 같은 당해 기술분야에서 널리 공지된 방법을 포함한다. 일부 구현예에서, 유전자 요법 벡터는 AAV 벡터이고, 생성된 플라스미드는 AAV 게놈 및 관심있는 유전자를 인코딩하는 AAV 시스-플라스미드, AAV rep 및 cap 유전자를 포함하는 AAV 트랜스-플라스미드 및 아데노바이러스 헬퍼 플라스미드이다. 벡터 생성 공정은 세포 배양의 개시, 세포의 계대, 세포의 접종, 플라스미드 DNA를 사용한 세포의 형질감염, 무-혈청 배지로의 형질감염-후 배지 교환, 및 벡터를 포함하는 세포 및 배양 배지의 수확과 같은 방법 단계를 포함할 수 있다. 수확된 벡터를 포함하는 세포 및 배양 배지는 본원에서 미정제 세포 수확물로서 지칭된다. 또 다른 시스템에서, 유전자 요법 벡터는 배쿨로바이러스 기반의 벡터를 사용한 감염에 의해 곤충 세포 내에 도입된다. 이러한 생산 시스템에 관한 리뷰를 위해, 일반적으로 예로 본원에 이의 전문이 참고문헌으로 통합되는 Zang et al., 2009, "Adenovirus-adeno-associated virus hybrid for large-scale recombinant adeno-associated virus production," Human Gene Therapy 20: 922-929 참조. 또한, 이들 및 기타 AAV 생산 시스템을 제조하고 사용하는 방법도 하기 미국 특허 제 US 5,139,941호; 제 US 5,741,683호; 제 US 6,057,152호; 제 US 6,204,059호; 제 US 6,268,213호; 제 US 6,491,907호; 제 US 6,660,514호; 제 US 6,951,753호; 제 US 7,094,604호; 제 US 7,172,893호; 제 US 7,201,898호; 제 US 7,229,823호; 및 제 US 7,439,065호에 기재되어 있으며, 이들 각각의 전문이 본원에 참고문헌으로 통합된다.

미정제 세포 수확물은 이어서 벡터 수확물의 농축, 벡터 수확물의 투과여과, 벡터 수확물의 미세유동화, 벡터 수확물의 뉴클레아제 소화, 미세유동화된 중간물의 여과, 크로마토그래피에 의한 조 정제, 초원심분리에 의한 조 정제, 접면 유동 여과에 의한 완충액 교환, 및/또는 대량의 벡터를 준비하는 제형화 및 여과와 같은 방법이 시행될 수 있다.

높은 염 농도에서 두 단계 친화 크로마토그래피 정제에 이어진 음이온 교환 레진 크로마토그래피는 벡터 약물 산물을 정제하고, 빈 캡시드를 제거하는데 사용된다. 이러한 방법은 본원에 참고문헌으로 통합되는 국제특허출원 공개 제 WO 2017/160360호에 더욱 자세하게 설명된다. AAV8, 국제특허출원 공개 제 WO 2017/100676호; rh10, 국제특허출원 개 제 WO 및 AAV1, 국제특허출원 공개 제 WO 2017/100674호에 대한 정제 방법은 모두 본원에 참고문헌으로 통합된다.

비어있는 및 완전된 입자 내용물을 계산하기 위하여, 선택된 시료 (예로, 본원의 실시예에서, GC의 수 = 입자의 수인 이오딕산올 구배-정제된 제조물)에 대한 VP3 밴드 부피가 로딩된 GC 입자에 대응하여 좌표화된다. 결과로 나온 선형 방정식 (y = mx + c)이 테스트 항목 피크의 밴드 부피에서 입자의 수를 계산하는데 사용된다. 다음으로 로딩된 20 μL 당 입자의 수 (pt)에 50을 곱하여 입자 (pt)/mL을 수득한다. GC/mL로 나누기한 pt/mL은 입자 대 게놈 사본 (pt/GC) 비를 제공한다. Pt/mL - GC/mL은 비어있는 pt/mL를 수득한다. pt/mL로 나누기한 빈 pt/mL × 100은 비어있는 입자의 백분율을 제공한다.

일반적으로, 빈 캡시드 및 포장된 게놈을 갖는 AAV 벡터 입자를 검정하는 방법은 당해 기술분야에 공지되어 있다. 예로, Grimm et al.,　Gene Therapy　(1999), 6: 1322-1330; Sommer et al.,　Molec. Ther. (2003), 7: 122-128 참조. 변성된 캡시드를 테스트하기 위해, 방법은 처리된 AAV 스톡을 3가지 캡시드 단백질을 분리할 수 있는 임의의 젤, 예를 들면 완충액 중 3% 내지 8% 트리스-아세테이트를 포함한 구배 젤로 구성되는 SDS-폴리아크릴아미드 젤 전기영동을 시행하고, 다음으로 시료 물질이 분리될 때까지 젤을 전개시키고, 나일론 또는 이트로셀룰로스 막, 바람직하게 나일론 상에 젤을 블럿팅하는 것을 포함한다. 다음으로 항-AAV 캡시드 항체가 변성된 캡시드 단백질에 결합하는 일차 항체, 바람직하게 항-AAV 캡시드 단일클론 항체, 가장 바람직하게 B1 항-AAV-2 단일클론 항체로서 사용된다 (Wobus et al., J. Virol. (2000), 74: 9281-9293). 다음으로 일차 항체에 결합하고 일차 항체와의 결합을 검출하기 위한 수단을 포함하는 이차 항체, 더욱 바람직하게는 일차 항체에 공유 결합하는 검출 분자를 포함하는 항-IgG 항체, 가장 바람직하게는 호스래디쉬 퍼옥시다제에 공유 결합된 양 항-마우스 IgG 항체를 포함하는 것이 사용된다. 결합을 검출하는 방법은 일차 및 이차 항체 사이의 결합을 반정량적으로 결정하는데 사용되고, 바람직하게 방사성 동위원소 방출, 전자기 방사선 조사 또는 비색측정 변화를 검출할 수 있는 검출 방법, 가장 바람직하게는 화학발광 검출 키트이다. 예를 들면, SDS-PAGE의 경우, 컬럼 분획으로부터의 시료는 수집되어 환원제 (예로, DTT)를 포함한 SDS-PAGE 로딩 완충액에서 가열될 수 있으며, 캡시드 단백질은 프리캐스트 구배 폴리아크릴아미드 젤 (예로, 노벡스사) 상에서 분리되었다. 은 염색이 제조사의 지침에 따른 실버엑스프레스 (인비트로겐사, CA), 또는 다른 적합한 염색 방법, 즉 SYPRO 루비 또는 쿠마시 염색을 사용하여 수행될 수 있다. 일 구현예에서, 컬럼 분획에서 AAV 벡터 게놈 (vg)의 농도는 정량적 실시간 PCR (Q-PCR)에 의해 측정될 수 있다. 시료는 외인성 DNA를 제거하도록 희석하여 DNase I (또는 또 다른 적합한 뉴클레아제)로 소화시킨다. 뉴클레아제의 불활성화 이후에, 시료는 추가로 희석되어 프라이머들 사이의 DNA 서열에 특이적인 TaqMan^TM형광생성 프로브를 사용하여 증폭되었다. 정의된 수준의 형광에 도달하는데 필요한 주기의 횟수 (역치 주기, Ct)는 각 시료에 대해 어플라이드 바이오시스템 프리즘 7700 서열 검출 시스템 상에서 측정되었다. AAV 벡터에 포함된 서열과 동일한 서열을 포함하는 플라스미드 DNA는 Q-PCR 반응에서 표준 곡선을 생성하는데 채용되었다. 시료로부터 획득된 주기 역치 (Ct) 값은 벡터 게놈 역가를 플라스미드 표준 곡선의 Ct 값으로 정규화함으로써 이를 결정하는데 사용된다. 디지털 PCR을 기초로 한 종결점 검정법도 사용될 수 있다.

일 양태에서, 광범위 스펙트럼 세린 프로테아제, 예로 단백질분해효소 K (예컨대 퀴아젠사로부터 구입가능함)를 사용하는 최적화된 q-PCR 방법이 사용된다. 보다 구체적으로, 최적화된 q-PCR 게놈 역가 검정법은 DNAase I 소화 이후에 시료가 단백질분해효소 K 완충액으로 희석되어 단백질분해효소 K로 처리되고, 이어서 열 불활성화가 진행되는 점을 제외하고는 표준 검정법과 유사하다. 적합하게, 시료는 시료 크기와 동등한 양의 단백질분해효소 K 완충액으로 희석된다. 단백질분해효소 K 완충액은 2배 이상으로 농축될 수 있다. 전형적으로, 단백질분해효소 K 처리는 약 0.2 mg/mL이지만, 0.1 mg/mL 내지 약 1 mg/mL으로 변화될 수 있다. 처리 단계는 일반적으로 약 55℃에서 약 15분 동안 시행되지만, 더 낮은 온도 (예로, 약 37℃ 내지 약 50℃)에서 더 긴 시간 (예로, 약 20분 내지 약 30분) 동안, 또는 더 높은 온도 (예로, 최고 약 60℃)에서 더 짧은 시간 (예로, 약 5분 내지 10분) 동안 수행될 수 있다. 유사하게, 열 불활성화는 일반적으로 약 95℃에서 약 15분 동안이지만, 온도를 낮추고 (예로, 약 70℃ 내지 약 90℃) 시간을 연장할 수 있다 (예로, 약 20분 내지 30분). 다음으로 시료를 희석하고 (예로, 1,000배), 표준 검정법에서 설명된 바와 같이 TaqMan 분석을 시행한다.

추가적으로 또는 대안적으로, 비말 디지털 PCR (ddPCR)이 사용될 수 있다. 예를 들면, ddPCR에 의해 단일가닥 및 자가-상보적 AAV 벡터 게놈 역가를 결정하는 방법이 기재되어 있다. 예로, M. Lock et al., Hu Gene Therapy Methods, Hum Gene Ther Methods, 2014년 4월; 25(2): 115-25. doi: 10.1089/hgtb.2013.131. Epub 2014년 2월 14일 참조.

간략하게, 게놈 결함성 AAV 중간물로부터 포장된 게놈 서열을 갖는 rAAV 입자를 분리하는 방법은 재조합 AAV 바이러스 입자 및 AAV 캡시드 중간물을 포함하는 현탁액에 대해 신속 성능 액체 크로마토그래피를 시행하고, 여기서 AAV 바이러스 입자 및 AAV 중간물을 높은 pH에서 평형화된 강한 음이온 교환 레진에 결합시키고, 염 구배를 적용하면서 용리물을 약 260 nm 및 약 280 nm에서 자외선 흡광도에 대해 모니터링하는 단계가 관여한다. pH는 선택된 AAV에 의존하여 조절될 수 있다. 예로, 본원에 참고문헌으로 통합되어 있는, 국제특허출원 제 WO 2017/160360호 (AAV9), 제 WO 2017/100704호 (AAVrh10), 제 WO 2017/100676호 (AAV8) 및 제 WO 2017/100674호 (AAV1) 참조. 이러한 방법에서, AAV 완전한 캡시드는 A260/A280 비가 감염점에 도달할 때 용리되는 분획으로부터 수집된다. 일 예에서, 친화 크로마토그래피 단계의 경우, 투과여과된 산물은 AAV2 혈청형을 효율적으로 포획하는 캡처 셀렉트^TM 포로스 - AAV2/9 친화 레진 (라이프 테크놀로지사)에 적용될 수 있다. 이들 이온 조건 하에, 유의한 백분율의 잔류 세포성 DNA 및 단백질은 컬럼을 통과하는 반면, AAV 입자는 효율적으로 포획된다.

약제학적 조성물

약제학적 조성물은 발현 카세트, 이를 포함하는 벡터 (바이러스성 또는 비-바이러스성) 또는 발현 카세트를 포함하는 또 다른 시스템 중 하나 이상 및 담체, 현탁제 및/또는 부형제 중 하나 이상을 포함한다.

특정 구현예에서, 조성물은 적어도 하나의 rAAV 스톡 (예로, 하나의 rAAV 스톡) 및 선택적인 담체, 부형제 및/또는 보존제를 포함한다. rAAV 스톡은 예로 농도 및 용량 단위를 논의하면서 하기에 기술된 양과 같이 동일한 다수의 rAAV 벡터를 말한다.

본원에 사용된 바, "담체"는 임의의 및 모든 용매, 분산 매질, 비히클, 코팅제, 희석제, 항균제 및 항진균제, 등장제 및 흡수 지연제, 완충액, 담체 용액, 현탁액 및 콜로이드 등을 포함한다. 약제학적 활성 물질의 위해 이러한 매질 및 제제의 사용은 당해 기술분야에 널리 공지되어 있다. 또한, 보조적 활성 성분이 조성물 내에 도입될 수 있다. 용어 "약제학적으로 허용가능한"은 숙주에게 투여될 때 알레르기 또는 유사한 유해한 반응을 생성하지 않는 분자적 실체 및 조성물을 말한다. 리포좀, 나노캡슐, 미세입자, 미세구, 액체 입자 및 소포 등과 같은 전달 비히클은 적합한 숙주 세포 내로 본 발명의 조성물의 도입에 사용될 수 있다. 구체적으로, rAAV 벡터 전달된 벡터 게놈은 액체 입자, 리포좀, 소포, 나노구 또는 나노입자 등에 피막화된 전달을 위해 제형화될 수 있다.

특정 구현예에서, 발현 카세트는 액체 나노입자를 통해 전달된다. 용어 "액체 나노입자"는 평균 직경 10 내지 1,000 나노미터, 예로, 75 nm 내지 750 nm, 100 nm 내지 350 nm, 또는 250 nm 내지 500 nm로의 전형적인 구형 구조를 갖는 액체 조성물을 말한다. 일부 제형물에서, 액체 나노입자는 적어도 하나의 비-양이온성 지질, 적어도 하나의 양이온성 지질 및 적어도 하나의 컨쥬게이션된 지질을 포함할 수 있다. 당해 기술분야에 공지된, mRNA와 같은 핵산을 피막화하는데 적합한 지질 나노입자가 사용될 수 있다. "평균 직경"은 친유성 상 및 친수성 상을 포함하는 나노입자의 집단의 평균 크기이다. 이러한 시스템의 평균 크기는 당업자에게 공지된 표준 방법에 의해 측정될 수 있다. 유전자 요법에 적합한 지질 나노입자의 예는 예로 본원에 이들의 전문이 참고문헌으로 통합되는 L. Battaglia and E. Ugazio, J. Nanomaterials, Vol 2019, 논문 ID 283441, pp. 1-22; 미국 특허 공개 제 US 2012/0183589A1호; 및 국제특허출원 제 WO 2012/170930호에 기재되어 있다.

일 구현예에서, 조성물은 대상체에게 전달에 적합한 최종 제형물을 포함하고, 예로 생리학적으로 적격한 pH 및 염 농도로 완충된 수성 액체 현탁액이다. 선택적으로, 하나 이상의 표면활성제가 제형물에 존재한다. 또 다른 구현예에서, 조성물은 대상체에게 투여를 위해 희석되는 농축물로서 운반될 수 있다. 다른 구현예에서, 조성물은 동결건조되고, 투여 시 재구성될 수 있다.

당해 기술분야에서 널리 공지된, 제형물을 제조하기 위한 방법 및 제제는 예를 들면 "Remington's Pharmaceutical Sciences," Mack Publishing Company, Easton, Pa.에 기술되어 있다. 예를 들면, 제형물은 멸균수, 식염수, 폴리에틸렌 글리콜과 같은 폴리알킬렌 글리콜, 식물 기원의 오일, 수소화된 나프탈렌, 보존제 (예컨대, 옥타데실디메틸벤질 염화물, 염화암모늄, 헥사메토늄 염화물, 벤즈알코늄 염화물, 벤제토늄 염화물, 페놀, 부틸 또는 벤질 알코올, 메틸 또는 프로필 파라벤과 같은 알킬 파라벤, 카테콜, 레소르시놀, 시클로헥산올, 3-펜탄올 및 m-크레졸), 저분자량 폴리펩티드, 혈청 알부민 젤라틴 또는 면역글로불린과 같은 단백질, 폴리비닐피롤리돈과 같은 친수성 중합체, 글리신, 글루타민, 아스파라긴, 히스티딘, 아르기닌 및 라이신과 같은 아미노산, 단당류, 이당류, 및 포도당, 만노스 및 덱스트린을 포함한 기타 탄수화물, EDTA와 같은 킬레이팅제, 슈크로스, 만니톨, 트레할로스 또는 소르비톨과 같은 당, 소듐과 같은 염 형성하는 반대이온, 금속 복합체 (예로, Zn-단백질 복합체) 및/또는 트윈^TM, 플루로닉스^TM 또는 폴리에틸렌 글리콜과 같은 비-이온성 표면활성제과 같은 부형제, 담체, 안정화제 또는 희석제를 포함할 수 있다.

또한, 활성 성분은 예를 들면 액적형성 기법 또는 경계면 중합화에 의해 제조된 미세캡슐, 예를 들면 각각 히드록시메틸셀룰로스 또는 젤라틴-미세캡슐 및 폴리(메틸메타크릴레이트) 미세캡슐에, 콜로이드 약물 전달 시스템 (예를 들면 리포좀, 알부민 미세구, 미세에멀전, 나노입자 및 나노캡슐)에, 또는 미세에멀전에 포집될 수 있다. 이러한 기법은 Remington's Pharmaceutical Sciences 제 4판, Osol, A. Ed. (1980)에 개시되어 있다.

적합한 표면활성제 또는 표면활성제의 조합은 비독성인 비-이온성 표면활성제부터 선택될 수 있다. 일 구현예에서, 일차 히드록시기로 종결되는 이중기능성 블록 공중합체 표면활성제가, 예로 중성 pH를 갖고 평균 분자량 8400을 갖는 폴록사머 188로도 알려져 있는 플루로닉® F68 [바스프사]와 같이 선택된다. 다른 표면활성제 및 다른 폴록사머, 즉 폴리옥시에틸렌 (폴리(에틸렌 옥사이드))의 2개 친수성 사슬에 의해 연접된 폴리옥시프로필렌 (폴리(프로필렌 옥사이드))의 중앙 친수성 사슬로 구성된 비-이온성 트리블록 공중합체, 솔루톨 HS 15 (마크로골-15 히드록시스테아레이트), 라브라졸 (폴리옥시 카프릴릭 글리세리드), 폴리옥시 10 올레일 에테르, 트윈 (폴리옥시에틸렌 소비탄 지방산 에스테르), 에탄올 및 폴리에틸렌 글리콜이 선택될 수 있다. 일 구현예에서, 제형물은 폴록사머를 포함한다. 이들 공중합체는 공통적으로 문자 "P" (폴록사머)에 이어진 3자리 수로 명명되고, 처음 2자리 수 × 100은 폴리옥시프로필렌 코아의 대략적인 분자량을 나타내고, 마지막 자리수 × 100은 폴리옥시에틸렌 함량의 백분율을 나타낸다. 일 구현예에서, 폴록사머 188이 선택된다. 표면활성제는 현탁액 중 최대 약 0.0005% 내지 약 0.001%의 양으로 존재할 수 있다.

벡터는 과도한 유해 효과가 없이 또는 의학적으로 허용가능한 생리학적 효과와 함께 치료적 유익을 제공하도록 세포를 형질감염시켜 충분한 수준의 유전자 전달 및 발현을 제공하기에 충분한 양으로 투여되고, 이는 의학 분야의 당업자에 의해 결정될 수 있다. 통상적인 및 약제학적으로 허용가능한 투여 경로는 원하는 장기 (예로, 간 (선택적으로 간 동맥을 통해)), 폐, 심장, 눈, 신장)에 대한 직접적 전달, 경구, 흡입, 비강내, 경막내, 기관내, 동맥내, 안구내, 정맥내, 근육내, 피하, 피부내 및 기타 비경구 투여 경로를 포함하나 이에 한정되지 않는다. 투여 경로는 바람직한 경우 조합될 수 있다.

바이러스성 벡터의 용량은 주로 치료되는 병태, 환자의 연령, 체중 및 건강과 같은 요인에 의존한다. 예를 들면, 바이러스성 벡터의 치료적으로 유효한 인간 용량은 일반적으로 약 1 × 10⁹개 내지 1 × 10¹⁶개 게놈 바이러스 벡터의 농도를 포함하는 약 100 mL의 용액으로 약 25 μL 내지 약 1,000 μL 범위이다. 용량은 임의의 부작용에 대응한 치료적 이익을 계산하도록 조절되고, 이러한 용량은 재조합 벡터가 채용되는 치료적 적용에 따라 달라질 수 있다. 트랜스 유전자 산물의 발현 수준은 바이러스성 벡터, 바람직하게 미니유전자를 포함하는 AAV 벡터를 생성하는 용량의 빈도를 결정하도록 모니터링될 수 있다. 선택적으로, 치료적 목적으로 기술된 것과 유사한 용량 요법은 본 발명의 조성물을 사용한 면역화에 사용될 수 있다.

복제 결함성 바이러스 조성물은 (체중 70 kg의 평균 대상체를 치료하는데) 범위 내의 모든 정수 또는 분획 양을 포함하여 약 1 × 10⁹개 GC 내지 약 1 × 10¹⁶개, 바람직하게 인간 환자의 경우 1 × 10¹²개 GC 내지 약 1 × 10¹⁴개 GC의 범위에 있는 복제 결함성 바이러스의 양을 포함하도록 용량 단위로 제형화될 수 있다. 일 구현예에서, 조성물은 범위 내의 모든 정수 또는 분획 양을 포함하여 용량 당 적어도 1 × 10⁹개, 2 × 10⁹개, 3 × 10⁹개, 4 × 10⁹개, 5 × 10⁹개, 6 × 10⁹개, 7 × 10⁹개, 8 × 10⁹개 또는 9 × 10⁹개의 GC를 포함하도록 제형화된다. 또 다른 구현예에서, 조성물은 범위 내의 모든 정수 또는 분획 양을 포함하여 용량 당 적어도 1 × 10¹⁰개, 2 × 10¹⁰개, 3 × 10¹⁰개, 4 × 10¹⁰개, 5 × 10¹⁰개, 6 × 10¹⁰개, 7 × 10¹⁰개, 8 × 10¹⁰개 또는 9 × 10¹⁰개의 GC를 포함하도록 제형화된다. 또 다른 구현예에서, 조성물은 범위 내의 모든 정수 또는 분획 양을 포함하여 용량 당 적어도 1 × 10¹¹개, 2 × 10¹¹개, 3 × 10¹¹개, 4 × 10¹¹개, 5 × 10¹¹개, 6 × 10¹¹개, 7 × 10¹¹개, 8 × 10¹¹개 또는 9 × 10¹¹개의 GC를 포함하도록 제형화된다. 또 다른 구현예에서, 조성물은 범위 내의 모든 정수 또는 분획 양을 포함하여 용량 당 적어도 1 × 10¹²개, 2 × 10¹²개, 3 × 10¹²개, 4 × 10¹²개, 5 × 10¹²개, 6 × 10¹²개, 7 × 10¹²개, 8 × 10¹²개 또는 9 × 10¹²개의 GC를 포함하도록 제형화된다. 또 다른 구현예에서, 조성물은 범위 내의 모든 정수 또는 분획 양을 포함하여 용량 당 적어도 1 × 10¹³개, 2 × 10¹³개, 3 × 10¹³개, 4 × 10¹³개, 5 × 10¹³개, 6 × 10¹³개, 7 × 10¹³개, 8 × 10¹³개 또는 9 × 10¹³개의 GC를 포함하도록 제형화된다. 또 다른 구현예에서, 조성물은 범위 내의 모든 정수 또는 분획 양을 포함하여 용량 당 적어도 1 × 10¹⁴개, 2 × 10¹⁴개, 3 × 10¹⁴개, 4 × 10¹⁴개, 5 × 10¹⁴개, 6 × 10¹⁴개, 7 × 10¹⁴개, 8 × 10¹⁴개 또는 9 × 10¹⁴개의 GC를 포함하도록 제형화된다. 또 다른 구현예에서, 조성물은 범위 내의 모든 정수 또는 분획 양을 포함하여 용량 당 적어도 1 × 10¹⁵개, 2 × 10¹⁵개, 3 × 10¹⁵개, 4 × 10¹⁵개, 5 × 10¹⁵개, 6 × 10¹⁵개, 7 × 10¹⁵개, 8 × 10¹⁵개 또는 9 × 10¹⁵개의 GC를 포함하도록 제형화된다. 일 구현예에서, 인간 적용을 위해, 용량은 범위 내의 모든 정수 또는 분획 양을 포함하여 용량 당 적어도 1 × 10¹⁰개 내지 약 1 × 10¹²개 GC의 범위를 갖을 수 있다.

이러한 상기 용량은 치료될 영역의 크기, 사용된 바이러스 역가, 투여 경로 및 방법의 원하는 효과에 의존하여, 범위 내의 모든 숫자를 포함하는 약 25 μL 내지 약 1,000 μL 이상의 부피 범위를 갖는, 다양한 부피의 담체, 부형제 또는 완충액 제형물로 투여될 수 있다.

임의의 적합한 투여 경로가 선택될 수 있다. 따라서, 약제학적 조성물은 임의의 적절한 투여 경로를 위해, 예를 들면 액체 용액 또는 현탁액의 형태로 (예를 들면, 정맥내 투여, 경구 투여 등을 위해) 제형화될 수 있다. 대안적으로, 약제학적 조성물은 고체 형태로 (예로, 정제 또는 캡슐의 형태, 예를 들면 경구 투여를 위해)일 수 있다. 일부 구현예에서, 약제학적 조성물은 분말, 드로프스, 에어로졸 등의 형태로일 수 있다.

방법

본원에 제공된 조성물은 생체내 전달된 효소의 표적-외 활성을 감소시키는데 유용하다. 특정 구현예에서, 조성물은 본원에서 설명된 바와 같이 약한 프로모터의 조절 하에서 효소 코딩 서열을 포함하는 발현 카세트의 비-바이러스 매개된 전달 이후에 발현된 효소의 표적-외 활성을 감소시키는데 유용하다. 특정 구현예에서, 조성물은 벡터 게놈의 AAV 매개된 전달 이후에 발현된 효소의 표적-외 활성을 감소시키는데 유용하다.

일 구현예에서, 표적화된 유전자를 편집화하는 방법이 제공된다. 방법은 뉴클레아제가 표적화되는 서열을 갖는 숙주 세포로의 전달 이후에 뉴클레아제의 발현을 안내하는 조절 서열에 작동가능하게 연결된 뉴클레아제 코딩 서열을 포함하는 핵산 서열을 포함하는 뉴클레아제 발현 카세트를 전달하는 단계로서, 조절 서열은 낮은 전사 활성을 갖는 프로모터를 포함하는 , 단계를 포함한다. 이러한 프로모터는 본원에 기술되어 있다. 또 다른 구현예에서, 방법은 본원에 기술된 바와 같이, 발현 카세트를 포함하는 조성물, 바이러스성 벡터 또는 rAAV를 전달하는 단계를 포함한다.

또 다른 구현예에서, 유전자 표적화 뉴클레아제의 표적-외 활성을 감소시키는 방법이 제공된다. 방법은 뉴클레아제가 표적화되는 서열을 갖는 숙주 세포로의 전달 이후에 뉴클레아제의 발현을 안내하는 조절 서열에 작동가능하게 연결된 뉴클레아제 코딩 서열을 포함하는 핵산 서열을 포함하는 뉴클레아제 발현 카세트를 전달하는 단계로서, 조절 서열은 낮은 전사 활성을 갖는 프로모터를 포함하는 , 단계를 포함한다. 이러한 프로모터는 본원에 기술되어 있다. 또 다른 구현예에서, 방법은 본원에 기술된 바와 같이, 발현 카세트를 포함하는 조성물, 바이러스성 벡터 또는 rAAV를 전달하는 단계를 포함한다.

특정 구현예에서, 약한 프로모터의 효과는 시험관내에서 평가될 수 있다. 예를 들면, 뉴클레아제의 반감기는 세포가 단백질의 번역을 종결하도록 처리한 다음 (예로, 시클로헥시미드 (CHX)를 사용함) 처리-후 상이한 시점에 웨스턴 블럿을 수행함으로써 시험관내 (배양된 세포)에서 평가될 수 있다. 뉴클레아제의 표적-외 활성을 평가하는 다른 적합한 방법은 당업자에 의해 쉽게 결정할 수 있다.

표적외 뉴클레아제 활성의 감소는 문헌에 기술되어 있는 다양한 접근법을 사용하여 결정될 수 있다. 이러한 뉴클레아제 특이성을 결정하는 방법은 무-세포 방법, 예컨대 부위-시퀸싱 [Cameron, P., et al., (2017) Mapping the genomic landscape of CRISPR-Cas9 cleavage. Nat. Methods, 14: 600-606], 이중게놈-시퀸싱 [Kim, D., et al., (2015) Digenome-seq: genome-wide profiling of CRISPR-Cas9 off-target effects in human cells. Nat. Methods, 12: 237-243, p 243이 이어진 p231], 및 원형-시퀀싱 [Tsai, S.Q., et al., (2017) CIRCLE-seq: a highly sensitive in vitro screen for genome-wide CRISPR-Cas9 nuclease off-targets. Nat. Methods, 14: 607-614]; 및 시험관내 기반의 방법, 예컨대 GUIDE-Seq [Tsai (2017), Nat. Methods, 14: 607-614] 및 혼입-결함성 렌티바이러스성 벡터 포획 (IDLV) [Gabriel, R., et al. (2011) An unbiased genome-wide analysis of zinc-finger nuclease specificity. Nat. Biotechnol., 29: 816-823; Wang, X., et al., (2015) Unbiased detection of off-target cleavage by CRISPR-Cas9 and TALENs using integrase-defective lentiviral vectors. Nat. Biotechnol., 33: 175-178]을 포함한다.

일부 구현예에서, 표적-외 활성은 ITR-Seq에 의해 평가된다. 예로, 본원에 이의 전문이 참고문헌으로 통합되는 간행물 Breton et al., ITR-Seq, a next-generation sequencing assay, identifies genome-wide DNA editing sites in vivo following adeno-associated viral vector-mediated genome editing, BMC Genomics (2020), 21: 239 참조.

일 양태에서, 표적화된 유전자를 편집화하는 방법으로서, 본원에 기술된 약한 프로모터의 조절 하에 뉴클레아제 발현 카세트를 전달하는 단계를 포함하는, 방법이 제공된다.

일 양태에서, 표적화된 유전자를 편집화하는 방법으로서, 본원에 기술된 조성물을 전달하는 단계를 포함하는, 방법이 제공된다.

일 양태에서, 표적화된 유전자를 편집화하는 방법으로서, 본원에 기술된 바이러스성 또는 비-바이러스성 벡터를 전달하는 단계를 포함하는, 방법이 제공된다.

일 양태에서, 표적화된 유전자를 편집화하는 방법으로서, 본원에 기술된 rAAV를 전달하는 단계를 포함하는, 방법이 제공된다.

일 양태에서, 고콜레스테롤혈증과 같은 콜레스테롤 관련 장애(들)에 걸린 환자를 치료하는 방법으로서, 본원에 기술된 약한 프로모터의 조절 하에 인간 PCSK9 유전자 내의 부위를 인식하는 메가뉴클레아제를 포함하는 뉴클레아제 발현 카세트를 사용하는, 방법이 제공된다. 일 구현예에서, 약한 프로모터는 F64이다. 또 다른 구현예에서, 약한 프로모터는 F113이다. 또 다른 구현예에서, 약한 프로모터는 F140이다. 또 다른 구현예에서, 약한 프로모터는 CCL16 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터이다. 이러한 발현 카세트는 바이러스성 또는 비-바이러스성 벡터를 통해 전달될 수 있다. 특정 구현예에서, 발현 카세트는 LNP를 사용하여 전달될 수 있다.

일 양태에서, 원발성 고옥살산뇨증과 같은 알라닌 글리옥시레이트 아미노전이효소 유전자에서 결함과 관련된 장애에 걸린 환자를 치료하는 방법으로서, 본원에 기술된 약한 프로모터의 조절 하에 인간 HAO 유전자 내의 부위를 인식하는 메가뉴클레아제를 포함하는 뉴클레아제 발현 카세트를 사용하는, 방법이 제공된다. 일 구현예에서, 약한 프로모터는 F64이다. 또 다른 구현예에서, 약한 프로모터는 F113이다. 또 다른 구현예에서, 약한 프로모터는 F140이다. 또 다른 구현예에서, 약한 프로모터는 CCL16 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터이다. 이러한 발현 카세트는 바이러스성 또는 비-바이러스성 벡터를 통해 전달될 수 있다. 특정 구현예에서, 발현 카세트는 LNP를 사용하여 전달될 수 있다. 특정 구현예에서, 장애는 원발성 고옥살산뇨증 (PH1)이다.

일 양태에서, 트랜스타이레틴 (TTR) 유전자의 결함과 관련된 장애에 걸린 환자를 치료하는 방법으로서, 본원에 기술된 약한 프로모터의 조절 하에 인간 TTR 유전자 내의 부위를 인식하는 메가뉴클레아제를 포함하는 뉴클레아제 발현 카세트를 사용하는, 방법이 제공된다. 일 구현예에서, 약한 프로모터는 F64이다. 또 다른 구현예에서, 약한 프로모터는 F113이다. 또 다른 구현예에서, 약한 프로모터는 F140이다. 또 다른 구현예에서, 약한 프로모터는 CCL16 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터이다. 이러한 발현 카세트는 바이러스성 또는 비-바이러스성 벡터를 통해 전달될 수 있다. 특정 구현예에서, 발현 카세트는 LNP를 사용하여 전달될 수 있다. 특정 구현예에서, 장애는 TTR 관련 유전성 아밀로이드증이다.

또 다른 양태에서, 아포지단백질 C-Ⅱ (APOC3) 유전자의 결함과 관련된 장애에 걸린 환자를 치료하는 방법으로서, 본원에 기술된 약한 프로모터의 조절 하에 인간 APOC3 유전자 내의 부위를 인식하는 메가뉴클레아제를 포함하는 뉴클레아제 발현 카세트를 사용하는, 방법이 제공된다. 일 구현예에서, 약한 프로모터는 F64이다. 또 다른 구현예에서, 약한 프로모터는 F113이다. 또 다른 구현예에서, 약한 프로모터는 F140이다. 또 다른 구현예에서, 약한 프로모터는 CCL16 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터이다. 이러한 발현 카세트는 바이러스성 또는 비-바이러스성 벡터를 통해 전달될 수 있다. 특정 구현예에서, 발현 카세트는 LNP를 사용하여 전달될 수 있다.

일 양태에서, 분지쇄 α-케토산 탈수소효소 복합체 (BCKDC) E1α 유전자에서 결함과 관련된 장애에 걸린 환자를 치료하는 방법으로서, 본원에 기술된 약한 프로모터의 조절 하에 인간 BCKDC E1α 유전자 내의 부위를 인식하는 메가뉴클레아제를 포함하는 뉴클레아제 발현 카세트를 사용하는, 방법이 제공된다. 일 구현예에서, 약한 프로모터는 F64이다. 또 다른 구현예에서, 약한 프로모터는 F113이다. 또 다른 구현예에서, 약한 프로모터는 F140이다. 또 다른 구현예에서, 약한 프로모터는 CCL16 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터이다. 이러한 발현 카세트는 바이러스성 또는 비-바이러스성 벡터를 통해 전달될 수 있다. 특정 구현예에서, 발현 카세트는 LNP를 사용하여 전달될 수 있다. 특정 구현예에서, 장애는 단풍시럽뇨병이다.

일 양태에서, CRISPR/Cas 관련 뉴클레아제를 사용하여 유전자를 편집하는 방법으로서, 본원에 기술된 약한 프로모터의 조절 하에 원하는 유전자 내의 부위를 인식하는 CRISPR/Cas 관련 뉴클레아제의 코딩 서열을 포함하는 발현 카세트를 사용하는, 방법이 제공된다. 일 구현예에서, 약한 프로모터는 F64이다. 또 다른 구현예에서, 약한 프로모터는 F113이다. 또 다른 구현예에서, 약한 프로모터는 F140이다. 또 다른 구현예에서, 약한 프로모터는 CCL16 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터이다. 이러한 발현 카세트는 바이러스성 또는 비-바이러스성 벡터를 통해 전달될 수 있다. 특정 구현예에서, 발현 카세트는 LNP를 사용하여 전달될 수 있다.

일 양태에서, TALEN을 사용하여 유전자를 편집하는 방법으로서, 본원에 기술된 약한 프로모터의 조절 하에 원하는 유전자 내의 부위를 인식하는 TALEN 코딩 서열을 포함하는 발현 카세트를 사용하는, 방법이 제공된다. 일 구현예에서, 약한 프로모터는 F64이다. 또 다른 구현예에서, 약한 프로모터는 F113이다. 또 다른 구현예에서, 약한 프로모터는 F140이다. 또 다른 구현예에서, 약한 프로모터는 CCL16 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터이다. 이러한 발현 카세트는 바이러스성 또는 비-바이러스성 벡터를 통해 전달될 수 있다. 특정 구현예에서, 발현 카세트는 LNP를 사용하여 전달될 수 있다.

일 양태에서, 아연 핑거 뉴클레아제를 사용하여 유전자를 편집하는 방법으로서, 본원에 기술된 약한 프로모터의 조절 하에 원하는 유전자 내의 부위를 인식하는 아연 핑거 뉴클레아제의 코딩 서열을 포함하는 발현 카세트를 사용하는, 방법이 제공된다. 일 구현예에서, 약한 프로모터는 F64이다. 또 다른 구현예에서, 약한 프로모터는 F113이다. 또 다른 구현예에서, 약한 프로모터는 F140이다. 또 다른 구현예에서, 약한 프로모터는 CCL16 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터이다. 이러한 발현 카세트는 바이러스성 또는 비-바이러스성 벡터를 통해 전달될 수 있다. 특정 구현예에서, 발현 카세트는 LNP를 사용하여 전달될 수 있다.

일 양태에서, 메가뉴클레아제를 사용하여 유전자를 편집하는 방법으로서, 본원에 기술된 약한 프로모터의 조절 하에 원하는 유전자 내의 부위를 인식하는 메가뉴클레아제의 코딩 서열을 포함하는 발현 카세트를 사용하는, 방법이 제공된다. 일 구현예에서, 약한 프로모터는 F64이다. 또 다른 구현예에서, 약한 프로모터는 F113이다. 또 다른 구현예에서, 약한 프로모터는 F140이다. 또 다른 구현예에서, 약한 프로모터는 CCL16 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 SLC22A9 프로모터이다. 또 다른 구현예에서, 약한 프로모터는 CYP26A1 프로모터이다. 이러한 발현 카세트는 바이러스성 또는 비-바이러스성 벡터를 통해 전달될 수 있다. 특정 구현예에서, 발현 카세트는 LNP를 사용하여 전달될 수 있다.

특정 구현예에서, 임의의 상기 기술된 유전자를 표적하는 메가뉴클레아제가 아닌 뉴클레아제가 고려된다.

특정 구현예에서, 본원에 기술된 바와 같이 약제학적 조성물에서 뉴클레아제 발현 카세트, 비-바이러스성 벡터, 바이러스성 벡터 (예로, rAAV) 또는 이와 동일한 임의의 것은 환자에서 유전자 편집화를 위해 투여가능하다. 특정 구현예에서, 방법은 비-배아 유전자 편집화에 유용하다. 특정 구현예에서, 환자는 소아 (예로, 신생아 내지 약 9개월)이다. 특정 구현예에서, 환자는 소아보다 나이가 많은, 예로 12개월 이상이다.

본원에 사용된 바, "a", "an" 또는 "the"는 하나 이상을 의미할 수 있다. 예를 들면, "a" 세포는 단일 세포 또는 다수의 세포를 의미할 수 있다.

특정 구현예에서, 용어 "메가뉴클레아제"는 12개 이상의 염기쌍인 인식 서열에서 이중가닥 DNA에 결합하는 엔도뉴클레아제를 말한다. 바람직하게, 본 발명의 메가뉴클레아제의 인식 서열은 22개의 염기쌍이다. 메가뉴클레아제는 I-CreI으로부터 유래한 엔도뉴클레아제일 수 있으며, 고유의 I-CreI와 비교하여 예를 들면 DNA 결합 특이성, DNA 절단 활성, DNA 결합 친화도 또는 이중합 특성의 관점으로 변형되었던 I-CreI의 조작된 변이체를 말할 수 있다. 이러한 I-CreI의 변형된 변이체를 생산하는 방법은 당해 기술분야에 공지되어 있다. 예로, 국제특허출원 제 WO 2007/047859호 참조. 본원에 사용된 메가뉴클레아제는 이종이량체로서 이중가닥 DNA에 결합한다. 또한, 메가뉴클레아제는 DNA 결합 도메인의 쌍이 단일 폴리펩티드 내에 펩티드 링커를 사용하여 연결된 "단일사슬 메가뉴클레아제"일 수 있다. 용어 "귀소 엔도뉴클레아제"는 용어 "메가뉴클레아제"와 동의어이다. 본원에 이의 전문이 참고문헌으로 통합되는, 특정 PCSK9 메가뉴클레아제를 기술하는, 국제특허출원 제 WO 2018/195449호 참조. 일 구현예에서, 메가뉴클레아제는 본원에 기술된 ARCUS 메가뉴클레아제가 아니다.

본원에 기술된 용어 "특이성"은 인식 서열로 지칭되는 염기쌍의 특정한 서열에서만 또는 인식 서열의 특정한 세트에서만 이중가닥 DNA 분자를 인식하고 절단하는 메가뉴클레아제의 능력을 의미한다. 인식 서열의 세트는 특정 보존된 위치 또는 서열 모티브를 공유할 것이지만, 하나 이상의 위치에서 중복될 수 있다. 매우 특이적인 메가뉴클레아제는 하나 또는 매우 적은 인식 서열만을 절단할 수 있다. 특이성은 당해 기술분야에 공지된 임의의 방법에 의해 결정될 수 있다.

약어 "sc"는 자가-상보적임을 말한다. "자가-상보적인 AAV"는 재조합 AAV 핵산에 보유되는 코딩 영역이 분자내 이중가닥 DNA 주형을 형성하도록 설계되었던 구조물을 말한다. 감염 시, 세포 매개된 두 번째 가닥의 합성을 기다리기보다는, scAAV의 2개 상보적인 가닥이 결합하여 즉각적 복제 및 전사가 준비된 하나의 이중가닥 DNA (dsDNA) 단위를 형성할 것이다. 예로, D.M. McCarty et al, "Self-complementary recombinant adeno-associated virus (scAAV) vectors promote efficient transduction independently of DNA synthesis", Gene Therapy, (2001년 8월), Vol 8, No. 16, pp 1248-1254 참조. 자가-상보적인 AAV는 예로 미국 특허 제 US 6,596,535호; 제 US 7,125,717호; 및 제 US 7,456,683호에 기술되어 있으며, 이들 각각은 본원에 이의 전문이 참고문헌으로 통합된다.

본원에 사용된 용어 "작동가능하게 연결된"은 관심있는 유전자와 인접하는 발현 조절 서열, 및 관심있는 유전자를 조절하도록 트랜스로 또는 일정 거리에서 작동하는 발현 조절 서열 둘 다를 말한다.

핵산 서열 또는 단백질을 기술하는데 사용된 용어 "외인성"은 핵산 서열 또는 단백질이 염색체 또는 숙주 세포에서 이것이 존재하는 위치에서 자연 발생하지 않음을 의미한다. 또한, 외인성 핵산 서열은 외부로부터 유래하고 동일한 발현 카세트 또는 숙주 세포 내에 삽입되지만, 비-자연 상태로 예로 상이한 사본수 또는 상이한 조절 요소의 조절 하에 존재하는 서열을 말한다.

용어 "이종유래"는 단백질 또는 핵산과 관련하여 사용될 때 단백질 또는 핵산이 둘 이상의 서열 또는 자연에서 서로 동일한 동일한 관계로 발견되지 않는 서열을 포함함을 나타낸다. 예를 들면, 전형적으로 새로운 기능적 핵산을 만들도록 배열된 관련없는 유전자로부터의 둘 이상의 서열을 갖는 핵산은 재조합으로 생산된다. 예를 들면, 일 구현예에서, 핵산은 상이한 유전자로부터 코딩 서열의 발현을 안내하도록 배열된 하나의 유전자로부터 나온 프로모터를 갖는다.

본원에 사용된 용어 "숙주 세포"는 벡터 (예로, 재조합 AAV)가 생산 플라스미드로부터 생산되는 포장하는 세포주를 말할 수 있다. 대안으로, 용어 "숙주 세포"는 트랜스 유전자의 발현을 원하는 임의의 표적 세포를 말할 수 있다. 따라서, "숙주 세포"는 임의의 수단, 예로 전기천공, 칼슘 포스페이트 침전, 미세주사, 형질전환, 바이러스 감염, 형질감염, 리포좀 전달, 막 융합 기법, 고속 DNA 코팅된 펠렛 및 원형질체 융합에 의해 세포 내에 도입되었던 외인성 또는 이종유래 핵산 서열을 포함하는 원핵 또는 진핵 세포를 말한다. 본원의 특정 구현예에서, 용어 "숙주 세포"는 본원에 기술된 조성물의 시험관내 평가를 위한 다양한 포유동물 종의 세포 배양물을 말한다. 본원의 다른 구현예에서, 용어 "숙주 세포"는 바이러스성 벡터 또는 재조합 바이러스를 생성하고 포장하도록 채용된 세포를 말한다. 다른 구현예에서, 용어 "숙주 세포"는 본원에 기술된 질환 또는 병태에 대해 생체내에서 처리되고 있는 대상체의 표적 세포를 언급하도록 의도된다. 특정 구현예에서, 용어 "숙주 세포"는 간 세포 또는 간세포이다.

"복제 결함성 바이러스" 또는 "바이러스성 벡터"는 관심있는 유전자를 포함하는 발현 카세트가 바이러스 캡시드 또는 외피에 포장되는 합성 또는 인공 바이러스 입자로서, 바이러스 캡시드 또는 외피 내에 포장된 임의의 바이러스 게놈 서열도 복제 결함성인, 즉 이들이 자손 비리온을 생성할 수는 없지만 표적 세포를 감염시키는 능력은 보유하는, 바이러스 입자를 말한다. 일 구현예에서, 바이러스성 벡터의 게놈은 복제하는데 필요한 효소를 인코딩하는 유전자를 포함하지 않지만 (게놈이 인공 게놈의 증폭 및 포장에 필요한 신호가 연접된 관심있는 유전자만을 포함하는 "내용물이 없음"으로 조작될 수 있음), 이들 유전자가 생산 과정 동안 공급될 수 있다. 따라서, 이것은 자손 비리온에 의한 복제 및 감염이 복제에 필요한 바이러스 효소가 존재하지 않고는 발생할 수 없기 때문에 유전자 요법의 사용에 안전한 것으로 간주된다.

핵산 서열의 맥락에서 용어 "서열 일치도", "서열 일치도 백분율" 또는 "일치하는 백분율"은 2가지 서열에서 최대 상응성으로 정렬될 때 동일한 잔기를 말한다. 서열 일치도 비교의 길이는 바람직하게 게놈의 전장, 유전자 코딩 서열의 전장 또는 적어도 약 500개 내지 5,000개 뉴클레오티드의 단편에 걸쳐질 수 있다. 그러나, 더 작은 단편 중의 일치도, 예로 적어도 약 7개의 뉴클레오티드, 보통 적어도 약 20개 내지 24개의 뉴클레오티드, 적어도 약 28개 내지 32개의 뉴클레오티드, 적어도 약 36개 이상의 뉴클레오티드도 바람직할 수 있다. 유사하게, "서열 일치도 백분율"은 아미노산 서열에 대해 단백질의 전장 또는 이의 단편에 걸쳐 쉽게 결정될 수 있다. 적합하게, 단편은 적어도 약 8개 아미노산의 길이이고, 최대 약 700개의 아미노산일 수 있다. 적합한 단편의 예는 본원에 기술된다.

아미노산 또는 이들의 단편을 언급할 때, 용어 "실질적인 상동성" 또는 "실질적인 유사도"는 또 다른 아미노산 (또는 이의 상보적 가닥)을 사용한 적절한 아미노산 삽입 또는 결실과 최적으로 정렬될 때 정렬된 서열과 적어도 약 95% 내지 99%의 아미노산 서열 일치도가 존재함을 나타낸다. 바람직하게, 상동성은 전장의 서열, 또는 이의 단백질, 예로 cap 단백질, rep 단백질, 또는 적어도 8개의 아미노산, 더욱 바람직하게 적어도 15개 아미노산의 길이인 이들의 단편에 걸쳐질 수 있다. 적합한 단편의 예는 본원에 기술된다.

용어 "높게 보존된"은 적어도 80% 일치도, 바람직하게 적어도 90% 일치도, 더욱 바람직하게 97% 초과의 일치도를 의미한다. 일치도는 당업자라면 숙지하고 있는 알고리즘 및 컴퓨터 프로그램을 의지하여 당업자에 의해 쉽게 결정될 수 있다.

일반적으로, 2가지의 상이한 아데노 관련 바이러스 사이의 "일치도", "상동성" 또는 "유사도"를 언급할 때, "일치도", "상동성" 또는 "유사도"는 "정렬된" 서열을 기준으로 결정된다. "정렬된" 서열 또는 "정렬"은 기준 서열과 비교하여 염기 또는 아미노산을 결실하거나 첨가하는 교정을 종종 포함하는 다수의 핵산 서열 또는 단백질 (아미노산) 서열을 말한다. 실시예에서, AAV 정렬은 기준점으로서 공개된 AAV9 서열을 사용하여 수행된다. 정렬은 임의의 다양한 공개적으로 사용가능한 또는 구입가능한 다수의 서열 정렬 프로그램을 사용하여 수행된다. 이러한 프로그램의 예는 "크러스탈 오메가 (Clustal Omega)", "크러스탈 W", "CAP 서열 어셈블리", "MAP" 및 "MEME"를 포함하고, 이는 인터넷 상의 웹 서버를 통해 접근가능하다. 이러한 프로그램의 다른 출처는 당업자에게 공지되어 있다. 대안적으로, 벡터 NTI도 사용될 수 있다. 또한, 뉴클레오티드 서열 일치도를 측정하는데 사용될 수 있는, 상기에 설명된 프로그램에 포함된 것을 포함하여 당해 기술분야에 공지된 알고리즘이 많이 있다. 또 다른 예로서, 폴리뉴클레오티드 서열이 GCG 버전 6.1의 프로그램, Fasta^TM를 사용하여 비교될 수 있다. Fasta^TM은 질문 및 검색 서열 사이에 최고 중첩 영역의 정렬 및 서열 일치도 백분율을 제공한다. 예를 들면, 핵산 서열 사이의 서열 일치도 백분율은 본원에 참고문헌으로 통합되는 GCG 버전 6.1에 제공된 이의 디폴트 매개변수 (단어 크기 6 및 점수매김 매트릭스의 NOPAM 인자)로 Fasta^TM를 사용하여 결정될 수 있다. 또한, 다수의 서열 정렬 프로그램, 예로 "크러스탈 오메가", "크러스탈 X", "MAP", "PIMA", "MSA", "블록메이커", "MEME" 및 "매치-박스" 프로그램이 아미노산 서열에 사용가능하다. 일반적으로, 임의의 이들 프로그램은 당업자라면 필요한 경우 설정을 변경할 수 있지만, 디폴트 설정으로 사용된다. 대안적으로, 당업자라면 기준이 된 알고리즘 및 프로그램에 의해 제공된 수준과 적어도 같은 일치도 또는 정렬을 제공하는 또 다른 알고리즘 또는 컴퓨터 프로그램을 사용할 수 있다. 예로, J. D. Thomson et al., Nucl. Acids Res., "A comprehensive comparison of multiple sequence alignments", 27(13): 2682-2690 (1999) 참조.

본원에 사용된 용어 "약"은 기준 정수 및 이들 사이의 값으로부터 ± 10%dml 변화를 말한다. 예를 들면, "약" 40개의 염기쌍은 ± 4개를 포함한다 (즉, 정수 36개, 37개, 38개, 39개, 40개, 41개, 42개, 43개, 44개를 포함하는 36개 내지 44개). 다른 값의 경우, 구체적으로 백분율을 언급할 때 (예로, 90% 일치도, 약 10% 분산 또는 약 36% 미스매칭), 용어 "약"은 정수 및 분획 둘 다를 포함한 범위 내의 모든 값을 포함한다.

본 명세서 및 청구항 전체에 걸쳐 사용된 바, 용어 "포함하는 (comprising)", "포함하는 (containing)", "포함하는 (including)" 및 이들의 활용형은 다른 구성성분, 요소, 정수 및 단계 등을 포함한다. 역으로, 용어 "구성되는" 및 이의 활용형은 다른 다른 구성성분, 요소, 정수 및 단계 등을 배제시킨다.

본 명세서에서 달리 정의되지 않은 경우라면, 본원에 사용된 기술 및 과학 용어는 당업자에게 본 출원에 사용된 많은 용어에 대한 일반적인 내용을 제공하는 출판된 교과서를 참조하여 당업자라면 공통적으로 이해하는 바와 동일한 의미를 갖는다.

실시예

ARCUS 뉴클레아제 (프레시전 바이오사이언스사에 의해 추가로 조작된 I-CreI 엔도뉴클레아제)는 DNA에서 22개 bp 표적 서열을 인식하고 절단한다. 세포성 단백질은 DNAdptj 이들 파손을 인식하여 복구한다. 이러한 복구 기작의 결과는 편집된 좌위에서 뉴클레오티드의 삽입 또는 결실 (인델)이고, 이들 변형은 상응하는 유전자의 발현에 영향을 줄 수 있다.

본 발명자들 등은 마우스 및 레서스 머카크 둘 다의 연구에서 ARCUS 뉴클레아제의 아데노 관련 바이러스 (AAV) 벡터 매개된 전달 이후에 DNA 표적 영역에서 높은 편집화 백분율을 관찰하였다. 그러나, 표적-내 영역과 유사한 서열도 인델을 포함하는 것으로 관찰되고, ARCUS 뉴클레아제의 표적-외 활성을 시사하였다.

본 발명자들은 특정 수준의 M2PCSK9가 표적-내 편집화에 필요하고, 이러한 역치를 능가하는 뉴클레아제 발현의 증가가 표적-외 활성을 생성하는 것으로 가설을 세웠다. M2PCSK9 발현의 수준을 감소시키기 위하여, 우리는 AAV 구조물에서 부모 TBG 프로모터를 낮은 전사 활성을 갖는 프로모터로 대체하였다.

실시예 1 - 생체내 마우스 연구

본 발명자들 등은 마우스 및 레서스 머카크 둘 다의 연구에서 ARCUS 뉴클레아제의 아데노 관련 바이러스 (AAV) 벡터 매개된 전달 이후에 DNA 표적 영역에서 높은 편집화 백분율을 관찰하였다. 그러나, 표적-내 부위와 유사한 서열도 인델을 포함하는 것으로 관찰되고, ARCUS 뉴클레아제의 표적-외 활성을 시사하였다. 이러한 표적-외 활성은 바람직하지 않으며, 특히 임상 연구에서는 표적-내 효능을 유지하면서 이러한 표적-외 활성을 감소시키거나 제거하는 것이 필수적이다.

본 발명자들의 가설은 트랜스 유전자의 높은 발현이 바람직한 유전자 요법과는 대조적으로, 게놈 편집화가 트랜스 유전자의 더 낮은 발현을 요구할 수 있는 반면 더 높은 발현이 표적-외 편집화를 역시 촉진시킬 것이라는 점이다. 따라서, 본 발명의 목적은 트랜스 유전자의 전사를 감소시킴으로써 이의 발현을 감소시키는 것이다. 이것은 약한 전사 활성을 갖는 간-특이적 프로모터를 선택함으로써 달성될 수 있다.

후보 프로모터의 선별은 2가지 방법으로 시행되었다. 첫 번째 접근법에서, 본 발명자들은 RNA 발현이 낮은 간-특이적 인간 유전자를 확인하였다. 본 발명자들은 전사 활성의 매개변수로서 공통 전사물 발현 수준 (NX 수준)을 사용하여 인간 아틀라스 단백질 데이터베이스를 검색하였으며, 우리는 간에서 전사가 역시 강화되는 유전자를 선별하였다.

TBG (갑상샘 호르몬 결합 글로불린) 프로모터는 간 내로 트랜스 유전자의 AAV 매개된 전달에 유용한 것으로 확인되어 있다. 본 발명자들은 간에서 역시 농축되는 NX 수준이 감소되는 3가지 유전자를 선택하였다. 우리는 스위치기어 게노믹스 (칼스베드, CA)로부터 나온 이들 유전자에 대한 프로모터 영역을 획득하였다 (표 1).

우리의 두 번째 접근법의 경우, 본 발명자들은 TBG 프로모터의 더 작은 (176개 bp) 버전인 TBG-S1 프로모터의 전사 활성을 이의 서열의 단축에 의해 감소시키는 것을 목표로 하였다. 우리는 상류 영역으로부터 시작하여, 이러한 서열의 길이를 증가시키면서 제거하고, 결과로 생성된 프로모터 TBG-S1-F140 (F140), TBG-S1-F113 (F113) 및 TBG-S1-F64 (F64)는 각각 TBS-S1 프로모터의 140개, 113개 또는 64개 bp를 포함하였다.

PCSK9에 특이적인 ARCUS 뉴클레아제의 발현이 이들 6가지 약한 프로모터 중 하나에 의해 매개되는 AAV 혈청형 8 벡터를 생산하였다. 이러한 AAV 게놈의 모식적 예시는 도 1에 나타낸다. 다음과 같이 벡터를 생산하였다.

(a) AAV8.CCL16-1k.ARCUS2.bGH

(b) AAV8.CYP26A1-1k.ARCUS2.bGH

(c) AAV8.SLC22A9-1k.ARCUS2.bGH

(d) AAV8.TBG-S1-F64.ARCUS2.bGH

(e) AAV8.TBG-S1-F113.ARCUS2.bGH

(f) AAV8.TBG-S1-F140.ARCUS2.bGH

초기 테스트는 마우스에서 수행하였다. 간략하게, 마우스에게 인간 PCSK9 발현하는 AAV를 투여하고, 2주 후에 마우스에게 PCSK9 특이적 ARCUS 뉴클레아제를 상이한 약한 프로모터 하에 발현하는 AAV의 제 2 주사를 주었다. 양성 대조군으로서, 본 발명자들은 뉴클레아제 발현이 TBG 프로모터에 의해 매개되는 구조물을 사용하였다. 제 2 벡터의 투여 이후 7주째, 마우스를 마취시키고, 추가 분석을 위해 간을 수집하였다.

ARCUS 뉴클레아제의 표적 서열에 상응하는 영역에서 인델 수준은 차세대 시퀸싱 검정법에 의해 정량화하였다 (도 2a 및 도 2b). 결과는 2가지의 약한 프로모터 실험군 (TBG-S1-F113 및 TBG-S1-F140)에서 인델 백분율이 뉴클레아제 투여 이후 7주째 대략 40%임을 나타내어, 표적-내 활성이 유지됨을 시사하고 있다. 나머지 실험군에서, 표적-내 활성은 표적화가 60% 내지 70%인 TBG 대조군을 제외하고는 10% 이하이었다 (도 2a 및 도 2b (각각 선형 및 로그 척도)). 도 2c는 ELISA 검정법에 의해 결정되는, 처리군 당 혈청에서 재조합 PCSK9의 평균 수준을 나타낸다.

다음으로, 뉴클레아제 활성의 결과로서 게놈 DNA에서 표적-외 좌위의 수는 ITR-Seq로 불리는 NGS 기반의 방법을 사용하여 결정하였다. 간행물 Breton et al., ITR-Seq, a next-generation sequencing assay, identifies genome-wide DNA editing sites in vivo following adeno-associated viral vector-mediated genome editing, BMC Genomics (2020), 21: 239은 본원에 이의 전문이 참고문헌으로 통합된다. 약한 프로모터 실험군 모두의 경우 표적-외 좌위의 수에서 표적 외부의 수가 대략 160개인 TBG 대조군과 비교하여 감소가 있다 (도 3).

이들 벡터의 표적-외 활성을 측정하는 더욱 정량적인 접근법은 확인된 외부 표적의 하위집합에서 인델을 계산하는 것이다. 단지 TBG 대조군, TBG-S1-F113 및 TBG-S1-F140 실험군에서 이들이 가장 높은 인델%를 나타내기 때문에 분석을 수행하였다. 도 4는 확인된 외부 표적에 해당하는 게놈 위치 세트에서 인델을 나타낸다. 각 외부 표적에 대한 인델 수준을 TBG 대조군의 인델 수준 (임의 값 1)과 비교하여 나타낸다. 분석된 약한 프로모터 실험군에서 대략 20배의 인델 감소가 있었으며, 이들 프로모터의 사용이 뉴클레아제 표적-외 활성을 분명하게 감소시킴을 시사하고 있다.

주사를 맞은 마우스에서 hPCSK9 수준은 도 5에 나타낸다.

전반적으로, 이들 결과는 게놈 편집화 뉴클레아제의 발현을 매개하는데 약한 간-특이적 프로모터를 사용하는 것이 표적-내 활성을 유지하면서 이들의 표적-외 활성을 감소시키는 유망한 전략임을 나타낸다.

실시예 2 - NHP 파일럿 연구

외부 표적의 감소가 NHP에서 보존되는지 여부를 관찰하기 위하여, 레서스 머카크에게 6 × 10¹²개 GC/kg의 용량의 벡터를 처리하였다. 생검 데이터를 18일째 수집하였다 (최대 1년 추적될 것임). 벡터 투여 이후 28일 동안 매주 채혈, 다음으로 연구 종결 시까지 격주 채혈을 수행하였다. 테스트된 벡터는 AAV8.TBG.M2PCSK9 및 AAV8.TBG-S1-F113.M2PCSK9이었다. 다음의 연구를 수행하였다: AAV8 캡시드에 대한 항체 중화; CBC/화합물/응집/지질 패널; ELISA에 의한 PCSK9 발현의 혈청; IFN-g ELISPOT을 위해 8주마다 PBMC 분리; 18일 및 128일째 간 생검; 및 차세대 시퀸싱에 의한 표적-내 및 표적-외 게놈 편집화를 검출하는 DNA/RNA 분석.

도 7 내지 도 10에 나타낸 일부 테이터의 요약은 도 6에 나타낸다. 인델% (도 7) 및 외부 표적의 수 (도 8)는 AAV 처리-후 18일째 간 생검으로부터 나온 DNA에서 결정하였다. PCSK9 수준 (기저선 백분율로서)은 도 9에 나타낸다 (AAV 처리-후 7주째). LDL 수준 (기저선 백분율로서)은 도 10에 나타낸다.

본 발명자들은 처리된 NHP에서 PCSK9 및 LDL 수준의 유사한 감소를 관찰하였다. 약한 프로모터의 사용을 통해 ARCUS 뉴클레아제를 발현하는 것은 마우스 및 NHP에서 뉴클레아제 표적-외 활성을 PCSK9 유전자에 대한 이의 표적-내 활성을 유지하면서 감소시킨다.

실시예 3 - GLP 독성 연구

GLP 독성은 NHP (n = 27)에서 12일째 데이터 및 1년 동안의 추적으로 수행된다. 연구 설계는 도 11에 나타낸다. 서열번호 13에 나타낸 벡터 게놈을 포함하는 AAVhu37.TBG-S1-F113.M2PCSK9 벡터의 정맥 투여는 3회 용량, 1.2e12, 6.0e12, 3.0e13 중 1회에 제공하였다. 28일 동안 매주 채혈, 다음으로 연구 종결 시까지 격주 채혈을 수행하였다. 테스트된 벡터는 AAV8.TBG.M2PCSK9 및 AAV8.TBG-S1-F113.M2PCSK9이었다. 다음의 연구를 수행하였다: AAVhu.37 캡시드에 대한 항체 중화; CBC/화합물/응집/지질 패널; ELISA에 의한 PCSK9 발현의 혈청; IFN-g ELISPOT을 위해 8주마다 PBMC 분리; 모든 NHP에 대한 18일째 간 생검; 차세대 시퀸싱에 의한 표적-내 및 표적-외 게놈 편집화를 검출하는 DNA/RNA 분석; 실험군 당 3마리 NHP에 대한 28일째 부검 - 모든 주요 장기에 대한 조직병리학 및 생체분포; 및 실험군 당 마지막 3마리 NHP에 대한 180일 및 364일째 간 생검.

본 발명자들은 상기 설명된 연구와 같이 처리된 NHP에서 PCSK9 및 LDL 수준의 유사한 감소를 관찰할 것으로 예상한다. 본 발명자들은 약한 프로모터의 사용을 통해 ARCUS 뉴클레아제를 발현하는 것이 NHP에서 뉴클레아제 표적-외 활성을 PCSK9 유전자에 대한 이의 표적-내 활성을 유지하면서 감소시킬 것으로 예상한다.

본 명세서에서 인용된 모든 문서, 뿐만 아니라 Breton et al., Increasing the Specificity of AAV-Based Gene Editing through Self-Targeting and Short-Promoter Strategies, Mol. Ther. 2021년 3월, 3일, 29(3): 1047-1056. doi: 10.1016/j.ymthe.2020.12.028. Epub 2020년 12월 25일은 본원에 참고문헌으로 통합된다. 2020년 4월 27일에 제출된 미국 가특허출원 제 US 63/016,541호, 2020년 6월 2일에 제출된 미국 가특허출원 제 US 63/033,738호, 2020년 10월 9일에 제출된 미국 가특허출원 제 US 63/089,796호, 및 2020년 4월 27일에 제출된 미국 가특허출원 제 US 63/016,139호는 이들의 서열목록과 함께 이들의 전문이 본원에 참고문헌으로 통합된다. 본원과 함께 제출된 "20-9267PCT_Seq-Listing_ST25.txt"로 명명된 서열목록, 및 이의 서열 및 텍스트는 본원에 참고문헌으로 통합된다. 본 발명이 구체적인 구현예를 언급하면서 설명되었던 한편, 본 발명의 정신을 벗어나지 않고도 변형이 만들어질 수 있음을 이해할 것이다. 이러한 변형은 첨부된 청구항의 범위 내에 속하도록 의도된다.

SEQUENCE LISTING <110> The Trustees of the University of Pennsylvania <120> COMPOSITIONS AND METHODS FOR REDUCING NUCLEASE EXPRESSION AND OFF-TARGET ACTIVITY USING A PROMOTER WITH LOW TRANSCRIPTIONAL ACTIVITY <130> UPN-20-9267PCT <150> US 63/016,139 <151> 2020-04-27 <160> 25 <170> PatentIn version 3.5 <210> 1 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> CRE motif <400> 1 Leu Ala Gly Leu Ile Asp Ala Asp Gly 1 5 <210> 2 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> CRE Recognition sequence <400> 2 caaaacgtcg tgagacagtt tg 22 <210> 3 <211> 978 <212> DNA <213> Homo sapiens <400> 3 acctgaagag agaggaagct gtgggacagg tccagccaga gcccaggcca gaggggcaga 60 agctggagtc ctggagcaca gacgcaggtt gtcaggtgca cagagttgga gggtcccctg 120 ctggtcatgg ttggccatgg gggcacccag gagggatcag cgagctggct acacctaaaa 180 atcagtccaa agtccgaggt ccaaagagat aaataaaaac attgacaaat aagtcaaacg 240 gtccagcaac aaatggggac ccaaggatca ggcacattgt tttttttttt tttggagtat 300 tagcatacac tgtgacatga aagagtgtga gctcaatcat gtggccttgg actgggagag 360 ggcatttcct tctcagaggc aactaagccc tacctttgcc tcagtctggg ctctgtaatc 420 ctgctttgtg ctcatctccc caagactgat cacctggggg aagctggggt ggttcaaccc 480 tgcctgccct tccccaacat acagatggtg gcaggtaaca tggtgaaatc aaacagatct 540 ggtttttcat ccgcctatcc acccaggtga ccttggacaa tttatttagc ctctaggcct 600 cagtagtccc agggaagtaa taatcgctac ttcactattt taaggattat ataagatagg 660 gcatgtaagg tagctgacac acattcgccc atttcttcac gtgaattcag attctactga 720 attcagctct gcaccaagtc ccatcctctg ctgccctctg tttcagcaaa cactgaggcc 780 tgttgtttct cctcctctac cggctctgat gcggtcaagg tccagagagc tgagtagttg 840 gcaagcggac caccagcaac agacaacatc ttcattcggc tctccctgaa gctgtactgc 900 ctcgctgaga ggatgaaggt ctccgaggct gccctgtctc tccttgtcct catccttatc 960 attacttcgg cttctcgc 978 <210> 4 <211> 919 <212> DNA <213> Homo sapiens <400> 4 tttgcctcca attcttccac agcacatagt gcatctcaca taatatttat aatgttggag 60 tgcaattgtt tatgtactct ctcttactta ctcaactata agatccttga acttgtcaca 120 cacgttactt taggaactag catggaaaag gtcttcacaa atactatctg aaaaatcaat 180 aagccagtaa aagtaaacct ccatatgagc ttactcctct gcttttcatc accatctatt 240 ctgtccacat ttcaagcaat gtatttccag catgaatttg tggtgtgatt tgacatgaag 300 gagaacatca gtcaccaaaa tgaaaggatt gtaccacagt acccttattt tagtttaact 360 tcgacttttt tagattaact cttaatcaaa aattggtact taacaaggaa aaacttgcct 420 tctgttgttt tcagagaagt aaaaaaagca cctcaccttt gagtcgccaa aattatgctt 480 cctggaatga ccgcatacca tgtagcaggt ttattttagt ttgtttacag aaaagtgtag 540 accaaagtcc agtgctgact ttgggagcta ctaaagacat gaaaaagtag aattttaaac 600 acatttcatt gtaaacgact gggagtatct gagcaaatta tttcttacgt gactttagag 660 aaaacggcta cctatctgac cccaaaacga cttgaggaaa ctgtttccac ggtcctgctg 720 cagaggggaa gcacagtcgt caagaagaga gtggggtcag gatcaaaaca catttagtgt 780 gacttaggga aagaaaacat tttccctctt tgaacctctc tggatacagt cattttgcct 840 ctacttgagg atcaactgtt caacctcaat ggcctttcag gacctcctgg gtcacgctgg 900 tgacctgtgg agattccag 919 <210> 5 <211> 799 <212> DNA <213> Homo sapiens <400> 5 ttggatctca gagacgggca ccgactgccg agccccagac gaagtgcccc agggtcgggg 60 atcaggcttg tgcagggtag cacctgggga cctgagggac ctggaggcct tcttgtatcc 120 tgaagtagga ccttctaaga cttcatgagt cctggccccc ttgcaggggt tggggagctg 180 gggatcccag atctgcctat tgcgcccgat gccccgaggc tctctcttgg actctggccc 240 tgagttcttc tgcgcgatcc ttcggagacg tctggaggcc tgctttatgc atctctcttg 300 gacctcagtt tccccacacg tgggaggagg cagctggacg attcctgaaa ggactttccc 360 ttgcttcctc atcacgtgga agagagccca cccggcacct ggaaatggaa agccagtgaa 420 ggctgctttg ggccggggca gcgggtggga ccgggcggga gggattccaa agagaccgcc 480 gggaaggcta gagcttggaa ttccggctcc tcggagtcct ggccctcccc caccgccgcc 540 tcggagctca gcacaccttg gatgggggag gcaggcagct cctagccccg caccccagga 600 ggcgcgctcg gagggaagcc gccaccgcgc cgcctctgcc tcggcgcgga acaaacggtt 660 aaagattttg ggcagcgcct cgcgggggga ggagccaggg gcccaatccg caattaaaga 720 tgaactttgg gtgaactaat tgtctgacca aggtaacgtg ggcagcaacc tgggccgcct 780 ataaagcggc agcgccgtg 799 <210> 6 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> constructed sequence <400> 6 gagtgctcta gttttgcaat acaggacatg ctataaaaat ggaaagatgt tgctttctga 60 gaga 64 <210> 7 <211> 113 <212> DNA <213> Artificial Sequence <220> <223> constructed sequence <400> 7 ctttgaaaat accatcccag ggttaatgct ggggttaatt tataactaag agtgctctag 60 ttttgcaata caggacatgc tataaaaatg gaaagatgtt gctttctgag aga 113 <210> 8 <211> 140 <212> DNA <213> Artificial Sequence <220> <223> constructed sequence <400> 8 cctcttggcc ttggttttgt acatcagctt tgaaaatacc atcccagggt taatgctggg 60 gttaatttat aactaagagt gctctagttt tgcaatacag gacatgctat aaaaatggaa 120 agatgttgct ttctgagaga 140 <210> 9 <211> 2729 <212> DNA <213> Artificial Sequence <220> <223> constructed sequence <220> <221> misc_feature <222> (1)..(168) <223> ITR <220> <221> misc_feature <222> (206)..(1183) <223> CCL16 promoter <220> <221> misc_feature <222> (1193)..(2287) <223> PCS7-8L.197 CDS <220> <221> misc_feature <222> (2298)..(2512) <223> PolyA <220> <221> misc_feature <222> (2562)..(2729) <223> ITR <400> 9 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatcg gaattcgccc ttaagacctg aagagagagg aagctgtggg acaggtccag 240 ccagagccca ggccagaggg gcagaagctg gagtcctgga gcacagacgc aggttgtcag 300 gtgcacagag ttggagggtc ccctgctggt catggttggc catgggggca cccaggaggg 360 atcagcgagc tggctacacc taaaaatcag tccaaagtcc gaggtccaaa gagataaata 420 aaaacattga caaataagtc aaacggtcca gcaacaaatg gggacccaag gatcaggcac 480 attgtttttt ttttttttgg agtattagca tacactgtga catgaaagag tgtgagctca 540 atcatgtggc cttggactgg gagagggcat ttccttctca gaggcaacta agccctacct 600 ttgcctcagt ctgggctctg taatcctgct ttgtgctcat ctccccaaga ctgatcacct 660 gggggaagct ggggtggttc aaccctgcct gcccttcccc aacatacaga tggtggcagg 720 taacatggtg aaatcaaaca gatctggttt ttcatccgcc tatccaccca ggtgaccttg 780 gacaatttat ttagcctcta ggcctcagta gtcccaggga agtaataatc gctacttcac 840 tattttaagg attatataag atagggcatg taaggtagct gacacacatt cgcccatttc 900 ttcacgtgaa ttcagattct actgaattca gctctgcacc aagtcccatc ctctgctgcc 960 ctctgtttca gcaaacactg aggcctgttg tttctcctcc tctaccggct ctgatgcggt 1020 caaggtccag agagctgagt agttggcaag cggaccacca gcaacagaca acatcttcat 1080 tcggctctcc ctgaagctgt actgcctcgc tgagaggatg aaggtctccg aggctgccct 1140 gtctctcctt gtcctcatcc ttatcattac ttcggcttct cgcgcggccg ccatggcacc 1200 gaagaagaag cgcaaggtgc atatgaatac aaaatataat aaagagttct tactctactt 1260 agcagggttt gtagacggtg acggttccat ctttgccagg atcaagccta gtcaacgtag 1320 taagttcaag cacaagctgc atctcgtttt cgctgtctat cagaagacac agcgccgttg 1380 gttcctcgac aagctggtgg acgagatcgg tgtgggttac gtgctggact ctggcagcgt 1440 ctccttttac tcgctgtccg agatcaagcc tttgcataat tttttaacac aactacaacc 1500 ttttctaaaa ctaaaacaaa aacaagcaaa tttagtttta aaaattattg aacaacttcc 1560 gtcagcaaaa gaatccccgg acaaattctt agaagtttgt acatgggtgg atcaaattgc 1620 agctctgaat gattcgaaga cgcgtaaaac aacttctgaa accgttcgtg ctgtgctaga 1680 cagtttacca ggatccgtgg gaggtctatc gccatctcag gcatccagcg ccgcatcctc 1740 ggcttcctca agcccgggtt cagggatctc cgaagcactc agagctggag caggttccgg 1800 cactggatac aacaaggaat tcctgctcta cctggcgggc ttcgtcgacg gggacggctc 1860 catctatgcc cgtatcaagc cggttcagcg ggctaagttc aagcacgagc tggttctcgg 1920 gttcgatgtc actcagaaga cacagcgccg ttggttcctc gacaagctgg tggacgagat 1980 cggtgtgggt tacgtgtatg acaagggcag cgtctccgcg taccgtctgt cccagatcaa 2040 gcctctgcac aacttcctga cccagctcca gcccttcctg aagctcaagc agaagcaggc 2100 caacctcgtg ctgaagatca tcgagcagct gccctccgcc aaggaatccc cggacaagtt 2160 cctggaggtg tgcacctggg tggaccagat cgccgctctg aacgactcca agacccgcaa 2220 gaccacttcc gaaaccgtcc gcgccgttct agacagtctc tccgagaaga agaagtcgtc 2280 cccctaaggt acgatctgcc tcgactgtgc cttctagttg ccagccatct gttgtttgcc 2340 cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt tcctaataaa 2400 atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg ggtggggtgg 2460 ggcaggacag caagggggag gattgggaag acaatagcag gcatgctggg gactcgagtt 2520 aagggcgaat tcccgataag gatcttccta gagcatggct acgtagataa gtagcatggc 2580 gggttaatca ttaactacaa ggaaccccta gtgatggagt tggccactcc ctctctgcgc 2640 gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg 2700 gcggcctcag tgagcgagcg agcgcgcag 2729 <210> 10 <211> 2669 <212> DNA <213> Artificial Sequence <220> <223> constructed sequence <220> <221> misc_feature <222> (1)..(168) <223> ITR <220> <221> misc_feature <222> (206)..(1124) <223> SLC22A9 promoter <220> <221> misc_feature <222> (1133)..(2227) <223> PCS7-8L CDS <220> <221> misc_feature <222> (2238)..(2452) <223> BGH Poly A <220> <221> misc_feature <222> (2502)..(2669) <223> ITR <400> 10 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatcg gaattcgccc ttaagtttgc ctccaattct tccacagcac atagtgcatc 240 tcacataata tttataatgt tggagtgcaa ttgtttatgt actctctctt acttactcaa 300 ctataagatc cttgaacttg tcacacacgt tactttagga actagcatgg aaaaggtctt 360 cacaaatact atctgaaaaa tcaataagcc agtaaaagta aacctccata tgagcttact 420 cctctgcttt tcatcaccat ctattctgtc cacatttcaa gcaatgtatt tccagcatga 480 atttgtggtg tgatttgaca tgaaggagaa catcagtcac caaaatgaaa ggattgtacc 540 acagtaccct tattttagtt taacttcgac ttttttagat taactcttaa tcaaaaattg 600 gtacttaaca aggaaaaact tgccttctgt tgttttcaga gaagtaaaaa aagcacctca 660 cctttgagtc gccaaaatta tgcttcctgg aatgaccgca taccatgtag caggtttatt 720 ttagtttgtt tacagaaaag tgtagaccaa agtccagtgc tgactttggg agctactaaa 780 gacatgaaaa agtagaattt taaacacatt tcattgtaaa cgactgggag tatctgagca 840 aattatttct tacgtgactt tagagaaaac ggctacctat ctgaccccaa aacgacttga 900 ggaaactgtt tccacggtcc tgctgcagag gggaagcaca gtcgtcaaga agagagtggg 960 gtcaggatca aaacacattt agtgtgactt agggaaagaa aacattttcc ctctttgaac 1020 ctctctggat acagtcattt tgcctctact tgaggatcaa ctgttcaacc tcaatggcct 1080 ttcaggacct cctgggtcac gctggtgacc tgtggagatt ccagcggccg ccatggcacc 1140 gaagaagaag cgcaaggtgc atatgaatac aaaatataat aaagagttct tactctactt 1200 agcagggttt gtagacggtg acggttccat ctttgccagg atcaagccta gtcaacgtag 1260 taagttcaag cacaagctgc atctcgtttt cgctgtctat cagaagacac agcgccgttg 1320 gttcctcgac aagctggtgg acgagatcgg tgtgggttac gtgctggact ctggcagcgt 1380 ctccttttac tcgctgtccg agatcaagcc tttgcataat tttttaacac aactacaacc 1440 ttttctaaaa ctaaaacaaa aacaagcaaa tttagtttta aaaattattg aacaacttcc 1500 gtcagcaaaa gaatccccgg acaaattctt agaagtttgt acatgggtgg atcaaattgc 1560 agctctgaat gattcgaaga cgcgtaaaac aacttctgaa accgttcgtg ctgtgctaga 1620 cagtttacca ggatccgtgg gaggtctatc gccatctcag gcatccagcg ccgcatcctc 1680 ggcttcctca agcccgggtt cagggatctc cgaagcactc agagctggag caggttccgg 1740 cactggatac aacaaggaat tcctgctcta cctggcgggc ttcgtcgacg gggacggctc 1800 catctatgcc cgtatcaagc cggttcagcg ggctaagttc aagcacgagc tggttctcgg 1860 gttcgatgtc actcagaaga cacagcgccg ttggttcctc gacaagctgg tggacgagat 1920 cggtgtgggt tacgtgtatg acaagggcag cgtctccgcg taccgtctgt cccagatcaa 1980 gcctctgcac aacttcctga cccagctcca gcccttcctg aagctcaagc agaagcaggc 2040 caacctcgtg ctgaagatca tcgagcagct gccctccgcc aaggaatccc cggacaagtt 2100 cctggaggtg tgcacctggg tggaccagat cgccgctctg aacgactcca agacccgcaa 2160 gaccacttcc gaaaccgtcc gcgccgttct agacagtctc tccgagaaga agaagtcgtc 2220 cccctaaggt acgatctgcc tcgactgtgc cttctagttg ccagccatct gttgtttgcc 2280 cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt tcctaataaa 2340 atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg ggtggggtgg 2400 ggcaggacag caagggggag gattgggaag acaatagcag gcatgctggg gactcgagtt 2460 aagggcgaat tcccgataag gatcttccta gagcatggct acgtagataa gtagcatggc 2520 gggttaatca ttaactacaa ggaaccccta gtgatggagt tggccactcc ctctctgcgc 2580 gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg 2640 gcggcctcag tgagcgagcg agcgcgcag 2669 <210> 11 <211> 2549 <212> DNA <213> Artificial Sequence <220> <223> constructed sequence <220> <221> misc_feature <222> (1)..(168) <223> ITR <220> <221> misc_feature <222> (206)..(1004) <223> CYP26A1 - 1K promoter <220> <221> misc_feature <222> (1013)..(2107) <223> PCS7-8L CDS <220> <221> misc_feature <222> (2118)..(2332) <223> bGH Poly A <220> <221> misc_feature <222> (2382)..(2549) <223> ITR <400> 11 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatcg gaattcgccc ttaagttgga tctcagagac gggcaccgac tgccgagccc 240 cagacgaagt gccccagggt cggggatcag gcttgtgcag ggtagcacct ggggacctga 300 gggacctgga ggccttcttg tatcctgaag taggaccttc taagacttca tgagtcctgg 360 cccccttgca ggggttgggg agctggggat cccagatctg cctattgcgc ccgatgcccc 420 gaggctctct cttggactct ggccctgagt tcttctgcgc gatccttcgg agacgtctgg 480 aggcctgctt tatgcatctc tcttggacct cagtttcccc acacgtggga ggaggcagct 540 ggacgattcc tgaaaggact ttcccttgct tcctcatcac gtggaagaga gcccacccgg 600 cacctggaaa tggaaagcca gtgaaggctg ctttgggccg gggcagcggg tgggaccggg 660 cgggagggat tccaaagaga ccgccgggaa ggctagagct tggaattccg gctcctcgga 720 gtcctggccc tcccccaccg ccgcctcgga gctcagcaca ccttggatgg gggaggcagg 780 cagctcctag ccccgcaccc caggaggcgc gctcggaggg aagccgccac cgcgccgcct 840 ctgcctcggc gcggaacaaa cggttaaaga ttttgggcag cgcctcgcgg ggggaggagc 900 caggggccca atccgcaatt aaagatgaac tttgggtgaa ctaattgtct gaccaaggta 960 acgtgggcag caacctgggc cgcctataaa gcggcagcgc cgtgcggccg ccatggcacc 1020 gaagaagaag cgcaaggtgc atatgaatac aaaatataat aaagagttct tactctactt 1080 agcagggttt gtagacggtg acggttccat ctttgccagg atcaagccta gtcaacgtag 1140 taagttcaag cacaagctgc atctcgtttt cgctgtctat cagaagacac agcgccgttg 1200 gttcctcgac aagctggtgg acgagatcgg tgtgggttac gtgctggact ctggcagcgt 1260 ctccttttac tcgctgtccg agatcaagcc tttgcataat tttttaacac aactacaacc 1320 ttttctaaaa ctaaaacaaa aacaagcaaa tttagtttta aaaattattg aacaacttcc 1380 gtcagcaaaa gaatccccgg acaaattctt agaagtttgt acatgggtgg atcaaattgc 1440 agctctgaat gattcgaaga cgcgtaaaac aacttctgaa accgttcgtg ctgtgctaga 1500 cagtttacca ggatccgtgg gaggtctatc gccatctcag gcatccagcg ccgcatcctc 1560 ggcttcctca agcccgggtt cagggatctc cgaagcactc agagctggag caggttccgg 1620 cactggatac aacaaggaat tcctgctcta cctggcgggc ttcgtcgacg gggacggctc 1680 catctatgcc cgtatcaagc cggttcagcg ggctaagttc aagcacgagc tggttctcgg 1740 gttcgatgtc actcagaaga cacagcgccg ttggttcctc gacaagctgg tggacgagat 1800 cggtgtgggt tacgtgtatg acaagggcag cgtctccgcg taccgtctgt cccagatcaa 1860 gcctctgcac aacttcctga cccagctcca gcccttcctg aagctcaagc agaagcaggc 1920 caacctcgtg ctgaagatca tcgagcagct gccctccgcc aaggaatccc cggacaagtt 1980 cctggaggtg tgcacctggg tggaccagat cgccgctctg aacgactcca agacccgcaa 2040 gaccacttcc gaaaccgtcc gcgccgttct agacagtctc tccgagaaga agaagtcgtc 2100 cccctaaggt acgatctgcc tcgactgtgc cttctagttg ccagccatct gttgtttgcc 2160 cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt tcctaataaa 2220 atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg ggtggggtgg 2280 ggcaggacag caagggggag gattgggaag acaatagcag gcatgctggg gactcgagtt 2340 aagggcgaat tcccgataag gatcttccta gagcatggct acgtagataa gtagcatggc 2400 gggttaatca ttaactacaa ggaaccccta gtgatggagt tggccactcc ctctctgcgc 2460 gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg 2520 gcggcctcag tgagcgagcg agcgcgcag 2549 <210> 12 <211> 1817 <212> DNA <213> Artificial Sequence <220> <223> constructed sequence <220> <221> misc_feature <222> (1)..(168) <223> ITR <220> <221> misc_feature <222> (206)..(269) <223> TBG-S1-F64 promoter <220> <221> misc_feature <222> (281)..(1375) <223> PCS7-8 CDS <220> <221> misc_feature <222> (1386)..(1600) <223> bGH Poly A <220> <221> misc_feature <222> (1650)..(1817) <223> ITR <400> 12 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatcg gaattcgccc ttaaggagtg ctctagtttt gcaatacagg acatgctata 240 aaaatggaaa gatgttgctt tctgagagac agcggccgcc atggcaccga agaagaagcg 300 caaggtgcat atgaatacaa aatataataa agagttctta ctctacttag cagggtttgt 360 agacggtgac ggttccatct ttgccaggat caagcctagt caacgtagta agttcaagca 420 caagctgcat ctcgttttcg ctgtctatca gaagacacag cgccgttggt tcctcgacaa 480 gctggtggac gagatcggtg tgggttacgt gctggactct ggcagcgtct ccttttactc 540 gctgtccgag atcaagcctt tgcataattt tttaacacaa ctacaacctt ttctaaaact 600 aaaacaaaaa caagcaaatt tagttttaaa aattattgaa caacttccgt cagcaaaaga 660 atccccggac aaattcttag aagtttgtac atgggtggat caaattgcag ctctgaatga 720 ttcgaagacg cgtaaaacaa cttctgaaac cgttcgtgct gtgctagaca gtttaccagg 780 atccgtggga ggtctatcgc catctcaggc atccagcgcc gcatcctcgg cttcctcaag 840 cccgggttca gggatctccg aagcactcag agctggagca ggttccggca ctggatacaa 900 caaggaattc ctgctctacc tggcgggctt cgtcgacggg gacggctcca tctatgcccg 960 tatcaagccg gttcagcggg ctaagttcaa gcacgagctg gttctcgggt tcgatgtcac 1020 tcagaagaca cagcgccgtt ggttcctcga caagctggtg gacgagatcg gtgtgggtta 1080 cgtgtatgac aagggcagcg tctccgcgta ccgtctgtcc cagatcaagc ctctgcacaa 1140 cttcctgacc cagctccagc ccttcctgaa gctcaagcag aagcaggcca acctcgtgct 1200 gaagatcatc gagcagctgc cctccgccaa ggaatccccg gacaagttcc tggaggtgtg 1260 cacctgggtg gaccagatcg ccgctctgaa cgactccaag acccgcaaga ccacttccga 1320 aaccgtccgc gccgttctag acagtctctc cgagaagaag aagtcgtccc cctaaggtac 1380 gatctgcctc gactgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc 1440 cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg 1500 catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca 1560 agggggagga ttgggaagac aatagcaggc atgctgggga ctcgagttaa gggcgaattc 1620 ccgataagga tcttcctaga gcatggctac gtagataagt agcatggcgg gttaatcatt 1680 aactacaagg aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc 1740 actgaggccg ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg 1800 agcgagcgag cgcgcag 1817 <210> 13 <211> 1866 <212> DNA <213> Artificial Sequence <220> <223> constructed sequence <220> <221> misc_feature <222> (1)..(168) <223> ITR <220> <221> misc_feature <222> (206)..(318) <223> TBG-S1-F113 promoter <220> <221> misc_feature <222> (330)..(1424) <223> PCS7-8 CDS <220> <221> misc_feature <222> (1435)..(1649) <223> bGH Poly A <220> <221> misc_feature <222> (1699)..(1866) <223> ITR <400> 13 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatcg gaattcgccc ttaagctttg aaaataccat cccagggtta atgctggggt 240 taatttataa ctaagagtgc tctagttttg caatacagga catgctataa aaatggaaag 300 atgttgcttt ctgagagaca gcggccgcca tggcaccgaa gaagaagcgc aaggtgcata 360 tgaatacaaa atataataaa gagttcttac tctacttagc agggtttgta gacggtgacg 420 gttccatctt tgccaggatc aagcctagtc aacgtagtaa gttcaagcac aagctgcatc 480 tcgttttcgc tgtctatcag aagacacagc gccgttggtt cctcgacaag ctggtggacg 540 agatcggtgt gggttacgtg ctggactctg gcagcgtctc cttttactcg ctgtccgaga 600 tcaagccttt gcataatttt ttaacacaac tacaaccttt tctaaaacta aaacaaaaac 660 aagcaaattt agttttaaaa attattgaac aacttccgtc agcaaaagaa tccccggaca 720 aattcttaga agtttgtaca tgggtggatc aaattgcagc tctgaatgat tcgaagacgc 780 gtaaaacaac ttctgaaacc gttcgtgctg tgctagacag tttaccagga tccgtgggag 840 gtctatcgcc atctcaggca tccagcgccg catcctcggc ttcctcaagc ccgggttcag 900 ggatctccga agcactcaga gctggagcag gttccggcac tggatacaac aaggaattcc 960 tgctctacct ggcgggcttc gtcgacgggg acggctccat ctatgcccgt atcaagccgg 1020 ttcagcgggc taagttcaag cacgagctgg ttctcgggtt cgatgtcact cagaagacac 1080 agcgccgttg gttcctcgac aagctggtgg acgagatcgg tgtgggttac gtgtatgaca 1140 agggcagcgt ctccgcgtac cgtctgtccc agatcaagcc tctgcacaac ttcctgaccc 1200 agctccagcc cttcctgaag ctcaagcaga agcaggccaa cctcgtgctg aagatcatcg 1260 agcagctgcc ctccgccaag gaatccccgg acaagttcct ggaggtgtgc acctgggtgg 1320 accagatcgc cgctctgaac gactccaaga cccgcaagac cacttccgaa accgtccgcg 1380 ccgttctaga cagtctctcc gagaagaaga agtcgtcccc ctaaggtacg atctgcctcg 1440 actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc 1500 ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt 1560 ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat 1620 tgggaagaca atagcaggca tgctggggac tcgagttaag ggcgaattcc cgataaggat 1680 cttcctagag catggctacg tagataagta gcatggcggg ttaatcatta actacaagga 1740 acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca ctgaggccgg 1800 gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc 1860 gcgcag 1866 <210> 14 <211> 1893 <212> DNA <213> Artificial Sequence <220> <223> constructed sequence <220> <221> misc_feature <222> (1)..(168) <223> ITR <220> <221> misc_feature <222> (206)..(345) <223> TBG-S1-F140 <220> <221> misc_feature <222> (357)..(1451) <223> PCS7-8 CDS <220> <221> misc_feature <222> (1462)..(1676) <223> bGH PolyA <220> <221> misc_feature <222> (1726)..(1893) <223> ITR <400> 14 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatcg gaattcgccc ttaagcctct tggccttggt tttgtacatc agctttgaaa 240 ataccatccc agggttaatg ctggggttaa tttataacta agagtgctct agttttgcaa 300 tacaggacat gctataaaaa tggaaagatg ttgctttctg agagacagcg gccgccatgg 360 caccgaagaa gaagcgcaag gtgcatatga atacaaaata taataaagag ttcttactct 420 acttagcagg gtttgtagac ggtgacggtt ccatctttgc caggatcaag cctagtcaac 480 gtagtaagtt caagcacaag ctgcatctcg ttttcgctgt ctatcagaag acacagcgcc 540 gttggttcct cgacaagctg gtggacgaga tcggtgtggg ttacgtgctg gactctggca 600 gcgtctcctt ttactcgctg tccgagatca agcctttgca taatttttta acacaactac 660 aaccttttct aaaactaaaa caaaaacaag caaatttagt tttaaaaatt attgaacaac 720 ttccgtcagc aaaagaatcc ccggacaaat tcttagaagt ttgtacatgg gtggatcaaa 780 ttgcagctct gaatgattcg aagacgcgta aaacaacttc tgaaaccgtt cgtgctgtgc 840 tagacagttt accaggatcc gtgggaggtc tatcgccatc tcaggcatcc agcgccgcat 900 cctcggcttc ctcaagcccg ggttcaggga tctccgaagc actcagagct ggagcaggtt 960 ccggcactgg atacaacaag gaattcctgc tctacctggc gggcttcgtc gacggggacg 1020 gctccatcta tgcccgtatc aagccggttc agcgggctaa gttcaagcac gagctggttc 1080 tcgggttcga tgtcactcag aagacacagc gccgttggtt cctcgacaag ctggtggacg 1140 agatcggtgt gggttacgtg tatgacaagg gcagcgtctc cgcgtaccgt ctgtcccaga 1200 tcaagcctct gcacaacttc ctgacccagc tccagccctt cctgaagctc aagcagaagc 1260 aggccaacct cgtgctgaag atcatcgagc agctgccctc cgccaaggaa tccccggaca 1320 agttcctgga ggtgtgcacc tgggtggacc agatcgccgc tctgaacgac tccaagaccc 1380 gcaagaccac ttccgaaacc gtccgcgccg ttctagacag tctctccgag aagaagaagt 1440 cgtcccccta aggtacgatc tgcctcgact gtgccttcta gttgccagcc atctgttgtt 1500 tgcccctccc ccgtgccttc cttgaccctg gaaggtgcca ctcccactgt cctttcctaa 1560 taaaatgagg aaattgcatc gcattgtctg agtaggtgtc attctattct ggggggtggg 1620 gtggggcagg acagcaaggg ggaggattgg gaagacaata gcaggcatgc tggggactcg 1680 agttaagggc gaattcccga taaggatctt cctagagcat ggctacgtag ataagtagca 1740 tggcgggtta atcattaact acaaggaacc cctagtgatg gagttggcca ctccctctct 1800 gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc 1860 ccgggcggcc tcagtgagcg agcgagcgcg cag 1893 <210> 15 <211> 2625 <212> DNA <213> Artificial sequence <220> <223> PCSK7-8L.197 <220> <221> CDS <222> (1089)..(2183) <223> M2PCSK9 coding sequence <400> 15 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatcg gaattcgccc ttaagctagc aggttaattt ttaaaaagca gtcaaaagtc 240 caagtggccc ttggcagcat ttactctctc tgtttgctct ggttaataat ctcaggagca 300 caaacattcc agatccaggt taatttttaa aaagcagtca aaagtccaag tggcccttgg 360 cagcatttac tctctctgtt tgctctggtt aataatctca ggagcacaaa cattccagat 420 ccggcgcgcc agggctggaa gctacctttg acatcatttc ctctgcgaat gcatgtataa 480 tttctacaga acctattaga aaggatcacc cagcctctgc ttttgtacaa ctttccctta 540 aaaaactgcc aattccactg ctgtttggcc caatagtgag aactttttcc tgctgcctct 600 tggtgctttt gcctatggcc cctattctgc ctgctgaaga cactcttgcc agcatggact 660 taaacccctc cagctctgac aatcctcttt ctcttttgtt ttacatgaag ggtctggcag 720 ccaaagcaat cactcaaagt tcaaacctta tcattttttg ctttgttcct cttggccttg 780 gttttgtaca tcagctttga aaataccatc ccagggttaa tgctggggtt aatttataac 840 taagagtgct ctagttttgc aatacaggac atgctataaa aatggaaaga tgttgctttc 900 tgagagactg cagaagttgg tcgtgaggca ctgggcaggt aagtatcaag gttacaagac 960 aggtttaagg agaccaatag aaactgggct tgtcgagaca gagaagactc ttgcgtttct 1020 gataggcacc tattggtctt actgacatcc actttgcctt tctctccaca ggtgtccagg 1080 cggccgcc atg gca ccg aag aag aag cgc aag gtg cat atg aat aca aaa 1130 Met Ala Pro Lys Lys Lys Arg Lys Val His Met Asn Thr Lys 1 5 10 tat aat aaa gag ttc tta ctc tac tta gca ggg ttt gta gac ggt gac 1178 Tyr Asn Lys Glu Phe Leu Leu Tyr Leu Ala Gly Phe Val Asp Gly Asp 15 20 25 30 ggt tcc atc ttt gcc agg atc aag cct agt caa cgt agt aag ttc aag 1226 Gly Ser Ile Phe Ala Arg Ile Lys Pro Ser Gln Arg Ser Lys Phe Lys 35 40 45 cac aag ctg cat ctc gtt ttc gct gtc tat cag aag aca cag cgc cgt 1274 His Lys Leu His Leu Val Phe Ala Val Tyr Gln Lys Thr Gln Arg Arg 50 55 60 tgg ttc ctc gac aag ctg gtg gac gag atc ggt gtg ggt tac gtg ctg 1322 Trp Phe Leu Asp Lys Leu Val Asp Glu Ile Gly Val Gly Tyr Val Leu 65 70 75 gac tct ggc agc gtc tcc ttt tac tcg ctg tcc gag atc aag cct ttg 1370 Asp Ser Gly Ser Val Ser Phe Tyr Ser Leu Ser Glu Ile Lys Pro Leu 80 85 90 cat aat ttt tta aca caa cta caa cct ttt cta aaa cta aaa caa aaa 1418 His Asn Phe Leu Thr Gln Leu Gln Pro Phe Leu Lys Leu Lys Gln Lys 95 100 105 110 caa gca aat tta gtt tta aaa att att gaa caa ctt ccg tca gca aaa 1466 Gln Ala Asn Leu Val Leu Lys Ile Ile Glu Gln Leu Pro Ser Ala Lys 115 120 125 gaa tcc ccg gac aaa ttc tta gaa gtt tgt aca tgg gtg gat caa att 1514 Glu Ser Pro Asp Lys Phe Leu Glu Val Cys Thr Trp Val Asp Gln Ile 130 135 140 gca gct ctg aat gat tcg aag acg cgt aaa aca act tct gaa acc gtt 1562 Ala Ala Leu Asn Asp Ser Lys Thr Arg Lys Thr Thr Ser Glu Thr Val 145 150 155 cgt gct gtg cta gac agt tta cca gga tcc gtg gga ggt cta tcg cca 1610 Arg Ala Val Leu Asp Ser Leu Pro Gly Ser Val Gly Gly Leu Ser Pro 160 165 170 tct cag gca tcc agc gcc gca tcc tcg gct tcc tca agc ccg ggt tca 1658 Ser Gln Ala Ser Ser Ala Ala Ser Ser Ala Ser Ser Ser Pro Gly Ser 175 180 185 190 ggg atc tcc gaa gca ctc aga gct gga gca ggt tcc ggc act gga tac 1706 Gly Ile Ser Glu Ala Leu Arg Ala Gly Ala Gly Ser Gly Thr Gly Tyr 195 200 205 aac aag gaa ttc ctg ctc tac ctg gcg ggc ttc gtc gac ggg gac ggc 1754 Asn Lys Glu Phe Leu Leu Tyr Leu Ala Gly Phe Val Asp Gly Asp Gly 210 215 220 tcc atc tat gcc cgt atc aag ccg gtt cag cgg gct aag ttc aag cac 1802 Ser Ile Tyr Ala Arg Ile Lys Pro Val Gln Arg Ala Lys Phe Lys His 225 230 235 gag ctg gtt ctc ggg ttc gat gtc act cag aag aca cag cgc cgt tgg 1850 Glu Leu Val Leu Gly Phe Asp Val Thr Gln Lys Thr Gln Arg Arg Trp 240 245 250 ttc ctc gac aag ctg gtg gac gag atc ggt gtg ggt tac gtg tat gac 1898 Phe Leu Asp Lys Leu Val Asp Glu Ile Gly Val Gly Tyr Val Tyr Asp 255 260 265 270 aag ggc agc gtc tcc gcg tac cgt ctg tcc cag atc aag cct ctg cac 1946 Lys Gly Ser Val Ser Ala Tyr Arg Leu Ser Gln Ile Lys Pro Leu His 275 280 285 aac ttc ctg acc cag ctc cag ccc ttc ctg aag ctc aag cag aag cag 1994 Asn Phe Leu Thr Gln Leu Gln Pro Phe Leu Lys Leu Lys Gln Lys Gln 290 295 300 gcc aac ctc gtg ctg aag atc atc gag cag ctg ccc tcc gcc aag gaa 2042 Ala Asn Leu Val Leu Lys Ile Ile Glu Gln Leu Pro Ser Ala Lys Glu 305 310 315 tcc ccg gac aag ttc ctg gag gtg tgc acc tgg gtg gac cag atc gcc 2090 Ser Pro Asp Lys Phe Leu Glu Val Cys Thr Trp Val Asp Gln Ile Ala 320 325 330 gct ctg aac gac tcc aag acc cgc aag acc act tcc gaa acc gtc cgc 2138 Ala Leu Asn Asp Ser Lys Thr Arg Lys Thr Thr Ser Glu Thr Val Arg 335 340 345 350 gcc gtt cta gac agt ctc tcc gag aag aag aag tcg tcc ccc taa 2183 Ala Val Leu Asp Ser Leu Ser Glu Lys Lys Lys Ser Ser Pro 355 360 ggtacgatct gcctcgactg tgccttctag ttgccagcca tctgttgttt gcccctcccc 2243 cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc ctttcctaat aaaatgagga 2303 aattgcatcg cattgtctga gtaggtgtca ttctattctg gggggtgggg tggggcagga 2363 cagcaagggg gaggattggg aagacaatag caggcatgct ggggactcga gttaagggcg 2423 aattcccgat aaggatcttc ctagagcatg gctacgtaga taagtagcat ggcgggttaa 2483 tcattaacta caaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct 2543 cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct 2603 cagtgagcga gcgagcgcgc ag 2625 <210> 16 <211> 364 <212> PRT <213> Artificial sequence <220> <223> Synthetic Construct <400> 16 Met Ala Pro Lys Lys Lys Arg Lys Val His Met Asn Thr Lys Tyr Asn 1 5 10 15 Lys Glu Phe Leu Leu Tyr Leu Ala Gly Phe Val Asp Gly Asp Gly Ser 20 25 30 Ile Phe Ala Arg Ile Lys Pro Ser Gln Arg Ser Lys Phe Lys His Lys 35 40 45 Leu His Leu Val Phe Ala Val Tyr Gln Lys Thr Gln Arg Arg Trp Phe 50 55 60 Leu Asp Lys Leu Val Asp Glu Ile Gly Val Gly Tyr Val Leu Asp Ser 65 70 75 80 Gly Ser Val Ser Phe Tyr Ser Leu Ser Glu Ile Lys Pro Leu His Asn 85 90 95 Phe Leu Thr Gln Leu Gln Pro Phe Leu Lys Leu Lys Gln Lys Gln Ala 100 105 110 Asn Leu Val Leu Lys Ile Ile Glu Gln Leu Pro Ser Ala Lys Glu Ser 115 120 125 Pro Asp Lys Phe Leu Glu Val Cys Thr Trp Val Asp Gln Ile Ala Ala 130 135 140 Leu Asn Asp Ser Lys Thr Arg Lys Thr Thr Ser Glu Thr Val Arg Ala 145 150 155 160 Val Leu Asp Ser Leu Pro Gly Ser Val Gly Gly Leu Ser Pro Ser Gln 165 170 175 Ala Ser Ser Ala Ala Ser Ser Ala Ser Ser Ser Pro Gly Ser Gly Ile 180 185 190 Ser Glu Ala Leu Arg Ala Gly Ala Gly Ser Gly Thr Gly Tyr Asn Lys 195 200 205 Glu Phe Leu Leu Tyr Leu Ala Gly Phe Val Asp Gly Asp Gly Ser Ile 210 215 220 Tyr Ala Arg Ile Lys Pro Val Gln Arg Ala Lys Phe Lys His Glu Leu 225 230 235 240 Val Leu Gly Phe Asp Val Thr Gln Lys Thr Gln Arg Arg Trp Phe Leu 245 250 255 Asp Lys Leu Val Asp Glu Ile Gly Val Gly Tyr Val Tyr Asp Lys Gly 260 265 270 Ser Val Ser Ala Tyr Arg Leu Ser Gln Ile Lys Pro Leu His Asn Phe 275 280 285 Leu Thr Gln Leu Gln Pro Phe Leu Lys Leu Lys Gln Lys Gln Ala Asn 290 295 300 Leu Val Leu Lys Ile Ile Glu Gln Leu Pro Ser Ala Lys Glu Ser Pro 305 310 315 320 Asp Lys Phe Leu Glu Val Cys Thr Trp Val Asp Gln Ile Ala Ala Leu 325 330 335 Asn Asp Ser Lys Thr Arg Lys Thr Thr Ser Glu Thr Val Arg Ala Val 340 345 350 Leu Asp Ser Leu Ser Glu Lys Lys Lys Ser Ser Pro 355 360 <210> 17 <211> 2214 <212> DNA <213> adeno-associated virus rh79 <220> <221> CDS <222> (1)..(2214) <400> 17 atg gct gct gac ggt tat ctt cca gat tgg ctc gag gac aac ctc tct 48 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 gag ggc att cgc gag tgg tgg gac ctg aaa cct gga gcc ccc aag ccc 96 Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 aag gcc aac cag cag aag cag gac gac ggc cgg ggt ctg gtg ctt cct 144 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 ggc tac aag tac ctc gga ccc ttc aac gga ctc gac aag ggg gag ccc 192 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 gtc aac gag gcg gac gcc gcg gcc ctc gag cac gac aag gcc tac gac 240 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 cag cag ctc aaa gcg ggt gac aat ccg tac ctg cgg tat aac cac gcc 288 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 gac gcc gag ttt cag gag cgt ctg caa gaa gat acg tct ttt ggg ggc 336 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 aac ctc ggg cga gca gtc ttc cag gcc aag aag cgg gtt ctc gaa cct 384 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 ctc ggt ctg gtt gag gaa gct gct aag acg gct cct gga aag aag aga 432 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 ccg gta gaa ccg tca cct cag cga tcc ccc gac tcc tcc acg ggc atc 480 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 ggc aaa aaa ggc cag cag ccc gcg aga aag aga ctg aac ttt ggg cag 528 Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln 165 170 175 act ggc gac tca gag tca gtc ccc gac cct caa cca atc gga gaa cca 576 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro 180 185 190 cca gca ggc ccc tct ggt ctg gga tct ggt aca atg gct gca ggc ggt 624 Pro Ala Gly Pro Ser Gly Leu Gly Ser Gly Thr Met Ala Ala Gly Gly 195 200 205 ggc gct cca atg gca gac aat aac gaa ggc gcc gac gga gtg ggt agt 672 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 tcc tca gga aat tgg cat tgc gat tcc aca tgg ctg ggc gac aga gtc 720 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 atc acc acc agc acc cga acc tgg gcc ctg ccc acc tac aac aac cac 768 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 ctc tac aag caa atc tcc aat ggg aca tcg gga gga agc acc aac gac 816 Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp 260 265 270 aac acc tac ttc ggc tac agc acc ccc tgg ggg tat ttt gac ttc aac 864 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 aga ttc cac tgt cac ttc tca cca cgt gac tgg cag aga ctc atc aac 912 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 aac aac tgg gga ttc cgg ccc aag aga ctc agc ttc aag ctc ttc aac 960 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn 305 310 315 320 atc cag gtt aag gag gtc acg cag aat gaa ggc acc aag acc atc gcc 1008 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 aat aac ctt acc agc acg att cag gta ttt acg gac tcg gaa tac cag 1056 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 ctg ccg tac gtc ctc ggc tcc gcg cac cag ggc tgc ctg cct ccg ttc 1104 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 ccg gcg gat gtc ttc atg att ccc cag tac ggc tac ctg aca ctg aac 1152 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 aac gga agt caa gcc gta ggc cgt tcc tca ttc tac tgc ctg gaa tat 1200 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 ttt cca tct caa atg ctg cgg act gga aac aac ttt gaa ttt agc tac 1248 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr 405 410 415 acc ttt gag gac gtg ccc ttc cac agc agc tac gca cac agc cag agc 1296 Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 ctg gac cgg ctg atg aac cct ctc atc gac cag tac ctg tat tac cta 1344 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 tcc aga act cag tcc aca gga gga act caa ggt aca cag caa ttg tta 1392 Ser Arg Thr Gln Ser Thr Gly Gly Thr Gln Gly Thr Gln Gln Leu Leu 450 455 460 ttt tct caa gcc ggg cct gca aat atg tcg gct cag gcc aag aac tgg 1440 Phe Ser Gln Ala Gly Pro Ala Asn Met Ser Ala Gln Ala Lys Asn Trp 465 470 475 480 cta cct gga cct tgc tac cgg cag cag cga gtc tcc acg aca ctg tcg 1488 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser 485 490 495 caa aac aac aac agc aac ttt gct tgg act ggt gcc acg aaa tat cat 1536 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His 500 505 510 ctg aac gga aga gac tct ttg gtg aat ccc ggt gtt gct atg gca acg 1584 Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr 515 520 525 cat aag gac gac gag gaa cgt ttc ttt cca tcg agc gga gtc ctg atg 1632 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met 530 535 540 ttt gga aaa cag ggt gct gga aga gac aat gtg gac tat agc agc gtt 1680 Phe Gly Lys Gln Gly Ala Gly Arg Asp Asn Val Asp Tyr Ser Ser Val 545 550 555 560 atg cta acc agc gag gaa gaa atc aag acc act aac cct gta gcc act 1728 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 gaa caa tac ggc gtg gtg gct gat aac ttg cag caa acc aat aca gga 1776 Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Thr Asn Thr Gly 580 585 590 cct atc gtg gga aat gtc aac agc caa gga gcc tta cct ggc atg gtc 1824 Pro Ile Val Gly Asn Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 tgg cag aac cga gac gtg tac ctg cag ggt ccc att tgg gcc aag att 1872 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 cct cac acg gac ggc aac ttt cac ccg tct cct ctg atg ggc ggc ttt 1920 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 gga ctg aaa cac ccg cct cct caa atc ctg atc aag aac act ccc gtt 1968 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 cct gcg gat cct cca acg acg ttc agc cag gcg aaa ttg gct tcc ttc 2016 Pro Ala Asp Pro Pro Thr Thr Phe Ser Gln Ala Lys Leu Ala Ser Phe 660 665 670 atc acg cag tat agt acc ggc cag gtc agc gtg gag atc gag tgg gag 2064 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 ctg cag aag gag aac agc aag cgc tgg aac cca gaa att cag tat act 2112 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 tcc aac tac tac aaa tct aca aat gtg gac ttt gct gtc aat acc gag 2160 Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 ggt aca tat tca gag cct cgc ccc att gga act cgt tac ctc acc cgt 2208 Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 aat ctg 2214 Asn Leu <210> 18 <211> 738 <212> PRT <213> adeno-associated virus rh79 <400> 18 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln 165 170 175 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro 180 185 190 Pro Ala Gly Pro Ser Gly Leu Gly Ser Gly Thr Met Ala Ala Gly Gly 195 200 205 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp 260 265 270 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn 305 310 315 320 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr 405 410 415 Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 Ser Arg Thr Gln Ser Thr Gly Gly Thr Gln Gly Thr Gln Gln Leu Leu 450 455 460 Phe Ser Gln Ala Gly Pro Ala Asn Met Ser Ala Gln Ala Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser 485 490 495 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His 500 505 510 Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr 515 520 525 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met 530 535 540 Phe Gly Lys Gln Gly Ala Gly Arg Asp Asn Val Asp Tyr Ser Ser Val 545 550 555 560 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Thr Asn Thr Gly 580 585 590 Pro Ile Val Gly Asn Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 Pro Ala Asp Pro Pro Thr Thr Phe Ser Gln Ala Lys Leu Ala Ser Phe 660 665 670 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 Asn Leu <210> 19 <211> 2214 <212> DNA <213> adeno-associated virus 8 <220> <221> CDS <222> (1)..(2214) <400> 19 atg gct gcc gat ggt tat ctt cca gat tgg ctc gag gac aac ctc tct 48 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 gag ggc att cgc gag tgg tgg gcg ctg aaa cct gga gcc ccg aag ccc 96 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 aaa gcc aac cag caa aag cag gac gac ggc cgg ggt ctg gtg ctt cct 144 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 ggc tac aag tac ctc gga ccc ttc aac gga ctc gac aag ggg gag ccc 192 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 gtc aac gcg gcg gac gca gcg gcc ctc gag cac gac aag gcc tac gac 240 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 cag cag ctg cag gcg ggt gac aat ccg tac ctg cgg tat aac cac gcc 288 Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 gac gcc gag ttt cag gag cgt ctg caa gaa gat acg tct ttt ggg ggc 336 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 aac ctc ggg cga gca gtc ttc cag gcc aag aag cgg gtt ctc gaa cct 384 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 ctc ggt ctg gtt gag gaa ggc gct aag acg gct cct gga aag aag aga 432 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 ccg gta gag cca tca ccc cag cgt tct cca gac tcc tct acg ggc atc 480 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 ggc aag aaa ggc caa cag ccc gcc aga aaa aga ctc aat ttt ggt cag 528 Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln 165 170 175 act ggc gac tca gag tca gtt cca gac cct caa cct ctc gga gaa cct 576 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro 180 185 190 cca gca gcg ccc tct ggt gtg gga cct aat aca atg gct gca ggc ggt 624 Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly 195 200 205 ggc gca cca atg gca gac aat aac gaa ggc gcc gac gga gtg ggt agt 672 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 tcc tcg gga aat tgg cat tgc gat tcc aca tgg ctg ggc gac aga gtc 720 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 atc acc acc agc acc cga acc tgg gcc ctg ccc acc tac aac aac cac 768 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 ctc tac aag caa atc tcc aac ggg aca tcg gga gga gcc acc aac gac 816 Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ala Thr Asn Asp 260 265 270 aac acc tac ttc ggc tac agc acc ccc tgg ggg tat ttt gac ttt aac 864 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 aga ttc cac tgc cac ttt tca cca cgt gac tgg cag cga ctc atc aac 912 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 aac aac tgg gga ttc cgg ccc aag aga ctc agc ttc aag ctc ttc aac 960 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn 305 310 315 320 atc cag gtc aag gag gtc acg cag aat gaa ggc acc aag acc atc gcc 1008 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 aat aac ctc acc agc acc atc cag gtg ttt acg gac tcg gag tac cag 1056 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 ctg ccg tac gtt ctc ggc tct gcc cac cag ggc tgc ctg cct ccg ttc 1104 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 ccg gcg gac gtg ttc atg att ccc cag tac ggc tac cta aca ctc aac 1152 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 aac ggt agt cag gcc gtg gga cgc tcc tcc ttc tac tgc ctg gaa tac 1200 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 ttt cct tcg cag atg ctg aga acc ggc aac aac ttc cag ttt act tac 1248 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr 405 410 415 acc ttc gag gac gtg cct ttc cac agc agc tac gcc cac agc cag agc 1296 Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 ttg gac cgg ctg atg aat cct ctg att gac cag tac ctg tac tac ttg 1344 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 tct cgg act caa aca aca gga ggc acg gca aat acg cag act ctg ggc 1392 Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly 450 455 460 ttc agc caa ggt ggg cct aat aca atg gcc aat cag gca aag aac tgg 1440 Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp 465 470 475 480 ctg cca gga ccc tgt tac cgc caa caa cgc gtc tca acg aca acc ggg 1488 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly 485 490 495 caa aac aac aat agc aac ttt gcc tgg act gct ggg acc aaa tac cat 1536 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His 500 505 510 ctg aat gga aga aat tca ttg gct aat cct ggc atc gct atg gca aca 1584 Leu Asn Gly Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr 515 520 525 cac aaa gac gac gag gag cgt ttt ttt ccc agt aac ggg atc ctg att 1632 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Gly Ile Leu Ile 530 535 540 ttt ggc aaa caa aat gct gcc aga gac aat gcg gat tac agc gat gtc 1680 Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val 545 550 555 560 atg ctc acc agc gag gaa gaa atc aaa acc act aac cct gtg gct aca 1728 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 gag gaa tac ggt atc gtg gca gat aac ttg cag cag caa aac acg gct 1776 Glu Glu Tyr Gly Ile Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala 580 585 590 cct caa att gga act gtc aac agc cag ggg gcc tta ccc ggt atg gtc 1824 Pro Gln Ile Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 tgg cag aac cgg gac gtg tac ctg cag ggt ccc atc tgg gcc aag att 1872 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 cct cac acg gac ggc aac ttc cac ccg tct ccg ctg atg ggc ggc ttt 1920 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 ggc ctg aaa cat cct ccg cct cag atc ctg atc aag aac acg cct gta 1968 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 cct gcg gat cct ccg acc acc ttc aac cag tca aag ctg aac tct ttc 2016 Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe 660 665 670 atc acg caa tac agc acc gga cag gtc agc gtg gaa att gaa tgg gag 2064 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 ctg cag aag gaa aac agc aag cgc tgg aac ccc gag atc cag tac acc 2112 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 tcc aac tac tac aaa tct aca agt gtg gac ttt gct gtt aat aca gaa 2160 Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 ggc gtg tac tct gaa ccc cgc ccc att ggc acc cgt tac ctc acc cgt 2208 Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 aat ctg 2214 Asn Leu <210> 20 <211> 738 <212> PRT <213> adeno-associated virus 8 <400> 20 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln 165 170 175 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro 180 185 190 Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly 195 200 205 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ala Thr Asn Asp 260 265 270 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn 305 310 315 320 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr 405 410 415 Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly 450 455 460 Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly 485 490 495 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His 500 505 510 Leu Asn Gly Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr 515 520 525 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Gly Ile Leu Ile 530 535 540 Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val 545 550 555 560 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 Glu Glu Tyr Gly Ile Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala 580 585 590 Pro Gln Ile Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe 660 665 670 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 Asn Leu <210> 21 <211> 2214 <212> DNA <213> adeno-associated virus hu37 <220> <221> CDS <222> (1)..(2214) <400> 21 atg gct gct gac ggt tat ctt cca gat tgg ctc gag gac aac ctc tct 48 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 gag ggc att cgc gag tgg tgg gac ctg aaa cct gga gcc ccc aag ccc 96 Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 aag gcc aac cag cag aag cag gac gac ggc cgg ggt ctg gtg ctt cct 144 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 ggc tac aag tac ctc gga ccc ttc aac gga ctc gac aag ggg gag ccc 192 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 gtc aac gcg gcg gac gca gcg gcc ctc gag cac gac aag gcc tac gac 240 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 cag cag ctc aaa gcg ggt gac aat ccg tac ctg cgg tat aac cac gcc 288 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 gac gcc gag ttt cag gag cgt ctg caa gaa gat acg tct ttt ggg ggc 336 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 aac ctc ggg cga gca gtc ttc cag gcc aag aag cgg gtt ctc gaa cct 384 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 ctc ggt ctg gtt gag gaa gct gct aag acg gct cct gga aag aag aga 432 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 ccg gta gaa ccg tca cct cag cgt tcc ccc gac tcc tcc acg ggc atc 480 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 ggc aag aaa ggc cag cag ccc gct aaa aag aga ctg aac ttt ggt cag 528 Gly Lys Lys Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln 165 170 175 act ggc gac tca gag tca gtc ccc gac cct caa cca atc gga gaa cca 576 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro 180 185 190 cca gca ggc ccc tct ggt ctg gga tct ggt aca atg gct gca ggc ggt 624 Pro Ala Gly Pro Ser Gly Leu Gly Ser Gly Thr Met Ala Ala Gly Gly 195 200 205 ggc gct cca atg gca gac aat aac gaa ggc gcc gac gga gtg ggt agt 672 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 tcc tca gga aat tgg cat tgc gat tcc aca tgg ctg ggc gac aga gtc 720 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 atc acc acc agc acc cga acc tgg gcc ctg ccc acc tac aac aac cac 768 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 ctc tac aag caa ata tcc aat ggg aca tcg gga gga agc acc aac gac 816 Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp 260 265 270 aac acc tac ttc ggc tac agc acc ccc tgg ggg tat ttt gac ttc aac 864 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 aga ttc cac tgc cac ttc tca cca cgt gac tgg cag cga ctc atc aac 912 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 aac aac tgg gga ttc cgg cca aaa aga ctc agc ttc aag ctc ttc aac 960 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn 305 310 315 320 atc cag gtc aag gag gtc acg cag aat gaa ggc acc aag acc atc gcc 1008 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 aat aac ctt acc agc acg att cag gta ttt acg gac tcg gaa tac cag 1056 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 ctg ccg tac gtc ctc ggc tcc gcg cac cag ggc tgc ctg cct ccg ttc 1104 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 ccg gcg gac gtc ttc atg att ccc cag tac ggc tac ctt aca ctg aac 1152 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 aat gga agt caa gcc gta ggc cgt tcc tcc ttc tac tgc ctg gaa tat 1200 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 ttt cca tct caa atg ctg cga act gga aac aat ttt gaa ttc agc tac 1248 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr 405 410 415 acc ttc gag gac gtg cct ttc cac agc agc tac gca cac agc cag agc 1296 Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 ttg gac cga ctg atg aat cct ctc atc gac cag tac ctg tac tac tta 1344 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 tcc aga act cag tcc aca gga gga act caa ggt acc cag caa ttg tta 1392 Ser Arg Thr Gln Ser Thr Gly Gly Thr Gln Gly Thr Gln Gln Leu Leu 450 455 460 ttt tct caa gct ggg cct gca aac atg tcg gct cag gct aag aac tgg 1440 Phe Ser Gln Ala Gly Pro Ala Asn Met Ser Ala Gln Ala Lys Asn Trp 465 470 475 480 cta cct gga cct tgc tac cgg cag cag cga gtc tct acg aca ctg tcg 1488 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser 485 490 495 caa aac aac aac agc aac ttt gct tgg act ggt gcc acc aaa tat cac 1536 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His 500 505 510 ctg aac gga aga gac tct ttg gta aat ccc ggt gtc gcc atg gca acc 1584 Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr 515 520 525 cac aag gac gac gag gaa cgc ttc ttc ccg tcg agt gga gtc ctg atg 1632 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met 530 535 540 ttc gga aaa cag ggt gct gga aga gac aat gtg gac tac agc agc gtt 1680 Phe Gly Lys Gln Gly Ala Gly Arg Asp Asn Val Asp Tyr Ser Ser Val 545 550 555 560 atg cta acc agc gaa gaa gaa att aaa acc act aac ccc gta gcc aca 1728 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 gaa caa tac ggt gtg gtg gct gac aac ttg cag caa acc aat aca ggg 1776 Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Thr Asn Thr Gly 580 585 590 cct att gtg gga aat gtc aac agc caa gga gcc tta cct ggc atg gtc 1824 Pro Ile Val Gly Asn Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 tgg cag aac cga gac gtg tac ctg cag ggt ccc atc tgg gcc aag att 1872 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 cct cac acg gac ggc aac ttc cac cct tca ccg cta atg gga gga ttt 1920 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 gga ctg aag cac cca cct cct cag atc ctg atc aag aac acg ccg gta 1968 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 cct gcg gat cct cca aca acg ttc agc cag gcg aaa ttg gct tcc ttc 2016 Pro Ala Asp Pro Pro Thr Thr Phe Ser Gln Ala Lys Leu Ala Ser Phe 660 665 670 att acg cag tac agc acc gga cag gtc agc gtg gaa atc gag tgg gag 2064 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 ctg cag aag gag aac agc aaa cgc tgg aac cca gag att cag tac act 2112 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 tca aac tac tac aaa tct aca aat gtg gac ttt gct gtc aat aca gag 2160 Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 gga act tat tct gag cct cgc ccc att ggt act cgt tac ctc acc cgt 2208 Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 aat ctg 2214 Asn Leu <210> 22 <211> 738 <212> PRT <213> adeno-associated virus hu37 <400> 22 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 Gly Lys Lys Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln 165 170 175 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro 180 185 190 Pro Ala Gly Pro Ser Gly Leu Gly Ser Gly Thr Met Ala Ala Gly Gly 195 200 205 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp 260 265 270 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn 305 310 315 320 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr 405 410 415 Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 Ser Arg Thr Gln Ser Thr Gly Gly Thr Gln Gly Thr Gln Gln Leu Leu 450 455 460 Phe Ser Gln Ala Gly Pro Ala Asn Met Ser Ala Gln Ala Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser 485 490 495 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His 500 505 510 Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr 515 520 525 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met 530 535 540 Phe Gly Lys Gln Gly Ala Gly Arg Asp Asn Val Asp Tyr Ser Ser Val 545 550 555 560 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Thr Asn Thr Gly 580 585 590 Pro Ile Val Gly Asn Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 Pro Ala Asp Pro Pro Thr Thr Phe Ser Gln Ala Lys Leu Ala Ser Phe 660 665 670 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 Asn Leu <210> 23 <211> 2217 <212> DNA <213> adeno-associated virus rh.90 <220> <221> CDS <222> (1)..(2217) <400> 23 atg gct gcc gat ggt tat ctt cca gat tgg ctc gag gac aac ctc tct 48 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 gag ggc att cgc gag tgg tgg gac ctg aaa cct gga gcc cca aaa ccc 96 Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 aaa gcc aac cag caa aag cag gac gac ggc cgg ggt ctg gtg ctt cct 144 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 ggc tac aag tac ctc gga ccc ttc aac gga ctc gac aag ggg gag ccc 192 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 gtc aac gcg gcg gac gca gcg gcc ctc gag cac gac aag gcc tac gac 240 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 cag cag ctg cag gcg ggt gat aat ccg tac ctg cgg tat aac cac gcc 288 Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 gac gcc gag ttt cag gag cgt ctg caa gaa gat acg tca ttt ggg ggc 336 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 aac ctc ggg cga gca gtc ttc cag gcc aag aag cgg gtt ctc gaa cct 384 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 ctc ggt ctg gtt gag gaa ggc gct aag acg gct cct gga aag aag aga 432 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 ccg gta gag cca tca cca cag cgt tcc ccc gac tcc tcc acg ggc atc 480 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 ggc aag aaa ggc cag cag ccc gcc aga aag aga ctc aat ttc ggt cag 528 Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln 165 170 175 act ggc gac tca gag tca gtc ccc gac cct caa cct ctc gga gaa cct 576 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro 180 185 190 cca gca gcg ccc tct agt gtg gga tct ggt aca atg gct gca ggc ggt 624 Pro Ala Ala Pro Ser Ser Val Gly Ser Gly Thr Met Ala Ala Gly Gly 195 200 205 ggc gca cca atg gca gac aat aac gaa ggt gcc gac gga gtg ggt agt 672 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 tcc tcg gga aat tgg cat tgc gat tcc aca tgg ctg ggc gac aga gtc 720 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 atc acc acc agc acc cga acc tgg gcc ctg ccc acc tac aac aac cac 768 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 ctc tac aag caa atc tcc aac ggg acc tcg gga ggc agc acc aac gac 816 Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp 260 265 270 aac acc tac ttc ggc tac agc acc ccc tgg ggg tat ttt gac ttt aac 864 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 aga ttc cac tgc cac ttc tca cca cgt gac tgg cag cga ctt atc aac 912 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 aac aac tgg gga ttc cgg ccc aag aga ctc agc ttc aag ctc ttc aac 960 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn 305 310 315 320 atc cag gtc aag gag gtc acg caa aat gaa ggc acc aag acc atc gcc 1008 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 aat aac ctc acc agc acc atc cag gtg ttt acg gac tcg gaa tac cag 1056 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 ctg cca tac gtc ctc ggc tct gcc cac cag ggc tgc ctg cct ccg ttc 1104 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 ccg gcg gac gtc ttc atg att cct cag tat ggc tac ctg acg ctg aac 1152 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 aac gga agt cag gcc gtg ggc cgt tcc tcc ttc tac tgc ctg gag tac 1200 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 ttt ccc tct cag atg cta aga acg ggc aac aac ttc tcc ttc agc tat 1248 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Ser Phe Ser Tyr 405 410 415 acc ttc gag gac gtg cct ttc cac agc agc tac gcg cac agc cag agc 1296 Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 ctg gac cgg ctg atg aat ccc ctc att gac cag tac ctg tac tac ctg 1344 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 tcg cgg aca caa tcc aca gga ggc aca gcg gga act cag cag ttg ctg 1392 Ser Arg Thr Gln Ser Thr Gly Gly Thr Ala Gly Thr Gln Gln Leu Leu 450 455 460 ttt tct cag gcc ggg cct aac aac atg tct gct cag gcc aaa aac tgg 1440 Phe Ser Gln Ala Gly Pro Asn Asn Met Ser Ala Gln Ala Lys Asn Trp 465 470 475 480 cta ccc gga cct tgt tat cgg cag caa cgt gtt tcc acg aca ctg tcg 1488 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser 485 490 495 caa aac aac aac agc aac ttt gcc tgg acc ggt gcc acc aaa tac cac 1536 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His 500 505 510 ctg aac gga aga gac tct ctg gta aat ccg ggt gtc gcc atg gca acc 1584 Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr 515 520 525 aac aag gac gac gag gac cgc ttc ttc cca tcc agc ggc atc ctc atg 1632 Asn Lys Asp Asp Glu Asp Arg Phe Phe Pro Ser Ser Gly Ile Leu Met 530 535 540 ttt ggc aag cag ggg gct gga aaa gac aac gtg gac tat agc aac gtg 1680 Phe Gly Lys Gln Gly Ala Gly Lys Asp Asn Val Asp Tyr Ser Asn Val 545 550 555 560 atg cta acc agc gag gaa gaa atc aag acc act aac cct gtg gcc aca 1728 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 gaa cag tat ggt gtg gtg gcg gat aac ctg cag cag caa aac aca gct 1776 Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala 580 585 590 cct att gtg ggg gcc gtc aac agc caa gga gcc tta cct ggc atg gtt 1824 Pro Ile Val Gly Ala Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 tgg cag aac cgg gac gtg tac ctg cag ggt ccc atc tgg gcc aag att 1872 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 cct cac acg gat ggt aac ttt cac ccg tct cct ctc atg ggc ggc ttt 1920 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 gga ctt aaa cat ccg cct cct cag atc ctg atc aag aac act ccc gtt 1968 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 cct gcg gat cct cca acg gcg ttc aac cag gcc aag ctg aac tct ttc 2016 Pro Ala Asp Pro Pro Thr Ala Phe Asn Gln Ala Lys Leu Asn Ser Phe 660 665 670 atc acg cag tac agc acc gga caa gtc agc gtg gag atc gag tgg gag 2064 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 ctg cag aag gag aac agc aag cgc tgg aac cca gag att cag tat acc 2112 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 tcc aac tac tac aaa tct aca aat gtg gac ttt gct gtt aat act gag 2160 Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 ggt gtt tac tct gag cct cgc ccc att ggc acc cgt tac ctc acc cgt 2208 Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 aat ctg taa 2217 Asn Leu <210> 24 <211> 738 <212> PRT <213> adeno-associated virus rh.90 <400> 24 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln 165 170 175 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro 180 185 190 Pro Ala Ala Pro Ser Ser Val Gly Ser Gly Thr Met Ala Ala Gly Gly 195 200 205 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp 260 265 270 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn 305 310 315 320 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Ser Phe Ser Tyr 405 410 415 Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 Ser Arg Thr Gln Ser Thr Gly Gly Thr Ala Gly Thr Gln Gln Leu Leu 450 455 460 Phe Ser Gln Ala Gly Pro Asn Asn Met Ser Ala Gln Ala Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser 485 490 495 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His 500 505 510 Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr 515 520 525 Asn Lys Asp Asp Glu Asp Arg Phe Phe Pro Ser Ser Gly Ile Leu Met 530 535 540 Phe Gly Lys Gln Gly Ala Gly Lys Asp Asn Val Asp Tyr Ser Asn Val 545 550 555 560 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala 580 585 590 Pro Ile Val Gly Ala Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 Pro Ala Asp Pro Pro Thr Ala Phe Asn Gln Ala Lys Leu Asn Ser Phe 660 665 670 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 Asn Leu <210> 25 <211> 176 <212> DNA <213> Artificial Sequence <220> <223> constructed sequence <400> 25 actcaaagtt caaaccttat cattttttgc tttgttcctc ttggccttgg ttttgtacat 60 cagctttgaa aataccatcc cagggttaat gctggggtta atttataact aagagtgctc 120 tagttttgca atacaggaca tgctataaaa atggaaagat gttgctttct gagaga 176

Claims

유전자 편집화 뉴클레아제 발현 카세트로서, 상기 뉴클레아제가 표적화되는 서열을 갖는 숙주 세포로의 전달 이후에 상기 뉴클레아제의 발현을 안내하는 조절 서열에 작동가능하게 연결된 뉴클레아제 코딩 서열을 포함하는 핵산 서열을 포함하고, 상기 조절 서열은 낮은 전사 활성을 갖는 프로모터를 포함하는, 뉴클레아제 발현 카세트.
제 1항에 있어서,
상기 프로모터는 간-특이적 프로모터인, 뉴클레아제 발현 카세트.
제 1항 또는 제 2항에 있어서,
상기 프로모터는 TBG-S1 프로모터 변이체인, 뉴클레아제 발현 카세트.
제 3항에 있어서,
상기 TBG-S1 변이체는 5' 말단 또는 3' 말단, 또는 양쪽 말단에서 절단되는, 뉴클레아제 발현 카세트.
제 4항에 있어서,
상기 TBG-S1 변이체는 5' 말단에서 절단되는, 뉴클레아제 발현 카세트.
제 1항 내지 제 5항 중 어느 한 항에 있어서,
상기 프로모터는 TBG-S1-F64 (서열번호 6)인, 뉴클레아제 발현 카세트.
제 1항 내지 제 5항 중 어느 한 항에 있어서,
상기 프로모터는 TBG-S1-F113 (서열번호 7)인, 뉴클레아제 발현 카세트.
제 1항 내지 제 5항 중 어느 한 항에 있어서,
상기 프로모터는 TBG-S1-F140 (서열번호 8)인, 뉴클레아제 발현 카세트.
제 1항 또는 제 2항에 있어서,
상기 프로모터는 CCL16 프로모터인, 뉴클레아제 발현 카세트.
제 1항 또는 제 2항에 있어서,
상기 프로모터는 SCLC22A9 프로모터인, 뉴클레아제 발현 카세트.
제 1항 또는 제 2항에 있어서,
상기 프로모터는 CYP26A1 프로모터인, 뉴클레아제 발현 카세트.
제 1항 내지 제 11항 중 어느 한 항에 있어서,
상기 뉴클레아제는 메가뉴클레아제, CRISPR/Cas 뉴클레아제, 아연 핑거 뉴클레아제 또는 TALEN인, 뉴클레아제 발현 카세트.
제 1항 내지 제 11항 중 어느 한 항에 있어서,
상기 뉴클레아제는 메가뉴클레아제인, 뉴클레아제 발현 카세트.
제 1항 내지 제 13항 중 어느 한 항에 따른 뉴클레아제 발현 카세트, 및 담체, 현탁제 및/또는 부형제 중 하나 이상을 포함하는 약제학적 조성물.
제 14항에 있어서,
상기 발현은 비-바이러스성 전달 시스템으로 되는, 약제학적 조성물.
제 15항에 있어서,
상기 비-바이러스성 전달 시스템은 지질 나노입자인, 약제학적 조성물.
제 1항 내지 제 13항 중 어느 한 항에 따른 뉴클레아제 발현 카세트를 포함하는 바이러스성 벡터.
유전자 편집화에 유용한 재조합 AAV로서, AAV 캡시드 및 상기 AAV 캡시드에 포장된 벡터 게놈을 포함하고, 상기 벡터 게놈은
(a) 제 1항 내지 제 13항 중 어느 한 항에 따른 발현 카세트; 및
(b) 상기 발현 카세트를 상기 캡시드 내에 포장하는데 필요한 AAV 역전된 말단 반복서열
을 포함하는, 재조합 AAV.
제 17항에 따른 바이러스성 벡터 또는 제 18항에 따른 재조합 AAV, 및 담체, 희석제 및/또는 부형제 중 하나 이상을 포함하는 조성물.
표적화된 유전자를 편집하는 방법으로서, 제 1항 내지 제 13항 중 어느 한 항에 따른 뉴클레아제 발현 카세트, 제 14항 내지 제 16항 중 어느 한 항에 따른 조성물, 제 17항에 따른 바이러스성 벡터, 또는 제 18항에 따른 rAAV를 전달하는 단계를 포함하는, 방법.
유전자 표적화 뉴클레아제의 표적-외 활성을 감소시키는 방법으로서, 제 1항 내지 제 13항 중 어느 한 항에 따른 뉴클레아제 발현 카세트, 제 14항 내지 제 16항 중 어느 한 항에 따른 조성물, 제 17항에 따른 바이러스성 벡터 또는 제 18항에 따른 rAAV를 전달하는 단계를 포함하는, 방법.
서열번호 6, 서열번호 7 또는 서열번호 8의 서열을 포함하는 프로모터.
제 22항의 프로모터를 포함하는 발현 카세트.
제 22항의 프로모터를 포함하는 발현 벡터.