KR20220139903A

KR20220139903A - 식물에서의 재조합 아데노-관련 바이러스 벡터

Info

Publication number: KR20220139903A
Application number: KR1020227029056A
Authority: KR
Inventors: 다니엘 깁스; 제이크 오리온 코너스
Original assignee: 벡프로바이오, 인크.
Priority date: 2020-02-07
Filing date: 2021-02-03
Publication date: 2022-10-17
Also published as: EP4100056A1; WO2021158648A1; CN115361970A; CA3170169A1; MX2022009581A; JP2023512831A; EP4100056A4; AU2021215860A1; US20230087751A1

Abstract

본 개시내용은 아데노-관련 바이러스 (AAV)의 성분을 코딩하는 핵산 서열, 예컨대 식물에서의 발현에 대해 코돈 최적화된 핵산 서열, 및 이들 핵산 서열로부터 발현되는 단백질에 관한 것이다. 또한, 식물에서 이들 핵산 서열을 사용하여 기능성 AAV 입자를 생산하는 방법이 개시된다. 본원에 개시된 바와 같은 식물에서의 AAV의 생산은 통상적인 공정에 비해 많은 이점, 예컨대 효율, 비용, 수율, 확장성 및 안전성을 제공한다.

Description

식물에서의 재조합 아데노-관련 바이러스 벡터

관련 출원에 대한 상호 참조

본 출원은 2020년 2월 7일에 출원된 미국 특허 가출원 번호 62/971,750을 우선권 주장하며, 이는 그 전문이 명백하게 본원에 참조로 포함된다.

서열 목록에 대한 참조

본 출원은 전자 포맷의 서열 목록과 함께 출원된다. 서열 목록은 파일명 SeqListingVCPRO002WO.TXT로 제공되며, 이는 2021년 2월 3일에 생성되었고, 115,770 바이트 크기이다. 전자 서열 목록 내의 정보는 그 전문이 본원에 참조로 포함된다.

기술분야

본 개시내용은 아데노-관련 바이러스 (AAV)의 성분을 코딩하는 핵산 서열, 예컨대 식물에서의 발현에 대해 코돈 최적화된 핵산 서열, 및 이들 핵산 서열로부터 발현되는 단백질에 관한 것이다. 또한, 식물에서 이들 핵산 서열을 사용하여 기능성 AAV 입자를 생산하는 방법이 개시된다. 본원에 개시된 바와 같은 식물에서의 AAV의 생산은 효율, 비용, 순도, 수율, 확장성 및 안전성을 비롯한, 바이러스 생산의 통상적인 과정과 비교하여 많은 이익을 제공한다.

아데노-관련 바이러스 (AAV)는 그의 최소 면역원성, 높은 효능 및 상대적 안전성으로 인해 유전자 요법을 위한 인간 세포 내로의 시험관내 형질도입 및 생체내 형질도입 둘 모두에서의 사용에 대해 큰 인기를 얻었다. AAV 입자는 전형적으로 포유동물 또는 곤충 세포 배양 시스템에서 생산되지만, 이들 세포 배양물을 유지하고, AAV 입자를 정제하며, 충분한 바이러스 역가를 얻는 것은 어렵고 비용이 많이 든다. AAV 입자를 생산하기 위한 개선된 방법이 현재 필요하다.

아데노-관련 바이러스 (AAV) 단백질을 코딩하는 서열을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어진 핵산에 관한 실시양태가 본원에 기재된다. 일부 실시양태에서, AAV는 AAV 혈청형 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 또는 12이다. 일부 실시양태에서, AAV는 연구 및 임상 적용에 통상적으로 사용되는 혈청형인 AAV 혈청형 2 (AAV2)이다. AAV 단백질은 REP 단백질인 REP78, REP68, REP52, REP40, CAP 단백질인 VP1, VP2, VP3, 또는 AAP를 포함하나 이에 제한되지는 않는다. 숙주 세포에서 AAV의 복제를 증진시킬 수 있는 아데노바이러스 단백질은 E4orf6, E1a, E2a, E2b 및 VA를 포함하나 이에 제한되지는 않는다. 일부 실시양태에서, AAV 단백질을 코딩하는 서열을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어진 핵산은 살아있는 숙주 또는 무세포 시스템에서 AAV 단백질로 전사 및 번역된다. 다른 실시양태에서, AAV 단백질을 코딩하는 서열을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어진 핵산은 AAV 단백질을 코딩하는 야생형 서열에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는다. 일부 실시양태에서, 핵산은 야생형 AAV2 단백질을 코딩하는 야생형 서열에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는다. 일부 실시양태에서, 핵산은 식물에서의 개선된, 증가된 또는 증진된 발현에 대해 코돈 최적화된다. 일부 실시양태에서, 핵산은 AAV2 REP/REP78/REP/68/REP52/REP48 단백질을 코딩하는 서열식별번호: 2-11, AAV2 CAP/VP1/VP2/VP3 단백질을 코딩하는 서열식별번호: 15-24, AAV2 AAP 단백질을 코딩하는 서열식별번호: 28-37, 또는 Ad5 E4orf6 단백질을 코딩하는 서열식별번호: 40-49에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는다. 일부 실시양태에서, 핵산은 니코티아나 벤타미아나(Nicotiana benthamiana), 니코티아나 타바쿰(Nicotiana tabacum), 아라비돕시스 탈리아나(Arabidopsis thaliana), 솔라눔 투베로숨(Solanum tuberosum), 칸나비스 사티바(Cannabis sativa), 파고피룸 에스쿨렌툼(Fagopyrum esculentum), 오리자 사티바(Oryza sativa), 제아 메이스(Zea mays), 솔라눔 리코페르시코이데스(Solanum lycopersicoides), 솔라눔 리코페르시쿰(Solanum lycopersicum), 락투카 사티바(Lactuca sativa)에서의 발현에 대해 코돈 최적화된다. 일부 실시양태에서, pEAQ 벡터, AAV 입자, 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens) 세포, 식물 세포, 또는 식물을 포함하나 이에 제한되지는 않는 재조합 핵산 벡터는 AAV 단백질을 코딩하는 핵산을 포함한다. 추가적으로, 니코티아나, 아라비돕시스, 솔라눔, 칸나비스, 파고피룸, 오리자, 락투카 또는 제아 속에 속할 수 있는 식물로부터 AAV 입자를 단리하는 방법이 기재된다. 일부 실시양태에서, AAV 입자는 원심분리, 여과, 크로마토그래피, 친화성 크로마토그래피, 이온 교환 크로마토그래피, 음이온 교환 크로마토그래피, 크기 배제 크로마토그래피, 또는 소수성 상호작용 크로마토그래피를 포함하는 방법에 의해 식물로부터 단리된다.

일부 실시양태에서, 정제된 AAV 입자는 의약으로서 사용된다. 일부 실시양태에서, 정제된 AAV 입자는 의약의 제조에 사용된다. 일부 실시양태에서, 정제된 AAV 입자는 포유동물 숙주 세포, 예컨대 인간 숙주 세포를 감염시키는 데 사용된다. 일부 실시양태에서, 정제된 AAV 입자는 질환을 치료하는 데 사용된다. 일부 실시양태에서, 정제된 AAV 입자는 치료 단백질 또는 펩티드를 필요로 하는 환자, 예컨대 인간 환자를 위한 유전자 요법에 사용된다. 일부 실시양태에서, 정제된 AAV 입자는 효소 결핍, 글리코겐 축적 질환 (GSD), GSD 유형 0, GSD 유형 I, GSD 유형 II, 폼페병, 다논병, GSD 유형 III, GSD 유형 IV, GSD 유형 V, GSD 유형 VI, GSD 유형 VII, GSD 유형 VIII, GSD 유형 IX, 선천성 락타시아, 수크로스 불내성, 프룩토스뇨, 프룩토스 불내성, 갈락토키나제 결핍, 갈락토스혈증, 성인 폴리글루코산 신체 질환, 당뇨병, 고인슐린혈증성 저혈당증, 트리오스포스페이트 이소머라제 결핍, 피루베이트 키나제 결핍, 피루베이트 카르복실레이트 결핍, 프룩토스 비스포스페이트 결핍, 글루코스-6-포스페이트 데히드로게나제 결핍, 트랜스알돌라제 결핍, 6-포스포노글루코네이트 데히드로게나제 결핍, 고옥살뇨, 펜토수리아, 또는 알돌라제 A 결핍을 포함하나 이에 제한되지는 않는 대사에서의 선천성 이상을 치료하는 데 사용된다. 일부 실시양태에서, 정제된 AAV 입자는 근위축성 측삭 경화증, 척수성 근육 위축, 파킨슨병, 알츠하이머병, 운동 뉴런 질환, 근육 이영양증, 베커 근육 이영양증, 뒤시엔느 근육 이영양증, 뮤코폴리사카라이드증 IIIB, 또는 방향족 L-아미노산 데카르복실라제 결핍을 포함하나 이에 제한되지는 않는 신경계 또는 신경변성 장애를 치료하는 데 사용된다. 일부 실시양태에서, 정제된 AAV 입자는 색소성 망막염, 어셔 증후군, 스타르가르트병, 맥락막결손, 완전색맹 또는 X-연관 망막층간분리를 포함하나 이에 제한되지는 않는 망막 변성 질환을 치료하는 데 사용된다. 일부 실시양태에서, 정제된 AAV 입자는 β-지중해빈혈, 겸상 적혈구 질환 또는 혈우병을 포함하나 이에 제한되지는 않는 혈액 장애를 치료하는 데 사용된다. 일부 실시양태에서, 정제된 AAV 입자는 유전성 또는 선천성 난청 원인을 치료하는 데 사용된다. 일부 실시양태에서, 정제된 AAV 입자는 비스코트-알드리치 증후군, X-연관 만성 육아종성 질환, 열성 이영양성 수포성 표피박리증, 제I형 뮤코폴리사카라이드증, 알파 1 항트립신 결핍, 또는 동형접합 가족성 고콜레스테롤혈증을 치료하는 데 사용된다.

일부 실시양태에서, 식물은 수경재배로 제조된다. 일부 실시양태에서, 식물 종자는 발아할 습도를 갖는 비료 용액에 침지된 그로단(Grodan) 암면 큐브에서 제조된다. 일부 실시양태에서, 발아 종자 또는 식물은 광 주기, 예컨대 16시간 명/8시간 암, 24시간 명/0시간 암, 12시간 명/12시간 암, 또는 18시간 명/6시간 암 하에 유지된다. 일부 실시양태에서, 발아 종자 또는 식물은 적절한 온도, 예컨대 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 또는 100℉ 또는 상기 언급된 임의의 두 온도에 의해 정의되는 범위 내의 임의의 온도에서 유지된다. 일부 실시양태에서, 종자는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30일 이내에 발아한다. 일부 실시양태에서, 성장하는 식물은 뿌리가 돌출되면 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30일 내에 보다 큰 용기로 옮겨져야 한다.

일부 실시양태에서, AAV2 유전자를 포함하는 핵산 플라스미드, 구축물 또는 벡터를 조립한다. 일부 실시양태에서, AAV2 유전자를 포함하는 이들 핵산 플라스미드, 구축물 또는 벡터는 pEAQ-HT-Ad5Orf6-OPT_AAV2-AAP-OPT, pEAQ-HT_CAPopt 또는 pEAQ-HT-REPopt_AVGFPopt를 포함한다. 일부 실시양태에서, 이들 플라스미드, 구축물 또는 벡터는 에이. 투메파시엔스 내로 형질전환된다. 일부 실시양태에서, 형질전환된 에이. 투메파시엔스는 규모에 적절한 배양물, 예컨대 10 mL, 20 mL, 30 mL, 40 mL, 50 mL, 100 mL, 200 mL, 300 mL, 400 mL, 500 mL, 1 L, 2 L, 3 L, 4 L, 5 L, 10 L, 20 L, 30 L, 40 L, 50 L, 100 L, 1000 L, 5000 L, 10000 L, 50000 L, 100000 L, 1000000 L 또는 상기 언급된 부피 중 임의의 2개에 의해 정의되는 범위 내의 임의의 부피로 성장한다. 일부 실시양태에서, 식물은 형질전환된 에이. 투메파시엔스의 배양물로 아그로침윤된다(agroinfiltrate). 일부 실시양태에서, 아그로침윤된 식물은 식물의 세포 내에서 AAV2 입자를 생산한다. 일부 실시양태에서, 식물의 일부, 예컨대 잎, 줄기, 꽃, 뿌리 또는 과실은 AAV2 입자를 정제하기 위한 프로세싱을 위해 제거된다.

일부 실시양태에서, AAV2 입자는 원심분리, 크로마토그래피, 여과 또는 다른 방법을 사용하여 생물학적 물질로부터 프로세싱된다. 일부 실시양태에서, 적어도 10⁴, 10⁵, 10⁶, 10⁷, 10⁸, 10⁹, 10¹⁰, 10¹¹, 10¹², 10¹³, 또는 10¹⁴개 바이러스 입자 또는 바이러스 게놈이 각각의 식물로부터 정제된다. 일부 실시양태에서, 무손상 바이러스 입자는 정제된 총 바이러스 입자의 적어도 40%, 50%, 60%, 70%, 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%를 구성한다. 일부 실시양태에서, 바이러스 입자는 50%, 60%, 70%, 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 순수하다. 일부 실시양태에서, 이들 정제된 바이러스 입자는 형질도입, 연구, 유전자 요법 또는 치료 목적에 사용된다.

본 발명의 바람직한 측면은 하기 넘버링된 대안에 관한 것이다:

1. AAV2 REP 단백질을 코딩하는 서열을 포함하며, 여기서 서열은 서열식별번호: 2-11에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 것인 핵산 분자.

2. 제1항에 있어서, 서열이 서열식별번호: 2에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 것인 핵산 분자.

3. AAV2 CAP 단백질을 코딩하는 서열을 포함하며, 여기서 서열은 서열식별번호: 15-24에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 것인 핵산 분자.

4. 제3항에 있어서, 서열이 서열식별번호: 15에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 것인 핵산 분자.

5. AAV2 AAP 단백질을 코딩하는 서열을 포함하며, 여기서 서열은 서열식별번호: 28-37에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 것인 핵산 분자.

6. 제5항에 있어서, 서열이 서열식별번호: 28에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 것인 핵산 분자.

7. Ad5 E4orf6 단백질을 코딩하는 서열을 포함하며, 여기서 서열은 서열식별번호: 40-49에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 것인 핵산 분자.

8. 제7항에 있어서, 서열이 서열식별번호: 40에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 것인 핵산 분자.

9. 제1항 내지 제8항 중 어느 한 항의 핵산 분자를 포함하는 재조합 핵산 벡터.

10. 제1항 내지 제8항 중 어느 한 항의 핵산 또는 제10항의 벡터에 의해 코딩된 단백질.

11. 제1항 내지 제8항 중 어느 한 항의 적어도 하나의 핵산 분자, 제9항의 벡터, 또는 제10항의 단백질을 포함하는 AAV 입자.

12. 제1항 내지 제8항 중 어느 한 항의 적어도 하나의 핵산 분자, 제9항의 재조합 핵산 벡터, 제10항의 단백질, 또는 제11항의 AAV 입자를 포함하는 식물 세포.

13. 제12항의 식물 세포를 포함하는 식물.

14. 제12항 또는 제13항에 있어서, 니코티아나, 아라비돕시스, 솔라눔, 칸나비스, 파고피룸, 오리자 또는 제아 속에 속하는 식물 세포 또는 식물.

15. 제14항에 있어서, 식물이 니코티아나 종인 식물 세포 또는 식물.

16. 제15항에 있어서, 식물이 니코티아나 벤타미아나 또는 니코티아나 타바쿰인 식물 세포 또는 식물.

17. 제12항 내지 제16항 중 어느 한 항의 식물 세포 또는 식물로부터의 잎, 줄기, 꽃 또는 뿌리.

18. 임의로 제9항의 재조합 핵산 벡터를 사용하여, 식물을 적어도 하나의 재조합 핵산 벡터를 포함하는 아그로박테리움 투메파시엔스와 접촉시키며, 여기서 적어도 하나의 재조합 핵산 벡터는 AAV 단백질을 코딩하는 핵산 서열을 포함하고, 핵산 서열은 식물에서의 발현에 대해 코돈 최적화된 것인 단계;

적어도 하나의 재조합 핵산 벡터를 식물의 세포에 전달하는 단계;

식물의 세포에서 AAV 단백질을 발현시키는 단계; 및 임의로

식물의 세포로부터 AAV 단백질을 단리하는 단계

를 포함하는, 식물에서 AAV 단백질을 생산하는 방법.

19. 제18항에 있어서, 복수의 AAV 단백질이 동일한 식물에서 생산되는 것인 방법.

20. 제19항에 있어서, AAV 입자가 상기 식물에서 생산되고, 상기 AAV 입자가 임의로 상기 식물로부터 단리되는 것인 방법.

21. 제20항에 있어서, AAV 입자가 포유동물 세포, 임의로 인간 세포, 임의로 HEK293T를 감염시킬 수 있는 것인 방법.

22. 제18항 내지 제21항 중 어느 한 항에 있어서, 식물이 니코티아나, 아라비돕시스, 솔라눔, 칸나비스, 파고피룸, 오리자, 락투카 또는 제아 속에 속하는 것인 방법.

23. 제22항에 있어서, 식물이 니코티아나 종인 방법.

24. 제23항에 있어서, 식물이 니코티아나 벤타미아나 또는 니코티아나 타바쿰이고, 핵산 서열이 니코티아나 벤타미아나 또는 니코티아나 타바쿰에서의 발현에 대해 코돈 최적화된 것인 방법.

25. 제18항 내지 제24항 중 어느 한 항에 있어서, AAV 단백질을 단리하는 것이 원심분리, 여과 및/또는 크로마토그래피를 포함하는 것인 방법.

26. 제25항에 있어서, 크로마토그래피가 친화성, 이온 교환, 음이온 교환, 크기 배제 또는 소수성 상호작용 크로마토그래피인 방법.

27. 제18항 내지 제26항 중 어느 한 항에 있어서, 적어도 하나의 재조합 핵산 벡터가 서열식별번호: 2-11, 15-24, 28-37, 또는 40-49에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 적어도 하나의 서열을 포함하는 것인 방법.

28. 제18항 내지 제27항 중 어느 한 항에 있어서, 식물이 AAV 단백질의 적어도 10⁷, 10⁸, 10⁹, 10¹⁰, 10¹¹, 10¹², 10¹³, 또는 10¹⁴개 카피를 생산하는 것인 방법.

29. 제28항에 있어서, 식물이 AAV 단백질의 적어도 10¹², 10¹³, 또는 10¹⁴개 카피를 생산하는 것인 방법.

30. 제18항 내지 제29항 중 어느 한 항의 방법에 의해 생산 및 단리된 AAV 입자를 이를 필요로 하는 대상체의 세포에 투여하는 것을 포함하는 유전자 요법 방법.

31. 의약으로 사용하기 위한, 제9항의 재조합 핵산 벡터, 또는 제11항의 AAV 입자, 또는 제20항 또는 제21항의 방법에 의해 생산된 AAV 입자.

32. 인간 질환, 예컨대 대사에서의 선천성 이상, 효소 결핍, 폼페병, 다논병, 신경변성 장애, 파킨슨병, 알츠하이머병, 운동 뉴런 질환, 근육 이영양증, 뒤시엔느 근육 이영양증, 망막 변성 질환, 색소성 망막염, 어셔 증후군, 스타르가르트병, 또는 난청의 유전적 원인을 치료하는 유전자 요법에서 사용하기 위한, 제9항의 재조합 핵산 벡터, 또는 제11항의 AAV 입자, 또는 제20항 또는 제21항의 방법에 의해 생산된 AAV 입자.

33. AAV 입자의 성분 또는 AAV 입자의 어셈블리에 수반되는 성분을 코딩하는 핵산 서열을 포함하는 적어도 하나의 재조합 핵산 벡터로 식물을 형질전환시키는 단계;

AAV 입자가 식물에서 발현되고 어셈블리되는 조건 하에 식물을 성장시키는 단계; 및

식물로부터 AAV 입자를 단리하는 단계

를 포함하는, 식물에서 기능성 AAV 입자를 생산하는 방법.

34. 제33항에 있어서, 식물을 형질전환시키는 단계가 아그로침윤에 의해 수행되는 것인 방법.

35. 제33항 또는 제34항에 있어서, AAV 입자의 성분을 코딩하는 핵산 서열이 식물에 대해 코돈 최적화된 것인 방법.

36. 제33항 내지 제35항 중 어느 한 항에 있어서, 식물이 니코티아나, 아라비돕시스, 솔라눔, 칸나비스, 파고피룸, 오리자, 락투카 또는 제아 속에 속하는 것인 방법.

37. 제33항 내지 제36항 중 어느 한 항에 있어서, 식물이 니코티아나, 락투카 또는 칸나비스 종인 방법.

38. 제33항 내지 제37항 중 어느 한 항에 있어서, 식물이 니코티아나 벤타미아나, 니코티아나 타바쿰, 락투카 사티바 또는 칸나비스 사티바인 방법.

39. 제33항 내지 제38항 중 어느 한 항에 있어서, AAV 입자의 성분 또는 AAV 입자의 어셈블리에 수반되는 성분이 REP 단백질, CAP 단백질, AAP 단백질, 또는 Ad5 E4orf6 단백질, 또는 그의 임의의 조합을 포함하는 것인 방법.

40. 제39항에 있어서, REP 단백질이 하류 인-프레임 폴리펩티드의 번역을 증진시키는 약한 식물 코작 서열, 및/또는 잠재 ORF의 잠재적 발현을 방지하기 위한 내부 메티오닌 코돈에서의 돌연변이를 포함하는 핵산 서열에 의해 코딩되는 것인 방법.

41. 제39항 또는 제40항에 있어서, REP 단백질이 서열식별번호: 1-11에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열에 의해 코딩되는 것인 방법.

42. 제39항 내지 제41항 중 어느 한 항에 있어서, REP 단백질이 서열식별번호: 12 또는 13에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 펩티드 서열을 포함하는 것인 방법.

43. 제39항 내지 제42항 중 어느 한 항에 있어서, CAP 단백질이 하류 인-프레임 폴리펩티드의 번역을 증진시키는 약한 식물 코작 서열을 포함하는 핵산 서열에 의해 코딩되는 것인 방법.

44. 제39항 내지 제43항 중 어느 한 항에 있어서, CAP 단백질이 서열식별번호: 14-24에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열에 의해 코딩되는 것인 방법.

45. 제39항 내지 제44항 중 어느 한 항에 있어서, CAP 단백질이 서열식별번호: 25 또는 26에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 펩티드 서열을 포함하는 것인 방법.

46. 제39항 내지 제45항 중 어느 한 항에 있어서, AAP 단백질이 서열식별번호: 27-37에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열에 의해 코딩되는 것인 방법.

47. 제39항 내지 제46항 중 어느 한 항에 있어서, AAP 단백질이 서열식별번호: 38에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 펩티드 서열을 포함하는 것인 방법.

48. 제39항 내지 제47항 중 어느 한 항에 있어서, Ad5 E4orf6 단백질이 서열식별번호: 39-49에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열에 의해 코딩되는 것인 방법.

49. 제39항 내지 제48항 중 어느 한 항에 있어서, Ad5 E4orf6 단백질이 서열식별번호: 50에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 펩티드 서열을 포함하는 것인 방법.

50. 제33항 내지 제49항 중 어느 한 항에 있어서, AAV 입자를 단리하는 것이 원심분리, 여과 및/또는 크로마토그래피를 포함하는 것인 방법.

51. 제50항에 있어서, 크로마토그래피가 친화성, 이온 교환, 음이온 교환, 크기 배제 또는 소수성 상호작용 크로마토그래피인 방법.

52. 제33항 내지 제51항 중 어느 한 항에 있어서, 적어도 10⁷, 10⁸, 10⁹, 10¹⁰, 10¹¹, 10¹², 10¹³, 또는 10¹⁴개 AAV 입자가 식물로부터 단리되는 것인 방법.

53. 제33항 내지 제52항 중 어느 한 항에 있어서, 적어도 10¹², 10¹³, 또는 10¹⁴개 AAV 입자가 식물로부터 단리되는 것인 방법.

54. 제33항 내지 제53항 중 어느 한 항에 있어서, AAV 입자가 포유동물 세포, 임의로 인간 세포, 임의로 HEK293T를 감염시킬 수 있는 것인 방법.

55. 제33항 내지 제53항 중 어느 한 항에 있어서, AAV 입자를 포유동물, 예컨대 인간에게 투여하는 것을 추가로 포함하는 방법.

56. 질환의 치료에 사용하기 위한, 제33항 내지 제53항 중 어느 한 항의 방법에 의해 생산된 AAV 입자.

57. 의약의 제조에 사용하기 위한, 제33항 내지 제53항 중 어느 한 항의 방법에 의해 생산된 AAV 입자.

상기 기재된 특색 외에도, 추가의 특색 및 변형이 하기 도면 및 예시적인 실시양태의 설명으로부터 용이하게 명백해 질 것이다. 이들 도면은 전형적인 실시양태를 도시하고, 범주를 제한하는 것으로 의도되지 않음을 이해해야 한다.
도 1은 엔. 벤타미아나(N. benthamiana), 에이. 탈리아나(A. thaliana), 에스. 투베로숨(S. tuberosum), 씨. 사티바(C. sativa), 에프. 에스쿨렌툼(F. esculentum), 오. 사티바(O. sativa), 지. 메이스(Z. mays), 에스. 리코페르시쿰(S. lycopersicum), 엘. 사티바(L. sativa) 및 에스. 리코페르시코이데스(S. lycopersicoides)에 대해 코돈 최적화된 AAV2 REP 핵산 서열의 서열 정렬을 도시한다. 이러한 정렬에서 사용된 엔. 벤타미아나에 대한 서열은 서열식별번호: 2의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 에이. 탈리아나에 대한 서열은 서열식별번호: 3의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 에스. 투베로숨에 대한 서열은 서열식별번호: 4의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 씨. 사티바에 대한 서열은 서열식별번호: 5의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 에프. 에스쿨렌툼에 대한 서열은 서열식별번호: 6의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 오. 사티바에 대한 서열은 서열식별번호: 7의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 지. 메이스에 대한 서열은 서열식별번호: 8의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 에스. 리코페르시코이데스에 대한 서열은 서열식별번호: 9의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 에스. 리코페르시쿰에 대한 서열은 서열식별번호: 10의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 엘. 사티바에 대한 서열은 서열식별번호: 11의 코딩 서열에 상응한다.
도 2는 엔. 벤타미아나, 에이. 탈리아나, 에스. 투베로숨, 씨. 사티바, 에프. 에스쿨렌툼, 오. 사티바, 지. 메이스, 에스. 리코페르시쿰, 엘. 사티바 및 에스. 리코페르시코이데스에 대해 코돈 최적화된 AAV2 CAP 핵산 서열의 서열 정렬을 도시한다. 이러한 정렬에서 사용된 엔. 벤타미아나에 대한 서열은 서열식별번호: 15의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 에이. 탈리아나에 대한 서열은 서열식별번호: 16의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 에스. 투베로숨에 대한 서열은 서열식별번호: 17의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 씨. 사티바에 대한 서열은 서열식별번호: 18의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 에프. 에스쿨렌툼에 대한 서열은 서열식별번호: 19의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 오. 사티바에 대한 서열은 서열식별번호: 20의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 지. 메이스에 대한 서열은 서열식별번호: 21의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 에스. 리코페르시코이데스에 대한 서열은 서열식별번호: 22의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 에스. 리코페르시쿰에 대한 서열은 서열식별번호: 23의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 엘. 사티바에 대한 서열은 서열식별번호: 24의 코딩 서열에 상응한다.
도 3은 엔. 벤타미아나, 에이. 탈리아나, 에스. 투베로숨, 씨. 사티바, 에프. 에스쿨렌툼, 오. 사티바, 지. 메이스, 에스. 리코페르시쿰, 엘. 사티바, 및 에스. 리코페르시코이데스에 대해 코돈 최적화된 AAV2 AAP 핵산 서열의 서열 정렬을 도시한다. 이러한 정렬에서 사용된 엔. 벤타미아나에 대한 서열은 서열식별번호: 28의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 에이. 탈리아나에 대한 서열은 서열식별번호: 29의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 에스. 투베로숨에 대한 서열은 서열식별번호: 30의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 씨. 사티바에 대한 서열은 서열식별번호: 31의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 에프. 에스쿨렌툼에 대한 서열은 서열식별번호: 32의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 오. 사티바에 대한 서열은 서열식별번호: 33의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 지. 메이스에 대한 서열은 서열식별번호: 34의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 에스. 리코페르시코이데스에 대한 서열은 서열식별번호: 35의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 에스. 리코페르시쿰에 대한 서열은 서열식별번호: 36의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 엘. 사티바에 대한 서열은 서열식별번호: 37의 코딩 서열에 상응한다.
도 4는 엔. 벤타미아나, 에이. 탈리아나, 에스. 투베로숨, 씨. 사티바, 에프. 에스쿨렌툼, 오. 사티바, 지. 메이스, 에스. 리코페르시쿰, 엘. 사티바, 및 에스. 리코페르시코이데스에 대해 코돈 최적화된 Ad5 E4orf6 핵산 서열의 서열 정렬을 도시한다. 이러한 정렬에서 사용된 엔. 벤타미아나에 대한 서열은 서열식별번호: 40의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 에이. 탈리아나에 대한 서열은 서열식별번호: 41의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 에스. 투베로숨에 대한 서열은 서열식별번호: 42의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 씨. 사티바에 대한 서열은 서열식별번호: 43의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 에프. 에스쿨렌툼에 대한 서열은 서열식별번호: 44의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 오. 사티바에 대한 서열은 서열식별번호: 45의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 지. 메이스에 대한 서열은 서열식별번호: 46의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 에스. 리코페르시코이데스에 대한 서열은 서열식별번호: 47의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 에스. 리코페르시쿰에 대한 서열은 서열식별번호: 48의 코딩 서열에 상응한다. 이러한 정렬에서 사용된 엘. 사티바에 대한 서열은 서열식별번호: 49의 코딩 서열에 상응한다.
도 5는 에이. 투메파시엔스 침윤을 사용하여 식물에서 AAV 입자를 생산하는 실험 절차를 도시한다.
도 6은 pEAQ-HT-REPopt_AVGFPopt에 대한 플라스미드 지도를 도시한다.
도 7은 pEAQ-HT-Ad5Orf6-OPT_AAV2-AAP-OPT에 대한 플라스미드 지도를 도시한다.
도 8은 pEAQ-HT_CAPopt에 대한 플라스미드 지도를 도시한다.
도 9는 AAV2-특이적 qPCR에 의해 검출된 바와 같은, 침윤된 엔. 벤타미아나, 엔. 타바쿰, 엘. 사티바 및 씨. 사티바에서의 AAV2 게놈 입자의 상대 수율을 도시한다.
도 10a는 VP1, VP2, 및 VP3 단백질에 상응하는 밴드의 존재를 나타내는, 엔. 벤타미아나, 엘. 사티바, 및 씨. 사티바 잎 용해물의 총 단백질-염색된 SDS-PAGE 겔을 도시한다.
도 10b는 항-AAV2 VP 모노클로날 항체에 의해 검출된 바와 같은, VP1, VP2, 및 VP3 단백질에 상응하는 밴드의 존재를 나타내는 엔. 벤타미아나 잎 용해물의 웨스턴 블롯을 도시한다. VP1 = "*", VP2 = "^", VP3 = "#".
도 11은 HEK293T 세포당 2.7x10⁴, 2.7x10³, 또는 2.7x10²개 바이러스 게놈의 MOI로 식물 생산된 AAV2-CMV-EGFP 입자를 형질도입한 후 HEK293T에서의 EGFP 발현을 도시한다.
도 12는 본 개시내용에 기재된 예시적인 서열을 도시한다.

하기 상세한 설명에서, 그의 일부를 형성하는 첨부 도면을 참조한다. 문맥이 달리 지시하지 않는 한, 도면에서 유사한 기호는 전형적으로 유사한 구성요소를 나타낸다. 상세한 설명, 도면 및 청구범위에 기재된 예시적 실시양태는 제한적인 것으로 의도되지 않는다. 본원에 제시된 대상의 취지 또는 범주로부터 벗어나지 않으면서, 다른 실시양태가 이용될 수 있고, 다른 변화가 이루어질 수 있다. 본원에 일반적으로 기재되고 도면에 예시된 바와 같은 본 개시내용의 측면은 매우 다양한 상이한 구성으로 배열, 치환, 조합, 분리 및 설계될 수 있으며, 이들 모두는 본원에서 명백하게 고려된다는 것이 용이하게 이해될 것이다.

달리 정의되지 않는 한, 본원에 사용된 기술 과학 용어는 본 개시내용이 속하는 기술분야의 관련 기술분야의 통상의 기술자에 의해 통상적으로 이해되는 것과 동일한 의미를 갖는다. 본 개시내용의 목적상, 다음의 용어가 하기 정의된다.

단수 형태 (관사 "a" 및 "an")는 관사의 문법적 대상의 하나 또는 하나 초과 (예를 들어, 적어도 하나)를 지칭하기 위해 본원에 사용된다. 예로서, "요소"는 하나의 요소 또는 하나 초과의 요소를 의미한다.

"약"은 참조 양, 수준, 값, 수, 빈도, 백분율, 치수, 크기, 양, 중량 또는 길이에 대해 30, 25, 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1%만큼 달라지는 양, 수준, 값, 수, 빈도, 백분율, 치수, 크기, 양, 중량 또는 길이를 의미한다.

본 명세서 전반에 걸쳐, 문맥상 달리 요구되지 않는 한, 단어 "포함하다", "포함한다" 및 "포함하는"은 언급된 단계 또는 요소, 또는 단계들 또는 요소들의 군의 포함하지만, 임의의 다른 단계 또는 요소, 또는 단계들 또는 요소들의 군을 배제하지는 않음을 의미하는 것으로 이해될 것이다. "로 이루어진"은 어구 "로 이루어진"에 이어지는 모든 것을 포함하고 이로 제한되는 것을 의미한다. 따라서, 어구 "로 이루어진"은, 열거된 요소가 요구되거나 필수적이고 다른 요소가 존재하지 않을 수 있음을 나타낸다. "로 본질적으로 이루어진"은 어구 뒤에 열거된 임의의 요소를 포함하고, 열거된 요소에 대해 본 개시내용에 명시된 활성 또는 작용을 방해하지 않거나 그에 기여하지 않는 다른 요소로 제한됨을 의미한다. 따라서, 어구 "로 본질적으로 이루어진"은 열거된 요소가 요구되거나 또는 필수적이지만, 다른 요소는 임의적이고, 이들이 열거된 요소의 활성 또는 작용에 실질적으로 영향을 미치는지 여부에 따라 존재할 수 있거나 또는 존재하지 않을 수 있음을 나타낸다.

달리 구체적으로 나타내지 않는 한, 본 개시내용의 실시는 관련 기술분야의 기술 내의 분자 생물학 및 재조합 DNA 기술의 통상적인 방법을 사용할 것이다.

본원에 사용된 용어 "기능" 및 "기능성"은 생물학적 또는 효소적 기능을 지칭한다.

본원에 사용된 용어 "단리된"은 그의 천연 상태에서 정상적으로 동반되는 성분이 실질적으로 또는 본질적으로 없는 물질을 지칭한다. 예를 들어, "단리된 단백질"은 환경 또는 유기체로부터 그의 자연 발생 상태로 정제된 단백질을 포함한다.

본원에 사용된 용어 "핵산" 또는 "핵산 분자"는 폴리뉴클레오티드, 예컨대 데옥시리보핵산 (DNA) 또는 리보핵산 (RNA), 올리고뉴클레오티드, 폴리머라제 연쇄 반응 (PCR)에 의해 생성된 단편, 및 라이게이션, 절단, 엔도뉴클레아제 작용 및 엑소뉴클레아제 작용 중 임의의 것에 의해 생성된 단편을 지칭한다. 핵산 분자는 자연 발생 뉴클레오티드 (예컨대, DNA 및 RNA)인 단량체, 또는 자연 발생 뉴클레오티드의 유사체 (예를 들어, 자연 발생 뉴클레오티드의 거울상이성질체 형태), 또는 둘 다의 조합으로 구성될 수 있다. 변형된 뉴클레오티드는 당 모이어티 및/또는 피리미딘 또는 퓨린 염기 모이어티에서 변경을 가질 수 있다. 당 변형은, 예를 들어 1개 이상의 히드록실 기의 할로겐, 알킬 기, 아민 및 아지도 기로의 대체를 포함하거나, 또는 당은 에테르 또는 에스테르로서 관능화될 수 있다. 또한, 전체 당 모이어티는 입체적으로 및 전자적으로 유사한 구조, 예컨대 아자-당 및 카르보시클릭 당 유사체로 대체될 수 있다. 염기 모이어티에서의 변형의 예는 알킬화된 퓨린 및 피리미딘, 아실화된 퓨린 또는 피리미딘, 또는 다른 널리 공지된 헤테로시클릭 치환기를 포함한다. 핵산 단량체는 포스포디에스테르 결합 또는 이러한 연결의 유사체에 의해 연결될 수 있다. 포스포디에스테르 연결의 유사체는 포스포로티오에이트, 포스포로디티오에이트, 포스포로셀레노에이트, 포스포로디셀레노에이트, 포스포로아닐로티오에이트, 포스포라닐리데이트, 또는 포스포르아미데이트를 포함한다. 용어 "핵산 분자"는 또한 폴리아미드 백본에 부착된 자연 발생 또는 변형된 핵산 염기를 포함하는 소위 "펩티드 핵산"을 포함한다. 핵산은 단일 가닥 또는 이중 가닥일 수 있다. "올리고뉴클레오티드"는 핵산과 상호교환가능하게 사용될 수 있고, 이중 가닥 또는 단일 가닥 DNA 또는 RNA를 지칭할 수 있다. 핵산 또는 핵산들은 다양한 생물계에서 핵산 또는 핵산들의 증폭 및/또는 발현에 사용될 수 있는 핵산 벡터 또는 핵산 구축물 (예를 들어, 플라스미드, 바이러스, 아데노-관련 바이러스 (AAV), 박테리오파지, 코스미드, 포스미드, 파지미드, 박테리아 인공 염색체 (BAC), 효모 인공 염색체 (YAC), 또는 인간 인공 염색체 (HAC))에 함유될 수 있다. 전형적으로, 벡터 또는 구축물은 또한 프로모터, 인핸서, 종결인자, 유도인자, 리보솜 결합 부위, 번역 개시 부위, 개시 코돈, 정지 코돈, 폴리아데닐화 신호, 복제 기점, 클로닝 부위, 다중 클로닝 부위, 제한 효소 부위, 에피토프, 리포터 유전자, 선택 마커, 항생제 선택 마커, 표적화 서열, 펩티드 정제 태그, 또는 보조 유전자, 또는 그의 임의의 조합을 포함하나 이에 제한되지는 않는 요소를 함유할 것이다.

핵산 또는 핵산 분자는 상이한 펩티드, 폴리펩티드, 또는 단백질을 코딩하는 하나 이상의 서열을 포함할 수 있다. 이들 하나 이상의 서열은 동일한 핵산 또는 핵산 분자에서 인접하게, 또는 그 사이에 추가의 핵산, 예를 들어 링커, 반복부 또는 제한 효소 부위, 또는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 150, 200, 300, 400, 500, 1000, 2000, 3000, 4000 또는 5000개 염기 길이, 또는 상기 언급된 길이 중 임의의 2개에 의해 정의되는 범위 내의 임의의 길이인 임의의 다른 서열과 연결될 수 있다. 본원에 사용된 핵산에 대한 용어 "하류"는 핵산이 이중 가닥인 경우 코딩 서열 (센스 가닥)을 함유하는 가닥 상에서 이전 서열의 3'-말단 뒤에 있는 서열을 지칭한다. 본원에 사용된 핵산에 대한 용어 "상류"는 핵산이 이중 가닥인 경우 코딩 서열 (센스 가닥)을 함유하는 가닥 상에서 후속 서열의 5'-말단 앞에 있는 서열을 지칭한다. 본원에 사용된 핵산에 대한 용어 "그룹화된"은 직접적으로, 또는 그 사이에 추가의 핵산, 예를 들어 링커, 반복부 또는 제한 효소 부위, 또는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 150, 200, 300, 400, 500, 1000, 2000, 3000, 4000 또는 5000개 염기 길이, 또는 상기 언급된 길이 중 임의의 2개에 의해 정의된 범위 내의 임의의 길이이지만, 일반적으로 기능성 또는 촉매 폴리펩티드, 단백질 또는 단백질 도메인을 코딩하는 그 사이의 서열을 갖지 않는 임의의 다른 서열과 함께 근접하여 발생하는 2개 이상의 서열을 지칭한다.

본원에 사용된 핵산에 관한 용어 "코돈 최적화된"은 종-특이적 코돈 사용 편향 및 표적 세포 세포질에서의 각각의 아미노아실-tRNA의 상대적 이용가능성에 기초하여 폴리펩티드 서열을 변화시키지 않으면서 특정 종의 숙주에서 번역을 증진시키거나 최대화하기 위한 핵산의 코돈 치환을 지칭한다. 코돈 최적화 및 이러한 최적화를 수행하기 위한 기술은 관련 기술분야에 공지되어 있다. 추가로, 합성 코돈 최적화된 서열은 DNA 서열분석 서비스로부터 상업적으로 수득될 수 있다. 관련 기술분야의 통상의 기술자는 유전자 발현 수준이 다수의 인자, 예컨대 프로모터 서열 및 조절 요소에 의존한다는 것을 알 것이다. 대부분의 박테리아에 대해 언급된 바와 같이, 코돈의 작은 하위세트는 tRNA 종에 의해 인식되어 번역 선택으로 이어지며, 이는 단백질 발현에 대한 중요한 제한이 될 수 있다. 이러한 측면에서, 많은 합성 유전자는 그의 단백질 발현 수준을 증가시키도록 설계될 수 있다. 일부 실시양태에서, 특정 유기체에 대한 유전자의 코돈 최적화는 비-코돈 최적화된 또는 야생형 유전자 서열로의 발현 수준의 적어도 100%, 150%, 200%, 250%, 300%, 350%, 400%, 450%, 500%, 550%, 600%, 650%, 700%, 750%, 800%, 850%, 900%, 950%, 또는 1000%의 유전자 발현 수준을 유발한다.

본원에 기재된 핵산은 핵염기를 포함한다. 주요, 정규, 천연 또는 비변형된 염기는 아데닌, 시토신, 구아닌, 티민 및 우라실이다. 다른 핵염기는 퓨린, 피리미딘, 변형된 핵염기, 5-메틸시토신, 슈도우리딘, 디히드로우리딘, 이노신, 7-메틸구아노신, 하이포크산틴, 크산틴, 5,6-디히드로우라실, 5-히드록시메틸시토신, 5-브로모우라실, 이소구아닌, 이소시토신, 아미노알릴 염기, 염료-표지된 염기, 형광 염기 또는 비오틴-표지된 염기를 포함하나 이에 제한되지는 않는다.

본원에 사용된 용어 "펩티드", "폴리펩티드" 및 "단백질"은 펩티드 결합에 의해 연결된 아미노산으로 구성된 거대분자를 지칭한다. 펩티드, 폴리펩티드 및 단백질의 수많은 기능은 관련 기술분야에 공지되어 있고, 효소, 구조물, 수송, 방어, 호르몬 또는 신호전달을 포함하나 이에 제한되지는 않는다. 펩티드, 폴리펩티드 및 단백질은 항상은 아니지만 종종 핵산 주형을 사용하여 리보솜 복합체에 의해 생물학적으로 생산되지만, 화학적 합성 또한 이용가능하다. 핵산 주형을 조작함으로써, 펩티드, 폴리펩티드, 및 단백질 돌연변이, 예컨대 하나 초과의 펩티드, 폴리펩티드, 또는 단백질의 치환, 결실, 말단절단, 부가, 중복, 또는 융합이 수행될 수 있다. 하나 초과의 펩티드, 폴리펩티드 또는 단백질의 이들 융합체는 동일한 분자에서 인접하게, 또는 그 사이에 추가의 아미노산, 예를 들어 링커, 반복부, 에피토프 또는 태그, 또는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 150, 200 또는 300개 염기 길이, 또는 상기 언급된 길이 중 임의의 2개에 의해 정의되는 범위의 임의의 길이인 임의의 다른 서열과 연결될 수 있다.

일부 실시양태에서, 본원에 제시되고 실시예에 사용된 핵산 또는 펩티드 서열은 식물에 대해 최적화되지만, 또한 다른 유기체, 예컨대 박테리아, 진균, 원생동물 또는 동물에서 기능할 수 있다. 다른 실시양태에서, 본원에 제시되고 실시예에 사용된 핵산 또는 펩티드 서열에 대해 0%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 유사성, 또는 상기 언급된 백분율 유사성 중 임의의 2개에 의해 정의된 범위 내의 임의의 백분율을 공유하는 핵산 또는 펩티드 서열이 또한 생물계에서 서열의 기능에 대해 효과 없이 또는 거의 효과 없이 사용될 수 있다. 본원에 사용된 용어 "유사성"은 서열 내에 특정 변화, 예컨대 치환, 결실, 반복 또는 삽입을 갖는 주형 핵산 또는 펩티드 서열과 각각 동일한 전체 순서의 뉴클레오티드 또는 아미노산을 갖는 핵산 또는 펩티드 서열을 지칭한다. 일부 실시양태에서, 0%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%만큼 낮은 유사성을 공유하는 2개의 핵산 서열은 번역 동안 동일한 아미노산을 코딩하는 상이한 코돈을 포함함으로써 동일한 폴리펩티드를 코딩할 수 있다.

본원에 사용된 용어 "비리온", "바이러스 또는 바이러스 벡터" 및 "바이러스 입자"는 달리 나타내지 않는 한 상호교환가능하게 사용된다.

본원에 사용된 용어 "패키징"은 단일-가닥 바이러스 게놈의 생산, 코트 (캡시드) 단백질의 어셈블리, 바이러스 게놈의 캡슐화 등을 포함하는 사건을 지칭한다. 적절한 플라스미드 벡터 (통상적으로, 복수의 플라스미드)가 적절한 조건 하에 패키징을 허용하는 세포주 내로 도입되는 경우, 재조합 바이러스 입자 (즉, 비리온, 바이러스 벡터)가 구축되고, 배양물 내로 분비된다.

파르보비리다에(Parvoviridae) 과의 바이러스는 다른 인자들 중에서도 특정 숙주를 감염시키는 그의 능력을 특징으로 하는 소형 DNA 동물 바이러스이다. 구체적으로, 파르보비리다에 과는 2종의 하위과로 분류된다: 척추동물을 감염시키는 파르보비리나에(Parvovirinae) 및 곤충을 감염시키는 덴소비리나에(Densovirinae). 파르보비리나에 아과 (그의 구성원은 본원에서 파르보바이러스로 지칭됨)는 데펜도바이러스(Dependovirus) 속을 포함하며, 이는 대부분의 조건 하에 세포 배양에서의 생산 감염을 위해 헬퍼 바이러스, 예컨대 아데노바이러스, 백시니아 바이러스, 또는 포진 바이러스와의 동시감염을 요구한다. 데펜도바이러스는 정상적으로 인간 (예를 들어, 혈청형 2, 3A, 3B, 5, 및 6) 또는 영장류 (예를 들어, 혈청형 1, 4, 및 rh10)를 감염시키는 아데노-관련 바이러스 (AAV), 및 다른 온혈 동물을 감염시키는 관련 바이러스 (예를 들어, 소, 개, 말, 및 양 아데노-관련 바이러스 및 보카바이러스)를 포함한다.

최근 수년간, AAV는 비-분열 및 분열 세포 둘 다를 효율적으로 감염시키고, 포유동물 세포에서 에피솜 비-통합 AAV 게놈으로부터 장기간 트랜스진 발현을 유지하고, 인간에게 비교적 낮은 병원성 위험을 제기하는 그의 능력으로 인해 유전자 요법을 위한 바람직한 바이러스 벡터로서 부상하였다. 이들 이점의 관점에서, 재조합 아데노-관련 바이러스 (rAAV)는 현재 신경계 장애, 안과 장애, 청각 장애, B형 혈우병, 악성 흑색종, 낭성 섬유증 및 다른 질환에 대한 유전자 요법 임상 시험에 사용되고 있고, 최근에 망막 변성 질환 레베르 선천성 흑암시 (LCA) 및 운동 뉴런 질환 척수-근육 위축 유형 1 (SMA1)의 치료를 위한 FDA 승인 및 BLA 허가를 통과하였다.

AAV는 다수의 포유동물 세포를 감염시킬 수 있다. 또한, 인간 활막 섬유모세포의 AAV 형질도입은 유사한 뮤린 세포에서보다 유의하게 더 효율적이어서, AAV를 인간 유전자 요법에 특히 매력적이게 한다. AAV의 향성은 혈청형에 의해 유의하게 상이하며, 이는 유전자 요법의 특정 표적에 가장 적합한 AAV 혈청형을 생산할 필요성을 강조한다. rAAV는 현재 바큘로바이러스 발현 벡터 시스템 (BEVS)을 사용하여 HEK 293T 세포, COS 세포, HeLa 세포, KB 세포, 및 다른 포유동물 세포주를 포함한 포유동물 세포에서 및 Sf9, Sf21, 및 다른 곤충 세포를 포함한 곤충 세포에서 생산된다. 예를 들어, 미국 특허 6,156,303, 5,387,484, 5,741,683, 5,691,176, 및 5,688,676; 미국 PGPub 2002/0081721, 및 국제 특허 출원 WO 2000/047757, WO 2000/024916, WO 2003/042361, 및 WO 1996/017947을 참조하고, 이들 각각은 그 전문이 명백하게 본원에 참조로 포함된다. 비-포유동물, 비-무척추동물 식물 세포 및 전체 유기체에서의 감염성 AAV의 생산은 이전에 공지되지 않았다. 비-포유동물, 비-무척추동물 식물 세포 및 전체 유기체에서의 파르보바이러스 게놈 (특히, 데펜도바이러스 게놈 포함)의 복제도 유사하게 이전에 공지되지 않았다.

대량의 강력하고 고순도의 임상 등급 AAV 벡터를 생산하는 현재의 방법은 포유동물 세포 배양 또는 곤충 세포 배양 플랫폼의 사용에 의존한다. 이들 플랫폼은 고가이고, 비-표준화되고, 비-모듈식이며, 공정 및 개발 규모에서 AAV 유전자 요법 제품에 대한 전반적 수요를 충족시키기 위해 요구되는 생산 규모로 확장하기 어렵고, 이는 상당한 장애를 나타낸다. 제이. 프레이저 라이트 (J. Fraser Wright)에 따르면, "10¹⁶ 내지 10¹⁸개 바이러스 게놈 범위의 cGMP 로트가 많은 재조합 AAV 제품, 특히 가장 상업적으로 실행가능한 질환 적용을 목표로 하는 것들에 대한 후기 임상 개발 및 제품 허가의 요건을 충족시키는 데 요구될 것이다" (문헌 [J. F. Wright, "Adeno-associated viral vector manufacturing: keeping pace with accelerating clinical development," Hum. Gene Ther., vol. 22, no. 8, pp. 913-914, Aug. 2011], 그 전문이 본원에 명백하게 참조로 포함됨). 식물에서의 일시적 유전자 발현을 사용한 AAV 생산은 통상적인 포유동물 및 곤충 세포-기반 생산 방법에서 현재 발견되는 가장 유의한 도전과제를 해결할 것이다. 즉, 극적으로 감소된 생산 비용 및 기반시설 비용, 모듈식 생산, 확장가능한 생산, 및 모든 AAV 기반 바이러스 벡터 제품에 대한 표준화된 생산 방법 및 공정.

지난 20년간, 식물은 제약을 위한 다른 생산 시스템, 예컨대 박테리아, 효모, 포유동물 또는 곤충 세포의 심각한 경쟁자가 되었다. 식물은 강건하고, 재배가 저렴하며, 포유동물 및 곤충 세포 배양에서 문제가 될 수 있는 내독소 또는 포유동물 병원체로 인한 오염 위험이 낮다. 원핵 발현 시스템과 달리, 식물은 번역후 변형, 예컨대 글리코실화를 도입할 수 있다. 곤충 및 효모 세포에서, 글리코실화는 매우 단순하고 일관성 없는 고 만노스 당형태로 제한된다. 제약 성분, 특히 바이러스 벡터를 위한 임의의 생산 시스템은 급작스러운 수요 증가에 반응하여 신속해야 한다. 식물에서의 일시적 발현은, 재현가능한 생산 모듈을 대표하는 각 개별 식물로 선형 확장 가능한 매우 낮은 제조 비용으로 신속하게 조정될 수 있으며, 바이오매스 생산 및 바이러스 벡터 수율의 관점에서 고도로 효율적이다. 일시적 식물 생물-공장의 이점은 조작의 용이성, 속도, 저비용, 및 바이오매스 1 Kg당 최대 1 g의 식물 조직 중량당 높은 단백질 수율이다 (문헌 [Gleba et al., 2007; Thuenemann et al., 2013]).

현재 포유동물 및 곤충 세포 생산 시스템을 사용한 임상 시험 및 상업화를 위한 rAAV 생산의 규모-확대에 수반되는 어려움은 완전히 금지되지는 않더라도 유의할 수 있다. 예를 들어, 특정 임상 연구를 위해, 용량당 10¹⁵개 초과의 rAAV 입자가 요구될 수 있으며, 이는 허가된 약물에 대한 대형 환자 코호트에 대해 제조된 배치당 10²⁰개 이하의 입자를 의미한다. 한 예는 사렙타 테라퓨틱스(Sarepta Therapeutics)로부터의 뒤시엔느 근육 이영양증의 치료를 위한 SRP9001일 것이며, 이는 3개월령 (평균 체중 6 kg) 내지 7세 (평균 체중 23 kg)의 소아에 대해 2 x 10¹⁴ vg/kg으로 환자에게 투여되며; 전반적 유병률은 ~200,000명의 환자이다 (문헌 [Stark, A.E. Ann Transl Med. 2015 Nov; 3(19): 287 and clinical trial NCT03375164]). 임상 (200 L) 또는 제조 (1000 L) 규모에 걸친 AAV 생산 비용의 분석은 부착 세포 배양, 단일 사용 생물반응기 또는 고정층 생물반응기 중 어느 하나를 사용한 1 x 10¹⁴ vg의 AAV에 대한 포괄적인 cGMP 생산 비용 (업스트림, 다운스트림, QC, 충전/마감)을 $8000-$25000 범위로 계산하였다 (문헌 [Cameau, E. et al. Cell Gene Therapy Insights 2019; 5(11), 1663-1675]). 이는 SRP9001과 같은 약물 제품의 대규모 cGMP 글로벌 제조를 위한 생산 비용을 심지어 최적화된 단일 사용 교반 또는 고정층 포유동물 세포 생물반응기를 사용하더라도 엄청나게 고가로 만들 것이다. 공지된 포유동물 세포주를 사용한 AAV의 생산과 연관된 관련된 어려움은 관련 기술분야에 인식되어 있다. 또한, 곤충 세포 BEVS 시스템은 안정한 생산자 세포주의 효과적인 발달을 막는 유의한 게놈 불안정성 및 유전적 부동을 겪는다. 포유동물 및 곤충 세포 배양물에서 생산되는 임상용으로 예정된 벡터가 포유동물 또는 곤충 세포에 존재하는 바람직하지 않은, 아마도 병원성인 물질로 오염될 가능성도 또한 존재한다. 이들 및 다른 문제를 고려하여, 다량의 감염성 rAAV 입자를 효율적으로, 안전하게, 및 경제적으로 생산하는 대안적이고 개선된 방법에 대한 필요가 남아있다.

세포 배양-기반 생산 시스템과 대조적으로, 식물 바이오매스 생성은 고가의 발효 설비의 건설을 필요로 하지 않고, 이에 상응하여 규모-확대 생산은 이중 설비를 건설할 필요 없이 달성될 수 있다. 그 결과, 확립된 농업 관행으로 식물 바이오매스 생성 및 상류 공정 용량이 자본-효율적 방식으로 작동되고 규모화될 수 있다. 침윤/생산 및 정제 후 4-6주령의 하나의 소식물체는, 엔. 벤타미아나에서의 최적화된 재조합 단백질 생산을 위한 식물 바이오매스 1 kg당 최대 1 g의 실험적으로 결정된 수율에 기초하여 1 리터의 현탁액 적합화된 포유동물 세포와 동등한 것으로 추정된다. 비교하면, 식물-제조 생물제제는 현재 세포 배양-기반 시스템보다 비용이 유의하게 낮은데, 이는 포유동물 세포 배양물이 상당한 초기 투자 및 고가의 성장 배지를 필요로 하기 때문이다 (문헌 [Lai H, Chen Q Plant Cell Rep. 2012 Mar; 31(3):573-84]). 식물은 또한 재조합 단백질-발현 바이오매스가 이중 생물반응기 및 관련 설비를 구축할 필요 없이 농업 규모로 생산될 수 있기 때문에 다른 발현 시스템의 확장성을 능가한다 (문헌 [Chen Q. Biological Engineering Transactions. 2008;1:291-321]). 박테리아 세포와 대조적으로, 식물은 포유동물 또는 곤충 세포와 유사하게 다중 헤테로-서브유닛의 글리코실화 및 어셈블리를 비롯한 단백질의 적절한 번역후 변형을 필요로 하는 대형의 기능성 제약 단백질을 생산할 수 있다 (문헌 [Lai H, et al., Proc Natl Acad Sci U S A. 2010 Feb 9; 107(6):2419-24]).

식물에서 임상 등급 재조합 복제 결손 아데노-관련 바이러스 벡터를 생산하기 위한 신속하고 확장가능하며 비용-효과적인 방법이 본원에 기재된다. 또한, 식물에서의 효율적인 발현 또는 기능에 대해 코돈 최적화된 AAV 단백질 및 AAV 게놈을 코딩하는 핵산 서열이 본원에 개시된다.

AAV는 대략 4.8 킬로베이스 길이의 단일 가닥 DNA 게놈을 갖는, 직경이 약 20 nm인 비-외피보유 복제 결손 바이러스이다. AAV의 100종 초과의 혈청형이 확인되었으며, 적어도 12종의 혈청형이 어느 정도 특징화된다. 이들 AAV 혈청형은 현저한 차이, 예컨대 진입에 사용되는 특이적 숙주 세포 수용체 또는 1차 수용체, 및 특정 숙주 세포 유형 (예를 들어, 근육 세포, 뉴런, 성상세포, 간세포)에 대한 선호도를 나타낸다. 예를 들어, AAV1, 4, 5, 및 6은 N- 또는 O-연결된 시알릴화 프로테오글리칸에 결합하고, AAV9는 갈락토스에 결합하고, AAV2 및 3은 헤파린 술페이트 프로테오글리칸에 결합한다. AAV2가 역사적으로 가장 잘 연구되고 이용되었지만, 그의 고유한 특성에 따라 다양한 혈청형의 사용이 가능하다. AAV 게놈은 3종의 유전자: REP, CAP, 및 AAP를 포함하지만, 이들 유전자 내의 내부 오픈 리딩 프레임 및 프로모터는 다수의 상이한 단백질 또는 단백질 단편을 생성한다. REP는 REP78, REP68, REP52 및 REP40을 코딩하며, 이들은 모두 바이러스 입자의 게놈 복제 및 패키징에 관여한다. CAP는 이십면체 바이러스 캡시드를 형성하는 VP1, VP2, 및 VP3을 코딩한다. 상이한 리딩 프레임 내의 CAP 서열 내에서 발견되는 AAP는 어셈블리-활성화 단백질 (AAP)을 코딩하며, 이는 적어도 AAV2에서 적절한 캡시드 형성에 필요하지만, 다른 AAV 혈청형에서는 불필요하다. AAV 입자 내로 패키징되는 핵산 물질 또는 게놈은 역전된 말단 반복부 (ITR)에 의해 플랭킹된 것으로 발견된 서열에 상응한다. 야생형 바이러스에서, ITR은 REP, CAP, 및 AAP 유전자 서열에 플랭킹된다. 재조합 AAV의 경우, 효소 마커 (예를 들어, LacZ)를 코딩하는 유전자, 형광 단백질 (예를 들어, GFP, EGFP)을 코딩하는 유전자, 광유전학적 단백질 (예를 들어, Chr2, ArctT, C1V1)을 코딩하는 유전자, 세포 대사, 칼슘 및 전기 활성의 유전적 센서 (예를 들어, GCaMP, rCaMP, 유전적으로 코딩되는 전압 센서)를 코딩하는 유전자, 약물 선택 마커를 코딩하는 유전자, 유전자 및 RNA 편집 단백질 (예를 들어, 아연 핑거 뉴클레아제, TALEN, CRISPR-Cas 단백질, 스트렙토코쿠스 피오게네스 Cas9, 스트렙토코쿠스 써모필루스 Cas9, 스타필로코쿠스 아우레우스 Cas9, 네이세리아 메닌기티디스 Cas9, 프란시셀라 노비시디아 Cas12a 또는 Cas12b, 프레보텔라 종 p5-125 Cas13a, Cas13b, Cas13c 또는 Cas13d, 포르피로모나스 굴라에 Cas13a, Cas13b, Cas13c, 또는 Cas13d, 리에메렐라 아나티페스티페르 Cas13a, Cas13b, Cas13c, 또는 Cas13d)을 코딩하는 유전자, 트랜스진 발현을 조절 또는 유도하는 유전자 (예를 들어, Dox 유도성 유전자 스위치, 큐메이트 유도성 유전자 스위치, PhyB-광 조절된 유전자 스위치) 또는 질환을 치료하는 유전자 (예를 들어, 낭성 섬유증의 경우 CFTR, B형 혈우병의 경우 인자 IX, 레베르 선천성 흑암시의 경우 RPE65, 신경변성 질환의 경우 뉴로트로핀)를 포함하나 이에 제한되지는 않는 다양한 트랜스진이 있다. ITR-플랭킹된 영역으로부터 REP 단백질을 배제함으로써, 트랜스진은 에피솜으로서 존재하고, 숙주 게놈 내로 통합되는 대신 숙주에 의해 일시적으로 발현될 수 있다. 2종 이상의 혈청형을 조합한 하이브리드 AAV 입자 또한 형질도입 효율, 세포 유형 향성, 또는 숙주 세포 수용체에 대한 친화도를 변경시키기 위해 생성될 수 있다.

복제 결손 바이러스로서, AAV는 효율적으로 복제하기 위해 헬퍼 바이러스를 필요로 한다. 아데노바이러스와의 동시-감염은 이를 달성하지만, 정제 동안 아데노바이러스 오염으로 이어진다. 이를 피하기 위해, 아데노바이러스 게놈의 E1, E2A, E4 및 VA 영역의 발현 (AAV 유전자를 함유하는 핵산 벡터로부터, 또는 숙주 세포를 이전에 조작함)은 효율적인 AAV 생산에 필요한 성분의 추가의 세트를 제공한다. 일부 실시양태에서, E1, E2A, 및 VA 영역은 내인성 AAV 프로모터를 사용하는 경우에만 효율적인 AAV 생산에 필요하다. 일부 실시양태에서, AAV 유전자는 다른 프로모터, 예컨대 구성적 프로모터, 유도성 프로모터, 다른 바이러스 프로모터, 포유동물 프로모터, 박테리아 프로모터, 진균 프로모터, 또는 식물 프로모터로 구동될 수 있다. 일부 실시양태에서, 단지 E4 영역만이 AAV 복제에 필요하다. 일부 실시양태에서, 아데노바이러스 유형 5 E4orf6 유전자 (Ad5 E4orf6)는 AAV 수율을 증가시키기 위해 식물의 형질전환 동안 AAV 발현 벡터와 함께 제공된다.

일부 실시양태에서, AAV 입자는 멸균 조건 하에 및 조절 또는 제어된 절차 하에 생산된다. 멸균을 유지하고 보장하는 방법은 우수 제조 관리기준 (GMP), 우수 조직 관리기준 (GTP), 우수 실험실 관리기준 (GLP), 및 우수 분포 관리기준 (GDP) 표준을 준수할 수 있다. 멸균을 유지하고 보장하는 방법은 고효율 미립자 공기 (HEPA) 여과, 습윤 또는 건조 열, 방사선, 예를 들어 X선, 감마선, 또는 UV 광, 멸균제 또는 훈증제, 예컨대 에틸렌 옥시드, 이산화질소, 오존, 글루타르알데히드, 포름알데히드, 퍼아세트산, 이산화염소, 또는 과산화수소, 멸균 용기의 무균 충전, 플라스틱 필름 또는 랩으로 포장, 또는 진공 밀봉을 포함하나 이에 제한되지는 않는다.

AAV는, 개체에 해를 끼칠 수 있는 잠재적 오염물을 배제하고 비-기능성 중공 캡시드의 정제를 피하면서 기능성 바이러스 입자의 최적 수율을 제공하는 방법으로 정제된다. 이 목적을 위해, AAV는 추출, 동결-해동, 균질화, 투과화, 원심분리, 밀도 구배 원심분리, CsCl 구배 원심분리, 아이오딕사놀 구배 원심분리, 초원심분리, 분별증류, 침전, SDS-PAGE, 천연 PAGE, 크기 배제 크로마토그래피, 액체 크로마토그래피, 기체 크로마토그래피, 소수성 상호작용 크로마토그래피, 이온 교환 크로마토그래피, 음이온 교환 크로마토그래피, 양이온 교환 크로마토그래피, 친화성 크로마토그래피, 헤파린 술페이트 친화성 크로마토그래피, 시알산 친화성 크로마토그래피, 면역친화성 크로마토그래피, 금속 결합 크로마토그래피, 니켈 칼럼 크로마토그래피, 에피토프 태그 정제, 또는 동결건조, 또는 그의 임의의 조합을 포함하나 이에 제한되지는 않는 관련 기술분야에 공지된 기술을 사용하여 정제될 수 있다.

임의의 다른 군의 유기체에서와 같이, 특정 식물은 특성, 예컨대 크기, 성장 속도, 배양의 용이성, 이용가능한 병원체 또는 벡터, 질환 저항성, 외부 조건에 대한 적응성, 광 요건, 유전자 조작의 용이성, 생산된 피토케미칼의 유형, 또는 게놈 서열의 이용가능성으로 인해 연구 또는 생산에 사용하기에 유리한 것으로 밝혀졌다. 이들 특성 또는 임의의 다른 바람직한 특성에 유용한 식물은 니코티아나, 니코티아나 벤타미아나, 니코티아나 타바쿰, 아라비돕시스, 아라비돕시스 탈리아나, 솔라눔, 솔라눔 투베로숨, 솔라눔 리코페르시쿰, 솔라눔 리코페르시코이데스, 칸나비스, 칸나비스 사티바, 파고피룸, 파고피룸 에스쿨렌툼, 오리자, 오리자 사티바, 제아, 제아 메이스, 호르데움, 호르데움 불가레, 셀라기넬라이, 셀라기넬라 모엘렌도르피이, 브라키포디움, 브라키포디움 디스타키온, 로투스, 로투스 자포니쿠스, 렘나, 렘나 기브바, 메디카고, 메디카고 트룬카툴라, 미물루스, 미물루스 구타투스, 피스코미트렐라, 피스코미트렐라 파텐스, 포풀루스, 포풀루스 트리코카르파, 락투카, 락투카 사티바, 또는 아그로박테리움 투메파시엔스에 의해 형질전환될 수 있는 임의의 식물 종을 포함하나 이에 제한되지는 않는다. 일부 실시양태에서, 식물은 니코티아나에 속한다. 일부 바람직한 실시양태에서, 식물은 니코티아나 벤타미아나이다.

아그로박테리움 투메파시엔스는 식물에서 혹(gall), 크라운 혹(crown gall) 또는 종양을 유발하는, 식물에 병원성인 박테리아이다. 에이. 투메파시엔스는 숙주 식물로 전달되는 T-DNA 영역, 및 상기 전달을 수행하는 데 사용되는 유형 IV 분비 메카니즘을 코딩하는 유전자의 병원성 섬 또는 병독성 영역을 포함하는 종양 유도 플라스미드 (Ti 플라스미드)를 통해 이를 달성한다. T-DNA 영역은 식물 호르몬, 예컨대 옥신 및 시토키닌을 합성하는 단백질을 코딩하는 유전자를 포함하며, 이는 혹 또는 종양의 성장을 유발한다. 이들 유전자를 제거하고 (질환의 형성을 없애기 위해), 발현에 바람직한 유전자를 삽입함으로써, 에이. 투메파시엔스는 식물을 유전적으로 조작하기 위한 강력한 도구가 된다. 에이. 투메파시엔스 또는 식물의 성공적인 형질전환은, 예를 들어 네오마이신 포스포트랜스퍼라제의 발현을 통해 네오마이신, 카나마이신 또는 G418 (게니티신)에 대한 저항성에 의해 선택될 수 있다. 에이. 투메파시엔스를 사용한 식물의 형질전환에 대한 보다 많은 정보는 미국 특허 5,792,935 (그 전문이 본원에 명백하게 참조로 포함됨)에서 찾아볼 수 있다.

본원에 사용된 "식물 프로모터"는 전사를 개시하는 코딩 서열의 상류의 비번역 핵산 서열을 지칭한다. 식물은 광 반응성 프로모터, 스트레스 반응성 프로모터, 식물 호르몬 반응성 프로모터, 수크로스 반응성 프로모터, 저-산소 반응성 프로모터 또는 노팔린 신타제 프로모터를 포함하나 이에 제한되지는 않는 특정 환경 조건에 반응성인 프로모터를 가질 수 있다. 식물에서 AAV 및 다른 바이러스 또는 단백질의 생산 및 후속 정제를 위해, 강한 구성적 프로모터가 전형적으로 요구된다. 일부 실시양태에서, 사용된 일부 강한 구성적 프로모터는 콜리플라워 모자이크 바이러스 35S 프로모터, 동부 모자이크 바이러스 프로모터, 오핀 프로모터, 유비퀴틴 프로모터, 벼 액틴 1 프로모터, 또는 옥수수 알콜 데히드로게나제 1 프로모터를 포함하나 이에 제한되지는 않는다. 일부 실시양태에서, pEAQ-HT 벡터는 에이. 투메파시엔스 (아그로침윤)를 사용하여 일시적으로 또는 안정하게 식물을 형질전환시키는 데 사용된다. 이러한 pEAQ 벡터는 T-DNA 내의 동부 모자이크 바이러스 프로모터 서열 (활성을 증진하기 위한 U162C 돌연변이 포함)을 사용하여, 식물에서 외래 바이러스 생산 없이 높은 비율의 단백질 발현을 얻는다. 그러나, 다른 실시양태에서, 상이한 식물 발현 벡터, 예컨대 pBINPLUS, pPZP3425, pPZP5025, pPZPTRBO, pJLTRBO, 또는 pBY030-2R이 사용될 수 있다. pEAQ 벡터에 관한 보다 많은 정보는 미국 특허 8,674,084 (그 전문이 본원에 명백하게 참조로 포함됨)에서 제공된다.

본원에 사용된 용어 "소식물체"는 어린 식물을 지칭한다. 완전히 성장한 식물에 비해 소식물체는 보다 작고, 따라서 취급이 보다 용이하며, 신속한 성장 및 세포 활성을 경험한다. 일부 실시양태에서, AAV의 소규모 정제는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 또는 100개의 소식물체의 사용을 수반한다. 다른 실시양태에서, AAV의 보다 큰 규모의 정제는 적어도 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 5000, 10000, 20000, 30000, 40000, 또는 50000개의 식물을 사용하도록 규모 확대될 수 있다.

본원에 사용된 임의의 주어진 물질, 화합물 또는 재료의 용어 "순도"는 예상된 존재비에 대한 물질, 화합물 또는 재료의 실제 존재비를 지칭한다. 예를 들어, 물질, 화합물 또는 재료는 적어도 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100% (그 사이의 모든 소수 포함) 순수할 수 있다. 순도는 핵산, DNA, RNA, 뉴클레오티드, 단백질, 폴리펩티드, 펩티드, 아미노산, 지질, 세포 막, 세포 파편, 소분자, 분해 산물, 용매, 담체, 비히클 또는 오염물, 또는 그의 임의의 조합을 포함하나 이에 제한되지는 않는 원치않는 불순물에 의해 영향을 받을 수 있다. 일부 실시양태에서, AAV 생성물에는 숙주 세포 단백질, 숙주 세포 핵산, 플라스미드 DNA, 빈 바이러스 벡터, 불완전 단백질 조성 및 올리고머화된 구조를 갖는 AAV 입자, 또는 오염 바이러스, 예를 들어 비 AAV, 지질 외피보유 바이러스, 열 쇼크 단백질 70 (HSP70), 락테이트 데히드로게나제 (LDH), 프로테아솜, 오염 비-AAV 바이러스, 숙주 세포 배양 성분, 공정 관련 성분, 미코플라스마, 발열원, 박테리아 내독소 및 우발적 작용제가 실질적으로 없다. 순도는 전기영동, SDS-PAGE, 모세관 전기영동, PCR, rtPCR, qPCR, 크로마토그래피, 액체 크로마토그래피, 기체 크로마토그래피, 박층 크로마토그래피, 효소-연결 면역흡착 검정 (ELISA), 분광분석법, UV-가시 분광측정법, 적외선 분광측정법, 질량 분광측정법, 핵 자기 공명, 중량측정법, 또는 적정, 또는 그의 임의의 조합을 포함하나 이에 제한되지는 않는 기술을 사용하여 측정될 수 있다.

아그로침윤과 같은 기술을 사용하여 식물 또는 식물 물질에서 AAV 입자를 생산하는 것은 포유동물 또는 곤충 세포에서의 생산과 같은 관련 기술분야에 공지된 기술에 비해 AAV의 순도가 더 높아진다. 일부 실시양태에서, 식물-유래 AAV 입자에는 동물 또는 포유동물 세포 성분, 동물 또는 포유동물-특이적 병원체, 예컨대 바이러스, 박테리아, 원충, 및 진균, 혈청, 소 혈청, 항생제 또는 호르몬, 또는 그의 임의의 조합이 없다.

본원에 사용된 임의의 주어진 물질, 화합물 또는 재료의 용어 "수율"은 예상된 전체 양에 대한 물질, 화합물 또는 재료의 실제 전체 양을 지칭한다. 예를 들어, 물질, 화합물 또는 재료의 수율은 예상되는 전체 양의 적어도 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100% (그 사이의 모든 소수 포함)일 수 있다. 수율은 반응 또는 공정의 효율, 원치 않는 부반응, 분해, 투입 물질, 화합물 또는 재료의 품질, 또는 임의의 제조 단계 동안 목적하는 물질, 화합물 또는 재료의 손실에 의해 영향을 받을 수 있다.

아그로침윤과 같은 기술을 사용하여 식물 또는 식물 물질에서 AAV 입자를 생산하는 것은 포유동물 또는 곤충 세포에서의 생산과 같은 관련 기술분야에 공지된 기술에 비해 AAV의 수율이 더 높아진다. 일부 실시양태에서, 4-6주령의 하나의 소식물체는 적어도 10⁷, 10⁸, 10⁹, 10¹⁰, 10¹¹, 10¹², 10¹³, 또는 10¹⁴개의 AAV 입자를 생산한다.

본 발명은 일반적으로 수많은 실시양태를 기재하기 위해 확정적 언어를 사용하여 본원에 개시된다. 본 발명은 또한 대상, 예컨대 물질 또는 물질, 방법 단계 및 조건, 프로토콜 또는 절차가 전체적으로 또는 부분적으로 배제된 실시양태를 포함한다.

AAV 입자 및 성분

일부 실시양태에서, AAV2 REP 단백질을 코딩하는 서열을 포함하는 핵산 분자가 본원에 개시된다. 일부 실시양태에서, REP 단백질은 REP78, REP68, REP52, 또는 REP 40을 포함한다. 일부 실시양태에서, 서열은 서열식별번호: 2-11에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 일부 실시양태에서, 서열은 서열식별번호: 2에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다.

또한, 일부 실시양태에서, AAV2 CAP 단백질을 코딩하는 서열을 포함하는 핵산 분자가 본원에 개시된다. 일부 실시양태에서, CAP 단백질은 VP1, VP2, 또는 VP3을 포함한다. 일부 실시양태에서, 서열은 서열식별번호: 15-24에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 일부 실시양태에서, 서열은 서열식별번호: 15에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다.

또한, 일부 실시양태에서, AAV2 AAP 단백질을 코딩하는 서열을 포함하는 핵산 분자가 본원에 개시된다. 일부 실시양태에서, 서열은 서열식별번호: 28-37에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 일부 실시양태에서, 서열은 서열식별번호: 28에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다.

또한, 일부 실시양태에서, Ad5 E4orf6 단백질을 코딩하는 서열을 포함하는 핵산 분자가 본원에 개시된다. 일부 실시양태에서, 서열은 서열식별번호: 40-49에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 일부 실시양태에서, 서열은 서열식별번호: 40에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다.

또한, 일부 실시양태에서, 본원에 개시된 핵산 분자 중 어느 하나 이상을 포함하는 재조합 핵산 벡터가 본원에 개시된다. 또한, 일부 실시양태에서, 본원에 개시된 핵산 분자 또는 핵산 벡터 중 어느 하나에 의해 코딩된 단백질이 본원에 개시된다. 또한, 일부 실시양태에서, 본원에 개시된 핵산 분자, 핵산 벡터 또는 단백질 중 어느 하나 이상을 포함하는 AAV 입자가 본원에 개시된다.

또한, 일부 실시양태에서, 본원에 개시된 핵산 분자, 핵산 벡터, 단백질 또는 AAV 입자 중 어느 하나 이상을 포함하는 식물 세포가 본원에 개시된다. 또한, 일부 실시양태에서, 본원에 개시된 식물 세포 중 어느 하나를 포함하는 식물이 본원에 개시된다. 일부 실시양태에서, 식물 세포 또는 식물은 니코티아나, 아라비돕시스, 솔라눔, 칸나비스, 파고피룸, 오리자 또는 제아 속에 속한다. 일부 실시양태에서, 식물은 니코티아나 종이다. 일부 실시양태에서, 식물은 니코티아나 벤타미아나 또는 니코티아나 타바쿰이다.

또한, 일부 실시양태에서, 본원에 개시된 식물 세포 또는 식물 중 어느 하나로부터의 잎, 줄기, 꽃 또는 뿌리가 본원에 개시된다.

제조 및 사용 방법

식물에서 AAV 단백질을 생산하는 방법이 본원에 개시된다. 일부 실시양태에서, 방법은 식물을 적어도 하나의 재조합 핵산 벡터를 포함하는 아그로박테리움 투메파시엔스와 접촉시키는 단계, 적어도 하나의 재조합 핵산 벡터를 식물의 세포로 전달하는 단계, 식물의 세포에서 AAV 단백질을 발현시키는 단계, 및 임의로 식물의 세포로부터 AAV 단백질을 단리하는 단계를 포함한다. 일부 실시양태에서, 적어도 하나의 재조합 핵산 벡터는 AAV 단백질을 코딩하는 핵산 서열을 포함한다. 일부 실시양태에서, 핵산 서열은 식물에서의 발현에 대해 코돈 최적화된다. 일부 실시양태에서, 핵산 서열은 본원에 개시된 핵산 벡터 중 어느 하나의 일부이다. 일부 실시양태에서, 복수의 AAV 단백질이 동일한 식물에서 생산된다. 일부 실시양태에서, AAV 입자는 식물에서 생산되고, AAV 입자는 임의로 식물로부터 단리된다. 일부 실시양태에서, AAV 입자는 포유동물 세포, 임의로 인간 세포, 임의로 HEK293T를 감염시킬 수 있다. 일부 실시양태에서, 식물은 니코티아나, 아라비돕시스, 솔라눔, 칸나비스, 파고피룸, 오리자, 락투카 또는 제아 속에 속한다. 일부 실시양태에서, 식물은 니코티아나 종이다. 일부 실시양태에서, 식물은 니코티아나 벤타미아나 또는 니코티아나 타바쿰이고, 핵산 서열은 니코티아나 벤타미아나 또는 니코티아나 타바쿰에서의 발현에 대해 코돈 최적화된다. 일부 실시양태에서, 식물은 락투카 종이다. 일부 실시양태에서, 식물은 락투카 사티바이고, 핵산 서열은 락투카 사티바에서의 발현에 대해 코돈 최적화된다. 일부 실시양태에서, 식물은 칸나비스 종이다. 일부 실시양태에서, 식물은 칸나비스 사티바이고, 핵산 서열은 칸나비스 사티바에서의 발현에 대해 코돈 최적화된다. 일부 실시양태에서, AAV 단백질을 단리하는 것은 원심분리, 여과 및/또는 크로마토그래피를 포함한다. 일부 실시양태에서, 크로마토그래피는 친화도, 이온 교환, 음이온 교환, 크기 배제 또는 소수성 상호작용 크로마토그래피이다. 일부 실시양태에서, 적어도 하나의 재조합 핵산 벡터는 서열식별번호: 2-11, 15-24, 28-37, 또는 40-49에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 적어도 하나의 서열을 포함한다. 일부 실시양태에서, 식물은 AAV 단백질의 적어도 10⁴, 10⁵, 10⁶, 10⁷, 10⁸, 10⁹, 10¹⁰, 10¹¹, 10¹², 10¹³, 또는 10¹⁴개 카피를 생산한다. 일부 실시양태에서, 식물은 AAV 단백질의 적어도 10¹², 10¹³, 또는 10¹⁴개 카피를 생산한다.

또한, 식물에서 기능성 AAV 입자를 생산하는 방법이 본원에 개시된다. 일부 실시양태에서, 방법은 AAV 입자의 성분 또는 AAV 입자의 어셈블리에 수반되는 성분을 코딩하는 핵산 서열을 포함하는 적어도 하나의 재조합 핵산 벡터로 식물을 형질전환시키는 단계, AAV 입자가 식물에서 발현 및 어셈블리되는 조건 하에 식물을 성장시키는 단계, 및 식물로부터 AAV 입자를 단리하는 단계를 포함한다. 일부 실시양태에서, 식물을 형질전환시키는 단계는 아그로침윤에 의해 수행된다. 일부 실시양태에서, AAV 입자의 성분을 코딩하는 핵산 서열은 식물에 대해 코돈 최적화된다. 일부 실시양태에서, 식물은 니코티아나, 아라비돕시스, 솔라눔, 칸나비스, 파고피룸, 오리자, 락투카 또는 제아 속에 속한다. 일부 실시양태에서, 식물은 니코티아나, 락투카 또는 칸나비스 종이다. 일부 실시양태에서, 식물은 니코티아나 벤타미아나, 니코티아나 타바쿰, 락투카 사티바, 또는 칸나비스 사티바이다. 일부 실시양태에서, AAV 입자의 성분 또는 AAV 입자의 어셈블리에 수반되는 성분은 REP 단백질, CAP 단백질, AAP 단백질, 또는 Ad5 E4orf6 단백질, 또는 그의 임의의 조합을 포함한다.

본원에 개시된 임의의 방법에서, 일부 실시양태에서, REP 단백질은 하류 인-프레임 폴리펩티드의 번역을 증진시키는 약한 식물 코작 서열, 및/또는 잠재 ORF의 잠재적 발현을 방지하기 위한 내부 메티오닌 코돈에서의 돌연변이를 포함하는 핵산 서열에 의해 코딩된다. 일부 실시양태에서, REP 단백질은 서열식별번호: 1-11에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열에 의해 코딩된다. 일부 실시양태에서, REP 단백질은 서열식별번호: 12 또는 13에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 펩티드 서열을 포함한다.

본원에 개시된 임의의 방법에서, 일부 실시양태에서, CAP 단백질은 하류 인-프레임 폴리펩티드의 번역을 증진시키는 약한 식물 코작 서열을 포함하는 핵산 서열에 의해 코딩된다. 일부 실시양태에서, CAP 단백질은 서열식별번호: 14-24에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열에 의해 코딩된다. 일부 실시양태에서, CAP 단백질은 서열식별번호: 25 또는 26에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 펩티드 서열을 포함한다.

본원에 개시된 임의의 방법에서, 일부 실시양태에서, AAP 단백질은 서열식별번호: 27-37에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열에 의해 코딩된다. 일부 실시양태에서, AAP 단백질은 서열식별번호: 38에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 펩티드 서열을 포함한다. 일부 실시양태에서, Ad5 E4orf6 단백질은 서열식별번호: 39-49에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열에 의해 코딩된다. 일부 실시양태에서, Ad5 E4orf6 단백질은 서열식별번호: 50에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 펩티드 서열을 포함한다.

본원에 개시된 임의의 방법에서, AAV 입자를 단리하는 것은 원심분리, 여과 및/또는 크로마토그래피를 포함한다. 일부 실시양태에서, 크로마토그래피는 친화도, 이온 교환, 음이온 교환, 크기 배제 또는 소수성 상호작용 크로마토그래피이다. 일부 실시양태에서, 적어도 10⁴, 10⁵, 10⁶, 10⁷, 10⁸, 10⁹, 10¹⁰, 10¹¹, 10¹², 10¹³, 또는 10¹⁴개의 AAV 입자가 식물로부터 단리된다. 일부 실시양태에서, 적어도 10¹², 10¹³, 또는 10¹⁴개의 AAV 입자가 식물로부터 단리된다. 일부 실시양태에서, AAV 입자는 포유동물 세포, 임의로 인간 세포, 임의로 HEK293T를 감염시킬 수 있다.

본원에 개시된 임의의 방법에서, 방법은 AAV 입자를 포유동물에게 투여하는 것을 추가로 포함한다. 일부 실시양태에서, 포유동물은 인간이다.

유전자 요법의 방법이 또한 본원에 개시된다. 일부 실시양태에서, 방법은 본원에 개시된 방법 중 어느 하나에 의해 생산 및 단리된 AAV 입자를 이를 필요로 하는 대상체의 세포에 투여하는 것을 포함한다.

또한, 의약으로서 사용하기 위한 본원에 개시된 재조합 핵산 벡터 또는 AAV 입자가 본원에 개시된다.

또한, 인간 질환을 치료하기 위한 유전자 요법에 사용하기 위한 본원에 개시된 재조합 핵산 벡터 또는 AAV 입자가 본원에 개시된다. 일부 실시양태에서, 인간 질환은 대사에서의 선천성 이상, 효소 결핍, 폼페병, 다논병, 신경변성 장애, 파킨슨병, 알츠하이머병, 운동 뉴런 질환, 근육 이영양증, 뒤시엔느 근육 이영양증, 망막 변성 질환, 색소성 망막염, 어셔 증후군, 스타르가르트병, 또는 난청의 유전적 원인이다.

또한, 질환의 치료에 사용하기 위한 본원에 개시된 임의의 방법에 의해 생산된 AAV 입자가 본원에 개시된다.

또한, 의약의 제조에 사용하기 위한 본원에 개시된 임의의 방법에 의해 생산된 AAV 입자가 본원에 개시된다.

실시예

상기 논의된 실시양태의 일부 측면은 하기 실시예에 추가로 상세하게 개시되며, 이는 어떠한 방식으로도 본 개시내용의 범주를 제한하는 것으로 의도되지 않는다. 관련 기술분야의 통상의 기술자는 여러 다른 실시양태가 또한 상기 본원 및 청구범위에 기재된 바와 같이 본 발명의 범주 내에 속한다는 것을 인지할 것이다.

실시예 1: AAV 서열

AAV2 REP, CAP, 및 AAP 및 Ad5 E4orf6의 야생형 핵산 서열을 니코티아나 벤타미아나, 니코티아나 타바쿰, 아라비돕시스 탈리아나, 솔라눔 투베로숨, 칸나비스 사티바, 파고피룸 에스쿨렌툼, 오리자 사티바, 제아 메이스, 솔라눔 리코페르시코이데스, 솔라눔 리코페르시쿰, 또는 락투카 사티바를 포함하나 이에 제한되지는 않는 여러 식물에서의 발현에 대해 코돈 최적화하였다. 이들 핵산 서열은 표 1에 제시된다. 상응하는 번역된 단백질 서열이 표 2에 제시된다.

표 1: 바이러스 성분의 핵산 서열

표 2: 바이러스 성분의 단백질 서열

본원에 나타낸 바와 같은 REP (서열식별번호: 2-11) 및 CAP (서열식별번호: 15-24)의 모든 식물 코돈 최적화된 cDNA 서열에 대한 핵산 서열은 야생형 서열 (서열식별번호: 1 및 14)과 비교하여 뉴클레오티드 차이를 갖도록 조작되었다. 변형된 REP 서열은 서열 GGGTTTATGACTGGT (서열식별번호: 54)로 시작하여 하류 인-프레임 폴리펩티드의 번역을 증진시키는 약한 식물 코작 서열 (즉, REP52)을 형성하고, 변형된 CAP 서열은 서열 GGGTTTATGACTGGCCGCCGGTTAT (서열식별번호: 55)로 시작하여 하류 인-프레임 폴리펩티드의 번역을 증진시키는 약한 식물 코작 서열 (즉, VP2, VP3)을 형성한다. 야생형 REP는 서열식별번호: 12로 번역되고, 야생형 CAP는 서열식별번호: 25로 번역된다. 식물 코돈 최적화된 REP는 서열식별번호: 13으로 번역되고, 식물 코돈 최적화된 CAP는 서열식별번호: 25로 번역된다. 식물 코돈 최적화된 단백질 AAP (서열식별번호: 38) 및 E4orf6 (서열식별번호: 50)은 야생형에서 변하지 않는다.

REP에 대한 식물 코돈 최적화된 서열을 변형시켜 4종의 인-프레임 단백질인 REP78, REP68, REP52 및 REP40의 발현 또는 발현 비를 증진시켰다. 코돈 2 (CCG, 프롤린)를 (ACT, 트레오닌으로) 치환하여 약한 코작 서열을 생성하였고, 이는 누출성 mRNA 리보솜 스캐닝에 의해 내부 개시 코돈으로 개시되는 REP52 및 REP40의 발현 속도를 증가시켰다. 또한, 내부 메티오닌 잔기 (M43, M91, M103 및 M172)를 류신으로 돌연변이시켜 REP78과 REP52 ATG 개시 코돈 사이의 인 프레임 개시 코돈을 제거함으로써 잠재 ORF의 잠재적 발현을 방지하였다. REP52 및 REP40은 코돈 225에서 개시된다. 이들 돌연변이 중 어느 하나 이상은 임의적인 것으로 구상된다.

유사하게, CAP에 대한 식물 코돈 최적화된 서열을 변형시켜 3종의 인-프레임 단백질인 VP1, VP2 및 VP3의 발현 또는 발현 비를 증진시켰다. 야생형 서열의 CAP의 처음 6개의 아미노산 (VP1의 처음 6개의 아미노산에 상응함)은 MAADGY이다. 식물 코돈 최적화된 서열의 경우, 이들 아미노산을 MTAAGY로 변화시켜 약한 코작 서열을 생성하였고, 이는 누출성 mRNA 리보솜 스캐닝에 의해 내부 개시 코돈으로 개시되는 VP2 및 VP3의 발현 속도를 증가시켰다. VP2는 코돈 138에서 대안적 개시 코돈 ACG로 개시되고, VP3은 코돈 203에서 ATG로 개시된다. 이들 돌연변이 중 어느 하나 이상은 임의적인 것으로 구상된다.

식물에서 AAV 생산을 개선하기 위한 REP 및 CAP에 대한 이들 핵산 및 아미노산 변화가 엔. 벤타미아나로 예시되지만, 이들은 또한 엔. 벤타미아나, 엔. 타바쿰, 에이. 탈리아나, 에스. 투베로숨, 씨. 사티바, 에프. 에스쿨렌툼, 오. 사티바, 지. 메이스, 에스. 리코페르시코이데스, 에스. 리코페르시쿰 및 엘. 사티바에 대해 코돈 최적화된 및 전사 최적화된 cDNA 및 단백질 서열에 구현된 바와 같이, 예상되는 문제 또는 제한 없이 본원에 열거된 다른 식물 또는 임의의 다른 유전적으로 다루기 쉬운 식물에 적용된다.

AAV2 REP (도 1), AAV2 CAP (도 2), AAV2 AAP (도 3), 및 Ad5 E4orf6 (도 4)에 대한 엔. 벤타미아나, 에이. 탈리아나, 에스. 투베로숨, 씨. 사티바, 에프. 에스쿨렌툼, 오. 사티바, 지. 메이스, 에스. 리코페르시코이데스, 에스. 리코페르시쿰, 및 엘. 사티바 코돈 최적화된 cDNA 서열을 이용한 핵산 서열 정렬이 제공된다.

필요한 코돈 최적화된 AAV2 및 Ad5 서열을 pEAQ-HT 식물 침윤 벡터 내로 삽입하였다. 강한 구성적 시토메갈로바이러스 (CMV) 포유동물 프로모터에 의해 구동된 EGFP를 포함하는 코돈 최적화된 REP 핵산 서열 및 코돈 최적화된 ITR-플랭킹된 트랜스진 (서열식별번호: 51)을 플라스미드 pEAQ-HT-REPopt_AVGFPopt (도 6) 내로 삽입하였다. 코돈 최적화된 AAP 및 E4orf6 핵산 서열을 플라스미드 pEAQ-HT-Ad5Orf6-OPT_AAV2-AAP-OPT (도 7) 내로 삽입하였다. 코돈 최적화된 CAP 핵산 서열을 플라스미드 pEAQ-HT_CAPopt (도 8) 내로 삽입하였다. 식물 세포에서의 이들 3종의 플라스미드의 공동 발현은 완전히 어셈블리된 AAV2-CMV-EGFP 바이러스 입자를 생성한다.

실시예 2: 엔. 벤타미아나의 번식

발아 프로토콜

1. 그로단 암면 큐브 (2"x2"x1.5")를 pH 5.8-6.2에서 5분 동안 80 ppm의 비료 용액 중에 침지시킴으로써 제조하였다. 비료의 한 예는 0.25 mL/L로 첨가된 슈퍼트리브(SuperThrive) 비타민 용액으로 보충된 0.2-2 g/L의 VEG+BLOOM RO/소프트 (히드로포닉 리서치(Hydroponic Research))이다.

2. 엔. 벤타미아나 종자를 제조된 암면 큐브 각각의 상부에 놓았다.

3. 시딩된 큐브를 성장 트레이에 위치시키고, 습도 돔을 트레이 상에 위치시켰다. 배기구를 약간 개방하여 공기 교환을 허용하였다.

4. 트레이 및 돔을 온실에 넣었다. 태양광에서 발아되는 경우, 쉐이드-클로스를 돔 상에서 사용하였다. 성장광 하에 발아되는 경우, 차광이 필요하지 않았다. 광 주기를 16시간 명 및 8시간 암 주기 (16L/8D)로 설정하였다. 온실 조건에서, 담배가 조기에 개화되지 않도록 빛이 충분한 시간 동안 존재하는 것을 보장하기 위해 보조 조명을 추가하였다.

5. 발아 동안 온도를 75 내지 80℉로 유지하였다. 온도는 65℉ 미만으로 떨어지지 않아야 한다. 묘목의 뿌리 발달은 저온 적용 시 심각하게 손상될 수 있다.

6. 암면 표면을 항상 습윤 상태로 유지하였다. 이는 분무 병으로부터의 광 미스팅에 의해 달성되었다. 격일로, 각각의 암면 개시 큐브를 집어 들고, 접촉을 통해 수분에 대해 시험하였다. 건조된 경우, 큐브를 만졌을 때 습윤할 때까지 분무 병의 용액으로 큐브를 미스팅하였다. 과습하지 않도록 주의하였다. 과습은 묘목의 뿌리 발달을 방해할 것이다.

7. 묘목을 최적 조건 하에 유지시켰을 때, 7-14일 이내에 발아가 관찰되었다. 두 종자가 발아되면, 큐브당 하나의 식물만이 존재하도록 하나를 선택하여 제거하였다.

8. 성장이 관찰되면 습도 돔을 제거하였다.

9. 큐브를 습윤 상태로 유지하고, 뿌리가 큐브의 바닥으로부터 돌출된 것으로 관찰될 때까지 분무 병으로 공급하였다.

성장 및 매니큐어링 가이드라인

다수의 뿌리가 2"x2"x1.5" 그로단 큐브의 바닥으로부터 돌출되기 시작함에 따라, 이들을 그로단 델타 4 큐브 (3"x3"x2.5")로 옮겼다. 이들 큐브를 발아 프로토콜에 약술된 바와 동일한 방식으로 제조하였다. 식물을 발아 동안과 동일한 조건 하에 성장시켰다. 습도 돔은 사용하지 않았다. 이 단계는 전형적으로 묘목이 암면으로부터 발아하기 시작한 후 7-10일에 일어났다.

식물이 발아 단계에서 식생 단계로의 이행을 시작함에 따라, 정단 성장 눈을 제거하였다. 이 과정은 또한 통상적으로 토핑(topping)으로 지칭된다. 이는 상당한 영양 잎 성장을 가능하게 할 것이다. 토핑 과정 직후에, 침윤 프로토콜을 수행하였다.

토핑 후, 심한 뿌리순(sucker) 성장 (겨드랑눈), 정단눈, 및 아마도 심지어 칼릭스 성장 (꽃눈)이 관찰되었다. 식물이 침윤된 잎의 성장에 집중하게 하여 관심 잎에서 더 많은 바이오매스를 제공하도록 하기 위해 이들 성장을 제거하는 것이 매우 중요하다.

이 과정은 적어도 2주 동안, 또는 잎 내부에서 바이러스 캡시드의 발현을 허용하기 위해 필요한 것으로 시험을 통해 결정된 기간 동안 매일 계속되었다.

실시예 3: AAV2-CMV-EGFP 헬퍼 플라스미드를 함유하는 아그로박테리움 투메파시엔스를 사용한 엔. 벤타미아나의 침윤

AAV2-CMV-EGFP의 생산을 위한 플라스미드 (pEAQ-HT-Ad5Orf6-OPT_AAV2-AAP-OPT, pEAQ-HT_CAPopt, 또는 pEAQ-HT-REPopt_AVGFPopt)를 제조업체 권장사항에 상술된 바와 같이 전기천공을 통해 에이. 투메파시엔스 균주 AGL1, GV3101 또는 LBA4404 (인택트 게노믹스 인크.(Intact Genomics Inc.)) 내로 형질전환시켰다. 간략하게, 적격 세포를 얼음 상에서 해동시키고, 형질전환시킬 DNA (1 μL)를 얼음 상에서 예냉된 튜브에 첨가하였다. 세포가 해동되었을 때, 이를 얼음 상에서 냉각된 DNA에 첨가하고 (25 μl), 탭핑에 의해 서서히 혼합하였다. 세포/DNA 혼합물 (26 μl)을 버블의 도입 없이 냉각된 1 mm 전기천공 큐벳 내로 피펫팅하고, 전기천공하였다 (지수 모드, 1800V, 25μFD, 200ohms). 회수 배지를 즉시 첨가하고 (976 μL), 회수 배지 중 전기천공된 세포를 에펜도르프 튜브로 옮기고, 200 rpm에서 진탕시키면서 30℃에서 3시간 동안 인큐베이션한 후, 선택 배지 상에 플레이팅하고, 30℃에서 2일 동안 배양하였다. 사인스베리(Sainsbury) 및 로모노소프(Lomonossoff)의 변형된 프로토콜을 사용하여, 개별 헬퍼 플라스미드로 형질전환된 에이. 투메파시엔스 균주를 침윤을 위해 제조하였다 (문헌 [Plant Physiol. 2008; 148(3):1212-8]). 간략하게, 재조합 박테리아의 단일 콜로니를 카나마이신 (100 mg/L) 및 리팜피신 (50 mg/L)을 함유하는 액체 LB 레녹스 또는 밀러 배지에 접종하였다. 배양물을 진탕하면서 28℃에서 밤새 인큐베이션하였다. 박테리아를 원심분리 (5분 동안 14,000xg)에 의해 펠릿화하고, 최적화된 침윤 완충제 (100 mM MES pH 5.6, 10 mM MgCl₂, 300 μM 아세토시린곤, 5 μM α-리포산, 0.002% 플루로닉 F-68) 중에 OD₆₀₀ = 1.0으로 재현탁시켰다. 이어서, 배양물을 서서히 요동시키면서 2-4시간 동안 실온에서 인큐베이션하였다. 소규모 실험을 위해, 무딘 팁을 갖는 플라스틱 시린지를 사용하고 완만한 압력을 적용하여 박테리아를 3-6주령 소식물체의 잎의 하부로 전달하였다. 전체 식물 침윤을 위해, 3-6주령 소식물체를, 상기 생성된 헬퍼 플라스미드로 형질전환된 아그로박테리움 균주를 함유하는 진공 데시케이터 유닛 내부에서 1-3 L의 침윤 완충제 중에 완전히 침지시켰다. 데시케이터 유닛을 밀봉하고, 100 mBar의 진공을 1분 동안 적용한 다음 진공을 해제함으로써 소식물체를 침윤시켰다. 이를 2회 반복하였다. 두 경우 모두, 개별 헬퍼 플라스미드를 함유하는 재조합 박테리아 균주를 침윤 직전에 1:1:1 비 (pEAQ-HT-Ad5Orf6-OPT_AAV2-AAP-OPT : pEAQ-HT_CAPopt : pEAQ-HT-REPopt_AVGFPopt)로 혼합하였다. 침윤 2일 후에 전체 식물을 열 쇼크에 적용하여 (30분 동안 37℃) 일시적 헬퍼 단백질 발현을 증가시켰다.

실시예 4: 엔. 벤타미아나 잎 조직으로부터의 AAV2-CMV-EGFP의 정제

아그로침윤된 엔. 벤타미아나 잎을 멸균 정원 전단을 사용하여 가능한 한 식물의 기부에 근접하게 제거하였다. 제거 시, 잎을 이산화염소 훈증 챔버에 넣어 10분 동안 소독한 후, 멸균 탈이온 증류수로 3회 세척하였다. 소독된 잎으로부터의 총 잎 단백질을 제조업체의 지침서에 따라 해밀턴 블렌더를 사용하여 추출 완충제 (25 mM 인산나트륨, 100 mM NaCl, 50 mM 아스코르브산나트륨, 2 mM PMSF, pH 5.75)로 균질화함으로써 추출하였다. 조 식물 추출물을 4℃에서 10분 동안 14,000xg에서 원심분리에 의해 정화하였다.

4℃에서 1시간 인큐베이션 후, 균질물을 4℃에서 30분 동안 6,000xg에서 원심분리하여 잎 파편 및 풍부한 식물 광합성 효소 리불로스 1,5-비스포스페이트 카르복실라제-옥시게나제 (루비스코(RuBisCO))를 제거하였다. 이어서, 상청액을 4℃에서 24시간 동안 인큐베이션하고, 4℃에서 30분 동안 6,000xg에서 원심분리하여 인큐베이션 동안 침전된 루비스코를 추가로 제거하였다. 이 과정을 총 3회 반복하여 잔류 루비스코를 완전히 제거하였다. 이어서, 상청액을 0.22 μM 필터 (밀리포어)로 여과하였다. 이어서, 정화된 상청액을 100 kDa 폴리에테르술폰 접선 (PES TFF) 막 (폴 코포레이션(Pall Corporation))을 사용한 한외여과/투석여과 (UF/DF)를 이용하여 농축시켜, 재조합 AAV2 입자를 보유하면서 임의의 잔류 식물-유래 소분자를 제거하였다. 이어서, 조 rAAV2 입자를 함유하는 사전-여과된 정화된 상청액을 순차적 친화도 및 이온 교환 크로마토그래피에 의해 추가로 정제하였다. 간략하게, rAAV 벡터를 함유하는 정화된 세포 용해물을 AVB 세파로스 HP 칼럼 (지이 라이프 사이언시스(GE Life Sciences)) 상에 로딩하였다. 결합된 rAAV 입자를 갖는 칼럼을 세척 완충제 (20 mM 트리스 HCl, 0.5 M NaCl, pH 8.0)로 세척하여 A₂₆₀ 및 A₂₈₀에서의 흡광도에 의해 측정된 모든 미결합 단백질 및 오염물을 제거하였다. 이어서, 결합된 rAAV를 저-pH 완충제로 용리시켰다. 용리 전에 1 M 트리스-HCl (pH 8.7)을 분획 부피의 1/10로 분획 수집 튜브에 직접 첨가함으로써 용리된 rAAV 용액을 즉시 중화시켰다. AVB 친화도 정제 후에, AAV 벡터를 결합 및 포로스(POROS) 50HQ (써모피셔(ThermoFisher)) 음이온 교환 칼럼으로부터의 용리에 의해 음이온 교환 크로마토그래피를 사용하여 추가로 정제하여, 비어있는 입자를 완전 (게놈 함유) 입자로부터 분리하였다. 결합된 AAV 캡시드를 10-mM 내지 300-mM 트리스-아세테이트 구배 (pH 8)의 존재 하에 전도도를 증가시키면서 용리시키고, 전체 rAAV2 입자에 대해 농축된 순차적 분획을 수집하고, 풀링한 다음, 비바스핀 15R 30kD 투석여과 칼럼을 통해 3,000xg로 회전시킴으로써 제제 완충제 (180 mM NaCl, 10 mM 인산나트륨, 0.001% 플루로닉 F-68) 내로 투석여과하였다. 이를 매회 제제 완충제의 첨가로 3회 반복하였다. 이어서, 정제 및 농축된 rAAV2-CMV-EGFP 바이러스 벡터를 저 단백질 결합 튜브 내로 분취하고, -80℃에서 저장하였다.

실시예 5: qPCR을 사용한 잎 조직으로부터 정제된 AAV2-CMV-EGFP의 적정

정제된 rAAV-CMV-EGFP 바이러스 입자 (2 μL) 및 공지된 게놈 역가를 갖는 AAV2-CMV-EGFP 참조 대조군 벡터 (ATCC #VR-1616) (2 μL)를 50 μL의 AAV PCR 알칼리성 소화 완충제 (25 mM NaOH, 0.2 mM EDTA)를 사용하여 100℃에서 10분 동안 변성시켰다. 이어서, 샘플을 얼음 상에서 냉각시키고, 50 μL의 중화 완충제 (40 mM 트리스-HCl, pH 5.0)를 첨가하여 중화시켰다. 각각의 샘플에 대해, SYBR 그린 qPCR 마스터 믹스(SYBR Green qPCR Master Mix) (시그마(Sigma)), 및 보존된 ITR 서열 (정방향: 5'-GGAACCCCTAGTGATGGAGTT-3' (서열식별번호: 52), 역방향: 5'-CGGCCTCAGTGAGCGA-3 (서열식별번호: 53))에 의해 EGFP 트랜스진을 증폭시키도록 설계된 프라이머를 사용하여 정량적 PCR 반응을 삼중으로 설정하였다. AAV2 참조 표준물을 동일한 마스터 믹스를 사용하여 동일하게 제조하고, 1x10⁹개 바이러스 게놈/mL (vg/ml) 내지 1x10⁴개 vg/ml 범위의 참조 벡터의 로그 희석 시리즈를 제조함으로써 표준 곡선을 생성하였다. 상대적 주기 정량화 (C_q) 값을 참조 표준 곡선에 피팅함으로써 식물-생산된 AAV2-CMV-EGFP의 역가를 계산하였다.

실시예 6: 식물-생산된 AAV2-CMV-EGFP의 qPCR 정량화

아그로박테리움 내로 형질전환된 식물 코돈 최적화 AAV2 생산자 플라스미드의 일시적 진공 매개 침윤에 의해 AAV2-CMV-EGPF 벡터를 생산하였다. 시험된 식물은 엔. 벤타미아나, 엔. 타바쿰, 엘. 사티바, 및 씨. 사티바였다. 엘. 사티바 및 씨. 사티바 샘플을 이중으로 수행하였다. 침윤 5일 후에 식물 잎을 수거하고, 추출하고, AAV2-CMV-EGFP 입자를 식물 단백질의 낮은 pH 침전, 및 이어서 본원에 기재된 바와 같은 원심분리, 여과 및 농축을 사용하여 정제하였다. 정제된 AAV2-CMV-EGFP 벡터 제제를 DNAse I로 처리하여 임의의 비-캡시드화 DNA를 제거하고, AAV2 특이적 ITR을 표적화하는 프라이머로 정량적 실시간 PCR을 사용하여 배치를 적정하였다 (실시예 5에 기재된 바와 같음). 공지된 양의 선형화된 AAV2-CMV-EGFP 플라스미드의 표준 곡선에 비교함으로써 식물당 상대 게놈 수율을 계산하였다. 식물당 10¹² 내지 10¹⁴개 바이러스 게놈의 범위를 정량화하였고, 엔. 벤타미아나가 바이러스 게놈의 최대 상대 수율을 생성하였다 (도 9).

실시예 7: 잎 조직에서 생산된 AAV2-CMV-EGFP의 단백질 함량 및 순도의 평가

정제 및 농축된 rAAV 입자의 순도를 은 염색 또는 다른 상용성 염색을 사용한 SDS-PAGE에 의해 평가하였다. 2 부피의 정제된 rAAV 제제 (예를 들어, 2 μL 및 6 μL)를 환원 트리스-글리신 SDS 샘플 완충제 중에서 15 μL의 최종 부피로 직접 변성시키고, 95℃로 5분 동안 가열하였다. AAV2 참조 표준물 (ATCC)의 부피 범위 (예를 들어, 0.5, 1, 2, 3, 및 4 μL)를 동일한 방식으로 프로세싱하였다. 동등 부피의 샘플을 SDS-PAGE 겔 상에 로딩하고, 50-200 V에서 1-3시간 동안 또는 염료 전면이 겔에서 흘러내릴 때까지 실행하였다. 겔을 제조업체의 지침서 또는 관련 기술분야에 공지된 프로토콜에 따라 은 염색을 위해 프로세싱하였다. 순수한 rAAV 샘플은 VP1 (87 kDa), VP2 (73 kDa), 및 VP3 (62 kDa)에 상응하는 단지 3개의 밴드를 생성할 것이다.

순도는 또한 관련 기술분야에 공지된 다른 기술, 예컨대 모세관 전기영동 또는 질량 분광측정법에 의해 평가될 수 있다.

실시예 8: AAV2-CMV-EGFP 생산 식물로부터의 잎 용해물로부터 SDS-PAGE에 의한 AAV2 VP1/2/3 캡시드 단백질의 검출

아그로박테리움 내로 형질전환된 식물 코돈 최적화된 AAV2 생산자 플라스미드의 진공 매개 침윤에 의해 AAV2-CMV-EGFP 벡터를 엔. 벤타미아나, 엘. 사티바 (2개의 복제물), 및 씨. 사티바 (2개의 복제물)에서 생산하였다. 침윤 5일 후에 식물 잎을 수거하고, 풍부한 식물 단백질의 낮은 pH 침전, 및 이어서 본원에 기재된 바와 같은 원심분리, 0.45 μm 여과, 및 농축을 사용하여 용해물을 생산하였다. 잎 용해물 중 총 단백질을 BCA 검정을 사용하여 정량화하고, 상이한 양의 총 단백질 (5 μg 및 15 μg)을 4-12% 비스-트리스 SDS-PAGE 겔 상에 로딩하고, 190 mV에서 1시간 동안 실행하였다. 단백질을 오리올(Oriole) 형광 단백질 염색을 사용하여 검출하고, 바이오라드 겔 이미저 상에서 가시화하였다. VP1, VP2, 및 VP3 단백질에 상응하는 강건한 밴드가 엔. 벤타미아나 및 엘. 사티바 잎 용해물에서 검출되었다 (도 10a).

정제 후에 엔. 벤타미아나 잎 용해물로부터의 상이한 양의 총 단백질 (5 μg, 10 μg, 25 μg, 50 μg)을 4-12% 비스-트리스 SDS-PAGE 겔 상에 로딩하고, 190 mV에서 1시간 동안 실행하였다. 단백질을 니트로셀룰로스 막 상으로 옮기고, 항-AAV2 VP 모노클로날 1차 항체 및 항-마우스 HRP 2차 항체를 사용하여 웨스턴 블롯팅을 수행하여 AAV2 VP1, VP2, 및 VP3 캡시드 단백질을 검출하였다 (도 10b).

실시예 9: 잎 조직으로부터 정제된 AAV2-CMV-EGFP를 사용한 조직 배양 세포의 감염

HEK 293T 세포 (ATCC #CRL-11268)를 1 mL의 성장 배지 (DMEM 고 글루코스, 1x 글루타맥스(GlutaMAX) (코닝(Corning)), 10% FBS, 1% 페니실린-스트렙토마이신) 중에서 12-웰 배양 플레이트에 웰당 5x10⁴개 세포의 밀도로 플레이팅하였다. 플레이팅 6-8시간 후에, 개별 웰을 세포당 500 내지 5000개 바이러스 게놈 (vg) 범위의 감염 다중도 (MOI)로 식물-생산된 rAAV2-CMV-EGFP로 감염시켰다. 감염된 세포를 37℃, 5% CO₂에서 36시간 동안 인큐베이션한 다음, EGFP에 적합한 여기 및 방출 필터를 갖는 도립 형광 현미경을 사용하여 웰당 감염성을 평가하였다.

실시예 10: 식물 생산된 AAV2-CMV-EGFP로 처리된 HEK293T 세포에서의 EGFP 발현

아그로박테리움 내로 형질전환된 식물 코돈 최적화된 AAV2 생산자 플라스미드의 일시적 진공 매개 침윤에 의해 AAV2-CMV-EGFP 벡터를 엔. 타바쿰 식물에서 생산하였다. 침윤 5일 후에 식물 잎을 수거하고, 추출하고, AAV2-CMV-EGFP 입자를 식물 단백질의 낮은 pH 침전, 및 이어서 본원에 기재된 바와 같은 원심분리, 여과 및 농축을 사용하여 정제하였다. 정제 및 적정된 AAV2-CMV-EGFP 벡터를 특이적 감염 다중도 (HEK293T 세포당 2.7x10⁴, 2.7x10³, 또는 2.7x10²개 바이러스 게놈)로 4 챔버 슬라이드 플라스크에서 성장시킨 HEK293T 세포에 직접 첨가하였다. 감염 4일 후 천연 EGFP 발현에 대해 세포를 영상화하였다. HEK293T 세포에서의 양성, MOI-의존성 EGFP 발현을 형광 현미경검사에 의해 관찰하였다 (도 11).

실시예 11: 유전자 요법을 위한 정제된 AAV2 입자의 사용

상기 실시예에서 생산된 재조합 AAV2 바이러스 입자는 무손상 및 감염성이다. 이들 입자는 유전자 요법 목적 또는 다른 치료 목적을 위해 사용될 수 있다. 입자는 생체외 및 생체내 치료 또는 적용에 사용될 수 있다. 입자는 기관, 조직, 암 또는 종양에 경장으로, 비경구로, 경구로, 설하로, 협측으로, 비강내로, 안구내로, 귀내로, 경막외로, 표피로, 동맥내로, 정맥내로, 문맥내로, 관절내로, 근육내로, 피내로, 복막으로, 피하로, 또는 직접 투여될 수 있다. 입자는 또한 환자 또는 개체로부터의 단리된 세포, 예컨대 T 세포, 자연 킬러 세포, B 세포, 대식세포, 림프구, 줄기 세포, 골수 세포 또는 조혈 줄기 세포에 투여될 수 있다. 식물로부터 정제된 입자는 다른 방법에 의해, 예컨대 포유동물 세포 배양 또는 곤충 세포 배양으로부터 정제된 바이러스 입자에 비해 개선된 안전성 프로파일, 수율 및 효능을 제공한다.

상기 기재된 실시양태 중 적어도 일부에서, 실시양태에 사용된 하나 이상의 요소는 이러한 대체가 기술적으로 실현가능하지 않는 한 또 다른 실시양태에서 상호교환가능하게 사용될 수 있다. 관련 기술분야의 통상의 기술자는 청구된 대상의 범주로부터 벗어나지 않으면서 상기 기재된 방법 및 구조에 대해 다양한 다른 생략, 부가 및 변형이 이루어질 수 있음을 알 것이다. 이러한 모든 변형 및 변화는 첨부된 청구범위에 의해 정의된 바와 같은 대상의 범주 내에 속하는 것으로 의도된다.

본원에서 실질적으로 임의의 복수 및/또는 단수 용어의 사용과 관련하여, 관련 기술분야의 통상의 기술자는 문맥 및/또는 적용에 적절한 바와 같이 복수에서 단수로 및/또는 단수에서 복수로 해석할 수 있다. 다양한 단수/복수 순열은 명확성을 위해 본원에 명백하게 기재될 수 있다.

일반적으로, 본원, 특히 첨부된 청구범위 (예를 들어, 첨부된 청구범위의 본문)에 사용된 용어는 일반적으로 "개방" 용어로서 의도된다는 것이 관련 기술분야의 통상의 기술자에 의해 이해될 것이다 (예를 들어, 용어 "포함하는"은 "포함하나 이에 제한되지는 않는"으로서 해석되어야 하고, 용어 "갖는"은 "적어도 갖는"으로서 해석되어야 하고, 용어 "포함하다"는 "포함하나 이에 제한되지는 않는다" 등으로 해석되어야 함). 특정 수의 도입된 청구항 인용이 의도되는 경우, 이러한 의도는 청구항에서 명백하게 인용될 것이고, 이러한 인용의 부재 하에 이러한 의도는 존재하지 않는다는 것이 관련 기술분야의 통상의 기술자에 의해 추가로 이해될 것이다. 예를 들어, 이해를 돕기 위해, 하기 첨부된 청구범위는 청구범위 인용을 도입하기 위해 도입 어구 "적어도 하나" 및 "하나 이상"의 사용을 함유할 수 있다. 그러나, 이러한 어구의 사용은 단수 형태 "하나"에 의한 청구항 인용의 도입이 이러한 도입된 청구항 인용을 함유하는 임의의 특정 청구항을 오직 하나의 이러한 인용을 함유하는 실시양태로 제한함을 의미하는 것으로 해석되어서는 안되며 (동일한 청구항이 도입 어구 "하나 이상" 또는 "적어도 하나" 및 단수 형태, 예컨대 "하나"를 포함하더라도 (예를 들어, "하나"는 "적어도 하나" 또는 "하나 이상"을 의미하는 것으로 해석되어야 함)); 동일한 것이 청구항 인용을 도입하는 데 사용되는 정관사의 사용에 적용된다. 또한, 특정 수의 도입된 청구항 인용이 명백하게 인용되더라도, 관련 기술분야의 통상의 기술자는 이러한 인용이 적어도 인용된 수를 의미하는 것으로 해석되어야 함을 인식할 것이다 (예를 들어, 다른 수식어 없이 "2개의 인용"의 있는 그대로의 인용은 적어도 2개의 인용, 또는 2개 이상의 인용을 의미함). 또한, "A, B 및 C 중 적어도 하나 등"과 유사한 관례가 사용되는 경우, 일반적으로 이러한 구성은 관련 기술분야의 통상의 기술자가 관례를 이해하는 의미로 의도된다 (예를 들어, "A, B 및 C 중 적어도 하나를 갖는 시스템"은 A 단독, B 단독, C 단독, A 및 B 함께, A 및 C 함께, B 및 C 함께, 및/또는 A, B 및 C 함께 등을 갖는 시스템을 포함하나 이에 제한되지는 않음). "A, B 또는 C 중 적어도 하나 등"과 유사한 관례가 사용되는 경우, 일반적으로 이러한 구성은 관련 기술분야의 통상의 기술자가 관례를 이해하는 의미로 의도된다 (예를 들어, "A, B 또는 C 중 적어도 하나를 갖는 시스템"은 A 단독, B 단독, C 단독, A 및 B 함께, A 및 C 함께, B 및 C 함께, 및/또는 A, B 및 C 함께 등을 갖는 시스템을 포함하나 이에 제한되지는 않음). 추가로, 상세한 설명, 청구범위 또는 도면에서든, 2개 이상의 대안적 용어를 제시하는 사실상 임의의 이접 단어 및/또는 어구는 용어 중 하나, 용어 중 어느 하나 또는 둘 다의 용어를 포함할 가능성을 고려하는 것으로 이해되어야 한다는 것이 관련 기술분야의 통상의 기술자에 의해 이해될 것이다. 예를 들어, 어구 "A 또는 B"는 "A" 또는 "B" 또는 "A 및 B"의 가능성을 포함하는 것으로 이해될 것이다.

또한, 본 개시내용의 특색 또는 측면이 마쿠쉬 군의 관점에서 기재되는 경우, 관련 기술분야의 통상의 기술자는 본 개시내용이 또한 마쿠쉬 군의 임의의 개별 구성원 또는 구성원의 하위군의 관점에서 기재된다는 것을 인식할 것이다.

관련 기술분야의 통상의 기술자에 의해 이해되는 바와 같이, 임의의 및 모든 목적을 위해, 예컨대 서면 설명을 제공하는 관점에서, 본원에 개시된 모든 범위는 또한 임의의 및 모든 가능한 하위-범위 및 그의 하위-범위의 조합을 포괄한다. 임의의 열거된 범위는 동일한 범위를 적어도 동등한 1/2, 1/3, 1/4, 1/5, 1/10 등으로 나눌 수 있도록 충분히 설명하고 가능하게 하는 것으로 용이하게 인식될 수 있다. 비제한적 예로서, 본원에 논의된 각각의 범위는 하위 1/3, 중간 1/3 및 상위 1/3 등으로 용이하게 나눌 수 있다. 관련 기술분야의 통상의 기술자에 의해 또한 이해될 바와 같이, "이하", "적어도", "초과", "미만" 등과 같은 모든 언어는 언급된 수를 포함하고, 상기 논의된 바와 같이 이후 하위-범위로 나눌 수 있는 범위를 지칭한다. 최종적으로, 관련 기술분야의 통상의 기술자가 이해하는 바와 같이, 범위는 각 개별 구성원을 포함한다. 따라서, 예를 들어 1-3개의 물품을 갖는 군은 1, 2, 또는 3개의 물품을 갖는 군을 지칭한다. 유사하게, 1-5개의 물품을 갖는 군은 1, 2, 3, 4, 또는 5개의 물품을 갖는 군 등을 지칭한다.

다양한 측면 및 실시양태가 본원에 개시되었지만, 다른 측면 및 실시양태가 관련 기술분야의 통상의 기술자에게 명백할 것이다. 본원에 개시된 다양한 측면 및 실시양태는 예시의 목적을 위한 것이고, 제한적인 것으로 의도되지 않으며, 진정한 범주 및 취지는 하기 청구범위에 의해 나타내어진다.

공개 및 미공개 출원, 특허 및 문헌 참고문헌을 포함하나 이에 제한되지는 않는 본원에 인용된 모든 참고문헌은 그 전문이 본원에 참조로 포함되며, 이로써 본 명세서의 일부가 된다. 참조로 포함된 간행물 및 특허 또는 특허 출원이 명세서에 포함된 개시내용과 모순되는 경우, 본 명세서는 임의의 이러한 모순되는 자료를 대체하고/거나 우선하는 것으로 의도된다.

SEQUENCE LISTING <110> VECPROBIO, INC. <120> RECOMBINANT ADENO-ASSOCIATED VIRAL VECTORS IN PLANTS <130> VCPRO.002WO <150> US 62/971750 <151> 2020-02-07 <160> 55 <170> PatentIn version 3.5 <210> 1 <211> 1866 <212> DNA <213> adeno-associated virus 2 <220> <221> REP78 Start Codon <222> (1)..(3) <220> <221> REP52 Start Codon <222> (673)..(675) <400> 1 atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacgg gcatctgccc 60 ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120 tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180 cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240 caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300 aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360 taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420 gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480 acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540 aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600 gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660 tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720 cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780 tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840 cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900 attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960 acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020 accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080 aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140 aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200 gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260 aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320 ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380 gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440 gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500 gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560 gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620 aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680 ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740 tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800 ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860 caataa 1866 <210> 2 <211> 1872 <212> DNA <213> Artificial Sequence <220> <223> AAV2 REP78 optimized for Nicotiana benthamiana <220> <221> REP78 Start Codon <222> (7)..(9) <220> <221> REP52 Start Codon <222> (679)..(681) <400> 2 gggtttatga ctggtttcta cgaaatcgtt attaaggttc catctgattt ggatggtcat 60 cttcctggaa tctctgattc attcgttaac tgggttgctg aaaaagagtg ggaattgcca 120 cctgattcag atcttgattt gaatcttatc gaacaagctc cacttactgt tgctgagaag 180 ttgcaaagag attttcttac agagtggaga agggtttcta aggctcctga ggctcttttc 240 tttgttcaat tcgaaaaggg agagtcatac ttccatttgc atgttcttgt tgaaactaca 300 ggtgttaagt cattggttct tggaagattt ttgtctcaaa tcagagaaaa gcttatccaa 360 agaatctata ggggtattga gccaactttg cctaattggt ttgctgttac taagacaaga 420 aatggtgctg gaggtggaaa taaggttgtt gatgaatgtt acatcccaaa ctaccttttg 480 ccaaagactc aacctgaact tcaatgggct tggacaaatt tggagcaata tctttctgct 540 tgtttgaatc ttacagagag aaaaaggttg gttgctcaac atcttactca tgtttctcaa 600 acacaagaac aaaataagga gaaccaaaac ccaaactcag atgctcctgt tattagatca 660 aaaacttctg ctaggtacat ggaattggtt ggttggcttg ttgataaggg aattacatct 720 gaaaaacagt ggattcaaga ggatcaagct tcatacatct cttttaatgc tgcttctaac 780 tcaagatctc aaattaaggc tgctcttgat aatgctggaa agattatgtc attgactaaa 840 acagctccag attatcttgt tggacaacaa cctgttgaag atatctcttc aaacagaatc 900 tataagatct tggagcttaa tggttacgat ccacaatacg ctgcttctgt ttttcttggt 960 tgggctacta agaaattcgg aaagaggaac acaatttggc tttttggtcc tgctactaca 1020 ggaaaaacta atattgctga agctattgct catacagttc cattctacgg ttgtgttaac 1080 tggactaatg agaacttccc ttttaatgat tgtgttgata agatggttat ttggtgggaa 1140 gagggaaaga tgacagctaa agttgttgaa tcagctaagg ctattttggg tggatctaaa 1200 gttagagttg atcaaaagtg taaatcttca gctcaaattg atccaactcc tgttattgtt 1260 acttcaaaca caaacatgtg tgctgttatt gatggtaact ctactacatt cgaacatcaa 1320 caacctcttc aagataggat gttcaagttc gagttgacta gaaggcttga tcatgatttt 1380 ggaaaggtta caaagcaaga ggttaaggat ttctttagat gggctaaaga tcatgttgtt 1440 gaggttgaac atgagtttta cgttaagaaa ggtggagcta agaaaaggcc agctccttca 1500 gatgctgata tttctgaacc aaagagagtt agggagtcag ttgctcaacc ttcaacatct 1560 gatgctgaag cttctattaa ttacgctgat agataccaaa ataagtgttc aaggcatgtt 1620 ggtatgaatt tgatgctttt tccatgtaga caatgtgaga ggatgaatca aaactctaac 1680 atctgtttca ctcatggaca aaaggattgt ttggaatgtt tcccagtttc agagtctcaa 1740 cctgtttcag ttgttaagaa agcttaccaa aagctttgtt acatccatca tatcatggga 1800 aaagttcctg atgcttgtac agcttgtgat ttggttaatg ttgatcttga tgattgtatt 1860 tttgaacaat aa 1872 <210> 3 <211> 1872 <212> DNA <213> Artificial Sequence <220> <223> AAV2 REP78 optimized for Arabidopsis thaliana <220> <221> REP78 Start Codon <222> (7)..(9) <220> <221> REP52 Start Codon <222> (679)..(681) <400> 3 gggtttatga ctggttttta tgaaattgtt attaaggttc cttctgatct tgatggacat 60 cttcctggaa tttctgattc ttttgttaat tgggttgctg aaaaggaatg ggaacttcct 120 cctgattctg atctggatct taatcttatt gaacaagctc ctcttactgt tgctgaaaag 180 cttcaaagag attttcttac tgaatggaga agagtttcta aggctcctga agctcttttt 240 tttgttcaat ttgaaaaggg agaatcttat tttcatttgc atgttcttgt tgaaactact 300 ggagttaagt ctttggttct tggaagattt ctttctcaaa ttagagaaaa gcttattcaa 360 agaatttata gaggaattga acctactctt cctaattggt ttgctgttac taagactaga 420 aatggagctg gaggaggaaa taaggttgtt gatgaatgtt atattcctaa ttatcttctt 480 cctaagactc aacctgaact tcaatgggct tggactaatt tggaacaata tctttctgct 540 tgtcttaatc ttactgaaag aaagagactt gttgctcaac atcttactca tgtttctcaa 600 actcaagaac aaaataagga aaatcaaaat cctaattctg atgctcctgt tattagatct 660 aagacttctg ctagatatat ggaacttgtt ggatggcttg ttgataaggg aattacttct 720 gaaaagcaat ggattcaaga agatcaagct tcttatattt cttttaatgc tgcttctaat 780 tctagatctc aaattaaggc tgctcttgat aatgctggaa agattatgtc tcttactaag 840 actgctcctg attatcttgt tggacaacaa cctgttgaag atatttcttc taatagaatt 900 tataagattc ttgaacttaa tggatatgat cctcaatatg ctgcttctgt ttttcttgga 960 tgggctacta agaagtttgg aaagagaaat actatttggc tttttggacc tgctactact 1020 ggaaagacta atattgctga agctattgct catactgttc ctttttatgg atgtgttaat 1080 tggactaatg aaaattttcc ttttaatgat tgtgttgata agatggttat ttggtgggaa 1140 gaaggaaaga tgactgctaa ggttgttgaa tctgctaagg ctattcttgg aggatctaag 1200 gttagagttg atcaaaagtg taagtcttct gctcaaattg atcctactcc tgttattgtt 1260 acttctaata ctaatatgtg tgctgttatt gatggaaatt ctactacttt tgaacatcaa 1320 caacctcttc aagatagaat gtttaagttt gaacttacta gaagacttga tcatgatttt 1380 ggaaaggtta ctaagcaaga agttaaggat ttttttagat gggctaagga tcatgttgtt 1440 gaagttgaac atgaatttta tgttaagaag ggaggagcta agaagagacc tgctccttct 1500 gatgctgata tttctgaacc taagagagtt agagaatctg ttgctcaacc ttctacttct 1560 gatgctgaag cttctattaa ttatgctgat agatatcaaa ataagtgttc tagacatgtt 1620 ggaatgaatc ttatgctttt tccttgtaga caatgtgaaa gaatgaatca aaattctaat 1680 atttgtttta ctcatggaca aaaggattgt cttgaatgtt ttcctgtttc tgaatctcaa 1740 cctgtttctg ttgttaagaa ggcttatcaa aagctttgtt atattcatca tattatggga 1800 aaggttcctg atgcttgtac tgcttgtgat cttgttaatg ttgatcttga tgattgtatt 1860 tttgaacaat ga 1872 <210> 4 <211> 1872 <212> DNA <213> Artificial Sequence <220> <223> AAV2 REP78 optimized for Solanum tuberosum <220> <221> REP78 Start Codon <222> (7)..(9) <220> <221> REP52 Start Codon <222> (679)..(681) <400> 4 gggtttatga ctggttttta tgaaattgtt attaaggttc cttctgatct tgatggacat 60 cttcctggaa tttctgattc ttttgttaat tgggttgctg aaaaggaatg ggaacttcct 120 cctgattctg atctggatct taatcttatt gaacaagctc ctcttactgt tgctgaaaag 180 cttcaaagag attttcttac tgaatggaga agagtttcta aggctcctga agctcttttt 240 tttgttcaat ttgaaaaggg agaatcttat tttcatttgc atgttcttgt tgaaactact 300 ggagttaagt ctttggttct tggaagattt ctttctcaaa ttagagaaaa gcttattcaa 360 agaatttata gaggaattga acctactctt cctaattggt ttgctgttac taagactaga 420 aatggagctg gaggaggaaa taaggttgtt gatgaatgtt atattcctaa ttatcttctt 480 cctaagactc aacctgaact tcaatgggct tggactaatt tggaacaata tctttctgct 540 tgtcttaatc ttactgaaag aaagagactt gttgctcaac atcttactca tgtttctcaa 600 actcaagaac aaaataagga aaatcaaaat cctaattctg atgctcctgt tattagatct 660 aagacttctg ctagatatat ggaacttgtt ggatggcttg ttgataaggg aattacttct 720 gaaaagcaat ggattcaaga agatcaagct tcttatattt cttttaatgc tgcttctaat 780 tctagatctc aaattaaggc tgctcttgat aatgctggaa agattatgtc tcttactaag 840 actgctcctg attatcttgt tggacaacaa cctgttgaag atatttcttc taatagaatt 900 tataagattc ttgaacttaa tggatatgat cctcaatatg ctgcttctgt ttttcttgga 960 tgggctacta agaagtttgg aaagagaaat actatttggc tttttggacc tgctactact 1020 ggaaagacta atattgctga agctattgct catactgttc ctttttatgg atgtgttaat 1080 tggactaatg aaaattttcc ttttaatgat tgtgttgata agatggttat ttggtgggaa 1140 gaaggaaaga tgactgctaa ggttgttgaa tctgctaagg ctattcttgg aggatctaag 1200 gttagagttg atcaaaagtg taagtcttct gctcaaattg atcctactcc tgttattgtt 1260 acttctaata ctaatatgtg tgctgttatt gatggaaatt ctactacttt tgaacatcaa 1320 caacctcttc aagatagaat gtttaagttt gaacttacta gaagacttga tcatgatttt 1380 ggaaaggtta ctaagcaaga agttaaggat ttttttagat gggctaagga tcatgttgtt 1440 gaagttgaac atgaatttta tgttaagaag ggaggagcta agaagagacc tgctccttct 1500 gatgctgata tttctgaacc taagagagtt agagaatctg ttgctcaacc ttctacttct 1560 gatgctgaag cttctattaa ttatgctgat agatatcaaa ataagtgttc tagacatgtt 1620 ggaatgaatc ttatgctttt tccttgtaga caatgtgaaa gaatgaatca aaattctaat 1680 atttgtttta ctcatggaca aaaggattgt cttgaatgtt ttcctgtttc tgaatctcaa 1740 cctgtttctg ttgttaagaa ggcttatcaa aagctttgtt atattcatca tattatggga 1800 aaggttcctg atgcttgtac tgcttgtgat cttgttaatg ttgatcttga tgattgtatt 1860 tttgaacaat aa 1872 <210> 5 <211> 1872 <212> DNA <213> Artificial Sequence <220> <223> AAV2 REP78 optimized for Cannabis sativa <220> <221> REP78 Start Codon <222> (7)..(9) <220> <221> REP52 Start Codon <222> (679)..(681) <400> 5 gggtttatga ctggttttta tgaaattgtt attaaagttc cttcagattt ggatggacat 60 ttgcctggaa tttcagattc atttgttaat tgggttgctg aaaaagaatg ggaattgcct 120 cctgattcag atctggattt gaatttgatt gaacaagctc ctttgactgt tgctgaaaaa 180 ttgcaaagag attttttgac tgaatggaga agagtttcaa aagctcctga agctttgttt 240 tttgttcaat ttgaaaaagg agaatcatat tttcatttgc atgttttggt tgaaactact 300 ggagttaaat cattggtttt gggaagattt ttgtcacaaa ttagagaaaa attgattcaa 360 agaatttata gaggaattga acctactttg cctaattggt ttgctgttac taaaactaga 420 aatggagctg gaggaggaaa taaagttgtt gatgaatgct atattcctaa ttatttgttg 480 cctaaaactc aacctgaatt gcaatgggct tggactaatt tggaacaata tttgtcagct 540 tgcttgaatt tgactgaaag aaaaagattg gttgctcaac atttgactca tgtttcacaa 600 actcaagaac aaaataaaga aaatcaaaat cctaattcag atgctcctgt tattagatca 660 aaaacttcag ctagatatat ggaattggtt ggatggttgg ttgataaagg aattacttca 720 gaaaaacaat ggattcaaga agatcaagct tcatatattt catttaatgc tgcttcaaat 780 tcaagatcac aaattaaagc tgctttggat aatgctggaa aaattatgtc attgactaaa 840 actgctcctg attatttggt tggacaacaa cctgttgaag atatttcatc aaatagaatt 900 tataaaattt tggaattgaa tggatatgat cctcaatatg ctgcttcagt ttttttggga 960 tgggctacta aaaaatttgg aaaaagaaat actatttggt tgtttggacc tgctactact 1020 ggaaaaacta atattgctga agctattgct catactgttc ctttttatgg atgcgttaat 1080 tggactaatg aaaattttcc ttttaatgat tgcgttgata aaatggttat ttggtgggaa 1140 gaaggaaaaa tgactgctaa agttgttgaa tcagctaaag ctattttggg aggatcaaaa 1200 gttagagttg atcaaaaatg caaatcatca gctcaaattg atcctactcc tgttattgtt 1260 acttcaaata ctaatatgtg cgctgttatt gatggaaatt caactacttt tgaacatcaa 1320 caacctttgc aagatagaat gtttaaattt gaattgacta gaagattgga tcatgatttt 1380 ggaaaagtta ctaaacaaga agttaaagat ttttttagat gggctaaaga tcatgttgtt 1440 gaagttgaac atgaatttta tgttaaaaaa ggaggagcta aaaaaagacc tgctccttca 1500 gatgctgata tttcagaacc taaaagagtt agagaatcag ttgctcaacc ttcaacttca 1560 gatgctgaag cttcaattaa ttatgctgat agatatcaaa ataaatgctc aagacatgtt 1620 ggaatgaatt tgatgttgtt tccttgcaga caatgcgaaa gaatgaatca aaattcaaat 1680 atttgcttta ctcatggaca aaaagattgc ttggaatgct ttcctgtttc agaatcacaa 1740 cctgtttcag ttgttaaaaa agcttatcaa aaattgtgct atattcatca tattatggga 1800 aaagttcctg atgcttgcac tgcttgcgat ttggttaatg ttgatttgga tgattgcatt 1860 tttgaacaat aa 1872 <210> 6 <211> 1872 <212> DNA <213> Artificial Sequence <220> <223> AAV2 REP78 optimized for Fagopyrum esculentum <220> <221> REP78 Start Codon <222> (7)..(9) <220> <221> REP52 Start Codon <222> (679)..(681) <400> 6 gggtttatga ctggtttcta cgagatcgtt atcaaggttc cttccgatct cgatggacat 60 ctccctggaa tctccgattc cttcgttaac tgggttgctg agaaggagtg ggagctccct 120 cctgattccg atctggatct caacctcatc gagcaggctc ctctcaccgt tgctgagaag 180 ctccagaggg atttcctcac cgagtggagg agggtttcca aggctcctga ggctctcttc 240 ttcgttcagt tcgagaaggg agagtcctac ttccatttgc atgttctcgt tgagaccacc 300 ggagttaagt ccttggttct cggaaggttc ctctcccaga tcagggagaa gctcatccag 360 aggatctaca ggggaatcga gcctaccctc cctaactggt tcgctgttac caagaccagg 420 aacggagctg gaggaggaaa caaggttgtt gatgagtgct acatccctaa ctacctcctc 480 cctaagaccc agcctgagct ccagtgggct tggaccaact tggagcagta cctctccgct 540 tgcctcaacc tcaccgagag gaagaggctc gttgctcagc atctcaccca tgtttcccag 600 acccaggagc agaacaagga gaaccagaac cctaactccg atgctcctgt tatcaggtcc 660 aagacctccg ctaggtacat ggagctcgtt ggatggctcg ttgataaggg aatcacctcc 720 gagaagcagt ggatccagga ggatcaggct tcctacatct ccttcaacgc tgcttccaac 780 tccaggtccc agatcaaggc tgctctcgat aacgctggaa agatcatgtc cctcaccaag 840 accgctcctg attacctcgt tggacagcag cctgttgagg atatctcctc caacaggatc 900 tacaagatcc tcgagctcaa cggatacgat cctcagtacg ctgcttccgt tttcctcgga 960 tgggctacca agaagttcgg aaagaggaac accatctggc tcttcggacc tgctaccacc 1020 ggaaagacca acatcgctga ggctatcgct cataccgttc ctttctacgg atgcgttaac 1080 tggaccaacg agaacttccc tttcaacgat tgcgttgata agatggttat ctggtgggag 1140 gagggaaaga tgaccgctaa ggttgttgag tccgctaagg ctatcctcgg aggatccaag 1200 gttagggttg atcagaagtg caagtcctcc gctcagatcg atcctacccc tgttatcgtt 1260 acctccaaca ccaacatgtg cgctgttatc gatggaaact ccaccacctt cgagcatcag 1320 cagcctctcc aggataggat gttcaagttc gagctcacca ggaggctcga tcatgatttc 1380 ggaaaggtta ccaagcagga ggttaaggat ttcttcaggt gggctaagga tcatgttgtt 1440 gaggttgagc atgagttcta cgttaagaag ggaggagcta agaagaggcc tgctccttcc 1500 gatgctgata tctccgagcc taagagggtt agggagtccg ttgctcagcc ttccacctcc 1560 gatgctgagg cttccatcaa ctacgctgat aggtaccaga acaagtgctc caggcatgtt 1620 ggaatgaacc tcatgctctt cccttgcagg cagtgcgaga ggatgaacca gaactccaac 1680 atctgcttca cccatggaca gaaggattgc ctcgagtgct tccctgtttc cgagtcccag 1740 cctgtttccg ttgttaagaa ggcttaccag aagctctgct acatccatca tatcatggga 1800 aaggttcctg atgcttgcac cgcttgcgat ctcgttaacg ttgatctcga tgattgcatc 1860 ttcgagcagt aa 1872 <210> 7 <211> 1872 <212> DNA <213> Artificial Sequence <220> <223> AAV2 REP78 optimized for Oryza sativa <220> <221> REP78 Start Codon <222> (7)..(9) <220> <221> REP52 Start Codon <222> (679)..(681) <400> 7 gggtttatga ctggtttcta cgagatcgtg atcaaggtgc cgtccgacct cgacggccac 60 ctcccgggca tctccgactc cttcgtgaac tgggtggccg agaaggagtg ggagctcccg 120 ccggactccg acctggacct caacctcatc gagcaggccc cgctcaccgt ggccgagaag 180 ctccagaggg acttcctcac cgagtggagg agggtgtcca aggccccgga ggccctcttc 240 ttcgtgcagt tcgagaaggg cgagtcctac ttccacttgc acgtgctcgt ggagaccacc 300 ggcgtgaagt ccttggtgct cggcaggttc ctctcccaga tcagggagaa gctcatccag 360 aggatctaca ggggcatcga gccgaccctc ccgaactggt tcgccgtgac caagaccagg 420 aacggcgccg gcggcggcaa caaggtggtg gacgagtgct acatcccgaa ctacctcctc 480 ccgaagaccc agccggagct ccagtgggcc tggaccaact tggagcagta cctctccgcc 540 tgcctcaacc tcaccgagag gaagaggctc gtggcccagc acctcaccca cgtgtcccag 600 acccaggagc agaacaagga gaaccagaac ccgaactccg acgccccggt gatcaggtcc 660 aagacctccg ccaggtacat ggagctcgtg ggctggctcg tggacaaggg catcacctcc 720 gagaagcagt ggatccagga ggaccaggcc tcctacatct ccttcaacgc cgcctccaac 780 tccaggtccc agatcaaggc cgccctcgac aacgccggca agatcatgtc cctcaccaag 840 accgccccgg actacctcgt gggccagcag ccggtggagg acatctcctc caacaggatc 900 tacaagatcc tcgagctcaa cggctacgac ccgcagtacg ccgcctccgt gttcctcggc 960 tgggccacca agaagttcgg caagaggaac accatctggc tcttcggccc ggccaccacc 1020 ggcaagacca acatcgccga ggccatcgcc cacaccgtgc cgttctacgg ctgcgtgaac 1080 tggaccaacg agaacttccc gttcaacgac tgcgtggaca agatggtgat ctggtgggag 1140 gagggcaaga tgaccgccaa ggtggtggag tccgccaagg ccatcctcgg cggctccaag 1200 gtgagggtgg accagaagtg caagtcctcc gcccagatcg acccgacccc ggtgatcgtg 1260 acctccaaca ccaacatgtg cgccgtgatc gacggcaact ccaccacctt cgagcaccag 1320 cagccgctcc aggacaggat gttcaagttc gagctcacca ggaggctcga ccacgacttc 1380 ggcaaggtga ccaagcagga ggtgaaggac ttcttcaggt gggccaagga ccacgtggtg 1440 gaggtggagc acgagttcta cgtgaagaag ggcggcgcca agaagaggcc ggccccgtcc 1500 gacgccgaca tctccgagcc gaagagggtg agggagtccg tggcccagcc gtccacctcc 1560 gacgccgagg cctccatcaa ctacgccgac aggtaccaga acaagtgctc caggcacgtg 1620 ggcatgaacc tcatgctctt cccgtgcagg cagtgcgaga ggatgaacca gaactccaac 1680 atctgcttca cccacggcca gaaggactgc ctcgagtgct tcccggtgtc cgagtcccag 1740 ccggtgtccg tggtgaagaa ggcctaccag aagctctgct acatccacca catcatgggc 1800 aaggtgccgg acgcctgcac cgcctgcgac ctcgtgaacg tggacctcga cgactgcatc 1860 ttcgagcagt ga 1872 <210> 8 <211> 1872 <212> DNA <213> Artificial Sequence <220> <223> AAV2 REP78 optimized for Zea mays <220> <221> REP78 Start Codon <222> (7)..(9) <220> <221> REP52 Start Codon <222> (679)..(681) <400> 8 gggtttatga ctggtttcta cgagatcgtg atcaaggtgc cgtccgacct ggacggccac 60 ctgccgggca tctccgactc cttcgtgaac tgggtggccg agaaggagtg ggagctgccg 120 ccggactccg acctggacct gaacctgatc gagcaggccc cgctgaccgt ggccgagaag 180 ctgcagaggg acttcctgac cgagtggagg agggtgtcca aggccccgga ggccctgttc 240 ttcgtgcagt tcgagaaggg cgagtcctac ttccacttgc acgtgctggt ggagaccacc 300 ggcgtgaagt ccttggtgct gggcaggttc ctgtcccaga tcagggagaa gctgatccag 360 aggatctaca ggggcatcga gccgaccctg ccgaactggt tcgccgtgac caagaccagg 420 aacggcgccg gcggcggcaa caaggtggtg gacgagtgct acatcccgaa ctacctgctg 480 ccgaagaccc agccggagct gcagtgggcc tggaccaact tggagcagta cctgtccgcc 540 tgcctgaacc tgaccgagag gaagaggctg gtggcccagc acctgaccca cgtgtcccag 600 acccaggagc agaacaagga gaaccagaac ccgaactccg acgccccggt gatcaggtcc 660 aagacctccg ccaggtacat ggagctggtg ggctggctgg tggacaaggg catcacctcc 720 gagaagcagt ggatccagga ggaccaggcc tcctacatct ccttcaacgc cgcctccaac 780 tccaggtccc agatcaaggc cgccctggac aacgccggca agatcatgtc cctgaccaag 840 accgccccgg actacctggt gggccagcag ccggtggagg acatctcctc caacaggatc 900 tacaagatcc tggagctgaa cggctacgac ccgcagtacg ccgcctccgt gttcctgggc 960 tgggccacca agaagttcgg caagaggaac accatctggc tgttcggccc ggccaccacc 1020 ggcaagacca acatcgccga ggccatcgcc cacaccgtgc cgttctacgg ctgcgtgaac 1080 tggaccaacg agaacttccc gttcaacgac tgcgtggaca agatggtgat ctggtgggag 1140 gagggcaaga tgaccgccaa ggtggtggag tccgccaagg ccatcctggg cggctccaag 1200 gtgagggtgg accagaagtg caagtcctcc gcccagatcg acccgacccc ggtgatcgtg 1260 acctccaaca ccaacatgtg cgccgtgatc gacggcaact ccaccacctt cgagcaccag 1320 cagccgctgc aggacaggat gttcaagttc gagctgacca ggaggctgga ccacgacttc 1380 ggcaaggtga ccaagcagga ggtgaaggac ttcttcaggt gggccaagga ccacgtggtg 1440 gaggtggagc acgagttcta cgtgaagaag ggcggcgcca agaagaggcc ggccccgtcc 1500 gacgccgaca tctccgagcc gaagagggtg agggagtccg tggcccagcc gtccacctcc 1560 gacgccgagg cctccatcaa ctacgccgac aggtaccaga acaagtgctc caggcacgtg 1620 ggcatgaacc tgatgctgtt cccgtgcagg cagtgcgaga ggatgaacca gaactccaac 1680 atctgcttca cccacggcca gaaggactgc ctggagtgct tcccggtgtc cgagtcccag 1740 ccggtgtccg tggtgaagaa ggcctaccag aagctgtgct acatccacca catcatgggc 1800 aaggtgccgg acgcctgcac cgcctgcgac ctggtgaacg tggacctgga cgactgcatc 1860 ttcgagcagt ga 1872 <210> 9 <211> 1872 <212> DNA <213> Artificial Sequence <220> <223> AAV2 REP78 optimized for Solanum lycopersicoides <220> <221> REP78 Start Codon <222> (7)..(9) <220> <221> REP52 Start Codon <222> (679)..(681) <400> 9 gggtttatga ctggttttta cgagattgtt attaaggttc catcagatct tgatggacat 60 cttccaggaa tttcagattc atttgttaat tgggttgcag agaaggagtg ggagcttcca 120 ccagattcag atctggatct taatcttatt gagcaagcac cacttacagt tgcagagaag 180 cttcaaagag attttcttac agagtggaga agagtttcaa aggcaccaga ggcacttttt 240 tttgttcaat ttgagaaggg agagtcatac tttcatttgc atgttcttgt tgagacaaca 300 ggagttaagt cattggttct tggaagattt ctttcacaaa ttagagagaa gcttattcaa 360 agaatttaca gaggaattga gccaacactt ccaaattggt ttgcagttac aaagacaaga 420 aatggagcag gaggaggaaa taaggttgtt gatgagtgtt acattccaaa ttaccttctt 480 ccaaagacac aaccagagct tcaatgggca tggacaaatt tggagcaata cctttcagca 540 tgtcttaatc ttacagagag aaagagactt gttgcacaac atcttacaca tgtttcacaa 600 acacaagagc aaaataagga gaatcaaaat ccaaattcag atgcaccagt tattagatca 660 aagacatcag caagatacat ggagcttgtt ggatggcttg ttgataaggg aattacatca 720 gagaagcaat ggattcaaga ggatcaagca tcatacattt catttaatgc agcatcaaat 780 tcaagatcac aaattaaggc agcacttgat aatgcaggaa agattatgtc acttacaaag 840 acagcaccag attaccttgt tggacaacaa ccagttgagg atatttcatc aaatagaatt 900 tacaagattc ttgagcttaa tggatacgat ccacaatacg cagcatcagt ttttcttgga 960 tgggcaacaa agaagtttgg aaagagaaat acaatttggc tttttggacc agcaacaaca 1020 ggaaagacaa atattgcaga ggcaattgca catacagttc cattttacgg atgtgttaat 1080 tggacaaatg agaattttcc atttaatgat tgtgttgata agatggttat ttggtgggag 1140 gagggaaaga tgacagcaaa ggttgttgag tcagcaaagg caattcttgg aggatcaaag 1200 gttagagttg atcaaaagtg taagtcatca gcacaaattg atccaacacc agttattgtt 1260 acatcaaata caaatatgtg tgcagttatt gatggaaatt caacaacatt tgagcatcaa 1320 caaccacttc aagatagaat gtttaagttt gagcttacaa gaagacttga tcatgatttt 1380 ggaaaggtta caaagcaaga ggttaaggat ttttttagat gggcaaagga tcatgttgtt 1440 gaggttgagc atgagtttta cgttaagaag ggaggagcaa agaagagacc agcaccatca 1500 gatgcagata tttcagagcc aaagagagtt agagagtcag ttgcacaacc atcaacatca 1560 gatgcagagg catcaattaa ttacgcagat agataccaaa ataagtgttc aagacatgtt 1620 ggaatgaatc ttatgctttt tccatgtaga caatgtgaga gaatgaatca aaattcaaat 1680 atttgtttta cacatggaca aaaggattgt cttgagtgtt ttccagtttc agagtcacaa 1740 ccagtttcag ttgttaagaa ggcataccaa aagctttgtt acattcatca tattatggga 1800 aaggttccag atgcatgtac agcatgtgat cttgttaatg ttgatcttga tgattgtatt 1860 tttgagcaat ga 1872 <210> 10 <211> 1872 <212> DNA <213> Artificial Sequence <220> <223> AAV2 REP78 optimized for Solanum lycopersicum <220> <221> REP78 Start Codon <222> (7)..(9) <220> <221> REP52 Start Codon <222> (679)..(681) <400> 10 gggtttatga ctggttttta tgaaattgtt attaaggttc cttctgatct tgatggacat 60 cttcctggaa tttctgattc ttttgttaat tgggttgctg aaaaggaatg ggaacttcct 120 cctgattctg atcttgatct taatcttatt gaacaagctc ctcttactgt tgctgaaaag 180 cttcaaagag attttcttac tgaatggaga agagtttcta aggctcctga agctcttttt 240 tttgttcaat ttgaaaaggg agaatcttat tttcatcttc atgttcttgt tgaaactact 300 ggagttaagt ctcttgttct tggaagattt ctttctcaaa ttagagaaaa gcttattcaa 360 agaatttata gaggaattga acctactctt cctaattggt ttgctgttac taagactaga 420 aatggagctg gaggaggaaa taaggttgtt gatgaatgtt atattcctaa ttatcttctt 480 cctaagactc aacctgaact tcaatgggct tggactaatc ttgaacaata tctttctgct 540 tgtcttaatc ttactgaaag aaagagactt gttgctcaac atcttactca tgtttctcaa 600 actcaagaac aaaataagga aaatcaaaat cctaattctg atgctcctgt tattagatct 660 aagacttctg ctagatatat ggaacttgtt ggatggcttg ttgataaggg aattacttct 720 gaaaagcaat ggattcaaga agatcaagct tcttatattt cttttaatgc tgcttctaat 780 tctagatctc aaattaaggc tgctcttgat aatgctggaa agattatgtc tcttactaag 840 actgctcctg attatcttgt tggacaacaa cctgttgaag atatttcttc taatagaatt 900 tataagattc ttgaacttaa tggatatgat cctcaatatg ctgcttctgt ttttcttgga 960 tgggctacta agaagtttgg aaagagaaat actatttggc tttttggacc tgctactact 1020 ggaaagacta atattgctga agctattgct catactgttc ctttttatgg atgtgttaat 1080 tggactaatg aaaattttcc ttttaatgat tgtgttgata agatggttat ttggtgggaa 1140 gaaggaaaga tgactgctaa ggttgttgaa tctgctaagg ctattcttgg aggatctaag 1200 gttagagttg atcaaaagtg taagtcttct gctcaaattg atcctactcc tgttattgtt 1260 acttctaata ctaatatgtg tgctgttatt gatggaaatt ctactacttt tgaacatcaa 1320 caacctcttc aagatagaat gtttaagttt gaacttacta gaagacttga tcatgatttt 1380 ggaaaggtta ctaagcaaga agttaaggat ttttttagat gggctaagga tcatgttgtt 1440 gaagttgaac atgaatttta tgttaagaag ggaggagcta agaagagacc tgctccttct 1500 gatgctgata tttctgaacc taagagagtt agagaatctg ttgctcaacc ttctacttct 1560 gatgctgaag cttctattaa ttatgctgat agatatcaaa ataagtgttc tagacatgtt 1620 ggaatgaatc ttatgctttt tccttgtaga caatgtgaaa gaatgaatca aaattctaat 1680 atttgtttta ctcatggaca aaaggattgt cttgaatgtt ttcctgtttc tgaatctcaa 1740 cctgtttctg ttgttaagaa ggcttatcaa aagctttgtt atattcatca tattatggga 1800 aaggttcctg atgcttgtac tgcttgtgat cttgttaatg ttgatcttga tgattgtatt 1860 tttgaacaat aa 1872 <210> 11 <211> 1872 <212> DNA <213> Artificial Sequence <220> <223> AAV2 REP78 optimized for Lactuca sativa <220> <221> REP78 Start Codon <222> (7)..(9) <220> <221> REP52 Start Codon <222> (679)..(681) <400> 11 gggtttatga ctggttttta tgaaattgtt attaaagttc catctgatct tgatggacat 60 cttccaggaa tttctgattc ttttgttaat tgggttgctg aaaaagaatg ggaacttcca 120 ccagattctg atcttgatct taatcttatt gaacaagctc cacttacagt tgctgaaaaa 180 cttcaaagag attttcttac agaatggaga agagtttcta aagctccaga agctcttttt 240 tttgttcaat ttgaaaaagg agaatcttat tttcatcttc atgttcttgt tgaaacaaca 300 ggagttaaat ctcttgttct tggaagattt ctttctcaaa ttagagaaaa acttattcaa 360 agaatttata gaggaattga accaacactt ccaaattggt ttgctgttac aaaaacaaga 420 aatggagctg gaggaggaaa taaagttgtt gatgaatgtt atattccaaa ttatcttctt 480 ccaaaaacac aaccagaact tcaatgggct tggacaaatc ttgaacaata tctttctgct 540 tgtcttaatc ttacagaaag aaaaagactt gttgctcaac atcttacaca tgtttctcaa 600 acacaagaac aaaataaaga aaatcaaaat ccaaattctg atgctccagt tattagatct 660 aaaacatctg ctagatatat ggaacttgtt ggatggcttg ttgataaagg aattacatct 720 gaaaaacaat ggattcaaga agatcaagct tcttatattt cttttaatgc tgcttctaat 780 tctagatctc aaattaaagc tgctcttgat aatgctggaa aaattatgtc tcttacaaaa 840 acagctccag attatcttgt tggacaacaa ccagttgaag atatttcttc taatagaatt 900 tataaaattc ttgaacttaa tggatatgat ccacaatatg ctgcttctgt ttttcttgga 960 tgggctacaa aaaaatttgg aaaaagaaat acaatttggc tttttggacc agctacaaca 1020 ggaaaaacaa atattgctga agctattgct catacagttc cattttatgg atgtgttaat 1080 tggacaaatg aaaattttcc atttaatgat tgtgttgata aaatggttat ttggtgggaa 1140 gaaggaaaaa tgacagctaa agttgttgaa tctgctaaag ctattcttgg aggatctaaa 1200 gttagagttg atcaaaaatg taaatcttct gctcaaattg atccaacacc agttattgtt 1260 acatctaata caaatatgtg tgctgttatt gatggaaatt ctacaacatt tgaacatcaa 1320 caaccacttc aagatagaat gtttaaattt gaacttacaa gaagacttga tcatgatttt 1380 ggaaaagtta caaaacaaga agttaaagat ttttttagat gggctaaaga tcatgttgtt 1440 gaagttgaac atgaatttta tgttaaaaaa ggaggagcta aaaaaagacc agctccatct 1500 gatgctgata tttctgaacc aaaaagagtt agagaatctg ttgctcaacc atctacatct 1560 gatgctgaag cttctattaa ttatgctgat agatatcaaa ataaatgttc tagacatgtt 1620 ggaatgaatc ttatgctttt tccatgtaga caatgtgaaa gaatgaatca aaattctaat 1680 atttgtttta cacatggaca aaaagattgt cttgaatgtt ttccagtttc tgaatctcaa 1740 ccagtttctg ttgttaaaaa agcttatcaa aaactttgtt atattcatca tattatggga 1800 aaagttccag atgcttgtac agcttgtgat cttgttaatg ttgatcttga tgattgtatt 1860 tttgaacaat ga 1872 <210> 12 <211> 621 <212> PRT <213> adeno-associated virus 2 <400> 12 Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp 1 5 10 15 Gly His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu 20 25 30 Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile 35 40 45 Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu 50 55 60 Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val 65 70 75 80 Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu 85 90 95 Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile 100 105 110 Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu 115 120 125 Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly 130 135 140 Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys 145 150 155 160 Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu 165 170 175 Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His 180 185 190 Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn 195 200 205 Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr 210 215 220 Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys 225 230 235 240 Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala 245 250 255 Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys 260 265 270 Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln 275 280 285 Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu 290 295 300 Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala 305 310 315 320 Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala 325 330 335 Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro 340 345 350 Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp 355 360 365 Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala 370 375 380 Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg 385 390 395 400 Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val 405 410 415 Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser 420 425 430 Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe 435 440 445 Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln 450 455 460 Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val 465 470 475 480 Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala 485 490 495 Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val 500 505 510 Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp 515 520 525 Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu 530 535 540 Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys 545 550 555 560 Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu 565 570 575 Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr 580 585 590 Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp 595 600 605 Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln 610 615 620 <210> 13 <211> 621 <212> PRT <213> Artificial Sequence <220> <223> AAV2 REP78 optimized for plant expression <400> 13 Met Thr Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp 1 5 10 15 Gly His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu 20 25 30 Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Leu Asp Leu Asn Leu Ile 35 40 45 Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu 50 55 60 Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val 65 70 75 80 Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Val Leu Val Glu 85 90 95 Thr Thr Gly Val Lys Ser Leu Val Leu Gly Arg Phe Leu Ser Gln Ile 100 105 110 Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu 115 120 125 Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly 130 135 140 Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys 145 150 155 160 Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Leu Glu Gln Tyr Leu 165 170 175 Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His 180 185 190 Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn 195 200 205 Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr 210 215 220 Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys 225 230 235 240 Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala 245 250 255 Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys 260 265 270 Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln 275 280 285 Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu 290 295 300 Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala 305 310 315 320 Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala 325 330 335 Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro 340 345 350 Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp 355 360 365 Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala 370 375 380 Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg 385 390 395 400 Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val 405 410 415 Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser 420 425 430 Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe 435 440 445 Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln 450 455 460 Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val 465 470 475 480 Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala 485 490 495 Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val 500 505 510 Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp 515 520 525 Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu 530 535 540 Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys 545 550 555 560 Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu 565 570 575 Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr 580 585 590 Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp 595 600 605 Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln 610 615 620 <210> 14 <211> 2208 <212> DNA <213> adeno-associated virus 2 <220> <221> VP1 Start Codon <222> (1)..(3) <220> <221> VP2 Start Codon <222> (412)..(414) <220> <221> VP3 Start Codon <222> (607)..(609) <400> 14 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800 cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860 attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920 caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980 ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040 gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga aattcagtac 2100 acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160 tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208 <210> 15 <211> 2214 <212> DNA <213> Artificial Sequence <220> <223> AAV2 CAP optimized for Nicotiana benthamiana <220> <221> VP1 Start Codon <222> (7)..(9) <220> <221> VP2 Start Codon <222> (418)..(420) <220> <221> VP3 Start Codon <222> (613)..(615) <400> 15 gggtttatga ctgccgccgg ttatcttcca gattggctcg aggacactct ctctgaagga 60 ataagacagt ggtggaagct caaacctggc ccaccaccac caaagcccgc agagcggcat 120 aaggacgaca gcaggggtct tgtgcttcct gggtacaagt acctcggacc cttcaacgga 180 ctcgacaagg gagagccggt caacgaggca gacgccgcgg ccctcgagca cgacaaagcc 240 tacgaccggc agctcgacag cggagacaac ccgtacctca agtacaacca cgccgacgcg 300 gagtttcagg agcgccttaa agaagatacg tcttttgggg gcaacctcgg acgagcagtc 360 ttccaggcga aaaagagggt tcttgaacct ctgggcctgg ttgaggaacc tgttaagacg 420 gctccgggaa aaaagaggcc ggtagagcac tctcctgtgg agccagactc ctcctcggga 480 accggaaagg cgggccagca gcctgcaaga aaaagattga attttggtca gactggagac 540 gcagactcag tacctgaccc ccagcctctc ggacagccac cagcagcccc ctctggtctg 600 ggaactaata cgatggctac tggatcaggt gctcctatgg ctgataataa cgaaggtgct 660 gatggagttg gtaattcatc tggaaattgg cattgtgatt ctacttggat gggagataga 720 gttattacta catcaactag gacatgggct cttccaacat acaataacca tttgtacaag 780 caaatttcat ctcaatcagg agcttctaac gataaccatt acttcggata ctctacacca 840 tggggttact tcgatttcaa cagattccat tgtcattttt cacctagaga ttggcaaagg 900 cttattaata acaattgggg ttttagacca aagaggctta acttcaagtt gtttaatatc 960 caagttaaag aagttactca aaacgatgga actacaacta tcgctaataa ccttacttct 1020 acagttcaag tttttacaga ttcagagtat caacttcctt acgttttggg atctgctcat 1080 caaggttgtt tgccaccttt tccagctgat gtttttatgg ttcctcaata tggttacctt 1140 actttgaata acggatctca agctgttggt agatcatctt tctactgtct tgaatacttc 1200 ccttctcaaa tgttgaggac aggaaataac ttcacttttt catacacatt cgaggatgtt 1260 ccatttcatt catcttacgc tcattcacaa tctcttgata gattgatgaa tcctcttatc 1320 gatcaatatc tttactactt gtctagaact aacacaccat caggtacaac tacacaatca 1380 aggcttcaat tttctcaagc tggagcttca gatattagag atcaatctag gaattggttg 1440 ccaggtcctt gttacagaca acaaagggtt tcaaagactt ctgctgataa taacaattca 1500 gaatactctt ggactggagc tacaaaatac catcttaatg gtagggattc tttggttaat 1560 ccaggacctg ctatggcttc acataaggat gatgaagaga agtttttccc acaatctgga 1620 gttcttatct tcggaaagca aggttcagaa aagactaacg ttgatatcga gaaggttatg 1680 atcacagatg aagaggaaat cagaactaca aatcctgttg ctactgagca atacggttca 1740 gtttctacaa atttgcaaag aggaaatagg caagctgcta ctgctgatgt taatacacaa 1800 ggagttcttc ctggtatggt ttggcaagat agggatgttt acttgcaagg tccaatttgg 1860 gctaaaattc ctcatactga tggacatttt catccatctc ctcttatggg aggttttggt 1920 ttgaagcatc cacctccaca aatccttatt aaaaacacac cagttcctgc taatccttca 1980 actacatttt ctgctgctaa gttcgcttct tttattactc aatactctac aggacaagtt 2040 tcagttgaga ttgaatggga gttgcaaaag gaaaactcaa aaagatggaa cccagagatc 2100 caatacactt ctaactacaa taagtcagtt aacgttgatt tcactgttga tacaaatggt 2160 gtttactctg aaccaaggcc tattggaact agatacctta caaggaattt gtaa 2214 <210> 16 <211> 2214 <212> DNA <213> Artificial Sequence <220> <223> AAV2 CAP optimized for Arabidopsis thaliana <220> <221> VP1 Start Codon <222> (7)..(9) <220> <221> VP2 Start Codon <222> (418)..(420) <220> <221> VP3 Start Codon <222> (613)..(615) <400> 16 gggtttatga ctgccgccgg ttatcttcct gattggcttg aagatactct ttctgaagga 60 attagacaat ggtggaagct taagcctgga cctcctcctc ctaagcctgc tgaaagacat 120 aaggatgatt ctagaggact tgttcttcct ggatataagt atcttggacc ttttaatgga 180 cttgataagg gagaacctgt taatgaagct gatgctgctg ctcttgaaca tgataaggct 240 tatgatagac aacttgattc tggagataat ccttatctta agtataatca tgctgatgct 300 gaatttcaag aaagacttaa ggaagatact tcttttggag gaaatcttgg aagagctgtt 360 tttcaagcta agaagagagt tcttgaacct cttggacttg ttgaagaacc tgttaagacg 420 gctcctggaa agaagagacc tgttgaacat tctcctgttg aacctgattc ttcttctgga 480 actggaaagg ctggacaaca acctgctaga aagagactta attttggaca aactggagat 540 gctgattctg ttcctgatcc tcaacctctt ggacaacctc ctgctgctcc ttctggactt 600 ggaactaata ctatggctac tggatctgga gctcctatgg ctgataataa tgaaggagct 660 gatggagttg gaaattcttc tggaaattgg cattgtgatt ctacttggat gggagataga 720 gttattacta cttctactag aacttgggct cttcctactt ataataatca tctttataag 780 caaatttctt ctcaatctgg agcttctaat gataatcatt attttggata ttctactcct 840 tggggatatt ttgattttaa tagatttcat tgtcattttt ctcctagaga ttggcaaaga 900 cttattaata ataattgggg atttagacct aagagactta attttaagct ttttaatatt 960 caagttaagg aagttactca aaatgatgga actactacta ttgctaataa tcttacttct 1020 actgttcaag tttttactga ttctgaatat caacttcctt atgttcttgg atctgctcat 1080 caaggatgtc ttcctccttt tcctgctgat gtttttatgg ttcctcaata tggatatctt 1140 actcttaata atggatctca agctgttgga agatcttctt tttattgtct tgaatatttt 1200 ccttctcaaa tgcttagaac tggaaataat tttacttttt cttatacttt tgaagatgtt 1260 ccttttcatt cttcttatgc tcattctcaa tctcttgata gacttatgaa tcctcttatt 1320 gatcaatatc tttattatct ttctagaact aatactcctt ctggaactac tactcaatct 1380 agacttcaat tttctcaagc tggagcttct gatattagag atcaatctag aaattggctt 1440 cctggacctt gttatagaca acaaagagtt tctaagactt ctgctgataa taataattct 1500 gaatattctt ggactggagc tactaagtat catcttaatg gaagagattc tcttgttaat 1560 cctggacctg ctatggcttc tcataaggat gatgaagaaa agttttttcc tcaatctgga 1620 gttcttattt ttggaaagca aggatctgaa aagactaatg ttgatattga aaaggttatg 1680 attactgatg aagaagaaat tagaactact aatcctgttg ctactgaaca atatggatct 1740 gtttctacta atcttcaaag aggaaataga caagctgcta ctgctgatgt taatactcaa 1800 ggagttcttc ctggaatggt ttggcaagat agagatgttt atcttcaagg acctatttgg 1860 gctaagattc ctcatactga tggacatttt catccttctc ctcttatggg aggatttgga 1920 cttaagcatc ctcctcctca aattcttatt aagaatactc ctgttcctgc taatccttct 1980 actacttttt ctgctgctaa gtttgcttct tttattactc aatattctac tggacaagtt 2040 tctgttgaaa ttgaatggga acttcaaaag gaaaattcta agagatggaa tcctgaaatt 2100 caatatactt ctaattataa taagtctgtt aatgttgatt ttactgttga tactaatgga 2160 gtttattctg aacctagacc tattggaact agatatctta ctagaaatct ttga 2214 <210> 17 <211> 2214 <212> DNA <213> Artificial Sequence <220> <223> AAV2 CAP optimized for Solanum tuberosum <220> <221> VP1 Start Codon <222> (7)..(9) <220> <221> VP2 Start Codon <222> (418)..(420) <220> <221> VP3 Start Codon <222> (613)..(615) <400> 17 gggtttatga ctgccgccgg ttatcttcct gattggcttg aagatactct ttctgaagga 60 attagacaat ggtggaagct taagcctgga cctcctcctc ctaagcctgc tgaaagacat 120 aaggatgatt ctagaggact tgttcttcct ggatataagt atcttggacc ttttaatgga 180 cttgataagg gagaacctgt taatgaagct gatgctgctg ctcttgaaca tgataaggct 240 tatgatagac aacttgattc tggagataat ccttatctta agtataatca tgctgatgct 300 gaatttcaag aaagacttaa ggaagatact tcttttggag gaaatcttgg aagagctgtt 360 tttcaagcta agaagagagt tcttgaacct cttggacttg ttgaagaacc tgttaagacg 420 gctcctggaa agaagagacc tgttgaacat tctcctgttg aacctgattc ttcttctgga 480 actggaaagg ctggacaaca acctgctaga aagagactta attttggaca aactggagat 540 gctgattctg ttcctgatcc tcaacctctt ggacaacctc ctgctgctcc ttctggactt 600 ggaactaata ctatggctac tggatctgga gctcctatgg ctgataataa tgaaggagct 660 gatggagttg gaaattcttc tggaaattgg cattgtgatt ctacttggat gggagataga 720 gttattacta cttctactag aacttgggct cttcctactt ataataatca tctttataag 780 caaatttctt ctcaatctgg agcttctaat gataatcatt attttggata ttctactcct 840 tggggatatt ttgattttaa tagatttcat tgtcattttt ctcctagaga ttggcaaaga 900 cttattaata ataattgggg atttagacct aagagactta attttaagct ttttaatatt 960 caagttaagg aagttactca aaatgatgga actactacta ttgctaataa tcttacttct 1020 actgttcaag tttttactga ttctgaatat caacttcctt atgttcttgg atctgctcat 1080 caaggatgtc ttcctccttt tcctgctgat gtttttatgg ttcctcaata tggatatctt 1140 actcttaata atggatctca agctgttgga agatcttctt tttattgtct tgaatatttt 1200 ccttctcaaa tgcttagaac tggaaataat tttacttttt cttatacttt tgaagatgtt 1260 ccttttcatt cttcttatgc tcattctcaa tctcttgata gacttatgaa tcctcttatt 1320 gatcaatatc tttattatct ttctagaact aatactcctt ctggaactac tactcaatct 1380 agacttcaat tttctcaagc tggagcttct gatattagag atcaatctag aaattggctt 1440 cctggacctt gttatagaca acaaagagtt tctaagactt ctgctgataa taataattct 1500 gaatattctt ggactggagc tactaagtat catcttaatg gaagagattc tcttgttaat 1560 cctggacctg ctatggcttc tcataaggat gatgaagaaa agttttttcc tcaatctgga 1620 gttcttattt ttggaaagca aggatctgaa aagactaatg ttgatattga aaaggttatg 1680 attactgatg aagaagaaat tagaactact aatcctgttg ctactgaaca atatggatct 1740 gtttctacta atcttcaaag aggaaataga caagctgcta ctgctgatgt taatactcaa 1800 ggagttcttc ctggaatggt ttggcaagat agagatgttt atcttcaagg acctatttgg 1860 gctaagattc ctcatactga tggacatttt catccttctc ctcttatggg aggatttgga 1920 cttaagcatc ctcctcctca aattcttatt aagaatactc ctgttcctgc taatccttct 1980 actacttttt ctgctgctaa gtttgcttct tttattactc aatattctac tggacaagtt 2040 tctgttgaaa ttgaatggga acttcaaaag gaaaattcta agagatggaa tcctgaaatt 2100 caatatactt ctaattataa taagtctgtt aatgttgatt ttactgttga tactaatgga 2160 gtttattctg aacctagacc tattggaact agatatctta ctagaaatct ttaa 2214 <210> 18 <211> 2214 <212> DNA <213> Artificial Sequence <220> <223> AAV2 CAP optimized for Cannabis sativa <220> <221> VP1 Start Codon <222> (7)..(9) <220> <221> VP2 Start Codon <222> (418)..(420) <220> <221> VP3 Start Codon <222> (613)..(615) <400> 18 gggtttatga ctgccgccgg ttatttgcct gattggttgg aagatacttt gtcagaagga 60 attagacaat ggtggaaatt gaaacctgga cctcctcctc ctaaacctgc tgaaagacat 120 aaagatgatt caagaggatt ggttttgcct ggatataaat atttgggacc ttttaatgga 180 ttggataaag gagaacctgt taatgaagct gatgctgctg ctttggaaca tgataaagct 240 tatgatagac aattggattc aggagataat ccttatttga aatataatca tgctgatgct 300 gaatttcaag aaagattgaa agaagatact tcatttggag gaaatttggg aagagctgtt 360 tttcaagcta aaaaaagagt tttggaacct ttgggattgg ttgaagaacc tgttaaaacg 420 gctcctggaa aaaaaagacc tgttgaacat tcacctgttg aacctgattc atcatcagga 480 actggaaaag ctggacaaca acctgctaga aaaagattga attttggaca aactggagat 540 gctgattcag ttcctgatcc tcaacctttg ggacaacctc ctgctgctcc ttcaggattg 600 ggaactaata ctatggctac tggatcagga gctcctatgg ctgataataa tgaaggagct 660 gatggagttg gaaattcatc aggaaattgg cattgcgatt caacttggat gggagataga 720 gttattacta cttcaactag aacttgggct ttgcctactt ataataatca tttgtataaa 780 caaatttcat cacaatcagg agcttcaaat gataatcatt attttggata ttcaactcct 840 tggggatatt ttgattttaa tagatttcat tgccattttt cacctagaga ttggcaaaga 900 ttgattaata ataattgggg atttagacct aaaagattga attttaaatt gtttaatatt 960 caagttaaag aagttactca aaatgatgga actactacta ttgctaataa tttgacttca 1020 actgttcaag tttttactga ttcagaatat caattgcctt atgttttggg atcagctcat 1080 caaggatgct tgcctccttt tcctgctgat gtttttatgg ttcctcaata tggatatttg 1140 actttgaata atggatcaca agctgttgga agatcatcat tttattgctt ggaatatttt 1200 ccttcacaaa tgttgagaac tggaaataat tttacttttt catatacttt tgaagatgtt 1260 ccttttcatt catcatatgc tcattcacaa tcattggata gattgatgaa tcctttgatt 1320 gatcaatatt tgtattattt gtcaagaact aatactcctt caggaactac tactcaatca 1380 agattgcaat tttcacaagc tggagcttca gatattagag atcaatcaag aaattggttg 1440 cctggacctt gctatagaca acaaagagtt tcaaaaactt cagctgataa taataattca 1500 gaatattcat ggactggagc tactaaatat catttgaatg gaagagattc attggttaat 1560 cctggacctg ctatggcttc acataaagat gatgaagaaa aattttttcc tcaatcagga 1620 gttttgattt ttggaaaaca aggatcagaa aaaactaatg ttgatattga aaaagttatg 1680 attactgatg aagaagaaat tagaactact aatcctgttg ctactgaaca atatggatca 1740 gtttcaacta atttgcaaag aggaaataga caagctgcta ctgctgatgt taatactcaa 1800 ggagttttgc ctggaatggt ttggcaagat agagatgttt atttgcaagg acctatttgg 1860 gctaaaattc ctcatactga tggacatttt catccttcac ctttgatggg aggatttgga 1920 ttgaaacatc ctcctcctca aattttgatt aaaaatactc ctgttcctgc taatccttca 1980 actacttttt cagctgctaa atttgcttca tttattactc aatattcaac tggacaagtt 2040 tcagttgaaa ttgaatggga attgcaaaaa gaaaattcaa aaagatggaa tcctgaaatt 2100 caatatactt caaattataa taaatcagtt aatgttgatt ttactgttga tactaatgga 2160 gtttattcag aacctagacc tattggaact agatatttga ctagaaattt gtaa 2214 <210> 19 <211> 2214 <212> DNA <213> Artificial Sequence <220> <223> AAV2 CAP optimized for Fagopyrum esculentum <220> <221> VP1 Start Codon <222> (7)..(9) <220> <221> VP2 Start Codon <222> (418)..(420) <220> <221> VP3 Start Codon <222> (613)..(615) <400> 19 gggtttatga ctgccgccgg ttatctccct gattggctcg aggataccct ctccgaggga 60 atcaggcagt ggtggaagct caagcctgga cctcctcctc ctaagcctgc tgagaggcat 120 aaggatgatt ccaggggact cgttctccct ggatacaagt acctcggacc tttcaacgga 180 ctcgataagg gagagcctgt taacgaggct gatgctgctg ctctcgagca tgataaggct 240 tacgataggc agctcgattc cggagataac ccttacctca agtacaacca tgctgatgct 300 gagttccagg agaggctcaa ggaggatacc tccttcggag gaaacctcgg aagggctgtt 360 ttccaggcta agaagagggt tctcgagcct ctcggactcg ttgaggagcc tgttaagacg 420 gctcctggaa agaagaggcc tgttgagcat tcccctgttg agcctgattc ctcctccgga 480 accggaaagg ctggacagca gcctgctagg aagaggctca acttcggaca gaccggagat 540 gctgattccg ttcctgatcc tcagcctctc ggacagcctc ctgctgctcc ttccggactc 600 ggaaccaaca ccatggctac cggatccgga gctcctatgg ctgataacaa cgagggagct 660 gatggagttg gaaactcctc cggaaactgg cattgcgatt ccacctggat gggagatagg 720 gttatcacca cctccaccag gacctgggct ctccctacct acaacaacca tctctacaag 780 cagatctcct cccagtccgg agcttccaac gataaccatt acttcggata ctccacccct 840 tggggatact tcgatttcaa caggttccat tgccatttct cccctaggga ttggcagagg 900 ctcatcaaca acaactgggg attcaggcct aagaggctca acttcaagct cttcaacatc 960 caggttaagg aggttaccca gaacgatgga accaccacca tcgctaacaa cctcacctcc 1020 accgttcagg ttttcaccga ttccgagtac cagctccctt acgttctcgg atccgctcat 1080 cagggatgcc tccctccttt ccctgctgat gttttcatgg ttcctcagta cggatacctc 1140 accctcaaca acggatccca ggctgttgga aggtcctcct tctactgcct cgagtacttc 1200 ccttcccaga tgctcaggac cggaaacaac ttcaccttct cctacacctt cgaggatgtt 1260 cctttccatt cctcctacgc tcattcccag tccctcgata ggctcatgaa ccctctcatc 1320 gatcagtacc tctactacct ctccaggacc aacacccctt ccggaaccac cacccagtcc 1380 aggctccagt tctcccaggc tggagcttcc gatatcaggg atcagtccag gaactggctc 1440 cctggacctt gctacaggca gcagagggtt tccaagacct ccgctgataa caacaactcc 1500 gagtactcct ggaccggagc taccaagtac catctcaacg gaagggattc cctcgttaac 1560 cctggacctg ctatggcttc ccataaggat gatgaggaga agttcttccc tcagtccgga 1620 gttctcatct tcggaaagca gggatccgag aagaccaacg ttgatatcga gaaggttatg 1680 atcaccgatg aggaggagat caggaccacc aaccctgttg ctaccgagca gtacggatcc 1740 gtttccacca acctccagag gggaaacagg caggctgcta ccgctgatgt taacacccag 1800 ggagttctcc ctggaatggt ttggcaggat agggatgttt acctccaggg acctatctgg 1860 gctaagatcc ctcataccga tggacatttc catccttccc ctctcatggg aggattcgga 1920 ctcaagcatc ctcctcctca gatcctcatc aagaacaccc ctgttcctgc taacccttcc 1980 accaccttct ccgctgctaa gttcgcttcc ttcatcaccc agtactccac cggacaggtt 2040 tccgttgaga tcgagtggga gctccagaag gagaactcca agaggtggaa ccctgagatc 2100 cagtacacct ccaactacaa caagtccgtt aacgttgatt tcaccgttga taccaacgga 2160 gtttactccg agcctaggcc tatcggaacc aggtacctca ccaggaacct ctaa 2214 <210> 20 <211> 2214 <212> DNA <213> Artificial Sequence <220> <223> AAV2 CAP optimized for Oryza sativa <220> <221> VP1 Start Codon <222> (7)..(9) <220> <221> VP2 Start Codon <222> (418)..(420) <220> <221> VP3 Start Codon <222> (613)..(615) <400> 20 gggtttatga ctgccgccgg ttatctcccg gactggctcg aggacaccct ctccgagggc 60 atcaggcagt ggtggaagct caagccgggc ccgccgccgc cgaagccggc cgagaggcac 120 aaggacgact ccaggggcct cgtgctcccg ggctacaagt acctcggccc gttcaacggc 180 ctcgacaagg gcgagccggt gaacgaggcc gacgccgccg ccctcgagca cgacaaggcc 240 tacgacaggc agctcgactc cggcgacaac ccgtacctca agtacaacca cgccgacgcc 300 gagttccagg agaggctcaa ggaggacacc tccttcggcg gcaacctcgg cagggccgtg 360 ttccaggcca agaagagggt gctcgagccg ctcggcctcg tggaggagcc ggtgaagacg 420 gccccgggca agaagaggcc ggtggagcac tccccggtgg agccggactc ctcctccggc 480 accggcaagg ccggccagca gccggccagg aagaggctca acttcggcca gaccggcgac 540 gccgactccg tgccggaccc gcagccgctc ggccagccgc cggccgcccc gtccggcctc 600 ggcaccaaca ccatggccac cggctccggc gccccgatgg ccgacaacaa cgagggcgcc 660 gacggcgtgg gcaactcctc cggcaactgg cactgcgact ccacctggat gggcgacagg 720 gtgatcacca cctccaccag gacctgggcc ctcccgacct acaacaacca cctctacaag 780 cagatctcct cccagtccgg cgcctccaac gacaaccact acttcggcta ctccaccccg 840 tggggctact tcgacttcaa caggttccac tgccacttct ccccgaggga ctggcagagg 900 ctcatcaaca acaactgggg cttcaggccg aagaggctca acttcaagct cttcaacatc 960 caggtgaagg aggtgaccca gaacgacggc accaccacca tcgccaacaa cctcacctcc 1020 accgtgcagg tgttcaccga ctccgagtac cagctcccgt acgtgctcgg ctccgcccac 1080 cagggctgcc tcccgccgtt cccggccgac gtgttcatgg tgccgcagta cggctacctc 1140 accctcaaca acggctccca ggccgtgggc aggtcctcct tctactgcct cgagtacttc 1200 ccgtcccaga tgctcaggac cggcaacaac ttcaccttct cctacacctt cgaggacgtg 1260 ccgttccact cctcctacgc ccactcccag tccctcgaca ggctcatgaa cccgctcatc 1320 gaccagtacc tctactacct ctccaggacc aacaccccgt ccggcaccac cacccagtcc 1380 aggctccagt tctcccaggc cggcgcctcc gacatcaggg accagtccag gaactggctc 1440 ccgggcccgt gctacaggca gcagagggtg tccaagacct ccgccgacaa caacaactcc 1500 gagtactcct ggaccggcgc caccaagtac cacctcaacg gcagggactc cctcgtgaac 1560 ccgggcccgg ccatggcctc ccacaaggac gacgaggaga agttcttccc gcagtccggc 1620 gtgctcatct tcggcaagca gggctccgag aagaccaacg tggacatcga gaaggtgatg 1680 atcaccgacg aggaggagat caggaccacc aacccggtgg ccaccgagca gtacggctcc 1740 gtgtccacca acctccagag gggcaacagg caggccgcca ccgccgacgt gaacacccag 1800 ggcgtgctcc cgggcatggt gtggcaggac agggacgtgt acctccaggg cccgatctgg 1860 gccaagatcc cgcacaccga cggccacttc cacccgtccc cgctcatggg cggcttcggc 1920 ctcaagcacc cgccgccgca gatcctcatc aagaacaccc cggtgccggc caacccgtcc 1980 accaccttct ccgccgccaa gttcgcctcc ttcatcaccc agtactccac cggccaggtg 2040 tccgtggaga tcgagtggga gctccagaag gagaactcca agaggtggaa cccggagatc 2100 cagtacacct ccaactacaa caagtccgtg aacgtggact tcaccgtgga caccaacggc 2160 gtgtactccg agccgaggcc gatcggcacc aggtacctca ccaggaacct ctga 2214 <210> 21 <211> 2214 <212> DNA <213> Artificial Sequence <220> <223> AAV2 CAP optimized for Zea mays <220> <221> VP1 Start Codon <222> (7)..(9) <220> <221> VP2 Start Codon <222> (418)..(420) <220> <221> VP3 Start Codon <222> (613)..(615) <400> 21 gggtttatga ctgccgccgg ttatctgccg gactggctgg aggacaccct gtccgagggc 60 atcaggcagt ggtggaagct gaagccgggc ccgccgccgc cgaagccggc cgagaggcac 120 aaggacgact ccaggggcct ggtgctgccg ggctacaagt acctgggccc gttcaacggc 180 ctggacaagg gcgagccggt gaacgaggcc gacgccgccg ccctggagca cgacaaggcc 240 tacgacaggc agctggactc cggcgacaac ccgtacctga agtacaacca cgccgacgcc 300 gagttccagg agaggctgaa ggaggacacc tccttcggcg gcaacctggg cagggccgtg 360 ttccaggcca agaagagggt gctggagccg ctgggcctgg tggaggagcc ggtgaagacg 420 gccccgggca agaagaggcc ggtggagcac tccccggtgg agccggactc ctcctccggc 480 accggcaagg ccggccagca gccggccagg aagaggctga acttcggcca gaccggcgac 540 gccgactccg tgccggaccc gcagccgctg ggccagccgc cggccgcccc gtccggcctg 600 ggcaccaaca ccatggccac cggctccggc gccccgatgg ccgacaacaa cgagggcgcc 660 gacggcgtgg gcaactcctc cggcaactgg cactgcgact ccacctggat gggcgacagg 720 gtgatcacca cctccaccag gacctgggcc ctgccgacct acaacaacca cctgtacaag 780 cagatctcct cccagtccgg cgcctccaac gacaaccact acttcggcta ctccaccccg 840 tggggctact tcgacttcaa caggttccac tgccacttct ccccgaggga ctggcagagg 900 ctgatcaaca acaactgggg cttcaggccg aagaggctga acttcaagct gttcaacatc 960 caggtgaagg aggtgaccca gaacgacggc accaccacca tcgccaacaa cctgacctcc 1020 accgtgcagg tgttcaccga ctccgagtac cagctgccgt acgtgctggg ctccgcccac 1080 cagggctgcc tgccgccgtt cccggccgac gtgttcatgg tgccgcagta cggctacctg 1140 accctgaaca acggctccca ggccgtgggc aggtcctcct tctactgcct ggagtacttc 1200 ccgtcccaga tgctgaggac cggcaacaac ttcaccttct cctacacctt cgaggacgtg 1260 ccgttccact cctcctacgc ccactcccag tccctggaca ggctgatgaa cccgctgatc 1320 gaccagtacc tgtactacct gtccaggacc aacaccccgt ccggcaccac cacccagtcc 1380 aggctgcagt tctcccaggc cggcgcctcc gacatcaggg accagtccag gaactggctg 1440 ccgggcccgt gctacaggca gcagagggtg tccaagacct ccgccgacaa caacaactcc 1500 gagtactcct ggaccggcgc caccaagtac cacctgaacg gcagggactc cctggtgaac 1560 ccgggcccgg ccatggcctc ccacaaggac gacgaggaga agttcttccc gcagtccggc 1620 gtgctgatct tcggcaagca gggctccgag aagaccaacg tggacatcga gaaggtgatg 1680 atcaccgacg aggaggagat caggaccacc aacccggtgg ccaccgagca gtacggctcc 1740 gtgtccacca acctgcagag gggcaacagg caggccgcca ccgccgacgt gaacacccag 1800 ggcgtgctgc cgggcatggt gtggcaggac agggacgtgt acctgcaggg cccgatctgg 1860 gccaagatcc cgcacaccga cggccacttc cacccgtccc cgctgatggg cggcttcggc 1920 ctgaagcacc cgccgccgca gatcctgatc aagaacaccc cggtgccggc caacccgtcc 1980 accaccttct ccgccgccaa gttcgcctcc ttcatcaccc agtactccac cggccaggtg 2040 tccgtggaga tcgagtggga gctgcagaag gagaactcca agaggtggaa cccggagatc 2100 cagtacacct ccaactacaa caagtccgtg aacgtggact tcaccgtgga caccaacggc 2160 gtgtactccg agccgaggcc gatcggcacc aggtacctga ccaggaacct gtga 2214 <210> 22 <211> 2214 <212> DNA <213> Artificial Sequence <220> <223> AAV2 CAP optimized for Solanum lycopersicoides <220> <221> VP1 Start Codon <222> (7)..(9) <220> <221> VP2 Start Codon <222> (418)..(420) <220> <221> VP3 Start Codon <222> (613)..(615) <400> 22 gggtttatga ctgccgccgg ttatcttcca gattggcttg aggatacact ttcagaggga 60 attagacaat ggtggaagct taagccagga ccaccaccac caaagccagc agagagacat 120 aaggatgatt caagaggact tgttcttcca ggatacaagt accttggacc atttaatgga 180 cttgataagg gagagccagt taatgaggca gatgcagcag cacttgagca tgataaggca 240 tacgatagac aacttgattc aggagataat ccatacctta agtacaatca tgcagatgca 300 gagtttcaag agagacttaa ggaggataca tcatttggag gaaatcttgg aagagcagtt 360 tttcaagcaa agaagagagt tcttgagcca cttggacttg ttgaggagcc agttaagacg 420 gcaccaggaa agaagagacc agttgagcat tcaccagttg agccagattc atcatcagga 480 acaggaaagg caggacaaca accagcaaga aagagactta attttggaca aacaggagat 540 gcagattcag ttccagatcc acaaccactt ggacaaccac cagcagcacc atcaggactt 600 ggaacaaata caatggcaac aggatcagga gcaccaatgg cagataataa tgagggagca 660 gatggagttg gaaattcatc aggaaattgg cattgtgatt caacatggat gggagataga 720 gttattacaa catcaacaag aacatgggca cttccaacat acaataatca tctttacaag 780 caaatttcat cacaatcagg agcatcaaat gataatcatt actttggata ctcaacacca 840 tggggatact ttgattttaa tagatttcat tgtcattttt caccaagaga ttggcaaaga 900 cttattaata ataattgggg atttagacca aagagactta attttaagct ttttaatatt 960 caagttaagg aggttacaca aaatgatgga acaacaacaa ttgcaaataa tcttacatca 1020 acagttcaag tttttacaga ttcagagtac caacttccat acgttcttgg atcagcacat 1080 caaggatgtc ttccaccatt tccagcagat gtttttatgg ttccacaata cggatacctt 1140 acacttaata atggatcaca agcagttgga agatcatcat tttactgtct tgagtacttt 1200 ccatcacaaa tgcttagaac aggaaataat tttacatttt catacacatt tgaggatgtt 1260 ccatttcatt catcatacgc acattcacaa tcacttgata gacttatgaa tccacttatt 1320 gatcaatacc tttactacct ttcaagaaca aatacaccat caggaacaac aacacaatca 1380 agacttcaat tttcacaagc aggagcatca gatattagag atcaatcaag aaattggctt 1440 ccaggaccat gttacagaca acaaagagtt tcaaagacat cagcagataa taataattca 1500 gagtactcat ggacaggagc aacaaagtac catcttaatg gaagagattc acttgttaat 1560 ccaggaccag caatggcatc acataaggat gatgaggaga agttttttcc acaatcagga 1620 gttcttattt ttggaaagca aggatcagag aagacaaatg ttgatattga gaaggttatg 1680 attacagatg aggaggagat tagaacaaca aatccagttg caacagagca atacggatca 1740 gtttcaacaa atcttcaaag aggaaataga caagcagcaa cagcagatgt taatacacaa 1800 ggagttcttc caggaatggt ttggcaagat agagatgttt accttcaagg accaatttgg 1860 gcaaagattc cacatacaga tggacatttt catccatcac cacttatggg aggatttgga 1920 cttaagcatc caccaccaca aattcttatt aagaatacac cagttccagc aaatccatca 1980 acaacatttt cagcagcaaa gtttgcatca tttattacac aatactcaac aggacaagtt 2040 tcagttgaga ttgagtggga gcttcaaaag gagaattcaa agagatggaa tccagagatt 2100 caatacacat caaattacaa taagtcagtt aatgttgatt ttacagttga tacaaatgga 2160 gtttactcag agccaagacc aattggaaca agatacctta caagaaatct ttga 2214 <210> 23 <211> 2214 <212> DNA <213> Artificial Sequence <220> <223> AAV2 CAP optimized for Solanum lycopersicum <220> <221> VP1 Start Codon <222> (7)..(9) <220> <221> VP2 Start Codon <222> (418)..(420) <220> <221> VP3 Start Codon <222> (613)..(615) <400> 23 gggtttatga ctgccgccgg ttatcttcct gattggcttg aagatactct ttctgaagga 60 attagacaat ggtggaagct taagcctgga cctcctcctc ctaagcctgc tgaaagacat 120 aaggatgatt ctagaggact tgttcttcct ggatataagt atcttggacc ttttaatgga 180 cttgataagg gagaacctgt taatgaagct gatgctgctg ctcttgaaca tgataaggct 240 tatgatagac aacttgattc tggagataat ccttatctta agtataatca tgctgatgct 300 gaatttcaag aaagacttaa ggaagatact tcttttggag gaaatcttgg aagagctgtt 360 tttcaagcta agaagagagt tcttgaacct cttggacttg ttgaagaacc tgttaagact 420 gctcctggaa agaagagacc tgttgaacat tctcctgttg aacctgattc ttcttctgga 480 actggaaagg ctggacaaca acctgctaga aagagactta attttggaca aactggagat 540 gctgattctg ttcctgatcc tcaacctctt ggacaacctc ctgctgctcc ttctggactt 600 ggaactaata ctatggctac tggatctgga gctcctatgg ctgataataa tgaaggagct 660 gatggagttg gaaattcttc tggaaattgg cattgtgatt ctacttggat gggagataga 720 gttattacta cttctactag aacttgggct cttcctactt ataataatca tctttataag 780 caaatttctt ctcaatctgg agcttctaat gataatcatt attttggata ttctactcct 840 tggggatatt ttgattttaa tagatttcat tgtcattttt ctcctagaga ttggcaaaga 900 cttattaata ataattgggg atttagacct aagagactta attttaagct ttttaatatt 960 caagttaagg aagttactca aaatgatgga actactacta ttgctaataa tcttacttct 1020 actgttcaag tttttactga ttctgaatat caacttcctt atgttcttgg atctgctcat 1080 caaggatgtc ttcctccttt tcctgctgat gtttttatgg ttcctcaata tggatatctt 1140 actcttaata atggatctca agctgttgga agatcttctt tttattgtct tgaatatttt 1200 ccttctcaaa tgcttagaac tggaaataat tttacttttt cttatacttt tgaagatgtt 1260 ccttttcatt cttcttatgc tcattctcaa tctcttgata gacttatgaa tcctcttatt 1320 gatcaatatc tttattatct ttctagaact aatactcctt ctggaactac tactcaatct 1380 agacttcaat tttctcaagc tggagcttct gatattagag atcaatctag aaattggctt 1440 cctggacctt gttatagaca acaaagagtt tctaagactt ctgctgataa taataattct 1500 gaatattctt ggactggagc tactaagtat catcttaatg gaagagattc tcttgttaat 1560 cctggacctg ctatggcttc tcataaggat gatgaagaaa agttttttcc tcaatctgga 1620 gttcttattt ttggaaagca aggatctgaa aagactaatg ttgatattga aaaggttatg 1680 attactgatg aagaagaaat tagaactact aatcctgttg ctactgaaca atatggatct 1740 gtttctacta atcttcaaag aggaaataga caagctgcta ctgctgatgt taatactcaa 1800 ggagttcttc ctggaatggt ttggcaagat agagatgttt atcttcaagg acctatttgg 1860 gctaagattc ctcatactga tggacatttt catccttctc ctcttatggg aggatttgga 1920 cttaagcatc ctcctcctca aattcttatt aagaatactc ctgttcctgc taatccttct 1980 actacttttt ctgctgctaa gtttgcttct tttattactc aatattctac tggacaagtt 2040 tctgttgaaa ttgaatggga acttcaaaag gaaaattcta agagatggaa tcctgaaatt 2100 caatatactt ctaattataa taagtctgtt aatgttgatt ttactgttga tactaatgga 2160 gtttattctg aacctagacc tattggaact agatatctta ctagaaatct ttaa 2214 <210> 24 <211> 2214 <212> DNA <213> Artificial Sequence <220> <223> AAV2 CAP optimized for Lactuca sativa <220> <221> VP1 Start Codon <222> (7)..(9) <220> <221> VP2 Start Codon <222> (418)..(420) <220> <221> VP3 Start Codon <222> (613)..(615) <400> 24 gggtttatga ctgccgccgg ttatcttcca gattggcttg aagatacact ttctgaagga 60 attagacaat ggtggaaact taaaccagga ccaccaccac caaaaccagc tgaaagacat 120 aaagatgatt ctagaggact tgttcttcca ggatataaat atcttggacc atttaatgga 180 cttgataaag gagaaccagt taatgaagct gatgctgctg ctcttgaaca tgataaagct 240 tatgatagac aacttgattc tggagataat ccatatctta aatataatca tgctgatgct 300 gaatttcaag aaagacttaa agaagataca tcttttggag gaaatcttgg aagagctgtt 360 tttcaagcta aaaaaagagt tcttgaacca cttggacttg ttgaagaacc agttaaaaca 420 gctccaggaa aaaaaagacc agttgaacat tctccagttg aaccagattc ttcttctgga 480 acaggaaaag ctggacaaca accagctaga aaaagactta attttggaca aacaggagat 540 gctgattctg ttccagatcc acaaccactt ggacaaccac cagctgctcc atctggactt 600 ggaacaaata caatggctac aggatctgga gctccaatgg ctgataataa tgaaggagct 660 gatggagttg gaaattcttc tggaaattgg cattgtgatt ctacatggat gggagataga 720 gttattacaa catctacaag aacatgggct cttccaacat ataataatca tctttataaa 780 caaatttctt ctcaatctgg agcttctaat gataatcatt attttggata ttctacacca 840 tggggatatt ttgattttaa tagatttcat tgtcattttt ctccaagaga ttggcaaaga 900 cttattaata ataattgggg atttagacca aaaagactta attttaaact ttttaatatt 960 caagttaaag aagttacaca aaatgatgga acaacaacaa ttgctaataa tcttacatct 1020 acagttcaag tttttacaga ttctgaatat caacttccat atgttcttgg atctgctcat 1080 caaggatgtc ttccaccatt tccagctgat gtttttatgg ttccacaata tggatatctt 1140 acacttaata atggatctca agctgttgga agatcttctt tttattgtct tgaatatttt 1200 ccatctcaaa tgcttagaac aggaaataat tttacatttt cttatacatt tgaagatgtt 1260 ccatttcatt cttcttatgc tcattctcaa tctcttgata gacttatgaa tccacttatt 1320 gatcaatatc tttattatct ttctagaaca aatacaccat ctggaacaac aacacaatct 1380 agacttcaat tttctcaagc tggagcttct gatattagag atcaatctag aaattggctt 1440 ccaggaccat gttatagaca acaaagagtt tctaaaacat ctgctgataa taataattct 1500 gaatattctt ggacaggagc tacaaaatat catcttaatg gaagagattc tcttgttaat 1560 ccaggaccag ctatggcttc tcataaagat gatgaagaaa aattttttcc acaatctgga 1620 gttcttattt ttggaaaaca aggatctgaa aaaacaaatg ttgatattga aaaagttatg 1680 attacagatg aagaagaaat tagaacaaca aatccagttg ctacagaaca atatggatct 1740 gtttctacaa atcttcaaag aggaaataga caagctgcta cagctgatgt taatacacaa 1800 ggagttcttc caggaatggt ttggcaagat agagatgttt atcttcaagg accaatttgg 1860 gctaaaattc cacatacaga tggacatttt catccatctc cacttatggg aggatttgga 1920 cttaaacatc caccaccaca aattcttatt aaaaatacac cagttccagc taatccatct 1980 acaacatttt ctgctgctaa atttgcttct tttattacac aatattctac aggacaagtt 2040 tctgttgaaa ttgaatggga acttcaaaaa gaaaattcta aaagatggaa tccagaaatt 2100 caatatacat ctaattataa taaatctgtt aatgttgatt ttacagttga tacaaatgga 2160 gtttattctg aaccaagacc aattggaaca agatatctta caagaaatct ttga 2214 <210> 25 <211> 735 <212> PRT <213> adeno-associated virus 2 <400> 25 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr 580 585 590 Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp 595 600 605 Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr 610 615 620 Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys 625 630 635 640 His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn 645 650 655 Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln 660 665 670 Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys 675 680 685 Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr 690 695 700 Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr 705 710 715 720 Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 26 <211> 735 <212> PRT <213> Artificial Sequence <220> <223> AAV2 CAP optimized for plant expression <400> 26 Met Thr Ala Ala Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr 580 585 590 Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp 595 600 605 Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr 610 615 620 Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys 625 630 635 640 His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn 645 650 655 Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln 660 665 670 Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys 675 680 685 Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr 690 695 700 Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr 705 710 715 720 Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 27 <211> 618 <212> DNA <213> adeno-associated virus 2 <400> 27 atgctggaga cgcagactca gtacctgacc cccagcctct cggacagcca ccagcagccc 60 cctctggtct gggaactaat acgatggcta caggcagtgg cgcaccaatg gcagacaata 120 acgagggcgc cgacggagtg ggtaattcct cgggaaattg gcattgcgat tccacatgga 180 tgggcgacag agtcatcacc accagcaccc gaacctgggc cctgcccacc tacaacaacc 240 acctctacaa acaaatttcc agccaatcag gagcctcgaa cgacaatcac tactttggct 300 acagcacccc ttgggggtat tttgacttca acagattcca ctgccacttt tcaccacgtg 360 actggcaaag actcatcaac aacaactggg gattccgacc caagagactc aacttcaagc 420 tctttaacat tcaagtcaaa gaggtcacgc agaatgacgg tacgacgacg attgccaata 480 accttaccag cacggttcag gtgtttactg actcggagta ccagctcccg tacgtcctcg 540 gctcggcgca tcaaggatgc ctcccgccgt tcccagcaga cgtcttcatg gtgccacagt 600 atggatacct caccctga 618 <210> 28 <211> 618 <212> DNA <213> Artificial Sequence <220> <223> AAV2 AAP optimized for Nicotiana benthamiana <400> 28 atgttagaga ctcagacaca atacttgact ccatcacttt cagatagcca tcagcagcct 60 ccactcgttt gggaactcat aaggtggctt caagctgttg ctcatcaatg gcaaacaatt 120 actagggctc ctacagaatg ggttattcca agagagattg gaattgctat tcctcatggt 180 tgggctactg aatcttcacc acctgctcca gagcctggac catgtccacc tactacaact 240 acatcaacaa ataagtttcc tgctaatcaa gaaccaagaa ctacaattac tacacttgct 300 actgctcctc ttggaggtat tttgacatca actgattcta cagctacttt tcatcatgtt 360 acaggaaaag attcttcaac tacaactgga gattcagatc caagggattc tacatcttca 420 tctttgactt ttaagtcaaa aagatctaga aggatgacag ttagaaggag acttcctatt 480 actttgccag ctaggtttag atgtcttttg acaaggtcta cttcatctag aacttcatct 540 gctaggagaa ttaaggatgc aagcagaaga agccaacaga caagttcctg gtgccacagc 600 atggatacaa gcccttaa 618 <210> 29 <211> 618 <212> DNA <213> Artificial Sequence <220> <223> AAV2 AAP optimized for Arabidopsis thaliana <400> 29 atgcttgaaa ctcaaactca atatcttact ccttctcttt ctgattctca tcaacaacct 60 cctcttgttt gggaacttat tagatggctt caagctgttg ctcatcaatg gcaaactatt 120 actagagctc ctactgaatg ggttattcct agagaaattg gaattgctat tcctcatgga 180 tgggctactg aatcttctcc tcctgctcct gaacctggac cttgtcctcc tactactact 240 acttctacta ataagtttcc tgctaatcaa gaacctagaa ctactattac tactcttgct 300 actgctcctc ttggaggaat tcttacttct actgattcta ctgctacttt tcatcatgtt 360 actggaaagg attcttctac tactactgga gattctgatc ctagagattc tacttcttct 420 tctcttactt ttaagtctaa gagatctaga agaatgactg ttagaagaag acttcctatt 480 actcttcctg ctagatttag atgtcttctt actagatcta cttcttctag aacttcttct 540 gctagaagaa ttaaggatgc ttctagaaga tctcaacaaa cttcttcttg gtgtcattct 600 atggatactt ctccttga 618 <210> 30 <211> 618 <212> DNA <213> Artificial Sequence <220> <223> AAV2 AAP optimized for Solanum tuberosum <400> 30 atgcttgaaa ctcaaactca atatcttact ccttctcttt ctgattctca tcaacaacct 60 cctcttgttt gggaacttat tagatggctt caagctgttg ctcatcaatg gcaaactatt 120 actagagctc ctactgaatg ggttattcct agagaaattg gaattgctat tcctcatgga 180 tgggctactg aatcttctcc tcctgctcct gaacctggac cttgtcctcc tactactact 240 acttctacta ataagtttcc tgctaatcaa gaacctagaa ctactattac tactcttgct 300 actgctcctc ttggaggaat tcttacttct actgattcta ctgctacttt tcatcatgtt 360 actggaaagg attcttctac tactactgga gattctgatc ctagagattc tacttcttct 420 tctcttactt ttaagtctaa gagatctaga agaatgactg ttagaagaag acttcctatt 480 actcttcctg ctagatttag atgtcttctt actagatcta cttcttctag aacttcttct 540 gctagaagaa ttaaggatgc ttctagaaga tctcaacaaa cttcttcttg gtgtcattct 600 atggatactt ctccttaa 618 <210> 31 <211> 618 <212> DNA <213> Artificial Sequence <220> <223> AAV2 AAP optimized for Cannabis sativa <400> 31 atgttggaaa ctcaaactca atatttgact ccttcattgt cagattcaca tcaacaacct 60 cctttggttt gggaattgat tagatggttg caagctgttg ctcatcaatg gcaaactatt 120 actagagctc ctactgaatg ggttattcct agagaaattg gaattgctat tcctcatgga 180 tgggctactg aatcatcacc tcctgctcct gaacctggac cttgccctcc tactactact 240 acttcaacta ataaatttcc tgctaatcaa gaacctagaa ctactattac tactttggct 300 actgctcctt tgggaggaat tttgacttca actgattcaa ctgctacttt tcatcatgtt 360 actggaaaag attcatcaac tactactgga gattcagatc ctagagattc aacttcatca 420 tcattgactt ttaaatcaaa aagatcaaga agaatgactg ttagaagaag attgcctatt 480 actttgcctg ctagatttag atgcttgttg actagatcaa cttcatcaag aacttcatca 540 gctagaagaa ttaaagatgc ttcaagaaga tcacaacaaa cttcatcatg gtgccattca 600 atggatactt caccttaa 618 <210> 32 <211> 618 <212> DNA <213> Artificial Sequence <220> <223> AAV2 AAP optimized for Fagopyrum esculentum <400> 32 atgctcgaga cccagaccca gtacctcacc ccttccctct ccgattccca tcagcagcct 60 cctctcgttt gggagctcat caggtggctc caggctgttg ctcatcagtg gcagaccatc 120 accagggctc ctaccgagtg ggttatccct agggagatcg gaatcgctat ccctcatgga 180 tgggctaccg agtcctcccc tcctgctcct gagcctggac cttgccctcc taccaccacc 240 acctccacca acaagttccc tgctaaccag gagcctagga ccaccatcac caccctcgct 300 accgctcctc tcggaggaat cctcacctcc accgattcca ccgctacctt ccatcatgtt 360 accggaaagg attcctccac caccaccgga gattccgatc ctagggattc cacctcctcc 420 tccctcacct tcaagtccaa gaggtccagg aggatgaccg ttaggaggag gctccctatc 480 accctccctg ctaggttcag gtgcctcctc accaggtcca cctcctccag gacctcctcc 540 gctaggagga tcaaggatgc ttccaggagg tcccagcaga cctcctcctg gtgccattcc 600 atggatacct ccccttaa 618 <210> 33 <211> 618 <212> DNA <213> Artificial Sequence <220> <223> AAV2 AAP optimized for Oryza sativa <400> 33 atgctcgaga cccagaccca gtacctcacc ccgtccctct ccgactccca ccagcagccg 60 ccgctcgtgt gggagctcat caggtggctc caggccgtgg cccaccagtg gcagaccatc 120 accagggccc cgaccgagtg ggtgatcccg agggagatcg gcatcgccat cccgcacggc 180 tgggccaccg agtcctcccc gccggccccg gagccgggcc cgtgcccgcc gaccaccacc 240 acctccacca acaagttccc ggccaaccag gagccgagga ccaccatcac caccctcgcc 300 accgccccgc tcggcggcat cctcacctcc accgactcca ccgccacctt ccaccacgtg 360 accggcaagg actcctccac caccaccggc gactccgacc cgagggactc cacctcctcc 420 tccctcacct tcaagtccaa gaggtccagg aggatgaccg tgaggaggag gctcccgatc 480 accctcccgg ccaggttcag gtgcctcctc accaggtcca cctcctccag gacctcctcc 540 gccaggagga tcaaggacgc ctccaggagg tcccagcaga cctcctcctg gtgccactcc 600 atggacacct ccccgtga 618 <210> 34 <211> 618 <212> DNA <213> Artificial Sequence <220> <223> AAV2 AAP optimized for Zea mays <400> 34 atgctggaga cccagaccca gtacctgacc ccgagcctga gcgacagcca ccagcagccg 60 ccgctggtgt gggagctgat caggtggctg caggccgtgg cccaccagtg gcagaccatc 120 accagggccc cgaccgagtg ggtgatcccg agggagatcg gcatcgccat cccgcacggc 180 tgggccaccg agagcagccc gccggccccg gagccgggcc cgtgcccgcc gaccaccacc 240 accagcacca acaagttccc ggccaaccag gagccgagga ccaccatcac caccctggcc 300 accgccccgc tgggcggcat cctgaccagc accgacagca ccgccacctt ccaccacgtg 360 accggcaagg acagcagcac caccaccggc gacagcgacc cgagggacag caccagcagc 420 agcctgacct tcaagagcaa gaggagcagg aggatgaccg tgaggaggag gctgccgatc 480 accctgccgg ccaggttcag gtgcctgctg accaggagca ccagcagcag gaccagcagc 540 gccaggagga tcaaggacgc cagcaggagg agccagcaga ccagctcctg gtgccacagc 600 atggacacca gcccgtga 618 <210> 35 <211> 618 <212> DNA <213> Artificial Sequence <220> <223> AAV2 AAP optimized for Solanum lycopersicoides <400> 35 atgcttgaga cacaaacaca ataccttaca ccatcacttt cagattcaca tcaacaacca 60 ccacttgttt gggagcttat tagatggctt caagcagttg cacatcaatg gcaaacaatt 120 acaagagcac caacagagtg ggttattcca agagagattg gaattgcaat tccacatgga 180 tgggcaacag agtcatcacc accagcacca gagccaggac catgtccacc aacaacaaca 240 acatcaacaa ataagtttcc agcaaatcaa gagccaagaa caacaattac aacacttgca 300 acagcaccac ttggaggaat tcttacatca acagattcaa cagcaacatt tcatcatgtt 360 acaggaaagg attcatcaac aacaacagga gattcagatc caagagattc aacatcatca 420 tcacttacat ttaagtcaaa gagatcaaga agaatgacag ttagaagaag acttccaatt 480 acacttccag caagatttag atgtcttctt acaagatcaa catcatcaag aacatcatca 540 gcaagaagaa ttaaggatgc atcaagaaga tcacaacaaa catcatcatg gtgtcattca 600 atggatacat caccatga 618 <210> 36 <211> 618 <212> DNA <213> Artificial Sequence <220> <223> AAV2 AAP optimized for Solanum lycopersicum <400> 36 atgcttgaaa ctcaaactca atatcttact ccttctcttt ctgattctca tcaacaacct 60 cctcttgttt gggaacttat tagatggctt caagctgttg ctcatcaatg gcaaactatt 120 actagagctc ctactgaatg ggttattcct agagaaattg gaattgctat tcctcatgga 180 tgggctactg aatcttctcc tcctgctcct gaacctggac cttgtcctcc tactactact 240 acttctacta ataagtttcc tgctaatcaa gaacctagaa ctactattac tactcttgct 300 actgctcctc ttggaggaat tcttacttct actgattcta ctgctacttt tcatcatgtt 360 actggaaagg attcttctac tactactgga gattctgatc ctagagattc tacttcttct 420 tctcttactt ttaagtctaa gagatctaga agaatgactg ttagaagaag acttcctatt 480 actcttcctg ctagatttag atgtcttctt actagatcta cttcttctag aacttcttct 540 gctagaagaa ttaaggatgc ttctagaaga tctcaacaaa cttcttcttg gtgtcattct 600 atggatactt ctccttaa 618 <210> 37 <211> 618 <212> DNA <213> Artificial Sequence <220> <223> AAV2 AAP optimized for Lactuca sativa <400> 37 atgcttgaaa cacaaacaca atatcttaca ccatctcttt ctgattctca tcaacaacca 60 ccacttgttt gggaacttat tagatggctt caagctgttg ctcatcaatg gcaaacaatt 120 acaagagctc caacagaatg ggttattcca agagaaattg gaattgctat tccacatgga 180 tgggctacag aatcttctcc accagctcca gaaccaggac catgtccacc aacaacaaca 240 acatctacaa ataaatttcc agctaatcaa gaaccaagaa caacaattac aacacttgct 300 acagctccac ttggaggaat tcttacatct acagattcta cagctacatt tcatcatgtt 360 acaggaaaag attcttctac aacaacagga gattctgatc caagagattc tacatcttct 420 tctcttacat ttaaatctaa aagatctaga agaatgacag ttagaagaag acttccaatt 480 acacttccag ctagatttag atgtcttctt acaagatcta catcttctag aacatcttct 540 gctagaagaa ttaaagatgc ttctagaaga tctcaacaaa catcttcttg gtgtcattct 600 atggatacat ctccatga 618 <210> 38 <211> 205 <212> PRT <213> adeno-associated virus 2 <400> 38 Met Leu Glu Thr Gln Thr Gln Tyr Leu Thr Pro Ser Leu Ser Asp Ser 1 5 10 15 His Gln Gln Pro Pro Leu Val Trp Glu Leu Ile Arg Trp Leu Gln Ala 20 25 30 Val Ala His Gln Trp Gln Thr Ile Thr Arg Ala Pro Thr Glu Trp Val 35 40 45 Ile Pro Arg Glu Ile Gly Ile Ala Ile Pro His Gly Trp Ala Thr Glu 50 55 60 Ser Ser Pro Pro Ala Pro Glu Pro Gly Pro Cys Pro Pro Thr Thr Thr 65 70 75 80 Thr Ser Thr Asn Lys Phe Pro Ala Asn Gln Glu Pro Arg Thr Thr Ile 85 90 95 Thr Thr Leu Ala Thr Ala Pro Leu Gly Gly Ile Leu Thr Ser Thr Asp 100 105 110 Ser Thr Ala Thr Phe His His Val Thr Gly Lys Asp Ser Ser Thr Thr 115 120 125 Thr Gly Asp Ser Asp Pro Arg Asp Ser Thr Ser Ser Ser Leu Thr Phe 130 135 140 Lys Ser Lys Arg Ser Arg Arg Met Thr Val Arg Arg Arg Leu Pro Ile 145 150 155 160 Thr Leu Pro Ala Arg Phe Arg Cys Leu Leu Thr Arg Ser Thr Ser Ser 165 170 175 Arg Thr Ser Ser Ala Arg Arg Ile Lys Asp Ala Ser Arg Arg Ser Gln 180 185 190 Gln Thr Ser Ser Trp Cys His Ser Met Asp Thr Ser Pro 195 200 205 <210> 39 <211> 453 <212> DNA <213> adeno-associated virus 2 <400> 39 atgaccacca gcggcgtgcc cttcggcatg accctgagac ccaccagaag cagactgagc 60 agaagaaccc cctacagcag agacagactg ccccccttcg agaccgagac cagagccacc 120 atcctggagg accaccccct gctgcccgag tgcaacaccc tgaccatgca caacgcctgg 180 accagcccca gcccccccgt gaagcagccc caggtgggcc agcagcccgt ggcccagcag 240 ctggacagcg acatgaacct gagcgagctg cccggcgagt tcatcaacat caccgacgag 300 agactggcca gacaggagac cgtgtggaac atcaccccca agaacatgag cgtgacccac 360 gacatgatgc tgttcaaggc cagcagaggc gagagaaccg tgtacagcgt gtgctgggag 420 ggcggcggca gactgaacac cagagtgctg taa 453 <210> 40 <211> 453 <212> DNA <213> Artificial Sequence <220> <223> Ad5 E4orf6 optimized for Nicotiana benthamiana <400> 40 atgactacat ctggtgttcc atttggaatg actcttagac ctacaagatc taggttgtca 60 agaaggacac catattcaag agataggctt ccaccttttg aaactgagac aagggctact 120 attttggaag atcatccact tttgcctgag tgtaatactc ttacaatgca taatgcttgg 180 acatctcctt caccacctgt taagcaacca caagttggtc aacaacctgt tgctcaacaa 240 ttggattctg atatgaatct ttcagaattg ccaggagagt ttattaatat cactgatgaa 300 agacttgcta ggcaagagac tgtttggaac atcacaccta agaacatgtc tgttactcat 360 gatatgatgt tgtttaaagc ttctagaggt gaaaggacag tttactcagt ttgttgggag 420 ggaggtggaa gacttaatac tagggttttg taa 453 <210> 41 <211> 453 <212> DNA <213> Artificial Sequence <220> <223> Ad5 E4orf6 optimized for Arabidopsis thaliana <400> 41 atgactactt ctggagttcc ttttggaatg actcttagac ctactagatc tagactttct 60 agaagaactc cttattctag agatagactt cctccttttg aaactgaaac tagagctact 120 attcttgaag atcatcctct tcttcctgaa tgtaatactc ttactatgca taatgcttgg 180 acttctcctt ctcctcctgt taagcaacct caagttggac aacaacctgt tgctcaacaa 240 cttgattctg atatgaatct ttctgaactt cctggagaat ttattaatat tactgatgaa 300 agacttgcta gacaagaaac tgtttggaat attactccta agaatatgtc tgttactcat 360 gatatgatgc tttttaaggc ttctagagga gaaagaactg tttattctgt ttgttgggaa 420 ggaggaggaa gacttaatac tagagttctt tga 453 <210> 42 <211> 453 <212> DNA <213> Artificial Sequence <220> <223> Ad5 E4orf6 optimized for Solanum tuberosum <400> 42 atgactactt ctggagttcc ttttggaatg actcttagac ctactagatc tagactttct 60 agaagaactc cttattctag agatagactt cctccttttg aaactgaaac tagagctact 120 attcttgaag atcatcctct tcttcctgaa tgtaatactc ttactatgca taatgcttgg 180 acttctcctt ctcctcctgt taagcaacct caagttggac aacaacctgt tgctcaacaa 240 cttgattctg atatgaatct ttctgaactt cctggagaat ttattaatat tactgatgaa 300 agacttgcta gacaagaaac tgtttggaat attactccta agaatatgtc tgttactcat 360 gatatgatgc tttttaaggc ttctagagga gaaagaactg tttattctgt ttgttgggaa 420 ggaggaggaa gacttaatac tagagttctt taa 453 <210> 43 <211> 453 <212> DNA <213> Artificial Sequence <220> <223> Ad5 E4orf6 optimized for Cannabis sativa <400> 43 atgactactt caggagttcc ttttggaatg actttgagac ctactagatc aagattgtca 60 agaagaactc cttattcaag agatagattg cctccttttg aaactgaaac tagagctact 120 attttggaag atcatccttt gttgcctgaa tgcaatactt tgactatgca taatgcttgg 180 acttcacctt cacctcctgt taaacaacct caagttggac aacaacctgt tgctcaacaa 240 ttggattcag atatgaattt gtcagaattg cctggagaat ttattaatat tactgatgaa 300 agattggcta gacaagaaac tgtttggaat attactccta aaaatatgtc agttactcat 360 gatatgatgt tgtttaaagc ttcaagagga gaaagaactg tttattcagt ttgctgggaa 420 ggaggaggaa gattgaatac tagagttttg taa 453 <210> 44 <211> 453 <212> DNA <213> Artificial Sequence <220> <223> Ad5 E4orf6 optimized for Fagopyrum esculentum <400> 44 atgaccacct ccggagttcc tttcggaatg accctcaggc ctaccaggtc caggctctcc 60 aggaggaccc cttactccag ggacaggctc cctcctttcg agaccgagac cagggccacc 120 atcctcgagg accatcctct cctccctgag tgcaacaccc tcaccatgca taacgcctgg 180 acctcccctt cccctcctgt taagcagcct caggttggac agcagcctgt tgcccagcag 240 ctcgactccg acatgaacct ctccgagctc cctggagagt tcatcaacat caccgacgag 300 aggctcgcca ggcaggagac cgtttggaac atcaccccta agaacatgtc cgttacccat 360 gacatgatgc tcttcaaggc ctccagggga gagaggaccg tttactccgt ttgctgggag 420 ggaggaggaa ggctcaacac cagggttctc taa 453 <210> 45 <211> 453 <212> DNA <213> Artificial Sequence <220> <223> Ad5 E4orf6 optimized for Oryza sativa <400> 45 atgaccacct ccggcgtgcc gttcggcatg accctcaggc cgaccaggtc caggctctcc 60 aggaggaccc cgtactccag ggacaggctc ccgccgttcg agaccgagac cagggccacc 120 atcctcgagg accacccgct cctcccggag tgcaacaccc tcaccatgca caacgcctgg 180 acctccccgt ccccgccggt gaagcagccg caggtgggcc agcagccggt ggcccagcag 240 ctcgactccg acatgaacct ctccgagctc ccgggcgagt tcatcaacat caccgacgag 300 aggctcgcca ggcaggagac cgtgtggaac atcaccccga agaacatgtc cgtgacccac 360 gacatgatgc tcttcaaggc ctccaggggc gagaggaccg tgtactccgt gtgctgggag 420 ggcggcggca ggctcaacac cagggtgctc tga 453 <210> 46 <211> 453 <212> DNA <213> Artificial Sequence <220> <223> Ad5 E4orf6 optimized for Zea mays <400> 46 atgaccacca gcggcgtgcc gttcggcatg accctgaggc cgaccaggag caggctgagc 60 aggaggaccc cgtacagcag ggacaggctg ccgccgttcg agaccgagac cagggccacc 120 atcctggagg accacccgct gctgccggag tgcaacaccc tgaccatgca caacgcctgg 180 accagcccga gcccgccggt gaagcagccg caggtgggcc agcagccggt ggcccagcag 240 ctggacagcg acatgaacct gagcgagctg ccgggcgagt tcatcaacat caccgacgag 300 aggctggcca ggcaggagac cgtgtggaac atcaccccga agaacatgag cgtgacccac 360 gacatgatgc tgttcaaggc cagcaggggc gagaggaccg tgtacagcgt gtgctgggag 420 ggcggcggca ggctgaacac cagggtgctg tga 453 <210> 47 <211> 453 <212> DNA <213> Artificial Sequence <220> <223> Ad5 E4orf6 optimized for Solanum lycopersicoides <400> 47 atgacaacat caggagttcc atttggaatg acacttagac caacaagatc aagactttca 60 agaagaacac catactcaag agatagactt ccaccatttg agacagagac aagagcaaca 120 attcttgagg atcatccact tcttccagag tgtaatacac ttacaatgca taatgcatgg 180 acatcaccat caccaccagt taagcaacca caagttggac aacaaccagt tgcacaacaa 240 cttgattcag atatgaatct ttcagagctt ccaggagagt ttattaatat tacagatgag 300 agacttgcaa gacaagagac agtttggaat attacaccaa agaatatgtc agttacacat 360 gatatgatgc tttttaaggc atcaagagga gagagaacag tttactcagt ttgttgggag 420 ggaggaggaa gacttaatac aagagttctt tga 453 <210> 48 <211> 453 <212> DNA <213> Artificial Sequence <220> <223> Ad5 E4orf6 optimized for Solanum lycopersicum <400> 48 atgactactt ctggagttcc ttttggaatg actcttagac ctactagatc tagactttct 60 agaagaactc cttattctag agatagactt cctccttttg aaactgaaac tagagctact 120 attcttgaag atcatcctct tcttcctgaa tgtaatactc ttactatgca taatgcttgg 180 acttctcctt ctcctcctgt taagcaacct caagttggac aacaacctgt tgctcaacaa 240 cttgattctg atatgaatct ttctgaactt cctggagaat ttattaatat tactgatgaa 300 agacttgcta gacaagaaac tgtttggaat attactccta agaatatgtc tgttactcat 360 gatatgatgc tttttaaggc ttctagagga gaaagaactg tttattctgt ttgttgggaa 420 ggaggaggaa gacttaatac tagagttctt taa 453 <210> 49 <211> 453 <212> DNA <213> Artificial Sequence <220> <223> Ad5 E4orf6 optimized for Lactuca sativa <400> 49 atgacaacat ctggagttcc atttggaatg acacttagac caacaagatc tagactttct 60 agaagaacac catattctag agatagactt ccaccatttg aaacagaaac aagagctaca 120 attcttgaag atcatccact tcttccagaa tgtaatacac ttacaatgca taatgcttgg 180 acatctccat ctccaccagt taaacaacca caagttggac aacaaccagt tgctcaacaa 240 cttgattctg atatgaatct ttctgaactt ccaggagaat ttattaatat tacagatgaa 300 agacttgcta gacaagaaac agtttggaat attacaccaa aaaatatgtc tgttacacat 360 gatatgatgc tttttaaagc ttctagagga gaaagaacag tttattctgt ttgttgggaa 420 ggaggaggaa gacttaatac aagagttctt tga 453 <210> 50 <211> 150 <212> PRT <213> adeno-associated virus 2 <400> 50 Met Thr Thr Ser Gly Val Pro Phe Gly Met Thr Leu Arg Pro Thr Arg 1 5 10 15 Ser Arg Leu Ser Arg Arg Thr Pro Tyr Ser Arg Asp Arg Leu Pro Pro 20 25 30 Phe Glu Thr Glu Thr Arg Ala Thr Ile Leu Glu Asp His Pro Leu Leu 35 40 45 Pro Glu Cys Asn Thr Leu Thr Met His Asn Ala Trp Thr Ser Pro Ser 50 55 60 Pro Pro Val Lys Gln Pro Gln Val Gly Gln Gln Pro Val Ala Gln Gln 65 70 75 80 Leu Asp Ser Asp Met Asn Leu Ser Glu Leu Pro Gly Glu Phe Ile Asn 85 90 95 Ile Thr Asp Glu Arg Leu Ala Arg Gln Glu Thr Val Trp Asn Ile Thr 100 105 110 Pro Lys Asn Met Ser Val Thr His Asp Met Met Leu Phe Lys Ala Ser 115 120 125 Arg Gly Glu Arg Thr Val Tyr Ser Val Cys Trp Glu Gly Gly Gly Arg 130 135 140 Leu Asn Thr Arg Val Leu 145 150 <210> 51 <211> 2729 <212> DNA <213> Artificial Sequence <220> <223> AAV reporter construct optimized for Nicotiana benthamiana <400> 51 gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgacctttgg 60 tcgcccggcc tcagtgagcg agcgagcgcg cagagaggga gtggccaact ccatcactag 120 gggttccttg tagttaatga ttaacccgcc atgctactta tctacgtagc catgctctag 180 aggatccggc ctcggcctct gcataaataa aaaaaattag tcagccatga gcttggccca 240 ttgcatacgt tgtatccata tcataatatg tacatttata ttggctcatg tccaacatta 300 ccgccatgtt gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta 360 gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc 420 tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg 480 ccaataggga ctttccattg acgtcaatgg gtggactatt tacggtaaac tgcccacttg 540 gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa 600 tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac 660 atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta catcaatggg 720 cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga cgtcaatggg 780 agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa ctccgcccca 840 ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag agctcgttta 900 gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt ttgacctcca tagaagacac 960 cgggaccgat ccagcctccc ctcgaagctt tcacgagctc ggatcctgag aacttcaggg 1020 tgagtctatg ggacccttga tgttttcttt ccccttcttt tctatggtta agttcatgtc 1080 ataggaaggg gagaagtaac agggtacaca tattgaccaa atcagggtaa ttttgcattt 1140 gtaattttaa aaaatgcttt cttcttttaa tatacttttt tgtttatctt atttctaata 1200 ctttccctaa tctctttctt tcagggcaat aatgatacaa tgtatcatgc ctctttgcac 1260 cattctaaag aataacagtg ataatttctg ggttaaggca atagcaatat ttctgcatat 1320 aaatatttct gcatataaat tgtaactgat gtaagaggtt tcatattgct aatagcagct 1380 acaatccagc taccattctg cttttatttt atggttggga taaggctgga ttattctgag 1440 tccaagctag gcccttttgc taatcatgtt catacctctt atcttcctcc cacagctcct 1500 gggcaacgtg ctggtctgtg tgctggccca tcactttggc aaagcgccac catggtttct 1560 aaaggagaag agctttttac aggtgttgtt ccaattcttg ttgagttgga tggagatgtt 1620 aatggtcata agttttctgt ttcaggagaa ggagagggag atgctactta cggaaagctt 1680 acattgaagt ttatttgtac tacaggaaag cttccagttc cttggccaac tcttgttact 1740 acattgacat atggagttca atgtttttca aggtaccctg atcatatgaa gcaacatgat 1800 ttctttaagt ctgctatgcc agaaggatat gttcaagaga gaactatttt ctttaaggat 1860 gatggtaact acaaaactag ggctgaggtt aagtttgagg gagatacatt ggttaacaga 1920 atcgaactta agggtatcga tttcaaggag gatggaaaca tccttggtca taagttggaa 1980 tacaactaca actcacataa cgtttacatc atggctgata agcaaaagaa tggtattaag 2040 gttaacttca agatcagaca taatattgag gatggttctg ttcaacttgc tgatcattac 2100 caacaaaaca ctcctattgg agatggacct gttcttttgc cagataatca ttacttgtct 2160 acacaatcag ctctttctaa ggatccaaat gagaaaaggg atcatatggt tcttttggag 2220 tttgttactg ctgctggaat cacacttggt atggatgaat tgtataagtc aggtcttaga 2280 tcttactaat aggattttaa acggccctat tctatagtgt cacctaaatg ctagagctcg 2340 ctgatcagcc tcgactgtgc cttctagttg ccagccatct gttgtttgcc cctcccccgt 2400 gccttccttg accctggaag gtgccactcc cactgtcctt tcctaataaa atgaggaaat 2460 tgcatcgcat tgtctgagta ggtgtcattc tattctgggg ggtggggtgg ggcaggacag 2520 caagggggag gattgggaag acaatagctc tagagcatgg ctacgtagat aagtagcatg 2580 gcgggttaat cattaactac aaggaacccc tagtgatgga gttggccact ccctctctgc 2640 gcgctcgctc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc 2700 gggcggcctc agtgagcgag cgagcgcgc 2729 <210> 52 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> ITR forward PCR primer <400> 52 ggaaccccta gtgatggagt t 21 <210> 53 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> ITR reverse PCR primer <400> 53 cggcctcagt gagcga 16 <210> 54 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Plant engineered Kozak for AAV2 REP <400> 54 gggtttatga ctggt 15 <210> 55 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Plant engineered Kozak for AAV2 CAP <400> 55 gggtttatga ctggccgccg gttat 25

Claims

AAV2 REP 단백질을 코딩하는 서열을 포함하며, 여기서 서열은 서열식별번호: 2-11에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 것인 핵산 분자.
제1항에 있어서, 서열이 서열식별번호: 2에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 것인 핵산 분자.
AAV2 CAP 단백질을 코딩하는 서열을 포함하며, 여기서 서열은 서열식별번호: 15-24에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 것인 핵산 분자.
제3항에 있어서, 서열이 서열식별번호: 15에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 것인 핵산 분자.
AAV2 AAP 단백질을 코딩하는 서열을 포함하며, 여기서 서열은 서열식별번호: 28-37에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 것인 핵산 분자.
제5항에 있어서, 서열이 서열식별번호: 28에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 것인 핵산 분자.
Ad5 E4orf6 단백질을 코딩하는 서열을 포함하며, 여기서 서열은 서열식별번호: 40-49에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 것인 핵산 분자.
제7항에 있어서, 서열이 서열식별번호: 40에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 것인 핵산 분자.
제1항 내지 제8항 중 어느 한 항의 핵산 분자를 포함하는 재조합 핵산 벡터.
제1항 내지 제8항 중 어느 한 항의 핵산 또는 제10항의 벡터에 의해 코딩된 단백질.
제1항 내지 제8항 중 어느 한 항의 적어도 하나의 핵산 분자, 제9항의 벡터, 또는 제10항의 단백질을 포함하는 AAV 입자.
제1항 내지 제8항 중 어느 한 항의 적어도 하나의 핵산 분자, 제9항의 재조합 핵산 벡터, 제10항의 단백질, 또는 제11항의 AAV 입자를 포함하는 식물 세포.
제12항의 식물 세포를 포함하는 식물.
제12항 또는 제13항에 있어서, 니코티아나, 아라비돕시스, 솔라눔, 칸나비스, 파고피룸, 오리자 또는 제아 속에 속하는 식물 세포 또는 식물.
제14항에 있어서, 식물이 니코티아나 종인 식물 세포 또는 식물.
제15항에 있어서, 식물이 니코티아나 벤타미아나 또는 니코티아나 타바쿰인 식물 세포 또는 식물.
제12항 내지 제16항 중 어느 한 항의 식물 세포 또는 식물로부터의 잎, 줄기, 꽃 또는 뿌리.
임의로 제9항의 재조합 핵산 벡터를 사용하여, 식물을 적어도 하나의 재조합 핵산 벡터를 포함하는 아그로박테리움 투메파시엔스와 접촉시키며, 여기서 적어도 하나의 재조합 핵산 벡터는 AAV 단백질을 코딩하는 핵산 서열을 포함하고, 핵산 서열은 식물에서의 발현에 대해 코돈 최적화된 것인 단계;
적어도 하나의 재조합 핵산 벡터를 식물의 세포에 전달하는 단계;
식물의 세포에서 AAV 단백질을 발현시키는 단계; 및 임의로
식물의 세포로부터 AAV 단백질을 단리하는 단계
를 포함하는, 식물에서 AAV 단백질을 생산하는 방법.
제18항에 있어서, 복수의 AAV 단백질이 동일한 식물에서 생산되는 것인 방법.
제19항에 있어서, AAV 입자가 상기 식물에서 생산되고, 상기 AAV 입자가 임의로 상기 식물로부터 단리되는 것인 방법.
제20항에 있어서, AAV 입자가 포유동물 세포, 임의로 인간 세포, 임의로 HEK293T를 감염시킬 수 있는 것인 방법.
제18항 내지 제21항 중 어느 한 항에 있어서, 식물이 니코티아나, 아라비돕시스, 솔라눔, 칸나비스, 파고피룸, 오리자, 락투카 또는 제아 속에 속하는 것인 방법.
제22항에 있어서, 식물이 니코티아나 종인 방법.
제23항에 있어서, 식물이 니코티아나 벤타미아나 또는 니코티아나 타바쿰이고, 핵산 서열이 니코티아나 벤타미아나 또는 니코티아나 타바쿰에서의 발현에 대해 코돈 최적화된 것인 방법.
제18항 내지 제24항 중 어느 한 항에 있어서, AAV 단백질을 단리하는 것이 원심분리, 여과 및/또는 크로마토그래피를 포함하는 것인 방법.
제25항에 있어서, 크로마토그래피가 친화성, 이온 교환, 음이온 교환, 크기 배제 또는 소수성 상호작용 크로마토그래피인 방법.
제18항 내지 제26항 중 어느 한 항에 있어서, 적어도 하나의 재조합 핵산 벡터가 서열식별번호: 2-11, 15-24, 28-37, 또는 40-49에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 적어도 하나의 서열을 포함하는 것인 방법.
제18항 내지 제27항 중 어느 한 항에 있어서, 식물이 AAV 단백질의 적어도 10⁷, 10⁸, 10⁹, 10¹⁰, 10¹¹, 10¹², 10¹³, 또는 10¹⁴개 카피를 생산하는 것인 방법.
제28항에 있어서, 식물이 AAV 단백질의 적어도 10¹², 10¹³, 또는 10¹⁴개 카피를 생산하는 것인 방법.
제18항 내지 제29항 중 어느 한 항의 방법에 의해 생산 및 단리된 AAV 입자를 이를 필요로 하는 대상체의 세포에 투여하는 것을 포함하는 유전자 요법 방법.
의약으로 사용하기 위한, 제9항의 재조합 핵산 벡터, 또는 제11항의 AAV 입자, 또는 제20항 또는 제21항의 방법에 의해 생산된 AAV 입자.
인간 질환, 예컨대 대사에서의 선천성 이상, 효소 결핍, 폼페병, 다논병, 신경변성 장애, 파킨슨병, 알츠하이머병, 운동 뉴런 질환, 근육 이영양증, 뒤시엔느 근육 이영양증, 망막 변성 질환, 색소성 망막염, 어셔 증후군, 스타르가르트병, 또는 난청의 유전적 원인을 치료하는 유전자 요법에서 사용하기 위한, 제9항의 재조합 핵산 벡터, 또는 제11항의 AAV 입자, 또는 제20항 또는 제21항의 방법에 의해 생산된 AAV 입자.
AAV 입자의 성분 또는 AAV 입자의 어셈블리에 수반되는 성분을 코딩하는 핵산 서열을 포함하는 적어도 하나의 재조합 핵산 벡터로 식물을 형질전환시키는 단계;
AAV 입자가 식물에서 발현되고 어셈블리되는 조건 하에 식물을 성장시키는 단계; 및
식물로부터 AAV 입자를 단리하는 단계
를 포함하는, 식물에서 기능성 AAV 입자를 생산하는 방법.
제33항에 있어서, 식물을 형질전환시키는 단계가 아그로침윤(agroinfiltration)에 의해 수행되는 것인 방법.
제33항 또는 제34항에 있어서, AAV 입자의 성분을 코딩하는 핵산 서열이 식물에 대해 코돈 최적화된 것인 방법.
제33항 내지 제35항 중 어느 한 항에 있어서, 식물이 니코티아나, 아라비돕시스, 솔라눔, 칸나비스, 파고피룸, 오리자, 락투카 또는 제아 속에 속하는 것인 방법.
제33항 내지 제36항 중 어느 한 항에 있어서, 식물이 니코티아나, 락투카 또는 칸나비스 종인 방법.
제33항 내지 제37항 중 어느 한 항에 있어서, 식물이 니코티아나 벤타미아나, 니코티아나 타바쿰, 락투카 사티바 또는 칸나비스 사티바인 방법.
제33항 내지 제38항 중 어느 한 항에 있어서, AAV 입자의 성분 또는 AAV 입자의 어셈블리에 수반되는 성분이 REP 단백질, CAP 단백질, AAP 단백질, 또는 Ad5 E4orf6 단백질, 또는 그의 임의의 조합을 포함하는 것인 방법.
제39항에 있어서, REP 단백질이 하류 인-프레임 폴리펩티드의 번역을 증진시키는 약한 식물 코작 서열, 및/또는 잠재 ORF의 잠재적 발현을 방지하기 위한 내부 메티오닌 코돈에서의 돌연변이를 포함하는 핵산 서열에 의해 코딩되는 것인 방법.
제39항 또는 제40항에 있어서, REP 단백질이 서열식별번호: 1-11에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열에 의해 코딩되는 것인 방법.
제39항 내지 제41항 중 어느 한 항에 있어서, REP 단백질이 서열식별번호: 12 또는 13에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 펩티드 서열을 포함하는 것인 방법.
제39항 내지 제42항 중 어느 한 항에 있어서, CAP 단백질이 하류 인-프레임 폴리펩티드의 번역을 증진시키는 약한 식물 코작 서열을 포함하는 핵산 서열에 의해 코딩되는 것인 방법.
제39항 내지 제43항 중 어느 한 항에 있어서, CAP 단백질이 서열식별번호: 14-24에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열에 의해 코딩되는 것인 방법.
제39항 내지 제44항 중 어느 한 항에 있어서, CAP 단백질이 서열식별번호: 25 또는 26에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 펩티드 서열을 포함하는 것인 방법.
제39항 내지 제45항 중 어느 한 항에 있어서, AAP 단백질이 서열식별번호: 27-37에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열에 의해 코딩되는 것인 방법.
제39항 내지 제46항 중 어느 한 항에 있어서, AAP 단백질이 서열식별번호: 38에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 펩티드 서열을 포함하는 것인 방법.
제39항 내지 제47항 중 어느 한 항에 있어서, Ad5 E4orf6 단백질이 서열식별번호: 39-49에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열에 의해 코딩되는 것인 방법.
제39항 내지 제48항 중 어느 한 항에 있어서, Ad5 E4orf6 단백질이 서열식별번호: 50에 대해 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 펩티드 서열을 포함하는 것인 방법.
제33항 내지 제49항 중 어느 한 항에 있어서, AAV 입자를 단리하는 것이 원심분리, 여과 및/또는 크로마토그래피를 포함하는 것인 방법.
제50항에 있어서, 크로마토그래피가 친화성, 이온 교환, 음이온 교환, 크기 배제 또는 소수성 상호작용 크로마토그래피인 방법.
제33항 내지 제51항 중 어느 한 항에 있어서, 적어도 10⁷, 10⁸, 10⁹, 10¹⁰, 10¹¹, 10¹², 10¹³, 또는 10¹⁴개 AAV 입자가 식물로부터 단리되는 것인 방법.
제33항 내지 제52항 중 어느 한 항에 있어서, 적어도 10¹², 10¹³, 또는 10¹⁴개 AAV 입자가 식물로부터 단리되는 것인 방법.
제33항 내지 제53항 중 어느 한 항에 있어서, AAV 입자가 포유동물 세포, 임의로 인간 세포, 임의로 HEK293T를 감염시킬 수 있는 것인 방법.
제33항 내지 제53항 중 어느 한 항에 있어서, AAV 입자를 포유동물, 예컨대 인간에게 투여하는 것을 추가로 포함하는 방법.
질환의 치료에 사용하기 위한, 제33항 내지 제53항 중 어느 한 항의 방법에 의해 생산된 AAV 입자.
의약의 제조에 사용하기 위한, 제33항 내지 제53항 중 어느 한 항의 방법에 의해 생산된 AAV 입자.