KR20230078625A - 개선된 아데노 연관 바이러스 유전자 치료 벡터 - Google Patents

개선된 아데노 연관 바이러스 유전자 치료 벡터 Download PDF

Info

Publication number
KR20230078625A
KR20230078625A KR1020237002671A KR20237002671A KR20230078625A KR 20230078625 A KR20230078625 A KR 20230078625A KR 1020237002671 A KR1020237002671 A KR 1020237002671A KR 20237002671 A KR20237002671 A KR 20237002671A KR 20230078625 A KR20230078625 A KR 20230078625A
Authority
KR
South Korea
Prior art keywords
maap
genome
adeno
associated virus
polypeptide
Prior art date
Application number
KR1020237002671A
Other languages
English (en)
Inventor
카리 애레인
리타 에릭슨
아미라 히보엔엔
한나 레쉬
저스틴 다리우스 알베르스
리오넬 가리베르트
Original Assignee
페링 벤처스 에스에이
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 페링 벤처스 에스에이 filed Critical 페링 벤처스 에스에이
Publication of KR20230078625A publication Critical patent/KR20230078625A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • C07K14/01DNA viruses
    • C07K14/015Parvoviridae, e.g. feline panleukopenia virus, human parvovirus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14151Methods of production or purification of viral material

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Virology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Immunology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

"MAAP"는 자연발생의, 새로이 발견된 약 13 KDa의 아데노-연관 바이러스 단백질이다. 그것은 알려진 단백질들과 일치하지 않는다. AAV 생산자 세포를 24시간 넘게 배양했을 때, 우리는 전장 MAAP의 번역을 불활성화 시키면 트랜스펙션된 생산자 세포의 생산성이 향상되는 것을 발견했다. 결과로 만들어진 AAV 바이러스는 더 나은 품질이고 더 안정적이다. 우리의 발견은 이와 같이 재조합 아데노-연관 바이러스 유전자 치료 벡터의 산업적 생산을 개선하는 길을 제공한다.

Description

개선된 아데노 연관 바이러스 유전자 치료 벡터
본 특허출원은 2020년 6월 25일에 출원된 미국 특허출원 63/043,837의 우선권을 주장하며, 그것은 여기 참조로서 영입된다.
아데노 연관 바이러스(adeno-associated virus, AAV)는 데펜도-파보 바이러스(dependo-parvovirus)의 하나이다. 바이러스 복제는 감염된 세포가 아데노 바이러스나 헤르페스 바이러스와 같은 도움 바이러스(helper virus)에 공감염되었는지에 달렸다.
AAV는 인간과 다른 영장류에서 매우 만연해 있다. 여러 가지 조직 시료에서 여러 혈청형이 분리되었다.
AAV의 12종 이상의 천연 혈청형과 100종이 넘는 변종이 분리되고, 연구되고, 유전자 전달 벡터로서 응용되어 왔으며, 유전자 전달을 위해 AAV를 개선시키기 위해 끊임없이 새로운 변종이 만들어졌다. 가장 많이 연구된 AAV 혈청형은 인간 세포에서 발견된 혈청형 2, 3, 5, 6, 9 및 12와 비인간 영장류의 세포에서 발견된 혈청형 1, 4, 7, 8, 10 및 11이다. 국제 바이러스 분류 위원회(The International Committee on Taxonomy of Viruses)에서는 이 여러 가지 혈청형들을 크게 두 종으로 분류했다: A 및 B. A 종은 예를 들어 혈청형 -1, -2, -3 및 -4를 아우르는 한편, B 종은 혈청형 -5를 포함한다. 영장류에 더해, AAV는 말, 소, 닭, 뱀, 도마뱀 및 염소와 같은 다른 종에서도 역시 분리되었다.
각 혈청형은 어느 정도 조직 특이성을 가진다. 예를 들어 혈청형 6은 인간의 심장 세포를 감염시키는 데 효과적이고, 한편 혈청형 8은 인간의 간 및 골격근 세포를 감염시키는 데 효과적이다.
혈청형, 그리고 그에 따른 조직 특이성은 캡시드에 의해 결정된다. AAV 캡시드 단백질은 12개의 과-가변 표면구역(hyper-variable surface region)을 갖는다. 대부분의 변이는 3-접힘 근위 피크(three-fold proximal peak)에서 일어난다.
모든 알려진 혈청형의 게놈은 유사한 구성을 공유한다. 혈청형 2(AAV2)를 예를 들면, 4679 염기의 게놈을 갖는다. AAV2 게놈은 양쪽 끝이 145-염기의 T-형 구조인 역 말단 반복서열(Inverted Terminal Repeats, ITRs)로 측부를 이루고 있다. ITR은 게놈 복제, 2차 가닥 합성, 단백질막으로 싸기(encapsidation) 및 인간 게놈으로의 바이러스 게놈 삽입에 필요하다. AAV2에서 게놈 복제는 두 개의 커다란 rep 단백질인 Rep78 및 Rep68로 매개된다. 작은 rep 단백질인 Rep52 및 Rep40은 AAV 게놈의 양 또는 음의 가닥을 미리 만들어진 빈 캡시드에 싸는 데 필요하다.
cap 유전자는 3개의 캡시드 단백질인 VP1, VP2 및 VP3를 발현한다. 그것은 교차로 스플라이싱 하고, 비-ATG 시작 코돈을 사용하며, 리딩 프레임을 겹쳐서 그렇게 한다. 조립 활성화 단백질(Assembly Activating Protein, AAP)은 VP2/3 리딩 프레임에서의 프레임-이동을 통해 발현되는데 VP 단백질이 핵으로 향하도록 한다. 이것은 캡시드 조립에 필요하다.
야생형 AAV 캡시드는 20각형이다. 그것은 60 VP 단백질 분자로 이루어져 있다. 야생형 캡시드는 VP1:VP2:VP3 비율을 1:1:10로 나타낸다. VP3은 그래서 보통 캡시드의 "핵심"을 이룬다.
Hela 세포에 야생형 아데노 바이러스 및 야생형 AAV (wt-AAV)를 공-감염시켜서 연구된 AAV의 세포 내 구획화(intra-cellular compartmentalization)는 핵질에서 DNA 포장이 일어나는 동안 핵소체가 캡시드 조립의 시작에 관여함을 암시한다. 늦은 단계에서, Rep 단백질들이 핵 주변부에 풍부하게 된다. 조립된 AAV 캡시드는 핵, 핵소체, 또는 핵막 주변에 무리를 이뤄 AAP와 공존(co-localizing)하는 것을 관찰할 수 있다.
AAV는 매력적인 잠재 유전자 치료 벡터로 알려져 있다. 완전한 치료적 응용은 그러나 몇 가지 난관을 마주하고 있다. 예를 들어, in vitro로 상업적 생산을 위한 설정을 할 때, 생산되는 바이러스의 양을 늘리기 위해서 적어도 72시간 또는 그 이상 감염된 및/또는 트랜스펙션된 생산자 세포를 배양하는 것이 바람직하다. 그러나 AAV는 생산하는 동안 빠르게 분해될 수 있다. 예를 들어, 번식 잘하는 바이러스를 풍부하게 수확할 수 있게 하기 위해 감염된 생산자 세포를 적어도 72시간 배양하는 것이 바람직한데, 혈청형 2 및 8은 72시간 이내에 분해되고, 따라서 감염 바이러스의 최종 수율이 줄어든다.
감염 후 단지 24시간 지나서 생산자 세포로부터 바이러스를 수확함으로써 이를 극복하는 것이 가능하다. 이것은 완전한 바이러스의 분해를 줄이지만, 바이러스 복제가 미성숙한 상태로 중단되게 되고 또한 생산된 바이러스의 양도 줄어든다.
그러므로, 당업계에 고품질의 안정한 AAV, 특히 유전자 치료를 위한 AAV가 충분한 양으로 생산될 수 있는 방법을 제공할 필요가 여전하다.
본 발명은 아래의 바람직한 실시예를 제공한다. 그러나 본 발명은 이 실시예에 한정되지 않는다.
일 측면에서, 본 발명은 막 연관 부속 단백질(membrane-associated accessory protein, MAAP) mRNA 번역-시작 코돈을 불활성화 시키거나 또는 전장 야생형 MAAP의 번역을 중단하기 위한 적어도 하나의 종결 코돈을 도입하는 돌연변이를 가지는 아데노 연관 바이러스 게놈을 제공한다.
또 다른 측면에서, 본 발명은 전장 야생형 MAAP의 발현을 줄이는 돌연변이를 가지는 아데노 연관 바이러스 게놈을 제공한다.
바람직한 일 실시예에서, VP1의 발현은 유지된다.
추가적인 측면에서, 본 발명은 MAAP mRNA로 전사하는 아데노 연관 바이러스 게놈을 제공하는데, 상기 게놈은 MAAP mRNA가 야생형 MAAP mRNA로부터 변형된 돌연변이를 포함하고, 상기 변형은 다음으로부터 선택되며: MAAP 번역 시작 코돈을 시작 코돈이 아닌 서열로 변경 및 MAAP mRNA에 적어도 하나의 종결 코돈을 생성; 여기서 상기 돌연변이는 상기 게놈에서 VP1이 발현하는 것을 방해하지 않는다.
바람직한 실시예에서, 상기 돌연변이는 MAAP 번역 시작 코돈을 불활성화 및/또는 전장 야생형 MAAP의 번역을 막기 위한 적어도 하나의 종결 코돈을 도입한다.
바람직한 실시예에서, 상기 돌연변이는 MAAP 번역 시작 코돈을 불활성화 시킨다.
바람직한 실시예에서, 상기 돌연변이는 MAAP 폴리펩타이드의 번역을 막기 위한 적어도 하나의 종결 코돈을 MAAP 폴리펩타이드 공통 서열인 서열번호 11의 잔기 번호 9, 33, 39, 47, 65, 90, 100, 103, 105, 106 또는 110과 정렬된 폴리펩타이드 잔기에 도입한다.
바람직한 실시예에서, 상기 돌연변이는 MAAP 폴리펩타이드의 번역을 막기 위한 적어도 하나의 종결 코돈을 MAAP 폴리펩타이드 공통 서열인 서열번호 11의 잔기 번호 9 내지 110으로부터의 폴리 펩타이드 잔기와, 더욱 바람직하게는 39 내지 103으로부터의 폴리펩타이드 잔기와 정렬된 폴리펩타이드 잔기에 도입한다.
바람직한 실시예에서, 상기 돌연변이는 MAAP 폴리펩타이드의 번역을 막기 위한 적어도 하나의 종결 코돈을 MAAP 폴리펩타이드 공통 서열인 서열번호 11의 잔기 번호 9, 33, 39, 47, 65, 90, 100, 103, 105, 106 또는 110과 정렬된 폴리펩타이드 잔기에 도입한다.
바람직한 실시예에서, 상기 돌연변이는 MAAP 폴리펩타이드의 번역을 막기 위한 하나의 종결 코돈을 MAAP 폴리펩타이드 공통 서열인 서열번호 11의 잔기 번호 9, 33, 39 및/또는 47과 정렬된 폴리펩타이드 잔기에 도입한다.
바람직한 실시예에서, 상기 돌연변이는 MAAP 폴리펩타이드의 번역을 막기 위한 적어도 하나의 종결 코돈을 MAAP 폴리펩타이드 공통 서열인 서열번호 11의 잔기 번호 9 또는 잔기번호 33, 39 및 47과 정렬된 폴리펩타이드 잔기에 도입한다.
바람직한 실시예에서, 상기 게놈은 다음으로 구성되는 모둠에서 선택된다: 자연발생 혈청형 및 비자연발생 혈청형.
바람직한 실시예에서, 상기 게놈은 혈청형 1 게놈, 혈청형 2 게놈, 혈청형 5 게놈, 혈청형 6 게놈, 혈청형 8 게놈, 혈청형 9 게놈, 혈청형 10 게놈 및 비자연발생적 혈청형으로부터 선택된다.
바람직한 실시예에서, 상기 게놈은 혈청형 1 게놈, 혈청형 2 게놈, 혈청형 6게놈, 혈청형 7 게놈, 혈청형 8 게놈 및 혈청형 10 게놈으로부터 선택된다.
바람직한 실시예에서, 상기 게놈은 혈청형 1, 2, 5, 6, 8 또는 9 게놈을 포함한다.
바람직한 실시예에서, 상기 게놈은 혈청형 2, 5, 6 또는 8 게놈을 포함한다.
바람직한 실시예에서, 상기 게놈은 혈청형 2 게놈을 포함한다.
바람직한 실시예에서, 상기 게놈은 비-자연발생 혈청형을 포함한다.
바람직한 실시예에서, VP1 펩타이드 서열은 야생형으로부터 바뀌지 않는다.
바람직한 실시예에서 VP1 펩타이드 서열은 보존적 돌연변이와 같은 돌연변이를 포함한다. 전형적으로, VP1 펩타이드는 MAAP 펩타이드 서열이 종결 코돈을 포함하도록 돌연변이되는 해당 위치에서 변형된다.
바람직한 실시예에서, MAAP 및 VP1 펩타이드 서열은 각각 야생형과 적어도 80%의 상동성을 갖는다.
바람직한 실시예에서, MAAP 및 VP1 펩타이드 서열은 각각 야생형과 적어도 90%의 상동성을 갖는다.
또 다른 측면에서, MAAP 공통 폴리펩타이드 서열인 서열번호 11의 임의의 인접하는 33개의 잔기와 적어도 50%의 상동성을 갖는 1차 아미노산 서열을 가지는 폴리펩타이드를 발현하지 않는 아데노 연관 바이러스 게놈, 즉, 적당한 숙주 세포, 즉 AAV 게놈으로 인코딩되는 단백질의 발현을 허용하는 숙주 세포 안에 있을 때 이러한 폴리펩타이드를 발현하지 않는 AAV 게놈을 포함하는 바이러스 입자, 벡터 또는 플라스미드를 제공한다. 바람직한 실시예에서, AAV 게놈은 MAAP 공통 폴리펩타이드 서열인 서열번호 11의 임의의 33개의 인접하는 잔기와 적어도 50%의 동일성(identity)을 갖는 1차 아미노산 서열을 갖는 폴리펩타이드를 발현하지 않는다.
추가적인 측면에서, 본 발명은 아데노 연관 바이러스를 생산하는 생산자 세포를 제공하는데, 상기 생산자 세포는 본 발명의 아데노 연관 바이러스 게놈을 포함한다.
바람직한 실시예에서, 상기 생산자 세포는 진핵세포이다.
바람직한 실시예에서, 상기 생산자 세포는 인간 세포를 포함한다.
바람직한 실시예에서, 상기 생산자 세포는 효모 세포 및 곤충 세포로 구성되는 모둠에서 선택된다.
추가적인 측면에서, 본 발명은 아데노 연관 바이러스를 생산하는 방법을 제공하는데, 상기 방법은: 아데노 연관 바이러스 게놈을 획득하고, 그 다음 상기 게놈을 세포에 도입하여 본 발명의 생산자 세포를 만들며, 그 다음 상기 생산자 세포를 배양하여 상기 생산자 세포가 아데노 연관 바이러스를 생산하게 하고, 그 다음 상기 아데노 연관 바이러스를 수확하는 것을 포함한다.
바람직한 실시예에서, 상기 수확된 아데노 연관 바이러스는 이식 유전자(transgene)를 포함한다.
바람직한 실시예에서, 생산자 세포는 바이러스 제제를 생산하는데, 여기서 관심있는 유전자 또는 게놈을 포함하는 캡시드 수의 총 물리적 캡시드의 수에 대한 비율이 적어도 야생형 아데노 연관 바이러스 게놈을 포함하는 유사한 세포에서 생산되는 총 물리적 캡시드 수에 대한 관심있는 유전자 또는 게놈을 포함하는 캡시드 수의 비율만큼 높다.
바람직한 실시예에서, 본 발명의 생산자 세포는 [속이 찬]:[빈] 바이러스 캡시드의 비율이 적어도 야생형 아데노 연관 바이러스 게놈으로 감염된 유사한 세포가 만드는 만큼 높은 비율을 갖는 바이러스를 생산한다.
바람직한 실시예에서, 생산자 세포는 적어도 야생형 아데노 연관 바이러스 게놈으로 감염된 유사한 세포가 만드는 만큼 많은 mL 당 바이러스 게놈을 가지는 바이러스를 생산한다.
바람직한 실시예에서, 생산자 세포는 야생형 아데노 연관 바이러스 게놈으로 감염된 유사한 세포가 만드는 것의 적어도 네 배 많은 mL 당 바이러스 게놈을 가지는 바이러스를 생산한다.
바람직한 실시예에서, 생산자 세포는 [속이 찬]:[빈] 바이러스 캡시드의 비율이 야생형 아데노 연관 바이러스 게놈으로 감염된 유사한 세포가 만드는 것보다 적어도 30% 높은 비율을 갖는 바이러스를 생산한다.
추가적인 측면에서, 본 발명은 MAAP mRNA 번역 시작 코돈을 불활성화하는 돌연변이를 가지는 아데노 연관 바이러스 게놈을 제공한다.
바람직한 실시예에서, 상기 아데노 연관 바이러스 게놈은 전장 야생형 MAAP의 번역을 막기 위한 적어도 하나의 종결 코돈을 도입하는 적어도 하나의 돌연변이를 더 포함한다.
바람직한 실시예에서, 상기 돌연변이는 MAAP 폴리펩타이드의 번역을 막기 위한 적어도 하나의 종결 코돈을 MAAP 폴리펩타이드 공통 서열인 서열번호 11의 잔기 번호 9, 33, 39, 47, 65, 90, 100, 103, 105, 106 또는 110과 정렬된 폴리펩타이드 잔기에 도입한다.
바람직한 실시예에서, 상기 돌연변이는 MAAP 폴리펩타이드의 번역을 막기 위한 종결 코돈을 MAAP 폴리펩타이드 공통 서열인 서열번호 11의 잔기 번호 33, 39 및 47과 정렬된 폴리펩타이드 잔기에 도입한다.
바람직한 실시예에서, 상기 게놈은 다음으로 구성되는 모둠에서 선택된다: 아데노 연관 바이러스 혈청형 1, 혈청형 2, 혈청형 3, 혈청형 4, 혈청형 5, 혈청형 6, 혈청형 7, 혈청형 8, 혈청형 9, 혈청형 10 및 비-자연발생적 혈청형.
바람직한 실시예에서, 상기 게놈은 혈청형 2 게놈을 포함한다.
바람직한 실시예에서, 상기 게놈은 비-자연발생 혈청형을 포함한다.
추가적인 측면에서, 본 발명은 MAAP 공통 폴리펩타이드 서열인 서열번호 11의 임의의 33개의 인접 잔기와 적어도 50%의 상동성을 갖는 1차 아미노산 서열을 가지는 폴리펩타이드를 발현하지 않는 아데노 연관 바이러스 게놈을 제공한다.
바람직한 실시예에서, 상기 33개의 인접한 잔기는 MAAP 공통 폴리펩타이드 서열인 서열번호 11의 잔기 93 내지 97을 포함한다.
바람직한 실시예에서, 상기 33개의 인접한 잔기는 MAAP 공통 폴리펩타이드 서열인 서열번호 11의 잔기 107 내지 119를 포함한다.
바람직한 실시예에서, 상기 33개의 인접한 잔기는 MAAP 공통 폴리펩타이드 서열인 서열번호 11의 잔기 1 내지 30을 포함한다.
바람직한 실시예에서, 상기 아데노 연관 바이러스 게놈은 MAAP 공통 폴리펩타이드 서열인 서열번호 11의 잔기 1 내지 33에 적어도 60%의 상동성을 갖는 임의의 서열을 갖지 않는다.
바람직한 실시예에서, 상기 아데노 연관 바이러스 게놈은 MAAP 공통 폴리펩타이드 서열인 서열번호 11의 잔기 1 내지 39 또는 잔기 1 내지 47에 적어도 60%의 상동성을 갖는 임의의 서열을 갖지 않는다.
바람직한 실시예에서, 상기 아데노 연관 바이러스 게놈은 MAAP 공통 폴리펩타이드 서열인 서열번호 11의 임의의 30개의 인접 잔기와 적어도 60%의 상동성을 갖는 임의의 서열을 갖지 않는다.
바람직한 실시예에서, 상기 아데노 연관 바이러스 게놈은 MAAP 공통 폴리펩타이드 서열인 서열번호 11의 임의의 30개의 인접 잔기와 적어도 70%의 상동성을 갖는 임의의 서열을 갖지 않는다.
바람직한 실시예에서, 상기 아데노 연관 바이러스 게놈은 MAAP 공통 폴리펩타이드 서열인 서열번호 11의 임의의 30개의 인접하는 잔기와 적어도 80%의 상동성을 갖는 임의의 서열을 갖지 않는다.
추가적인 측면에서, 본 발명은 MAAP 공통 폴리펩타이드 서열인 서열번호 11의 임의의 15개의 인접하는 잔기와 적어도 95%의 상동성을 갖는 1차 아미노산 서열을 가지는 폴리펩타이드를 발현하지 않는 아데노 연관 바이러스 게놈을 제공한다.
바람직한 실시예에서, 상기 게놈은 MAAP 공통 폴리펩타이드 서열인 서열번호 11의 임의의 17개, 바람직하게는 19개, 바람직하게는 21개의 인접하는 잔기와 적어도 90%의 상동성을 갖는 1차 아미노산 서열을 가지는 폴리펩타이드를 발현하지 않는다.
추가적인 측면에서, 본 발명은 MAAP 공통 폴리펩타이드 서열인 서열번호 11의 잔기 94 내지 120의 임의의 10개의 인접 잔기에 적어도 50%의 상동성을 갖는 1차 아미노산 서열을 가지는 폴리펩타이드를 발현하지 않는 아데노 연관 바이러스 게놈을 제공한다.
추가적인 측면에서, 본 발명은 아데노 연관 바이러스를 생산하는 방법을 제공하는데, 상기 방법에서 세포에 본 발명의 아데노 연관 바이러스 게놈을 도입하여 생산자 세포를 만들고, 그 다음 상기 생산자 세포를 배양하여 아데노 연관 바이러스를 만들며, 그 다음 상기 아데노 연관 바이러스를 수확한다.
추가적인 측면에서, 본 발명은 아데노 연관 바이러스를 생산하는 방법을 제공하는데, 상기 방법은 다음을 포함한다: 생산자 세포를 만들기 위해 본 발명의 아데노 연관 바이러스 게놈을 세포에 삽입; 그 다음 아데노 연관 바이러스를 만들기 위해 상기 생산자 세포를 배양; 및 그 다음 상기 아데노 연관 바이러스를 수확.
추가적인 측면에서, 본 발명은 아데노 연관 바이러스를 생산하는 생산자 세포를 제공하는데, 상기 생산자 세포는 MAAP 공통 폴리펩타이드 서열인 서열번호 11의 임의의 30개의 인접하는 잔기에 적어도 50%의 상동성을 갖는 1차 아미노산 서열을 가지는 폴리펩타이드를 실질적으로 포함하지 않는다.
추가적인 측면에서, 본 발명은 아데노 연관 바이러스를 생산하는 생산자 세포를 제공하는데, 상기 생산자 세포는 MAAP 공통 폴리펩타이드 서열인 서열번호 11의 임의의 15개의 인접하는 잔기에 적어도 95%의 상동성을 갖는 폴리펩타이드를 실질적으로 포함하지 않는다.
추가적인 측면에서, 본 발명은 아데노 연관 바이러스를 생산하는 생산자 세포를 제공하는데, 상기 생산자 세포는 MAAP 공통 폴리펩타이드 서열인 서열번호 11의 잔기 번호 94 내지 120의 임의의 인접하는 10개의 잔기에 적어도 50%의 상동성을 갖는 폴리펩타이드를 실질적으로 포함하지 않는다.
추가적인 측면에서, 본 발명은 아데노 연관 바이러스 게놈을 포함하는 생산자 세포를 제공하는데, 상기 생산자 세포는 아데노 연관 바이러스를 발현할 수 있고, 상기 생산자 세포는 전장 기능성 MAAP가 실질적으로 없다.
바람직한 실시예에서, 상기 생산자 세포는 진핵세포이다.
바람직한 실시예에서, 상기 생산자 세포는 인간 세포를 포함한다.
바람직한 실시예에서, 상기 생산자 세포는 효모 세포 및 곤충 세포로 구성되는 모둠으로부터 선택된다.
바람직한 실시예에서, 상기 아데노 연관 바이러스 게놈은 전장 야생형 기능성 MAAP의 발현에 간섭하는 돌연변이를 가진다.
바람직한 실시예에서, 상기 생산자 세포는 항체나 아피바디(affibody)와 같은, MAAP를 향하고 MAAP에 결합하여 MAAP의 기능에 손상을 입히는 단백질을 포함한다.
추가적인 측면에서 본 발명은 아데노 연관 바이러스 게놈을 포함하는 생산자 세포를 제공하는데, 상기 생산자 세포는 아데노 연관 바이러스를 발현할 수 있고, 상기 생산자 세포는 전장 기능성 MAAP가 실질적으로 없다. 바람직한 실시예에서, 상기 아데노 연관 바이러스 게놈은 전장 야생형 MAAP의 발현에 간섭하는 돌연변이를 가진다. 바람직한 실시예에서, 상기 생산자 세포는 전장 야생형 기능성 MAAP의 발현에 간섭하는 간섭 RNA를 포함한다. 바람직한 실시예에서, MAAP를 지향하고 MAAP에 결합하여 MAAP의 기능을 손상시키는 단클론 항체를 포함한다.
추가적인 측면에서, 본 발명은 아데노 연관 바이러스를 생산하는 방법을 제공하는데, 상기 방법은 아데노 연관 바이러스를 생산하는 본 발명의 생산자 세포를 배양하고, 그 다음 상기 아데노 연관 바이러스를 수확하는 것을 포함한다.
추가적인 측면에서, 본 발명은 본 발명의 방법에 따라 생산된 아데노 연관 바이러스를 제공한다.
추가적인 측면에서, 본 발명은 아데노 연관 바이러스(AAV)의 안정성을 증가시키고, 캡시드 온전성(integrity)을 향상시키거나, 또는 캡시드의 분해를 줄이는 방법을 제공하는데, 상기 방법은 AAV 안에 본 발명의 아데노 연관 바이러스 게놈을 넣는 것을 포함한다.
추가적인 측면에서, 본 발명은 관심 있는 유전자 또는 게놈을 포함하는 AAV 캡시드의 비율을 증가시키는 방법을 제공하는데, 상기 방법은 AAV 안에 본 발명의 아데노 연관 바이러스 게놈 및 관심 있는 유전자 또는 게놈을 넣는 것을 포함한다.
추가적인 측면에서, 본 발명은 AAV를 생산하는 생산자 세포의 바이러스 역가(바이러스 게놈 / mL)를 증가시키는 방법을 제공하는데, 상기 방법은 AAV 안에 본 발명의 아데노 연관 바이러스 게놈을 넣고, 상기 AAV를 생산자 세포에 도입하는 것을 포함한다.
바람직한 실시예에서, 상기 생산자 세포는 적어도 30시간 배양한다. 바람직한 실시예에서, 상기 생산자 세포는 적어도 36 시간, 48 시간, 72 시간 또는 96 시간 배양한다.
추가적인 측면에서, 본 발명은 AAV를 생산하는 생산자 세포 내에서 바이러스 게놈 또는 바이러스 입자의 보유력을 증가시키는 방법을 제공하는데, 상기 방법은 청구항 1-47 중 어느 한 항에 따른 아데노 연관 바이러스 게놈을 AAV에 포함시키고, 상기 AAV를 생산자 세포에 도입시키는 것을 포함한다.
바람직한 실시예에서, 상기 방법은 생산자 세포로부터, 바람직하게는 실질적으로 배지를 포함하지 않고 세포로부터, 바이러스 게놈 또는 바이러스 입자를 수확 및/또는 정제하는 것을 더 포함한다.
상세한 설명
유전자 치료 처치를 위한 재조합 아데노 연관 바이러스(rAAV)의 성공에도 불구하고, 그것의 활용가능성은 대량 생산에서의 한계 때문에 제한된다. 최근 확인된 ORF 인코딩 막-연관 부속 단백질(membrane-associated accessory protein, MAAP) 변형체는, VP1/2 고유 도메인과 동일한 게놈 구역에 있는 cap 유전자에 의해 인코딩되는데, 대부분의 AAV 혈청형에 대한 생산성의 한계를 극복하는 데 도움을 줄 수 있을 것이다. 본 명세서에서 몇몇 C-말단 절단 MAAP 변형체가 VP 아미노산 서열에 영향 없이 야생형 AAV2의 생산성을 개선시키는 것과 캡시드 분해를 줄이는 것을 보여준다. 또한, 두 개의 구조적으로 다른 MAAP 변형체의 예를 쥐의 분비 알칼라인 포스파타제(murine Secreted Alkaline Phosphatase, mSeAP) 유전자를 인코딩하는 rAAV 혈청형 1, 2, 5, 6, 8 및 9를 생산하기 위해 썼다. 실시예 2에서 보여지다시피, 상기 MAAP 변형체들은 통상 rAAV 생산 수율을 높이고 rAAV 게놈을 포함하는 캡시드의 퍼센티지를 높인다. 세포 또는 배지 내의 벡터의 존재는 몇몇 AAV 혈청형에 대해 변형했다. 몇몇 AAV 혈청형의 cap 유전자 서열을 기초로 하여 MAAP 계통수를 구축했는데, 그것이 MAAP의 주된 계통 분기(clade)와의 특정 생물학적 특성을 연결시켜준다. 이 계통 도구는 특정 MAAP 변형체를 사용했을 때 그것들의 특정 캡시드 변형체에 대한 잠재적인 생산성 획득과 세포 내 및 배지 내에서의 벡터 분포를 추산하게 해주면서, 또한 AAV 혈청형을 넘나드는 이런 특성들의 많은 부분이 일관됨(consistency)을 합리적으로 예측한다.
우리는 우연히 생산성을 높이면서 또 한편으로 더 나은 품질의 벡터를 만들 수 있는 방법을 찾았다. 우리의 새로운 접근법을 이용해서, 감염 72시간 후에 바이러스 생산을 300-400%까지 늘릴 수 있다. 결과로 나온 바이러스는 더 안정적이고, 감염 후 72시간 이상 되었을 때 캡시드 분해가 덜 보인다. 결과로 나온 바이러스는 유전자 치료 벡터로 설계된다면(즉, 그것이 재조합이며 "이식 유전자" 또는 치료용 외래 유전자를 포함한다면), 역시 72시간 내에 향상된 게놈 포장을 나타낼 것이다. 또한, 결과로 만들어지는 유전자 치료 벡터는 개선된 형질 도입 효율(표적 세포에서의 치료용 이식 유전자의 발현)이 있을 것으로 기대된다.
우리의 발견은 산업적으로 중요한데, 우리는 사실상 좀 더 학문적이고 이론적인 연구를 하면서 그것을 이뤄냈다. AAV의 비리온 특성 확인 및 전체 게놈 분석을 하면서, 우리는 비-정규적인 시작 코돈에 의해 인코딩된 새로운 단백질을 확인했고 그 다음 그 단백질이 사실 야생형 AAV에서 발현된다는 것을 밝혀냈다. 우리는 새로운 단백질을 "DS"라 이름 지었다. 우리가 연구를 진행하는 동안 같은 단백질을 Ogden et. al. (2019)이 보고했고, 그들은 그것을 막 연관 부속 단백질(membrane-associated accessory protein, MAAP)이라 이름 붙였다. 일관성을 위해 우리도 여기서 DS 대신 MAAP라는 이름을 사용한다.
우리는 이 비-정규적인 시작 코돈의 돌연변이가 이 새로운 단백질의 불활성화를 가져온다는 것을 발견했다. 우리는 유사하게 동반하는 ORF의 N-말단에 여러 종결 코돈을 도입하는 것 또한 이 단백질의 불활성화를 가져온다는 것을 발견했다.
우리는 그 다음 이 새로운 단백질을 불활성화 시키기 위해 종결 코돈을 포함시키는 변형을 한 AAV를 야생형 AAV와 비교했다. 우리는 감염 24시간 후에 wt-AAV가 이 새로운 단백질을 불활성화 시키기 위해 종결 코돈을 포함하도록 변형된 바이러스가 생산하는 것보다 더 높은 역가의 바이러스를 생산하는 것을 발견했다. 이것은 아마도 놀랍지는 않은데, 왜냐하면 그것은 야생형 유전자가 그 유전자의 작업 사본(working copy)이 없는 돌연변이체에 비해 일종의 선택적 이점을 줄 것이라는 것을 의미하기 때문이다.
놀랍게도, 그러나, 우리는 감염된 세포를 72시간까지 더 긴 시간 동안 배양했을 때, 우리의 돌연변이 누락 바이러스가 wt-AAV2가 생산하는 것에 비해 더 높은 바이러스 게놈(vg) 역가를 생산하는 것을 발견했다. 이것은 놀라운데 왜냐하면 그것은 야생형 유전자가 그 유전자의 작업 사본이 없는 돌연변이체에 비해 해로운 선택적 단점을 갖는다는 것을 의미하기 때문이다.
또한, 우리는 놀랍게도 우리의 돌연변이 (누락) 바이러스가 더 막강한 캡시드 온전성 또는 내구성을 보이고, 시간 경과에 따른 캡시드 분해도 줄어드는 것을 발견했다. 반대로, wt-AAV는 면역블로팅에서 보이는 특정 단백질 분해 단편을 나타냈다.
또한, 우리는 우리의 돌연변이 (누락) 바이러스가 결과로 만들어진 캡시드 내의 VP1 및 VP2의 상대 농도가 증가함을 보이는 것을 발견했다.
추가로, 우리는 우리의 돌연변이 (누락) 바이러스가 야생형 AAV보다 더 감염력이 있을 것으로 기대한다. 이론에 얽매이려는 의도 없이, 우리는 그 돌연변이 바이러스가 더 높은 캡시드 온전성 덕에, 특히 VP1 단백질 덕에 더 감염력을 가질 것이라고 가정했다. VP1 고유 도메인은 포스포리파아제 A2 도메인, "PLA2"를 인코딩한다. 이 포스포리파아제는 감염되는 동안 AAV 엔도솜 탈출(AAV endosomal escape)에 필수이다.
유사하게, 우리는 우리의 돌연변이 (누락) 바이러스가, 이식 유전자를 포함하도록 조작되었을 때 향상된 이식 유전자 발현을 할 것으로 기대한다. 이론에 얽매이려는 의도 없이, 우리는 이렇게 이식 유전자 발현이 향상되는 것은 VP1가 이식 유전자가 발현되도록 감염된 세포의 핵으로 운반하기 때문이고, 우리의 돌연변이 (누락) 바이러스가 더 높은 VP1의 상대 농도를 갖기 때문이라고 가정한다.
우리는 이론에 붙잡히고 싶지 않은데, MAAP C-말단은 MAAP의 세포 내 자리잡기에 연관될 수 있는 세 개의 염기-아미노산-풍부(basic-amino-acid-rich, BR) 클러스터, KKIR (MAAP2BR1), RRKR (MAAP2BR2) 및 RNLLRRLREKRGR (MAAP2BR3)를 포함한다. 실제로, 유사한 BR 클러스터가 AAP에 대해 핵 내 자리잡기 신호(nuclear localisation signal, NLS)로서 작용한다고 보인다. MAAPBR3를 거의 완전하게 제거해도 핵 내 자리잡기 장애의 증거를 보이지 않는데, rMAAP2BR1 및 MAAP2BR2 도메인이 여전히 막 연결을 가능하게 할 수 있어서 그렇게 유지된다. MAAP C-말단 마지막 10개의 아미노산만 없으면 VP와 캡시드 농도를 강화시키고 캡시드 분해를 줄였고, 한편 전체 MAAP2BR3를 완전히 제거하면 AAV2 캡시드의 분해를 막았다. 프로테아좀 억제는 AAV가 감염되는 동안 중요한 역할을 하고, 프로테아제 억제제를 추가하면 캡시드 항원 제시를 막고, 또한 바이러스 형질 도입을 향상시킬 수 있다. 또한, AAV 캡시드가 산성 조건에서 자가 절단될 수 있는 것으로 보이고, wt-AAV 생산 동안 AAV 캡시드가 프로테아좀-연관 후-번역 변형(post-translational modifications, PTMs)되는데, 유비퀴틴화(ubiquitination)를 포함한다. 이런 PTM은 잠재적으로 숙주 세포 방어를 시작하는, 또는 유비퀴틴화를 통해 새로운 캡시드를 하향 조절하는, 그리고 이어서 프로테아좀 분해의 신호로서 쓰일 수 있다. 세포 분해 과정에의 MAAP의 영향의 가능성에 더해, 캡시드가 분해 과정이 일어나는 아세포(subcellular) 자리로 들어가는 것을 막음으로써 MAAP의 AAV 안정화 효과도 얻을 수 있다. 그러나, 우리는 24 hpt 내 핵으로부터의 캡시드 탈출에 미치는 MAAP의 영향을 관찰하지는 못했다. 따라서, 특정 실시예에서, 본 발명의 MAAP 펩타이드는 BR 클러스터의 하나 이상을 부분적으로 또는 완전히, 특히 MAAP2BR3를 배제한다.
우리는 이와 같이 이 새로운 야생형 단백질의 발현을 불활성화시킴으로써 AAV 벡터의 산업적 생산을 증가시키는 놀라운 방법을 발견했다. 우리는 또한 이 야생형 단백질의 발현을 불활성화 시킴으로써 AAV 바이러스의 유효기간 안정성을 증가시키는 놀라운 방법을 발견했다. 우리의 발견은 산업적으로 가치가 있는데, 왜냐하면 AAV가 유전자 치료 벡터로서 치료용으로 쓰일 수 있기 때문이다. 그러므로, 우리의 발견은 기존에 가능했던 것보다 더 많은 양으로 더 큰 안정성을 가지는 AAV 유전자 치료 벡터(예: 비-상보적 또는 자기-상보적 AAV, 조작된 ITR을 가지는 AAV 등)를 만드는 길을 제공한다.
상기 야생형 단백질의 발현을 불활성화함으로써, 감염 72시간 후 바이러스 생산을 300-400%까지 늘릴 수 있다. 결과로 만들어진 바이러스는 더 안정적이고, 감염 후 72시간 이상 지났을 때 캡시드 분해를 덜 보인다. 결과로 만들어진 바이러스는 속이 찬 캡시드의 퍼센티지가 야생형만큼 높고, 심지어 아마도 야생형에 비해 속이 찬 캡시드의 퍼센티지가 더 높을 것이다. 또한, 우리는 결과적인 유전자 치료 벡터가 향상된 유전자 전달 효율(표적 세포에서 치료용 이식 유전자의 발현)을 가져올 것이라고 기대한다.
여기 쓰인 "포함하다" 및 그것의 활용형은 뒤에 이어지는 단어의 품목이 포함되지만 특별히 언급되지 않은 품목을 배제하지는 않음을 의미하는 비제한적인 의미로 쓰인다. 또한, "구성된다"는 동사는 여기 설명되는 화합물 또는 부속 화합물(adjunct compound)이 특별하게 정의된 것 외에 부가적인 구성요소(들)를 포함할 수 있음을 의미하는 "기본적으로 ~로 구성된다"로 대체될 수 있으며, 상기 부가적인 구성요소(들)은 본 발명의 고유의 특성을 변화시키지 않는다.
여기 쓰인 단수형의 단어는 단수형으로 가리키는 문법적 목적물의 하나 또는 그 이상을(즉, 적어도 하나) 지칭한다. 예를 들어, "구성요소"는 하나의 구성요소 또는 하나 이상의 구성요소를 의미한다. 예컨대, "종결 코돈"을 요구하는 청구항은 하나의 종결 코돈 및 여러 종결 코돈으로 읽힌다.
여기에서 숫자값과 함께 쓰이는 "약" 또는 "대략"이라는 단어는 (약 10, 대략 10) 바람직하게는 그 값이 주어진 값 10에서 10% 많거나 적은 값일 수 있음을 의미한다.
여기 특정값 및 기준값과 연관하여 쓰이는 용어 "필적하는"은 특정값이 기준값과 동일하거나, 또는 기준값으로부터의 편차(높든 또는 낮든)가 최대 10%까지임을 의미한다.
여기 쓰인 "막 연관 부속 단백질" 또는 "MAAP"는 임의의 AAV 혈청형의 AAV MAAP 단백질을 지칭한다. 여기 쓰인 "야생형 MAAP"는 자연발생적인 AAV MAAP를 가리킨다. 서열목록 1-10(도 20도 참조)은 각각 AAV 혈청형 1-10의 전장 야생형 MAAP의 아미노산 서열을 제공한다. 이 혈청형들 각각에 대한 아미노산 서열은 C-말단에서 고-보존성이다. N-말단에서, AAV 혈청형 4 (서열목록 4) 및 혈청형 5 (서열목록 5) 야생형 단백질은 다른 혈청형에서는 보이지 않는 선도(leading) 15-25 아미노산 잔기 서열을 갖는다. 서열목록 11에는 이 10개 혈청형 모두의 이론적인 공통 1차 아미노산 서열을 나타냈다. 바람직한 실시예에서 "야생형 MAAP"는 서열목록 1 내지 11 중 어느 하나로부터 선택된 서열이다. 여기 쓰인 "야생형 VP-1"은 자연 발생적인 AAV VP1를 가리킨다.
아미노산 서열 또는 핵산 서열의 동일성 퍼센티지, 또는 "% 서열 일치(또는 동일성)"는 여기서, 최대한의 퍼센트로 동일성을 갖도록 두 개의 서열을 정렬한 후에, 필요하다면 간격도 두어서 정렬한 후에 전장 아미노산 서열 또는 핵산 서열에서 기준 아미노산 서열 또는 핵산 서열의 잔기와 동일한 잔기의 퍼센티지로 정의한다. 아미노산 서열의 퍼센티지 상동성 또는 "~에 % 상동성을 갖는"이라는 용어는 여기서 최대한의 퍼센트로 상동성을 갖도록 서열을 정렬하고, 필요하다면 간격도 두어서 정렬한 후에 특정 서열에서 기준 서열의 아미노산 잔기와 상응하는 아미노산 잔기의 퍼센티지로 정의한다. 이 방법은 보존적 아미노산 치환을 염두에 둔다. 보존적 치환은 한 아미노산을 비슷한 아미노산으로 치환하는 것이다. 아미노산은 여러 특징에서 비슷할 수 있는데, 예를 들어, 크기, 모양, 소수성(hydrophobicity), 친수성, 전하, 등전점, 극성, 방향성 등이다. 바람직하게는 보존적 치환은 하나의 모둠 안의 한 아미노산을 동일한 모둠 안의 다른 아미노산과 바꾸는 것인데, 여기서 상기 모둠은 다음과 같다: (1) 알라닌, 발린, 류신, 이소류신, 메티오닌 및 페닐알라닌; (2) 히스티딘, 아르기닌, 리신, 글루타민 및 아스파라긴; (3) 아스파르트산 및 글루탐산; (4) 세린, 트레오닌, 알라닌, 타이로신, 페닐알라닌, 트립토판 및 시스테인; 및 (5) 글리신, 프롤린 및 알라닌. 정렬을 위한 방법 및 컴퓨터 프로그램은 당업계에 잘 알려져 있으며, 예컨대 "얼라인 2(Align 2)"가 있다. 뉴클레오타이드 서열 동일성을 측정하기 위한 프로그램도 당업계에 잘 알려져 있고, 예를 들어, BESTFIT, FASTA 및 GAP 프로그램이 있다. 이 프로그램들은 제조사가 권장하는 기본 변수를 사용하여 바로 사용가능하다.
예를 들어 청구항에서 돌연변이된 MAAP를 언급한다면, 청구된 돌연변이체는 야생형 폴리펩타이드와 동일한 길이를 가질 필요는 없지만 다른 것, 즉 비-MAAP AAV 폴리펩타이드와 구분될만큼 충분히 길어야 한다. 예를 들어, 혈청형 5 MAAP는 145 아미노산 잔기 길이를 갖는다. "돌연변이된" 혈청형 5 MAAP를 요구하는 청구항은 다른, 비-MAAP 단백질과 구분될만큼 충분하게 혈청형 5 MAAP와 상동성을 갖는 한, 145 아미노산 잔기 길이보다 크거나 작은 폴리펩타이드로 읽힌다. 반면, 상기 청구항은 MAAP가 아닌 야생형 AAV 폴리펩타이드와 구분이 되지 않도록 그렇게 짧은 폴리펩타이드로 읽히지는 않는다. 이것은 당업자가 그런 짧은 폴리펩타이드를 "MAAP"라는 청구항 용어의 범위 내라고 여기지 않을 것이기 때문이다.
여기 쓰인 용어 "단백질" 및 "폴리펩타이드"는 펩타이드 결합으로 연결된 아미노산을 포함하는 화합물을 가리키며 서로 호환되게 쓰인다. 유전자에 의해 인코딩되는 단백질 또는 폴리펩타이드는 하나의 유전자에 의해 인코딩되는 아미노산 서열에 한정되는 것이 아니라 그 단백질 또는 폴리펩타이드의 하나 이상의 아미노산의 번역 후 변형을 포함할 수 있다. 단백질 및 폴리펩타이드의 서열은 여기서 달리 표시되지 않는 한 N-말단부터 C-말단으로 쓰인다. 여기서 단백질 또는 폴리펩타이드의 아미노산 서열에 대해 쓰이는 용어 "N-말단의(으로)" 및 "C-말단의(으로)"는 각각 단백질 또는 폴리펩타이드의 "N-말단" 및 "C-말단" 방향으로의 아미노산 서열의 상대적인 위치를 의미한다. "N-말단" 및 "C-말단"은 각각 폴리펩타이드의 양 끝의 아미노 및 카르복시 말단을 가리킨다.
여기서 특정 아미노산 잔기를 언급한다면, 바람직하게는 서열목록 1-11의 MAAP 서열에서의 대응하는 번호의 잔기를 지칭한다. 여기서 서열목록 11의 잔기 또는 MAAP 폴리펩타이드 공통 서열인 서열목록 11의 잔기 번호와 정렬된 잔기를 언급했다면, 상기 잔기는 MAAP 폴리펩타이드 공통 서열인 서열목록 11에서의 지시된 잔기에 대응하는 AAV 혈청형 1 내지 10의 MAAP 아미노산 서열(서열목록 1 내지 10, 도 20에 나타냄) 중 하나의 잔기를 아우른다. 이와 같이, 여기 쓰인 용어 "MAAP 폴리펩타이드 공통 서열인 서열목록 11의 잔기 번호 X와 정렬한 폴리펩타이드 잔기에서의 돌연변이"는 MAAP 폴리펩타이드 공통 서열인 서열목록 11에서의 아미노산 잔기 번호 X에 대응하는 위치에서의 MAAP 폴리펩타이드에서의 돌연변이로 정의된다. 이것은 서열목록 11의 서열에서의 잔기 번호, 또는 임의의 AAV MAAP에서의 대응하는 잔기 번호를 가리킬 수 있고, 특히 서열목록 1-10 중 어느 하나의 서열을 갖는 MAAP 서열에서의 대응하는 잔기 번호를 가리킬 수 있다. 특히, AAV 혈청형 1, 2, 5, 6, 8 및 9의 MAAP에서의 대응하는 잔기, 더욱 구체적으로, AAV 혈청형 1, 2, 5, 6 및 8의 것을 아우른다. 당업자라면 서열목록 11의 특정 잔기에 해당하는 임의의 MAAP에서의 잔기 또는 서열목록 1 내지 10(각각 AAV 1-10의 MAAP 아미노산 서열) 중 어느 하나의 서열을 갖는 MAAP에서의 잔기를, 예를 들어 그 MAAP 서열과 서열목록 11의 서열을 정렬함으로써 쉽게 찾을 수 있다. 예를 들어, 일 실시예에서, 돌연변이를 통해 MAAP 폴리펩타이드 공통 서열인 서열목록 11의 잔기번호 65와 정렬된 폴리펩타이드 잔기에 MAAP 폴리펩타이드의 번역을 중단하기 위한 종결 코돈을 도입한다. 당업자에게 명확한 바와 같이, 이것은 MAAP 폴리펩타이드 공통 서열인 서열목록 11의 아미노산 잔기 번호 65에 해당하는 위치의 MAAP 폴리펩타이드에서의 돌연변이를 가리킨다. 예를 들어, 서열목록 11의 잔기 번호 65는 서열목록 2의 잔기 번호 64에 해당한다.
첫번째 관점에서 MAAP mRNA 번역 시작 코돈을 불활성화 및/또는 전장 야생형 MAAP의 번역을 중단시키기 위한 적어도 하나의 종결코돈을 도입하는 돌연변이를 가지는 아데노-연관 바이러스 게놈을 제공한다. 또한, 전장 야생형 MAAP의 발현을 줄이는 돌연변이를 가지는 아데노-연관 바이러스 게놈을 제공한다. 바람직한 실시예에서, VP1의 발현은 유지된다. 특히, 상기 돌연변이는 VP1의 발현을 유지시킨다.
여기 쓰인 용어 "아데노-연관 바이러스 게놈"은 AAV MAAP를 인코딩하는 적어도 하나의 폴리뉴클레오타이드 서열을 포함하는 폴리뉴클레오타이드 분자를 가리킨다. 바람직한 실시예에서, AAV 게놈 또는 AAV 벡터는 MAAP를 인코딩하는 적어도 하나의 유전자를 포함하고, 구체적으로 막 연관 부속 단백질(MAAP) mRNA 번역-시작 코돈 불활성화 및/또는 전장 야생형 MAAP의 번역을 막기 위한 적어도 하나의 종결 코돈을 도입하는 전장 야생형 MAAP의 발현을 줄이는 돌연변이를 가지는 것이다. AAV 게놈 또는 AAV 벡터는 바람직하게는 하나 이상의 추가적인 AAV 유전자를 인코딩하는 하나 이상의 폴리뉴클레오타이드 서열을 더 포함한다. 구체적으로, MAAP를 인코딩하는 유전자가 아닌 다른 유전자는 야생형이거나 또는 하나 이상의 돌연변이를 포함하는 것일 수 있다. 바람직한 실시예에서, AAV 게놈은 양 말단에서 AAV 역 말단 반복부(Inverted Terminal Repeats, ITRs)가 측부를 이룬 AAV 폴리펩타이드 서열을 포함하는 폴리펩타이드 분자를 포함한다. 바람직한 실시예에서, AAV 게놈은 AAV 발현 벡터에 포함되거나 또는 AAV 발현 벡터이다. AAV 게놈 또는 AAV 발현 벡터는 따라서 바람직하게는, 야생형이든 하나 이상의 돌연변이를 포함하는 것이든, 막 연관 부속 단백질(MAAP) mRNA 번역-시작 코돈 불활성화 및/또는 전장 야생형 MAAP의 번역을 중단시키기 위한 적어도 하나의 종결 코돈을 도입하는, 전장 야생형 MAAP의 발현을 줄이는 돌연변이를 포함하는 한, AAV ITR로 측부를 이루는 적어도 하나의 AAV 폴리펩타이드를 포함한다. 바람직한 실시예에서, 본 발명의 AAV 게놈은 적절한 숙주세포로 도입되었을 때 AAV 생산이 가능하게 하는 AAV 폴리뉴클레오타이드 서열을 포함하는 폴리뉴클레오타이드 분자를 포함한다. 또는, 본 발명의 AAV 게놈은, AAV 캡시드 단백질 및 다른 AAV 도움 기능을 인코딩하는 폴리뉴클레오타이드 서열을 포함하는 AAV 도움 구성체와 같은 AAV 폴리뉴클레오타이드 서열을 포함하는 하나 이상의 추가적인 폴리뉴클레오타이드 분자와 조합되어, 적절한 숙주세포 내로 도입되었을 때 조합된 AAV 게놈 및 하나 이상의 추가적인 폴리뉴클레오타이드 분자가 AAV의 생산을 가능하게 한다.
바람직한 실시예에서, AAV 게놈 또는 AAV 벡터는 AAV 유전자의 모든 폴리뉴클레오타이드 서열을 포함하고, 야생형이든 하나 이상의 돌연변이를 포함하는 것이든, 막 연관 부속 단백질(MAAP) mRNA 번역-시작 코돈 불활성화 또는 전장 야생형 MAAP의 번역을 중단시키기 위한 적어도 하나의 종결 코돈을 도입하는 하나 이상의 돌연변이를 가진다. AAV 게놈 또는 AAV 벡터는 하나 이상의 이종 폴리뉴클레오타이드, 즉, 이식 유전자와 같은, 야생형 AAV 유전자가 아닌 폴리뉴클레오타이드를 더 포함할 수 있다. 이식 유전자는 예컨대 치료용 유전자이다.
AAV 게놈 또는 AAV 벡터는 임의의 AAV 혈청형일 수 있고, 자연발생 혈청형이거나 비-자연발생 혈청형일 수도 있다. MAAP를 인코딩하는 cap 유전자는 각 AAV 혈청형에 대해 잘 알려져 있고, 당업자는 그러므로 임의의 AAV 혈청형 MAAP의 여기 설명된 돌연변이 AAV 게놈을 잘 만들 수 있을 것이다. 여기 설명된 실시예에서, MAAP 돌연변이체는 여러 AAV 혈청형에 대해 제작되었고, 모든 실험한 혈청형에서 여기 기술된 효과들(예: 24시간을 넘게 배양한 후에 높은 바이러스 역가, 캡시드 분해 감소, 높은 캡시드 온전성 및 높은 VP 단백질 온전성)의 적어도 하나가 나타났다. 바람직한 실시예에서, AAV 게놈 또는 AAV 벡터는 혈청형 1 게놈, 혈청형 2 게놈, 혈청형 5 게놈, 혈청형 6 게놈, 혈청형 8 게놈, 혈청형 9 게놈 또는 비-자연발생 혈청형 AAV 게놈 또는 AAV 벡터이다. 바람직한 실시예에서, AAV 게놈 또는 AAV 벡터는 혈청형 1, 2, 5, 6, 8 또는 9 AAV 게놈 또는 AAV 벡터이다. 바람직한 실시예에서, AAV 게놈 또는 AAV 벡터는 혈청형 2, 5, 6 또는 8 AAV 게놈 또는 AAV 벡터이다. 바람직한 실시예에서, 상기 게놈 또는 벡터는 혈청형 2 게놈 또는 벡터이거나 그를 포함한다. 다른 바람직한 실시예에서, 상기 게놈 또는 벡터는 비-자연발생 혈청형 게놈 또는 벡터를 포함한다.
여기 쓰인 "전장 야생형 MAAP의 발현 감소"는 적절한 숙주 세포에서의 본 발명의 AAV 게놈을 포함하는 바이러스 입자, 벡터 또는 플라스미드에 의한 전장 야생형 MAAP의 발현값이, 상기 돌연변이가 없는 것을 제외하고는 본 발명의 AAV 게놈과 같은 AAV 게놈을 포함하는 바이러스 입자, 벡터 또는 플라스미드에 의한 동일한 숙주 세포에서의 전장 야생형 MAAP의 발현값에 비해 줄어드는 것을 의미한다. 바람직한 실시예에서, 전장 야생형 MAAP의 발현은 적어도 약 10%, 바람직하게는 적어도 약 15%, 더욱 바람직하게는 적어도 약 20%, 더욱 바람직하게는 적어도 약 25%, 더욱 바람직하게는 적어도 약 50%, 더욱 바람직하게는 적어도 약 75%, 더욱 바람직하게는 적어도 약 80%, 더욱 바람직하게는 적어도 약 85%, 더욱 바람직하게는 적어도 약 90%, 가장 바람직하게는 적어도 약 95%까지 줄어든다.
전장 야생형 MAAP의 발현을 줄이는 AAV 게놈의 돌연변이는, 바람직하게는 MAAP mRNA가 야생형 MAAP mRNA와 비교했을 때 변형된 돌연변이이다. 그 중에서도, 동일한 AAV 혈청형의 야생형MAAP mRNA과 비교했을 때 변형된 것이다.
바람직한 실시예에서, AAV 게놈에서의 돌연변이는 MAAP를 인코딩하는 유전자에서의 돌연변이이고, 특히 야생형 AAV와 비교했을 때의 돌연변이이다. MAAP를 인코딩하는 유전자는 하나 또는 그 이상의 이러한 돌연변이를 가질 수 있다. 바람직한 일 실시예에서, MAAP를 인코딩하는 유전자는 하나의 돌연변이를 가진다. 다른 바람직한 실시예에서, MAAP를 인코딩하는 유전자는 1 내지 10개의 돌연변이, 바람직하게는 1, 2, 3, 4 또는 5개의 돌연변이와 같은 1 내지 5개의 돌연변이를 가진다. 상기 돌연변이는 지시된 효과를 가지는 아무 유형의 돌연변이라도, 예를 들어 하나 이상의 뉴클레오타이드의 치환, 부가 또는 삭제일 수 있다. 바람직한 실시예에서, 상기 돌연변이는 하나 이상의 뉴클레오타이드의 치환이고, 더욱 바람직하게는 MAAP 아미노산 서열에 하나 이상의 종결 코돈을 도입시키는 결과를 만드는 하나 이상의 뉴클레오타이드의 치환이다.
돌연변이는 예를 들어 부위-지향 돌연변이 유발(site-directed mutagenesis)을 통해 도입될 수 있다. 부위-지향 돌연변이 유발은 당업계에 잘 알려져 있으며, 본 발명에 따른 돌연변이(치환, 삽입 또는 삭제를 포함)를 포함하는 하나 또는 그 이상의 점 돌연변이를 바이러스 폴리뉴클레오타이드 또는 게놈으로 도입하기 위해 쓰일 수 있다. 당업자라면 본 발명에 따른 돌연변이를 잘 도입할 수 있다. 도 21 A-J는 각각 AAV 혈청형 1-10의 cap 유전자, 그 중에서도 MAAP 및 VP1를 인코딩하는 유전자의 핵산 서열을 보여준다. 부위-지향 돌연변이 유발의 적당한 기술은 Sambrook's et al. Molecular Cloning:A Laboratory Manual, second edition (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (1989)), Ausubel et al.Current Protocols in Molecular Biology(Greene Publishing Associates (1992)) 및 Bachman et al. (J. Methods Enzymol. 2013; 529:241-248)에 설명되어 있으며, 그 참고문헌의 내용은 여기에 참고로서 영입된다.
바람직한 실시예에서, 상기 돌연변이는 MAAP mRNA 번역 시작 코돈을 불활성화시키거나, 또는 전장 야생형 MAAP의 번역을 중단시키기 위한 적어도 하나의 종결 코돈을 도입한다. 또한 이와 같이 MAAP mRNA로 전사되는 아데노-연관 바이러스 게놈을 제공하는데, 상기 게놈은 MAAP mRNA가 야생형 MAAP mRNA으로부터 변형된 돌연변이를 가지며, 상기 변형은 다음으로 구성되는 모둠으로부터 선택된다: MAAP 번역 시작 코돈을 시작 코돈이 아닌 서열로 변경, MAAP mRNA에 적어도 하나의 종결 코돈 생성, 및 그것들의 조합. 바람직한 실시예에서 상기 돌연변이는 상기 게놈으로부터의 VP1의 발현을 방해하지 않는다.
바람직한 실시예에서, 상기 돌연변이는 MAAP (mRNA) 번역 시작 코돈을 불활성화, 즉 MAAP 번역 시작 코돈을 시작 코돈이 아닌 서열로 바꾼다. 상기 번역 시작 코돈은 바람직하게는 비-ATG 시작 코돈이고, 더욱 바람직하게는, AAV 혈청형 2의 MAAP에서 류신(AAV 혈청형 2의 전장 단백질 상의 L1)으로 번역되는 MAAP를 인코딩하는 핵산 서열에서의 첫 CTG와 같은 CTG 시작 코돈이다. 예를 들어, CTG 시작 코돈이 CGG로 돌연변이될 수 있고, 잠재적인 시작 코돈으로서 코돈을 불활성화시킬 수 있다. 그러나, 당업자라면 시작 코돈을 불활성화 시키는 다른 돌연변이를 용이하게 도입할 수 있다.
바람직한 실시예에서, 상기 돌연변이는 전장 야생형 MAAP의 번역을 중단시키기 위해 적어도 하나의 종결 코돈을 도입한다. 상기 종결 코돈은 그것을 도입함으로써 전장 야생형 MAAP가 더 이상 번역 및/또는 발현되지 않도록 하게 만드는 아무 위치에나 도입될 수 있다. 여러 개의 종결 코돈이 도입될 수도 있다. 바람직한 실시예에서 1-5개의 종결 코돈이 도입된다. 바람직한 실시예에서 1-3개의 종결 코돈이 도입된다. 바람직한 실시예에서, 상기 돌연변이는 전장 야생형 MAAP의 번역을 중단시키기 위한 적어도 하나의 종결 코돈을 도입하지만 VP1의 발현은 방해하지 않는 돌연변이이고, 바람직하게는 전장 야생형 MAAP의 번역을 막기 위한 적어도 하나의 종결 코돈을 도입하지만 VP1 아미노산 서열에는 돌연변이를 도입하지 않는 돌연변이이다. 바람직한 실시예에서, 상기 돌연변이는 MAAP 폴리펩타이드 공통 서열인 서열목록 11의 잔기 번호 9 내지 110과 정렬한 폴리펩타이드 잔기에, 즉 서열목록 11의 서열에서의 잔기 번호 9 내지 110로부터의 폴리펩타이드 잔기 또는 임의의 MAAP 아미노산 서열에서의 대응하는 잔기 번호에, 그 중에서도 서열목록 1-10 중 어느 하나에서의 대응하는 잔기 번호에 MAAP 폴리펩타이드의 번역을 중단하기 위한 적어도 하나의 종결 코돈을 도입한다. 바람직한 실시예에서, 상기 돌연변이는 MAAP 폴리펩타이드 공통 서열인 서열목록 11의 잔기 번호 9, 33, 39, 47, 65, 90, 100, 103, 105, 106 및/또는 110과 정렬한 폴리펩타이드 잔기에 적어도 하나의 종결 코돈을 도입한다. 바람직한 실시예에서, 상기 돌연변이는 MAAP 폴리펩타이드 공통 서열인 서열목록 11의 잔기 번호 39 내지 103과 정렬한 폴리펩타이드 잔기에 MAAP 폴리펩타이드의 번역을 중단하기 위한 적어도 하나의 종결 코돈을 도입한다. 당업자는 서열목록 11의 공통 서열에서의 표시된 잔기 번호에 기초하여 AAV의 자연발생 또는 비-자연발생 혈청형 중 임의의 것에서의 관련 잔기 번호를 용이하게 확인할 수 있다. 바람직한 실시예에서, 상기 돌연변이는 적어도 하나의 종결 코돈을 MAAP 폴리펩타이드 공통 서열인 서열목록 11의 잔기 번호 9, 33, 39, 47, 65, 90, 100, 103, 105, 106 및/또는 110과 정렬한 폴리펩타이드 잔기에 도입한다. 바람직한 실시예에서, 상기 돌연변이는 MAAP 폴리펩타이드 공통 서열인 서열목록 11의 잔기 번호 9, 33, 39, 및/또는 47과 정렬된 폴리펩타이드 잔기에 적어도 하나의 종결 코돈을 도입한다.
바람직한 실시예에서, 상기 돌연변이는 표 1, 표 2, 표 3에 기재된 돌연변이, 또는 이 돌연변이의 임의의 조합으로부터 선택된다. 표 1, 2 및 3에서 돌연변이 서열은 "돌연변이된 MAAP" 열에 표시했다.
바람직한 실시예에서, VP1의 발현은 방해받지 않는다. 다른 바람직한 실시예에서, VP1의 발현은 유지된다.
여기 쓰인 "VP1의 발현은 유지(된다)" 및 "VP1의 발현은 방해받지 않는다"는 본 발명의 AAV 게놈을 포함하는 바이러스 입자, 벡터 또는 플라스미드가 적절한 숙주세포에서 VP1를 발현함을 의미한다. "VP1의 발현은 유지(된다)" 및 "VP1의 발현은 방해받지 않는다"는 바람직하게는 본 발명의 AAV 게놈을 포함하는 바이러스 입자, 벡터 또는 플라스미드에 의한 적절한 숙주세포에서의 VP1 발현값이, 상기 돌연변이를 갖지 않는 것을 제외하고는 본 발명의 AAV 게놈과 동일한 AAV 게놈을 포함하는 바이러스 입자, 벡터 또는 플라스미드가 동일한 숙주 세포에서 발현하는 VP1 발현값의 적어도 25%, 더욱 바람직하게는 적어도 50%, 더욱 바람직하게는 적어도 75%, 더욱 바람직하게는 적어도 90%, 더욱 바람직하게는 적어도 100%인 것이다. 바람직한 실시예에서, "VP1의 발현은 유지(된다)"라는 표현은 상기 돌연변이를 갖는 본 발명의 AAV 게놈을 포함하는 바이러스 입자, 벡터 또는 플라스미드에 의한 적절한 숙주세포에서의 VP1이 발현이, 상기 돌연변이를 갖지 않는 것을 제외하고는 본 발명의 AAV 게놈과 동일한 AAV 게놈을 포함하는 바이러스 입자, 벡터 또는 플라스미드에 의해 동일한 숙주 세포에서 발현하는 VP1의 발현과 필적함을 의미한다.
VP1의 발현의 유지 또는 VP1의 발현이 방해받지 않음은 예를 들어, MAAP mRNA 번역-시작 코돈을 불활성화시키거나, 전장 야생형 MAAP의 번역을 중단시키기 위한 적어도 하나의 종결 코돈을 도입하여 전장 야생형 MAAP의 발현을 줄이는, 그러나 VP1 아미노산 서열의 돌연변이를 일으키지 않는 돌연변이를 도입함으로써 달성될 수 있다. 이와 달리, 이것은 전장 VP1의 발현에 영향을 미치지 않는 VP1 아미노산 서열에 돌연변이를 일으키는 돌연변이를 도입함으로써 달성될 수 있다. 그중에서도, 이러한 돌연변이는 또한 VP1의 기능성에 영향을 끼치지 않는다. 바람직한 실시예에서, 전장 야생형 MAAP의 발현을 줄이거나, MAAP mRNA 번역-시작 코돈을 불활성화 시키거나 또는 전장 야생형 MAAP의 번역을 막기 위한 적어도 하나의 종결 코돈을 도입하는 상기 돌연변이는 VP1에는 종결 코돈을 도입하지 않는다. 이와 같이, 바람직한 실시예에서, VP1 아미노산 서열은 변경되지 않는다. 특히, VP1 아미노산 서열은 동일한 AAV 혈청형의 야생형 VP1 아미노산 서열 대비 변경되지 않는다. 그러나, VP1 아미노산 또는 펩타이드 서열이 하나 이상의 돌연변이를 포함할 수 있다. 예를 들어, VP1 펩타이드는 MAAP 펩타이드 서열이 종결 코돈을 포함하도록 돌연변이되는 곳에 대응하는 위치에서 변경될 수 있다. 이와 같이, 일부 실시예에서는, VP1 아미노산 서열이 하나 이상의 돌연변이를 갖는다. 몇몇 실시예에서는, VP1 펩타이드에서의 하나 이상의 돌연변이가 보존적 돌연변이이다. 당업자는 적당한 보존적 돌연변이를 용이하게 확인하거나 고를 수 있다. 보존적 돌연변이의 예는, 단백질 또는 펩타이드의 기능에 영향을 끼치지 않을 것 같은 것으로서, 다음을 포함한다: 세린에 대해 알라닌, 이소류신에 대해 발린, 글루탐산염에 대해 아스파르트산염, 세린에 대해 트레오닌, 글리신에 대해 알라닌, 트레오닌에 대해서 알라닌, 아스파라긴에 대해 세린, 발린에 대해 알라닌, 글리신에 대해 세린, 페닐알라닌에 대해 티로신, 프롤린에 대해 알라닌, 아르기닌에 대해 리신, 아스파라긴에 대해 아르파르트산염, 이소류신에 대해 류신, 발린에 대해 류신, 글루탐산염에 대해 알라닌, 글리신에 대해 아스파르트산염, 및 역도 성립. 바람직하게는, 보존적 치환은 한 모둠 안의 한 아미노산을 동일 모둠 안의 다른 아미노산으로 바꾸는 것이고, 여기서 모둠은 다음과 같다: (1) 알라닌, 발린, 류신, 이소류신, 메티오닌, 및 페닐알라닌; (2) 히스티딘, 아르기닌, 리신, 글루타민, 및 아스파라긴; (3) 아스파르트산염 및 글루탐산염; (4) 세린, 트레오닌, 알라닌, 티로신, 페닐알라닌, 트립토판 및 시스테인; 및 (5) 글리신, 프롤린 및 알라닌.
바람직한 실시예에서, VP1 아미노산 서열은 야생형 VP1, 그 중에서도 동일 AAV 혈청형의 야생형 VP1과 적어도 80%의 상동성을 갖는다. 바람직한 실시예에서, VP1 아미노산 서열은 야생형 VP1, 특히 동일 AAV 혈청형의 야생형 VP1과 적어도 90%, 더욱 바람직하게는 적어도 95%, 더욱 바람직하게는 적어도 98%의 상동성을 갖는다.
바람직한 실시예에서, 상기 아데노-연관 바이러스 게놈은 MAAP 공통 폴리펩타이드 서열인 서열목록 11의 임의의 33개의 인접하는 잔기에 적어도 50%의 상동성을 갖는 1차 아미노산 서열을 갖는 폴리펩타이드를 발현하지 않는다. 바람직한 실시예에서, AAV 게놈은 MAAP 공통 폴리펩타이드 서열인 서열목록 11의 임의의 33개의 인접하는 잔기에 적어도 50%의 동일성을 갖는 1차 아미노산 서열을 갖는 폴리펩타이드를 발현하지 않는다. 또한, MAAP 공통 폴리펩타이드 서열인 서열목록 11의 임의의 33개의 인접하는 잔기에 적어도 50%의 상동성을 갖는 1차 아미노산 서열을 갖는 폴리펩타이드를 발현하지 않는 아데노-연관 바이러스 게놈이 제공된다. 바람직한 실시예에서, AAV 게놈은 MAAP 공통 폴리펩타이드 서열인 서열목록 11의 임의의 33개의 인접하는 잔기에 적어도 50%의 동일성을 갖는 1차 아미노산 서열을 갖는 폴리펩타이드를 발현하지 않는다.
바람직한 실시예에서, 상기 33개의 인접하는 잔기는 MAAP 공통 폴리펩타이드 서열인 서열목록 11의 잔기 93 내지 97을 포함한다.
바람직한 실시예에서, 상기 33개의 인접하는 잔기는 MAAP 공통 폴리펩타이드 서열인 서열목록 11의 잔기 107 내지 119를 포함한다.
바람직한 실시예에서, 상기 33개의 인접하는 잔기는 MAAP 공통 폴리펩타이드 서열인 서열목록 11의 잔기 1 내지 30을 포함한다.
바람직한 실시예에서, 상기 AAV 게놈은 MAAP 공통 폴리펩타이드 서열인 서열목록 11의 잔기 1 내지 33에 적어도 60%의 상동성을 가지는 아무 서열도 갖지 않는다. 바람직한 실시예에서, 상기 AAV 게놈은 MAAP 공통 폴리펩타이드 서열인 서열목록 11의 잔기 1 내지 33와 적어도 60%의 동일성을 갖는 아무 서열도 갖지 않는다.
바람직한 실시예에서, 상기 AAV 게놈은 MAAP 공통 폴리펩타이드 서열인 서열목록 11의 잔기 1 내지 39에 적어도 60%의 상동성을 가지는 아무 서열도 갖지 않는다. 바람직한 실시예에서, 상기 AAV 게놈은 MAAP 공통 폴리펩타이드 서열인 서열목록 11의 잔기 1 내지 39와 적어도 60%의 동일성을 갖는 아무 서열도 갖지 않는다.
바람직한 실시예에서, 상기 AAV 게놈은 MAAP 공통 폴리펩타이드 서열인 서열목록 11의 잔기 1 내지 47에 적어도 60%의 상동성을 가지는 아무 서열도 갖지 않는다. 바람직한 실시예에서, 상기 AAV 게놈은 MAAP 공통 폴리펩타이드 서열인 서열목록 11의 잔기 1 내지 47과 적어도 60%의 동일성을 갖는 아무 서열도 갖지 않는다.
바람직한 실시예에서, 상기 AAV 게놈은 MAAP 공통 폴리펩타이드 서열인 서열목록 11의 임의의 30개의 인접하는 잔기에 적어도 60%의 상동성을 가지는 아무 서열도 갖지 않는다. 바람직한 실시예에서, 상기 AAV 게놈은 MAAP 공통 폴리펩타이드 서열인 서열목록 11의 임의의 30개의 인접하는 잔기와 적어도 60%의 동일성을 갖는 아무 서열도 갖지 않는다.
바람직한 실시예에서, 상기 AAV 게놈은 MAAP 공통 폴리펩타이드 서열인 서열목록 11의 임의의 30개의 인접하는 잔기에 적어도 70%의 상동성을 가지는 아무 서열도 갖지 않는다. 바람직한 실시예에서, 상기 AAV 게놈은 MAAP 공통 폴리펩타이드 서열인 서열목록 11의 임의의 30개의 인접하는 잔기와 적어도 70%의 동일성을 갖는 아무 서열도 갖지 않는다.
바람직한 실시예에서, 상기 AAV 게놈은 MAAP 공통 폴리펩타이드 서열인 서열목록 11의 임의의 30개의 인접하는 잔기에 적어도 80%의 상동성을 가지는 아무 서열도 갖지 않는다. 바람직한 실시예에서, 상기 AAV 게놈은 MAAP 공통 폴리펩타이드 서열인 서열목록 11의 임의의 30개의 인접하는 잔기와 적어도 80%의 동일성을 갖는 아무 서열도 갖지 않는다.
바람직한 실시예에서, 상기 AAV 게놈은 MAAP 공통 폴리펩타이드 서열인 서열목록 11의 임의의 15개의 인접하는 잔기에 적어도 95%의 상동성을 가지는 1차 아미노산 서열을 가지는 폴리펩타이드를 발현하지 않는다. 바람직한 실시예에서, 상기AAV 게놈은 MAAP 공통 폴리펩타이드 서열인 서열목록 11의 임의의 15개의 인접하는 잔기와 적어도 95%의 동일성을 가지는 1차 아미노산 서열을 갖는 폴리펩타이드를 발현하지 않는다.
바람직한 실시예에서, 상기 AAV 게놈은 MAAP 공통 폴리펩타이드 서열인 서열목록 11의 임의의 17개의 인접하는 잔기에 적어도 90%의 상동성을 가지는 1차 아미노산 서열을 갖는 폴리펩타이드를 발현하지 않는다. 바람직한 실시예에서, 상기 AAV 게놈은 MAAP 공통 폴리펩타이드 서열인 서열목록 11의 임의의 17개의 인접하는 잔기와 적어도 90%의 동일성을 갖는 1차 아미노산 서열을 가지는 폴리펩타이드를 발현하지 않는다.
바람직한 실시예에서, AAV 게놈은 MAAP 공통 폴리펩타이드 서열인 서열목록 11의 임의의 19개의 인접하는 잔기에 적어도 90%의 상동성을 가지는 1차 아미노산 서열을 가지는 폴리펩타이드를 발현하지 않는다. 바람직한 실시예에서, AAV 게놈은 MAAP 공통 폴리펩타이드 서열인 서열목록 11의 임의의 19개의 인접하는 잔기와 적어도 90% 일치하는 1차 아미노산 서열을 가지는 폴리펩타이드를 발현하지 않는다.
바람직한 실시예에서, AAV 게놈은 MAAP 공통 폴리펩타이드 서열인 서열목록 11의 임의의 21개의 인접하는 잔기에 적어도 90%의 상동성을 갖는 1차 아미노산 서열을 가지는 폴리펩타이드를 발현하지 않는다. 바람직한 실시예에서, AAV 게놈은 MAAP 공통 폴리펩타이드 서열인 서열목록 11의 임의의 21개의 인접하는 잔기와 적어도 90%의 동일성을 갖는 1차 아미노산 서열을 가지는 폴리펩타이드를 발현하지 않는다.
바람직한 실시예에서, AAV 게놈은 MAAP 공통 폴리펩타이드 서열인 서열목록 11의 잔기 번호 94 내지 120 중 임의의 10개의 인접하는 잔기에 적어도 50%의 상동성을 가지는 1차 아미노산 서열을 갖는 폴리펩타이드를 발현하지 않는다. 바람직한 실시예에서, AAV 게놈은 MAAP 공통 폴리펩타이드 서열인 서열목록 11의 잔기 번호 94 내지 120 중 임의의 10개의 인접하는 잔기와 적어도 50%의 동일성을 갖는 1차 아미노산 서열을 가지는 폴리펩타이드를 발현하지 않는다.
바람직한 실시예에서, 본 발명에 따른 아데노-연관 바이러스 게놈이 적절한 숙주 세포 내에 도입되었을 때 바이러스 생산이 늘어난다. 구체적으로, 바이러스 생산은, 여기 설명된 것과 같은 막 연관 부속 단백질(MAAP) mRNA 번역-시작 코돈을 불활성화 및/또는 전장 야생형 MAAP의 번역을 막기 위해 적어도 하나의 종결 코돈을 도입하는 전장 야생형 MAAP의 발현을 줄이는 돌연변이가 없다는 점을 제외하고는 본 발명의 AAV 게놈과 동일한 AAV 게놈이 동일한 숙주 세포에 도입되었을 때 바이러스를 생산하는 것에 비해 늘어난다. 바람직하게는 바이러스 생산이 적어도 약 10%까지 증가한다. 바람직한 실시예에서, 바이러스 생산이 적어도 약 15%까지, 더욱 바람직하게는 적어도 약 20%까지, 더욱 바람직하게는 적어도 약 25%까지, 더욱 바람직하게는 적어도 약 50%까지 늘어난다. 추가적인 바람직한 실시예에서, 바이러스 생산이 적어도 약 60%까지, 적어도 약 75%까지, 더욱 바람직하게는 적어도 약 80%까지, 더욱 바람직하게는 적어도 약 85%까지, 더욱 바람직하게는 적어도 약 90%까지, 가장 바람직하게는 적어도 약 95%까지 늘어난다.
바람직한 실시예에서, 본 발명에 따른 아데노-연관 바이러스 게놈은 상기 게놈을 포함하는 바이러스 입자의 감염력을 증가시킨다. 특히, 여기 설명된 것과 같은 막 연관 부속 단백질(MAAP) mRNA 번역-시작 코돈을 불활성화, 및/또는 전장 야생형 MAAP의 번역을 막기 위해 적어도 하나의 종결 코돈을 도입하는 전장 야생형 MAAP의 발현을 줄이는 돌연변이가 없다는 점을 제외하고는 본 발명의 AAV 게놈과 동일한 AAV 게놈을 포함하는 바이러스 입자의 감염력에 비해 감염력이 증가한다. 바람직하게는, 감염력이 적어도 약 10%까지 증가한다. 바람직한 실시예에서 감염력이 적어도 약 15%까지, 더욱 바람직하게는 적어도 약 20%까지, 더욱 바람직하게는 적어도 약 25%까지, 더욱 바람직하게는 적어도 약 50%까지 증가한다. 또 다른 바람직한 실시예에서, 감염력이 적어도 약 60%까지, 적어도 약 75%까지, 더욱 바람직하게는 적어도 약 80%까지, 더욱 바람직하게는 적어도 약 85%까지, 더욱 바람직하게는 적어도 약 90%까지, 가장 바람직하게는 적어도 약 95%까지 증가한다.
바람직한 실시예에서, 본 발명에 따른 아데노-연관 바이러스 게놈은 상기 게놈을 포함하는 바이러스 입자의 안정성을 증가시킨다. 구체적으로, 본 발명에 따른 아데노-연관 바이러스 게놈은 캡시드 분해를 줄이고, 캡시드 온전성을 향상시키며 및/또는 VP1 단백질 온전성을 증가시킨다. 특히, 안정성은 여기 설명된 것과 같은 막 연관 부속 단백질(MAAP) mRNA 번역-시작 코돈을 불활성화, 및/또는 전장 야생형 MAAP의 번역을 막기 위해 적어도 하나의 종결 코돈을 도입하는 전장 야생형 MAAP의 발현을 줄이는 돌연변이가 없다는 점을 제외하고는 본 발명의 AAV 게놈과 동일한 AAV 게놈을 포함하는 바이러스 입자의 안정성에 비해 증가한다. 바람직하게는, 안정성이 적어도 약 10%까지 증가한다. 바람직한 실시예에서, 안정성이 적어도 약 15%까지, 더욱 바람직하게는 적어도 약 20%까지, 더욱 바람직하게는 적어도 약 25%까지, 더욱 바람직하게는 적어도 약 50%까지 증가한다. 또 다른 바람직한 실시예에서, 안정성이 적어도 약 60%까지, 더욱 바람직하게는 적어도 약 75%까지,더욱 바람직하게는 적어도 약 80%까지, 더욱 바람직하게는 적어도 약 85%까지, 더욱 바람직하게는 적어도 약 90%까지, 가장 바람직하게는 적어도 약 95%까지 증가한다.
본 발명에 따른 AAV 게놈 또는 AAV 벡터는 적당한 생산자 세포 내에 있을 때, 그리고 AAV Rep 및 Cap 단백질이 있을 때 복제될 수 있고, 바이러스 입자로, 특히 감염력 있는 바이러스 입자로 포장(package)될 수 있다. 이와 같이 본 발명의 AAV 게놈 또는 AAV 벡터를 포함하는 아데노 연관바이러스가 역시 제공된다.
여기 쓰인 "아데노-연관 바이러스" 또는 "AAV"는 적어도 하나의 AAV 캡시드 단백질 VP1, VP2 및/또는 VP3, 바람직하게는 야생형 AAV의 모든 캡시드 단백질과 캡시드 단백질에 싸인 폴리뉴클레오타이드 AAV 게놈 또는 AAV 벡터로 구성되는 바이러스 입자를 가리킨다. 본 발명의 AAV는 전형적으로 재조합 AAV이다. 바람직한 실시예에서 AAV는 비자연발생 AAV이다. 상기 AAV는 하나 이상의 이종 폴리뉴클레오타이드, 즉 이식 유전자와 같은, 야생형 AAV 폴리뉴클레오타이드가 아닌 폴리뉴클레오타이드를 포함할 수 있다. 이식 유전자의 예로는 치료 유전자가 있다. 여기 쓰인 "치료 유전자"는 세포 안에서 발현되었을 때 그것이 발현된 세포, 조직, 또는 동물에 이로운 효과를 주는 유전자 산물을 생산하는 유전자를 가리킨다.
본 발명의 AAV는 복제 가능한, 또는 복제 가능하지 않은 것일 수 있다. "복제가능한"의 의미는 바이러스 또는 바이러스 입자가 감염성이고 적당한 감염된 세포에서 복제될 수 있음을 의미한다. 바람직한 실시예에서, 본 발명의 AAV는 복제 가능하지 않다.
몇몇 실시예에서, 상기 AAV 게놈은 프로모터 서열에 기능적으로 연결된, 구체적으로 숙주 세포에서 폴리뉴클레오타이드의 발현을 이끄는 프로모터 서열과 연결된 폴리뉴클레오타이드를 포함한다. 여기 프로모터 서열과 기능적으로 연결되어 있는 폴리뉴클레오타이드를 언급하며 쓰인 "기능적으로 연결된"은 폴리뉴클레오타이드 서열이 프로모터와 기능적인 연관성을 가진 위치에 놓이는 것을 의미하는데, 즉, 상기 프로모터가 서열의 전사에 영향을 끼친다면 프로모터가 폴리뉴클레오타이드 서열에 기능적으로 연결된 것이다.
바람직한 실시예에서, 본 발명에 따른 아데노-연관 바이러스는 감염력이 증가된다. 구체적으로, 여기 설명된 것과 같은 막 연관 부속 단백질(MAAP) mRNA 번역-시작 코돈을 불활성화 및/또는 전장 야생형 MAAP의 번역을 막기 위해 적어도 하나의 종결 코돈을 도입하는 전장 야생형 MAAP의 발현을 줄이는 돌연변이가 없다는 점을 제외하고는 본 발명의 AAV 게놈과 동일한 AAV 게놈을 포함하는 AAV의 감염력에 비해 감염력이 증가한다. 바람직하게는, 감염력이 적어도 10%까지 증가한다. 바람직한 실시예에서, 감염력은 적어도 15%까지, 더욱 바람직하게는 적어도 약 20%까지, 더욱 바람직하게는 적어도 약 25%까지, 더욱 바람직하게는 적어도 약 50%까지 증가한다. 또 다른 바람직한 실시예에서, 감염력이 적어도 약 60%까지, 적어도 약 75%까지, 더욱 바람직하게는 적어도 약 80%까지, 더욱 바람직하게는 적어도 약 85%까지, 더욱 바람직하게는 적어도 약 90%까지, 가장 바람직하게는 적어도 약 95%까지 증가한다.
바람직한 실시예에서, 본 발명에 따른 아데노-연관 바이러스는 안정성이 증가한다. 구체적으로, 여기 설명된 것과 같은 막 연관 부속 단백질(MAAP) mRNA 번역-시작 코돈을 불활성화 및/또는 전장 야생형 MAAP의 번역을 중단시키기 위한 적어도 하나의 종결 코돈을 도입하는 전장 야생형 MAAP의 발현을 줄이는 돌연변이가 없다는 점을 제외하고는 본 발명의 AAV 게놈과 동일한 AAV 게놈을 포함하는 AAV의 안정성에 비해 안정성이 증가한다. 바람직하게는, 안정성이 적어도 10%까지 증가한다. 바람직한 실시예에서, 안정성이 적어도 15%까지, 더욱 바람직하게는 적어도 약 20%까지, 더욱 바람직하게는 적어도 약 25%까지, 더욱 바람직하게는 적어도 약 50%까지 증가한다. 또 다른 바람직한 실시예에서, 안정성이 적어도 약 60%까지, 적어도 약 75%까지, 더욱 바람직하게는 적어도 약 80%까지, 더욱 바람직하게는 적어도 약 85%까지, 더욱 바람직하게는 적어도 약 90%까지, 가장 바람직하게는 적어도 약 95%까지 증가한다.
추가적인 측면에서, 본 발명은 아데노 연관 바이러스를 생산하는 생산자 세포를 제공하는데, 상기 생산자 세포는 본 발명의 아데노-연관 바이러스 게놈을 포함한다.
추가적인 측면에서, 본 발명은 아데노 연관 바이러스를 생산하는 생산자 세포를 제공하는데, 상기 생산자 세포는 실질적으로 다음의 폴리펩타이드를 갖지 않는다:
(a) MAAP 공통 폴리펩타이드 서열인 서열목록 11의 임의의 30개의 인접하는 잔기에 적어도 50%의 상동성을 가지는 폴리펩타이드;
(b) MAAP 공통 폴리펩타이드 서열인 서열목록 11의 임의의 15개의 인접하는 잔기에 적어도 95%의 상동성을 가지는 폴리펩타이드;
(c) MAAP 공통 폴리펩타이드 서열인 서열목록 11의 잔기 번호 94 내지 120의 임의의 10개의 인접하는 잔기에 적어도 50%의 상동성을 가지는 폴리펩타이드. 상기 생산자 세포에는 바람직하게는 상기 설명된 폴리펩타이드가 없다.
여기 쓰인 바와 같은 "생산자 세포"는 "숙주 세포"로도 지칭된다. "생산자 세포" 및 "숙주 세포"라는 용어는 AAV에 의해, 특히 본 발명의 AAV에 의해 감염되거나 형질도입될 수 있는 임의의 세포를 가리킨다. 여기 쓰인 "형질 도입되다" 또는 "형질 도입"은 바이러스 또는 바이러스 벡터에 의해 세포 내로 하나 이상의 폴리뉴클레오타이드가 도입되는 것을 가리킨다. 여기에 쓰인 "적당한(적절한) 숙주 세포"라는 용어는 AAV 게놈을 포함하는 바이러스 입자, 벡터, 또는 플라스미드로 감염되었을 때 그 AAV 게놈으로 인코딩되는 단백질을 발현하게 하는 숙주 세포를 의미한다. 바람직한 실시예에서, 상기 생산자 세포는 유전자 조작된 생산자 세포이다.
바이러스 입자를 생산하기 위해 세포 또는 생산자에게 AAV 게놈 또는 벡터를 도입 또는 봉입하는 것은 당업계에 알려진 아무 종래의 방법을 사용하여 달성될 수 있고, 그런 방법은 당업자에게 잘 알려져 있다. 바람직한 실시예에서, 상기 세포 또는 생산자 세포는 AAV 게놈으로 형질 도입된다. 예를 들어, 본 발명에 따른 AAV 게놈을 포함하는 AAV 발현 벡터를, AAV 캡시드 단백질을 인코딩하는 폴리뉴클레오타이드와, 감염 및/또는 복제에 필요한 복제 단백질 및 포장(packaging) 단백질을 포함하는 다른 AAV 도움 기능을 포함하는 AAV 도움 구성체와 함께 생산자 세포에 도입하고, 그 다음 상기 생산자 세포가 AAV를 생산하도록 배양할 수 있다. 또는, 본 발명의 AAV 게놈이 바이러스 입자의 감염 및 복제를 위해 필요한 모든 뉴클레오타이드 서열과 단백질을 포함한다. 적당한 방법은 여기 실시예에서 설명된다.
"생산자 세포" 및 "숙주 세포"라는 용어는 임의의 진핵 또는 원핵 세포를 아우른다(예를 들어 E. coli와 같은 세균 세포, 효모 세포, 포유류 세포, 조류 세포, 양서류 세포, 식물 세포, 어류 세포 및 곤충 세포). 숙주 세포는 시험관 내(in vitro) 또는 예를 들어 유전자 조작 동물 안에 자리잡은 것 같은 체내(in vivo)일 수 있다. 바람직한 실시예에서, 생산자 세포는 진핵세포이다. 바람직한 실시예에서, 생산자 세포는 포유류 세포이다. 바람직한 실시예에서, 생산자 세포는 인간 세포이다. 바람직한 실시예에서, 생산자 세포는 효모 세포 및 곤충 세포로부터 선택된다. 당업자는 아데노-연관 바이러스를 생산하기에 적당한 생산자 세포를 용이하게 선택할 수 있다. 적당한 생산자 세포의 한 예는 293T 세포이다. 생산자 세포의 다른 예는 HeLa 세포, COS 세포, COS-1 세포, COS-7 세포, HEK293 세포, A549 세포, BHK 세포, BSC-1 세포, BSC-40 세포, 베로 세포, Sf9 세포, Sf -21 세포, Tn-368 세포, BTI-Tn-5B1- 4 (High-Five) 세포, 사오스(Saos) 세포, C2C12 세포, L 세포, HT1080 세포, HepG2 세포, WEHI 세포, 3T3 세포, 10T1/2 세포, MDCK 세포, BMT-10 세포, WI38 세포, 및 포유류 1차 섬유아세포, 간세포 또는 근아세포(myoblast)를 포함하나 이에 한정되지는 않는다.
또 다른 측면에서 아데노-연관 바이러스 게놈을 포함하는 생산자 세포를 제공하는데, 상기 생산자 세포는 아데노-연관 바이러스를 발현할 수 있는 세포이고, 상기 생산자 세포는 전장 기능성 MAAP가 실질적으로 없는 세포이다. 바람직한 실시예에서, 상기 아데노-연관 바이러스 게놈은 전장, 야생형 기능성 MAAP의 발현에 간섭하는 돌연변이를 가진다. 바람직한 실시예에서, 생산자 세포는 전장, 야생형 기능성 MAAP의 발현에 간섭하는 간섭 RNA를 포함한다. 바람직한 실시예에서, MAAP에 결합하여 MAAP의 기능을 망가뜨리는 MAAP를 향하는 단클론항체를 포함한다.
바람직한 실시예에서, 본 발명의 생산자 세포는 바이러스 생산이 증가한다. 특히, 여기 설명된 것과 같은 막 연관 부속 단백질(MAAP) mRNA 번역-시작 코돈을 불활성화 및/또는 전장 야생형 MAAP의 번역을 막기 위해 적어도 하나의 종결 코돈을 도입하는 전장 야생형 MAAP의 발현을 줄이는 돌연변이가 없다는 점을 제외하고는 본 발명의 AAV 게놈과 동일한 AAV 게놈이 도입된 동일한 생산자 세포에 의한 바이러스 생산에 비해 바이러스 생산이 증가한다. 바람직하게는 바이러스 생산이 적어도 10%까지 증가한다. 바람직한 실시예에서, 바이러스 생산이 적어도 15%까지, 더욱 바람직하게는 적어도 약 20%까지, 더욱 바람직하게는 적어도 약 25%까지, 더욱 바람직하게는 적어도 약 50%까지 증가한다. 또 다른 바람직한 실시예에서, 바이러스 생산이 적어도 약 60%까지, 적어도 약 75%까지, 더욱 바람직하게는 적어도 약 80%까지, 더욱 바람직하게는 적어도 약 85%까지, 더욱 바람직하게는 적어도 약 90%까지, 가장 바람직하게는 적어도 약 95%까지 증가한다.
추가적인 측면에서, 아데노-연관 바이러스를 생산하는 방법을 제공하는데, 상기 방법은: 아데노-연관 바이러스 게놈을 획득하고, 그리고나서 본 발명의 생산자 세포를 만들기 위해 상기 게놈을 세포에 도입하며, 그리고나서 상기 생산자 세포를 배양하여 상기 생산자 세포가 아데노-연관 바이러스를 생산하는 것을 포함한다. 바람직한 실시예에서, 상기 방법은 상기 아데노-연관 바이러스를 수확하는 것을 더 포함한다. 바람직한 실시예에서, 아데노-연관 바이러스 게놈은 본 발명에 따른 아데노-연관 바이러스 게놈이다.
추가적인 측면에서 아데노-연관 바이러스를 생산하는 방법이 제공되는데, 상기 방법은 본 발명의 생산자 세포를 배양하는 것을 포함하고, 여기서 상기 생산자 세포가 아데노-연관 바이러스를 생산한다. 바람직한 실시예에서, 상기 방법은 상기 아데노-연관 바이러스를 수확하는 것을 더 포함한다.
본 발명의 방법에 의해 생산되는 아데노-연관 바이러스는 하나 이상의 이종 폴리뉴클레오타이드, 즉 이식 유전자와 같은, 야생형 AAV 폴리뉴클레오타이드가 아닌 폴리뉴클레오타이드를 포함할 수 있다. 바람직한 실시예에서, 상기 아데노-연관 바이러스, 구체적으로 수확된 아데노-연관 바이러스는 이식 유전자(transgene)를 포함한다. 이식 유전자의 한 예는 치료 유전자이다.
바람직한 실시예에서, 본 발명의 AAV를 생산하는 방법은 생산자 세포를 24 시간 넘게 배양하는 것, 구체적으로 AAV를 수확하기 전에 24시간 넘게 생산자 세포를 배양하는 것을 포함한다. 바람직한 실시예에서, 상기 생산자 세포를 적어도 30시간, 특히 AAV를 수확하기 전에 생산자 세포를 적어도 30시간 배양한다. 바람직한 실시예에서, 상기 생산자 세포를 적어도 36시간, 구체적으로 AAV를 수확하기 전에 생산자 세포를 적어도 36시간 배양한다. 바람직한 실시예에서, 상기 생산자 세포를 적어도 48시간, 특히 AAV를 수확하기 전에 생산자 세포를 적어도 48시간 배양한다. 바람직한 실시예에서, 상기 생산자 세포를 적어도 60시간, 구체적으로 AAV를 수확하기 전에 생산자 세포를 적어도 60시간 배양한다. 바람직한 실시예에서, 상기 생산자 세포를 적어도 72시간, 특히 AAV를 수확하기 전에 생산자 세포를 적어도 72시간 배양한다.
바람직한 실시예에서, 상기 생산자 세포는 총 물리적 캡시드의 수에 대한 관심 유전자 또는 게놈을 함유하는 캡시드의 수의 비율이 적어도 야생형 아데노-연관 바이러스 게놈을 함유하는 유사한 세포에 의해 생산되는 총 물리적 캡시드의 수에 대한 관심 유전자 또는 게놈을 함유하는 캡시드의 수의 비율만큼 높은 바이러스 제제를 생산한다. 바람직한 실시예에서, 관심 게놈은 바람직하게는 본 발명에 따른 AAV 게놈이다. 바람직한 실시예에서, 관심 유전자는 AAV 유전자이고, 구체적으로 막-연관 부속 단백질(MAAP) mRNA 번역-시작 코돈을 불활성화 시키거나 또는 전장 야생형 MAAP의 발현을 중단시키기 위한 적어도 하나의 종결 코돈을 도입하는 돌연변이를 가지는 본 발명에 따른 MAAP 유전자이다. 다른 바람직한 실시예에서, 관심 유전자는 이종 유전자이고, 특히 이식 유전자이다. 이식 유전자의 한 예는 치료 유전자이다.
바람직한 실시예에서, 상기 생산자 세포는 [속이 찬]:[속이 빈] 캡시드의 비율이 최소한 야생형 아데노-연관 바이러스 게놈으로 감염된 유사한 세포에서 생산되는 것의 비율만큼 높은 비율을 가지는 바이러스를 생산한다. 바람직한 실시예에서, 상기 생산자 세포는 [속이 찬]:[속이 빈] 캡시드의 비율이 최소한 야생형 아데노-연관 바이러스 게놈으로 감염된 유사한 세포에서 생산되는 것보다 30% 높은 비율을 갖는 바이러스를 생산한다.
바람직한 실시예에서, 상기 생산자 세포는 최소한 야생형 아데노-연관 바이러스로 감염된 유사한 세포가 생산하는 것만큼 많은 바이러스 게놈 / mL를 가지는 바이러스를 생산한다. 바람직한 실시예에서, 상기 생산자 세포는 야생형 아데노-연관 바이러스로 감염된 유사한 세포가 생산하는 것의 최소 네 배의 바이러스 게놈 / mL를 가지는 바이러스를 생산한다.
또한, 아데노-연관 바이러스 (AAV)의 안정성을 높이고, 캡시드 온전성을 증가시키거나, 또는 캡시드 분해를 줄이는 방법을 제공하는데, 상기 방법은 본 발명의 아데노-연관 바이러스 게놈을 AAV에 넣는 것을 포함한다.
또한, 관심 유전자 또는 게놈을 함유하는 AAV 캡시드의 비율을 늘리는 방법을 제공하는데, 상기 방법은 본 발명의 아데노-연관 바이러스 게놈 및 관심 유전자 또는 게놈을 AAV에 넣는 것을 포함한다.
또한 AAV를 생산하는 생산자 세포의 바이러스 역가(바이러스 게놈/ mL)를 늘리는 방법을 제공하는데, 상기 방법은 본 발명의 아데노-연관 바이러스 게놈을 AAV에 넣고, 생산자 세포에 상기 AAV를 도입하는 것을 포함한다.
바람직한 실시예에서, 상기 생산자 세포를 적어도 30시간 배양한다.
바람직한 실시예에서, 상기 생산자 세포를 적어도 36시간, 48시간, 72시간 또는 96시간 배양한다.
또한 AAV를 생산하는 생산자 세포에서 바이러스 게놈 또는 바이러스 입자의 보유력을 증가시키는 방법을 제공하는데, 상기 방법은 본 발명의 아데노-연관 바이러스 게놈을 AAV에 넣고, 생산자 세포에 상기 AAV를 도입하는 것을 포함한다. 바람직한 실시예에서, 상기 방법은 생산자 세포로부터, 바람직하게는 실질적으로 배지 없이 세포로부터, 바이러스 게놈 또는 바이러스 입자를 수확 및/또는 정제하는 것을 더 포함한다.
또한, 본 발명의 아데노-연관 바이러스를 생산하는 방법에 의해 생산된 아데노-연관 바이러스가 제공된다. 바람직한 실시예에서, 상기 아데노-연관 바이러스는 본 발명에 따른 AAV 게놈을 포함하는 아데노-연관 바이러스이다. 본 발명의 AAV는 전형적으로 재조합 AAV이다. 바람직한 실시예에서 상기 AAV는 비-자연발생 AAV이다. 상기 AAV는 하나 이상의 이종 폴리뉴클레오타이드, 즉 이식 유전자와 같은, 야생형 AAV 폴리뉴클레오타이드가 아닌 폴리뉴클레오타이드를 포함할 수 있다.
본 발명을 명확하고 간결하게 설명할 목적으로 본 발명의 실시예와 같은, 또는 다른 측면의 일부로서 본 발명의 특징이 여기 설명될 것이다. 본 발명의 범위가, 동일한 또는 다른 실시예의 일부로서 여기 설명된 특징의 전체 또는 일부의 조합을 가지는 실시예를 포함하는 것이 당업자에게 이해될 것이다.
특허 또는 출원 파일은 적어도 하나의 유색 도면을 포함한다. 유색 도면을 포함하는 본 특허 또는 특허출원 공개의 사본은 요청 및, 필요한 비용이 있다면 비용 지불을 통해 특허청에 의해 제공될 것이다.
도 1은 여러 플라스미드 및 대조군으로서 PEI 단독으로 트랜스펙션된 세포의 형광 강도를 보여준다.
도 2는 293T 세포에서 WT AAV를 생산하는 동안 시간에 따른 Rep78/52, VP, AAP 및 MAAP 단백질의 발현을 추적한다.
도 3은 생산자 세포를 감염 시키고 24시간이 지난 후의 AAV 바이러스 역가를 보여준다(ddPCR을 사용하여 측정하고, mL 당 바이러스 게놈으로 표현). 열 1: 야생형(wt) AAV 혈청형 2. 열 2는 CGG로 돌연변이된 첫번째 이론적인 비-정규 시작 코돈(서열목록 2의 전장 혈청형 2 MAAP 폴리펩타이드 상의 잔기 L1을 코딩하는 CTG)을 가지는 MAAP이다. 열 3은 서열목록 2의 잔기 Q9가 종결 코돈으로 돌연변이된 MAAP이다. 열 4는 서열목록 2의 잔기 S39가 종결 코돈으로 돌연변이된 MAAP이다. 열 5는 서열목록 2의 잔기 S33, S39 및 S47이 각각 종결 코돈으로 돌연변이된 MAAP이다. 열 6-12는 각각 서열목록 2의 잔기 S65, E90, L100, W103, W105, L106 및 L110 (개별적으로)이 종결 코돈으로 돌연변이된 MAAP이다.
도 4는 감염 72시간 후 생산자 세포에서의 AAV 바이러스 역가를 나타낸다(ddPCR를 사용하여 측정했고 mL 당 바이러스 게놈으로 표현). 각 열은 앞의 도 3과 같다.
도 5는 24시간에 mL 당 AAV 바이러스 게놈에 미치는 MAAP 과발현의 효과를 보여준다. 열 1은 야생형 MAAP 유전자; 열 2: 전장 MAAP 폴리펩타이드 상의 잔기 S33, S39 및 S47가 종결 코돈으로 각각 돌연변이된 MAAP; 열 3: 열 1과 같지만 MAAP 과발현 플라스미드로도 세포 처리; 열 4: 열 2와 같지만 MAAP 과발현 플라스미드로도 세포 처리; 열 5: wt-AAV2 및 GFP 과발현 플라스미드 처리 세포; 열 6: 열 2와 같지만 GFP 플라스미드로 처리.
도 6은 감염 후 72시간에 mL 당 AAV 바이러스 게놈에 미치는 MAAP 과발현의 효과를 보여준다. 열 1은 야생형 MAAP 유전자; 열 2: 전장 MAAP 폴리펩타이드 상의 잔기 S33, S39 및 S47이 종결 코돈으로 각각 돌연변이된 MAAP; 열 3: 열 1과 같지만 MAAP 과발현 플라스미드로도 세포 처리; 열 4: 열 2와 같지만 MAAP 과발현 플라스미드로도 세포 처리; 열 5: wt-AAV2 및 GFP 과발현 플라스미드 처리 세포; 열 6: 열 2와 같지만 GFP 플라스미드로 처리.
도 7은 생산자 세포를 감염 시킨 뒤 24시에 측정한 바이러스 캡시드 내 포장된 AAV 바이러스 게놈에 대한 오염원 카나마이신 저항성 유전자(kan) DNA(바이러스를 만들기 위해 사용한 플라스미드에서 유래)의 양을 측정한 것이다. 각 열은 앞선 도 3과 같다.
도 8은 생산자 세포를 감염 시킨 뒤 72시간에 측정한 바이러스 캡시드 내 포장된 AAV 바이러스 게놈에 대한 오염원 kan DNA의 양을 측정한 것이다. 각 열은 앞의 도 3과 같다.
도 9는 생산자 세포를 감염 시킨 뒤 24시간에 MAAP 과발현 후 또는 과발현이 있을 때 측정한 바이러스 캡시드 내 포장된 AAV 바이러스 게놈에 대한 포장된 오염원 kan DNA의 양을 측정한 것이다. 각 열은 앞선 도 5와 같다.
도 10은 생산자 세포를 감염 시킨 뒤 72시간에, MAAP 과발현 후 또는 과발현이 있을 때 측정한 바이러스 캡시드 내 포장된 AAV 바이러스 게놈에 대한 포장된 오염원 kan DNA의 양을 측정한 것이다. 각 열은 앞의 도 6와 같다.
도 11은 생산자 세포를 감염 시킨 뒤 24시에 측정한 바이러스 캡시드 내 포장된 AAV 바이러스 게놈에 대한 오염원 아데노바이러스 혈청형 5 E4 유전자 DNA(아데노-연관 바이러스를 만들기 위해 쓰인 도움 아데노 바이러스 플라스미드로부터 유래)의 양을 측정한 것이다. 각 열은 앞선 도 3과 같다.
도 12는 생산자 세포를 감염 시킨 뒤 72시간에 측정한 바이러스 캡시드 내 포장된 AAV 바이러스 게놈에 대한 오염원 아데노바이러스 혈청형 5 E4 유전자 DNA(아데노-연관 바이러스를 만들기 위해 쓰인 도움 아데노 바이러스로부터 유래)의 양을 측정한 것이다. 각 열은 앞의 도 3과 같다.
도 13은 wt-AAV 및 아미노산 잔기 번호 E90, L100, W103, W105, L106 또는 L110 (서열목록 2의 전장 MAAP 서열에서의 번호)에 종결 코돈이 새로 도입된 MAAP, 그리고 음성 대조군을 코딩하는 플라스미드로 감염시킨 세포에서 24시에 폴리펩타이드 발현을 측정한 웨스턴블롯 사진이다(v1 및 v7는 아데노바이러스-게놈 도움 플라스미드의 다른 버전을 나타낸다; v7이 v1보다 작다). 맨 윗 판: 알파-튜블린의 발현, 중간 판: MAAP의 발현, 아래 판: 전장 VP-1, -2 및 -3의 발현(위쪽 밴드) 및 그것의 분해 산물(아래쪽 밴드).
도 14는 VP-1, -2 및 -3 (윗 판), MAAP (중간 판) 및 알파 튜블린(아래 판)의 발현을 측정한 웨스턴블롯 사진이다. 열 1: 분자량 마커. 열 2: 야생형(wt) AAV2. 열 3은 첫번째 이론적 비-정규 시작코돈(서열목록 2의 전장 혈청형 2 MAAP 폴리펩타이드 상의 잔기 L1을 코딩하는 CTG)이 CGG로 돌연변이된 MAAP 이다. 열 4는 전장 MAAP 폴리펩타이드의 잔기 Q9가 종결 코돈으로 돌연변이된 MAAP 이다. 열 5는 전장 MAAP 폴리펩타이드의 잔기 S39가 종결 코돈으로 돌연변이된 MAAP이다. 열 6은 전장 MAAP 폴리펩타이드의 잔기 S33, S39 및 S47이 각각 종결 코돈으로 돌연변이된 MAAP이다. 열 7은 음성 대조군이다.
도 15는 빈(원하는 DNA의 탑재가 안됨) 또는 채워진(원하는 DNA의 탑재) 캡시드의 퍼센티지를 비교한다. 각 열은 위의 도 3과 같다.
도 16은 rAAV 바이러스 게놈 역가에 대한 MAAP 변형체의 효과를 나타낸다. mSeAP를 인코딩하는 혈청형 1, 2, 5, 6, 8 및 9의 rAAV가 플라스미드 팩토리(Plasmid Factory)의 2-플라스미드 시스템 또는 3-플라스미드 시스템을 이용하여 생산되었다. 바이러스 게놈 역가를 정량하였다. 3-플라스미드 시스템에서, 동일한 캡시드 혈청형이지만 각각 wt-MAAP 또는 MAAP-삼중 종결체(triple stop), 및 MAAP-S/L-100을 인코딩하는 cap 유전자를 rAAV 생산을 위해 사용했다. (A) rAAV 수율은 평균 및 SD와 함께 vg.mL­1 로 나타냈다. wt-MAAP 및 돌연변이 MAAP로 생산된 rAAV 간의 통계적 유의성은 2-방향 기수 스튜던트 T-검정법(two-tailed, unpaired Student's T-tests)을 사용하여 계산했다.
도 17은 rAAV 게놈 포장에 대한 MAAP 변형체의 효과를 보여준다. mSeAP를 인코딩하는 혈청형 2, 5, 6 및 8의 rAAV를 wt-MAAP를 코딩하는 cap 유전자를 함유하는 2-플라스미드 시스템 및 wt-MAAP 또는 MAAP 변형체를 인코딩하는 cap 유전자를 가지는 3-플라스미드 시스템을 사용하여 생산했다. rAAV vg 역가를 정량했다. 병행하여, 우리는 동일 시료로부터의 AAV 캡시드의 총 수를 ELISA로 정량했다. 우리는 총 캡시드 대 rAAV 게놈을 함유하는 캡시드의 비율을 퍼센티지로 나타냈다. mSeAP 이식 유전자를 인코딩하는 rAAV 캡시드의 비율을 평균 및 SD와 함께 나타냈다. wt-MAAP 또는 돌연변이 MAAP를 인코딩하는 cap 유전자로 생산된 rAAV 간의 통계적 유의성은 2-방향 기수 스튜던트 T-검정법을 사용하여 계산했다.
도 18은 MAAP 변형체가 rAAV 배출 프로파일을 변형하는 것을 보여준다. mSeAP을 인코딩하는 혈청형 1, 2, 5, 6, 8 및 9의 rAAV가 플라스미드 팩토리의 2-플라스미드 시스템 또는 3-플라스미드 시스템을 사용하여 생산되었고, 바이러스 게놈 역가를 세포 배양액 또는 세포 배양 배지로부터 정량했다. 3-플라스미드 시스템에서, wt-MAAP; MAAP-삼중 종결체, MAAP-S/L-100을 인코딩하는 cap 유전자가 rAAV 생산을 위해 사용되었다. 세포 용해물 내의 vg 역가에 대한 세포 배지에서의 vg 역가의 평균 퍼센티지를 '분비된 바이러스 입자'로 SD와 함께 나타냈다. 같은 캡시드 혈청형이지만 wt-MAAP 또는 MAAP 변형체로 생산된 rAAV 간의 통계적 유의성은 2-방향 기수 스튜던트 T-검정법을 사용하여 계산했다.
도 19는 MAAP 계통수(phylogenetic tree)를 보여준다. MAAP 단백질의 계통수는 영장류 AAV의 서열이다. 75 초과 부트스트랩 수치 노드를 4가지 크기의 원으로 표현했다. 명명법은 혈청형 이름이거나 또는 AAV가 확인된 종을 참고하였고 종 뒤에 혈청형 번호가 온다(hu: 인간; rh: 레서스 원숭이; pi: 돼지꼬리 원숭이).
도 20은 서열목록 1 내지 29의 서열을 보여준다.
도 21 A-J는 각각 AAV 혈청형 1-10의 MAAP를 인코딩하는 cap 유전자의 핵산 서열을 제공한다.
실시예 1
재료 및 방법
전장 및 절단된 MAAP
AAV를 분석하면서, 우리는 가능성 있는 새로운 바이러스 단백질 및 그것의 번역을 위한 몇몇 비-정규(non-canonical) 시작 코돈을 확인했다. 우리는 그 다음 이 세 개의 비정규 시작 코돈 중 하나가 사실 야생형 AAV가 새로운 야생형 단백질의 번역을 시작하도록 작동한다는 것을 발견했다. 서열목록 1-10은 각각 AAV 혈청형 1-10의 야생형 단백질에 대한 1차 단백질의 서열을 제공한다. C-말단 끝에서 이 혈청형 각각에 대한 아미노산 서열이 높게 보존된다. N-말단 끝에서, AAV 혈청형 4 (서열목록 4) 및 혈청형 5 (서열목록 5) 야생형 단백질은 다른 혈청형에서는 보이지 않는 선도하는(leading) 15-25개 아미노산 잔기 서열을 갖는다. 서열목록 11은 이 10개의 혈청형 전체에 대한 이론적인 공통의 1차 아미노산 서열을 제공한다. 우리는 이 단백질을 종합적으로, 그리고 각각 개별적으로 "MAAP"로 지칭한다(동일한 새로 발견된 단백질이 최근 독립적으로 Ogden P.J. et al., Comprehensive AAV Capsid Fitness Landscape Reveals A Viral Gene And Enables Machine-Guided Design, 366 Science 1139 (2019)에서도 보고되었다. Ogden et al.은 이 새로 발견된 단백질을 "막 연관 부속 단백질" 또는 "MAAP"라 지칭했다).
야생형 DNA 서열은 두 개의 추가적인 비정규 시작 코돈을 포함한다. 그 중 하나는 AGG(서열목록 2의 전장 폴리펩타이드 서열의 아미노산 잔기 13번을 코딩함) 이다. 다른 것은 ACG (서열목록 2의 전장 폴리펩타이드 서열의 아미노산 잔기 14번을 코딩함)이다.
바이러스 제제
AAV 바이러스 생산은 다음과 같이 진행했다. 293T 세포(European Collection of Cell Cultures 293T Number: 12022001)를 10% 우태혈청(FBS, Thermo Fisher 10091-148)을 보충하고 2mM 엘-글루타민(Gibco, 25030-024) 및 페니실린-스트렙토마이신 (Gibco 15070-063)을 첨가한 둘베코 변형 이글 배지 (Dulbecco's modified Eagle medium)(DMEM, Gibco 11965084)에서 키웠다.
AAV 플라스미드와 아데노 바이러스 도움 플라스미드의 폴리에틸렌이민(PEI) 트랜스펙션을 T25 플라스크 내의 293T 세포에서 수행했다(60,000 세포/cm2). PEI Pro™ (Polyplus Transfection, ref# 115-100)/DNA 질량비를 무혈청 DMEM 배지 내에서 1:1로 유지했다. AAV2에 대해서는, 우리는 AAV2 플라스미드와 아데노 바이러스 도움 플라스미드를 1:1 비율로 총 350 ng/cm2 로 사용했다. 다른 AAV 혈청형에 대해서도 유사하게 적절한 도움 플라스미드 대 AAV 플라스미드 비율을 사용할 수 있다.
비정규 시작 코돈의 상대적 쓰임을 분석하기 위해서, 우리는 첫번째 비정규 시작코돈을 CTG에서 CGG로 점-돌연변이 시켰고, 잠재적 시작 코돈으로서의 그 코돈을 불활성화시켰다.
이 새로운 단백질의 기능을 평가하기 위해, 우리는 그것을 인공적으로 절단한 돌연변이체를 만들었다. 이 돌연변이를 설계하는 것은 보통 일이 아니었는데, 왜냐하면 동일한 DNA 서열이 VP1을 발현하기 위해 쓰이고, 그 바이러스 단백질은 바이러스가 숙주 세포로 진입하는 데, 그리고 바이러스 게놈을 감염된 세포의 핵으로 세포 내 전달하는 데 필수적이기 때문이다. 따라서, 우리는 MAAP 번역을 중단시키지만, VP1의 아무런 아미노산 서열의 번역도 방해하지 않는 코돈을 만드는 점 돌연변이를 만들어야만 했다. 우리는 11개의 적당한 돌연변이 위치를 확인했다. 이 새로운 종결(stop) 코돈은 이론적으로 MAAP 번역을 아미노산 잔기 번호 Q9, S33, S39, S47, S65, E90, L100, W103, W105, L106 및 L110(여기서는 혈청형 2, 서열목록 2)에서 절단한다. 아래 표는 본 연구에서 사용한 다양한 플라스미드의 완전한 목록과 우리가 MAAP 유전자에 만든 점 돌연변이, 그리고 결과로 만들어진 MAAP 및 VP1 아미노산 서열에 대한 그것의 영향을 제공한다.
사용한 플라스미드
사용한 플라스미드
# 이름 MAAP wt MAAP 돌연변이 VP1 wt VP1 돌연변이 사용
p0059 p0059-pDEST-eGFP 채움 플라스미드(Stuffer plasmid)
p0088 p0088-pHelper-Ad5-Lio - - - - WT AAV2 및 rAAV2 생산을 위해 사용한 도움 플라스미드. 아데노바이러스 5의 VAI, VAII, E2, E4 구역 인코딩
p0108 p0108-pGRG25-AAV2WT WT 서열 - WT 서열 - WT AAV2 생산에 대한 참고 (Savy et al., 2018)
p0188 p0188-AAV2WT-MAAP Q16 -> stop Gln 9 (CAG) stop 9 (TAG) Ala 35 (GCA) Val 35 (GTA) MAAP 시작 코돈 연구
p0189 p0189-AAV2WT-MAAP S40-S46-S54 -> stops Ser 33 (TCG) - Ser 39 (TCA) -Ser 47 (TCG) Stop 33 (TAG) - Stop 39 (TGA) - Stop 47 (TAG) Leu 59 (CTC) - Val 65 (GTC) - Leu 72 (CTC) Leu 59 (CTA) - Val 65 (GTA) - Leu 72 (CTA) MAAP 불활성화 연구
p0190 p0190-AAV2WT-MAAP S40 -> stop Ser 33 (TCG) Stop 33 (TAG) Leu 59 (CTC) Leu 59 (CTA) MAAP 불활성화 연구
p0191 p0191-AAV2WT-MAAP S46 -> stop Ser 39 (TCA) Stop 39 (TGA) Val 65 (GTC) Val 65 (GTA) MAAP 불활성화 연구
p0192 p0192-AAV2WT-MAAP S54 -> stop Ser 47 (TCG) Stop 47 (TAG) Leu 72 (CTC) Leu 72 (CTA) MAAP 불활성화 연구
p0193 p0193-AAV2WT-MAAP S72 -> stop Ser 65 (TCA) Stop 65 (TGA) Leu 91 (CTC) Leu 91 (CTC) MAAP 불활성화 연구
p0194 p0194 - AAV2WT-MAAP E97 -> stop Glu 90 (GAG) Stop 90 (TAG) Arg 116 (CGA) Leu 116 (CTA) * MAAP 핵 자리잡기(localization) 신호 연구
p0195 p0195 - AAV2WT-MAAP L107 -> stop Leu 100 (TTG) Stop 100 (TAG) Leu 126 (CTT) Leu 126 (CTA) MAAP 핵 자리잡기(localization) 신호 연구
p0196 p0196 - AAV2WT-MAAP W110 -> stop Trp 103 (TGG) Stop 103 (TAG) Leu 129 (CTG) Leu 129 (CTA) MAAP 핵 자리잡기(localization) 신호 연구
p0197 p0197 - AAV2WT-MAAP W112 -> stop Trp 105 (TGG) Stop 105 (TAG) Leu 131 (CTG) Leu 131 (CTA) MAAP 핵 자리잡기(localization) 신호 연구
p0198 p0198 - AAV2WT-MAAP L113 -> stop Leu 106 (TTG) Stop 106 (TAG) Val 132 (GTT) Val 132 (GTA) MAAP 핵 자리잡기(localization) 신호 연구
p0199 p0199 - AAV2WT-MAAP L117 -> stop Leu 110 (TTA) Stop 110 (TGA) Val 136 (GTT) Val 136 (GTG) MAAP 핵 자리잡기(localization) 신호 연구
p0200 p0200-AAV2WT-MAAP-GFP WT 서열 WT 서열 GFP의 삽입으로 VP1-P145 뒤에서 MAAP로 융합됨 WT-AAV 플라스미드에서의 MAAP 시작코돈- MAAP-GFP 융합 연구
p0201 p0201-AAV2WT-MAAP-GFP Q16 -> stop Gln 9 (CAG) Stop 9 (TAG) Ala 35 (GCA) Val 35 (GTA) WT-AAV 플라스미드에서의 MAAP 시작코돈- MAAP-GFP 융합 연구
p0202 p0202-AAV2WT-MAAP-GFP S40 -> stop Ser 33 (TCG) Stop 33 (TAG) Leu 59 (CTC) Leu 59 (CTA) MAAP 불활성화- MAAP - GFP 융합 연구
p0203 p0203-AAV2WT-MAAP-GFP S46 -> stop Ser 39 (TCA) Stop 39 (TGA) Val 65 (GTC) Val 65 (GTA) MAAP 불활성화- MAAP - GFP 융합 연구
p0204 p0204-AAV2WT-MAAP-GFP S54 -> stop Ser 47 (TCG) Stop 47 (TAG) Leu 72 (CTC) Leu 72 (CTA) MAAP 불활성화- MAAP - GFP 융합 연구
p0205 p0205-AAV2WT-MAAP-GFP S40-46-54 -> stops Ser 33 (TCG) - Ser 39 (TCA) -Ser 47 (TCG) Stop 33 (TAG) - Stop 39 (TGA) - Stop 47 (TAG) Leu 59 (CTC) - Val 65 (GTC) - Leu 72 (CTC) Leu 59 (CTA) - Val 65 (GTA) - Leu 72 (CTA) MAAP 불활성화- MAAP - GFP 융합 연구
p0206 p0206-AAV2WT-MAAP-GFP start1 Leu8 -> Arg Leu 1 (CTG) Arg 1 (CGG) Pro 27 (CCT) Pro 27 (CCG) WT-AAV 플라스미드에서의 MAAP 시작코돈- MAAP-GFP 융합 연구
p0223 p0223-AAV2WT-MAAP- start1 Leu8 -> Arg Leu 1 (CTG) Arg 1 (CGG) Pro 27 (CCT) Pro 27 (CCG) MAAP 시작 코돈 연구
p0226 p0226-AAV2WT-AAP- S13-W46 -> stops WT 서열 - WT 서열 - MAAP의 AAP와의 상호 작용 연구
p0230 p0230-pUC-K-AAV2WT-Reverse WT 서열 - WT 서열 - WT AAV2 생산에 대한 참조
p0273 p0273-Ad5-Lio-v7 WT AAV2 및 rAAV2 생산을 위해 사용한 도움 플라스미드. 아데노바이러스 5의 VAI, VAII, E2, E4 구역 인코딩
p0280 p0280-MAAP CMV 인핸서 - CMV 프로모터 - SV40 인트론 프로모터 서열 하에서 ATG 코돈에 의해 구동되는 MAAP 발현
p0283 p0283-MAAP-GFP CMV 인핸서 - CMV 프로모터 - SV40 인트론 프로모터 서열 하에서 ATG 코돈에 의해 구동되는 MAAP 발현
p0326 p0326 - MAAP start 2 CMV 인핸서 - CMV 프로모터 - SV40 인트론 프로모터 서열 하에서 ATG로 변형된 Start 2 (R13)에서 시작된 MAAP의 발현
p0331 jp0331-AAP
# = 플라스미드 코드 번호. wt = 야생형. * = 이 돌연변이는 MAAP에 종결 코돈을 도입하는는 동 시에 VP1아미노산 서열을 변형시킴.
AAV 생산을 위해 사용한 플라스미드
AAV 생산을 위해 사용한 플라스미드
# 이름 MAAP wt MAAP 돌연변이 n t
p0223-AAV2WT-MAAP- start1 Leu8 -> Arg 3 24h; 72h
p0188 p0188-AAV2WT-MAAP Q16 -> stop Gln 9 (CAG) stop 9 (TAG) 3 24h; 72h
p0189 p0189-AAV2WT-MAAP S40-S46-S54 -> stops Ser 33 (TCG) - Ser 39 (TCA) -Ser 47 (TCG) Stop 33 (TAG) - Stop 39 (TGA) - Stop 47 (TAG) 3 24h; 72h
p0190 p0190-AAV2WT-MAAP S40 -> stop Ser 33 (TCG) Stop 33 (TAG) - -
p0191 p0191-AAV2WT-MAAP S46 -> stop Ser 39 (TCA) Stop 39 (TGA) 3 24h; 72h
p0192 p0192-AAV2WT-MAAP S54 -> stop Ser 47 (TCG) Stop 47 (TAG) - -
시료없음; WB 없음 p0193-AAV2WT-MAAP S72 -> stop 3 72h
p0194 p0194 - AAV2WT-MAAP E97 -> stop Glu 90 (GAG) Stop 90 (TAG) 3 24h; 72h
p0195 p0195 - AAV2WT-MAAP L107 -> stop Leu 100 (TTG) Stop 100 (TAG) 3 24h; 72h
p0196 p0196 - AAV2WT-MAAP W110 -> stop Trp 103 (TGG) Stop 103 (TAG) 2 24h
p0197 p0197 - AAV2WT-MAAP W112 -> stop Trp 105 (TGG) Stop 105 (TAG) 2 24h
p0198 p0198 - AAV2WT-MAAP L113 -> stop Leu 106 (TTG) Stop 106 (TAG) 3 24h; 72h
p0199 p0199 - AAV2WT-MAAP L117 -> stop Leu 110 (TTA) Stop 110 (TGA) 3 24h; 72h
WB 24h 시료
p0230-pUC-K-AAV2WT-Reverse
p0189-AAV2WT-MAAP S40-S46-S54 -> stops
p0194 - AAV2WT-MAAP E97 -> stop
p0195 - AAV2WT-MAAP L107 -> stop
p0196 - AAV2WT-MAAP W110 -> stop
p0197 - AAV2WT-MAAP W112 -> stop
p0198 - AAV2WT-MAAP L113 -> stop
p0199 - AAV2WT-MAAP L117 -> stop
neg
p0230-pUC-K-AAV2WT-Reverse 3 24h; 72h
p0223-AAV2WT-MAAP- start1 Leu8 -> Arg
p0188-AAV2WT-MAAP Q16 -> stop
p0191-AAV2WT-MAAP S46 -> stop
p0189-AAV2WT-MAAP S40-S46-S54 -> stops
# = 플라스미드 코드 번호. n = 실험 진행 횟수. t = 생산자 세포 감염 후 바이러스 수확까지의 시간(시간)
형광-활성화 세포 분류를 위해서, 우리는 다음의 플라스미드를 사용했다:
형광-활성화 세포 분류를 위해 사용한 플라스미드
형광-활성화 세포 분류를 위해 사용한 플라스미드
# 이름 MAAP wt MAAP 돌연변이
p0200 p0200-AAV2WT-MAAP-GFP WT 서열 WT 서열
p0201 p0201-AAV2WT-MAAP-GFP Q16 -> stop Gln 9 (CAG) Stop 9 (TAG)
p0202 p0202-AAV2WT-MAAP-GFP S40 -> stop Ser 33 (TCG) Stop 33 (TAG)
p0203 p0203-AAV2WT-MAAP-GFP S46 -> stop Ser 39 (TCA) Stop 39 (TGA)
p0204 p0204-AAV2WT-MAAP-GFP S54 -> stop Ser 47 (TCG) Stop 47 (TAG)
p0205 p0205-AAV2WT-MAAP-GFP S40-46-54 -> stops Ser 33 (TCG) - Ser 39 (TCA) -Ser 47 (TCG) Stop 33 (TAG) - Stop 39 (TGA) - Stop 47 (TAG)
p0206 p0206-AAV2WT-MAAP-GFP start1 Leu8 -> Arg Leu 1 (CTG) Arg 1 (CGG)
# = 플라스미드 번호
MAAP original = MAAP 원 코돈 및 아미노산
MAAP final = MAAP 최종 돌연변이
바이러스는 트랜스펙션 후 24시간 및 72시간에 수확했다.
바이러스 게놈 역가 측정 및 AAV 캡시드 ELISA 시료를 얻기 위해서, 트리톤-X-100 완충액(0.5 % Triton-X-100 (Sigma-Aldrich, ref# X100-1L), 1x 인산 완충 식염수(PBS, Gibco, ref# 18912-014) 내 2 mM MgCl2 (Merck, ref# E13980))과 데나라제(Denarase)(50 U/ml, c-Lecta, ref# 20804-5M)를 사용하여 바이러스를 수확했다. 용해 완충액을 배지에 넣고 세포 용해물을 모으기 전에 세포를 37℃에서 2시간 동안 배양했다.
웨스턴블롯을 위한 시료를 처리하기 위해, 바이러스를 다음과 같이 수확했다. 트리플 셀렉트(Tryple Select™)(Gibco, ref# 12563-011)를 사용하여 세포를 떼어내고 1x PBS (Gibco, ref# 14190-094)에 띄웠다. 원심분리(500 g, 5 분)하여 세포를 덩어리지게 했다. 세포 덩어리를 1x PBS로 씻고, 원심분리를 반복했다. 세포를 프로티나제 억제제 칵테일(Proteinase Inhibitor Cocktail) (cOmplete™, Roche, ref# 1169749800)을 함유하는 방사선 면역침강 분석(radio-immunoprecipitation assay, RIPA) (Thermo Scientific, ref# 89901) 완충액에 다시 띄웠다. 시료를 20분간 얼음 속에서 배양하고 20,000 g로 15분간 원심분리했다. 상층액을 수거했다.
이 연구에서 사용한 프라이머와 프로브
이 연구에서 사용한 프라이머와 프로브
ID 서열
Rep2-PRB /56-FAM /CCCGTGTCA/ZEN/GAATCTCAACCCGTT/
3IABkFQ/
Rep2-FWD CTTCACTCACGGACAGAAAGA
Rep2-REV CTGGCACCTTTCCCATGATA
Ad5-E4-PRB /56-FAM /ACCCAGCCA/ZEN/ACCTACACATTCGTT/3IABkFQ/
Ad5-E4-FWD CATCCACCACCGCAGAATAA
Ad5-E4-REV ACATGGTTCTTCCAGCTCTTC
Kan-PRB /56-FAM /TCGCACCTG/ZEN/ATTGCCCGACATTAT/3IABkFQ/
Kan-FWD ATCGGGCTTCCCATACAATC
Kan-REV GCTCTAGGCCGCGATTAAA 
메모:
56-FAM, ZEN 및 3IABkFQ는 조영제이다.
미세방울 디지털 PCR에 의한 AAV 및 오염 서열의 정량
미세방울 디지털(droplet digital PCR)(ddPCR) AAV 바이러스 게놈(vg) 역가를 얻기 위해, 바이러스의 조 제제를 우선 DNaseI (0,01 U/μl, Invitrogen, ref# 18047-019)으로 처리하고 그 다음 Proteinase K (0,1 μg/μl, Roche, ref# 03115879001)로 처리했고, 적당한 프라이머로 ddPCR 증폭(QX200, Bio-Rad) 시켜 바이러스 역가를 얻었다. 예를 들어, AAV2에 대해 우리는 Rep2-FWD 및 Rep2-REV 프라이머를 사용했고, AAV 복제효소(replicase) 구역을 탐지하기 위해 프로브 Rep2-PRB를 사용했다.
AAV 플라스미드 골격(backbone)과 아데노 바이러스 도움 플라스미드 골격으로부터 유래되어 AAV 캡시드에 포장된, 원하지 않는 오염 DNA의 값을 측정하기 위해 적당한 프라이머를 사용하여 ddPCR을 수행했다. 예를 들어, 플라스미드 골격에 존재하는 카나마이신-저항성 유전자에 의한 오염을 추적하기 위해, 우리는 Kan-FWD 및 Kan-REV 프라이머를 사용하였고, 카나마이신 저항성 유전자에 대한 Kan-PRB 프로브를 사용하였다. 아데노 바이러스 E4 (Ad5-E4) 구역 프라이머 세트(Ad5-E4-FWD ; Ad5-E4-REV) 및 프로브(Ad5-E4-PRB)를 아데노 바이러스 도움 플라스미드를 정량하기 위해 사용했다. 모든 프라이머와 프로브는 인터그레이티드 DNA 테크놀로지스(Integrated DNA Technologies)에서 주문했다.
마스터믹스를 만들기 위해, 프라이머 (900 nM) 및 프로브(250 nM)를 2x ddPCR 슈퍼믹스 포 프로브(supermix for Probes)(dUTP 없음, Bio-Rad, ref# 1863025) 및 뉴클레아제 프리 워터(nuclease free water)(Thermo Scientific, ref#R0582)에 희석시켰다. 상기 표는 본 연구에서 사용한 프라이머 및 프로브의 목록을 제공한다. 다른 프라이머와 프로브도 여러 가지 AAV 혈청형 또는 여러 가지 오염 DNA를 찾기 위해 유사하게 쓰일 수 있다.
ELISA
총 AAV 캡시드 대비 AAV 게놈을 포함하는 캡시드의 비율을 측정하기 위해, AAV 역가 ELISA 키트(Progen, ref # PRATV)를 사용하여 제조사의 설명서에 따라 바이러스 제제를 연속적으로 희석하여 A20 캡시드 ELISA를 수행했다.
MAAP 및 AAP 항혈청
면역화 전에 담체에 결합시킨 펩타이드 KKIRLLGATSDEQSSRRKRG (서열목록 28)로 면역 반응을 일으킨 토끼로부터 다클론 항-MAAP 항혈청을 채취했다(Davids Biotechnologie GmbH, Germany).
면역화 전에 담체에 결합시킨 펩타이드 RSTSSRTSSARRIKDASRR (서열목록 29)로 면역 반응을 일으킨 기니피그로부터 다클론 항-AAP 항혈청을 채취했다. 항혈청은 친화도 정제(affinity purified)했다(Davids Biotechnologie GmbH, Germany).
웨스턴 블롯팅
라엠리 시료 완충액 내의 (Laemmli sample buffer) (Bio-Rad, ref# 1610747) 2-메르캅토에탄올 (10 %, Sigma-Aldrich)을 이용하여 시료를 변성시켰다. 일정한 부피의 각 시료를 Mini-Protean TGX 겔에(4-10 %, Bio-Rad) 걸었다. 단백질을 0.2 μm PVDF 막(Trans-Blot Turbo Transfer Pack, Bio-Rad)으로 이동시켰고, 선택된 1차 항체(표)로 밤새 염색했다. 고추냉이 과산화효소(HRP) 결합 2차 항체로 단백질을 탐지했고 ChemiDoc (Bio-Rad)을 사용하여 시각화시켰다.
웨스턴 블롯 분석: 사용한 항체 및 희석 배율
웨스턴블롯 분석: 사용한 항체 및 희석 배율
탐지 단백질 1차 항체 1º dil 2차 항체 2º dil
AAV 복제효소 303.9 (Progen) 1:250 염소 항-마우스 IgG (H+L)-HRP 복합체 (Bio-Rad) 1:3000
AAV 캡시드 단백질 B1 (Progen) 1:250 염소 항-마우스 IgG (H+L)-HRP 복합체 (Bio-Rad) 1:3000
MAAP GAL-KKI(Davids Biotechnologie) 1 μg/ mL 염소 항-토끼 IgG (H+L)-HRP 복합체 (Bio-Rad) 1:3000
AAP GAL-RST(Davids Biotechnologie) 3 μg/ mL 항 기니피그 IgG (H+L)-HRP 복합체 (Sigma) 1:1000
α-튜블린 α-튜블린 HRP 결합 마우스 단클론 IgG 1:1000 NA NA
1º dil = 1차 희석; 2º dil = 2차 희석
α-튜블린 HRP 결합 마우스 단클론 IgG는 Santa Cruz Biotechnology에서 구입.
통계적 분석
1-방향 변수 분석(ANOVA)을 사용하여 통계적인 비교를 수행했고, 이어서 던넷 다중 비교 검정법(Dunnett's Multiple Comparison Test)으로, 분석한 다른 AAV2를 wt-AAV2 참고치와 비교했다. 통계적 시험은 GraphPad™ 소프트웨어(Prism)를 사용하여 수행했다.
결과
MAAP 번역은 CTG 코돈에서 시작함
가능성 있는 새로운 바이러스 단백질을 찾아낸 후에, 우리는 잠재적인 비-ATG (비정규) 시작 코돈을 확인하기 위해 wt AAV의 게놈을 분석했다. 우리의 검토를 통해 이론적으로 번역을 시작할 수 있는 적어도 세 개의 서로 다른 비정규 세 개 묶음을 찾았다. 이 세 개 각각은 정규적인 ATG 시작 코돈과 비교했을 때 하나의 염기만 다르다. 따라서, 각각 이론적으로 번역을 시작할 수 있다.
우리는 MAAP 리딩 프레임에서 나타난 첫번째 CTG가 MAAP에 대한 주요한 번역 시작 코돈임을 발견했다. CTG는 MAAP에서 류신으로 번역된다(전장 단백질의 L1). VP1 프레임에서(MAAP에서 -1)는 이 위치에서 CCT가 P27로 번역된다.
야생형 게놈의 측면에서 비정규 시작 코돈의 쓰임을 분석하기 위해, 우리는 MAAP의 첫 번째 잠재적인 비정규 시작 코돈(CTG, 전장 단백질에서 L1)을 CGG로(R1으로 번역됨) 돌연변이 시켰다. 이것은 그 잠재적인 시작 코돈의 기능을 파괴했다. 그 결과로, 우리는 MAAP 생산이 웨스턴블롯을 사용하여 탐지되지 않을 정도까지 떨어짐을 발견했다.
우리는 그래서 우리의 결과를 여러 방향으로 확증했다. 첫 번째, 우리는 첫 번째(CTG) 및 두 번째(AGG) 잠재적인 비정규 시작 코돈 사이의 MAAP-Q9 자리에 종결(stop) 코돈을 도입했다. 그 결과, 우리는 MAAP 단백질 생산이 웨스턴블롯을 사용하여 탐지되지 않을 수준으로 떨어짐을 발견했다.
유사하게, 우리는 MAAP-S39 위치에 종결 코돈을 도입했다. 그 결과, 우리는 MAAP 단백질 생산이 웨스턴블롯을 사용하여 탐지되지 않을 수준으로 떨어짐을 발견했다.
유사하게, 우리는 MAAP 아미노산 잔기 S33, S39 및 S47에 3개의 일련의 종결 코돈을 놓았다. 그 결과, 우리는 MAAP 단백질 생산이 웨스턴블롯을 사용하여 탐지되지 않을 수준으로 떨어짐을 발견했다.
우리의 결과는 Ogden (2019)이 관찰한 것과는 다르다. 그들의 연구에서, Ogden (2019)은 MAAP-플래그 태그 융합 단백질을 사용하여, 첫 번째 CTG 시작 코돈이 돌연변이 되고 MAAP-Q6 위치에 종결 코돈이 도입되었을 때 단백질 발현이(아마도 절단된 형태로) 관찰되었다고 했다.
우리는 MAAP-L1 CTG 시작 코돈을 ATG로 바꾼 재조합 MAAP와 야생형 MAAP의 크기를 비교함으로써 추가적으로 MAAP 시작 코돈의 특성을 파악했고, 그 외에 두 번째 잠재 시작 코돈(MAAP-R13, AGG)을 ATG로 바꾸었을 때 N-말단이 잘린 MAAP가 발현되었다. 우리는 MAAP-L1이 ATG로 변형된 것에서 발현된 단백질과 동일한 분자량의 MAAP를 탐지했고, 한편 MAAP-R13이 ATG로 변형된 것에서 발현된 재조합 N-말단 절단 MAAP는 웨스턴 블롯에서 더 낮은 분자량에서 탐지되었다.
우리는 그것의 C-말단에 강화 녹색 형광 단백질(enhanced green fluorescent protein, eGFP)이 융합된 MAAP(MAAP-GFP)를 만들었고 그것을 wt-AAV2 게놈에서 복제했다. 그것은 VP1/2 단백질의 기능적 손상을 일으켰다. 이것은 cap ORF 프레임에 eGFP를 삽입했기 때문이다. 그러나, AAP 및 VP3 단백질을 인코딩하는 효능은 보존된 것 같다. 비슷하게, Rep 단백질 발현과 p40 프로모터의 제어도 손상되지 않은 것 같다. 따라서, eGFP로부터 유래되어 탐지되는 형광은 바이러스 맥락에서 MAAP 단백질의 생산 수준을 반영할 것이다.
wt-AAV2 게놈으로부터 발현된 MAAP-GFP 융합 단백질은 아데노바이러스 5 도움 유전자를 인코딩하는 플라스미드와 함께 공-감염 시켰을 때 30872 강도의 중간 형광값을 가졌다(도 1). MAAP-L1 CTG 시작 코돈을 CGG 코돈으로 돌연변이 시키자 형광강도가 17524가 되었다. 도 1을 보라. 그것은 우리가 MAAP-Q39 또는 MAAP-S47 또는 동시에 세 개의 위치 MAAP-S33,-39 및 -47 모두에 종결 코돈을 도입시켰을 때 탐지된 강도 수준과 비슷하다. 우리가 MAAP-Q9 또는 MAAP-S33 위치에 종결 코돈을 도입했을 때, 형광 강도값은 15896 및 15021로 각각 떨어졌다. 이 발현값은 배경값보다는 여전히 높으며, 리딩 프레임에 종결 코돈이 도입되었을 때 MAAP 단백질의 다른 위치에서 잠재적인 번역의 시작이 일어날 수 있다는 암시를 준다. 대안적으로, 이 수준의 발현값은 삽입된 종결 코돈에도 불구하고 잠재적으로 읽을 수 있다는 것을 암시할지도 모른다. 우리는 그러나, 이 새로운 종결 코돈을 삽입했을 때 웨스턴블롯을 사용한 모든 실험에서 아무런 MAAP 생산을 탐지할 수 없었음에 주목한다.
아데노 바이러스 도움 플라스미드가 없을 때, MAAP-GFP의 생산 수준이 배경값 위에서 탐지된다. 이것은 HEK293T 세포주가 아데노 바이러스 E1 유전자의 한 복사본을 포함하기 때문일 것이다. 이 E1 유전자가 AAV 프로모터에 대한 trans- 활성자로서 작용할 수 있다.
우리의 실험을 통해 MAAP-L1 (CTG)가 야생형 MAAP의 시작 코돈임을 확인했다. L1으로부터의 MAAP 번역이 손상되었을 때, MAAP-GFP 생산 결과가 보여주듯이 MAAP-L1의 하위에서 MAAP-R13 위치(AGG), MAAP-T14 위치(ACG) 또는 MAAP 단백질의 더 하위에 있는 잠재적인 시작 코돈이 N-말단 절단형 MAAP의 번역에 쓰일 수 있다.
MAAP 생산의 동력학
MAAP는 cap 유전자로부터 발현되는데, 아마도 VP2/3 발현을 이끄는 p40 전사의 스플라이스(spliced) 형태로부터일 것이다. 리보솜 스캔 장치를 통해, 우리는 번역이 MAAP 단백질의 CTG 시작 코돈에서 시작되고(VP1 orf에 +1 프레임 이동), ACG 시작 코돈에서 시작하는 VP2 번역으로 이어지며 CTG 코돈에서 (VP1 orf에 +1 프레임 이동) AAP 발현으로 계속되어 ATG 코돈에서 시작되는 VP3 단백질로 성취됨을 발견했다.
동력학(kinetics) 실험에서, 우리는 293T 세포에서 WT AAV2를 생산하는 동안 시간에 따른 Rep78/52, VPs, AAP 및 MAAP 단백질의 발현을 추적했다. 트랜스펙션 6.5 시간 후에, 우리는 VP3 및 Rep52가 아주 약하게 발현됨을 감지했다. 트랜스펙션 12 시간 후, 우리는 AAP를 제외한 모든 AAV 단백질을 감지했다. 트랜스펙션 13 시간 후, 우리는 AAP를 감지했다. 도 2를 보라. 그후로, 점차적으로 단백질 발현이 증가하였고, 감염 후 21시간에 정점에 달했다. AAV를 생산하는 동안, 우리는 Rep78 및 52 동형체(isoform)만 탐지할 수 있었고, Rep 68 및 40는 탐지하지 못했다.
생산 과정에서, 우리는 또한 감염 후 21시간 뒤에 캡시드 분해가 시작됨을 관찰했다. 이것은 VP의 C-말단부를 표적으로 하는 Progen B1 항체를 사용한 웨스턴 블롯 상의 VP3 단백질 밴드보다 낮게 나타났다. 도 2를 보라.
AAP C-말단 구역은 5-염기 아미노산 풍부("BR") 클러스터로 구성되는 핵 내 및 핵소체 내 자리잡기 신호를 나타낸다. 이 BR 클러스터 중 임의의 4개의 조합이 그 단백질을 핵과 핵소체로 보낸다.
유사하게, 우리는 MAAP C-말단 끝이 세 개의 BR 클러스터를 나타냄을 발견했다: KKIR (BR1), RRKR (BR2), 및 RNLLRRLREKRGR (BR3). 이것은 서열목록 2의 잔기 78-82, 94-97 및 107-119에 각각 나타난다. 우리는 그래서 MAAP 단백질의 C-말단부가 핵 내 자리잡기 신호를 포함할 것이라고 결론 내렸다.
야생형 AAV에 미치는 MAAP의 영향
MAAP 불활성화 및 AAV 생산에 미치는 영향
시작 코돈을 돌연변이 시키거나 MAAP 코딩 서열에서의 다양한 위치에 종결 코돈을 도입하는 MAAP의 변형은 트랜스펙션 24시간 후의 AAV 생산을 줄였다. 도 3을 보라. AAV 생산의 이러한 감소는 MAAP-L1 (CTG)를 MAAP-R1 (CGG)로 바꿨을 때 통계적으로 유의한 차이가 있었고, wt-AAV2에서 관찰된 것에 비해 겨우 21%까지로 생산이 줄었다. MAAP-Q9의 위치에 종결 코돈을 도입했을 때, 생산성은 wt-AAV2에서 관찰된 것의 고작 39%까지 떨어졌다. 우리는 또한 MAAP -W103 또는 MAAP -W105가 각각 종결 코돈으로 돌연변이된 AAV 돌연변이체에서 야생형 생산력에 비해 각각 15% 및 20%까지 줄어든 것을 발견했다. MAAP -S33-39-S47, MAAP -S65의 위치에 종결 코돈을 도입한 것은 AAV 역가가 wt-AAV2에서 관찰된 값과 비교하여 76% 및 61% 수준까지 떨어지는 경향이었다. 아미노산 잔기 번호 90, 100, 106 또는 110의 위치에 종결 코돈을 도입한 것은 야생형 유전자에서 관찰된 결과와 비교했을 때 뚜렷한 차이의 경향을 보이지 않았다. 도 3을 보라. 이와 같이, 트랜스펙션 24시간 후 MAAP 단백질의 발현은 MAAP 유전자가 불활성화된 AAV 돌연변이체에 비해 복제의 장점을 제공한다. 우리의 결과는 오젠(Ogden)(2019)과는 다른데, 그는 MAAP 돌연변이체에서 역가 감소를 나타내지 않음을 관찰했다. 그러나, 그들은 MAAP 돌연변이체가 기능성 MAAP 폴리펩타이드로 trans 에서 보완되지 않으면 경쟁력이 없다(out-competed)는 것을 관찰했다. 이러한 결론은 트랜스펙션 24시간 후 wt-AAV2에 MAAP가 복제 우위를 제공하는 우리의 관찰 결과와 들어맞는다.
바이러스 게놈의 양
바이러스 게놈의 양(vg) / mL
Rep 24h A B C D E F G H I J K L
I 6.49 1.38 2.55 3.53 4.93 3.99 6.18 5.98 0.99 1.28 5.87 6.62
II - 0.21 0.39 0.54 0.76 0.61 0.95 0.92 0.15 0.20 0.90 1.02
n 7 4 4 4 7 3 4 7 3 3 4 4
KEY: 열 A = wt-AAV2. B = MAAP-L1 (CTG)→ MAAP R1 (CGG). C = MAAP-Q9 → stop. D = MAAP-S39 → stop. E = MAAP-S33-S39-S47 → stop. F = MAAP-S65 → stops. G = MAAP-E90 → stop. H = MAAP-L100 → stop. I = MAAP-W103 → stop. J = MAAP-W105→ stop. K = MAAP-L106 →stop. L = MAAP-L110 → stop.

행 I = 평균 (vg.mL-1) x 1010. 열 II =wt-AAV 대비 차이(배수). n = 시료 수
72시간 째에는 MAAP-W103 및 MAAP-W105가 종결 코돈으로 치환된 MAAP 돌연변이체들에서만 역가가 감소해서 각각 wt-AAV2 대비 0.75 및 0.76-배였다. 도 4를 보라. 그러나, 놀랍게도, 우리는 다른 모든 우리의 실험 MAAP 돌연변이체에서 AAV 역가가 줄어들기보다 개선되었음을 발견했다. AAV 역가의 이 놀라운 증가는 MAAP-S33-S39-S47, MAAP-E90, MAAP-L100, MAAP-L106가 종결 코돈으로 치환된 돌연변이체에서 유의적이었고, 역가가 wt-AAV2 대비 각각 3.50, 4.62, 3.67, 4.08-배까지 늘어났다. 이와 같이, 생산 시간(즉, 트랜스펙션된 세포가 바이러스를 생산하도록 배양되는 시간)이 24시간을 초과하여 늘어나면 MAAP 단백질의 불활성화가 야생형 AAV에 비해 더 높은 AAV 역가를 만드는 것이다.
바이러스 게놈의 양
바이러스 게놈의 양 (vg) / mL
Rep 72h A B C D E F G H I J K L
I 6.19 7.35 10.3 15.5 21.7 17.4 28.6 22.7 4.62 4.74 25.3 20.3
II - 1.19 1.67 2.51 3.50 2.82 4.62 3.67 0.75 0.76 4.08 3.28
n 7 4 4 4 7 3 4 7 3 3 4 4
KEY: 열 A = wt-AAV2. 열 B = MAAP-L1 (CTG) → MAAP R1 (CGG). 열 C = MAAP-Q9 → stop. 열 D = MAAP-S39 → stop. 열 E = MAAP-S33-S39-S47 → stop. 열 F = MAAP-S65 → stop
열 G = MAAP-E90 → stop. 열 H = MAAP-L100 → stop. 열 I = MAAP-W103 → stop. 열 J = MAAP-W105→ stop. 열 K = MAAP-L106 → stop. 열 L = MAAP-L110 → stop.

행 I = 평균 (vg.mL-1) x 1010. 행 II = wt-AAV2. 대비 배수. n = 시료 수.
그 다음, 우리는 wt-AAV 생산 또는 MAAP-S33-S39-S47가 종결 코돈으로 돌연변이된 AAV 돌연변이체에 대한 MAAP 과-생산의 효과를 연구했다. 트랜스펙션 24시간 후에 wt-AAV2로 추가적인 MAAP를 발현시켰고, wt-AAV2에 비해 AAV 역가가 0.67배로 줄어든 것을 관찰했다. 도 5 왼쪽을 보라. 72시간 째에는 wt-AAV2에 비해 0.36배로의 감소가 나타났다. 도 6 오른쪽을 보라. 우리가 wt-AAV 기준 세포에 MAAP 발현 플라스미드와 유사한 크기의 플라스미드를 넣었을 때(MAAP 발현 플라스미드의 첨가에 의한 추가적인 DNA 양 증가를 모방하기 위해) wt-AAV 참고치에 비해 24시간 째에 0.91배로의 감소가, 72시간 째에는 0.96-배로의 감소가 보였다.
바이러스 게놈의 양
바이러스 게놈의 양 (vg) / mL
Rep 24 h A B C D E F
I 2.33 3.86 1.57 2.28 2.12 2.33
II - 1.66 0.67 0.98 0.91 1.00
KEY: 열 A = wt-AAV2. 열 B = MAAP S33-S39-S4 7→ stops. 열 C = wt-AAV1 + MAAP. 열 D = MAAP S33-S39-S47 → stops + MAAP. 열 E = wt-AAV2 + eGFP.
열 F = MAAP S33-S39-S47 → stops + eGFP.

행 I = 평균 (vg.mL-1) x 1010. 행 II = wt-AAV2 대비 배수 차이
바이러스 게놈의 양
바이러스 게놈의 양 (vg) / mL
Rep 72 h A B C D E F
I 3.77 22.2 1.36 4.61 3.63 14.3
II - 5.89 0.36 1.22 0.96 3.80
KEY: 열 A = wt-AAV2. 열 B = MAAP S33-S39-S47→ stops. 열 C = wt-AAV1 + MAAP. 열 D = MAAP S33-S39-S47 → stops + MAAP. 열 E = wt-AAV2 + eGFP. 열 F = MAAP S33-S39-S47 → stops + eGFP.

행 I = 평균 (vg.mL-1) x 1010. 행 II = wt-AAV2 대비 차이 배수.
MAAP-S33-S39-S47가 종결 코돈으로 돌연변이된 것에서 AAV를 생산할 때, 우리는 vg 역가가 24시간에는 wt-AAV2 대비 1.66배 증가하고 72시간에는 5.89배로 증가함을 관찰했다.
MAAP-S33-S39-S47가 종결 코돈으로 돌연변이된 것에 MAAP가 추가된 AAV는 24시간째에는 vg 역가가 wt-AAV2와 비슷했고, 72시간째에는 1.22-배로 늘어나는 결과를 보였다. MAAP-S33-S39-S47가 종결 코돈으로 돌연변이 되고 MAAP 발현 플라스미드와 유사한 크기의 플라스미드로 보충되었을 때, 24시에는 역가가 wt-AAV2 참고치와 같았고, 72시에는 3.8배 높았다.
요약하면, 우리는, 배양 기간이 24시간 보다 길어지면 놀랍게도 MAAP 단백질이 과발현될 때 바이러스 게놈 역가가 줄어드는 결과를 보이는 것을 발견했다. 이것은 MAAP가 다른 AAV 단백질, 아마도 AAP 또는 VP 단백질들에 대해 화학양론적인(stoichiometrics) 양으로 필요함을 암시한다.
오염 DNA의 포장
다음으로, 우리는 AAV 생산 플라스미드에서 유래된 오염 DNA를 AAV 캡시드 내로 포장하는 것에 대한 MAAP의 영향을 연구했다. 우리는 우선 ddPCR로 AAV 캡시드 안에 싸인 카나마이신-저항성 유전자의 값을 연구했다. 카나마이신-저항성 유전자는 아데노 바이러스 혈청형 5 도움 플라스미드 및 AAV 게놈을 인코딩하는 플라스미드 모두에 존재한다. wt-AAV을 생산하는 동안, 트랜스펙션 24시간 후에, 우리는 우리는 포장된 wt-AAV2 게놈 대비 3.77%의 카나마이신 저항성 유전자 오염물이 포장된 것을 측정했고, 72시간째에는 이 퍼센티지가 3.5%였다. 도 7 및 도 8을 보라.
포장된 카나마이신 저항성 유전자 vs AAV 게놈
24시간째에 포장된 AAV 게놈 대비 카나마이신 저항성 유전자의 %
A B C D E F G H I J K L
I 3.77 38.88 6.47 18.55 3.47 7.20 6.45 4.59 33.10 40.34 15.19 7.29
II - 10.31 1.72 4.92 0.92 1.91 1.71 1.22 8.78 10.70 4.03 1.93
n 6 3 3 3 6 3 3 6 3 3 3 3
KEY: 열 A = wt-AAV2. 열 B = MAAP-L1 (CTG) → MAAP R1 (CGG). 열 C = MAAP-Q9 → stop. 열 D = MAAP-S39 → stop. 열 E = MAAP-S33-S39-S47 → stop. 열 F = MAAP-S65 → stops. 열 G = MAAP-E90 → stop. 열 H = MAAP-L100 → stop. 열 I = MAAP-W103 → stop.
열 J = MAAP-W105 →stop. 열 K = MAAP-L106 → stop. 열 L = MAAP-L110 → stop.

행 I = 포장된 AAV 게놈 대비 카나마이신 저항성 유전자의 %. 행 II = wt-AAV2 대비 배수 차이 n = 시료 수
포장된 카나마이신 저항성 유전자 vs AAV 게놈
72시간째에 포장된 AAV 게놈 대비 카나마이신 저항성 유전자의 %
A B C D E F G H I J K L
I 3.50 37.21 9.25 20.40 4.93 5.82 5.82 5.27 36.93 47.12 16.27 8.55
II - 10.63 2.64 5.83 1.41 1.66 1.66 1.51 10.55 13.46 4.65 2.44
n 6 3 3 3 6 3 3 6 3 3 3 3
KEY: 열 A = wt-AAV2. 열 B = MAAP-L1 (CTG) → MAAP R1 (CGG). 열 C = MAAP-Q9 → stop. 열 D = MAAP-S39 → stop. 열 E = MAAP-S33-S39-S47 → stop. 열 F = MAAP-S65 → stops. 열 G = MAAP-E90 → stop. 열 H = MAAP-L100 → stop. 열 I = MAAP-W103 → stop. 열 J = MAAP-W105
Figure pct00001
→stop. 열 K = MAAP-L106 → stop. 열 L = MAAP-L110 → stop.

행 I = 포장된 AAV 게놈 대비 카나마이신 저항성 유전자의 %. 행 II = wt-AAV2 대비 배수 차이 n = 시료 수
포장된 카나마이신 저항성 유전자 vs AAV 게놈
24시간째에 포장된 AAV 게놈 대비 카나마이신 저항성 유전자의 %
A B C D E F
I 4.05 3.11 7.08 7.34 5.43 5.09
II - 0.77 1.75 1.81 1.34 1.26
KEY: 열 A = wt-AAV2. 열 B = MAAP S33-S39-S47→ stops. 열 C = wt-AAV2 + MAAP. 열 D = MAAP S33-S39-S47 → stops + MAAP. 열 E = wt-AAVS + eGFP. 열 F = MAAP S33-39-S47 → stops + eGFP.

행 I = 포장된 AAV 게놈 대비 카나마이신 저항성 유전자의 %. 행 II = wt-AAV2 대비 배수 차이
포장된 카나마이신 저항성 유전자 vs AAV 게놈
72시간째에 포장된 AAV 게놈 대비 카나마이신 저항성 유전자의 %
A B C D E F
I 5.78 6.10 10.15 8.43 5.22 5.86
II - 1.06 1.76 1.46 0.90 1.01
KEY: 열 A = wt-AAV2. 열 B = MAAP S33-S39-S47→ stops. 열 C = wt-AAV2 + MAAP. 열 D = MAAP S33-S39-S47 → stops + MAAP. 열 E = wt-AAVS + eGFP. 열 F = MAAP S33-39-S47 → stops + eGFP.

행 I = 포장된 AAV 게놈 대비 카나마이신 저항성 유전자의 %. 행 II = wt-AAV2 대비 배수 차이
포장된 카나마이신 유전자 수준은 MAAP-L1 CTG 시작 코돈이 CGG로 변형되었을 때, 또는 MAAP-S39, MAAP-W103 또는 MAAP-W105 및 MAAP-L106이 종결 코돈으로 변형되었을 때 상당히 증가해서 24시간 째에 wt-AAV와 비교해 각각 10.31, 4.92, 8.78, 10.70 및 4.03-배로 늘었다. 도 7을 보라. 이것은 72시간 째에는 wt-AAV 대비 10.63, 5.83, 10.55, 13.46 및 4.65-배로 늘었다. 도 8을 보라. 가장 높은 오염 수준은 MAAP-W105가 종결 코돈으로 돌연변이된 것에서 관찰되었는데, wt-AAV 대비 13.46 배까지 증가했고, AAV 게놈 대비 포장된 카나마이신 저항성 유전자가 47.12 %까지 나타났다. 도 8을 보라.
MAAP-S33-S39-S47가 종결 코돈으로 돌연변이된 AAV와 MAAP-S65, MAAP-E90, MAAP-L100 및 MAAP-L110가 wt-AAV2 대비 24시간 째와 72 시간 째에 모두 카나마이신 유전자 포장이 높은 수준의 경향을 보였다.
MAAP가 wt-AAV 생산에, 또는 MAAP-S33-S39-S47가 종결 코돈으로 돌연변이된 AAV의 생산에 추가적으로 더해진 경우, 우리는 카나마이신 저항성 유전자 포장이 MAAP 단백질 발현이 추가되지 않은 wt-AAV에 비해 증가하는 것을 관찰했다. 도 9 및 도 10을 보라.
항생제 저항성 유전자 오염이 아데노 바이러스 도움 플라스미드로부터 또는 wt-AAV2 인코딩 플라스미드로부터 중 어느 쪽이 더 우세한지 연구하기 위해, 우리는 AAV 생산을 위해 필요한 아데노 바이러스 5 도우미 기능을 인코딩하는 플라스미드 상에 존재하는 아데노 바이러스 5 E4 유전자로부터 유래하는 오염 수준을 측정했다. MAAP-L1 CTG 시작 코돈이 CGG로 변형되었을 때, 우리는 아데노 바이러스 5 E4 유전자의 포장만이 24시간 째에 6.37배로 통계적으로 유의하게 증가함을 관찰했다. 도 11을 보라. 72시간 째에는, wt-AAV2 대비 통계적으로 유의한 차이가 감지되지 않았다. 그러나, 72시간 째에, 아데노 바이러스 5 E4 유전자 포장이 줄어드는 경향이 관찰되었고, 특히 MAAP-S33-S39-S47, MAAP-S65, MAAP-E90, MAAP-L100 또는 MAAP-L110의 위치에 종결 코돈이 도입된 돌연변이에서 각각 0.43, 0.32, 0.53, 0.31, 0.44배로 줄었다. 도 12를 보라.
포장된 Ad5 E4 유전자 vs AAV 게놈
24시간 째에 포장된 Ad5 E4 유전자의 AAV 게놈 대비 %
A B C D E F G H I J K L
I 1.23 5.09 1.14 1.12 1.90 3.21 2.00 1.47 5.23 7.83 1.22 1.45
II - 4.13 0.92 0.91 1.55 2.61 1.63 1.19 4.25 6.37 0.99 1.18
n 6 3 3 3 6 3 3 6 3 3 3 3
KEY: 열 A = wt-AAV2. 열 B = MAAP-L1 (CTG) → MAAP R1 (CGG). 열 C = MAAP-Q9 → stop. 열 D = MAAP-S39 → stop. 열 E = MAAP-S33-S39-S47 → stop. 열 F = MAAP-S65 → stops. 열 G = MAAP-E90 → stop. 열 H = MAAP-L100 → stop. 열 I = MAAP-W103 → stop.
열 J = MAAP-W105 →stop. 열 K = MAAP-L106 → stop. 열 L = MAAP-L110 → stop.

행 I = 포장된 Ad5 E4 유전자의 AAV 게놈 대비 % . Row II = wt-AAV2 대비 배수 차이.
n = 시료 수
포장된 Ad5 E4 유전자 vs AAV 게놈
72시간 째에 포장된 Ad5 E4 유전자의 AAV 게놈 대비 %
A B C D E F G H I J K L
I 0.21 0.47 0.14 0.15 0.09 0.07 0.11 0.06 0.22 0.47 0.39 0.09
II - 2.22 0.68 0.73 0.43 0.32 0.53 0.31 1.03 2.23 1.88 0.44
n 6 3 3 3 6 3 3 6 3 3 3 3
KEY: 열 A = wt-AAV2. 열 B = MAAP-L1 (CTG) → MAAP R1 (CGG). 열 C = MAAP-Q9 → stop. 열 D = MAAP-S39 → stop. 열 E = MAAP-S33-S39-S47 → stop. 열 F = MAAP-S65 → stops. 열 G = MAAP-E90 → stop. 열 H = MAAP-L100 → stop. 열 I = MAAP-W103 → stop.
열 J = MAAP-W105 →stop. 열 K = MAAP-L106 → stop. 열 L = MAAP-L110 → stop.

행 I = 포장된 Ad5 E4 유전자의 AAV 게놈 대비 % . Row II = wt-AAV2 대비 배수 차이.
n = 시료 수
이러한 결과는 MAAP 발현에 장애가 생겼을 때, 또는 AAV 게놈을 인코딩하는 동일한 플라스미드 골격으로부터 오염 DNA가 유래할 때 AAV 캡시드 내에 오염 DNA가 더 높은 수준으로 포장됨을 암시한다. 그러나 아데노 바이러스 도움 플라스미드로부터 유래된 포장된 DNA는 wt-AAV에 비해 줄어드는데, 특히 MAAP-S33-S39-S47, MAAP-S65, MAAP-E90, MAAP-L100 또는 MAAP-L110가 종결 코돈으로 돌연변이된 것에서 그렇다. 종합하면, 우리의 결과는 MAAP가 AAV 게놈의 측면에 존재하지만 ITR 골격의 측면에는 존재하지 않는 ITR D 서열과는 독립적으로 ITR-매개 DNA 포장과 연관 있을 수 있다는 것을 보여준다.
AAV 캡시드에 대한 MAAP의 영향
야생형 AAV 캡시드는 VP1, VP2 및 VP3 단백질로 구성되며, 상대적인 비율이 약 1:1:10이다. 그러나, 이런 VP의 특정 분해 산물이 293 및 293T 세포에서 트랜스펙션 후 21시간부터 탐지되기 시작한다. 도 2를 보라. 예를 들어, AAV 혈청형 2에서, VP-1, -2 및 -3은 각각 약 87, 73, 및 61 kDa이다. 우리는 이 세 VP의 C-말단 각각을 표적으로 하는 단클론 항체를 사용하여 VP의 분해를 추적했다 (상기 항체는 Wobus CE et al., Monoclonal Antibodies against the Adeno-Associated Virus Type 2 (AAV-2) Capsid: Epitope Mapping and Identification of Capsid Domains Involved in AAV-2-Cell Interaction and Neutralization of AAV-2 Infection, 74 J. Virol. 9281 (2000).에 개시되었다). 이를 이용해서, 우리는 트랜스펙션 후 21시간 이내에 VP1, VP2 및 VP3가 분해되는 것을 관찰했다. 이것들은 도 2의 32 kDa (도 2 줄표; 도 13; 도 14), 18 kDa (도 2 별표; 도 13; 도 14), 및 14 kDa (도 2 샵표; 도 13; 도 14)위치에서 관찰된다.
흥미롭게도, MAAP-L110이 종결 코돈으로 변경된 변형체를 제외한 MAAP 발현이 불활성화된 모든 구성체에서, 우리는 이 32 kDa, 18 kDa 및 14 kDa 폴리펩타이드가 사라진 것을 관찰했다 (도 13; 도 14). 우리는 또한 VP1 및 VP2 단백질의 양이 늘어난 것을 관찰했다. 이는 분해 산물이 특히 VP1 및 VP2의 분해로부터 유래되었음을 암시한다(도 13; 도 14). 그러나, MAAP-L110이 종결 코돈으로 돌연변이된 변형체는 여전히 특이적인 18 kDa AAV 캡시드 분해 산물을 보였는데, 그렇지만 wt-AAV2에 비해서는 낮은 강도였다. 이는 MAAP가 발현될 때, 특정 단백질 분해 활성이 C-말단부, 더욱 구체적으로 염기성 아미노산 풍부 "BR3" 도메인(서열목록 2의 아미노산 잔기 107-119)과 연관되어 나타남을 암시하는데, 여전히 BR3 도메인을 인코딩하는 MAAP-L110의 종결 코돈으로의 돌연변이체에서만 VP 단백질 분해 단편을 보였기 때문이다. MAAP-S33-S39-S47가 종결 코돈으로 치환된 AAV 돌연변이체에 보충적으로 MAAP가 발현되었을 때, AAV 캡시드에 대한 단백질 분해 활성이 복구되었다. 이 데이터는 단백질 분해 도메인을 제거하도록 MAAP-제거 또는 MAAP-절단된 게놈으로부터 만들어지는 바이러스 제제가 야생형 게놈으로부터 만들어지는 바이러스와 생체적으로 다르다는 것을 보여준다. 여기서 우리의 발견은 AAV의 수율을 증가시키고, 결과적인 AAV의 안정성까지 모두 증가시키는 길을 제공한다.
우리는 72시간 째에, 총 AAV 캡시드 대비 AAV 게놈을 포함하는 캡시드의 비율을 분석했고, 속이 찬 캡시드(원하는 DNA를 탑재) 대비 속이 빈 캡시드(원하는 DNA 결여)의 비율을 얻어냈다. 야생형 AAV2는 AAV 게놈을 포함하는 캡시드를 6.91% 보였다.
AAV 게놈을 포함하는 총 캡시드
AAV 게놈을 포함하는 총 캡시드의 퍼센트
I II III IV V VI VII VIII IX X XI XII
% 6.91 3.39 4.60 5.99 11.80 13.07 8.24 8.76 4.52 3.71 7.04 7.04
vs wt = 0.49 0.67 0.87 1.71 1.89 1.19 1.27 0.65 0.54 1.02 1.02
열 번호 설명:
I = wt-AAV2
II = 시작코돈(CTG)(전장 폴리펩타이드 상의 L1)이 CGG로 돌연변이된 MAAP 유전자(R1)
III= 전장 폴리펩타이드 상의 Q9이 종결 코돈으로 점 돌연변이된 MAAP 유전자
IV = S39가 종결 코돈으로 점 돌연변이된 MAAP 유전자
V = S33, S39 및 S47 가 모두 종결 코돈으로 점 돌연변이된 MAAP 유전자
VI 내지 XII = S65, E90, L100, L103, L105, L106 또는 L110 (각각)이 종결 코돈으로 점 돌연변이된 MAAP 유전자
MAAP-L1 CTG 시작 코돈이 CGG로 변형되었을 때, 또는 AAV MAAP-Q9, MAAP-S39, MAAP-W103 또는 MAAP-W105가 종결 코돈으로 치환되었을 때, 게놈을 함유하는 캡시드의 감소가 관찰되었다. 거의 전장 MAAP를 인코딩하는, AAV MAAP-L106 또는 MAAP-L110가 종결 코돈으로 돌연변이된 것은 wt-AAV2와 비교하여 AAV 게놈을 포함하는 AAV 캡시드의 수준이 비슷했다. AAV MAAP-S33-S39-S47가 종결 코돈으로 대체되었을 때, 또는 MAAP-S65, MAAP-E90 및 MAAP-L100가 종결 코돈으로 돌연변이되었을 때, 우리는 AAV 게놈을 포함하는 캡시드가 wt-AAV2에 비해 늘어나는 것을 관찰했다. 우리는 더 상세한 데이터를 도 15에 그래프로 그렸다.
AAV 게놈을 포함하는 캡시드
AAV 게놈을 포함하는 캡시드의 %
A B C D E F G H I J K L
I 6.91 3.39 4.60 5.99 11.80 13.07 8.24 8.76 4.52 3.71 7.04 7.04
II - 0.49 0.67 0.87 1.71 1.89 1.19 1.27 0.65 0.54 1.02 1.02
KEY: 열 A = wt-AAV2. 열 B = MAAP-L1 (CTG) → MAAP R1 (CGG). 열 C = MAAP-Q9 → stop. 열 D = MAAP-S39 → stop. 열 E = MAAP-S33-S39-S47 → stop. 열 F = MAAP-S65 → stops. 열 G = MAAP-E90 → stop. 열 H = MAAP-L100 → stop. 열 I = MAAP-W103 → stop. 열 J = MAAP-W105→ stop. 열 K = MAAP-L106 → stop. 열 L = MAAP-L110 → stop.

행 I = %. 행 II = wt-AAV2 대비 차이 배수. n = 시료 수
바이러스 수율 및 순도에 미치는 MAAP 절단의 영향
MAAP 변형체 I II III IV V VI VII VIII IX X XI XII
Rep 24 h
평균 (vg/mL) * 1010 6.49 1.38 2.55 3.53 4.93 3.99 6.18 5.98 0.99 1.28 5.87 6.62
wt-AAV2 대비 차이 배수 - 0.21 0.39 0.54 0.76 0.61 0.95 0.92 0.15 0.20 0.90 1.02
N 14 8 8 8 14 6 8 14 6 6 8 8
108
Rep 72 h
평균 (vg/mL) * 1010 6.19 7.35 10.3 15.5 21.7 17.4 28.6 22.7 4.62 4.74 25.3 20.3
wt-AAV2 대비 차이 배수 - 1.19 1.67 2.51 3.50 2.82 4.62 3.67 0.75 0.76 4.08 3.28
N 14 8 8 8 14 6 7 14 6 6 8 8
107
% Kan 24 h
포장된 AAV 게놈 대비 kan의 % 3.77 38.9 6.47 18.6 3.47 7.20 6.45 4.59 33.1 40.3 15.2 7.29
wt-AAV2 대비 차이 배수 - 10.3 1.72 4.92 0.92 1.91 1.71 1.22 8.78 10.7 4.03 1.93
N 12 6 6 6 12 6 6 12 6 6 6 6
90
% Kan 72 h
포장된 AAV 게놈 대비 kan의 % 3.50 37.2 9.25 20.4 4.93 5.82 5.82 5.27 36.9 47.1 16.3 8.55
wt-AAV2 대비 차이 배수 - 10.6 2.64 5.83 1.41 1.66 1.66 1.51 10.6 13.5 4.65 2.44
N 12 6 6 6 12 6 5 12 6 6 6 6
89
% Ad5 E4 24 h
포장된 AAV 게놈 대비 Ad5 E4 유전자 % 1.23 5.09 1.14 1.12 1.90 3.21 2.00 1.47 5.23 7.83 1.22 1.45
wt-AAV2 대비 차이 배수 - 4.13 0.92 0.91 1.55 2.61 1.63 1.19 4.25 6.37 0.99 1.18
N 12 6 6 6 12 6 6 12 6 6 6 6
90
% Ad5 E4 72 h
포장된 AAV 게놈 대비 Ad5 E4 유전자 % 0.21 0.47 0.14 0.15 0.09 0.07 0.11 0.06 0.22 0.47 0.39 0.09
wt-AAV2 대비 차이 배수 - 2.22 0.68 0.73 0.43 0.32 0.53 0.31 1.03 2.23 1.88 0.44
N 12 6 6 6 12 6 5 12 6 6 6 6
89
AAV 게놈을 포함하는 캡시드의 %
% 7.20 3.13 3.77 4.56 9.45   8.00 6.83     5.80 5.99
wt-AAV2 대비 차이 배수 - 0.43 0.52 0.63 1.31   1.11 0.95     0.81 0.83
573.00
1719
열 번호 설명:
I = wt-AAV2
II = 시작 코돈 (CTG) (전장 폴리펩타이드 상의 L1)이 CGG로 돌연변이된(R1) MAAP 유전자
III= 전장 폴리펩타이드 상의 Q9이 종결 코돈으로 점 돌연변이된 MAAP 유전자
IV = S39가 종결 코돈으로 점 돌연변이된 MAAP 유전자
V = S33, S39 및 S47가 모두 종결 코돈으로 점 돌연변이된 MAAP 유전자
VI 내지 XII = S65, E90, L100, L103, L105, L106 또는 L110 (각각)이 종결 코돈으로 점 돌연변이된 MAAP 유전자

N-값은 여기서 측정된 모든 시료의 수를 나타내며 상기 실제 독립적인 실험의 수는 고려하지 않았다.
결론
MAAP 발현은 감염 24 시간 후의 바이러스 복제를 증진시킨다. 그러나 감염 시간이 길어지면, 우리는 놀랍게도 MAAP 발현이 바이러스 복제를 악화시킨다는 것을 발견했다. 우리는 감염 기간이 24시간을 초과하면, 야생형 MAAP 발현을 불활성화 시키는 것이 야생형 게놈을 사용하여 생산하는 것에 비해 더 높은 수율의 바이러스를 생산하는 것을 밝혀냈다.
우리는 또한 놀랍게도 MAAP가 바이러스 캡시드 단백질의 분해에 영향을 끼치는 것 같음을 발견했다. MAAP는 직접적인 단백질 분해 활성을 가졌을 것이다. 또는, MAAP가 바이러스 캡시드 단백질 분해를 억제하는 다른 단백질, 또는 바이러스 또는 숙주 세포의 세포 내 게놈과 상호 작용하는지도 모른다. 또는, MAAP가 AAV 캡시드 단백질에 대한 세포의 단백질 분해 또는 단백질 분해 활성에 영향을 끼칠 수도 있다.
우리는 MAAP를 제거하면, 또는 그것의 C-말단을 잘라내면 야생형 게놈으로부터 만들어지는 바이러스보다 수율이 더 높고 분해에 더 저항하는 바이러스 제제를 만든다는 것을 증명했다.
또한 우리는 MAAP의 발현을 손상시키면 온전한 비리온의 퍼센티지를 증가시킴을 발견했다. 이와 같이 우리는 생산된 바이러스의 품질을 높이는 길을 제공한다. 이것은 인간 유전자 치료 벡터를 생산할 때 아주 중요하다.
우리는 야생형 MAAP 발현을 불활성화 시키면 표적 세포로 더 잘 전이될 수 있는 바이러스를 생산할 것이라고 예상한다.
여기서 주어진 우리의 발견을 보고, 당업자는 쉽게 특정 변형을 가할 수 있을 것이다. 예를 들어, 우리는 기본 DNA에 점 돌연변이를 삽입함으로써 전장 MAAP 의 번역을 잘라냈다. 당업자라면, 예를 들어, MAAP 발현에 간섭하는 간섭 RNA를 코딩하는 플라스미스와 함께 생산자 세포를 공-감염시킴으로써 같은 결과를 얻을 수 있을 것이다. 또는, 당업자라면 MAAP를 표적으로 하는 단클론 항체로 생산자 세포를 처리할 수도 있을 것이다. 이러한 접근법은 아마 별다른 큰 노력 없이도 바이러스 게놈의 점 돌연변이와 같은 결과에 이르게 할 것이다. 따라서 우리는 본 특허의 법적인 범위가 우리의 여러 실시예에 의해 정의되지 않고, 첨부된 우리의 법적인 청구항에 의해 정해질 것으로 의도한다.
실시예 2
아데노 연관 바이러스(AAV)는 원래 아데노 바이러스 생산의 오염물로서 발견되었다. AAV 혈청형 2는 기준 모델로 여겨지며, 20면체 캡시드에 포장된 4679개 염기의 ssDNA 게놈을 인코딩한다. AAV2 게놈은 머리핀 구조로 된 GC-풍부 DNA 구역, 역 말단 반복부(Inverted Terminal Repeats, ITRs)로 측부를 이룬다. ITR은 AAV 대형 Rep 단백질에 의해 인식되고, AAV 게놈이 복제되게 하지만, 또한 숙주 염색체 DNA로의 그것의 통합은 부위 특이적 방식을 가진다. 소형 Rep 단백질은 게놈 포장에 필수적이다. 캡시드는 집단 수준에서 VP1, VP2 및 VP3 단백질이 약 1:1:10의 비율로 구성되어 있으며, 캡시드 당 총 60 VP이다. 캡시드 조립(Assembly) 및 핵으로의 VP의 전달은, 역시 캡시드 유전자 상에 그러나 VP와 다른 리딩 프레임 상에 인코딩되는 조립 활성화 단백질(Assembly Activating Protein, AAP)에 의해 매개된다. 막 연관 부속 단백질(The Membrane Associated Accessory Protein, MAAP)도 VP1/2 고유 도메인도 코딩하는 구역 내의 cap 유전자 상에 인코딩되고, 세포 및 핵 막과 연관된다(실시예 1). MAAP는 wt-AAV2 복제를 가속화시킨다. 그러나, C-말단 절단 MAAP 변형체는 아데노 도움 플라스미드를 사용한 플라스미드 트랜스펙션 생산에서 AAV2 생산을 증가시켰다. 실시예 1의 결과에 기초하여, 우리는 재조합 (r)AAV 생산에 잠재적인 중요성을 보이는 2개의 AAV2 MAAP 변형체를 확보했고, MAAP-S33-S39-S47가 종결 코돈으로 돌연변이된 것과(삼중 종결(stop) 돌연변이로도 부름) MAAP-L100이 종결 코돈으로 돌연변이된 것이다. 두 돌연변이는 VP1/2 단백질 서열에 영향을 끼치지 않았다. 재조합 AAV 혈청형 1, 2, 5, 6, 8 및 9를 인코딩하는 cap 유전자 상에 유사한 MAAP 돌연변이를 만들었고, 역시 VP1/2 아미노산 서열을 변경하지 않았다. 293T 세포주에서, 바이러스 게놈(vg) 수율이 rAAV5을 제외한 모든 rAAV혈청형에서 개선되었으며, 특히 MAAP-L/S100 변형체를 인코딩하는 cap 유전자에서 그러했다. 이 실험들에서, 가장 극적인 생산 증가는 rAAV6에서 보였다. MAAP 단백질의 변형은 또한 몇몇 rAAV의 분비 프로파일도 바꾸는 결과를 만들었는데, 세포 배양 배지 내에 존재하는 rAAV6 및 8가 기본적으로 세포 안쪽에 보유되는 결과를 만들었다. 몇몇 AAV 혈청형의 MAAP DNA 및 단백질 서열은 거의 모든 AAV cap 유전자에 대해 그것의 VP1 단백질 서열에 영향을 끼치지 않으면서 MAAP-S33-S39-S47 및 MAAP-L/S-100의 돌연변이의 수행이 가능함을 보여준다. MAAP의 구축된 계통수는 AAV 혈청형의 특이적 성질과 연관될 수 있는 AAV의 2개의 주요 분기군(clade)을 보여준다.
재료 및 방법
바이러스 제제
rAAV를 실시예 1에서 설명된 것처럼 만들었다. rAAV 벡터는 다음과 같이 마련했다. 293T 세포(European Collection of Cell Cultures 293T Number: 12022001)를 10% 우태혈청(FBS, Thermo Fisher 10091-148)으로 보강하고 2mM L-글루타민 (Gibco, 25030-024), 그리고 페니실린-스트렙토마이신(Gibco 15070-063)를 보충한 둘베코 변형 이글 배지(DMEM, Gibco 11965084)에서 키웠다. rep-cap 플라스미드, mSeAP-ITR 플라스미드 및 아데노 바이러스 도움 플라스미드(1:1:1 비율, 총 261 ng/cm2)를 6-웰 플레이트의 293T 세포(341000 세포/웰)에 폴리에틸렌이민(PEI) 트랜스펙션시켰다. 또한 플라스미드 팩토리의 pDG2, pDP6, pDP5rs, 및 pDP8 플라스미드를 mSeAP-ITR 플라스미드와 함께 사용했다 (1:1 비율, 총 261 ng/cm2). 무혈청 DMEM 배지에서 PEI Pro (Polyplus Transfection, ref# 115-100)/DNA 질량비를 1:1로 유지했다. 무혈청 배지를 트랜스펙션 24시간 후에 갈았다. 트랜스펙션 72시간 후에 rAAV를 수확했다. 바이러스 게놈 역가 측정 및 rAAV 캡시드 ELISA 시료 확보를 위해, Triton-X-100 완충액 (0.5 % Triton-X-100 (Sigma-Aldrich, ref# X100-1L) 및 1x PBS (Gibco, ref# 18912-014)) 내 2 mM MgCl2 (Merck, ref# E13980) 및 Denarase (50 U/ml, c-Lecta, ref# 20804-5M)를 사용하여 rAAV를 수확했다. 용해 완충액을 배지에 넣고 세포 용해물을 거두기 전에 37℃에서 2시간 동안 세포를 배양했다.
미세방울 디지털 PCR에 의한 rAAV의 정량
미세방울 디지털 PCR (ddPCR) AAV vg 역가를 확인하기 위해서, 바이러스 조생산물을 DNaseI (0,01 U/μl, Invitrogen, ref# 18047-019) 및 Proteinase K (0,1 μg/μl, Roche, ref# 03115879001)로 처리하고 프라이머(CMV-FWD [5' CATGACCTTATGGGACTTTCCT]; CMV-REV [5' CTATCCACGCCCATTGATGTA])와 mSeAP 발현 카세트를 구동하는 CMV 프로모터를 탐지하는 프로브(CMV-PRB [5´-6-FAM/TCGCACCTG/ZEN/ATTGCCCGACATTAT/IABkFQ)를 이용하여 ddPCR 증폭(QX200, Bio-Rad)을 통해 바이러스 역가를 얻었다. 모든 프라이머와 프로브는 인테그레이티드 DNA 테크놀로지스(Integrated DNA Technologies)에서 주문했다. 마스터믹스 생성을 위해 프라이머(900 nM) 및 프로브(250 nM)를 2x ddPCR 프로브용 슈퍼믹스(Supermix for Probes)(dUTP 불포함, Bio-Rad, ref# 1863025) 및 뉴클레아제 프리 워터(nuclease free water)(Thermo Scientific, ref#R0582)에 희석했다.
ELISA
AAV 캡시드 중 rAAV 게놈을 포함하는 캡시드의 비율을 측정하기 위해, 먼저 제조사의 설명서에 따라 AAV 적정 ELISA 키트를 사용하여 바이러스 제제의 500-10,000배의 일련의 희석액에서 ELISA를 했다: rAAV2에 대해서는 Progen, PRAT; rAAV5에 대해서는 Progen PRAAV5; rAAV6에 대해서는 Progen PRAAV6; rAAV8에 대해서는 Progen PRAAV8. 전체 캡시드 대비 관심있는 게놈을 포함하는 캡시드의 비율은 퍼센티지로 나타냈고, 캡시드 역가로 rAAV vg 역가를 나눠서 계산했다.
통계 분석
통계 분석은 그래프패드(GraphPad) 소프트웨어(Prism)를 사용해서 수행했다. 도면의 막대 위에 나타낸 유의값은 **** (p<0.0001), *** (p<0.001), ** (p<0.01), * (p<0.05) 또는 ns (유의적이지 않음)으로 나타냈다.
계통발생 분석
Cap 유전자 서열은 원래 Gao와 공-연구자들이 사용했고, MAAP ORF에 대해 수납번호 AY530553 내지 AY530629가 할당되었다. MAAP ORF 안에서 발견된 CTG 코돈은 wt-AAV2에서 발견되고 wt-AAV2에 대한 MAAP 단백질의 번역을 위해 시작 코돈으로 쓰였다(본 특허 출원의 실시예 1). GenomeNet (https://www.genome.jp/tools/ete/)에서 수행되는 ETE3 v3.1.1의 "구축(build)" 기능을 사용하여 정렬 및 계통 발생 재구성을 했다. 기본 옵션 또는 물탈린(Multalin)을 가지고 MAFFT v6.861b으로 정렬을 했다. 기본 변수의 FastTree v2.1.8을 이용하여 계통수를 구축했다. iTOL을 이용해서 그래픽화했다.
결과
MAAP 변형체가 rAAV 생산성을 증가시킴
우리는 mSeAP 유전자를 인코딩하는 혈청형 1, 2, 5, 6, 8 및 9의 rAAV를 만들었다. cap 유전자로 인코딩되는 각 혈청형의 야생형(wt)-MAAP, 또는 rAAV1, 2, 6, 8 및 9에 대한 MAAP-S33-S39-S47가 cap 유전자 안에서 종결 코돈으로 돌연변이되었다(AAV5에 대해서는 MAAP-S59-65-71에 해당). 이러한 MAAP 돌연변이체들은 여기서 MAAP 삼중 종결체라고 부른다. 끝으로, 우리는 MAAP-L100을 사용하여 rAAV2 및 9의 종결 변이체를, MAAP-S100를 사용하여 rAAV1, 6 및 8의 종결 변이체를 만들었다. 이런 변이체들은 명세서 내에서 MAAP-L/S-100으로 종종 언급될 것이다. MAAP 삼중 종결체 및 MAAP-L/S-100 변이체를 얻기 위해 cap 유전자 안에 도입된 돌연변이는 VP1/2 단백질의 아미노산 서열에는 영향을 끼치지 않았다. 따라서, 이 작업에서 연구된 모든 AAV 혈청형에 대해 VP의 아미노산 서열을 변경시키지 않으면서 MAAP-삼중 종결 돌연변이, 즉 MAAP 서열에서 S33-S39-S47를 코딩하는 코돈의 위치에 (AAV5에 대해서는 이 돌연변이가 S59-65-71에 해당) 종결 코돈이 도입될 수 있다. 마찬가지로, 모든 AAV 혈청형은 VP 아미노산 서열을 변경시키지 않으면서 종결 코돈으로 돌연변이된 각각의 MAAP-L/S-100를 가질 수 있다. AAV5에 대해서는 동등한 돌연변이가 MAAP-S123에 나타난다. AAV hu.28에 대해서는 그것이 MAAP-W100에 해당한다.
mSeAP를 인코딩하는 삼중 종결 rAAV1는 wt-MAAP 대비 바이러스 게놈(vg) 역가가 6.02배까지 늘어났고, 한편 MAAP-S100 변형체는 7.47 배로 증가한 결과를 이뤘다(도 16 및 표 18). rAAV2-mSEAP의 경우, MAAP 삼중 종결체는 바이러스 게놈 역가가 2.3배까지 늘었고, 한편 MAAP-L100 변형체는 wt-MAAP 대비 3.41배의 결과를 가졌다(도 16 및 표 18). rAAV6-mSeAP의 경우, 그 수치가 각각 6.51 및 8.20 배, 그리고 AAV8-mSeAP의 경우 각각 3.60 배 및 2.49 배 증가가 일어났다. AAV9의 경우, MAAP-S33-S39-S47 및 MAAP-L100 변형체는 각각 wt-MAAP 서열 대비 1.21 배 및 1.87 배의 vg 역가 증가를 이뤘다. rAAV5-mSeAP의 경우, 동일한 변형이 vg 역가에 영향을 끼치지 않았다. 결론적으로, 우리는 wt-MAAP 대비 MAAP 삼중 종결체 및 MAAP-L/S-100 변형체를 사용했을 때 rAAV 1, 2, 6, 8 및 9에 대해 rAAV 생산성의 전반적인 증가를 관찰했지만, 5의 경우는 그렇지 않았다.
rAAV 게놈 포장에 대한 MAAP 변형체의 영향
우리는 또한 전체 캡시드 대비 관심 이식 유전자를 포함하는 캡시드(통 바이러스)의 퍼센티지에 대한 상기 설명된 MAAP 돌연변이의 역할을 연구했고, 혈청형 2, 5, 8 바이러스를 인코딩하는 돌연변이체 및 wt-MAAP 간에는 유의적 차이를 발견하지 못했다(도 17 및 표 19). 그러나, rAAV6는 MAAP 변이체가 사용되었을 때 속이 찬 바이러스의 값이 증가하는 것을 보였다(도 17 및 표 19). wt-MAAP을 인코딩하는 cap6 유전자가 쓰였을 때 rAAV 게놈을 포함하는 캡시드의 비율이 평균 67.3%로 측정됐고, MAAP-S33-S39-S47 및 MAAP-S100 변형체를 인코딩하는 cap6 유전자에 대해서는 각각 95.9% 및 118.4%였다.
rAAV의 배출에 미치는 MAAP 변형체의 영향
다음으로 우리는 여러 rAAV 혈청형이 세포 배양 배지로 어떻게 배출되는지를 연구했고, MAAP-삼중 종결체 및 MAAP-L/S100 변형체 모두 세포 내 rAAV와 비교했을 때 세포 배지 안의 rAAV의 양이 눈에 띄게 줄게 되었음을 관찰했다(도 18 및 표 20). rAAV 1 및 6의 경우, 수확 전에 세포 배양 배지에서 발견된 벡터의 비율이 각각 84.51% 및 49.14% 였다. 세포 배양 배지 안에서 발견된 이러한 벡터의 비율은 혈청형 1에서는 각각 MAAP-삼중 종결체에서는 10.45%로 그리고 MAAP-S100 변형체에서는 8.31%로 떨어졌고, AAV6의 경우 각각 7.15% 및 5.49%로 떨어졌다. 유사한 결과가 rAAV8에서도 얻어졌는데, wt-MAAP에 의해서는 세포 배지 내의 rAAV8가 60.38%가 된 것에 비해 세포 배지 내에 존재하는 재조합 AAV가 삼중 종결체는 11.33%이고, MAAP-S100는 7.55%가 되게 했다. 변형된 rAAV2 및 5의 배양 배지에서도 비율의 유의적인 감소가 관찰되었다.
AAV 혈청형 간의 MAAP 계통 발생 분석
인간 및 비인간 영장류 유래의 87개 AAV 혈청형으로 MAAP 계통수가 구축되었다(도 19). VP1 단백질 서열 3을 기초로 하여 앞서 설명된 AAV의 여러 분기군의 cap 유전자로부터 MAAP 서열을 획득했다.
주요 분기는 AAV를 두 개의 다른 대형 모둠과 추가로 AAV5로 대표되는 가지로 나눈다. 분기군 A는 AAV 1, 3, 4, 6, 8, 9, 10로 대표되고, 모두 비-인간 영장류 AAV이다. 분기군 B는 AAV2로 대표되고, 인간으로부터 분리된 AAV 혈청형이다. AAV5는 그 자체로 분리된 가지를 이룬다. 흥미롭게도, MAAP 분기군 A의 구성원인 AAV 1, 6, 8 및 9는 생산된 AAV의 적어도 40%가 세포 배양 배지에서 발견되는 것을특징으로 한다. 한편, 분기군 B의 구성원인 AAV2는 재조합 AAV 게놈을 포함하는 캡시드를, AAV 계통 발생 MAAP 나무의 주요 분리된 가지에 있는 AAV5의 경우에 세포 배양 배지에서 발견되는 것의 20% 미만으로 갖는다. 이와 같이, 분기군 A AAV는 분기군 B 및 AAV5의 구성원에 비해 좀 더 배출하는 것으로 보인다. 그러나, 이런 초기 결과를 확증하기 위해서는 분기군 B의 더 많은 구성원을 연구하는 추가적인 연구가 필요하다.
MAAP 분기군 A 및 B의 모든 연구된 구성원에서, rAAV 생산에 MAAP 변이체를 사용했을 때 더 높은 수율의 vg 역가를 나타냈고, AAV5만 유일한 예외이다. 우리는MAAP-S59-S65-S71 변형체를 사용했을 때 더 높은 vg 역가를 관찰하지 못했다. AAV5 MAAP는 분기군 A 및 B의 많은 AAV 구성원과 비교되게, 다른 구성원 없이 자체로 독립된 분기군을 형성하는데, 그것은 MAAP-S59-S65-S71 돌연변이체가 다른 생물학적 활성을 가지게 할 수 있을 것이다. 그러나, 가장 차이 나는 MAAP를 가지고 있기 때문에, 변형하기에 딱 맞는 위치에 대한 좀 더 집중적인 특성파악을 통해 생산성을 더 증가시킬 수 있을 것이다.
흥미롭게도, AAV5 MAAP를 제외하면, AAV hu.57 외의 모든 다른 MAAP 단백질은 정렬 시에 아무런 간격을 두지 않고 정렬된다. 그것은 MAAP 서열의 시작 부위에 히스티딘이 결여되었다(MAAP 단백질 정렬 줄을 지지). 이 결과는 AAV 계통 간 MAAP가 높은 수준으로 보존되는 것을 보여준다. 정렬을 통해 주요 MAAP 분기군 A 및 B의 구성원들이 높은 연관 단백질 서열을 가지는 것이 부각되었다.
우리는 또한 MAAP 돌연변이체가 원래의 VP1 단백질 서열을 바꾸지 않으면서 다른 AAV 혈청형으로 전이될 수 있는지 분석했다. MAAP 분기군 B에 속하는 AAV 혈청형 hu.15 및 hu.16의 cap 유전자를 제외하고 도 19에 나타낸 모든 연구한 혈청형에서, 우리는 VP1 아미노산 서열을 간섭하지 않는 MAAP 삼중 종결 변이를 만들 수 있었다.
표 18은 72 hpt에 만들어진 rAAV의 평균 vg.mL­1 역가, 동일한 캡시드 혈청형 내의 wt-MAAP 및 MAAP 변형체로 만든 rAAV에 대한 배수 차이, 그리고 본 연구에서 평가된 각 실험의 반복수(N)를 보여준다. 시료는 왼쪽부터 오른쪽으로 다음과 같다. wt-MAAP; S33-S39-S47; 및 MAAP-S100를 인코딩하는 Rep2-Cap1 플라스미드를 이용한 3-플라스미드 시스템에서 만들어진 rAAV1-mSeAP. pDG2 (플라스미드 팩토리)를 이용하고, wt-MAAP; MAAP-S33-S39-S47; 및 MAAP-L100를 인코딩하는 Rep2-Cap2 플라스미드를 이용한 3-플라스미드 시스템을 사용하여 만들어진 rAAV2-mSeAP. pDP6 (플라스미드 팩토리)를 이용하고, wt-MAAP; MAAP-S33-S39-S47; 및 MAAP-S100를 인코딩하는 Rep2-Cap6 플라스미드를 이용하는 3-플라스미드 시스템을 사용하여 만들어진 rAAV6-mSeAP. pDP5rs (플라스미드 팩토리)를 이용하고, wt-MAAP; 및 MAAP-S59-S65-S71를 인코딩하는 Rep2-Cap5 플라스미드를 이용한 3-플라스미드 시스템으로 만들어진 rAAV5-mSeAP. pDP8.ape (플라스미드 팩토리)를 이용하고, wt-MAAP; MAAP-S33-S39-S47 및 MAAP-S100를 인코딩하는 Rep2-Cap8 플라스미드를 이용한 3-플라스미드 시스템으로 만들어진 rAAV8-mSeAP. MAAP-S33-S39-S47 및 MAAP-L100를 인코딩하는 Rep2-Cap9를 이용하여 3-플라스미드 시스템으로 만들어진 rAAV9-mSeAP.
Figure pct00002
표 19는 72 hpt에 생산된 각 바이러스에 대해 측정한 rAAV 게놈 포함 캡시드의 평균, 동일 캡시드 혈청형이면서 wt-MAAP 또는 MAAP 변형체를 인코딩하는 rAAV에 대한 배수 차이, 그리고 본 연구에서 측정된 기술적인 복제물(replicate)(N)의 양을 나타낸다. 시료는 왼쪽부터 오른쪽 방향이다. pDG2 (플라스미드 팩토리)를 이용하고, 3-플라스미드 시스템, wt-MAAP; MAAP-S33-S39-S47; 및 MAAP-L100를 인코딩하는 Rep2-Cap2 플라스미드를 이용하여 생산된 rAAV2-mSeAP. pDP6(플라스미드 팩토리)를 이용하고, 3-플라스미드 시스템, wt-MAAP; MAAP-S33-S39-S47; 및 MAAP-S100를 인코딩하는 Rep2-Cap6를 이용하여 생산된 rAAV6-mSeAP. pDP5rs (플라스미드 팩토리)를 이용하고, 3-플라스미드 시스템, wt-MAAP; 및 MAAP-S59-S65-S71를 인코딩하는 Rep2-Cap5 플라스미드를 이용하여 생산된 rAAV5-mSeAP. pDP8.ape (플라스미드 팩토리)를 이용하고, 3-플라스미드 시스템, wt-MAAP; MAAP-S33-S39-S47를 인코딩하는 Rep2-Cap8 플라스미드를 이용하여 생산된 rAAV8-mSeAP.
Figure pct00003
표 20은 72 hpt에 생산된 각 바이러스에 대해 측정된 배출된 rAAV 입자의 평균 퍼센티지, 동일한 혈청형이면서 wt-MAAP 또는 MAAP 변형체로 생산된 rAAV에 대한 배수 차이, 본 연구에서 측정된 기술적 복제물(N)의 양을 나타낸다. 시료는 왼쪽부터 오른쪽으로 다음과 같다. wt-MAAP; MAAP-S33-S39-S47; 및 MAAP-S100를 인코딩하는 Rep2-Cap1 플라스미드를 이용하여 3-플라스미드 시스템으로 생산된 rAAV1-mSeAP. pDG2 (플라스미드 팩토리)를 이용하고, 3-플라스미드 시스템, wt-MAAP; MAAP-S33-S39-S47; 및 MAAP-L100을 인코딩하는 Rep2-Cap2 플라스미드를 이용하여 생산된 rAAV2-mSeAP. pDP5rs (플라스미드 팩토리)를 이용하고, 3-플라스미드 시스템, wt-MAAP ; 및 MAAP-S59-S65-S71를 인코딩하는 Rep2-Cap5 플라스미드를 이용하여 생산된 rAAV5-mSeAP. pDP6 (플라스미드 팩토리)를 이용하고, 3-플라스미드 시스템, wt-MAAP; MAAP-S33-S39-S47; 및 MAAP-S100를 인코딩하는 Rep2-Cap6 플라스미드를 이용하여 생산된 rAAV6-mSeAP. pDP8.ape (플라스미드 팩토리)를 이용하고, 3-플라스미드 시스템, wt-MAAP; MAAP-S33-S39-S47 및 MAAP-S100를 인코딩하는 Rep2-Cap8 플라스미드를 이용하여 생산된 rAAV8-mSeAP. wt-MAAP; MAAP-S33-S39-S47 및 MAAP-L100를 인코딩하는 Rep2-Cap9 플라스미드를 이용하여 3-플라스미드 시스템으로 생산된 rAAV9-mSeAP.
Figure pct00004
결론
유전자 치료는 보통 큰 벡터 용량을 필요로 한다. 우리는 이 연구에서 AAV의 rAAV 생산성을 향상시키는 두 개의 MAAP 변형체를 선보였다. rAAV 게놈을 포함하는 캡시드의 높은 수준에 기초한 품질은 적어도 rAAV6에 대해서는 증진되어 rAAV 벡터 생산 용량을 향상시킬 수 있을 것이다. rAAV 생산성 및 품질을 향상시키기 위해 MAAP 변형체를 사용할 때의 하나의 주요한 장점은 VP 아미노산 서열과 rAAV 캡시드 특성을 바꾸지 않으면서 cap 유전자에 이 돌연변이를 수행할 수 있다는 것이다.
실시예 1을 보면, 우리는 두 개의 MAAP 변형체가 이 바이러스의 생산에 특히 바람직한 특성을 나타내는 것을 관찰했다. MAAP ORF의 MAAP-L100 또는 MAAP-S33-S39-S47 위치에 이른 종결 코돈을 도입하면 VP 아미노산 서열을 바꾸지 않으면서, 캡시드 분해를 줄이고, AAV2 생산성을 향상시키며, 전체 캡시드 대비 wt-AAV2 게놈을 포함하는 캡시드의 비율을 향상시키는 결과를 만들었다. 우리는 이 두 개의 특정 돌연변이체에 초점을 맞췄지만, 원한다면, 몇몇 다른 것들도 거의 모든 AAV 혈청형에서 AAV2의 생산성과 품질을 유사하게 향상시키고, VP1 아미노산 서열의 변형을 일으키지 않으면서 rAAV 벡터 생산에 적용될 수 있을 것이다.
이 실시예는 rAAV 1, 2, 5, 6, 8 및 9에 초점을 맞췄고, 혈청형 5를 제외한 그것들 모두에서 MAAP 변형체가 각 혈청형의 생산성을 향상시켰다. AAV 혈청형이 MAAP 계통 발생을 기초로 하여 분류될 때, AAV5는 그 자체 가지의 유일한 대표로서분리되어 있다. AAV 1, 6, 8 및 9는 분기군 A로 묶이고 비-인간 영장류 AAV이며, 분기군 B는 AAV2 및 인간 시료로부터 동정된 다른 혈청형을 포함한다. 따라서, MAAP가 분기군 A 및 B의 구성원으로서 분류되는 AAV 혈청형에서 cap 유전자에 MAAP 변형체가 도입되었을 때, 더 높은 역가의 생산성 수준을 나타낼 것이다. MAAP 변형체가 rAAV를 생산하기 위해 사용될 때, 1012 vg.mL-1 범위에 이르는 최대 생산 수준을 가능하게 하는 것 외에도, MAAP 변형체를 사용했을 때의 다른 흥미로운 특성은 세포 배양 배지 또는 세포 내 rAAV 분포 프로파일이 바뀐다는 것이다. 여러 가지 rAAV 혈청형을 생산하기 위해 사용된 모든 MAAP 변형체에서, 우리는 rAAV가 거의 예외 없이 세포 내에 남는 것을 관찰했다. MAAP 변형체의 이러한 특성은 AAV 생산 및 정제에 적용될 수 있다. 실제로, 원한다면, AAV를 세포와 세포 배양 배지로부터 수확하는 것이 아니라 오직 세포로부터만 수확할 수 있다. rAAV를 정제하기 위해 오직 세포만 처리하는 것은 더 적은 부피를 처리하기 때문에 생산(정제) 비용을 낮추는 것과 연관된다. 이것은 DNase와 같은 시약의 사용에 드는 비용을 절약하고 세포 배양 배지에 비해 한정된 완충액 내에서 벡터를 수확하기 위해 세포를 용해할 수 있게 하며, 더 적은 부피의 용해액을 사용할 수 있게 한다. 마지막으로, MAAP 변형체를 사용하면 특히 rAAV6에서 보였던 것처럼, 원하는 게놈을 포함하는 rAAV 캡시드의 수준이 향상된다. 이것은 빈 캡시드 및 원하는 재조합 게놈을 포함하지 않는 캡시드의 수준을 줄임으로써 rAAV 안전 프로파일을 향상시킬 수 있다. 이것은 또한 관심 있는 게놈을 포함하는 캡시드를 다른 캡시드와 추가적으로 분리하는 과정을 불필요하게 할 수 있기 때문에 하위 공정에서의 일부 정제 단계를 줄일 수 있다.
MAAP ORF를 인코딩하는 구역에서의 cap 유전자의 DNA 서열에 기초하여, 우리가 연구한 87개의 AAV 혈청형 모두에서, VP 단백질 서열을 변경하지 않으면서 MAAP-삼중 종결체 및 MAAP-L/S-100 돌연변이를 생산할 수 있을 것이다. 그러므로, 여기 실시예들은 모든 AAV 혈청형에 적용가능하다고 여겨진다.
References example 2
1. Atchison, R. W., Casto, B. C. & Hammon, W. M. D. Adenovirus-Associated Virus. Science (80-. ). 149, 754-755 (1965).
2. Ogden, P. J., Kelsic, E. D., Sinai, S. & Church, G. M. Comprehensive AAV capsid fitness landscape reveals a viral gene and enables machine-guided design. Science (80). 366, 1139-1143 (2019).
3. Gao, G. et al. Clades of Adeno-Associated Viruses Are Widely Disseminated in Human Tissues. J. Virol. 78, 6381-6388 (2004).
4. Corpet, F. Multiple sequence alignment with hierarchical clustering. Nucleic Acids Res. 16, 10881-90 (1988).
5. Girod, A. et al. The VP1 capsid protein of adeno-associated virus type 2 is carrying a phospholipase A2 domain required for virus infectivity. J. Gen. Virol. 83, 973-978 (2002).
6. Huerta-Cepas, J., Serra, F. & Bork, P. ETE 3: Reconstruction, Analysis, and Visualization of Phylogenomic Data. Mol. Biol. Evol. (2016). doi:10.1093/molbev/msw046
7. Katoh, K. & Standley, D. M. MAFFT multiple sequence alignment software version 7: Improvements in performance and usability. Mol. Biol. Evol. (2013). doi:10.1093/molbev/mst010
8. Price, M. N., Dehal, P. S. & Arkin, A. P. Fasttree: Computing large minimum evolution trees with profiles instead of a distance matrix. Mol. Biol. Evol. (2009). doi:10.1093/molbev/msp077
9. Letunic, I. & Bork, P. Interactive Tree Of Life (iTOL) v5: an online tool for phylogenetic tree display and annotation. Nucleic Acids Res. (2021). doi:10.1093/nar/gkab301
<110> Ferring Ventures SA Galibert, Lionel <120> Improved Adeno-Associated Virus Gene Therapy Vectors <130> P130599PC00 <140> PCT/EP2021/067569 <141> 2021-06-25 <150> US 63/043,837 <151> 2020-06-25 <160> 48 <170> PatentIn version 3.5 <210> 1 <211> 120 <212> PRT <213> Artificial Sequence <220> <223> AAV1 MAAP <400> 1 Asn Leu Glu Pro Arg Ser Pro Lys Pro Thr Ser Lys Ser Arg Thr Thr 1 5 10 15 Ala Gly Val Trp Cys Phe Leu Ala Thr Ser Thr Ser Asp Pro Ser Thr 20 25 30 Asp Ser Thr Arg Gly Ser Pro Ser Thr Arg Arg Thr Gln Arg Pro Ser 35 40 45 Ser Thr Thr Pro Arg Thr Thr Ser Ser Ser Lys Arg Val Thr Ile Arg 50 55 60 Thr Cys Gly Ile Thr Thr Pro Thr Pro Ser Phe Arg Ser Val Cys Lys 65 70 75 80 Lys Ile Arg Leu Leu Gly Ala Thr Ser Gly Glu Gln Ser Ser Arg Pro 85 90 95 Arg Ser Gly Phe Ser Asn Leu Ser Val Trp Leu Arg Lys Ala Leu Arg 100 105 110 Arg Leu Leu Glu Arg Asn Val Arg 115 120 <210> 2 <211> 119 <212> PRT <213> Artificial Sequence <220> <223> AAV2 MAAP <400> 2 Leu Ala His His His Gln Ser Pro Gln Ser Gly Ile Arg Thr Thr Ala 1 5 10 15 Gly Val Leu Cys Phe Leu Gly Thr Ser Thr Ser Asp Pro Ser Thr Asp 20 25 30 Ser Thr Arg Glu Ser Arg Ser Thr Arg Gln Thr Pro Arg Pro Ser Ser 35 40 45 Thr Thr Lys Pro Thr Thr Gly Ser Ser Thr Ala Glu Thr Thr Arg Thr 50 55 60 Ser Ser Thr Thr Thr Pro Thr Arg Ser Phe Arg Ser Ala Leu Lys Lys 65 70 75 80 Ile Arg Leu Leu Gly Ala Thr Ser Asp Glu Gln Ser Ser Arg Arg Lys 85 90 95 Arg Gly Phe Leu Asn Leu Trp Ala Trp Leu Arg Asn Leu Leu Arg Arg 100 105 110 Leu Arg Glu Lys Arg Gly Arg 115 <210> 3 <211> 120 <212> PRT <213> Artificial Sequence <220> <223> AAV3 MAAP <400> 3 Asn Leu Glu Ser Leu Asn Pro Lys Arg Thr Asn Asn Thr Arg Thr Thr 1 5 10 15 Val Gly Val Leu Cys Phe Arg Val Thr Asn Thr Ser Asp Pro Val Thr 20 25 30 Asp Ser Thr Lys Glu Ser Arg Ser Thr Arg Arg Thr Arg Gln Pro Ser 35 40 45 Asn Thr Thr Lys Leu Thr Thr Ser Ser Ser Arg Pro Val Thr Thr Arg 50 55 60 Thr Ser Ser Thr Thr Thr Pro Thr Pro Ser Phe Arg Ser Val Phe Lys 65 70 75 80 Lys Ile Arg Leu Leu Gly Ala Thr Leu Ala Glu Gln Ser Ser Arg Pro 85 90 95 Lys Arg Gly Ser Leu Ser Leu Leu Val Trp Leu Arg Lys Gln Leu Lys 100 105 110 Arg Leu Leu Glu Arg Arg Gly Leu 115 120 <210> 4 <211> 134 <212> PRT <213> Artificial Sequence <220> <223> AAV4 MAAP <400> 4 Arg Thr Thr Ser Leu Lys Ala Phe Glu Ser Gly Gly Arg Cys Asn Leu 1 5 10 15 Glu Pro Leu Asn Pro Arg Gln Ile Asn Asn Ile Arg Thr Thr Leu Gly 20 25 30 Val Leu Cys Phe Arg Val Thr Asn Thr Ser Asp Pro Ala Thr Asp Ser 35 40 45 Thr Arg Gly Asn Pro Ser Thr Gln Arg Thr Arg Gln Pro Ser Ser Thr 50 55 60 Thr Arg Pro Thr Thr Ser Ser Ser Arg Pro Val Thr Thr Pro Thr Ser 65 70 75 80 Ser Thr Thr Thr Pro Thr Arg Ser Ser Ser Ser Gly Phe Arg Ala Thr 85 90 95 His Arg Leu Gly Ala Thr Ser Ala Glu Gln Ser Ser Arg Pro Lys Arg 100 105 110 Gly Phe Leu Asn Leu Leu Val Trp Leu Ser Lys Arg Val Arg Arg Leu 115 120 125 Leu Glu Arg Arg Asp Arg 130 <210> 5 <211> 144 <212> PRT <213> Artificial Sequence <220> <223> AAV5 MAAP <400> 5 Ser Cys Leu Leu Leu Ile Thr Leu Gln Ile Gly Trp Lys Lys Leu Val 1 5 10 15 Lys Val Phe Ala Ser Phe Trp Ala Leu Lys Arg Ala His Arg Asn Gln 20 25 30 Asn Pro Ile Ser Ser Ile Lys Ile Lys Pro Val Val Leu Cys Cys Leu 35 40 45 Val Ile Thr Ile Ser Asp Pro Glu Thr Val Ser Ile Glu Glu Ser Leu 50 55 60 Ser Thr Gly Gln Thr Arg Ser Arg Glu Ser Thr Thr Ser Arg Thr Thr 65 70 75 80 Ser Ser Leu Arg Arg Glu Thr Thr Pro Thr Ser Ser Thr Thr Thr Arg 85 90 95 Thr Pro Ser Phe Arg Arg Ser Ser Pro Thr Thr His Pro Ser Gly Glu 100 105 110 Thr Ser Glu Arg Gln Ser Phe Arg Pro Arg Lys Gly Phe Ser Asn Leu 115 120 125 Leu Ala Trp Leu Lys Arg Val Leu Arg Arg Pro Leu Pro Glu Ser Gly 130 135 140 <210> 6 <211> 170 <212> PRT <213> Artificial Sequence <220> <223> AAV6 MAAP <400> 6 Asn Leu Glu Pro Arg Asn Pro Lys Pro Thr Ser Lys Ser Arg Thr Thr 1 5 10 15 Ala Gly Val Trp Cys Phe Leu Ala Thr Ser Thr Ser Asp Pro Ser Thr 20 25 30 Asp Ser Thr Arg Gly Ser Pro Ser Thr Arg Arg Met Gln Arg Pro Ser 35 40 45 Ser Thr Thr Arg Pro Thr Thr Ser Ser Ser Lys Arg Val Thr Ile Arg 50 55 60 Thr Cys Gly Ile Thr Thr Pro Thr Pro Ser Phe Ser Thr Ser Asp Pro 65 70 75 80 Ser Thr Asp Ser Thr Arg Gly Ser Pro Ser Thr Arg Arg Met Gln Arg 85 90 95 Pro Ser Ser Thr Thr Arg Pro Thr Thr Ser Ser Ser Lys Arg Val Thr 100 105 110 Ile Arg Thr Cys Gly Ile Thr Thr Pro Thr Pro Ser Phe Arg Ser Val 115 120 125 Cys Lys Lys Ile Arg Leu Leu Gly Ala Thr Ser Gly Glu Gln Ser Ser 130 135 140 Arg Pro Arg Arg Gly Phe Ser Asn Leu Leu Val Trp Leu Arg Lys Val 145 150 155 160 Leu Arg Arg Leu Leu Glu Arg Asn Val Arg 165 170 <210> 7 <211> 120 <212> PRT <213> Artificial Sequence <220> <223> AAV7 MAAP <400> 7 Asn Leu Glu Pro Arg Asn Pro Lys Pro Thr Ser Lys Ser Arg Thr Thr 1 5 10 15 Ala Gly Val Trp Cys Phe Leu Ala Thr Ser Thr Ser Asp Pro Ser Thr 20 25 30 Asp Ser Thr Arg Gly Ser Pro Ser Thr Arg Arg Thr Gln Arg Pro Ser 35 40 45 Ser Thr Thr Arg Pro Thr Thr Ser Ser Ser Lys Arg Val Thr Ile Arg 50 55 60 Thr Cys Gly Ile Thr Thr Pro Thr Pro Ser Phe Arg Ser Val Cys Lys 65 70 75 80 Lys Ile Arg His Leu Gly Ala Thr Ser Gly Glu Gln Ser Ser Arg Pro 85 90 95 Arg Ser Gly Phe Ser Asn Leu Ser Val Trp Leu Arg Lys Ala Leu Arg 100 105 110 Arg Leu Leu Gln Arg Arg Asp Arg 115 120 <210> 8 <211> 120 <212> PRT <213> Artificial Sequence <220> <223> AAV8 MAAP <400> 8 Asn Leu Glu Pro Arg Ser Pro Lys Pro Thr Ser Lys Ser Arg Thr Thr 1 5 10 15 Ala Gly Val Trp Cys Phe Leu Ala Thr Ser Thr Ser Asp Pro Ser Thr 20 25 30 Asp Ser Thr Arg Gly Ser Pro Ser Thr Arg Arg Thr Gln Arg Pro Ser 35 40 45 Ser Thr Thr Arg Pro Thr Thr Ser Ser Cys Arg Arg Val Thr Ile Arg 50 55 60 Thr Cys Gly Ile Thr Thr Pro Thr Pro Ser Phe Arg Ser Val Cys Lys 65 70 75 80 Lys Ile Arg Leu Leu Gly Ala Thr Ser Gly Glu Gln Ser Ser Arg Pro 85 90 95 Arg Ser Gly Phe Ser Asn Leu Ser Val Trp Leu Arg Lys Ala Leu Arg 100 105 110 Arg Leu Leu Glu Arg Arg Asp Arg 115 120 <210> 9 <211> 119 <212> PRT <213> Artificial Sequence <220> <223> AAV9 MAAP <400> 9 Leu Glu Pro Leu Asn Pro Arg Gln Ile Asn Asn Ile Lys Thr Thr Leu 1 5 10 15 Glu Val Leu Cys Phe Arg Val Thr Asn Thr Leu Asp Pro Ala Thr Asp 20 25 30 Ser Thr Arg Gly Ser Arg Ser Thr Gln Gln Thr Arg Arg Pro Ser Ser 35 40 45 Thr Thr Arg Pro Thr Thr Ser Ser Ser Arg Pro Glu Thr Thr Arg Thr 50 55 60 Ser Ser Thr Thr Thr Pro Thr Pro Ser Ser Arg Ser Gly Ser Lys Lys 65 70 75 80 Ile Arg Leu Leu Gly Ala Thr Ser Gly Glu Gln Ser Ser Arg Pro Lys 85 90 95 Arg Gly Phe Leu Asn Leu Leu Val Trp Leu Arg Lys Arg Leu Arg Arg 100 105 110 Leu Leu Glu Arg Arg Gly Leu 115 <210> 10 <211> 120 <212> PRT <213> Artificial Sequence <220> <223> AAV10 MAAP <400> 10 Asn Leu Glu Pro Pro Ser Pro Arg Pro Thr Ser Arg Ser Arg Thr Thr 1 5 10 15 Ala Gly Val Trp Cys Phe Leu Ala Thr Ser Thr Ser Asp Pro Ser Thr 20 25 30 Asp Ser Thr Arg Gly Ser Pro Ser Thr Arg Arg Thr Gln Arg Pro Ser 35 40 45 Ser Thr Thr Arg Pro Thr Thr Ser Ser Ser Lys Arg Val Thr Ile Arg 50 55 60 Thr Cys Gly Ile Thr Thr Pro Thr Pro Ser Phe Arg Ser Val Cys Lys 65 70 75 80 Lys Ile Arg Leu Leu Gly Ala Thr Ser Gly Glu Gln Ser Ser Arg Pro 85 90 95 Arg Ser Gly Phe Ser Asn Leu Ser Val Trp Leu Arg Lys Leu Leu Arg 100 105 110 Arg Leu Leu Glu Arg Arg Asp Arg 115 120 <210> 11 <211> 120 <212> PRT <213> Artificial Sequence <220> <223> AAV consensus MAAP <220> <221> MISC_FEATURE <222> (5) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (8) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (10) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (12) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (24) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (39) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (45) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (78)..(79) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (90) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (110) <223> Xaa can be any naturally occurring amino acid <400> 11 Asn Leu Glu Pro Xaa Asn Pro Xaa Pro Xaa Ser Xaa Ile Arg Thr Thr 1 5 10 15 Ala Gly Val Leu Cys Phe Leu Xaa Thr Ser Thr Ser Asp Pro Ser Thr 20 25 30 Asp Ser Thr Arg Gly Ser Xaa Ser Thr Arg Arg Thr Xaa Arg Pro Ser 35 40 45 Ser Thr Thr Arg Pro Thr Thr Ser Ser Ser Arg Arg Val Thr Thr Arg 50 55 60 Thr Ser Ser Thr Thr Thr Pro Thr Pro Ser Phe Arg Ser Xaa Xaa Lys 65 70 75 80 Lys Ile Arg Leu Leu Gly Ala Thr Ser Xaa Glu Gln Ser Ser Arg Pro 85 90 95 Arg Arg Gly Phe Ser Asn Leu Leu Val Trp Leu Arg Lys Xaa Leu Arg 100 105 110 Arg Leu Leu Glu Arg Arg Gly Arg 115 120 <210> 12 <211> 6952 <212> DNA <213> Artificial Sequence <220> <223> p0230-pUC-K-AAV2wt-Reverse <400> 12 gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 60 cttagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt 120 tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat 180 aatattgaaa aaggaagagt atgagccata ttcaacggga aacgtcttgc tctaggccgc 240 gattaaattc caacatggat gctgatttat atgggtataa atgggctcgc gataatgtcg 300 ggcaatcagg tgcgacaatc tatcgattgt atgggaagcc cgatgcgcca gagttgtttc 360 tgaaacatgg caaaggtagc gttgccaatg atgttacaga tgagatggtc agactaaact 420 ggctgacgga atttatgcct cttccgacca tcaagcattt tatccgtact cctgatgatg 480 catggttact caccactgcg atccctggga aaacagcatt ccaggtatta gaagaatatc 540 ctgattcagg tgaaaatatt gttgatgcgc tggcagtgtt cctgcgccgg ttgcattcga 600 ttcctgtttg taattgtcct tttaacagcg atcgcgtatt tcgtctcgct caggcgcaat 660 cacgaatgaa taacggtttg gttgatgcga gtgattttga tgacgagcgt aatggctggc 720 ctgttgaaca agtctggaaa gaaatgcata aacttttgcc attctcaccg gattcagtcg 780 tcactcatgg tgatttctca cttgataacc ttatttttga cgaggggaaa ttaataggtt 840 gtattgatgt tggacgagtc ggaatcgcag accgatacca ggatcttgcc atcctatgga 900 actgcctcgg tgagttttct ccttcattac agaaacggct ttttcaaaaa tatggtattg 960 ataatcctga tatgaataaa ttgcagtttc atttgatgct cgatgagttt ttctaactgt 1020 cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 1080 ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 1140 cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 1200 ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 1260 tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 1320 taccaaatac tgttcttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 1380 caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 1440 agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 1500 gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 1560 gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 1620 ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 1680 acgcctggta tctttatagt cctgtcaggt ttcgccacct ctgacttgag cgtcgatttt 1740 tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 1800 ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta tcccctgatt 1860 ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc agccgaacga 1920 ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cccaatacgc aaaccgcctc 1980 tccccgcgcg ttggccgatt cattaatgca gctggcacga caggtttccc gactggaaag 2040 cgggcagtga gcgcaacgca atttaattaa tcagatccct caatagcggc cttggccact 2100 ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg 2160 ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gagagggagt ggccaactcc 2220 atcactaggg gttcctggag gggtggagtc gtgacgtgaa ttacgtcata gggttaggga 2280 ggtcctgtat tagaggtcac gtgagtgttt tgcgacattt tgcgacacca tgtggtcacg 2340 ctgggtattt aagcccgagt gagcacgcag ggtctccatt ttgaagcggg aggtttgaac 2400 gcgcagccgc catgccgggg ttttacgaga ttgtgattaa ggtccccagc gaccttgacg 2460 agcatctgcc cggcatttct gacagctttg tgaactgggt ggccgagaag gaatgggagt 2520 tgccgccaga ttctgacatg gatctgaatc tgattgagca ggcacccctg accgtggccg 2580 agaagctgca gcacgacttt ctgacggaat ggcgccgtgt gagtaaggcc ccggaggccc 2640 ttttctttgt gcaatttgag aagggagaga gctacttcca catgcacgtg ctcgtggaaa 2700 ccaccggggt gaaatccatg gttttgggac gtttcctgag tcagattcgc gaaaaactga 2760 ttcagagaat ttaccgcggg atcgagccga ctttgccaaa ctggttcgcg gtcacaaaga 2820 ccagaaatgg cgccggaggc gggaacaagg tggtggatga gtgctacatc cccaattact 2880 tgctccccaa aacccagcct gagctccagt gggcatggac taatatggaa cagtatttaa 2940 gcgcctgttt gaatctcacg gagcgtaaac ggttggtggc gcagcatctg acgcacgtgt 3000 cgcagacgca ggagcagaac aaagagaatc agaatcccaa ttctgatgcg ccggtgatca 3060 gatcaaaaac ttcagccagg tacatggagc tggtcgggtg gctcgtggac aaggggatta 3120 cctcggagaa gcagtggatc caggaggacc aggcctcata catctccttc aatgcggcct 3180 ccaactcgcg gtcccaaatc aaggctgcct tggacaatgc gggaaagatt atgagcctga 3240 ctaaaaccgc ccccgactac ctggtgggcc agcagcccgt ggaggacatt tccagcaatc 3300 ggatttataa aattttggaa ctaaacgggt acgatcccca atatgcggct tccgtctttc 3360 tgggatgggc cacgaaaaag ttcggcaaga ggaacaccat ctggctgttt gggcctgcaa 3420 ctaccgggaa gaccaacatc gcggaggcca tagcccacac tgtgcccttc tacgggtgcg 3480 taaactggac caatgagaac tttcccttca acgactgtgt cgacaagatg gtgatctggt 3540 gggaggaggg gaagatgacc gccaaggtcg tggagtcggc caaagccatt ctcggaggaa 3600 gcaaggtgcg cgtggaccag aaatgcaagt cctcggccca gatagacccg actcccgtga 3660 tcgtcacctc caacaccaac atgtgcgccg tgattgacgg gaactcaacg accttcgaac 3720 accagcagcc gttgcaagac cggatgttca aatttgaact cacccgccgt ctggatcatg 3780 actttgggaa ggtcaccaag caggaagtca aagacttttt ccggtgggca aaggatcacg 3840 tggttgaggt ggagcatgaa ttctacgtca aaaagggtgg agccaagaaa agacccaccc 3900 ccagtgacgc agatataagt gagcccaaac gggtgcgcga gtcagttgcg cagccatcga 3960 cgtcagacgc ggaagcttcg atcaactacg cagacaggta ccaaaacaaa tgttctcgtc 4020 acgtgggcat gaatctgatg ctgtttccct gcagacaatg cgagagaatg aatcagaatt 4080 caaatatctg cttcactcac ggacagaaag actgtttaga gtgctttccc gtgtcagaat 4140 ctcaacccgt ttctgtcatc aaaaaggcgt atcagaaact gtgctacatt catcatatca 4200 tgggaaaggt gccagacgct tgcactgcct gcgatctggt caatgtggat ttggatgact 4260 gcatctttga acaataaatg atttaaatca ggtatggctg ccgatggtta tcttccagat 4320 tggctcgagg acactctctc tgaaggaata agacagtggt ggaagctcaa acctggccca 4380 ccaccaccaa agcccgcaga gcggcataag gacgacagca ggggtcttgt gcttcctggg 4440 tacaagtacc tcggaccctt caacggactc gacaagggag agccggtcaa cgaggcagac 4500 gccgcggccc tcgagcacga caaagcctac gaccggcagc tcgacagcgg agacaacccg 4560 tacctcaagt acaaccacgc cgacgcggag tttcaggagc accttaaaga agatacatct 4620 tttgggggca acctcagacg agcagtcttc caggcgaaaa agagggttct tgaacctctg 4680 ggcctggttg aggaacctgt taagacggct ccgggaaaaa agaggccggt agagcactct 4740 cctgtggagc cagactcctc ctcgggaacc ggaaaggcgg gccagcagcc tgcaagaaaa 4800 agattgaatt ttggtcagac tggagacgca gactcagtac ctgaccccca gcctctcgga 4860 cagccaccag cagccccctc tggtctggga actaatacga tggctacagg cagtggcaca 4920 ccaatggcag acaataacga gggcgccgac ggagtgggta attcctcggg aaattggcat 4980 tgcgattcca catggatggg cgacagagtc atcaccacca gcacccgaac ctgggccctg 5040 cccacctaca acaaccacct ctacaaacaa atttccagcc aatcaggagc ctcgaacgac 5100 aatcactact ttggctacag caccccttgg gggtattttg acttcaacag attccactgc 5160 cacttttcac cacgtgactg gcaaagactc atcaacaaca actggggatt ccgacccaag 5220 agactcaact tcaagctctt taacattcaa gtcaaagagg tcacgcagaa tgacggtacg 5280 acgacgattg ccaataacct taccagcacg gttcaggtgt ttactgactc ggagtaccag 5340 ctcccgtacg tcctcggctc ggcgcatcaa ggatgcctcc cgccgttccc agcagacgtc 5400 ttcatggtgc cacagtatgg atacctcacc ctgaacaacg ggagtcaggc agtaggacgc 5460 tcttcatttt actgcctgga gtactttcct tctcagatgc tgcgtaccgg aaacaacttt 5520 accttcagct acacttttga ggacgttcct ttccacagca gctacgctca cagccagagt 5580 ctggaccgtc tcatgaatcc tctcatcgac cagtacctgt attacttgag cagaacaaac 5640 actccaagtg gaaccaccac gcagtcaagg cttcagtttt ctcaggccgg agcgagtgac 5700 attcgggacc agtctaggaa ctggcttcct ggaccctgtt accgccagca gcgagtatca 5760 aagacatctg cggataacaa caacagtgaa tactcgtgga ctggagctac caagtaccac 5820 ctcaatggca gagactctct ggtgaatccg ggcccggcca tggcaagcca caaggacgat 5880 gaagaaaagt tttttcctca gagcggggtt ctcatctttg ggaagcaagg ctcagagaaa 5940 acaaatgtgg acattgaaaa ggtcatgatt acagacgaag aggaaatcag gacaaccaat 6000 cccgtggcta cggagcagta tggttctgta tctaccaacc tccagagagg caacagacaa 6060 gcagctaccg cagatgtcaa cacacaaggc gttcttccag gcatggtctg gcaggacaga 6120 gatgtgtacc ttcaggggcc catctgggca aagattccac acacggacgg acattttcac 6180 ccctctcccc tcatgggtgg attcggactt aaacaccctc ctccacagat tctcatcaag 6240 aacaccccgg tacctgcgaa tccttcgacc accttcagtg cggcaaagtt tgcttccttc 6300 atcacacagt actccacggg acaggtcagc gtggagatcg agtgggagct gcagaaggaa 6360 aacagcaaac gctggaatcc cgaaattcag tacacttcca actacaacaa gtctgttaat 6420 gtggacttta ctgtggacac taatggcgtg tattcagagc ctcgccccat tggcaccaga 6480 tacctgactc gtaatctgta attgcttgtt aatcaataaa ccgtttaatt cgtttcagtt 6540 gaactttggt ctctgcgtat ttctttctta tctagtttcc atggctacgt agataagtag 6600 catggcgggt taatcattaa ctacaaggaa cccctagtga tggagttggc cactccctct 6660 ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt 6720 gcccgggcgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa gccactcgag 6780 cacctaggag gcgcgccacg gccgtagtta agccagcccc gacacccgcc aacacccgct 6840 gacgcgccct gacgggcttg tctgctcccg gcatccgctt acagacaagc tgtgaccgtc 6900 tccgggagct gcatgtgtca gaggttttca ccgtcatcac cgaaacgcgc ga 6952 <210> 13 <211> 360 <212> DNA <213> Artificial Sequence <220> <223> AAV2 MAAP gene <400> 13 ctggcccacc accaccaaag cccgcagagc ggcataagga cgacagcagg ggtcttgtgc 60 ttcctgggta caagtacctc ggacccttca acggactcga caagggagag ccggtcaacg 120 aggcagacgc cgcggccctc gagcacgaca aagcctacga ccggcagctc gacagcggag 180 acaacccgta cctcaagtac aaccacgccg acgcggagtt tcaggagcgc cttaaagaag 240 atacgtcttt tgggggcaac ctcggacgag cagtcttcca ggcgaaaaag agggttcttg 300 aacctctggg cctggttgag gaacctgtta agacggctcc gggaaaaaag aggccggtag 360 360 <210> 14 <211> 6952 <212> DNA <213> Artificial Sequence <220> <223> p0189-AAV2WT-DS 540-546-554 -> stops <400> 14 gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 60 cttagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt 120 tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat 180 aatattgaaa aaggaagagt atgagccata ttcaacggga aacgtcttgc tctaggccgc 240 gattaaattc caacatggat gctgatttat atgggtataa atgggctcgc gataatgtcg 300 ggcaatcagg tgcgacaatc tatcgattgt atgggaagcc cgatgcgcca gagttgtttc 360 tgaaacatgg caaaggtagc gttgccaatg atgttacaga tgagatggtc agactaaact 420 ggctgacgga atttatgcct cttccgacca tcaagcattt tatccgtact cctgatgatg 480 catggttact caccactgcg atccctggga aaacagcatt ccaggtatta gaagaatatc 540 ctgattcagg tgaaaatatt gttgatgcgc tggcagtgtt cctgcgccgg ttgcattcga 600 ttcctgtttg taattgtcct tttaacagcg atcgcgtatt tcgtctcgct caggcgcaat 660 cacgaatgaa taacggtttg gttgatgcga gtgattttga tgacgagcgt aatggctggc 720 ctgttgaaca agtctggaaa gaaatgcata aacttttgcc attctcaccg gattcagtcg 780 tcactcatgg tgatttctca cttgataacc ttatttttga cgaggggaaa ttaataggtt 840 gtattgatgt tggacgagtc ggaatcgcag accgatacca ggatcttgcc atcctatgga 900 actgcctcgg tgagttttct ccttcattac agaaacggct ttttcaaaaa tatggtattg 960 ataatcctga tatgaataaa ttgcagtttc atttgatgct cgatgagttt ttctaactgt 1020 cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 1080 ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 1140 cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 1200 ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 1260 tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 1320 taccaaatac tgttcttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 1380 caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 1440 agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 1500 gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 1560 gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 1620 ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 1680 acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 1740 tgtgatgctc gtcagggggg cagagcctat ggaaaaacgc cagcaacgcg gcctttttac 1800 ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta tcccctgatt 1860 ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc agccgaacga 1920 ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cccaatacgc aaaccgcctc 1980 tccccgcacg ttggccgatt cattaatgca gctggcacga caggtttccc gactggaaag 2040 cgggcagtga gcgcaacgca atttaattaa tcagatccct caatagcggc cttggccact 2100 ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg 2160 ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gagagggagt ggccaactcc 2220 atcactaggg gttcctggag gggtggagtc gtgacgtgaa ttacgtcata gggttaggga 2280 ggtcctgtat tagaggtcac gtgagtgttt tgcgacattt tgcgacacca tgtggtcacg 2340 ctgggtattt aagcccaagt gagcacacag ggtctccatt ttgaagcggg aggtttgaac 2400 gcgcagccgc catgccgggg ttttacgaga ttgtgattaa ggtccccagc gaccttgacg 2460 agcatctgcc cggcatttct gacagctttg tgaactgggt ggccgagaag gaatgggagt 2520 tgccgccaga ttctgacatg gatctgaatc tgattgagca ggcacccctg accgtggccg 2580 agaagctgca gcgcgacttt ctgacggaat ggcgccgtgt gagtaaggcc ccggaggccc 2640 ttttctttgt gcaatttgag aagggagaga gctacttcca catgcacgtg ctcgtggaaa 2700 ccaccggggt gaaatccatg gttttgggac gtttcctgag tcagattcgc gaaaaactga 2760 ttcagagaat ttaccgcggg atcgagccga ctttgccaaa ctggttcacg gtcacaaaga 2820 ccagaaatgg cgccggaggc gggaacaagg tggtggatga gtgctacatc cccaattact 2880 tgctccccaa aacccagcct gagctccagt gggcgtggac taatatggaa cagtatttaa 2940 gcgcctgttt gaatctcacg gagcgtaaac ggttggtggc gcagcatctg acgcacgtgt 3000 cgcagacgca ggagcagaac aaagagaatc agaatcccaa ttctgatgcg ccggtgatca 3060 gatcaaaaac ttcagccagg tacatggagc tggtcgggtg gctcatggac aaggggatta 3120 cctcggagaa gcagtggatc caggaggacc aggcctcata catctccttc aatgcggcct 3180 ccaactcgcg gtcccaaatc aaggctgcct tggacaatgc gggaaagatt atgagcctga 3240 ctaaaaccgc ccccgactac ctggtgggcc agcagcccgt ggaggacatt tccagcaatc 3300 ggatttataa aattttggaa ctaaacgggt acgatcccca atatgcggct tccgtctttc 3360 tgggatgggc cacgaaaaag ttcggcaaga ggaacaccat ctggctgttt gggcctgcaa 3420 ctaccgggaa gaccaacatc gcggaggcca tagcccacac tgtgcccttc tacgggtgcg 3480 taaactggac caatgagaac tttcccttca acgactgtgt cgacaagatg gtgatctggt 3540 gggaggaggg gaagatgacc gccaaggtcg tggagtcggc caaagccatt ctcggaggaa 3600 gcaaggtgcg cgtggaccag aaatgcaagt cctcggccca gatagacccg actcccgtga 3660 tcgtcacctc caacaccaac atgtgcgccg tgattgacgg gaactcaacg accttcgaac 3720 accagcagcc gttgcaagac cggatgttca aatttgaact cacccgccgt ctggatcatg 3780 actttgggaa ggtcaccaag caggaagtca aagacttttt ccggtgggca aaggatcacg 3840 tggttgaggt ggagcatgaa ttctacgtca aaaagggtgg agccaagaaa agacccgccc 3900 ccagtgacgc agatataagt gagcccaaac gggtgcgcga gtcagttgcg cagccatcga 3960 cgtcagacgc ggaagcttcg atcaactacg cagacaggta ccaaaacaaa tgttctcgtc 4020 acgtgggcat gaatctgatg ctgtttccct gcagacaatg cgagagaatg aatcagaatt 4080 caaatatctg cttcactcac ggacagaaag actgtttaga gtgctttccc gtgtcagaat 4140 ctcaacccgt ttctgtcgtc aaaaaggcgt atcagaaact gtgctacatt catcatatca 4200 tgggaaaggt gccagacgct tgcactgcct gcgatctggt caatgtggat ttggatgact 4260 gcatctttga acaataaatg atttaaatca ggtatggctg ccgatggtta tcttccagat 4320 tggctcgagg acactctctc tgaaggaata agacagtggt ggaagctcaa acctggccca 4380 ccaccaccaa agcccgcaga gcggcataag gacgacagca ggggtcttgt gcttcctggg 4440 tacaagtacc tcggaccctt caacggacta gacaagggag agccggtgaa cgaggcagac 4500 gccgcggccc tagagcacga caaagcctac gaccggcagc tcgacagcgg agacaacccg 4560 tacctcaagt acaaccacgc cgacgcggag tttcaggagc gccttaaaga agatacgtct 4620 tttgggggca acctcggacg agcagtcttc caggcgaaaa agagggttct tgaacctctg 4680 ggcctggttg aggaacctgt taagacggct ccgggaaaaa agaggccggt agagcactct 4740 cctgtggagc cagactcctc ctcgggaacc ggaaaggcgg gccagcagcc tgcaagaaaa 4800 agattgaatt ttggtcagac tggagacgca gactcagtac ctgaccccca gcctctcgga 4860 cagccaccag cagccccctc tggtctggga actaatacga tggctacagg cagtggcgca 4920 ccaatggcag acaataacga gggcgccgac ggagtgggta attcctcggg aaattggcat 4980 tgcgattcca catggatggg cgacagagtc atcaccacca gcacccgaac ctgggccctg 5040 cccacctaca acaaccacct ctacaaacaa atttccagcc aatcaggagc ctcgaacgac 5100 aatcactact ttggctacag caccccttgg gggtattttg acttcaacag attccactgc 5160 cacttttcac cacgtgactg gcaaagactc atcaacaaca actggggatt ccgacccaag 5220 agactcaact tcaagctctt taacattcaa gtcaaagagg tcacgcagaa tgacggtacg 5280 acgacgattg ccaataacct taccagcacg gttcaggtgt ttactgactc ggagtaccag 5340 ctcccgtacg tcctcggctc ggcgcatcaa ggatgcctcc cgccgttccc agcagacgtc 5400 ttcatggtgc cacagtatgg atacctcacc ctgaacaacg ggagtcaggc agtaggacgc 5460 tcttcatttt actgcctgga gtactttcct tctcagatgc tgcgtaccgg aaacaacttt 5520 accttcagct acacttttga ggacgttcct ttccacagca gctacgctca cagccagagt 5580 ctggaccgtc tcatgaatcc tctcatcgac cagtacctgt attacttgag cagaacaaac 5640 actccaagtg gaaccaccac gcagtcaagg cttcagtttt ctcaggccgg agcgagtgac 5700 attcgggacc agtctaggaa ctggcttcct ggaccctgtt accgccagca gcgagtatca 5760 aagacatctg cggataacaa caacagtgaa tactcgtgga ctggagctac caagtaccac 5820 ctcaatggca gagactctct ggtgaatccg ggcccggcca tggcaagcca caaggacgat 5880 gaagaaaagt tttttcctca gagcggggtt ctcatctttg ggaagcaagg ctcagagaaa 5940 acaaatgtgg acattgaaaa ggtcatgatt acagacgaag aggaaatcag gacaaccaat 6000 cccgtggcta cggagcagta tggttctgta tctaccaacc tccagagagg caacagacaa 6060 gcagctaccg cagatgtcaa cacacaaggc gttcttccag gcatggtctg gcaggacaga 6120 gatgtgtacc ttcaggggcc catctgggca aagattccac acacggacgg acattttcac 6180 ccctctcccc tcatgggtgg attcggactt aaacaccctc ctccacagat tctcatcaag 6240 aacaccccgg tacctgcgaa tccttcgacc accttcagtg cggcaaagtt tgcttccttc 6300 atcacacagt actccacggg acaggtcagc gtggagatcg agtgggagct gcagaaggaa 6360 aacagcaaac gctggaatcc cgaaattcag tacacttcca actacaacaa gtctgttaat 6420 gtggacttta ctgtggacac taatggcgtg tattcagagc ctcgccccat tggcaccaga 6480 tacctgactc gtaatctgta attgcttgtt aatcaataaa ccgtttaatt cgtttcagtt 6540 gaactttggt ctctgcgtat ttctttctta tctagtttcc atggctacgt agataagtag 6600 catggcgggt taatcattaa ctacaaggaa cccctagtga tggagttggc cactccctct 6660 ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt 6720 gcccgggcgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa gccactcgag 6780 cacctaggag gcgcgccacg gccgtagtta agccagcccc gacacccgcc aacacccgct 6840 gacgcgccct gacgggcttg tctgctcccg gcatccgctt acagacaagc tgtgaccgtc 6900 tccgggagct gcatgtgtca gaggttttca ccgtcatcac cgaaacgcgc ga 6952 <210> 15 <211> 735 <212> PRT <213> Artificial Sequence <220> <223> p0189-AAV2WT-DS VP1 protein <400> 15 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr 580 585 590 Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp 595 600 605 Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr 610 615 620 Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys 625 630 635 640 His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn 645 650 655 Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln 660 665 670 Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys 675 680 685 Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr 690 695 700 Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr 705 710 715 720 Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 16 <211> 32 <212> PRT <213> Artificial Sequence <220> <223> p0189-AAV2WT MAAP #1 <400> 16 Leu Ala His His His Gln Ser Pro Gln Ser Gly Ile Arg Thr Thr Ala 1 5 10 15 Gly Val Leu Cys Phe Leu Gly Thr Ser Thr Ser Asp Pro Ser Thr Asp 20 25 30 <210> 17 <211> 37 <212> PRT <213> Artificial Sequence <220> <223> p0189-AAV2WT MAAP #2 <400> 17 Leu Ala His His His Gln Ser Pro Gln Ser Gly Ile Arg Thr Thr Ala 1 5 10 15 Gly Val Leu Cys Phe Leu Gly Thr Ser Thr Ser Asp Pro Ser Thr Asp 20 25 30 Thr Arg Glu Ser Arg 35 <210> 18 <211> 44 <212> PRT <213> Artificial Sequence <220> <223> p0189-AAV2WT MAAP #3 <400> 18 Leu Ala His His His Gln Ser Pro Gln Ser Gly Ile Arg Thr Thr Ala 1 5 10 15 Gly Val Leu Cys Phe Leu Gly Thr Ser Thr Ser Asp Pro Ser Thr Asp 20 25 30 Thr Arg Glu Ser Arg Thr Arg Gln Thr Pro Arg Pro 35 40 <210> 19 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Rep2-PRB <220> <221> misc_feature <222> (1)..(2) <223> ZEN <220> <221> misc_feature <222> (1) <223> 56-FAM is before residue 1. <220> <221> misc_feature <222> (2) <223> 3IABkFQ is after residue 2. <400> 19 cccgtgtcag aatctcaacc cgtt 24 <210> 20 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Rep2-FWD <400> 20 cttcactcac ggacagaaag a 21 <210> 21 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Rep2-Rev <400> 21 ctggcacctt tcccatgata 20 <210> 22 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Ad5-E4-PRB <220> <221> misc_feature <222> (1) <223> 56-FAM is before residue 1. <220> <221> misc_feature <222> (1)..(2) <223> ZEN <220> <221> misc_feature <222> (2) <223> 3IABkFQ is after residue 2. <400> 22 acccagccaa cctacacatt cgtt 24 <210> 23 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Ad5-E4-FWD <400> 23 catccaccac cgcagaataa 20 <210> 24 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Ad5-E4-REV <400> 24 acatggttct tccagctctt c 21 <210> 25 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Kan-PRB <220> <221> misc_feature <222> (1) <223> 56-FAM is before residue 1. <220> <221> misc_feature <222> (1)..(2) <223> ZEN <220> <221> misc_feature <222> (2) <223> 3IABkFQ is after residue 2. <400> 25 tcgcacctga ttgcccgaca ttat 24 <210> 26 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Kan-FWD <400> 26 atcgggcttc ccatacaatc 20 <210> 27 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Kan-REV <400> 27 gctctaggcc gcgattaaa 19 <210> 28 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> anti-MAAP antigen <400> 28 Lys Lys Ile Arg Leu Leu Gly Ala Thr Ser Asp Glu Gln Ser Ser Arg 1 5 10 15 Arg Lys Arg Gly 20 <210> 29 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Anti-MAAP antigen <400> 29 Arg Ser Thr Ser Ser Arg Thr Ser Ser Ala Arg Arg Ile Lys Asp Ala 1 5 10 15 Ser Arg Arg <210> 30 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> basic-amino-acid-rich (BR) cluster <400> 30 Lys Lys Ile Arg 1 <210> 31 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> basic-amino-acid-rich (BR) cluster <400> 31 Arg Arg Lys Arg 1 <210> 32 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> basic-amino-acid-rich (BR) cluster <400> 32 Arg Asn Leu Leu Arg Arg Leu Arg Glu Lys Arg Gly Arg 1 5 10 <210> 33 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> primer CMV-Fwd <400> 33 catgacctta tgggactttc ct 22 <210> 34 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer CMV-Rev <400> 34 ctatccacgc ccattgatgt a 21 <210> 35 <211> 2211 <212> DNA <213> adeno-associated virus serotype 1 <400> 35 atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60 gagtggtggg acttgaaacc tggagccccg aagcccaaag ccaaccagca aaagcaggac 120 gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180 aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240 cagcagctca aagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300 caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360 gccaagaagc gggttctcga acctctcggt ctggttgagg aaggcgctaa gacggctcct 420 ggaaagaaac gtccggtaga gcagtcgcca caagagccag actcctcctc gggcatcggc 480 aagacaggcc agcagcccgc taaaaagaga ctcaattttg gtcagactgg cgactcagag 540 tcagtccccg atccacaacc tctcggagaa cctccagcaa cccccgctgc tgtgggacct 600 actacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660 gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720 accaccagca cccgcacctg ggccttgccc acctacaata accacctcta caagcaaatc 780 tccagtgctt caacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840 gggtattttg atttcaacag attccactgc cacttttcac cacgtgactg gcagcgactc 900 atcaacaaca attggggatt ccggcccaag agactcaact tcaaactctt caacatccaa 960 gtcaaggagg tcacgacgaa tgatggcgtc acaaccatcg ctaataacct taccagcacg 1020 gttcaagtct tctcggactc ggagtaccag cttccgtacg tcctcggctc tgcgcaccag 1080 ggctgcctcc ctccgttccc ggcggacgtg ttcatgattc cgcaatacgg ctacctgacg 1140 ctcaacaatg gcagccaagc cgtgggacgt tcatcctttt actgcctgga atatttccct 1200 tctcagatgc tgagaacggg caacaacttt accttcagct acacctttga ggaagtgcct 1260 ttccacagca gctacgcgca cagccagagc ctggaccggc tgatgaatcc tctcatcgac 1320 caatacctgt attacctgaa cagaactcaa aatcagtccg gaagtgccca aaacaaggac 1380 ttgctgttta gccgtgggtc tccagctggc atgtctgttc agcccaaaaa ctggctacct 1440 ggaccctgtt atcggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaat 1500 tttacctgga ctggtgcttc aaaatataac ctcaatgggc gtgaatccat catcaaccct 1560 ggcactgcta tggcctcaca caaagacgac gaagacaagt tctttcccat gagcggtgtc 1620 atgatttttg gaaaagagag cgccggagct tcaaacactg cattggacaa tgtcatgatt 1680 acagacgaag aggaaattaa agccactaac cctgtggcca ccgaaagatt tgggaccgtg 1740 gcagtcaatt tccagagcag cagcacagac cctgcgaccg gagatgtgca tgctatggga 1800 gcattacctg gcatggtgtg gcaagataga gacgtgtacc tgcagggtcc catttgggcc 1860 aaaattcctc acacagatgg acactttcac ccgtctcctc ttatgggcgg ctttggactc 1920 aagaacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggcg 1980 gagttttcag ctacaaagtt tgcttcattc atcacccaat actccacagg acaagtgagt 2040 gtggaaattg aatgggagct gcagaaagaa aacagcaagc gctggaatcc cgaagtgcag 2100 tacacatcca attatgcaaa atctgccaac gttgatttta ctgtggacaa caatggactt 2160 tatactgagc ctcgccccat tggcacccgt taccttaccc gtcccctgta a 2211 <210> 36 <211> 2208 <212> DNA <213> adeno-associated virus serotype 2 <400> 36 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800 cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860 attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920 caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980 ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040 gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga aattcagtac 2100 acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160 tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208 <210> 37 <211> 2211 <212> DNA <213> adeno-associated virus serotype 3 <400> 37 atggctgctg acggttatct tccagattgg ctcgaggaca acctttctga aggcattcgt 60 gagtggtggg ctctgaaacc tggagtccct caacccaaag cgaaccaaca acaccaggac 120 aaccgtcggg gtcttgtgct tccgggttac aaatacctcg gacccggtaa cggactcgac 180 aaaggagagc cggtcaacga ggcggacgcg gcagccctcg aacacgacaa agcttacgac 240 cagcagctca aggccggtga caacccgtac ctcaagtaca accacgccga cgccgagttt 300 caggagcgtc ttcaagaaga tacgtctttt gggggcaacc ttggcagagc agtcttccag 360 gccaaaaaga ggatccttga gcctcttggt ctggttgagg aagcagctaa aacggctcct 420 ggaaagaagg gggctgtaga tcagtctcct caggaaccgg actcatcatc tggtgttggc 480 aaatcgggca aacagcctgc cagaaaaaga ctaaatttcg gtcagactgg agactcagag 540 tcagtcccag accctcaacc tctcggagaa ccaccagcag cccccacaag tttgggatct 600 aatacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaggg tgccgatgga 660 gtgggtaatt cctcaggaaa ttggcattgc gattcccaat ggctgggcga cagagtcatc 720 accaccagca ccagaacctg ggccctgccc acttacaaca accatctcta caagcaaatc 780 tccagccaat caggagcttc aaacgacaac cactactttg gctacagcac cccttggggg 840 tattttgact ttaacagatt ccactgccac ttctcaccac gtgactggca gcgactcatt 900 aacaacaact ggggattccg gcccaagaaa ctcagcttca agctcttcaa catccaagtt 960 agaggggtca cgcagaacga tggcacgacg actattgcca ataaccttac cagcacggtt 1020 caagtgttta cggactcgga gtatcagctc ccgtacgtgc tcgggtcggc gcaccaaggc 1080 tgtctcccgc cgtttccagc ggacgtcttc atggtccctc agtatggata cctcaccctg 1140 aacaacggaa gtcaagcggt gggacgctca tccttttact gcctggagta cttcccttcg 1200 cagatgctaa ggactggaaa taacttccaa ttcagctata ccttcgagga tgtacctttt 1260 cacagcagct acgctcacag ccagagtttg gatcgcttga tgaatcctct tattgatcag 1320 tatctgtact acctgaacag aacgcaagga acaacctctg gaacaaccaa ccaatcacgg 1380 ctgcttttta gccaggctgg gcctcagtct atgtctttgc aggccagaaa ttggctacct 1440 gggccctgct accggcaaca gagactttca aagactgcta acgacaacaa caacagtaac 1500 tttccttgga cagcggccag caaatatcat ctcaatggcc gcgactcgct ggtgaatcca 1560 ggaccagcta tggccagtca caaggacgat gaagaaaaat ttttccctat gcacggcaat 1620 ctaatatttg gcaaagaagg gacaacggca agtaacgcag aattagataa tgtaatgatt 1680 acggatgaag aagagattcg taccaccaat cctgtggcaa cagagcagta tggaactgtg 1740 gcaaataact tgcagagctc aaatacagct cccacgactg gaactgtcaa tcatcagggg 1800 gccttacctg gcatggtgtg gcaagatcgt gacgtgtacc ttcaaggacc tatctgggca 1860 aagattcctc acacggatgg acactttcat ccttctcctc tgatgggagg ctttggactg 1920 aaacatccgc ctcctcaaat catgatcaaa aatactccgg taccggcaaa tcctccgacg 1980 actttcagcc cggccaagtt tgcttcattt atcactcagt actccactgg acaggtcagc 2040 gtggaaattg agtgggagct acagaaagaa aacagcaaac gttggaatcc agagattcag 2100 tacacttcca actacaacaa gtctgttaat gtggacttta ctgtagacac taatggtgtt 2160 tatagtgaac ctcgccctat tggaacccgg tatctcacac gaaacttgtg a 2211 <210> 38 <211> 2205 <212> DNA <213> adeno-associated virus serotype 4 <400> 38 atgactgacg gttaccttcc agattggcta gaggacaacc tctctgaagg cgttcgagag 60 tggtgggcgc tgcaacctgg agcccctaaa cccaaggcaa atcaacaaca tcaggacaac 120 gctcggggtc ttgtgcttcc gggttacaaa tacctcggac ccggcaacgg actcgacaag 180 ggggaacccg tcaacgcagc ggacgcggca gccctcgagc acgacaaggc ctacgaccag 240 cagctcaagg ccggtgacaa cccctacctc aagtacaacc acgccgacgc ggagttccag 300 cagcggcttc agggcgacac atcgtttggg ggcaacctcg gcagagcagt cttccaggcc 360 aaaaagaggg ttcttgaacc tcttggtctg gttgagcaag cgggtgagac ggctcctgga 420 aagaagagac cgttgattga atccccccag cagcccgact cctccacggg tatcggcaaa 480 aaaggcaagc agccggctaa aaagaagctc gttttcgaag acgaaactgg agcaggcgac 540 ggaccccctg agggatcaac ttccggagcc atgtctgatg acagtgagat gcgtgcagca 600 gctggcggag ctgcagtcga gggcggacaa ggtgccgatg gagtgggtaa tgcctcgggt 660 gattggcatt gcgattccac ctggtctgag ggccacgtca cgaccaccag caccagaacc 720 tgggtcttgc ccacctacaa caaccacctc tacaagcgac tcggagagag cctgcagtcc 780 aacacctaca acggattctc caccccctgg ggatactttg acttcaaccg cttccactgc 840 cacttctcac cacgtgactg gcagcgactc atcaacaaca actggggcat gcgacccaaa 900 gccatgcggg tcaaaatctt caacatccag gtcaaggagg tcacgacgtc gaacggcgag 960 acaacggtgg ctaataacct taccagcacg gttcagatct ttgcggactc gtcgtacgaa 1020 ctgccgtacg tgatggatgc gggtcaagag ggcagcctgc ctccttttcc caacgacgtc 1080 tttatggtgc cccagtacgg ctactgtgga ctggtgaccg gcaacacttc gcagcaacag 1140 actgacagaa atgccttcta ctgcctggag tactttcctt cgcagatgct gcggactggc 1200 aacaactttg aaattacgta cagttttgag aaggtgcctt tccactcgat gtacgcgcac 1260 agccagagcc tggaccggct gatgaaccct ctcatcgacc agtacctgtg gggactgcaa 1320 tcgaccacca ccggaaccac cctgaatgcc gggactgcca ccaccaactt taccaagctg 1380 cggcctacca acttttccaa ctttaaaaag aactggctgc ccgggccttc aatcaagcag 1440 cagggcttct caaagactgc caatcaaaac tacaagatcc ctgccaccgg gtcagacagt 1500 ctcatcaaat acgagacgca cagcactctg gacggaagat ggagtgccct gacccccgga 1560 cctccaatgg ccacggctgg acctgcggac agcaagttca gcaacagcca gctcatcttt 1620 gcggggccta aacagaacgg caacacggcc accgtacccg ggactctgat cttcacctct 1680 gaggaggagc tggcagccac caacgccacc gatacggaca tgtggggcaa cctacctggc 1740 ggtgaccaga gcaacagcaa cctgccgacc gtggacagac tgacagcctt gggagccgtg 1800 cctggaatgg tctggcaaaa cagagacatt tactaccagg gtcccatttg ggccaagatt 1860 cctcataccg atggacactt tcacccctca ccgctgattg gtgggtttgg gctgaaacac 1920 ccgcctcctc aaatttttat caagaacacc ccggtacctg cgaatcctgc aacgaccttc 1980 agctctactc cggtaaactc cttcattact cagtacagca ctggccaggt gtcggtgcag 2040 attgactggg agatccagaa ggagcggtcc aaacgctgga accccgaggt ccagtttacc 2100 tccaactacg gacagcaaaa ctctctgttg tgggctcccg atgcggctgg gaaatacact 2160 gagcctaggg ctatcggtac ccgctacctc acccaccacc tgtaa 2205 <210> 39 <211> 2175 <212> DNA <213> adeno-associated virus serotype 5 <400> 39 atgtcttttg ttgatcaccc tccagattgg ttggaagaag ttggtgaagg tcttcgcgag 60 tttttgggcc ttgaagcggg cccaccgaaa ccaaaaccca atcagcagca tcaagatcaa 120 gcccgtggtc ttgtgctgcc tggttataac tatctcggac ccggaaacgg tctcgatcga 180 ggagagcctg tcaacagggc agacgaggtc gcgcgagagc acgacatctc gtacaacgag 240 cagcttgagg cgggagacaa cccctacctc aagtacaacc acgcggacgc cgagtttcag 300 gagaagctcg ccgacgacac atccttcggg ggaaacctcg gaaaggcagt ctttcaggcc 360 aagaaaaggg ttctcgaacc ttttggcctg gttgaagagg gtgctaagac ggcccctacc 420 ggaaagcgga tagacgacca ctttccaaaa agaaagaagg ctcggaccga agaggactcc 480 aagccttcca cctcgtcaga cgccgaagct ggacccagcg gatcccagca gctgcaaatc 540 ccagcccaac cagcctcaag tttgggagct gatacaatgt ctgcgggagg tggcggccca 600 ttgggcgaca ataaccaagg tgccgatgga gtgggcaatg cctcgggaga ttggcattgc 660 gattccacgt ggatggggga cagagtcgtc accaagtcca cccgaacctg ggtgctgccc 720 agctacaaca accaccagta ccgagagatc aaaagcggct ccgtcgacgg aagcaacgcc 780 aacgcctact ttggatacag caccccctgg gggtactttg actttaaccg cttccacagc 840 cactggagcc cccgagactg gcaaagactc atcaacaact actggggctt cagaccccgg 900 tccctcagag tcaaaatctt caacattcaa gtcaaagagg tcacggtgca ggactccacc 960 accaccatcg ccaacaacct cacctccacc gtccaagtgt ttacggacga cgactaccag 1020 ctgccctacg tcgtcggcaa cgggaccgag ggatgcctgc cggccttccc tccgcaggtc 1080 tttacgctgc cgcagtacgg ttacgcgacg ctgaaccgcg acaacacaga aaatcccacc 1140 gagaggagca gcttcttctg cctagagtac tttcccagca agatgctgag aacgggcaac 1200 aactttgagt ttacctacaa ctttgaggag gtgcccttcc actccagctt cgctcccagt 1260 cagaacctgt tcaagctggc caacccgctg gtggaccagt acttgtaccg cttcgtgagc 1320 acaaataaca ctggcggagt ccagttcaac aagaacctgg ccgggagata cgccaacacc 1380 tacaaaaact ggttcccggg gcccatgggc cgaacccagg gctggaacct gggctccggg 1440 gtcaaccgcg ccagtgtcag cgccttcgcc acgaccaata ggatggagct cgagggcgcg 1500 agttaccagg tgcccccgca gccgaacggc atgaccaaca acctccaggg cagcaacacc 1560 tatgccctgg agaacactat gatcttcaac agccagccgg cgaacccggg caccaccgcc 1620 acgtacctcg agggcaacat gctcatcacc agcgagagcg agacgcagcc ggtgaaccgc 1680 gtggcgtaca acgtcggcgg gcagatggcc accaacaacc agagctccac cactgccccc 1740 gcgaccggca cgtacaacct ccaggaaatc gtgcccggca gcgtgtggat ggagagggac 1800 gtgtacctcc aaggacccat ctgggccaag atcccagaga cgggggcgca ctttcacccc 1860 tctccggcca tgggcggatt cggactcaaa cacccaccgc ccatgatgct catcaagaac 1920 acgcctgtgc ccggaaatat caccagcttc tcggacgtgc ccgtcagcag cttcatcacc 1980 cagtacagca ccgggcaggt caccgtggag atggagtggg agctcaagaa ggaaaactcc 2040 aagaggtgga acccagagat ccagtacaca aacaactaca acgaccccca gtttgtggac 2100 tttgccccgg acagcaccgg ggaatacaga accaccagac ctatcggaac ccgatacctt 2160 acccgacccc tttaa 2175 <210> 40 <211> 2211 <212> DNA <213> adeno-associated virus serotype 6 <400> 40 atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60 gagtggtggg acttgaaacc tggagccccg aaacccaaag ccaaccagca aaagcaggac 120 gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180 aagggggagc ccgtcaacgc ggcggatgca gcggccctcg agcacgacaa ggcctacgac 240 cagcagctca aagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300 caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360 gccaagaaga gggttctcga accttttggt ctggttgagg aaggtgctaa gacggctcct 420 ggaaagaaac gtccggtaga gcagtcgcca caagagccag actcctcctc gggcattggc 480 aagacaggcc agcagcccgc taaaaagaga ctcaattttg gtcagactgg cgactcagag 540 tcagtccccg acccacaacc tctcggagaa cctccagcaa cccccgctgc tgtgggacct 600 actacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660 gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720 accaccagca cccgaacatg ggccttgccc acctataaca accacctcta caagcaaatc 780 tccagtgctt caacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840 gggtattttg atttcaacag attccactgc catttctcac cacgtgactg gcagcgactc 900 atcaacaaca attggggatt ccggcccaag agactcaact tcaagctctt caacatccaa 960 gtcaaggagg tcacgacgaa tgatggcgtc acgaccatcg ctaataacct taccagcacg 1020 gttcaagtct tctcggactc ggagtaccag ttgccgtacg tcctcggctc tgcgcaccag 1080 ggctgcctcc ctccgttccc ggcggacgtg ttcatgattc cgcagtacgg ctacctaacg 1140 ctcaacaatg gcagccaggc agtgggacgg tcatcctttt actgcctgga atatttccca 1200 tcgcagatgc tgagaacggg caataacttt accttcagct acaccttcga ggacgtgcct 1260 ttccacagca gctacgcgca cagccagagc ctggaccggc tgatgaatcc tctcatcgac 1320 cagtacctgt attacctgaa cagaactcag aatcagtccg gaagtgccca aaacaaggac 1380 ttgctgttta gccgggggtc tccagctggc atgtctgttc agcccaaaaa ctggctacct 1440 ggaccctgtt accggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaac 1500 tttacctgga ctggtgcttc aaaatataac cttaatgggc gtgaatctat aatcaaccct 1560 ggcactgcta tggcctcaca caaagacgac aaagacaagt tctttcccat gagcggtgtc 1620 atgatttttg gaaaggagag cgccggagct tcaaacactg cattggacaa tgtcatgatc 1680 acagacgaag aggaaatcaa agccactaac cccgtggcca ccgaaagatt tgggactgtg 1740 gcagtcaatc tccagagcag cagcacagac cctgcgaccg gagatgtgca tgttatggga 1800 gccttacctg gaatggtgtg gcaagacaga gacgtatacc tgcagggtcc tatttgggcc 1860 aaaattcctc acacggatgg acactttcac ccgtctcctc tcatgggcgg ctttggactt 1920 aagcacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggca 1980 gagttttcgg ctacaaagtt tgcttcattc atcacccagt attccacagg acaagtgagc 2040 gtggagattg aatgggagct gcagaaagaa aacagcaaac gctggaatcc cgaagtgcag 2100 tatacatcta actatgcaaa atctgccaac gttgatttca ctgtggacaa caatggactt 2160 tatactgagc ctcgccccat tggcacccgt tacctcaccc gtcccctgta a 2211 <210> 41 <211> 2214 <212> DNA <213> adeno-associated virus serotype 7 <400> 41 atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60 gagtggtggg acctgaaacc tggagccccg aaacccaaag ccaaccagca aaagcaggac 120 aacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180 aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240 cagcagctca aagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300 caggagcgtc tgcaagaaga tacgtcattt gggggcaacc tcgggcgagc agtcttccag 360 gccaagaagc gggttctcga acctctcggt ctggttgagg aaggcgctaa gacggctcct 420 gcaaagaaga gaccggtaga gccgtcacct cagcgttccc ccgactcctc cacgggcatc 480 ggcaagaaag gccagcagcc cgccagaaag agactcaatt tcggtcagac tggcgactca 540 gagtcagtcc ccgaccctca acctctcgga gaacctccag cagcgccctc tagtgtggga 600 tctggtacag tggctgcagg cggtggcgca ccaatggcag acaataacga aggtgccgac 660 ggagtgggta atgcctcagg aaattggcat tgcgattcca catggctggg cgacagagtc 720 attaccacca gcacccgaac ctgggccctg cccacctaca acaaccacct ctacaagcaa 780 atctccagtg aaactgcagg tagtaccaac gacaacacct acttcggcta cagcaccccc 840 tgggggtatt ttgactttaa cagattccac tgccacttct caccacgtga ctggcagcga 900 ctcatcaaca acaactgggg attccggccc aagaagctgc ggttcaagct cttcaacatc 960 caggtcaagg aggtcacgac gaatgacggc gttacgacca tcgctaataa ccttaccagc 1020 acgattcagg tattctcgga ctcggaatac cagctgccgt acgtcctcgg ctctgcgcac 1080 cagggctgcc tgcctccgtt cccggcggac gtcttcatga ttcctcagta cggctacctg 1140 actctcaaca atggcagtca gtctgtggga cgttcctcct tctactgcct ggagtacttc 1200 ccctctcaga tgctgagaac gggcaacaac tttgagttca gctacagctt cgaggacgtg 1260 cctttccaca gcagctacgc acacagccag agcctggacc ggctgatgaa tcccctcatc 1320 gaccagtact tgtactacct ggccagaaca cagagtaacc caggaggcac agctggcaat 1380 cgggaactgc agttttacca gggcgggcct tcaactatgg ccgaacaagc caagaattgg 1440 ttacctggac cttgcttccg gcaacaaaga gtctccaaaa cgctggatca aaacaacaac 1500 agcaactttg cttggactgg tgccaccaaa tatcacctga acggcagaaa ctcgttggtt 1560 aatcccggcg tcgccatggc aactcacaag gacgacgagg accgcttttt cccatccagc 1620 ggagtcctga tttttggaaa aactggagca actaacaaaa ctacattgga aaatgtgtta 1680 atgacaaatg aagaagaaat tcgtcctact aatcctgtag ccacggaaga atacgggata 1740 gtcagcagca acttacaagc ggctaatact gcagcccaga cacaagttgt caacaaccag 1800 ggagccttac ctggcatggt ctggcagaac cgggacgtgt acctgcaggg tcccatctgg 1860 gccaagattc ctcacacgga tggcaacttt cacccgtctc ctttgatggg cggctttgga 1920 cttaaacatc cgcctcctca gatcctgatc aagaacactc ccgttcccgc taatcctccg 1980 gaggtgttta ctcctgccaa gtttgcttcg ttcatcacac agtacagcac cggacaagtc 2040 agcgtggaaa tcgagtggga gctgcagaag gaaaacagca agcgctggaa cccggagatt 2100 cagtacacct ccaactttga aaagcagact ggtgtggact ttgccgttga cagccagggt 2160 gtttactctg agcctcgccc tattggcact cgttacctca cccgtaatct gtaa 2214 <210> 42 <211> 2217 <212> DNA <213> adeno-associated virus serotype 8 <400> 42 atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60 gagtggtggg cgctgaaacc tggagccccg aagcccaaag ccaaccagca aaagcaggac 120 gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180 aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240 cagcagctgc aggcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300 caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360 gccaagaagc gggttctcga acctctcggt ctggttgagg aaggcgctaa gacggctcct 420 ggaaagaaga gaccggtaga gccatcaccc cagcgttctc cagactcctc tacgggcatc 480 ggcaagaaag gccaacagcc cgccagaaaa agactcaatt ttggtcagac tggcgactca 540 gagtcagttc cagaccctca acctctcgga gaacctccag cagcgccctc tggtgtggga 600 cctaatacaa tggctgcagg cggtggcgca ccaatggcag acaataacga aggcgccgac 660 ggagtgggta gttcctcggg aaattggcat tgcgattcca catggctggg cgacagagtc 720 atcaccacca gcacccgaac ctgggccctg cccacctaca acaaccacct ctacaagcaa 780 atctccaacg ggacatcggg aggagccacc aacgacaaca cctacttcgg ctacagcacc 840 ccctgggggt attttgactt taacagattc cactgccact tttcaccacg tgactggcag 900 cgactcatca acaacaactg gggattccgg cccaagagac tcagcttcaa gctcttcaac 960 atccaggtca aggaggtcac gcagaatgaa ggcaccaaga ccatcgccaa taacctcacc 1020 agcaccatcc aggtgtttac ggactcggag taccagctgc cgtacgttct cggctctgcc 1080 caccagggct gcctgcctcc gttcccggcg gacgtgttca tgattcccca gtacggctac 1140 ctaacactca acaacggtag tcaggccgtg ggacgctcct ccttctactg cctggaatac 1200 tttccttcgc agatgctgag aaccggcaac aacttccagt ttacttacac cttcgaggac 1260 gtgcctttcc acagcagcta cgcccacagc cagagcttgg accggctgat gaatcctctg 1320 attgaccagt acctgtacta cttgtctcgg actcaaacaa caggaggcac ggcaaatacg 1380 cagactctgg gcttcagcca aggtgggcct aatacaatgg ccaatcaggc aaagaactgg 1440 ctgccaggac cctgttaccg ccaacaacgc gtctcaacga caaccgggca aaacaacaat 1500 agcaactttg cctggactgc tgggaccaaa taccatctga atggaagaaa ttcattggct 1560 aatcctggca tcgctatggc aacacacaaa gacgacgagg agcgtttttt tcccagtaac 1620 gggatcctga tttttggcaa acaaaatgct gccagagaca atgcggatta cagcgatgtc 1680 atgctcacca gcgaggaaga aatcaaaacc actaaccctg tggctacaga ggaatacggt 1740 atcgtggcag ataacttgca gcagcaaaac acggctcctc aaattggaac tgtcaacagc 1800 cagggggcct tacccggtat ggtctggcag aaccgggacg tgtacctgca gggtcccatc 1860 tgggccaaga ttcctcacac ggacggcaac ttccacccgt ctccgctgat gggcggcttt 1920 ggcctgaaac atcctccgcc tcagatcctg atcaagaaca cgcctgtacc tgcggatcct 1980 ccgaccacct tcaaccagtc aaagctgaac tctttcatca cgcaatacag caccggacag 2040 gtcagcgtgg aaattgaatg ggagctgcag aaggaaaaca gcaagcgctg gaaccccgag 2100 atccagtaca cctccaacta ctacaaatct acaagtgtgg actttgctgt taatacagaa 2160 ggcgtgtact ctgaaccccg ccccattggc acccgttacc tcacccgtaa tctgtaa 2217 <210> 43 <211> 2211 <212> DNA <213> adeno-associated virus serotype 9 <400> 43 atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60 gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120 aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180 aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240 cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300 caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360 gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420 ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480 aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540 tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600 cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660 gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780 tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840 tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900 ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960 caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020 acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080 gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140 acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200 ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260 cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320 gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380 ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440 ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500 tttgcttggc ctggagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560 ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620 ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680 accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740 gccacaaacc accagagtgc ccaagcacag gcgcagaccg gctgggttca aaaccaagga 1800 atacttccgg gtatggtttg gcaggacaga gatgtgtacc tgcaaggacc catttgggcc 1860 aaaattcctc acacggacgg caactttcac ccttctccgc tgatgggagg gtttggaatg 1920 aagcacccgc ctcctcagat cctcatcaaa aacacacctg tacctgcgga tcctccaacg 1980 gccttcaaca aggacaagct gaactctttc atcacccagt attctactgg ccaagtcagc 2040 gtggagatcg agtgggagct gcagaaggaa aacagcaagc gctggaaccc ggagatccag 2100 tacacttcca actattacaa gtctaataat gttgaatttg ctgttaatac tgaaggtgta 2160 tatagtgaac cccgccccat tggcaccaga tacctgactc gtaatctgta a 2211 <210> 44 <211> 2217 <212> DNA <213> adeno-associated virus serotype 10 <400> 44 atggctgctg acggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60 gagtggtggg acctgaaacc tggagccccc aagcccaagg ccaaccagca gaagcaggac 120 gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180 aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240 cagcagctca aagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300 caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360 gccaagaagc gggttctcga acctctcggt ctggttgagg aagctgctaa gacggctcct 420 ggaaagaaga gaccggtaga accgtcacct cagcgttccc ccgactcctc cacgggcatc 480 ggcaagaaag gccagcagcc cgctaaaaag agactgaact ttgggcagac tggcgagtca 540 gagtcagtcc ccgaccctca accaatcgga gaaccaccag caggcccctc tggtctggga 600 tctggtacaa tggctgcagg cggtggcgct ccaatggcag acaataacga aggcgccgac 660 ggagtgggta gttcctcagg aaattggcat tgcgattcca catggctggg cgacagagtc 720 atcaccacca gcacccgaac ctgggccctg cccacctaca acaaccacct ctacaagcaa 780 atctccaacg ggacatcggg aggaagcacc aacgacaaca cctacttcgg ctacagcacc 840 ccctgggggt attttgactt caacagattc cactgccact tctcaccacg tgactggcag 900 cgactcatca acaacaactg gggattccgg ccaaaaagac tcagcttcaa gctcttcaac 960 atccaggtca aggaggtcac gcagaatgaa ggcaccaaga ccatcgccaa taaccttacc 1020 agcacgattc aggtatttac ggactcggaa taccagctgc cgtacgtcct cggctccgcg 1080 caccagggct gcctgcctcc gttcccggcg gatgtcttca tgattcccca gtacggctac 1140 ctgacactga acaatggaag tcaagccgta ggccgttcct ccttctactg cctggaatat 1200 tttccatctc aaatgctgcg aactggaaac aattttgaat tcagctacac cttcgaggac 1260 gtgcctttcc acagcagcta cgcacacagc cagagcttgg accgactgat gaatcctctc 1320 attgaccagt acctgtacta cttatccaga actcagtcca caggaggaac tcaaggtacc 1380 cagcaattgt tattttctca agctgggcct gcaaacatgt cggctcaggc caagaactgg 1440 ctgcctggac cttgctaccg gcagcagcga gtctccacga cactgtcgca aaacaacaac 1500 agcaactttg cttggactgg tgccaccaaa tatcacctga acggaagaga ctctctggtg 1560 aatcccggtg tcgccatggc aacccacaag gacgacgagg aacgcttctt cccgtcgagc 1620 ggagtcctga tgtttggaaa acagggtgct ggaagagaca atgtggacta cagcagcgtt 1680 atgctaacaa gcgaagaaga aattaaaacc actaaccctg tagccacaga acaatacggc 1740 gtggtggctg acaacttgca gcaagccaat acagggccta ttgtgggaaa tgtcaacagc 1800 caaggagcct tacctggcat ggtctggcag aaccgagacg tgtacctgca gggtcccatc 1860 tgggccaaga ttcctcacac ggacggcaac tttcacccgt ctcctctgat gggcggcttt 1920 ggacttaaac acccgcctcc acagatcctg atcaagaaca cgccggtacc tgcggatcct 1980 ccaacaacgt tcagccaggc gaaattggct tccttcatca cgcagtacag caccggacag 2040 gtcagcgtgg aaatcgagtg ggagctgcag aaggagaaca gcaaacgctg gaacccagag 2100 attcagtaca cttcaaacta ctacaaatct acaaatgtgg actttgctgt caatacagag 2160 ggaacttatt ctgagcctcg ccccattggt actcgttatc tgacacgtaa tctgtaa 2217 <210> 45 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Rep2-PRB <220> <221> misc_feature <222> (1) <223> 56-FAM <220> <221> misc_feature <222> (9) <223> ZEN <220> <221> misc_feature <222> (24) <223> 3IABkFQ <400> 45 cccgtgtcag aatctcaacc cgtt 24 <210> 46 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Ad5-E4-PRB <220> <221> misc_feature <222> (1) <223> 56-FAM <220> <221> misc_feature <222> (9) <223> ZEN <220> <221> misc_feature <222> (24) <223> 3IABkFQ <400> 46 acccagccaa cctacacatt cgtt 24 <210> 47 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Kan-PRB <220> <221> misc_feature <222> (1) <223> 56-FAM <220> <221> misc_feature <222> (9) <223> ZEN <220> <221> misc_feature <222> (24) <223> 3IABkFQ <400> 47 tcgcacctga ttgcccgaca ttat 24 <210> 48 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> CMV-PRB <220> <221> misc_feature <222> (1) <223> 6-FAM <220> <221> misc_feature <222> (9) <223> ZEN <220> <221> misc_feature <222> (24) <223> IABkFQ <400> 48 tcgcacctga ttgcccgaca ttat 24

Claims (82)

  1. 전장 야생형 막 연관 부속 단백질(membrane associated accessory protein, MAAP)의 발현을 줄이면서 VP1의 발현은 유지하는 돌연변이를 가지는 아데노 연관 바이러스 게놈.
  2. MAAP mRNA로 전사되는 아데노 연관 바이러스 게놈으로서, 상기 게놈은 돌연변이를 가지고, 여기서 상기 MAAP mRNA는 야생형 MAAP mRNA으로부터 변형되며, 상기 변형은 다음으로부터 선택되고: MAAP 번역 시작 코돈을 시작 코돈이 아닌 서열로 변경, 및 MAAP mRNA 안에 적어도 하나의 종결 코돈을 생성; 여기서 상기 돌연변이는 상기 게놈으로부터의 VP1의 발현을 방해하지 않는 것인 아데노-연관 바이러스 게놈.
  3. MAAP mRNA 번역 시작 코돈을 불활성화, 및/또는 전장 야생형 MAAP의 번역을 중단시키기 위한 적어도 하나의 종결 코돈을 도입하는 돌연변이를 가지는 아데노-연관 바이러스 게놈.
  4. 제 3 항에 있어서, MAAP mRNA 번역 시작 코돈을 불활성화시키는 돌연변이를 가지고 추가로 전장 야생형 MAAP의 번역을 중단시키기 위한 적어도 하나의 종결 코돈을 도입하는 적어도 하나의 돌연변이를 더 포함하는 것인 아데노-연관 바이러스 게놈.
  5. 제 1 항 또는 제 2 항에 있어서, 상기 돌연변이는 MAAP 번역 시작 코돈을 불활성화, 및/또는 전장 야생형 MAAP의 번역을 중단시키기 위한 적어도 하나의 종결 코돈을 도입하는 것인 아데노-연관 바이러스 게놈.
  6. 제 1 항 내지 제 5 항 중 어느 한 항에 있어서, 상기 돌연변이는 MAAP 폴리펩타이드 공통 서열 서열목록 11의 잔기 번호 9 내지 110과 정렬된, 바람직하게는 잔기 번호 39 내지 103과 정렬된 폴리펩타이드 잔기에 MAAP 폴리펩타이드의 번역을 중단하기 위한 적어도 하나의 종결 코돈을 도입하는 것인 아데노-연관 바이러스 게놈.
  7. 제 6 항에 있어서, 상기 돌연변이는 MAAP 폴리펩타이드 공통 서열 서열목록 11의 잔기 번호 9, 33, 39, 47, 65, 90, 100, 103, 105, 106 또는 110과 정렬된 폴리펩타이드 잔기에 MAAP 폴리펩타이드의 번역을 중단하기 위한 적어도 하나의 종결 코돈을 도입하는 것인 아데노-연관 바이러스 게놈.
  8. 제 6 항에 있어서, 상기 돌연변이는 MAAP 폴리펩타이드 공통 서열 서열목록 11의 잔기 번호 9와 정렬된 폴리펩타이드 잔기에 MAAP 폴리펩타이드의 번역을 중단하기 위한 종결 코돈을 도입하는 것인 아데노-연관 바이러스 게놈.
  9. 제 6 항에 있어서, 상기 돌연변이는 MAAP 폴리펩타이드 공통 서열 서열목록 11의 잔기 번호 33과 정렬된 폴리펩타이드 잔기에 MAAP 폴리펩타이드의 번역을 중단하기 위한 종결 코돈을 도입하는 것인 아데노-연관 바이러스 게놈.
  10. 제 6 항에 있어서, 상기 돌연변이는 MAAP 폴리펩타이드 공통 서열 서열목록 11의 잔기 번호 39와 정렬된 폴리펩타이드 잔기에 MAAP 폴리펩타이드의 번역을 중단하기 위한 종결 코돈을 도입하는 것인 아데노-연관 바이러스 게놈.
  11. 제 6 항에 있어서, 상기 돌연변이는 MAAP 폴리펩타이드 공통 서열 서열목록 11의 잔기 번호 47과 정렬된 폴리펩타이드 잔기에 MAAP 폴리펩타이드의 번역을 중단하기 위한 종결 코돈을 도입하는 것인 아데노-연관 바이러스 게놈.
  12. 제 6 항에 있어서, 상기 돌연변이는 MAAP 폴리펩타이드 공통 서열 서열목록 11의 잔기 번호 33, 39 및 47과 정렬된 폴리펩타이드 잔기에 MAAP 폴리펩타이드의 번역을 중단하기 위한 종결 코돈을 도입하는 것인 아데노-연관 바이러스 게놈.
  13. 제 6 항에 있어서, 상기 돌연변이는 MAAP 폴리펩타이드 공통 서열 서열목록 11의 잔기 번호 65와 정렬된 폴리펩타이드 잔기에 MAAP 폴리펩타이드의 번역을 중단하기 위한 종결 코돈을 도입하는 것인 아데노-연관 바이러스 게놈.
  14. 제 6 항에 있어서, 상기 돌연변이는 MAAP 폴리펩타이드 공통 서열 서열목록 11의 잔기 번호 90과 정렬된 폴리펩타이드 잔기에 MAAP 폴리펩타이드의 번역을 중단하기 위한 종결 코돈을 도입하는 것인 아데노-연관 바이러스 게놈.
  15. 제 6 항에 있어서, 상기 돌연변이는 MAAP 폴리펩타이드 공통 서열 서열목록 11의 잔기 번호 100과 정렬된 폴리펩타이드 잔기에 MAAP 폴리펩타이드의 번역을 중단하기 위한 종결 코돈을 도입하는 것인 아데노-연관 바이러스 게놈.
  16. 제 6 항에 있어서, 상기 돌연변이는 MAAP 폴리펩타이드 공통 서열 서열목록 11의 잔기 번호 103과 정렬된 폴리펩타이드 잔기에 MAAP 폴리펩타이드의 번역을 중단하기 위한 종결 코돈을 도입하는 것인 아데노-연관 바이러스 게놈.
  17. 제 6 항에 있어서, 상기 돌연변이는 MAAP 폴리펩타이드 공통 서열 서열목록 11의 잔기 번호 105와 정렬된 폴리펩타이드 잔기에 MAAP 폴리펩타이드의 번역을 중단하기 위한 종결 코돈을 도입하는 것인 아데노-연관 바이러스 게놈.
  18. 제 6 항에 있어서, 상기 돌연변이는 MAAP 폴리펩타이드 공통 서열 서열목록 11의 잔기 번호 106과 정렬된 폴리펩타이드 잔기에 MAAP 폴리펩타이드의 번역을 중단하기 위한 종결 코돈을 도입하는 것인 아데노-연관 바이러스 게놈.
  19. 제 6 항에 있어서, 상기 돌연변이는 MAAP 폴리펩타이드 공통 서열 서열목록 11의 잔기 번호 110과 정렬된 폴리펩타이드 잔기에 MAAP 폴리펩타이드의 번역을 중단하기 위한 종결 코돈을 도입하는 것인 아데노-연관 바이러스 게놈.
  20. 제 1 항 내지 제 19 항 중 어느 한 항에 있어서, 상기 게놈은 다음으로 구성되는 모둠에서 선택되는 아데노-연관 바이러스 게놈: 자연 발생 혈청형 및 비-자연 발생 혈청형.
  21. 제 20 항에 있어서, 상기 게놈은 비-자연 발생 혈청형인 아데노-연관 바이러스 게놈.
  22. 제 20 항에 있어서, 상기 게놈은 자연 발생 혈청형인 아데노-연관 바이러스 게놈.
  23. 제 22 항에 있어서, 상기 게놈은 혈청형 2 게놈을 포함하는 아데노-연관 바이러스 게놈.
  24. 제 22 항에 있어서, 상기 게놈은 혈청형 5 게놈을 포함하는 아데노-연관 바이러스 게놈.
  25. 제 22 항에 있어서, 상기 게놈은 혈청형 6 게놈 및 혈청형 8 게놈으로부터 선택되는 아데노-연관 바이러스 게놈.
  26. 제 22 항에 있어서, 상기 게놈은 혈청형 1 게놈 및 혈청형 9 게놈으로부터 선택되는 아데노-연관 바이러스 게놈.
  27. 제 22 항에 있어서, 상기 게놈은 혈청형 1 게놈, 혈청형 2 게놈, 혈청형 5 게놈, 혈청형 6 게놈, 혈청형 8 게놈 및 혈청형 9 게놈으로부터 선택되는 아데노-연관 바이러스 게놈.
  28. 제 21 항에 있어서, 상기 게놈은 비-자연 발생 혈청형을 포함하는 아데노-연관 바이러스 게놈.
  29. 제 2 항 내지 제 28 항 중 어느 한 항에 있어서, VP1 펩타이드 서열이 야생형으로부터 변경되지 않는 아데노-연관 바이러스 게놈.
  30. 제 2 항 내지 제 28 항 중 어느 한 항에 있어서, VP1 펩타이드 서열이 돌연변이를 포함하는 아데노-연관 바이러스 게놈.
  31. 제 2 항 내지 제 28 항 중 어느 한 항에 있어서, MAAP 및 VP1 펩타이드 서열이 각각 야생형과 적어도 80%의 상동성을 갖는 아데노-연관 바이러스 게놈.
  32. 제 31 항에 있어서, 상기 MAAP 및 VP1 펩타이드 서열이 각각 야생형과 적어도 90%의 상동성을 갖는 아데노-연관 바이러스 게놈.
  33. MAAP 공통 폴리펩타이드 서열 서열목록 11의 임의의 인접하는 33개의 잔기에 적어도 50%의 상동성을 갖는 1차 아미노산 서열을 가지는 폴리펩타이드를 발현하지 않는 아데노-연관 바이러스 게놈.
  34. 제 33 항에 있어서, 상기 33개의 인접하는 잔기가 MAAP 공통 폴리펩타이드 서열 서열목록 11의 잔기 93 내지 97을 포함하는 아데노-연관 바이러스 게놈.
  35. 제 33 항에 있어서, 상기 33개의 인접하는 잔기가 MAAP 폴리펩타이드 공통 서열 서열목록 11의 잔기 107 내지 119를 포함하는 아데노-연관 바이러스 게놈.
  36. 제 33 항에 있어서, 상기 33개의 인접하는 잔기가 MAAP 폴리펩타이드 공통 서열 서열목록 11의 잔기 1 내지 30을 포함하는 아데노-연관 바이러스 게놈.
  37. 제 33 항에 있어서, 상기 33개의 인접하는 잔기가 MAAP 공통 폴리펩타이드 서열 서열목록 11의 잔기 1 내지 33과 적어도 60%의 상동성을 갖는 아무 서열도 포함하지 않는 아데노-연관 바이러스 게놈.
  38. 제 33 항에 있어서, 상기 33개의 인접하는 잔기가 MAAP 폴리펩타이드 공통 서열 서열목록 11의 잔기 1 내지 39와 적어도 60%의 상동성을 갖는 아무 서열도 포함하지 않는 아데노-연관 바이러스 게놈.
  39. 제 33 항에 있어서, 상기 33개의 인접하는 잔기가 MAAP 폴리펩타이드 공통 서열 서열목록 11의 잔기 1 내지 47과 적어도 60%의 상동성을 갖는 아무 서열도 포함하지 않는 아데노-연관 바이러스 게놈.
  40. 제 33 항에 있어서, MAAP 폴리펩타이드 공통 서열 서열목록 11의 임의의 인접하는 30개의 잔기와 적어도 60%의 상동성을 갖는 아무 서열도 포함하지 않는 아데노-연관 바이러스 게놈.
  41. 제 40 항에 있어서, MAAP 공통 폴리펩타이드 서열 서열목록 11의 임의의 인접하는 30개의 잔기와 적어도 70%의 상동성을 갖는 아무런 서열도 포함하지 않는 아데노-연관 바이러스 게놈.
  42. 제 40 항에 있어서, MAAP 공통 폴리펩타이드 서열 서열목록 11의 임의의 인접하는 30개의 잔기와 적어도 80%의 상동성을 갖는 아무런 서열도 포함하지 않는 아데노-연관 바이러스 게놈.
  43. 제 33 항에 있어서, 상기 게놈은 MAAP 폴리펩타이드 공통 서열 서열목록 11의 임의의 인접하는 15개의 잔기와 적어도 95%의 상동성을 갖는 1차 아미노산 서열을 가지는 폴리펩타이드를 발현하지 않는 아데노-연관 바이러스 게놈.
  44. 제 43 항에 있어서, 상기 게놈은 MAAP 폴리펩타이드 공통 서열 서열목록 11의 임의의 인접하는 17개의 잔기와 적어도 90%의 상동성을 갖는 1차 아미노산 서열을 가지는 폴리펩타이드를 발현하지 않는 아데노-연관 바이러스 게놈.
  45. 제 43 항에 있어서, 상기 게놈은 MAAP 폴리펩타이드 공통 서열 서열목록 11의 임의의 19개의 인접하는 잔기와 적어도 90%의 상동성을 갖는 1차 아미노산 서열을 가지는 폴리펩타이드를 발현하지 않는 아데노-연관 바이러스 게놈.
  46. 제 43 항에 있어서, 상기 게놈은 MAAP 폴리펩타이드 공통 서열 서열목록 11의 임의의 인접하는 21개의 잔기와 적어도 90%의 상동성을 갖는 1차 아미노산 서열을 가지는 폴리펩타이드를 발현하지 않는 아데노-연관 바이러스 게놈.
  47. 제 33 항에 있어서, 상기 게놈은 MAAP 폴리펩타이드 공통 서열 서열목록 11의 잔기 번호 94 내지 120의 임의의 인접하는 10개의 잔기와 적어도 50%의 상동성을 갖는 1차 아미노산 서열을 가지는 폴리펩타이드를 발현하지 않는 아데노-연관 바이러스 게놈.
  48. 아데노-연관 바이러스를 생산하는 생산자 세포로서, 상기 생산자 세포는 제 1 항 내지 제 47 항 중 어느 한 항의 아데노-연관 바이러스 게놈을 포함하는 생산자 세포.
  49. 제 48 항에 있어서, 상기 생산자 세포는 진핵 세포인 생산자 세포.
  50. 제 49 항에 있어서, 상기 생산자 세포는 포유류 세포인 생산자 세포.
  51. 제 50 항에 있어서, 상기 생산자 세포는 인간 세포인 생산자 세포.
  52. 제 49 항에 있어서, 상기 생산자 세포는 효모 세포 및 곤충 세포로부터 선택되는 생산자 세포.
  53. 아데노-연관 바이러스를 생산하는 방법으로서, 상기 방법은 다음을 포함한다: 아데노-연관 바이러스 게놈 취득, 및 그 다음 제 48 항 내지 제 52 항 중 어느 한 항의 생산자 세포를 만들기 위해 상기 게놈을 세포에 도입, 및 그 다음 상기 생산자 세포가 아데노-연관 바이러스를 생산하도록 상기 생산자 세포를 배양.
  54. 제 53 항에 있어서, 상기 아데노-연관 바이러스를 수확하는 것을 더 포함하며, 여기서 상기 수확된 아데노-연관 바이러스는 이식 유전자를 포함하는 것인 방법.
  55. 제 53 항에 있어서, 상기 생산자 세포가 총 물리적 캡시드 수 대비 관심 유전자 또는 게놈을 포함하는 캡시드의 수의 비율이 적어도 야생형 아데노-연관 바이러스 게놈을 포함하는 비슷한 세포에 의해 생산되는 총 물리적 캡시드의 수 대비 관심 유전자 또는 게놈을 포함하는 캡시드의 수 비율만큼 높은 바이러스 제제를 생산하는 방법.
  56. 제 53 항에 있어서, 상기 생산자 세포가 [속이 찬 바이러스 캡시드] : [속이 빈 바이러스 캡시드]의 비율이 적어도 야생형 아데노-연관 바이러스 게놈으로 감염된 유사한 세포에서의 비율만큼 높은 바이러스를 생산하는 것인 방법.
  57. 제 56 항에 있어서, 상기 생산자 세포가 [속이 찬 바이러스 캡시드] : [속이 빈 바이러스 캡시드]의 비율이 야생형 아데노-연관 바이러스 게놈으로 감염된 유사한 세포에서의 비율보다 30% 높은 바이러스를 생산하는 것인 방법.
  58. 제 53 항에 있어서, 상기 생산자 세포가 적어도 야생형 아데노-연관 바이러스 게놈으로 감염된 유사한 세포에서 만드는 만큼 많은 바이러스 게놈/mL의 바이러스를 생산하는 것인 방법.
  59. 제 58 항에 있어서, 상기 생산자 세포가 야생형 아데노-연관 바이러스 게놈으로 감염된 유사한 세포에서 만드는 것보다 적어도 4배 많은 바이러스 게놈/mL의 바이러스를 생산하는 것인 방법.
  60. 제 53 항의 방법에 의해 생산된 아데노-연관 바이러스.
  61. 아데노-연관 바이러스를 생산하는 생산자 세포로서, 상기 생산자 세포는 실질적으로 다음의 폴리펩타이드를 결여한 것인 세포:
    (a) MAAP 공통 폴리펩타이드 서열 서열목록 11의 임의의 30개의 인접하는 잔기에 적어도 50%의 상동성을 가지는 폴리펩타이드;
    (b) MAAP 공통 폴리펩타이드 서열 서열목록 11의 임의의 15개의 인접하는 잔기에 적어도 95%의 상동성을 가지는 폴리펩타이드;
    (c) MAAP 공통 폴리펩타이드 서열 서열목록 11의 잔기 번호 94 내지 120의 임의의 10개의 인접하는 잔기에 적어도 50%의 상동성을 가지는 폴리펩타이드.
  62. 아데노-연관 바이러스를 생산하는 방법으로서, 상기 방법이 제 61 항의 생산자 세포를 배양하고, 여기서 상기 생산자 세포가 아데노-연관 바이러스를 생산하며, 그 다음 상기 아데노-연관 바이러스를 수확하는 것을 포함하는 방법.
  63. 제 62 항의 방법에 의해 생산된 아데노-연관 바이러스.
  64. 아데노-연관 바이러스 게놈을 포함하는 생산자 세포로서, 상기 생산자 세포는 아데노-연관 바이러스를 발현할 수 있으며, 상기 생산자 세포는 실질적으로 전장 기능성 MAAP를 결여한 것인 생산자 세포.
  65. 아데노-연관 바이러스를 생산하는 방법으로서, 상기 방법이 제 64 항의 생산자 세포를 배양하여 상기 생산자 세포가 아데노-바이러스를 생산하도록 하고, 그 다음 상기 아데노-연관 바이러스를 수확하는 것을 포함하는 것인 방법.
  66. 제 65 항의 방법에 의해 생산된 아데노-연관 바이러스.
  67. 제 64 항에 있어서, 상기 아데노-연관 바이러스 게놈이 전장 야생형 기능성 MAAP의 발현에 간섭하는 돌연변이를 가지는 것인 생산자 세포.
  68. 아데노-연관 바이러스를 생산하는 방법으로서, 상기 방법은 생산자 세포가 아데노-바이러스를 생산하도록 제 67 항의 생산자 세포를 배양하고, 그 다음 상기 아데노-연관 바이러스를 수확하는 것을 포함하는 것인 방법.
  69. 제 68 항의 방법에 의해 생산된 아데노-연관 바이러스.
  70. 제 64 항에 있어서, 상기 생산자 세포가 전장 야생형 기능성 MAAP의 발현에 간섭하는 간섭 RNA를 포함하는 생산자 세포.
  71. 아데노-연관 바이러스를 생산하는 방법으로서, 상기 방법은 생산자 세포가 아데노-바이러스를 생산하도록 제 70 항의 생산자 세포를 배양하고, 그 다음 상기 아데노-연관 바이러스를 수확하는 것을 포함하는 것인 방법.
  72. 제 71 항의 방법에 의해 생산된 아데노-연관 바이러스.
  73. 제 64 항에 있어서, 상기 생산자 세포는 단클론 항체 또는 아피바디와 같은, MAAP를 표적으로 하여 MAAP에 결합하거나 MAAP의 기능을 손상시키는 단백질을 포함하는 것인 생산자 세포.
  74. 아데노-연관 바이러스를 생산하는 방법으로서, 상기 방법은 생산자 세포가 아데노-바이러스를 생산하도록 제 73 항의 생산자 세포를 배양하고, 그 다음 상기 아데노-연관 바이러스를 수확하는 것을 포함하는 것인 방법.
  75. 제 71 항의 방법에 의해 생산된 아데노-연관 바이러스.
  76. 아데노-연관 바이러스(AAV)의 안정성 증가, 캡시드 온전성(integrity) 향상, 또는 캡시드 분해를 감소시키는 방법으로서, 상기 방법은 제 1 항 내지 제 47 항 중 어느 한 항의 아데노-연관 바이러스 게놈을 AAV에 포함시키는 것을 포함하는 것인 방법.
  77. 관심 유전자 또는 게놈을 포함하는 AAV 캡시드의 비율을 증가시키는 방법으로서, 제 1 항 내지 제 47 항 중 어느 한 항의 아데노-연관 바이러스 게놈 및 관심 유전자 또는 게놈을 AAV에 포함시키는 것을 포함하는 것인 방법.
  78. AAV를 생산하는 생산자 세포의 바이러스 역가(바이러스 게놈/mL)를 증가시키는 방법으로서, 제 1 항 내지 제 47 항 중 어느 한 항의 아데노-연관 바이러스 게놈을 AAV에 포함시키고, 상기 AAV를 생산자 세포에 도입하는 것을 포함하는 것인 방법.
  79. 제 53 항에 있어서, 상기 생산자 세포를 적어도 30 시간 동안 배양하는 것인 방법.
  80. 제 79 항에 있어서, 상기 생산자 세포를 적어도 36시간, 48시간, 72시간 또는 96시간 동안 배양하는 것인 방법.
  81. AAV를 생산하는 생산자 세포 내에 바이러스 게놈 또는 바이러스 입자의 보유를 증가시키는 방법으로서, 제 1 항 내지 제 47 항 중 어느 한 항의 아데노-연관 바이러스 게놈을 AAV에 포함시키고, 상기 AAV를 생산자 세포에 도입하는 것을 포함하는 것인 방법.
  82. 제 81 항에 있어서, 바람직하게는 실질적으로 배지가 없이, 상기 생산자 세포로부터 바이러스 게놈 또는 바이러스 입자를 수확 및/또는 정제하는 것을 더 포함하는 것인 방법.
KR1020237002671A 2020-06-25 2021-06-25 개선된 아데노 연관 바이러스 유전자 치료 벡터 KR20230078625A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063043837P 2020-06-25 2020-06-25
US63/043,837 2020-06-25
PCT/EP2021/067569 WO2021260204A1 (en) 2020-06-25 2021-06-25 Improved adeno-associated virus gene therapy vectors

Publications (1)

Publication Number Publication Date
KR20230078625A true KR20230078625A (ko) 2023-06-02

Family

ID=76829531

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237002671A KR20230078625A (ko) 2020-06-25 2021-06-25 개선된 아데노 연관 바이러스 유전자 치료 벡터

Country Status (11)

Country Link
US (1) US20230374540A1 (ko)
EP (1) EP4172322A1 (ko)
JP (1) JP2023531281A (ko)
KR (1) KR20230078625A (ko)
CN (1) CN116249771A (ko)
AU (1) AU2021295718A1 (ko)
BR (1) BR112022026292A2 (ko)
CA (1) CA3188161A1 (ko)
IL (1) IL299380A (ko)
MX (1) MX2022016466A (ko)
WO (1) WO2021260204A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118202060A (zh) 2021-10-05 2024-06-14 再生生物股份有限公司 用于重组aav生产的组合物和方法
WO2023220591A1 (en) * 2022-05-13 2023-11-16 The Regents Of The University Of California Compositions and methods for enhanced production of adeno-associated virus

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2403867B1 (en) * 2009-03-04 2019-05-22 Deutsches Krebsforschungszentrum Assembly activating protein (aap) and its use for the manufacture of parvovirus particles essential consisting of vp3
CA3069369A1 (en) * 2017-07-20 2019-01-24 Uniqure Ip B.V. Improved aav capsid production in insect cells

Also Published As

Publication number Publication date
WO2021260204A1 (en) 2021-12-30
CA3188161A1 (en) 2021-12-30
US20230374540A1 (en) 2023-11-23
BR112022026292A2 (pt) 2023-03-07
IL299380A (en) 2023-02-01
MX2022016466A (es) 2023-06-15
EP4172322A1 (en) 2023-05-03
JP2023531281A (ja) 2023-07-21
AU2021295718A1 (en) 2023-02-02
CN116249771A (zh) 2023-06-09

Similar Documents

Publication Publication Date Title
US11015189B2 (en) AAV capsid proteins for nucleic acid transfer
KR102649707B1 (ko) 근이영양증을 치료하기 위한 마이크로-디스트로핀의 아데노-관련 바이러스 벡터 전달
JP2024026872A (ja) アデノ随伴ウイルス変異体及びその使用方法
JP6363958B2 (ja) Aav変異体
CN104619832B (zh) 经修饰的腺伴随病毒载体组合物
JP2023053254A (ja) 筋ジストロフィーを治療するための筋肉特異的マイクロジストロフィンのアデノ随伴ウイルスベクター送達
Bowles et al. Marker rescue of adeno-associated virus (AAV) capsid mutants: a novel approach for chimeric AAV production
JP7081767B2 (ja) アデノ随伴ウイルス(aav)キャプシドタンパク質の変異体
JP2011067212A (ja) ハイブリッドウイルス粒子とその製造方法
US11987801B2 (en) Altering tissue tropism of adeno-associated viruses
JP2002529098A (ja) アデノ随伴ウイルス血清型1核酸配列、ベクターおよび同一物を含有する宿主細胞
WO2011038187A1 (en) Controlled adeno-associated virus (aav) diversification and libraries prepared therefrom
CA3103485A1 (en) Adeno-associated virus vector delivery of muscle specific micro-dystrophin to treat muscular dystrophy
KR20230078625A (ko) 개선된 아데노 연관 바이러스 유전자 치료 벡터
WO2020218419A1 (ja) 脳に指向性を有するaav変異体
JP7360382B2 (ja) 改変されたホスホリパーゼドメインを含むアデノ随伴ウイルス(aav)
AU2019261646A1 (en) Gene therapy for CNS degeneration
CN113025618B (zh) 一种x连锁遗传性视网膜劈裂症的基因治疗方案与应用
AU2023202289A1 (en) Adeno-Associated Variants, Formulations And Methods For Pulmonary Delivery
TW202246516A (zh) 病毒蛋白之控制表現
KR20220110781A (ko) 재조합 aav를 생산하기 위한 신규 조성물 및 방법
KR20210145180A (ko) 엔젤만 증후군을 치료하기 위한 벡터 및 방법
CN114269935A (zh) 用于治疗婴儿贝敦氏病的鞘内和静脉内组合基因疗法
WO2022212616A1 (en) Aav-ids vectors for treatment of mucopolysaccharidosis ii
US20220064668A1 (en) Modified adeno-associated viral vectors for use in genetic engineering