KR20220068954A - 최적화된 페닐알라닌 히드록실라아제 발현 - Google Patents

최적화된 페닐알라닌 히드록실라아제 발현 Download PDF

Info

Publication number
KR20220068954A
KR20220068954A KR1020217042390A KR20217042390A KR20220068954A KR 20220068954 A KR20220068954 A KR 20220068954A KR 1020217042390 A KR1020217042390 A KR 1020217042390A KR 20217042390 A KR20217042390 A KR 20217042390A KR 20220068954 A KR20220068954 A KR 20220068954A
Authority
KR
South Korea
Prior art keywords
sequence
pah
seq
codon
optimized
Prior art date
Application number
KR1020217042390A
Other languages
English (en)
Inventor
타일러 라후젠
링지 샤오
씨 데이비드 파우자
Original Assignee
아메리칸 진 테크놀로지스 인터내셔널 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 아메리칸 진 테크놀로지스 인터내셔널 인코포레이티드 filed Critical 아메리칸 진 테크놀로지스 인터내셔널 인코포레이티드
Publication of KR20220068954A publication Critical patent/KR20220068954A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/44Oxidoreductases (1)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0058Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P3/00Drugs for disorders of the metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/15011Lentivirus, not HIV, e.g. FIV, SIV
    • C12N2740/15023Virus like particles [VLP]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/15011Lentivirus, not HIV, e.g. FIV, SIV
    • C12N2740/15041Use of virus, viral particle or viral elements as a vector
    • C12N2740/15043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16041Use of virus, viral particle or viral elements as a vector
    • C12N2740/16043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/16Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with reduced pteridine as one donor, and incorporation of one atom of oxygen (1.14.16)
    • C12Y114/16001Phenylalanine 4-monooxygenase (1.14.16.1)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Physics & Mathematics (AREA)
  • Epidemiology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Virology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Diabetes (AREA)
  • Obesity (AREA)
  • Hematology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

렌티바이러스 입자를 발현하기 위한 렌티바이러스 벡터 시스템이 개시된다. 렌티바이러스 벡터 시스템은 치료적 벡터를 포함한다. 렌티바이러스 벡터 시스템은 페닐케톤뇨증 (PKU) 으로 고생하는 대상체의 세포에서 PAH 발현을 상향조절하기 위해 코돈-최적화된 PAH 를 인코딩하는 렌티바이러스 입자를 생성한다.

Description

최적화된 페닐알라닌 히드록실라아제 발현
우선권 및 참조에 의한 통합
본 출원은 2019 년 5 월 31 일에 출원한, 명칭이 코돈-최적화된 페닐알라닌 히드록실라아제인 미국 가출원 번호 62/855,506 을 우선권 주장하며, 이는 그 전체가 참조로 포함된다.
기술분야
본 개시물의 양태는 페닐케톤뇨증 (phenylketonuria) (PKU) 을 치료하기 위한 유전적 의약에 관한 것이다. 보다 구체적으로, 본 개시물의 양태는 코돈-최적화된 PAH-함유 렌티바이러스 벡터를 포함하는 렌티바이러스 벡터에 관한 것이다.
페닐케톤뇨증 (PKU) 은 치료받지 않은 채로 있다면 지적 장애, 발작, 행동 문제, 및 영향을 받는 어린이에서 손상된 성장 및 발달을 초래할 수 있는 장애의 이종 군을 나타낸다. 고페닐알라닌혈증이 지적 장애를 초래하는 메커니즘은 고용량 페닐알라닌의 놀라운 독성을 반영하며 신경계 조직의 저수초화 또는 탈수초화를 포함한다. PKU 는 북미에서 12,000 건 중 1 건의 평균 보고 발생률을 가지며, 남성과 여성에게 동일하게 영향을 준다. 이 장애는 유럽인 또는 아메리카 원주민 조상에서 가장 흔하며 동부 지중해 지역에서 훨씬 높은 수준에 이른다.
PKU 환자의 신경학적 변화는 생후 1 개월 이내에 입증되었으며, 성인 PKU 환자의 자기 공명 영상 (MRI) 은 뇌에서의 백질 병변을 보여주었다. 이러한 병변의 크기와 수는 혈중 페닐알라닌 농도와 관련된다. 대조군 대상과 비교하여 PKU 를 갖는 청소년 및 성인의 인지 프로파일은 현저하게 감소된 IQ, 처리 속도, 운동 제어 및 억제 능력, 및 주의력 시험에서의 수행 감소를 포함할 수 있다.
PKU 의 대부분은 간 페닐알라닌 히드록실라아제 (PAH) 의 결핍으로 인해 야기된다. PAH 는 분자 산소 및 촉매량의 테트라히드로바이오프테린 (BH4), 그의 비단백질 보조인자의 존재 하에 페닐알라닌 (Phe) 의 티로신 (Tyr) 으로의 히드록실화를 촉매화하는 다량체성 간 효소이다. PAH 의 충분한 발현의 부재 하에, 혈액 내 페닐알라닌 수치가 증가하여 PKU 환자에서 고페닐알라닌혈증 및 유해한 부작용을 일으킨다. PAH 활성의 감소 또는 부재는 티로신, 및 멜라닌, l-티록신 및 카테콜아민 신경전달물질 (도파민을 포함) 을 포함하는 그의 다운스트림 생성물의 결핍을 유발할 수 있다.
PKU 는 PAH 에서의 돌연변이 및/또는 PAH 보조인자 (즉, BH4) 의 합성 또는 재생 결함에 의해 유발될 수 있다. 특히, 몇몇 PAH 돌연변이는 소포체에서의 단백질 폴딩에 영향을 미치는 것으로 나타났으며, 이는 효소 촉매 활성을 약화시키거나 크게 철폐시키는 단백질 구조에서의 미스센스 돌연변이 (63%) 및 작은 결실 (13%) 로 인한 가속화된 분해 및/또는 응집을 초래한다.
일반적으로, 혈장 Phe 수준, Phe 에 대한 식이 내성 및 치료요법에 대한 잠재적 반응성을 기반으로 하여 PKU 를 분류하기 위해 3 개의 주요 표현형 군이 사용된다. 이들 군은 고전적 PKU (Phe > 1200 μM), 비정형 또는 경증 PKU (Phe 가 600 - 1200 μM 임) 및 영구적인 경증 고페닐알라닌혈증 (HPA, Phe 120 - 600 μM) 을 포함한다.
PKU 의 검출은 보편적 신생아 스크리닝 (NBS) 에 의존한다. 힐 스틱으로부터 채취한 혈액 1 점적을 미국의 모든 50 개 주에서 필수인 스크린에서 페닐알라닌 수치에 대해 검사한다.
현재, Phe 및 BH4 보충의 평생 식이 제한은 PKU 에 대해 유일하게 이용가능한 두 가지 치료 옵션이며, 영향받은 영아에서 최적의 임상 결과를 보장하기 위해 조기 치료 개입이 중요하다. 그러나, 고가의 약물 치료와 특수 저-단백 식품은, 특히 이들 제품이 개인 의료 보험에 의해 완전히 커버되지 않는 경우, 영양결핍, 심리사회적 또는 신경인지적 합병증으로 이어질 수 있는 환자에 대한 큰 부담을 부과한다. 또한, BH4 치료요법은 BH4 생합성에서의 결함과 관련된 바에 따라 경증 고페닐알라닌혈증의 치료에 주로 효과적인 반면, 경증 또는 고전적 PKU 를 갖는 환자의 오직 20-30% 만이 반응성이다. 따라서, 과도한 Phe-제한 식단에 대한 대안으로서 PKU 를 위한 새로운 치료 방식이 필요하다.
유전적 의약은 PKU 를 효과적으로 치료하는 가능성을 갖는다. 유전적 의약은 질환 치료요법 또는 예방의 목적을 위해 유전적 구축물의 전달 및 발현을 수반할 수 있다. 유전적 구축물의 발현은 다양한 프로모터, 인핸서 및/또는 이의 조합에 의해 조정될 수 있다.
발명의 개요
한 양태에서, 치료적 카고 (cargo) 부분을 포함하는 바이러스 벡터가 제공되며, 여기서 치료적 카고 부분은 조정된 페닐알라닌 히드록실라아제 (PAH) 발현을 위한 변형된 PAH 서열 또는 이의 변이체를 포함한다. 추가의 양태에서, 치료적 카고 부분을 포함하는 바이러스 벡터가 제공되며, 여기서 치료적 카고 부분은 향상된 PAH 발현을 위한 코돈-최적화된 PAH 서열 또는 이의 변이체, 및 임의로는 프로모터 및 간-특이적 인핸서를 포함하고, PAH 서열 또는 이의 변이체는 프로모터 및 간-특이적 인핸서 둘 모두에 의해 작동적으로 제어된다.
구현예에서, 바이러스 벡터는 SEQ ID NO: 70 과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 서열 동일성을 갖는 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함한다. 구현예에서, 바이러스 벡터는 SEQ ID NO: 70 의 서열을 포함하는 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함한다.
한 양태에서, 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함하는 바이러스 벡터가 제공되며, 여기서 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 71 과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖는다. 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 71 의 서열을 포함한다. 구현예에서, 바이러스 벡터는 코돈-최적화된 PAH 서열 또는 이의 변이체, 프로모터 및 간-특이적 인핸서를 포함하는 치료적 카고 부분을 추가로 포함하며, 여기서 코돈-최적화된 PAH 서열 또는 이의 변이체는 프로모터 및 간-특이적 인핸서 둘 모두에 의해 작동적으로 제어된다.
한 양태에서, 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함하는 바이러스 벡터가 제공되며, 여기서 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 72 와 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖는다. 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 72 의 서열을 포함한다. 구현예에서, 바이러스 벡터는 코돈-최적화된 PAH 서열 또는 이의 변이체, 프로모터 및 간-특이적 인핸서를 포함하는 치료적 카고 부분을 추가로 포함하며, 여기서 코돈-최적화된 PAH 서열 또는 이의 변이체는 프로모터 및 간-특이적 인핸서 둘 모두에 의해 작동적으로 제어된다.
구현예에서, 간-특이적 인핸서는 프로트롬빈 인핸서를 포함한다. 구현예에서 프로트롬빈 인핸서는 SEQ ID NO: 3 과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일성을 갖는 서열을 포함한다. 구현예에서, 프로트롬빈 인핸서는 SEQ ID NO: 3 의 서열을 포함한다.
구현예에서, 프로모터는 간-특이적 프로모터를 포함한다. 구현예에서, 간-특이적 프로모터는 hAAT 프로모터를 포함한다. 구현예에서, hAAT 프로모터는 SEQ ID NO: 4 와 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일성을 갖는 서열을 포함한다. 구현예에서, hAAT 프로모터는 SEQ ID NO: 4 의 서열을 포함한다.
구현예에서, 치료적 카고 부분은 베타 글로빈 인트론을 추가로 포함한다. 구현예에서, 베타 글로빈 인트론은 SEQ ID NOS: 5 또는 6 과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일성을 갖는 서열을 포함한다. 구현예에서, 베타 글로빈 인트론은 SEQ ID NOS: 5 또는 6 의 서열을 포함한다.
구현예에서, 치료적 카고 부분은 적어도 하나의 간세포 핵 인자 결합 위치를 추가로 포함한다. 구현예에서, 간세포 핵 인자 결합 위치는 SEQ ID NOS: 7 (1XHNF1), 8 (5XHNF1), 9 (1XHNF1/4) 또는 10 (3XHNF1/4) 와 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일성을 갖는 서열을 포함한다. 구현예에서, 간세포 핵 인자 결합 위치는 SEQ ID NOS: 7, 8, 9 또는 10 의 서열을 포함한다.
구현예에서, 적어도 하나의 간세포 핵 인자 결합 위치는 프로트롬빈 인핸서의 다운스트림에 배치되어 있다.
구현예에서, 치료적 카고 부분은 적어도 하나의 작은 RNA 서열을 추가로 포함한다. 구현예에서, 적어도 하나의 작은 RNA 서열은 SEQ ID NOS: 11 또는 12 와 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일성을 갖는 서열을 포함한다. 구현예에서, 적어도 하나의 작은 RNA 서열은 제 1 프로모터의 제어 하에 있으며, PAH 서열은 제 2 프로모터의 제어 하에 있다. 구현예에서, 제 1 프로모터는 H1 프로모터이다. 구현예에서, 제 2 프로모터는 간-특이적 프로모터이다.
구현예에서, 바이러스 벡터는 렌티바이러스 벡터 또는 아데노-관련 바이러스 벡터이다. 구현예에서, 바이러스 벡터는 본원에 기재된 코돈-최적화된 PAH 서열을 전달하기에 적합한 렌티바이러스 벡터 또는 또 다른 바이러스 벡터 또는 비-바이러스 시스템이다. 구현예에서, 바이러스 벡터는 렌티바이러스 벡터이다.
한 양태에서, 치료적 카고 부분을 포함하는 바이러스 벡터가 제공되며, 여기서 치료적 카고 부분은 SEQ ID NO: 70 과 95% 초과의 서열 동일성을 공유하는 서열을 포함하는 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함한다. 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 70 을 포함한다.
한 양태에서, 치료적 카고 부분을 포함하는 바이러스 벡터가 제공되며, 여기서 치료적 카고 부분은 SEQ ID NO: 71 과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖는 서열을 포함하는 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함한다. 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 71 을 포함한다.
한 양태에서, 치료적 카고 부분을 포함하는 바이러스 벡터가 제공되며: 여기서 치료적 카고 부분은 SEQ ID NO: 72 와 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖는 서열을 포함하는 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함한다. 구현예에서, 코돈-최적화된 서열 또는 이의 변이체는 SEQ ID NO: 72 를 포함한다.
한 양태에서, 치료적 카고 부분을 포함하는 바이러스 벡터가 제공되며: 여기서 치료적 카고 부분은 SEQ ID NO: 73 과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖는 서열을 포함하는 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함한다. 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 73 의 서열을 포함한다.
한 양태에서, 치료적 카고 부분을 포함하는 바이러스 벡터가 제공되며: 여기서 치료적 카고 부분은 SEQ ID NO: 74 와 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖는 서열을 포함하는 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함한다. 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 74 의 서열을 포함한다.
한 양태에서, 치료적 카고 부분을 포함하는 바이러스 벡터가 제공되며, 여기서 치료적 카고 부분은 SEQ ID NO: 75 와 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖는 서열을 포함하는 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함한다. 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 75 의 서열을 포함한다.
한 양태에서, 치료적 카고 부분을 포함하는 바이러스 벡터가 제공되며: 여기서 치료적 카고 부분은 SEQ ID NO: 76 과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖는 서열을 포함하는 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함한다. 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 76 의 서열을 포함한다.
한 양태에서, SEQ ID NO: 73 과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖는 서열을 포함하는 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함하는 바이러스 벡터가 제공된다. 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 73 의 서열을 포함한다. 구현예에서, 바이러스 벡터는 코돈-최적화된 PAH 서열 또는 이의 변이체, 프로모터 및 간-특이적 인핸서를 포함하는 치료적 카고 부분을 추가로 포함하며, 코돈-최적화된 PAH 서열 또는 이의 변이체는 프로모터 및 간-특이적 인핸서 둘 모두에 의해 작동적으로 제어된다.
한 양태에서, SEQ ID NO: 74 와 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖는 서열을 포함하는 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함하는 바이러스 벡터가 제공된다. 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 74 의 서열을 포함한다. 구현예에서, 바이러스 벡터는 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함하며 프로모터 및 간-특이적 인핸서를 추가로 포함하는 치료적 카고 부분을 추가로 포함하고, 여기서 코돈-최적화된 PAH 서열 또는 이의 변이체는 프로모터 및 간-특이적 인핸서 둘 모두에 의해 작동적으로 제어된다.
한 양태에서, SEQ ID NO: 75 와 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖는 서열을 포함하는 코돈-최적화된 PAH 서열 또는 이의 변이체를 갖는 바이러스 벡터가 제공된다. 구현예에서, 코돈-최적화된 서열 또는 이의 변이체는 SEQ ID NO: 75 를 포함한다. 구현예에서, 바이러스 벡터는 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함하며 프로모터 및 간-특이적 인핸서를 추가로 포함하는 치료적 카고 부분을 추가로 포함하고, 여기서 코돈-최적화된 PAH 서열 또는 이의 변이체는 프로모터 및 간-특이적 인핸서 둘 모두에 의해 작동적으로 제어된다.
한 양태에서, SEQ ID NO: 76 과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖는 서열을 포함하는 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함하는 바이러스 벡터가 제공된다. 구현예에서, 코돈-최적화된 서열 또는 이의 변이체는 SEQ ID NO: 76 을 포함한다. 구현예에서, 바이러스 벡터는 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함하며 프로모터 및 간-특이적 인핸서를 추가로 포함하는 치료적 카고 부분을 추가로 포함하고, 여기서 코돈-최적화된 PAH 서열 또는 이의 변이체는 프로모터 및 간-특이적 인핸서 둘 모두에 의해 작동적으로 제어된다.
한 양태에서, 패키징 세포에 의해 생성되며 표적 세포를 감염시킬 수 있는 렌티바이러스 입자가 개시된다. 구현예에서, 렌티바이러스 입자는 표적 세포를 감염시킬 수 있는 외피 단백질, 및 본원에 상세히 나타낸 바와 같은 바이러스 벡터를 포함한다.
한 양태에서, 대상체에서의 페닐케톤뇨증 (PKU) 의 치료 방법이 개시된다. 방법은 본원에서 상세히 나타낸 바와 같은 치료적 유효량의 렌티바이러스 입자를 대상체에게 투여하는 것을 포함한다.
한 양태에서, 대상체에서의 PKU 를 치료하기 위한 코돈-최적화된 PAH 서열 또는 이의 변이체의 용도가 제공된다. 또 다른 양태에서, 대상체에서의 PKU 를 치료하기 위한 약제를 제형화하기 위한 코돈-최적화된 PAH 서열 또는 이의 변이체의 용도가 제공된다.
한 양태에서, 대상체에서의 PKU 를 치료하는데 사용하기 위한 코돈-최적화된 PAH 서열 또는 이의 변이체가 제공된다. 또 다른 양태에서, 대상체에서의 PKU 를 치료하는데 사용하기 위한 약제를 제형화하기 위한 코돈-최적화된 PAH 서열 또는 이의 변이체가 제공된다.
도 1 은 원형화된 형태의 예시적 3-벡터 렌티바이러스 벡터 시스템을 도시한다.
도 2 는 원형화된 형태의 예시적 4-벡터 렌티바이러스 벡터 시스템을 도시한다.
도 3 은 PAH 의 발현을 조절하기 위한 hAAT 프로모터 및 프로트롬빈 인핸서의 변이를 함유하는 4 개의 예시적 렌티바이러스 벡터의 선형 맵을 도시한다.
도 4A- 4B 는 hPAH 및 다양한 형태의 코돈-최적화된 PAH 서열의 형질도입 후 Hepa1-6 세포에서의 PAH 의 수준을 비교하는 면역블롯 데이터를 도시한다. 도 4A 는 hPAH 와 OPT2 코돈-최적화된 PAH 를 비교한다. 도 4B 는 hPAH 와 코돈-최적화된 PAH 의 OPT3, OPT2/3 및 OPT3/2 버전을 비교한다.
도 5 는 렌티바이러스 벡터 발현 hPAH 및 코돈-최적화된 버전의 PAH 로 형질도입된 Hepa1-6 세포에서의 PAH RNA 발현을 도시한다.
도 6A- 6B 는 코돈-최적화된 PAH 의 수준을 프로트롬빈 인핸서 업스트림의 HNF1 및 HNF1/4 결합 위치와 비교하는 면역블롯 데이터를 도시한다. 도 6A 는 Hepa1-6 세포에서의 면역블롯 데이터를 도시한다. 도 6B 는 Hep3B 세포에서의 면역블롯 데이터를 도시한다.
도 7 은 코돈-최적화된 PAH 의 수준을 프로트롬빈 인핸서/hAAT 프로모터/마우스 미세 바이러스 인트론 또는 hAAT 인핸서/트란스타이레틴 프로모터/마우스 미세 바이러스 인트론을 함유하는 조절 서열과 비교하는 면역블롯 데이터를 도시한다.
도 8 은 코돈-최적화된 PAH 의 수준을 돌연변이체 WPRE 서열 또는 짧은 WPRE (WPREs) 서열, 또는 PAH 또는 알부민 3' UTR 서열을 함유하는 조절 서열과 비교하는 면역블롯 데이터를 도시한다.
발명의 상세한 설명
개시물의 개괄
본 개시물은 치료적 벡터 및 세포로의 이의 전달에 관한 것이다. 한 양태에서, 치료적 벡터는 치료적 카고 부분을 포함하는 바이러스 벡터이며: 여기서 치료적 카고 부분은 코돈-최적화된 PAH 서열 또는 이의 변이체; 프로모터; 및 간-특이적 인핸서를 포함하고, PAH 서열 또는 이의 변이체는 프로모터 및 간-특이적 인핸서 둘 모두에 의해 작동적으로 제어된다. 구현예에서, 벡터는 코돈-최적화된 PAH 서열 또는 이의 변이체, 및/또는 간-특이적 인핸서를 포함한다. 구현예에서, 벡터는 숙주 (즉, 내인성) PAH 단백질 발현을 조절하는 작은 RNA 를 포함한다. 구현예에서, 바이러스 벡터는 렌티바이러스 벡터이다.
정의
본원에서 달리 정의되지 않는 한, 본 개시물과 관련하여 사용된 과학 및 기술 용어는 당업자에게 일반적으로 이해되는 의미를 가질 것이다. 또한, 문맥에서 달리 요구되지 않는 한, 단수형 용어는 복수형을 포함할 것이고, 복수형 용어는 단수형을 포함할 것이다. 일반적으로, 본원에 기재된 세포 및 조직 배양, 분자 생물학, 면역학, 미생물학, 유전학 및 단백질 및 핵산 화학 및 하이브리드화와 관련하여 사용된 명명법 및 이의 기법은 당업계에 잘 공지되어 있으며 통상적으로 사용되는 것들이다. 본 개시물의 방법 및 기법은 일반적으로 당업계에 잘 공지된 종래의 방법에 따라, 그리고 달리 지시되지 않는 한 본 명세서 전반에 걸쳐 인용되고 논의된 다양한 일반적이고 보다 구체적인 참고문헌에 기재된 바와 같이 수행된다. 예를 들어, 다음을 참조한다: Sambrook J. & Russell D. Molecular Cloning: A Laboratory Manual, 3rd ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2000); Ausubel et al., Short Protocols in Molecular Biology: A Compendium of Methods from Current Protocols in Molecular Biology, Wiley, John & Sons, Inc. (2002); Harlow and Lane Using Antibodies: A Laboratory Manual; Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (1998); 및 Coligan et al., Short Protocols in Protein Science, Wiley, John & Sons, Inc. (2003). 임의의 효소 반응 또는 정제 기법은 당업계에서 일반적으로 달성되거나 본원에 기재된 바와 같이 제조사의 사양에 따라 수행된다. 본원에 기재된 분석 화학, 합성 유기 화학, 및 의학 및 제약 화학과 관련하여 사용된 명명법 및 이의 실험실 절차 및 기법은 당업계에 잘 공지되며 통상적으로 사용되는 것들이다.
본원에서 사용되는 바와 같이, 단수형 형태는 문맥에서 달리 나타내지 않는 한, 복수형 형태와 상호교환가능하게 사용되며 복수형 형태를 포함하는 것 뿐만 아니라 각각의 의미 내에 포함되는 것으로 의도된다. 또한, 본원에서 사용되는 바와 같이, "및/또는" 은 하나 이상의 열거된 항목의 임의의 및 모든 가능한 조합 뿐만 아니라 대안으로 해석될 때의 조합 부족 ("또는") 을 나타내며 포함한다.
모든 숫자 지정, 예를 들어 범위를 포함하는, %, pH, 온도, 시간, 농도 및 분자량은 변화, 예를 들어 0.1% 또는 0.1 씩 (+) 또는 (-) 증분을 포함할 수 있는 근사치이다. 항상 명확하게 언급되지 않더라도, 모든 수치 지정은 용어 "약" 이 선행된다는 것이 이해된다. 항상 명확하게 언급되지 않더라도, 본원에서 기재되는 시약은 단지 예시적이며 이들의 등가물이 당업계에 공지되어 있다는 것이 이해된다.
본원에서 사용되는 용어 "약" 은 당업자에 의해 이해될 것이며 사용되는 문맥에 따라서 어느 정도 가변적일 것이다. 사용되는 문맥을 고려했을 때 당업자에게 분명하지 않은 용어가 사용되는 경우, "약" 은 값 및 그 값의 플러스 또는 마이너스 10% 까지를 포함할 것이다. 용어 "약" 은 "X" + 0.1% 또는 X - 0.1% 와 같은 "X" 의 작은 증분에 더하여 정확한 값 "X" 를 또한 포함한다.
본원에서 사용되는 용어 "~의 투여" 또는 "투여하는" 은 치료적으로 유용한 형태 및 치료적 유효량으로 개체의 신체에 도입할 수 있는 형태로 치료를 필요로 하는 대상체에게 임의의 개시된 벡터, 벡터 조성물, 약학 조성물, 또는 본원에 개시된 다른 활성제를 제공하는 것을 의미한다. 개시된 벡터, 벡터 조성물, 또는 다른 활성제를 투여하는 방법은 본원에 개시된 방법 중 임의의 것일 수 있다.
본원에서 사용되는 어구 "코딩 서열" 은 전사 또는 역전사될 수 있는 임의의 바이러스 벡터 서열을 기재한다. "코딩 서열" 은 전사되거나 역전사될 수 있는 외인성 서열 (예를 들어, 세포 내로 형질도입되거나 형질감염된 벡터 상의 서열) 을 포함하나 이에 제한되지는 않는다.
본원에서 사용되는 용어 "코돈-최적화된" 은 하기; (i) 인코딩된 단백질의 아미노산 서열을 보존하지만 인코딩 RNA 의 조성 및/또는 구조를 변경시키는 대안적 코돈으로 자연 발생 코돈 서열을 치환하는 것; (ii) 코딩 서열의 자연 발생 구아노신 시토신 함량에 관해 코딩 서열의 구아노신 시토신 함량을 조정하는 것; (iii) 자연 발생 코딩 서열에서의 CpG 위치의 수에 관해 코딩 서열의 CpG 위치의 수를 조정하는 것; 및 (iv) (ii) 구아노신 시토신 함량 및/또는 (iii) CpG 위치의 수에 관해 대안적 코돈으로 자연 발생 코돈 서열을 치환하는 것 중 적어도 하나에 따라 코딩 서열을 조정하는 것을 의미한다. 코돈 최적화는 특정 조직에서의 tRNA 발현의 맥락에서 코돈의 조정을 포함할 수 있고/있거나 자연적, 조직-특이적 shRNA 또는 miRNA 의 작용을 회피하는 방법을 포함할 수 있다.
본원에서 사용되는 용어 "포함하는" 은 조성물 및 방법이 열거된 요소를 포함하지만 다른 것은 배제하지 않는다는 것을 의미한다. 조성물 및 방법을 정의하는데 사용되는 경우 "~로 본질적으로 이루어지는" 은 조성물 또는 방법에 임의의 필수적인 중요한 다른 요소를 배제하는 것을 의미한다. "~로 이루어지는" 은 청구된 조성물 및 실질적인 방법 단계에 대한 다른 구성성분의 미량 초과의 요소를 배제하는 것을 의미한다. 이들 전환 용어 각각에 의해 정의되는 구현예는 본 개시물의 범주 내에 있다. 따라서, 방법 및 조성물이 추가의 단계 및 성분을 포함할 수 있거나 (포함하는), 대안적으로, 중요하지 않은 단계 또는 조성물을 포함하거나 (본질적으로 이루어지는), 또는 대안적으로, 오직 언급된 방법 단계 및 조성물을 의도하는 (이루어지는) 것으로 의도된다.
본원에서 사용되는 용어 "CpG 위치" 는 5' → 3' 방향을 따라 염기의 선형 서열에서 시토신 뉴클레오티드 이후에 구아닌 뉴클레오티드가 이어지는 DNA 부위를 의미한다. CpG 위치는 CpG 섬 (또는 CG 섬) 으로 불리는 게놈 부위에서 높은 빈도로 발생한다. CpG 디뉴클레오티드에서의 시토신은 메틸화되어 5-메틸시토신을 형성할 수 있다. 포유동물에서, 70% 내지 80% 의 CpG 시토신이 메틸화된다. 유전자 내의 시토신을 메틸화하는 것은 그의 발현을 변화시킬 수 있다.
본원에서 사용되는 용어 "UTR" 은 일반적으로 RNA 스플라이싱이 완료된 후 남아 있는 메신저 RNA (mRNA) 의 미번역 부위를 의미한다. 본원에서 사용되는 "3' UTR" 은 번역 종결 코돈에 바로 뒤이어지는 mRNA 의 미번역 부위를 의미한다. 3' UTR 은 생성 단백질로 번역되지 않는다.
본원에서 사용되는 용어 "아데노-연관 바이러스 벡터" 는 치료적 DNA 카고를 세포 또는 조직 내로 전달하기 위해 아데노-연관 바이러스의 구조 성분을 사용하는 합성 전달 시스템을 의미한다. 용어 "아데노-연관 바이러스 벡터" 는 또한 본원에서 "AAV 벡터" 로서 지칭될 수 있다.
본원에서 사용되는 용어 "아데노-연관 바이러스" 는 가벼운 면역 반응을 생성시키고, 숙주 세포에서 그 자체의 염색체외 DNA 카피를 침착시킬 수 있고, 간혹 DNA 카피를 숙주 게놈 내로 통합하고, 상대적으로 비-병원성인, 작은 바이러스를 의미한다. 아데노-연관 바이러스는 본원에 기재된 바와 같이 AAV2 를 포함하지만 이에 제한되지는 않는 다수의 자연적 및 합성 혈청형을 포함한다.
본원에서 사용되는 용어 "AAV/DJ" (또한 본원에서 "AAV-DJ" 로서 언급됨) 는 야생형 AAV 혈청형보다 더 높은 형질도입율 및 감염율을 매개하는, 상이한 AAV 혈청형으로부터 조작된 AAV 벡터의 혈청형이다.
본원에서 사용되는 용어 "AAV2" (또한 본원에서 "AAV/2" 또는 "AAV-2" 로서 언급됨) 는 자연 발생하는 AAV 혈청형이다.
본원에서 사용되는 용어 "ApoE 인핸서" 는 아포지질단백질 E 인핸서를 의미한다.
본원에서 사용되는 용어 "발현", "발현된" 또는 "인코딩하는" 은 폴리뉴클레오티드가 mRNA 로 전사되거나 DNA 로 역전사되는 과정 및/또는 전사된 mRNA 가 이후 펩티드, 폴리펩티드 또는 단백질로 번역되는 과정을 의미한다. 발현은 진핵생물 세포에서 mRNA 의 스플라이싱 또는 전사후 변형 또는 번역후 변형의 다른 형태를 포함할 수 있다.
본원에서 사용되는 용어 "유전적 의약" 또는 "유전적 의약들" 은 일반적으로 임상적 질환 또는 징후를 치료하기 위해 유전적 표적에 초점을 두는 치료제 및 치료 전략을 의미한다. 용어 "유전적 의약" 은 유전자 요법 등을 포함한다.
본원에서 사용되는 용어 "hAAT" 는 hAAT 프로모터를 지칭한다.
본원에서 사용되는 용어 "간세포 핵 인자" 는 간에서 우세하게 발현되는 전사 인자를 의미한다. 간세포 핵 인자의 유형은 간세포 핵 인자 1, 간세포 핵 인자 2, 간세포 핵 인자 3 및 간세포 핵 인자 4 를 포함하지만 이에 제한되지는 않는다.
본원에서 사용되는 용어 "HNF" 는 간세포 핵 인자를 지칭한다. 따라서 HNF1 은 간세포 핵 인자 1 을 의미하고, HNF2 는 간세포 핵 인자 2 를 의미하고, HNF3 은 간세포 핵 인자 3 을 의미하고, HNF4 는 간세포 핵 인자 4 를 의미한다.
본원에서 사용되는 용어 "HNF 결합 위치" 는 HNF 전사 인자가 결합할 수 있는 DNA 부위를 의미한다. 따라서, HNF1 결합 위치는 HNF1 이 결합할 수 있는 DNA 부위이고, HNF4 결합 위치는 HNF4 가 결합할 수 있는 DNA 부위이다.
본원에서 사용되는 용어 "인간 베타 글로빈 인트론" 은 RNA 성숙 동안 스플라이싱되며 단백질에 대해 코딩하지 않는 인간 베타 글로빈 유전자 내의 핵산 분절을 의미한다.
본원에서 사용되는 용어 "개체", "대상체" 및 "환자" 는 본원에서 상호교환가능하게 사용되며, 임의의 개별 포유동물 대상체, 예를 들어, 쥐, 돼지, 소, 개, 고양이, 말, 비인간 영장류 또는 인간 영장류를 의미한다.
본원에서 사용되는 용어 "LV" 는 일반적으로 "렌티바이러스" 를 의미한다. 비제한적 예로서, "LV-PAH" 에 대한 언급은 PAH 서열을 함유하고 PAH 를 발현하는 렌티바이러스에 대한 언급이다. PAH 서열은 hPAH 서열 또는 코돈-최적화된 PAH 서열일 수 있다.
본원에서 사용되는 용어 "LV-Pro-hAAT-PAH" 는 프로트롬빈 인핸서, hAAT 프로모터 및 PAH 서열을 포함하는 LV 벡터를 의미한다.
본원에서 사용되는 용어 "패키징 세포주" 는 렌티바이러스 입자를 발현하는데 사용될 수 있는 임의의 세포주를 의미한다.
본원에서 사용되는 용어 "동일성 %" 또는 "서열 동일성 %" 는, 2 개 이상의 핵산 또는 폴리펩티드 서열의 맥락에서, 하기 기재된 서열 비교 알고리즘 중 하나 (예를 들어 BLASTP 및 BLASTN 또는 기타 숙련자가 이용가능한 기타 알고리즘) 또는 육안 검사에 의해 측정된 바와 같은, 최대 상응성을 위해 비교되고 정렬될 때 동일한 특정 백분율의 뉴클레오티드 또는 아미노산 잔기를 갖는 2 개 이상의 서열 또는 하위서열을 의미한다. 적용에 따라, "동일성 %" 또는 "서열 동일성 %" 는 비교되는 서열의 부위에 걸쳐, 예를 들어, 기능적 도메인에 걸쳐 존재할 수 있거나, 대안적으로, 비교될 2 개 서열의 전체 길이에 걸쳐 존재할 수 있다. 서열 비교를 위해, 전형적으로 하나의 서열은 시험 서열을 그에 대해 비교하는 참조 서열로서 작용한다. 서열 비교 알고리즘을 사용하는 경우, 시험 및 참조 서열이 컴퓨터에 입력되고, 필요하다면 하위서열 좌표가 지정되며, 서열 알고리즘 프로그램 매개변수가 지정된다. 이후, 서열 비교 알고리즘은 지정된 프로그램 매개변수를 기반으로 하여, 참조 서열에 대한 시험 서열(들) 의 서열 동일성 % 를 계산한다.
본원에서 사용되는 용어 "약학적으로 허용가능한" 은 타당한 의료적 판단의 범주 내에서, 과도한 독성, 자극, 알레르기 반응, 또는 기타 문제점 또는 합병증이 합당한 이익/위험 비에 비례하지 않으면서, 인간 및 동물의 조직, 기관 및/또는 체액과 접촉하여 사용하기에 적합한 이러한 화합물, 물질, 조성물 및/또는 투약 형태를 의미한다.
본원에서 사용되는 용어 "페닐알라닌 히드록실라아제" 는 또한 본원에서 PAH 로도 지칭될 수 있다. 용어 페닐알라닌 히드록실라아제는 모든 야생형, 변이체의 뉴클레오티드 및 펩티드 서열, 및 PAH 서열의 단편을 포함하는 코돈-최적화된 PAH 서열을 포함한다. 제한 없이, 용어 페닐알라닌 히드록실라아제는 SEQ ID NOS: 1, 2 및 70-76 에 대한 언급을 포함하고, 이와 적어도 약 75% 동일성을 갖는 변이체를 추가로 포함한다.
본원에서 사용되는 용어 "hPAH" 는 그의 코돈이 합성적으로 변경되지 않은 인간 또는 인간 공급원에서 유래한 PAH 서열을 의미한다.
본원에서 사용되는, 본원에서 "PKU" 로도 지칭되는 용어 "페닐케톤뇨증" 은 페닐알라닌 히드록실라아제의 만성 결핍 뿐만 아니라 경증 및 고전적 형태의 질환을 포함하여 이와 관련된 모든 증상을 의미한다. 따라서, "페닐케톤뇨증" 은 PKU 와 관련된 모든 또는 일부 증상의 치료에 관한 것일 수 있다.
본원에서 사용되는 용어 "프로트롬빈 인핸서" 는 프로트롬빈 유전자의 전사를 초래하는, 단백질에 의해 결합될 수 있는 프로트롬빈 유전자 상의 부위이다.
본원에서 사용되는 용어 "Pro" 는 프로트롬빈 인핸서를 의미한다.
본원에서 사용되는 용어 "토끼 베타 글로빈 인트론" 은 RNA 성숙 동안 스플라이싱되며 단백질에 대해 코딩하지 않는 토끼 베타 글로빈 유전자 내의 핵산 분절을 의미한다.
본원에서 사용되는 용어 "작은 RNA" 는 일반적으로 약 200 개 이하의 뉴클레오티드 길이이며 침묵 또는 간섭 기능을 갖는 비-코딩 RNA 를 의미한다. 다른 구현예에서, 작은 RNA 는 약 175 개 이하의 뉴클레오티드, 약 150 개 이하의 뉴클레오티드, 약 125 개 이하의 뉴클레오티드, 약 100 개 이하의 뉴클레오티드, 또는 약 75 개 이하의 뉴클레오티드 길이이다. 이러한 RNA 는 microRNA (miRNA), 작은 간섭 RNA (siRNA), 이중 가닥 RNA (dsRNA), 및 짧은 헤어핀 RNA (shRNA), 작은 핵 RNA (snRNA), 및 작은 핵소체 RNA (snoRNA) 를 포함한다. 개시물의 "작은 RNA" 는 일반적으로 표적 유전자 mRNA 의 파괴를 초래하는 경로 또는 표적 유전자 mRNA 의 번역을 방지하는 경로를 통해, 표적 유전자의 발현을 억제 또는 녹다운시킬 수 있어야 한다.
본원에서 사용되는 용어 "shPAH" 는 PAH 를 표적화하는 작은 헤어핀 RNA 를 의미한다.
본원에서 사용되는 용어 "SEQ ID NO" 는 용어 "서열 ID 번호 (Sequence ID No)" 와 동의어이다.
본원에서 사용되는 용어 "티록신 결합 글로불린" 은 혈류에서 티로이드 호르몬을 운반하는 책임을 지는 수송 단백질이다. 본원에서 사용되는 약어 "TBG" 는 티록신 결합 글로불린을 의미한다.
본원에서 사용되는 용어 "치료적 유효량" 은 특정한 질병, 상해, 질환 또는 병상을 앓고 있는 환자에서 보이는 합병증의 증상, 진행 또는 개시를 치료하거나 예방하기 위한, 적합한 조성물, 및 적합한 투약 형태 중 본 개시물의 활성제의 충분한 양을 의미한다. 치료적 유효량은 환자의 병상의 상태 또는 이의 중증도, 및 치료하려는 대상체의 연령, 체중 등에 따라 가변적일 것이다. 치료적 유효량은 예를 들어 투여 경로, 대상체의 병상 뿐만 아니라 당업자에 의해 이해되는 기타 인자를 포함하는, 임의의 수많은 인자에 따라 가변적일 수 있다.
본원에서 사용되는 용어 "치료적 벡터" 는 렌티바이러스 벡터 또는 아데노-연관 바이러스 (AAV) 벡터에 대한 언급을 포함하지만 이에 제한되지는 않는다. 추가로, 렌티바이러스 벡터 시스템과 관련하여 본원에서 사용되는 용어 "벡터" 는 용어 "플라스미드" 와 동의어이다. 예를 들어, 2-벡터 및 3-벡터 패키징 시스템을 포함하는 3-벡터 및 4-벡터 시스템은 또한, 3-플라스미드 및 4-플라스미드 시스템으로도 지칭될 수 있다.
본원에서 사용되는 용어 "치료" 또는 "치료하는" 은 일반적으로 치료하는 대상체의 자연적 과정을 변경시키려고 시도하는 중재술을 의미하며, 예방을 위해 또는 임상 병리학 과정 동안 수행될 수 있다. 바람직한 효과는 질환의 발생 또는 재발의 예방, 증상의 완화, 질환의 임의의 직접적 또는 간접적 병리학적 결과의 저해, 감소 또는 억제, 질환 상태의 경감 또는 일시적 완화, 및 차도의 야기 또는 개선된 예후를 포함하지만 이에 제한되지는 않는다. "치료" 는 질환 상태를 표적으로 하여 그것과 싸우는 것, 즉, 질환 상태를 완화 또는 예방하는 것으로 의도된다. 따라서 특정한 치료는 표적이 될 질환 상태, 및 의학적 치료요법 및 치료적 접근방식의 현재 또는 미래 상태에 따라 좌우될 것이다. 치료는 연관된 독성을 가질 수 있다.
본원에서 사용되는 용어 "절두된" 은 또한 본원에서 "단축된" 또는 "~없이" 로 지칭될 수 있다.
본원에서 사용되는 용어 "변이체" 는 참조 서열과 비교하여, 단일 뉴클레오티드 다형성, 단일 뉴클레오티드 변이, 전환, 반전, 복제, 결실 또는 치환 중 적어도 하나를 함유하는 뉴클레오티드 서열을 의미한다. "변이체"는 "변이체" 뉴클레오티드 서열에서 유래하는 아미노산 서열 뿐만 아니라 그에 대한 전사 후 및 번역 후 변형을 포함한다.
본원에서 고려되는 바와 같이, 최적의 서열 정렬을 예를 들어 Smith & Waterman, Adv. Appl. Math. 2:482 (1981) 의 국부적 상동성 알고리즘에 의해, Needleman & Wunsch, J. Mol. Biol. 48:443 (1970) 의 상동성 정렬 알고리즘에 의해, Pearson & Lipman, Proc. Nat'l. Acad. Sci. USA 85:2444 (1988) 의 유사성 방법에 대한 검색에 의해, 이들 알고리즘의 컴퓨터화된 실행 (Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, Wis. 에서의 GAP, BESTFIT, FASTA 및 TFASTA) 에 의해, 또는 육안 검사 (일반적으로 상기 Ausubel et al. 참조) 에 의해 실시할 수 있다.
서열 동일성 % 및 서열 유사성을 결정하기에 적합한 알고리즘의 한 예는 BLAST 알고리즘이며 이는 Altschul et al., J. Mol. Biol. 215:403-410 (1990) 에 기재되어 있다. BLAST 분석을 수행하기 위한 소프트웨어는 국립생물정보센터 (National Center for Biotechnology Information) 웹사이트로부터 공개적으로 입수가능하다.
본 개시물의 핵산 및 단백질 서열은 또한, 예를 들어, 관련된 서열을 확인하기 위해 공개적 데이터베이스에 대한 검색을 수행하기 위한 "질의 서열 (query sequence)" 로서 사용될 수 있다. 이러한 검색은 Altschul, et al. (1990) J. Mol. Biol . 215:403-10 의 NBLAST 및 XBLAST 프로그램 (version 2.0) 을 사용하여 수행될 수 있다. BLAST 뉴클레오티드 검색은 개시물에서 제공된 핵산 분자와 상동인 뉴클레오티드 서열을 수득하기 위해 NBLAST 프로그램, 스코어 = 100, 단어 길이 = 12 로 수행될 수 있다. BLAST 단백질 검색은 개시물의 단백질 분자와 상동인 아미노산 서열을 수득하기 위해 XBLAST 프로그램, 스코어 = 50, 단어 길이 = 3 으로 수행될 수 있다. 비교 목적을 위한 갭화된 정렬 (gapped alignment) 을 수득하기 위해, Gapped BLAST 를 Altschul et al., (1997) Nucleic Acids Res. 25(17):3389-3402 에서 기재된 바와 같이 이용할 수 있다. BLAST 및 Gapped BLAST 프로그램을 이용하는 경우, 각각의 프로그램 (예를 들어 XBLAST 및 NBLAST) 의 디폴트 매개변수를 사용할 수 있다. http://www.ncbi.nlm.nih.gov 를 참조한다.
양태 및 구현예의 설명
한 양태에서, 치료적 카고 부분을 포함하는 바이러스 벡터가 제공되며, 여기서 치료적 카고 부분은 코돈-최적화된 PAH 서열 또는 이의 변이체, 프로모터 및 인핸서를 포함한다.
한 양태에서, 치료적 카고 부분을 포함하는 바이러스 벡터가 제공되며, 여기서 치료적 카고 부분은 코돈-최적화된 PAH 서열 또는 이의 변이체 및 프로모터를 포함한다.
한 양태에서, 치료적 카고 부분을 포함하는 바이러스 벡터가 제공되며, 여기서 치료적 카고 부분은 코돈-최적화된 PAH 서열 또는 이의 변이체 및 인핸서를 포함한다.
한 양태에서, 치료적 카고 부분을 포함하는 바이러스 벡터가 제공되며, 여기서 치료적 카고 부분은 코돈-최적화된 PAH 서열 또는 이의 변이체, 프로모터 및 간-특이적 인핸서를 포함한다.
한 양태에서, 치료적 카고 부분을 포함하는 바이러스 벡터가 제공되며, 여기서 치료적 카고 부분은 코돈-최적화된 PAH 서열 또는 이의 변이체, 프로모터 및 간-특이적 인핸서를 포함하고, 코돈-최적화된 PAH 서열 또는 이의 변이체는 프로모터 및 간-특이적 인핸서 둘 모두에 의해 작동적으로 제어된다.
한 양태에서, 치료적 카고 부분을 포함하는 바이러스 벡터가 제공되며, 여기서 치료적 카고 부분은 코돈-최적화된 PAH 서열 또는 이의 변이체 및 프로모터를 포함하고, 코돈-최적화된 PAH 서열 또는 이의 변이체는 프로모터에 의해 작동적으로 제어된다.
한 양태에서, 치료적 카고 부분을 포함하는 바이러스 벡터가 제공되며, 여기서 치료적 카고 부분은 코돈-최적화된 PAH 서열 또는 이의 변이체 및 인핸서를 포함하고, 코돈-최적화된 PAH 서열 또는 이의 변이체는 인핸서에 의해 작동적으로 제어된다. 구현예에서, 인핸서는 간-특이적 인핸서이다.
구현예에서, 본원에 기재된 임의의 프로모터는 조직-특이적 프로모터, 구성적 프로모터 및 합성 프로모터 중 적어도 하나이다.
구현예에서, 조직-특이적 프로모터는 간-특이적 프로모터이다. 구현예에서, 간-특이적 프로모터는 hAAT 프로모터이다. 구현예에서, hAAT 프로모터는 SEQ ID NO: 4 와 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일성을 갖는 서열을 포함한다. 예를 들어 구현예에서, hAAT 프로모터는 SEQ ID NO: 4 와 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96% 97%, 98% 또는 99% 동일한 서열을 포함한다. 구현예에서, hAAT 프로모터는 SEQ ID NO: 4 의 서열을 포함한다.
구현예에서, 본원에 기재된 임의의 간-특이적 인핸서는 자연 발생 인핸서 및 합성 인핸서 중 적어도 하나이다.
구현예에서, 간-특이적 인핸서는 프로트롬빈 인핸서이다. 구현예에서, 프로트롬빈 인핸서는 SEQ ID NO: 3 과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일성을 갖는 서열을 포함한다. 예를 들어 구현예에서, 프로트롬빈 인핸서는 SEQ ID NO: 3 과 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 서열을 포함한다. 구현예에서, 프로트롬빈 인핸서는 SEQ ID NO: 3 을 포함한다.
구현예에서, 바이러스 벡터는 프로모터에 대해 5' 인 인핸서를 포함한다. 구현예에서, 바이러스 벡터는 프로모터에 대해 3' 인 인핸서를 포함한다.
구현예에서, 임의의 코돈-최적화된 PAH 서열 또는 이의 변이체는 자연 발생 PAH 서열의 변이체이다. 구현예에서, 임의의 코돈-최적화된 PAH 서열 또는 이의 변이체는 합성 PAH 서열의 변이체이다.
구현예에서, 바이러스 벡터는 SEQ ID NO: 70 과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 서열 동일성을 갖는 서열을 포함하는 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함한다. 예를 들어 구현예에서, 코돈-최적화된 PAH 서열은 SEQ ID NO: 70 과 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일하다. 구현예에서, 바이러스 벡터는 SEQ ID NO: 70 의 서열을 포함하는 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함한다. 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 70 과 90.0%, 90.1%, 90.2%, 90.3%, 90.4%, 90.5%, 90.6%, 90.7%, 90.8%, 90.9%, 91.0%, 91.1%, 91.2%, 91.3%, 91.4%, 91.5%, 91.6%, 91.7%, 91.8%, 91.9%, 92.0%, 92.1%, 92.2%, 92.3%, 92.4%, 92.5%, 92.6%, 92.7%, 92.8%, 92.9%, 93.0%, 93.1%, 93.2%, 93.3%, 93.4%, 93.5%, 93.6%, 93.7%, 93.8%, 93.9%, 94.0%, 94.1%, 94.2%, 94.3%, 94.4%, 94.5%, 94.6%, 94.7%, 94.8%, 94.9%, 95.0%, 95.1%, 95.2%, 95.3%, 95.4%, 95.5%, 95.6%. 95.7%, 95.8%, 95.9%, 96.0%, 96.1%, 96.2%, 96.3%, 96.4%, 96.5%, 96.6%, 96.7%, 96.8%, 96.9%, 97.0%, 97.1%, 97.2%, 97.3%, 97.4%, 97.5%, 97.6%, 97.7%, 97.8%, 97.9%, 98.0%, 98.1%, 98.2%, 98.3%, 98.4%, 98.5%, 98.6%, 98.7%, 98.8%, 98.9%, 99.0%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
구현예에서, 본원에 기재된 임의의 치료적 카고 부분은 인트론을 추가로 포함한다. 구현예에서, 인트론은 임의의 식물 또는 동물 종에서 유래한다. 구현예에서, 인트론은 베타 글로빈 인트론이다. 구현예에서, 베타 글로빈 인트론은 인간 베타 글로빈 인트론이다. 구현예에서, 베타 글로빈 인트론은 토끼 베타 글로빈 인트론이다. 구현예에서, 베타 글로빈 인트론은 SEQ ID NOS: 5 또는 6 과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일성을 갖는 서열을 포함한다. 예를 들어 구현예에서, 베타 글로빈 인트론은 SEQ ID NOS: 5 또는 6 과 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89% 90%, 91%, 92%, 93%, 94%, 95%, 96% 97%, 98% 또는 99% 동일하다. 구현예에서, 베타 글로빈 인트론은 SEQ ID NOS: 5 또는 6 의 서열을 포함한다.
구현예에서, 본원에 기재된 임의의 치료적 카고 부분은 핵 수용체에 의해 결합될 수 있는 위치를 추가로 포함한다. 구현예에서, 핵 수용체는 간에서 발현된다. 구현예에서, 위치는 간세포 핵 인자 결합 위치이다.
구현예에서, 간세포 핵 인자 결합 위치는 SEQ ID NOS: 7, 8, 9 또는 10 과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일성을 갖는 서열을 포함한다. 예를 들어 구현예에서, 간세포 핵 인자 결합 위치는 SEQ ID NOS: 7, 8, 9 또는 10 과 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85% 86%, 87%, 88% 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일하다. 구현예에서, 간세포 핵 인자 결합 위치는 SEQ ID NOS: 7, 8, 9 또는 10 의 서열을 포함한다.
구현예에서, 본원에 기재된 임의의 간세포 핵 인자 결합 위치는 프로트롬빈 인핸서의 다운스트림에 배치된다. 구현예에서, 본원에 기재된 임의의 간세포 핵 인자 결합 위치는 프로트롬빈 인핸서의 업스트림에 배치된다. 본원에서 사용되는 다운스트림은 기능적 RNA 에 대한 전사 방향을 따라 인접 뉴클레오티드 위치에서 측정된 거리를 의미한다. 업스트림은 기능적 RNA 의 전사 방향과 반대되는 인접 위치에서 측정된 거리를 의미한다.
구현예에서, 본원에서 기재된 임의의 치료적 카고 부분은 적어도 하나의 사전결정된 PAH mRNA 서열에 결합할 수 있는 적어도 하나의 작은 RNA 서열을 추가로 포함한다.
구현예에서, 본원에 기재된 임의의 적어도 하나의 작은 RNA 는 작은 핵 RNA 이다. 구현예에서, 적어도 하나의 작은 RNA 는 작은 핵소체 RNA 이다. 구현예에서, 적어도 하나의 작은 RNA 는 microRNA 이다. 구현예에서, 적어도 하나의 작은 RNA 는 작은 간섭 RNA 이다. 구현예에서, 적어도 하나의 작은 RNA 는 짧은 헤어핀 RNA 이다.
구현예에서, 적어도 하나의 작은 RNA 서열은 SEQ ID NOS: 11 또는 12 와 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일성을 갖는 서열을 포함한다. 예를 들어 구현예에서, 적어도 하나의 작은 RNA 서열은 SEQ ID NOS: 11 또는 12 와 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96% 97%, 98% 또는 99% 동일하다. 구현예에서, 적어도 하나의 작은 RNA 서열은 SEQ ID NOS: 11 또는 12 의 서열을 포함한다.
구현예에서, 본원에 기재된 임의의 바이러스 벡터는 렌티바이러스 벡터 및 AAV 벡터 중 적어도 하나이다. 추가 구현예에서, 하기의 바이러스 벡터가 또한 본 개시물의 양태에 따라 사용될 수 있다: 단순 헤르페스 바이러스 유형 1; 아데노바이러스, 몰로니 뮤린 백혈증 바이러스; HTLV-1 및 HTLV-2 를 포함하나 이에 제한되지 않는 종양레트로바이러스를 기반으로 하는 벡터; 말 감염성 빈혈 바이러스 원숭이 면역결핍 바이러스, 고양이 면역결핍 바이러스, 또는 비스나 메디 (Visna maedi) 렌티바이러스를 기반으로 하는 렌티바이러스 벡터; 홍역 바이러스 벡터; 멈프스 바이러스 벡터; 아르보바이러스 벡터; 말 감염성 빈혈 바이러스 벡터; 및 아레나바이러스를 기반으로 하는 벡터. 한 양태에서, 본 개시물에 따른 유전자 전달은 PAH 를 인코딩하는 유전자 외의 장소에서 상보적 유전자 카피의 통합을 초래할 수 있고, PAH 를 인코딩하는 염색체외 DNA 또는 RNA 요소의 생성을 초래할 수 있고, 상동성 재조합을 통해 천연 PAH 유전자를 대체할 수 있고, 정상 PAH 유전자에서의 또는 정상 PAH 유전자에서 떨어진 상보적 유전자 서열을 삽입하거나 유전자 전환을 이용하여 염색체 PAH 유전자의 서열을 변형하기 위해 게놈 편집을 이용할 수 있다. 또 다른 양태에서, 상보적 DNA 는 간, 단리된 간세포 또는 간에 이식된 간세포 줄기 세포의 DNA 형질감염을 통해 원형 또는 선형 형태로 전달될 수 있다. 또 다른 양태에서, 상보적 RNA 는 간, 단리된 간세포 또는 간에 이식된 간세포 줄기 세포의 형질감염을 통해 전달될 수 있다. 또 다른 양태에서, 단리된 DNA 또는 RNA 는 PAH 유전자의 유전자 전환을 달성하고, 인근의 또는 멀리 떨어진 유전자좌에서 상보적 유전자를 삽입하거나, PAH 유전자의 음으로 상보적인 염색체 대립유전자의 발현을 조정하기 위해 직접 전달될 수 있다.
한 양태에서, 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함하는 바이러스 벡터가 제공되며, 여기서 코돈-최적화된 서열 또는 이의 변이체는 SEQ ID NO: 71 과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖는다. 예를 들어 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 71 과 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96% 97%, 98% 또는 99% 동일하다. 구현예에서, 코돈-최적화된 서열 또는 이의 변이체는 SEQ ID NO: 71 의 서열을 포함한다. 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 71 과 90.0%, 90.1%, 90.2%, 90.3%, 90.4%, 90.5%, 90.6%, 90.7%, 90.8%, 90.9%, 91.0%, 91.1%, 91.2%, 91.3%, 91.4%, 91.5%, 91.6%, 91.7%, 91.8%, 91.9%, 92.0%, 92.1%, 92.2%, 92.3%, 92.4%, 92.5%, 92.6%, 92.7%, 92.8%, 92.9%, 93.0%, 93.1%, 93.2%, 93.3%, 93.4%, 93.5%, 93.6%, 93.7%, 93.8%, 93.9%, 94.0%, 94.1%, 94.2%, 94.3%, 94.4%, 94.5%, 94.6%, 94.7%, 94.8%, 94.9%, 95.0%, 95.1%, 95.2%, 95.3%, 95.4%, 95.5%, 95.6%. 95.7%, 95.8%, 95.9%, 96.0%, 96.1%, 96.2%, 96.3%, 96.4%, 96.5%, 96.6%, 96.7%, 96.8%, 96.9%, 97.0%, 97.1%, 97.2%, 97.3%, 97.4%, 97.5%, 97.6%, 97.7%, 97.8%, 97.9%, 98.0%, 98.1%, 98.2%, 98.3%, 98.4%, 98.5%, 98.6%, 98.7%, 98.8%, 98.9%, 99.0%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
구현예에서, 바이러스 벡터는 코돈-최적화된 PAH 서열 또는 이의 변이체, 프로모터 및 간-특이적 인핸서를 포함하는 치료적 카고 부분을 추가로 포함하며, 코돈-최적화된 서열 또는 이의 변이체는 프로모터 및 간-특이적 인핸서 둘 모두에 의해 작동적으로 제어된다.
구현예에서, 바이러스 벡터는 코돈-최적화된 PAH 서열 또는 이의 변이체, 프로모터 및 인핸서를 포함하는 치료적 카고 부분을 추가로 포함한다.
구현예에서, 프로모터는 본원에 기재된 임의의 프로모터일 수 있다. 구현예에서, 인핸서는 본원에 기재된 임의의 인핸서일 수 있다.
한 양태에서, 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함하는 바이러스 벡터가 제공되며, 여기서 코돈-최적화된 서열 또는 이의 변이체는 SEQ ID NO: 72 와 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖는다. 예를 들어 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 72 와 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96% 97%, 98% 또는 99% 동일하다. 구현예에서, 코돈-최적화된 서열 또는 이의 변이체는 SEQ ID NO: 72 의 서열을 포함한다. 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 72 와 90.0%, 90.1%, 90.2%, 90.3%, 90.4%, 90.5%, 90.6%, 90.7%, 90.8%, 90.9%, 91.0%, 91.1%, 91.2%, 91.3%, 91.4%, 91.5%, 91.6%, 91.7%, 91.8%, 91.9%, 92.0%, 92.1%, 92.2%, 92.3%, 92.4%, 92.5%, 92.6%, 92.7%, 92.8%, 92.9%, 93.0%, 93.1%, 93.2%, 93.3%, 93.4%, 93.5%, 93.6%, 93.7%, 93.8%, 93.9%, 94.0%, 94.1%, 94.2%, 94.3%, 94.4%, 94.5%, 94.6%, 94.7%, 94.8%, 94.9%, 95.0%, 95.1%, 95.2%, 95.3%, 95.4%, 95.5%, 95.6%. 95.7%, 95.8%, 95.9%, 96.0%, 96.1%, 96.2%, 96.3%, 96.4%, 96.5%, 96.6%, 96.7%, 96.8%, 96.9%, 97.0%, 97.1%, 97.2%, 97.3%, 97.4%, 97.5%, 97.6%, 97.7%, 97.8%, 97.9%, 98.0%, 98.1%, 98.2%, 98.3%, 98.4%, 98.5%, 98.6%, 98.7%, 98.8%, 98.9%, 99.0%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
구현예에서, 바이러스 벡터는 코돈-최적화된 PAH 서열 또는 이의 변이체, 프로모터 및 간-특이적 인핸서를 포함하는 치료적 카고 부분을 추가로 포함하며, 코돈-최적화된 서열 또는 이의 변이체는 프로모터 및 간-특이적 인핸서 둘 모두에 의해 작동적으로 제어된다.
구현예에서, 바이러스 벡터는 코돈-최적화된 PAH 서열 또는 이의 변이체, 프로모터 및 인핸서를 포함하는 치료적 카고 부분을 추가로 포함한다.
구현예에서, 프로모터는 본원에 기재된 임의의 프로모터일 수 있다. 구현예에서, 인핸서는 본원에 기재된 임의의 인핸서일 수 있다.
한 양태에서, 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함하는 바이러스 벡터가 제공되며, 여기서 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 73 과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖는다. 예를 들어 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 73 과 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96% 97%, 98% 또는 99% 동일하다. 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 73 의 서열을 포함한다. 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 73 과 90.0%, 90.1%, 90.2%, 90.3%, 90.4%, 90.5%, 90.6%, 90.7%, 90.8%, 90.9%, 91.0%, 91.1%, 91.2%, 91.3%, 91.4%, 91.5%, 91.6%, 91.7%, 91.8%, 91.9%, 92.0%, 92.1%, 92.2%, 92.3%, 92.4%, 92.5%, 92.6%, 92.7%, 92.8%, 92.9%, 93.0%, 93.1%, 93.2%, 93.3%, 93.4%, 93.5%, 93.6%, 93.7%, 93.8%, 93.9%, 94.0%, 94.1%, 94.2%, 94.3%, 94.4%, 94.5%, 94.6%, 94.7%, 94.8%, 94.9%, 95.0%, 95.1%, 95.2%, 95.3%, 95.4%, 95.5%, 95.6%. 95.7%, 95.8%, 95.9%, 96.0%, 96.1%, 96.2%, 96.3%, 96.4%, 96.5%, 96.6%, 96.7%, 96.8%, 96.9%, 97.0%, 97.1%, 97.2%, 97.3%, 97.4%, 97.5%, 97.6%, 97.7%, 97.8%, 97.9%, 98.0%, 98.1%, 98.2%, 98.3%, 98.4%, 98.5%, 98.6%, 98.7%, 98.8%, 98.9%, 99.0%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
구현예에서, 바이러스 벡터는 코돈-최적화된 PAH 서열 또는 이의 변이체, 프로모터 및 간-특이적 인핸서를 포함하는 치료적 카고 부분을 추가로 포함하며, 여기서 코돈-최적화된 PAH 서열 또는 이의 변이체는 프로모터 및 간-특이적 인핸서 둘 모두에 의해 작동적으로 제어된다.
구현예에서, 바이러스 벡터는 코돈-최적화된 PAH 서열 또는 이의 변이체, 프로모터 및 인핸서를 포함하는 치료적 카고 부분을 추가로 포함한다.
구현예에서, 프로모터는 본원에 기재된 임의의 프로모터일 수 있다. 구현예에서, 인핸서는 본원에 기재된 임의의 인핸서일 수 있다.
한 양태에서, 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함하는 바이러스 벡터가 제공되며, 여기서 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 74 와 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖는다. 예를 들어 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 74 와 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96% 97%, 98% 또는 99% 동일하다. 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 74 의 서열을 포함한다. 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 74 와 90.0%, 90.1%, 90.2%, 90.3%, 90.4%, 90.5%, 90.6%, 90.7%, 90.8%, 90.9%, 91.0%, 91.1%, 91.2%, 91.3%, 91.4%, 91.5%, 91.6%, 91.7%, 91.8%, 91.9%, 92.0%, 92.1%, 92.2%, 92.3%, 92.4%, 92.5%, 92.6%, 92.7%, 92.8%, 92.9%, 93.0%, 93.1%, 93.2%, 93.3%, 93.4%, 93.5%, 93.6%, 93.7%, 93.8%, 93.9%, 94.0%, 94.1%, 94.2%, 94.3%, 94.4%, 94.5%, 94.6%, 94.7%, 94.8%, 94.9%, 95.0%, 95.1%, 95.2%, 95.3%, 95.4%, 95.5%, 95.6%. 95.7%, 95.8%, 95.9%, 96.0%, 96.1%, 96.2%, 96.3%, 96.4%, 96.5%, 96.6%, 96.7%, 96.8%, 96.9%, 97.0%, 97.1%, 97.2%, 97.3%, 97.4%, 97.5%, 97.6%, 97.7%, 97.8%, 97.9%, 98.0%, 98.1%, 98.2%, 98.3%, 98.4%, 98.5%, 98.6%, 98.7%, 98.8%, 98.9%, 99.0%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
구현예에서, 바이러스 벡터는 코돈-최적화된 PAH 서열 또는 이의 변이체, 프로모터 및 간-특이적 인핸서를 포함하는 치료적 카고 부분을 추가로 포함하며, 여기서 코돈-최적화된 PAH 서열 또는 이의 변이체는 프로모터 및 간-특이적 인핸서 둘 모두에 의해 작동적으로 제어된다.
구현예에서, 바이러스 벡터는 코돈-최적화된 PAH 서열 또는 이의 변이체, 프로모터 및 인핸서를 포함하는 치료적 카고 부분을 추가로 포함한다.
구현예에서, 프로모터는 본원에 기재된 임의의 프로모터일 수 있다. 구현예에서, 인핸서는 본원에 기재된 임의의 인핸서일 수 있다.
한 양태에서, 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함하는 바이러스 벡터가 제공되며, 여기서 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 75 와 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖는다. 예를 들어 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 75 와 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96% 97%, 98% 또는 99% 동일하다. 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 75 의 서열을 포함한다. 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 75 와 90.0%, 90.1%, 90.2%, 90.3%, 90.4%, 90.5%, 90.6%, 90.7%, 90.8%, 90.9%, 91.0%, 91.1%, 91.2%, 91.3%, 91.4%, 91.5%, 91.6%, 91.7%, 91.8%, 91.9%, 92.0%, 92.1%, 92.2%, 92.3%, 92.4%, 92.5%, 92.6%, 92.7%, 92.8%, 92.9%, 93.0%, 93.1%, 93.2%, 93.3%, 93.4%, 93.5%, 93.6%, 93.7%, 93.8%, 93.9%, 94.0%, 94.1%, 94.2%, 94.3%, 94.4%, 94.5%, 94.6%, 94.7%, 94.8%, 94.9%, 95.0%, 95.1%, 95.2%, 95.3%, 95.4%, 95.5%, 95.6%. 95.7%, 95.8%, 95.9%, 96.0%, 96.1%, 96.2%, 96.3%, 96.4%, 96.5%, 96.6%, 96.7%, 96.8%, 96.9%, 97.0%, 97.1%, 97.2%, 97.3%, 97.4%, 97.5%, 97.6%, 97.7%, 97.8%, 97.9%, 98.0%, 98.1%, 98.2%, 98.3%, 98.4%, 98.5%, 98.6%, 98.7%, 98.8%, 98.9%, 99.0%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
구현예에서, 바이러스 벡터는 코돈-최적화된 PAH 서열 또는 이의 변이체, 프로모터 및 간-특이적 인핸서를 포함하는 치료적 카고 부분을 추가로 포함하며, 코돈-최적화된 PAH 서열 또는 이의 변이체는 프로모터 및 간-특이적 인핸서 둘 모두에 의해 작동적으로 제어된다.
구현예에서, 바이러스 벡터는 코돈-최적화된 PAH 서열 또는 이의 변이체, 프로모터 및 인핸서를 포함하는 치료적 카고 부분을 추가로 포함한다.
구현예에서, 프로모터는 본원에 기재된 임의의 프로모터일 수 있다. 구현예에서, 인핸서는 본원에 기재된 임의의 인핸서일 수 있다.
한 양태에서, 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함하는 바이러스 벡터가 제공되며, 여기서 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 76 과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖는다. 예를 들어 구현예에서, 코돈-최적화된 PAH 서열은 SEQ ID NO: 76 과 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96% 97%, 98% 또는 99% 동일하다. 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 76 의 서열을 포함한다. 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 73 과 90.0%, 90.1%, 90.2%, 90.3%, 90.4%, 90.5%, 90.6%, 90.7%, 90.8%, 90.9%, 91.0%, 91.1%, 91.2%, 91.3%, 91.4%, 91.5%, 91.6%, 91.7%, 91.8%, 91.9%, 92.0%, 92.1%, 92.2%, 92.3%, 92.4%, 92.5%, 92.6%, 92.7%, 92.8%, 92.9%, 93.0%, 93.1%, 93.2%, 93.3%, 93.4%, 93.5%, 93.6%, 93.7%, 93.8%, 93.9%, 94.0%, 94.1%, 94.2%, 94.3%, 94.4%, 94.5%, 94.6%, 94.7%, 94.8%, 94.9%, 95.0%, 95.1%, 95.2%, 95.3%, 95.4%, 95.5%, 95.6%. 95.7%, 95.8%, 95.9%, 96.0%, 96.1%, 96.2%, 96.3%, 96.4%, 96.5%, 96.6%, 96.7%, 96.8%, 96.9%, 97.0%, 97.1%, 97.2%, 97.3%, 97.4%, 97.5%, 97.6%, 97.7%, 97.8%, 97.9%, 98.0%, 98.1%, 98.2%, 98.3%, 98.4%, 98.5%, 98.6%, 98.7%, 98.8%, 98.9%, 99.0%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
구현예에서, 바이러스 벡터는 코돈-최적화된 PAH 서열 또는 이의 변이체, 프로모터 및 간-특이적 인핸서를 포함하는 치료적 카고 부분을 추가로 포함하며, 코돈-최적화된 PAH 서열 또는 이의 변이체는 프로모터 및 간-특이적 인핸서 둘 모두에 의해 작동적으로 제어된다.
구현예에서, 바이러스 벡터는 코돈-최적화된 PAH 서열 또는 이의 변이체, 프로모터 및 인핸서를 포함하는 치료적 카고 부분을 추가로 포함한다.
구현예에서, 프로모터는 본원에 기재된 임의의 프로모터일 수 있다. 구현예에서, 인핸서는 본원에 기재된 임의의 인핸서일 수 있다.
한 양태에서, 치료적 카고 부분을 포함하는 바이러스 벡터가 제공되며, 여기서 치료적 카고 부분은 SEQ ID NO: 70 과 90% 초과의 서열 동일성을 공유하는 서열을 포함하는 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함한다. 예를 들어 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 70 과 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일하다. 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 70 을 포함한다. 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 70 과 90.0%, 90.1%, 90.2%, 90.3%, 90.4%, 90.5%, 90.6%, 90.7%, 90.8%, 90.9%, 91.0%, 91.1%, 91.2%, 91.3%, 91.4%, 91.5%, 91.6%, 91.7%, 91.8%, 91.9%, 92.0%, 92.1%, 92.2%, 92.3%, 92.4%, 92.5%, 92.6%, 92.7%, 92.8%, 92.9%, 93.0%, 93.1%, 93.2%, 93.3%, 93.4%, 93.5%, 93.6%, 93.7%, 93.8%, 93.9%, 94.0%, 94.1%, 94.2%, 94.3%, 94.4%, 94.5%, 94.6%, 94.7%, 94.8%, 94.9%, 95.0%, 95.1%, 95.2%, 95.3%, 95.4%, 95.5%, 95.6%. 95.7%, 95.8%, 95.9%, 96.0%, 96.1%, 96.2%, 96.3%, 96.4%, 96.5%, 96.6%, 96.7%, 96.8%, 96.9%, 97.0%, 97.1%, 97.2%, 97.3%, 97.4%, 97.5%, 97.6%, 97.7%, 97.8%, 97.9%, 98.0%, 98.1%, 98.2%, 98.3%, 98.4%, 98.5%, 98.6%, 98.7%, 98.8%, 98.9%, 99.0%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
한 양태에서, 치료적 카고 부분을 포함하는 바이러스 벡터가 제공되며, 여기서 치료적 카고 부분은 SEQ ID NO: 71 과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖는 서열을 포함하는 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함한다. 예를 들어 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 71 과 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96% 97%, 98% 또는 99% 동일하다. 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 71 을 포함한다. 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 71 과 90.0%, 90.1%, 90.2%, 90.3%, 90.4%, 90.5%, 90.6%, 90.7%, 90.8%, 90.9%, 91.0%, 91.1%, 91.2%, 91.3%, 91.4%, 91.5%, 91.6%, 91.7%, 91.8%, 91.9%, 92.0%, 92.1%, 92.2%, 92.3%, 92.4%, 92.5%, 92.6%, 92.7%, 92.8%, 92.9%, 93.0%, 93.1%, 93.2%, 93.3%, 93.4%, 93.5%, 93.6%, 93.7%, 93.8%, 93.9%, 94.0%, 94.1%, 94.2%, 94.3%, 94.4%, 94.5%, 94.6%, 94.7%, 94.8%, 94.9%, 95.0%, 95.1%, 95.2%, 95.3%, 95.4%, 95.5%, 95.6%. 95.7%, 95.8%, 95.9%, 96.0%, 96.1%, 96.2%, 96.3%, 96.4%, 96.5%, 96.6%, 96.7%, 96.8%, 96.9%, 97.0%, 97.1%, 97.2%, 97.3%, 97.4%, 97.5%, 97.6%, 97.7%, 97.8%, 97.9%, 98.0%, 98.1%, 98.2%, 98.3%, 98.4%, 98.5%, 98.6%, 98.7%, 98.8%, 98.9%, 99.0%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
한 양태에서, 치료적 카고 부분을 포함하는 바이러스 벡터가 제공되며: 여기서 치료적 카고 부분은 SEQ ID NO: 72 와 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖는 서열을 포함하는 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함한다. 예를 들어 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 72 와 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96% 97%, 98% 또는 99% 동일하다. 구현예에서 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 72 를 포함한다. 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 72 와 90.0%, 90.1%, 90.2%, 90.3%, 90.4%, 90.5%, 90.6%, 90.7%, 90.8%, 90.9%, 91.0%, 91.1%, 91.2%, 91.3%, 91.4%, 91.5%, 91.6%, 91.7%, 91.8%, 91.9%, 92.0%, 92.1%, 92.2%, 92.3%, 92.4%, 92.5%, 92.6%, 92.7%, 92.8%, 92.9%, 93.0%, 93.1%, 93.2%, 93.3%, 93.4%, 93.5%, 93.6%, 93.7%, 93.8%, 93.9%, 94.0%, 94.1%, 94.2%, 94.3%, 94.4%, 94.5%, 94.6%, 94.7%, 94.8%, 94.9%, 95.0%, 95.1%, 95.2%, 95.3%, 95.4%, 95.5%, 95.6%. 95.7%, 95.8%, 95.9%, 96.0%, 96.1%, 96.2%, 96.3%, 96.4%, 96.5%, 96.6%, 96.7%, 96.8%, 96.9%, 97.0%, 97.1%, 97.2%, 97.3%, 97.4%, 97.5%, 97.6%, 97.7%, 97.8%, 97.9%, 98.0%, 98.1%, 98.2%, 98.3%, 98.4%, 98.5%, 98.6%, 98.7%, 98.8%, 98.9%, 99.0%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
한 양태에서, 치료적 카고 부분을 포함하는 바이러스 벡터가 제공되며: 여기서 치료적 카고 부분은 SEQ ID NO: 73 과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖는 서열을 포함하는 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함한다. 예를 들어 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 73 과 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96% 97%, 98% 또는 99% 동일하다. 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 73 을 포함한다. 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 73 과 90.0%, 90.1%, 90.2%, 90.3%, 90.4%, 90.5%, 90.6%, 90.7%, 90.8%, 90.9%, 91.0%, 91.1%, 91.2%, 91.3%, 91.4%, 91.5%, 91.6%, 91.7%, 91.8%, 91.9%, 92.0%, 92.1%, 92.2%, 92.3%, 92.4%, 92.5%, 92.6%, 92.7%, 92.8%, 92.9%, 93.0%, 93.1%, 93.2%, 93.3%, 93.4%, 93.5%, 93.6%, 93.7%, 93.8%, 93.9%, 94.0%, 94.1%, 94.2%, 94.3%, 94.4%, 94.5%, 94.6%, 94.7%, 94.8%, 94.9%, 95.0%, 95.1%, 95.2%, 95.3%, 95.4%, 95.5%, 95.6%. 95.7%, 95.8%, 95.9%, 96.0%, 96.1%, 96.2%, 96.3%, 96.4%, 96.5%, 96.6%, 96.7%, 96.8%, 96.9%, 97.0%, 97.1%, 97.2%, 97.3%, 97.4%, 97.5%, 97.6%, 97.7%, 97.8%, 97.9%, 98.0%, 98.1%, 98.2%, 98.3%, 98.4%, 98.5%, 98.6%, 98.7%, 98.8%, 98.9%, 99.0%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
한 양태에서, 치료적 카고 부분을 포함하는 바이러스 벡터가 제공되며: 여기서 치료적 카고 부분은 SEQ ID NO: 74 와 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖는 서열을 포함하는 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함한다. 예를 들어 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 74 와 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96% 97%, 98% 또는 99% 동일하다. 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 74 를 포함한다. 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 74 와 90.0%, 90.1%, 90.2%, 90.3%, 90.4%, 90.5%, 90.6%, 90.7%, 90.8%, 90.9%, 91.0%, 91.1%, 91.2%, 91.3%, 91.4%, 91.5%, 91.6%, 91.7%, 91.8%, 91.9%, 92.0%, 92.1%, 92.2%, 92.3%, 92.4%, 92.5%, 92.6%, 92.7%, 92.8%, 92.9%, 93.0%, 93.1%, 93.2%, 93.3%, 93.4%, 93.5%, 93.6%, 93.7%, 93.8%, 93.9%, 94.0%, 94.1%, 94.2%, 94.3%, 94.4%, 94.5%, 94.6%, 94.7%, 94.8%, 94.9%, 95.0%, 95.1%, 95.2%, 95.3%, 95.4%, 95.5%, 95.6%. 95.7%, 95.8%, 95.9%, 96.0%, 96.1%, 96.2%, 96.3%, 96.4%, 96.5%, 96.6%, 96.7%, 96.8%, 96.9%, 97.0%, 97.1%, 97.2%, 97.3%, 97.4%, 97.5%, 97.6%, 97.7%, 97.8%, 97.9%, 98.0%, 98.1%, 98.2%, 98.3%, 98.4%, 98.5%, 98.6%, 98.7%, 98.8%, 98.9%, 99.0%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
한 양태에서, 치료적 카고 부분을 포함하는 바이러스 벡터가 제공되며: 여기서 치료적 카고 부분은 SEQ ID NO: 75 와 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖는 서열을 포함하는 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함한다. 예를 들어 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 75 와 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96% 97%, 98% 또는 99% 이다. 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 75 의 서열을 포함한다. 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 75 와 90.0%, 90.1%, 90.2%, 90.3%, 90.4%, 90.5%, 90.6%, 90.7%, 90.8%, 90.9%, 91.0%, 91.1%, 91.2%, 91.3%, 91.4%, 91.5%, 91.6%, 91.7%, 91.8%, 91.9%, 92.0%, 92.1%, 92.2%, 92.3%, 92.4%, 92.5%, 92.6%, 92.7%, 92.8%, 92.9%, 93.0%, 93.1%, 93.2%, 93.3%, 93.4%, 93.5%, 93.6%, 93.7%, 93.8%, 93.9%, 94.0%, 94.1%, 94.2%, 94.3%, 94.4%, 94.5%, 94.6%, 94.7%, 94.8%, 94.9%, 95.0%, 95.1%, 95.2%, 95.3%, 95.4%, 95.5%, 95.6%. 95.7%, 95.8%, 95.9%, 96.0%, 96.1%, 96.2%, 96.3%, 96.4%, 96.5%, 96.6%, 96.7%, 96.8%, 96.9%, 97.0%, 97.1%, 97.2%, 97.3%, 97.4%, 97.5%, 97.6%, 97.7%, 97.8%, 97.9%, 98.0%, 98.1%, 98.2%, 98.3%, 98.4%, 98.5%, 98.6%, 98.7%, 98.8%, 98.9%, 99.0%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
한 양태에서, 치료적 카고 부분을 포함하는 바이러스 벡터가 제공되며: 여기서 치료적 카고 부분은 SEQ ID NO: 76 과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖는 서열을 포함하는 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함한다. 예를 들어 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 76 과 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96% 97%, 98% 또는 99% 동일하다. 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 76 을 포함한다. 구현예에서, 코돈-최적화된 PAH 서열 또는 이의 변이체는 SEQ ID NO: 76 과 90.0%, 90.1%, 90.2%, 90.3%, 90.4%, 90.5%, 90.6%, 90.7%, 90.8%, 90.9%, 91.0%, 91.1%, 91.2%, 91.3%, 91.4%, 91.5%, 91.6%, 91.7%, 91.8%, 91.9%, 92.0%, 92.1%, 92.2%, 92.3%, 92.4%, 92.5%, 92.6%, 92.7%, 92.8%, 92.9%, 93.0%, 93.1%, 93.2%, 93.3%, 93.4%, 93.5%, 93.6%, 93.7%, 93.8%, 93.9%, 94.0%, 94.1%, 94.2%, 94.3%, 94.4%, 94.5%, 94.6%, 94.7%, 94.8%, 94.9%, 95.0%, 95.1%, 95.2%, 95.3%, 95.4%, 95.5%, 95.6%. 95.7%, 95.8%, 95.9%, 96.0%, 96.1%, 96.2%, 96.3%, 96.4%, 96.5%, 96.6%, 96.7%, 96.8%, 96.9%, 97.0%, 97.1%, 97.2%, 97.3%, 97.4%, 97.5%, 97.6%, 97.7%, 97.8%, 97.9%, 98.0%, 98.1%, 98.2%, 98.3%, 98.4%, 98.5%, 98.6%, 98.7%, 98.8%, 98.9%, 99.0%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
구현예에서, 바이러스 벡터는 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함하며 프로모터 및 간-특이적 인핸서를 추가로 포함하는 치료적 카고 부분을 추가로 포함하고, 여기서 코돈-최적화된 PAH 서열 또는 이의 변이체는 프로모터 및 간-특이적 인핸서 둘 모두에 의해 작동적으로 제어된다.
한 양태에서, 패키징 세포에 의해 생성되며 표적 세포를 감염시킬 수 있는 렌티바이러스 입자가 개시된다. 구현예에서, 렌티바이러스 입자는 표적 세포를 감염시킬 수 있는 외피 단백질, 및 본원에 상세히 나타낸 바와 같은 바이러스 벡터를 포함한다.
한 양태에서, 대상체에서의 페닐케톤뇨증 (PKU) 의 치료 방법이 개시된다. 방법은 본원에서 상세히 나타낸 바와 같은 치료적 유효량의 렌티바이러스 입자를 대상체에게 투여하는 것을 포함한다.
한 양태에서, 대상체에서의 PKU 를 치료하기 위한 코돈-최적화된 PAH 서열 또는 이의 변이체의 용도가 제공된다. 또 다른 양태에서, 대상체에서의 PKU 를 치료하기 위한 약제를 제형화하기 위한 코돈-최적화된 PAH 서열 또는 이의 변이체의 용도가 제공된다.
또 다른 양태에서, 대상체에서의 PKU 를 치료하기 위한 약제를 제형화하기 위한 코돈-최적화된 PAH 서열 또는 이의 변이체의 용도가 제공된다. 또 다른 양태에서, 대상체에서의 PKU 를 치료하는데 사용하기 위한 약제를 제형화하기 위한 코돈-최적화된 PAH 서열 또는 이의 변이체가 제공된다.
한 양태에서, 대상체에서의 PKU 를 치료하는데 사용하기 위한 코돈-최적화된 PAH 서열 또는 이의 변이체가 제공된다. 또 다른 양태에서, 대상체에서의 PKU 를 치료하는데 사용하기 위한 약제를 제형화하기 위한 코돈-최적화된 PAH 서열 또는 이의 변이체가 제공된다.
한 양태에서, PAH 서열 발현을 향상시키는 렌티바이러스 벡터가 제공된다. 구현예에서, PAH 서열 또는 PAH 3'UTR 서열 중 적어도 하나가 변형된다. 추가 구현예에서, 이러한 변형은 PAH 서열의 mRNA 전사체의 2 차 구조를 변경시킨다. 추가 구현예에서, 이러한 변형은 mRNA PAH 2 차 구조 서열 및 mRNA 3' UTR 2 차 구조 서열 중 적어도 하나의 변경을 포함한다. 추가 구현예에서, 이러한 변형은 PAH mRNA 의 3'UTR 부위 및 코딩 부위의 상호작용을 변경시킨다. 추가 구현예에서, 이러한 변형은 PAH 단백질 생성에 대한 PAH 2 차 구조의 부정적 조절 효과를 억제한다.
구현예에서, 조정된 PAH 서열은 이의 임의의 변이체를 비롯한 그의 뉴클레오티드 중 임의의 하나 이상의 임의의 첨가, 결실, 치환 또는 변형을 포함하여, 자연 발생 PAH 서열이 변형된 임의의 서열을 포함한다. 구현예에서, 변형은 자연 발생 서열의 하나 이상의 구아노신 시토신 함량, 자연 발생 서열의 하나 이상의 코돈, 또는 자연 발생 서열의 하나 이상의 CpG 위치를 조정하는 것을 포함한다. 구현예에서, 변형은 코돈-최적화된 PAH 서열을 포함한다. PAH 코돈-최적화된 서열은 본원에 나타내고 기재된 것들을 포함하여 임의의 적합한 PAH 코돈-최적화된 서열일 수 있다. 구현예에서, 변형된 PAH 서열 (코돈-최적화된 서열 포함) 을 인코딩하는 벡터는 변형되지 않은 (예를 들어, 즉 코돈-최적화되지 않은) PAH 서열을 인코딩하는 벡터에 비해 더 높은 PAH 발현을 초래한다.
구현예에서, 변형된 PAH 서열은 임의의 SEQ ID NOs: 1, 70, 71 또는 72 와 적어도 70%, 75%, 80%, 적어도 85%, 적어도 90% 또는 적어도 95%, 그러나 100% 미만의 서열 동일성을 갖는 서열을 포함한다. 구현예에서 변형된 PAH 는 SEQ ID NOs: 70, 71 또는 72 의 서열 중 임의의 것을 포함한다.
구현예에서, 조정된 PAH 3'UTR 서열은 이의 임의의 변이체를 비롯한 그의 뉴클레오티드 중 임의의 하나 이상의 임의의 첨가, 결실, 치환 또는 변형을 포함하여, 자연 PAH 3' UTR 서열이 변형된 임의의 서열을 포함한다. 구현예에서, 조정된 PAH 3' UTR 서열은 그의 뉴클레오티드 중 하나 이상의 치환 또는 결실 중 적어도 하나를 포함한다. 추가 구현예에서 3' UTR 뉴클레오티드의 전부 또는 실질적으로 전부는 치환되거나 결실된다.
구현예에서, 변형된 3'UTR 서열은 상이한 유전자의 3'UTR 서열에서 유래하는 3'UTR 서열을 포함한다. 구현예에서, PAH 의 3'UTR 서열은 상이한 유전자의 3'UTR 서열로 치환된다. 구현예에서, 3'UTR 서열은 알부민 3'UTR 을 포함한다. 구현예에서, 알부민 3'UTR 은 SEQ ID NO: 86 과 적어도 70%, 75%, 80%, 적어도 85%, 적어도 90% 또는 적어도 95%, 그러나 100% 미만의 서열 동일성을 갖는 서열을 포함한다. 구현예에서, 알부민 3'UTR 은 SEQ ID NO: 86 의 서열을 포함한다.
구현예에서, 변형된 PAH 3'UTR 서열을 포함하는 PAH 서열을 인코딩하는 렌티바이러스 벡터는 PAH 3'UTR 이 파괴되지 않은 PAH 서열을 인코딩하는 렌티바이러스 벡터보다 더 높은 PAH 발현을 초래한다.
구현예에서, 변형된 PAH 3'UTR 및 변형된 PAH 서열 (코돈-최적화된 서열 포함) 을 인코딩하는 렌티바이러스 벡터는 변형되지 않은 임의의 PAH 3'UTR 및/또는 변형되지 않은 (예를 들어, 코돈-최적화되지 않은) PAH 서열을 인코딩하는 벡터에 비해 더 높은 PAH 발현을 초래한다.
페닐케톤뇨증
PKU 는 PAH 의 돌연변이 및/또는 PAH 보조인자 (즉, BH4) 의 합성 또는 재생 결함에 의해 유발된다고 여겨진다. 특히, 몇몇 PAH 돌연변이는 소포체에서의 단백질 폴딩에 영향을 미치는 것으로 나타났으며, 이는 효소 촉매 활성을 약화시키거나 크게 철폐시키는 단백질 구조에서의 미스센스 돌연변이 (약 63%) 및 작은 결실 (약 13%) 로 인한 가속화된 분해 및/또는 응집을 초래한다. PAH 의 기능성에 영향을 줄 수 있는 수많은 돌연변이가 존재하므로, PKU 를 치료하기 위한 효과적인 치료적 접근방식은 비정상 PAH 및 대체 PAH 가 투여되고/되거나 발생할 수 있는 방식을 다루는 것이 필요할 수 있다.
일반적으로, 3 가지 주요 표현형 군은 진단시 측정된 Phe 수준, Phe 에 대한 식이 내성 및 치료요법에 대한 잠재적 반응성을 기반으로 하여 PKU 에서 분류된다. 이들 군은 고전적 PKU (약 Phe > 1200 μM), 비정형 또는 경증 PKU (Phe 가 약 600 - 1200 μM 임) 및 영구적인 경증 고페닐알라닌혈증 (HPA, Phe 120 - 600 μM) 을 포함한다.
PKU 의 검출은 보편적 신생아 스크리닝 (NBS) 에 의존한다. 힐 스틱으로부터 수집한 1 점적의 혈액을 USA 의 모든 50 개 주에서 의무적이고 대부분의 개발도상국에서 통상적으로 사용되는 스크린에서 페닐알라닌 수준에 대해 검사한다.
유전적 의약
유전적 의약은 질환 치료 또는 예방의 목적으로 숙주 세포에 유전적 구축물을 전달하는데 사용되는 바이러스 벡터에 대한 언급을 포함한다.
유전적 구축물은 존재하는 결함을 교정하거나 보완하기 위한 기능적 유전자 또는 유전자의 일부, 조절 단백질을 인코딩하는 DNA 서열, 안티센스, 짧은 헤어핀 RNA, 짧은 상동성 RNA, 긴 비-코딩 RNA, 작은 간섭 RNA 또는 기타의 것들을 포함하는 조절 RNA 분자를 인코딩하는 DNA 서열, 및 질환 상태를 변경하기 위해 중요한 세포 인자에 대해 경쟁하도록 디자인된 RNA 또는 단백질을 인코딩하는 디코이 서열 (decoy sequence) 을 포함할 수 있으나 이에 제한되지는 않는다. 구현예에서, 유전적 의약은 특징 질환의 치료 또는 완화를 제공하기 위해 이러한 치료적 유전적 구축물을 표적 세포에 전달하는 것을 포함한다.
기능적 PAH 유전자를 간에 생체내 전달함으로써, PAH 활성이 재구성될 수 있어, 혈액 내 Phe 의 정상적인 정리 (clearance) 를 초래하여 따라서 식이 제한 또는 빈번한 효소 대체 치료요법에 대한 필요성을 제거한다. 이러한 치료적 접근방식의 효과는 내인성 PAH 에 대한 shRNA 의 표적화에 의해 개선될 수 있다. 본 개시물의 한 양태에서, 기능적 PAH 유전자 또는 이의 변이체는, 태아가 PKU 유전자형에 대한 위험성이 있는 것으로 확인된 경우 자궁 내에 전달될 수 있다. 구현예에서, 기능적 PAH 유전자 또는 이의 변이체는 코돈-최적화된 PAH 유전자이다. 구현예에서, 진단 단계는 태아가 PKU 표현형에 대한 위험성이 있는지 여부를 결정하기 위해 실행될 수 있다. 진단 단계에서 태아가 PKU 표현형에 대한 위험성이 있는 것으로 결정되는 경우, 태아는 본원에 상세히 나타낸 유전적 의약을로 치료될 수 있다. 치료는 자궁 내에서 또는 시험관 내에서 이루어질 수 있다.
렌티바이러스 벡터 시스템
본원의 다양한 양태 및 구현예에 따른 렌티바이러스 비리온 (입자) 은 비리온 (바이러스 입자) 을 생성하기 위해 필요한 바이러스 단백질을 인코딩하는 벡터 시스템에 의해 발현된다. 다양한 구현예에서, 프로모터에 작동가능하게 연결된, 렌티바이러스 Pol 단백질을 인코딩하는 핵산 서열을 함유하는 하나의 벡터가 역전사 및 통합을 위해 제공된다. 또 다른 구현예에서, Pol 단백질은 다수의 벡터에 의해 발현된다. 다른 구현예에서, 프로모터에 작동가능하게 연결된, 바이러스 캡시드를 형성하기 위한 렌티바이러스 Gag 단백질을 인코딩하는 핵산 서열을 함유하는 벡터가 제공된다. 구현예에서, 이러한 gag 핵산 서열은 적어도 일부의 pol 핵산 서열 외에 별개의 벡터 상에 존재한다. 다른 구현예에서, gag 핵산 서열은 pol 단백질을 인코딩하는 모든 pol 핵산 서열로부터 별개의 벡터 상에 존재한다.
야생형 복귀 돌연변이체 (revertant) 를 수득하는 가능성을 더 최소화하기 위해, 입자 생성에 사용되는 본원의 벡터에 수많은 변형이 이루어질 수 있다. 이들은 LTR 의 U3 부위의 결실, tat 결실 및 매트릭스 (MA) 결실을 포함하지만 이에 제한되지 않는다. 구현예에서, gag, pol 및 env 벡터(들) 는 렌티바이러스 패키징 서열로 지칭되는, 렌티바이러스 RNA 를 패키징하는 렌티바이러스 게놈으로부터의 뉴클레오티드를 함유하지 않는다.
구현예에서, 입자를 형성하는 벡터(들) 는 외피 단백질을 발현하는 렌티바이러스 게놈으로부터의 핵산 서열을 함유하지 않는다. 구현예에서, 프로모터에 작동가능하게 연결된 외피 단백질을 인코딩하는 핵산 서열을 함유하는 별개의 벡터가 사용된다. 구현예에서, 외피 단백질을 인코딩하는 이러한 별개의 벡터는 렌티바이러스 패키징 서열을 함유하지 않는다. 한 구현예에서 외피 핵산 서열을 인코딩하는 서열은 렌티바이러스 외피 단백질을 인코딩한다.
또 다른 구현예에서 외피 단백질은 렌티바이러스로부터가 아니라 상이한 바이러스로부터 유래한다. 생성된 입자는 위형 입자 (pseudotyped particle) 로 지칭된다. 외피를 적절히 선택함으로써 사실상 임의의 세포를 "감염" 시킬 수 있다. 예를 들어, 세포내 구획을 표적으로 하는 외피 단백질을 인코딩하는 env 유전자를 사용할 수 있다. 이러한 env 유전자 및 외피 단백질이 유래할 수 있는 바이러스의 예는 인플루엔자 바이러스 (예를 들어, 인플루엔자 A 바이러스, 인플루엔자 B 바이러스, 인플루엔자 C 바이러스, 인플루엔자 D 바이러스, 이사바이러스, 콰란자바이러스 및 토고토바이러스), 베시큘로바이러스 (예를 들어, 인디애나 베시큘로바이러스), 알파 바이러스 (예를 들어, 셈리키 포레스트 바이러스, 신드비스 바이러스, 아우라 바이러스, 바르마 포레스트 바이러스, 베바루 바이러스, 카바소우 바이러스, 게타 바이러스, 하이랜드 J 바이러스, 트로카라 바이러스, 우나 바이러스, 엔두무 바이러스 및 미들버그 바이러스), 아레나바이러스 (예를 들어, 림프구성 맥락수막염 바이러스, 마추포 바이러스, 쥬닌 바이러스 및 라사 피버 바이러스), 플라비바이러스 (예를 들어, 진드기-매개 뇌염 바이러스, 뎅기 바이러스, 간염 C 바이러스, GB 바이러스, 아포이 바이러스, 바가자 바이러스, 에지 힐 바이러스, 주그라 바이러스, 카담 바이러스, 다카르 바트 바이러스, 모독 바이러스, 포와센 바이러스, 우수투 바이러스 및 살비에자 바이러스), 랍도바이러스 (예를 들어, 수포성 구내염 바이러스, 광견병 바이러스), 파라믹소바이러스 (예를 들어, 볼거리 또는 홍역) 및 오르토믹소바이러스 (예를 들어, 인플루엔자 바이러스) 를 포함한다.
바람직하게 사용될 수 있는 다른 외피 단백질은 내인성 레트로바이러스 (예를 들어, 고양이 내인성 레트로바이러스 및 비비 내인성 레트로바이러스) 및 밀접하게 관련된 감마레트로바이러스 (예를 들어, 특히 몰로니 백혈병 바이러스, MLV-E, MLV-A, 긴팔원숭이 유인원 백혈병 바이러스, GALV, 고양이 백혈병 바이러스, 코알라 레트로바이러스, 트라거 덕 비장 괴사 바이러스, 바이퍼 레트로바이러스, 병아리 세포융합 바이러스, 가드너-안슈타인 고양이 육종 바이러스 및 돼지 유형-C 종양바이러스) 에서 유래한 것들을 포함한다. 이러한 감마레트로바이러스는 1차 세포를 표적화하기 위한 env 유전자 및 외피 단백질의 공급원으로서 사용될 수 있다. 숙주 세포가 1차 세포인 경우 감마레트로바이러스가 특히 바람직하다.
외피 단백질은 특정한 원하는 숙주 세포를 표적화하기 위해 선택될 수 있다. 예를 들어, 특이적 수용체 예컨대 도파민 수용체의 표적화는 뇌 전달에 사용될 수 있다. 다른 표적은 혈관 내피일 수 있다. 이들 세포는 필로비리대 계열에서의 임의의 바이러스 (예를 들어, 쿠에바바이러스, 디안로바이러스, 에볼라바이러스 및 마르부르그바이러스) 에서 유래한 외피 단백질을 사용하여 표적화될 수 있다. 에볼라바이러스의 종은 타이 포레스트 에볼라바이러스, 자이르 에볼라바이러스, 수단 에볼라바이러스, 분디부교 에볼라바이러스 및 레스톤 에볼라바이러스를 포함한다.
또한 구현예에서, 당단백질은 전사후 변형을 거칠 수 있다. 예를 들어 구현예에서, 에볼라의 GP 는 번역 후 GP1 및 GP2 당단백질이 되도록 변형될 수 있다. 또 다른 구현예에서, 위형 외피를 갖는 상이한 렌티바이러스 캡시드를 사용할 수 있다 (예를 들어, FIV 또는 SHIV [U.S. 특허 번호 5,654,195]). SHIV 위형 벡터는 동물 모델 예컨대 원숭이에서 쉽게 사용될 수 있다.
본원에서 제공된 바와 같은 렌티바이러스 벡터 시스템은 전형적으로 gag, pol 또는 rev 유전자 중 적어도 하나를 포함하는 적어도 하나의 헬퍼 플라스미드를 포함한다. 각각의 gag, pol 및 rev 유전자는 개별 플라스미드 상에 제공될 수 있거나, 하나 이상의 유전자가 동일한 플라스미드 상에 함께 제공될 수 있다. 한 구현예에서, gag, pol 및 rev 유전자는 동일한 플라스미드 상에 제공된다 (예를 들어, 도 1). 또 다른 구현예에서, gag 및 pol 유전자는 제 1 플라스미드 상에 제공되며 rev 유전자는 제 2 플라스미드 상에 제공된다 (예를 들어, 도 2). 따라서, 3-벡터 (예를 들어, 도 1) 및 4-벡터 (예를 들어 도 2) 시스템 둘 모두가 본원에 기재된 바와 같은 렌티바이러스를 생성하는데 사용될 수 있다. 구현예에서, 치료적 벡터, 적어도 하나의 외피 플라스미드 및 적어도 하나의 헬퍼 플라스미드는 패키징 세포, 예를 들어 패키징 세포주에 형질감염된다. 패키징 세포주의 비제한적인 예는 293T/17 HEK 세포주이다. 치료적 벡터, 외피 플라스미드 및 적어도 하나의 헬퍼 플라스미드가 패키징 세포주에 형질감염되는 경우, 렌티바이러스 입자가 궁극적으로 생성된다. 본원에서 제공된 바와 같은 렌티바이러스 벡터 시스템은 전형적으로 gag, pol 또는 rev 유전자 중 적어도 하나를 포함하는 적어도 하나의 헬퍼 플라스미드를 포함한다. 각각의 gag, pol 및 rev 유전자는 개별 플라스미드 상에 제공될 수 있거나, 하나 이상의 유전자가 동일한 플라스미드 상에 함께 제공될 수 있다. 한 구현예에서, gag, pol 및 rev 유전자는 동일한 플라스미드 상에 제공된다 (예를 들어, 도 1). 또 다른 구현예에서, gag 및 pol 유전자는 제 1 플라스미드 상에 제공되며 rev 유전자는 제 2 플라스미드 상에 제공된다 (예를 들어, 도 2). 따라서, 3-벡터 및 4-벡터 시스템 둘 모두가 본원에 기재된 바와 같은 렌티바이러스를 생성하는데 사용될 수 있다. 구현예에서, 치료적 벡터, 적어도 하나의 외피 플라스미드 및 적어도 하나의 헬퍼 플라스미드는 패키징 세포, 예를 들어 패키징 세포주에 형질감염된다. 패키징 세포주의 비제한적인 예는 293T/17 HEK 세포주이다. 치료적 벡터, 외피 플라스미드 및 적어도 하나의 헬퍼 플라스미드가 패키징 세포주에 형질감염되는 경우, 렌티바이러스 입자가 궁극적으로 생성된다.
또 다른 양태에서, 렌티바이러스 입자를 발현하기 위한 렌티바이러스 벡터 시스템이 개시된다. 시스템은 본원에 기재된 바와 같은 렌티바이러스 벡터; 세포를 감염시키기 위해 최적화된 외피 단백질을 발현하기 위한 외피 플라스미드; 및 gag, pol 및 rev 유전자를 발현하기 위한 적어도 하나의 헬퍼 플라스미드를 포함하며, 여기서 렌티바이러스 벡터, 외피 플라스미드 및 적어도 하나의 헬퍼 플라스미드가 패키징 세포주에 형질감염되는 경우, 렌티바이러스 입자가 패키징 세포주에 의해 생성되며, 렌티바이러스 입자는 PAH 의 생성을 억제할 수 있다.
또 다른 양태에서, 본원에서 치료적 벡터로도 지칭되는 렌티바이러스 벡터는 하기 요소를 포함한다: 하이브리드 5' 긴 말단 반복부 (라우스 육종 바이러스 (RSV) 프로모터/5' 긴 말단 반복부 (LTR)) (SEQ ID NOS: 13-14), Psi 패키징 신호 (RNA 패키징 위치) (SEQ ID NO: 15), Rev-반응 요소 (RRE) (SEQ ID NO: 16), 중심 폴리푸린 관 (cPPT) (폴리푸린 관) (SEQ ID NO: 17), 인간 알파-1 항-트립신 프로모터 (hAAT) (SEQ ID NO: 4), 페닐알라닌 히드록실라아제 (PAH) (SEQ ID NOS: 1, 2, 및 70-76), 긴 우드척 전사후 조절 요소 (long Woodchuck Post-Transcriptional Regulatory Element) (WPRE) 서열 (SEQ ID NO: 18), 및 델타 U3 3' LTR (SEQ ID NO: 19). 구현예에서, 본원에서 치료적 벡터로도 지칭되는 렌티바이러스 벡터는 하기 요소를 포함한다: 하이브리드 5' 긴 말단 반복부 (라우스 육종 바이러스 (RSV) 프로모터/5' 긴 말단 반복부 (LTR)) (SEQ ID NOS: 13-14), Psi 패키징 신호 (RNA 패키징 위치) (SEQ ID NO: 15), Rev-반응 요소 (RRE) (SEQ ID NO: 16), 중심 폴리푸린 관 (cPPT) (폴리푸린 관) (SEQ ID NO: 17), H1 프로모터 (SEQ ID NO: 20), PAH shRNA (SEQ ID NOS: 11 및 12), 인간 알파-1 항-트립신 프로모터 (hAAT) (SEQ ID NO: 4), 긴 우드척 전사후 조절 요소 (WPRE) 서열 (SEQ ID NO: 18), 및 델타 U3 3' LTR (SEQ ID NO: 19). 구현예에서, 치환, 결실, 부가 또는 돌연변이에 의한 서열 변이는 본원에서 서열 참조물을 변형시키는데 사용될 수 있다.
또 다른 양태에서, 헬퍼 플라스미드는 하기 요소를 포함한다: CMV 인핸서/닭 베타 액틴 프로모터 (SEQ ID NO: 21); HIV 성분 gag (SEQ ID NO: 22); HIV 성분 pol (SEQ ID NO: 23); HIV Int (SEQ ID NO: 24); HIV RRE (SEQ ID NO: 25); 및 HIV Rev (SEQ ID NO: 26). 또 다른 양태에서, 헬퍼 플라스미드는 gag 유전자 (SEQ ID NO: 22) 및 pol 유전자 (SEQ ID NO: 23) 를 발현하기 위한 제 1 헬퍼 플라스미드, 및 rev 유전자 (SEQ ID NO: 26) 를 발현하기 위한 제 2 및 별개의 플라스미드를 포함하도록 변형될 수 있다. 구현예에서, 치환, 결실, 부가 또는 돌연변이에 의한 서열 변이는 본원에서 서열 참조물을 변형시키는데 사용될 수 있다.
또 다른 양태에서, 외피 플라스미드는 하기 요소를 포함한다: 사이토메갈로 바이러스 (CMV) 프로모터 (SEQ ID NO: 27) 및 수포성 구내염 바이러스 G 당단백질 (VSV-G) (SEQ ID NO: 28). 구현예에서, 치환, 결실, 부가 또는 돌연변이에 의한 서열 변이는 본원에서 서열 참조물을 변형시키는데 사용될 수 있다.
다양한 양태에서, 렌티바이러스 패키징에 사용된 플라스미드는 벡터 기능의 손실 없이 다양한 요소의 치환, 부가, 감산 또는 돌연변이에 의해 변형된다. 예를 들어, 비제한적으로, 하기 요소는 패키징 시스템을 포함하는 플라스미드 내의 유사한 요소를 대체할 수 있다: 신장 인자-1 알파 (EF-1 알파) 및 유비퀴틴 C (UbC) 프로모터는 CMV 또는 CAG 프로모터를 대체할 수 있다. SV40 폴리 A 및 bGH 폴리 A 는 토끼 베타 글로빈 폴리 A 를 대체할 수 있다. 또 다른 양탸에서, 헬퍼 플라스미드 내 HIV 서열은 상이한 HIV 계통 또는 클레이드로부터 구축될 수 있다. 예를 들어, VSV-G 당단백질은 감마레트로바이러스 (예를 들어, 예컨대, 긴팔원숭이 유인원 백혈병 바이러스, GALV, 뮤린 백혈병 바이러스 10A1, MLV, 코알라 레트로바이러스, 트라거 덕 비장 괴사 바이러스, 바이퍼 레트로바이러스, 병아리 세포융합 바이러스, 가드너-안슈타인 고양이 육종 바이러스 및 돼지 유형-C 종양바이러스), 내인성 레트로바이러스 (예를 들어, 고양이 내인성 바이러스 (RD114), 인간 내인성 레트로바이러스 예컨대 HERV-W, 및 비비 내인성 레트로바이러스, BaEV), 리사바이러스 (예를 들어, 광견병 바이러스, FUG), 포유동물 레나바이러스 (예를 들어, 림프구성 맥락수막염 바이러스, LCMV, 인플루엔자 바이러스 예컨대 인플루엔자 A 바이러스, 인플루엔자 A 조류 바이러스, FPV, 인플루엔자 B 바이러스, 인플루엔자 C 바이러스, 인플루엔자 D 바이러스, 이사바이러스, 콰란자바이러스 및 토고토바이러스), 알파바이러스 (예를 들어, 로스 리버 알파바이러스, RRV, 또는 에볼라 바이러스, EboV, 예컨대 수단 에볼라바이러스, 타이 포레스트 에볼라바이러스, 자이레 에볼라바이러스, 분디부교 에볼라바이러스 및 레스톤 에볼라바이러스) 에서 유래한 멤브레인 당단백질로 치환될 수 있다.
다양한 렌티바이러스 패키징 시스템은 상업적으로 구입할 수 있으며 (예를 들어 OriGene Technologies, Inc., Rockville, MD 로부터의 Lenti-vpak packaging kit), 또한 본원에 기재된 바와 같이 설계될 수 있다. 더욱이, 렌티바이러스 입자의 생성 효율을 포함하여 임의의 수의 관련 인자를 개선하기 위해 렌티바이러스 패키징 시스템의 양태를 치환하거나 변형시키는 것은 당업자의 기술 내에 있다.
또 다른 양태에서, 아데노-연관 바이러스 (AAV) 벡터가 또한 사용될 수 있다. 구현예에서, AAV 벡터는 AAV-DJ 혈청형이다. 구현예에서, AAV 벡터는 혈청형 1-11 중 임의의 혈청형이다. 구현예에서, AAV 혈청형은 AAV-2 이다. 구현예에서, AAV 벡터는 인간 간세포의 최적 형질도입을 위해 조작된 비-천연 유형이다.
AAV 벡터 구축. 본 개시물의 양태에서, PAH 코딩 서열 (SEQ ID NOS: 1, 2, 및 70-76) 및 프로트롬빈 인핸서 (SEQ ID NO: 3) 와 hAAT 프로모터 (SEQ ID NO: 4) 를 pAAV 플라스미드 (Cell Biolabs, San Diego, CA) 내로 삽입한다. PAH 코딩 서열과 측면 EcoRI 및 SalI 제한 위치는 Eurofins Genomics (Louisville, KY) 에 의해 합성된다. pAAV 플라스미드 및 PAH 서열을 EcoRI 및 SalI 효소로 소화시키고 함께 라이게이션한다. PAH 서열의 삽입을 서열분석에 의해 확인한다. 다음으로, 프로트롬빈 인핸서 및 hAAT 프로모터와 측면 MluI 및 EcoRI 제한 위치는 Eurofins Genomics (Louisville, KY) 에 의해 합성된다. PAH 코딩 서열 및 프로트롬빈 인핸서/hAAT 프로모터 서열을 함유하는 pAAV 플라스미드를 MluI 및 EcoRI 효소로 소화시키고 함께 라이게이션한다. 프로트롬빈 인핸서/hAAT 프로모터의 삽입을 서열분석에 의해 확인한다.
나아가, PAH 를 발현시키기 위한 대표적인 AAV 플라스미드 시스템은 AAV 헬퍼 플라스미드, AAV 플라스미드, 및 AAV Rev/Cap 플라스미드를 포함할 수 있다. AAV 헬퍼 플라스미드는 좌측 ITR (SEQ ID NO: 29), 프로트롬빈 인핸서 (SEQ ID NO: 3), 인간 항 알파 트립신 프로모터 (SEQ ID NO: 4), PAH 요소 (SEQ ID NOS: 1, 2 및 70-76), PolyA 요소 (SEQ ID NO: 30), 및 우측 ITR (SEQ ID NO: 31) 를 함유할 수 있다. AAV 플라스미드는 적합한 프로모터 요소 (SEQ ID NO: 21 또는 SEQ ID NO: 27), E2A 요소 (SEQ ID NO: 32), E4 요소 (SEQ ID NO: 33), 바이러스 연관 (VA) RNA 요소 (SEQ ID NO: 34), 및 PolyA 요소 (SEQ ID NO: 30) 를 함유할 수 있다. AAV Rep/Cap 플라스미드는 적합한 프로모터 요소 (SEQ ID NO: 21 또는 SEQ ID NO: 27), Rep 요소 (SEQ ID NO: 35; AAV2 Rep), Cap 요소 (SEQ ID NOS: 36 (AAV2 Cap), 37 (AAV8 Cap), 또는 38 (AAV DJ Cap)), 및 PolyA 요소 (SEQ ID NO: 30) 를 함유할 수 있다.
구현예에서, 프로트롬빈 인핸서 및 PAH 서열을 포함하는 AAV/DJ 플라스미드가 제공된다 (AAV/DJ-Pro-PAH). 구현예에서, PAH 서열은 본원에 개시된 임의의 코돈-최적화된 PAH 서열이다. 구현예에서, 프로트롬빈 인핸서, 인트론, 및 PAH 서열을 포함하는 AAV/DJ 플라스미드가 제공된다 (AAV/DJ-Pro-인트론-PAH). 구현예에서, 인트론은 인간 베타 글로빈 인트론이다. 구현예에서, 인트론은 토끼 베타 글로빈 인트론이다. 구현예에서, GFP 를 포함하는 AAV/DJ 플라스미드가 제공된다 (AAV/DJ-GFP).
구현예에서, 프로트롬빈 인핸서 및 PAH 서열을 포함하는 AAV2 플라스미드가 제공된다 (AAV2-Pro-PAH). 구현예에서, PAH 서열은 본원에 개시된 임의의 코돈-최적화된 PAH 서열이다. 구현예에서, 프로트롬빈 인핸서, 인트론, 및 PAH 서열을 포함하는 AAV2 플라스미드가 제공된다 (AAV2-Pro-인트론-PAH). 구현예에서, 인트론은 인간 베타 글로빈 인트론이다. 구현예에서, 인트론은 토끼 베타 글로빈 인트론이다. 구현예에서, GFP 를 포함하는 AAV2 가 제공된다 (AAV2-GFP).
구현예에서, 본원에서 개시되는 임의의 AAV 벡터는 조절 RNA 를 발현하는 코딩 서열을 함유할 수 있다. 구현예에서, 조절 RNA 는 lncRNA 이다. 구현예에서, 조절 RNA 는 microRNA 이다. 구현예에서, 조절 RNA 는 piRNA 이다. 구현예에서, 조절 RNA 는 shRNA 이다. 구현예에서, 조절 RNA 는 SEQ ID NOs: 11 또는 12 와 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95% 또는 그 이상의 동일성 % 를 갖는 서열을 포함하는 작은 RNA 서열이다.
AAV 입자의 생성. AAV-PAH 플라스미드는 플라스미드 pAAV-RC2 (Cell Biolabs) 및 pHelper (Cell Biolabs) 와 조합될 수 있다. pAAV-RC2 플라스미드는 Rep 및 AAV-2 캡시드 유전자를 함유할 수 있으며, pHelper 는 아데노바이러스 E2A, E4 및 VA 유전자를 함유할 수 있다. AAV 캡시드는 또한 AAV-8 (SEQ ID NO: 39) 또는 AAV-DJ (SEQ ID NO: 40) 서열을 포함할 수 있다. AAV 입자를 생성하기 위해, 이들 플라스미드를 1:1:1 비 (pAAV-PAH: pAAV-RC2: pHelper) 로 293T 세포에 형질감염시킬 수 있다. 150 mm 디쉬 (BD Falcon) 에서 세포의 형질감염을 위해, 10 ㎍ 의 각각의 플라스미드를 1 ml 의 DMEM 중 함께 첨가할 수 있다. 또 다른 튜브에서, 60 ㎕ 의 형질감염 시약 PEI (1 ㎍/㎖) (Polysciences) 를 1 ml 의 DMEM 에 첨가할 수 있다. 2 개의 튜브를 함께 혼합하여 15 분 동안 인큐베이션할 수 있다. 그런 다음, 형질감염 혼합물을 세포에 첨가할 수 있고, 세포를 3 일 후 수집한다. 세포를 드라이 아이스/이소프로판올 중 동결/해동 용해 (lysis) 에 의해 용해할 수 있다. 벤조나아제 뉴클레아제 (Sigma) 를 37℃ 에서 30 분 동안 세포 용해물에 첨가할 수 있다. 그런 다음, 세포 잔해를 4℃ 에서 15 분 동안 12,000 rpm 에서 원심분리에 의해 펠렛화할 수 있다. 상청액을 수집한 다음, 표적 세포에 첨가할 수 있다.
투약량 및 투약 형태
개시된 조성물은 질환의 다양한 단계 동안 PKU 환자를 치료하는데 사용될 수 있다. 개시된 벡터 시스템은 개시된 벡터의 에피솜 유지 및 관심 유전자 또는 서열의 단기간, 중간 기간 또는 장기간 발현을 가능하게 한다. 따라서, 투여 용법은 치료되는 병상 및 투여 방법을 기반으로 가변적일 수 있다.
구현예에서, 벡터 조성물은 가변적 용량으로 이를 필요로 하는 대상체에게 투여될 수 있다. 특히, 대상체는 약 ≥ 106 감염 용량 (여기서 1 용량이 1 표적 세포를 형질도입시키는데 평균적으로 필요함) 이 투여될 수 있다. 보다 특히, 대상체는 약 ≥ 107, 약 ≥ 108, 약 ≥ 109, 약 ≥ 1010, 약 ≥ 1011, 또는 약 ≥ 1012 감염 용량/체중 kg, 또는 이들 값 사이의 임의 수의 용량을 투여받을 수 있다. 용량의 상한치는 각각의 질환 징후에 대해 결정될 것이며, 각각의 개별 제품 또는 제품 로트에 대한 독성/안전성 프로파일에 따라 좌우될 것이다.
부가적으로, 본 개시물의 벡터 조성물은 1 일 1 회 또는 2 회와 같이 주기적으로, 또는 임의의 다른 적합한 시간으로 투여될 수 있다. 예를 들어, 벡터 조성물은 이를 필요로 하는 대상체에게 1 주에 1 회, 2 주에 1 회, 3 주에 1 회, 1 개월에 1 회, 2 개월마다, 3 개월마다, 6 개월마다, 9 개월마다, 1 년에 1 회, 18 개월마다, 2 년마다, 30 개월마다, 또는 3 년마다 투여될 수 있다.
구현예에서, 개시된 벡터 조성물은 약학 조성물로서 투여된다. 구현예에서, 약학 조성물은 임상 적용을 위한 코, 폐, 경구, 국소 또는 비경구 투약 형태를 포함하나 이에 제한되지는 않는 광범위한 투약 형태로 제형화될 수 있다. 각각의 투약 형태는 다양한 가용화제, 붕해제, 계면활성제, 충전제, 증점제, 결합제, 희석제 예컨대 습윤제 또는 다른 약학적으로 허용가능한 부형제를 포함할 수 있다. 약학 조성물은 또한 주사, 흡입, 주입 또는 피내 노출을 위해 제형화될 수 있다. 예를 들어, 주사가능 제형은 적합한 pH 및 등장성에서 수성 또는 비-수성 용액 중에 개시된 벡터를 포함할 수 있다.
개시된 벡터 조성물은 대상체에게 유도 주입으로 간 내로 직접 주입을 통해 투여될 수 있다. 일부 구현예에서, 벡터는 동맥 또는 정맥 순환을 통해 전신 투여될 수 있다. 일부 구현예에서, 벡터 조성물은 유도 삽관을 통해 비장 또는 췌장을 포함하는 간을 바로 둘러싼 조직에 투여될 수 있다. 일부 구현예에서, 벡터 조성물은 유도 삽관술 또는 바늘을 통해 신장으로 투여될 수 있다. 일부 구현예에서, 벡터 조성물은 유도 삽관 또는 바늘을 통해 흑질을 포함하는 뇌의 특정 부위에 투여될 수 있다. 일부 구현예에서, 벡터 조성물은 문맥 또는 문맥동 내로 주입에 의해 전달될 수 있고, 탯줄 정맥 내로 주입에 의해 전달될 수 있다.
개시된 벡터 조성물은 임의의 약학적으로 허용가능한 방법, 예컨대 비내, 구강, 설하, 경구, 직장, 안구, 비경구 (정맥내, 피부내, 근육내, 피하, 복강내), 폐, 질내, 국부 투여, 국소 투여, 난절 이후 국소 투여, 점막 투여를 사용하여, 에어로졸을 통해, 반고체 매질 예컨대 아가로오스 또는 젤라틴에서, 또는 구강 또는 코 스프레이 제형을 통해 투여될 수 있다.
또한, 개시된 벡터 조성물은 임의의 약학적으로 허용가능한 투약 형태, 예컨대 고체 투약 형태, 정제, 알약, 로젠지, 캡슐, 액체 분산액, 겔, 에어로졸, 폐 에어로졸, 코 에어로졸, 연고, 크림, 반고체 투약 형태, 용액, 에멀젼 및 현탁액으로 제형화될 수 있다. 또한, 약학 조성물은 제어 방출 제형, 지속 방출 제형, 즉시 방출 제형 또는 이의 임의 조합일 수 있다. 또한, 약학 조성물은 경피 전달 시스템일 수 있다.
구현예에서, 약학 조성물은 경구 투여용 고체 투약 형태로 제형화될 수 있고, 고체 투약 형태는 분말, 과립, 캡슐, 정제 또는 알약일 수 있다. 구현예에서, 고체 투약 형태는 하나 이상의 부형제 예컨대 칼슘 카르보네이트, 전분, 수크로오스, 락토오스, 미세결정질 셀룰로오스 또는 젤라틴을 포함할 수 있다. 또한, 고체 투약 형태는 부형제에 추가로, 윤활제 예컨대 탈크 또는 마그네슘 스테아레이트를 포함할 수 있다. 일부 구현예에서, 경구 투약 형태는 즉시 방출 또는 변형 방출 형태일 수 있다. 변형 방출 투약 형태는 제어 또는 연장 방출, 장 방출 등을 포함한다. 변형 방출 투약 형태에서 사용되는 부형제는 일반적으로 당업자에게 공지되어 있다.
구현예에서, 약학 조성물은 설하 또는 구강 투약 형태로서 제형화될 수 있다. 이러한 투약 형태는 혀 아래에 투여되는 설하 정제 또는 용액 조성물 및 뺨과 잇몸 사이에 놓여지는 구강 정제를 포함한다.
구현예에서, 약학 조성물은 코 투약 형태로서 제형화될 수 있다. 본 개시물의 이러한 투약 형태는 코 전달을 위한 용액, 현탁액 및 겔 조성물을 포함한다.
구현예에서, 약학 조성물은 경구 투여용 액체 투약 형태, 예컨대 현탁액, 에멀젼 또는 시럽으로 제형화될 수 있다. 구현예에서, 액체 투약 형태는 통용되는 단순한 희석제 예컨대 물 및 액체 파라핀에 추가로, 다양한 부형제 예컨대 보습제, 감미제, 방향제 또는 보존제를 포함할 수 있다. 구현예에서, 조성물은 소아과 환자에게 투여하기 적합하도록 제형화될 수 있다.
구현예에서, 약학 조성물은 비경구 투여용 투약 형태, 예컨대 멸균 수용액, 현탁액, 에멀젼, 비-수용액 또는 좌제로 제형화될 수 있다. 구현예에서, 용액 또는 현탁액은 프로필렌 글리콜, 폴리에틸렌 글리콜, 식물성 오일 예컨대 올리브 오일 또는 주사가능 에스테르 예컨대 에틸 올레에이트를 포함할 수 있다.
약학 조성물의 투약량은 환자의 체중, 연령, 성별, 투여 시기 및 방식, 배설률, 및 질환의 중증도에 따라 가변적일 수 있다.
구현예에서, PKU 의 치료는 바늘, 또는 혈관내 삽관을 사용하여 간 내로 개시된 벡터 구축물의 유도 직접 주입에 의해 달성된다. 구현예에서, 벡터 조성물은 정맥 또는 동맥 삽관 또는 주입, 피내 전달, 근육내 전달 또는 간 근처의 배수 기관 내로의 주입에 의해 뇌척수액, 혈액 또는 림프 순환에 투여된다.
하기 실시예는 본 발명의 양태를 예시하기 위해 제공된다. 그러나, 본 발명은 이들 실시예에서 기재되는 특정 조건 또는 세부사항에 제한되지 않는다고 이해될 것이다. 본원에서 참조하는 모든 인쇄된 공개물은 명확하게 참조로 통합된다.
실시예
실시예 1: 렌티바이러스 벡터 시스템의 개발
렌티바이러스 벡터 시스템을 도 1 (원형화된 형태) 에서 요약한 바와 같이 개발하였다.
렌티바이러스 입자를 293T/17 HEK 세포 (American Type Culture Collection, Manassas, VA 로부터 구입) 에서 생성시킨 후, 치료적 벡터, 외피 플라스미드 및 헬퍼 플라스미드로 형질감염하였다. 기능적 바이러스 입자를 생성한 293T/17 HEK 세포의 형질감염에는 시약 폴리(에틸렌이민) (PEI) 을 이용하여 플라스미드 DNA 흡수 효율을 증가시켰다. 플라스미드 및 DNA 를 초기에 3:1 의 비 (PEI 대 DNA 의 질량비) 로, 혈청 없는 배양 배지에서 별도로 첨가하였다. 2-3 일 후, 세포 배지를 수집하고 렌티바이러스 입자를 고속 원심분리 및/또는 여과에 의해 정제한 후, 음이온 교환 크로마토그래피를 수행하였다. 렌티바이러스 입자의 농도는 형질도입 단위/ml (TU/ml) 로 표현될 수 있다. TU 의 결정은 배양액 (p24 단백질이 렌티바이러스 입자에 통합됨) 중 HIV p24 수준을 측정함으로써, 정량 PCR 에 의해 형질도입된 세포 당 바이러스 DNA 카피수를 측정함으로써, 또는 세포를 감염시키고 광을 사용하여 (벡터가 루시퍼라아제 또는 형광 단백질 마커를 인코딩하는 경우) 달성되었다.
3-벡터 시스템 (즉, 2-벡터 렌티바이러스 패키징 시스템을 포함함) 은 렌티바이러스 입자의 생성을 위해 설계되었다. 3-벡터 시스템의 개략도를 도 1 에 나타낸다. 간략하게, 도 1 을 참조하면, 최상부 벡터는 헬퍼 플라스미드이며, 이러한 경우, 이는 Rev 를 포함한다. 도 1 의 중앙에 나타나는 벡터는 외피 플라스미드이다. 최하부 벡터는 본원에 기재된 바와 같은 치료적 벡터이다.
도 1 을 참조하면, 헬퍼 + Rev 플라스미드는 CMV 인핸서/ 닭 베타 액틴 프로모터 (SEQ ID NO: 21); 닭 베타 액틴 인트론 (SEQ ID NO: 39); HIV Gag (SEQ ID NO: 22); HIV Pol (SEQ ID NO: 23); HIV 인테그라아제 (SEQ ID NO: 24); HIV RRE (SEQ ID NO: 25); HIV Rev (SEQ ID NO: 26); 및 토끼 베타 글로빈 poly A (SEQ ID NO: 40) 를 포함한다.
외피 플라스미드는 CMV 프로모터 (SEQ ID NO: 27); 베타 글로빈 인트론 (SEQ ID NO: 5 또는 6); VSV-G 외피 당단백질 (SEQ ID NO: 28); 및 토끼 베타 글로빈 poly A (SEQ ID NO: 40) 를 포함한다.
헬퍼 (+ Rev) 및 외피 플라스미드를 함유하는 2-벡터 렌티바이러스 패키징 시스템을 포함하는 3-벡터 시스템의 합성이 개시된다.
재료 및 방법:
헬퍼 플라스미드의 구축: Gag, Pol 및 인테그라아제 유전자를 함유하는 pNL4-3 HIV 플라스미드 (NIH Aids Reagent Program) 로부터 DNA 단편의 초기 PCR 증폭에 의해 헬퍼 플라스미드를 구축하였다. 프라이머는, pCDNA3 플라스미드 (Invitrogen) 의 동일한 위치에서 삽입하는데 사용될 수 있는 EcoRI 및 NotI 제한 위치를 갖는 단편이 증폭되도록 설계되었다. 정방향 프라이머는 (5'-TAAGCAGAATTCATGAATTTGCCAGGAAGAT-3') (SEQ ID NO: 41) 및 역방향 프라이머는 (5'-CCATACAATGAATGGACACTAGGCGGCCGCACGAAT-3') (SEQ ID NO: 42) 였다.
Gag, Pol, 인테그라아제 단편에 대한 서열은 하기와 같았다:
Figure pct00001
Figure pct00002
Figure pct00003
다음으로, RRE, Rev, 및 토끼 베타 글로빈 poly A 서열과 XbaI 및 XmaI 측면 제한 위치를 함유하는 DNA 단편은 Eurofins Genomics 에 의해 합성되었다. DNA 단편을 그 후 플라스미드 내로 XbaI 및 XmaI 제한 위치에서 삽입하였다.
DNA 서열은 하기와 같았다:
Figure pct00004
Figure pct00005
마지막으로, pCDNA3.1 의 CMV 프로모터를 CAG 프로모터 (CMV 인핸서, 닭 베타 액틴 프로모터 + 닭 베타 액틴 인트론 서열) 로 대체하였다. CAG 인핸서/프로모터/인트론 서열과 MluI 및 EcoRI 측면 제한 위치를 함유하는 DNA 단편은 Eurofins Genomics 에 의해 합성되었다. 그런 다음, DNA 단편을 MluI 및 EcoRI 제한 위치에서 플라스미드에 삽입하였다. DNA 서열은 하기와 같았다:
Figure pct00006
Figure pct00007
VSV-G 외피 플라스미드의 구축:
수포성 구내염 인디아나 바이러스 당단백질 (VSV-G) 서열을 측면 EcoRI 제한 위치로, Eurofins Genomics 에 의해 합성하였다. 그런 다음, DNA 단편을 EcoRI 제한 위치에서 pCDNA3.1 플라스미드 (Invitrogen) 에 삽입하고, CMV 특이적 프라이머를 사용하는 서열분석에 의해 올바른 배향을 결정하였다.
DNA 서열은 하기와 같았다:
Figure pct00008
Figure pct00009
3-벡터 렌티바이러스 패키징 시스템을 포함하는 4-벡터 시스템은 또한, 본원에 기재된 방법 및 재료를 사용하여 설계되고 생성되었다. 4-벡터 시스템의 개략도를 도 2 에 나타낸다. 간략하게, 도 2 를 참조하면, 최상부 벡터는 헬퍼 플라스미드이며, 이러한 경우, 이는 Rev 를 포함하지 않는다. 제 2 벡터는 별개의 Rev 플라스미드이다. 제 3 벡터는 외피 플라스미드이다. 최하부 벡터는 본원에서 기재되는 치료적 벡터이다.
도 2 를 참조하면, 헬퍼 플라스미드는 CMV 인핸서 / 닭 베타 액틴 프로모터 (SEQ ID NO: 21); 닭 베타 액틴 인트론 (SEQ ID NO: 39); HIV Gag (SEQ ID NO: 22); HIV Pol (SEQ ID NO: 23); HIV 인테그라아제 (SEQ ID NO: 24); HIV RRE (SEQ ID NO: 25); 및 토끼 베타 글로빈 poly A (SEQ ID NO: 40) 를 포함한다.
Rev 플라스미드는 RSV 프로모터 및 HIV Rev (SEQ ID NO: 46); 및 토끼 베타 글로빈 poly A (SEQ ID NO: 40) 를 포함한다.
외피 플라스미드는 CMV 프로모터 (SEQ ID NO: 27); 베타 글로빈 인트론 (SEQ ID NO: 5 또는 6); VSV-G 외피 당단백질 (SEQ ID NO: 28); 및 토끼 베타 글로빈 poly A (SEQ ID NO: 40) 를 포함한다.
한 양태에서, PAH 를 발현하는 치료적 렌티바이러스 벡터는 도 3 의 벡터 A 에서 보여지는 요소 전부를 포함한다. 또 다른 양태에서, PAH 를 발현하는 치료적 렌티바이러스 벡터는 도 3 의 벡터 B 에서 보여지는 요소 전부를 포함한다. 또 다른 양태에서, PAH 를 발현하는 치료적 렌티바이러스 벡터는 도 3 의 벡터 C 에서 보여지는 요소 전부를 포함한다. 또 다른 양태에서, PAH 를 발현하는 치료적 렌티바이러스 벡터는 도 3 의 벡터 D 에서 보여지는 요소 전부를 포함한다.
Helper, Rev 및 외피 플라스미드를 함유하는 3-벡터 렌티바이러스 패키징 시스템을 포함하는 4-벡터 시스템의 합성이 개시된다.
재료 및 방법:
Rev 가 없는 헬퍼 플라스미드의 구축:
RRE 및 토끼 베타 글로빈 poly A 서열을 함유하는 DNA 단편을 삽입하여, Rev 가 없는 헬퍼 플라스미드를 구축하였다. 이 서열을 측면 XbaI 및 XmaI 제한 위치로, Eurofins Genomics 에 의해 합성하였다. 그런 다음, RRE/토끼 poly A 베타 글로빈 서열을 XbaI 및 XmaI 제한 위치에서 헬퍼 플라스미드에 삽입하였다.
DNA 서열은 하기와 같다:
Figure pct00010
Rev 플라스미드의 구축:
측면 MfeI 및 XbaI 제한 위치로, Eurofins Genomics 에 의해 단일 DNA 단편으로서 RSV 프로모터 및 HIV Rev 서열을 합성하였다. 그런 다음, DNA 단편을, CMV 프로모터가 RSV 프로모터로 대체되는 pCDNA3.1 플라스미드 (Invitrogen) 에 MfeI 및 XbaI 제한 위치에서 삽입하였다. DNA 서열은 하기와 같았다:
Figure pct00011
패키징 시스템에서 사용한 플라스미드는 유사한 요소로 변형될 수 있으며, 인트론 서열은 벡터 기능의 손실 없이 잠재적으로 제거될 수 있다. 예를 들어, 하기 요소는 패키징 시스템에서 유사한 요소를 대체할 수 있다:
프로모터: 신장 인자-1 알파 (EF1-알파) 프로모터 (SEQ ID NO: 47), 포스포글리세레이트 키나아제 (PGK) 프로모터 (SEQ ID NO: 48), 티록신 결합 글로불린 프로모터 (SEQ ID NO: 60) 및 유비퀴틴 C (UbC) 프로모터 (SEQ ID NO: 49) 는 CMV 프로모터 (SEQ ID NO: 27) 또는 CMV 인핸서/닭 베타 액틴 프로모터 (SEQ ID NO: 21) 를 대체할 수 있다. 이러한 서열은 또한 부가, 치환, 결실 또는 돌연변이에 의해 더 가변적일 수 있다.
Poly A 서열: SV40 poly A (SEQ ID NO: 50) 및 bGH poly A (SEQ ID NO: 30 또는 SEQ ID NO: 51) 는 토끼 베타 글로빈 poly A (SEQ ID NO: 40) 를 대체할 수 있다. 이러한 서열은 또한 부가, 치환, 결실 또는 돌연변이에 의해 더 가변적일 수 있다.
HIV Gag, Pol 및 인테그라아제 서열: 헬퍼 플라스미드에서의 HIV 서열은 상이한 HIV 균주 또는 클레이드 (clade) 로부터 구축될 수 있다. 예를 들어, Bal 균주로부터의 HIV Gag (SEQ ID NO: 22); HIV Pol (SEQ ID NO: 23); 및 HIV Int (SEQ ID NO: 24) 는 본원에 요약된 바와 같은 헬퍼/헬퍼 + Rev 플라스미드에 함유된 gag, pol 및 int 서열과 상호교환될 수 있다. 이러한 서열은 또한 부가, 치환, 결실 또는 돌연변이에 의해 더 가변적일 수 있다.
외피: VSV-G 당단백질은 고양이 내인성 바이러스 (RD114) 외피 (SEQ ID NO: 52), 긴팔원숭이 유인원 백혈병 바이러스 (GALV) 외피 (SEQ ID NO: 53), 광견병 (FUG) 외피 (SEQ ID NO: 54), 림프구성 맥락수막염 바이러스 (LCMV) 외피 (SEQ ID NO: 55), 인플루엔자 A 조류 바이러스 (FPV) 외피 (SEQ ID NO: 56), 로스 리버 알파바이러스 (RRV) 외피 (SEQ ID NO: 57), 뮤린 백혈병 바이러스 10A1 (MLV 10A1) 외피 (SEQ ID NO: 58) 또는 에볼라 바이러스 (EboV) 외피 (SEQ ID NO: 59) 로부터의 멤브레인 당단백질로 치환될 수 있다. 이러한 외피에 대한 서열은 본원의 서열 부분에서 확인된다. 추가로, 이러한 서열은 또한 부가, 치환, 결실 또는 돌연변이에 의해 더 가변적일 수 있다.
요약하여, 3-벡터 시스템 대 4-벡터 시스템은 하기와 같이 비교되고 대조될 수 있다. 3-벡터 렌티바이러스 벡터 시스템은 하기를 포함할 수 있다: (1) 헬퍼 플라스미드: HIV Gag, Pol, 인테그라아제 단편 (SEQ ID NO: 43), RRE, 및 Rev; (2) 외피 플라스미드: VSV-G 외피; 및 (3) 치료적 벡터: RSV, 5'LTR, Psi 패키징 신호, RRE, cPPT, 프로트롬빈 인핸서, 알파 1 항-트립신 프로모터, 페닐알라닌 히드록실라아제, WPRE, 및 3'델타 LTR. 4-벡터 렌티바이러스 벡터 시스템은 하기를 포함할 수 있다: (1) 헬퍼 플라스미드: HIV Gag, Pol, 인테그라아제 단편 (SEQ ID NO: 43), 및 RRE; (2) Rev 플라스미드: Rev; (3) 외피 플라스미드: VSV-G 외피; 및 (4) 치료적 벡터: RSV, 5'LTR, Psi 패키징 신호, RRE, cPPT, 프로트롬빈 인핸서, 알파 1 항-트립신 프로모터, 페닐알라닌 히드록실라아제, WPRE, 및 3'델타 LTR. 상기 요소에 상응하는 서열은 본원의 서열 목록 부분에서 확인된다.
실시예 2. 치료적 벡터
예시적 치료적 벡터를, 예를 들어 도 3 에서 나타내는 바와 같이 설계하고 개발하였다.
첫 번째로 도 3 의 벡터 A 를 참조하면, 좌측에서 우측으로, 핵심적 유전적 요소는 다음과 같다: 하이브리드 5' 긴 말단 반복부 (RSV/LTR), Psi 서열 (RNA 패키징 위치), RRE (Rev-반응 요소), cPPT (폴리푸린 관), 프로트롬빈 인핸서, hAAT 프로모터, 구현예에서, 본원에서 상세히 나타내는 바와 같은 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함하는 PAH 서열, 우드척 전사후 조절 요소 (WPRE), 및 U3 부위에 결실이 있는 LTR.
다음으로 도 3 의 벡터 B 를 참조하면, 좌측에서 우측으로, 핵심적 유전적 요소는 다음과 같다: 하이브리드 5' 긴 말단 반복부 (RSV/LTR), Psi 서열 (RNA 패키징 위치), RRE (Rev-반응 요소), cPPT (폴리푸린 관), 프로트롬빈 인핸서의 업스트림의 1 개의 HNF1/HNF4 (간세포 핵 인자) 결합 위치, hAAT 프로모터, 구현예에서, 본원에서 상세히 나타내는 바와 같은 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함하는 PAH 서열, 우드척 전사후 조절 요소 (WPRE), 및 U3 부위에 결실이 있는 LTR.
다음으로 도 3 의 벡터 C 를 참조하면, 좌측에서 우측으로, 핵심적 유전적 요소는 다음과 같다: 하이브리드 5' 긴 말단 반복부 (RSV/LTR), Psi 서열 (RNA 패키징 위치), RRE (Rev-반응 요소), cPPT (폴리푸린 관), 프로트롬빈 인핸서의 업스트림의 3 개의 HNF1/4 (간세포 핵 인자) 결합 위치, hAAT 프로모터, 구현예에서, 본원에서 상세히 나타내는 바와 같은 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함하는 PAH 서열, 우드척 전사후 조절 요소 (WPRE), 및 U3 부위에 결실이 있는 LTR.
다음으로 도 3 의 벡터 D 를 참조하면, 좌측에서 우측으로, 핵심적 유전적 요소는 다음과 같다: 하이브리드 5' 긴 말단 반복부 (RSV/LTR), Psi 서열 (RNA 패키징 위치), RRE (Rev-반응 요소), cPPT (폴리푸린 관), 프로트롬빈 인핸서의 업스트림의 5 개의 HNF1 (간세포 핵 인자) 결합 위치, hAAT 프로모터, 구현예에서, 본원에서 상세히 나타내는 바와 같은 코돈-최적화된 PAH 서열 또는 이의 변이체를 포함하는 PAH 서열, 우드척 전사후 조절 요소 (WPRE), 및 U3 부위에 결실이 있는 LTR.
도 3 에 일반적으로 나타낸 벡터를 생산하기 위해서, 본원에서 기재되는 바와 같고 그 외에는 당업자에게 이해되는 바와 같은 방법 및 재료를 이용하였다.
억제 RNA 설계: 호모 사피엔스 (Homo sapiens) 페닐알라닌 히드록실라아제 (PAH) (NM_000277.1) mRNA 의 서열을, 인간 세포에서 PAH 수준을 녹다운시키기 위한 잠재적 shRNA 후보물에 대한 검색에 사용하였다. 잠재적 RNA shRNA 서열을 siRNA 또는 shRNA 설계 프로그램에 의해 선별된 후보로부터 예컨대 Broad Institute (portals.broadinstitute.org/gpp/public/) 에 의해 관리되는 GPP 웹 포털 또는 Thermo Scientific 의 BLOCK-iT RNAi Designer (https://rnaidesigner.thermofisher.com/rnaiexpress/) 로부터 선택하였다. 개별 선택된 shRNA 서열을 RNA 폴리머라아제 III 프로모터 H1 (H1 프로모터) (SEQ ID NO: 20) 에 바로 3 프라임 (prime) 으로 렌티바이러스 벡터에 삽입하여, shRNA 발현을 조절하였다. 이러한 렌티바이러스 shRNA 구축물을 사용하여, 세포를 형질도입하고 특정 mRNA 수준에서의 변화를 측정하였다.
벡터 구축: PAH 를 표적으로 하는 shRNA 서열을 합성하기 위해, BamHI 및 EcoRI 제한 위치를 함유하는 올리고뉴클레오티드 서열을 Eurofins MWG Operon 에 의해 합성하였다. 중첩 센스 및 안티센스 올리고뉴클레오티드 서열을 70℃ 에서 실온으로 냉각시키는 동안 혼합 및 어닐링하였다. 렌티바이러스 벡터를 제한 효소 BamHI 및 EcoRI 으로 1 시간 동안 37℃ 에서 소화시켰다. 소화된 렌티바이러스 벡터를 아가로오스 겔 전기영동에 의해 정제하고, Thermo Scientific 으로부터의 DNA 겔 추출 키트를 사용하여 겔로부터 추출하였다. DNA 농도를 측정하고, 벡터 대 올리고 (3:1 비) 를 혼합하고, 어닐링하고, 라이게이션하였다. 라이게이션 반응을 T4 DNA 리가아제로 30 분 동안 실온에서 수행하였다. 2.5 ㎕ 의 라이게이션 믹스를 25 ㎕ 의 STBL3 적격 박테리아 세포에 첨가하였다. 형질전환을 42℃ 에서 열 충격 후 달성하였다. 박테리아 세포를 암피실린을 함유하는 아가 플레이트 상에 스프레딩하고, 약물-저항성 콜로니 (암피실린 저항성 플라스미드의 존재를 나타냄) 를 회수하고 LB 브로쓰에서 확장시켰다. 올리고 서열의 삽입을 확인하기 위해, 플라스미드 DNA 를 Thermo Scientific DNA mini prep 키트를 사용하여 수확된 박테리아 배양물로부터 추출하였다. 렌티바이러스 벡터 내의 shRNA 의 삽입은 shRNA 발현을 조절하는데 사용되는 프로모터에 대한 특이적 프라이머를 사용하여 DNA 서열분석에 의해 확인하였다. 하기 코딩 서열을 사용하여, 예시적 shRNA 서열을 PAH 를 녹다운시키는 것으로 결정하였다.
PAH shRNA 서열 #1:
Figure pct00012
PAH shRNA 서열 #2:
Figure pct00013
실시예 3. 간 특이적 프로트롬빈 인핸서 / hAAT 프로모터
Hepa1-6 마우스 간세포암 및 Hep3B 인간 암종 세포를 간-특이적 프로트롬빈 인핸서 (SEQ ID NO: 3) 및 인간 알파-1 항-트립신 프로모터 (SEQ ID NO: 4) 를 함유하는 렌티바이러스 벡터로 형질도입하여, 프로트롬빈 인핸서 및 인간 알파-1 항-트립신 프로모터를 함유하는 DNA 단편을 생성하였다. 그 결과의 DNA 서열은 하기와 같다:
Figure pct00014
Figure pct00015
이러한 감염에 대한 결과를 본원의 추가 실시예에서 상세히 나타낸다.
실시예 4. hAAT 프로모터와 프로트롬빈 인핸서 및 간세포 핵 인자 ( HNF ) 결합 위치
Hepa1-6 인간 간세포암 및 Hep3B 인간 암종 세포를 간-특이적 프로트롬빈 인핸서 (SEQ ID NO: 3), 인간 알파-1 항-트립신 프로모터 (SEQ ID NO: 4) 및 하나 이상의 간세포 핵 인자 (HNF) 결합 위치를 함유하는 렌티바이러스 벡터로 형질도입하였다. 프로트롬빈 인핸서, 인간 알파-1 항-트립신 프로모터 및 5 개의 HNF1 결합 위치 (밑줄그은 글씨체로 지정함) 를 함유하는 DNA 단편을 포함하는 생성 DNA 서열은 하기와 같았다:
Figure pct00016
프로트롬빈 인핸서, 인간 알파-1 항-트립신 프로모터 및 1 개의 HNF1/HNF4 결합 위치 (HNF1 은 밑줄그은 글씨체로 지정함; HNF4 는 굵은 글씨체로 지정함) 를 함유하는 DNA 단편을 포함하는 생성 DNA 서열은 하기와 같다:
Figure pct00017
Figure pct00018
프로트롬빈 인핸서, 인간 알파-1 항-트립신 프로모터 및 3 개의 HNF1/HNF4 결합 위치 (HNF1 은 밑줄그은 글씨체로 지정함; HNF4 는 굵은 글씨체로 지정함) 를 함유하는 DNA 단편을 포함하는 생성 DNA 서열은 하기와 같다:
Figure pct00019
이들 벡터로부터의 코돈-최적화된 PAH 의 발현을 본원의 추가 실시예에서 상세히 나타낸다.
실시예 5. PAH 를 함유하는 벡터를 합성하기 위한 재료 및 방법
호모 사피엔스 페닐알라닌 히드록실라아제 (hPAH) mRNA (Gen Bank: NM_000277.1) 의 서열을 Eurofins Genomics (Louisville, KY) 에 의해 유전자의 원위 및 근위 말단에 위치하는 EcoRI 및 SalI 제한 효소 위치로 화학적으로 합성하였다. EcoRI 및 SalI 제한 효소로 처리된 hPAH 를, ApoE (NM_000001.11, U35114.1) 또는 프로트롬빈 (AF478696.1), 및 hAAT (HG98385.1) 유전자좌 제어 부위의 부분을 포함하는 하이브리드 프로모터의 제어 하에 pCDH 렌티바이러스 플라스미드 (System Biosciences, CA) 내로 라이게이션하였다.
렌티바이러스 벡터 및 hPAH 서열을 제한 효소 BamHI 및 EcoRI (NEB, Ipswich, MA) 로 2 시간 동안 37℃ 에서 소화시켰다. 소화된 렌티바이러스 벡터를 아가로오스 겔 전기영동에 의해 정제하고, ThermoFisher (Waltham, MA) 로부터의 DNA 겔 추출 키트를 사용하여 겔로부터 추출하였다. DNA 농도를 결정한 다음, 3:1 의 삽입물 대 벡터 비를 사용하여 PAH 서열과 혼합하였다. 혼합물을 T4 DNA 리가아제 (NEB) 로 30 분 동안 실온에서 라이게이션하였다. 2.5 ㎕ 의 라이게이션 믹스를 25 ㎕ 의 STBL3 적격 박테리아 세포 (ThermoFisher) 에 첨가하였다. 형질전환을 열 충격에 의해 42℃ 에서 실행하였다. 박테리아 세포를 암피실린을 함유하는 아가 플레이트에 스트리킹한 다음, 콜로니를 LB 브로쓰에서 확장시켰다. PAH 서열의 삽입을 확인하기 위해서, ThermoFisher DNA 미니 프렙 키트를 사용하여 수확된 박테리아 배양물로부터 플라스미드 DNA 를 추출하였다. 렌티바이러스 벡터 (LV) 내의 PAH 서열의 삽입을 DNA 서열분석 (Eurofins Genomics) 에 의해 확인하였다. 다음으로, ClaI 및 EcoRI 제한 위치가 있는 ApoE 인핸서/hAAT 프로모터 또는 프로트롬빈 인핸서/hAAT 프로모터 서열을 Eurofins Genomics 에 의해 합성하였다. PAH 코딩 서열 및 하이브리드 프로모터를 함유하는 렌티바이러스 벡터를 ClaI 및 EcoRI 효소로 소화시키고, 함께 라이게이션하였다. 하이브리드 프로모터를 함유하는 플라스미드를 DNA 서열분석에 의해 확인하였다. hPAH 및 하이브리드 프로모터 서열을 함유하는 렌티바이러스 벡터를 그 후 사용하여, 형질도입된 세포에서 PAH 를 발현하는 능력에 관해 시험하기 위해서 렌티바이러스 입자를 패키징하였다. 포유동물 세포에 렌티바이러스 입자를 형질도입하였다. 3 일 후에 세포를 수집하고, 단백질을 면역블롯에 의해 PAH 발현에 대해 분석하였다.
hPAH 서열의 조절:
간 특이적 인핸서-프로모터를 렌티바이러스 벡터에 첨가하여 간-특이적 방식으로 PAH 발현을 조절하였다. 구체적으로, 프로트롬빈 인핸서를 렌티바이러스 벡터 내 인간 알파-1-항-트립신 프로모터와 조합하여 PAH 발현을 조절하였다. 간 세포에 대한 이식유전자 발현을 제한하는 것은, 페닐케톤뇨증을 치료하기 위한 유전적 의약에 대한 벡터 안전성 및 표적 특이성을 위한 중요한 고려 사항이다.
실시예 6. 코돈-최적화된 PAH 서열의 합성
호모 사피엔스 페닐알라닌 히드록실라아제 (hPAH) mRNA (Gen Bank: NM_000277.1) 서열에서 코돈 내 특정 염기를 변화시켜, OPT2 PAH 서열 (SEQ ID NO: 2) 및 OPT3 PAH 코돈-최적화된 서열 (SEQ ID NO: 70) 을 생성하였다. EcoRI 및 SalI 제한 위치가 측면에 있는 OPT2 및 OPT3 PAH 서열을 Eurofins Genomics 및 IDT 에 의해 합성하고, EcoRI 및 SalI 으로 소화된 렌티바이러스 벡터 내로 라이게이션하였다.
하이브리드 PAH 코돈-최적화된 서열을 StuI (New England Biolabs) 를 사용하여 제한 엔도뉴클레아제 소화에 의해 구축하였다. C-말단 단편을 OPT2 또는 OPT3 서열을 함유하는 LV-Pro-hAAT-PAH 플라스미드로부터 소화시켰다. C-말단 OPT3 단편을 N-말단 OPT2 서열을 함유하는 플라스미드에 다시 라이게이션하여, OPT2/3 서열 (SEQ ID NO: 71) 을 생성하였다. C-말단 OPT2 서열을 N-말단 OPT3 서열을 함유하는 플라스미드에 다시 라이게이션하여, OPT3/2 서열 (SEQ ID NO: 72) 을 생성하였다. 단편의 올바른 배향을 서열분석 (Eurofins Genomics) 에 의해 확인하였다.
실시예 7. Hepa1 -6 세포에서 코돈-최적화된 버전의 PAH 를 발현하는 LV -Pro-hAAT-hPAH 를 사용한 PAH 의 발현
본 실시예는 Pro hAAT 및 코돈-최적화된 버전의 PAH 를 함유하는 렌티바이러스 벡터를 사용하는 PAH 의 발현을 예시한다.
실시예 6 에서 기재한 바와 같이, hPAH 를 코돈-최적화하고 (GeneArt Thermo 및 IDT), 합성하고 (IDT 및 Eurofins Genomics), 프로트롬빈 인핸서-hAAT 프로모터를 함유하는 렌티바이러스 벡터에 삽입하였다. 서열의 삽입을 DNA 서열분석 (Eurofins Genomics) 에 의해 확인하였다.
그런 다음, hPAH 또는 코돈-최적화된 hPAH 를 함유하는 렌티바이러스 벡터를 사용하여 마우스 Hepa1-6 세포 (American Type Culture Collection) 를 형질도입하였다. 세포에 5 의 감염 다중도 (MOI) 에서 렌티바이러스 입자를 형질도입하고, 3 일 후 단백질 발현을 PAH 발현에 대한 면역블롯에 의해 분석하였다. 세포를 1% NP-40 및 프로테아제 억제제 믹스 (Thermo) 를 함유하는 Tris-HCl (pH 7.5) 완충제로 용해하였다. 세포 용해물을 10000 RPM 에서 15 분 동안 원심분리하고, 단백질 어세이 시약 (Bio-Rad) 을 사용하여 단백질 농도를 결정하였다. 단백질 용해물을 4-12% Tris-Bis 겔 (Thermo) 상에서 분리하고, Bio-Rad 이동 유닛에서 12 시간 동안 이동시켰다. 항-PAH 항체 (MilliporeSigma) 를 사용하여 면역블롯에 의해 PAH 의 발현을 검출하고, 항-베타 액틴 항체 (MilliporeSigma) 를 로딩 대조군에 사용하였다. PAH 발현은 프로트롬빈 인핸서 및 hAAT 프로모터에 의해 유도되었다. 다양한 경우에, 렌티바이러스 벡터에 hPAH 또는 코돈-최적화된 버전의 hPAH 유전자를 통합시켰다.
도 4A 는 Hepa1-6 세포에서 프로트롬빈-hAAT PAH 및 프로트롬빈-hAAT 코돈-최적화된 PAH (OPT2; SEQ ID NO: 2) 를 함유하는 렌티바이러스 벡터로부터의 PAH 발현을 입증하는 데이터를 도시한다. 코돈-최적화된 버전의 PAH (OPT2) 의 발현은 hPAH 의 발현보다 44% 적었다. 도 4B 는 Hepa1-6 세포에서 프로트롬빈-hAAT PAH 또는 3 개의 상이한 코돈-최적화된 버전의 PAH 를 함유하는 렌티바이러스 벡터로부터의 면역블롯에 의해 PAH 단백질 발현을 비교한다. 면역블롯의 제 1 레인은 미-형질도입된 세포로 이루어지고, 제 2 레인은 인간 버전의 PAH (hPAH) 를 발현하는 렌티바이러스로 형질도입된 세포 (1 로 설정) 이고, 제 3 레인은 코돈-최적화된 버전 3 (OPT3; SEQ ID NO: 70) 의 PAH 를 발현하는 렌티바이러스로 형질도입된 세포 (2.6 배 증가) 이고, 제 4 레인은 코돈-최적화된 버전 2/3 (OPT2/3; SEQ ID NO: 71) 의 PAH 를 발현하는 렌티바이러스로 형질도입된 세포 (1.9 배 증가) 이고, 마지막 레인은 코돈-최적화된 버전 3/2 (OPT3/2; SEQ ID NO: 72) 의 PAH 를 발현하는 렌티바이러스로 형질도입된 세포 (1.4 배 증가) 이다. 각각의 면역블롯에 대한 밴드 강도는 Adobe PhotoShop 을 사용하여 농도계에 의해 결정하였다.
도 4A 및 4B 에서 나타낸 바와 같이, 코돈-최적화된 OPT3 PAH 서열로의 형질도입은 (i) 코돈-최적화된 OPT2 (SEQ ID NO: 2), OPT2/3 (SEQ ID NO: 71) 및 OPT3/2 PAH (SEQ ID NO: 72) 서열로의 형질도입에 비해, 그리고 (ii) hPAH 서열 (SEQ ID NO: 1) 로의 형질도입에 비해 PAH 발현 증가를 초래하였다.
실시예 8. Hepa1 -6 세포에서 hPAH 및 코돈-최적화된 버전의 PAH 의 형질도입 후 PAH mRNA 의 발현 수준 측정
본 실시예는, 도 5 에서 나타낸 바와 같이, 코돈-최적화되지 않은 PAH 서열 (SEQ ID NO: 1) 에 비해 프로트롬빈-hAAT 코돈-최적화된 PAH (OPT3 (SEQ ID NO: 70) 및 OPT2/3 (SEQ ID NO: 71)) 을 함유하는 렌티바이러스 벡터로 MOI 5 에서 형질도입된 Hepa1-6 암종 세포에서 PAH RNA 의 발현이 증가한다는 것을 예시한다.
hPAH 를 코돈-최적화하고 (GeneArt Thermo), 합성하고 (IDT 및 Eurofins Genomics), 프로트롬빈 인핸서-hAAT 프로모터를 함유하는 렌티바이러스 벡터에 삽입하였다. 서열의 삽입을 DNA 서열분석 (Eurofins Genomics) 에 의해 확인하였다. 비-최적화된 PAH 또는 코돈-최적화된 PAH 를 함유하는 렌티바이러스 벡터를 사용하여 Hepa1-6 마우스 암종 세포 (American Type Culture Collection) 를 형질도입하였다. 세포에 렌티바이러스 입자를 형질도입하고, 3 일 후 RNA 를 RNeasy 키트 (Qiagen) 로 추출하고, QuantStudio 3 (Thermo) 으로 qPCR 에 의해 분석하였다. hPAH RNA 발현을 TaqMan 프로브 및 프라이머 (IDT): hPAH FAM TaqMan 프로브 (5'-TCGTGAAAGCTCATGGACAGTGGC-3': SEQ ID NO: 64) 및 hPAH 에 대한 프라이머 세트 (PAH TaqMan 정방향 프라이머: 5'-AGATCTTGAGGCATGACATTGG-3': SEQ ID NO: 65; 및 PAH TaqMan 역방향 프라이머: 5'-GTCCAGCTCTTGAATGGTTCTT-3': SEQ ID NO: 66) 를 사용하여 검출하였다. 총 RNA (100 ng) 를 액틴 FAM 프로브 (5'-AGCGGGAAATCGTGCGTGAC-3': SEQ ID NO: 67) 및 프라이머 세트 (액틴 정방향 프라이머: 5'-GGACCTGACTGACTACCTCAT-3': SEQ ID NO: 68; 및 액틴 역방향 프라이머: 5'-CGTAGCACAGCTTCTCCTTAAT-3': SEQ ID NO: 69) 로 정규화하였다.
도 5 에서 나타낸 바와 같이, 3 개 군: PAH (SEQ ID NO: 1) (막대 1) 또는 코돈-최적화된 버전의 PAH (OPT3 (SEQ ID NO: 70)) 및 OPT2/3 (SEQ ID NO: 71, 각각 막대 2 및 3) 의 코딩 부위를 발현하는 렌티바이러스 벡터로 5 MOI 에서 형질도입된 Hepa1-6 세포를 비교한다. PAH RNA 수준은 PAH (SEQ ID NO: 1) 를 발현하는 Hepa1-6 세포 (1 로 설정) 로부터 RNA 배수 변화로서 표현된다. 코돈-최적화된 버전으로부터의 PAH (OPT3: 서SEQ ID NO: 70) 를 발현하는 세포에서, PAH (SEQ ID NO: 1) 와 비교하여 발현이 4.5 배 증가하였다. 코돈-최적화된 버전으로부터의 PAH (OPT2/3: SEQ ID NO: 71) 를 발현하는 세포에서, PAH (SEQ ID NO: 1) 와 비교하여 발현이 2.2 배 증가하였다.
실시예 9. Hepa1-6 및 Hep3B 세포에서 HNF1 또는 HNF1/4 결합 위치를 함유하는 프로트롬빈 인핸서 및 코돈-최적화된 PAH 서열을 갖는 PAH 의 렌티바이러스-전달 발현
이 실시예는 도 6A-6B 에서 나타내는 바와 같이, 프로트롬빈 인핸서 및 업스트림 HNF1/4 결합 위치와의 조합으로 hAAT 프로모터를 함유하는 렌티바이러스 벡터로 형질도입되는 경우 마우스 Hepa1-6 및 인간 Hep3B 암종 세포에서 코돈-최적화된 hPAH 의 발현이 증가한다는 것을 예시한다. 이 실시예는 또한, Hepa1-6 세포 및 Hep3B 세포에서 코돈-최적화된 버전의 hPAH 코딩 서열 (OPT3) 이 비-최적화된 hPAH 코딩 부위 서열보다 더 많이 발현된다는 것을 보여준다. 이 실시예는 또한, 프로트롬빈 인핸서와의 조합으로 간세포 핵 인자-1 및 간세포 핵 인자-4 (HNF1 및 HNF1/4) 결합 위치를 발현하는 렌티바이러스 벡터가 Hepa1-6 세포 및 Hep3B 세포에서 PAH 단백질의 수준을 증가시킨다는 것을 나타낸다.
hPAH (최적화 및 비-최적화됨) 및 HNF1/4 결합 위치를 갖는 프로트롬빈 인핸서의 변이를 합성하고 (Eurofin Genomics 및 IDT), hAAT 프로모터를 함유하는 렌티바이러스 벡터에 삽입하였다. 서열의 삽입을 DNA 서열분석 (Eurofin Genomics) 에 의해 확인하였다. 그런 다음, 확인된 PAH 서열을 함유하는 렌티바이러스 벡터를 사용하여 Hepa1-6 마우스 간암 세포 (American Type Culture Collection, Manassas) 를 형질도입하였다. 세포에 MOI 5 에서 렌티바이러스 입자를 형질도입하고, 3 일 후 단백질을 PAH 발현에 대한 면역블롯에 의해 분석하였다. 세포를 1% NP-40 및 프로테아제 억제제 믹스 (Thermo) 를 함유하는 Tris-HCl (pH 7.5) 완충제로 용해하였다. 세포 용해물을 10000 RPM 에서 15 분 동안 원심분리하고, 단백질 어세이 시약 (Bio-Rad) 을 사용하여 단백질 농도를 결정하였다. 단백질 용해물을 4-12% Tris-Bis 겔 (Thermo) 상에서 분리하고, Bio-Rad 이동 유닛에서 12 시간 동안 이동시켰다. 항-PAH 항체 (MilliporeSigma) 를 사용하여 면역블롯에 의해 PAH 의 발현을 검출하고, 항-베타 액틴 항체 (MilliporeSigma) 를 로딩 대조군에 사용하였다. PAH 발현은 프로트롬빈 인핸서 및 hAAT 프로모터에 의해 유도되었다. 다양한 경우에, 렌티바이러스 벡터에 코돈-최적화된 버전의 hPAH 유전자 또는 코돈이 미변형된 채로 남아 있는 hPAH 유전자를 통합하였다. 또한, 이들 구축물에서의 PAH 발현은 HNF1 또는 HNF1/4 결합 위치의 업스트림에 간-특이적 프로트롬빈 인핸서를 함유하는 hAAT 프로모터에 의해 유도되었다. 면역블롯에 대한 밴드 강도는 Adobe PhotoShop 을 사용하여 농도계에 의해 결정하였다.
도 6A 에서 나타낸 바와 같이, 6 개 군: (1) Hepa1-6 세포 단독 (레인 1), (2) 프로트롬빈 인핸서/hAAT 프로모터에 의해 hPAH 의 코딩 부위를 발현하는 렌티바이러스 벡터 (레인 2) (1 로 설정), (3) 프로트롬빈 인핸서/hAAT 프로모터에 의해 코돈-최적화된 hPAH (OPT3) 를 발현하는 렌티바이러스 벡터 (레인 3) (5.7 배 증가), (4) 프로트롬빈 인핸서의 업스트림에 1 개의 HNF-1 및 HNF-4 결합 위치를 갖는 프로트롬빈 인핸서/hAAT 에 의해 코돈-최적화된 hPAH (OPT3) 를 발현하는 렌티바이러스 벡터 (레인 4), (5) 프로트롬빈 인핸서의 업스트림에 3 개의 HNF-1 및 HNF-4 결합 위치를 갖는 프로트롬빈 인핸서/hAAT 에 의해 코돈-최적화된 hPAH (OPT3) 를 발현하는 렌티바이러스 벡터 (레인 5) (5.8 배 증가), 및 (6) 프로트롬빈 인핸서의 업스트림에 5 개의 HNF-1 결합 위치를 갖는 프로트롬빈 인핸서/hAAT 에 의해 코돈-최적화된 hPAH (OPT3) 를 발현하는 렌티바이러스 벡터 (레인 6) (5.9 배 증가) 를 비교한다. 이 실험에 사용된 hPAH 에 대한 서열은 SEQ ID NO: 1 이었다. 이 실험에 사용된 코돈-최적화된 PAH 에 사용된 서열은 SEQ ID NO: 70 이었다.
도 6B 에 나타낸 바와 같이, 6 개 군: (1) Hep3B 세포 단독 (레인 1), (2) 프로트롬빈 인핸서/hAAT 프로모터 (SEQ ID NO: 61) 에 의해 hPAH (SEQ ID NO: 1) 의 코딩 부위를 발현하는 렌티바이러스 벡터 (레인 2) (1 로 설정), (3) 프로트롬빈 인핸서/hAAT 프로모터 (SEQ ID NO: 61) 에 의해 코돈-최적화된 hPAH (OPT3) (SEQ ID NO: 70) 를 발현하는 렌티바이러스 벡터 (레인 3) (4.1 배 증가), (4) 프로트롬빈 인핸서의 업스트림에 1 개의 HNF-1 및 HNF-4 결합 위치를 갖는 프로트롬빈 인핸서/hAAT 프로모터 (SEQ ID NO: 9) 에 의해 코돈-최적화된 hPAH (OPT3) 를 발현하는 렌티바이러스 벡터 (레인 4) (5.3 배 증가), (5) 프로트롬빈 인핸서의 업스트림에 3 개의 HNF-1 및 HNF-4 결합 위치를 갖는 프로트롬빈 인핸서/hAAT 프로모터 (SEQ ID NO: 10) 에 의해 코돈-최적화된 hPAH (OPT3) 를 발현하는 렌티바이러스 벡터 (레인 5) (4.8 배 증가), 및 (6) 프로트롬빈 인핸서의 업스트림에 5 개의 HNF-1 결합 위치를 갖는 프로트롬빈 인핸서/hAAT 프로모터 (SEQ ID NO: 8) 에 의해 코돈-최적화된 hPAH (OPT3) 를 발현하는 렌티바이러스 벡터 (레인 6) (4.5 배 증가) 를 비교한다.
도6A 및 6B 는 PAH 로 형질도입된 Hepa1-6 및 Hep3B 암종 세포에 비해 프로트롬빈 인핸서의 업스트림에 HNF1 또는 HNF1/4 결합 위치를 갖는 코돈-최적화된 버전의 PAH (OPT3) 를 함유하는 렌티바이러스 벡터로 형질도입되는 경우 Hepa1-6 및 Hep3B 암종 세포에서 PAH 의 발현이 증가한다는 것을 입증한다.
실시예 10. hAAT 인핸서/트란스타이레틴 프로모터/마우스 미세 바이러스 인트론 또는 프로트롬빈 인핸서/hAAT 프로모터/마우스 미세 바이러스 인트론을 함유하는 조절 서열 및 코돈-최적화된 PAH 서열을 갖는 Huh-7 세포에서 hPAH 의 렌티바이러스-전달 발현
본 실시예는 도 7 에서 나타낸 바와 같이, 코돈-최적화된 인간 PAH 의 발현이 인트론 및 대안적 인핸서/프로모터 조합을 함유하는 대안적 구축물과 비교하여 간-특이적 조절 요소를 함유하는 렌티바이러스 벡터를 갖는 인간 간세포 암종 세포에서 증가한다는 것을 예시한다.
프로트롬빈 인핸서 (SEQ ID NO: 61) 와 조합으로의 hAAT 프로모터는 PAH 발현을 증가시켰으나, 마우스 미세 바이러스로부터의 인트론 서열 (SEQ ID NO: 80) 의 첨가는 발현을 향상시키지 않았다. 프로트롬빈 인핸서 및 hAAT 프로모터 (SEQ ID NO: 61) 와 코돈-최적화된 PAH 서열 (SEQ ID NO: 70) 의 조합은 hAAT 프로모터 (SEQ ID NO: 82) 및 트란스타이레틴 인핸서 (SEQ ID NO: 81) 와 비교하여 PAH 의 더 높은 발현을 초래하였다.
간-특이적 조절 서열을 합성하고 (IDT), 최적화된 PAH 서열의 업스트림의 렌티바이러스 벡터에 삽입하였다. 서열의 삽입을 DNA 서열분석 (Eurofin Genomics) 에 의해 확인하였다. 그런 다음, 확인된 서열을 함유하는 렌티바이러스 벡터를 사용하여 Huh-7 간세포 암 세포 (Japanese Collection of Research Bioresources Cell Bank) 를 형질도입하였다. 세포에 MOI 50 에서 렌티바이러스 입자를 형질도입하고 3 일 후 단백질을 PAH 발현에 대한 면역블롯에 의해 분석하였다. 세포를 1% NP-40 및 프로테아제 억제제 믹스 (Thermo) 를 함유하는 Tris-HCl (pH 7.5) 완충제로 용해하였다. 세포 용해물을 12,000 RPM 에서 15 분 동안 원심분리하고, 단백질 어세이 시약 (Bio-Rad) 을 사용하여 단백질 농도를 결정하였다. 단백질 용해물을 4-12% Tris-Bis 겔 (Thermo) 상에서 분리하고, Bio-Rad 이동 유닛에서 16 시간 동안 이동시켰다. 항-PAH 항체 (MilliporeSigma) 를 사용하여 면역블롯에 의해 PAH 의 발현을 검출하고, 항-베타 액틴 항체 (MilliporeSigma) 를 로딩 대조군에 사용하였다. 면역블롯에 대한 밴드 강도는 Adobe PhotoShop 을 사용하여 농도계에 의해 결정하였다.
도 7 에서 나타낸 바와 같이, 4 개 군: (i) Huh-7 세포 단독 (레인 1); (ii) 코돈-최적화된 hPAH (OPT3; SEQ ID NO: 70) 및 프로트롬빈 인핸서/hAAT 프로모터 (SEQ ID NO: 61) 를 발현하는 렌티바이러스 벡터 (레인 2) (1 로 설정된 기준 밴드 강도); (iii) 프로트롬빈 인핸서/hAAT 프로모터 및 마우스 미세 바이러스의 인트론 서열 (SEQ ID NO: 78) 에 의해 코돈-최적화된 hPAH (OPT3) 을 발현하는 렌티바이러스 벡터 (레인 3) (밴드 강도 0.80); 및 (iv) hAAT 프로모터/트란스타이레틴 인핸서 및 마우스 미세 바이러스의 인트론 서열 (SEQ ID NO: 79) 에 의해 코돈-최적화된 hPAH (OPT3) 를 발현하는 렌티바이러스 벡터 (레인 4) (밴드 강도 0.36) 를 비교한다.
결과는, 마우스 미세 바이러스로부터의 인트론 서열을 인코딩하는 렌티바이러스 벡터가 이러한 인트론 서열이 결여된 렌티바이러스 벡터에 비해 더 낮은 PAH 발현을 초래하였다는 것을 나타낸다 (도 7 의 레인 2 를 레인 3 과 비교). 이러한 발견은, 이전의 연구가 마우스 미세 바이러스로부터의 인트론 서열이 벡터로부터의 외인성 유전자 발현을 증가시킨다는 것을 시사하기 때문에 예상치 못한 것이다. 또한, 본 실시예는 간-특이적 유전자 발현을 위해 사용된 프로모터/인핸서 조합을 함유하는 렌티바이러스 벡터가 본원에 제공된 바와 같이 추가적인 인트론이 없는 프로트롬빈 인핸서/hAAT 프로모터의 특정 조합을 함유하는 렌티바이러스 벡터보다 더 낮은 PAH 발현을 초래한다는 것을 예상치 않게 보여준다 (도 7 의 레인 2 를 레인 4 와 비교).
실시예 11. 돌연변이체 WPRE 서열 또는 짧은 WPRE (WPREs) 서열을 갖고 PAH 또는 알부민 3' UTR 서열을 함유하는 코돈-최적화된 PAH 서열을 갖는 Huh-7 세포에서 hPAH 의 렌티바이러스-전달 발현
본 실시예는 도 8 에서 나타낸 바와 같이, 3'UTR 및 대안적 WPRE 서열을 포함하는 대안적 벡터 구축물과 비교하여 간-특이적 조절 요소를 함유하는 렌티바이러스 벡터를 갖는 인간 간세포 암종 세포에서 코돈-최적화된 인간 PAH 의 발현이 증가한다는 것을 예시한다.
WPRE 가 X-단백질 서열이 없는 더 짧은, 돌연변이체 버전으로 변형된 경우 (SEQ ID NO: 87), PAH 의 발현은 야생형 WPRE (SEQ ID NO: 18) 를 함유하는 벡터보다 작지만 유사하였다. PAH 유전자 (SEQ ID NO: 85) 또는 알부민 유전자 (SEQ ID NO: 86) 로부터의 3' UTR 서열을 PAH 코딩 서열의 다운스트림에 첨가한 경우, 이는 PAH 최적화된 버전 3-PAH 3'UTR 서열 (SEQ ID NO: 83) 또는 PAH 최적화된 버전 3-알부민 3'UTR 서열 (SEQ ID NO: 84) 을 초래하여, 3'UTR 을 함유하지 않는 벡터에 비해 PAH 의 발현이 감소되었다.
WPREs 및 3' UTR 서열을 합성하고 (IDT), 최적화된 PAH 서열의 업스트림의 렌티바이러스 벡터에 삽입하였다. 서열의 삽입을 DNA 서열분석 (Eurofin Genomics) 에 의해 확인하였다. 그런 다음, 확인된 서열을 함유하는 렌티바이러스 벡터를 사용하여 Huh-7 간세포 암 세포 (Japanese Collection of Research Bioresources Cell Bank) 를 형질도입하였다. 세포에 MOI 50 에서 렌티바이러스 입자를 형질도입하고 3 일 후 단백질을 PAH 발현에 대한 면역블롯에 의해 분석하였다. 세포를 1% NP-40 및 프로테아제 억제제 믹스 (Thermo) 를 함유하는 Tris-HCl (pH 7.5) 완충제로 용해하였다. 세포 용해물을 12,000 RPM 에서 15 분 동안 원심분리하고, 단백질 어세이 시약 (Bio-Rad) 을 사용하여 단백질 농도를 결정하였다. 단백질 용해물을 4-12% Tris-Bis 겔 (Thermo) 상에서 분리하고, Bio-Rad 이동 유닛에서 16 시간 동안 이동시켰다. 항-PAH 항체 (MilliporeSigma) 를 사용하여 면역블롯에 의해 PAH 의 발현을 검출하고, 항-베타 액틴 항체 (MilliporeSigma) 를 로딩 대조군에 사용하였다. 면역블롯에 대한 밴드 강도는 Adobe PhotoShop 을 사용하여 농도계에 의해 결정하였다.
도 8 에서 나타낸 바와 같이, 5 개 군: (i) Huh-7 세포 단독 (레인 1); (ii) 코돈-최적화된 hPAH (OPT3; SEQ ID NO: 70), 프로트롬빈 인핸서/hAAT 프로모터 (SEQ ID NO: 61), 및 야생형 WPRE (SEQ ID NO: 18) 를 발현하는 렌티바이러스 벡터 (레인 2) (1 로 설정된 기준 밴드 강도); (iii) 코돈-최적화된 hPAH (OPT3; SEQ ID NO: 70), 프로트롬빈 인핸서/hAAT 프로모터 (SEQ ID NO: 61), 및 X-단백질 발현이 결여된 돌연변이체 WPRE (SEQ ID NO: 87) 를 발현하는 렌티바이러스 벡터 (레인 3) (밴드 강도 0.81); (iv) 코돈-최적화된 hPAH (OPT3; SEQ ID NO: 70), 프로트롬빈 인핸서/hAAT 프로모터 (SEQ ID NO: 61) 를 발현하고 PAH 3' UTR (SEQ ID NO: 85) 을 갖는 렌티바이러스 벡터 (레인 4) (밴드 강도 0.68); 및 (v) 코돈-최적화된 hPAH (OPT3; SEQ ID NO: 70) 및 프로트롬빈 인핸서/hAAT 프로모터 (SEQ ID NO: 61) 를 발현하고 알부민 3' UTR (SEQ ID NO: 86) 을 갖는 렌티바이러스 벡터 (레인 5) (밴드 강도 0.85) 를 비교한다.
결과는, 일반적으로 사용되는 야생형 WPRE 를 돌연변이체 WPRE 로 대체하거나, 인간 PAH 유전자의 천연 3' UTR 을 첨가하거나, 인간 알부민 유전자로부터 3' UTR 을 첨가하는 렌티바이러스 벡터가, 이후 세포 형질도입에 사용되어, 야생형 WPRE 를 함유하고 3' UTR 서열이 없는 Pro-hAAT-PAH(OPT3) 벡터에 비해 더 낮은 PAH 발현을 초래한다는 것을 나타낸다. 결과는 또한, 알부민 PAH 3'UTR 을 인코딩하는 렌티바이러스 벡터에 비해 천연 인간 PAH 3'UTR 을 인코딩하는 렌티바이러스 벡터를 사용하는 PAH 발현에 대한 부정적인 효과를 나타낸다 (도 8 의 레인 4 와 레인 5 를 비교). 이러한 발견은 천연 인간 PAH 3'UTR 에 비해 알부민 PAH 3'UTR 을 사용하는 경우 발생하는 PAH mRNA 의 2 차 구조의 변화로 인한 것일 수 있다. 2 차 구조의 이러한 변화는 PAH 의 코딩 부위와 3'UTR 사이의 상호작용을 감소시켜, 더 높은 PAH 발현 수준을 초래할 수 있다. 또한, 본 실시예에서 나타낸 바와 같이, 3'UTR PAH 가 결여된 렌티바이러스 벡터를 사용하는 경우, PAH 의 발현 수준이 가장 높다 (도 8 의 레인 4 및 5 를 레인 2 와 비교).
서열 목록
Figure pct00020
Figure pct00021
Figure pct00022
Figure pct00023
Figure pct00024
Figure pct00025
Figure pct00026
Figure pct00027
Figure pct00028
Figure pct00029
Figure pct00030
Figure pct00031
Figure pct00032
Figure pct00033
Figure pct00034
Figure pct00035
Figure pct00036
Figure pct00037
Figure pct00038
Figure pct00039
Figure pct00040
Figure pct00041
Figure pct00042
Figure pct00043
Figure pct00044
Figure pct00045
Figure pct00046
<110> American Gene Technologies International Inc. <120> OPTIMIZED PHENYLALANINE HYDROXYLASE EXPRESSION <130> 70612.03516 <140> WO PCT/US2020/35584 <141> 2020-06-01 <150> US 62/855,506 <151> 2019-05-31 <160> 87 <170> NotePad <210> 1 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> hPAH <400> 1 atgtccactg cggtcctgga aaacccaggc ttgggcagga aactctctga ctttggacag 60 gaaacaagct atattgaaga caactgcaat caaaatggtg ccatatcact gatcttctca 120 ctcaaagaag aagttggtgc attggccaaa gtattgcgct tatttgagga gaatgatgta 180 aacctgaccc acattgaatc tagaccttct cgtttaaaga aagatgagta tgaatttttc 240 acccatttgg ataaacgtag cctgcctgct ctgacaaaca tcatcaagat cttgaggcat 300 gacattggtg ccactgtcca tgagctttca cgagataaga agaaagacac agtgccctgg 360 ttcccaagaa ccattcaaga gctggacaga tttgccaatc agattctcag ctatggagcg 420 gaactggatg ctgaccaccc tggttttaaa gatcctgtgt accgtgcaag acggaagcag 480 tttgctgaca ttgcctacaa ctaccgccat gggcagccca tccctcgagt ggaatacatg 540 gaggaagaaa agaaaacatg gggcacagtg ttcaagactc tgaagtcctt gtataaaacc 600 catgcttgct atgagtacaa tcacattttt ccacttcttg aaaagtactg tggcttccat 660 gaagataaca ttccccagct ggaagacgtt tctcaattcc tgcagacttg cactggtttc 720 cgcctccgac ctgtggctgg cctgctttcc tctcgggatt tcttgggtgg cctggccttc 780 cgagtcttcc actgcacaca gtacatcaga catggatcca agcccatgta tacccccgaa 840 cctgacatct gccatgagct gttgggacat gtgcccttgt tttcagatcg cagctttgcc 900 cagttttccc aggaaattgg ccttgcctct ctgggtgcac ctgatgaata cattgaaaag 960 ctcgccacaa tttactggtt tactgtggag tttgggctct gcaaacaagg agactccata 1020 aaggcatatg gtgctgggct cctgtcatcc tttggtgaat tacagtactg cttatcagag 1080 aagccaaagc ttctccccct ggagctggag aagacagcca tccaaaatta cactgtcacg 1140 gagttccagc ccctgtatta cgtggcagag agttttaatg atgccaagga gaaagtaagg 1200 aactttgctg ccacaatacc tcggcccttc tcagttcgct acgacccata cacccaaagg 1260 attgaggtct tggacaatac ccagcagctt aagattttgg ctgattccat taacagtgaa 1320 attggaatcc tttgcagtgc cctccagaaa ataaagtaa 1359 <210> 2 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Codon-optimized PAH (Opt2) <400> 2 atgagtacgg ctgtgctcga gaatccaggt ttgggccgaa agctgtctga ttttggacag 60 gagacatctt atattgaaga caactgcaac cagaatggtg cgatatccct tattttttct 120 ctgaaagaag aagtaggtgc gctggcaaag gtcttgcggc tgtttgaaga gaacgatgtt 180 aatcttactc atattgagtc cagaccatca cggctgaaaa aagacgagta cgaatttttt 240 actcacttgg acaaacgaag cttgccggct cttactaata tcattaagat cctccggcat 300 gacatagggg cgacagtgca tgagctttca agggataaaa agaaagatac cgtcccctgg 360 tttccaagga ccatacaaga actcgaccga ttcgcgaacc agatcctttc atatggtgct 420 gagttggatg ctgaccaccc cggcttcaaa gacccggtct accgagcgcg gcggaaacaa 480 tttgctgaca tcgcatacaa ttacaggcat ggccagccaa ttcctagagt agaatacatg 540 gaagaagaga aaaaaacctg gggtaccgtc ttcaagacgc tgaaatcatt gtataaaact 600 catgcatgtt acgaatataa ccatattttt ccgttgctcg agaaatattg cgggttccac 660 gaagataaca tcccacaact cgaggatgta tctcagttcc tccagacctg tacggggttt 720 cgacttaggc ctgtcgcggg tttgctcagt tctcgagact tcctgggtgg attggcgttt 780 cgggtattcc attgcacgca gtatatccga cacggaagta agccaatgta cacgccagaa 840 cccgatatct gtcacgaatt gcttggacac gttcctctgt tttctgatcg atcattcgct 900 cagttttcac aggaaatcgg cctggcatct ttgggagcgc cggatgaata tattgagaag 960 ctcgctacaa tttactggtt cacggtagaa tttgggttgt gcaagcaggg tgatagtatt 1020 aaagcatacg gtgcgggatt gctgtcctca ttcggggagc ttcagtattg cctgtccgag 1080 aaacccaagc tgttgccgtt ggaattggaa aaaaccgcta tccaaaatta cacagtaacg 1140 gagttccaac ctttgtacta cgtagccgag tcatttaacg atgcaaagga gaaggtcaga 1200 aattttgctg cgacgatacc cagaccgttc tcagtaaggt acgatcctta cactcagagg 1260 attgaagtcc tggataatac gcaacagctc aagatcctgg cagactccat aaattctgaa 1320 atcggcatct tgtgttcagc actgcaaaag ataaaataa 1359 <210> 3 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Prothrombin enhancer (Pro) <400> 3 gcgagaactt gtgcctcccc gtgttcctgc tctttgtccc tctgtcctac ttagactaat 60 atttgccttg ggtactgcaa acaggaaatg ggggagggac aggagtaggg cggagggtag 120 120 <210> 4 <211> 397 <212> DNA <213> Artificial Sequence <220> <223> Human alpha-1 anti-trypsin promoter (hAAT) <400> 4 gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 60 agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg gacacaggac 120 gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg aagctgtaca 180 ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact 240 tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct 300 cccccgttgc ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct 360 cagcttcagg caccaccact gacctgggac agtgaat 397 <210> 5 <211> 573 <212> DNA <213> Artificial Sequence <220> <223> Rabbit beta globin intron <400> 5 gtgagtttgg ggacccttga ttgttctttc tttttcgcta ttgtaaaatt catgttatat 60 ggagggggca aagttttcag ggtgttgttt agaatgggaa gatgtccctt gtatcaccat 120 ggaccctcat gataattttg tttctttcac tttctactct gttgacaacc attgtctcct 180 cttattttct tttcattttc tgtaactttt tcgttaaact ttagcttgca tttgtaacga 240 atttttaaat tcacttttgt ttatttgtca gattgtaagt actttctcta atcacttttt 300 tttcaaggca atcagggtat attatattgt acttcagcac agttttagag aacaattgtt 360 ataattaaat gataaggtag aatatttctg catataaatt ctggctggcg tggaaatatt 420 cttattggta gaaacaacta caccctggtc atcatcctgc ctttctcttt atggttacaa 480 tgatatacac tgtttgagat gaggataaaa tactctgagt ccaaaccggg cccctctgct 540 aaccatgttc atgccttctt ctctttccta cag 573 <210> 6 <211> 544 <212> DNA <213> Artificial Sequence <220> <223> Human beta globin intron <400> 6 ggatcctgag aacttcaggg tgagtctatg ggacgcttga tgttttcttt ccccttcttt 60 tctatggtta agttcatgtc ataggaaggg gataagtaac agggtacaca tattgaccaa 120 atcagggtaa ttttgcattt gtaattttaa aaaatgcttt cttcttttaa tatacttttt 180 tgtttatctt atttctaata ctttccctaa tctctttctt tcagggcaat aatgatacaa 240 tgtatcatgc ctctttgcac cattctaaag aataacagtg ataatttctg ggttaaggca 300 atagcaatat ttctgcatat aaatatttct gcatataaat tgtaactgat gtaagaggtt 360 tcatattgct aatagcagct acaatccagc taccattctg cttttatttt atggttggga 420 taaggctgga ttattctgag tccaagctag gcccttttgc taatcatgtt catacctctt 480 atcttcctcc cacagctcct gggcaacgtg ctggtctgtg tgctggccca tcactttggc 540 aaag 544 <210> 7 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> 1X Hepatocyte Nuclear Factor 1 (1XHNF1) <400> 7 gttaatcatt aac 13 <210> 8 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> 5X Hepatocyte Nuclear Factor 1 (5XHNF1) <400> 8 gttaatcatt aacgttaatc attaacgtta atcattaacg ttaatcatta acgttaatca 60 ttaac 65 <210> 9 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> 1X Hepatocyte Nuclear Factor 1/4 (1XHNF1/4) <400> 9 gttaatcatt aacgcttgta ctttggtaca 30 <210> 10 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> 3X Hepatocyte Nuclear Factor 1/4 (3XHNF1/4) <400> 10 gttaatcatt aacgcttgta ctttggtaca gttaatcatt aacgcttgta ctttggtaca 60 gttaatcatt aacgcttgta ctttggtaca 90 <210> 11 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> PAH shRNA sequence #1 <400> 11 tcgcatttca tcaagattaa tctcgagatt aatcttgatg aaatgcgatt ttt 53 <210> 12 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> PAH shRNA sequence #2 <400> 12 actcataaag gagcatataa gctcgagctt atatgctcct ttatgagttt ttt 53 <210> 13 <211> 228 <212> DNA <213> Artificial Sequence <220> <223> Rous Sarcoma virus (RSV) promoter <400> 13 gtagtcttat gcaatactct tgtagtcttg caacatggta acgatgagtt agcaacatgc 60 cttacaagga gagaaaaagc accgtgcatg ccgattggtg gaagtaaggt ggtacgatcg 120 tgccttatta ggaaggcaac agacgggtct gacatggatt ggacgaacca ctgaattgcc 180 gcattgcaga gatattgtat ttaagtgcct agctcgatac aataaacg 228 <210> 14 <211> 180 <212> DNA <213> Artificial Sequence <220> <223> 5 Long terminal repeat (LTR) <400> 14 ggtctctctg gttagaccag atctgagcct gggagctctc tggctaacta gggaacccac 60 tgcttaagcc tcaataaagc ttgccttgag tgcttcaagt agtgtgtgcc cgtctgttgt 120 gtgactctgg taactagaga tccctcagac ccttttagtc agtgtggaaa atctctagca 180 180 <210> 15 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Psi Packaging signal (RNA packaging site) <400> 15 tacgccaaaa attttgacta gcggaggcta gaaggagaga g 41 <210> 16 <211> 233 <212> DNA <213> Artificial Sequence <220> <223> Rev response element (RRE) <400> 16 aggagctttg ttccttgggt tcttgggagc agcaggaagc actatgggcg cagcctcaat 60 gacgctgacg gtacaggcca gacaattatt gtctggtata gtgcagcagc agaacaattt 120 gctgagggct attgaggcgc aacagcatct gttgcaactc acagtctggg gcatcaagca 180 gctccaggca agaatcctgg ctgtggaaag atacctaaag gatcaacagc tcc 233 <210> 17 <211> 118 <212> DNA <213> Artificial Sequence <220> <223> Central polypurine tract (cPPT) (polypurine tract) <400> 17 ttttaaaaga aaagggggga ttggggggta cagtgcaggg gaaagaatag tagacataat 60 agcaacagac atacaaacta aagaattaca aaaacaaatt acaaaattca aaatttta 118 <210> 18 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> Long WPRE sequence <400> 18 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaaatcat cgtcctttcc ttggctgctc 420 gcctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592 <210> 19 <211> 250 <212> DNA <213> Artificial Sequence <220> <223> delta U3 3LTR <400> 19 tggaagggct aattcactcc caacgaagat aagatctgct ttttgcttgt actgggtctc 60 tctggttaga ccagatctga gcctgggagc tctctggcta actagggaac ccactgctta 120 agcctcaata aagcttgcct tgagtgcttc aagtagtgtg tgcccgtctg ttgtgtgact 180 ctggtaacta gagatccctc agaccctttt agtcagtgtg gaaaatctct agcagtagta 240 gttcatgtca 250 <210> 20 <211> 217 <212> DNA <213> Artificial Sequence <220> <223> H1 Promoter <400> 20 gaacgctgac gtcatcaacc cgctccaagg aatcgcgggc ccagtgtcac taggcgggaa 60 cacccagcgc gcgtgcgccc tggcaggaag atggctgtga gggacagggg agtggcgccc 120 tgcaatattt gcatgtcgct atgtgttctg ggaaatcacc ataaacgtga aatgtctttg 180 gatttgggaa tcttataagt tctgtatgag accactt 217 <210> 21 <211> 642 <212> DNA <213> Artificial Sequence <220> <223> CMV enhancer/chicken beta actin promoter <400> 21 tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60 cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120 gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180 atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240 aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300 catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360 catgggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 420 ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 480 ggggggcgcg cgccaggcgg ggcggggcgg ggcgaggggc ggggcggggc gaggcggaga 540 ggtgcggcgg cagccaatca gagcggcgcg ctccgaaagt ttccttttat ggcgaggcgg 600 cggcggcggc ggccctataa aaagcgaagc gcgcggcggg cg 642 <210> 22 <211> 1503 <212> DNA <213> Artificial Sequence <220> <223> HIV Gag <400> 22 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 taa 1503 <210> 23 <211> 1872 <212> DNA <213> Artificial Sequence <220> <223> HIV Pol <400> 23 atgaatttgc caggaagatg gaaaccaaaa atgatagggg gaattggagg ttttatcaaa 60 gtaggacagt atgatcagat actcatagaa atctgcggac ataaagctat aggtacagta 120 ttagtaggac ctacacctgt caacataatt ggaagaaatc tgttgactca gattggctgc 180 actttaaatt ttcccattag tcctattgag actgtaccag taaaattaaa gccaggaatg 240 gatggcccaa aagttaaaca atggccattg acagaagaaa aaataaaagc attagtagaa 300 atttgtacag aaatggaaaa ggaaggaaaa atttcaaaaa ttgggcctga aaatccatac 360 aatactccag tatttgccat aaagaaaaaa gacagtacta aatggagaaa attagtagat 420 ttcagagaac ttaataagag aactcaagat ttctgggaag ttcaattagg aataccacat 480 cctgcagggt taaaacagaa aaaatcagta acagtactgg atgtgggcga tgcatatttt 540 tcagttccct tagataaaga cttcaggaag tatactgcat ttaccatacc tagtataaac 600 aatgagacac cagggattag atatcagtac aatgtgcttc cacagggatg gaaaggatca 660 ccagcaatat tccagtgtag catgacaaaa atcttagagc cttttagaaa acaaaatcca 720 gacatagtca tctatcaata catggatgat ttgtatgtag gatctgactt agaaataggg 780 cagcatagaa caaaaataga ggaactgaga caacatctgt tgaggtgggg atttaccaca 840 ccagacaaaa aacatcagaa agaacctcca ttcctttgga tgggttatga actccatcct 900 gataaatgga cagtacagcc tatagtgctg ccagaaaagg acagctggac tgtcaatgac 960 atacagaaat tagtgggaaa attgaattgg gcaagtcaga tttatgcagg gattaaagta 1020 aggcaattat gtaaacttct taggggaacc aaagcactaa cagaagtagt accactaaca 1080 gaagaagcag agctagaact ggcagaaaac agggagattc taaaagaacc ggtacatgga 1140 gtgtattatg acccatcaaa agacttaata gcagaaatac agaagcaggg gcaaggccaa 1200 tggacatatc aaatttatca agagccattt aaaaatctga aaacaggaaa atatgcaaga 1260 atgaagggtg cccacactaa tgatgtgaaa caattaacag aggcagtaca aaaaatagcc 1320 acagaaagca tagtaatatg gggaaagact cctaaattta aattacccat acaaaaggaa 1380 acatgggaag catggtggac agagtattgg caagccacct ggattcctga gtgggagttt 1440 gtcaataccc ctcccttagt gaagttatgg taccagttag agaaagaacc cataatagga 1500 gcagaaactt tctatgtaga tggggcagcc aatagggaaa ctaaattagg aaaagcagga 1560 tatgtaactg acagaggaag acaaaaagtt gtccccctaa cggacacaac aaatcagaag 1620 actgagttac aagcaattca tctagctttg caggattcgg gattagaagt aaacatagtg 1680 acagactcac aatatgcatt gggaatcatt caagcacaac cagataagag tgaatcagag 1740 ttagtcagtc aaataataga gcagttaata aaaaaggaaa aagtctacct ggcatgggta 1800 ccagcacaca aaggaattgg aggaaatgaa caagtagatg ggttggtcag tgctggaatc 1860 aggaaagtac ta 1872 <210> 24 <211> 867 <212> DNA <213> Artificial Sequence <220> <223> HIV Integrase (HIV Int) <400> 24 tttttagatg gaatagataa ggcccaagaa gaacatgaga aatatcacag taattggaga 60 gcaatggcta gtgattttaa cctaccacct gtagtagcaa aagaaatagt agccagctgt 120 gataaatgtc agctaaaagg ggaagccatg catggacaag tagactgtag cccaggaata 180 tggcagctag attgtacaca tttagaagga aaagttatct tggtagcagt tcatgtagcc 240 agtggatata tagaagcaga agtaattcca gcagagacag ggcaagaaac agcatacttc 300 ctcttaaaat tagcaggaag atggccagta aaaacagtac atacagacaa tggcagcaat 360 ttcaccagta ctacagttaa ggccgcctgt tggtgggcgg ggatcaagca ggaatttggc 420 attccctaca atccccaaag tcaaggagta atagaatcta tgaataaaga attaaagaaa 480 attataggac aggtaagaga tcaggctgaa catcttaaga cagcagtaca aatggcagta 540 ttcatccaca attttaaaag aaaagggggg attggggggt acagtgcagg ggaaagaata 600 gtagacataa tagcaacaga catacaaact aaagaattac aaaaacaaat tacaaaaatt 660 caaaattttc gggtttatta cagggacagc agagatccag tttggaaagg accagcaaag 720 ctcctctgga aaggtgaagg ggcagtagta atacaagata atagtgacat aaaagtagtg 780 ccaagaagaa aagcaaagat catcagggat tatggaaaac agatggcagg tgatgattgt 840 gtggcaagta gacaggatga ggattaa 867 <210> 25 <211> 234 <212> DNA <213> Artificial Sequence <220> <223> HIV RRE <400> 25 aggagctttg ttccttgggt tcttgggagc agcaggaagc actatgggcg cagcgtcaat 60 gacgctgacg gtacaggcca gacaattatt gtctggtata gtgcagcagc agaacaattt 120 gctgagggct attgaggcgc aacagcatct gttgcaactc acagtctggg gcatcaagca 180 gctccaggca agaatcctgg ctgtggaaag atacctaaag gatcaacagc tcct 234 <210> 26 <211> 351 <212> DNA <213> Artificial Sequence <220> <223> HIV Rev <400> 26 atggcaggaa gaagcggaga cagcgacgaa gaactcctca aggcagtcag actcatcaag 60 tttctctatc aaagcaaccc acctcccaat cccgagggga cccgacaggc ccgaaggaat 120 agaagaagaa ggtggagaga gagacagaga cagatccatt cgattagtga acggatcctt 180 agcacttatc tgggacgatc tgcggagcct gtgcctcttc agctaccacc gcttgagaga 240 cttactcttg attgtaacga ggattgtgga acttctggga cgcagggggt gggaagccct 300 caaatattgg tggaatctcc tacaatattg gagtcaggag ctaaagaata g 351 <210> 27 <211> 615 <212> DNA <213> Artificial Sequence <220> <223> CMV Promoter <400> 27 acattgatta ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc 60 atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 120 cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 180 tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 240 agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 300 gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 360 agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc gtggatagcg 420 gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga gtttgttttg 480 gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat 540 gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctctctggc taactagaga 600 acccactgct tactg 615 <210> 28 <211> 1536 <212> DNA <213> Artificial Sequence <220> <223> Vesicular stomatitis Indiana virus glycoprotein VSV-G <400> 28 atgaagtgcc ttttgtactt agccttttta ttcattgggg tgaattgcaa gttcaccata 60 gtttttccac acaaccaaaa aggaaactgg aaaaatgttc cttctaatta ccattattgc 120 ccgtcaagct cagatttaaa ttggcataat gacttaatag gcacagcctt acaagtcaaa 180 atgcccaaga gtcacaaggc tattcaagca gacggttgga tgtgtcatgc ttccaaatgg 240 gtcactactt gtgatttccg ctggtatgga ccgaagtata taacacattc catccgatcc 300 ttcactccat ctgtagaaca atgcaaggaa agcattgaac aaacgaaaca aggaacttgg 360 ctgaatccag gcttccctcc tcaaagttgt ggatatgcaa ctgtgacgga tgccgaagca 420 gtgattgtcc aggtgactcc tcaccatgtg ctggttgatg aatacacagg agaatgggtt 480 gattcacagt tcatcaacgg aaaatgcagc aattacatat gccccactgt ccataactct 540 acaacctggc attctgacta taaggtcaaa gggctatgtg attctaacct catttccatg 600 gacatcacct tcttctcaga ggacggagag ctatcatccc tgggaaagga gggcacaggg 660 ttcagaagta actactttgc ttatgaaact ggaggcaagg cctgcaaaat gcaatactgc 720 aagcattggg gagtcagact cccatcaggt gtctggttcg agatggctga taaggatctc 780 tttgctgcag ccagattccc tgaatgccca gaagggtcaa gtatctctgc tccatctcag 840 acctcagtgg atgtaagtct aattcaggac gttgagagga tcttggatta ttccctctgc 900 caagaaacct ggagcaaaat cagagcgggt cttccaatct ctccagtgga tctcagctat 960 cttgctccta aaaacccagg aaccggtcct gctttcacca taatcaatgg taccctaaaa 1020 tactttgaga ccagatacat cagagtcgat attgctgctc caatcctctc aagaatggtc 1080 ggaatgatca gtggaactac cacagaaagg gaactgtggg atgactgggc accatatgaa 1140 gacgtggaaa ttggacccaa tggagttctg aggaccagtt caggatataa gtttccttta 1200 tacatgattg gacatggtat gttggactcc gatcttcatc ttagctcaaa ggctcaggtg 1260 ttcgaacatc ctcacattca agacgctgct tcgcaacttc ctgatgatga gagtttattt 1320 tttggtgata ctgggctatc caaaaatcca atcgagcttg tagaaggttg gttcagtagt 1380 tggaaaagct ctattgcctc ttttttcttt atcatagggt taatcattgg actattcttg 1440 gttctccgag ttggtatcca tctttgcatt aaattaaagc acaccaagaa aagacagatt 1500 tatacagaca tagagatgaa ccgacttgga aagtga 1536 <210> 29 <211> 141 <212> DNA <213> Artificial Sequence <220> <223> Left ITR <400> 29 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc t 141 <210> 30 <211> 228 <212> DNA <213> Artificial Sequence <220> <223> PolyA Element <400> 30 gactgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac 60 cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg 120 tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga 180 ttgggaagac aatagcaggc atgctgggga tgcggtgggc tctatggc 228 <210> 31 <211> 141 <212> DNA <213> Artificial Sequence <220> <223> Right ITR <400> 31 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120 gagcgcgcag ctgcctgcag g 141 <210> 32 <211> 1470 <212> DNA <213> Artificial Sequence <220> <223> E2A Element <400> 32 ttaaaagtcg aaggggttct cgcgctcgtc gttgtgcgcc gcgctgggga gggccacgtt 60 gcggaactgg tacttgggct gccacttgaa ctcggggatc accagtttgg gcactggggt 120 ctcggggaag gtctcgctcc acatgcgccg gctcatctgc agggcgccca gcatgtcagg 180 cgcggagatc ttgaaatcgc agttggggcc ggtgctctgc gcgcgcgagt tgcggtacac 240 tgggttgcag cactggaaca ccatcagact ggggtacttc acactagcca gcacgctctt 300 gtcgctgatc tgatccttgt ccaggtcctc ggcgttgctc aggccgaacg gggtcatctt 360 gcacagctgg cggcccagga agggcacgct ctgaggcttg tggttacact cgcagtgcac 420 gggcatcagc atcatccccg cgccgcgctg catattcggg tagagggcct tgacgaaggc 480 cgcgatctgc ttgaaagctt gctgggcctt ggccccctcg ctgaaaaaca ggccgcagct 540 cttcccgctg aactgattat tcccgcaccc ggcatcatgg acgcagcagc gcgcgtcatg 600 gctggtcagt tgcaccacgc tccgtcccca gcggttctgg gtcaccttgg ccttgctggg 660 ttgctccttc agcgcacgct gcccgttctc actggtcaca tccatctcca ccacgtggtc 720 cttgtggatc atcaccgtcc catgcagaca cttgagctgg ccttccacct cggtgcagcc 780 gtggtcccac agggcactgc cggtgcactc ccagttcttg tgcgcgatcc cgctgtggct 840 gaagatgtaa ccttgcaaca ggcgacccat gatggtgcta aagctcttct gggtggtgaa 900 ggtcagttgc agaccgcggg cctcctcgtt catccaggtc tggcacatct tttggaagat 960 ctcggtctgc tcgggcatga gcttgtaagc atcgcgcagg ccgctgtcga cgcggtagcg 1020 ttccatcagc acattcatgg tatccatgcc cttctcccag gacgagacca gaggcagact 1080 cagggggttg cgcacgttca ggacaccggg ggtcgcgggc tcgacgatgc gttttccgtc 1140 cttgccttcc ttcaacagaa ccggcggctg gctgaatccc actcccacga tcacggcttc 1200 ttcctggggc atctcttcgt ctgggtctac cttggtcaca tgcttggtct ttctggcttg 1260 cttctttttt ggagggctgt ccacggggac cacgtcctcc tcggaagacc cggatcccac 1320 ccgctgatac tttcggcgct tggttggcag aggaggtggc ggcgaggggc tcctctcctg 1380 ctccggcgga tagcgcgctg aaccgtggcc ccggggcgga gtggcctctc ggtccatgaa 1440 ccggcgcacg tcctgactgc cgccggccat 1470 <210> 33 <211> 393 <212> DNA <213> Artificial Sequence <220> <223> E4 element <400> 33 tcatgtatct ttattgattt ttacaccagc acgggtagtc agtctcccac caccagccca 60 tttcacagtg taaacaattc tctcagcacg ggtggcctta aatagggcaa tattctgatt 120 agtgcgggaa ctggacttgg ggtctataat ccacacagtt tcctggcgag ccaaacgggg 180 gtcggtgatt gagatgaagc cgtcctctga aaagtcatcc aagcgagcct cacagtccaa 240 ggtcacagta ttatgataat ctgcatgatc acaatcgggc aacaggggat gttgttcagt 300 cagtgaagcc ctggtttcct catcagatcg tggtaaacgg gccctgcgat atggatgatg 360 gcggagcgag ctggattgaa tctcggtttg cat 393 <210> 34 <211> 162 <212> DNA <213> Artificial Sequence <220> <223> VA RNA <400> 34 agcgggcact cttccgtggt ctggtggata aattcgcaag ggtatcatgg cggacgaccg 60 gggttcgagc cccgtatccg gccgtccgcc gtgatccatg cggttaccgc ccgcgtgtcg 120 aacccaggtg tgcgacgtca gacaacgggg gagtgctcct tt 162 <210> 35 <211> 2208 <212> DNA <213> Artificial Sequence <220> <223> AAV2 Rep <400> 35 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780 tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840 tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900 aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960 aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020 caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800 cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860 attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920 caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980 ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040 gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga aattcagtac 2100 acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160 tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208 <210> 36 <211> 1866 <212> DNA <213> Artificial Sequence <220> <223> AAV2 Cap <400> 36 atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60 ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120 tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180 cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240 caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300 aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360 taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420 gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480 acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540 aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600 gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660 tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720 cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780 tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840 cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900 attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960 acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020 accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080 aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140 aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200 gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260 aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320 ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380 gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440 gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500 gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560 gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620 aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680 ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740 tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800 ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860 caataa 1866 <210> 37 <211> 1608 <212> DNA <213> Artificial Sequence <220> <223> AAV8 Cap <400> 37 atggctgcag gcggtggcgc accaatggca gacaataacg aaggcgccga cggagtgggt 60 agttcctcgg gaaattggca ttgcgattcc acatggctgg gcgacagagt catcaccacc 120 agcacccgaa cctgggccct gcccacctac aacaaccacc tctacaagca aatctccaac 180 gggacatcgg gaggagccac caacgacaac acctacttcg gctacagcac cccctggggg 240 tattttgact ttaacagatt ccactgccac ttttcaccac gtgactggca gcgactcatc 300 aacaacaact ggggattccg gcccaagaga ctcagcttca agctcttcaa catccaggtc 360 aaggaggtca cgcagaatga aggcaccaag accatcgcca ataacctcac cagcaccatc 420 caggtgttta cggactcgga gtaccagctg ccgtacgttc tcggctctgc ccaccagggc 480 tgcctgcctc cgttcccggc ggacgtgttc atgattcccc agtacggcta cctaacactc 540 aacaacggta gtcaggccgt gggacgctcc tccttctact gcctggaata ctttccttcg 600 cagatgctga gaaccggcaa caacttccag tttacttaca ccttcgagga cgtgcctttc 660 cacagcagct acgcccacag ccagagcttg gaccggctga tgaatcctct gattgaccag 720 tacctgtact acttgtctcg gactcaaaca acaggaggca cggcaaatac gcagactctg 780 ggcttcagcc aaggtgggcc taatacaatg gccaatcagg caaagaactg gctgccagga 840 ccctgttacc gccaacaacg cgtctcaacg acaaccgggc aaaacaacaa tagcaacttt 900 gcctggactg ctgggaccaa ataccatctg aatggaagaa attcattggc taatcctggc 960 atcgctatgg caacacacaa agacgacgag gagcgttttt ttcccagtaa cgggatcctg 1020 atttttggca aacaaaatgc tgccagagac aatgcggatt acagcgatgt catgctcacc 1080 agcgaggaag aaatcaaaac cactaaccct gtggctacag aggaatacgg tatcgtggca 1140 gataacttgc agcagcaaaa cacggctcct caaattggaa ctgtcaacag ccagggggcc 1200 ttacccggta tggtctggca gaaccgggac gtgtacctgc agggtcccat ctgggccaag 1260 attcctcaca cggacggcaa cttccacccg tctccgctga tgggcggctt tggcctgaaa 1320 catcctccgc ctcagatcct gatcaagaac acgcctgtac ctgcggatcc tccgaccacc 1380 ttcaaccagt caaagctgaa ctctttcatc acgcaataca gcaccggaca ggtcagcgtg 1440 gaaattgaat gggagctgca gaaggaaaac agcaagcgct ggaaccccga gatccagtac 1500 acctccaact actacaaatc tacaagtgtg gactttgctg ttaatacaga aggcgtgtac 1560 tctgaacccc gccccattgg cacccgttac ctcacccgta atctgtaa 1608 <210> 38 <211> 2214 <212> DNA <213> Artificial Sequence <220> <223> AAV DJ Cap <400> 38 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300 caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360 gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420 ggaaagaaga ggcctgtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540 tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600 cttacaatgg ctgcaggcgg tggcgcacca atggcagaca ataacgaggg cgccgacgga 660 gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caagcaaatc 780 tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840 tgggggtatt ttgactttaa cagattccac tgccactttt caccacgtga ctggcagcga 900 ctcatcaaca acaactgggg attccggccc aagagactca gcttcaagct cttcaacatc 960 caggtcaagg aggtcacgca gaatgaaggc accaagacca tcgccaataa cctcaccagc 1020 accatccagg tgtttacgga ctcggagtac cagctgccgt acgttctcgg ctctgcccac 1080 cagggctgcc tgcctccgtt cccggcggac gtgttcatga ttccccagta cggctaccta 1140 acactcaaca acggtagtca ggccgtggga cgctcctcct tctactgcct ggaatacttt 1200 ccttcgcaga tgctgagaac cggcaacaac ttccagttta cttacacctt cgaggacgtg 1260 cctttccaca gcagctacgc ccacagccag agcttggacc ggctgatgaa tcctctgatt 1320 gaccagtacc tgtactactt gtctcggact caaacaacag gaggcacgac aaatacgcag 1380 actctgggct tcagccaagg tgggcctaat acaatggcca atcaggcaaa gaactggctg 1440 ccaggaccct gttaccgcca gcagcgagta tcaaagacat ctgcggataa caacaacagt 1500 gaatactcgt ggactggagc taccaagtac cacctcaatg gcagagactc tctggtgaat 1560 ccgggcccgg ccatggcaag ccacaaggac gatgaagaaa agttttttcc tcagagcggg 1620 gttctcatct ttgggaagca aggctcagag aaaacaaatg tggacattga aaaggtcatg 1680 attacagacg aagaggaaat caggacaacc aatcccgtgg ctacggagca gtatggttct 1740 gtatctacca acctccagag aggcaacaga caagcagcta ccgcagatgt caacacacaa 1800 ggcgttcttc caggcatggt ctggcaggac agagatgtgt accttcaggg gcccatctgg 1860 gcaaagattc cacacacgga cggacatttt cacccctctc ccctcatggg tggattcgga 1920 cttaaacacc ctccgcctca gatcctgatc aagaacacgc ctgtacctgc ggatcctccg 1980 accaccttca accagtcaaa gctgaactct ttcatcaccc agtattctac tggccaagtc 2040 agcgtggaga tcgagtggga gctgcagaag gaaaacagca agcgctggaa ccccgagatc 2100 cagtacacct ccaactacta caaatctaca agtgtggact ttgctgttaa tacagaaggc 2160 gtgtactctg aaccccgccc cattggcacc cgttacctca cccgtaatct gtaa 2214 <210> 39 <211> 960 <212> DNA <213> Artificial Sequence <220> <223> Chicken beta actin intron <400> 39 ggagtcgctg cgttgccttc gccccgtgcc ccgctccgcg ccgcctcgcg ccgcccgccc 60 cggctctgac tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg 120 ggctgtaatt agcgcttggt ttaatgacgg ctcgtttctt ttctgtggct gcgtgaaagc 180 cttaaagggc tccgggaggg ccctttgtgc gggggggagc ggctcggggg gtgcgtgcgt 240 gtgtgtgtgc gtggggagcg ccgcgtgcgg cccgcgctgc ccggcggctg tgagcgctgc 300 gggcgcggcg cggggctttg tgcgctccgc gtgtgcgcga ggggagcgcg gccgggggcg 360 gtgccccgcg gtgcgggggg gctgcgaggg gaacaaaggc tgcgtgcggg gtgtgtgcgt 420 gggggggtga gcagggggtg tgggcgcggc ggtcgggctg taaccccccc ctgcaccccc 480 ctccccgagt tgctgagcac ggcccggctt cgggtgcggg gctccgtgcg gggcgtggcg 540 cggggctcgc cgtgccgggc ggggggtggc ggcaggtggg ggtgccgggc ggggcggggc 600 cgcctcgggc cggggagggc tcgggggagg ggcgcggcgg ccccggagcg ccggcggctg 660 tcgaggcgcg gcgagccgca gccattgcct tttatggtaa tcgtgcgaga gggcgcaggg 720 acttcctttg tcccaaatct ggcggagccg aaatctggga ggcgccgccg caccccctct 780 agcgggcgcg ggcgaagcgg tgcggcgccg gcaggaagga aatgggcggg gagggccttc 840 gtgcgtcgcc gcgccgccgt ccccttctcc atctccagcc tcggggctgc cgcaggggga 900 cggctgcctt cgggggggac ggggcagggc ggggttcggc ttctggcgtg tgaccggcgg 960 960 <210> 40 <211> 448 <212> DNA <213> Artificial Sequence <220> <223> Rabbit beta globin poly A <400> 40 agatcttttt ccctctgcca aaaattatgg ggacatcatg aagccccttg agcatctgac 60 ttctggctaa taaaggaaat ttattttcat tgcaatagtg tgttggaatt ttttgtgtct 120 ctcactcgga aggacatatg ggagggcaaa tcatttaaaa catcagaatg agtatttggt 180 ttagagtttg gcaacatatg ccatatgctg gctgccatga acaaaggtgg ctataaagag 240 gtcatcagta tatgaaacag ccccctgctg tccattcctt attccataga aaagccttga 300 cttgaggtta gatttttttt atattttgtt ttgtgttatt tttttcttta acatccctaa 360 aattttcctt acatgtttta ctagccagat ttttcctcct ctcctgacta ctcccagtca 420 tagctgtccc tcttctctta tgaagatc 448 <210> 41 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Forward Primer <400> 41 taagcagaat tcatgaattt gccaggaaga t 31 <210> 42 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Reverse Primer <400> 42 ccatacaatg aatggacact aggcggccgc acgaat 36 <210> 43 <211> 2745 <212> DNA <213> Artificial Sequence <220> <223> Gag, Pol, Integrase fragment <400> 43 gaattcatga atttgccagg aagatggaaa ccaaaaatga tagggggaat tggaggtttt 60 atcaaagtaa gacagtatga tcagatactc atagaaatct gcggacataa agctataggt 120 acagtattag taggacctac acctgtcaac ataattggaa gaaatctgtt gactcagatt 180 ggctgcactt taaattttcc cattagtcct attgagactg taccagtaaa attaaagcca 240 ggaatggatg gcccaaaagt taaacaatgg ccattgacag aagaaaaaat aaaagcatta 300 gtagaaattt gtacagaaat ggaaaaggaa ggaaaaattt caaaaattgg gcctgaaaat 360 ccatacaata ctccagtatt tgccataaag aaaaaagaca gtactaaatg gagaaaatta 420 gtagatttca gagaacttaa taagagaact caagatttct gggaagttca attaggaata 480 ccacatcctg cagggttaaa acagaaaaaa tcagtaacag tactggatgt gggcgatgca 540 tatttttcag ttcccttaga taaagacttc aggaagtata ctgcatttac catacctagt 600 ataaacaatg agacaccagg gattagatat cagtacaatg tgcttccaca gggatggaaa 660 ggatcaccag caatattcca gtgtagcatg acaaaaatct tagagccttt tagaaaacaa 720 aatccagaca tagtcatcta tcaatacatg gatgatttgt atgtaggatc tgacttagaa 780 atagggcagc atagaacaaa aatagaggaa ctgagacaac atctgttgag gtggggattt 840 accacaccag acaaaaaaca tcagaaagaa cctccattcc tttggatggg ttatgaactc 900 catcctgata aatggacagt acagcctata gtgctgccag aaaaggacag ctggactgtc 960 aatgacatac agaaattagt gggaaaattg aattgggcaa gtcagattta tgcagggatt 1020 aaagtaaggc aattatgtaa acttcttagg ggaaccaaag cactaacaga agtagtacca 1080 ctaacagaag aagcagagct agaactggca gaaaacaggg agattctaaa agaaccggta 1140 catggagtgt attatgaccc atcaaaagac ttaatagcag aaatacagaa gcaggggcaa 1200 ggccaatgga catatcaaat ttatcaagag ccatttaaaa atctgaaaac aggaaagtat 1260 gcaagaatga agggtgccca cactaatgat gtgaaacaat taacagaggc agtacaaaaa 1320 atagccacag aaagcatagt aatatgggga aagactccta aatttaaatt acccatacaa 1380 aaggaaacat gggaagcatg gtggacagag tattggcaag ccacctggat tcctgagtgg 1440 gagtttgtca atacccctcc cttagtgaag ttatggtacc agttagagaa agaacccata 1500 ataggagcag aaactttcta tgtagatggg gcagccaata gggaaactaa attaggaaaa 1560 gcaggatatg taactgacag aggaagacaa aaagttgtcc ccctaacgga cacaacaaat 1620 cagaagactg agttacaagc aattcatcta gctttgcagg attcgggatt agaagtaaac 1680 atagtgacag actcacaata tgcattggga atcattcaag cacaaccaga taagagtgaa 1740 tcagagttag tcagtcaaat aatagagcag ttaataaaaa aggaaaaagt ctacctggca 1800 tgggtaccag cacacaaagg aattggagga aatgaacaag tagataaatt ggtcagtgct 1860 ggaatcagga aagtactatt tttagatgga atagataagg cccaagaaga acatgagaaa 1920 tatcacagta attggagagc aatggctagt gattttaacc taccacctgt agtagcaaaa 1980 gaaatagtag ccagctgtga taaatgtcag ctaaaagggg aagccatgca tggacaagta 2040 gactgtagcc caggaatatg gcagctagat tgtacacatt tagaaggaaa agttatcttg 2100 gtagcagttc atgtagccag tggatatata gaagcagaag taattccagc agagacaggg 2160 caagaaacag catacttcct cttaaaatta gcaggaagat ggccagtaaa aacagtacat 2220 acagacaatg gcagcaattt caccagtact acagttaagg ccgcctgttg gtgggcgggg 2280 atcaagcagg aatttggcat tccctacaat ccccaaagtc aaggagtaat agaatctatg 2340 aataaagaat taaagaaaat tataggacag gtaagagatc aggctgaaca tcttaagaca 2400 gcagtacaaa tggcagtatt catccacaat tttaaaagaa aaggggggat tggggggtac 2460 agtgcagggg aaagaatagt agacataata gcaacagaca tacaaactaa agaattacaa 2520 aaacaaatta caaaaattca aaattttcgg gtttattaca gggacagcag agatccagtt 2580 tggaaaggac cagcaaagct cctctggaaa ggtgaagggg cagtagtaat acaagataat 2640 agtgacataa aagtagtgcc aagaagaaaa gcaaagatca tcagggatta tggaaaacag 2700 atggcaggtg atgattgtgt ggcaagtaga caggatgagg attaa 2745 <210> 44 <211> 1586 <212> DNA <213> Artificial Sequence <220> <223> DNA Fragment containing the RRE, REV, and rabbit beta globin poly A sequence <400> 44 tctagaatgg caggaagaag cggagacagc gacgaagagc tcatcagaac agtcagactc 60 atcaagcttc tctatcaaag caacccacct cccaatcccg aggggacccg acaggcccga 120 aggaatagaa gaagaaggtg gagagagaga cagagacaga tccattcgat tagtgaacgg 180 atccttggca cttatctggg acgatctgcg gagcctgtgc ctcttcagct accaccgctt 240 gagagactta ctcttgattg taacgaggat tgtggaactt ctgggacgca gggggtggga 300 agccctcaaa tattggtgga atctcctaca atattggagt caggagctaa agaatagagg 360 agctttgttc cttgggttct tgggagcagc aggaagcact atgggcgcag cgtcaatgac 420 gctgacggta caggccagac aattattgtc tggtatagtg cagcagcaga acaatttgct 480 gagggctatt gaggcgcaac agcatctgtt gcaactcaca gtctggggca tcaagcagct 540 ccaggcaaga atcctggctg tggaaagata cctaaaggat caacagctcc tagatctttt 600 tccctctgcc aaaaattatg gggacatcat gaagcccctt gagcatctga cttctggcta 660 ataaaggaaa tttattttca ttgcaatagt gtgttggaat tttttgtgtc tctcactcgg 720 aaggacatat gggagggcaa atcatttaaa acatcagaat gagtatttgg tttagagttt 780 ggcaacatat gccatatgct ggctgccatg aacaaaggtg gctataaaga ggtcatcagt 840 atatgaaaca gccccctgct gtccattcct tattccatag aaaagccttg acttgaggtt 900 agattttttt tatattttgt tttgtgttat ttttttcttt aacatcccta aaattttcct 960 tacatgtttt actagccaga tttttcctcc tctcctgact actcccagtc atagctgtcc 1020 ctcttctctt atgaagatcc ctcgacctgc agcccaagct tggcgtaatc atggtcatag 1080 ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc 1140 ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc 1200 tcactgcccg ctttccagtc gggaaacctg tcgtgccagc ggatccgcat ctcaattagt 1260 cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg cccagttccg 1320 cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc gaggccgcct 1380 cggcctctga gctattccag aagtagtgag gaggcttttt tggaggccta ggcttttgca 1440 aaaagctaac ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa 1500 tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa 1560 tgtatcttat cagcggccgc cccggg 1586 <210> 45 <211> 1614 <212> DNA <213> Artificial Sequence <220> <223> DNA fragment containing the CAG enhancer/promoter/intron sequence <400> 45 acgcgttagt tattaatagt aatcaattac ggggtcatta gttcatagcc catatatgga 60 gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca acgacccccg 120 cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga ctttccattg 180 acgtcaatgg gtggactatt tacggtaaac tgcccacttg gcagtacatc aagtgtatca 240 tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc 300 ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat tagtcatcgc 360 tattaccatg ggtcgaggtg agccccacgt tctgcttcac tctccccatc tcccccccct 420 ccccaccccc aattttgtat ttatttattt tttaattatt ttgtgcagcg atgggggcgg 480 gggggggggg ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg cggggcgagg 540 cggagaggtg cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc ttttatggcg 600 aggcggcggc ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcggg agtcgctgcg 660 ttgccttcgc cccgtgcccc gctccgcgcc gcctcgcgcc gcccgccccg gctctgactg 720 accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctccggg ctgtaattag 780 cgcttggttt aatgacggct cgtttctttt ctgtggctgc gtgaaagcct taaagggctc 840 cgggagggcc ctttgtgcgg gggggagcgg ctcggggggt gcgtgcgtgt gtgtgtgcgt 900 ggggagcgcc gcgtgcggcc cgcgctgccc ggcggctgtg agcgctgcgg gcgcggcgcg 960 gggctttgtg cgctccgcgt gtgcgcgagg ggagcgcggc cgggggcggt gccccgcggt 1020 gcgggggggc tgcgagggga acaaaggctg cgtgcggggt gtgtgcgtgg gggggtgagc 1080 agggggtgtg ggcgcggcgg tcgggctgta acccccccct gcacccccct ccccgagttg 1140 ctgagcacgg cccggcttcg ggtgcggggc tccgtgcggg gcgtggcgcg gggctcgccg 1200 tgccgggcgg ggggtggcgg caggtggggg tgccgggcgg ggcggggccg cctcgggccg 1260 gggagggctc gggggagggg cgcggcggcc ccggagcgcc ggcggctgtc gaggcgcggc 1320 gagccgcagc cattgccttt tatggtaatc gtgcgagagg gcgcagggac ttcctttgtc 1380 ccaaatctgg cggagccgaa atctgggagg cgccgccgca ccccctctag cgggcgcggg 1440 cgaagcggtg cggcgccggc aggaaggaaa tgggcgggga gggccttcgt gcgtcgccgc 1500 gccgccgtcc ccttctccat ctccagcctc ggggctgccg cagggggacg gctgccttcg 1560 ggggggacgg ggcagggcgg ggttcggctt ctggcgtgtg accggcggga attc 1614 <210> 46 <211> 884 <212> DNA <213> Artificial Sequence <220> <223> RSV promoter and HIV Rev <400> 46 caattgcgat gtacgggcca gatatacgcg tatctgaggg gactagggtg tgtttaggcg 60 aaaagcgggg cttcggttgt acgcggttag gagtcccctc aggatatagt agtttcgctt 120 ttgcataggg agggggaaat gtagtcttat gcaatacact tgtagtcttg caacatggta 180 acgatgagtt agcaacatgc cttacaagga gagaaaaagc accgtgcatg ccgattggtg 240 gaagtaaggt ggtacgatcg tgccttatta ggaaggcaac agacaggtct gacatggatt 300 ggacgaacca ctgaattccg cattgcagag ataattgtat ttaagtgcct agctcgatac 360 aataaacgcc atttgaccat tcaccacatt ggtgtgcacc tccaagctcg agctcgttta 420 gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt ttgacctcca tagaagacac 480 cgggaccgat ccagcctccc ctcgaagcta gcgattaggc atctcctatg gcaggaagaa 540 gcggagacag cgacgaagaa ctcctcaagg cagtcagact catcaagttt ctctatcaaa 600 gcaacccacc tcccaatccc gaggggaccc gacaggcccg aaggaataga agaagaaggt 660 ggagagagag acagagacag atccattcga ttagtgaacg gatccttagc acttatctgg 720 gacgatctgc ggagcctgtg cctcttcagc taccaccgct tgagagactt actcttgatt 780 gtaacgagga ttgtggaact tctgggacgc agggggtggg aagccctcaa atattggtgg 840 aatctcctac aatattggag tcaggagcta aagaatagtc taga 884 <210> 47 <211> 1104 <212> DNA <213> Artificial Sequence <220> <223> Elongation Factor-1 alpha (EF-1 alpha) promoter <400> 47 ccggtgccta gagaaggtgg cgcggggtaa actgggaaag tgatgtcgtg tactggctcc 60 gcctttttcc cgagggtggg ggagaaccgt atataagtgc agtagtcgcc gtgaacgttc 120 tttttcgcaa cgggtttgcc gccagaacac aggtaagtgc cgtgtgtggt tcccgcgggc 180 ctggcctctt tacgggttat ggcccttgcg tgccttgaat tacttccacg cccctggctg 240 cagtacgtga ttcttgatcc cgagcttcgg gttggaagtg ggtgggagag ttcgaggcct 300 tgcgcttaag gagccccttc gcctcgtgct tgagttgagg cctggcctgg gcgctggggc 360 cgccgcgtgc gaatctggtg gcaccttcgc gcctgtctcg ctgctttcga taagtctcta 420 gccatttaaa atttttgatg acctgctgcg acgctttttt tctggcaaga tagtcttgta 480 aatgcgggcc aagatctgca cactggtatt tcggtttttg gggccgcggg cggcgacggg 540 gcccgtgcgt cccagcgcac atgttcggcg aggcggggcc tgcgagcgcg gccaccgaga 600 atcggacggg ggtagtctca agctggccgg cctgctctgg tgcctggcct cgcgccgccg 660 tgtatcgccc cgccctgggc ggcaaggctg gcccggtcgg caccagttgc gtgagcggaa 720 agatggccgc ttcccggccc tgctgcaggg agctcaaaat ggaggacgcg gcgctcggga 780 gagcgggcgg gtgagtcacc cacacaaagg aaaagggcct ttccgtcctc agccgtcgct 840 tcatgtgact ccacggagta ccgggcgccg tccaggcacc tcgattagtt ctcgagcttt 900 tggagtacgt cgtctttagg ttggggggag gggttttatg cgatggagtt tccccacact 960 gagtgggtgg agactgaagt taggccagct tggcacttga tgtaattctc cttggaattt 1020 gccctttttg agtttggatc ttggttcatt ctcaagcctc agacagtggt tcaaagtttt 1080 tttcttccat ttcaggtgtc gtga 1104 <210> 48 <211> 511 <212> DNA <213> Artificial Sequence <220> <223> PGK Promoter <400> 48 ggggttgggg ttgcgccttt tccaaggcag ccctgggttt gcgcagggac gcggctgctc 60 tgggcgtggt tccgggaaac gcagcggcgc cgaccctggg tctcgcacat tcttcacgtc 120 cgttcgcagc gtcacccgga tcttcgccgc tacccttgtg ggccccccgg cgacgcttcc 180 tgctccgccc ctaagtcggg aaggttcctt gcggttcgcg gcgtgccgga cgtgacaaac 240 ggaagccgca cgtctcacta gtaccctcgc agacggacag cgccagggag caatggcagc 300 gcgccgaccg cgatgggctg tggccaatag cggctgctca gcagggcgcg ccgagagcag 360 cggccgggaa ggggcggtgc gggaggcggg gtgtggggcg gtagtgtggg ccctgttcct 420 gcccgcgcgg tgttccgcat tctgcaagcc tccggagcgc acgtcggcag tcggctccct 480 cgttgaccga atcaccgacc tctctcccca g 511 <210> 49 <211> 1162 <212> DNA <213> Artificial Sequence <220> <223> UbC Promoter <400> 49 gcgccgggtt ttggcgcctc ccgcgggcgc ccccctcctc acggcgagcg ctgccacgtc 60 agacgaaggg cgcaggagcg ttcctgatcc ttccgcccgg acgctcagga cagcggcccg 120 ctgctcataa gactcggcct tagaacccca gtatcagcag aaggacattt taggacggga 180 cttgggtgac tctagggcac tggttttctt tccagagagc ggaacaggcg aggaaaagta 240 gtcccttctc ggcgattctg cggagggatc tccgtggggc ggtgaacgcc gatgattata 300 taaggacgcg ccgggtgtgg cacagctagt tccgtcgcag ccgggatttg ggtcgcggtt 360 cttgtttgtg gatcgctgtg atcgtcactt ggtgagttgc gggctgctgg gctggccggg 420 gctttcgtgg ccgccgggcc gctcggtggg acggaagcgt gtggagagac cgccaagggc 480 tgtagtctgg gtccgcgagc aaggttgccc tgaactgggg gttgggggga gcgcacaaaa 540 tggcggctgt tcccgagtct tgaatggaag acgcttgtaa ggcgggctgt gaggtcgttg 600 aaacaaggtg gggggcatgg tgggcggcaa gaacccaagg tcttgaggcc ttcgctaatg 660 cgggaaagct cttattcggg tgagatgggc tggggcacca tctggggacc ctgacgtgaa 720 gtttgtcact gactggagaa ctcgggtttg tcgtctggtt gcgggggcgg cagttatgcg 780 gtgccgttgg gcagtgcacc cgtacctttg ggagcgcgcg cctcgtcgtg tcgtgacgtc 840 acccgttctg ttggcttata atgcagggtg gggccacctg ccggtaggtg tgcggtaggc 900 ttttctccgt cgcaggacgc agggttcggg cctagggtag gctctcctga atcgacaggc 960 gccggacctc tggtgagggg agggataagt gaggcgtcag tttctttggt cggttttatg 1020 tacctatctt cttaagtagc tgaagctccg gttttgaact atgcgctcgg ggttggcgag 1080 tgtgttttgt gaagtttttt aggcaccttt tgaaatgtaa tcatttgggt caatatgtaa 1140 ttttcagtgt tagactagta aa 1162 <210> 50 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> SV40 Poly A <400> 50 gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa 60 agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca 120 120 <210> 51 <211> 228 <212> DNA <213> Artificial Sequence <220> <223> bHG Poly <400> 51 agactgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga 60 ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt gcatcgcatt 120 gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggagg 180 attgggaaga caatagcagg catgctgggg atgcggtggg ctctatgg 228 <210> 52 <211> 1695 <212> DNA <213> Artificial Sequence <220> <223> RD114 Envelope <400> 52 atgaaactcc caacaggaat ggtcatttta tgtagcctaa taatagttcg ggcagggttt 60 gacgaccccc gcaaggctat cgcattagta caaaaacaac atggtaaacc atgcgaatgc 120 agcggagggc aggtatccga ggccccaccg aactccatcc aacaggtaac ttgcccaggc 180 aagacggcct acttaatgac caaccaaaaa tggaaatgca gagtcactcc aaaaaatctc 240 acccctagcg ggggagaact ccagaactgc ccctgtaaca ctttccagga ctcgatgcac 300 agttcttgtt atactgaata ccggcaatgc agggcgaata ataagacata ctacacggcc 360 accttgctta aaatacggtc tgggagcctc aacgaggtac agatattaca aaaccccaat 420 cagctcctac agtccccttg taggggctct ataaatcagc ccgtttgctg gagtgccaca 480 gcccccatcc atatctccga tggtggagga cccctcgata ctaagagagt gtggacagtc 540 caaaaaaggc tagaacaaat tcataaggct atgcatcctg aacttcaata ccacccctta 600 gccctgccca aagtcagaga tgaccttagc cttgatgcac ggacttttga tatcctgaat 660 accactttta ggttactcca gatgtccaat tttagccttg cccaagattg ttggctctgt 720 ttaaaactag gtacccctac ccctcttgcg atacccactc cctctttaac ctactcccta 780 gcagactccc tagcgaatgc ctcctgtcag attatacctc ccctcttggt tcaaccgatg 840 cagttctcca actcgtcctg tttatcttcc cctttcatta acgatacgga acaaatagac 900 ttaggtgcag tcacctttac taactgcacc tctgtagcca atgtcagtag tcctttatgt 960 gccctaaacg ggtcagtctt cctctgtgga aataacatgg catacaccta tttaccccaa 1020 aactggacag gactttgcgt ccaagcctcc ctcctccccg acattgacat catcccgggg 1080 gatgagccag tccccattcc tgccattgat cattatatac atagacctaa acgagctgta 1140 cagttcatcc ctttactagc tggactggga atcaccgcag cattcaccac cggagctaca 1200 ggcctaggtg tctccgtcac ccagtataca aaattatccc atcagttaat atctgatgtc 1260 caagtcttat ccggtaccat acaagattta caagaccagg tagactcgtt agctgaagta 1320 gttctccaaa ataggagggg actggaccta ctaacggcag aacaaggagg aatttgttta 1380 gccttacaag aaaaatgctg tttttatgct aacaagtcag gaattgtgag aaacaaaata 1440 agaaccctac aagaagaatt acaaaaacgc agggaaagcc tggcatccaa ccctctctgg 1500 accgggctgc agggctttct tccgtacctc ctacctctcc tgggacccct actcaccctc 1560 ctactcatac taaccattgg gccatgcgtt ttcaatcgat tggtccaatt tgttaaagac 1620 aggatctcag tggtccaggc tctggttttg actcagcaat atcaccagct aaaacccata 1680 gagtacgagc catga 1695 <210> 53 <211> 2013 <212> DNA <213> Artificial Sequence <220> <223> GALV Envelope <400> 53 atgcttctca cctcaagccc gcaccacctt cggcaccaga tgagtcctgg gagctggaaa 60 agactgatca tcctcttaag ctgcgtattc ggagacggca aaacgagtct gcagaataag 120 aacccccacc agcctgtgac cctcacctgg caggtactgt cccaaactgg ggacgttgtc 180 tgggacaaaa aggcagtcca gcccctttgg acttggtggc cctctcttac acctgatgta 240 tgtgccctgg cggccggtct tgagtcctgg gatatcccgg gatccgatgt atcgtcctct 300 aaaagagtta gacctcctga ttcagactat actgccgctt ataagcaaat cacctgggga 360 gccatagggt gcagctaccc tcgggctagg accaggatgg caaattcccc cttctacgtg 420 tgtccccgag ctggccgaac ccattcagaa gctaggaggt gtggggggct agaatcccta 480 tactgtaaag aatggagttg tgagaccacg ggtaccgttt attggcaacc caagtcctca 540 tgggacctca taactgtaaa atgggaccaa aatgtgaaat gggagcaaaa atttcaaaag 600 tgtgaacaaa ccggctggtg taaccccctc aagatagact tcacagaaaa aggaaaactc 660 tccagagatt ggataacgga aaaaacctgg gaattaaggt tctatgtata tggacaccca 720 ggcatacagt tgactatccg cttagaggtc actaacatgc cggttgtggc agtgggccca 780 gaccctgtcc ttgcggaaca gggacctcct agcaagcccc tcactctccc tctctcccca 840 cggaaagcgc cgcccacccc tctacccccg gcggctagtg agcaaacccc tgcggtgcat 900 ggagaaactg ttaccctaaa ctctccgcct cccaccagtg gcgaccgact ctttggcctt 960 gtgcaggggg ccttcctaac cttgaatgct accaacccag gggccactaa gtcttgctgg 1020 ctctgtttgg gcatgagccc cccttattat gaagggatag cctcttcagg agaggtcgct 1080 tatacctcca accatacccg atgccactgg ggggcccaag gaaagcttac cctcactgag 1140 gtctccggac tcgggtcatg catagggaag gtgcctctta cccatcaaca tctttgcaac 1200 cagaccttac ccatcaattc ctctaaaaac catcagtatc tgctcccctc aaaccatagc 1260 tggtgggcct gcagcactgg cctcaccccc tgcctctcca cctcagtttt taatcagtct 1320 aaagacttct gtgtccaggt ccagctgatc ccccgcatct attaccattc tgaagaaacc 1380 ttgttacaag cctatgacaa atcacccccc aggtttaaaa gagagcctgc ctcacttacc 1440 ctagctgtct tcctggggtt agggattgcg gcaggtatag gtactggctc aaccgcccta 1500 attaaagggc ccatagacct ccagcaaggc ctaaccagcc tccaaatcgc cattgacgct 1560 gacctccggg cccttcagga ctcaatcagc aagctagagg actcactgac ttccctatct 1620 gaggtagtac tccaaaatag gagaggcctt gacttactat tccttaaaga aggaggcctc 1680 tgcgcggccc taaaagaaga gtgctgtttt tatgtagacc actcaggtgc agtacgagac 1740 tccatgaaaa aacttaaaga aagactagat aaaagacagt tagagcgcca gaaaaaccaa 1800 aactggtatg aagggtggtt caataactcc ccttggttta ctaccctact atcaaccatc 1860 gctgggcccc tattgctcct ccttttgtta ctcactcttg ggccctgcat catcaataaa 1920 ttaatccaat tcatcaatga taggataagt gcagtcaaaa ttttagtcct tagacagaaa 1980 tatcagaccc tagataacga ggaaaacctt taa 2013 <210> 54 <211> 1530 <212> DNA <213> Artificial Sequence <220> <223> FUG Envelope <400> 54 atggttccgc aggttctttt gtttgtactc cttctgggtt tttcgttgtg tttcgggaag 60 ttccccattt acacgatacc agacgaactt ggtccctgga gccctattga catacaccat 120 ctcagctgtc caaataacct ggttgtggag gatgaaggat gtaccaacct gtccgagttc 180 tcctacatgg aactcaaagt gggatacatc tcagccatca aagtgaacgg gttcacttgc 240 acaggtgttg tgacagaggc agagacctac accaactttg ttggttatgt cacaaccaca 300 ttcaagagaa agcatttccg ccccacccca gacgcatgta gagccgcgta taactggaag 360 atggccggtg accccagata tgaagagtcc ctacacaatc cataccccga ctaccactgg 420 cttcgaactg taagaaccac caaagagtcc ctcattatca tatccccaag tgtgacagat 480 ttggacccat atgacaaatc ccttcactca agggtcttcc ctggcggaaa gtgctcagga 540 ataacggtgt cctctaccta ctgctcaact aaccatgatt acaccatttg gatgcccgag 600 aatccgagac caaggacacc ttgtgacatt tttaccaata gcagagggaa gagagcatcc 660 aacgggaaca agacttgcgg ctttgtggat gaaagaggcc tgtataagtc tctaaaagga 720 gcatgcaggc tcaagttatg tggagttctt ggacttagac ttatggatgg aacatgggtc 780 gcgatgcaaa catcagatga gaccaaatgg tgccctccag atcagttggt gaatttgcac 840 gactttcgct cagacgagat cgagcatctc gttgtggagg agttagttaa gaaaagagag 900 gaatgtctgg atgcattaga gtccatcatg accaccaagt cagtaagttt cagacgtctc 960 agtcacctga gaaaacttgt cccagggttt ggaaaagcat ataccatatt caacaaaacc 1020 ttgatggagg ctgatgctca ctacaagtca gtccggacct ggaatgagat catcccctca 1080 aaagggtgtt tgaaagttgg aggaaggtgc catcctcatg tgaacggggt gtttttcaat 1140 ggtataatat tagggcctga cgaccatgtc ctaatcccag agatgcaatc atccctcctc 1200 cagcaacata tggagttgtt ggaatcttca gttatccccc tgatgcaccc cctggcagac 1260 ccttctacag ttttcaaaga aggtgatgag gctgaggatt ttgttgaagt tcacctcccc 1320 gatgtgtaca aacagatctc aggggttgac ctgggtctcc cgaactgggg aaagtatgta 1380 ttgatgactg caggggccat gattggcctg gtgttgatat tttccctaat gacatggtgc 1440 agagttggta tccatctttg cattaaatta aagcacacca agaaaagaca gatttataca 1500 gacatagaga tgaaccgact tggaaagtaa 1530 <210> 55 <211> 1497 <212> DNA <213> Artificial Sequence <220> <223> LCMV Envelope <400> 55 atgggtcaga ttgtgacaat gtttgaggct ctgcctcaca tcatcgatga ggtgatcaac 60 attgtcatta ttgtgcttat cgtgatcacg ggtatcaagg ctgtctacaa ttttgccacc 120 tgtgggatat tcgcattgat cagtttccta cttctggctg gcaggtcctg tggcatgtac 180 ggtcttaagg gacccgacat ttacaaagga gtttaccaat ttaagtcagt ggagtttgat 240 atgtcacatc tgaacctgac catgcccaac gcatgttcag ccaacaactc ccaccattac 300 atcagtatgg ggacttctgg actagaattg accttcacca atgattccat catcagtcac 360 aacttttgca atctgacctc tgccttcaac aaaaagacct ttgaccacac actcatgagt 420 atagtttcga gcctacacct cagtatcaga gggaactcca actataaggc agtatcctgc 480 gacttcaaca atggcataac catccaatac aacttgacat tctcagatcg acaaagtgct 540 cagagccagt gtagaacctt cagaggtaga gtcctagata tgtttagaac tgccttcggg 600 gggaaataca tgaggagtgg ctggggctgg acaggctcag atggcaagac cacctggtgt 660 agccagacga gttaccaata cctgattata caaaatagaa cctgggaaaa ccactgcaca 720 tatgcaggtc cttttgggat gtccaggatt ctcctttccc aagagaagac taagttcttc 780 actaggagac tagcgggcac attcacctgg actttgtcag actcttcagg ggtggagaat 840 ccaggtggtt attgcctgac caaatggatg attcttgctg cagagcttaa gtgtttcggg 900 aacacagcag ttgcgaaatg caatgtaaat catgatgccg aattctgtga catgctgcga 960 ctaattgact acaacaaggc tgctttgagt aagttcaaag aggacgtaga atctgccttg 1020 cacttattca aaacaacagt gaattctttg atttcagatc aactactgat gaggaaccac 1080 ttgagagatc tgatgggggt gccatattgc aattactcaa agttttggta cctagaacat 1140 gcaaagaccg gcgaaactag tgtccccaag tgctggcttg tcaccaatgg ttcttactta 1200 aatgagaccc acttcagtga tcaaatcgaa caggaagccg ataacatgat tacagagatg 1260 ttgaggaagg attacataaa gaggcagggg agtacccccc tagcattgat ggaccttctg 1320 atgttttcca catctgcata tctagtcagc atcttcctgc accttgtcaa aataccaaca 1380 cacaggcaca taaaaggtgg ctcatgtcca aagccacacc gattaaccaa caaaggaatt 1440 tgtagttgtg gtgcatttaa ggtgcctggt gtaaaaaccg tctggaaaag acgctga 1497 <210> 56 <211> 1692 <212> DNA <213> Artificial Sequence <220> <223> FPV Envelope <400> 56 atgaacactc aaatcctggt tttcgccctt gtggcagtca tccccacaaa tgcagacaaa 60 atttgtcttg gacatcatgc tgtatcaaat ggcaccaaag taaacacact cactgagaga 120 ggagtagaag ttgtcaatgc aacggaaaca gtggagcgga caaacatccc caaaatttgc 180 tcaaaaggga aaagaaccac tgatcttggc caatgcggac tgttagggac cattaccgga 240 ccacctcaat gcgaccaatt tctagaattt tcagctgatc taataatcga gagacgagaa 300 ggaaatgatg tttgttaccc ggggaagttt gttaatgaag aggcattgcg acaaatcctc 360 agaggatcag gtgggattga caaagaaaca atgggattca catatagtgg aataaggacc 420 aacggaacaa ctagtgcatg tagaagatca gggtcttcat tctatgcaga aatggagtgg 480 ctcctgtcaa atacagacaa tgctgctttc ccacaaatga caaaatcata caaaaacaca 540 aggagagaat cagctctgat agtctgggga atccaccatt caggatcaac caccgaacag 600 accaaactat atgggagtgg aaataaactg ataacagtcg ggagttccaa atatcatcaa 660 tcttttgtgc cgagtccagg aacacgaccg cagataaatg gccagtccgg acggattgat 720 tttcattggt tgatcttgga tcccaatgat acagttactt ttagtttcaa tggggctttc 780 atagctccaa atcgtgccag cttcttgagg ggaaagtcca tggggatcca gagcgatgtg 840 caggttgatg ccaattgcga aggggaatgc taccacagtg gagggactat aacaagcaga 900 ttgccttttc aaaacatcaa tagcagagca gttggcaaat gcccaagata tgtaaaacag 960 gaaagtttat tattggcaac tgggatgaag aacgttcccg aaccttccaa aaaaaggaaa 1020 aaaagaggcc tgtttggcgc tatagcaggg tttattgaaa atggttggga aggtctggtc 1080 gacgggtggt acggtttcag gcatcagaat gcacaaggag aaggaactgc agcagactac 1140 aaaagcaccc aatcggcaat tgatcagata accggaaagt taaatagact cattgagaaa 1200 accaaccagc aatttgagct aatagataat gaattcactg aggtggaaaa gcagattggc 1260 aatttaatta actggaccaa agactccatc acagaagtat ggtcttacaa tgctgaactt 1320 cttgtggcaa tggaaaacca gcacactatt gatttggctg attcagagat gaacaagctg 1380 tatgagcgag tgaggaaaca attaagggaa aatgctgaag aggatggcac tggttgcttt 1440 gaaatttttc ataaatgtga cgatgattgt atggctagta taaggaacaa tacttatgat 1500 cacagcaaat acagagaaga agcgatgcaa aatagaatac aaattgaccc agtcaaattg 1560 agtagtggct acaaagatgt gatactttgg tttagcttcg gggcatcatg ctttttgctt 1620 cttgccattg caatgggcct tgttttcata tgtgtgaaga acggaaacat gcggtgcact 1680 atttgtatat aa 1692 <210> 57 <211> 1266 <212> DNA <213> Artificial Sequence <220> <223> RRV Envelope <400> 57 agtgtaacag agcactttaa tgtgtataag gctactagac catacctagc acattgcgcc 60 gattgcgggg acgggtactt ctgctatagc ccagttgcta tcgaggagat ccgagatgag 120 gcgtctgatg gcatgcttaa gatccaagtc tccgcccaaa taggtctgga caaggcaggc 180 acccacgccc acacgaagct ccgatatatg gctggtcatg atgttcagga atctaagaga 240 gattccttga gggtgtacac gtccgcagcg tgctccatac atgggacgat gggacacttc 300 atcgtcgcac actgtccacc aggcgactac ctcaaggttt cgttcgagga cgcagattcg 360 cacgtgaagg catgtaaggt ccaatacaag cacaatccat tgccggtggg tagagagaag 420 ttcgtggtta gaccacactt tggcgtagag ctgccatgca cctcatacca gctgacaacg 480 gctcccaccg acgaggagat tgacatgcat acaccgccag atataccgga tcgcaccctg 540 ctatcacaga cggcgggcaa cgtcaaaata acagcaggcg gcaggactat caggtacaac 600 tgtacctgcg gccgtgacaa cgtaggcact accagtactg acaagaccat caacacatgc 660 aagattgacc aatgccatgc tgccgtcacc agccatgaca aatggcaatt tacctctcca 720 tttgttccca gggctgatca gacagctagg aaaggcaagg tacacgttcc gttccctctg 780 actaacgtca cctgccgagt gccgttggct cgagcgccgg atgccaccta tggtaagaag 840 gaggtgaccc tgagattaca cccagatcat ccgacgctct tctcctatag gagtttagga 900 gccgaaccgc acccgtacga ggaatgggtt gacaagttct ctgagcgcat catcccagtg 960 acggaagaag ggattgagta ccagtggggc aacaacccgc cggtctgcct gtgggcgcaa 1020 ctgacgaccg agggcaaacc ccatggctgg ccacatgaaa tcattcagta ctattatgga 1080 ctataccccg ccgccactat tgccgcagta tccggggcga gtctgatggc cctcctaact 1140 ctggcggcca catgctgcat gctggccacc gcgaggagaa agtgcctaac accgtacgcc 1200 ctgacgccag gagcggtggt accgttgaca ctggggctgc tttgctgcgc accgagggcg 1260 aatgca 1266 <210> 58 <211> 1938 <212> DNA <213> Artificial Sequence <220> <223> MLV 10A1 Envelope <400> 58 atggaaggtc cagcgttctc aaaacccctt aaagataaga ttaacccgtg gaagtcctta 60 atggtcatgg gggtctattt aagagtaggg atggcagaga gcccccatca ggtctttaat 120 gtaacctgga gagtcaccaa cctgatgact gggcgtaccg ccaatgccac ctccctttta 180 ggaactgtac aagatgcctt cccaagatta tattttgatc tatgtgatct ggtcggagaa 240 gagtgggacc cttcagacca ggaaccatat gtcgggtatg gctgcaaata ccccggaggg 300 agaaagcgga cccggacttt tgacttttac gtgtgccctg ggcataccgt aaaatcgggg 360 tgtggggggc caagagaggg ctactgtggt gaatggggtt gtgaaaccac cggacaggct 420 tactggaagc ccacatcatc atgggaccta atctccctta agcgcggtaa caccccctgg 480 gacacgggat gctccaaaat ggcttgtggc ccctgctacg acctctccaa agtatccaat 540 tccttccaag gggctactcg agggggcaga tgcaaccctc tagtcctaga attcactgat 600 gcaggaaaaa aggctaattg ggacgggccc aaatcgtggg gactgagact gtaccggaca 660 ggaacagatc ctattaccat gttctccctg acccgccagg tcctcaatat agggccccgc 720 atccccattg ggcctaatcc cgtgatcact ggtcaactac ccccctcccg acccgtgcag 780 atcaggctcc ccaggcctcc tcagcctcct cctacaggcg cagcctctat agtccctgag 840 actgccccac cttctcaaca acctgggacg ggagacaggc tgctaaacct ggtagaagga 900 gcctatcagg cgcttaacct caccaatccc gacaagaccc aagaatgttg gctgtgctta 960 gtgtcgggac ctccttatta cgaaggagta gcggtcgtgg gcacttatac caatcattct 1020 accgccccgg ccagctgtac ggccacttcc caacataagc ttaccctatc tgaagtgaca 1080 ggacagggcc tatgcatggg agcactacct aaaactcacc aggccttatg taacaccacc 1140 caaagtgccg gctcaggatc ctactacctt gcagcacccg ctggaacaat gtgggcttgt 1200 agcactggat tgactccctg cttgtccacc acgatgctca atctaaccac agactattgt 1260 gtattagttg agctctggcc cagaataatt taccactccc ccgattatat gtatggtcag 1320 cttgaacagc gtaccaaata taagagggag ccagtatcgt tgaccctggc ccttctgcta 1380 ggaggattaa ccatgggagg gattgcagct ggaataggga cggggaccac tgccctaatc 1440 aaaacccagc agtttgagca gcttcacgcc gctatccaga cagacctcaa cgaagtcgaa 1500 aaatcaatta ccaacctaga aaagtcactg acctcgttgt ctgaagtagt cctacagaac 1560 cgaagaggcc tagatttgct cttcctaaaa gagggaggtc tctgcgcagc cctaaaagaa 1620 gaatgttgtt tttatgcaga ccacacggga ctagtgagag acagcatggc caaactaagg 1680 gaaaggctta atcagagaca aaaactattt gagtcaggcc aaggttggtt cgaagggcag 1740 tttaatagat ccccctggtt taccacctta atctccacca tcatgggacc tctaatagta 1800 ctcttactga tcttactctt tggaccctgc attctcaatc gattggtcca atttgttaaa 1860 gacaggatct cagtggtcca ggctctggtt ttgactcaac aatatcacca gctaaaacct 1920 atagagtacg agccatga 1938 <210> 59 <211> 2030 <212> DNA <213> Artificial Sequence <220> <223> EboV Envelope <400> 59 atgggtgtta caggaatatt gcagttacct cgtgatcgat tcaagaggac atcattcttt 60 ctttgggtaa ttatcctttt ccaaagaaca ttttccatcc cacttggagt catccacaat 120 agcacattac aggttagtga tgtcgacaaa ctggtttgcc gtgacaaact gtcatccaca 180 aatcaattga gatcagttgg actgaatctc gaagggaatg gagtggcaac tgacgtgcca 240 tctgcaacta aaagatgggg cttcaggtcc ggtgtcccac caaaggtggt caattatgaa 300 gctggtgaat gggctgaaaa ctgctacaat cttgaaatca aaaaacctga cgggagtgag 360 tgtctaccag cagcgccaga cgggattcgg ggcttccccc ggtgccggta tgtgcacaaa 420 gtatcaggaa cgggaccgtg tgccggagac tttgccttcc acaaagaggg tgctttcttc 480 ctgtatgacc gacttgcttc cacagttatc taccgaggaa cgactttcgc tgaaggtgtc 540 gttgcatttc tgatactgcc ccaagctaag aaggacttct tcagctcaca ccccttgaga 600 gagccggtca atgcaacgga ggacccgtct agtggctact attctaccac aattagatat 660 caagctaccg gttttggaac caatgagaca gagtatttgt tcgaggttga caatttgacc 720 tacgtccaac ttgaatcaag attcacacca cagtttctgc tccagctgaa tgagacaata 780 tatacaagtg ggaaaaggag caataccacg ggaaaactaa tttggaaggt caaccccgaa 840 attgatacaa caatcgggga gtgggccttc tgggaaacta aaaaaacctc actagaaaaa 900 ttcgcagtga agagttgtct ttcacagctg tatcaaacag agccaaaaac atcagtggtc 960 agagtccggc gcgaacttct tccgacccag ggaccaacac aacaactgaa gaccacaaaa 1020 tcatggcttc agaaaattcc tctgcaatgg ttcaagtgca cagtcaagga agggaagctg 1080 cagtgtcgca tctgacaacc cttgccacaa tctccacgag tcctcaaccc cccacaacca 1140 aaccaggtcc ggacaacagc acccacaata cacccgtgta taaacttgac atctctgagg 1200 caactcaagt tgaacaacat caccgcagaa cagacaacga cagcacagcc tccgacactc 1260 cccccgccac gaccgcagcc ggacccctaa aagcagagaa caccaacacg agcaagggta 1320 ccgacctcct ggaccccgcc accacaacaa gtccccaaaa ccacagcgag accgctggca 1380 acaacaacac tcatcaccaa gataccggag aagagagtgc cagcagcggg aagctaggct 1440 taattaccaa tactattgct ggagtcgcag gactgatcac aggcgggagg agagctcgaa 1500 gagaagcaat tgtcaatgct caacccaaat gcaaccctaa tttacattac tggactactc 1560 aggatgaagg tgctgcaatc ggactggcct ggataccata tttcgggcca gcagccgagg 1620 gaatttacat agaggggctg atgcacaatc aagatggttt aatctgtggg ttgagacagc 1680 tggccaacga gacgactcaa gctcttcaac tgttcctgag agccacaacc gagctacgca 1740 ccttttcaat cctcaaccgt aaggcaattg atttcttgct gcagcgatgg ggcggcacat 1800 gccacatttt gggaccggac tgctgtatcg aaccacatga ttggaccaag aacataacag 1860 acaaaattga tcagattatt catgattttg ttgataaaac ccttccggac cagggggaca 1920 atgacaattg gtggacagga tggagacaat ggataccggc aggtattgga gttacaggcg 1980 ttataattgc agttatcgct ttattctgta tatgcaaatt tgtcttttag 2030 <210> 60 <211> 218 <212> DNA <213> Artificial Sequence <220> <223> Thyroxin binding globulin promoter(TBG) <400> 60 ctttctcttt tgttttacat gaagggtctg gcagccaaag caatcactca aagttcaaac 60 cttatcattt tttgctttgt tcctcttggc cttggttttg tacatcagct ttgaaaatac 120 catcccaggg ttaatgctgg ggttaattta taactaagag tgctctagtt ttgcaataca 180 ggacatgcta taaaaatgga aagatgttgc tttctgag 218 <210> 61 <211> 523 <212> DNA <213> Artificial Sequence <220> <223> DNA fragment containing prothrombin enhancer and human alpha-1 anti-trypsin promoter <400> 61 gcgagaactt gtgcctcccc gtgttcctgc tctttgtccc tctgtcctac ttagactaat 60 atttgccttg ggtactgcaa acaggaaatg ggggagggac aggagtaggg cggagggtag 120 cccggggatc ttgctaccag tggaacagcc actaaggatt ctgcagtgag agcagagggc 180 cagctaagtg gtactctccc agagactgtc tgactcacgc caccccctcc accttggaca 240 caggacgctg tggtttctga gccaggtaca atgactcctt tcggtaagtg cagtggaagc 300 tgtacactgc ccaggcaaag cgtccgggca gcgtaggcgg gcgactcaga tcccagccag 360 tggacttagc ccctgtttgc tcctccgata actggggtga ccttggttaa tattcaccag 420 cagcctcccc cgttgcccct ctggatccac tgcttaaata cggacgagga cagggccctg 480 tctcctcagc ttcaggcacc accactgacc tgggacagtg aat 523 <210> 62 <211> 558 <212> DNA <213> Artificial Sequence <220> <223> DNA fragment containing prothrombin enhancer, human alpha-1 anti-trypsin promoter, and five HNF1 binding sites <400> 62 gttaatcatt aacgttaatc attaacgtta atcattaacg ttaatcatta acgttaatca 60 ttaacatcga tgcgagaact tgtgcctccc cgtgttcctg ctctttgtcc ctctgtccta 120 cttagactaa tatttgcctt gggtactgca aacaggaaat gggggaggga caggagtagg 180 gcggagggta ggattctgca gtgagagcag agggccagct aagtggtact ctcccagaga 240 ctgtctgact cacgccaccc cctccacctt ggacacagga cgctgtggtt tctgagccag 300 gtacaatgac tcctttcggt aagtgcagtg gaagctgtac actgcccagg caaagcgtcc 360 gggcagcgta ggcgggcgac tcagatccca gccagtggac ttagcccctg tttgctcctc 420 cgataactgg ggtgaccttg gttaatattc accagcagcc tcccccgttg cccctctgga 480 tccactgctt aaatacggac gaggacaggg ccctgtctcc tcagcttcag gcaccaccac 540 tgacctggga cagtgaat 558 <210> 63 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> DNA fragment containing prothrombin enhancer, human alpha-1 anti-trypsin promoter, and three HNF1/HNF4 binding sites <400> 63 gttaatcatt aacgcttgta ctttggtaca gttaatcatt aacgcttgta ctttggtaca 60 gttaatcatt aacgcttgta ctttggtaca atcgatgcga gaacttgtgc ctccccgtgt 120 tcctgctctt tgtccctctg tcctacttag actaatattt gccttgggta ctgcaaacag 180 gaaatggggg agggacagga gtagggcgga gggtagcccg gggattctgc agtgagagca 240 gagggccagc taagtggtac tctcccagag actgtctgac tcacgccacc ccctccacct 300 tggacacagg acgctgtggt ttctgagcca ggtacaatga ctcctttcgg taagtgcagt 360 ggaagctgta cactgcccag gcaaagcgtc cgggcagcgt aggcgggcga ctcagatccc 420 agccagtgga cttagcccct gtttgctcct ccgataactg gggtgacctt ggttaatatt 480 caccagcagc ctcccccgtt gcccctctgg atccactgct taaatacgga cgaggacagg 540 gccctgtctc ctcagcttca ggcaccacca ctgacctggg acagtgaat 589 <210> 64 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> hPAH FAM TaqMan Probe <400> 64 tcgtgaaagc tcatggacag tggc 24 <210> 65 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> PAH TaqMan Forward Primer <400> 65 agatcttgag gcatgacatt gg 22 <210> 66 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> PAH TaqMan Reverse Primer <400> 66 gtccagctct tgaatggttc tt 22 <210> 67 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Actin FAM Probe <400> 67 agcgggaaat cgtgcgtgac 20 <210> 68 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Actin Forward Primer <400> 68 ggacctgact gactacctca t 21 <210> 69 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Actin Reverse Primer <400> 69 cgtagcacag cttctcctta at 22 <210> 70 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Codon-optimized PAH (OPT3) <400> 70 atgtctaccg ccgtgctgga aaatcctggc ctgggcagaa agctgagcga cttcggccaa 60 gagacaagct acatcgagga caactgcaac cagaacggcg ccatcagcct gatcttcagc 120 ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgttcgaaga gaacgacgtg 180 aacctgacac acatcgagag cagacccagc agactgaaga aggacgagta cgagttcttc 240 acccacctgg acaagcggag cctgcctgct ctgaccaaca tcatcaagat cctgcggcac 300 gacatcggcg ccacagtgca cgaactgagc cgggacaaga aaaaggacac cgtgccatgg 360 ttccccagaa ccatccaaga gctggacaga ttcgccaacc agatcctgag ctatggcgcc 420 gagctggacg ctgatcaccc tggctttaag gaccccgtgt accgggccag aagaaagcag 480 tttgccgata tcgcctacaa ctaccggcac ggccagccta ttcctcgggt cgagtacatg 540 gaagaggaaa agaaaacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 600 cacgcctgct acgagtacaa ccacatcttc ccactgctcg agaagtactg cggcttccac 660 gaggacaata tccctcagct cgaggacgtg tcccagttcc tgcagacctg caccggcttt 720 agactgaggc ctgttgccgg actgctgagc agcagagatt ttctcggcgg cctggccttc 780 agagtgttcc actgtaccca gtacatcaga cacggcagca agcccatgta cacccctgag 840 cctgatatct gccacgagct gctgggacat gtgcccctgt tcagcgatag aagcttcgcc 900 cagttcagcc aagagatcgg actggcttct ctgggagccc ctgacgagta cattgagaag 960 ctggccacca tctactggtt caccgtggag ttcggcctgt gcaagcaggg cgatagcatc 1020 aaggcttatg gcgctggcct gctgtctagc tttggcgagc tgcagtactg tctgagcgag 1080 aagcctaagc tgctgcccct ggaactggaa aagaccgcca tccagaacta caccgtgacc 1140 gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1200 aacttcgccg ccaccattcc tcggcctttc agcgtcagat acgaccccta cacacagcgg 1260 atcgaggtgc tggacaacac acagcagctg aaaattctgg ccgacagcat caacagcgag 1320 atcggcatcc tgtgcagcgc cctgcagaaa atcaagtga 1359 <210> 71 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Codon-optimized PAH (OPT2/3) <400> 71 atgagtacgg ctgtgctcga gaatccaggt ttgggccgaa agctgtctga ttttggacag 60 gagacatctt atattgaaga caactgcaac cagaatggtg cgatatccct tattttttct 120 ctgaaagaag aagtaggtgc gctggcaaag gtcttgcggc tgtttgaaga gaacgatgtt 180 aatcttactc atattgagtc cagaccatca cggctgaaaa aagacgagta cgaatttttt 240 actcacttgg acaaacgaag cttgccggct cttactaata tcattaagat cctccggcat 300 gacatagggg cgacagtgca tgagctttca agggataaaa agaaagatac cgtcccctgg 360 tttccaagga ccatacaaga actcgaccga ttcgcgaacc agatcctttc atatggtgct 420 gagttggatg ctgaccaccc cggcttcaaa gacccggtct accgagcgcg gcggaaacaa 480 tttgctgaca tcgcatacaa ttacaggcat ggccagccaa ttcctagagt agaatacatg 540 gaagaagaga aaaaaacctg gggtaccgtc ttcaagacgc tgaaatcatt gtataaaact 600 catgcatgtt acgaatataa ccatattttt ccgttgctcg agaaatattg cgggttccac 660 gaagataaca tcccacaact cgaggatgta tctcagttcc tccagacctg tacggggttt 720 cgacttaggc ctgttgccgg actgctgagc agcagagatt ttctcggcgg cctggccttc 780 agagtgttcc actgtaccca gtacatcaga cacggcagca agcccatgta cacccctgag 840 cctgatatct gccacgagct gctgggacat gtgcccctgt tcagcgatag aagcttcgcc 900 cagttcagcc aagagatcgg actggcttct ctgggagccc ctgacgagta cattgagaag 960 ctggccacca tctactggtt caccgtggag ttcggcctgt gcaagcaggg cgatagcatc 1020 aaggcttatg gcgctggcct gctgtctagc tttggcgagc tgcagtactg tctgagcgag 1080 aagcctaagc tgctgcccct ggaactggaa aagaccgcca tccagaacta caccgtgacc 1140 gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1200 aacttcgccg ccaccattcc tcggcctttc agcgtcagat acgaccccta cacacagcgg 1260 atcgaggtgc tggacaacac acagcagctg aaaattctgg ccgacagcat caacagcgag 1320 atcggcatcc tgtgcagcgc cctgcagaaa atcaagtga 1359 <210> 72 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Codon-optimized PAH (OPT3/2) <400> 72 atgtctaccg ccgtgctgga aaatcctggc ctgggcagaa agctgagcga cttcggccaa 60 gagacaagct acatcgagga caactgcaac cagaacggcg ccatcagcct gatcttcagc 120 ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgttcgaaga gaacgacgtg 180 aacctgacac acatcgagag cagacccagc agactgaaga aggacgagta cgagttcttc 240 acccacctgg acaagcggag cctgcctgct ctgaccaaca tcatcaagat cctgcggcac 300 gacatcggcg ccacagtgca cgaactgagc cgggacaaga aaaaggacac cgtgccatgg 360 ttccccagaa ccatccaaga gctggacaga ttcgccaacc agatcctgag ctatggcgcc 420 gagctggacg ctgatcaccc tggctttaag gaccccgtgt accgggccag aagaaagcag 480 tttgccgata tcgcctacaa ctaccggcac ggccagccta ttcctcgggt cgagtacatg 540 gaagaggaaa agaaaacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 600 cacgcctgct acgagtacaa ccacatcttc ccactgctcg agaagtactg cggcttccac 660 gaggacaata tccctcagct cgaggacgtg tcccagttcc tgcagacctg caccggcttt 720 agactgaggc ctgtcgcggg tttgctcagt tctcgagact tcctgggtgg attggcgttt 780 cgggtattcc attgcacgca gtatatccga cacggaagta agccaatgta cacgccagaa 840 cccgatatct gtcacgaatt gcttggacac gttcctctgt tttctgatcg atcattcgct 900 cagttttcac aggaaatcgg cctggcatct ttgggagcgc cggatgaata tattgagaag 960 ctcgctacaa tttactggtt cacggtagaa tttgggttgt gcaagcaggg tgatagtatt 1020 aaagcatacg gtgcgggatt gctgtcctca ttcggggagc ttcagtattg cctgtccgag 1080 aaacccaagc tgttgccgtt ggaattggaa aaaaccgcta tccaaaatta cacagtaacg 1140 gagttccaac ctttgtacta cgtagccgag tcatttaacg atgcaaagga gaaggtcaga 1200 aattttgctg cgacgatacc cagaccgttc tcagtaaggt acgatcctta cactcagagg 1260 attgaagtcc tggataatac gcaacagctc aagatcctgg cagactccat aaattctgaa 1320 atcggcatct tgtgttcagc actgcaaaag ataaaataa 1359 <210> 73 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> DNA Fragment of OPT3 <400> 73 agaaccatcc aagag 15 <210> 74 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> DNA Fragment of OPT3 <400> 74 tattcctcgg gtcgagtac 19 <210> 75 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> DNA Fragment of OPT3 <400> 75 agagatcgga ctggct 16 <210> 76 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> DNA Fragment of OPT3 <400> 76 tcctcggcct ttcag 15 <210> 77 <211> 529 <212> DNA <213> Artificial Sequence <220> <223> DNA fragment containing prothrombin enhancer, human alpha-1, anti-trypsin promoter, and one HNF1/HNF4 binding site <400> 77 gttaatcatt aacgcttgta ctttggtaca atcgatgcga gaacttgtgc ctccccgtgt 60 tcctgctctt tgtccctctg tcctacttag actaatattt gccttgggta ctgcaaacag 120 gaaatggggg agggacagga gtagggcgga gggtagcccg gggattctgc agtgagagca 180 gagggccagc taagtggtac tctcccagag actgtctgac tcacgccacc ccctccacct 240 tggacacagg acgctgtggt ttctgagcca ggtacaatga ctcctttcgg taagtgcagt 300 ggaagctgta cactgcccag gcaaagcgtc cgggcagcgt aggcgggcga ctcagatccc 360 agccagtgga cttagcccct gtttgctcct ccgataactg gggtgacctt ggttaatatt 420 caccagcagc ctcccccgtt gcccctctgg atccactgct taaatacgga cgaggacagg 480 gccctgtctc ctcagcttca ggcaccacca ctgacctggg acagtgaat 529 <210> 78 <211> 615 <212> DNA <213> Artificial Sequence <220> <223> Prothrombin enhancer-hAAT promoter-Minute Virus of Mouse intron <400> 78 gcgagaactt gtgcctcccc gtgttcctgc tctttgtccc tctgtcctac ttagactaat 60 atttgccttg ggtactgcaa acaggaaatg ggggagggac aggagtaggg cggagggtag 120 cccggggatc ttgctaccag tggaacagcc actaaggatt ctgcagtgag agcagagggc 180 cagctaagtg gtactctccc agagactgtc tgactcacgc caccccctcc accttggaca 240 caggacgctg tggtttctga gccaggtaca atgactcctt tcggtaagtg cagtggaagc 300 tgtacactgc ccaggcaaag cgtccgggca gcgtaggcgg gcgactcaga tcccagccag 360 tggacttagc ccctgtttgc tcctccgata actggggtga ccttggttaa tattcaccag 420 cagcctcccc cgttgcccct ctggatccac tgcttaaata cggacgagga cagggccctg 480 tctcctcagc ttcaggcacc accactgacc tgggacagtg aataagaggt aagggtttaa 540 gggatggttg gttggtgggg tattaatgtt taattacctg gagcacctgc ctgaaatcac 600 tttttttcag gttgg 615 <210> 79 <211> 334 <212> DNA <213> Artificial Sequence <220> <223> hAAT promoter-Transthyretin enhancer-Minute Virus of Mouse intron <400> 79 gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60 ggctaagtcc accgatgctc taatctctct agacaaggtt catatttgta tgggttactt 120 attctctctt tgttgactaa gtcaataatc agaatcagca ggtttgcagt cagattggca 180 gggataagca gcctagctca ggagaagtga gtataaaagc cccaggctgg gagcagccat 240 caaagaggta agggtttaag ggatggttgg ttggtggggt attaatgttt aattacctgg 300 agcacctgcc tgaaatcact ttttttcagg ttgg 334 <210> 80 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Minute virus of Mouse intron <400> 80 aagaggtaag ggtttaaggg atggttggtt ggtggggtat taatgtttaa ttacctggag 60 cacctgcctg aaatcacttt ttttcaggtt gg 92 <210> 81 <211> 171 <212> DNA <213> Artificial Sequence <220> <223> Transthyretin enhancer <400> 81 ccgatgctct aatctctcta gacaaggttc atatttgtat gggttactta ttctctcttt 60 gttgactaag tcaataatca gaatcagcag gtttgcagtc agattggcag ggataagcag 120 cctagctcag gagaagtgag tataaaagcc ccaggctggg agcagccatc a 171 <210> 82 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> hAAT promoter <400> 82 gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60 ggctaagtcc a 71 <210> 83 <211> 1654 <212> DNA <213> Artificial Sequence <220> <223> PAH optimized version 3-PAH 3UTR <400> 83 atgtctaccg ccgtgctgga aaatcctggc ctgggcagaa agctgagcga cttcggccaa 60 gagacaagct acatcgagga caactgcaac cagaacggcg ccatcagcct gatcttcagc 120 ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgttcgaaga gaacgacgtg 180 aacctgacac acatcgagag cagacccagc agactgaaga aggacgagta cgagttcttc 240 acccacctgg acaagcggag cctgcctgct ctgaccaaca tcatcaagat cctgcggcac 300 gacatcggcg ccacagtgca cgaactgagc cgggacaaga aaaaggacac cgtgccatgg 360 ttccccagaa ccatccaaga gctggacaga ttcgccaacc agatcctgag ctatggcgcc 420 gagctggacg ctgatcaccc tggctttaag gaccccgtgt accgggccag aagaaagcag 480 tttgccgata tcgcctacaa ctaccggcac ggccagccta ttcctcgggt cgagtacatg 540 gaagaggaaa agaaaacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 600 cacgcctgct acgagtacaa ccacatcttc ccactgctcg agaagtactg cggcttccac 660 gaggacaata tccctcagct cgaggacgtg tcccagttcc tgcagacctg caccggcttt 720 agactgaggc ctgttgccgg actgctgagc agcagagatt ttctcggcgg cctggccttc 780 agagtgttcc actgtaccca gtacatcaga cacggcagca agcccatgta cacccctgag 840 cctgatatct gccacgagct gctgggacat gtgcccctgt tcagcgatag aagcttcgcc 900 cagttcagcc aagagatcgg actggcttct ctgggagccc ctgacgagta cattgagaag 960 ctggccacca tctactggtt caccgtggag ttcggcctgt gcaagcaggg cgatagcatc 1020 aaggcttatg gcgctggcct gctgtctagc tttggcgagc tgcagtactg tctgagcgag 1080 aagcctaagc tgctgcccct ggaactggaa aagaccgcca tccagaacta caccgtgacc 1140 gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1200 aacttcgccg ccaccattcc tcggcctttc agcgtcagat acgaccccta cacacagcgg 1260 atcgaggtgc tggacaacac acagcagctg aaaattctgg ccgacagcat caacagcgag 1320 atcggcatcc tgtgcagcgc cctgcagaaa atcaagtgag tcgacagcca tggacagaat 1380 gtggtctgtc agctgtgaat ctgttgatgg agatccaact atttctttca tcagaaaaag 1440 tccgaaaagc aaaccttaat ttgaaataac agccttaaat cctttacaag atggagaaac 1500 aacaaataag tcaaaataat ctgaaatgac aggatatgag tacatactca agagcataat 1560 ggtaaatctt ttggggtcat ctttgattta gagatgataa tcccatactc tcaattgagt 1620 taaatcagta atctgtcgca tttcatcaag atta 1654 <210> 84 <211> 1995 <212> DNA <213> Artificial Sequence <220> <223> PAH optimized version 3-Albumin 3UTR <400> 84 atgtctaccg ccgtgctgga aaatcctggc ctgggcagaa agctgagcga cttcggccaa 60 gagacaagct acatcgagga caactgcaac cagaacggcg ccatcagcct gatcttcagc 120 ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgttcgaaga gaacgacgtg 180 aacctgacac acatcgagag cagacccagc agactgaaga aggacgagta cgagttcttc 240 acccacctgg acaagcggag cctgcctgct ctgaccaaca tcatcaagat cctgcggcac 300 gacatcggcg ccacagtgca cgaactgagc cgggacaaga aaaaggacac cgtgccatgg 360 ttccccagaa ccatccaaga gctggacaga ttcgccaacc agatcctgag ctatggcgcc 420 gagctggacg ctgatcaccc tggctttaag gaccccgtgt accgggccag aagaaagcag 480 tttgccgata tcgcctacaa ctaccggcac ggccagccta ttcctcgggt cgagtacatg 540 gaagaggaaa agaaaacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 600 cacgcctgct acgagtacaa ccacatcttc ccactgctcg agaagtactg cggcttccac 660 gaggacaata tccctcagct cgaggacgtg tcccagttcc tgcagacctg caccggcttt 720 agactgaggc ctgttgccgg actgctgagc agcagagatt ttctcggcgg cctggccttc 780 agagtgttcc actgtaccca gtacatcaga cacggcagca agcccatgta cacccctgag 840 cctgatatct gccacgagct gctgggacat gtgcccctgt tcagcgatag aagcttcgcc 900 cagttcagcc aagagatcgg actggcttct ctgggagccc ctgacgagta cattgagaag 960 ctggccacca tctactggtt caccgtggag ttcggcctgt gcaagcaggg cgatagcatc 1020 aaggcttatg gcgctggcct gctgtctagc tttggcgagc tgcagtactg tctgagcgag 1080 aagcctaagc tgctgcccct ggaactggaa aagaccgcca tccagaacta caccgtgacc 1140 gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1200 aacttcgccg ccaccattcc tcggcctttc agcgtcagat acgaccccta cacacagcgg 1260 atcgaggtgc tggacaacac acagcagctg aaaattctgg ccgacagcat caacagcgag 1320 atcggcatcc tgtgcagcgc cctgcagaaa atcaagtgag tcgacattca gcagccgtaa 1380 gtctaggaca ggcttaaatt gttttcactg gtgtaaattg cagaaagatg atctaagtaa 1440 tttggcattt attttaatag gtttgaaaaa cacatgccat tttacaaata agacttatat 1500 ttgtcctttt gtttttcagc ctaccatgag aataagagaa agaaaatgaa gatcaaaagc 1560 ttattcatct gtttttcttt ttcgttggtg taaagccaac accctgtcta aaaaacataa 1620 atttctttaa tcattttgcc tcttttctct gtgcttcaat taataaaaaa tggaaagaat 1680 ctaatagagt ggtacagcac tgttattttt caaagatgtg ttgctatcct gaaaattctg 1740 taggttctgt ggaagttcca gtgttctctc ttattccact tcggtagagg atttctagtt 1800 tcttgtgggc taattaaata aatcattaat actcttctaa gttatggatt ataaacattc 1860 aaaataatat tttgacatta tgataattct gaataaaaga acaaaaacca tggtataggt 1920 aaggaatata aaacatggct tttaccttag aaaaaacaat tctaaaattc atatggaatc 1980 aaaaaagagc ctgca 1995 <210> 85 <211> 255 <212> DNA <213> Artificial Sequence <220> <223> PAH 3UTR <400> 85 agccatggac agaatgtggt ctgtcagctg tgaatctgtt gatggagatc caactatttc 60 tttcatcaga aaaagtccga aaagcaaacc ttaatttgaa ataacagcct taaatccttt 120 acaagatgga gaaacaacaa ataagtcaaa ataatctgaa atgacaggat atgagtacat 180 actcaagagc ataatggtaa atcttttggg gtcatctttg atttagagat gataatccca 240 tactctcaat tgagt 255 <210> 86 <211> 630 <212> DNA <213> Artificial Sequence <220> <223> Albumin 3UTR <400> 86 attcagcagc cgtaagtcta ggacaggctt aaattgtttt cactggtgta aattgcagaa 60 agatgatcta agtaatttgg catttatttt aataggtttg aaaaacacat gccattttac 120 aaataagact tatatttgtc cttttgtttt tcagcctacc atgagaataa gagaaagaaa 180 atgaagatca aaagcttatt catctgtttt tctttttcgt tggtgtaaag ccaacaccct 240 gtctaaaaaa cataaatttc tttaatcatt ttgcctcttt tctctgtgct tcaattaata 300 aaaaatggaa agaatctaat agagtggtac agcactgtta tttttcaaag atgtgttgct 360 atcctgaaaa ttctgtaggt tctgtggaag ttccagtgtt ctctcttatt ccacttcggt 420 agaggatttc tagtttcttg tgggctaatt aaataaatca ttaatactct tctaagttat 480 ggattataaa cattcaaaat aatattttga cattatgata attctgaata aaagaacaaa 540 aaccatggta taggtaagga atataaaaca tggcttttac cttagaaaaa acaattctaa 600 aattcatatg gaatcaaaaa agagcctgca 630 <210> 87 <211> 395 <212> DNA <213> Artificial Sequence <220> <223> WPREs (WPRE without X-protein sequence) <400> 87 aatcaacctc tggattacaa aatttgtgaa agattgactg atattcttaa ctatgttgct 60 ccttttacgc tgtgtggata tgctgcttta atgcctctgt atcatgctat tgcttcccgt 120 acggctttcg ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tccgtcaacg tggcgtggtg tgctctgtgt ttgctgacgc aacccccact 240 ggctggggca ttgccaccac ctgtcaactc ctttctggga ctttcgcttt ccccctcccg 300 atcgccacgg cagaactcat cgccgcctgc cttgcccgct gctggacagg ggctaggttg 360 ctgggcactg ataattccgt ggtgttgtcg gtacc 395

Claims (25)

  1. 치료적 카고 부분을 포함하는 바이러스 벡터로서, 치료적 카고 부분이 하기:
    코돈-최적화된 PAH 서열 또는 이의 변이체;
    프로모터; 및
    간-특이적 인핸서
    를 포함하고,
    코돈-최적화된 PAH 서열 또는 이의 변이체가 프로모터 및 간-특이적 인핸서 둘 모두에 의해 작동적으로 제어되는, 바이러스 벡터.
  2. 제 1 항에 있어서, 코돈-최적화된 PAH 서열 또는 이의 변이체가 SEQ ID NO: 70 과 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖는 서열을 포함하는, 바이러스 벡터.
  3. 제 2 항에 있어서, 코돈-최적화된 PAH 서열 또는 이의 변이체가 SEQ ID NO: 70 의 서열을 포함하는, 바이러스 벡터.
  4. 제 1 항에 있어서, 코돈-최적화된 PAH 서열 또는 이의 변이체가 SEQ ID NO: 71 과 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖는 서열을 포함하는, 바이러스 벡터.
  5. 제 4 항에 있어서, 코돈-최적화된 PAH 서열 또는 이의 변이체가 SEQ ID NO: 71 의 서열을 포함하는, 바이러스 벡터.
  6. 제 1 항에 있어서, 코돈-최적화된 PAH 서열 또는 이의 변이체가 SEQ ID NO: 72 와 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖는 서열을 포함하는, 바이러스 벡터.
  7. 제 6 항에 있어서, 코돈-최적화된 PAH 서열 또는 이의 변이체가 SEQ ID NO: 72 의 서열을 포함하는, 바이러스 벡터.
  8. 제 1 항에 있어서, 코돈-최적화된 PAH 서열 또는 이의 변이체가 SEQ ID NO: 73 과 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖는 서열을 포함하는, 바이러스 벡터.
  9. 제 8 항에 있어서, 코돈-최적화된 PAH 서열 또는 이의 변이체가 SEQ ID NO: 73 의 서열을 포함하는, 바이러스 벡터.
  10. 제 1 항에 있어서, 코돈-최적화된 PAH 서열 또는 이의 변이체가 SEQ ID NO: 74 와 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖는 서열을 포함하는, 바이러스 벡터.
  11. 제 10 항에 있어서, 코돈-최적화된 PAH 서열 또는 이의 변이체가 SEQ ID NO: 74 의 서열을 포함하는, 바이러스 벡터.
  12. 제 1 항에 있어서, 코돈-최적화된 PAH 서열 또는 이의 변이체가 SEQ ID NO: 75 와 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖는 서열을 포함하는, 바이러스 벡터.
  13. 제 12 항에 있어서, 코돈-최적화된 PAH 서열 또는 이의 변이체가 SEQ ID NO: 75 의 서열을 포함하는, 바이러스 벡터.
  14. 제 1 항에 있어서, 코돈-최적화된 PAH 서열 또는 이의 변이체가 SEQ ID NO: 76 과 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖는 서열을 포함하는, 바이러스 벡터.
  15. 제 14 항에 있어서, 코돈-최적화된 PAH 서열 또는 이의 변이체가 SEQ ID NO: 76 의 서열을 포함하는, 바이러스 벡터.
  16. 제 1 항에 잇어서, 간-특이적 인핸서가 프로트롬빈 인핸서를 포함하는, 바이러스 벡터.
  17. 제 1 항에 있어서, 프로모터가 간-특이적 프로모터를 포함하는, 바이러스 벡터.
  18. 제 17 항에 있어서, 간-특이적 프로모터가 hAAT 프로모터를 포함하는, 바이러스 벡터.
  19. 제 1 항에 있어서, 치료적 카고 부분이 베타 글로빈 인트론을 추가로 포함하는, 바이러스 벡터.
  20. 제 1 항에 있어서, 치료적 카고 부분이 적어도 하나의 작은 RNA 서열을 추가로 포함하는, 바이러스 벡터.
  21. 제 1 항에 있어서, 바이러스 벡터가 렌티바이러스 벡터 또는 아데노-연관 바이러스 벡터인, 바이러스 벡터.
  22. 제 21 항에 있어서, 바이러스 벡터가 렌티바이러스 벡터인, 바이러스 벡터.
  23. 패키징 세포에 의해 생성되며 표적 세포를 감염시킬 수 있는 렌티바이러스 입자로서,
    표적 세포를 감염시킬 수 있는 외피 단백질; 및
    제 1 항의 바이러스 벡터
    를 포함하는, 렌티바이러스 입자.
  24. 치료적 유효량의 제 23 항의 렌티바이러스 입자를 대상체에게 투여하는 것을 포함하는, 대상체에서 페닐케톤뇨증 (PKU) 을 치료하는 방법.
  25. 대상체에서 PKU 를 치료하기 위한 코돈-최적화된 PAH 서열 또는 이의 변이체의 용도.
KR1020217042390A 2019-05-31 2020-06-01 최적화된 페닐알라닌 히드록실라아제 발현 KR20220068954A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962855506P 2019-05-31 2019-05-31
US62/855,506 2019-05-31
PCT/US2020/035584 WO2020243717A1 (en) 2019-05-31 2020-06-01 Optimized phenylalanine hydroxylase expression

Publications (1)

Publication Number Publication Date
KR20220068954A true KR20220068954A (ko) 2022-05-26

Family

ID=73553945

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217042390A KR20220068954A (ko) 2019-05-31 2020-06-01 최적화된 페닐알라닌 히드록실라아제 발현

Country Status (10)

Country Link
US (1) US20220162643A1 (ko)
EP (1) EP3976076A4 (ko)
JP (1) JP2022535745A (ko)
KR (1) KR20220068954A (ko)
CN (1) CN113905768A (ko)
AU (1) AU2020283069A1 (ko)
BR (1) BR112021024124A2 (ko)
CA (1) CA3137698A1 (ko)
IL (1) IL288400A (ko)
WO (1) WO2020243717A1 (ko)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010045659A1 (en) 2008-10-17 2010-04-22 American Gene Technologies International Inc. Safe lentiviral vectors for targeted delivery of multiple therapeutic molecules
WO2017007994A1 (en) 2015-07-08 2017-01-12 American Gene Technologies International Inc. Hiv pre-immunization and immunotherapy
IL279520B2 (en) 2016-01-15 2023-03-01 American Gene Tech Int Inc Methods and preparations for the activation of gamma-delta t cells
DK3426777T3 (da) 2016-03-09 2022-04-25 American Gene Tech Int Inc Kombinationsvektorer og fremgangsmåder til behandling af cancer
EP3468617A4 (en) 2016-06-08 2020-01-22 American Gene Technologies International Inc. INTEGRATED VIRAL ADMINISTRATION SYSTEM AND RELATED METHODS
AU2017292582C1 (en) 2016-07-08 2021-11-11 American Gene Technologies International Inc. HIV pre-immunization and immunotherapy
WO2018017882A1 (en) 2016-07-21 2018-01-25 American Gene Technologies International Inc. Viral vectors for treating parkinson's disease
CA3057142A1 (en) 2017-04-03 2018-10-11 American Gene Technologies International Inc. Compositions and methods for treating phenylketonuria
JP7423521B2 (ja) 2017-11-22 2024-01-29 モダーナティエックス・インコーポレイテッド フェニルケトン尿症の治療用のフェニルアラニンヒドロキシラーゼをコードするポリヌクレオチド
CN116507730A (zh) * 2020-09-16 2023-07-28 世代生物公司 封闭端dna载体及其用于表达苯丙氨酸羟化酶(pah)的用途
IL311240A (en) * 2021-09-16 2024-05-01 Generation Bio Co Liver-specific expression cassettes, vectors and their uses for the expression of therapeutic proteins
CN115772503B (zh) * 2022-08-16 2023-10-17 广东省南山医药创新研究院 一种表达pah的基因修饰细胞药物及其制备方法与应用

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2013243953A1 (en) * 2012-04-02 2014-10-30 Modernatx, Inc. Modified polynucleotides for the production of nuclear proteins
EA034103B1 (ru) * 2013-10-22 2019-12-27 Транслейт Био, Инк. СПОСОБ ЛЕЧЕНИЯ ФЕНИЛКЕТОНУРИИ С ПРИМЕНЕНИЕМ мРНК
DK3440206T3 (da) * 2016-04-08 2020-11-23 Translate Bio Inc Multimer-kodende nukleinsyre og anvendelser deraf
CN110325199A (zh) * 2016-12-30 2019-10-11 宾夕法尼亚州立大学托管会 用于治疗苯丙酮尿症的基因疗法
CA3057142A1 (en) * 2017-04-03 2018-10-11 American Gene Technologies International Inc. Compositions and methods for treating phenylketonuria
CN111433368A (zh) * 2017-10-02 2020-07-17 美国基因技术国际有限公司 具有启动子和增强子组合的载体用于治疗苯丙酮尿症

Also Published As

Publication number Publication date
AU2020283069A8 (en) 2022-05-12
AU2020283069A1 (en) 2022-01-06
IL288400A (en) 2022-01-01
EP3976076A4 (en) 2023-06-07
EP3976076A1 (en) 2022-04-06
WO2020243717A1 (en) 2020-12-03
CA3137698A1 (en) 2020-12-03
CN113905768A (zh) 2022-01-07
JP2022535745A (ja) 2022-08-10
BR112021024124A2 (pt) 2022-01-11
US20220162643A1 (en) 2022-05-26

Similar Documents

Publication Publication Date Title
KR20220068954A (ko) 최적화된 페닐알라닌 히드록실라아제 발현
KR20190136048A (ko) 페닐케톤뇨증을 치료하기 위한 조성물 및 방법
KR20200057766A (ko) 페닐케톤뇨증을 치료하기 위한 프로모터 및 인핸서 조합을 포함하는 벡터
CN111569090A (zh) 用于活化γ-δ T细胞的方法和组合物
US20230285480A1 (en) Viral vectors for treating parkinson&#39;s disease
EP2194137B1 (en) Cells comprising codon optimized lentiviral particles
KR20200018586A (ko) 인간 감마-델타 t-세포를 통한 종양 세포독성의 활성화를 위한 방법 및 조성물
US20200368333A1 (en) Cmv vectors comprising microrna recognition elements
US5650309A (en) Viral vectors
US7226780B2 (en) Lentivirus vector system
AU2024201392A1 (en) HIV immunotherapy with no pre-immunization step
KR20210119416A (ko) 폐쇄-말단 dna (cedna), 및 유전자 또는 핵산 치료 관련 면역 반응을 감소시키는 방법에서의 이의 용도
KR20220155981A (ko) 미성숙 종결 코돈-매개 장애를 치료하기 위한 방법 및 조성물
CA2422544A1 (en) Conditionally replicating viral vectors and their use
US20040033595A1 (en) Conditionally replicating vectors for inhibiting viral infections
KR20230129162A (ko) 제1형 근긴장성 이영양증을 치료하기 위한 rna 표적화조성물 및 방법
KR20230003477A (ko) 비-바이러스성 dna 벡터 및 인자 ix 치료제 발현을 위한 이의 용도
KR20210150486A (ko) 리소좀 장애에 대한 유전자 요법
KR20230003478A (ko) 비-바이러스성 dna 벡터 및 고셰 치료제 발현을 위한 이의 용도
KR102663972B1 (ko) 예비-면역화 단계가 없는 hiv 면역요법
KR20230147060A (ko) 조작된 nk 세포 및 암 치료 방법
US20230151388A1 (en) Modified vectors for production of retrovirus
JP2024509789A (ja) レトロウイルスベクター
CN115244181A (zh) 阿司匹林化合物在增加核酸表达中的新型用途
CN114591922A (zh) 一种表达狂犬病毒g蛋白的重组黑猩猩源腺病毒及其制备方法