KR20210149702A - 비바이러스성 dna 벡터 및 페닐알라닌 히드록실라아제(pah) 치료제 발현을 위한 이의 용도 - Google Patents

비바이러스성 dna 벡터 및 페닐알라닌 히드록실라아제(pah) 치료제 발현을 위한 이의 용도 Download PDF

Info

Publication number
KR20210149702A
KR20210149702A KR1020217029544A KR20217029544A KR20210149702A KR 20210149702 A KR20210149702 A KR 20210149702A KR 1020217029544 A KR1020217029544 A KR 1020217029544A KR 20217029544 A KR20217029544 A KR 20217029544A KR 20210149702 A KR20210149702 A KR 20210149702A
Authority
KR
South Korea
Prior art keywords
seq
itr
cedna vector
cedna
pah
Prior art date
Application number
KR1020217029544A
Other languages
English (en)
Inventor
더글라스 앤써니 케르
필립 사마요아
나다니엘 실버
매튜 치오꼬
Original Assignee
제너레이션 바이오 컴퍼니
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 제너레이션 바이오 컴퍼니 filed Critical 제너레이션 바이오 컴퍼니
Publication of KR20210149702A publication Critical patent/KR20210149702A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0066Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0008Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
    • A61K48/0016Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the nucleic acid is delivered as a 'naked' nucleic acid, i.e. not combined with an entity such as a cationic lipid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P13/00Drugs for disorders of the urinary system
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/16Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with reduced pteridine as one donor, and incorporation of one atom of oxygen (1.14.16)
    • C12Y114/16001Phenylalanine 4-monooxygenase (1.14.16.1)

Abstract

본 출원은 전이유전자의 전달 및 발현을 위한 선형 및 연속 구조를 갖는 ceDNA 벡터를 설명한다. ceDNA 벡터는 2개의 ITR 서열이 플랭킹된 발현 카세트를 포함하며, 여기서 발현 카세트는 PAH 단백질을 인코딩하는 전이유전자를 인코딩한다. 일부 ceDNA 벡터는 조절 스위치를 포함하는 시스-조절 요소를 추가로 포함한다. ceDNA 벡터를 사용하여 시험관내, 생체외생체내에서 PAH 단백질의 신뢰할 수 있는 유전자 발현을 위한 방법 및 세포주가 본원에 추가로 제공된다. 세포, 조직 또는 대상에서 PAH 단백질의 발현에 유용한 ceDNA 벡터를 포함하는 방법 및 조성물, 및 PAH 단백질을 발현하는 상기 ceDNA 벡터로 질환을 치료하는 방법이 본원에 제공된다. 이러한 PAH 단백질은 질환, 예를 들어 페닐케톤뇨증(PKU)의 치료를 위해 발현될 수 있다.

Description

비바이러스성 DNA 벡터 및 페닐알라닌 히드록실라아제(PAH) 치료제 발현을 위한 이의 용도
관련 출원
본 출원은 2019년 3월 13일자 출원된 미국 가출원 제62/817,771호 및 2019년 6월 5일자 출원된 미국 가출원 제62/857,514호를 우선권 주장하며, 상기 문헌들의 내용은 그 전문이 본원에 참조로서 인용된다.
서열목록
본 출원은 ASCII 형식으로 전자문서로 제출된 서열목록 및 본원의 표 1 내지 표 15의 서열을 포함하며, 이들은 각각 그 전체가 본원에 참조로서 인용된다. 2020년 3월 10일자 생성된 상기 ASCII 사본의 명칭은 131698-05720_SL.txt이고, 크기는 116,806바이트이다.
기술분야
본 발명은 대상 또는 세포에서 전이유전자(transgene) 또는 단리된 폴리뉴클레오타이드를 발현시키기 위한 비(非)바이러스성 벡터를 포함하는 유전자 치료 분야에 관한 것이다. 본 개시내용은 또한 상기 폴리뉴클레오타이드를 포함하는 핵산 구조체, 프로모터, 벡터 및 숙주세포뿐 아니라, 표적 세포, 조직, 기관 또는 유기체로 외인성 DNA 서열을 전달하는 방법에 관한 것이다. 예를 들어, 본 개시내용은 세포에서 페닐알라닌 히드록실라아제(PAH)를 발현시키기 위해, 예를 들어 페닐케톤뇨증(PKU)을 앓고 있는 대상의 치료를 위한 PAH 치료 단백질을 발현시키기 위해 비바이러스성 ceDNA 벡터를 사용하는 방법을 제공한다. 상기 방법 및 조성물은, 예를 들어 이를 필요로 하는 대상의 세포 또는 조직에서 PAH를 발현시키는 방식으로 질환의 치료에 사용될 수 있다.
유전자 치료는 유전자 발현 프로파일의 이상으로 인한 유전자 돌연변이 또는 후천성 질환을 앓고 있는 환자의 임상 결과를 개선시키는 것을 목표로 한다. 유전자 치료는 장애, 질환, 악성종양 등을 초래할 수 있는, 결함이 있는 유전자, 또는 비정상적인 조절 또는 발현, 예를 들어 과소발현(underexpression) 또는 과발현으로 인한 의학적 병태의 치료 또는 예방을 포함한다. 예를 들어, 결함이 있는 유전자로 인한 질환 또는 장애는 교정(corrective) 유전 물질을 환자에게 전달하여 환자 내에서 유전 물질의 치료적 발현을 유도하거나, 또는 예를 들어 교정 유전 물질을 이용하여 결함 유전자를 변경하거나 침묵시켜 환자 내에서 유전 물질의 치료적 발현을 유도하는 방식으로 치료, 예방 또는 개선될 수 있다.
유전자 치료의 기초는, 예를 들어 긍정적인 기능획득 효과, 부정적인 기능손실 효과 또는 또 다른 결과를 유도할 수 있는 활성 유전자 산물(때때로 전이유전자로 지칭됨)을 전사 카세트에 공급하는 것이다. 이러한 결과는 항체, 기능성 효소 또는 융합 단백질과 같은 치료용 단백질의 발현에 기인한 것일 수 있다. 유전자 치료는 또한 다른 인자로 인한 질환 또는 악성종양을 치료하는 데 사용될 수 있다. 인간 단일유전 장애는 정상 유전자를 표적세포에 전달하여 발현시키는 방식으로 치료될 수 있다. 교정 유전자를 환자의 표적세포에 전달하여 발현시키는 것은 조작된 바이러스 및 바이러스성 유전자 전달 벡터의 사용을 포함하는 다양한 방법을 통해 수행될 수 있다. 다수의 이용 가능한 바이러스 유래 벡터(예를 들어, 재조합 레트로바이러스, 재조합 렌티바이러스, 재조합 아데노바이러스 등) 중에서, 재조합 아데노연관바이러스(rAAV: recombinant adeno-associated virus)는 유전자 치료에서 다목적 벡터로서 인기를 얻고 있다.
아데노연관바이러스(AAV: adeno-associated virus)는 파르보바이러스과에 속하며, 더욱 구체적으로는 데펜도파르보바이러스(dependoparvovirus) 속을 구성한다. AAV 유래 벡터(즉, 재조합 AAV(rAVV) 또는 AAV 벡터)는 다음과 같은 이유로 유전 물질의 전달에 매력적이다: (i) 이는 근세포와 뉴런을 포함하는 다양한 비(非)분열 및 분열 세포 유형을 감염(형질도입)시킬 수 있는 능력이 있음; (ii) 이는 바이러스 구조 유전자가 없기 때문에, 바이러스 감염에 대한 숙주세포 반응, 예를 들어 인터페론 매개 반응을 감소시킬 수 있음; (iii) 야생형 바이러스는 인간에서 비(非)병적으로 간주됨; (iv) 숙주세포 게놈에 통합될 수 있는 야생형 AAV와 대조적으로, 복제불능 AAV 벡터에는 rep 유전자가 결여되어 있고 일반적으로 에피솜으로 지속되기 때문에, 삽입 돌연변이유발 또는 유전독성의 위험을 제한할 수 있음; 및 (v) 다른 벡터 시스템과 비교하여, AAV 벡터는 일반적으로 상대적으로 불량한 면역원인 것으로 여겨져 중요한 면역 반응((ii) 참조)을 촉발시키지 않기 때문에, 벡터 DNA의 지속, 및 잠재적으로 치료용 전이유전자의 장기 발현을 얻을 수 있음.
하지만, 유전자 전달 벡터로서 AAV 입자를 사용하는 데에는 몇 가지 주요 결함이 있다. rAAV와 관련된 하나의 주요 단점은 약 4.5 kb로 제한된 이종 DNA 바이러스 패키징 용량으로(Dong 등의 문헌(1996); Athanasopoulos 등의 문헌(2004); Lai 등의 문헌(2010)), 그 결과, AAV 벡터의 사용은 150,000 Da 단백질 코딩 용량 미만으로 제한되어 있다. 두 번째 단점은, 집단에서 야생형 AAV 감염의 유병률로 인해, rAAV 유전자 치료 후보가 환자에서 벡터를 제거하는 중화 항체의 존재에 대해 스크리닝되어야 한다는 점이다. 세 번째 단점은, 초기 치료에서 제외되지 않았던 환자에게의 재투여를 막는 캡시드 면역원성과 관련이 있다. 환자의 면역계는 향후 치료를 방해하는 높은 역가의 항-AAV 항체를 생성하는 면역계를 자극하기 위해 "부스터(booster)" 주사로서 효과적으로 작용하는 벡터에 반응할 수 있다. 일부 최근 보고서는, 고용량 조건에서 면역원성에 대한 우려를 나타낸다. 또 다른 주목할 만한 단점은, 단일가닥 AAV DNA가 이종 유전자 발현 전 이중가닥 DNA로 전환되어야 한다는 점을 고려할 때, AAV 매개 유전자 발현의 개시가 상대적으로 느리다는 점이다.
또한, 캡시드를 갖는 통상적인 AAV 비리온은 AAV 게놈, rep 유전자 및 cap 유전자를 함유하는 플라스미드 또는 플라스미드들의 도입을 통해 생성된다(Grimm 등의 문헌(1998)). 하지만, 이러한 캡시드화된 AAV 바이러스 벡터는 특정 세포 및 조직 유형을 비효율적으로 형질도입하는 것으로 확인되었으며, 캡시드 또한 면역반응을 유도한다.
따라서, 유전자 치료를 위한 아데노연관바이러스(AAV) 벡터의 사용은 (환자 면역 반응으로 인해) 환자에게의 단회 투여, 최소 바이러스 패키징 용량(약 4.5 kb)으로 인한 AAV 벡터에서 전달에 적합한 전이유전자 유전 물질의 제한된 범위, 및 느린 AAV 매개 유전자 발현으로 인해 제한된다.
페닐케톤뇨증(PKU)은 PAH 유전자의 돌연변이에 의해 유발되는 희귀한 선천성 대사 이상이다. 페닐케톤뇨증(PKU)은 아미노산 페닐알라닌의 대사를 감소시키는 선천성 대사 이상이다. 치료되지 않은 PKU는 지적 장애, 발작, 행동 문제 및 정신 장애로 이어질 수 있다. 이는 또한 퀴퀴한 냄새와 보다 옅은 색의 피부를 생성할 수 있다. PKU가 제대로 치료되지 않은 산모에서 태어난 아기는 심장 문제, 작은 머리 및 출생 시 저체중이 있을 수 있다. PKA는 효소 페닐알라닌 히드록실라아제(PAH)의 수준을 낮추는 PAH 유전자의 돌연변이로 인해 발생하며, 즉, PKU를 앓고 있는 대상은 이의 효소 활성 결핍을 유도하는 PAH의 돌연변이를 갖는다. PKU는 상염색체 열성으로, 이는 병태가 발생하기 위해서는 유전자의 두 개의 카피가 모두 돌연변이되어야 함을 의미한다. 효소 기능이 남아있는 지 여부에 따라, 전형적 PKU와 변이형 PKU의 2가지 주요 유형이 존재한다. 돌연변이된 PAH 유전자 카피가 1개 있는 사람들은 전형적으로 증상이 없다.
PAH는 통상적으로 간에서 발현되며, 식이(dietary) 페닐알라닌을 신경전달물질의 생성을 담당하는 아미노산인 티로신으로 대사시키는 데 필요한 효소이다. PAH는 페닐알라닌의 티로신으로의 히드록실화를 촉진시킨다. 결함이 있는 PAH 효소는 식이 페닐알라닌을 잠재적 독성 수준까지 축적시킨다.
PKU는 혈청 Phe 수준을 상승시키는 효소 페닐알라닌 히드록실라아제(PAH)의 단일 유전자 결함에 의해 유발될 수 있다. PAH는 척추동물에서 Phe을 티로신으로 전환시킨다. PAH의 부재 하에서, Phe을 제거하는 유일한 다른 메커니즘은 단백질 합성과, 알라닌 측쇄의 탈아미노화 및 산화적 탈카르복실화를 포함하는 부수적인 분해 경로이며, 이는 PKU 환자의 소변에서 확인되는 특징적인 페닐락테이트와 페닐아세테이트를 생성한다. 불행하게도, 전형적인 식이는 PAH의 부재 하에서 제거될 수 있는 것보다 더 많은 Phe를 함유한다. 결과적으로 PKU 환자에서 Phe가 축적되면, 비정상적인 뇌 발달 및 중증 정신지체를 포함하는 다수의 증상이 나타난다. (문헌[Kaufman, Proc Nat'l Acad Sci USA 96: 3160-3164, 1999]).
현재 표준 치료는 고도로 제한된 식이(페닐알라닌 (Phe)의 제한)이지만, 이러한 식이 제한은 유지하기가 어렵고 근본적인 결함을 교정하지 못하기 때문에 항상 효과적인 것이 아니다. 현재 PKU 치료법은 페닐알라닌을 함유한 식품을 적게 섭취하고 특수 보충제를 이용하는 것이다. 엄격한 식이요법은 출생 후 가능한 빨리 시작하여, 평생은 아니지만 적어도 10년 동안 지속되어야 한다. 사프롭테린 디히드로클로라이드(sapropterin dihydrochloride)라는 약물이 일부 PKU 환자에서 유용할 수 있다. 치료되지 않은 채로 방치되면, PKU는 진행성 및 중증 신경계 장애를 초래할 수 있다. PKU는 미국에서 대략 15,000명의 사람들이 앓고 있는 것으로 추정되며, PKU의 유전적 결함을 해결할 수 있는 치료법은 존재하지 않는다.
PKU의 생화학, 분자생물학 및 유전학을 이해하는 데 있어서의 엄청난 발전에도 불구하고, 이러한 장애에 대한 새로운 치료법을 개발하는 데에는 거의 진전이 없었다. PKU의 질환 변형(disease-modifying) 치료법에 대한 상당한 충족되지 않은 요구가 존재한다. 첫 번째로, 현재 치료법은 질환 변형이 아니며 일부 환자에서만 효과적이고, 여전히 엄격한 식이 제한을 필요로 하며, 순응하지 않으면 신경 손상을 유발할 수 있다. 두 번째로, PKU에 대해 승인된 유전자 치료법이 존재하지 않으며, 기존 항체로 인해 환자의 25% 내지 40%는 AAV 기반 치료를 사용할 수 없다. AAV는 한 번만 투여될 수 있으며, 결과적인 PAH 수준은 효과적일 만큼 충분히 높지 않거나, 정상보다 높을 수 있으며, 용량 수준은 적정이 불가하다.
따라서, PKU의 치료를 위해 세포, 조직 또는 대상에서 치료용 PAH 단백질의 발현을 가능하게 하는 기술이 해당 분야에 필요하다.
본원에 기재된 기술은 공유결합으로 폐쇄된 말단을 갖는 캡시드 미함유(예를 들어, 비바이러스성) DNA 벡터(본원에서 "폐쇄형 DNA 벡터" 또는 "ceDNA 벡터"로 지칭됨)(여기서 ceDNA 벡터는 PAH 핵산 서열 또는 이의 코돈 최적화된 버전을 포함함)로부터 효소 페닐알라닌 히드록실라아제(PAH)의 발현에 의한 페닐케톤뇨증(PKU)의 치료 방법 및 이의 치료를 위한 조성물에 관한 것이다. 이러한 ceDNA 벡터는 치료, 모니터링 및 진단을 위한 PAH 단백질의 생산에 사용될 수 있다. PKU의 치료를 위해 PAH를 발현하는 ceDNA 벡터를 대상에게 적용하는 것은, 다음과 같은 측면에서 유용하다: (i) 질환 변형 수준의 PAH 효소를 제공함, (ii) 최소 침습성으로 전달이 이루어짐, (iii) 반복 가능하고 용량 반응성임, (iv) 치료 효과의 개시가 신속함, (v) 간에서 교정 PAH 효소의 발현을 지속시킴, (vi) 페닐알라닌 대사가 기능하도록 요소 회로 기능을 회복시킴, 및/또는 (vii) 결함 효소의 적절한 약리학적 수준이 달성되도록 적정할 수 있음.
따라서, 본원에 기재된 발명은 세포에서 PAH 치료 단백질의 발현을 가능하게 하는, PAH를 인코딩하는 이종 유전자를 포함하는 공유결합으로 폐쇄된 말단을 갖는 캡시드 미함유(예를 들어, 비바이러스성) DNA 벡터(본원에서 "폐쇄형 DNA 벡터" 또는 "ceDNA 벡터"로 지칭됨)에 관한 것이다.
하나의 양태에서, 플랭킹(flanking) 역말단반복서열(ITR: inverted terminal repeat) 사이에 적어도 하나의 이종 뉴클레오타이드 서열을 포함하는 폐쇄형 DNA(ceDNA) 벡터로서, 여기서 적어도 하나의 이종 뉴클레오타이드 서열은 적어도 하나의 PAH 단백질을 인코딩하고, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 이종 뉴클레오타이드 서열은 표 1의 서열 중 임의의 것과 적어도 90%의 동일성을 갖는 서열에서 선택되는 것인 ceDNA 벡터가 본원에 개시된다. 하나의 구현예에서, ceDNA 벡터는 캡시드 미함유 벡터이다. 하나의 구현예에서, 표 1의 서열은 서열번호 380, 서열번호 381, 서열번호 382, 서열번호 383, 서열번호 384, 서열번호 385, 서열번호 386, 서열번호 387, 서열번호 388, 서열번호 389, 서열번호 390, 서열번호 391, 서열번호 392, 서열번호 393 및 서열번호 394로 이루어지는 군에서 선택된다.
하나의 구현예에서, 이종 뉴클레오타이드 서열은 서열번호 392와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성을 갖는다. 하나의 구현예에서, 이종 뉴클레오타이드 서열은 서열번호 84와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성을 갖는다. 하나의 구현예에서, 이종 뉴클레오타이드 서열은 서열번호 394와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성을 갖는다.
본원에 기재된 바와 같은 PAH 단백질 생산의 발현을 위한 ceDNA 벡터는 공유결합으로 폐쇄된 말단을 갖는 상보적 DNA의 연속 가닥으로부터 형성된 캡시드 미함유 선형 이중체 DNA 분자(선형, 연속 및 비캡시드화된 구조)로서, 이는 5' 역말단반복(ITR) 서열과 3' ITR 서열을 포함하며, 여기서 5' ITR과 3' ITR은 서로에 대해 동일한 대칭인 3차원 구성을 가질 수 있거나(즉, 대칭 또는 실질적으로 대칭임), 또는 대안적으로, 5' ITR과 3' ITR은 서로에 대해 상이한 3차원 구성을 가질 수 있다(즉, 비대칭인 ITR). 또한, ITR은 동일하거나 상이한 혈청형에서 유래한 것일 수 있다. 일부 구현예에서, ceDNA 벡터는 기하학적 공간에서의 구조가 동일한 형상이 되도록 대칭인 3차원 공간 구성을 갖거나, 3D 공간에서 동일한 A, C-C' 및 B-B' 루프를 갖는 ITR 서열을 포함할 수 있다(즉, 이들은 동일하거나 서로에 대해 거울상임). 일부 구현예에서, 하나의 ITR은 하나의 AAV 혈청형에서 유래할 수 있고, 다른 하나의 ITR은 상이한 AAV 혈청형에서 유래할 수 있다.
따라서, 본원에 기재된 기술의 일부 양태는 상기 기재된 PAH 단백질의 개선된 단백질 발현 및/또는 생산을 위한 ceDNA 벡터로서, 표 5에 개시된 임의의 PAH 핵산 서열을 포함하는 이종 핵산 서열이 플랭킹된 ITR 서열을 포함하며, 여기서 ITR 서열은 (i) 적어도 하나의 WT ITR과 적어도 하나의 변형된 AAV 역말단반복서열(ITR)(예를 들어, 비대칭인 변형된 ITR); (ii) 2개의 변형된 ITR(여기서 mod-ITR 쌍은 서로에 대해 상이한 3차원 공간 구성을 가짐)(예를 들어, 비대칭인 변형된 ITR), 또는 (iii) 대칭 또는 실질적으로 대칭인 WT-WT ITR 쌍(여기서 각각의 WT-ITR은 동일한 3차원 공간 구성을 가짐), 또는 (iv) 대칭 또는 실질적으로 대칭인 변형된 ITR 쌍(여기서 각각의 mod-ITR은 동일한 3차원 공간 구성을 가짐) 중 임의의 것에서 선택되는 것인 ceDNA 벡터에 관한 것이다. 본원에 개시된 ceDNA 벡터는 진핵세포에서 생산될 수 있기 때문에, 곤충 세포에서 원핵세포 DNA 변형 및 박테리아 내독소 오염이 없다.
본원에 기재된 방법 및 조성물은, 부분적으로, 비제한적으로 간의 세포를 포함하는 세포에서 적어도 하나의 PAH 단백질 또는 하나 초과의 PAH 단백질을 발현시키는 데 사용될 수 있는, 공유결합으로 폐쇄된 말단을 갖는 비바이러스성 캡시드 미함유 DNA 벡터(ceDNA 벡터)의 발견에 관한 것이다.
따라서, 하나의 양태에서, 2개의 상이한 AAV 역말단반복서열(ITR) 사이에 배치된 프로모터에 작동 가능하게 연결된 PAH 단백질을 인코딩하는 적어도 하나의 전이유전자를 인코딩하는 적어도 하나의 이종 핵산 서열을 포함하는 DNA 벡터(예를 들어, ceDNA 벡터)로서, 여기서 ITR 중 하나는 기능성 AAV 말단 분해 부위와 Rep 결합 부위를 포함하고, ITR 중 하나는 다른 하나의 ITR에 비해 결실, 삽입 또는 치환을 포함하며; 여기서 전이유전자는 PAH 단백질을 인코딩하고; DNA 벡터에서 단일 인식 부위를 갖는 제한 효소로 소화될 때, DNA는, 미변성 겔 상에서 분석 시, 선형 및 비연속 DNA 대조군과 비교하여 선형 및 연속 DNA의 특징적인 밴드의 존재를 갖는 DNA 벡터(예를 들어, ceDNA 벡터)가 본원에 제공된다. 하나의 양태는 본원에 기재된 바와 같은 ceDNA 벡터로부터 생체내에서 PAH 단백질을 발현시켜 PAH 단백질을 전달하는 것, 나아가, PAH를 인코딩하는 ceDNA 벡터를 사용하여 페닐케톤뇨증(PKU)을 치료하는 것을 포함한다. 또한, 본원에 기재된 바와 같은 PAH를 인코딩하는 ceDNA 벡터를 포함하는 세포가 본원에서 고려된다. 일부 구현예에 따르면, ceDNA 벡터는 서열번호 192와 85% 동일한 핵산 서열을 포함한다. 일부 구현예에 따르면, ceDNA 벡터는 서열번호 192와 90% 동일한 핵산 서열을 포함한다. 일부 구현예에 따르면, ceDNA 벡터는 서열번호 192와 95% 동일한 핵산 서열을 포함한다. 일부 구현예에 따르면, ceDNA 벡터는 서열번호 192와 96% 동일한 핵산 서열을 포함한다. 일부 구현예에 따르면, ceDNA 벡터는 서열번호 192와 97% 동일한 핵산 서열을 포함한다. 일부 구현예에 따르면, ceDNA 벡터는 서열번호 192와 98% 동일한 핵산 서열을 포함한다. 일부 구현예에 따르면, ceDNA 벡터는 서열번호 192와 99% 동일한 핵산 서열을 포함한다. 일부 구현예에 따르면, ceDNA 벡터는 서열번호 192로 이루어져 있다. 일부 구현예에 따르면, ceDNA 벡터는 서열번호 194와 85% 동일한 핵산 서열을 포함한다. 일부 구현예에 따르면, ceDNA 벡터는 서열번호 194와 90% 동일한 핵산 서열을 포함한다. 일부 구현예에 따르면, ceDNA 벡터는 서열번호 194와 95% 동일한 핵산 서열을 포함한다. 일부 구현예에 따르면, ceDNA 벡터는 서열번호 194와 96% 동일한 핵산 서열을 포함한다. 일부 구현예에 따르면, ceDNA 벡터는 서열번호 194와 97% 동일한 핵산 서열을 포함한다. 일부 구현예에 따르면, ceDNA 벡터는 서열번호 194와 98% 동일한 핵산 서열을 포함한다. 일부 구현예에 따르면, ceDNA 벡터는 서열번호 194와 99% 동일한 핵산 서열을 포함한다. 일부 구현예에 따르면, ceDNA 벡터는 서열번호 194로 이루어져 있다.
본 발명의 양태는 본원에 기재된 바와 같은 세포에서 PAH 단백질 발현에 유용한 ceDNA 벡터를 생산하는 방법에 관한 것이다. 하나의 구현예는 본원에 제공된 방법으로 생산된 ceDNA 벡터에 관한 것이다. 하나의 구현예에서, PAH 단백질 생산을 위한 캡시드 미함유(예를 들어, 비바이러스성) DNA 벡터(ceDNA 벡터)는, 첫 번째 5' 역말단반복서열(예를 들어, AAV ITR); 이종 핵산 서열; 및 3' ITR(예를 들어, AAV ITR)을 이러한 순서대로 포함하는 폴리뉴클레오타이드 발현 구조체 주형을 포함하는 플라스미드(본원에서 "ceDNA-플라스미드"로 지칭됨)로부터 수득되며, 여기서 5' ITR과 3'ITR은 서로 비대칭일 수 있거나, 본원에 기재된 바와 같이 대칭(예를 들어, WT-ITR 또는 변형된 대칭인 ITR)일 수 있다.
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, 본 개시내용을 읽은 후 당업자가 이해하게 되는 다수의 수단에 의해 수득 가능하다. 예를 들어, 본 발명의 ceDNA 벡터를 생성하는 데 사용되는 폴리뉴클레오타이드 발현 구조체 주형은 ceDNA-플라스미드, ceDNA-박미드 및/또는 ceDNA-바큐로바이러스일 수 있다. 하나의 구현예에서, ceDNA-플라스미드는 ITR 사이에 작동 가능하게 배치된 제한 클로닝 부위(예를 들어, 서열번호 123 및/또는 서열번호 124)를 포함하며, 여기에, 예를 들어 전이유전자에 작동적으로 연결된 프로모터를 포함하는 발현 카세트, 예를 들어 PAH를 인코딩하는 핵산이 삽입될 수 있다. 일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 대칭 또는 비대칭인 ITR(변형된 또는 WT ITR)을 함유하는 폴리뉴클레오타이드 주형(예를 들어, ceDNA-플라스미드, ceDNA-박미드, ceDNA-바큐로바이러스)으로부터 생산된다.
허용(permissive) 숙주세포에서, 예를 들어 Rep의 존재 하에서, 적어도 2개의 ITR을 갖는 폴리뉴클레오타이드 주형을 복제하여 PAH 단백질을 발현하는 ceDNA 벡터를 생산한다. ceDNA 벡터 생산은 다음과 같은 2단계를 거친다: 첫 번째로, Rep 단백질을 통한 주형 백본(예를 들어, ceDNA-플라스미드, ceDNA-박미드, ceDNA-바큐로바이러스 게놈 등)으로부터의 주형의 절제("회수") 단계, 및 두 번째로, 절제된 ceDNA 벡터의 Rep 매개 복제 단계. 다양한 AAV 혈청형의 Rep 단백질 및 Rep 결합 부위는 당업자에게 널리 공지되어 있다. 당업자는 적어도 하나의 기능성 ITR에 기반하여 핵산 서열에 결합하고 이를 복제하는 혈청형에서 Rep 단백질을 선택하는 것을 이해한다. 예를 들어, 복제 가능한 ITR이 AAV 혈청형 2에서 유래하는 경우, 상응하는 Rep는 AAV2 또는 AAV4 Rep을 갖는 AAV2 ITR과 같은 해당 혈청형과는 함께 작동하지만, AAV5 Rep과는 함께 작동하지 않는 AAV 혈청형에서 유래할 수 있다. 복제 시, 공유결합으로 폐쇄된 말단을 갖는 ceDNA 벡터는 허용 세포에 계속 축적되고, ceDNA 벡터는 바람직하게는 표준 복제 조건 하 Rep 단백질 존재 하에서 시간의 경과에 따라 충분히 안정하여, 예를 들어 적어도 1 pg/세포, 바람직하게는 적어도 2 pg/세포, 바람직하게는 적어도 3 pg/세포, 더욱 바람직하게는 적어도 4 pg/세포, 보다 더욱 바람직하게는 적어도 5 pg/세포의 양으로 축적된다.
따라서, 본 발명의 하나의 양태는, 하기 단계를 포함하는, 상기와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 생산 방법에 관한 것이다: a) 바이러스 캡시드 코딩 서열이 없는 폴리뉴클레오타이드 발현 구조체 주형(예를 들어, ceDNA-플라스미드, ceDNA-박미드 및/또는 ceDNA-바큐로바이러스)을 보유하는 숙주세포(예를 들어, 곤충 세포) 집단을, Rep 단백질의 존재 하에서, 숙주세포 내에서 ceDNA 벡터의 생산을 유도하는 데 효과적인 조건 하에서 충분한 시간 동안 인큐베이션하는 단계로서, 여기서 숙주세포는 바이러스 캡시드 코딩 서열을 포함하지 않는 단계; 및 b) 숙주세포에서 ceDNA 벡터를 수거하고 단리하는 단계. Rep 단백질의 존재는 변형된 ITR을 갖는 벡터 폴리뉴클레오타이드의 복제를 유도하여, 숙주세포에서 PAH 단백질의 발현을 위한 ceDNA 벡터를 생산한다. 하지만, 바이러스 입자(예를 들어, AAV 비리온)는 발현되지 않는다. 따라서, 비리온으로 인한 크기 제한이 없다.
숙주세포에서 단리된 PAH 단백질의 발현에 유용한 ceDNA 벡터의 존재는, 숙주세포에서 단리된 DNA를 ceDNA 벡터에서 단일 인식 부위를 갖는 제한 효소로 소화시키고, 변성 및 미변성 겔 상에서 소화된 DNA 물질을 분석하여, 선형 및 비연속 DNA와 비교하여 선형 및 연속 DNA의 특징적인 밴드의 존재를 확인하는 방식으로 확인될 수 있다.
또한, 세포 또는 대상에서 ceDNA 벡터를 사용하여, 치료적 용도를 갖는 PAH 단백질을 발현시키는 방법이 본원에 제공된다. 이러한 PAH 단백질은 페닐케톤뇨증(PKU)의 치료에 사용될 수 있다. 따라서, 치료용 PAH 단백질을 인코딩하는 ceDNA 벡터를 이를 필요로 하는 대상에게 투여하는 것을 포함하는, 페닐케톤뇨증(PKU)의 치료 방법이 본원에 제공된다. 일부 구현예에 따르면, 대상은 투여 전 대상의 혈청 페닐알라닌 수준과 비교하여 혈청 페닐알라닌 수준에서 적어도 약 50%의 감소를 나타낸다. 일부 구현예에 따르면, 대상은 혈청 페닐알라닌 수준의 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90% 또는 적어도 약 95% 감소를 나타낸다. 일부 구현예에 따르면, 대상의 혈청 페닐알라닌 수준은 투여 후 약 1500 uM 미만이다. 일부 구현예에 따르면, 대상의 혈청 페닐알라닌 수준은 투여 후 1500 mM 미만, 1250 mM 미만, 1000 mM 미만, 750 mM 미만, 500 mM 미만, 400 mM 미만, 300 mM 미만, 250 mM 미만, 200 mM 미만, 100 mM 미만, 50 mM 미만이다. 일부 구현예에 따르면, 대상은 투여 전 PAH 활성 수준과 비교하여 투여 후 PAH 활성에서 적어도 약 10%의 증가를 나타낸다. 일부 구현예에 따르면, 대상은 투여 전 PAH 활성 수준과 비교하여 투여 후 PAH 활성 수준에서 적어도 약 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50% 또는 55%의 증가를 나타낸다.
일부 구현예에서, 본원에 기재된 기술의 하나의 양태는 공유결합으로 폐쇄된 말단을 갖는 비바이러스성 캡시드 미함유 DNA 벡터(ceDNA 벡터)로서, 여기서 ceDNA 벡터는 2개의 역말단반복서열 사이에 작동적으로 배치된 적어도 하나의 이종 뉴클레오타이드 서열을 포함하고, 여기서 ITR 서열은 비대칭, 또는 대칭, 또는 실질적으로 대칭일 수 있고(이러한 용어는 본원에 정의된 바와 같음), ITR 중 적어도 하나는 기능성 말단 분해 부위와 Rep 결합 부위를 포함하고, 선택적으로 이종 핵산 서열은 전이유전자(예를 들어, PAH 단백질)를 인코딩하고, 벡터는 바이러스 캡시드 내에 있지 않은 ceDNA 벡터에 관한 것이다.
본 발명의 이러한 및 다른 양태는 하기에 보다 상세하게 기재되어 있다.
상기 간략하게 개략되어 있고 하기 보다 상세하게 논의되는 본 개시내용의 구현예는, 첨부된 도면에 도시된 본 개시내용의 예시적인 구현예를 참조로 이해될 수 있다. 하지만, 첨부된 도면은 본 개시내용의 단지 전형적인 구현예를 예시하는 것으로, 본 개시내용의 범위를 제한하는 것으로 간주되어서는 안 되며, 본 개시내용은 다른 동등하게 효과적인 구현예를 허용할 수 있다.
도 1a는, 비대칭인 ITR을 포함하는 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 예시적인 구조를 예시한다. 이러한 구현예에서, 예시적인 ceDNA 벡터는 CAG 프로모터, WPRE 및 BGHpA를 함유하는 발현 카세트를 포함한다. PAH 전이유전자를 인코딩하는 오픈리딩프레임(ORF)은 CAG 프로모터와 WPRE 사이에 있는 클로닝 부위(R3/R4)에 삽입될 수 있다. 발현 카세트에는 2개의 역말단반복서열(ITR), 즉, 발현 카세트의 업스트림(5'-말단)에 있는 야생형 AAV2 ITR과 발현 카세트의 다운스트림(3'-말단)에 있는 변형된 ITR이 플랭킹되어 있으므로, 발현 카세트를 플랭킹하는 2개의 ITR은 서로에 대해 비대칭이다.
도 1b는, CAG 프로모터, WPRE 및 BGHpA를 함유하는 발현 카세트를 갖는, 비대칭인 ITR을 포함하는 본원에 개시된 바와 같은 PAH의 발현을 위한 ceDNA 벡터의 예시적인 구조를 예시한다. PAH 전이유전자를 인코딩하는 오픈리딩프레임(ORF)은 CAG 프로모터와 WPRE 사이에 있는 클로닝 부위에 삽입될 수 있다. 발현 카세트에는 2개의 역말단반복서열(ITR), 즉, 발현 카세트의 업스트림(5'-말단)에 있는 변형된 ITR과 발현 카세트의 다운스트림(3'-말단)에 있는 야생형 ITR이 플랭킹되어 있다.
도 1c는, 인핸서/프로모터, PAH 전이유전자, 전사 후 요소(WPRE) 및 polyA 신호를 함유하는 발현 카세트를 갖는, 비대칭인 ITR을 포함하는 본원에 개시된 바와 같은 PAH의 발현을 위한 ceDNA 벡터의 예시적인 구조를 예시한다. 오픈리딩프레임(ORF)은 CAG 프로모터와 WPRE 사이에 있는 클로닝 부위에의 PAH 전이유전자의 삽입을 가능하게 한다. 발현 카세트에는 서로에 대해 비대칭인 2개의 역말단반복서열(ITR), 즉, 발현 카세트의 업스트림(5'-말단)에 있는 변형된 ITR과 발현 카세트의 다운스트림(3'-말단)에 있는 변형된 ITR이 플랭킹되어 있으며, 여기서 5' ITR과 3' ITR은 모두 변형된 ITR이지만, 상이한 변형을 갖는다(즉, 이들은 동일한 변형을 갖지 않음).
도 1d는, CAG 프로모터, WPRE 및 BGHpA를 함유하는 발현 카세트를 갖는, 본원에 정의된 바와 같은 대칭인 변형된 ITR 또는 실질적으로 대칭인 변형된 ITR을 포함하는 본원에 개시된 바와 같은 PAH의 발현을 위한 ceDNA 벡터의 예시적인 구조를 예시한다. PAH 전이유전자를 인코딩하는 오픈리딩프레임(ORF)은 CAG 프로모터와 WPRE 사이에 있는 클로닝 부위에 삽입된다. 발현 카세트에는 2개의 변형된 역말단반복서열(ITR)이 플랭킹되어 있으며, 여기서 5' 변형된 ITR과 3' 변형된 ITR은 대칭이거나 실질적으로 대칭이다.
도 1e는, 인핸서/프로모터, 전이유전자, 전사 후 요소(WPRE) 및 polyA 신호를 함유하는 발현 카세트를 갖는, 본원에 정의된 바와 같은 대칭인 변형된 ITR 또는 실질적으로 대칭인 변형된 ITR을 포함하는 본원에 개시된 바와 같은 PAH의 발현을 위한 ceDNA 벡터의 예시적인 구조를 예시한다. 오픈리딩프레임(ORF)은 CAG 프로모터와 WPRE 사이에 있는 클로닝 부위에의 전이유전자(예를 들어, PAH)의 삽입을 가능하게 한다. 발현 카세트에는 2개의 변형된 역말단반복서열(ITR)이 플랭킹되어 있으며, 여기서 5' 변형된 ITR과 3' 변형된 ITR은 대칭이거나 실질적으로 대칭이다.
도 1f는, CAG 프로모터, WPRE 및 BGHpA를 함유하는 발현 카세트를 갖는, 본원에 정의된 바와 같은 대칭인 WT-ITR 또는 실질적으로 대칭인 WT-ITR을 포함하는 본원에 개시된 바와 같은 PAH의 발현을 위한 ceDNA 벡터의 예시적인 구조를 예시한다. 전이유전자(예를 들어, PAH)를 인코딩하는 오픈리딩프레임(ORF)은 CAG 프로모터와 WPRE 사이에 있는 클로닝 부위에 삽입된다. 발현 카세트에는 2개의 야생형 역말단반복서열(WT-ITR)이 플랭킹되어 있으며, 여기서 5' WT-ITR과 3' WT-ITR은 대칭이거나 실질적으로 대칭이다.
도 1g는, 인핸서/프로모터, 전이유전자(예를 들어, PAH), 전사 후 요소(WPRE) 및 polyA 신호를 함유하는 발현 카세트를 갖는, 본원에 정의된 바와 같은 대칭인 변형된 ITR 또는 실질적으로 대칭인 변형된 ITR을 포함하는 본원에 개시된 바와 같은 PAH의 발현을 위한 ceDNA 벡터의 예시적인 구조를 예시한다. 오픈리딩프레임(ORF)은 CAG 프로모터와 WPRE 사이에 있는 클로닝 부위에의 전이유전자(예를 들어, PAH)의 삽입을 가능하게 한다. 발현 카세트에는 2개의 야생형 역말단반복서열(WT-ITR)이 플랭킹되어 있으며, 여기서 5' WT-ITR과 3' WT-ITR은 대칭이거나 실질적으로 대칭이다.
도 2a는, A-A' 아암, B-B' 아암, C-C' 아암, 2개의 Rep 결합 부위(RBE 및 RBE')가 확인되는 AAV2의 야생형 좌측 ITR(서열번호 52)의 T-형 스템-루프 구조를 제공하고, 또한 말단 분해 부위(TRS)를 보여준다. RBE는 Rep 78 또는 Rep 68과 상호작용하는 것으로 여겨지는 일련의 4개의 이중체 사량체를 함유한다. 나아가, RBE'는 또한 구조체 내 야생형 ITR 또는 돌연변이된 ITR 상에 어셈블링된 Rep 복합체와 상호작용하는 것으로 여겨진다. D 및 D' 영역은 전사인자 결합 부위와 다른 보존된 구조를 함유한다. 도 2b는, A-A' 아암, B-B' 아암, C-C' 아암, 2개의 Rep 결합 부위(RBE 및 RBE')가 확인되는 AAV2의 야생형 좌측 ITR의 T-형 스템-루프 구조를 포함하는 야생형 좌측 ITR(서열번호 53)에서의 제안된 Rep 촉매화된 닉킹 및 결찰 활성을 보여주고, 또한 말단 분해 부위(TRS), 및 몇몇 전사인자 결합 부위와 다른 보존된 구조를 포함하는 D 및 D' 영역을 보여준다.
도 3a는, 야생형 좌측 AAV2 ITR(서열번호 54)의 A-A' 아암의 RBE 함유 부분과 C-C' 및 B-B' 아암의 1차 구조(폴리뉴클레오타이드 서열)(좌측)와 2차 구조(우측)를 보여준다. 도 3b는, 좌측 ITR에 대한 예시적인 돌연변이된 ITR(변형된 ITR로도 지칭됨) 서열을 보여준다. 예시적인 돌연변이된 좌측 ITR(ITR-1, 좌측)(서열번호 113)의 A-A' 아암의 RBE 부분과 C 아암 및 B-B' 아암의 1차 구조(좌측)와 예측된 2차 구조(우측)가 제시되어 있다. 도 3c는, 야생형 우측 AAV2 ITR(서열번호 55)의 A-A' 루프의 RBE 함유 부분과 B-B' 및 C-C' 아암의 1차 구조(좌측)와 2차 구조(우측)를 보여준다. 도 3d는, 예시적인 우측 변형된 ITR을 보여준다. 예시적인 돌연변이 우측 ITR(ITR-1, 우측)(서열번호 114)의 A-A' 아암의 RBE 함유 부분과 B-B' 및 C 아암의 1차 구조(좌측)와 예측된 2차 구조(우측)가 제시되어 있다. 좌측 및 우측 ITR(예를 들어, AAV2 ITR, 또는 다른 바이러스 혈청형 또는 합성 ITR)의 임의의 조합이 본원에 교시된 바와 같이 사용될 수 있다. 도 3a 내지 도 3d 각각에서, 폴리뉴클레오타이드 서열은 본원에 기재된 바와 같은 ceDNA를 생산하는 데 사용되는 플라스미드 또는 박미드/바큐로바이러스 게놈에 사용된 서열을 나타낸다. 또한, 도 3a 내지 도 3d 각각에는, 플라스미드 또는 박미드/바큐로바이러스 게놈의 ceDNA 벡터 구성 및 예측된 깁스 자유 에너지 값에서 추론된 상응하는 ceDNA 2차 구조가 포함되어 있다.
도 4a는, 도 4b의 개략도에 기재된 공정에서 본원에 개시된 바와 같은 PAH의 발현을 위한 ceDNA 벡터의 생산에 유용한 바큐로바이러스 감염된 곤충 세포(BIIC)를 제조하는 업스트림 공정을 예시하는 개략도이다. 도 4b는 예시적인 ceDNA 생산 방법의 개략도이고, 도 4c는 ceDNA 벡터 생산을 확인하기 위한 생화학적 방법 및 공정을 예시한다. 도 4d도 4e는, 도 4b의 ceDNA 생산 공정 동안 수득된 세포 펠릿에서 수거된 DNA에서 ceDNA의 존재를 식별하는 공정을 설명하는 개략도이다. 도 4d는, 절단되지 않은 채로 유지되거나 제한 엔도뉴클레아제로 소화된 후, 미변성 겔 또는 변성 겔 상에서 전기영동에 적용된 예시적인 ceDNA에 대한 개략적인 예상 밴드를 보여준다. 가장 좌측의 개략도는 미변성 겔이며, 이는 이중체 및 절단되지 않은 형태에서 ceDNA가, 더 빠르게 이동하는 더 작은 단량체와 단량체 크기의 2배인 더 느리게 이동하는 이량체로 보이는, 적어도 단량체와 이량체 상태로 존재함을 시사한다. 좌측에서 두 번째 개략도는, ceDNA가 제한 엔도뉴클레아제로 절단되는 경우, 본래 밴드가 사라지고, 절단 후 남아있는 예상 단편 크기에 상응하는 더 빠르게 이동하는(예를 들어, 더 작은) 밴드가 나타남을 보여준다. 변성 조건 하에서, 본래 이중체 DNA는 단일가닥이며, 이는 상보적 가닥이 공유결합으로 연결되어 있기 때문에, 미변성 겔 상에서 관찰된 것 보다 2배 더 큰 종으로 이동한다. 따라서, 우측에서 두 번째 개략도에서, 소화된 ceDNA는 미변성 겔에서 관찰된 것과 유사한 밴딩 분포를 보여주지만, 밴드는 미변성 겔 대응물의 2배 크기의 단편으로 이동한다. 가장 우측의 개략도는, 변성 조건 하에서 절단되지 않은 ceDNA가 단일가닥 개방형 고리로 이동하기 때문에, 관찰된 밴드는 고리가 개방되지 않은 미변성 조건에서 관찰된 것의 2배 크기임을 보여준다. 이러한 도면에서, "kb"는, 문맥에 따라, 뉴클레오타이드 사슬 길이(예를 들어, 변성 조건에서 관찰된 단일가닥 분자의 경우) 또는 염기쌍의 수(예를 들어, 미변성 조건에서 관찰된 이중가닥 분자의 경우)를 기반으로 뉴클레오타이드 분자의 상대적인 크기를 나타내는 데 사용된다. 도 4e는, 비연속 구조를 갖는 DNA를 보여준다. ceDNA는 ceDNA 벡터 상에 단일 인식 부위를 갖는 제한 엔도뉴클레아제에 의해 절단되어, 중성 및 변성 조건 모두에서 상이한 크기(1 kb 및 2 kb)를 갖는 2개의 DNA 단편을 생성할 수 있다. 도 4e는, 선형 및 연속 구조를 갖는 ceDNA를 또한 보여준다. ceDNA 벡터는 제한 엔도뉴클레아제에 의해 절단되어, 중성 조건에서는 1 kb 및 2 kb로 이동하는 2개의 DNA 단편을 생성할 수 있지만, 변성 조건에서는 가닥이 연결된 채로 유지되어 2 kb 및 4 kb로 이동하는 단일 가닥을 생성할 수 있다.
도 5는, 엔도뉴클레아제로 소화되거나(+) 소화되지 않은(-) ceDNA 벡터의 변성 겔 전개의 예시적인 도면이다(ceDNA 구조체 1 및 2의 경우 EcoRI; ceDNA 구조체 3 및 4의 경우 BamH1; ceDNA 구조체 5 및 6의 경우 SpeI; 및 ceDNA 구조체 7 및 8의 경우 XhoI). 구조체 1 내지 8은 국제 출원 PCT PCT/US18/49996의 실시예 1에 기재되어 있으며, 상기 문헌은 그 전문이 본원에 참조로서 인용된다. 별표로 강조된 밴드의 크기를 결정하고 도면의 하단에 제공하였다.
도 6은 실시예 7에 기재된 실험의 결과를 도시한 것으로, 구체적으로 LNP-polyC 대조군으로 처리된 마우스(가장 좌측에 있는 마우스)와 LNP-ceDNA-루시퍼라아제로 처리된 4마리 마우스(가장 좌측에 있는 마우스를 제외한 나머지 모든 마우스)에서 얻은 IVIS 이미지를 보여준다. 4마리의 ceDNA 처리된 마우스는 마우스의 간 함유 영역에서 유의한 형광을 나타낸다.
도 7은, 실시예 8에 기재된 실험의 결과를 도시한 것이다. 어두운 반점(화살표로 표시됨)은 발현된 ceDNA 전이유전자에서 생성된 단백질의 존재를 나타내며, 이는 투여된 LNP-ceDNA와 간세포의 결합을 입증한다.
도 8a 도 8b는, 실시예 9에 제시된 안구 연구의 결과를 도시한 것이다. 도 8a는, JetPEI®-ceDNA-루시퍼라아제가 주사된 래트의 눈(좌측 상단)과 동일한 래트의 주사되지 않은 눈(우측 상단), 또는 플라스미드-루시퍼라아제 DNA가 주사된 래트의 눈(좌측 하단)과 동일한 래트의 주사되지 않은 눈(우측 하단)의 대표적인 IVIS 이미지를 보여준다. 도 8b는, 각각의 처리군에서 처리된 눈 또는 상응하는 처리되지 않은 눈에서 관찰된 평균 광도의 그래프를 보여준다. ceDNA 처리된 래트는 99일에 걸쳐 장기간 유의한 형광(및 따라서 루시퍼라아제 전이유전자 발현)을 나타냈으며, 이는 플라스미드-루시퍼라아제로 처리된 래트에서 최소량의 상대적 형광(및 따라서 루시퍼라아제 전이유전자 발현)이 관찰되었던 것과 뚜렷한 대조를 이룬다.
도 9a 도 9b는, 실시예 10에 기재된 Rag2 마우스에서의 ceDNA 지속성 및 재투여 연구의 결과를 도시한 것이다. 도 9a는, LNP-ceDNA-Luc 처리된 야생형 c57bl/6 마우스 또는 Rag2 마우스에서 관찰된 시간 경과에 따른 총 플럭스(flux)의 그래프를 보여준다. 도 9b는, Rag2 마우스에서 루시퍼라아제 전이유전자의 발현 수준에 대한 재투여의 영향을 보여주는 그래프를 제공하며, 여기서 재투여 후 안정한 발현의 증가가 관찰되었다(화살표는 재투여 시점을 나타냄).
도 10은, 실시예 11에 기재된 처리된 마우스에서의 ceDNA 루시퍼라아제 발현 연구에서 얻은 데이터를 제공하며, 이는 연구 기간에 걸친 마우스의 각 그룹에서의 총 플럭스를 나타낸다. 높은 수준의 메틸화되지 않은 CpG는 시간 경과에 따라 마우스에서 관찰된 보다 낮은 총 플럭스와 상관관계가 있었지만, 간 특이적 프로모터의 사용은 적어도 77일에 걸친 ceDNA 벡터로부터 전이유전자의 지속적인 안정한 발현과 상관관계가 있었다.
도 11은, 실시예 12에 기재된 실험의 결과를 도시한 그래프이다. PAHenu2 마우스에서 유체역학적 전달에 의한 2개의 ceDNA PAH 구조체(ceDNA#1, ceDNA#2) 각각의 투여는, 대조군(PolyC) 처리된 마우스에서 확인된 것에 비해 혈청 PHE 수준을 유의하게 감소시켰다(약 75% 감소).
도 12는, 실시예 13에 기재된 실험의 결과를 도시한 그래프이다. hPAH Codop2는 반덴드리슈(VandenDriessche, VD) 프로모터에 연결된 코돈 최적화된 버전 2(codop_v2) 인간 PAH 서열을 함유하는 ceDNA를 나타내고; hPAH Codop4는 코돈 최적화되고 CpG 최소화된 인간 PAH 버전 4(codop_CpGmin_v4)에 작동적으로 연결된 VD_프로모터를 함유하는 ceDNA를 나타내고; ceDNA hPAH cDNA는 PAH 결핍 PAHenu2 마우스에서 PHE 교정에 대한 영향에 대해 시험된 변형되지 않은 인간 PAH cDNA를 나타낸다. 도 12는, 시간 경과에 따른 혈청 PHE 수준을 보여준다(대조군 PAHenu2를 기준으로 교정된 PHE %로 표시됨). hPAH Codop2 및 Codop4를 함유하는 ceDNA의 투여는 PHE 혈청 수준을 감소시켰으며, 이는 쥣과 PKU에서 혈중 페닐알라닌 수준을 교정하기에 충분한 PAH 활성을 나타낸다. 교정은 15일의 실험 기간에 걸쳐 안정한 것으로 나타났다.
도 13은, 실시예 14에 기재된 실험의 결과를 도시한 그래프이다. hPAH 코돈 최적화된 버전 2(Codop2)를 함유하는 ceDNA를 저용량, 중간용량 및 고용량으로 투여하였다. 도 13은, 시간 경과에 따른 혈청 PHE 수준(PHE μM)을 보여준다. 저용량 및 중간용량으로의 ceDNA hPAH Codop2의 투여는, 용량 의존적 방식으로 혈청 PHE를 감소시켰다. 특히, 중간용량으로의 ceDNA hPAH Codop2의 투여는 저용량으로의 투여보다 상당히 더 높았다. 교정은 15일의 실험 기간에 걸쳐 안정한 것으로 나타났다. 혈청 PHE 농도는 대조군 동물(비히클-KO)에서 감소되지 않았다.
도 14a는, 실시예 15에 기재된 실험의 결과를 도시한 그래프이다. 3일차 및 7일차에 개별 동물에 대한 ceDNA Codop2의 영향을 조사하였다. 도 14a에 도시된 바와 같이, 3일차까지, Codop2의 투여는 혈청 PHE 수준을 감소시켰으며, 이는 3일차부터 쥣과 PKU에서 혈중 페닐알라닌 수준을 교정하기에 충분한 PAH 활성을 나타낸다.
도 14b는, VD-hPAH Codop2를 함유하는 ceDNA의 주사 후 3일차 및 7일차에 측정된 인간 PAH 효소 활성 및 결과적인 혈청 페닐알라닌 수준을 도시한 그래프이다. 타원형은 7일차에 수집된 무반응군(non-responder)을 나타내며, 도 14a에서의 PHE 교정 결여에 해당한다.
PAH 치료 단백질 또는 이의 단편을 인코딩하는 하나 이상의 핵산을 포함하는 ceDNA 벡터를 사용하여 페닐케톤뇨증(PKU)을 치료하는 방법이 본원에 제공된다. 또한, PAH 단백질을 인코딩하는 하나 이상의 이종 핵산을 포함하는, 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터가 본원에 제공된다. 일부 구현예에서, PAH 단백질의 발현은 치료용 단백질이 이것이 발현되는 세포 외부로 분비되는 것을 포함할 수 있거나, 대안적으로는, 일부 구현예에서, 발현된 PAH 단백질은 이것이 발현되는 세포 내에서 작용하거나 기능할 수 있다(예를 들어, 이의 효과를 발휘함). 일부 구현예에서, ceDNA 벡터는 대상의 간, 근육(예를 들어, 골격근), 또는 PAH 치료 단백질 생산 및 다수의 전신 구획으로의 분비를 위한 데포로서 작용할 수 있는 다른 신체 부위에서 PAH 단백질을 발현시킨다.
I. 정의
본원에서 달리 정의되지 않는 한, 본 출원과 관련하여 사용된 과학 및 기술 용어는 본 개시내용이 속하는 당업자가 통상적으로 이해하는 의미를 가질 것이다. 본 발명이 본원에 기재된 특정 방법론, 프로토콜 및 시약 등에 제한되지 않고, 달라질 수 있다는 것을 이해해야 한다. 본원에 사용된 용어는 단지 특정 구현예를 설명하기 위한 목적이며, 청구범위에 의해서만 한정되는 본 발명의 범위를 제한하고자 하는 것이 아니다. 면역학 및 분자생물학에서의 상용 용어 정의는, 하기 문헌에서 확인할 수 있다: 문헌[The Merck Manual of Diagnosis and Therapy, 19th Edition, Merck Sharp & Dohme Corp., 2011 (ISBN 978-0-911910-19-3)]; 문헌[Robert S. Porter et al. (eds.), Fields Virology, 6th Edition, Lippincott Williams & Wilkins, Philadelphia, PA, USA (2013)]; 문헌[Knipe, D.M. and Howley, P.M. (ed.), The Encyclopedia of Molecular Cell Biology and Molecular Medicine, Blackwell Science Ltd., 1999-2012 (ISBN 9783527600908)]; 문헌[Robert A. Meyers (ed.), Molecular Biology and Biotechnology: a Comprehensive Desk Reference, VCH Publishers, Inc., 1995 (ISBN 1-56081-569-8)]; 문헌[Immunology by Werner Luttmann, Elsevier, 2006]; 문헌[Janeway's Immunobiology, Kenneth Murphy, Allan Mowat, Casey Weaver (eds.), Taylor & Francis Limited, 2014 (ISBN 0815345305, 9780815345305)]; 문헌[Lewin's Genes XI, Jones & Bartlett Publishers, 2014 (ISBN-1449659055)]; 문헌[Michael Richard Green and Joseph Sambrook, Molecular Cloning: A Laboratory Manual, 4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., USA (2012) (ISBN 1936113414)]; 문헌[Davis et al., Basic Methods in Molecular Biology, Elsevier Science Publishing, Inc., New York, USA (2012) (ISBN 044460149X)]; 문헌[Laboratory Methods in Enzymology: DNA, Jon Lorsch (ed.) Elsevier, 2013 (ISBN 0124199542)]; 문헌[Current Protocols in Molecular Biology (CPMB), Frederick M. Ausubel (ed.), John Wiley and Sons, 2014 (ISBN 047150338X, 9780471503385)]; 문헌[Current Protocols in Protein Science (CPPS), John E. Coligan (ed.), John Wiley and Sons, Inc., 2005]; 및 문헌[Current Protocols in Immunology (CPI), John E. Coligan, ADA M Kruisbeek, David H Margulies, Ethan M Shevach, Warren Strobe, (eds.) John Wiley and Sons, Inc., 2003 (ISBN 0471142735, 9780471142737)](상기 문헌들의 내용은 모두 그 전문이 본원에 참조로서 인용됨).
본원에 사용된 "투여", "투여하는"이라는 용어 및 이의 변형은, 대상에게 조성물 또는 작용제(예를 들어, 본원에 기재된 바와 같은 치료 핵산 또는 면역억제제)를 도입하는 것을 나타내며, 하나 이상의 조성물 또는 작용제의 동시 및 순차적 도입을 포함한다. "투여"는, 예를 들어 치료, 약동학, 진단, 연구, 위약 및 실험 방법을 나타낼 수 있다. "투여"는 또한 시험관내생체외 처리를 포함한다. 대상으로의 조성물 또는 작용제의 도입은, 경구, 폐, 비강, 비경구(정맥내, 근육내, 복강내 또는 피하), 직장, 림프내, 종양내 또는 국소를 포함하는 임의의 적합한 경로로 이루어져 있다. 대상으로의 조성물 또는 작용제의 도입은 전기천공을 통해 이루어진다. 투여는 자가 투여와 다른 이에 의한 투여를 포함한다. 투여는 임의의 적합한 경로로 수행될 수 있다. 적합한 투여 경로는 조성물 또는 작용제가 이의 의도된 기능을 수행하는 것을 가능하게 한다. 예를 들어, 적합한 경로가 정맥내인 경우, 조성물은 조성물 또는 작용제를 대상의 정맥에 도입하는 방식으로 투여된다.
본원에 사용된 "핵산 치료제", "치료용 핵산" 및 "TNA"라는 구절은 상호교환적으로 사용되며, 질환 또는 장애를 치료하기 위한 치료제의 활성 성분으로서 핵산을 사용하는 임의의 치료 양식을 나타낸다. 본원에 사용된 이러한 구절은 RNA 기반 치료제와 DNA 기반 치료제를 나타낸다. RNA 기반 치료제의 비제한적인 예에는, mRNA, 안티센스 RNA 및 올리고뉴클레오타이드, 리보자임, 압타머, 간섭 RNA(RNAi), 다이서-기질 dsRNA, 소형 헤어핀 RNA(shRNA), 비대칭 간섭 RNA(aiRNA), 마이크로RNA(miRNA)가 포함된다. DNA 기반 치료제의 비제한적인 예에는, 미니서클 DNA, 미니유전자, 바이러스성 DNA(예를 들어, 렌티바이러스 또는 AAV 게놈) 또는 비바이러스성 합성 DNA 벡터, 폐쇄형 선형 이중체 DNA(ceDNA/CELiD), 플라스미드, 박미드, 개뼈형(dbDNA™) DNA 벡터, 최소한으로 면역학적으로 정의된 유전자 발현(MIDGE) 벡터, 비바이러스성 미니스트링 DNA 벡터(선형의 공유결합으로 폐쇄된 DNA 벡터) 또는 덤벨형 DNA 최소 벡터("덤벨 DNA")가 포함된다.
본원에 사용된 PAH 치료 단백질 또는 이의 단편과 같은 치료제의 "유효량" 또는 "치료적 유효량"이란, 목적하는 효과를 생성하는 데 충분한 양, 예를 들어 질환 변형 수준의 PAH 효소를 제공하고, 간에서 교정 PAH 효소의 발현을 지속시키고, 페닐알라닌 대사가 기능하도록 요소 회로 기능을 회복시키고/시키거나 결함 효소의 적절한 약리학적 수준을 달성하는 데 충분한 양이다. 표적 유전자 또는 표적 서열의 발현을 측정하는 데 적합한 검정에는, 예를 들어 도트 블롯(dot blot), 노던 블롯(northern blot), 제자리 혼성화, ELISA, 면역침강, 효소 기능과 같은 당업자에게 공지된 기술뿐 아니라, 당업자에게 공지된 표현형 검정을 사용하는 단백질 또는 RNA 수준의 검사가 포함된다. 하지만, 투여량 수준은 질환의 유형, 환자의 연령, 체중, 성별 및 의학적 상태, 병태의 중증도, 투여 경로, 및 이용되는 특정 활성제를 포함하는 다양한 인자를 기반으로 한다. 따라서, 투여 요법은 광범위하게 달라질 수 있으나, 의사가 표준 방법을 사용하여 통상적으로 결정할 수 있다. 또한, "치료량", "치료적 유효량" 및 "약학적 유효량"이라는 용어는, 상기 기재된 발명의 조성물의 예방적 또는 예방용 양을 포함한다. 상기 기재된 발명의 예방적 또는 예방용 적용에서, 약학적 조성물 또는 약제는 질환, 장애 또는 병태에 걸리기 쉽거나 다르게는 이의 위험이 있는 환자에게, 질환, 장애 또는 병태, 이의 합병증, 및 질환, 장애 또는 병태의 발달 동안 나타나는 중간 병리학적 표현형의 생화학적, 조직학적 및/또는 거동적 증상을 포함하는, 질환, 장애 또는 병태의 위험을 제거 또는 감소시키거나, 이의 중증도를 감소시키거나, 또는 이의 발병을 지연시키는 데 충분한 양으로 투여된다. 최대 용량, 즉, 일부 의학적 판단에 따라 가장 안전한 용량이 사용되는 것이 일반적으로 바람직하다. 일부 구현예에 따르면, 질환, 장애 또는 병태는 PKU이다. "용량" 및 "투여량"이라는 용어는 본원에서 상호교환적으로 사용된다.
본원에 사용된 "치료 효과"라는 용어는, 바람직하고 유익한 것으로 판단되는 치료 결과를 나타낸다. 치료 효과는, 직접적으로 또는 간접적으로, 질환 발현의 억제, 감소 또는 제거를 포함할 수 있다. 치료 효과는 또한, 직접적으로 또는 간접적으로, 질환 발현 진행의 억제, 감소 또는 제거를 포함할 수 있다.
본원에 기재된 임의의 치료제의 경우, 치료적 유효량은 초기에 예비 시험관내 연구 및/또는 동물 모델에서 결정될 수 있다. 치료적 유효 용량은 또한 인간 데이터로부터 결정될 수 있다. 적용되는 용량은 투여된 화합물의 상대적인 생체이용률 및 효능을 기반으로 조정될 수 있다. 상기 기재된 방법 및 다른 널리 공지된 방법을 기반으로 최대 효능을 달성하기 위해 용량을 조정하는 것은, 당업자의 능력에 속한다. 문헌[Goodman and Gilman's The Pharmacological Basis of Therapeutics, 10th Edition, McGraw-Hill (New York) (2001)](이는 본원에 참조로서 인용됨)의 챕터 1에서 확인할 수 있는 치료 효과를 결정하는 일반 원리가 하기에 요약되어 있다.
약동학적 원리는, 허용 가능하지 않은 부작용을 최소화하면서 목적하는 정도의 치료 효능을 얻기 위해 투여 요법을 변경하는 기반을 제공한다. 약물의 혈장 농도가 측정될 수 있고 이것이 치료 범위와 관련이 있는 상황에서, 투여량 변경을 위한 추가 지침을 얻을 수 있다.
본원에 사용된 "이종 뉴클레오타이드 서열" 및 "전이유전자"라는 용어는 상호교환적으로 사용되며, 본원에 개시된 바와 같은 ceDNA 벡터에 혼입되고, 이에 의해 전달 및 발현될 수 있는 (캡시드 폴리펩타이드를 인코딩하는 핵산 이외의) 관심 핵산을 나타낸다.
본원에 사용된 "발현 카세트" 및 "전사 카세트"라는 용어는 상호교환적으로 사용되며, 하나 이상의 프로모터, 또는 전이유전자의 전사를 지시하는 데 충분한 다른 조절 서열에 작동 가능하게 연결되어 있는 전이유전자를 포함하지만, 캡시드 인코딩 서열, 다른 벡터 서열 또는 역말단반복 영역을 포함하지 않는 핵산의 선형 스트레치를 나타낸다. 발현 카세트는 하나 이상의 시스-작용 서열(예를 들어, 프로모터, 인핸서 또는 억제인자), 하나 이상의 인트론 및 하나 이상의 전사 후 조절 요소를 추가로 포함할 수 있다.
본원에서 상호 교환적으로 사용되는 "폴리뉴클레오타이드" 및 "핵산"이라는 용어는, 임의의 길이의 뉴클레오타이드, 리보뉴클레오타이드 또는 데옥시리보뉴클레오타이드의 중합체 형태를 나타낸다. 따라서, 이러한 용어에는, 단일가닥, 이중가닥 또는 다중가닥 DNA 또는 RNA, 게놈 DNA, cDNA, DNA-RNA 혼성체, 또는 퓨린 및 피리미딘 염기, 또는 다른 천연, 화학적 또는 생화학적으로 변형된, 비천연 또는 유도체화된 뉴클레오타이드 염기를 포함하는 중합체가 포함된다. "올리고뉴클레오타이드"는 일반적으로 단일가닥 또는 이중가닥 DNA의 약 5개 내지 약 100개 뉴클레오타이드의 폴리뉴클레오타이드를 나타낸다. 하지만, 본 개시내용을 목적을 위해, 올리고뉴클레오타이드의 길이에는 상한이 없다. 올리고뉴클레오타이드는 "올리고머" 또는 "올리고"로도 공지되어 있으며, 유전자에서 단리되거나, 당업계에 공지된 방법에 따라 화학적으로 합성될 수 있다. "폴리뉴클레오타이드" 및 "핵산"이라는 용어는, 기재되는 구현예에 적용되는 바에 따라, 단일가닥(예컨대 센스 및 안티센스) 및 이중가닥 폴리뉴클레오타이드를 포함한다는 것을 이해해야 한다. DNA는, 예를 들어 안티센스 분자, 플라스미드 DNA, DNA-DNA 이중체, 사전 축합된 DNA, PCR 산물, 벡터(P1, PAC, BAC, YAC, 인공 염색체), 발현 카세트, 키메라 서열, 염색체 DNA, 또는 이러한 그룹의 유도체 및 조합의 형태일 수 있다. DNA는 미니서클, 플라스미드, 박미드, 미니유전자, 미니스트링 DNA(선형의 공유결합으로 폐쇄된 DNA 벡터), 폐쇄형 선형 이중체 DNA(CELiD 또는 ceDNA), 개뼈형(dbDNA™) DNA, 덤벨형 DNA, 최소한으로 면역학적으로 정의된 유전자 발현(MIDGE) 벡터, 바이러스성 벡터 또는 비바이러스성 벡터의 형태일 수 있다. RNA는 소형 간섭 RNA(siRNA), 다이서-기질(Dicer-substrate) dsRNA, 소형 헤어핀 RNA(shRNA), 비대칭 간섭 RNA(aiRNA), 마이크로RNA(miRNA), mRNA, rRNA, tRNA, 바이러스성 RNA(vRNA) 및 이들의 조합의 형태일 수 있다. 핵산에는, 합성, 자연 발생 및 비자연 발생이고, 참조 핵산과 유사한 결합 특성을 갖는, 공지된 뉴클레오타이드 유사체, 또는 변형된 백본 잔기 또는 연결을 함유하는 핵산이 포함된다. 이러한 유사체 및/또는 변형된 잔기의 예에는, 비제한적으로, 포스포로티오에이트, 포스포로디아미데이트 모르폴리노 올리고머(모르폴리노), 포스포르아미데이트, 메틸 포스포네이트, 키랄-메틸 포스포네이트, 2'-O-메틸 리보뉴클레오타이드, 잠금 핵산(LNA™) 및 펩타이드 핵산(PNA)이 포함된다. 구체적으로 제한되지 않는 한, 상기 용어는 참조 핵산과 유사한 결합 특성을 갖는 천연 뉴클레오타이드의 공지된 유사체를 함유하는 핵산을 포함한다. 달리 지시되지 않는 한, 특정 핵산 서열은 또한 이의 보존적으로 변형된 변이체(예를 들어, 퇴화 코돈 치환), 대립유전자, 동원체(ortholog), SNP 및 상보적 서열뿐 아니라, 명백하게 제시된 서열을 암시적으로 포함한다.
"뉴클레오타이드"는, 당 옥시리보오스(DNA) 또는 리보오스(RNA), 염기 및 포스페이트기를 함유한다. 뉴클레오타이드는 포스페이트기를 통해 함께 연결된다.
"염기"에는, 퓨린 및 피리미딘(이에는 천연 화합물인 아데닌, 티민, 구아닌, 시토신, 우라실, 이노신, 및 천연 유사체가 추가로 포함됨) 및 퓨린 및 피리미딘의 합성 유도체(이에는, 비제한적으로, 아민, 알코올, 티올, 카르복실레이트 및 알킬할라이드와 같은 새로운 반응성기가 대체된 변형이 포함됨)가 포함된다.
본원에 사용된 "간섭 RNA" 또는 "RNAi" 또는 "간섭 RNA 서열"이라는 용어는, 간섭 RNA가 표적 유전자 또는 서열과 동일한 세포에 존재할 때 (예를 들어, 간섭 RNA 서열에 상보적인 mRNA의 분해를 매개하거나 이의 번역을 저해하는 방식으로) 표적 유전자 또는 서열의 발현을 감소시키거나 저해할 수 있는, 단일가닥 RNA(예를 들어, 성숙 miRNA, ssRNAi 올리고뉴클레오타이드, ssDNAi 올리고뉴클레오타이드), 이중가닥 RNA(즉, 이중체 RNA, 예컨대 siRNA, 다이서-기질 dsRNA, shRNA, aiRNA 또는 pre-miRNA), DNA-RNA 혼성체(예를 들어, PCT 공개 번호 WO 2004/078941 참조), 또는DNA-DNA 혼성체(예를 들어, PCT 공개 번호 WO 2004/104199 참조)를 포함한다. 따라서, 간섭 RNA는 표적 mRNA 서열에 상보적인 단일가닥 RNA, 또는 2개의 상보적 가닥 또는 단일의 자가 상보적 가닥으로 형성된 이중가닥 RNA를 나타낸다. 간섭 RNA는 표적 유전자 또는 서열과 실질적으로 또는 완전히 동일할 수 있거나, 미스매치(mismatch) 영역(즉, 미스매치 모티프)를 포함할 수 있다. 간섭 RNA의 서열은 전장 표적 유전자, 또는 이의 하위서열에 상응할 수 있다. 바람직하게는, 간섭 RNA 분자는 화학적으로 합성된다. 상기 특허 문헌 각각의 개시내용은 모든 목적을 위해 그 전문이 본원에 참조로서 인용된다.
간섭 RNA에는, "작은 간섭 RNA" 또는 "siRNA", 예를 들어 약 15개 내지 60개, 15개 내지 50개 또는 15개 내지 40개(이중체) 뉴클레오타이드 길이, 보다 전형적으로 약 15개 내지 30개, 15개 내지 25개 또는 19개 내지 25개(이중체) 뉴클레오타이드 길이, 바람직하게는 약 20개 내지 24개, 21개 내지 22개 또는 21개 내지 23개(이중체) 뉴클레오타이드 길이의 간섭 RNA가 포함된다(예를 들어, 이중가닥 siRNA의 각각의 상보적 서열은 15개 내지 60개, 15개 내지 50개, 15개 내지 40개, 15개 내지 30개, 15개 내지 25개 또는 19개 내지 25개 뉴클레오타이드 길이, 바람직하게는 약 20개 내지 24개, 21개 내지 22개 또는 21개 내지 23개 뉴클레오타이드 길이이고, 이중가닥 siRNA는 약 15개 내지 60개, 15개 내지 50개, 15개 내지 40개, 15개 내지 30개, 15개 내지 25개 또는 19개 내지 25개 염기쌍 길이, 바람직하게는 약 18개 내지 22개, 19개 내지 20개 또는 19개 내지 21개 염기쌍 길이임). siRNA 이중체는 약 1개 내지 약 4개 뉴클레오타이드 또는 약 2개 내지 약 3개 뉴클레오타이드의 3' 돌출부와, 5' 포스페이트 말단을 포함할 수 있다. siRNA의 예에는, 비제한적으로, 2개의 별개의 가닥 분자에서 어셈블링된 이중가닥 폴리뉴클레오타이드 분자(여기서 하나의 가닥은 센스 가닥이고, 다른 하나는 상보적 안티센스 가닥임); 단일가닥 분자에서 어셈블링된 이중가닥 폴리뉴클레오타이드 분자(여기서 센스 및 안티센스 영역은 핵산 기반 또는 비핵산 기반 링커로 연결되어 있음); 자가 상보적 센스 및 안티센스 영역을 갖는 헤어핀 2차 구조를 갖는 이중가닥 폴리뉴클레오타이드 분자; 및 2개 이상의 루프 구조와 자가 상보적 센스 및 안티센스 영역을 갖는 스템을 갖는 원형 단일가닥 폴리뉴클레오타이드 분자(여기서 원형 폴리뉴클레오타이드는 생체내 또는 시험관내에서 처리되어 활성 이중가닥 siRNA 분자를 생성할 수 있음)가 포함된다. 본원에 사용된 "siRNA"라는 용어는, RNA-RNA 이중체뿐 아니라, DNA-RNA 혼성체를 포함한다(예를 들어, PCT 공개 번호 WO 2004/078941(이는 그 전문이 본원에 참조로서 인용됨)).
본원에 사용된 "핵산 구조체"라는 용어는, 자연 발생 유전자에서 단리되거나, 자연에 달리 존재하지 않을 수 있는 방식으로 핵산의 분절을 함유하도록 변형되거나 또는 합성된, 단일가닥 또는 이중가닥의 핵산 분자를 나타낸다. 핵산 구조체라는 용어는, 핵산 구조체가 본 개시내용의 코딩 서열의 발현에 필요한 제어 서열을 함유하는 경우, "발현 카세트"라는 용어와 동의어이다. "발현 카세트"는 프로모터에 작동 가능하게 연결된 DNA 코딩 서열을 포함한다.
"혼성화 가능한" 또는 "상보적인" 또는 "실질적으로 상보적인"이란, 핵산(예를 들어, RNA)이 이에 대한 비공유결합을 가능하게 하는, 즉, 왓슨-크릭(Watson-Crick) 염기 쌍 및/또는 G/U 염기 쌍을 형성하거나, 온도 및 용액 이온 강도의 적절한 시험관내 및/또는 생체내 조건 하에서 서열 특이적인 역평행 방식으로 또 다른 핵산(즉, 상보적인 핵산에 특이적으로 결합하는 핵산)에 "어닐링", 또는 "혼성화"하는 뉴클레오타이드의 서열을 포함한다는 것을 의미한다. 당업계에 공지된 바와 같이, 표준 왓슨-크릭 염기 짝짓기에는, 아데닌(A)과 티미딘(T)의 짝짓기, 아데닌(A)과 우라실(U)의 짝짓기, 및 구아닌(G)과 시토신(C)의 짝짓기가 포함된다. 또한, 당업계에는 2개의 RNA 분자(예를 들어, dsRNA) 사이의 혼성화, 구아닌(G)과 우라실(U)의 염기 쌍에 대해서도 공지되어 있다. 예를 들어, G/U 염기 짝짓기는 tRNA 안티코돈과 mRNA 코돈의 염기 짝짓기의 맥락에서 유전자 코드의 축퇴(즉, 중복)에 부분적으로 관여한다. 본 개시내용의 맥락에서, 대상 DNA 표적화 RNA 분자의 단백질-결합 분절(dsRNA 이중체)의 구아닌(G)은 우라실(U)에 상보적인 것으로 간주되며, 그 반대도 마찬가지이다. 이와 같이, G/U 염기쌍이 주어진 뉴클레오타이드 위치에서 대상 DNA 표적화 RNA 분자의 단백질-결합 분절(dsRNA 이중체)로 만들어질 수 있는 경우, 해당 위치는 비상보적인 것으로 간주되지 않고, 대신 상보적인 것으로 간주된다.
"펩타이드", "폴리펩타이드" 및 "단백질"은 본원에서 상호 교환적으로 사용되며, 코딩된 및 비코딩된 아미노산, 화학적으로 또는 생화학적으로 변형된 또는 유도체화된 아미노산, 및 변형된 펩타이드 백본을 갖는 폴리펩타이드를 포함할 수 있는 임의의 길이의 아미노산의 중합체 형태를 나타낸다.
특정 PAH 단백질을 "인코딩하는" DNA 서열은 특정 RNA 및/또는 단백질로 전사되는 DNA 핵산 서열이다. DNA 폴리뉴클레오타이드는 단백질로 번역되는 RNA(mRNA)를 인코딩할 수 있거나, DNA 폴리뉴클레오타이드는 단백질로 번역되지 않는 RNA(예를 들어, tRNA, rRNA 또는 DNA 표적화 RNA; "비코딩" RNA 또는 "ncRNA"로도 불림)를 인코딩할 수 있다.
본원에 사용된 "융합 단백질"이라는 용어는, 적어도 2개의 상이한 단백질로부터의 단백질 도메인을 포함하는 폴리펩타이드를 나타낸다. 예를 들어, 융합 단백질은 (i) PAH 또는 이의 단편과, (ii) 적어도 하나의 비(非)GOI 단백질을 포함할 수 있다. 본원에 포함되는 융합 단백질에는, 비제한적으로, 항체, 또는 PAH 단백질에 융합된 항체의 Fc 또는 항원 결합 단편, 예를 들어 수용체, 리간드, 효소 또는 펩타이드의 세포외 도메인이 포함된다. 융합 단백질의 일부인 PAH 단백질 또는 이의 단편은 단일특이적 항체, 또는 이중특이적 또는 다중특이적 항체일 수 있다.
본원에 사용된 "게놈 세이프 하버(safe harbor) 유전자" 또는 "세이프 하버 유전자"라는 용어는, 암의 촉진 또는 내인성 유전자 활성에 대한 유의한 부정적인 결과 없이, 서열이 예측 가능한 방식으로 통합 및 기능할 수 있도록(예를 들어, 관심 단백질을 발현시킴) 핵산 서열이 삽입될 수 있는 유전자 또는 유전좌위를 나타낸다. 일부 구현예에서, 세이프 하버 유전자는 또한 삽입된 핵산 서열이 비(非)세이프 하버 부위보다 더 높은 수준으로 효율적으로 발현될 수 있는 유전좌위 또는 유전자이다.
본원에 사용된 "유전자 전달"이라는 용어는, 유전자 치료의 적용을 위해 외래 DNA가 숙주세포에 전달되는 과정을 의미한다.
본원에 사용된 "말단반복서열" 또는 "TR"이라는 용어는, 적어도 하나의 최소 필수 복제 기점과 회문 헤어핀 구조를 포함하는 영역을 포함하는, 임의의 바이러스 말단반복 또는 합성 서열을 포함한다. Rep-결합 서열("RBS")(RBE(Rep-결합 요소)로도 지칭됨)과 말단 분해 부위("TRS")는 함께 "최소 필수 복제 기점"을 구성하기 때문에, TR은 적어도 하나의 RBS와 적어도 하나의 TRS를 포함한다. 폴리뉴클레오타이드 서열의 주어진 스트레치 내에서 서로 역 보체인 TR은, 전형적으로 "역말단반복서열" 또는 "ITR"로 지칭된다. 바이러스의 맥락에서, ITR은 복제, 바이러스 패키징, 통합 및 프로바이러스 회수를 매개한다. 본원의 발명에서 예상치 못하게 발견된 바와 같이, 전체 길이에 걸쳐 역 보체가 아닌 TR은 여전히 야생형 ITR의 전형적인 기능을 수행할 수 있기 때문에, 본원에 사용된 ITR이라는 용어는 ceDNA 벡터의 복제를 매개할 수 있는 ceDNA 게놈 또는 ceDNA 벡터 내 TR을 나타낸다. 당업자는, 복잡한 ceDNA 벡터 구성에서, 2개 초과의 ITR 또는 비대칭인 ITR 쌍이 존재할 수 있다는 것을 이해할 것이다. ITR은 AAV ITR 또는 비(非)AAV ITR일 수 있거나, AAV ITR 또는 비AAV ITR에서 유도될 수 있다. 예를 들어, ITR은 파르보바이러스 및 데펜도바이러스(예를 들어, 개 파르보바이러스, 소 파르보바이러스, 마우스 파르보바이러스, 돼지 파르보바이러스, 인간 파르보바이러스 B-19)를 포함하는 파르보바이러스과에서 유도될 수 있거나, 또는 SV40 복제 기점으로 작용하는 SV40 헤어핀(이는 절단, 치환, 결실, 삽입 및/또는 부가에 의해 추가로 변형될 수 있음)이 ITR로서 사용될 수 있다. 파르보바이러스과 바이러스는 척추동물을 감염시키는 파르보바이러스아과(Parvovirinae)와 무척추동물을 감염시키는 덴소바이러스아과(Densovirinae)의 2개의 아과로 이루어져 있다. 데펜도파르보바이러스에는, 비제한적으로, 인간, 영장류, 소, 개, 말 및 양 종을 포함하는 척추동물 숙주에서 복제 가능한 아데노연관바이러스(AAV)의 바이러스과가 포함된다. 본원에서 편의를 위해, ceDNA 벡터 내 발현 카세트(의 업스트림) 5'에 위치한 ITR은 "5' ITR" 또는 "좌측 ITR"로 지칭되고, ceDNA 벡터 내 발현 카세트(의 다운스트림) 3'에 위치한 ITR은 "3' ITR" 또는 "우측 ITR"로 지칭된다.
"야생형 ITR" 또는 "WT-ITR"은, 예를 들어 Rep 결합 활성 및 Rep 닉킹 능력을 보유하는, AAV 또는 다른 데펜도바이러스 내 자연 발생 ITR 서열의 서열을 나타낸다. 임의의 AAV 혈청형의 WT-ITR의 뉴클레오타이드 서열은 유전자 코드 또는 드리프트의 축퇴로 인해 기본형 자연 발생 서열에서 약간 달라질 수 있기 때문에, 본원에의 사용을 위해 포함된 WT-ITR 서열은 생산 과정 동안 일어나는 자연적으로 발생하는 변화(예를 들어, 복제 오류)의 결과로서의 WT-ITR 서열을 포함한다.
본원에 사용된 "실질적으로 대칭인 WT-ITR" 또는 "실질적으로 대칭인 WT-ITR 쌍"이라는 용어는, 둘 모두 이의 전체 길이에 걸쳐 역 보체 서열을 갖는 야생형 ITR인, 단일 ceDNA 게놈 또는 ceDNA 벡터 내 WT-ITR의 쌍을 나타낸다. 예를 들어, ITR은, 기본형 자연 발생 서열에서 벗어난 하나 이상의 뉴클레오타이드를 갖더라도, 변화가 서열의 특성 및 전체 3차원 구조에 영향을 미치지 않는 한, 야생형 서열인 것으로 간주될 수 있다. 일부 양태에서, 벗어난 뉴클레오타이드는 보존적 서열 변화를 나타낸다. 하나의 비제한적인 예로서, 기본형 서열과 적어도 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 갖고(기본 설정으로 BLAST를 사용하여 측정 시), 또한 기하학적 공간에서의 3D 구조가 동일한 형상이 되도록 다른 WT-ITR에 대칭인 3차원 공간 구성을 갖는 서열. 실질적으로 대칭인 WT-ITR은 3D 공간에 동일한 A, C-C' 및 B-B' 루프를 갖는다. 실질적으로 대칭인 WT-ITR은, 이것이 적절한 Rep 단백질과 쌍을 이루는 작동 가능한 Rep 결합 부위(RBE 또는 RBE')와 말단 분해 부위(TRS)를 가지고 있음을 결정하는 방식으로 WT로서 기능적으로 확인될 수 있다. 선택적으로, 허용 조건 하에서의 전이유전자 발현을 포함하는 다른 기능을 시험할 수 있다.
본원에 사용된 "변형된 ITR" 또는 "mod-ITR" 또는 "돌연변이 ITR"이라는 구절은 본원에서 상호교환적으로 사용되며, 동일한 혈청형의 WT-ITR과 비교하여 적어도 하나 또는 그 이상의 뉴클레오타이드에 돌연변이를 갖는 ITR을 나타낸다. 돌연변이는 ITR 내 A 영역, C 영역, C' 영역, B 영역, B' 영역 중 하나 이상을 변경시킬 수 있으며, 동일한 혈청형의 WT-ITR의 3D 공간 구성과 비교하여 3차원 공간 구성(즉, 기하학적 공간에서의 3D 구조)을 변경시킬 수 있다.
본원에 사용된 "비대칭인 ITR"이라는 용어(이는 "비대칭인 ITR 쌍"으로도 지칭됨)는, 전체 길이에 걸쳐 역 보체가 아닌 단일 ceDNA 게놈 또는 ceDNA 벡터 내 ITR의 쌍을 나타낸다. 하나의 비제한적인 예로서, 비대칭인 ITR 쌍은 3D 구조가 기하학적 공간에서 상이한 형상이 되도록 이의 동족 ITR과 대칭인 3차원 공간 구성을 갖지 않는다. 달리 말하면, 비대칭인 ITR 쌍은 전체적인 기하 구조가 상이하며, 즉, 이들은 3D 공간에서 A, C-C' 및 B-B' 루프의 구성이 상이하다(예를 들어, 하나의 ITR은 동족 ITR과 비교하여 짧은 C-C' 아암 및/또는 짧은 B-B' 아암을 가질 수 있음). 2개의 ITR 사이의 서열 차이는 뉴클레오타이드 부가, 결실, 절단 또는 점 돌연변이 중 하나 이상으로 인한 것일 수 있다. 하나의 구현예에서, 비대칭인 ITR 쌍 중 하나의 ITR은 야생형 AAV ITR 서열일 수 있고, 다른 하나의 ITR은 본원에 정의된 바와 같이 변형된 ITR(예를 들어, 비야생형 또는 합성 ITR 서열)일 수 있다. 또 다른 구현예에서, 비대칭인 ITR 쌍 중 어느 ITR도 야생형 AAV 서열이 아니며, 2개의 ITR은 기하학적 공간에서 상이한 형상을 갖는(즉, 전체 기하 구조가 상이한) 변형된 ITR이다. 일부 구현예에서, 비대칭인 ITR 쌍 중 하나의 mod-ITR은 짧은 C-C' 아암을 가질 수 있고, 다른 하나의 ITR은 동족 비대칭인 mod-ITR과 비교하여 상이한 3차원 공간 구성을 갖도록 상이한 변형(예를 들어, 단일 또는 짧은 B-B' 아암 등)을 가질 수 있다.
본원에 사용된 "대칭인 ITR"이라는 용어는, 야생형 또는 돌연변이된(예를 들어, 야생형에 비해 변형된) 데펜도바이러스 ITR 서열이고 전체 길이에 걸쳐 역 보체인, 단일 ceDNA 게놈 또는 ceDNA 벡터 내 ITR의 쌍을 나타낸다. 하나의 비제한적인 예에서, 두 개의 ITR은 모두 AAV2 유래의 야생형 ITR 서열이다. 또 다른 예에서, ITR 중 어느 것도 야생형 ITR AAV2 서열이 아니며(즉, 이는 변형된 ITR이며, 돌연변이 ITR로도 지칭됨), 뉴클레오타이드 부가, 결실, 치환, 절단 또는 점 돌연변이로 인해 야생형 ITR의 서열과 차이가 있을 수 있다. 본원에서 편의를 위해, ceDNA 벡터 내 발현 카세트(의 업스트림) 5'에 위치한 ITR은 "5' ITR" 또는 "좌측 ITR"로 지칭되고, ceDNA 벡터 내 발현 카세트(의 다운스트림) 3'에 위치한 ITR은 "3' ITR" 또는 "우측 ITR"로 지칭된다.
본원에 사용된 "실질적으로 대칭인 변형된 ITR" 또는 "실질적으로 대칭인 mod-ITR 쌍"이라는 용어는, 둘 모두 이의 전체 길이에 걸쳐 역 보체 서열을 갖는 단일 ceDNA 게놈 또는 ceDNA 벡터 내 변형된 ITR의 쌍을 나타낸다. 예를 들어, 변형된 ITR은, 역 보체 서열에서 벗어난 일부 뉴클레오타이드 서열을 갖더라도, 변화가 특성 및 전체 형상에 영향을 미치지 않는 한, 실질적으로 대칭인 것으로 간주될 수 있다. 하나의 비제한적인 예로서, 기본형 서열과 적어도 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 갖고(기본 설정으로 BLAST를 사용하여 측정 시), 또한 기하학적 공간에서의 3D 구조가 동일한 형상이 되도록 동족 변형된 ITR에 대칭인 3차원 공간 구성을 갖는 서열. 달리 말하면, 실질적으로 대칭인 변형된 ITR 쌍은 3D 공간에 구성된 동일한 A, C-C' 및 B-B' 루프를 갖는다. 일부 구현예에서, mod-ITR 쌍으로부터의 ITR은 상이한 역 보체 뉴클레오타이드 서열을 갖지만, 여전히 동일한 대칭인 3차원 공간 구성을 가질 수 있으며, 즉, 두 개의 ITR은 동일한 전체 3D 형상을 생성하는 돌연변이를 갖는다. 예를 들어, mod-ITR 쌍에서 하나의 ITR(예를 들어, 5' ITR)은 하나의 혈청형에서 유래할 수 있고, 다른 하나의 ITR(예를 들어, 3' ITR)은 상이한 혈청형에서 유래할 수 있지만, 두 가지 모두 동일한 상응하는 돌연변이를 가질 수 있으므로(예를 들어, 5' ITR이 C 영역에 결실을 갖는 경우, 상이한 혈청형으로부터의 동족의 변형된 3' ITR은 C' 영역의 상응하는 위치에 결실을 가짐), 변형된 ITR 쌍은 동일한 대칭인 3차원 공간 구성을 갖는다. 이러한 구현예에서, 변형된 ITR 쌍의 각각의 ITR은 상이한 혈청형(예를 들어, AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 및 AAV12), 예컨대 AAV2와 AAV6의 조합에서 유래할 수 있으며, 여기서 하나의 ITR에서의 변형은 상이한 혈청형의 동족 ITR 내 상응하는 위치에 반영된다. 하나의 구현예에서, 실질적으로 대칭인 변형된 ITR 쌍은, ITR 사이의 뉴클레오타이드 서열 차이가 특성 또는 전체 형상에 영향을 미치지 않고 이들이 3D 공간에서 실질적으로 동일한 형상을 갖는 한, 변형된 ITR(mod-ITR)의 쌍을 나타낸다. 비제한적인 예로서, mod-ITR은 기본 설정의 BLAST(Basic Local Alignment Search Tool)(BLASTN)와 같은 당업계에 널리 공지된 표준 수단에 의해 측정 시 기본형 mod-ITR과 적어도 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 갖고, 또한 기하학적 공간에서의 3D 구조가 동일한 형상이 되도록 대칭인 3차원 공간 구성을 갖는다. 실질적으로 대칭인 mod-ITR 쌍은 3D 공간에서 동일한 A, C-C' 및 B-B' 루프를 가지며, 예를 들어 실질적으로 대칭인 mod-ITR 쌍에서 변형된 ITR이 C-C' 아암의 결실을 갖는 경우, 동족 mod-ITR은 C-C' 루프의 상응하는 결실을 갖고, 또한 이의 동족 mod-ITR의 기하학적 공간에서 동일한 형상으로 나머지 A 및 B-B' 루프의 유사한 3D 구조를 갖는다.
"플랭킹"이라는 용어는, 또 다른 핵산 서열에 대한 하나의 핵산 서열의 상대적인 위치를 나타낸다. 일반적으로, 서열 ABC에서, B에는 A와 C가 플랭킹되어 있다. 이는 배열 AxBxC에 대해서도 동일하게 적용된다. 따라서, 플랭킹 서열은 플랭킹된 서열의 앞에 있거나 뒤에 있지만, 플랭킹된 서열에 인접하거나 바로 근접할 필요는 없다. 하나의 구현예에서, 플랭킹이라는 용어는, 선형 이중체 ceDNA 벡터의 각 말단에 있는 말단반복서열을 나타낸다.
본원에 사용된 "치료하다", "치료하는" 및/또는 "치료"라는 용어는, 병태의 진행을 중단시키거나, 실질적으로 저해하거나, 느리게 하거나 또는 역전시키는 것; 병태의 임상 증상을 실질적으로 개선하는 것; 또는 병태의 임상 증상의 출현을 실질적으로 예방하는 것을 통해 유익하거나 목적하는 임상 결과를 수득하는 것을 포함한다. 일부 구현예에 따르면, 병태는 PKU이다. 치료는 나아가 다음 중 하나 이상을 달성하는 것을 나타낸다: (a) 장애의 중증도를 감소시키는 것; (b) 치료하고자 하는 장애(들)의 특징적인 증상의 발달을 제한하는 것; (c) 치료하고자 하는 장애(들)의 특징적인 증상의 악화를 제한하는 것; (d) 이전에 장애(들)를 앓았던 환자에서 장애(들)의 재발을 제한하는 것; 및 (e) 장애(들)에 대해 이전에 증상이 없었던 환자에서 증상의 재발을 제한하는 것. 약리학적 및/또는 생리학적 효과와 같은 유익하거나 목적하는 임상 결과에는, 비제한적으로, 질환, 장애 또는 병태에 걸리기 쉬울 수 있지만, 질환의 증상을 아직 경험하지 않았거나 나타내지 않은 대상에서 질환, 장애 또는 병태의 발생을 예방하는 것(예방적 치료), 질환, 장애 또는 병태의 증상 경감, 질환, 장애 또는 병태의 정도 감소, 질환, 장애 또는 병태의 안정화(즉, 악화시키지 않음), 질환, 장애 또는 병태의 확산 예방, 질환, 장애 또는 병태 진행의 지연 또는 늦추기, 질환, 장애 또는 병태의 개선 또는 완화, 및 이들의 조합뿐 아니라, 치료를 받지 않은 경우 예상되는 생존기간에 비해 생존기간을 연장시키는 것.
본원에 사용된 "증가시키다", "증강시키다", "상승시키다"(및 유사 용어)라는 용어는, 일반적으로, 본래 값, 예측 값 또는 평균 값에 비해, 또는 대조군 조건에 비해, 농도, 수준, 기능, 활성 또는 거동을, 직접적으로 또는 간접적으로, 증가시키는 작용을 나타낸다.
본원에 사용된 "최소화시키다", "저하시키다", "감소시키다" 및/또는 "저해하다"(및 유사 용어)라는 용어는, 일반적으로, 본래 값, 예측 값 또는 평균 값에 비해, 또는 대조군 조건에 비해, 농도, 수준, 기능, 활성 또는 거동을, 직접적으로 또는 간접적으로, 감소시키는 작용을 나타낸다.
본원에 사용된 "ceDNA 게놈"이라는 용어는, 적어도 하나의 역말단반복 영역을 추가로 포함하는 발현 카세트를 나타낸다. ceDNA 게놈은 하나 이상의 스페이서 영역을 추가로 포함할 수 있다. 일부 구현예에서, ceDNA 게놈은 DNA의 분자간 이중체 폴리뉴클레오타이드로서 플라스미드 또는 바이러스 게놈에 혼입된다.
본원에 사용된 "ceDNA 스페이서 영역"이라는 용어는, ceDNA 벡터 또는 ceDNA 게놈에서 기능성 요소를 분리하는 개재 서열을 나타낸다. 일부 구현예에서, ceDNA 스페이서 영역은 최적의 기능을 위해 2개의 기능성 요소를 목적하는 거리로 유지시킨다. 일부 구현예에서, ceDNA 스페이서 영역은, 예를 들어 플라스미드 또는 바큐로바이러스 내에 ceDNA 게놈의 유전적 안정성을 제공하거나 부가한다. 일부 구현예에서, ceDNA 스페이서 영역은, 클로닝 부위 등에 대한 편리한 위치를 제공하는 방식으로, ceDNA 게놈의 준비된 유전자 조작을 용이하게 한다. 예를 들어, 특정 양태에서, 몇몇 제한 엔도뉴클레아제 부위를 함유하는 올리고뉴클레오타이드 "폴리링커", 또는 공지된 단백질(예를 들어, 전사인자) 결합 부위를 갖지 않도록 설계된 비(非)오픈리딩프레임 서열은, 시스-작용 인자를 분리하기 위해, 예를 들어 말단 분해 부위와 업스트림 전사 조절 요소 사이에 6량체, 12량체, 18량체, 24량체, 48량체, 86량체, 176량체 등을 삽입하는 방식으로, ceDNA 게놈에 배치될 수 있다. 유사하게, 스페이서는 폴리아데닐화 신호 서열과 3'-말단 분해 부위 사이에 혼입될 수 있다.
본원에 사용된 "Rep 결합 부위", "Rep 결합 요소", "RBE" 및 "RBS"라는 용어는 상호교환적으로 사용되며, Rep 단백질에 의해 결합될 때, Rep 단백질이 RBS를 포함하는 서열에서 이의 부위 특이적 엔도뉴클레아제 활성을 수행할 수 있게 하는 Rep 단백질(예를 들어, AAV Rep 78 또는 AAV Rep 68)에 대한 결합 부위를 나타낸다. RBS 서열과 이의 역 보체는 함께 단일 RBS를 형성한다. RBS 서열은 당업계에 공지되어 있으며, 예를 들어 AAV2에서 식별된 RBS 서열인 5'-GCGCGCTCGCTCGCTC-3'(서열번호 60)를 포함한다. 다른 공지된 AAV RBS 서열, 및 다른 자연적으로 공지된 또는 합성 RBS 서열을 포함하는, 임의의 공지된 RBS 서열이 본 발명의 구현예에서 사용될 수 있다. 이론에 구애됨 없이, Rep 단백질의 뉴클레아제 도메인은 이중체 뉴클레오타이드 서열 GCTC에 결합하기 때문에, 2개의 공지된 AAV Rep 단백질이 이중체 올리고뉴클레오타이드인 5'-(GCGC)(GCTC)(GCTC)(GCTC)-3'(서열번호 60) 상에 직접 결합하여 안정적으로 어셈블링된다고 여겨진다. 또한, 가용성 응집된 이형태체(conformer)(즉, 정의되지 않은 수의 상호연관된 Rep 단백질)는 해리되어, Rep 결합 부위를 함유하는 올리고뉴클레오타이드에 결합한다. 각각의 Rep 단백질은 각 가닥에서 질소성 염기 및 포스포디에스테르 백본과 상호작용한다. 질소성 염기와의 상호작용은 서열 특이성을 제공하지만, 포스포디에스테르 백본과의 상호작용은 비(非)서열 특이적 또는 덜 서열 특이적이며, 단백질-DNA 복합체를 안정화시킨다.
본원에 사용된 "말단 분해 부위" 및 "TRS"는 본원에서 상호교환적으로 사용되며, Rep가 5' 티미딘과 티로신-포스포디에스테르 결합을 형성하여, 세포 DNA 폴리머라아제, 예를 들어 DNA pol 델타 또는 DNA pol 엡실론을 통해 DNA 연장을 위한 기질로서 작용하는 3' OH를 생성하는 영역을 나타낸다. 대안적으로, Rep-티미딘 복합체는 조정된 결찰 반응에 참여할 수 있다. 일부 구현예에서, TRS는 염기쌍을 이루지 않은 티미딘을 최소한으로 포함한다. 일부 구현예에서, TRS의 닉킹 효율은 RBS로부터의 동일한 분자 내 거리에 의해 적어도 부분적으로 제어될 수 있다. 수용체 기질이 상보적 ITR인 경우, 생성되는 산물은 분자내 이중체이다. TRS 서열은 당업계에 공지되어 있으며, 예를 들어 AAV2로 식별된 헥사뉴클레오타이드 서열인 5'-GGTTGA-3'(서열번호 61)을 포함한다. 다른 공지된 AAV TRS 서열 및 다른 자연적으로 알려진 또는 합성 TRS 서열, 예컨대 AGTT(서열번호 62), GGTTGG(서열번호 63), AGTTGG(서열번호 64), AGTTGA(서열번호 65), 및 RRTTRR(서열번호 66)과 같은 다른 모티프를 포함하는, 임의의 공지된 TRS 서열이 본 발명의 구현예에서 사용될 수 있다.
본원에 사용된 "ceDNA-플라스미드"라는 용어는, 분자간 이중체로서 ceDNA 게놈을 포함하는 플라스미드를 나타내다.
본원에 사용된 "ceDNA-박미드"라는 용어는, 플라스미드로서 대장균에서 증식할 수 있고, 따라서 바큐로바이러스에 대한 셔틀 벡터로서 작용할 수 있는 분자간 이중체로서 ceDNA 게놈을 포함하는 감염성 바큐로바이러스 게놈을 나타낸다.
본원에 사용된 "ceDNA-바큐로바이러스"라는 용어는, 바큐로바이러스 게놈 내에 분자간 이중체로서 ceDNA 게놈을 포함하는 바큐로바이러스를 나타낸다.
본원에 사용된 "ceDNA-바큐로바이러스 감염된 곤충 세포" 및 "ceDNA-BIIC"라는 용어는 상호교환적으로 사용되며, ceDNA-바큐로바이러스로 감염된 무척추동물 숙주세포(비제한적으로, 곤충 세포(예를 들어, Sf9 세포) 포함)를 나타낸다.
본원에 사용된 "ceDNA"라는 용어는, 합성 또는 그 이외의 다른 비바이러스성 유전자 전달을 위한 캡시드 미함유 폐쇄형 선형 이중가닥(ds) 이중체 DNA를 나타낸다. ceDNA에 대한 상세한 설명은, 2017년 3월 3일자 출원된 국제 출원 PCT/US2017/020828에 기재되어 있으며, 상기 문헌의 전체 내용은 명백하게 본원에 참조로서 인용된다. 세포 기반 방법을 사용하여 다양한 역말단반복(ITR) 서열 및 구성을 포함하는 ceDNA의 생산을 위한 특정 방법은, 2018년 9월 7일자 출원된 국제 출원 PCT/US18/49996 및 2018년 12월 6일자 출원된 PCT/US2018/064242의 실시예 1에 기재되어 있으며, 상기 문헌들은 각각 그 전문이 본원에 참조로서 인용된다. 다양한 ITR 서열 및 구성을 포함하는 합성 ceDNA 벡터의 생산을 위한 특정 방법은, 예를 들어 2019년 1월 18일자 출원된 국제 출원 PCT/US2019/14122에 기재되어 있으며, 상기 문헌의 전체 내용은 본원에 참조로서 인용된다.
본원에 사용된 "폐쇄형 DNA 벡터"라는 용어는, 적어도 하나의 공유결합으로 폐쇄된 말단을 갖고 벡터의 적어도 일부가 분자내 이중체 구조를 갖는 캡시드 미함유 DNA 벡터를 나타낸다.
본원에 사용된 "ceDNA 벡터" 및 "ceDNA"라는 용어는 상호 교환적으로 사용되며, 적어도 하나의 말단 회문구조를 포함하는 폐쇄형 DNA 벡터를 나타낸다. 일부 구현예에서, ceDNA는 2개의 공유결합으로 폐쇄된 말단을 포함한다.
본원에 사용된 "neDNA" 또는 "닉킹된(nicked) ceDNA"라는 용어는, 오픈리딩프레임(예를 들어, 발현시키고자 하는 프로모터와 전이유전자)의 스템 영역 또는 스페이서 영역 5' 업스트림에 1개 내지 100개 염기쌍의 닉 또는 갭을 갖는 폐쇄형 DNA를 나타낸다.
본원에 사용된 "갭(gap)" 및 "닉(nick)"이라는 용어는 상호교환적으로 사용되며, 본 발명의 합성 DNA 벡터의 중단된 부분으로, 다르게는 이중가닥 ceDNA에서 단일가닥 DNA 부분의 스트레치를 형성하는 중단된 부분을 나타낸다. 갭은 이중체 DNA의 하나의 가닥에서 1개 염기쌍 내지 100개 염기쌍 길이일 수 있다. 본원에 기재된 방법에 의해 설계되고 형성된 전형적인 갭, 및 이러한 방법에 의해 생성된 합성 벡터는, 예를 들어 길이가 1 bp, 2 bp, 3 bp, 4 bp, 5 bp, 6 bp, 7 bp, 8 bp, 9 bp, 10 bp, 11 bp, 12 bp, 13 bp, 14 bp, 15 bp, 16 bp, 17 bp, 18 bp, 19 bp, 20 bp, 21 bp, 22 bp, 23 bp, 24 bp, 25 bp, 26 bp, 27 bp, 28 bp, 29 bp, 30 bp, 31 bp, 32 bp, 33 bp, 34 bp, 35 bp, 36 bp, 37 bp, 38 bp, 39 bp, 40 bp, 41 bp, 42 bp, 43 bp, 44 bp, 45 bp, 46 bp, 47 bp, 48 bp, 49 bp, 50 bp, 51 bp, 52 bp, 53 bp, 54 bp, 55 bp, 56 bp, 57 bp, 58 bp, 59 bp 또는 60 bp일 수 있다. 본 개시내용에 예시된 갭은 길이가 1 bp 내지 10 bp, 1 bp 내지 20 bp, 1 bp 내지 30 bp일 수 있다.
본원에 정의된 "리포터"란, 검출 가능한 판독물을 제공하는 데 사용될 수 있는 단백질을 나타낸다. 리포터는 일반적으로 형광, 색상 또는 발광과 같은 측정 가능한 신호를 생성한다. 리포터 단백질 코딩 서열은 세포 또는 유기체에서의 존재가 용이하게 관찰되는 단백질을 인코딩한다. 예를 들어, 형광 단백질은 특정 파장의 빛으로 여기될 때 세포가 형광을 나타내게 하고, 루시퍼라아제는 세포가 빛을 생성하는 반응을 촉진시키게 하며, β-갈락토시다아제와 같은 효소는 기질을 착색된 산물로 전환시킨다. 실험 또는 진단 목적에 유용한 예시적인 리포터 폴리펩타이드에는, 비제한적으로 β-락타마아제, β -갈락토시다아제(LacZ), 알칼리성 포스파타아제(AP), 티미딘 키나아제(TK), 녹색 형광 단백질(GFP) 및 다른 형광 단백질, 클로람페니콜 아세틸트랜스퍼라아제(CAT), 루시퍼라아제, 및 당업계에 널리 공지된 다른 것들이 포함된다.
본원에 사용된 "센스" 및 "안티센스"라는 용어는, 폴리뉴클레오타이드에서의 구조 요소의 배향을 나타낸다. 요소의 센스 및 안티센스 버전은 서로 역 보체이다.
본원에 사용된 "합성 AAV 벡터" 및 "AAV 벡터의 합성 생산"이라는 용어는, 완전한 무세포 환경에서의 AAV 벡터 및 이의 합성 생산 방법을 나타낸다.
본원에 사용된 "리포터"란, 검출 가능한 판독물을 제공하는 데 사용될 수 있는 단백질을 나타낸다. 리포터는 일반적으로 형광, 색상 또는 발광과 같은 측정 가능한 신호를 생성한다. 리포터 단백질 코딩 서열은 세포 또는 유기체에서의 존재가 용이하게 관찰되는 단백질을 인코딩한다. 예를 들어, 형광 단백질은 특정 파장의 빛으로 여기될 때 세포가 형광을 나타내게 하고, 루시퍼라아제는 세포가 빛을 생성하는 반응을 촉진시키게 하며, β-갈락토시다아제와 같은 효소는 기질을 착색된 산물로 전환시킨다. 실험 또는 진단 목적에 유용한 예시적인 리포터 폴리펩타이드에는, 비제한적으로 β-락타마아제, β -갈락토시다아제(LacZ), 알칼리성 포스파타아제(AP), 티미딘 키나아제(TK), 녹색 형광 단백질(GFP) 및 다른 형광 단백질, 클로람페니콜 아세틸트랜스퍼라아제(CAT), 루시퍼라아제, 및 당업계에 널리 공지된 다른 것들이 포함된다.
본원에 사용된 "이펙터(effector) 단백질"이라는 용어는, 예를 들어 리포터 폴리펩타이드, 또는 보다 적절하게는, 세포를 사멸시키는 폴리펩타이드, 예를 들어 독소, 또는 세포가 선택된 작용제 또는 이의 결여로 인해 사멸하기 쉽게 만드는 작용제로서 검출 가능한 판독물을 제공하는 폴리펩타이드를 나타낸다. 이펙터 단백질에는, 숙주세포의 DNA 및/또는 RNA를 직접 표적으로 하거나 이를 손상시키는 임의의 단백질 또는 펩타이드가 포함된다. 예를 들어, 이펙터 단백질은, 비제한적으로, 숙주세포 DNA 서열(게놈 요소인지 또는 염색체외 요소인지에 관계없이)을 표적으로 하는 제한 엔도뉴클레아제, 세포 생존에 필요한 폴리펩타이드 표적을 분해하는 프로테아제, DNA 자이라아제(gyrase) 저해제 및 리보뉴클레아제 유형 독소를 포함할 수 있다. 일부 구현예에서, 본원에 기재된 바와 같은 합성 생물학적 회로에 의해 제어되는 이펙터 단백질의 발현은, 또 다른 합성 생물학적 회로에 인자로 참여하여, 생물학적 회로 시스템의 반응성의 범위 및 복잡성을 확장시킬 수 있다.
전사 조절인자는 PAH와 같은 관심 유전자의 전사를 활성화시키거나 억제하는 전사 활성화제 및 억제인자를 나타낸다. 프로모터는 특정 유전자의 전사를 개시하는 핵산의 영역이다. 전사 활성화제는 전형적으로 전사 프로모터 근처에 결합하고 RNA 폴리머라아제를 동원하여, 직접 전사를 개시한다. 억제인자는 전사 프로모터에 결합하여, RNA 폴리머라아제에 의한 전사 개시를 입체적으로 방해한다. 다른 전사 조절인자는 이들의 결합하는 위치, 및 세포 및 환경 조건에 따라 활성화제 또는 억제인자로 작용할 수 있다. 전사 조절인자 부류의 비제한적인 예에는, 비제한적으로, 호메오도메인(homeodomain) 단백질, 아연-핑거 단백질, 날개있는 나선형(winged-helix)(포크헤드(forkhead)) 단백질 및 류신-지퍼 단백질이 포함된다.
본원에 사용된 "억제 단백질" 또는 "유도 단백질"은, 조절 서열 요소에 결합하여, 조절 서열 요소에 작동적으로 연결된 서열의 전사를, 각각, 억제 또는 활성화시키는 단백질이다. 본원에 기재된 바와 같은 바람직한 억제 및 유도 단백질은 적어도 하나의 입력물질 또는 환경 입력의 존재 또는 부재에 민감하다. 본원에 기재된 바와 같은 바람직한 단백질은, 예를 들어 분리 가능한 DNA-결합 및 입력물질-결합, 또는 반응성 요소 또는 도메인을 포함하는 형태의 모듈이다.
본원에 사용된 "담체"에는, 임의의 및 모든 용매, 분산 매질, 비히클, 코팅제, 희석제, 항균제 및 항진균제, 등장화제 및 흡수지연제, 완충제, 담체 용액, 현탁액, 콜로이드 등이 포함된다. 약학적 활성 물질에 대한 이러한 매질 및 작용제의 사용은 당업계에 공지되어 있다. 보충 활성 성분이 또한 조성물에 혼입될 수 있다. "약학적으로 허용 가능한"이라는 구절은, 숙주에 투여될 때 독성, 알레르기 또는 유사한 유해 반응을 생성하지 않는 분자 엔티티 및 조성물을 나타낸다.
본원에 사용된 "입력물질 반응성 도메인"은, 연결된 DNA 결합 융합 도메인을 해당 조건 또는 입력의 존재에 대해 반응성으로 만드는 방식으로 조건 또는 입력물질에 결합하거나 다르게는 이에 반응하는 전사인자의 도메인이다. 하나의 구현예에서, 조건 또는 입력의 존재는 입력물질 반응성 도메인 또는 이와 융합되는 단백질에서 입체형태 변화를 유도하여, 전사인자의 전사 조절 활성을 변형시킨다.
"생체내"라는 용어는, 다세포 동물과 같은 유기체에서 또는 유기체 내에서 일어나는 검정 또는 과정을 나타낸다. 본원에 기재된 일부 양태에서, 방법 또는 용도는, 박테리아와 같은 단세포 유기체가 사용될 때, "생체내"에서 일어난다고 할 수 있다. "생체외"라는 용어는, 다세포 동물 또는 식물의 체외, 예를 들어 특히 외식편, 배양된 세포(1차 세포 및 세포주 포함), 형질전환된 세포주 및 추출된 조직 또는 세포(혈액 세포 포함)에 있는 온전한 막을 갖는 살아있는 세포를 사용하여 수행되는 방법 및 용도를 나타낸다. "시험관내"라는 용어는, 세포 추출물과 같은 온전한 막을 갖는 세포의 존재를 필요로 하지 않는 검정 및 방법을 나타내며, 세포를 포함하지 않는 배지와 같은 비(非)세포 시스템, 또는 세포 추출물과 같은 세포 시스템에 프로그래밍 가능한 합성 생물학적 회로를 도입하는 것을 나타낼 수 있다.
본원에 사용된 "프로모터"라는 용어는, 단백질 또는 RNA를 인코딩하는 이종 표적 유전자일 수 있는 핵산 서열의 전사를 유도하는 방식으로 또 다른 핵산 서열의 발현을 조절하는 임의의 핵산 서열을 나타낸다. 프로모터는 구성적, 유도성, 억제성, 조직 특이적 또는 이들의 임의의 조합일 수 있다. 프로모터는 핵산 서열의 나머지 부분의 전사 개시 및 속도가 제어되는 핵산 서열의 제어 영역이다. 프로모터는 또한 RNA 폴리머라아제 및 다른 전사인자와 같은, 조절 단백질 및 분자에 결합할 수 있는 유전 요소를 함유할 수 있다. 본원에 기재된 양태의 일부 구현예에서, 프로모터는 프로모터 자체의 발현을 조절하는 전사인자의 발현을 유도할 수 있다. 프로모터 서열 내에는 전사 개시 부위뿐 아니라, RNA 폴리머라아제의 결합을 담당하는 단백질 결합 도메인이 발견될 것이다. 진핵생물 프로모터는 종종, 항상은 아니지만, "TATA" 박스와 "CAT" 박스를 함유할 것이다. 유도성 프로모터를 비롯한 다양한 프로모터는, 본원에 개시된 ceDNA 벡터의 전이유전자의 발현을 유도하는 데 사용될 수 있다. 프로모터 서열은 이의 3' 말단에서 전사 개시 부위에 의해 결합될 수 있으며, 배경 위에서 검출 가능한 수준으로 전사를 개시하는 데 필요한 최소한의 염기 또는 요소의 수를 포함하도록 업스트림(5' 방향)으로 연장된다.
본원에 사용된 "인핸서"라는 용어는, 핵산 서열의 전사 활성화를 증가시키기 위해 하나 이상의 단백질(예를 들어, 활성화 단백질 또는 전사인자)과 결합하는 시스-작용 조절 서열(예를 들어, 50개 내지 1,500개 염기쌍)을 나타낸다. 인핸서는 이들이 조절하는 유전자 시작 부위의 업스트림 또는 유전자 시작 부위의 다운스트림에 최대 1,000,000개 염기쌍으로 배치될 수 있다. 인핸서는 인트론 영역 내, 또는 관련없는 유전자의 엑손 영역에 배치될 수 있다.
프로모터는 이것이 조절하는 핵산 서열의 발현을 유도하거나 전사를 유도한다고 할 수 있다. "작동 가능하게 연결된", "작동적으로 배치된", "작동적으로 연결된", "제어 하에 있는" 및 "전사 제어 하에 있는"이라는 구절은, 프로모터가 해당 서열의 전사 개시 및/또는 발현을 제어하기 위해 조절하는 핵산 서열에 대해 정확한 기능적 위치 및/또는 배향으로 존재한다는 것을 나타낸다. 본원에 사용된 "역 프로모터"는, 코딩 가닥이 비코딩 가닥이 되고, 그 반대로도 되도록, 핵산 서열이 역 배향으로 존재하는 프로모터를 나타낸다. 역 프로모터 서열은 다양한 구현예에서 스위치의 상태를 조절하는 데 사용될 수 있다. 또한, 다양한 구현예에서, 프로모터는 인핸서와 함께 사용될 수 있다.
프로모터는 주어진 유전자 또는 서열의 코딩 분절 및/또는 엑손의 업스트림에 위치한 5' 비코딩 서열을 단리하여 얻을 수 있는 바와 같이 유전자 또는 서열과 자연적으로 연관된 것일 수 있다. 이러한 프로모터는 "내인성"으로 지칭될 수 있다. 유사하게, 일부 구현예에서, 인핸서는 해당 서열의 다운스트림 또는 업스트림에 위치한, 핵산 서열과 자연적으로 연관된 것일 수 있다.
일부 구현예에서, 코딩 핵산 분절은 "재조합 프로모터" 또는 "이종 프로모터"의 제어 하에 배치되며, 여기서 두 가지 프로모터는 모두 자연 환경에서 작동 가능하게 연결된 인코딩된 핵산 서열과 통상적으로 연관되지 않은 프로모터를 나타낸다. 재조합 또는 이종 인핸서는, 자연 환경에서 주어진 핵산 서열과 통상적으로 연관되지 않은 인핸서를 나타낸다. 이러한 프로모터 또는 인핸서는, 다른 유전자의 프로모터 또는 인핸서; 임의의 다른 원핵생물, 바이러스 또는 진핵생물 세포에서 단리된 프로모터 또는 인핸서; 및 "자연 발생"이 아닌, 즉, 상이한 전사조절 영역의 상이한 요소, 및/또는 당업계에 공지된 유전자 조작 방법을 통해 발현을 변경시키는 돌연변이를 포함하는 합성 프로모터 또는 인핸서를 포함할 수 있다. 프로모터와 인핸서의 핵산 서열을 합성적으로 생성하는 것에 더하여, 프로모터 서열은 본원에 개시된 합성 생물학적 회로 및 모듈과 관련하여, 재조합 클로닝 및/또는 핵산 증폭 기술(PCR 포함)을 사용하여 생성될 수 있다(예를 들어, 미국 특허 제4,683,202호, 미국 특허 제5,928,906호(이들은 각각 본원에 참조로서 인용됨) 참조). 나아가, 미토콘드리아, 엽록체 등과 같은 비(非)핵 세포소기관 내 서열의 전사 및/또는 발현을 지시하는 제어 서열이 또한 이용될 수 있다고 고려된다.
본원에 기재된 "유도성 프로모터"는, 유도제 또는 유도 작용제의 존재 하에 있거나, 이에 의해 영향을 받거나 또는 이와 접촉될 때 전사 활성을 개시하거나 증강시키는 것을 특징으로 하는 것이다. 본원에 정의된 "유도제" 또는 "유도 작용제"는, 유도성 프로모터로부터 전사 활성을 유도하는 데 활성이 되는 방식으로 투여되는, 내인성, 또는 통상적으로 외인성 화합물 또는 단백질일 수 있다. 일부 구현예에서, 유도제 또는 유도 작용제, 즉, 화학물질, 화합물 또는 단백질은, 그 자체가 핵산 서열의 전사 또는 발현 결과일 수 있으며(즉, 유도제는 또 다른 구성요소 또는 모듈에 의해 발현된 유도제 단백질일 수 있음), 이는 유도성 프로모터의 제어 하에 있을 수 있다. 일부 구현예에서, 유도성 프로모터는 억제인자와 같은 특정 작용제의 부재 하에서 유도된다. 유도성 프로모터의 예에는, 비제한적으로, 테트라시클린(tetracycline), 메탈로티오닌(metallothionine), 엑디손(ecdysone), 포유류 바이러스(예를 들어, 아데노바이러스 후기 프로모터; 및 마우스 유선종양바이러스 긴말단반복서열(MMTV-LTR)), 및 다른 스테로이드 반응성 프로모터, 라파마이신(rapamycin) 반응성 프로모터 등이 포함된다.
본원에서 교환가능하게 사용되는 "DNA 조절 서열", "제어 요소" 및 "조절 요소"라는 용어는, 비코딩 서열(예를 들어, DNA 표적화 RNA) 또는 코딩 서열(예를 들어, 부위 지정 변형 폴리펩타이드 또는 Cas9/Csn1 폴리펩타이드)을 제공하고/하거나 이의 전사를 조절하고/하거나, 인코딩된 폴리펩타이드의 전사를 조절하는, 프로모터, 인핸서, 폴리아데닐화 신호, 종결인자, 단백질 분해 신호 등과 같은 전사 및 번역 제어 서열을 나타낸다.
"작동 가능하게 연결된"이란, 기재된 바와 같은 구성요소가 의도된 방식으로 기능할 수 있도록 하는 관계에 있는 근접부위(juxtaposition)를 나타낸다. 예를 들어, 프로모터가 전사 또는 발현에 영향을 미치는 경우 프로모터는 코딩 서열에 작동 가능하게 연결되어 있다. "발현 카세트"는, ceDNA 벡터에서 전이유전자의 전사를 지시하는 데 충분한 프로모터 또는 다른 조절 서열에 작동 가능하게 연결된 이종 DNA 서열을 포함한다. 적합한 프로모터에는, 예를 들어 조직 특이적 프로모터가 포함된다. 프로모터는 또한 AAV 기원일 수 있다.
본원에 사용된 "대상"이라는 용어는, 본 발명에 따른 ceDNA 벡터로 치료(예방적 치료 포함)가 제공되는 인간 또는 동물을 나타낸다. 통상적으로, 동물은, 비제한적으로, 영장류, 설치류, 가축 또는 사냥감 동물과 같은 척추동물이다. 영장류에는, 비제한적으로, 침팬지, 시노몰구스 원숭이, 스파이더 원숭이 및 마카크(macaque), 예를 들어 레서스(Rhesus)가 포함된다. 설치류에는, 마우스, 래트, 마멋(woodchuck), 페럿(ferret), 토끼 및 햄스터가 포함된다. 가축 및 사냥감 동물에는, 비제한적으로, 소, 말, 돼지, 사슴, 들소, 버팔로, 고양이과 종류(예를 들어, 집고양이), 갯과 종류(예를 들어, 개, 여우, 늑대), 조류(예를 들어, 닭, 에뮤, 타조) 및 어류(송어, 메기 및 연어)가 포함된다. 본원에 기재된 양태의 특정 구현예에서, 대상은 포유류, 예를 들어 영장류 또는 인간이다. 대상은 남성 또는 여성일 수 있다. 또한, 대상은 유아 또는 어린이일 수 있다. 일부 구현예에서, 대상은 신생아 또는 태어나지 않은 대상, 예를 들어 자궁에 있는 대상일 수 있다. 바람직하게는, 대상은 포유류이다. 포유류는 인간, 비인간 영장류, 마우스, 래트, 개, 고양이, 말 또는 소일 수 있지만, 이러한 예에 제한되지 않는다. 인간 이외의 포유류는 질환 및 장애의 동물 모델을 나타내는 대상으로 유리하게 사용될 수 있다. 또한, 본원에 기재된 방법 및 조성물은 가축 및/또는 애완동물에 대해 사용될 수 있다. 인간 대상은 임의의 연령, 성별, 인종 또는 민족, 예를 들어 코카시안(백인), 아시아인, 아프리카인, 흑인, 아프리카계 미국인, 아프리카계 유럽인, 히스패닉계, 중동인 등일 수 있다. 일부 구현예에서, 대상은 임상 설정에서의 환자 또는 다른 대상일 수 있다. 일부 구현예에서, 대상은 이미 치료를 받고 있다. 일부 구현예에서, 대상은 배아, 태아, 신생아, 유아, 아동, 청소년 또는 성인이다. 일부 구현예에서, 대상은 인간 태아, 인간 신생아, 인간 유아, 인간 아동, 인간 청소년 또는 인간 성인이다. 일부 구현예에서, 대상은 동물 배아, 또는 비인간 배아 또는 비인간 영장류 배아이다. 일부 구현예에서, 대상은 인간 배아이다.
본원에 사용된 "숙주세포"라는 용어는, 본 개시내용의 핵산 구조체 또는 ceDNA 발현 벡터를 이용한 형질전환, 트랜스펙션, 형질도입 등에 민감한 임의의 세포 유형을 나타낸다. 비제한적인 예로서, 숙주세포는 단리된 1차 세포, 다능성줄기세포, CD34+ 세포), 유도된 다능성줄기세포, 또는 다수의 불멸화된 세포주 중 임의의 것(예를 들어, HepG2 세포)일 수 있다. 대안적으로, 숙주세포는 조직, 기관 또는 유기체의 제자리 또는 생체내 세포일 수 있다.
"외인성"라는 용어는, 천연 공급원 이외의 세포에 존재하는 물질을 나타낸다. 본원에 사용된 "외인성"이라는 용어는, 인간의 손이 관여하는 과정에 의해 세포 또는 유기체와 같은 생물학적 시스템에 도입된 핵산(예를 들어, 폴리펩타이드를 인코딩하는 핵산) 또는 폴리펩타이드로서, 통상적으로 발견되지 않으며 인간이 이러한 세포 또는 유기체에 도입하고자 하는 핵산 또는 폴리펩타이드를 나타낼 수 있다. 대안적으로, "외인성"은, 인간의 손이 관여하는 과정에 의해 세포 또는 유기체와 같은 생물학적 시스템에 도입된 핵산 또는 폴리펩타이드로서, 비교적 낮은 수준으로 발견되며, 인간이, 예를 들어 이소성(ectopic) 발현 또는 수준을 생성하도록 이러한 세포 또는 유기체 내 핵산 또는 폴리펩타이드의 양을 증가시키기 위해 도입하고자 하는 핵산 또는 폴리펩타이드를 나타낼 수 있다. 대조적으로, "내인성"이라는 용어는, 생물학적 시스템 또는 세포에 고유한 물질을 나타낸다.
"서열 동일성"이라는 용어는, 2개의 뉴클레오타이드 서열 사이의 관련성을 나타낸다. 본 개시내용의 목적을 위해, 2개의 데옥시리보뉴클레오타이드 서열 사이의 서열 동일성 정도는 EMBOSS 패키지(EMBOSS: The European Molecular Biology Open Software Suite, 상기 Rice 등의 문헌(2000) 참조)의 니들(Needle) 프로그램(바람직하게는 버전 3.0.0 이상)에서 구현된 바와 같이 니들만 브니쉬(Needleman-Wunsch) 알고리즘(상기 Needleman 및 Wunsch의 문헌(1970) 참조)을 사용하여 결정된다. 사용되는 선택적 매개변수는 갭 오픈 패널티 10, 갭 연장 패널티 0.5 및 EDNAFULL(NCBI NUC4.4의 EMBOSS 버전) 치환 매트릭스이다. 니들 표지된 "최장 동일성"의 출력(-nobrief 옵션을 사용하여 수득됨)은 동일성%로 사용되며, 이는 다음과 같이 계산된다: (동일한 데옥시뉴클레오타이드 x 100)/(정렬 길이 - 정렬의 총 갭 수). 정렬의 길이는 바람직하게는 적어도 10개 뉴클레오타이드, 바람직하게는 적어도 25개 뉴클레오타이드, 더욱 바람직하게는 적어도 50개 뉴클레오타이드 및 가장 바람직하게는 적어도 100개 뉴클레오타이드이다.
본원에 사용된 "상동성" 또는 "상동"이라는 용어는, 최대 서열 동일성%를 달성하기 위해, 필요한 경우, 서열을 정렬하고 갭을 도입한 후, 표적 염색체 상의 상응하는 서열의 뉴클레오타이드 잔기와 동일한 뉴클레오타이드 잔기의 백분율로 정의된다. 뉴클레오타이드 서열 상동성%를 결정하기 위한 정렬은, 예를 들어 BLAST, BLAST-2, ALIGN, ClustalW2 또는 Megalign(DNASTAR) 소프트웨어와 같은 공개적으로 이용 가능한 컴퓨터 소프트웨어를 사용하여, 당업계의 기술 내에서 다양한 방법으로 달성될 수 있다. 당업자는 비교되는 서열의 전체 길이에 걸쳐 최대 정렬을 달성하는 데 필요한 임의의 알고리즘을 포함하여, 서열 정렬을 위한 적절한 매개변수를 결정할 수 있다. 일부 구현예에서, 예를 들어 상동성 아암의 핵산 서열(예를 들어, DNA 서열)은, 서열이 숙주세포의 상응하는 천연 또는 미편집된 핵산 서열(예를 들어, 게놈 서열)과 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 이상 동일한 경우, "상동"인 것으로 간주된다.
본원에 사용된 "이종"이라는 용어는, 각각, 천연 핵산 또는 단백질에서 발견되지 않는 뉴클레오타이드 또는 폴리펩타이드 서열을 의미한다. 이종 핵산 서열은 (예를 들어, 유전자 조작에 의해) 자연 발생 핵산 서열(또는 이의 변이체)에 연결되어, 키메라 폴리펩타이드를 인코딩하는 키메라 뉴클레오타이드 서열을 생성할 수 있다. 이종 핵산 서열은 (예를 들어, 유전자 조작에 의해) 변이형 폴리펩타이드에 연결되어, 융합 변이형 폴리펩타이드를 인코딩하는 뉴클레오타이드 서열을 생성할 수 있다.
본원에 사용된 "벡터" 또는 "발현 벡터"는, 세포 내 부착된 분절의 복제를 야기하도록, 또 다른 DNA 분절, 즉, "삽입물"에 부착될 수 있는, 플라스미드, 박미드, 파지, 바이러스, 비리온 또는 코스미드(cosmid)와 같은 레플리콘이다. 벡터는 숙주세포로의 전달, 또는 상이한 숙주세포 사이에서의 전달을 위해 설계된 핵산 구조체일 수 있다. 본원에 사용된 벡터는 본래 및/또는 최종 형태가 바이러스성 또는 비바이러스성일 수 있지만, 본 개시내용의 목적을 위해, "벡터"는 일반적으로 본원에 사용된 바와 같은 용어로서의 ceDNA 벡터를 나타낸다. "벡터"라는 용어는, 적절한 제어 요소와 결합될 때 복제 가능하고, 유전자 서열을 세포에 전달할 수 있는 임의의 유전 요소를 포함한다. 일부 구현예에서, 벡터는 발현 벡터 또는 재조합 벡터일 수 있다.
본원에 사용된 "발현 벡터"라는 용어는, 벡터 상의 전사 조절 서열에 연결된 서열로부터 RNA 또는 폴리펩타이드의 발현을 지시하는 벡터를 나타낸다. 발현된 서열은 종종, 반드시는 아니지만, 세포에 대해 이종성일 수 있다. 발현 벡터는 추가 요소를 포함할 수 있으며, 예를 들어 발현 벡터는 2개의 복제 시스템을 가질 수 있기 때문에, 2가지 유기체에서, 예를 들어 인간 세포에서 발현을 위해, 원핵 숙주에서 클로닝 및 증폭을 위해 유지될 수 있다. "발현"이라는 용어는, 적용 가능한 경우, 비제한적으로, 예를 들어 전사, 전사체 처리, 번역 및 단백질 폴딩, 변형 및 처리를 포함하는, RNA 및 단백질의 생산, 및 적절한 경우, 단백질 분비에 관여하는 세포 과정을 나타낸다. "발현 산물"에는, 유전자에서 전사된 RNA, 및 유전자에서 전사된 mRNA의 번역에 의해 수득된 폴리펩타이드가 포함된다. "유전자"라는 용어는, 적절한 조절 서열에 작동 가능하게 연결될 때 시험관내 또는 생체내에서 RNA에 전사되는 핵산 서열(DNA)을 의미한다. 유전자는 코딩 영역의 앞뒤 영역, 예를 들어 5' 미번역(5' UTR) 또는 "리더(leader)" 서열과 3' UTR 또는 "트레일러(trailer)" 서열뿐 아니라, 개별 코딩 분절(엑손) 사이의 개재 서열(인트론)을 포함할 수도 포함하지 않을 수도 있다.
"재조합 벡터"란, 이종 핵산 서열, 또는 생체내에서 발현 가능한 "전이유전자"를 포함하는 벡터를 의미한다. 본원에 기재된 벡터가, 일부 구현예에서, 다른 적합한 조성물 및 요법과 조합될 수 있다는 것을 이해해야 한다. 일부 구현예에서, 벡터는 에피솜 상태이다. 적합한 에피솜 벡터의 사용은 대상에서 관심 뉴클레오타이드를 염색체외 DNA에 높은 카피수로 유지하여, 염색체 통합의 잠재적인 영향을 제거하는 수단을 제공한다.
본원에 사용된 "유전 질환"이라는 구절은, 부분적으로 또는 완전히, 직접적으로 또는 간접적으로, 게놈 내 하나 이상의 비정상에 의해 유발된 질환, 특히 출생 시부터 존재한 병태를 나타낸다. 비정상은 돌연변이, 삽입 또는 결실일 수 있다. 비정상은 유전자의 코딩 서열 또는 이의 조절 서열에 영향을 미칠 수 있다. 유전 질환은, 비제한적으로, PKU, DMD, 혈우병, 낭성섬유증, 헌팅턴 무도병(Huntington's chorea), 가족성 고콜레스테롤혈증(LDL 수용체 결함), 간모세포종, 윌슨병(Wilson's disease), 선천성 간 포르피린증, 유전성 간 대사장애, 레쉬 니한 증후군(Lesch Nyhan syndrome), 낫적혈구빈혈, 지중해빈혈, 색소성 건피증, 판코니 빈혈(Fanconi's anemia), 색소성망막염, 모세혈관확장성 운동실조증, 블룸 증후군(Bloom's syndrome), 망막모세포종 및 테이-삭스병(Tay-Sachs disease)일 수 있다.
본원에 사용된 "저해 폴리뉴클레오타이드"란, 제2(표적) 폴리뉴클레오타이드의 발현(전사 또는 번역)을 감소시키거나 방지하는 DNA 또는 RNA 분자를 나타낸다. 저해 폴리뉴클레오타이드에는 안티센스 폴리뉴클레오타이드, 리보자임 및 외부 가이드 서열이 포함된다. "저해 폴리뉴클레오타이드"라는 용어는, DNA 및 RNA 분자, 예를 들어 리보자임을 인코딩하는 DNA 분자와 같은 실제 저해 종을 인코딩하는 RNAi를 추가로 포함한다.
RNAi 분자, 예를 들어 siRNA 또는 miRNA의 활성과 관련하여 본원에 사용된 "유전자 침묵" 또는 "유전자 침묵된"이란, 표적 유전자에 대한 세포 내 mRNA 수준이 감소된 것을 나타낸다.
본원에 사용된 "RNAi"라는 용어는, 비제한적으로, siRNAi, shRNAi, 내인성 마이크로RNA 및 인공 마이크로RNA를 포함하는 임의의 유형의 간섭 RNA를 나타낸다. 예를 들어, 이에는, RNA의 다운스트림 처리 메커니즘에 관계없이, 이전에 siRNA로 식별된 서열이 포함된다(즉, siRNA가 mRNA의 절단을 초래하는 특정 생체내 처리 방법을 거치는 것으로 여겨지지만, 이러한 서열은 본원에 기재된 플랭킹 서열의 맥락에서 벡터에 혼입될 수 있음). "RNAi"라는 용어는, 유전자 침묵 RNAi 분자, 및 또한 유전자의 발현을 활성화시키는 RNAi 이펙터 분자를 모두 포함할 수 있다. 단지 예로서, 일부 구현예에서, 유전자를 침묵시키거나 저해하는 역할을 하는 RNAi 작용제는, 예를 들어 면역반응(예를 들어, 선천성 면역반응)을 저해하기 위한 본원에 개시된 방법, 키트 및 조성물에 유용하다.
본원에 사용된 "포함하는" 또는 "포함하다"라는 용어는, 방법 또는 조성물에 필수적이지만, 필수적인지 여부에 관계없이 명시되지 않은 요소를 포함할 수도 있는, 조성물, 방법, 및 이의 각 구성요소(들)에 관하여 사용된다.
본원에 사용된 "~로 본질적으로 이루어진"이라는 용어는, 주어진 구현예에 필요한 요소를 나타낸다. 상기 용어는, 해당 구현예의 기본적인 및 신규한 또는 기능적 특징(들)에 실질적으로 영향을 미치지 않는 요소의 존재를 허용한다. "포함하는"이라는 용어의 사용은 제한이 아닌 포함을 나타낸다.
"~로 이루어진"이라는 용어는, 구현예의 설명에 언급되지 않은 임의의 요소를 배제하는, 본원에 기재된 바와 같은 조성물, 방법 및 이의 각 구성요소를 나타낸다.
본원에 사용된 "~로 본질적으로 이루어진"이라는 용어는, 주어진 구현예에 필요한 요소를 나타낸다. 상기 용어는, 본 발명의 구현예의 기본적인 및 신규한 또는 기능적 특징(들)에 실질적으로 영향을 미치지 않는 추가 요소의 존재를 허용한다.
본 명세서 및 첨부된 청구범위에 사용된 바와 같이, 단수 형태의 표현은, 문맥에서 달리 명백하게 지시하지 않는 한, 복수의 언급 대상을 포함한다. 따라서, 예를 들어, "방법"에 대한 언급은 본원에 기재된 및/또는 본 개시내용 등을 읽을 때 당업자에게 명백해질 수 있는 유형의 하나 이상의 방법 및/또는 단계를 포함한다. 유사하게, "또는 "이라는 단어는, 문맥에서 달리 명백하게 지시되지 않는 한, "및"을 포함한다. 본원에 기재된 바와 유사하거나 동등한 방법 및 재료가 본 개시내용의 실시 또는 시험에 사용될 수 있지만, 적합한 방법 및 재료가 하기에 기재된다. "e.g."라는 약어는, 라틴어 예를 들어(exempli gratia)에서 유도된 것이며, 이는 본원에서 비제한적인 예를 나타내기 위해 사용된다. 따라서, "e.g."라는 약어는, "예를 들어"라는 용어와 동의어이다.
본원에 개시된 본 발명의 대안적인 요소 또는 구현예의 그룹화는 제한으로 해석되어서는 안 된다. 각각의 그룹 구성원은 개별적으로, 또는 그룹의 다른 구성원 또는 본원에서 확인되는 다른 요소와 조합으로 참조되고 청구될 수 있다. 그룹의 하나 이상의 구성원은 편의성 및/또는 특허성의 이유로 그룹에 포함되거나, 그룹에서 결실될 수 있다. 임의의 이러한 포함 또는 결실이 발생하는 경우, 본 명세서는 본원에 변형된 그룹을 포함하는 것으로 간주되어 첨부된 청구범위에 사용된 모든 마쿠쉬(Markush) 그룹에 대한 서면 기재를 충족시킨다.
임의의 양태의 일부 구현예에서, 본원에 기재된 개시내용은 인간을 클로닝하는 방법, 인간의 생식계열 유전자 정체성을 변형시키는 방법, 산업적 또는 상업적 목적을 위한 인간 배아의 사용, 또는 인간 또는 동물에게의 임의의 실질적인 의학적 유익 없이 고통을 야기할 수 있는 동물의 유전적 정체성을 변형시키는 방법, 및 또한 이러한 방법의 결과로서의 동물에 관한 것이 아니다.
다른 용어는 본 발명의 다양한 양태의 설명 내에서 본원에 정의된 바와 같다.
본 출원 전반에 걸쳐 인용된 모든 특허 및 다른 간행물(문헌 참조, 등록된 특허, 공개된 특허 출원 및 동시 계류중인 특허 출원 포함)은, 예를 들어 본원에 기재된 기술과 관련하여 사용될 수 있는 이러한 간행물에 기재된 방법론을 설명 및 개시하기 위한 목적으로 명백하게 본원에 참조로서 인용된다. 이러한 간행물은 본 출원의 출원일 이전의 개시내용에 대해서만 제공된다. 이와 관련하여, 선행 발명으로 인해 또는 임의의 다른 이유로, 본 발명자가 그러한 개시내용보다 선행할 자격이 없다는 것을 인정하는 것으로 해석되어서는 안 된다. 이러한 문서의 내용에 대한 날짜 또는 표현에 대한 모든 진술은 출원인이 이용 가능한 정보를 기반으로 하며, 이러한 문헌의 날짜 또는 내용의 정확성에 대한 승인을 구성하는 것으로 여겨지지 않는다.
본 개시내용의 구현예의 설명은 개시된 정확한 형태로 본 개시내용을 제한하거나, 완전한 것으로서 의도되지 않는다. 본 개시내용의 특정 구현예 및 이에 대한 예는 예시의 목적으로 본원에 기재되었으며, 당업자가 이해하는 바와 같이 본 개시내용의 범위 내에서 다양한 등가의 변형이 이루어질 수 있다. 예를 들어, 방법 단계 또는 기능이 주어진 순서로 제시되어 있지만, 대안적인 구현예는 상이한 순서로 기능을 수행할 수 있거나, 기능들이 실질적으로 동시에 수행될 수 있다. 본원에 제공된 개시내용의 교시는 적절하게 다른 절차 또는 방법에 적용될 수 있다. 본원에 기재된 다양한 구현예는 조합되어 추가 구현예를 제공할 수 있다. 본 개시내용의 양태는, 필요한 경우, 본 개시내용의 추가의 구현예를 제공하기 위해 상기 참고문헌 및 적용의 조성물, 기능 및 개념을 이용하도록 변형될 수 있다. 나아가, 생물학적 기능 동등성을 고려할 때, 생물학적 또는 화학적 작용의 종류 또는 양에 영향을 미치지 않는 한 단백질 구조에 약간의 변경이 이루어질 수 있다. 이러한 및 다른 변경은 상세한 설명을 고려하여 이루어질 수 있다. 모든 이러한 변형은 첨부된 청구범위의 범위 내에 포함되는 것으로 의도된다.
전술한 구현예 중 임의의 것의 특정 요소는 조합되거나, 다른 구현예의 요소로 치환될 수 있다. 나아가, 본 개시내용의 특정 구현예와 관련된 이점이 이러한 구현예의 맥락에서 기재되어 있지만, 다른 구현예 또한 이러한 이점을 나타낼 수 있으며, 모든 구현예가 본 개시내용의 범위 내에 속하기 위해 반드시 이러한 이점을 나타낼 필요가 있는 것은 아니다.
본원에 기재된 기술은 하기 예에 의해 추가로 예시되며, 이러한 예는 어떠한 방식으로든 추가적인 제한으로 해석되어서는 안 된다. 본 발명이 본원에 기재된 특정 방법론, 프로토콜 및 시약 등에 제한되지 않고, 달라질 수 있다는 것을 이해해야 한다. 본원에 사용된 용어는 단지 특정 구현예를 설명하기 위한 목적이며, 청구범위에 의해서만 한정되는 본 발명의 범위를 제한하고자 하는 것이 아니다.
II. 폐쇄형 DNA(ceDNA) 벡터로부터 PAH 단백질의 발현
본원에 기재된 기술은 일반적으로 비바이러스성 DNA 벡터, 예를 들어 본원에 기재된 바와 같은 ceDNA 벡터로부터의 세포 내 PAH 단백질의 발현 및/또는 생산에 관한 것이다. PAH 단백질의 발현을 위한 ceDNA 벡터는 본원의 "ceDNA 벡터 전반"이라는 제목의 섹션에 기재되어 있다. 특히, PAH 단백질의 발현을 위한 ceDNA 벡터는 (예를 들어, 본원에 기재된 바와 같은 대칭 또는 비대칭인) ITR 쌍과, ITR 쌍 사이에, 프로모터 또는 조절 서열에 작동적으로 연결된 본원에 기재된 바와 같은 PAH 단백질을 인코딩하는 핵산을 포함한다. 전형적인 AAV 벡터, 및 심지어 렌티바이러스 벡터에 비해 PAH 단백질의 발현을 위한 ceDNA 벡터의 뚜렷한 이점은, 목적하는 단백질을 인코딩하는 이종 핵산 서열에 크기 제한이 없다는 점이다. 따라서, 심지어 전장 6.8 kb PAH 단백질도 단일 ceDNA 벡터로부터 발현될 수 있다. 따라서, 본원에 기재된 ceDNA 벡터는 이를 필요로 하는 대상, 예를 들어 PKU를 앓고 있는 대상에서 치료용 PAH 단백질을 발현시키는 데 사용될 수 있다.
당업자가 이해하는 바와 같이, 본원에 기재된 ceDNA 벡터 기술은 임의의 복잡성 수준에 맞게 조정될 수 있거나, PAH 단백질의 상이한 구성요소의 발현이 독립적인 방식으로 제어될 수 있는 모듈 방식으로 사용될 수 있다. 예를 들어, 구체적으로, 본원에 설계된 ceDNA 벡터 기술은 단일 이종 유전자 서열(예를 들어, PAH 단백질)을 발현시키기 위해 단일 ceDNA 벡터를 사용하는 바와 같이 간단할 수 있거나, 다중 ceDNA 벡터를 사용(여기서 각각의 벡터는 상이한 프로모터에 의해 각각 독립적으로 제어되는 다수의 PAH 단백질, 또는 관련 보조인자 또는 부속 단백질을 발현시킴)하는 바와 같이 복잡할 수 있다고 고려된다. 하기 구현예는 본원에서 구체적으로 고려되며, 목적하는 바 대로 당업자에 의해 조정될 수 있다.
하나의 구현예에서, 단일 ceDNA 벡터를 사용하여 PAH 단백질의 단일 구성요소를 발현시킬 수 있다. 대안적으로, 단일 ceDNA 벡터를 사용하여 단일 프로모터(예를 들어, 강력한 프로모터)의 제어 하에서 PAH 단백질의 다수의 구성요소(예를 들어, 적어도 2개)를 발현시킬 수 있으며, 선택적으로 IRES 서열(들)을 사용하여, 구성요소, 예를 들어 보조인자 또는 부속 단백질 각각의 적합한 발현을 보장할 수 있다.
또 다른 구현예에서, 적어도 2개의 삽입물을 포함하는(예를 들어, 중쇄 또는 경쇄를 발현시킴) 단일 ceDNA 벡터가 또한 본원에서 고려되며, 여기서 각각의 삽입물의 발현은 이의 고유한 프로모터의 제어 하에 있다. 프로모터는 동일한 프로모터의 다중 카피, 다수의 상이한 프로모터 또는 이들의 임의의 조합을 포함할 수 있다. 당업자가 이해하는 바와 같이, PAH 단백질의 구성요소를 상이한 발현 수준으로 발현시키는 것이 종종 바람직하기 때문에, 세포 내 효율적인 PAH 단백질 폴딩 및 조합을 보장하기 위해 발현되는 개별 구성요소의 화학량론을 제어한다.
당업자에 의해 ceDNA 벡터 기술의 추가적인 변형이 구상될 수 있거나, 통상적인 벡터를 사용하는 단백질 생산 방법이 조정될 수 있다.
A. 핵산
가능성 있는 치료용 핵산 분자의 특징분석 및 개발이 본원에 제공된다. 일부 구현예에 따르면, 치료용 핵산은 PAH 단백질을 인코딩한다. 일부 구현예에서, 생체내 특성(전달, 안정성, 수명, 폴딩, 표적 특이성)의 변경 및 개선을 위한 올리고뉴클레오타이드의 화학적 변형뿐 아니라, 적절한 경우, 치료적 적용과 직접적인 상관관계가 있는 이의 생물학적 기능 및 메커니즘이 본원에 기재되어 있다.
면역자극성이며 본원에 개시된 면역억제제의 사용을 필요로 할 수 있는 본 개시내용의 예시적인 치료용 핵산은, 비제한적으로, 미니유전자, 플라스미드, 미니서클, 소형 간섭 RNA(siRNA), 마이크로RNA(miRNA), 안티센스 올리고뉴클레오타이드(ASO), 리보자임, 폐쇄형 이중가닥 DNA(예를 들어, ceDNA, CELiD, 선형의 공유결합으로 폐쇄된 DNA("미니스트링"), 개뼈형 DNA(dbDNA™), 프로텔로미어 폐쇄형 DNA 또는 덤벨 선형 DNA), 다이서-기질 dsRNA, 소형 헤어핀 RNA(shRNA), 비대칭 간섭 RNA(aiRNA), 마이크로RNA(miRNA), mRNA, tRNA, rRNA, 및 DNA 바이러스성 벡터, 바이러스성 RNA 벡터, 및 이들의 임의의 조합을 포함할 수 있다.
RNA 간섭(RNAi)으로 불리는 과정을 통해 특정 단백질의 세포내 수준을 하향조절할 수 있는 siRNA 또는 miRNA가 또한 본 발명에서 핵산 치료제로 고려된다. siRNA 또는 miRNA가 숙주세포의 세포질에 도입된 후, 이러한 이중가닥 RNA 구조체는 RISC로 불리는 단백질에 결합할 수 있다. siRNA 또는 miRNA의 센스 가닥은 RISC 복합체에 의해 제거된다. RISC 복합체는, 상보적 mRNA와 조합될 때, mRNA를 절단하고 절단된 가닥을 방출한다. RNAi는 mRNA의 특이적 파괴를 유도하여, 상응하는 단백질을 하향조절한다.
단백질로의 mRNA 번역을 저해하는 안티센스 올리고뉴클레오타이드(ASO)와 리보자임은, 핵산 치료제일 수 있다. 안티센스 구조체의 경우, 이러한 단일가닥 데옥시핵산은 표적 단백질 mRNA의 서열에 상보적인 서열, 및 mRNA에 결합할 수 있는 왓슨-크릭(Watson-Crick) 염기쌍을 갖는다. 이러한 결합은 표적 mRNA의 번역을 방지하고/하거나 mRNA 전사체의 RNaseH 분해를 촉발시킨다. 그 결과, 안티센스 올리고뉴클레오타이드는 작용의 특이성(즉, 특정 질환 관련 단백질의 하향조절)이 증가했다.
본원에 제공된 임의의 방법에서, 치료용 핵산은 치료용 RNA일 수 있다. 치료용 RNA는 mRNA 번역 저해제, RNA 간섭 작용제(RNAi), 촉매 활성 RNA 분자(리보자임), 전달 RNA(tRNA), 또는 mRNA 전사체(ASO), 단백질 또는 다른 분자 리간드(압타머)에 결합하는 RNA일 수 있다. 본원에 제공된 임의의 방법에서, RNAi 작용제는 이중가닥 RNA, 단일가닥 RNA, 마이크로RNA, 짧은 간섭 RNA, 짧은 헤어핀 RNA 또는 삼중체 형성 올리고뉴클레오타이드일 수 있다.
일부 구현예에 따르면, 치료용 핵산은 폐쇄형 이중가닥 DNA, 예를 들어 ceDNA이다. 일부 구현예에 따르면, 세포 내 치료용 단백질의 발현 및/또는 생산은 비바이러스성 DNA 벡터, 예를 들어 ceDNA 벡터에서 유래한 것이다. 전형적인 AAV 벡터, 및 심지어 렌티바이러스 벡터에 비해 치료용 단백질의 발현을 위한 ceDNA 벡터의 뚜렷한 이점은, 목적하는 단백질을 인코딩하는 이종 핵산 서열에 대한 크기 제한이 없다는 점이다. 따라서, 심지어 거대한 치료용 단백질도 단일 ceDNA 벡터로부터 발현될 수 있다. 따라서, ceDNA 벡터는 이를 필요로 하는 대상에서 치료용 단백질을 발현시키는 데 사용될 수 있다.
일반적으로, 본원에 개시된 바와 같은 치료용 단백질의 발현을 위한 ceDNA 벡터는, 5'→3' 방향으로, 제1 아데노연관바이러스(AAV) 역말단반복서열(ITR), 관심 뉴클레오타이드 서열(예를 들어, 본원에 기재된 바와 같은 발현 카세트) 및 제2 AAV ITR을 포함한다. ITR 서열은, (i) 적어도 하나의 WT ITR과 적어도 하나의 변형된 AAV 역말단반복서열(mod-ITR)(예를 들어, 비대칭인 변형된 ITR); (ii) 2개의 변형된 ITR(여기서 mod-ITR 쌍은 서로에 대해 상이한 3차원 공간 구성을 가짐)(예를 들어, 비대칭인 변형된 ITR), 또는 (iii) 대칭 또는 실질적으로 대칭인 WT-WT ITR 쌍(여기서 각각의 WT-ITR은 동일한 3차원 공간 구성을 가짐), 또는 (iv) 대칭 또는 실질적으로 대칭인 변형된 ITR 쌍(여기서 각각의 mod-ITR은 동일한 3차원 공간 구성을 가짐) 중 임의의 것에서 선택된다.
일부 구현예에서, PAH 단백질을 인코딩하는 전이유전자는 또한 PAH 단백질이 골지체 및 소포체로 향하도록 분비 서열을 인코딩할 수 있으며, 여기서 PAH 단백질은 ER을 통과하여 세포 밖으로 나올 때 샤페론 분자에 의해 정확한 형태로 폴딩될 것이다. 예시적인 분비 서열에는, 비제한적으로, VH-02(서열번호 88) 및 VK-A26(서열번호 89) 및 IgK 신호 서열(서열번호 126)뿐 아니라, 태그된 단백질이 시토졸 외부로 분비되게 하는 Gluc 분비 신호(서열번호 188), 태그된 단백질이 골지로 향하게 하는 TMD-ST 분비 서열(서열번호 189)이 포함된다.
조절 스위치는 또한, PAH 단백질이 목적하는 대로 발현되도록(비제한적으로, 목적하는 발현 수준 또는 양으로PAH 단백질이 발현되는 것을 포함함), 또는 대안적으로, 세포 신호전달 사건을 포함하는 특정 신호의 존재 또는 부재 하에 있을 때, PAH 단백질의 발현을 미세 조정하는 데 사용될 수 있다. 예를 들어, 본원에 기재된 바와 같이, ceDNA 벡터로부터 PAH 단백질의 발현은 조절 스위치라는 제목의 섹션에 본원에 기재된 바와 같이, 특정 조건이 발생하는 경우, 켜지거나 꺼질 수 있다.
예를 들어, 단지 예시의 목적으로, PAH 단백질은 PAH 단백질의 너무 높은 생산 수준과 같은 바람직하지 않은 반응을 차단하는 데 사용될 수 있다. PAH 유전자는 PAH 단백질을 목적하는 세포로 가져오기 위한 신호 펩타이드 마커를 함유할 수 있다. 하지만, 어느 상황에서도, PAH 단백질의 발현을 조절하는 것이 바람직할 수 있다. ceDNA 벡터는 조절 스위치의 사용을 용이하게 수용한다.
전형적인 AAV 벡터, 및 심지어 렌티바이러스 벡터에 비해 ceDNA 벡터의 뚜렷한 이점은, PAH 단백질을 인코딩하는 이종 핵산 서열에 대한 크기 제한이 없다는 점이다. 따라서, 심지어 전장 PAH뿐 아니라, 선택적으로 임의의 보조인자 또는 부속 단백질도 단일 ceDNA 벡터로부터 발현될 수 있다. 또한, 필요한 화학량론에 따라, 동일한 PAH 단백질의 다수의 분절을 발현시킬 수 있고, 동일하거나 상이한 프로모터를 사용할 수 있고, 각각의 영역의 발현을 미세 조정하기 위해 조절 스위치를 사용할 수도 있다. 예를 들어, 실시예에 제시된 바와 같이, PAH 단백질의 각각의 도메인에 대해 상이한 프로모터가 사용되는, 이중 프로모터 시스템을 포함하는 ceDNA 벡터가 사용될 수 있다. PAH 단백질의 생산을 위한 ceDNA 플라스미드의 사용은, 기능성 PAH 단백질의 형성을 위한 각각의 도메인의 적절한 비를 유도하는, PAH 단백질의 도메인의 발현을 위한 프로모터의 고유한 조합을 포함할 수 있다. 따라서, 일부 구현예에서, ceDNA 벡터는 (예를 들어, 상이한 프로모터의 제어 하에서) PAH 단백질의 상이한 영역을 개별적으로 발현시키는 데 사용될 수 있다.
또 다른 구현예에서, ceDNA 벡터로부터 발현된 PAH 단백질은 형광, 효소 활성, 분비 신호 또는 면역세포 활성화제와 같은 추가 기능을 추가로 포함한다.
일부 구현예에서, PAH 단백질을 인코딩하는 ceDNA는, 예를 들어 링커 도메인을 추가로 포함할 수 있다. 본원에 사용된 "링커 도메인"이란, 본원에 기재된 바와 같은 PAH 단백질의 임의의 도메인/영역을 함께 연결하는, 약 2개 내지 100개 아미노산 길이의 올리고- 또는 폴리펩타이드 영역을 나타낸다. 일부 구현예에서, 링커는 인접한 단백질 도메인이 서로 자유롭게 이동할 수 있도록, 글리세린 및 세린과 같은 가용성 잔기를 포함하거나 이로 구성될 수 있다. 2개의 인접한 도메인이 서로 입체적으로 간섭하지 않도록 보장하는 것이 바람직한 경우, 보다 긴 링커가 사용될 수 있다. 링커는 절단 가능하거나 절단 가능하지 않을 수 있다. 절단 가능한 링커의 예에는, 2A 링커(예를 들어, T2A), 2A 유사 링커 또는 이들의 기능성 등가물, 및 이들의 조합이 포함된다. 링커는 토세아 아시그나(Thosea asigna) 바이러스에서 유도된 T2A 링커 영역일 수 있다.
예를 들어 PAH 등의 공지된 및/또는 공개적으로 이용 가능한 단백질 서열을 취하고, 이러한 단백질을 인코딩하기 위해 cDNA 서열을 역으로 조작하는 것은 당업자의 능력 범위 내에 있다. 따라서, cDNA는 의도된 숙주세포와 매칭되도록 코돈 최적화되고 본원에 기재된 바와 같은 ceDNA 벡터에 삽입될 수 있다.
B. PAH 단백질을 발현하는 ceDNA 벡터
목적하는 PAH를 인코딩하는 하나 이상의 서열을 갖는 PAH 단백질의 발현을 위한 ceDNA 벡터는, 프로모터, 분비 신호, polyA 영역 및 인핸서와 같은 조절 서열을 포함할 수 있다. 최소한, ceDNA 벡터는 PAH 단백질을 인코딩하는 하나 이상의 이종 서열을 포함한다.
고도로 효율적이고 정확한 PAH 단백질 어셈블리를 달성하기 위해, 구체적으로, 일부 구현예에서, PAH 단백질이 이를 단백질 폴딩이 일어나는 ER로 향하게 하는 소포체 ER 리더 서열을 포함하는 것으로 고려된다. 예를 들어, 폴딩을 위해 발현된 단백질(들)을 ER로 향하게 하는 서열.
일부 구현예에서, ceDNA 벡터에는, PAH 단백질이 세포내 표적(들)(예를 들어, 인트라바디) 또는 세포외 표적(들)에 결합될 수 있도록 PAH의 분비 또는 목적하는 세포하 국소화를 지시하는, 세포 또는 세포외 국소화 신호(예를 들어, 분비 신호, 핵 국소화 신호, 미토콘드리아 국소화 신호 등)가 포함되어 있다.
일부 구현예에서, 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, 모듈 방식으로 임의의 목적하는 PAH 단백질의 어셈블리 및 발현을 가능하게 한다. 본원에 사용된 "모듈(형)"이라는 용어는, 구조체로부터 쉽게 제거될 수 있는 ceDNA 발현 플라스미드의 요소를 나타낸다. 예를 들어, ceDNA 생성 플라스미드의 모듈형 요소는 구조체 내 각각의 요소를 플랭킹하는 고유한 제한 부위 쌍을 포함하여, 개별 요소의 배타적 조작을 가능하게 한다(예를 들어, 도1a 내지 도 1g 참조). 따라서, ceDNA 벡터 플랫폼은 임의의 목적하는 PAH 단백질 구성의 발현 및 어셈블리를 가능하게 할 수 있다. 다양한 구현예에서, PAH 단백질을 인코딩하는 목적하는 ceDNA 벡터를 어셈블링하는 데 필요한 조작의 양을 감소 및/또는 최소화시킬 수 있는 ceDNA 플라스미드 벡터가 본원에 제공된다.
C. ceDNA 벡터에 의해 발현되는 예시적인 PAH 단백질
특히, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 페닐케톤뇨증(PKU)의 하나 이상의 증상의 치료, 예방 및/또는 개선에 사용되는, 예를 들어, 비제한적으로, PAH 단백질뿐 아니라, 이의 변이체 및/또는 활성 단편을 인코딩할 수 있다. 하나의 양태에서, 페닐케톤뇨증(PKU)은 인간 페닐케톤뇨증(PKU)이다.
(i) PAH 치료 단백질 및 이의 단편
본질적으로, 임의의 버전의 PAH 치료 단백질 또는 이의 단편(예를 들어, 기능성 단편)이 본원에 기재된 바와 같은 ceDNA 벡터에 의해 인코딩되고, 이에서 및 이로부터 발현될 수 있다. 당업자는, PAH 치료 단백질이 PAH 단백질의 모든 스플라이스 변이체 및 이종상동체(ortholog)를 포함한다는 것을 이해할 것이다. PAH 치료 단백질에는, 온전한 분자뿐 아니라, 이의 단편(예를 들어, 기능성 단편)이 포함된다.
전형적인 AAV 벡터, 및 심지어 렌티바이러스 벡터에 비해 ceDNA 벡터의 뚜렷한 이점은, 목적하는 단백질을 인코딩하는 이종 핵산 서열에 대한 크기 제한이 없다는 점이다. 따라서, 다수의 전장 PAH 치료 단백질도 단일 ceDNA 벡터로부터 발현될 수 있다.
PAH 단백질 및 유전자: PAH 유전자는 12q22-q24.2 밴드에서 12번 염색체 상에 위치한다. 2000년 현재, 대략 400가지 질환 유발 돌연변이가 PAH 유전자에서 확인되었다. 페닐알라닌 히드록실라아제(PAH)는 페닐알라닌 4-모노옥시게나아제, 페닐알라닌-4-히드록실라아제, Phe-4-모노옥시게나아제, EC 1.14.16.1, EC 1.14.16, PKU1, PKU 또는 PH로도 지칭될 수 있다.
PAH의 단백질 서열은 다음과 같다: 호모 사피엔스 PAH 효소 번역(450개 아미노산), 수탁번호 NM_000277.3
MSTAVLENPGLGRKLSDFGQETSYIEDNCNQNGAISLIFSLKEEVGALAKVLRLFEENDVNLTHIESRPSRLKKDEYEFFTHLDKRSLPALTNIIKILRHDIGATVHELSRDKKKDTVPWFPRTIQELDRFANQILSYGAELDADHPGFKDPVYRARRKQFADIAYNYRHGQPIPRVEYMEEEKKTWGTVFKTLKSLYKTHACYEYNHIFPLLEKYCGFHEDNIPQLEDVSQFLQTCTGFRLRPVAGLLSSRDFLGGLAFRVFHCTQYIRHGSKPMYTPEPDICHELLGHVPLFSDRSFAQFSQEIGLASLGAPDEYIEKLATIYWFTVEFGLCKQGDSIKAYGAGLLSSFGELQYCLSEKPKLLPLELEKTAIQNYTVTEFQPLYYVAESFNDAKEKVRNFAATIPRPFSVRYDPYTQRIEVLDNTQQLKILADSINSEIGILCSALQK (서열번호195)
PAH는 간에서 우세하게 발현되며, 신장 및 담낭에서는 중간 정도로 발현된다. 낮은 수준의 PAH 발현은 또한 전립선, 부신에서도 검출될 수 있다. 태아 발달 동안, PAH는 부신, 심장, 장, 폐 및 위에서 발현될 수 있다. 따라서, PAH를 발현하는 ceDNA 벡터는 간, 신장, 담낭, 전립선, 부신에서 선택되는 임의의 하나 이상의 조직에 투여될 수 있다. 일부 구현예에서, PAH를 발현하는 ceDNA 벡터가 유아에게 투여되거나 대상의 자궁에 투여되는 경우, PAH를 발현하는 ceDNA 벡터는 간, 부신, 심장, 장, 폐 및 위에서 선택되는 임의의 하나 이상의 조직에 투여될 수 있다.
ceDNA 벡터로부터의 PAH 치료 단백질 또는 이의 단편의 발현은 본원에 기재된 바와 같은 조절 스위치를 비롯한, 당업계에 공지되어 있거나 본원에 기재된 바와 같은 하나 이상의 유도성 또는 억제성 프로모터를 사용하여 공간적으로 및 시간적으로 달성될 수 있다.
하나의 구현예에서, PAH 치료 단백질은 이의 상응하는 천연 PAH 치료 단백질과 비교하여 변경된 아미노산 서열, 조성 또는 구조를 갖는 PAH 치료 단백질을 나타내는 "치료 단백질 변이체"이다. 하나의 구현예에서, PAH는 기능성 버전(예를 들어, 야생형)이다. 이는 또한, 예를 들어 질환의 동물 모델 및/또는 페닐케톤뇨증(PKU)의 약물 평가를 위해, 페닐케톤뇨증(PKU)으로 이어지는 점 돌연변이 또는 결실 돌연변이와 같은 PAH 단백질의 돌연변이 버전을 발현시키는 데 유용할 수 있다. 질환 모델을 생성하기 위해, 돌연변이 또는 변형된 PAH 단백질의 세포 또는 동물 모델 시스템으로의 전달이 이루어질 수 있다. 이러한 세포 또는 동물 모델은 연구 및/또는 약물 스크리닝을 위해 사용될 수 있다. ceDNA 벡터로부터 발현된 PAH 치료 단백질은 형광, 효소 활성 또는 분비 신호와 같은 추가 기능을 부여하는 서열/모이어티를 추가로 포함할 수 있다. 하나의 구현예에서, PAH 치료 단백질 변이체는 수용 숙주세포에서 내인성 PAH 치료 단백질과 구별될 수 있도록 하는 식별을 위한 비(非)천연 태그 서열(예를 들어, 면역태그(immunotag))을 포함한다.
예를 들어 PAH 치료 단백질의 공지된 및/또는 공개적으로 이용 가능한 단백질 서열을 취하고, 이러한 단백질을 인코딩하기 위해 cDNA 서열을 역으로 조작하는 것은 당업자의 능력 범위 내에 있다. 따라서, cDNA는 의도된 숙주세포와 매칭되도록 코돈 최적화되고 본원에 기재된 바와 같은 ceDNA 벡터에 삽입될 수 있다.
하나의 구현예에서, PAH 치료 단백질 인코딩 서열은, 예를 들어 숙주에서 얻은 mRNA를 역전사시키고, PCR을 사용하여 서열을 증폭시키는 방식으로, 기존 숙주 세포 또는 세포주에서 유도될 수 있다.
(ii) ceDNA 벡터를 발현하는 PAH 치료 단백질
목적하는 PAH 치료 단백질을 인코딩하는 하나 이상의 서열을 갖는 ceDNA 벡터는, 프로모터(예를 들어, 표 1 참조), 분비 신호, polyA 영역 및 인핸서와 같은 조절 서열을 포함할 수 있다. 최소한, ceDNA 벡터는 PAH 치료 단백질 또는 이의 기능성 단편을 인코딩하는 하나 이상의 이종 서열을 포함한다. PAH 치료 단백질을 인코딩하는 ceDNA 벡터를 생성하기 위한 예시적인 카세트 삽입물은 도 1a 내지 도 1g에 도시되어 있다. 하나의 구현예에서, ceDNA 벡터는 본원의 표 1에 열거된 PAH 서열을 포함한다.
Figure pct00001
Figure pct00002
Figure pct00003
Figure pct00004
Figure pct00005
Figure pct00006
Figure pct00007
Figure pct00008
Figure pct00009
Figure pct00010
하나의 구현예에서, ceDNA 벡터는 본원의 표 1에 열거된 PAH 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 표 1에 열거된 PAH 서열과 적어도 90%의 동일성을 갖는 PAH 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 표 1에 열거된 PAH 서열과 적어도 91%의 동일성을 갖는 PAH 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 표 1에 열거된 PAH 서열과 적어도 92%의 동일성을 갖는 PAH 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 표 1에 열거된 PAH 서열과 적어도 93%의 동일성을 갖는 PAH 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 표 1에 열거된 PAH 서열과 적어도 94%의 동일성을 갖는 PAH 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 표 1에 열거된 PAH 서열과 적어도 95%의 동일성을 갖는 PAH 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 표 1에 열거된 PAH 서열과 적어도 96%의 동일성을 갖는 PAH 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 표 1에 열거된 PAH 서열과 적어도 97%의 동일성을 갖는 PAH 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 표 1에 열거된 PAH 서열과 적어도 98%의 동일성을 갖는 PAH 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 표 1에 열거된 PAH 서열과 적어도 99%의 동일성을 갖는 PAH 서열을 포함한다.
하나의 구현예에서, PAH 서열은 서열번호 380, 서열번호 381, 서열번호 382, 서열번호 383, 서열번호 384, 서열번호 385, 서열번호 386, 서열번호 387, 서열번호 388, 서열번호 389, 서열번호 390, 서열번호 391, 서열번호 392, 서열번호 393 또는 서열번호 394와 적어도 90%의 동일성을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 380, 서열번호 381, 서열번호 382, 서열번호 383, 서열번호 384, 서열번호 385, 서열번호 386, 서열번호 387, 서열번호 388, 서열번호 389, 서열번호 390, 서열번호 391, 서열번호 392, 서열번호 393 또는 서열번호 394와 적어도 91%의 동일성을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 380, 서열번호 381, 서열번호 382, 서열번호 383, 서열번호 384, 서열번호 385, 서열번호 386, 서열번호 387, 서열번호 388, 서열번호 389, 서열번호 390, 서열번호 391, 서열번호 392, 서열번호 393 또는 서열번호 394와 적어도 92%의 동일성을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 380, 서열번호 381, 서열번호 382, 서열번호 383, 서열번호 384, 서열번호 385, 서열번호 386, 서열번호 387, 서열번호 388, 서열번호 389, 서열번호 390, 서열번호 391, 서열번호 392, 서열번호 393 또는 서열번호 394와 적어도 93%의 동일성을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 380, 서열번호 381, 서열번호 382, 서열번호 383, 서열번호 384, 서열번호 385, 서열번호 386, 서열번호 387, 서열번호 388, 서열번호 389, 서열번호 390, 서열번호 391, 서열번호 392, 서열번호 393 또는 서열번호 394와 적어도 94%의 동일성을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 380, 서열번호 381, 서열번호 382, 서열번호 383, 서열번호 384, 서열번호 385, 서열번호 386, 서열번호 387, 서열번호 388, 서열번호 389, 서열번호 390, 서열번호 391, 서열번호 392, 서열번호 393 또는 서열번호 394와 적어도 95%의 동일성을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 380, 서열번호 381, 서열번호 382, 서열번호 383, 서열번호 384, 서열번호 385, 서열번호 386, 서열번호 387, 서열번호 388, 서열번호 389, 서열번호 390, 서열번호 391, 서열번호 392, 서열번호 393 또는 서열번호 394와 적어도 96%의 동일성을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 380, 서열번호 381, 서열번호 382, 서열번호 383, 서열번호 384, 서열번호 385, 서열번호 386, 서열번호 387, 서열번호 388, 서열번호 389, 서열번호 390, 서열번호 391, 서열번호 392, 서열번호 393 또는 서열번호 394와 적어도 97%의 동일성을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 380, 서열번호 381, 서열번호 382, 서열번호 383, 서열번호 384, 서열번호 385, 서열번호 386, 서열번호 387, 서열번호 388, 서열번호 389, 서열번호 390, 서열번호 391, 서열번호 392, 서열번호 393 또는 서열번호 394와 적어도 98%의 동일성을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 380, 서열번호 381, 서열번호 382, 서열번호 383, 서열번호 384, 서열번호 385, 서열번호 386, 서열번호 387, 서열번호 388, 서열번호 389, 서열번호 390, 서열번호 391, 서열번호 392, 서열번호 393 또는 서열번호 394와 적어도 99%의 동일성을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 380, 서열번호 381, 서열번호 382, 서열번호 383, 서열번호 384, 서열번호 385, 서열번호 386, 서열번호 387, 서열번호 388, 서열번호 389, 서열번호 390, 서열번호 391, 서열번호 392, 서열번호 393 또는 서열번호 394를 포함한다. 하나의 구현예에서, PAH 서열은 서열번호 380, 서열번호 381, 서열번호 382, 서열번호 383, 서열번호 384, 서열번호 385, 서열번호 386, 서열번호 387, 서열번호 388, 서열번호 389, 서열번호 390, 서열번호 391, 서열번호 392, 서열번호 393 또는 서열번호 394로 이루어져 있다.
하나의 구현예에서, PAH 서열은 서열번호 382와 적어도 85%의 동일성을 갖는 서열을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 382와 적어도 90%의 동일성을 갖는 서열을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 382와 적어도 95%의 동일성을 갖는 서열을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 382와 적어도 97%의 동일성을 갖는 서열을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 382와 적어도 99%의 동일성을 갖는 서열을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 382와 적어도 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 동일성을 갖는 서열을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 382를 포함하는 서열을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 382로 이루어진 서열을 갖는다.
하나의 구현예에서, PAH 서열은 서열번호 384와 적어도 85%의 동일성을 갖는 서열을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 384와 적어도 90%의 동일성을 갖는 서열을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 384와 적어도 95%의 동일성을 갖는 서열을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 384와 적어도 97%의 동일성을 갖는 서열을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 384와 적어도 99%의 동일성을 갖는 서열을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 384와 적어도 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 동일성을 갖는 서열을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 384를 포함하는 서열을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 384로 이루어진 서열을 갖는다.
하나의 구현예에서, PAH 서열은 서열번호 394와 적어도 85%의 동일성을 갖는 서열을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 394와 적어도 90%의 동일성을 갖는 서열을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 394와 적어도 95%의 동일성을 갖는 서열을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 394와 적어도 97%의 동일성을 갖는 서열을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 394와 적어도 99%의 동일성을 갖는 서열을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 394와 적어도 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 동일성을 갖는 서열을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 394를 포함하는 서열을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 394로 이루어진 서열을 갖는다.
(iii) PAH 치료 단백질 및 PKU의 치료를 위한 이의 용도
본원에 기재된 ceDNA 벡터는 PAH 단백질의 부적절한 발현 및/또는 PAH 단백질 내 돌연변이와 관련된 PKU의 치료를 위한 치료용 PAH 단백질을 전달하는 데 사용될 수 있다.
본원에 기재된 바와 같은 ceDNA 벡터는 임의의 목적하는 PAH 치료 단백질을 발현시키는 데 사용될 수 있다. 예시적인 치료용 PAH 치료 단백질에는, 비제한적으로, 본원의 표 1에 제시된 서열에 의해 발현되는 임의의 PAH 단백질이 포함된다.
하나의 구현예에서, 발현된 PAH 치료 단백질은 페닐케톤뇨증(PKU)의 치료에 기능성이 있다. 일부 구현예에서, PAH 치료 단백질은 면역계 반응을 야기하기 않는다.
또 다른 구현예에서, PAH 치료 단백질 또는 이의 단편(예를 들어, 기능성 단편)을 인코딩하는 ceDNA 벡터는 키메라 단백질을 생성하는 데 사용될 수 있다. 따라서, 구체적으로는, 키메라 단백질을 발현하는 ceDNA 벡터가, 예를 들어 간, 신장, 담낭, 전립선, 부신에서 선택되는 임의의 하나 이상의 조직에 투여될 수 있다고 본원에서 고려된다. 일부 구현예에서, PAH를 발현하는 ceDNA 벡터가 유아에게 투여되거나 대상의 자궁에 투여되는 경우, PAH를 발현하는 ceDNA 벡터는 페닐케톤뇨증(PKU)의 생체내 또는 생체외 치료를 위해, 간, 부신, 심장, 장, 폐 및 위에서 선택되는 임의의 하나 이상의 조직, 또는 이의 간 줄기세포 전구체에 투여될 수 있다.
PKU: PKU는 PAH 유전자의 돌연변이에 의해 유발되는 희귀한 선천성 대사 이상이다. PAH는 통상적으로 간에서 발현되며, 식이(dietary) 페닐알라닌을 신경전달물질의 생성을 담당하는 아미노산인 티로신으로 대사시키는 데 필요한 효소이다. PKU는 PAH의 효소 활성이 결핍되게 하는 PAH의 돌연변이로 인해 발생한다. 따라서, PAH 단백질을 발현하는 ceDNA 벡터는 간, 또는 광수용체 및/또는 RPE 세포와 같은 망막세포를 포함하는 다른 조직에서 PAH를 발현시킬 수 있다. 일부 구현예에서, ceDNA 벡터는 광수용체와 RPE 세포 모두에서 적어도 하나의 PAH 단백질을 발현시킨다.
PAH는 통상적으로 PR 및 RPE 세포 유형 둘 모두에서 내인성으로 발현된다. 또한, RPE에서 낮은 수준의 PAH 발현은 정상적인 망막 기능에도 필요할 수 있다고 보고되어 있다. 따라서, PR 및 또한, 선택적으로 RPE 세포에서 ceDNA 벡터에 의한 PAH 단백질의 낮은 수준 또는 높은 수준의 발현은, 때때로 망막 변성을 예방하기 위해 필요할 수 있다. 이러한 발현 수준은 본원에 기재된 바와 같은 프로모터 및/또는 조절 스위치에 의해 미세 조정될 수 있다.
따라서, 일부 구현예에서, ceDNA 벡터는 광수용체와 RPE 둘 모두에서 정상적인 레티노이드 처리를 회복시키기 위해, 내인성 프로모터(약 1 kb)로부터 6.8 kb 단백질인 PAH 단백질의 발현에 사용된다. 일부 구현예에서, PAH 단백질을 발현하는 ceDNA 벡터는 망막의 더 넓은 영역을 치료하기 위해 맥락막상 또는 유리체내 투여 경로를 통해 투여된다. 일부 구현예에서, ceDNA 벡터는 망막하 주사, 맥락막상 주사 또는 유리체내 주사 중 임의의 하나 이상을 통해 투여된다.
상기 방법은 본원에 기재된 바와 같은 PAH 치료 단백질 또는 이의 단편(예를 들어, 기능성 단편)을 인코딩하는 ceDNA 벡터를 포함하는 조성물의 유효량을 대상에게 투여하는 것을 포함한다. 당업자가 이해하는 바와 같이, "유효량"이라는 용어는, 질환 또는 장애의 치료를 위한 "치료적 유효량"으로 단백질의 발현을 유도하는, 투여되는 ceDNA 조성물의 양을 나타낸다.
PAH 치료 단백질 또는 이의 단편(예를 들어, 기능성 단편)을 인코딩하는 ceDNA 벡터를 포함하는 조성물의 투여량 범위는, 역가(예를 들어, 프로모터의 효율)에 따라 달라지며, 페닐케톤뇨증(PKU)의 치료를 위해 목적하는 효과, 예를 들어 목적하는 PAH 치료 단백질의 발현을 생성하는 데 충분히 큰 양을 포함한다. 투여량은 허용 가능하지 않은 부작용을 야기할 정도로 커서는 안 된다. 일반적으로, 투여량은 ceDNA 벡터의 특정한 특징, 발현 효율, 및 환자의 연령, 병태 및 성별에 따라 달라진다. 투여량은 당업자에 의해 결정될 수 있으며, 전형적인 AAV 벡터와 달리, ceDNA 벡터가 반복 투여를 방해하는 면역 활성화 캡시드 단백질을 포함하지 않기 때문에, 임의의 합병증 사례에서 개별 의사에 의해 조정될 수도 있다.
본원에 기재된 ceDNA 조성물의 투여는 제한된 기간 동안 반복될 수 있다. 일부 구현예에서, 용량은 주기적으로 또는 간헐적 투여로 제공된다. 바람직한 구현예에서, 상기 언급된 용량은 수개월에 걸쳐 투여된다. 치료 지속기간은 대상의 임상 진행과 치료에 대한 반응성에 따라 달라진다. 시간 경과에 따른 부스터 치료도 고려된다. 나아가, 발현 수준은 대상이 성장함에 따라 적정될 수 있다.
PAH 치료 단백질은 적어도 1주, 적어도 2주, 적어도 1개월, 적어도 2개월, 적어도 6개월, 적어도 12개월/1년, 적어도 2년, 적어도 5년, 적어도 10년, 적어도 15년, 적어도 20년, 적어도 30년, 적어도 40년, 적어도 50년 또는 그 이상 동안 대상에서 발현될 수 있다. 장기 발현은 선결된 또는 목적하는 간격으로 본원에 기재된 ceDNA 벡터를 반복 투여하는 방식으로 달성될 수 있다.
본원에 사용된 "치료적 유효량"이라는 용어는, 질환 바이오마커 발현의 통계적으로 유의하고 측정 가능한 변화, 또는 주어진 질환 증상의 감소를 생성하는 데 충분한(하기 "효능 측정" 섹션 참조), 발현된 PAH 치료 단백질 또는 이의 기능성 단편의 양이다. 이러한 유효량은 주어진 ceDNA 조성물에 대한 임상 시험 및 동물 연구에서 추정될 수 있다.
투여에 필요한 ceDNA 벡터의 정확한 양은 의사의 판단에 따라 달라지며, 각 개체마다 특정하다. 적합한 투여 방식 또한 가변적이지만, 초기 투여 후, 후속 주사 또는 다른 투여가 하나 이상의 간격으로 반복 투여되는 것이 전형적이다. 대안적으로, 특히 급성 질환/장애 치료의 경우, 생체내 치료법에 대해 명시된 범위로 혈중 농도를 유지하는 데 충분한 연속 정맥내 주입이 고려된다.
본원에 기재된 방법 및 조성물에 유용한 작용제는 국소적으로, 정맥내로(볼루스 또는 연속 주입으로), 세포내 주사로, 조직내 주사로, 경구로, 흡입으로, 복강내로, 근육내로, 피하로, 공동내로 투여될 수 있으며, 목적하는 경우, 연동 수단을 통해, 또는 당업자에게 공지된 다른 수단을 통해 전달될 수 있다. 작용제는, 목적하는 경우, 전신으로 투여될 수 있다. 이는 또한 자궁에 투여될 수 있다.
페닐케톤뇨증(PKU)에 대한 주어진 치료의 효능은 숙련된 임상의에 의해 결정될 수 있다. 하지만, 질환 또는 장애의 징후 또는 증상 중 어느 하나 또는 전부가 유익한 방식으로 변경되거나, 다른 임상적으로 허용되는 질환의 증상 또는 마커가, 예를 들어 PAH 또는 이의 기능성 단편을 인코딩하는 ceDNA 벡터로의 치료 후 적어도 10% 정도 호전되거나 개선되는 경우, 치료는 본원에 사용된 용어로 "유효한 치료"로 간주된다. 효능은 또한 질환의 안정화 또는 의학적 개입의 필요성에 의해 평가되는 바와 같이 개체의 악화 실패로 측정될 수 있다(즉, 질환의 진행이 중단되거나 적어도 느려짐). 이러한 지표의 측정 방법은 당업자에게 공지되어 있고/있거나 본원에 기재되어 있다. 치료는 개체 또는 동물(일부 비제한적인 예에는, 인간 또는 포유류가 포함됨)에서의 질환의 임의의 치료를 포함하며, 이에는 (1) 질환을 저해하는 것, 예를 들어 질환 또는 장애의 진행을 중단시키거나 느리게 하는 것; 또는 (2) 질환을 완화시키는 것, 예를 들어 증상의 퇴행을 유발하는 것; 및 (3) 질환의 발달 가능성을 예방하거나 감소시키는 것, 또는 간부전 또는 신부전과 같은 질환과 관련된 2차 질환/장애를 예방하는 것을 포함한다.질환의 치료를 위한 유효량은, 이를 필요로 하는 포유류에게 투여되는 경우, 해당 질환에 대한 유효한 치료(이러한 용어는 본원에 정의된 바와 같음)를 유도하는 데 충분한 양을 의미한다.
작용제의 효능은 페닐케톤뇨증(PKU)에 대해 특정한 물리적 지표를 평가하는 방식으로 결정될 수 있다. PKU 지표의 표준 분석 방법은 당업계에 공지되어 있다.
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 또한, ceDNA로부터 발현된 PAH 단백질과 함께 사용될 수 있는, 보조인자 또는 다른 폴리펩타이드, 센스 또는 안티센스 올리고뉴클레오타이드, 또는 RNA(코딩 또는 비코딩; 예를 들어, siRNA, shRNA, 마이크로RNA, 및 이들의 안티센스 대응물(예를 들어, antagoMiR))를 인코딩할 수 있다. 또한, PAH 단백질을 인코딩하는 서열을 포함하는 발현 카세트는 또한, β-락타마아제, β-갈락토시다아제(LacZ), 알칼리성 포스파타아제, 티미딘 키나아제, 녹색 형광 단백질(GFP), 클로람페니콜 아세틸트랜스퍼라아제(CAT), 루시퍼라아제 및 당업계에 널리 공지된 다른 것들과 같은, 실험 또는 진단 목적으로 사용되는 리포터 단백질을 인코딩하는 외인성 서열을 포함할 수 있다.
하나의 구현예에서, ceDNA 벡터는 PKU의 치료에 기능성이 있는 PAH 단백질을 발현시키는 핵산 서열을 포함한다. 바람직한 구현예에서, 치료용 PAH 단백질은, 목적하지 않는 경우, 면역계 반응을 야기하지 않는다.
III. PAH 치료 단백질의 생산에 사용되는 ceDNA 벡터 전반
본 발명의 구현예는 PAH 전이유전자를 발현시킬 수 있는 폐쇄형 선형 이중체화된(ceDNA) 벡터를 포함하는 방법 및 조성물을 기반으로 한다. 일부 구현예에서, 전이유전자는 PAH 단백질을 인코딩하는 서열이다. 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 크기 제한이 없기 때문에, 예를 들어 단일 벡터로부터 전이유전자의 발현에 필요한 모든 구성요소의 발현을 가능하게 한다. PAH 단백질의 발현을 위한 ceDNA 벡터는 바람직하게는 이중체이며, 예를 들어 발현 카세트와 같은 분자의 적어도 일부에 걸쳐 자가 상보적이다(예를 들어, ceDNA는 이중가닥 원형 분자가 아님). ceDNA 벡터는 공유결합으로 폐쇄된 말단을 갖기 때문에, 예를 들어 37℃에서 1시간 초과 동안 엑소뉴클레아제 소화(예를 들어, 엑소뉴클레아제 I 또는 엑소뉴클레아제 III)에 대한 내성이 있다.
일반적으로, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, 5'→3' 방향으로, 제1 아데노관련바이러스(AAV) 역말단반복서열(ITR), 관심 뉴클레오타이드 서열(예를 들어, 본원에 기재된 바와 같은 발현 카세트) 및 제2 AAV ITR을 포함한다. ITR 서열은, (i) 적어도 하나의 WT ITR과 적어도 하나의 변형된 AAV 역말단반복서열(mod-ITR)(예를 들어, 비대칭인 변형된 ITR); (ii) 2개의 변형된 ITR(여기서 mod-ITR 쌍은 서로에 대해 상이한 3차원 공간 구성을 가짐)(예를 들어, 비대칭인 변형된 ITR), 또는 (iii) 대칭 또는 실질적으로 대칭인 WT-WT ITR 쌍(여기서 각각의 WT-ITR은 동일한 3차원 공간 구성을 가짐), 또는 (iv) 대칭 또는 실질적으로 대칭인 변형된 ITR 쌍(여기서 각각의 mod-ITR은 동일한 3차원 공간 구성을 가짐) 중 임의의 것에서 선택된다.
비제한적으로, 리포좀 나노입자 전달 시스템과 같은 전달 시스템을 추가로 포함할 수 있는, PAH 단백질 생산을 위한 ceDNA 벡터를 포함하는 방법 및 조성물이 본원에 포함된다. 사용을 위해 포함되는 비제한적인 예시적인 리포좀 나노입자 시스템이 본원에 개시되어 있다. 일부 양태에서, 본 개시내용은 ceDNA와 이온화 가능한 지질을 포함하는 지질 나노입자를 제공한다. 예를 들어, 2018년 9월 7일자 출원된 국제 출원 PCT/US2018/050042(이는 그 전문이 본원에 참조로서 인용됨)에 기재된 바와 같은 방법으로 수득된 ceDNA 벡터로 제조되고 로딩되는 지질 나노입자 제형.
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 바이러스 캡시드 내 제한적인 공간에 의해 부과되는 패키징 제약이 없다. ceDNA 벡터는, 캡슐화된 AAV 게놈과 대조적으로, 원핵생물에서 생산된 플라스미드 DNA 벡터에 대한 실행 가능한 진핵생물에서 생산된 대안을 나타낸다. 이는, 제어 요소, 예를 들어 본원에 개시된 바와 같은 조절 스위치, 대형 전이유전자, 다중 전이유전자 등의 삽입을 허용한다.
도 1a 내지 도 1e는, 비제한적이며 예시적인 PAH 단백질의 발현을 위한 ceDNA 벡터, 또는 ceDNA 플라스미드의 상응하는 서열의 개략도를 보여준다. PAH 단백질의 발현을 위한 ceDNA 벡터는 캡시드를 함유하지 않으며, 제1 ITR, 전이유전자를 포함하는 발현 카세트 및 제2 ITR을 이러한 순서로 인코딩하는 플라스미드에서 수득될 수 있다. 발현 카세트는 전이유전자의 발현을 가능하게 하고/하거나 제어하는 하나 이상의 조절 서열을 포함할 수 있으며, 예를 들어 여기서 발현 카세트는 인핸서/프로모터, ORF 리포터(전이유전자), 전사 후 조절 요소(예를 들어, WPRE), 및 폴리아데닐화 및 종결 신호(예를 들어, BGH polyA) 중 하나 이상을 이러한 순서로 포함할 수 있다.
발현 카세트는 또한 내부 리보솜 진입 부위(IRES) 및/또는 2A 요소를 포함할 수 있다. 시스-조절 요소에는, 비제한적으로, 프로모터, 리보스위치, 절연인자, mir-조절 요소, 전사 후 조절 요소, 조직 및 세포 유형 특이적 프로모터, 및 인핸서가 포함된다. 일부 구현예에서, ITR은 전이유전자, 예를 들어 PAH 단백질을 위한 프로모터로서 작용할 수 있다. 일부 구현예에서, ceDNA 벡터는 PAH 단백질의 발현을 조절하기 위한 추가의 구성요소, 예를 들어 PAH 단백질의 발현을 제어하고 조절하기 위한 "조절 스위치"라는 제목의 섹션에 본원에 기재된 조절 스위치를 포함하며, 목적하는 경우, ceDNA 벡터를 포함하는 세포의 제어된 세포 사멸을 가능하게 하는 사멸 스위치인 조절 스위치를 포함할 수 있다.
발현 카세트는 4000개 초과의 뉴클레오타이드, 5000개 뉴클레오타이드, 10,000개 뉴클레오타이드 또는 20,000개 뉴클레오타이드, 또는 30,000 뉴클레오타이드, 또는 40,000개 뉴클레오타이드 또는 50,000개 뉴클레오타이드, 또는 약 4000개 내지 10,000개 뉴클레오타이드, 또는 10,000개 내지 50,000개 뉴클레오타이드 사이의 임의의 범위, 또는 50,000개 초과의 뉴클레오타이드를 포함할 수 있다. 일부 구현예에서, 발현 카세트는 길이가 500개 내지 50,000개 뉴클레오타이드 범위인 전이유전자를 포함할 수 있다. 일부 구현예에서, 발현 카세트는 길이가 500개 내지 75,000개 뉴클레오타이드 범위인 전이유전자를 포함할 수 있다. 일부 구현예에서, 발현 카세트는 길이가 500개 내지 10,000개 뉴클레오타이드 범위인 전이유전자를 포함할 수 있다. 일부 구현예에서, 발현 카세트는 길이가 1000개 내지 10,000개 뉴클레오타이드 범위인 전이유전자를 포함할 수 있다. 일부 구현예에서, 발현 카세트는 길이가 500개 내지 5,000개 뉴클레오타이드 범위인 전이유전자를 포함할 수 있다. ceDNA 벡터는 캡시드화된 AAV 벡터의 크기 제한이 없기 때문에, 대형 발현 카세트를 전달하여 효율적인 전이유전자 발현을 제공할 수 있다. 일부 구현예에서, ceDNA 벡터에는 원핵생물 특이적 메틸화가 없다.
ceDNA 발현 카세트는, 예를 들어 수용 대상에 존재하지 않거나, 이에서 불활성이거나 불충분한 활성을 갖는 단백질을 인코딩하는 발현 가능한 외인성 서열(예를 들어, 오픈리딩프레임) 또는 전이유전자, 또는 목적하는 생물학적 또는 치료 효과를 갖는 단백질을 인코딩하는 유전자를 포함할 수 있다. 전이유전자는 결함 유전자 또는 전사체의 발현을 교정하는 기능을 할 수 있는 유전자 산물을 인코딩할 수 있다. 원칙적으로, 발현 카세트는 돌연변이로 인해 존재하지 않거나 감소된 단백질, 폴리펩타이드 또는 RNA를 인코딩하거나, 과발현될 때 치료적 유익을 전달하는 것이 본 개시내용의 범위에 속하는 것으로 간주되는 임의의 유전자를 포함할 수 있다.
발현 카세트는 임의의 전이유전자(예를 들어, PAH 단백질을 인코딩함), 예를 들어 대상에서 PKU의 치료에 유용한 PAH 단백질, 즉, 치료용 PAH 단백질을 포함할 수 있다. ceDNA 벡터는 단독으로, 또는 폴리펩타이드를 인코딩하는 핵산 또는 비코딩 핵산(예를 들어, RNAi, miR 등)뿐 아니라, 대상의 게놈에 있는 바이러스 서열, 예를 들어 HIV 바이러스 서열 등을 포함하는 뉴클레오타이드 서열 및 외인성 유전자와 조합으로, 대상에서 임의의 관심 PAH 단백질을 전달하고 발현시키는 데 사용될 수 있다. 바람직하게는, 본원에 개시된 ceDNA 벡터는 치료 목적을 위해(예를 들어, 의학적, 진단적 또는 수의학적 용도로) 또는 면역원성 폴리펩타이드를 위해 사용된다. 특정 구현예에서, ceDNA 벡터는 하나 이상의 폴리펩타이드, 펩타이드, 리보자임, 펩타이드 핵산, siRNA, RNAi, 안티센스 올리고뉴클레오타이드, 안티센스 폴리뉴클레오타이드, 또는 RNA(코딩 또는 비코딩; 예를 들어 siRNA, shRNA, 마이크로RNA, 및 이들의 안티센스 대응물(예를 들어, antagoMiR)), 항체, 융합 단백질, 또는 이들의 임의의 조합을 포함하는, 대상의 임의의 관심 유전자를 발현시키는 데 유용하다.
발현 카세트는 또한 폴리펩타이드, 센스 또는 안티센스 올리고뉴클레오타이드, 또는 RNA(코딩 또는 비코딩; 예를 들어, siRNA, shRNA, 마이크로RNA, 및 이들의 안티센스 대응물(예를 들어, antagoMiR))을 인코딩할 수 있다. 발현 카세트는 또한, β-락타마아제, β-갈락토시다아제(LacZ), 알칼리성 포스파타아제, 티미딘 키나아제, 녹색 형광 단백질(GFP), 클로람페니콜 아세틸트랜스퍼라아제(CAT), 루시퍼라아제 및 당업계에 널리 공지된 다른 것들과 같은, 실험 또는 진단 목적으로 사용되는 리포터 단백질을 인코딩하는 외인성 서열을 포함할 수 있다.
본원에 기재된 PAH 단백질의 발현을 위한 ceDNA 벡터의 발현 구조체인 발현 카세트에 제공된 서열은 표적 숙주세포에 대해 코돈 최적화될 수 있다. 본원에 사용된 "코돈 최적화된" 또는 "코돈 최적화"라는 용어는, 관심 척추동물, 예를 들어 마우스 또는 인간의 세포에서 발현 증강을 위해 핵산 서열을 변경하는 과정으로서, 천연 서열(예를 들어, 원핵생물 서열) 중 적어도 하나, 하나 초과 또는 유의한 수의 코돈을, 해당 척추동물의 유전자에서 보다 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 대체하는 과정을 나타낸다. 다양한 종은 특정 아미노산의 특정 코돈에 대해 특정 편향을 나타낸다. 전형적으로, 코돈 최적화는 원래 번역된 단백질의 아미노산 서열을 변경시키지 않는다. 최적화된 코돈은, 예를 들어 Aptagen's Gene Forge® 코돈 최적화 및 맞춤형 유전자 합성 플랫폼(Aptagen, Inc., 2190 Fox Mill Rd. Suite 300, Herndon, Va. 20171), 또는 또 다른 공개적으로 이용 가능한 데이터베이스를 사용하여 결정될 수 있다. 일부 구현예에서 PAH 단백질을 인코딩하는 핵산은 인간 발현을 위해 최적화된 것이고/것이거나, 당업계에 공지된 바와 같은 인간 PAH 또는 이의 기능성 단편이다.
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터에 의해 발현되는 전이유전자는 PAH 단백질을 인코딩한다. 플라스미드 기반 발현 벡터와 상이한 PAH 단백질의 발현을 위한 ceDNA 벡터의 다수의 구조적 특징이 있다. ceDNA 벡터는 다음 특징 중 하나 이상을 보유할 수 있다: 본래(즉, 삽입되지 않은) 박테리아 DNA의 결여; 원핵생물 복제 기점의 결여; 자가 함유, 즉, 이들은 Rep 결합 부위와 말단 분해 부위(RBS 및 TRS)를 포함하는 2개의 ITR 이외의 임의의 서열, 및 ITR 사이의 외인성 서열을 필요로 하지 않음; 헤어핀을 형성하는 ITR 서열의 존재; 및 박테리아 유형 DNA 메틸화 또는 실제로 포유류 숙주에 의해 비정상적인 것으로 간주되는 임의의 다른 메틸화의 부재. 일반적으로, 본 발명의 벡터는 임의의 원핵생물 DNA를 함유하지 않는 것이 바람직하지만, 일부 원핵생물 DNA가, 비제한적인 예로서, 프로모터 또는 인핸서 영역에 외인성 서열로서 삽입될 수 있다고 고려된다. ceDNA 벡터를 플라스미드 발현 벡터와 구별하는 또 다른 중요한 특징은, ceDNA 벡터는 폐쇄형 말단을 갖는 단일가닥 선형 DNA이지만, 플라스미드는 항상 이중가닥 DNA라는 점이다.
본원에 제공된 방법에 의해 생산된 PAH 단백질의 발현을 위한 ceDNA 벡터는 바람직하게는 제한 효소 소화 검정으로 측정 시, 비연속 구조라기보다는 선형 및 연속 구조이다(도 4d). 선형 및 연속 구조는 세포 엔도뉴클레아제에 의한 공격으로부터 보다 안정적일 뿐 아니라, 재조합되어 돌연변이를 유발할 가능성이 적은 것으로 여겨진다. 따라서, 선형 및 연속 구조의 ceDNA 벡터가 바람직한 구현예이다. 연속, 선형, 단일가닥 분자내 이중체 ceDNA 벡터는, AAV 캡시드 단백질을 인코딩하는 서열 없이, 공유결합으로 결합된 말단을 가질 수 있다. 이러한 ceDNA 벡터는 박테리아 기원의 원형 이중체 핵산 분자인 플라스미드(본원에 기재된 ceDNA 플라스미드 포함)와 구조적으로 구별된다. 플라스미드의 상보적 가닥은 변성 후 분리되어 2개의 핵산 분자를 생성하지만, 대조적으로, 상보적 가닥을 갖는 ceDNA 벡터는, 단일 DNA 분자이기 때문에, 변성되더라도 단일 분자로 남아있다. 일부 구현예에서, 본원에 기재된 바와 같은 ceDNA 벡터는, 플라스미드와 달리, 원핵생물 유형의 DNA 염기 메틸화 없이 생산될 수 있다. 따라서, ceDNA 벡터와 ceDNA-플라스미드는 구조(특히, 선형 대 원형)의 측면에서, 또한 이러한 상이한 대상을 생산하고 정제하는 데 사용되는 방법(하기 참조)의 측면에서, 또한 ceDNA-플라스미드의 경우 원핵생물 유형이고 ceDNA 벡터의 경우 진핵생물 유형인 이의 DNA 메틸화의 측면에서 모두 상이하다.
플라스미드 기반 발현 벡터에 비해 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 사용하는 데에는 몇 가지 이점이 존재하며, 이러한 이점에는, 비제한적으로, 하기가 포함된다: 1) 플라스미드는 박테리아 DNA 서열을 함유하고 원핵생물 특이적 메틸화, 예를 들어 6-메틸 아데노신 및 5-메틸 시토신 메틸화에 적용되지만, 캡시드 미함유 AAV 벡터 서열은 진핵생물 기원으로 원핵생물 특이적 메틸화를 거치지 않으며; 그 결과, 캡시드 미함유 AAV 벡터는 플라스미드에 비해 염증 및 면역 반응을 유도할 가능성이 적음; 2) 플라스미드는 생산 과정 동안 내성 유전자의 존재를 필요로 하지만, ceDNA 벡터는 그렇지 않음; 3) 원형 플라스미드는 세포에의 도입 시 핵으로 전달되지 않고 세포 뉴클레아제에 의한 분해를 우회하기 위해서는 과부하가 필요하지만, ceDNA 벡터는 뉴클레아제에 대한 내성을 부여하는 바이러스성 시스-요소, 즉, ITR을 함유하고, 핵을 표적으로 하여 이에 전달되도록 설계될 수 있음. ITR 기능에 없어서는 안 될 최소 정의 요소를, Rep-결합 부위(RBS; AAV2의 경우 5'-GCGCGCTCGCTCGCTC-3'(서열번호 60))와 말단 분해 부위(TRS; AAV2의 경우 5'-AGTTGG-3'(서열번호 64)), 그리고 헤어핀 형성을 가능하게 하는 가변 회문구조 서열; 및 4) ceDNA 벡터가 T세포 매개 면역반응을 유발하는 톨유사(Toll-like) 수용체 패밀리의 멤버와 결합하는 것으로 보고된 원핵생물 유래 플라스미드에서 종종 발견되는 CpG 디뉴클레오타이드의 과대표현(over-representation)을 갖지 않는 것이라고 가정하였다. 대조적으로, 본원에 개시된 캡시드 미함유 AAV 벡터로의 형질도입은, 다양한 전달 시약을 사용하여 통상적인 AAV 비리온으로 형질도입하기 곤란한 세포 및 조직 유형을 효율적으로 표적화할 수 있다.
IV. 역말단반복서열(ITR)
본원에 개시된 바와 같은, PAH 단백질의 발현을 위한 ceDNA 벡터는 2개의 역말단반복서열(ITR) 사이에 배치된 전이유전자 또는 이종 핵산 서열을 함유하며, 여기서 ITR 서열은 비대칭인 ITR 쌍, 또는 대칭 또는 실질적으로 대칭인 ITR 쌍(이러한 용어는 본원에 정의된 바와 같음)일 수 있는 ceDNA 벡터가 본원에 포함된다. 본원에 개시된 바와 같은 ceDNA 벡터는, (i) 적어도 하나의 WT ITR과 적어도 하나의 변형된 AAV 역말단반복서열(mod-ITR)(예를 들어, 비대칭인 변형된 ITR); (ii) 2개의 변형된 ITR(여기서 mod-ITR 쌍은 서로에 대해 상이한 3차원 공간 구성을 가짐)(예를 들어, 비대칭인 변형된 ITR), 또는 (iii) 대칭 또는 실질적으로 대칭인 WT-WT ITR 쌍(여기서 각각의 WT-ITR은 동일한 3차원 공간 구성을 가짐), 또는 (iv) 대칭 또는 실질적으로 대칭인 변형된 ITR 쌍(여기서 각각의 mod-ITR은 동일한 3차원 공간 구성을 가짐) 중 임의의 것에서 선택되는 ITR 서열을 포함할 수 있으며, 여기서 본 개시내용의 방법은, 비제한적으로, 리포좀 나노입자 전달 시스템과 같은 전달 시스템을 추가로 포함할 수 있다.
일부 구현예에서, ITR 서열은 척추동물을 감염시키는 파르보바이러스아과와 곤충을 감염시키는 덴소바이러스아과의 2개의 아과를 포함하는 파르보바이러스과의 바이러스에서 유래할 수 있다. 파르보바이러스아과(파르보바이러스로 지칭됨)에는, 대부분의 조건 하에서, 생산적인 감염을 위해 아데노바이러스 또는 헤르페스바이러스와 같은 헬퍼 바이러스로의 동시감염을 필요로 하는 구성원인 데펜도바이러스속이 포함된다. 데펜도바이러스속에는, 통상적으로 인간(예를 들어, 혈청형 2, 3A, 3B, 5 및 6) 또는 영장류(예를 들어, 혈청형 1 및 4)를 감염시키는 아데노연관바이러스(AAV), 및 다른 온혈동물을 감염시키는 관련 바이러스(예를 들어, 소, 개, 말 및 양 아데노연관바이러스)가 포함된다. 파르보바이러스 및 파르보바이러스과의 다른 구성원은 일반적으로 문헌[Kenneth I. Berns, "Parvoviridae: The Viruses and Their Replication", Chapter 69 in FIELDS VIROLOGY (3d Ed. 1996)]에 기재되어 있다.
본원의 명세서 및 실시예에 예시된 ITR이 AAV2 WT-ITR이지만, 당업자는 상기 언급된 바와 같이 임의의 공지된 파르보바이러스, 예를 들어 AAV(예를 들어, AAV1, AAV2, AAV3, AAV4, AAV5, AAV 5, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAVrh8, AAVrh10, AAV-DJ 및 AAV-DJ8 게놈, 예를 들어 NCBI: NC 002077; NC 001401; NC001729; NC001829; NC006152; NC 006260; NC 006261)와 같은 데펜도바이러스 유래의 ITR, 키메라 ITR, 또는 임의의 합성 AAV 유래의 ITR을 사용할 수 있다는 것을 알고 있다. 일부 구현예에서, AAV는 온혈동물, 예를 들어 조류(AAAV), 소(BAAV), 개, 말 및 양 아데노연관바이러스를 감염시킬 수 있다. 일부 구현예에서, ITR은 B19 파르보바이러스(GenBank 수탁번호: NC 000883), 마우스 유래 미세생쥐바이러스(MVM: Minute Virus from Mouse)(GenBank 수탁번호. NC 001510); 거위 파르보바이러스(GenBank 수탁번호: NC 001701); 뱀 파르보바이러스 1(GenBank 수탁번호. NC 006148)에서 유래한 것이다. 일부 구현예에서, 본원에 논의된 바와 같이, 5' WT-ITR은 하나의 혈청형에서 유래할 수 있고, 3' WT-ITR은 상이한 혈청형에서 유래할 수 있다.
당업자는, ITR 서열이 전형적으로 T-형 또는 Y-형 헤어핀 구조(예를 들어, 도 2a도 3a 참조)인 이중가닥 홀리데이 접합의 공통 구조를 갖고, 여기서 각각의 WT-ITR은 보다 큰 회문구조 아암(A-A')에 포매된 2개의 회문구조 아암 또는 루프(B-B' 및 C-C'), 및 단일가닥 D 서열로 형성된다(여기서, 이러한 회문구조 서열의 순서는 ITR의 플립 또는 플랍 배향을 정의함)는 것을 알고 있다. 예를 들어, 상이한 AAV 혈청형(AAV1 내지 AAV6) 유래의 ITR의 구조 분석 및 서열 비교는 문헌[Grimm et al., J. Virology, 2006; 80(1); 426-439]; 문헌[Yan et al., J. Virology, 2005; 364-379]; 문헌[Duan et al., Virology 1999; 261; 8-14]에 기재된 것을 참조한다. 당업자는, 본원에 제공된 예시적인 AAV2 ITR 서열에 기반하여 ceDNA 벡터 또는 ceDNA-플라스미드에 사용되는 임의의 AAV 혈청형 유래의 WT-ITR 서열을 용이하게 결정할 수 있다. 예를 들어, 다른 혈청형 유래의 좌측 ITR에 대한 AAV2의 좌측 ITR의 동일성%: AAV-1(84%), AAV-3(86%), AAV-4(79%), AAV-5(58%), AAV-6(좌측 ITR)(100%) 및 AAV-6(우측 ITR)(82%)을 보여주는, 문헌[Grimm et al., J. Virology, 2006; 80(1); 426-439]에 기재된 상이한 AAV 혈청형 유래 ITR의 서열 비교(AAV1 내지 AAV6, 및 조류 AAV(AAAV) 및 소 AAV(BAAV)) 참조.
A. 대칭인 ITR 쌍
일부 구현예에서, 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, 5'→3' 방향으로, 제1 아데노연관바이러스(AAV) 역말단반복서열(ITR), 관심 뉴클레오타이드 서열(예를 들어, 본원에 기재된 바와 같은 발현 카세트) 및 제2 AAV ITR을 포함하고, 여기서 제1 ITR(5' ITR)과 제2 ITR(3' ITR)은 서로에 대해 대칭이거나 실질적으로 대칭이며, 즉, ceDNA 벡터는, 이의 구조가 기하학적 공간에서 동일한 형상이거나, 3D 공간에서 동일한 A, C-C' 및 B-B' 루프를 갖도록, 대칭인 3차원 공간 구성을 갖는 ITR 서열을 포함할 수 있다. 이러한 구현예에서, 대칭인 ITR 쌍 또는 실질적으로 대칭인 ITR 쌍은, 야생형 ITR이 아닌 변형된 ITR(예를 들어, mod-ITR)일 수 있다. mod-ITR 쌍은 야생형 ITR로부터 하나 이상의 변형을 갖고, 서로 역 보체(역상)인 동일한 서열을 가질 수 있다. 대안적인 구현예에서, 변형된 ITR 쌍은 본원에 정의된 바와 같이 실질적으로 대칭이며, 즉, 변형된 ITR 쌍은 상이한 서열을 갖지만, 상응하거나 동일한 대칭인 3차원 형상을 가질 수 있다.
(i) 야생형 ITR
일부 구현예에서, 대칭인 ITR 또는 실질적으로 대칭인 ITR은 본원에 기재된 바와 같은 야생형(WT-ITR)이다. 즉, 2개의 ITR은 야생형 서열을 갖지만, 반드시 동일한 AAV 혈청형의 WT-ITR일 필요는 없다. 즉, 일부 구현예에서, 하나의 WT-ITR은 하나의 AAV 혈청형에서 유래할 수 있고, 다른 하나는 WT-ITR은 상이한 AAV 혈청형에서 유래할 수 있다. 이러한 구현예에서, WT-ITR 쌍은 본원에 정의된 바와 같이 실질적으로 대칭이며, 즉, 이들은 대칭인 3차원 공간 구성을 여전히 유지하면서, 하나 이상의 보존적 뉴클레오타이드 변형을 가질 수 있다.
따라서, 본원에 개시된 바와 같이, ceDNA 벡터는 서로 역 보체(역상)이거나, 또는 대안적으로, 서로 실질적으로 대칭이며, 즉, WT-ITR 쌍이 대칭인 3차원 공간 구성을 갖는, 2개의 플랭킹 야생형 역말단반복서열(WT-ITR) 사이에 배치된 전이유전자 또는 이종 핵산 서열을 함유한다. 일부 구현예에서, 야생형 ITR 서열(예를 들어, AAV WT-ITR)은 기능성 Rep 결합 부위(RBS; 예를 들어 AAV2의 경우 5'-GCGCGCTCGCTCGCTC-3', 서열번호 60)와 기능성 말단 분해 부위(TRS; 예를 들어 5'-AGTT-3', 서열번호 62)를 포함한다.
하나의 양태에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 2개의 WT 역말단반복서열(WT-ITR)(예를 들어, AAV WT-ITR) 사이에 작동적으로 배치된 이종 핵산을 인코딩하는 벡터 폴리뉴클레오타이드에서 수득될 수 있다. 즉, 2개의 ITR은 야생형 서열을 갖지만, 반드시 동일한 AAV 혈청형의 WT-ITR일 필요는 없다. 즉, 일부 구현예에서, 하나의 WT-ITR은 하나의 AAV 혈청형에서 유래할 수 있고, 다른 하나는 WT-ITR은 상이한 AAV 혈청형에서 유래할 수 있다. 이러한 구현예에서, WT-ITR 쌍은 본원에 정의된 바와 같이 실질적으로 대칭이며, 즉, 이들은 대칭인 3차원 공간 구성을 여전히 유지하면서, 하나 이상의 보존적 뉴클레오타이드 변형을 가질 수 있다. 일부 구현예에서, 5' WT-ITR은 하나의 AAV 혈청형에서 유래한 것이고, 3' WT-ITR은 동일하거나 상이한 AAV 혈청형에서 유래한 것이다. 일부 구현예에서, 5' WT-ITR과 3' WT-ITR은 서로 거울상이며, 즉, 이들은 대칭이다. 일부 구현예에서, 5' WT-ITR과 3' WT-ITR은 동일한 AAV 혈청형에서 유래한 것이다.
WT ITR은 널리 공지되어 있다. 하나의 구현예에서, 2개의 ITR은 동일한 AAV2 혈청형에서 유래한 것이다. 특정 구현예에서, 다른 혈청형에서 유래한 WT를 사용할 수 있다. 다수의 상동인 혈청형, 예를 들어 AAV2, AAV4, AAV6, AAV8이 존재한다. 하나의 구현예에서, 거의 상동인 ITR(예를 들어, 유사한 루프 구조를 갖는 ITR)이 사용될 수 있다. 또 다른 구현예에서, 보다 다양한 AAV WT ITR, 예를 들어 AAV2와 AAV5가 사용될 수 있으며, 또 다른 구현예에서는, 실질적으로 WT인, 즉, WT의 기본 루프 구조를 갖지만, 특성을 변경시키거나 이에 영향을 미치지 않는 일부 보존적 뉴클레오타이드 변경을 갖는 ITR이 사용될 수도 있다. 동일한 바이러스 혈청형 유래의 WT-ITR이 사용되는 경우, 하나 이상의 조절 서열이 추가로 사용될 수 있다. 특정 구현예에서, 조절 서열은 ceDNA의 활성, 예를 들어 인코딩된 PAH 단백질의 발현을 조절할 수 있는 조절 스위치이다.
일부 구현예에서, 본원에 기재된 기술의 하나의 양태는 PAH 단백질의 발현을 위한 ceDNA 벡터에 관한 것으로, 여기서 ceDNA 벡터는 2개의 야생형 역말단반복서열(WT-ITR) 사이에 작동 가능하게 배치된 PAH 단백질을 인코딩하는 적어도 하나의 이종 뉴클레오타이드 서열을 포함하고, 여기서 WT-ITR은 동일한 혈청형, 상이한 혈청형에서 유래하거나, 또는 서로에 대해 실질적으로 대칭일 수 있다(즉, 기하학적 공간에서의 구조가 동일한 형상이 되도록 대칭인 3차원 공간 구성을 갖거나, 3D 공간에서 동일한 A, C-C' 및 B-B' 루프를 가짐). 일부 구현예에서, 대칭인 WT-ITR은 기능성 말단 분해 부위와 Rep 결합 부위를 포함한다. 일부 구현예에서, 이종 핵산 서열은 전이유전자를 인코딩하고, 여기서 벡터는 바이러스 캡시드 내에 존재하지 않는다.
일부 구현예에서, WT-ITR은 동일하지만, 서로 역 보체이다. 예를 들어, 5' ITR에서 서열 AACG은 상응하는 부위의 3' ITR에서 CGTT(즉, 역 보체)일 수 있다. 하나의 예에서, 5' WT-ITR 센스 가닥은 ATCGATCG의 서열을 포함하고, 상응하는 3' WT-ITR 센스 가닥은 CGATCGAT(즉, ATCGATCG의 역 보체)의 서열을 포함한다. 일부 구현예에서, WT-ITR ceDNA는 말단 분해 부위와 복제 단백질 결합 부위(RPS)(때때로 복제성 단백질 결합 부위로 지칭됨), 예를 들어 Rep 결합 부위를 추가로 포함한다.
WT-ITR을 포함하는 PAH 단백질의 발현을 위한 ceDNA 벡터에 사용되는 예시적인 WT-ITR 서열은 본원의 표 3에 제시되어 있으며, 이는 WT-ITR의 쌍(5' WT-ITR과 3' WT-ITR)으로 나타나 있다.
예시적인 예로서, 본 개시내용은 조절 스위치의 존재 또는 부재 하에 전이유전자(예를 들어, 이종 핵산 서열)에 작동 가능하게 연결된 프로모터를 포함하는 PAH 단백질의 발현을 위한 ceDNA 벡터로서, 캡시드 단백질이 없으며, (a) WT-ITR을 인코딩하는 ceDNA-플라스미드로부터 생산되고(예를 들어, 도 1f도 1g 참조)(여기서 각각의 WT-ITR은 이의 헤어핀 2차 구성에서 동일한 수의 분자내 이중체화된 염기쌍을 가짐)(바람직하게는 참조 서열과 비교하여 이러한 구성에서 임의의 AAA 또는 TTT 말단 루프의 결실을 배제함), (b) 실시예 1의 미변성 겔 및 변성 조건 하에서 아가로오스 겔 전기영동에 의해 ceDNA를 식별하는 검정을 사용한 경우 ceDNA로서 식별되는 ceDNA 벡터를 제공한다.
일부 구현예에서, 플랭킹 WT-ITR은 서로 실질적으로 대칭이다. 이러한 구현예에서, 5' WT-ITR은 AAV의 하나의 혈청형에서 유래할 수 있고, 3' WT-ITR은 AAV의 상이한 혈청형에서 유래할 수 있기 때문에, WT-ITR은 동일한 역 보체가 아니다. 예를 들어, 5' WT-ITR은 AAV2에서 유래할 수 있고, 3' WT-ITR은 상이한 혈청형(예를 들어, AAV1, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 및 AAV12)에서 유래할 수 있다. 일부 구현예에서, WT-ITR은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, 뱀 파르보바이러스(예를 들어, 공비단뱀 파르보바이러스), 소 파르보바이러스, 염소 파르보바이러스, 조류 파르보바이러스, 개 파르보바이러스, 말 파르보바이러스, 새우 파르보바이러스, 돼지 파르보바이러스 또는 곤충 AAV 중 임의의 것에서 선택되는 2개의 상이한 파르보바이러스에서 선택될 수 있다. 일부 구현예에서, WT ITR의 이러한 조합은 AAV2와 AAV6에서 유래한 WT-ITR의 조합이다. 하나의 구현예에서, 실질적으로 대칭인 WT-ITR은, 하나가 다른 하나의 ITR에 대해 역상인 경우, 적어도 90% 동일, 적어도 95% 동일, 적어도 96%...97%... 98%... 99%....99.5%(및 이러한 동일성% 사이의 모든 지점 포함) 동일하며, 동일한 대칭인 3차원 공간 구성을 갖는다. 일부 구현예에서, WT-ITR 쌍은 대칭인 3차원 공간 구성, 예를 들어 A, C-C', B-B' 및 D 아암의 동일한 3D 구성을 갖기 때문에 실질적으로 대칭이다. 하나의 구현예에서, 실질적으로 대칭인 WT-ITR 쌍은 다른 하나에 대해 역상이며, 서로 적어도 95% 동일, 적어도 96%...97%... 98%... 99%....99.5% 동일(이러한 동일성% 사이의 모든 지점 포함)하고, 하나의 WT-ITR은 5'-GCGCGCTCGCTCGCTC-3'(서열번호 60)의 Rep-결합 부위(RBS)와 말단 분해 부위(trs)를 보유한다. 일부 구현예에서, 실질적으로 대칭인 WT-ITR 쌍은 서로 역상이며, 서로 적어도 95% 동일, 적어도 96%...97%... 98%... 99%....99.5% 동일(이러한 동일성% 사이의 모든 지점 포함)하고, 하나의 WT-ITR은 5'-GCGCGCTCGCTCGCTC-3' (서열번호 60)의 Rep-결합 부위(RBS)와 말단 분해 부위(trs), 및 헤어핀 2차 구조 형성을 가능하게 하는 가변 회문구조 서열을 보유한다. 상동성은 기본 설정의 BLAST(Basic Local Alignment Search Tool)(BLASTN)와 같은 당업계에 널리 공지된 표준 수단에 의해 결정될 수 있다.
일부 구현예에서, ITR의 구조 요소는 ITR과 큰 Rep 단백질(예를 들어, Rep 78 또는 Rep 68)의 기능적 상호작용에 관여하는 임의의 구조 요소일 수 있다. 특정 구현예에서, 구조 요소는 ITR과 큰 Rep 단백질의 상호작용에 대한 선택성을 제공하며, 즉, 적어도 부분적으로 어느 Rep 단백질이 ITR과 기능적으로 상호작용하는 지를 결정한다. 다른 구현예에서, 구조 요소는, Rep 단백질이 ITR에 결합될 때, 큰 Rep 단백질과 물리적으로 상호작용한다. 각각의 구조 요소는, 예를 들어 ITR의 2차 구조, ITR의 뉴클레오타이드 서열, 둘 이상의 요소 사이의 간격, 또는 상기 중 임의의 것의 조합일 수 있다. 하나의 구현예에서, 구조 요소는 A 및 A' 아암, B 및 B' 아암, C 및 C' 아암, D 아암, Rep 결합 부위(RBE) 및 RBE'(즉, 상보적 RBE 서열), 및 말단 분해 부위(trs)로 이루어지는 군에서 선택된다.
단지 예로서, 표 2는 WT-ITR의 예시적인 조합을 나타낸다.
Figure pct00011
Figure pct00012
Figure pct00013
Figure pct00014
단지 예로서, 표 3은 일부 상이한 AAV 혈청형 유래의 예시적인 WT-ITR의 서열을 보여준다.
Figure pct00015
일부 구현예에서, WT-ITR 서열의 뉴클레오타이드 서열은 변형될 수 있으며(예를 들어, 1개, 2개, 3개, 4개 또는 5개, 또는 그 이상의 뉴클레오타이드, 또는 그 안의 임의의 범위의 뉴클레오타이드 변형), 여기서 변형은 상보적 뉴클레오타이드로, 예를 들어 C의 경우 G, 및 그 반대로, 및 A의 경우 T, 및 그 반대로의 치환이다.
본 발명의 특정 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 서열번호 1, 2, 5 내지 14 중 어느 하나에서 선택되는 뉴클레오타이드 서열로 이루어진 WT-ITR을 갖지 않는다. 본 발명의 대안적인 구현예에서, ceDNA 벡터가 서열번호 1, 2, 5 내지 14 중 어느 하나에서 선택되는 뉴클레오타이드 서열을 포함하는 WT-ITR을 갖는 경우, 플랭킹 ITR은 또한 WT이고, ceDNA 벡터는, 예를 들어 본원 및 국제 출원 PCT/US18/49996(예를 들어, PCT/US18/49996(이는 그 전문이 본원에 참조로서 인용됨)의 표 11 참조)에 개시된 바와 같은 조절 스위치를 포함한다. 일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 본원에 개시된 바와 같은 조절 스위치와, 서열번호 1, 2, 5 내지 14 중 어느 하나에서 선택되는 뉴클레오타이드 서열을 갖는 선택된 WT-ITR을 포함한다.
본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 작동 가능한 RBE, trs 및 RBE' 부분을 보유하는 WT-ITR 구조를 포함할 수 있다. 도 2a도 2b는, 예시 목적으로 야생형 ITR을 사용하여, ceDNA 벡터의 야생형 ITR 구조 부분 내에서 trs 부위의 작동을 위한 하나의 가능한 메커니즘을 보여준다. 일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 Rep-결합 부위(예를 들어, RBS; AAV2의 경우 5'-GCGCGCTCGCTCGCTC-3'(서열번호 60))와 말단 분해 부위(TRS; 예를 들어, 5'-AGTT(서열번호 62))를 포함하는 하나 이상의 기능성 WT-ITR 폴리뉴클레오타이드 서열을 함유한다. 일부 구현예에서, 적어도 하나의 WT-ITR은 기능성이다. 대안적인 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터가 서로 실질적으로 대칭인 2개의 WT-ITR을 포함하는 경우, 적어도 하나의 WT-ITR은 기능성이고, 적어도 하나의 WT-ITR은 비기능성이다.
B. 비대칭인 ITR 쌍 또는 대칭인 ITR 쌍을 포함하는 ceDNA 벡터에 대한 변형된 ITR(mod-ITR) 전반
본원에 논의된 바와 같이, PAH 단백질의 발현을 위한 ceDNA 벡터는 대칭인 ITR 쌍 또는 비대칭인 ITR 쌍을 포함할 수 있다. 두 경우 모두, ITR 중 하나 또는 둘 모두는 변형된 ITR일 수 있으며, 여기서 차이점은, 첫 번째 경우(즉, 대칭인 mod-ITR), mod-ITR은 동일한 3차원 공간 구성을 갖지만(즉, 동일한 A-A', C-C' 및 B-B' 아암 구성을 가짐), 두 번째 경우(즉, 비대칭인 mod-ITR), mod-ITR은 상이한 3차원 공간 구성을 갖는다(즉, 상이한 A-A', C-C' 및 B-B' 아암 구성을 가짐)는 점이다.
일부 구현예에서, 변형된 ITR은 야생형 ITR 서열(예를 들어, AAV ITR)과 비교하여 결실, 삽입 및/또는 치환에 의해 변형된 ITR이다. 일부 구현예에서, ceDNA 벡터에서 ITR 중 적어도 하나는 기능성 Rep 결합 부위(RBS; 예를 들어 AAV2의 경우 5'-GCGCGCTCGCTCGCTC-3', 서열번호 60)와 기능성 말단 분해 부위(TRS; 예를 들어 5'-AGTT-3', 서열번호 62)를 포함한다. 하나의 구현예에서, ITR 중 적어도 하나는 비기능성 ITR이다. 하나의 구현예에서, 상이한 또는 변형된 ITR은 각각 상이한 혈청형 유래의 야생형 ITR이 아니다.
ITR의 특정 변경 및 돌연변이가 본원에 상세하게 설명되어 있지만, ITR의 맥락에서, "변경된" 또는 "돌연변이된" 또는 "변형된"은 뉴클레오타이드가 야생형, 참조 또는 본래 ITR 서열에 비해 삽입, 결실 및/또는 치환된 것을 나타낸다. 변경된 또는 돌연변이된 ITR은 조작된 ITR일 수 있다. 본원에 사용된 "조작된"은, 인간의 손에 의해 조작된 양태를 나타낸다. 예를 들어, 폴리펩타이드는, 폴리펩타이드의 적어도 하나의 양태, 예를 들어 이의 서열이, 자연에 존재하는 양태와 상이하도록 인간의 손에 의해 조작된 경우, "조작된" 것으로 간주된다.
일부 구현예에서, mod-ITR은 합성일 수 있다. 하나의 구현예에서, 합성 ITR은 하나 초과의 AAV 혈청형에서 유래한 ITR 서열을 기반으로 한다. 또 다른 구현예에서, 합성 ITR은 AAV 기반 서열을 포함하지 않는다. 또 다른 구현예에서, 합성 ITR은 AAV 유래 서열을 갖지 않거나 일부만 갖지만, 상기 기재된 ITR 구조를 보존한다. 일부 양태에서, 합성 ITR은 야생형 Rep 또는 특정 혈청형의 Rep와 우선적으로 상호작용할 수 있거나, 또는 일부 경우에, 야생형 Rep에 의해 인식되지 않고 돌연변이된 Rep에 의해서만 인식될 수 있다.
당업자는 공지된 수단을 통해 다른 혈청형에서 상응하는 서열을 결정할 수 있다. 예를 들어, A, A', B, B', C, C' 또는 D 영역에 변경이 존재하는 지 여부를 결정하고, 또 다른 혈청형에서 상응하는 영역을 결정한다. 기본 설정의 BLAST®(Basic Local Alignment Search Tool) 또는 다른 상동성 정렬 프로그램을 사용하여 상응하는 서열을 결정할 수 있다. 본 발명은 나아가 상이한 AAV 혈청형의 조합인 mod-ITR, 즉, 하나의 mod-ITR은 하나의 AAV 혈청형에서 유래할 수 있고 다른 하나의 mod-ITR은 상이한 혈청형에서 유래할 수 있는 mod-ITR을 포함하는 ceDNA 벡터의 집단 및 복수의 ceDNA 벡터를 제공한다. 이론에 구애됨 없이, 하나의 구현예에서, ceDNA 벡터의 하나의 ITR은 AAV2 ITR 서열에서 유래하거나 이를 기반으로 할 수 있고, 다른 하나의 ITR은 AAV 혈청형1(AAV1), AAV 혈청형 4(AAV4), AAV 혈청형 5(AAV5), AAV 혈청형 6(AAV6), AAV 혈청형 7(AAV7), AAV 혈청형 8(AAV8), AAV 혈청형 9(AAV9), AAV 혈청형 10(AAV10), AAV 혈청형 11(AAV11) 또는 AAV 혈청형 12(AAV12) 중 임의의 하나 이상의 ITR 서열에서 유래하거나 이를 기반으로 할 수 있다.
임의의 파르보바이러스 ITR이 ITR로서 또는 변형을 위한 기본 ITR로서 사용될 수 있다. 바람직하게는, 파르보바이러스는 데펜도바이러스이다. 더욱 바람직하게는, AAV이다. 선택된 혈청형은 혈청형의 조직 친화성을 기반으로 할 수 있다. AAV2는 폭넓은 조직 친화성을 갖고, AAV1은 뉴런 및 골격근을 우선적으로 표적화하고, AAV5는 뉴런, 망막색소상피세포 및 광수용체를 우선적으로 표적화한다. AAV6은 골격근 및 폐를 우선적으로 표적화한다. AAV8은 간, 골격근, 심장 및 췌장 조직을 우선적으로 표적화한다. AAV9는 간, 골격 및 폐 조직을 우선적으로 표적화한다. 하나의 구현예에서, 변형된 ITR은 AAV2 ITR을 기반으로 한다.
보다 구체적으로, 특정 대형 Rep 단백질과 기능적으로 상호작용하는 구조 요소의 능력은 구조 요소의 변형을 통해 변경될 수 있다. 예를 들어, 구조 요소의 뉴클레오타이드 서열은 ITR의 야생형 서열과의 비교를 통해 변형시킬 수 있다. 하나의 구현예에서, ITR의 구조 요소(예를 들어, A 아암, A' 아암, B 아암, B' 아암, C 아암, C' 아암, D 아암, RBE, RBE' 및 trs)는 제거되어, 상이한 파르보바이러스의 야생형 구조 요소로 대체될 수 있다. 예를 들어, 대체 구조는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, 뱀 파르보바이러스(예를 들어, 공비단뱀 파르보바이러스), 소 파르보바이러스, 염소 파르보바이러스, 조류 파르보바이러스, 개 파르보바이러스, 말 파르보바이러스, 새우 파르보바이러스, 돼지 파르보바이러스 또는 곤충 AAV에서 유래할 수 있다. 예를 들어, ITR은 AAV2 ITR일 수 있고, A 또는 A' 아암, 또는 RBE는 AAV5의 구조 요소로 대체될 수 있다. 또 다른 예에서, ITR은 AAV5 ITR일 수 있고, C 또는 C' 아암, RBE, 및 trs는 AAV2의 구조 요소로 대체될 수 있다. 또 다른 예에서, AAV ITR은 B 및 B' 아암이 AAV2 ITR B 및 B' 아암으로 대체된 AAV5 ITR일 수 있다.
단지 예로서, 표 4는 변형된 ITR 영역 내 적어도 하나의 뉴클레오타이드의 예시적인 변형(예를 들어, 결실, 삽입 및/또는 치환)을 나타내며, 여기서 X는 상응하는 야생형 ITR에 대한 해당 섹션에서의 적어도 하나의 핵산의 변형(예를 들어, 결실, 삽입 및/또는 치환)을 나타낸다. 일부 구현예에서, C 및/또는 C' 및/또는 B 및/또는 B'의 임의의 영역 내 적어도 하나의 뉴클레오타이드의 임의의 변형(예를 들어, 결실, 삽입 및/또는 치환)은, 적어도 하나의 말단 루프에 3개의 순차적 T 뉴클레오타이드(즉, TTT)를 보유한다. 예를 들어, 변형이 단일 아암 ITR(예를 들어, 단일 C-C' 아암 또는 단일 B-B' 아암), 또는 변형된 C-B' 아암 또는 C'-B 아암, 또는 적어도 하나의 절단된 아암(예를 들어, 절단된 C-C' 아암 및/또는 절단된 B-B' 아암)을 갖는 2개의 아암 ITR 중 임의의 것을 생성하는 경우, 적어도 단일 아암, 또는 2개의 아암 ITR 중 적어도 하나의 아암(여기서 하나의 아암은 절단될 수 있음)은 적어도 하나의 말단 루프에 3개의 순차적 T 뉴클레오타이드(즉, TTT)를 보유한다. 일부 구현예에서, 절단된 C-C' 아암 및/또는 절단된 B-B' 아암은 말단 루프에 3개의 순차적 T 뉴클레오타이드(즉, TTT)를 갖는다.
Figure pct00016
일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터에 사용되는 mod-ITR은 본원에 개시된 바와 같은 비대칭인 ITR 쌍 또는 대칭인 mod-ITR 쌍을 포함하며, 표 4에 제시된 변형의 조합 중 어느 하나, 및 또한 A'와 C 사이, C와 C' 사이, C'와 B 사이, B와 B' 사이, 및 B'와 A 사이에서 선택되는 영역 중 임의의 하나 이상에서의 적어도 하나의 뉴클레오타이드의 변형을 포함할 수 있다. 일부 구현예에서, C 또는 C' 또는 B 또는 B' 영역 내 적어도 하나의 뉴클레오타이드의 임의의 변형(예를 들어, 결실, 삽입 및/또는 치환)은, 여전히 스템-루프의 말단 루프를 보존한다. 일부 구현예에서, C 및 C' 및/또는 B 및 B' 영역 내 적어도 하나의 뉴클레오타이드의 임의의 변형(예를 들어, 결실, 삽입 및/또는 치환)은, 적어도 하나의 말단 루프에 3개의 순차적 T 뉴클레오타이드(즉, TTT)를 보유한다. 대안적인 구현예에서, C와 C' 사이 및/또는 B와 B' 사이의 적어도 하나의 뉴클레오타이드의 임의의 변형(예를 들어, 결실, 삽입 및/또는 치환)은, 적어도 하나의 말단 루프에 3개의 순차적 A 뉴클레오타이드(즉, AAA)를 보유한다. 일부 구현예에서, 본원에 사용하기 위한 변형된 ITR은 표 4에 제시된 변형의 조합 중 어느 하나, 및 또한 A', A 및/또는 D에서 선택되는 영역 중 임의의 하나 이상에서의 적어도 하나의 뉴클레오타이드 변형(예를 들어, 결실, 삽입 및/또는 치환)을 포함할 수 있다. 예를 들어, 일부 구현예에서, 본원에 사용되는 변형된 ITR은 표 4에 제시된 변형의 조합 중 어느 하나, 및 또한 A 영역 내 적어도 하나의 뉴클레오타이드 변형(예를 들어, 결실, 삽입 및/또는 치환)을 포함할 수 있다. 예를 들어, 일부 구현예에서, 본원에 사용하기 위한 변형된 ITR은 표 4에 제시된 변형의 조합 중 어느 하나, 및 또한 A' 영역 내 적어도 하나의 뉴클레오타이드 변형(예를 들어, 결실, 삽입 및/또는 치환)을 포함할 수 있다. 예를 들어, 일부 구현예에서, 본원에 사용되는 변형된 ITR은 표 4에 제시된 변형의 조합 중 어느 하나, 및 또한 A 및/또는 A' 영역 내 적어도 하나의 뉴클레오타이드 변형(예를 들어, 결실, 삽입 및/또는 치환)을 포함할 수 있다. 예를 들어, 일부 구현예에서, 본원에 사용되는 변형된 ITR은 표 4에 제시된 변형의 조합 중 어느 하나, 및 또한 D 영역 내 적어도 하나의 뉴클레오타이드 변형(예를 들어, 결실, 삽입 및/또는 치환)을 포함할 수 있다.
하나의 구현예에서, 구조 요소의 뉴클레오타이드 서열을 변형시켜(예를 들어, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개 또는 20개 이상(또는 상기 제시된 개수 내 임의의 범위)의 뉴클레오타이드를 변형시켜) 변형된 구조 요소를 생성할 수 있다. 하나의 구현예에서, ITR에 대한 특정 변형은 본원에 예시된 것(예를 들어, 서열번호 3, 4, 15 내지 47, 101 내지 116 또는 165 내지 187), 또는 2018년 12월 6일자 출원된 PCT/US2018/064242의 도 7a 및 도 7b에 제시된 것이다(예를 들어, PCT/US2018/064242의 서열번호 97 내지 98, 101 내지 103, 105 내지 108, 111 내지 112, 117 내지 134, 545 내지 54). 일부 구현예에서, ITR을 변형시킬 수 있다(예를 들어, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개 또는 20개 이상(또는 상기 제시된 개수 내 임의의 범위)의 뉴클레오타이드를 변형시킴). 다른 구현예에서, ITR은 서열번호 3, 4, 15 내지 47, 101 내지 116 또는 165 내지 187의 변형된 ITR 중 하나, 또는 서열번호 3, 4, 15 내지 47, 101 내지 116 또는 165 내지 187의 A-A' 아암의 RBE 함유 섹션, 및 C-C' 및 B-B' 아암, 또는 국제 출원 PCT/US18/49996(이는 그 전문이 본원에 참조로서 인용된)의 표 2 내지 표 9(즉, 서열번호 110 내지 112, 115 내지 190, 200 내지 468)에 제시된 바와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 이상의 서열 동일성을 가질 수 있다.
일부 구현예에서, 변형된 ITR은, 예를 들어 특정 아암의 전부, 예를 들어 A-A' 아암의 전부 또는 일부, 또는 B-B' 아암의 전부 또는 일부, 또는 C-C' 아암의 전부 또는 일부의 제거 또는 결실, 또는 대안적으로, 스템(예를 들어, 단일 아암)을 캡핑하는 최종 루프가 여전히 존재하는 한, 루프의 스템을 형성하는 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 그 이상의 염기쌍의 제거를 포함할 수 있다(예를 들어, 2018년 12월 6일자 출원된 PCT/US2018/064242(이는 그 전문이 본원에 참조로서 인용됨)의 도 7a의 ITR-21 참조). 일부 구현예에서, 변형된 ITR은 B-B' 아암으로부터 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 그 이상의 염기쌍의 제거를 포함할 수 있다. 일부 구현예에서, 변형된 ITR은 C-C' 아암으로부터 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 그 이상의 염기쌍의 제거를 포함할 수 있다(예를 들어, 2018년 12월 6일자 출원된 PCT/US2018/064242(이는 그 전문이 본원에 참조로서 인용됨)의 도 3b의 ITR-1 또는 도 7a의 ITR-45 참조). 일부 구현예에서, 변형된 ITR은 C-C' 아암으로부터 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 그 이상의 염기쌍의 제거, 및 B-B' 아암으로부터 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 그 이상의 염기쌍의 제거를 포함할 수 있다. 염기쌍의 제거의 임의의 조합이 고려되며, 예를 들어 C-C' 아암에서 6개의 염기쌍이 제거되고 B-B' 아암에서 2개의 염기쌍이 제거될 수 있다. 예시적인 예로서, 도 3b는, C 부분과 C' 부분 각각에서 적어도 7개의 염기쌍 결실, C 영역과 C' 영역 사이의 루프에서 뉴클레오타이드의 치환, 및 변형된 ITR이 2개의 아암을 포함하며 이 중 적어도 하나의 아암(예를 들어, C-C')이 절단되도록 B 영역과 B' 영역 각각에서의 적어도 하나의 염기쌍 결실을 갖는 예시적인 변형된 ITR을 보여준다. 일부 구현예에서, 변형된 ITR은 또한 B-B' 아암이 또한 WT ITR에 비해 절단되도록 B 영역과 B' 영역 각각에서의 적어도 하나의 염기쌍 결실을 포함한다.
일부 구현예에서, 변형된 ITR은 전장 야생형 ITR 서열에 비해 1개 내지 50개(예를 들어, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개, 31개, 32개, 33개, 34개, 35개, 36개, 37개, 38개, 39개, 40개, 41개, 42개, 43개, 44개, 45개, 46개, 47개, 48개, 49개 또는 50개)의 뉴클레오타이드 결실을 가질 수 있다. 일부 구현예에서, 변형된 ITR은 전장 WT ITR 서열에 비해 1개 내지 30개의 뉴클레오타이드 결실을 가질 수 있다. 일부 구현예에서, 변형된 ITR은 전장 야생형 ITR 서열에 비해 2개 내지 20개의 뉴클레오타이드 결실을 갖는다.
일부 구현예에서, 변형된 ITR은, DNA 복제(예를 들어, Rep 단백질에 의한 RBE에의 결합, 또는 말단 분해 부위에서의 닉킹)를 방해하지 않도록, A 또는 A' 영역의 RBE 함유 부분에서 임의의 뉴클레오타이드 결실을 함유하지 않는다. 일부 구현예에서, 본원에의 사용을 위해 포함된 변형된 ITR은 본원에 기재된 바와 같은 B, B', C, 및/또는 C 영역에 하나 이상의 결실을 갖는다.
일부 구현예에서, 대칭인 ITR 쌍 또는 비대칭인 ITR 쌍을 포함하는 PAH 단백질의 발현을 위한 ceDNA 벡터는, 본원에 개시된 바와 같은 조절 스위치와, 서열번호 3, 4, 15 내지 47, 101 내지 116 또는 165 내지 187로 이루어지는 군 중 어느 하나에서 선택되는 뉴클레오타이드 서열을 갖는 선택된 적어도 하나의 변형된 ITR을 포함한다.
또 다른 구현예에서, 구조 요소의 구조는 변형될 수 있다. 예를 들어, 구조 요소는 스템의 높이 및/또는 루프 내 뉴클레오타이드 수가 변경된다. 예를 들어, 스템의 높이는 약 2개, 3개, 4개, 5개, 6개, 7개, 8개 또는 9개 뉴클레오타이드 또는 그 이상, 또는 상기 개수 내 임의의 범위의 뉴클레오타이드일 수 있다. 하나의 구현예에서, 스템의 높이는 약 5개 뉴클레오타이드 내지 약 9개 뉴클레오타이드일 수 있으며, Rep와 기능적으로 상호작용한다. 또 다른 구현예에서, 스템의 높이는 약 7개 뉴클레오타이드일 수 있으며, Rep와 기능적으로 상호작용한다. 또 다른 예에서, 루프는 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개 뉴클레오타이드 또는 그 이상, 또는 상기 개수 내 임의의 범위의 뉴클레오타이드를 가질 수 있다.
또 다른 구현예에서, RBE 또는 연장된 RBE 내 GAGY 결합 부위 또는 GAGY 관련 결합 부위의 수가 증가 또는 감소할 수 있다. 하나의 예에서, RBE 또는 연장된 RBE는, 1개, 2개, 3개, 4개, 5개 또는 6개, 또는 그 이상의 GAGY 결합 부위, 또는 상기 개수 내 임의의 범위의 GAGY 결합 부위를 포함할 수 있다. 각각의 GAGY 결합 부위는, 서열이 Rep 단백질에 결합하는 데 충분하다면, 독립적으로 정확한 GAGY 서열 또는 GAGY에 유사한 서열일 수 있다.
또 다른 구현예에서, 2개의 요소(예컨대, 비제한적으로, RBE와 헤어핀) 사이의 간격을 변경시켜(예를 들어, 증가 또는 감소시켜), 큰 Rep 단백질과의 기능적 상호작용을 변경시킬 수 있다. 예를 들어, 상기 간격은 약 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개 또는 21개 뉴클레오타이드 또는 그 이상, 또는 상기 개수 내 임의의 범위의 뉴클레오타이드일 수 있다.
본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 본원에 개시된 야생형 AAV2 ITR 구조에 대해 변형된 ITR 구조를 포함할 수 있지만, 작동 가능한 RBE, trs 및 RBE' 부분은 여전히 보유한다. 도 2a도 2b는, PAH 단백질의 발현을 위한 ceDNA 벡터의 야생형 ITR 구조 부분 내에서 trs 부위의 작동을 위한 하나의 가능한 메커니즘을 보여준다. 일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 Rep-결합 부위(예를 들어, RBS; AAV2의 경우 5'-GCGCGCTCGCTCGCTC-3'(서열번호 60))와 말단 분해 부위(TRS; 예를 들어, 5'-AGTT(서열번호 62))를 포함하는 하나 이상의 기능성 ITR 폴리뉴클레오타이드 서열을 함유한다. 일부 구현예에서, 적어도 하나의 ITR(wt 또는 변형된 ITR)은 기능성이다. 대안적인 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터가 서로 상이하거나 비대칭인 2개의 변형된 ITR을 포함하는 경우, 적어도 하나의 변형된 ITR은 기능성이고, 적어도 하나의 변형된 ITR은 비기능성이다.
일부 구현예에서, 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 변형된 ITR(예를 들어, 좌측 또는 우측 ITR)은, 루프 아암, 절단된 아암 또는 스페이서 내에 변형을 갖는다. 루프 아암, 절단된 아암 또는 스페이서 내에 변형을 갖는 ITR의 예시적인 서열은 국제 출원 PCT/US18/49996(이는 그 전문이 본원에 참조로서 인용됨)의 표 2(즉, 서열번호 135 내지 190, 200 내지 233); 표 3(예를 들어, 서열번호 234 내지 263); 표 4(예를 들어, 서열번호 264 내지 293); 표 5(예를 들어, 본원의 서열번호 294 내지 318); 표 6(예를 들어, 서열번호 319 내지 468; 및 표 7 내지 표 9(예를 들어, 서열번호 101 내지 110, 111 및 112, 115 내지 134) 또는 표 10A 또는 표 10B(예를 들어, 서열번호 9, 100, 469 내지 483, 484 내지 499)에 열거되어 있다.
일부 구현예에서, 비대칭인 ITR 쌍 또는 대칭인 mod-ITR 쌍을 포함하는 PAH 단백질의 발현을 위한 ceDNA 벡터에 사용되는 변형된 ITR은, 국제 출원 PCT/US18/49996(이는 그 전문이 본원에 참조로서 인용됨)의 표 2, 표 3, 표 4, 표 5, 표 6, 표 7, 표 8, 표 9, 및 표 10A 및 표 10B에 제시된 것들 중 임의의 것 또는 이들의 조합에서 선택된다.
비대칭인 ITR 쌍 또는 대칭인 mod-ITR 쌍을 포함하는 PAH 단백질의 발현을 위한 ceDNA 벡터에 사용되는 상기 각 부류의 추가의 예시적인 변형된 ITR은 표 5A 5B에 제공되어 있다. 표 5A의 우측 변형된 ITR의 예측된 2차 구조는 2018년 12월 6일자 출원된 국제 출원 PCT/US2018/064242의 도 7a에 제시되어 있고, 표 5B의 좌측 변형된 ITR의 예측된 2차 구조는 2018년 12월 6일자 출원된 국제 출원 PCT/US2018/064242의 도 7b에 제시되어 있으며, 상기 문헌은 그 전문이 본원에 참조로서 인용된다.
표 5A 표 5B는 예시적인 우측 및 좌측 변형된 ITR을 보여준다.
Figure pct00017
Figure pct00018
Figure pct00019
Figure pct00020
하나의 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는, 5'→3' 방향으로, 제1 아데노연관바이러스(AAV) 역말단반복서열(ITR), 관심 뉴클레오타이드 서열(예를 들어, 본원에 기재된 바와 같은 발현 카세트) 및 제2 AAV ITR을 포함하고, 여기서 제1 ITR(5' ITR)과 제2 ITR(3' ITR)은 서로에 대해 비대칭이며, 즉, 이들은 서로 상이한 3D 공간 구성을 갖는다. 예시적인 구현예로서, 제1 ITR은 야생형 ITR이고, 제2 ITR은 돌연변이되거나 변형된 ITR일 수 있거나, 또는 그 반대로 제1 ITR은 돌연변이되거나 변형된 ITR이고, 제2 ITR은 야생형 ITR일 수 있다. 일부 구현예에서, 제1 ITR과 제2 ITR은 모두 mod-ITR이지만, 상이한 서열을 갖거나 상이한 변형을 갖기 때문에, 동일한 변형된 ITR이 아니고, 상이한 3D 공간 구성을 갖는다. 달리 말하면, 비대칭인 ITR을 갖는 ceDNA 벡터는, WT-ITR과 비교하여 하나의 ITR에서의 임의의 변화가 다른 하나의 ITR에 반영되지 않거나; 또는 대안적으로, 비대칭인 ITR이 변형된 비대칭인 ITR 쌍을 갖고 서로에 대해 상이한 서열과 상이한 3차원 형상을 가질 수 있는 ITR을 포함한다. PAH 단백질의 발현 및 ceDNA-플라스미드를 생성에 사용하기 위한 ceDNA 벡터의 예시적인 비대칭인 ITR은 표 5A표 5B에 제시되어 있다.
대안적인 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 2개의 대칭인 mod-ITR을 포함하며, 즉, 두 개의 ITR은 동일한 서열을 갖지만, 서로 역 보체(역상)이다. 일부 구현예에서, 대칭인 mod-ITR 쌍은 동일한 AAV 혈청형의 야생형 ITR 서열에 대한 결실, 삽입 또는 치환 중 적어도 하나 또는 이들의 임의의 조합을 포함한다. 대칭인 ITR에서 부가, 결실 또는 치환은 동일하지만, 서로 역 보체이다. 예를 들어, 5' ITR의 C 영역에의 3개의 뉴클레오타이드의 삽입은 3' ITR의 C' 영역 내 상응하는 섹션에의 3개의 역 보체 뉴클레오타이드의 삽입으로 반영될 것이다. 단지 예시의 목적으로, 부가가 5' ITR에의 AACG인 경우, 이러한 부가는 상응하는 부위의 3' ITR에의 CGTT이다. 예를 들어, 5' ITR 센스 가닥이 ATCGATCG인 경우, G와 A 사이에 AACG가 부가되면 ATCG AACG ATCG(서열번호 51)의 서열이 생성된다. 상응하는 3' ITR 센스 가닥은 CGATCGAT(ATCGATCG의 역 보체)이고, T와 C 사이에 CGTT(즉, AACG의 역 보체)가 부가되어, CGAT CGTT CGAT(서열번호 49)(ATCG AACG ATCG(서열번호 51)의 역 보체) 서열이 생성된다.
대안적인 구현예에서, 변형된 ITR 쌍은 본원에 정의된 바와 같이 실질적으로 대칭이며, 즉, 변형된 ITR 쌍은 상이한 서열을 갖지만, 상응하거나 동일한 대칭인 3차원 형상을 가질 수 있다. 예를 들어, 하나의 변형된 ITR은 하나의 혈청형에서 유래할 수 있고, 다른 하나의 변형된 ITR은 상이한 혈청형에서 유래할 수 있지만, 동일한 영역에 동일한 돌연변이(예를 들어, 뉴클레오타이드 삽입, 결실 또는 치환)을 가질 수 있다. 달리 말하면, 단지 예시의 목적으로, 5' mod-ITR은 AAV2에 유래할 수 있고 C 영역에 결실을 가질 수 있으며, 3' mod-ITR은 AAV5에서 유래할 수 있고 C' 영역에 상응하는 결실을 가질 수 있으며, 단, 5' mod-ITR과 3' mod-ITR은 동일하거나 대칭인 3차원 공간 구성을 갖고, 이들은 변형된 ITR 쌍으로서 본원에의 사용을 위해 포함된다.
일부 구현예에서, 실질적으로 대칭인 mod-ITR 쌍은 3D 공간에서 동일한 A, C-C' 및 B-B' 루프를 가지며, 예를 들어 실질적으로 대칭인 mod-ITR 쌍에서 변형된 ITR이 C-C' 아암의 결실을 갖는 경우, 동족 mod-ITR은 C-C' 루프의 상응하는 결실을 갖고, 또한 이의 동족 mod-ITR의 기하학적 공간에서 동일한 형상으로 나머지 A 및 B-B' 루프의 유사한 3D 구조를 갖는다. 단지 예로서, 실질적으로 대칭인 ITR은 기하학적 공간에서 동일한 형상이 되도록 대칭인 공간 구성을 가질 수 있다. 이는, G-C 쌍이, 예를 들어 C-G 쌍으로, 또는 그 반대로 변형되거나, A-T 쌍이 T-A 쌍으로, 또는 그 반대로 변형되는 경우에 일어날 수 있다. 따라서, ATCG AACG ATCG(서열번호 51)로서의 변형된 5' ITR과 CGAT CGTT CGAT(서열번호 49)로서의 변형된 3' ITR(즉, ATCG AACG ATCG(서열번호 51)의 역 보체)의 상기 예시적인 예를 사용하면, 이러한 변형된 ITR은, 예를 들어 5' ITR이 ATCG AAC C ATCG(서열번호 50)의 서열(여기서, 추가의 G가 C로 변형됨)을 갖고, 실질적으로 대칭인 3' ITR이 A에 더하여 T의 상응하는 변형 없이 CGAT CGTT CGAT(서열번호 49)의 서열을 갖는 경우, 여전히 대칭일 수 있다. 일부 구현예에서, 이러한 변형된 ITR 쌍은 대칭인 입체화학을 갖기 때문에 실질적으로 대칭이다.
표 6은, PAH 단백질의 발현을 위한 ceDNA 벡터에 사용되는 예시적인 대칭인 변형된 ITR 쌍(즉, 좌측 변형된 ITR과 대칭인 우측 변형된 ITR)을 보여준다. 서열의 볼드체(적색) 부분은 부분 ITR 서열(즉, A-A', C-C' 및 B-B' 루프의 서열)을 식별한다. 이러한 예시적인 변형된 ITR은 GCGCGCTCGCTCGCTC-3'(서열번호 60)의 RBE, ACTGAGGC(서열번호 69)의 스페이서, 스페이서 보체 GCCTCAGT(서열번호 70) 및 GAGCGAGCGAGCGCGC(서열번호 71)의 RBE'(즉, RBE에 대한 보체)를 포함할 수 있다.
Figure pct00021
Figure pct00022
Figure pct00023
일부 구현예에서, 비대칭인 ITR 쌍을 포함하는 PAH 단백질의 발현을 위한 ceDNA 벡터는 본원의 표 5A표 5B 중 임의의 하나 이상에 제시된 ITR 서열 또는 ITR 부분 서열에서의 임의의 변형에 상응하는 변형을 갖는 ITR, 또는 2018년 12월 6일자 출원된 국제 출원 PCT/US2018/064242(이는 그 전문이 본원에 참조로서 인용됨)의 도 7a 및 도 7b에 제시된, 또는 2018년 9월 7일자 출원된 국제 출원 PCT/US18/49996(이는 그 전문이 본원에 참조로서 인용됨)의 표 2, 표 3, 표 4, 표 5, 표 6, 표 7, 표 8, 표 9, 또는 표 10a 및 표 10b에 개시된 서열을 포함할 수 있다.
V. 예시적인 ceDNA 벡터
상기 기재된 바와 같이, 본 개시내용은 본원에 기재된 바와 같은 비대칭인 ITR 쌍, 대칭인 ITR 쌍 또는 실질적으로 대칭인 ITR 쌍 중 어느 하나를 포함하는, 재조합 ceDNA 발현 벡터 및 PAH 단백질을 인코딩하는 ceDNA 벡터에 관한 것이다. 특정 구현예에서, 본 개시내용은 플랭킹 ITR 서열과 전이유전자를 갖는 PAH 단백질의 발현을 위한 재조합 ceDNA 벡터로서, 여기서 ITR 서열은 본원에 정의된 바와 같이 서로 비대칭, 대칭 또는 실질적으로 대칭이고, ceDNA는 플랭킹 ITR 사이에 위치한 관심 뉴클레오타이드 서열(예를 들어, 전이유전자의 핵산을 포함하는 발현 카세트)을 추가로 포함하며, 여기서 상기 핵산 분자에는 바이러스 캡시드 단백질 코딩 서열이 없는 재조합 ceDNA 벡터에 관한 것이다.
PAH 단백질의 발현을 위한 ceDNA 발현 벡터는, 적어도 하나의 ITR이 변경된 본원에 기재된 바와 같은 뉴클레오타이드 서열(들)을 포함하는 재조합 DNA 절차에 편리하게 적용될 수 있는 임의의 ceDNA 벡터일 수 있다. 본 개시내용의 PAH 단백질의 발현을 위한 ceDNA 벡터는 ceDNA 벡터가 도입되는 숙주세포와 양립 가능하다. 특정 구현예에서, ceDNA 벡터는 선형일 수 있다. 특정 구현예에서, ceDNA 벡터는 염색체외 엔티티로서 존재할 수 있다. 특정 구현예에서, 본 개시내용의 ceDNA 벡터는 숙주세포의 게놈으로의 공여체 서열의 통합을 가능하게 하는 요소(들)을 함유할 수 있다. 본원에 사용된 "전이유전자"와 "이종 뉴클레오타이드 서열"은 동의어이며, 본원에 기재된 바와 같이 PAH 단백질을 인코딩한다.
이제 도 1a 내지 도 1g를 참조하면, PAH 단백질의 발현을 위한 ceDNA 벡터의 제조에 유용한 2개의 비제한적인 플라스미드의 기능성 구성요소의 개략도가 제시되어 있다. 도 1a, 도 1b, 도 1d, 도 1f는, PAH 단백질의 발현을 위한 ceDNA 벡터의 구조체 또는 ceDNA 플라스미드의 상응하는 서열을 보여준다. ceDNA 벡터는 캡시드를 함유하지 않고, 제1 ITR, 발현 가능한 전이유전자 카세트 및 제2 ITR을 이러한 순서로 인코딩하는 플라스미드에서 수득될 수 있으며, 여기서 제1 ITR 서열과 제2 ITR 서열은 본원에 정의된 바와 같이 서로 비대칭, 대칭 또는 실질적으로 대칭이다. PAH 단백질의 발현을 위한 ceDNA 벡터는 캡시드를 함유하지 않고, 제1 ITR, 발현 가능한 전이유전자(단백질 또는 핵산) 및 제2 ITR을 이러한 순서로 인코딩하는 플라스미드에서 수득될 수 있으며, 여기서 제1 ITR 서열과 제2 ITR 서열은 본원에 정의된 바와 같이 서로 비대칭, 대칭 또는 실질적으로 대칭이다. 일부 구현예에서, 발현 가능한 전이유전자 카세트는, 필요한 경우, 인핸서/프로모터, 하나 이상의 상동성 아암, 공여체 서열, 전사 후 조절 요소(예를 들어, WPRE, 예를 들어 서열번호 67)), 및 폴리아데닐화 및 종결 신호(예를 들어, BGH polyA, 예를 들어 서열번호 68)를 포함한다.
도 5는, 실시예에 기재된 방법을 사용하여 다수의 플라스미드 구조체로부터 ceDNA의 생산을 확인시켜 주는 겔이다. ceDNA는, 상기 도 4a 및 실시예에 논의된 바와 같이, 겔에서의 특징적인 밴드 패턴에 의해 확인된다.
A. 조절 요소.
본원에 정의된 바와 같은 비대칭인 ITR 쌍 또는 대칭인 ITR 쌍을 포함하는 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, 시스-조절 요소의 특정 조합을 추가로 포함할 수 있다. 시스-조절 요소에는, 비제한적으로, 프로모터, 리보스위치, 절연인자, mir-조절 요소, 전사 후 조절 요소, 조직 및 세포 유형 특이적 프로모터, 및 인핸서가 포함된다. 예시적인 프로모터는 국제 출원 번호 PCT/US2020/021328(이는 그 전문이 본원에 참조로서 인용됨), 예를 들어 표 7에 열거되어 있다. 예시적인 인핸서는 국제 출원 번호 PCT/US2020/021328(이는 그 전문이 본원에 참조로서 인용됨), 예를 들어 표 8에 열거되어 있다. 일부 구현예에서, ITR은 전이유전자, 예를 들어 PAH 단백질을 위한 프로모터로서 작용할 수 있다. 일부 구현예에서, 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 전이유전자의 발현을 조절하는 추가 구성요소, 예를 들어 전이유전자의 발현을 조절하는 본원에 기재된 바와 같은 조절 스위치, 또는 PAH 단백질을 인코딩하는 ceDNA 벡터를 포함하는 세포를 사멸시킬 수 있는 사멸 스위치를 포함한다. 본 발명에 사용될 수 있는 조절 스위치를 비롯한 조절 요소는 국제 출원 PCT/US18/49996(이는 그 전문이 본원에 참조로서 인용됨)에 보다 충분히 논의되어 있다.
구현예에서, 제2 뉴클레오타이드 서열은 조절 서열과, 뉴클레아제를 인코딩하는 뉴클레오타이드 서열을 포함한다. 특정 구현예에서, 유전자 조절 서열은 뉴클레아제를 인코딩하는 뉴클레오타이드 서열에 작동 가능하게 연결되어 있다. 특정 구현예에서, 조절 서열은 숙주세포에서 뉴클레아제의 발현을 제어하는 데 적합하다. 특정 구현예에서, 조절 서열은 본 개시내용의 뉴클레아제(들)을 인코딩하는 뉴클레오타이드 서열과 같은 프로모터 서열에 작동 가능하게 연결된 유전자의 전사를 지시할 수 있는, 적합한 프로모터 서열을 포함한다. 특정 구현예에서, 제2 뉴클레오타이드 서열은 뉴클레아제를 인코딩하는 뉴클레오타이드 서열의 5' 말단에 연결된 인트론 서열을 포함한다. 특정 구현예에서, 프로모터의 효능을 증가시키기 위해 인핸서 서열이 프로모터의 업스트림에 제공된다. 특정 구현예에서, 조절 서열은 인핸서와 프로모터를 포함하며, 여기서 제2 뉴클레오타이드 서열은 뉴클레아제를 인코딩하는 뉴클레오타이드 서열의 업스트림에 있는 인트론 서열을 포함하고, 인트론은 하나 이상의 뉴클레아제 절단 부위(들)을 포함하고, 프로모터는 뉴클레아제를 인코딩하는 뉴클레오타이드 서열에 작동 가능하게 연결되어 있다.
합성적으로, 또는 실시예에 본원에 기재된 바와 같은 세포 기반 생산 방법을 사용하여 생산된 PAH 단백질의 발현을 위한 ceDNA 벡터는, WHP 전사 후 조절 요소(WPRE)(예를 들어, 서열번호 67)와 BGH polyA(서열번호 68) 같은 시스-조절 요소의 특정 조합을 추가로 포함할 수 있다. 발현 구조체에 사용하기에 적합한 발현 카세트는 바이러스 캡시드에 의해 부과된 패키징 제약에 의해 제한되지 않는다.
(i) 프로모터:
당업자는, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터에 사용되는 프로모터가 이를 촉진시키는 특정 서열에 적절하게 조정되어야 한다는 것을 이해할 것이다.
PAH 단백질의 발현을 위한 ceDNA 벡터의 발현 카세트는 전체 발현 수준 및 세포 특이성에 영향을 미칠 수 있는 프로모터를 포함한다. 전이유전자 발현, 예를 들어 PAH 단백질의 발현을 위해, 이는 고도로 활성인 바이러스 유래의 극초기 프로모터를 포함할 수 있다. 발현 카세트는 특정 세포 유형에 대한 전이유전자 발현을 제한하고, 조절되지 않은 이소성 발현으로 인한 독성 효과 및 면역 반응을 감소시키기 위해 조직 특이적 진핵생물 프로모터를 함유할 수 있다. 일부 구현예에서, 발현 카세트는 CAG 프로모터(서열번호 72)와 같은 프로모터 또는 합성 조절 요소를 함유할 수 있다. CAG 프로모터는 (i) 시토메갈로바이러스(CMV) 초기 인핸서 요소, (ii) 닭 베타-액틴 유전자의 프로모터, 제1 엑손 및 제1 인트론, 및 (iii) 토끼 베타-글로빈 유전자의 스플라이스 수용체를 포함한다. 대안적으로, 발현 카세트는 알파-1-항트립신(AAT) 프로모터(서열번호 73 또는 서열번호 74), 간 특이적(LP1) 프로모터(서열번호 75 또는 서열번호 76), 또는 인간 신장인자-1 알파(EF1a) 프로모터(예를 들어, 서열번호 77 또는 서열번호 78)를 함유할 수 있다. 일부 구현예에서, 발현 카세트에는, 하나 이상의 구성적 프로모터, 예를 들어 레트로바이러스 라우스육종 바이러스(RSV) LTR 프로모터(선택적으로 RSV 인핸서를 가짐), 또는 시토메갈로바이러스(CMV) 극초기 프로모터(선택적으로 CMV 인핸서를 가짐, 예를 들어 서열번호 79)가 포함된다. 대안적으로, 유도성 프로모터, 전이유전자에 대한 천연 프로모터, 조직 특이적 프로모터 또는 당업계에 공지된 다양한 프로모터가 사용될 수 있다. 일부 구현예에 따르면, 프로모터는 2020년 3월 6일자 출원된 국제 출원 번호 PCT/US2020/021328(이는 그 전문이 본원에 참조로서 인용됨)에 제시된 임의의 프로모터 또는 프로모터 서열이다.
일부 구현예에 따르면, 프로모터는 반덴드리슈(VD) 프로모터이다. 일부 구현예에 따르면, VD 프로모터는 하기 제시되는 서열번호 191를 포함한다:
CCGTCTGTCTGCACATTTCGTAGAGCGAGTGTTCCGATACTCTAATCTCCCTAGGCAAGGTTCATATTTGTGTAGGTTACTTATTCTCCTTTTGTTGACTAAGTCAATAATCAGAATCAGCAGGTTTGGAGTCAGCTTGGCAGGGATCAGCAGCCTGGGTTGGAAGGAGGGGGTATAAAAGCCCCTTCACCAGGAGAAGCCGTCACACAGATCCACAAGCTCCTG (서열번호 191). 일부 구현예에 따르면, 프로모터는 서열번호 191과 적어도 약 85% 동일한 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 191과 적어도 약 90% 동일한 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 191과 적어도 약 95% 동일한 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 191과 적어도 약 96% 동일한 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 191과 적어도 약 97% 동일한 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 191과 적어도 약 98% 동일한 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 191과 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 191의 핵산 서열로 이루어져 있다.
적합한 프로모터는 바이러스에서 유도될 수 있고, 따라서 바이러스 프로모터로 지칭될 수 있거나, 원핵생물 또는 진핵생물 유기체를 포함하는 임의의 유기체에서 유도될 수 있다. 적합한 프로모터는 임의의 RNA 폴리머라아제(예를 들어, pol I, pol II, pol III)에 의한 발현을 유도하는 데 사용될 수 있다. 예시적인 프로모터에는, 비제한적으로, SV40 초기 프로모터, 마우스 유선종양바이러스 긴말단반복서열(LTR) 프로모터; 아데노바이러스 주요 후기 프로모터(Ad MLP); 단순헤르페스바이러스(HSV) 프로모터, 시토메갈로바이러스(CMV) 프로모터, 예컨대 CMV 극초기 프로모터 영역(CMVIE), 라우스육종(rous sarcoma)바이러스(RSV) 프로모터, 인간 U6 소형 핵 프로모터(U6, 예를 들어, 서열번호 80)(문헌[Miyagishi et al., Nature Biotechnology 20, 497-500 (2002)]), 증강된 U6 프로모터(예를 들어, 문헌[Xia et al., Nucleic Acids Res. 2003 Sep. 1; 31(17))], 인간 H1 프로모터(H1)(예를 들어, 서열번호 81 또는 서열번호 155), CAG 프로모터, 인간 알파 1-항트립신(HAAT) 프로모터(예를 들어, 서열번호 82) 등이 포함된다. 특정 구현예에서, 이러한 프로모터는 하나 이상의 뉴클레아제 절단 부위를 포함하도록 이의 다운스트림 인트론 함유 말단에서 변경된다. 특정 구현예에서, 뉴클레아제 절단 부위(들)을 함유하는 DNA는 프로모터 DNA에 대해 이질적이다.
하나의 구현예에서, 사용된 프로모터는 치료용 단백질을 인코딩하는 유전자의 천연 프로모터이다. 치료용 단백질을 인코딩하는 각각의 유전자에 대한 프로모터 및 다른 조절 서열은 공지되어 있고 특징분석되어 있다. 사용되는 프로모터 영역은 SV40 인핸서(서열번호 126)를 비롯한 하나 이상의 추가 조절 서열(예를 들어, 천연), 예를 들어 인핸서(예를 들어, 서열번호 79 및 서열번호 83)를 추가로 포함할 수 있다.
일부 구현예에서, 프로모터는 또한 인간 유비퀴틴 C(hUbC), 인간 액틴, 인간 미오신, 인간 헤모글로빈, 인간 근육 크레아틴 또는 인간 메탈로티오네인과 같은 인간 유전자 유래의 프로모터일 수 있다. 프로모터는 또한 조직 특이적 프로모터, 예컨대 천연 또는 합성의 인간 알파 1-항트립신(HAAT)과 같은 간 특이적 프로모터일 수 있다. 하나의 구현예에서, 간으로의 전달은, 간세포 표면에 존재하는 저밀도 지질단백질(LDL) 수용체를 통해, 간세포에 대한 ceDNA 벡터를 포함하는 조성물의 내인성 ApoE 특이적 표적화를 사용하여 달성될 수 있다.
본 발명에 따라 사용하기에 적합한 프로모터의 비제한적인 예에는, 예를 들어 CAG 프로모터(서열번호 72), HAAT 프로모터(서열번호 82), 인간 EF1-α 프로모터(서열번호 77) 또는 EF1a 프로모터의 단편(서열번호 78), IE2 프로모터(예를 들어, 서열번호 84) 및 래트 EF1-α 프로모터(서열번호 85), mEF1 프로모터(서열번호 59) 또는 1E1 프로모터 단편(서열번호 125) 중 임의의 것이 포함된다.
(ii) 인핸서
일부 구현예에서, PAH를 발현하는 ceDNA는 하나 이상의 인핸서를 포함한다. 일부 구현예에서, 인핸서 서열은 프로모터 서열의 5'에 위치한다. 일부 구현예에서, 인핸서 서열은 프로모터 서열의 3'에 위치한다. 일부 구현예에 따르면, 인핸서는 2020년 3월 6일자 출원된 국제 출원 번호 PCT/US2020/021328(이는 그 전문이 본원에 참조로서 인용됨)에 제시된 임의의 인핸서 또는 인핸서 서열이다.
(iii) 5' UTR 서열 및 인트론 서열
일부 구현예에서, ceDNA 벡터는 5' UTR 서열 및/또는 5' ITR 서열의 3'에 위치한 인트론 서열을 포함한다. 일부 구현예에서, 5' UTR은 전이유전자, 예를 들어 PAH 단백질을 인코딩하는 서열의 5'에 위치한다. 예시적인 5' UTR 서열은 국제 출원 번호 PCT/US2020/021328(이는 그 전문이 본원에 참조로서 인용됨), 예를 들어 표 9A에 열거되어 있다.
(iv) 3' UTR 서열
일부 구현예에서, ceDNA 벡터는 3' ITR 서열 5'에 위치한 3' UTR 서열을 포함한다. 일부 구현예에서, 3' UTR은 전이유전자, 예를 들어 PAH 단백질을 인코딩하는 서열의 3'에 위치한다. 예시적인 3' UTR 서열은 국제 출원 번호 PCT/US2020/021328(이는 그 전문이 본원에 참조로서 인용됨), 예를 들어 표 9B에 열거되어 있다.
(v) 폴리아데닐화 서열
ceDNA 벡터로부터 발현되는 mRNA를 안정화시키고, 핵 방출 및 번역을 돕기 위해, PAH 단백질의 발현을 위한 ceDNA 벡터에 폴리아데닐화 서열을 인코딩하는 서열을 포함시킬 수 있다. 하나의 구현예에서, ceDNA 벡터는 폴리아데닐화 서열을 포함하지 않는다. 다른 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 10개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 40개, 적어도 45개, 적어도 50개 또는 그 이상의 아데닌 또는 디뉴클레오타이드를 포함한다. 일부 구현예에서, 폴리아데닐화 서열은 약 43개의 뉴클레오타이드, 약 40 내지 50개의 뉴클레오타이드, 약 40개 내지 55개의 뉴클레오타이드, 약 45개 내지 50개의 뉴클레오타이드, 약 35개 내지 50개의 뉴클레오타이드, 또는 상기 개시된 범위 사이의 임의의 범위의 뉴클레오타이드를 포함한다.
발현 카세트는 당업계에 공지된 임의의 폴리아데닐화 서열 또는 이의 변형을 포함할 수 있다. 일부 구현예에서, 폴리아데닐화(polyA) 서열은 국제 출원 번호 PCT/US2020/021328(이는 그 전문이 본원에 참조로서 인용됨), 예를 들어 표 10에 열거된 것 중 임의의 것에서 선택된다. 예를 들어, 비제한적으로, 소 BGHpA(예를 들어, 서열번호 68) 또는 바이러스 SV40pA(예를 들어, 서열번호 86)에서 단리된 자연 발생 서열, 또는 합성 서열(예를 들어, 서열번호 87)을 포함하는, 당업계에 일반적으로 공지된 다른 polyA 서열이 또한 사용될 수 있다. 일부 발현 카세트는 또한 SV40 후기 polyA 신호 업스트림 인핸서(USE) 서열을 포함할 수 있다. 일부 구현예에서, USE 서열은 SV40pA 또는 이종 polyA 신호와 조합으로 사용될 수 있다. PolyA 서열은 PAH 단백질을 인코딩하는 전이유전자의 3'에 위치한다.
발현 카세트는 또한 전이유전자의 발현을 증가시키기 위해 전사 후 요소를 포함할 수 있다. 일부 구현예에서, 우드척 간염바이러스(WHP: Woodchuck Hepatitis Virus) 전사 후 조절 요소(WPRE)(예를 들어, 서열번호 67)가 전이유전자의 발현을 증가시키기 위해 사용된다. 단순헤르페스바이러스의 티미딘 키나아제 유전자, 또는 B형 간염 바이러스(HBV)로부터의 전사 후 요소와 같은 다른 전사 후 처리 요소가 사용될 수 있다. 분비 서열은 전이유전자, 예를 들어 VH-02 및 VK-A26 서열, 예를 들어 서열번호 88 및 서열번호 89에 연결될 수 있다.
(vi) 핵 국소화 서열
일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 하나 이상의 핵 국소화 서열(NLS), 예를 들어 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 또는 그 이상의 NLS를 포함한다. 일부 구현예에서, 하나 이상의 NLS는 아미노 말단에 또는 그 근처에, 카르복시 말단에 또는 그 근처에, 또는 이들의 조합에 위치한다(예를 들어, 아미노 말단에 있는 하나 이상의 NLS 및/또는 카르복시 말단에 있는 하나 이상의 NLS). 하나 초과의 NLS가 존재하는 경우, 각각은 서로 독립적으로, 단일 NLS가 하나 초과의 카피에 존재하고/하거나 하나 이상의 카피에 존재하는 하나 이상의 다른 NLS와 조합으로 존재하도록 선택될 수 있다. NLS의 비제한적인 예는 표 7에 제시되어 있다.
Figure pct00024
B. ceDNA 벡터의 추가 구성요소
본 개시내용의 PAH 단백질의 발현을 위한 ceDNA 벡터는 유전자 발현을 위한 다른 구성요소를 인코딩하는 뉴클레오타이드를 함유할 수 있다. 예를 들어, 특정 유전자 표적화 사건을 선택하기 위해, 보호 shRNA를 마이크로RNA에 포매시키고, 고도로 활성인 유전좌위, 예컨대 알부민 유전좌위에 부위 특이적으로 통합되도록 설계된 재조합 ceDNA 벡터에 삽입할 수 있다. 이러한 구현예는 문헌[Nygaard et al., A universal system to select gene-modified hepatocytes in vivo, Gene Therapy, June 8, 2016]에 기재된 바와 같이 임의의 유전적 배경에서 유전자 변형된 간세포의 생체내 선별 및 확장을 위한 시스템을 제공할 수 있다.본 개시내용의 ceDNA 벡터는 형질전환된 세포, 트랜스펙션된 세포, 형질도입된 세포 등의 선별을 가능하게 하는 하나 이상의 선별 마커를 함유할 수 있다. 선별 마커는 유전자의 산물이 살생물제 또는 바이러스 내성, 중금속에 대한 내성, 영양요구성에 대한 원영양성, NeoR 등을 제공하는 유전자이다. 특정 구현예에서, 양성 선별 마커는 NeoR과 같은 공여체 서열에 혼입된다. 음성 선별 마커는 공여체 서열의 다운스트림에 혼입될 수 있으며, 예를 들어 음성 선별 마커를 인코딩하는 핵산 서열 HSV-tk는 공여체 서열의 다운스트림에 있는 핵산 구조체에 혼입될 수 있다.
C. 조절 스위치
분자 조절 스위치는 신호에 반응하여 측정 가능한 상태 변화를 생성하는 스위치이다. 이러한 조절 스위치는 ceDNA 벡터로부터 PAH 단백질 발현의 출력을 제어하기 위해 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터와 유용하게 조합될 수 있다. 일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 PAH 단백질의 발현을 미세조정하는 역할을 하는 조절 스위치를 포함한다. 예를 들어, 이는 ceDNA 벡터의 생물학적 봉쇄(biocontainment) 기능으로 작용할 수 있다. 일부 구현예에서, 상기 스위치는 제어 가능하고 조절 가능한 방식으로 ceDNA 벡터에서 PAH 단백질의 발현을 개시 또는 중단(즉, 셧다운)하도록 설계된 "ON/OFF" 스위치이다. 일부 구현예에서, 상기 스위치는 스위치가 활성화되면 ceDNA 벡터를 포함하는 세포가 세포의 프로그래밍된 사멸을 거치도록 지시할 수 있는 "사멸 스위치"를 포함할 수 있다. PAH 단백질의 발현을 위한 ceDNA 벡터에 사용하기 위해 포함된 예시적인 조절 스위치는, 전이유전자의 발현을 조절하는 데 사용될 수 있으며, 이는 국제 출원 PCT/US18/49996(이는 그 전문이 본원에 참조로서 인용됨)에 보다 충분히 논의되어 있다.
(i) 이원 조절 스위치
일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 PAH 단백질의 발현을 제어 가능하게 조절하는 역할을 할 수 있는 조절 스위치를 포함한다. 예를 들어, ceDNA 벡터의 ITR 사이에 위치한 발현 카세트는 PAH 단백질을 인코딩하는 핵산 서열에 작동적으로 연결된 조절 영역, 예를 들어 프로모터, 시스-요소, 억제인자, 인핸서 등을 추가로 포함할 수 있으며, 여기서 조절 영역은 하나 이상의 보조인자 또는 외인성 작용제에 의해 조절된다. 단지 예로서, 조절 영역은 소분자 스위치, 또는 유도성 또는 억제성 프로모터에 의해 조절될 수 있다. 유도성 프로모터 비제한적인 예는, 호르몬 유도성 또는 금속 유도성 프로모터이다. 다른 예시적인 유도성 프로모터/인핸서 요소에는, 비제한적으로, RU486-유도성 프로모터, 엑디손-유도성 프로모터, 라파마이신-유도성 프로모터 및 메탈로티오네인 프로모터가 포함된다.
(ii) 소분자 조절 스위치
다양한 업계 공지 소분자 기반 조절 스위치가 당업계에 공지되어 있으며, 이는 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터와 조합되어 조절 스위치 제어된 ceDNA 벡터를 형성할 수 있다. 일부 구현예에서, 조절 스위치는, 문헌[Taylor, et al. BMC Biotechnology 10 (2010): 15]에 개시된 바와 같은 작동적으로 연결된 전이유전자의 발현을 제어하는 인공 프로모터와 함께인, 직교 리간드/핵 수용체 쌍, 예를 들어 레티노이드 수용체 변이체/LG335 및 GRQCIMFI; 조작된 스테로이드 수용체, 예를 들어 프로게스테론에 결합할 수 없지만 RU486(미페프리스톤(mifepristone))에 결합하는 C-말단 절단을 갖는 변형된 프로게스테론 수용체(미국 특허 제5,364,791호); 초파리의 엑디손 수용체 및 이의 엑디스테로이드 리간드(문헌[Saez, et al., PNAS, 97(26)(2000), 14512-14517]); 또는 문헌[Sando R 3rd; Nat Methods. 2013, 10(11):1085-8]에 개시된 바와 같은 항생제 트리메토프림(TMP: trimethoprim)에 의해 제어되는 스위치 중 어느 하나 또는 이들의 조합에서 선택될 수 있다. 일부 구현예에서, 전이유전자를 제어하거나 ceDNA 벡터에 의해 발현되는 조절 스위치는, 미국 특허 제8,771,679호 및 제6,339,070호(이들은 그 전문이 본원에 참조로서 인용됨)에 개시된 것들과 같은 전구약물 활성화 스위치이다.
(iii) "패스코드" 조절 스위치
일부 구현예에서, 조절 스위치는 "패스코드 스위치" 또는 "패스코드 회로"일 수 있다. 패스코드 스위치는, 특정 조건이 발생하는 경우에 ceDNA 벡터로부터의 전이유전자 발현 제어를 미세 조정하는 것을 가능하게 하며, 즉, 전이유전자 발현 및/또는 억제가 일어나기 위해서는 조건의 조합이 존재해야 한다. 예를 들어, 전이유전자의 발현이 일어나기 위해서는, 적어도 조건 A 및 B가 발생해야 한다. 패스코드 조절 스위치는, 전이유전자의 발현이 일어나기 위해 존재하는 임의의 수의 조건, 예를 들어 적어도 2개, 또는 적어도 3개, 또는 적어도 4개, 또는 적어도 5개, 또는 적어도 6개, 또는 적어도 7개, 또는 그 이상의 조건일 수 있다. 일부 구현예에서는, 적어도 2개의 조건(예를 들어, 조건 A, B)이 발생해야 하고, 일부 구현예에서는, 적어도 3개의 조건(예를 들어, A, B 및 C, 또는 A, B 및 D)이 발생해야 한다. 단지 예로서, 패스코드 "ABC" 조절 스위치를 갖는 ceDNA에서 유전자 발현이 일어나기 위해서는, 조건 A, B 및 C가 존재해야 한다. 조건 A, B 및 C는 다음과 같을 수 있다: 조건 A는 병태 또는 질환의 존재이고, 조건 B는 호르몬 반응이고, 조건 C는 전이유전자 발현에 대한 반응이다. 예를 들어, 전이유전자가 결함이 있는 EPO 유전자를 편집하는 경우, 조건 A는 만성신장질환(CKD)의 존재이고, 조건 B는 대상의 신장이 저산소 상태인 경우에 발생하고, 조건 C는 신장에서 에리트로포이에틴 생산 세포(EPC) 동원이 손상되거나; 또는 대안적으로, HIF-2 활성화가 손상되는 경우이다. 산소 수준이 증가하거나 목적하는 EPO 수준에 도달하는 경우, 전이유전자는 다시 3가지 조건이 발생할 때까지 꺼지고, 다시 켜지게 된다.
일부 구현예에서, ceDNA 벡터에의 사용을 위해 포함된 패스코드 조절 스위치 또는 "패스코드 회로"는, 생물학적 봉쇄 조건을 정의하는 데 사용되는 환경 신호의 범위 및 복잡성을 확장시키기 위해 하이브리드 전사인자(TF)를 포함한다. 선결된 조건의 존재 하에서 세포 사멸을 촉발시키는 데드맨 스위치와 반대로, "패스코드 회로"는 특정 "패스코드"의 존재 하에서 세포 생존 또는 전이유전자 발현을 가능하게 하며, 선결된 환경 조건 또는 패스코드가 존재하는 경우에만 전이유전자 발현 및/또는 세포 생존을 가능하게 하도록 용이하게 재프로그래밍될 수 있다.
본원에 개시된 조절 스위치의 임의의 및 모든 조합, 예를 들어 소분자 스위치, 핵산 기반 스위치, 소분자-핵산 하이브리드 스위치, 전사 후 전이유전자 조절 스위치, 번역 후 조절, 방사선 제어 스위치, 저산소증 매개 스위치, 및 본원에 개시된 바와 같은 당업자에게 공지된 다른 조절 스위치가, 본원에 개시된 바와 같은 패스코드 조절 스위치에 사용될 수 있다. 사용을 위해 포함된 조절 스위치는 또한 리뷰 논문인 문헌[Kis et al., J R Soc Interface. 12: 20141000 (2015)]에 논의되어 있고, Kis의 표 1에 요약되어 있다. 일부 구현예에서, 패스코드 시스템에 사용되는 조절 스위치는 국제 특허 출원 PCT/US18/49996(이는 그 전문이 본원에 참조로서 인용됨)의 표 11에 개시된 스위치 중 임의의 것 또는 스위치의 조합에서 선택될 수 있다.
(iv) 전이유전자 발현을 제어하는 핵산 기반 조절 스위치
일부 구현예에서, ceDNA에 의한 PAH 단백질의 발현을 제어하는 조절 스위치는 핵산 기반 제어 메커니즘을 기반으로 한다. 예시적인 핵산 제어 메커니즘은 당업계에 공지되어 있으며, 사용을 위해 고려된다. 예를 들어, 이러한 메커니즘은, 예를 들어 US2009/0305253, US2008/0269258, US2017/0204477, WO2018026762A1, 미국 특허 제9,222,093호 및 EP 출원 EP288071에 개시된 것들, 및 문헌[Villa JK et al., Microbiol Spectr. 2018 May;6(3)]에 개시된 것과 같은 리보스위치를 포함한다. WO2018/075486 및 WO2017/147585에 개시된 것들과 같은 대사산물 반응성 전사 바이오센서가 또한 포함된다. 사용을 위해 고려되는 다른 업계 공지 메커니즘에는, siRNA 또는 RNAi 분자(예를 들어, miR, shRNA)를 이용한 전이유전자의 침묵이 포함된다. 예를 들어, ceDNA 벡터는 ceDNA 벡터에 의해 발현되는 전이유전자의 일부에 상보적인 RNAi 분자를 인코딩하는 조절 스위치를 포함할 수 있다. 전이유전자(예를 들어, PAH 단백질)가 ceDNA 벡터에 의해 발현되는 경우라도 이러한 RNAi가 발현되면, 상보적 RNAi 분자에 의해 침묵하게 되고, 전이유전자가 ceDNA 벡터에 의해 발현될 때 RNAi가 발현되지 않으면, 전이유전자(예를 들어, PAH 단백질)는 RNAi에 의해 침묵하게 되지 않는다.
일부 구현예에서, 조절 스위치는, 예를 들어 US2002/0022018에 개시된 바와 같은 조직 특이적 자가 불활성화 조절 스위치이며, 이에 의해 조절 스위치는 전이유전자 발현이 달리 불리할 수 있는 부위에서 전이유전자(예를 들어, PAH 단백질)를 의도적으로 차단한다. 일부 구현예에서, 조절 스위치는, 예를 들어 US2014/0127162 및 미국 특허 제8,324,436호에 개시된 바와 같은 재조합효소 가역적 유전자 발현 시스템이다.
(v) 전사 후 및 번역 후 조절 스위치.
일부 구현예에서, ceDNA 벡터에 의한 PAH 단백질의 발현을 제어하는 조절 스위치는 전사 후 변형 시스템이다. 예를 들어, 이러한 조절 스위치는 US2018/0119156, GB201107768, WO2001/064956A3, EP 특허 제2707487호 및 문헌[Beilstein et al., ACS Synth. Biol., 2015, 4 (5), pp 526-534]; 문헌[Zhong et al., Elife. 2016 Nov 2;5. pii: e18858]에 개시된 바와 같은, 테트라시클린 또는 테로필린에 민감한 압타자임(aptazyme) 리보스위치일 수 있다. 일부 구현예에서, 당업자는 리간드 민감성(OFF-스위치) 압타머를 함유하는 저해성 siRNA와 전이유전자를 모두 인코딩할 수 있으며, 최종 결과는 리간드 민감성 ON-스위치가 되는 것으로 예상된다.
(vi) 다른 예시적인 조절 스위치
환경 변화에 의해 촉발되는 것들을 포함하는 임의의 공지된 조절 스위치가, ceDNA 벡터에 의한 PAH 단백질의 발현을 제어하기 위해 ceDNA 벡터에 사용될 수 있다. 추가의 예에는, 비제한적으로, 문헌[Suzuki et al., Scientific Reports 8; 10051 (2018)]의 BOC 방법; 유전 코드 확장 및 비(非)생리학적 아미노산; 방사선 제어 또는 초음파 제어 온/오프 스위치(예를 들어, 문헌[Scott S et al., Gene Ther. 2000 Jul;7(13):1121-5]; 미국 특허 제5,612,318호; 제5,571,797호; 제5,770,581호; 제5,817,636호; 및 WO1999/025385A1 참조)가 포함된다. 일부 구현예에서, 조절 스위치는, 예를 들어 미국 특허 제7,840,263호; US2007/0190028A1에 개시된 바와 같은 이식 가능한 시스템에 의해 제어되며, 여기서 유전자 발현은 ceDNA 벡터 내 전이유전자에 작동적으로 연결된 프로모터를 활성화시키는 전자기 에너지를 포함하는 하나 이상의 에너지 형태에 의해 제어된다.
일부 구현예에서, ceDNA 벡터에의 사용을 위해 고려되는 조절 스위치는, 저산소증 매개 또는 스트레스 활성화 스위치, 예를 들어 WO1999060142A2, 미국 특허 제5,834,306호; 제6,218,179호; 제6,709,858호; US2015/0322410; 문헌[Greco et al., (2004) Targeted Cancer Therapies 9, S368](이들은 그 전문이 본원에 참조로서 인용됨)에 개시된 바와 같은 것들뿐 아니라, 예를 들어 미국 특허 제9,394,526호(이는 그 전문이 본원에 참조로서 인용됨)에 개시된 바와 같은, FROG, TOAD 및 NRSE 요소, 및 조건부 유도성 침묵 요소(저산소증 반응 요소(HRE), 염증 반응 요소(IRE) 및 전단 응력 활성화 요소(SSAE) 포함)이다. 이러한 구현예는, 허혈 후, 허혈 조직 및/또는 종양에서 ceDNA 벡터로부터의 전이유전자의 발현을 조정하는 데 유용하다.
(vii) 사멸 스위치
본원에 기재된 다른 구현예는 사멸 스위치를 포함하는 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터에 관한 것이다. 본원에 개시된 바와 같은 사멸 스위치는, 대상의 시스템으로부터 도입된 ceDNA 벡터를 영구적으로 제거하는 수단으로서, ceDNA 벡터를 포함하는 세포를 사멸시키거나 프로그래밍된 세포 사멸에 거치게 할 수 있다. 당업자는, PAH 단백질의 발현을 위한 ceDNA 벡터에서의 사멸 스위치의 사용이, 전형적으로 대상이 수용 가능하게 손실할 수 있는 제한된 수의 세포, 또는 세포자멸사가 바람직한 세포 유형(예를 들어, 암 세포)에 대한 ceDNA 벡터의 표적화와 결합될 수 있다는 것을 이해할 것이다. 모든 양태에서, 본원에 개시된 바와 같은 "사멸 스위치"는, 입력 생존 신호 또는 다른 명시된 조건의 부재 하에서 ceDNA 벡터를 포함하는 세포의 신속하고 강력한 세포 사멸을 제공하도록 설계된다. 달리 말하면, 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터에 의해 인코딩된 사멸 스위치는 ceDNA 벡터를 포함하는 세포의 세포 생존을 특정한 입력 신호에 의해 정의된 환경으로 제한할 수 있다. 이러한 사멸 스위치는, 대상에서 PAH 단백질의 발현을 위한 ceDNA 벡터를 제거하거나, 인코딩된 PAH 단백질을 발현하지 않도록 보장하는 것이 바람직한 경우에 생물학적 생물봉쇄(biocontainment) 기능으로 작용한다.
당업자에게 공지된 다른 사멸 스위치, 예를 들어 US2010/0175141; US2013/0009799; US2011/0172826; US2013/0109568에 개시된 것뿐 아니라, 문헌[Jusiak et al, Reviews in Cell Biology and molecular Medicine; 2014; 1-56]; 문헌[Kobayashi et al., PNAS, 2004; 101; 8419-9]; 문헌[Marchisio et al., Int. Journal of Biochem and Cell Biol., 2011; 43; 310-319]; 및 문헌[Reinshagen et al., Science Translational Medicine, 2018, 11]에 개시된 사멸 스위치가, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터에의 사용을 위해 포함되며, 상기 모든 문헌은 그 전문이 본원에 참조로서 인용된다.
따라서, 일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 이펙터 독소 또는 리포터 단백질을 인코딩하는 핵산을 포함하는 사멸 스위치 핵산 구조체를 포함할 수 있으며, 여기서 이펙터 독소(예를 들어, 사멸 단백질) 또는 리포터 단백질의 발현은 선결된 조건에 의해 제어된다. 예를 들어, 선결된 조건은 환경 작용제, 예를 들어 외인성 작용제의 존재일 수 있으며, 그렇지 않으면 세포는 이펙터 독소(예를 들어, 사멸 단백질)의 발현이 기본 설정이 되어 사멸되게 된다. 대안적인 구현예에서, 선결된 조건은 2개 이상의 환경 작용제의 존재이며, 예를 들어 세포는 2개 이상의 필요한 외인성 작용제가 공급되는 경우에만 생존할 것이고, 둘 중 어느 하나가 없는 경우에, ceDNA를 포함하는 세포는 사멸된다.
일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 ceDNA 벡터에 의해 발현되는 전이유전자의 생체내 발현(예를 들어, PAH 단백질의 발현)을 효과적으로 종결시키는 ceDNA 벡터를 포함하는 세포를 파괴하기 위해 사멸 스위치를 혼입하도록 변형된다. 구체적으로, ceDNA 벡터는 정상적인 생리학적 조건 하의 포유류 세포에서 기능성이 아닌 스위치-단백질을 발현하도록 추가로 유전자 조작된다. 이러한 스위치-단백질을 특이적으로 표적화하는 환경 조건 또는 약물의 투여 시에만, 스위치-단백질을 발현하는 세포가 파괴되어 치료용 단백질 또는 펩타이드의 발현이 종결될 것이다. 예를 들어, HSV-티미딘 키나아제를 발현하는 세포는 간시클로버(ganciclovir) 및 시토신 데아미나아제와 같은 약물의 투여 시 사멸될 수 있다고 보고되었다. 예를 들어 문헌[Dey and Evans, Suicide Gene Therapy by Herpes Simplex Virus-1 Thymidine Kinase (HSV-TK), in Targets in Gene Therapy, edited by You (2011)]; 및 문헌[Beltinger et al., Proc. Natl. Acad. Sci. USA 96(15):8699-8704 (1999)] 참조. 일부 구현예에서 ceDNA 벡터는 DISE(생존 유전자 제거로 인해 유도된 사멸(Death Induced by Survival gene Elimination))로 지칭되는 siRNA 사멸 스위치를 포함할 수 있다(문헌[Murmann et al., Oncotarget. 2017; 8:84643-84658, Induction of DISE in ovarian cancer cells in vivo]).
VI. ceDNA 벡터의 상세한 생산 방법
A. 생산 전반
본원에 정의된 바와 같은 비대칭인 ITR 쌍 또는 대칭인 ITR 쌍을 포함하는 PAH 단백질의 발현을 위한 ceDNA 벡터의 생산을 위한 특정 방법은, 2018년 9월 7일자 출원된 국제 출원 PCT/US18/49996(이는 그 전문이 본원에 참조로서 인용됨)의 섹션 IV에 기재되어 있다. 일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 본원에 기재된 바와 같이 곤충 세포를 사용하여 생산될 수 있다. 대안적인 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 합성적으로, 일부 구현예에서 2019년 1월 18일자 출원된 국제 출원 PCT/US19/14122(이는 그 전문이 본원에 참조로서 인용됨)에 개시된 바와 같은 무세포 방법으로 생산될 수 있다.
본원에 기재된 바와 같이, 하나의 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는, 예를 들어 하기 단계를 포함하는 공정에 따라 수득될 수 있다: a) 바이러스 캡시드 코딩 서열이 없는 폴리뉴클레오타이드 발현 구조체 주형(예를 들어, ceDNA-플라스미드, ceDNA-박미드 및/또는 ceDNA-바큐로바이러스)을 보유하는 숙주세포(예를 들어, 곤충 세포) 집단을, Rep 단백질의 존재 하에서, 숙주세포 내에서 ceDNA 벡터의 생산을 유도하는 데 효과적인 조건 하에서 충분한 시간 동안 인큐베이션하는 단계로서, 여기서 숙주세포는 바이러스 캡시드 코딩 서열을 포함하지 않는 단계; 및 b) 숙주세포에서 ceDNA 벡터를 수거하고 단리하는 단계. Rep 단백질의 존재는 변형된 ITR을 갖는 벡터 폴리뉴클레오타이드의 복제를 유도하여, 숙주세포에서 ceDNA 벡터를 생산한다. 하지만, 바이러스 입자(예를 들어, AAV 비리온)는 발현되지 않는다. 따라서, AAV 또는 다른 바이러스 기반 벡터에 자연적으로 부과되는 것과 같은 크기 제한이 없다.
숙주세포에서 단리된 ceDNA 벡터의 존재는, 숙주세포에서 단리된 DNA를 ceDNA 벡터 상에 단일 인식 부위를 갖는 제한 효소로 소화시키고, 소화된 DNA 물질을 미변성 겔 상에서 분석하여, 선형 및 비연속 DNA와 비교하여 선형 및 연속 DNA의 특징적인 밴드의 존재를 확인하는 방식으로 확인될 수 있다.
또 다른 양태에서, 본 발명은, 예를 들어 문헌[Lee, L. et al. (2013) Plos One 8(8): e69879]에 기재된 바와 같이, 비바이러스성 DNA 벡터의 생산에서 DNA 벡터 폴리뉴클레오타이드 발현 주형(ceDNA 주형)을 이의 자체 게놈에 안정적으로 통합시킨 숙주 세포주의 용도를 제공한다. 바람직하게는, Rep는 약 3의 MOI에서 숙주 세포에 첨가된다. 숙주 세포주가 포유류 세포주, 예를 들어 HEK293 세포인 경우, 상기 세포주는 안정적으로 통합된 폴리뉴클레오타이드 벡터 주형을 가질 수 있고, 헤르페스바이러스와 같은 제2 벡터를 사용하여 Rep 단백질을 세포에 도입하여, Rep 및 헬퍼 바이러스의 존재 하에서 ceDNA의 절제 및 증폭을 가능하게 할 수 있다.
하나의 구현예에서, 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 제조하는 데 사용되는 숙주세포는 곤충 세포이고, 바큐로바이러스는 Rep 단백질을 인코딩하는 폴리뉴클레오타이드, 및 예를 들어 도 4a 내지 도 4c 및 실시예 1에 기재된 바와 같은 ceDNA에 대한 비바이러스성 DNA 벡터 폴리뉴클레오타이드 발현 구조체 주형을 전달하는 데 사용된다. 일부 구현예에서, 숙주세포는 Rep 단백질을 발현하도록 조작된다.
이어서, 숙주세포에서 ceDNA 벡터를 수거하고 단리한다. 상기 세포에서 본원에 기재된 ceDNA 벡터를 수거하고 수집하는 시간은, ceDNA 벡터의 고수율 생산을 달성하기 위해 선택 및 최적화될 수 있다. 예를 들어, 수거 시간은 세포 생존율, 세포 형태, 세포 성장 등의 관점에서 선택될 수 있다. 하나의 구현예에서, 세포를 충분한 조건 하에서 성장시키고, ceDNA 벡터를 생산하기 위한 바큐로바이러스 감염 후, 하지만 바큐로바이러스 독성으로 인해 세포의 대부분이 사멸되기 시작하기 전에 충분한 시간 동안 수거한다. DNA 벡터는 Qiagen Endo-Free Plasmid 키트와 같은 플라스미드 정제 키트를 사용하여 단리될 수 있다. 플라스미드 단리를 위해 개발된 다른 방법이 또한 DNA 벡터에 적용될 수 있다. 일반적으로, 임의의 핵산 정제 방법이 채택될 수 있다.
DNA 벡터는 DNA의 정제에 대해 당업자에게 공지된 임의의 수단을 통해 정제될 수 있다. 하나의 구현예에서, ceDNA 벡터는 DNA 분자로 정제된다. 또 다른 구현예에서, ceDNA 벡터는 엑소좀 또는 미세입자로 정제된다.
PAH 단백질의 발현을 위한 ceDNA 벡터의 존재는, 세포에서 단리된 벡터 DNA를 DNA 벡터 상에 단일 인식 부위를 갖는 제한 효소로 소화시키고, 소화 및 미소화된 DNA 물질을 겔 전기영동을 사용하여 분석하여, 선형 및 비연속 DNA와 비교하여 선형 및 연속 DNA의 특징적인 밴드의 존재를 확인하는 방식으로 확인될 수 있다. 도 4c도 4d는, 본원의 공정에 의해 생산된 폐쇄형 ceDNA 벡터의 존재를 확인하는 하나의 구현예를 예시한다.
B. ceDNA 플라스미드
ceDNA-플라스미드는 PAH 단백질의 발현을 위한 ceDNA 벡터의 추후 생산에 사용되는 플라스미드이다. 일부 구현예에서, ceDNA-플라스미드는 적어도 다음과 같은 요소를 전사 방향으로 작동적으로 연결된 구성요소로서 제공하기 위해 공지된 기술을 사용하여 구축될 수 있다: (1) 변형된 5' ITR 서열; (2) 시스-조절 요소, 예를 들어 프로모터, 유도성 프로모터, 조절 스위치, 인핸서 등을 함유하는 발현 카세트; 및 (3) 변형된 3' ITR 서열(여기서, 3' ITR 서열은 5' ITR 서열에 대칭임). 일부 구현예에서, ITR이 플랭킹된 발현 카세트는 외인성 서열을 도입하기 위한 클로닝 부위를 포함한다. 발현 카세트는 AAV 게놈의 rep 및 cap 코딩 영역을 대체한다.
하나의 양태에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 제1 아데노연관바이러스(AAV) 역말단반복서열(ITR), 전이유전자를 포함하는 발현 카세트, 및 돌연변이되거나 변형된 AAV ITR을 이러한 순서로 인코딩하는 "ceDNA-플라스미드"로 본원에 지칭되는 플라스미드로부터 수득되며, 여기서 상기 ceDNA-플라스미드에는 AAV 캡시드 단백질 코딩 서열이 없다. 대안적인 구현예에서, ceDNA-플라스미드는 제1(또는 5') 변형되거나 돌연변이된 AAV ITR, 전이유전자를 포함하는 발현 카세트, 및 제2(또는 3') 변형된 AAV ITR을 이러한 순서로 인코딩하며, 여기서 상기 ceDNA-플라스미드에는 AAV 캡시드 단백질 코딩 서열이 없고, 5' 및 3' ITR은 서로 대칭이다. 대안적인 구현예에서, ceDNA-플라스미드는 제1(또는 5') 변형되거나 돌연변이된 AAV ITR, 전이유전자를 포함하는 발현 카세트, 및 제2(또는 3') 돌연변이되거나 변형된 AAV ITR을 이러한 순서로 인코딩하며, 여기서 상기 ceDNA-플라스미드에는 AAV 캡시드 단백질 코딩 서열이 없고, 5' 및 3' 변형된 ITR은 동일한 변형을 갖는다(즉, 이들은 서로에 대해 역 보체 또는 대칭임).
추가의 구현예에서, ceDNA-플라스미드 시스템에는 바이러스 캡시드 단백질 코딩 서열이 없다(즉, AAV 캡시드 유전자뿐 아니라 다른 바이러스의 캡시드 유전자가 없음). 또한, 특정 구현예에서, ceDNA-플라스미드에는 또한 AAV Rep 단백질 코딩 서열이 없다. 따라서, 바람직한 구현예에서, ceDNA-플라스미드에는 AAV2에 대한 기능성 AAV cap 및 AAV rep 유전자 GG-3', 및 헤어핀 형성을 가능하게 하는 가변 회문구조 서열이 없다.
본 발명의 ceDNA-플라스미드는 당업계에 널리 공지된 임의의 AAV 혈청형의 게놈의 천연 뉴클레오타이드 서열을 사용하여 생성될 수 있다. 하나의 구현예에서, ceDNA-플라스미드 백본은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV 5, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAVrh8, AAVrh10, AAV-DJ 및 AAV-DJ8 게놈에서 유도된다. 예를 들어, NCBI: NC 002077; NC 001401; NC001729; NC001829; NC006152; NC 006260; NC 006261; Kotin and Smith, The Springer Index of Viruses(Springer가 유지 관리하는 URL에서 이용 가능함)(www 웹 주소: oesys.springer.de/viruses/database/mkchapter.asp?virID=42.04.)(참고: URL 또는 데이터베이스에 대한 참조는 현재 본 출원의 유효 출원일자의 URL 또는 데이터베이스의 내용을 나타냄). 특정 구현예에서, ceDNA-플라스미드 백본은 AAV2 게놈에서 유도된다. 또 다른 특정 구현예에서, ceDNA-플라스미드 백본은 이러한 AAV 게놈 중 하나에서 유도된 5' 및 3' ITR을 포함하도록 유전자 조작된 합성 백본이다.
ceDNA-플라스미드는 선택적으로 ceDNA 벡터 생산 세포주의 확립에 사용하기 위한 선별 가능한 또는 선별 마커를 포함할 수 있다. 하나의 구현예에서, 선별 마커는 3' ITR 서열의 다운스트림(즉, 3')에 삽입될 수 있다. 또 다른 구현예에서, 선별 마커는 5' ITR 서열의 업스트림(즉, 5')에 삽입될 수 있다. 적절한 선별 마커에는, 예를 들어 약물 내성을 부여하는 것들이 포함된다. 선별 마커, 예를 들어 블라스티시딘(blasticidin) S 내성 유전자, 카나마이신(kanamycin), 제네티신(geneticin) 등일 수 있다. 바람직한 구현예에서, 약물 선별 마커는 블라스티시딘 S 내성 유전자이다.
PAH 단백질의 발현을 위한 예시적인 ceDNA(예를 들어, rAAV0) 벡터는 rAAV 플라스미드에서 생산된다. rAAV 벡터의 생산 방법은 (a) 상기 기재된 바와 같은 rAAV 플라스미드를 갖는 숙주세포를 제공하는 단계로서, 여기서 숙주세포와 플라스미드에는 모두 캡시드 단백질 인코딩 유전자가 없는 단계, (b) ceDNA 게놈의 생성을 가능하게 하는 조건 하에서 숙주세포를 배양하는 단계, 및 (c) 세포를 수거하고 상기 세포로부터 생산된 AAV 게놈을 단리하는 단계를 포함할 수 있다.
C. ceDNA 플라스미드로부터 ceDNA 벡터를 제조하는 예시적인 방법
PAH 단백질의 발현을 위한 캡시드 미함유 ceDNA 벡터를 제조하는 방법, 특히 생체내 실험에 충분한 벡터를 충분히 고수율로 제공하는 방법이 또한 본원에 제공된다.
일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터의 생산 방법은 (1) 발현 카세트와 2개의 대칭인 ITR 서열을 포함하는 핵산 구조체를 숙주세포(예를 들어, Sf9 세포)에 도입하는 단계, (2) 선택적으로, 예를 들어 플라스미드 상에 존재하는 선별 마커를 사용하여 클론 세포주를 확립하는 단계, (3) Rep 코딩 유전자를 (상기 유전자를 운반하는 바큐로바이러스로 트랜스펙션 또는 감염시켜) 상기 곤충 세포에 도입하는 단계, 및 (4) 세포를 수거하고 ceDNA 벡터를 정제하는 단계를 포함한다. ceDNA 벡터의 생산을 위한, 상기 기재된 발현 카세트와 2개의 ITR 서열을 포함하는 핵산 구조체는, ceDNA 플라스미드, 또는 하기 기재되는 바와 같이 ceDNA 플라스미드를 이용하여 생성된 박미드 또는 바큐로바이러스의 형태일 수 있다. 핵산 구조체는 트랜스펙션, 바이러스 형질도입, 안정적인 통합 또는 당업계에 공지된 다른 방법에 의해 숙주세포에 도입될 수 있다.
D. 세포주
PAH 단백질의 발현을 위한 ceDNA 벡터의 생산에 사용되는 숙주 세포주는 스포도프테라 프루기페르다(Spodoptera frugiperda)(예컨대, Sf9, Sf21) 또는 트리코플루시아 니 세포에서 유도된 곤충 세포주, 또는 다른 무척추동물, 척추동물 또는 다른 진핵생물 세포주(포유류 세포 포함)를 포함할 수 있다. HEK293, Huh-7, HeLa, HepG2, HeplA, 911, CHO, COS, MeWo, NIH3T3, A549, HT1 180, 단핵구 및 성숙 및 미성숙 수지상세포와 같은 당업자에게 공지된 다른 세포주가 또한 사용될 수 있다. 숙주 세포주는 고수율 ceDNA 벡터 생산을 위한 ceDNA-플라스미드의 안정적인 발현을 위해 트랜스펙션될 수 있다.
ceDNA-플라스미드는 당업계에 공지된 시약(예를 들어, 리포좀, 인산칼슘) 또는 물리적 수단(예를 들어, 전기천공)을 사용하여 일시적 트랜스펙션에 의해 Sf9 세포에 도입될 수 있다. 대안적으로, ceDNA-플라스미드를 게놈에 안정적으로 통합시킨 안정한 Sf9 세포주가 확립될 수 있다. 이러한 안정적인 세포주는 선별 마커를 상기 기재된 바와 같은 ceDNA 플라스미드에 혼입시키는 방식으로 확립될 수 있다. 세포주를 트랜스펙션시키는 데 사용되는 ceDNA 플라스미드가 항생제와 같은 선별 마커를 포함하는 경우, ceDNA-플라스미드로 트랜스펙션시키고 ceDNA-플라스미드 DNA를 게놈에 통합시킨 세포는 세포 성장 배지에 항생제를 첨가하여 선별할 수 있다. 이어서, 세포의 내성 클론을 단일 세포 희석 또는 집락 전달 기술로 단리하고, 증식시킬 수 있다.
E. ceDNA 벡터의 단리 및 정제:
ceDNA 벡터를 수득하고 단리하는 공정의 예는, 도 4a 내지 도 4e, 및 하기 특정예에 기재되어 있다. 본원에 개시된 PAH 단백질의 발현을 위한 ceDNA 벡터는 ceDNA-플라스미드, ceDNA-박미드 또는 ceDNA-바큐로바이러스로 추가로 형질전환된, AAV Rep 단백질(들)을 발현하는 생산 세포로부터 수득될 수 있다. ceDNA 벡터의 생산에 유용한 플라스미드에는, PAH 단백질을 인코딩하는 플라스미드, 또는 하나 이상의 REP 단백질을 인코딩하는 플라스미드가 포함된다.
하나의 양태에서, 폴리뉴클레오타이드는 플라스미드(Rep-플라스미드), 박미드(Rep-박미드) 또는 바큐로바이러스(Rep-바큐로바이러스)에서 생산 세포에 전달된 AAV Rep 단백질(Rep78 또는 Rep68)을 인코딩한다. Rep-플라스미드, Rep-박미드 및 Rep-바큐로바이러스는 상기 기재된 방법에 의해 생성될 수 있다.
PAH 단백질의 발현을 위한 ceDNA 벡터의 생산 방법은 본원에 기재되어 있다. 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 생성하는 데 사용되는 발현 구조체는 플라스미드(예를 들어, ceDNA-플라스미드), 박미드(예를 들어, ceDNA-박미드) 및/또는 바큐로바이러스(예를 들어, ceDNA-바큐로바이러스)일 수 있다. 단지 예시로서, ceDNA-벡터는 ceDNA-바큐로바이러스 및 Rep-바큐로바이러스로 동시 감염된 세포에서 생성될 수 있다. Rep-바큐로바이러스에서 생성된 Rep 단백질은 ceDNA-바큐로바이러스를 복제하여 ceDNA-벡터를 생성할 수 있다. 대안적으로, PAH 단백질의 발현을 위한 ceDNA 벡터는 Rep-플라스미드, Rep-박미드 또는 Rep-바큐로바이러스에 전달된 AAV Rep 단백질(Rep78/52)을 인코딩하는 서열을 포함하는 구조체로 안정적으로 트랜스펙션된 세포에서 생성될 수 있다. ceDNA-바큐로바이러스를 세포에 일시적으로 트랜스펙션시키고, Rep 단백질을 통해 복제하여, ceDNA 벡터를 생산할 수 있다.
박미드(예를 들어, ceDNA-박미드)를 Sf9, Sf21, Tni(트리코플루시아 니) 세포, High Five 세포와 같은 허용 곤충 세포에 트랜스펙션시켜, 대칭인 ITR과 발현 카세트를 포함하는 서열을 포함하는 재조합 바큐로바이러스인 ceDNA-바큐로바이러스를 생성할 수 있다. ceDNA-바큐로바이러스를 다시 곤충 세포에 감염시켜, 차세대 재조합 바큐로바이러스를 수득할 수 있다. 선택적으로, 상기 단계를 1회 또는 다회 반복하여 재조합 바큐로바이러스를 보다 많은 양으로 생산할 수 있다.
상기 세포에서 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 수거하고 수집하는 시간은, ceDNA 벡터의 고수율 생산을 달성하기 위해 선택 및 최적화될 수 있다. 예를 들어, 수거 시간은 세포 생존율, 세포 형태, 세포 성장 등의 관점에서 선택될 수 있다. 통상적으로, 세포는 ceDNA 벡터(예를 들어, ceDNA 벡터)를 생산하기 위한 바큐로바이러스 감염 후 충분한 시간 후에, 하지만 바이러스 독성으로 인해 세포의 대부분이 사멸되기 시작하기 전에 수거될 수 있다. ceDNA-벡터는 Qiagen ENDO-FREE PLASMID® 키트와 같은 플라스미드 정제 키트를 사용하여 Sf9 세포에서 단리될 수 있다. 플라스미드 단리를 위해 개발된 다른 방법이 또한 ceDNA 벡터에 적용될 수 있다. 일반적으로, 임의의 업계 공지 핵산 정제 방법뿐 아니라, 상업적으로 입수 가능한 DNA 추출 키트가 채택될 수 있다.
대안적으로, 정제는 세포 펠릿을 알칼리성 용해 과정에 적용하고, 생성된 용해물을 원심분리하고, 크로마토그래피 분리를 수행하는 방식으로 구현될 수 있다. 하나의 비제한적인 예로서, 상기 공정은 핵산을 보유하는 이온 교환 컬럼(예를 들어, SARTOBIND Q®) 상에 상청액을 로딩한 후, 용리(예를 들어, 1.2 M NaCl 용액을 이용하여)하고, 겔 여과 컬럼(예를 들어, 6 fast flow GE) 상에서 추가로 크로마토그래피 정제를 수행하는 방식으로 수행될 수 있다. 이어서, 캡시드 미함유 AAV 벡터를, 예를 들어 침전으로 회수한다.
일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 또한 엑소좀 또는 미세입자 형태로 정제될 수 있다. 다수의 세포 유형이 가용성 단백질뿐 아니라, 복합 단백질/핵산 카고를 막 미세소포 배출을 통해 방출하는 것으로 공지되어 있다(Cocucci 등 (2009); EP 10306226.1(이는 그 전문이 본원에 참조로서 인용됨)). 이러한 소포에는 미세소포(미세입자로도 지칭됨) 및 엑소좀(나노소포로도 지칭됨)이 포함되며, 이 둘 모두 카고로서 단백질과 RNA를 포함한다. 미세소포는 원형질막의 직접 버딩(budding)으로부터 생성되고, 엑소좀은 다소포성 엔도좀과 원형질막의 융합 시 세포외 환경으로 방출된다. 따라서, ceDNA 벡터 함유 미세소포 및/또는 엑소좀은 ceDNA-플라스미드, 또는 ceDNA-플라스미드를 이용하여 생성된 박미드 또는 바큐로바이러스로 형질도입된 세포에서 단리될 수 있다.
배양 배지를 여과 또는 20,000 x g에서의 초원심분리에 적용하여 미세소포를 단리하고, 100,000 x g에서의 초원심분리하여 엑소좀을 단리할 수 있다. 초원심분리의 최적 기간은 실험적으로 결정될 수 있고, 소포가 단리되는 특정 세포 유형에 따라 달라질 수 있다. 바람직하게는, 배양 배지를 먼저 저속 원심분리(예를 들어, 2000 x g에서 5분 내지 20분 동안)로 정제하고, 예를 들어 AMICON® 스핀 컬럼(Millipore, Watford, UK)을 사용하여 스핀 농축에 적용한다. 미세소포와 엑소좀은 미세소포와 엑소좀 상에 존재하는 특정 표면 항원을 인식하는 특정 항체를 사용하여 FACS 또는 MACS를 통해 추가로 정제될 수 있다. 다른 미세소포 및 엑소좀 정제 방법에는, 비제한적으로, 면역침강, 친화성 크로마토그래피, 여과, 및 특정 항체 또는 압타머가 코팅된 자성 비드가 포함된다. 정제 시, 소포를, 예를 들어 인산염 완충 염수로 세척한다. ceDNA 함유 소포를 전달하는 데 미세소포 또는 엑소좀을 사용하는 하나의 이점은, 이러한 소포가 각각의 세포 유형에 대한 특정 수용체에 의해 인식되는 막 단백질을 포함하기 때문에 다양한 세포 유형에 대해 표적화될 수 있다는 점이다. (또한 EP 10306226 참조)
본원의 발명의 또 다른 양태는, ceDNA 구조체가 그 자체의 게놈에 안정적으로 통합된 숙주 세포주로부터 ceDNA 벡터를 정제하는 방법에 관한 것이다. 하나의 구현예에서, ceDNA 벡터는 DNA 분자로 정제된다. 또 다른 구현예에서, ceDNA 벡터는 엑소좀 또는 미세입자로 정제된다.
국제 출원 PCT/US18/49996의 도 5는, 실시예에 기재된 방법을 사용하여 다수의 ceDNA-플라스미드 구조체로부터 ceDNA의 생산을 확인시켜 주는 겔을 보여준다. ceDNA는, 실시예에서 도 4d에 대해 논의된 바와 같이, 겔에서의 특징적인 밴드 패턴에 의해 확인된다.
VII. 약학적 조성물
또 다른 양태에서, 약학적 조성물이 제공된다. 약학적 조성물은 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터와, 약학적으로 허용 가능한 담체 또는 희석제를 포함한다.
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 대상의 세포, 조직 또는 기관으로의 생체내 전달을 위해 대상에게의 투여에 적합한 약학적 조성물에 혼입될 수 있다. 전형적으로, 약학적 조성물은 본원에 개시된 바와 같은 ceDNA 벡터와 약학적으로 허용 가능한 담체를 포함한다. 예를 들어, 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 치료용 투여(예를 들어, 비경구 투여)의 목적하는 경로에 적합한 약학적 조성물에 혼입될 수 있다. 고압 정맥내 또는 동맥내 주입뿐 아니라, 핵내 미세주사 또는 세포질내 주사와 같은 세포내 주사를 통한 수동적 조직 전달이 또한 고려된다. 치료 목적의 약학적 조성물은 용액, 마이크로에멀젼, 분산액, 리포좀, 또는 높은 ceDNA 벡터 농도에 적합한 다른 정렬된 구조로 제형화될 수 있다. 멸균 주사액은, 필요한 경우 상기 열거된 성분 중 하나 또는 이들의 조합을 갖는 적절한 완충액 중에 필요한 양의 ceDNA 벡터 화합물을 혼입시켜 제조할 수 있고, 이어서 ceDNA 벡터를 포함하는 여과 멸균된 것을 제형화하여 핵산의 전이유전자를 수용자의 세포에 전달함으로써, 그 안의 전이유전자 또는 공여체 서열의 치료적 발현을 유도할 수 있다. 상기 조성물은 또한 약학적으로 허용 가능한 담체를 포함할 수 있다.
PAH 단백질의 발현을 위한 ceDNA 벡터를 포함하는 약학적 활성 조성물은 다양한 목적을 위한 전이유전자를 세포, 예를 들어 대상의 세포에 전달하도록 제형화될 수 있다.
치료 목적을 위한 약학적 조성물은 전형적으로 제조 및 저장 조건 하에서 멸균되고 안정해야 한다. 상기 조성물은 용액, 마이크로에멀젼, 분산액, 리포좀, 또는 높은 ceDNA 벡터 농도에 적합한 다른 정렬된 구조로 제형화될 수 있다. 멸균 주사액은, 필요한 경우 상기 열거된 성분 중 하나 또는 이들의 조합을 갖는 적절한 완충액 중에 필요한 양의 ceDNA 벡터 화합물을 혼입시킨 후, 여과 멸균하는 방식으로 제조될 수 있다.
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 국소, 전신, 양막내, 경막내, 두개내, 동맥내, 정맥내, 림프내, 복강내, 피하, 기관, 조직내(예를 들어, 근육내, 심장내, 간내, 신장내, 뇌내), 경막내, 방광내, 결막(예를 들어, 안와외, 안와내, 안와후방, 망막내, 망막하, 맥락막, 맥락막하, 간질내, 전방내 및 유리체내), 달팽이관내 및 점막(예를 들어, 구강, 설하, 비강) 투여에 적합한 약학적 조성물에 혼입될 수 있다. 고압 정맥내 또는 동맥내 주입뿐 아니라, 핵내 미세주사 또는 세포질내 주사와 같은 세포내 주사를 통한 수동적 조직 전달이 또한 고려된다.
일부 양태에서, 본원에 제공된 방법은 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 하나 이상의 ceDNA 벡터를 숙주세포에 전달하는 것을 포함한다. 또한, 이러한 방법에 의해 생산된 세포, 및 이러한 세포로부터 생산되거나 이러한 세포를 포함하는 유기체(예컨대, 동물, 식물 또는 진균)가 본원에 제공된다. 핵산의 전달 방법은 리포펙션, 뉴클레오펙션, 미세주사, 유전자총, 리포좀, 면역리포좀(immunoliposome), 다가양이온 또는 지질:핵산 접합체, 네이키드 DNA, 및 DNA의 작용제 증강된 흡수를 포함할 수 있다. 리포펙션은, 예를 들어 미국 특허 제5,049,386호, 제4,946,787호 및 제4,897,355호(이들은 그 전문이 본원에 참조로서 인용됨)에 기재되어 있으며, 리포펙션 시약은 상업적으로 시판되고 있다(예를 들어, Transfectam™ 및 Lipofectin™). 전달은 세포(예를 들어, 시험관내 또는 생체외 투여) 또는 표적 조직(예를 들어, 생체내 투여)으로 이루어질 수 있다.
핵산을 세포에 전달하는 다양한 기술 및 방법이 당업계에 공지되어 있다. 예를 들어, PAH 단백질의 발현을 위한 ceDNA와 같은 핵산은 지질 나노입자(LNP), 리피도이드, 리포좀, 지질 나노입자, 리포플렉스 또는 코어-쉘 나노입자로 제형화될 수 있다. 전형적으로, LNP는 핵산(예를 들어, ceDNA) 분자, 하나 이상의 이온화 가능하거나 양이온성인 지질(또는 이의 염), 하나 이상의 비이온성 또는 중성 지질(예를 들어, 인지질), 응집을 방지하는 분자(예를 들어, PEG 또는 PEG-지질 접합체), 및 선택적으로 스테롤(예를 들어, 콜레스테롤)로 구성된다.
PAH 단백질의 발현을 위한 ceDNA와 같은 핵산을 세포에 전달하는 또 다른 방법은, 핵산을 세포에 의해 내재화된 리간드와 접합시키는 것이다. 예를 들어, 리간드는 세포 표면 상의 수용체에 결합하여 세포내이입을 통해 내재화될 수 있다. 리간드는 핵산의 뉴클레오타이드에 공유결합으로 연결될 수 있다. 핵산을 세포에 전달하기 위한 예시적인 접합체는, 예를 들어 WO2015/006740, WO2014/025805, WO2012/037254, WO2009/082606, WO2009/073809, WO2009/018332, WO2006/112872, WO2004/090108, WO2004/091515 및 WO2017/177326에 기재되어 있으며, 상기 모든 문헌의 내용은 그 전문이 본원에 참조로서 인용된다.
PAH 단백질의 발현을 위한 ceDNA 벡터와 같은 핵산은 또한 트랜스펙션에 의해 세포에 전달될 수 있다. 유용한 트랜스펙션 방법에는, 비제한적으로, 지질 매개 트랜스펙션, 양이온성 중합체 매개 트랜스펙션 또는 인산칼슘 침전이 포함된다. 트랜스펙션 시약은 당업계에 널리 공지되어 있으며, 이에는, 비제한적으로, TurboFect 트랜스펙션 시약(Thermo Fisher Scientific), Pro-Ject 시약(Thermo Fisher Scientific), TRANSPASS™ P 단백질 트랜스펙션 시약(New England Biolabs), CHARIOT™ 단백질 전달 시약(Active Motif), PROTEOJUICE™ 단백질 트랜스펙션 시약(EMD Millipore), 293fectin, LIPOFECTAMINE™ 2000, LIPOFECTAMINE™ 3000(Thermo Fisher Scientific), LIPOFECTAMINE™(Thermo Fisher Scientific), LIPOFECTIN™(Thermo Fisher Scientific), DMRIE-C, CELLFECTIN™(Thermo Fisher Scientific), OLIGOFECTAMINE™(Thermo Fisher Scientific), LIPOFECTACE™, FUGENE™(Roche, Basel, Switzerland), FUGENE™ HD(Roche), TRANSFECTAM™(Transfectam, Promega, Madison, Wis.), TFX-10™(Promega), TFX-20™(Promega), TFX-50™(Promega), TRANSFECTIN™(BioRad, Hercules, Calif.), SILENTFECT™(Bio-Rad), Effectene™(Qiagen, Valencia, Calif.), DC-chol(Avanti Polar Lipids), GENEPORTER™(Gene Therapy Systems, San Diego, Calif.), DHARMAFECT 1™(Dharmacon, Lafayette, Colo.), DHARMAFECT 2™(Dharmacon), DHARMAFECT 3™(Dharmacon), DHARMAFECT 4™(Dharmacon), ESCORT™ III(Sigma, St. Louis, Mo.) 및 ESCORT™ IV(Sigma Chemical Co.)가 포함된다. ceDNA와 같은 핵산은, 또한 당업자에게 공지된 미세유체 방법을 통해 세포에 전달될 수 있다.
본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 또한 생체내 세포의 형질도입을 위해 유기체에 직접 투여될 수 있다. 투여는, 비제한적으로, 주사, 주입, 국소 적용 및 전기천공을 포함하는, 분자를 혈액 또는 조직 세포와의 궁극적 접촉에 도입하는 데 통상적으로 사용되는 경로 중 임의의 것에 의해 이루어져 있다. 이러한 핵산을 투여하는 적합한 방법이 이용 가능하고 당업자에 널리 공지되어 있으며, 하나 초과의 경로가 특정 조성물을 투여하는 데 사용될 수 있지만, 특정 경로가 종종 또 다른 경로보다 더 즉각적이고 더 효과적인 반응을 제공할 수 있다.
핵산 벡터의 도입 방법에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, 예를 들어 미국 특허 제5,928,638호(이는 그 전문이 본원에 참조로서 인용됨)에 기재된 방법에 따라 조혈줄기세포에 전달될 수 있다.
본 발명에 따른 PAH 단백질의 발현을 위한 ceDNA 벡터는 대상의 세포 또는 표적 기관으로의 전달을 위해 리포좀에 첨가될 수 있다. 리포좀은 적어도 하나의 지질 이중층을 보유하는 소포이다. 리포좀은 의약품 개발의 맥락에서 약물/치료제 전달을 위한 담체로서 전형적으로 사용된다. 이는, 세포막과 융합하고 지질 구조를 재배치하여 약물 또는 활성 약학 성분(API)을 전달하는 방식으로 작동한다. 이러한 전달을 위한 리포좀 조성물은 인지질, 특히 포스파티딜콜린기를 갖는 화합물로 구성되지만, 이러한 조성물은 다른 지질을 또한 포함할 수 있다. 예시적인 리포좀 및 리포좀 제형(비제한적으로, 폴리에틸렌 글리콜(PEG) 관능기 함유 화합물을 포함함)은, 2018년 9월 7일자 출원된 국제 출원 PCT/US2018/050042 및 2018년 12월 6일자 출원된 국제 출원 PCT/US2018/064242(예를 들어, "약학적 제형"이라는 제목의 섹션 참조)에 개시되어 있으며, 상기 문헌 각각의 내용은 그 전문이 본원에 참조로서 인용된다.
당업계에 공지된 다양한 전달 방법 또는 이의 변형을 사용하여 시험관내 또는 생체내에서 ceDNA 벡터를 전달할 수 있다. 예를 들어, 일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는, 표적화된 세포로의 DNA 유입이 용이하도록 기계적, 전기적, 초음파, 유체역학적 또는 레이저 기반 에너지에 의해 세포막에 일시적으로 침투하는 방식으로 전달된다. 예를 들어, ceDNA 벡터는 세포막을 일시적으로 파괴하거나, 크기 제한 채널을 통해 세포를 밀어넣거나, 또는 당업계에 공지된 다른 수단에 의해 전달될 수 있다. 일부 경우에, ceDNA 벡터만 네이키드 DNA로서 간, 신장, 담낭, 전립선, 부신, 심장, 장, 폐 및 위, 피부, 흉선, 심장근 또는 골격근에서 선택되는 임의의 하나 이상의 조직에 직접 주사된다. 일부 경우에, ceDNA 벡터는 유전자 총에 의해 전달된다. 캡시드 미함유 AAV 벡터로 코팅된 금 또는 텅스텐 구형 입자(직경 1 μm 내지 3 μm)는 가압 가스에 의해 고속으로 가속화되어 표적 조직세포에 침투할 수 있다.
PAH 단백질의 발현을 위한 ceDNA 벡터와 약학적으로 허용 가능한 담체를 포함하는 조성물이 구체적으로 본원에서 고려된다. 일부 구현예에서, ceDNA 벡터는 지질 전달 시스템, 예를 들어 본원에 기재된 바와 같은 리포좀을 이용하여 제형화된다. 일부 구현예에서, 이러한 조성물은 숙련된 의사에 의해 임의의 목적하는 경로로 투여된다. 상기 조성물은 경구, 비경구, 설하, 경피, 직장, 경점막, 국소, 흡입, 협측 투여, 흉막내, 정맥내, 동맥내, 복강내, 피하, 근육내, 비강내, 경막내 및 관절내, 또는 이들의 조합을 포함하는 상이한 경로로 대상에게 투여될 수 있다. 수의학적 사용을 위해, 상기 조성물은 통상의 수의학적 관행에 따라 적합하게 허용 가능한 제형으로 투여될 수 있다. 수의사는 특정 동물에 가장 적절한 투여 방식 및 투여 경로를 용이하게 결정할 수 있다. 상기 조성물은 전형적인 시린지, 무바늘 주사 장치, "미세사출법(microprojectile bombardment) 유전자 총", 또는 전기천공("EP"), 유체역학적 방법 또는 초음파와 같은 다른 물리적 방법에 의해 투여될 수 있다.
일부 경우에, PAH 단백질의 발현을 위한 ceDNA 벡터는 유체역학적 주사에 의해 전달되는데, 이는 임의의 수용성 화합물 및 입자를 사지 전체의 내부 기관 및 골격근에 직접 세포내 전달하기 위한 간단하고 매우 효율적인 방법이다.
일부 경우에, PAH 단백질의 발현을 위한 ceDNA 벡터는 DNA 입자의 내부 기관 또는 종양 세포로의 세포내 전달을 용이하게 하기 위해 막 내에 나노범위 공극을 만들어 초음파를 통해 전달되므로, 플라스미드 DNA의 크기 및 농도는 상기 시스템의 효율에 큰 역할을 한다. 일부 경우에, ceDNA 벡터는 핵산을 함유하는 입자를 표적세포 내로 농축시키기 위해 자기장을 사용하는 자기주입법(magnetofection)을 통해 전달된다.
일부 경우에, 양이온성 리포좀/미셀 또는 양이온성 중합체에 속하는 다가양이온성 나노머 입자에 의한 음으로 하전된 핵산의 압축을 포함하는, 예를 들어 나노머 복합체를 사용하는 화학적 전달 시스템이 사용될 수 있다. 전달 방법에 사용되는 양이온성 지질에는, 비제한적으로, 1가 양이온성 지질, 다가 양이온성 지질, 구아닌 함유 화합물, 콜레스테롤 유도체 화합물, 양이온성 중합체(예를 들어, 폴리(에틸렌이민), 폴리-L-리신, 프로타민, 다른 양이온성 중합체) 및 지질-중합체 하이브리드가 포함된다.
A. 엑소좀:
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 엑소좀에 패키징되는 방식으로 전달된다. 엑소좀은 다소포체와 원형질막의 융합 후 세포외 환경으로 방출되는 세포내이입 기원의 작은 막 소포이다. 이의 표면은 공여체 세포의 세포막 유래의 지질 이중층으로 이루어져 있으며, 엑소좀을 생산한 세포의 세포질을 함유하고, 표면에 모세포(parental cell)의 막 단백질을 나타낸다. 엑소좀은 내피세포, B 및 T 림프구, 비만세포(MC)뿐 아니라, 수지상세포(DC)를 포함하는 다양한 세포 유형에 의해 생성된다. 일부 구현예에서, 직경이 10 nm 내지 1μm, 20 nm 내지 500 nm, 30 nm 내지 250 nm, 50 nm 내지 100 nm인 엑소좀이 사용을 위해 고려된다. 엑소좀은 이의 공여체 세포를 사용하거나 특정 핵산을 도입하는 방식으로 표적세포로의 전달을 위해 단리될 수 있다. 당업계에 공지된 다양한 접근법을 사용하여 본 발명의 캡시드 미함유 AAV 벡터를 함유하는 엑소좀을 생성할 수 있다.
A. 미세입자/나노입자
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 지질 나노입자에 의해 전달된다. 일반적으로, 지질 나노입자는, 예를 들어 문헌[Tam et al. (2013). Advances in Lipid Nanoparticles for siRNA delivery. Pharmaceuticals 5(3): 498-507]에 개시된 바와 같은, 이온화 가능한 아미노 지질(예를 들어, 헵타트리아콘타-6,9,28,31-테트라엔-19-일 4-(디메틸아미노)부타노에이트, DLin-MC3-DMA, 포스파티딜콜린(1,2-디스테아로일-sn-글리세로-3-포스포콜린, DSPC), 콜레스테롤 및 코트 지질(폴리에틸렌 글리콜-디미리스톨글리세롤, PEG-DMG)을 포함한다.
일부 구현예에서, 지질 나노입자의 평균 직경은 약 10 nm 내지 약 1000 nm이다. 일부 구현예에서, 지질 나노입자의 평균 직경은 300 nm 미만이다. 일부 구현예에서, 지질 나노입자의 평균 직경은 약 10 nm 내지 약 300 nm이다. 일부 구현예에서, 지질 나노입자의 평균 직경은 200 nm 미만이다. 일부 구현예에서, 지질 나노입자의 평균 직경은 약 25 nm 내지 약 200 nm이다. 일부 구현예에서, 지질 나노입자 제제(예를 들어, 다수의 지질 나노입자를 포함하는 조성물)는, 평균 크기(예를 들어, 직경)가 약 70 nm 내지 약 200 nm이고, 전형적으로 평균 크기가 약 100 nm 이하인 크기 분포를 갖는다.
당업계에 공지된 다양한 지질 나노입자를 사용하여 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 전달할 수 있다. 예를 들어, 지질 나노입자를 사용하는 다양한 전달 방법은 미국 특허 제9,404,127호, 제9,006,417호 및 제9,518,272호에 기재되어 있다.
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 금 나노입자에 의해 전달된다. 일반적으로, 핵산은, 예를 들어 문헌[Ding et al. (2014). Gold Nanoparticles for Nucleic Acid Delivery. Mol. Ther. 22(6); 1075-1083]에 기재된 바와 같이, 금 나노입자에 공유결합으로 결합되거나, 금 나노입자에 비공유결합으로 결합될 수 있다(예를 들어, 전하-전하 상호작용에 의해 결합됨). 일부 구현예에서, 금 나노입자-핵산 접합체는, 예를 들어 미국 특허 제6,812,334호에 기재된 방법을 사용하여 생성된다.
B. 접합체
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 세포 흡수를 증가시키는 작용제에 접합된다(예를 들어, 공유결합으로 결합됨). "세포 흡수를 증가시키는 작용제"는 지질 막을 통한 핵산의 수송을 용이하게 하는 분자이다. 예를 들어, 핵산은 친유성 화합물(예를 들어, 콜레스테롤, 토코페롤 등), 세포 침투 펩타이드(CPP)(예를 들어, 페네트라틴(penetratin), TAT, Syn1B, 등) 및 폴리아민(예를 들어, 스페르민(spermine))에 접합될 수 있다. 세포 흡수를 증가시키는 작용제의 추가 예는, 예를 들어 문헌[Winkler (2013). Oligonucleotide conjugates for therapeutic applications. Ther. Deliv. 4(7); 791-809]에 개시되어 있다.
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 중합체(예를 들어, 중합체 분자) 또는 폴레이트 분자(예를 들어, 엽산 분자)에 접합된다. 일반적으로, 중합체에 접합된 핵산의 전달은 당업계에 공지되어 있으며, 예를 들어 WO2000/34343 및 WO2008/022309에 기재되어 있다. 일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 미국 특허 제8,987,377호에 기재된 바와 같이 폴리(아미드) 중합체에 접합된다. 일부 구현예에서, 본 개시내용에 기재된 핵산은 미국 특허 제8,507,455호에 기재된 바와 같이 엽산 분자에 접합된다.
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, 예를 들어 미국 특허 제8,450,467호 기재된 바와 같이 탄수화물에 접합된다.
C. 나노캡슐
대안적으로, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 나노캡슐 제형이 사용될 수 있다. 나노캡슐은 일반적으로 안정적이고 재현 가능한 방식으로 물질을 포획할 수 있다. 세포내 중합체 과부하로 인한 부작용을 회피하기 위해, 이러한 초미세 입자(크기 약 0.1 μm)는 생체내에서 분해될 수 있는 중합체를 사용하여 설계되어야 한다. 이러한 요건을 충족시키는 생분해성 폴리알킬-시아노아크릴레이트 나노입자가 사용을 위해 고려된다.
D. 리포좀
본 발명에 따른 PAH 단백질의 발현을 위한 ceDNA 벡터는 대상의 세포 또는 표적 기관으로의 전달을 위해 리포좀에 첨가될 수 있다. 리포좀은 적어도 하나의 지질 이중층을 보유하는 소포이다. 리포좀은 의약품 개발의 맥락에서 약물/치료제 전달을 위한 담체로서 전형적으로 사용된다. 이는, 세포막과 융합하고 지질 구조를 재배치하여 약물 또는 활성 약학 성분(API)을 전달하는 방식으로 작동한다. 이러한 전달을 위한 리포좀 조성물은 인지질, 특히 포스파티딜콜린기를 갖는 화합물로 구성되지만, 이러한 조성물은 다른 지질을 또한 포함할 수 있다.
리포좀의 형성 및 사용은 일반적으로 당업자에게 공지되어 있다. 리포좀은 개선된 혈청 안정성 및 순환 반감기를 갖도록 개발되었다(미국 특허 제5,741,516호). 나아가, 잠재적인 약물 담체로서의 리포좀 및 리포좀 유사 제제의 다양한 방법이 기재되어 있다(미국 특허 제5,567,434호; 제5,552,157호; 제5,565,213호; 제5,738,868호 및 제5,795,587호(이들은 그 전문이 본원에 참조로서 인용됨)).
E. 예시적인 리포좀 및 지질 나노입자(LNP) 조성물
본 발명에 따른 PAH 단백질의 발현을 위한 ceDNA 벡터는 세포, 예를 들어 전이유전자의 발현을 필요로 하는 세포로의 전달을 위해 리포좀에 첨가될 수 있다. 리포좀은 적어도 하나의 지질 이중층을 보유하는 소포이다. 리포좀은 의약품 개발의 맥락에서 약물/치료제 전달을 위한 담체로서 전형적으로 사용된다. 이는, 세포막과 융합하고 지질 구조를 재배치하여 약물 또는 활성 약학 성분(API)을 전달하는 방식으로 작동한다. 이러한 전달을 위한 리포좀 조성물은 인지질, 특히 포스파티딜콜린기를 갖는 화합물로 구성되지만, 이러한 조성물은 다른 지질을 또한 포함할 수 있다.
ceDNA를 포함하는 지질 나노입자(LNP)는 2018년 9월 7일자 출원된 국제 출원 PCT/US2018/050042 및 2018년 12월 6일자 출원된 국제 출원 PCT/US2018/064242(이들은 그 전문이 본원에 참조로서 인용됨)에 개시되어 있으며, 이는 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 위한 방법 및 조성물에의 사용을 위해 고려된다.
일부 양태에서, 본 개시내용은 면역원성/항원성을 감소시키고, 화합물(들)에 친수성 및 소수성을 제공하고, 투여 빈도를 감소시킬 수 있는 폴리에틸렌 글리콜(PEG) 관능기(소위 "PEG화 화합물")를 갖는 하나 이상의 화합물을 포함하는 리포좀 제형을 제공한다. 또는, 리포좀 제형은 단순히 추가 구성요소로서 폴리에틸렌 글리콜(PEG) 중합체를 포함한다. 이러한 양태에서, PEG 또는 PEG 관능기의 분자량은 62 Da 내지 약 5,000 Da일 수 있다.
일부 양태에서, 본 개시내용은 수시간 내지 수주의 기간에 걸쳐 연장 방출 또는 제어 방출 프로파일로 API를 전달하는 리포좀 제형을 제공한다. 일부 관련 양태에서, 리포좀 제형은 지질 이중층에 의해 결합된 수성 챔버를 포함할 수 있다. 다른 관련 양태에서, 리포좀 제형은 수시간 내지 수주의 기간에 걸쳐 API를 방출하는 승온에서 물리적 전이를 거치는 구성요소로 API를 캡슐화한다.
일부 양태에서, 리포좀 제형은 스핑고미엘린과, 본원에 개시된 하나 이상의 지질을 포함한다. 일부 양태에서, 리포좀 제형은 옵티좀을 포함한다.
일부 양태에서, 본 개시내용은 N-(카르보닐-메톡시폴리에틸렌 글리콜 2000)-1,2-디스테아로일-sn-글리세로-3-포스포에탄올아민 소듐 염, (디스테아로일-sn-글리세로-포스포에탄올아민), MPEG(메톡시 폴리에틸렌 글리콜)-접합된 지질, HSPC(수소첨가된 대두 포스파티딜콜린); PEG(폴리에틸렌 글리콜); DSPE(디스테아로일-sn-글리세로-포스포에탄올아민); DSPC(디스테아로일포스파티딜콜린); DOPC(디올레오일포스파티딜콜린); DPPG(디팔미토일포스파티딜글리세롤); EPC(달걀 포스파티딜콜린); DOPS(디올레오일포스파티딜세린); POPC(팔미토일올레오일포스파티딜콜린); SM(스핑고미엘린); MPEG(메톡시 폴리에틸렌 글리콜); DMPC(디미리스토일 포스파티딜콜린); DMPG(디미리스토일 포스파티딜글리세롤); DSPG(디스테아로일포스파티딜글리세롤); DEPC(디에루코일포스파티딜콜린); DOPE(디올레오일-sn-글리세로-포스포에탄올아민), 콜레스테릴 설페이트(CS), 디팔미토일포스파티딜글리세롤(DPPG), DOPC(디올레오일-sn-글리세로-포스파티딜콜린) 또는 이들의 임의의 조합에서 선택되는 하나 이상의 지질을 포함하는 리포좀 제형을 제공한다.
일부 양태에서, 본 개시내용은 인지질, 콜레스테롤 및 PEG화 지질을 56:38:5의 몰비로 포함하는 리포좀 제형을 제공한다. 일부 양태에서, 리포좀 제형의 전체 지질 함량은 2 mg/mL 내지 16 mg/mL이다. 일부 양태에서, 본 개시내용은 포스파티딜콜린 관능기를 함유하는 지질, 에탄올아민 관능기를 함유하는 지질 및 PEG화 지질을 포함하는 리포좀 제형을 제공한다. 일부 양태에서, 본 개시내용은 포스파티딜콜린 관능기를 함유하는 지질, 에탄올아민 관능기를 함유하는 지질 및 PEG화 지질을, 각각, 3:0.015:2의 몰비로 포함하는 리포좀 제형을 제공한다. 일부 양태에서, 본 개시내용은 포스파티딜콜린 관능기를 함유하는 지질, 콜레스테롤 및 PEG화 지질을 포함하는 리포좀 제형을 제공한다. 일부 양태에서, 본 개시내용은 포스파티딜콜린 관능기를 함유하는 지질과 콜레스테롤을 포함하는 리포좀 제형을 제공한다. 일부 양태에서, PEG화 지질은 PEG-2000-DSPE이다. 일부 양태에서, 본 개시내용은 DPPG, 대두 PC, MPEG-DSPE 지질 접합체 및 콜레스테롤을 포함하는 리포좀 제형을 제공한다.
일부 양태에서, 본 개시내용은 포스파티딜콜린 관능기를 함유하는 하나 이상의 지질과 에탄올아민 관능기를 함유하는 하나 이상의 지질을 포함하는 리포좀 제형을 제공한다. 일부 양태에서, 본 개시내용은 포스파티딜콜린 관능기를 함유하는 지질, 에탄올아민 관능기를 함유하는 지질, 및 스테롤, 예를 들어 콜레스테롤 중 하나 이상을 포함하는 리포좀 제형을 제공한다. 일부 양태에서, 리포좀 제형은 DOPC/ DEPC; 및 DOPE를 포함한다.
일부 양태에서, 본 개시내용은 하나 이상의 약학적 부형제, 예를 들어 수크로오스 및/또는 글리신을 추가로 포함하는 리포좀 제형을 제공한다.
일부 양태에서, 본 개시내용은 단일라멜라 또는 다중라멜라 구조의 리포좀 제형을 제공한다. 일부 양태에서, 본 개시내용은 다소포성 입자 및/또는 발포체 기반 입자를 포함하는 리포좀 제형을 제공한다. 일부 양태에서, 본 개시내용은 통상의 나노입자에 비해 크기가 크고, 크기가 약 150 nm 내지 250 nm인 리포좀 제형을 제공한다. 일부 양태에서, 리포좀 제형은 동결건조된 분말이다.
일부 양태에서, 본 개시내용은 리포좀 외부에 단리된 ceDNA를 갖는 혼합물에 약염기를 첨가하여, 본원에 개시 또는 기재된 ceDNA 벡터로 제조되고 로딩되는 리포좀 제형을 제공한다. 이러한 첨가는 리포좀 외부의 pH를 대략 7.3으로 증가시키고, API를 리포좀으로 유도한다. 일부 양태에서, 본 개시내용은 리포좀 내부에서 산성인 pH를 갖는 리포좀 제형을 제공한다. 이러한 경우에, 리포좀의 내부는 pH 4 내지 6.9, 더욱 바람직하게는 pH 6.5일 수 있다. 다른 양태에서, 본 개시내용은 리포좀내 약물 안정화 기술을 사용하여 제조된 리포좀 제형을 제공한다. 이러한 경우에, 중합체성 또는 비중합체성의 고도로 하전된 음이온과, 리포좀내 포획제, 예를 들어 폴리포스페이트 또는 수크로오스 옥타설페이트가 이용된다.
일부 양태에서, 본 개시내용은 ceDNA와 이온화 가능한 지질을 포함하는 지질 나노입자를 제공한다. 예를 들어, 2018년 9월 7일자 출원된 국제 특허 PCT/US2018/050042(이는 본원에 참조로서 인용됨)에 기재된 바와 같은 방법으로 수득된 ceDNA로 제조되고 로딩되는 지질 나노입자 제형. 이는, 이온화 가능한 지질을 양성자화하고 ceDNA/지질 회합 및 입자의 핵형성에 유용한 에너지를 제공하는, 낮은 pH에서의 에탄올성 지질과 수성 ceDNA의 고에너지 혼합에 의해 달성될 수 있다. 상기 입자는 수성 희석 및 유기 용매의 제거를 통해 추가로 안정화될 수 있다. 상기 입자는 목적하는 수준으로 농축될 수 있다.
일반적으로, 지질 입자는 약 10:1 내지 30:1의 총 지질 대 ceDNA의 (질량 또는 중량)비로 제조된다. 일부 구현예에서, 지질 대 ceDNA 비(질량/질량 비; w/w 비)는 약 1:1 내지 약 25:1, 약 10:1 내지 약 14:1, 약 3:1 내지 약 15:1, 약 4:1 내지 약 10:1, 약 5:1 내지 약 9:1, 또는 약 6:1 내지 약 9:1의 범위일 수 있다. 지질과 ceDNA의 양은 목적하는 N/P 비, 예를 들어 3, 4, 5, 6, 7, 8, 9, 10 또는 그 이상의 N/P 비를 제공하도록 조정될 수 있다. 일반적으로, 지질 입자 제형의 전체 지질 함량은 약 5 mg/ml 내지 약 30 mg/mL 범위일 수 있다.
이온화 가능한 지질은 전형적으로 낮은 pH에서 핵산 카고, 예를 들어 ceDNA를 응축시키고, 막 회합과 융합원성(fusogenicity)을 유도하는 데 이용된다. 일반적으로, 이온화 가능한 지질은 산성 조건 하에서, 예를 들어 6.5 이하의 pH에서 양으로 하전되거나 양성자화되는 적어도 하나의 아미노기를 포함하는 지질이다. 이온화 가능한 지질은 또한 본원에서 양이온성 지질로 지칭된다.
예시적인 이온화 가능한 지질은 국제 PCT 특허 출원 WO2015/095340, WO2015/199952, WO2018/011633, WO2017/049245, WO2015/061467, WO2012/040184, WO2012/000104, WO2015/074085, WO2016/081029, WO2017/004143, WO2017/075531, WO2017/117528, WO2011/022460, WO2013/148541, WO2013/116126, WO2011/153120, WO2012/044638, WO2012/054365, WO2011/090965, WO2013/016058, WO2012/162210, WO2008/042973, WO2010/129709, WO2010/144740, WO2012/099755, WO2013/049328, WO2013/086322, WO2013/086373, WO2011/071860, WO2009/132131, WO2010/048536, WO2010/088537, WO2010/054401, WO2010/054406, WO2010/054405, WO2010/054384, WO2012/016184, WO2009/086558, WO2010/042877, WO2011/000106, WO2011/000107, WO2005/120152, WO2011/141705, WO2013/126803, WO2006/007712, WO2011/038160, WO2005/121348, WO2011/066651, WO2009/127060, WO2011/141704, WO2006/069782, WO2012/031043, WO2013/006825, WO2013/033563, WO2013/089151, WO2017/099823, WO2015/095346 및 WO2013/086354, 및 미국 특허 공보 US2016/0311759, US2015/0376115, US2016/0151284, US2017/0210697, US2015/0140070, US2013/0178541, US2013/0303587, US2015/0141678, US2015/0239926, US2016/0376224, US2017/0119904, US2012/0149894, US2015/0057373, US2013/0090372, US2013/0274523, US2013/0274504, US2013/0274504, US2009/0023673, US2012/0128760, US2010/0324120, US2014/0200257, US2015/0203446, US2018/0005363, US2014/0308304, US2013/0338210, US2012/0101148, US2012/0027796, US2012/0058144, US2013/0323269, US2011/0117125, US2011/0256175, US2012/0202871, US2011/0076335, US2006/0083780, US2013/0123338, US2015/0064242, US2006/0051405, US2013/0065939, US2006/0008910, US2003/0022649, US2010/0130588, US2013/0116307, US2010/0062967, US2013/0202684, US2014/0141070, US2014/0255472, US2014/0039032, US2018/0028664, US2016/0317458 및 US2013/0195920에 기재되어 있으며, 모든 상기 문헌들의 내용은 그 전문이 본원에 참조로서 인용된다.
일부 구현예에서, 이온화 가능한 지질은 하기 구조를 갖는 MC3 (6Z,9Z,28Z,31Z)-헵타트리아콘타-6,9,28,31-테트라엔-19-일-4-(디메틸아미노)부타노에이트(DLin-MC3-DMA 또는 MC3)이다:
Figure pct00025
.
지질 DLin-MC3-DMA는 문헌[Jayaraman et al., Angew. Chem. Int. Ed Engl. (2012), 51(34): 8529-8533]에 기재되어 있으며, 상기 문헌의 내용은 그 전문이 본원에 참조로서 인용된다.
일부 구현예에서, 이온화 가능한 지질은 WO2015/074085에 기재된 바와 같은 지질 ATX-002이며, 상기 문헌의 내용은 그 전문이 본원에 참조로서 인용된다.
일부 구현예에서, 이온화 가능한 지질은 WO2012/040184에 기재된 바와 같은 (13Z,16Z)-N,N-디메틸-3-노닐도코사-13,16-디엔-1-아민(화합물 32)이며, 상기 문헌의 내용은 그 전문이 본원에 참조로서 인용된다.
일부 구현예에서, 이온화 가능한 지질은 WO2015/199952에 기재된 바와 같은 화합물 6 또는 화합물 22이며, 상기 문헌의 내용은 그 전문이 본원에 참조로서 인용된다.
비제한적으로, 이온화 가능한 지질은 지질 나노입자에 존재하는 총 지질의 20% 내지 90%(몰)를 차지할 수 있다. 예를 들어, 이온화 가능한 지질 몰 함량은 지질 나노입자에 존재하는 총 지질의 20% 내지 70%(몰), 30% 내지 60%(몰) 또는 40% 내지 50%(몰)일 수 있다. 일부 구현예에서, 이온화 가능한 지질은 지질 나노입자에 존재하는 총 지질의 약 50 mol% 내지 약 90 mol%를 차지한다.
일부 양태에서, 지질 나노입자는 비양이온성 지질을 추가로 포함할 수 있다. 비이온성 지질에는, 양친매성 지질, 중성 지질 및 음이온성 지질이 포함된다. 따라서, 비양이온성 지질은 중성의 하전되지 않은 지질, 쯔비터이온성(zwitterionic) 지질 또는 음이온성 지질일 수 있다. 비양이온성 지질은 전형적으로 융합원성을 증강시키는 데 이용된다.
본원에 개시된 바와 같은 방법 및 조성물에 사용하기 위해 고려되는 예시적인 비양이온성 지질은 2018년 9월 7일자 출원된 국제 출원 PCT/US2018/050042 및 2018년 12월 6일자 출원된 PCT/US2018/064242에 기재되어 있으며, 상기 문헌들은 그 전문이 본원에 참조로서 인용된다. 예시적인 비양이온성 지질은 국제 출원 공보 WO2017/099823 및 미국 특허 공보 US2018/0028664에 기재되어 있으며, 상기 문헌의 내용은 모두 그 전문이 본원에 참조로서 인용된다.
비양이온성 지질은 지질 나노입자에 존재하는 총 지질의 0 내지 30%(몰)를 차지할 수 있다. 예를 들어, 비양이온성 지질 함량은 지질 나노입자에 존재하는 총 지질의 5% 내지 20%(몰) 또는 10% 내지 15%(몰)이다. 다양한 구현예에서, 이온화 가능한 지질 대 중성 지질의 몰비는 약 2:1 내지 약 8:1 범위이다.
일부 구현예에서, 지질 나노입자는 임의의 인지질을 포함하지 않는다. 일부 양태에서, 지질 나노입자는 막 온전성을 제공하기 위해 스테롤과 같은 구성요소를 추가로 포함할 수 있다.
지질 나노입자에 사용될 수 있는 하나의 예시적인 스테롤은 콜레스테롤 및 이의 유도체이다. 예시적인 콜레스테롤 유도체는 국제 출원 WO2009/127060 및 미국 특허 공보 US2010/0130588에 기재되어 있으며, 상기 문헌들의 내용은 그 전문이 본원에 참조로서 인용된다.
스테롤과 같은 막 온전성을 제공하는 구성요소는, 지질 나노입자에 존재하는 지질의 0 내지 50%(몰)를 차지할 수 있다. 일부 구현예에서, 이러한 구성요소는 지질 나노입자의 총 지질 함량의 20% 내지 50%(몰) 또는 30% 내지 40%(몰)이다.
일부 양태에서, 지질 나노입자는 폴리에틸렌 글리콜(PEG) 또는 접합된 지질 분자를 추가로 포함할 수 있다. 일반적으로, 이들은 지질 나노입자의 응집을 저해하고/하거나 입체 안정화를 제공하기 위해 사용된다. 예시적인 접합된 지질에는, 비제한적으로, PEG-지질 접합체, 폴리옥사졸린(POZ)-지질 접합체, 폴리아미드-지질 접합체(예컨대, ATTA-지질 접합체), 양이온성 중합체-지질(CPL) 접합체, 및 이들의 혼합물이 포함된다. 일부 구현예에서, 접합된 지질 분자는 PEG-지질 접합체, 예를 들어 (메톡시 폴리에틸렌 글리콜)-접합된 지질이다. 예시적인 PEG-지질 접합체에는, 비제한적으로, PEG-디아실글리세롤(DAG)(예컨대, 1-(모노메톡시-폴리에틸렌글리콜)-2,3-디미리스토일글리세롤(PEG-DMG)), PEG-디알킬옥시프로필(DAA), PEG-인지질, PEG-세라미드(Cer), peg화 포스파티딜에탄올아민(PEG-PE), PEG 숙시네이트 디아실글리세롤(PEGS-DAG)(예컨대, 4-O-(2',3'-디(테트라데카노일옥시)프로필-1-O-(w-메톡시(폴리에톡시)에틸) 부탄디오에이트(PEG-S-DMG)), PEG 디알콕시프로필카르밤, N-(카르보닐-메톡시폴리에틸렌 글리콜 2000)-1,2-디스테아로일-sn-글리세로-3-포스포에탄올아민 소듐 염, 또는 이들의 혼합물이 포함된다. 추가의 예시적인 PEG-지질 접합체는, 예를 들어 US5,885,613, US6,287,591, US2003/0077829, US2003/0077829, US2005/0175682, US2008/0020058, US2011/0117125, US2010/0130588, US2016/0376224 및 US2017/0119904에 기재되어 있으며, 모든 상기 문헌들의 내용은 그 전문이 본원에 참조로서 인용된다.
일부 구현예에서, PEG-지질은 US2018/0028664에 정의된 바와 같은 화합물이며, 상기 문헌의 내용은 그 전문이 본원에 참조로서 인용된다. 일부 구현예에서, PEG-지질은 US20150376115 또는US2016/0376224에 개시되어 있으며, 상기 문헌들의 내용은 그 전문이 본원에 참조로서 인용된다.
PEG-DAA 접합체는, 예를 들어 PEG-디라우릴옥시프로필, PEG-디미리스틸옥시프로필, PEG-디팔미틸옥시프로필 또는 PEG-디스테아릴옥시프로필일 수 있다. PEG-지질은 PEG-DMG, PEG-디라우릴글리세롤, PEG-디팔미토일글리세롤, PEG-디스테릴글리세롤, PEG-디라우릴글리카미드, PEG-디미리스틸글리카미드, PEG-디팔미토일글리카미드, PEG-디스테릴글리카미드, PEG-콜레스테롤(1-[8'-(콜레스트-5-엔-3[베타]-옥시)카르복사미도-3',6'-디옥사옥타닐]카르바모일-[오메가]-메틸-폴리(에틸렌 글리콜), PEG-DMB(3,4-디테트라데콕시벤질-[오메가]-메틸-폴리(에틸렌 글리콜)에테르) 및 1,2-디미리스토일-sn-글리세로-3-포스포에탄올아민-N-[메톡시(폴리에틸렌 글리콜)-2000] 중 하나 이상일 수 있다. 일부 예에서, PEG-지질은 PEG-DMG, 1,2-디미리스토일-sn-글리세로-3-포스포에탄올아민-N-[메톡시(폴리에틸렌 글리콜)-2000],
PEG 이외의 분자와 접합된 지질이 또한 PEG-지질 대신 사용될 수 있다. 예를 들어, 폴리옥사졸린(POZ)-지질 접합체, 폴리아미드-지질 접합체(예컨대, ATTA-지질 접합체) 및 양이온성 중합체-지질(CPL) 접합체가 PEG-지질 대신 또는 이에 더하여 사용될 수 있다. 예시적인 접합된 지질, 즉, PEG-지질, (POZ)-지질 접합체, ATTA-지질 접합체 및 양이온성 중합체-지질은, 국제 특허 출원 공보 WO1996/010392, WO1998/051278, WO2002/087541, WO2005/026372, WO2008/147438, WO2009/086558, WO2012/000104, WO2017/117528, WO2017/099823, WO2015/199952, WO2017/004143, WO2015/095346, WO2012/000104, WO2012/000104 및 WO2010/006282; 미국 특허 출원 공보 US2003/0077829, US2005/0175682, US2008/0020058, US2011/0117125, US2013/0303587, US2018/0028664, US2015/0376115, US2016/0376224, US2016/0317458, US2013/0303587, US2013/0303587 및 US20110123453; 및 US 특허 US5,885,613, US6,287,591, US6,320,017 및 US6,586,559에 기재되어 있으며, 상기 모든 문헌들의 내용은 그 전문이 본원에 참조로서 인용된다.
일부 구현예에서, 하나 이상의 추가 화합물은 치료제일 수 있다. 치료제는 치료 목적에 적합한 임의의 부류에서 선택될 수 있다. 다시 말해서, 치료제는 치료 목적에 적합한 임의의 부류에서 선택될 수 있다. 다시 말해서, 치료제는 치료 목적 및 목적하는 생물학적 작용에 따라 선택될 수 있다. 예를 들어, LNP 내 ceDNA가 PKU 치료에 유용한 경우, 추가 화합물은 항-PKU 작용제(예를 들어, 화학요법제 또는 다른 PKU 치료제(비제한적으로, 소분자 또는 항체를 포함함)일 수 있다. 또 다른 예에서, ceDNA를 함유하는 LNP이 감염의 치료에 유용한 경우, 추가 화합물은 항미생물제(예를 들어, 항생제 또는 항바이러스 화합물)일 수 있다. 또 다른 예에서, ceDNA를 함유하는 LNP이 면역 질환 또는 장애의 치료에 유용한 경우, 추가 화합물은 면역 반응을 조절하는 화합물(예를 들어, 면역억제제, 면역자극 화합물 또는 하나 이상의 특정 면역 경로를 조절하는 화합물)일 수 있다. 일부 구현예에서, 상이한 단백질 또는 상이한 화합물, 예컨대 치료제를 인코딩하는 ceDNA와 같은 상이한 화합물을 함유하는 상이한 지질 나노입자의 상이한 칵테일이, 본 발명의 조성물 및 방법에 사용될 수 있다.
일부 구현예에서, 추가 화합물은 면역 조절제이다. 예를 들어, 추가 화합물은 면역억제제이다. 일부 구현예에서, 추가 화합물은 면역자극제이다. 또한, 지질 나노입자 캡슐화된 곤충 세포에서 생산된 또는 합성적으로 생산된 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터와, 약학적으로 허용 가능한 담체 또는 희석제를 포함하는 약학적 조성물이 본원에 제공된다.
일부 양태에서, 본 개시내용은 하나 이상의 약학적 부형제를 추가로 포함하는 지질 나노입자 제형을 제공한다. 일부 구현예에서, 지질 나노입자 제형은 수크로오스, 트리스, 트레할로오스 및/또는 글리신을 추가로 포함한다.
ceDNA 벡터는 입자의 지질 부분과 복합체화되거나, 지질 나노입자의 지질 위치에서 캡슐화될 수 있다. 일부 구현예에서, ceDNA는 지질 나노입자의 지질 위치에서 완전히 캡슐화되어, 예를 들어 수용액에서 뉴클레아제에 의한 분해로부터 보호될 수 있다. 일부 구현예에서, 지질 나노입자 내 ceDNA는 지질 나노입자를 37℃에서 적어도 약 20분, 30분, 45분 또는 60분 동안 뉴클레아제에 노출시킨 후 실질적으로 분해되지 않는다. 일부 구현예에서, 지질 나노입자 내 ceDNA는 상기 입자를 혈청에서 37℃에서 적어도 약 30분, 45분 또는 60분, 또는 적어도 약 2시간, 3시간, 4시간, 5시간, 6시간, 7시간, 8시간, 9시간, 10시간, 12시간, 14시간, 16시간, 18시간, 20시간, 22시간, 24시간, 26시간, 28시간, 30시간, 32시간, 34시간 또는 36시간 동안 인큐베이션한 후 실질적으로 분해되지 않는다.
특정 구현예에서, 지질 나노입자는 대상, 예를 들어 인간과 같은 포유류에 실질적으로 비독성이다. 일부 양태에서, 지질 나노입자 제형은 동결건조된 분말이다.
일부 구현예에서, 지질 나노입자는 적어도 하나의 지질 이중층을 보유하는 고체 코어 입자이다. 다른 구현예에서, 지질 나노입자는 비(非)이중층 구조, 즉, 비(非)라멜라(즉, 비이중층) 형태를 갖는다. 비제한적으로, 비이중층 형태는, 예를 들어 3차원 튜브, 막대, 입방 대칭 등을 포함할 수 있다. 예를 들어, 지질 나노입자의 형태(라멜라 대 비라멜라)는, 예를 들어 US2010/0130588에 기재된 바와 같은 Cryo-TEM 분석을 사용하여 용이하게 평가 및 특징분석될 수 있으며, 상기 문헌의 내용은 그 전문이 본원에 참조로서 인용된다.
일부 추가의 구현예에서, 비라멜라 형태를 갖는 지질 나노입자는 전자 밀도가 높다. 일부 양태에서, 본 개시내용은 단일라멜라 또는 다중라멜라 구조의 지질 나노입자를 제공한다. 일부 양태에서, 본 개시내용은 다소포성 입자 및/또는 발포체 기반 입자를 포함하는 지질 나노입자 제형을 제공한다.
지질 구성요소의 조성 및 농도를 제어하는 방식으로, 지질 접합체가 지질 입자로부터 교환되는 속도, 및 결국, 지질 나노입자가 융합원성이 되는 속도를 제어할 수 있다. 또한, 예를 들어 pH, 온도 또는 이온 강도를 포함하는 다른 변수를 사용하여, 지질 나노입자가 융합원성이 되는 속도를 변화시키고/시키거나 제어할 수 있다. 지질 나노입자가 융합원성이 되는 속도를 제어하는 데 사용될 수 있는 다른 방법이, 본 개시내용을 기반으로 당업자에게 명백할 것이다. 지질 접합체의 조성 및 농도를 제어하여 지질 입자 크기를 제어할 수 있다는 것이 또한 명백할 것이다.
제형화된 양이온성 지질의 pKa는 핵산의 전달을 위한 LNP의 효과와 상관관계가 있을 수 있다(문헌[Jayaraman et al, Angewandte Chemie, International Edition (2012), 51(34), 8529-8533]; 문헌[Semple et al, Nature Biotechnology 28, 172-176 (2010)] 참조, 상기 문헌들은 모두 그 전문이 본원에 참조로서 인용됨). pKa의 바람직한 범위는 약 5 내지 약 7이다. 양이온성 지질의 pKa는 2-(p-톨루이디노)-6-나프탈렌 설폰산(TNS)의 형광을 기반으로 하는 검정을 사용하여 지질 나노입자에서 결정될 수 있다.
VIII. 사용 방법
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 또한 관심 뉴클레오타이드 서열(예를 들어, PAH 단백질을 인코딩함)을 표적세포(예를 들어, 숙주세포)로 전달하는 방법에 사용될 수 있다. 상기 방법은 특히 PAH 단백질을 이를 필요로 하는 대상의 세포에 전달하여 PKU를 치료하는 방법일 수 있다. 본 발명은 PAH 단백질 발현의 치료 효과가 발생하도록, 대상의 세포에서 ceDNA 벡터에 인코딩된 PAH 단백질의 생체내 발현을 가능하게 한다. 이러한 결과는 ceDNA 벡터 전달의 생체내시험관내 모델 모두에서 확인되었다.
또한, 본 발명은 PAH 단백질을 이를 필요로 하는 대상의 세포에 전달하는 방법으로서, 상기 PAH 단백질을 인코딩하는 본 발명의 ceDNA 벡터의 다회 투여를 포함하는 방법을 제공한다. 본 발명의 ceDNA 벡터는 캡시드화된 바이러스 벡터에 대해 통상적으로 관찰되는 바와 같은 면역반응을 유도하지 않기 때문에, 이러한 다회 투여 전략은 ceDNA 기반 시스템에서 큰 성공을 거둘 가능성이 높다. ceDNA 벡터는 목적하는 조직의 세포를 트랜스펙션시키고, 과도한 부작용 없이 충분한 수준의 유전자 전달 및 PAH 단백질의 발현을 제공하는 데 충분한 양으로 투여된다. 전형적인 및 약학적으로 허용 가능한 투여 경로에는, 비제한적으로, 망막 투여(예를 들어, 망막하 주사, 맥락막상 주사 또는 유리체내 주사), 정맥내(예를 들어, 리포좀 제형), 선택된 기관(예를 들어, 간, 신장, 담낭, 전립선, 부신, 심장, 장, 폐 및 위에서 선택되는 임의의 하나 이상의 조직)으로의 직접 전달, 근육내 및 다른 비경구 투여 경로가 포함된다. 투여 경로는, 목적하는 경우, 조합될 수 있다.
본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 전달은 발현된 PAH 단백질의 전달에 제한되지 않는다. 예를 들어, 본원에 기재된 바와 같이 통상적으로 생산된(예를 들어, 세포 기반 생산 방법(예를 들어, 곤충세포 생산 방법)을 사용하여) 또는 합성적으로 생산된 ceDNA 벡터는, 유전자 치료의 일부를 제공하기 위해 제공된 다른 전달 시스템과 함께 사용될 수 있다. 본 개시내용에 따른 ceDNA 벡터와 조합될 수 있는 시스템의 하나의 비제한적인 예에는, PAH 단백질을 발현하는 ceDNA 벡터의 효과적인 유전자 발현을 위한 하나 이상의 보조인자 또는 면역억제제를 별도로 전달하는 시스템이 포함된다.
본 발명은 또한 대상에서 PKU를 치료하는 방법으로서, 선택적으로 약학적으로 허용 가능한 담체를 포함하는 치료적 유효량의 ceDNA 벡터를, 대상의 이를 필요로 하는 표적세포(특히, 근육 세포 또는 조직)에 도입하는 것을 포함하는 방법을 제공한다. ceDNA 벡터는 담체의 존재 하에서 도입될 수 있지만, 이러한 담체는 필요하지 않다. 선택된 ceDNA 벡터는 PKU의 치료에 유용한 PAH 단백질을 인코딩하는 뉴클레오타이드 서열을 포함한다. 특히, ceDNA 벡터는, 대상에게 도입될 때, 외인성 DNA 서열에 의해 인코딩된 목적하는 PAH 단백질의 전사를 지시할 수 있는 제어 요소에 작동 가능하게 연결된 목적하는 PAH 단백질 서열을 포함할 수 있다. ceDNA 벡터는 상기 및 본원의 다른 곳에 제공된 임의의 적합한 경로를 통해 투여될 수 있다.
본원에 제공된 조성물 및 벡터는 다양한 목적을 위해 PAH 단백질을 전달하는 데 사용될 수 있다. 일부 구현예에서, 전이유전자는, 예를 들어 PAH 단백질 산물의 기능을 연구하기 위해, 예를 들어 전이유전자를 보유하는 체세포 유전자도입 동물 모델을 생성하기 위해, 연구 목적으로 사용되는 PAH 단백질을 인코딩한다. 또 다른 예에서, 전이유전자는 PKU의 동물 모델을 생성하는 데 사용되는 PAH 단백질을 인코딩한다. 일부 구현예에서, 인코딩된 PAH 단백질은 포유류 대상에서 PKU 상태의 치료 또는 예방에 유용하다. PAH 단백질은 유전자의 발현 감소, 발현 결여 또는 기능장애와 연관된 PKU를 치료하는 데 충분한 양으로 환자에게 전달(예를 들어, 환자에서 발현)될 수 있다.
원칙적으로, 발현 카세트는 돌연변이로 인해 존재하지 않거나 감소된 PAH 단백질을 인코딩하거나, 과발현될 때 치료적 유익을 전달하는 것이 본 개시내용의 범위에 속하는 것으로 간주되는 핵산 또는 임의의 전이유전자를 포함할 수 있다. 바람직하게는, 삽입되지 않은 박테리아 DNA는 존재하지 않으며, 바람직하게는 본원에 제공된 ceDNA 조성물에는 박테리아 DNA가 존재하지 않는다.
ceDNA 벡터는 한 종의 ceDNA 벡터에 제한되지 않는다. 이와 같이, 또 다른 양태에서, 상이한 단백질 또는 동일한 PAH 단백질을 발현하지만, 상이한 프로모터 또는 시스-조절 요소에 작동적으로 연결된 다수의 ceDNA 벡터는, 표적 세포, 조직, 기관 또는 대상에게 동시에 또는 순차적으로 전달될 수 있다. 따라서, 이러한 전략은 동시에 다수의 단백질의 유전자 치료 또는 유전자 전달을 가능하게 할 수 있다. PAH 단백질의 상이한 부분을, 동시에 또는 상이한 시간에 투여될 수 있으며 별도로 조절될 수 있는 별개의 ceDNA 벡터(예를 들어, PAH 단백질의 기능에 필요한 상이한 도메인 및/또는 보조인자)로 분리하는 것이 가능할 수 있으며, 이를 통해 PAH 단백질의 발현 제어에 추가적인 수준을 부가할 수 있다. 바이러스 캡시드의 부재로 인한 항캡시드 숙주 면역 반응의 결여를 고려할 때, 전달은 또한 중요하게는, 임상 설정에서 유전자 치료를 위해, 후속으로 용량을 증가시키거나 감소시키면서 다회 수행될 수 있다. 캡시드가 존재하지 않기 때문에 항-캡시드 반응이 일어나지 않을 것으로 예상된다.
본 발명은 또한 대상에서 PKU를 치료하는 방법으로서, 선택적으로 약학적으로 허용 가능한 담체를 포함하는 치료적 유효량의 본원에 개시된 바와 같은 ceDNA 벡터를, 대상의 이를 필요로 하는 표적세포(특히, 근육 세포 또는 조직)에 도입하는 것을 포함하는 방법을 제공한다. ceDNA 벡터는 담체의 존재 하에서 도입될 수 있지만, 이러한 담체는 필요하지 않다. 구현된 ceDNA 벡터는 PKU를 치료하는 데 유용한 관심 뉴클레오타이드 서열을 포함한다. 특히, ceDNA 벡터는, 대상에게 도입될 때, 외인성 DNA 서열에 의해 인코딩된 목적하는 폴리펩타이드, 단백질 또는 올리고뉴클레오타이드의 전사를 지시할 수 있는 제어 요소에 작동 가능하게 연결된 목적하는 외인성 DNA 서열을 포함할 수 있다. ceDNA 벡터는 상기 및 본원의 다른 곳에 제공된 임의의 적합한 경로를 통해 투여될 수 있다.
IX. PAH 단백질 생산을 위한 ceDNA 벡터의 전달 방법
일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 다양한 적합한 방법에 의해 시험관내 또는 생체내 표적세포에 전달될 수 있다. ceDNA 벡터만 적용되거나 주사될 수 있다. CeDNA 벡터는 트랜스펙션 시약 또는 다른 물리적 수단의 도움 없이 세포에 전달될 수 있다. 대안적으로, PAH 단백질의 발현을 위한 ceDNA 벡터는 DNA의 세포에의 진입을 용이하게 하는 임의의 업계 공지 트랜스펙션 시약 또는 다른 업계 공지 물리적 수단, 예를 들어 리포좀, 알코올, 폴리리신 풍부 화합물, 아르기닌 풍부 화합물, 인산칼슘, 미세소포, 미세주사, 전기천공 등을 사용하여 전달될 수 있다.
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, 통상적으로 다양한 전달 시약을 사용하여 통상적인 AAV 비리온으로 형질도입하기 곤란한 세포 및 조직 유형을 효율적으로 표적화할 수 있다.
본원에 기재된 기술의 하나의 양태는, PAH 단백질을 세포에 전달하는 방법에 관한 것이다. 전형적으로, 생체내시험관내 방법의 경우, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 본원에 개시된 바와 같은 방법뿐 아니라, 당업계에 공지된 다른 방법을 사용하여 세포에 도입될 수 있다. 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 바람직하게는 생물학적 유효량으로 세포에 투여된다. ceDNA 벡터가 생체내 세포(예를 들어, 대상)에 투여되는 경우, ceDNA 벡터의 생물학적 유효량은 표적세포에서 PAH 단백질의 형질도입 및 발현을 유도하는 데 충분한 양이다.
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 예시적인 투여 방식에는, 경구, 직장, 경점막, 비강내, 흡입(예를 들어, 에어로졸을 통해), 협측(예를 들어, 설하), 질, 경막내, 안구내, 경피, 내피내, 자궁내(또는 알내(in ovo)), 비경구(예를 들어, 정맥내, 피하, 피내, 두개내, 근육내[골격근, 횡격막근 및/또는 심장근에의 투여 포함], 흉막내, 뇌내 및 관절내)가 포함된다. 투여는 전신적으로 이루어지거나, 간 또는 다른 곳(예를 들어, 임의의 신장, 담낭, 전립선, 부신, 심장, 폐 및 위)으로 직접 전달될 수 있다.
투여는 국소(예를 들어, 기도 표면을 포함한 피부 및 점막 표면, 및 경피 투여), 림프내 등뿐 아니라, 직접적인 조직 또는 기관 주사(예를 들어, 비제한적으로, 간뿐 아니라, 눈, 골격근, 심장근, 횡격막근을 포함하는 근육, 또는 뇌)로 이루어질 수 있다.
ceDNA 벡터의 투여는, 비제한적으로, 간 및/또는 또한 눈, 뇌, 골격근, 평활근, 심장, 횡격막, 기도 상피, 신장, 비장, 췌장, 피부로 이루어지는 군에서 선택되는 부위를 포함하는 대상의 임의의 부위에 이루어질 수 있다.
임의의 주어진 경우에서 가장 적합한 경로는 치료, 개선 및/또는 예방하고자 하는 병태의 특성 및 중증도에 따라, 및 사용되는 특정 ceDNA 벡터의 특성에 따라 달라질 것이다. 또한, ceDNA는 하나 초과의 PAH 단백질을 단일 벡터 또는 다수의 ceDNA 벡터(예를 들어, ceDNA 칵테일)로 투여하는 것을 가능하게 한다.
A. ceDNA 벡터의 근육내 투여
일부 구현예에서, 대상에서 질환을 치료하는 방법은, 치료적 유효량의 PAH 단백질을 인코딩하는 ceDNA 벡터를 선택적으로 약학적으로 허용 가능한 담체와 함께, 대상의 이를 필요로 하는 표적세포(특히, 근육 세포 또는 조직)에 도입하는 것을 포함한다. 일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 대상의 근육 조직에 투여된다.
일부 구현예에서, ceDNA 벡터의 투여는, 비제한적으로, 골격근, 평활근, 심장, 횡격막 또는 눈의 근육으로 이루어지는 군에서 선택되는 부위를 포함하는 대상의 임의의 부위에 이루어질 수 있다.
본 발명에 따른 골격근에의 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 투여는, 비제한적으로, 사지(예를 들어, 상완(upper arm), 하완(lower arm), 상각(upper leg) 및/또는 하각(lower leg)), 등, 목, 머리(예를 들어, 혀), 흉곽, 복부, 골반/회음 및/또는 손(발)가락의 골격근에의 투여를 포함한다. 본원에 개시된 바와 같은 ceDNA 벡터는 정맥내 투여, 동맥내 투여, 복강내 투여, 사지 관류(선택적으로, 다리 및/또는 팔의 격리된 사지 관류; 예를 들어[Arruda et al., (2005) Blood 105: 3458-3464] 참조), 및/또는 직접 근육내 주사에 의해 골격근에 전달될 수 있다. 특정 구현예에서, 본원에 개시된 바와 같은 ceDNA 벡터는 사지 관류, 선택적으로 격리된 사지 관류에 의해(예를 들어, 정맥내 또는 관절내 투여에 의해), 대상(예를 들어, DMD와 같은 근디스트로피를 앓고 있는 대상)의 간, 눈, 사지(팔 및/또는 다리)에 투여된다. 구현예에서, 본원에 개시된 바와 같은 ceDNA 벡터는 "유체역학적" 기술을 이용하지 않고 투여될 수 있다.
예를 들어, 통상적인 바이러스 벡터의 (예를 들어, 망막으로의) 조직 전달은 종종 혈관구조의 압력을 증가시키고, 내피세포 장벽을 가로지르는 바이러스 벡터의 능력을 촉진시키는 유체역학적 기술(예를 들어, 대량의 정맥내/정맥내 투여)에 의해 증강된다. 특정 구현예에서, 본원에 기재된 ceDNA 벡터는 고용량 주입 및/또는 상승된 혈관내압(예를 들어, 정상 수축기압 초과, 예를 들어 정상 수축기압보다 혈관내압의 5%, 10%, 15%, 20%, 25% 이하의 증가)과 같은 유체역학적 기술의 부재 하에서 투여될 수 있다. 이러한 방법은 부종, 신경 손상 및/또는 구획 증후군과 같은 유체역학적 기술과 관련된 부작용을 감소시키거나 회피할 수 있다.
나아가, 골격근에 투여되는 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 포함하는 조성물은, 사지(예를 들어, 상완, 하완, 상각 및/또는 하각), 등, 목, 머리(예를 들어, 혀), 흉곽, 복부, 골반/회음 및/또는 손(발)가락의 골격근에 투여될 수 있다. 적합한 골격근에는, 비제한적으로, 새끼벌림근(손), 새끼벌림근(발), 엄지벌림근, 새끼중족골벌림근(abductor ossis metatarsi quinti), 짧은엄지벌림근, 긴엄지벌림근, 짧은모음근, 엄지모음근(adductor hallucis), 긴모음근, 큰모음근, 엄지모음근(adductor pollicis), 팔꿈치근, 목갈비근, 무릎관절근, 위팔두갈래근, 넙다리두갈래근, 상완근, 상완요골근, 협근, 부리위팔근, 눈썹주름근, 삼각근, 입꼬리내림근, 아래입술내림근, 이복근, 배측골간근(손), 배측골간근(발), 짧은노쪽손목폄근, 긴노쪽손목폄근, 자쪽손목폄근, 새끼폄근, 손가락폄근, 짧은발가락폄근, 긴발가락폄근, 짧은엄지폄근(extensor hallucis brevis), 긴엄지폄근(extensor hallucis longus), 집게폄근, 짧은엄지폄근(extensor pollicis brevis), 긴엄지폄근(extensor pollicis longus), 노쪽손목굽힘근, 자쪽손목굽힘근, 짧은새끼굽힘근(손), 짧은새끼굽힘근(발), 짧은발가락굽힘근, 긴발가락굽힘근, 깊은손가락굽힘근, 얕은손가락굽힘근, 짧은엄지굽힘근(flexor hallucis brevis), 긴엄지굽힘근(flexor hallucis longus), 짧은엄지굽힘근(flexor pollicis brevis), 긴엄지굽힘근(flexor pollicis longus), 전두근, 장딴지근, 턱끝목뿔근, 큰볼기근, 중간볼기근, 작은볼기근, 두덩정강근, 엉덩갈비근, 허리엉덩갈비근, 등엉덩갈비근, 엉덩근, 아래쌍동이근, 하사근, 하직근, 가시아래근, 가시사이근, 가시돌기사이근, 가쪽날개근, 가쪽곧은근, 넓은등근, 입꼬리올림근, 위입술올림근, 위입술콧방울올림근, 눈꺼풀올림근, 어깨올림근, 긴회전근, 머리가장긴근, 목가장긴근, 등가장긴근, 긴머리근, 긴목근, 충양근(손), 충양근(손), 깨물근, 안쪽날개근, 안쪽곧은근, 중사각근, 뭇갈래근, 턱목뿔근, 아래머리빗근, 위머리빗근, 바깥폐쇄근, 속폐쇄근, 후두근, 어깨목뿔근, 새끼맞섬근, 엄지맞섬근, 눈둘레근, 입둘레근, 배측골간근, 짧은손바닥근, 긴손바닥근, 두덩근, 큰가슴근, 작은가슴근, 짧은종아리근, 긴종아리근, 셋째종아리근, 궁둥구멍근, 척측골간근, 장딴지빗근, 넓은목근, 오금근, 뒤경추늑골근, 네모엎침근, 원엎침근, 큰허리근, 넙다리네모근, 발바닥네모근, 앞머리곧은근, 가쪽머리곧은근, 큰뒤머리곧은근, 작은뒤머리곧은근, 넙다리곧은근, 큰마름근, 작은마름근, 입꼬리당김근, 넙다리빗근, 최소목갈비근, 반막모양근, 반가시근, 목반가시근, 등반가시근, 반힘줄모양근, 앞톱니근, 짧은회전근, 가자미근, 머리가시근, 목가시근, 등가시근, 머리널판근, 목널판근, 흉쇄유돌근, 복장목뿔근, 복장방패근, 붓목뿔근, 빗장밑근, 어깨밑근, 위쌍동이근, 상사근, 상직근, 손뒤침근, 가시위근, 관자근, 넙다리근막긴장근, 큰원근, 작은원근, 흉부근, 갑상선골근, 앞정강근, 뒤정강근, 승모근, 위팔세갈래근, 중간넓은근, 가쪽넓은근, 안쪽넓은근, 큰광대근 및 작은광대근, 및 당업계에 공지된 임의의 다른 적합한 골격근이 포함된다.
횡격막근에의 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 투여는, 정맥내 투여, 동맥내 투여 및/또는 복강내 투여를 포함하는 임의의 적합한 방법에 의해 이루어질 수 있다. 일부 구현예에서, ceDNA 벡터로부터 발현된 전이유전자의 표적조직으로의 전달은 또한 ceDNA 벡터를 포함하는 합성 데포를 전달하는 방식(여기서 ceDNA 벡터를 포함하는 데포가 골격근, 평활근, 심장근 및/또는 횡격막근 조직에 이식됨)으로 달성될 수 있거나, 또는 근육조직을 본원에 기재된 바와 같은 ceDNA 벡터를 포함하는 필름 또는 다른 매트릭스와 접촉시킬 수 있다. 이러한 이식 가능한 매트릭스 또는 기재는 미국 특허 제7,201,898호(이는 그 전문이 본원에 참조로서 인용됨)에 기재되어 있다.
심장근에의 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 투여는, 좌심방, 우심방, 좌심실, 우심실 및/또는 격막에의 투여를 포함한다. 본원에 기재된 바와 같은 ceDNA 벡터는 정맥내 투여, 대동맥내 투여와 같은 동맥내 투여, 직접 심장 주사(예를 들어, 좌심방, 우심방, 좌심실, 우심실에) 및/또는 관상동맥 관류에 의해 심장근에 전달될 수 있다.
평활근에의 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 투여는, 정맥내 투여, 동맥내 투여 및/또는 복강내 투여를 포함하는 임의의 적합한 방법에 의해 이루어질 수 있다. 하나의 구현예에서, 투여는 평활근에, 근처에 및/또는 위에 존재하는 내피세포에 이루어질 수 있다. 평활근의 비제한적인 예에는, 눈의 홍채, 폐의 세기관지, 후두근(성대), 위의 근육층, 식도, 위장관의 소장 및 대장, 요관, 요도의 배뇨근, 자궁근층, 음경 또는 전립선이 포함된다.
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 골격근, 횡격막근 및/또는 심장근에 투여된다. 대표적인 구현예에서, 본 발명에 따른 ceDNA 벡터는 골격근, 심장근 및/또는 횡격막근의 장애를 치료 및/또는 예방하는 데 사용된다.
구체적으로, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 포함하는 조성물은, 눈근육(예를 들어, 외직근, 내직근, 상직근, 하직근, 상사근, 하사근), 얼굴근육(예를 들어, 뒤통수이마근, 관자마루근, 눈살근, 코근, 비중격내림근, 눈둘레근, 눈썹주름근, 눈썹내림근, 귓바퀴근, 입둘레근, 입꼬리내림근, 입꼬리당김근, 큰광대근, 작은광대근, 위입술올림근, 위입술콧방울올림근, 아래입술내림근, 입꼬리올림근, 협근, 턱끝근) 또는 혀근육(예를 들어, 이설근, 설골설근, 연골설근, 경상설근, 구개설근, 상종설근, 하종설근, 설수직근 및 설횡근) 중 하나 이상의 근육에 전달될 수 있다고 고려된다.
(i) 근육내 주사:
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 포함하는 조성물은, 바늘을 사용하여 대상의 주어진 근육, 예를 들어 골격근(예를 들어, 삼각근, 가쪽넓은근, 둔부의 복면근, 둔부의 배면근 또는 유아의 앞가쪽 허벅지)의 하나 이상의 부위에 주사될 수 있다. ceDNA를 포함하는 조성물은 다른 근육세포 아형에 도입될 수 있다. 근육세포 아형의 비제한적인 예에는, 골격근세포, 심장근세포, 평활근세포 및/또는 횡격막근세포가 포함된다.
근육내 주사 방법은 당업자에게 공지되어 있기 때문에 본원에 상세하게 기재되어 있지 않다. 하지만, 근육내 주사를 수행하는 경우, 환자의 연령 및 크기, 조성물의 점도뿐 아니라, 주사 부위를 기반으로 적절한 바늘 크기가 결정되어야 한다. 표 8은, 예시적인 주사 부위 및 상응하는 바늘 크기에 대한 지침을 제공한다:
Figure pct00026
특정 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 적은 부피로, 예를 들어 주어진 대상에 대하여 표 8에 개략된 바와 같은 예시적인 부피로 제형화된다. 일부 구현예에서, 대상은 목적하는 경우, 주사 전 전신 또는 국소 마취제를 투여받을 수 있다. 이는 특히, 다회 주사를 필요로 하거나, 상기 제시된 통상의 주사 부위보다 더 깊은 근육에 주사되는 경우 바람직하다.
일부 구현예에서, 근육내 주사는 ceDNA 벡터의 세포 흡수를 증강시키기 위해 전기천공, 전달 압력(delivery pressure) 또는 트랜스펙션 시약의 사용과 조합될 수 있다.
(ii) 트랜스펙션 시약
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 근관 또는 근육조직으로의 벡터의 흡수를 촉진시키기 위해 하나 이상의 트랜스펙션 시약을 포함하는 조성물로 제형화된다. 따라서, 하나의 구현예에서, 본원에 기재된 핵산은 본원의 다른 곳에 기재된 방법을 사용한 트랜스펙션을 통해 근육세포, 근관 또는 근육조직에 투여된다.
(iii) 전기천공
특정 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 ceDNA의 세포로의 진입을 촉진시키는 담체의 부재 하에서, 또는 생리학적으로 불활성인 약학적으로 허용 가능한 담체(즉, 캡시드 미함유 비바이러스성 벡터의 근관으로의 흡수를 개선시키거나 증강시키지 않는 임의의 담체)의 존재 하에서 투여된다. 이러한 구현예에서, 캡시드 미함유 비바이러스성 벡터의 흡수는 세포 또는 조직의 전기천공에 의해 촉진될 수 있다.
세포막은 자연적으로 세포질로의 세포외 통과에 저항한다. 이러한 저항을 일시적으로 감소시키는 하나의 방법은, 전기장을 사용하여 세포에 영구적인 손상을 야기하지 않으면서 세포에 공극을 형성하는 "전기천공"이다. 이러한 공극은 DNA 벡터, 약학적 약물, DNA 및 다른 극성 화합물이 세포의 내부에 접근할 수 있을 만큼 충분히 크다. 시간이 경과함에 따라, 세포막의 공극이 닫혀, 세포는 다시 불투과성이 된다.
전기천공은, 예를 들어 외인성 DNA를 살아있는 세포에 도입하기 위한 시험관내생체내 적용에 모두 사용될 수 있다. 시험관내 적용은 전형적으로 살아있는 세포의 샘플을, 예를 들어 DNA를 포함하는 조성물과 혼합한다. 이어서, 세포를 평행판과 같은 전극 사이에 배치하고, 세포/조성물 혼합물에 전기장을 인가한다.
다수의 생체내 전기천공 방법이 존재하며; 전극은, 예를 들어 처리하고자 하는 세포 영역 위에 놓인 표피를 잡는 캘리퍼와 같은 다양한 구성으로 제공될 수 있다. 대안적으로, 보다 깊은 곳에 위치한 세포에 접근하기 위해 바늘 모양 전극을 조직에 삽입할 수 있다. 어느 경우든, 예를 들어 핵산을 포함하는 조성물이 처리 영역에 주사되고, 전극이 해당 영역에 전기장을 인가한다. 일부 전기천공 적용에서, 이러한 전기장은 약 10 ms 내지 60 ms 지속기간 동안 100 V/cm 내지 500 V/cm 정도의 단일 구형파 펄스를 포함한다. 이러한 펄스는, 예를 들어 BTX Division of Genetronics, Inc에서 제조한 Electro Square Porator T820의 공지된 어플리케이션에서 생성될 수 있다.
전형적으로, 예를 들어 핵산의 성공적인 흡수는 근육이 즉시 전기적으로 자극되거나, 예를 들어 근육으로의 주사에 의해 조성물이 투여된 직후에만 일어난다.
특정 구현예에서, 전기천공은 전기장의 펄스를 사용하거나, 저전압/장펄스 치료 요법을 사용하여(예를 들어, 구형파 펄스 전기천공 시스템을 사용하여) 달성된다. 펄스 전기장을 생성할 수 있는 예시적인 펄스 생성기에는, 예를 들어 지수 파형을 생성할 수 있는 ECM600과 구형파 형태를 생성할 수 있는 ElectroSquarePorator(T820)(둘 모두 Genetronics, Inc(San Diego, Calif.)의 사업부인 BTX에서 입수 가능함)이 포함된다. 구형파 전기천공 시스템은 설정된 전압까지 빠르게 상승하고, 설정된 시간(펄스 길이) 동안 해당 수준을 유지한 후, 빠르게 0으로 떨어지는 제어된 전기 펄스를 전달한다.
일부 구현예에서, 본원에 기재된 바와 같은 캡시드 미함유 비바이러스성 벡터를 포함하는 조성물의 존재 하에서 조직의 전기천공과 관련이 있을 수 있는 통증을 감소시키기 위해, 예를 들어 국소 마취제가 치료 부위에 주사로 투여된다. 또한, 당업자는 근육의 섬유증, 괴사 또는 염증을 유발하는 과도한 조직 손상을 최소화 및/또는 방지하는 조성물의 용량을 선택해야 한다는 것을 이해할 것이다.
(iv) 전달 압력
일부 구현예에서, 근육 조직으로의 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 전달은, 대용량과 사지로 공급하는 동맥(예를 들어, 장골동맥)으로의 신속한 주사의 조합을 사용하는 전달 압력에 의해 촉진된다. 이러한 투여 방식은, 전형적으로 혈관 클램프의 지혈대를 사용하여 근육이 전신 순환으로부터 분리되는 동안, ceDNA 벡터를 포함하는 조성물을 사지 혈관계에 주입하는 것을 포함하는 다양한 방법을 통해 달성될 수 있다. 하나의 방법에서, 상기 조성물은 사지 혈관계를 통해 순환하여 세포로의 혈관외유출을 가능하게 한다. 또 다른 방법에서, 혈관내 유체역학적 압력을 증가시켜, 혈관층을 확장시키고, 근육 세포 또는 조직으로의 ceDNA 벡터의 흡수를 증가시킨다. 하나의 구현예에서, ceDNA 조성물은 동맥 내로 투여된다.
(v) 지질 나노입자 조성물
일부 구현예에서, 근육내 전달을 위한 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, 본원의 다른 곳에 기재된 바와 같은 리포좀을 포함하는 조성물로 제형화된다.
(vi) 근육 조직을 표적으로 하는 ceDNA 벡터의 전신 투여
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 간접 전달 투여를 통해 근육을 표적화하도록 제형화되며, 여기서 ceDNA는 간이 아니라 근육으로 수송된다. 따라서, 본원에 기재된 기술은, 예를 들어 전신 투여에 의한, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 포함하는 조성물의 근육 조직으로의 간접 투여를 포함한다. 이러한 조성물은 국소적으로, 정맥내로(볼루스 또는 연속 주입으로), 세포내 주사로, 조직내 주사로, 경구로, 흡입으로, 복강내로, 피하로, 공동내로 투여될 수 있으며, 목적하는 경우, 연동 수단을 통해, 또는 당업자에게 공지된 다른 수단을 통해 전달될 수 있다. 작용제는, 목적하는 경우, 예를 들어 정맥내 주입에 의해 전신으로 투여될 수 있다.
일부 구현예에서, 근육 세포/조직으로의 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 흡수는, 벡터를 근육 조직으로 우선적으로 지시하는 표적화 작용제 또는 모이어티를 사용하여 증가된다. 따라서, 일부 구현예에서, 캡시드 미함유 ceDNA 벡터는 신체의 다른 세포 또는 조직에 존재하는 캡시드 미함유 ceDNA 벡터의 양과 비교하여 근육 조직에 농축될 수 있다.
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 포함하는 조성물은 근육 세포에 대한 표적화 모이어티를 추가로 포함한다. 다른 구현예에서, 발현된 유전자 산물은 작용하고자 의도된 조직에 특이적인 표적화 모이어티를 포함한다. 표적화 모이어티는 세포 또는 조직의 세포내, 세포 표면 또는 세포외 바이오마커를 표적화하고, 이와 상호작용하고, 이와 커플링하고/하거나 이와 결합할 수 있는 임의의 분자 또는 분자의 복합체를 포함할 수 있다. 바이오마커는, 예를 들어 세포 프로테아제, 키나아제, 단백질, 세포 표면 수용체, 지질 및/또는 지방산을 포함할 수 있다. 표적화 모이어티가 표적화, 상호작용, 커플링 및/또는 결합할 수 있는 바이오마커의 다른 예에는, 특정 질환과 관련된 분자가 포함된다. 예를 들어, 바이오마커는 표피 성장 인자 수용체 및 트랜스페린 수용체와 같은 암 발달과 관련이 있는 세포 표면 수용체를 포함할 수 있다. 표적화 모이어티는, 비제한적으로, 표적 근육 조직에서 발현되는 분자에 결합하는, 합성 화합물, 천연 화합물 또는 산물, 거대분자 엔티티, 생명공학적으로 조작된 분자(예를 들어, 폴리펩타이드, 지질, 폴리뉴클레오타이드, 항체, 항체 단편) 및 작은 엔티티(예를 들어, 소분자, 신경전달물질, 기질, 리간드, 호르몬 및 원소 화합물)를 포함할 수 있다.
특정 구현예에서, 표적화 모이어티는, 예를 들어 표적세포의 특정 목적하는 분자를 자연적으로 인식하는 수용체를 포함하는 수용체 분자를 추가로 포함할 수 있다. 이러한 수용체 모이어티에는, 표적 분자와의 상호작용 특이성을 증가시키도록 변형된 수용체, 해당 수용체에 의해 자연적으로 인식되지 않는 목적하는 표적 분자와 상호작용하도록 변형된 수용체, 및 이러한 수용체의 단편이 포함된다(예를 들어, 문헌[Skerra, 2000, J. Molecular Recognition, 13:167-187] 참조). 바람직한 수용체는 케모카인 수용체이다. 예시적인 케모카인 수용체는, 예를 들어 문헌[Lapidot et al, 2002, Exp Hematol, 30:973-81] 및 문헌[Onuffer et al, 2002, Trends Pharmacol Sci, 23:459-67]에 기재되어 있다.
다른 구현예에서, 추가의 표적화 모이어티는, 예를 들어 트랜스페린(Tf) 리간드와 같은, 표적세포의 특정 목적하는 수용체를 자연적으로 인식하는 리간드를 포함하는 리간드 분자를 포함할 수 있다. 이러한 리간드 분자에는, 표적 수용체와의 상호작용 특이성을 증가시키도록 변형된 리간드, 해당 리간드에 의해 자연적으로 인식되지 않는 목적하는 수용체와 상호작용하도록 변형된 리간드, 및 이러한 리간드의 단편이 포함된다.
또 다른 구현예에서, 표적화 모이어티는 압타머를 포함할 수 있다. 압타머는 표적세포의 목적하는 분자 구조에 특이적으로 결합하도록 선택된 올리고뉴클레오타이드이다. 압타머는 전형적으로 파지 디스플레이의 친화성 선별과 유사한 친화성 선별 과정(시험관내 분자 진화로도 공지됨)의 산물이다. 이러한 과정은, 예를 들어 병든 면역원에 결합하는 고체 지지체를 사용한 후, 폴리머라아제 연쇄 반응(PCR)을 사용하여 면역원이 결합된 핵산을 증폭시키는 친화성 분리의 여러 차례 탠덤 반복을 수행하는 것을 포함한다. 따라서, 각 회차의 친화성 분리는 목적하는 면역원에 성공적으로 결합하는 분자의 핵산 집단을 풍부하게 한다. 이러한 방식으로, 핵산의 랜덤 풀은 표적 분자에 특이적으로 결합하는 압타머를 생성하도록 "교육"될 수 있다. 압타머는 전형적으로 RNA이지만, 비제한적으로, 펩타이드 핵산(PNA) 및 포스포로티오에이트 핵산과 같은 DNA 또는 이의 유사체 또는 유도체일 수 있다.
일부 구현예에서, 표적화 모이어티는, 예를 들어 캡시드 미함유 비바이러스성 벡터 또는 유전자 산물이 특정 조직을 표적화하도록 집속된 광선의 빔으로부터 방출되는 광분해성 리간드(즉, '케이징된(caged)' 리간드)를 포함할 수 있다.
상기 조성물이 대상의 하나 이상의 근육 내 여러 부위로 전달되는 것이 또한 고려된다. 즉, 주사는 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 적어도 50개, 적어도 55개, 적어도 60개, 적어도 65개, 적어도 70개, 적어도 75개, 적어도 80개, 적어도 85개, 적어도 90개, 적어도 95개, 적어도 100개의 주사 부위에 이루어질 수 있다. 이러한 부위는 단일 근육 영역에 퍼져 있을 수 있거나, 여러 근육에 분포되어 있을 수 있다.
B. 비근육 위치에의 PAH 단백질의 발현을 위한 ceDNA 벡터의 투여
또 다른 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 간에 투여된다. ceDNA 벡터는 또한 각막 및/또는 시신경과 같은 눈의 상이한 영역에 투여될 수 있다. ceDNA 벡터는 또한 척수, 뇌간(연수, 교뇌), 중뇌(시상하부, 시상, 시상상부, 뇌하수체, 흑색질, 송과체), 소뇌, 종뇌(선조체, 후두엽, 측두엽, 두정엽 및 전두엽을 포함하는 대뇌, 피질, 기저핵, 해마 및 편도체), 변연계, 신피질, 선조체, 대뇌 및 하구에 도입될 수 있다. ceDNA 벡터는 (예를 들어, 요추천자에 의해) 뇌척수액에 전달될 수 있다. PAH 단백질의 발현을 위한 ceDNA 벡터는 나아가 혈액-뇌 장벽이 교란된 상황(예를 들어, 뇌종양 또는 뇌경색)에서 CNS에 혈관내 투여될 수 있다.
일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는, 비제한적으로, 경막내, 안구내, 뇌내, 심실내, 정맥내(예를 들어, 만니톨과 같은 당의 존재 하에서), 비강내, 이내, 안구내(예를 들어, 유리체내, 망막하, 전방) 및 안구주위(예를 들어, 테논낭하(sub-Tenon's region)) 전달뿐 아니라, 운동 뉴런으로의 역행 전달을 통한 근육내 전달을 포함하는, 당업계에 공지된 임의의 경로를 통해 눈의 목적하는 영역(들)에 투여될 수 있다.
일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 직접 주사(예를 들어, 정위주사)를 통해 액체 제형으로 CNS 내 목적하는 영역 또는 구획에 투여된다. 다른 구현예에서, ceDNA 벡터는 목적하는 영역에의 국소 적용 또는 에어로졸 제형의 비강내 투여를 통해 제공될 수 있다. 눈에의 투여는 액체 방울의 국소 적용을 통해 이루어질 수 있다. 추가의 대안으로서, ceDNA 벡터는 고체 서방형 제형으로 투여될 수 있다(예를 들어, 미국 특허 제7,201,898호 참조). 추가의 구현예에서, ceDNA 벡터는 운동 뉴런과 관련된 질환 및 장애(예를 들어, 근위축성 측삭경화증(ALS); 척수성근위축(SMA) 등)를 치료, 개선 및/또는 예방하기 위한 역행 수송에 사용될 수 있다. 예를 들어, ceDNA 벡터는 뉴런으로 이동할 수 있는 근육 조직에 전달될 수 있다.
C. 생체외 치료
일부 구현예에서, 대상에서 세포가 제거되고, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터가 그 안에 도입된 후, 세포가 다시 대상에 배치된다. 생체외 치료를 위해 대상에서 세포를 제거한 후, 다시 대상에게 도입하는 방법은 당업계에 공지되어 있다(예를 들어, 미국 특허 제5,399,346호; 상기 문헌의 개시내용은 그 전문이 본원에 참조로서 인용됨). 대안적으로, ceDNA 벡터는 또 다른 대상의 세포, 배양된 세포 또는 임의의 다른 적합한 공급원의 세포에 도입되며, 세포는 이를 필요로 하는 대상에게 투여된다.
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터로 형질도입된 세포는 바람직하게는 약학적 담체와 조합으로 "치료적 유효량"으로 대상에게 투여된다. 당업자는, 일부 유익이 대상에게 제공되는 한, 치료 효과가 완전하거나 치유적일 필요가 없다는 것을 이해할 것이다.
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 시험관내, 생체외 또는 생체내 세포에서 생산되는 본원에 기재된 바와 같은 PAH 단백질(때때로 전이유전자 또는 이종 뉴클레오타이드 서열로 지칭됨)을 인코딩할 수 있다. 예를 들어, 본원에 논의된 바와 같은 치료 방법에서의 본원에 기재된 ceDNA 벡터의 사용과 대조적으로, 일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는, 예를 들어 항체 및 융합 단백질의 생산을 위해 배양된 세포 및 이러한 세포로부터 단리된 발현된 PAH 단백질에 도입될 수 있다. 일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 포함하는 배양된 세포는, 예를 들어 항체 또는 융합 단백질의 소규모 또는 대규모 생물제조(biomanufacturing)를 위한 세포 공급원으로서 작용하여, 항체 또는 융합 단백질의 상업적 생산을 위해 사용될 수 있다. 대안적인 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 소규모 생산뿐 아니라 상업적 대규모 PAH 단백질 생산을 포함하는 항체 또는 융합 단백질의 생체내 생산을 위해, 숙주 비인간 대상의 세포에 도입된다.
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 수의학적 및 의학적 적용 모두에 사용될 수 있다. 상기 기재된 바와 같은 생체외 유전자 전달 방법에 적합한 대상에는, 조류(예를 들어, 닭, 오리, 거위, 메추라기, 칠면조 및 꿩) 및 포유류(예를 들어, 인간, 소, 양, 염소, 말, 고양이, 개 및 토끼)가 모두 포함되며, 이 중 포유류가 바람직하다. 인간 대상이 가장 바람직하다. 인간 대상에는, 신생아, 유아, 청소년 및 성인이 포함된다.
D. 용량 범위
본원에 기재된 바와 같은 PAH 단백질을 인코딩하는 ceDNA 벡터를 포함하는 조성물의 유효량을 대상에게 투여하는 것을 포함하는 치료 방법이 본원에 제공된다. 당업자가 이해하는 바와 같이, "유효량"이라는 용어는, PKU의 치료를 위한 "치료적 유효량"으로 PAH 단백질의 발현을 유도하는, 투여된 ceDNA 조성물의 양을 나타낸다.
생체내 및/또는 시험관내 검정은 선택적으로 사용을 위한 최적 투여량 범위를 확인하는 것을 돕기 위해 이용될 수 있다. 제형에 이용되는 정확한 용량은 또한 투여 경로, 및 병태의 중증도에 따라 달라질 것이며, 당업자의 판단 및 각 대상의 상황에 따라 결정되어야 한다. 유효 용량은, 예를 들어 시험관내 또는 동물 모델 시험 시스템에서 유도된 용량 반응 곡선에서 추론될 수 있다.
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 목적하는 조직의 세포를 트랜스펙션시키고, 과도한 부작용 없이 충분한 수준의 유전자 전달 및 발현을 제공하는 데 충분한 양으로 투여된다. 통상적이고 약학적으로 허용 가능한 투여 경로에는, 비제한적으로, 선택된 기관에의 직접 전달(예를 들어, 간에의 문맥내 전달), 경구, 흡입(비강내 및 기관내 전달 포함), 안구내, 정맥내, 근육내, 피하, 피내, 종양내 및 다른 비경구 투여 경로와 같은 "투여" 섹션에 상기 기재된 것들이 포함된다. 투여 경로는, 목적하는 경우, 조합될 수 있다.
특정 "치료 효과"를 달성하는 데 필요한 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 양의 용량은, 비제한적으로, 핵산 투여 경로, 치료 효과를 달성하는 데 필요한 유전자 또는 RNA 발현 수준, 치료하고자 하는 특정 질환 또는 장애, 및 유전자(들), RNA 산물(들) 또는 생성되는 발현된 단백질(들)의 안정성을 포함하는 몇 가지 인자에 기반하여 달라질 것이다. 당업자는, 상기 언급된 인자뿐 아니라, 당업계에 널리 공지된 다른 인자를 기반으로, 특정 질환 또는 장애를 앓고 있는 환자를 치료하기 위한 ceDNA 벡터 용량 범위를 용이하게 결정할 수 있다.
투여 요법은 최적 치료 반응을 제공하도록 조정될 수 있다. 예를 들어, 올리고뉴클레오타이드는 반복적으로 투여될 수 있으며, 예를 들어 수회 용량이 매일 투여될 수 있거나, 용량이 치료 상황의 긴급성에 따라 지시된 바와 같이 비례적으로 감소될 수 있다. 당업자는 올리고뉴클레오타이드가 세포에 투여되는지 대상에 투여되는지에 관계없이, 대상 올리고뉴클레오타이드의 적절한 용량 및 투여 스케줄을 용이하게 결정할 수 있을 것이다.
"치료적 유효 용량"은 임상 시험을 통해 결정될 수 있는 비교적 넓은 범위에 속할 것이며, 특정 적용에 따라 달라질 것이다(신경세포는 매우 소량을 필요로 하지만, 전신 주사는 많은 양을 필요로 할 수 있음). 예를 들어, 인간 대상의 골격근 또는 심장근에의 직접 생체내 주사의 경우, 치료적 유효 용량은 약 1 μg 내지 100 g의 ceDNA 벡터 정도일 것이다. 엑소좀 또는 미세입자가 ceDNA 벡터를 전달하는 데 사용되는 경우, 치료적 유효 용량은 실험적으로 결정될 수 있지만, 1 μg 내지 약 100 g의 벡터를 전달할 것으로 예측된다. 나아가, 치료적 유효 용량은 질환의 하나 이상의 증상의 감소를 유도하지만, 유의한 표적외 또는 유의한 부작용을 초래하지 않는, 대상에게 영향을 미치는 데 충분한 양의 전이유전자를 발현시키는 ceDNA 벡터의 양이다. 하나의 구현예에서, "치료적 유효 용량"은 PKU 바이오마커의 발현의 통계적으로 유의하고 측정 가능한 변화 또는 주어진 질환 증상의 감소를 생성하는 데 충분한 발현된 PAH 단백질의 양이다. 이러한 유효량은 주어진 ceDNA 벡터 조성물에 대한 임상 시험 및 동물 연구에서 측정될 수 있다.
약학적으로 허용 가능한 부형제와 담체 용액의 제형은, 다양한 치료 요법에서 본원에 기재된 특정 조성물을 사용하는 적합한 투여 및 치료 요법의 개발과 마찬가지로, 당업자에게 널리 공지되어 있다.
시험관내 트랜스펙션의 경우, 세포(1x106개의 세포)에 전달되는 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 유효량은, 0.1 μg 내지 100 μg, 바람직하게는 1 μg 내지 20 μg, 더욱 바람직하게는 1 μg 내지 15 μg 또는 8 μg 내지 10 μg 정도의 ceDNA 벡터일 것이다. ceDNA 벡터가 클수록 더 높은 용량이 필요할 것이다. 엑소좀 또는 미세입자가 사용되는 경우, 효과적인 시험관내 용량은 실험적으로 결정될 수 있지만, 일반적으로 동일한 양의 ceDNA 벡터를 전달하도록 의도될 것이다.
PKU의 치료를 위해, 본원에 개시된 바와 같은 PAH 단백질을 발현시키는 ceDNA 벡터의 적절한 투여량은, 치료하고자 하는 질환의 특정 유형, PAH 단백질의 유형, PKU 질환의 중증도 및 경과, 이전 치료, 환자의 임상 이력 및 항체에 대한 반응, 및 주치의의 재량에 따라 달라질 것이다. PAH 단백질을 인코딩하는 ceDNA 벡터는 한 번에 또는 일련의 치료에 걸쳐 적합하게 투여된다. 비제한적으로, 다양한 시점에 걸친 단회 또는 다회 투여, 볼루스 투여, 및 펄스 주입을 포함하는 다양한 투약 스케쥴이 본원에서 고려된다.
질환의 유형 및 중증도에 따라, ceDNA 벡터는, 인코딩된 PAH 단백질이 약 0.3 mg/kg 내지 100 mg/kg(예를 들어, 15 mg/kg 내지 100 mg/kg, 또는 상기 범위 내 임의의 투여량)으로 발현되는 양으로, 1회 이상의 개별 투여 또는 연속 주입으로 투여된다. ceDNA 벡터의 하나의 전형적인 1일 투여량은, 상기 언급된 인자에 따라, 인코딩된 PAH 단백질을 약 15 mg/kg 내지 100 mg/kg 또는 그 이상의 범위로 발현시키는 데 충분한 양이다. ceDNA 벡터의 하나의 예시적인 용량은, 본원에 개시된 바와 같은 인코딩된 PAH 단백질을 약 10 mg/kg 내지 약 50 mg/kg의 범위로 발현시키는 데 충분한 양이다. 따라서, 인코딩된 PAH 단백질을 약 0.5 mg/kg, 1 mg/kg, 1.5 mg/kg, 2.0 mg/kg, 3 mg/kg, 4.0 mg/kg, 5 mg/kg, 10 mg/kg, 15 mg/kg, 20 mg/kg, 25 mg/kg, 30 mg/kg, 35 mg/kg, 40 mg/kg, 50 mg/kg, 60 mg/kg, 70 mg/kg, 80 mg/kg, 90 mg/kg 또는 100 mg/kg(또는 이들의 임의의 조합)으로 발현시키는 데 충분한 양으로의 ceDNA 벡터의 1회 이상의 용량이 환자에게 투여될 수 있다. 일부 구현예에서, ceDNA 벡터는 인코딩된 PAH 단백질을 50 mg 내지 2500 mg 범위의 총 용량으로 발현시키는 데 충분한 양이다. ceDNA 벡터의 예시적인 용량은, 인코딩된 PAH 단백질을 총 약 50 mg, 약 100 mg, 200 mg, 300 mg, 400 mg, 약 500 mg, 약 600 mg, 약 700 mg, 약 720 mg, 약 1000 mg, 약 1050 mg, 약 1100 mg, 약 1200 mg, 약 1300 mg, 약 1400 mg, 약 1500 mg, 약 1600 mg, 약 1700 mg, 약 1800 mg, 약 1900 mg, 약 2000 mg, 약 2050 mg, 약 2100 mg, 약 2200 mg, 약 2300 mg, 약 2400 mg 또는 약 2500 mg(또는 이들의 임의의 조합)으로 발현시키는 데 충분한 양이다. ceDNA 벡터로부터 PAH 단백질의 발현이 본원의 조절 스위치, 또는 대안적으로 대상에게 투여된 ceDNA 벡터의 다회 용량에 의해 조심스럽게 제어될 수 있기 때문에, ceDNA 벡터로부터 PAH 단백질의 발현은, 발현된 PAH 단백질의 용량이 간헐적으로, 예를 들어 ceDNA 벡터로부터 매주, 2주마다, 3주마다, 4주마다, 매월, 2개월마다, 3개월마다 또는 6개월마다 투여될 수 있는 방식으로 제어될 수 있다. 이러한 요법의 진행은 통상적인 기술 및 검정으로 모니터링될 수 있다.
특정 구현예에서, ceDNA 벡터는 인코딩된 PAH 단백질을 15 mg/kg, 30 mg/kg, 40 mg/kg, 45 mg/kg, 50 mg/kg, 60 mg/kg의 용량, 또는 고정 용량, 예를 들어 300 mg, 500 mg, 700 mg, 800 mg 또는 그 이상으로 발현시키는 데 충분한 양으로 투여된다. 일부 구현예에서, ceDNA 벡터로부터 PAH 단백질의 발현은, PAH 단백질이 일정 기간 동안 매일, 2일마다, 매주, 2주마다 또는 4주마다 발현되도록 제어된다. 일부 구현예에서, ceDNA 벡터로부터 PAH 단백질의 발현은, PAH 단백질이 일정 기간 동안 2주마다 또는 4주마다 발현되도록 제어된다. 특정 구현예에서, 일정 기간은 6개월, 1년, 18개월, 2년, 5년, 10년, 15년, 20년 또는 환자의 일생이다.
치료는 단회 투여 또는 다회 투여를 포함할 수 있다. 일부 구현예에서, 1회 초과의 용량이 대상에게 투여될 수 있으며; ceDNA 벡터는 바이러스 캡시드의 부재로 인해 항캡시드 숙주 면역 반응을 일으키지 않기 때문에, 사실 필요한 경우 다회 용량이 투여될 수 있다. 이와 같이, 당업자는 적절한 용량의 횟수를 용이하게 결정할 수 있다. 투여되는 용량의 횟수는, 예를 들어 1회 내지 100회, 바람직하게는 2회 내지 20회 용량 정도일 수 있다.
임의의 특정 이론에 구애됨 없이, 본 개시내용에 기재된 바와 같은 ceDNA 벡터의 투여에 의해 유발된 전형적인 항바이러스 면역 반응의 결여는(즉, 캡시드 구성요소의 부재)는, PAH 단백질의 발현을 위한 ceDNA 벡터가 숙주에 여러 차례 투여되는 것을 가능하게 한다. 일부 구현예에서, 이종 핵산이 대상에게 전달되는 경우의 횟수는, 2회 내지 10회 범위(예를 들어, 2회, 3회, 4회, 5회, 6회, 7회, 8회, 9회 또는 10회)이다. 일부 구현예에서, ceDNA 벡터는 대상에게 10회 초과로 전달된다.
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 용량은 대상에게 달력일(calendar day)(예를 들어, 24시간 기간)당 1회 이하로 투여된다. 일부 구현예에서, ceDNA 벡터의 용량은 대상에게 2달력일, 3달력일, 4달력일, 5달력일, 6달력일 또는 7달력일당 1회 이하로 투여된다. 일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 용량은 대상에게 달력주(calendar week)(예를 들어, 7달력일)당 1회 이하로 투여된다. 일부 구현예에서, ceDNA 벡터의 용량은 대상에게 2주에 1회(예를 들어, 2달력주 기간 중 1회) 이하로 투여된다. 일부 구현예에서, ceDNA 벡터의 용량은 대상에게 달력달(calendar month)당 1회(예를 들어, 30달력일 중 1회) 이하로 투여된다. 일부 구현예에서, ceDNA 벡터의 용량은 대상에게 6달력달당 1회 이하로 투여된다. 일부 구현예에서, ceDNA 벡터의 용량은 대상에게 달력년(예를 들어, 365일 또는 윤년의 경우 366일)당 1회 이하로 투여된다.
특정 구현예에서, 다양한 간격의 기간, 예를 들어 매일, 매주, 매월, 매년 등에 걸쳐 목적하는 수준의 유전자 발현을 달성하기 위해, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 1회 초과의 투여(예를 들어, 2회, 3회, 4회 또는 그 이상의 투여)가 이용될 수 있다.
일부 구현예에서, 본원에 개시된 바와 같은 ceDNA 벡터에 의해 인코딩된 치료용 PAH 단백질은, 이것이 대상에서 적어도 1시간, 적어도 2시간, 적어도 5시간, 적어도 10시간, 적어도 12시간, 적어도 18시간, 적어도 24시간, 적어도 36시간, 적어도 48시간, 적어도 72시간, 적어도 1주, 적어도 2주, 적어도 1개월, 적어도 2개월, 적어도 6개월, 적어도 12개월/1년, 적어도 2년, 적어도 5년, 적어도 10년, 적어도 15년, 적어도 20년, 적어도 30년, 적어도 40년, 적어도 50년 또는 그 이상 동안 대상에서 발현되도록, 조절 스위치, 유도성 또는 억제성 프로모터에 의해 제어될 수 있다. 하나의 구현예에서, 발현은 선결된 또는 목적하는 간격으로 본원에 기재된 ceDNA 벡터를 반복 투여하는 방식으로 달성될 수 있다. 대안적으로, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, 질환의 실질적으로 영구적인 치료 또는 "치유"를 위해, PAH 단백질을 인코딩하는 하나 이상의 핵산 서열의 삽입을 가능하게 하는 유전자 편집 시스템의 구성요소(예를 들어, CRISPR/Cas, TALEN, 아연 핑거 엔도뉴클레아제 등)를 추가로 포함할 수 있다. 유전자 편집 구성요소를 포함하는 이러한 ceDNA 벡터는 국제 출원 PCT/US18/64242에 개시되어 있으며, PAH 단백질을 인코딩하는 핵산을 알부민 유전자 또는 CCR5 유전자를 포함하지 않는 세이프 하버 영역에 삽입하기 위해, 5' 및 3' 상동성 아암(예를 들어, 서열번호 151 내지 154, 또는 이와 적어도 40%, 50%, 60%, 70% 또는 80%의 상동성을 갖는 서열)을 포함할 수 있다. 예로서, PAH 단백질을 발현하는 ceDNA 벡터는, 2019년 3월 1일자 출원된 국제 특허 출원 PCT/US2019/020225(이는 그 전문이 본원에 참조로서 인용됨)에 개시되어 있는, PAH 전이유전자의 게놈 세이프 하버에의 삽입을 위한 적어도 하나의 게놈 세이프 하버(GSH) 특이적 상동성 아암을 포함할 수 있다.
치료 지속기간은 대상의 임상 진행과 치료에 대한 반응성에 따라 달라진다. 초기의 높은 치료 용량 후, 지속적이고 상대적으로 낮은 유지 용량이 고려된다.
E. 단위 투여 형태
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 포함하는 약학적 조성물은 편리하게 단위 투여 형태로 존재할 수 있다. 단위 투여 형태는 전형적으로 약학적 조성물의 하나 이상의 특정 투여 경로에 맞게 조정될 수 있다. 일부 구현예에서, 단위 투여 형태는 눈에 직접 투여되는 점적액으로 조정된다. 일부 구현예에서, 단위 투여 형태는 흡입에 의한 투여에 맞게 조정된다. 일부 구현예에서, 단위 투여 형태는 기화기에 의한 투여에 맞게 조정된다. 일부 구현예에서, 단위 투여 형태는 분무기에 의한 투여에 맞게 조정된다. 일부 구현예에서, 단위 투여 형태는 에어로졸 생성기에 의한 투여에 맞게 조정된다. 일부 구현예에서, 단위 투여 형태는 경구 투여, 협측 투여 또는 설하 투여에 맞게 조정된다. 일부 구현예에서, 단위 투여 형태는 정맥내, 근육내 또는 피하 투여에 맞게 조정된다. 일부 구현예에서, 단위 투여 형태는 망막하 주사, 맥락막상 주사 또는 유리체내 주사에 맞게 조정된다.
일부 구현예에서, 단위 투여 형태는 경막내 또는 뇌실내 투여에 맞게 조정된다. 일부 구현예에서, 약학적 조성물은 국소 투여용으로 제형화된다. 단일 투여 형태를 생성하기 위해 담체 물질과 조합될 수 있는 활성 성분의 양은, 일반적으로 치료 효과를 생성하는 화합물의 양일 수 있다.
X. 치료 방법
본원에 기재된 기술은 또한 상기 개시된 PAH 단백질의 발현을 위한 ceDNA 벡터를 제조하는 방법뿐 아니라, 예를 들어 생체외, 현장외, 시험관내 생체내 적용, 방법론, 진단 절차 및/또는 유전자 치료 요법을 포함하는 다양한 방식으로 사용하는 방법을 나타낸다.
하나의 구현예에서, 본원에 개시된 바와 같은 ceDNA 벡터로부터 발현된 치료용 PAH 단백질은 질환의 치료에 기능성이 있다. 바람직한 구현예에서, 치료용 PAH 단백질은, 목적하지 않는 경우, 면역계 반응을 야기하지 않는다.
대상에서 PKU를 치료하는 방법으로서, 치료적 유효량의 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를, 선택적으로 약학적으로 허용 가능한 담체와 함께, 대상의 이를 필요로 하는 표적세포(예를 들어, 근육 세포 또는 조직, 다른 병든 세포 유형)에 도입하는 것을 포함하는 방법이 본원에 제공된다. ceDNA 벡터는 담체의 존재 하에서 도입될 수 있지만, 이러한 담체는 필요하지 않다. 구현된 ceDNA 벡터는 질환을 치료하는 데 유용한 본원에 기재된 바와 같은 PAH 단백질을 인코딩하는 뉴클레오타이드 서열을 포함한다. 특히, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, 대상에게 도입될 때, 외인성 DNA 서열에 의해 인코딩된 목적하는 PAH 단백질의 전사를 지시할 수 있는 제어 요소에 작동 가능하게 연결된 목적하는 PAH 단백질 DNA 서열을 포함할 수 있다. 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 상기 및 본원의 다른 곳에 제공된 임의의 적합한 경로를 통해 투여될 수 있다.
하나 이상의 본 발명의 ceDNA 벡터를, 하나 이상의 약학적으로 허용 가능한 완충제, 희석제 또는 부형제와 함께 포함하는, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터 조성물 및 제형이 본원에 개시된다. 이러한 조성물은 PKU의 하나 이상의 증상을 진단, 예방, 치료 또는 개선시키기 위한, 하나 이상의 진단용 또는 치료용 키트에 포함될 수 있다. 하나의 양태에서, 질환, 손상, 장애, 외상 또는 기능장애는 인간의 질환, 손상, 장애, 외상 또는 기능장애이다.
본원에 기재된 기술의 또 다른 양태는, 진단적 또는 치료적 유효량의 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 이를 필요로 하는 대상에게 제공하는 방법으로서, 본원에 개시된 바와 같은 ceDNA 벡터의 양을 이를 필요로 하는 대상의 세포, 조직 또는 기관에; ceDNA 벡터로부터 PAH 단백질의 발현을 가능하게 하는 데 효과적인 시간 동안 제공하여, 대상에게 ceDNA 벡터에 의해 발현되는 진단적 또는 치료적 유효량의 PAH 단백질을 제공하는 것을 포함하는 방법을 제공한다. 추가의 양태에서, 대상은 인간이다.
본원에 기재된 기술의 또 다른 양태는, 대상에서 PKU, 장애, 기능장애, 손상, 비정상적인 병태 또는 외상의 적어도 하나 이상의 증상을 진단, 예방, 치료 또는 개선하는 방법을 제공한다. 전반적이고 일반적인 의미에서, 상기 방법은 적어도, 하나 이상의 상기 개시된 PAH 단백질 생산을 위한 ceDNA 벡터를, 이를 필요로 하는 대상에게, 대상에서 질환, 장애, 기능장애, 손상, 비정상적인 병태 또는 외상의 하나 이상의 증상을 진단, 예방, 치료 또는 개선하는 데 충분한 양으로 충분한 시간 동안 투여하는 단계를 적어도 포함한다. 이러한 구현예에서, 대상은 PAH 단백질의 효능, 또는 대안적으로, 대상 내 PAH 단백질 또는 PAH 단백질의 조직 위치(세포 및 세포하 위치 포함) 검출을 위해 평가될 수 있다. 이와 같이, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, 예를 들어 암 또는 다른 적응증의 검출을 위한 생체내 진단 도구로서 사용될 수 있다. 추가의 양태에서, 대상은 인간이다.
또 다른 양태는, PKU 또는 질환 상태의 하나 이상의 증상을 치료하거나 감소시키는 도구로서의 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 용도이다. 결함이 있는 유전자가 공지된 다수의 유전병이 존재하며, 이는 전형적으로 2개의 부류로 분류된다: 일반적으로 열성 방식으로 유전되는 효소의 결핍 상태, 및 조절 또는 구조 단백질이 관여할 수 있으며, 전형적으로 우성 방식으로 유전되지만, 항상 우성 방식으로 유전되는 것은 아닌 불균형 상태. 불균형 질환 상태의 경우, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 모델 시스템에서 PKU 상태를 생성하기 위해 사용될 수 있으며, 이는 질환 상태에 대응하기 위한 노력으로 사용될 수 있다. 따라서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 유전 질환의 치료를 가능하게 한다. 본원에 사용된 PKU 상태는, 질환을 유발하거나 이를 더 중증으로 만드는 결핍 또는 불균형을 부분적으로 또는 전체적으로 개선하는 방식으로 치료된다.
A. 숙주세포
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 PAH 단백질 전이유전자를 대상 숙주세포로 전달한다. 일부 구현예에서, 상기 세포는 광수용체 세포이다. 일부 구현예에서, 상기 세포는 RPE 세포이다. 일부 구현예에서, 대상 숙주세포는, 예를 들어 혈액세포, 줄기세포, 조혈세포, CD34+ 세포, 간세포, 암세포, 혈관세포, 근육세포, 췌장세포, 신경세포, 안구 또는 망막 세포, 상피 또는 내피 세포, 수지상세포, 섬유아세포를 포함하는 인간 숙주세포, 또는 비제한적으로, 간의(hepatic)(즉, 간) 세포, 폐세포, 심장세포, 췌장세포, 장세포, 횡격막세포, 신장의(renal)(즉, 신장) 세포, 신경세포, 혈액세포, 골수세포, 또는 유전자 치료가 고려되는 대상의 임의의 하나 이상의 선택된 조직세포를 포함하는 포유류 기원의 임의의 다른 세포이다. 하나의 양태에서, 대상 숙주세포는 인간 숙주세포이다.
본 개시내용은 또한 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 포함하는, 상기 언급된 바와 같은 재조합 숙주세포에 관한 것이다. 따라서, 당업자에게 자명한 바와 같이 목적에 따라 다양한 숙주세포를 사용할 수 있다. 공여체 서열을 포함하는 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 구조체 또는 ceDNA 벡터는, 공여체 서열이 이전에 기재된 바와 같이 염색체 통합체로 유지되도록 숙주세포에 도입된다. 숙주세포라는 용어는, 복제 동안 발생하는 돌연변이로 인해 모세포와 동일하지 않은 모세포의 임의의 자손을 포함한다. 숙주세포의 선택은 공여체 서열 및 이의 공급원에 따라 크게 달라질 수 있다.
숙주세포는 또한 포유류, 곤충, 식물 또는 진균 세포와 같은 진핵생물일 수 있다. 하나의 구현예에서, 숙주세포는 인간 세포(예를 들어, 1차세포, 줄기세포 또는 불멸화된 세포주)이다. 일부 구현예에서, 숙주세포에 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터가 생체외로 투여되고, 숙주세포가 유전자 치료 후 대상에게 전달될 수 있다. 숙주세포는 임의의 세포 유형, 예를 들어 체세포 또는 줄기세포, 유도된 다능성 줄기세포 또는 혈액세포, 예를 들어 T세포 또는 B세포, 또는 골수세포일 수 있다. 특정 구현예에서, 숙주세포는 동종이계 세포이다. 예를 들어, T세포 게놈 조작은 암 면역요법, HIV 요법(예를 들어, CXCR4 및 CCR5와 같은 수용체 녹아웃)과 같은 질환 조절 및 면역결핍 치료에 유용하다. B세포의 MHC 수용체는 면역요법의 표적이 될 수 있다. 일부 구현예에서, 유전자 변형된 숙주세포, 예를 들어 골수 줄기세포, 예를 들어 CD34+ 세포 또는 유도된 다능성 줄기세포는, 치료용 단백질의 발현을 위해 환자에게 다시 이식될 수 있다.
B. 유전자 치료를 위한 추가의 질환
일반적으로, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 대상에서의 이상 단백질 발현 또는 유전자 발현과 관련된 PKU와 연관된 증상을 치료, 예방 또는 개선시키기 위해 상기 설명에 따른 임의의 PAH 단백질을 전달하는 데 사용될 수 있다.
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, PKU를 치료, 개선 및/또는 예방하기 위해, 혈액 내 분비 및 순환, 또는 다른 조직으로의 전신 전달을 위한 PAH 단백질의 생산을 위해, PAH 단백질을 골격근, 심장근 또는 횡격막근으로 전달하는 데 사용될 수 있다.
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 임의의 적합한 수단에 의해, 선택적으로 대상이 흡입하는 ceDNA 벡터를 포함하는 호흡 가능한 입자의 에어로졸 현탁액을 투여하는 방식으로 대상의 폐에 투여될 수 있다. 호흡 가능한 입자는 액체 또는 고체일 수 있다. ceDNA 벡터를 포함하는 액체 입자의 에어로졸은 당업자에게 공지된 바와 같은 압력 구동 에어로졸 분무기 또는 초음파 분무기와 같은 임의의 적합한 수단에 의해 생성될 수 있다. 예를 들어, 미국 특허 제4,501,729호 참조. ceDNA 벡터를 포함하는 고체 입자의 에어로졸은 마찬가지로 약학 분야에 공지된 기술에 의해 임의의 고체 미립자 약제 에어로졸 생성기를 이용하여 생성될 수 있다.
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 CNS의 조직(예를 들어, 뇌, 눈)에 투여될 수 있다.
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터로 치료, 개선 또는 예방될 수 있는 안구 장애에는, 망막, 후방로 및/또는 시신경과 관련된 안과적 장애(예를 들어, 색소성망막염, 당뇨망막병증 및 다른 망막변성질환, 포도막염, 연령관련 황반변성, 녹내장)가 포함된다. 다수의 안과적 질환 및 장애는 (1) 혈관형성, (2) 염증, 및 (3) 변성의 3가지 유형의 징후 중 하나 이상과 연관이 있다. 일부 구현예에서, 본원에 개시된 바와 같은 ceDNA 벡터는 항혈관형성 인자; 항염증 인자; 세포 변성을 지연시키거나, 세포 감축을 촉진시키거나, 세포 성장을 촉진시키는 인자, 및 이들의 조합을 전달하는 데 이용될 수 있다. 예를 들어, 당뇨망막병증은 혈관형성을 특징으로 한다. 당뇨망막병증은 하나 이상의 항혈관형성 항체 또는 융합 단백질을 안구내로(예를 들어, 유리체에) 또는 안구주위로(예를 들어, 테논낭하에) 전달하는 방식으로 치료될 수 있다. 본 발명의 ceDNA 벡터로 치료, 개선 또는 예방될 수 있는 추가의 안구 질환에는, 지도형위축, 혈관 또는 "습윤형" 황반변성, PKU, 레베르 선천성 흑암시(LCA), 어셔증후군, 탄성섬유가황색종(PXE), x연관 색소성망막염(XLRP), x연관 망막층간분리(XLRS), 범맥락막위축, 레베르 유전성 시신경병증(LHON), 완전색맹, 추체-간체 디스트로피, 푹스각막내피이상증, 당뇨병성 황반부종, 및 안구의 암 및 종양이 포함된다.
일부 구현예에서, 염증성 안구 질환 또는 장애(예를 들어, 포도막염)가 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터에 의해 치료, 개선 또는 예방될 수 있다. 하나 이상의 항염증 항체 또는 융합 단백질은 본원에 개시된 바와 같은 ceDNA 벡터의 안구내(예를 들어, 유리체 또는 전방) 투여에 의해 발현될 수 있다.
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 리포터 폴리펩타이드(예를 들어, 녹색 형광 단백질 또는 알칼리성 포스파타아제와 같은 효소)를 인코딩하는 전이유전자와 관련이 있는 PAH 단백질을 인코딩할 수 있다. 일부 구현예에서, 실험 또는 진단 목적에 유용한 리포터 단백질을 인코딩하는 전이유전자는, β-락타마아제, β-갈락토시다아제(LacZ), 알칼리성 포스파타아제, 티미딘 키나아제, 녹색 형광 단백질(GFP), 클로람페니콜 아세틸트랜스퍼라아제(CAT), 루시퍼라아제 및 당업계에 널리 공지된 다른 것들 중 임의의 것에서 선택된다. 일부 양태에서, 리포터 폴리펩타이드에 연결된 PAH 단백질을 발현하는 ceDNA 벡터는 진단 목적으로 사용될 수 있을 뿐 아니라, 효율을 측정하기 위해, 또는 이것이 투여되는 대상에서 ceDNA 벡터 활성의 마커로서 사용될 수 있다.
C. ceDNA 벡터를 사용한 성공적인 유전자 발현 시험
ceDNA 벡터에 의한 PAH 단백질의 유전자 전달 효율을 시험하는 데 당업계에 널리 공지된 검정이 사용될 수 있으며, 이는 시험관내생체내 모델로 수행될 수 있다. ceDNA에 의한 PAH 단백질의 발현 수준은 PAH 단백질의 mRNA 및 단백질 수준을 측정하는 방식(예를 들어, 역전사 PCR, 웨스턴 블롯 분석 및 효소 결합 면역흡착 검정(ELISA))으로 당업자에 의해 평가될 수 있다. 하나의 구현예에서, ceDNA는, 예를 들어 형광 현미경 또는 발광 플레이트 판독기로 리포터 단백질의 발현을 평가하는 방식으로 PAH 단백질의 발현을 평가하는 데 사용될 수 있는 리포터 단백질을 포함한다. 생체내 적용의 경우, 유전자 발현이 성공적으로 일어나는 지 여부를 결정하기 위해 주어진 PAH 단백질의 기능을 시험하는 단백질 기능 검정이 사용될 수 있다. 당업자는 시험관내 또는 생체내에서 ceDNA 벡터에 의해 발현되는 PAH 단백질의 기능을 측정하는 최상의 시험을 결정할 수 있다.
세포 또는 대상에서 ceDNA 벡터로부터의 PAH 단백질의 유전자 발현 효과는 적어도 1개월, 적어도 2개월, 적어도 3개월, 적어도 4개월, 적어도 5개월, 적어도 6개월, 적어도 10개월, 적어도 12개월, 적어도 18개월, 적어도 2년, 적어도 5년, 적어도 10년, 적어도 20년 동안 지속될 수 있거나, 영구적일 수 있다고 본원에서 고려된다.
일부 구현예에서, 본원에 기재된 발현 카세트, 발현 구조체 또는 ceDNA 벡터 내 PAH 단백질은 숙주세포에 대해 코돈 최적화될 수 있다. 본원에 사용된 "코돈 최적화된" 또는 "코돈 최적화"라는 용어는, 관심 척추동물, 예를 들어 마우스 또는 인간(예를 들어, 인간화)의 세포에서 발현 증강을 위해 핵산 서열을 변경하는 과정으로서, 천연 서열(예를 들어, 원핵생물 서열) 중 적어도 하나, 하나 초과 또는 유의한 수의 코돈을, 해당 척추동물의 유전자에서 보다 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 대체하는 과정을 나타낸다. 다양한 종은 특정 아미노산의 특정 코돈에 대해 특정 편향을 나타낸다. 전형적으로, 코돈 최적화는 원래 번역된 단백질의 아미노산 서열을 변경시키지 않는다. 최적화된 코돈은, 예를 들어 Aptagen's Gene Forge® 코돈 최적화 및 맞춤형 유전자 합성 플랫폼(Aptagen, Inc.), 또는 또 다른 공개적으로 이용 가능한 데이터베이스를 사용하여 결정될 수 있다.
D. ceDNA 벡터로부터의 PAH 단백질 발현 평가를 통한 효능 결정
본질적으로, 단백질 발현을 결정하는 당업계에 공지된 임의의 방법이 ceDNA 벡터로부터 PAH 단백질의 발현을 분석하는 데 사용될 수 있다. 이러한 방법/검정의 비제한적인 예에는, 효소 결합 면역검정(ELISA), 친화성 ELISA, ELISPOT, 연속 희석, 유세포분석, 표면 플라즈몬 공명 분석, 역학적 배제 검정, 질량분석, 웨스턴 블롯, 면역침강 및 PCR이 포함된다.
생체내에서 PAH 단백질 발현을 평가하는 경우, 분석을 위해 대상에서 생물학적 샘플을 얻을 수 있다. 예시적인 생물학적 샘플에는, 생체유체 샘플, 체액 샘플, 혈액(전혈 포함), 혈청, 혈장, 소변, 타액, 생검 및/또는 조직 샘플 등이 포함된다. 생물학적 샘플 또는 조직 샘플은 또한, 비제한적으로, 종양 생검, 대변, 척수액, 흉막액, 유두 흡인물, 림프액, 피부, 호흡기, 장 및 비뇨생식기의 외부 부분, 눈물, 타액, 모유, 세포(비제한적으로, 혈액 세포 포함), 종양, 기관을 포함하는 개체로부터 단리된 조직 또는 체액의 샘플, 및 또한 시험관내 세포 배양 구성성분의 샘플을 나타낼 수 있다. 상기 용어는 또한 상기 언급된 샘플의 혼합물을 포함한다. "샘플"이라는 용어는 또한 미처리된 또는 전처리된(또는 사전 가공된) 생물학적 샘플을 포함한다. 일부 구현예에서, 본원에 기재된 검정 및 방법에 사용되는 샘플은 시험하고자 하는 대상에서 채취된 혈청 샘플을 포함한다.
E. 임상 매개변수에 의한 발현된 PAH 단백질의 효능 결정
PKU에 대한 ceDNA 벡터에 의해 발현되는 주어진 PAH 단백질의 효능(즉, 기능적 발현)은 숙련된 임상의에 의해 결정될 수 있다. 하지만, PKU의 징후 또는 증상 중 어느 하나 또는 전부가 유익한 방식으로 변경되거나, 다른 임상적으로 허용되는 질환의 증상 또는 마커가, 예를 들어 본원에 기재된 바와 같은 치료용 PAH 단백질을 인코딩하는 ceDNA 벡터로의 치료 후 적어도 10% 정도 호전되거나 개선되는 경우, 치료는 본원에 사용된 용어로 "유효한 치료"로 간주된다. 효능은 또한 PKU의 안정화 또는 의학적 개입의 필요성에 의해 평가되는 바와 같이 개체의 악화 실패로 측정될 수 있다(즉, 질환의 진행이 중단되거나 적어도 느려짐). 이러한 지표의 측정 방법은 당업자에게 공지되어 있고/있거나 본원에 기재되어 있다. 치료는 개체 또는 동물(일부 비제한적인 예에는, 인간 또는 포유류가 포함됨)에서의 질환의 임의의 치료를 포함하며, 이에는 (1) PKU를 저해하는 것, 예를 들어 PKU의 진행을 중단시키거나 느리게 하는 것; 또는 (2) PKU를 완화시키는 것, 예를 들어 PKU 증상의 퇴행을 유발하는 것; 및 (3) PKU 질환의 발달 가능성을 예방하거나 감소시키는 것, 또는 PKU와 관련된 2차 질환/장애를 예방하는 것을 포함한다. 질환의 치료를 위한 유효량은, 이를 필요로 하는 포유류에게 투여되는 경우, 해당 질환에 대한 유효한 치료(이러한 용어는 본원에 정의된 바와 같음)를 유도하는 데 충분한 양을 의미한다. 작용제의 효능은 PKU 질환에 대해 특정한 물리적 지표를 평가하는 방식으로 결정될 수 있다. 의사는, PKU의 임상 증상 중 임의의 하나 이상을 평가할 수 있다: **(i) 일반 식단에서 감소된 혈청 페닐알라닌(Phe) 수준. Phe의 감소는 PKU의 치료제 개발에서 핵심 바이오마커이다; (ii) 일반 식단에서 회복된 Phe 대 티로신 대사 비율. 이러한 경로는 신경전달물질의 생산을 담당한다; 및/또는 (iii) 감소된 혈청 Phe 수준의 평가.
XI. 항체 또는 융합 단백질을 발현하는 ceDNA 벡터의 다양한 적용
본원에 개시된 바와 같이, 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 조성물 및 ceDNA 벡터는 다양한 목적을 위해 PAH 단백질을 발현시키는 데 사용될 수 있다. 하나의 구현예에서, PAH 단백질을 발현하는 ceDNA 벡터는, 예를 들어 PKU의 기능 또는 진행을 연구하기 위해, 전이유전자를 보유하는 체세포 유전자도입 동물 모델을 생성하는 데 사용될 수 있다. 일부 구현예에서, PAH 단백질을 발현하는 ceDNA 벡터는 포유류 대상에서 PKU 상태 또는 장애의 치료, 예방 또는 개선에 유용하다.
일부 구현예에서, PAH 단백질은 증가된 발현, 유전자 산물의 증가된 활성 또는 유전자의 부적절한 상향조절과 연관된 질환을 치료하는 데 충분한 양으로 대상에서 ceDNA 벡터로부터 발현될 수 있다.
일부 구현예에서, PAH 단백질은 단백질의 감소된 발현, 발현의 결여 또는 기능이상과 연관된 PKU를 치료하는 데 충분한 양으로 대상에서 ceDNA 벡터로부터 발현될 수 있다.
당업자는, 전이유전자가 그 자체로 전사되는 유전자의 오픈리딩프레임이 아니라; 대신 표적 유전자의 프로모터 영역 또는 억제인자 영역일 수 있으며, ceDNA 벡터가 그러한 영역을 변형시킴에 따라 PAH 유전자의 발현을 조절하는 결과를 얻을 수 있다는 것을 이해할 것이다.
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 조성물 및 ceDNA 벡터는 상기 기재된 바와 같은 다양한 목적을 위해 PAH 단백질을 전달하는 데 사용될 수 있다.
일부 구현예에서, 전이유전자는 포유류 대상에서 PKU 상태의 치료, 개선 또는 예방에 유용한 하나 이상의 PAH 단백질을 인코딩한다. ceDNA 벡터에 의해 발현되는 PAH 단백질은 비정상 유전자 서열과 연관된 PKU를 치료하는 데 충분한 양으로 환자에게 투여되어, 하기 중 임의의 하나 이상을 결과로 얻을 수 있다: 증가된 단백질 발현, 단백질의 과잉 활성, 표적 유전자 또는 단백질의 감소된 발현, 발현 결여 또는 기능이상.
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, PAH 단백질이 세포 배양 시스템, 또는 대안적으로 유전자도입 동물 모델에서 일시적으로 또는 안정적으로 발현되는, 진단 및 스크리닝 방법에서의 사용이 고려된다.
본원에 기재된 기술의 또 다른 양태는 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터로 포유류 세포 집단을 형질도입시키는 방법을 제공한다. 전반적이고 일반적인 의미에서, 상기 방법은 적어도, 집단의 하나 이상의 세포에, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터 중 하나 이상의 유효량을 포함하는 조성물을 도입하는 단계를 포함한다.
또한, 본 발명은 하나 이상의 추가 성분과 함께 제형화되거나, 이의 사용을 위한 하나 이상의 설명서와 함께 준비된, 하나 이상의 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터 또는 ceDNA 조성물을 포함하는 조성물뿐 아니라, 치료용 및/또는 진단용 키트를 제공한다.
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터가 투여되는 세포는, 비제한적으로, 신경세포(말초 및 중추 신경계의 세포, 특히 뇌세포 포함), 폐세포, 망막세포, 내피세포(예를 들어, 장 및 호흡기 상피세포), 근육세포, 수지상세포, 췌장세포(섬세포 포함), 간세포, 심근세포, 골세포(예를 들어, 골수줄기세포), 조혈줄기세포, 비장세포, 각질세포, 섬유아세포, 내피세포, 전립선세포, 생식세포 등을 포함하는 임의의 유형일 수 있다. 대안적으로, 세포는 임의의 전구세포일 수 있다. 추가의 대안으로서, 세포는 줄기세포(예를 들어, 신경줄기세포, 간줄기세포)일 수 있다. 또 다른 추가의 대안으로서, 세포는 암 또는 종양 세포일 수 있다. 나아가, 세포는 상기 제시된 바와 같은 임의의 종에서 유래할 수 있다.
A. PAH를 발현하는 ceDNA 벡터의 생산 및 정제
본원에 개시된 ceDNA 벡터는 시험관내 또는 생체내에서 PAH 단백질을 생산하는 데 사용되게 된다. 이러한 방식으로 생산된 PAH 단백질은 연구 또는 치료적 치료제로서의 추가 사용을 위해 단리되고, 목적하는 기능에 대해 시험되고, 정제될 수 있다. 단백질 생산의 각 시스템에는 고유한 이점/단점이 있다. 시험관내에서 생산된 단백질은 용이하게 정제될 수 있고 단시간에 단백질이 될 수 있지만, 생체내에서 생산된 단백질은 글리코실화와 같은 번역 후 변형을 거칠 수 있다.
ceDNA 벡터를 사용하여 생산된 PAH 치료 단백질은 당업자에게 공지된 임의의 방법, 예를 들어 이온 교환 크로마토그래피, 친화성 크로마토그래피, 침전 또는 전기영동을 사용하여 정제될 수 있다.
본원에 기재된 방법 및 조성물로 생산된 PAH 치료 단백질은 목적하는 표적 단백질에의 결합에 대해 시험될 수 있다.
실시예
하기 실시예는 제한이 아닌 예시로서 제공된다. 당업자는, ceDNA 벡터가 본원에 기재된 야생형 또는 변형된 ITR 중 임의의 것으로부터 구축될 수 있으며, 하기 예시적인 방법을 사용하여 이러한 ceDNA 벡터를 구축하고 이의 활성을 평가할 수 있다는 것을 이해할 것이다. 방법이 특정 ceDNA 벡터를 이용하는 것으로 예시되어 있지만, 설명에 따라 임의의 ceDNA 벡터에 적용할 수 있다.
실시예 1: 곤충 세포 기반 방법을 사용한 ceDNA 벡터의 구축
폴리뉴클레오타이드 구조체 주형을 사용한 ceDNA 벡터의 생산은 PCT/US18/49996(이는 그 전문이 본원에 참조로서 인용됨)의 실시예 1에 기재되어 있다. 예를 들어, 본 발명의 ceDNA 벡터를 생성하는 데 사용되는 폴리뉴클레오타이드 구조체 주형은 ceDNA-플라스미드, ceDNA-박미드 및/또는 ceDNA-바큐로바이러스일 수 있다. 이론에 제한됨 없이, 허용 숙주세포에서, 예를 들어 Rep의 존재 하에서, 2개의 대칭인 ITR과 발현 구조체를 갖는 폴리뉴클레오타이드 구조체 주형(여기서, ITR 중 적어도 하나는 야생형 ITR 서열에 대해 변형됨)을 복제하여 ceDNA 벡터를 생산한다. ceDNA 벡터 생산은 다음과 같은 2단계를 거친다: 첫 번째로, Rep 단백질을 통한 주형 백본(예를 들어, ceDNA-플라스미드, ceDNA-박미드, ceDNA-바큐로바이러스 게놈 등)으로부터의 주형의 절제("회수") 단계, 및 두 번째로, 절제된 ceDNA 벡터의 Rep 매개 복제 단계.
ceDNA 벡터를 생산하는 예시적인 방법은, 본원에 기재된 바와 같은 ceDNA-플라스미드에서 시작하는 방법이다. 도 1a 도 1b를 참조하면, 각각의 ceDNA-플라스미드의 폴리뉴클레오타이드 구조체 주형은 좌측 변형된 ITR과 우측 변형된 ITR을 포함하고, 상기 ITR 서열 사이에 다음을 갖는다: (i) 인핸서/프로모터; (ii) 전이유전자의 클로닝 부위; (iii) 전사 후 반응 요소(예를 들어, 우드척 간염바이러스 전사 후 조절 요소(WPRE)); 및 (iv) 폴리아데닐화 신호(예를 들어, 소 성장호르몬 유전자(BGHpA) 유래). 구조체의 특정 부위에 새로운 유전 구성요소의 도입을 용이하게 하기 위해, 고유한 제한 엔도뉴클레아제 인식 부위(R1 내지 R6)(도 1a도 1b에 제시됨)를 또한 각 구성요소 사이에 도입하였다. R3(PmeI) GTTTAAAC(서열번호 123) 및 R4(PacI) TTAATTAA(서열번호 124) 효소 부위를 클로닝 부위로 조작하여, 전이유전자의 오픈리딩프레임을 도입하였다. 이러한 서열을 ThermoFisher Scientific에서 입수한 pFastBac HT B 플라스미드에 클로닝하였다.
ceDNA-박미드의 생산:
DH10Bac 적격세포(MAX EFFICIENCY® DH10Bac™ Competent Cells, Thermo Fisher)를 제조업체의 설명서에 따른 프로토콜에 따라 시험 또는 대조군 플라스미드로 형질전환시켰다. DH10Bac 세포에서 플라스미드와 바큐로바이러스 셔틀 벡터 사이의 재조합을 유도하여, 재조합 ceDNA-박미드를 생성하였다. 박미드와 트랜스포사아제 플라스미드의 형질전환체 및 유지를 위해 선택한 항생제와 함께 X-gal 및 IPTG를 함유하는 박테리아 한천 플레이트 상에서, 대장균(E. coli)에서의 청백색 스크리닝을 기반으로 하는 양성 선별을 스크리닝하여 재조합 박미드를 선별하였다(Φ80dlacZΔM15 마커는 박미드 벡터로부터의 β-갈락토시다아제 유전자의 α-상보성을 제공함). β-갈락토시드 지표 유전자를 파괴하는 전위에 의해 야기된 백색 집락을 선별하고, 10 ml 배지에서 배양하였다.
재조합 ceDNA-박미드를 대장균에서 단리하고, FugeneHD를 사용하여 Sf9 또는 Sf21 곤충 세포에 트랜스펙션시켜, 감염성 바큐로바이러스를 생산하였다. 부착성 Sf9 또는 Sf21 곤충 세포를 25℃에서 T25 플라스크 내 50 ml 배지에서 배양하였다. 4일 후, 배양 배지(P0 바이러스 함유)에서 세포를 꺼내고, 0.45 μm 필터를 통해 여과하여, 세포 또는 세포 잔해물로부터 감염성 바큐로바이러스 입자를 분리하였다.
선택적으로, 50 ml 내지 500 ml 배지에서 나이브(naive) Sf9 또는 Sf21 곤충 세포를 감염시켜 제1세대 바큐로바이러스(P0)를 증폭시켰다. 세포의 직경이 18 nm 내지 19 nm(본래 직경 14 nm 내지 15 nm), 밀도가 약 4.0E+6개의 세포/mL에 도달할 때까지, 세포 직경 및 생존율을 모니터링하면서, 25℃에서 130 rpm으로 오비탈 진탕기 인큐베이터에서 현탁 배양으로 세포를 유지시켰다. 감염 후 3일 내지 8일 사이에, 원심분리한 후 배지 중 P1 바큐로바이러스 입자를 수집하여 세포와 잔해물을 제거하고, 0.45 μm 필터를 통해 여과하였다.
시험 구조체를 포함하는 ceDNA-바큐로바이러스를 수집하고, 바큐로바이러스의 감염 활성 또는 역가를 측정하였다. 구체적으로, 4개 x 20 ml Sf9 세포 배양물(2.5E+6개의 세포/ml)을 1/1000, 1/10,000, 1/50,000, 1/100,000로 희석된 P1 바큐로바이러스로 처리하고, 25℃ 내지 27℃에서 인큐베이션하였다. 4일 내지 5일 동안 매일 세포 직경 증가율과 세포주기 정지율, 및 세포 생존율의 변화로 감염성을 측정하였다.
PCT/US18/49996(이는 그 전문이 본원에 참조로서 인용됨)의 도 8a에 개시된 바와 같은 "Rep-플라스미드"를, Rep78(서열번호 131 또는 133)과 Rep52(서열번호 132) 또는 Rep68(서열번호 130)과 Rep40(서열번호 129)을 포함하는 pFASTBACTM-이중 발현 벡터(ThermoFisher)에서 생산하였다. Rep-플라스미드를 제조업체가 제공한 프로토콜에 따라 DH10Bac 적격세포(MAX EFFICIENCY® DH10Bac™ Competent Cells)(Thermo Fisher)로 형질전환시켰다. DH10Bac 세포에서 Rep-플라스미드와 바큐로바이러스 셔틀 벡터 사이의 재조합을 유도하여, 재조합 박미드("Rep-박미드")를 생성하였다. X-gal 및 IPTG를 함유하는 박테리아 한천 플레이트 상에서 대장균에서의 청백색 스크리닝을 포함하는 양성 선별을 통해 재조합 박미드를 선별하였다(Φ80dlacZΔM15 마커는 박미드 벡터로부터의 β-갈락토시다아제 유전자의 α-상보성을 제공함). 단리된 백색 집락을 선별하고, 10 ml의 선택된 배지(LB 브로쓰 중의 카나마이신, 겐타마이신, 테트라시클린)에 접종하였다. 재조합 박미드(Rep-박미드)를 대장균에서 단리하고, Rep-박미드를 Sf9 또는 Sf21 곤충 세포에 트랜스펙션시켜, 감염성 바큐로바이러스를 생산하였다.
Sf9 또는 Sf21 곤충 세포를 50 ml 배지에서 4일 동안 배양하고, 감염성 재조합 바큐로바이러스("Rep-바큐로바이러스")를 배양물에서 단리하였다. 선택적으로, 나이브 Sf9 또는 Sf21 곤충 세포를 감염시켜 제1세대 바큐로바이러스(P0)를 증폭시키고, 50 ml 내지 500 ml 배지에서 배양하였다. 감염 후 3일 내지 8일 사이에, 원심분리 또는 여과 또는 또 다른 분별 과정을 통해 세포를 분리하여, 배지 내 P1 바큐로바이러스 입자를 수집하였다. Rep-바큐로바이러스를 수집하고, 바큐로바이러스의 감염 활성을 측정하였다. 구체적으로, 4개 x 20 mL Sf9 세포 배양물(2.5x106개의 세포/mL)을 1/1000, 1/10,000, 1/50,000, 1/100,000로 희석된 P1 바큐로바이러스로 처리하고, 인큐베이션하였다. 4일 내지 5일 동안 매일 세포 직경 증가율과 세포주기 정지율, 및 세포 생존율의 변화로 감염성을 측정하였다.
ceDNA 벡터 생성 및 특징분석
도 4b를 참조하여, (1) ceDNA-박미드 또는 ceDNA-바큐로바이러스를 함유하는 샘플, 및 (2) 상기 기재된 Rep-바큐로바이러스를 함유하는 Sf9 곤충 세포 배양 배지를, 각각, 1:1000 및 1:10,000의 비로, Sf9 세포의 새로운 배양물(2.5E+6개의 세포/ml, 20 ml)에 첨가하였다. 이어서, 세포를 25℃에서 130 rpm으로 배양하였다. 공동 감염 4일 내지 5일 후, 세포 직경과 생존율을 검출하였다. 세포 직경이 18 nm 내지 20 nm에 도달하고, 생존율이 약 70% 내지 80%에 도달하면, 세포 배양물을 원심분리하고, 배지를 제거하고, 세포 펠릿을 수집하였다. 세포 펠릿을 먼저 적절한 부피의 물 또는 완충액인 수성 배지에 재현탁시켰다. Qiagen MIDI PLUS™ 정제 프로토콜(Qiagen, 컬럼당 처리되는 세포 펠릿 질량 0.2 mg)을 사용하여, 세포에서 ceDNA 벡터를 단리하고 정제하였다.
Sf9 곤충 세포에서 생산되고 정제된 ceDNA 벡터의 수율을 초기에 260 nm에서의 UV 흡광도를 기반으로 측정하였다.
ceDNA 벡터는 도 4d에 예시된 미변성 또는 변성 조건 하에서 아가로오스 겔 전기영동으로 확인하여 평가할 수 있으며, 여기서 (a) 제한 엔도뉴클레아제 절단 및 겔 전기영동 분석 후 미변성 겔에 비해 변성 겔에서 2배 크기로 이동하는 특징적인 밴드의 존재, 및 (b) 절단되지 않은 물질의 경우 미변성 겔에서 단량체 및 이량체(2x) 밴드의 존재가, ceDNA 벡터 존재의 특징이다.
공동 감염된 Sf9 세포(본원에 기재된 바와 같음)에서 수득된 DNA를, a) ceDNA 벡터 내 오로지 단일 절단 부위만 존재, 및 b) 0.8% 변성 아가로오스 겔 상에서 분별 시 명확하게 확인할 수 있을 만큼 큰 생성된 단편(>800 bp)에 대해 선별된 제한 엔도뉴클레아제로 소화시켜, 단리된 ceDNA 벡터의 구조를 추가로 분석하였다. 도 4d 도 4e에 예시된 바와 같이, 비연속 구조를 갖는 선형 DNA 벡터와 선형 및 연속 구조를 갖는 ceDNA 벡터를 이의 반응 생성물의 크기로 구별할 수 있다: 예를 들어 비연속 구조를 갖는 DNA 벡터는 1 kb 및 2 kb 단편을 생성할 것으로 예상되고, 연속 구조를 갖는 비캡시드화된 벡터는 2 kb 및 4 kb 단편을 생성할 것으로 예상된다.
따라서, 단리된 ceDNA 벡터가 정의에 따라 공유결합으로 폐쇄되어 있다는 것을 정성적으로 입증하기 위해, 샘플을 단일 제한 부위를 갖는 특정 DNA 벡터 서열의 맥락에서 확인된 제한 엔도뉴클레아제로 소화시켜, 바람직하게는 동일하지 않은 크기의 2개의 절단 산물(예를 들어, 1000 bp 및 2000 bp)을 수득하였다. 소화 및 변성 겔 상에서의 전기영동(이는 2개의 상보적 DNA 가닥을 분리함) 후, 선형의 비공유결합으로 폐쇄된 DNA는 1000 bp 및 2000 bp의 크기로 분리될 것이지만, 공유결합으로 폐쇄된 DNA(즉, ceDNA 벡터)는 2개의 DNA 가닥이 연결되고 언폴딩되어 (단일가닥이지만) 길이가 2배가 됨으로써, 2배 크기(2000 bp 및 4000 bp)로 분리될 것이다. 나아가, 단량체, 이량체 및 n량체 형태의 DNA 벡터의 소화는 모두 다량체 DNA 벡터의 말단 대 말단 연결로 인해 동일한 크기의 단편으로 분리될 것이다(도 4d 참조).
본원에 사용된 "미변성 겔 및 변성 조건 하에서 아가로오스 겔 전기영동에 의한 DNA 벡터의 식별을 위한 검정"이라는 구절은, 제한 엔도뉴클레아제 소화, 이어서 소화 산물의 전기영동을 수행하는 방식으로 ceDNA의 폐쇄형 말단을 평가하는 검정을 나타낸다. 하나의 이러한 예시적인 검정이 하기에 이어지지만, 당업자는 이러한 예에 대한 다수의 업계 공지 변형이 가능하다는 것을 이해할 것이다. 제한 엔도뉴클레아제는 DNA 벡터 길이의 대략 1/3x 및 2/3x인 산물을 생성하게 되는 관심 ceDNA 벡터에 대한 단일 절단 효소인 것으로 선택된다. 이는, 미변성 및 변성 겔 모두에 대한 밴드를 분리한다. 변성 전, 샘플에서 완충액을 제거하는 것이 중요하다. Qiagen PCR 클린업 키트(clean-up kit) 또는 탈염 "스핀 컬럼", 예를 들어 GE HEALTHCARE ILUSTRA™ MICROSPIN™ G-25 컬럼이 엔도뉴클레아제 소화에 대한 일부 업계 공지 옵션이다. 상기 검정은, 예를 들어 i) 적절한 제한 엔도뉴클레아제(들)를 이용하여 DNA를 소화시키는 단계, ii) 예를 들어 Qiagen PCR 클린업 키트에 적용하고, 증류수로 용리하는 단계, iii) 10x 변성 용액(10x = 0.5 M NaOH, 10 mM EDTA)을 첨가하고, 완충되지 않은 10X 염료를 첨가하고, NaOH 농도가 겔과 겔 박스에서 균일하도록 보장하기 위해 1 mM EDTA 및 200 mM NaOH와 함께 이전에 인큐베이션한 0.8% 내지 1.0% 겔 상에 10X 변성 용액을 4배로 첨가하여 제조된 DNA ladder와 함께 분석하고, 1x 변성 용액(50 mM NaOH, 1 mM EDTA)의 존재 하에서 겔에서 전개시키는 단계를 포함한다. 당업자는, 크기 및 목적하는 결과 타이밍을 기반으로 전기영동을 수행하는 데 어떤 전압을 사용해야 하는 지를 이해할 것이다. 전기영동 후, 겔을 배수하고, 1x TBE 또는 TAE에서 중화시키고, 1x SYBR Gold을 함유한 1x TBE/TAE 또는 증류수로 옮겼다. 이어서, 밴드를, 예를 들어 Thermo Fisher, SYBR® Gold Nucleic Acid Gel Stain(DMSO 중 10,000X 농축물) 및 에피형광(epifluorescent light)(청색) 또는 UV(312 nm)를 이용하여 가시화할 수 있다.
생성된 ceDNA 벡터의 순도는 임의의 업계 공지 방법을 사용하여 평가할 수 있다. 하나의 예시적이고 비제한적인 방법으로서, ceDNA 벡터의 형광 강도를 표준과 비교하여 샘플의 전체 UV 흡광도에 대한 ceDNA-플라스미드의 기여를 추정할 수 있다. 예를 들어, UV 흡광도에 기반하여, 4 μg의 ceDNA 벡터가 겔 상에 로딩되고, ceDNA 벡터 형광 강도가 1 μg인 것으로 공지된 2 kb 밴드와 동등한 경우, 1 μg의 ceDNA 벡터가 존재하며, ceDNA 벡터는 총 UV 흡수 물질의 25%이다. 이어서, 겔 상의 밴드 강도를 밴드가 나타내는 계산된 입력에 대해 플롯팅한다: 예를 들어 총 ceDNA 벡터가 8 kb이고, 절제된 비교용 밴드가 2 kb인 경우, 밴드 강도는 총 입력의 25%로서 플롯팅될 것이며, 이러한 경우 1.0 μg 입력에 대한 값은 0.25 μg일 것이다. ceDNA 벡터 플라스미드 적정을 사용하여 표준 곡선을 플롯팅한 후, 회귀선 방정식을 사용하여 ceDNA 벡터 밴드의 양을 계산한 다음, 이를 사용하여 ceDNA 벡터로 표시되는 총 입력의 % 또는 순도%를 결정할 수 있다.
비교 목적으로, 실시예 1에는 곤충 세포 기반 방법 및 폴리뉴클레오타이드 구조체 주형을 사용한 ceDNA 벡터의 생산 방법이 기재되어 있으며, 이는 또한 PCT/US18/49996(이는 그 전문이 본원에 참조로서 인용됨)의 실시예 1에 기재되어 있다. 예를 들어, 실시예 1에 따른 본 발명의 ceDNA 벡터를 생성하는 데 사용되는 폴리뉴클레오타이드 구조체 주형은 ceDNA-플라스미드, ceDNA-박미드 및/또는 ceDNA-바큐로바이러스일 수 있다. 이론에 제한됨 없이, 허용 숙주세포에서, 예를 들어 Rep의 존재 하에서, 2개의 대칭인 ITR과 발현 구조체를 갖는 폴리뉴클레오타이드 구조체 주형(여기서, ITR 중 적어도 하나는 야생형 ITR 서열에 대해 변형됨)을 복제하여 ceDNA 벡터를 생산한다. ceDNA 벡터 생산은 다음과 같은 2단계를 거친다: 첫 번째로, Rep 단백질을 통한 주형 백본(예를 들어, ceDNA-플라스미드, ceDNA-박미드, ceDNA-바큐로바이러스 게놈 등)으로부터의 주형의 절제("회수") 단계, 및 두 번째로, 절제된 ceDNA 벡터의 Rep 매개 복제 단계.
곤충 세포를 사용하는 방법으로 ceDNA 벡터를 생산하는 예시적인 방법은, 본원에 기재된 바와 같은 ceDNA-플라스미드에서 시작하는 방법이다. 도 1a 도 1b를 참조하면, 각각의 ceDNA-플라스미드의 폴리뉴클레오타이드 구조체 주형은 좌측 변형된 ITR과 우측 변형된 ITR을 포함하고, 상기 ITR 서열 사이에 다음을 갖는다: (i) 인핸서/프로모터; (ii) 전이유전자의 클로닝 부위; (iii) 전사 후 반응 요소(예를 들어, 우드척 간염바이러스 전사 후 조절 요소(WPRE)); 및 (iv) 폴리아데닐화 신호(예를 들어, 소 성장호르몬 유전자(BGHpA) 유래). 구조체의 특정 부위에 새로운 유전 구성요소의 도입을 용이하게 하기 위해, 고유한 제한 엔도뉴클레아제 인식 부위(R1 내지 R6)(도 1a도 1b에 제시됨)를 또한 각 구성요소 사이에 도입하였다. R3(PmeI) GTTTAAAC(서열번호 123) 및 R4(PacI) TTAATTAA(서열번호 124) 효소 부위를 클로닝 부위로 조작하여, 전이유전자의 오픈리딩프레임을 도입하였다. 이러한 서열을 ThermoFisher Scientific에서 입수한 pFastBac HT B 플라스미드에 클로닝하였다.
실시예 2: 이중가닥 DNA 분자로부터의 절제를 통한 합성 ceDNA 생산
ceDNA 벡터의 합성 생산은 2019년 1월 18일자 출원된 국제 출원 PCT/US19/14122의 실시예 2 내지 실시예 6에 기재되어 있으며, 상기 문헌은 그 전문이 본원에 참조로서 인용된다. 이중가닥 DNA 분자의 절제를 포함하는 합성 방법을 사용하여 ceDNA 벡터를 생산하는 하나의 예시적인 방법. 간략하게, ceDNA 벡터는 이중가닥 DNA 구조체를 사용하여 생성할 수 있다(예를 들어, PCT/US19/14122의 도 7a 내지 도 8e 참조). 일부 구현예에서, 이중가닥 DNA 구조체는 ceDNA 플라스미드이다(예를 들어, 2018년 12월 6일자 출원된 국제 특허 출원 PCT/US2018/064242의 도 6 참조).
일부 구현예에서, ceDNA 벡터 제조용 구조체는 본원에 기재된 바와 같은 조절 스위치를 포함한다.
예시 목적으로, 실시예 2는 이러한 방법을 사용하여 생성된 예시적인 폐쇄형 DNA 벡터로서의 ceDNA 벡터의 생산을 설명한다. ITR과 발현 카세트(예를 들어, 이종 핵산 서열)를 포함하는 이중가닥 폴리뉴클레오타이드의 절제, 이어서 본원에 기재된 바와 같은 유리된 3' 및 5' 말단의 결찰에 의해 폐쇄형 DNA 벡터를 생성하는 시험관내 합성 생산 방법을 설명하는 상기 실시예에 ceDNA 벡터가 예시되어 있지만, 당업자는, 상기 예시된 바와 같이, 비제한적으로, 개뼈형 DNA, 덤벨형 DNA 등을 포함하는 임의의 목적하는 폐쇄형 DNA 벡터가 생성되도록, 이중가닥 DNA 폴리뉴클레오타이드 분자를 변형시킬 수 있다는 것을 알고 있다. 실시예 2에 기재된 합성 생산 방법에 따라 생산될 수 있는 항체 또는 융합 단백질의 생산을 위한 예시적인 ceDNA 벡터는, "III ceDNA 벡터 전반"라는 제목의 섹션에 논의되어 있다. ceDNA 벡터에 의해 발현되는 예시적인 항체 및 융합 단백질은, "IIC ceDNA 벡터에 의해 발현되는 예시적인 항체 및 융합 단백질"이라는 제목의 섹션에 논의되어 있다.
상기 방법은 (i) 이중가닥 DNA 구조체로부터 발현 카세트를 인코딩하는 서열을 절제하는 단계, (ii) ITR 중 하나 이상에서 헤어핀 구조를 형성하는 단계, 및 (iii) 유리된 5' 및 3' 말단을 결찰, 예를 들어 T4 DNA 리가아제에 의해 결합하는 단계를 포함한다.
이중가닥 DNA 구조체는, 5'→3' 순서로, 제1 제한 엔도뉴클레아제 부위; 업스트림 ITR; 발현 카세트; 다운스트림 ITR; 및 제2 제한 엔도뉴클레아제 부위를 포함한다. 이어서, 이중가닥 DNA 구조체를 하나 이상의 제한 엔도뉴클레아제와 접촉시켜, 양쪽 제한 엔도뉴클레아제 부위에 이중가닥 절단물을 생성한다. 하나의 엔도뉴클레아제는 2개의 부위를 모두 표적화할 수 있거나, 제한 부위가 ceDNA 벡터 주형에 존재하지 않는 한 각각의 부위는 상이한 엔도뉴클레아제에 의해 표적화될 수 있다. 이는 나머지 이중가닥 DNA 구조체로부터 제한 엔도뉴클레아제 부위 사이의 서열을 절제한다(PCT/US19/14122의 도 9 참조). 결찰시켜, 폐쇄형 DNA 벡터를 형성한다.
상기 방법에 사용되는 ITR 중 하나 또는 둘 모두는 야생형 ITR일 수 있다. 변형된 ITR을 또한 사용할 수 있으며, 여기서 변형은 B 및 B' 아암 및/또는 C 및 C' 아암을 형성하는 서열에서 야생형 ITR로부터 하나 이상의 뉴클레오타이드의 결실, 삽입 또는 치환을 포함하거나(예를 들어, PCT/US19/14122의 도 6 내지 도 8, 도 10 및 도 11b 참조), 2개 이상의 헤어핀 루프(예를 들어, PCT/US19/14122의 도 6 내지 도 8 및 도 11b 참조) 또는 단일 헤어핀 루프(예를 들어, PCT/US19/14122의 도 10a, 도 10b 및 도 11b 참조)를 가질 수 있다. 헤어핀 루프 변형된 ITR은 기존 올리고의 유전적 변형 또는 새로운(de novo) 생물학적 및/또는 화학적 합성으로 생성할 수 있다.
비제한적인 예에서, 좌측 및 우측 ITR-6(서열번호 111 및 서열번호 112)은 AAV2의 야생형 ITR로부터 B-B' 및 C-C' 아암의 40개 뉴클레오타이드 결실을 포함한다. 변형된 ITR에 남아있는 뉴클레오타이드는 단일 헤어핀 구조를 형성할 것으로 예측된다. 상기 구조의 언폴딩 깁스 자유 에너지는 약 -54.4 kcal/mol이다. 기능성 Rep 결합 부위 또는 Trs 부위의 선택적 결실을 비롯한 ITR에 대한 다른 변형이 또한 이루어질 수 있다.
실시예 3: 올리고뉴클레오타이드 구축을 통한 ceDNA 생산
다양한 올리고뉴클레오타이드의 어셈블리를 포함하는 합성 방법을 사용하여 ceDNA 벡터를 생산하는 또 다른 예시적인 방법이, PCT/US19/14122(이는 그 전문이 본원에 참조로서 인용됨)의 실시예 3에 제공되어 있으며, 여기서 ceDNA 벡터는 5' 올리고뉴클레오타이드와 3' ITR 올리고뉴클레오타이드를 합성하는 단계, 및 ITR 올리고뉴클레오타이드를 발현 카세트를 포함하는 이중가닥 폴리뉴클레오타이드에 결찰시키는 단계를 통해 생산된다. PCT/US19/14122의 도 11b는, 5' ITR 올리고뉴클레오타이드와 3' ITR 올리고뉴클레오타이드를 발현 카세트를 포함하는 이중가닥 폴리뉴클레오타이드에 결찰시키는 예시적인 방법을 보여준다.
본원에 개시된 바와 같이, ITR 올리고뉴클레오타이드는 WT-ITR(예를 들어, 도 3a, 도 3c 참조) 또는 변형된 ITR(예를 들어, 도 3b도 3d 참조)을 포함할 수 있다. (또한, PCT/US19/14122(이는 그 전문이 본원에 참조로서 인용됨)의 도 6a, 도 6b, 도 7a 및 도 7b 참조). 예시적인 ITR 올리고뉴클레오타이드에는, 비제한적으로, 서열번호 134 내지 145가 포함된다(예를 들어, PCT/US19/14122의 표 7 참조). 변형된 ITR은 B 및 B' 아암 및/또는 C 및 C' 아암을 형성하는 서열에서 야생형 ITR로부터 하나 이상의 뉴클레오타이드의 결실, 삽입 또는 치환을 포함할 수 있다. 무세포 합성에 사용되는 본원에 기재된 바와 같은 WT-ITR 또는 mod-ITR을 포함하는 ITR 올리고뉴클레오타이드는, 유전적 변형, 또는 생물학적 및/또는 화학적 합성으로 생성할 수 있다. 본원에 논의된 바와 같이, 실시예 2와 실시예 3의 ITR 올리고뉴클레오타이드는 WT-ITR, 또는 본원에 논의된 바와 같은 대칭 또는 비대칭 구성의 변형된 ITR(mod-ITR)을 포함할 수 있다.
실시예 4: 단일가닥 DNA 분자를 통한 ceDNA 생산
합성 방법을 사용하여 ceDNA 벡터를 생산하는 또 다른 예시적인 방법이 PCT/US19/14122(이는 그 전문이 본원에 참조로서 인용됨)의 실시예 4에 제공되어 있으며, 이는 센스 발현 카세트 서열을 플랭킹하고, 안티센스 발현 카세트를 플랭킹하는 2개의 안티센스 ITR에 공유결합으로 부착된 2개의 센스 ITR을 포함하는 단일가닥 선형 DNA를 사용하며, 이러한 단일가닥 선형 DNA의 말단을 결찰시켜 폐쇄형 단일가닥 분자를 형성한다. 하나의 비제한적인 예는, 단일가닥 DNA 분자를 합성 및/또는 생산하는 단계, 분자의 일부를 어닐링하여 하나 이상의 2차 구조 염기쌍 영역을 갖는 단일 선형 DNA 분자를 형성하는 단계, 및 유리된 5' 및 3' 말단을 서로 결찰시켜 폐쇄형 단일가닥 분자를 형성하는 단계를 포함한다.
ceDNA 벡터 생산을 위한 예시적인 단일가닥 DNA 분자는, 5'→3' 방향으로, 센스 제1 ITR; 센스 발현 카세트 서열; 센스 제2 ITR; 안티센스 제2 ITR; 안티센스 발현 카세트 서열; 및 안티센스 제1 ITR을 포함한다.
실시예 4의 예시적인 방법에 사용되는 단일가닥 DNA 분자는 본원에 기재된 임의의 DNA 합성 방법, 예를 들어 시험관내 DNA 합성으로 형성하거나, 뉴클레아제를 이용하여 DNA 구조체(예를 들어, 플라스미드)를 절단하고 생성된 dsDNA 단편을 용융시켜 ssDNA 단편을 제공하는 방식으로 제공할 수 있다.
센스 및 안티센스 서열 쌍의 계산된 용융 온도 미만으로 온도를 저하시켜 어닐링을 달성할 수 있다. 용융 온도는 특정 뉴클레오타이드 염기 함량과, 사용되는 용액의 특징, 예를 들어 염 농도에 따라 달라진다. 당업자는 임의의 주어진 서열 및 용액 조합에 대한 용융 온도를 쉽게 계산할 수 있다.
어닐링된 분자의 유리된 5' 및 3' 말단을 서로 결찰시키거나 헤어핀 분자에 결찰시켜, ceDNA 벡터를 형성할 수 있다. 적합한 예시적인 결찰 방법 및 헤어핀 분자는 실시예 2 및 실시예 3에 기재되어 있다.
실시예 5: ceDNA의 정제 및/또는 생산 확인
예를 들어 실시예 1에 기재된 곤충 세포 기반 생산 방법, 또는 실시예 2 내지 4에 기재된 합성 생산 방법을 포함하는 본원에 기재된 방법에 의해 생산된 임의의 DNA 벡터 산물을, 당업자에게 일반적으로 공지된 방법을 사용하여 불순물, 미사용 구성요소 또는 부산물을 제거하기 위해 정제할 수 있고/있거나; 생산된 DNA 벡터(이러한 경우, ceDNA 벡터)가 목적하는 분자인지를 확인하기 위해 분석할 수 있다. DNA 벡터, 예를 들어 ceDNA의 예시적인 정제 방법은, Qiagen Midi Plus 정제 프로토콜(Qiagen) 및/또는 겔 정제를 사용하는 것이다.
ceDNA 벡터의 정체를 확인하는 예시적인 방법은 다음과 같다.
ceDNA 벡터는 도 4d에 예시된 미변성 또는 변성 조건 하에서 아가로오스 겔 전기영동으로 확인하여 평가할 수 있으며, 여기서 (a) 제한 엔도뉴클레아제 절단 및 겔 전기영동 분석 후 미변성 겔에 비해 변성 겔에서 2배 크기로 이동하는 특징적인 밴드의 존재, 및 (b) 절단되지 않은 물질의 경우 미변성 겔에서 단량체 및 이량체(2x) 밴드의 존재가, ceDNA 벡터 존재의 특징이다.
정제된 DNA를, a) ceDNA 벡터 내 오로지 단일 절단 부위만 존재, 및 b) 0.8% 변성 아가로오스 겔 상에서 분별 시 명확하게 확인할 수 있을 만큼 큰 생성된 단편(>800 bp)에 대해 선별된 제한 엔도뉴클레아제로 소화시켜, 단리된 ceDNA 벡터의 구조를 추가로 분석하였다. 도 4c 도 4d에 예시된 바와 같이, 비연속 구조를 갖는 선형 DNA 벡터와 선형 및 연속 구조를 갖는 ceDNA 벡터를 이의 반응 생성물의 크기로 구별할 수 있다: 예를 들어 비연속 구조를 갖는 DNA 벡터는 1 kb 및 2 kb 단편을 생성할 것으로 예상되고, 연속 구조를 갖는 ceDNA 벡터는 2 kb 및 4 kb 단편을 생성할 것으로 예상된다.
따라서, 단리된 ceDNA 벡터가 정의에 따라 공유결합으로 폐쇄되어 있다는 것을 정성적으로 입증하기 위해, 샘플을 단일 제한 부위를 갖는 특정 DNA 벡터 서열의 맥락에서 확인된 제한 엔도뉴클레아제로 소화시켜, 바람직하게는 동일하지 않은 크기의 2개의 절단 산물(예를 들어, 1000 bp 및 2000 bp)을 수득하였다. 소화 및 변성 겔 상에서의 전기영동(이는 2개의 상보적 DNA 가닥을 분리함) 후, 선형의 비공유결합으로 폐쇄된 DNA는 1000 bp 및 2000 bp의 크기로 분리될 것이지만, 공유결합으로 폐쇄된 DNA(즉, ceDNA 벡터)는 2개의 DNA 가닥이 연결되고 언폴딩되어 (단일가닥이지만) 길이가 2배가 됨으로써, 2배 크기(2000 bp 및 4000 bp)로 분리될 것이다. 나아가, 단량체, 이량체 및 n량체 형태의 DNA 벡터의 소화는 모두 다량체 DNA 벡터의 말단 대 말단 연결로 인해 동일한 크기의 단편으로 분리될 것이다(도 4e 참조).
본원에 사용된 "미변성 겔 및 변성 조건 하에서 아가로오스 겔 전기영동에 의한 DNA 벡터의 식별을 위한 검정"이라는 구절은, 제한 엔도뉴클레아제 소화, 이어서 소화 산물의 전기영동을 수행하는 방식으로 ceDNA의 폐쇄형 말단을 평가하는 검정을 나타낸다. 하나의 이러한 예시적인 검정이 하기에 이어지지만, 당업자는 이러한 예에 대한 다수의 업계 공지 변형이 가능하다는 것을 이해할 것이다. 제한 엔도뉴클레아제는 DNA 벡터 길이의 대략 1/3x 및 2/3x인 산물을 생성하게 되는 관심 ceDNA 벡터에 대한 단일 절단 효소인 것으로 선택된다. 이는, 미변성 및 변성 겔 모두에 대한 밴드를 분리한다. 변성 전, 샘플에서 완충액을 제거하는 것이 중요하다. Qiagen PCR 클린업 키트(clean-up kit) 또는 탈염 "스핀 컬럼", 예를 들어 GE HEALTHCARE ILUSTRA™ MICROSPIN™ G-25 컬럼이 엔도뉴클레아제 소화에 대한 일부 업계 공지 옵션이다. 상기 검정은, 예를 들어 i) 적절한 제한 엔도뉴클레아제(들)를 이용하여 DNA를 소화시키는 단계, ii) 예를 들어 Qiagen PCR 클린업 키트에 적용하고, 증류수로 용리하는 단계, iii) 10x 변성 용액(10x = 0.5 M NaOH, 10 mM EDTA)을 첨가하고, 완충되지 않은 10X 염료를 첨가하고, NaOH 농도가 겔과 겔 박스에서 균일하도록 보장하기 위해 1 mM EDTA 및 200 mM NaOH와 함께 이전에 인큐베이션한 0.8% 내지 1.0% 겔 상에 10X 변성 용액을 4배로 첨가하여 제조된 DNA ladder와 함께 분석하고, 1x 변성 용액(50 mM NaOH, 1 mM EDTA)의 존재 하에서 겔에서 전개시키는 단계를 포함한다. 당업자는, 크기 및 목적하는 결과 타이밍을 기반으로 전기영동을 수행하는 데 어떤 전압을 사용해야 하는 지를 이해할 것이다. 전기영동 후, 겔을 배수하고, 1x TBE 또는 TAE에서 중화시키고, 1x SYBR Gold을 함유한 1x TBE/TAE 또는 증류수로 옮겼다. 이어서, 밴드를, 예를 들어 Thermo Fisher, SYBR® Gold Nucleic Acid Gel Stain(DMSO 중 10,000X 농축물) 및 에피형광(청색) 또는 UV(312 nm)를 이용하여 가시화할 수 있다. 겔 밴드에서 ceDNA 벡터를 분리하고 이를 재생시키는 방식으로 전술한 겔 기반 방법을 정제 목적에 맞게 조정할 수 있다.
생성된 ceDNA 벡터의 순도는 임의의 업계 공지 방법을 사용하여 평가할 수 있다. 하나의 예시적이고 비제한적인 방법으로서, ceDNA 벡터의 형광 강도를 표준과 비교하여 샘플의 전체 UV 흡광도에 대한 ceDNA-플라스미드의 기여를 추정할 수 있다. 예를 들어, UV 흡광도에 기반하여, 4 μg의 ceDNA 벡터가 겔 상에 로딩되고, ceDNA 벡터 형광 강도가 1 μg인 것으로 공지된 2 kb 밴드와 동등한 경우, 1 μg의 ceDNA 벡터가 존재하며, ceDNA 벡터는 총 UV 흡수 물질의 25%이다. 이어서, 겔 상의 밴드 강도를 밴드가 나타내는 계산된 입력에 대해 플롯팅한다: 예를 들어 총 ceDNA 벡터가 8 kb이고, 절제된 비교용 밴드가 2 kb인 경우, 밴드 강도는 총 입력의 25%로서 플롯팅될 것이며, 이러한 경우 1.0 μg 입력에 대한 값은 0.25 μg일 것이다. ceDNA 벡터 플라스미드 적정을 사용하여 표준 곡선을 플롯팅한 후, 회귀선 방정식을 사용하여 ceDNA 벡터 밴드의 양을 계산한 다음, 이를 사용하여 ceDNA 벡터로 표시되는 총 입력의 % 또는 순도%를 결정할 수 있다.
실시예 6: ceDNA로부터의 제어된 전이유전자 발현: 재투여에 의해 유지 및/또는 증가될 수 있는 생체내 ceDNA 벡터로부터의 전이유전자 발현.
상기 실시예 1에 기재된 방법에 따라, 비대칭인 ITR(예를 들어, 5' WT-ITR(서열번호 2)과 3' mod-ITR(서열번호 3)) 사이에 플랭킹된 예시적인 PAH로서의 루시퍼라아제 전이유전자(서열번호 56)와 CAG 프로모터(서열번호 72)를 포함하는 ceDNA 플라스미드를 사용하여 ceDNA 벡터를 생산하고, 생체내 상이한 처리 프로그램으로 평가하였다. 이러한 ceDNA 벡터를 실시예 6 내지 10에 기재된 모든 후속 실험에 사용하였다. 실시예 6에서, ceDNA 벡터를 정제하고 지질 나노입자(LNP ceDNA)로 제형화하여, 각 CD-1® IGS 마우스의 꼬리 정맥에 주사하였다. 리포좀을 지질 나노입자(LNP) 리포좀을 형성하는 데 적합한 4개의 구성요소(양이온성 지질, 헬퍼 지질, 콜레스테롤 및 PEG-지질을 포함함)를 포함하는 지질 블렌드를 이용하여 제형화하였다.
장기간에 걸쳐 ceDNA 벡터로부터 생체내 전이유전자의 지속된 발현을 평가하기 위해, LNP-ceDNA를 멸균 PBS 중의 꼬리 정맥내 주사로 대략 5주령 내지 7주령의 CD-1® IGS 마우스에 투여하였다. 3가지 상이한 투여군을 평가하였다: 0.1 mg/kg, 0.5 mg/kg 및 1.0 mg/kg, 군당 10마리(단, 1.0 mg/kg 군은 군당 15마리였음). 0일차에 주사를 투여하였다. 28일차에, 각 군의 5마리 마우스에게 동일한 용량을 추가로 주사하였다. CD-1® IGS 마우스(Charles River Laboratories; WT 마우스)에게 정맥내 주사한 후, IVIS 영상화로 루시퍼라아제 발현을 측정하였다. 3일차, 4일차, 7일차, 14일차, 21일차, 28일차, 31일차, 35일차 및 42일차, 및 42일차 내지 110일차 사이에 정기적으로(예를 들어, 매주, 격주 또는 10일마다 또는 2주마다) 150 mg/kg 루시페린 기질을 복강내 주사한 후, IVIS 영상화로 루시퍼라아제 발현을 평가하였다. 3가지 상이한 투여 프로토콜 후, 적어도 132일 동안 IVIS 영상화로 측정된 예시적인 PAH로서의 루시퍼라아제 전이유전자 발현(데이터는 제시되지 않음).
LNP-ceDNA 처리된 대상의 재투여, 예를 들어 루시퍼라아제를 발현하는 LNP-ceDNA의 재투여 효과를 조사하기 위해 확장된 연구를 수행하였다. 특히, 발현 수준이 ceDNA 벡터의 1회 이상 추가 투여에 의해 증가될 수 있는 지를 결정하기 위해 평가하였다.
이러한 연구에서, 0일차 및 28일차에 1.0 mg/kg의 초기 정맥내 투여(즉, 프라이밍 투여) 후, CD-1® IGS 마우스에서 IVIS로 ceDNA 벡터로부터의 루시퍼라아제 발현의 체내분포를 평가하였다(군 A). 84일차에 꼬리 정맥에의 3 mg/kg(군 B) 또는 10 mg/kg(군 C)의 꼬리 정맥 주사(1.2 mL)를 통해 ceDNA 벡터의 두 번째 투여를 투여하였다. 이러한 연구에서, 군 A, B 및 C 각각에서 5마리 CD-1® 마우스를 사용하였다. 추가 투여 전 49일차, 56일차, 63일차 및 70일차뿐 아니라, 84일차의 재투여 후, 및 91일차, 98일차, 105일차, 112일차 및 132일차에, 상기 기재된 바와 같이 루시퍼라아제 발현에 대한 마우스의 IVIS 영상화를 수행하였다. 적어도 110일(평가된 가장 긴 기간)까지 3가지 군 A, B 및 C 모두에서 루시퍼라아제 발현을 평가하고 검출하였다.
루시퍼라아제의 발현 수준은, 루시페린의 존재 하에서 루시퍼라아제 활성의 평가로 결정된 바와 같이, LNP-ceDNA-Luc의 재투여(즉, ceDNA 조성물의 재투여)에 의해 증가되는 것으로 나타났다. 3가지 상이한 투여 프로토콜(군 A, B 및 C) 후, 적어도 110일 동안 IVIS 영상화로 측정된 예시적인 PAH로서의 루시퍼라아제 전이유전자 발현. 임의의 추가 재투여 처리를 받지 않은 마우스(1 mg/kg 프라이밍 투여)(즉, 군 A)에서는 연구 기간에 걸쳐 안정한 루시퍼라아제 발현이 관찰되었다. 3 mg/kg의 ceDNA 벡터를 재투여받은 군 B의 마우스는 군 C의 마우스에 비해 관찰된 광도가 대략 7배 증가된 것으로 나타냈다. 놀랍게도, 10 mg/kg의 ceDNA 벡터를 재투여받은 마우스는 임의의 재투여를 받지 않은 마우스(군 A)보다 관찰된 루시퍼라아제 광도가 17배 증가되었다.
군 A는, 0일차 및 28일차에 꼬리 정맥으로 1 mg/kg ceDNA 벡터의 정맥내 투여 후 CD-1® IGS 마우스에서의 루시퍼라아제 발현을 나타낸다. 군 B 및 군 C는, 첫 번째 시점(0일차)에서 1 mg/kg의 ceDNA 벡터를 투여받고, 84일차 두 번째 시점에서 ceDNA 벡터를 재투여받은 CD-1® IGS 마우스에서의 루시퍼라아제 발현을 나타낸다. ceDNA 벡터의 두 번째 투여(즉, 재투여)는 발현을 적어도 7배, 심지어 최대 17배로 증가시켰다.
군 B에서 재투여 시 ceDNA 벡터 용량(즉, 양)의 3배 증가(즉, 3 mg/kg의 재투여)는, 루시퍼라아제의 발현을 7배 증가시켰다. 또한 예상치 못하게, 군 C에서 재투여 시 ceDNA 벡터 양의 10배 증가(즉, 10 mg/kg 재투여)는 루시퍼라아제의 발현을 17배 증가시켰다. 따라서, ceDNA의 두 번째 투여(즉, 재투여)는 발현을 적어도 7배, 심지어 최대 17배로 증가시켰다. 이는, 재투여를 통한 전이유전자 발현의 증가가 예상했던 것보다 크고, 재투여 시 ceDNA 벡터의 용량 또는 양에 따라 달라지며, 0일차의 초기 프라이밍 투여에 의한 초기 전이유전자 발현에 상승작용을 나타내는 것으로 보인다. 즉, 전이유전자 발현의 용량 의존적 증가는 부가작용이 아니라, 전이유전자의 발현 수준은 용량 의존적이며 각 시점에서 투여된 ceDNA 벡터의 양의 합보다 크다.
군 B 및 군 C는, 두 번째 시점에서 ceDNA 벡터가 재투여되지 않은 대조군 마우스(군 A)와 비교 시 루시퍼라아제 발현의 유의한 용량 의존적 증가를 나타냈다. 종합하면, 이러한 데이터는, ceDNA 벡터로부터의 전이유전자의 발현이 적어도 두 번째 시점에서의 ceDNA 벡터의 재투여(즉, 재투여)에 의해 용량 의존적 방식으로 증가될 수 있음을 보여준다.
종합하면, 이러한 데이터는, ceDNA 벡터로부터의 전이유전자, 예를 들어 PAH의 발현 수준이 적어도 84일 동안 일관된 수준으로 유지될 수 있으며, 적어도 두 번째 시점에서 투여된 ceDNA 벡터의 재투여 후 생체내에서 증가될 수 있음을 입증한다.
실시예 7: LNP-제형화된 ceDNA 벡터의 생체내 지속된 전이유전자 발현
상이한 지질 나노입자를 이용한 실시예 6에서의 결과의 재현성을 마우스의 생체내에서 평가하였다. 0일차에, 실시예 6에서 사용된 바와 상이한 LNP, 또는 polyC를 포함하지만 ceDNA 또는 루시퍼라아제 유전자가 결여되어 있는 동일한 LNP에 캡슐화된 CAG 프로모터에 의해 구동되는 루시퍼라아제 전이유전자를 포함하는 ceDNA 벡터를 마우스에 투여하였다. 구체적으로, 0일차에, 대략 약 4주령의 수컷 CD-1® 마우스를 측면 꼬리 정맥을 통해 정맥내 투여되는 0.5 mg/kg LNP-TTX-루시퍼라아제 또는 대조군 LNP-polyC의 단회 주사로 처리하였다. 14일차에, 2.5 mL/kg의 복강내 주사를 통해 동물에게 150 mg/kg의 루시페린을 전신으로 투여하였다. 루시페린 투여 대략 15분 후, 생체내 이미지화 시스템(In Vivo Imaging System, "IVIS")을 사용하여 각 동물을 이미지화하였다.
도 7에 도시된 바와 같이, 4마리의 모든 ceDNA 처리된 마우스 간에서 유의한 형광이 관찰되었고, 동물의 주사 부위 이외에서는 다른 형광이 거의 관찰되지 않았으며, 이는 LNP가 ceDNA 구조체의 간 특이적 전달을 매개하고, 전달된 ceDNA 벡터가 투여 후 적어도 2주 동안 이의 전이유전자의 지속된 발현을 제어할 수 있음을 나타낸다.
실시예 8: ceDNA 벡터 투여에 의한 생체내 간에서의 지속된 전이유전자 발현
별도의 실험으로, 처리된 동물의 간 내에서 LNP를 통해 전달된 ceDNA의 국소화를 평가하였다. 관심 기능성 전이유전자를 포함하는 ceDNA 벡터를 실시예 7에 사용된 바와 동일한 LNP로 캡슐화하고, 0.5 mg/kg의 용량 수준으로 정맥내 주사를 통해 마우스에게 생체내 투여하였다. 6시간 후, 마우스를 종결시키고, 간 샘플을 취하여, 표준 프로토콜에 따라 포르말린 고정시키고 파라핀 포매시켰다. 조직 내 ceDNA 벡터를 가시화하기 위해, ceDNA 전이유전자에 대해 특이적인 프로브를 사용하여 RNAscope® 제자리 혼성화 검정을 수행하고, 발색 반응 및 헤마톡실린 염색(Advanced Cell Diagnostics)을 사용하여 검출하였다. 도 8은, ceDNA가 간세포에 존재함을 나타내는 결과를 보여준다.
실시예 9: 생체내 ceDNA의 지속된 안구 전이유전자 발현
생체내 안구 투여 후 ceDNA 벡터의 관용성 및 발현을 결정하기 위해 간 이외의 조직에서 ceDNA 벡터 전이유전자 발현의 지속성을 평가하였다. 실시예 9에서 예시적인 전이유전자로 루시퍼라아제를 사용하였지만, 당업자는 루시퍼라아제 전이유전자를 표 5에 열거된 것들 중 임의의 것의 PAH 서열로 대체할 수 있다.
0일차에, jetPEI® 트랜스펙션 시약(Polyplus)으로 제형화된 루시퍼라아제 전이유전자 또는 jetPEI®로 제형화된 루시퍼라아제를 인코딩하는 플라스미드 DNA를, 둘 모두 0.25 μg/μL의 농도로, 포함하는 ceDNA 벡터 5 μL를 대략 9주령의 수컷 스프래그 돌리(Sprague Dawley) 래트에게 망막하 주사하였다. 각 군에서 4마리의 래트를 시험하였다. 동물을 진정시키고, 33 게이지 바늘을 사용하여 시험 물품을 우측 눈에 망막하 주사하였다. 각 동물의 좌측 눈은 처리하지 않았다. 주사 직후, 망막하 수포(subretinal bleb)의 존재를 확인하기 위해 광간섭단층영상(optical coherence tomography) 또는 안저 이미지화(fundus imaging)를 이용하여 눈을 점검하였다. 래트를 표준 절차에 따라 부프레노르핀(buprenorphine) 및 국소 항생제 연고로 처리하였다.
7일차, 14일차, 21일차, 28일차 및 35일차에, 2.5 mL/kg의 복강내 주사를 통해 양쪽 군의 동물에게 150 mg/kg의 새로 제조된 루시페린을 전신으로 투여하였다. 루시페린 투여 5분 내지 15분 후, 모든 동물을 이소플루란 마취 하에서 IVIS를 사용하여 이미지화하였다. 눈을 포함하는 관심 영역에서 5분 노출에 걸친 총 플럭스[p/s]와 평균 플럭스(p/s/sr/cm2)를 얻었다. 각 처리 군의 미처리된 눈("주사되지 않음")에서의 평균 강도에 대한 각 처리 군의 처리된 눈("주사됨")에서의 평균 광도로 결과를 그래프화하였다(도 9b). ceDNA 벡터 처리된 눈에서는 유의한 형광을 쉽게 검출할 수 있었지만, 플라스미드 처리된 눈에서는 훨씬 약했다(도 9a). 35일 후, 플라스미드 주사된 래트는 종결시켰지만, ceDNA 처리된 래트에 대해서는 연구를 지속하여, 42일차, 49일차, 56일차, 63일차, 70일차 및 99일차에 루시페린을 주사하고 IVIS 이미지화를 수행하였다. 결과는, 래트 눈에 단회 주사로 도입된 ceDNA 벡터가 생체내 전이유전자 발현을 매개하였고, 그 발현이 주사 후 적어도 99일 동안 높은 수준으로 지속되었음을 입증한다.
실시예 10: Rag2 마우스에서 ceDNA 벡터의 지속된 투여 및 재투여.
ceDNA 벡터의 유전자 발현 카세트에 인코딩된 전이유전자 중 하나 이상이 숙주 환경(예를 들어, 세포 또는 대상)에서 발현되고 발현된 단백질이 외래 종으로 인식되는 상황에서, 숙주는 발현 산물의 원치않는 고갈을 유도할 수 있는 적응성 면역반응을 일으켜, 잠재적으로 발현 부족으로 혼동될 수 있는 가능성이 있다. 일부 경우에, 이는 정상적인 숙주 환경과 이종성인 리포터 분자에서 일어날 수 있다. 따라서, B세포와 T세포가 결여되어 있기 때문에 루시퍼라아제와 같은 비천연 쥣과 단백질에 대한 적응성 면역반응을 일으키지 않는 Rag2 마우스 모델에서, 생체내 ceDNA 벡터 전이유전자 발현을 평가하였다. 간략하게, 0일차에, 루시퍼라아제를 발현하는 LNP 캡슐화된 ceDNA 벡터 또는 polyC 대조군 0.5 mg/kg을 c57bl/6 및 Rag2 녹아웃 마우스에게 꼬리 정맥 주사를 통해 정맥내 투여하고, 21일차에, 동일한 LNP 캡슐화된 ceDNA 벡터를 동일한 용량 수준으로 특정 마우스에게 재투여하였다. 모든 시험 군은 각각 4마리의 마우스로 이루어져 있었다. 실시예 9에 기재된 바와 같이 루시페린 주사 후 1주 간격으로 IVIS 이미지화를 수행하였다.
IVIS 분석을 통해 관찰된 총 플러스를 비교하면, LNP-ceDNA 벡터-Luc가 투여된 야생형 마우스에서 관찰된 형광(발현된 루시퍼라아제 존재의 간접 측정)은 21일 후 점진적으로 감소했지만, 동일한 처리가 투여된 Rag2 마우스는 42일 실험에 걸쳐 루시퍼라아제의 비교적 일정한 지속된 발현을 나타냈다(도 9a). 야생형 마우스에서 감소가 관찰된 대략 21일의 시점은 적응성 면역반응이 생성될 것으로 예상할 수 있는 시간에 해당한다. Rag2 마우스에서 LNP-ceDNA 벡터의 재투여는 발현의 현저한 증가를 유도하였으며, 이는 본 연구에서 추적된 적어도 21일에 걸쳐 지속되었다(도 9b). 결과는, 비천연 단백질이 숙주의 ceDNA 벡터로부터 발현될 때 적응성 면역이 역할을 할 수 있으며, 초기 투여로부터 20일 이상이 지난 시간에서 관찰된 발현의 감소는 발현의 감소라기보다는(또는 발현의 감소에 더하여) 발현된 분자에 대한 적응성 면역반응을 교란시키는 신호일 수 있음을 시사한다. 참고로, 이러한 반응은, 숙주에서 천연 단백질을 발현할 때, 즉, 발현된 분자를 자기 자신으로 적절하게 인식하고 이러한 면역반응을 발달시키지 않을 것으로 예상되는 경우, 낮을 것으로 예측된다.
실시예 11: 지속된 발현에 대한 간 특이적 발현 및 CpG 조절의 영향
실시예 10에 기재된 바와 같이, 바람직하지 않은 숙주 면역반응은, 일부 경우에, 그렇지 않으면 도입된 ceDNA 벡터로부터 하나 이상의 목적하는 전이유전자의 발현이 지속될 수 있는 것을 인위적으로 약화시킬 수 있다. ceDNA 벡터로부터 지속된 발현에 대한 잠재적 숙주 면역반응을 회피 및/또는 약화시키는 영향을 평가하기 위해 2가지 접근법을 취하였다. 첫 번째로, 상기 실시예에 사용된 ceDNA-Luc 벡터가 구성적 CAG 프로모터의 제어 하에 존재했기 때문에, 골수세포 또는 비간 조직에 장기간 노출을 회피하는 것이 임의의 관찰된 면역 효과를 감소시켰는 지 여부를 확인하기 위해, 간 특이적 프로모터(hAAT) 또는 상이한 구성적 프로모터(hEF-1)를 사용하여 유사한 구조체를 제조하였다. 두 번째로, 숙주 면역반응에 대한 공지된 촉발인자인 CpG 함량이 감소되도록 특정 ceDNA-루시퍼라아제 구조체를 조작하였다. 이러한 조작된 및 프로모터 전환된 ceDNA 벡터를 마우스에 투여할 때 ceDNA 인코딩된 루시퍼라아제 유전자 발현을 측정하였다.
3가지 상이한 ceDNA 벡터를 사용하였으며, 각각은 전이유전자로서 루시퍼라아제를 인코딩하였다. 첫 번째 ceDNA 벡터는 다수의 메틸화되지 않은 CpG(약 350)를 갖고 구성적 CAG 프로모터를 포함하였고("ceDNA CAG"); 두 번째는 중간 정도의 메틸화되지 않은 CpG(약 60)를 갖고 간 특이적 hAAT 프로모터를 포함하였으며("ceDNA hAAT low CpG"); 세 번째는 두 번째 것의 메틸화된 형태로, 메틸화되지 않은 CpG를 함유하지 않고 또한 hAAT 프로모터를 포함하였다("ceDNA hAAT No CpG"). ceDNA 벡터는 그 외에는 동일했다. 벡터를 상기 기재된 바와 같이 준비하였다.
대략 약 4주령의 4마리 수컷 CD-1® 마우스로 구성된 4개의 군을 LNP 또는 polyC 대조군으로 캡슐화된 ceDNA 벡터 중 하나로 처리하였다. 0일차에, 각각의 마우스에게 0.5 mg/kg ceDNA 벡터의 단일 정맥내 꼬리 정맥 주사를 5 mL/kg 부피로 투여하였다. -1일차, -일차, 1일차, 2일차, 3일차, 7일차에 체중을 기록하고, 이후 마우스가 종결될 때까지 매주 기록하였다. 0일차, 1일차 및 35일차에 전혈 및 혈청 샘플을 채취하였다. 7일차, 14일차, 21일차, 28일차 및 35일차에 생전 이미지화(in-life imaging)를 수행하고, 이후 매주 생체내 이미지화 시스템(IVIS)을 사용하여 수행하였다. 이미지화 후, 각각의 마우스에게 2.5 mL/kg의 복강내 주사를 통해 루시페린 150 mg/kg을 주사하였다. 15분 후, 각각의 마우스를 마취시키고, 이미지화하였다. 93일차에 마우스를 종결시키고, 간 및 비장을 비롯한 말단 조직을 채취하였다. 사이토카인 측정은 0일차에 투여 6시간 후에 이루어졌다.
ceDNA 처리된 마우스는 모두 7일차 및 14일차에 유의한 형광을 나타냈지만, 형광은 14일 후 ceDNA CAG 마우스에서 급속하게 감소되었으며, 연구 나머지 기간 동안 보다 점진적으로 감소하였다. 대조적으로, ceDNA hAAT low CpG 및 No CpG 처리된 마우스의 총 플럭스는 일정하게 높은 수준으로 유지되었다(도 10). 이는, ceDNA 벡터를 간으로 특이적으로 전달하는 것이, 단회 주사 후 적어도 77일에 걸쳐 벡터로부터 일관되고 지속적인 전이유전자 발현을 유도했음을 시사한다. CpG 최소화된 또는 CpG 함량이 전혀 없는 구조체는 유사한 지속적인 일관된 발현 프로파일을 나타냈던 반면, 높은 CpG 구성적 프로모터 구조체는 시간 경과에 따라 발현 감소를 나타냈으며, 이는 ceDNA 벡터 도입에 의한 숙주 면역 활성화가 대상에서 이러한 벡터로부터 관찰된 임의의 발현 감소에 역할을 할 수 있음을 시사한다. 이러한 결과는, 숙주 면역반응, 잠재적으로 전이유전자 특이적 반응이 관찰되는 경우, 조직 제한 프로모터를 선택하고/하거나 ceDNA 벡터의CpG 함량을 변경시키는 방식으로 반응 지속기간을 목적하는 수준으로 조절하는 대안적인 방법을 제공한다.
실시예 12: PAH를 발현하는 ceDNA의 유체역학적 전달
설치류의 간에 핵산을 도입하는 널리 공지된 방법은 유체역학적 꼬리 정맥 주사에 의한 것이다. 이러한 시스템에서, 다량의 비캡슐화된 핵산을 가압 주사하면, 세포 투과성이 일시적으로 증가하여 조직 및 세포로의 직접 전달이 이루어진다. 이는, 대식세포 전달과 같은 다수의 숙주 면역계를 우회하는 실험적 메커니즘을 제공하여, 이러한 활성의 부재 하에서 전달 및 발현을 관찰할 수 있는 기회를 제공한다.
각각 야생형 좌측 ITR과 절단 돌연변이 우측 ITR을 갖고, 인간 PAH를 인코딩하는 전이유전자 영역을 갖는 2개의 상이한 ceDNA 벡터를, 상기 실시예 15에 기재된 바와 같이 제조하고, 정제하였다. 각각의 ceDNA PAH 벡터는 상이한 간 특이적 프로모터의 제어 하에 있었다. LNP 캡슐화된 poly C 대조군을 또한 검정에 포함시켰다. ceDNA PAH 벡터(임의의 LNP 캡슐화 없이 단독으로)와 대조군을 각각 대략 약 4주령 내지 6주령의 혼성 연령 일치 PAHenu2 마우스에 투여하였다. 네이키드 ceDNA 벡터를 <100 mg/mL 부피로 측면 꼬리 정맥을 통해 유체역학적 정맥내 주사로 동물(군당 6마리 동물)당 5 μg 투여하였다. -1일차, 0일차, 1일차, 2일차, 3일차, 7일차 및 14일차에 체중을 측정하였다. -1일차, 3일차, 7일차 및 14일차에 각각의 처리된 동물에서 혈액 샘플을 채취하였다. 처리된 동물의 혈청 샘플 중 페닐알라닌의 양을 고처리량 질량 분석기로 측정하고, 대조군 처리된 동물에서 관찰된 수준의 백분율로 표시하였다.
도 11에 도시된 바와 같이, 이러한 돌연변이 마우스 모델에서의 페닐알라닌 수준은 대조군 처리된 동물의 실험 전반에 걸쳐 일정하게 높게 유지되었다. 각각의 ceDNA 벡터의 투여는 마우스 내 페닐알라닌 수준을 실험 기간에 걸쳐 대략 75%까지 감소시켰다(도 11). 이러한 실험은, 유체역학적 주사로 투여된 ceDNA 벡터가 PKU의 마우스 모델에서 페닐알라닌 수준을 전신적으로 감소시킬 수 있는 활성 PAH를 발현시켰음을 입증한다.
실시예 13: 유체역학적 주사를 통한 PAH enu2 마우스 내 인간 PAH 효소의 발현에 의한 페닐알라닌 수준의 생화학적 교정을 평가하기 위한 약리학적 연구
PAH 결핍증 쥣과 모델인 PAHenu2 마우스의 이용 가능성은 PAHenu2 마우스에서 페닐알라닌 수준에 대한 인간 PAH 효소의 발현 효과 연구를 가능하게 한다. PAH 결핍증은 손상된 페닐알라닌 청소율 및 결과적으로 고페닐알라닌혈증과 관련이 있다.
실시예 12에 기재된 바와 같은 ceDNA 벡터를 제조하였다. ceDNA PAH 벡터(임의의 LNP 캡슐화 없이 단독으로)와 대조군을 각각 대략 약 4주령 내지 6주령의 혼성 연령 일치 PAHenu2 마우스에 투여하였다. 네이키드 ceDNA 벡터를 <100 mg/mL 부피로 측면 꼬리 정맥을 통해 유체역학적 정맥내 주사로 동물(군당 6마리 동물)당 5 μg 투여하였다. -1일차, 0일차, 1일차, 2일차, 3일차, 7일차 및 14일차에 체중을 측정하였다. -1일차, 3일차, 7일차 및 14일차에 각각의 처리된 동물에서 혈액 샘플을 채취하였다. 처리된 동물의 혈청 샘플 중 페닐알라닌의 양을 고처리량 질량 분석기로 측정하고, 대조군 처리된 동물(PAHenu2)에서 관찰된 수준의 백분율로 표시하였다.
연구 설계는 하기 표 9 및 표 10에 제시되어 있다.
Figure pct00027
Figure pct00028
시험 물품은 농축된 스톡으로 공급받았고, 공칭 4℃에서 보관하였다. 제형을 볼텍싱하거나 원심분리하지 않았다. 군을 처치실 내 환기 랙과 접촉된 침구가 있는 투명 폴리카보네이트 케이지에 수용하였다. 먹이 및 1 N HCl을 이용하여 2.5 내지 3.0의 목표 pH로 산성화시킨 여과된 수돗물을 임의로 동물에게 제공하였다.
각각, 표 11A 및 표 11B에 따라, 중간 및 종료 시점에서 혈액을 채취하였다.
Figure pct00029
Figure pct00030
혈액 샘플 채취는 하기 표 12를 따랐다.
Figure pct00031
연구 세부사항은 하기와 같이 제공된다:
종(수, 성별, 연령): 군 1 내지 8의 경우: 36마리 + 2마리 예비용 PAHenu2 마우스(혼성, 약 4주령 내지 6주령, 연령 일치); 10마리 + 1마리 예비용 WT(한배새끼; 연령 일치). 군 1 내지 7의 경우: 30마리 PAHenu2 마우스(혼성, 약 7주령 내지 10주령, 연령 일치); 10마리 WT(한배새끼; 연령 일치).
화합물 부류: 지질 나노입자 중 DNA.
케이지 관찰: 케이지 관찰은 매일 수행하였다.
임상 관찰: 임상 관찰은 투여 약 1시간, 약 6시간 및 약 24시간 후에 수행하였다.
체중: 모든 동물의 체중을 -4일차, 0일차, 1일차, 2일차, 3일차, 7일차, 14일차, 21일차, 28일차 및 안락사 전에 기록하였다.
투여 제형: 시험 샘플은 농축 스톡으로 공급받았다. 사용 직전 스톡을 PBS로 희석시켰다. 투여가 즉시 수행되지 않는 경우, 준비된 재료를 약 4℃(또는 습윤한 얼음 위)에서 보관하였다.
용량 투여: 0일차에, 군 1 내지 8 및 군 1 내지 7에 대한 시험 재료를 측면 꼬리 정맥을 통해 동물당 설정된 부피, 90 ml/kg 내지 100 ml/kg(군 내 가장 가벼운 동물에 따라 달라짐)로 유체역학적 IV 투여로 투여하였다(5초 이내에 투여함).
혈액 채취 및 검시 전 금식: 모든 동물(모든 군)을 -3일차(~)의 투여전 기준선 혈액 채취, 및 3일차, 7일차, 14일차, 21일차 및 28일차(마지막 채취 전)의 혈액 채취 전 최소 4시간 동안 금식시켰다.
혈액 채취: 각 채취 후, 동물에게 젖산 링거액 0.5 mL 내지 1.0 mL를 피하 투여하였다. 상기 혈액 채취 표에 따라 동물에서 혈액을 채취하였다.
4시간 금식 후, -3일차(~), 3일차, 7일차, 14일차 및 21일차에, 꼬리정맥 닉, 복재정맥 또는 안와정맥굴을 통해 동물의 혈청용 전혈을 채취하였다(시설 SOP에 따라 흡입용 이소플루란 하에서). 2개의 분취액이 만들어질 것이다. 모든 샘플을 배송 시까지 공칭 -70℃에서 보관하였다.
마취 회복: 동물을 마취 하에 있는 동안, 회복하는 동안 및 움직일 때까지 지속적으로 모니터링하였다.
안락사 및 마지막 혈액 채취: 28일차에, 4시간 금식 후, CO2 질식, 개흉술 및 방혈을 통해 동물을 안락사시켰다. 심장 천자를 이용하여 수득 가능한 최대 혈액 부피를 수집하고, 시설 SOP에 따라 처리하고, 2개의 분취액으로 보관하였다.
관류: 방혈 후, 모든 동물은 식염수를 이용하여 심장 관류를 받았다. 간략하게, 염수가 함유된 10 mL 시린지가 부착된 23/21 게이지 바늘을 관류를 위해 좌심실의 내강에 삽입하여 전신 심장내 관류를 수행하였다. 관류액에 대한 배수구를 제공하기 위해 우심방을 절개하였다. 바늘을 심장에 위치시킨 후, 동물을 관류시키기 위해 플런저에 온건하고 일정한 압력을 가하였다. 배출되는 관류액이 투명하게 흐를 때까지(보이는 혈액이 없음), 즉, 플러싱 용액이 신체를 포화시키고 절차가 완료되었음을 나타낼 때까지 플러싱 용액의 적절한 흐름을 보장하였다.
조직 채취: 예정된 시점 이전에 안락사시킨 빈사 상태의 동물에서 말단 조직을 채취하였다. 가능한 경우, 죽은 채로 발견된 동물에서 조직을 채취하여 보관하였다.
안락사 및 관류 후, 간을 수거하였다. 간으로부터, 약 50 mg의 절편을 2개 수집하여, 칭량하지 않고 가능한 신속하게 급속 동결시켰다. 이어서, 약 25 mg 내지 50 mg(≤ 50 mg)의 절편을 3개 수집하고 칭량하였다. 절편을 개별적으로 급속 동결시키고, 배송 시까지 공칭 70℃에서 보관하였다. 죄측 간엽을 조직학 카세트에 위치시키고, 10% NBF 중에 고정시키고, 냉장시켰다(약 4℃). 10% NBF 중의 조직을 냉장유지시키고(약 4℃), 배송 시에는 얼음 팩 위 밀봉된 용기에 보관하였다.
페닐알라닌(PHE) 수준: Pure Honey에서 PHE 수준에 대해 혈청 샘플을 분석하였다.
활성 수준: Pure Honey에서 활성 수준에 대해 2개의 동결된 간 샘플을 분석하였다.
결과: 도 12에 도시된 바와 같이, 이러한 돌연변이 마우스 모델에서의 페닐알라닌 수준(대조군을 기준으로 한 PHE%)은 대조군 처리된 동물의 실험 전반에 걸쳐 일정하게 높게 유지되었다. ceDNA 벡터(Codop2 또는 Codop4) 각각의 투여는 마우스 내 페닐알라닌 수준을 실험 기간에 걸쳐 감소시켰다(도 12). 이러한 결과는, 유체역학적 주사로 투여된 ceDNA 벡터가 PKU의 마우스 모델에서 페닐알라닌 수준을 전신적으로 감소시킬 수 있는 활성 PAH를 발현시켰음을 입증한다. 인간 PAH 코돈 최적화된 버전 2(Codop2)에 연결된 VD 프로모터를 함유하는 ceDNA가 시험된 3가지 ceDNA 실험 벡터 중 최상으로 기능했다. 인간 PAH 코돈 최적화된 버전 2(Codop2)가 인간 PAH 코돈 최적화된 버전 4(Codop4)보다 약간 더 양호하게 기능했음을 보여주는 이러한 결과는, 적어도 부분적으로 버전 4가 CpG가 최소화된 것으로 구성되어 있어, 전형적으로 전이유전자 발현이 증가될 것으로 예상되며, 이는 본원에 기재된 실험 시스템에서의 PHE 수준 감소와 상관관계가 있을 수 있기 때문에 놀랍다. 하지만, Codop2(CpG 최소화 없음)가 Codop4(CpG 최소화됨)보다 PHE 수준을 더 많이 감소시키는 것으로 밝혀졌다.
실시예 14: 유체역학적 IV를 통한 PAH enu2 마우스 내 인간 PAH 효소의 발현에 의한 페닐알라닌 수준의 생화학적 교정을 평가하기 위한 약리학적 연구- 용량 반응
실시예 12에 기재된 바와 같은 ceDNA 벡터를 제조하였다. ceDNA PAH 벡터(임의의 LNP 캡슐화 없이 단독으로)와 대조군을 각각 대략 약 4주령 내지 6주령의 혼성 연령 일치 PAHenu2 마우스에 투여하였다. 네이키드 ceDNA 벡터를 <100 mg/mL 부피로 측면 꼬리 정맥을 통해 유체역학적 정맥내 주사로 (군당 5마리 동물) 동물당 0.5 μg, 동물당 5 μg 또는 동물당 50 μg 투여하였다. -1일차, 0일차, 1일차, 2일차, 3일차, 7일차 및 14일차에 체중을 측정하였다. -1일차, 3일차, 7일차 및 14일차에 각각의 처리된 동물에서 혈액 샘플을 채취하였다. 처리된 동물의 혈청 샘플 중 페닐알라닌의 양을 고처리량 질량 분석기로 측정하였다.
연구 설계는 하기 표 13에 제시되어 있다.
Figure pct00032
혈액 채취는 실시예 13에 기재된 바와 같이 수행하였다.
연구 세부사항은 하기와 같이 제공된다:
종(수, 성별, 연령): 35마리 + 1마리 예비용 PAH' 마우스(혼성, =6주령 내지 9주령, 연령 일치); 10마리 + 2마리 예비용 WT(한배새끼; 연령 일치).
화합물 부류: 지질 나노입자 중 DNA
케이지 관찰: 케이지 관찰은 매일 수행하였다.
임상 관찰: 임상 관찰은 시험 물질 투여(0일차) -1시간, =6시간 및 =24시간 후에 수행하였다. 예외에 따라 추가 관찰이 이루어졌다.
체중: 모든 동물의 체중을 -4일차, 0일차, 1일차, 2일차, 3일차, 7일차, 14일차, 21일차, 28일차 및 안락사 전에 기록하였다.
투여 제형: 시험 샘플은 농축 스톡으로 공급받았다. 사용 직전 스톡을 tPBS로 희석시켰다.
용량 투여: 0일차에, 군 1 내지 9에 대한 시험 재료를 측면 꼬리 정맥을 통해 동물당 설정된 부피, 90 내지 100 ml/kg(군 내 가장 가벼운 동물에 따라 달라짐)로 유체역학적 IV 투여로 투여하였다(5초 이내에 투여함).
혈액 채취 및 검시 전 금식: 모든 동물(모든 군)을 -4일차(=)의 투여전 기준선 혈액 채취, 및 3일차, 7일차, 14일차 및 21일차의 혈액 채취 전 최소 4시간 동안 금식시켰다.
혈액 채취: 각 채취 후, 동물에게 젖산 링거액 0.5 mL 내지 1.0 mL를 피하 투여하였다. 혈액 채취 표에 따라 동물에서 혈액을 채취하였다. -4(--)일차, 3일차, 7일차, 14일차 및 21일차에, 동물의 공복 혈청용 전혈을 채취하였다(상기 표 참조). 꼬리정맥 닉, 복재정맥 또는 안와정맥굴을 통해 동물의 혈청용 전혈을 채취하였다(시설 SOP에 따른 흡입용 이소플루란 하에서). 전혈은 혈전 활성화제가 포함된 혈청 분리기 튜브에 채취하였다. 1개의 분취액이 만들어졌다. 모든 샘플을 배송 시까지 공칭 -70℃에서 보관하였다.
마취 회복: 동물을 마취 하에 있는 동안, 회복하는 동안 및 움직일 때까지 지속적으로 모니터링하였다.
안락사 및 마지막 혈액 채취: 28일차에, 4시간 금식 후, CO2 질식, 개흉술 및 방혈을 통해 동물을 안락사시켰다. 심장 천자를 이용하여 수득 가능한 최대 혈액 부피를 수집하고, 시설 SOP에 따라 처리하고, 2개의 분취액으로 보관하였다.
관류: 방혈 후, 모든 동물은 식염수를 이용하여 심장 관류를 받았다. 간략하게, 염수가 함유된 10 mL 시린지가 부착된 23/21 게이지 바늘을 관류를 위해 좌심실의 내강에 삽입하여 전신 심장내 관류를 수행하였다. 관류액에 대한 배수구를 제공하기 위해 우심방을 절개하였다. 바늘을 심장에 위치시킨 후, 동물을 관류시키기 위해 플런저에 온건하고 일정한 압력을 가하였다. 배출되는 관류액이 투명하게 흐를 때까지(보이는 혈액이 없음), 즉, 플러싱 용액이 신체를 포화시키고 절차가 완료되었음을 나타낼 때까지 플러싱 용액의 적절한 흐름을 보장하였다.
조직 채취: 예정된 시점 이전에 안락사시킨 빈사 상태의 동물에서 말단 조직을 채취하였다. 가능한 경우, 죽은 채로 발견된 동물에서 조직을 채취하여 보관하였다.
안락사 및 관류 후, 간을 수거하였다. 간으로부터, 약 50 mg의 절편을 2개 수집하여, 칭량하지 않고 가능한 신속하게 급속 동결시켰다. 이어서, 약 25 mg 내지 50 mg(< 50 mg)의 절편을 3개 수집하고 칭량하였다. 절편을 개별적으로 급속 동결시키고, 배송 시까지 공칭 70℃에서 보관하였다. 나머지 모든 간은 폐기하였다.
페닐알라닌(PHE) 수준: Pure Honey에서 PHE 수준에 대해 혈청 샘플을 분석하였다.
활성 수준: Pure Honey에서 활성 수준에 대해 2개의 동결된 간 샘플을 분석하였다.
결과: 도 13에 도시된 바와 같이, 이러한 돌연변이 마우스 모델에서의 페닐알라닌 수준은 대조군 처리된 동물의 실험 전반에 걸쳐 일정하게 높게 유지되었다. VD-hPAH codop2를 함유하는 ceDNA 벡터의 투여는 마우스 내 페닐알라닌 수준을 용량 의존적 방식으로 실험 기간에 걸쳐 감소시켰다(도 13). 이러한 실험은, 유체역학적 주사로 투여된 ceDNA 벡터가 PKU의 마우스 모델에서 페닐알라닌 수준을 용량 의존적 방식으로 전신적으로 감소시킬 수 있는 활성 PAH를 발현시켰음을 입증한다.
실시예 15: 유체역학적 주사를 통한 PAH enu2 마우스 내 인간 PAH 효소의 발현에 의한 페닐알라닌 수준의 생화학적 교정을 평가하기 위한 약리학적 연구- PHE에 대한 hPAH-codop2 구조체와 PAH 효소 활성의 상관관계
PAHenu2 마우스의 페닐알라닌 수준에 대한 인간 PAH 효소의 발현 효과를 결정하고, 인간 PAH의 발현과 효소 활성을 연관시키기 위해 하기 연구를 수행하였다.
실시예 12에 기재된 바와 같은 ceDNA 벡터를 제조하였다. ceDNA PAH 벡터(임의의 LNP 캡슐화 없이 단독으로)와 대조군을 각각 대략 약 4주령 내지 6주령의 혼성 연령 일치 PAHenu2 마우스에 투여하였다. 네이키드 ceDNA 벡터를 <100 mg/mL 부피로 측면 꼬리 정맥을 통해 유체역학적 정맥내 주사로 동물(군당 6마리 동물)당 5 μg 투여하였다. -1일차, 0일차, 1일차, 2일차, 3일차, 7일차 및 14일차에 체중을 측정하였다. -1일차, 3일차, 7일차 및 14일차에 각각의 처리된 동물에서 혈액 샘플을 채취하였다. 처리된 동물의 혈청 샘플 중 페닐알라닌의 양을 고처리량 질량 분석기로 측정하고, 대조군 처리된 동물(PAHenu2)에서 관찰된 수준의 백분율로 표시하였다.
연구 설계는 하기 표 14에 제시되어 있다.
Figure pct00033
각각, 표 15A 및 표 15B에 따라, 중간 및 종료 시점에서 혈액을 채취하였다.
Figure pct00034
Figure pct00035
연구 세부사항은 하기와 같이 제공된다:
종(수, 성별, 연령): 55마리 + 2마리 예비용 PAHenu2 마우스(혼성, 약 5주령 내지 8주령, 연령 일치); 5마리 +1마리 예비용 WT(혼성, 한배새끼; 연령 일치).
화합물 부류: 지질 나노입자 중 DNA
케이지 관찰: 케이지 관찰은 매일 수행하였다.
임상 관찰: 임상 관찰은 투여 약 1시간, 약 6시간 및 약 24시간 후에 수행하였다. 예외에 따라 추가 관찰이 이루어졌다.
체중: 모든 동물의 체중을, 가능한 경우, -2일차, 0일차, 1일차, 2일차, 3일차, 7일차, 14일차, 21일차 및 28일차에 기록하였다.
투여 제형: 시험 샘플은 농축 스톡으로 공급받았다. 사용 직전 스톡을 Sponsor 제공 PBS로 희석시켰다.
용량 투여: 0일차에, 군 1 내지 12에 대한 시험 재료를 측면 꼬리 정맥을 통해 동물당 설정된 부피, 90 내지 100 ml/kg(군 내 가장 가벼운 동물에 따라 달라짐)로 유체역학적 IV 투여로 투여하였다(5초 이내에 투여함).
혈액 채취 및 검시 전 금식: 모든 동물(모든 군)을 -2일차, 3일차, 7일차, 14일차, 21일차 및 28일차의 모든 혈액 채취 및 검시 전 최소 4시간 동안 금식시켰다.
혈액 채취: 각 채취 후, 동물에게 젖산 링거액 0.5 mL 내지 1.0 mL를 피하 투여하였다. -2일차, 3일차, 7일차, 14일차 및 21일차에, 동물의 공복 혈청용 전혈을 채취하였다. 2개의 분취액이 만들어졌다. 모든 샘플을 배송 시까지 공칭 -70℃에서 보관하였다.
마취 회복: 동물을 마취 하에 있는 동안, 회복하는 동안 및 움직일 때까지 지속적으로 모니터링하였다.
안락사 및 마지막 혈액 채취: 28일차에, 4시간 금식 후, CO2 질식, 개흉술 및 방혈을 통해 동물을 안락사시켰다. 심장 천자를 이용하여 수득 가능한 최대 혈액 부피를 수집하고, 시설 SOP에 따라 처리하고, 2개의 분취액으로 보관하였다.
관류: 방혈 후, 모든 동물은 식염수를 이용하여 심장 관류를 받았다. 간략하게, 염수가 함유된 10 mL 시린지가 부착된 23/21 게이지 바늘을 관류를 위해 좌심실의 내강에 삽입하여 전신 심장내 관류를 수행하였다. 관류액에 대한 배수구를 제공하기 위해 우심방을 절개하였다. 바늘을 심장에 위치시킨 후, 동물을 관류시키기 위해 플런저에 온건하고 일정한 압력을 가하였다. 배출되는 관류액이 투명하게 흐를 때까지(보이는 혈액이 없음), 즉, 플러싱 용액이 신체를 포화시키고 절차가 완료되었음을 나타낼 때까지 플러싱 용액의 적절한 흐름을 보장하였다.
조직 채취: 예정된 시점 이전에 안락사시킨 빈사 상태의 동물에서 말단 조직을 채취하였다. 가능한 경우, 죽은 채로 발견된 동물에서 조직을 채취하여 보관하였다.
안락사 및 관류 후, 간을 수거하였다. 간으로부터, 약 50 mg의 절편을 2개 수집하여, 칭량하지 않고 가능한 신속하게 급속 동결시켰다. 이어서, 약 25 mg 내지 50 mg(≤ 50 mg)의 절편을 4개 수집하고 칭량하였다. 절편을 개별적으로 급속 동결시키고, 배송 시까지 공칭 70℃에서 보관하였다.
죄측 간엽을 조직학 카세트에 위치시키고, 10% NBF 중에 고정시키고, 냉장시켰다(약 4℃). 10% NBF 중의 조직을 냉장유지시키고(약 4℃), 배송 시에는 얼음 팩 위 밀봉된 용기에 보관하였다.
나머지 모든 간은 폐기하였다.
페닐알라닌(PHE) 수준: Pure Honey에서 PHE 수준에 대해 혈청 샘플을 분석하였다.
활성 수준: Pure Honey에서 활성 수준에 대해 2개의 동결된 간 샘플을 분석하였다.
결과: 도 14a 및 도 14b에 도시된 바와 같이, 3일차까지, 코돈 최적화된 인간 PAH 버전 2("Codop2")를 함유하는 ceDNA의 투여는 혈청 PHE 수준을 감소시켰으며, 이는 3일차부터 쥣과 PKU에서 혈중 페닐알라닌 수준을 교정하기에 충분한 PAH 활성을 나타낸다.
핵산 서열:
코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열이 하기에 제시되어 있다. 프로모터에는 밑줄이 그어져 있고(서열번호 191), 코돈 최적화된 PAH 버전 2 오픈리딩프레임(ORF)에는 이중 밑줄이 그어져 있다(서열번호 382).
AAAGTAGCCGAAGATGACGGTTTGTCACATGGAGTTGGCAGGATGTTTGATTAAAAACATAACAGGAAGAAAAATGCCCCGCTGTGGGCGGACAAAATAGTTGGGAACTGGGAGGGGTGGAAATGGAGTTTTTAAGGATTATTTAGGGAAGAGTGACAAAATAGATGGGAACTGGGTGTAGCGTCGTAAGCTAATACGAAAATTAAAAATGACAAAATAGTTTGGAACTAGATTTCACTTATCTGGTTCGGATCTCCTAGGCCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTTGTAGTTAATGATTAACCCGCCATGCTACTTATCGCGGCCGCCGGGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGGCTAAGTCCACACGCGTGGTACCGTCTGTCTGCACATTTCGTAGAGCGAGTGTTCCGATACTCTAATCTCCCTAGGCAAGGTTCATATTTGTGTAGGTTACTTATTCTCCTTTTGTTGACTAAGTCAATAATCAGAATCAGCAGGTTTGGAGTCAGCTTGGCAGGGATCAGCAGCCTGGGTTGGAAGGAGGGGGTATAAAAGCCCCTTCACCAGGAGAAGCCGTCACACAGATCCACAAGCTCCTGAAGAGGTAAGGGTTTAAGGGATGGTTGGTTGGTGGGGTATTAATGTTTAATTACCTGGAGCACCTGCCTGAAATCACTTTTTTTCAGGTTGGTTTAAACCGCAGCCACCATGAGCACCGCCGTGCTGGAAAATCCTGGCCTGGGCAGAAAGCTGAGCGACTTCGGCCAAGAGACAAGCTACATCGAGGACAACTGCAACCAGAACGGCGCCATCAGCCTGATCTTCAGCCTGAAAGAAGAAGTGGGCGCCCTGGCCAAGGTGCTGAGACTGTTCGAAGAGAACGACGTGAACCTGACACACATCGAGAGCAGACCCAGCAGACTGAAGAAGGACGAGTACGAGTTCTTCACCCACCTGGACAAGCGGAGCCTGCCTGCTCTGACCAACATCATCAAGATCCTGCGGCACGACATCGGCGCCACAGTGCACGAACTGAGCCGGGACAAGAAAAAGGACACCGTGCCATGGTTCCCCAGAACCATCCAAGAGCTGGACAGATTCGCCAACCAGATCCTGAGCTATGGCGCCGAGCTGGACGCTGATCACCCTGGCTTTAAGGACCCCGTGTACCGGGCCAGAAGAAAGCAGTTTGCCGATATCGCCTACAACTACCGGCACGGCCAGCCTATTCCTCGGGTCGAGTACATGGAAGAGGAAAAGAAAACCTGGGGCACCGTGTTCAAGACCCTGAAGTCCCTGTACAAGACCCACGCCTGCTACGAGTACAACCACATCTTCCCACTGCTCGAAAAGTACTGCGGCTTCCACGAGGACAATATCCCTCAGCTTGAGGACGTGTCCCAGTTCCTGCAGACCTGCACCGGCTTTAGACTGAGGCCAGTTGCCGGACTGCTGAGCAGCAGAGATTTTCTCGGCGGCCTGGCCTTCAGAGTGTTCCACTGTACCCAGTACATCAGACACGGCAGCAAGCCCATGTACACCCCTGAGCCTGATATCTGCCACGAGCTGCTGGGACATGTGCCCCTGTTCAGCGATAGAAGCTTCGCCCAGTTCAGCCAAGAGATCGGACTGGCTTCTCTGGGAGCCCCTGACGAGTACATTGAGAAGCTGGCCACCATCTACTGGTTCACCGTGGAATTCGGCCTGTGCAAGCAGGGCGACAGCATCAAAGCTTATGGCGCTGGCCTGCTGTCTAGCTTCGGCGAGCTGCAGTACTGTCTGAGCGAGAAGCCTAAGCTGCTGCCCCTGGAACTGGAAAAGACCGCCATCCAGAACTACACCGTGACCGAGTTCCAGCCTCTGTACTACGTGGCCGAGAGCTTCAACGACGCCAAAGAAAAAGTGCGGAACTTCGCCGCCACCATTCCTCGGCCTTTCAGCGTCAGATACGACCCCTACACACAGCGGATCGAGGTGCTGGACAACACACAGCAGCTGAAAATTCTGGCCGACTCCATCAACAGCGAGATCGGCATCCTGTGCAGCGCCCTGCAGAAAATCAAGTGATAGTTAATTAAGAGCATCTTACCGCCATTTATTCCCATATTTGTTCTGTTTTTCTTGATTTGGGTATACATTTAAATGTTAATAAAACAAAATGGTGGGGCAATCATTTACATTTTTAGGGATATGTAATTACTAGTTCAGGTGTATTGCCACAAGACAAACATGTTAAGAAACTTTCCCGTTATTTACGCTCTGTTCCTGTTAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGATATTCTTAACTATGTTGCTCCTTTTACGCTGTGTGGATATGCTGCTTTATAGCCTCTGTATCTAGCTATTGCTTCCCGTACGGCTTTCGTTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTTAGAGGAGTTGTGGCCCGTTGTCCGTCAACGTGGCGTGGTGTGCTCTGTGTTTGCTGACGCAACCCCCACTGGCTGGGGCATTGCCACCACCTGTCAACTCCTTTCTGGGACTTTCGCTTTCCCCCTCCCGATCGCCACGGCAGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTAGGTTGCTGGGCACTGATAATTCCGTGGTGTTGTCTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTCTAGAGCATGGCTACGTAGATAAGTAGCATGGCGGGTTAATCATTAACTACACCTGCAGGAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCGCCTCGAGCCATGGTGCTAGCAGCTGATGCATAGCATGCGGTACCGGGAGATGGGGGAGGCTAACTGAAACACGGAAGGAGACAATACCGGAAGGAACCCGCGCTATGACGGCAATAAAAAGACAGAATAAAACGCACGGGTGTTGGGTCGTTTGTTCATAAACGCGGGGTTCGGTCCCAGGGCTGGCACTCTGTCGATACCCCACCGAGACCCCATTGGGACCAATACGCCCGCGTTTCTTCCTTTTCCCCACCCCAACCCCCAAGTTCGGGTGAAGGCCCAGGGCTCGCAGCCAACGTCGGGGCGGCAAGCCCTGCCATAGCCACTACGGGTACGTAGGCCAACCACTAGAACTATAGCTAGAGTCCTGGGCGAACAAACGATGCTCGCCTTCCAGAAAACCGAGGATGCGAACCACTTCATCCGGGGTCAGCACCACCGGCAAGCGCCGCGACGGCCGAGGTCTACCGATCTCCTGAAGCCAGGGCAGATCCGTGCACAGCACCTTGCCGTAGAAGAACAGCAAGGCCGCCAATGCCTGACGATGCGTGGAGACCGAAACCTTGCGCTCGTTCGCCAGCCAGGACAGAAATGCCTCGACTTCGCTGCTGCCCAAGGTTGCCGGGTGACGCACACCGTGGAAACGGATGAAGGCACGAACCCAGTTGACATAAGCCTGTTCGGTTCGTAAACTGTAATGCAAGTAGCGTATGCGCTCACGCAACTGGTCCAGAACCTTGACCGAACGCAGCGGTGGTAACGGCGCAGTGGCGGTTTTCATGGCTTGTTATGACTGTTTTTTTGTACAGTCTATGCCTCGGGCATCCAAGCAGCAAGCGCGTTACGCCGTGGGTCGATGTTTGATGTTATGGAGCAGCAACGATGTTACGCAGCAGCAACGATGTTACGCAGCAGGGCAGTCGCCCTAAAACAAAGTTAGGTGGCTCAAGTATGGGCATCATTCGCACATGTAGGCTCGGCCCTGACCAAGTCAAATCCATGCGGGCTGCTCTTGATCTTTTCGGTCGTGAGTTCGGAGACGTAGCCACCTACTCCCAACATCAGCCGGACTCCGATTACCTCGGGAACTTGCTCCGTAGTAAGACATTCATCGCGCTTGCTGCCTTCGACCAAGAAGCGGTTGTTGGCGCTCTCGCGGCTTACGTTCTGCCCAGGTTTGAGCAGCCGCGTAGTGAGATCTATATCTATGATCTCGCAGTCTCCGGCGAGCACCGGAGGCAGGGCATTGCCACCGCGCTCATCAATCTCCTCAAGCATGAGGCCAACGCGCTTGGTGCTTATGTGATCTACGTGCAAGCAGATTACGGTGACGATCCCGCAGTGGCTCTCTATACAAAGTTGGGCATACGGGAAGAAGTGATGCACTTTGATATCGACCCAAGTACCGCCACCTAACAATTCGTTCAAGCCGAGATCGGCTTCCCGGCCGCGGAGTTGTTCGGTAAATTGTCACAACGCCGCGAATATAGTCTTTACCATGCCCTTGGCCACGCCCCTCTTTAATACGACGGGCAATTTGCACTTCAGAAAATGAAGAGTTTGCTTTAGCCATAACAAAAGTCCAGTATGCTTTTTCACAGCATAACTGGACTGATTTCAGTTTACAACTATTCTGTCTAGTTTAAGACTTTATTGTCATAGTTTAGATCTATTTTGTTCAGTTTAAGACTTTATTGTCCGCCCACACCCGCTTACGCAGGGCATCCATTTATTACTCAACCGTAACCGATTTTGCCAGGTTACGCGGCTGGTCTGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCAATGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGGACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGAAATTGTAAACGTTAATATTTTGTTAAAATTCGCGTTAAATTTTTGTTAAATCAGCTCATTTTTTAACCAATAGGCCGAAATCGGCAAAATCCCTTATAAATCAAAAGAATAGACCGAGATAGGGTTGAGTGTTGTTCCAGTTTGGAACAAGAGTCCACTATTAAAGAACGTGGACTCCAACGTCAAAGGGCGAAAAACCGTCTATCAGGGCGATGGCCCACTACGTGAACCATCACCCTAATCAAGTTTTTTGGGGTCGAGGTGCCGTAAAGCACTAAATCGGAACCCTAAAGGGAGCCCCCGATTTAGAGCTTGACGGGGAAAGCCGGCGAACGTGGCGAGAAAGGAAGGGAAGAAAGCGAAAGGAGCGGGCGCTAGGGCGCTGGCAAGTGTAGCGGTCACGCTGCGCGTAACCACCACACCCGCCGCGCTTAATGCGCCGCTACAGGGCGCGTCCCATTCGCCATTCAGGCTGCAAATAAGCGTTGATATTCAGTCAATTACAAACATTAATAACGAAGAGATGACAGAAAAATTTTCATTCTGTGACAGAGAA (서열번호 192)
상기 ceDNA 구조체는 left-ITR_v1: spacer_left-ITR_v2.1: VandenDriessche_Promoter Set: PmeI_site: Modified_Minimum_Consensus_Kozak: hPAH_codop_ORF_v2: PacI_site: WPRE_3pUTR: bGH/spacer: spacer_right-ITR_v1: right-ITR_v1를 포함한다.
일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192를 포함한다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192와 적어도 85% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192와 적어도 90% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192와 적어도 91% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192와 적어도 92% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192와 적어도 93% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192와 적어도 94% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192와 적어도 95% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192와 적어도 96% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192와 적어도 97% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192와 적어도 98% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192와 적어도 99% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192로 이루어져 있다.
인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열이 하기에 제시되어 있다. 프로모터에는 밑줄이 그어져 있고(서열번호 191), PAH 오픈리딩프레임(ORF)에는 이중 밑줄이 그어져 있다(서열번호 394).
GGCCGGCCCCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTTGTAGTTAATGATTAACCCGCCATGCTACTTATCTACGTAGCCATGCTCTAGACGGGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGGCTAAGTCCACACGCGTGGTACCGTCTGTCTGCACATTTCGTAGAGCGAGTGTTCCGATACTCTAATCTCCCTAGGCAAGGTTCATATTTGTGTAGGTTACTTATTCTCCTTTTGTTGACTAAGTCAATAATCAGAATCAGCAGGTTTGGAGTCAGCTTGGCAGGGATCAGCAGCCTGGGTTGGAAGGAGGGGGTATAAAAGCCCCTTCACCAGGAGAAGCCGTCACACAGATCCACAAGCTCCTGAAGAGGTAAGGGTTTAAGGGATGGTTGGTTGGTGGGGTATTAATGTTTAATTACCTGGAGCACCTGCCTGAAATCACTTTTTTTCAGGTTGGTTTAAACGCCGCCACCATGTCCACTGCGGTCCTGGAAAACCCAGGCTTGGGCAGGAAACTCTCTGACTTTGGACAGGAAACAAGCTATATTGAAGACAACTGCAATCAAAATGGTGCCATATCACTGATCTTCTCACTCAAAGAAGAAGTTGGTGCATTGGCCAAAGTATTGCGCTTATTTGAGGAGAATGATGTAAACCTGACCCACATTGAATCTAGACCTTCTCGTTTAAAGAAAGATGAGTATGAATTTTTCACCCATTTGGATAAACGTAGCCTGCCTGCTCTGACAAACATCATCAAGATCTTGAGGCATGACATTGGTGCCACTGTCCATGAGCTTTCACGAGATAAGAAGAAAGACACAGTGCCCTGGTTCCCAAGAACCATTCAAGAGCTGGACAGATTTGCCAATCAGATTCTCAGCTATGGAGCGGAACTGGATGCTGACCACCCTGGTTTTAAAGATCCTGTGTACCGTGCAAGACGGAAGCAGTTTGCTGACATTGCCTACAACTACCGCCATGGGCAGCCCATCCCTCGAGTGGAATACATGGAGGAAGAAAAGAAAACATGGGGCACAGTGTTCAAGACTCTGAAGTCCTTGTATAAAACCCATGCTTGCTATGAGTACAATCACATTTTTCCACTTCTTGAAAAGTACTGTGGCTTCCATGAAGATAACATTCCCCAGCTGGAAGACGTTTCTCAGTTCCTGCAGACTTGCACTGGTTTCCGCCTCCGACCTGTGGCTGGCCTGCTTTCCTCTCGGGATTTCTTGGGTGGCCTGGCCTTCCGAGTCTTCCACTGCACACAGTACATCAGACATGGATCCAAGCCCATGTATACCCCCGAACCTGACATCTGCCATGAGCTGTTGGGACATGTGCCCTTGTTTTCAGATCGCAGCTTTGCCCAGTTTTCCCAGGAAATTGGCCTTGCCTCTCTGGGTGCACCTGATGAATACATTGAAAAGCTCGCCACAATTTACTGGTTTACTGTGGAGTTTGGGCTCTGCAAACAAGGAGACTCCATAAAGGCATATGGTGCTGGGCTCCTGTCATCCTTTGGTGAATTACAGTACTGCTTATCAGAGAAGCCAAAGCTTCTCCCCCTGGAGCTGGAGAAGACAGCCATCCAAAATTACACTGTCACGGAGTTCCAGCCCCTCTATTACGTGGCAGAGAGTTTTAATGATGCCAAGGAGAAAGTAAGGAACTTTGCTGCCACAATACCTCGGCCCTTCTCAGTTCGCTACGACCCATACACCCAAAGGATTGAGGTCTTGGACAATACCCAGCAGCTTAAGATTTTGGCTGATTCCATTAACAGTGAAATTGGAATCCTTTGCAGTGCCCTCCAGAAAATAAAGTAATTAATTAAGAGCATCTTACCGCCATTTATTCCCATATTTGTTCTGTTTTTCTTGATTTGGGTATACATTTAAATGTTAATAAAACAAAATGGTGGGGCAATCATTTACATTTTTAGGGATATGTAATTACTAGTTCAGGTGTATTGCCACAAGACAAACATGTTAAGAAACTTTCCCGTTATTTACGCTCTGTTCCTGTTAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGATATTCTTAACTATGTTGCTCCTTTTACGCTGTGTGGATATGCTGCTTTATAGCCTCTGTATCTAGCTATTGCTTCCCGTACGGCTTTCGTTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTTAGAGGAGTTGTGGCCCGTTGTCCGTCAACGTGGCGTGGTGTGCTCTGTGTTTGCTGACGCAACCCCCACTGGCTGGGGCATTGCCACCACCTGTCAACTCCTTTCTGGGACTTTCGCTTTCCCCCTCCCGATCGCCACGGCAGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTAGGTTGCTGGGCACTGATAATTCCGTGGTGTTGTCTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTCTAGAGCATGGCTACGTAGATAAGTAGCATGGCGGGTTAATCATTAACTACACCTGCAGGAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCGCCTCGAGGCATGCGGTACCAAGCTTGTCGAGAAGTACTAGAGGATCATAATCAGCCATACCACATTTGTAGAGGTTTTACTTGCTTTAAAAAACCTCCCACACCTCCCCCTGAACCTGAAACATAAAATGAATGCAATTGTTGTTGTTAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGGATCTGATCACTGATATCGCCTAGGAGATCCGAACCAGATAAGTGAAATCTAGTTCCAAACTATTTTGTCATTTTTAATTTTCGTATTAGCTTACGACGCTACACCCAGTTCCCATCTATTTTGTCACTCTTCCCTAAATAATCCTTAAAAACTCCATTTCCACCCCTCCCAGTTCCCAACTATTTTGTCCGCCCACAGCGGGGCATTTTTCTTCCTGTTATGTTTTTAATCAAACATCCTGCCAACTCCATGTGACAAACCGTCATCTTCGGCTACTTTTTCTCTGTCACAGAATGAAAATTTTTCTGTCATCTCTTCGTTATTAATGTTTGTAATTGACTGAATATCAACGCTTATTTGCAGCCTGAATGGCGAATGGGACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCATTGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTTCTTTCCTGCGTTATCCCCTGATTCTGTGGATAACCGTATTACCGCCTTTGAGTGAGCTGATACCGCTCGCCGCAGCCGAACGACCGAGCGCAGCGAGTCAGTGAGCGAGGAAGCGGAAGAGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCAGACCAGCCGCGTAACCTGGCAAAATCGGTTACGGTTGAGTAATAAATGGATGCCCTGCGTAAGCGGGTGTGGGCGGACAATAAAGTCTTAAACTGAACAAAATAGATCTAAACTATGACAATAAAGTCTTAAACTAGACAGAATAGTTGTAAACTGAAATCAGTCCAGTTATGCTGTGAAAAAGCATACTGGACTTTTGTTATGGCTAAAGCAAACTCTTCATTTTCTGAAGTGCAAATTGCCCGTCGTATTAAAGAGGGGCGTGGCCAAGGGCATGGTAAAGACTATATTCGCGGCGTTGTGACAATTTACCGAACAACTCCGCGGCCGGGAAGCCGATCTCGGCTTGAACGAATTGTTAGGTGGCGGTACTTGGGTCGATATCAAAGTGCATCACTTCTTCCCGTATGCCCAACTTTGTATAGAGAGCCACTGCGGGATCGTCACCGTAATCTGCTTGCACGTAGATCACATAAGCACCAAGCGCGTTGGCCTCATGCTTGAGGAGATTGATGAGCGCGGTGGCAATGCCCTGCCTCCGGTGCTCGCCGGAGACTGCGAGATCATAGATATAGATCTCACTACGCGGCTGCTCAAACCTGGGCAGAACGTAAGCCGCGAGAGCGCCAACAACCGCTTCTTGGTCGAAGGCAGCAAGCGCGATGAATGTCTTACTACGGAGCAAGTTCCCGAGGTAATCGGAGTCCGGCTGATGTTGGGAGTAGGTGGCTACGTCTCCGAACTCACGACCGAAAAGATCAAGAGCAGCCCGCATGGATTTGACTTGGTCAGGGCCGAGCCTACATGTGCGAATGATGCCCATACTTGAGCCACCTAACTTTGTTTTAGGGCGACTGCCCTGCTGCGTAACATCGTTGCTGCTGCGTAACATCGTTGCTGCTCCATAACATCAAACATCGACCCACGGCGTAACGCGCTTGCTGCTTGGATGCCCGAGGCATAGACTGTACAAAAAAACAGTCATAACAAGCCATGAAAACCGCCACTGCGCCGTTACCACCGCTGCGTTCGGTCAAGGTTCTGGACCAGTTGCGTGAGCGCATACGCTACTTGCATTACAGTTTACGAACCGAACAGGCTTATGTCAACTGGGTTCGTGCCTTCATCCGTTTCCACGGTGTGCGTCACCCGGCAACCTTGGGCAGCAGCGAAGTCGAGGCATTTCTGTCCTGGCTGGCGAACGAGCGCAAGGTTTCGGTCTCCACGCATCGTCAGGCATTGGCGGCCTTGCTGTTCTTCTACGGCAAGGTGCTGTGCACGGATCTGCCCTGGCTTCAGGAGATCGGAAGACCTCGGCCGTCGCGGCGCTTGCCGGTGGTGCTGACCCCGGATGAAGTGGTTCGCATCCTCGGTTTTCTGGAAGGCGAGCATCGTTTGTTCGCCCAGGACTCTAGCTATAGTTCTAGTGGTTGGCTACGTATACTCCGGAATATTAATAGATCATGGAGATAATTAAAATGATAACCATCTCGCAAATAAATAAGTATTTTACTGTTTTCGTAACAGTTTTGTAATAAAAAAACCTATAAATATTCCGGATTATTCATACCGTCCCACCATCGGGCGCGGATCTCGGTCCGAAACCATGTCGTACTACCATCACCATCACCATCACGATTACGATATCCCAACGACCGAAAACCTGTATTTTCAGGGCGCCATGGGATCC (서열번호 193)
상기 구조체는 하기 요소를 포함한다. Left-ITR_v1: spacer_left-ITR_v1 : VandenDriessche_Promoter Set : PmeI_site : Consensus_Kozak : hPAH_cDNA_ORF_v3 : PacI_site : WPRE_3pUTR : bGH : spacer_right-ITR_v1 : right-ITR_v1.
일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193을 포함한다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193과 적어도 85% 동일하다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193과 적어도 90% 동일하다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193과 적어도 91% 동일하다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193과 적어도 92% 동일하다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193과 적어도 93% 동일하다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193과 적어도 94% 동일하다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193과 적어도 95% 동일하다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193과 적어도 96% 동일하다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193과 적어도 97% 동일하다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193과 적어도 98% 동일하다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193과 적어도 99% 동일하다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193으로 이루어져 있다.
코돈 최적화된 hPAH 버전 4(CpG 최소화 및 코돈 최적화된 인간 PAH)를 함유하는 ceDNA의 핵산 서열이 하기에 제시되어 있다. 프로모터에는 밑줄이 그어져 있고(서열번호 191), 코돈 최적화된 hPAH 버전 4 오픈리딩프레임(ORF)에는 이중 밑줄이 그어져 있다(서열번호 384).
GGCCGGCCCCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTTGTAGTTAATGATTAACCCGCCATGCTACTTATCTACGTAGCCATGCTCTAGACGGGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGGCTAAGTCCACACGCGTGGTACCGTCTGTCTGCACATTTCGTAGAGCGAGTGTTCCGATACTCTAATCTCCCTAGGCAAGGTTCATATTTGTGTAGGTTACTTATTCTCCTTTTGTTGACTAAGTCAATAATCAGAATCAGCAGGTTTGGAGTCAGCTTGGCAGGGATCAGCAGCCTGGGTTGGAAGGAGGGGGTATAAAAGCCCCTTCACCAGGAGAAGCCGTCACACAGATCCACAAGCTCCTGAAGAGGTAAGGGTTTAAGGGATGGTTGGTTGGTGGGGTATTAATGTTTAATTACCTGGAGCACCTGCCTGAAATCACTTTTTTTCAGGTTGGTTTAAACGCCGCCACCATGAGTACAGCTGTGCTTGAAAATCCTGGCCTGGGCAGGAAGCTTAGTGACTTTGGCCAGGAAACATCTTATATTGAAGACAACTGCAACCAGAATGGTGCCATTTCTCTTATCTTCTCCCTGAAAGAAGAGGTGGGAGCCCTGGCAAAGGTTTTAAGGCTCTTTGAGGAGAATGATGTGAATTTGACACACATTGAGTCCAGGCCTTCTAGACTCAAGAAAGATGAATATGAGTTCTTCACCCACCTGGACAAGAGGAGTCTCCCTGCTCTGACCAACATTATCAAGATCTTGAGACATGATATAGGAGCTACAGTGCATGAACTTTCAAGGGATAAAAAGAAGGACACTGTCCCCTGGTTTCCCAGAACTATCCAAGAATTAGACAGGTTTGCCAATCAGATCCTGAGCTATGGTGCAGAATTAGATGCAGACCACCCTGGGTTTAAAGACCCTGTGTATAGAGCCAGAAGAAAGCAGTTTGCTGACATTGCATACAACTACAGGCATGGGCAGCCCATTCCTAGGGTGGAGTACATGGAGGAAGAAAAAAAGACCTGGGGCACAGTTTTCAAGACCCTGAAGAGCCTTTACAAGACACATGCCTGCTATGAATATAACCATATATTTCCATTGTTGGAGAAATACTGTGGATTTCATGAAGATAACATCCCCCAGCTGGAGGATGTTAGTCAGTTTCTGCAGACCTGCACAGGCTTTAGACTGAGGCCAGTTGCAGGACTGCTAAGTTCTAGGGACTTCCTGGGTGGGCTAGCCTTCAGAGTGTTCCACTGTACCCAATATATAAGGCATGGATCCAAGCCCATGTACACCCCTGAGCCTGATATCTGCCATGAGCTATTGGGCCATGTCCCCCTATTTTCTGACAGAAGCTTTGCCCAGTTCTCCCAGGAGATTGGATTAGCCTCTCTGGGAGCTCCTGATGAGTACATTGAGAAGTTAGCAACCATCTACTGGTTCACTGTGGAATTTGGCCTTTGCAAACAAGGGGATAGTATAAAGGCTTATGGAGCAGGTCTGCTTAGCAGTTTTGGAGAGCTGCAGTACTGCCTGTCAGAAAAGCCAAAGCTCCTACCATTAGAACTAGAAAAGACTGCCATCCAGAACTATACAGTCACTGAATTCCAGCCTCTCTACTATGTGGCTGAGTCTTTCAATGATGCCAAGGAGAAGGTGAGAAATTTTGCAGCCACCATTCCCAGGCCCTTCTCTGTTAGATATGACCCCTACACTCAGAGGATTGAGGTCCTGGACAATACCCAGCAACTAAAAATTCTGGCTGATTCCATTAATTCTGAAATTGGCATCCTCTGCTCTGCTCTCCAGAAGATTAAATGATTAATTAAGAGCATCTTACCGCCATTTATTCCCATATTTGTTCTGTTTTTCTTGATTTGGGTATACATTTAAATGTTAATAAAACAAAATGGTGGGGCAATCATTTACATTTTTAGGGATATGTAATTACTAGTTCAGGTGTATTGCCACAAGACAAACATGTTAAGAAACTTTCCCGTTATTTACGCTCTGTTCCTGTTAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGATATTCTTAACTATGTTGCTCCTTTTACGCTGTGTGGATATGCTGCTTTATAGCCTCTGTATCTAGCTATTGCTTCCCGTACGGCTTTCGTTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTTAGAGGAGTTGTGGCCCGTTGTCCGTCAACGTGGCGTGGTGTGCTCTGTGTTTGCTGACGCAACCCCCACTGGCTGGGGCATTGCCACCACCTGTCAACTCCTTTCTGGGACTTTCGCTTTCCCCCTCCCGATCGCCACGGCAGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTAGGTTGCTGGGCACTGATAATTCCGTGGTGTTGTCTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTCTAGAGCATGGCTACGTAGATAAGTAGCATGGCGGGTTAATCATTAACTACACCTGCAGGAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCGCCTCGAGGCATGCGGTACCAAGCTTGTCGAGAAGTACTAGAGGATCATAATCAGCCATACCACATTTGTAGAGGTTTTACTTGCTTTAAAAAACCTCCCACACCTCCCCCTGAACCTGAAACATAAAATGAATGCAATTGTTGTTGTTAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGGATCTGATCACTGATATCGCCTAGGAGATCCGAACCAGATAAGTGAAATCTAGTTCCAAACTATTTTGTCATTTTTAATTTTCGTATTAGCTTACGACGCTACACCCAGTTCCCATCTATTTTGTCACTCTTCCCTAAATAATCCTTAAAAACTCCATTTCCACCCCTCCCAGTTCCCAACTATTTTGTCCGCCCACAGCGGGGCATTTTTCTTCCTGTTATGTTTTTAATCAAACATCCTGCCAACTCCATGTGACAAACCGTCATCTTCGGCTACTTTTTCTCTGTCACAGAATGAAAATTTTTCTGTCATCTCTTCGTTATTAATGTTTGTAATTGACTGAATATCAACGCTTATTTGCAGCCTGAATGGCGAATGGGACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCATTGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTTCTTTCCTGCGTTATCCCCTGATTCTGTGGATAACCGTATTACCGCCTTTGAGTGAGCTGATACCGCTCGCCGCAGCCGAACGACCGAGCGCAGCGAGTCAGTGAGCGAGGAAGCGGAAGAGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCAGACCAGCCGCGTAACCTGGCAAAATCGGTTACGGTTGAGTAATAAATGGATGCCCTGCGTAAGCGGGTGTGGGCGGACAATAAAGTCTTAAACTGAACAAAATAGATCTAAACTATGACAATAAAGTCTTAAACTAGACAGAATAGTTGTAAACTGAAATCAGTCCAGTTATGCTGTGAAAAAGCATACTGGACTTTTGTTATGGCTAAAGCAAACTCTTCATTTTCTGAAGTGCAAATTGCCCGTCGTATTAAAGAGGGGCGTGGCCAAGGGCATGGTAAAGACTATATTCGCGGCGTTGTGACAATTTACCGAACAACTCCGCGGCCGGGAAGCCGATCTCGGCTTGAACGAATTGTTAGGTGGCGGTACTTGGGTCGATATCAAAGTGCATCACTTCTTCCCGTATGCCCAACTTTGTATAGAGAGCCACTGCGGGATCGTCACCGTAATCTGCTTGCACGTAGATCACATAAGCACCAAGCGCGTTGGCCTCATGCTTGAGGAGATTGATGAGCGCGGTGGCAATGCCCTGCCTCCGGTGCTCGCCGGAGACTGCGAGATCATAGATATAGATCTCACTACGCGGCTGCTCAAACCTGGGCAGAACGTAAGCCGCGAGAGCGCCAACAACCGCTTCTTGGTCGAAGGCAGCAAGCGCGATGAATGTCTTACTACGGAGCAAGTTCCCGAGGTAATCGGAGTCCGGCTGATGTTGGGAGTAGGTGGCTACGTCTCCGAACTCACGACCGAAAAGATCAAGAGCAGCCCGCATGGATTTGACTTGGTCAGGGCCGAGCCTACATGTGCGAATGATGCCCATACTTGAGCCACCTAACTTTGTTTTAGGGCGACTGCCCTGCTGCGTAACATCGTTGCTGCTGCGTAACATCGTTGCTGCTCCATAACATCAAACATCGACCCACGGCGTAACGCGCTTGCTGCTTGGATGCCCGAGGCATAGACTGTACAAAAAAACAGTCATAACAAGCCATGAAAACCGCCACTGCGCCGTTACCACCGCTGCGTTCGGTCAAGGTTCTGGACCAGTTGCGTGAGCGCATACGCTACTTGCATTACAGTTTACGAACCGAACAGGCTTATGTCAACTGGGTTCGTGCCTTCATCCGTTTCCACGGTGTGCGTCACCCGGCAACCTTGGGCAGCAGCGAAGTCGAGGCATTTCTGTCCTGGCTGGCGAACGAGCGCAAGGTTTCGGTCTCCACGCATCGTCAGGCATTGGCGGCCTTGCTGTTCTTCTACGGCAAGGTGCTGTGCACGGATCTGCCCTGGCTTCAGGAGATCGGAAGACCTCGGCCGTCGCGGCGCTTGCCGGTGGTGCTGACCCCGGATGAAGTGGTTCGCATCCTCGGTTTTCTGGAAGGCGAGCATCGTTTGTTCGCCCAGGACTCTAGCTATAGTTCTAGTGGTTGGCTACGTATACTCCGGAATATTAATAGATCATGGAGATAATTAAAATGATAACCATCTCGCAAATAAATAAGTATTTTACTGTTTTCGTAACAGTTTTGTAATAAAAAAACCTATAAATATTCCGGATTATTCATACCGTCCCACCATCGGGCGCGGATCTCGGTCCGAAACCATGTCGTACTACCATCACCATCACCATCACGATTACGATATCCCAACGACCGAAAACCTGTATTTTCAGGGCGCCATGGGATCC (서열번호 194)
상기 ceDNA 구조체는 left-ITR_v1 : spacer_left-ITR_v1 : VandenDriessche_Promoter Set : PmeI_site : Consensus_Kozak : hPAH_CpGmin-codop_ORF_v4 : PacI_site : WPRE_3pUTR : bGH : spacer_right-ITR_v1 : right-ITR_v1를 포함한다.
일부 구현예에 따르면, 코돈 최적화된 hPAH 버전 4(CpG 최소화 및 코돈 최적화된 인간 PAH)를 함유하는 ceDNA의 핵산 서열은 서열번호 194를 포함한다. 일부 구현예에 따르면, 코돈 최적화된 hPAH 버전 4(CpG 최소화 및 코돈 최적화된 인간 PAH)를 함유하는 ceDNA의 핵산 서열은 서열번호 194와 적어도 85% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 hPAH 버전 4(CpG 최소화 및 코돈 최적화된 인간 PAH)를 함유하는 ceDNA의 핵산 서열은 서열번호 194와 적어도 90% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 hPAH 버전 4(CpG 최소화 및 코돈 최적화된 인간 PAH)를 함유하는 ceDNA의 핵산 서열은 서열번호 194와 적어도 91% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 hPAH 버전 4(CpG 최소화 및 코돈 최적화된 인간 PAH)를 함유하는 ceDNA의 핵산 서열은 서열번호 194와 적어도 92% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 hPAH 버전 4(CpG 최소화 및 코돈 최적화된 인간 PAH)를 함유하는 ceDNA의 핵산 서열은 서열번호 194와 적어도 93% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 hPAH 버전 4(CpG 최소화 및 코돈 최적화된 인간 PAH)를 함유하는 ceDNA의 핵산 서열은 서열번호 194와 적어도 94% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 hPAH 버전 4(CpG 최소화 및 코돈 최적화된 인간 PAH)를 함유하는 ceDNA의 핵산 서열은 서열번호 194와 적어도 95% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 hPAH 버전 4(CpG 최소화 및 코돈 최적화된 인간 PAH)를 함유하는 ceDNA의 핵산 서열은 서열번호 194와 적어도 96% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 hPAH 버전 4(CpG 최소화 및 코돈 최적화된 인간 PAH)를 함유하는 ceDNA의 핵산 서열은 서열번호 194와 적어도 97% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 hPAH 버전 4(CpG 최소화 및 코돈 최적화된 인간 PAH)를 함유하는 ceDNA의 핵산 서열은 서열번호 194와 적어도 98% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 hPAH 버전 4(CpG 최소화 및 코돈 최적화된 인간 PAH)를 함유하는 ceDNA의 핵산 서열은 서열번호 194와 적어도 99% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 hPAH 버전 4(CpG 최소화 및 코돈 최적화된 인간 PAH)를 함유하는 ceDNA의 핵산 서열은 서열번호 194로 이루어져 있다.
참고문헌
본 명세서 및 본원의 실시예에 인용된, 비제한적으로, 특허 및 특허 출원을 포함하는 모든 간행물 및 참고문헌은, 각각의 개별적인 간행물 또는 참고문헌이 구체적으로 및 개별적으로 완전하게 기재된 것으로서 본원에 참조로서 인용되는 것으로 표시된 바와 같이, 그 전문이 본원에 참조로서 인용된다. 본 출원이 우선권을 주장하는 임의의 특허 출원 또한 간행물 및 참고문헌에 대해 상기 기재된 방식으로 본원에 참조로서 인용된다.
SEQUENCE LISTING <110> GENERATION BIO CO. <120> NON-VIRAL DNA VECTORS AND USES THEREOF FOR EXPRESSING PHENYLALANINE HYDROXYLASE (PAH) THERAPEUTICS <130> 131698-05720 <140> PCT/US2020/022595 <141> 2020-03-13 <150> 62/857,514 <151> 2019-06-05 <150> 62/817,771 <151> 2019-03-13 <160> 396 <170> PatentIn version 3.5 <210> 1 <211> 141 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 1 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120 gagcgcgcag ctgcctgcag g 141 <210> 2 <211> 141 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 2 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc t 141 <210> 3 <211> 130 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 3 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc 120 tgcctgcagg 130 <210> 4 <211> 130 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 4 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct 130 <210> 5 <211> 143 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 5 ttgcccactc cctctctgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60 agacggcaga ggtctcctct gccggcccca ccgagcgagc gacgcgcgca gagagggagt 120 gggcaactcc atcactaggg taa 143 <210> 6 <211> 144 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 6 ttggccactc cctctatgcg cactcgctcg ctcggtgggg cctggcgacc aaaggtcgcc 60 agacggacgt gggtttccac gtccggcccc accgagcgag cgagtgcgca tagagggagt 120 ggccaactcc atcactagag gtat 144 <210> 7 <211> 127 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 7 ttggccactc cctctatgcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60 agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcat agagggagtg 120 gccaact 127 <210> 8 <211> 166 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 8 tcccccctgt cgcgttcgct cgctcgctgg ctcgtttggg ggggcgacgg ccagagggcc 60 gtcgtctggc agctctttga gctgccaccc ccccaaacga gccagcgagc gagcgaacgc 120 gacagggggg agagtgccac actctcaagc aagggggttt tgtaag 166 <210> 9 <211> 144 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 9 ttgcccactc cctctaatgc gcgctcgctc gctcggtggg gcctgcggac caaaggtccg 60 cagacggcag aggtctcctc tgccggcccc accgagcgag cgagcgcgca tagagggagt 120 gggcaactcc atcactaggg gtat 144 <210> 10 <211> 143 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 10 ttaccctagt gatggagttg cccactccct ctctgcgcgc gtcgctcgct cggtggggcc 60 ggcagaggag acctctgccg tctgcggacc tttggtccgc aggccccacc gagcgagcga 120 gcgcgcagag agggagtggg caa 143 <210> 11 <211> 144 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 11 atacctctag tgatggagtt ggccactccc tctatgcgca ctcgctcgct cggtggggcc 60 ggacgtggaa acccacgtcc gtctggcgac ctttggtcgc caggccccac cgagcgagcg 120 agtgcgcata gagggagtgg ccaa 144 <210> 12 <211> 127 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 12 agttggccac attagctatg cgcgctcgct cactcactcg gccctggaga ccaaaggtct 60 ccagactgcc ggcctctggc cggcagggcc gagtgagtga gcgagcgcgc atagagggag 120 tggccaa 127 <210> 13 <211> 166 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 13 cttacaaaac ccccttgctt gagagtgtgg cactctcccc cctgtcgcgt tcgctcgctc 60 gctggctcgt ttgggggggt ggcagctcaa agagctgcca gacgacggcc ctctggccgt 120 cgccccccca aacgagccag cgagcgagcg aacgcgacag ggggga 166 <210> 14 <211> 144 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 14 atacccctag tgatggagtt gcccactccc tctatgcgcg ctcgctcgct cggtggggcc 60 ggcagaggag acctctgccg tctgcggacc tttggtccgc aggccccacc gagcgagcga 120 gcgcgcatta gagggagtgg gcaa 144 <210> 15 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 15 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 cgcacgcccg ggtttcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg 120 <210> 16 <211> 122 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 16 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gctgcctgca 120 gg 122 <210> 17 <211> 129 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 17 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg gcgcctcagt gagcgagcga gcgcgcagct 120 gcctgcagg 129 <210> 18 <211> 101 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 18 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ctttgcctca gtgagcgagc gagcgcgcag ctgcctgcag g 101 <210> 19 <211> 139 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 19 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgaca aagtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga 120 gcgcgcagct gcctgcagg 139 <210> 20 <211> 137 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 20 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgaaa atcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc 120 gcgcagctgc ctgcagg 137 <210> 21 <211> 135 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 21 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgaaa cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc 120 gcagctgcct gcagg 135 <210> 22 <211> 133 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 22 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcaaag cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc 120 agctgcctgc agg 133 <210> 23 <211> 139 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 23 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg gtttcccggg cggcctcagt gagcgagcga 120 gcgcgcagct gcctgcagg 139 <210> 24 <211> 137 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 24 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg tttccgggcg gcctcagtga gcgagcgagc 120 gcgcagctgc ctgcagg 137 <210> 25 <211> 135 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 25 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgt ttcgggcggc ctcagtgagc gagcgagcgc 120 gcagctgcct gcagg 135 <210> 26 <211> 133 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 26 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgccctt tgggcggcct cagtgagcga gcgagcgcgc 120 agctgcctgc agg 133 <210> 27 <211> 131 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 27 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgccttt ggcggcctca gtgagcgagc gagcgcgcag 120 ctgcctgcag g 131 <210> 28 <211> 129 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 28 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgctttg cggcctcagt gagcgagcga gcgcgcagct 120 gcctgcagg 129 <210> 29 <211> 127 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 29 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgtttcg gcctcagtga gcgagcgagc gcgcagctgc 120 ctgcagg 127 <210> 30 <211> 122 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 30 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacggcctc agtgagcgag cgagcgcgca gctgcctgca 120 gg 122 <210> 31 <211> 130 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 31 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc 120 tgcctgcagg 130 <210> 32 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 32 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggaaacc cgggcgtgcg 60 cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct 120 <210> 33 <211> 122 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 33 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgt cgggcgacct ttggtcgccc 60 ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc 120 ct 122 <210> 34 <211> 122 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 34 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc 120 ct 122 <210> 35 <211> 129 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 35 cctgcaggca gctgcgcgct cgctcgctca ctgaggcgcc cgggcgtcgg gcgacctttg 60 gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac tccatcacta 120 ggggttcct 129 <210> 36 <211> 101 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 36 cctgcaggca gctgcgcgct cgctcgctca ctgaggcaaa gcctcagtga gcgagcgagc 60 gcgcagagag ggagtggcca actccatcac taggggttcc t 101 <210> 37 <211> 139 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 37 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacttt gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac 120 tccatcacta ggggttcct 139 <210> 38 <211> 137 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 38 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgatttt cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc 120 catcactagg ggttcct 137 <210> 39 <211> 135 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 39 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgtttcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120 tcactagggg ttcct 135 <210> 40 <211> 133 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 40 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggctttgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120 actaggggtt cct 133 <210> 41 <211> 139 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 41 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggaaacc cgggcgtcgg 60 gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac 120 tccatcacta ggggttcct 139 <210> 42 <211> 137 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 42 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccggaaaccg ggcgtcgggc 60 gacctttggt cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc 120 catcactagg ggttcct 137 <210> 43 <211> 135 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 43 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgaaacggg cgtcgggcga 60 cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120 tcactagggg ttcct 135 <210> 44 <211> 133 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 44 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccaaagggcg tcgggcgacc 60 tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120 actaggggtt cct 133 <210> 45 <211> 131 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 45 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc caaaggcgtc gggcgacctt 60 tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca actccatcac 120 taggggttcc t 131 <210> 46 <211> 129 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 46 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc aaagcgtcgg gcgacctttg 60 gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac tccatcacta 120 ggggttcct 129 <210> 47 <211> 127 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 47 cctgcaggca gctgcgcgct cgctcgctca ctgaggccga aacgtcgggc gacctttggt 60 cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc catcactagg 120 ggttcct 127 <210> 48 <211> 122 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 48 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacggcctc agtgagcgag cgagcgcgca gctgcctgca 120 gg 122 <210> 49 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 49 cgatcgttcg at 12 <210> 50 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 50 atcgaaccat cg 12 <210> 51 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 51 atcgaacgat cg 12 <210> 52 <211> 165 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 52 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgcccgggc aaagcccggg cgtcgggcga cctttggtcg cccggcctca gtgagcgagc 120 gagcgcgcag agagggagtg gccaactcca tcactagggg ttcct 165 <210> 53 <211> 140 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 53 cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac tgaggccgcc 60 cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctcagtgag cgagcgagcg 120 cgcagagaga tcactagggg 140 <210> 54 <211> 91 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 54 gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgacctttgg 60 tcgcccggcc tcagtgagcg agcgagcgcg c 91 <210> 55 <211> 91 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 55 gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc 60 ccgggcggcc tcagtgagcg agcgagcgcg c 91 <210> 56 <211> 1662 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 56 gccgccacca tggaagacgc caaaaacata aagaaaggcc cggcgccatt ctatccgctg 60 gaagatggaa ccgctggaga gcaactgcat aaggctatga agagatacgc cctggttcct 120 ggaacaattg cttttacaga tgcacatatc gaggtggaca tcacttacgc tgagtacttc 180 gaaatgtccg ttcggttggc agaagctatg aaacgatatg ggctgaatac aaatcacaga 240 atcgtcgtat gcagtgaaaa ctctcttcaa ttctttatgc cggtgttggg cgcgttattt 300 atcggagttg cagttgcgcc cgcgaacgac atttataatg aacgtgaatt gctcaacagt 360 atgggcattt cgcagcctac cgtggtgttc gtttccaaaa aggggttgca aaaaattttg 420 aacgtgcaaa aaaagctccc aatcatccaa aaaattatta tcatggattc taaaacggat 480 taccagggat ttcagtcgat gtacacgttc gtcacatctc atctacctcc cggttttaat 540 gaatacgatt ttgtgccaga gtccttcgat agggacaaga caattgcact gatcatgaac 600 tcctctggat ctactggtct gcctaaaggt gtcgctctgc ctcatagaac tgcctgcgtg 660 agattctcgc atgccagaga tcctattttt ggcaatcaaa tcattccgga tactgcgatt 720 ttaagtgttg ttccattcca tcacggtttt ggaatgttta ctacactcgg atatttgata 780 tgtggatttc gagtcgtctt aatgtataga tttgaagaag agctgtttct gaggagcctt 840 caggattaca agattcaaag tgcgctgctg gtgccaaccc tattctcctt cttcgccaaa 900 agcactctga ttgacaaata cgatttatct aatttacacg aaattgcttc tggtggcgct 960 cccctctcta aggaagtcgg ggaagcggtt gccaagaggt tccatctgcc aggtatcagg 1020 caaggatatg ggctcactga gactacatca gctattctga ttacacccga gggggatgat 1080 aaaccgggcg cggtcggtaa agttgttcca ttttttgaag cgaaggttgt ggatctggat 1140 accgggaaaa cgctgggcgt taatcaaaga ggcgaactgt gtgtgagagg tcctatgatt 1200 atgtccggtt atgtaaacaa tccggaagcg accaacgcct tgattgacaa ggatggatgg 1260 ctacattctg gagacatagc ttactgggac gaagacgaac acttcttcat cgttgaccgc 1320 ctgaagtctc tgattaagta caaaggctat caggtggctc ccgctgaatt ggaatccatc 1380 ttgctccaac accccaacat cttcgacgca ggtgtcgcag gtcttcccga cgatgacgcc 1440 ggtgaacttc ccgccgccgt tgttgttttg gagcacggaa agacgatgac ggaaaaagag 1500 atcgtggatt acgtcgccag tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg 1560 tttgtggacg aagtaccgaa aggtcttacc ggaaaactcg acgcaagaaa aatcagagag 1620 atcctcataa aggccaagaa gggcggaaag atcgccgtgt aa 1662 <210> 57 <211> 453 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <221> MOD_RES <222> (1)..(1) <223> Any amino acid <400> 57 Xaa Val Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln Pro Gly Arg 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Ala Phe Ser Ser Tyr 20 25 30 Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val 35 40 45 Ala Val Ile Trp Phe Asp Gly Thr Lys Lys Tyr Tyr Thr Asp Ser Val 50 55 60 Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr 65 70 75 80 Leu Gln Met Asn Thr Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ala Arg Asp Arg Gly Ile Gly Ala Arg Arg Gly Pro Tyr Tyr Met Asp 100 105 110 Val Trp Gly Lys Gly Thr Thr Val Thr Val Ser Ser Ala Ser Thr Lys 115 120 125 Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly 130 135 140 Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro 145 150 155 160 Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr 165 170 175 Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val 180 185 190 Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn 195 200 205 Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Arg Val Glu Pro 210 215 220 Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu 225 230 235 240 Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp 245 250 255 Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp 260 265 270 Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly 275 280 285 Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn 290 295 300 Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp 305 310 315 320 Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro 325 330 335 Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu 340 345 350 Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn 355 360 365 Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile 370 375 380 Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr 385 390 395 400 Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys 405 410 415 Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys 420 425 430 Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu 435 440 445 Ser Leu Ser Pro Gly 450 <210> 58 <211> 214 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 58 Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly 1 5 10 15 Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Ser Ile Ser Ser Tyr 20 25 30 Leu Asn Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile 35 40 45 Tyr Ala Ala Ser Ser Leu Gln Ser Gly Val Pro Ser Arg Phe Ser Gly 50 55 60 Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro 65 70 75 80 Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln Ser Tyr Ser Thr Pro Leu 85 90 95 Thr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala 100 105 110 Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly 115 120 125 Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala 130 135 140 Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln 145 150 155 160 Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser 165 170 175 Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr 180 185 190 Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser 195 200 205 Phe Asn Arg Gly Glu Cys 210 <210> 59 <211> 1310 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 59 ggagccgaga gtaattcata caaaaggagg gatcgccttc gcaaggggag agcccaggga 60 ccgtccctaa attctcacag acccaaatcc ctgtagccgc cccacgacag cgcgaggagc 120 atgcgctcag ggctgagcgc ggggagagca gagcacacaa gctcatagac cctggtcgtg 180 ggggggagga ccggggagct ggcgcggggc aaactgggaa agcggtgtcg tgtgctggct 240 ccgccctctt cccgagggtg ggggagaacg gtatataagt gcggcagtcg ccttggacgt 300 tctttttcgc aacgggtttg ccgtcagaac gcaggtgagg ggcgggtgtg gcttccgcgg 360 gccgccgagc tggaggtcct gctccgagcg ggccgggccc cgctgtcgtc ggcggggatt 420 agctgcgagc attcccgctt cgagttgcgg gcggcgcggg aggcagagtg cgaggcctag 480 cggcaacccc gtagcctcgc ctcgtgtccg gcttgaggcc tagcgtggtg tccgcgccgc 540 cgccgcgtgc tactccggcc gcactctggt cttttttttt tttgttgttg ttgccctgct 600 gccttcgatt gccgttcagc aataggggct aacaaaggga gggtgcgggg cttgctcgcc 660 cggagcccgg agaggtcatg gttggggagg aatggaggga caggagtggc ggctggggcc 720 cgcccgcctt cggagcacat gtccgacgcc acctggatgg ggcgaggcct ggggtttttc 780 ccgaagcaac caggctgggg ttagcgtgcc gaggccatgt ggccccagca cccggcacga 840 tctggcttgg cggcgccgcg ttgccctgcc tccctaacta gggtgaggcc atcccgtccg 900 gcaccagttg cgtgcgtgga aagatggccg ctcccgggcc ctgttgcaag gagctcaaaa 960 tggaggacgc ggcagcccgg tggagcgggc gggtgagtca cccacacaaa ggaagagggc 1020 ctggtccctc accggctgct gcttcctgtg accccgtggt cctatcggcc gcaatagtca 1080 cctcgggctt ttgagcacgg ctagtcgcgg cggggggagg ggatgtaatg gcgttggagt 1140 ttgttcacat ttggtgggtg gagactagtc aggccagcct ggcgctggaa gtcatttttg 1200 gaatttgtcc ccttgagttt tgagcggagc taattctcgg gcttcttagc ggttcaaagg 1260 tatcttttaa accctttttt aggtgttgtg aaaaccaccg ctaattcaaa 1310 <210> 60 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 60 gcgcgctcgc tcgctc 16 <210> 61 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 61 ggttga 6 <210> 62 <211> 4 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 62 agtt 4 <210> 63 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 63 ggttgg 6 <210> 64 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 64 agttgg 6 <210> 65 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 65 agttga 6 <210> 66 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 66 rrttrr 6 <210> 67 <211> 581 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 67 gagcatctta ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat 60 ttaaatgtta ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt 120 actagttcag gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc 180 tctgttcctg ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt 240 aactatgttg ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct 300 attgcttccc gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt 360 ttagaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac 420 gcaaccccca ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct 480 ttccccctcc cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca 540 ggggctaggt tgctgggcac tgataattcc gtggtgttgt c 581 <210> 68 <211> 225 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 68 tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct 60 ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct 120 gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg 180 ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggc 225 <210> 69 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 69 actgaggc 8 <210> 70 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 70 gcctcagt 8 <210> 71 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 71 gagcgagcga gcgcgc 16 <210> 72 <211> 1923 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 72 tcaatattgg ccattagcca tattattcat tggttatata gcataaatca atattggcta 60 ttggccattg catacgttgt atctatatca taatatgtac atttatattg gctcatgtcc 120 aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat caattacggg 180 gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc 240 gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 300 agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 360 ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg acgtcaatga 420 cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact ttcctacttg 480 gcagtacatc tacgtattag tcatcgctat taccatggtc gaggtgagcc ccacgttctg 540 cttcactctc cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta 600 attattttgt gcagcgatgg gggcgggggg gggggggggg cgcgcgccag gcggggcggg 660 gcggggcgag gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg 720 cgcgctccga aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg 780 aagcgcgcgg cgggcgggag tcgctgcgac gctgccttcg ccccgtgccc cgctccgccg 840 ccgcctcgcg ccgcccgccc cggctctgac tgaccgcgtt actcccacag gtgagcgggc 900 gggacggccc ttctcctccg ggctgtaatt agcgcttggt ttaatgacgg cttgtttctt 960 ttctgtggct gcgtgaaagc cttgaggggc tccgggaggg ccctttgtgc gggggggagc 1020 ggctcggggg gtgcgtgcgt gtgtgtgtgc gtggggagcg ccgcgtgcgg cccgcgctgc 1080 ccggcggctg tgagcgctgc gggcgcggcg cggggctttg tgcgctccgc agtgtgcgcg 1140 aggggagcgc ggccgggggc ggtgccccgc ggtgcggggg gggctgcgag gggaacaaag 1200 gctgcgtgcg gggtgtgtgc gtgggggggt gagcaggggg tgtgggcgcg gcggtcgggc 1260 tgtaaccccc ccctgcaccc ccctccccga gttgctgagc acggcccggc ttcgggtgcg 1320 gggctccgta cggggcgtgg cgcggggctc gccgtgccgg gcggggggtg gcggcaggtg 1380 ggggtgccgg gcggggcggg gccgcctcgg gccggggagg gctcggggga ggggcgcggc 1440 ggcccccgga gcgccggcgg ctgtcgaggc gcggcgagcc gcagccattg ccttttatgg 1500 taatcgtgcg agagggcgca gggacttcct ttgtcccaaa tctgtgcgga gccgaaatct 1560 gggaggcgcc gccgcacccc ctctagcggg cgcggggcga agcggtgcgg cgccggcagg 1620 aaggaaatgg gcggggaggg ccttcgtgcg tcgccgcgcc gccgtcccct tctccctctc 1680 cagcctcggg gctgtccgcg gggggacggc tgccttcggg ggggacgggg cagggcgggg 1740 ttcggcttct ggcgtgtgac cggcggctct agagcctctg ctaaccatgt tttagccttc 1800 ttctttttcc tacagctcct gggcaacgtg ctggttattg tgctgtctca tcatttgtcg 1860 acagaattcc tcgaagatcc gaaggggttc aagcttggca ttccggtact gttggtaaag 1920 cca 1923 <210> 73 <211> 1272 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 73 aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60 ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120 tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180 cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240 tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300 ggtttaggta gtgtgagagg gtccgggttc aaaaccactt gctgggtggg gagtcgtcag 360 taagtggcta tgccccgacc ccgaagcctg tttccccatc tgtacaatgg aaatgataaa 420 gacgcccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480 ttttgttttt tgagatggag gtttgctctg tcgcccaggc tggagtgcag tgacacaatc 540 tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600 gccaccacac ctggctaatt ttctattttt agtagagacg ggtttctcca tgttggtcag 660 cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacccgg ctaatttttt 720 ctatttttga cagggacggg gtttcaccat gttggtcagg ctggtctaga ggtaccggat 780 cttgctacca gtggaacagc cactaaggat tctgcagtga gagcagaggg ccagctaagt 840 ggtactctcc cagagactgt ctgactcacg ccaccccctc caccttggac acaggacgct 900 gtggtttctg agccaggtac aatgactcct ttcggtaagt gcagtggaag ctgtacactg 960 cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag atcccagcca gtggacttag 1020 cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca gcagcctccc 1080 ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagggccct gtctcctcag 1140 cttcaggcac caccactgac ctgggacagt gaatccggac tctaaggtaa atataaaatt 1200 tttaagtgta taatgtgtta aactactgat tctaattgtt tctctctttt agattccaac 1260 ctttggaact ga 1272 <210> 74 <211> 1177 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 74 ggctcagagg ctcagaggca cacaggagtt tctgggctca ccctgccccc ttccaacccc 60 tcagttccca tcctccagca gctgtttgtg tgctgcctct gaagtccaca ctgaacaaac 120 ttcagcctac tcatgtccct aaaatgggca aacattgcaa gcagcaaaca gcaaacacac 180 agccctccct gcctgctgac cttggagctg gggcagaggt cagagacctc tctgggccca 240 tgccacctcc aacatccact cgaccccttg gaatttcggt ggagaggagc agaggttgtc 300 ctggcgtggt ttaggtagtg tgagagggtc cgggttcaaa accacttgct gggtggggag 360 tcgtcagtaa gtggctatgc cccgaccccg aagcctgttt ccccatctgt acaatggaaa 420 tgataaagac gcccatctga tagggttttt gtggcaaata aacatttggt ttttttgttt 480 tgttttgttt tgttttttga gatggaggtt tgctctgtcg cccaggctgg agtgcagtga 540 cacaatctca tctcaccaca accttcccct gcctcagcct cccaagtagc tgggattaca 600 agcatgtgcc accacacctg gctaattttc tatttttagt agagacgggt ttctccatgt 660 tggtcagcct cagcctccca agtaactggg attacaggcc tgtgccacca cacccggcta 720 attttttcta tttttgacag ggacggggtt tcaccatgtt ggtcaggctg gtctagaggt 780 accggatctt gctaccagtg gaacagccac taaggattct gcagtgagag cagagggcca 840 gctaagtggt actctcccag agactgtctg actcacgcca ccccctccac cttggacaca 900 ggacgctgtg gtttctgagc caggtacaat gactcctttc ggtaagtgca gtggaagctg 960 tacactgccc aggcaaagcg tccgggcagc gtaggcgggc gactcagatc ccagccagtg 1020 gacttagccc ctgtttgctc ctccgataac tggggtgacc ttggttaata ttcaccagca 1080 gcctcccccg ttgcccctct ggatccactg cttaaatacg gacgaggaca gggccctgtc 1140 tcctcagctt caggcaccac cactgacctg ggacagt 1177 <210> 75 <211> 547 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 75 ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60 tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120 cactcgaccc cttggaattt ttcggtggag aggagcagag gttgtcctgg cgtggtttag 180 gtagtgtgag aggggaatga ctcctttcgg taagtgcagt ggaagctgta cactgcccag 240 gcaaagcgtc cgggcagcgt aggcgggcga ctcagatccc agccagtgga cttagcccct 300 gtttgctcct ccgataactg gggtgacctt ggttaatatt caccagcagc ctcccccgtt 360 gcccctctgg atccactgct taaatacgga cgaggacagg gccctgtctc ctcagcttca 420 ggcaccacca ctgacctggg acagtgaatc cggactctaa ggtaaatata aaatttttaa 480 gtgtataatg tgttaaacta ctgattctaa ttgtttctct cttttagatt ccaacctttg 540 gaactga 547 <210> 76 <211> 556 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 76 ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60 tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120 cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 180 agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc 240 aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt 300 ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc 360 ccctctggat ccactgctta aatacggacg aggacactcg agggccctgt ctcctcagct 420 tcaggcacca ccactgacct gggacagtga atccggacat cgattctaag gtaaatataa 480 aatttttaag tgtataattt gttaaactac tgattctaat tgtttctctc ttttagattc 540 caacctttgg aactga 556 <210> 77 <211> 1179 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 77 ggctccggtg cccgtcagtg ggcagagcgc acatcgccca cagtccccga gaagttgggg 60 ggaggggtcg gcaattgaac cggtgcctag agaaggtggc gcggggtaaa ctgggaaagt 120 gatgtcgtgt actggctccg cctttttccc gagggtgggg gagaaccgta tataagtgca 180 gtagtcgccg tgaacgttct ttttcgcaac gggtttgccg ccagaacaca ggtaagtgcc 240 gtgtgtggtt cccgcgggcc tggcctcttt acgggttatg gcccttgcgt gccttgaatt 300 acttccacct ggctgcagta cgtgattctt gatcccgagc ttcgggttgg aagtgggtgg 360 gagagttcga ggccttgcgc ttaaggagcc ccttcgcctc gtgcttgagt tgaggcctgg 420 cctgggcgct ggggccgccg cgtgcgaatc tggtggcacc ttcgcgcctg tctcgctgct 480 ttcgataagt ctctagccat ttaaaatttt tgatgacctg ctgcgacgct ttttttctgg 540 caagatagtc ttgtaaatgc gggccaagat ctgcacactg gtatttcggt ttttggggcc 600 gcgggcggcg acggggcccg tgcgtcccag cgcacatgtt cggcgaggcg gggcctgcga 660 gcgcggccac cgagaatcgg acgggggtag tctcaagctg gccggcctgc tctggtgcct 720 ggtctcgcgc cgccgtgtat cgccccgccc tgggcggcaa ggctggcccg gtcggcacca 780 gttgcgtgag cggaaagatg gccgcttccc ggccctgctg cagggagctc aaaatggagg 840 acgcggcgct cgggagagcg ggcgggtgag tcacccacac aaaggaaaag ggcctttccg 900 tcctcagccg tcgcttcatg tgactccacg gagtaccggg cgccgtccag gcacctcgat 960 tagttctcga gcttttggag tacgtcgtct ttaggttggg gggaggggtt ttatgcgatg 1020 gagtttcccc acactgagtg ggtggagact gaagttaggc cagcttggca cttgatgtaa 1080 ttctccttgg aatttgccct ttttgagttt ggatcttggt tcattctcaa gcctcagaca 1140 gtggttcaaa gtttttttct tccatttcag gtgtcgtga 1179 <210> 78 <211> 141 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 78 aataaacgat aacgccgttg gtggcgtgag gcatgtaaaa ggttacatca ttatcttgtt 60 cgccatccgg ttggtataaa tagacgttca tgttggtttt tgtttcagtt gcaagttggc 120 tgcggcgcgc gcagcacctt t 141 <210> 79 <211> 317 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 79 ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt 60 agtcagcaac caggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca 120 tgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc ccgcccctaa 180 ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt atttatgcag 240 aggccgaggc cgcctcggcc tctgagctat tccagaagta gtgaggaggc ttttttggag 300 gcctaggctt ttgcaaa 317 <210> 80 <211> 241 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 80 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 c 241 <210> 81 <211> 215 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 81 gaacgctgac gtcatcaacc cgctccaagg aatcgcgggc ccagtgtcac taggcgggaa 60 cacccagcgc gcgtgcgccc tggcaggaag atggctgtga gggacagggg agtggcgccc 120 tgcaatattt gcatgtcgct atgtgttctg ggaaatcacc ataaacgtga aatgtctttg 180 gatttgggaa tcgtataaga actgtatgag accac 215 <210> 82 <211> 546 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 82 ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60 tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120 cactcgaccc cttggaattt ttcggtggag aggagcagag gttgtcctgg cgtggtttag 180 gtagtgtgag aggggaatga ctcctttcgg taagtgcagt ggaagctgta cactgcccag 240 gcaaagcgtc cgggcagcgt aggcgggcga ctcagatccc agccagtgga cttagcccct 300 gtttgctcct ccgataactg gggtgacctt ggttaatatt caccagcagc ctcccccgtt 360 gcccctctgg atccactgct taaatacgga cgaggacagg gccctgtctc ctcagcttca 420 ggcaccacca ctgacctggg acagtgaatc cggactctaa ggtaaatata aaatttttaa 480 gtgtataatg tgttaaacta ctgattctaa ttgtttctct cttttagatt ccaacctttg 540 gaactg 546 <210> 83 <211> 576 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 83 tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg cgttacataa 60 cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt gacgtcaata 120 atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggag 180 tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc aagtacgccc 240 cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta 300 tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac catggtgatg 360 cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg atttccaagt 420 ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg ggactttcca 480 aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt acggtgggag 540 gtctatataa gcagagctgg tttagtgaac cgtcag 576 <210> 84 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 84 ataaacgata acgccgttgg tggcgtgagg catgtaaaag gttacatcat tatcttgttc 60 gccatccggt tggtataaat agacgttcat gttggttttt gtttcagttg caagttggct 120 gcggcgcgcg cagcaccttt gcggccatct 150 <210> 85 <211> 1313 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 85 ggagccgaga gtaattcata caaaaggagg gatcgccttc gcaaggggag agcccaggga 60 ccgtccctaa attctcacag acccaaatcc ctgtagccgc cccacgacag cgcgaggagc 120 atgcgcccag ggctgagcgc gggtagatca gagcacacaa gctcacagtc cccggcggtg 180 gggggagggg cgcgctgagc gggggccagg gagctggcgc ggggcaaact gggaaagtgg 240 tgtcgtgtgc tggctccgcc ctcttcccga gggtggggga gaacggtata taagtgcggt 300 agtcgccttg gacgttcttt ttcgcaacgg gtttgccgtc agaacgcagg tgagtggcgg 360 gtgtggcttc cgcgggcccc ggagctggag ccctgctctg agcgggccgg gctgatatgc 420 gagtgtcgtc cgcagggttt agctgtgagc attcccactt cgagtggcgg gcggtgcggg 480 ggtgagagtg cgaggcctag cggcaacccc gtagcctcgc ctcgtgtccg gcttgaggcc 540 tagcgtggtg tccgccgccg cgtgccactc cggccgcact atgcgttttt tgtccttgct 600 gccctcgatt gccttccagc agcatgggct aacaaaggga gggtgtgggg ctcactctta 660 aggagcccat gaagcttacg ttggatagga atggaagggc aggaggggcg actggggccc 720 gcccgccttc ggagcacatg tccgacgcca cctggatggg gcgaggcctg tggctttccg 780 aagcaatcgg gcgtgagttt agcctacctg ggccatgtgg ccctagcact gggcacggtc 840 tggcctggcg gtgccgcgtt cccttgcctc ccaacaaggg tgaggccgtc ccgcccggca 900 ccagttgctt gcgcggaaag atggccgctc ccggggccct gttgcaagga gctcaaaatg 960 gaggacgcgg cagcccggtg gagcgggcgg gtgagtcacc cacacaaagg aagagggcct 1020 tgcccctcgc cggccgctgc ttcctgtgac cccgtggtct atcggccgca tagtcacctc 1080 gggcttctct tgagcaccgc tcgtcgcggc ggggggaggg gatctaatgg cgttggagtt 1140 tgttcacatt tggtgggtgg agactagtca ggccagcctg gcgctggaag tcattcttgg 1200 aatttgcccc tttgagtttg gagcgaggct aattctcaag cctcttagcg gttcaaaggt 1260 attttctaaa cccgtttcca ggtgttgtga aagccaccgc taattcaaag caa 1313 <210> 86 <211> 213 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 86 taagatacat tgatgagttt ggacaaacca caactagaat gcagtgaaaa aaatgcttta 60 tttgtgaaat ttgtgatgct attgctttat ttgtaaccat tataagctgc aataaacaag 120 ttaacaacaa caattgcatt cattttatgt ttcaggttca gggggaggtg tgggaggttt 180 tttaaagcaa gtaaaacctc tacaaatgtg gta 213 <210> 87 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 87 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 88 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 88 Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly 1 5 10 15 Ala His Ser <210> 89 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 89 Met Leu Pro Ser Gln Leu Ile Gly Phe Leu Leu Leu Trp Val Pro Ala 1 5 10 15 Ser Arg Gly <210> 90 <211> 7 <212> PRT <213> Simian virus 40 <400> 90 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 91 <211> 21 <212> DNA <213> Simian virus 40 <400> 91 cccaagaaga agaggaaggt g 21 <210> 92 <211> 16 <212> PRT <213> Unknown <220> <223> Description of Unknown: Nucleoplasmin bipartite NLS sequence <400> 92 Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1 5 10 15 <210> 93 <211> 9 <212> PRT <213> Unknown <220> <223> Description of Unknown: C-myc NLS sequence <400> 93 Pro Ala Ala Lys Arg Val Lys Leu Asp 1 5 <210> 94 <211> 11 <212> PRT <213> Unknown <220> <223> Description of Unknown: C-myc NLS sequence <400> 94 Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro 1 5 10 <210> 95 <211> 38 <212> PRT <213> Homo sapiens <400> 95 Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly 1 5 10 15 Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro 20 25 30 Arg Asn Gln Gly Gly Tyr 35 <210> 96 <211> 42 <212> PRT <213> Unknown <220> <223> Description of Unknown: IBB domain from importin-alpha sequence <400> 96 Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu 1 5 10 15 Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys 20 25 30 Asp Glu Gln Ile Leu Lys Arg Arg Asn Val 35 40 <210> 97 <211> 8 <212> PRT <213> Unknown <220> <223> Description of Unknown: Myoma T protein sequence <400> 97 Val Ser Arg Lys Arg Pro Arg Pro 1 5 <210> 98 <211> 8 <212> PRT <213> Unknown <220> <223> Description of Unknown: Myoma T protein sequence <400> 98 Pro Pro Lys Lys Ala Arg Glu Asp 1 5 <210> 99 <211> 8 <212> PRT <213> Homo sapiens <400> 99 Pro Gln Pro Lys Lys Lys Pro Leu 1 5 <210> 100 <211> 12 <212> PRT <213> Mus musculus <400> 100 Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro 1 5 10 <210> 101 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 101 gcgcgctcgc tcgctcactg aggccgcccg ggaaacccgg gcgtgcgcct cagtgagcga 60 gcgagcgcgc 70 <210> 102 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 102 gcgcgctcgc tcgctcactg aggcgcacgc ccgggtttcc cgggcggcct cagtgagcga 60 gcgagcgcgc 70 <210> 103 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 103 gcgcgctcgc tcgctcactg aggccgtcgg gcgacctttg gtcgcccggc ctcagtgagc 60 gagcgagcgc gc 72 <210> 104 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 104 gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacggc ctcagtgagc 60 gagcgagcgc gc 72 <210> 105 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 105 gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggc ctcagtgagc 60 gagcgagcgc gc 72 <210> 106 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 106 gcgcgctcgc tcgctcactg aggccgacgc ccgggctttg cccgggcggc ctcagtgagc 60 gagcgagcgc gc 72 <210> 107 <211> 83 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 107 gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg ctttgcccgg 60 cctcagtgag cgagcgagcg cgc 83 <210> 108 <211> 83 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 108 gcgcgctcgc tcgctcactg aggccgggca aagcccgacg cccgggcttt gcccgggcgg 60 cctcagtgag cgagcgagcg cgc 83 <210> 109 <211> 77 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 109 gcgcgctcgc tcgctcactg aggccgaaac gtcgggcgac ctttggtcgc ccggcctcag 60 tgagcgagcg agcgcgc 77 <210> 110 <211> 77 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 110 gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgtt tcggcctcag 60 tgagcgagcg agcgcgc 77 <210> 111 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 111 gcgcgctcgc tcgctcactg aggcaaagcc tcagtgagcg agcgagcgcg c 51 <210> 112 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 112 gcgcgctcgc tcgctcactg aggctttgcc tcagtgagcg agcgagcgcg c 51 <210> 113 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 113 gcgcgctcgc tcgctcactg aggccgcccg ggcgtcgggc gacctttggt cgcccggcct 60 cagtgagcga gcgagcgcgc 80 <210> 114 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 114 gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct 60 cagtgagcga gcgagcgcgc 80 <210> 115 <211> 79 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 115 gcgcgctcgc tcgctcactg aggcgcccgg gcgtcgggcg acctttggtc gcccggcctc 60 agtgagcgag cgagcgcgc 79 <210> 116 <211> 79 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 116 gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcgcctc 60 agtgagcgag cgagcgcgc 79 <210> 117 <211> 5 <212> PRT <213> Influenza virus <400> 117 Asp Arg Leu Arg Arg 1 5 <210> 118 <211> 7 <212> PRT <213> Influenza virus <400> 118 Pro Lys Gln Lys Lys Arg Lys 1 5 <210> 119 <211> 10 <212> PRT <213> Hepatitis delta virus <400> 119 Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu 1 5 10 <210> 120 <211> 10 <212> PRT <213> Mus musculus <400> 120 Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg 1 5 10 <210> 121 <211> 20 <212> PRT <213> Homo sapiens <400> 121 Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys 1 5 10 15 Lys Ser Lys Lys 20 <210> 122 <211> 17 <212> PRT <213> Homo sapiens <400> 122 Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys 1 5 10 15 Lys <210> 123 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 123 gtttaaac 8 <210> 124 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 124 ttaattaa 8 <210> 125 <211> 141 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 125 aataaacgat aacgccgttg gtggcgtgag gcatgtaaaa ggttacatca ttatcttgtt 60 cgccatccgg ttggtataaa tagacgttca tgttggtttt tgtttcagtt gcaagttggc 120 tgcggcgcgc gcagcacctt t 141 <210> 126 <211> 317 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 126 ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt 60 agtcagcaac caggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca 120 tgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc ccgcccctaa 180 ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt atttatgcag 240 aggccgaggc cgcctcggcc tctgagctat tccagaagta gtgaggaggc ttttttggag 300 gcctaggctt ttgcaaa 317 <210> 127 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 127 gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacggc ctcagtgagc 60 gagcgagcgc gc 72 <210> 128 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 128 gagacagaca cactcctgct atgggtactg ctgctctggg ttccaggttc cactggtgac 60 <210> 129 <211> 1260 <212> DNA <213> Adeno-associated virus - 2 <400> 129 atggagctgg tcgggtggct cgtggacaag gggattacct cggagaagca gtggatccag 60 gaggaccagg cctcatacat ctccttcaat gcggcctcca actcgcggtc ccaaatcaag 120 gctgccttgg acaatgcggg aaagattatg agcctgacta aaaccgcccc cgactacctg 180 gtgggccagc agcccgtgga ggacatttcc agcaatcgga tttataaaat tttggaacta 240 aacgggtacg atccccaata tgcggcttcc gtctttctgg gatgggccac gaaaaagttc 300 ggcaagagga acaccatctg gctgtttggg cctgcaacta ccgggaagac caacatcgcg 360 gaggccatag cccacactgt gcccttctac gggtgcgtaa actggaccaa tgagaacttt 420 cccttcaacg actgtgtcga caagatggtg atctggtggg aggaggggaa gatgaccgcc 480 aaggtcgtgg agtcggccaa agccattctc ggaggaagca aggtgcgcgt ggaccagaaa 540 tgcaagtcct cggcccagat agacccgact cccgtgatcg tcacctccaa caccaacatg 600 tgcgccgtga ttgacgggaa ctcaacgacc ttcgaacacc agcagccgtt gcaagaccgg 660 atgttcaaat ttgaactcac ccgccgtctg gatcatgact ttgggaaggt caccaagcag 720 gaagtcaaag actttttccg gtgggcaaag gatcacgtgg ttgaggtgga gcatgaattc 780 tacgtcaaaa agggtggagc caagaaaaga cccgccccca gtgacgcaga tataagtgag 840 cccaaacggg tgcgcgagtc agttgcgcag ccatcgacgt cagacgcgga agcttcgatc 900 aactacgcag acaggtacca aaacaaatgt tctcgtcacg tgggcatgaa tctgatgctg 960 tttccctgca gacaatgcga gagaatgaat cagaattcaa atatctgctt cactcacgga 1020 cagaaagact gtttagagtg ctttcccgtg tcagaatctc aacccgtttc tgtcgtcaaa 1080 aaggcgtatc agaaactgtg ctacattcat catatcatgg gaaaggtgcc agacgcttgc 1140 actgcctgcg atctggtcaa tgtggatttg gatgactgca tctttgaaca ataaatgatt 1200 taaatcaggt atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga 1260 <210> 130 <211> 1932 <212> DNA <213> Adeno-associated virus - 2 <400> 130 atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60 ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120 tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180 cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240 caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300 aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360 taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420 gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480 acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540 aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600 gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660 tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720 cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780 tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840 cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900 attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960 acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020 accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080 aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140 aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200 gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260 aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320 ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380 gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440 gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500 gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560 gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620 aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680 ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740 tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800 ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860 caataaatga tttaaatcag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920 cactctctct ga 1932 <210> 131 <211> 1876 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 131 cgcagccacc atggcggggt tttacgagat tgtgattaag gtccccagcg accttgacgg 60 gcatctgccc ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt 120 gccgccagat tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga 180 gaagctgcag cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct 240 tttctttgtg caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac 300 caccggggtg aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat 360 tcagagaatt taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac 420 cagaaatggc gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt 480 gctccccaaa acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag 540 cgcctgtttg aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc 600 gcagacgcag gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag 660 atcaaaaact tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac 720 ctcggagaag cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc 780 caactcgcgg tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac 840 taaaaccgcc cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg 900 gatttataaa attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct 960 gggatgggcc acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac 1020 taccgggaag accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt 1080 aaactggacc aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg 1140 ggaggagggg aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag 1200 caaggtgcgc gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat 1260 cgtcacctcc aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca 1320 ccagcagccg ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga 1380 ctttgggaag gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt 1440 ggttgaggtg gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc 1500 cagtgacgca gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac 1560 gtcagacgcg gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca 1620 cgtgggcatg aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc 1680 aaatatctgc ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc 1740 tcaacccgtt tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat 1800 gggaaaggtg ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg 1860 catctttgaa caataa 1876 <210> 132 <211> 1194 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 132 atggagctgg tcgggtggct cgtggacaag gggattacct cggagaagca gtggatccag 60 gaggaccagg cctcatacat ctccttcaat gcggcctcca actcgcggtc ccaaatcaag 120 gctgccttgg acaatgcggg aaagattatg agcctgacta aaaccgcccc cgactacctg 180 gtgggccagc agcccgtgga ggacatttcc agcaatcgga tttataaaat tttggaacta 240 aacgggtacg atccccaata tgcggcttcc gtctttctgg gatgggccac gaaaaagttc 300 ggcaagagga acaccatctg gctgtttggg cctgcaacta ccgggaagac caacatcgcg 360 gaggccatag cccacactgt gcccttctac gggtgcgtaa actggaccaa tgagaacttt 420 cccttcaacg actgtgtcga caagatggtg atctggtggg aggaggggaa gatgaccgcc 480 aaggtcgtgg agtcggccaa agccattctc ggaggaagca aggtgcgcgt ggaccagaaa 540 tgcaagtcct cggcccagat agacccgact cccgtgatcg tcacctccaa caccaacatg 600 tgcgccgtga ttgacgggaa ctcaacgacc ttcgaacacc agcagccgtt gcaagaccgg 660 atgttcaaat ttgaactcac ccgccgtctg gatcatgact ttgggaaggt caccaagcag 720 gaagtcaaag actttttccg gtgggcaaag gatcacgtgg ttgaggtgga gcatgaattc 780 tacgtcaaaa agggtggagc caagaaaaga cccgccccca gtgacgcaga tataagtgag 840 cccaaacggg tgcgcgagtc agttgcgcag ccatcgacgt cagacgcgga agcttcgatc 900 aactacgcag accgctacca aaacaaatgt tctcgtcacg tgggcatgaa tctgatgctg 960 tttccctgca gacaatgcga gagaatgaat cagaattcaa atatctgctt cactcacgga 1020 cagaaagact gtttagagtg ctttcccgtg tcagaatctc aacccgtttc tgtcgtcaaa 1080 aaggcgtatc agaaactgtg ctacattcat catatcatgg gaaaggtgcc agacgcttgc 1140 actgcctgcg atctggtcaa tgtggatttg gatgactgca tctttgaaca ataa 1194 <210> 133 <211> 1876 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 133 cgcagccacc atggcggggt tttacgagat tgtgattaag gtccccagcg accttgacgg 60 gcatctgccc ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt 120 gccgccagat tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga 180 gaagctgcag cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct 240 tttctttgtg caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac 300 caccggggtg aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat 360 tcagagaatt taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac 420 cagaaatggc gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt 480 gctccccaaa acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag 540 cgcctgtttg aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc 600 gcagacgcag gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag 660 atcaaaaact tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac 720 ctcggagaag cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc 780 caactcgcgg tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac 840 taaaaccgcc cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg 900 gatttataaa attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct 960 gggatgggcc acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac 1020 taccgggaag accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt 1080 aaactggacc aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg 1140 ggaggagggg aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag 1200 caaggtgcgc gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat 1260 cgtcacctcc aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca 1320 ccagcagccg ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga 1380 ctttgggaag gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt 1440 ggttgaggtg gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc 1500 cagtgacgca gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac 1560 gtcagacgcg gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca 1620 cgtgggcatg aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc 1680 aaatatctgc ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc 1740 tcaacccgtt tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat 1800 gggaaaggtg ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg 1860 catctttgaa caataa 1876 <210> 134 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 134 ctaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg c 51 <210> 135 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 135 ctaggactga ggccgcccgg gcaaagcccg ggcgtcgggc gacctttggt cgcccggcct 60 cagtc 65 <210> 136 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 136 ggactgaggc cgcccgggca aagcccgggc gtcgggcgac ctttggtcgc ccggcctcag 60 tcctgca 67 <210> 137 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 137 gtgcgggcga ccaaaggtcg cccgacgccc gggcgcactc a 41 <210> 138 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 138 ggactgaggc cgggcgacca aaggtcgccc gacgcccggg cggcctcagt cctgca 56 <210> 139 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 139 ctaggactga ggccgcccgg gcgtcgggcg acctttggtc gcccggcctc agtc 54 <210> 140 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 140 ggactgaggc cgggcgacca aaggtcgccc gacggcctca gtcctgca 48 <210> 141 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 141 ctaggactga ggccgtcggg cgacctttgg tcgcccggcc tcagtc 46 <210> 142 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 142 ggactgaggc ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcgcctcag 60 tcctgca 67 <210> 143 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 143 atacctaggc acgcgtgtta ctagttatta atagtaatca attacgg 47 <210> 144 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 144 atacctaggg gccgcacgcg tgttactag 29 <210> 145 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 145 atacactcag tgcctgcagg cacgtggtcc ggagatccag ac 42 <210> 146 <211> 3754 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 146 cctaggtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct 60 tgtagttaat gattaacccg ccatgctact tatcgcggcc gctcaatatt ggccattagc 120 catattattc attggttata tagcataaat caatattggc tattggccat tgcatacgtt 180 gtatctatat cataatatgt acatttatat tggctcatgt ccaatatgac cgccatgttg 240 gcattgatta ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc 300 atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 360 cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 420 tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 480 agtgtatcat atgccaagtc cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 540 gcattatgcc cagtacatga ccttacggga ctttcctact tggcagtaca tctacgtatt 600 agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc tccccatctc 660 ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt gtgcagcgat 720 gggggcgggg gggggggggg ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg 780 cggggcgagg cggagaggtg cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc 840 ttttatggcg aggcggcggc ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcggg 900 agtcgctgcg acgctgcctt cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc 960 cccggctctg actgaccgcg ttactcccac aggtgagcgg gcgggacggc ccttctcctc 1020 cgggctgtaa ttagcgcttg gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa 1080 gccttgaggg gctccgggag ggccctttgt gcggggggga gcggctcggg gggtgcgtgc 1140 gtgtgtgtgt gcgtggggag cgccgcgtgc ggcccgcgct gcccggcggc tgtgagcgct 1200 gcgggcgcgg cgcggggctt tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg 1260 gcggtgcccc gcggtgcggg gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt 1320 gcgtgggggg gtgagcaggg ggtgtgggcg cggcggtcgg gctgtaaccc ccccctgcac 1380 ccccctcccc gagttgctga gcacggcccg gcttcgggtg cggggctccg tacggggcgt 1440 ggcgcggggc tcgccgtgcc gggcgggggg tggcggcagg tgggggtgcc gggcggggcg 1500 gggccgcctc gggccgggga gggctcgggg gaggggcgcg gcggcccccg gagcgccggc 1560 ggctgtcgag gcgcggcgag ccgcagccat tgccttttat ggtaatcgtg cgagagggcg 1620 cagggacttc ctttgtccca aatctgtgcg gagccgaaat ctgggaggcg ccgccgcacc 1680 ccctctagcg ggcgcggggc gaagcggtgc ggcgccggca ggaaggaaat gggcggggag 1740 ggccttcgtg cgtcgccgcg ccgccgtccc cttctccctc tccagcctcg gggctgtccg 1800 cggggggacg gctgccttcg ggggggacgg ggcagggcgg ggttcggctt ctggcgtgtg 1860 accggcggct ctagagcctc tgctaaccat gttttagcct tcttcttttt cctacagctc 1920 ctgggcaacg tgctggttat tgtgctgtct catcatttgt cgacagaatt cctcgaagat 1980 ccgaaggggt tcaagcttgg cattccggta ctgttggtaa agccagttta aacgccgcca 2040 ccatggtgag caagggcgag gagctgttca ccggggtggt gcccatcctg gtcgagctgg 2100 acggcgacgt aaacggccac aagttcagcg tgtccggcga gggcgagggc gatgccacct 2160 acggcaagct gaccctgaag ttcatctgca ccaccggcaa gctgcccgtg ccctggccca 2220 ccctcgtgac caccctgacc tacggcgtgc agtgcttcag ccgctacccc gaccacatga 2280 agcagcacga cttcttcaag tccgccatgc ccgaaggcta cgtccaggag cgcaccatct 2340 tcttcaagga cgacggcaac tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc 2400 tggtgaaccg catcgagctg aagggcatcg acttcaagga ggacggcaac atcctggggc 2460 acaagctgga gtacaactac aacagccaca acgtctatat catggccgac aagcagaaga 2520 acggcatcaa ggtgaacttc aagatccgcc acaacatcga ggacggcagc gtgcagctcg 2580 ccgaccacta ccagcagaac acccccatcg gcgacggccc cgtgctgctg cccgacaacc 2640 actacctgag cacccagtcc gccctgagca aagaccccaa cgagaagcgc gatcacatgg 2700 tcctgctgga gttcgtgacc gccgccggga tcactctcgg catggacgag ctgtacaagt 2760 aattaattaa gagcatctta ccgccattta ttcccatatt tgttctgttt ttcttgattt 2820 gggtatacat ttaaatgtta ataaaacaaa atggtggggc aatcatttac atttttaggg 2880 atatgtaatt actagttcag gtgtattgcc acaagacaaa catgttaaga aactttcccg 2940 ttatttacgc tctgttcctg ttaatcaacc tctggattac aaaatttgtg aaagattgac 3000 tgatattctt aactatgttg ctccttttac gctgtgtgga tatgctgctt tatagcctct 3060 gtatctagct attgcttccc gtacggcttt cgttttctcc tccttgtata aatcctggtt 3120 gctgtctctt ttagaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt 3180 gtttgctgac gcaaccccca ctggctgggg cattgccacc acctgtcaac tcctttctgg 3240 gactttcgct ttccccctcc cgatcgccac ggcagaactc atcgccgcct gccttgcccg 3300 ctgctggaca ggggctaggt tgctgggcac tgataattcc gtggtgttgt ctgtgccttc 3360 tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc 3420 cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg 3480 tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa 3540 tagcaggcat gctggggatg cggtgggctc tatggctcta gagcatggct acgtagataa 3600 gtagcatggc gggttaatca ttaactacac ctgcagcagg aacccctagt gatggagttg 3660 gccactccct ctctgcgcgc tcgctcgctc cctgcaggac tgaggccggg cgaccaaagg 3720 tcgcccgacg cccgggcggc ctcagtcctg cagg 3754 <210> 147 <211> 8418 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 147 ggcagctgcg cgctcgctcg ctcacctagg ccgcccgggc aaagcccggg cgtcgggcga 60 cctttggtcg cccggcctag gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120 tcactagggg ttccttgtag ttaatgatta acccgccatg ctacttatcg cggccgctca 180 atattggcca ttagccatat tattcattgg ttatatagca taaatcaata ttggctattg 240 gccattgcat acgttgtatc tatatcataa tatgtacatt tatattggct catgtccaat 300 atgaccgcca tgttggcatt gattattgac tagttattaa tagtaatcaa ttacggggtc 360 attagttcat agcccatata tggagttccg cgttacataa cttacggtaa atggcccgcc 420 tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt 480 aacgccaata gggactttcc attgacgtca atgggtggag tatttacggt aaactgccca 540 cttggcagta catcaagtgt atcatatgcc aagtccgccc cctattgacg tcaatgacgg 600 taaatggccc gcctggcatt atgcccagta catgacctta cgggactttc ctacttggca 660 gtacatctac gtattagtca tcgctattac catggtcgag gtgagcccca cgttctgctt 720 cactctcccc atctcccccc cctccccacc cccaattttg tatttattta ttttttaatt 780 attttgtgca gcgatggggg cggggggggg gggggggcgc gcgccaggcg gggcggggcg 840 gggcgagggg cggggcgggg cgaggcggag aggtgcggcg gcagccaatc agagcggcgc 900 gctccgaaag tttcctttta tggcgaggcg gcggcggcgg cggccctata aaaagcgaag 960 cgcgcggcgg gcgggagtcg ctgcgacgct gccttcgccc cgtgccccgc tccgccgccg 1020 cctcgcgccg cccgccccgg ctctgactga ccgcgttact cccacaggtg agcgggcggg 1080 acggcccttc tcctccgggc tgtaattagc gcttggttta atgacggctt gtttcttttc 1140 tgtggctgcg tgaaagcctt gaggggctcc gggagggccc tttgtgcggg ggggagcggc 1200 tcggggggtg cgtgcgtgtg tgtgtgcgtg gggagcgccg cgtgcggccc gcgctgcccg 1260 gcggctgtga gcgctgcggg cgcggcgcgg ggctttgtgc gctccgcagt gtgcgcgagg 1320 ggagcgcggc cgggggcggt gccccgcggt gcgggggggg ctgcgagggg aacaaaggct 1380 gcgtgcgggg tgtgtgcgtg ggggggtgag cagggggtgt gggcgcggcg gtcgggctgt 1440 aacccccccc tgcacccccc tccccgagtt gctgagcacg gcccggcttc gggtgcgggg 1500 ctccgtacgg ggcgtggcgc ggggctcgcc gtgccgggcg gggggtggcg gcaggtgggg 1560 gtgccgggcg gggcggggcc gcctcgggcc ggggagggct cgggggaggg gcgcggcggc 1620 ccccggagcg ccggcggctg tcgaggcgcg gcgagccgca gccattgcct tttatggtaa 1680 tcgtgcgaga gggcgcaggg acttcctttg tcccaaatct gtgcggagcc gaaatctggg 1740 aggcgccgcc gcaccccctc tagcgggcgc ggggcgaagc ggtgcggcgc cggcaggaag 1800 gaaatgggcg gggagggcct tcgtgcgtcg ccgcgccgcc gtccccttct ccctctccag 1860 cctcggggct gtccgcgggg ggacggctgc cttcgggggg gacggggcag ggcggggttc 1920 ggcttctggc gtgtgaccgg cggctctaga gcctctgcta accatgtttt agccttcttc 1980 tttttcctac agctcctggg caacgtgctg gttattgtgc tgtctcatca tttgtcgaca 2040 gaattcctcg aagatccgaa ggggttcaag cttggcattc cggtactgtt ggtaaagcca 2100 gtttaaacgc cgccaccatg gtgagcaagg gcgaggagct gttcaccggg gtggtgccca 2160 tcctggtcga gctggacggc gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg 2220 agggcgatgc cacctacggc aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc 2280 ccgtgccctg gcccaccctc gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct 2340 accccgacca catgaagcag cacgacttct tcaagtccgc catgcccgaa ggctacgtcc 2400 aggagcgcac catcttcttc aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt 2460 tcgagggcga caccctggtg aaccgcatcg agctgaaggg catcgacttc aaggaggacg 2520 gcaacatcct ggggcacaag ctggagtaca actacaacag ccacaacgtc tatatcatgg 2580 ccgacaagca gaagaacggc atcaaggtga acttcaagat ccgccacaac atcgaggacg 2640 gcagcgtgca gctcgccgac cactaccagc agaacacccc catcggcgac ggccccgtgc 2700 tgctgcccga caaccactac ctgagcaccc agtccgccct gagcaaagac cccaacgaga 2760 agcgcgatca catggtcctg ctggagttcg tgaccgccgc cgggatcact ctcggcatgg 2820 acgagctgta caagtaatta attaagagca tcttaccgcc atttattccc atatttgttc 2880 tgtttttctt gatttgggta tacatttaaa tgttaataaa acaaaatggt ggggcaatca 2940 tttacatttt tagggatatg taattactag ttcaggtgta ttgccacaag acaaacatgt 3000 taagaaactt tcccgttatt tacgctctgt tcctgttaat caacctctgg attacaaaat 3060 ttgtgaaaga ttgactgata ttcttaacta tgttgctcct tttacgctgt gtggatatgc 3120 tgctttatag cctctgtatc tagctattgc ttcccgtacg gctttcgttt tctcctcctt 3180 gtataaatcc tggttgctgt ctcttttaga ggagttgtgg cccgttgtcc gtcaacgtgg 3240 cgtggtgtgc tctgtgtttg ctgacgcaac ccccactggc tggggcattg ccaccacctg 3300 tcaactcctt tctgggactt tcgctttccc cctcccgatc gccacggcag aactcatcgc 3360 cgcctgcctt gcccgctgct ggacaggggc taggttgctg ggcactgata attccgtggt 3420 gttgtctgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt 3480 gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca 3540 ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga 3600 ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg ctctagagca 3660 tggctacgta gataagtagc atggcgggtt aatcattaac tacacctgca gcaggaaccc 3720 ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctccctgc aggactgagg 3780 ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag tcctgcaggg agcgagcgag 3840 cgcgcagctg cctgcacggg cgcgccggta ccgggagatg ggggaggcta actgaaacac 3900 ggaaggagac aataccggaa ggaacccgcg ctatgacggc aataaaaaga cagaataaaa 3960 cgcacgggtg ttgggtcgtt tgttcataaa cgcggggttc ggtcccaggg ctggcactct 4020 gtcgataccc caccgagacc ccattgggac caatacgccc gcgtttcttc cttttcccca 4080 ccccaacccc caagttcggg tgaaggccca gggctcgcag ccaacgtcgg ggcggcaagc 4140 cctgccatag ccactacggg tacgtaggcc aaccactaga actatagcta gagtcctggg 4200 cgaacaaacg atgctcgcct tccagaaaac cgaggatgcg aaccacttca tccggggtca 4260 gcaccaccgg caagcgccgc gacggccgag gtctaccgat ctcctgaagc cagggcagat 4320 ccgtgcacag caccttgccg tagaagaaca gcaaggccgc caatgcctga cgatgcgtgg 4380 agaccgaaac cttgcgctcg ttcgccagcc aggacagaaa tgcctcgact tcgctgctgc 4440 ccaaggttgc cgggtgacgc acaccgtgga aacggatgaa ggcacgaacc cagttgacat 4500 aagcctgttc ggttcgtaaa ctgtaatgca agtagcgtat gcgctcacgc aactggtcca 4560 gaaccttgac cgaacgcagc ggtggtaacg gcgcagtggc ggttttcatg gcttgttatg 4620 actgtttttt tgtacagtct atgcctcggg catccaagca gcaagcgcgt tacgccgtgg 4680 gtcgatgttt gatgttatgg agcagcaacg atgttacgca gcagcaacga tgttacgcag 4740 cagggcagtc gccctaaaac aaagttaggt ggctcaagta tgggcatcat tcgcacatgt 4800 aggctcggcc ctgaccaagt caaatccatg cgggctgctc ttgatctttt cggtcgtgag 4860 ttcggagacg tagccaccta ctcccaacat cagccggact ccgattacct cgggaacttg 4920 ctccgtagta agacattcat cgcgcttgct gccttcgacc aagaagcggt tgttggcgct 4980 ctcgcggctt acgttctgcc caggtttgag cagccgcgta gtgagatcta tatctatgat 5040 ctcgcagtct ccggcgagca ccggaggcag ggcattgcca ccgcgctcat caatctcctc 5100 aagcatgagg ccaacgcgct tggtgcttat gtgatctacg tgcaagcaga ttacggtgac 5160 gatcccgcag tggctctcta tacaaagttg ggcatacggg aagaagtgat gcactttgat 5220 atcgacccaa gtaccgccac ctaacaattc gttcaagccg agatcggctt cccggccgcg 5280 gagttgttcg gtaaattgtc acaacgccgc gaatatagtc tttaccatgc ccttggccac 5340 gcccctcttt aatacgacgg gcaatttgca cttcagaaaa tgaagagttt gctttagcca 5400 taacaaaagt ccagtatgct ttttcacagc ataactggac tgatttcagt ttacaactat 5460 tctgtctagt ttaagacttt attgtcatag tttagatcta ttttgttcag tttaagactt 5520 tattgtccgc ccacacccgc ttacgcaggg catccattta ttactcaacc gtaaccgatt 5580 ttgccaggtt acgcggctgg tctgcggtgt gaaataccgc acagatgcgt aaggagaaaa 5640 taccgcatca ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg 5700 ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg 5760 gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag 5820 gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga 5880 cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct 5940 ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc 6000 tttctccctt cgggaagcgt ggcgctttct caatgctcac gctgtaggta tctcagttcg 6060 gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc 6120 tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca 6180 ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag 6240 ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct 6300 ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc 6360 accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga 6420 tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca 6480 cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat 6540 taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac 6600 caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt 6660 gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt 6720 gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag 6780 ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct 6840 attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt 6900 gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc 6960 tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt 7020 agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg 7080 gttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg 7140 actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct 7200 tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc 7260 attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt 7320 tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt 7380 tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg 7440 aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta tcagggttat 7500 tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg 7560 cgcacatttc cccgaaaagt gccacctgaa attgtaaacg ttaatatttt gttaaaattc 7620 gcgttaaatt tttgttaaat cagctcattt tttaaccaat aggccgaaat cggcaaaatc 7680 ccttataaat caaaagaata gaccgagata gggttgagtg ttgttccagt ttggaacaag 7740 agtccactat taaagaacgt ggactccaac gtcaaagggc gaaaaaccgt ctatcagggc 7800 gatggcccac tacgtgaacc atcaccctaa tcaagttttt tggggtcgag gtgccgtaaa 7860 gcactaaatc ggaaccctaa agggagcccc cgatttagag cttgacgggg aaagccggcg 7920 aacgtggcga gaaaggaagg gaagaaagcg aaaggagcgg gcgctagggc gctggcaagt 7980 gtagcggtca cgctgcgcgt aaccaccaca cccgccgcgc ttaatgcgcc gctacagggc 8040 gcgtcccatt cgccattcag gctgcaaata agcgttgata ttcagtcaat tacaaacatt 8100 aataacgaag agatgacaga aaaattttca ttctgtgaca gagaaaaagt agccgaagat 8160 gacggtttgt cacatggagt tggcaggatg tttgattaaa aacataacag gaagaaaaat 8220 gccccgctgt gggcggacaa aatagttggg aactgggagg ggtggaaatg gagtttttaa 8280 ggattattta gggaagagtg acaaaataga tgggaactgg gtgtagcgtc gtaagctaat 8340 acgaaaatta aaaatgacaa aatagtttgg aactagattt cacttatctg gttcggatct 8400 cctagtgagc tccctgca 8418 <210> 148 <211> 225 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 148 tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct 60 ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct 120 gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg 180 ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggc 225 <210> 149 <211> 1177 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 149 ggctcagagg ctcagaggca cacaggagtt tctgggctca ccctgccccc ttccaacccc 60 tcagttccca tcctccagca gctgtttgtg tgctgcctct gaagtccaca ctgaacaaac 120 ttcagcctac tcatgtccct aaaatgggca aacattgcaa gcagcaaaca gcaaacacac 180 agccctccct gcctgctgac cttggagctg gggcagaggt cagagacctc tctgggccca 240 tgccacctcc aacatccact cgaccccttg gaatttcggt ggagaggagc agaggttgtc 300 ctggcgtggt ttaggtagtg tgagagggtc cgggttcaaa accacttgct gggtggggag 360 tcgtcagtaa gtggctatgc cccgaccccg aagcctgttt ccccatctgt acaatggaaa 420 tgataaagac gcccatctga tagggttttt gtggcaaata aacatttggt ttttttgttt 480 tgttttgttt tgttttttga gatggaggtt tgctctgtcg cccaggctgg agtgcagtga 540 cacaatctca tctcaccaca accttcccct gcctcagcct cccaagtagc tgggattaca 600 agcatgtgcc accacacctg gctaattttc tatttttagt agagacgggt ttctccatgt 660 tggtcagcct cagcctccca agtaactggg attacaggcc tgtgccacca cacccggcta 720 attttttcta tttttgacag ggacggggtt tcaccatgtt ggtcaggctg gtctagaggt 780 accggatctt gctaccagtg gaacagccac taaggattct gcagtgagag cagagggcca 840 gctaagtggt actctcccag agactgtctg actcacgcca ccccctccac cttggacaca 900 ggacgctgtg gtttctgagc caggtacaat gactcctttc ggtaagtgca gtggaagctg 960 tacactgccc aggcaaagcg tccgggcagc gtaggcgggc gactcagatc ccagccagtg 1020 gacttagccc ctgtttgctc ctccgataac tggggtgacc ttggttaata ttcaccagca 1080 gcctcccccg ttgcccctct ggatccactg cttaaatacg gacgaggaca gggccctgtc 1140 tcctcagctt caggcaccac cactgacctg ggacagt 1177 <210> 150 <211> 1326 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 150 ctgcagggcc cactagtgga gccgagagta attcatacaa aaggagggat cgccttcgca 60 aggggagagc ccagggaccg tccctaaatt ctcacagacc caaatccctg tagccgcccc 120 acgacagcgc gaggagcatg cgcccagggc tgagcgcggg tagatcagag cacacaagct 180 cacagtcccc ggcggtgggg ggaggggcgc gctgagcggg ggccagggag ctggcgcggg 240 gcaaactggg aaagtggtgt cgtgtgctgg ctccgccctc ttcccgaggg tgggggagaa 300 cggtatataa gtgcggtagt cgccttggac gttctttttc gcaacgggtt tgccgtcaga 360 acgcaggtga gtggcgggtg tggcttccgc gggccccgga gctggagccc tgctctgagc 420 gggccgggct gatatgcgag tgtcgtccgc agggtttagc tgtgagcatt cccacttcga 480 gtggcgggcg gtgcgggggt gagagtgcga ggcctagcgg caaccccgta gcctcgcctc 540 gtgtccggct tgaggcctag cgtggtgtcc gccgccgcgt gccactccgg ccgcactatg 600 cgttttttgt ccttgctgcc ctcgattgcc ttccagcagc atgggctaac aaagggaggg 660 tgtggggctc actcttaagg agcccatgaa gcttacgttg gataggaatg gaagggcagg 720 aggggcgact ggggcccgcc cgccttcgga gcacatgtcc gacgccacct ggatggggcg 780 aggcctgtgg ctttccgaag caatcgggcg tgagtttagc ctacctgggc catgtggccc 840 tagcactggg cacggtctgg cctggcggtg ccgcgttccc ttgcctccca acaagggtga 900 ggccgtcccg cccggcacca gttgcttgcg cggaaagatg gccgctcccg gggccctgtt 960 gcaaggagct caaaatggag gacgcggcag cccggtggag cgggcgggtg agtcacccac 1020 acaaaggaag agggccttgc ccctcgccgg ccgctgcttc ctgtgacccc gtggtctatc 1080 ggccgcatag tcacctcggg cttctcttga gcaccgctcg tcgcggcggg gggaggggat 1140 ctaatggcgt tggagtttgt tcacatttgg tgggtggaga ctagtcaggc cagcctggcg 1200 ctggaagtca ttcttggaat ttgccccttt gagtttggag cgaggctaat tctcaagcct 1260 cttagcggtt caaaggtatt ttctaaaccc gtttccaggt gttgtgaaag ccaccgctaa 1320 ttcaaa 1326 <210> 151 <211> 573 <212> DNA <213> Mus musculus <400> 151 gtaagagttt tatgtttttt catctctgct tgtatttttc tagtaatgga agcctggtat 60 tttaaaatag ttaaattttc ctttagtgct gatttctaga ttattattac tgttgttgtt 120 gttattattg tcattatttg catctgagaa cccttaggtg gttatattat tgatatattt 180 ttggtatctt tgatgacaat aatgggggat tttgaaagct tagctttaaa tttcttttaa 240 ttaaaaaaaa atgctaggca gaatgactca aattacgttg gatacagttg aatttattac 300 ggtctcatag ggcctgcctg ctcgaccatg ctatactaaa aattaaaagt gtgtgttact 360 aattttataa atggagtttc catttatatt tacctttatt tcttatttac cattgtctta 420 gtagatattt acaaacatga cagaaacact aaatcttgag tttgaatgca cagatataaa 480 cacttaacgg gttttaaaaa taataatgtt ggtgaaaaaa tataactttg agtgtagcag 540 agaggaacca ttgccacctt cagattttcc tgt 573 <210> 152 <211> 1993 <212> DNA <213> Mus musculus <400> 152 acgatcggga actggcatct tcagggagta gcttaggtca gtgaagagaa gaacaaaaag 60 cagcatatta cagttagttg tcttcatcaa tctttaaata tgttgtgtgg tttttctctc 120 cctgtttcca cagacaagag tgagatcgcc catcggtata atgatttggg agaacaacat 180 ttcaaaggcc tgtaagttat aatgctgaaa gcccacttaa tatttctggt agtattagtt 240 aaagttttaa aacacctttt tccaccttga gtgtgagaat tgtagagcag tgctgtccag 300 tagaaatgtg tgcattgaca gaaagactgt ggatctgtgc tgagcaatgt ggcagccaga 360 gatcacaagg ctatcaagca ctttgcacat ggcaagtgta actgagaagc acacattcaa 420 ataatagtta attttaattg aatgtatcta gccatgtgtg gctagtagct cctttcctgg 480 agagagaatc tggagcccac atctaacttg ttaagtctgg aatcttattt tttatttctg 540 gaaaggtcta tgaactatag ttttgggggc agctcactta ctaactttta atgcaataag 600 atctcatggt atcttgagaa cattattttg tctctttgta gtactgaaac cttatacatg 660 tgaagtaagg ggtctatact taagtcacat ctccaacctt agtaatgttt taatgtagta 720 aaaaaatgag taattaattt atttttagaa ggtcaatagt atcatgtatt ccaaataaca 780 gaggtatatg gttagaaaag aaacaattca aaggacttat ataatatcta gccttgacaa 840 tgaataaatt tagagagtag tttgcctgtt tgcctcatgt tcataaatct attgacacat 900 atgtgcatct gcacttcagc atggtagaag tccatattcc tttgcttgga aaggcaggtg 960 ttcccattac gcctcagaga atagctgacg ggaagaggct ttctagatag ttgtatgaaa 1020 gatatacaaa atctcgcagg tatacacagg catgatttgc tggttgggag agccacttgc 1080 ctcatactga ggtttttgtg tctgcttttc agagtcctga ttgccttttc ccagtatctc 1140 cagaaatgct catacgatga gcatgccaaa ttagtgcagg aagtaacaga ctttgcaaag 1200 acgtgtgttg ccgatgagtc tgccgccaac tgtgacaaat cccttgtgag taccttctga 1260 ttttgtggat ctactttcct gctttctgga actctgtttc aaagccaatc atgactccat 1320 cacttaaggc cccgggaaca ctgtggcaga gggcagcaga gagattgata aagccagggt 1380 gatgggaatt ttctgtggga ctccatttca tagtaattgc agaagctaca atacactcaa 1440 aaagtctcac cacatgactg cccaaatggg agcttgacag tgacagtgac agtagatatg 1500 ccaaagtgga tgagggaaag accacaagag ctaaaccctg taaaaagaac tgtaggcaac 1560 taaggaatgc agagagaaga agttgccttg gaagagcata ccaactgcct ctccaatacc 1620 aatggtcatc cctaaaacat acgtatgaat aacatgcaga ctaagcaggc tacatttagg 1680 aatatacatg tatttacata aatgtatatg catgtaacaa caatgaatga aaactgaggt 1740 catggatctg aaagagagca agggggctta catgagaggg tttggaggga ggggttggag 1800 ggagggaggt attattcttt agttttacag ggaacgtagt aaaaacatag gcttctccca 1860 aaggagcaga gcccatgagg agctgtgcaa ggttccccag cttgatttta cctgctcctc 1920 aaattccctt gatttgtttt tattataatg actttactcc tagcttttag tgtcagatag 1980 aaaacatgga agg 1993 <210> 153 <211> 1350 <212> DNA <213> Homo sapiens <400> 153 taggaggctg aggcaggagg atcgcttgag cccaggagtt cgagaccagc ctgggcaaca 60 tagtgtgatc ttgtatctat aaaaataaac aaaattagct tggtgtggtg gcgcctgtag 120 tccccagcca cttggagggg tgaggtgaga ggattgcttg agcccgggat ggtccaggct 180 gcagtgagcc atgatcgtgc cactgcactc cagcctgggc gacagagtga gaccctgtct 240 cacaacaaca acaacaacaa caaaaaggct gagctgcacc atgcttgacc cagtttctta 300 aaattgttgt caaagcttca ttcactccat ggtgctatag agcacaagat tttatttggt 360 gagatggtgc tttcatgaat tcccccaaca gagccaagct ctccatctag tggacaggga 420 agctagcagc aaaccttccc ttcactacaa aacttcattg cttggccaaa aagagagtta 480 attcaatgta gacatctatg taggcaatta aaaacctatt gatgtataaa acagtttgca 540 ttcatggagg gcaactaaat acattctagg actttataaa agatcacttt ttatttatgc 600 acagggtgga acaagatgga ttatcaagtg tcaagtccaa tctatgacat caattattat 660 acatcggagc cctgccaaaa aatcaatgtg aagcaaatcg cagcccgcct cctgcctccg 720 ctctactcac tggtgttcat ctttggtttt gtgggcaaca tgctggtcat cctcatcctg 780 ataaactgca aaaggctgaa gagcatgact gacatctacc tgctcaacct ggccatctct 840 gacctgtttt tccttcttac tgtccccttc tgggctcact atgctgccgc ccagtgggac 900 tttggaaata caatgtgtca actcttgaca gggctctatt ttataggctt cttctctgga 960 atcttcttca tcatcctcct gacaatcgat aggtacctgg ctgtcgtcca tgctgtgttt 1020 gctttaaaag ccaggacggt cacctttggg gtggtgacaa gtgtgatcac ttgggtggtg 1080 gctgtgtttg cgtctctccc aggaatcatc tttaccagat ctcaaaaaga aggtcttcat 1140 tacacctgca gctctcattt tccatacagt cagtatcaat tctggaagaa tttccagaca 1200 ttaaagatag tcatcttggg gctggtcctg ccgctgcttg tcatggtcat ctgctactcg 1260 ggaatcctaa aaactctgct tcggtgtcga aatgagaaga agaggcacag ggctgtgagg 1320 cttatcttca ccatcatgat tgtttatttt 1350 <210> 154 <211> 1223 <212> DNA <213> Homo sapiens <400> 154 tgacagagac tcttgggatg acgcactgct gcatcaaccc catcatctat gcctttgtcg 60 gggagaagtt cagaaactac ctcttagtct tcttccaaaa gcacattgcc aaacgcttct 120 gcaaatgctg ttctattttc cagcaagagg ctcccgagcg agcaagctca gtttacaccc 180 gatccactgg ggagcaggaa atatctgtgg gcttgtgaca cggactcaag tgggctggtg 240 acccagtcag agttgtgcac atggcttagt tttcatacac agcctgggct gggggtgggg 300 tgggagaggt cttttttaaa aggaagttac tgttatagag ggtctaagat tcatccattt 360 atttggcatc tgtttaaagt agattagatc ttttaagccc atcaattata gaaagccaaa 420 tcaaaatatg ttgatgaaaa atagcaacct ttttatctcc ccttcacatg catcaagtta 480 ttgacaaact ctcccttcac tccgaaagtt ccttatgtat atttaaaaga aagcctcaga 540 gaattgctga ttcttgagtt tagtgatctg aacagaaata ccaaaattat ttcagaaatg 600 tacaactttt tacctagtac aaggcaacat ataggttgta aatgtgttta aaacaggtct 660 ttgtcttgct atggggagaa aagacatgaa tatgattagt aaagaaatga cacttttcat 720 gtgtgatttc ccctccaagg tatggttaat aagtttcact gacttagaac caggcgagag 780 acttgtggcc tgggagagct ggggaagctt cttaaatgag aaggaatttg agttggatca 840 tctattgctg gcaaagacag aagcctcact gcaagcactg catgggcaag cttggctgta 900 gaaggagaca gagctggttg ggaagacatg gggaggaagg acaaggctag atcatgaaga 960 accttgacgg cattgctccg tctaagtcat gagctgagca gggagatcct ggttggtgtt 1020 gcagaaggtt tactctgtgg ccaaaggagg gtcaggaagg atgagcattt agggcaagga 1080 gaccaccaac agccctcagg tcagggtgag gatggcctct gctaagctca aggcgtgagg 1140 atgggaagga gggaggtatt cgtaaggatg ggaaggaggg aggtattcgt gcagcatatg 1200 aggatgcaga gtcagcagaa ctg 1223 <210> 155 <211> 215 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 155 gaacgctgac gtcatcaacc cgctccaagg aatcgcgggc ccagtgtcac taggcgggaa 60 cacccagcgc gcgtgcgccc tggcaggaag atggctgtga gggacagggg agtggcgccc 120 tgcaatattt gcatgtcgct atgtgttctg ggaaatcacc ataaacgtga aatgtctttg 180 gatttgggaa tcttataagt tctgtatgag accac 215 <210> 156 <211> 141 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 156 cctgcaggca gctgcgcgct cgctcgctca cctaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctaggtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc t 141 <210> 157 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 157 gcgcgctcgc tcgctcacc 19 <210> 158 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 158 ctaggtgagc gagcgagcgc gc 22 <210> 159 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 159 cctgcaggac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg 60 cctcagtcct gcagg 75 <210> 160 <211> 130 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 160 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagt 60 gcgggcgacc aaaggtcgcc cgacgcccgg gcgcactcag tgagcgagcg agcgcgcagc 120 tgcctgcagg 130 <210> 161 <211> 142 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 161 cctgcaggca gctgcgcgct cgctcgctcc ctaggactga ggccgcccgg gcgtcgggcg 60 acctttggtc gcccggcctc agtcctaggg agcgagcgag cgcgcagaga gggagtggcc 120 aactccatca ctaggggttc ct 142 <210> 162 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 162 gcgcgctcgc tcgctcactg agtgcgggcg accaaaggtc gcccgacgcc cgggcgcact 60 cagtgagcga gcgagcgcgc 80 <210> 163 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 163 gcgcgctcgc tcgctcactg a 21 <210> 164 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 164 gtgagcgagc gagcgcgc 18 <210> 165 <211> 89 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 165 gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgactttgtc 60 gcccggcctc agtgagcgag cgagcgcgc 89 <210> 166 <211> 89 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 166 gcgcgctcgc tcgctcactg aggccgggcg acaaagtcgc ccgacgcccg ggctttgccc 60 gggcggcctc agtgagcgag cgagcgcgc 89 <210> 167 <211> 87 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 167 gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgattttcgc 60 ccggcctcag tgagcgagcg agcgcgc 87 <210> 168 <211> 87 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 168 gcgcgctcgc tcgctcactg aggccgggcg aaaatcgccc gacgcccggg ctttgcccgg 60 gcggcctcag tgagcgagcg agcgcgc 87 <210> 169 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 169 gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgtttcgccc 60 ggcctcagtg agcgagcgag cgcgc 85 <210> 170 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 170 gcgcgctcgc tcgctcactg aggccgggcg aaacgcccga cgcccgggct ttgcccgggc 60 ggcctcagtg agcgagcgag cgcgc 85 <210> 171 <211> 89 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 171 gcgcgctcgc tcgctcactg aggccgcccg ggaaacccgg gcgtcgggcg acctttggtc 60 gcccggcctc agtgagcgag cgagcgcgc 89 <210> 172 <211> 89 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 172 gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggtttccc 60 gggcggcctc agtgagcgag cgagcgcgc 89 <210> 173 <211> 87 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 173 gcgcgctcgc tcgctcactg aggccgcccg gaaaccgggc gtcgggcgac ctttggtcgc 60 ccggcctcag tgagcgagcg agcgcgc 87 <210> 174 <211> 87 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 174 gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cggtttccgg 60 gcggcctcag tgagcgagcg agcgcgc 87 <210> 175 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 175 gcgcgctcgc tcgctcactg aggccgcccg aaacgggcgt cgggcgacct ttggtcgccc 60 ggcctcagtg agcgagcgag cgcgc 85 <210> 176 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 176 gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgtttcgggc 60 ggcctcagtg agcgagcgag cgcgc 85 <210> 177 <211> 83 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 177 gcgcgctcgc tcgctcactg aggccgccca aagggcgtcg ggcgaccttt ggtcgcccgg 60 cctcagtgag cgagcgagcg cgc 83 <210> 178 <211> 83 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 178 gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc ctttgggcgg 60 cctcagtgag cgagcgagcg cgc 83 <210> 179 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 179 gcgcgctcgc tcgctcactg aggccgccaa aggcgtcggg cgacctttgg tcgcccggcc 60 tcagtgagcg agcgagcgcg c 81 <210> 180 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 180 gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc tttggcggcc 60 tcagtgagcg agcgagcgcg c 81 <210> 181 <211> 79 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 181 gcgcgctcgc tcgctcactg aggccgcaaa gcgtcgggcg acctttggtc gcccggcctc 60 agtgagcgag cgagcgcgc 79 <210> 182 <211> 79 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 182 gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgct ttgcggcctc 60 agtgagcgag cgagcgcgc 79 <210> 183 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 183 ctgcgcgctc gctcgctcac tgaggccgaa acgtcgggcg acctttggtc gcccggcctc 60 agtgagcgag cgagcgcgca g 81 <210> 184 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 184 ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg tttcggcctc 60 agtgagcgag cgagcgcgca g 81 <210> 185 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 185 gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacggc ctcagtgagc 60 gagcgagcgc gc 72 <210> 186 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 186 gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct 60 cagtgagcga gcgagcgcgc 80 <210> 187 <211> 79 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 187 gcgcgctcgc tcgctcactg aggcgcccgg gcgtcgggcg acctttggtc gcccggcctc 60 agtgagcgag cgagcgcgc 79 <210> 188 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 188 ggagtcaaag ttctgtttgc cctgatctgc atcgctgtgg ccgaggcc 48 <210> 189 <211> 99 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 189 attcatacca acttgaagaa aaagttcagc ctcttcatcc tggtctttct cctgttcgca 60 gtcatctgtg tttggaagaa agggagcgac tatgaggcc 99 <210> 190 <211> 588 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 190 gcccctctcc ctcccccccc cctaacgtta ctggccgaag ccgcttggaa taaggccggt 60 gtgcgtttgt ctatatgtta ttttccacca tattgccgtc ttttggcaat gtgagggccc 120 ggaaacctgg ccctgtcttc ttgacgagca ttcctagggg tctttcccct ctcgccaaag 180 gaatgcaagg tctgttgaat gtcgtgaagg aagcagttcc tctggaagct tcttgaagac 240 aaacaacgtc tgtagcgacc ctttgcaggc agcggaaccc cccacctggc gacaggtgcc 300 tctgcggcca aaagccacgt gtataagata cacctgcaaa ggcggcacaa ccccagtgcc 360 acgttgtgag ttggatagtt gtggaaagag tcaaatggct ctcctcaagc gtattcaaca 420 aggggctgaa ggatgcccag aaggtacccc attgtatggg atctgatctg gggcctcggt 480 gcacatgctt tacatgtgtt tagtcgaggt taaaaaaacg tctaggcccc ccgaaccacg 540 gggacgtggt tttcctttga aaaacacgat gataatatgg ccacaacc 588 <210> 191 <211> 225 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 191 ccgtctgtct gcacatttcg tagagcgagt gttccgatac tctaatctcc ctaggcaagg 60 ttcatatttg tgtaggttac ttattctcct tttgttgact aagtcaataa tcagaatcag 120 caggtttgga gtcagcttgg cagggatcag cagcctgggt tggaaggagg gggtataaaa 180 gccccttcac caggagaagc cgtcacacag atccacaagc tcctg 225 <210> 192 <211> 7551 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 192 aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat 60 aacaggaaga aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg 120 aaatggagtt tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta 180 gcgtcgtaag ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt 240 atctggttcg gatctcctag gcctgcaggc agctgcgcgc tcgctcgctc actgaggccg 300 cccgggcaaa gcccgggcgt cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag 360 cgcgcagaga gggagtggcc aactccatca ctaggggttc cttgtagtta atgattaacc 420 cgccatgcta cttatcgcgg ccgccggggg aggctgctgg tgaatattaa ccaaggtcac 480 cccagttatc ggaggagcaa acaggggcta agtccacacg cgtggtaccg tctgtctgca 540 catttcgtag agcgagtgtt ccgatactct aatctcccta ggcaaggttc atatttgtgt 600 aggttactta ttctcctttt gttgactaag tcaataatca gaatcagcag gtttggagtc 660 agcttggcag ggatcagcag cctgggttgg aaggaggggg tataaaagcc ccttcaccag 720 gagaagccgt cacacagatc cacaagctcc tgaagaggta agggtttaag ggatggttgg 780 ttggtggggt attaatgttt aattacctgg agcacctgcc tgaaatcact ttttttcagg 840 ttggtttaaa ccgcagccac catgagcacc gccgtgctgg aaaatcctgg cctgggcaga 900 aagctgagcg acttcggcca agagacaagc tacatcgagg acaactgcaa ccagaacggc 960 gccatcagcc tgatcttcag cctgaaagaa gaagtgggcg ccctggccaa ggtgctgaga 1020 ctgttcgaag agaacgacgt gaacctgaca cacatcgaga gcagacccag cagactgaag 1080 aaggacgagt acgagttctt cacccacctg gacaagcgga gcctgcctgc tctgaccaac 1140 atcatcaaga tcctgcggca cgacatcggc gccacagtgc acgaactgag ccgggacaag 1200 aaaaaggaca ccgtgccatg gttccccaga accatccaag agctggacag attcgccaac 1260 cagatcctga gctatggcgc cgagctggac gctgatcacc ctggctttaa ggaccccgtg 1320 taccgggcca gaagaaagca gtttgccgat atcgcctaca actaccggca cggccagcct 1380 attcctcggg tcgagtacat ggaagaggaa aagaaaacct ggggcaccgt gttcaagacc 1440 ctgaagtccc tgtacaagac ccacgcctgc tacgagtaca accacatctt cccactgctc 1500 gaaaagtact gcggcttcca cgaggacaat atccctcagc ttgaggacgt gtcccagttc 1560 ctgcagacct gcaccggctt tagactgagg ccagttgccg gactgctgag cagcagagat 1620 tttctcggcg gcctggcctt cagagtgttc cactgtaccc agtacatcag acacggcagc 1680 aagcccatgt acacccctga gcctgatatc tgccacgagc tgctgggaca tgtgcccctg 1740 ttcagcgata gaagcttcgc ccagttcagc caagagatcg gactggcttc tctgggagcc 1800 cctgacgagt acattgagaa gctggccacc atctactggt tcaccgtgga attcggcctg 1860 tgcaagcagg gcgacagcat caaagcttat ggcgctggcc tgctgtctag cttcggcgag 1920 ctgcagtact gtctgagcga gaagcctaag ctgctgcccc tggaactgga aaagaccgcc 1980 atccagaact acaccgtgac cgagttccag cctctgtact acgtggccga gagcttcaac 2040 gacgccaaag aaaaagtgcg gaacttcgcc gccaccattc ctcggccttt cagcgtcaga 2100 tacgacccct acacacagcg gatcgaggtg ctggacaaca cacagcagct gaaaattctg 2160 gccgactcca tcaacagcga gatcggcatc ctgtgcagcg ccctgcagaa aatcaagtga 2220 tagttaatta agagcatctt accgccattt attcccatat ttgttctgtt tttcttgatt 2280 tgggtataca tttaaatgtt aataaaacaa aatggtgggg caatcattta catttttagg 2340 gatatgtaat tactagttca ggtgtattgc cacaagacaa acatgttaag aaactttccc 2400 gttatttacg ctctgttcct gttaatcaac ctctggatta caaaatttgt gaaagattga 2460 ctgatattct taactatgtt gctcctttta cgctgtgtgg atatgctgct ttatagcctc 2520 tgtatctagc tattgcttcc cgtacggctt tcgttttctc ctccttgtat aaatcctggt 2580 tgctgtctct tttagaggag ttgtggcccg ttgtccgtca acgtggcgtg gtgtgctctg 2640 tgtttgctga cgcaaccccc actggctggg gcattgccac cacctgtcaa ctcctttctg 2700 ggactttcgc tttccccctc ccgatcgcca cggcagaact catcgccgcc tgccttgccc 2760 gctgctggac aggggctagg ttgctgggca ctgataattc cgtggtgttg tctgtgcctt 2820 ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg 2880 ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt 2940 gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca 3000 atagcaggca tgctggggat gcggtgggct ctatggctct agagcatggc tacgtagata 3060 agtagcatgg cgggttaatc attaactaca cctgcaggag gaacccctag tgatggagtt 3120 ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg 3180 acgcccgggc ggcctcagtg agcgagcgag cgcgcagctg cctgcagggg cgcgcctcga 3240 gccatggtgc tagcagctga tgcatagcat gcggtaccgg gagatggggg aggctaactg 3300 aaacacggaa ggagacaata ccggaaggaa cccgcgctat gacggcaata aaaagacaga 3360 ataaaacgca cgggtgttgg gtcgtttgtt cataaacgcg gggttcggtc ccagggctgg 3420 cactctgtcg ataccccacc gagaccccat tgggaccaat acgcccgcgt ttcttccttt 3480 tccccacccc aacccccaag ttcgggtgaa ggcccagggc tcgcagccaa cgtcggggcg 3540 gcaagccctg ccatagccac tacgggtacg taggccaacc actagaacta tagctagagt 3600 cctgggcgaa caaacgatgc tcgccttcca gaaaaccgag gatgcgaacc acttcatccg 3660 gggtcagcac caccggcaag cgccgcgacg gccgaggtct accgatctcc tgaagccagg 3720 gcagatccgt gcacagcacc ttgccgtaga agaacagcaa ggccgccaat gcctgacgat 3780 gcgtggagac cgaaaccttg cgctcgttcg ccagccagga cagaaatgcc tcgacttcgc 3840 tgctgcccaa ggttgccggg tgacgcacac cgtggaaacg gatgaaggca cgaacccagt 3900 tgacataagc ctgttcggtt cgtaaactgt aatgcaagta gcgtatgcgc tcacgcaact 3960 ggtccagaac cttgaccgaa cgcagcggtg gtaacggcgc agtggcggtt ttcatggctt 4020 gttatgactg tttttttgta cagtctatgc ctcgggcatc caagcagcaa gcgcgttacg 4080 ccgtgggtcg atgtttgatg ttatggagca gcaacgatgt tacgcagcag caacgatgtt 4140 acgcagcagg gcagtcgccc taaaacaaag ttaggtggct caagtatggg catcattcgc 4200 acatgtaggc tcggccctga ccaagtcaaa tccatgcggg ctgctcttga tcttttcggt 4260 cgtgagttcg gagacgtagc cacctactcc caacatcagc cggactccga ttacctcggg 4320 aacttgctcc gtagtaagac attcatcgcg cttgctgcct tcgaccaaga agcggttgtt 4380 ggcgctctcg cggcttacgt tctgcccagg tttgagcagc cgcgtagtga gatctatatc 4440 tatgatctcg cagtctccgg cgagcaccgg aggcagggca ttgccaccgc gctcatcaat 4500 ctcctcaagc atgaggccaa cgcgcttggt gcttatgtga tctacgtgca agcagattac 4560 ggtgacgatc ccgcagtggc tctctataca aagttgggca tacgggaaga agtgatgcac 4620 tttgatatcg acccaagtac cgccacctaa caattcgttc aagccgagat cggcttcccg 4680 gccgcggagt tgttcggtaa attgtcacaa cgccgcgaat atagtcttta ccatgccctt 4740 ggccacgccc ctctttaata cgacgggcaa tttgcacttc agaaaatgaa gagtttgctt 4800 tagccataac aaaagtccag tatgcttttt cacagcataa ctggactgat ttcagtttac 4860 aactattctg tctagtttaa gactttattg tcatagttta gatctatttt gttcagttta 4920 agactttatt gtccgcccac acccgcttac gcagggcatc catttattac tcaaccgtaa 4980 ccgattttgc caggttacgc ggctggtctg cggtgtgaaa taccgcacag atgcgtaagg 5040 agaaaatacc gcatcaggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 5100 gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 5160 tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 5220 aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 5280 aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 5340 ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 5400 tccgcctttc tcccttcggg aagcgtggcg ctttctcaat gctcacgctg taggtatctc 5460 agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 5520 gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 5580 tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 5640 acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 5700 tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 5760 caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 5820 aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 5880 aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt 5940 ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac 6000 agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc 6060 atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt accatctggc 6120 cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata 6180 aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc 6240 cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc 6300 aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca 6360 ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa 6420 gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca 6480 ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt 6540 tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt 6600 tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg 6660 ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga 6720 tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc 6780 agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg 6840 acacggaaat gttgaatact catactcttc ctttttcaat attattgaag catttatcag 6900 ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg 6960 gttccgcgca catttccccg aaaagtgcca cctgaaattg taaacgttaa tattttgtta 7020 aaattcgcgt taaatttttg ttaaatcagc tcatttttta accaataggc cgaaatcggc 7080 aaaatccctt ataaatcaaa agaatagacc gagatagggt tgagtgttgt tccagtttgg 7140 aacaagagtc cactattaaa gaacgtggac tccaacgtca aagggcgaaa aaccgtctat 7200 cagggcgatg gcccactacg tgaaccatca ccctaatcaa gttttttggg gtcgaggtgc 7260 cgtaaagcac taaatcggaa ccctaaaggg agcccccgat ttagagcttg acggggaaag 7320 ccggcgaacg tggcgagaaa ggaagggaag aaagcgaaag gagcgggcgc tagggcgctg 7380 gcaagtgtag cggtcacgct gcgcgtaacc accacacccg ccgcgcttaa tgcgccgcta 7440 cagggcgcgt cccattcgcc attcaggctg caaataagcg ttgatattca gtcaattaca 7500 aacattaata acgaagagat gacagaaaaa ttttcattct gtgacagaga a 7551 <210> 193 <211> 7780 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 193 ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc 60 cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg 120 agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt 180 atctacgtag ccatgctcta gacgggggag gctgctggtg aatattaacc aaggtcaccc 240 cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc tgtctgcaca 300 tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat atttgtgtag 360 gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt ttggagtcag 420 cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc ttcaccagga 480 gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg atggttggtt 540 ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt 600 ggtttaaacg ccgccaccat gtccactgcg gtcctggaaa acccaggctt gggcaggaaa 660 ctctctgact ttggacagga aacaagctat attgaagaca actgcaatca aaatggtgcc 720 atatcactga tcttctcact caaagaagaa gttggtgcat tggccaaagt attgcgctta 780 tttgaggaga atgatgtaaa cctgacccac attgaatcta gaccttctcg tttaaagaaa 840 gatgagtatg aatttttcac ccatttggat aaacgtagcc tgcctgctct gacaaacatc 900 atcaagatct tgaggcatga cattggtgcc actgtccatg agctttcacg agataagaag 960 aaagacacag tgccctggtt cccaagaacc attcaagagc tggacagatt tgccaatcag 1020 attctcagct atggagcgga actggatgct gaccaccctg gttttaaaga tcctgtgtac 1080 cgtgcaagac ggaagcagtt tgctgacatt gcctacaact accgccatgg gcagcccatc 1140 cctcgagtgg aatacatgga ggaagaaaag aaaacatggg gcacagtgtt caagactctg 1200 aagtccttgt ataaaaccca tgcttgctat gagtacaatc acatttttcc acttcttgaa 1260 aagtactgtg gcttccatga agataacatt ccccagctgg aagacgtttc tcagttcctg 1320 cagacttgca ctggtttccg cctccgacct gtggctggcc tgctttcctc tcgggatttc 1380 ttgggtggcc tggccttccg agtcttccac tgcacacagt acatcagaca tggatccaag 1440 cccatgtata cccccgaacc tgacatctgc catgagctgt tgggacatgt gcccttgttt 1500 tcagatcgca gctttgccca gttttcccag gaaattggcc ttgcctctct gggtgcacct 1560 gatgaataca ttgaaaagct cgccacaatt tactggttta ctgtggagtt tgggctctgc 1620 aaacaaggag actccataaa ggcatatggt gctgggctcc tgtcatcctt tggtgaatta 1680 cagtactgct tatcagagaa gccaaagctt ctccccctgg agctggagaa gacagccatc 1740 caaaattaca ctgtcacgga gttccagccc ctctattacg tggcagagag ttttaatgat 1800 gccaaggaga aagtaaggaa ctttgctgcc acaatacctc ggcccttctc agttcgctac 1860 gacccataca cccaaaggat tgaggtcttg gacaataccc agcagcttaa gattttggct 1920 gattccatta acagtgaaat tggaatcctt tgcagtgccc tccagaaaat aaagtaatta 1980 attaagagca tcttaccgcc atttattccc atatttgttc tgtttttctt gatttgggta 2040 tacatttaaa tgttaataaa acaaaatggt ggggcaatca tttacatttt tagggatatg 2100 taattactag ttcaggtgta ttgccacaag acaaacatgt taagaaactt tcccgttatt 2160 tacgctctgt tcctgttaat caacctctgg attacaaaat ttgtgaaaga ttgactgata 2220 ttcttaacta tgttgctcct tttacgctgt gtggatatgc tgctttatag cctctgtatc 2280 tagctattgc ttcccgtacg gctttcgttt tctcctcctt gtataaatcc tggttgctgt 2340 ctcttttaga ggagttgtgg cccgttgtcc gtcaacgtgg cgtggtgtgc tctgtgtttg 2400 ctgacgcaac ccccactggc tggggcattg ccaccacctg tcaactcctt tctgggactt 2460 tcgctttccc cctcccgatc gccacggcag aactcatcgc cgcctgcctt gcccgctgct 2520 ggacaggggc taggttgctg ggcactgata attccgtggt gttgtctgtg ccttctagtt 2580 gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc 2640 ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt 2700 ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca 2760 ggcatgctgg ggatgcggtg ggctctatgg ctctagagca tggctacgta gataagtagc 2820 atggcgggtt aatcattaac tacacctgca ggaggaaccc ctagtgatgg agttggccac 2880 tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 2940 gggcggcctc agtgagcgag cgagcgcgca gctgcctgca ggggcgcgcc tcgaggcatg 3000 cggtaccaag cttgtcgaga agtactagag gatcataatc agccatacca catttgtaga 3060 ggttttactt gctttaaaaa acctcccaca cctccccctg aacctgaaac ataaaatgaa 3120 tgcaattgtt gttgttaact tgtttattgc agcttataat ggttacaaat aaagcaatag 3180 catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg gtttgtccaa 3240 actcatcaat gtatcttatc atgtctggat ctgatcactg atatcgccta ggagatccga 3300 accagataag tgaaatctag ttccaaacta ttttgtcatt tttaattttc gtattagctt 3360 acgacgctac acccagttcc catctatttt gtcactcttc cctaaataat ccttaaaaac 3420 tccatttcca cccctcccag ttcccaacta ttttgtccgc ccacagcggg gcatttttct 3480 tcctgttatg tttttaatca aacatcctgc caactccatg tgacaaaccg tcatcttcgg 3540 ctactttttc tctgtcacag aatgaaaatt tttctgtcat ctcttcgtta ttaatgtttg 3600 taattgactg aatatcaacg cttatttgca gcctgaatgg cgaatgggac gcgccctgta 3660 gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca 3720 gcgccctagc gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct 3780 ttccccgtca agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc 3840 acctcgaccc caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat 3900 agacggtttt tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc 3960 aaactggaac aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc 4020 cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta 4080 acaaaatatt aacgtttaca atttcaggtg gcacttttcg gggaaatgtg cgcggaaccc 4140 ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 4200 gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 4260 cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 4320 tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 4380 tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 4440 cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 4500 tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 4560 agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 4620 ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 4680 ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 4740 aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 4800 gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 4860 tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 4920 ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca gcactggggc 4980 cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 5040 atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 5100 cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 5160 ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 5220 cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 5280 ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 5340 tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 5400 taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 5460 caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 5520 agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 5580 gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 5640 gatacctaca gcgtgagcat tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 5700 ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 5760 acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 5820 tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 5880 ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta tcccctgatt 5940 ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc agccgaacga 6000 ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg tattttctcc 6060 ttacgcatct gtgcggtatt tcacaccgca gaccagccgc gtaacctggc aaaatcggtt 6120 acggttgagt aataaatgga tgccctgcgt aagcgggtgt gggcggacaa taaagtctta 6180 aactgaacaa aatagatcta aactatgaca ataaagtctt aaactagaca gaatagttgt 6240 aaactgaaat cagtccagtt atgctgtgaa aaagcatact ggacttttgt tatggctaaa 6300 gcaaactctt cattttctga agtgcaaatt gcccgtcgta ttaaagaggg gcgtggccaa 6360 gggcatggta aagactatat tcgcggcgtt gtgacaattt accgaacaac tccgcggccg 6420 ggaagccgat ctcggcttga acgaattgtt aggtggcggt acttgggtcg atatcaaagt 6480 gcatcacttc ttcccgtatg cccaactttg tatagagagc cactgcggga tcgtcaccgt 6540 aatctgcttg cacgtagatc acataagcac caagcgcgtt ggcctcatgc ttgaggagat 6600 tgatgagcgc ggtggcaatg ccctgcctcc ggtgctcgcc ggagactgcg agatcataga 6660 tatagatctc actacgcggc tgctcaaacc tgggcagaac gtaagccgcg agagcgccaa 6720 caaccgcttc ttggtcgaag gcagcaagcg cgatgaatgt cttactacgg agcaagttcc 6780 cgaggtaatc ggagtccggc tgatgttggg agtaggtggc tacgtctccg aactcacgac 6840 cgaaaagatc aagagcagcc cgcatggatt tgacttggtc agggccgagc ctacatgtgc 6900 gaatgatgcc catacttgag ccacctaact ttgttttagg gcgactgccc tgctgcgtaa 6960 catcgttgct gctgcgtaac atcgttgctg ctccataaca tcaaacatcg acccacggcg 7020 taacgcgctt gctgcttgga tgcccgaggc atagactgta caaaaaaaca gtcataacaa 7080 gccatgaaaa ccgccactgc gccgttacca ccgctgcgtt cggtcaaggt tctggaccag 7140 ttgcgtgagc gcatacgcta cttgcattac agtttacgaa ccgaacaggc ttatgtcaac 7200 tgggttcgtg ccttcatccg tttccacggt gtgcgtcacc cggcaacctt gggcagcagc 7260 gaagtcgagg catttctgtc ctggctggcg aacgagcgca aggtttcggt ctccacgcat 7320 cgtcaggcat tggcggcctt gctgttcttc tacggcaagg tgctgtgcac ggatctgccc 7380 tggcttcagg agatcggaag acctcggccg tcgcggcgct tgccggtggt gctgaccccg 7440 gatgaagtgg ttcgcatcct cggttttctg gaaggcgagc atcgtttgtt cgcccaggac 7500 tctagctata gttctagtgg ttggctacgt atactccgga atattaatag atcatggaga 7560 taattaaaat gataaccatc tcgcaaataa ataagtattt tactgttttc gtaacagttt 7620 tgtaataaaa aaacctataa atattccgga ttattcatac cgtcccacca tcgggcgcgg 7680 atctcggtcc gaaaccatgt cgtactacca tcaccatcac catcacgatt acgatatccc 7740 aacgaccgaa aacctgtatt ttcagggcgc catgggatcc 7780 <210> 194 <211> 7780 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 194 ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc 60 cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg 120 agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt 180 atctacgtag ccatgctcta gacgggggag gctgctggtg aatattaacc aaggtcaccc 240 cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc tgtctgcaca 300 tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat atttgtgtag 360 gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt ttggagtcag 420 cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc ttcaccagga 480 gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg atggttggtt 540 ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt 600 ggtttaaacg ccgccaccat gagtacagct gtgcttgaaa atcctggcct gggcaggaag 660 cttagtgact ttggccagga aacatcttat attgaagaca actgcaacca gaatggtgcc 720 atttctctta tcttctccct gaaagaagag gtgggagccc tggcaaaggt tttaaggctc 780 tttgaggaga atgatgtgaa tttgacacac attgagtcca ggccttctag actcaagaaa 840 gatgaatatg agttcttcac ccacctggac aagaggagtc tccctgctct gaccaacatt 900 atcaagatct tgagacatga tataggagct acagtgcatg aactttcaag ggataaaaag 960 aaggacactg tcccctggtt tcccagaact atccaagaat tagacaggtt tgccaatcag 1020 atcctgagct atggtgcaga attagatgca gaccaccctg ggtttaaaga ccctgtgtat 1080 agagccagaa gaaagcagtt tgctgacatt gcatacaact acaggcatgg gcagcccatt 1140 cctagggtgg agtacatgga ggaagaaaaa aagacctggg gcacagtttt caagaccctg 1200 aagagccttt acaagacaca tgcctgctat gaatataacc atatatttcc attgttggag 1260 aaatactgtg gatttcatga agataacatc ccccagctgg aggatgttag tcagtttctg 1320 cagacctgca caggctttag actgaggcca gttgcaggac tgctaagttc tagggacttc 1380 ctgggtgggc tagccttcag agtgttccac tgtacccaat atataaggca tggatccaag 1440 cccatgtaca cccctgagcc tgatatctgc catgagctat tgggccatgt ccccctattt 1500 tctgacagaa gctttgccca gttctcccag gagattggat tagcctctct gggagctcct 1560 gatgagtaca ttgagaagtt agcaaccatc tactggttca ctgtggaatt tggcctttgc 1620 aaacaagggg atagtataaa ggcttatgga gcaggtctgc ttagcagttt tggagagctg 1680 cagtactgcc tgtcagaaaa gccaaagctc ctaccattag aactagaaaa gactgccatc 1740 cagaactata cagtcactga attccagcct ctctactatg tggctgagtc tttcaatgat 1800 gccaaggaga aggtgagaaa ttttgcagcc accattccca ggcccttctc tgttagatat 1860 gacccctaca ctcagaggat tgaggtcctg gacaataccc agcaactaaa aattctggct 1920 gattccatta attctgaaat tggcatcctc tgctctgctc tccagaagat taaatgatta 1980 attaagagca tcttaccgcc atttattccc atatttgttc tgtttttctt gatttgggta 2040 tacatttaaa tgttaataaa acaaaatggt ggggcaatca tttacatttt tagggatatg 2100 taattactag ttcaggtgta ttgccacaag acaaacatgt taagaaactt tcccgttatt 2160 tacgctctgt tcctgttaat caacctctgg attacaaaat ttgtgaaaga ttgactgata 2220 ttcttaacta tgttgctcct tttacgctgt gtggatatgc tgctttatag cctctgtatc 2280 tagctattgc ttcccgtacg gctttcgttt tctcctcctt gtataaatcc tggttgctgt 2340 ctcttttaga ggagttgtgg cccgttgtcc gtcaacgtgg cgtggtgtgc tctgtgtttg 2400 ctgacgcaac ccccactggc tggggcattg ccaccacctg tcaactcctt tctgggactt 2460 tcgctttccc cctcccgatc gccacggcag aactcatcgc cgcctgcctt gcccgctgct 2520 ggacaggggc taggttgctg ggcactgata attccgtggt gttgtctgtg ccttctagtt 2580 gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc 2640 ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt 2700 ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca 2760 ggcatgctgg ggatgcggtg ggctctatgg ctctagagca tggctacgta gataagtagc 2820 atggcgggtt aatcattaac tacacctgca ggaggaaccc ctagtgatgg agttggccac 2880 tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 2940 gggcggcctc agtgagcgag cgagcgcgca gctgcctgca ggggcgcgcc tcgaggcatg 3000 cggtaccaag cttgtcgaga agtactagag gatcataatc agccatacca catttgtaga 3060 ggttttactt gctttaaaaa acctcccaca cctccccctg aacctgaaac ataaaatgaa 3120 tgcaattgtt gttgttaact tgtttattgc agcttataat ggttacaaat aaagcaatag 3180 catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg gtttgtccaa 3240 actcatcaat gtatcttatc atgtctggat ctgatcactg atatcgccta ggagatccga 3300 accagataag tgaaatctag ttccaaacta ttttgtcatt tttaattttc gtattagctt 3360 acgacgctac acccagttcc catctatttt gtcactcttc cctaaataat ccttaaaaac 3420 tccatttcca cccctcccag ttcccaacta ttttgtccgc ccacagcggg gcatttttct 3480 tcctgttatg tttttaatca aacatcctgc caactccatg tgacaaaccg tcatcttcgg 3540 ctactttttc tctgtcacag aatgaaaatt tttctgtcat ctcttcgtta ttaatgtttg 3600 taattgactg aatatcaacg cttatttgca gcctgaatgg cgaatgggac gcgccctgta 3660 gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca 3720 gcgccctagc gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct 3780 ttccccgtca agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc 3840 acctcgaccc caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat 3900 agacggtttt tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc 3960 aaactggaac aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc 4020 cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta 4080 acaaaatatt aacgtttaca atttcaggtg gcacttttcg gggaaatgtg cgcggaaccc 4140 ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 4200 gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 4260 cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 4320 tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 4380 tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 4440 cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 4500 tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 4560 agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 4620 ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 4680 ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 4740 aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 4800 gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 4860 tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 4920 ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca gcactggggc 4980 cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 5040 atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 5100 cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 5160 ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 5220 cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 5280 ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 5340 tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 5400 taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 5460 caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 5520 agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 5580 gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 5640 gatacctaca gcgtgagcat tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 5700 ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 5760 acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 5820 tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 5880 ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta tcccctgatt 5940 ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc agccgaacga 6000 ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg tattttctcc 6060 ttacgcatct gtgcggtatt tcacaccgca gaccagccgc gtaacctggc aaaatcggtt 6120 acggttgagt aataaatgga tgccctgcgt aagcgggtgt gggcggacaa taaagtctta 6180 aactgaacaa aatagatcta aactatgaca ataaagtctt aaactagaca gaatagttgt 6240 aaactgaaat cagtccagtt atgctgtgaa aaagcatact ggacttttgt tatggctaaa 6300 gcaaactctt cattttctga agtgcaaatt gcccgtcgta ttaaagaggg gcgtggccaa 6360 gggcatggta aagactatat tcgcggcgtt gtgacaattt accgaacaac tccgcggccg 6420 ggaagccgat ctcggcttga acgaattgtt aggtggcggt acttgggtcg atatcaaagt 6480 gcatcacttc ttcccgtatg cccaactttg tatagagagc cactgcggga tcgtcaccgt 6540 aatctgcttg cacgtagatc acataagcac caagcgcgtt ggcctcatgc ttgaggagat 6600 tgatgagcgc ggtggcaatg ccctgcctcc ggtgctcgcc ggagactgcg agatcataga 6660 tatagatctc actacgcggc tgctcaaacc tgggcagaac gtaagccgcg agagcgccaa 6720 caaccgcttc ttggtcgaag gcagcaagcg cgatgaatgt cttactacgg agcaagttcc 6780 cgaggtaatc ggagtccggc tgatgttggg agtaggtggc tacgtctccg aactcacgac 6840 cgaaaagatc aagagcagcc cgcatggatt tgacttggtc agggccgagc ctacatgtgc 6900 gaatgatgcc catacttgag ccacctaact ttgttttagg gcgactgccc tgctgcgtaa 6960 catcgttgct gctgcgtaac atcgttgctg ctccataaca tcaaacatcg acccacggcg 7020 taacgcgctt gctgcttgga tgcccgaggc atagactgta caaaaaaaca gtcataacaa 7080 gccatgaaaa ccgccactgc gccgttacca ccgctgcgtt cggtcaaggt tctggaccag 7140 ttgcgtgagc gcatacgcta cttgcattac agtttacgaa ccgaacaggc ttatgtcaac 7200 tgggttcgtg ccttcatccg tttccacggt gtgcgtcacc cggcaacctt gggcagcagc 7260 gaagtcgagg catttctgtc ctggctggcg aacgagcgca aggtttcggt ctccacgcat 7320 cgtcaggcat tggcggcctt gctgttcttc tacggcaagg tgctgtgcac ggatctgccc 7380 tggcttcagg agatcggaag acctcggccg tcgcggcgct tgccggtggt gctgaccccg 7440 gatgaagtgg ttcgcatcct cggttttctg gaaggcgagc atcgtttgtt cgcccaggac 7500 tctagctata gttctagtgg ttggctacgt atactccgga atattaatag atcatggaga 7560 taattaaaat gataaccatc tcgcaaataa ataagtattt tactgttttc gtaacagttt 7620 tgtaataaaa aaacctataa atattccgga ttattcatac cgtcccacca tcgggcgcgg 7680 atctcggtcc gaaaccatgt cgtactacca tcaccatcac catcacgatt acgatatccc 7740 aacgaccgaa aacctgtatt ttcagggcgc catgggatcc 7780 <210> 195 <211> 450 <212> PRT <213> Homo sapiens <400> 195 Met Ser Thr Ala Val Leu Glu Asn Pro Gly Leu Gly Arg Lys Leu Ser 1 5 10 15 Asp Phe Gly Gln Glu Thr Ser Tyr Ile Glu Asp Asn Cys Asn Gln Asn 20 25 30 Gly Ala Ile Ser Leu Ile Phe Ser Leu Lys Glu Glu Val Gly Ala Leu 35 40 45 Ala Lys Val Leu Arg Leu Phe Glu Glu Asn Asp Val Asn Leu Thr His 50 55 60 Ile Glu Ser Arg Pro Ser Arg Leu Lys Lys Asp Glu Tyr Glu Phe Phe 65 70 75 80 Thr His Leu Asp Lys Arg Ser Leu Pro Ala Leu Thr Asn Ile Ile Lys 85 90 95 Ile Leu Arg His Asp Ile Gly Ala Thr Val His Glu Leu Ser Arg Asp 100 105 110 Lys Lys Lys Asp Thr Val Pro Trp Phe Pro Arg Thr Ile Gln Glu Leu 115 120 125 Asp Arg Phe Ala Asn Gln Ile Leu Ser Tyr Gly Ala Glu Leu Asp Ala 130 135 140 Asp His Pro Gly Phe Lys Asp Pro Val Tyr Arg Ala Arg Arg Lys Gln 145 150 155 160 Phe Ala Asp Ile Ala Tyr Asn Tyr Arg His Gly Gln Pro Ile Pro Arg 165 170 175 Val Glu Tyr Met Glu Glu Glu Lys Lys Thr Trp Gly Thr Val Phe Lys 180 185 190 Thr Leu Lys Ser Leu Tyr Lys Thr His Ala Cys Tyr Glu Tyr Asn His 195 200 205 Ile Phe Pro Leu Leu Glu Lys Tyr Cys Gly Phe His Glu Asp Asn Ile 210 215 220 Pro Gln Leu Glu Asp Val Ser Gln Phe Leu Gln Thr Cys Thr Gly Phe 225 230 235 240 Arg Leu Arg Pro Val Ala Gly Leu Leu Ser Ser Arg Asp Phe Leu Gly 245 250 255 Gly Leu Ala Phe Arg Val Phe His Cys Thr Gln Tyr Ile Arg His Gly 260 265 270 Ser Lys Pro Met Tyr Thr Pro Glu Pro Asp Ile Cys His Glu Leu Leu 275 280 285 Gly His Val Pro Leu Phe Ser Asp Arg Ser Phe Ala Gln Phe Ser Gln 290 295 300 Glu Ile Gly Leu Ala Ser Leu Gly Ala Pro Asp Glu Tyr Ile Glu Lys 305 310 315 320 Leu Ala Thr Ile Tyr Trp Phe Thr Val Glu Phe Gly Leu Cys Lys Gln 325 330 335 Gly Asp Ser Ile Lys Ala Tyr Gly Ala Gly Leu Leu Ser Ser Phe Gly 340 345 350 Glu Leu Gln Tyr Cys Leu Ser Glu Lys Pro Lys Leu Leu Pro Leu Glu 355 360 365 Leu Glu Lys Thr Ala Ile Gln Asn Tyr Thr Val Thr Glu Phe Gln Pro 370 375 380 Leu Tyr Tyr Val Ala Glu Ser Phe Asn Asp Ala Lys Glu Lys Val Arg 385 390 395 400 Asn Phe Ala Ala Thr Ile Pro Arg Pro Phe Ser Val Arg Tyr Asp Pro 405 410 415 Tyr Thr Gln Arg Ile Glu Val Leu Asp Asn Thr Gln Gln Leu Lys Ile 420 425 430 Leu Ala Asp Ser Ile Asn Ser Glu Ile Gly Ile Leu Cys Ser Ala Leu 435 440 445 Gln Lys 450 <210> 196 <400> 196 000 <210> 197 <400> 197 000 <210> 198 <400> 198 000 <210> 199 <400> 199 000 <210> 200 <400> 200 000 <210> 201 <400> 201 000 <210> 202 <400> 202 000 <210> 203 <400> 203 000 <210> 204 <400> 204 000 <210> 205 <400> 205 000 <210> 206 <400> 206 000 <210> 207 <400> 207 000 <210> 208 <400> 208 000 <210> 209 <400> 209 000 <210> 210 <400> 210 000 <210> 211 <400> 211 000 <210> 212 <400> 212 000 <210> 213 <400> 213 000 <210> 214 <400> 214 000 <210> 215 <400> 215 000 <210> 216 <400> 216 000 <210> 217 <400> 217 000 <210> 218 <400> 218 000 <210> 219 <400> 219 000 <210> 220 <400> 220 000 <210> 221 <400> 221 000 <210> 222 <400> 222 000 <210> 223 <400> 223 000 <210> 224 <400> 224 000 <210> 225 <400> 225 000 <210> 226 <400> 226 000 <210> 227 <400> 227 000 <210> 228 <400> 228 000 <210> 229 <400> 229 000 <210> 230 <400> 230 000 <210> 231 <400> 231 000 <210> 232 <400> 232 000 <210> 233 <400> 233 000 <210> 234 <400> 234 000 <210> 235 <400> 235 000 <210> 236 <400> 236 000 <210> 237 <400> 237 000 <210> 238 <400> 238 000 <210> 239 <400> 239 000 <210> 240 <400> 240 000 <210> 241 <400> 241 000 <210> 242 <400> 242 000 <210> 243 <400> 243 000 <210> 244 <400> 244 000 <210> 245 <400> 245 000 <210> 246 <400> 246 000 <210> 247 <400> 247 000 <210> 248 <400> 248 000 <210> 249 <400> 249 000 <210> 250 <400> 250 000 <210> 251 <400> 251 000 <210> 252 <400> 252 000 <210> 253 <400> 253 000 <210> 254 <400> 254 000 <210> 255 <400> 255 000 <210> 256 <400> 256 000 <210> 257 <400> 257 000 <210> 258 <400> 258 000 <210> 259 <400> 259 000 <210> 260 <400> 260 000 <210> 261 <400> 261 000 <210> 262 <400> 262 000 <210> 263 <400> 263 000 <210> 264 <400> 264 000 <210> 265 <400> 265 000 <210> 266 <400> 266 000 <210> 267 <400> 267 000 <210> 268 <400> 268 000 <210> 269 <400> 269 000 <210> 270 <400> 270 000 <210> 271 <400> 271 000 <210> 272 <400> 272 000 <210> 273 <400> 273 000 <210> 274 <400> 274 000 <210> 275 <400> 275 000 <210> 276 <400> 276 000 <210> 277 <400> 277 000 <210> 278 <400> 278 000 <210> 279 <400> 279 000 <210> 280 <400> 280 000 <210> 281 <400> 281 000 <210> 282 <400> 282 000 <210> 283 <400> 283 000 <210> 284 <400> 284 000 <210> 285 <400> 285 000 <210> 286 <400> 286 000 <210> 287 <400> 287 000 <210> 288 <400> 288 000 <210> 289 <400> 289 000 <210> 290 <400> 290 000 <210> 291 <400> 291 000 <210> 292 <400> 292 000 <210> 293 <400> 293 000 <210> 294 <400> 294 000 <210> 295 <400> 295 000 <210> 296 <400> 296 000 <210> 297 <400> 297 000 <210> 298 <400> 298 000 <210> 299 <400> 299 000 <210> 300 <400> 300 000 <210> 301 <400> 301 000 <210> 302 <400> 302 000 <210> 303 <400> 303 000 <210> 304 <400> 304 000 <210> 305 <400> 305 000 <210> 306 <400> 306 000 <210> 307 <400> 307 000 <210> 308 <400> 308 000 <210> 309 <400> 309 000 <210> 310 <400> 310 000 <210> 311 <400> 311 000 <210> 312 <400> 312 000 <210> 313 <400> 313 000 <210> 314 <400> 314 000 <210> 315 <400> 315 000 <210> 316 <400> 316 000 <210> 317 <400> 317 000 <210> 318 <400> 318 000 <210> 319 <400> 319 000 <210> 320 <400> 320 000 <210> 321 <400> 321 000 <210> 322 <400> 322 000 <210> 323 <400> 323 000 <210> 324 <400> 324 000 <210> 325 <400> 325 000 <210> 326 <400> 326 000 <210> 327 <400> 327 000 <210> 328 <400> 328 000 <210> 329 <400> 329 000 <210> 330 <400> 330 000 <210> 331 <400> 331 000 <210> 332 <400> 332 000 <210> 333 <400> 333 000 <210> 334 <400> 334 000 <210> 335 <400> 335 000 <210> 336 <400> 336 000 <210> 337 <400> 337 000 <210> 338 <400> 338 000 <210> 339 <400> 339 000 <210> 340 <400> 340 000 <210> 341 <400> 341 000 <210> 342 <400> 342 000 <210> 343 <400> 343 000 <210> 344 <400> 344 000 <210> 345 <400> 345 000 <210> 346 <400> 346 000 <210> 347 <400> 347 000 <210> 348 <400> 348 000 <210> 349 <400> 349 000 <210> 350 <400> 350 000 <210> 351 <400> 351 000 <210> 352 <400> 352 000 <210> 353 <400> 353 000 <210> 354 <400> 354 000 <210> 355 <400> 355 000 <210> 356 <400> 356 000 <210> 357 <400> 357 000 <210> 358 <400> 358 000 <210> 359 <400> 359 000 <210> 360 <400> 360 000 <210> 361 <400> 361 000 <210> 362 <400> 362 000 <210> 363 <400> 363 000 <210> 364 <400> 364 000 <210> 365 <400> 365 000 <210> 366 <400> 366 000 <210> 367 <400> 367 000 <210> 368 <400> 368 000 <210> 369 <400> 369 000 <210> 370 <400> 370 000 <210> 371 <400> 371 000 <210> 372 <400> 372 000 <210> 373 <400> 373 000 <210> 374 <400> 374 000 <210> 375 <400> 375 000 <210> 376 <400> 376 000 <210> 377 <400> 377 000 <210> 378 <400> 378 000 <210> 379 <400> 379 000 <210> 380 <211> 1365 <212> DNA <213> Mus musculus <400> 380 atggcagctg ttgtcctgga gaacggagtc ctgagcagaa aactctcaga ctttgggcag 60 gaaacaagtt acatcgaaga caactccaat caaaatggtg ctgtatctct gatattctca 120 ctcaaagagg aagttggtgc cctggccaag gtcctgcgct tatttgagga gaatgagatc 180 aacctgacac acattgaatc cagaccttcc cgtttaaaca aagatgagta tgagtttttc 240 acctatctgg ataagcgtag caagcccgtc ctgggcagca tcatcaagag cctgaggaac 300 gacattggtg ccactgtcca tgagctttcc cgagacaagg aaaagaacac agtgccctgg 360 ttcccaagga ccattcagga gctggacaga ttcgccaatc agattctcag ctatggagcc 420 gaactggatg cagaccaccc aggctttaaa gatcctgtgt accgggcgag acgaaagcag 480 tttgctgaca ttgcctacaa ctaccgccat gggcagccca ttcctcgggt ggaatacaca 540 gaggaggaga ggaagacctg gggaacggtg ttcaggactc tgaaggcctt gtataaaaca 600 catgcctgct acgagcacaa ccacatcttc cctcttctgg aaaagtactg cggtttccgt 660 gaagacaaca tcccgcagct ggaagatgtt tctcagtttc tgcagacttg tactggtttc 720 cgcctccgtc ctgttgctgg cttactgtcg tctcgagatt tcttgggtgg cctggccttc 780 cgagtcttcc actgcacaca gtacattagg catggatcta agcccatgta cacacctgaa 840 cctgatatct gtcatgaact cttgggacat gtgcccttgt tttcagatag aagctttgcc 900 cagttttctc aggaaattgg gcttgcatcg ctgggggcac ctgatgagta cattgagaaa 960 ctggccacaa tttactggtt tactgtggag tttgggcttt gcaaggaagg agattctata 1020 aaggcatatg gtgctgggct cttgtcatcc tttggagaat tacagtactg tttatcagac 1080 aagccaaagc tcctgcccct ggagctagag aagacagcct gccaggagta tactgtcaca 1140 gagttccagc ctctgtacta tgtggccgag agtttcaatg atgccaagga gaaagtgagg 1200 acttttgctg ccacaatccc ccggcccttc tccgttcgct atgaccccta cactcaaagg 1260 gttgaggtcc tggacaatac tcagcagttg aagattttag ctgactccat taatagtgag 1320 gttggaatcc tttgccatgc cctgcagaaa ataaagtcat gataa 1365 <210> 381 <211> 1362 <212> DNA <213> Homo sapiens <400> 381 atgtccactg cggtcctgga aaacccaggc ttgggcagga aactctctga ctttggacag 60 gaaacaagct atattgaaga caactgcaat caaaatggtg ccatatcact gatcttctca 120 ctcaaagaag aagttggtgc attggccaaa gtattgcgct tatttgagga gaatgatgta 180 aacctgaccc acattgaatc tagaccttct cgtttaaaga aagatgagta tgaatttttc 240 acccatttgg ataaacgtag cctgcctgct ctgacaaaca tcatcaagat cttgaggcat 300 gacattggtg ccactgtcca tgagctttca cgagataaga agaaagacac agtgccctgg 360 ttcccaagaa ccattcaaga gctggacaga tttgccaatc agattctcag ctatggagcg 420 gaactggatg ctgaccaccc tggttttaaa gatcctgtgt accgtgcaag acggaagcag 480 tttgctgaca ttgcctacaa ctaccgccat gggcagccca tccctcgagt ggaatacatg 540 gaggaagaaa agaaaacatg gggcacagtg ttcaagactc tgaagtcctt gtataaaacc 600 catgcttgct atgagtacaa tcacattttt ccacttcttg aaaagtactg tggcttccat 660 gaagataaca ttccccagct ggaagacgtt tctcaattcc tgcagacttg cactggtttc 720 cgcctccgac ctgtggctgg cctgctttcc tctcgggatt tcttgggtgg cctggccttc 780 cgagtcttcc actgcacaca gtacatcaga catggatcca agcccatgta tacccccgaa 840 cctgacatct gccatgagct gttgggacat gtgcccttgt tttcagatcg cagctttgcc 900 cagttttccc aggaaattgg ccttgcctct ctgggtgcac ctgatgaata cattgaaaag 960 ctcgccacaa tttactggtt tactgtggag tttgggctct gcaaacaagg agactccata 1020 aaggcatatg gtgctgggct cctgtcatcc tttggtgaat tacagtactg cttatcagag 1080 aagccaaagc ttctccccct ggagctggag aagacagcca tccaaaatta cactgtcacg 1140 gagttccagc ccctgtatta cgtggcagag agttttaatg atgccaagga gaaagtaagg 1200 aactttgctg ccacaatacc tcggcccttc tcagttcgct acgacccata cacccaaagg 1260 attgaggtct tggacaatac ccagcagctt aagattttgg ctgattccat taacagtgaa 1320 attggaatcc tttgcagtgc cctccagaaa ataaagtaat aa 1362 <210> 382 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 382 atgagcaccg ccgtgctgga aaatcctggc ctgggcagaa agctgagcga cttcggccaa 60 gagacaagct acatcgagga caactgcaac cagaacggcg ccatcagcct gatcttcagc 120 ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgttcgaaga gaacgacgtg 180 aacctgacac acatcgagag cagacccagc agactgaaga aggacgagta cgagttcttc 240 acccacctgg acaagcggag cctgcctgct ctgaccaaca tcatcaagat cctgcggcac 300 gacatcggcg ccacagtgca cgaactgagc cgggacaaga aaaaggacac cgtgccatgg 360 ttccccagaa ccatccaaga gctggacaga ttcgccaacc agatcctgag ctatggcgcc 420 gagctggacg ctgatcaccc tggctttaag gaccccgtgt accgggccag aagaaagcag 480 tttgccgata tcgcctacaa ctaccggcac ggccagccta ttcctcgggt cgagtacatg 540 gaagaggaaa agaaaacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 600 cacgcctgct acgagtacaa ccacatcttc ccactgctcg aaaagtactg cggcttccac 660 gaggacaata tccctcagct tgaggacgtg tcccagttcc tgcagacctg caccggcttt 720 agactgaggc cagttgccgg actgctgagc agcagagatt ttctcggcgg cctggccttc 780 agagtgttcc actgtaccca gtacatcaga cacggcagca agcccatgta cacccctgag 840 cctgatatct gccacgagct gctgggacat gtgcccctgt tcagcgatag aagcttcgcc 900 cagttcagcc aagagatcgg actggcttct ctgggagccc ctgacgagta cattgagaag 960 ctggccacca tctactggtt caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc 1020 aaagcttatg gcgctggcct gctgtctagc ttcggcgagc tgcagtactg tctgagcgag 1080 aagcctaagc tgctgcccct ggaactggaa aagaccgcca tccagaacta caccgtgacc 1140 gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1200 aacttcgccg ccaccattcc tcggcctttc agcgtcagat acgaccccta cacacagcgg 1260 atcgaggtgc tggacaacac acagcagctg aaaattctgg ccgactccat caacagcgag 1320 atcggcatcc tgtgcagcgc cctgcagaaa atcaagtga 1359 <210> 383 <211> 1359 <212> DNA <213> Homo sapiens <400> 383 atgtccactg cggtcctgga aaacccaggc ttgggcagga aactctctga ctttggacag 60 gaaacaagct atattgaaga caactgcaat caaaatggtg ccatatcact gatcttctca 120 ctcaaagaag aagttggtgc attggccaaa gtattgcgct tatttgagga gaatgatgta 180 aacctgaccc acattgaatc tagaccttct cgtttaaaga aagatgagta tgaatttttc 240 acccatttgg ataaacgtag cctgcctgct ctgacaaaca tcatcaagat cttgaggcat 300 gacattggtg ccactgtcca tgagctttca cgagataaga agaaagacac agtgccctgg 360 ttcccaagaa ccattcaaga gctggacaga tttgccaatc agattctcag ctatggagcg 420 gaactggatg ctgaccaccc tggttttaaa gatcctgtgt accgtgcaag acggaagcag 480 tttgctgaca ttgcctacaa ctaccgccat gggcagccca tccctcgagt ggaatacatg 540 gaggaagaaa agaaaacatg gggcacagtg ttcaagactc tgaagtcctt gtataaaacc 600 catgcttgct atgagtacaa tcacattttt ccacttcttg aaaagtactg tggcttccat 660 gaagataaca ttccccagct ggaagacgtt tctcagttcc tgcagacttg cactggtttc 720 cgcctccgac ctgtggctgg cctgctttcc tctcgggatt tcttgggtgg cctggccttc 780 cgagtcttcc actgcacaca gtacatcaga catggatcca agcccatgta tacccccgaa 840 cctgacatct gccatgagct gttgggacat gtgcccttgt tttcagatcg cagctttgcc 900 cagttttccc aggaaattgg ccttgcctct ctgggtgcac ctgatgaata cattgaaaag 960 ctcgccacaa tttactggtt tactgtggag tttgggctct gcaaacaagg agactccata 1020 aaggcatatg gtgctgggct cctgtcatcc tttggtgaat tacagtactg cttatcagag 1080 aagccaaagc ttctccccct ggagctggag aagacagcca tccaaaatta cactgtcacg 1140 gagttccagc ccctctatta cgtggcagag agttttaatg atgccaagga gaaagtaagg 1200 aactttgctg ccacaatacc tcggcccttc tcagttcgct acgacccata cacccaaagg 1260 attgaggtct tggacaatac ccagcagctt aagattttgg ctgattccat taacagtgaa 1320 attggaatcc tttgcagtgc cctccagaaa ataaagtaa 1359 <210> 384 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 384 atgagtacag ctgtgcttga aaatcctggc ctgggcagga agcttagtga ctttggccag 60 gaaacatctt atattgaaga caactgcaac cagaatggtg ccatttctct tatcttctcc 120 ctgaaagaag aggtgggagc cctggcaaag gttttaaggc tctttgagga gaatgatgtg 180 aatttgacac acattgagtc caggccttct agactcaaga aagatgaata tgagttcttc 240 acccacctgg acaagaggag tctccctgct ctgaccaaca ttatcaagat cttgagacat 300 gatataggag ctacagtgca tgaactttca agggataaaa agaaggacac tgtcccctgg 360 tttcccagaa ctatccaaga attagacagg tttgccaatc agatcctgag ctatggtgca 420 gaattagatg cagaccaccc tgggtttaaa gaccctgtgt atagagccag aagaaagcag 480 tttgctgaca ttgcatacaa ctacaggcat gggcagccca ttcctagggt ggagtacatg 540 gaggaagaaa aaaagacctg gggcacagtt ttcaagaccc tgaagagcct ttacaagaca 600 catgcctgct atgaatataa ccatatattt ccattgttgg agaaatactg tggatttcat 660 gaagataaca tcccccagct ggaggatgtt agtcagtttc tgcagacctg cacaggcttt 720 agactgaggc cagttgcagg actgctaagt tctagggact tcctgggtgg gctagccttc 780 agagtgttcc actgtaccca atatataagg catggatcca agcccatgta cacccctgag 840 cctgatatct gccatgagct attgggccat gtccccctat tttctgacag aagctttgcc 900 cagttctccc aggagattgg attagcctct ctgggagctc ctgatgagta cattgagaag 960 ttagcaacca tctactggtt cactgtggaa tttggccttt gcaaacaagg ggatagtata 1020 aaggcttatg gagcaggtct gcttagcagt tttggagagc tgcagtactg cctgtcagaa 1080 aagccaaagc tcctaccatt agaactagaa aagactgcca tccagaacta tacagtcact 1140 gaattccagc ctctctacta tgtggctgag tctttcaatg atgccaagga gaaggtgaga 1200 aattttgcag ccaccattcc caggcccttc tctgttagat atgaccccta cactcagagg 1260 attgaggtcc tggacaatac ccagcaacta aaaattctgg ctgattccat taattctgaa 1320 attggcatcc tctgctctgc tctccagaag attaaatga 1359 <210> 385 <211> 1451 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 385 atgagtacag ctgtgcttga aaatcctggc ctgggcagga agcttagtga ctttggccag 60 aagaggtaag ggtttaaggg atggttggtt ggtggggtat taatgtttaa ttacctggag 120 cacctgcctg aaatcacttt ttttcaggtt gggaaacatc ttatattgaa gacaactgca 180 accagaatgg tgccatttct cttatcttct ccctgaaaga agaggtggga gccctggcaa 240 aggttttaag gctctttgag gagaatgatg tgaatttgac acacattgag tccaggcctt 300 ctagactcaa gaaagatgaa tatgagttct tcacccacct ggacaagagg agtctccctg 360 ctctgaccaa cattatcaag atcttgagac atgatatagg agctacagtg catgaacttt 420 caagggataa aaagaaggac actgtcccct ggtttcccag aactatccaa gaattagaca 480 ggtttgccaa tcagatcctg agctatggtg cagaattaga tgcagaccac cctgggttta 540 aagaccctgt gtatagagcc agaagaaagc agtttgctga cattgcatac aactacaggc 600 atgggcagcc cattcctagg gtggagtaca tggaggaaga aaaaaagacc tggggcacag 660 ttttcaagac cctgaagagc ctttacaaga cacatgcctg ctatgaatat aaccatatat 720 ttccattgtt ggagaaatac tgtggatttc atgaagataa catcccccag ctggaggatg 780 ttagtcagtt tctgcagacc tgcacaggct ttagactgag gccagttgca ggactgctaa 840 gttctaggga cttcctgggt gggctagcct tcagagtgtt ccactgtacc caatatataa 900 ggcatggatc caagcccatg tacacccctg agcctgatat ctgccatgag ctattgggcc 960 atgtccccct attttctgac agaagctttg cccagttctc ccaggagatt ggattagcct 1020 ctctgggagc tcctgatgag tacattgaga agttagcaac catctactgg ttcactgtgg 1080 aatttggcct ttgcaaacaa ggggatagta taaaggctta tggagcaggt ctgcttagca 1140 gttttggaga gctgcagtac tgcctgtcag aaaagccaaa gctcctacca ttagaactag 1200 aaaagactgc catccagaac tatacagtca ctgaattcca gcctctctac tatgtggctg 1260 agtctttcaa tgatgccaag gagaaggtga gaaattttgc agccaccatt cccaggccct 1320 tctctgttag atatgacccc tacactcaga ggattgaggt cctggacaat acccagcaac 1380 taaaaattct ggctgattcc attaattctg aaattggcat cctctgctct gctctccaga 1440 agattaaatg a 1451 <210> 386 <211> 3359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 386 atgagtacag ctgtgcttga aaatcctggc ctgggcagga agcttagtga ctttggccag 60 gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120 cccaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attggttgga 180 agctgatgag aatatccagg aagtcaacag acaaatgtcc tcaacaattg tttctaagta 240 ggagaacatc tgtcctgggt ggctttcaca ggaatgaatg accattgctt tagggggttg 300 gggatctggc ctccagaact gccaccaatt agctgtgtgt ctttggacaa gttactgtcc 360 ctctctgttg tctgtttact cttctgtaca ctgaaggggc tggtccctaa tgatctggga 420 tgggatgtgg aatccttcta gatttctttt gtaatattta taaagtgctc tcagcaaggt 480 atcaaaatgg caaaattgtg agtaactatc ctcctttcat tttgggaaga agatgaggca 540 tgaagagaat tcagacagaa acttactcag accaggggag gcagaaacta agcagagagg 600 aaaatgacca agagttagcc ctgggcatgg aatgtgaaag aaccctaaag gtgacttgga 660 aataatgccc aaggtatatt ccattctcct ggatttgttg gcattttctt gaggtgaaga 720 attgcagaat acattcttta atgtgaccta catatttacc catgtgagga agtctgctcc 780 tggactcttg agattcagtc ataaagccca ggccagggaa ataatgtaag tctgcaggcc 840 cctgtcatca gtaggattag ggagaagagt tctcagtaga aaacagggag gctggagaga 900 aaagaatggt taatgttaag gttaatataa ctagaaagac tgcagaactt aggactgatt 960 tttatttgaa tccttaaaaa aaaaaatttc ttatgaaaat agtacatggc tcttaggaga 1020 cagaacttat tgtacagagg aacagtgtga gagtcagagt gaattttatg tattattttt 1080 ggacttaggc taatgattta gcaaactctg gaatgtcagc cctaacccca accttggttt 1140 tctgtcacat gcatgtagta agtgctagat cctggacatt ctttgagatt tagtttaaga 1200 ctaagtttat tttctgatag gttatttgtg tactttcatg gattttgtaa ctctttttca 1260 acaattggat gtctcagatc tcagcatatg ggagcaagtt aatgcttcct gagatctttg 1320 ccaaaggtca agaggtcatt tttgtgtatt tataattttc catcattttt atatacttct 1380 caatattctt tttaaactat tcttttcctt ttttcatcct ctgaatactg ttttgacaga 1440 tcttgttatt agcatgcttt cagggatgag aaaactaaga aagctgaatg atttgcccaa 1500 agtagtccac ctggaaaatg aaagagagag gattccaatc caggtcttag gattcaaaag 1560 cctgtgcatg ttccattttt agtactttcc acactgtatt tctcaatgtc tttctgggac 1620 attttataaa tcatattata tcacctctaa ggatctttca gtttgttata tatgtgtcta 1680 ttaagttaga ttgtgagctc ctaaaagata aagcattgtc ttattcatct ttaaatttct 1740 cagagcccaa atagtgcctg gaacctagta gttgctcaat aaaaggtatt gaatttacag 1800 gattgaatgg tgacatcaat gaataattga agattcctta agctgataac tgacccagta 1860 gcatcattga tcatttaatt gccctggact tacttatttt ccaccacact acatatttct 1920 gtatagaata tatatagctc attgtattgc aagatttaac tagaagaaag agttcatgct 1980 tgctttgtcc atgtaggttt aacaggaatg aattgctaaa ctgtggaaaa tgttttaaac 2040 aaatgcatct tatcctgtag gaaacatctt atattgaaga caactgcaac cagaatggtg 2100 ccatttctct tatcttctcc ctgaaagaag aggtgggagc cctggcaaag gttttaaggc 2160 tctttgagga gaatgatgtg aatttgacac acattgagtc caggccttct agactcaaga 2220 aagatgaata tgagttcttc acccacctgg acaagaggag tctccctgct ctgaccaaca 2280 ttatcaagat cttgagacat gatataggag ctacagtgca tgaactttca agggataaaa 2340 agaaggacac tgtcccctgg tttcccagaa ctatccaaga attagacagg tttgccaatc 2400 agatcctgag ctatggtgca gaattagatg cagaccaccc tgggtttaaa gaccctgtgt 2460 atagagccag aagaaagcag tttgctgaca ttgcatacaa ctacaggcat gggcagccca 2520 ttcctagggt ggagtacatg gaggaagaaa aaaagacctg gggcacagtt ttcaagaccc 2580 tgaagagcct ttacaagaca catgcctgct atgaatataa ccatatattt ccattgttgg 2640 agaaatactg tggatttcat gaagataaca tcccccagct ggaggatgtt agtcagtttc 2700 tgcagacctg cacaggcttt agactgaggc cagttgcagg actgctaagt tctagggact 2760 tcctgggtgg gctagccttc agagtgttcc actgtaccca atatataagg catggatcca 2820 agcccatgta cacccctgag cctgatatct gccatgagct attgggccat gtccccctat 2880 tttctgacag aagctttgcc cagttctccc aggagattgg attagcctct ctgggagctc 2940 ctgatgagta cattgagaag ttagcaacca tctactggtt cactgtggaa tttggccttt 3000 gcaaacaagg ggatagtata aaggcttatg gagcaggtct gcttagcagt tttggagagc 3060 tgcagtactg cctgtcagaa aagccaaagc tcctaccatt agaactagaa aagactgcca 3120 tccagaacta tacagtcact gaattccagc ctctctacta tgtggctgag tctttcaatg 3180 atgccaagga gaaggtgaga aattttgcag ccaccattcc caggcccttc tctgttagat 3240 atgaccccta cactcagagg attgaggtcc tggacaatac ccagcaacta aaaattctgg 3300 ctgattccat taattctgaa attggcatcc tctgctctgc tctccagaag attaaatga 3359 <210> 387 <211> 1362 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 387 atggccgctg tggtgctgga aaatggcgtg ctgagcagaa agctgagcga cttcggccaa 60 gagacaagct acatcgagga caacagcaac cagaacggcg ctgtgtccct gatcttcagc 120 ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgtttgagga aaacgagatc 180 aacctgacgc acatcgagag cagacccagc agactgaaca aggacgagta cgagttcttc 240 acctacctgg acaagagaag caagcccgtg ctgggcagca tcatcaagag cctgagaaac 300 gacatcggcg ccaccgtgca cgagctgagc agggacaaag aaaagaacac cgtgccatgg 360 ttccccagga ccatccaaga gctggacaga ttcgccaacc agatcctgtc ttacggcgcc 420 gagctggacg ctgatcaccc tggctttaag gaccccgtgt acagagccag aagaaagcag 480 ttcgccgata tcgcctacaa ctacagacac ggccagccta ttcctagagt cgagtacacc 540 gaggaagaga gaaagacctg gggcaccgtg ttcagaaccc tgaaggccct gtacaagacc 600 cacgcctgct acgagcacaa ccacatcttc ccactgctcg aaaagtactg cggcttccgc 660 gaggataaca tccctcagct tgaggacgtg tcccagttcc tgcagacctg cacaggcttc 720 agactgaggc cagttgctgg cctgctgtcc agcagagatt ttctcggcgg cctggccttc 780 agagtgttcc actgtaccca gtacatcagg cacggcagca agcccatgta cacccctgag 840 cctgacatct gccacgagct gctgggacat gtgcctctgt tcagcgacag aagcttcgcc 900 cagttcagcc aagagatcgg cctggctagt ctgggcgctc ctgatgagta catcgagaag 960 ctggccacca tctactggtt caccgtggaa ttcggcctgt gcaaagaggg cgacagcatc 1020 aaggcttatg gcgccggact gctgtctagc tttggcgagc tgcagtactg tctgagcgac 1080 aagcctaagc tgctgcccct ggaactggaa aagaccgcct gccaagagta cacagtgacc 1140 gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1200 accttcgccg ctacaatccc cagacctttc agcgtcagat acgaccccta cacacagcgc 1260 gtggaagtgc tggacaacac acagcagctg aagattctgg ccgactccat caacagcgaa 1320 gtgggcatcc tgtgtcacgc cctgcagaaa atcaagagct ga 1362 <210> 388 <211> 5531 <212> DNA <213> Homo sapiens <400> 388 atgtccactg cggtcctgga aaacccaggc ttgggcagga aactctctga ctttggacag 60 gtgagccacg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120 ccgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcgttgga 180 agctgatgag aatatccagg aagtcaacag acaaatgtcc tcaacaattg tttctaagta 240 ggagaacatc tgtcctcggt ggctttcaca ggaatgaatg accattgctt tagggggttg 300 gggatctggc ctccagaact gccaccaatt agctgtgtgt ctttggacaa gttactgtcc 360 ctctctgttg tctgtttact cttctgtaca ctgaaggggc tggtccctaa tgatctggga 420 tgggatgtgg aatccttcta gatttctttt gtaatattta taaagtgctc tcagcaaggt 480 atcaaaatgg caaaattgtg agtaactatc ctcctttcat tttgggaaga agatgaggca 540 tgaagagaat tcagacagaa acttactcag accaggggag gcagaaacta agcagagagg 600 aaaatgacca agagttagcc ctgggcatgg aatgtgaaag aaccctaaac gtgacttgga 660 aataatgccc aaggtatatt ccattctccg ggatttgttg gcattttctt gaggtgaaga 720 attgcagaat acattcttta atgtgaccta catatttacc catgggagga agtctgctcc 780 tggactcttg agattcagtc ataaagccca ggccagggaa ataatgtaag tctgcaggcc 840 cctgtcatca gtaggattag ggagaagagt tctcagtaga aaacagggag gctggagaga 900 aaagaatggt taatgttaac gttaatataa ctagaaagac tgcagaactt aggactgatt 960 tttatttgaa tccttaaaaa aaaaaatttc ttatgaaaat agtacatggc tcttaggaga 1020 cagaacttat tgtacagagg aacagcgtga gagtcagagt gatcccagaa caggtcctgg 1080 ctccatcctg cacatagttt tggtgctgct ggcaatacgg tccccacaac tgtgggaagg 1140 ggttaggggc agggatctca tcaggaaagc ataggggttt aaagttcttt atagagcact 1200 tagaagattg agaatccaca aattatatta ataacaaaca aagtagtgtc gtgttatata 1260 gtaaatgtga atttgcagac acatttaggg aaaagttata attaaaaaaa taggctgtat 1320 atatatcaat ggttccaaaa ttttctatgg ttaagaatca cctgggatgg ttttgaaatg 1380 gcagattcta agacaacttg attcaacagg tttaggtaaa gcccagggaa ctgcattata 1440 agaaggaatc acctgtaatt ttggagtcaa gatccaagga acactcattg agaaacactg 1500 atttacaaag tgcatggaga gaaatggagc aagtgaaggg ggatcagcat ggtgaaatat 1560 aggctgttag gagtgctatt gactaactgt ctggtgactg gaccagagta aatcttttac 1620 tttgcaagaa acaggactaa attcccatat tatgtccata gcaaagggaa ttatgtagaa 1680 aaattgataa ttaggagcct gagttcttga ccagcctcca ctacctatgt ggcctcaggt 1740 gagttatttt ctccctttgg ctctaagttt tccccatctg taatgtaagg gagtttaact 1800 agatgagcac taaggacaaa tcaatttctg tgagtcaatt attatgaaat accatgtggg 1860 catcaaatgc caagtggaaa gcatagataa agaagtgatt gtgcacctgg gctgagggga 1920 acaaacattt cctaagagaa ttgagaccca aaagagcctt taaggaaggt gagatcttgg 1980 aaagggaaat ttggtgaata ctctaatgag gagctaaaaa ggcaagaaag aaagcagctt 2040 ggctggaaag gaggttcctg taggtgggcc tccagagatt cggtaccaca gaaactgcca 2100 aacatcagca agaagccatg gggatggagc gtttgaggga ttctaaatag aaggacaaga 2160 gtaaaaatgt caggctggat cgatgcaggc cactaagaaa tggattcagg tgatggcagt 2220 gggaagaaag gacctgatgc ccagaggcat ttctggagaa gatgagatca gacttgtgat 2280 tggctgaaca cacactgtag tggggtgggg tttagggggt gactcaactt caagcccagg 2340 tacattcaag tctgaattgc cctagtcaaa agtggcatct gtggatgtgt atcagaaata 2400 tcttactttt cttggaagcc aacaggagaa aagagtgcta ccaagtgaac tagagacagg 2460 aatatctttt gtcatttcaa ggaaactgga aagaagaagg ctcagtattc tttagtagga 2520 agaagactta agtcagagac tcatctgtac ctctctggca gggtttaaaa gggggaagag 2580 gaatagaggc tgcaagagat tgtgattcat ggacagtatg cagagatcaa atgacctggg 2640 ttcagatcct ggctccactg ctaactgtgt aactataggc aagttcctta acctctctaa 2700 gccttaatct tgtcatcaat aaaagggggc acttggtgcc taataaaacc tacctcttag 2760 gttgttgcca aattacatga gataatccaa atcaagtgct tattataata cccagaaatt 2820 ataggctcta aataaatgtt tatataggct ctaaataaat gaagtttttt agaaagataa 2880 catcatgatc aaaatgggat atttaacagt ttagtcttcc atttcatttg aagctcccta 2940 aaatcactct tgctgataaa tttgtttttt ccttcacacc tcagtttcat gggatgtttt 3000 ggcaaaaatc tgaattttct gaattgaaag aattttttgc taagggtcat cagtattcat 3060 gcagggcttg ttattctgag tcactaagag tttcctaaca cagccttctc tcattgagat 3120 gatgtaacat ctattccatt aatttcatta acttgcttac aagagagtaa ttgttctgca 3180 aatttttttc ttcccagttt taggtacctg ctgcttattg tggacacaca tagaatttta 3240 tgtattattt ttcgacttag gctaatgatt tagcaaactc tggaatgtca gccctaaccc 3300 caaccttggt tttctgtcac atgcatgtag taagtgctag atcctggaca ttctttgaga 3360 tttagtttaa gactaagttt attttctgat aggttatttg tgtactttca tggattttgt 3420 aactcttttt caacaattgg atgtctcaga tctcagcata tgggagcaag ttaatgcttc 3480 ctgagatctt tgccaaaggt caagaggtca tttttgtgta tttataattt tccatcattt 3540 ttatatactt ctcaatattc tttttaaact attcttttcc ttttttcatc ctctgaatac 3600 tgttttgaca gatcttgtta ttagcatgct ttcacggatg agaaaactaa gaaagctgaa 3660 tgatttgccc aaagtagtcc acctggaaaa tgaaagagag aggattccaa tccaggtctt 3720 acgattcaaa agcctgtgca tgttccattt ttagtacttt ccacactgta tttctcaatg 3780 tctttctggg acattttata aatcatatta tatcacctct aaggatcttt cagtttgtta 3840 tatatgtgtc tattaagtta gattgtgagc tcctaaaaga taaagcattg tcttattcat 3900 ctttaaattt ctcagagccc aaatagtgcc tggaacctag tagttgctca ataaaaggta 3960 ttgaatttac aggattgaat ggtgacatca atgaataatt gaagattcct taagctgata 4020 actgacccag tagcatcatt gatcatttaa ttgccctgga cttacttatt ttccaccaca 4080 ctacatattt ctgtatagaa tatatatagc tcattgtatt gcaagattta actagaagaa 4140 agagttcatg cttgctttgt ccatggaggt ttaacaggaa tgaattgcta aactgtggaa 4200 aatgttttaa acaaatgcat cttatcctgt aggaaacaag ctatattgaa gacaactgca 4260 atcaaaatgg tgccatatca ctgatcttct cactcaaaga agaagttggt gcattggcca 4320 aagtattgcg cttatttgag gagaatgatg taaacctgac ccacattgaa tctagacctt 4380 ctcgtttaaa gaaagatgag tatgaatttt tcacccattt ggataaacgt agcctgcctg 4440 ctctgacaaa catcatcaag atcttgaggc atgacattgg tgccactgtc catgagcttt 4500 cacgagataa gaagaaagac acagtgccct ggttcccaag aaccattcaa gagctggaca 4560 gatttgccaa tcagattctc agctatggag cggaactgga tgctgaccac cctggtttta 4620 aagatcctgt gtaccgtgca agacggaagc agtttgctga cattgcctac aactaccgcc 4680 atgggcagcc catccctcga gtggaataca tggaggaaga aaagaaaaca tggggcacag 4740 tgttcaagac tctgaagtcc ttgtataaaa cccatgcttg ctatgagtac aatcacattt 4800 ttccacttct tgaaaagtac tgtggcttcc atgaagataa cattccccag ctggaagacg 4860 tttctcaatt cctgcagact tgcactggtt tccgcctccg acctgtggct ggcctgcttt 4920 cctctcggga tttcttgggt ggcctggcct tccgagtctt ccactgcaca cagtacatca 4980 gacatggatc caagcccatg tatacccccg aacctgacat ctgccatgag ctgttgggac 5040 atgtgccctt gttttcagat cgcagctttg cccagttttc ccaggaaatt ggccttgcct 5100 ctctgggtgc acctgatgaa tacattgaaa agctcgccac aatttactgg tttactgtgg 5160 agtttgggct ctgcaaacaa ggagactcca taaaggcata tggtgctggg ctcctgtcat 5220 cctttggtga attacagtac tgcttatcag agaagccaaa gcttctcccc ctggagctgg 5280 agaagacagc catccaaaat tacactgtca cggagttcca gcccctgtat tacgtggcag 5340 agagttttaa tgatgccaag gagaaagtaa ggaactttgc tgccacaata cctcggccct 5400 tctcagttcg ctacgaccca tacacccaaa ggattgaggt cttggacaat acccagcagc 5460 ttaagatttt ggctgattcc attaacagtg aaattggaat cctttgcagt gccctccaga 5520 aaataaagta a 5531 <210> 389 <211> 1359 <212> DNA <213> Homo sapiens <400> 389 atgtccactg cggtcctgga aaacccaggc ttgggcagga aactctctga ctttggacag 60 gaaacaagct atattgaaga caactgcaat caaaatggtg ccatatcact gatcttctca 120 ctcaaagaag aagttggtgc attggccaaa gtattgcgct tatttgagga gaatgatgta 180 aacctgaccc acattgaatc tagaccttct cgtttaaaga aagatgagta tgaatttttc 240 acccatttgg ataaacgtag cctgcctgct ctgacaaaca tcatcaagat cttgaggcat 300 gacattggtg ccactgtcca tgagctttca cgagataaga agaaagacac agtgccctgg 360 ttcccaagaa ccattcaaga gctggacaga tttgccaatc agattctcag ctatggagcg 420 gaactggatg ctgaccaccc tggttttaaa gatcctgtgt accgtgcaag acggaagcag 480 tttgctgaca ttgcctacaa ctaccgccat gggcagccca tccctcgagt ggaatacatg 540 gaggaagaaa agaaaacatg gggcacagtg ttcaagactc tgaagtcctt gtataaaacc 600 catgcttgct atgagtacaa tcacattttt ccacttcttg aaaagtactg tggcttccat 660 gaagataaca ttccccagct ggaagacgtt tctcaattcc tgcagacttg cactggtttc 720 cgcctccgac ctgtggctgg cctgctttcc tctcgggatt tcttgggtgg cctggccttc 780 cgagtcttcc actgcacaca gtacatcaga catggatcca agcccatgta tacccccgaa 840 cctgacatct gccatgagct gttgggacat gtgcccttgt tttcagatcg cagctttgcc 900 cagttttccc aggaaattgg ccttgcctct ctgggtgcac ctgatgaata cattgaaaag 960 ctcgccacaa tttactggtt tactgtggag tttgggctct gcaaacaagg agactccata 1020 aaggcatatg gtgctgggct cctgtcatcc tttggtgaat tacagtactg cttatcagag 1080 aagccaaagc ttctccccct ggagctggag aagacagcca tccaaaatta cactgtcacg 1140 gagttccagc ccctgtatta cgtggcagag agttttaatg atgccaagga gaaagtaagg 1200 aactttgctg ccacaatacc tcggcccttc tcagttcgct acgacccata cacccaaagg 1260 attgaggtct tggacaatac ccagcagctt aagattttgg ctgattccat taacagtgaa 1320 attggaatcc tttgcagtgc cctccagaaa ataaagtaa 1359 <210> 390 <211> 1451 <212> DNA <213> Homo sapiens <400> 390 atgtccactg cggtcctgga aaacccaggc ttgggcagga aactctctga ctttggacag 60 aagaggtaag ggtttaaggg atggttggtt ggtggggtat taatgtttaa ttacctggag 120 cacctgcctg aaatcacttt ttttcaggtt gggaaacaag ctatattgaa gacaactgca 180 atcaaaatgg tgccatatca ctgatcttct cactcaaaga agaagttggt gcattggcca 240 aagtattgcg cttatttgag gagaatgatg taaacctgac ccacattgaa tctagacctt 300 ctcgtttaaa gaaagatgag tatgaatttt tcacccattt ggataaacgt agcctgcctg 360 ctctgacaaa catcatcaag atcttgaggc atgacattgg tgccactgtc catgagcttt 420 cacgagataa gaagaaagac acagtgccct ggttcccaag aaccattcaa gagctggaca 480 gatttgccaa tcagattctc agctatggag cggaactgga tgctgaccac cctggtttta 540 aagatcctgt gtaccgtgca agacggaagc agtttgctga cattgcctac aactaccgcc 600 atgggcagcc catccctcga gtggaataca tggaggaaga aaagaaaaca tggggcacag 660 tgttcaagac tctgaagtcc ttgtataaaa cccatgcttg ctatgagtac aatcacattt 720 ttccacttct tgaaaagtac tgtggcttcc atgaagataa cattccccag ctggaagacg 780 tttctcaatt cctgcagact tgcactggtt tccgcctccg acctgtggct ggcctgcttt 840 cctctcggga tttcttgggt ggcctggcct tccgagtctt ccactgcaca cagtacatca 900 gacatggatc caagcccatg tatacccccg aacctgacat ctgccatgag ctgttgggac 960 atgtgccctt gttttcagat cgcagctttg cccagttttc ccaggaaatt ggccttgcct 1020 ctctgggtgc acctgatgaa tacattgaaa agctcgccac aatttactgg tttactgtgg 1080 agtttgggct ctgcaaacaa ggagactcca taaaggcata tggtgctggg ctcctgtcat 1140 cctttggtga attacagtac tgcttatcag agaagccaaa gcttctcccc ctggagctgg 1200 agaagacagc catccaaaat tacactgtca cggagttcca gcccctgtat tacgtggcag 1260 agagttttaa tgatgccaag gagaaagtaa ggaactttgc tgccacaata cctcggccct 1320 tctcagttcg ctacgaccca tacacccaaa ggattgaggt cttggacaat acccagcagc 1380 ttaagatttt ggctgattcc attaacagtg aaattggaat cctttgcagt gccctccaga 1440 aaataaagta a 1451 <210> 391 <211> 1588 <212> DNA <213> Homo sapiens <400> 391 atgtccactg cggtcctgga aaacccaggc ttgggcagga aactctctga ctttggacag 60 gtgagccacg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120 ccgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcgttgga 180 agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 240 attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtagg aaacaagcta 300 tattgaagac aactgcaatc aaaatggtgc catatcactg atcttctcac tcaaagaaga 360 agttggtgca ttggccaaag tattgcgctt atttgaggag aatgatgtaa acctgaccca 420 cattgaatct agaccttctc gtttaaagaa agatgagtat gaatttttca cccatttgga 480 taaacgtagc ctgcctgctc tgacaaacat catcaagatc ttgaggcatg acattggtgc 540 cactgtccat gagctttcac gagataagaa gaaagacaca gtgccctggt tcccaagaac 600 cattcaagag ctggacagat ttgccaatca gattctcagc tatggagcgg aactggatgc 660 tgaccaccct ggttttaaag atcctgtgta ccgtgcaaga cggaagcagt ttgctgacat 720 tgcctacaac taccgccatg ggcagcccat ccctcgagtg gaatacatgg aggaagaaaa 780 gaaaacatgg ggcacagtgt tcaagactct gaagtccttg tataaaaccc atgcttgcta 840 tgagtacaat cacatttttc cacttcttga aaagtactgt ggcttccatg aagataacat 900 tccccagctg gaagacgttt ctcaattcct gcagacttgc actggtttcc gcctccgacc 960 tgtggctggc ctgctttcct ctcgggattt cttgggtggc ctggccttcc gagtcttcca 1020 ctgcacacag tacatcagac atggatccaa gcccatgtat acccccgaac ctgacatctg 1080 ccatgagctg ttgggacatg tgcccttgtt ttcagatcgc agctttgccc agttttccca 1140 ggaaattggc cttgcctctc tgggtgcacc tgatgaatac attgaaaagc tcgccacaat 1200 ttactggttt actgtggagt ttgggctctg caaacaagga gactccataa aggcatatgg 1260 tgctgggctc ctgtcatcct ttggtgaatt acagtactgc ttatcagaga agccaaagct 1320 tctccccctg gagctggaga agacagccat ccaaaattac actgtcacgg agttccagcc 1380 cctgtattac gtggcagaga gttttaatga tgccaaggag aaagtaagga actttgctgc 1440 cacaatacct cggcccttct cagttcgcta cgacccatac acccaaagga ttgaggtctt 1500 ggacaatacc cagcagctta agattttggc tgattccatt aacagtgaaa ttggaatcct 1560 ttgcagtgcc ctccagaaaa taaagtaa 1588 <210> 392 <211> 1398 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 392 atggcagctg ttgtcctgga gaacggagtc ctgagcagaa aactctcaga ctttgggcag 60 gaaacaagtt acatcgaaga caactccaat caaaatggtg ctgtatctct gatattctca 120 ctcaaagagg aagttggtgc cctggccaag gtcctgcgct tatttgagga gaatgagatc 180 aacctgacac acattgaatc cagaccttcc cgtttaaaca aagatgagta tgagtttttc 240 acctatctgg ataagcgtag caagcccgtc ctgggcagca tcatcaagag cctgaggaac 300 gacattggtg ccactgtcca tgagctttcc cgagacaagg aaaagaacac agtgccctgg 360 ttcccaagga ccattcagga gctggacaga ttcgccaatc agattctcag ctatggagcc 420 gaactggatg cagaccaccc aggctttaaa gatcctgtgt accgggcgag acgaaagcag 480 tttgctgaca ttgcctacaa ctaccgccat gggcagccca ttcctcgggt ggaatacaca 540 gaggaggaga ggaagacctg gggaacggtg ttcaggactc tgaaggcctt gtataaaaca 600 catgcctgct acgagcacaa ccacatcttc cctcttctgg aaaagtactg cggtttccgt 660 gaagacaaca tcccgcagct ggaagatgtt tctcagtttc tgcagacttg tactggtttc 720 cgcctccgtc ctgttgctgg cttactgtcg tctcgagatt tcttgggtgg cctggccttc 780 cgagtcttcc actgcacaca gtacattagg catggatcta agcccatgta cacacctgaa 840 cctgatatct gtcatgaact cttgggacat gtgcccttgt tttcagatag aagctttgcc 900 cagttttctc aggaaattgg gcttgcatcg ctgggggcac ctgatgagta cattgagaaa 960 ctggccacaa tttactggtt tactgtggag tttgggcttt gcaaggaagg agattctata 1020 aaggcatatg gtgctgggct cttgtcatcc tttggagaat tacagtactg tttatcagac 1080 aagccaaagc tcctgcccct ggagctagag aagacagcct gccaggagta tactgtcaca 1140 gagttccagc ctctgtacta tgtggccgag agtttcaatg atgccaagga gaaagtgagg 1200 acttttgctg ccacaatccc ccggcccttc tccgttcgct atgaccccta cactcaaagg 1260 gttgaggtcc tggacaatac tcagcagttg aagattttag ctgactccat taatagtgag 1320 gttggaatcc tttgccatgc cctgcagaaa ataaagtcag ggggtggagg ctctcatcac 1380 catcaccatc actaatga 1398 <210> 393 <211> 1395 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 393 atggccgctg tggtgctgga gaacggcgtg ctgtccagaa agctgtctga cttcggacag 60 gagaccagct acatcgagga taactccaac cagaacggcg ccgtgagcct gatcttctcc 120 ctgaaggagg aagtgggagc cctggctaag gtgctgagac tgtttgagga gaacgagatc 180 aacctgaccc acatcgagtc caggccttct agactgaaca aggacgagta cgagttcttt 240 acatacctgg ataagcggtc taagccagtg ctgggctcta tcatcaagag cctgagaaac 300 gatatcggag ctaccgtgca cgagctgagc cgggacaagg agaagaacac cgtgccctgg 360 ttccccagga caatccagga gctggataga tttgccaacc agatcctgag ctacggagct 420 gagctggacg ctgatcaccc tggattcaag gaccccgtgt accgcgctag gagaaagcag 480 tttgccgaca tcgcttacaa ctacaggcac ggacagccaa tccctcgcgt ggagtacaca 540 gaggaggaga ggaagacctg gggaacagtg ttcagaaccc tgaaggccct gtacaagaca 600 cacgcttgct acgagcacaa ccacatcttc cccctgctgg agaagtactg tggctttagg 660 gaggacaaca tccctcagct ggaggacgtg agccagttcc tgcagacctg cacaggattt 720 aggctgaggc cagtggccgg actgctgagc tcccgggatt tcctgggcgg actggctttc 780 cgcgtgtttc actgcaccca gtacatcagg cacggctcta agccaatgta cacaccagag 840 cccgatatct gtcacgagct gctgggacac gtgcccctgt ttagcgaccg gtccttcgcc 900 cagttttctc aggagatcgg cctggccagc ctgggagctc ctgacgagta catcgagaag 960 ctggctacca tctactggtt cacagtggag tttggcctgt gcaaggaggg agattccatc 1020 aaggcctacg gcgctggact gctgtctagc ttcggcgagc tgcagtactg cctgtctgac 1080 aagccaaagc tgctgcccct ggagctggag aagaccgcct gtcaggagta caccgtgaca 1140 gagttccagc ccctgtacta cgtggccgag agctttaacg acgctaagga gaaggtgcgc 1200 accttcgccg ctacaatccc tcggccattt tccgtgcgct acgaccctta cacccagagg 1260 gtggaggtgc tggataacac acagcagctg aagatcctgg ccgactctat caacagcgaa 1320 gtgggcatcc tgtgccacgc tctgcagaag atcaagtccg gaggaggagg atctcatcac 1380 caccaccacc actga 1395 <210> 394 <211> 1363 <212> DNA <213> Homo sapiens <400> 394 atgtccactg cggtcctgga aaacccaggc ttgggcagga aactctctga ctttggacag 60 gaaacaagct atattgaaga caactgcaat caaaatggtg ccatatcact gatcttctca 120 ctcaaagaag aagttggtgc attggccaaa gtattgcgct tatttgagga gaatgatgta 180 aacctgaccc acattgaatc tagaccttct cgtttaaaga aagatgagta tgaatttttc 240 acccatttgg ataaacgtag cctgcctgct ctgacaaaca tcatcaagat cttgaggcat 300 gacattggtg ccactgtcca tgagctttca cgagataaga agaaagacac agtgccctgg 360 ttcccaagaa ccattcaaga gctggacaga tttgccaatc agattctcag ctatggagcg 420 gaactggatg ctgaccaccc tggttttaaa gatcctgtgt accgtgcaag acggaagcag 480 tttgctgaca ttgcctacaa ctaccgccat gggcagccca tccctcgagt ggaatacatg 540 gaggaagaaa agaaaacatg gggcacagtg ttcaagactc tgaagtcctt gtataaaacc 600 catgcttgct atgagtacaa tcacattttt ccacttcttg aaaagtactg tggcttccat 660 gaagataaca ttccccagct ggaagacgtt tctcagttcc tgcagacttg cactggtttc 720 cgcctccgac ctgtggctgg cctgctttcc tctcgggatt tcttgggtgg cctggccttc 780 cgagtcttcc actgcacaca gtacatcaga catggatcca agcccatgta tacccccgaa 840 cctgacatct gccatgagct gttgggacat gtgcccttgt tttcagatcg cagctttgcc 900 cagttttccc aggaaattgg ccttgcctct ctgggtgcac ctgatgaata cattgaaaag 960 ctcgccacaa tttactggtt tactgtggag tttgggctct gcaaacaagg agactccata 1020 aaggcatatg gtgctgggct cctgtcatcc tttggtgaat tacagtactg cttatcagag 1080 aagccaaagc ttctccccct ggagctggag aagacagcca tccaaaatta cactgtcacg 1140 gagttccagc ccctctatta cgtggcagag agttttaatg atgccaagga gaaagtaagg 1200 aactttgctg ccacaatacc tcggcccttc tcagttcgct acgacccata cacccaaagg 1260 attgaggtct tggacaatac ccagcagctt aagattttgg ctgattccat taacagtgaa 1320 attggaatcc tttgcagtgc cctccagaaa ataaagtaat taa 1363 <210> 395 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 395 Gly Gly Gly Gly Ser 1 5 <210> 396 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic 6xHis tag <400> 396 His His His His His His 1 5

Claims (55)

  1. 플랭킹(flanking) 역말단반복서열(ITR: inverted terminal repeat) 사이에 적어도 하나의 이종 뉴클레오타이드 서열을 포함하는 폐쇄형 DNA(ceDNA) 벡터로서, 여기서 적어도 하나의 이종 뉴클레오타이드 서열은 적어도 하나의 PAH 단백질을 인코딩하고, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 이종 뉴클레오타이드 서열은 표 1의 서열 중 임의의 것과 적어도 90%의 동일성을 갖는 서열에서 선택되는 것인 ceDNA 벡터.
  2. 제1항에 있어서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 이종 뉴클레오타이드 서열에 작동적으로 연결된 프로모터를 포함하는, ceDNA 벡터.
  3. 제2항에 있어서, 프로모터가 서열번호 191과 적어도 85%의 동일성을 갖는 핵산 서열을 포함하는 것인, ceDNA 벡터.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 인핸서를 포함하는, ceDNA 벡터.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 5' UTR 및/또는 인트론 서열을 포함하는, ceDNA 벡터.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 3' UTR을 포함하는, ceDNA 벡터.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 적어도 하나의 poly A 서열을 포함하는, ceDNA 벡터.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 적어도 하나의 이종 뉴클레오타이드 서열에 작동 가능하게 연결된 적어도 하나의 프로모터를 포함하는, ceDNA 벡터.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 적어도 하나의 이종 뉴클레오타이드 서열이 cDNA인, ceDNA 벡터.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 적어도 하나의 ITR이 기능성 말단 분해 부위(TRS: terminal resolution site)와 Rep 결합 부위를 포함하는 것인, ceDNA 벡터.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 파르보바이러스(parvovirus), 데펜도바이러스(dependovirus) 및 아데노연관바이러스(AAV: adeno-associated virus)에서 선택되는 바이러스에서 유래한 것인, ceDNA 벡터.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 플랭킹 ITR이 대칭 또는 비대칭인, ceDNA 벡터.
  13. 제12항에 있어서, 플랭킹 ITR이 대칭 또는 실질적으로 대칭인, ceDNA 벡터.
  14. 제12항에 있어서, 플랭킹 ITR이 비대칭인, ceDNA 벡터.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 야생형이거나, 두 개의 ITR이 모두 야생형인, ceDNA 벡터.
  16. 제1항 내지 제15항 중 어느 한 항에 있어서, 플랭킹 ITR이 상이한 바이러스 혈청형에서 유래한 것인, ceDNA 벡터.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서, 플랭킹 ITR이 표 2에 제시된 한 쌍의 바이러스 혈청형에서 유래한 것인, ceDNA 벡터.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 표 3, 표 5A, 표 5B 또는 표 6의 서열에서 선택되는 서열을 포함하는 것인, ceDNA 벡터.
  19. 제1항 내지 제18항 중 어느 한 항에 있어서, ITR 중 적어도 하나가 ITR의 전반적인 3차원 입체형태에 영향을 미치는 결실, 부가 또는 치환에 의해 야생형 AAV ITR 서열에서 변경된 것인, ceDNA 벡터.
  20. 제1항 내지 제19항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 및 AAV12에서 선택되는 AAV 혈청형에서 유도된 것인, ceDNA 벡터.
  21. 제1항 내지 제20항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 합성인, ceDNA 벡터.
  22. 제1항 내지 제21항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 야생형 ITR이 아니거나, 두 개의 ITR이 모두 야생형이 아닌, ceDNA 벡터.
  23. 제1항 내지 제22항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 A, A', B, B', C, C', D 및 D'에서 선택되는 ITR 영역 중 적어도 하나에서 결실, 삽입 및/또는 치환에 의해 변형된 것인, ceDNA 벡터.
  24. 제23항에 있어서, 결실, 삽입 및/또는 치환이 통상적으로 A, A', B, B' C 또는 C' 영역으로 형성된 스템-루프 구조(stem-loop structure)의 전부 또는 일부의 결실을 초래하는 것인, ceDNA 벡터.
  25. 제1항 내지 제24항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 통상적으로 B 및 B' 영역으로 형성된 스템-루프 구조의 전부 또는 일부의 결실을 초래하는 결실, 삽입 및/또는 치환에 의해 변형된 것인, ceDNA 벡터.
  26. 제1항 내지 제24항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 통상적으로 C 및 C' 영역으로 형성된 스템-루프 구조의 전부 또는 일부의 결실을 초래하는 결실, 삽입 및/또는 치환에 의해 변형된 것인, ceDNA 벡터.
  27. 제1항 내지 제24항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 통상적으로 B 및 B' 영역으로 형성된 스템-루프 구조의 일부 및/또는 통상적으로 C 및 C' 영역으로 형성된 스템-루프 구조 일부의 결실을 초래하는 결실, 삽입 및/또는 치환에 의해 변형된 것인, ceDNA 벡터.
  28. 제1항 내지 제27항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 통상적으로 B 및 B' 영역으로 형성된 제1 스템-루프 구조와 C 및 C' 영역으로 형성된 제2 스템-루프 구조를 포함하는 영역에 단일 스템-루프 구조를 포함하는 것인, ceDNA 벡터.
  29. 제1항 내지 제28항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 통상적으로 B 및 B' 영역으로 형성된 제1 스템-루프 구조와 C 및 C' 영역으로 형성된 제2 스템-루프 구조를 포함하는 영역에 단일 스템과 2개의 루프를 포함하는 것인, ceDNA 벡터.
  30. 제1항 내지 제29항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 통상적으로 B 및 B' 영역으로 형성된 제1 스템-루프 구조와 C 및 C' 영역으로 형성된 제2 스템-루프 구조를 포함하는 영역에 단일 스템과 단일 루프를 포함하는 것인, ceDNA 벡터.
  31. 제1항 내지 제30항 중 어느 한 항에 있어서, ITR이 서로에 대해 역전될 때, 두 개의 ITR이 모두 전반적인 3차원 대칭을 이루는 방식으로 변경되는 것인, ceDNA 벡터.
  32. 제1항 내지 제31항 중 어느 한 항에 있어서, 적어도 하나의 이종 뉴클레오타이드 서열이 서열번호 381, 서열번호 382, 서열번호 383, 서열번호 384, 서열번호 385, 서열번호 386, 서열번호 387, 서열번호 388, 서열번호 389, 서열번호 390, 서열번호 391, 서열번호 392, 서열번호 393 또는 서열번호 394와 적어도 90%의 동일성을 갖는 서열을 포함하는 것인, ceDNA 벡터.
  33. 제32항에 있어서, 적어도 하나의 이종 뉴클레오타이드 서열이 서열번호 382, 서열번호 384, 서열번호 394, 서열번호 385 또는 서열번호 386과 적어도 90%의 동일성을 갖는 서열을 포함하는 것인, ceDNA 벡터.
  34. 제1항 내지 제33항 중 어느 한 항에 있어서, 서열번호 192, 서열번호 193 또는 서열번호 194와 적어도 90% 동일한 핵산 서열을 포함하는, ceDNA 벡터.
  35. 제1항 내지 제34항 중 어느 한 항에 있어서, 적어도 하나의 이종 뉴클레오타이드 서열이 적어도 하나의 조절 스위치의 제어 하에 있는 것인, ceDNA 벡터.
  36. 제35항에 있어서, 적어도 하나의 조절 스위치가 이원 조절 스위치, 소분자 조절 스위치, 패스코드 조절 스위치, 핵산 기반 조절 스위치, 전사 후 조절 스위치, 방사선 제어 또는 초음파 제어 조절 스위치, 저산소증 매개 조절 스위치, 염증 반응 조절 스위치, 전단 활성화 조절 스위치 및 사멸 스위치에서 선택되는 것인, ceDNA 벡터.
  37. 세포를 제1항 내지 제36항 중 어느 한 항의 ceDNA 벡터와 접촉시키는 것을 포함하는, 세포에서 PAH 단백질을 발현시키는 방법.
  38. 제37항에 있어서, 세포가 광수용체 또는 RPE 세포인, 방법.
  39. 제37항 또는 제38항에 있어서, 세포가 시험관내 또는 생체내에 존재하는 것인, 방법.
  40. 제36항 내지 제39항 중 어느 한 항에 있어서, 적어도 하나의 이종 뉴클레오타이드 서열이 진핵세포에서의 발현을 위해 코돈 최적화된 것인, 방법.
  41. 제36항 내지 제40항 중 어느 한 항에 있어서, 적어도 하나의 이종 뉴클레오타이드 서열이 표 1에 제시된 서열에서 선택되는 것인, 방법.
  42. 제1항 내지 제36항 중 어느 한 항의 ceDNA 벡터를 페닐케톤뇨증(PKU)을 앓고 있는 대상에게 투여하는 것을 포함하는, 페닐케톤뇨증(PKU)을 앓고 있는 대상을 치료하는 방법.
  43. 제42항에 있어서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 이종 뉴클레오타이드 서열이 표 1에 제시된 서열 중 임의의 것과 적어도 90%의 동일성을 갖는 서열에서 선택되는 것인, 방법.
  44. 제42항 또는 제43항에 있어서, ceDNA 벡터가 광수용체 세포 또는 RPE 세포, 또는 둘 모두에 투여되는, 방법.
  45. 제20항 내지 제44항 중 어느 한 항에 있어서, ceDNA 벡터가 광수용체 세포 또는 RPE 세포, 또는 둘 모두에서 PAH 단백질을 발현시키는, 방법.
  46. 제42항 내지 제45항 중 어느 한 항에 있어서, ceDNA 벡터가 망막하 주사, 맥락막상 주사 또는 유리체내 주사 중 임의의 하나 이상을 통해 투여되는, 방법.
  47. 제42항 내지 제46항 중 어느 한 항에 있어서, 대상이 투여 전 대상의 혈청 페닐알라닌 수준과 비교하여 혈청 페닐알라닌 수준에서 적어도 약 50%의 감소를 나타내는, 방법.
  48. 제42항 내지 제47항 중 어느 한 항에 있어서, 대상의 혈청 페닐알라닌 수준이 투여 후 약 1500 uM 미만인, 방법.
  49. 제42항 내지 제48항 중 어느 한 항에 있어서, 대상이 투여 전 PAH 활성 수준과 비교하여 투여 후 PAH 활성에서 적어도 약 10%의 증가를 나타내는, 방법.
  50. 제1항 내지 제36항 중 어느 한 항의 ceDNA 벡터를 포함하는 약학적 조성물.
  51. 제1항 내지 제36항 중 어느 한 항의 ceDNA 벡터를 포함하는 세포.
  52. 제51항에 있어서, 광수용체 세포 또는 RPE 세포, 또는 둘 모두인, 세포.
  53. 제1항 내지 제36항 중 어느 한 항의 ceDNA 벡터와 지질을 포함하는 조성물.
  54. 제53항에 있어서, 지질이 지질 나노입자(LNP)인, 조성물.
  55. 제1항 내지 제36항 중 어느 한 항의 ceDNA 벡터, 제50항의 약학적 조성물, 제51항 또는 제52항의 세포, 또는 제53항 또는 제54항의 조성물을 포함하는 키트.
KR1020217029544A 2019-03-13 2020-03-13 비바이러스성 dna 벡터 및 페닐알라닌 히드록실라아제(pah) 치료제 발현을 위한 이의 용도 KR20210149702A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962817771P 2019-03-13 2019-03-13
US62/817,771 2019-03-13
US201962857514P 2019-06-05 2019-06-05
US62/857,514 2019-06-05
PCT/US2020/022595 WO2020186150A2 (en) 2019-03-13 2020-03-13 Non-viral dna vectors and uses thereof for expressing phenylalanine hydroxylase (pah) therapeutics

Publications (1)

Publication Number Publication Date
KR20210149702A true KR20210149702A (ko) 2021-12-09

Family

ID=72426457

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217029544A KR20210149702A (ko) 2019-03-13 2020-03-13 비바이러스성 dna 벡터 및 페닐알라닌 히드록실라아제(pah) 치료제 발현을 위한 이의 용도

Country Status (12)

Country Link
US (1) US20230024354A1 (ko)
EP (1) EP3938515A4 (ko)
JP (1) JP2022525302A (ko)
KR (1) KR20210149702A (ko)
CN (1) CN113874508A (ko)
AU (1) AU2020235121A1 (ko)
BR (1) BR112021017852A2 (ko)
CA (1) CA3133330A1 (ko)
IL (1) IL286283A (ko)
MX (1) MX2021011037A (ko)
SG (1) SG11202109830TA (ko)
WO (1) WO2020186150A2 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023535632A (ja) 2020-07-27 2023-08-18 アンジャリウム バイオサイエンシズ エージー Dna分子の組成物、その作製方法、及びその使用方法
MX2023003019A (es) * 2020-09-16 2023-05-08 Generation Bio Co Vectores de adn de extremo cerrado y usos de estos para expresar fenilalanina hidroxilasa (pah).
CN115772503B (zh) * 2022-08-16 2023-10-17 广东省南山医药创新研究院 一种表达pah的基因修饰细胞药物及其制备方法与应用
CN116656740A (zh) * 2023-05-30 2023-08-29 浙江大学 一种腺相关病毒基因治疗载体及其在制备治疗苯丙酮尿症的药物中的应用

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007149852A2 (en) * 2006-06-19 2007-12-27 Asklepios Biopharmaceutical, Inc. Modified factor viii and factor ix genes and vectors for gene therapy
RU2752882C2 (ru) * 2016-03-03 2021-08-11 Юниверсити Оф Массачусетс Линейная дуплексная днк с закрытым концом для невирусного переноса генов
BR112019013576A2 (pt) * 2016-12-30 2020-02-04 Univ Pennsylvania terapia genica para o tratamento da fenilcetonuria
CA3056182A1 (en) * 2017-03-16 2018-09-20 Pfizer Inc. Tyrosine prototrophy
US11820999B2 (en) * 2017-04-03 2023-11-21 American Gene Technologies International Inc. Compositions and methods for treating phenylketonuria
US11939600B2 (en) * 2017-05-31 2024-03-26 Arcturus Therapeutics, Inc. Compositions and methods for treating phenylketonuria
KR20200035130A (ko) * 2017-08-09 2020-04-01 바이오버라티브 테라퓨틱스 인크. 핵산 분자 및 이의 용도

Also Published As

Publication number Publication date
BR112021017852A2 (pt) 2021-11-30
MX2021011037A (es) 2021-12-15
EP3938515A4 (en) 2022-12-28
SG11202109830TA (en) 2021-10-28
WO2020186150A3 (en) 2020-10-29
US20230024354A1 (en) 2023-01-26
EP3938515A2 (en) 2022-01-19
WO2020186150A2 (en) 2020-09-17
CA3133330A1 (en) 2020-09-17
CN113874508A (zh) 2021-12-31
IL286283A (en) 2021-10-31
AU2020235121A1 (en) 2021-11-04
JP2022525302A (ja) 2022-05-12

Similar Documents

Publication Publication Date Title
KR20200111726A (ko) 무세포 합성으로부터 수득된 폐쇄 말단 DNA 벡터 및 ceDNA 벡터를 수득하는 방법
AU2023214366B2 (en) Gene therapies for lysosomal disorders
KR20210149702A (ko) 비바이러스성 dna 벡터 및 페닐알라닌 히드록실라아제(pah) 치료제 발현을 위한 이의 용도
KR20210119416A (ko) 폐쇄-말단 dna (cedna), 및 유전자 또는 핵산 치료 관련 면역 반응을 감소시키는 방법에서의 이의 용도
JP2024028931A (ja) 閉端dna(cedna)ベクターを使用した導入遺伝子の制御された発現
KR20220015500A (ko) 리소좀 장애를 위한 유전자 요법
KR20200120649A (ko) 비-바이러스 dna 벡터 및 항체 및 융합 단백질 생산을 위한 이의 용도
CA2711179A1 (en) Rna interference for the treatment of heart failure
KR20210127935A (ko) 폐쇄형 DNA(ceDNA) 생산에서의 Rep 단백질 활성의 변형
KR20210090619A (ko) 대칭인 변형된 역말단반복을 포함하는 변형된 폐쇄형 DNA(ceDNA)
KR20230003477A (ko) 비-바이러스성 dna 벡터 및 인자 ix 치료제 발현을 위한 이의 용도
KR20220007601A (ko) 치료제 투여를 위한 조성물 및 방법
CN113874513A (zh) 非病毒dna载体及其用于表达fviii治疗剂的用途
RU2814137C2 (ru) Невирусные днк-векторы и варианты их применения для экспрессии терапевтического средства на основе фенилаланингидроксилазы (pah)
KR20230003478A (ko) 비-바이러스성 dna 벡터 및 고셰 치료제 발현을 위한 이의 용도
RU2816871C2 (ru) КОНТРОЛИРУЕМАЯ ЭКСПРЕССИЯ ТРАНСГЕНОВ С ИСПОЛЬЗОВАНИЕМ ДНК-ВЕКТОРОВ С ЗАМКНУТЫМИ КОНЦАМИ (зкДНК)
KR20230066615A (ko) 폐쇄형 dna 벡터 및 페닐알라닌 히드록실라아제(pah) 발현을 위한 이의 용도
RU2800914C9 (ru) Невирусные днк-векторы и их применение для продуцирования антител и слитых белков
RU2800914C2 (ru) Невирусные днк-векторы и их применение для продуцирования антител и слитых белков
RU2816963C2 (ru) МОДИФИЦИРОВАННАЯ ДНК С ЗАМКНУТЫМИ КОНЦАМИ (зкДНК), СОДЕРЖАЩАЯ СИММЕТРИЧНЫЕ МОДИФИЦИРОВАННЫЕ ИНВЕРТИРОВАННЫЕ КОНЦЕВЫЕ ПОВТОРЫ
RU2812850C2 (ru) Модуляция активности rep белка при получении днк с замкнутыми концами (зкднк)
US20230383311A1 (en) Non-viral dna vectors and uses thereof for expressing fviii therapeutics
TW202411426A (zh) 經工程化的2類v型crispr系統
KR20210150487A (ko) 리소좀 장애를 위한 유전자 요법