KR20220072758A - 트랜스-스플라이싱 아데노-연관 바이러스 벡터를 포함하는 프라임에디팅용 조성물 - Google Patents

트랜스-스플라이싱 아데노-연관 바이러스 벡터를 포함하는 프라임에디팅용 조성물 Download PDF

Info

Publication number
KR20220072758A
KR20220072758A KR1020210157739A KR20210157739A KR20220072758A KR 20220072758 A KR20220072758 A KR 20220072758A KR 1020210157739 A KR1020210157739 A KR 1020210157739A KR 20210157739 A KR20210157739 A KR 20210157739A KR 20220072758 A KR20220072758 A KR 20220072758A
Authority
KR
South Korea
Prior art keywords
protein
leu
prime
fragment
lys
Prior art date
Application number
KR1020210157739A
Other languages
English (en)
Inventor
김형범
장혜원
Original Assignee
연세대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 연세대학교 산학협력단 filed Critical 연세대학교 산학협력단
Priority to PCT/KR2021/017534 priority Critical patent/WO2022114815A1/ko
Publication of KR20220072758A publication Critical patent/KR20220072758A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1276RNA-directed DNA polymerase (2.7.7.49), i.e. reverse transcriptase or telomerase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07049RNA-directed DNA polymerase (2.7.7.49), i.e. telomerase or reverse-transcriptase
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/22Vectors comprising a coding region that has been codon optimised for expression in a respective host

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

트랜스-스플라이싱 아데노-연관 바이러스 벡터를 포함하는 프라임에디팅용 조성물에 관한 것이다. 일 양상에 따른 조성물을 사용하면 운반 크기(cargo size)가 큰 프라임에디터를 세포에 전달할 수 있어 유전체 편집 플랫폼으로 유용하게 사용될 수 있다. 또한, 표적 서열에 특이적으로 작용하며 높은 정확도로 유전체 교정이 가능하여 유전체 편집 분야에서 다양한 유전병 치료 용도로 활용될 수 있을 것으로 기대된다.

Description

트랜스-스플라이싱 아데노-연관 바이러스 벡터를 포함하는 프라임에디팅용 조성물{A composition for prime editing comprising trans-splicing adeno-associated virus vector}
트랜스-스플라이싱 아데노-연관 바이러스 벡터를 포함하는 프라임에디팅용 조성물에 관한 것이다.
프라임에디팅(Prime Editing)은 도너(donor) DNA 또는 이중가닥 절단(double-strand breaks: DSBs) 없이, 거의 모든 크기의 유전자 변화를 도입할 수 있는 혁신적인 신규 게놈 편집 방법이다(Anzalone, A.V. et al. Search-and-replace genome editing without double-strand breaks or donor DNA. Nature 576, 149-157 (2019)). 이러한 변화에는 삽입, 결실 및 모든 가능한 12가지 점 돌연변이뿐만 아니라 이러한 변화들의 조합을 포함한다.
프라임에디팅(Prime editing)은 기본적으로 단일 가닥만 절단하는 닉카아제 Cas9(nickase Cas9)과 역전사 효소(reverse transcriptase: RT)가 융합된 프라임에디터(Prime editor: PE) 단백질 및 프라임에디팅 가이드 RNA(prime editing guide RNA: pegRNA)가 복합체를 형성하여 일어나게 된다. 그동안 4가지 유형의 프라임에디터가 개발되었다: PE1, PE2, PE3, 및 PE3b. PE1 및 PE2는 Cas9-역전사 효소 융합 단백질(fusion protein)과 pegRNA로 구성되며, PE3 및 PE3b는 PE2와 하나의 추가 단일가닥 가이드 RNA(single guide RNA: sgRNA)로 구성된다.
한편, 유전체 편집이 실제로 치료 효과를 발휘하기 위해서는 유전자 가위가 표적 조직이나 세포에 안전하고, 효과적으로 전달되어야 한다. 유전자 가위를 체내에 전달하는 방법은 크게 바이러스성 전달체를 이용하는 방법과 비-바이러스성 전달체를 이용하는 방법으로 구분할 수 있으며, 유전자 가위의 크기, 전달하고자 하는 세포의 위치 및 안정성을 고려하여 구체적인 전달체를 선택할 수 있다. 그러나, CRISPR/Cas 시스템과 같은 잘 확립된 유전자 가위의 경우 이러한 연구가 활발하게 진행된 것에 반해, 프라임에디터에 대해서는 연구된 바가 거의 없다.
이에, 본 발명자들은 크기가 큰 프라임에디터를 효과적으로 체내로 전달하기 위한 방법을 연구하던 중, 트랜스-스플라이싱 아데노-연관 바이러스 벡터를 사용하는 경우 프라임에디터를 체내의 표적 부위에 정확하고 안정적으로 전달할 수 있고, 생체 내(in vivo)에서 높은 유전자 편집 효율을 나타냄을 확인하여 본 발명을 완성하였다.
일 양상은 N-말단 닉카아제 Cas9을 암호화하는 핵산 서열을 포함하는 프라임에디터 단백질의 제 1단편을 발현하는 재조합 벡터;
C-말단 닉카아제 Cas9에 융합된 역전사효소를 암호화하는 핵산 서열을 포함하는 프라임에디터 단백질의 제 2단편을 발현하는 재조합 벡터; 및
프라임에디팅 가이드 RNA(pegRNA) 서열을 포함하는 재조합 벡터를 포함하는 유전체 편집용 조성물로서,
상기 프라임에디터 단백질은 닉카아제 Cas9 단백질의 C-말단에 역전사 효소가 융합된 형태인 것인 유전체 편집용 조성물을 제공하는 것이다.
다른 양상은 상기 조성물을 포함하는 유전체 편집용 키트를 제공하는 것이다.
또 다른 양상은 N-말단 닉카아제 Cas9을 암호화하는 핵산 서열을 포함하는 프라임에디터 단백질의 제 1단편을 발현하는 재조합 벡터;
C-말단 닉카아제 Cas9에 융합된 역전사효소를 암호화하는 핵산 서열을 포함하는 프라임에디터 단백질의 제 2단편을 발현하는 재조합 벡터; 및
프라임에디팅 가이드 RNA(pegRNA) 서열을 포함하는 재조합 벡터를 각각 분리된 진핵 세포 또는 인간을 제외한 진핵 유기체에 도입하는 단계를 포함하고,
상기 프라임에디터 단백질은 닉카아제 Cas9 단백질의 C-말단에 역전사 효소가 융합된 형태인 것인 유전체를 편집하는 방법을 제공하는 것이다.
또 다른 양상은 상기 조성물을 포함하는 망막질환 예방 및 치료용 약학적 조성물 을 제공하는 것이다.
본 출원의 다른 목적 및 이점은 첨부한 청구범위 및 도면과 함께 하기의 상세한 설명에 의해 보다 명확해질 것이다. 본 명세서에 기재되지 않은 내용은 본 출원의 기술 분야 또는 유사한 기술 분야 내 숙련된 자이면 충분히 인식하고 유추할 수 있는 것이므로 그 설명을 생략한다.
본 출원에서 개시된 각각의 설명 및 실시형태는 각각의 다른 설명 및 실시형태에도 적용될 수 있다. 즉, 본 출원에서 개시된 다양한 요소들의 모든 조합이 본 출원의 범주에 속한다. 또한, 하기 기술된 구체적인 서술에 의하여 본 출원의 범주가 제한된다고 볼 수 없다.
일 양상은 N-말단 닉카아제 Cas9을 암호화하는 핵산 서열을 포함하는 프라임에디터 단백질의 제 1단편을 발현하는 재조합 벡터;
C-말단 닉카아제 Cas9에 융합된 역전사효소를 암호화하는 핵산 서열을 포함하는 프라임에디터 단백질의 제 2단편을 발현하는 재조합 벡터; 및
프라임에디팅 가이드 RNA(pegRNA) 서열을 포함하는 재조합 벡터를 포함하는 유전체 편집용 조성물로서,
상기 프라임에디터 단백질은 닉카아제 Cas9 단백질의 C-말단에 역전사 효소가 융합된 형태인 것인 유전체 편집용 조성물을 제공한다.
"유전체 편집(genome editing)"은 특별한 언급이 없는 한, 표적 유전자의 표적 부위에서의 절단에 의한 하나 이상의 핵산 분자(예컨대, 1 - 100,000 bp, 1 - 10,000 bp, 1 - 1,000 bp, 1 - 100 bp, 1 - 70 bp, 1 - 50 bp, 1 - 30 bp, 1 - 20 bp, 또는 1 - 10 bp)의 결실, 삽입, 치환 등에 의하여 유전자 기능을 상실, 변경, 및/또는 회복(수정)시키는 것을 의미한다. 본 명세서에서, 상기 유전체 편집은 프라임에디팅을 의미하는 것일 수 있다.
"프라임에디팅(Prime editing)"은 4세대 유전자 가위에 의한, DNA 이중가닥 절단 없이 한 가닥의 DNA만 절단하여 유전자 변화를 도입할 수 있는 게놈 편집 방법이다.
프라임에디팅은 "프라임에디터(Prime editor: PE)"에 의해 수행된다. 프라임에디터의 종류로는 PE1, PE2, PE3, 및 PE3b 등이 있으나, 이에 제한되지 않는다. 일 구체예에서, 상기 프라임에디터는 프라임에디터2(PE2) 또는 프라임에디터3(PE3)일 수 있다.
프라임에디터는 닉카아제 Cas9 단백질(nickase Cas9, nCas9)과 역전사 효소(reverse transcriptase: RT)가 융합된 프라임에디터(Prime editor: PE) 단백질 및 프라임에디팅 가이드 RNA(prime editing guide RNA: pegRNA)를 포함한다. 본 명세서에서 프라임에디터는 좁게는 닉카아제 Cas9 단백질과 역전사 효소가 융합된 프라임에디터 단백질을 의미하고, 넓게는 상기 프라임에디터 단백질과 프라임에디팅 가이드 RNA(pegRNA) 단일, RNA(pegRNA) 및/또는 단일가닥 가이드 RNA(sgRNA)와 복합체를 형성한 형태의 프라임에디터 복합체(prime editor complex)를 의미하는 것일 수 있다.
상기 "Cas9 단백질"은 한 가닥의 DNA를 절단(nick)하도록 변형된 것일 수 있다. 예를 들어, 상기 Cas9 단백질은 단일 가닥만 절단할 수 있는 돌연변이인 nCas9일 수 있으나, pegRNA와 함께 표적 부위로 전달되어 표적 특이적으로 단일 가닥만 절단할 수 있도록 변형된 Cas9 단백질이라면 제한 없이 사용할 수 있다.
프라임에디팅은 상기 프라임에디터 단백질과 프라임에디팅 가이드 RNA가 복합체를 형성하여 일어나게 된다. 상기 단일가닥 가이드 RNA(sgRNA)는 프라임에디팅 효율을 극대화하기 위해 추가로 도입될 수 있으며, 프라임에디팅 가이드 RNA(pegRNA)가 결합하는 표적 유전자 부위와 조금 떨어진 위치에서 프라임에디터 단백질과 함께 절단(nick)을 형성할 수 있다.
상기 프라임에디터는 유전자 사이즈가 크기 때문에, 벡터(예를 들어, 아데노-연관 바이러스(AAV) 등의 바이러스 벡터)를 이용하여 프라임에디터를 세포 내 또는 유기체 내로 전달하는 경우 효율이 떨어지는 문제가 있을 수 있고, 이는 프라임에디팅 기술 적용에 한계로 작용할 수 있다. 특히, AAV 벡터와 같은 바이러스 벡터의 경우, 벡터의 패키징(packaging) 한계 때문에 패키징 한계를 넘는 유전자가 클로닝 된 경우 바이러스 생산 효율 및 세포 내 전달 효율이 떨어지는 현상이 보편적으로 잘 알려져 있다.
이에, 본 명세서에서 사용되는 프라임에디터 단백질 또는 이를 암호화하는 핵산 서열은 적어도 하나 이상의 임의의 위치에서 절단되어 생성된 두 개 이상의 절단 단편들 중 하나 이상을 포함하는 것일 수 있다. 상기 두 개 이상의 절단되어 생성된 단편들은 하나의 벡터에 함께 포함되거나 두 개 이상의 벡터에 각각 포함되어 세포 또는 유기체에 전달될 수 있고, 바람직하게는 두 개 이상의 벡터에 각각 포함되어 세포 또는 유기체에 전달될 수 있다. 상기 두 개 이상의 절단되어 생성된 단편들은 전장 프라임에디터 단백질을 중복 없이 커버(cover)하는 것일 수 있다. 상기 전장 프라임에디터 단백질은 닉카아제 Cas9 단백질의 C-말단에 역전사 효소가 융합된 단백질일 수 있고, 바람직하게는 닉카아제 Cas9 단백질의 C-말단과 역전사 효소가 링커로 연결됨으로써 융합된 단백질일 수 있다.
"제1 단편"은 N-말단 프라임에디터 단백질로서 닉카아제 Cas9 단백질의 N-말단을 포함하는 부분을 의미하며, "제2 단편"은 C-말단 프라임에디터 단백질로서 닉카아제 Cas9 단백질의 C-말단에 융합된 역전사효소를 포함하는 부분을 의미한다. 상기 제1 단편 및 제2 단편은 세포 내에서 각각 발현 및 융합하여 프라임에디터 단백질 전체를 형성할 수 있다.
상기 프라임에디터 단백질 또는 이를 암호화하는 핵산 서열의 절단 지점은 프라임에디터 단백질의 3차 구조상 외부 노출 부위 또는 소정의 기능을 갖는 도메인 이외의 부위 (예를 들어, 도메인 간 링커(domain-domain linker), 또는 상기 외부 노출 부위 또는 도메인 이외의 부위를 암호화하는 핵산 서열 내에 위치할 수 있다.
상기 제1 단편 및/또는 제2 단편을 포함하는 재조합 벡터는 스플라이싱 도너(SD) 또는 스플라이싱 어셉터(SA)를 암호화하는 핵산 서열을 추가로 포함할 수 있다. 또한, 상기 재조합 벡터는 우드척 간염바이러스 전사후 조절요소(WPRE)를 암호화하는 핵산 서열을 더 포함할 수 있다.
상기 SD/SA 서열은 RNA 전사체의 인트론을 제거하는 스플라이싱 반응에 있어서 잘려나가는 인트론의 시작부분과 끝나는 부분에 해당하는 서열을 의미하고, WPRE는 DNA 상에 발현을 촉진하는 3차 구조를 유도하여 유전자의 발현을 증가시키는 서열을 의미한다. 상기 SD/SA는 전사 시작(transcription initiation)과 RNA 폴리머라제 ±의 프로세싱(processing) 및 mRNA의 핵에서 세포질로의 이동(nucleocytoplasmic export)을 증가시키며, WPRE는 mRNA의 프로세싱과 핵에서 세포질로의 이동을 증가시킴으로써 각각 pre-mRNA 수준을 증가시킬 수 있다.
상기와 같은 구성을 통하여 세포 내에서 프라임에디터 단백질의 RNA 수준이 현저히 증가되고, 전사체 양이 증가함으로써, 표적 세포 또는 조직에서 프라임에디터의 발현이 특이적으로 이루어지도록 함으로써 원하는 위치에서의 정확한 유전체 편집이 가능하도록 할 수 있다.
일 구체예에서, 상기 제1 단편을 암호화하는 핵산 서열은 C-말단에 스플라이싱 도너(splicing donor: SD)가 연결된 것이고, 상기 제2 단편을 암호화하는 핵산 서열은 N-말단에 스플라이싱 어셉터(splicing acceptor: SA)가 연결된 것일 수 있다.
상기 프라임에디터 단백질은 서열번호 1의 아미노산 서열로 표시될 수 있다. 상기 서열번호 1의 아미노산 서열로 표시되는 프라임에디터 단백질은, 예를 들어 서열번호 2의 핵산 서열로 표시되는 폴리뉴클레오티드에 의해서 암호화될 수 있으나, 이에 제한되는 것은 아니다.
일 구체예에서, 상기 프라임에디터 단백질의 제1 단편은 서열번호 1의 1번째 아미노산 잔기부터 1035번째 아미노산 잔기까지의 아미노산 서열(서열번호 1에서, N 말단으로부터 1 내지 1035번째 아미노산)로 이루어진 단백질 단편을 포함하고,
상기 프라임에디터 단백질의 제2 단편은 서열번호 1의 1036번째 아미노산 잔기부터 1368번째 아미노산 잔기까지의 아미노산 서열(서열번호 1에서, N 말단으로부터 1036 내지 1368번째 아미노산)로 이루어진 단백질 단편을 포함하고, 상기 단백질 단편은 C-말단에 역전사효소(reverse transcriptase)가 융합된 것일 수 있다.
"역전사 효소(reverse transcriptase: RT)"는 RNA를 주형으로 하고, 이에 상보적인 새로운 DNA를 합성하는 효소를 의미한다. 상기 역전사 효소는 닉카아제 Cas9 단백질의 C-말단에 융합될 수 있고, 벡터 내에서 닉카아제 Cas9 단백질을 암호화하는 핵산 서열과 링커(linker)로 연결된 것일 수 있다. 일 구체예에서, 상기 역전사 효소는 마우스 백혈병 바이러스(Moloney Murine Leukemia Virus)에서 유래한 MMLV 역전사 효소일 수 있다.
상기 각 단백질 단편을 암호화하는 핵산 서열은 별개의 재조합 벡터에 각각 포함될 수 있고, 프라임에디터 단백질 내 절단 위치에 따라 트랜스-스플라이싱(trans-splicing) 효율이 달라질 수 있다.
본 명세서에서, 프라임에디터는 Cas9 닉카아제 -RT 융합 단백질만을 포함하는 것을 의미할 수도 있고, Cas9 닉카아제 -RT 융합 단백질과 pegRNA를 함께 포함하는 것을 의미할 수도 있다. 예를 들어, 세포 내에 pegRNA를 별도로 도입한 경우, 여기에 프라임에디터를 도입하였다는 것은 Cas9 닉카아제 -RT 융합 단백질만을 도입한 것을 의미할 수 있다. 즉, pegRNA가 이미 도입되어 있는 경우 프라임에디터의 도입은 Cas9 닉카아제 -RT 융합 단백질만을 도입한 것을 의미할 수 있다.
"pegRNA(prime editing guide RNA)"는 표적 서열을 인식하는 가이드 서열(guide sequence), tracrRNA 스캐폴드 서열, 역전사 개시에 필요한 프라이머 결합 부위(primer binding site: PBS) 및 원하는 유전적 변화를 포함하는 RT 주형(RT template)을 포함한다.
일 구체예에서, 상기 pegRNA는 서열번호 3, 서열번호 28 및/또는 서열번호 29의 뉴클레오티드 서열을 포함하는 것일 수 있다. 일 구체예에서는 확인한 pegRNA 157은 서열번호 28로 이루어진 뉴클레오티드 서열이며, pegRNA 198은 서열번호 29로 이루어진 뉴클레오티드 서열이다.
서열 (5'-3') 서열번호
gTGCCTTTCAGTTTCTGGGTgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtgggaccgagtcggtccAGTACCACCCAtCCAGAAACTGAAAG 3
gGAGCCCTGGCCCACATCAGgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcgcagtctcctccgatgtgggcc 28
gGAGCCCTGGCCCACATCAGgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcggcagtctcctccgatgtgggcc 29
"표적 서열(target sequence)"은 pegRNA가 목적하는 표적 뉴클레오티드 서열을 의미한다. 상기 표적 서열은 pegRNA가 표적으로 할 것으로 예상되는 서열일 수 있고, 예를 들어 당업계에 공지된 게놈 서열 중 일부 서열 또는 당업자가 분석하고자 하는 서열을 임의로 설계한 서열일 수 있다.
"벡터"는 적당한 숙주세포에서 목적 단백질을 발현할 수 있는 발현 벡터로서, 유전자 삽입물이 발현되도록 작동 가능하게 연결된 필수적인 조절 요소를 포함하는 유전자 작제물을 의미한다.
"작동 가능하게 연결된(operably linked)"은 일반적 기능을 수행하도록 핵산 발현조절 서열과 목적하는 단백질을 코딩하는 핵산 서열이 기능적으로 연결(functional linkage)되어 있는 것을 의미한다.
상기 벡터는 프라임에디터 단백질, 프라임에디터 가이드RNA(pegRNA)를 세포 내에 전달할 수 있도록 하는 매개체를 의미할 수 있다. 상기 벡터는 바이러스 벡터 또는 플라스미드 벡터일 수 있으나, 이에 제한되지 않는다. 상기 바이러스 벡터는 레트로바이러스(retrovirus) 벡터, 아데노바이러스(adenovirus) 벡터, 아데노-연관 바이러스(adeno-associated virus) 벡터 및 헤르페스 심플렉스 바이러스(herpes simplex virus) 벡터로 이루어진 군으로부터 선택되는 어느 하나일 수 있으나, 이에 제한되지 않는다. 바람직하게는, 상기 벡터는 아데노-연관 바이러스 벡터일 수 있고, 상기 AAV 벡터는 특정 혈청형(serotype)에 제한되는 것은 아니나, 예를 들면 혈청형 2 또는 혈청형 8 유래일 수 있다.
상기 벡터는 개체의 세포 내에 존재하는 경우 삽입물, 즉 암호화된 핵산서열이 발현될 수 있도록 삽입물에 작동가능하게 연결된 필수적인 조절 요소를 포함할 수 있다. 상기 벡터는 표준적인 재조합 DNA 기술을 이용하여 제조 및 정제될 수 있다. 상기 벡터의 종류는 원핵세포 및 진핵세포 등 목적하는 세포에서 작용할 수 있도록 하는 한, 특별히 한정되지 않는다. 벡터는 프로모터, 개시코돈, 및 종결코돈 터미네이터를 포함할 수 있다. 그 외에 시그널 펩타이드를 암호화하는 DNA, 및/또는 인핸서 서열, 및/또는 원하는 유전자의 5'측 및 3'측의 비번역 영역, 및/또는 선택마커 영역, 및/또는 복제가능단위 등을 적절하게 포함할 수도 있다.
"프로모터(promoter)"는 전사조절인자들이 결합하는 DNA 염기서열 부위를 의미하며, 본 발명의 목적상 유전자 발현율을 높이기 위하여 강력하고 안정적인 유전자 발현을 유도할 수 있는 프로모터를 사용할 수 있다.
상기 벡터는 벡터의 전달 효율을 향상시키기 위하여, 핵 국재화 서열(nuclear localization sequence: NLS)을 더 포함할 수 있다.
"핵 국재화 서열"은 세포 내로 벡터가 도입된 후 세포질 내에 존재하는 전사인자가 결합하여 벡터의 핵 내로의 이동을 보조하는 폴리뉴클레오티드 서열을 의미한다. 전사인자의 핵 내로의 유입은 다양한 외부 및 내부 자극뿐만 아니라 발생 신호에 반응하여 일어나는 과정이다. 그러므로, 벡터 내에 삽입된 NLS는 세포 내로 도입된 벡터가 핵 내로 유입될 수 있도록 이동을 촉진한다.
일 구체예에서, 상기 프라임에디팅 가이드 RNA(pegRNA) 서열을 포함하는 재조합 벡터는 단일가닥 가이드 RNA(sgRNA)를 암호화하는 핵산 서열을 더 포함할 수 있다. 상기 "sgRNA"는 에디팅 부위에서 조금 떨어진 위치에 또 다른 DNA 절단(nick)을 만들어 낼 수 있도록 추가로 도입한 가이드 RNA를 의미하며, 이 경우 프라임에디터는 프라임에디터3(PE3)일 수 있다. 일 구체예에서, 상기 sgRNA는 서열번호 4의 뉴클레오티드 서열을 포함하는 것일 수 있다.
서열 (5'-3') 서열번호
GATGAGTACGTCCATGTTGGGTTTTAGAGCTAGAAATAGCAAGTTAAaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc 4
일 구체예에서, 재조합 벡터는 트랜스-스플라이싱 아데노-연관 바이러스 벡터일 수 있고, 5'에서 3'방향으로, (i) ITR 서열, CMV 프로모터, NLS 서열, 프라임에디터 단백질의 제1 단편을 암호화하는 제1 핵산 서열, SD 서열 및 ITR 서열을 포함하거나(TS-PE2-N, 서열번호 26); 또는 (ii) ITR 서열, SA 서열, 프라임에디터 단백질의 제2 단편을 암호화하는 제2 핵산 서열, NLS 서열, WPRE 서열, poly(A) 및 ITR 서열(TS-PE2-C-WPRE, 서열번호 27)을 포함하는 것일 수 있다. 또한, 재조합 벡터는 아데노-연관 바이러스 벡터일 수 있고, 5'에서 3'방향으로 ITR 서열, U6 프로모터, pegRNA를 암호화하는 핵산 서열, H1 프로모터, sgRNA를 암호화하는 핵산 서열, CMV 프로모터, mCherry 유전자 서열 및 ITR 서열을 포함하는 것일 수 있다(U6-pegRNA-H1-nick sgRNA-mCherry).
상기 벡터를 세포에 전달하는 방법은 당업계에 공지된 다양한 방법을 이용하여 달성될 수 있다. 예컨대, 국소 주입법, 미세주사법(microinjection), 전기천공법(electroporation), 리포펙션(lipofection) 방법 등의 당 분야에 공지된 여러 방법에 의해 수행될 수 있다. 또한, 바이러스 벡터를 이용하는 경우, 감염(infection)을 수단으로 하여 바이러스 입자를 사용하여 목적물, 즉 벡터를 세포 내로 전달시킬 수 있다. 아울러, 유전자 밤바드먼트 등에 의해 벡터를 세포 내로 도입할 수 있다. 상기 도입된 벡터는 세포 내에서 벡터 자체로 존재하거나, 염색체 내에 통합될 수 있으나, 이에 제한되는 것은 아니다.
상기 조성물은 진핵 세포 또는 진핵 유기체의 유전체 편집에 사용할 수 있다. 상기 진핵 유기체는 진핵 세포(예를 들어, 효모 등의 균류, 진핵 동물 및/또는 진핵 식물 유래 세포(예를 들어, 배아세포, 줄기세포, 체세포, 생식세포 등) 등), 진핵 동물(예를 들어, 척추동물 또는 무척추동물, 보다 구체적으로, 인간, 원숭이 등의 영장류, 개, 돼지, 소, 양, 염소, 마우스, 래트 등을 포함하는 포유류 등) 및 진핵 식물(예를 들어, 녹조류 등의 조류, 옥수수, 콩, 밀, 벼 등의 단자엽 또는 쌍자엽 식물 등)로 이루어진 군으로부터 선택되는 것일 수 있다. 바람직하게는, 상기 조성물은 진핵 세포 또는 진핵 유기체의 프라임에디팅 용도로 사용할 수 있다.
본 명세서에서, 용어 "프라임에디팅 효율"은 프라임에디터에 의한 유전자 편집 효율을 의미한다. 프라임에디팅 효율은 프라임에디팅을 수행하였을 때, 표적 서열 내에서 의도하지 않은 돌연변이 없이 프라임에디터 및 pegRNA에 의해 유도된 편집이 발생하는 비율로 계산될 수 있다. 상기 프라임에디팅 효율은 백분율로 표시될 수 있다.
구체적으로, 상기 프라임에디팅 효율에 대한 데이터는 상기 유전체 편집용 조성물을 세포 또는 조직에 도입하는 단계; 상기 조성물이 도입된 세포 또는 조직으로부터 수득한 DNA를 이용하여 딥 시퀀싱(Deep sequencing)을 수행하는 단계; 및 상기 딥 시퀀싱으로 수득한 데이터로부터 프라임에디팅 효율을 분석하는 단계를 포함하는 방법을 수행하여 수득된 것일 수 있다.
상기 프라임에디터가 도입된 세포 또는 조직으로부터 DNA를 수득하는 방법은 당업계에 공지된 다양한 DNA 분리 방법을 이용하여 수행될 수 있다. 각각의 세포 또는 조직은 도입된 표적 서열에서 유전자 편집이 발생한 것으로 예상되므로, 표적 서열을 서열 분석하여 유전자 편집 효율을 검출할 수 있다. 상기 서열 분석 방법은 프라임에디팅 효율 데이터를 얻을 수 있다면 특정 방법에 제한되는 것은 아니나, 예를 들어 딥 시퀀싱을 이용할 수 있다.
상기 딥시퀀싱으로 수득한 데이터로부터 프라임에디팅 효율을 분석하는 단계는 프라임에디팅 효율을 계산하는 단계를 포함할 수 있다. 프라임에디팅 효율은 pegRNA 서열 및 표적 서열의 종류 및/또는 길이에 따라 다르게 나타날 수 있다. 상기 프라임에디팅 효율에 대한 데이터는 데이터 세트로 제공될 수 있다.
일 양상에 따른 조성물을 사용하면, 운반 크기(cargo size)가 큰 프라임에디터를 세포에 전달할 수 있어 유전체 편집 플랫폼으로 유용하게 사용될 수 있다. 일 구체예에서는, Atp7b 를 표적으로 하는 pegRNA 및 sgRNA를 암호화하는 AAV 벡터와 함께, (i) PE2의 N-말단 절반을 암호화하는 제 1 tsAAV 벡터; 및 (ii) PE2의 C-말단 절반을 암호화하는 제2 tsAAV 벡터를 마우스 망막색소상피 및 망막에 투여하고, 그 결과 일 양상에 따른 조성물은 표적 서열에 특이적으로 작용하며 높은 정확도로 유전체 교정이 가능함을 확인하였다.
또한 일 양상에 따른 조성물을 사용하면, 운반 크기(cargo size)가 큰 프라임에디터를 세포에 전달할 수 있어 RPE65를 표적으로 하는 pegRNA를 암호화하는 AAV 벡터와 함께 (i) PE2의 N-말단 절반을 암호화하는 제 1 tsAAV 벡터; 및 (ii) PE2의 C-말단 절반을 암호화하는 제2 tsAAV 벡터를 마우스 망막색소상피에 투여하고, 그 결과 일 양상에 따른 조성물은 표적 서열에 특이적으로 작용하며 높은 정확도로 유전체 교정이 가능함을 확인하였다.
따라서, 일 양상에 따른 조성물은 유전체 편집 분야에서 다양한 유전병 치료 용도로의 활용이 가능하다.
다른 양상은 상기 조성물을 포함하는 유전체 편집용 키트를 제공한다.
상기 키트는 재조합 벡터의 발현이 이루어지거나 촉진될 수 있도록 하는 물질 또는 세포를 유지할 수 있도록 하는 배지용 조성물 뿐 아니라 재조합 벡터의 제작 또는 세포 내로의 도입 등을 용이하게 할 수 있는 조성물, 재조합 벡터의 제작 또는 세포 내로의 도입을 위한 설명서 등을 포함할 수 있다.
또 다른 양상은 상기 N-말단 닉카아제 Cas9을 암호화하는 핵산 서열을 포함하는 프라임에디터 단백질의 제 1단편을 발현하는 재조합 벡터; C-말단 닉카아제 Cas9에 융합된 역전사효소를 암호화하는 핵산 서열을 포함하는 프라임에디터 단백질의 제 2단편을 발현하는 재조합 벡터; 및 프라임에디팅 가이드 RNA(pegRNA) 서열을 포함하는 재조합 벡터를 포함하는 망막질환 예방 및 치료용 약학적 조성물을 제공한다.
상기 망막질환은 예를 들면 망막색소변성증, 원뿔세포이상증, 황반변성, 스타가르트병(Stargardt disease), 레베르선천성흑내장(Leber congenital amaurosis: LCA), 유전성 망막디스트로피, 맥락막결손, 유전성 유리체망막병증, 녹내장, 어셔 증후군, 바뎃-비들 증후군, 베스트병, 맥락망막 위축, 망막 황반성 퇴화증, 망막층간 분리, 말라티아 레벤티네스(Malattia Leventinese: ML), 오구치병(Oguchi disease) 및 레프섬병(Refsum disease)으로 이루어진 군으로부터 선택되는 하나 이상일 수 있고, 바람직하게는 유전성 망막질환으로서 망막색소변성증, 원뿔세포이상증, 황반변성, 스타가르트병(Stargardt disease), 레베르선천성흑내장, 유전성 망막디스트로피, 맥락막결손 및 유전성 유리체망막병증으로 이루어진 군으로부터 선택되는 하나 이상일 수 있으나, 이에 제한되는 것은 아니다.
용어 "예방"은 망막질환의 병인을 제거하거나 조기 발견하여 해당 질환을 막는 모든 행위를 의미한다.
용어 "치료"는 망막질환에 의한 증세가 호전되거나 이롭게 변경되는 모든 행위를 의미한다.
상기 망막질환의 예방 또는 치료용 약학적 조성물은 상기 재조합 벡터 이외에 약학적으로 허용 가능한 담체 즉 식염수, 멸균수, 링거액, 완충 식염수, 사이클로덱스트린, 덱스트로즈 용액, 말토덱스트린 용액, 글리세롤, 에탄올, 리포좀 및 이들 성분 중 1종 이상을 혼합하여 사용할 수 있으며, 필요에 따라 항산화제, 완충액 등 다른 통상의 첨가제를 더 포함할 수 있다. 또한 희석제, 분산제, 계면활성제, 결합제 및/또는 윤활제를 부가적으로 첨가하여 수용액, 현탁액, 유탁액 등과 같은 주사용 제형, 환약, 캡슐, 과립 또는 정제로 제제화할 수 있다. 더 나아가 당해 기술분야의 적정한 방법으로 또는 레밍턴의 문헌(Remington's Pharmaceutical Science, Mack Publishing Company, Easton PA)에 개시되어 있는 방법을 이용하여 각 성분에 따라 바람직하게 제제화할 수 있다. 본 발명의 약학 조성물은 제형에 특별한 제한은 없으나 주사제, 안약 또는 흡입제로 제제화하는 것이 바람직하다.
일 양상에 따른 약학적 조성물의 투여방법은 특별히 제한되는 것은 아니나, 목적하는 방법에 따라 정맥내, 망막내, 유리체강내(intravitreal), 피하, 복강 내, 흡입 또는 국소적용과 같이 비경구 투여하거나 경구 투여할 수 있다. 투여량은 환자의 체중, 연령, 성별, 건강상태, 식이, 투여시간, 투여방법, 배설율 및 질환의 중증도 등에 따라 그 범위가 다양하다. 일일 투여량은 치료를 필요로 하는 개체에 투여됨으로서 경감된 질병 상태에 대한 치료에 충분한 일 양상에 따른 치료용 물질의 양을 의미한다. 치료용 물질의 효과적인 양은 특정 화합물, 질병 상태 및 그의 심각도, 치료를 필요로 하는 개체에 따라 달라지며, 이는 당업자에 의해 통상적으로 결정될 수 있다. 비제한적 예로서, 일 양상에 따른 조성물의 인체에 대한 투여량은 환자의 나이, 몸무게, 성별, 투여 형태, 건강 상태 및 질환 정도에 따라 달라질 수 있다. 몸무게가 70 ㎏인 성인 환자를 기준으로 할 때 예를 들어 약 1,000~10,000 세포/회, 1,000~100,000세포/회, 1,000~1000,000 세포/회, 1,000~10,000,000, 1,000~100,000,000 세포/회, 1,000~1,000,000,000 세포/회, 1,000~10,000,000,000 세포/회로, 일정시간 간격으로 1일 1회 내지 수회에 분할 투여할 수도 있고, 일정 시간 간격으로 여러 번 투여할 수 있다.
'개체'란 유전질환, 구체적으로 망막 질환의 치료를 필요로 하는 대상을 의미하고, 보다 구체적으로 인간 또는 비-인간인 영장류, 마우스(mouse), 쥐(rat), 개, 고양이, 말 및 소 등의 포유류를 의미한다.
또 다른 양상은 N-말단 닉카아제 Cas9을 암호화하는 핵산 서열을 포함하는 프라임에디터 단백질의 제 1단편을 발현하는 재조합 벡터;
C-말단 닉카아제 Cas9에 융합된 역전사효소를 암호화하는 핵산 서열을 포함하는 프라임에디터 단백질의 제 2단편을 발현하는 재조합 벡터; 및
프라임에디팅 가이드 RNA(pegRNA) 서열을 포함하는 재조합 벡터를 각각 분리된 진핵 세포 또는 인간을 제외한 진핵 유기체에 도입하는 단계를 포함하고,
상기 프라임에디터 단백질은 닉카아제 Cas9 단백질의 C-말단에 역전사 효소가 융합된 형태인 것인 유전체를 편집하는 방법을 제공한다.
상기 프라임에디터 단백질의 제1 단편 및 제2 단편은 세포 내에서 각각 발현 및 융합하여 프라임에디터 단백질을 형성하는 것일 수 있다.
상기 제1 단편을 암호화하는 핵산 서열은 C-말단에 스플라이싱 도너(splicing donor: SD)가 연결된 것이고, 상기 제2 단편을 암호화하는 핵산 서열은 N-말단에 스플라이싱 어셉터(splicing acceptor: SA)가 연결된 것일 수 있다.
일 구체예에서, 상기 프라임에디터 단백질의 제1 단편은 서열번호 1의 1번째 아미노산 잔기부터 1035번째 아미노산 잔기까지의 아미노산 서열(서열번호 1에서, N 말단으로부터 1 내지 1035번째 아미노산)로 이루어진 단백질 단편을 포함하고,
상기 프라임에디터 단백질의 제2 단편은 서열번호 1의 1036번째 아미노산 잔기부터 1368번째 아미노산 잔기까지의 아미노산 서열(서열번호 1에서, N 말단으로부터 1036 내지 1368번째 아미노산)로 이루어진 단백질 단편을 포함하고, 상기 단백질 단편은 C-말단에 역전사효소(reverse transcriptase)가 융합된 것일 수 있다.
상기 프라임에디터 단백질의 제1 단편 및 제2 단편은 세포 내에서 각각 발현 및 융합하여 프라임에디터 단백질을 형성할 수 있다.
상기 프라임에디터 단백질은 서열번호 1의 아미노산 서열로 표시될 수 있다. 상기 서열번호 1의 아미노산 서열로 표시되는 프라임에디터 단백질은, 예를 들어 서열번호 2의 핵산 서열로 표시되는 폴리뉴클레오티드에 의해서 암호화될 수 있으나, 이에 제한되는 것은 아니다.
상기 프라임에디터 단백질은 핵 국재화 서열을 더 포함할 수 있다. 또한, 상기 프라임에디터 가이드 RNA 서열을 포함하는 재조합 벡터는 단일가닥 가이드 RNA 서열을 더 포함할 수 있다.
상기 재조합 벡터를 도입하는 단계는 국소 주입법, 미세주사법(microinjection), 전기천공법(electroporation) 및 리포펙션(lipofection) 방법으로 이루어진 군으로부터 선택되는 어느 하나에 의해 수행될 수 있다.
상기 방법은 진핵 세포 또는 진핵 유기체의 유전체 편집에 사용할 수 있다. 상기 진핵 유기체는 진핵 세포(예를 들어, 효모 등의 균류, 진핵 동물 및/또는 진핵 식물 유래 세포(예를 들어, 배아세포, 줄기세포, 체세포, 생식세포 등) 등), 진핵 동물(예를 들어, 척추동물 또는 무척추동물, 보다 구체적으로, 인간, 원숭이 등의 영장류, 개, 돼지, 소, 양, 염소, 마우스, 래트 등을 포함하는 포유류 등) 및 진핵 식물(예를 들어, 녹조류 등의 조류, 옥수수, 콩, 밀, 벼 등의 단자엽 또는 쌍자엽 식물 등)로 이루어진 군으로부터 선택되는 것일 수 있다.
상기 유전체를 편집하는 방법에서 수행되는 모든 단계는 세포 내 또는 세포 외, 또는 생체 내 또는 생체 외에서 수행되는 것일 수 있다.
상기 유전체를 편집하는 방법은 프라임에디팅에 의해 수행되는 것일 수 있다.
상기 유전체를 편집하는 방법에 대한 설명에서 언급된 용어 또는 요소 중 이미 언급된 것과 동일한 것은 상술한 바와 같다.
일 양상에 따른 조성물을 사용하면 운반 크기(cargo size)가 큰 프라임에디터를 세포에 전달할 수 있어 유전체 편집 플랫폼으로 유용하게 사용될 수 있다. 또한, 표적 서열에 특이적으로 작용하며 높은 정확도로 유전체 교정이 가능하여 유전체 편집 분야에서 다양한 유전병 치료 용도로 활용될 수 있을 것으로 기대된다.
도 1은 야생형 마우스 망막 및 망막색소상피에서의 프라임에디팅에 관한 개요로서, 실험에 사용한 AAV 벡터맵을 나타낸 도이다. 각 벡터에서, 두 ITR(Inverted terminal repeats) 사이의 서열 길이를 괄호 안에 표시하였다. 2개의 트랜스-스플라이싱 PE2-발현 AAV 벡터(TS-PE2-N, TS-PE2-C-WPRE)를 pegRNA 및 sgRNA를 발현하는 AAV 벡터(U6-pegRNA-H1-nick sgRNA-mCherry)와 함께 망막 및 망막색소상피로 주사하였다. 6주 후, 딥 시퀀싱을 위해 망막 및 망막색소상피 세포를 수집하였다. SD: 스플라이싱 도너(splicing donor); SA: 스플라이싱 어셉터(splicing acceptor); NLS: (nuclear localization sequence, 핵 국소화 서열); ITR: (Inverted terminal repeats, 역위 말단 반복); MMLV-RT: Moloney murine leukemia virus reverse transcriptase, MMLV 역전사 효소); WPRE: Woodchuck hepatitis virus post-transcriptional regulatory element, 우드척 간염바이러스 전사후 조절요소).
도 2는 마우스 Atp7b 유전자좌(locus)의 표적 서열을 나타낸 도이다. 프라임에디팅을 통해 G(빨간색)를 A로 바꾸고자 하였다. 밑줄 부분은 RT 서열을 의미하며, 프라이머 결합 부위(primer binding site: PBS)는 소문자로 표시하였다. 표적 서열의 프로토스페이서(protospacer) 및 PAM은 각각 녹색 선, 파란색 선으로 표시하였다.
도 3의 a는 마우스 Atp7b 유전자의 엑손 8 상에 위치한 표적 서열 및 pegRNA, sgRNA에 의해 절단되는 부위를 나타낸 도이다. pegRNA, sgRNA 스페이서(spacer)는 녹색 선으로 표시하였다. pegRNA, sgRNA 표적 서열의 PAM은 각각 파란색 선, 주황색 선으로 표시하였다. 도 3의 b는 N2A 세포에서 측정한 6개 pegRNA의 편집 효율(efficiency, %)을 분석한 결과를 나타낸 도이다.
도 4는 PE3 처리된 마우스의 망막색소상피(왼쪽 그래프), 망막(오른쪽 그래프)에서의 의도된, 의도되지 않은 편집 빈도를 나타낸 도이다. PCR 증폭 및 시퀀싱으로부터 발생하는 오류들을 제외하기 위하여, 실험군의 상기 편집 빈도에서 대조군의 상기 편집 빈도 평균을 빼서 정규화하였다. 표적 뉴클레오티드 주위의 치환은 표적 지점을 중심으로 40bp 범위에서 평가하였다. 인델(indel)은 pegRNA 닉킹 부위를 중심으로 136bp 범위에서 측정하였다. 빨간색 가로선은 정규화된 빈도가 0인 위치를 나타낸다. 데이터는 평균 ± s.d로 나타내었으며, 마우스의 수는 3마리로 하였다.
도 5는 PE3 처리된 마우스의 망막색소상피에서, 표적 서열 내 각 위치에서의 치환 빈도(substitution frequencies)를 나타낸 도이다. 치환 빈도는 PE3로 처리되지 않은 대조군의 배경 프라임에디팅 빈도를 빼서 정규화하였다. 빨간색 가로선은 정규화된 빈도가 0인 위치를 나타낸다. 표적 위치는 +2이다. 데이터는 평균 ± s.d로 나타내었으며, 마우스의 수는 3마리로 하였다.
도 6은 PE3 처리된 야생형 마우스의 망막, 망막색소상피에서의 시퀀싱 결과를 나타낸 도이다. 대조군으로는 PE3을 주사하지 않은(non-injection) 야생형 마우스의 망막, 망막색소상피세포를 사용하였다. 빨간색 뉴클레오티드는 프라임에디팅 표적 염기를 나타낸다.
도 7은 PE3 처리된 마우스의 망막에서, 표적 서열 내 각 위치에서의 치환 빈도(substitution frequencies)를 나타낸 도이다. 치환 빈도는 PE3로 처리되지 않은 대조군의 배경 프라임에디팅 빈도를 빼서 정규화하였다. 빨간색 가로선은 정규화된 빈도가 0인 위치를 나타낸다. 표적 위치는 +2이다. 데이터는 평균 ± s.d로 나타내었으며, 마우스의 수는 3마리로 하였다.
도 8은 rd12 마우스의 RPE65 유전자 (p.R44X) 의 엑손 3의 130번째 위치에 C가 T로 치환되어 발생한 넌센스 돌연변이를 보여주는 도이다.
도 9는 rd12 마우스에서 레베르선천성흑내장(LCA)를 유도하는 넌센스 돌연변이를 편집하기 위한 pegRNA 후보군 NG-PE2 타겟 시퀀스를 확인한 도(도 9A)로서, 프로토스페이서(protospacer)는 초록색으로, 각 타겟 시퀀스의 PAM 서열은 빨간색으로 나타내었고, 각 선 옆의 숫자는 타겟 id를 나타낸다. 또한 pegRNA 및 타겟 시퀀스 쌍의 올리고 라이브러리의 모식도를 도 9B에 나타냈다. 각 pegRNA는 프로토스페이서, PAM 및 이웃 시퀀스(neighboring sequences)를 포함하는 타겟 시퀀스를 포함하는 넓은 타겟 시퀀스와 연결되었고, pegRNA 발현은 인간 U6 프로모터(hU6)에 의하여 유도되었으며, 라이브러리는 5 내지 5개의 상이한 길이(7, 9, 11, 13, 15 또는 17nt)의 PBS를 포함하는 pegRNA와 9 내지 16개의 상이한 길이의 RT 템플릿을 포함하는 총 561개의 pegRNA-타겟 페어를 포함한다. 스페이서(Spacer) : pegRNA의 가이드 시퀀스; RT : 역전사 효소(reverse transcriptase); PBS : 프라이머 바인딩 사이트
도 10은 pegRNA에 따른 프라임에디팅 효율을 확인한 도로서, 구체적으로 NG-PE2 인코딩 플라스미드로 독립적으로 형질감염된 복제물에서 프라임에디팅 효율간의 상관관계를 나타낸 도이다. 빨간색과 검은색 점은 각각 NGG 및 NGH PAM가 있는 해당 표적 서열을 포함한 pegRNA를 나타낸다. 파란색 화살표는 이후 실험을 위해 선택된 pegRNA이며, Spearman(R) 및 Pearson(r) 상관 계수 및 추세선이 표시됩니다. n = 309 pegRNA-표적 서열 쌍
도 11은 rd12 마우스에서의 프라임에디팅에 관한 개요로서, 실험에 사용한 AAV 벡터맵을 나타낸 도이다. 각 벡터에서, 두 ITR(Inverted terminal repeats) 사이의 서열 길이를 괄호 안에 표시하였다. 2개의 트랜스-스플라이싱 PE2-발현 AAV 벡터(TS-PE2-N, TS-PE2-C-WPRE)를 pegRNA를 발현하는 AAV 벡터(U6-pegRNA-mCherry)와 함께 망막하에(subretinal) 주사하였다. 6주 후, 딥 시퀀싱을 위해 망막색소상피세포를 수집하였다. SD: 스플라이싱 도너(splicing donor); SA: 스플라이싱 어셉터(splicing acceptor); NLS: (nuclear localization sequence, 핵 국소화 서열); ITR: (Inverted terminal repeats, 역위 말단 반복); MMLV-RT: Moloney murine leukemia virus reverse transcriptase, MMLV 역전사 효소); WPRE: Woodchuck hepatitis virus post-transcriptional regulatory element, 우드척 간염바이러스 전사후 조절요소).
도 12는 AAV-PE2와 mCherry형광을 대리표지마커로 사용하여 AAV-PE2 시스템의 전달 효율을 확인하기 위한 실험의 결과를 확인한 도로서, 형광을 상대적으로 낮은 배율로 확인한 결과(도 12A)로 스케일 바는 500 μm이며, 외족은 미처리된 대조군 rd12 마우스의 망막색소상피를 확인한 것이다. 형광을 높은 배율로 확인한 결과를 도 12B에 확인했고, 스케일 바는 10 μm이다. mCherry-양성 면적을 정량화한 분석 결과 (도 12C)에 나타냈으며, 모든 데이터는 평균 ± sd이고, 마우스 수 n = 4이며, 표시된 p-값은 student's t-검정을 기반으로 하였다.
도 13은 AAV-PE2 처리 rd12 마우스의 RPE에서 의도된 편집 및 의도하지 않은 편집의 빈도를 나타낸 도이다. PCR 증폭 및 시퀀싱으로부터 발생하는 오류들을 제외하기 위하여, 실험군의 상기 편집 빈도에서 대조군의 상기 편집 빈도 평균을 빼서 정규화하였다. 표적 뉴클레오티드 주위의 치환은 표적 지점을 중심으로 40bp 범위에서 평가하였다. 인델(indel)은 pegRNA 닉킹부위를 중심으로 60bp 범위에서 측정하였다. 빨간색 가로선은 정규화된 빈도가 0인 위치를 나타낸다. 데이터는 평균 ± s.d로 나타내었으며, 마우스의 수는 5마리로 하였다.
도 14는 PE2 처리된 rd12 마우스의 RPE에서 표적 서열 내 -20 bp에서 +20 bp 범위의 위치에서의 치환 빈도(substitution frequencies)를 나타낸 도이다. 치환 빈도는 PE2 로 처리되지 않은 rd12 마우스의 RPE의 프라임에디팅 빈도를 빼서 정규화하였다. 빨간색 가로선은 정규화된 빈도가 0인 위치를 나타낸다(로그 스케일 값을 표시하기 위해 y축의 모든 값에 0.5%가 추가된다). 위치는 pegRNA 닉킹 위치에서 번호가 매겨졌다. 표적 위치는 +2이다. 데이터는 평균 ± s.d로 나타내었으며, 마우스의 수는 5마리로 하였다.
도 15는 AAV-PE2 처리된 rd12 마우스의 망막색소상피에서의 의도된 편집 및 의도하지 않은 편집의 빈도를 확인한 결과를 도 15A에 나타내었다. PCR 증폭 및 시퀀싱으로부터 발생하는 오류들을 제외하기 위하여, 실험군의 상기 편집 빈도에서 대조군의 상기 편집 빈도 평균을 빼서 정규화하였다. 표적 뉴클레오티드 주위의 치환은 표적 지점을 중심으로 40bp 범위에서 평가하였다. 인델(indel)은 pegRNA 닉킹부위를 중심으로 60bp 범위에서 측정하였다. 빨간색 가로선은 정규화된 빈도가 0인 위치를 나타낸다. 데이터는 평균 ± s.d로 나타내었으며, 마우스의 수는 5마리로 하였다. 또한 AAV-PE2 처리된 rd12 마우스 망막색소상피에서의 표적 서열 내 표적 서열 내 -20 bp에서 +20 bp 범위의 위치에서의 치환 빈도(substitution frequencies)를 확인한 결과를 도 15B에 나타내었다. 치환 빈도는 PE2 로 처리되지 않은 rd12 마우스의 RPE의 프라임에디팅 빈도를 빼서 정규화하였다. 빨간색 가로선은 정규화된 빈도가 0인 위치를 나타낸다(. 위치는 pegRNA 닉킹 위치에서 번호가 매겨졌다. 표적 위치는 +2이다. 데이터는 평균 ± s.d로 나타내었으며, 마우스의 수는 5마리로 하였다.
도 16은 pegRNA ID 157을 포함한 AAV-PE2에 의한 망막전위도검사를 수행한 결과로 야생형(C57BL/6), 주사되지 않은 대조군(rd12) 및 PE2 발현 AAV(rd12-AAV-PE2)가 주입된 rd12 마우스의 0dB에서의 암적응 ERG 반응의 대표적인 파형을 나타낸 도이다. 스케일 바, 30ms(x축) 및 50μV(y축)
도 17은 pegRNA ID 157을 포함한 AAV-PE2에 의한 망막전위도검사를 수행한 결과로 C57BL/6 및 rd12 마우스의 ERG 반응의 a-파(왼쪽) 및 b-파(오른쪽)의 진폭을 확인한 도이다. 데이터는 평균 ± sd이다. 마우스 수는 n = 5이다. 사후 Tukey 다중 비교 테스트를 사용한 일원 분산 분석의 P-값을 표시했다.
도 18은 Optomotor 반응검사의 결과를 나타낸 도이다. 데이터는 평균 ± sd이며, 마우스 수는 n = 5이다. 사후 Tukey의 다중 비교 테스트를 사용한 일원 분산 분석의 P-값을 표시했다.
이하 일 양상을 실시예 및 실험예를 통하여 보다 상세하게 설명한다. 그러나 이들 실시예 및 실험예는 일 양상을 예시적으로 설명하기 위한 것으로 일 양상의 범위가 이들 실시예 및 실험예에 한정되는 것은 아니며, 일 양상의 실시예 및 실험예는 당업계에서 평균적인 지식을 가진 자에게 일 양상을 보다 완전하게 설명하기 위해서 제공되는 것이다.
실험방법
1. 트랜스-스플라이싱 AAV 벡터의 제조
트랜스-스플라이싱(trans-splicing) PE2 플라스미드를 제조하기 위해, PE2 N 말단(PE2-N term)(Addgene #132775) 및 스플라이싱 도너(splicing donor: SD)(Addgene#112734) 코딩 서열을 하기 [표 3]에 기재한 프라이머를 사용하여 PCR 증폭시키고 NEBuilder HiFi DNA assembly kit(NEB)를 사용하여 px601 플라스미드에 클로닝하였다.
목적 서열 (5'-3') 서열번호
TS-PE2-N cloning 정방향 GCAGAGCTCTCTGGCTAACTACCGGTGCCACCATGAAACGGACAG 5
역방향 GTAAGTATCAAGGTTACAAGACAG 6
CTGTCTTGTAACCTTGATACTTACGTACTTGGCGGTAGCCTT 7
CATCACTAGGGGTTCCTGCG 8
TS-PE2-C-WPRE cloning 정방향 TCACTAGGGGTTCCTGCGGCCTCTAGACTTGTCGAGACAGAGAAGAC 9
CTTTGCCTTTCTCTCCACAGTTCTTCTACAGCAACATCATGAAC 10
AATCAACCTCTGGATTACAAAAT 11
TTTGGGCCGCCTCCCCGCCTGTGCCTTCTAGTTGCCAG 12
역방향 CTGTGGAGAGAAAGGCAAAG 13
ATTTTGTAATCCAGAGGTTGATTTGGTGATGATGACCGGTTAGAC 14
GCGGGGAGGCGGCCCAAA 15
CTCCATCACTAGGGGTTCCTGCGGCCGCCCATAGAGCCCACCGCAT 16
유사하게, 스플라이싱 어셉터(splicing acceptor: SA)(Addgene#112876), PE2 C 말단 코딩 서열(PE2-C term)(Addgene #132775) 및 WPRE 서열(Addgene #52962)을 PCR 증폭시키고 NEBuilder HiFi DNA assembly kit를 사용하여 pX601 플라스미드에 클로닝하였다.U6-pegRNA-H1-nick sgRNA-mCherry를 제조하기 위하여, pegRNA 코딩 서열, sgRNA 코딩 서열 및 H1 프로모터 서열(Addgene#61089)을 합성 또는 PCR 증폭시키고 NEBuilder HiFi DNA assembly kit를 사용하여 px552-U6-CAG-mCherry 플라스미드에 클로닝하였다. 그런 다음, VectorBuilder Inc(Chicago, Illinois, USA)를 통해 상기 AAV 벡터로부터 생체 내(in vivo) 연구에 필요한 high-grade 아데노-연관 바이러스(Adeno-Associated Virus: AAV) 벡터(혈청형 8)를 수득하였다.
Rd12 마우스 관련 실험에는 TS-PE2-N 플라스미드, TS-PE2-C-WPRE 플라스미드 또는 U6-Rpe65 pegRNA-CAG-mCherry 플라스미드는 AAV2-캡시드 플라스미드 및 헬퍼 플라스미드를 HEK 293T 세포에 공동 형질감염시켰다. 3일 후, 세포를 용해시키고, 그런 다음 iodixanol(Optiprep, Sigma; D1556) 구배 초정제를 통해 고급 AAV를 수득하였다. 마지막으로 Centricon tube(Vivaspin 20, Sartorius)를 사용하여 고급 AAV를 얻기 위해 인산염 완충 식염수에 바이러스를 농축하였다.
2. 트랜스-스플라이싱 AAV 벡터의 전달
마우스 눈 관련 연구는 서울대학교 및 서울대학교병원 동물실험윤리위원회의 승인을 받아 수행하였다. C57BL/6 마우스(Central Laboratory Animal)를 12시간 명암주기(dark/light cycle)로 조절하고, AAV 주사 전 틸레타민(tiletamine)/졸라제팜(zolazepam)(Zoletil 50, Virbac; 30 mg/kg) 및 자일라진(xylazine)(Rompun, Bayer; 10 mg/kg)을 사용하여 마취를 유도하였다. 다음으로, PBS에서 AAV8-TS-PE2-N term 4.9 x 1010vg, AAV8-TS-PE2-C term 4.9 x 1010 vg 및 2.4 x 1010 AAV8-Atp7b pegRNA-sgRNA을 혼합한 총 1.5μl를 마우스 유리체강내(vitreous cavity)로 주사하였다.
3. 딥 시퀀싱(Deep sequencing)
DNeasy Blood & Tissue kit(Qiagen)를 사용하여 마우스 조직(망막, 망막색소상피(Retinal Pigment Epithelium: RPE))으로부터 게놈 DNA를 추출하였다. 표적 서열들은 2X Taq PCR Smart mix(SolGent)를 사용하여 PCR 증폭하였다. 실험에 사용한 PCR 프라이머들은 상기 표 3에 나타내었다.
내인성 부위(endogenous sites)에서 프라임에디팅 효율을 평가하기 위해, 마우스 망막과 망막색소상피 시료에 대한 DNA 주형 500ng을 포함하는 반응액 부피(reaction volume) 50μL에서 표적 서열의 첫번째 PCR 증폭을 수행하였다. Illumina 바코드 서열을 부착시키기 위한 두번째 PCR은 첫번째 PCR로부터 수득한 정제 산물 50ng을 사용하여 반응액 부피 30μL에서 수행하였다. 생성된 앰플리콘들은 겔 정제 후 MiniSeq(Illumina, San Diego, CA)를 사용하여 시퀀싱하였다. 한편, 딥 시퀀싱에 사용된 데이터는 accession No. SRR12778000 하에 NCBI Sequence Read Archive에서 제공된다.
4. 망막전위검사(Electroretinography)
ERG 이전에는 마우스를 밤새 어두운 곳에 두었다. 심부 마취를 유도하고 페닐에프린 염산염(5 mg ml-1)과 트로피카미드(5 mg ml-1)를 함유한 Tropherin 안과 용액을 국소 투여하여 동공을 확장시켰다. 전체 필드 ERG에는 범용 테스트 및 전기 생리학 시스템 2000(UTAS E-2000, LKC)이 사용되었다. 0dB 크세논 플래시에 대한 빛 유도 응답은 60Hz에서 노치 필터를 사용하여 2k gain으로 기록되었다. 반응을 0.1에서 1,500Hz 사이에서 대역통과 필터링하였다. Prism 8(GraphPad)을 사용하여 그래프를 그리고 진폭을 추정하였다. a-파 진폭은 기준선에서 가장 낮은 음으로 가는 전압까지 측정하여 결정되었고 b-파 진폭은 a-파 골에서 양의 b-파의 가장 높은 피크까지 측정되었다.
5. 광운동 반응(Optomotor response)
가상 현실 광운동 시스템(OptoMotry HD, CerebralMechanics)을 시스템에 대한 제조업체의 지침 및 원본 간행물에 따라 격자 시력 시각적 임계값을 측정하였다. 마우스는 인클로저를 둘러싼 모니터에서 가상 회전 실린더의 보기에 노출되는 플랫폼에 배치되었다. 그런 다음 마우스의 머리 움직임으로 격자를 추적하였다. 시각적 임계값은 마우스가 회전 자극에 반응하지 않는 최대 공간 주파수(주기/도)를 생성하기 위해 계단 절차로 결정되었다.
6. 프라임에디팅의 효율 분석
내인성 부위에서 프라임에디팅 빈도를 정량화하기 위하여, Cas-analyzer를 사용하여 앰플리콘 서열들을 참조 서열에 정렬하였다. 치환(substitutions) 및 인델(indel)을 포함하는 의도된, 의도되지 않은 편집 빈도를 (편집된 리드 수/총 리드 수)의 비율로 계산하였다. PCR 증폭 및 시퀀싱으로부터 발생하는 오류들을 제외하기 위하여, 실험군의 상기 편집 빈도에서 대조군의 상기 편집 빈도 평균을 빼서 정규화하였다.
실험결과
실시예 1. 트랜스-스플라이싱 AAV 벡터의 제조
트랜스-스플라이싱 아데노-연관 바이러스(trans-splicing Adeno-Associated Virus:tsAAV) 벡터(혈청형 8)를 사용하여 프라임에디터 도입용 벡터를 제조하였다(도 1). 편집하고자 하는 유전자로는 망막 세포의 생존 또는 기능에 영향을 미치지 않을 것으로 예상되는 Atp7b 유전자를 선택하였다.
Atp7b 유전자의 엑손 8에서 G에서 A로의 치환(G>A)을 유도하는 4개의 pegRNA를 설계하고, neuro2A(N2A) 세포에서 가장 높은 활성을 나타낸 pegRNA를 선택하였다(도 2). 구체적으로, 프라이머 결합 부위와 RT 주형의 길이는 서로 다르되, 동일한 표적 서열을 갖도록 하여 6개의 pegRNA(PBS13nt-RT16nt, PBS13nt-RT15nt, PBS13nt-RT14nt, PBS13nt-RT13nt, PBS11nt-RT14nt 및 PBS11nt-RT13nt)를 설계하였다. 그 결과, 프라이머 결합 부위가 13nt이고 RT 주형 길이가 13nt인 PBS13nt-RT13nt를 포함하는 pegRNA(서열번호 3)의 생체 내 프라임에디터 전달 효율이 가장 높음을 확인하고, 이를 선택하여 실험에 사용하였다(도 3).
sgRNA는 pegRNA의 DNA 결합 부위로부터 다운스트림(downstream) 100bp 서열 내에서 설계 가능한 모든 sgRNA에 대하여 DeepSpCas9(Kim HK et al. (2019) Sci Adv 5, eaax9249.)을 이용하여 Atp7b 유전자에 대한 편집 활성을 분석하였다. 그 중, pegRNA가 결합하는 DNA 가닥에 상보적인 가닥에 결합하는 sgRNA만이 PE3 시스템에 적용이 가능하므로 그것들만 따로 분류하였다(표 4). 그 결과, 하기 표 4에 나타낸 바와 같이 guide sequence(ID 2)를 포함하고, 절단 부위가 +55인 sgRNA(서열번호 4)의 편집 활성이 가장 높음을 확인하고, 이를 선택하여 실험에 사용하였다.
ID 서열(5'-3') DeepSpCas9
score
서열번호
1 Input
sequence
AAGCCTACAAATCGCTGAGACACAGGTCCG 22.433 17
Target
sequence
CGGACCTGTGTCTCAGCGATTTGTAGGCTT 18
Guidesequence CCTGTGTCTCAGCGATTTGT 19
2 Input
sequence
GGTCCGCCAACATGGACGTACTCATCGTGC 60.005 20
Target
sequence
GCACGATGAGTACGTCCATGTTGGCGGACC 21
Guidesequence GATGAGTACGTCCATGTTGG 22
3 Input
sequence
CCGCCAACATGGACGTACTCATCGTGCTCG 55.018 23
Target
sequence
CGAGCACGATGAGTACGTCCATGTTGGCGG 24
Guidesequence CACGATGAGTACGTCCATGT 25
(상기 표에서, Atp7b 유전자의 엑손 8 상에서 각 sgRNA에 의해 유도된 절단 위치는 다음과 같다. 절단 위치(sgRNA-induced nicking position)는 pegRNA-유도된 절단 부위를 기준으로 다음과 같다: ID 1, +31; ID 2, +55; ID 3, +58) Atp7b 를 표적으로 하는 pegRNA 및 sgRNA를 암호화하는 AAV 벡터와 함께, 다음 2개의 tsAAV 벡터를 제조하여 이후 실험에서 사용하였다: (i) PE2의 N-말단 절반을 암호화하는 제 1 tsAAV 벡터, (ii) PE2의 C-말단 절반을 암호화하는 제2 tsAAV 벡터.
실시예 2. 딥 시퀀싱을 통한 유전체 편집 빈도 분석
상기 실시예 1에서 제조한 벡터들을 마우스 망막색소상피(retinal pigment epithelium: RPE) 및 망막(retina)에 유리체강내(intravitreal) 주사하였다. 6주 후, 마우스들을 안락사시키고 망막색소상피 및 망막을 수득하여 딥 시퀀싱 분석을 수행하였다.
그 결과, 평균 편집 효율은 망막색소상피 및 망막에서 각각 1.82%, 1.87%로 나타났으며, 표적 뉴클레오티드 주변에서 인델(indel) 또는 의도하지 않은 치환은 관찰되지 않음을 확인하였다(도 4 내지 7).
상기 결과를 통해, AAV-매개된 PE3 운반은 망막색소상피 및 망막에서 정교한 유전체 편집을 유도할 수 있음을 확인하였다. 또한, 선행 연구(Jo DH et al. (2019) Science Advances. Vol. 5, no. 10, eaax1210.)에 따르면 인간의 유전적 안구 질환 마우스 모델에서 단지 1.17%의 유전체 편집 빈도만으로도 현저한 망막 기능의 향상을 달성할 수 있음을 고려할 때, 상기 결과는 일 양상에 따른 조성물이 유전체 편집 분야에서 다양한 유전병 치료 용도로 유용하게 사용될 수 있음을 의미한다.
실시예 3. 유전성 안질환 모델에서 트랜스-스플라이싱 AAV-프라임에디터를 통한 유전자 편집능의 확인
3.1 유전성 안질환 모델에서 생체 내 프라임에디팅을 위한 pegRNA 서열 선별
다른 유전성 안질환 모델에서도 상기 실시예에서 확인한 프라임에디팅이 가능한지 확인하기 위하여 레베르선천성흑내장(Leber congenital amaurosis :LCA) 질환 모델에서 실험을 수행하였다. 편집하고자 하는 유전자는 시각주기에 필수적인 11-cis 레티날을 생산하는 아이소머히드롤라아제(isomerohydrolase)를 인코딩하는 대표적인 유전자인 RPE65 이다. 도 8에 나타난 바와 같이, RPE65 유전자 (p.R44X)의 엑손 3의 130번째 위치에 C가 T로 치환되어 발생한 넌센스 돌연변이를 갖는 rd12 안질환 마우스 모델로 실험을 진행하였다.
상기 넌센스 돌연변이를 프라임에디팅하기 위한 효율적인 pegRNA 서열을 찾아내기 위하여, 돌연변이 부위에서 -52bp ~ +59bp 범위의 위치에 존재하는 NGN PAM을 갖는 표적 서열을 확인한 결과를 도 9A에 나타내었다. 결과에 나타낸 10개의 표적 서열 중 6개는 NGG PAM을 갖고 4개는 NGH PAM을 가진다. 10개의 표적 서열에 대해 5~6개의 다른 길이(7, 9, 11, 13, 15 또는 17 nt)의 PBS와 9~17개의 다른 길이(6~62 nt)의 RT 템플릿을 포함하는 총 561개의 pegRNA를 설계하여 올리고 라이브러리를 구성하였으며, 상기 설계된 올리고 라이브러리의 모식도를 도 9B에 나타내었다.
pegRNA의 효율성을 평가하기 위해 설계된 올리고 라이브러리 풀로부터 렌티바이러스 라이브러리를 제작하였고, HEK 293T 세포에 렌티바이러스 라이브러리를 형질도입하였다. 이후, 세포에 NG-PE2를 코딩하는 플라스미드를 형질주입하여 5일 후에 세포의 핵산을 추출하여 딥 시퀀싱을 수행하였다. 총 2번의 반복실험을 진행하였으며 이 결과를 도 10에 나타내었다. 도 10에서 pegRNA 후보군 중 가장 높은 평균 15%의 프라임에디팅 효율은 pegRNA ID 157 (서열번호 28)에서 나타났고 두번째로 높은 평균 14%의 프라임 에티딩 효율은 pegRNA ID 198 (서열번호 29)에서 나타났다. 상기 두개의 pegRNA는 같은 표적서열을 갖지만 pegRNA ID 157은 RT 템플릿 길이가 13nt이고, pegRNA ID 198은 14nt인 점에서 차이가 나타났으며, 이후 실시예에서 pegRNA ID 198과 pegRNA ID 157을 순차적으로 실험에 사용하였다. 또한 일반적으로 NGG PAM이 있는 표적 서열에서 SpCas9가 SpCas9-NG보다 더 높은 활성을 갖고 NGG PAM이 있는 표적에서 PE2가 NG-PE2보다 더 높은 활성을 갖기 때문에 이후 마우스 모델 실험에서 NG-PE2 대신 PE2를 사용하였다.
3.2 LCA 질환 마우스 모델에서 프라임에디팅의 유전자 교정 효율 확인
상기 선별된 pegRNA(pegRNA ID 198)를 통하여 실제적인 rd12 마우스에서 프라임에디팅을 통한 망막 질환의 치료효과를 확인하기 위한 실험을 수행하였다. 혈청형 2를 갖는 AAV 시스템을 사용하여 상기 실시예 1에서 사용한 PE2와 선택된 pegRNA를 발현시켰다. AAV-PE2 시스템을 3주령의 rd12 마우스의 망막하에 주사하였고 6주 후 마우스들을 안락사시키고 망막색소상피를 수득하여 딥 시퀀싱 분석을 수행하였다. AAV-PE2를 미처리한 Rd12 마우스의 망막색소상피를 대조군으로 사용하였다. 본 실험에서 사용한 PE2를 인코딩하는 AAV 벡터, 질환치료용 pegRNA 및 mCherry를 인코딩하는 AAV 벡터와 전반적인 실험과정을 모식화하여 도 11에 나타내었다.
주사 6주 후에 AAV-PE2 시스템의 생체 내 전달 효율을 확인하기 위하여 마우스의 망막색소상피에서 AAV-PE2의 대리표지 마커인 mCherry 형광을 확인하였고 상대적으로 낮은 배율로 확인한 결과를 도 12A에, 높은 배율로 확인한 결과를 도 12B에 나타내었으며 mCherry-양성 면적을 정량화한 분석결과를 도 12C에 나타내었다. 도 12A 및 12B에서 확인한 바와 같이, 대조군 대비 AAV-PE2 시스템을 투여한 경우 마우스의 망막색소상피에서 형광이 우수하게 발현하는 것으로 보아 상기 유전자 편집 시스템은 높은 효율로 타겟에 전달될 수 있음을 확인할 수 있었다. 도 12C에서 확인한 바와 같이, mCherry-양성 면적을 정량 분석한 결과 대조군 대비 AAV-PE2 시스템은 평균적으로 평균 23%(17% ~ 30%의 범위)의 전달 효율이 나타나는 것을 확인할 수 있었다.
또한 주사 6주 후에 마우스의 망막색소상피세포의 DNA를 분석하여 실제로 의도된 유전자 편집의 빈도와 의도되지 않은 유전자 편집의 빈도를 확인하였으며, 이 결과를 도 13 에 나타내었다. 도 13에서 확인한 바와 같이, 망막색소상피세포에서 분리한 DNA에 대한 딥 시퀀싱을 통해 표적 뉴클레오티드에 4.1% ~ 7.4% (평균 6.4%)의 프라임에디팅 효율이 나타나는 것을 확인하였다.
AAV-PE2가 처리된 마우스의 망막색소상피세포에서 표적 서열 내 -20bp 내지 +20bp 위치에서의 염기 치환빈도를 도 14에 나타내었다. 도 14에서 확인한 바와 같이, 표적 뉴클레오티드 주변에서 인델(indel) 또는 의도하지 않은 염기 치환은 관찰되지 않았다.
실험을 통해 확인한 망막색소상피세포에 대한 AAV-PE2의 전달효율이 23% 라는 점을 고려할 때, 마우스 질병 모델에 대한 프라임에디팅 효율은 약 28%인 것으로 계산할 수 있다. 또한 선행 연구(Jo DH et al. (2019) Science Advances. Vol. 5, no. 10, eaax1210.)를 통해 확인한 동일한 마우스 모델에서의 CRISPR 뉴클레아제 매개 HDR 방식으로 확인한 편집 효율은 17% ± 8%의 삽입결실 빈도가 나타나면서 1.2% ± 0.3%로 나타나는 것임을 확인하였을 때, 일 양상에 따른 유전자 편집 조성물은 유전자 편집 분야에서 다양한 유전병 치료 용도로 유용하게 사용할 수 있음을 다시 한번 확인할 수 있었다.
3.3 LCA 질환 마우스 모델에서 고효율의 pegRNA를 통한 실제적 유전자 교정 효과의 확인
상기 실시예 3.1에서 확인한 가장 유전자 편집 효율이 높은 pegRNA(pegRNA ID 157)를 사용하여 rd12 마우스에서의 프라임에디팅을 통한 망막 질환의 치료효과를 확인하기 위한 실험을 수행하였다. 실험 조건은 상기 실시예 3.2와 pegRNA 시퀀스를 제외하고 동일하게 하였다. AAV-PE2 주사 6주 후에 망막색소상피세포의 DNA에 대한 딥시퀀싱 실험을 수행하였고, 의도된 편집 및 의도하지 않은 편집의 빈도를 분석한 결과를 도 15A에 나타냈다. AAV-PE2 처리된 마우스의 망막색소상피세포에서 표적 서열 내 -20 bp에서 +20 bp 범위의 위치에서의 염기 치환 빈도(substitution frequencies)를 확인한 결과를 도 15B에 나타내었다.
도 15A에 나타낸 바와 같이, pegRNA ID 157번을 사용하면, 4.7% 내지 16% (평균 7.7%)의 프라임에디팅 효율을 보임을 확인하였다. 도 15B에 나타낸 바와 같이, 표적 뉴클레오티드 주변에서 인델(indel) 또는 의도하지 않은 염기 치환은 관찰되지 않음을 확인하였다.
pegRNA ID 157을 포함한 AAV-PE2에 의해 유발된 망막 기능 개선 수준을 확인하기 위하여 망막전위도검사(electroretinography :ERG) 및 Optomotor 반응 테스트를 수행하였다. 야생형(C57BL/6), 주사되지 않은 대조군(rd12) 및 PE2-발현 AAV(rd12-AAV-PE2)가 주입된 rd12 마우스를 나누어 실험을 수행하였다.
암-순응 ERG 반응의 대표적인 파형을 확인한 결과를 도 16에 나타내었고, ERG 반응의 a-파(왼쪽) 및 b-파(오른쪽)의 진폭을 확인한 결과를 도 17에 나타내었고, Optomotor 반응 테스트를 확인한 결과를 도 18에 나타내었다.
도 16에서 확인한 바와 같이, pegRNA ID 157가 포함된 PE2-발현 AAV(rd12-AAV-PE2)가 주입된 rd12 마우스에서만 암-순응 ERG 반응으로부터 구출할 수 있음을 확인하였다. 도 17에서 확인한 바와 같이, AAV-PE2로 처리된 rd12 마우스의 암순응 a-파 및 b-파 진폭은 각각 평균 34%(범위, 25%~49%) 및 36%(범위, 32%~41%)인 것을 확인하였고, C57BL/6 마우스와 대비한 경우 AAV-PE2처리 군은 유의할 정도의 진폭의 차이가 나타나는 것을 확인하였다. 도 18에서 확인한 바와 같이, 가상 회전 자극에 대한 공간 역치(spatial thresholds) 도 AAV-PE2 처리 rd12 마우스에서 증가하는 것을 확인하였다. 따라서, 이러한 결과를 통하여 AAV-PE2-매개의 프라임에디팅이 LCA 질환 마우스 모델의 유전자형 및 표현형을 정밀하게 교정할 수 있음을 확인하였다.
상기 결과를 통해, 트랜스-스플라이싱 AAV 벡터를 사용하면 운반 크기(cargo size)가 큰 프라임에디터를 세포에 전달하여 유전체를 매우 정교하게 편집할 수 있음을 확인하였다. 따라서, 일 양상에 따른 조성물은 표적 서열에 특이적으로 작용하며 높은 정확도로 유전체 교정이 가능하여, 유전체 편집 플랫폼으로 유용하게 사용될 수 있을 것으로 기대된다.
전술한 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다.
<110> Industry-Academic Cooperation Foundation, Yonsei University <120> A composition for prime editing comprising trans-splicing adeno-associated virus vector <130> PN141628KR <150> KR 10-2020-0160446 <151> 2020-11-25 <160> 29 <170> KoPatentIn 3.0 <210> 1 <211> 2091 <212> PRT <213> Artificial Sequence <220> <223> prime editor(nCas9-linker-RT) <400> 1 Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly 1 5 10 15 Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys 20 25 30 Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly 35 40 45 Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys 50 55 60 Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr 65 70 75 80 Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe 85 90 95 Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His 100 105 110 Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His 115 120 125 Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser 130 135 140 Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met 145 150 155 160 Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp 165 170 175 Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn 180 185 190 Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys 195 200 205 Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu 210 215 220 Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu 225 230 235 240 Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp 245 250 255 Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp 260 265 270 Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu 275 280 285 Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile 290 295 300 Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met 305 310 315 320 Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala 325 330 335 Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp 340 345 350 Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln 355 360 365 Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly 370 375 380 Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys 385 390 395 400 Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly 405 410 415 Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu 420 425 430 Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro 435 440 445 Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met 450 455 460 Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val 465 470 475 480 Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn 485 490 495 Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu 500 505 510 Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr 515 520 525 Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys 530 535 540 Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val 545 550 555 560 Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser 565 570 575 Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr 580 585 590 Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn 595 600 605 Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu 610 615 620 Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His 625 630 635 640 Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 645 650 655 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys 660 665 670 Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala 675 680 685 Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys 690 695 700 Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His 705 710 715 720 Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile 725 730 735 Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg 740 745 750 His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr 755 760 765 Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 770 775 780 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val 785 790 795 800 Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln 805 810 815 Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu 820 825 830 Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp 835 840 845 Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly 850 855 860 Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn 865 870 875 880 Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 885 890 895 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys 900 905 910 Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys 915 920 925 His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu 930 935 940 Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 945 950 955 960 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu 965 970 975 Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val 980 985 990 Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val 995 1000 1005 Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser 1010 1015 1020 Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn 1025 1030 1035 1040 Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile 1045 1050 1055 Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val 1060 1065 1070 Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met 1075 1080 1085 Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe 1090 1095 1100 Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala 1105 1110 1115 1120 Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro 1125 1130 1135 Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys 1140 1145 1150 Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met 1155 1160 1165 Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys 1170 1175 1180 Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr 1185 1190 1195 1200 Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala 1205 1210 1215 Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro 1235 1240 1245 Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr 1250 1255 1260 Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile 1265 1270 1275 1280 Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His 1285 1290 1295 Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe 1300 1305 1310 Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr 1315 1320 1325 Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala 1330 1335 1340 Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp 1345 1350 1355 1360 Leu Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 1365 1370 1375 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 1380 1385 1390 Gly Gly Ser Ser Gly Gly Ser Ser Thr Leu Asn Ile Glu Asp Glu Tyr 1395 1400 1405 Arg Leu His Glu Thr Ser Lys Glu Pro Asp Val Ser Leu Gly Ser Thr 1410 1415 1420 Trp Leu Ser Asp Phe Pro Gln Ala Trp Ala Glu Thr Gly Gly Met Gly 1425 1430 1435 1440 Leu Ala Val Arg Gln Ala Pro Leu Ile Ile Pro Leu Lys Ala Thr Ser 1445 1450 1455 Thr Pro Val Ser Ile Lys Gln Tyr Pro Met Ser Gln Glu Ala Arg Leu 1460 1465 1470 Gly Ile Lys Pro His Ile Gln Arg Leu Leu Asp Gln Gly Ile Leu Val 1475 1480 1485 Pro Cys Gln Ser Pro Trp Asn Thr Pro Leu Leu Pro Val Lys Lys Pro 1490 1495 1500 Gly Thr Asn Asp Tyr Arg Pro Val Gln Asp Leu Arg Glu Val Asn Lys 1505 1510 1515 1520 Arg Val Glu Asp Ile His Pro Thr Val Pro Asn Pro Tyr Asn Leu Leu 1525 1530 1535 Ser Gly Leu Pro Pro Ser His Gln Trp Tyr Thr Val Leu Asp Leu Lys 1540 1545 1550 Asp Ala Phe Phe Cys Leu Arg Leu His Pro Thr Ser Gln Pro Leu Phe 1555 1560 1565 Ala Phe Glu Trp Arg Asp Pro Glu Met Gly Ile Ser Gly Gln Leu Thr 1570 1575 1580 Trp Thr Arg Leu Pro Gln Gly Phe Lys Asn Ser Pro Thr Leu Phe Asn 1585 1590 1595 1600 Glu Ala Leu His Arg Asp Leu Ala Asp Phe Arg Ile Gln His Pro Asp 1605 1610 1615 Leu Ile Leu Leu Gln Tyr Val Asp Asp Leu Leu Leu Ala Ala Thr Ser 1620 1625 1630 Glu Leu Asp Cys Gln Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu Gly 1635 1640 1645 Asn Leu Gly Tyr Arg Ala Ser Ala Lys Lys Ala Gln Ile Cys Gln Lys 1650 1655 1660 Gln Val Lys Tyr Leu Gly Tyr Leu Leu Lys Glu Gly Gln Arg Trp Leu 1665 1670 1675 1680 Thr Glu Ala Arg Lys Glu Thr Val Met Gly Gln Pro Thr Pro Lys Thr 1685 1690 1695 Pro Arg Gln Leu Arg Glu Phe Leu Gly Lys Ala Gly Phe Cys Arg Leu 1700 1705 1710 Phe Ile Pro Gly Phe Ala Glu Met Ala Ala Pro Leu Tyr Pro Leu Thr 1715 1720 1725 Lys Pro Gly Thr Leu Phe Asn Trp Gly Pro Asp Gln Gln Lys Ala Tyr 1730 1735 1740 Gln Glu Ile Lys Gln Ala Leu Leu Thr Ala Pro Ala Leu Gly Leu Pro 1745 1750 1755 1760 Asp Leu Thr Lys Pro Phe Glu Leu Phe Val Asp Glu Lys Gln Gly Tyr 1765 1770 1775 Ala Lys Gly Val Leu Thr Gln Lys Leu Gly Pro Trp Arg Arg Pro Val 1780 1785 1790 Ala Tyr Leu Ser Lys Lys Leu Asp Pro Val Ala Ala Gly Trp Pro Pro 1795 1800 1805 Cys Leu Arg Met Val Ala Ala Ile Ala Val Leu Thr Lys Asp Ala Gly 1810 1815 1820 Lys Leu Thr Met Gly Gln Pro Leu Val Ile Leu Ala Pro His Ala Val 1825 1830 1835 1840 Glu Ala Leu Val Lys Gln Pro Pro Asp Arg Trp Leu Ser Asn Ala Arg 1845 1850 1855 Met Thr His Tyr Gln Ala Leu Leu Leu Asp Thr Asp Arg Val Gln Phe 1860 1865 1870 Gly Pro Val Val Ala Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro Glu 1875 1880 1885 Glu Gly Leu Gln His Asn Cys Leu Asp Ile Leu Ala Glu Ala His Gly 1890 1895 1900 Thr Arg Pro Asp Leu Thr Asp Gln Pro Leu Pro Asp Ala Asp His Thr 1905 1910 1915 1920 Trp Tyr Thr Asp Gly Ser Ser Leu Leu Gln Glu Gly Gln Arg Lys Ala 1925 1930 1935 Gly Ala Ala Val Thr Thr Glu Thr Glu Val Ile Trp Ala Lys Ala Leu 1940 1945 1950 Pro Ala Gly Thr Ser Ala Gln Arg Ala Glu Leu Ile Ala Leu Thr Gln 1955 1960 1965 Ala Leu Lys Met Ala Glu Gly Lys Lys Leu Asn Val Tyr Thr Asp Ser 1970 1975 1980 Arg Tyr Ala Phe Ala Thr Ala His Ile His Gly Glu Ile Tyr Arg Arg 1985 1990 1995 2000 Arg Gly Trp Leu Thr Ser Glu Gly Lys Glu Ile Lys Asn Lys Asp Glu 2005 2010 2015 Ile Leu Ala Leu Leu Lys Ala Leu Phe Leu Pro Lys Arg Leu Ser Ile 2020 2025 2030 Ile His Cys Pro Gly His Gln Lys Gly His Ser Ala Glu Ala Arg Gly 2035 2040 2045 Asn Arg Met Ala Asp Gln Ala Ala Arg Lys Ala Ala Ile Thr Glu Thr 2050 2055 2060 Pro Asp Thr Ser Thr Leu Leu Ile Glu Asn Ser Ser Pro Ser Gly Gly 2065 2070 2075 2080 Ser Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu 2085 2090 <210> 2 <211> 6273 <212> DNA <213> Artificial Sequence <220> <223> prime editor(nCas9-linker-RT) <400> 2 gacaagaagt acagcatcgg cctggacatc ggcaccaact ctgtgggctg ggccgtgatc 60 accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac 120 agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc 180 acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat 240 ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg 300 gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac 360 atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa 420 ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg 480 atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg 540 gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc 600 aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg 660 ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg 720 attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat 780 gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag 840 atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg 900 ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg 960 atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag 1020 cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc 1080 tacattgacg gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa 1140 aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag 1200 cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc 1260 attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag 1320 aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga 1380 ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg 1440 gtggacaagg gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac 1500 ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat 1560 aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc 1620 ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg 1680 aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc 1740 ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc 1800 aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg 1860 accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac 1920 ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg 1980 ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat 2040 ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc 2100 ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac 2160 gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg 2220 aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc 2280 gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg 2340 aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg 2400 gaaaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat 2460 atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggacgctatc 2520 gtgcctcaga gctttctgaa ggacgactcc atcgacaaca aggtgctgac cagaagcgac 2580 aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac 2640 tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc 2700 aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg 2760 gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact 2820 aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag 2880 ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac 2940 caccacgccc acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac 3000 cctaagctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg 3060 atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac 3120 atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaagcggcct 3180 ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc 3240 accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag 3300 acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc 3360 agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat 3420 tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa 3480 gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt 3540 ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac 3600 tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag 3660 aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac 3720 tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag 3780 cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc 3840 ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc 3900 atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct 3960 gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag 4020 gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac 4080 ctgtctcagc tgggaggtga ctctggagga tctagcggag gatcctctgg cagcgagaca 4140 ccaggaacaa gcgagtcagc aacaccagag agcagtggcg gcagcagcgg cggcagcagc 4200 accctaaata tagaagatga gtatcggcta catgagacct caaaagagcc agatgtttct 4260 ctagggtcca catggctgtc tgattttcct caggcctggg cggaaaccgg gggcatggga 4320 ctggcagttc gccaagctcc tctgatcata cctctgaaag caacctctac ccccgtgtcc 4380 ataaaacaat accccatgtc acaagaagcc agactgggga tcaagcccca catacagaga 4440 ctgttggacc agggaatact ggtaccctgc cagtccccct ggaacacgcc cctgctaccc 4500 gttaagaaac cagggactaa tgattatagg cctgtccagg atctgagaga agtcaacaag 4560 cgggtggaag acatccaccc caccgtgccc aacccttaca acctcttgag cgggctccca 4620 ccgtcccacc agtggtacac tgtgcttgat ttaaaggatg cctttttctg cctgagactc 4680 caccccacca gtcagcctct cttcgccttt gagtggagag atccagagat gggaatctca 4740 ggacaattga cctggaccag actcccacag ggtttcaaaa acagtcccac cctgtttaat 4800 gaggcactgc acagagacct agcagacttc cggatccagc acccagactt gatcctgcta 4860 cagtacgtgg atgacttact gctggccgcc acttctgagc tagactgcca acaaggtact 4920 cgggccctgt tacaaaccct agggaacctc gggtatcggg cctcggccaa gaaagcccaa 4980 atttgccaga aacaggtcaa gtatctgggg tatcttctaa aagagggtca gagatggctg 5040 actgaggcca gaaaagagac tgtgatgggg cagcctactc cgaagacccc tcgacaacta 5100 agggagttcc tagggaaggc aggcttctgt cgcctcttca tccctgggtt tgcagaaatg 5160 gcagcccccc tgtaccctct caccaaaccg gggactctgt ttaattgggg cccagaccaa 5220 caaaaggcct atcaagaaat caagcaagct cttctaactg ccccagccct ggggttgcca 5280 gatttgacta agccctttga actctttgtc gacgagaagc agggctacgc caaaggtgtc 5340 ctaacgcaaa aactgggacc ttggcgtcgg ccggtggcct acctgtccaa aaagctagac 5400 ccagtagcag ctgggtggcc cccttgccta cggatggtag cagccattgc cgtactgaca 5460 aaggatgcag gcaagctaac catgggacag ccactagtca ttctggcccc ccatgcagta 5520 gaggcactag tcaaacaacc ccccgaccgc tggctttcca acgcccggat gactcactat 5580 caggccttgc ttttggacac ggaccgggtc cagttcggac cggtggtagc cctgaacccg 5640 gctacgctgc tcccactgcc tgaggaaggg ctgcaacaca actgccttga tatcctggcc 5700 gaagcccacg gaacccgacc cgacctaacg gaccagccgc tcccagacgc cgaccacacc 5760 tggtacacgg atggaagcag tctcttacaa gagggacagc gtaaggcggg agctgcggtg 5820 accaccgaga ccgaggtaat ctgggctaaa gccctgccag ccgggacatc cgctcagcgg 5880 gctgaactga tagcactcac ccaggcccta aagatggcag aaggtaagaa gctaaatgtt 5940 tatactgata gccgttatgc ttttgctact gcccatatcc atggagaaat atacagaagg 6000 cgtgggtggc tcacatcaga aggcaaagag atcaaaaata aagacgagat cttggcccta 6060 ctaaaagccc tctttctgcc caaaagactt agcataatcc attgtccagg acatcaaaag 6120 ggacacagcg ccgaggctag aggcaaccgg atggctgacc aagcggcccg aaaggcagcc 6180 atcacagaga ctccagacac ctctaccctc ctcatagaaa attcatcacc ctctggcggc 6240 tcaaaaagaa ccgccgacgg cagcgaattc gag 6273 <210> 3 <211> 122 <212> DNA <213> Artificial Sequence <220> <223> pegRNA <400> 3 gtgcctttca gtttctgggt gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt gggaccgagt cggtccagta ccacccatcc agaaactgaa 120 ag 122 <210> 4 <211> 96 <212> DNA <213> Artificial Sequence <220> <223> sgRNA <400> 4 gatgagtacg tccatgttgg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgc 96 <210> 5 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> TS-PE2-N_F1 <400> 5 gcagagctct ctggctaact accggtgcca ccatgaaacg gacag 45 <210> 6 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> TS-PE2-N_F2 <400> 6 gtaagtatca aggttacaag acag 24 <210> 7 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> TS-PE2-N_R1 <400> 7 ctgtcttgta accttgatac ttacgtactt ggcggtagcc tt 42 <210> 8 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> TS-PE2-N_R2 <400> 8 catcactagg ggttcctgcg 20 <210> 9 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> TS-PE2-C-WPRE_F1 <400> 9 tcactagggg ttcctgcggc ctctagactt gtcgagacag agaagac 47 <210> 10 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> TS-PE2-C-WPRE_F2 <400> 10 ctttgccttt ctctccacag ttcttctaca gcaacatcat gaac 44 <210> 11 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> TS-PE2-C-WPRE_F3 <400> 11 aatcaacctc tggattacaa aat 23 <210> 12 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> TS-PE2-C-WPRE_F4 <400> 12 tttgggccgc ctccccgcct gtgccttcta gttgccag 38 <210> 13 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> TS-PE2-C-WPRE_R1 <400> 13 ctgtggagag aaaggcaaag 20 <210> 14 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> TS-PE2-C-WPRE_R2 <400> 14 attttgtaat ccagaggttg atttggtgat gatgaccggt tagac 45 <210> 15 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> TS-PE2-C-WPRE_R3 <400> 15 gcggggaggc ggcccaaa 18 <210> 16 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> TS-PE2-C-WPRE_R4 <400> 16 ctccatcact aggggttcct gcggccgccc atagagccca ccgcat 46 <210> 17 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> sgRNA1_input <400> 17 aagcctacaa atcgctgaga cacaggtccg 30 <210> 18 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> sgRNA1_target <400> 18 cggacctgtg tctcagcgat ttgtaggctt 30 <210> 19 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> sgRNA1_guide <400> 19 cctgtgtctc agcgatttgt 20 <210> 20 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> sgRNA2_input <400> 20 ggtccgccaa catggacgta ctcatcgtgc 30 <210> 21 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> sgRNA2_target <400> 21 gcacgatgag tacgtccatg ttggcggacc 30 <210> 22 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> sgRNA2_guide <400> 22 gatgagtacg tccatgttgg 20 <210> 23 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> sgRNA3_input <400> 23 ccgccaacat ggacgtactc atcgtgctcg 30 <210> 24 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> sgRNA3_target <400> 24 cgagcacgat gagtacgtcc atgttggcgg 30 <210> 25 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> sgRNA3_guide <400> 25 cacgatgagt acgtccatgt 20 <210> 26 <211> 4122 <212> DNA <213> Artificial Sequence <220> <223> TS-PE2-N <400> 26 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct gcggcctcta gactcgaggc gttgacattg attattgact agttattaat 180 agtaatcaat tacggggtca ttagttcata gcccatatat ggagttccgc gttacataac 240 ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa 300 tgacgtatgt tcccatagta acgccaatag ggactttcca ttgacgtcaa tgggtggagt 360 atttacggta aactgcccac ttggcagtac atcaagtgta tcatatgcca agtacgcccc 420 ctattgacgt caatgacggt aaatggcccg cctggcatta tgcccagtac atgaccttat 480 gggactttcc tacttggcag tacatctacg tattagtcat cgctattacc atggtgatgc 540 ggttttggca gtacatcaat gggcgtggat agcggtttga ctcacgggga tttccaagtc 600 tccaccccat tgacgtcaat gggagtttgt tttggcacca aaatcaacgg gactttccaa 660 aatgtcgtaa caactccgcc ccattgacgc aaatgggcgg taggcgtgta cggtgggagg 720 tctatataag cagagctctc tggctaacta ccggtgccac catgaaacgg acagccgacg 780 gaagcgagtt cgagtcacca aagaagaagc ggaaagtcga caagaagtac agcatcggcc 840 tggacatcgg caccaactct gtgggctggg ccgtgatcac cgacgagtac aaggtgccca 900 gcaagaaatt caaggtgctg ggcaacaccg accggcacag catcaagaag aacctgatcg 960 gagccctgct gttcgacagc ggcgaaacag ccgaggccac ccggctgaag agaaccgcca 1020 gaagaagata caccagacgg aagaaccgga tctgctatct gcaagagatc ttcagcaacg 1080 agatggccaa ggtggacgac agcttcttcc acagactgga agagtccttc ctggtggaag 1140 aggataagaa gcacgagcgg caccccatct tcggcaacat cgtggacgag gtggcctacc 1200 acgagaagta ccccaccatc taccacctga gaaagaaact ggtggacagc accgacaagg 1260 ccgacctgcg gctgatctat ctggccctgg cccacatgat caagttccgg ggccacttcc 1320 tgatcgaggg cgacctgaac cccgacaaca gcgacgtgga caagctgttc atccagctgg 1380 tgcagaccta caaccagctg ttcgaggaaa accccatcaa cgccagcggc gtggacgcca 1440 aggccatcct gtctgccaga ctgagcaaga gcagacggct ggaaaatctg atcgcccagc 1500 tgcccggcga gaagaagaat ggcctgttcg gaaacctgat tgccctgagc ctgggcctga 1560 cccccaactt caagagcaac ttcgacctgg ccgaggatgc caaactgcag ctgagcaagg 1620 acacctacga cgacgacctg gacaacctgc tggcccagat cggcgaccag tacgccgacc 1680 tgtttctggc cgccaagaac ctgtccgacg ccatcctgct gagcgacatc ctgagagtga 1740 acaccgagat caccaaggcc cccctgagcg cctctatgat caagagatac gacgagcacc 1800 accaggacct gaccctgctg aaagctctcg tgcggcagca gctgcctgag aagtacaaag 1860 agattttctt cgaccagagc aagaacggct acgccggcta cattgacggc ggagccagcc 1920 aggaagagtt ctacaagttc atcaagccca tcctggaaaa gatggacggc accgaggaac 1980 tgctcgtgaa gctgaacaga gaggacctgc tgcggaagca gcggaccttc gacaacggca 2040 gcatccccca ccagatccac ctgggagagc tgcacgccat tctgcggcgg caggaagatt 2100 tttacccatt cctgaaggac aaccgggaaa agatcgagaa gatcctgacc ttccgcatcc 2160 cctactacgt gggccctctg gccaggggaa acagcagatt cgcctggatg accagaaaga 2220 gcgaggaaac catcaccccc tggaacttcg aggaagtggt ggacaagggc gcttccgccc 2280 agagcttcat cgagcggatg accaacttcg ataagaacct gcccaacgag aaggtgctgc 2340 ccaagcacag cctgctgtac gagtacttca ccgtgtataa cgagctgacc aaagtgaaat 2400 acgtgaccga gggaatgaga aagcccgcct tcctgagcgg cgagcagaaa aaggccatcg 2460 tggacctgct gttcaagacc aaccggaaag tgaccgtgaa gcagctgaaa gaggactact 2520 tcaagaaaat cgagtgcttc gactccgtgg aaatctccgg cgtggaagat cggttcaacg 2580 cctccctggg cacataccac gatctgctga aaattatcaa ggacaaggac ttcctggaca 2640 atgaggaaaa cgaggacatt ctggaagata tcgtgctgac cctgacactg tttgaggaca 2700 gagagatgat cgaggaacgg ctgaaaacct atgcccacct gttcgacgac aaagtgatga 2760 agcagctgaa gcggcggaga tacaccggct ggggcaggct gagccggaag ctgatcaacg 2820 gcatccggga caagcagtcc ggcaagacaa tcctggattt cctgaagtcc gacggcttcg 2880 ccaacagaaa cttcatgcag ctgatccacg acgacagcct gacctttaaa gaggacatcc 2940 agaaagccca ggtgtccggc cagggcgata gcctgcacga gcacattgcc aatctggccg 3000 gcagccccgc cattaagaag ggcatcctgc agacagtgaa ggtggtggac gagctcgtga 3060 aagtgatggg ccggcacaag cccgagaaca tcgtgatcga aatggccaga gagaaccaga 3120 ccacccagaa gggacagaag aacagccgcg agagaatgaa gcggatcgaa gagggcatca 3180 aagagctggg cagccagatc ctgaaagaac accccgtgga aaacacccag ctgcagaacg 3240 agaagctgta cctgtactac ctgcagaatg ggcgggatat gtacgtggac caggaactgg 3300 acatcaaccg gctgtccgac tacgatgtgg acgctatcgt gcctcagagc tttctgaagg 3360 acgactccat cgacaacaag gtgctgacca gaagcgacaa gaaccggggc aagagcgaca 3420 acgtgccctc cgaagaggtc gtgaagaaga tgaagaacta ctggcggcag ctgctgaacg 3480 ccaagctgat tacccagaga aagttcgaca atctgaccaa ggccgagaga ggcggcctga 3540 gcgaactgga taaggccggc ttcatcaaga gacagctggt ggaaacccgg cagatcacaa 3600 agcacgtggc acagatcctg gactcccgga tgaacactaa gtacgacgag aatgacaagc 3660 tgatccggga agtgaaagtg atcaccctga agtccaagct ggtgtccgat ttccggaagg 3720 atttccagtt ttacaaagtg cgcgagatca acaactacca ccacgcccac gacgcctacc 3780 tgaacgccgt cgtgggaacc gccctgatca aaaagtaccc taagctggaa agcgagttcg 3840 tgtacggcga ctacaaggtg tacgacgtgc ggaagatgat cgccaagagc gagcaggaaa 3900 tcggcaaggc taccgccaag tacgtaagta tcaaggttac aagacaggtt taaggagacc 3960 aatagaaact ggggcggccg caggaacccc tagtgatgga gttggccact ccctctctgc 4020 gcgctcgctc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc 4080 gggcggcctc agtgagcgag cgagcgcgca gctgcctgca gg 4122 <210> 27 <211> 4396 <212> DNA <213> Artificial Sequence <220> <223> TS-PE2-C-WPRE <400> 27 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct gcggcctcta gacttgtcga gacagagaag actcttgcgt ttctgatagg 180 cacctattgg tcttactgac atccactttg cctttctctc cacagttctt ctacagcaac 240 atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaagcggcct 300 ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc 360 accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag 420 acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc 480 agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat 540 tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa 600 gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt 660 ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac 720 tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag 780 aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac 840 tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag 900 cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc 960 ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc 1020 atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct 1080 gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag 1140 gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac 1200 ctgtctcagc tgggaggtga ctctggagga tctagcggag gatcctctgg cagcgagaca 1260 ccaggaacaa gcgagtcagc aacaccagag agcagtggcg gcagcagcgg cggcagcagc 1320 accctaaata tagaagatga gtatcggcta catgagacct caaaagagcc agatgtttct 1380 ctagggtcca catggctgtc tgattttcct caggcctggg cggaaaccgg gggcatggga 1440 ctggcagttc gccaagctcc tctgatcata cctctgaaag caacctctac ccccgtgtcc 1500 ataaaacaat accccatgtc acaagaagcc agactgggga tcaagcccca catacagaga 1560 ctgttggacc agggaatact ggtaccctgc cagtccccct ggaacacgcc cctgctaccc 1620 gttaagaaac cagggactaa tgattatagg cctgtccagg atctgagaga agtcaacaag 1680 cgggtggaag acatccaccc caccgtgccc aacccttaca acctcttgag cgggctccca 1740 ccgtcccacc agtggtacac tgtgcttgat ttaaaggatg cctttttctg cctgagactc 1800 caccccacca gtcagcctct cttcgccttt gagtggagag atccagagat gggaatctca 1860 ggacaattga cctggaccag actcccacag ggtttcaaaa acagtcccac cctgtttaat 1920 gaggcactgc acagagacct agcagacttc cggatccagc acccagactt gatcctgcta 1980 cagtacgtgg atgacttact gctggccgcc acttctgagc tagactgcca acaaggtact 2040 cgggccctgt tacaaaccct agggaacctc gggtatcggg cctcggccaa gaaagcccaa 2100 atttgccaga aacaggtcaa gtatctgggg tatcttctaa aagagggtca gagatggctg 2160 actgaggcca gaaaagagac tgtgatgggg cagcctactc cgaagacccc tcgacaacta 2220 agggagttcc tagggaaggc aggcttctgt cgcctcttca tccctgggtt tgcagaaatg 2280 gcagcccccc tgtaccctct caccaaaccg gggactctgt ttaattgggg cccagaccaa 2340 caaaaggcct atcaagaaat caagcaagct cttctaactg ccccagccct ggggttgcca 2400 gatttgacta agccctttga actctttgtc gacgagaagc agggctacgc caaaggtgtc 2460 ctaacgcaaa aactgggacc ttggcgtcgg ccggtggcct acctgtccaa aaagctagac 2520 ccagtagcag ctgggtggcc cccttgccta cggatggtag cagccattgc cgtactgaca 2580 aaggatgcag gcaagctaac catgggacag ccactagtca ttctggcccc ccatgcagta 2640 gaggcactag tcaaacaacc ccccgaccgc tggctttcca acgcccggat gactcactat 2700 caggccttgc ttttggacac ggaccgggtc cagttcggac cggtggtagc cctgaacccg 2760 gctacgctgc tcccactgcc tgaggaaggg ctgcaacaca actgccttga tatcctggcc 2820 gaagcccacg gaacccgacc cgacctaacg gaccagccgc tcccagacgc cgaccacacc 2880 tggtacacgg atggaagcag tctcttacaa gagggacagc gtaaggcggg agctgcggtg 2940 accaccgaga ccgaggtaat ctgggctaaa gccctgccag ccgggacatc cgctcagcgg 3000 gctgaactga tagcactcac ccaggcccta aagatggcag aaggtaagaa gctaaatgtt 3060 tatactgata gccgttatgc ttttgctact gcccatatcc atggagaaat atacagaagg 3120 cgtgggtggc tcacatcaga aggcaaagag atcaaaaata aagacgagat cttggcccta 3180 ctaaaagccc tctttctgcc caaaagactt agcataatcc attgtccagg acatcaaaag 3240 ggacacagcg ccgaggctag aggcaaccgg atggctgacc aagcggcccg aaaggcagcc 3300 atcacagaga ctccagacac ctctaccctc ctcatagaaa attcatcacc ctctggcggc 3360 tcaaaaagaa ccgccgacgg cagcgaattc gagcccaaga agaagaggaa agtctaaccg 3420 gtcatcatca ccaaatcaac ctctggatta caaaatttgt gaaagattga ctggtattct 3480 taactatgtt gctcctttta cgctatgtgg atacgctgct ttaatgcctt tgtatcatgc 3540 tattgcttcc cgtatggctt tcattttctc ctccttgtat aaatcctggt tgctgtctct 3600 ttatgaggag ttgtggcccg ttgtcaggca acgtggcgtg gtgtgcactg tgtttgctga 3660 cgcaaccccc actggttggg gcattgccac cacctgtcag ctcctttccg ggactttcgc 3720 tttccccctc cctattgcca cggcggaact catcgccgcc tgccttgccc gctgctggac 3780 aggggctcgg ctgttgggca ctgacaattc cgtggtgttg tcggggaaat catcgtcctt 3840 tccttggctg ctcgcctgtg ttgccacctg gattctgcgc gggacgtcct tctgctacgt 3900 cccttcggcc ctcaatccag cggaccttcc ttcccgcggc ctgctgccgg ctctgcggcc 3960 tcttccgcgt cttcgccttc gccctcagac gagtcggatc tccctttggg ccgcctcccc 4020 gcctgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac 4080 cctggaaggt gccactccca ctgtcctttc ctaataaaat gagaaaattg catcgcattg 4140 tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga 4200 ttgggaagac aatagcaggc atgctgggga tgcggtgggc tctatgggcg gccgcaggaa 4260 cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac tgaggccggg 4320 cgaccaaagg tcgcccgacg cccgggcttt gcccgggcgg cctcagtgag cgagcgagcg 4380 cgcagctgcc tgcagg 4396 <210> 28 <211> 118 <212> DNA <213> Artificial Sequence <220> <223> pegRNA 157 <400> 28 ggagccctgg cccacatcag gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgcag tctcctccga tgtgggcc 118 <210> 29 <211> 119 <212> DNA <213> Artificial Sequence <220> <223> pegRNA 198 <400> 29 ggagccctgg cccacatcag gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgcggca gtctcctccg atgtgggcc 119

Claims (19)

  1. N-말단 닉카아제 Cas9을 암호화하는 핵산 서열을 포함하는 프라임에디터 단백질의 제 1단편을 발현하는 재조합 벡터;
    C-말단 닉카아제 Cas9에 융합된 역전사효소를 암호화하는 핵산 서열을 포함하는 프라임에디터 단백질의 제 2단편을 발현하는 재조합 벡터; 및
    프라임에디팅 가이드 RNA(pegRNA) 서열을 포함하는 재조합 벡터를 포함하는 유전체 편집용 조성물로서,
    상기 프라임에디터 단백질은 닉카아제 Cas9 단백질의 C-말단에 역전사 효소가 융합된 형태인 것인 유전체 편집용 조성물.
  2. 청구항 1에 있어서,
    상기 제1 단편을 암호화하는 핵산 서열은 C-말단에 스플라이싱 도너(splicing donor: SD)가 연결된 것이고,
    상기 제2 단편을 암호화하는 핵산 서열은 N-말단에 스플라이싱 어셉터(splicing acceptor: SA)가 연결된 것인, 조성물.
  3. 청구항 1에 있어서,
    상기 프라임에디터 단백질의 제1 단편은 서열번호 1의 1번째 아미노산 잔기부터 1035번째 아미노산 잔기까지의 아미노산 서열로 이루어진 단백질 단편을 포함하고,
    상기 프라임에디터 단백질의 제2 단편은 서열번호 1의 1036번째 아미노산 잔기부터 1368번째 아미노산 잔기까지의 아미노산 서열로 이루어진 단백질 단편을 포함하고, C-말단에 역전사효소(reverse transcriptase)가 융합된 것인, 조성물.
  4. 청구항 1에 있어서,
    상기 재조합 벡터는 아데노-연관 바이러스 벡터로서 혈청형 8 또는 혈청형 2 유래인 것인, 조성물.
  5. 청구항 1에 있어서,
    상기 프라임에디터 단백질은 닉카아제 Cas9 단백질의 C-말단과 역전사 효소 사이에 링커를 더 포함하는 것인, 조성물.
  6. 청구항 1에 있어서,
    상기 프라임에디터 단백질은 핵 국재화 서열(nuclear localization sequence: NLS)을 더 포함하는 것인, 조성물.
  7. 청구항 1에 있어서,
    상기 프라임에디팅 가이드 RNA(pegRNA) 서열을 포함하는 재조합 벡터는 단일가닥 가이드 RNA(sgRNA) 서열을 더 포함하는 것인, 조성물.
  8. 청구항 1 내지 7 중 어느 한 항에 있어서,
    상기 조성물은 진핵 세포 또는 진핵 유기체의 유전체 편집에 사용하기 위한 것인, 조성물.
  9. 청구항 1 내지 7 중 어느 한 항의 조성물을 포함하는 유전체 편집용 키트.
  10. N-말단 닉카아제 Cas9을 암호화하는 핵산 서열을 포함하는 프라임에디터 단백질의 제 1단편을 발현하는 재조합 벡터;
    C-말단 닉카아제 Cas9에 융합된 역전사효소를 암호화하는 핵산 서열을 포함하는 프라임에디터 단백질의 제 2단편을 발현하는 재조합 벡터; 및
    프라임에디팅 가이드 RNA(pegRNA) 서열을 포함하는 재조합 벡터를 각각 분리된 진핵 세포 또는 인간을 제외한 진핵 유기체에 도입하는 단계를 포함하고,
    상기 프라임에디터 단백질은 닉카아제 Cas9 단백질의 C-말단에 역전사 효소가 융합된 형태인 것인 유전체를 편집하는 방법.
  11. 청구항 10에 있어서,
    상기 제1 단편을 암호화하는 핵산 서열은 C-말단에 스플라이싱 도너(splicing donor: SD)가 연결된 것이고,
    상기 제2 단편을 암호화하는 핵산 서열은 N-말단에 스플라이싱 어셉터(splicing acceptor: SA)가 연결된 것인, 방법.
  12. 청구항 10에 있어서,
    상기 프라임에디터 단백질의 제1 단편은 서열번호 1의 1번째 아미노산 잔기부터 1035번째 아미노산 잔기까지의 아미노산 서열로 이루어진 단백질 단편을 포함하고,
    상기 프라임에디터 단백질의 제2 단편은 서열번호 1의 1036번째 아미노산 잔기부터 1368번째 아미노산 잔기까지의 아미노산 서열로 이루어진 단백질 단편을 포함하고, C-말단에 역전사효소(reverse transcriptase)가 융합된 것인, 방법.
  13. 청구항 10에 있어서,
    상기 프라임에디터 단백질의 제1 단편 및 제2 단편은 세포 내에서 각각 발현 및 융합하여 프라임에디터 단백질을 형성하는 것인, 방법.
  14. 청구항 10에 있어서,
    상기 프라임에디터 단백질은 서열번호 1의 아미노산 서열로 표시되는 것인, 방법.
  15. 청구항 10에 있어서,
    상기 프라임에디터 단백질은 핵 국재화 서열(nuclear localization sequence: NLS)을 더 포함하는 것인, 방법.
  16. 청구항 10에 있어서,
    상기 프라임에디팅 가이드 RNA(pegRNA) 서열을 포함하는 재조합 벡터는 단일가닥 가이드 RNA(sgRNA) 서열을 더 포함하는 것인, 방법.
  17. 청구항 10에 있어서,
    상기 재조합 벡터의 도입은 국소 주입법, 미세주사법(microinjection), 전기천공법(electroporation) 및 리포펙션(lipofection) 방법으로 이루어진 군으로부터 선택되는 어느 하나에 의해 수행되는 것인, 방법.
  18. 청구항 10에 있어서,
    상기 유전체를 편집하는 방법은 프라임에디팅에 의해 수행되는 것인, 방법.
  19. N-말단 닉카아제 Cas9을 암호화하는 핵산 서열을 포함하는 프라임에디터 단백질의 제 1단편을 발현하는 재조합 벡터;
    C-말단 닉카아제 Cas9에 융합된 역전사효소를 암호화하는 핵산 서열을 포함하는 프라임에디터 단백질의 제 2단편을 발현하는 재조합 벡터; 및
    프라임에디팅 가이드 RNA(pegRNA) 서열을 포함하는 재조합 벡터를 포함하는 망막질환 예방 및 치료용 약학적 조성물 조성물로서,
    상기 프라임에디터 단백질은 닉카아제 Cas9 단백질의 C-말단에 역전사 효소가 융합된 형태인 것인 망막질환 예방 및 치료용 약학적 조성물.

KR1020210157739A 2020-11-25 2021-11-16 트랜스-스플라이싱 아데노-연관 바이러스 벡터를 포함하는 프라임에디팅용 조성물 KR20220072758A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/KR2021/017534 WO2022114815A1 (ko) 2020-11-25 2021-11-25 트랜스-스플라이싱 아데노-연관 바이러스 벡터를 포함하는 프라임에디팅용 조성물

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20200160446 2020-11-25
KR1020200160446 2020-11-25

Publications (1)

Publication Number Publication Date
KR20220072758A true KR20220072758A (ko) 2022-06-02

Family

ID=81985112

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210157739A KR20220072758A (ko) 2020-11-25 2021-11-16 트랜스-스플라이싱 아데노-연관 바이러스 벡터를 포함하는 프라임에디팅용 조성물

Country Status (1)

Country Link
KR (1) KR20220072758A (ko)

Similar Documents

Publication Publication Date Title
US10704061B2 (en) Lentiviral vectors
KR20210056329A (ko) 신규 cas12b 효소 및 시스템
CN114457044A (zh) 武装有异源基因的溶瘤腺病毒
CN110944674A (zh) 高活性调控元件
EP0795015A1 (en) Plasmids suitable for il-2 expression
CN107723276A (zh) 一种稳定高表达目标产物的细胞株的构建方法和试剂盒
KR102370150B1 (ko) 전사 조절 인자 및 이의 외래 단백질 발현 증강에 있어서의 응용
CN102329784A (zh) 一种日本乙型脑炎病毒样颗粒及其制备方法和应用
CN115029360A (zh) 用于治疗粘多糖贮积症iiia型的转基因表达盒
KR20230093437A (ko) 안구 적응증을 위한 벡터화된 항-TNF-α 항체
CN109402071A (zh) 一种表达h9n2亚型禽流感病毒h9蛋白的重组火鸡疱疹病毒
CN109970861B (zh) 一种靶向线粒体的nd4融合蛋白及其制备方法和应用
CN110885819B (zh) 基于aav病毒的基因编辑表达盒
CN114685685B (zh) 编辑rna的融合蛋白及其应用
KR20220072758A (ko) 트랜스-스플라이싱 아데노-연관 바이러스 벡터를 포함하는 프라임에디팅용 조성물
CN114196639B (zh) 表达3型鸭甲型肝炎病毒p1和3c基因的重组鸭瘟病毒及其构建方法和用途
KR20220140620A (ko) 강화된 발현 시스템 및 그 사용방법
CN113462700B (zh) SARS-CoV-2线性DNA疫苗
WO2022114815A1 (ko) 트랜스-스플라이싱 아데노-연관 바이러스 벡터를 포함하는 프라임에디팅용 조성물
US20240082327A1 (en) Retroviral vectors
CN115029380B (zh) 一种新型冠状病毒SARS-CoV-2复制子及其细胞模型、构建方法和应用
CN116916937A (zh) 用于人类基因疗法的elovl2构建体
AU2020440834A1 (en) Expression vector of human nuclear factor E2-related factor 2 and application of expression vector
WO2024062259A1 (en) Retroviral vector comprising rre inserted within an intron
KR20230154015A (ko) 레트로바이러스 벡터

Legal Events

Date Code Title Description
E902 Notification of reason for refusal