KR20230035362A - 개선된 rna 편집 방법 - Google Patents

개선된 rna 편집 방법 Download PDF

Info

Publication number
KR20230035362A
KR20230035362A KR1020237004198A KR20237004198A KR20230035362A KR 20230035362 A KR20230035362 A KR 20230035362A KR 1020237004198 A KR1020237004198 A KR 1020237004198A KR 20237004198 A KR20237004198 A KR 20237004198A KR 20230035362 A KR20230035362 A KR 20230035362A
Authority
KR
South Korea
Prior art keywords
rna
target
arrna
base
residue
Prior art date
Application number
KR1020237004198A
Other languages
English (en)
Inventor
펭페이 유안
제수안 이
넹인 리우
Original Assignee
에디진 테라퓨틱스 (베이징) 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에디진 테라퓨틱스 (베이징) 인크. filed Critical 에디진 테라퓨틱스 (베이징) 인크.
Publication of KR20230035362A publication Critical patent/KR20230035362A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04004Adenosine deaminase (3.5.4.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04005Cytidine deaminase (3.5.4.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/11Antisense
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16041Use of virus, viral particle or viral elements as a vector
    • C12N2740/16043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Virology (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

숙주세포의 표적 잔기 위치에 표적 RNA를 편집하는 방법을 제공한다. 이 방법은 ADAR-리크루팅 RNA(arRNA) 또는 arRNA를 인코팅하는 컨스트럭트를 숙주세포 내로 도입하는 단계, 여기에서 arRNA는 표적 RNA에 혼성화하는 상보적 RNA 시퀀스를 포함하고; 표적 잔기는 표적 RNA에서 표적 잔기의 5' 최근접 이웃 잔기(업스트림 잔기), 표적 잔기, 및 표적 RNA에서 표적 잔지의 3' 최근접 이웃 잔기(다운스트림 잔기)를 포함하는 3-염기 모티프에 위치하며, 여기에서 3-염기 모티프는 UAG가 아니고 상보적 RNA 시퀀스는 표적 RNA에서 업스트림 잔기 또는 다운스트림 잔기에 정반대되는 불일치를 포함한다. 추가로 상기 방법을 위한 arRNA, 상기 방법에 의해 얻어진 RNA, RNA를 포함하는 숙주세포, 및 질환의 치료에서 방법의 용도가 제공된다.

Description

개선된 RNA 편집 방법
본 출원은 유전자 편집 분야, 특히 RNA 편집 분야에 속하며, 숙주세포의 표적 잔기 위치에 표적 RNA를 편집하기 위해 탈아미노효소-리크루팅 RNA(dRNA, arRNA라고도 함) 또는 arRNA를 숙주세포 내로 인코딩하는 컨스트럭트를 도입하는 것을 포함한다.
CRISPR 기술
최근에, CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats, WO2014018423A3)가 주도하는 게놈 편집 기술은 빠르게 발전하고 있으며, 생물학 및 의학 분야에 엄청난 영향을 미치고 있다. 많은 과학 연구자 및 생명공학 회사도 이 기술을 임상에 적용하기 위해 노력하고 있다. 2019년 9월에, 베이징대학교 덩홍쿠이(Deng Hongkui) 교수와 그의 공동 연구자들은 후천면역결핍 증후군(Aids)과 백혈병을 치료하기 위해 CRISPR로 줄기세포를 편집하고 편집된 줄기세포를 환자에게 다시 주입하는 임상 테스트 결과를 처음 보고한 논문을 발표하여, 유전자 치료 방향에 대한 CRISPR의 전환에 큰 기여를 했다.
CRISPR의 큰 잠재적 적용 가능성에도 불구하고, 과학 연구 단계에서 임상 치료 적용으로의 전환을 어렵게 하는 일련의 결함도 가지고 있다. 문제 중 하나는 CRISPR에 사용되는 핵심 작용 효소인 Cas9이다. CRISPR 기반 DNA 편집은 외인성으로 발현되는 Cas9 또는 유사한 기능을 가진 다른 뉴클레아제의 도입을 필요로 하며, 이는 다음과 같은 문제를 야기한다. 첫째로, 외인성으로 발현되어야 하는 뉴클레아제는 일반적으로 상대적으로 큰 분자량을 가지며, 이는 바이러스 벡터를 통해 체내로 전달되는 효율을 급격히 감소시킨다. 둘째로, Cas9의 발현은 다수의 연구에서 잠재적인 암 위험인 것으로 나타났다. p53은 가장 광범위하게 연구된 종양 억제 유전자이며, Haapaniemi 외의 연구에서 Cas9 시스템이 p53 유도된 DNA 손상을 활성화할 수 있음이 발혀졌으며(Haapaniemi et al., 2018), 또한 Enache 외의 연구에서 Cas9 단백질의 과발현이 p53 불활성화 돌연변이가 있는 세포를 선택적으로 풍부하게 할 수 있음을 발견했다(Enache et al., 2020). 또한, Adikusuma는 Cas9 편집된 마우스 접합체에서 많은 수의 대규모 DNA 결실이 있음을 발견했으며(Adikusuma et al., 2018), Cullot 외에는 Cas9 편집된 게놈이 수백만 개의 염기를 포함하는 큰 단편 결실을 가질 것이고, 더 중요한 것은 이러한 결실된 단편이 5개의 원발암 유전자와 7개의 종양 억제 유전자를 포함한다는 것이다(Cullot et al., 2019). 최종적으로, 외인성으로 발현되는 Cas9는 일반적으로 황색포도상구균(Staphylococcus aureus) 및 화농성연쇄상구균(Streptococcus pyogenes)과 같은 박테리아로부터 유래되지만, 인간이나 포유류에서는 자연적으로 발생하지 않으므로, 환자의 체내에서 면역 반응을 유도할 수 있는 것이 가능하다. Charlesworth 외의 연구에서는 Cas9에 대한 IgG 항체가 인간 혈청에 존재한다는 것이 밝혀졌다(Charlesworth et al., 2019). 한편, 항체는 외인성으로 발현된 뉴클레아제를 중화시켜 뉴클레아제를 불활성화시킬 수 있으며, 다른 한편으로 뉴클레아제는 환자에게 손상 또는 심지어 독성을 유발하거나 추가적인 개입 치료를 방해할 수 있다.
RNA 수준에서 A-to-I 편집
DNA 편집에서 잠재적 위험을 피하기 위해서, 과학자들은 RNA 편집에 대한 연구도 수행한다. DNA에서 유전 정보는 RNA로 전사되고, 나아가 단백질로 번역되어 정상적인 생리 기능을 발휘해야 할 필요가 있는데, 이를 유기체의 센트럴 도그마라고 한다. DNA 수준의 편집과 비교하여, RNA 수준의 편집은 게놈 손상을 방지할 뿐만 아니라, 최종적인 생물학적 기능을 변경할 수 있다. 일반적인 RNA 편집은 RNA(ADAR) 매개된 아데노신(A)에서 이노신(I)(구아노신)으로의 편집에 작용하는 아데노신 탈아미노효소이다. 2007년, 매사추세츠 공과대학교 장펑(Zhang Feng) 교수 연구팀은 프로그램가능한 A-to-I 치환을 위한 RNA 편집(REPAGE)이라는 RNA 편집 편집 기술을 보고하였고, 이는 외인성으로 발현된 Cas13-ADAR 융합 단백질 및 단일 가이드 RNA(sgRNA)를 통해 표적 RNA의 A-to-I 편집을 실현하였다(Cox et al., 2017). 이 방법에서, Cas13은 sgRNA에 결합하여 융합 단백질을 편집할 위치로 가이드하도록 표적화 기능을 발휘하며, 한편 ADAR의 탈아미노화 도메인은 촉매 기능을 발휘하여 A-to-I 편집을 실현한다. 그러나 CRISPR과 유사하게, 이 방법도 외인성 단백질의 발현을 필요로 한다. 외인성 단백질의 발현으로 인한 문제는 해결될 수 없다.
상기 문제점을 해결하고 핵산 편집 기술을 의료 분야에 보다 잘 적용하기 위해서, 새로운 핵산 편집 기술, 특히 외인성 단백질의 발현으로부터 독립된 새로운 기술의 개발이 시급하다. 2019년 7월에, 베이징대학교 생명과학대학 웨이원성(Wei Wensheng) 교수 연구팀은 Nature Biotechnology에 "Programmable RNA Editing by Recruiting Endogenous ADAR Using Engineered RNAs"라는 제목의 논문을 발표했으며, 이는 새로운 핵산 편집 기술을 처음 보고했다: RNA의 프로그래밍 가능한 편집을 위한 내인성 ADAR(LEAPER)(Qu et al., 2019)(WO2020074001A1). CRISPR(WO2014018423A3) 및 REPAIR(WO2019005884A1)와 달리, 이 기술은 원칙적으로 외인성 뉴클레아제의 과발현 의존성을 없애고 의료 분야로의 전환에 더 많은 이점을 가진다. 그러나, 이 기술은 아데노신(A)에서 이노신(I)으로의 편집, 즉 아데노신(A)에서 구아노신(G)으로의 편집만 실현할 수 있으므로, 그 적용은 여전히 제한적이다. CRISPR과 유사하게, 이 기술도 편집될 위치에 내인성 뉴클레아제를 리크루팅하기 위한 가이드 역할을 하는 RNA의 단편을 필요로 한다. 가이드 RNA의 단편은 ADAR-리크루팅한 RNA(arRNA)로 명명된다.
2019년 1월에, Thorsten Stafforst의 연구팀은 LEAPER와 유사한 핵산 편집 기술을 보고했고, 이는 올리고뉴클레오티드 매개된 RNA 편집을 위한 특정 전사에 대한 내인성 ADAR 리크루팅으로 명명되었다(RESTORE, WO2020001793A1). LEAPER와 유사하게, RESTORE도 외인성 단백질에 대한 의존성을 없앨 수 있다. 그러나 LEAPER와 달리, 첫째로 RESTORE는 자가면역의 발달과 중증도를 결정하는 핵심 요인인 IFN-γ의 존재 하에서만 효율적인 편집을 실현할 수 있으며(Pollard et al., 2013), 의료 분야에서 이 기술의 적용에 큰 영향을 미친다. 둘째로, RESTORE는 안정성을 보장하기 위해 인위적으로 수많은 화학적 변형을 도입하는 데 필요한 화학적으로 합성된 올리고뉴클레오티드여야 하는 가이드 RNA의 단편도 필요하다. 이러한 화학적 변형 중에, 일부 변형은 잠재적인 독성 또는 면역원성을 가질 수 있으며, 일부는 동일한 염기 시퀀스가 있는 RNA가 수십 개의 상이한 형태 조합을 가질 수 있도록 동일한 기본 쇄의 상이한 형태로 이어질 수도 있다. 대조적으로, LEAPER는 화학적으로 합성된 RNA를 통해 편집을 실현할 수 있을 뿐만 아니라, 이를 벡터(아데노 관련 바이러스(AAV) 및 렌티바이러스 등)를 통해 환자의 세포로 전달하여 기능할 수 있으므로 전달 수단이 유연하다.
A-to-I 편집 위치에 인접한 업스트림 및 다운스트림 잔여물 또는 시퀀스
DNA 편집에서, 편집된 위치는 복제에 의해 모든 딸세포에 전달될 것이다. DNA 수준에서의 편집 효율은 상대적으로 낮지만, 편집된 세포는 딸세포를 스크리닝하거나 다른 방법으로 강화할 수도 있다. DNA 편집과는 달리, RNA 편집에서는 얻어진 편집된 RNA가 유전되지 않는다. 따라서, 한편으로는 RNA 편집에서 비표적 사이트는 자손에게 유전될 수 없으므로 RNA 수준에서의 편집이 DNA 편집보다 더 안전하고, 다른 한편으로는 RNA 편집 효율이 더 중요하다. A-to-I의 RNA 편집에서, REPAIR(WO2019005884A1), RESTORE(WO2020001793A1) 또는 LEAPER(WO2020074001A1) 시스템은 촉매 반응에서 핵심 효소 역할을 하는 ADAR을 필요로 한다. 포유류 세포에는 세 가지 유형의 ADAR 단백질이 있다: ADAR1(p110 및 p150), ADAR2 및 ADAR3(촉매 활성이 없는). ADAR 단백질의 촉매 기질은 이중가닥 RNA이며, ADAR 단백질은 아데노신(A) 핵염기에서 -NH2기를 제거하여 세포의 후속 생리학적 과정, 예를 들면 역전사 및 번역 과정 또는 세포에서 바이러스 RNA의 복제 과정에서 A를 구아노신(G)으로 인식되고 시티딘(C)과 페어링되는 이노신(I)으로 전환할 수 있다. ADAR의 특정 속성으로 인해, 몇 가지 유사한 요소가 RNA 편집을 위한 REPAIR, RESTORE 및 LEAPER 편집 시스템의 효율에 영향을 미친다. 요인 중 하나는 편집될 위치에 인접한 업스트림 및 다운스트림 잔기 및 시퀀스가다. mRNA에서 편집될 아데노신(A)(표적 A)(즉, 본원에서 표적 잔기)에 인접한 각각 5'-업스트림 및 3'-다운스트림 염기는 분명히 편집 효율에 영향을 미칠 것이다. 설명의 편의상, 표적 잔기에 인접한 5'-업스트림 염기(업스트림 잔기), 표적 잔기, 및 표적 잔기에 인접한 3'-다운스트림 염기(다운스트림 잔기)를 5'-말단에서 3'-말단의 순서로 연결하여 형성된 모티프를 "3-염기 모티프"라고 한다. 표적 A에 인접한 업스트림 잔기 또는 다운스트림 잔기는 A, U, C 또는 G일 수 있으므로, 16개의 3-염기 모티프가 있다: AAA, AAU, AAC, AAG, UAA, UAU, UAC, UAG, CAA, CAU, CAC, CAG, GAA, GAU, GAC 및 GAG. 상이한 3-염기 모티프에 대한 REPAIR, RESTORE 또는 LEAPER 시스템의 편집 효율은 상이하며, 상이한 3-염기 모티프에 대한 상이한 편집 효율의 이러한 상황을 본원에서는 "3-연속 염기 선호도"라고 한다.
REPAIR 시스템에서는 Cas13-ADAR 융합 단백질이 채택되기 때문에, 이 시스템은 약간 상이한 3-연속 염기 선호도를 나타낸다. 도 1(Cox et al, 2017)에 나타낸 바와 같이, GAC의 3-염기 모티프에 대한 REPAIR 시스템의 편집 효율이 가장 낮고 UAU에 대한 편집 효율이 가장 높으며, 편집 효율의 차이는 약 2~3배이다.
RESTORE 시스템에서, 논문의 저자들은 3-염기 모티프에 대한 선호도에 대한 데이터를 직접적으로 나타내지 않고, 다른 논문(Vogel et al., 2018)을 인용하였으며, RESTORE 시스템의 선호도가 이 시스템의 선호도(Merkle et al., 2019)와 일치할 수 있다고 언급되어 있다. 도 2(Vogel et al., 2018)에 나타낸 바와 같이, 이 도면의 삼각형은 SA1Q를 나타내며, 구체적인 구현 방법은: 인간 ADAR1의 촉매 도메인은 인간 O6-알킬구아닌-DNA-알킬 전이효소(hAGT)의 C-말단 도메인(SNAP-tag)과 융합되며, 835 아미노산 위치에 글루탐산을 글루타민(E-Q)으로 돌연변이시키고, SNAP-tag를 통해 가이드 RNA와 공유적으로 가교결합시킨다(Keppler, A. et al., 2003, Stafforst, T.,et al., 2012). 이 도면의 사각형은 SA2Q를 나타내며, 구체적인 구현 방법은: 인간 ADAR2의 촉매 도메인은 인간 O6-알킬구아닌-DNA-알킬 전이효소(hAGT)의 C-말단 도메인(SNAP-tag)과 융합되며, 1310 아미노산 위치에 글루탐산을 글루타민(E-Q)으로 돌연변이시키고, SNAP-tag를 통해 가이드 RNA와 공유적으로 가교결합시킨다(Keppler, A. et al., 2003; Stafforst, T., et al. , 2012). ADAR의 상이한 두 가지 유형의 선호도는 분명한 차이가 있는 유사한 추세를 나타내는 것을 알 수 있다. 5'-업스트림 잔기가 G인 경우, 즉 GAA, GAU, GAC 또는 GAG의 3-염기 모티프에 대한 편집 효율은 일반적으로 다른 3-염기 모티프에 대한 편집 효율보다 훨씬 낮고, 심지어 편집되지 않은 수준에 가깝고, UAG는 편집 효율이 가장 높은 3-염기 모티프 중 하나이다. 도 2에 나타낸 바와 같이, UAG에 대한 이 시스템의 편집 효율은 G의 업스트림 잔기를 갖는 3-염기 모티프에 대해 이 시스템의 편집 효율보다 최대 10배가 될 수 있다.
LEAPER 시스템에서, 논문의 저자들은 이 시스템의 3-연속 염기 선호도를 직접 테스트했다(Qu et al., 2019). 도 3에 나타낸 바와 같이, LEAPER 시스템에서는 RESTORE 시스템과 동일한 완전하고 수정이나 변경되지 않은 ADAR을 채택하고 있으므로, RESTORE 시스템과 유사한 3-연속 염기 선호도를 나타내는 것을 이해하는 것은 어렵지 않다. 도 3에서, GAA, GAU, GAC 및 GAG의 3-염기 모티프에 대한 LEAPER 시스템의 편집 효율이 가장 낮고, 심지어 0에 가깝다는 것을 알 수 있으며, UAG의 3-염기 모티프에 대한 편집 효율은 가장 높으며, 유사하게 UAG에 대한 LEAPER 시스템의 편집 효율도 G의 업스트림 잔기를 갖는 3-염기 모티프에 대한 LEAPER 시스템보다 최대 10배 이상일 수 있다. 결론적으로, REPAIR 시스템에서 외인성으로 과발현된 Cas13-ADAR이 채택되므로, REPAIR 시스템은 3-연속 염기 선호도가 약간 상이하다. 그러나, LEAPER 시스템 및 RESTORE 시스템은 수정이나 변경되지 않은 ADAR을 채택하므로, 두 시스템은 유사한 3-연속 염기 선호도를 나타낸다. 모든 3-염기 모티프 중에서, 수정이나 변경되지 않은 ADAR을 편집에 사용하는 경우, UAG의 편집 효율은 가장 높거나, 또는 UAG가 가장 높은 편집 효율을 갖는 3-염기 모티프 중 하나이다. 5'-업스트림 잔기가 G인 경우, 편집 효율은 명백히 감소하고 심지어 0에 가깝고, UAG에 대한 편집 효율은 G의 5'-업스트림 잔기가 있는 3-염기 모티프에 대항 편집 효율보다 10배 이상일 수 있다. 이는 선행기술의 내인성 ADAR 기반 RNA 편집 시스템이 G의 5'-업스트림 잔기를 갖는 3-염기 모티프에서 위치를 거의 편집할 수 없음을 나타낸다.
종래 기술에서 탈아미노효소에 의한 RNA 편집을 수행하는 기술 시스템의 3-연속 염기 선호도는 기존 RNA 편집 기술의 적용 범위를 제한한다. 예를 들면, 기존의 RNA 편집 기술은 G의 업스트림 잔기를 갖는 3-염기 모티프에서 위치를 거의 편집할 수 없으며, 이는 질환 치료에 이러한 시스템을 적용하는 데 큰 영향을 미친다. 공지된 RNA 편집 수단에 의해 G의 업스트림 잔기를 갖는 돌연변이 위치를 갖는 병원성 유전자에 의해 야기되는 유전병은 교정 및 치료하기 어렵다. 그러나, 본 출원에 의해 해결하고자 하는 과제는 선행기술에서 선호하는 3-염기 모티프 이외의 3-염기 모티프(예를 들면, UAG 이외의 3-염기 모티프)와 관련하여, G 또는 C의 업스트림 잔기를 갖는 3-염기 모티프에 대한 편집 효율을 크게 향상시키도록, 표적 RNA에 탈아미노효소를 리크루팅하기 위해 탈아미노효소-리크루팅 RNA(dRNA 또는 arRNA) 시퀀스를 조정하여 정확한 편집을 실현함으로써 기존 탈아미노효소를 수정이나 변경하지 않고 3-연속 염기 선호도의 한계를 돌파할 수 있다.
따라서, 일 양태에 있어서, 본 출원은 ADAR-리크루팅 RNA(arRNA) 또는 arRNA를 인코딩하는 컨스트럭트를 숙주세포 내로 도입하는 단계를 포함하는, 숙주세포의 표적 잔기 위치에 표적 RNA를 편집하기 위한 방법을 제공하며, 여기에서 arRNA는 표적 RNA에 혼성화하는 상보적 RNA 시퀀스를 포함하고, 표적 잔기는 표적 RNA에서 표적 잔기의 5' 최근접 이웃 잔기(업스트림 잔기), 표적 잔기, 및 표적 RNA에서 표적 잔기의 3' 최근접 이웃 잔기(다운스트림 잔기)를 포함하는 3-염기 모티프에 위치하고, 여기에서 3-염기 모티프는 UAG가 아니며, 상보적 RNA 시퀀스는 표적 RNA에서 업스트림 잔기 또는 다운스트림 잔기에 정반대되는 불일치를 포함한다.
일부 실시형태에 있어서, 본 출원은 숙주세포의 표적 잔기 위치에 표적 RNA를 편집하는 방법을 제공하며, 이는 ADAR-리크루팅 RNA(arRNA) 또는 arRNA를 인코딩하는 컨스트럭트를 숙주세포 내로 도입하는 것을 포함하며, 여기에서 arRNA는 표적 RNA에 혼성화하는 상보적 RNA 시퀀스를 포함하고, 표적 잔기는 표적 RNA에서 표적 잔기의 5' 최근접 이웃 잔기(업스트림 잔기), 표적 잔기, 및 표적 RNA에서 표적 잔기의 3' 최근접 이웃 잔기(다운스트림 잔기)를 포함하는 3-염기 모티프에 위치하고; 여기에서 3-염기 모티프는 UAG가 아니며, 상보적 RNA 시퀀스는 표적 RNA에서 업스트림 잔기 및 다운스트림 잔기에 정반대되는 불일치를 포함한다.
특정 실시형태에 있어서, 3-염기 모티프에서 업스트림 잔기는 G이다. 특정 실시형태에 있어서, 3-염기 모티프에서 업스트림 잔기는 A이다. 특정 실시형태에 있어서, 3-염기 모티프에서 업스트림 잔기는 C이다. 실시형태에 있어서, 3-염기 모티프에서 다운스트림 잔기는 C이다. 특정 실시형태에 있어서, 3-염기 모티프에서 다운스트림 잔기는 U이다. 특정 실시형태에 있어서, 3-염기 모티프에서 다운스트림 잔기는 A이다. 특정 실시형태에 있어서, 3-염기 모티프는: GAG, GAC, GAA, GAU, AAG, AAC, AAA, AAU, CAG, CAC, CAA, CAU, UAA, UAC 및 UAU로 이루어지는 군으로부터 선택된다.
본 출원의 방법에 따르면, 일부 실시형태에 있어서, 3-염기 모티프에서 업스트림 잔기가 G인 경우, 상보적 RNA에서 업스트림 잔기에 반대되는 염기는 G이다. 일부 실시형태에 있어서, 3-염기 모티프에서 업스트림 잔기는 G이고, 상보적 RNA에서 업스트림 잔기에 반대되는 염기는 A이다. 일부 실시형태에 있어서, 3-염기 모티프는 GAU이고, 상보적 RNA 시퀀스에 포함되는 3-연속 상보적 염기(3-염기 모티프에 정반대)는 ACG 또는 ACA이다. 일부 실시형태에 있어서, 3-염기 모티프는 GAU이고, 상보적 RNA 시퀀스에 포함되는 3-연속 상보적 염기(3-염기 모티프에 정반대)는 ACG이다. 일부 실시형태에 있어서, 3-염기 모티프는 GAA이고, 상보적 RNA 시퀀스에 포함되는 3-연속 상보적 염기(3-염기 모티프에 정반대)는 UCA, CCG, CCC 또는 UCC이다. 특정 실시형태에 있어서, 3-염기 모티프는 GAA이고, 상보적 RNA 시퀀스에 포함되는 3-연속 상보적 염기(3-염기 모티프에 정반대)는 UCA이다. 일부 실시형태에 있어서, 3-염기 모티프는 GAC이고, 상보적 RNA 시퀀스에 포함되는 3-연속 상보적 염기(3-염기 모티프에 정반대)는 GCG 또는 GCA이다. 특정 실시형태에 있어서, 3-염기 모티프는 GAC이고, 상보적 RNA 시퀀스에 포함되는 3-연속 상보적 염기(3-염기 모티프에 정반대)는 GCG이다. 일부 실시형태에 있어서, 3-염기 모티프는 GAG이고, 상보적 RNA 시퀀스에 포함되는 3-연속 상보적 염기(3-염기 모티프에 정반대)는 CCG, CCA, CCC, UCC 또는 UCG이다. 특정 실시형태에 있어서, 3-염기 모티프는 GAG이고, 상보적 RNA 시퀀스에 포함되는 3-연속 상보적 염기(3-염기 모티프에 정반대)는 CCG이다.
일부 실시형태에 있어서, 상보적 RNA 시퀀스는 표적 RNA에서 표적 아데노신에 정반대되는 시티딘(C), 아데노신(A) 또는 우리딘(U)을 포함한다. 일부 특정 실시형태에 있어서, 상보적 RNA 시퀀스는 표적 RNA에서 표적 아데노신에 정반대되는 C를 포함한다.
본 출원의 방법에 따르면, 일부 실시형태에 있어서, 표적 RNA에 혼성화하는 상보적 RNA 시퀀스는 표적 RNA에서 비표적 아데노신과 각각 반대되는 하나 이상의 불일치를 추가로 포함한다. 특정 실시형태에 있어서, 하나 이상의 비표적 아데노신에 반대되는 불일치 뉴클레오시드는 구아노신이다.
일부 실시형태에 있어서, 3-염기 모티프에서 업스트림 잔기는 G이고, 상보적 RNA에서 업스트림 잔기에 반대되는 염기는 G 또는 A이다. 일부 실시형태에 있어서, 3-염기 모티프에서 다운스트림 잔기는 상보적 RNA의 반대 염기에 대해 엄격하게 상보적이다. 일부 실시형태에 있어서, 3-염기 모티프에서 업스트림 잔기는 G이고, 여기에서 상보적 RNA에서 업스트림 잔기에 반대되는 염기는 G 또는 A이고, 3-염기 모티프에서 다운스트림 잔기는 상보적 RNA에서 반대 염기에 대해 엄격하게 상보적이다. 일부 실시형태에 있어서, 상보적 RNA 시퀀스는 표적 RNA에서 표적 아데노신에 정반대되는 C를 포함하고, 3-염기 모티프에서 업스트림 잔기는 G이고, 여기에서 상보적 RNA에서 업스트림 잔기에 반대되는 염기는 G 또는 A이고, 3-염기 모티프에서 다운스트림 잔기는 상보적 RNA의 반대 염기에 엄격하게 상보적이다. 일부 실시형태에 있어서, 상보적 RNA 시퀀스는 표적 RNA에서 표적 아데노신에 정반대되는 C를 포함하고, 3-염기 모티프에서 업스트림 잔기는 G이고, 여기에서 상보적 RNA에서 업스트림 잔기에 반대되는 염기는 G이고, 3-염기 모티프에서 다운스트림 잔기는 상보적 RNA의 반대 염기에 엄격하게 상보적이다.
본 출원의 상기 RNA 편집 방법에 있어서, RNA 편집 효율은 종래에 비해 적어도 90% 내지 1100%, 예를 들면 적어도 100%, 200%, 300%, 400%, 500%, 600%, 700%, 800%, 900% 및 1000% 증가된다.
일부 실시형태에 있어서, 표적 RNA에서 표적 아데노신(A)은 아데노신 탈아미노효소(RNA에 작용하는 아데노신 탈아미노효소, ADAR)를 통해 탈아미노화된다. 특정 실시형태에 있어서, 아데노신 탈아미노효소는 천연 ADAR, 또는 그것의 상동 단백질이다. 특정 실시형태에 있어서, 아데노신 탈아미노효소는 변형되었지만 아데노신 탈아미노효소 활성을 유지하는 아데노신 탈아미노효소 기능성 변이체, 예를 들면 천연 ADAR, 또는 그것의 상동 단백질을 하나 이상의 위치 돌연변이에 의해 변형시켜 얻어지고, 아데노신 탈아미노효소를 유지하는 변이체이다. 특정 실시형태에 있어서, 아데노신 탈아미노효소는 ADAR 촉매 도메인, 또는 ADAR 동종 단백질 촉매 도메인, 또는 아데노신 탈아미노효소 기능성 변이체를 포함하는 융합 단백질이다. 특정 실시형태에 있어서, ADAR 단백질 촉매 도메인을 포함하는 융합 단백질은 돌연변이 후 촉매 활성을 상실하는 Cas13 단백질 및 ADAR 기능성 도메인, 또는 ADAR 동종 단백질 기능성 도메인, 또는 아데노신 탈아미노효소 기능성 변이체를 포함하는 융합 단백질이다. 일부 실시형태에 있어서, 아데노신 탈아미노효소 활성을 갖는 탈아미노효소는 숙주세포 내로 외인성으로 도입되거나 탈아미노효소를 인코딩하는 컨스트럭트를 도입함으로써 숙주세포에서 발현된다. 특정 실시형태에 있어서, ADAR 단백질 촉매 도메인을 포함하는 융합 단백질은 λN 펩티드 및 ADAR 기능성 도메인, 또는 ADAR 동종 단백질 촉매 도메인, 또는 아데노신 탈아미노효소 기능성 변이체를 포함하는 융합 단백질이다. 특정 실시형태에 있어서, ADAR 단백질 촉매 도메인을 포함하는 융합 단백질은 SNAP-tag-표지된 ADAR, 또는 SNAP-tag-표지된 ADAR 기능성 변이체이다. 특정 실시형태에 있어서, ADAR은 ADAR1 및/또는 ADAR2이다. 일부 실시형태에 있어서, ADAR은 hADAR1, hADAR2, 마우스 ADAR1 및 마우스 ADAR2로 이루어지는 군으로부터 선택된 하나 이상의 ADAR이다.
특정 실시형태에 있어서, ADAR은 숙주세포에 의해 발현된다. 특정 실시형태에 있어서, ADAR은 숙주세포에서 자연적으로 또는 내인성으로 발생하며, 예를 들면 ADAR은 진핵세포에서 자연적으로 또는 내인성으로 발생한다. 특정 실시형태에 있어서, ADAR 단백질은 숙주세포 내로 외인성으로 도입된다. 특정 실시형태에 있어서, ADAR 또는 ADAR을 인코딩하는 컨스트럭트는 숙주세포 내로 도입된다. 일부 실시형태에 있어서, 컨스트럭트는 선형 핵산, 플라스미드, 바이러스 등으로부터 선택되는 임의의 하나(그러나 이에 한정되지 않음)이다. 상기 방법에 있어서, ADAR은 상기 천연 ADAR 및 그것의 상동 단백질, 변형되었지만 아데노신 탈아미노효소 활성을 유지하는 아데노신 탈아미노효소 기능성 변이체(예를 들면, 천연 ADAR 또는 그것의 상동 단백질을 하나 이상의 위치 돌연변이에 의해 변형시켜 얻어진 아데노신 탈아미노효소 활성을 유지하는 변이체), 및 ADAR 촉매 도메인, 또는 ADAR 상동 단백질 촉매 도메인, 또는 아데노신 탈아미노효소 기능성 변이체를 포함한다. 일부 실시형태에 있어서, 상기 방법은 임의의 단백질을 숙주세포 내로 도입하는 단계를 포함하지 않는다. 특정 실시형태에 있어서, ADAR은 ADAR1 및/또는 ADAR2이다. 일부 실시형태에 있어서, ADAR은 hADAR1, hADAR2, 마우스 ADAR1 및 마우스 ADAR2로 이루어지는 군으로부터 선택된 하나 이상의 ADAR이다.
또 다른 양태에 있어서, 본 출원은 숙주세포의 표적 잔기 위치에 표적 RNA를 편집하는 방법을 제공하며, 여기에서 표적 잔기는 시티딘이고, arRNA는 표적 RNA에서 표적 시티딘을 탈아미노화하도록, RNA에 작용하고 시티딘 탈아미노효소 활성을 갖는 탈아미노효소(또는 "시티딘 탈아미노효소"라고 언급되고, 본 출원에 있어서 시티딘 탈아미노효소 활성을 갖는 탈아미노효소 및 시티딘 탈아미노효소는 동일한 의미를 가지며 상호교환가능함)를 리크루팅한다. 일부 실시형태에 있어서, 시티딘 탈아미노효소 활성을 갖는 탈아미노효소, 또는 시티딘 탈아미노효소 활성을 갖는 탈아미노효소를 인코딩하는 컨스트럭트는 숙주세포 내로 도입된다. 상기 방법에 따르면, arRNA는 표적 RNA에 혼성화하는 상보적 RNA 시퀀스를 포함하고, 표적 잔기는 표적 RNA에서 표적 잔기의 5' 최근접 이웃 잔기(업스트림 잔기), 표적 잔기, 및 표적 RNA에서 표적 잔기의 3' 최근접 이웃 잔기(다운스트림 잔기)를 포함하는 3-염기 모티프에 위치하며, 여기에서 표적 잔기는 시티딘(C)이고, 상보적 RNA 시퀀스는 표적 RNA에서 업스트림 잔기 및/또는 다운스트림 잔기에 정반대되는 불일치를 포함한다.
일부 실시형태에 있어서, 표적 시티딘이 위치된 3-염기 모티프는 GCG, GCC, GCA, GCU, ACG, ACC, ACA, ACU, CCG, CCC, CCA, CCU, UCA, UCC, UCU 및 UCG로 이루어지는 군으로부터 선택된다. 일부 실시형태에 있어서, arRNA는 표적 RNA에서 표적 잔기에 상응하는 위치에 언페어링된 뉴클레오티드를 포함하여 표적 잔기와 불일치를 형성한다. 일부 실시형태에 있어서, 표적 RNA에 혼성화할 수 있는 arRNA에서 상보적 RNA 시퀀스는 표적 RNA에서 표적 시티딘에 정반대되는 시티딘, 아데노신 또는 우리딘을 포함한다. 특정 실시형태에 있어서, 상보적 RNA 시퀀스는 표적 시티딘에 정반대되는 우리딘을 포함한다. 특정 실시형태에 있어서, arRNA는 표적 RNA에서 비표적 편집 위치에 상응하는 위치에 하나 이상의 언페어링된 뉴클레오티드를 포함하여 표적 RNA에서 비표적 위치와 하나 이상의 불일치를 형성한다.
일부 실시형태에 있어서, 3-염기 모티프에서 업스트림 잔기는 G이고, 상보적 RNA에서 업스트림 잔기에 반대되는 염기는 G이다. 일부 실시형태에 있어서, 3-염기 모티프에서 다운스트림 잔기는 A이고, 염기는 상보적 RNA에서 다운스트림 잔기에 반대되는 염기는 U 또는 A이다. 일부 실시형태에 있어서, 3-염기 모티프는 ACA이고, 상보적 RNA 시퀀스는 3-염기 모티프에 반대되는 AUU 또는 GUU를 포함한다. 일부 실시형태에 있어서, 3-염기 모티프는 ACA이고, 상보적 RNA 시퀀스는 3-염기 모티프에 반대되는 AUU를 포함한다. 일부 실시형태에 있어서, 3-염기 모티프는 UCA이고, 상보적 RNA 시퀀스는 3-염기 모티프에 반대되는 AUA, GUA 또는 CUA를 포함한다. 일부 실시형태에 있어서, 3-염기 모티프는 UCA이고, 상보적 RNA 시퀀스는 3-염기 모티프에 반대되는 AUA를 포함한다. 일부 실시형태에 있어서, 3-염기 모티프는 GCA이고, 상보적 RNA 시퀀스는 3-염기 모티프에 반대되는 UUG 또는 UCG를 포함한다. 일부 실시형태에 있어서, 3-염기 모티프는 GCA이고, 상보적 RNA 시퀀스는 3-염기 모티프에 반대되는 UUG를 포함한다. 일부 실시형태에 있어서, 3-염기 모티프는 CCA이고, 상보적 RNA 시퀀스는 3-염기 모티프에 반대되는 AUG를 포함한다.
일부 실시형태에 있어서, 시티딘 탈아미노효소 활성을 갖는 탈아미노효소는 ADAR 단백질 또는 ADAR 촉매 도메인을 포함하는 융합 단백질의 유전자 변형에 의해 얻어지는 C-to-U 촉매 활성을 갖는 탈아미노효소이다. 특정 실시형태에 있어서, 시티딘 탈아미노효소는 변형된 ADAR2이고, E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T로부터 선택되는 하나 이상의 돌연변이 ADAR2 촉매 도메인을 포함한다. 특정 실시형태에 있어서, 시티딘 탈아미노효소는 이하의 돌연변이 ADAR2 촉매 도메인 모두를 포함하는 융합 단백질이다: E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T. 일부 실시형태에 있어서, 시티딘 탈아미노효소 활성을 갖는 탈아미노효소는 표적화 도메인을 추가로 포함한다. 특정 실시형태에 있어서, 표적화 도메인은 돌연변이 후에 촉매 활성을 상실하는 Cas13 단백질, λN 펩티드 및 SNAP-tag로 이루어지는 군으로부터 선택되는 어느 하나를 포함하지만, 이에 한정되지 않는다. 시티딘 탈아미노효소 활성을 갖는 탈아미노효소는 돌연변이 후에 촉매 활성을 상실하는 Cas13 단백질을 포함한다. 일부 실시형태에 있어서, 융합 단백질은 돌연변이 후에 촉매 활성을 상실하는 Cas13 단백질 및 시티딘 탈아미노효소 활성을 갖는 ADAR2 촉매 도메인을 포함한다. 일부 실시형태에 있어서, 시티딘 탈아미노효소 활성을 갖는 탈아미노효소는 숙주세포 내로 외인성으로 도입되거나 탈아미노효소를 인코딩하는 컨스트럭트를 도입함으로써 숙주세포에서 발현된다.
특정 실시형태에 있어서, 상기 방법은 시티딘 탈아미노효소 또는 융합 단백질, 또는 시티딘 탈아미노효소를 인코딩하는 컨스트럭트 또는 융합 단백질을 표적 RNA를 포함하는 세포 내로 도입하는 단계를 포함하며, 여기에서 시티딘 탈아미노효소를 인코딩하는 컨스트럭트 또는 융합 단백질은: 선형 핵산, 플라스미드, 벡터 등으로부터 선택된다(그러나, 이에 한정되지 않음). 특정 실시형태에 있어서, 표적 RNA에서 3-염기 모티프의 표적 잔기는 시티딘이고, 3-염기 모티프에서 업스트림 잔기는 G, C, A 및 U로부터 선택되는 뉴클레오티드이며, 바람직한 순서는 G>C>A≒U이다.
본 출원의 상기 방법에 따르면, arRNA는 단일가닥 RNA이다. 일부 실시형태에 있어서, 상보적 RNA 시퀀스는 완전히 단일가닥이다. 특정 실시형태에 있어서, arRNA는 하나 이상(예를 들면, 1, 2, 3개 이상)의 이중가닥 영역 및/또는 하나 이상의 스템-루프 영역을 포함한다. 특정 실시형태에 있어서, arRNA는 상보적 RNA 시퀀스만으로 이루어진다.
본 출원의 방법에 따르면, 일부 실시형태에 있어서, arRNA는 약 20-260 뉴클레오티드의 길이를 가지며, 예를 들면 arRNA는 40-260, 45-250, 50-240, 60-230, 65-220, 70-220, 70-210, 70-200, 70-190, 70-180, 70-170, 70-160, 70-150, 70-140, 70-130, 70-120, 70-110, 70-100, 70-90, 70-80, 75-200, 80-190, 85-180, 90-170, 95-160, 100-200, 100-150, 100-175, 110-200, 110-175, 110-150 또는 105-140 뉴클레오티드의 길이를 갖는다. 일부 실시형태에 있어서, arRNA는 약 60-200(예를 들면, 약 60-150, 65-140, 68-130, 및 70-120 중 임의의 하나) 뉴클레오티드의 길이를 갖는다. 일부 실시형태에 있어서, arRNA는 ADAR-리크루팅 도메인을 추가로 포함한다.
본 출원의 방법에 따르면, 일부 실시형태에 있어서, arRNA는 하나 이상의 화학적 변형을 포함한다. 일부 실시형태에 있어서, 화학적 변형은 메틸화 및/또는 인산화, 예를 들면 2'-O-메틸화(2'-O-Me) 및/또는 뉴클레오티드간 인산화 결합을 포함한다. 특정 실시형태에 있어서, arRNA에서 첫 번째 및 마지막 3 또는 5개의 뉴클레오티드는 2'-O-Me 변형을 포함하고/또는 첫 번째 및 마지막 3, 4 또는 5개의 뉴클레오티드 사이의 연결은 인산화 결합 변형을 포함한다. 특정 실시형태에 있어서, arRNA에서 하나 이상 또는 모든 우리딘은 2'-O-Me 변형을 포함한다. 특정 실시형태에 있어서, arRNA에서 표적화 뉴클레오시드, 및/또는 표적화 뉴클레오시드의 5'-말단 및/또는 3'-말단에 인접한 뉴클레오시드(예를 들면, 표적화 뉴클레오시드의 5'-말단 및/또는 3'-말단에 직접 인접한 1 또는 2개의 뉴클레오시드)는 2'-O-Me 변형을 포함한다. 특정 실시형태에 있어서, arRNA에서 표적화 뉴클레오시드, 및/또는 표적화 뉴클레오시드의 5'-말단 및/또는 3'-말단에 인접한 뉴클레오시드(예를 들면, 표적화 뉴클레오시드의 5'-말단 및/또는 3'-말단에 직접 인접한 1 또는 2개의 뉴클레오시드)는 3'-인산화 결합 변형을 포함한다. 특정 실시형태에 있어서, arRNA는 임의의 화학적 변형을 포함하지 않는다.
본 출원은, 본 출원의 표적 RNA 편집 방법에 의해 생산된 편집된 RNA, 또는 편집된 RNA를 포함하는 숙주세포를 추가로 제공한다.
본 출원의 숙주세포의 표적 잔기 위치에 표적 RNA를 편집하는 방법은 개체에서 질환 또는 상태를 치료 또는 예방하기 위해 적용될 수 있다. 따라서, 본 출원은 개체에서 질환 또는 상태를 치료 또는 예방하는 방법을 추가로 제공하며, 이는 이하의 단계를 포함한다: 본 출원에 따른 숙주세포의 표적 잔기 위치에 표적 RNA를 편집하는 임의의 방법에 의해 개체 세포에서 질환 또는 상태와 관련된 표적 RNA를 편집한다. 일부 실시형태에 있어서, 질환 또는 상태는 유전성 유전자 질환, 또는 하나 이상의 후천적 유전자 돌연변이(예를 들면, 약물 내성)와 관련된 질환 또는 상태이다.
본 출원은 표적 RNA에 혼성화하는 상보적 RNA 시퀀스를 포함하는, 표적 RNA에서 표적 잔기를 탈아미노화하기 위해 RNA에 작용하는 탈아미노효소를 리크루팅하기 위한 본 출원의 방법에 적용될 수 있는 RNA(arRNA)를 추가로 제공하며, 여기에서 표적 잔기는 표적 RNA에서 표적 잔기의 5' 최근접 이웃 잔기(업스트림 잔기), 표적 잔기, 및 표적 RNA에서 표적 잔기의 3' 최근접 이웃 잔기(다운스트림 잔기)를 포함하는 3-염기 모티프에 위치하고, 여기에서 3-염기 모티프는 UAG가 아니며 상보적 RNA 시퀀스는 표적 RNA에서 업스트림 잔기 및/또는 다운스트림 잔기에 정반대되는 불일치를 포함한다.
본 출원의 arRNA에 따르면, arRNA는 표적 RNA에서 표적 아데노신에 정반대되는 C를 포함한다. 특정 실시형태에 있어서, 표적 RNA에 혼성화하는 arRNA는 표적 RNA에서 비표적 아데노신에 각각 반대되는 하나 이상의 불일치를 추가로 포함한다. 특정 실시형태에 있어서, 하나 이상의 비표적 아데노신에 반대되는 불일치는 구아노신이다. 특정 실시형태에 있어서, 3-염기 모티프는 GAU이고, arRNA에 포함된 3-연속 상보적 염기(3-염기 모티프에 정반대)는 ACG 또는 ACA이다. 특정 실시형태에 있어서, 3-염기 모티프는 GAU이고, arRNA에 포함된 3-연속 상보적 염기(3-염기 모티프에 정반대)는 ACG이다. 특정 실시형태에 있어서, 3-염기 모티프는 GAA이고, arRNA에 포함된 3-연속 상보적 염기(3-염기 모티프에 정반대)는 UCA, CCG, CCC 또는 UCC이다. 특정 실시형태에 있어서, 3-염기 모티프는 GAA이고, arRNA에 포함된 3-연속 상보적 염기(3-염기 모티프에 정반대)는 UCA이다. 특정 실시형태에 있어서, 3-염기 모티프는 GAC이고, arRNA에 포함된 3-연속 상보적 염기(3-염기 모티프에 정반대)는 GCG 또는 GCA이다. 특정 실시형태에 있어서, 3-염기 모티프는 GAC이고, arRNA에 포함된 3-연속 상보적 염기(3-염기 모티프에 정반대)는 GCG이다. 특정 실시형태에 있어서, 3-염기 모티프는 GAG이고, arRNA에 포함된 3-연속 상보적 염기(3-염기 모티프에 정반대)는 CCG, CCA, CCC, UCC 또는 UCG이다. 특정 실시형태에 있어서, 3-염기 모티프는 GAG이고, arRNA에 포함된 3-연속 상보적 염기(3-염기 모티프에 정반대)는 CCG이다.
본 출원의 arRNA에 따르면, 일부 실시형태에 있어서, arRNA는 약 20-260 뉴클레오티드의 길이를 가지며, 예를 들면 arRNA는 40-260, 45-250, 50-240, 60-230, 65-220, 70-220, 70-210, 70-200, 70-190, 70-180, 70-170, 70-160, 70-150, 70-140, 70-130, 70-120, 70-110, 70-100, 70-90, 70-80, 75-200, 80-190, 85-180, 90-170, 95-160, 100-200, 100-150, 100-175, 110-200, 110-175, 110-150 또는 105-140 뉴클레오티드의 길이를 갖는다. 일부 실시형태에 있어서, arRNA는 약 60-200(예를 들면, 약 60-150, 65-140, 68-130 및 70-120 중 임의의 하나) 뉴클레오티드의 길이를 갖는다. 일부 실시형태에 있어서, arRNA는 ADAR-리크루팅 도메인을 추가로 포함한다.
본 출원의 arRNA에 따르면, 일부 실시형태에 있어서, arRNA는 하나 이상의 화학적 변형을 포함한다. 일부 실시형태에 있어서, 화학적 변형은 메틸화 및/또는 인산화, 예를 들면 2'-O-메틸화(2'-O-Me) 및/또는 뉴클레오티드간 인산화 결합을 포함한다. 특정 실시형태에 있어서, arRNA의 첫 번째 및 마지막 3 또는 5개의 뉴클레오티드는 2'-O-Me 변형을 포함하고/또는 첫 번째와 마지막 3, 4 또는 5개의 뉴클레오티드 사이의 연결은 인산화 결합을 포함한다. 특정 실시형태에 있어서, arRNA에서 하나 이상 또는 모든 우리딘은 2'-O-Me 변형을 포함한다. 특정 실시형태에 있어서, arRNA에서 표적화 뉴클레오시드, 및/또는 표적화 뉴클레오시드의 5'-말단 및/또는 3'-말단에 인접한 뉴클레오시드(예를 들면, 표적화 뉴클레오시드의 5'-말단 및/또는 3'-말단에 직접 인접한 1 또는 2개의 뉴클레오시드)는 2'-O-Me 변형을 포함한다. 특정 실시형태에 있어서, arRNA에서 표적화 뉴클레오시드, 및/또는 표적화 뉴클레오시드의 5'-말단 및/또는 3'-말단에 인접한 뉴클레오시드(예를 들면, 표적화 뉴클레오시드의 5'-말단 및/또는 3'-말단에 직접 인접한 1 또는 2개의 뉴클레오시드)는 3'-인산화 결합 변형을 포함한다. 특정 실시형태에 있어서, arRNA는 임의의 화학적 변형을 포함하지 않는다.
본 출원은, 본 출원에 따라 상기 기재된 임의의 arRNA를 포함하는 바이러스 벡터, 플라스미드 또는 선형 핵산쇄를 추가로 제공하고, arRNA는 임의의 화학적 변형을 포함하지 않는다. 본 출원은, 본 출원에 따라 상기 기재된 임의의 arRNA, 또는 본 출원에 따라 상기 기재된 임의의 바이러스 벡터, 플라스미드 또는 선형 핵산쇄를 포함하는 라이브러리를 추가로 제공한다. 본 출원은, 본 출원에 따라 상기 기재된 임의의 arRNA, 또는 본 출원에 따라 상기 기재된 임의의 바이러스 벡터, 플라스미드 또는 선형 핵산쇄를 포함하는 조성물을 추가로 제공한다. 본 출원은, 본 출원에 따라 상기 기재된 임의의 arRNA, 또는 본 출원에 따라 상기 기재된 임의의 바이러스 벡터, 플라스미드 또는 선형 핵산쇄를 포함하는 숙주세포를 제공한다. 일부 실시형태에 있어서, 본 출원에 따라 상기 기재된 임의의 arRNA를 포함하는 숙주세포는 진핵세포이다.
도 1은 REPAIR 시스템의 3-연속 염기 선호도를 나타낸다(Cox et al., 2017).
도 2는 SNAP-ADAR 시스템의 3-연속 염기 선호도를 나타낸다(Vogel et al., 2018).
도 3은 LEAPER 시스템의 3-연속 염기 선호도를 나타낸다(Qu et al., 2019).
도 4는 LEAPER 시스템의 기본 프로세스 및 본 출원의 개선을 나타낸다.
도 5는 16개의 3-염기 모티프 리포터 시스템의 구성을 나타낸다.
도 6은 16개의 3-연속 상보적 염기 시퀀스의 설계 및 종래 기술의 LEAPER 시스템에서 arRNA의 설계 원리에 따른 3-염기 모티프에 상응하는 결과를 나타낸다.
도 7은 UAG의 3-염기 모티프에 대한 리포터 시스템의 첫 번째 테스트 결과를 나타낸다.
도 8은 UAG의 3-염기 모티프에 대한 리포터 시스템의 반복 실험 결과를 나타낸다.
도 9는 LEAPER 시스템에 관련된 참고 문헌(Qu et al., 2019)에서 UAG의 3-염기 모티프에 대한 리포터 시스템의 테스트 결과를 나타낸다.
도 10은 UAG의 3-염기 모티프에 대한 편집 효율의 테스트 결과를 나타낸다.
도 11a 내지 도 11c는 GAU(도 11A), GAG(도 11B) 및 GAC(도 11C)를 포함하는, GAN의 3-염기 모티프에 대한 편집 효율의 테스트 결과를 나타낸다.
도 12는 본 출원의 개선된 arRNA 설계를 나타낸다.
도 13a 내지 도 13d는 GAA(도 13a), GAU(도 13b), GAG(도 13c) 및 GAC(도 13d)의 3-염기 모티프에 대한 본 출원의 개선된 arRNA 설계의 개선된 편집 효율을 나타낸다.
도 14는 리포터 1의 플라스미드 프로파일 및 그것의 시퀀스를 나타낸다.
도 15는 C-to-U 편집 시스템의 테스트 결과이며, 이 도면에서 표적 잔기는 C이고, 편집 효율에 대한 3-연속 상보적 염기에서 표적 C에 반대되는 염기 및 업스트림 잔기의 변화의 영향을 테스트하였다. 이 도에서, "/"는 상응하는 플라스미드 또는 arRNA가 첨가되지 않고 동일한 부피의 물만 첨가되었음을 나타낸다.
도 16은 도 15의 일부 데이터에 대한 반복 실험 결과를 나타낸다. 이 도면에서, "/"는 상응하는 플라스미드 또는 arRNA가 첨가되지 않고 동일한 부피의 물만 첨가되었음을 나타낸다.
도 17은 C-to-U 편집 시스템의 테스트 결과를 나타낸다. 테스트 결과는 arRNA에서 3-연속 상보적 염기가 표적 C에 상응하는 단일 불일치를 포함하는 조건 하에서 얻어지며, 여기에서 표적 C에 상응하는 불일치된 염기는 U이고, 3-연속 상보적 염기에서 다른 2개의 염기는 표적 C에 인접한 업스트림 잔기 및 다운스트림 잔기와 완전히 일치한다.
도 18은 도 15에서 mRNA에서 3-염기 모티프가 N*CA(가로축에 나타냄)이고 arRNA에서 3-연속 상보적 염기가 GUU인 경우의 데이터를 바나낸 것이며, 도 17의 데이터와의 비교를 위해 사용된다.
도 19a 및 도 19b는 도 18 및 도 17에서 각각 3-염기 모티프 및 3-연속 상보적 염기의 페어링 결과를 분석한 것을 나타낸다. 특히, 도 19a에서 3-염기 모티프 및 3-연속 상보적 염기는 도 18의 결과를 도출하기 위해 사용되고, 도 19b에서 3-염기 모티프 및 3-연속 상보적 염기는 도 17의 결과를 도출하기 위해 사용된다.
도 20은 다중 불일치 및 단일 불일치를 포함하는 리포터 시스템의 편집 효율의 비교 결과를 나타내고, 그 결과는 %GFP로 나타낸다. 특히, 3-염기 모티프에서 표적 잔기 C와 페어링되는 염기는 C이고, 표적 잔기에 인접한 다운스트림 잔기에 반대되는 염기는 U이다. 이 도면에서, "mRNA의 5'-말단 염기"는 3-염기 모티프에서 업스트림 잔기를 나타낸다. mRNA 및 arRNA에서 언급되지 않은 다른 염기는 엄격하게 상보적으로 페어링된다.
도 21은 다중 불일치 및 단일 불일치를 포함하는 리포터 시스템의 편집 효율의 비교 결과를 나타내며, 이는 도 20에서 동일한 테스트의 평균 형광 강도(MFI)로 나타낸 결과이다.
도 22a 내지 도 22d는 ACA(도 22a), TCA(도 22b), CCA(도 22c) 및 GCA(도 22d)의 3-염기 모티프에 대한 상이하게 설계된 arRNA의 편집 효율의 테스트 결과를 나타낸다.
본 출원은 ADAR-리크루팅 RNA(arRNA) 또는 arRNA를 인코딩하는 컨스트럭트를 숙주세포 내로 도입하는 단계를 포함하는, 숙주세포의 표적 잔기 위치에 표적 RNA를 편집하는 방법을 제공한다. 상기 arRNA는 표적 RNA에 혼성화하여 RNA에 작용하는 탈아미노효소를 리크루팅하여 표적 RNA에서 표적 잔기를 탈아미노화하는 이중가닥 RNA를 형성하는 상보적 RNA 시퀀스를 포함하고, 상기 잔기의 염기 유형은 탈아미노화 후에 변경된다. 본 출원은 arRNA 및 표적 RNA의 설계를 통한 표적 RNA 편집 방법을 제공하며, 상기 방법은 종래 기술의 ADAR 기반 RNA 편집 시스템을 사용함으로써 ADAR의 자연적 선호도와 불일치된 UAG 이외의 3-염기 모티프의 편집 효율을 상당히 향상시키고, RNA 편집의 적용에서 편집 위치의 선택에 지속적인 한계를 돌파한다. 본 출원의 방법에 의해, RNA 편집에 의한 질환 치료의 범위와 효능이 크게 확대되어, 유전자 돌연변이로 인해 야기되는 더 많은 질환(예를 들면, 더 많은 유전병)이 RNA 편집에 의해 안전하고 효과적으로 치료될 수 있는 기회를 가질 수 있다. 본 출원의 방법 및/또는 arRNA에 의해, 향후 RNA 편집 요법으로 치료될 수 있는 G->A 돌연변이에 의한 질환에 대해서는 돌연변이 위치가 위치하는 3-염기 모티프를 보다 유연하게 선택할 수 있다. 예를 들면, 돌연변이 위치가 위치하는 3-염기 모티프가 GAU인 경우, 종래 기술의 편집 효율은 처리 요건을 충족시킬 수 없는 반면에, 본 출원에 따른 방법의 편집 효율은 적어도 종래 기술의 10배이다. 또한, 적절하게 변형된 ADAR 단백질은 C->U의 RNA 염기 편집을 수행할 수 있으므로, 본 출원에 따른 방법은 C의 표적 잔기를 갖는 상이한 3-염기 모티프에 대한 RNA 편집 시스템의 편집 효율을 더욱 향상시킬 수 있다.
따라서, 본 출원은 ADAR-리크루팅 RNA(arRNA) 또는 arRNA를 인코딩하는 컨스트럭트를 숙주세포 내로 도입하는 단계를 포함하는, 숙주세포의 표적 잔기 위치에 표적 RNA를 편집하는 방법을 제공하며, 여기에서 arRNA는 표적 RNA에 혼성화하는 상보적 RNA 시퀀스를 포함하고, 표적 잔기는 표적 RNA에서 표적 잔기의 5' 최근접 이웃 잔기(업스트림 잔기), 표적 잔기, 및 표적 RNA에서 표적 잔기의 3' 최근접 이웃 잔기(다운스트림 잔기)에 위치하고, 여기에서 3-염기 모티프는 UAG가 아니며, 상보적 RNA 시퀀스는 표적 RNA에서 업스트림 잔기 및/또는 다운스트림 잔기에 정반대되는 불일치를 포함한다.
본원에서 "표적 RNA"는 편집될 RNA이다. 본원에서 "염기" 및 "잔기"는 "아데닌", "구아닌", "시토신", "티민", "우라실" 및 "하이포잔틴"과 같은 핵염기를 지칭한다. 용어 "아데노신", "구아노신", "시티딘", "티미딘", "우리딘" 및 "이노신"은 리보스 또는 데옥시리보스의 탄수화물 모이어티와 연결된 핵염기를 지칭한다. 용어 "뉴클레오시드"는 리보스 또는 데옥시리보스와 연결된 핵염기를 지칭한다. 용어 "뉴클레오티드"는 각각의 핵염기-리보스-포스페이트 또는 핵염기-데옥시리보스-포스페이트를 지칭한다. 때때로, 아데노신 및 아데닌(약칭 "A"), 구아노신 및 구아닌(약칭 "G"), 시토신 및 시티딘(약칭 "C"), 우라실 및 우리딘(약칭 "U"), 티민 및 티미딘("T"로 약칭), 및 이노신 및 하이포크산틴("I"로 약칭)은 상호교환가능하며, 상응하는 핵염기, 뉴클레오시드 또는 뉴클레오티드를 지칭한다. 핵산쇄에서, 이전 뉴클레오티드의 3'-히드록실기와 다음 뉴클레오티드의 5'-인산이 3',5'-포스포디에스테르 결합을 형성하고, 뉴클레오티드의 3'-말단에서 히드록실기-OH가 제거되며, 이는 "뉴클레오티드 잔기" 또는 "잔기"로 지칭된다. 때때로, 용어 핵염기, 염기, 뉴클레오시드, 뉴클레오티드, 뉴클레오티드 잔기 및 잔기는 문맥에서 차이가 명백하게 기재되지 않는 한 상호교환가능하다.
본원에서 사용되는 바와 같이, 핵산의 "상보적"은 핵산이 종래의 왓슨-크릭 염기쌍을 통해 다른 핵산과 수소 결합을 형성하는 핵산의 능력을 지칭한다. 상보적 퍼센트는 다른 핵산 분자와 수소 결합(즉, 왓슨-크릭 염기쌍)을 형성할 수 있는 핵상 분자에서 잔기의 퍼센트를 나타낸다(예를 들면, 10개 중 약 5, 6, 7, 8, 9 또는 10개는 약 50%, 60%, 70%, 80%, 90% 또는 100% 상보성을 나타냄). "완전히 상보적"은 핵산 시퀀스의 모든 연속 잔기가 두 번째 핵산 시퀀스의 동일한 수의 연속 잔기와 수소 결합을 형성하는 것을 지칭한다. 본원에서 사용되는 바와 같이, "실질적으로 상보적"은 약 40, 50, 60, 70, 80, 100, 150, 200, 250개 이상의 뉴클레오티드의 영역에 대해 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100%의 상보성을 지칭하거나, 또는 엄격한 조건 하에서 혼성화하는 2개의 핵산을 지칭한다. 단일 염기 또는 단일 뉴클레오티드의 경우, 왓슨-크릭 염기쌍 원리에 따라 A와 T 또는 U의 페어링, 또는 C와 G 또는 I의 페어링을 상보적 또는 일치되는 것으로 지칭하며, 그 반대의 경우도 마찬가지이다. 그러나, 다른 염기쌍은 비상보적이거나 불일치되는 것으로 지칭된다.
"혼성화"는 하나 이상의 폴리뉴클레오티드가 복합체를 형성하고, 복합체가 뉴클레오티드 잔기의 염기 사이의 수소 결합에 의해 안정화되는 반응을 지칭한다. 수소 결합은 왓슨 크릭 염기쌍, 후그스타인(Hoogstein) 결합 또는 임의의 다른 시퀀스 특이적 방식에 의해 형성될 수 있다. 주어진 시퀀스에 혼성화할 수 있는 시퀀스는 주어진 시퀀스의 "상보적 시퀀스"로 지칭된다.
용어 "RNA 편집"은 RNA에 염기가 삽입, 결실, 및 치환 등의 현상을 지칭한다. 많은 RNA 편집 시스템에서 일반적으로 사용되는 효소는 RNA에 작용하는 아데노신 탈아미노효소(ADAR) 또는 그것의 변이체, 또는 ADAR 기능성 도메인을 포함하는 복합체이다. ADAR 단백질 패밀리는 특정 RNA의 이중가닥 영역에 결합할 수 있으며, 아데노신(A) 뉴클레오티드 염기에서 -NH2기를 제거하여 A를 이노신(I)으로 전환할 수 있으며, I는 구아노신(G)으로 인식되고 세포의 후속 번역 과정에서 시티딘(C)과 페어링된다. 아데노신-to-이노신(A->I)의 RNA 편집은 동물에서 가장 흔한 유형의 RNA 편집이며, 전사 및 전사 후 수준에서 여러 유전자 조절 메커니즘에 광범위하게 관여하고 있고, 예를 들면 전사체 수준에서 아미노산 시퀀스를 변화시키고, mRNA의 스플라이싱 및 안정성과 원형 RNA의 형성을 조절한다(Nishkura K. 2010). 포유류 세포에서, 세 가지 유형의 ADAR 단백질이 있다: ADAR1(두 가지 동종형: p110 및 p150), ADAR2, 및 ADAR3(촉매 활성이 없는). 연구진은 λN 펩티드를 인간 ADAR1 또는 ADAR2 탈아미노효소 도메인과 융합시켜, 특정 RNA 표적에 결합하도록 BoxB 스템-루프와 안티센스 RNA로 이루어지는 융합 RNA에 의해 가이드될 수 있는 λN-ADARDD 시스템을 구축했다. 이 방법에 따르면, 표적 A는 표적 A 염기 위치에 I(A-C 불일치가 도입)로 편집되어 A-to-G RNA 염기 편집을 가능하게 한다. 다른 RNA 편집 방법은 포유류 세포에서 ADAR1 또는 ADAR2 단백질을 과발현시키도록 R/G 모티프(ADAR-리크루팅 RNA 비계)와 융합된 안티센스 RNA를 제조하여 표적 RNA를 편집하는 방법, 및 dCas13-ADAR을 사용하여 RNA를 정확하게 표적화하여 편집하는 방법을 포함한다. RNA 수준에서 편집하면 게놈 손상을 피할 수 있을 뿐만 아니라, 최종 생물학적 기능도 변경할 수 있다.
용어 "탈아미노효소-리크루팅 RNA", "dRNA", "arRNA" 및 "ADAR-리크루팅 RNA"는 본원에서 상호교환가능하며, RNA에서 표적 아데노신 또는 표적 시티딘을 탈아미노화하기 위해 ADAR, ADAR 변이체 또는 ADAR 도메인을 포함하는 특정 복합체를 리크루팅할 수 있는 RNA를 지칭한다. 본 출원의 맥락에서, "표적 RNA"는 탈아미노효소 리크루팅 RNA 시퀀스가 표적 RNA와 완전히 상보적이거나 실질적으로 상보적 RNA 시퀀스로 설계되고, 표적 RNA는 표적 잔기를 포함하는 것을 지칭한다. 본원에서 "표적 잔기"는 ADAR 효소 및 arRNA의 도입과 같은 RNA 편집에 의해 변형되는 뉴클레오티드 잔기를 지칭한다. 표적 시퀀스는 arRNA에 혼성화하여 표적 잔기(ADAR)에 작용하는 아데노신 탈아미노효소 또는 그것의 변이체를 리크루팅하는 표적 잔기를 포함하는 이중가닥 RNA(dsRNA) 영역을 형성하고, 효소 또는 그것의 변이체는 표적 잔기를 탈아미노화한다.
"3-염기 모티프"는 표적 RNA에서 표적 잔기의 5' 최근접 이웃 잔기(업스트림 잔기), 표적 잔기 및 표적 RNA에서 표적 잔기의 3' 최근접 이웃 잔기(다운스트림 잔기)를 포함하는 3-연속 염기 시퀀스를 나타낸다. 본 출원에 따른 "3-염기 모티프"의 맥락에서, "표적 잔기"는 "편집 위치"에 위치하므로 달리 명시되지 않는 한, "표적 잔기" 및 "편집 위치"는 상호교환가능하다. 3-염기 모티프에서 업스트림 잔기 및 다운스트림 잔기는 종종 표적 잔기에 대한 RNA 편집의 편집 효율을 결정한다. 예를 들면, REPAIR(WO2019005884A1), RESTORE(WO2020001793A1) 및 LEAPER(WO2020074001A1)와 같은 RNA 편집 시스템의 편집 효율은 3-염기 모티프에 따라 상이하며, 3-염기 모티프에 대한 상이한 편집 효율의 상황을 본원에서는 "3-연속 염기 선호도"라고 지칭힌다.
표적 RNA의 3-염기 모티프에 정반대되는 상보적 RNA 시퀀스의 3-염기, 즉 표적 잔기에 정반대되는 염기(본원에서 "표적화 염기"라 함)로 이루어지는 3-연속 염기 모티프, 염기의 5' 최근접 이웃 잔기 및 염기의 3' 최근접 이웃 잔기는 본원에서 "3-연속 상보적 염기"로 지칭된다.
여기에서, 모든 3-염기 모티프 및 3-연속 상보적 염기는 5'-말단에서 3'-말단의 순서이다.
본 출원의 방법에 있어서, 표적 RNA는 arRNA에 혼성화하여 표적 잔기를 포함하는 이중가닥 RNA(dsRNA) 영역을 형성하고, 이는 RNA에 작용하는 탈아미노효소를 리크루팅하고, 이 효소는 표적 잔기를 탈아미노화한다. 본 출원의 방법은 arRNA를 설계하는 단계, 및 arRNA 또는 arRNA를 인코딩하는 컨스트럭트를 숙주세포에 도입하는 단계를 포함한다. arRNA에서 상보적 RNA 시퀀스는 표적 RNA에서 표적 잔기를 탈아미노화하도록, 표적 RNA와 혼성화하여 RNA에 작용하는 탈아미노효소를 리크루팅할 수 있는 이중가닥 RNA를 형성하고, 잔기의 염기 유형은 탈아미노화 후에 변경될 수 있다. 탈아미노화로 인해, 아데노신(A)이 이노신(I)으로 전환될 수 있고, I가 구아노신(G)으로 인식됨으로써, A-to-G 편집이 가능하다. 유사하게, 탈아미노화로 인해, 시티딘(C)은 우리딘(U)으로 전환될 수 있으며, 이에 따라 C-to-U 편집이 실현된다.
RNA 편집의 3-연속 염기 선호도는, 예를 들면 도 2 및 도 3에 나타낸다. 구아노신(G)의 업스트림 잔기를 갖는 3-염기 모티프에 대한 낮은 3-연속 염기 선호도는 현재 ADAR 기반 RNA 편집 방법의 공통적인 특징이다. 유사하게, C-to-U 편집에서, 출판된 문서는 또한 명백한 3-연속 염기 선호도를 보여준다. 3-연속 염기 선호도의 한계로 인해, 실질적인 적용 요건을 충족하고 효율적인 편집을 실현하기 위해서, 종래 기술에서는 3-연속 염기 선호도가 더 높은 3-염기 모티프를 선택하여 탈아미노효소 기반 RNA 편집 시스템에서 편집할 필요가 있다. 따라서, RNA 편집의 적용 범위는 한정적이다. 본 출원은 숙주세포의 표적 잔기 위치에 표적 RNA를 편집하기 위한 개선된 방법을 제공하며, 이는 arRNA의 3-염기 모티프에 정반대되는 염기 위치에 더 많은 불일치를 도입하는 것을 포함하며, 이는 탈아미노효소의 3-연속 염기 선호도를 충족하지 않는 3-염기 모티프에서 표적 염기에 대한 종래 기술의 ADAR 기반 RNA 편집 시스템의 편집 효율을 크게 향상시킴으로써, RNA 편집의 적용에서 편집 위치의 선택에 대한 지속적인 한계를 돌파한다.
따라서, 일 양태에 있어서, 본 출원은 ADAR-리크루팅 RNA(arRNA) 또는 arRNA를 인코딩하는 컨스트럭트를 숙주세포 내로 도입하는 단계를 포함하는, 숙주세포의 표적 잔기 위치에 표적 RNA를 편집하는 방법을 제공하며, 여기에서 arRNA는 상보적 RNA 시퀀스를 포함하고, 상보적 RNA 시퀀스는 표적 RNA에서 표적 잔기를 탈아미노화하도록, 표적 RNA에 혼성화하여 RNA에 작용하는 탈아미노효소를 리크루팅할 수 있는 이중가닥 RNA를 형성한다. 표적 잔기는 표적 RNA에서 3-염기 모티프에 위치하며, 3-염기 모티프는 표적 RNA에서 표적 잔기의 5' 최근접 이웃 잔기(업스트림 잔기), 표적 잔기 및 표적 RNA에서 표적 잔기의 3' 최근접 이웃 잔기(다운스트림 잔기)를 포함한다. 5'-말단에서 3'-말단의 순서로 순차적으로 업스트림 잔기, 표적 잔기, 및 다운스트림 잔기가 연결됨으로써 형성된 삼중항을 "3-염기 모티프"라고 지칭한다. 본 출원에서, 모든 3-염기 모티프를 5'말단에서 3'말단의 순서로 기재한다. 상보적 RNA 시퀀스의 3-염기(표적 RNA의 3-염기 모티프에 반대)는 또한 5'-말단에서 3'-말단의 순서이다.
본 출원은 숙주세포의 표적 잔기 위치에 표적 RNA를 편집하는 방법을 제공하며, 이는 ADAR-리크루팅 RNA(arRNA) 또는 arRNA를 인코딩하는 컨스트럭트를 숙주세포 내로 도입하는 것을 포함하며, 여기에서 arRNA는 표적 RNA에 혼성화하는 상보적 RNA 시퀀스를 포함하고, 표적 잔기는 표적 RNA에서 표적 잔기의 5' 최근접 이웃 잔기(업스트림 잔기), 표적 잔기 및 표적 RNA에서 표적 잔기의 3' 최근접 이웃 잔기(다운스트림 잔기)를 포함하는 3-염기 모티프에 위치하고; 여기에서 3-염기 모티프는 UAG가 아니며, 상보적 RNA 시퀀스는 표적 RNA에서 업스트림 잔기 또는 다운스트림 잔기에 정반대되는 불일치를 포함한다.
일부 실시형태에 있어서, 본 출원은 숙주세포의 표적 잔기 위치에 표적 RNA를 편집하는 방법을 제공하며, 이는 ADAR-리크루팅 RNA(arRNA) 또는 arRNA를 인코딩하는 컨스트럭트를 숙주세포 내로 도입하는 것을 포함하며, 여기에서 arRNA는 표적 RNA에 혼성화하는 상보적 RNA 시퀀스가며, 표적 잔기는 표적 RNA에서 표적 잔기의 5' 최근접 이웃 잔기(업스트림 잔기), 표적 잔기 및 표적 RNA에서 표적 잔기의 3' 최근접 이웃 잔기(다운스트림 잔기)를 포함하는 3-염기 모티프에 위치하고; 여기에서 3-염기 모티프는 UAG가 아니며, 상보적 RNA 시퀀스는 표적 RNA에서 업스트림 잔기 및 다운스트림 잔기에 정반대되는 불일치를 포함한다.
특정 실시형태에 있어서, 3-염기 모티프에서 업스트림 잔기는 G이다. 특정 실시형태에 있어서, 3-염기 모티프에서 업스트림 잔기는 A이다. 특정 실시형태에 있어서, 3-염기 모티프에서 업스트림 잔기는 C이다. 실시형태에 있어서, 3-염기 모티프에서 다운스트림 잔기는 C이다. 특정 실시형태에 있어서, 3-염기 모티프에서 다운스트림 잔기는 U이다. 특정 실시형태에 있어서, 3-염기 모티프에서 다운스트림 잔기는 A이다. 특정 실시형태에 있어서, 3-염기 모티프는 GAG, GAC, GAA, GAU, AAG, AAC, AAA, AAU, CAG, CAC, CAA, CAU, UAA, UAC 및 UAU로 이루어지는 군으로부터 선택된다. 특정 실시형태에 있어서, 3-염기 모티프는 GAU이다. 특정 실시형태에 있어서, 3-염기 모티프는 GAG이다. 특정 실시형태에 있어서, 3-염기 모티프는 GAA이다. 특정 실시형태에 있어서, 3-염기 모티프는 GAC이다. 일부 실시형태에 있어서, 표적 RNA에서 업스트림 잔기는 G, C, A 및 U로 이루어지는 군으로부터 선택된 뉴클레오티드이고, 바람직한 순서는 다음과 같다: G>C≒A>U. 일부 실시형태에 있어서, 상보적 RNA 시퀀스는 표적 RNA에서 표적 아데노신에 정반대되는 시티딘(C), 아데노신(A) 또는 우리딘(U)을 포함한다. 일부 특정 실시형태에 있어서, 상보적 RNA 시퀀스는 표적 RNA에서 표적 아데노신에 정반대되는 C를 포함한다.
본 출원의 방법에 따르면, 일부 실시형태에 있어서, 표적 RNA에 혼성화하는 상보적 RNA 시퀀스는 표적 RNA에서 비표적 아데노신과 각각 반대되는 하나 이상의 불일치를 추가로 포함한다. 특정 실시형태에 있어서, 하나 이상의 비표적 아데노신에 반대되는 불일치 뉴클레오시드는 구아노신이다. 일부 실시형태에 있어서, 3-염기 모티프는 GAU이고, 상보적 RNA 시퀀스에 포함된 3-연속 상보적 염기(3-염기 모티프에 정반대)는 ACG 또는 ACA이다. 일부 실시형태에 있어서, 3-염기 모티프는 GAU이고, 상보적 RNA 시퀀스에 포함된 3-연속 상보적 염기(3-염기 모티프에 정반대)는 ACG이다. 일부 실시형태에 있어서, 3-염기 모티프는 GAA이고, 상보적 RNA 시퀀스에 포함된 3-연속 상보적 염기(3-염기 모티프에 정반대)는 UCA, CCG, CCC 또는 UCC이다. 특정 실시형태에 있어서, 3-염기 모티프는 GAA이고, 상보적 RNA 시퀀스에 포함된 3-연속 상보적 염기(3-염기 모티프에 정반대)는 UCA이다. 일부 실시형태에 있어서, 3-염기 모티프는 GAC이고, 상보적 RNA 시퀀스에 포함된 3-연속 상보적 염기(3-염기 모티프에 정반대)는 GCG 또는 GCA이다. 특정 실시형태에 있어서, 3-염기 모티프는 GAC이고, 상보적 RNA 시퀀스에 포함된 3-연속 상보적 염기(3-염기 모티프에 정반대)는 GCG이다. 일부 실시형태에 있어서, 3-염기 모티프는 GAG이고, 상보적 RNA 시퀀스에 포함된 3-연속 상보적 염기(3-염기 모티프에 정반대)는 CCG, CCA, CCC, UCC 또는 UCG이다. 특정 실시형태에 있어서, 3-염기 모티프는 GAG이고, 상보적 RNA 시퀀스에 포함된 3-연속 상보적 염기(3-염기 모티프에 정반대)는 CCG이다. 일부 실시형태에 있어서, 3-염기 모티프에서 업스트림 잔기는 G이고, 상보적 RNA에서 업스트림 잔기에 반대되는 염기는 G 또는 A이다. 일부 실시형태에 있어서, 3-염기 모티프에서 다운스트림 잔기는 상보적 RNA의 반대 염기에 대해 엄격하게 상보적이다. 일부 실시형태에 있어서, 3-염기 모티프에서 업스트림 잔기는 G이고, 여기에서 상보적 RNA에서 업스트림 잔기에 반대되는 염기는 G 또는 A이고, 3-염기 모티프에서 다운스트림 잔기는 상보적 RNA의 반대 염기에 대해 엄격하게 상보적이다. 일부 실시형태에 있어서, 상보적 RNA 시퀀스는 표적 RNA에서 표적 아데노신에 정반대되는 C를 포함하고, 3-염기 모티프에서 업스트림 잔기는 G이고, 여기에서 상보적 RNA에서 업스트림 잔기에 반대되는 염기는 G 또는 A이고, 3-염기 모티프에서 다운스트림 잔기는 상보적 RNA의 반대 염기에 엄격하게 상보적이다. 일부 실시형태에 있어서, 상보적 RNA 시퀀스는 표적 RNA에서 표적 아데노신에 정반대 C를 포함하고, 3-염기 모티프에서 업스트림 잔기는 G이고, 여기에서 상보적 RNA에서 업스트림 잔기에 반대되는 염기는 G이고, 3-염기 모티프에서 다운스트림 잔기는 상보적 RNA의 반대 염기에 엄격하게 상보적이다. 본 출원에 따른 방법의 RNA 편집 효율은 적어도 90% 내지 1100%, 예를 들면 적어도 100%, 200%, 300%, 400%, 500%, 600%, 700%, 800 %, 900% 및 1000%만큼 증가한다.
일부 실시형태에 있어서, 표적 RNA의 표적 아데노신(A)은 RNA에 작용하는 아데노신 탈아미노효소(ADAR)를 통해 탈아미노화된다. 특정 실시형태에 있어서, 아데노신 탈아미노효소는 천연 ADAR 또는 그것의 상동 단백질이다. 특정 실시형태에 있어서, 아데노신 탈아미노효소는 변형되었지만 아데노신 탈아미노효소 활성을 유지하는 아데노신 탈아미노효소 기능성 변이체, 예를 들면 천연 ADAR 또는 그것의 상동 단백질을 하나 이상의 위치 돌연변이로 변형시켜 얻어지고 아데노신 탈아미노효소 활성을 유지하는 변이체이다. 특정 실시형태에 있어서, 아데노신 탈아미노효소는 ADAR 촉매 도메인, 또는 ADAR 동종 단백질 촉매 도메인, 또는 아데노신 탈아미노효소 기능성 변이체를 포함하는 융합 단백질이다. 특정 실시형태에 있어서, ADAR 단백질 촉매 도메인을 포함하는 융합 단백질은 돌연변이 후에 촉매 활성을 상실하는 Cas13 단백질 및 ADAR 기능성 도메인, 또는 ADAR 동종 단백질 기능성 도메인, 또는 아데노신 탈아미노효소 기능성 변이체를 포함하는 융합 단백질이다. 일부 실시형태에 있어서, 아데노신 탈아미노효소 활성을 갖는 탈아미노효소는 외인성으로 숙주세포 내로 도입되거나 탈아미노효소를 인코딩하는 컨스트럭트를 도입함으로써 숙주세포에서 발현된다. 특정 실시형태에 있어서, ADAR 단백질 촉매 도메인을 포함하는 융합 단백질은 λN 펩티드 및 ADAR 기능성 도메인, 또는 ADAR 동종 단백질 촉매 도메인, 또는 아데노신 탈아미노효소 기능성 변이체를 포함하는 융합 단백질이다. 특정 실시형태에 있어서, ADAR 단백질 촉매 도메인을 포함하는 융합 단백질은 SNAP-tag-표지된 ADAR, 또는 SNAP-tag-표지된 ADAR 기능성 변이체이다. 특정 실시형태에 있어서, ADAR은 ADAR1 및/또는 ADAR2이다. 일부 실시형태에 있어서, ADAR은 hADAR1, hADAR2, 마우스 ADAR1 및 마우스 ADAR2로 이루어지는 군으로부터 선택된 하나 이상의 ADAR이다.
특정 실시형태에 있어서, ADAR은 숙주세포에 의해 발현된다. 특정 실시형태에 있어서, ADAR은 숙주세포에서 자연적으로 또는 내인성으로 발생하며, 예를 들면 ADAR은 진핵세포에서 자연적으로 또는 내인성으로 발생한다. 특정 실시형태에 있어서, ADAR 단백질은 숙주세포 내로 외인성으로 도입된다. 특정 실시형태에 있어서, ADAR 또는 ADAR을 인코딩하는 컨스트럭트는 숙주세포 내로 도입된다. 일부 실시형태에 있어서, 컨스트럭트는 선형 핵산, 플라스미드, 벡터 등을 포함하지만 이에 한정되지 않는다. 상기 방법에서, ADAR은 천연 ADAR 및 그것의 상동 단백질, 변형되지만 아데노신 탈아미노효소 활성을 유지하는 아데노신 탈아미노효소 기능성 변이체(예를 들면, 천연 ADAR 또는 그것의 상동 단백질을 하나 이상의 위치 돌연변이로 변형시켜 얻어지고 아데노신 탈아미노효소 활성을 유지하는 변이체), 또는 ADAR 촉매 도메인을 포함하는 융합 단백질, 또는 ADAR 상동 단백질 촉매 도메인, 또는 아데노신 탈아미노효소 기능성 변이체를 포함한다. 특정 실시형태에 있어서, ADAR 촉매 도메인 또는 ADAR 동종 단백질 촉매 도메인 또는 아데노신 탈아미노효소 기능성 변이체를 포함하는 융합 단백질은 표적화 도메인 및 ADAR 촉매 도메인 또는 ADAR 동종 단백질 촉매 도메인 또는 아데노신 탈아미노효소 기능성 변이체를 포함하는 융합 단백질이다. 특정 실시형태에 있어서, 표적화 도메인은 돌연변이 후에 촉매 활성을 상실하는 Cas13 단백질, λN 펩티드 및 SNAP-tag 중 임의의 하나를 포함하지만 이에 한정되지 않는다. 일부 실시형태에 있어서, ADAR은 hADAR1, hADAR2, 마우스 ADAR1 및 마우스 ADAR2로 이루어지는 군으로부터 선택된 하나 이상의 ADAR이다. 일부 실시형태에 있어서, 방법은 임의의 단백질을 숙주세포 내로 도입하는 단계를 포함하지 않는다. 특정 실시형태에 있어서, ADAR은 ADAR1 및/또는 ADAR2이다.
또 다른 양태에 있어서, 본 출원은 ADAR-리크루팅 RNA(arRNA) 또는 arRNA를 인코딩하는 컨스트럭트를 숙주세포 내로 도입하는 단계를 포함하는, 숙주세포의 표적 잔기 위치에 표적 RNA를 편집하는 방법을 제공하며, 여기에서 arRNA는 표적 RNA에 혼성화하는 상보적 RNA 시퀀스를 포함하고, 표적 잔기는 표적 RNA에서 표적 잔기의 5' 최근접 이웃 잔기(업스트림 잔기), 표적 잔기 및 표적 RNA에서 표적 잔기의 3' 최근접 이웃 잔기(다운스트림 잔기)를 포함하는 3-염기 모티프에 위치하고, 표적 잔기는 시티딘(C)이며; 여기에서 상보적 RNA 시퀀스는 표적 RNA에서 업스트림 잔기 및/또는 다운스트림 잔기에 정반대되는 불일치를 포함하고, 상기 방법은 시티딘 탈아미노효소 활성을 갖는 탈아미노효소 또는 시티딘 탈아미노효소 또는 탈아미노효소를 인코딩하는 컨스트럭트를 숙주세포 내로 도입하는 단계를 추가로 포함한다. 일부 실시형태에 있어서, 시티딘 탈아미노효소 활성을 갖는 탈아미노효소는 ADAR 단백질 또는 ADAR 촉매 도메인을 포함하는 융합 단백질의 유전자 변형에 의해 얻어지는 C-to-U 촉매 활성을 갖는 탈아미노효소이다. 일부 실시형태에 있어서, 시티딘 탈아미노효소 활성을 갖는 탈아미노효소는 표적화 도메인을 추가로 포함한다.
일부 실시형태에 있어서, 표적 시티딘이 위치하는 3-염기 모티프는: GCG, GCC, GCA, GCU, ACG, ACC, ACA, ACU, CCG, CCC, CCA, CCU, UCA, UCC, UCU 및 UCG로 이루어지는 군으로부터 선택되는 어느 하나이다. 일부 실시형태에 있어서, arRNA는 표적 RNA에서 표적 잔기에 상응하는 위치에 언페어링된 뉴클레오티드를 포함하여 표적 잔기와 불일치를 형성한다. 일부 실시형태에 있어서, 표적 RNA에 혼성화할 수 있는 arRNA에서 상보적 RNA 시퀀스는 표적 RNA에서 표적 시티딘에 정반대되는 시티딘, 아데노신 또는 우리딘을 포함한다. 특정 실시형태에 있어서, 상보적 RNA 시퀀스는 표적 시티딘에 정반대되는 시티딘을 포함한다. 특정 실시형태에 있어서, arRNA는 표적 RNA에서 비표적 편집 위치에 상응하는 위치에 하나 이상의 언페어링된 뉴클레오티드를 포함하여 표적 RNA에서 비표적 위치와 하나 이상의 불일치를 형성한다. 3-염기 모티프에서 표적 잔기에 반대되는 단일 불일치가 있는 경우 및 3-염기 모티프에서 잔기의 다수 불일치가 있는 경우의 시티딘-to-우리딘 편집 효율을 실시예 4에서 각각 테스트되고, 결과는 도 22에 나타낸다. 3-염기 모티프에서 업스트림 잔기가 A 또는 U인 경우에, 다수 불일치가 있는 경우의 편집 효율은 표적 잔기의 단일 불일치인 경우의 편집 효율과 동등한 반면에, 3-염기 모티프에서 업스트림 잔기가 G인 경우에, 표적 잔기의 단일 불일치가 있는 경우의 편집 효율은 매우 낮고, 더 많은 불일치를 도입함으로써 C-to-U 편집 효율을 상당히 향상시킬 수 있다. 따라서, 일부 실시형태에 있어서, 3-염기 모티프의 업스트림 잔기는 G이고, 상보적 RNA 시퀀스는 업스트림 잔기에 정반대되는 G를 포함한다. 일부 실시형태에 있어서, 3-염기 모티프는 ACA이고, 상보적 RNA 시퀀스는 3-염기 모티프에 반대되는 AUU 또는 GUU를 포함한다. 일부 실시형태에 있어서, 3-염기 모티프는 ACA이고, 상보적 RNA 시퀀스는 바람직하게는 3-염기 모티프에 반대되는 AUU를 포함한다. 일부 실시형태에 있어서, 3-염기 모티프는 UCA이고, 상보적 RNA 시퀀스는 3-염기 모티프에 반대되는 AUA, GUA 또는 CUA를 포함한다. 일부 실시형태에 있어서, 3-염기 모티프는 UCA이고, 상보적 RNA 시퀀스는 바람직하게는 3-염기 모티프에 반대되는 AUA를 포함한다. 특정 실시형태에 있어서, 3-염기 모티프는 GCA이고, 상보적 RNA 시퀀스는 3-염기 모티프에 반대되는 UUG 또는 UCG를 포함한다. 일부 실시형태에 있어서, 3-염기 모티프는 GCA이고, 상보적 RNA 시퀀스는 바람직하게는 3-염기 모티프에 반대되는 UUG를 포함한다. 일부 실시형태에 있어서, 3-염기 모티프는 CCA이고, 상보적 RNA 시퀀스는 3-염기 모티프에 반대되는 AUG를 포함한다. 특정 실시형태에 있어서, 표적 RNA에서 3-염기 모티프의 표적 잔기는 시티딘이고, 3-염기 모티프에서 업스트림 잔기는 G, C, A 및 U로부터 선택되는 뉴클레오티드이고, 바람직한 순서는 다음과 같다: G>C>A≒U.
일부 실시형태에 있어서, arRNA는 표적 RNA에서 표적 시티딘(C)을 탈아민화하고 우리딘으로 전환시키도록, 표적 RNA에 대한 시티딘 탈아미노효소 활성을 갖는 탈아미노효소를 리크루팅한다. 시티딘 탈아미노효소는 변형(예를 들면, 하나 이상의 위치에 아미노산의 결실 또는 돌연변이) 후에 시티딘 탈아미노화 활성을 갖는 시티딘 탈아미노효소 또는 그것의 상동 단백질 변이체이다. 특정 실시형태에 있어서, 변형 후에 시티딘 탈아미노화 활성을 갖는 시티딘 탈아미노효소는 종래 기술에 개시된 것을 포함하며, 예를 들면 Abudayyeh et al., 2019에 개시된 시티딘 탈아미노화 활성을 갖는 하나 이상의 돌연변이 시티딘 탈아미노효소 단편을 포함한다. 특정 실시형태에 있어서, 변형 후에 시티딘 탈아미노화 활성을 갖는 시티딘 탈아미노효소는 E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T로부터 선택되는 하나 이상의 돌연변이를 포함하는 ADAR2이다. 특정 실시형태에 있어서, 변형 후에 시티딘 탈아미노화 활성을 갖는 시티딘 탈아미노효소는 이하의 돌연변이체: E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T 모두를 포함하는 ADAR2이다. 특정 실시형태에 있어서, 시티딘 탈아미노효소는 이하의 돌연변이체: E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T 모두를 포함하는 ADAR2 촉매 도메인의 융합 단백질이다. 일부 실시형태에 있어서, 시티딘 탈아미노효소 활성을 갖는 탈아미노효소는 표적화 도메인을 추가로 포함한다. 특정 실시형태에 있어서, 표적화 도메인은 돌연변이 후에 촉매 활성을 상실하는 Cas13 단백질, λN 펩티드 및 SNAP-tag 중 임의의 하나를 포함하지만 이에 한정되지 않는다.
특정 실시형태에 있어서, 상기 방법은 시티딘 탈아미노효소 또는 융합 단백질, 또는 시티딘 탈아미노효소를 인코딩하는 컨스트럭트 또는 융합 단백질을 숙주세포 내로 도입하는 단계를 포함한다. 특정 실시형태에 있어서, 컨스트럭트는 선형 핵산, 플라스미드, 벡터 등을 포함하지만 이에 한정되지 않는다.
본 출원의 상기 방법에 따르면, arRNA는 단일가닥 RNA이다. 일부 실시형태에 있어서, 상보적 RNA 시퀀스는 완전히 단일가닥이다. 특정 실시형태에 있어서, arRNA는 하나 이상(예를 들면, 1, 2, 3개 이상)의 이중가닥 영역, 및/또는 하나 이상의 스템-루프 영역을 포함한다. 특정 실시형태에 있어서, arRNA는 상보적 RNA 시퀀스만으로 이루어진다.
본 출원의 방법에 따르면, 일부 실시형태에 있어서, 상보적 RNA 시퀀스는 표적 시퀀스에 상응하는 2개 이상의 불일치를 포함한다. 일부 실시형태에 있어서, 상보적 RNA 시퀀스는 3-연속 상보적 염기 이외에 표적 시퀀스에 상응하는 하나 이상의 불일치를 포함한다. 일부 실시형태에 있어서, 상보적 RNA 시퀀스가 표적 시퀀스에 혼성화될 때, 하나 이상의 워블 염기쌍이 형성될 수 있다. 일부 실시형태에 있어서, 상보적 RNA 시퀀스가 표적 시퀀스에 혼성화될 때, 하나 이상의 단독 돌출부가 형성될 수 있다. 일부 실시형태에 있어서, 상보적 RNA 시퀀스가 표적 시퀀스에 혼성화될 때, 하나 이상의 워블 염기쌍 및 하나 이상의 단독 돌출부가 형성될 수 있다.
본 출원의 방법에 따르면, 일부 실시형태에 있어서, arRNA는 약 20-260 뉴클레오티드의 길이를 가지며, 예를 들면 arRNA는 약 30, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 105, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 또는 그 이상의 뉴클레오티드 중 어느 하나 이하의 길이를 갖는다. 특정 실시형태에 있어서, 상보적 RNA 시퀀스는 40-260, 45-250, 50-240, 60-230, 65-220, 70-220, 70-210, 70-200, 70-190, 70-180, 70-170, 70-160, 70-150, 70-140, 70-130, 70-120, 70-110, 70-100, 70-90, 70-80, 75-200, 80-190, 85-180, 90-170, 95-160, 100-200, 100-150, 100-175, 110-200, 110-175, 110-150, 또는 105-140 뉴클레오티드 중 어느 하나의 길이를 갖는다. 일부 실시형태에 있어서, arRNA는 약 60-200(예를 들면, 약 60-150, 65-140, 68-130, 또는 70-120 중 임의의 하나) 뉴클레오티드의 길이를 갖는다. 일부 실시형태에 있어서, arRNA는 ADAR-리크루팅 도메인을 추가로 포함한다.
본 출원의 방법에 따르면, 일부 실시형태에 있어서, arRNA는 하나 이상의 화학적 변형을 포함한다. 일부 실시형태에 있어서, 화학적 변형은 메틸화 및/또는 인산화, 예를 들면 2'-O-메틸화(2'-O-Me) 및/또는 뉴클레오티드간 인산화 결합을 포함한다. 특정 실시형태에 있어서, arRNA의 첫 번째 및 마지막 3 또는 5개의 뉴클레오티드는 2'-O-Me 변형을 포함하고/또는 첫 번째와 마지막 3 또는 5개의 뉴클레오티드 사이의 연결은 인산화 결합 변형을 포함한다. 특정 실시형태에 있어서, arRNA에서 하나 이상 또는 모든 우리딘은 2'-O-Me 변형을 포함한다. 특정 실시형태에 있어서, arRNA에서 표적화 뉴클레오시드 및/또는 표적화 뉴클레오시드의 5'-말단 및/또는 3'-말단에 인접한 뉴클레오시드(예를 들면, 표적화 뉴클레오시드의 5'-말단 및/또는 3'-말단에 직접 인접한 1 또는 2개의 뉴클레오시드)는 2'-O-Me 변형을 포함한다. 특정 실시형태에 있어서, arRNA에서 표적화 뉴클레오시드 및/또는 표적화 뉴클레오시드의 5'-말단 및/또는 3'-말단에 인접한 뉴클레오시드(예를 들면, 표적화 뉴클레오시드의 5'-말단 및/또는 3'-말단에 직접 인접한 1 또는 2개의 뉴클레오시드)는 3'-인산화 결합 변형을 포함한다. 특정 실시형태에 있어서, arRNA는 임의의 화학적 변형을 포함하지 않는다.
본 출원의 방법에 따르면, 일부 실시형태에 있어서 상기 표적 RNA는 메신저 RNA 전구체, 메신저 RNA, 리보솜 RNA, 전이 RNA, 긴 논코딩 RNA 및 작은 RNA로부터 선택되는 RNA이다. 일부 실시형태에 있어서, 본 출원의 방법에 따르면, 표적 RNA에서 표적 잔기는 편집되어 표적 RNA에서 미스센스 돌연변이, 조기 종결 코돈, 비정상적 스플라이싱 또는 선택적 스플라이싱을 초래하거나, 대안적으로 표적 RNA에서 미스센스 돌연변이, 조기 종결 코돈, 비정상적 스플라이싱 또는 선택적 스플라이싱을 반전시킨다. 일부 실시형태에 있어서, 본 출원의 방법에 따르면, 표적 RNA에서 표적 잔기는 편집되어 표적 RNA에 의해 인코딩되는 단백질의 포인트 돌연변이, 절단, 연장 및/또는 미스폴딩을 초래하거나, 대안적으로 표적 RNA에서 미스센스 돌연변이, 조기 종결 코돈, 비정상적 스플라이싱 또는 선택적 스플라이싱을 반전시킴으로써 기능성, 전장, 정확한 폴드 및/또는 야생형 단백질을 얻는다.
본 출원의 방법에 따르면, 일부 실시형태에 있어서, 숙주세포는 진핵세포이다. 특정 실시형태에 있어서, 숙주세포는 포유동물 세포이다. 특정 실시형태에 있어서, 숙주세포는 인간 또는 마우스 세포이다.
본 출원에 따른 숙주세포의 표적 잔기 위치에 표적 RNA를 편집하는 임의의 방법에 의해, 편집된 RNA 또는 편집된 RNA를 포함하는 숙주세포가 생성될 수 있다. 따라서, 본 출원은, 본 출원에 따른 표적 RNA 편집 방법에 의해 생산된 편집된 RNA 또는 편집된 RNA를 포함하는 숙주세포를 추가로 제공한다.
본 출원에 따른 숙주세포의 표적 잔기 위치에 표적 RNA를 편집하는 방법은 개체에서 질환 또는 상태를 치료 또는 예방하기 위해 적용될 수 있다. 따라서, 본 출원은 개체에서 질환 또는 상태를 치료 또는 예방하는 방법을 추가로 제공하며, 이는 본 출원에 따라 상술한 숙주세포의 표적 잔기 위치에 표적 RNA를 편집하는 임의의 방법에 의해 개체 세포에서 질환 또는 상태와 관련된 표적 RNA를 편집하는 단계를 포함한다. 일부 실시형태에 있어서, 질환 또는 상태는 유전성 유전자 질환, 또는 하나 이상의 후천적 유전자 돌연변이(예를 들면, 약물 내성)와 관련된 질환 또는 상태이다.
본 출원은 표적 RNA에 혼성화하는 상보적 RNA 시퀀스를 포함하는, 표적 RNA의 표적 잔기를 탈아미노화하도록, RNA에 작용하는 탈아미노효소를 리크루팅을 위한 본 출원의 방법에 적용될 수 있는 RNA(arRNA)를 추가로 제공하며, 여기에서 표적 잔기는 표적 RNA에서 표적 잔기의 5' 최근접 이웃 잔기(업스트림 잔기), 표적 잔기 및 표적 RNA에서 표적 잔기의 3' 최근접 이웃 잔기(다운스트림 잔기)를 포함하는 3-염기 모티프에 위치하고, 여기에서 3-염기 모티프는 UAG가 아니며, 상보적 RNA 시퀀스는 표적 RNA에서 업스트림 잔기 및/또는 다운스트림 잔기에 정반대되는 불일치를 포함한다.
본 출원의 arRNA에 따르면, 일부 실시형태에 있어서, 표적 RNA의 3-염기 모티프에서 표적 잔기(arRNA에 의해 표적화됨)는 아데노신이며, 여기에서 표적 RNA에서 업스트림 잔기는 G, C, A 및 U로부터 선택되는 뉴클레오티드이며, 바람직한 순서는 다음과 같다: G>C≒A>U. 일부 실시형태에 있어서, 3-염기 모티프는 GAG, GAC, GAA, GAU, AAG, AAC, AAA, AAU, CAG, CAC, CAA, CAU, UAA, UAC 및 UAU로 이루어지는 기로부터 선택된다. 특정 실시형태에 있어서, arRNA는 표적 RNA에서 표적 아데노신에 정반대되는 시티딘(C), 아데노신(A) 또는 우리딘(U)을 포함한다. 일부 특정 실시형태에 있어서, arRNA는 표적 RNA에서 표적 아데노신에 정반대되는 C를 포함한다. 특정 실시형태에 있어서, 표적 RNA에 혼성화하는 arRNA는 표적 RNA에서 비표적 아데노신에 각각 반대되는 하나 이상의 불일치를 추가로 포함한다. 특정 실시형태에 있어서, 하나 이상의 비표적 아데노신에 반대되는 불일치는 구아노신이다. 일부 실시형태에 있어서, 3-염기 모티프에서 업스트림 잔기는 G이고, 상보적 RNA에서 업스트림 잔기에 반대되는 염기는 G 또는 A이다. 특정 실시형태에 있어서, 3-염기 모티프는 GAU이고, arRNA에 포함된 3-연속 상보적 염기(3-염기 모티프에 정반대)는 ACG 또는 ACA이다. 특정 실시형태에 있어서, 3-염기 모티프는 GAU이고, arRNA에 포함된 3-연속 상보적 염기(3-염기 모티프에 정반대)는 ACG이다. 특정 실시형태에 있어서, 3-염기 모티프는 GAA이고, arRNA에 포함된 3-연속 상보적 염기(3-염기 모티프에 정반대)는 UCA, CCG, CCC 또는 UCC이다. 특정 실시형태에 있어서, 3-염기 모티프는 GAA이고, arRNA에 포함된 3-연속 상보적 염기(3-염기 모티프에 정반대)는 UCA이다. 특정 실시형태에 있어서, 3-염기 모티프는 GAC이고, arRNA에 포함된 3-연속 상보적 염기(3-염기 모티프에 정반대)는 GCG 또는 GCA이다. 특정 실시형태에 있어서, 3-염기 모티프는 GAC이고, arRNA에 포함된 3-연속 상보적 염기(3-염기 모티프에 정반대)는 GCG이다. 특정 실시형태에 있어서, 3-염기 모티프는 GAG이고, arRNA에 포함된 3-연속 상보적 염기(3-염기 모티프에 정반대)는 CCG, CCA, CCC, UCC 또는 UCG이다. 특정 실시형태에 있어서, 3-염기 모티프는 GAG이고, arRNA에 포함된 3-연속 상보적 염기(3-염기 모티프에 정반대)는 CCG이다. 특정 실시형태에 있어서, arRNA는 표적 RNA에서 비표적 아데노신에 각각 반대되는 하나 이상의 불일치를 포함한다.
본 출원의 arRNA에 따르면, 일부 실시형태에 있어서, 상기 표적 RNA의 3-염기 모티프에서 표적 잔기(arRNA에 의해 표적됨)는 시티딘(C)일 수 있으며, 이를 표적 시티딘이라 지칭한다. 특정 실시형태에 있어서, 3-염기 모티프에서 업스트림 잔기는 G, C, A 및 U로부터 선택되는 뉴클레오티드이고, 바람직한 순서는 다음과 같다: G>C>A≒U. 특정 실시형태에 있어서, 표적 시티딘이 위치하는 3-염기 모티프는 GCG, GCC, GCA, GCU, ACG, ACC, ACA, ACU, CCG, CCC, CCA, CCU, UCA, UCC, UCU 및 UCG로 이루어지는 군으로부터 선택된 임의의 하나이다. 특정 실시형태에 있어서, 3-염기 모티프에서 업스트림 잔기는 G이고, 상보적 RNA에서 업스트림 잔기에 반대되는 염기는 G이다. 일부 실시형태에 있어서, 3-염기 모티프에서 다운스트림 잔기는 A이고, 염기는 상보적 RNA에서 다운스트림 잔기에 반대되는 염기는 U 또는 A이다. 일부 실시형태에 있어서, 3-염기 모티프는 ACA이고, 상보적 RNA 시퀀스는 3-염기 모티프에 반대되는 AUU 또는 GUU를 포함한다. 일부 실시형태에 있어서, 3-염기 모티프는 ACA이고, 상보적 RNA 시퀀스는 3-염기 모티프에 반대되는 AUU를 포함한다. 일부 실시형태에 있어서, 3-염기 모티프는 UCA이고, 상보적 RNA 시퀀스는 3-염기 모티프에 반대되는 AUA, GUA 또는 CUA를 포함한다. 일부 실시형태에 있어서, 3-염기 모티프는 UCA이고, 상보적 RNA 시퀀스는 3-염기 모티프에 반대되는 AUA를 포함한다. 일부 실시형태에 있어서, 3-염기 모티프는 GCA이고, 상보적 RNA 시퀀스는 3-염기 모티프에 반대되는 UUG 또는 UCG를 포함한다. 일부 실시형태에 있어서, 3-염기 모티프는 GCA이고, 상보적 RNA 시퀀스는 3-염기 모티프에 반대되는 UUG를 포함한다. 일부 실시형태에 있어서, 3-염기 모티프는 CCA이고, 상보적 RNA 시퀀스는 3-염기 모티프에 반대되는 AUG를 포함한다. 특정 실시형태에 있어서, arRNA는 표적 RNA에서 표적 잔기에 상응하는 위치에 언페어링된 뉴클레오티드를 포함하여 표적 잔기와 불일치를 형성한다. 특정 실시형태에 있어서, 표적 RNA에 혼성화할 수 있는 arRNA의 상보적 RNA 시퀀스는 표적 RNA에서 표적 시티딘에 정반대되는 시티딘, 아데노신 또는 우리딘을 포함한다. 특정 실시형태에 있어서, 상보적 RNA 시퀀스는 표적 시티딘에 정반대되는 시티딘을 포함한다. 특정 실시형태에 있어서, arRNA는 표적 RNA에서 비표적 편집 위치에 상응하는 위치에 하나 이상의 언페어링된 뉴클레오티드를 포함하여 표적 RNA에서 비표적 위치와 하나 이상의 불일치를 형성한다.
본 출원의 arRNA에 따르면, 일부 실시형태에 있어서, arRNA는 단일가닥 RNA이다. 일부 실시형태에 있어서, 상보적 RNA 시퀀스는 완전히 단일가닥이다. 특정 실시형태에 있어서, arRNA는 하나 이상(예를 들면, 1, 2, 3개 이상)의 이중가닥 영역 및 하나 이상의 스템-루프 영역을 포함한다. 특정 실시형태에 있어서, arRNA는 하나 이상(예를 들면, 1, 2, 3개 이상)의 이중가닥 영역을 포함한다. 특정 실시형태에 있어서, arRNA는 하나 이상(예를 들면, 1, 2, 3개 이상) 스템-루프 영역을 포함한다. 특정 실시형태에 있어서, arRNA는 ADAR 효소 리크루팅을 위한 분자내 스템-루프 구조를 형성할 수 있는 영역을 포함한다. 특정 실시형태에 있어서, arRNA는 ADAR 효소를 리크루팅하기 위한 분자내 스템-루프 구조를 형성할 수 있는 영역을 포함하지 않는다. 특정 실시형태에 있어서, arRNA는 상보적 RNA 시퀀스만으로 이루어진다.
본 출원의 arRNA에 따르면, 일부 실시형태에 있어서, 상보적 RNA 시퀀스가 표적 시퀀스에 혼성화되면 하나 이상의 워블 염기쌍이 형성될 수 있다. 일부 실시형태에 있어서, 상보적 RNA 시퀀스가 표적 시퀀스에 혼성화될 때, 하나 이상의 단독 돌출부가 형성될 수 있다. 일부 실시형태에 있어서, 상보적 RNA 시퀀스가 표적 시퀀스에 혼성화될 때, 하나 이상의 워블 염기쌍 및 하나 이상의 단독 돌출부가 형성될 수 있다.
본 출원의 arRNA에 따르면, 일부 실시형태에 있어서, arRNA는 약 20-260 뉴클레오티드의 길이를 가지며, 예를 들면 arRNA는 약 30, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 105, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 또는 그 이상의 뉴클레오티드 중 어느 하나 이하의 길이를 갖는다. 특정 실시형태에 있어서, 상보적 RNA 시퀀스는 40-260, 45-250, 50-240, 60-230, 65-220, 70-220, 70-210, 70-200, 70-190, 70-180, 70-170, 70-160, 70-150, 70-140, 70-130, 70-120, 70-110, 70-100, 70-90, 70-80, 75-200, 80 -190, 85-180, 90-170, 95-160, 100-200, 100-150, 100-175, 110-200, 110-175, 110-150, 또는 105-140 뉴클레오티드 중 어느 하나의 길이를 갖는다. 일부 실시형태에 있어서, arRNA는 약 60-200(예를 들면, 약 60-150, 65-140, 68-130, 또는 70-120 중 임의의 하나) 뉴클레오티드의 길이를 갖는다. 일부 실시형태에 있어서, arRNA는 ADAR-리크루팅 도메인을 추가로 포함한다.
본 출원의 arRNA에 따르면, 일부 실시형태에 있어서, arRNA는 하나 이상의 화학적 변형을 포함한다. 일부 실시형태에 있어서, 화학적 변형은 메틸화 및/또는 인산화, 예를 들면 2'-O-메틸화(2'-O-Me) 및/또는 뉴클레오티드간 인산화 결합을 포함한다. 특정 실시형태에 있어서, arRNA에서 첫 번째 및 마지막 3 또는 5개의 뉴클레오티드는 2'-O-Me 변형을 포함하고/또는 첫 번째와 마지막 3 또는 5개의 뉴클레오티드 사이의 연결은 인산화 결합 변형을 포함한다. 특정 실시형태에 있어서, arRNA에서 하나 이상 또는 모든 우리딘은 2'-O-Me 변형을 포함한다. 특정 실시형태에 있어서, arRNA에서 표적화 뉴클레오시드 및/또는 표적 뉴클레오시드의 5'-말단 및/또는 3'-말단에 인접한 뉴클레오시드(예를 들면, 표적화 뉴클레오시드의 5'-말단 및/또는 3'-말단에 직접 인접한 1 또는 2개의 뉴클레오시드)는 2'-O-Me 변형을 포함한다. 특정 실시형태에 있어서, arRNA에서 표적화 뉴클레오시드 및/또는 표적화 뉴클레오시드의 5'-말단 및/또는 3'-말단에 인접한 뉴클레오시드(예를 들면, 표적화 뉴클레오시드의 5'-말단 및/또는 3'-말단에 직접 인접한 1 또는 2개의 뉴클레오시드)는 3'-인산화 결합 변형을 포함한다. 특정 실시형태에 있어서, arRNA는 임의의 화학적 변형을 포함하지 않는다.
본 출원은, 본 출원에 따라 상기 기재된 임의의 arRNA를 포함하는 바이러스 벡터, 플라스미드 또는 선형 핵산쇄를 추가로 제공하고, arRNA는 임의의 화학적 변형을 포함하지 않는다. 본 출원은, 본 출원에 따라 상기 기재된 임의의 arRNA, 또는 본 출원에 따라 상기 기재된 임의의 바이러스 벡터, 플라스미드 또는 선형 핵산쇄를 포함하는 라이브러리를 추가로 제공한다. 본 출원은, 본 출원에 따라 상기 기재된 임의의 arRNA, 또는 본 출원에 따라 상기 기재된 임의의 바이러스 벡터, 플라스미드 또는 선형 핵산쇄를 포함하는 조성물을 추가로 제공한다. 본 출원은, 본 출원에 따라 상기 기재된 임의의 arRNA, 또는 본 출원에 따라 상기 기재된 임의의 바이러스 벡터, 플라스미드 또는 선형 핵산쇄를 포함하는 숙주세포를 추가로 제공한다. 일부 실시형태에 있어서, 본 출원에 따라 상기 기술된 임의의 arRNA를 포함하는 숙주세포는 진핵세포이다.
실시예
LEAPER의 기술적 경로(WO2020074001A1)를 참조하면, 표적 아데노신(A)을 포함하는 표적 RNA에 부분적으로 또는 완전히 상보적인 작은 arRNA 단편이 외인성으로 도입되고, RNA는 표적 A 상에 A-to-I 편집을 수행하기 위해 내인성 ADAR을 리크루팅하는 데 사용된다. arRNA는 시험관내에 합성되고 길이는 71-111nt이다. 도 4에 나타낸 바와 같이, ADAR 단백질 또는 ADAR 기능성 도메인(예를 들면, LEAPER)을 사용하여 기존 편집 기술에서 사용되는 ADAR 단백질 리크루팅 RNA와 비교하여, 본 출원에서 사용된 arRNA에서 3-염기 모티프(표적 시퀀스에서 3-염기 모티프에 정반대)는 3-염기 모티프에 대해, 즉 표적 A에 반대되는 불일치 이외에 약한 상보성을 갖고, arRNA에서 3-염기(3-염기 모티프에 정반대)는 업스트림 잔기 및/또는 다운스트림 잔기와 불일치된 염기를 추가로 포함한다. 이러한 변화는 3-연속 염기 선호도를 돌파하여, 기존 및 향후 ADAR 기반 편집 방법에 의해 G의 업스트림 잔기를 가진 3-염기 모티프 또는 UAG 이외의 3-염기 모티프에 대해 보다 자유롭고 효율적인 편집을 수행할 수 있다.
실시예 1: 3-염기 모티프 리포터 시스템 및 상응하는 arRNA의 구축
우선, 16개의 3-염기 모티프로 이루어지는 리포터 시스템을 구축하였다. LEAPER 관련 문서에서, UAG의 3-염기 모티프에 대한 편집 효율 사이의 차이를 테스트하였다(Qu et al., 2019). 본 실시예에 있어서, 도 5에 나타낸 바와 같이 대조군의 일관성을 유지하기 위해서 편집 위치를 제외하고 arRNA와 상보적으로 페어링된 뉴클레오시드를 상기 LEAPER 관련 문헌의 시퀀스과 동일하게 설계하였다. 원래 플라스미드 리포터 1은 베이징대학교 생명과학대학의 Wei Wensheng 교수에 의해 기증되었다. 플라스미드 프로파일은 도 14에 나타내고, 플라스미드는 표 4에 나타낸 시퀀스를 포함한다. 표 1에 나타낸 16개의 3-염기 모티프와 관련된 프라이머를 합성하고, PCR 증폭(Q5® High-Fidelity 2X Master Mix, NEB M0492L), 효소 소화(XbaI, NEB R0145L; AscI, NEB R0558L), 아가로스겔을 사용한 회수(Seakem LE agarose, Lonza 5502; GeneJET Gel Extraction and DNA Cleanup Micro Kit, Thermo Fisher K0832) 및 어셈블리(NEBuilder® HiFi DNA Assembly Master Mix, NEB E2621L)는 당업계의 연구자들에게 잘 알려져 있는 J. Sambrook and M. R. Green, Molecular Cloning: a Laboratory Manual(4th Edition, 2017)에 기재된 방법에 의해 수행되었으며, 표 2에 나타낸 물질을 사용하여, 증폭 생성물을 리포터 1에 어셈블링하여 리포터 1의 원래 표적 RNA 인코딩 시퀀스를 대체한 다음, 리포터 1을 컴피턴트 세포(Trans1-T1 Phage Resistant Chemically Competent Cell, TransGen CD501-02)로 형질전환하고 클론을 다음날 시퀀싱하기 위해 선정하였다. 플라스미드는 올바른 시퀀싱 결과를 가진 클론으로부터 추출되었으며, 렌티바이러스로 패키징되었다. 293T 세포는 각각 상이한 3-염기 모티프 인코딩 유전자로 패키징된 이들 렌티바이러스로 감염되었다. 48시간 동안 감염시킨 후, 상이한 3-염기 모티프를 포함하는 mRNA(표적 RNA)를 각각 전사할 수 있는 16종의 293T 세포, 즉 최종 3-염기 모티프 리포터 시스템 세포를 얻었고, 이를 표 2에 나타낸 3-염기 모티프로 명명하였다.
arRNA에서 불일치(3-염기 모티프에서 업스트림 잔기 및/또는 다운스트림 잔기에 반대)가 특정 3-염기 모티프에서 편집 효율을 향상시킬 수 있는지의 여부를 검출하기 위해서, 16종의 arRNA를 화학적으로 합성하였고, 설계 원리는 다음과 같다: mRNA의 3-염기 모티프에서 표적 A에 인접한 3'-다운스트림 55nt 및 5'-업스트림 25nt를 포함하는 RNA 단편에 역상보적 단일가닥 RNA를 취하였으며, 여기에서 3-염기 모티프에서 표적 A에 반대되는 염기는 C이다. arRNA에서 다른 염기를 변화없이 유지한 경우, 업스트림 잔기에 상응하는 염기와 다운스트림 잔기에 상응하는 염기는 각각 A, C, G, 및 U로부터 선택되었고, 16(4×4=16)종의 arRNA는 업스트림 잔기에 상응하는 4개의 염기와 다운스트림 잔기에 상응하는 다른 4개의 염기를 조합하여 얻었다. 특정 시퀀스를 표 3에 나타내었다.
실시예 2: GFP-양성세포의 비율에 기초한 UAG의 3-염기 모티프에 대한 상이한 arRNA의 편집 효율 비교
도 5에 나타낸 바와 같이, 실시예 1에서 16종의 표적 RNA 각각은 표적 시퀀스의 3'-말단에 녹색 형광 단백질(GFP) 핵산 시퀀스를 갖는다. 시퀀스는 정상적인 조건 하에서 녹색 형광을 방출하는 GFP로 올바르게 변환될 수 있다. 그러나, 3-염기 모티프가 UAG인 경우에는 UAG가 종료 코돈이므로, 이 위치에 번역이 종료되어 GFP로 번역될 수 없다. 본 실시예에 있어서, LEAPER 시스템을 사용하여 UAG의 3-염기 모티프에서 A를 편집하였다. A가 성공적으로 편집되면, UAG는 UIG로 변환되고 UIG는 번역 과정에서 UGG로 인식되므로, 번역이 종료되지 않고 다운스트림 GFP가 정상적으로 번역될 수 있다. 따라서, GFP 양성세포의 비율에 따라 상이한 arRNA의 편집 효율을 대략적으로 결정할 수 있다.
본 연구의 모든 테스트에 있어서, RNAiMAX 시약(Invitrogen 13778150)을 사용하여 실시예 1의 16종의 arRNA를 각각 세포에 트랜스펙션시켰으며, 구체적인 과정는 다음과 같다.
I. 세포를 10% FBS(Vistech SE100-011)를 함유하는 DMEM(Hyclone SH30243.01)에서 배양하였다. 리포터 시스템 세포를 150000개 세포/웰의 밀도로 12-웰 플레이트로 이송하였다. 이 시점을 0시간으로 표시하였다.
II. 세포 통과 24시간 후, RNAiMAX 시약(Invitrogen 13778150)을 사용하여 12.5pmol의 arRNA를 각 웰로 이송하였다. 공급자의 지침에 따라 트랜스펙션을 수행하였다.
III. 세포 통과 72시간 후, 판크레아틴(Invitrogen 25300054)을 사용하여 각 웰의 세포를 분해하고, 유세포 분석기를 사용하여 FITC 채널 강도를 분석하였다.
세포는 UAG의 3-염기 모티프로 mRNA를 전사하는 293T 세포이었다. 세포를 arRNA와 함께 72시간(트랜스펙션 후 48시간) 동안 공배양한 후, 유세포 분석기를 사용하여 FITC 채널 강도를 분석하였다. 결과는 도 7에 나타내었고, UT는 트랜스펙션이 없는 대조군이고, Vech는 RNAiMAX 트랜스펙션 시약이 첨가되고 임의의 dRNA도 트랜스펙션되지 않은 대조군이다.
다음에, 이 실험을 반복하였다.
실험 결과는 도 8에 나타내었다. 첫 번째 실험에서, 건조 분말로서의 arRNA를 직접 용해시킨 후, 용해 후에 -80℃에서 보관하였다. 반복 실험에서, arRNA를 -80℃에서 한번 동결 및 해동을 수행하므로, 전체적인 효율은 감소하였으나 결과는 첫 번째 실험과 유사한 추세를 보였다. 특히, arRNARan은 랜덤 RNA 시퀀스과 함께 트랜스펙션된 대조군이다.
종래 기술에서, UAG의 3-염기 모티프에 대해 본 실시예와 유사한 리포터 시스템을 사용하여 LEAPER 시스템의 편집 효율을 도 9에 나타내었다(Qu et al., 2019). 도 9의 가로축에 대한 주석은 arRNA 시퀀스의 이름이며, 이는 도 7 또는 도 8의 가로축에 대한 이름의 첨자에 상당한다. 비교의 편의상, 도 7 또는 도 8의 arRNA는 도 9의 arRNA와 동일한 순서로 배열되어 있다. 화학적으로 합성된 arRNA는 본 실시예에 있어서 트랜스펙션에 사용되었고, 플라스미드는 도 9에서 트랜스펙션에 사용되므로, 본 실시예의 전체적인 편집 효율은 상대적으로 높지만 전체적인 경향은 도 9와 같다. 즉, 3-염기 모티프가 UAG인 경우 arRNA의 효율이 가장 높으며, arRNA에서 염기(표적 A에 상당)는 C이고 업스트림 잔기 U 및 다운스트림 잔기 G에 상응하는 다른 2개의 염기는 각각 U 및 G와 페어링되는 A 및 C이며, 즉 상응하는 arRNA는 arRNACCA이다. 그러나, 3-염기 모티프가 UAG인 경우 arRNA의 염기(각각 업스트림 잔기 U와 다운스트림 잔기 G에 상당)가 다른 언페어링된 염기일 때 arRNA의 편집 효율은 크게 향상되지 않고 감소한다.
본 실시예에 따른 UAG의 3-염기 모티프에 대한 편집의 연구 결과는 문헌에 보고된 것과 실질적으로 동일하고, 즉 UAG의 3-염기 모티프를 편집할 때, arRNA의 3-염기 효율은 arRNA에서 3-염기(3-염기 모티프에 상당)의 더 많이 불일치된 부분을 도입하여 개선시킬 수 없었다.
실시예 3: GAN의 3-염기 모티프에 대한 RNA 편집 효율
본 실시형태에 있어서는 UAG, GAA, GAU, GAC 및 GAG의 3-염기 모티프를 각각 포함하는 리포터 시스템 세포에 각각 16종의 arRNA를 트랜스펙션시켰으며, 트랜스펙션 과정은 실시예 2와 동일하였다.
72시간 후(트랜스펙션 48시간 후), TRIZOL을 사용하여 샘플을 수집하고 RNA(TRIzol Reagent, ambion REF15596026)를 추출하였다. 1㎍의 RNA를 20㎕의 역전사 시스템(TransScript® One-Step gDNA Removal and cDNA Synthesis SuperMix, TransGen AT311-02)으로 역전사하고, 1㎕의 역전사 생성물을 다음의 프라이머의 쌍을 사용하여 PCR 증폭을 수행하였다: ggagtgagtacggtgtgcGACGAGCTGTACAAGCTGCAGGG(SEQ ID NO: 1), 및 gagttggatgctggatggTGGTGCAGATGAACTTCAGGGTCAG(SEQ ID NO: 2)(소문자는 Hi-Tom 키트에서 요구하는 프라이머 어댑터를 나타냄), 라이브러리는 Hi-Tom 키트(Novogene, REF PT045)를 사용하여 구축하였다.
다음에, 이하의 과정에 따라 차세대 시퀀싱을 수행하고, 편집 위치에 대한 A->G 편집 효율을 분석하였다.
ⅰ. 일루미나 시퀀싱
구축된 시퀀싱 라이브러리는 NovaSeq6000 플랫폼에서 PE150에 의해 고처리량 시퀀싱을 수행하였다.
ii. 시퀀싱 데이터 처리
고처리량 시퀀싱으로 얻어진 로우 데이터는 fastp(v0.19.6)로 품질을 제어하여 저품질, 어댑터 시퀀스 또는 polyG를 갖는 시퀀스를 필터링하였다. 얻어진 고품질 시퀀싱 데이터는 BWA(v0.7.17-r1188) 소프트웨어를 사용하여 증폭된 표적 영역의 시퀀스와 비교하여 자체 개발된 분할 스크립트에 상응하는 바코드 시퀀스에 따라 각각의 샘플로 분할하고, SAMtools(v1.9)를 사용하여 BAM 파일 및 통계 비교 정보를 생성하는 형식 변환한 다음, 재배열 및 인덱싱을 수행하였다.
iii. 편집 효율 분석
모든 잠재적 RNA 편집 위치는 JACUSA(v1.3.0) 소프트웨어를 사용하여 감지되었으며, 사용된 파라미터는 call-1-a B,R,D,I,Y,M:4-C ACGT-c2-p1-P UNSTRANDED -Ru DirMult-CE이었다. 대조군과 처리된 샘플에 존재하는 고주파 포인트 돌연변이를 필터링한 후, A->G 돌연변이를 제외한 평균 돌연변이 빈도의 3배의 값을 임계값으로 하고, 편집 위치의 A->G 돌연변이 빈도 중 일부는 표적 A에서 G로의 돌연변이의 진정한 빈도로 취하였다.
UAG의 3-염기 모티프에 대한 실험 결과를 도 10에 나타내었다. 종래 기술에서 보고된 원리에 따라 설계된 arRNA 시퀀스의 편집 효율이 가장 높은 것, 즉 표적 잔기에 상응하는 위치에 단일 불일치를 포함하는 arRNACCA임을 분명히 알 수 있다. 결과는 이전 GFP 실험의 결과와 일치한다.
종래 기술의 편집 효율이 매우 낮은 GAN(N은 4개의 리보뉴클레오티드 중 어느 하나)의 3-염기 모티프에 대하여, 본 출원의 arRNA는 도 11에 나타낸 바와 같이 예상하지 못한 편집 효과를 달성한다. GAU에 대한 본 출원의 arRNA의 효율은 특히 병백하게 개선된다. mRNA 시퀀스에서 3-염기 모티프가 GAU인 경우, 종래 기술의 방법으로 설계된 arRNAACC의 편집 효율은 실질적으로 0이고 보고된 문헌과 일치한다. 그러나, 상보성이 감소하면 arRNA의 염기(3-염기 모티프에서 5' 업스트림 잔기 G에 반대)가 언페어링된 염기, 즉 C 이외의 염기이더라도, 예를 들면 arRNAACG를 사용할 때 편집 효율은 크게 향상될 수 있다. 도 11a에 나타낸 바와 같이, 편집 효율은 종래 기술의 고유 설계(arRNAACC)보다 10배 이상이며, 종래 기술에 따라 설계된 arRNAACC의 편집 효율은 매우 낮아 이전 보고서와 일치한다. 또한, GAU의 3-염기 모티프에 관하여, 3-염기 모티프에 대한 상보성을 적절하게 감소시킨 본 실시예의 arRNAACA, arRNACCU, arRNAUCC 등의 arRNA 설계는 종래 기술의 고유 설계(arRNAACC)보다 편집 효율이 높다. GAU의 3-염기 모티프에 관하여, arRNA에서 염기(표적 A에 반대)가 C인 경우 다운스트림 잔기에 반대되는 염기는 다운스트림 잔기 U에 상보적인 염기 A이고, 업스트림 잔기 G에 반대되는 염기가 불일치 염기 G(즉, arRNAACG)이며, 편집 효율은 가장 높다.
유사하게, GAC의 3-염기 모티프와 관하여, 3-염기 모티프에 대한 상보성을 적절하게 감소시킨 arRNA의 편집 효율은 예상외로 높다. 도 11c의 히스토그램에 나타낸 바와 같이, 종래 기술의 고유 원리에 따라 설계된 arRNAGCC의 편집 효율은 실질적으로 0인 반면에, 불일치가 더 많이 도입된 arRNAGCG 및 arRNAGCA의 편집 효율은 분명히 더 높다. 또한, GAC의 3-염기 모티프에 관하여, arRNA에서 염기(표적 A에 반대)가 C인 경우, 다운스트림 잔기에 반대되는 염기는 다운스트림 잔기 C에 상보적인 염기 G이고, 업스트림 잔기 G에 반대되는 염기가 불일치된 G(즉, arRNAGCG)이며, 효율은 가장 높다.
유사하게, GAG의 3-염기 모티프를 편집할 때(도 11b 참조), 종래 기술에서 고정 패턴에 따라 설계된 arRNACCC의 효율이 가장 높지 않은 반면에, 적절하게 감소된 상보성을 가진 RNACCG 및 arRNACCA의 편집 효율은 분명히 더 높다. 상술한 GAU 및 GAC의 3-염기 모티프와 유사하게, GAG의 3-염기 모티프에 관하여, arRNA에서 염기(표적 A의 반대)가 C인 경우 다운스트림 잔기에 반대되는 염기는 다운스트림 잔기 G에 상보적인 염기 C이고, 업스트림 잔기 G에 반대되는 염기는 불일치된 염기 G(즉, arRNACCG)이며, 효율은 가장 높다.
유사하게, GAA에 관하여, 종래 기술에서 고정된 패턴에 따라 설계된 arRNAUCC의 편집 효율은 높지 않은 반면에, arRNA에서 염기(표적 A에 반대)가 C인 경우 다운스트림 잔기 A에 반대되는 염기는 상보적인 염기 U이고, 업스트림 잔기 G에 반대되는 염기는 불일치된 염기 A(즉, arRNAUCA)이며, 편집 효율은 더 높다.
상기 결과를 추가로 확인하기 위해서, GAA, GAU, GAC 및 GAG의 3-염기 모티프를 각각 포함하는 mRNA에 대해 반복 실험을 수행하였다. 반복 실험에서, 각각의 특정 3-염기 모티프에 대해 3개의 arRNA 설계만 반복적으로 사용되었다.
1. 고유 기술에 따라 설계된 arRNA, 즉 표적 A에 반대되는 염기는 C이고, 다른 2개의 염기는 상보적인 염기쌍의 원리에 따라 설계되며, 이 경우 염기는 표적 A에 인접한 업스트림 잔기 G와 페어링된다.
2. 본 출원의 설계에 따르면, 표적 A에 인접한 업스트림 잔기 G와 페어링되는 염기는 A이다.
3. 본 출원의 설계에 따르면, 표적 A에 인접한 업스트림 잔기 G와 페어링되는 염기는 G이다.
도 13에 나타낸 바와 같이, 3-염기 모티프가 GAA, GAU, GAC 또는 GAG와 상관없이 표적 잔기 A에 인접한 업스트림 잔기 G와 페어링되는 염기가 A인 경우에 편집 효율은 어느 정도 향상되지만, 표적 잔기 A에 인접한 업스트림 잔기 G와 페어링되는 염기가 G인 경우에 편집 효율은 보통 가장 높다. 또한, 표적 잔기 A에 인접한 업스트림 잔기 G와 페어링되는 염기를 고유 기술의 C에서 G로 변경되는 경우에 상이한 3-염기 모티프에 대한 효율은 다음과 같이 향상되고: GAU>GAC≒GAA>GAG; 표적 잔기 A에 인접한 업스트림 잔기 G와 페어링되는 염기가 고유 기술의 C에서 A로 변경되는 동안, 상이한 3-염기 모티프에 대한 효율은 다음과 같이 개선된다: GAC>GAU≒GAG≒GAA.
종래 기술의 문헌 보고서에 따르면, GAU, GAC 및 GAA의 3-염기 모티프에 대한 효율이 가장 낮고 0에 가깝다(도 3 참조). 따라서, 이러한 3-염기 모티프는 RNA 편집 중에 가능한 한 피해야 한다. 그러나, 본 출원은 더 많은 불일치된 염기(3-염기 모티프에 반대)를 arRNA 내로 창의적으로 도입함으로써 이러한 한계를 돌파한다. 본 출원의 실시예로부터 알 수 있듯이, arRNA에서 3-염기(3-염기 모티프에 반대) 중에 표적 A에 반대인 염기는 C이고, 업스트림 및/또는 다운스트림 잔기에 반대인 염기가 불일치된 염기인 경우에 편집 효율은 상당히 향상될 수 있다. 또한, 업스트림 잔기가 G인 경우에 다운스트림 잔기에 반대되는 염기는 상보적 염기이고, 업스트림 잔기 G에 반대되는 염기가 불일치된 염기 A일 때 효율은 더 높고; 특히 업스트림 잔기 G에 반대되는 염기가 불일치된 염기 G인 경우에 편집 효율은 가장 높다.
실시예 4: C-to-U RNA 편집을 위한 3-연속 염기 선호도 연구
ⅰ. 돌연변이 ADAR2-r16-293T의 구축
RESUCE(WO2019071048A9)를 참조하면, ADAR2 촉매 도메인은 돌연변이를 유도하였고, 돌연변이 위치는 문헌에서 r16(dADAR2(E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/ D619G/S582T/V440I/S495N/K418E/S661T) r16, https://benchling.com/s/seq-19Ytwwh0i0vSIbyXYZ95)와 동일하였다. pLenti-ADAR2 플라스미드 벡터에서 ADAR2 XmaI 제한 사이트와 AscI 제한 사이트 사이의 시퀀스를 종래의 DNA 합성 기술(pLenti-ADAR2 플라스미드 백본은 Wei Wensheng 교수 연구실에서 기증)에 의해 시험관내에 합성하였고, 상기 돌연변이는 시퀀스에 포함되었다. 2개의 제한효소를 통해, 원래의 플라스미드 pLenti-ADAR2에 상응하는 단편을 제한효소 소화 및 결찰에 의해 새롭게 합성된 DNA 단편으로 교체하고, 교체 후 플라스미드를 pLenti-ADAR2-r16으로 명명하고, RESCUE(WO2019071048A9)에 따라 돌연변이된 촉매 도메인을 갖는 ADAR2 유전자는 ADAR2-r16으로 명명되었다. ADAR2-r16의 전장 cDNA 시퀀스는 표 6에 나타내었다. 2세대 렌티바이러스 패키징 시스템(pCAG-VSVG는 Arthur Nienhuis & Patrick Salmon(Addgene Plasmid #35616; http://n2t.net/addgene:35616; RRID: Addgene_35616); 및 pCMVR8.74는 Didier Trono(Addgene Plasmid #22036; http://n2t.net/addgene:22036; RRID: Addgene_22036))에 의해 기증되었으며, pLenti-ADAR2-r16은 렌티바이러스로 패키징되었고, 293T 세포를 렌티바이러스로 트랜스펙션시키고, 트랜스펙션 48시간 후에 최종 농도 10㎍/mL Blasticidin(Solarbio B9300)으로 내성 스크리닝을 수행하였다. 스크리닝 후에, 살아 남은 세포를 ADAR2-r16-293T로 명명하였다.
ii. BFP 리포터 시스템의 구축
BFP 리포터 시스템은 문헌(Vu, L. T., Nguyen, T. T. K., Md Thoufic, A. A., Suzuki, H., & Tsukahara, T. (2016))을 참조하여 구축되었다. 유전자 복원을 위한 화학적 RNA 편집: 카르복시비닐데옥시유리딘 올리고데옥시뉴클레오티드의 구조와 탈아미노화 효율 사이의 관계. Chemical Biology & Drug Design, 87(4), 583-593), 및 BFP의 모든 cDNA 시퀀스는 DNA로부터 시험관내에 합성되었으며, 구체적인 시퀀스는 표 7에 나타내었다. CMV 프로모터 뒤의 다수의 클로닝 위치를 통해 pCDH-CMV 플라스미드 벡터로 클로닝되었다(pCDH-CMV 플라스미드 골격은 Kazuhiro Oka, Addgene Plasmid #72265에 의해 기증됨; http://n2t.net/addgene:72265; RRID: Addgene_72265 ). 리포터 시스템에서 C-to-U 편집 위치는 BFP 시퀀스에서 위치 199의 염기 C이고, 위치 199-201의 염기는 위치 66의 히스티딘에 상응하는 CAC이었다.
시퀀스에서 위치 198-200의 염기는 순서대로 CCA이며, 이를 BFP-CCA로 명명하고 C*로 약칭하였다. RNA 수준에서 위치 199의 염기 C가 탈아미노화되어 U로 편집되면, 위치 66의 아미노산이 변하게 되고 BFP 형광 단백질은 원래의 청색 형광에서 녹색 형광으로 변하여, 유세포 분석기의 FITC(fluorescein isothiocyanate) 채널을 사용하여 신호를 검출할 수 있다. 위치 198의 뉴클레오티드가 C에서 A, T 또는 G로 변이된 후에, 위치 65의 아미노산의 코돈은 ACC, ACA, ACT 또는 ACG로 인코딩되고, 이들은 모두 트레오닌을 인코딩하므로 이 위치의 돌연변이는 동의어 돌연변이이다. 따라서, mRNA에서 위치 199의 표적 잔기에 인접한 업스트림 잔기가 상이한 염기인 경우, 리포터 시스템을 사용하여 C-to-U 편집 효율을 동시에 결정하고 비교할 수 있다. 위치 지정된 돌연변이유발 키트(Q5® Site-Directed Mutagenesis Kit, NEB E0554S)를 사용하여 위치 198의 염기 내로 돌연변이를 도입했으며, 위치 198-200의 염기는 각각: BFP-GCA로 명명되고 G*로 약칭되는 GCA; BFP-ACA로 명명되고 A*로 약칭되는 ACA; 및 BFP-TCA로 명명되고 T*로 약칭되는 TCA이었다. 위치 199의 C 염기를 T로 변이시키고, 위치 198-200의 염기는 각각 BFP-CUA로 명명되고 CUA로 약칭되는 CTA이었다. 2세대 렌티바이러스 패키징 시스템(상기 ADAR2-r16의 렌티바이러스 패키징과 동일한 조건 하에서)을 통해, 상기 4개의 구축된 플라스미드: BFP-GCA, BFP-ACA, BFP-TCA 및 BFP-CCA는 각각 렌티바이러스, 293T 세포 또는 ADAR2-r16-293T 세포를 렌티바이러스로 트랜스펙션시키고, 트랜스펙션 48시간 후에, 10㎍/mL의 최종 농도 500㎍/mL Geneticin(Gibco, 카탈로그 번호: 10131035) 또는 Blasticidin(Solarbio B9300)으로 내성 스크리닝을 수행하였고, 스크리닝 후에 살아 남은 세포를 각각 293T-GCA, 293T-ACA, 293T-TCA, 293T-CCA, 및 ADAR2-r16-GCA, ADAR2-r16-ACA, ADAR2-r16-TCA, ADAR2-r16-CCA로 명명하였다.
iii. arRNA의 설계 및 합성
본 실시형태에 있어서 용어 "arRNA" 및 본원에서 용어 "dRNA"는 동일한 의미를 가지며, 혼용될 수 있다. 본 실시형태에 있어서, arRNA에서 염기(3-염기 모티프에서 표적 잔기의 반대)는 arRNA의 중간에 위치하고, 5' 업스트림와 3' 다운스트림은 양쪽으로 동일한 길이만큼 연장된다. 합성된 길이의 한계로 인해, 본 실시형태에 있어서는 91nt 길이의 RNA를 갖는 RNA가 시험관내에 먼저 합성되었으며, 상이한 뉴클레오티드 위치 46(표적화 염기)에 따라, 즉 위치 46의 뉴클레오티드는 각각 A, U, G 또는 C이고, 합성된 4개의 arRNA는 각각 A*, U*, G* 및 C*로 약칭되었다. 4개의 합성된 arRNA의 구체적인 시퀀스를 표 5에 나타내었다. LEAPER 기술의 설계 방식(WO2020074001A1)과의 차이는 다음과 같다: 본 실험에서 설계된 4개의 arRNA에서는 표적 잔기 C에 반대되는 표적화 염기만 변경, 즉 위치 46의 염기는 A, U, G 또는 C이고, arRNA에서 위치 47(상당하는 리포터 시스템에서 위치 198)의 염기는 돌연변이, 즉 CCA 도입 전 BFP 시퀀스에 따라 설계되었다. 다음에, 상이한 3-연속 상보적 염기를 각각 포함하는 arRNA를 3-염기 모티프에서 표적 잔기가 시티딘이고 '업스트림 잔기가 아데노신'인 조건 하에서 합성되었으며, 구체적인 시퀀스를 표 8에 나타내었다. arRNA에서 위치 46의 뉴클레오티드는 U로 고정되고, 위치 45와 47의 뉴클레오티드를 각각 A, U, G 또는 C로 하여 총 16개의 arRNA를 합성하였다. 각 arRNA는 다음과 같은 원칙에 따라 명명되었다: 모든 arRNA는 "arRNA"로 시작하여 명명된 다음 arRNA에서 3-연속 상보적 염기가 첨자의 형태로 표시되었다. mRNA에서 표적 잔기 C의 염기는 arRNA에서 U의 표적 염기에 상당하므로, 5'-말단에서 3'-말단의 순서로 3-연속 상보적 염기를 나타내었다. 예를 들면, CCA의 3-염기 모티프에 대한 arRNA, 표적 잔기 C에 인접한 업스트림 잔기는 C이고, arRNA에서 표적화 염기의 상응하는 3' 최근접 이웃 잔기는 G이고; 표적화 염기 C의 경우, arRNA에서 상응하는 표적화 잔기는 U이고; 표적 잔기 C에 인접한 다운스트림 잔기는 A이고, arRNA에서 표적화 염기의 상응하는 5' 최근접 이웃 잔기는 U이므로, arRNA에서 3-연속 상보적 염기는 UUG이고, 명명 규칙에 따라, 이 안티센스 RNA는 arRNAUUG로 명명되었다. 4개의 합성된 arRNA(A*, U*, G* 및 C*)의 제 1 배치와 16개의 합성된 RNA의 제 2 배치의 명명법을 통일하기 위해서, 4개의 합성된 arRNA(A*, U*, G* 및 C*)의 )의 제 1 배치는 다음의 실험에서 각각 arRNAUAG, arRNAUUG, arRNAUGG 및 arRNAUCG로 명명되었다. 두 실험에서, 처음으로 합성된 arRNAUUG의 시퀀스는 두 번째로 합성된 arRNAUUG의 시퀀스과 완전히 동일하며, arRNAUUG는 2개의 상이한 배치에서 합성되었다는 점에 유의해야 한다.
iv. 표적 C 파라안티센스 RNA 테스트
ADAR2-r16-293T 세포를 6-웰 플레이트에 300000개 세포/웰의 밀도로 플레이팅하고, 플레이팅 24시간 후, 세포를 Lipofectamine™ 3000 Transfection Reagent(Invitrogen, 카탈로그 번호: L3000015)으로 트랜스펙션시키고, 지침에 따라 트랜스펙션 과정을 수행하였다. 지침에 따라 상이한 농도에서 Lipofectamine 3000 트랜스펙션 시약을 사용하여 두 번의 반복 실험을 수행했으며, 웰당 3.75㎕ 및 7.5㎕ 트랜스펙션 시약 농도를 각각 반복 1 및 반복 2에 사용하였다. 2.5㎍의 BFP 및 관련 플라스미드, 즉 BFP-GCA(G*로 약칭), BFP-ACA(A*로 약칭), BFP-TCA(T*로 약칭) 또는 BFP-CUA(CUA로 약칭)를 첨가하고, 25pmol의 합성된 가이드 RNA를 첨가하고, 트랜스펙션 48시간 후 , FITC 채널 신호 강도는 FACS에 의해 감지되었다. 양성세포에 대한 평균 형광 강도(MFI)의 통계 결과를 도 15에 나타내었다.
도 15에서, mRNA 행은 상당하는 웰에 첨가된 BFP 리포터 시스템 플라스미드를 나타내고, arRNA 행은 상당하는 웰에 첨가된 arRNA를 나타낸다. BFP 리포터 시스템에서, 원래 시퀀스에서 위치 198-200의 염기는 CCA이고, 위치 198의 염기 C가 A 또는 T 또는 G로 전환될 때 위치 65의 아미노산이 트레오닌으로 전환되므로, BFP-GCA, BFP-CCA, BFP-ACA 및 BFP-TCA의 4개의 상이한 리포터 시스템에서 위치 198의 염기의 변화는 원래 단백질 기능에 영향을 미치지 않는다. 도 15에 나타낸 바와 같이, arRNA가 첨가되지 않은 경우, 리포터 시스템의 배경 GFP 신호의 MFI는 5×104이다(리포터 시스템은 U*로 표시되고, arRNA는 /로 표시되며; 리포터는 A*로 표시되고, arRNA는 /로 표시됨). 그러나 DNA 수준에서 포인트 돌연변이(mRNA의 3-염기 모티프는 CUA임)에 의해 위치 199의 염기 C가 T로 돌연변이된 후, GFP 신호의 MFI는 약 2.4×106-3.1×106이며, 배경 신호의 약 100배이다. 따라서, RNA 수준에서 위치 199의 염기 C가 U로 변환되면, GFP 신호의 MFI가 약 100배 증가함을 나타낼 수 있다.
그러나, arRNA를 첨가한 후에, 도 15에 나타낸 바와 같이 DNA 수준에서 위치 199의 변하지 않은 염기 C를 기준으로 최종 GFP 신호의 MFI를 5×105 이상으로 증가시킬 수 있으며, 형광 강도는 위치 199의 염기 C가 T로 변이된 경우에 형광 강도의 약 20%이다. 편집 능력 및 염기 선호도를 더 확인하기 위해서, 상기 실험을 추가로 설계하고 반복하였다. 결과는 도 16에 나타내었으며, 실험 조건은 도 15와 실질적으로 동일하며, 유일한 차이점은: 반복 1과 반복 2에서 3.75㎕의 트랜스펙션 시약을 사용하였다는 점이다. 즉, 3-염기 모티프가 GCA 또는 CCA인 경우, U^의 arRNA(arRNAUUG)가 C^의 arRNA(arRNAUCG)보다 효율이 더 높다. 도 15와 비교하여, 도 16과 동일한 실험 조건 하에서 MFI가 거의 절반으로 감소되었으며, 이는 arRNA의 건조 분말이 용해된 직후에 도 15에서 arRNA를 테스트한 반면, 도 16의 실험은 도 15의 실험에서 arRNA 용액을 -80℃에서 한번 동결 및 해동한 후에 수행되었기 때문이다. 그러나, 도 15에 비해 최대값은 감소하였지만, 도 15의 4개의 가장 높은 편집 효율 결과는 도 16의 실험에서 실질적으로 반복되고, 도 16의 효율은 동일한 추세를 나타냄을 알 수 있었다. 본 실시예의 테스트 설계 조건 하에서, arRNA에서 3-연속 상보적 염기 중 5'-말단 염기는 U로 고정되고, 3'-말단 염기는 G로 고정되며, 연구는 3-연속 상보적 염기에서 염기(표적 C에 반대)에 초점을 맞추고, 다음과 같은 결론이 제시된다: U^의 중간 잔기를 갖는 3-연속 상보적 염기의 편집 효율은 C^의 중간 잔기를 갖는 3-연속 상보적 염기보다 더 높고, 출원인은 3-염기 모티프에서 업스트림 잔기가 변경될 때 GCA의 3-염기 모티프에 대한 최대 효율은 CCA보다 높다는 것을 발견하였다.
v. 3-연속 염기 선호도 테스트
ii. BFP 리포터 시스템의 구축의 설명에 따라 후속 결과의 더 나은 일관성을 위해서, 출원인은 4개의 플라스미드: BFP-GCA, BFP-ACA, BFP-TCA 및 BFP-CCA를 각각 렌티바이러스 패키징에 의해 ADAR2-r16이 없는 일반 293T 세포 및 ADAR2-r16과 안정적으로 통합된 293T 세포에 통합되고, 및 과정 및 명명법은 ii. BFP 리포터 시스템의 구축에 언급되었다. 리포터 시스템이 세포 게놈에 통합되었기 때문에, 3-연속 염기 선호도 테스트에서 arRNA를 사용한 트랜스펙션과 표적 C 파라안티센스 RNA 테스트에서 arRNA를 사용한 트랜스펙션에 상이한 트랜스펙션 시약이 사용되었다. 표적 C 파라안티센스 RNA 테스트에서, arRNA와 플라스미드를 동시에 트랜스펙션해야 하므로, 상기에서 설명한 바와 같이 Lipofectamine 3000을 사용하였다. 3-연속 염기 선호도 테스트에서, arRNA만으로 트랜스펙션할 필요가 있고, 플라스미드는 사용하지 않으므로, Lipofectamine™ RNAiMAX Transfection Reagent(Invitrogen, Catalog number: 13778100)를 사용하였다. 상이한 리포터 시스템을 포함하는 293T 세포 또는 ADAR2-r16-293T 세포를 12-웰 플레이트에 150000개 세포/웰의 밀도로 플레이팅하고, 플레이팅 24시간 후, 각 웰의 세포를 RNAiMAX 시약을 사용하여 15pmol의 arRNA로 트랜스펙션하고, 트랜스펙션 48시간 후, FACS로 FITC 채널 신호 강도를 검출하고, GFP+ 세포의 백분율을 계산하였다.
arRNA에서 3-연속 상보적 염기가 표적 C와 단일 불일치를 포함하고, 표적 C에 상응하는 불일치된 염기는 U이고, 다른 2개의 염기는 표적 C에 대해 각각 인접하는 업스트림 잔기 및 다운스트림 잔기와 완전히 일치되는 경우에 대해서(즉, 리포터 시스템이 BFP-GCA인 경우, arRNA에서 3-연속 상보적 염기(리포터 시스템에 상보적)는 UUC이고; 리포터 시스템이 BFP-ACA인 경우, arRNA에서 3-연속 상보적 염기(리포터 시스템에 대한 상보적)는 UUU이고; 리포터 시스템이 BFP-TCA인 경우 arRNA에서 3-연속 상보적 염기(리포터 시스템에 대한 상보적)는 UUA이며; 리포터 시스템이 BFP-CCA인 경우, arRNA에서 3-연속 상보적 염기(리포터 시스템에 대한 상보적)는 UUG임), 테스트 결과는 도 17에 나타내었다. 이 도에서, "미처리된"은 arRNA가 없는 대조군을 의미하고, "랜덤 RNA 시퀀스"는 91nt의 랜덤 RNA 시퀀스가 첨가된 대조군을 나타내고(특정 시퀀스는 표 8에서 Ran-91로 나타냄), "arRNA"는 상기 규칙에 따라 상응하는 일치된 arRNA의 첨가를 의미한다. 도 17에서 알 수 있듯이, 3-연속 염기가 TCA 또는 ACA인 경우 시스템에 대한 편집 효율은 높고, 3-연속 염기가 GCA 또는 CCA인 경우 편집 효율이 0에 가깝다는 것을 알 수 있다.
3-연속 염기 테스트 결과는 한때 이 연구에 큰 문제를 일으켰다. 도 15의 테스트에서, 3-연속 염기는 표적 C에 상응하는 염기 A, U, C 또는 G를 포함하는 반면, 도 17의 테스트에서는 C가 U와 페어링된다. 도 15에 상응하는 실험에서, arRNA에서 염기(표적 C에 상당)가 U인 경우의 데이터를 별도로 추출하여 다시 그려서 도 18을 얻었다. 도 17과 비교하면, 두 실험의 결론은 명백히 모순적이다. 두 도면의 통계적 패턴은 상이하지만, 실험의 동일한 배치의 추세는 크게 상이하다. 도 15의 데이터에 따라 다시 그린 도 18에서, GCA와 CCA에 대한 효율이 높은 반면, 도 17에서는 TCA와 ACA에 대한 효율이 명백히 높다.
vi. 편집 위치에 인접한 5'-업스트림과 불일치되는 경우의 예상하지 못한 발견
두 실험의 상반된 결과는 전혀 예상하지 못한 것이다. 여러 번 반복된 실험과 arRNA의 2개의 신중한 비교를 통해, 두 실험에서 RNA 설계의 미묘한 차이가 예상하지 않게 발견되고 복제되었다. 도 19a는 도 18에서 사용된 mRNA에서 3-염기 모티프와 arRNA에서 3-연속 상보적 염기 사이의 페어링 관계를 나타내고, 도 19b는 도 17에서 사용된 mRNA에서 3-염기 모티프와 arRNA에서 3-연속 상보적 염기 사이의 페어링 관계를 나타낸다. 그에 비해, 둘 사이의 차이는: 전자(도 19a)는 arRNA에서 염기(표적 C에 인접한 업스트림 잔기의 반대)가 G인 경우를 나타내고, 업스트림 잔기는 표적 C에 인접한 업스트림 잔기가 C인 경우를 제외하고 arRNA에서 반대 염기와 불일치되고; 후자(도 19b)는 arRNA에서 염기(표적 C에 인접한 업스트림 잔기의 반대)가 업스트림 잔기에 엄격하게 상보적 염기인 경우를 나타낸다. 따라서, 본 발명자들은 상기 모순의 원인이 arRNA에서 3-연속 상보적 염기의 염기와 업스트림 잔기 사이의 불일치가 3-연속 염기 선호도의 변화로 이어질 수 있기 때문이라고 추측하였다.
상기 추측을 더욱 확인하기 위해서, iv. 표적 C 파라안티센스 RNA 테스트, 및 v. 3-연속 염기 선호도 테스트에서 합성된 arRNA를 함께 테스트하여, GFP 백분율과 MFI를 카운팅하였다. 테스트 조건은 v. 3-연속 염기 선호도 테스트와 정확히 동일하였다. 특히, 도 20 및 도 21의 상부 패널은 iv. 표적 C 파라안티센스 RNA 테스트에서 합성된 arRNA의 테스트 결과, 및 도 20 및 도 21의 하단 패널은 v. 3-연속 염기 선호도 테스트에서 합성된 arRNA의 테스트 결과를 나타낸다. 상응하는 arRNA의 첨가는 iv 및 v의 2개의 테스트에서와 동일하였다. 도 20(%GFP) 및 도 21(MFI)에 나타낸 바와 같이, 반복 1 및 반복 2는 2개의 독립적인 실험이다. 도 20과 도 21에서, 2개의 도면의 통계적 패턴은 상이하지만, 추세는 유사함을 알 수 있었다. 상단 패널에서, GCA와 CCA의 편집 효율은 상대적으로 높은 반면, TCA와 ACA의 편집 효율은 상대적으로 낮아 iv. 표적 C 파라안티센스 RNA 테스트의 결론과 일치한다. 하단 패널에서, TCA 및 ACA의 편집 효율은 상대적으로 높은 반면, GCA 및 CCA의 편집 효율은 0에 가까우며, 이는 v. 3-연속 염기 선호도 테스트의 결론과 일치한다. 따라서, 상기 추측이 확인되었고, 즉 외견상으로 모순되는 2개의 결론은 상이한 arRNA 설계 방법에 의해 야기되었다. 또한, 본 발명자들은 GCA의 3-염기 모티프에 대하여 선행 기술에 따라 설계된 arRNA의 편집 효율이 0에 가깝고, 추가적인 G-G 불일치가 추가되면 편집 효율이 상당히 향상되는 것을 예상하지 않게 발견되었다.
상기 발견에 더 영감을 받아, 본 발명자들은 3-염기 모티프에 다른 추가적인 불일치된 시퀀스를 도입함으로써 편집 효율이 더 향상될 수 있는지의 여부를 고려하였다. 이러한 영감으로, arRNA에서 염기(표적 C에 반대)가 U라는 전제 하에, 위치(3-염기 모티프에서 표적 염기에 인접한 업스트림 잔기 및/또는 다운스트림 잔기의 반대)에 더 많은 돌연변이가 도입되었다. 표적 염기의 업스트림 잔기에 반대되는 염기는 A, U, C 또는 G일 수 있고, 표적 염기의 다운스트림 잔기에 반대되는 염기도 A, U, C 또는 G일 수 있으므로, 총 16개의 3-연속 상보적 염기 시퀀스가 있다: AUA, AUU, AUC, AUG, UUA, UUU, UUC, UUG, CUA, CUU, CUC, CUG, GUA, GUU, GUC, 및 GUG. 이를 고려하여, 상기 16개의 3-연속 상보적 염기 시퀀스를 포함하는 arRNA를 합성하였고, 3-연속 상보적 염기 시퀀스에 따라 명명되었으며, 구체적인 시퀀스는 표 8에 나타내었다. 이들 16개의 상이한 arRNA는 RNAiMAX, 즉 BFP-ACA-293T 및 BFP-ACA-293T-ADAR2-r16(도 22b 참조), BFP-TCA-293T 및 BFP-TCA-293T-ADAR2-r16(도 22a 참조), BFP-CCA-293T 및 BFP-CCA-293T-ADAR2-r16(도 22d 참조), 및 BFP-GCA-293T 및 BFP-GCA-293T-ADAR2-r16(도 22d 참조)에 의해 리포터를 포함하는 8개의 이전에 구축된 세포주에 각각 트랜스펙션되었고, 트랜스펙션 조건 및 테스트 시간은 도 17과 관련된 실험과 동일하게 하였다. 4개의 도 22a-d의 대조군은 동일한 샘플이고, "91nt의 랜덤 시퀀스"는 91nt의 랜덤 시퀀스와 함께 첨가된 대조군이며, "벡터만"은 RNAiMAX 트랜스펙션 시약과 함께 첨가되지만 RNA가 첨가되지 않은 대조군이며, "Opti-DMEM 배지"는 동일한 부피의 Opti-DMEM과 함께 첨가되지만 RNAIMAX 트랜스펙션 시약이 첨가되지 않은 대조군이며, "미처리된"은 트랜스펙션, 특히 arRNAUAG, arRNAUUG, arRNAUCG 및 arRNAUGG는 각각 CCA-arRNAUAG, CCA-ARNAUUG, CCA-ARNAUCG 및 CCA-ARNAUGG와 동일한 시퀀스가지만 2개의 상이한 배치로 합성되었다.
도 22는 더 많은 불일치를 도입하기 위한 바람직한 선택, 즉 3-염기 모티프가 ACA인 경우, AUU 또는 GUU의 3-연속 상보적 염기를 갖는 arRNA의 편집 효율이 높고, 특히 AUU의 3-연속 상보적 염기를 갖는 arRNA의 편집 효율이 더 높은 것을 나타내며: 3-염기 모티프가 UCA(플라스미드의 TCA)인 경우, AUA, GUA 또는 CUA의 3-연속 상보적 염기를 갖는 arRNA의 편집 효율이 높고, 특히 AUA의 3-연속 상보적 염기를 갖는 arRNA의 편집 효율이 더 높으며; 3-염기 모티프가 GCA인 경우, UUG 또는 UCG의 3-연속 상보적 염기를 갖는 arRNA의 편집 효율이 높고, 특히 UUG의 3-연속 상보적 염기를 갖는 arRNA의 편집 효율이 더 높으며; 3-염기 모티프가 CCA인 경우, AUG의 3-연속 상보적 염기를 갖는 arRNA의 편집 효율이 더 높다.
또한, 표적 RNA에서 상이한 업스트림 잔기는 상이한 편집 효율을 초래할 수 있다. 본 출원의 적용 범위 및 3-염기 모티프에서 바람직한 순서를 더 잘 규정하기 위해서, 본 실시예에서 업스트림 잔기 및/또는 다운스트림 잔기, 및 표적 잔기에 반대되는 단일 불일치의 경우 편집 효율을 비교하였다. 또한, 그 결과를 도 22에 나타내었으며, 3-염기 모티프에서 업스트림 잔기가 A 또는 U인 경우, 업스트림 잔기 및/또는 다운스트림 잔기에 정반대되는 불일치를 갖는 arRNA가 표적 잔기에 반대되는 단일 불일치로 arRNA의 편집 효율에 필적하는 편집 효율에 도달할 수 있음을 알 수 있었다. 예를 들면, 3-염기 모티프가 ACA인 경우, 표적 잔기에 반대되는 단일 염기 불일치를 갖는 3-연속 상보적 염기 시퀀스 UUU를 포함하는 arRNA는 업스트림 잔기 및/또는 다운스트림 잔기에 정반대되는 불일치를 갖는 AUU 또는 GUU에 필적하는 편집 효율에 도달할 수 있고; 3-염기 모티프가 UCA인 경우, 표적 잔기에 정반대되는 단일 불일치를 갖는 3-연속 상보적 염기 시퀀스 UUA를 포함하는 arRNA는 업스트림 잔기 및/또는 다운스트림 잔기에 정반대되는 불일치를 갖는 AUA에 필적하는 편집 효율에 도달할 수 있다. 그러나, 3-염기 모티프가 GCA인 경우, 표적 잔기에 반대되는 단일 염기 불일치를 갖는 3-연속 상보적 염기 시퀀스 UUC의 편집 효율은 0에 가깝고, 업스트림 잔기 및/또는 다운스트림 잔기에 정반대되는 불일치를 갖는 UUG 또는 UCG의 편집 효율은 수배 내지 10배 이상일 수 있다. 3-염기 모티프가 CCA인 경우, 업스트림 잔기 및/또는 다운스트림 잔기에 정반대되는 불일치를 도입하는 AUG의 편집 효율도 UCG와 유사하다. 따라서, 편집 효율의 향상 순서에 따라, 3-염기 모티프에서 업스트림 잔기의 불일치의 바람직한 순서는 다음과 같음을 알 수 있다: G>C>A≒U, 즉 3-염기 모티프에서 업스트림 잔기가 G인 경우, 업스트림 잔기와 불일치되는 G를 도입함으로써 편집 효율을 크게 향상시킬 수 있다.
최종적으로, 도 22의 데이터는 동일한 검출 방법에 의해 동일한 실험 조건 하에서 동일한 배치의 테스트에서 얻은 데이터이므로, ACA, UCA, CCA 및 GCA의 4개의 상이한 모티프에 대해 C-to-U RNA 편집 기술의 편집 효율을 비교하는 것이 편리하다. 도 22에 나타낸 바와 같이, 3-염기 모티프 중에 ACA 또는 UCA에 대한 최대 효율은 약 10% GFP+이고; GCA에 관하여 표적 염기에 반대되는 단일 불일치를 갖는 arRNA의 편집 효율은 0에 가까우며: 표적 염기에 반대되는 불일치를 포함할 뿐만 아니라 업스트림 잔기 및/또는 다운스트림 잔기에 정반대되는 불일치가 도입된 arRNA의 편집 효율은 6%-8% GFP+로 증가될 수 있지만; CCA에 관하여 업스트림 잔기 및/또는 다운스트림 잔기에 정반대되는 불일치로 도입된 arRNA의 최대 효율은 2.5% GFP+ 보다 크지 않다.
본 출원은 GAU, GAC 등의 3-염기 모티프에 대한 기존 RNA 편집 기술의 낮은 편집 효율의 한계를 돌파하여, G로 시작하는 3-염기 모티프도 여전히 상당한 효율로 편집하여 기존 RNA 편집 기술로는 GAU, GAC 등의 사이트를 편집할 수 없는 난처한 상황을 돌파함으로써, ADAR의 자연적 선호도를 충족하지 않는 3-염기 모티프(UAG 제외)에 대한 종래 기술의 ADAR 기반 RNA 편집 시스템(예를 들면, LEAPR(WO2020074001A1) 및 RESTORE(WO2020001793A1))의 편집 효율을 상당히 향상시킨다. 한편, 본 출원의 기술적 해결방안도 GCA와 같은 3-염기 모티프에 대한 기존 RNA 편집 기술의 낮은 편집 효율의 한계를 돌파하고, GCA의 3개 염기 모티프에 대한 종래 기술(WO2019071048A9)의 RESCUE의 낮은 편집 효율과 비교하여, 본 출원은 추가적인 염기 불일치를 도입함으로써 GCA를 편집하는 능력을 크게 향상시킨다. 본 출원은 RNA 편집의 적용에서 편집 사이트 선택의 오래 지속되는 한계를 돌파한다. 예를 들면, 질환 치료 개발에 있어서 본 출원에 따라, 유전자 돌연변이에 의해 야기되는 더 많은 유전 질환이 RNA 편집에 의해 보다 안전하고 효율적으로 치료될 수 있는 기회를 갖는다.
시퀀스 목록
[표 1] 16개의 3-염기 모티브 리포터 시스템 구축을 위한 프라이머
Figure pct00001
[표 2] 16개의 3-염기 모티프 리포터 시스템 구축하기 위한 재료 및 어셈블리 순서
Figure pct00002
[표 3] 실시예 1-3에 사용된 arRNA 시퀀스
Figure pct00003
[표 4] 리포터 1의 기준 시퀀스(SEQ ID NO: 54)
Figure pct00004
Figure pct00005
Figure pct00006
[표 5]
Figure pct00007
[표 6] ADAR2-r16의 전장 cDNA 시퀀스(SEQ ID NO: 59)
Figure pct00008
[표 7] BFP의 cDNA 시퀀스(SEQ ID NO: 60)
Figure pct00009
[표 8] 실시예 4에서 사용된 관련 arRNA 시퀀스
Figure pct00010
참조:
1. Adikusuma, F., Piltz, S., Corbett, M. A., Turvey, M., McColl, S. R., Helbig, K. J., ... & Thomas, P. Q. (2018). Large deletions induced by Cas9 cleavage. Nature, 560(7717), E8-E9.
2. Cox, D. B., Gootenberg, J. S., Abudayyeh, O. O., Franklin, B., Kellner, M. J., Joung, J., & Zhang, F. (2017). RNA editing with CRISPR-Cas13. Science, 358(6366), 1019-1027.
3. Charlesworth, C. T., Deshpande, P. S., Dever, D. P., Camarena, J., Lemgart, V. T., Cromer, M. K., ... & Behlke, M. A. (2019). Identification of preexisting adaptive immunity to Cas9 proteins in humans. Nature medicine, 25(2), 249-254.
4. Cullot, G., Boutin, J., Toutain, J., Prat, F., Pennamen, P., Rooryck, C., ... & Bibeyran, A. (2019). CRISPR-Cas9 genome editing induces megabase-scale chromosomal truncations. Nature communications, 10(1), 1-14.
5. Enache, O. M., Rendo, V., Abdusamad, M., Lam, D., Davison, D., Pal, S., ... & Thorner, A. R. (2020). Cas9 activates the p53 pathway and selects for p53-inactivating mutations. Nature Genetics, 1-7.
6. Haapaniemi, E., Botla, S., Persson, J., Schmierer, B., & Taipale, J. (2018). CRISPR-Cas9 genome editing induces a p53-mediated DNA damage response. Nature medicine, 24(7), 927-930.
7. Merkle, T., Merz, S., Reautschnig, P., Blaha, A., Li, Q., Vogel, P., ... & Stafforst, T. (2019). Precise RNA editing by Recruiting endogenous ADARs with antisense oligonucleotides. Nature biotechnology, 37(2), 133-138.
8. Qu, L., Yi, Z., Zhu, S., Wang, C., Cao, Z., Zhou, Z., ... & Bao, Y. (2019). Programmable RNA editing by Recruiting endogenous ADAR using engineered RNAs. Nature biotechnology, 37(9), 1059-1069.
9. Vogel, P., Moschref, M., Li, Q., Merkle, T., Selvasaravanan, K. D., Li, J. B., & Stafforst, T. (2018). Efficient and precise editing of endogenous transcripts with SNAP-tagged ADARs. Nature methods, 15(7), 535-538.
10. Nishikura K. (2010). Functions and regulation of RNA editing by ADAR deaminases. Annual review of biochemistry, 79, 321-349.
11. Paul Vogel, Matin Moschref, Qin Li, Tobias Merkle, Karthika D. Selvasaravanan, Jin Billy Li & Thorsten Stafforst. (2018). Efficient and precise editing of endogenous transcripts with SNAP-tagged ADARs. Nat Methods 15, 535-538 (2018).
12. Abudayyeh, O. O., Gootenberg, J. S., Franklin, B., Koob, J., Kellner, M. J., Ladha, A., ... & Zhang, F. (2019). A cytosine deaminase for programmable single-base RNA editing. Science, 365(6451), 382-386.
13. Vu, L. T., Nguyen, T. T. K., Md Thoufic, A. A., Suzuki, H., & Tsukahara, T. (2016). Chemical RNA editing for genetic restoration: the relationship between the structure and deamination efficiency of carboxyvinyldeoxyuridine oligodeoxynucleotides. Chemical biology & drug design, 87(4), 583-593.
14. Keppler, A., Gendreizig, S., Gronemeyer, T., Pick, H., Vogel, H., & Johnsson, K. (2003). A general method for the covalent labeling of fusion proteins with small molecules in vivo. Nature Biotechnology, 21(1), 86-89.
15. Stafforst, T., & Schneider, M. F. (2012). An RNA-Deaminase Conjugate Selectively Repairs Point Mutations. Angewandte Chemie, 51(44), 11166-11169.
Sequence Listing <110> EdiGene Inc. <120> Improved RNA Editing Method <130> FE00412US <150> PCT/CN2020/100467 <151> 2020-07-06 <160> 76 <170> PatentIn version 3.5 <210> 1 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> PCR primer <400> 1 ggagtgagta cggtgtgcga cgagctgtac aagctgcagg g 41 <210> 2 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> PCR primer <400> 2 gagttggatg ctggatggtg gtgcagatga acttcagggt cag 43 <210> 3 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Vector-F <400> 3 ctgttttgac ctccatagaa gacaccgact ctagacgtgg aacagtacga acgcgc 56 <210> 4 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> GAT-R <400> 4 cactggcaga gccctatcgc atcgcgagca ggcgct 36 <210> 5 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> GAT-F <400> 5 tgctcgcgat gcgatagggc tctgccagtg agc 33 <210> 6 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Vector-R <400> 6 gggtttaaac ccctgcaggg tgtacaccgg cgcgccttac ttgtacagct cgtccatgc 59 <210> 7 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> GAA-R <400> 7 cactggcaga gccctttcgc atcgcgagca ggcgct 36 <210> 8 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> GAA-F <400> 8 tgctcgcgat gcgaaagggc tctgccagtg agc 33 <210> 9 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> GAG-R <400> 9 cactggcaga gccctctcgc atcgcgagca ggcgct 36 <210> 10 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> GAG-F <400> 10 tgctcgcgat gcgagagggc tctgccagtg agc 33 <210> 11 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> GAC-R <400> 11 cactggcaga gccctgtcgc atcgcgagca ggcgct 36 <210> 12 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> GAC-F <400> 12 tgctcgcgat gcgacagggc tctgccagtg agc 33 <210> 13 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> AAA-R <400> 13 cactggcaga gcccttttgc atcgcgagca ggcgct 36 <210> 14 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> AAA-F <400> 14 tgctcgcgat gcaaaagggc tctgccagtg agc 33 <210> 15 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> AAT-R <400> 15 cactggcaga gccctattgc atcgcgagca ggcgct 36 <210> 16 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> AAT-F <400> 16 tgctcgcgat gcaatagggc tctgccagtg agc 33 <210> 17 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> AAC-R <400> 17 cactggcaga gccctgttgc atcgcgagca ggcgct 36 <210> 18 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> AAC-F <400> 18 tgctcgcgat gcaacagggc tctgccagtg agc 33 <210> 19 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> AAG-R <400> 19 cactggcaga gccctcttgc atcgcgagca ggcgct 36 <210> 20 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> AAG-F <400> 20 tgctcgcgat gcaagagggc tctgccagtg agc 33 <210> 21 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> CAA-R <400> 21 cactggcaga gccctttggc atcgcgagca ggcgct 36 <210> 22 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> CAA-F <400> 22 tgctcgcgat gccaaagggc tctgccagtg agc 33 <210> 23 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> CAT-R <400> 23 cactggcaga gccctatggc atcgcgagca ggcgct 36 <210> 24 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> CAT-F <400> 24 tgctcgcgat gccatagggc tctgccagtg agc 33 <210> 25 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> CAC-R <400> 25 cactggcaga gccctgtggc atcgcgagca ggcgct 36 <210> 26 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> CAC-F <400> 26 tgctcgcgat gccacagggc tctgccagtg agc 33 <210> 27 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> CAG-R <400> 27 cactggcaga gccctctggc atcgcgagca ggcgct 36 <210> 28 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> CAG-F <400> 28 tgctcgcgat gccagagggc tctgccagtg agc 33 <210> 29 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> TAA-R <400> 29 cactggcaga gccctttagc atcgcgagca ggcgct 36 <210> 30 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> TAA-F <400> 30 tgctcgcgat gctaaagggc tctgccagtg agc 33 <210> 31 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> TAG-R <400> 31 cactggcaga gccctctagc atcgcgagca ggcgct 36 <210> 32 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> TAG-F <400> 32 tgctcgcgat gctagagggc tctgccagtg agc 33 <210> 33 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> TAC-R <400> 33 cactggcaga gccctgtagc atcgcgagca ggcgct 36 <210> 34 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> TAC-F <400> 34 tgctcgcgat gctacagggc tctgccagtg agc 33 <210> 35 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> TAT-R <400> 35 cactggcaga gccctatagc atcgcgagca ggcgct 36 <210> 36 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> TAT-F <400> 36 tgctcgcgat gctatagggc tctgccagtg agc 33 <210> 37 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> arRNA-UCU <400> 37 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuucugca 60 ucgcgagcag gcgcugccuc c 81 <210> 38 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> arRNA-ACU <400> 38 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuacugca 60 ucgcgagcag gcgcugccuc c 81 <210> 39 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> arRNA-GCU <400> 39 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccugcugca 60 ucgcgagcag gcgcugccuc c 81 <210> 40 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> arRNA-CCU <400> 40 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuccugca 60 ucgcgagcag gcgcugccuc c 81 <210> 41 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> arRNA-UCA <400> 41 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuucagca 60 ucgcgagcag gcgcugccuc c 81 <210> 42 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> arRNA-ACA <400> 42 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuacagca 60 ucgcgagcag gcgcugccuc c 81 <210> 43 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> arRNA-GCA <400> 43 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccugcagca 60 ucgcgagcag gcgcugccuc c 81 <210> 44 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> arRNA-CCA <400> 44 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuccagca 60 ucgcgagcag gcgcugccuc c 81 <210> 45 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> arRNA-UCG <400> 45 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuucggca 60 ucgcgagcag gcgcugccuc c 81 <210> 46 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> arRNA-ACG <400> 46 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuacggca 60 ucgcgagcag gcgcugccuc c 81 <210> 47 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> arRNA-GCG <400> 47 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccugcggca 60 ucgcgagcag gcgcugccuc c 81 <210> 48 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> arRNA-CCG <400> 48 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuccggca 60 ucgcgagcag gcgcugccuc c 81 <210> 49 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> arRNA-UCC <400> 49 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuuccgca 60 ucgcgagcag gcgcugccuc c 81 <210> 50 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> arRNA-ACC <400> 50 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuaccgca 60 ucgcgagcag gcgcugccuc c 81 <210> 51 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> arRNA-GCC <400> 51 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccugccgca 60 ucgcgagcag gcgcugccuc c 81 <210> 52 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> arRNA-CCC <400> 52 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucccgca 60 ucgcgagcag gcgcugccuc c 81 <210> 53 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> arRNA-random <400> 53 caauaggcac uaacuuauug gcgcugguga acggacuucc ucucgaguac cagaagauga 60 cuacaaaacu ccuuuccauu gcgaguaucg g 91 <210> 54 <211> 9088 <212> DNA <213> Artificial Sequence <220> <223> Reference sequence of Reporter 1 <400> 54 ctaggctttt gcaaaaagct atcgctagct cgagcacgtg ttgacaatta atcatcggca 60 tagtatatcg gcatagtata atacgacaag gtgaggaact aaaccatggc caagcctttg 120 tctcaagaag aatccaccct cattgaaaga gcaacggcta caatcaacag catccccatc 180 tctgaagact acagcgtcgc cagcgcagct ctctctagcg acggccgcat cttcactggt 240 gtcaatgtat atcattttac tgggggacct tgtgcagaac tcgtggtgct gggcactgct 300 gctgctgcgg cagctggcaa cctgacttgt atcgtcgcga tcggaaatga gaacaggggc 360 atcttgagcc cctgcggacg gtgccgacag gtgcttctcg atctgcatcc tgggatcaaa 420 gccatagtga aggacagtga tggacagccg acggcagttg ggattcgtga attgctgccc 480 tctggttatg tgtgggaggg ctaagcactt cgtggccgag gagcaggact gagaattcca 540 gtcgacaatc aacctctgga ttacaaaatt tgtgaaagat tgactggtat tcttaactat 600 gttgctcctt ttacgctatg tggatacgct gctttaatgc ctttgtatca tgctattgct 660 tcccgtatgg ctttcatttt ctcctccttg tataaatcct ggttgctgtc tctttatgag 720 gagttgtggc ccgttgtcag gcaacgtggc gtggtgtgca ctgtgtttgc tgacgcaacc 780 cccactggtt ggggcattgc caccacctgt cagctccttt ccgggacttt cgctttcccc 840 ctccctattg ccacggcgga actcatcgcc gcctgccttg cccgctgctg gacaggggct 900 cggctgttgg gcactgacaa ttccgtggtg ttgtcgggga agctgacgtc ctttccatgg 960 ctgctcgcct gtgttgccac ctggattctg cgcgggacgt ccttctgcta cgtcccttcg 1020 gccctcaatc cagcggacct tccttcccgc ggcctgctgc cggctctgcg gcctcttccg 1080 cgtcttcgcc ttcgccctca gacgagtcgg atctcccttt gggccgcctc cccgcctgga 1140 attcgagctc ggtaccttta agaccaatga cttacaaggc agctgtagat cttagccact 1200 ttttaaaaga aaagggggga ctggaagggc taattcactc ccaacgaaga caagatctgc 1260 tttttgcttg tactgggtct ctctggttag accagatctg agcctgggag ctctctggct 1320 aactagggaa cccactgctt aagcctcaat aaagcttgcc ttgagtgctt caagtagtgt 1380 gtgcccgtct gttgtgtgac tctggtaact agagatccct cagacccttt tagtcagtgt 1440 ggaaaatctc tagcagtagt agttcatgtc atcttattat tcagtattta taacttgcaa 1500 agaaatgaat atcagagagt gagaggaact tgtttattgc agcttataat ggttacaaat 1560 aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 1620 gtttgtccaa actcatcaat gtatcttatc atgtctggct ctagctatcc cgcccctaac 1680 tccgcccagt tccgcccatt ctccgcccca tggctgacta atttttttta tttatgcaga 1740 ggccgaggcc gcctcggcct ctgagctatt ccagaagtag tgaggaggct tttttggagg 1800 cctaggcttt tgcgtcgaga cgtacccaat tcgccctata gtgagtcgta ttacgcgcgc 1860 tcactggccg tcgttttaca acgtcgtgac tgggaaaacc ctggcgttac ccaacttaat 1920 cgccttgcag cacatccccc tttcgccagc tggcgtaata gcgaagaggc ccgcaccgat 1980 cgcccttccc aacagttgcg cagcctgaat ggcgaatggc gcgacgcgcc ctgtagcggc 2040 gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc 2100 ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc 2160 cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc 2220 gaccccaaaa aacttgatta gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg 2280 gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact 2340 ggaacaacac tcaaccctat ctcggtctat tcttttgatt tataagggat tttgccgatt 2400 tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa 2460 atattaacgt ttacaatttc ccaggtggca cttttcgggg aaatgtgcgc ggaaccccta 2520 tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat 2580 aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc 2640 ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga 2700 aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca 2760 acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt 2820 ttaaagttct gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg 2880 gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc 2940 atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata 3000 acactgcggc caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt 3060 tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag 3120 ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca 3180 aactattaac tggcgaacta cttactctag cttcccggca acaattaata gactggatgg 3240 aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg 3300 ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag 3360 atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg 3420 aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag 3480 accaagttta ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga 3540 tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt 3600 tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc 3660 tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc 3720 cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac 3780 caaatactgt ccttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac 3840 cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt 3900 cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct 3960 gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat 4020 acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt 4080 atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg 4140 cctggtatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt 4200 gatgctcgtc aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt 4260 tcctggcctt ttgctggcct tttgctcaca tgttctttcc tgcgttatcc cctgattctg 4320 tggataaccg tattaccgcc tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg 4380 agcgcagcga gtcagtgagc gaggaagcgg aagagcgccc aatacgcaaa ccgcctctcc 4440 ccgcgcgttg gccgattcat taatgcagct ggcacgacag gtttcccgac tggaaagcgg 4500 gcagtgagcg caacgcaatt aatgtgagtt agctcactca ttaggcaccc caggctttac 4560 actttatgct tccggctcgt atgttgtgtg gaattgtgag cggataacaa tttcacacag 4620 gaaacagcta tgaccatgat tacgccaagc gcgcaattaa ccctcactaa agggaacaaa 4680 agctggagct gcaagcttaa tgtagtctta tgcaatactc ttgtagtctt gcaacatggt 4740 aacgatgagt tagcaacatg ccttacaagg agagaaaaag caccgtgcat gccgattggt 4800 ggaagtaagg tggtacgatc gtgccttatt aggaaggcaa cagacgggtc tgacatggat 4860 tggacgaacc actgaattgc cgcattgcag agatattgta tttaagtgcc tagctcgata 4920 caataaacgg gtctctctgg ttagaccaga tctgagcctg ggagctctct ggctaactag 4980 ggaacccact gcttaagcct caataaagct tgccttgagt gcttcaagta gtgtgtgccc 5040 gtctgttgtg tgactctggt aactagagat ccctcagacc cttttagtca gtgtggaaaa 5100 tctctagcag tggcgcccga acagggacct gaaagcgaaa gggaaaccag agctctctcg 5160 acgcaggact cggcttgctg aagcgcgcac ggcaagaggc gaggggcggc gactggtgag 5220 tacgccaaaa attttgacta gcggaggcta gaaggagaga gatgggtgcg agagcgtcag 5280 tattaagcgg gggagaatta gatcgcgatg ggaaaaaatt cggttaaggc cagggggaaa 5340 gaaaaaatat aaattaaaac atatagtatg ggcaagcagg gagctagaac gattcgcagt 5400 taatcctggc ctgttagaaa catcagaagg ctgtagacaa atactgggac agctacaacc 5460 atcccttcag acaggatcag aagaacttag atcattatat aatacagtag caaccctcta 5520 ttgtgtgcat caaaggatag agataaaaga caccaaggaa gctttagaca agatagagga 5580 agagcaaaac aaaagtaaga ccaccgcaca gcaagcggcc gctgatcttc agacctggag 5640 gaggagatat gagggacaat tggagaagtg aattatataa atataaagta gtaaaaattg 5700 aaccattagg agtagcaccc accaaggcaa agagaagagt ggtgcagaga gaaaaaagag 5760 cagtgggaat aggagctttg ttccttgggt tcttgggagc agcaggaagc actatgggcg 5820 cagcctcaat gacgctgacg gtacaggcca gacaattatt gtctggtata gtgcagcagc 5880 agaacaattt gctgagggct attgaggcgc aacagcatct gttgcaactc acagtctggg 5940 gcatcaagca gctccaggca agaatcctgg ctgtggaaag atacctaaag gatcaacagc 6000 tcctggggat ttggggttgc tctggaaaac tcatttgcac cactgctgtg ccttggaatg 6060 ctagttggag taataaatct ctggaacaga ttggaatcac acgacctgga tggagtggga 6120 cagagaaatt aacaattaca caagcttaat acactcctta attgaagaat cgcaaaacca 6180 gcaagaaaag aatgaacaag aattattgga attagataaa tgggcaagtt tgtggaattg 6240 gtttaacata acaaattggc tgtggtatat aaaattattc ataatgatag taggaggctt 6300 ggtaggttta agaatagttt ttgctgtact ttctatagtg aatagagtta ggcagggata 6360 ttcaccatta tcgtttcaga cccacctccc aaccccgagg ggacccgaca ggcccgaagg 6420 aatagaagaa gaaggtggag agagagacag agacagatcc attcgattag tgaacggatc 6480 tcgacggtta acttttaaaa gaaaaggggg gattgggggg tacagtgcag gggaaagaat 6540 agtagacata atagcaacag acatacaaac taaagaatta caaaaacaaa ttacaaaaat 6600 tcaaaatttt atcgataagc ttgggagttc cgcgttacat aacttacggt aaatggcccg 6660 cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata 6720 gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc 6780 cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac 6840 ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg 6900 cagtacatct acgtattagt catcgctatt accatggtga tgcggttttg gcagtacatc 6960 aatgggcgtg gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgtc 7020 aatgggagtt tgttttggca ccaaaatcaa cgggactttc caaaatgtcg taacaactcc 7080 gccccattga cgcaaatggg cggtaggcgt gtacggtggg aggtctatat aagcagagct 7140 cgtttagtga accgtcagat cgcctggaga cgccatccac gctgttttga cctccataga 7200 agacaccgac tctagaggat ccggactagt atggtgagca agggcgagga ggataacatg 7260 gccatcatca aggagttcat gcgcttcaag gtgcacatgg agggctccgt gaacggccac 7320 gagttcgaga tcgagggcga gggcgagggc cgcccctacg agggcaccca gaccgccaag 7380 ctgaaggtga ccaagggtgg ccccctgccc ttcgcctggg acatcctgtc ccctcagttc 7440 atgtacggct ccaaggccta cgtgaagcac cccgccgaca tccccgacta cttgaagctg 7500 tccttccccg agggcttcaa gtgggagcgc gtgatgaact tcgaggacgg cggcgtggtg 7560 accgtgaccc aggactcctc cctgcaggac ggcgagttca tctacaaggt gaagctgcgc 7620 ggcaccaact tcccctccga cggccccgta atgcagaaga agaccatggg ctgggaggcc 7680 tcctccgagc ggatgtaccc cgaggacggc gccctgaagg gcgagatcaa gcagaggctg 7740 aagctgaagg acggcggcca ctacgacgct gaggtcaaga ccacctacaa ggccaagaag 7800 cccgtgcagc tgcccggcgc ctacaacgtc aacatcaagt tggacatcac ctcccacaac 7860 gaggactaca ccatcgtgga acagtacgaa cgcgccgagg gccgccactc caccggcggc 7920 atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgcgatagg 7980 gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag 8040 ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc 8100 acctacggca agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg 8160 cccaccctcg tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac 8220 atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc 8280 atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac 8340 accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg 8400 gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag 8460 aagaacggca tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag 8520 ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac 8580 aaccactacc tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac 8640 atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctgtac 8700 aagtaaggcg cgccggtgta caccctgcag gggtttaaac ccacgcgtcg accagtggtc 8760 gaccctgtgg aatgtgtgtc agttagggtg tggaaagtcc ccaggctccc cagcaggcag 8820 aagtatgcaa agcatgcatc tcaattagtc agcaaccagg tgtggaaagt ccccaggctc 8880 cccagcaggc agaagtatgc aaagcatgca tctcaattag tcagcaacca tagtcccgcc 8940 cctaactccg cccatcccgc ccctaactcc gcccagttcc gcccattctc cgccccatgg 9000 ctgactaatt ttttttattt atgcagaggc cgaggccgcc tcggcctctg agctattcca 9060 gaagtagtga ggaggctttt ttggaggc 9088 <210> 55 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> arRNA-UAG <400> 55 gcugcuucau guggucgggg uagcggcuga agcacugcac gccguagguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 56 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> arRNA-UUG <400> 56 gcugcuucau guggucgggg uagcggcuga agcacugcac gccguugguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 57 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> arRNA-UCG <400> 57 gcugcuucau guggucgggg uagcggcuga agcacugcac gccgucgguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 58 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> arRNA-UGG <400> 58 gcugcuucau guggucgggg uagcggcuga agcacugcac gccguggguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 59 <211> 2130 <212> DNA <213> Artificial Sequence <220> <223> Full-length cDNA sequence of ADAR2-r16 <400> 59 atggatatag aagatgaaga aaacatgagt tccagcagca ctgatgtgaa ggaaaaccgc 60 aatctggaca acgtgtcccc caaggatggc agcacacctg ggcctggcga gggctctcag 120 ctctccaatg ggggtggtgg tggccccggc agaaagcggc ccctggagga gggcagcaat 180 ggccactcca agtaccgcct gaagaaaagg aggaaaacac cagggcccgt cctccccaag 240 aacgccctga tgcagctgaa tgagatcaag cctggtttgc agtacacact cctgtcccag 300 actgggcccg tgcacgcgcc tttgtttgtc atgtctgtgg aggtgaatgg ccaggttttt 360 gagggctctg gtcccacaaa gaaaaaggca aaactccatg ctgctgagaa ggccttgagg 420 tctttcgttc agtttcctaa tgcctctgag gcccacctgg ccatggggag gaccctgtct 480 gtcaacacgg acttcacatc tgaccaggcc gacttccctg acacgctctt caatggtttt 540 gaaactcctg acaaggcgga gcctcccttt tacgtgggct ccaatgggga tgactccttc 600 agttccagcg gggacctcag cttgtctgct tccccggtgc ctgccagcct agcccagcct 660 cctctccctg ccttaccacc attcccaccc ccgagtggga agaatcccgt gatgatcttg 720 aacgaactgc gcccaggact caagtatgac ttcctctccg agagcgggga gagccatgcc 780 aagagcttcg tcatgtctgt ggtcgtggat ggtcagttct ttgaaggctc ggggagaaac 840 aagaagcttg ccaaggcccg ggctgcgcag tctgccctgg ccgccatttt taacttgcac 900 ttggatcaga cgccatctcg ccagcctatt cccagtgagg gtcttcagct gcatttaccg 960 caggttttag ctgacgctgt ctcacgcctg gtcataggta agtttggtga cctgaccgac 1020 aacttctcct cccctcacgc tcgcagaata ggtctggctg gagtcgtcat gacaacaggc 1080 acagatgtta aagatgccaa ggtgatatgt gtttctacag gatctaaatg tattaatggt 1140 gaatacctaa gtgatcgtgg ccttgcatta aatgactgcc atgcagaaat agtatctcgg 1200 agatccttgc tcagatttct ttatacacaa cttgagcttt acttaaataa cgaggatgat 1260 caaaaaagat ccatctttca gaaatcagag cgaggggggt ttaggctgaa ggagaatata 1320 cagtttcatc tgtacatcag cacctctccc tgtggagatg ccagaatctt ctcaccacat 1380 gaggcaatcc tggaagaacc agcagataga cacccaaatc gtaaagcaag aggacagcta 1440 cggaccaaaa tagaggctgg tcaggggacg attccagtgc gcaacaatgc gagcatccaa 1500 acgtgggacg gggtgctgca aggggagcgg ctgctcacca tgtcctgcag tgacaagatt 1560 gcacgctgga acgtggtggg catccaggga tcactgctca gcattttcgt ggagcccatt 1620 tacttctcga gcatcatcct gggcagcctt taccacgggg accacctttc cagggccatg 1680 taccagcgga tctccaacat agaggacctg ccacctctct acaccctcaa caagcctttg 1740 ctcacaggca tcagcaatgc agaagcacgg cagccaggga aggcccccat attcagtgtc 1800 aactggacgg taggcgactc cgctattgag gtcatcaacg ccacgactgg gaagggagag 1860 ctgggccgcg cgtcccgcct gtgtaagcac gcgttgtact gtcgctggat gcgtgtgcac 1920 ggcaaggttc cctcccactt actacgctcc aagattacca agcccaacgt gtaccatgag 1980 acaaagctgg cggcaaagga gtaccaggcc gccaaggcgc gtctgttcac agccttcatc 2040 aaggcggggc tgggggcctg ggtggagaag cccaccgagc aggaccagtt ctcactcacg 2100 cccgattaca aggatgacga cgataagtag 2130 <210> 60 <211> 720 <212> DNA <213> Artificial Sequence <220> <223> BFP cDNA sequence <400> 60 atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60 ggcgacgtaa acggccacaa gttcagcgtg tctggcgagg gcgagggcga tgccacctac 120 ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180 ctcgtgacca ccctgaccca cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240 cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300 ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360 gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420 aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480 ggcatcaagg cgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540 gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600 tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660 ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtga 720 <210> 61 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> arRNA-UUU <400> 61 gcugcuucau guggucgggg uagcggcuga agcacugcac gccguuuguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 62 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> arRNA-AUU <400> 62 gcugcuucau guggucgggg uagcggcuga agcacugcac gccgauuguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 63 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> arRNA-GUU <400> 63 gcugcuucau guggucgggg uagcggcuga agcacugcac gccgguuguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 64 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> arRNA-CUU <400> 64 gcugcuucau guggucgggg uagcggcuga agcacugcac gccgcuuguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 65 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> arRNA-UUA <400> 65 gcugcuucau guggucgggg uagcggcuga agcacugcac gccguuaguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 66 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> arRNA-AUA <400> 66 gcugcuucau guggucgggg uagcggcuga agcacugcac gccgauaguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 67 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> arRNA-GUA <400> 67 gcugcuucau guggucgggg uagcggcuga agcacugcac gccgguaguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 68 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> arRNA-CUA <400> 68 gcugcuucau guggucgggg uagcggcuga agcacugcac gccgcuaguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 69 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> arRNA-AUG <400> 69 gcugcuucau guggucgggg uagcggcuga agcacugcac gccgaugguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 70 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> arRNA-GUG <400> 70 gcugcuucau guggucgggg uagcggcuga agcacugcac gccggugguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 71 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> arRNA-CUG <400> 71 gcugcuucau guggucgggg uagcggcuga agcacugcac gccgcugguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 72 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> arRNA-UUC <400> 72 gcugcuucau guggucgggg uagcggcuga agcacugcac gccguucguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 73 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> arRNA-AUC <400> 73 gcugcuucau guggucgggg uagcggcuga agcacugcac gccgaucguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 74 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> arRNA-GUC <400> 74 gcugcuucau guggucgggg uagcggcuga agcacugcac gccggucguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 75 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> arRNA-CUC <400> 75 gcugcuucau guggucgggg uagcggcuga agcacugcac gccgcucguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 76 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> Ran-91 <400> 76 uaauccugaa uaucgcgcaa uuccccagca gagaacaucg cggugugaac gucccuuuau 60 accgggcagg uauagcugaa aucagcgugg c 91

Claims (57)

  1. ADAR-리크루팅 RNA(arRNA) 또는 상기 arRNA를 인코딩하는 컨스트럭트를 숙주세포에 도입하는 단계를 포함하는, 숙주세포의 표적 잔기 위치에 표적 RNA를 편집하는 방법으로서,
    여기에서, 상기 arRNA는 표적 RNA에 혼성화하는 상보적 RNA 시퀀스를 포함하고; 상기 표적 잔기는 표적 RNA에서 표적 잔기의 5' 최근접 이웃 잔기(업스트림 잔기), 표적 잔기, 및 표적 RNA에서 표적 잔기의 3' 최근접 이웃 잔기(다운스트림 잔기)를 포함하는 3-염기 모티프에 위치하며, 여기에서 상기 3-염기 모티프는 UAG가 아니고, 상기 상보적 RNA 시퀀스는 표적 RNA에서 업스트림 잔기 및/또는 다운스트림 잔기에 정반대되는 불일치를 포함하는 방법.
  2. 제 1 항에 있어서,
    상기 상보적 RNA 시퀀스는 표적 RNA에서 업스트림 잔기에 정반대되는 불일치를 포함하는 방법.
  3. 제 1 항 또는 제 2 항에 있어서,
    상기 상보적 RNA 시퀀스는 표적 RNA에서 다운스트림 잔기에 정반대되는 불일치를 포함하는 방법.
  4. 제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
    상기 표적 잔기는 아데노신인 방법.
  5. 제 4 항에 있어서,
    상기 업스트림 잔기는 G, A 및 C로 이루어지는 군으로부터 선택되는 방법.
  6. 제 1 항 내지 제 4 항 중 어느 한 항에 있어서,
    상기 3-염기 모티프는 GAG, GAC, GAA, GAU, AAG, AAC, AAA, AAU, CAG, CAC, CAA, CAU, UAA, UAC 및 UAU로 이루어지는 군으로부터 선택되는 방법.
  7. 제 4 항 내지 제 6 항 중 어느 한 항에 있어서,
    상기 상보적 RNA 시퀀스는 표적 RNA에서 표적 아데노신에 정반대되는 시티딘, 아데노신 또는 우리딘을 포함하는 방법.
  8. 제 4 항 내지 제 7 항 중 어느 한 항에 있어서,
    상기 상보적 RNA 시퀀스는 표적 RNA에서 비표적 아데노신에 각각 반대되는 하나 이상의 불일치를 추가로 포함하는 방법.
  9. 제 4 항 내지 제 8 항 중 어느 한 항에 있어서,
    상기 3-염기 모티프는 GAU이고, 상기 상보적 RNA 시퀀스는 3-염기 모티프에 반대되는 ACG, UCC, CCU 또는 ACA를 포함하는 방법.
  10. 제 9 항에 있어서,
    상기 3-염기 모티프는 GAU이고, 상기 상보적 RNA 시퀀스는 3-염기 모티프에 반대되는 ACG를 포함하는 방법.
  11. 제 4 항 내지 제 8 항 중 어느 한 항에 있어서,
    상기 3-염기 모티프는 GAA이고, 상기 상보적 RNA 시퀀스는 3-염기 모티프에 반대되는 UCA, CCG, CCC 또는 UCG를 포함하는 방법.
  12. 제 11 항에 있어서,
    상기 3-염기 모티프는 GAA이고, 상기 상보적 RNA 시퀀스는 3-염기 모티프에 반대되는 UCA 또는 UCG를 포함하는 방법.
  13. 제 4 항 내지 제 8 항 중 어느 한 항에 있어서,
    상기 3-염기 모티프는 GAC이고, 상기 상보적 RNA 시퀀스는 3-염기 모티프에 반대되는 GCG 또는 GCA를 포함하는 방법.
  14. 제 13 항에 있어서,
    상기 3-염기 모티프는 GAC이고, 상기 상보적 RNA 시퀀스는 3-염기 모티프에 반대되는 GCG를 포함하는 방법.
  15. 제 4 항 내지 제 8 항 중 어느 한 항에 있어서,
    상기 3-염기 모티프는 GAG이고, 상기 상보적 RNA 시퀀스는 3-염기 모티프에 반대되는 CCG, CCA, CCC, UCC 또는 UCG를 포함하는 방법.
  16. 제 15 항에 있어서,
    상기 3-염기 모티프는 GAG이고, 상기 상보적 RNA 시퀀스는 3-염기 모티프에 반대되는 CCG를 포함하는 방법.
  17. 제 4 항 내지 제 8 항 중 어느 한 항에 있어서,
    상기 표적 RNA에서 업스트림 잔기는 G, C, A 및 U로 이루어지는 군으로부터 선택된 뉴클레오티드이고, 바람직한 순서는 다음과 같은: G>C≒A>U인 방법.
  18. 제 4 항 내지 제 8 항 중 어느 한 항에 있어서,
    상기 3-염기 모티프의 업스트림 잔기는 G이고, 상기 상보적 RNA에서 업스트림 잔기에 반대되는 염기는 G 또는 A인 방법.
  19. 제 4 항 내지 제 18 항 중 어느 한 항에 있어서,
    상기 3-염기 모티프의 다운스트림 잔기는 상기 상보적 RNA에 반대되는 염기에 엄격히 상보적인 방법.
  20. 제 4 항 내지 제 19 항 중 어느 한 항에 있어서,
    상기 arRNA는 RNA에 작용하는 아데노신 탈아미노효소(ADAR) 또는 ADAR 촉매 도메인을 포함하는 융합 단백질을 리크루팅하여 표적 RNA에서 표적 아데노신을 탈아미노화하는 방법.
  21. 제 20 항에 있어서,
    상기 ADAR 촉매 도메인을 포함하는 융합 단백질은 표적화 도메인을 추가로 포함하는 방법.
  22. 제 20 항 또는 제 21 항에 있어서,
    ADAR 단백질 또는 ADAR 촉매 도메인을 포함하는 융합 단백질, 또는 ADAR 단백질 또는 ADAR 촉매 도메인을 포함하는 융합 단백질을 인코딩하는 컨스트럭트는 숙주세포 내로 외인성으로 도입되는 방법.
  23. 제 20 항에 있어서,
    상기 ADAR 단백질은 숙주세포에 의해 내인성으로 발현되는 방법.
  24. 제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
    상기 표적 잔기는 시티딘이고, 상기 arRNA는 표적 RNA에서 표적 시티딘을 탈아미노화하기 위해 RNA에 작용하고 시티딘 탈아미노효소 활성을 갖는 탈아미노효소를 리크루팅하는 방법.
  25. 제 24 항에 있어서,
    상기 표적 RNA에서 표적 시티딘이 위치한 3-염기 모티프는 GCG, GCC, GCA, GCU, ACG, ACC, ACA, ACU, CCG, CCC, CCA, CCU, UCA, UCC, UCU 및 UCG로 이루어지는 군으로부터 선택되는 어느 하나에 위치되는 방법.
  26. 제 24 항 또는 제 25 항에 있어서,
    상기 상보적 RNA 시퀀스는 표적 RNA에서 표적 시티딘에 반대되는 시티딘, 아데노신 또는 우리딘을 포함하는 방법.
  27. 제 24 항 내지 제 26 항 중 어느 한 항에 있어서,
    상기 상보적 RNA 시퀀스는 표적 RNA에서 비표적 시티딘에 각각 반대되는 하나 이상의 불일치를 추가로 포함하는 방법.
  28. 제 24 항 내지 제 27 항 중 어느 한 항에 있어서,
    상기 3-염기 모티프의 업스트림 잔기는 G이고, 상기 상보적 RNA에서 업스트림 잔기에 반대되는 염기는 G인 방법.
  29. 제 24 항 내지 제 27 항 중 어느 한 항에 있어서,
    상기 3-염기 모티프는 GCA이고, 상기 상보적 RNA 시퀀스는 3-염기 모티프에 반대되는 UUG 또는 UCG를 포함하는 방법.
  30. 제 29 항에 있어서,
    상기 3-염기 모티프는 GCA이고, 상기 상보적 RNA 시퀀스는 3-염기 모티프에 반대되는 UUG를 포함하는 방법.
  31. 제 24 항 내지 제 27 항 중 어느 한 항에 있어서,
    상기 3-염기 모티프는 CCA이고, 상기 상보적 RNA 시퀀스는 3-염기 모티프에 반대되는 AUG를 포함하는 방법.
  32. 제 24 항 내지 제 27 항 중 어느 한 항에 있어서,
    상기 표적 RNA에서 업스트림 잔기는 G, C, A 및 U로 이루어지는 군으로부터 선택된 뉴클레오티드이고, 바람직한 순서는 다음과 같은: G>C>A≒U인 방법.
  33. 제 24 항 내지 제 32 항 중 어느 한 항에 있어서,
    시티딘 탈아미노효소 활성을 갖는 탈아미노효소는 ADAR 단백질의 유전자 변형에 의해 얻어지는 C-to-U 촉매 활성을 갖는 탈아미노효소 또는 ADAR 촉매 도메인을 포함하는 융합 단백질인 방법.
  34. 제 33 항에 있어서,
    상기 시티딘 탈아미노효소 활성을 갖는 탈아미노효소는 표적화 도메인을 추가로 포함하는 방법.
  35. 제 21 항 또는 제 34 항에 있어서,
    상기 표적 도메인은 촉매 활성이 없는 SNAP-tag, λN 펩티드 및 Cas13 단백질로 이루어지는 군으로부터 선택되는 어느 하나인 방법.
  36. 제 22 항 또는 제 24 항에 있어서,
    상기 컨스트럭트는 바이러스 벡터, 플라스미드 및 선형 핵산쇄로 이루어지는 군으로부터 선택되는 어느 하나인 방법.
  37. 제 1 항 내지 제 36 항 중 어느 한 항에 있어서,
    상기 arRNA는 약 20-260개 뉴클레오티드의 길이를 갖는 방법.
  38. 제 1 항 내지 제 37 항 중 어느 한 항에 있어서,
    상기 arRNA는 단일가닥 RNA인 방법.
  39. 제 1 항 내지 제 38 항 중 어느 한 항에 있어서,
    상기 상보적 RNA 시퀀스는 단일가닥이고, 상기 arRNA은 하나 이상의 이중가닥 영역을 추가로 포함하는 방법.
  40. 제 1 항 내지 제 39 항 중 어느 한 항에 있어서,
    상기 arRNA는 ADAR-리크루팅 도메인을 추가로 포함하는 방법.
  41. 제 1 항 내지 제 40 항 중 어느 한 항에 있어서,
    상기 arRNA는 하나 이상의 화학적 변형을 포함하는 방법.
  42. 제 1 항 내지 제 40 항 중 어느 한 항에 있어서,
    상기 arRNA는 임의의 화학적 변형을 포함하지 않는 방법.
  43. 제 1 항 내지 제 42 항 중 어느 한 항에 있어서,
    상기 표적 RNA는 메신저 RNA 전구체, 메신저 RNA, 리보솜 RNA, 전이 RNA, 긴 논코딩 RNA 및 작은 RNA로 이루어지는 군으로부터 선택되는 RNA인 방법.
  44. 제 1 항 내지 제 43 항 중 어느 한 항에 있어서,
    표적 RNA에서 표적 잔기가 편집되어, 표적 RNA에서 미스센스 돌연변이, 조기 종결 코돈, 비정상적 스플라이싱 또는 선택적 스플라이싱, 대안적으로 표적 RNA에서 미스센스 돌연변이, 조기 종료 코돈, 비정상적 스플라이싱 또는 선택적 스플라이싱을 초래하는 방법.
  45. 제 1 항 내지 제 44 항 중 어느 한 항에 있어서,
    상기 표적 RNA에서 표적 잔기는 편집되어, 표적 RNA에 의해 인코딩되는 단백질의 포인트 돌연변이, 절단, 연장 및/또는 미스폴딩을 초래하고, 대안적으로 표적 RNA에서 미스센스 돌연변이, 조기 종료 코돈, 비정상적 스플라이싱 또는 선택적 스플라이싱을 반전시킴으로써 기능성, 전장, 정확한 폴드 및/또는 야생형 단백질을 얻는 방법.
  46. 제 1 항 내지 제 45 항 중 어느 한 항에 있어서,
    상기 숙주세포는 진핵세포인 방법.
  47. 제 46 항에 있어서,
    상기 숙주세포는 포유동물 세포인 방법.
  48. 제 47 항에 있어서,
    상기 숙주세포는 인간 또는 마우스 세포인 방법.
  49. 제 1 항 내지 제 48 항 중 어느 한 항에 기재된 방법에 의해 생산된 편집된 RNA, 또는 상기 편집된 RNA를 포함하는 숙주세포.
  50. 제 49 항에 기재된 복수의 RNA, 또는 제 49 항에 기재된 편집된 RNA를 포함하는 복수의 숙주세포를 포함하는 라이브러리.
  51. 제 1 항 내지 제 48 항 중 어느 한 항에 기재된 방법에 의해 개체의 세포에서 질환 또는 상태와 관련된 표적 RNA를 편집하는 것을 포함하는, 개체에서 질환 또는 상태를 치료 또는 예방하는 방법.
  52. 제 51 항에 있어서,
    상기 질환 또는 상태는 유전성 유전자 질환, 또는 하나 이상의 후천적 유전자 돌연변이와 관련된 질환 또는 상태인 방법.
  53. 제 1 항 내지 제 49 항 중 어느 한 항에 기재된 방법에 사용되는 arRNA를 포함하는 arRNA.
  54. 제 53 항에 기재된 arRNA를 포함하며,
    여기에서 상기 arRNA는 임의의 화학적 변형을 포함하지 않는 바이러스 벡터, 플라스미드 또는 선형 핵산쇄.
  55. 제 53 항에 기재된 복수의 arRNA, 또는 제 54 항에 기재된 복수의 바이러스 벡터, 플라스미드 또는 선형 핵산을 포함하는 라이브러리.
  56. 제 53 항에 기재된 arRNA, 또는 제 54 항에 기재된 바이러스 벡터, 플라스미드 또는 선형 핵산쇄를 포함하는 조성물.
  57. 제 53 항에 기재된 arRNA, 또는 제 54 항에 기재된 바이러스 벡터, 플라스미드 또는 선형 핵산쇄를 포함하는 숙주세포.
KR1020237004198A 2020-07-06 2021-07-06 개선된 rna 편집 방법 KR20230035362A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN2020100467 2020-07-06
CNPCT/CN2020/100467 2020-07-06
PCT/CN2021/104801 WO2022007803A1 (zh) 2020-07-06 2021-07-06 一种改善的rna编辑方法

Publications (1)

Publication Number Publication Date
KR20230035362A true KR20230035362A (ko) 2023-03-13

Family

ID=79552779

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237004198A KR20230035362A (ko) 2020-07-06 2021-07-06 개선된 rna 편집 방법

Country Status (9)

Country Link
US (1) US20230272379A1 (ko)
EP (1) EP4177345A1 (ko)
JP (1) JP2023532375A (ko)
KR (1) KR20230035362A (ko)
CN (1) CN116194582A (ko)
AU (1) AU2021305359A1 (ko)
CA (1) CA3185231A1 (ko)
TW (1) TW202214853A (ko)
WO (1) WO2022007803A1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023152371A1 (en) 2022-02-14 2023-08-17 Proqr Therapeutics Ii B.V. Guide oligonucleotides for nucleic acid editing in the treatment of hypercholesterolemia
WO2023185231A1 (en) * 2022-04-02 2023-10-05 Edigene Therapeutics (Beijing) Inc. Engineered adar-recruiting rnas and methods of use for usher syndrome
WO2024013360A1 (en) 2022-07-15 2024-01-18 Proqr Therapeutics Ii B.V. Chemically modified oligonucleotides for adar-mediated rna editing
WO2024013361A1 (en) 2022-07-15 2024-01-18 Proqr Therapeutics Ii B.V. Oligonucleotides for adar-mediated rna editing and use thereof
GB202215614D0 (en) 2022-10-21 2022-12-07 Proqr Therapeutics Ii Bv Heteroduplex rna editing oligonucleotide complexes
WO2024099575A1 (en) * 2022-11-11 2024-05-16 Eberhard Karls Universität Tübingen Artificial nucleic acids for site-directed editing of a target rna

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116622704A (zh) 2012-07-25 2023-08-22 布罗德研究所有限公司 可诱导的dna结合蛋白和基因组干扰工具及其应用
CN111328290A (zh) 2017-06-26 2020-06-23 博德研究所 用于靶向核酸编辑的基于crispr/cas-腺嘌呤脱氨酶的组合物、系统和方法
WO2019071048A1 (en) 2017-10-04 2019-04-11 The Broad Institute, Inc. SYSTEMS, METHODS AND COMPOSITIONS FOR TARGETED NUCLEIC ACID EDITION
EP3814498A1 (en) 2018-06-29 2021-05-05 Eberhard-Karls-Universität Tübingen Artificial nucleic acids for rna editing
AU2019336793A1 (en) * 2018-09-06 2021-04-08 The Regents Of The University Of California RNA and DNA base editing via engineered ADAR recruitment
ES2962434T3 (es) 2018-10-12 2024-03-19 Univ Beijing Procedimientos y composiciones para editar ARN

Also Published As

Publication number Publication date
CN116194582A (zh) 2023-05-30
JP2023532375A (ja) 2023-07-27
US20230272379A1 (en) 2023-08-31
CA3185231A1 (en) 2022-01-13
EP4177345A1 (en) 2023-05-10
AU2021305359A1 (en) 2023-02-16
WO2022007803A1 (zh) 2022-01-13
TW202214853A (zh) 2022-04-16

Similar Documents

Publication Publication Date Title
KR20230035362A (ko) 개선된 rna 편집 방법
KR102267412B1 (ko) Rna 전사 벡터 및 이의 용도
JP6884430B2 (ja) ハンチントン病のaav処置
KR101819803B1 (ko) 혈소판 표적화 치료
KR20210005179A (ko) 헤모글로빈-관련 돌연변이를 편집하기 위한 상동성-지정 복구 주형 설계 및 전달
CA2688804A1 (en) Polycistronic vector for human induced pluripotent stem cell production
CN112041436A (zh) 雷帕霉素抗性细胞
CN111575248A (zh) 一种慢病毒、重组间充质干细胞及其构建方法和应用
CN113897359A (zh) 一种改善的rna编辑方法
CN108137664B (zh) 用于治疗伴侣动物的aav-epo
CN113481237A (zh) 一种预防和治疗新生血管眼部疾病的基因药物
US20220330533A1 (en) Systems and methods for batch cultivation of non-transgenic heterogametes
CN112501101A (zh) 天然除草剂thaxtomins的高产菌株及其制备方法和用途
AU2023241362A1 (en) Chimeric opsin GPCR proteins
CN114085874B (zh) 一种制备肝功能可逆的永生化肝细胞的方法及其应用
CN113943749B (zh) 一种基于crispr基因编辑系统提高同源重组效率的方法
US11486010B2 (en) Genetically encoded biosensors for detection of polyketides
CN109929029A (zh) 一种提高重组人凝血因子viii高效表达的方法
US6423544B1 (en) Compositions and methods for producing recombinant virions
KR20200037206A (ko) 과립상 각막 변성증에 대한 유전자 치료약
KR101973007B1 (ko) 외래 단백질 발현 증가를 위한 재조합 전이 벡터
CN112831524B (zh) 人工改造的重组腺病毒载体、由其包装的病毒及其应用
CN112680430B (zh) 一种CRISPR SpCas9突变体及其应用
KR20190113508A (ko) 염증성 질환 예방 또는 치료용 유전자/전달체 복합체
CN112538471B (zh) 一种CRISPR SpCas9(K510A)突变体及其应用

Legal Events

Date Code Title Description
A201 Request for examination