KR20220004674A - Rna를 편집하기 위한 방법 및 조성물 - Google Patents

Rna를 편집하기 위한 방법 및 조성물 Download PDF

Info

Publication number
KR20220004674A
KR20220004674A KR1020217037218A KR20217037218A KR20220004674A KR 20220004674 A KR20220004674 A KR 20220004674A KR 1020217037218 A KR1020217037218 A KR 1020217037218A KR 20217037218 A KR20217037218 A KR 20217037218A KR 20220004674 A KR20220004674 A KR 20220004674A
Authority
KR
South Korea
Prior art keywords
nucleotides
rna
drna
target
adenosine
Prior art date
Application number
KR1020217037218A
Other languages
English (en)
Inventor
펑페이 위안
얀샤 자오
넝인 리우
저슈엔 이
강빈 탕
원성 웨이
리앙 취
쭝이 이
스여우 주
춘후이 왕
중정 차오
줘 저우
Original Assignee
에디진 인크.
페킹 유니버시티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에디진 인크., 페킹 유니버시티 filed Critical 에디진 인크.
Publication of KR20220004674A publication Critical patent/KR20220004674A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/11Antisense
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/16Aptamers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/31Chemical structure of the backbone
    • C12N2310/315Phosphorothioates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/32Chemical structure of the sugar
    • C12N2310/3212'-O-R Modification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3519Fusion with another nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/352Nature of the modification linked to the nucleic acid via a carbon atom
    • C12N2310/3521Methyl
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/50Physical structure
    • C12N2310/53Physical structure partially self-complementary or closed
    • C12N2310/531Stem-loop; Hairpin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/50Physical structure
    • C12N2310/53Physical structure partially self-complementary or closed
    • C12N2310/533Physical structure partially self-complementary or closed having a mismatch or nick in at least one of the strands

Abstract

타겟 RNA에서 아데노신의 탈아미노화를 위해 숙주 세포에 탈아미노효소-리크루팅 RNA를 도입하여 RNA를 편집하는 방법이 제공된다. RNA 편집 방법 및 이를 포함하는 조성물에 사용되는 탈아미노효소-리크루팅 RNA가 더 제공된다.

Description

RNA를 편집하기 위한 방법 및 조성물
(관련 출원 및 참조에 의한 원용)
본 출원은 2019년 4월 15일에 출원된 국제 출원 번호 PCT/CN2019/082713의 국제 출원, 및 2019년 12월 30일에 출원된 국제 출원 번호 PCT/CN2019/129952의 국제 출원에 대한 우선권을 주장한다.
상술의 출원서, 및 그 내부에 인용되거나 출원진행 중 인용된 모든 문서("출원에 인용된 문서") 및 상기 출원에 인용된 문서에서 인용 또는 참조된 모든 문서, 및 본원에 인용 또는 참조된 모든 문서("본원에 인용된 문서"), 및 본원에 인용된 문서에서 인용 또는 참조된 모든 문서를 비롯하여, 본원에 언급된 모든 제품에 대한 제조사의 지침서, 설명서, 제품사양서 및 제품시트 또는 본원에 참조로 포함된 모든 문서는 여기에 참조로 포함되며, 본 발명의 실시에 사용될 수 있다. 보다 구체적으로, 모든 참조 문서는 각각의 개별 문서가 참조로 포함되는 것으로 구체적이고 개별적으로 표시된 바와 동일한 정도로 참조로 포함된다.
(ASCII 텍스트 파일의 서열 목록 제출)
하기 ASCII 텍스트 파일에 대한 제출 내용은 그 전체가 참조로 여기에 포함된다: 서열 목록의 컴퓨터 판독가능 형식(CRF)(파일명: FD0020PCT-sequence listing.TXT, 기록 날짜: 2020년 4월 13일, 크기: 133KB).
본 발명은 타겟 RNA에서 하나 이상의 아데노신을 탈아미노화하기 위해 아데노신 탈아미노효소를 리크루팅할 수 있는 조작된 RNA를 사용하여 RNA를 편집하기 위한 방법 및 조성물에 관한 것이다.
게놈 편집은 생물의학 연구 및 질환 치료제의 개발을 위한 강력한 도구이다. 지금까지, 가장 대중적인 게놈 편집 기술은 박테리아와 고세균의 적응 면역 체계로부터 개발된 크리스퍼(CRISPR: Clustered Regularly Interspaced Short Palindromic Repeats)-Cas 시스템이다. 크리스퍼-Cas는 게놈 DNA를 정확하게 타겟팅하고 절단하여, 이중-가닥 DNA 절단(DSB: Double-Strand DNA Break)을 생성할 수 있다. DSB는 비상동 말단 연결(NHEJ: non-homologous end joining) 경로를 통해 수복될 수 있으며, 그 결과 대부분의 경우에 유전자를 비활성화하는 삽입 또는 결실(Indel)을 야기한다. 대안적으로, 상동성-지정 수복(HDR: homology-directed repair) 경로는 상동성 템플릿 dsDNA 또는 ssDNA를 사용하여 DSB를 수복할 수 있으므로, 정확한 게놈 편집을 달성할 수 있다.
최근에는, RNA 아데노신 탈아미노효소(ADAR: Adenosine Deaminase Acting on RNA)와 같은 탈아미노효소 단백질을 활용하여 RNA를 편집하기 위한 새로운 도구가 개발되었다. 포유류 세포에는 3가지 유형의 ADAR 단백질인 ADAR1(2개의 이소폼, p110 및 p150), ADAR2 및 ADAR3(촉매 비활성)이 존재한다. ADAR 단백질의 촉매 기질은 이중-가닥 RNA이다. ADAR은 아데노신(A)으로부터 -NH2 기를 제거함으로써, A를 후속 세포 전사 및 번역 과정 동안에 구아노신(G)으로 인식되어 시티딘(C)과 쌍이 되는 이노신(I)으로 변환시킬 수 있다. 연구자들은 BoxB 스템 루프와 안티센스 RNA로 이루어지는 융합 RNA에 의해 특정 RNA 타겟에 결합하도록 안내될 수 있는 λN-ADARDD 시스템을 구축하도록 λN 펩티드를 인간 ADAR1 또는 ADAR2 탈아미노효소 도메인에 융합시켰다. 이 방법은 타겟 A 염기에 A-C 미스매치를 도입함으로써 타겟 A를 I로 변환시키고, 그 결과 A에서 G로의 RNA 염기 편집이 야기된다. RNA 편집을 위한 다른 방법에는 포유류 세포에서 ADAR1 또는 ADAR2 단백질을 과발현하여 타겟 RNA를 편집하도록 안티센스 RNA를 R/G 모티프(ADAR-리크루팅 RNA 스캐폴드)에 융합시키는 단계, 및 RNA를 정확하게 타겟팅하고 편집하도록 dCas13-ADAR을 사용하는 단계를 포함한다. 출원 PCT/EP2017/071912에서는 핵산에 대한 리크루팅 도메인 또는 외인성 단백질을 필요로 하지 않은 RNA 편집 방법이 개시되어 있다. 타겟 RNA에 상보적인 서열을 포함하는 합성된 RNA를 사용하여 A에서 G로의 염기 편집을 유도하였다. 상기 방법에 사용되는 RNA는 짧으며(54개의 뉴클레오티드 미만), 특히 편집 효율성을 높이기 위해서는 특별히 변형되어야 한다.
핵산 편집은 생물학적 연구와 치료제의 개발에 엄청난 잠재력을 갖고 있다. 현재 DNA 또는 RNA 편집을 위한 대부분의 도구는 외인성 단백질을 살아있는 유기체에 도입하는데 의존하여, 가능한 비정상적인 이펙터 활성, 전달 한계 및 면역원성으로 인해 잠재적인 위험 또는 기술적 장벽의 영향을 받는다. 일부 다른 도구는 복잡한 화학적 변형이 필요하지만, 여전히 낮은 편집 효율성으로 이어진다. 일부 양태에 있어서, 본 출원은 타겟팅된 RNA 편집을 위한 탈아미노효소를 활용하기 위해 짧은 RNA를 사용하는 프로그램가능한 접근법을 제공하며, 일부 실시형태에 있어서, 탈아미노효소는 ADAR(Adenosine Deaminase Acting on RNA) 단백질이고, 일부 실시형태에 있어서, ADAR은 내인성 ADAR 단백질이다. 일부 양태에 있어서, 본 출원은 타겟 RNA의 특정 부위에서 아데노신을 이노신으로 변환하기 위해 ADAR1 또는 ADAR2를 리크루팅하도록 타겟 전사물에 부분적으로 상보적인 조작된 RNA를 제공한다. 본 명세서에 기재된 방법은 총괄하여 "LEAPER"(Leveraging Endogenous ADAR for Programmable Editing on RNA, RNA 상의 프로그래밍가능한 편집을 위한 내인성 ADAR 활용)라고 지칭되며, ADAR-리크루팅 RNA는 "dRNA" 또는 "arRNA"로 상호교환적으로 지칭된다.
일 양태에 있어서, 본 출원은 탈아미노효소-리크루팅 RNA(dRNA) 또는 탈아미노효소-리크루팅 RNA를 인코딩하는 구축물을 숙주 세포에 도입하는 단계를 포함하는, 숙주 세포에서 타겟 RNA를 편집하는 방법을 제공하며, 상기 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 dRNA는 타겟 뉴클레오티드를 탈아미노화하기 위해 탈아미노효소, 일부 실시형태에 있어서는 타겟 RNA에서 타겟 아데노신(A)을 탈아미노화하기 위해 RNA 아데노신 탈아미노효소(ADAR)를 리크루팅할 수 있다. 소정 실시형태에 있어서, 숙주 세포는 진핵 세포이다. 일부 실시형태에 있어서, 숙주 세포는 포유류 세포이다. 일부 실시형태에 있어서, 숙주 세포는 인간 세포이다. 일부 실시형태에 있어서, 숙주 세포는 쥐과 세포이다. 일부 실시형태에 있어서, 숙주 세포는 원핵 세포이다. 일부 실시형태에 있어서, 숙주 세포는 1차 세포이다. 일부 실시형태에 있어서, 숙주 세포는 T 세포이다.
소정 실시형태에 있어서, ADAR은 숙주 세포에 자연적으로 또는 내인적으로 존재하며, 예를 들면 진핵 세포에 자연적으로 또는 내인적으로 존재한다. 일부 실시형태에 있어서, ADAR은 숙주 세포에 의해 내인적으로 발현된다. 소정 실시형태에 있어서, ADAR은 숙주 세포에 대해 외인성이다. 일부 실시형태에 있어서, ADAR은 핵산(예를 들면, DNA 또는 RNA)에 의해 인코딩된다. 일부 실시형태에 있어서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 숙주 세포 내로 도입하는 단계를 포함한다. 일부 실시형태에 있어서, 상기 방법은 임의의 단백질을 숙주 세포 내로 도입하는 단계를 포함하지 않는다. 소정 실시형태에 있어서, ADAR은 ADAR1 및/또는 ADAR 2이다. 일부 실시형태에 있어서, ADAR은 hADAR1, hADAR2, 뮤린 ADAR1 및 뮤린 ADAR2로 이루어진 군으로부터 선택되는 하나 이상의 ADAR이다.
소정 실시형태에 있어서, dRNA는 Cas(CRISPR-연관 단백질)에 의해 인식되지 않는다. 일부 실시형태에 있어서, dRNA는 CRISPR/Cas 시스템에서 사용되는 crRNA, tracrRNA 또는 gRNA를 포함하지 않는다. 일부 실시형태에 있어서, 상기 방법은 Cas 또는 Cas 융합 단백질을 숙주 세포 내로 도입하는 단계를 포함하지 않는다.
소정 실시형태에 있어서, 타겟 RNA에서의 타겟 A의 탈아미노화는 타겟 RNA에서의 미스센스 돌연변이, 조기 정지 코돈, 비정상적 스플라이싱, 또는 선택적 스플라이싱을 초래한다. 일부 실시형태에 있어서, 타겟 RNA는 단백질을 인코딩하고, 타겟 RNA에서의 타겟 A의 탈아미노화는 단백질의 점 돌연변이, 절단, 신장 및/또는 잘못 접힘을 초래한다. 일부 실시형태에 있어서, 타겟 RNA에서의 타겟 A의 탈아미노화는 타겟 RNA에서 미스센스 돌연변이, 조기 정지 코돈, 비정상적 스플라이싱, 또는 선택적 스플라이싱의 역전을 초래한다. 일부 실시형태에 있어서, 타겟 RNA가 절단된, 신장된, 돌연변이된 또는 잘못 접힘된 단백질을 인코딩하는 경우, 타겟 RNA에서의 타겟 A의 탈아미노화는 타겟 RNA에서의 미스센스 돌연변이, 조기 정지 코돈, 비정상적 스플라이싱 또는 선택적 스플라이싱의 역전에 의해 기능적, 전장의, 올바르게 접힌 및/또는 야생형 단백질을 야기한다. 일부 실시형태에 있어서, 타겟 RNA는 조절 RNA이고, 타겟 A의 탈아미노화는 타겟 RNA에 의해 조절되는 하류 분자의 발현 변화를 초래한다. 소정 실시형태에 있어서, 상기 방법은 타겟 RNA에 의해 인코딩된 단백질의 점 돌연변이 및/또는 잘못 접힘을 생성하고, 및/또는 타겟 RNA에서 조기 정지 코톤, 비정상 스플라이스 부위 및/또는 선택적 스플라이스 부위를 생성하도록 타겟 RNA 상에서의 편집을 위해 내인성 아데노신 탈아미노효소를 활용하는 방법에 대한 것이다.
소정 실시형태에 있어서, 숙주 세포에서 복수의 타겟 RNA를 편집하는 방법이 제공되며, 상기 방법은 복수의 dRNA 또는 복수의 dRNA를 인코딩하는 구축물을 숙주 세포 내로 도입하는 단계를 포함하고, 상기 복수의 탈아미노효소-리크루팅 RNA는 각각 복수의 타겟 RNA에서 대응하는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 각각의 dRNA는 대응하는 타겟 RNA에서 타겟 아데노신(A)을 탈아미노화하기 위해 RNA 아데노신 탈아미노효소(ADAR)를 리크루팅할 수 있다.
일부 실시형태에 있어서, 상기 기재된 바와 같은 RNA 편집 방법 중 어느 하나에 의해 생성되는 편집된 RNA 또는 편집된 RNA를 갖는 숙주 세포가 제공된다.
일 양태에 있어서, 본 출원은 상술한 RNA 편집 방법 중 어느 하나에 따라 개체의 세포에서 질환 또는 상태와 관련된 타겟 RNA를 편집하는 단계를 포함하는, 개체에서의 질환 또는 상태를 치료 또는 예방하는 방법을 제공한다. 일부 실시형태에 있어서, 상기 방법은 생체외 세포에서 타겟 RNA를 편집하는 단계를 포함한다. 일부 실시형태에 있어서, 상기 방법은 편집된 세포를 개체에게 투여하는 단계를 포함한다. 일부 실시형태에 있어서, 상기 방법은 유효량의 dRNA 또는 dRNA를 인코딩하거나 포함하는 구축물을 개체에게 투여하는 단계를 포함한다. 일부 실시형태에 있어서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물(예를 들면, 바이러스 벡터)을 세포에 도입하는 단계를 더 포함한다. 일부 실시형태에 있어서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물(예를 들면, 바이러스 벡터)을 개체에게 투여하는 단계를 더 포함한다. 일부 실시형태에 있어서, 질환 또는 상태는 유전성 유전 질환이다. 일부 실시형태에 있어서, 질환 또는 상태는 하나 이상의 후천적 유전 돌연변이, 예를 들면 약물 내성과 연관된다.
본 출원의 일 양태는 타겟 RNA에서 타겟 아데노신을 탈아미노화하기 위해, 탈아미노효소, 일부 실시형태에 있어서는 RNA 아데노신 탈아미노효소(ADAR)를 리크루팅함으로써 타겟 RNA에서 타겟 아데노신의 탈아미노화를 위한, 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하는 dRNA를 제공한다.
본 명세서에 기재된 방법 또는 dRNA 중 어느 하나에 따른 일부 실시형태에 있어서, dRNA는 타겟 RNA와 결합할 때 타겟 RNA에서 편집되는 타겟 아데노신의 정반대쪽에 있는 시티딘(C), 아데노신(A) 및 우리딘(U)을 포함하는 RNA 서열을 포함한다. 상기 타겟 아데노신의 정반대쪽에 있는 시티딘(C), 아데노신(A) 및 우리딘(U)을 총칭하여 "타겟팅 뉴클레오티드"라고 하거나, 별도로 "타겟팅 C", "타겟팅 A" 및 "타겟팅 U"라고 한다. 소정 실시형태에 있어서, RNA 서열은 타겟 RNA에서 비타겟 아데노신(들)과 각각 정반대쪽에 있는 하나 이상의 구아노신을 더 포함한다. 소정 실시형태에 있어서, 타겟 RNA 서열에서 타겟 A의 5' 최근접 이웃은 U, C, A 및 G로부터 선택되는 뉴클레오티드이고 선호도는 U>C≒A>G이며, 타겟 RNA 서열에서 타겟 A의 3' 최근접 이웃은 G, C, A 및 U로부터 선택된 뉴클레오티드이며 선호도는 G>C>A≒U이다. 소정 실시형태에 있어서, 타겟 A는 타겟 RNA에서 UAG, UAC, UAA, UAU, CAG, CAC, CAA, CAU, AAG, AAC, AAA, AAU, GAG, GAC, GAA 및 GAU이다. 소정 실시형태에 있어서, 3-염기 모티프가 UAG인 경우, dRNA는 3-염기 모티프에서 U의 정반대쪽에 있는 A, 타겟 A의 정반대쪽에 있는 C, 및 3-염기 모티브에서 G의 정반대쪽에 있는 C, G 또는 U를 포함한다. 소정 실시형태에 있어서, 3-염기 모티프가 타겟 RNA에서 UAG인 경우, dRNA는 타겟 RNA의 UAG의 반대쪽에 있는 ACC, ACG 또는 ACU를 포함한다.
본 명세서에 기재된 방법 또는 dRNA 중 어느 하나에 따른 일부 실시형태에 있어서, 탈아미노효소-리크루팅 RNA는 40, 45, 50, 55, 60, 65, 70, 75 또는 80개 초과의 뉴클레오티드를 포함한다. 소정 실시형태에 있어서, 탈아미노효소-리크루팅 RNA는 40-260, 45-250, 50-240, 60-230, 65-220, 70-210, 70-200, 70-190, 70-180, 70-170, 70-160, 70-150, 70-140, 70-130, 70-120, 70-110, 70-100, 70-90, 70-80, 75-200, 80-190, 85-180, 90-170, 95-160, 100-150 또는 105-140개의 뉴클레오티드 길이이다. 일부 실시형태에 있어서, dRNA는 약 60-200개(예를 들면, 약 60-150, 65-140, 68-130, 또는 70-120개 중 임의의 것)의 길이이다.
본 명세서에 기재된 방법 또는 dRNA 중 어느 하나에 따른 일부 실시형태에 있어서, 본 명세서에 기재된 dRNA는 5' 말단에서 3' 말단으로: 5' 부분, 타겟 RNA에서 타겟 A의 정반대쪽에 있는 시티딘 미스매치, 및 3' 부분을 포함한다. 일부 실시형태에 있어서, 3' 부분은 약 7개의 뉴클레오티드 이상(예를 들면, 8개의 뉴클레오티드 이상, 9개의 뉴클레오티드 이상 및 10개의 뉴클레오티드 이상)의 뉴클레오티드이다. 일부 실시형태에 있어서, 3' 부분은 약 7개의 뉴클레오티드-25개의 뉴클레오티드 뉴클레오티드 길이(예를 들면, 약 8개의 뉴클레오티드-25개의 뉴클레오티드, 9개의 뉴클레오티드-25개의 뉴클레오티드, 10개의 뉴클레오티드-25개의 뉴클레오티드, 11개의 뉴클레오티드-25개의 뉴클레오티드, 12개의 뉴클레오티드-25개의 뉴클레오티드, 13개의 뉴클레오티드-25개의 뉴클레오티드, 14개의 뉴클레오티드-25개의 뉴클레오티드, 15개의 뉴클레오티드-25개의 뉴클레오티드, 16개의 뉴클레오티드-25개의 뉴클레오티드, 17개의 뉴클레오티드-25개의 뉴클레오티드, 18개의 뉴클레오티드-25개의 뉴클레오티드, 19개의 뉴클레오티드-25개의 뉴클레오티드, 20개의 뉴클레오티드-25개의 뉴클레오티드, 21개의 뉴클레오티드-25개의 뉴클레오티드, 22개의 뉴클레오티드-25개의 뉴클레오티드, 23개의 뉴클레오티드-25개의 뉴클레오티드, 24개의 뉴클레오티드-25개의 뉴클레오티드, 및 예를 들면 10개의 뉴클레오티드-15개의 뉴클레오티드 또는 2개의 뉴클레오티드-25개의 뉴클레오티드 뉴클레오티드 길이)이다. 일부 실시형태에 있어서, 5' 부분은 약 25개 이상(예를 들면, 약 30개의 뉴클레오티드 이상, 약 35개의 뉴클레오티드 이상, 약 40개의 뉴클레오티드 이상 및 약 45개의 뉴클레오티드 이상)의 뉴클레오티드이다. 일부 실시형태에 있어서, 5' 부분은 약 25개의 뉴클레오티드-85개의 뉴클레오티드 뉴클레오티드 길이(예를 들면, 약 25개의 뉴클레오티드-80개의 뉴클레오티드, 25개의 뉴클레오티드-75개의 뉴클레오티드, 25개의 뉴클레오티드-70개의 뉴클레오티드, 25개의 뉴클레오티드-65개의 뉴클레오티드, 25개의 뉴클레오티드-60개의 뉴클레오티드, 30개의 뉴클레오티드-55개의 뉴클레오티드, 40개의 뉴클레오티드-55개의 뉴클레오티드, 또는 45개의 뉴클레오티드-55개의 뉴클레오티드 뉴클레오티드 길이)이다. 일부 실시형태에 있어서, 5' 부분은 약 25개의 뉴클레오티드-85개의 뉴클레오티드 뉴클레오티드 길이(예를 들면, 약 25개의 뉴클레오티드-80개의 뉴클레오티드, 25개의 뉴클레오티드-75개의 뉴클레오티드, 25개의 뉴클레오티드-70개의 뉴클레오티드, 25개의 뉴클레오티드-65개의 뉴클레오티드, 25개의 뉴클레오티드-60개의 뉴클레오티드, 30개의 뉴클레오티드-55개의 뉴클레오티드, 40개의 뉴클레오티드-55개의 뉴클레오티드, 또는 45개의 뉴클레오티드-55개의 뉴클레오티드 뉴클레오티드 길이)이고, 3' 부분은 약 7개의 뉴클레오티드-25개의 뉴클레오티드 뉴클레오티드 길이(예를 들면, 약 10개의 뉴클레오티드-15개의 뉴클레오티드 또는 21개의 뉴클레오티드-25개의 뉴클레오티드 뉴클레오티드 길이)이다. 일부 실시형태에 있어서, 5' 부분은 3' 부분보다 더 길다. 일부 실시형태에 있어서, 5' 부분은 약 55개의 뉴클레오티드 길이이고, 3' 부분은 약 15개의 뉴클레오티드 길이이다. 일부 실시형태에 있어서, dRNA에서 시티딘 미스매치의 위치는 본 명세서의 실시예에 기재된 임의의 dRNA에 따르고, dRNA는 예를 들면, X개의 뉴클레오티드-c-Y개의 뉴클레오티드의 형식일 수 있으며, 여기서 X는 5' 부분의 길이를 나타내고, Y는 3' 부분의 길이를 나타낸다: 55개의 뉴클레오티드-c-35개의 뉴클레오티드, 55개의 뉴클레오티드-c-25개의 뉴클레오티드, 55개의 뉴클레오티드-c-24개의 뉴클레오티드, 55개의 뉴클레오티드-c-23개의 뉴클레오티드, 55개의 뉴클레오티드-c-22개의 뉴클레오티드, 55개의 뉴클레오티드-c-21개의 뉴클레오티드, 55개의 뉴클레오티드-c-20개의 뉴클레오티드, 55개의 뉴클레오티드-c-19개의 뉴클레오티드, 55개의 뉴클레오티드-c-18개의 뉴클레오티드, 55개의 뉴클레오티드-c-17개의 뉴클레오티드, 55개의 뉴클레오티드-c-16개의 뉴클레오티드, 55개의 뉴클레오티드-c-15개의 뉴클레오티드, 55개의 뉴클레오티드-c-14개의 뉴클레오티드, 55개의 뉴클레오티드-c-13개의 뉴클레오티드, 55개의 뉴클레오티드-c-12개의 뉴클레오티드, 55개의 뉴클레오티드-c-11개의 뉴클레오티드, 55개의 뉴클레오티드-c-10개의 뉴클레오티드, 55개의 뉴클레오티드-c-9개의 뉴클레오티드, 55개의 뉴클레오티드-c-8개의 뉴클레오티드, 55개의 뉴클레오티드-c-7개의 뉴클레오티드, 55개의 뉴클레오티드-n-20개의 뉴클레오티드, 50개의 뉴클레오티드-n-20개의 뉴클레오티드, 45개의 뉴클레오티드-n-20개의 뉴클레오티드, 55개의 뉴클레오티드-n-15개의 뉴클레오티드, 50개의 뉴클레오티드-n-15개의 뉴클레오티드, 45개의 뉴클레오티드-c-45개의 뉴클레오티드, 45개의 뉴클레오티드-c-55개의 뉴클레오티드, 54개의 뉴클레오티드-c-12개의 뉴클레오티드, 53개의 뉴클레오티드-c-13개의 뉴클레오티드, 52개의 뉴클레오티드-c-14개의 뉴클레오티드, 51개의 뉴클레오티드-c-15개의 뉴클레오티드, 50개의 뉴클레오티드-c-16개의 뉴클레오티드, 49개의 뉴클레오티드-c-17개의 뉴클레오티드, 48개의 뉴클레오티드-c-18개의 뉴클레오티드, 47개의 뉴클레오티드-c-19개의 뉴클레오티드, 46개의 뉴클레오티드-c-20개의 뉴클레오티드, 45개의 뉴클레오티드-c-21개의 뉴클레오티드, 44개의 뉴클레오티드-c-22개의 뉴클레오티드, 43개의 뉴클레오티드-c-23개의 뉴클레오티드, 54개의 뉴클레오티드-c-15개의 뉴클레오티드, 53개의 뉴클레오티드-c-16개의 뉴클레오티드, 52개의 뉴클레오티드-c-17개의 뉴클레오티드, 51개의 뉴클레오티드-c-18개의 뉴클레오티드, 50개의 뉴클레오티드-c-19개의 뉴클레오티드, 49개의 뉴클레오티드-c-20개의 뉴클레오티드, 48개의 뉴클레오티드-c-21개의 뉴클레오티드, 47개의 뉴클레오티드-c-22개의 뉴클레오티드, 46개의 뉴클레오티드-c-23개의 뉴클레오티드, 54개의 뉴클레오티드-c-17개의 뉴클레오티드, 53개의 뉴클레오티드-n-18개의 뉴클레오티드, 52개의 뉴클레오티드-n-19개의 뉴클레오티드, 51개의 뉴클레오티드-n-20개의 뉴클레오티드, 50개의 뉴클레오티드-n-21개의 뉴클레오티드, 49개의 뉴클레오티드-n-22개의 뉴클레오티드, 및 48개의 뉴클레오티드-c-23.
소정 실시형태에 있어서, 타겟 RNA는 프리-메신저 RNA, 메신저 RNA, 리보솜 RNA, 전달 RNA, 긴 비-코딩 RNA 및 작은 RNA(예를 들면, miRNA)로 이루어지는 군으로부터 선택되는 RNA이다.
본 명세서에 기재된 방법 또는 dRNA 중 어느 하나에 따른 일부 실시형태에 있어서, dRNA는 단일-가닥 RNA이다. 일부 실시형태에 있어서, 상보적 RNA 서열은 단일-가닥이고, 상기 dRNA는 하나 이상의 이중-가닥 영역을 더 포함한다.
일부 실시형태에 있어서, dRNA는 2'-O-메틸화 및/또는 포스포로티오화와 같은 하나 이상의 변형을 포함한다. 일부 실시형태에 있어서, dRNA는 약 60-200개의 뉴클레오티드 길이이고, 하나 이상의 변형(예를 들면, 2'-O-메틸화 및/또는 포스포로티오화)을 포함한다. 일부 실시형태에 있어서, dRNA는 첫번째 및 마지막 3개의 뉴클레오티드에서의 2'-O-메틸화 및/또는 첫번째 및 마지막 3개의 뉴클레오티드간 연결에서의 포스포로티오화를 포함한다. 일부 실시형태에 있어서, dRNA는 첫번째 및 마지막 3개의 뉴클레오티드에서의 2'-O-메틸화, 첫번째 및 마지막 3개의 뉴클레오티드간 연결에서의 포스포로티오화, 및 하나 이상의 우리딘에서의, 예를 들면 모든 우리딘에서의 2'-O-메틸화를 포함한다. 일부 실시형태에 있어서, dRNA는 첫번째 및 마지막 3개의 뉴클레오티드에서의 2'-O-메틸화, 첫번째 및 마지막 3개의 뉴클레오티드간 연결에서의 포스포로티오화, 단일 또는 다수 또는 모든 우리딘에서의 2'-O-메틸화, 및 타겟 아데노신의 반대쪽에 있는 뉴클레오티드, 및/또는 타겟 아데노신의 반대쪽에 있는 뉴클레오티드 최근접 1개 또는 2개의 뉴클레오티드에서의 변형을 포함한다. 소정 실시형태에 있어서, 타겟 아데노신의 반대쪽에 있는 뉴클레오티드 및/또는 타겟 아데노신의 반대쪽에 있는 뉴클레오티드 최근접 1개 또는 2개의 뉴클레오티드에서의 변형은 2'-O-메틸화이다. 소정 실시형태에 있어서, 타겟 아데노신의 반대쪽에 있는 뉴클레오티드, 및/또는 타겟 아데노신의 반대쪽에 있는 뉴클레오티드 최근접 1개 또는 2개의 뉴클레오티드에서의 변형은 포스포로티오화 연결, 예를 들면 3'-포스포로티오화 연결이다. 소정 실시형태에 있어서, dRNA는 첫번째 및 마지막 3개의 뉴클레오티드에서의 2'-O-메틸화, 첫번째 및 마지막 3개의 뉴클레오티드간 연결에서의 포스포로티오화, 모든 우리딘에서의 2'-O-메틸화, 및 타겟 아데노신의 반대쪽에 있는 뉴클레오티드의 3' 말단 또는 5' 말단에 인접한 뉴클레오티드에서의 2'-O-메틸화를 포함한다. 소정 실시형태에 있어서, dRNA는 첫번째 및 마지막 3개의 뉴클레오티드에서의 2'-O-메틸화, 첫번째 및 마지막 3개의 뉴클레오티드간 연결에서의 포스포로티오화, 모든 우리딘에서의 2'-O-메틸화, 및 타겟 아데노신 및/또는 그것의 5' 및/또는 3' 최근접 뉴클레오티드의 반대쪽에 있는 뉴클레오티드에서의 3'-포스포로티오화를 포함한다. 일부 실시형태에 있어서, dRNA는 첫번째 및 마지막 5개의 뉴클레오티드에서의 2'-O-메틸화 및 첫번째 및 마지막 5개의 뉴클레오티드간 연결에서의 포스포로티오화를 포함한다.
본 명세서에 기재된 방법 중 어느 하나에 따른 소정 실시형태에 있어서, 타겟 RNA에 대한 편집 효율은 적어도 약 30%, 예를 들면 32%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 그 이상 중 적어도 어느 하나이다.
일부 실시형태에 있어서, 상기 기재된 dRNA 중 어느 하나를 인코딩하는 구축물(예를 들면, 바이러스 벡터 또는 플라스미드)이 제공된다. 일부 실시형태에 있어서, 구축물은 dRNA를 인코딩하는 서열에 작동가능하게 연결된 프로모터를 포함한다. 일부 실시형태에 있어서, 구축물은 DNA 구축물이다.
일부 실시형태에 있어서, 상기 기재된 dRNA 중 어느 하나에 따른 복수의 dRNA 또는 상기 기재된 구축물 중 어느 하나에 따른 복수의 구축물을 포함하는 라이브러리가 제공된다.
또한, 본 명세서에 기재된 dRNA 중 임의의 하나, 본 명세서에 기재된 구축물 중 임의의 하나, 또는 본 명세서에 기재된 라이브러리 중 임의의 하나를 포함하는 조성물, 숙주 세포, 키트 및 제조 물품이 더 제공된다.
도 1a-1h는 내인성 ADAR1 단백질을 사용하는 단일 dRNA를 사용한 RNA 편집을 도시한다. 도 1a 및 1b는 내인성 ADAR1 단백질을 사용한 RNA 편집의 도식적 표현을 도시한다. 도 1c는 내인성 ADAR1 단백질을 사용하여 dRNA로 리포터 mRNA를 편집하는 것을 도시한다. 도 1d는 도 1b의 결과의 통계적 분석을 도시한다. 도 1e는 ADAR1 녹아웃 및 ADAR1(p110), ADAR1(p150) 및 ADAR2 구제 결과를 도시한다. 도 1f는 도 1d의 결과의 통계적 분석을 도시한다. 도 1g는 293T-WT 세포에서 dRNA에 의해 매개되는 RNA 편집에 대한 ADAR1(p110), ADAR1(p150) 또는 ADAR2 과발현의 효과를 도시한다. 도 1h는 타겟팅 부위에서 A에서 G로의 편집이 확인된 딥 시퀀싱(즉, 차세대 시퀀싱, NGS) 결과를 도시한다.
도 2a-2h는 dRNA의 최적화를 도시한다. 도 2a는 타겟팅 아데노신의 반대쪽에 있는 4종류의 염기(A, U, C 및 G) 식별의 도식적 표현을 도시한다. 도 2b는 dRNA에 의한 RNA 편집 효율에 대한 타겟팅 아데노신의 반대쪽에 있는 염기 식별의 효과를 도시한다. 도 2c는 UAG 타겟팅 부위와 미스매치된 1개, 2개 또는 3개의 염기를 갖는 dRNA의 도시적 표현을 도시한다. 도 2d는 dRNA에 의한 리포터 RNA 편집에 대한 UAG 타겟팅 부위와 미스매치된 1개, 2개 또는 3개의 염기의 효과를 도시한다. dRNA는 타겟팅 아데노신에 대해 A-C 미스매치를 선호했다. 도 2e는 변이 길이를 갖는 dRNA의 도식적 표현을 도시한다. 도 2f는 이중 형광 리포터-2를 기반으로 한 RNA 편집 효율에 대한 dRNA 길이의 효과를 도시한다. 도 2g는 상이한 A-C 미스매치 위치의 도식적 표현을 도시한다. 도 2h는 RNA 편집 효율에 대한 A-C 미스매치 위치의 효과를 도시한다.
도 3a-3b는 본 출원의 예시적인 RNA 편집 방법을 통한 내인성 RNA 편집을 위한 편집 유연성을 도시한다. 도 3a는 16개의 상이한 3-염기 모티프 모두에서 내인성 RNA 편집 효율의 백분율 정량화를 도시한다. 도 3b는 16개의 상이한 3-염기 모티프에 대한 내인성 RNA 편집의 5' 및 3' 염기 선호도의 히트맵을 도시한다.
도 4a-4h는 293T 세포에서 dRNA로 내인성 유전자의 mRNA를 편집하는 것을 도시한다. 도 4a는 KRAS mRNA 타겟 및 변이 길이를 갖는 dRNA의 도식적 표현을 도시한다. 도 4b는 293T 세포에서 dRNA로 내인성 KRAS 유전자의 mRNA를 편집하는 것을 도시한다. 빈 벡터, dRNA-91개의 뉴클레오티드 플라스미드를 각각 293T-WT 세포에 형질감염시켰다. 60시간 후, RT-PCR을 위해 RNA를 단리하고, 이어서 cDNA를 증폭하고 Illumina NextSeq에서 시퀀싱했다. 도 4c는 PPIB mRNA 타겟(부위 1, 부위 2 및 부위 3) 및 대응하는 dRNA 설계의 도식적 표현을 도시한다. 도 4d, 4e 및 4f는 293T 세포에서 dRNA로 내인성 PPIB 유전자의 mRNA를 편집하는 것을 도시한다. 도 4g는 β-액틴 mRNA 타겟 및 dRNA(71개의 뉴클레오티드 및 131개의 뉴클레오티드)의 도식적 표현을 도시한다. 도 4h는 293T 세포에서 dRNA로 내인성 β-액틴 유전자의 mRNA를 편집하는 것을 도시한다.
도 5a-5g는 오프-타겟 분석을 도시한다. 도 5a는 PPIB mRNA 타겟(PPIB 부위 1)에 대한 A에서 I로의 편집이 분석된 서열 창의 도식적 표현을 도시한다. 흑색 화살표는 타겟팅된 아데노신을 나타낸다. 도 5b는 PPIB mRNA 타겟(PPIB 부위 1)을 타겟팅하는 151개의 뉴클레오티드 dRNA에 의한 A에서 I로의 RNA 편집의 딥 스퀀싱 정량화를 도시한다. 도 5c는 A에서 I로의 편집이 KRAS mRNA 타겟에 한해 분석된 서열 창의 도식적 표현을 도시한다. 흑색 화살표는 타겟팅된 아데노신을 나타낸다. 도 5d는 KRAS mRNA 타겟을 타겟팅하는 91개의 뉴클레오티드 및 111개의 뉴클레오티드 dRNA에 의한 A에서 I로의 RNA 편집의 딥 스퀀싱 정량화를 도시한다. 도 5e는 상이한 A-G 미스매치 조합을 함유하는 설계된 4종류의 91개의 뉴클레오티드 또는 111개의 뉴클레오티드 dRNA 변이체의 도식적 표현을 도시한다. A-G 미스매치는 도 5d의 통계 결과 및 상이한 아미노산의 유전자 코드에 대한 기존 지식을 기반으로 설계되었다. 도 5f는 도 5e에서의 dRNA 및 상이한 종류의 dRNA 변이체에 의한 타겟팅된 A56 편집의 결과를 도시한다. 도 5g는 111개의 뉴클레오티드 dRNA 및 KRAS mRNA 타겟을 타겟팅하는 4종류의 111개의 뉴클레오티드 dRNA 변이체에 의한 A에서 I로의 RNA 편집의 딥 스퀀싱 정량화를 도시한다.
도 6a-6h는 내인성 ADAR1 단백질을 활용하여 단일 dRNA를 이용한 RNA 편집을 도시한다. 도 6a는 dLbuCas13-ADARDD 융합 단백질에 의한 RNA 편집의 도식적 표현을 도시한다. 촉매적으로 비활성인 dLbuCas13은 ADAR1 또는 ADAR2의 RNA 탈아미노효소 도메인에 융합되었다. 도 6b는 이중 형광 리포터 mRNA 타겟 및 가이드 RNA 설계의 도식적 표현을 도시한다. 도 6c는 도 6a 및 도 6b의 결과에 대한 통계적 분석을 도시한다. 도 6d는 293T-WT 세포에서의 ADAR1 및 ADAR2의 mRNA 레벨을 도시한다. 도 6e는 게놈 PCR에 의한 293T-ADAR1-KO 세포주에서의 ADAR1 유전자의 유전자형 분석 결과를 도시한다. 도 6f는 웨스턴 블로팅을 통한 293T-WT 및 293T-ADAR1-KO 세포주에서의 ADAR1(p110) 및 ADAR1(p150)의 발현 레벨을 도시한다. 도 6g는 FACS를 통한 293T-WT 세포에서의 dRNA에 의해 매개된 RNA 편집에 대한 ADAR1(p110), ADAR1(p150) 또는 ADAR2의 과발현의 효과를 도시한다. 도 6h는 타겟 아데노신 부위에서 A에서 G로의 편집을 나타낸 생어 시퀀싱 결과를 나타낸다.
도 7a-7c는 dRNA의 최적화를 도시한다. 도 7a는 이중 형광 리포터-1을 기반으로 한 변이 길이를 갖는 dRNA 및 변이 길이를 갖는 dRNA에 의한 타겟팅된 mRNA 편집 결과의 도식적 표현을 도시한다. 도 7b는 이중 형광 리포터-1을 기반으로 한 RNA 편집 효율에 대한 상이한 A-C 미스매치 위치 및 A-C 미스매치 위치의 효과의 도식적 표현을 도시한다. 도 7c는 이중 형광 리포터-3을 기반으로 한 RNA 편집 효율에 대한 상이한 A-C 미스매치 위치 및 A-C 미스매치 위치의 효과의 도식적 표현을 도시한다.
도 8a-8b는 293T 세포에서의 dRNA를 이용한 내인성 유전자의 mRNA 편집을 도시한다. 도 8a는 293T 세포에서의 dRNA를 이용한 내인성 β-액틴 유전자(부위 2)의 mRNA 편집을 도시한다. 도 8b는 293T 세포에서의 dRNA를 이용한 내인성 GAPDH 유전자의 mRNA 편집을 도시한다.
도 9는 상이한 세포주에서의 dRNA에 의한 RNA 편집을 도시한다. 도 9a는 리포터 플라스미드와 dRNA 플라스미드가 상이한 세포주 내에 공-형질감염되었으며, 그 결과 dRNA가 다수의 세포주에서 양호하게 기능할 수 있음을 나타내어, dRNA 적용의 보편성을 보여준다.
도 10a-10d는 효율적인 예시적 RNA 편집 플랫폼의 탐색을 도시한다. 도 10a, dLbuCas13a-ADAR1DD(E1008Q) 융합 단백질 및 대응하는 crRNA를 도시한다. 촉매 불활성 LbuCas13a는 3×GGGGS 링커를 사용하여 ADAR1(과활동성 E1008Q 변이체)의 탈아미노효소 도메인에 융합되었다. crRNA(crRNACas13a)는 Lbu-crRNA 스캐폴드와 스페이서로 이루어졌으며, 표시된 바와 같이 A-C 미스매치를 갖는 타겟팅 RNA에 상보적이었다. 도 10b는 이중 형광 리포터 시스템 및 표시된 바와 같은 다양한 길이의 스페이서를 갖는 Lbu-crRNA의 도식적 표현을 도시한다. 도 10c는 EGFP 양성(EGFP+) 세포의 정량화를 도시한다. 리포터-1을 안정적으로 발현하는 HEK293T 세포를 dLbuCas13a-ADAR1DD(E1008Q)의 공동 발현 유무에 관계없이, 표시된 crRNACas13a의 길이로 형질감염시킨 후, FACS 분석을 행했다. 데이터는 평균±s.e.m.(n=3)으로 표시된다. 도 10d는 대조군(대조군 crRNA70) 또는 타겟팅 스페이서(crRNA70)를 사용하여 수행한 실험으로부터 얻어진 대표적 FACS 결과를 도시한다.
도 11a-11g는 타겟팅된 RNA 편집을 위해 내인성 ADAR1 단백질을 활용하는 예시적인 방법을 도시한다. 도 11a는 리포터-1 및 70개의 뉴클레오티드 arRNA의 도식적 표현을 도시한다. 도 11b는 리포터-1을 안정적으로 발현하는 야생형(HEK293T, 상단) 또는 ADAR1 녹아웃(HEK293T ADAR1-/-, 하단) 세포에서의 arRNA-유도 EGFP 발현의 대표적인 FACS 분석을 도시한다. 도 11c는 야생형 및 HEK293T ADAR1-/-세포에서의 ADAR1 단백질의 발현 레벨뿐만 아니라, ADAR1 이소폼(p110 및 p150)으로 형질감염된 HEK293T ADAR1-/-세포에서의 ADAR1 단백질의 발현 레벨을 나타내는 웨스턴 블롯 분석을 도시한다. 도 11d는 야생형 및 HEK293T ADAR1-/-세포에서의 ADAR2 단백질의 발현 레벨뿐만 아니라 ADAR2로 형질감염된 HEK293T ADAR1-/-세포에서의 ADAR2 단백질의 발현 레벨을 나타내는 웨스턴 블롯 분석을 도시한다. 도 11e는 EGFP 양성(EGFP+) 세포의 정량화를 도시한다. 리포터-1 및 표시된 ADAR-발현 구축물은 대조군 RNA70 또는 타겟팅 arRNA70과 함께 HEK293T ADAR1-/- 세포로 공-형질감염된 후, FACS 분석을 행했다. EGFP+ 백분율은 mCherry+에 의해 결정된 형질감염 효율에 의해 정규화되었다. 데이터는 평균값±s.e.m.(n=4)이다. 도 11f는 대조군 RNA70(상단) 또는 arRNA70(하단)-타겟팅된 영역에서의 생어 시퀀싱 결과를 나타내는 전기영동도를 도시한다. 도 11g는 딥 시퀀싱에 의해 타겟팅된 부위에서의 A에서 I로의 전환율의 정량화를 도시한다.
도 12a-12b는 ADAR1/ADAR2 및 arRNA-매개 RNA 편집의 mRNA 발현 레벨을 도시한다. 도 12a는 HEK293T 세포에서의 ADAR1 및 ADAR2의 mRNA 레벨을 나타내는 정량적 PCR을 도시한다. 데이터는 평균±s.e.m.(n=3)으로 표시된다. 도 12b는 도 1e로부터의 대표적인 FACS 결과를 도시한다.
도 13은 HEK293T 세포에서의 111개의 뉴클레오티드 arRNA 또는 대조군 RNA에 의한 타겟팅된 리포터-1 전사물의 발현 레벨에 대한 예시적인 LEAPER 방법의 효과를 입증하는 정량적 PCR 결과를 도시한다. 데이터는 평균±s.e.m.(n=3)으로 표시되고; 짝을 이루지 않은 양측 스튜던트 t-검정이고, ns는 유의하지 않음을 나타낸다.
도 14a-14d는 다수의 세포주에서 예시적인 LEAPER 방법을 사용한 타겟팅된 RNA 편집을 도시한다. 도 14a는 표시된 인간 세포주에서의 ADAR1, ADAR2 및 ADAR3의 발현 레벨을 나타내는 웨스턴 블롯 결과를 도시한다. β-튜불린은 로딩 대조군으로 사용되었다. 도시된 데이터는 3개의 독립적 실험을 대표한다. ADAR1-/-/ADAR2는 ADAR2를 과발현하는 ADAR1-녹아웃 HEK293T 세포를 나타낸다. 도 14b는 β-튜불린 발현에 의해 정규화된 상대적 ADAR 단백질 발현 레벨을 도시한다. 도 14c는 표시된 인간 세포가 71개의 뉴클레오티드 대조군 arRNA(대조군 RNA71) 또는 71개의 뉴클레오티드 타겟팅 arRNA(arRNA71)와 함께, 리포터-1로 형질감염된 후, 수행된 FACS 분석을 도시한다. 도 14d는 표시된 마우스 세포주를 도 14c에 기재된 바와 같이 분석한 것을 도시한다. EGFP+ 백분율은 mCherry+에 의해 결정된 형질감염 효율에 의해 정규화되었다. 도 14b, 14c 및 14d의 오차 막대는 모두 평균±s.e.m.(n=3)을 나타내고; 짝을 이루지 않은 양측 스튜던트 t-검정은 *P<0.05; **P<0.01; ***P<0.001; ****P<0.0001이고; ns는 유의하지 않음을 나타낸다.
도 15a-15c는 리포터-1(도 15a), -2(도 15b), 및 -3(도 15c)뿐만 아니라 그 대응하는 arRNA의 도식적 표현을 도시한다.
도 16a-16g는 예시적인 LEAPER 방법의 특성화 및 최적화를 도시한다. 도 16a의 상단은 타겟 UAG의 반대쪽에 있는 변경된 삼중항(5'-CNA, N은 A, U, C 또는 G를 나타냄)을 갖는 arRNA의 설계의 도식적 표현이고, 하단은 RNA 편집 효율에 대한 타겟팅된 아데노신의 반대쪽에 있는 가변 염기의 효과를 나타내는 EGFP+%를 도시한다. 도 16b의 상단은 A-C 미스매치(5'-N1CN2)에서 시티딘에 인접하여 있는 변경된 이웃 염기를 갖는 arRNA의 설계를 도시한다. 하단은 RNA 편집 효율에 대한 N1CN2의 16개의 상이한 조합의 효과를 도시한다. 도 16c는 A-C 미스매치에서 시티딘의 5' 및 3' 최근접 이웃 부위의 선호도의 요약을 도시한다. 도 16d의 상단은 가변 길이를 갖는 arRNA의 설계를 도시하고, 하단은 리포터-1 및 리포터-2를 기반으로 한 RNA 편집 효율에 대한 arRNA 길이의 영향을 도시한다. 도 16e의 상단은 가변 A-C 미스매치 위치를 갖는 arRNA의 설계를 도시한다. 하단은 리포터-1 및 리포터-2를 기반으로 한 RNA 편집 효율에 대한 A-C 미스매치 위치의 영향을 도시한다. 도 16f의 상단은 111개의 뉴클레오티드 arRNA(arRNA111)에 대해 타겟팅된 아데노신(5'-N1AN2) 및 반대쪽 모티프(5'-N2CN1)를 둘러싸고 있는 가변의 가장 가까운 이웃 염기를 갖는 리포터-3에서의 삼중항 모티프 설계를 도시한다. 하단은 5'-N1AN2 모티프에서의 타겟팅된 아데노신에 대한 편집률을 나타내는 딥 시퀀싱 결과를 도시한다. 도 16g는 리포터-3에서 LEAPER-매개 편집의 5' 및 3' 염기 선호도를 요약한 것이다. 도 16a, 16b, 16d, 16e 및 16f에서의 오차 막대는 모두 평균값±s.e.m.(n=3)을 나타낸다.
도 17a-17i는 예시적인 LEAPER 방법을 사용한 내인성 전사물의 편집을 도시한다. 도 17a는 4개의 질환 관련 유전자(PPIB, KRAS, SMAD4 및 FANCC)의 타겟팅 내인성 전사물 및 대응하는 arRNA의 도식을 도시한다. 도 17b는 표시된 길이의 arRNA를 도입함으로써 PPIB, KRAS, SMAD4 및 FANCC 전사물의 타겟팅된 아데노신에 대한 편집률을 나타내는 딥 시퀀싱 결과를 도시한다. 도 17c는 내인성 PPIB, FANCC 및 IDUA 전사물의 비-UAN 부위에 대한 편집률을 나타내는 딥 시퀀싱 결과를 도시한다. 도 17d는 2개의 111개의 뉴클레오티드 arRNA에 의한 다중 편집률을 도시한다. 표시된 arRNA는 단독으로 형질감염되거나 또는 HEK293T 세포로 공-형질감염되었다. 2개의 부위의 타겟팅된 편집은 공-형질감염된 세포로부터 측정되었다. 도 17e는 151개의 뉴클레오티드 arRNA에 의해 커버되는 PPIB 전사물 서열의 도식을 도시한다. 흑색 화살표는 타겟팅된 아데노신을 나타낸다. 모든 아데노신은 적색으로 마킹되었다. 도 17f는 PPIB 유전자를 타겟팅하는 표시된 길이의 arRNA(청색의 굵은 프레임으로 마킹함)에 의해 커버되는 아데노신에 대한 편집률의 히트맵을 도시한다. 111개의 뉴클레오티드 arRNA 또는 arRNA151-PPIB 커버 영역의 경우, A22, A30, A33 및 A34의 편집률은 이 영역을 증폭하기 위한 효과적인 PCR 프라이머가 부족하기 때문에 RNA-seq에 의해 결정되었다. 그렇지 않으면, 편집률은 타겟팅된 딥 시퀀싱 분석에 의해 결정되었다. 도 17g의 상단은 111개의 뉴클레오티드 arRNA(arRNA111)에서 타겟팅하는 아데노신(5'-N1AN2) 및 반대쪽의 모티프(5'-N2'GN1')를 둘러싸고 있는 가변의 가장 가까운 이웃 염기를 갖는 리포터-3에서의 삼중항 모티프의 설계를 도시한다. 하단은 편집률을 나타내는 딥 시퀀싱 결과를 도시한다. 도 17h의 상단은 5'-UAG 또는 5'-AAG 모티프의 반대쪽에 있는 5'-N1GN2 모티프에서의 2개의 연속한 미스매치를 갖는 arRNA의 설계를 도시한다. 딥 시퀀싱 결과는 5'-UAG 모티프(좌측 하단) 또는 5'-AAG 모티프(우측 하단)의 반대쪽에 있는 5'-N1GN2 모티프에서 2개의 연속한 미스매치를 갖는 arRNA111에 의한 편집률을 나타낸다. 도 17i는 KRAS 유전자를 타겟팅하는 조작된 arRNA111 변이체에 의해 커버되는 아데노신에 대한 편집률의 히트맵을 도시한다. 도 17b, 도 17c, 도 17d, 도 17g 및 도 17h에서의 데이터는 평균±s.e.m.(n=3)으로 표시되고; 짝을 이루지 않은 양측 스튜던트 t-검정은 *P<0.05; **P<0.01; ***P<0.001; ****P<0.0001이고; NS는 유의하지 않음을 나타낸다. (f 및 i)에서의 데이터는 평균(n=3)으로 표시된다.
도 18a-18b는 타겟팅된 전사물 및 단백질 생성물의 발현 레벨에 대한 예시적인 LEAPER 방법의 효과를 도시한다. 도 18a는 HEK293T 세포에서 대응하는 151개의 뉴클레오티드 arRNA 또는 대조군 RNA에 의해 PPIB, KRAS, SMAD4 및 FANCC로부터의 타겟팅된 전사물의 발현 레벨을 나타내는 정량적 PCR을 도시한다. 데이터는 평균±s.e.m.(n=3)으로 표시되고; 짝을 이루지 않은 양측 스튜던트 t-검정은 *P<0.05; **P<0.01; ***P<0.001; ****P<0.0001이고; ns는 유의하지 않음을 나타낸다. 도 18b는 HEK293T 세포에서 151개의 뉴클레오티드 arRNA에 의해 타겟팅된 KRAS 유전자의 단백질 생성물에 미치는 영향을 나타내는 웨스턴 블롯 결과를 도시한다. β-튜불린은 로딩 대조군으로 사용되었다.
도 19a-19f는 예시적인 LEAPER 방법을 사용한 내인성 전사물의 편집을 도시한다. 도 19a는 151개의 뉴클레오티드 arRNA에 의해 커버되는 KARS 전사물 서열의 도식을 도시한다. 화살표는 타겟팅 아데노신을 나타낸다. 모든 아데노신은 적색으로 마킹했다. 도 19b는 KARS 전사물에서 표시된 arRNA(청색의 굵은 프레임으로 마킹함)에 의해 커버되는 아데노신에 대한 편집률의 히트맵을 도시한다. 도 19c는 151개의 뉴클레오티드 arRNA에 의해 커버되는 SMAD4 전사물의 도식을 도시한다. 도 19d는 SMAD4 전사물에서 표시된 arRNA에 의해 커버되는 아데노신에 대한 편집률의 히트맵을 도시한다. 도 19e는 151개의 뉴클레오티드 arRNA에 의해 커버되는 FANCC 전사물의 도식을 도시한다 도 19f는 FANCC 전사물에서 표시된 arRNA에 의해 커버되는 아데노신에 대한 편집률의 히트맵을 도시한다. 각각의 arRNA에 대해 이중체 RNA의 영역은 청색의 굵은 프레임으로 강조 표시된다. 데이터(도 19b, 19d 및 19f)는 평균(n=3)으로 표시된다.
도 20a-20d는 LEAPER에 의한 RNA 편집의 전장 전사체(transcriptome-wide) 특이성을 도시한다. 도 20a 및 20b는 대조군 RNA151 및 arRNA151-PPIB의 전장 전사체의 오프-타겟팅 분석을 도시한다. 온-타겟팅 부위(PPIB)는 적색으로 강조 표시된다. 대조군 RNA 및 PPIB-타겟팅 RNA군 모두에서 식별된 잠재적 오프-타겟 부위는 청색으로 라벨링된다. 도 20c는 오프-타겟 부위와 대응하는 대조군 RNA151 또는 arRNA151-PPIB 사이의 예측된 어닐링 친화도를 도시한다. 오프-타겟 부위(편집 부위의 150개의 뉴클레오티드 상류 및 하류) 및 대응하는 대조군 RNA151 또는 arRNA151-PPIB에 의해 형성된 이중 가닥 RNA의 최소 자유 에너지(ΔG)는 온라인 웹사이트 도구인 RNAhybrid를 사용하여 예측했다. 도 20d의 상단은 NCBI-BLAST를 통해 상동 서열을 검색함으로써 예측되는 arRNA151-PPIB와 표시된 잠재적 오프-타겟 부위 사이의 고도로 상보적인 영역의 도식을 도시한다. 하단은 arRNA151-PPIB의 온-타겟 부위 및 모든 예측된 오프-타겟 부위에 대한 편집률을 나타내는 딥 시퀀싱을 도시한다. 데이터는 평균±s.e.m.(n=3)으로 표시된다.
도 21a-21b는 잠재적 오프-타겟의 평가를 도시한다. 도 21a는 NCBI-BLAST를 통해 상동성 서열을 검색함으로써 예측되는 arRNA111-FANCC의 고도로 상보적인 영역 및 표시된 잠재적 오프-타겟 서열의 도식을 도시한다. 도 21b는 arRNA111-FANCC의 온-타겟 부위 및 모든 예측된 오프-타겟 부위에서의 편집률을 나타내는 딥 시퀀싱을 도시한다. 모든 데이터는 평균±s.e.m.(n=3)으로 표시된다.
도 22a-22f는 포유류 세포에서의 예시적인 LEAPER 방법을 적용한 안전성 평가를 도시한다. 도 22a 및 22b는 전장 전사체 RNA 시퀀싱에 의한 네이티브 편집 부위에 대한 대조군 RNA151(a) arRNA151-PPIB(b)가 미치는 효과의 전장 전사체 분석을 도시한다. 피어슨의 상관계수 분석은 네이티브 편집 부위에서의 상이한 RNA 편집률을 평가하기 위해 사용되었다. 도 22c 및 22d는 전사물 레벨의 RNA-seq 데이터를 사용하여 대조군 RNA151(c) arRNA151-PPIB(d)의 효과의 상이한 유전자 발현 분석을 도시한다. 피어슨의 상관계수 분석을 사용하여, 상이한 유전자 발현을 평가했다. 도 22e 및 22f는 선천적인 면역 반응에 대한 arRNA 형질감염의 효과를 도시한다. 표시된 arRNA 또는 폴리(I:C)를 HEK293T 세포에 형질감염시켰다. 이어서, 정량적 PCR을 사용하여, 총 RNA를 분석하여 IFN-β(e) 및 IL-6(f)의 발현 레벨을 결정했다. 데이터(e 및 f)는 평균±s.e.m.(n=3)으로 표시된다.
도 23a-23d는 LEAPER에 의한 돌연변이 TP53W53X의 전사 조절 활성의 수복을 도시한다. 도 23a의 상단은 c158G>A 임상 관련 넌센스 돌연변이(Trp53Ter)를 함유하는 111개의 뉴클레오티드 arRNA에 의해 커버되는 TP53 전사물 서열의 도식을 도시한다. 흑색 화살표는 타겟팅된 아데노신을 나타낸다. 모든 아데노신은 적색으로 마킹했다. 하단은 "편집하기 쉬운" 모티프에 대한 잠재적 오프-타겟을 최소화하기 위해, arRNA111-AG1의 경우에는 46번째 A에 대해, 또한 arRNA111-AG4의 경우에는 16번째 A, 46번째 A, 91번째 A 및 94번째 A에 대해 A-G 미스매치를 갖는 TP53W53X 전사물을 타겟팅하는 2개의 최적화된 arRNA의 설계를 도시한다. 도 23b는 arRNA111, arRNA111-AG1 및 arRNA111-AG4에 의한 TP53W53X 전사물에 대한 타겟팅된 편집을 나타내는 딥 시퀀싱 결과를 도시한다. 도 23c는 HEK293T TP53-/-세포에서 TP53W53X 전사물로부터 전장 p53 단백질의 회복된 생성을 나타내는 웨스턴 블롯을 도시한다. 도 23d는 공-형질감염된 레닐라 루시퍼라아제 벡터에 의해 정규화된 p53-파이어플라이 루시퍼라아제 리포터 시스템을 사용하여 복원된 p53 단백질의 전사 조절 활성의 검출을 도시한다. 데이터(b, c 및 d)는 평균±s.e.m.(n=3)으로 표시되고; 짝을 이루지 않은 양측 스튜던트 t-검정은 *P<0.05; **P<0.01; ***P<0.001; ****P<0.0001이고; ns는 유의하지 않음을 나타낸다.
도 24는 예시적인 LEAPER 방법에 의한 돌연변이 TP53W53X 전사물의 편집을 도시한다. 상단은 111개의 뉴클레오티드 arRNA에 의해 커버된 TP53 전사물 서열의 도식을 도시한다. 화살표는 타겟팅된 아데노신을 표시한다. 모든 아데노신은 적색으로 마킹했다. 하단은 TP53 전사물에서 표시된 arRNA로 커버된 아데노신의 편집률의 히트맵을 도시한다.
도 25는 Clin Var 데이터로부터의 G에서 A로의 돌연변이 및 대응하는 111개의 뉴클레오티드 arRNA를 함유하는 선택된 질환 관련 cDNA의 도식적 표현을 도시한다.
도 26은 예시적인 LEAPER 방법에 의한 병원성 돌연변이의 교정을 도시한다. 표시된 바와 같이(도 25 및 이하의 arRNA 및 대조군 RNA 및 질환 관련 cDNA의 서열의 표), 6개의 병원성 유전자로부터 임상 관련 돌연변이를 타겟팅하는, 대응하는 111개의 뉴클레오티드 arRNA에 의한 ClinVar 데이터로부터 질환 관련 G>A 돌연변이의 A에서 I로의 교정을 도시한다. 데이터는 평균±s.e.m.(n=3)으로 표시되고; 짝을 이루지 않은 양측 스튜던트 t-검정은 *P<0.05; **P<0.01; ***P<0.001; ****P<0.0001이고; ns는 유의하지 않음을 나타낸다.
도 27a-27c는 예시적인 LEAPER 방법에 의한 다수의 인간 1차 세포에서의 RNA 편집을 도시한다. 도 27a는 LEAPER 매개 RNA 편집에 의해 유도된 EGFP 양성(EGFP+) 세포의 정량화를 도시한다. 인간 1차 폐섬유아세포 및 인간 1차 기관지 상피세포를 151개의 뉴클레오티드 대조군 RNA(대조군 RNA151) 또는 151개의 뉴클레오티드 타겟팅 arRNA(arRNA151)와 함께 리포터-1로 형질감염시킨 후, FACS 분석을 수행했다. 도 27b 및 27c는 인간 1차 폐섬유아세포, 인간 1차 기관지 상피세포(b) 및 인간 1차 T세포(c)에서의 PPIB 전사물에 대한 편집률을 나타내는 딥 시퀀싱 결과를 도시한다. a, b 및 미처리군(c)에서의 데이터는 평균±s.e.m.(n=3)으로 표시되고; 대조군 RNA151 및 arRNA151(c)의 데이터는 평균±s.e.m.(n=2)으로 표시된다.
도 28a-28d는 arRNA의 렌티바이러스 형질도입 및 합성된 arRNA 올리고뉴클레오티드의 전기천공에 의한 타겟팅된 편집을 도시한다. 도 28a는 EGFP+ 세포의 정량화를 도시한다. 리포터-1을 안정적으로 발현하는 HEK293T 세포는 대조군 RNA의 151개의 뉴클레오티드를 발현하는 렌티바이러스 또는 타겟팅된 arRNA로 감염되었다. FACS 분석은 감염 후 2일 및 8일 후에 수행되었다. EGFP+ 세포의 비율은 렌티바이러스 형질도입 효율(BFP+ 비율)에 의해 정규화되었다. 도 28b는 HEK293T 세포 내에 151개의 뉴클레오티드 arRNA의 렌티바이러스 형질도입 시 PPIB 전사물에 대한 편집률을 나타내는 딥 시퀀싱 결과를 도시한다. 도 28c는 PPIB 서열 및 대응하는 111개의 뉴클레오티드 타겟팅 arRNA의 도식을 도시한다. *(적색)는 2'-O-메틸화 및 포스포로티오에이트 연결을 갖는 뉴클레오티드를 나타낸다. 도 28d는 인간 1차 T 세포 내로의 111개의 뉴클레오티드 합성 arRNA 올리고뉴클레오티드의 전기천공 시 PPIB 전사물에 대한 편집률을 나타내는 딥 시퀀싱 결과를 도시한다.
도 29a-29e는 예시적인 LEAPER 방법에 의한 헐러 증후군 환자 유래의 원발성 섬유아세포에서의 α-L-아이두로니데이스 활성의 복원을 도시한다. 도 29a의 상단은 환자 유래 섬유아세포 GM06214에서의 병원성 돌연변이의 유전 정보를 도시하고; 중간은 IDUA 유전자(Trp402Ter)의 엑손 9에 동형접합 TGG>TAG 돌연변이를 포함하는 GM06214 세포의 IDUA 성숙 mRNA 서열(흑색) 및 대응하는 111개의 뉴클레오티드 타겟팅 arRNA111-IDUA-V1(청색)을 도시하고; 하단은 GM06214 세포의 IDUA pre-mRNA 서열(흑색) 및 대응하는 111개의 뉴클레오티드 타겟팅 arRNA111-IDUA-V2(청색)의 도식을 도시한다. *(적색)은 2'-O-메틸화 및 포스포로티오에이트 연결을 갖는 뉴클레오티드를 나타낸다. 도 29b는 상이한 시점에서 4-메틸움벨리페릴 α-L-아이두로니데이스 기질을 사용하여 α-L-아이두로니데이스의 촉매 활성 측정을 도시한다. 데이터는 평균±s.e.m.(n=2)으로 표시된다. 도 29c는 전기천공 48시간 후 GM06214 세포에서의 IDUA 전사물에 대한 타겟팅된 편집률을 나타내는 딥 시퀀싱 결과를 도시한다. 도 29d의 상단은 111개의 뉴클레오티드 arRNA에 의해 커버되는 IDUA 전사물 서열의 도식을 도시한다. 화살표는 타겟팅된 아데노신을 나타낸다. 모든 아데노신은 적색으로 마킹했다. 하단은 IDUA 전사물에서 표시된 arRNA(청색의 굵은 프레임으로 마킹됨)로 커버된 아데노신에 대한 편집률의 히트맵을 도시한다. 도 29e는 arRNA 또는 폴리(I:C) 전기천공 시 I형 인터페론, 인터페론 자극 유전자 및 전염증성 유전자의 발현을 나타내는 정량적 PCR을 도시한다. 데이터는 평균(n=3)으로 표시된다.
도 30a-30c는 이중 형광 리포터(리포터-1, 리포터-2 및 리포터-3), mCherry 및 EGFP의 세 가지 버전을 도시한다. 도 30a는 리포터-1의 구조, 도 30b는 리포터-2의 구조, 및 도 30c는 리포터-3의 구조를 도시한다.
도 31은 pLenti-dCas13-ADAR1DD의 구조를 나타낸다.
도 32는 pLenti-MCS-mCherry 백본의 구조를 나타낸다.
도 33은 pLenti-arRNA-BFP 백본의 구조를 나타낸다.
도 34는 GM06214 세포에서 검출된 IDUA의 유전자형을 나타낸다. A C1205 G>A 돌연변이는 유전자 내에서 발생한다.
도 35는 세포의 전기천공 조건의 시험 결과를 나타낸다.
도 36은 각각 전기천공법을 사용하여 IDUA pre-mRNA 및 mRNA를 타겟팅하도록 설계된 dRNA로 형질감염된 세포에서 IDUA의 효소 활성 및 소망의 돌연변이 비율을 나타낸다.
도 37a-37b는 IDUA-리포터를 사용한 테스트를 보여준다. 도 37a는 IDUA-리포터의 구성을 나타낸다. 도 37b는 전기천공법을 사용한 293T-IDUA-리포터 세포(IDUA-리포터를 갖는 293T 세포)에서 상이한 길이(대칭 절단)의 dRNA의 편집 효율을 나타낸다.
도 38은 상이한 길이의 dRNA(대칭 절단)로 전기형질감염된 GM06214 세포에서 상이한 시점에서 결정된 효소 활성 및 편집 효율을 나타낸다.
도 39a-39b는 리포펙타민 RNAiMAX를 사용하여 상이한 dRNA(대칭 절단, 3' 말단 절단 및 5' 말단 절단)로 형질감염된 세포에서 결정된 IDUA 효소 활성(도 39A) 및 A에서 G로의 돌연변이율(도 39B)을 나타낸다.
도 40a-40b는 리포펙타민 RNAiMAX를 사용하여 다른 길이의 dRNA로 형질감염된 GM06214 세포에서의 효소 활성의 비교를 나타낸다. 도 40a에서 dRNA의 3' 말단 의 염기는 55-c-25로부터 55-c-10으로 하나씩 감소하였다. 도 40b에서 dRNA의 3' 말단의 염기는 55-c-16으로부터 55-c-5로 하나씩 감소되었다.
도 41은 리포펙타민 RNAiMAX를 이용한, 상이한 길이의 dRNA(3' 말단의 길이는 15개의 뉴클레오티드 또는 20개의 뉴클레오티드로 고정하고, 5' 말단의 길이는 점차 감소됨)로 형질감염된 GM06214 세포에서의 효소 활성의 비교를 나타낸다.
도 42는 리포펙타민 RNAiMAX를 이용한, 3개 그룹의 dRNA로 형질감염된 GM06214 세포에서의 효소 활성의 비교를 나타낸다. 각 그룹에서의 dRNA에 대해, 타겟팅 뉴클레오티드로부터 5' 말단까지의 거리는 상이하다. 또한, 이 도면은 60개의 뉴클레오티드 미만인 dRNA의 낮은 편집 효율을 나타낸다.
도 43a-43b는 상이한 화학적 변형을 갖는 71개의 뉴클레오티드 및 76개의 뉴클레오티드의 dRNA의 편집 효율을 나타낸다. 도 43a는 효소 활성을 이용한 편집 효율을 나타낸다. 도 43b는 A로부터 G로의 비율을 이용한 편집 효율을 나타낸다.
도 44는 본 발명에서 dRNA로 형질감염된 세포에서의 효소 활성 및 종래 기술에서의 외인성 효소 비의존적 RNA 염기 편집에 바람직한 RNA의 비교를 나타낸다.
도 45a-45d는 본 발명의 화학적으로 변형된 dRNA를 사용한 USH2A 모델(c.11864 G>A, p.Trp3955*)에 있어서의 돌연변이의 RNA 편집 결과를 나타낸다. MFI 및 %GFP는 편집 효율성을 나타낸다. 도 45a는 USH2A 구조의 구조를 도시한다. 도 45b는 동일한 길이의 3' 및 5' 말단을 갖는 dRNA의 편집 효율을 나타낸다. 도 45c는 상이한 길이의 3' 및 5' 말단을 갖는 dRNA의 편집 효율을 나타낸다. 도 45d는 60개 미만의 뉴클레오티드의 dRNA의 비교적 낮은 편집 효율을 나타낸다.
본 출원은 RNA 편집 방법(본원에서 "LEAPER" 방법으로 칭해짐) 및 숙주 세포에서 타겟 RNA를 편집하도록 본원에서 탈아미노효소-리크루팅 RNA("dRNA") 또는 ADAR-리크루팅 RNA("arRNA")로 칭해지는 특이적으로 설계된 RNA를 제공한다. 이론이나 가설에 얽매이는 일 없이, dRNA는 서열 특이적 방식으로 타겟 RNA에의 혼성화를 통해 이중 가닥 RNA를 형성하도록 작용하여, 타겟 RNA에서 타겟 아데노신을 탈아미노화하도록 RNA 아데노신 탈아미노효소(ADAR)를 리크루팅한다. 이와 같이, 효율적인 RNA 편집은 숙주 세포에서 ADAR 단백질의 이소성(ectopic) 또는 과발현 없이 일부 실시형태에 있어서 달성될 수 있다. 또한, RNA 편집 방법을 이용하여 개체에서의 질환 또는 상태를 치료하거나 예방하기 위한 방법 및 조성물이 제공된다.
본원에 기재된 RNA 편집 방법은 Cas와 같은 가이드 핵산과 특이적으로 결합하는 단백질 및 ADAR을 포함하는 융합 단백질을 사용하지 않는다. 본원에 기재된 탈아미노효소-리크루팅 RNA("dRNA")는 CRISPR/Cas 시스템에서 사용되는 crRNA, tracrRNA 또는 gRNA를 포함하지 않는다. 일부 실시형태에 있어서, dRNA는 ADAR-리크루팅 도메인 또는 화학적 변형(들)을 포함하지 않는다. 일부 실시형태에 있어서, arRNA는 플라스미드 또는 바이러스 벡터로부터 발현되거나, 또는 올리고뉴클레오티드로서 합성될 수 있어 바람직한 편집 효율을 달성할 수 있다. 어떤 이론이나 기본 메커니즘에 얽매이는 일 없이, 특정 길이, 미스매치의 위치 및/또는 변형 패턴을 갖는 소정 dRNA가 RNA 편집에서 더 높은 효율성을 나타내는 것으로 밝혀졌다. 따라서, 본 출원은 이전에 보고된 것보다 개선된 RNA 편집 방법을 더 제공한다.
본원에 기재된 LEAPER 방법은 타겟팅된 전사물 및 레어 글로벌 오프-타겟(rare global off-target)에 대한 관리가능한 오프-타겟 비율을 갖는다. 발명자들은 LEAPER 방법을 이용하여 특정 암 관련 점 돌연변이를 수복함으로써 p53 기능을 복원했다. 또한, 본원에 기재된 LEAPER 방법은 다수의 인간 1차 세포를 포함하는 광범위한 세포 유형에 적용될 수 있고, 또한 선천적 면역 반응을 유발하는 일 없이 헐러 증후군 환자 유래의 1차 섬유아세포에서 α-L-아이두로니데이스 촉매 활성을 복원하는 데 사용될 수 있다. 일부 실시형태에 있어서, LEAPER 방법은 단일 분자(즉, dRNA) 시스템을 수반한다. 본원에 기재된 LEAPER 방법은 정밀하고 효율적인 RNA 편집을 가능하게 하여 기본 연구 및 치료제에 대한 변화 가능성을 제공한다.
정의
본 발명은 소정 실시형태에 대해서 소정 도면을 참조하여 설명될 것이지만, 본 발명은 이에 한정되지 않고 청구범위에 의해서만 한정된다. 청구범위의 임의의 참조 기호는 범위를 한정하는 것으로 해석되어서는 안 된다. 용어 "포함하는"이 본 명세서 및 청구범위에서 사용되는 경우, 다른 요소 또는 단계를 배제하지 않는다. 단수 명사를 지칭할 때에 부정 관사 또는 정관사, 예를 들면 "a" 또는 "an", "the"가 사용되는 경우, 이것은 특별히 다른 것을 언급하지 않는 한 그 명사의 복수형을 포함한다. 본원에서 뉴클레오티드의 수 범위를 언급하기 위해, 그 사이에 있는 각각의 개재된 숫자가 명백하게 고려된다. 예를 들면, 40-260개의 뉴클레오티드 범위에 대해, 40개의 뉴클레오티드 및 260개의 뉴클레오티드의 수에 추가하여 40개와 260개의 뉴클레오티드 사이의 임의의 정수개의 뉴클레오티드가 고려된다.
하기 용어 또는 정의는 단지 본 발명의 이해를 돕기 위해 제공된다. 본원에서 구체적으로 정의되지 않는 한, 본원에서 사용된 모든 용어는 본 발명의 당업자에게서의 용어와 동일한 의미를 갖는다. 의사들에게는 특히 본 기술 분야의 정의 및 용어에 대해 Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd ed., Cold Spring Harbor Press, Plainsview, New York(1989); 및 Ausubel et al., Curre개의 뉴클레오티드 Protocols in Molecular Biology(Supplement 47), John Wiley & Sons, New York(1999)가 참조된다. 본원에 제공된 정의는 당업자에 의해 이해되는 범위보다 작은 범위를 갖는 것으로 해석되어서는 안 된다.
용어 "탈아미노효소-리크루팅 RNA", "dRNA," "ADAR-리크루팅 RNA" 및 "arRNA"는 RNA에서 타겟 아데노신을 탈아미노화하도록 ADAR을 리크루팅할 수 있는 조작된 RNA를 지칭하기 위해 본원에서 상호 교환적으로 사용된다.
용어 "폴리뉴클레오티드", "뉴클레오티드 서열" 및 "핵산"은 상호 교환적으로 사용된다. 이들은 임의의 길이의 뉴클레오티드의 폴리머 형태, 데옥시리보뉴클레오티드 또는 리보뉴클레오티드, 또는 그것의 유사체를 지칭한다. 2개의 뉴클레오티드가 포스포디에스테르 결합에 의해 연결되고, 다수의 뉴클레오티드가 포스포디에스테르 결합에 의해 연결되어 폴리뉴클레오디드 또는 핵산을 형성한다. 뉴클레오티드 사이의 연결은 "포스포로티오에이트 연결" 또는 "포스포로티오화 연결"이라고 불리는 포스포로티오화될 수 있다.
본원에서 사용된 용어 "아데닌", "구아닌", "시토신", "티민", "우라실" 및 "하이포크산틴"은 이와 같은 핵염기를 지칭한다. 용어 "아데노신", "구아노신", "시티딘", "티미딘", "우리딘" 및 "이노신"은 리보오스 또는 데옥시리보오스 당 부위에 연결된 핵염기를 지칭한다. 용어 "뉴클레오시드"는 리보오스 또는 데옥시리보오스에 연결된 핵염기를 지칭한다. 용어 "뉴클레오티드"는 각각의 핵염기-리보실-포스페이트 또는 핵염기-데옥시리보실-포스페이트를 지칭한다. 용어 아데노신 및 아데닌(약어 "A"), 구아노신 및 구아닌(약어 "G"), 시토신 및 시티딘(약어 "C"), 우라실 및 우리딘(약어 "U"), 티민 및 티미딘(약어 "T"), 이노신 및 하이포크산틴(약어 "I")은 대응하는 핵염기, 뉴클레오시드 또는 뉴클레오티드를 지칭하기 위해 상호 교환적으로 사용되는 경우가 있다. 용어 핵염기, 뉴클레오시드 및 뉴클레오티드는 문맥상 명확히 다르게 요구하지 않는 한, 상호 교환적으로 사용되는 경우가 있다.
본 출원의 맥락에서, "타겟 RNA"는 탈아미노효소-리크루팅 RNA 서열이 완벽한 상보성 또는 실질적인 상보성을 갖도록 설계된 RNA 서열을 지칭하며, 타겟 서열과 dRNA 사이의 혼성화는 타겟 아데노신을 함유하는 이중 가닥 RNA(dsRNA) 영역을 형성하여, 타겟 아데노신을 탈아미노화하는 RNA 아데노신 탈아미노효소(ADAR)를 리크루팅한다. 일부 실시형태에 있어서, ADAR은 진핵 세포(바람직하게는 포유동물 세포, 보다 바람직하게는 인간 세포)와 같은 숙주 세포에 자연적으로 존재한다. 일부 실시형태에 있어서, ADAR은 숙주 세포에 도입된다.
본원에서 사용된 바와 같이, "상보성"은 전통적인 왓슨-크릭(Watson-Crick) 염기쌍에 의해 다른 핵산과 수소 결합(들)을 형성하는 핵산의 능력을 지칭한다. 퍼센트 상보성은 제 2 핵산과 수소 결합(예를 들면, 왓슨-크릭 염기쌍)을 형성할 수 있는 핵산 분자 중의 잔기의 백분율(예를 들면, 10 중 약 5, 6, 7, 8, 9, 10은 각각 약 50%, 60%, 70%, 80%, 90% 및 100% 상보성을 나타냄)을 나타낸다. "완벽하게 상보적"은 핵산 서열의 모든 인접한 잔기가 제 2 핵산 서열에서의 동일한 수의 인접한 잔기와 수소 결합을 형성하는 것을 의미한다. 본원에서 사용된 "실질적으로 상보적"은 약 40, 50, 60, 70, 80, 100, 150, 200, 250개 또는 그 이상의 뉴클레오티드의 영역에 걸쳐 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100% 중 어느 하나인 상보성의 정도를 지칭하거나, 또는 엄격한 조건 하에서 혼성화하는 2개의 핵산을 지칭한다.
본원에서 사용된 바와 같이, 혼성화를 위한 "엄격한 조건"은 타겟 서열에 대해 상보성을 갖는 핵산이 타겟 서열과 대부분 혼성화하고, 비타겟 서열에 실질적으로 혼성화하지 않는 조건을 지칭한다. 엄격한 조건은 일반적으로 서열 의존적이며, 다수의 요인에 따라 달라진다. 일반적으로, 서열이 길수록 서열이 그것의 타겟 서열에 특이적으로 혼성화하는 온도가 높아진다. 엄격한 조건의 비제한적인 예는 Tijssen(1993), Laboratory Techniques In Biochemistry And Molecular Biology- Hybridization With Nucleic Acid Probes Part I, Second Chapter "Overview of principles of hybridization and the strategy of nucleic acid probe assay", Elsevier, N,Y.에 상세히 기재된다.
"혼성화"는 하나 이상의 폴리뉴클레오티드가 반응하여 뉴클레오티드 잔기의 염기 사이의 수소 결합을 통해 안정화되는 복합체를 형성하는 반응을 지칭한다. 수소 결합은 왓슨-크릭 염기쌍, 후그스테인 결합에 의해, 또는 임의의 다른 서열 특이적 방식으로 발생할 수 있다. 주어진 서열과 혼성화할 수 있는 서열은 주어진 서열의 "보체"라고 지칭된다.
본원에서 사용된 바와 같이, 용어 "세포", "세포주" 및 "세포 배양"은 상호 교환적으로 사용되며, 이러한 모든 명칭에는 자손이 포함된다. 모든 자손은 의도적이거나 의도하지 않은 돌연변이로 인해 DNA 함량이 정확하게 동일하지 않을 수 있음을 이해해야 한다. 본래의 세포와 동일한 기능 또는 생물학적 활성을 갖는 변이체 자손이 포함된다.
RNA 편집 방법
본 발명에 있어서, 본원에서 사용된 dRNA는 타겟 RNA와 결합할 때 타겟 RNA에서 편집될 타겟 아데노신의 정반대쪽에 시티딘(C), 아데노신(A) 또는 우리딘(U)을 포함하는 RNA 서열을 포함한다. 타겟 아데노신의 정반대쪽의 시티딘(C), 아데노신(A) 및 우리딘(U)을 총칭하여 "타겟팅 뉴클레오티드"라고 지칭하거나, 또는 별도로 "타겟팅 C", "타겟팅 A" 및 "타겟팅 U"라고 지칭한다. 타겟팅 뉴클레오티드 및 타겟팅 뉴클레오티드에 바로 인접한 2개의 뉴클레오티드는 본원에서 "타겟팅 삼중항"이라고 지칭되는 삼중항을 형성한다.
일부 실시형태에 있어서, 탈아미노효소-리크루팅 RNA(dRNA) 또는 dRNA를 인코딩하는 구축물을 숙주 세포에 도입하는 단계를 포함하는, 숙주 세포(예를 들면, 진핵 세포)에서 타겟 RNA를 편집하는 방법이 제공되며, 상기 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 dRNA는 타겟 RNA에서 타겟 아데노신(A)을 탈아미노화하도록 RNA 아데노신 탈아미노효소(ADAR)를 리크루팅할 수 있다.
일부 실시형태에 있어서, dRNA 또는 dRNA를 인코딩하는 구축물을 숙주 세포에 도입하는 단계를 포함하는, 숙주 세포(예를 들면, 진핵 세포)에서 타겟 RNA를 편집하는 방법이 제공되며, 상기 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하도록 숙주 세포의 내인적으로 발현된 ADAR을 리크루팅한다. 일부 실시형태에 있어서, 상기 방법은 단백질(예를 들면, Cas, ADAR 또는 ADAR과 Cas의 융합 단백질)을 인코딩하는 임의의 단백질 또는 구축물을 숙주 세포에 도입하는 단계를 포함하지 않는다.
일부 실시형태에 있어서, (a) dRNA 또는 dRNA를 인코딩하는 구축물, 및 (b) ADAR 또는 ADAR을 인코딩하는 구축물을 숙주 세포에 도입하는 단계를 포함하는, 숙주 세포(예를 들면, 진핵 세포)에서 타겟 RNA를 편집하는 방법이 제공되며, 상기 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하도록 ADAR을 리크루팅한다. 일부 실시형태에 있어서, ADAR은 숙주 세포의 내인적으로 인코딩된 ADAR이고, 여기서 ADAR의 도입은 숙주 세포에서 ADAR을 과발현하는 것을 포함한다. 일부 실시형태에 있어서, ADAR은 숙주 세포에 대해 외인성이다. 일부 실시형태에 있어서, ADAR을 인코딩하는 구축물은 플라스미드와 같은 벡터, 또는 바이러스 벡터(예를 들면, 렌티바이러스 벡터)이다.
일부 실시형태에 있어서, 복수의 dRNA 또는 복수의 dRNA를 인코딩하는 구축물을 숙주 세포에 도입하는 단계를 포함하는, 숙주 세포(예를 들면, 진핵 세포)에서 복수(예를 들면, 적어도 약 2, 3, 4, 5, 10, 20, 50, 100개 또는 그 이상)의 타겟 RNA를 편집하는 방법이 제공되며, 각각의 상기 dRNA는 복수의 타겟 RNA에서 대응하는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 각각의 상기 dRNA는 대응하는 타겟 RNA에서 타겟 A를 탈아미노화하도록 ADAR을 리크루팅할 수 있다.
일부 실시형태에 있어서, 복수의 dRNA 또는 복수의 dRNA를 인코딩하는 구축물을 숙주 세포에 도입하는 단계를 포함하는, 숙주 세포(예를 들면, 진핵 세포)에서 복수(예를 들면, 적어도 약 2, 3, 4, 5, 10, 20, 50, 100개 또는 그 이상)의 타겟 RNA를 편집하는 방법이 제공되며, 각각의 상기 dRNA는 복수의 타겟 RNA에서 대응하는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 각각의 상기 dRNA는 대응하는 타겟 RNA에서 타겟 A를 탈아미노화하도록 내인적으로 발현된 ADAR를 리크루팅한다.
일부 실시형태에 있어서, (a) 복수의 dRNA 또는 복수의 dRNA를 인코딩하는 구축물, 및 (b) ADAR 또는 ADAR을 인코딩하는 구축물을 숙주 세포에 도입하는 단계를 포함하는, 숙주 세포(예를 들면, 진핵 세포)에서 복수(예를 들면, 적어도 약 2, 3, 4, 5, 10, 20, 50, 100, 1000개 또는 그 이상)의 타겟 RNA를 편집하는 방법이 제공되며, 각각의 상기 dRNA는 복수의 타겟 RNA에서 대응하는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 각각의 상기 dRNA는 대응하는 타겟 RNA에서 타겟 A를 탈아미노화하도록 ADAR을 리크루팅한다.
일 양태에 있어서, 본 출원은 복수의 탈아미노효소-리크루팅 RNA, 탈아미노효소-리크루팅 RNA를 인코딩하는 하나 이상의 구축물, 또는 본원에 기재된 라이브러리를 숙주 세포에 도입함으로써, 숙주 세포에서 복수의 RNA를 편집하는 방법을 제공한다.
소정 실시형태에 있어서, 타겟 RNA에 대한 편집 방법은 하나 이상의 타겟 RNA에서 하나 이상의 타겟 아데노신에 대해 탈아미노화 반응을 행하기 위해 RNA 아데노신 탈아미노효소(ADAR)를 리크루팅하도록 다수의 탈아미노효소-리크루팅 RNA 또는 다수의 탈아미노효소-리크루팅 RNA를 포함하는 하나 이상의 구축물을 숙주 세포에 도입하는 단계를 포함하고, 여기서 각각의 탈아미노효소-리크루팅 RNA는 대응하는 타겟 RNA에 상보적인 RNA 서열을 포함한다.
일 양태에 있어서, 본 출원은 dRNA 또는 dRNA를 인코딩하는 구축물을 숙주 세포에 도입하는 단계를 포함하는, 숙주 세포(예를 들면, 진핵 세포)에서 타겟 RNA 및/또는 타겟 RNA에 의해 인코딩된 단백질의 하나 이상의 변형을 생성하는 방법을 제공하며, 상기 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 여기서 하나 이상의 변형은 타겟 RNA에 의해 인코딩된 단백질의 점 돌연변이, 타겟 RNA에 의해 인코딩된 단백질의 잘못 접힘, 타겟 RNA에서의 조기 정지 코돈, 타겟 RNA에서의 비정상적 스플라이스 부위, 및 타겟 RNA에서의 선택적 스플라이스 부위로 이루어지는 군으로부터 선택된다.
소정 실시형태에 있어서, 숙주 세포(예를 들면, 진핵 세포)에서 타겟 RNA 및/또는 타겟 RNA에 의해 인코딩된 단백질의 하나 이상의 변형을 생성하는 방법은 복수의 탈아미노효소-리크루팅 RNA 또는 복수의 탈아미노효소-리크루팅 RNA를 인코딩하는 구축물을 숙주 세포에 도입하는 단계를 포함하고, 각각의 상기 dRNA는 복수의 타겟 RNA에서 대응하는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 각각의 상기 dRNA는 대응하는 타겟 RNA에서 타겟 A를 탈아미노화하도록 ADAR를 리크루팅할 수 있다.
일 양태에 있어서, 본 출원은 숙주 세포에서 타겟 RNA를 편집하기 위해 본원에 기재된 dRNA 중 어느 하나에 따른 탈아미노효소-리크루팅 RNA의 사용을 제공한다. 소정 실시형태에 있어서, 탈아미노효소-리크루팅 RNA는 편집될 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함한다.
일 양태에 있어서, 본 출원은 타겟 RNA 및/또는 타겟 RNA에 의해 인코딩된 단백질에 하나 이상의 변형을 생성하기 위해 본원에 기재된 dRNA 중 어느 하나에 따른 탈아미노효소-리크루팅 RNA의 사용을 제공하며, 여기서 하나 이상의 변형은 타겟 RNA에 의해 인코딩된 단백질의 점 돌연변이, 타겟 RNA에 의해 인코딩된 단백질의 잘못 접힘, 타겟 RNA에서의 조기 정지 코돈, 타겟 RNA에서의 비정상적 스플라이스 부위, 및 타겟 RNA에서의 선택적 스플라이스 부위로 이루어지는 군으로부터 선택되는다. 소정 실시형태에 있어서, 탈아미노효소-리크루팅 RNA는 편집될 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함한다.
또한, 본 발명은 타겟 RNA 서열에서 타겟 아데노신에 대한 탈아미노화 반응을 행하기 위해 내인성의 RNA 아데노신 탈아미노효소(ADAR)를 자연적으로 리크루팅하도록 본원에 기재된 바와 같이 dRNA 또는 dRNA를 인코딩하는 구축물을 진핵 세포에 도입하는 단계를 포함하는, 진핵 세포에서 타겟 RNA를 편집하기 위한 내인성의 아데노신 탈아미노효소를 레버리징하는 방법에 관한 것이다.
본원에 기재된 방법 또는 사용 중 어느 하나에 따른 소정 실시형태에 있어서, dRNA는 적어도 약 40, 45, 50, 55, 60, 65, 70, 75, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240 또는 250개의 뉴클레오티드 중 어느 하나를 포함한다. 소정 실시형태에 있어서, dRNA는 약 40-260, 45-250, 50-240, 60-230, 65-220, 70-220, 70-210, 70-200, 70-190, 70-180, 70-170, 70-160, 70-150, 70-140, 70-130, 70-120, 70-110, 70-100, 70-90, 70-80, 75-200, 80-190, 85-180, 90-170, 95-160, 100-200, 100-150, 100-175, 110-200, 110-175, 110-150 또는 105-140개의 뉴클레오티드 길이 중 어느 하나이다. 일부 실시형태에 있어서, dRNA는 약 60-200개(예를 들면, 약 60-150, 65-140, 68-130, 또는 70-120개 중 어느 것)의 뉴클레오티드 길이이다. 일부 실시형태에 있어서, dRNA는 약 71개의 뉴클레오티드 길이이다. 일부 실시형태에 있어서, dRNA는 약 111개의 뉴클레오티드 길이이다.
본원에 기재된 방법 또는 사용 중 어느 하나에 따른 소정 실시형태에 있어서, dRNA는 ADAR-리크루팅 도메인을 포함하지 않는다. "ADAR-리크루팅 도메인"은 ADAR과 높은 친화성으로 결합하는 뉴클레오티드 서열 또는 구조, 또는 조작된 ADAR 구축물에서 ADAR에 융합된 결합 파트너와 결합하는 뉴클레오티드 서열일 수 있다. 예시적인 ADAR-리크루팅 도메인은 GluR-2, GluR-B(R/G), GluR-B(Q/R), GluR-6(R/G), 5HT2C, 및 FlnA(Q/R) 도메인을 포함하지만, 이들에 한정되지 않고, 예를 들면 그 전체가 본원에 참조로 포함된 Wahlstedt, Helene, 및 Marie, "Site-selective versus promiscuous A-to-I editing." Wiley Interdisciplinary Reviews: RNA 2.6(2011): 761-771을 참조한다. 일부 실시형태에 있어서, dRNA는 이중 가닥 부분을 포함하지 않는다. 일부 실시형태에 있어서, dRNA는 MS2 스템 루프와 같은 헤어핀을 포함하지 않는다. 일부 실시형태에 있어서, dRNA는 단일 가닥이다. 일부 실시형태에 있어서, dRNA는 DSB-결합 도메인을 포함하지 않는다. 일부 실시형태에 있어서, dRNA는 상보적 RNA 서열로 이루어진다(또는 본질적으로 이루어진다).
본원에 기재된 방법 또는 사용 중 어느 하나에 따른 소정 실시형태에 있어서, dRNA는 화학적 변형을 포함하지 않는다. 일부 실시형태에 있어서, dRNA는 화학적으로 변형된 뉴클레오티드, 예를 들면 2'-O-메틸 뉴클레오티드 또는 포스포로티오에이트 연결을 갖는 뉴클레오티드를 포함하지 않는다. 일부 실시형태에 있어서, dRNA는 처음 3개 및 마지막 3개의 잔기에서만 2'-O-메틸화 및 포스포로티오에이트 연결을 포함한다. 일부 실시형태에 있어서, dRNA는 안티센스 올리고뉴클레오티드(ASO)가 아니다.
본원에 기재된 방법 또는 사용 중 어느 하나에 따른 소정 실시형태에 있어서, 숙주 세포는 원핵 세포이다. 일부 실시형태에 있어서, 숙주 세포는 진핵 세포이다. 바람직하게는, 숙주 세포는 포유동물 세포이다. 보다 바람직하게는, 숙주 세포는 인간 세포이다. 일부 실시형태에 있어서, 숙주 세포는 뮤린 세포이다. 일부 실시형태에 있어서, 숙주 세포는 식물 세포 또는 균류 세포이다.
본원에 기재된 방법 또는 사용 중 어느 하나에 따른 일부 실시형태에 있어서, 숙주 세포는 HEK293T, HT29, A549, HepG2, RD, SF268, SW13 및 HeLa 세포와 같은 세포주이다. 일부 실시형태에 있어서, 숙주 세포는 섬유아세포, 상피 세포 또는 면역 세포와 같은 1차 세포이다. 일부 실시형태에 있어서, 숙주 세포는 T 세포이다. 일부 실시형태에 있어서, 숙주 세포는 유사분열 후 세포이다. 일부 실시형태에 있어서, 숙주 세포는 뇌 세포, 예를 들면 소뇌 세포와 같은 중추 신경계(CNS)의 세포이다.
일부 실시형태에 있어서, dRNA 또는 dRNA를 인코딩하는 구축물을 숙주 세포에 도입하는 단계를 포함하는 1차 숙주 세포(예를 들면, T 세포 또는 CNS 세포)에서 타겟 RNA를 편집하는 방법이 제공되며, 상기 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하도록 숙주 세포의 내인적으로 발현된 ADAR을 리크루팅한다.
본원에 기재된 방법 또는 사용 중 어느 하나에 따른 소정 실시형태에 있어서, ADAR은 숙주 세포에 대해 내인성이다. 일부 실시형태에 있어서, RNA 아데노신 탈아미노효소(ADAR)는 숙주 세포에 자연적으로 또는 내인적으로 존재하며, 예를 들면 진핵 세포에 자연적으로 또는 내인적으로 존재한다. 일부 실시형태에 있어서, ADAR은 숙주 세포에 의해 내인적으로 발현된다. 소정 실시형태에 있어서, ADAR은 숙주 세포에 외인적으로 도입된다. 일부 실시형태에 있어서, ADAR은 ADAR1 및/또는 ADAR2이다. 소정 실시형태에 있어서, ADAR은 hADAR1, hADAR2, 마우스 ADAR1 및 ADAR2로 이루어지는 군으로부터 선택되는 하나 이상의 ADAR이다. 일부 실시형태에 있어서, ADAR은 ADAR1의 p110 이소폼("ADAR1p110") 및/또는 ADAR1의 p150 이소폼("ADAR1p150")과 같은 ADAR1이다. 일부 실시형태에 있어서, ADAR은 ADAR2이다. 일부 실시형태에 있어서, ADAR은 숙주 세포에 의해 발현된 ADAR2, 예를 들면 소뇌 세포에 의해 발현된 ADAR2이다.
일부 실시형태에 있어서, ADAR은 숙주 세포에 대해 외인성인 ADAR이다. 일부 실시형태에 있어서, ADAR은 자연 발생 ADAR의 과활성 돌연변이체이다. 일부 실시형태에 있어서, ADAR은 E1008Q 돌연변이를 포함하는 ADAR1이다. 일부 실시형태에 있어서, ADAR은 결합 도메인을 포함하는 융합 단백질이 아니다. 일부 실시형태에 있어서, ADAR은 조작된 이중 가닥 핵산 결합 도메인을 포함하지 않는다. 일부 실시형태에 있어서, ADAR은 dRNA에서 상보적 RNA 서열에 융합되는 MS2 헤어핀과 결합하는 MCP 도메인을 포함하지 않는다. 일부 실시형태에 있어서, ADAR은 DSB를 포함하지 않는다.
본원에 기재된 방법 또는 사용 중 어느 하나에 따른 일부 실시형태에 있어서, 숙주 세포는 ADAR1의 높은 발현 수준(예를 들면, ADAR1p110 및/또는 ADAR1p150), 예를 들면 β-튜불린의 단백질 발현 수준에 대해 적어도 약 10%, 20%, 50%, 100%, 2x, 3x, 5x 또는 그 이상 중 어느 하나를 갖는다. 일부 실시형태에 있어서, 숙주 세포는 ADAR2의 높은 발현 수준, 예를 들면 β-튜불린의 단백질 발현 수준에 대해 적어도 약 10%, 20%, 50%, 100%, 2x, 3x, 5x 또는 그 이상 중 어느 하나를 갖는다. 일부 실시형태에 있어서, 숙주 세포는 ADAR3의 낮은 발현 수준, 예를 들면 β-튜불린의 단백질 발현 수준에 대해 약 5x, 3x, 2x, 100%, 50%, 20% 또는 그 이하 중 어느 하나 이하를 갖는다.
본원에 기재된 방법 또는 사용 중 어느 하나에 따른 소정 실시형태에 있어서, 상보적 RNA 서열은 타겟 RNA에서의 타겟 A의 정반대쪽에 있는 시티딘, 아데노신 또는 우리딘을 포함한다. 일부 실시형태에 있어서, 상보적 RNA 서열은 타겟 RNA에서의 타겟 A의 정반대쪽에 있는 시티딘 미스매치를 포함한다. 일부 실시형태에 있어서, 시티딘 미스매치는 상보적 RNA 서열의 5' 말단으로부터 적어도 5개의 뉴클레오티드, 예를 들면 적어도 10, 15, 20, 25, 30개 또는 그 이상의 뉴클레오티드와 떨어져 위치된다. 일부 실시형태에 있어서, 시티딘 미스매치는 상보적 RNA 서열의 3' 말단으로부터 적어도 20개의 뉴클레오티드, 예를 들면 적어도 25, 30, 35개 또는 그 이상의 뉴클레오티드와 떨어져 위치된다. 일부 실시형태에 있어서, 시티딘 미스매치는 상보적 RNA 서열의 3' 말단으로부터 20개의 뉴클레오티드 이내(예를 들면, 15, 10, 5개 또는 그 이하의 뉴클레오티드) 떨어져 위치하지 않는다. 일부 실시형태에 있어서, 시티딘 미스매치는 상보적 RNA 서열의 3' 말단으로부터 적어도 20개의 뉴클레오티드(예를 들면, 적어도 25, 30, 35개 또는 그 이상의 뉴클레오티드) 및 5' 말단으로부터 적어도 5개의 뉴클레오티드(예를 들면, 적어도 10, 15, 20, 25, 30개 또는 그 이상의 뉴클레오티드) 떨어져 위치된다. 일부 실시형태에 있어서, 시티딘 미스매치는 상보적 RNA 서열의 중심에 위치된다. 일부 실시형태에 있어서, 시티딘 미스매치는 dRNA에서 상보적 서열의 중심의 20개의 뉴클레오티드 이내(예를 들면, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1개의 뉴클레오티드)에 위치된다.
또한, 본원에 기재된 dRNA는 5' 말단에서 3' 말단으로: 5' 부분, 타겟 RNA에서 타겟 A의 정반대쪽의 시티딘 미스매치, 및 3' 부분을 포함하는 것을 특징으로 할 수 있다. 일부 실시형태에 있어서, 3' 부분은 약 7개의 뉴클레오티드 이상(예를 들면, 8개의 뉴클레오티드 이상, 9개의 뉴클레오티드 이상 및 10개의 뉴클레오티드 이상)의 뉴클레오티드이다. 일부 실시형태에 있어서, 3' 부분은 약 7개의 뉴클레오티드-25개의 뉴클레오티드 뉴클레오티드 길이(예를 들면, 약 10개의 뉴클레오티드-15개의 뉴클레오티드 또는 21개의 뉴클레오티드-25개의 뉴클레오티드 뉴클레오티드 길이)이다. 일부 실시형태에 있어서, 5' 부분은 약 25개 이상(예를 들면, 약 30개 이상, 약 35개의 뉴클레오티드 이상, 약 40개의 뉴클레오티드 이상 및 약 45개의 뉴클레오티드 이상)의 뉴클레오티드이다. 일부 실시형태에 있어서, 5' 부분은 약 25개의 뉴클레오티드-85개의 뉴클레오티드 뉴클레오티드 길이(예를 들면, 약 25개의 뉴클레오티드-80개의 뉴클레오티드, 25개의 뉴클레오티드-75개의 뉴클레오티드, 25개의 뉴클레오티드-70개의 뉴클레오티드, 25개의 뉴클레오티드-65개의 뉴클레오티드, 25개의 뉴클레오티드-60개의 뉴클레오티드, 30개의 뉴클레오티드-55개의 뉴클레오티드, 40개의 뉴클레오티드-55개의 뉴클레오티드, 또는 45개의 뉴클레오티드-55개의 뉴클레오티드 뉴클레오티드 길이)이다. 일부 실시형태에 있어서, 5' 부분은 약 25개의 뉴클레오티드-85개의 뉴클레오티드 뉴클레오티드 길이(예를 들면, 약 25개의 뉴클레오티드-80개의 뉴클레오티드, 25개의 뉴클레오티드-75개의 뉴클레오티드, 25개의 뉴클레오티드-70개의 뉴클레오티드, 25개의 뉴클레오티드-65개의 뉴클레오티드, 25개의 뉴클레오티드-60개의 뉴클레오티드, 30개의 뉴클레오티드-55개의 뉴클레오티드, 40개의 뉴클레오티드-55개의 뉴클레오티드 또는 45개의 뉴클레오티드-55개의 뉴클레오티드 뉴클레오티드 길이)이고, 3' 부분은 약 7개의 뉴클레오티드-25개의 뉴클레오티드 뉴클레오티드 길이(예를 들면, 약 10개의 뉴클레오티드-15개의 뉴클레오티드 또는 21개의 뉴클레오티드-25개의 뉴클레오티드 뉴클레오티드 길이)이다. 일부 실시형태에 있어서, 5' 부분은 3' 부분보다 길다. 일부 실시형태에 있어서, 5' 부분은 약 55개의 뉴클레오티드 길이이고, 3' 부분은 약 15개의 뉴클레오티드 길이이다.
일부 실시형태에 있어서, dRNA에서 시티딘 미스매치의 위치는 본원의 실시예에 기재된 임의의 dRNA에 따르고, dRNA는 예를 들면, X개의 뉴클레오티드-c-Y개의 뉴클레오티드의 형식일 수 있으며, 여기서 X는 5' 부분의 길이를 나타내고, Y는 3' 부분의 길이를 나타낸다: 55개의 뉴클레오티드-c-35개의 뉴클레오티드, 55개의 뉴클레오티드-c-25개의 뉴클레오티드, 55개의 뉴클레오티드-c-24개의 뉴클레오티드, 55개의 뉴클레오티드-c-23개의 뉴클레오티드, 55개의 뉴클레오티드-c-22개의 뉴클레오티드, 55개의 뉴클레오티드-c-21개의 뉴클레오티드, 55개의 뉴클레오티드-c-20개의 뉴클레오티드, 55개의 뉴클레오티드-c-19개의 뉴클레오티드, 55개의 뉴클레오티드-c-18개의 뉴클레오티드, 55개의 뉴클레오티드-c-17개의 뉴클레오티드, 55개의 뉴클레오티드-c-16개의 뉴클레오티드, 55개의 뉴클레오티드-c-15개의 뉴클레오티드, 55개의 뉴클레오티드-c-14개의 뉴클레오티드, 55개의 뉴클레오티드-c-13개의 뉴클레오티드, 55개의 뉴클레오티드-c-12개의 뉴클레오티드, 55개의 뉴클레오티드-c-11개의 뉴클레오티드, 55개의 뉴클레오티드-c-10개의 뉴클레오티드, 55개의 뉴클레오티드-c-9개의 뉴클레오티드, 55개의 뉴클레오티드-c-8개의 뉴클레오티드, 55개의 뉴클레오티드-c-7개의 뉴클레오티드, 55개의 뉴클레오티드-n-20개의 뉴클레오티드, 50개의 뉴클레오티드-n-20개의 뉴클레오티드, 45개의 뉴클레오티드-n-20개의 뉴클레오티드, 55개의 뉴클레오티드-n-15개의 뉴클레오티드, 50개의 뉴클레오티드-n-15개의 뉴클레오티드, 45개의 뉴클레오티드-c-45개의 뉴클레오티드, 45개의 뉴클레오티드-c-55개의 뉴클레오티드, 54개의 뉴클레오티드-c-12개의 뉴클레오티드, 53개의 뉴클레오티드-c-13개의 뉴클레오티드, 52개의 뉴클레오티드-c-14개의 뉴클레오티드, 51개의 뉴클레오티드-c-15개의 뉴클레오티드, 50개의 뉴클레오티드-c-16개의 뉴클레오티드, 49개의 뉴클레오티드-c-17개의 뉴클레오티드, 48개의 뉴클레오티드-c-18개의 뉴클레오티드, 47개의 뉴클레오티드-c-19개의 뉴클레오티드, 46개의 뉴클레오티드-c-20개의 뉴클레오티드, 45개의 뉴클레오티드-c-21개의 뉴클레오티드, 44개의 뉴클레오티드-c-22개의 뉴클레오티드, 43개의 뉴클레오티드-c-23개의 뉴클레오티드, 54개의 뉴클레오티드-c-15개의 뉴클레오티드, 53개의 뉴클레오티드-c-16개의 뉴클레오티드, 52개의 뉴클레오티드-c-17개의 뉴클레오티드, 51개의 뉴클레오티드-c-18개의 뉴클레오티드, 50개의 뉴클레오티드-c-19개의 뉴클레오티드, 49개의 뉴클레오티드-c-20개의 뉴클레오티드, 48개의 뉴클레오티드-c-21개의 뉴클레오티드, 47개의 뉴클레오티드-c-22개의 뉴클레오티드, 46개의 뉴클레오티드-c-23개의 뉴클레오티드, 54개의 뉴클레오티드-c-17개의 뉴클레오티드, 53개의 뉴클레오티드-n-18개의 뉴클레오티드, 52개의 뉴클레오티드-n-19개의 뉴클레오티드, 51개의 뉴클레오티드-n-20개의 뉴클레오티드, 50개의 뉴클레오티드-n-21개의 뉴클레오티드, 49개의 뉴클레오티드-n-22개의 뉴클레오티드, 48개의 뉴클레오티드-c-23.
본원에 기재된 방법 또는 사용 중 어느 하나에 따른 소정 실시형태에 있어서, 상보적 RNA 서열은 타겟 RNA에서의 비타겟 아데노신의 각각 정반대쪽에 있는 1, 2, 3, 4, 5, 6개 또는 그 이상의 G와 같은 하나 이상의 구아노신(들)을 더 포함한다. 일부 실시형태에 있어서, 상보적 RNA 서열은 타겟 RNA에서의 비타겟 아데노신의 반대쪽에 있는 2개 이상의 연속한 미스매치 뉴클레오티드(예를 들면, 2, 3, 4, 5개 또는 그 이상의 미스매치 뉴클레오티드)를 포함한다. 일부 실시형태에 있어서, 타겟 RNA는 약 20개 이하의 비타겟 A, 예를 들면 약 15, 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1개 이하의 비타겟 A 중 어느 하나를 포함한다. 비타겟 A의 반대쪽에 있는 G 및 연속한 미스매치 뉴클레오티드는 ADAR에 의한 오프-타겟 편집 효과를 감소시킬 수 있다.
본원에 기재된 방법 또는 사용 중 어느 하나에 따른 소정 실시형태에 있어서, 타겟 A의 5' 최근접 이웃은 U, C, A 및 G로부터 선택된 뉴클레오티드이고 선호도는 U>C≒A>G이고, 타겟 A의 3' 최근접 이웃은 G, C, A 및 U로부터 선택된 뉴클레오티드이고 선호도는 G>C>A≒U이다. 소정 실시형태에 있어서, 타겟 A는 타겟 RNA에서 UAG, UAC, UAA, UAU, CAG, CAC, CAA, CAU, AAG, AAC, AAA, AAU, GAG, GAC, GAA 및 GAU로 이루어지는 군으로부터 선택되는 3-염기 모티프로 있다. 소정 실시형태에 있어서, 3-염기 모티프는 UAG이고, dRNA는 3-염기 모티프에서 U의 정반대쪽에 A, 타겟 A의 정반대쪽에 C, 및 3-염기 모티프에서 G의 정반대쪽에 C, G 또는 U를 포함한다. 소정 실시형태에 있어서, 3-염기 모티프는 타겟 RNA에서 UAG이고, dRNA는 타겟 RNA의 UAG 반대쪽은 ACC, ACG 또는 ACU를 포함한다. 소정 실시형태에 있어서, 3-염기 모티프는 타겟 RNA에서 UAG이고, dRNA는 타겟 RNA의 UAG의 반대쪽인 ACC를 포함한다.
일부 실시형태에 있어서, dRNA는 하나 이상의 변형을 포함한다. dRNA에 대한 예시적인 변형은 포스포로티오에이트 백본 변형, 리보오스에서의 2'-치환(예를 들면, 2'-O-메틸화 및 2'-플루오로 치환), LNA 및 L-RNA를 포함하지만, 이들에 한정되지 않는다. 일부 실시형태에 있어서, dRNA는 2'-O-메틸화 및/또는 포스포로티오화와 같은 하나 이상의 변형을 포함한다. 일부 실시형태에 있어서, dRNA는 약 60-200(이 범위는 숫자 60과 200 사이의 임의의 연속한 양의 정수, 예를 들면 60, 65, 70, 75, 80, 85, 90, 95, 100, 105, 110, 115, 120, 130, 140, 150, 160, 170, 180, 190, 200)개의 뉴클레오티드 길이이고, 하나 이상의 변형(예를 들면, 2'-O-메틸화 및/또는 3'-포스포로티오화)을 포함한다. 일부 실시형태에 있어서, dRNA는 약 60-200개의 뉴클레오티드 길이이고 하나 이상의 변형을 포함한다. 일부 실시형태에 있어서, dRNA는 약 60-200개의 뉴클레오티드 길이이고 2'-O-메틸화 및/또는 포스포로티오화 변형을 포함한다. 일부 실시형태에 있어서, dRNA는 첫번째 및 마지막 3개의 뉴클레오티드에서의 2'-O-메틸화 및/또는 첫번째 및 마지막 3개의 뉴클레오티드간 연결에서의 포스포로티오화를 포함한다. 일부 실시형태에 있어서, dRNA는 첫번째 및 마지막 3개의 뉴클레오티드에서의 2'-O-메틸화, 첫번째 및 마지막 3개의 뉴클레오티드간 연결에서의 포르포로티오화, 및 하나 이상의 우리딘, 예를 들면 모든 우리딘에서의 2'-O-메틸화를 포함한다. 일부 실시형태에 있어서, dRNA는 첫번째 및 마지막 3개의 뉴클레오티드에서의 2'-O-메틸화, 첫번째 및 마지막 3개의 뉴클레오티드간 연결에서의 포스포로티오화, 단일 또는 다수 또는 모든 우리딘에서의 2'-O-메틸화, 및 타겟 아데노신의 반대쪽의 뉴클레오티드 및/또는 타겟 아데노신의 반대쪽의 뉴클레오티드 최근접 1개 또는 2개의 뉴클레오티드에서의 변형을 포함한다. 소정 실시형태에 있어서, 타겟 아데노신의 반대쪽의 뉴클레오티드 및/또는 타겟 아데노신의 반대쪽의 뉴클레오티드 최근접 1개 또는 2개의 뉴클레오티드에서의 변형은 2'-O-메틸화이다. 소정 실시형태에 있어서, 타겟 아데노신의 반대쪽의 뉴클레오티드, 및/또는 타겟 아데노신의 반대쪽의 뉴클레오티드 최근접 1개 또는 2개의 뉴클레오티드에서의 변형은 3'-포스포로티오화 연결과 같은 포스포로티오화이다. 소정 실시형태에 있어서, dRNA는 첫번째 및 마지막 3개의 뉴클레오티드에서의 2'-O-메틸화, 첫번째 및 마지막 3개의 뉴클레오티드간 연결에서의 포스포로티오화, 모든 우리딘에서의 2'-O-메틸화, 및 타겟 아데노신의 반대쪽의 뉴클레오티드의 3' 말단 및/또는 5' 말단에 인접한 뉴클레오티드에서의 2'-O-메틸화를 포함한다. 소정 실시형태에 있어서, dRNA는 첫번째 및 마지막 3개의 뉴클레오티드에서의 2'-O-메틸화, 첫번째 및 마지막 3개의 뉴클레오티드간 연결에서의 포스포로티오화, 단일 또는 다수 또는 모든 우리딘에서의 2'-O-메틸화, 및 타겟 아데노신의 반대쪽의 뉴클레오티드 및/또는 그것의 5' 및/또는 3' 최근접 뉴클레오티드에서의 3'-포스포로티오화 연결과 같은 포스포로티오화 연결을 포함한다. 일부 실시형태에 있어서, dRNA는 첫번째 및 마지막 5개의 뉴클레오티드에서의 2'-O-메틸화 및 첫번째 및 마지막 5개의 뉴클레오티드간 연결에서의 포스포로티오화를 포함한다.
본원에 기재된 방법 또는 사용 중 어느 하나에 따른 소정 실시형태에 있어서, 타겟 RNA는 프리메신저 RNA, 메신저 RNA, 리보솜 RNA, 트랜스퍼 RNA, 긴 논-코딩 RNA 및 작은 RNA(예를 들면, miRNA)로 이루어진 군으로부터 선택되는 어느 하나이다. 일부 실시형태에 있어서, 타겟 RNA는 프리메신저 RNA이다. 일부 실시형태에있어서, 타겟 RNA는 메신저 RNA이다.
본원에 기재된 방법 또는 사용 중 어느 하나에 따른 소정 실시형태에 있어서, 상기 방법은 ADAR3의 억제제를 숙주 세포에 도입하는 단계를 더 포함한다. 일부 실시형태에 있어서, ADAR3의 억제제는 ADAR3에 대한 shRNA 또는 ADAR3에 대한 siRNA와 같은 ADAR3에 대한 RNAi이다. 일부 실시형태에 있어서, 상기 방법은 숙주 세포에 인터페론 자극제를 도입하는 단계를 더 포함한다. 일부 실시형태에 있어서, ADAR은 인터페론에 의해 유도될 수 있고, 예를 들면 ADAR은 ADARp150이다. 일부 실시형태에 있어서, 인터페론의 자극제는 IFNα이다. 일부 실시형태에 있어서, ADAR3의 억제제 및/또는 인터페론의 자극제는 dRNA를 인코딩하는 동일한 구축물(예를 들면, 벡터)에 의해 인코딩된다.
본원에 기재된 방법 또는 사용 중 어느 하나에 따른 소정 실시형태에 있어서, 타겟 RNA의 편집 효율은 적어도 약 25%, 예를 들면 적어도 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 그 이상 중 어느 하나이다. 일부 실시형태에 있어서, 편집 효율은 생어(Sanger) 시퀀싱에 의해 결정된다. 일부 실시형태에 있어서, 편집 효율은 차세대 시퀀싱에 의해 결정된다.
본원에 기재된 방법 또는 사용 중 어느 하나에 따른 소정 실시형태에 있어서, 상기 방법은 낮은 오프-타겟 편집률을 갖는다. 일부 실시형태에 있어서, 상기 방법은 타겟 RNA에서 비타겟 A에 대해 약 1% 미만(예를 들면, 약 0.5%, 0.1%, 0.05%, 0.01%, 0.001% 또는 그 이하 중 어느 하나 이하)의 편집 효율을 갖는다. 일부 실시형태에 있어서, 상기 방법은 타겟 RNA에서 비타겟 A를 편집하지 않는다. 일부 실시형태에 있어서, 상기 방법은 비타겟 RNA에서 A에 대해 약 0.1% 미만(예를 들면, 약 0.05%, 0.01%, 0.005%, 0.001%, 0.0001% 또는 그 이하 중 어느 하나 이하)의 편집 효율을 갖는다.
본원에 기재된 방법 또는 사용 중 어느 하나에 따른 소정 실시형태에 있어서, 상기 방법은 선천적 면역 반응과 같은 면역 반응을 유도하지 않는다. 일부 실시형태에 있어서, 상기 방법은 숙주 세포에서 인터페론 및/또는 인터루킨 발현을 유도하지 않는다. 일부 실시형태에 있어서, 상기 방법은 숙주 세포에서 IFN-β 및/또는 IL-6 발현을 유도하지 않는다.
또한, 본원에 기재된 방법 중 어느 하나에 의해 생성되는 편집된 RNA 또는 편집된 RNA를 갖는 숙주 세포가 제공된다. 일부 실시형태에 있어서, 편집된 RNA는 이노신을 포함한다. 일부 실시형태에 있어서, 숙주 세포는 미스센스 돌연변이, 조기 정지 코돈, 선택적 스플라이스 부위 또는 비정상적 스플라이스 부위를 갖는 RNA를 포함한다. 일부 실시형태에 있어서, 숙주 세포는 돌연변이, 절단된 또는 잘못 접힌 단백질을 포함한다.
본원에 기재된 바와 같은 "숙주 세포"는 그것이 본원에 기재된 바와 같이 변형될 수 있다면 숙주 세포로서 사용될 수 있는 임의의 세포 유형을 지칭한다. 예를 들면, 숙주 세포는 내인적으로 발현된 RNA 아데노신 탈아미노효소(ADAR)를 갖는 숙주 세포일 수 있고, 또는 RNA 아데노신 탈아미노효소(ADAR)가 당업계에 공지된 방법으로 도입된 숙주 세포일 수 있다. 예를 들면, 숙주 세포는 원핵 세포, 진핵 세포 또는 식물 세포일 수 있다. 일부 실시형태에 있어서, 숙주 세포는 인간 세포주 또는 비인간 세포주를 포함한 포유동물 세포주와 같은 사전 확립된 세포주로부터 유래된다. 일부 실시형태에 있어서, 숙주 세포는 인간 개체와 같은 개체로부터 유래된다.
본원에 사용된 "도입하는" 또는 "도입"은 dRNA 또는 본원에 기재된 바와 같은 벡터를 포함한 하나 이상의 구축물, 그것의 하나 이상의 전사물과 같은 하나 이상의 폴리뉴클레오티드를 숙주 세포에 전달하는 것을 의미한다. 본 발명은 RNA, 예를 들면 프리메신저 RNA, 메신저 RNA, 리보솜 RNA, 트랜스퍼 RNA, 긴 논-코딩 RNA 및 작은 RNA(예를 들면, miRNA)의 타겟팅된 편집을 가능하게 하기 위한 기본 플랫폼의 역할을 한다. 본 출원의 방법은 바이러스, 리포솜, 전기천공, 미세주입 및 콘쥬게이션을 포함하지만 이들에 한정되지 않는 많은 전달 시스템을 채용하여 본원에 기재된 바와 같은 dRNA 또는 구축물을 숙주 세포에 도입하는 것을 달성할 수 있다. 종래 바이러스 및 비바이러스 기반 유전자 전달 방법은 핵산을 포유동물 세포 또는 타겟 조직에 도입하는 데 사용될 수 있다. 이러한 방법은 본 출원의 dRNA를 인코딩하는 핵산을 배양물 내 또는 숙주 유기체 내 세포에 투여하는 데 사용될 수 있다. 비바이러스 벡터 전달 시스템은 DNA 플라스미드, RNA(예를 들면, 본원에 기재된 구축물의 전사물), 네이키드 핵산, 및 리포솜과 같은 전달 비히클과 복합체화된 핵산을 포함한다. 바이러스 벡터 전달 시스템은 숙주 세포에 전달하기 위한 에피솜 또는 통합된 게놈을 가진 DNA 및 RNA 바이러스를 포함한다.
핵산의 비바이러스 전달 방법은 리포펙션, 뉴클레오펙션, 미세주입, 바이오리스틱스(biolistics), 비로좀, 리포솜, 면역 리포솜, 폴리양이온 또는 지질: 핵산 콘쥬게이트, 전기천공, 나노입자, 엑소좀, 미세소포체 또는 유전자총, 네이키드 DNA 및 인공 비리온을 포함한다.
핵산의 전달을 위한 RNA 또는 DNA 바이러스 기반 시스템의 사용은 바이러스를 특정 세포에 타겟팅하고 바이러스 페이로드를 세포핵으로 트래피킹(trafficking)하는 데 있어서 높은 효율을 갖는다.
본원에 기재된 방법 또는 사용 중 어느 하나에 따른 소정 실시형태에 있어서, 상기 방법은 dRNA를 인코딩하는 바이러스 벡터(예를 들면, 렌티바이러스 벡터)를 숙주 세포에 도입하는 단계를 포함한다. 일부 실시형태에 있어서, 상기 방법은 dRNA를 인코딩하는 플라스미드를 숙주 세포에 도입하는 단계를 포함한다. 일부 실시형태에 있어서, 상기 방법은 dRNA(예를 들면, 합성 dRNA)를 숙주 세포에 도입(예를 들면, 전기천공에 의해)하는 단계를 포함한다. 일부 실시형태에 있어서, 상기 방법은 dRNA의 숙주 세포로의 형질감염을 포함한다.
탈아미노화 후, 타겟 RNA 및/또는 타겟 RNA에 의해 인코딩된 단백질의 변형은 타겟 RNA에서 타겟팅된 아데노신의 위치에 따라 상이한 방법을 이용하여 결정될 수 있다. 예를 들면, 타겟 RNA에서 "A"가 "I"로 편집되었는지의 여부를 결정하기 위해, 당업계에 공지된 RNA 시퀀싱 방법을 이용하여 RNA 서열의 변형을 검출할 수 있다. 타겟 아데노신이 mRNA의 코딩 영역에 위치되는 경우, RNA 편집은 mRNA에 의해 인코딩된 아미노산 서열에 변화를 일으킬 수 있다. 예를 들면, 점 돌연변이는 mRNA에서 선천적인 또는 후천적인 점 돌연변이의 mRNA에 도입될 수 있으며, "A"가 "I"로 전환되기 때문에 야생형 유전자 산물(들)을 생성하기 위해 역전될 수 있다. 당업계에 공지된 방법에 의한 아미노산 시퀀싱을 이용하여, 인코딩된 단백질에서 아미노산 잔기의 임의의 변화를 찾을 수 있다. 정지 코돈의 변형은 기능적, 연장된, 절단된, 전장 및/또는 야생형 단백질의 존재를 평가함으로써 결정될 수 있다. 예를 들면, 타겟 아데노신이 UGA, UAG 또는 UAA 정지 코돈에 위치되면, 타겟 A(UGA 또는 UAG) 또는 타겟 A들(UAA)의 변형은 리드-스루(read-through) 돌연변이 및/또는 연장된 단백질을 생성할 수 있고, 또는 타겟 RNA에 의해 인코딩되는 절단된 단백질은 기능적, 전장 및/또는 야생형 단백질을 생성하도록 역전될 수 있다. 또한, 타겟 RNA의 편집은 타겟 RNA에서 비정상적 스플라이스 부위 및/또는 선택적 스플라이스 부위를 생성할 수 있으며, 따라서 연장된, 절단된 또는 잘못 접힌 단백질, 또는 타겟 RNA에서 인코딩된 비정상적 스플라이싱 또는 선택적 스플라이스 부위가 기능적, 제대로 접힌, 전장 및/또는 야생형 단백질을 생성하도록 역전될 수 있게 된다. 일부 실시형태에 있어서, 본 출원은 선천적인 및 후천적인 유전적 변화의 양방, 예를 들면 미스센스 돌연변이, 조기 정지 코돈, 타겟 RNA에 의해 인코딩된 비정상적 스플라이싱 또는 선택적 스플라이스 부위의 편집을 고려한다. 타겟 RNA에 의해 인코딩된 단백질의 기능을 평가하기 위한 공지의 방법을 이용하면, RNA 편집이 소망의 효과를 달성하는지의 여부를 알 수 있다. 아데노신(A)의 이노신(I)으로의 탈아미노화는 단백질을 인코딩하는 돌연변이체 RNA의 타겟 위치의 돌연변이된 A를 교정할 수 있기 때문에, 이노신으로의 탈아미노화의 식별은 기능적 단백질이 존재하는지의 여부, 또는 돌연변이된 아데노신의 존재에 의해 야기된 질환 또는 약물 내성-관련 RNA가 역전되거나 또는 부분적으로 역전되는지의 여부에 대한 평가를 제공할 수 있다. 마찬가지로, 아데노신(A)의 이노신(I)으로의 탈아미노화는 얻어지는 단백질에 점 돌연변이를 도입할 수 있기 때문에, 이노신으로의 탈아미노화의 식별은 질환의 원인 또는 질환의 관련 요인을 식별하기 위한 기능적 표시를 제공할 수 있다.
타겟 아데노신의 존재로 비정상적 스플라이싱이 발생하면, 판독은 비정상적 스플라이싱의 발생 및 빈도에 대한 평가일 수 있다. 한편, 스플라이스 부위를 도입하기 위해 타겟 아데노신의 탈아미노화가 바람직한 경우, 유사한 접근법을 이용하여 필요한 유형의 스플라이싱이 발생하는지의 여부를 확인할 수 있다. 타겟 아데노신의 탈아미노화 후의 이노신의 존재를 식별하기 위한 예시적인 적절한 방법은 당업자에게 잘 알려진 방법을 이용한 RT-PCR 및 시퀀싱이다.
타겟 아데노신(들)의 탈아미노화의 효과는 예를 들면, 얻어지는 단백질의 점 돌연변이, 조기 정지 코돈, 비정상적 스플라이스 부위, 선택적 스플라이스 부위 및 잘못 접힘을 포함한다. 이들 효과는 유전적으로 유전되거나 또는 후천적인 유전적 돌연변이에 의해 유발된 질환과 관련된 RNA 및/또는 단백질의 구조적 및 기능적 변화를 유도할 수 있거나, 또는 약물 내성의 발생과 관련된 RNA 및/또는 단백질의 구조적 및 기능적 변화를 유도할 수 있다. 따라서, 본 출원의 dRNA, dRNA를 인코딩하는 구축물 및 RNA 편집 방법은 질환-관련 RNA 및/또는 단백질의 구조 및/또는 기능을 변화시킴으로써 유전적인 유전 질환 또는 상태, 또는 후천적인 유전적 돌연변이와 관련된 질환 또는 상태를 예방하거나 치료하는 데 사용될 수 있다.
일부 실시형태에 있어서, 타겟 RNA는 조절 RNA이다. 일부 실시형태에 있어서, 편집될 타겟 RNA는 리보솜 RNA, 트랜스퍼 RNA, 긴 논-코딩 RNA 또는 작은 RNA(예를 들면, miRNA, pri-miRNA, pre-miRNA, piRNA, siRNA, snoRNA, snRNA, exRNA 또는 scaRNA)이다. 타겟 아데노신의 탈아미노화의 효과는 예를 들면, 3차원 구조의 변화 및/또는 타겟 RNA의 기능 손실이나 기능 획득을 포함한, 리보솜 RNA, 트랜스퍼 RNA, 긴 논-코딩 RNA 또는 작은 RNA(예를 들면, miRNA)의 구조적 및 기능적 변화를 포함한다. 일부 실시형태에 있어서, 타겟 RNA에서의 타겟 A의 탈아미노화는 타겟 RNA의 하나 이상의 하류 분자(예를 들면, 단백질, RNA 및/또는 대사 물질)의 발현 수준을 변화시킨다. 하류 분자의 발현 수준의 변화는 발현 수준의 증가 또는 감소일 수 있다.
본 출원의 일부 실시형태는 타겟 유전자의 상이한 변이체 또는 숙주 세포에서의 상이한 유전자를 스크리닝하는 데 유용한, 숙주 세포에서의 타겟 RNA의 다중화 편집을 수반한다. 일부 실시형태에 있어서, 상기 방법은 복수의 dRNA를 숙주 세포에 도입하는 단계를 포함하고, 복수의 dRNA 중 적어도 2개의 dRNA는 상이한 서열 및/또는 상이한 타겟 RNA를 갖는다. 일부 실시형태에 있어서, 각각의 dRNA는 상이한 서열 및/또는 상이한 타겟 RNA를 갖는다. 일부 실시형태에 있어서, 상기 방법은 숙주 세포에서 단일 타겟 RNA의 복수(예를 들면, 적어도 2, 3, 5, 10, 50, 100, 1000개 또는 그 이상)의 변형을 생성한다. 일부 실시형태에 있어서, 상기 방법은 숙주 세포에서 복수(예를 들면, 적어도 2, 3, 5, 10, 50, 100, 1000개 또는 그 이상)의 타겟 RNA의 변형을 생성한다. 일부 실시형태에 있어서, 상기 방법은 복수의 숙주 세포 집단에서 복수의 타겟 RNA를 편집하는 단계를 포함한다. 일부 실시형태에 있어서, 숙주 세포의 각각의 집단은 다른 숙주 세포의 집단과는 상이한 dRNA 또는 상이한 타겟 RNA를 갖는 dRNA를 수용한다.
탈아미노효소-리크루팅 RNA, 구축물 및 라이브러리
일 양태에 있어서, 본 출원은 본원에 기재된 방법 중 어느 하나에 유용한 탈아미노효소-리크루팅 RNA를 제공한다. 이 섹션에 기재된 dRNA 중 어느 하나는 본원에 기재된 RNA 편집 방법 및 치료 방법에 사용될 수 있다. dRNA에 대해 본원에 기재된 임의의 특징 및 파라미터는 마치 각각의 조합 및 모든 조합이 개별적으로 기재된 것처럼 서로 조합될 수 있다는 것을 의도한다. 본원에 기재된 dRNA는 CRISPR/Cas 시스템에서 사용되는 tracrRNA, crRNA 또는 gRNA를 포함하지 않는다.
일부 실시형태에 있어서, 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하는, ADAR을 리크루팅함으로써 타겟 RNA에서 타겟 아데노신의 탈아미노화를 위한 탈아미노효소-리크루팅 RNA(dRNA)가 제공된다.
일 양태에 있어서, 본 발명은 본원에 기재된 탈아미노효소-리크루팅 RNA 중 어느 하나를 포함하는 구축물을 제공한다. 소정 실시형태에 있어서, 구축물은 바이러스 벡터(바람직하게는, 렌티바이러스 벡터) 또는 플라스미드이다. 일부 실시형태에 있어서, 구축물은 단일 dRNA를 인코딩한다. 일부 실시형태에 있어서, 구축물은 복수(예를 들면, 약 1, 2, 3, 4, 5, 10, 20개 또는 그 이상 중 어느 하나)의 dRNA를 인코딩한다.
일 양태에 있어서, 본 출원은 본원에 기재된 복수의 탈아미노효소-리크루팅 RNA 또는 복수의 구축물을 포함하는 라이브러리를 제공한다.
일 양태에 있어서, 본 출원은 본원에 기재된 탈아미노효소-리크루팅 RNA 또는 구축물을 포함하는 조성물 또는 숙주 세포를 제공한다. 소정 실시형태에 있어서, 숙주 세포는 원핵 세포 또는 진핵 세포이다. 바람직하게는, 숙주 세포는 포유동물 세포이다. 가장 바람직하게는, 숙주 세포는 인간 세포이다.
본원에 기재된 dRNA, 구축물, 라이브러리 또는 조성물 중 어느 하나에 따른 소정 실시형태에 있어서, 상보적 RNA 서열은 타겟 RNA에서 편집될 타겟 아데노신의 정반대쪽에 시티딘, 아데노신 또는 우리딘을 포함한다. 소정 실시형태에 있어서, 상보적 RNA 서열은 타겟 RNA에서 비타겟 아데노신의 각각 정반대쪽인 하나 이상의 구아노신(들)을 더 포함한다. 소정 실시형태에 있어서, 타겟 A의 5' 최근접 이웃은 U, C, A 및 G로부터 선택된 뉴클레오티드이고 선호도는 U>C≒A>G이고, 타겟 A의 3' 최근접 이웃은 G, C, A 및 U로부터 선택된 뉴클레오티드이고 선호도는 G>C>A≒U이다. 일부 실시형태에 있어서, 타겟 A의 5' 최근접 이웃은 U이다. 일부 실시형태에 있어서, 타겟 A의 5' 최근접 이웃은 C 또는 A이다. 일부 실시형태에 있어서, 타겟 A의 3' 최근접 이웃은 G이다. 일부 실시형태에 있어서, 타겟 A의 3' 최근접 이웃은 C이다.
본원에 기재된 dRNA, 구축물, 라이브러리 또는 조성물 중 어느 하나에 따른 소정 실시형태에 있어서, 타겟 A는 타겟 RNA에서 UAG, UAC, UAA, UAU, CAG, CAC, CAA, CAU, AAG, AAC, AAA, AAU, GAG, GAC, GAA 및 GAU로 이루어지는 군으로부터 선택되는 3-염기 모티프로 있다. 소정 실시형태에 있어서, 3-염기 모티프는 UAG이고, dRNA는 3-염기 모티프에서 U의 정반대쪽에 A, 타겟 A의 정반대쪽에 C, 및 3-염기 모티프에서 G의 정반대쪽에 C, G 또는 U를 포함한다. 소정 실시형태에 있어서, 3-염기 모티프는 타겟 RNA에서 UAG이고, dRNA는 타겟 RNA의 UAG의 반대쪽인 ACC, ACG 또는 ACU를 포함한다.
일부 실시형태에 있어서, dRNA는 타겟 RNA에서 타겟 A의 정반대쪽에 시티딘 미스매치를 포함한다. 일부 실시형태에 있어서, 시티딘 미스매치는 상보적 RNA 서열의 중심으로부터 20, 15, 10, 5, 4, 3, 2 또는 1개의 뉴클레오티드 이내 떨어져 있는 것과 같이 상보적 RNA 서열의 중심에 가깝다. 일부 실시형태에 있어서, 시티딘 미스매치는 상보적 RNA 서열의 5' 말단으로부터 적어도 5개의 뉴클레오티드와 떨어져 있다. 일부 실시형태에 있어서, 시티딘 미스매치는 상보적 RNA 서열의 3' 말단으로부터 적어도 20개의 뉴클레오티드와 떨어져 있다.
본원에 기재된 dRNA, 구축물, 라이브러리 또는 조성물 중 어느 하나에 따른 소정 실시형태에 있어서, dRNA는 적어도 약 40, 45, 50, 55, 60, 65, 70, 75, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 또는 250개의 뉴클레오티드 중 어느 하나를 포함한다. 소정 실시형태에 있어서, dRNA는 약 40-260, 45-250, 50-240, 60-230, 65-220, 70-210, 70-200, 70-190, 70-180, 70-170, 70-160, 70-150, 70-140, 70-130, 70-120, 70-110, 70-100, 70-90, 70-80, 75-200, 80-190, 85-180, 90-170, 95-160, 100-150 또는 105-140개의 뉴클레오티드 길이 중 어느 하나이다. 일부 실시형태에 있어서, dRNA는 약 60-200(예를 들면, 약 60-150, 65-140, 68-130, 또는 70-120)개의 뉴클레오티드 길이이다.
본 출원의 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함한다. 상보적 RNA 서열은 상보적 RNA 서열을 타겟 RNA에 혼성화할 수 있도록 타겟 RNA에 대해 완벽하게 상보적이거나 또는 실질적으로 상보적이다. 일부 실시형태에 있어서, 상보적 RNA 서열은 타겟 RNA로서 100%의 서열 상보성을 갖는다. 일부 실시형태에 있어서, 상보적 RNA 서열은 타겟 RNA에서 적어도 약 20, 40, 60, 80, 100, 150, 200개 또는 그 이상의 뉴클레오티드 중 어느 하나의 연속적인 신장에 걸쳐 적어도 약 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 또는 그 이상의 상보성 중 어느 하나를 갖는다. 일부 실시형태에 있어서, 상보적 RNA 서열과 타겟 RNA 사이의 혼성화에 의해 형성된 dsRNA는 하나 이상(예를 들면, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 이상)의 비-왓슨-크릭 염기쌍(즉, 미스매치)을 갖는다.
ADAR, 예를 들면 인간 ADAR 효소는 다수의 요인에 따라 다양한 특이성을 가진 이중 가닥 RNA(dsRNA) 구조를 편집한다. 한 가지 중요한 요인은 dsRNA 서열을 구성하는 2개의 가닥의 상보성의 정도이다. dRNA와 타겟 RNA 사이의 완벽한 상보성은 일반적으로 ADAR의 촉매 도메인이 비차별적 방식으로 아데노신을 탈아미노화하게 한다. ADAR의 특이성 및 효율은 dsRNA 영역에 미스매치를 도입함으로써 변형될 수 있다. 예를 들면, 편집될 아데노신의 탈아미노화의 특이성 및 효율을 증가시키기 위해서 바람직하게는 A-C 미스매치가 권장된다. 반대로, 타겟 A 이외의 다른 A(아데노신) 위치(즉, "비타겟 A")에서, G-A 미스매치는 오프-타겟 편집을 감소시킬 수 있다. dRNA와 타겟 RNA 사이에 dsRNA의 혼성화 및 형성을 위해 실질적인 상보성이 있다면, dRNA와 그것의 타겟 RNA 사이에 dsRNA 형성을 위해 완벽한 상보성이 반드시 필요한 것은 아니다. 일부 실시형태에 있어서, dRNA 서열 또는 그것의 단일 가닥 RNA 영역은 최적으로 정렬될 때, 타겟 RNA에 대해 적어도 약 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 서열 상보성 중 어느 하나를 갖는다. 최적의 정렬은 서열을 정렬하기 위한 임의의 적합한 알고리즘을 이용하여 결정될 수 있고, 그 비제한적인 예는 스미스-워터만 알고리즘, 니들만-운치 알고리즘, 버로우즈-휠러 변환 기반 알고리즘(예를 들면, 버로우즈 휠러 얼라이너)을 포함한다.
또한, 타겟 아데노신에 인접한 뉴클레오티드는 탈아미노화의 특이성 및 효율에 영향을 미친다. 아데노신의 탈아미노화의 특이성 및 효율의 관점으로부터, 예를 들면 타겟 RNA 서열에서 편집될 타겟 아데노신의 5' 최근접 이웃은 U>C≒A>G의 선호도를 갖고, 타겟 RNA 서열에서 편집될 타겟 아데노신의 3' 최근접 이웃은 G>C>A≒U의 선호도를 갖는다. 일부 실시형태에 있어서, 타겟 아데노신이 타겟 RNA에서 UAG, UAC, UAA, UAU, CAG, CAC, CAA, CAU, AAG, AAC, AAA, AAU, GAG, GAC, GAA 및 GAU로 이루어지는 군으로부터 선택되는 3-염기 모티프로 있을 수 있는 경우, 아데노신의 탈아미노화의 특이성 및 효율은 다른 3-염기 모티프에서의 아데노신보다 높다. 일부 실시형태에 있어서, 편집될 타겟 아데노신이 3-염기 모티프 UAG, UAC, UAA, UAU, CAG, CAC, AAG, AAC or AAA로 있는 경우, 아데노신의 탈아미노화의 효율은 다른 모티프에서의 아데노신보다 훨씬 더 높다. 동일한 3-염기 모티프에 대해, 상이한 설계의 dRNA는 또한 상이한 탈아미노화 효율로 이어질 수 있다. 3-염기 모티프 UAG를 예로 들면, 일부 실시형태에 있어서, dRNA가 편집될 타겟 아데노신의 정반대쪽에 시티딘(C), 우리딘의 정반대쪽에 아데노신(A), 및 구아노신의 정반대쪽에 시티딘(C), 구아노신(G) 또는 우리딘(U)을 포함하는 경우, 타겟 아데노신의 탈아미노화의 효율은 다른 dRNA 서열을 사용하는 것보다 높다. 일부 실시형태에 있어서, dRNA가 타겟 RNA의 UAG의 반대쪽에 ACC, ACG 또는 ACU를 포함하는 경우, 타겟 RNA의 UAG에서의 A의 편집 효율은 약 25%-30%에 도달할 수 있다.
타겟 아데노신 외에, 편집되는 것이 바람직하지 않은 타겟 RNA에서의 하나 이상의 아데노신이 있을 수 있다. 이들 아데노신에 대해, 가능한 한 그들의 편집 효율을 감소시키는 것이 바람직하다. 본 발명에 의해, 구아노신이 타겟 RNA에서 아데노신의 정반대쪽에 있는 경우, 탈아미노화 효율은 현저히 감소되는 것을 발견했다. 따라서, 오프-타겟 탈아미노화를 감소시키기 위해, dRNA는 타겟 RNA에서 편집될 타겟 아데노신 이외의 하나 이상의 아데노신(들)의 정반대쪽에 하나 이상의 구아노신을 포함하도록 설계될 수 있다.
타겟 RNA 서열 편집의 소망하는 수준의 특이성 및 효율은 상이한 용도에 따라 달라질 수 있다. 본 특허 출원의 지침에 따라, 당업자는 그들의 요구에 따라 타겟 RNA 서열에 대해 상보적이거나 또는 실질적으로 상보적인 서열을 갖는 dRNA를 설계할 수 있을 것이고, 또한 약간의 시행착오를 거쳐 소망하는 결과를 얻을 수 있을 것이다. 본원에 사용된 바와 같이, 용어 "미스매치"는 왓슨-크릭 염기쌍 규칙에 따라 완벽한 염기쌍을 형성하지 않는 이중 가닥 RNA(dsRNA)에서 반대쪽 뉴클레오티드를 지칭한다. 미스매치 염기쌍은 예를 들면, G-A, C-A, U-C, A-A, G-G, C-C, U-U 염기쌍을 포함한다. A-C 매치를 예로 들면, 타겟 A가 타겟 RNA에서 편집되는 경우, dRNA는 편집될 A의 반대쪽에 C를 포함하도록 설계되어, 타겟 RNA와 dRNA 사이의 혼성화에 의해 형성된 dsRNA에서 A-C 미스매치를 생성한다.
일부 실시형태에 있어서, dRNA와 타겟 RNA 사이의 혼성화에 의해 형성된 dsRNA는 미스매치를 포함하지 않는다. 일부 실시형태에 있어서, dRNA와 타겟 RNA 사이의 혼성화에 의해 형성된 dsRNA는 하나 이상, 예를 들면 1, 2, 3, 4, 5, 6, 7개 또는 그 이상의 미스매치(예를 들면, 동일한 유형의 상이한 미스매치 유형) 중 어느 하나를 포함한다. 일부 실시형태에 있어서, dRNA와 타겟 RNA 사이의 혼성화에 의해 형성된 dsRNA는 1종 이상의 미스매치를 포함하고, 예를 들면 G-A, C-A, U-C, A-A, G-G, C-C 및 U-U로 이루어지는 군으로부터 선택되는 1, 2, 3, 4, 5, 6, 7종의 미스매치를 포함한다.
dRNA와 타겟 RNA 사이의 혼성화에 의해 형성된 dsRNA에서의 미스매치 뉴클레오티드는 타겟 RNA의 편집 효율을 촉진할 수 있는 벌지(bulge)를 형성할 수 있다. 미스매치에 의해 형성된 하나(타겟 아데노신에서만 형성됨) 이상의 벌지가 있을 수 있다. 추가의 벌지-유도 미스매치는 타겟 아데노신의 상류 및/또는 하류일 수 있다. 벌지는 단일 미스매치 벌지(하나의 미스매칭 염기쌍에 의해 발생됨) 또는 다수의 미스매치 벌지(하나를 초과한 연속한 미스매칭 염기쌍, 바람직하게는 2개 또는 3개의 연속한 미스매칭 염기쌍에 의해 발생됨)일 수 있다.
dRNA에서의 상보적 RNA 서열은 단일 가닥이다. dRNA는 완전히 단일 가닥이거나 또는 하나 이상(예를 들면, 1, 2, 3개 또는 그 이상)의 이중 가닥 영역 및/또는 하나 이상의 스템 루프 영역을 가질 수 있다. 일부 실시형태에 있어서, 상보적 RNA 서열은 적어도 약 40, 45, 50, 55, 60, 65, 70, 75, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200개 또는 그 이상의 뉴클레오티드 중 어느 하나이다. 소정 실시형태에 있어서, 상보적 RNA 서열은 약 40-260, 45-250, 50-240, 60-230, 65-220, 70-220, 70-210, 70-200, 70-190, 70-180, 70-170, 70-160, 70-150, 70-140, 70-130, 70-120, 70-110, 70-100, 70-90, 70-80, 75-200, 80-190, 85-180, 90-170, 95-160, 100-200, 100-150, 100-175, 110-200, 110-175, 110-150, 또는 105-140개의 뉴클레오티드 길이 중 어느 하나이다. 일부 실시형태에 있어서, dRNA는 약 60-200(예를 들면, 약 60-150, 65-140, 68-130, 또는 70-120)개의 뉴클레오티드 길이이다. 일부 실시형태에 있어서, 상보적 RNA 서열은 약 71개의 뉴클레오티드 길이이다. 일부 실시형태에 있어서, 상보적 RNA 서열은 약 111개의 뉴클레오티드 길이이다.
일부 실시형태에 있어서, 상보적 RNA 서열 외에도 dRNA는 dRNA를 안정화시키기 위한 영역, 예를 들면 하나 이상의 이중 가닥 영역 및/또는 스템 루프 영역을 더 포함한다. 일부 실시형태에 있어서, dRNA의 이중 가닥 영역 또는 스템 루프 영역은 약 200, 150, 100, 50, 40, 30, 20, 10개 또는 그 이하의 염기쌍 중 어느 하나 이하를 포함한다. 일부 실시형태에 있어서, dRNA는 스템 루프 또는 이중 가닥 영역을 포함하지 않는다. 일부 실시형태에 있어서, dRNA는 ADAR-리크루팅 도메인을 포함한다. 일부 실시형태에 있어서, dRNA는 ADAR-리크루팅 도메인을 포함하지 않는다.
dRNA는 하나 이상의 변형을 포함할 수 있다. 일부 실시형태에 있어서, dRNA는 핵염기 변형 및/또는 백본 변형을 포함한 하나 이상의 변형된 뉴클레오티드를 갖는다. 일부 실시형태에 있어서, dRNA는 약 60-200개의 뉴클레오티드 길이이고, 하나 이상의 변형(예를 들면, 2'-O-메틸화 및/또는 포스포로티오화)을 포함한다. 일부 실시형태에 있어서, 변형된 dRNA는 5' 말단에서 3' 말단으로: 5' 부분, 타겟 RNA에서 타겟 A의 정반대쪽의 시티딘 미스매치, 및 3' 부분을 포함하고, 여기서 3' 부분은 약 7개의 뉴클레오티드 이상(예를 들면, 8개의 뉴클레오티드 이상, 9개의 뉴클레오티드 이상, 및 10개의 뉴클레오티드 이상)의 뉴클레오티드이다. 일부 실시형태에 있어서, 5' 부분은 약 25개 이상(예를 들면, 약 30개 이상, 약 35개의 뉴클레오티드 이상, 약 40개의 뉴클레오티드 이상, 및 약 45개의 뉴클레오티드 이상)의 뉴클레오티드이다. 일부 실시형태에 있어서, 5' 부분은 약 25개의 뉴클레오티드-85개의 뉴클레오티드 뉴클레오티드 길이(예를 들면, 약 25개의 뉴클레오티드-80개의 뉴클레오티드, 25개의 뉴클레오티드-75개의 뉴클레오티드, 25개의 뉴클레오티드-70개의 뉴클레오티드, 25개의 뉴클레오티드-65개의 뉴클레오티드, 25개의 뉴클레오티드-60개의 뉴클레오티드, 30개의 뉴클레오티드-55개의 뉴클레오티드, 40개의 뉴클레오티드-55개의 뉴클레오티드, 또는 45개의 뉴클레오티드-55개의 뉴클레오티드 뉴클레오티드 길이)이다. 일부 실시형태에 있어서, 3' 부분은 약 7개의 뉴클레오티드-25개의 뉴클레오티드 뉴클레오티드 길이(예를 들면, 약 10개의 뉴클레오티드-15개의 뉴클레오티드 또는 21개의 뉴클레오티드-25개의 뉴클레오티드 뉴클레오티드 길이)이다. 일부 실시형태에 있어서, 5' 부분은 약 25개의 뉴클레오티드-85개의 뉴클레오티드 뉴클레오티드 길이(예를 들면, 약 25개의 뉴클레오티드-80개의 뉴클레오티드, 25개의 뉴클레오티드-75개의 뉴클레오티드, 25개의 뉴클레오티드-70개의 뉴클레오티드, 25개의 뉴클레오티드-65개의 뉴클레오티드, 25개의 뉴클레오티드-60개의 뉴클레오티드, 30개의 뉴클레오티드-55개의 뉴클레오티드, 40개의 뉴클레오티드-55개의 뉴클레오티드, 또는 45개의 뉴클레오티드-55개의 뉴클레오티드 뉴클레오티드 길이)이고, 3' 부분은 약 7개의 뉴클레오티드-25개의 뉴클레오티드 뉴클레오티드 길이(예를 들면, 약 10개의 뉴클레오티드-15개의 뉴클레오티드 또는 21개의 뉴클레오티드-25개의 뉴클레오티드 뉴클레오티드 길이)이다. 일부 실시형태에 있어서, 5' 부분은 3' 부분보다 길다. 일부 실시형태에 있어서, 5' 부분은 약 55개의 뉴클레오티드 길이이고, 3' 부분은 약 15개의 뉴클레오티드 길이이다. 일부 실시형태에 있어서, dRNA에서 시티딘 미스매치의 위치는 본원의 실시예에 기재된 임의의 dRNA에 따르고, dRNA는 X개의 뉴클레오티드-c-Y개의 뉴클레오티드의 형식일 수 있으며, 여기서 X는 5' 부분의 길이를 나타내고, Y는 3' 부분의 길이를 나타낸다: 55개의 뉴클레오티드-c-35개의 뉴클레오티드, 55개의 뉴클레오티드-c-25개의 뉴클레오티드, 55개의 뉴클레오티드-c-24개의 뉴클레오티드, 55개의 뉴클레오티드-c-23개의 뉴클레오티드, 55개의 뉴클레오티드-c-22개의 뉴클레오티드, 55개의 뉴클레오티드-c-21개의 뉴클레오티드, 55개의 뉴클레오티드-c-20개의 뉴클레오티드, 55개의 뉴클레오티드-c-19개의 뉴클레오티드, 55개의 뉴클레오티드-c-18개의 뉴클레오티드, 55개의 뉴클레오티드-c-17개의 뉴클레오티드, 55개의 뉴클레오티드-c-16개의 뉴클레오티드, 55개의 뉴클레오티드-c-15개의 뉴클레오티드, 55개의 뉴클레오티드-c-14개의 뉴클레오티드, 55개의 뉴클레오티드-c-13개의 뉴클레오티드, 55개의 뉴클레오티드-c-12개의 뉴클레오티드, 55개의 뉴클레오티드-c-11개의 뉴클레오티드, 55개의 뉴클레오티드-c-10개의 뉴클레오티드, 55개의 뉴클레오티드-c-9개의 뉴클레오티드, 55개의 뉴클레오티드-c-8개의 뉴클레오티드, 55개의 뉴클레오티드-c-7개의 뉴클레오티드, 55개의 뉴클레오티드-n-20개의 뉴클레오티드, 50개의 뉴클레오티드-n-20개의 뉴클레오티드, 45개의 뉴클레오티드-n-20개의 뉴클레오티드, 55개의 뉴클레오티드-n-15개의 뉴클레오티드, 50개의 뉴클레오티드-n-15개의 뉴클레오티드, 45개의 뉴클레오티드-c-45개의 뉴클레오티드, 45개의 뉴클레오티드-c-55개의 뉴클레오티드, 54개의 뉴클레오티드-c-12개의 뉴클레오티드, 53개의 뉴클레오티드-c-13개의 뉴클레오티드, 52개의 뉴클레오티드-c-14개의 뉴클레오티드, 51개의 뉴클레오티드-c-15개의 뉴클레오티드, 50개의 뉴클레오티드-c-16개의 뉴클레오티드, 49개의 뉴클레오티드-c-17개의 뉴클레오티드, 48개의 뉴클레오티드-c-18개의 뉴클레오티드, 47개의 뉴클레오티드-c-19개의 뉴클레오티드, 46개의 뉴클레오티드-c-20개의 뉴클레오티드, 45개의 뉴클레오티드-c-21개의 뉴클레오티드, 44개의 뉴클레오티드-c-22개의 뉴클레오티드, 43개의 뉴클레오티드-c-23개의 뉴클레오티드, 54개의 뉴클레오티드-c-15개의 뉴클레오티드, 53개의 뉴클레오티드-c-16개의 뉴클레오티드, 52개의 뉴클레오티드-c-17개의 뉴클레오티드, 51개의 뉴클레오티드-c-18개의 뉴클레오티드, 50개의 뉴클레오티드-c-19개의 뉴클레오티드, 49개의 뉴클레오티드-c-20개의 뉴클레오티드, 48개의 뉴클레오티드-c-21개의 뉴클레오티드, 47개의 뉴클레오티드-c-22개의 뉴클레오티드, 46개의 뉴클레오티드-c-23개의 뉴클레오티드, 54개의 뉴클레오티드-c-17개의 뉴클레오티드, 53개의 뉴클레오티드-n-18개의 뉴클레오티드, 52개의 뉴클레오티드-n-19개의 뉴클레오티드, 51개의 뉴클레오티드-n-20개의 뉴클레오티드, 50개의 뉴클레오티드-n-21개의 뉴클레오티드, 49개의 뉴클레오티드-n-22개의 뉴클레오티드, 48개의 뉴클레오티드-c-23.
일부 실시형태에 있어서, dRNA는 약 60-200개의 뉴클레오티드 길이이고, 하나 이상의 변형(예를 들면, 2'-O-메틸화 및/또는 포스포로티오화)을 포함한다. 일부 실시형태에 있어서, dRNA는 첫번째 및 마지막 3개의 뉴클레오티드에서의 2'-O-메틸화 및/또는 첫번째 및 마지막 3개의 뉴클레오티드간 연결에서의 포스포로티오화를 포함한다. 일부 실시형태에 있어서, dRNA는 첫번째 및 마지막 3개의 뉴클레오티드에서의 2'-O-메틸화, 첫번째 및 마지막 3개의 뉴클레오티드간 연결에서의 포스포로티오화, 및 하나 이상의 우리딘, 예를 들면 모든 우리딘에서의 2'-O-메틸화를 포함한다. 일부 실시형태에 있어서, dRNA는 첫번째 및 마지막 3개의 뉴클레오티드에서의 2'-O-메틸화, 첫번째 및 마지막 3개의 뉴클레오티드간 연결에서의 포스포로티오화, 단일 또는 다수 또는 모든 우리딘에서의 2'-O-메틸화, 및 타겟 아데노신의 반대쪽의 뉴클레오티드 및/또는 타겟 아데노신의 반대쪽의 뉴클레오티드 최근접 1개 또는 2개의 뉴클레오티드에서의 변형을 포함한다. 소정 실시형태에 있어서, 타겟 아데노신의 반대쪽의 뉴클레오티드 및/또는 타겟 아데노신의 반대쪽의 뉴클레오티드 최근접 1개 또는 2개의 뉴클레오티드에서의 변형은 2'-O-메틸화이다. 소정 실시형태에 있어서, 타겟 아데노신의 반대쪽의 뉴클레오티드 및/또는 타겟 아데노신의 반대쪽의 뉴클레오티드 최근접 1개 또는 2개의 뉴클레오티드에서의 변형은 3'-포스포로티오화 연결과 같은 포스포로티오화 연결이다. 소정 실시형태에 있어서, dRNA는 첫번째 및 마지막 3개의 뉴클레오티드에서의 2'-O-메틸화, 첫번째 및 마지막 3개의 뉴클레오티드간 연결에서의 포스포로티오화, 모든 우리딘에서의 2'-O-메틸화, 및 타겟 아데노신의 반대쪽의 뉴클레오티드의 3' 말단 또는 5' 말단에 인접한 뉴클레오티드에서의 2'-O-메틸화를 포함한다. 소정 실시형태에 있어서, dRNA는 첫번째 및 마지막 3개의 뉴클레오티드에서의 2'-O-메틸화, 첫번째 및 마지막 3개의 뉴클레오티드간 연결에서의 포스포로티오화, 모든 우리딘에서의 2'-O-메틸화, 및 타겟 아데노신의 반대쪽의 뉴클레오티드 및/또는 그것의 5' 및/또는 3' 최근접 뉴클레오티드에서의 3'-포스포로티오화를 포함한다. 일부 실시형태에 있어서, dRNA는 첫번째 및 마지막 5개의 뉴클레오티드에서의 2'-O-메틸화 및 첫번째 및 마지막 5개의 뉴클레오티드간 연결에서의 포스포로티오화를 포함한다. 또한, 본 출원은 본원에 기재된 dRNA를 포함하는 구축물을 고려한다. 본원에 사용된 바와 같은 용어 "구축물"은 RNA로 전사되거나 단백질로 발현될 수 있는 코딩 뉴클레오티드 서열을 포함하는 DNA 또는 RNA 분자를 지칭한다. 일부 실시형태에 있어서, 구축물은 RNA 또는 단백질을 인코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 하나 이상의 조절 요소를 함유한다. 구축물이 숙주 세포에 도입될 때, 적합한 조건 하에서 구축물의 코딩 뉴클레오티드 서열이 전사되거나 발현될 수 있다.
일부 실시형태에 있어서, 구축물은 프로모터가 코딩 뉴클레오티드 서열의 전사 또는 발현을 제어하도록, 코딩 뉴클레오티드 서열에 작동가능하게 연결되거나 또는 공간적으로 연결되는 프로모터를 포함한다. 프로모터는 그것의 제어 하에서 코딩 뉴클레오티드 서열의 5'(상류)에 위치될 수 있다. 프로모터와 코딩 서열 사이의 거리는 그 프로모터와, 프로모터가 유래된 유전자에서 제어하는 유전자 사이의 거리와 거의 동일할 수 있다. 당업계에 공지된 바와 같이, 이 거리의 변화는 프로모터 기능의 손실 없이 수용될 수 있다. 일부 실시형태에 있어서, 구축물은 코딩 뉴클레오티드 서열의 전사 또는 발현을 조절하는 5' UTR 및/또는 3' UTR을 포함한다.
일부 실시형태에 있어서, 구축물은 본 출원에 기재된 dRNA 중 어느 하나를 인코딩하는 벡터이다. 용어 "벡터"는 그것이 연결된 또 다른 핵산을 수송할 수 있는 핵산 분자를 지칭한다. 벡터는 단일 가닥, 이중 가닥 또는 부분 이중 가닥인 핵산 분자; 하나 이상의 자유 말단을 포함하는 핵산 분자, 자유 말단이 없는(예를 들면, 원형) 핵산 분자; DNA, RNA 또는 양방을 포함하는 핵산 분자; 및 당업계에 공지된 다른 다양한 폴리뉴클레오티드를 포함하지만, 이들에 한정되지 않는다. 한 유형의 벡터는 표준 분자 클로닝 기술과 같이 추가 DNA 세그먼트가 삽입될 수 있는 환형의 이중 가닥 DNA 루프를 지칭하는 "플라스미드"이다. 소정 벡터는 이들이 도입되는 숙주 세포에서 자율 복제할 수 있다(예를 들면, 박테리아 복제 기점을 갖는 박테리아 벡터 및 에피솜 포유동물 벡터). 다른 벡터(예를 들면, 비-에피솜 포유동물 벡터)는 숙주 세포에 도입될 때 숙주 세포의 게놈에 통합되고, 따라서 숙주 게놈과 함께 복제된다. 또한, 소정 벡터는 그들이 작동가능하게 연결된 코딩 뉴클레오티드 서열의 전사 또는 발현을 지시할 수 있다. 이러한 벡터는 본원에서 "발현 벡터"라고 지칭된다.
재조합 발현 벡터는 숙주 세포에서 핵산의 전사 또는 발현에 적합한 형태로 본 발명의 핵산을 포함할 수 있다. 일부 실시형태에 있어서, 재조합 발현 벡터는 하나 이상의 조절 요소를 포함하고, 전사 또는 발현에 사용될 숙주 세포를 기준으로 선택될 수 있고, 전사 또는 발현될 핵산 서열에 작동가능하게 연결된다. 재조합 발현 벡터 내에서, "작동가능하게 연결된"은 관심의 뉴클레오티드 서열이 뉴클레오티드 서열의 발현(예를 들면, 시험관내(in vitro) 전사/번역 시스템에서 또는 벡터가 숙주 세포에 도입될 때 숙주 세포에서)을 허용하는 방식으로 조절 요소(들)에 연결되는 것을 의미하도록 의도된다.
일부 실시형태에 있어서, dRNA를 인코딩하는 뉴클레오티드 서열을 포함하는 구축물(예를 들면, 바이러스 벡터와 같은 벡터)이 제공된다. 일부 실시형태에 있어서, ADAR을 인코딩하는 뉴클레오티드 서열을 포함하는 구축물(예를 들면, 바이러스 벡터와 같은 벡터)이 제공된다. 일부 실시형태에 있어서, dRNA를 인코딩하는 제 1 뉴클레오티드 서열 및 ADAR을 인코딩하는 제 2 뉴클레오티드 서열을 포함하는 구축물이 제공된다. 일부 실시형태에 있어서, 제 1 뉴클레오티드 서열 및 제 2 뉴클레오티드 서열은 동일한 프로모터에 작동가능하게 연결된다. 일부 실시형태에 있어서, 제 1 뉴클레오티드 서열 및 제 2 뉴클레오티드 서열은 상이한 프로모터에 작동가능하게 연결된다. 일부 실시형태에 있어서, 프로모터는 유도성이다. 일부 실시형태에 있어서, 구축물은 ADAR을 인코딩하지 않는다. 일부 실시형태에 있어서, 벡터는 ADAR3의 억제제(예를 들면, ADAR3 shRNA 또는 siRNA) 및/또는 인터페론의 자극제(예를 들면, IFN-α)를 인코딩하는 핵산 서열(들)을 더 포함한다.
치료 방법
본원에 기재된 RNA 편집 방법 및 조성물은 유전적인 유전 질환 및 약물 내성을 포함하지만 이들에 한정되지 않는, 개체에서의 질환 또는 상태를 치료하거나 예방하는 데 사용될 수 있다.
일부 실시형태에 있어서, 본원에 기재된 RNA 편집 방법 중 어느 하나를 이용하여 타겟 RNA를 편집하는 단계를 포함하는, 생체외에서 개체(예를 들면, 인간 개체)의 세포에서 타겟 RNA를 편집하는 방법이 제공된다.
일부 실시형태에 있어서, dRNA 또는 dRNA를 인코딩하는 구축물을 개체의 세포에 도입하는 단계를 포함하는, 생체외에서 개체(예를 들면, 인간 개체)의 세포에서 타겟 RNA를 편집하는 방법이 제공되고, 상기 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하도록 ADAR을 리크루팅할 수 있다. 일부 실시형태에 있어서, 타겟 RNA는 개체의 질환 또는 상태와 관련된다. 일부 실시형태에 있어서, 질환 또는 상태는 유전적인 유전 질환이거나 또는 하나 이상의 후천적인 유전적 돌연변이(예를 들면, 약물 내성)와 관련된 질환 또는 상태이다. 일부 실시형태에 있어서, 상기 방법은 개체로부터 세포를 얻는 단계를 더 포함한다.
일부 실시형태에 있어서, 본원에 기재된 RNA 편집 방법 중 어느 하나를 이용하여 개체의 세포에서 질환 또는 상태와 관련된 타겟 RNA를 편집하는 단계를 포함하는, 개체(예를 들면, 인간 개체)의 질환 또는 상태를 치료하거나 예방하는 방법이 제공된다.
일부 실시형태에 있어서, dRNA 또는 dRNA를 인코딩하는 구축물을 생체외에서 개체의 단리된 세포에 도입하는 단계를 포함하는, 개체(예를 들면, 인간 개체)에서의 질환 또는 상태를 치료하거나 예방하는 방법이 제공되고, 상기 dRNA는 질환 또는 상태와 관련된 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하도록 ADAR을 리크루팅할 수 있다. 일부 실시형태에 있어서, ADAR은 단리된 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에 있어서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 단리된 세포에 도입하는 단계를 방법을 포함한다. 일부 실시형태에 있어서, 상기 방법은 편집된 RNA를 갖는 세포를 배양하는 단계를 더 포함한다. 일부 실시형태에 있어서, 상기 방법은 편집된 RNA를 갖는 세포를 개체에 투여하는 단계를 더 포함한다. 일부 실시형태에 있어서, 질환 또는 상태는 유전적인 유전 질환이거나 또는 하나 이상의 후천적인 유전적 돌연변이(예를 들면, 약물 내성)와 관련된 질환 또는 상태이다.
일부 실시형태에 있어서, dRNA 또는 dRNA를 인코딩하는 구축물을 생체외에서 개체의 단리된 세포에 도입하는 단계를 포함하는, 개체(예를 들면, 인간 개체)의 질환 또는 상태를 치료하거나 예방하는 방법이 제공되고, 상기 dRNA는 질환 또는 상태와 관련된 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 dRNA는 타겟 RNA에서 타겟 A를 탈아미노하도록 숙주 세포의 내인적으로 발현된 ADAR을 리크루팅할 수 있다. 일부 실시형태에 있어서, 상기 방법은 편집된 RNA를 갖는 세포를 배양하는 단계를 더 포함한다. 일부 실시형태에 있어서, 상기 방법은 편집된 RNA를 갖는 세포를 개체에 투여하는 단계를 더 포함한다. 일부 실시형태에 있어서, 질환 또는 상태는 유전적인 유전 질환이거나 또는 하나 이상의 후천적인 유전적 돌연변이(예를 들면, 약물 내성)과 관련된 질환 또는 상태이다.
일부 실시형태에 있어서, 유효량의 dRNA 또는 dRNA를 인코딩하는 구축물을 개체에 투여하는 단계를 포함하는, 개체(예를 들면, 인간 개체)의 질환 또는 상태를 치료하거나 예방하는 방법이 제공되고, 상기 dRNA는 질환 또는 상태와 관련된 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하도록 ADAR을 리크루팅할 수 있다. 일부 실시형태에 있어서, ADAR은 개체의 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 개체에 투여하는 단계를 포함한다. 일부 실시형태에서, 질환 또는 상태는 유전적인 유전 질환이거나 또는 하나 이상의 후천적인 유전적 돌연변이(예를 들면, 약물 내성)와 관련된 질환 또는 상태이다.
본 출원의 방법을 이용한 치료에 적합한 질환 및 상태는 G에서 A로의 돌연변이와 같은 돌연변이, 예를 들면 RNA 전사물에서 미스센스 돌연변이, 조기 정지 코돈, 비정상적 스플라이싱 또는 선택적 스플라이싱을 초래하는 G에서 A로의 돌연변이와 관련된 질환을 포함한다. 본 출원의 방법에 의해 복원될 수 있는 질환-관련 돌연변이의 예는 암과 관련된 TP53W53X(예를 들면, 158G>A), I형 점액다당류증(MPS I)과 관련된 IDUAW402X(예를 들면, 엑손 9에서의 TGG>TAG 돌연변이), 엘러스-단로스 증후군과 관련된 COL3A1W1278X(예를 들면, 3833G>A 돌연변이), 원발성 폐고혈압증과 관련된 BMPR2W298X(예를 들면, 893G>A), 주버트 증후군과 관련된 AHI1W725X(예를 들면, 2174G>A) 판코니 빈혈과 관련된 FANCCW506X(예를 들면, 1517G>A), 원발성 가족성 비대형 심근병증과 관련된 MYBPC3W1098X(예를 들면, 3293G>A), X-연관성 중증 복합 면역부전증과 관련된 IL2RGW237X(예를 들면, 710G>A)을 포함하지만, 이들에 한정되지 않는다. 일부 실시형태에 있어서, 질환 또는 상태는 암이다. 일부 실시형태에 있어서, 질환 또는 상태는 단일유전성 질환이다. 일부 실시형태에 있어서, 질환 또는 상태는 다중유전성 질환이다.
일부 실시형태에 있어서, dRNA 또는 dRNA를 인코딩하는 구축물을 생체외에서 개체의 단리된 세포에 도입하는 단계를 포함하는, 개체에서 돌연변이(예를 들면, G>A 돌연변이)를 갖는 타겟 RNA와 관련된 암을 치료하는 방법이 제공되고, 상기 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하도록 ADAR을 리크루팅할 수 있고, 따라서 타겟 RNA에서 돌연변이를 구제(rescue)할 수 있다. 일부 실시형태에 있어서, ADAR은 단리된 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에 있어서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 단리된 세포에 도입하는 단계를 포함한다. 일부 실시형태에 있어서, 타겟 RNA는 TP53W53X(예를 들면, 158G>A)이다. 일부 실시형태에 있어서, dRNA는 SEQ ID NO: 195, 196 또는 197의 핵산 서열을 포함한다.
일부 실시형태에 있어서, 유효량의 dRNA 또는 dRNA를 인코딩하는 구축물을 개체에 투여하는 단계를 포함하는, 개체에서 돌연변이(예를 들면, G>A 돌연변이)를 갖는 타겟 RNA로 암을 치료하거나 예방하는 방법이 제공되고, 상기 dRNA는 질환 또는 상태와 관련된 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하도록 ADAR을 리크루팅할 수 있고, 따라서 타겟 RNA에서 돌연변이를 구제할 수 있다. 일부 실시형태에 있어서, ADAR은 개체의 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에 있어서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 개체에 투여하는 단계를 포함한다. 일부 실시형태에 있어서, 타겟 RNA는 TP53W53X(예를 들면, 158G>A)이다. 일부 실시형태에 있어서, dRNA는 SEQ ID NO: 195, 196 또는 197의 핵산 서열을 포함한다.
일부 실시형태에 있어서, dRNA 또는 dRNA를 인코딩 구축물을 생체외에서 개체의 단리된 세포에 도입하는 단계를 포함하는, 개체에서 돌연변이(예를 들면, G>A 돌연변이)를 갖는 타겟 RNA와 관련된 MPS I(예를 들면, 헐러 증후군 또는 샤이에 증후군)를 치료하는 방법이 제공되고, 상기 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하도록 ADAR을 리크루팅할 수 있고, 따라서 타겟 RNA에서 돌연변이를 구제할 수 있다. 일부 실시형태에 있어서, ADAR은 단리된 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에 있어서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 단리된 세포에 도입하는 단계를 포함한다. 일부 실시형태에 있어서, 타겟 RNA는 IDUAW402X(예를 들면, 엑손 9에서의 TGG>TAG 돌연변이)이다. 일부 실시형태에 있어서, dRNA는 SEQ ID NO: 204 또는 205의 핵산 서열을 포함한다.
일부 실시형태에 있어서, 유효량의 dRNA 또는 dRNA를 인코딩하는 구축물을 개체에 투여하는 단계를 포함하는, 개체에서 돌연변이(예를 들면, G>A 돌연변이)를 갖는 타겟 RNA로 MPS I(예를 들면, 헐러 증후군 또는 샤이에 증후군)를 치료하거나 예방하는 방법이 제공되고, 상기 dRNA는 질환 또는 상태와 관련된 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하도록 ADAR을 리크루팅할 수 있고, 따라서 타겟 RNA에서 돌연변이를 구제할 수 있다. 일부 실시형태에 있어서, ADAR은 개체의 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에 있어서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 개체에 투여하는 단계를 포함한다. 일부 실시형태에 있어서, 타겟 RNA는 IDUAW402X(예를 들면, 엑손 9에서의 TGG>TAG 돌연변이)이다. 일부 실시형태에 있어서, dRNA는 SEQ ID NO: 204 또는 205의 핵산 서열을 포함한다.
일부 실시형태에 있어서, dRNA 또는 dRNA를 인코딩하는 구축물을 생체외에서 개체의 단리된 세포에 도입하는 단계를 포함하는, 개체에서 돌연변이(예를 들면, G>A 돌연변이)를 갖는 타겟 RNA와 관련된 질환 또는 상태 엘러스-단로스 증후군을 치료하는 방법이 제공되고, 상기 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하도록 ADAR을 리크루팅할 수 있고, 따라서 타겟 RNA에서 돌연변이를 구제할 수 있다. 일부 실시형태에 있어서, ADAR은 단리된 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에 있어서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 단리된 세포에 도입하는 단계를 포함한다. 일부 실시형태에 있어서, 타겟 RNA는 COL3A1W1278X(예를 들면, 3833G>A 돌연변이)이다. 일부 실시형태에 있어서, dRNA는 SEQ ID NO: 198의 핵산 서열을 포함한다.
일부 실시형태에 있어서, 유효량의 dRNA 또는 dRNA를 인코딩하는 구축물을 개체에 투여하는 단계를 포함하는, 개체에서 돌연변이(예를 들면, G>A 돌연변이)를 갖는 타겟 RNA로 엘러스-단로스 증후군을 치료하거나 예방하는 방법이 제공되고, 상기 dRNA는 질환 또는 상태와 관련된 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하도록 ADAR을 리크루팅할 수 있고, 따라서 타겟 RNA에서 돌연변이를 구제할 수 있다. 일부 실시형태에 있어서, ADAR은 개체의 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에 있어서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 개체에 투여하는 단계를 포함한다. 일부 실시형태에 있어서, 타겟 RNA는 COL3A1W1278X(예를 들면, 3833G>A 돌연변이)이다. 일부 실시형태에 있어서, dRNA는 SEQ ID NO: 198의 핵산 서열을 포함한다.
일부 실시형태에 있어서, dRNA 또는 dRNA를 인코딩하는 구축물을 생체외에서 개체의 단리된 세포에 도입하는 단계를 포함하는, 개체에서 돌연변이(예를 들면, G>A 돌연변이)를 갖는 타겟 RNA와 관련된 원발성 폐고혈압증을 치료하는 방법이 제공되고, 상기 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하도록 ADAR을 리크루팅할 수 있고, 따라서 타겟 RNA에서 돌연변이를 구제할 수 있다. 일부 실시형태에 있어서, ADAR은 단리된 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에 있어서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 단리된 세포에 도입하는 단계를 포함한다. 일부 실시형태에 있어서, 타겟 RNA는 BMPR2W298X(예를 들면, 893G>A)이다. 일부 실시형태에 있어서, dRNA는 SEQ ID NO: 199의 핵산 서열을 포함한다.
일부 실시형태에 있어서, 유효량의 dRNA 또는 dRNA를 인코딩하는 구축물을 개체에 투여하는 단계를 포함하는, 개체에서 돌연변이(예를 들면, G>A 돌연변이)를 갖는 타겟 RNA로 원발성 폐고혈압증을 치료하거나 예방하는 방법이 제공되고, 상기 dRNA는 질환 또는 상태와 관련된 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하도록 ADAR을 리크루팅할 수 있고, 따라서 타겟 RNA에서 돌연변이를 구제할 수 있다. 일부 실시형태에 있어서, ADAR은 개체의 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에 있어서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 개체에 투여하는 단계를 포함한다. 일부 실시형태에 있어서, 타겟 RNA는 BMPR2W298X(예를 들면, 893G>A)이다. 일부 실시형태에 있어서, dRNA는 SEQ ID NO: 199의 핵산 서열을 포함한다.
일부 실시형태에 있어서, dRNA 또는 dRNA를 인코딩하는 구축물을 생체외에서 개체의 단리된 세포에 도입하는 단계를 포함하는, 개체에서 돌연변이(예를 들면, G>A 돌연변이)를 갖는 타겟 RNA와 관련된 주버트 증후군을 치료하는 방법이 제공되고, 상기 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하도록 ADAR을 리크루팅할 수 있고, 따라서 타겟 RNA에서 돌연변이를 구제할 수 있다. 일부 실시형태에 있어서, ADAR은 단리된 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에 있어서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 단리된 세포에 도입하는 단계를 포함한다. 일부 실시형태에 있어서, 타겟 RNA는 AHI1W725X(예를 들면, 2174G>A)이다. 일부 실시형태에 있어서, dRNA는 SEQ ID NO: 200의 핵산 서열을 포함한다.
일부 실시형태에 있어서, 유효량의 dRNA 또는 dRNA를 인코딩하는 구축물을 개체에 투여하는 단계를 포함하는, 개체에서 돌연변이(예를 들면, G>A 돌연변이)를 갖는 타겟 RNA로 주버트 증후군을 치료하거나 예방하는 방법이 제공되고, 상기 dRNA는 질환 또는 상태와 관련된 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하도록 ADAR을 리크루팅할 수 있고, 따라서 타겟 RNA에서 돌연변이를 구제할 수 있다. 일부 실시형태에 있어서, ADAR은 개체의 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에 있어서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 개체에 투여하는 단계를 포함한다. 일부 실시형태에 있어서, 타겟 RNA는 AHI1W725X(예를 들면, 2174G>A)이다. 일부 실시형태에 있어서, dRNA는 SEQ ID NO: 200의 핵산 서열을 포함한다.
일부 실시형태에 있어서, dRNA 또는 dRNA를 인코딩하는 구축물을 생체외에서 개체의 단리된 세포에 도입하는 단계를 포함하는, 개체에서 돌연변이(예를 들면, G>A 돌연변이)를 갖는 타겟 RNA와 관련된 판코니 빈혈을 치료하는 방법이 제공되고, 상기 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하도록 ADAR을 리크루팅할 수 있고, 따라서 타겟 RNA에서 돌연변이를 구제할 수 있다. 일부 실시형태에 있어서, ADAR은 단리된 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에 있어서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 단리된 세포에 도입하는 단계를 포함한다. 일부 실시형태에 있어서, 타겟 RNA는 FANCCW506X(예를 들면, 1517G>A)이다. 일부 실시형태에 있어서, dRNA는 SEQ ID NO: 201의 핵산 서열을 포함한다.
일부 실시형태에 있어서, 유효량의 dRNA 또는 dRNA를 인코딩하는 구축물을 개체에 투여하는 단계를 포함하는, 개체에서 돌연변이(예를 들면, G>A 돌연변이)를 갖는 타겟 RNA로 판코니 빈혈을 치료하거나 예방하는 방법이 제공되고, 상기 dRNA는 질환 또는 상태와 관련된 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하도록 ADAR을 리크루팅할 수 있고, 따라서 타겟 RNA에서 돌연변이를 구제할 수 있다. 일부 실시형태에 있어서, ADAR은 개체의 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에 있어서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 개체에 투여하는 단계를 포함한다. 일부 실시형태에 있어서, 타겟 RNA는 FANCCW506X(예를 들면, 1517G>A)이다. 일부 실시형태에 있어서, dRNA는 SEQ ID NO: 201의 핵산 서열을 포함한다.
일부 실시형태에 있어서, dRNA 또는 dRNA를 인코딩하는 구축물을 세포외에서 개체의 단리된 세포에 도입하는 단계를 포함하는, 개체에서 돌연변이(예를 들면, G>A 돌연변이)를 갖는 타겟 RNA와 관련된 원발성 가족성 비대형 심근병증을 치료하는 방법이 제공되고, 상기 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하도록 ADAR을 리크루팅할 수 있고, 따라서 타겟 RNA에서 돌연변이를 구제할 수 있다. 일부 실시형태에 있어서, ADAR은 단리된 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에 있어서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 단리된 세포에 도입하는 단계를 포함한다. 일부 실시형태에 있어서, 타겟 RNA는 MYBPC3W1098X(예를 들면, 3293G>A)이다. 일부 실시형태에 있어서, dRNA는 SEQ ID NO: 202의 핵산 서열을 포함한다.
일부 실시형태에 있어서, 유효량의 dRNA 또는 dRNA를 인코딩하는 구축물을 개체에 투여하는 단계를 포함하는, 개체에서 돌연변이(예를 들면, G>A 돌연변이)를 갖는 타겟 RNA로 원발성 가족성 비대형 심근병증을 치료하거나 예방하는 방법이 제공되고, 상기 dRNA는 질환 또는 상태와 관련된 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하도록 ADAR을 리크루팅할 수 있고, 따라서 타겟 RNA에서 돌연변이를 구제할 수 있다. 일부 실시형태에 있어서, ADAR은 개체의 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에 있어서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 개체에 투여하는 단계를 포함한다. 일부 실시형태에 있어서, 타겟 RNA는 MYBPC3W1098X(예를 들면, 3293G>A)이다. 일부 실시형태에 있어서, dRNA는 SEQ ID NO: 202의 핵산 서열을 포함한다.
일부 실시형태에 있어서, dRNA 또는 dRNA를 인코딩하는 구축물을 생체외에서 개체의 단리된 세포에 도입하는 단계를 포함하는, 개체에서 돌연변이(예를 들면, G>A 돌연변이)를 갖는 타겟 RNA와 관련된 X-연관성 중증 복합 면역부전증을 치료하는 방법이 제공되고, 상기 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하도록 ADAR을 리크루팅할 수 있고, 따라서 타겟 RNA에서 돌연변이를 구제할 수 있다. 일부 실시형태에 있어서, ADAR은 단리된 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에 있어서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 단리된 세포에 도입하는 단계를 포함한다. 일부 실시형태에 있어서, 타겟 RNA는 IL2RGW237X(예를 들면, 710G>A)이다. 일부 실시형태에 있어서, dRNA는 SEQ ID NO: 203의 핵산 서열을 포함한다.
일부 실시형태에 있어서, 유효량의 dRNA 또는 dRNA를 인코딩하는 구축물을 개체에 투여하는 단계를 포함하는, 개체에서 돌연변이(예를 들면, G>A 돌연변이)를 갖는 타겟 RNA로 X-연관성 중증 복합 면역부전증을 치료하거나 예방하는 방법이 제공되고, 상기 dRNA는 질환 또는 상태와 관련된 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하도록 ADAR을 리크루팅할 수 있고, 따라서 타겟 RNA에서 돌연변이를 구제할 수 있다. 일부 실시형태에 있어서, ADAR은 개체의 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에 있어서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 개체에 투여하는 단계를 포함한다. 일부 실시형태에 있어서, 타겟 RNA는 IL2RGW237X(예를 들면, 710G>A)이다. 일부 실시형태에 있어서, dRNA는 SEQ ID NO: 203의 핵산 서열을 포함한다.
본원에 사용된 바와 같이, "치료" 또는 "치료하는"은 임상 결과를 포함한 유익하거나 또는 소망하는 결과를 얻기 위한 접근법이다. 본 발명의 목적을 위해, 유익하거나 또는 소망하는 임상 결과는: 질환으로 인한 하나 이상의 증상을 감소, 질환의 정도를 약화, 질환을 안정화(예를 들면, 질환의 예방 또는 악화를 지연), 질환의 확산(예를 들면, 전이)을 예방 또는 지연, 질환의 발생 또는 재발을 예방 또는 지연, 질환의 진행을 지연 또는 늦춤, 질환 상태를 개선, 질환의 차도(부분적이든 전체적이든)를 제공, 질환을 치료하는 데 필요한 하나 이상의 다른 약물의 용량을 감소, 질환의 진행을 지연, 삶의 질을 향상, 및/또는 생존을 연장하는 것 중 하나 이상을 포함하지만, 이들에 한정되지 않는다. 또한, "치료"에 포함되는 것은 질환 또는 상태의 병리학적 결과의 감소이다. 본 발명의 방법은 이러한 치료 측면 중 어느 하나 이상을 고려한다.
용어 "개체", "피험자" 및 "환자"는 인간을 포함한 포유동물을 기재하기 위해 본원에서 상호교환적으로 사용된다. 개체는 인간, 소, 말, 고양이, 개, 설치류 또는 영장류를 포함하지만, 이들에 한정되지 않는다. 일부 실시형태에 있어서, 개체는 인간이다. 일부 실시형태에 있어서, 개체는 약물 내성과 같은 질환 또는 상태를 앓고 있다. 일부 실시형태에 있어서, 개체는 치료가 필요하다.
당업계에서 이해되는 바와 같이, "유효량"은 소망하는 치료 결과(예를 들면, 질환 또는 상태의 하나 이상의 증상의 중증도 또는 지속기간의 단축, 증증도의 안정화, 또는 질환 또는 상태의 하나 이상의 증상의 제거)를 생성하기에 충분한 조성물(예를 들면, dRNA 또는 dRNA를 인코딩하는 구축물)의 양을 지칭한다. 치료 용도의 경우, 유익하거나 또는 소망하는 결과는 예를 들면, 합병증 및 질환의 진전 동안에 나타나는 중간 병리학적 표현형을 포함한, 질환(생화학적, 조직학적 및/또는 행동학적)으로 인한 하나 이상의 증상을 감소, 질환 또는 상태를 앓고 있는 개체의 삶의 질을 향상, 질환을 치료하는 데 필요한 다른 약물의 용량을 감소, 다른 약물의 효과를 증대, 질환의 진행을 지연, 및/또는 환자의 생존을 연장하는 것을 포함한다.
일반적으로, 조성물(예를 들면, dRNA 또는 dRNA를 인코딩하는 구축물)의 투여 용량, 투여 일정 및 투여 경로는 개체의 크기 및 상태에 따라 결정될 수 있고, 표준 약학적 관행에 따라 결정될 수 있다. 예시적인 투여 경로는 정맥내, 동맥내, 복강내, 폐내, 소포내, 근육내, 기관내, 피하, 안구내, 척수강내 또는 경피를 포함한다.
본 출원의 RNA 편집 방법은 동물 세포, 예를 들면 포유동물 세포에서 사용될 수 있을 뿐만 아니라, 식물 또는 균류의 RNA의 변형, 예를 들면 내인적으로 발현된 ADAR을 갖는 식물 또는 균류에도 사용될 수 있다. 본원에 기재된 방법은 개선된 특성을 갖는 유전적으로 조작된 식물 및 균류를 생성하는 데 사용될 수 있다.
조성물, 키트 및 제조 물품
또한, 본원에 기재된 바와 같은 dRNA, 구축물, 라이브러리 또는 편집된 RNA를 갖는 숙주세포 중 어느 하나를 포함하는 조성물(예를 들면, 약학 조성물)이 본원에 제공된다.
일부 실시형태에 있어서, 본원에 기재된 dRNA 또는 dRNA를 인코딩하는 구축물 중 어느 하나, 및 약학적으로 허용가능한 캐리어, 부형제 또는 안정화제(Remington's Pharmaceutical Sciences 16th edition, Osol, A. Ed.(1980))를 포함하는 약학 조성물이 제공된다. 허용가능한 캐리어, 부형제 또는 안정화제는 채용되는 용량 및 농도에서 수용체에게 무독성이고, 포스페이트, 시트레이트 및 다른 유기산과 같은 완충액; 아스코르브산 및 메티오닌을 포함한 항산화제; 방부제(예를 들면, 옥타데실디메틸벤질암모늄 클로라이드; 헥사메토늄 클로라이드; 벤잘코늄 클로라이드, 벤제토늄 클로라이드; 페놀, 부틸 또는 벤질알코올; 메틸 또는 프로필파라벤과 같은 알킬파라벤; 카테콜; 레조르시놀; 시클로헥산올; 3-펜탄올; 및 m-크레졸); 저분자량(약 10개 미만의 잔기) 폴리펩티드; 혈청 알부민, 젤라틴 또는 면역글로불린과 같은 단백질; 올리비닐피롤리돈과 같은 친수성 폴리머; 글리신, 글루타민, 아스파라긴, 히스티딘, 아르기닌 또는 리신과 같은 아미노산; 단당류, 이당류 및 글루코오스, 만노오스 또는 덱스트린을 포함한 다른 탄수화물; EDTA와 같은 킬레이트제; 수크로오스, 만니톨, 트레할로오스 또는 소르비톨과 같은 당; 나트륨과 같은 염 형성 카운터 이온; 금속 복합체(예를 들면, Zn-단백질 복합체); 및/또는 TWEE개의 뉴클레오티드M, PLURONICSTM 또는 폴리에틸렌글리콜(PEG)과 같은 비이온성 계면활성제를 포함한다. 일부 실시형태에 있어서, 동결건조된 제제가 제공된다. 생체내 투여에 사용되는 약학 조성물은 멸균되어야 한다. 이것은 예를 들면, 멸균 여과막을 통한 여과에 의해 쉽게 달성된다.
본원에 기재된 바와 같은 dRNA, 구축물, 조성물, 라이브러리 또는 편집된 숙주 세포 중 어느 하나를 포함하는, 본원에 기재된 RNA 편집 방법 또는 치료 방법 중 어느 하나에 유용한 키트가 더 제공된다.
일부 실시형태에 있어서, dRNA를 포함하는, 숙주 세포에서 타겟 RNA를 편집하기 위한 키트가 제공되고, 상기 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 dRNA는 타겟 RNA에서 A를 탈아미노화하도록 ADAR을 리크루팅할 수 있다. 일부 실시형태에 있어서, 키트는 ADAR 또는 ADAR을 인코딩하는 구축물을 더 포함한다. 일부 실시형태에 있어서, 키트는 ADAR3의 억제제 또는 그것의 구축물을 더 포함한다. 일부 실시형태에 있어서, 키트는 인터페론의 자극제 또는 그것의 구축물을 더 포함한다. 일부 실시형태에 있어서, 키트는 본원에 기재된 RNA 편집 방법 중 어느 하나를 수행하기 위한 설명서를 더 포함한다.
본 출원의 키트는 적절한 패키징에 있다. 적절한 패키징은 바이알, 보틀, 자(jar), 가요성 패키징(예를 들면, 밀봉된 마일라 또는 플라스틱 백) 등을 포함하지만, 이들에 한정되지 않는다. 키트는 형질감염 또는 형질도입 시약, 세포 배양 배지, 완충액 및 해석적 정보와 같은 추가 구성 요소를 선택적으로 제공할 수 있다.
따라서, 본 출원은 또한 제조 물품을 제공한다. 제조 물품은 용기 및 용기 상에 또는 용기와 관련된 라벨 또는 패키지 삽입물을 포함할 수 있다. 적절한 용기는 바이알(예를 들면, 밀봉된 바이알), 보틀, 자, 가요성 패키지 등을 포함한다. 일부 실시형태에 있어서, 용기는 약학 조성물을 보유하고, 멸균 접근 포트(예를 들면, 용기는 정맥주사액 백 또는 피하주사바늘로 뚫을 수 있는 마개를 갖는 바이알일 수 있음)를 가질 수 있다. 약학 조성물을 보유하는 용기는 재구성된 제제의 반복 투여(예를 들면, 2-6회 투여)를 허용하는 멀티유즈 바이알일 수 있다. 패키지 삽입물은 그러한 제품의 사용에 관한 지시, 사용법, 용량, 투여, 금기 및/또는 경고에 대한 정보를 포함하는 치료 제품의 상업적 패키지에 관례적으로 포함된 설명서를 지칭한다. 부가적으로, 제조 물품은 주사용 정균수(BWFI), 포스페이트 완충 식염수, 링거 용액 및 덱스트로오스 용액과 같은 약학적으로 허용가능한 완충액을 포함하는 제 2 용기를 더 포함할 수 있다. 다른 완충액, 희석제, 필터, 바늘 및 시린지를 포함한, 상업적 및 사용자 관점으로부터 소망되는 다른 재료를 더 포함할 수 있다.
키트 또는 제조 물품은 약국, 예를 들면 병원 약국 및 조제 약국에서 보관하고 사용하기에 충분한 양으로 패키징된, 약학 조성물의 다중 단위 용량 및 사용 설명서를 포함할 수 있다.
예시적인 실시형태
본원에 제공된 실시형태 중에는 이하의 것이 있다.
1. 탈아미노효소-리크루팅 RNA(dRNA) 또는 dRNA를 인코딩하는 구축물을 숙주 세포에 도입하는 단계를 포함하는, 숙주 세포에서 타겟 RNA를 편집하는 방법으로서, 상기 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 또한 상기 탈아미노효소-리크루팅 RNA는 타겟 RNA에서 타겟 아데노신을 탈아미노화하도록 RNA 아데노신 탈아미노효소(ADAR)를 리크루팅할 수 있는 방법.
2. 실시형태 1에 있어서, 상기 RNA 서열은 상기 타겟 RNA에서 타겟 아데노신의 정반대쪽에 시티딘, 아데노신 또는 우리딘을 포함하는 방법.
3. 실시형태 2에 있어서, 상기 RNA 서열은 상기 타겟 RNA에서 타겟 아데노신의 정반대쪽에 시티딘 미스매치를 포함하는 방법.
4. 실시형태 3에 있어서, 상기 시티딘 미스매치는 상기 dRNA에서 상보적 서열의 3' 말단으로부터 적어도 20개의 뉴클레오티드와 떨어져 위치되고, 또한 상보적 서열의 5' 말단으로부터 적어도 5개의 뉴클레오티드와 떨어져 위치되는 방법.
5. 실시형태 4에 있어서, 상기 시티딘 미스매치는 상기 dRNA에서 상보적 서열의 중심으로부터 10개의 뉴클레오티드 이내에(예를 들면, 중심에) 위치되는 방법.
6. 실시형태 1-5 중 어느 하나에 있어서, 상기 RNA 서열은 타겟 RNA에서 비타겟 아데노신의 각각 반대쪽에 하나 이상의 구아노신을 더 포함하는 방법.
7. 실시형태 1-6 중 어느 하나에 있어서, 상기 상보적 서열은 타겟 RNA에서 비타겟 아데노신의 반대쪽에 2개 이상의 연속한 미스매치 뉴클레오티드를 포함하는 방법.
8. 실시형태 1-7 중 어느 하나에 있어서, 상기 타겟 RNA에서 타겟 아데노신의 5' 최근접 이웃은 U, C, A 및 G로부터 선택된 뉴클레오티드이고 선호도는 U>C≒A>G이고, 상기 타겟 RNA에서 타겟 아데노신의 3' 최근접 이웃은 G, C, A 및 U로부터 선택된 뉴클레오티드이고 선호도는 G>C>A≒U인 방법.
9. 실시형태 1-8 중 어느 하나에 있어서, 상기 타겟 아데노신은 타겟 RNA에서 UAG, UAC, UAA, UAU, CAG, CAC, CAA, CAU, AAG, AAC, AAA, AAU, GAG, GAC, GAA 및 GAU로 이루어지는 군으로부터 선택되는 3-염기 모티프로 있는 방법.
10. 실시형태 9에 있어서, 상기 3-염기 모티프는 UAG이고, 상기 탈아미노효소-리크루팅 RNA는 3-염기 모티프에서 우리딘의 정반대쪽에 A, 타겟 아데노신의 정반대쪽에 시티딘, 및 3-염기 모티프에서 구아노신의 정반대쪽에 시티딘, 구아노신 또는 우리딘을 포함하는 방법.
11. 실시형태 1-10 중 어느 하나에 있어서, 상기 탈아미노효소-리크루팅 RNA는 약 40-260개의 뉴클레오티드 길이인 방법.
12. 실시형태 11에 있어서, 상기 탈아미노효소-리크루팅 RNA는 약 60-230개의 뉴클레오티드 길이인 방법.
13. 실시형태 11 또는 12에 있어서, 상기 dRNA는 약 60개 초과의 뉴클레오티드 길이인 방법.
14. 실시형태 11-13 중 어느 하나에 있어서, 상기 dRNA는 약 100개 내지 약 150개(예를 들면, 약 110-150개)의 뉴클레오티드 길이인 방법.
15. 실시형태 1-14 중 어느 하나에 있어서, 상기 타겟 RNA는 프리메신저 RNA, 메신저 RNA, 리보솜 RNA, 트랜스퍼 RNA, 긴 논-코딩 RNA 및 작은 RNA로 이루어지는 군으로부터 선택되는 RNA인 방법.
16. 실시형태 15에 있어서, 상기 타겟 RNA는 프리메신저 RNA인 방법.
17. 실시형태 1-16 중 어느 하나에 있어서, 상기 ADAR은 숙주 세포에 의해 내인적으로 발현되는 방법.
18. 실시형태 1-16 중 어느 하나에 있어서, 상기 ADAR은 숙주 세포에 대해 외인성인 방법.
19. 실시형태 18에 있어서, 상기 ADAR을 상기 숙주 세포에 도입하는 단계를 더 포함하는 방법.
20. 실시형태 18 또는 19에 있어서, 상기 ADAR은 E1008 돌연변이를 포함하는 방법.
21. 실시형태 1-20 중 어느 하나에 있어서, 상기 탈아미노효소-리크루팅 RNA는 단일 가닥 RNA인 방법.
22. 실시형태 1-20 중 어느 하나에 있어서, 상기 상보적 RNA 서열은 단일 가닥이고, 상기 탈아미노효소-리크루팅 RNA는 하나 이상의 이중 가닥 영역을 더 포함하는 방법.
23. 실시형태 1-22 중 어느 하나에 있어서, 상기 dRNA는 ADAR-리크루팅 도메인(예를 들면, DSB-결합 도메인, GluR2 도메인, 또는 MS2 도메인)을 포함하지 않는 방법.
24. 실시형태 1-23 중 어느 하나에 있어서, 상기 dRNA는 화학적으로 변형된 뉴클레오티드(예를 들면, 2'-O-메틸화 또는 포스포로티오화)를 포함하지 않는 방법.
25. 실시형태 26에 있어서, 상기 타겟 RNA에서의 타겟 아데노신의 탈아미노화는 타겟 RNA에 의해 인코딩된 단백질의 점 돌연변이, 절단, 연장 및/또는 잘못 접힘을 초래하거나, 또는 상기 타겟 RNA에서 미스센스 돌연변이, 조기 정지 코돈, 비정상적 스플라이싱 또는 선택적 스플라이싱의 역전에 의해 기능적, 전장, 제대로 접힌 및/또는 야생형 단백질을 초래하는 방법.
26. 실시형태 1-27 중 어느 하나에 있어서, 상기 숙주 세포는 진핵 세포인 방법.
27. 실시형태 28에 있어서, 상기 숙주 세포는 포유동물 세포인 방법.
28. 실시형태 29에 있어서, 상기 숙주 세포는 인간 또는 마우스 세포인 방법.
29. 실시형태 29 또는 30에 있어서, 상기 ADAR은 ADAR1 및/또는 ADAR2인 방법.
30. 실시형태 1-31 중 어느 하나에 있어서, 상기 숙주 세포는 1차 세포인 방법.
31. 실시형태 32에 있어서, 상기 숙주 세포는 T 세포인 방법.
32. 실시형태 32에 있어서, 상기 숙주 세포는 유사분열후 세포인 방법.
33. 실시형태 1-34 중 어느 하나에 있어서, ADAR3의 억제제를 상기 숙주 세포에 도입하는 단계를 더 포함하는 방법.
34. 실시형태 1-35 중 어느 하나에 있어서, 인터페론의 자극제를 상기 숙주 세포에 도입하는 단계를 더 포함하는 방법.
35. 실시형태 1-36 중 어느 하나에 있어서, 상이한 타겟 RNA를 각각 타겟팅하는 복수의 dRNA를 도입하는 단계를 포함하는 방법.
36. 실시형태 1-37 중 어느 하나에 있어서, 상기 타겟 RNA의 편집 효율은 적어도 약 30%(예를 들면, 적어도 약 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 그 이상)인 방법.
37. 실시형태 1-38 중 어느 하나에 있어서, 상기 dRNA는 면역 반응을 유도하지 않는 방법.
38. 실시형태 1-39 중 어느 하나의 방법에 의해 생성되는 편집된 RNA 또는 편집된 RNA를 갖는 숙주 세포.
39. 실시형태 1-39 중 어느 하나에 기재된 개체의 세포에서 질환 또는 상태와 관련된 타겟 RNA를 편집하는 단계를 포함하는, 개체에서의 질환 또는 상태를 치료하거나 예방하는 방법.
40. 실시형태 41에 있어서, 상기 질환 또는 상태는 유전적인 유전 질환이거나 또는 하나 이상의 후천적인 유전적 돌연변이와 관련된 질환 또는 상태인 방법.
41. 실시형태 41 또는 42에 있어서, 상기 타겟 RNA는 G에서 A로의 돌연변이를 갖는 방법.
42. 실시형태 41-43 중 어느 하나에 있어서, 상기 질환 또는 상태는 단일유전성 질환 또는 상태인 방법.
43. 실시형태 41-44 중 어느 하나에 있어서, 상기 질환 또는 상태는 다중유전성 질환 또는 상태인 방법.
44. 실시형태 41-45 중 어느 하나에 있어서,
(i) 상기 타겟 RNA는 TP53이고, 상기 질환 또는 상태는 암이고;
(ii) 상기 타겟 RNA는 IDUA이고, 상기 질환 또는 상태는 I형 점액다당류증(MPS I)이고;
(iii) 상기 타겟 RNA는 COL3A1이고, 상기 질환 또는 상태는 엘러스-단로스 증후군이고;
(iv) 상기 타겟 RNA는 BMPR2이고, 상기 질환 또는 상태는 주버트 증후군이고;
(v) 상기 타겟 RNA는 FANCC이고, 상기 질환 또는 상태는 판코니 빈혈이고;
(vi) 상기 타겟 RNA는 MYBPC3이고, 상기 질환 또는 상태는 원발성 가족성 비대형 심근병증이고; 또는
(vii) 상기 타겟 RNA는 IL2RG이고, 상기 질환 또는 상태는 X-연관성 중증 복합 면역부전증인 방법.
45. RNA 아데노신 탈아미노효소(ADAR)를 리크루팅함으로써 타겟 RNA에서 타겟 아데노신을 탈아미노화하기 위한 탈아미노효소-리크루팅 RNA(dRNA)로서, 상기 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하는 탈아미노효소-리크루팅 RNA(dRNA).
46. 실시형태 47에 있어서, 상기 RNA 서열은 상기 타겟 RNA에서의 상기 타겟 아데노신의 정반대쪽에 시토신, 아데노신 또는 U를 포함하는 탈아미노효소-리크루팅 RNA.
47. 실시형태 48에 있어서, 상기 RNA 서열은 상기 타겟 RNA에서의 타겟 아데노신의 정반대쪽에 시티딘 미스매치를 포함하는 dRNA.
48. 실시형태 49에 있어서, 상기 시티딘 미스매치는 상기 dRNA에서 상보적 서열의 3' 말단으로부터 적어도 20개의 뉴클레오티드와 떨어져 위치되고, 또한 상보적 서열의 5' 말단으로부터 적어도 5개의 뉴클레오티드와 떨어져 위치되는 dRNA.
49. 실시형태 50에 있어서, 상기 시티딘 미스매치는 상기 dRNA에서 상보적 서열의 중심으로부터 10개의 뉴클레오티드 이내에(예를 들면, 중심에) 위치되는 dRNA.
50. 실시형태 47-51 중 어느 하나에 있어서, 상기 RNA 서열은 상기 타겟 RNA에서 비타겟 아데노신의 각각 정반대쪽에 하나 이상의 구아노신을 더 포함하는 탈아미노효소-리크루팅 RNA.
51. 실시형태 47-51 중 어느 하나에 있어서, 상기 상보적 서열은 상기 타겟 RNA에서의 비타겟 아데노신의 반대쪽에 2개 이상의 연속한 미스매치 뉴클레오티드를 포함하는 dRNA.
52. 실시형태 47-53 중 어느 하나에 있어서, 상기 타겟 아데노신은 상기 타겟 RNA에서 UAG, UAC, UAA, UAU, CAG, CAC, CAA, CAU, AAG, AAC, AAA, AAU, GAG, GAC, GAA 및 GAU로 이루어지는 군으로부터 선택되는 3-염기 모티프로 있는 탈아미노효소-리크루팅 RNA.
53. 실시형태 54에 있어서, 상기 3-염기 모티프는 UAG이고, 상기 dRNA는 3-염기 모티프에서 우리딘의 정반대쪽에 아데노신, 타겟 아데노신의 정반대쪽에 시토신, 및 3-염기 모티프에서 구아노신의 정반대쪽에 시티딘, 구아노신 또는 우리딘을 포함하는 탈아미노효소-리크루팅 RNA.
54. 실시형태 55에 있어서, 상기 3-염기 모티프는 상기 타겟 RNA에서 UAG이고, 상기 탈아미노효소-리크루팅 RNA는 상기 타겟 RNA의 UAG의 반대쪽에 ACC, ACG 또는 ACU를 포함하는 탈아미노효소-리크루팅 RNA.
55. 실시형태 47-56 중 어느 하나에 있어서, 상기 탈아미노효소-리크루팅 RNA는 약 40-260개의 뉴클레오티드 길이인 탈아미노효소-리크루팅 RNA.
56. 실시형태 57에 있어서, 상기 dRNA는 약 70개 초과의 뉴클레오티드 길이인 dRNA.
57. 실시형태 57 또는 58에 있어서, 상기 dRNA는 약 100개 내지 약 150개의 뉴클레오티드(예를 들면, 약 110-150개) 길이인 dRNA.
58. 실시형태 47-59 중 어느 하나에 있어서, 상기 dRNA는 ADAR-리크루팅 도메인(예를 들면, DSB-결합 도메인, GluR2 도메인 또는 MS2 도메인)을 포함하지 않는 dRNA.
59. 실시형태 47-60 중 어느 하나에 있어서, 상기 dRNA는 화학적으로 변형된 뉴클레오티드(예를 들면, 2'-O-메틸화 또는 포스포로티오화)를 포함하지 않는 dRNA.
60. 실시형태 47-61 중 어느 하나에 기재된 탈아미노효소-리크루팅 RNA를 인코딩하는 구축물.
61. 실시형태 62에 있어서, 상기 구축물은 바이러스 벡터(예를 들면, 렌티바이러스 벡터) 또는 플라스미드인 구축물.
62. 실시형태 47-61 중 어느 하나에 기재된 복수의 탈아미노효소-리크루팅 RNA, 또는 실시형태 62 또는 63에 기재된 구축물을 포함하는 라이브러리.
63. 실시형태 47-61 중 어느 하나에 기재된 탈아미노효소-리크루팅 RNA, 실시형태 62 또는 63에 기재된 구축물, 또는 실시형태 64에 기재된 라이브러리를 포함하는 조성물.
64. 실시형태 47-61 중 어느 하나에 기재된 탈아미노효소-리크루팅 RNA 또는 실시형태 62 또는 63에 기재된 구축물을 포함하는 숙주 세포.
65. 실시형태 66에 있어서, 상기 숙주 세포는 진핵 세포인 숙주 세포.
66. 실시형태 66 또는 67에 있어서, 상기 숙주 세포는 1차 세포인 숙주 세포.
67. 탈아미노효소-리크루팅 RNA를 포함하는, 숙주 세포에서 타겟 RNA를 편집하기 위한 키트로서, 상기 탈아미노효소-리크루팅 RNA는 상기 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 탈아미노효소-리크루팅 RNA는 상기 타겟 RNA에서 타겟 아데노신을 탈아미노화하도록 ADAR을 리크루팅할 수 있는 키트.
68. 60-200개의 뉴클레오티드의 탈아미노효소-리크루팅 RNA(dRNA)로서,
1) 상기 dRNA는 타겟 RNA에 혼성화할 수 있는 상보적 RNA 서열을 포함하고;
2) 상기 dRNA는 탈아미노효소 또는 탈아미노효소를 포함하는 구축물 또는 탈아미노효소의 촉매 도메인을 포함하는 구축물을 리크루팅하여 상기 타겟 RNA에서 타겟 아데노신을 탈아미노화할 수 있고; 또한
3) 상기 dRNA는 하나 이상의 화학적 변형을 포함하는 탈아미노효소-리크루팅 RNA(dRNA).
69. 실시형태 68에 있어서, 상기 dRNA는 약 60개의 뉴클레오티드, 65개의 뉴클레오티드, 70개의 뉴클레오티드, 80개의 뉴클레오티드, 90개의 뉴클레오티드, 100개의 뉴클레오티드, 또는 110개의 뉴클레오티드 중 어느 것보다 긴 dRNA.
70. 실시형태 1 또는 실시형태 69에 있어서, 상보적 타겟 RNA 영역과의 하나 이상의 미스매치, 워블 및/또는 벌지를 포함하는 dRNA.
71. 실시형태 68-70 중 어느 하나에 있어서, 상보적 RNA 서열은 상기 타겟 RNA에서의 타겟 아데노신의 정반대쪽에 시티딘, 아데노신 또는 우리딘을 포함하는 dRNA.
72. 실시형태 71에 있어서, 상기 타겟 아데노신의 정반대쪽의 시티딘, 아데노신 또는 우리딘은 3' 말단으로부터 적어도 약 7개의 뉴클레오티드, 예를 들면 3' 말단으로부터 적어도 약 8, 9, 10개 또는 그 이상의 뉴클레오티드, 또는 3' 말단으로부터 약 7-25개의 뉴클레오티드와 떨어져 위치되는 dRNA.
73. 실시형태 71-72 중 어느 하나에 있어서, 상기 타겟 아데노신의 정반대쪽의 시티딘, 아데노신 또는 우리딘은 5' 말단으로부터 적어도 약 25개의 뉴클레오티드, 예를 들면 5' 말단으로부터 적어도 약 30, 35, 40, 45, 50 또는 55개의 뉴클레오티드, 또는 5' 말단으로부터 약 45-55개의 뉴클레오티드와 떨어져 위치되는 dRNA.
74. 실시형태 71-73 중 어느 하나에 있어서, 상기 타겟 아데노신의 정반대쪽의 시티딘, 아데노신 또는 우리딘의 측면에 있는 5' 및 3' 서열의 길이가 동일하지 않은 dRNA.
75. 실시형태 71-74 중 어느 하나에 있어서, 상기 타겟 아데노신의 정반대쪽의 시티딘, 아데노신 또는 우리딘의 측면에 있는 5' 서열의 길이는 3' 서열보다 긴 dRNA.
76. 실시형태 68-75 중 어느 하나에 있어서, 상기 타겟 RNA에서 상기 타겟 아데노신의 정반대쪽에 시티딘을 포함하는 dRNA.
77. 실시형태 68-76 중 어느 하나에 있어서, 상기 상보적 RNA 서열은 상기 타겟 RNA에서 비타겟 아데노신의 각각 반대쪽에 하나 이상의 구아노신을 포함하는 dRNA.
78. 실시형태 68-77 중 어느 하나에 있어서, 상기 상보적 서열은 상기 타겟 RNA에서 비타겟 아데노신의 반대쪽에 2개 이상의 연속한 미스매치 뉴클레오티드를 포함하는 dRNA.
79. 실시형태 68-78 중 어느 하나에 있어서, 상기 타겟 RNA에서의 타겟 아데노신의 5' 최근접 이웃은 U, C, A 및 G로부터 선택된 뉴클레오티드이고 선호도는 U>C≒A>G이고, 상기 타겟 RNA에서 타겟 아데노신의 3' 최근접 이웃은 G, C, A 및 U로부터 선택된 뉴클레오티드이고 선호도는 G>C>A≒U인 dRNA.
80. 실시형태 68-79 중 어느 하나에 있어서, 상기 타겟 아데노신은 상기 타겟 RNA에서 UAG, UAC, UAA, UAU, CAG, CAC, CAA, CAU, AAG, AAC, AAA, AAU, GAG, GAC, GAA 및 GAU로 이루어지는 군으로부터 선택되는 3-염기 모티프로 있는 dRNA.
81. 실시형태 80에 있어서, 상기 3-염기 모티프는 UAG이고, 상기 dRNA는 상기 3-염기 모티프에서 우리딘의 정반대쪽에 A, 상기 타겟 아데노신의 정반대쪽에 시티딘, 및 상기 3-염기 모티프에서 구아노신의 정반대쪽에 시티딘, 구아노신 또는 우리딘을 포함하는 dRNA.
82. 실시형태 81에 있어서, UAG의 3-염기 모티프의 정반대쪽에 5'-CCA-3'을 포함하는 dRNA.
83. 실시형태 68-82 중 어느 하나에 있어서, 상기 화학적 변형은 메틸화 및/또는 포스포로티오화, 예를 들면 2'-O-메틸화 및/또는 뉴클레오티드간 포스포로티오에이트 연결인 dRNA.
84. 실시형태 83에 있어서, 상기 화학적 변형은 첫번째 및 마지막 1-5, 2-5, 3-5, 4-5개의 뉴클레오티드에서의 2'-O-메틸화 및/또는 첫번째 및 마지막 1-5, 2-5, 3-5, 4-5개의 뉴클레오티드간 연결에서의 포스포로티오화를 포함하는 dRNA.
85. 실시형태 83 또는 실시형태 84에 있어서, 상기 화학적 변형은 상기 타겟 아데노신의 반대쪽의 뉴클레오티드 및/또는 그것의 5' 및/또는 3' 최근접 뉴클레오티드에서의 2'-O-메틸화 및/또는 3'-포스포로티오화를 포함하는 dRNA.
86. 실시형태 1-85 중 어느 하나에 있어서, 상기 화학적 변형은 이하로 이루어진 군으로부터 선택되는 dRNA.
1) 첫번째 및 마지막 3개의 뉴클레오티드에서의 2'-O-메틸화 및/또는 첫번째 및 마지막 3개의 뉴클레오티드간 연결에서의 포스포로티오화;
2) 첫번째 및 마지막 3개의 뉴클레오티드에서의 2'-O-메틸화, 첫번째 및 마지막 3개의 뉴클레오티드간 연결에서의 포스포로티오화, 및 하나 이상의 우리딘, 예를 들면 모든 우리딘에서의 2'-O-메틸화;
3) 첫번째 및 마지막 3개의 뉴클레오티드에서의 2'-O-메틸화, 첫번째 및 마지막 3개의 뉴클레오티드간 연결에서의 포스포로티오화, 단일 또는 다수 또는 모든 우리딘에서의 2'-O-메틸화, 및 상기 타겟 아데노신의 반대쪽의 뉴클레오티드, 및/또는 그것의 5' 및/또는 3' 최근접 뉴클레오티드에서의 변형;
4) 첫번째 및 마지막 3개의 뉴클레오티드에서의 2'-O-메틸화, 첫번째 및 마지막 3개의 뉴클레오티드간 연결에서의 포스포로티오화, 모든 우리딘에서의 2'-O-메틸화, 및 상기 타겟 아데노신의 반대쪽의 뉴클레오티드의 3' 말단 및/또는 5' 말단 최근접 뉴클레오티드에서의 2'-O-메틸화;
5) 첫번째 및 마지막 3개의 뉴클레오티드에서의 2'-O-메틸화, 첫번째 및 마지막 3개의 뉴클레오티드간 연결에서의 포스포로티오화, 모든 우리딘에서의 2'-O-메틸화, 및 상기 타겟 아데노신의 반대쪽의 뉴클레오티드 및/또는 그것의 5' 및/또는 3' 최근접 뉴클레오티드에서의 3'-포스포로티오화; 및
6) 첫번째 및 마지막 5개의 뉴클레오티드에서의 2'-O-메틸화 및 첫번째 및 마지막 5개의 뉴클레오티드간 연결에서의 포스포로티오화
87. 실시형태 86에 있어서, 상기 타겟 아데노신의 반대쪽의 뉴클레오티드, 및/또는 상기 타겟 아데노신의 반대쪽의 뉴클레오티드 최근접 1개 또는 2개의 뉴클레오티드에서의 변형은 2'-O-메틸화 또는 3'-포스포로티오화 연결과 같은 포스포로티오화 연결인 dRNA.
88. 실시형태 68-87 중 어느 하나에 있어서, ADAR 효소를 결합시키기 위한 분자내 스템 루프 구조를 형성할 수 있는 ADAR-리크루팅 도메인을 포함하지 않는 dRNA.
89. 실시형태 68-88 중 어느 하나에 기재된 dRNA를 포함하거나 인코딩하는 구축물.
90. 실시형태 68-89 중 어느 하나에 기재된 dRNA를, 진핵 세포, 1차 세포, T 세포, 포유동물 세포, 인간 세포, 뮤린 세포 등을 포함하지만 이들에 한정되지 않는 숙주 세포에 감염, 전기 형질감염, 리포펙션, 엔도시토시스, 리포솜 또는 지질 나노입자 전달 등에 의해 도입하는 단계를 포함하는, 숙주 세포에서 타겟 RNA를 편집하는 방법.
91. 실시형태 90에 있어서, ADAR3의 억제제를 상기 숙주 세포에 도입하는 단계를 더 포함하는 방법.
92. 실시형태 90 또는 실시형태 91에 있어서, 인터페론의 자극제를 상기 숙주 세포에 도입하는 단계를 더 포함하는 방법.
93. 실시형태 90-92 중 어느 하나에 있어서. 상이한 타겟 RNA를 rkrrkr 타겟팅하는 복수의 dRNA를 도입하는 단계를 포함하는 방법.
94. 실시형태 90-93 중 어느 하나에 있어서, 상기 dRNA는 면역 반응을 유도하지 않는 방법.
95. 실시형태 90-94 중 어느 하나에 있어서, 외인성의 ADAR을 상기 숙주 세포에 도입하는 단계를 더 포함하는 방법.
96. 실시형태 95에 있어서, 상기 ADAR은 E1008 돌연변이를 포함하는 ADAR1인 방법.
97. 실시형태 68-89 중 어느 하나에 기재된 dRNA를 포함하는 조성물, 세포, 라이브러리 또는 키트.
실시예
하기 실시예는 본 출원을 순수하게 예시하는 것으로 의도되며, 따라서 본 발명을 한정하는 것으로 하등 간주되어서는 안된다. 이하 실시예 및 상세한 설명은 설명을 위해 제공되는 것이고 한정하고자 하는 것은 아니다.
재료 및 방법
플라스미드 구성
이중 형광 리포터는 mCherry 및 EGFP(EGFP 제 1 코돈 ATG가 삭제됨) 코딩 DNA를 증폭하는 PCR에 의해 콜로닝되었고, PCR 동안에 3×GS 링커 및 타겟팅 DNA 서열이 프라이머를 통해 추가되었다. 이어서, PCR 생성물은 타입 IIs 제한 효소 BsmB1(Thermo) 및 T4 DNA 리가제(NEB)에 의해 절단 및 링크된 후, pLenti 백본(pLenti-CMV-MCS-SV-Bsd, Stanley Cohen Lab, Stanford University)에 삽입되었다.
dLbuCas13 DNA는 Lbu 플라스미드(Addgene #83485)로부터 PCR 증폭되었다. ADAR1DD 및 ADAR2DD는 ADAR1(p150) cDNA와 ADAR2 cDNA에서 증폭되었고, 모두 Xiamen University의 Han의 실험실에서 제공한 것이다. ADAR1DD 또는 ADAR2DD를 dLbuCas13 DNA에 중복 PCR을 통해 융합하고, 융합된 PCR 생성물은 pLenti 백본에 삽입되었다.
포유류 세포에서의 dRNA의 발현을 위해, dRNA 서열을 직접 합성하고(짧은 dRNA의 경우) 오버랩핑 ssDNA를 합성함으로써 어닐링 또는 PCR 증폭하고, 생성물을 골든 게이트 클로닝에 의해 U6 발현 하에 대응하는 벡터에 클로닝하였다.
전장 ADAR1(p110) 및 ADAR1(p150)은 ADAR1(p150) cDNA으로부터 PCR 증폭되었고, 전장 ADAR2는 ADAR2 cDNA에서 PCR 증폭된 후, 이어서 pLenti 백본에 각각 클로닝되었다.
이중 형광 리포터(리포터-1, -2 및 -3)의 3개 버전의 경우, mCherry 및 EGFP(EGFP의 개시 코돈 ATG가 삭제됨) 코딩 서열을 PCR 증폭하고, BsmBI(Thermo Fisher Scientific, ER0452)를 사용하여 분해한 후, 이어서, GGGGS 링커로 T4 DNA 리가아제(NEB, M0202L) 매개 결찰되었다. 이어서, 결찰 생성물은 pLenti-CMV-MCS-PURO 백본에 삽입되었다.
dLbuCas13-ADARDD(E1008Q) 발현 구축물의 경우, ADAR1DD 유전자는 ADAR1p150 구축물(Jiahuai Han's lab, Xiamen University에서 제공)로부터 증폭되었다. dLbuCas13 유전자는 Lbu_C2c2_R472A_H477A_R1048A_H1053A 플라스미드(Addgene #83485)로부터 PCR에 의해 증폭되었다. ADAR1DD(고활성 E1008Q 변이체)는 오버랩 PCR에 의해 생성된 후 dLbuCas13에 융합되었다. 결찰 생성물은 pLenti-CMV-MCS-BSD 백본에 삽입되었다.
arRNA-발현 구축물의 경우, arRNA의 서열을 합성하고 pLenti-sgRNA-lib 2.0(Addgene #89638) 백본에 골든 게이트 클로닝하고, arRNA의 전사는 hU6 프로모터에 의해 구동되었다. ADAR 발현 구축물의 경우, 전장 ADAR1p110 및 ADAR1p150은 ADAR1p150 구축물로부터 PCR 증폭되었고, 전장 ADAR2는 ADAR2 구축물((Jiahuai Han's lab, Xiamen University 제공)로부터 PCR 증폭되었다. 이어서, 증폭된 생성물은 pLenti-CMV-MCS-BSD 백본에 클로닝되었다.
병원성 돌연변이가 있는 유전자를 발현하는 구축물의 경우, TP53(Vigenebio에서 주문) 및 다른 6개 질병 관련 유전자(COL3A1, BMPR2, AHI1, FANCC, MYBPC3 및 IL2RG, JJianwei Wang’s lab, Institute of pathogen biology, Chinese Academy of Medical Sciences에서 제공)가 돌연변이 유발 PCR을 통해 G>A 돌연변이가 도입된 대응하는 유전자를 인코딩하는 구축물로부터 증폭되었다. 증폭된 생성물은 Gibson 클로닝 방법59을 통해 pLenti-CMV-MCS-mCherry 백본에 클로닝되었다.
포유류 세포주 및 세포 배양
포유류 세포주는, 37℃, 5% CO2 하에서 1% 페니실린-스트렙토마이신이 보충된 10% 소태아 혈청(Lanzhou Bailing Biotechnology Co., Ltd., Lanzhou, China)이 첨가된 둘베코 변형 이글 배지(10-013-CV, Corning, Tewksbury, MA, USA)에서 배양되었다. ADAR1-KO 세포주는 EdiGene China로부터 구입했으며 유전자형 분석 결과도 EdiGene China에서 제공하였다.
HeLa 및 B16 세포주는 Z. Jiang의 실험실(Peking University)로부터 제공되었다. 그리고 HEK293T 세포주는 C. Zhang의 실험실(Peking University)로부터 제공되었다. RD 세포주는 J Wang의 실험실(Institute of Pathogen Biology, Peking Union Medical College & Chinese Academy of Medical Sciences))로부터 제공되었다. SF268 세포주는 Cell Center, Institute of Basic Medical Sciences, Chinese Academy of Medical Sciences로부터 제공되었다. A549 및 SW13 세포주는 EdiGene Inc.로부터 제공되었다. HepG2, HT29, NIH3T3 및 MEF 세포주는 Peking University의 본 출원인의 실험실에서 유지 관리되었다. 이러한 포유류 세포주는 37℃, 5% CO2 하에서 1% 페니실린-스트렙토마이신이 더 보충된 10% 소태아 혈청(Lanzhou Bailing Biotechnology Co., Ltd., Lanzhou, China)을 지닌 둘베코 변형 이글 배지(Corning, 10-013-CV)에서 배양되었다. 달리 언급되지 않는 한, 제조사의 지시에 따라 X-tremeGENE HP DNA 형질감염 시약(Roche, 06366546001)으로 세포를 형질감염시켰다.
인간 1차 폐 섬유아세포(#3300) 및 인간 1차 기관지 상피 세포(#3210)는 ScienCell Research Laboratories, Inc.에서 구입하여 섬유아세포 배지(ScienCell, #2301) 및 기관지 상피 세포 배지(ScienCell, #3211)에서 각각 배양하였다. 두 배지 모두 15% 소태아혈청(BI)과 1% 페니실린-스트렙토마이신으로 보충되었다. 1차 GM06214(Hurler 증후군 환자 유래 섬유아세포; IDUA 유전자의 엑손 9에서의 뉴클레오티드 1293[Trp402Ter(W402X)]에서 TGG>TAG 돌연변이의 동형접합성) 및 GM01323(WT 세포에 비하여 0.3% IDUA 활성을 갖는 Scheie 증후군 환자 유래 섬유아세포). Hurler 증후군보다 훨씬 가벼운 증상. 복합 이형 접합체: IDUA 유전자의 엑손 9에서의 뉴클레오티드 1293[Trp402Ter(W402X)]에서 엑손 6(IVS5AS-7G>A) 및 TGG>TAG로부터 위치 7에서, 인트론 5의 G>A 전이. 본 발명의 실시예에서 양성 대조군으로 제공되는 경우, 세포는 Coriell Institute for Medical Research에서 주문하고 15% 소태아혈청(BI) 및 1% 페니실린-스트렙토마이신을 지닌 둘베코 변형 이글 배지(Corning, 10-013-CV)에서 배양하였다. 모든 세포는 37℃, 5% CO2 하에서 배양되었다.
리포터 시스템 형질감염, FACS 분석 및 생어 시퀀싱
이중 형광 리포터 편집 실험의 경우, 293T-WT 세포 또는 293T-ADAR1-KO 세포를 6개의 웰 플레이트(6×105세포/웰)에 시딩하였고, 24시간 후, 공급자의 프로토콜에 따라 X-tremeGENE HP DNA 형질감염 시약(06366546001; Roche, Mannheim, German)을 사용하여 1.5㎍ 리포터 플라스미드 및 1.5㎍ dRNA 플라스미드를 공-형질감염시켰다. 48-72시간 후, 세포를 수집하고 FACS 분석을 수행하였다. 리포터 mRNA 편집을 더 확인하기 위해, 우리는 FACS Aria 유세포 분석기(BD Biosciences)를 사용하여 리포터 및 dRNA 플라스미드로 형질감염된 293T-WT 세포에서 EGFP 양성 세포를 분류한 후 전체 RNA 단리(TIANGEN, DP430)를 수행하였다. 이어서, RNA를 RT-PCR(TIANGEN, KR103-04)을 통해 cDNA로 역전사하고 타겟팅된 유전자좌를 해당 프라이머 쌍(23 PCR 주기)으로 PCR 증폭하고 PCR 생성물을 생어 시퀀싱을 위해 정제하였다.
ADAR1(p110), ADAR1(p150) 또는 ADAR2 구제 및 과발현 실험을 위해, 293T-WT 세포 또는 293T-ADAR1-KO 세포를 12웰 플레이트(2.5×105세포/웰)에 시딩하고, 24시간 후, 0.5㎍ 리포터 플라스미드, 0.5㎍ dRNA 플라스미드 및 0.5㎍ ADAR1/2 플라스미드(대조군으로서 pLenti 백본)를 X-tremeGENE HP DNA 형질감염 시약(06366546001, Roche, Mannheim, German)을 사용하여 공-형질감염시켰다. 48~72시간 후, 세포를 수집하고 FACS 분석을 수행하였다.
내인성 mRNA 실험을 위해, 293T-WT 세포를 6개의 웰 플레이트(6×105 세포/웰)에 시딩하였다. 대략 70%가 융합하면, 3㎍ dRNA 플라스미드를 X-tremeGENE HP DNA 형질감염 시약(06366546001, Roche, Mannheim, German)을 사용하여 형질감염시켰다. 72시간 후, 세포를 수집하였고, 다음 RNA 분리를 위해 FACS를 통하여 GFP-양성 또는 BFP-양성 세포를 분류(대응하는 형광 마커에 따라)하였다.
인간 1차 T 세포의 단리 및 배양
원발성 인간 T 세포는 건강한 인간 기증자의 루카페레시스 생성물에서 분리되었다. 간단히 말해서, 말초 혈액 단핵 세포(PBMC)는 Ficoll 원심분리(Dakewei, AS1114546)에 의해 분리되었고, T 세포는 PBMC로부터 EasySep 인간 T 세포 분리 키트(STEMCELL, 17951)를 사용하여 자기 음성 선택에 의해 분리었다. 분리 후, T 세포를 X-vivo15 배지, 10% FBS 및 IL2(1000 U/ml)에서 배양하고, CD3/CD28 DynaBeads(ThermoFisher, 11131D)로 2일 동안 자극하였다. 건강한 기증자의 루카페레시스 생성물은 AllCells LLC China에서 얻었다. 모든 건강한 기증자는 정보에 입각한 동의를 하였다.
렌티바이러스 패키지 및 리포터 세포주 구축
발현 플라스미드를 X-tremeGENE HP DNA 형질감염 시약을 통해 2개의 바이러스 패키징 플라스미드인 pR8.74 및 pVSVG(Addgene)와 함께 HEK293T-WT 세포에 공-형질감염시켰다. 72시간 후 상등액 바이러스를 수집하여 -80℃에 보관하였다. HEK293T-WT 세포를 렌티바이러스로 감염시키고, 72시간 후, mCherry-양성 세포를 FACS를 통해 분류하고 배양하여 제한 희석 방법에 의해 매우 낮은 EGFP 배경을 갖는 이중 형광 리포터 시스템을 안정적으로 발현하는 단일 클론 세포주를 선택하였다.
안정적인 리포터 세포주의 경우, 리포터 구축물(pLenti-CMV-MCS-PURO 백본)을 2개의 바이러스 패키징 플라스미드인 pR8.74 및 pVSVG와 함께 HEK293T 세포에 공-형질감염시켰다. 72시간 후, 상등액 바이러스를 수집하여 -80℃에 보관하였다. HEK293T 세포를 렌티바이러스로 감염시킨 후, mCherry 양성 세포를 FACS를 통해 분류하고 배양하여 검출 가능한 EGFP 배경 없이 이중 형광 리포터 시스템을 안정적으로 발현하는 단일 클론 세포주를 선택하였다. HEK293T ADAR1-l- 및 TP53-l- 세포주는 이전에 보고된 방법60에 따라 생성되었다. ADAR1 타겟팅 sgRNA 및 CMV 구동 퓨로마이신 내성 유전자를 함유하는 PCR 증폭 공여자 DNA를 HEK293T 세포에 공-형질감염시켰다. 이어서, 형질감염 7일 후에 세포를 퓨로마이신으로 처리하였다. 단일 클론을 퓨로마이신 내성 세포로부터 단리한 후, 시퀀싱 및 웨스턴 블롯을 통해 검증하였다.
내인성 또는 외인성 발현 전사체의 RNA 편집
이중 형광 리포터에 대해 RNA 편집을 평가하기 위해, HEK293T 세포 또는 HEK293T ADAR1-/- 세포를 6웰 플레이트(6×105세포/웰)에 시딩했다. 24시간 후, 세포를 1.5㎍ 리포터 플라스미드 및 1.5㎍ arRNA 플라스미드로 공-형질감염시켰다. ADAR1p110, ADAR1p150 또는 ADAR2 단백질 발현의 효과를 조사하기 위해, 편집 효율을 EGFP 양성 비율 및 딥 시퀀싱에 의해 분석했다.
HEK293T ADAR1-/- 세포를 12웰 플레이트(2.5×105세포/웰)에 시딩했다. 24시간 후, 세포를 0.5㎍의 리포터 플라스미드, 0.5㎍의 arRNA 플라스미드 및 0.5㎍의 ADAR1/2 플라스미드(대조군으로서 pLenti 백본)로 공-형질감염시켰다. 편집 효율은 EGFP 양성 비율 및 딥 시퀀싱에 의해 분석했다.
내인성 mRNA 전사물에 대한 RNA 편집을 평가하기 위해, HEK293T 세포를 6웰 플레이트(6×105세포/웰)에 시딩했다. 24시간 후, 세포를 3㎍의 arRNA 플라스미드로 형질감염시켰다. 편집 효율은 딥 시퀀싱에 의해 분석했다.
다중 세포주에서의 RNA 편집 효율을 평가하기 위해, 8-9×104(RD, SF268, HeLa) 또는 1.5×105(HEK293T) 세포를 12웰 플레이트에 시딩했다. HT29, A549, HepG2, SW13, NIH3T3, MEF 및 B16과 같이 형질감염이 어려운 세포의 경우, 2-2.5×105세포를 6플레이트에 시딩했다. 24시간 후, 리포터와 arRNA 플라스미드를 이들 세포에 공-형질감염시켰다. 편집 효율은 EGFP 양성 비율에 의해 분석했다.
EGFP 양성 비율을 평가하기 위해, 형질감염 후 48∼72시간에서 세포를 형광 활성화 세포 분류(FACS) 분석에 의해 분류 및 수집했다. mCherry 신호는 리포터/arRNA-발현 세포를 위한 형광 선택 마커로 사용되었으며, EGFP+/mCherry+ 세포의 백분율을 편집 효율에 대한 판독값으로서 계산했다.
A에서 I로의 편집률의 NGS 정량화를 위해, 형질감염 후 48~72시간에서 세포를 FACS 분석에 의해 분류 및 수집한 다음, RNA 단리(TIANGEN, DP420)를 실시했다. 그 다음, RT-PCR(TIANGEN, KR103-04)을 통해 전체 RNA를 cDNA로 역전사하고, 타겟 유전자좌를 표 1에 나열된 대응하는 프라이머로 PCR 증폭했다.
Figure pct00001
Figure pct00002
Figure pct00003
Figure pct00004
Figure pct00005
Figure pct00006
PCR 생성물은 생어 시퀀싱 또는 NGS(Illumina HiSeq X Ten)를 위해 정제되었다.
딥 시퀀싱
내인성 mRNA 편집 실험을 위해, 293T-WT 세포를 6웰 플레이트(6×105세포/웰)에 시딩했다. 대략 70%가 융합하면, HEK293 세포를 X-tremeGENE HP DNA 형질감염 시약(Roche)을 사용하여 3㎍ dRNA로 형질감염시켰다. 72시간 후, FACS를 통해 GFP-양성 또는 BFP-양성 세포를 분류(대응하는 형광 마커에 따라)한 다음, RNA 단리를 수행했다. 그 다음, 단리된 RNA를 RT-PCR을 통해 cDNA에 역전사시키고, 특정한 타겟팅된 유전자좌를 대응하는 프라이머 쌍(23 PCR 사이클)으로 증폭하고, Illumina NextSeq에서 시퀀싱했다.
다중 세포주에서 테스팅
HEK293T(양성 대조군) 및 HEK293T ADAR1-/-(음성 대조군) 세포 외에, 상이한 조직 및 기관으로부터 유래하는 1개의 마우스 세포주(NIH3T3) 및 7개의 인간 세포주(RD, HeLa, SF268, A549, HepG2, HT-29, SW13)를 실험을 수행하기 위해 선택했다. 형질감염 효율이 더 높은 세포주의 경우, 약 8-9×104세포(RD, HeLa, SF268) 또는 1.5×105(HEK293T)를 12웰 플레이트의 각 웰에 플레이팅하고, 형질감염이 곤란한 것(A549, HepG2, HT-29, SW13, NIH3T3)에 대해서는, 2-2.5×105세포를 6웰 플레이트에 플레이팅했다. 또한, 모든 이들 세포를 37℃에서 5% CO2와 함께 10% 소 태아 혈청(FBS, CellMax)이 보충된 둘베코 변형 이글 배지(DMEM, Corning)에서 유지되었다. 24시간 후, CG2 리포터 및 71개의 뉴클레오티드 dRNA(35-C-35) 플라스미드를 X-tremeGENE HP DNA 형질감염 시약(Roche)을 사용하여 상이한 유형의 세포에 공-형질감염시켰다. 형질감염 48시간 후, 세포를 트립신화하고, FACS(BD)를 통해 분석했다. 형질감염 효율이 낮은 세포는 mCherry 및 BFP 양성 세포가 상당히 적었기 때문에, 6웰 플레이트에 플레이팅된 세포에 대해서는 FACS 분석을 위한 총 세포수를 1×105까지 증가시켰다.
타겟팅된 부위에 대한 RNA 편집 분석
딥 시퀀싱 분석을 위해, arRNA 커버링 서열의 타겟팅된 부위 서열(상류 및 하류 20개의 뉴클레오티드)을 사용하여 인덱스를 생성했다. 판독은 BWA 버전 0.7.10-r789를 사용하여 정렬 및 정량화했다. 그 다음, 정렬 BAM은 Samtools에 의해 분류하고, RNA 편집 부위는 REDitools 버전 1.0.4를 사용하여 분석했다. 파라미터는 다음과 같다: -U[AG 또는 TC]-t 8-n 0.0-T 6-6 -e -d -u. 피셔(Fisher) 정확 검증(p-값<0.05)에 의해 계산된 arRNA 타겟팅 영역 내의 모든 유의한 A>G 전환은 arRNA에 의한 편집으로 간주했다. 타겟팅된 아데노신을 제외한 전환은 오프-타겟 편집이었다. 대조군과 실험군에서 동시에 나타난 돌연변이는 SNP로 간주했다.
전장 전사체 RNA-시퀀싱 분석
BFP 발현 카세트를 갖는 대조군 RNA151 또는 arRNA151-PPIB-발현 플라스미드를 HEK293T 세포에 형질감염시켰다. BFP+ 세포는 형질감염 48시간 후 FACS에 의해 농축했고, RNA는 RNAprep Pure Micro 키트(TIANGEN, DP420)를 사용하여 정제했다. 그 다음, NEBNext Poly(A) mRNA Magnetic Isolation Module(New England Biolabs, E7490)을 사용하여 mRNA를 정제하고, NEBNext Ultra II RNA Library Prep Kit for Illumina(New England Biolabs, E7770)로 처리한 다음, Illumina HiSeq X Ten 플랫폼(2×150-bp 페어드 엔드, 각 샘플에 대해 30G)을 사용한 딥 시퀀싱 분석을 했다. 형질감염으로 인한 비특이적 효과를 배제하기 위해, 형질감염 시약으로 세포만 처리한 모조를 포함시켰다. 각 군에는 4개의 복제가 포함되었다.
생물정보학 분석 파이프라인은 Vogel et al22에 의한 작업을 참조했다. 분석의 품질 관리는 FastQC를 사용하여 수행되었으며, 품질 트림은 Cutadapt를 기반으로 했다(각 판독에 대한 처음의 6bp는 트리밍되었고, 최대 20-bp가 품질 트리밍되었다). AWK 스크립트를 도입된 arRNA를 필터링하기 위해 사용했다. 트리밍 후, 길이가 90개의 뉴클레오티드 미만인 판독은 필터링했다. 이어서, 필터링된 판독은 STAR 소프트웨어61에 의해 참조 게놈(GRCh38-hg38)에 매핑했다. 우리는 변이체를 호출하기 위해 GATK Haplotypcaller62를 사용했다. GATK에 의해 생성된 raw VCF 파일을 GATK VariantFiltration, bcftools 및 ANNOVAR63에 의해 필터링하고 주석을 달았다. dbSNP에서의 변이체, 1000 Genome64, EVS는 필터링했다. 그 다음, 각 군의 4개 복제물에서 공유된 변이체를 RNA 편집 부위로서 선택했다. 모조의 RNA 편집 수준을 배경으로 간주하고, 대조군 RNA151 및 arRNA151-PPIB의 글로벌 타겟을 모조에서 변이체를 제함으로써 얻었다.
LEAPER가 자연적인 편집 항상성을 교란하는지를 평가하기 위해, 모조와 arRNA151-PPIB군(또는 대조군 RNA151군)에 의해 공유된 글로벌 편집 부위를 분석했다. 네이티브 A에서 I로의 편집 부위에서의 차등 RNA 편집률은 피어슨의 상관계수 분석을 이용하여 평가했다. 모조와 arRNA151-PPIB군(또는 대조군 RNA151군) 사이의 편집률의 피어슨 상관 관계를 계산하고 도 6에 주석을 달았다.
Figure pct00007
X는 모조에서의 각 부위의 편집률을 의미하고; Y는 대조군 RNA151군(도 6a) 또는 arRNA151-PPIB군(도 6b)에서의 각 부위의 편집률을 의미하고; σx는 X의 표준 편차이고; σY는 Y의 표준 편차이고; μX는 X의 평균이고; μY는 Y의 평균이고; E는 기대치이다.
RNA-Seq 데이터를 RNA 편집 이벤트에 의해 유도된 가능한 전사 변화의 문의(Interrogation)에 대해 분석했다. 전장 전사체의 유전자 발현 분석은 HISAT2 및 STRINGTIE 소프트웨어65를 사용하여 수행했다. 시퀀싱 데이터의 품질 관리를 위해 Cutadapt 및 FastQC를 사용했다. 그 다음, HISAT2를 사용하여 시퀀싱 판독을 참조 게놈(GRCh38-hg38)에 매핑한 다음, 상술한 바와 같이 피어슨의 상관계수 분석을 수행했다.
웨스턴 블롯
우리는 ADAR1(Sa개의 뉴클레오티드a Cruz, sc-271854), ADAR2(Sa개의 뉴클레오티드a Cruz, sc-390995), ADAR3(Sa개의 뉴클레오티드a Cruz, sc-73410), p53(Sa개의 뉴클레오티드a Cruz, sc-99), KRAS(Sigma, SAB1404011); GAPDH(Sa개의 뉴클레오티드a Cruz, sc-47724) 및 β-튜불린(CWBiotech, CW0098)에 대해 각각 마우스 단일 클론 1차 항체를 사용했다. HRP-콘쥬게이티드 염소 항-마우스 IgG(H+L, 115-035-003) 2차 항체는 Jackson ImmunoResearch에서 구입했다. 2×106개의 세포를 분류하여 용해시키고, 동일한 양의 각 용해물을 SDS-PAGE에 대해 로딩했다. 그 다음, 샘플 단백질을 PVDF 막(Bio-Rad Laboratories)으로 옮기고, ADAR 효소 중 하나에 대한 1차 항체(항-ADAR1, 1:500; 항-ADAR2, 1:100; 항-ADAR3, 1:800)로 면역블 롯팅한 다음, 2차 항체 배양(1:10,000)하고 노출시켰다. 스트리핑 버퍼(CWBiotech, CW0056)로 ADAR 단백질을 스트리핑한 후 β-튜불린을 동일한 PVDF 막에 다시 프로빙했다. 실험은 3회 반복했다. 반 정량적(semi-quantitative) 분석은 Image Lab 소프트웨어를 이용하여 행했다.
사이토카인 발현 분석
HEK293T 세포를 12개의 웰 플레이트(2×105세포/웰)에 시딩했다. 약 70% 융합시, 세포를 1.5㎍의 arRNA로 형질감염시켰다. 양성 대조군으로서 1㎍의 폴리(I:C)(Invitrogen, tlrl-picw)를 형질감염시켰다. 48시간 후, 세포를 수집하고 RNA 단리(TIANGEN, DP430)를 행했다. 그 다음, 전체 RNA를 RT-PCR(TIANGEN, KR103-04)을 통해 cDNA에 역전사하고, 정량적 PCR(TAKARA, RR820a)에 의해 IFN-β및 IL-6의 발현을 측정했다. 프라이머의 서열은 상기 표 1에 나열했다.
p53의 전사 조절 활성 분석
p53의 전사 조절 활성을 검출하기 위해, TP53W53X cDNA-발현 플라스미드 및 arRNA-발현 플라스미드를 p53-파이어플라이-루시페라아제 cis-리포팅 플라스미드(YRGene, VXS0446) 및 레닐라-루시페라아제 플라스미드(Z. Jiang의 연구실, Peking University)와 함께, HEK293T TP53-/- 세포에 공-형질감염시켰다. 48시간 후, 세포를 수확하고, 제조사 프로토콜에 따라 Promega Dual-Glo 루시페라아제 에세이 시스템(Promega, E4030)으로 분석했다. 간단히 말해, 150㎕ Dual-Glo 루시페라아제 시약을 수확된 세포 펠릿에 추가하고, 30분 후 Infinite M200 리더(TECAN)에 의해 96웰 백색 플레이트에 100㎕ Dual-Glo 루시페라아제 시약(세포 용해)를 첨가함으로써 파이어플라이 발광을 측정했다. 30분 후, 100㎕ Dual-Glo stop과 Glo 시약을 각 웰에 순차적으로 첨가하여 레닐라 발광을 측정하고, 레닐라 발광에 대한 파이어플라이 발광의 비율을 계산했다.
1차 세포에서의 전기천공
인간 1차 폐 섬유아세포 또는 인간 1차 기관지 상피세포에서의 arRNA 발현 플라스미드 전기천공의 경우, 20㎍ 플라스미드를 NucleofectorTM 2b 장치(Lonza) 및 Basic NucleofectorTM 키트(Lonza, VPI-1002)로 전기천공하고, 전기천공 프로그램은 U-023였다. 인간 1차 T 세포에서의 arRNA 발현 플라스미드 전기천공의 경우, 20㎍ 플라스미드를 NucleofectorTM 2b 장치(Lonza) 및 Human T cell NucleofectorTM 키트(Lonza, VPA-1002)를 사용하여 인간 1차 T 세포에 전기천공하고, 전기천공 프로그램은 T-024였다. 전기천공 48시간 후, 세포를 분류하고 FACS 분석에 의해 수집 한 다음, 타겟팅된 RNA 편집 어세이를 위해 하기의 딥 시퀀싱을 수행했다. 형광 마커에 따라 전기천공 효율을 정규화했다.
인간 1차 T 세포 또는 1차 GM06214 세포에서 화학합성 arRNA 또는 대조군 RNA 전기천공을 위해, RNA 올리고를 최종 농도가 2㎛인 100㎕ opti-MEM 배지(Gbico, 31985070)에 용해시켰다. 그 다음, 1×10E6 GM06214 세포 또는 3×10E6 T 세포를 상기 전기천공 혼합물로 재현탁하고, 1ms 동안 450V에서 애자일 펄스 인 비보 장치(Agile Pulse In Vivo Device)(BTX)로 전기천공했다. 그 다음, 세포를 하기 분석을 위해 옮겨 배양 배지를 가온했다.
α-L-아이두로니데이스(IDUA) 촉매 활성 분석
수확된 세포 펠릿을 재현탁하고 30분 동안 얼음 위에서 1×PBS 완충액에서 28㎕ 0.5% Triton X-100으로 용해시켰다. 그 다음, 25㎕의 세포 용해물을 pH 3.5의 0.2 Triton X-100을 함유하는 0.4M 나트륨 포르메이트 완충액에 용해시킨 190㎛ 4-메틸움베릴페릴-α-L-아이두로니데이스 기질(Cayman, 2A-19543-500) 25㎕에 첨가하고, 암실에서 37℃에서 90분간 배양했다. pH 10.3의 0.5M NaOH/글리신 완충액 200㎕를 첨가함으로써 촉매 반응을 켄칭한 후, 4℃에서 2분간 원심 분리했다. 상층액을 96웰 플레이트에 옮기고, Infinite M200 리더(TECAN)로 365nm 여기 파장 및 450nm 방출 파장에서 형광을 측정했다.
실시예 1. 리포터에 대한 본 발명의 RNA 편집 방법의 테스트
Cas13 계열 단백질(C2c2)이 포유류 세포에서 RNA를 편집할 수 있다고 보고되어 있다. 우리는 다양한 조건 하에서 이 시스템을 더 테스트했다. 우선, mCherry와 EGFP 유전자 사이에 정지 코돈을 포함하는 3×GS 링커 타겟팅 서열을 도입함으로써, mCherry 및 EGFP 형광을 기반으로 한 이중 형광 리포터 시스템을 구축했다. 또한, 우리는 EGFP 번역의 누락을 저감하기 위해 EGFP의 개시 코돈 ATG를 삭제했다.
이중 형광 리포터-1은 mCherry의 서열(SEQ ID NO:1), 3×GS 링커 및 타겟팅된 A를 포함하는 서열(SEQ ID NO:2), 및 eGFP의 서열(SEQ ID NO:3)을 포함한다.
atggtgagcaagggcgaggaggataacatggccatcatcaaggagttcatgcgcttcaaggtgcacatggagggctccgtgaacggccacgagttcgagatcgagggcgagggcgagggccgcccctacgagggcacccagaccgccaagctgaaggtgaccaagggtggccccctgcccttcgcctgggacatcctgtcccctcagttcatgtacggctccaaggcctacgtgaagcaccccgccgacatccccgactacttgaagctgtccttccccgagggcttcaagtgggagcgcgtgatgaacttcgaggacggcggcgtggtgaccgtgacccaggactcctccctgcaggacggcgagttcatctacaaggtgaagctgcgcggcaccaacttcccctccgacggccccgtaatgcagaagaagaccatgggctgggaggcctcctccgagcggatgtaccccgaggacggcgccctgaagggcgagatcaagcagaggctgaagctgaaggacggcggccactacgacgctgaggtcaagaccacctacaaggccaagaagcccgtgcagctgcccggcgcctacaacgtcaacatcaagttggacatcacctcccacaacgaggactacaccatcgtggaacagtacgaacgcgccgagggccgccactccaccggcggcatggacgagctgtacaag (mCherry의 서열) (SEQ ID NO:1)
ctgcag ggcggaggaggcagcggcggaggaggcagcggcggaggaggcagc agaaggtatacacgccggaagaatctgtagagatccccggtcgccacc(3×GS 링커(이탤릭체 및 굵은체로 표시) 및 타겟팅된 A(더 크고 및 굵은 A로 표시)를 포함하는 서열 (SEQ ID NO:2)
gtgagcaagggcgaggagctgttcaccggggtggtgcccatcctggtcgagctggacggcgacgtaaacggccacaagttcagcgtgtccggcgagggcgagggcgatgccacctacggcaagctgaccctgaagttcatctgcaccaccggcaagctgcccgtgccctggcccaccctcgtgaccaccctgacctacggcgtgcagtgcttcagccgctaccccgaccacatgaagcagcacgacttcttcaagtccgccatgcccgaaggctacgtccaggagcgcaccatcttcttcaaggacgacggcaactacaagacccgcgccgaggtgaagttcgagggcgacaccctggtgaaccgcatcgagctgaagggcatcgacttcaaggaggacggcaacatcctggggcacaagctggagtacaactacaacagccacaacgtctatatcatggccgacaagcagaagaacggcatcaaggtgaacttcaagatccgccacaacatcgaggacggcagcgtgcagctcgccgaccactaccagcagaacacccccatcggcgacggccccgtgctgctgcccgacaaccactacctgagcacccagtccgccctgagcaaagaccccaacgagaagcgcgatcacatggtcctgctggagttcgtgaccgccgccgggatcactctcggcatggacgagctgtacaagtaa(eGFP의 서열) (SEQ ID NO:3)
이중 형광 리포터-2는 mCherry의 서열(SEQ ID NO:1), 3×GS 링커(이탤릭체 및 굵은체로 표시) 및 타겟팅된 A(더 크고 굵은 A로 표시)를 포함하는 서열(SEQ ID NO:4), 및 eGFP의 서열(SEQ ID NO:3)을 포함한다.
ctgcag ggcggaggaggcagcggcggaggaggcagcggcggaggaggcagc gcctgctcgcgatgctagagggctctgcca(3×GS 링커(이탤릭체 및 굵은체로 표시) 및 타겟팅된 A(더 크고 및 굵은 A로 표시) (SEQ ID NO:4))
이중 형광 리포터-3은 mCherry의 서열(SEQ ID NO:1), 1×GS 링커(이탤릭체 및 굵은체로 표시) 및 타겟팅된 A를 포함하는 서열(SEQ ID NO:5), 및 eGFP의 서열(SEQ ID NO:3)을 포함한다.
ctgcag ggcggaggaggcagc gcctgctcgcgatgctagagggctctgcca(1×GS 링커(이탤릭체 및 굵은체로 표시) 및 타겟팅된 A(더 크고 굵은 A로 표시)를 포함하는 서열) (SEQ ID NO:5)
우리는 mCherry-3×GS 링커-TAG-EGFP를 pLenti-백본에 클로닝하고, 리포터 플라스미드를 렌티바이러스에 패킹하여 이중 형광 리포터를 발현하는 안정적인 세포주를 구축하는 293T 세포를 감염시켰다. 그 다음, 우리는 리포터 시스템으로서 EGFP 형광 배경이 낮은 단일 클론을 선택했다. 최적의 crRNA 디자인을 테스트하기 위해, LbucC2c2 crRNA 가이드를 타겟팅 아데노신에 걸쳐 28∼78개의 뉴클레오티드 길이의 스페이서로 타일링했다. 우리는 더 긴 crRNA 가이드가 더 높은 EGFP 양성 효율을 부여한다는 것을 발견했다. 놀랍게도, 우리가 임의의 dC2c2-ADARDD 발현 플라스미드의 공-형질감염 없이 타겟팅 crRNA 플라스미드를 형질감염했을 때, EGFP 단백질이 실질적으로 발현된다. 예를 들면 서열 ggaccaccccaaaaaugaauauaaccaaaacugaacagcuccucgcccuugcucacuggcagagcccuccagcaucgcgagcaggcgcugccuccuccgcc(SEQ ID NO:6)을 갖는 crRNA 가이드는 25% 이상의 EGFP 양성 효율을 부여했다. 이것은 정지 코돈 UAG의 아데닌이 대부분 편집되었음을 나타낸다. 대조적으로, 랜덤 crRNA는 EGFP 음성 세포를 양성으로 되게 할 수 없었다(도 6a, 6b 및 6c). 이러한 결과를 기반으로 하여, 우리는 RNA 전사물의 과발현만이 RNA를 편집하기 위해 내인성 ADAR 효소를 활용할 수 있다고 추론했다.
또한, 우리는 RNA 가이드에서의 스캐폴드 RNA 서열을 삭제하여, 선형 가이드 RNA를 생성했다. 우리는 A-C 미스매치를 갖는 타겟팅 RNA에 상보적인 70개의 뉴클레오티드 길이의 RNA (aaaccgagggaucauaggggacugaauccaccauucuucucccaaucccugcaacuccuucuuccccugc(SEQ ID NO:7))는 EGFP 음성 세포를 EGFP 양성 세포로 효율적으로 전환할 수 있는 반면, 70개의 뉴클레오티드 랜덤 RNA (ugaacagcuccucgcccuugcucacuggcagagcccuccagcaucgcgagcaggcgcugccuccuccgcc(SEQ ID NO: 8))는 할 수 없었다(도 1a, 1b, 1c 및 1d). 따라서, 우리는 이 RNA를 dRNA(탈아미노효소-리크루팅 RNA)로 지정한다. 세포 내인성 ADAR이 dRNA에 의한 아데닌 탈아미노화를 수행하기 위해 리크루팅될 수 있는지를 확인하기 위해, 우리는 ADAR1 p110 및 ADAR1 p150 이중 녹아웃 293T 세포주에서 실험을 행했다(도 6e 및 6f). ADAR1은 보편적으로 발현되는 반면, ADAR2는 주로 뇌에서 높은 수준으로 발현되기 때문이다. 그래서, 우리는 dRNA에 의한 타겟팅 아데닌 탈아미노화는 ADAR2가 아닌 ADAR1에 의해 주로 매개된다는 것을 제안했다. 예상대로, 타겟팅 dRNA는 293T-ADAR1-/- 세포에서 EGFP 발현을 유발할 수 없었지만, 외인성 ADAR1 p110, p150 또는 ADAR2를 과발현하면 293T-ADAR1-/- 세포에서 EGFP 발현을 구제할 수 있는 바(도 1e 및 1f), 293T 세포에서, dRNA는 타겟 RNA에 대한 아데닌 탈아미노화를 매개할 수 있도록 ADAR1 또는 ADAR2를 리크루팅할 수 있다는 것을 시사한다. 또한, 우리는 ADAR1-p110 및 ADAR2는 ADAR1-p110 및 ADAR1-p150의 상이한 세포 국재성으로 인해 가능할 수 있는, ADAR1-p150(도 1g 및 도 6g)보다 더 높은 편집 활성을 갖는 것을 발견했다.
EGFP 형광의 복원이 타겟팅 RNA 편집 이벤트에 인한 것인지 확인하기 위해, RT-PCR을 통해 리포터-2 전사물의 dRNA 매개 편집을 직접 측정한 다음, 타겟팅된 생어 시퀀싱 및 차세대 시퀀싱을 행했다. 시퀀싱 결과는 타겟팅된 아데닌(A-C 미스매치 부위)에서 A에서 G로의 염기 전환이 나타났고, 편집률은 13%에 도달할 수 있었다(도 6h 및 도 1h). 게다가, 우리는 또한 증가된 이중 RNA 영역으로 인하여 가장 가능할 수 있는, 서열 창이 타겟팅된 아데닌에 근접하는 동안, A에서 G로의 약간의 편집이 관찰되어, 추후 우리는 수개의 전략으로 예기치 않은 편집을 제거하려고자 할 것이다.
실시예 2. dRNA 설계를 위한 요인의 최적화
다음으로, 우리는 더 높은 편집 효율을 달성하기 위해 dRNA를 최적화를 시작했다. 우선, 우리는 타겟팅된 아데닌의 반대쪽 부위의 염기가 편집하기 유리한지를 결정하는 것을 목표로 했다. 이전 연구에서는 타겟팅된 아데노신의 반대쪽 염기가 효율적인 편집에 영향을 미친다는 것을 나타내었다. 따라서, 우리는 타겟팅된 A의 반대쪽의 중간 위치에 미스매치 N(A, U, C 및 G)을 갖는 71개의 뉴클레오티드 dRNA를 설계했다. FACS 결과를 기반으로, 우리는 4개의 상이한 dRNA가 다음과 같이 효율적으로 편집되는 것을 발견했다: C>A>U>G(도 2a 및 2b). 최근에는, 타겟 UAG 부위에 기포가 거의 없는 것이 편집 효율에 유익할 수 있다는 것이 보고되어 있다. 따라서, 우리는 우리의 가설을 테스트하기 위해 타겟 UAG 부위를 갖는 2개 또는 3개의 미스매치 염기를 포함하는 dRNA를 설계했다. 골든 게이트 클로닝 방법을 사용하여, BFP 마커가 있는 dRNA 벡터에 대해 16개의 상이한 71개의 뉴클레오티드 dRNA를 설계하고 구축했다. 우리는 CCA 및 GCA 서열을 가진 dRNA가 효율이 가장 높았으며, 이는 적어도 UAG 타겟 부위의 경우에는 기포가 적을수록 A-I 편집에 대한 기여가 작다는 것을 의미한다. 게다가, NCA 서열의 4개의 dRNA는 GFP 양성 세포의 백분율이 더 높음으로써, 상보적인 U-A 염기 쌍이 ADAR 편집에 중요할 수 있다는 결론으로 이어졌다(도 2c 및 2d). 이어서, 리포터를 기반으로 한 상이한 길이의 dRNA의 효율을 테스트한다. dRNA는 중간 위치에서의 미스매치 C가 31개의 뉴클레오티드-221개의 뉴클레오티드 범위의 상이한 길이를 갖게 설계되었다. 우리는 dRNA가 길수록 편집 효율이 증가한다는 것을 발견했다. 리포터 시스템의 편집 피크는 171개의 뉴클레오티드 dRNA에 위치된다. 51개의 뉴클레오티드 dRNA는 우수한 효율(18%)로 리포터 시스템을 밝힐 수 있다(도 2e 및 2f). 마지막으로, 우리는 dRNA의 미스매치 C의 위치가 편집 효율에 영향을 미치는지의 여부를 조사했다. dRNA는 동일한 71개의 뉴클레오티드 길이로 유지되었고, 전사 개시와는 다른 위치의 미스매치 C가 설계되었다. FACS 결과에 기반하면, 반대쪽의 미스매치 C의 위치가 편집 효율에 영향을 미칠 수 있으며, 또한 dRNA의 5' 또는 3'에 위치한 미스매치 C는 낮은 효율을 갖는다는 것을 발견했다(도 2g 및 2h).
가능한 3-염기 모티프를 모두 포함하는 타겟 서열을 포함하는 16개의 상이한 리포터가 깁슨 클로닝을 통해 구축된 다음, pLenti 백본(pLenti-CMV-MCS-SV-Bsd, Stanley cohen Lab, Stanford University)에 클로닝되었다. 타겟 서열은 다음과 같이 나타내어진다.
가능한 3-염기 모티프를 모두 포함하는 타겟 서열:
TAT:
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgctatagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc(SEQ ID NO: 9)
TAA:
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgctaaagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc(SEQ ID NO: 10)
TAC:
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgctacagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc(SEQ ID NO: 11)
TAG:
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgctagagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc (SEQ ID NO: 12)
AAT:
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgcaatagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc(SEQ ID NO: 13)
AAA:
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgcaaaagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc (SEQ ID NO: 14)
AAC:
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgcaacagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc(SEQ ID NO: 15)
AAG:
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgcaagagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc (SEQ ID NO: 16)
CAT:
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgccatagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc (SEQ ID NO: 17)
CAA:
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgccaaagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc(SEQ ID NO: 18)
CAC:
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgccacagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc (SEQ ID NO: 19)
CAG:
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgccagagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc (SEQ ID NO: 20)
GAT:
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgcgatagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc(SEQ ID NO: 21)
GAA:
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgcgaaagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc (SEQ ID NO: 22)
GAC:
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgcgacagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc (SEQ ID NO: 23)
GAG:
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgcgagagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc (SEQ ID NO: 24)
dRNA는 동일한 111bp 길이를 유지하고 중앙에서의 미스매치 C를 타겟 A를 향하게 설계했다.
12웰 세포 배양 클러스터에 있어서, 2×105세포 HEK293T를 각 웰에 플레이 팅하고, 각 실험을 3회 반복 수행했다. 24시간 후, 0.5㎍ dRNA 플라스미드 및 0.5㎍ 리포터 타겟 플라스미드를 X-tremeGENE HP DNA 형질감염 시약(Roche)을 사용하여 세포에 공-형질감염시켰다. 48시간 후, 세포를 트립신화하고 FACS(BD)를 통해 mCherry 양성 세포에 대해 선택했다. 총 4×105개의 세포를 수확하고, RNAprep 순수 세포/박테리아 키트(TIANGEN DP430)를 사용하여 전체 RNA를 추출했다. cDNA는 Quantscript RT Kit(TIANGEN KR103-04)를 사용하여 2㎍의 전체 RNA로부터 합성했다. 또한, 111개의 타겟 영역은 PCR을 통해 증폭했고, 딥 시퀀싱을 행했다.
우리는 16개의 상이한 3-염기 모티프 모두가 가변적인 효율일지라도 본 출원의 예시적인 RNA 편집 방법을 통해 편집될 수 있다는 것을 발견했다. 요약하면, 그 결과는 편집될 A의 5' 최근접 이웃은 U>C≒A>G의 선호도를 가지며, 편집될 A의 3' 최근접 이웃은 G>C>A≒U의 선호도를 갖는 것을 나타낸다. 데이터는 도 3a에서의 막대 차트 또는 도 3b의 히트맵으로서 나타내었다.
실시예 3. 내인성 유전자로부터 전사된 RNA 편집
다음으로, dRNA가 내인성 유전자로부터 전사된 mRNA를 매개할 수 있는지의 여부를 테스트했다. 우리는 KRAS, PPIB, β-액틴 및 GAPDH의 4개의 유전자를 타겟으로 하는 dRNA를 설계했다. KRAS mRNA의 경우, 우리는 91, 111, 131, 151, 171 및 191개의 뉴클레오티드 길이의 dRNA(도 4a)를 하기와 같은 서열을 갖게 설계했다.
91개의 뉴클레오티드 KRAS-dRNA
uagcuguaucgucaaggcacucuugccuacgccaccagcuccaaccaccacaaguuuauauucagucauuuucagcaggccucucucccgc (SEQ ID NO: 25)
111개의 뉴클레오티드 KRAS-dRNA
gauucugaauuagcuguaucgucaaggcacucuugccuacgccaccagcuccaacuaccacaaguuuauauucagucauuuucagcaggccucucucccgcaccugggagc (SEQ ID NO: 26)
131개의 뉴클레오티드 KRAS-dRNA
uccacaaaaugauucugaauuagcuguaucgucaaggcacucuugccuacgccaccagcuccaacuaccacaaguuuauauucagucauuuucagcaggccucucucccgcaccugggagccgcugagccu (SEQ ID NO: 27)
151개의 뉴클레오티드 KRAS-dRNA
aucauauucguccacaaaaugauucugaauuagcuguaucgucaaggcacucuugccuacgccaccagcuccaaccaccacaaguuuauauucagucauuuucagcaggccucucucccgcaccugggagccgcugagccucuggccccgc (SEQ ID NO: 28)
171개의 뉴클레오티드 KRAS-dRNA
cuauuguuggaucauauucguccacaaaaugauucugaauuagcuguaucgucaaggcacucuugccuacgccaccagcuccaaccaccacaaguuuauauucagucauuuucagcaggccucucucccgcaccugggagccgcugagccucuggccccgccgccgccuuc (SEQ ID NO: 29)
191개의 뉴클레오티드 KRAS-dRNA
uaggaauccucuauuguuggaucauauucguccacaaaaugauucugaauuagcuguaucgucaaggcacucuugccuacgccaccagcuccaaccaccacaaguuuauauucagucauuuucagcaggccucucucccgcaccugggagccgcugagccucuggccccgccgccgccuucagugccugcg (SEQ ID NO: 30)
차세대 시퀀싱 결과는 dRNA가 타겟팅된 KRAS mRNA를 최대 11.7% 편집 효율(도 4b)로 편집할 수 있다는 것을 나타냈다. 내인성 PPIB mRNA의 경우, 부위 1, 부위 2 및 부위 3의 3개의 부위를 타겟으로 했다. 우리는 각 부위(도 4c)에 대해 151개의 뉴클레오티드 길이의 dRNA가 이하에 나타낸 바와 같은 서열을 갖게 설계했다.
151개의 뉴클레오티드 PPIB-dRNA (부위 1)
gaggcgcagcauccacaggcggaggcgaaagcagcccggacagcugaggccggaagaggguggggccgcgguggccagggagccggcgccgccacgcgcgggugggggggacugggguugcucgcgggcuccgggcgggcggcgggcgccg (SEQ ID NO: 31)
151개의 뉴클레오티드 PPIB-dRNA (부위 2)
uccuguagcuaaggccacaaaauuauccacuguuuuuggaacagucuuuccgaagagaccaaagaucacccggcccacaucuucaucuccaauucguaggucaaaauacaccuugacggugacuuugggccccuucuucuucucaucggcc (SEQ ID NO: 32)
151개의 뉴클레오티드 PPIB-dRNA (부위 3)
gcccuggaucaugaaguccuugauuacacgauggaauuugcuguuuuuguagccaaauccuuucucuccuguagccaaggccacaaaauuauccacuguuuuuggaacagucuuuccgaagagaccaaagaucacccggccuacaucuuca (SEQ ID NO: 33)
차세대 시퀀싱 결과는 dRNA가 PPIB mRNA 부위 1을 최대 14% 편집률(도 4b)로 효율적으로 편집할 수 있다는 것을 나타냈다. PPIB mRNA 부위 2 및 부위 3의 경우, 편집 효율이 1.5% 및 0.6%이었다(도 4e 및 4f). 내인성 β-액틴 mRNA의 경우, 우리는 2개의 타겟팅된 부위를 선택하고, 각 부위(도 4g)에 대한 dRNA를 이하에 나타낸 바와 같은 서열을 갖게 설계했다.
72개의 뉴클레오티드β-Actin-dRNA (부위 1)
gcgcaaguuagguuuugucaagaaaggguguaacgcaaccaagucauaguccgccuagaagcauuugcggug (SEQ ID NO: 34)
131개의 뉴클레오티드β-Actin-dRNA (부위 1)
gccaugccaaucucaucuuguuuucugcgcaaguuagguuuugucaagaaaggguguaacgcaaccaagucauaguccgccuagaagcauuugcgguggacgauggaggggccggacucgucauacuccug (SEQ ID NO: 35)
70개의 뉴클레오티드β-Actin-dRNA (부위 2)
ggacuuccuguaacaacgcaucucauauuuggaaugaccauuaaaaaaacaacaaugugcaaucaaaguc
(SEQ ID NO: 36)
우리는 dRNA가 부위 1과 부위 2 모두에 대해 β-액틴 mRNA를 각 부위에 대해 최대 1.4% 편집 효율로 편집할 수 있다는 것을 발견했다(도 4h 및 도 8a). 또한, 우리는 dRNA-71개의 뉴클레오티드의 경우 0.6%, dRNA-131개의 뉴클레오티드의 경우 1.4%로, 더 긴 dRNA가 더 높은 편집 효율을 제공한다는 것을 관찰했다(도 3h). 또 다른 하우스키핑 유전자 GAPDH의 경우, 71개의 뉴클레오티드 dRNA (caaggugcggcuccggcccccccccucuucaagggguccacauggcaacugugaggaggggagauucagug(SEQ ID NO: 37))를 사용했고, 편집 효율은 아마도 짧은 dRNA 길이로 기인하여 0.3%이다(도 8b).
실시예 4. 예시적인 LEAPER 방법에 대한 오프-타겟팅 분석
치료 용도를 위해서는, 편집의 정확성이 매우 중요하다. 다음으로, 우리는 본 출원의 예시적인 RNA 편집 시스템의 특이성을 특성화하고자 했다. 분석을 위해 내인성 PPIB 부위 1과 KRAS 부위를 선택했다. PPIB 부위 1의 경우, dRNA가 커버된 영역 중에, A22, A30, A33, A34, A39, A49, A80, A91, A107 및 A140과 같은 타겟팅된 A76 측면에 위치하는 수개의 A 염기가 있다는 알 수 있었다. 측면에 있는 A 염기는 거의 편집되지 않은 반면, 타겟팅된 A76 염기(A-C 미스매치)는 최대 14%의 편집 효율을 나타냈다(도 5a 및 5b).
KRAS 부위의 경우, dRNA가 커버된 영역에서 타겟팅된 A56 염기의 측면에는 다수의 아데닌, 최대 29개의 측면 A 염기가 있다는 것을 알 수 있었다. KRAS mRNA 편집 결과로부터, 우리는 타겟팅된 A56 염기(A-C 미스매치)가 최대 11.7%의 편집 효율을 나타냈지만, 측면의 아데닌은 편집될 수 있다는 것을 발견했다(도 5c 및 5d). 다양한 오프-타겟팅된 아데닌이 편집된 한편, A41, A43, A45, A46, A74, A79와 같은 아데닌은 더욱 편집되는 것이 나타났다. 우리는 미편집된 A 염기의 5' 최근접 이웃이 G 또는 C인 반면, 효율적으로 편집된 아데닌의 5' 최근접 이웃은 T 또는 A라는 것을 발견했다. 이 관찰을 기반으로, 우리는 편집하기 쉬운 아데닌의 오프-타겟 편집을 최소화하기 위한 dRNA의 설계를 시작했다. 우리의 연구에 있어서, ADAR이 A-A, A-U보다 A-C 미스매치를 선호하고, 또한 A-C 미스매치가 가장 선호되지 않는다는 것을 발견했다. 그래서, 우리는 5' 최근접 이웃이 U 또는 A인 오프-타겟팅 A 염기의 경우, A-G 미스매치가 오프-타겟팅 효과를 감소시키거나 또는 축소시킬 수 있다고 제안했다. 종래 연구에서는 A-G 미스매치가 ADAR에 의한 탈아미노화 편집을 차단할 수 있다고 보고되어 있다.
그래서, 다음으로 우리는 도 5d에 있어서의 통계적 결과 및 기존의 지식에 기반한 상이한 A-G 미스매치 조합을 포함하는 3종류의 91개의 뉴클레오티드 dRNA 변이체와 4종류의 111개의 뉴클레오티드 dRNA 변이체(이하에 표시된 바와 같은 서열을 가짐)를 설계했다: dRNA-AG1(A41, A46, A74); dRNA-AG2(A41, A43, A45, A46, A74, A79); dRNA-AG3(A31, A32, A33, A41, A43, A45, A46, A47, A74, A79); dRNA-AG4(A7, A31, A32, A33, A40, A41, A43, A45, A46, A47, A74, A79, A95)(도 4e).
KRAS-dRNA-91-AG2
UAGCUGUAUCGUCAAGGCACUCgUGCCgACGCCACCAGCUCCAACcACCACAAGgggAgAgUCAGUCAgggUCAGCAGGCCUCUCUCCCGC (SEQ ID NO: 38)
KRAS-dRNA-91-AG3
UAGCUGUAUCGUCAAGGCACUCUUGCCgACGCCACCAGCUCCAACcACCACAAGUgUAUAgUCAGUCAUUUUCAGCAGGCCUCUCUCCCGC (SEQ ID NO: 39)
KRAS-dRNA-91-AG4
UAGCUGGAUCGUCAAGGCACUCGUGCCGACGCCACCAGCUCCAACCACCACAAGGGGAGAGGCAGUCAGGGUCAGCAGGCCUCUCUCCCGC (SEQ ID NO: 40)
KRAS-dRNA-111-AG1
GAUUCUGAAUUAGCUGUAUCGUCAAGGCACUCUUGCCgACGCCACCAGCUCCAACcACCACAAGUgUAUAgUCAGUCAUUUUCAGCAGGCCUCUCUCCCGCACCUGGGAGC (SEQ ID NO:41)
KRAS-dRNA-111-AG2
GAUUCUGAAUUAGCUGUAUCGUCAAGGCACUCgUGCCgACGCCACCAGCUCCAACcACCACAAGUggAgAgUCAGUCAUUUUCAGCAGGCCUCUCUCCCGCACCUGGGAGC (SEQ ID NO:42)
KRAS-dRNA-111-AG3
GAUUCUGAAUUAGCUGUAUCGUCAAGGCACUCgUGCCgACGCCACCAGCUCCAACcACCACAAGgggAgAgUCAGUCAgggUCAGCAGGCCUCUCUCCCGCACCUGGGAGC (SEQ ID NO:43)
KRAS-dRNA-111-AG4
GCUCCCCGGUGCGGGAGAGAGGCCUGCUGACCCUGACUGCCUCUCCCCUUGUGGUGGUUGGAGCUGGUGGCGUCGGCACGAGUGCCUUGACGAUCCAGCUAAUUCAGAAUC(SEQ ID NO: 44)
그 다음, 이들 dRNA를 HEK293T 세포에 형질감염시키고, 빈 벡터 및 71개의 뉴클레오티드 비타겟팅 dRNA 대조군 : (tctcagtccaatgtatggtccgagcacaagctctaatcaaagtccgcgggtgtagaccggttgccatagga (SEQ ID NO: 45))를 음성 대조군으로 사용했다. 91개의 뉴클레오티드 dRNA의 경우, 딥 시퀀싱 결과는 A-G 미스매치가 없는 dRNA-91의 경우 온-타겟 편집(A56) 효율이 7.9%인 것(도 4f)과 비교하여, dRNA-91-AG2의 경우 온-타겟 편집(A56)이 2.8%, dRNA-91-AG3의 경우 2.3%, dRNA-91-AG4의 경우 0.7%로 감소한 것으로 나타났다. 91개의 뉴클레오티드 dRNA의 경우, 온-타겟 편집(A56) 효율이 A-G 미스매치가 없는 dRNA-111의 경우 15.1%인 것(도 4f)과 비교하여, 온-타겟 편집(A56)이 dRNA-111-AG2의 경우 5.1%, dRNA-111-AG3의 경우 4.9%로 감소하였고, 이는 dRNA가 길수록 더 많은 A-G 미스매치를 견딜 수 있다는 것을 나타낸다. 그래서, 다음으로 우리는 상세한 오프-타겟 분석을 위해 111개의 뉴클레오티드 dRNA를 선택했다. 측면에 위치하는 A 염기 편집은 A7 및 A79 이외에는 극적으로 삭제되었다(도 4g). A7 염기의 경우, 오프-타겟 효과는 현재 dRNA 설계에 없는 이 부위에서 추가 A-G 미스매치 설계에 의해 방지될 수 있다. A79 염기의 경우, 인접한 2개의 A-G 미스매치 A78/A79를 도입하면 오프-타겟 효과를 제거하는 것을 도울 수 있다. 이러한 결과를 기반으로, 본 출원의 RNA 편집 시스템을 유전 질환 치료에 적용하는 것은 매우 유망하고 고무적이다.
실시예 5. 다중 세포주에서의 예시적인 LEAPER 방법 테스트
HEK293T 세포의 결과를 통해, 우리는 선형 dRNA 및 그 타겟 RNA에 의해 형성된 이중 가닥 RNA가 A-I 편집을 위해 내인성 ADAR 단백질을 리크루팅할 수 있다고 가정했다. 가설을 확인하기 위해, 우리의 RNA 편집 방법을 테스트하기 위해 더욱 많은 세포주를 선택했다. 결과는 도 9에 도시되어 있다. 다수의 세포주에서 얻은 결과는 우리의 RNA 편집 방법의 보편성을 증명했다. 첫째, 다양한 편집 효율에도 불구하고, dRNA를 사용하여 내인성 ADAR을 리크루팅하는 것은 7개의 상이한 조직 및 기관으로부터 유래된 다수의 인간 세포주에 적합했다. 또한, 이 방법은 인간 세포뿐만 아니라 마우스 세포에서도 작용할 수 있어서, 마우스에 대한 실험의 수행 가능성을 제공한다.
실시예 6. RNA 편집을 위한 내인성 ADAR 활용
효율적인 RNA 편집 플랫폼을 탐색하기 위해, 우리는 과활성 E1008Q 돌연변이 ADAR1(ADAR1DD)40의 탈아미노효소 도메인을 RNA 가이드된 RNA-타겟팅 CRISPR 이펙터41 인 촉매 비활성 LbuCas13(dCas13a)에 융합했다(도 10a). RNA 편집 효율을 평가하기 위해, 우리는 3×GGGGS 코딩 영역과 인프레임 UAG 정지 코돈을 포함하는 서열에 의해 연결된 mCherry 및 EGFP 유전자를 보유하는 대리(surrogate) 리포터를 구축했다(리포터-1, 도 10b). 리포터-형질감염된 세포는 mCherry 단백질만을 발현한 반면, 리포터 전사물의 UAG에 대한 타겟팅 편집은 정지 코돈을 UIG로 변환하여, 결과적으로 하류 EGFP 발현을 허용한다. 이러한 리포터는 EGFP 레벨의 모니터링을 통해 A에서 I로의 편집 효율을 측정하는 것을 가능하게 한다. 그 다음, 우리는 Cas13a 인식 대상인 5' 스캐폴드를 함유하는 hU6 프로모터 구동 crRNA(CRISPR RNA)와 타겟팅을 위한 다양한 길이의 스페이서 서열(crRNACas13a, LbuCas13 crRNA 서열을 따름)을 설계했다.
LbuCas13 crRNA 서열
명칭 서열 출처
LbuCas13/Cas13a crRNA 스캐폴드 ggaccaccccaaaaaugaaggggacuaaaac
(SEQ ID NO: 46)
도 10
대조군 crRNA70 aaaccgagggaucauaggggacugaauccaccauucuucucccaaucccugcaacuccuucuuccccugc
(SEQ ID NO: 47)
도 10
crRNA15 의 스페이서 gcagagccucCagc
(SEQ ID NO: 48)
도 10
crRNA22 의 스페이서 cucacuggcagagccucCagc
(SEQ ID NO: 49)
도 10
crRNA28 의 스페이서 cccuugcucacuggcagagccucCagc
(SEQ ID NO: 50)
도 10
crRNA35 의 스페이서 cucucgcccuugcucacuggcagagccucCagc
(SEQ ID NO: 51)
도 10
crRNA40 의 스페이서 cucucgcccuugcucacuggcagagccucCagcaucgc
(SEQ ID NO: 52)
도 10
crRNA47 의 스페이서 ugaacagcucucgcccuugcucacuggcagagccucCagcaucgc
(SEQ ID NO: 53)
도 10
crRNA70 의 스페이서 ugaacagcuccucgcccuugcucacuggcagagcccucCagcaucgcgagcaggcgcugccuccuccgcc
(SEQ ID NO: 54)
도 10
타겟 전사물에 상보적인 서열은 모두 A-C 미스매치 부위에서 아데노신 탈아미노화가 우선적으로 발생13, 14하기 때문에, 아데노신(A)과 미스페어링하는 시티딘(C)을 도입하기 위해 UAG 코돈의 반대쪽에 CCA를 포함한다. crRNA의 최적 길이를 테스트하기 위해, 상이한 길이의 비타겟팅 또는 타겟팅 crRNA를 리포터-1이 안정적으로 발현하는 HEK293T 세포에서 dCas13a-ADAR1DD 단백질과 공동 발현시켰다. EGFP 발현의 출현에 의해 표시된 분명한 RNA 편집 효과는 적어도 40개의 뉴클레오티드 길이의 매칭 서열을 포함하는 crRNA를 이용하여 관찰되었으며, crRNA가 길수록 EGFP 양성 백분율이 높았다(도 10c). 놀랍게도, 긴 crRNACas13a 단독의 발현은 EGFP 발현을 활성화하기에 충분한 것으로 나타났고, dCas13a-ADAR1DD의 공동 발현은 오히려 crRNA 활성을 감소시켰다(도 10c, 10d). 70개의 뉴클레오티드(길이 계산을 위해 5'스캐폴드 제외) 대조군 RNA가 EGFP 발현을 활성화시킬 수 없었기 때문에 EGFP 발현은 명백히 서열 의존적이었다(도 10c, 10d).소정의 긴 조작된 crRNACas13a가 dCas13a-ADAR1DD에 독립적인 RNA 편집을 가능하게 한다는 놀라운 발견으로, 우리는 crRNA로부터 Cas13a-리크루팅 스캐폴드 서열을 제거하기로 결정했다. crRNA70은 EGFP 발현을 유발하는 가장 높은 활성을 가졌기 때문에(도 10c, 10d), 추가 테스트를 위해 Cas13a-리크루팅 스캐폴드가 없는 동일한 70개의 뉴클레오티드 길이의 가이드 RNA를 선택했다(도 11a 및 실시예에서 사용된 표 3의 arRNA 및 대조군 RNA의 서열).
Figure pct00008
Figure pct00009
Figure pct00010
Figure pct00011
Figure pct00012
Figure pct00013
이 선형 가이드 RNA는 리포터-1을 보유하는 전체 세포의 40% 근접하여 강력한 EGFP 발현을 유도한 것으로 밝혀졌다(도 11b, 상부). 내인성 ADAR 단백질이 이중 가닥 RNA(dsRNA) 기질12을 편집할 수 있기 때문에, 우리는 긴 가이드 RNA가 dsRNA 기질을 형성하도록 타겟 전사물과 어닐링할 수 있고, 결과적으로 타겟팅된 편집을 위해 내인성 ADAR 단백질을 리크루팅한다고 추론했다. 따라서, 우리는 그러한 가이드 RNA를 arRNA(ADAR-리크루팅 RNA)로 지정했다.
내인성 ADAR 단백질이 실제로 상기 관찰의 원인이 되는지를 확인하기 위해, ADAR 결핍 세포에서 arRNA 매개 RNA 편집을 조사하기 시작했다. ADAR2 mRNA는 HEK293T 세포에서 거의 검출되지 않았기 때문에(도 12a), 우리는 HEK293T ADAR1-/- 세포를 생성하여, ADAR1과 ADAR2 모두에서 이 세포주가 결핍되도록 했다(도 11c, d). 실제로, ADAR1의 고갈은 arRNA70에 의해 유도된 EGFP 신호를 제거했다(도 11b, 하부). 더욱이, HEK293T ADAR1-/- 세포에서의 ADAR1p110, ADAR1p150 또는 ADAR2의 외인성 발현(도 11c, d)은 arRNA70(도 11e, 도 12b)에 의한 EGFP 유도 손실을 성공적으로 구제한 바, arRNA-유도된 EGFP 리포터 발현은 이소폼(p110 및 p150) 또는 ADAR2에 의해 활성이 재구축될 수 있는 네이티브 ADAR1에만 의존했다는 것을 입증했다. arRNA70-타겟팅 영역에 대한 생어 시퀀싱 분석은 유의한 A에서 I(G)로의 전환(도 11f)을 표시하는, UAG 이내에서의 예측된 아데노신 부위에서 A/G 중첩 피크를 나타냈다. 차세대 시퀀싱(NGS)은 A에서 I로의 전환이 전체 리포터 전사물의 약 13%임을 더 확인했다(도 11g). 정량적 PCR 분석은 arRNA의 가능한 RNAi 효과를 제외하고는 arRNA70이 타겟팅된 전사물의 발현을 감소시키지 않았다는 것을 나타냈다(도 13). 종합적으로, 우리의 데이터는 arRNA가 조작된 A-C 미스매치를 통해 타겟팅된 전사물에 대해 상당한 수준의 편집을 생성할 수 있다는 것을 입증했다.
실시예 7. 다중 세포주에서 RNA 편집을 가능하게 하는 LEAPER
내인성 ADAR 단백질의 발현은 LEAPER 매개 RNA 편집의 전제 조건이기 때문에, 우리는 HT29, A549, HepG2, RD, SF268, SW13 및 HeLa를 포함한 별개의 조직으로부터 유래된 세포주의 패널에서 LEAPER의 성능을 테스트했다. 우선, 웨스턴 블롯팅 분석을 사용하여 3종류의 ADAR 단백질 모두의 내인성 발현을 조사했다. ADAR1은 모든 시험된 세포주에서 고도로 발현되었으며, 웨스턴 블롯에서의 그 동일성은 음성 대조군인 HEK293T ADAR1-/- 라인에 의해 확인되었다(도 14a, b). ADAR3은 HepG2 및 HeLa 세포에서만 검출되었다(도 14a, b). ADAR2는 어느 세포에서도 검출이 불가능했고, 이 결과는 ADAR2 단백질은 ADAR2 과발현 HEK293T 세포로부터 검출될 수 있었기 때문에, 웨스턴 블로팅의 실패에 기인하는 것은 아니었다(도 14a, b). 이러한 발견은 ADAR1은 보편적으로 발현하는 반면, ADAR2 및 ADAR3의 발현은 특정 조직으로 제한된다는11 이전의 보고와 일치한다.
그 다음, 이들 세포주에서 리포터-1을 타겟팅하는 재설계된 71개의 뉴클레오티드 arRNA(arRNA71)의 편집 효율을 테스트하기 시작했다(도 15a 및 본 연구에서 사용된 arRNA 및 대조군 RNA의 서열은 상기 열거되어 있음).
LEAPER는 이 arRNA71에 대한 모든 테스트된 세포에 있어서 작용했지만, 효과는 다양했다(도 14c). 이들 결과는 HepG2 및 HeLa 세포를 제외하고는 ADAR1/2 단백질 수준이 RNA 편집 수율과 상관관계가 있다42는 이전 보고와 일치했다. ADAR1 수준과 편집 효율의 최적이 아닌 상관관계는 ADAR3이 RNA 편집에서 억제적 역할을 한다고 보고되어 있기 때문에 이들 두 라인에서 풍부한 ADAR3 발현(도 14a, b)에 기인한 것으로 보였다. 중요한 것은, LEAPER가 마우스 유래의 3개의 상이한 세포주(NIH3T3, 마우스 배아 섬유아세포(MEF) 및 B16)에도 작용하여(도 14d), 동물 및 질환 모델을 통해 치료 잠재력을 테스트할 수 있는 길을 열었다. 종합적으로, 우리는 LEAPER가 다양한 세포 유형과 다양한 유기체를 위한 다목적 도구라는 결론을 내렸다.
실시예 8. LEAPER의 특성화 및 최적화
LEAPER를 더욱 잘 특성화하고 최적화하기 위해, 타겟팅된 전사물의 UAG 삼중항 내에서 아데노신 반대쪽에 있는 뉴클레오티드의 선택을 조사했다. HEK293T 세포에 있어서, 리포터-1-타겟팅 arRNA71은 가변적 편집 효율을 나타냈고, 변화된 삼중항(5'-CNA, N은 A/U/C/G 중 하나를 나타냄)은 타겟팅된 UAG(본 연구에 사용된 arRNA 및 대조군 RNA의 서열은 상기에 열거되어 있음) 반대쪽에 있다. A-C 미스매치에 의해 가장 높은 편집 효율이 얻어졌고, 또한 A-G 미스매치는 가장 적지만 명백한 편집을 산출했다(도 16a). 그 다음, arRNA에서 A-C 미스매치 측면에 있는 뉴클레오티드의 선호도를 조사했다. 우리는 시티딘(5'-N1CN2)을 둘러싼 5' 및 3' 이웃 부위의 16개의 조합을 모두 테스트했고(본 연구에서 사용된 arRNA 및 대조군 RNA의 서열은 상기에 열거되어 있음), 3' 이웃 아데노신은 효율적인 편집을 위해 필요로 되는 반면, 아데노신은 5' 부위에서 가장 바람직하지 않은 뉴클레오티드이다(도 16b, c). 따라서, 우리는 arRNA의 CCA 모티프가 UAG 부위를 타겟팅하는 가장 높은 편집 효율을 제공한다는 결론을 내렸다. arRNA에서의 3' 이웃 구아노신(5'-N1CG)이 극적인 억제 효과를 나타냈다는 점에 주목할 가치가 있다(도 16b, c).
RNA의 길이는 타겟팅된 전사물에 대한 편집을 지시할 때 arRNA 효율과 관련이 있는 것으로 나타났고(도 10c), 이는 이전 보고42와 일치한다. 이 효과를 완전히 이해하기 위해, 2개의 상이한 리포터 전사물 - 리포터-1 및 리포터-2를 타겟팅하는 가변 길이의 arRNA를 테스트했다(도 15a, b). 둘 중 하나의 리포터를 타겟팅하기 위해, 31개의 뉴클레오티드-211개의 뉴클레오티드 범위에서 10개의 상이한 크기의 arRNA를 정가운데에 CCA 삼중항(UAG 타겟팅용)을 갖게 설계하고 테스트했다(본 연구에 사용된 arRNA 및 대조군 RNA의 서열은 상기에 열거되어 있음). 리포터 EGFP 활성을 기반으로, arRNA의 길이는 2개의 리포터 모두에 대해 편집 효율과 양의 상관 관계를 가졌으며, 111개의 뉴클레오티드-191개의 뉴클레오티드에서 피크에 달했다(도 16d). 하나의 arRNA51이 작용하는 것으로 보였지만, arRNA에 대해 71개의 뉴클레오티드가 최소 길이이어서 2개의 리포터 모두에 작용하였다(도 16d).
다음으로, 우리는 편집 효율에 대한 arRNA 내에서의 A-C 미스매치 위치의 효과를 검토했다. 테스트를 위한 모든 arRNA의 길이를 71개의 뉴클레오티드로 고정하고, arRNA 내에서 UAG-타겟팅 ACC 삼중항을 5'로부터 3'로 슬라이딩했다(본 연구에 사용된 arRNA 및 대조군 RNA의 서열은 상기에 나열되어 있음). A-C 미스매치를 중간 영역에 배치하면 편집 수율이 높아지고, 미스매치 부위를 3' 말단에 근접하여 갖는 arRNA가 양 리포터 모두에서 5' 말단에 근접하여 갖는 것보다 더 나은 결과를 내는 것으로 나타났다(도 16e). 편의를 위해, 우리는 모든 후속 연구에서 A-C 미스매치를 arRNA의 중심에 배치했다.
또한, 우리는 LEAPER의 타겟팅 유연성을 테스트하고, 타겟의 UAG가 RNA 편집되는 유일한 모티프인지의 여부를 확인하고자 했다. 리포터-3에 대한 모든 16개의 삼중항 조합(5'-N1AN2)(도 15c)에 대해, 우리는 고정된 길이(111개의 뉴클레오티드)를 갖는 대응하는 arRNA를 사용하고, 편집 부위(AC 미스매치)를 제외하고는 arRNA 및 리포터에 대한 완벽한 시퀀싱 일치를 보장했다(도 16f 및 본 연구에 사용된 arRNA 및 대조군 RNA의 서열은 상기에 열거됨). NGS 결과는 모든 N1AN2 모티프는 편집될 수 있음을 나타냈다. UAN2와 GAN2는 각각 가장 바람직한 모티프이고 가장 바람직하지 않은 모티프이다(도 16f, g). 종합적으로, 타겟 아데노신의 최근접 이웃 선호도는 5' U>C≒A>G 및 3' G>C>A≒U이다(도 16g).
실시예 9. LEAPER를 사용하여 내인성 전사물의 편집
다음으로, 우리는 LEAPER가 내인성 전사물을 효과적으로 편집할 수 있는지를 조사했다. 길이가 상이한 arRNA를 사용하여, PPIB, KRAS 및 SMAD4 유전자의 전사물에 있어서의 UAG 모티프, 및 FANCC 유전자 전사물에 있어서의 UAC 모티프를 타겟팅했다(도 17a, 본 연구에 사용된 arRNA 및 대조군 RNA의 서열은 상기에 열거됨). 고무적으로, NGS 결과에 따르면 가변적 효율이기는 하지만, 4개의 전사물 모두에 있어서 타겟팅된 아데노신 부위를 모두 4개의 크기를 갖는 그 대응하는 arRNA에 의해 편집했다(도 17b). 이전 관찰과 부합하여, arRNA가 길수록 더 높은 편집률을 산출하는 경향이 있다. 참고로, 151개의 뉴클레오티드 arRNAPPIB는 PPIB 유전자의 전체 전사물 중∼50%를 편집했다(도 17b). 어떠한 arRNA도 타겟팅된 전사물(도 18a) 또는 최종의 단백질 수준(예를 들면 KRAS, 도 18b)에 대해 RNAi 효과를 나타내지 않았다. 게다가, LEAPER는 비 UAN 부위에 대해 바람직한 편집률을 달성할 수 있으며(도 17c 및 본 연구에 사용된 arRNA 및 대조군 RNA의 서열은 상기에 나열되어 있음), 내인성 전사물의 편집에 대해 LEAPER의 유연성을 나타낸다. LEAPER의 능력을 더 자세히 알아보기 위해, 우리는 여러 부위를 동시에 타겟팅할 수 있는지의 여부를 테스트했다. 우리는 개별 arRNA를 사용한 것보다 훨씬 높은 효율을 가진 2개의 arRNA(본 연구에서 사용된 arRNA 및 대조군 RNA의 서열은 상기 나열되어 있음)의 동시 발현에 의해 TARDBP 및 FANCC 전사물의 다중 편집을 관찰한 바(도 17d), LEAPER는 다수의 타겟을 동시에 편집하는데 매우 적합한 것으로 나타났다.
ADAR1/2는 RNA 이중체44에서 다중 아데노신을 무차별적으로 탈아미노화하는 경향이 있으며, A-C 미스매치는 A에서 I로의 스위치를 안내하는 유일한 모티프가 아니라는 것(도 16a)을 주목해야 한다. 따라서, arRNA 커버리지 내의 타겟 전사물의 모든 아데노신은 의도하지 않는 변형의 주요 근원인 다양한 수준의 편집이 가해진다고 가정하는 것이 합리적이다. arRNA가 길수록 이러한 오프-타겟의 가능성은 높아진다. 따라서, 우리는 이들 타겟팅된 전사물에서의 arRNA 커버링 영역 내의 모든 아데노신 부위를 조사했다. PPIB 전사물의 경우, 다양한 크기의 arRNA에 대한 시퀀싱 창 전체에 걸쳐 오프-타겟 편집이 거의 관찰되지 않았다(도 17e, f). 그러나, KRAS, SMAD4 및 FANCC 유전자를 타겟팅하는 경우에는, 다수의 오프-타겟 편집이 검출되었다(도 19a-f). 특히 KRAS의 경우, 30개의 아데노신 중 11개가 arRNA111의 시퀀싱 창에서 상당한 A에서 I로의 전환을 겪었다(도 19a, b).
우리는 다음으로 이러한 의도하지 않는 오프-타겟 효과를 최소화하기 위한 전략을 개발하고자 시도했다. 우리는, A-G 미스매치가 UAG 타겟팅에 대한 편집을 억제했기 때문에(도 16a), 구아노신과 비타겟팅 아데노신을 페어링하면 바람직하지 않은 편집을 감소시킬 수 있다고 가정했다. 그 다음, 우리는 리포터-3에서와 같이 가능한 모든 삼중항 조합(5'-N1AN2)에서 A-G 미스매치가 아데노신에 미치는 영향을 테스트했다(도 15c 및 본 연구에 사용된 arRNA 및 대조군 RNA의 서열은 상기에 열거됨). A-G 미스매치는 실제로 A-C 미스매치(도 16f)와 비교하여 UAG 또는 AAG 타겟팅(~2%)을 제외한 모든 테스트된 타겟에서 아데노신에 대한 편집을 감소시켰다(도 17g). 의도하지 않는 부위의 편집률을 더욱 감소시키기 위해, 우리는 2회의 연속한 미스매치 효과를 테스트했다. UAG 또는 AAG의 반대쪽에 있는 삼중항의 3' 말단 뉴클레오티드에서의 추가 미스매치가 그 대응하는 아데노신 편집을 폐지한 것으로 판명되었다(도 17h 및 본 연구에 사용된 arRNA 및 대조군 RNA의 서열은 상기에 열거됨). 이들 발견을 고려하여, 우리는 KRAS 전사물에서 오프-타겟을 줄이기 위해 이 규칙을 적용하고자 시도했다(도 19a). 우선, 우리는 AAU(61번째), UAU(63번째), UAA(65번째), AAA(66번째), UAG(94번째) 및 AAG(99번째)를 포함하여, arRNA111(도 17i, 도 19a 및 본 연구에 사용된 arRNA 및 대조군 RNA의 서열은 상기에 열거됨)에 의해 커버된 모든 "편집하기 쉬운" 모티프에 대해 A-G 미스매치를 생성한 arRNA(arRNA111-AG6)를 설계했다. 이 arRNA111-AG6은 ~5%의 온-타겟 편집률을 유지하면서 대부분의 오프-타겟 편집을 제거했다. 도 17g의 결과와 일치하여, 단일 A-G 미스매치는 AAG 모티프(99번째)에서 편집을 완전히 최소화할 수 없었다(도 17i 및 도 19a). 그 다음, 우리는 이중 미스매치(타겟팅된 모티프 5'-AAG의 반대쪽에 있는 5'-CGG)를 포함하여 arRNA111-AG6에 대해 더 많은 미스매치를 추가했고, 또한 27번째, 98번째 및 115번째 아데노신(arRNA111-AG9)(본 연구에 사용된 arRNA 및 대조군 RNA의 서열은 상기에 열거되어 있음)에 대한 편집을 완화하기 위해 3개의 추가 A-G 미스매치를 추가했다. 결과적으로, 우리는 타겟팅된 부위(A76)에 대한 편집률을 더 상실하지 않고 편집에 대해 훨씬 향상된 특이성을 달성했다(도 17i). 요약하면, 추가 규칙을 통합한 조작된 LEAPER는 내인성 전사물에 대해 효율적이고 더욱 정확한 RNA 편집을 가능하게 한다.
실시예 10. LEAPER의 RNA 편집 특이성
arRNA 커버된 dsRNA 영역 내에서 가능한 오프-타겟 효과에 추가하여, 우리는 arRNA의 부분 염기 쌍을 통해 다른 전사물에 대한 잠재적인 오프-타겟 효과에 대해서도 고려했다. 그 다음, 우리는 LEAPER의 글로벌 오프-타겟 효과를 평가하기 위해 전장 전사체 RNA-시퀀싱 분석을 수행했다. RNA-seq 분석을 행하기 전에 세포를 대조군 RNA151 또는 PPIB-특이적 arRNA(arRNA151-PPIB) 발현 플라스미드로 형질감염시켰다. 우리는 대조군 RNA151(도 20a)에서 6개 및 arRNA151-PPIB 군에서 5개(도 20b)의 잠재적인 오프-타겟을 확인했으며, NGS 분석에 기반한 PPIB 온-타겟 비율은 ∼37%였다(도 20b). 추가 분석에 따르면, EIF2AK2 전사물의 2개의 부위를 제외한 모든 부위가 SINE(Alu) 또는 LINE 영역(도 20a, b)에 위치하고, 둘 다 ADAR 매개 편집45 하기 쉬운 것으로 나타났으며, 이는 이들 오프 타겟이 타겟 전사물과 arRNA 또는 대조군 RNA 사이의 페어링으로부터 유래되지 않을 수 있다는 것을 시사한다. 중요한 것은, 양 군 모두에서 2개의 오프-타겟팅 전사물인 WDR73과 SMYD4가 나타났으며, 이는 이들이 서열 의존적 RNA 편집할 가능성은 낮다는 것을 시사한다. 실제로, 최소 자유 에너지 분석은 모든 이들 가능한 오프-타겟 전사물이 대조군 RNA151 또는 arRNA151-PPIB 중 하나를 사용하여 안정한 이중체를 형성하지 못했음을 시사했다(도 20c). arRNA가 서열 의존적 오프-타겟을 생성하는지 추가 테스트하기 위해, arRNA151-PPIB 및 arRNA111-FANCC 모두에 대해 NCBI BLAST를 사용하여 서열 유사성을 비교함으로써 잠재적인 오프-타겟 부위를 선택했다. arRNA151-PPIB에 대한 TRAPPC12 전사물과 arRNA111-FANCC에 대한 ST3GAL1, OSTM1-AS1 및 EHD2 전사물에 있어서의 3개 부위가 유력한 후보였다(도 20d 및 도 21a). NGS 분석은 이들 예측된 오프-타겟 부위의 어디에서도 편집이 검출되지 않았음이 나타났다(도 20d 및 도 21b). 이들 결과는 LEAPER가 타겟팅된 부위에서 효율적인 편집을 가능하게 하는 동시에, 검출 가능한 서열 의존적 오프-타겟 편집없이, 전사체 전체의 특이성을 유지할 수 있게 하는 것을 나타낸다.
실시예 11. 포유류 세포에서의 LEAPER의 안전성 평가
arRNA는 타겟 전사물에 대한 편집을 위해 내인성 ADAR 단백질에 의존하기 때문에, 우리는 외인성 arRNA의 추가가 너무 많은 ADAR1 또는 ADAR2 단백질을 차지함으로써 네이티브 RNA 편집 이벤트에 영향을 미치는 것이 아닌지 생각했다. 따라서, 우리는 전장 전사체 RNA-시퀀싱 결과로부터 모조와 arRNA151-PPIB 군이 공유한 A에서 I로의 RNA 편집 부위를 분석하고, 모조와 대조군 RNA151 간의 비교도 분석했다. RNA151 대조군과 arRNA151-PPIB 군은 모두 모조와 비교하여 유의한 차이를 보이지 않았으며(도 22a, b), 이는 LEAPER가 네이티브 A에서 I로의 편집 이벤트를 촉진시키는 내인성 ADAR1의 정상적인 기능에 거의 영향을 미치지 않는다는 것을 나타낸다.
한편, 우리는 arRNA가 글로벌 유전자 발현에 영향을 미치는지 확인하기 위해 RNA-seq 데이터를 이용하여 차등 유전자 발현 분석을 수행했다. 우리는 대조군 RNA151과 arRNA151-PPIB 모두 모조와 비교하여 글로벌 유전자 발현에 영향을 미치지 않음을 발견했다(도 22c, d). 우리의 이전 관찰(도 18a)과 일치하여, arRNA는 PPIB의 발현에 어떤 RNAi 효과도 나타내지 않았다(도 22c, d).
arRNA가 타겟 전사물과 RNA 이중체를 형성하고, 또한 RNA 이중체가 선천성 면역 반응을 유도할 수 있다는 점을 고려하여, arRNA의 도입이 그러한 효과가 있는지 조사했다. 이를 테스트하기 위해, 유효한 것으로 입증된 4개의 유전자 전사물을 타겟팅하는 arRNA를 선택했다. 우리는 선천성 면역 활성화의 두 가지 특징인 인터페론-β(IFN-β)(도 22e) 또는 인터루킨-6(IL-6)(도 22f)의 어떤 mRNA 유도도 관찰되지 않았다. 양성 대조군으로서, 이중 가닥 RNA-폴리(I:C)의 합성 유사체는 강력한 IFN-β 및 IL-6 발현을 유도했다(도 22e, f). LEAPER는 안전한 치료제에 중요한 기능인 타겟 세포에서 면역원성을 유도하지 않는 것으로 보인다.
실시예 12. LEAPER에 의한 p53의 전사 조절 활성의 복원
이제 우리는 외래 단백질을 도입할 필요없이 RNA 편집의 새로운 방법을 확립 했으므로, 그 치료적 유용성을 입증하려고 시도했다. 우리는 우선 세포 항상성 유지에 중요한 역할을 하는 것으로 알려져 있지만, 인간 암의 >50%에서 빈번히 돌연변이를 겪는46 종양 억제 유전자 TP53을 타겟으로 했다. TP53에서의 c.158G>A 돌연변이는 임상적으로 관련된 넌센스 돌연변이(Trp53Ter)이며, 이것에 의해 비기능적 절단된 단백질46로 되게 된다. 우리는 모두 TP53W53X 전사물을 타겟팅하는(도 23a) 하나의 arRNA111과 2개의 대체적 arRNA(arRNA111-AG1 및 arRNA111-AG4)(본 연구에 사용된 arRNA 및 대조군 RNA의 서열은 상기에 열거되어 있음)를 설계했으며, 후자의 2개는 잠재적인 오프-타겟을 최소화하도록 설계되었다. 우리는 네이티브 p53 단백질의 효과를 제거하기 위해 HEK293T TP53-/- 세포주를 생성했다. TP53W53X 타겟팅 arRNA의 3개의 형태 모두는 arRNA111-AG1 및 arRNA111-AG4에 대한 의도하지 않는 편집의 가변적 감소(도 24)와 함께, 돌연변이된 아데노신 부위에서 TP53W53X 전사체의 25-35%가 전환되었다(도 23b). 웨스턴 블롯은 arRNA111, arRNA111-AG1 및 arRNA111-AG4가 모두 HEK293T TP53-/- 세포에서의 TP53W53X 전사물을 기반으로 한 전장 p53의 단백질의 생산을 모두 구제할 수 있는 반면, 대조군 RNA111은 할 수 없는 것으로 나타났다(도 23c).
복구된 p53 단백질이 완전히 기능하는지를 확인하기 위해, p53-루시페라아제 cis-리포팅 시스템47, 48을 사용하여 p53의 전사 조절 활성을 테스트했다. 세 가지 버전의 arRNA 모두 p53 활성을 복원할 수 있으며, 최적화된 버전 arRNA111-AG1이 가장 잘 수행했다(도 23d). 결론적으로, 우리는 LEAPER가 TP53의 암 관련 조기 중지 코돈을 복구하고, 그 기능을 복원할 수 있음을 입증했다.
실시예 13. LEAPER에 의한 병원성 돌연변이의 교정
우리는 LEAPER가 더 많은 병원성 돌연변이를 교정하는 데 사용될 수 있는지의 여부를 조사했다. 엘러스-단로스 증후군의 COL3A1, 1차 폐고혈압증의 BMPR2, 주버트 증후군의 AHI1, 판코니 빈혈의 FANCC, 1차 가족성 비대 심근병증의 MYBPC3 및 X-염색체 연관 중증복합면역결핍증의 IL2RG의 6개의 병원성 유전자로부터의 임상적으로 관련된 돌연변이를 목표로, 우리는 대응하는 병원성 G>A 돌연변이를 담지하는 이들 각각의 유전자를 위한 111개의 뉴클레오티드 arRNA를 설계했다(도 25 및 본 연구에 사용된 arRNA 및 대조군 RNA의 서열이 상기 나열되어 있고, 또한 본 연구에서 다음의 질환 관련 cDNA가 표 4에 나타내어짐).
본 연구에 사용된 질환 관련 cDNA
후보 질환 돌연변이 아데노신
NM_000090.3 (COL3A1) 엘러스-단로스 증후군, 4형 c.3833G>A (p.Trp1278Ter)
NM_001204.6 (BMPR2) 1차 폐고혈압증 c.893G>A (p.Trp298Ter)
NM_017651.4 (AHI1) 주버트 증후군 3 c.2174G>A (p.Trp725Ter)
NM_000136.2 (FANCC) 판코니 빈혈, 상보군C c.1517G>A (p.Trp506Ter)
NM_000256.3 (MYBPC3) 1차 가족성 비대심근병증 c.3293G>A (p.Trp1098Ter)
NM_000206.2 (IL2RG) X염색체 관련 중증복합면역결핍증 c.710G>A (p.Trp237Ter)
HEK293T 세포에서 arRNA/cDNA 쌍을 공동 발현함으로써, 우리는 모든 테스트에서 A>G 보정을 이용하여 상당한 양의 타겟 전사물을 확인했다(도 24). G>A 돌연변이는 인간에 있어서 알려진 질환 유발 점 돌연변이의 거의 절반을 차지하기10, 49 때문에, LEAPER에 의한 A>G 변환은 치료제에 엄청난 기회를 제공할 수 있다.
실시예 14. LEAPER에 의한 다중의 인간 1차 세포에서의 RNA 편집
LEAPER의 임상적 유용성을 더 탐구하기 위해, 우리는 다중의 인간 1차 세포에서 방법을 테스트하기 시작했다. 우선, 우리는 리포터-1을 편집하기 위해 151개의 뉴클레오티드 arRNA(본 연구에서 사용된 arRNA 및 대조군 RNA의 서열은 상기에 열거됨)를 사용하여 인간 1차 폐 섬유아세포 및 인간 1차 기관지 상피 세포에서 LEAPER를 테스트했다(도 15a). EGFP 양성 세포의 35-45%는 양방의 인간 1차 세포 모두에서 LEAPER에 의해 얻어질 수 있었다(도 27a). 그 다음, 우리는 이 두 가지 1차 세포와 인간 1차 T 세포에서 내인성 유전자 PPIB를 편집하는데에 있어서 LEAPER를 테스트했으며, arRNA151-PPIB가 1차 인간 1차 폐 섬유아세포, 기관지 상피 세포(도 27b) 및 일차 T 세포(도 27c)에서 편집률의 >40%, >80% 및 >30%를 각각 달성할 수 있다는 것을 발견했다. 인간 1차 세포에서의 LEAPER의 높은 편집 효율은 특히 치료제에서의 잠재적인 용도에 고무적이다.
실시예 15. 렌티바이러스 발현 및 arRNA의 화학적 합성에 의한 효율적인 편집
그 다음, 우리는 LEAPER가 더욱 임상적으로 관련된 방법에 의해 전달될 수 있는지 조사했다. 우선, 렌티바이러스계 발현을 통해 arRNA의 효과를 테스트했다. 리포터-1 타겟팅 arRNA151은 감염 2일 후(dpi) HEK293T 세포에서 리포터-1을 보유한 전체 세포의 40%를 초과해서 강력한 EGFP 발현을 유도했다. 8dpi에서, EGFP 비율은∼38%에 필적하는 수준으로 유지된 바(도 28a 및 본 연구에 사용된 arRNA 및 대조군 RNA의 서열은 상기에 열거됨), LEAPER는 지속적인 투여가 필요한 치료제에 맞추어질 수 있음을 시사한다. 네이티브 유전자 편집을 위해, 우리는 HEK293T 세포에서 렌티바이러스의 형질도입을 통해 PPIB-타겟팅 arRNA151을 전달했고, 6dpi에서 6% 이상의 타겟 편집률이 관찰되었다(도 28b).
다음으로, 우리는 합성된 arRNA 올리고뉴클레오티드와 LEAPER에 대한 전기천공 전달 방법을 테스트했다. PPIB 전사물을 타겟팅하는 111개의 뉴클레오티드 arRNA와 대조군 RNA는 arRNA의 처음 3개 및 마지막 3개의 뉴클레오티드에서 2'-O-메틸 및 포스포로티오에이트 연결 수식으로 화학적으로 합성되었다(도 28c). 전기천공을 통해 T 세포에 도입된 후, arRNA111-PPIB 올리고는 PPIB 전사물에 대해 ∼20%의 편집을 달성한 바(도 28d), LEAPER가 올리고뉴클레오티드 약물 개발에 대한 가능성을 갖고 있음을 나타낸다.
실시예 16. LEAPER에 의한 헐러 증후군 환자 유래의 1차 섬유아세포에서의 α-L-아이두로니데이스 활성의 복원
마지막으로, 우리는 뮤코다당류의 분해에 책임이 있는 리소좀 대사 효소인 α-L-아이두로니데이스(IDUA)의 결핍으로 인한 점액 다당류증 I형(MPS I)의 가장 심각한 아형인 단일 유전 질환-헐러 증후군 치료50에서 LEAPER의 잠재력을 조사했다. 우리는 원래 헐러 증후군 환자로부터 단리된 1차 섬유아세포 GM06214를 선택했다. GM06214 세포는 IDUA 유전자의 엑손 9에서의 동형 접합성 TGG>TAG 돌연변이를 포함함으로써, 단백질에서 Trp402Ter 돌연변이로 된다. 우리는 IDUA의 성숙한 mRNA와 pre-mRNA를 각각 타겟팅하는(도 29a 및 본 연구에 사용된 arRNA 및 대조군 RNA의 서열은 상기에 열거됨), 화학적 수식을 갖는 합성된 RNA 올리고뉴클레오티드에 의해, arRNA111-IDUA-V1 및 arRNA111-IDUA-V2의 두 가지 버전의 arRNA를 설계했다. arRNA111-IDUA-V1 또는 arRNA111-IDUA-V2를 전기천공을 통해 GM06214 세포에 도입한 후, 우리는 NGS 분석을 통해 타겟팅된 RNA 편집률 및 다른 시점에서 4-MU-α-L-아이두로니데이스 기질을 사용하여 α-L-아이두로니데이스의 촉매 활성을 측정했다. arRNA111-IDUA-V1 및 arRNA111-IDUA-V2 모두가 전기천공 후 시간에 따라 IDUA 결핍 GM06214 세포에서 IDUA 촉매 활성을 점진적으로 현저히 복원되었으며, 또한 arRNA111-IDUA-V2는 arRNA111-IDUA-V1보다 훨씬 우수하게 수행한 반면, α-L-아이두로니데이스 활성은 3개의 대조군에서 검출되지 않았다(도 29b).
LEAPER에 의해 GM06214에서 복원된 IDUA 활성이 헐러 증후군을 완화하는 정도를 더 평가하기 위해, 우리는 IDUA 유전자에 대한 이형 접합성 유전자형으로 인한 잔류 IDUA 활성으로 인하여 헐러 증후군보다 훨씬 더 가벼운 MPS I의 아형인 샤이에 증후군 환자로부터 또 다른 1차 섬유아세포인 GM01323 세포에서의 IDUA 활성을 조사했다. 우리는 arRNA111-IDUA-V2를 보유하는 GM06214 세포에 있어서의 IDUA의 촉매 활성이 전기천공 48시간 후 GM01323 세포보다 더 높다는 것을 발견했다(도 29b). 이러한 결과와 일치하여, NGS 분석은 arRNA111-IDUA-V2가 A에서 I로의 편집 중 거의 30%를 전환한 것으로, arRNA111-IDUA-V1보다 훨씬 높은 비율을 나타냈다(도 29c). 추가 분석 결과, IDUA 전사물의 arRNA 커버된 영역 내에서 최소한의 의도하지 않은 편집이 검출된 것으로 나타났다(도 29d). 중요한 것은, LEAPER는 양성 대조군 역할을 하는 RNA 이중체 폴리(I:C)와 달리 arRNA111-IDUA-V1도 arRNA111-IDUA-V2도 I형 인터페론 및 전염증성 반응에 관련된 유전자 패널의 발현을 유도하지 않는다는 것을 입증한 바와 같이, 1차 세포에서 면역 반응을 유발하지 않는다(도 29e). 이러한 결과는 소정의 단일 유전 질환을 타겟으로 하는 LEAPER의 치료 잠재력을 나타냈다.
실시예 17. GM06214 돌연변이 유전자형의 검출
GM06214 세포를 15% 혈청 및 1% 섬유아세포 성장 첨가제(ScienCell, GFS, Cat. No. 2301)를 함유하는 섬유아세포 배양 배지(ScienCell, FM 배지, 카탈로그 번호 2301)에서 2-3일 동안 37℃, 5% CO2의 인큐베이터에서 배양되었다. 세포가 90% 융합되면 0.25% 트립신으로 분해시키고, 이어서 15% 혈청을 포함하는 섬유아세포 배양 배지에 의해 분해가 종료된다. DNA 추출은 동작 지침에 따라서 TianGene® (TIANGEN Biotech (Beijing) Co., Ltd.) 세포 DNA 추출 키트(Cat. No. DP304-03)를 사용하여 수행되었다.
IDUA 돌연변이 부위의 상류 및 하류 서열에 대한 프라이머는 NCBI-Primer blast(웹사이트: https://www.ncbi.nlm.nih.gov/tools/primer-blast/)를 사용하여 설계되었다. SEQ ID NO: 304: CGCTTCCAGGTCAACAACAC(순방향 프라이머 hIDUA-F1); SEQ ID NO: 305: CTCGCGTAGATCAGCACCG(역방향 프라이머 hIDUA-R1). PCR을 수행하고 PCR 생성물을 생어 시퀀싱을 실시하였다. 도 34에 나타낸 바와 같이, 세포의 돌연변이는 질병을 유발하는 G에서 A로의 돌연변이로 확인되었다.
실시예 18. GM06214 세포 형질감염 조건의 시험
GM06214 세포는 GM06214가 90% 융합일 때 소화되었고, 소화 종료 후 카운트되었다. 전기 형질감염을 위해, 6백만개의 세포를 400ul의 미리 혼합된 전기 형질감염 용액(Lonza, Cat. No. V4XP-3024)으로 재현탁시키고, 20ug의 GFP 플라스미드(Lonza, Cat. No. V4XP-3024)를 첨가하였다. 혼합 후, 20ul의 현탁액을 Lonza Nucleofector™ 기기를 사용하여 7개의 시험 전기형질감염 조건(도 35 참조) 및 1개의 음성대조군을 포함하는 8개 조건 각각의 시험을 위한 전기형질감염증 시스템으로 취한다. 각 조건의 테스트는 반복된다. 전기 형질감염 후, 세포는 15% 혈청을 함유하는 2ml 섬유아세포 배양 배지(ScienCell, FM 배지, Cat. No. 2301)로 신속하게 이동된다. 각 조건의 세포를 2개의 웰(6웰 배양 플레이트)에 플레이팅하고, 5% CO2 및 37℃의 인큐베이터에서 배양하였다. 전기 형질감염 24시간 후, 각 전기 형질감염 조건의 2개 웰 중 하나의 세포를 분해하여 GFP 양성 세포의 비율을 유동 세포 분석법으로 측정하였다. 전기 형질감염 48시간 후, 각 전기 형질감염 조건의 2개 웰 중 다른 웰의 세포를 분해하여 유동 세포 분석기로 GFP 양성 세포의 비율을 측정하였다. 세포에 대한 최적의 전기 형질감염 조건은 도 35에 나타낸 바와 같이 CA-137 조건이다.
실시예 19. IDUA 효소 활성 및 A에서 G로의 돌연변이율 검출
올리고 dRNA는 IDUA 유전자로부터 전사된 pre-mRNA 및 성숙한 RNA의 돌연변이 부위를 갖는 서열을 타겟팅하기 위해 설계 및 합성된다. dRNA의 서열은 이하에 나타낸 바와 같다. 모든 dRNA 서열은 CM0 패턴으로 변형되었다(2'-O-메틸화는 서열의 첫번째 및 마지막 3개의 뉴클레오티드에 있었고, 서열의 첫번째 및 마지막 3개의 뉴클레오티드간 연결은 포스포로티오화되었다).
SEQ ID NO 204:
gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucauccagcagcgccagcagccccauggccgugagcaccggcuu(Pre-55개의 뉴클레오티드-c-55개의 뉴클레오티드);
SEQ ID NO 205:
gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcggggcgggggggggccgucgccgcguggggucguug(m- 55개의 뉴클레오티드-c-55개의 뉴클레오티드);
SEQ ID NO 341:
uaccgcuacagccacgcugauuucagcuauaccugcccgguauaaagggacguucacaccggauguucuccgcggggauaucgcgauauucaggauuaaaagaagugc(랜덤-111개의 뉴클레오티드).
합성된 dRNA에서 돌연변이된 염기에 해당하는 염기는 C이고, 결합할 때 돌연변이된 염기와 AC 미스매치를 형성한다. 합성된 RNA의 길이는 111개의 뉴클레오티드인 것이 바람직하다. 실시예 2에서 얻어진 최적화 전기 형질감염 조건을 사용하여 세포를 전기 형질감염하였다. 전기 형질감염 48시간 후, 효소 활성 측정 및 A에서 G로의 돌연변이율 검출을 위해 세포가 수집되었다.
A에서 G로의 돌연변이 비율의 결정:
설계된 dRNA를 RNase-프리 워터(TransGene Biotech, Cat. No. GI201-01)에 필요한 농도로 용해시키고, -80℃에서 보관하였다. GM06214 세포가 약 90% 융합까지 성장하면, 세포를 분해하고, 분해 종료 후 카운트하였다. 100만개의 세포와 200pmol의 dRNA를 혼합하여 100ul로 희석한 후 CA-137 조건 하에서 전기 형질감염하였다. 전기 형질감염 48시간 후, 세포를 카운트하고 그들의 생존력을 측정하였다. 세포를 RNase 프리 원심분리 튜브로 옮기고 원심분리하였다. 상층액은 폐기하였다. RNA는 QIAGEN RNA 추출 키트(QIAGEN, Cat. No. 74134)를 사용하여 추출되었다. 지침에 따라서, Buffer RLT Plus 0.35ml를 5×105 세포(냉동 세포에서 RNA를 직접 추출하는 경우, 세포를 PBS로 한번 세척하는 것이 바람직하다)를 피펫팅에 의해 혼합하였다. 세포 용해물을 gDNA Eliminator 스핀 컬럼으로 옮기고 30초 동안 ≥8000g에서 원심 분리하였다. 컬럼을 폐기하고, 액체를 잔존시켰다. 액체와 동일한 부피의 70% 에탄올을 첨가하였다. 혼합 직후, 혼합물을 RNeasyMinElute 스핀 컬럼으로 옮기고 ≥8000g에서 원심 분리하여 15개 모래에 대해 폐액을 폐기하였다. 700㎕의 버퍼 RW1을 RNeasyMinElute 스핀 컬럼에 가하고 15초 동안 ≥8000g에서 원심분리하였다. 폐액을 폐기하고, 5000㎕의 버퍼 RPE를 첨가한 후, RNeasyMinElute 스핀 컬럼을 ≥8000g에서 15초 동안 원심분리하였다. 폐액을 폐기하고 500㎕의 80% 에탄올을 첨가하고, 이어서 RNeasyMinElute 스핀 컬럼을 ≥8000g에서 2분 동안 원심분리하였다. 폐액은 폐기되었다. 상기 RNeasyMinElute 스핀 컬럼을 새로운 2ml 수집 컬럼에 넣고, 최대 속도로 5분 동안 뚜껑을 덮고 원심분리하여 컬럼을 건조시켰다. 상기 RNeasyMinElute 스핀 컬럼은 새로운 1.5ml 수집 컬럼에 넣고 컬럼 멤브레인 중앙에 RNase-프리 워터 14㎕를 적하 첨가한 후 컬럼을 최대 속도로 1분간 원심분리하여 RNA를 용출시킨다.
추출된 RNA의 농도는 Nanodrop(Thermo, Nanodrop2000)으로 결정하였으며, 역전사에는 RNA 1ug(Thermo, reverse transcriptase, Cat. No. 28025013)을 사용하였다. 역전사 시스템은 표 5-6에 나타내어졌다. 65℃에서 5분 동안 인큐베이션한 후, 역전사 시스템을 즉시 빙욕에서 냉각시켰다. 37℃에서 50분 동안 배양을 계속하였다. 역전사효소는 70℃에서 15분 동안 비활성화되었다. PCR은 표 7에 나타낸 조건으로 수행되었다. PCR 후, 아가로스 겔 전기영동을 위해 2ul의 PCR 생성물을 취하였다. 전기영동 결과에 따라 PCR 생성물의 농도와 밴드 사이즈가 맞는지의 여부를 판단한다. 정제 후, 상기 PCR 생성물이 차세대 시퀀싱을 위해 보내지는 라이브러리를 제작하는데 사용되었다.
역전사 시스템-1
부피(㎕)
총 RNA(1ug) X
올리고 dT 1
10nM d개의 뉴클레오티드P 1
RNase-프리 워터 10-X
총부피 12
65℃, 5분, 얼음으로 즉시 옮김
역전사 시스템-2
부피(㎕)
표 5로부터의 생성물 12㎕
5X 제 1 표준 버퍼 4
0.1 M DTT 2
RNaseOUTTM 재조합 리보뉴클레아제 억제제 1
M-MLV 1
총부피 20
PCR 조건
단계 시간 사이클
98℃ 2분 1 사이클
98℃ 15초 28-35 사이클
63℃ 30초
72℃ 15초
72℃ 2분 1 사이클
본 실시예에서 효소 활성 분석:
GM06214 세포를 분해하고, 원심분리하고, 0.1% Triton X-100을 함유하는 28 ul의 1×PBS에 재현탁하고 30분 동안 얼음에서 용해시켰다. 이어서, 25ul의 세포 용해물을 190㎛ 4-메틸움벨리페릴-α-L-이두로니다제(Cayman, 2A-19543-500, 0.2% Triton X-100을 포함하는 0.4M 포름산나트륨 완충액에 용해됨, pH 3.5)를 함유하는 25㎕ 기질에 첨가하였고, 37℃에서 90분간 암실에서 배양하였다. 200ul 0.5M NaOH/글리신 용액(Beijing Chemical Works, NAOH, Cat. No. AR500G; Solarbio, Glycine, Cat. No. G8200), pH 10.3을 첨가하여 촉매 반응을 비활성화시켰다. 4℃에서 2분간 원심분리한 후, 상층액을 Infinite M200 기기(TECAN)를 사용한 형광값 측정을 위해 96-웰 플레이트로 옮겼다. 여기광의 파장은 365nm 및 450nm이었다. 형광은, 도면에서 GM01323의 효소 활성의 배수로 표현되는 효소 활성을 나타낸다.
도 36에 나타낸 바와 같이, 결과는 pre-mRNA를 타켓팅하는 dRNA가 성숙한mRNA를 타겟팅하는 것보다 현저히 높은 효소 활성 및 A에서 G로의 돌연변이율을 유도한다는 것이었다. 따라서 이하의 실시예에서 사용된 dRNA는 pre-mRNA를 타겟으로 한다.
실시예 20. 화학적으로 변형된 dRNA의 전기 형질감염 후 IDUA-리포터 세포주에서 편집 효율의 검출
도 37a에 나타낸 바와 같이, 렌티바이러스 플라스미드 상의 mcherry 및 GFP 단백질을 발현하는 서열 사이에, 양 측 상에 각각 약 100bp의 IDUA 돌연변이 부위가 측면에 있는 서열을 삽입하여 플라스미드를 구축하였다. 구축된 플라스미드는 바이러스로 패킹되어 이후에 293T 세포를 감염시키는데 사용되었다. 게놈에 통합한 후, IDUA-리포터 단일 클론 세포를 선택하였다. 단일 클론 세포는 삽입된 서열에서 IDUA 돌연변이 부위의 TAG 정지 코돈의 영향을 받기 때문에, 상기 mcherry 단백질만을 발현하였다. 세포가 dRNA에 의해 편집되면 TGG로 돌연변이된 TAG 뒤에 있는 GFP는 정상적으로 발현될 수 있다. 따라서, GFP의 발현은 세포에서 dRNA의 편집 효율로 간주되었다. 이하의 표 8에 나타낸 바와 같이, 51개의 뉴클레오티드-111개의 뉴클레오티드로 길이가 다른 4개의 바람직한 dRNA를 설계하였다. 모든 dRNA 서열은 CM0 패턴으로 변형되었다. 실시예 18의 전기 형질감염 조건 하에서, 세포는 다양한 길이의 dRNA를 전기 형질감염하였다. 형질감염 1일째부터 7일째까지 매일 세포 내의 GFP의 비율을 검출하여 편집 효율을 예비 평가하였다. 도 37b에 나타낸 바와 같이, 편집 효율의 피크는 둘째 날(48h)에 나타났다. 편집 효율이 가장 높은 서열은 111개의 뉴클레오티드: 55-c-55의 것보다 높은 91개의 뉴클레오티드: 45-c-45이었다. 따라서, 모든 경우에 있어서, dRNA가 길수록 편집 효율이 높은 것은 아니었다. 또한, 51개의 뉴클레오티드의 dRNA의 편집 효율은 매우 낮았다.
Figure pct00014
실시예 21. 상이한 길이의 화학적으로 변형된 dRNA로 형질감염시킨 후 상이한 시점에서 GM06214 세포에서 세포 내 IDUA 효소 활성 및 RNA 편집 효율의 측정
상이한 길이의 dRNA를 GM06214 세포에 전기 형질감염시키기 위한 실시예 18의 조건(표 7 참조) 및 효소 활성 및 편집 효율을 결정하기 위한 실시예 19의 방법이 사용되었다. 상기 전기 형질감염 후, 2번째, 4번째, 6번째, 8번째, 10번째, 12번째, 14번째에 대해, 세포 내 효소의 활성을 시험하였다. 그리고, 2째날과 4째날에, 세포에서 RNA 편집의 효율성을 테스트했다. 도 38a에 나타낸 바와 같이, 91개의 뉴클레오티드: 45-c-45가 가장 높은 효소 활성을 보였고, IDUA 효소 활성은 전기 형질감염 후, 6일째까지 높은 수준으로 유지되었다. 도 38b에 있어서, 91개의 뉴클레오티드의 dRNA와 111개의 뉴클레오티드의 dRNA는 거의 동일한 편집 효율을 나타내었다. 또한, 51개의 뉴클레오티드의 dRNA는 낮은 편집 효율을 보였다.
실시예 22. 화학적으로 변형된 dRNA의 바람직한 서열에 대한 스크리닝
문헌 연구를 통해 우리는 전기 형질감염이 미래의 질병 치료에 적합하지 않다고 생각한다. 따라서, 우리는 dRNA를 세포에 형질감염시키기 위해 Lipofectamine RNAiMAX((Invitrgen, Cat. No. 13778-150))로 전기 형질감염을 하였다. Lipofectamine RNAiMAX가 전기 형질감염보다 형질감염 효율이 더 높은 것으로 확인되었다. 서열은 우선 양쪽 말단을 동시에 잘랐고, 그런 다음 서열의 한 쪽 말단은 고정하고 다른 쪽 말단은 잘랐다. 이러한 방식으로 14개의 dRNA와 4개의 동일한 길이의 랜덤 서열이 이하의 표 9와 같이 얻어진다. 모든 dRNA 서열은 CM0 패턴으로 변형되었다. 도 39에 나타낸 바와 같이, IDUA 효소 활성(도 39a, 실시예 19에 기재된 방법을 사용) 및 RNA 편집 효율(도 39b, NGS 사용)은 형질감염 48시간 후에 결정되었다. 81개의 뉴클레오티드: 55-c-25(SEQ ID NO: 24) 및 71개의 뉴클레오티드: 55-c-15(SEQ ID NO: 24)에 의해 나타내어지는 IDUA 효소 활성 및 RNA 편집 효율이 다른 dRNA에 비해 높은 것으로 나타났다. 그리고, 3' 말단이 더 짧고 5' 말단이 더 긴 RNA는 항상 더 높은 효율을 보였다. 또한 dRNA의 길이가 61개의 뉴클레오티드 이하로 줄어들면 3' 또는 5' 말단이 어떻게 바뀌든 간에 dRNA의 편집 효율이 급격히 감소한 것으로 보인다.
Figure pct00015
실시예 23. 화학적으로 변형된 dRNA의 3' 말단의 선택적 길이의 측정
실시예 22에서, 81개의 뉴클레오티드: 55-c-25 및 71개의 뉴클레오티드: 55-c-15 서열을 갖는 dRNA에 의해 편집된 세포에서 더 높은 IDUA 효소 활성 및 편집 효율이 검출되었다. 3' 말단의 가장 짧고 최적의 길이를 찾기 위해 3' 말단의 서열을 표 10에 나타낸 바와 같이, 25개의 뉴클레오티드(81개의 뉴클레오티드: 55-c-25)에서 5개의 뉴클레오티드(61개의 뉴클레오티드: 55-c-5)로 절단하였다. 모든 dRNA 서열은 CM0 패턴으로 변형되었다. 2개의 IDUA 효소 활성 분석을 81개의 뉴클레오티드: 55-c-25~66개의 뉴클레오티드: 55-c-10(도 40a)의 dRNA로 별도로 형질감염된 세포 및 72개의 뉴클레오티드: 55-c-16~61개의 뉴클레오티드: 55-c-5(도 40b)의 dRNA로 별도로 형질감염된 세포에 대해 수행하였다. 3'말단 길이가 25개의 뉴클레오티드~9개의 뉴클레오티드인 dRNA는 GM06214 세포의 효소 활성을 GM0123 세포의 20배 이상으로 쉽게 증가시켰다. 따라서 3' 말단의 최적 길이는 25개의 뉴클레오티드-7개의 뉴클레오티드이었다. 또한, 3' 말단과 5' 말단의 길이가 동일한 45개의 뉴클레오티드-c-45개의 뉴클레오티드에 비해 3' 말단이 더 짧은 dRNA는 항상 더 높은 편집 효율을 가졌다.
본원에서 사용되는 IDUA 효소 활성 분석은 다음과 같다. 형질감염 하루 전, 웰당 3×105 세포를 6웰 플레이트에 플레이팅하였다. 형질전환 당일 배지를 리프레시하였다. 20nM Lipofectamine RNAiMAX 시약을 사용한 형질감염 48시간 후, GM06214 세포를 분해하고, 원심분리하고, 0.1% Triton X-100을 함유하는 33ul의 1×PBS에 재현탁하고 30분 동안 얼음에서 용해시켰다. 그런 다음 용해물을 4℃에서 2분 동안 원심분리하였다. 25ul의 세포 용해물을 0.2% Triton X-100(pH 3.5)을 포함하는 0.4M 포름산나트륨 완충액에 용해된 190㎛ 4-메틸움벨리페리-α-L-아이두로니데이스(Glycosy개의 뉴클레오티드h, 44076)를 포함하는 기질 25ul에 첨가하고 암실에서 30분 동안 37℃에서 배양하였다. 200ul 0.5M NaOH/글리신 용액(Beijing Chemical Works, NAOH, Cat. No. AR500G; Solarbio, Glycine, Cat. No. G8200), pH 10.3을 첨가하여 촉매 반응을 비활성화시켰다. 모든 상층액은 Infinite M200 기기(TECAN)를 사용하여 검출되었다. 여기광의 파장은 365nm 및 450nm이었다. 효소 활성은 GM01323에서 효소 활성의 배수로 표현된다.
Figure pct00016
Figure pct00017
실시예 24. 3' 말단의 길이가 고정된 경우의 화학적으로 변형된 dRNA의 5' 말단의 선택적 길이의 측정
5' 말단의 절단은 76개의 뉴클레오티드: 55-c-20 및 71개의 뉴클레오티드: 55-c-15의 2개의 다른 길이의 dRNA에서 별도로 수행되었다. 3'말단의 고정된 길이로, 그들의 5' 말단은 표 11에 나타낸 바와 같이, 점차적으로 절단되었다. 모든 dRNA 서열은 CM0 패턴으로 변형되었다. IDUA 효소 활성 분석 결과에 따라서, 55개의 뉴클레오티드와 45개의 뉴클레오티드 사이의 5' 말단을 갖는 dRNA로 형질감염된 세포는 도 41에 나타난 바와 같이 더 높은 IDUA 효소 활성을 나타내었다. 형질감염에 있어서, Lipofectamine RNAiMAX를 사용하였다. 도 39에 따라서, 길이를 61개의 뉴클레오티드 미만으로 감소시킨 경우, 3' 말단과 5' 말단의 길이가 같지 않은 경우에도 dRNA의 편집 효율이 급격히 감소하였다.
Figure pct00018
실시예 27. IDUA 돌연변이 부위에 대한 화학적 변형 dRNA의 타겟팅 뉴클레오티드 위치와 편집 효율 간의 관계의 측정
상기 데이터에 따르면, dRNA의 편집 효율은 dRNA 상의 타겟팅 뉴클레오티드의 길이 및 위치와 관련된다. 일반적으로 타겟팅 뉴클레오티드가 5' 말단에 가까울수록 편집 효율이 낮아진다. 따라서, 본 실시예에서는 3개의 고정된 길이의 dRNA의 3개 그룹을 설계하였다. 각 그룹의 dRNA는 타겟팅 뉴클레오티드를 서열의 중간에서 5' 말단으로 점진적으로 이동시켜 설계하였다. 합성이 용이하지 않은 구조는 회피한다. 서열은 표 12에 나타내어진다. 모든 dRNA 서열은 CM0 패턴으로 변형되었다. dRNA를 Lipofectamine RNAiMAX를 사용하여 GM06214 세포에 형질감염시켰다. 48시간 후, 세포를 수확하고 실시예 23에 기재된 방법에 따라 효소 활성을 테스트하였다. 도 42에 나타낸 데이터에 따르면, 적어도 dRNA의 전체 길이를 67개의 뉴클레오티드, 70개의 뉴클레오티드 또는 72개의 뉴클레오티드로 고정한 경우, 타겟팅 뉴클레오티드의 위치 변화는 편집 효율을 나타내는 효소 활성에 영향을 미치지 않는 것으로 보였다.
Figure pct00019
Figure pct00020
Figure pct00021
실시예 28. 화학적 변형이 dRNA의 편집 효율에 미치는 영향
합성 RNA의 화학적 변형은 RNA 안정성을 증가시키고 타겟 외 잠재력을 감소시킨다. RNA의 비교적 일반적인 화학적 변형은 2'-O-메틸화(2'-O-Me) 및 포스포로티오에이트 결합이다. 길이 71개의 뉴클레오티드 또는 76개의 뉴클레오티드의 상이한 조합을 지닌 dRNA 및 화학적 변형이 표 13에 나타내어진다. GM06214 세포는 세포내 IDUA 편집을 위해 Lipofectamine RNAiMAX를 사용하여 다른 dRNA로 형질감염되었다. 형질감염 48시간 후 세포를 수집하여 실시예 23에 나타내는 방법을 사용하여 IDUA 효소 활성을 측정하였다. 도 42a에 나타낸 결과를 따라서, CM5를 제외한 모든 변형은 우수한 효소 활성을 나타내었다(5번째 변형: 타겟팅 뉴클레오티드 및 양측의 5개의 뉴클레오티드를 제외한 모든 뉴클레오티드가 2'-OMe에 의해 변형됨). 타겟팅 뉴클레오티드 또는 가장 인접한 2개의 뉴클레오티드에 대한 변형은 편집 효율을 감소시키지 않았다.
편집 효율성은 A에서 G로의 치환율을 카운트함으로써 더 측정되었다. 방법은 다음과 같다: GM06214 세포의 IDUA 유전자에서의 타겟 아데노신을 포함하는 서열은 dRNA를 사용한 RNA 편집 후 CTGG로 돌연변이된 CTAG이다. CTAG는 제한효소 BfaI의 인식 부위이다. 따라서, A에서 G로의 성공적인 치환은 BfaI에 의한 분해를 일으키지 않는 반면에, 야생형은 분해를 일으킨다. 편집 후 GM06214 세포의 RNA를 추출하고 cDNA로 역전사하였다. cDNA를 이용하여 PCR을 수행하였다. 프라이머는 hIDUA-62F: CCTTCCTGAGCTACCACCCG(SEQ ID NO: 415) 및 hIDUA-62R: CCAGGGCTCGAACTCGGTAG(SEQ ID NO: 416)이었다. PCR 후, 생성물을 정제하고 BfaI(NEB, 카탈로그 번호 R0568L)와 함께 배양하였다. A에서 G로의 치환율 또는 편집 효율은 아가로스 겔 전기영동을 사용하여 측정되었다. 결과는 겔 전기영동 이미지의 회색 값을 사용하여 산출된 PCR 생성물의 총 핵산에 대한 절단되지 않은 섹션(A에서 G로 치환)의 백분율로 표시되었다. 그 결과를 도 42b에 나타내었다. 도 42a의 효소 활성 분석 결과와 유사하였다.
Figure pct00022
Figure pct00023
실시예 29. 변형 패턴의 추가 검증
CM1의 변형 패턴은 다른 서열에서 테스트되었다. 대조군으로서 종래 기술에서 바람직한 변형 패턴이 사용되었다. 표 14에 나타낸 바와 같이, 55개의 뉴클레오티드-c-15개의 뉴클레오티드-CM1은 테스트 서열이고, 36개의 뉴클레오티드-c-13개의 뉴클레오티드-CM11은 양성 대조군이었고, 편집 삼중항 "CCA"를 제외한 모든 뉴클레오티드가 2'-O-Me로 변형되었고, 첫번째 및 마지막 4개의 뉴클레오티드간 연결이 포스포로티오화되었다. 또한, 36개의 뉴클레오티드-c-13개의 뉴클레오티드-CM11은 단지 51개의 뉴클레오티드이고, 본 발명에서는 바람직한 길이가 아니라 종래 기술에서는 바람직한 길이이다. Lipofectamine RNAiMAX를 이용하여 GM06214 세포에 dRNA를 형질감염시키고 48시간 후, 실시예 23에 나타낸 방법을 사용하여 IDUA 효소 활성을 검출하였다. 도 44에 나타낸 바와 같이, 55개의 뉴클레오티드-c-15개의 뉴클레오티드-CM1은 36개의 뉴클레오티드-c-13개의 뉴클레오티드-CM11보다 현저하게 높은 편집 효율을 가졌다.
Figure pct00024
실시예 30. 다른 세포에서 dRNA의 추가 테스트
본 실시예는 LEAPER 기술을 사용한 USH2A c.11864 G>A(p.Trp3955 *) 돌연변이의 복구에 초점을 맞췄다. 본 실시예에서 설계된 리포터 시스템은 도면 45a에 나타내어진다. USH2A c.11864 G> A(p. Trp3955*)의 경우, 정상 TGG 서열이 종료 코돈인 TAG로 돌연변이되었다. 따라서, 돌연변이된 mRNA의 번역은 이 TAG에서 조기에 종료될 것이다. 293T(C. Zhang's lab, Peking University의 293T 세포) 리포터 시스템은 렌티바이러스 벡터이며, 도 45a에 나타내어진 mRNA는 CMV 프로모터에 의해 구동된다. 상기 시스템은 다음 부분을 포함한다: 1) 안정적으로 발현될 수 있는 mCherry 적색 형광 단백질, 2) USH2A 유전자의 돌연변이 부위 및 양측에 인접한 100개 염기쌍. 3) GFP 녹색 형광 단백질. 돌연변이 부위가 성공적으로 편집되면, TAG 코돈이 TIG로 변환되고, 이렇게 하면 번역을 계속할 수 있으며 USH2A 서열 이후의 GFP는 정상적으로 번역될 수 있다. 따라서, GFP의 발현은 편집 효율을 나타낸다.
dRNA는 시험관 내에서 합성하였으며, 본 실시예에서 사용한 모든 dRNA 서열은 표 15에 나타내어졌다. 모든 dRNA 서열은 CM0 패턴으로 변형되었다. 테스트의 구체적인 단계는 다음과 같다.
293T 리포터 세포를 10% FBS(Vistech, SE100-011)로 DMEM(Hyclone SH30243.01)에서 배양하였다. 융합되면, 세포를 15,000개 세포/웰로 12웰 플레이트로 옮겼다. 시간은 0시간으로 기록된다.
24시간째에, 각 웰의 293T 세포를 Lipofectamine RNAiMAX 시약(Invitrogen 13778150)을 사용하여 12.5pmol의 dRNA로 형질감염시켰다. 형질감염 프로토콜은 제품 메뉴얼에 제공되었다.
72시간째에 각 웰의 세포를 트립신(Invitrogen, 13778-150)으로 분해하고, 유세포 분석기를 이용하여 FITC(Fluorescein isothiocyanate)의 강도를 검출하였다.
도 45b에 나타낸 바와 같이, 세포는 동일한 길이의 3' 및 5' 말단을 갖는 dRNA의 편집 효율이었다. NC는 dRNA 형질감염이 없는 대조군 세포를 나타낸다. 상기 실시예에 따르면, 111개의 뉴클레오티드, 91개의 뉴클레오티드 및 71개의 뉴클레오티드의 dRNA로 형질감염된 세포의 GFP 양성 비율은 90%를 초과한 반면, 51개의 뉴클레오티드 dRNA로 형질감염된 세포는 매우 낮은 GFP 양성 비율을 나타내었다. 왼쪽의 MFI(mean fluorescence Intensity) 데이터에서 111개의 뉴클레오티드 dRNA가 가장 높은 형광 강도를 나타내었다.
도 45c에 나타낸 바와 같이, 상이한 길이의 3' 및 5' 말단을 갖는 dRNA 및 동일한 3' 및 5' 말단을 갖는 111개의 뉴클레오티드 dRNA를 별도로 세포 내로 형질감염시켰다. 본 실시예에서 사용된 바와 같이, 55개의 뉴클레오티드 5' 말단을 갖는 dRNA는 55개의 뉴클레오티드, 45개의 뉴클레오티드, 35개의 뉴클레오티드, 25개의 뉴클레오티드 또는 5개의 뉴클레오티드의 3' 말단을 갖는다. 동일하게, 55개의 뉴클레오티드 3' 말단을 갖는 dRNA는 55개의 뉴클레오티드, 45개의 뉴클레오티드, 35개의 뉴클레오티드, 25개의 뉴클레오티드 또는 5개의 뉴클레오티드의 5' 말단을 갖는다. 도 45c의 결과에 따르면, dRNA의 길이를 61개의 뉴클레오티드로 감소시켰을 때 편집 효율이 급격히 감소한 반면, dRNA가 길수록 편집 효율이 명백하게 높아졌다. 그 중, dRNA 55개의 뉴클레오티드-c-25개의 뉴클레오티드가 가장 높은 편집 효율을 갖는다. 따라서, 3' 말단은 25개의 뉴클레오티드로 고정되었고, 5' 말단을 갖는 dRNA는 55개의 뉴클레오티드에서 25개의 뉴클레오티드까지 다른 길이로 고정되었다. 이들 dRNA로 형질감염된 세포의 결과를 도 45d에 나타내었다. 2개의 55개의 뉴클레오티드-c-25개의 뉴클레오티드 dRNA는 2개의 다른 배치에서 가져왔다. 5' 말단이 짧을수록 편집 효율이 떨어지는 것은 자명했다. 또한, 도 45d의 결과는 편집 효율성을 보장하기 위해 dRNA의 길이가 61개의 뉴클레오티드 이상인 것이 바람직하다고 다시 한번 나타내었다.
Figure pct00025
Figure pct00026
Figure pct00027
Figure pct00028
Figure pct00029
Figure pct00030
Figure pct00031
Figure pct00032
Figure pct00033
Figure pct00034
Figure pct00035
Figure pct00036
Figure pct00037
Figure pct00038
Figure pct00039
Figure pct00040
Figure pct00041
Figure pct00042
Figure pct00043
Figure pct00044
Figure pct00045
토론
게놈 편집 기술은 생물의학 연구에 혁명을 일으키고 있다. 징크 핑거 뉴클레아제(ZFN)1, 전사 활성화제 유사 이펙터 뉴클레아제(TALEN)2-4, CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats) 시스템5-7의 Cas 단백질과 같은 고활성 뉴클레아제가 무수한 유기체에서의 게놈을 조작하기 위해 성공적으로 설계되었다. 최근에 탈아미노효소는 이중 가닥 DNA를 파괴하지 않고 유전 암호를 정확하게 변경하는데 활용되었다. CRISPR-Cas9 시스템과 시티딘 또는 아데노신 탈아미노효소를 결합함으로써, 연구원들은 질환을 유발하는 돌연변이를 교정하기 위한 새로운 기회를 제공하는, 게놈 DNA8-10에서 C·G에서 T·A로 또는 A·T에서 G·C로 변환할 수 있게 하는 프로그래밍 가능한 염기 편집기를 만들었다.
DNA 외에도, RNA 변형은 게놈에 임의의 영구적인 변화를 일으키지 않고 단백질 기능을 변경할 수 있기 때문에, 유전자 교정을 위한 매력적인 타겟이다. ADAR 아데노신 탈아미노효소는 현재 RNA에 대한 정확한 염기 편집을 달성하기 위해 이용되고 있다. 포유류에서 ADAR1(이소형 p110 및 p150), ADAR2 및 ADAR3(촉매 불활성)11, 12의 3종류의 ADAR 단백질이 확인되었으며, 그 기질이 이중 가닥 RNA이며, 시토신(C)과 미스매치된 아데노신(A)은 이노신(I)으로 우선적으로 탈아미노화된다. 이노신은 번역13, 14 동안 구아노신(G)을 모방하는 것으로 생각된다. 타겟팅된 RNA 편집을 달성하기 위해, ADAR 단백질 또는 그 촉매 도메인은 λN 펩티드15-17, SNAP-태그18-22 또는 Cas 단백질(dCas13b)23과 융합되었고, 가이드 RNA는 특정 부위에 키메라 ADAR 단백질을 리크루팅하도록 설계되었다. 대안적으로, R/G 모티프 함유(motif bearing) 가이드 RNA와 함께 ADAR1 또는 ADAR2 단백질을 과발현하는 것도 타겟팅된 RNA 편집24-27을 가능하게 하는 것으로 보고되었다.
포유류 시스템에서의 보고된 모든 핵산 편집 방법은 효소와 가이드 RNA의 2개의 구성 요소의 이소성 발현에 의존한다. 이러한 이진 시스템은 대부분의 연구에서 효율적으로 작동하지만, 일부 고유한 장애물은 특히 치료에서 광범위한 적용을 제한한다. 유전자 치료를 위한 가장 효과적인 생체내 전달은 바이러스 벡터28를 통하고, 또한 매우 바람직한 아데노 관련 바이러스(AAV) 벡터는 화물 크기(~4.5kb)로 제한되어 있기 때문에, 단백질과 가이드 RNA29, 30를 모두 수용하는 것이 어렵게 된다. ADAR1의 과발현은 최근 RNA31에 대한 비정상적인 과대 편집으로 인해, 다발성 골수종에 발암성을 부여하고, 또한 실질적인 글로벌 오프-타겟팅 편집32을 생성하는 것으로 보고되었다. 또한, 단백질의 이소성 발현 또는 비인간 유래의 그 도메인은 면역원성30, 33을 유도해낼 수 있는 잠재적 위험을 갖는다. 더욱이, 기존의 적응성 면역력 및 p53 매개 DNA 손상 반응은 Cas934-38과 같은 치료 단백질의 효능을 손상시킬 수 있다. RNA 편집을 위해 내인성 메커니즘을 활용하려는 시도가 있었지만, 이것은 사전조립된 타겟 전사물인 RNA 이중체를 제노푸스 배아39에 주입하는 것만으로 시도되었다. 단백질의 이소성 발현에 의존하지 않는 강력한 핵산 편집을 위한 대체 기술이 더욱 필요로 된다. 여기에서, 우리는 RNA 편집을 위해 내인성 ADAR을 활용하는 새로운 접근 방식을 개발했다. 우리는 의도적으로 설계된 가이드 RNA를 발현하면 내인성 RNA에 대한 효율적이고 정확한 편집이 가능하고, 또한 병원성 돌연변이를 교정할 수 있다는 것을 보여주었다. 이러한 단항 핵산 편집 플랫폼은 치료 및 연구를 위한 새로운 길을 열 수 있다.
특히, 우리는 적절한 길이의 선형 arRNA의 발현이 타겟 전사물에 대해 아데노신을 이노신으로 편집하도록 내인성 ADAR 단백질을 가이딩할 수 있다는 것을 보여주었다. LEAPER라고 지칭되는 이 시스템은 내인성 ADAR 단백질을 사용하여 프로그래밍 가능한 핵산 편집을 달성하므로, 기존 접근 방식을 능가하는 장점을 가지고 있다.
LEAPER의 우수한 품질은 단순성이며, 이는 RNA 편집을 위해 내인성 단백질을 다이렉팅하기 위해 작은 크기의 RNA 분자에만 의존하기 때문이다. 이것은 RNAi를 연상시켜서, 작은 dsRNA가 타겟팅된 RNA 분해51를 위한 네이티브 메커니즘을 작동시킬 수 있다. 크기가 작기 때문에, arRNA는 다양한 바이러스 및 비바이러스 비히클에 의해 쉽게 전달될 수 있다. RNAi와 달리, LEAPER는 타겟팅된 전사물의 절단 또는 분해를 일으키지 않고 정확한 A에서 I로의 스위치를 촉진시킨다(도 18a). arRNA의 길이 요건은 RNAi보다 길지만, 세포 수준에서 면역 자극 효과를 유도하지도 않고(도 22e, f 및 도 29e) 또한 내인성 ADAR 단백질의 기능에도 영향을 주지 않음(도 22a, b)으로써, RNA 타겟팅을 위한 안전한 전략으로 되게 한다. 놀랍게도, ADAR 단백질 또는 그 촉매 도메인의 이소성 발현은 실질적인 글로벌 오프-타겟 편집32을 유도하고 또한 암을 유발할 가능성이 있다는 것이 보고되어 있다.
최근에, 수개의 그룹은 시토신 염기 편집기가 이펙터 단백질의 발현으로 인해, 마우스 배아, 쌀 또는 인간 세포주에서 실질적인 오프-타겟 단일 뉴클레오티드 변이체를 생성할 수 있다고 보고했으며, 이는 잠재적인 치료 적용에 대한 LEAPER의 이점52-54을 실증한다. 만족스럽게도, LEAPER는 희귀한 글로벌 오프-타겟 편집을 이끌어 내면서 효율적인 편집을 지원한다(도 20 및 도 21). 또한, LEAPER는 잠재적인 면역원성을 최소화하거나 또는 외부 단백질의 도입을 필요로 하는 다른 방법에 의해 일반적으로 공유되는 전달 장애를 극복할 수 있었다.
LEAPER의 경우, 우리는 소망하는 활성을 달성하기 위해 70개의 뉴클레오티드 이상의 최소 크기를 갖는 arRNA를 사용하는 것을 추천할 수 있다. 네이티브 컨텍스트에서, ADAR 단백질은 300개의 뉴클레오티드를 초과하는 이중체를 갖는 Alu 반복을 비특이적으로 편집한다55. 중요한 것은, Alu 반복은 안정적인 분자 내 이중체를 형성하는 반면, LEAPER는 arRNA와 mRNA 또는 pre-mRNA 사이에서 분자 내 이중체가 생기게 하고, 이것은 덜 안정적이고 형성하기 더 어렵다. 따라서, 우리는 효과적인 편집을 위해 ADAR 단백질을 리크루팅 또는 도킹하기 위해서는 70개의 뉴클레오티드보다 긴 RNA 이중체가 화학양론적으로 중요하다고 가정했다. 실제로, 더 긴 arRNA는 이소적으로 발현된 리포터 및 내인성 전사물 모두에서 편집 수율이 더 높아졌다(도 16d 및 도 17b). 그러나, ADAR 단백질은 RNA 이중체에서 아데노신 염기를 무차별적으로 탈아미노화하기 때문에, 더 긴 arRNA는 타겟팅 창 내에서 더 많은 오프-타겟을 유발할 수 있다.
LEAPER는 네이티브 전사물을 효과적으로 타겟팅할 수 있지만, 편집 효율과 오프-타겟 비율은 다양했다. PPIB 전사물-타겟팅의 경우, 우리는 커버링 창 내에서 명백한 오프-타겟없이 타겟팅된 아데노신의 50%를 이노신으로 전환할 수 있다(도 17b, f). 다른 전사물에 대한 오프-타겟은 더욱 심각해졌다. 우리는 소망하지 않은 편집을 억제하기 위해 A-G 미스매치 또는 연속한 미스매치를 도입하는 것과 같은 오프-타겟을 감소시키도록 조작했다. 그러나, 미스매치가 너무 많으면 온-타겟 효율이 저하될 수 있다. 효율 및 잠재적인 오프-타겟을 고려하여, 내인성 전사물에 대한 편집을 위해서는 100-150개의 뉴클레오티드 범위의 길이를 갖는 arRNA를 권장한다. 선택의 여지가 있는 경우, 소망하지 않는 편집의 가능성을 최소화하기 위해, 아데노신이 적은 영역을 선택하는 것이 좋다. 고무적으로, 우리는 arRNA-타겟팅된 전사물 이중체(도 20) 이외에는 어떤 오프-타겟도 검출하지 못했다.
우리는 개선된 편집 효율을 달성하기 위해 arRNA의 설계를 최적화했으며, LEAPER가 유전자 기능을 조작하거나 병원성 돌연변이를 교정하는데 활용될 수 있음을 입증했다. 또한, 우리는 LEAPER가 UAG에서만 작용하도록 제한되는 것이 아니라, 측면 뉴클레오티드에 관계없이 가능한 모든 아데노신과 함께 작용한다는 것을 보여주었다(도 16f, g 및 도 17c). 이러한 유연성은 특정 단일 점 돌연변이로 인한 유전 질환의 잠재적 치료 교정에 유리한다. 흥미롭게도, IDUA 전사물의 편집시, pre-mRNA를 타겟으로 하는 arRNA가 성숙한 RNA를 타겟으로 하는 것보다 더욱 효과적인 바, 핵이 ADAR 단백질에 대한 주요 작용 부위이고, LEAPER는 pre-mRNA 내의 스플라이스 부위를 변형함으로써 스플라이싱을 조작하기 위해 활용될 수 있음을 나타낸다. 또한, LEAPER는 다수의 유전자 전사물을 동시에 타겟팅하는 높은 효율을 입증했다(도 17d). LEAPER의 이러한 다중화 기능은 향후 소정의 다중 유전 질환을 치료하기 위해 개발될 수 있다.
RNA 수준에서 유전자 교정을 행하는 것이 유리하다. 첫째, 타겟팅된 전사물에 대한 편집은 게놈 또는 전사체 레퍼토리를 영구적으로 변경하지 않음으로써, 치료를 위해서는 RNA 편집 접근 방식이 게놈 편집 수단보다 더 안전하다. 또한, 일시적인 편집은 특정 상태의 간헐적인 변화로 인해 야기된 질환 치료의 시간적 제어에 매우 적합하다. 둘째, LEAPER 및 기타 RNA 편집 방법은 게놈에 DSB를 도입하지 않아서, 큰 DNA 단편의 바람직하지 않은 삭제가 발생할37 위험을 피할 수 있다. 닉케이스(nickase) Cas9를 채택한 DNA 염기 편집 방법은 여전히 게놈에서 삽입 결실을 생성8할 수 있다. 더욱이, 네이티브 DNA 복구 기계와는 별도로, LEAPER는 ADAR2의 높은 발현을 갖는 소뇌 세포11와 같은 유사 분열 후 세포에서도 작용해야 한다.
우리는 LEAPER를 인간 세포주(도 14c), 마우스 세포주(도 14d) 및 1차 T 세포를 포함한 인간 1차 세포(도 27 및 도 28d)와 같은 광범위한 세포 유형에 적용할 수 있다는 것을 입증했다. 렌티바이러스 전달 또는 합성된 올리고를 통한 효율적인 편집은 치료법 개발의 잠재력을 높이다(도 28). 또한, LEAPER는 p53의 전사 조절 활성의 회복(도 7), 병원성 돌연변이의 교정(도 26), 헐러 증후군 환자 유래의 일차 섬유아세포에서 α-L-아이두로니데이스 활성의 회복(도 29)을 포함한 다양한 응용 분야에서 표현형 변화 또는 생리학적 변화를 일으킬 수 있었다. 따라서, LEAPER는 질환 치료에 엄청난 잠재력을 갖는다고 생각할 수 있다.
스태포스트(Stafforst)와 동료들은 합성 안티센스 올리고뉴클레오티드56를 사용한 내인성 ADAR의 리크루팅을 통해 작용하는 RESTORE라는 칭해지는 새롭고 외견상으로는 유사한 RNA 편집 방법을 보고했다. RESTORE와 LEAPER 사이의 근본적인 차이는 내인성 ADAR 리크루팅을 위한 가이드 RNA의 고유한 특성에 있다. RESTORE의 가이드 RNA는 복잡한 화학적 변형에 의존하는 화학 합성의 안티센스 올리고뉴클레오티드(ASO)에 제한되는 반면, LEAPER의 arRNA는 바이러스 벡터 또는 비바이러스 벡터로부터 화학적 합성 및 발현 등 다양한 방법으로 생성될 수 있다(도 28 및 도 29). 중요한 것은, 화학적으로 심하게 변형된 ASO는 질환 치료에서 일시적으로 작용하도록 제한된다. 대조적으로, arRNA는 발현을 통해 생성될 수 있으며, 이는 지속적인 편집을 위해 특히 중요한 특징이다.
LEAPER의 효율 및 특이성에 관해서는 개선의 여지는 여전히 남아 있다. LEAPER는 내인성 ADAR에 의존하기 때문에, 타겟 세포에서의 ADAR 단백질의 발현 수준은 성공적인 편집을 위한 결정 요인 중 하나이다. 이전 보고57 및 우리의 관찰에 따르면(도 14a, b), ADAR1p110은 조직 전반에 걸쳐 보편적으로 발현되는 바, LEAPER의 광범위한 적용 가능성을 보장한다. ADAR1p150은 인터페론 유도성 이소폼58이며, LEAPER에서 기능적이라는 것이 입증되었다(도 11e, 도 12b). 따라서, arRNA와 인터페론 자극 RNA의 공-형질감염은 소정의 상황에서 편집 효율을 더욱 향상시킬 수 있다. 대안적으로, ADAR3가 억제적 역할을 하기 때문에, ADAR3의 억제는 ADAR3 발현 세포에서 편집 효율을 향상시킬 수 있다. 더욱이, arRNA의 추가 수식은 편집 효율을 높일 수 있다. 예를 들면, 소정의 ADAR 리크루팅 스캐폴드와 융합된 arRNA는 국소 ADAR 단백질 농도를 증가시켜, 결과적으로 편집 수율을 높일 수 있다. 지금까지, 우리는 A에서 I로의 염기 전환을 위해 내인성 ADAR1/2 단백질만을 활용할 수 있었다. 유전적 요소의 수식을 위해, 특히 강력한 핵산 편집을 실현하기 위해 더 많은 고유 메커니즘이 유사하게 활용될 수 있는지 탐구하는 것은 흥미롭다.
전체적으로, 우리는 세포에서의 내인성 기계가 RNA 전사체를 편집하기 위해 채택될 수 있다는 원리의 증거를 제공했다. 우리는 LEAPER가 유전자 편집 기반 치료 및 연구를 위한 새로운 경로를 밝히는 간단하고 효율적이며 안전한 시스템임을 입증했다.
참조문헌
1 Porteus, M. H. & Carroll, D. Gene targeting using zinc finger nucleases. Nat Biotechnol 23, 967-973 (2005).
2 Boch, J. et al. Breaking the code of DNA binding specificity of TAL-type III effectors. Science 326, 1509-1512 (2009).
3 Moscou, M. J. & Bogdanove, A. J. A simple cipher governs DNA recognition by TAL effectors. Science 326, 1501 (2009).
4 Miller, J. C. et al. A TALE nuclease architecture for efficient genome editing. Nat Biotechnol 29, 143-148 (2011).
5 Jinek, M. et al. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science 337, 816-821 (2012).
6 Cong, L. et al. Multiplex genome engineering using CRISPR/Cas systems. Science 339, 819-823 (2013).
7 Mali, P. et al. RNA-guided human genome engineering via Cas9. Science 339, 823-826 (2013).
8 Komor, A. C., Kim, Y. B., Packer, M. S., Zuris, J. A. & Liu, D. R. Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage. Nature 533, 420-424 (2016).
9 Ma, Y. et al. Targeted AID-mediated mutagenesis (TAM) enables efficient genomic diversification in mammalian cells. Nat Methods 13, 1029-1035 (2016).
10 Gaudelli, N. M. et al. Programmable base editing of A*T to G*C in genomic DNA without DNA cleavage. Nature 551, 464-471 (2017).
11 Tan, M. H. et al. Dynamic landscape and regulation of RNA editing in mammals. Nature 550, 249-254 (2017).
12 Nishikura, K. Functions and regulation of RNA editing by ADAR deaminases. Annu Rev Biochem 79, 321-349 (2010).
13 Bass, B. L. & Weintraub, H. An unwinding activity that covalently modifies its double-stranded RNA substrate. Cell 55, 1089-1098 (1988).
14 Wong, S. K., Sato, S. & Lazinski, D. W. Substrate recognition by ADAR1 and ADAR2. RNA 7, 846-858 (2001).
15 Montiel-Gonzalez, M. F., Vallecillo-Viejo, I., Yudowski, G. A. & Rosenthal, J. J. Correction of mutations within the cystic fibrosis transmembrane conductance regulator by site-directed RNA editing. Proc Natl Acad Sci U S A 110, 18285-18290 (2013).
16 Sinnamon, J. R. et al. Site-directed RNA repair of endogenous Mecp2 RNA in neurons. Proc Natl Acad Sci U S A 114, E9395-E9402 (2017).
17 Montiel-Gonzalez, M. F., Vallecillo-Viejo, I. C. & Rosenthal, J. J. An efficient system for selectively altering genetic information within mRNAs. Nucleic Acids Res 44, e157 (2016).
18 Hanswillemenke, A., Kuzdere, T., Vogel, P., Jekely, G. & Stafforst, T. Site-Directed RNA Editing in Vivo Can Be Triggered by the Light-Driven Assembly of an Artificial Riboprotein. J Am Chem Soc 137, 15875-15881 (2015).
19 Schneider, M. F., Wettengel, J., Hoffmann, P. C. & Stafforst, T. Optimal guideRNAs for re-directing deaminase activity of hADAR1 and hADAR2 in trans. Nucleic Acids Res 42, e87 (2014).
20 Vogel, P., Hanswillemenke, A. & Stafforst, T. Switching Protein Localization by Site-Directed RNA Editing under Control of Light. ACS synthetic biology 6, 1642-1649 (2017).
21 Vogel, P., Schneider, M. F., Wettengel, J. & Stafforst, T. Improving site-directed RNA editing in vitro and in cell culture by chemical modification of the guideRNA. Angewandte Chemie 53, 6267-6271 (2014).
22 Vogel, P. et al. Efficient and precise editing of endogenous transcripts with SNAP-tagged ADARs. Nat Methods 15, 535-538 (2018).
23 Cox, D. B. T. et al. RNA editing with CRISPR-Cas13. Science 358, 1019-1027 (2017).
24 Fukuda, M. et al. Construction of a guide-RNA for site-directed RNA mutagenesis utilising intracellular A-to-I RNA editing. Scientific reports 7, 41478 (2017).
25 Wettengel, J., Reautschnig, P., Geisler, S., Kahle, P. J. & Stafforst, T. Harnessing human ADAR2 for RNA repair - Recoding a PINK1 mutation rescues mitophagy. Nucleic Acids Res 45, 2797-2808 (2017).
26 Heep, M., Mach, P., Reautschnig, P., Wettengel, J. & Stafforst, T. Applying Human ADAR1p110 and ADAR1p150 for Site-Directed RNA Editing-G/C Substitution Stabilizes GuideRNAs against Editing. Genes (Basel) 8 (2017).
27 Katrekar, D. et al. In vivo RNA editing of point mutations via RNA-guided adenosine deaminases. Nat Methods 16, 239-242 (2019).
28 Yin, H., Kauffman, K. J. & Anderson, D. G. Delivery technologies for genome editing. Nat Rev Drug Discov 16, 387-399 (2017).
29 Platt, R. J. et al. CRISPR-Cas9 knockin mice for genome editing and cancer modeling. Cell 159, 440-455 (2014).
30 Chew, W. L. et al. A multifunctional AAV-CRISPR-Cas9 and its host response. Nat Methods 13, 868-874 (2016).
31 Teoh, P. J. et al. Aberrant hyperediting of the myeloma transcriptome by ADAR1 confers oncogenicity and is a marker of poor prognosis. Blood 132, 1304-1317 (2018).
32 Vallecillo-Viejo, I. C., Liscovitch-Brauer, N., Montiel-Gonzalez, M. F., Eisenberg, E. & Rosenthal, J. J. C. Abundant off-target edits from site-directed RNA editing can be reduced by nuclear localization of the editing enzyme. RNA biology 15, 104-114 (2018).
33 Mays, L. E. & Wilson, J. M. The complex and evolving story of T cell activation to AAV vector-encoded transgene products. Mol Ther 19, 16-27 (2011).
34 Wagner, D. L. et al. High prevalence of Streptococcus pyogenes Cas9-reactive T cells within the adult human population. Nat Med 25, 242-248 (2019).
35 Simhadri, V. L. et al. Prevalence of Pre-existing Antibodies to CRISPR-Associated Nuclease Cas9 in the USA Population. Mol Ther Methods Clin Dev 10, 105-112 (2018).
36 Charlesworth, C. T. et al. Identification of preexisting adaptive immunity to Cas9 proteins in humans. Nat Med 25, 249-254 (2019).
37 Haapaniemi, E., Botla, S., Persson, J., Schmierer, B. & Taipale, J. CRISPR-Cas9 genome editing induces a p53-mediated DNA damage response. Nat Med 24, 927-930 (2018).
38 Ihry, R. J. et al. p53 inhibits CRISPR-Cas9 engineering in human pluripotent stem cells. Nat Med 24, 939-946 (2018).
39 Woolf, T. M., Chase, J. M. & Stinchcomb, D. T. Toward the therapeutic editing of mutated RNA sequences. Proc Natl Acad Sci U S A 92, 8298-8302 (1995).
40 Zheng, Y., Lorenzo, C. & Beal, P. A. DNA editing in DNA/RNA hybrids by adenosine deaminases that act on RNA. Nucleic Acids Res 45, 3369-3377 (2017).
41 Abudayyeh, O. O. et al. C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector. Science 353, aaf5573 (2016).
42 Daniel, C., Widmark, A., Rigardt, D. & Ohman, M. Editing inducer elements increases A-to-I editing efficiency in the mammalian transcriptome. Genome Biol 18, 195 (2017).
43 Chen, C. X. et al. A third member of the RNA-specific adenosine deaminase gene family, ADAR3, contains both single- and double-stranded RNA binding domains. RNA 6, 755-767 (2000).
44 Savva, Y. A., Rieder, L. E. & Reenan, R. A. The ADAR protein family. Genome Biol 13, 252 (2012).
45 Nishikura, K. A-to-I editing of coding and non-coding RNAs by ADARs. Nat Rev Mol Cell Biol 17, 83-96 (2016).
46 Floquet, C., Deforges, J., Rousset, J. P. & Bidou, L. Rescue of non-sense mutated p53 tumor suppressor gene by aminoglycosides. Nucleic Acids Res 39, 3350-3362 (2011).
47 Kern, S. E. et al. Identification of p53 as a sequence-specific DNA-binding protein. Science 252, 1708-1711 (1991).
48 Doubrovin, M. et al. Imaging transcriptional regulation of p53-dependent genes with positron emission tomography in vivo. Proc Natl Acad Sci U S A 98, 9300-9305 (2001).
49 Landrum, M. J. et al. ClinVar: public archive of interpretations of clinically relevant variants. Nucleic Acids Res 44, D862-868 (2016).
50 Ou, L. et al. ZFN-Mediated In Vivo Genome Editing Corrects Murine Hurler Syndrome. Mol Ther 27, 178-187 (2019).
51 Fire, A. et al. Potent and specific genetic interference by double-stranded RNA in Caenorhabditis elegans. Nature 391, 806-811 (1998).
52 Zuo, E. et al. Cytosine base editor generates substantial off-target single-nucleotide variants in mouse embryos. Science (2019).
53 Jin, S. et al. Cytosine, but not adenine, base editors induce genome-wide off-target mutations in rice. Science (2019).
54 Kim, D., Kim, D. E., Lee, G., Cho, S. I. & Kim, J. S. Genome-wide target specificity of CRISPR RNA-guided adenine base editors. Nat Biotechnol 37, 430-435 (2019).
55 Levanon, E. Y. et al. Systematic identification of abundant A-to-I editing sites in the human transcriptome. Nat Biotechnol 22, 1001-1005 (2004).
56 Merkle, T. et al. Precise RNA editing by recruiting endogenous ADARs with antisense oligonucleotides. Nat Biotechnol 37, 133-138 (2019).
57 Wagner, R. W. et al. Double-stranded RNA unwinding and modifying activity is detected ubiquitously in primary tissues and cell lines. Mol Cell Biol 10, 5586-5590 (1990).
58 Patterson, J. B. & Samuel, C. E. Expression and regulation by interferon of a double-stranded-RNA-specific adenosine deaminase from human cells: evidence for two forms of the deaminase. Mol Cell Biol 15, 5376-5388 (1995).
59 Gibson, D. G. et al. Enzymatic assembly of DNA molecules up to several hundred kilobases. Nat Methods 6, 343-345 (2009).
60 Zhou, Y., Zhang, H. & Wei, W. Simultaneous generation of multi-gene knockouts in human cells. FEBS Lett 590, 4343-4353 (2016).
61 Dobin, A. et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics 29, 15-21 (2013).
62 Van der Auwera, G. A. et al. From FastQ data to high confidence variant calls: the Genome Analysis Toolkit best practices pipeline. Curr Protoc Bioinformatics 43, 11 10 11-33 (2013).
63 Wang, K., Li, M. & Hakonarson, H. ANNOVAR: functional annotation of genetic variants from high-throughput sequencing data. Nucleic Acids Res 38, e164 (2010).
64 Genomes Project, C. et al. An integrated map of genetic variation from 1,092 human genomes. Nature 491, 56-65 (2012).
65 Pertea, M., Kim, D., Pertea, G. M., Leek, J. T. & Salzberg, S. L. Transcript-level expression analysis of RNA-seq experiments with HISAT, StringTie and Ballgown. Nat Protoc 11, 1650-1667 (2016).
SEQUENCE LISTING <110> EdiGene Inc. Peking University <120> Methods and Compositions for Editing RNAs <130> FD00220PCT <150> PCT/CN2019/082713 <151> 2019-04-15 <150> PCT/CN2019/130558 <151> 2019-12-31 <160> 416 <170> PatentIn version 3.5 <210> 1 <211> 708 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 1 atggtgagca agggcgagga ggataacatg gccatcatca aggagttcat gcgcttcaag 60 gtgcacatgg agggctccgt gaacggccac gagttcgaga tcgagggcga gggcgagggc 120 cgcccctacg agggcaccca gaccgccaag ctgaaggtga ccaagggtgg ccccctgccc 180 ttcgcctggg acatcctgtc ccctcagttc atgtacggct ccaaggccta cgtgaagcac 240 cccgccgaca tccccgacta cttgaagctg tccttccccg agggcttcaa gtgggagcgc 300 gtgatgaact tcgaggacgg cggcgtggtg accgtgaccc aggactcctc cctgcaggac 360 ggcgagttca tctacaaggt gaagctgcgc ggcaccaact tcccctccga cggccccgta 420 atgcagaaga agaccatggg ctgggaggcc tcctccgagc ggatgtaccc cgaggacggc 480 gccctgaagg gcgagatcaa gcagaggctg aagctgaagg acggcggcca ctacgacgct 540 gaggtcaaga ccacctacaa ggccaagaag cccgtgcagc tgcccggcgc ctacaacgtc 600 aacatcaagt tggacatcac ctcccacaac gaggactaca ccatcgtgga acagtacgaa 660 cgcgccgagg gccgccactc caccggcggc atggacgagc tgtacaag 708 <210> 2 <211> 99 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 2 ctgcagggcg gaggaggcag cggcggagga ggcagcggcg gaggaggcag cagaaggtat 60 acacgccgga agaatctgta gagatccccg gtcgccacc 99 <210> 3 <211> 717 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 3 gtgagcaagg gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc 60 gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc 120 aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc 180 gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcag 240 cacgacttct tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc 300 aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg 360 aaccgcatcg agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag 420 ctggagtaca actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc 480 atcaaggtga acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac 540 cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac 600 ctgagcaccc agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg 660 ctggagttcg tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaa 717 <210> 4 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 4 ctgcagggcg gaggaggcag cggcggagga ggcagcggcg gaggaggcag cgcctgctcg 60 cgatgctaga gggctctgcc a 81 <210> 5 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 5 ctgcagggcg gaggaggcag cgcctgctcg cgatgctaga gggctctgcc 50 <210> 6 <211> 101 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 6 ggaccacccc aaaaaugaau auaaccaaaa cugaacagcu ccucgcccuu gcucacuggc 60 agagcccucc agcaucgcga gcaggcgcug ccuccuccgc c 101 <210> 7 <211> 70 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 7 aaaccgaggg aucauagggg acugaaucca ccauucuucu cccaaucccu gcaacuccuu 60 cuuccccugc 70 <210> 8 <211> 70 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 8 ugaacagcuc cucgcccuug cucacuggca gagcccucca gcaucgcgag caggcgcugc 60 cuccuccgcc 70 <210> 9 <211> 111 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 9 atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgctatagg 60 gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111 <210> 10 <211> 111 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 10 atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgctaaagg 60 gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111 <210> 11 <211> 111 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 11 atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgctacagg 60 gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111 <210> 12 <211> 111 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 12 atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgctagagg 60 gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111 <210> 13 <211> 111 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 13 atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgcaatagg 60 gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111 <210> 14 <211> 111 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 14 atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgcaaaagg 60 gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111 <210> 15 <211> 111 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 15 atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgcaacagg 60 gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111 <210> 16 <211> 111 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 16 atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgcaagagg 60 gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111 <210> 17 <211> 111 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 17 atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgccatagg 60 gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111 <210> 18 <211> 111 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 18 atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgccaaagg 60 gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111 <210> 19 <211> 111 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 19 atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgccacagg 60 gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111 <210> 20 <211> 111 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 20 atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgccagagg 60 gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111 <210> 21 <211> 111 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 21 atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgcgatagg 60 gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111 <210> 22 <211> 111 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 22 atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgcgaaagg 60 gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111 <210> 23 <211> 111 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 23 atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgcgacagg 60 gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111 <210> 24 <211> 111 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 24 atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgcgagagg 60 gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111 <210> 25 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 25 uagcuguauc gucaaggcac ucuugccuac gccaccagcu ccaaccacca caaguuuaua 60 uucagucauu uucagcaggc cucucucccg c 91 <210> 26 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 26 gauucugaau uagcuguauc gucaaggcac ucuugccuac gccaccagcu ccaacuacca 60 caaguuuaua uucagucauu uucagcaggc cucucucccg caccugggag c 111 <210> 27 <211> 131 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 27 uccacaaaau gauucugaau uagcuguauc gucaaggcac ucuugccuac gccaccagcu 60 ccaacuacca caaguuuaua uucagucauu uucagcaggc cucucucccg caccugggag 120 ccgcugagcc u 131 <210> 28 <211> 151 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 28 aucauauucg uccacaaaau gauucugaau uagcuguauc gucaaggcac ucuugccuac 60 gccaccagcu ccaaccacca caaguuuaua uucagucauu uucagcaggc cucucucccg 120 caccugggag ccgcugagcc ucuggccccg c 151 <210> 29 <211> 171 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 29 cuauuguugg aucauauucg uccacaaaau gauucugaau uagcuguauc gucaaggcac 60 ucuugccuac gccaccagcu ccaaccacca caaguuuaua uucagucauu uucagcaggc 120 cucucucccg caccugggag ccgcugagcc ucuggccccg ccgccgccuu c 171 <210> 30 <211> 191 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 30 uaggaauccu cuauuguugg aucauauucg uccacaaaau gauucugaau uagcuguauc 60 gucaaggcac ucuugccuac gccaccagcu ccaaccacca caaguuuaua uucagucauu 120 uucagcaggc cucucucccg caccugggag ccgcugagcc ucuggccccg ccgccgccuu 180 cagugccugc g 191 <210> 31 <211> 151 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 31 gaggcgcagc auccacaggc ggaggcgaaa gcagcccgga cagcugaggc cggaagaggg 60 uggggccgcg guggccaggg agccggcgcc gccacgcgcg gguggggggg acugggguug 120 cucgcgggcu ccgggcgggc ggcgggcgcc g 151 <210> 32 <211> 151 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 32 uccuguagcu aaggccacaa aauuauccac uguuuuugga acagucuuuc cgaagagacc 60 aaagaucacc cggcccacau cuucaucucc aauucguagg ucaaaauaca ccuugacggu 120 gacuuugggc cccuucuucu ucucaucggc c 151 <210> 33 <211> 151 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 33 gcccuggauc augaaguccu ugauuacacg auggaauuug cuguuuuugu agccaaaucc 60 uuucucuccu guagccaagg ccacaaaauu auccacuguu uuuggaacag ucuuuccgaa 120 gagaccaaag aucacccggc cuacaucuuc a 151 <210> 34 <211> 72 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 34 gcgcaaguua gguuuuguca agaaagggug uaacgcaacc aagucauagu ccgccuagaa 60 gcauuugcgg ug 72 <210> 35 <211> 131 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 35 gccaugccaa ucucaucuug uuuucugcgc aaguuagguu uugucaagaa aggguguaac 60 gcaaccaagu cauaguccgc cuagaagcau uugcggugga cgauggaggg gccggacucg 120 ucauacuccu g 131 <210> 36 <211> 70 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 36 ggacuuccug uaacaacgca ucucauauuu ggaaugacca uuaaaaaaac aacaaugugc 60 aaucaaaguc 70 <210> 37 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 37 caaggugcgg cuccggcccc uccccucuuc aaggggucca cauggcaacu gugaggaggg 60 gagauucagu g 71 <210> 38 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 38 uagcuguauc gucaaggcac ucgugccgac gccaccagcu ccaaccacca caaggggaga 60 gucagucagg gucagcaggc cucucucccg c 91 <210> 39 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 39 uagcuguauc gucaaggcac ucuugccgac gccaccagcu ccaaccacca caaguguaua 60 gucagucauu uucagcaggc cucucucccg c 91 <210> 40 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 40 uagcuggauc gucaaggcac ucgugccgac gccaccagcu ccaaccacca caaggggaga 60 ggcagucagg gucagcaggc cucucucccg c 91 <210> 41 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 41 gauucugaau uagcuguauc gucaaggcac ucuugccgac gccaccagcu ccaaccacca 60 caaguguaua gucagucauu uucagcaggc cucucucccg caccugggag c 111 <210> 42 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 42 gauucugaau uagcuguauc gucaaggcac ucgugccgac gccaccagcu ccaaccacca 60 caaguggaga gucagucauu uucagcaggc cucucucccg caccugggag c 111 <210> 43 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 43 gauucugaau uagcuguauc gucaaggcac ucgugccgac gccaccagcu ccaaccacca 60 caaggggaga gucagucagg gucagcaggc cucucucccg caccugggag c 111 <210> 44 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 44 gcuccccggu gcgggagaga ggccugcuga cccugacugc cucuccccuu guggugguug 60 gagcuggugg cgucggcacg agugccuuga cgauccagcu aauucagaau c 111 <210> 45 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 45 tctcagtcca atgtatggtc cgagcacaag ctctaatcaa agtccgcggg tgtagaccgg 60 ttgccatagg a 71 <210> 46 <211> 31 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 46 ggaccacccc aaaaaugaag gggacuaaaa c 31 <210> 47 <211> 70 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 47 aaaccgaggg aucauagggg acugaaucca ccauucuucu cccaaucccu gcaacuccuu 60 cuuccccugc 70 <210> 48 <211> 14 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 48 gcagagccuc cagc 14 <210> 49 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 49 cucacuggca gagccuccag c 21 <210> 50 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 50 cccuugcuca cuggcagagc cuccagc 27 <210> 51 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 51 cucucgcccu ugcucacugg cagagccucc agc 33 <210> 52 <211> 38 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 52 cucucgcccu ugcucacugg cagagccucc agcaucgc 38 <210> 53 <211> 45 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 53 ugaacagcuc ucgcccuugc ucacuggcag agccuccagc aucgc 45 <210> 54 <211> 70 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 54 ugaacagcuc cucgcccuug cucacuggca gagcccucca gcaucgcgag caggcgcugc 60 cuccuccgcc 70 <210> 55 <211> 70 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 55 aaaccgaggg aucauagggg acugaaucca ccauucuucu cccaaucccu gcaacuccuu 60 cuuccccugc 70 <210> 56 <211> 70 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 56 ugaacagcuc cucgcccuug cucacuggca gagcccucca gcaucgcgag caggcgcugc 60 cuccuccgcc 70 <210> 57 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 57 ucucagucca auguaugguc cgagcacaag cucuaaucaa aguccgcggg uguagaccgg 60 uugccauagg a 71 <210> 58 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 58 acagcuccuc gcccuugcuc acuggcagag cccuccagca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 59 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 59 acagcuccuc gcccuugcuc acuggcagag cccucaagca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 60 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 60 acagcuccuc gcccuugcuc acuggcagag cccucuagca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 61 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 61 acagcuccuc gcccuugcuc acuggcagag cccucgagca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 62 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 62 acagcuccuc gcccuugcuc acuggcagag cccugcagca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 63 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 63 acagcuccuc gcccuugcuc acuggcagag cccuucagca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 64 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 64 acagcuccuc gcccuugcuc acuggcagag cccuacagca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 65 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 65 acagcuccuc gcccuugcuc acuggcagag cccuccugca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 66 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 66 acagcuccuc gcccuugcuc acuggcagag cccugcugca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 67 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 67 acagcuccuc gcccuugcuc acuggcagag cccuucugca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 68 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 68 acagcuccuc gcccuugcuc acuggcagag cccuacugca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 69 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 69 acagcuccuc gcccuugcuc acuggcagag cccucccgca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 70 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 70 acagcuccuc gcccuugcuc acuggcagag cccugccgca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 71 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 71 acagcuccuc gcccuugcuc acuggcagag cccuuccgca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 72 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 72 acagcuccuc gcccuugcuc acuggcagag cccuaccgca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 73 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 73 acagcuccuc gcccuugcuc acuggcagag cccuccggca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 74 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 74 acagcuccuc gcccuugcuc acuggcagag cccugcugca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 75 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 75 acagcuccuc gcccuugcuc acuggcagag cccuucggca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 76 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 76 acagcuccuc gcccuugcuc acuggcagag cccuacggca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 77 <211> 31 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 77 acuggcagag cccuccagca ucgcgagcag g 31 <210> 78 <211> 51 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 78 gcccuugcuc acuggcagag cccuccagca ucgcgagcag gcgcugccuc c 51 <210> 79 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 79 acagcuccuc gcccuugcuc acuggcagag cccuccagca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 80 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 80 accccgguga acagcuccuc gcccuugcuc acuggcagag cccuccagca ucgcgagcag 60 gcgcugccuc cuccgccgcu gccuccuccg c 91 <210> 81 <211> 131 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 81 gcucgaccag gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag 60 cccuccagca ucgcgagcag gcgcugccuc cuccgccgcu gccuccuccg ccgcugccuc 120 cuccgcccug c 131 <210> 82 <211> 151 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 82 ucgccgucca gcucgaccag gaugggcacc accccgguga acagcuccuc gcccuugcuc 60 acuggcagag cccuccagca ucgcgagcag gcgcugccuc cuccgccgcu gccuccuccg 120 ccgcugccuc cuccgcccug cagcuuguac a 151 <210> 83 <211> 171 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 83 gccguuuacg ucgccgucca gcucgaccag gaugggcacc accccgguga acagcuccuc 60 gcccuugcuc acuggcagag cccuccagca ucgcgagcag gcgcugccuc cuccgccgcu 120 gccuccuccg ccgcugccuc cuccgcccug cagcuuguac agcucgucca u 171 <210> 84 <211> 191 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 84 ugaacuugug gccguuuacg ucgccgucca gcucgaccag gaugggcacc accccgguga 60 acagcuccuc gcccuugcuc acuggcagag cccuccagca ucgcgagcag gcgcugccuc 120 cuccgccgcu gccuccuccg ccgcugccuc cuccgcccug cagcuuguac agcucgucca 180 ugccgccggu g 191 <210> 85 <211> 211 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 85 ccggacacgc ugaacuugug gccguuuacg ucgccgucca gcucgaccag gaugggcacc 60 accccgguga acagcuccuc gcccuugcuc acuggcagag cccuccagca ucgcgagcag 120 gcgcugccuc cuccgccgcu gccuccuccg ccgcugccuc cuccgcccug cagcuuguac 180 agcucgucca ugccgccggu ggaguggcgg c 211 <210> 86 <211> 31 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 86 gcgaccgggg aucuccacag auucuuccgg c 31 <210> 87 <211> 51 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 87 gcucacggug gcgaccgggg aucuccacag auucuuccgg cguguauacc u 51 <210> 88 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 88 ccucgcccuu gcucacggug gcgaccgggg aucuccacag auucuuccgg cguguauacc 60 uucugcugcc u 71 <210> 89 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 89 gugaacagcu ccucgcccuu gcucacggug gcgaccgggg aucuccacag auucuuccgg 60 cguguauacc uucugcugcc uccuccgccg c 91 <210> 90 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 90 caccaccccg gugaacagcu ccucgcccuu gcucacggug gcgaccgggg aucuccacag 60 auucuuccgg cguguauacc uucugcugcc uccuccgccg cugccuccuc c 111 <210> 91 <211> 131 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 91 ccaggauggg caccaccccg gugaacagcu ccucgcccuu gcucacggug gcgaccgggg 60 aucuccacag auucuuccgg cguguauacc uucugcugcc uccuccgccg cugccuccuc 120 cgccgcugcc u 131 <210> 92 <211> 151 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 92 uccagcucga ccaggauggg caccaccccg gugaacagcu ccucgcccuu gcucacggug 60 gcgaccgggg aucuccacag auucuuccgg cguguauacc uucugcugcc uccuccgccg 120 cugccuccuc cgccgcugcc uccuccgccc u 151 <210> 93 <211> 171 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 93 cggcgacgua uccagcucga ccaggauggg caccaccccg gugaacagcu ccucgcccuu 60 gcucacggug gcgaccgggg aucuccacag auucuuccgg cguguauacc uucugcugcc 120 uccuccgccg cugccuccuc cgccgcugcc uccuccgccc ugcagcuugu a 171 <210> 94 <211> 191 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 94 uguggccguu uacgucgccg uccagcucga ccaggauggg caccaccccg gugaacagcu 60 ccucgcccuu gcucacggug gcgaccgggg aucuccacag auucuuccgg cguguauacc 120 uucugcugcc uccuccgccg cugccuccuc cgccgcugcc uccuccgccc ugcagcuugu 180 acagcucguc c 191 <210> 95 <211> 211 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 95 acgcugaacu uguggccguu uacgucgccg uccagcucga ccaggauggg caccaccccg 60 gugaacagcu ccucgcccuu gcucacggug gcgaccgggg aucuccacag auucuuccgg 120 cguguauacc uucugcugcc uccuccgccg cugccuccuc cgccgcugcc uccuccgccc 180 ugcagcuugu acagcucguc caugccgccg g 211 <210> 96 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 96 cagcaucgcg agcaggcgcu gccuccuccg ccgcugccuc cuccgccgcu gccuccuccg 60 cccugcagcu u 71 <210> 97 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 97 cccuccagca ucgcgagcag gcgcugccuc cuccgccgcu gccuccuccg ccgcugccuc 60 cuccgcccug c 71 <210> 98 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 98 cagagcccuc cagcaucgcg agcaggcgcu gccuccuccg ccgcugccuc cuccgccgcu 60 gccuccuccg c 71 <210> 99 <211> 72 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 99 acuggcagag cccucccagc aucgcgagca ggcgcugccu ccuccgccgc ugccuccucc 60 gccgcugccu cc 72 <210> 100 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 100 ugcucacugg cagagcccuc cagcaucgcg agcaggcgcu gccuccuccg ccgcugccuc 60 cuccgccgcu g 71 <210> 101 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 101 gcccuugcuc acuggcagag cccuccagca ucgcgagcag gcgcugccuc cuccgccgcu 60 gccuccuccg c 71 <210> 102 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 102 uccucgcccu ugcucacugg cagagcccuc cagcaucgcg agcaggcgcu gccuccuccg 60 ccgcugccuc c 71 <210> 103 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 103 ggugaacagc uccucgcccu ugcucacugg cagagcccuc cagcaucgcg agcaggcgcu 60 gccuccuccg c 71 <210> 104 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 104 accccgguga acagcuccuc gcccuugcuc acuggcagag cccuccagca ucgcgagcag 60 gcgcugccuc c 71 <210> 105 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 105 gcaccacccc ggugaacagc uccucgcccu ugcucacugg cagagcccuc cagcaucgcg 60 agcaggcgcu g 71 <210> 106 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 106 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuccagca 60 ucgcgagcag g 71 <210> 107 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 107 accaggaugg gcaccacccc ggugaacagc uccucgcccu ugcucacugg cagagcccuc 60 cagcaucgcg a 71 <210> 108 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 108 gcucgaccag gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag 60 cccuccagca u 71 <210> 109 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 109 guccagcucg accaggaugg gcaccacccc ggugaacagc uccucgcccu ugcucacugg 60 cagagcccuc c 71 <210> 110 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 110 cacagauucu uccggcgugu auaccuucug cugccuccuc cgccgcugcc uccuccgccg 60 cugccuccuc c 71 <210> 111 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 111 aucuccacag auucuuccgg cguguauacc uucugcugcc uccuccgccg cugccuccuc 60 cgccgcugcc u 71 <210> 112 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 112 cggggaucuc cacagauucu uccggcgugu auaccuucug cugccuccuc cgccgcugcc 60 uccuccgccg c 71 <210> 113 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 113 gcgaccgggg aucuccacag auucuuccgg cguguauacc uucugcugcc uccuccgccg 60 cugccuccuc c 71 <210> 114 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 114 cgguggcgac cggggaucuc cacagauucu uccggcgugu auaccuucug cugccuccuc 60 cgccgcugcc u 71 <210> 115 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 115 gcucacggug gcgaccgggg aucuccacag auucuuccgg cguguauacc uucugcugcc 60 uccuccgccg c 71 <210> 116 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 116 cccuugcuca cgguggcgac cggggaucuc cacagauucu uccggcgugu auaccuucug 60 cugccuccuc c 71 <210> 117 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 117 cagcuccucg cccuugcuca cgguggcgac cggggaucuc cacagauucu uccggcgugu 60 auaccuucug c 71 <210> 118 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 118 gugaacagcu ccucgcccuu gcucacggug gcgaccgggg aucuccacag auucuuccgg 60 cguguauacc u 71 <210> 119 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 119 ccccggugaa cagcuccucg cccuugcuca cgguggcgac cggggaucuc cacagauucu 60 uccggcgugu a 71 <210> 120 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 120 caccaccccg gugaacagcu ccucgcccuu gcucacggug gcgaccgggg aucuccacag 60 auucuuccgg c 71 <210> 121 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 121 augggcacca ccccggugaa cagcuccucg cccuugcuca cgguggcgac cggggaucuc 60 cacagauucu u 71 <210> 122 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 122 ccaggauggg caccaccccg gugaacagcu ccucgcccuu gcucacggug gcgaccgggg 60 aucuccacag a 71 <210> 123 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 123 cucgaccagg augggcacca ccccggugaa cagcuccucg cccuugcuca cgguggcgac 60 cggggaucuc c 71 <210> 124 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 124 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuccagca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 125 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 125 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccugcagca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 126 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 126 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuucagca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 127 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 127 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuacagca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 128 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 128 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuccggca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 129 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 129 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccugcggca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 130 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 130 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuucggca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 131 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 131 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuacggca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 132 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 132 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuccugca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 133 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 133 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccugcugca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 134 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 134 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuacugca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 135 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 135 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuucugca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 136 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 136 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucccgca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 137 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 137 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccugccgca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 138 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 138 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuuccgca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 139 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 139 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuaccgca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 140 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 140 uaccgcuaca gccacgcuga uuucagcuau accugcccgg uauaaaggga cguucacacc 60 gcgauguucu cugcugggga auugcgcgau auucaggauu aaaagaagug c 111 <210> 141 <211> 151 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 141 acuacaguug cuccgauauu uaggcuacgu caauaggcac uaacuuauug gcgcugguga 60 acggacuucc ucucgaguac cagaagauga cuacaaaacu ccuuuccauu gcgaguaucg 120 gagucuggcu caguuuggcc agggaggcac u 151 <210> 142 <211> 51 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 142 cggaagaggg uggggccgcg guggccaggg agccggcgcc gccacgcgcg g 51 <210> 143 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 143 cagcugaggc cggaagaggg uggggccgcg guggccaggg agccggcgcc gccacgcgcg 60 gguggggggg a 71 <210> 144 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 144 ggaggcgaaa gcagcccgga cagcugaggc cggaagaggg uggggccgcg guggccaggg 60 agccggcgcc gccacgcgcg gguggggggg acugggguug cucgcgggcu c 111 <210> 145 <211> 151 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 145 gaggcgcagc auccacaggc ggaggcgaaa gcagcccgga cagcugaggc cggaagaggg 60 uggggccgcg guggccaggg agccggcgcc gccacgcgcg gguggggggg acugggguug 120 cucgcgggcu ccgggcgggc ggcgggcgcc g 151 <210> 146 <211> 51 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 146 ucuugccuac gccaccagcu ccaaccacca caaguuuaua uucagucauu u 51 <210> 147 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 147 gauucugaau uagcuguauc gucaaggcac ucuugccuac gccaccagcu ccaaccacca 60 caaguuuaua uucagucauu uucagcaggc cucucucccg caccugggag c 111 <210> 148 <211> 151 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 148 aucauauucg uccacaaaau gauucugaau uagcuguauc gucaaggcac ucuugccuac 60 gccaccagcu ccaaccacca caaguuuaua uucagucauu uucagcaggc cucucucccg 120 caccugggag ccgcugagcc ucuggccccg c 151 <210> 149 <211> 51 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 149 ucggcauggu augaaguacu ucguccagga gcuggagggc ccgguguaag u 51 <210> 150 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 150 gggucugcaa ucggcauggu augaaguacu ucguccagga gcuggagggc ccgguguaag 60 ugaauuucaa u 71 <210> 151 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 151 gaccucaguc uaaagguugu gggucugcaa ucggcauggu augaaguacu ucguccagga 60 gcuggagggc ccgguguaag ugaauuucaa uccagcaagg uguuucuuug a 111 <210> 152 <211> 151 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 152 uaagggcccc aacgguaaaa gaccucaguc uaaagguugu gggucugcaa ucggcauggu 60 augaaguacu ucguccagga gcuggagggc ccgguguaag ugaauuucaa uccagcaagg 120 uguuucuuug augcucuguc uuggguaauc c 151 <210> 153 <211> 51 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 153 ugggggguuc ggcugccgac aucagcaauu gcucugccac caucucagcc c 51 <210> 154 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 154 agcagggccg ugggggguuc ggcugccgac aucagcaauu gcucugccac caucucagcc 60 cauccuccga a 71 <210> 155 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 155 aguagaaggc caagagccac agcagggccg ugggggguuc ggcugccgac aucagcaauu 60 gcucugccac caucucagcc cauccuccga agugaaugaa caggaaccag c 111 <210> 156 <211> 151 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 156 ccucccauca cgggggccgu aguagaaggc caagagccac agcagggccg ugggggguuc 60 ggcugccgac aucagcaauu gcucugccac caucucagcc cauccuccga agugaaugaa 120 caggaaccag cucucaaagg gaccuccgca g 151 <210> 157 <211> 151 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 157 gccaaacacc acatgcttgc catctagcca ggctgtcttg actgtcgtga tgaagaactg 60 ggagccgttg gtgtccttgc ctgcgttggc catgctcacc cagccaggcc cgtagtgctt 120 cagtttgaag ttctcatcgg ggaagcgctc a 151 <210> 158 <211> 151 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 158 gggagtgggt ccgctccacc agatgccagc accggggcca gtgcagctca gagccctgtg 60 gcggactaca gggcccgcac agacggtcac tcaaagaaag atgtccctgt gccctactcc 120 ttggcgatgg caaagggctt ctccacctcg a 151 <210> 159 <211> 151 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 159 tgcattttgt aaaatagata ctagcagatt gtcccaagat gtgtacagct cattctcaca 60 gcccagcgag ggcacctact ccacaaatgc gtggccacag gtcatcacct gtcctgtggc 120 cctggcgagc ctgatccctc acgccgggca c 151 <210> 160 <211> 151 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 160 gctcattctc acagcccagc gagggcactt actccacaaa tgcgtggcca caggtcatca 60 cctgtcctgt ggccccggcg agcctgatcc ctcacgccgg gcacccacac ggcctgcgtg 120 ccttctagac ttgagttcgc agctctttaa g 151 <210> 161 <211> 151 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 161 tcggccgggc cctgggggcg gtgggcgctg gccaggacgc ccaccgtgtg gttgctgtcc 60 aggacggtcc cggcccgcga cacttcggcc cagagctgct cctcatccag cagcgccagc 120 agccccatgg ccgtgagcac cggcttgcgc a 151 <210> 162 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 162 ugaccagucu uaagaucuuu cuugaccugc accauaagaa cuucuccaaa gguaccaaaa 60 uacucuuuca gguccuguuc gguuguuuuc caugggagac ccaacacuau u 111 <210> 163 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 163 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgagca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 164 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 164 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuggagca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 165 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 165 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuugagca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 166 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 166 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuagagca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 167 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 167 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgggca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 168 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 168 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuggggca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 169 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 169 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuugggca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 170 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 170 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuagggca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 171 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 171 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgugca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 172 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 172 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuggugca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 173 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 173 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuagugca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 174 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 174 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuugugca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 175 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 175 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgcgca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 176 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 176 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuggcgca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 177 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 177 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuugcgca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 178 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 178 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuagcgca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 179 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 179 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgagca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 180 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 180 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuggagca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 181 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 181 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuugagca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 182 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 182 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuagagca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 183 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 183 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgugca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 184 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 184 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgggca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 185 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 185 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgcgca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 186 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 186 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgugca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 187 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 187 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuggugca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 188 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 188 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuugugca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 189 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 189 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuagugca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 190 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 190 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgagca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 191 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 191 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgcgca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 192 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 192 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgggca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 193 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 193 gauucugaau uagcuguauc gucaaggcac ucgugccgac gccaccagcu ccaaccacca 60 caaguggaga gucagucauu uucagcaggc cucucucccg caccugggag c 111 <210> 194 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 194 gauucugaau uagcuggauc gucaaggcac ucgggccgac gccaccagcu ccaaccacca 60 caaguggaga gucagucauu uucagcaggc cucucucccg caccggggag c 111 <210> 195 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 195 gggagcagcc ucuggcauuc ugggagcuuc aucuggaccu gggucuucag ugaaccauug 60 uucaauaucg uccggggaca gcaucaaauc auccauugcu ugggacggca a 111 <210> 196 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 196 gggagcagcc ucuggcauuc ugggagcuuc aucuggaccu gggucuucag ugaaccauug 60 uucaagaucg uccggggaca gcaucaaauc auccauugcu ugggacggca a 111 <210> 197 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 197 gggagcagcc ucuggcaguc ggggagcuuc aucuggaccu gggucuucag ugaaccauug 60 uucaagaucg uccggggaca gcaucaaauc auccagugcu ugggacggca a 111 <210> 198 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 198 cauauuacag aauaccuuga uagcauccaa uuugcauccu ugguuagggu caacccagua 60 uucuccacuc uugaguucag gauggcagaa uuucaggucu cugcaguuuc u 111 <210> 199 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 199 gugaagauaa gccaguccuc uaguaacaga augagcaaga cggcaagagc uuacccaguc 60 acuugugugg agacuuaaau acuugcauaa agauccauug ggauaguacu c 111 <210> 200 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 200 gugaacguca aacugucgga ccaauauggc agaaucuucu cucaucucaa cuuuccauau 60 ccguaucaug gaaucauagc auccuguaac uacuagcucu cuuacagcug g 111 <210> 201 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 201 gccaaugauc ucgugaguua ucucagcagu gugagccauc agggugauga caucccaggc 60 gaucgugugg ccuccaggag cccagagcag gaaguugagg agaaggugcc u 111 <210> 202 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 202 caagacggug aaccacucca uggucuucuu gucggcuuuc ugcacugugu acccccagag 60 cuccguguug ccgacauccu gggguggcuu ccacuccaga gccacauuaa g 111 <210> 203 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 203 aggauucucu uuugaaguau ugcuccccca guggauuggg uggcuccauu cacuccaaug 60 cugagcacuu ccacagagug gguuaaagcg gcuccgaaca cgaaacgugu a 111 <210> 204 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 204 gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60 cugcuccuca uccagcagcg ccagcagccc cauggccgug agcaccggcu u 111 <210> 205 <211> 111 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 205 gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60 cugcuccuca ucugcggggc gggggggggc cgucgccgcg uggggucguu g 111 <210> 206 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 206 tataactagt atggtgagca agggcgagga g 31 <210> 207 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 207 tatacgtctc atctacagat tcttccggcg tgtatacctt c 41 <210> 208 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 208 tatacgtctc atagagatcc ccggtcgcca ccgtgagcaa gggcgaggag ctg 53 <210> 209 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 209 tataggcgcg ccttacttgt acagctcgtc catgcc 36 <210> 210 <211> 94 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 210 tatacgtctc aaggcgctgc ctcctccgcc gctgcctcct ccgccgctgc ctcctccgcc 60 ctgcagcttg tacagctcgt ccatgccgcc ggtg 94 <210> 211 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 211 tatacgtctc agcctgctcg cgatgctaga gggctctgcc agtgagcaag ggcgaggagc 60 tg 62 <210> 212 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 212 tataactagt atggtggatt acaaggatga cgacgataag atgaaagtga cgaaggtagg 60 aggcatttcg 70 <210> 213 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 213 atatggcgcg ccgttttcag actttttctc ttccattttg tattcaaaca taatcttcac 60 <210> 214 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 214 tataggcgcg ccaggcggag gaggcagcgg cggaggaggc agcctcctcc tctcaaggtc 60 cccagaagc 69 <210> 215 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 215 tatacctgca ggctacacct tgcgtttttt cttgggtact gggcagagat aaaagttctt 60 ttcc 64 <210> 216 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 216 cactccaccg gcggcatgga cgag 24 <210> 217 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 217 cacgctgaac ttgtggccgt ttacgtcg 28 <210> 218 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 218 tataactagt atgaatccgc ggcaggggta ttccctcagc 40 <210> 219 <211> 73 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 219 tataggcgcg ccctacttat cgtcgtcatc cttgtaatct actgggcaga gataaaagtt 60 cttttcctcc tgg 73 <210> 220 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 220 tataactagt atggatatag aagatgaaga aaacatgagt tc 42 <210> 221 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 221 tataggcgcg ccctacttat cgtcgtcatc cttgtaatcg ggcgtgagtg agaactggtc 60 ctgctcg 67 <210> 222 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 222 tataactagt atggccgaga tcaaggagaa aatctgc 37 <210> 223 <211> 73 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 223 tataggcgcg ccctacttat cgtcgtcatc cttgtaatct actgggcaga gataaaagtt 60 cttttcctcc tgg 73 <210> 224 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 224 cgccatttcg gactgggag 19 <210> 225 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 225 agagacaggt ttctccatca attac 25 <210> 226 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 226 gagcccgcga gcaacc 16 <210> 227 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 227 gcagcaggaa gaagacggac 20 <210> 228 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 228 agaagcagtt gaagaccaga ctc 23 <210> 229 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 229 ggccttcacc tggaccatag 20 <210> 230 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 230 agagaagcag ttgaagacca ga 22 <210> 231 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 231 cggccttcac ctggaccata 20 <210> 232 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 232 cagagaagca gttgaagacc aga 23 <210> 233 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 233 cggccttcac ctggaccata 20 <210> 234 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 234 tttgtgaaag gctggggacc 20 <210> 235 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 235 acaggattgt attttgtagt ccacc 25 <210> 236 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 236 aggatgagtt ttgtgaaagg ctg 23 <210> 237 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 237 attttgtagt ccaccatcct gata 24 <210> 238 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 238 gatgagtttt gtgaaaggct gg 22 <210> 239 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 239 attttgtagt ccaccatcct gataa 25 <210> 240 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 240 cgaagagaac gagaccgcat 20 <210> 241 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 241 gaagatggtg cacaccggg 19 <210> 242 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 242 gacagatgct tcatcagcag tg 22 <210> 243 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 243 cgaacaaagc caaacccctt t 21 <210> 244 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 244 tctgttaatg gacaaataga aagcc 25 <210> 245 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 245 ggaacattca aaggattggc act 23 <210> 246 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 246 agtcactgca gatggacgca 20 <210> 247 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 247 atctcgatgg gaaattgcag gt 22 <210> 248 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 248 tcagagtttt acctcatcct tcttt 25 <210> 249 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 249 cctgaataca tatgatgacc ttcag 25 <210> 250 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 250 agggcacaga cacagacctc 20 <210> 251 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 251 agggctttca atgccaagac g 21 <210> 252 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 252 tgacaagcca agtcctccc 19 <210> 253 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 253 attgccaatg atgagctctg g 21 <210> 254 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 254 ttatagacat aagttctcct tgcct 25 <210> 255 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 255 tcaatcccat ggagccaaca 20 <210> 256 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 256 tacacgacgc tcttccgatc ttaagtagag gccgccactc caccggcggc 50 <210> 257 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 257 tacacgacgc tcttccgatc tatcatgctt agccgccact ccaccggcgg c 51 <210> 258 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 258 tacacgacgc tcttccgatc tgatgcacat ctgccgccac tccaccggcg gc 52 <210> 259 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 259 tacacgacgc tcttccgatc tcgattgctc gacgccgcca ctccaccggc ggc 53 <210> 260 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 260 tacacgacgc tcttccgatc ttcgatagca attcgccgcc actccaccgg cggc 54 <210> 261 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 261 tacacgacgc tcttccgatc tatcgatagt tgcttgccgc cactccaccg gcggc 55 <210> 262 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 262 tacacgacgc tcttccgatc tgatcgatcc agttaggccg ccactccacc ggcggc 56 <210> 263 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 263 tacacgacgc tcttccgatc tcgatcgatt tgagcctgcc gccactccac cggcggc 57 <210> 264 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 264 tacacgacgc tcttccgatc tacgatcgat acacgatcgc cgccactcca ccggcggc 58 <210> 265 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 265 tacacgacgc tcttccgatc ttacgatcga tggtccagag ccgccactcc accggcggc 59 <210> 266 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 266 agacgtgtgc tcttccgatc ttaagtagag tcgccgtcca gctcgaccag 50 <210> 267 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 267 agacgtgtgc tcttccgatc tatcatgctt atcgccgtcc agctcgacca g 51 <210> 268 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 268 agacgtgtgc tcttccgatc tgatgcacat cttcgccgtc cagctcgacc ag 52 <210> 269 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 269 agacgtgtgc tcttccgatc tcgattgctc gactcgccgt ccagctcgac cag 53 <210> 270 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 270 agacgtgtgc tcttccgatc ttcgatagca attctcgccg tccagctcga ccag 54 <210> 271 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 271 agacgtgtgc tcttccgatc tatcgatagt tgctttcgcc gtccagctcg accag 55 <210> 272 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 272 agacgtgtgc tcttccgatc tgatcgatcc agttagtcgc cgtccagctc gaccag 56 <210> 273 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 273 agacgtgtgc tcttccgatc tcgatcgatt tgagccttcg ccgtccagct cgaccag 57 <210> 274 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 274 agacgtgtgc tcttccgatc tacgatcgat acacgatctc gccgtccagc tcgaccag 58 <210> 275 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 275 agacgtgtgc tcttccgatc ttacgatcga tggtccagat cgccgtccag ctcgaccag 59 <210> 276 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 276 ggggaactcg ggcaacct 18 <210> 277 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 277 gaatcggatc tgccccgtg 19 <210> 278 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 278 catcgaggcc aagctggaa 19 <210> 279 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 279 gtagtgagga gggagacccc 20 <210> 280 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 280 aagcctcctt ccttccccaa 20 <210> 281 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 281 atcgatacac tccctagccc a 21 <210> 282 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 282 acaaattcgg tacatcctcg ac 22 <210> 283 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 283 ttcagccatc tttggaaggt t 21 <210> 284 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 284 acgccgcatt gaccatctat 20 <210> 285 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 285 tagccaggag gttctcaaca 20 <210> 286 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 286 ggcatggact gtggtcatga g 21 <210> 287 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 287 tgcaccacca actgcttagc 20 <210> 288 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 288 ccccgtaatg cagaagaaga cc 22 <210> 289 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 289 gtccttcagc ttcagcctct g 21 <210> 290 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 290 aacgcaacat gaaggtgctc 20 <210> 291 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 291 accttgacgg tgactttggg 20 <210> 292 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 292 cagtgcaatg agggaccagt 20 <210> 293 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 293 aggaccatag gtacatcttc agag 24 <210> 294 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 294 cgaacgagtt gtatcacctg ga 22 <210> 295 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 295 cgatggctgt ccctcaaagt 20 <210> 296 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 296 agttgctctt ttcactcaag gtc 23 <210> 297 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 297 ttctctctga gttcagacgc t 21 <210> 298 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 298 tacacgacgc tcttccgatc ttaagtagag tggcacagga ggaaagagca tc 52 <210> 299 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 299 agacgtgtgc tcttccgatc ttaagtagag gcaccacctc catgccctc 49 <210> 300 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 300 tacacgacgc tcttccgatc ttaagtagag catcgcagac tgcggcaag 49 <210> 301 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 301 agacgtgtgc tcttccgatc ttaagtagag agtccatggg cctgtggaat gt 52 <210> 302 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 302 gaaaaactgg cccgagagc 19 <210> 303 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 303 ctgagtctgg gctgagggac 20 <210> 304 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 304 cgcttccagg tcaacaacac 20 <210> 305 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 305 ctcgcgtaga tcagcaccg 19 <210> 306 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 306 cccctctgag tcaggaaaca t 21 <210> 307 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 307 gaagatgaca ggggccagg 19 <210> 308 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 308 tagcactggc tggaatgag 19 <210> 309 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 309 gtttcggagg taacctgtaa g 21 <210> 310 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 310 tacagcaacc atgagtacaa 20 <210> 311 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 311 tcaggtgttt cacataggc 19 <210> 312 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 312 ctgcaaccat gagtgagaa 19 <210> 313 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 313 cctttgaggt gctttagata g 21 <210> 314 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 314 gccctgagaa aggagacat 19 <210> 315 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 315 ctgttctgga ggtactctag gtat 24 <210> 316 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 316 tttgaagagg gctgagaa 18 <210> 317 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 317 tgttctggat atttcatgg 19 <210> 318 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 318 catctgcctc cccatattcc 20 <210> 319 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 319 tccatcctag ctcatctcca aa 22 <210> 320 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 320 tgctccagaa ggccagac 18 <210> 321 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 321 ttcataaata ctactaaggc acagg 25 <210> 322 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 322 acagatgaag tgctccttcc a 21 <210> 323 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 323 gtcggagatt cgtagctgga t 21 <210> 324 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 324 cattgtggcc aaggagatct g 21 <210> 325 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 325 cttcggagtt tgggtttgct t 21 <210> 326 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 326 catcacttgc tgctgacacg 20 <210> 327 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 327 tgtggaatct gccgggag 18 <210> 328 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 328 ctgactctaa gtggcatt 18 <210> 329 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 329 tgatggcctt cgattctg 18 <210> 330 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 330 cggagtcaac ggatttggtc gta 23 <210> 331 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 331 agccttctcc atggtggtga agac 24 <210> 332 <211> 2820 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 332 atggccgaga tcaaggagaa aatctgcgac tatctcttca atgtgtctga ctcctctgcc 60 ctgaatttgg ctaaaaatat tggccttacc aaggcccgag atataaatgc tgtgctaatt 120 gacatggaaa ggcaggggga tgtctataga caagggacaa cccctcccat atggcatttg 180 acagacaaga agcgagagag gatgcaaatc aagagaaata cgaacagtgt tcctgaaacc 240 gctccagctg caatccctga gaccaaaaga aacgcagagt tcctcacctg taatataccc 300 acatcaaatg cctcaaataa catggtaacc acagaaaaag tggagaatgg gcaggaacct 360 gtcataaagt tagaaaacag gcaagaggcc agaccagaac cagcaagact gaaaccacct 420 gttcattaca atggcccctc aaaagcaggg tatgttgact ttgaaaatgg ccagtgggcc 480 acagatgaca tcccagatga cttgaatagt atccgcgcag caccaggtga gtttcgagcc 540 atcatggaga tgccctcctt ctacagtcat ggcttgccac ggtgttcacc ctacaagaaa 600 ctgacagagt gccagctgaa gaaccccatc agcgggctgt tagaatatgc ccagttcgct 660 agtcaaacct gtgagttcaa catgatagag cagagtggac caccccatga acctcgattt 720 aaattccagg ttgtcatcaa tggccgagag tttcccccag ctgaagctgg aagcaagaaa 780 gtggccaagc aggatgcagc tatgaaagcc atgacaattc tgctagagga agccaaagcc 840 aaggacagtg gaaaatcaga agaatcatcc cactattcca cagagaaaga atcagagaag 900 actgcagagt cccagacccc caccccttca gccacatcct tcttttctgg gaagagcccc 960 gtcaccacac tgcttgagtg tatgcacaaa ttggggaact cctgcgaatt ccgtctcctg 1020 tccaaagaag gccctgccca tgaacccaag ttccaatact gtgttgcagt gggagcccaa 1080 actttcccca gtgtgagtgc tcccagcaag aaagtggcaa agcagatggc cgcagaggaa 1140 gccatgaagg ccctgcatgg ggaggcgacc aactccatgg cttctgataa ccagcctgaa 1200 ggtatgatct cagagtcact tgataacttg gaatccatga tgcccaacaa ggtcaggaag 1260 attggcgagc tcgtgagata cctgaacacc aaccctgtgg gtggcctttt ggagtacgcc 1320 cgctcccatg gctttgctgc tgaattcaag ttggtcgacc agtccggacc tcctcacgag 1380 cccaagttcg tttaccaagc aaaagttggg ggtcgctggt tcccagccgt ctgcgcacac 1440 agcaagaagc aaggcaagca ggaagcagca gatgcggctc tccgtgtctt gattggggag 1500 aacgagaagg cagaacgcat gggtttcaca gaggtaaccc cagtgacagg ggccagtctc 1560 agaagaacta tgctcctcct ctcaaggtcc ccagaagcac agccaaagac actccctctc 1620 actggcagca ccttccatga ccagatagcc atgctgagcc accggtgctt caacactctg 1680 actaacagct tccagccctc cttgctcggc cgcaagattc tggccgccat cattatgaaa 1740 aaagactctg aggacatggg tgtcgtcgtc agcttgggaa cagggaatcg ctgtgtaaaa 1800 ggagattctc tcagcctaaa aggagaaact gtcaatgact gccatgcaga aataatctcc 1860 cggagaggct tcatcaggtt tctctacagt gagttaatga aatacaactc ccagactgcg 1920 aaggatagta tatttgaacc tgctaaggga ggagaaaagc tccaaataaa aaagactgtg 1980 tcattccatc tgtatatcag cactgctccg tgtggagatg gcgccctctt tgacaagtcc 2040 tgcagcgacc gtgctatgga aagcacagaa tcccgccact accctgtctt cgagaatccc 2100 aaacaaggaa agctccgcac caaggtggag aacggagaag gcacaatccc tgtggaatcc 2160 agtgacattg tgcctacgtg ggatggcatt cggctcgggg agagactccg taccatgtcc 2220 tgtagtgaca aaatcctacg ctggaacgtg ctgggcctgc aaggggcact gttgacccac 2280 ttcctgcagc ccatttatct caaatctgtc acattgggtt accttttcag ccaagggcat 2340 ctgacccgtg ctatttgctg tcgtgtgaca agagatggga gtgcatttga ggatggacta 2400 cgacatccct ttattgtcaa ccaccccaag gttggcagag tcagcatata tgattccaaa 2460 aggcaatccg ggaagactaa ggagacaagc gtcaactggt gtctggctga tggctatgac 2520 ctggagatcc tggacggtac cagaggcact gtggatgggc cacggaatga attgtcccgg 2580 gtctccaaaa agaacatttt tcttctattt aagaagctct gctccttccg ttaccgcagg 2640 gatctactga gactctccta tggtgaggcc aagaaagctg cccgtgacta cgagacggcc 2700 aagaactact tcaaaaaagg cctgaaggat atgggctatg ggaactggat tagcaaaccc 2760 caggaggaaa agaactttta tctctgccca gtagattaca aggatgacga cgataagtag 2820 <210> 333 <211> 3705 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 333 atgaatccgc ggcaggggta ttccctcagc ggatactaca cccatccatt tcaaggctat 60 gagcacagac agctcagata ccagcagcct gggccaggat cttcccccag tagtttcctg 120 cttaagcaaa tagaatttct caaggggcag ctcccagaag caccggtgat tggaaagcag 180 acaccgtcac tgccaccttc cctcccagga ctccggccaa ggtttccagt actacttgcc 240 tccagtacca gaggcaggca agtggacatc aggggtgtcc ccaggggcgt gcatctcgga 300 agtcaggggc tccagagagg gttccagcat ccttcaccac gtggcaggag tctgccacag 360 agaggtgttg attgcctttc ctcacatttc caggaactga gtatctacca agatcaggaa 420 caaaggatct taaagttcct ggaagagctt ggggaaggga aggccaccac agcacatgat 480 ctgtctggga aacttgggac tccgaagaaa gaaatcaatc gagttttata ctccctggca 540 aagaagggca agctacagaa agaggcagga acaccccctt tgtggaaaat cgcggtctcc 600 actcaggctt ggaaccagca cagcggagtg gtaagaccag acggtcatag ccaaggagcc 660 ccaaactcag acccgagttt ggaaccggaa gacagaaact ccacatctgt ctcagaagat 720 cttcttgagc cttttattgc agtctcagct caggcttgga accagcacag cggagtggta 780 agaccagaca gtcatagcca aggatcccca aactcagacc caggtttgga acctgaagac 840 agcaactcca catctgcctt ggaagatcct cttgagtttt tagacatggc cgagatcaag 900 gagaaaatct gcgactatct cttcaatgtg tctgactcct ctgccctgaa tttggctaaa 960 aatattggcc ttaccaaggc ccgagatata aatgctgtgc taattgacat ggaaaggcag 1020 ggggatgtct atagacaagg gacaacccct cccatatggc atttgacaga caagaagcga 1080 gagaggatgc aaatcaagag aaatacgaac agtgttcctg aaaccgctcc agctgcaatc 1140 cctgagacca aaagaaacgc agagttcctc acctgtaata tacccacatc aaatgcctca 1200 aataacatgg taaccacaga aaaagtggag aatgggcagg aacctgtcat aaagttagaa 1260 aacaggcaag aggccagacc agaaccagca agactgaaac cacctgttca ttacaatggc 1320 ccctcaaaag cagggtatgt tgactttgaa aatggccagt gggccacaga tgacatccca 1380 gatgacttga atagtatccg cgcagcacca ggtgagtttc gagccatcat ggagatgccc 1440 tccttctaca gtcatggctt gccacggtgt tcaccctaca agaaactgac agagtgccag 1500 ctgaagaacc ccatcagcgg gctgttagaa tatgcccagt tcgctagtca aacctgtgag 1560 ttcaacatga tagagcagag tggaccaccc catgaacctc gatttaaatt ccaggttgtc 1620 atcaatggcc gagagtttcc cccagctgaa gctggaagca agaaagtggc caagcaggat 1680 gcagctatga aagccatgac aattctgcta gaggaagcca aagccaagga cagtggaaaa 1740 tcagaagaat catcccacta ttccacagag aaagaatcag agaagactgc agagtcccag 1800 acccccaccc cttcagccac atccttcttt tctgggaaga gccccgtcac cacactgctt 1860 gagtgtatgc acaaattggg gaactcctgc gaattccgtc tcctgtccaa agaaggccct 1920 gcccatgaac ccaagttcca atactgtgtt gcagtgggag cccaaacttt ccccagtgtg 1980 agtgctccca gcaagaaagt ggcaaagcag atggccgcag aggaagccat gaaggccctg 2040 catggggagg cgaccaactc catggcttct gataaccagc ctgaaggtat gatctcagag 2100 tcacttgata acttggaatc catgatgccc aacaaggtca ggaagattgg cgagctcgtg 2160 agatacctga acaccaaccc tgtgggtggc cttttggagt acgcccgctc ccatggcttt 2220 gctgctgaat tcaagttggt cgaccagtcc ggacctcctc acgagcccaa gttcgtttac 2280 caagcaaaag ttgggggtcg ctggttccca gccgtctgcg cacacagcaa gaagcaaggc 2340 aagcaggaag cagcagatgc ggctctccgt gtcttgattg gggagaacga gaaggcagaa 2400 cgcatgggtt tcacagaggt aaccccagtg acaggggcca gtctcagaag aactatgctc 2460 ctcctctcaa ggtccccaga agcacagcca aagacactcc ctctcactgg cagcaccttc 2520 catgaccaga tagccatgct gagccaccgg tgcttcaaca ctctgactaa cagcttccag 2580 ccctccttgc tcggccgcaa gattctggcc gccatcatta tgaaaaaaga ctctgaggac 2640 atgggtgtcg tcgtcagctt gggaacaggg aatcgctgtg taaaaggaga ttctctcagc 2700 ctaaaaggag aaactgtcaa tgactgccat gcagaaataa tctcccggag aggcttcatc 2760 aggtttctct acagtgagtt aatgaaatac aactcccaga ctgcgaagga tagtatattt 2820 gaacctgcta agggaggaga aaagctccaa ataaaaaaga ctgtgtcatt ccatctgtat 2880 atcagcactg ctccgtgtgg agatggcgcc ctctttgaca agtcctgcag cgaccgtgct 2940 atggaaagca cagaatcccg ccactaccct gtcttcgaga atcccaaaca aggaaagctc 3000 cgcaccaagg tggagaacgg agaaggcaca atccctgtgg aatccagtga cattgtgcct 3060 acgtgggatg gcattcggct cggggagaga ctccgtacca tgtcctgtag tgacaaaatc 3120 ctacgctgga acgtgctggg cctgcaaggg gcactgttga cccacttcct gcagcccatt 3180 tatctcaaat ctgtcacatt gggttacctt ttcagccaag ggcatctgac ccgtgctatt 3240 tgctgtcgtg tgacaagaga tgggagtgca tttgaggatg gactacgaca tccctttatt 3300 gtcaaccacc ccaaggttgg cagagtcagc atatatgatt ccaaaaggca atccgggaag 3360 actaaggaga caagcgtcaa ctggtgtctg gctgatggct atgacctgga gatcctggac 3420 ggtaccagag gcactgtgga tgggccacgg aatgaattgt cccgggtctc caaaaagaac 3480 atttttcttc tatttaagaa gctctgctcc ttccgttacc gcagggatct actgagactc 3540 tcctatggtg aggccaagaa agctgcccgt gactacgaga cggccaagaa ctacttcaaa 3600 aaaggcctga aggatatggg ctatgggaac tggattagca aaccccagga ggaaaagaac 3660 ttttatctct gcccagtaga ttacaaggat gacgacgata agtag 3705 <210> 334 <211> 2130 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 334 atggatatag aagatgaaga aaacatgagt tccagcagca ctgatgtgaa ggaaaaccgc 60 aatctggaca acgtgtcccc caaggatggc agcacacctg ggcctggcga gggctctcag 120 ctctccaatg ggggtggtgg tggccccggc agaaagcggc ccctggagga gggcagcaat 180 ggccactcca agtaccgcct gaagaaaagg aggaaaacac cagggcccgt cctccccaag 240 aacgccctga tgcagctgaa tgagatcaag cctggtttgc agtacacact cctgtcccag 300 actgggcccg tgcacgcgcc tttgtttgtc atgtctgtgg aggtgaatgg ccaggttttt 360 gagggctctg gtcccacaaa gaaaaaggca aaactccatg ctgctgagaa ggccttgagg 420 tctttcgttc agtttcctaa tgcctctgag gcccacctgg ccatggggag gaccctgtct 480 gtcaacacgg acttcacatc tgaccaggcc gacttccctg acacgctctt caatggtttt 540 gaaactcctg acaaggcgga gcctcccttt tacgtgggct ccaatgggga tgactccttc 600 agttccagcg gggacctcag cttgtctgct tccccggtgc ctgccagcct agcccagcct 660 cctctccctg ccttaccacc attcccaccc ccgagtggga agaatcccgt gatgatcttg 720 aacgaactgc gcccaggact caagtatgac ttcctctccg agagcgggga gagccatgcc 780 aagagcttcg tcatgtctgt ggtcgtggat ggtcagttct ttgaaggctc ggggagaaac 840 aagaagcttg ccaaggcccg ggctgcgcag tctgccctgg ccgccatttt taacttgcac 900 ttggatcaga cgccatctcg ccagcctatt cccagtgagg gtcttcagct gcatttaccg 960 caggttttag ctgacgctgt ctcacgcctg gtcctgggta agtttggtga cctgaccgac 1020 aacttctcct cccctcacgc tcgcagaaaa gtgctggctg gagtcgtcat gacaacaggc 1080 acagatgtta aagatgccaa ggtgataagt gtttctacag gaacaaaatg tattaatggt 1140 gaatacatga gtgatcgtgg ccttgcatta aatgactgcc atgcagaaat aatatctcgg 1200 agatccttgc tcagatttct ttatacacaa cttgagcttt acttaaataa caaagatgat 1260 caaaaaagat ccatctttca gaaatcagag cgaggggggt ttaggctgaa ggagaatgtc 1320 cagtttcatc tgtacatcag cacctctccc tgtggagatg ccagaatctt ctcaccacat 1380 gagccaatcc tggaagaacc agcagataga cacccaaatc gtaaagcaag aggacagcta 1440 cggaccaaaa tagagtctgg tgaggggacg attccagtgc gctccaatgc gagcatccaa 1500 acgtgggacg gggtgctgca aggggagcgg ctgctcacca tgtcctgcag tgacaagatt 1560 gcacgctgga acgtggtggg catccaggga tccctgctca gcattttcgt ggagcccatt 1620 tacttctcga gcatcatcct gggcagcctt taccacgggg accacctttc cagggccatg 1680 taccagcgga tctccaacat agaggacctg ccacctctct acaccctcaa caagcctttg 1740 ctcagtggca tcagcaatgc agaagcacgg cagccaggga aggcccccaa cttcagtgtc 1800 aactggacgg taggcgactc cgctattgag gtcatcaacg ccacgactgg gaaggatgag 1860 ctgggccgcg cgtcccgcct gtgtaagcac gcgttgtact gtcgctggat gcgtgtgcac 1920 ggcaaggttc cctcccactt actacgctcc aagattacca aacccaacgt gtaccatgag 1980 tccaagctgg cggcaaagga gtaccaggcc gccaaggcgc gtctgttcac agccttcatc 2040 aaggcggggc tgggggcctg ggtggagaag cccaccgagc aggaccagtt ctcactcacg 2100 cccgattaca aggatgacga cgataagtag 2130 <210> 335 <211> 4401 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 335 atgatgagct ttgtgcaaaa ggggagctgg ctacttctcg ctctgcttca tcccactatt 60 attttggcac aacaggaagc tgttgaagga ggatgttccc atcttggtca gtcctatgcg 120 gatagagatg tctggaagcc agaaccatgc caaatatgtg tctgtgactc aggatccgtt 180 ctctgcgatg acataatatg tgacgatcaa gaattagact gccccaaccc agaaattcca 240 tttggagaat gttgtgcagt ttgcccacag cctccaactg ctcctactcg ccctcctaat 300 ggtcaaggac ctcaaggccc caagggagat ccaggccctc ctggtattcc tgggagaaat 360 ggtgaccctg gtattccagg acaaccaggg tcccctggtt ctcctggccc ccctggaatc 420 tgtgaatcat gccctactgg tcctcagaac tattctcccc agtatgattc atatgatgtc 480 aagtctggag tagcagtagg aggactcgca ggctatcctg gaccagctgg ccccccaggc 540 cctcccggtc cccctggtac atctggtcat cctggttccc ctggatctcc aggataccaa 600 ggaccccctg gtgaacctgg gcaagctggt ccttcaggcc ctccaggacc tcctggtgct 660 ataggtccat ctggtcctgc tggaaaagat ggagaatcag gtagacccgg acgacctgga 720 gagcgaggat tgcctggacc tccaggtatc aaaggtccag ctgggatacc tggattccct 780 ggtatgaaag gacacagagg cttcgatgga cgaaatggag aaaagggtga aacaggtgct 840 cctggattaa agggtgaaaa tggtcttcca ggcgaaaatg gagctcctgg acccatgggt 900 ccaagagggg ctcctggtga gcgaggacgg ccaggacttc ctggggctgc aggtgctcgg 960 ggtaatgacg gtgctcgagg cagtgatggt caaccaggcc ctcctggtcc tcctggaact 1020 gccggattcc ctggatcccc tggtgctaag ggtgaagttg gacctgcagg gtctcctggt 1080 tcaaatggtg cccctggaca aagaggagaa cctggacctc agggacacgc tggtgctcaa 1140 ggtcctcctg gccctcctgg gattaatggt agtcctggtg gtaaaggcga aatgggtccc 1200 gctggcattc ctggagctcc tggactgatg ggagcccggg gtcctccagg accagccggt 1260 gctaatggtg ctcctggact gcgaggtggt gcaggtgagc ctggtaagaa tggtgccaaa 1320 ggagagcccg gaccacgtgg tgaacgcggt gaggctggta ttccaggtgt tccaggagct 1380 aaaggcgaag atggcaagga tggatcacct ggagaacctg gtgcaaatgg gcttccagga 1440 gctgcaggag aaaggggtgc ccctgggttc cgaggacctg ctggaccaaa tggcatccca 1500 ggagaaaagg gtcctgctgg agagcgtggt gctccaggcc ctgcagggcc cagaggagct 1560 gctggagaac ctggcagaga tggcgtccct ggaggtccag gaatgagggg catgcccgga 1620 agtccaggag gaccaggaag tgatgggaaa ccagggcctc ccggaagtca aggagaaagt 1680 ggtcgaccag gtcctcctgg gccatctggt ccccgaggtc agcctggtgt catgggcttc 1740 cccggtccta aaggaaatga tggtgctcct ggtaagaatg gagaacgagg tggccctgga 1800 ggacctggcc ctcagggtcc tcctggaaag aatggtgaaa ctggacctca gggaccccca 1860 gggcctactg ggcctggtgg tgacaaagga gacacaggac cccctggtcc acaaggatta 1920 caaggcttgc ctggtacagg tggtcctcca ggagaaaatg gaaaacctgg ggaaccaggt 1980 ccaaagggtg atgccggtgc acctggagct ccaggaggca agggtgatgc tggtgcccct 2040 ggtgaacgtg gacctcctgg attggcaggg gccccaggac ttagaggtgg agctggtccc 2100 cctggtcccg aaggaggaaa gggtgctgct ggtcctcctg ggccacctgg tgctgctggt 2160 actcctggtc tgcaaggaat gcctggagaa agaggaggtc ttggaagtcc tggtccaaag 2220 ggtgacaagg gtgaaccagg cggtccaggt gctgatggtg tcccagggaa agatggccca 2280 aggggtccta ctggtcctat tggtcctcct ggcccagctg gccagcctgg agataagggt 2340 gaaggtggtg cccccggact tccaggtata gctggacctc gtggtagccc tggtgagaga 2400 ggtgaaactg gccctccagg acctgctggt ttccctggtg ctcctggaca gaatggtgaa 2460 cctggtggta aaggagaaag aggggctccg ggtgagaaag gtgaaggagg ccctcctgga 2520 gttgcaggac cccctggagg ttctggacct gctggtcctc ctggtcccca aggtgtcaaa 2580 ggtgaacgtg gcagtcctgg tggacctggt gctgctggct tccctggtgc tcgtggtctt 2640 cctggtcctc ctggtagtaa tggtaaccca ggacccccag gtcccagcgg ttctccaggc 2700 aaggatgggc ccccaggtcc tgcgggtaac actggtgctc ctggcagccc tggagtgtct 2760 ggaccaaaag gtgatgctgg ccaaccagga gagaagggat cgcctggtgc ccagggccca 2820 ccaggagctc caggcccact tgggattgct gggatcactg gagcacgggg tcttgcagga 2880 ccaccaggca tgccaggtcc taggggaagc cctggccctc agggtgtcaa gggtgaaagt 2940 gggaaaccag gagctaacgg tctcagtgga gaacgtggtc cccctggacc ccagggtctt 3000 cctggtctgg ctggtacagc tggtgaacct ggaagagatg gaaaccctgg atcagatggt 3060 cttccaggcc gagatggatc tcctggtggc aagggtgatc gtggtgaaaa tggctctcct 3120 ggtgcccctg gcgctcctgg tcatccaggc ccacctggtc ctgtcggtcc agctggaaag 3180 agtggtgaca gaggagaaag tggccctgct ggccctgctg gtgctcccgg tcctgctggt 3240 tcccgaggtg ctcctggtcc tcaaggccca cgtggtgaca aaggtgaaac aggtgaacgt 3300 ggagctgctg gcatcaaagg acatcgagga ttccctggta atccaggtgc cccaggttct 3360 ccaggccctg ctggtcagca gggtgcaatc ggcagtccag gacctgcagg ccccagagga 3420 cctgttggac ccagtggacc tcctggcaaa gatggaacca gtggacatcc aggtcccatt 3480 ggaccaccag ggcctcgagg taacagaggt gaaagaggat ctgagggctc cccaggccac 3540 ccagggcaac caggccctcc tggacctcct ggtgcccctg gtccttgctg tggtggtgtt 3600 ggagccgctg ccattgctgg gattggaggt gaaaaagctg gcggttttgc cccgtattat 3660 ggagatgaac caatggattt caaaatcaac accgatgaga ttatgacttc actcaagtct 3720 gttaatggac aaatagaaag cctcattagt cctgatggtt ctcgtaaaaa ccccgctaga 3780 aactgcagag acctgaaatt ctgccatcct gaactcaaga gtggagaata ctgggttgac 3840 cctaaccaag gatgcaaatt ggatgctatc aaggtattct gtaatatgga aactggggaa 3900 acatgcataa gtgccaatcc tttgaatgtt ccacggaaac actggtggac agattctagt 3960 gctgagaaga aacacgtttg gtttggagag tccatggatg gtggttttca gtttagctac 4020 ggcaatcctg aacttcctga agatgtcctt gatgtgcagc tggcattcct tcgacttctc 4080 tccagccgag cttcccagaa catcacatat cactgcaaaa atagcattgc atacatggat 4140 caggccagtg gaaatgtaaa gaaggccctg aagctgatgg ggtcaaatga aggtgaattc 4200 aaggctgaag gaaatagcaa attcacctac acagttctgg aggatggttg cacgaaacac 4260 actggggaat ggagcaaaac agtctttgaa tatcgaacac gcaaggctgt gagactacct 4320 attgtagata ttgcacccta tgacattggt ggtcctgatc aagaatttgg tgtggacgtt 4380 ggccctgttt gctttttata a 4401 <210> 336 <211> 3117 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 336 atgacttcct cgctgcagcg gccctggcgg gtgccctggc taccatggac catcctgctg 60 gtcagcgctg cggctgcttc gcagaatcaa gaacggctat gtgcgtttaa agatccgtat 120 cagcaagacc ttgggatagg tgagagtaga atctctcatg aaaatgggac aatattatgc 180 tcgaaaggta gcacctgcta tggcctttgg gagaaatcaa aaggggacat aaatcttgta 240 aaacaaggat gttggtctca cattggagat ccccaagagt gtcactatga agaatgtgta 300 gtaactacca ctcctccctc aattcagaat ggaacatacc gtttctgctg ttgtagcaca 360 gatttatgta atgtcaactt tactgagaat tttccacctc ctgacacaac accactcagt 420 ccacctcatt catttaaccg agatgagaca ataatcattg ctttggcatc agtctctgta 480 ttagctgttt tgatagttgc cttatgcttt ggatacagaa tgttgacagg agaccgtaaa 540 caaggtcttc acagtatgaa catgatggag gcagcagcat ccgaaccctc tcttgatcta 600 gataatctga aactgttgga gctgattggc cgaggtcgat atggagcagt atataaaggc 660 tccttggatg agcgtccagt tgctgtaaaa gtgttttcct ttgcaaaccg tcagaatttt 720 atcaacgaaa agaacattta cagagtgcct ttgatggaac atgacaacat tgcccgcttt 780 atagttggag atgagagagt cactgcagat ggacgcatgg aatatttgct tgtgatggag 840 tactatccca atggatcttt atgcaagtat ttaagtctcc acacaagtga ctgggtaagc 900 tcttgccgtc ttgctcattc tgttactaga ggactggctt atcttcacac agaattacca 960 cgaggagatc attataaacc tgcaatttcc catcgagatt taaacagcag aaatgtccta 1020 gtgaaaaatg atggaacctg tgttattagt gactttggac tgtccatgag gctgactgga 1080 aatagactgg tgcgcccagg ggaggaagat aatgcagcca taagcgaggt tggcactatc 1140 agatatatgg caccagaagt gctagaagga gctgtgaact tgagggactg tgaatcagct 1200 ttgaaacaag tagacatgta tgctcttgga ctaatctatt gggagatatt tatgagatgt 1260 acagacctct tcccagggga atccgtacca gagtaccaga tggcttttca gacagaggtt 1320 ggaaaccatc ccacttttga ggatatgcag gttctcgtgt ctagggaaaa acagagaccc 1380 aagttcccag aagcctggaa agaaaatagc ctggcagtga ggtcactcaa ggagacaatc 1440 gaagactgtt gggaccagga tgcagaggct cggcttactg cacagtgtgc tgaggaaagg 1500 atggctgaac ttatgatgat ttgggaaaga aacaaatctg tgagcccaac agtcaatcca 1560 atgtctactg ctatgcagaa tgaacgcaac ctgtcacata ataggcgtgt gccaaaaatt 1620 ggtccttatc cagattattc ttcctcctca tacattgaag actctatcca tcatactgac 1680 agcatcgtga agaatatttc ctctgagcat tctatgtcca gcacaccttt gactataggg 1740 gaaaaaaacc gaaattcaat taactatgaa cgacagcaag cacaagctcg aatccccagc 1800 cctgaaacaa gtgtcaccag cctctccacc aacacaacaa ccacaaacac cacaggactc 1860 acgccaagta ctggcatgac tactatatct gagatgccat acccagatga aacaaatctg 1920 cataccacaa atgttgcaca gtcaattggg ccaacccctg tctgcttaca gctgacagaa 1980 gaagacttgg aaaccaacaa gctagaccca aaagaagttg ataagaacct caaggaaagc 2040 tctgatgaga atctcatgga gcactctctt aaacagttca gtggcccaga cccactgagc 2100 agtactagtt ctagcttgct ttacccactc ataaaacttg cagtagaagc aactggacag 2160 caggacttca cacagactgc aaatggccaa gcatgtttga ttcctgatgt tctgcctact 2220 cagatctatc ctctccccaa gcagcagaac cttcccaaga gacctactag tttgcctttg 2280 aacaccaaaa attcaacaaa agagccccgg ctaaaatttg gcagcaagca caaatcaaac 2340 ttgaaacaag tcgaaactgg agttgccaag atgaatacaa tcaatgcagc agaacctcat 2400 gtggtgacag tcaccatgaa tggtgtggca ggtagaaacc acagtgttaa ctcccatgct 2460 gccacaaccc aatatgccaa tgggacagta ctatctggcc aaacaaccaa catagtgaca 2520 catagggccc aagaaatgtt gcagaatcag tttattggtg aggacacccg gctgaatatt 2580 aattccagtc ctgatgagca tgagccttta ctgagacgag agcaacaagc tggccatgat 2640 gaaggtgttc tggatcgtct tgtggacagg agggaacggc cactagaagg tggccgaact 2700 aattccaata acaacaacag caatccatgt tcagaacaag atgttcttgc acagggtgtt 2760 ccaagcacag cagcagatcc tgggccatca aagcccagaa gagcacagag gcctaattct 2820 ctggatcttt cagccacaaa tgtcctggat ggcagcagta tacagatagg tgagtcaaca 2880 caagatggca aatcaggatc aggtgaaaag atcaagaaac gtgtgaaaac tccctattct 2940 cttaagcggt ggcgcccctc cacctgggtc atctccactg aatcgctgga ctgtgaagtc 3000 aacaataatg gcagtaacag ggcagttcat tccaaatcca gcactgctgt ttaccttgca 3060 gaaggaggca ctgctacaac catggtgtct aaagatatag gaatgaactg tctgtga 3117 <210> 337 <211> 3590 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 337 atgcctacag ctgagagtga agcaaaagta aaaaccaaag ttcgctttga agaattgctt 60 aagacccaca gtgatctaat gcgtgaaaag aaaaaactga agaaaaaact tgtcaggtct 120 gaagaaaaca tctcacctga cactattaga agcaatcttc actatatgaa agaaactaca 180 agtgatgatc ccgacactat tagaagcaat cttccccata ttaaagaaac tacaagtgat 240 gatgtaagtg ctgctaacac taacaacctg aagaagagca cgagagtcac taaaaacaaa 300 ttgaggaaca cacagttagc aactgaaaat cctaatggtg atgctagtgt agaggaagac 360 aaacaaggaa agccaaataa aaaggtgata aagacggtgc cccagttgac tacacaagac 420 ctgaaaccgg aaactcctga gaataaggtt gattctacac accagaaaac acatacaaag 480 ccacagccag gcgttgatca tcagaaaagt gagaaggcaa atgagggaag agaagagact 540 gatttagaag aggatgaaga attgatgcaa gcatatcagt gccatgtaac tgaagaaatg 600 gcaaaggaga ttaagaggaa aataagaaag aaactgaaag aacagttgac ttactttccc 660 tcagatactt tattccatga tgacaaacta agcagtgaaa aaaggaaaaa gaaaaaggaa 720 gttccagtct tctctaaagc tgaaacaagt acattgacca tctctggtga cacagttgaa 780 ggtgaacaaa agaaagaatc ttcagttaga tcagtttctt cagattctca tcaagatgat 840 gaaataagct caatggaaca aagcacagaa gacagcatgc aagatgatac aaaacctaaa 900 ccaaaaaaaa caaaaaagaa gactaaagca gttgcagata ataatgaaga tgttgatggt 960 gatggtgttc atgaaataac aagccgagat agcccggttt atcccaaatg tttgcttgat 1020 gatgaccttg tcttgggagt ttacattcac cgaactgata gacttaagtc agattttatg 1080 atttctcacc caatggtaaa aattcatgtg gttgatgagc atactggtca atatgtcaag 1140 aaagatgata gtggacggcc tgtttcatct tactatgaaa aagagaatgt ggattatatt 1200 cttcctatta tgacccagcc atatgatttt aaacagttaa aatcaagact tccagagtgg 1260 gaagaacaaa ttgtatttaa tgaaaatttt ccctatttgc ttcgaggctc tgatgagagt 1320 cctaaagtca tcctgttctt tgagattctt gatttcttaa gcgtggatga aattaagaat 1380 aattctgagg ttcaaaacca agaatgtggc tttcggaaaa ttgcctgggc atttcttaag 1440 cttctgggag ccaatggaaa tgcaaacatc aactcaaaac ttcgcttgca gctatattac 1500 ccacctacta agcctcgatc cccattaagt gttgttgagg catttgaatg gtggtcaaaa 1560 tgtccaagaa atcattaccc atcaacactg tacgtaactg taagaggact gaaagttcca 1620 gactgtataa agccatctta ccgctctatg atggctcttc aggaggaaaa aggtaaacca 1680 gtgcattgtg aacgtcacca tgagtcaagc tcagtagaca cagaacctgg attagaagag 1740 tcaaaggaag taataaagtg gaaacgactc cctgggcagg cttgccgtat cccaaacaaa 1800 cacctcttct cactaaatgc aggagaacga ggatgttttt gtcttgattt ctcccacaat 1860 ggaagaatat tagcagcagc ttgtgccagc cgggatggat atccaattat tttatatgaa 1920 attccttctg gacgtttcat gagagaattg tgtggccacc tcaatatcat ttatgatctt 1980 tcctggtcaa aagatgatca ctacatcctt acttcatcat ctgatggcac tgccaggata 2040 tggaaaaatg aaataaacaa tacaaatact ttcagagttt tacctcatcc ttcttttgtt 2100 tacacggcta aattccatcc agctgtaaga gagctagtag ttacaggatg ctatgattcc 2160 atgatacgga tatggaaagt tgagatgaga gaagattctg ccatattggt ccgacagttt 2220 gacgttcaca aaagttttat caactcactt tgttttgata ctgaaggtca tcatatgtat 2280 tcaggagatt gtacaggggt gattgttgtt tggaatacct atgtcaagat taatgatttg 2340 gaacattcag tgcaccactg gactataaat aaggaaatta aagaaactga gtttaaggga 2400 attccaataa gttatttgga gattcatccc aatggaaaac gtttgttaat ccataccaaa 2460 gacagtactt tgagaattat ggatctccgg atattagtag caaggaagtt tgtaggagca 2520 gcaaattatc gggagaagat tcatagtact ttgactccat gtgggacttt tctgtttgct 2580 ggaagtgagg atggtatagt gtatgtttgg aacccagaaa caggagaaca agtagccatg 2640 tattctgact tgccattcaa gtcacccatt cgagacattt cttatcatcc atttgaaaat 2700 atggttgcat tctgtgcatt tgggcaaaat gagccaattc ttctgtatat ttacgatttc 2760 catgttgccc agcaggaggc tgaaatgttc aaacgctaca atggaacatt tccattacct 2820 ggaatacacc aaagtcaaga tgccctatgt acctgtccaa aactacccca tcaaggctct 2880 tttcagattg atgaatttgt ccacactgaa agttcttcaa cgaagatgca gctagtaaaa 2940 cagaggcttg aaactgtcac agaggtgata cgttcctgtg ctgcaaaagt caacaaaaat 3000 ctctcattta cttcaccacc agcagtttcc tcacaacagt ctaagttaaa gcagtcaaac 3060 atgctgaccg ctcaagagat tctacatcag tttggtttca ctcagaccgg gattatcagc 3120 atagaaagaa agccttgtaa ccatcaggta gatacagcac caacggtagt ggctctttat 3180 gactacacag cgaatcgatc agatgaacta accatccatc gcggagacat tatccgagtg 3240 tttttcaaag ataatgaaga ctggtggtat ggcagcatag gaaagggaca ggaaggttat 3300 tttccagcta atcatgtggc tagtgaaaca ctgtatcaag aactgcctcc tgagataaag 3360 gagcgatccc ctcctttaag ccctgaggaa aaaactaaaa tagaaaaatc tccagctcct 3420 caaaagcaat caatcaataa gaacaagtcc caggacttca gactaggctc agaatctatg 3480 acacattctg aaatgagaaa agaacagagc catgaggacc aaggacacat aatggataca 3540 cggatgagga agaacaagca agcaggcaga aaagtcactc taatagagta 3590 <210> 338 <211> 1677 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 338 atggctcaag attcagtaga tctttcttgt gattatcagt tttggatgca gaagctttct 60 gtatgggatc aggcttccac tttggaaacc cagcaagaca cctgtcttca cgtggctcag 120 ttccaggagt tcctaaggaa gatgtatgaa gccttgaaag agatggattc taatacagtc 180 attgaaagat tccccacaat tggtcaactg ttggcaaaag cttgttggaa tccttttatt 240 ttagcatatg atgaaagcca aaaaattcta atatggtgct tatgttgtct aattaacaaa 300 gaaccacaga attctggaca atcaaaactt aactcctgga tacagggtgt attatctcat 360 atactttcag cactcagatt tgataaagaa gttgctcttt tcactcaagg tcttgggtat 420 gcacctatag attactatcc tggtttgctt aaaaatatgg ttttatcatt agcgtctgaa 480 ctcagagaga atcatcttaa tggatttaac actcaaaggc gaatggctcc cgagcgagtg 540 gcgtccctgt cacgagtttg tgtcccactt attaccctga cagatgttga ccccctggtg 600 gaggctctcc tcatctgtca tggacgtgaa cctcaggaaa tcctccagcc agagttcttt 660 gaggctgtaa acgaggccat tttgctgaag aagatttctc tccccatgtc agctgtagtc 720 tgcctctggc ttcggcacct tcccagcctt gaaaaagcaa tgctgcatct ttttgaaaag 780 ctaatctcca gtgagagaaa ttgtctgaga aggatcgaat gctttataaa agattcatcg 840 ctgcctcaag cagcctgcca ccctgccata ttccgggttg ttgatgagat gttcaggtgt 900 gcactcctgg aaaccgatgg ggccctggaa atcatagcca ctattcaggt gtttacgcag 960 tgctttgtag aagctctgga gaaagcaagc aagcagctgc ggtttgcact caagacctac 1020 tttccttaca cttctccatc tcttgccatg gtgctgctgc aagaccctca agatatccct 1080 cggggacact ggctccagac actgaagcat atttctgaac tgctcagaga agcagttgaa 1140 gaccagactc atgggtcctg cggaggtccc tttgagagct ggttcctgtt cattcacttc 1200 ggaggatggg ctgagatggt ggcagagcaa ttactgatgt cggcagccga accccccacg 1260 gccctgctgt ggctcttggc cttctactac ggcccccgtg atgggaggca gcagagagca 1320 cagactatgg tccaggtgaa ggccgtgctg ggccacctcc tggcaatgtc cagaagcagc 1380 agcctctcag cccaggacct gcagacggta gcaggacagg gcacagacac agacctcaga 1440 gctcctgcac aacagctgat caggcacctt ctcctcaact tcctgctctg ggctcctgga 1500 ggccacacga tcgcctggga tgtcatcacc ctgatggctc acactgctga gataactcac 1560 gagatcattg gctttcttga ccagaccttg tacagatgga atcgtcttgg cattgaaagc 1620 cctagatcag aaaaactggc ccgagagctc cttaaagagc tgcgaactca agtctag 1677 <210> 339 <211> 3825 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 339 atgcctgagc cggggaagaa gccagtctca gcttttagca agaagccacg gtcagtggaa 60 gtggccgcag gcagccctgc cgtgttcgag gccgagacag agcgggcagg agtgaaggtg 120 cgctggcagc gcggaggcag tgacatcagc gccagcaaca agtacggcct ggccacagag 180 ggcacacggc atacgctgac agtgcgggaa gtgggccctg ccgaccaggg atcttacgca 240 gtcattgctg gctcctccaa ggtcaagttc gacctcaagg tcatagaggc agagaaggca 300 gagcccatgc tggcccctgc ccctgcccct gctgaggcca ctggagcccc tggagaagcc 360 ccggccccag ccgctgagct gggagaaagt gccccaagtc ccaaagggtc aagctcagca 420 gctctcaatg gtcctacccc tggagccccc gatgacccca ttggcctctt cgtgatgcgg 480 ccacaggatg gcgaggtgac cgtgggtggc agcatcacct tctcagcccg cgtggccggc 540 gccagcctcc tgaagccgcc tgtggtcaag tggttcaagg gcaaatgggt ggacctgagc 600 agcaaggtgg gccagcacct gcagctgcac gacagctacg accgcgccag caaggtctat 660 ctgttcgagc tgcacatcac cgatgcccag cctgccttca ctggcagcta ccgctgtgag 720 gtgtccacca aggacaaatt tgactgctcc aacttcaatc tcactgtcca cgaggccatg 780 ggcaccggag acctggacct cctatcagcc ttccgccgca cgagcctggc tggaggtggt 840 cggcggatca gtgatagcca tgaggacact gggattctgg acttcagctc actgctgaaa 900 aagagagaca gtttccggac cccgagggac tcgaagctgg aggcaccagc agaggaggac 960 gtgtgggaga tcctacggca ggcaccccca tctgagtacg agcgcatcgc cttccagtac 1020 ggcgtcactg acctgcgcgg catgctaaag aggctcaagg gcatgaggcg cgatgagaag 1080 aagagcacag cctttcagaa gaagctggag ccggcctacc aggtgagcaa aggccacaag 1140 atccggctga ccgtggaact ggctgaccat gacgctgagg tcaaatggct caagaatggc 1200 caggagatcc agatgagcgg cagcaagtac atctttgagt ccatcggtgc caagcgtacc 1260 ctgaccatca gccagtgctc attggcggac gacgcagcct accagtgcgt ggtgggtggc 1320 gagaagtgta gcacggagct ctttgtgaaa gagccccctg tgctcatcac gcgccccttg 1380 gaggaccagc tggtgatggt ggggcagcgg gtggagtttg agtgtgaagt atcggaggag 1440 ggggcgcaag tcaaatggct gaaggacggg gtggagctga cccgggagga gaccttcaaa 1500 taccggttca agaaggacgg gcagagacac cacctgatca tcaacgaggc catgctggag 1560 gacgcggggc actatgcact gtgcactagc gggggccagg cgctggctga gctcattgtg 1620 caggaaaaga agctggaggt gtaccagagc atcgcagacc tgatggtggg cgcaaaggac 1680 caggcggtgt tcaaatgtga ggtctcagat gagaatgttc ggggtgtgtg gctgaagaat 1740 gggaaggagc tggtgcccga cagccgcata aaggtgtccc acatcgggcg ggtccacaaa 1800 ctgaccattg acgacgtcac acctgccgac gaggctgact acagctttgt gcccgagggc 1860 ttcgcctgca acctgtcagc caagctccac ttcatggagg tcaagattga cttcgtaccc 1920 aggcaggaac ctcccaagat ccacctggac tgcccaggcc gcataccaga caccattgtg 1980 gttgtagctg gaaataagct acgtctggac gtccctatct ctggggaccc tgctcccact 2040 gtgatctggc agaaggctat cacgcagggg aataaggccc cagccaggcc agccccagat 2100 gccccagagg acacaggtga cagcgatgag tgggtgtttg acaagaagct gctgtgtgag 2160 accgagggcc gggtccgcgt ggagaccacc aaggaccgca gcatcttcac ggtcgagggg 2220 gcagagaagg aagatgaggg cgtctacacg gtcacagtga agaaccctgt gggcgaggac 2280 caggtcaacc tcacagtcaa ggtcatcgac gtgccagacg cacctgcggc ccccaagatc 2340 agcaacgtgg gagaggactc ctgcacagta cagtgggagc cgcctgccta cgatggcggg 2400 cagcccatcc tgggctacat cctggagcgc aagaagaaga agagctaccg gtggatgcgg 2460 ctgaacttcg acctgattca ggagctgagt catgaagcgc ggcgcatgat cgagggcgtg 2520 gtgtacgaga tgcgcgtcta cgcggtcaac gccatcggca tgtccaggcc cagccctgcc 2580 tcccagccct tcatgcctat cggtcccccc agcgaaccca cccacctggc agtagaggac 2640 gtctctgaca ccacggtctc cctcaagtgg cggcccccag agcgcgtggg agcaggaggc 2700 ctggatggct acagcgtgga gtactgccca gagggctgct cagagtgggt ggctgccctg 2760 caggggctga cagagcacac atcgatactg gtgaaggacc tgcccacggg ggcccggctg 2820 cttttccgag tgcgggcaca caatatggca gggcctggag cccctgttac caccacggag 2880 ccggtgacag tgcaggagat cctgcaacgg ccacggcttc agctgcccag gcacctgcgc 2940 cagaccattc agaagaaggt cggggagcct gtgaaccttc tcatcccttt ccagggcaag 3000 ccccggcctc aggtgacctg gaccaaagag gggcagcccc tggcaggcga ggaggtgagc 3060 atccgcaaca gccccacaga caccatcctg ttcatccggg ccgctcgccg cgtgcattca 3120 ggcacttacc aggtgacggt gcgcattgag aacatggagg acaaggccac gctggtgctg 3180 caggttgttg acaagccaag tcctccccag gatctccggg tgactgacgc ctggggtctt 3240 aatgtggctc tggagtggaa gccaccccag gatgtcggca acacggagct ctgggggtac 3300 acagtgcaga aagccgacaa gaagaccatg gagtggttca ccgtcttgga gcattaccgc 3360 cgcacccact gcgtggtgcc agagctcatc attggcaatg gctactactt ccgcgtcttc 3420 agccagaata tggttggctt tagtgacaga gcggccacca ccaaggagcc cgtctttatc 3480 cccagaccag gcatcaccta tgagccaccc aactataagg ccctggactt ctccgaggcc 3540 ccaagcttca cccagcccct ggtgaaccgc tcggtcatcg cgggctacac tgctatgctc 3600 tgctgtgctg tccggggtag ccccaagccc aagatttcct ggttcaagaa tggcctggac 3660 ctgggagaag acgcccgctt ccgcatgttc agcaagcagg gagtgttgac tctggagatt 3720 agaaagccct gcccctttga cgggggcatc tatgtctgca gggccaccaa cttacagggc 3780 gaggcacggt gtgagtgccg cctggaggtg cgagtgcctc agtga 3825 <210> 340 <211> 1110 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 340 atgttgaagc catcattacc attcacatcc ctcttattcc tgcagctgcc cctgctggga 60 gtggggctga acacgacaat tctgacgccc aatgggaatg aagacaccac agctgatttc 120 ttcctgacca ctatgcccac tgactccctc agtgtttcca ctctgcccct cccagaggtt 180 cagtgttttg tgttcaatgt cgagtacatg aattgcactt ggaacagcag ctctgagccc 240 cagcctacca acctcactct gcattattgg tacaagaact cggataatga taaagtccag 300 aagtgcagcc actatctatt ctctgaagaa atcacttctg gctgtcagtt gcaaaaaaag 360 gagatccacc tctaccaaac atttgttgtt cagctccagg acccacggga acccaggaga 420 caggccacac agatgctaaa actgcagaat ctggtgatcc cctgggctcc agagaaccta 480 acacttcaca aactgagtga atcccagcta gaactgaact ggaacaacag attcttgaac 540 cactgtttgg agcacttggt gcagtaccgg actgactggg accacagctg gactgaacaa 600 tcagtggatt atagacataa gttctccttg cctagtgtgg atgggcagaa acgctacacg 660 tttcgtgttc ggagccgctt taacccactc tgtggaagtg ctcagcattg gagtgaatgg 720 agccacccaa tccactgggg gagcaatact tcaaaagaga atcctttcct gtttgcattg 780 gaagccgtgg ttatctctgt tggctccatg ggattgatta tcagccttct ctgtgtgtat 840 ttctggctgg aacggacgat gccccgaatt cccaccctga agaacctaga ggatcttgtt 900 actgaatacc acgggaactt ttcggcctgg agtggtgtgt ctaagggact ggctgagagt 960 ctgcagccag actacagtga acgactctgc ctcgtcagtg agattccccc aaaaggaggg 1020 gcccttgggg aggggcctgg ggcctcccca tgcaaccagc atagccccta ctgggccccc 1080 ccatgttaca ccctaaagcc tgaaacctga 1110 <210> 341 <211> 108 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 341 uaccgcuaca gccacgcuga uuucagcuau accugcccgg uauaaaggga cguucacacc 60 ggauguucuc cgcggggaua ucgcgauauu caggauuaaa agaagugc 108 <210> 342 <211> 91 <212> DNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 342 uaauccugaa uaucgcgcaa uuccccagca gagaacaucg cggugugaac gucccuuuau 60 accgggcagg uauagcugaa aucagcgugg c 91 <210> 343 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 343 uuucagcuau accugcccgg uauaaaggga cguucacacc gcgauguucu cugcugggga 60 auugcgcgau a 71 <210> 344 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 344 gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag cugcuccuca 60 ucugcggggc gggggggggc cgucgccgcg u 91 <210> 345 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 345 uguccaggac ggucccggcc ugcgacacuu cggcccagag cugcuccuca ucugcggggc 60 gggggggggc c 71 <210> 346 <211> 51 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 346 ggucccggcc ugcgacacuu cggcccagag cugcuccuca ucugcggggc g 51 <210> 347 <211> 101 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 347 gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60 cugcuccuca ucugcggggc gggggggggc cgucgccgcg u 101 <210> 348 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 348 gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60 cugcuccuca ucugcggggc gggggggggc c 91 <210> 349 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 349 gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60 cugcuccuca ucugcggggc g 81 <210> 350 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 350 gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60 cugcuccuca u 71 <210> 351 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 351 gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60 c 61 <210> 352 <211> 101 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 352 gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag cugcuccuca 60 ucugcggggc gggggggggc cgucgccgcg uggggucguu g 101 <210> 353 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 353 uguccaggac ggucccggcc ugcgacacuu cggcccagag cugcuccuca ucugcggggc 60 gggggggggc cgucgccgcg uggggucguu g 91 <210> 354 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 354 ggucccggcc ugcgacacuu cggcccagag cugcuccuca ucugcggggc gggggggggc 60 cgucgccgcg uggggucguu g 81 <210> 355 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 355 ugcgacacuu cggcccagag cugcuccuca ucugcggggc gggggggggc cgucgccgcg 60 uggggucguu g 71 <210> 356 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 356 cggcccagag cugcuccuca ucugcggggc gggggggggc cgucgccgcg uggggucguu 60 g 61 <210> 357 <211> 80 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 357 gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60 cugcuccuca ucugcggggc 80 <210> 358 <211> 79 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 358 gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60 cugcuccuca ucugcgggg 79 <210> 359 <211> 78 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 359 gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60 cugcuccuca ucugcggg 78 <210> 360 <211> 77 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 360 gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60 cugcuccuca ucugcgg 77 <210> 361 <211> 76 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 361 gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60 cugcuccuca ucugcg 76 <210> 362 <211> 75 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 362 gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60 cugcuccuca ucugc 75 <210> 363 <211> 74 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 363 gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60 cugcuccuca ucug 74 <210> 364 <211> 73 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 364 gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60 cugcuccuca ucu 73 <210> 365 <211> 72 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 365 gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60 cugcuccuca uc 72 <210> 366 <211> 70 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 366 gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60 cugcuccuca 70 <210> 367 <211> 69 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 367 gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60 cugcuccuc 69 <210> 368 <211> 68 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 368 gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60 cugcuccu 68 <210> 369 <211> 67 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 369 gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60 cugcucc 67 <210> 370 <211> 66 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 370 gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60 cugcuc 66 <210> 371 <211> 65 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 371 gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60 cugcu 65 <210> 372 <211> 64 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 372 gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60 cugc 64 <210> 373 <211> 63 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 373 gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60 cug 63 <210> 374 <211> 62 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 374 gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60 cu 62 <210> 375 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 375 gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60 c 61 <210> 376 <211> 70 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 376 uaccgcuaca gccacgcuga uuucagcuau accugcccgg uauaaaggga cguucacacc 60 gcgauguucu 70 <210> 377 <211> 66 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 377 uaccgcuaca gccacgcuga uuucagcuau accugcccgg uauaaaggga cguucacacc 60 gcgaug 66 <210> 378 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 378 ccaccgugug guugcugucc aggacggucc cggccugcga cacuucggcc cagagcugcu 60 ccucaucugc g 71 <210> 379 <211> 66 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 379 gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag cugcuccuca 60 ucugcg 66 <210> 380 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 380 guugcugucc aggacggucc cggccugcga cacuucggcc cagagcugcu ccucaucugc 60 g 61 <210> 381 <211> 56 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 381 uguccaggac ggucccggcc ugcgacacuu cggcccagag cugcuccuca ucugcg 56 <210> 382 <211> 66 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 382 ccaccgugug guugcugucc aggacggucc cggccugcga cacuucggcc cagagcugcu 60 ccucau 66 <210> 383 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 383 gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag cugcuccuca 60 u 61 <210> 384 <211> 56 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 384 guugcugucc aggacggucc cggccugcga cacuucggcc cagagcugcu ccucau 56 <210> 385 <211> 51 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 385 uguccaggac ggucccggcc ugcgacacuu cggcccagag cugcuccuca u 51 <210> 386 <211> 67 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 386 acgcccaccg ugugguugcu guccaggacg gucccggccu gcgacacuuc ggcccagagc 60 ugcuccu 67 <210> 387 <211> 67 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 387 cgcccaccgu gugguugcug uccaggacgg ucccggccug cgacacuucg gcccagagcu 60 gcuccuc 67 <210> 388 <211> 67 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 388 gcccaccgug ugguugcugu ccaggacggu cccggccugc gacacuucgg cccagagcug 60 cuccuca 67 <210> 389 <211> 67 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 389 cccaccgugu gguugcuguc caggacgguc ccggccugcg acacuucggc ccagagcugc 60 uccucau 67 <210> 390 <211> 67 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 390 ccaccgugug guugcugucc aggacggucc cggccugcga cacuucggcc cagagcugcu 60 ccucauc 67 <210> 391 <211> 67 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 391 caccgugugg uugcugucca ggacgguccc ggccugcgac acuucggccc agagcugcuc 60 cucaucu 67 <210> 392 <211> 67 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 392 accguguggu ugcuguccag gacggucccg gccugcgaca cuucggccca gagcugcucc 60 ucaucug 67 <210> 393 <211> 67 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 393 ccgugugguu gcuguccagg acggucccgg ccugcgacac uucggcccag agcugcuccu 60 caucugc 67 <210> 394 <211> 67 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 394 cgugugguug cuguccagga cggucccggc cugcgacacu ucggcccaga gcugcuccuc 60 aucugcg 67 <210> 395 <211> 67 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 395 gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag cugcuccuca 60 ucugcgg 67 <210> 396 <211> 67 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 396 ugugguugcu guccaggacg gucccggccu gcgacacuuc ggcccagagc ugcuccucau 60 cugcggg 67 <210> 397 <211> 67 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 397 gugguugcug uccaggacgg ucccggccug cgacacuucg gcccagagcu gcuccucauc 60 ugcgggg 67 <210> 398 <211> 70 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 398 acgcccaccg ugugguugcu guccaggacg gucccggccu gcgacacuuc ggcccagagc 60 ugcuccucau 70 <210> 399 <211> 70 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 399 cgcccaccgu gugguugcug uccaggacgg ucccggccug cgacacuucg gcccagagcu 60 gcuccucauc 70 <210> 400 <211> 70 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 400 gcccaccgug ugguugcugu ccaggacggu cccggccugc gacacuucgg cccagagcug 60 cuccucaucu 70 <210> 401 <211> 70 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 401 cccaccgugu gguugcuguc caggacgguc ccggccugcg acacuucggc ccagagcugc 60 uccucaucug 70 <210> 402 <211> 70 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 402 ccaccgugug guugcugucc aggacggucc cggccugcga cacuucggcc cagagcugcu 60 ccucaucugc 70 <210> 403 <211> 70 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 403 caccgugugg uugcugucca ggacgguccc ggccugcgac acuucggccc agagcugcuc 60 cucaucugcg 70 <210> 404 <211> 70 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 404 accguguggu ugcuguccag gacggucccg gccugcgaca cuucggccca gagcugcucc 60 ucaucugcgg 70 <210> 405 <211> 70 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 405 ccgugugguu gcuguccagg acggucccgg ccugcgacac uucggcccag agcugcuccu 60 caucugcggg 70 <210> 406 <211> 70 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 406 cgugugguug cuguccagga cggucccggc cugcgacacu ucggcccaga gcugcuccuc 60 aucugcgggg 70 <210> 407 <211> 72 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 407 acgcccaccg ugugguugcu guccaggacg gucccggccu gcgacacuuc ggcccagagc 60 ugcuccucau cu 72 <210> 408 <211> 72 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 408 cgcccaccgu gugguugcug uccaggacgg ucccggccug cgacacuucg gcccagagcu 60 gcuccucauc ug 72 <210> 409 <211> 72 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 409 gcccaccgug ugguugcugu ccaggacggu cccggccugc gacacuucgg cccagagcug 60 cuccucaucu gc 72 <210> 410 <211> 72 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 410 cccaccgugu gguugcuguc caggacgguc ccggccugcg acacuucggc ccagagcugc 60 uccucaucug cg 72 <210> 411 <211> 72 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 411 ccaccgugug guugcugucc aggacggucc cggccugcga cacuucggcc cagagcugcu 60 ccucaucugc gg 72 <210> 412 <211> 72 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 412 caccgugugg uugcugucca ggacgguccc ggccugcgac acuucggccc agagcugcuc 60 cucaucugcg gg 72 <210> 413 <211> 72 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 413 accguguggu ugcuguccag gacggucccg gccugcgaca cuucggccca gagcugcucc 60 ucaucugcgg gg 72 <210> 414 <211> 50 <212> RNA <213> Artificial Sequence <220> <223> dRNA/arRNA <400> 414 cuguccagga cggucccggc cugcgacacu ucggcccaga gcugcuccuc 50 <210> 415 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Forward primer: hIDUA-62F <400> 415 ccttcctgag ctaccacccg 20 <210> 416 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Reverse primer: hIDUA-62R <400> 416 ccagggctcg aactcggtag 20

Claims (31)

  1. 60-200개의 뉴클레오티드의 탈아미노효소-리크루팅 RNA(deaminase-recruiting RNA: dRNA)로서,
    a) 상기 dRNA는 타겟 RNA에 혼성화할 수 있는 상보적 RNA 서열을 포함하고;
    b) 상기 dRNA는 탈아미노효소 또는 탈아미노효소를 포함하는 구축물 또는 탈아미노효소의 촉매 도메인을 포함하는 구축물을 리크루팅하여 상기 타겟 RNA에서의 타겟 아데노신을 탈아미노화할 수 있고; 또한
    c) 상기 dRNA는 하나 이상의 화학적 변형을 포함하는, dRNA.
  2. 제 1 항에 있어서,
    상기 dRNA는 약 60, 65, 70, 80, 90, 100, 또는 110개의 뉴클레오티드의 어느 것보다 더 긴, dRNA.
  3. 제 1 항 또는 제 2 항에 있어서,
    상보적 타겟 RNA 영역과의 하나 이상의 미스매치, 워블 및/또는 벌지를 포함하는, dRNA.
  4. 제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
    상기 상보적 RNA 서열은 상기 타겟 RNA에서의 타겟 아데노신의 정반대쪽에 있는 시티딘, 아데노신 또는 우리딘을 포함하는, dRNA.
  5. 제 4 항에 있어서,
    상기 타겟 아데노신의 정반대쪽에 있는 시티딘, 아데노신 또는 우리딘은 3' 말단으로부터 적어도 약 7개의 뉴클레오티드, 예를 들면 3' 말단으로부터 적어도 약 8, 9, 또는 10개의 뉴클레오티드와 떨어져 위치되는, dRNA.
  6. 제 4 항 또는 제 5 항에 있어서,
    상기 타겟 아데노신의 정반대쪽에 있는 시티딘, 아데노신 또는 우리딘은 5' 말단으로부터 적어도 약 25개의 뉴클레오티드, 예를 들면 5' 말단으로부터 적어도 약 30, 35, 40, 45, 50 또는 55개의 뉴클레오티드와 떨어져 위치되는, dRNA.
  7. 제 4 항 내지 제 6 항 중 어느 한 항에 있어서,
    상기 타겟 아데노신의 정반대쪽에 있는 시티딘, 아데노신 또는 우리딘의 측면에 있는 5' 및 3' 서열의 길이는 동일하지 않은, dRNA.
  8. 제 4 항 내지 제 7 항 중 어느 한 항에 있어서,
    상기 타겟 아데노신의 정반대쪽에 있는 시티딘, 아데노신 또는 우리딘의 측면에 있는 5' 서열의 길이는 3' 서열보다 긴, dRNA.
  9. 제 1 항 내지 제 8 항 중 어느 한 항에 있어서,
    상기 타겟 RNA에서의 타겟 아데노신의 정반대쪽에 있는 시티딘을 포함하는, dRNA.
  10. 제 1 항 내지 제 9 항 중 어느 한 항에 있어서,
    상기 상보적 RNA 서열은 상기 타겟 RNA의 비타겟 아데노신과 각각 반대쪽에 있는 하나 이상의 구아노신을 포함하는, dRNA.
  11. 제 1 항 내지 제 10 항 중 어느 한 항에 있어서,
    상기 상보적 서열은 상기 타겟 RNA의 비타겟 아데노신의 반대쪽에 있는 2개 이상의 연속적 미스매치 뉴클레오티드를 포함하는, dRNA.
  12. 제 1 항 내지 제 11 항 중 어느 한 항에 있어서,
    상기 타겟 RNA에서의 타겟 아데노신의 5' 최근접 이웃은 U, C, A 및 G로부터 선택되는 뉴클레오티드이고 선호도는 U>C≒A>G이고, 상기 타겟 RNA에서의 타겟 아데노신의 3' 최근접 이웃은 G, C, A 및 U로부터 선택되는 뉴클레오티드이고 선호도는 G>C>A≒U인, dRNA.
  13. 제 1 항 내지 제 12 항 중 어느 한 항에 있어서,
    상기 타겟 아데노신은 상기 타겟 RNA에서 UAG, UAC, UAA, UAU, CAG, CAC, CAA, CAU, AAG, AAC, AAA, AAU, GAG, GAC, GAA 및 GAU로 이루어지는 군으로부터 선택되는 3-염기 모티프에 존재하는, dRNA.
  14. 제 13 항에 있어서,
    상기 3-염기 모티프는 UAG이고, 상기 dRNA는 상기 3-염기 모티프에서의 우리딘의 정반대쪽에 있는 A, 상기 타겟 아데노신의 정반대쪽에 있는 시티딘, 및 상기 3-염기 모티프에서의 구아노신의 정반대쪽에 있는 시티딘, 구아노신 또는 우리딘을 포함하는, dRNA.
  15. 제 14 항에 있어서,
    상기 UAG의 3-염기 모티프와 정반대쪽에 있는 5'-CCA-3'를 포함하는, dRNA.
  16. 제 1 항 내지 제 15 항 중 어느 한 항에 있어서,
    상기 화학적 변형은 메틸화 및/또는 포스포로티오화를 포함하는, dRNA.
  17. 제 16 항에 있어서,
    상기 화학적 변형은 2'-O-메틸화 및/또는 뉴클레오티드간 포스포로티오에이트 연결을 포함하는, dRNA.
  18. 제 16 항에 있어서,
    상기 화학적 변형은 첫번째 및 마지막 1-5, 2-5, 3-5, 4-5개의 뉴클레오티드에서의 2'-O-메틸화, 및/또는 첫번째 및 마지막 1-5, 2-5, 3-5, 4-5개의 뉴클레오티드간 연결에서의 포스포로티오화를 포함하는, dRNA.
  19. 제 16 항 내지 제 18 항 중 어느 한 항에 있어서,
    상기 화학적 변형은 상기 타겟 아데노신의 반대쪽에 있는 뉴클레오티드 및/또는 그것의 5' 및/또는 3' 최근접 뉴클로레오티드에서의 2'-O-메틸화 및/또는 3'-포스포로티오화를 포함하는, dRNA.
  20. 제 1 항 내지 제 19 항 중 어느 한 항에 있어서,
    상기 화학적 변형은 이하로 이루어지는 군으로부터 선택되는, dRNA:
    1) 첫번째 및 마지막 3개의 뉴클레오티드에서의 2'-O-메틸화 및/또는 첫번째 및 마지막 3개의 뉴클레오티드간 연결에서의 포스포로티오화;
    2) 첫번째 및 마지막 3개의 뉴클레오티드에서의 2'-O-메틸화 및/또는 첫번째 및 마지막 3개의 뉴클레오티드간 연결에서의 포스포로티오화, 및 단일 또는 다수 또는 모든 우리딘에서의 2'-O-메틸화;
    3) 첫번째 및 마지막 3개의 뉴클레오티드에서의 2'-O-메틸화, 첫번째 및 마지막 3개의 뉴클레오티드간 연결에서의 포스포로티오화, 단일 또는 다수 또는 모든 우리딘에서의 2'-O-메틸화, 및 상기 타겟 아데노신의 반대쪽에 있는 뉴클레오티드 및/또는 그것의 5' 및/또는 3' 최근접 뉴클레오티드에서의 변형;
    4) 첫번째 및 마지막 3개의 뉴클레오티드에서의 2'-O-메틸화, 첫번째 및 마지막 3개의 뉴클레오티드간 연결에서의 포스포로티오화, 단일 또는 다수 또는 모든 우리딘에서의 2'-O-메틸화, 및 상기 타겟 아데노신의 반대쪽에 있는 뉴클레오티드의 3' 말단 및/또는 5' 말단 최근접 뉴클레오티드에서의 2'-O-메틸화;
    5) 첫번째 및 마지막 3개의 뉴클레오티드에서의 2'-O-메틸화, 첫번째 및 마지막 3개의 뉴클레오티드간 연결에서의 포스포로티오화, 단일 또는 다수 또는 모든 우리딘에서의 2'-O-메틸화, 및 상기 타겟 아데노신의 반대쪽에 있는 뉴클레오티드 및/또는 그것의 5' 및/또는 3' 최근접 뉴클레오티드에서의 포스포로티오화 연결;
    6) 첫번째 및 마지막 1-5개의 뉴클레오티드에서의 2'-O-메틸화 및/또는 첫번째 및 마지막 1-5개의 뉴클레오티드간 연결에서의 포스포로티오화.
  21. 제 20 항에 있어서,
    상기 타겟 아데노신의 반대쪽에 있는 뉴클레오티드 및/또는 상기 타겟 아데노신의 반대쪽에 있는 뉴클레오티드 최근접 1개 또는 2개의 뉴클레오티드에서의 변형은 2'-O-메틸화 및/또는 포스포로티오화 연결인, dRNA.
  22. 제 1 항 내지 제 21 항 중 어느 한 항에 있어서,
    ADAR 효소와 결합하기 위한 분자내 스템 루프 구조를 형성할 수 있는 ADAR-리크루팅 도메인을 포함하지 않는, dRNA.
  23. 제 1 항 내지 제 22 항 중 어느 한 항에 기재된 dRNA를 포함하거나 인코딩하는, 구축물.
  24. 제 1 항 내지 제 23 항 중 어느 한 항에 기재된 dRNA를 숙주 세포 내로 도입하는 단계를 포함하는, 숙주 세포에서 타겟 RNA를 편집하는, 방법.
  25. 제 24 항에 있어서,
    ADAR3의 억제제를 상기 숙주 세포에 도입하는 단계를 더 포함하는, 방법.
  26. 제 24 항 또는 제 25 항에 있어서,
    인터페론의 자극제를 상기 숙주 세포에 도입하는 단계를 더 포함하는, 방법.
  27. 제 24 항 내지 제 26 항 중 어느 한 항에 있어서,
    상이한 타겟 RNA를 각각 타겟팅하는 복수의 dRNA를 도입하는 단계를 포함하는, 방법.
  28. 제 24 항 내지 제 27 항 중 어느 한 항에 있어서,
    상기 dRNA는 면역 반응을 유도하지 않는, 방법.
  29. 제 24 항 내지 제 28 항 중 어느 한 항에 있어서,
    외인성 ADAR을 상기 숙주 세포에 도입하는 단계를 더 포함하는, 방법.
  30. 제 29 항에 있어서,
    상기 ADAR은 E1008 돌연변이를 포함하는 ADAR1인, 방법.
  31. 제 1 항 내지 제 23 항 중 어느 한 항에 기재된 dRNA를 포함하는 구축물, 조성물, 세포, 라이브러리 또는 키트.
KR1020217037218A 2019-04-15 2020-04-15 Rna를 편집하기 위한 방법 및 조성물 KR20220004674A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
CN2019082713 2019-04-15
CNPCT/CN2019/082713 2019-04-15
CN2019129952 2019-12-30
CNPCT/CN2019/129952 2019-12-30
PCT/CN2020/084922 WO2020211780A1 (en) 2019-04-15 2020-04-15 Methods and compositions for editing rnas

Publications (1)

Publication Number Publication Date
KR20220004674A true KR20220004674A (ko) 2022-01-11

Family

ID=72837012

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217037218A KR20220004674A (ko) 2019-04-15 2020-04-15 Rna를 편집하기 위한 방법 및 조성물

Country Status (18)

Country Link
US (2) US20220307020A1 (ko)
EP (1) EP3956449A4 (ko)
JP (1) JP2022526455A (ko)
KR (1) KR20220004674A (ko)
CN (1) CN113939591A (ko)
AU (1) AU2020259548B2 (ko)
BR (1) BR112021020608A8 (ko)
CA (1) CA3136735A1 (ko)
CL (1) CL2021002695A1 (ko)
CO (1) CO2021015214A2 (ko)
CR (1) CR20210572A (ko)
EC (1) ECSP21080618A (ko)
IL (1) IL287248A (ko)
MX (1) MX2021012645A (ko)
PE (1) PE20212214A1 (ko)
SG (1) SG11202111401RA (ko)
TW (1) TW202043249A (ko)
WO (1) WO2020211780A1 (ko)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112021020608A8 (pt) 2019-04-15 2023-03-21 Univ Beijing Rna recrutador de desaminase, construção, método para editar um rna alvo em uma célula hospedeira, e, construção, composição, célula, biblioteca ou kit
US20220243194A1 (en) 2019-07-12 2022-08-04 Peking University Targeted rna editing by leveraging endogenous adar using engineered rnas
CN115038789A (zh) 2019-12-02 2022-09-09 塑造治疗公司 治疗性编辑
MX2022008197A (es) * 2019-12-30 2022-08-02 Edigene Therapeutics Beijing Inc Metodo para el tratamiento del sindrome de usher y composicion del mismo.
PE20230037A1 (es) * 2019-12-30 2023-01-10 Edigene Therapeutics Beijing Inc Metodo basado en tecnologia leaper para el tratamiento de mucopolisacaridosis ih y composicion
CN113528582B (zh) * 2020-04-15 2022-05-17 博雅辑因(北京)生物科技有限公司 基于leaper技术靶向编辑rna的方法和药物
WO2021209010A1 (zh) * 2020-04-15 2021-10-21 博雅辑因(北京)生物科技有限公司 一种治疗赫勒氏综合征的方法和药物
JP2023529316A (ja) * 2020-05-26 2023-07-10 シェイプ セラピューティクス インコーポレイテッド ゲノム編集のための組成物及び方法
WO2022150974A1 (en) * 2021-01-12 2022-07-21 Peking University Targeted rna editing by leveraging endogenous adar using engineered rnas
US20230194709A9 (en) * 2021-06-29 2023-06-22 Seagate Technology Llc Range information detection using coherent pulse sets with selected waveform characteristics
TW202321451A (zh) * 2021-08-18 2023-06-01 北京大學 工程化的 adar 招募 rnas 及其使用方法
WO2023143539A1 (en) * 2022-01-28 2023-08-03 Edigene Therapeutics (Beijing) Inc. Engineered adar-recruiting rnas and methods of use thereof
WO2023152371A1 (en) 2022-02-14 2023-08-17 Proqr Therapeutics Ii B.V. Guide oligonucleotides for nucleic acid editing in the treatment of hypercholesterolemia
WO2024013361A1 (en) 2022-07-15 2024-01-18 Proqr Therapeutics Ii B.V. Oligonucleotides for adar-mediated rna editing and use thereof
WO2024013360A1 (en) 2022-07-15 2024-01-18 Proqr Therapeutics Ii B.V. Chemically modified oligonucleotides for adar-mediated rna editing

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK187280A (da) 1980-04-30 1981-10-31 Novo Industri As Ruhedsreducerende middel til et fuldvaskemiddel fuldvaskemiddel og fuldvaskemetode
US5773244A (en) 1993-05-19 1998-06-30 Regents Of The University Of California Methods of making circular RNA
US9222088B2 (en) 2010-10-22 2015-12-29 Curna, Inc. Treatment of alpha-L-iduronidase (IDUA) related diseases by inhibition of natural antisense transcript to IDUA
US9650627B1 (en) 2012-07-19 2017-05-16 University Of Puerto Rico Site-directed RNA editing
WO2015134812A1 (en) 2014-03-05 2015-09-11 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating usher syndrome and retinitis pigmentosa
EP3230445B1 (en) 2014-12-12 2024-01-24 Tod M. Woolf Compositions and methods for editing nucleic acids in cells utilizing oligonucleotides
EP3712269A1 (en) 2014-12-17 2020-09-23 ProQR Therapeutics II B.V. Targeted rna editing
US11390865B2 (en) 2015-07-14 2022-07-19 Fukuoka University Method for introducing site-directed RNA mutation, target editing guide RNA used in the method and target RNA-target editing guide RNA complex
DE102015012522B3 (de) * 2015-09-26 2016-06-02 Eberhard Karls Universität Tübingen Verfahren und Substanzen zur gerichteten RNA-Editierung
US10617707B2 (en) 2016-04-25 2020-04-14 Proqr Therapeutics Ii B.V. Oligonucleotides to treat eye disease
WO2017220751A1 (en) * 2016-06-22 2017-12-28 Proqr Therapeutics Ii B.V. Single-stranded rna-editing oligonucleotides
PL3507366T3 (pl) 2016-09-01 2021-05-04 Proqr Therapeutics Ii B.V. Chemicznie modyfikowane jednoniciowe oligonukleotydy edytujące rna
WO2018041873A1 (en) 2016-09-01 2018-03-08 F. Hoffmann-La Roche Ag Process for the preparation of (6s)-6-isopropyl-10-methoxy-9-(3-methoxypropoxy)-2-oxo-6,7-dihydrobenzo[a]quinolizine-3-carboxylic acid
GB201616202D0 (en) 2016-09-23 2016-11-09 Proqr Therapeutics Ii Bv Antisense oligonucleotides for the treatment of eye deisease
EP3571300A1 (en) 2017-01-19 2019-11-27 ProQR Therapeutics II B.V. Oligonucleotide complexes for use in rna editing
EP3589751A4 (en) 2017-03-03 2021-11-17 The Regents of The University of California RNA TARGETING OF MUTATIONS VIA SUPPRESSOR RNA AND DEAMINASES
WO2018208998A1 (en) 2017-05-10 2018-11-15 The Regents Of The University Of California Directed editing of cellular rna via nuclear delivery of crispr/cas9
US20200248169A1 (en) 2017-06-26 2020-08-06 The Broad Institute, Inc. Crispr/cas-cytidine deaminase based compositions, systems, and methods for targeted nucleic acid editing
EP3684397A4 (en) 2017-09-21 2021-08-18 The Broad Institute, Inc. SYSTEMS, METHODS AND COMPOSITIONS FOR TARGETED EDITION OF NUCLEIC ACIDS
WO2019067322A1 (en) 2017-09-26 2019-04-04 The Board Of Trustees Of The University Of Illinois CRISPR / CAS SYSTEM AND METHOD FOR GENOME EDITING AND TRANSCRIPTION MODULATION
US20210009972A1 (en) 2017-10-04 2021-01-14 The Broad Institute, Inc. Systems methods, and compositions for targeted nucleic acid editing
AU2018393050A1 (en) 2017-12-21 2020-06-18 Bayer Healthcare Llc Materials and methods for treatment of Usher Syndrome Type 2A
WO2019158475A1 (en) 2018-02-14 2019-08-22 Proqr Therapeutics Ii B.V. Antisense oligonucleotides for rna editing
WO2019183641A1 (en) 2018-03-23 2019-09-26 Massachusetts Eye And Ear Infirmary Crispr/cas9-mediated exon-skipping approach for ush2a-associated usher syndrome
US20220073915A1 (en) * 2018-06-29 2022-03-10 Eberhard-Karls-Universität-Tübingen Artificial nucleic acids for rna editing
WO2020051555A1 (en) 2018-09-06 2020-03-12 The Regents Of The University Of California Rna and dna base editing via engneered adar recruitment
CN113631708B (zh) 2018-10-12 2022-05-24 北京大学 编辑rna的方法和组合物
WO2020125762A1 (en) 2018-12-20 2020-06-25 Peking University Compositions and methods for highly efficient genetic screening using barcoded guide rna constructs
AU2020223306A1 (en) 2019-02-13 2021-08-05 Beam Therapeutics Inc. Methods of editing a disease-associated gene using adenosine deaminase base editors, including for the treatment of genetic disease
CN109943586B (zh) 2019-03-15 2021-02-26 上海交通大学 一种植物circRNA过表达载体及其构建方法
BR112021020608A8 (pt) 2019-04-15 2023-03-21 Univ Beijing Rna recrutador de desaminase, construção, método para editar um rna alvo em uma célula hospedeira, e, construção, composição, célula, biblioteca ou kit
EA202192931A1 (ru) 2019-04-30 2022-02-22 Эдиджен Инк. Способ прогнозирования эффективности лечения гемоглобинопатии
US20220243194A1 (en) 2019-07-12 2022-08-04 Peking University Targeted rna editing by leveraging endogenous adar using engineered rnas
JP2022547105A (ja) 2019-09-04 2022-11-10 博雅▲輯▼因(北京)生物科技有限公司 オフターゲット評価に基づく遺伝子編集治療の評価方法
JP2023507486A (ja) 2019-12-16 2023-02-22 ▲広▼州▲輯▼因医▲療▼科技有限公司 造血幹細胞を増幅するための小分子化合物、及びそれらの組み合わせ
MX2022008197A (es) 2019-12-30 2022-08-02 Edigene Therapeutics Beijing Inc Metodo para el tratamiento del sindrome de usher y composicion del mismo.
PE20230037A1 (es) 2019-12-30 2023-01-10 Edigene Therapeutics Beijing Inc Metodo basado en tecnologia leaper para el tratamiento de mucopolisacaridosis ih y composicion
EP4085931A4 (en) 2019-12-31 2024-01-17 Edigene Therapeutics Beijing Inc NEW PROCESS FOR TARGETED RNA EDITING
DE102020126779A1 (de) 2020-10-13 2022-04-14 Fritsch Bakery Technologies GmbH & Co. KG Teigverarbeitungsmaschine zum Bearbeiten von Produkten
WO2022150974A1 (en) 2021-01-12 2022-07-21 Peking University Targeted rna editing by leveraging endogenous adar using engineered rnas

Also Published As

Publication number Publication date
SG11202111401RA (en) 2021-11-29
JP2022526455A (ja) 2022-05-24
CN113939591A (zh) 2022-01-14
EP3956449A1 (en) 2022-02-23
US20220307020A1 (en) 2022-09-29
MX2021012645A (es) 2021-11-12
WO2020211780A1 (en) 2020-10-22
US20220098587A1 (en) 2022-03-31
BR112021020608A2 (pt) 2022-02-22
CR20210572A (es) 2022-04-07
US11702658B2 (en) 2023-07-18
ECSP21080618A (es) 2021-12-30
TW202043249A (zh) 2020-12-01
PE20212214A1 (es) 2021-11-19
AU2020259548B2 (en) 2023-10-12
CO2021015214A2 (es) 2022-02-07
EP3956449A4 (en) 2023-03-29
CL2021002695A1 (es) 2022-07-01
BR112021020608A8 (pt) 2023-03-21
IL287248A (en) 2021-12-01
AU2020259548A1 (en) 2021-12-09
CA3136735A1 (en) 2020-10-22

Similar Documents

Publication Publication Date Title
CN113631708B (zh) 编辑rna的方法和组合物
KR20220004674A (ko) Rna를 편집하기 위한 방법 및 조성물
EP3589751A1 (en) RNA TARGETING OF MUTATIONS VIA SUPPRESSOR tRNAs AND DEAMINASES
US20170198277A1 (en) Compositions and Methods for Improving Homogeneity of DNA Generated Using a CRISPR/Cas9 Cleavage System
KR20210053898A (ko) 신규 crispr 효소 및 시스템
JP2018500913A (ja) マイクロ流体送達による遺伝子編集
JP6952315B2 (ja) ゲノム編集方法
KR20180131577A (ko) 신규의 최소 utr 서열
EP4349979A1 (en) Engineered cas12i nuclease, effector protein and use thereof
Qu et al. Leveraging endogenous ADAR for programmable editing on RNA
US20230340437A1 (en) Modified nucleases
EP4314265A2 (en) Novel crispr enzymes, methods, systems and uses thereof

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E902 Notification of reason for refusal