KR20220122727A

KR20220122727A - Rna의 표적 편집을 위한 신규한 방법

Info

Publication number: KR20220122727A
Application number: KR1020227026283A
Authority: KR
Inventors: 펭페이 위엔; 제슈안 이; 넹인 리우
Original assignee: 에디진 테라퓨틱스 (베이징) 인크.
Priority date: 2019-12-31
Filing date: 2020-12-31
Publication date: 2022-09-02
Also published as: AU2020417930A1; JP2023509178A; CA3163281A1; CN114728080A; EP4085931A4; TW202136513A; IL294336A; US20230060517A1; WO2021136520A1; EP4085931A1

Abstract

세포의 표적 RNA에서 표적화 시토신을 탈아미노화하는 방법이 제공된다. 상기 방법은, 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인, 또는 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 발현하는 구축물, 및 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 표적 RNA로 모집하는 arRNA 올리고뉴클레오티드를 포함하거나 또는 arRNA를 발현하는 구축물을 세포 내로 도입하는 단계를 포함한다. 또한, RNA 편집을 위한 조작된 조성물 또는 시스템, 및 상기 조작된 조성물 또는 시스템을 사용하여 T에서 C로의 돌연변이를 교정함으로써 질병을 치료하는 용도가 추가로 제공된다.

Description

RNA의 표적 편집을 위한 신규한 방법

본 출원은 유전자 편집 요법의 분야에 속하며, 구체적으로는 본 출원은 RNA의 C에서 U로의 특이적 프로그래머블 편집(CUSPER: C to U Specific Programmable Editing of RNA)이라는 RNA의 표적 편집을 위한 방법을 제작하고, 이것은 CUSPER 기술을 사용하여 C염기에서 U염기까지 RNA에 대한 정확한 부위 편집을 행하는 것이 포함되고, T에서 C로의 돌연변이로 인한 질병을 치료하는데 사용될 수 있다.

최근, 클러스터링된 규칙적 간격의 짧은 회문 반복부(Clustered regularly interspaced short palindromic repeats: CRISPR)가 이끄는 게놈 편집 기술이 빠르게 발전하여 생물학 및 의학의 많은 분야에 지대한 영향을 미치고 있다. 또한, 다수의 과학 연구자와 생명 공학 회사는 이 기술을 임상에 도입하기 위해 노력하고 있다. 2019년 9월에, Peking University의 Deng Hongkui 교수와 공동 연구자들은 후천성 면역 결핍 증후군(AIDS)과 백혈병을 치료하기 위해 CRISPR 기술을 사용하여 줄기 세포를 편집하고 환자에게 다시 주입한 임상 시험 결과를 최초로 보고한 아니클 11을 발표하였고, 유전자 치료 방향에 있어서, CRISPR 기술의 변형에 큰 기여를 하고 있다.

CRISPR 기술은 응용 가능성이 크지만 일련의 결함도 있어 과학적 연구 단계에서 임상 치료 용도로의 변형이 곤란하다. 문제 중 하나는, CRISPR 기술이 사용하는 핵심 역할 효소인 Cas9이다. CRISPR 기반의 DNA 편집 기술은 Cas9 또는 이와 유사한 기능을 가진 다른 뉴클레아제의 외인성 발현을 필요로 하므로 다음과 같은 문제가 발생한다. 첫째, 통상, 외인성 발현을 필요로 하는 뉴클레아제는 상대적으로 분자량이 크고, 이는 바이러스 벡터에 의해 체내로 전달되는 효율을 급격하게 감소시킨다. 둘째로, 뉴클레아제의 외인성 발현으로 인해, 이 방법은 잠재적인 뉴클레아제 오프 타겟 가능성이 있고, 이는 적용 시 잠재적인 발암 위험으로 이어질 수 있다. 마지막으로 외인성으로 발현된 Cas9 및 기타 유사한 뉴클레아제는 박테리아에서 발견되며, 인간이나 포유동물에는 자연적으로 존재하지 않아 환자의 신체에서 면역 반응을 일으킬 수 있다. 한편, 이것은 환자 자신에게 데미지를 줄 수 있고, 다른 한편으로는 외인성으로 발현된 뉴클레아제도 중화시켜 본래의 활성이 상실되어 치료 효과에 영향을 미친다.

2017년에, 매사추세츠 공과대학(MIT)의 Zhang Feng 교수와 그의 연구단은 Cas13-ADAR 융합 단백질과 단일 가이드 RNA(sgRNA)의 외인성 발현에 의해 표적 RNA를 표적으로 하는 A에서 I로의 편집 2를 달성할 수 있는, REPAIR(RNA Editing for Programmable A to I Replacement)라는 RNA 편집 기술을 보고했지만, 이 방법은 CRISPR 기술과 마찬가지로, 여전히 외래 단백질의 발현을 요구한다. 외래 단백질의 발현으로 인한 문제는 해결되지 않을 수 있다.

2019년 1월에, Thorsten Stafforst의 연구단은 올리고뉴클레오티드 매개 RNA 편집을 위한 특정 트랜스에 내인성 ADAR 모집(RESTORE; Recruiting Endogenous ADAR to Specific Trans for Oligonucleotide-mediated RNA Editing)으로 명명된 RNA 단일 염기 편집 기술을 보고하였다(Merkle et al., 2019). RESTORE는 외래 단백질에 대한 의존성을 제거할 수 있지만, RESTORE 기술은 IFN-γ의 존재 하에, 더 높은 편집 효율성을 가져야 하고, IFN-γ는 자가면역의 발달과 중증도를 결정하는 핵심 인자 9이므로, 이 기술을 의료 분야에 응용하는 것은 크게 감소된다. 한편, 가이드 RNA의 섹션은 RESTORE 기술에서도 사용되고, 사용된 가이드 RNA는 화학적으로 합성된 올리고뉴클레오티드이고, 합성된 올리고뉴클레오티드는 안정성을 보장하기 위해 인공적으로 많은 화학적 변형을 도입해야 한다. 이 화학적 변형에 있어서의 일부는 비천연 변형이므로 올리고뉴클레오티드가 독성 또는 면역원성을 가질 수 있고, 다른 일부는 동일한 염기 사슬의 다른 형태를 유도하여 동일한 RNA 서열에 대해 다수의 여러 형태 조합이 있을 수 있으며, 이는 세포 내로 전달하는데 어려움을 증가시킨다.

2019년 7월에, Peking University의 Wei Wensheng 교수의 연구단은 Nature Biotechnology에 발표된 아티클 4에 핵산 편집 기술인 LEAPER(Leveraging Endogenous ADAR for Programmable Editing of RNA)를 처음으로 보고하였다. 한편, 이 기술은 CRISPR 기술과 달리, 외인성 뉴클레아제의 과발현에 대한 의존성을 원칙적으로 제거하고, RNA를 화학적으로 합성함으로써 완성될 수 있거나, 또는 아데노 관련 바이러스(AAV) 및 렌티바이러스 등의 벡터에 의해 기능을 수행하기 위해 환자에게 전달될 수 있고, 이것은 그 전달 수단의 선택을 보다 유연하고 변경 가능하게 하여 이 기술이 의료 분야로 전환하는 과정에서 더 큰 이점을 갖고; 한편, 이 기술은 아데노신 A에서 크레아티닌 I로의 편집만 달성하므로(번역 과정에서, 크레아티닌 I은 구아노신 G로 인식될 수 있음), 다른 돌연변이, 예를 들면, T에서 C로의 돌연변이에는 무력하다. 또한, CRISPR 기술과 유사하게, 이 기술은 편집이 필요한 부위에 내인성 뉴클레아제를 모집하기 위해 가이드로서 RNA 섹션을 요구한다. 이 가이드 RNA의 섹션을 ADAR 모집 RNA(arRNA)라고 한다.

2019년 7월에, Zhang Feng 교수의 연구단은 특정 C에서 U로의 변경을 위한 RNA 편집(RESCUE: RNA Editing for Specific C to U Exchange)이라 명명된 신기술¹을 보고한다. 이 기술은 2017년 연구단이 보고한 Cas13-ADAR의 기본 골격을 기반으로 하며, 반응을 담당하는 ADAR의 촉매 도메인에 대해 다른 돌연변이 시도를 행한다. 마지막으로, ADAR 촉매 도메인의 A에서 I로의 편집 활성이 C에서 U으로의 편집 활성으로 변형되어 특정 부위의 RNA에 대한 C에서 U로의 편집이 이루어지며, 염기의 정확한 편집 범위가 더욱 확장된다. 그러나, 이 기술은 여전히 ADAR 돌연변이 후, Cas13과 융합 단백질의 외인성 발현을 요구하고, 박테리아 유래 단백질 발현에 의해 야기된 문제를 해결할 수 없다.

상기 유전자 편집 기술의 문제점을 해결하기 위해서, 유전자 편집 기술을 의료 분야에 보다 더욱 적용하기 위해서는, 전달이 용이하고 높은 효율성과 정밀도로 T에서 C로의 돌연변이를 교정할 수 있는, 표적화 유전자 편집 기술을 찾아내는 것이 시급하다.

본 출원은 새로운 RNA 편집 기술 CUSPER를 제작하고, 이 기술은 박테리아 유래 Cas13b의 발현에 의존하지 않으며, RNA 편집의 적용 범위를 A에서 I로의 편집에서 C에서 U로의 편집으로 확장한다.

본 출원에 있어서, 한편으로는, 박테리아 유래 거대분자 단백질의 발현에 의존할 필요가 없기 때문에, 외부 단백질에 대한 면역계의 공격으로 인한 시스템의 편집 효율성에 대한 영향 및 면역계에 대한 잠재적인 위험이 감소되고; 다른 한편으로는, 도입해야 하는 단백질의 분자량이 크게 감소함에 따라, 전달 방식도 더욱 유연해지며 화학적 변형 및 생물학적 전달, 예를 들면, AAV 전달 등을 포함할 수 있다. 따라서, 본 출원에서 제공하는 기술 체계는 C에서 U로 단일 염기 편집의 기술적 문제를 해결할 뿐만 아니라, 편집 시스템의 안전성, 안정성 및 사용 유연성을 향상시키고, 생체 내 용도에 더욱 유리하여 생물 의학 분야에서의 적용 가능성을 갖는다.

구체적으로, 본 발명은 이하에 기재된 것에 관련된 것이다.

1.

1) 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인, 또는 변형된 아데노신 데아미나아제 단백질 그 촉매 도메인을 발현하는 구축물, 및

2) 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 표적 RNA로 모집하는 arRNA, 또는 arRNA 또는 arRNA에 대한 코딩 서열을 포함하는 구축물을 포함하는 RNA 편집을 위한 조작된 조성물 또는 시스템으로서:

상기 아데노신 데아미나아제 단백질 또는 그 촉매 도메인은 변형된 후 시티딘 탈아미노화를 촉매하는 활성을 갖고,

상기 arRNA는 표적 RNA에 혼성되는 상보적 RNA 서열을 포함하고, 상기 arRNA는 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 표적 RNA에 모집하여 표적 RNA에서 표적 시티딘을 탈아미노화한다.

일부 실시형태에 있어서, 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 발현하는 구축물 및 arRNA에 대한 코딩 서열을 포함하는 구축물은 동일한 구축물이다. 일부 실시형태에 있어서, 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 발현하는 구축물 및 arRNA에 대한 코딩 서열을 포함하는 구축물은 분리된 구축물이다.

일부 실시형태에서, 본 출원의 변형된 아데노신 데아미나아제 단백질은, 아데노신 데아미나아제 단백질(예를 들면, ADAR2 단백질)에서 하나 이상의 아미노산의 결실, 부가 또는 치환에 의해 시티딘 탈아미노의 활성을 갖는 단백질이다. 일부 실시형태에서, 본 출원의 변형된 아데노신 데아미나아제 단백질은 아데노신 데아미나아제 단백질(예를 들면, ADAR2 단백질) 또는 그 촉매 도메인에서 하나 이상의 아미노산의 치환에 의해 시티딘 탈아미노의 활성을 갖는 단백질이다. 일부 실시형태에서, 본 출원의 변형된 아데노신 데아미나아제 단백질은 이하의 돌연변이 변형: E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T을 포함하고; 여기서, 돌연변이 변형의 아미노산의 넘버링은 NP_001103.1의 아미노산의 넘버링과 일치한다. 일부 실시형태에서, 본 출원의 변형된 아데노신 데아미나아제 단백질은 참조 서열로서, 다른 ADAR2 단백질을 사용한 E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/ S582T/V440I/S495N/K418E/S661T의 상응하는 돌연변이를 갖는 단백질을 포함한다.

일부 실시형태에서, 본 출원의 RNA 편집을 위한 조작된 조성물 또는 시스템은 상기 변형된 아데노신 데아미나아제 단백질의 촉매 도메인을 포함한다. 일부 실시형태에서, 상기 촉매 도메인은 상기 변형된 아데노신 데아미나아제 단백질의 촉매 도메인이다.

2. 항목 1에 따른 조작된 조성물 또는 시스템에 있어서, 상기 아데노신 데아미나아제는 하나 이상의 부위에서 돌연변이에 의해 변형되어 결과적으로는 우리딘으로 변환되는 시티딘을 탈아미노화하는 활성을 갖도록 한다.

3. 항목 2에 따른 조작된 조성물 또는 시스템에 있어서, 상기 아데노신 데아미나제 단백질 또는 그 촉매 도메인은 ADAR2 단백질 또는 이것의 상동 단백질 또는 그 촉매 도메인이다.

4. 항목 3에 따른 조작된 조성물 또는 시스템에 있어서, 상기 돌연변이 변형은 E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T를 포함하고, 상기 돌연변이 변형의 아미노산의 넘버링은 NP_001103.1에서의 아미노산의 넘버링과 일치한다.

일부 실시형태에서, 상기 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인은 NP_001103.1 단백질의 상동 단백질이고, 하기 돌연변이에 상응하는 돌연변이를 갖는다: E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T.

5. 항목 1-4 중 어느 하나에 따른 조작 조성물 또는 시스템에 있어서, 상기 arRNA는 표적 RNA에 혼성화되고, 표적 시티딘과 반대되는 arRNA의 표적으로 하는 염기는 A, U, C 또는 G이다.

6. 항목 5에 따른 조작 조성물 또는 시스템에 있어서, 상기 표적으로 하는 염기는 U 또는 C이다.

7. 항목 1-6 중 어느 하나에 따른 조작 조성물 또는 시스템에 있어서, 상기 arRNA는 표적 RNA의 표적 염기의 상류, 하류 또는 상류 및 하류 모두에 상응하는 하나 이상의 위치에서 쌍을 이루지 않은 뉴클레오티드를 포함하여, 표적 염기의 상류, 하류, 또는 상류와 하류 모두의 하나 이상의 위치에서 뉴클레오티드와 불일치를 형성한다.

8. 항목 7에 따른 조작 조성물 또는 시스템에 있어서, 상기 arRNA 표적으로 하는 염기의 3' 최인접 염기는 표적 RNA와 불일치를 형성한다.

9. 항목 8에 따른 조성물 또는 시스템에 있어서, 상기 arRNA는 표적 RNA에 혼성화하고, 표적으로 하는 염기의 3' 최인접 염기는 표적 RNA와 G-G 불일치를 형성한다.

10. 항목 1~9 중 어느 하나에 따른 조작 조성물 또는 시스템에 있어서, 상기 arRNA는 표적 RNA에 혼성화하고, 표적으로 하는 염기의 5' 최인접 염기는 표적 RNA와 불일치를 형성하지 않는다.

11. 항목 10에 따른 조작된 조성물 또는 시스템에 있어서, 상기 표적으로 하는 염기의 5' 최인접 염기는 U이다.

12. 항목 9에 따른 조작된 조성물 또는 시스템에 있어서, 상기 arRNA는 표적 RNA에 혼성화하고, 상기 arRNA의 표적으로 하는 염기의 5' 최인접 염기에 반대되는 표적 RNA에서, 염기 선호도가 높은 것에서 낮은 것의 순서는 G 또는 C, U 또는 A(G≒C>U≒A)이다.

13. 항목 1-6 중 어느 하나에 따른 조작된 조성물 또는 시스템에 있어서, 상기 arRNA는 표적 RNA에 혼성화하고, 표적 염기와 그 5' 및 3' 인접 염기에 의해 형성된 표적 염기 삼중항은 표적 염기에서만 불일치를 형성하고, 상기 표적 염기 삼중항은 ACG, ACC, UCC, UCG, CCC, CCG, UCA 및 UCU로부터 선택된다.

14. 항목 1-13 중 어느 하나에 따른 조작된 조성물 또는 시스템에 있어서, 상기 arRNA의 길이는 >50 nt, >55 nt, >60 nt, >65 nt, >70 nt, >75 nt, >80 nt, >85 nt, >90 nt, >95 nt, >100 nt, >105 nt, >110 nt, >115 nt, 또는 >120 nt이다. 일부 실시형태에서, 상기 arRNA의 길이는 약 151-53 nt, 131-61 nt, 121-61 nt, 111-65 nt, 101-71 nt, 91-71 nt 또는 81-71 nt이다. 일부 특정 실시형태에서, arRNA의 길이는 이 항목에서 정의한 길이 범위 내에서 임의의 하나의 양의 정수이다.

15. 항목 1-14 중 어느 하나에 따른 조작된 조성물 또는 시스템에 있어서, 상기 arRNA의 표적으로 하는 염기에서 3'-말단 및 5'-말단까지의 길이는 동일하다.

16. 항목 1-14 중 어느 하나에 따른 조작된 조성물 또는 시스템에 있어서, 상기 arRNA의 표적으로 하는 염기에서 3'-말단까지의 길이는 45-5 nt, 40-5 nt, 35-10 nt, 25 nt-15 nt 또는 24 nt-11 nt이다. 일부 특정 실시형태에서, 상기 arRNA의 길이는 이 항목에서 정의한 길이 범위 내에서 임의의 하나의 양의 정수이다.

17. 항목 1-14 중 어느 하나에 따른 조작된 조성물 또는 시스템에 있어서, 상기 arRNA의 표적으로 하는 염기에서 5'-말단까지의 길이는 80-30 nt, 70-35 nt, 60-40 nt, 55 nt-35 nt 또는 55 nt-45 nt이다. 일부 특정 실시형태에서, 상기 arRNA의 길이는 이 항목에서 정의한 길이 범위 내에서 임의의 하나의 양의 정수이다.

18. 항목 1-17 중 어느 하나에 따른 조작된 조성물 또는 시스템에 있어서, 상기 arRNA는 화학적 변형된다.

19. 항목 18에 따른 조작된 조성물 또는 시스템에 있어서, 상기 화학적 변형은 2'-O-메틸 변형 또는 뉴클레오티드 간 3'-티오 변형을 포함한다.

20. 하기 1) 및 2)를 세포로 도입하는 것을 포함하는, 세포에서의 표적 RNA의 표적 시토신을 탈아미노화하는 방법:

1) 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인, 또는 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 발현하는 구축물, 및

2) 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 표적 RNA로 모집하는 arRNA 또는 arRNA 또는 arRNA에 대한 코딩 서열을 포함하는 구축물로서, 상기 아데노신 데아미나아제 단백질 또는 그 촉매 도메인은, 변형된 후 시티딘 탈아미노화를 촉매하는 활성을 갖고, 상기 arRNA는 표적 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 arRNA는 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 표적 RNA에 모집함으로써 표적 RNA의 표적 시티딘을 탈아미노화한다.

일부 실시형태에서, 본 출원의 변형된 아데노신 데아미나아제 단백질은, 아데노신 데아미나아제 단백질(예를 들면, ADAR2 단백질)에서 하나 이상의 아미노산의 결실, 부가 또는 치환에 의해 시티딘 탈아미노화의 활성을 갖는 단백질이다. 일부 실시형태에서, 본 출원의 변형된 아데노신 데아미나아제 단백질은, 아데노신 데아미나아제 단백질(예를 들면, ADAR2 단백질) 또는 그 촉매 도메인에서 하나 이상의 아미노산의 치환에 의해 시티딘 탈아미노화의 활성을 갖는 단백질이다. 일부 실시형태에서, 본 출원의 변형된 아데노신 데아미나아제 단백질은 이하의 돌연변이 변형을 포함하고: E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T, 상기 돌연변이 변형의 아미노산의 넘버링은 NP_001103.1의 아미노산의 넘버링과 일치한다. 일부 실시형태에서, 본 출원의 변형된 아데노신 데아미나아제 단백질은, 참조 서열로서 다른 ADAR2 단백질을 사용한 E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T의 상응하는 돌연변이를 갖는 단백질을 포함한다.

일부 실시형태에서, 본 출원의 RNA 편집을 위한 조작된 조성물 또는 시스템은 상기 변형된 아데노신 데아미나아제 단백질의 촉매 도메인을 포함한다.

21. 항목 20에 따른 방법에 있어서, 상기 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 발현하는 구축물 및 arRNA에 대한 코딩 서열을 포함하는 구축물은 동일한 구축물이고, 동시에 세포에 도입되고, 또는 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 발현하는 구축물 및 상기 arRNA에 대한 코딩 서열을 포함하는 구축물은 분리된 구축물이며, 상기 분리된 구축물은 동시에 또는 별도로 세포에 도입된다.

22. 항목 20 또는 21에 따른 방법에 있어서, 상기 아데노신 데아미나아제는 하나 이상의 부위에서 돌연변이에 의해 변형되어 결과적으로 우리딘으로 변환되는 시티딘을 탈아미노화하는 활성을 갖는다.

23. 항목 22에 따른 방법에 있어서, 상기 아데노신 데아미나아제 단백질 또는 그 촉매 도메인은 ADAR2 단백질 또는 그 상동 단백질 또는 그 촉매 도메인이다.

24. 항목 23에 따른 방법에 있어서, 돌연변이 변형은 E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T를 포함하고, 상기 돌연변이 변형의 아미노산 넘버링은 NP_001103.1의 아미노산 넘버링과 일치한다.

일부 실시형태에 있어서, 상기 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인은 NP_001103.1 단백질의 상동 단백질이고, 하기 돌연변이에 상응하는 돌연변이를 갖는다:

E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T

25. 항목 21-24 중 어느 하나에 따른 방법에 있어서, 상기 arRNA는 표적 RNA에 혼성화하고, 표적 시티딘과 반대되는 arRNA의 표적으로 하는 염기는 A, U, C 또는 G이다.

26. 항목 25에 있어서, 상기 표적으로 하는 염기는 U 또는 C이다.

27. 항목 21-26 중 어느 하나에 따른 방법에 있어서,

상기 arRNA는 표적 RNA의 표적 염기의 상류, 하류, 또는 상류 및 하류 모두에 상응하는 하나 이상의 위치에서 쌍을 이루지 않은 뉴클레오티드를 포함하여 표적 염기의 상류, 하류, 또는 상류와 하류 모두의 하나 이상의 위치에서 뉴클레오티드와 불일치를 형성한다.

28. 항목 27에 있어서, 상기 arRNA 표적으로 하는 염기의 3' 최인접 염기는 표적 RNA와 불일치를 형성한다.

29. 항목 28에 있어서, 상기 arRNA는 표적 RNA에 혼성화하고, 표적으로 하는 염기의 3' 최인접 염기는 표적 RNA와 G-G 불일치를 형성한다.

30. 항목 21-29 중 어느 하나에 따른 방법에 있어서, 상기 arRNA는 표적 RNA에 혼성화하고, 표적으로 하는 염기의 5' 최인접 염기는 표적 RNA와 불일치를 형성하지 않는다.

31. 항목 30에 따른 방법에 있어서, 상기 표적으로 하는 염기의 5' 최인접 염기는 U이다.

32. 항목 29에 따른 방법에 있어서, 상기 arRNA는 표적 RNA에 혼성화하고, 상기 arRNA의 표적으로 하는 염기의 5' 최인접 염기에 반대되는 표적 RNA에서 염기 선호도가 높은 것에서 낮은 것으로의 순서는 G 또는 C, U 또는 A이다(G≒C>U≒A).

33. 항목 21-26 중 어느 하나에 따른 방법에 있어서, 상기 arRNA는 표적 RNA에 혼성화하고, 표적 염기와 그것의 5' 및 3' 인접 염기에 의해 형성된 표적 염기 삼중항은 표적 염기에서만 불일치를 형성하고, 상기 표적 염기 삼중항은 ACG, ACC, UCC, UCG, CCC, CCG, UCA 및 UCU로부터 선택된다.

34. 항목 21-33 중 어느 하나에 따른 방법에 있어서, 상기 arRNA의 길이는 >50 nt, >55 nt, >60 nt, >65 nt, >70 nt, >75 nt, >80 nt, >85 nt, >90 nt, >95 nt, >100 nt, >105 nt, >110 nt, >115 nt 또는 >120 nt이다. 일부 실시형태에 있어서, 상기 arRNA의 길이는 약 151-53 nt, 131-61 nt, 121-61 nt, 111-65 nt, 101-71 nt, 91-71 nt 또는 81-71 nt이다. 일부 특정 실시형태에서, 상기 arRNA의 길이는 이 항목에서 정의한 길이 범위 내에서 임의의 하나의 양의 정수이다.

35. 항목 21-34 중 어느 하나에 따른 방법에 있어서, 상기 arRNA의 표적으로 하는 염기에서 3'-말단 및 5'-말단까지의 길이는 동일하다.

36. 항목 21-34 중 어느 하나에 따른 방법에 있어서, 상기 arRNA의 표적으로 하는 염기에서 3'-말단까지의 길이는 45-5 nt, 40-5 nt, 35-10 nt, 25 nt-15 nt 또는 24 nt-11 nt이다. 일부 특정 실시형태에서, 상기 arRNA의 길이는 이 항목에서 정의한 길이 범위 내에서 임의의 하나의 양의 정수이다.

37. 항목 21-34 중 어느 하나에 따른 방법에 있어서, 상기 arRNA의 표적으로 하는 염기에서 5' 말단까지의 길이는 80-30 nt, 70-35 nt, 60-40 nt, 55 nt-35 nt 또는 55 nt-45 nt이다. 일부 특정 실시형태에서, 상기 arRNA의 길이는 이 항목에서 정의한 길이 범위 내에서 임의의 하나의 양의 정수이다.

38. 항목 21-37 중 어느 하나에 따른 방법에 있어서, 상기 arRNA는 화학적 변형된다.

39. 항목 38에 따른 방법에 있어서, 상기 화학적 변형은 2'-O-메틸 변형 또는 뉴클레오티드 간 3'-티오 변형을 포함한다.

40. 항목 21-39 중 어느 하나에 따른 방법에 있어서, 상기 세포는 포유동물 세포이다.

41. T에서 C로의 돌연변이에 의해 유발된 질병을 치료하는 방법으로서,

항목 21-39 중 어느 하나의 방법을 사용하여 T에서 C로의 돌연변이를 포함하는 전사 형성된 메신저 RNA에서 표적 염기 C를 탈아미노화하여 돌연변이를 교정한다.

42. 변형된 아데노신 데아미나아제 단백질로서, 상기 아데노신 데아미나아제 단백질은 ADAR2이고, 이것은 E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T의 돌연변이 변형을 포함하고, 여기서 상기 돌연변이 변형의 아미노산 넘버링는 NP_001103.1의 아미노산 넘버링과 일치하고, 상기 ADAR2 단백질은 돌연변이에 의해 변형된 후, 시티딘의 탈아미노화를 촉매하는 활성을 갖는다.

일부 실시형태에서, 상기 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인은 NP_001103.1 단백질의 상동 단백질이고, 하기 돌연변이에 상응하는 돌연변이를 갖는다:

E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T.

43. 우리딘으로의 시티딘 탈아미노화를 촉매하기 위한 항목 42에 따른 변형된 아데노신 데아미나아제 단백질의 용도.

도 1은, 생물학적 위양성(BFP) 리포터 시스템 및 C에서 U로 편집되는 표적 염기를 나타낸다.
도 2는, CUSPER 및 RESCUE 기술에 의해 가이드 RNA가 설계되고, 표적으로 하는 지점을 U로 할 때, 표적 염기의 선택 및 표적으로 하는 부위에서의 인접 염기의 설계 원리를 나타낸다.
도 3은, CUSPER 편집 시스템의 테스트를 나타낸다. 도면에서 "/"는 해당하는 플라스미드 또는 arRNA가 첨가되지 않고, 동일한 체적의 물만 첨가되었음을 나타낸다.
도 4는, 표적 염기의 인접한 상류 및 하류 염기에 대한 LEAPER 기술의 선호도를 나타낸다. 도면의 화살표는 도 3에 해당하는 표적 염기의 3' 인접 염기가 A인 경우, 5' 인접 염기에 대한 LEAPER 기술의 선호도를 나타낸다.
도 5는, 표적 염기의 인접한 상류 및 하류 염기에 대한 RESCUE 기술의 선호도를 나타낸다. 도면의 화살표는 도 3에 해당하는 3' 인접 염기가 A인 경우, 5' 인접 염기에 대한 RESCUE 기술의 선호도를 나타낸다.
도 6은, CUSPER 편집 시스템에서 반복 테스트한 결과를 나타낸다. 도면에서 "/"는 해당하는 플라스미드 또는 arRNA가 첨가되지 않고, 동일한 체적의 물만 첨가되었음을 나타낸다.
도 7은, 표적 C가 U에 상응하고, 그 인접 염기가 불일치를 갖지 않는 경우의 mRNA와 해당하는 arRNA의 서열을 나타낸다.
도 8은, 표적 C가 U에 상응하고, 그 인접 염기가 불일치를 갖지 않는 경우의 3' 및 5' 인접 염기의 조합 16개 모두에 대한 C에서 U으로의 RNA 편집 효율을 나타낸다.

통상, 기존의 유전자 편집 기술이 이종 외래 단백질에 의존하는 딜레마를 해결하고 더 많은 유형의 염기에 대한 정확한 단일 염기 편집을 달성하기 위해서, 본 출원은 RNA 편집 기술 CUSPER를 제작한다. CUSPER는 RNA 편집의 적용 범위를 A에서 I로의 편집에서 C에서 U으로의 편집으로 확장하고, 포유류 자체에서 발현되는 효소 단백질을 편집에 사용하기 때문에, 이종 외래 단백질이 세포로 도입되는 것을 회피함으로써 안전성이 향상되고, 전체 유전자 편집 공정이 보다 효율적이고 편리하다.

정의

본원에서 사용되는 "CUSPER 기술"은, 본 출원의 기술적 방안에 있어서 근본 기술이고, 상기 CUSPER는 "C to U Specific Programmable Editing of RNA"의 약자로 "시티딘 C를 우리딘 U로 변환하는 특정 프로그래머블 RNA 편집"이다. 이 기술은 표적 RNA에 상보적으로 혼성화할 수 있는 짧은 RNA의 단면을 사용하여, 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 포함하는 단백질을 표적 RNA에 모집해서 표적 시티딘을 탈아미노화하여 우리딘으로 변환하는 기술이다. 여기서, 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 포함하는 단백질은 변형된 후 시토신 탈아미노화를 촉매하는 활성을 갖는다. 표적 RNA에 상보적으로 혼성화할 수 있는 짧은 RNA는 arRNA이다. 본 출원에서 사용되는 바와 같이, "arRNA"는 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 표적 RNA로 모집할 수 있는 단일 가닥 RNA를 의미하고, 상기 arRNA는 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 표적 RNA로 모집하여 표적 RNA의 표적 시티딘이 탈아미노화되도록 한다. 본원에서 사용되는 바와 같이, 핵산의 "상보성"은 통상의 Watson-Crick 염기 쌍에 의해 하나의 핵산이 다른 핵산과 수소 결합을 형성하는 능력을 말한다. 백분율 상보성은 핵산 분자에서 다른 핵산 분자와 수소 결합(즉, Watson-Crick 염기쌍)을 형성할 수 있는 잔기의 백분율(예를 들면, 10에서 약 5, 6, 7, 8, 9 및 10은 약 50%, 60%, 70%, 80%, 90% 및 100%의 상보성이다)을 나타낸다. "완전한 상보성"은 핵산 서열의 모든 연속 잔기가 제 2 핵산 서열에서의 동일한 수의 연속 잔기와 수소 결합을 형성하는 것을 의미한다. 본원에서 사용되는 바와 같이, 기본 상보성"은 약 40, 50, 60, 70, 80, 100, 150, 200, 250개 이상의 뉴클레오티드의 영역에서 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100%의 임의의 하나의 상보성 정도를 나타내며, 또는 엄격한 조건 하에 혼성화하는 2개의 핵산을 의미한다. 단일 염기 또는 단일 뉴클레오티드에 대해서는 Watson-Crick 염기 쌍 원리에 따라, A가 T 또는 U와 쌍을 이루고 C가 G 또는 I와 쌍을 이루는 경우, 상보성 또는 일치라고 하며, 그 반대의 경우도 마찬가지이고; 다른 염기쌍은 모두 비상보성 또는 불일치라고 한다.

"혼성화"는 하나 이상의 폴리뉴클레오티드가 반응하여 착체를 형성하는 반응을 말하고, 상기 착체는 뉴클레오티드 잔기의 염기 사이의 수소 결합에 의해 안정화된다. 수소 결합은 Watson Crick 염기쌍, Hoogstein 결합 또는 임의의 다른 서열 특이적 방식에 의해 발생할 수 있다. 제공된 서열에 혼성화할 수 있는 서열은 제공된 서열의 "상보적 서열"로 나타낸다.

본원에 사용되는 바와 같이, "전달"이라는 용어는, 핵산 및 단백질 등의 생물학적 거대 분자가 세포막 외부로부터 세포막으로, 특정 경로로 도입되는 것을 나타낸다. 예를 들면, 상기 "전달"은 전기형질감염, 리포펙션, 지질-나노입자 전달, 바이러스 전달 및 엑소좀 전달이다.

본원에 사용되는 바와 같이, "표적 RNA"라는 용어는, 편집되는 표적 RNA를 나타내고, 이것은 편집되는 시티딘을 포함한다. 표적 RNA는 성숙한 mRNA 또는 mRNA 전구체일 수 있다. 편집되는 시티딘은 "타겟 염기", "타겟 시티딘" 또는 "타겟 C"로서 나타낸다. 표적 RNA의 5' 말단에서 표적 시티딘에 인접한 염기를 "5' 인접 염기"라 하고; 표적 RNA의 3' 말단에서 표적 시티딘에 인접한 염기를 "3' 인접 염기"라 하고, 표적 염기와 그것의 3' 및 5' 인접 염기에 의해 형성된 염기 삼중항은 본원에서 "표적 염기 삼중항"으로 나타내어진다. arRNA가 표적 RNA에 혼성화하는 경우, 표적 염기와 반대되는 arRNA 상의 염기를 "표적 염기"라 하고, arRNA의 5'-말단에서 표적 염기에 인접한 염기를 "5' 최인접 염기"라 하고, arRNA의 3'-말단에서 표적 염기에 인접한 염기를 "3' 최인접 염기"라 하며, 표적 염기와 그것의 3' 및 5' 최인접 염기에 의해 형성된 염기 삼중항은, 본원에서 "표적으로 하는 염기 삼중항"으로 나타내어진다.

이 아티클에서 3'-말단에서 표적으로 하는 염기의 길이는, 표적으로 하는 염기의 3' 최인접 염기에서 3' 최말단 염기까지의 모든 염기의 수를 나타내고; 5'-말단에서 표적으로 하는 염기의 길이는, 표적으로 하는 염기의 5' 최인접 염기에서 5' 최말단 염기까지의 모든 염기의 수를 나타낸다.

본원에 사용된 용어 "ADAR"은 진핵생물(인간 등의 포유동물 포함)의 다양한 조직에서 광범위하게 발현되고, RNA 분자에 있어서, 아데노신 A에서 이노신 I로의 변환을 촉매할 수 있는 아데노신 데아미나아제 효소의 부류를 나타낸다.

본 출원에 있어서, E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T 돌연변이는 ADAR2 단백질에서 발생하는 일련의 돌연변이를 나타내고, 상기 돌연변이 변형의 아미노산의 넘버링은 NP_001103.1의 아미노산 넘버링과 일치하며, 즉 NP_001103.1이 참조 서열로 사용된다. 돌연변이에 있어서의 아미노산의 넘버링은 상이한 ADAR2 단백질의 참조 서열에 대해 변경될 수 있다는 것이 당업자에게 공지되어 있어야 한다. 따라서, 본 출원에서 사용된 바와 같이, 상기 E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T 돌연변이는 돌연변이된 아미노산의 위치에 상응하는 상이한 ADAR2 단백질 참조 서열에서의 돌연변이를 포함하고, ADAR2 단백질은 돌연변이에 의해 변형된 후, 시티딘 탈아미노화를 촉매하는 활성을 갖는다. 상응하게, 본 출원에 의해 제공된 변형된 아데노신 데아미나아제 단백질은 NP_001103.1을 참조 서열로 사용하고, E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T 돌연변이 변형을 포함하는 ADAR2를 포함하고, 또한, 참조 서열로서 상이한 ADAR2 단백질을 사용하고 상응하는 돌연변이 변형을 포함하는 ADAR2를 포함한다.

본원에서 "구축물"이라는 용어는, 임의의 핵산 서열을 포함하는 핵산 벡터를 나타내고, 상기 핵산 벡터는 선형 핵산 분자, 플라스미드 또는 바이러스 벡터 등일 수 있다. 상기 핵산 분자는 단일 가닥 또는 이중 가닥 분자일 수 있다. 특정 핵산 서열은 DNA 서열 또는 RNA 서열일 수 있다. 일부 실시형태에서, 핵산 서열은 전사, 번역 또는 발현됨이 없이 직접 기능한다. 일부 실시형태에서, 핵산 서열은 DNA 서열이고, 전사되어 RNA를 형성한 후 RNA 분자의 형태로 기능한다. 일부 실시형태애서, 핵산 서열은 RNA이고, 폴리펩티드 또는 단백질의 형태로 기능하도록 번역된다. 일부 실시형태에서, 핵산 서열은 DNA이며 전사 및 번역 단계를 거쳐 단백질을 형성 후, 단백질의 형태로 기능한다. 상기 구축물은 바이러스, 지질 나노입자 또는 엑소좀 등으로 패키징하거나 또는 전기 변환, 미세 주입, 화학적 변환 등에 의해 세포에 들어갈 수 있다.

본원에서 "변형"이라는 용어는 유전 공학적 방법 등의 화학적 방법에 의해 핵산 또는 단백질의 조성 또는 구조를 변화시켜 핵산 또는 단백질의 하나 이상의 특성 또는 기능을 변경시키는 것을 나타낸다. 예를 들면, 본 출원에서, 아데노신 데아미나아제 단백질 또는 그 촉매 도메인은 변형, 예를 들면, 하나 이상의 아미노산의 추가, 결실 및/또는 돌연변이 후, 시티딘 아미노화를 촉매하는 효과를 갖는다.

조작된 조성물 또는 시스템

본 출원은 이하를 포함하는 RNA 편집을 위한 조작된 조성물 또는 시스템을 제공한다.

1) 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인, 또는 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 발현하는 구축물로서, 상기 아데노신 데아미나아제 단백질 또는 그 촉매 도메인은 변형 후에 시티딘 탈아미노화를 촉매하는 활성을 갖는 구축물, 및

2) 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 표적 RNA로 모집하는 arRNA, 또는 arRNA 또는 arRNA에 대한 코딩 서열을 포함하는 구축물로서,

상기 arRNA는 표적 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 arRNA는 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 표적 RNA에 모집하여 표적 RNA에서 표적 시티딘을 탈아미노화하는 구축물.

일부 실시형태에서, 본 출원의 변형된 아데노신 데아미나아제 단백질은 아데노신 데아미나아제 단백질(예를 들면, ADAR2 단백질)에서 하나 이상의 아미노산의 결실, 부가 또는 치환에 의해 시티딘 탈아미노화의 활성을 갖는 단백질이다. 일부 실시형태에서, 본 출원의 변형된 아데노신 데아미나아제 단백질은 아데노신 데아미나아제 단백질(예를 들면, ADAR2 단백질) 또는 그 촉매 도메인에서 하나 이상의 아미노산의 치환에 의해 시티딘 탈아미노화의 활성을 갖는 단백질이다. 일부 실시형태에서, 본 출원의 변형된 아데노신 데아미나제 단백질은 하기 돌연변이 변형을 포함한다: E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T, 여기서, 돌연변이 변형의 아미노산의 넘버링은 NP_001103.1의 아미노산 넘버링과 일치한다. 일부 실시형태에서, 본 출원의 변형된 아데노신 데아미나아제 단백질은 참조 서열로서 다른 ADAR2 단백질을 사용한 E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T의 상응하는 돌연변이를 갖는 단백질을 포함한다.

일부 실시형태에서, 본 출원의 RNA 편집을 위한 조작된 조성물 또는 시스템은 상기 변형된 아데노신 데아미나아제 단백질 또는 이것의 촉매 도메인을 포함한다. 일부 실시형태에서, 촉매 도메인은 상기 변형된 아데노신 데아미나아제 단백질의 촉매 도메인이다.

일부 실시형태에서, 아데노신 데아미나아제는 하나 이상의 부위에서의 돌연변이에 의해 변형되어 시티딘 탈아미노화 활성을 가져서 우리딘으로 변환된다. 일부 실시형태에서, 아데노신 데아미나아제 단백질 또는 그 촉매 도메인은 ADAR2 단백질 또는 그 상동 단백질 또는 ADAR2 단백질의 촉매 도메인 또는 ADAR2 단백질 상동 단백질의 촉매 도메인이다. 일부 실시형태에서, 상기 돌연변이 변형은 E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T를 포함하고, 상기 돌연변이 변형의 아미노산의 넘버링은 NP_001103.1의 아미노산 넘버링과 일치한다.

일부 실시형태에서, 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인은 구축물을 세포에 도입하여 발현되고, 구축물은 선형 핵산, 플라스미드 및 바이러스 벡터 중 어느 하나에서 선택된다. 일부 실시형태에서, 세포는 진핵 세포이다. 일부 실시형태에서, 세포는 포유동물 세포이다. 일부 실시형태에서, 세포는 인간 세포이다.

일부 실시형태에서, arRNA가 표적 RNA에 혼성화하는 경우, 표적 시티딘에 반대되는 그것의 표적으로 하는 염기는 A, U, C, 또는 G이다. 일부 실시형태에서, 바람직한 표적으로 하는 염기 순서는 U>C>A≒G이고, 즉, 표적으로 하는 염기를 제외한 모든 염기가 동일한 복수의 arRNA 서열을 비교하면, 표적으로 하는 염기가 U 또는 C인 arRNA는, 일반적으로 편집 효율이 더욱 높다. 따라서 바람직하게는 일부 실시형태에서 표적으로 하는 염기는 U 또는 C이다.

일부 실시형태에서, arRNA는 표적 RNA의 표적 염기의 상류, 하류, 또는 상류 및 하류 모두에 상응하는 하나 이상의 위치에서 쌍을 이루지 않은 뉴클레오티드를 포함하여, 표적 염기의 상류, 하류, 또는 상류와 하류 모두의 하나 이상의 위치에서 뉴클레오티드와 불일치를 형성한다. 일부 실시형태에서, arRNA 표적으로 하는 염기의 3' 최인접 염기는 표적 RNA와 불일치를 형성한다. 일부 실시형태에서, arRNA는 표적 RNA에 혼성화하는 경우, 표적으로 하는 염기의 3' 최인접 염기는 표적 RNA와 G-G 불일치를 형성한다. 일부 실시형태에서, arRNA가 표적 RNA에 혼성화하는 경우, 표적으로 하는 염기의 5' 최인접 염기는 표적 RNA와 불일치를 형성하지 않는다. 일부 실시형태에서, 표적으로 하는 염기의 5' 최인접 염기는 표적 RNA와 불일치를 형성하지 않고, 여기서 표적으로 하는 염기의 5' 최인접 염기는 U이다. 일부 실시형태에서, arRNA는 표적 RNA에 혼성화하고, arRNA의 표적으로 하는 염기의 5' 최인접 염기와 반대되는 표적 RNA에서 염기 선호도가 높은 것에서 낮은 것의 순서는 G 또는 C, U 또는 A이다. 일부 실시형태에서, arRNA가 표적 RNA와 상보적으로 혼성화하는 경우, arRNA 표적으로 하는 삼중항을 제외한 하나 이상의 염기가 표적 RNA와 불일치를 형성한다. 또한, 일부 실시형태에서, 상기 불일치는 arRNA를 기반으로 하는 표적화 편집의 효율성을 더욱 개선할 수 있다.

일부 실시형태에서, arRNA가 표적 RNA에 혼성화하는 경우, 표적 염기 및 그 5' 및 3' 인접 염기에 의해 형성된 표적 염기 삼중항은 표적 염기에서만 불일치를 형성하고, arRNA에서 표적으로 하는 염기로부터 3'-말단과 5'-말단까지의 길이는 동일하다. 이 때, 상기 표적 염기 삼중항은 ACG, ACC, UCC, UCG, CCC, CCG, UCA 및 UCU에서 선택되는 것이 바람직하다. 일부 실시형태에서, arRNA가 표적 RNA에 혼성화하는 경우, 표적 염기 및 그 5' 및 3' 인접 염기에 의해 형성된 표적 염기 삼중항은 표적 염기에서만 불일치를 형성하고, 3'-말단 및 5'-말단에서 arRNA의 표적으로 하는 염기의 길이는 동일하지 않다. 이 때, 표적 염기 삼중항은 ACG, ACC, UCC, UCG, CCC, CCG, UCA 및 UCU에서 선택된다.

일부 실시형태에서, arRNA의 길이는 >50 nt, >55 nt, >60 nt, >65 nt, >70 nt, >75 nt, >80 nt, >85 nt, >90 nt, >95 nt, >100nt, >105nt, >110nt, >115nt 또는 >120nt이다. 일부 실시형태에서, arRNA는 길이는 약 151-53 nt, 131-61 nt, 121-61 nt, 111-65 nt, 101-71 nt, 91-71 nt 또는 81-71 nt이다. 일부 특정 실시형태에서, arRNA의 길이는 이 항목에 의해 정의된 길이 범위 내의 임의의 하나의 양의 정수이다.

일부 실시형태에서, arRNA의 표적으로 하는 염기로부터 3'-말단 및 5'-말단까지의 길이는 동일하다. 일부 실시형태에서, 3'-말단 및 5'-말단으로부터의 arRNA의 표적으로 하는 염기의 길이는 동일하지 않다. 일부 실시형태에서, arRNA의 표적으로 하는 염기로부터 3'-말단까지의 길이는 45-5 nt, 40-5 nt, 35-10 nt, 25 nt-15 nt, 또는 24 nt-11 nt이다. 일부 특정 실시형태에서, 길이는 이 항목에 의해 정의된 길이 범위 내의 임의의 하나의 양의 정수로부터 선택된다.

일부 실시형태에서, arRNA의 표적으로 하는 염기로부터 5'-말단까지의 길이는 80-30 nt, 70-35 nt, 60-40 nt, 55 nt-35 nt, 또는 55 nt-45 nt이다. 일부 특정 실시형태에서, 길이는 이 항목에 의해 정의된 길이 범위 내의 임의의 하나의 양의 정수로부터 선택된다. 일부 실시형태에서, arRNA의 표적으로 하는 염기로부터 5'-말단까지의 길이는 80보다 크다.

일부 실시형태에서, arRNA는 화학적으로 합성된다. 일부 실시형태에서, arRNA는 올리고뉴클레오티드이다. 일부 실시형태에서, arRNA는 화학적으로 변형된다. 일부 실시형태에서, 화학적 변형은 2'-O-메틸 변형 또는 뉴클레오티드 간 3'-티오 변형을 포함한다. 일부 실시형태에서, 화학적 변형은 이하의 것 중 하나 이상에서 선택된다:

서열의 처음 3개 뉴클레오티드 및 마지막 3개 뉴클레오티드는 각각 2'-OMe에 의해 변형된다,

처음 3개 및 마지막 3개의 뉴클레오티드 간 연결은 포스포로티오에이트 결합 연결이다,

서열의 모든 U는 2'-OMe에 의해 변형된다,

표적으로 하는 염기의 3' 최인접 염기는 2'-OMe에 의해 변형된 A이다,

표적으로 하는 염기의 5' 최인접 염기는 2'-OMe에 의해 변형된 C이다,

표적으로 하는 염기는 각각 포스포로티오에이트 결합에 의해 그것의 3' 최인접 염기 및 5' 최인접 염기에 연결된다,

처음 5개 및 마지막 5개 뉴클레오티드는 각각 2'-OMe에 의해 변형된다, 그리고,

처음 5개 및 마지막 5개 뉴클레오티드 간 연결은 포스포로티오에이트 결합 연결이다.

일부 실시형태에서, arRNA는 구촉물에 의해 인코딩되고 전사에 의해 생성된다. 일부 실시형태에서, 구축물은 선형 핵산 사슬, 바이러스 벡터 또는 플라스미드로부터 선택된다.

RNA 편집 방법

본 출원은 하기 1) 및 2)를 세포 내로 도입하는 것을 포함하는, 세포 내의 표적 RNA에서의 표적 시토신을 탈아미노화하는 방법, CUSPER(프로그래밍된 C에서 U로의 RNA 편집)를 제공한다:

2) 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 표적 RNA에 모집하는 arRNA, 또는 arRNA 또는 arRNA에 대한 코딩 서열을 포함하는 구축물로서, 상기 아데노신 데아미나아제 단백질 또는 그 촉매 도메인은 변형된 후 시티딘 탈아미노화를 촉매하는 활성을 갖고, 상기 arRNA는 표적 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 arRNA는 상기 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 표적 RNA에 모집함으로써 표적 RNA에서 표적 시티딘을 탈아미노화하는 구축물.

일부 실시형태에서, 세포는 진핵 세포이다. 일부 실시형태에서, 세포는 포유동물 세포이다. 일부 실시형태에서, 세포는 인간 세포이다. 일부 실시형태에서, 세포는 마우스 세포이다.

일부 실시형태에서, 본 출원의 변형된 아데노신 데아미나아제 단백질은 아데노신 데아미나아제 단백질(예를 들면, ADAR2 단백질)에서 하나 이상의 아미노산의 결실, 부가 또는 치환에 의해 시티딘 탈아미노화의 활성을 갖는 단백질이다. 일부 실시형태에서, 본 출원의 변형된 아데노신 데아미나아제 단백질은 아데노신 데아미나아제 단백질(예를 들면, ADAR2 단백질) 또는 그 촉매 도메인에서 하나 이상의 아미노산의 치환에 의해 시티딘 탈아미노화의 활성을 갖는 단백질이다. 일부 실시형태에서, 본 출원의 변형된 아데노신 데아미나아제 단백질은 하기 돌연변이 변형을 포함한다: E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I /M383L/D619G/S582T/V440I/S495N/K418E/S661T, 여기서, 돌연변이 변형의 아미노산 넘버링은 NP_001103.1의 아미노산 넘버링과 일치한다. 일부 실시형태에서, 본 출원의 변형된 아데노신 데아미나아제 단백질은 참조 서열로 다른 ADAR2 단백질을 사용하여 E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/ S582T/V440I/S495N/K418E/S661T의 상응하는 돌연변이를 갖는 단백질을 포함한다.

변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 발현하는 구축물이, 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인의 코딩 서열을 포함한다는 것이 당업자에게 공지되어 있어야 한다. 일부 실시형태에서, 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 발현하는 구축물 및 arRNA에 대한 코딩 서열을 포함하는 구축물은 동일한 구축물이다. 일부 실시형태에서, 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인의 코딩 서열을 발현하는 구축물 및 arRNA에 대한 코딩 서열을 포함하는 구축물은 상이한 구축물이고, 즉 변형된 아데노신 데아미나아제 단백질 또는 그것의 촉매 도메인의 코딩 서열 및 arRNA에 대한 코딩 서열은 각각 상이한 구축물 상에 위치한다. 일부 실시형태에서, 상이한 구축물은 2개 이상의 구축물이다. 일부 실시형태에서, 상이한 구축물은 동시에 또는 별도로 세포 내에 도입된다. 이 단락에서 언급된 상이한 구축물은 동일하지 않은 구축물을 나타내며, 상이한 구축물이 구축물의 상이한 범주에 각각 속하는 것을 의미하지는 않는다는 것을 이해해야 한다. 일부 실시형태에서, 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 발현하는 구축물 및 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 표적 RNA에 모집하는 arRNA 또는 arRNA를 포함하는 구축물 또는 arRNA에 대한 코딩 서열을 포함하는 구축물이 동일한 세포 내에 도입된다. 일부 실시형태에서, 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인 또는 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 발현하는 구축물, 및 복수의 arRNA 또는 arRNA를 포함하는 구축물 또는 arRNA에 대한 코딩 서열을 포함하는 구축물이 세포 내로 도입되어 표적 RNA의 높은 스루풋 편집을 달성하고, 상기 복수의 arRNA는 상이한 표적 RNA를 표적으로 하는 arRNA, 또는 동일한 표적 RNA에서 상이한 표적 염기(예를 들면, C) 부위를 표적으로 하는 arRNA이다.

따라서, 본 출원은 하기 1) 및 2)를 세포 내로 도입하는 것을 포함하는, 세포의 표적 RNA에서의 표적 시토신의 높은 스루풋 편집을 위한 방법도 포함한다.

1) 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인 또는 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 발현하는 구축물, 및

변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인은 표적 RNA의 복수(예를 들면, 2 이상, 5 이상, 5 이상 및 10 이상)의 arRNA 또는 arRNA를 포함하거나 또는 그 코딩 서열을 포함하는 구축물에 모집하고, 상기 아데노신 데아미나아제 단백질 또는 그 촉매 도메인은 변형된 후 시티딘 탈아미노화를 촉매하는 활성을 갖고, 상기 복수(예를 들면, 2 이상, 5 이상, 5 이상 및 10 이상)의 arRNA는 표적 RNA를 각각 혼성화하는 상보성의 RNA 서열을 포함하고, arRNA는 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 표적 RNA에 모집하여 표적 RNA의 표적 시티딘이 탈아미노화되도록 한다.

일부 실시형태에서, 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 발현하는 구축물 및 arRNA에 대한 코딩 서열을 포함하는 구축물은 동일한 구축물이거나, 또는 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 발현하는 구축물 및 arRNA에 대한 코딩 서열을 포함하는 구축물은 분리된 구축물이고, 분리된 구축물은 세포에 동시에 또는 별도로 도입된다.

일부 실시형태에서, 상기 아데노신 데아미나아제는 하나 이상의 부위에서 돌연변이에 의해 변형되어 결과적으로는 우리딘으로 변환하는 시티딘을 탈아미노화하는 활성을 갖는다.

일부 실시형태에서, 상기 아데노신 데아미나아제 단백질 또는 그 촉매 도메인은 ADAR2 단백질 또는 상동 단백질 또는 그 촉매 도메인이다.

일부 실시형태에서, 상기 돌연변이 변형은, E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T를 포함하고, 여기서, 상기 돌연변이 변형의 아미노산의 넘버링은 NP_001103.1의 아미노산의 넘버링과 일치한다. 일부 실시형태에서, 상기 구축물은 바이러스 벡터, 플라스미드 및 선형 핵산에서 선택된다. 일부 실시형태에서, 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인 또는 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 발현하는 구축물 및 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 표적 RNA의 arRNA에 모집하는 올리고뉴클레오티드를 포함하거나 또는 arRNA를 전사하는 구축물이 바이러스 감염, 화학적 형질감염, 전기 형질감염, 엑소좀 전달 또는 나노-지질 입자 전달과 같은 모드에 의해 세포 내로 도입된다.

일부 실시형태에서, 아데노신 데아미나아제는 하나 이상의 부위에서 돌연변이에 의해 변형되어 유리딘으로 변환되도록 시티딘을 탈아미노화하는 활성을 갖는다. 일부 실시형태에서, 상기 아데노신 데아미나아제 단백질 또는 그 촉매 도메인은 ADAR2 단백질 또는 상동 단백질 또는 그 촉매 도메인이다. 일부 실시형태에서, 상기 돌연변이 변형은 E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T를 포함하고, 상기 돌연변이 변형의 아미노산의 넘버링은 NP_001103.1의 아미노산의 넘버링과 일치한다.

일부 실시형태에서, arRNA가 표적 RNA에 혼성화하는 경우, 표적 시티딘과 반대되는 그것의 표적으로 하는 염기는 A, U, C 또는 G이다. 일부 실시형태에서, arRNA가 표적 RNA에 혼성화하는 경우, 표적 시티딘과 반대되는 그것의 표적으로 하는 염기는 U 또는 C가 바람직하다.

일부 실시형태에서, arRNA는 표적 RNA의 표적 염기의 상류, 하류, 또는 상류 및 하류 모두에 상응하는 하나 이상의 위치에 쌍을 이루지 않은 뉴클레오티드를 포함하여, 표적 염기의 상류, 하류, 또는 상류와 하류 모두의 위치 중 하나 이상에서 뉴클레오티드와 불일치를 형성한다. 일부 실시형태에서, arRNA 표적으로 하는 염기의 3' 최인접 염기는 표적 RNA와 불일치를 형성한다. 일부 실시형태에서, arRNA는 표적 RNA에 혼성화하는 경우, 표적으로 하는 염기의 3' 최인접 염기는 표적 RNA와 G-G 불일치를 형성한다. 일부 실시형태에서, arRNA가 표적 DNA에 혼성화되는 경우, 표적으로 하는 염기의 5' 최인접 염기는 표적 RNA와 불일치를 형성하지 않는다. 일부 실시형태에서, 표적으로 하는 염기의 5' 최인접 염기는 U이다. 일부 실시형태에서, arRNA는 표적 RNA에 혼성화하고, arRNA의 표적으로 하는 염기의 5' 최인접 염기와 반대되는 표적 RNA에서 염기 선호도가 높은 것에서 낮은 것으로의 순서는 G 또는 C, U 또는 A(G≒C>U≒A)이다. 일부 실시형태에서, arRNA가 표적 RNA에 혼성화하는 경우, arRNA의 표적으로 하는 염기의 5' 최인접 염기와 반대되는 표적 RNA의 염기는 바람직하게는 G 또는 C이다. 일부 실시형태에서, arRNA가 표적 RNA에 혼성화하는 경우, arRNA의 표적으로 하는 염기의 5' 최인접 염기와 반대되는 표적 RNA의 염기는 가장 바람직하게는 G이다. 일부 실시형태에서, arRNA가 표적 RNA에 상보적으로 혼성화하는 경우, arRNA 표적으로 하는 삼중항을 제외한 하나 이상의 염기가 표적 RNA와 불일치를 형성한다. 또한, 일부 실시형태에서, 상기 불일치는 arRNA에 대한 표적화 편집의 효율성을 더욱 개선시킬 수 있다.

일부 실시형태에서, arRNA가 표적 RNA에 혼성화하는 경우, 표적 염기와 그것의 5' 및 3' 인접 염기에 의해 형성된 표적 염기 삼중항은 표적 염기에서만 불일치를 형성하고, arRNA의 표적으로 하는 염기에서 3'-말단 및 5'-말단까지의 길이는 동일하다. 이 때, 상기 표적 염기 삼중항은 ACG, ACC, UCC, UCG, CCC, CCG, UCA 및 UCU에서 선택되는 것이 바람직하다. 일부 실시형태에서, arRNA가 표적 RNA에 혼성화하는 경우, 표적 염기와 그것의 5' 및 3' 인접 염기에 의해 형성된 표적 염기 삼중항은 표적 염기에서만 불일치를 형성하고, 3'-말단 및 5'-말단에서의 arRNA의 표적 염기의 길이는 같지 않다. 이 때, 표적 염기 삼중항은 ACG, ACC, UCC, UCG, CCC, CCG, UCA 및 UCU에서 선택된다.

일부 실시형태에서, arRNA의 길이는 >50 nt, >55 nt, >60 nt, >65 nt, >70 nt, >75 nt, >80 nt, >85 nt, >90 nt, >95 nt, >100 nt, >105nt, >110nt, >115nt 또는 >120nt이다. 일부 실시형태에서, arRNA는 길이가 약 151-53 nt, 131-61 nt, 121-61 nt, 111-65 nt, 101-71 nt, 91-71 nt, 또는 81-71 nt이다. 일부 특정 실시형태에서, arRNA의 길이는 이 항목에 의해 정의된 길이 범위 내의 임의의 하나의 양의 정수이다.

일부 실시형태에서, arRNA의 표적으로 하는 염기에서 3'-말단 및 5'-말단까지의 길이는 동일하다. 일부 실시형태에서, 3'-말단 및 5'-말단으로부터의 arRNA의 표적으로 하는 염기의 길이는 동일하지 않다. 일부 실시형태에서, arRNA의 표적으로 하는 염기로부터 3'-말단까지의 길이는 45-5 nt, 40-5 nt, 35-10 nt, 25 nt-15 nt, 또는 24 nt-11 nt이다. 일부 특정 실시형태에서, 길이는 이 항목에 의해 정의된 길이 범위 내의 임의의 하나의 양의 정수로부터 선택된다.

일부 실시형태에서, arRNA의 표적으로 하는 염기에서 5' 말단까지의 길이는 80-30 nt, 70-35 nt, 60-40 nt, 55 nt-35 nt 또는 55 nt-45 nt이다. 일부 특정 실시형태에서, 길이는 이 항목에 의해 정의된 길이 범위 내의 임의의 하나의 양의 정수로부터 선택된다. 일부 실시형태에서, arRNA의 표적으로 하는 염기로부터 5'-말단까지의 길이는 80보다 크다.

일부 실시형태에서, arRNA는 올리고뉴클레오티드이거나 올리고뉴클레오티드에 포함되어 있다. 일부 실시형태에서, 올리고뉴클레오티드는 화학적으로 변형된다. 일부 실시형태에서, 화학적 변형은 2'-O-메틸 변형 또는 뉴클레오티드 간 3'-티오 변형을 포함한다. 일부 실시형태에서, 화학적 변형은 이하 중 하나 이상에서 선택된다:

서열의 모든 U는 2'-OMe에 의해 변형된다,

처음 5개 및 마지막 5개 뉴클레오티드는 각각 2'-OMe에 의해 변형된다, 그리고

일부 실시형태에서, arRNA는 구축물에 의해 인코딩되고 전사에 의해 생성된다. 일부 실시형태에서, 구축물은 선형 핵산 사슬, 바이러스 벡터 또는 플라스미드에서 선택된다.

효소 단백질과 관련된 RNA 편집 및 그 용도

본 출원은 변형된 아데노신 데아미나아제 단백질을 제공하고, 여기서, 상기 아데노신 데아미나아제 단백질은 ADAR2이고, 그것은 Genebank 수탁 번호 NP_001103.1의 ADAR2에 상응하는 이하의 아미노산 돌연변이: E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T, 또는 NP_001103.1의 상동 ADAR2 단백질의 상응하는 위치에서의 아미노산 돌연변이를 포함하고, 상기 ADAR2 단백질은 돌연변이에 의해 변형된 후 시티딘 탈아미노화를 촉매하는 활성을 갖는다.

본 출원은 우리딘으로서 시티딘의 탈아미노화를 촉매하기 위한 변형된 아데노신 데아미나아제 단백질의 용도가 추가로 제공된다. 일부 실시형태에서, 우리딘으로의 시티딘의 탈아미노화를 촉매하는 용도는 세포 내에서 일어난다. 일부 실시형태에서, 우리딘으로의 시티딘의 탈아미노화를 촉매하는 용도는 세포 외에서 일어난다.

질병 치료 방법

본 출원은 T에서 C로의 돌연변이를 포함하는 전사 형성된 메신저 RNA에서 표적 염기 C를 탈아미노화하여 돌연변이를 교정하기 위해 RNA를 편집하는 상기 방법을 사용하는 것을 포함하는, T에서 C로의 돌연변이에 의해 야기되는 질병을 치료하는 방법을 제공한다.

일부 실시형태에서, T에서 C로의 돌연변이에 의해 야기된 질병을 치료하는 방법은 상기 조작된 조성물 또는 시스템을 대상체에 주사하는 것을 포함한다. 일부 실시형태에서, 치료는 하기 1) 및 2)를 대상체에 주사하는 것을 포함할 수 있다.

2) 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 표적 RNA로 모집하는 arRNA, 또는 arRNA 또는 arRNA에 대한 코딩 서열을 포함하는 구축물이고, 여기서, 상기 아데노신 데아미나아제 단백질은 상기 RNA 편집 관련 효소 단백질이다.

일부 실시형태에서, 주사는 정맥 주사, 동맥 주사, 근육 주사, 피하 주사 또는 종양 내 주사이다.

일부 실시형태에서, T에서 C로의 돌연변이에 의해 야기된 질병은 유전적 질병 및 암을 포함한다.

키트 및 준비

본 출원은 키트를 추가로 제공하고, 이는 시티딘의 우리딘으로의 탈아미노화를 촉매하기 위해 사용된다. 일부 실시형태에서, 키트는 상기 조작된 조성물 또는 시스템을 포함한다. 일부 실시형태에서, 키트는 조작된 조성물 시스템에서 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 인코딩하거나 또는 발현하고 및/또는 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 표적 RNA의 arRNA로 모집하는 구축물을 포함한다.

본 출원에서 제공하는 CUSPER 기술을 사용하여 RNA의 표적화 편집을 위한 방법은 다음과 같은 이점이 있다.

한편으로는, 신기술은 편집 단백질(ADAR 등)을 모집하는 경우, RESCUE 기술과 달리 Cas13b 모집 프레임워크를 포함하는 가이드 RNA를 설계해야 하며, 박테리아 유래 Cas13b의 과발현을 요구하지 않고, 외인성 발현된 단백질의 길이를 감소시켜 바이러스 벡터에 의한 로딩 및 인체로의 전달을 용이하고 다양하게 함과 동시에, 또한 외인성으로 발현된 뉴클레아제의 중화로 인한 유전자 편집 실패의 가능성을 감소시킬 수 있으며, 이것은 RESCUE 기술에 비해 의료 분야에 적용할 때 상당한 이점이 된다.

다른 한편으로는, 새로운 시스템은 LEAPER 기술과 다르고, LEAPER 기술은 A에서 I까지 RNA 편집 적용 범위의 편집만을 행하지만, 새로운 시스템은 편집을 C에서 U로 확장하여 게놈 상의 T에서 C로의 돌연변이를 나타내는 많은 유전 질환 및 C에서 T/U로의 변환을 필요로 하는 다른 적용은 본 발명의 기술로 치료할 수 있다.

따라서, 본 출원의 기술은 종래 기술에 비해 적용 범위가 더 넓고 더 안전하며 효과적이다.

이상, 본 발명의 바람직한 실시형태를 상세히 설명하였지만, 본 발명이 이에 한정되는 것은 아니다. 본 발명의 기술적 개념의 범위 내에서, 다양한 기술적 특징을 임의의 다른 적절한 방식으로 결합하는 것을 포함하여 본 발명의 기술적 솔루션에 대해 다수의 단순한 변형이 이루어질 수 있다. 이러한 단순한 변형 및 조합도 본 발명에 개시된 내용으로 간주되어야 하며, 모두 본 발명의 보호 범위에 포함된다.

이하, 특정 실시형태를 참조로 본 발명의 기술적 솔루션을 더욱 상세히 기재하지만, 본 발명이 이하의 실시예에 한정되는 것은 아니다. 달리 명시되지 않는 한, 이하에 언급된 시약은 모두 시판되고 있다. 간결함을 위해, 일부 작업은 작업 매개변수, 단계 및 사용된 도구를 상세히 설명하지 않으며, 이들은 당업자에게 공지이고 당업자에 의해 재현될 수 있음을 이해해야 한다.

실시예

실시예 1 : 변형된 ADAR2 및 BFP 리포터 시스템의 분자 구축

1. 돌연변이 ADAR2-r16-293T의 구축

참고문헌 1에 보고된 RESCUE 기술을 참조하여 RNA 아데노신 데아미나아제 2(ADAR2)의 촉매 도메인을 돌연변이시켰으며, 돌연변이 부위는 문헌, (dADAR2(E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T) r16, https://benchling.com/s/seq-19Ytwwh0i0vSIbyXYZ95)에서의 r16과 동일하고, 여기서, 돌연변이 변형의 아미노산 넘버링은 NP_001103.1의 아미노산 넘버링과 일치한다. 상기 돌연변이를 포함하는 ADAR2 코딩 서열 단편은 현장에서 통상적인 DNA 합성 기술을 이용하여 시험관 내에서 합성되고, 제한 효소 결찰에 의해 pLenti-ADAR2-r16 플라스미드 벡터(pLenti- ADAR2 플라스미드 백본은 Wei Wensheng 교수의 연구실에 의해 기증됨)의 AscI 제한 부위와 ADAR2 XmaI 제한 부위 사이에 삽입된다. 상기 단계에 의해 구축된 플라스미드를 pLenti-ADAR2-r16으로 명명하고, 상기 돌연변이를 포함하는 그 ADAR2 유전자를 ADAR2-r16으로 명명한다. ADAR2-r16의 전장 cDNA 서열은 SEQ ID NO 1이다. 2세대 렌티바이러스 패키징 시스템(pCAG-VSVG는 Arthur Nienhuis & Patrick Salmon에 의해 기증됨(Addgene plasmid #35616; http://n2t.net/ addgene:35616; RRID: Addgene_35616); pCMVR8.74는 Didier Trono에 의해 기증됨(Addgene plasmid # 22036; http://n2t.net/addgene:22036; RRID:Addgene_22036)), pLenti-ADAR2-r16은 렌티바이러스로 패키징되고, 렌티바이러스가 사용되어 293T 세포를 감염시키고 48시간 후 최종 농도가 10ug/ml인 블라스티사이딘(Solarbio B9300)을 이용하여 저항 스크리닝을 수행한다. 저항 스크리닝 후 생존한 세포를 ADAR2-r16-293T라고 한다.

SEQ ID NO 1:

ATGGATATAGAAGATGAAGAAAACATGAGTTCCAGCAGCACTGATGTGAAGGAAAACCGCAATCTGGACAACGTGTCCCCCAAGGATGGCAGCACACCTGGGCCTGGCGAGGGCTCTCAGCTCTCCAATGGGGGTGGTGGTGGCCCCGGCAGAAAGCGGCCCCTGGAGGAGGGCAGCAATGGCCACTCCAAGTACCGCCTGAAGAAAAGGAGGAAAACACCAGGGCCCGTCCTCCCCAAGAACGCCCTGATGCAGCTGAATGAGATCAAGCCTGGTTTGCAGTACACACTCCTGTCCCAGACTGGGCCCGTGCACGCGCCTTTGTTTGTCATGTCTGTGGAGGTGAATGGCCAGGTTTTTGAGGGCTCTGGTCCCACAAAGAAAAAGGCAAAACTCCATGCTGCTGAGAAGGCCTTGAGGTCTTTCGTTCAGTTTCCTAATGCCTCTGAGGCCCACCTGGCCATGGGGAGGACCCTGTCTGTCAACACGGACTTCACATCTGACCAGGCCGACTTCCCTGACACGCTCTTCAATGGTTTTGAAACTCCTGACAAGGCGGAGCCTCCCTTTTACGTGGGCTCCAATGGGGATGACTCCTTCAGTTCCAGCGGGGACCTCAGCTTGTCTGCTTCCCCGGTGCCTGCCAGCCTAGCCCAGCCTCCTCTCCCTGCCTTACCACCATTCCCACCCCCGAGTGGGAAGAATCCCGTGATGATCTTGAACGAACTGCGCCCAGGACTCAAGTATGACTTCCTCTCCGAGAGCGGGGAGAGCCATGCCAAGAGCTTCGTCATGTCTGTGGTCGTGGATGGTCAGTTCTTTGAAGGCTCGGGGAGAAACAAGAAGCTTGCCAAGGCCCGGGCTGCGCAGTCTGCCCTGGCCGCCATTTTTAACTTGCACTTGGATCAGACGCCATCTCGCCAGCCTATTCCCAGTGAGGGTCTTCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGATCTAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGCCCGATTACAAGGATGACGACGATAAGTAG

2. BFP 리포터 시스템의 구축

BFP 리포터 시스템은 참조 문헌 7을 참조로 구축되고, 전체 BFP(청색 형광 단백질) cDNA 서열은 시험관 내에서 합성되고, 특정 서열은 SEQ ID NO 2이다. BFP cDNA 서열은 CMV 프로모터 뒤의 다중 클로닝 부위에 의해 pCDH-CMV 플라스미드 벡터로 클로닝된다(pCDH-CMV 플라스미드 백본은 Kazuhiro Oka에 의해 기증됨, Addgene plasmid # 72265; http://n2t.net/addgene: 72265, RRID: Addgene_72265). 리포터 시스템에서 편집되는 표적 염기는 BFP 서열의 199번째 위치의 염기 C이고, 66번째 위치의 히스티딘에 상응하며, 도 1을 참조한다.

SEQ ID NO 2:

ATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCTGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGAC CCA CGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGCGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTGA

서열의 198번째, 199번째 및 200번째 위치의 염기는 연속적으로 CCA이고 BFP-CCA로 명명되고 C^*로 약칭된다. 199번째 위치의 염기 C를 RNA 수준에서 탈아미노화에 의해 U로 편집한 후, BFP 형광 단백질은 원래의 청색 형광에서 녹색 형광으로 변할 수 있으며, 이에 따라 플로우 사이토메트리 플루오레세인 이소티오시아네이트(FITC) 채널로 시그널을 검출할 수 있다. 198번째 위치의 뉴클레오티드는 C에서 A, T 및 G로 돌연변이되기 때문에, 상응하는 코돈(196번째, 197번째 및 198번째 위치의 염기) ACC, ACA, ACT 및 ACG는 모두 트레오닌을 인코딩하므로, 이 부위에서의 돌연변이는 동일 돌연변이이다. 이것은 mRNA 상의 표적 염기의 5' 상류 인접 염기가 다른 경우, 리포터 시스템을 C에서 U로의 편집 효율을 동시에 측정하고 비교하도록 한다. 이를 바탕으로 부위 특이적 돌연변이유도 키트(Q5® Site-Directed Mutagenesis Kit, NEB E0554S)를 이용하여 198번째 위치의 염기에 돌연변이를 도입하여 198번째, 199번째, 200번째 위치의 염기는 각각, BFP-GCA로 명명되고, G*로 약칭되는 GCA; BFP-ACA로 명명되고 A*로 약칭되는 ACA; 및 BFP-UCA로 명명되고 U*로 약칭되는 TCA이다.

실시예 2: CUSPER 시스템의 예비 테스트

1. arRNA의 설계 및 합성

본 실시예에 사용된 arRNA는 표적 mRNA에 상보적인 안티센스 RNA를 포함하고, 표적 염기는 arRNA의 중간 위치에 위치되며, 5' 상류 및 3' 하류가 동일한 길이로 양측으로 연장된다. 합성 길이의 제한으로 인해, 본 실시예에서는 길이가 91nt인 RNA가 시험관 내 합성을 위해 선택된다. 도 3에 나타낸 바와 같이, arRNA의 46번 위치의 뉴클레오티드가 각각 A, U, G 및 C인 경우, A^, U^, G^ 및 C^로서 각각 약칭된다. 합성된 4개의 arRNA의 특정 서열은 하기 표 1에 나타낸다. 도 2에 나타낸 바와 같이, LEAPER 기술 설계 방법과 달리, 실험의 목적이 표적 염기가 arRNA 상의 표적으로 하는 염기와 일치하는 경우의 편집 효율을 측정하는 것이기 때문에, 이 실험의 배치에서의 4개의 arRNA의 설계는 실험을 위해 상이한 표적으로 하는 염기를 사용하고, 즉, 46번째 위치에 A, U, G 및 C가 있는 arRNA가 테스트된다. arRNA의 47번째 위치에 5' 최인접 염기(리포터 시스템의 198번째 위치에 상응)는 돌연변이 도입 전, BFP 서열의 표적 3중항 염기(즉, CCA)에 따라 설계되고, 즉, arRNA의 표적으로 하는 염기의 5' 최인접 염기(47번째 위치)는 A에 상보하는 U이다. 이것은 후속 테스트의 리포터 시스템이 BFP-CCA인 경우에만, 즉, arRNA가 표적 RNA에 혼성화되는 경우, 표적 염기에만 불일치가 있고; 리포터 시스템이 BFP-GCA, BFP-TCA, BFP-ACA인 경우, arRNA의 설계는 표적 염기에서 불일치가 있을 뿐만 아니라, arRNA 표적 염기의 3' 인접 염기에도 불일치를 갖는 경우, RNA의 설계가 LEAPER 기술과 일치함을 의미한다.

arRNA 명칭	arRNA 서열
A^	SEQ ID NO 3: gcugcuucauguggucgggguagcggcugaagcacugcacgccguAggucaggguggucacgagggugggccagggcacgggcagcuugcc
U^	SEQ ID NO 4: gcugcuucauguggucgggguagcggcugaagcacugcacgccguUggucaggguggucacgagggugggccagggcacgggcagcuugcc
C^	SEQ ID NO 5: gcugcuucauguggucgggguagcggcugaagcacugcacgccguCggucaggguggucacgagggugggccagggcacgggcagcuugcc
G^	SEQ ID NO 6: gcugcuucauguggucgggguagcggcugaagcacugcacgccguGggucaggguggucacgagggugggccagggcacgggcagcuugcc

주: 대문자는 서열 간의 차이점을 강조하는데만 사용되며, 기본적으로 동일한 문자의 다른 대문자와 소문자는 차이를 나타내지 않는다.

2. C에서 A로의 편집 테스트

ADAR2-r16-293T를 300,000 셀/웰의 밀도로 6-웰 플레이트에 플레이팅하고, 플레이팅 24시간 후, 리포펙타민 3000(Invitrogen L3000015)으로 형질감염시키고 지시에 따라 형질감염 단계를 수행한다. 지시에 따라서, 상이한 농도의 리포펙타민 3000 형질감염 시약을 사용하여 반복 실험을 2회 행한다. 반복 1: 3.75μl의 리포펙타민 3000을 웰당 사용하고, 반복 2: 7.5μl의 리포펙타민 3000을 웰당 사용한다. 2.5μg의 BFP 리포터 플라스미드(BFP-GCA, G^*로 약칭; BFP-ACA, A^*로 약칭; BFP-TCA, T^*로 약칭; BFP-CCA, C^*로 약칭) 및 25pmol의 화학적으로 합성된 arRNA가 웰당 가해진다. FITC 채널 시그널 강도는 형질감염 48시간 후에 형광 활성화 세포 분류기(FACS)에 의해 검출된다. 양성 세포의 평균 형광 강도(Mean Fluorescent Intensity, MFI)의 통계적 결과를 도 3에 나타낸다.

도 3에 있어서, mRNA 로우는 해당하는 웰에 가해진 BFP 리포터 시스템 플라스미드를 나타내고, arRNA 로우는 해당하는 웰에 가해진 arRNA를 나타낸다. BFP 리포터 시스템에 있어서, 198번째, 199번째 및 200번째 위치의 3개의 염기는 원래 서열에서 CCA이고, 198번째 위치의 C는 A, T 또는 G로 변경되는 경우, 65번째 위치의 상응하는 아미노산은 모두 트레오닌이고, 따라서 4개의 상이한 리포터 시스템 BFP-GCA, BFP-CCA, BFP-ACA 및 BFP-TCA의 198번째 위치 변경은 원래 단백질 기능의 변경을 야기하지 않을 수 있다. 199번째 위치의 C를 U로 편집하는 경우, 199번째, 200번째, 201번째 위치의 염기에 의해 형성된 코돈은 CAC에서 UAC로 변경되고, 66번째 위치의 상응하는 아미노산은 히스티딘(His, H)을 티로신(Tyr, Y)으로 변경함으로써 BFP에서 GFP로의 형광 전이가 달성된다. 도 3에 나타낸 바와 같이, arRNA가 추가되지 않는 경우, 리포터 시스템의 백그라운드 GFP 시그널 MFI는 약 5×10⁴(mRNA 로우가 U^*로 표시되고, arRNA 로우가 /로 표시되는 리포터 시스템; 및 mRNA 로우가 A^*로 표시되고, arRNA 로우가 /로 표시되는 리포터 시스템). 그러나, 199번째 위치의 C가 DNA 수준에서 포인트 돌연변이에 의해 T로 돌연변이되는 경우, GFP 시그널 MFI는 약 2.4×10⁶~3.1×10⁶이고, 백그라운드 값보다 약 100배 더 높다. 따라서, 199번째 위치의 C가 RNA 수준에서 모두 U로 변경되면, GFP MFI가 약 100배 증가할 수 있다.

DNA 수준에서 199번째 위치의 C가 변하지 않은 채로 유지된다는 것을 기준으로 도 3에 나타낸 바와 같이, arRNA가 첨가되는 경우, GFP의 MFI는 최대 5×10⁵ 이상으로 증가할 수 있으며, 형광 강도가 DNA 수준에서 199번째 위치의 C가 T로 변경된 후 형광 강도의 20%를 초과한다. 본 출원의 기술은 DNA 서열의 변경없이 전사 수준에서 199번째 위치의 C를 U로 변환함으로써 최종 단백질 기능을 변화시킬 수 있음을 시사한다.

LEAPER 기술 문헌(Qu et al., 2019, 원본 도면 2f, 본 출원의 도 4에 해당)에서, 표적 염기의 3' 인접 염기(N² 위치로 표시됨)가 A인 경우, 표적 염기의 5' 인접 염기에 대한 LEAPER 기술의 선호도(5' 상류 염기가 A, U, G 또는 C인 경우, 동일한 arRNA에 의해 얻어진 편집 효율을 참조)(N1 위치에 표시됨)는, U>C≒A>G이다. RESCUE 기술 문헌(Abudayyeh et al., 2019, 원본 도면 1c, 본 출원에서는 도 5에 해당)에서 표적 염기의 3' 인접 염기가 A인 경우, 표적 염기의 5' 인접 염기에 대한 RESCUE 기술의 선호도는, U≒A>>C≒G이다. 본 출원의 CUSPER 기술에서, 표적 염기의 3' 인접 염기가 A인 경우, 표적 염기의 5' 상류 염기에 대한 선호도가 LEAPER 기술 및 RESCUE 기술 모두와 상이하다는 것을 예기치 않게 발견하였다. 도 3에 나타낸 바와 같이, 고정된 arRNA가 편집 효율이 더 높은 U^ 또는 C^인 경우, 5' 상류 염기에 대한 본 출원의 기술의 선호도는 G>C>>U≒A임을 알 수 있다.

3. CUSPER의 염기 선호도의 추가 결정

CUSPER의 편집 능력과 그 염기 선호도를 추가로 결정하기 위해, 도 6에 나타낸 바와 같이, 실시예 2의 제 2 부분을 더 반복한다. 실시예 2의 제 2 부분과 비교하면, 이 부분은 실시예 2의 제 2 부분에 관여하지 않은 두 개의 리포터 시스템 플라스미드, BFP-GCA 및 BFP-CCA의 경우, arRNA를 추가하지 않고 대조 실험을 보완한다. 또한, 도 3의 관련 테스트에서 MFI가 백그라운드 값을 2배 이상 초과하는 조건이 반복된다. 동시에, 실험에서 반복 1 및 반복 2는 다른 배치에서 생성된 두 개의 ADAR2-r16-293T 균주에 상응한다.

도 6에 나타낸 바와 같이, 반복 실험에서 표적 염기의 5' 인접 염기에 대한 시스템의 선호도는 도 3에 나타낸 실시예 2의 제 2 부분의 관련 테스트와 유사한 패턴을 나타내고, 5' 인접 염기가 G 또는 C이고, G가 C보다 크면, 편집 효율이 더욱 양호하다.

상기 결과는 본 출원의 기술이 DNA 서열의 변경없이 전사 수준에서 최종 단백질 기능에 영향을 미칠 수 있음을 보여준다. 동시에 표적 염기의 5' 인접 염기에 대한 이 기술의 선호도는 LERPER 및 RESCUE 기술과 상이할 수 있으며, 이를 표 2에 상세하게 나타낸다. 본 연구에서 BFP-GCA, BFP-TCA 및 BFP-ACA의 테스트에서 arRNA의 설계는 표적 염기에서 불일치를 가질 뿐만 아니라, arRNA(도 2에 도시된 바와 같음)의 3' 하류에서 또 다른 불일치를 가진다는 점에 주목할 필요가 있다. 따라서 이러한 위치에 불일치가 없으면, 5' 상류 염기에 대한 기술 선호도에 있어서, 유사한 패턴이 있는지의 여부를 추가로 테스트할 필요가 있다.

3개 RNA 편집 기술의 표적 염기의 인접 염기의 선호도 비교

기술 명칭	불일치 개수	표적 염기의 3'인접 염기가 A인 경우, 5' 인접 염기에 대한 선호도
CUSPER 기술	CCA에서 1개 불일치 그 밖에서 2개 불일치	G>C>>A≒U
LEAPER ⁴	1개 불일치	U>C≒A > G
RESCUE ¹	1개 불일치	U≒A >> C≒G

실시예 3 : 3' 및 5' 인접 염기 모두의 불일치가 없는 CUSPER 편집 시스템의 테스트

녹색 형광 단백질(GFP) 시그널을 판독함으로써, 상이한 arRNA의 편집 효율을 빠르고 대략적으로 판단할 수 있지만, 편집 효율을 추가로 확인해야 할 경우, 최종적으로 mRNA에서의 C의 어느 정도의 비율이 U로 편집되는지 확인하기 위해 차세대 시퀀싱(NGS: Next Generation Sequencing)이 필요하다. 동시에 RNA 단일 염기 편집 시스템에서, A에서 I(Qu et al., 2019)인지, 또는 C에서 U(Abudayyeh et al., 2019)인지의 여부는, 그 표적 염기 A 또는 C의 5' 인접 염기 및 3' 인접 염기가 그 편집 효율에 더 큰 영향을 미친다. BFP에서 GFP로의 리포터 시스템의 한계로 인해, BFP의 DNA 서열(SEQ ID NO 2)에서 199번째 위치의 C를 표적 염기로 사용하는 경우, 5' 인접 염기(198번째 위치) C가 A, T 및 G로 변경되면, 65번째 위치의 해당하는 아미노산은 영향을 받지 않지만, 3' 인접 염기(200번째 위치) A가 T, C 또는 G로 변경되면, GFP 시그널을 완전히 상실하게 된다. 따라서, 리포터 시스템으로 GFP 시그널을 판독하는 테스트는, 3' 인접 염기를 T, C 및 G로 하는 시스템을 테스트하지 않을 수 있다. 그러나 NGS를 사용하는 경우, 편집된 mRNA의 A, U, C 및 G에서 U의 백분율이 바로 판독될 수 있으므로 4개의 상이한 5' 인접 염기와 4개의 상이한 3' 인접 염기의 순열 및 조합의 총 16개 경우에서의 편집 효율을 비교하기에 더욱 편리하다.

실시예 1.2의 단계를 참조하면, BFP의 DNA 서열(서열번호 2)의 198번째, 199번째 및 200번째 위치의 상이한 DNA 서열에 따라, 16개의 상이한 리포터 시스템, 즉 ACA, ACT(상응하는 mRNA: ACU), ACC, ACG, TCA(상응하는 mRNA: UCA), TCT(상응하는 mRNA: UCU), TCC(해당하는 mRNA: UCC), TCG(상응하는 mRNA: UCG), CCA, CCT(상응하는 mRNA: CCU), CCC, CCG, GCA, GCT(mRNA에 상응: GCU), GCC, GCG가 구축된다. 또한, 실시예 1.1의 렌티바이러스 패키징 및 감염 단계를 참조하면, 293T가 감염되어 293T 세포에 안정적으로 통합된다.

상기 16개의 상이한 리포터 시스템에 상응하여, mRNA 표적 염기 C가 arRNA 표적으로 하는 염기 U에 상응한다는 것을 기초로, arRNA 표적으로 하는 염기의 3' 및 5' 최인접 염기는 Watson-Crick 염기쌍 원리에 따라 표적 RNA에서의 표적 염기의 5' 및 3' 인접 염기와 상보적으로 쌍을 이룰 수 있다. 합성된 arRNA 서열을 표 3에 나타내었으며, mRNA 내의 표적과 그것의 5' 및 3' 인접 염기와, arRNA 표적으로 하는 염기와 5' 및 3' 최인접 염기의 상응 관계를 도 7에 나타낸다.

이하 단계에 따라, 상응하는 arRNA를 16개의 상이한 리포터 시스템 세포에 형질감염시키고, RNA 추출 및 NGS가 행해진다.

1. 10% 소태아 혈청(FBS)(Vistech SE100-011)을 포함하는 둘베코 변형 독수리 배지(DMEM)(Hyclone SH30243.01)를 세포 배양에 사용한다. 리포터 시스템 세포는 15,000개 세포/웰로 12웰 플레이트로 이송된다. 이 시간은 0시간으로 기록된다.

2. 세포 계대 24시간 후, 12.5pmol의 arRNA를 RNAi MAX(Invitrogen, 13778150) 시약을 사용하여 각 웰로 이송한다. 형질감염 단계는 공급자의 지침을 참조한다.

3. 세포 계대 72시간 후, 세포 전체 웰이 트립신(Invitrogen 25300054)으로 분해되고, 800㎕ TRIzol(Invitrogen, 15596018)로 샘플이 수집되고, Direct-zol RNA Miniprep Kit(Zymo Resaerch, R2052)를 이용하여 RNA가 추출된다. 각 샘플에서 추출된 총 RNA 1000ng을 취하고, TransScript® One-Step gDNA Removal and cDNA Synthesis SuperMix Kit(TransGen, AT311)를 사용하여 cDNA 합성을 위한 역전사를 행한다. 1㎕의 역전사 생성물을 취하고, 서열이 ggagtgagtacggtgtgcCTACGGCAAGCTGACCCTGAAGTT(서열번호: 7) 및 gagttggatgctggatggGTAGTTGCCGTCGTCCTTGAAGAAG(서열번호: 8)인 2개의 프라이머 및 Q5 hot start enzyme(NEB, M0494L)으로 폴리머라아제 연쇄 반응(PCR)을 수행한다. PCR 생성물은 Hi-TOM kit(NOVOGENE, REF PT045)로 서열 라이브러리를 구축하는데 사용되며, NGS와 데이터 분석은 하기 단계를 따라서 완성된다.

i. 일루미나 시퀀싱

구축된 시퀀싱 라이브러리는 NovaSeq6000 플랫폼에 의해 PE150 모드에서 높은 스루풋 시퀀싱에 사용된다.

ii. 시퀀싱 데이터 처리

높은 스루풋 시퀀싱으로 얻은 원시 데이터는 fastp(v0.19.6)로 품질이 제어되고, 저품질 서열, 링커가 있는 서열 및 polyG를 포함하는 서열 등을 필터링한다. 얻어진 고품질 시퀀싱 데이터를 자체 개발한 분할 스크립트로 해당하는 바코드 서열에 따라 각각의 샘플로 분할하고, BWA(v0.7.17-r1188) 소프트웨어를 사용하여 증폭된 표적 면적 서열과 비교하고, SAMtools( v1.9)에 의해, 형식이 변환되어 BAM 파일, 카운트 비교 정보 및 재정렬이 생성되어 인덱스를 구축한다.

iii. 편집 효율성 분석

JACUSA(v1.3.0) 소프트웨어는 모든 mRNA 표적 염기를 검출하는데 사용되며 사용된 매개변수는 call-1 -a B,R,D,I,Y,M:4 -C ACGT -c 2 -p 1 -P UNSTRANDED -R -u Dir Mult-CE이다. 대조군과 처리된 샘플 모두에서 나타나는 고주파 돌연변이를 필터링한 후, C->U 돌연변이 이외의 평균 돌연변이 주파수의 3배를 임계값으로 사용하고, 임계값 이상의 표적 염기 C에서 U로의 돌연변이 주파수의 부분은 표적 C가 U로 돌연변이되는 실제 주파수로서 사용된다.

NGS의 결과를 도 8에 나타낸다. CUSPER 시스템이 실제로 mRNA의 C에서 U로의 단일 염기 편집을 달성할 수 있다는 것은 NGS에 의해 확인될 수 있다. 실시예 2와 비교하여, 표적으로 하는 염기의 5' 및 3' 최인접 염기와 표적 RNA 사이에 불일치가 없는 경우, 편집 효율이 상대적으로 낮고, 표적으로 하는 5' 최인접 염기가 표적 RNA와 G-G 불일치를 형성하는 경우, 편집 효율이 향상될 수 있음이 확인될 수 있다. 또한, 표적으로 하는 염기의 5' 및 3' 최인접 염기는 표적 염기의 C-U 불일치를 제외하고, Wastson-Crick 원리에 따라 표적 염기의 3' 및 5' 인접 염기와 모두 쌍을 이루는 경우, mRNA 상의 표적 염기 삼중항이 ACG, ACC, UCC, UCG, CCC, CCG, UCA 또는 UCU 서열이면, 더 높은 편집 효율을 얻을 수 있다.

주: 대문자와 소문자는 차이가 없으며 대문자와 소문자는 서열 간의 차이점을 강조하기 위해서만 사용된다. 여기서, arRNA는 표적화되는 표적 염기 삼중항에 의해 명명된다.

참고문헌

1. Abudayyeh, O. O., Gootenberg, J. S., Franklin, B., Koob, J., Kellner, M. J., Ladha, A., ... & Zhang, F. (2019). A cytosine deaminase for programmable single-base RNA editing. Science, 365(6451), 382-386.

2. Cox, D. B., Gootenberg, J. S., Abudayyeh, O. O., Franklin, B., Kellner, M. J., Joung, J., & Zhang, F. (2017). RNA editing with CRISPR-Cas13. Science, 358(6366), 1019-1027.

3. Eckstein, F. (2014). Phosphorothioates, essential components of therapeutic oligonucleotides. Nucleic acid therapeutics, 24(6), 374-387.

4. Merkle, T., Merz, S., Reautschnig, P., Blaha, A., Li, Q., Vogel, P., ... & Stafforst, T. (2019). Precise RNA editing by recruiting endogenous ADARs with antisense oligonucleotides. Nature biotechnology, 37(2), 133.

5. Pollard, K. M., Cauvi, D. M., Toomey, C. B., Morris, K. V., & Kono, D. H. (2013). Interferon-γ and systemic autoimmunity. Discovery medicine, 16(87), 123.

6. Qu, L., Yi, Z., Zhu, S., Wang, C., Cao, Z., Zhou, Z., ... & Bao, Y. (2019). Programmable RNA editing by recruiting endogenous ADAR using engineered RNAs. Nature biotechnology, 37(9), 1059-1069.

7. Vu, L. T., Nguyen, T. T. K., Md Thoufic, A. A., Suzuki, H., & Tsukahara, T. (2016). Chemical RNA editing for genetic restoration: the relationship between the structure and deamination efficiency of carboxyvinyldeoxyuridine oligodeoxynucleotides. Chemical biology & drug design, 87(4), 583-593.

8. Xu, L., Wang, J., Liu, Y., Xie, L., Su, B., Mou, D., ... & Zhao, L. (2019). CRISPR-edited stem cells in a patient with HIV and acute lymphocytic leukemia. New England Journal of Medicine, 381(13), 1240-1247.

SEQUENCE LISTING <110> EdiGene Inc. <120> NEW METHOD FOR TARGETED EDITING OF RNA <130> FD00307PCT <150> PCT/CN2019/130558 <151> 2019-12-31 <160> 25 <170> PatentIn version 3.5 <210> 1 <211> 2130 <212> DNA <213> artificial sequence <220> <223> ADAR2-r16 cDNA <400> 1 atggatatag aagatgaaga aaacatgagt tccagcagca ctgatgtgaa ggaaaaccgc 60 aatctggaca acgtgtcccc caaggatggc agcacacctg ggcctggcga gggctctcag 120 ctctccaatg ggggtggtgg tggccccggc agaaagcggc ccctggagga gggcagcaat 180 ggccactcca agtaccgcct gaagaaaagg aggaaaacac cagggcccgt cctccccaag 240 aacgccctga tgcagctgaa tgagatcaag cctggtttgc agtacacact cctgtcccag 300 actgggcccg tgcacgcgcc tttgtttgtc atgtctgtgg aggtgaatgg ccaggttttt 360 gagggctctg gtcccacaaa gaaaaaggca aaactccatg ctgctgagaa ggccttgagg 420 tctttcgttc agtttcctaa tgcctctgag gcccacctgg ccatggggag gaccctgtct 480 gtcaacacgg acttcacatc tgaccaggcc gacttccctg acacgctctt caatggtttt 540 gaaactcctg acaaggcgga gcctcccttt tacgtgggct ccaatgggga tgactccttc 600 agttccagcg gggacctcag cttgtctgct tccccggtgc ctgccagcct agcccagcct 660 cctctccctg ccttaccacc attcccaccc ccgagtggga agaatcccgt gatgatcttg 720 aacgaactgc gcccaggact caagtatgac ttcctctccg agagcgggga gagccatgcc 780 aagagcttcg tcatgtctgt ggtcgtggat ggtcagttct ttgaaggctc ggggagaaac 840 aagaagcttg ccaaggcccg ggctgcgcag tctgccctgg ccgccatttt taacttgcac 900 ttggatcaga cgccatctcg ccagcctatt cccagtgagg gtcttcagct gcatttaccg 960 caggttttag ctgacgctgt ctcacgcctg gtcataggta agtttggtga cctgaccgac 1020 aacttctcct cccctcacgc tcgcagaata ggtctggctg gagtcgtcat gacaacaggc 1080 acagatgtta aagatgccaa ggtgatatgt gtttctacag gatctaaatg tattaatggt 1140 gaatacctaa gtgatcgtgg ccttgcatta aatgactgcc atgcagaaat agtatctcgg 1200 agatccttgc tcagatttct ttatacacaa cttgagcttt acttaaataa cgaggatgat 1260 caaaaaagat ccatctttca gaaatcagag cgaggggggt ttaggctgaa ggagaatata 1320 cagtttcatc tgtacatcag cacctctccc tgtggagatg ccagaatctt ctcaccacat 1380 gaggcaatcc tggaagaacc agcagataga cacccaaatc gtaaagcaag aggacagcta 1440 cggaccaaaa tagaggctgg tcaggggacg attccagtgc gcaacaatgc gagcatccaa 1500 acgtgggacg gggtgctgca aggggagcgg ctgctcacca tgtcctgcag tgacaagatt 1560 gcacgctgga acgtggtggg catccaggga tcactgctca gcattttcgt ggagcccatt 1620 tacttctcga gcatcatcct gggcagcctt taccacgggg accacctttc cagggccatg 1680 taccagcgga tctccaacat agaggacctg ccacctctct acaccctcaa caagcctttg 1740 ctcacaggca tcagcaatgc agaagcacgg cagccaggga aggcccccat attcagtgtc 1800 aactggacgg taggcgactc cgctattgag gtcatcaacg ccacgactgg gaagggagag 1860 ctgggccgcg cgtcccgcct gtgtaagcac gcgttgtact gtcgctggat gcgtgtgcac 1920 ggcaaggttc cctcccactt actacgctcc aagattacca agcccaacgt gtaccatgag 1980 acaaagctgg cggcaaagga gtaccaggcc gccaaggcgc gtctgttcac agccttcatc 2040 aaggcggggc tgggggcctg ggtggagaag cccaccgagc aggaccagtt ctcactcacg 2100 cccgattaca aggatgacga cgataagtag 2130 <210> 2 <211> 720 <212> DNA <213> artificial sequence <220> <223> BFP cDNA <400> 2 atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60 ggcgacgtaa acggccacaa gttcagcgtg tctggcgagg gcgagggcga tgccacctac 120 ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180 ctcgtgacca ccctgaccca cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240 cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300 ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360 gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420 aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480 ggcatcaagg cgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540 gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600 tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660 ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtga 720 <210> 3 <211> 91 <212> RNA <213> artificial sequence <220> <223> arRNA <400> 3 gcugcuucau guggucgggg uagcggcuga agcacugcac gccguagguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 4 <211> 91 <212> RNA <213> artificial sequence <220> <223> arRNA <400> 4 gcugcuucau guggucgggg uagcggcuga agcacugcac gccguugguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 5 <211> 91 <212> RNA <213> artificial sequence <220> <223> arRNA <400> 5 gcugcuucau guggucgggg uagcggcuga agcacugcac gccgucgguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 6 <211> 91 <212> RNA <213> artificial sequence <220> <223> arRNA <400> 6 gcugcuucau guggucgggg uagcggcuga agcacugcac gccguggguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 7 <211> 42 <212> DNA <213> artificial sequence <220> <223> primer <400> 7 ggagtgagta cggtgtgcct acggcaagct gaccctgaag tt 42 <210> 8 <211> 43 <212> DNA <213> artificial sequence <220> <223> primer <400> 8 gagttggatg ctggatgggt agttgccgtc gtccttgaag aag 43 <210> 9 <211> 91 <212> RNA <213> artificial sequence <220> <223> arRNA <400> 9 gcugcuucau guggucgggg uagcggcuga agcacugcac gccguucguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 10 <211> 91 <212> RNA <213> artificial sequence <220> <223> arRNA <400> 10 gcugcuucau guggucgggg uagcggcuga agcacugcac gccgaucguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 11 <211> 91 <212> RNA <213> artificial sequence <220> <223> arRNA <400> 11 gcugcuucau guggucgggg uagcggcuga agcacugcac gccggucguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 12 <211> 91 <212> RNA <213> artificial sequence <220> <223> arRNA <400> 12 gcugcuucau guggucgggg uagcggcuga agcacugcac gccgcucguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 13 <211> 91 <212> RNA <213> artificial sequence <220> <223> arRNA <400> 13 gcugcuucau guggucgggg uagcggcuga agcacugcac gccguugguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 14 <211> 91 <212> RNA <213> artificial sequence <220> <223> arRNA <400> 14 gcugcuucau guggucgggg uagcggcuga agcacugcac gccgaugguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 15 <211> 91 <212> RNA <213> artificial sequence <220> <223> arRNA <400> 15 gcugcuucau guggucgggg uagcggcuga agcacugcac gccggugguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 16 <211> 91 <212> RNA <213> artificial sequence <220> <223> arRNA <400> 16 gcugcuucau guggucgggg uagcggcuga agcacugcac gccgcugguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 17 <211> 91 <212> RNA <213> artificial sequence <220> <223> arRNA <400> 17 gcugcuucau guggucgggg uagcggcuga agcacugcac gccguuaguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 18 <211> 91 <212> RNA <213> artificial sequence <220> <223> arRNA <400> 18 gcugcuucau guggucgggg uagcggcuga agcacugcac gccgauaguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 19 <211> 91 <212> RNA <213> artificial sequence <220> <223> arRNA <400> 19 gcugcuucau guggucgggg uagcggcuga agcacugcac gccgguaguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 20 <211> 91 <212> RNA <213> artificial sequence <220> <223> arRNA <400> 20 gcugcuucau guggucgggg uagcggcuga agcacugcac gccgcuaguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 21 <211> 91 <212> RNA <213> artificial sequence <220> <223> arRNA <400> 21 gcugcuucau guggucgggg uagcggcuga agcacugcac gccguuuguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 22 <211> 91 <212> RNA <213> artificial sequence <220> <223> arRNA <400> 22 gcugcuucau guggucgggg uagcggcuga agcacugcac gccgauuguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 23 <211> 91 <212> RNA <213> artificial sequence <220> <223> arRNA <400> 23 gcugcuucau guggucgggg uagcggcuga agcacugcac gccgguuguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 24 <211> 91 <212> RNA <213> artificial sequence <220> <223> arRNA <400> 24 gcugcuucau guggucgggg uagcggcuga agcacugcac gccgcuuguc agggugguca 60 cgaggguggg ccagggcacg ggcagcuugc c 91 <210> 25 <211> 91 <212> RNA <213> artificial sequence <220> <223> arRNA <400> 25 uaauccugaa uaucgcgcaa uuccccagca gagaacaucg cggugugaac gucccuuuau 60 accgggcagg uauagcugaa aucagcgugg c 91

Claims

1) 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인, 또는 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 발현하는 구축물, 및
2) 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 표적 RNA로 모집하는 ADAR-모집 RNA(arRNA), 또는 arRNA 또는 arRNA에 대한 코딩 서열을 포함하는 구축물을 포함하는 리보핵산(RNA) 편집을 위한 조작된 조성물 또는 시스템으로서:
상기 아데노신 데아미나아제 단백질 또는 그 촉매 도메인은 변형된 후 시티딘 탈아미노화를 촉매하는 활성을 갖고,
상기 arRNA는 표적 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 arRNA는 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 표적 RNA에 모집하여 표적 RNA에서 표적 시티딘을 탈아미노화하는, 조작된 조성물 또는 시스템.

제 1 항에 있어서,
상기 아데노신 데아미나아제는 하나 이상의 부위에서 돌연변이에 의해 변형되어 결과적으로는 우리딘으로 변환되는 시티딘을 탈아미노화하는 활성을 갖는, 조작된 조성물 또는 시스템.

제 2 항에 있어서,
상기 아데노신 데아미나아제 단백질 또는 그 촉매 도메인은 ADAR2 단백질 또는 상동 단백질 또는 그 촉매 도메인인, 조작된 조성물 또는 시스템.

제 3 항에 있어서,
상기 돌연변이 변형은 E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/ I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T를 포함하고, 상기 돌연변이 변형의 아미노산 서열의 넘버링은 NP_001103.1의 아미노산의 넘버링과 일치하는, 조작된 조성물 또는 시스템.

제 1 항 내지 제 4 항 중 어느 한 항에 있어서,
상기 arRNA는 표적 RNA에 혼성화되고, 표적 시티딘과 반대되는 arRNA의 표적으로 하는 염기는 A, U, C 또는 G인, 조작된 조성물 또는 시스템.

제 5 항에 있어서,
상기 표적으로 하는 염기는 U 또는 C인, 조작된 조성물 또는 시스템.

제 1 항 내지 제 6 항 중 어느 한 항에 있어서,
상기 arRNA는 표적 RNA의 표적 염기의 상류 및/또는 하류에 상응하는 하나 이상의 위치에서 하나 이상의 불일치를 포함하는, 조작된 조성물 또는 시스템.

제 7 항에 있어서,
상기 arRNA 표적으로 하는 염기의 3' 최인접 염기는 표적 RNA와 불일치를 형성하는, 조작된 조성물 또는 시스템.

제 8 항에 있어서,
상기 arRNA는 표적 RNA에 혼성화하고, 표적으로 하는 염기의 3' 최인접 염기는 표적 RNA와 G-G 불일치를 형성하는, 조작된 조성물 또는 시스템.

제 1 항 내지 제 9 항 중 어느 한 항에 있어서,
상기 arRNA는 표적 RNA에 혼성화하고, 표적으로 하는 염기의 5' 최인접 염기는 표적 RNA와 불일치를 형성하지 않는, 조작된 조성물 또는 시스템.

제 10 항에 있어서,
상기 표적으로 하는 염기의 5' 최인접 염기는 U인, 조작된 조성물 또는 시스템.

제 9 항에 있어서,
상기 arRNA는 표적 RNA에 혼성화하고, arRNA의 표적으로 하는 염기의 5' 최인접 염기에 반대되는 표적 RNA에서 염기 선호도가 높은 것에서 낮은 것의 순서는 G 또는 C, U 또는 A인, 조작된 조성물 또는 시스템.

제 1 항 내지 제 6 항 중 어느 한 항에 있어서,
상기 arRNA는 표적 RNA에 혼성화하고, 표적 염기와 그것의 5' 및 3' 인접 염기에 의해 형성된 표적 염기 삼중항은 표적 염기에서만 불일치를 형성하고, 상기 표적 염기 삼중항은 ACG, ACC, UCC, UCG, CCC, CCG, UCA 및 UCU로부터 선택되는, 조작된 조성물 또는 시스템.

제 1 항 내지 제 13 항 중 어느 한 항에 있어서,
상기 arRNA의 길이는 >50 nt인, 조작된 조성물 또는 시스템.

제 1 항 내지 제 14 항 중 어느 한 항에 있어서,
상기 arRNA의 표적으로 하는 염기에서 3'-말단 및 5'-말단까지의 길이는 동일한, 조작된 조성물 또는 시스템.

제 1 항 내지 제 14 항 중 어느 한 항에 있어서,
상기 arRNA의 표적으로 염기에서 3'-말단까지의 길이는 45-5 nt, 40-5 nt, 35-10 nt, 25 nt-15 nt 또는 24 nt-11 nt인, 조작된 조성물 또는 시스템.

제 1 항 내지 제 14 항 중 어느 한 항에 있어서,
상기 arRNA의 표적으로 하는 염기에서 5'-말단까지의 길이는 80-30 nt, 70-35 nt, 60-40 nt, 55 nt-35 nt 또는 55 nt-45 nt인, 조작된 조성물 또는 시스템.

제 1 항 내지 제 17 항 중 어느 한 항에 있어서,
상기 arRNA는 화학적 변형되는, 조작된 조성물 또는 시스템.

제 18 항에 있어서,
상기 화학적 변형은 2'-O-메틸 변형 또는 뉴클레오티드 간 3'-티오 변형을 포함하는, 조작된 조성물 또는 시스템.

하기 1) 및 2)를 세포로 도입하는 것을 포함하는 세포에서의 표적 RNA의 표적 시토신을 탈아미노화하는 방법.
1) 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인, 또는 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 발현하는 구축물, 및
2) 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 표적 RNA로 모집하는 arRNA 또는 arRNA 또는 arRNA에 대한 코딩 서열을 포함하는 구축물로서, 상기 아데노신 데아미나아제 단백질 또는 그 촉매 도메인은, 변형된 후 시티딘 탈아미노화를 촉매하는 활성을 갖고, 상기 arRNA는 표적 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 arRNA는 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 표적 RNA에 모집함으로써 표적 RNA의 표적 시티딘을 탈아미노화하는 구축물.

제 20 항에 있어서,
상기 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 발현하는 구축물 및 arRNA에 대한 코딩 서열을 포함하는 구축물은 동일한 구축물이거나, 또는 변형된 아데노신 데아미나아제 단백질 또는 그 촉매 도메인을 발현하는 구축물 및 arRNA에 대한 코딩 서열을 포함하는 구축물은 분리된 구축물이고, 분리된 구축물은 동시에 또는 별도로 세포에 도입되는, 방법.

제 20 항 또는 제 21 항에 있어서,
상기 아데노신 데아미나아제는 하나 이상의 부위에서 돌연변이에 의해 변형되어 결과적으로 우리딘으로 변환되는 시티딘을 탈아미노화하는 활성을 갖는, 방법.

제 22 항에 있어서,
상기 아데노신 데아미나아제 단백질 또는 그 촉매 도메인은 ADAR2 단백질 또는 상동 단백질 또는 그 촉매 도메인인, 방법.

제 23 항에 있어서,
상기 돌연변이 변형은 E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/ I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T를 포함하고, 상기 돌연변이 변형의 아미노산의 넘버링은 NP_001103.1의 아미노산의 넘버링과 일치하는, 방법.

제 21 항 내지 제 24 항 중 어느 한 항에 있어서,
상기 arRNA는 표적 RNA에 혼성화하고, 표적 시티딘과 반대되는 arRNA의 표적으로 하는 염기는 A, U, C 또는 G인, 방법.

제 25 항에 있어서,
상기 표적으로 하는 염기는 U 또는 C인, 방법.

제 21 항 내지 제 26 항 중 어느 한 항에 있어서,
상기 arRNA는 표적 RNA의 표적 염기의 상류 및/또는 하류에 상응하는 하나 이상의 위치에서 하나 이상의 불일치를 포함하는, 방법.

제 27 항에 있어서,
상기 arRNA 표적으로 하는 염기의 3' 최인접 염기는 표적 RNA와 불일치를 형성하는, 방법.

제 28 항에 있어서,
상기 arRNA는 표적 RNA에 혼성화하고, 표적으로 하는 염기의 3' 최인접 염기는 표적 RNA와 G-G 불일치를 형성하는, 방법.

제 21 항 내지 제 29 항 중 어느 한 항에 있어서,
상기 arRNA는 표적 RNA에 혼성화하고, 표적으로 하는 염기의 5' 최인접 염기는 표적 RNA와 불일치를 형성하지 않는, 방법.

제 30 항에 있어서,
상기 표적으로 하는 염기의 5' 최인접 염기는 U인, 방법.

제 29 항에 있어서,
상기 arRNA는 표적 RNA에 혼성화하고, 상기 arRNA의 표적으로 하는 염기의 5' 최인접 염기에 반대되는 표적 RNA에서 염기 선호도가 높은 것에서 낮은 것의 순서는 G 또는 C, U 또는 A인, 방법.

제 21 항 내지 제 26 항 중 어느 한 항에 있어서,
상기 arRNA는 표적 RNA에 혼성화하고, 표적 염기와 그것의 5' 및 3' 인접 염기에 의해 형성된 표적 염기 삼중항은 표적 염기에서만 불일치를 형성하고, 상기 표적 염기 삼중항은 ACG, ACC, UCC, UCG, CCC, CCG, UCA 및 UCU로부터 선택되는, 방법.

제 21 항 내지 제 33 항 중 어느 한 항에 있어서,
상기 arRNA의 길이는 >50 nt인, 방법.

제 21 항 내지 제 34 항 중 어느 한 항에 있어서,
상기 arRNA의 표적으로 하는 염기에서 3'-말단 및 5'-말단까지의 길이는 동일한, 방법.

제 21 항 내지 제 34 항 중 어느 한 항에 있어서,
상기 arRNA의 표적으로 하는 염기에서 3'-말단까지의 길이는 45-5 nt, 40-5 nt, 35-10 nt, 25 nt-15 nt 또는 24 nt-11 nt인, 방법.

제 21 항 내지 제 34 항 중 어느 한 항에 있어서,
상기 arRNA의 표적으로 하는 염기에서 5'-말단까지의 길이는 80-30 nt, 70-35 nt, 60-40 nt, 55 nt-35 nt 또는 55 nt-45 nt인, 방법.

제 21 항 내지 제 37 항 중 어느 한 항에 있어서,
상기 arRNA는 화학적 변형되는, 방법.

제 38 항에 있어서,
상기 화학적 변형은 2'-O-메틸 변형 또는 뉴클레오티드 간 3'-티오 변형을 포함하는, 방법.

제 21 항 내지 제 39 항 중 어느 한 항에 있어서,
상기 세포는 포유동물 세포인, 방법.

T에서 C로의 돌연변이에 의해 유발된 질병을 치료하는 방법으로서,
제 21 항 내지 제 39 항 중 어느 한 항에 기재된 방법을 사용하여 T에서 C로의 돌연변이를 포함하는 전사 형성된 메신저 RNA에서 표적 염기 C를 탈아미노화하여 상기 돌연변이를 교정하는, 방법.

아데노신 데아미나아제 단백질이 Genebank 수탁 번호가 NP_001103.1인 ADAR2에 상응하는, E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T의 아미노산 돌연변이 또는 NP_001103.1의 상동 ADAR2 단백질의 상응하는 위치에 아미노산 돌연변이를 포함하는 ADAR2이고, 상기 ADAR2 단백질은 돌연변이에 의해 변형된 후, 시티딘 탈아미노화를 촉매하는 활성을 갖는, 변형된 아데노신 데아미나아제 단백질.

우리딘으로의 시티딘 탈아미노화를 촉매하기 위한 제 42 항에 기재된 변형된 아데노신 데아미나아제 단백질의 용도.