KR20210076082A

KR20210076082A - Rna를 편집하기 위한 방법 및 조성물

Info

Publication number: KR20210076082A
Application number: KR1020217014349A
Authority: KR
Inventors: 원성 웨이; 리앙 취; 쭝이 이; 스여우 주; 춘후이 왕; 중정 차오; 줘 저우; 펑페이 위안
Original assignee: 페킹 유니버시티; 에디진 인크.
Priority date: 2018-10-12
Filing date: 2019-10-12
Publication date: 2021-06-23
Also published as: US20210310026A1; AU2023202184A1; SG11202103666PA; ECSP21033637A; PE20211402A1; CN115651927A; CA3115864A1; AU2019357450B2; CR20210243A; CN116218836A; AU2019357450A1; PH12021550805A1; TW202028466A; EP4306116A3; IL282191A; JP2021534810A; CN113631708A; JP7252328B2; CO2021005956A2; EP3864152A4

Abstract

타겟 RNA에서의 아데노신의 탈아미노화를 위해 숙주 세포에 탈아미노효소-리크루팅 RNA를 도입함으로써 RNA를 편집하는 방법 및 RNA를 편집하는 방법에 사용되는 탈아미노효소-리크루팅 RNA, 및 이것을 포함하는 조성물을 제공한다.

Description

RNA를 편집하기 위한 방법 및 조성물

(관련 출원에 대한 상호 참조)

본 출원은 2018년 10월 12일에 출원된 국제출원번호 PCT/CN2018/110105의 국제출원 및 2019년 4월 15일에 출원된 국제출원번호 CN2019/082713의 국제출원에 대한 우선권을 주장하며, 그들 전체를 참조로 여기에 포함된다.

(ASCII 텍스트 파일의 서열 목록의 제출)

하기 ASCII 텍스트 파일에 대한 제출 내용은 그 전체가 참조로 여기에 포함된다: 서열 목록의 컴퓨터 판독 가능 형식(CRF)(파일 이름: FC00158PCT-New-sequence listing-YZG-zhc.TXT, 기록 날짜: 2019년 10월 11일, 크기: 104KB).

본 발명은 타겟 RNA에서 하나 이상의 아데노신을 탈아미노화하기 위해 아데노신 탈아미노효소를 리크루팅할 수 있는 조작된 RNA를 사용하여 RNA를 편집하기 위한 방법 및 조성물에 관한 것이다.

게놈 편집은 생의학 연구 및 질환 치료제 개발을 위한 강력한 도구이다. 지금까지, 가장 인기있는 유전자 편집 기술은 박테리아와 고세균의 적응 면역 체계로부터 개발된, CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats, 주기적으로 간격을 띠고 분포하는 짧은 회문구조 반복서열)-Cas 시스템이다. CRISPR-Cas는 게놈 DNA를 정확하게 타겟팅하고 절단하여, DSB(Double-Strand DNA Breaks)를 생성한다. DSB는 NHEJ(non-homologous end joining, 비상동 말단 연결) 경로를 통해 복구될 수 있으며, 그 결과 삽입 또는 결실(Indel)이 야기되어, 대부분의 경우에 유전자를 비활성화한다. 대안적으로, 상동성 지정 복구(HDR) 경로는 상동성 템플릿 dsDNA 또는 ssDNA를 사용하여 DSB를 복구할 수 있으므로, 정확한 게놈 편집을 달성할 수 있다.

최근에는, RNA 아데노신 탈아미노효소(ADAR: Adenosine Deaminase Acting on RNA)와 같은 탈아미노효소 단백질을 이용하는, 새로운 도구가 개발되었다. 포유류 세포에는 3가지 유형의 ADAR 단백질, Adar1(2개의 이소폼, p110 및 p150), Adar2 및 Adar3(촉매 비활성)이 있다. ADAR 단백질의 촉매 기질은 이중 가닥 RNA이며, 또한 아데노신(A) 핵염기로부터 -NH₂기를 제거함으로써, A를 후속의 세포 전사 및 번역 과정 동안 구아노신(G)으로 인식되고 시티딘(C)과 쌍이 되는 이노신(I)으로 변경될 수 있다. 연구자들은 BoxB 스템 루프와 안티센스 RNA로 이루어진 융합 RNA에 의해 특정 RNA 타겟과 결합하도록 안내될 수 있는, λN-ADARDD 시스템을 구축하도록 λN 펩티드를 인간 Adar1 또는 Adar2 탈아미노효소 도메인에 융합시켰다. 이 방법은 타겟 A 염기에서 A-C 미스매치를 도입함으로써 타겟 A에서 I로 편집함으로써, A에서 G RNA 염기로 편집할 수 있게 된다. RNA 편집을 위한 다른 방법은 포유류 세포에서 Adar1 또는 Adar2 단백질을 과발현시킴으로써 타겟 RNA를 편집하도록 안티센스 RNA를 R/G 모티프(ADAR-리크루팅 RNA 스캐폴드)에 융합시키는 단계, 및 RNA를 정확하게 타겟팅하고 편집하도록 dCas13-ADAR을 사용하는 단계를 포함한다.

본 명세서에 언급된 모든 간행물, 특허, 특허 출원 및 공개된 특허 출원의 개시는 그 전체가 본 명세서에 참고로 포함된다.

핵산 편집은 생물학적 연구와 치료제 개발에 엄청난 잠재력을 가지고 있다. 현재의 DNA 또는 RNA 편집을 위한 도구는 가능한 비정상적인 이펙터 활성, 전달 한계 및 면역원성으로 인해 잠재적 위험 또는 기술적 장벽의 영향을 받는 외인성 단백질을 살아있는 유기체에 도입하는데 의존한다. 일부 양태에서, 본 출원은 타겟팅된 RNA 편집을 위해 내인성 ADAR(Adenosine Deaminase Acting on RNA) 단백질을 활용하기 위해 짧은 RNA를 사용하는 프로그래밍 가능한 접근 방식을 제공한다. 일부 양태에서, 본 출원은 타겟 RNA의 특정 부위에서 아데노신을 이노신으로 변경하기 위해 네이티브 ADAR1 또는 ADAR2를 리크루팅하기 위해 타겟 전사물에 부분적으로 상보적인 조작된 RNA를 제공한다. 본 명세서에 기재된 방법은 총괄하여 "LEAPER"(RNA상의 프로그래밍 가능한 편집을 위한 내인성 ADAR 활용)이라고 칭해지며, ADAR-리크루팅 RNA는 "dRNA" 또는 "arRNA"로 상호교환적으로 칭해진다.

일 양태에서, 본 출원은 탈아미노효소-리크루팅 RNA(dRNA) 또는 탈아미노효소-리크루팅 RNA를 인코딩하는 구축물을 숙주 세포에 도입하는 단계를 포함하는, 숙주 세포에서 타겟 RNA를 편집하는 방법으로서, 상기 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 dRNA는 타겟 RNA에서의 타겟 아데노신(A)을 탈아미노화하도록 RNA 아데노신 탈아미노효소(ADAR)를 리크루팅할 수 있다. 소정 실시형태에서, 숙주 세포는 진핵 세포이다. 일부 실시형태에서, 숙주 세포는 포유류 세포이다. 일부 실시형태에서, 숙주 세포는 인간 세포이다. 일부 실시형태에서, 숙주 세포는 마우스 세포이다. 일부 실시형태에서, 숙주 세포는 원핵 세포이다.

소정 실시형태에서, ADAR은 숙주 세포에 자연적으로 또는 내인적으로 존재하며, 예를 들면 진핵 세포에 자연적으로 또는 내인적으로 존재한다. 일부 실시형태에서, ADAR은 숙주 세포에 의해 내인적으로 발현된다. 소정 실시형태에서, ADAR은 숙주 세포에 대해 외인적이다. 일부 실시형태에서, ADAR은 핵산(예를 들면 DNA 또는 RNA)에 의해 인코딩된다. 일부 실시형태에서, 상기 방법은 숙주 세포에 ADAR 또는 ADAR을 인코딩하는 구축물을 도입하는 단계를 포함한다. 일부 실시형태에서, 상기 방법은 숙주 세포에 임의의 단백질을 도입하는 단계를 포함하지 않는다. 소정 실시형태에서, ADAR은 ADAR1 및/또는 ADAR2이다. 일부 실시형태에서, ADAR은 hADAR1, hADAR2, 뮤린 ADAR1 및 뮤린 ADAR2로 이루어진 군에서 선택된 하나 이상의 ADAR이다.

소정 실시형태에서, dRNA는 Cas에 의해 인식되지 않는다. 일부 실시형태에서, dRNA는 CRISPR/Cas 시스템에서 사용되는 crRNA, tracrRNA 또는 gRNA를 포함하지 않는다. 일부 실시형태에서, 상기 방법은 Cas 또는 Cas 융합 단백질을 숙주 세포에 도입하는 단계를 포함하지 않는다.

소정 실시형태에서, 타겟 RNA에서의 타겟 A의 탈아미노화는 타겟 RNA에서 미스센스 돌연변이, 조기 정지 코돈, 비정상적 스플라이싱 또는 선택적 스플라이싱을 야기한다. 일부 실시형태에서, 타겟 RNA는 단백질을 인코딩하고, 타겟 RNA에서의 타겟 A의 탈아미노화는 단백질의 점 돌연변이, 절단, 연장 및/또는 잘못 접힘을 야기한다. 일부 실시형태에서, 타겟 RNA에서의 타겟 A의 탈아미노화는 타겟 RNA에서의 미스센스 돌연변이, 조기 정지 코돈, 비정상적 스플라이싱 또는 선택적 스플라이싱의 반전을 야기한다. 일부 실시형태에서, 타겟 RNA가 절단된, 연장된, 돌연변이된 또는 잘못 접힌 단백질을 인코딩하는 경우, 타겟 RNA에서의 타겟 A의 탈아미노화에 의해 타겟 RNA에서의 미스센스 돌연변이, 조기 중지 코돈, 비정상적 스플라이싱 또는 선택적 스플라이싱의 반전에 의해 기능적, 전장의, 제대로 접힌 및/또는 야생형 단백질이 된다. 일부 실시형태에서, 타겟 RNA는 조절 RNA이고, 타겟 A의 탈아미노화는 상기 타겟 RNA에 의해 조절된 하류 분자의 발현에서 변화를 야기한다. 소정 실시형태에서, 상기 방법은 타겟 RNA에 의해 인코딩된 단백질의 점 돌연변이 및/또는 잘못 접힘을 생성하도록, 타겟 RNA의 편집 및/또는 타겟 RNA에서의 조기 정지 코톤, 비정상적 스플라이스 부위 및/또는 선택적 스플라이스 부위의 생성을 위해 내인성 아데노신 탈아미노효소를 활용하기 위한 것이다.

소정 실시형태에서, 숙주 세포에서 복수의 타겟 RNA를 편집하는 방법이 제공되며, 여기서 상기 방법은 복수의 dRNA 또는 복수의 dRNA를 인코딩하는 구축물을 숙주 세포에 도입하는 단계를 포함하며, 여기서 상기 복수의 탈아미노효소-리크루팅 RNA의 각각은 복수의 타겟 RNA에서의 대응하는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하며, 여기서 각각의 dRNA는 대응하는 타겟에서 타겟 아데노신(A)을 탈아미노화하도록 RNA 아데노신 탈아미노효소(ADAR)를 리크루팅할 수 있다.

일부 실시형태에서, 상기 기재된 바와 같은 RNA 편집 방법 중 어느 하나에 의해 생성된 편집된 RNA 또는 편집된 RNA를 갖는 숙주 세포가 제공된다.

일 양태에서, 본 출원은 상술한 바와 같은 RNA 편집 방법 중 어느 하나에 따라 개체의 세포에서 질환 또는 상태와 관련된 타겟 RNA를 편집하는 단계를 포함하는, 개체의 질환 또는 상태를 치료 또는 예방하는 방법을 제공한다. 일부 실시형태에서, 상기 방법은 생체외(ex vivo) 세포에서 타겟 RNA를 편집하는 단계를 포함한다. 일부 실시형태에서, 상기 방법은 편집된 세포를 개체에 투여하는 단계를 포함한다. 일부 실시형태에서, 상기 방법은 유효량의 dRNA 또는 dRNA를 인코딩하는 구축물을 개체에 투여하는 단계를 포함한다. 일부 실시형태에서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물(예를 들면 바이러스 벡터)을 세포에 도입하는 단계를 추가로 포함한다. 일부 실시형태에서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물(예를 들면 바이러스 벡터)을 개체에 투여하는 단계를 추가로 포함한다. 일부 실시형태에서, 질환 또는 상태는 유전성 유전 질환이다. 일부 실시형태에서, 질환 또는 상태는 하나 이상의 후천적 유전적 돌연변이, 예를 들면 약물 내성과 관련된다.

본 출원의 일 양태는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하는 RNA 아데노신 탈아미노효소(ADAR)를 리크루팅함으로써 타겟 RNA에서 타겟 아데노신의 탈아미노화를 위한 dRNA를 제공한다. 일부 실시형태에서, dRNA는 서열 번호 25-44, 142-205, 341-342 중 어느 하나의 핵산 서열을 포함한다.

본 명세서에 기재된 방법 또는 dRNA 중 어느 하나에 따른 일부 실시형태에서, dRNA는 타겟 RNA에서 편집될 타겟 아데노신의 정반대측에 시티딘(C), 아데노신(A) 또는 우리딘(U)을 포함하는 RNA 서열을 포함한다. 소정 실시형태에서, RNA 서열은 타겟 RNA에서 비타겟 아데노신(들)에 각각 정반대측에 하나 이상의 구아노신을 추가로 포함한다. 소정 실시형태에서, 타겟 RNA 서열에서의 타겟 A의 5' 최근접 이웃은 U, C, A 및 G에서 선택된 뉴클레오티드이며, 선호도는 U＞C≒A>G이고, 타겟 RNA 서열에서의 3' 최근접 이웃은 G, C, A 및 U에서 선택된 뉴클레오티드이고, 선호도는 G>C＞A≒U이다. 소정 실시형태에서, 타겟 A는 타겟 RNA에서의 UAG, UAC, UAA, UAU, CAG, CAC, CAA, CAU, AAG, AAC, AAA, AAU, GAG, GAC, GAA 및 GAU로 이루어진 군에서 선택되는 3-염기 모티프이다. 소정 실시형태에서, 상기 3-염기 모티프가 UAG인 경우, dRNA는 3-염기 모티프에서 U에 정반대쪽에 A, 타겟 A에 정반대쪽에 C, 및 3-염기 모티프에서 G에 정반대쪽에 C, G 또는 U를 포함한다. 소정 실시형태에서, 타겟 RNA에서 3-염기 모티프가 UAG인 경우, dRNA는 타겟 RNA의 UAG의 반쪽에 ACC, ACG 또는 ACU를 포함한다.

본 명세서에 기재된 방법 또는 dRNA 중 어느 하나에 따른 일부 실시형태에서, 탈아미노효소-리크루팅 RNA는 40, 45, 50, 55, 60, 65, 70, 75 또는 80개의 뉴클레오티드를 포함한다. 소정 실시형태에서, 탈아미노효소-리크루팅 RNA는 길이가 40-260, 45-250, 50-240, 60-230, 65-220, 70-210, 70-200, 70-190, 70-180, 70-170, 70-160, 70-150, 70-140, 70-130, 70-120, 70-110, 70-100, 70-90, 70-80, 75-200, 80-190, 85-180, 90-170, 95-160, 100-150 또는 105-140개의 뉴클레오티드이다. 소정 실시형태에서, 타겟 RNA는 프리메신저 RNA, 메신저 RNA, 리보솜 RNA, 트랜스퍼 RNA, 긴 논코딩 RNA 및 작은 RNA(예를 들면 miRNA)로 이루어진 군에서 선택된 RNA이다.

본 명세서에 기재된 방법 또는 dRNA 중 어느 하나에 따른 일부 실시형태에서, dRNA는 단일 가닥 RNA이다. 일부 실시형태에서, 상보적 RNA 서열은 단일 가닥이고, 여기서 dRNA는 하나 이상의 이중 가닥 영역을 추가로 포함한다. 일부 실시형태에서, dRNA는 2'-O-메틸 수식 및/또는 포스포로티오에이트 수식과 같은 하나 이상의 수식을 포함한다.

일부 실시형태에서, 상기 기재된 dRNA 중 어느 하나를 인코딩하는 구축물(예를 들면 바이러스 벡터 또는 플라스미드)이 제공된다. 일부 실시형태에서, 상기 구축물은 dRNA를 인코딩하는 서열에 조작 가능하게 연결된 프로모터를 포함한다. 일부 실시형태에서, 상기 구축물은 DNA 구축물이다. 일부 실시형태에서, 구축물은 AAV8과 같은 AAV와 같은 바이러스 벡터이다.

일부 실시형태에서, 상기 기재된 dRNA 중 어느 하나에 따른 복수의 dRNA 또는 상기 기재된 구축물 중 어느 하나에 따른 복수의 구축물을 포함하는 라이브러리가 제공된다.

또한, 본 명세서에 기재된 dRNA 중 어느 하나, 본 명세서에 기재된 구축물 중 어느 하나, 또는 본 명세서에 기재된 라이브러리 중 어느 하나를 포함하는 조성물, 숙주 세포, 키트 및 제조 물품이 제공된다.

도 1a-1h는 내인성 Adar1 단백질을 사용하는 단일 dRNA를 사용한 RNA 편집을 도시한다. 도 1a 및 1b는 내인성 Adar1 단백질을 사용한 RNA 편집의 도식적 표현을 도시한다. 도 1c는 내인성 Adar1 단백질을 사용하여 dRNA로 리포터 mRNA 편집을 도시한다. 도 1d는 도 1b의 결과의 통계적 분석을 도시한다. 도 1e는 Adar1 녹아웃(knockout) 및 Adar1(p110), Adar1(p150) 및 Adar2 구제 결과를 도시한다. 도 1f는 도 1d의 결과의 통계적 분석을 도시한다. 도 1g는 293T-WT 세포에서 dRNA에 의해 매개되는 RNA 편집에 대한 Adar1(p110), Adar1(p150) 또는 Adar2 과발현의 효과를 도시한다. 도 1h는 딥 시퀀싱(즉, 차세대 시퀀싱, NGS) 결과가 타겟팅 부위에서 확인된 A에서 G로의 편집 결과를 도시한다.
도 2a-2h는 dRNA의 최적화를 도시한다. 도 2a는 타겟팅 아데노신에 반대측에 있는 4종류의 염기(A, U, C 및 G) 식별의 도식적 표현을 도시한다. 도 2b는 dRNA에 의한 RNA 편집 효율에 대한 타겟팅 아데노신의 반대쪽에 있는 염기 식별의 효과를 도시한다. 도 2c는 UAG 타겟팅 부위와 미스매치된(mismatched) 1개, 2개 또는 3개의 염기를 갖는 dRNA의 도시적 표현을 도시한다. 도 2d는 dRNA에 의한 리포터 RNA 편집에 대한 UAG 타겟팅 부위와 미스매치된 1개, 2개 또는 3개의 염기의 효과를 도시한다. dRNA는 타겟팅 아데노신에 대해 A-C 미스매치를 선호했다. 도 2e는 변이 길이를 갖는 dRNA의 도식적 표현을 도시한다. 도 2f는 이중 형광 리포터-2를 기반으로 한 RNA 편집 효율에 대한 dRNA 길이의 효과를 도시한다. 도 2g는 상이한 A-C 미스매치 위치의 도식적 표현을 도시한다. 도 2h는 RNA 편집 효율에 대한 A-C 미스매치 위치의 효과를 도시한다.
도 3a-3b는 본 출원의 예시적인 RNA 편집 방법을 통한 내인성 RNA 편집을 위한 편집 유연성을 도시한다. 도 3a는 16개의 상이한 3-염기 모티프 모두에서 내인성 RNA 편집 효율의 백분율 정량화를 도시한다. 도 3b는 16개의 상이한 3-염기 모티프에 대한 내인성 RNA 편집의 5' 및 3' 염기 선호도의 히트맵을 도시한다.
도 4a-4h는 293T 세포에서 dRNA로 내인성 유전자의 mRNA 편집을 도시한다. 도 4a는 KRAS mRNA 타겟 및 변이 길이를 갖는 dRNA의 도식적 표현을 도시한다. 도 4b는 293T 세포에서 dRNA로 내인성 KRAS 유전자의 mRNA 편집을 도시한다. 빈 벡터, dRNA-91nt 플라스미드를 각각 293T-WT 세포에 형질감염시켰다. 60시간 후 RT-PCR을 위해 RNA를 단리한 다음, cDNA를 증폭하고 Illumina NextSeq에서 시퀀싱했다. 도 4c는 PPIB mRNA 타겟(부위 1, 부위 2 및 부위 3) 및 대응하는 dRNA 설계의 도식적 표현을 도시한다. 도 4d, 4e 및 4f는 293T 세포에서 dRNA로 내인성 PPIB 유전자의 mRNA 편집을 도시한다. 도 4g는 β-액틴 mRNA 타겟 및 dRNA(71개의 뉴클레오티드 및 131개의 뉴클레오티드)의 도식적 표현을 도시한다. 도 4h는 293T 세포에서 dRNA로 내인성 β-액틴 유전자의 mRNA 편집을 도시한다.
도 5a-5g는 오프타겟 분석을 도시한다. 도 5a는 PPIB mRNA 타겟(PPIB 부위 1)에 대한 A에서 I로의 편집이 분석된 서열 창의 도식적 표현을 도시한다. 흑색 화살표는 타겟팅된 아데노신을 나타낸다. 도 5b는 PPIB mRNA 타겟(PPIB 부위 1)을 타겟팅하는 151개의 뉴클레오티드 dRNA에 의한 A에서 I로의 RNA 편집의 딥 스퀀싱 정량화를 도시한다. 도 5c는 A에서 I로의 편집이 KRAS mRNA 타겟에 한해 분석된 서열 창의 도식적 표현을 도시한다. 흑색 화살표는 타겟팅된 아데노신을 나타낸다. 도 5d는 KRAS mRNA 타겟을 타겟팅하는 91개의 뉴클레오티드 및 111개의 뉴클레오티드 dRNA에 의한 A에서 I로의 RNA 편집의 딥 스퀀싱 정량화를 도시한다. 도 5e는 상이한 A-G 미스매치 조합을 함유하는 설계된 4종류의 91개의 뉴클레오티드 또는 111개의 뉴클레오티드 dRNA 변이체의 도식적 표현을 도시한다. A-G 미스매치는 도 5d의 통계 결과 및 상이한 아미노산의 유전자 코드에 대한 기존 지식을 기반으로 설계되었다. 도 5f는 도 5e에서의 dRNA 및 상이한 종류의 dRNA 변이체에 의한 타겟팅된 A56 편집의 결과를 도시한다. 도 5g는 111개의 뉴클레오티드 dRNA 및 KRAS mRNA 타겟을 타겟팅하는 4종류의 111개의 뉴클레오티드 dRNA 변이체에 의한A에서 I로의 RNA 편집의 딥 스퀀싱 정량화를 도시한다.
도 6a-6h는 내인성 Adar1 단백질을 활용하여 단일 dRNA를 이용한 RNA 편집을 도시한다. 도 6a는 dLbuCas13-ADARDD 융합 단백질에 의한 RNA 편집의 도식적 표현을 도시한다. 촉매적으로 비활성인 dLbuCas13은 ADAR1 또는 ADAR2의 RNA 탈아미노효소 도메인에 융합되었다. 도 6b는 이중 형광 리포터 mRNA 타겟 및 가이드 RNA 설계의 도식적 표현을 도시한다. 도 6c는 도 6a 및 도 6b의 결과에 대한 통계적 분석을 도시한다. 도 6d는 293T-WT 세포에서의 Adar1 및 Adar2의 mRNA 수준을 도시한다. 도 6e는 게놈 PCR에 의한 293T-ADAR1-KO 세포주에서의 ADAR1 유전자의 유전자형 분류 결과를 도시한다. 도 6f는 웨스턴 블로팅을 통한 293T-WT 및 293T-ADAR1-KO 세포주에서의 Adar1(p110) 및 Adar1(p150)의 발현 수준을 도시한다. 도 6g는 FACS를 통한 293T-WT 세포에서의 dRNA에 의해 매개된 RNA 편집에 대한 Adar1(p110), Adar1(p150) 또는 Adar2의 과발현의 효과를 도시한다. 도 6h는 타겟 아데노신 부위에서 A에서 G로의 편집을 나타낸 생어 시퀀싱 결과를 나타낸다.
도 7a-7c는 dRNA의 최적화를 도시한다. 도 7a는 이중 형광 리포터-1을 기반으로 한 변이 길이를 갖는 dRNA 및 변이 길이를 갖는 dRNA에 의한 타겟팅된 mRNA 편집 결과의 도식적 표현을 도시한다. 도 7b는 이중 형광 리포터-1에 기초한 RNA 편집 효율에 대한 상이한 A-C 미스매치 위치 및 A-C 미스매치 위치의 효과의 도식적 표현을 도시한다. 도 7c는 이중 형광 리포터-3을 기반으로 한 RNA 편집 효율에 대한 상이한 A-C 미스매치 위치 및 A-C 미스매치 위치의 효과의 도식적 표현을 도시한다.
도 8a-8b는 293T 세포에서의 dRNA를 이용한 내인성 유전자의 mRNA 편집을 도시한다. 도 8a는 293T 세포에서의 dRNA를 이용한 내인성 β-액틴 유전자(부위 2)의 mRNA 편집을 도시한다. 도 8b는 293T 세포에서의 dRNA를 이용한 내인성 GAPDH 유전자의 mRNA 편집을 도시한다.
도 9는 상이한 세포주에서의 dRNA에 의한 RNA 편집을 도시한다. 도 9a는 리포터 플라스미드와 dRNA 플라스미드가 상이한 세포주 내에 공-형질감염되었으며, dRNA가 다수의 세포주에서 잘 기능할 수 있다는 결과를 나타낸 바, dRNA 적용의 보편성을 나타낸다.
도 10a-10d는 효율적인 예시적 RNA 편집 플랫폼의 탐색을 도시한다. 도 10a, dLbuCas13a-ADAR1_DD(E1008Q) 융합 단백질 및 대응하는 crRNA를 도시한다. 촉매 불활성 LbuCas13a는 3×GGGGS 링커를 사용하여 ADAR1(과활동성 E1008Q 변이체)의 탈아미노효소 도메인에 융합되었다. crRNA(crRNA^Cas13a)는 Lbu-crRNA 스캐폴드와 스페이서로 이루어졌으며, 표시된 바와 같이 A-C 미스매치를 갖는 타겟팅 RNA에 상보적이었다. 도 10b는 이중 형광 리포터 시스템 및 표시된 바와 같은 다양한 길이의 스페이서를 갖는 Lbu-crRNA의 도식적 표현을 도시한다. 도 10c는 EGFP 양성(EGFP+) 세포의 정량화를 도시한다. 리포터-1을 안정적으로 발현하는 HEK293T 세포를 dLbuCas13a-ADAR1_DD(E1008Q)의 공동 발현 유무에 관계없이, 표시된 crRNA^Cas13a의 길이로 형질감염시킨 후, FACS 분석을 행했다. 데이터는 평균±s.e.m(n=3)으로 표시된다. 도 10d는 대조군(대조군 crRNA₇₀) 또는 타겟팅 스페이서(crRNA₇₀)를 사용하여 수행 한 실험으로부터 얻어진 대표적 FACS 결과를 도시한다.
도 11a-11g는 타겟팅된 RNA 편집을 위해 내인성 ADAR1 단백질을 활용하는 예시적인 방법을 도시한다. 도 11a는 리포터-1 및 70개의 뉴클레오티드 arRNA의 도식적 표현을 도시한다. 도 11b는 리포터-1을 안정적으로 발현하는 야생형(HEK293T, 상부) 또는 ADAR1 녹아웃(HEK293T ADAR1^-/-, 하부) 세포에서의 arRNA-유도 EGFP 발현의 대표적인 FACS 분석을 도시한다. 도 11c는 야생형 및 HEK293T ADAR1^-/-세포에서의 ADAR1 단백질의 발현 수준뿐만 아니라, ADAR1 이소폼(p110 및 p150)으로 형질감염된 HEK293T ADAR1^-/-세포에서의 ADAR1 단백질의 발현 수준을 나타내는 웨스턴 블롯 분석을 도시한다. 도 11d는 야생형 및 HEK293T ADAR1^-/-세포에서의 ADAR2 단백질의 발현 수준뿐만 아니라 ADAR2로 형질감염된 HEK293T ADAR1^-/-세포에서의 ADAR2 단백질의 발현 수준을 나타내는 웨스턴 블롯 분석을 도시한다. 도 11e는 EGFP 양성(EGFP+) 세포의 정량화를 도시한다. 리포터-1 및 표시된 ADAR-발현 구축물은 대조군 RNA₇₀ 또는 타겟팅 arRNA₇₀과 함께 HEK293T ADAR1^-/-세포로 공-형질감염된 후, FACS 분석을 행했다. EGFP⁺ 백분율은 mCherry⁺에 의해 결정된 형질감염 효율에 의해 정규화되었다. 데이터는 평균값±s.e.m(n=4)이다. 도 11f는 대조군 RNA₇₀(상부) 또는 arRNA₇₀(하부)-타겟팅된 영역에서의 생어 시퀀싱 결과를 나타내는 전기영동도(Electropherograms)를 도시한다. 도 11g는 딥 시퀀싱에 의해 타겟팅된 부위에서의 A에서 I로의 전환율의 정량화를 도시한다.
도 12a-12b는 ADAR1/ADAR2 및 arRNA-매개 RNA 편집의 mRNA 발현 수준을 도시한다. 도 12a는 HEK293T 세포에서의 ADAR1 및 ADAR2의 mRNA 수준을 나타내는 정량적 PCR을 도시한다. 데이터는 평균±s.e.m(n=3)으로 표시된다. 도 12b는 도 1e로부터의 대표적인 FACS 결과를 도시한다.
도 13은 HEK293T 세포에서의 111개의 뉴클레오티드 arRNA 또는 대조군 RNA에 의한 타겟팅된 리포터-1 전사물의 발현 수준에 대한 예시적인 LEAPER 방법의 효과를 입증하는 정량적 PCR 결과를 도시한다. 데이터는 평균±s.e.m(n=3)으로 표시되고; 짝을 이루지 않은 양측 스튜던트 t-검정이고, ns는 유의하지 않음을 나타낸다.
도 14a-14d는 다수의 세포주에서 예시적인 LEAPER 방법을 사용한 타겟화 RNA 편집을 도시한다. 도 14a는 표시된 인간 세포주에서의 ADAR1, ADAR2 및 ADAR3의 발현 수준을 나타내는 웨스턴 블롯 결과를 도시한다. β-튜불린은 로딩 대조군으로 사용되었다. 나타낸 데이터는 3개의 독립적 실험을 대표한다. ADAR1^-/-/ADAR2는 ADAR2를 과발현하는 ADAR1-녹아웃 HEK293T 세포를 나타낸다. 도 14b는 β-튜불린 발현에 의해 정규화된 상대적 ADAR 단백질 발현 수준을 도시한다. 도 14c는 표시된 인간 세포가 71개의 뉴클레오티드 대조군 arRNA(대조군 RNA₇₁) 또는 71개의 뉴클레오티드 타겟팅 arRNA(arRNA₇₁)와 함께, 리포터-1로 형질감염된 후, 수행된 FACS 분석을 도시한다. 도 14d는 표시된 마우스 세포주를 도 14c에 기재된 바와 같이 분석한 것을 도시한다. EGFP⁺ 백분율은 mCherry⁺에 의해 결정된 형질감염 효율에 의해 정규화되었다. 도 4b, 14c 및 14d의 오차 막대는 모두 평균±s.e.m(n=3)을 나타내고; 짝을 이루지 않은 양측 스튜던트 t-검정은 *P<0.05; **P<0.01; ***P<0.001; ****P<0.0001이고; ns는 유의하지 않음을 나타낸다.
도 15a-15c는 리포터-1(a), -2(b), 및 -3(c)뿐만 아니라 그 대응하는 arRNA의 도식적 표현을 도시한다.
도 16a-16g는 예시적인 LEAPER 방법의 특성화 및 최적화를 도시한다. 도 16a의 상부는 타겟 UAG 반대측에 있는 변화된 삼중항(5'-CNA, N은 A, U, C 또는 G를 나타냄)을 갖는 arRNA의 설계의 도식적 표현이고, 하단은 RNA 편집 효율에 대한 타겟팅된 아데노신에 반대쪽에 있는 가변 염기의 효과를 나타내는 EGFP⁺%를 도시한다. 도 16b의 상부는 A-C 미스매치(5'-N¹CN²)에서 시티딘에 인접하여 있는 변경된 이웃 염기를 갖는 arRNA의 설계를 도시하고, 하부는 RNA 편집 효율에 대한 N¹CN²의 16개의 상이한 조합의 효과를 도시한다. 도 16c는 A-C 미스매치에서 시티딘의 5' 및 3' 최근접 이웃 부위의 선호도의 요약을 도시한다. 도 16d의 상부는 가변 길이를 갖는 arRNA의 설계를 도시하고, 하부는 리포터-1 및 리포터-2를 기반으로 한 RNA 편집 효율에 대한 arRNA 길이의 영향을 도시한다. 도 16e의 상부는 가변적 A-C 미스매치 위치를 갖는 arRNA의 설계를 도시하고, 하부는 리포터-1 및 리포터-2를 기반으로 한 RNA 편집 효율에 대한 A-C 미스매치 위치의 영향을 도시한다. 도 16f의 상부는 111개의 뉴클레오티드 arRNA(arRNA₁₁₁)에 대해 타겟팅 아데노신(5'-N¹AN²) 및 반대쪽 모티프(5'-N²CN¹)를 둘러싸고 있는 가변의 최근접 이웃 염기를 갖는 리포터-3에서의 삼중항 모티프 설계를 도시하고, 하부는 5'-N¹AN² 모티프에서의 타겟팅된 아데노신에 대한 편집률을 나타내는 딥 시퀀싱 결과를 도시한다. 도 16g는 리포터-3에서 LEAPER-매개 편집의 5'-및 3'-염기 선호도를 요약한 것이다. 도 16a, 16b, 16d, 16e 및 16f에서의 오차 막대는 모두 평균값±s.e.m(n=3)을 나타낸다.
도 17a-17i는 예시적인 LEAPER 방법을 사용한 내인성 전사물의 편집을 도시한다. 도 17a는 4개의 질환 관련 유전자(PPIB, KRAS, SMAD4 및 FANCC)의 타겟팅 내인성 전사물 및 대응하는 arRNA의 도식을 도시한다. 도 17b는 표시된 길이의 arRNA를 도입함으로써 PPIB, KRAS, SMAD4 및 FANCC 전사물의 타겟팅된 아데노신에 대한 편집률을 나타내는 딥 시퀀싱 결과를 도시한다. 도 17c는 내인성 PPIB, FANCC 및 IDUA 전사물의 비-UAN 부위에 대한 편집률을 나타내는 딥 시퀀싱 결과를 도시한다. 도 17d는 2개의 111개의 뉴클레오티드 arRNA에 의한 다중 편집률을 도시한다. 표시된 arRNA는 단독으로 형질감염되거나 또는 HEK293T 세포로 공-형질감염되었다. 두 부위의 타겟팅된 편집은 공-형질감염된 세포로부터 측정되었다. 도 17e는 151개의 뉴클레오티드 arRNA에 의해 커버되는 PPIB 전사물 서열의 도식을 도시한다. 흑색 화살표는 타겟팅된 아데노신을 나타낸다. 모든 아데노신은 적색으로 마크되었다. 도 17f는 PPIB 유전자를 타겟팅하는 표시된 길이의 arRNA(청색의 굵은 프레임으로 마크함)에 의해 커버되는 아데노신에 대한 편집률의 히트맵을 도시한다. 111개의 뉴클레오티드 arRNA 또는 arRNA₁₅₁-PPIB 커버 영역의 경우, A22, A30, A33 및 A34의 편집률은 이 영역을 증폭하기 위한 효과적인 PCR 프라이머가 부족하기 때문에 RNA-seq에 의해 결정되었다. 그렇지 않으면, 편집률은 타겟팅된 딥 시퀀싱 분석에 의해 결정되었다. 도 17g의 상부는 111개의 뉴클레오티드 arRNA(arRNA₁₁₁)에서 타겟팅하는 아데노신(5'-N¹AN²) 및 반대쪽의 모티프(5'-N^2'GN¹ ^')를 둘러싸고 있는 가변의 최근접 이웃 염기를 갖는 리포터-3에서의 삼중항 모티프의 설계를 도시하고, 하부는 편집률을 나타내는 딥 시퀀싱 결과를 도시한다. 도 17h의 상부는 5'-UAG 또는 5'-AAG 모티프의 반대쪽에 있는 5'-N¹GN² 모티프에서의 2개의 연속한 미스매치를 갖는 arRNA의 설계를 도시한다. 딥 시퀀싱 결과는 5'-UAG 모티프(좌측 하부) 또는 5'-AAG 모티프(우측 하부)에 반대되는 5'-N¹GN² 모티프에서 2개의 연속한 미스매치를 갖는 arRNA₁₁₁에 의한 편집률을 나타낸다. 도 17i는 KRAS 유전자를 타겟팅하는 조작된 arRNA₁₁₁ 변이체에 의해 커버되는 아데노신에 대한 편집률의 히트맵을 도시한다. 도 17b, 도 17c, 도 17d, 도 17g 및 도 17h에서의 데이터는 평균±s.e.m(n=3)으로 표시되고; 짝을 이루지 않은 양측 스튜던트 t-검정은 *P<0.05; **P<0.01; ***P<0.001; ****P<0.0001이고; NS는 유의하지 않음을 나타낸다. (f 및 i)에서의 데이터는 평균(n=3)으로 표시된다.
도 18a-18b는 타겟팅된 전사물 및 단백질 생성물의 발현 수준에 대한 예시적인 LEAPER 방법의 효과를 도시한다. 도 18a는 HEK293T 세포에서 대응하는 151개의 뉴클레오티드 arRNA 또는 대조군 RNA에 의해 PPIB, KRAS, SMAD4 및 FANCC로부터의 타겟팅된 전사물의 발현 수준을 나타내는 정량적 PCR을 도시한다. 데이터는 평균±s.e.m(n=3)으로 표시되고; 짝을 이루지 않은 양측 스튜던트 t-검정은 *P<0.05; **P<0.01; ***P<0.001; ****P<0.0001이고; ns는 유의하지 않음을 나타낸다. 도 18b는 HEK293T 세포에서 151개의 뉴클레오티드 arRNA에 의해 타겟팅된 KRAS 유전자의 단백질 생성물에 미치는 영향을 나타내는 웨스턴 블롯 결과를 도시한다. β-튜불린은 로딩 대조군으로 사용되었다.
도 19a-19f는 예시적인 LEAPER 방법을 사용한 내인성 전사물의 편집을 도시한다. 도 19a는 151개의 뉴클레오티드 arRNA에 의해 커버되는 KARS 전사물 서열의 도식을 도시한다. 화살표는 타겟팅 아데노신을 나타낸다. 모든 아데노신은 적색으로 마크했다. 도 19b는 KARS 전사물에서 표시된 arRNA(청색의 굵은 프레임으로 마크함)에 의해 커버되는 아데노신에 대한 편집률의 히트맵을 도시한다. 도 19c는 151개의 뉴클레오티드 arRNA에 의해 커버되는 SMAD4 전사물의 도식을 도시한다. 도 19d는 SMAD4 전사물에서 표시된 arRNA에 의해 커버되는 아데노신에 대한 편집률의 히트맵을 도시한다. 도 19e는 151개의 뉴클레오티드 arRNA에 의해 커버되는 FANCC 전사물의 도식을 도시한다 도 19f는 FANCC 전사물에서 표시된 arRNA에 의해 커버되는 아데노신에 대한 편집률의 히트맵을 도시한다. 각각의 arRNA에 대해 이중체(duplex) RNA의 영역은 청색의 굵은 프레임으로 강조 표시된다. 데이터(도 19b, 19d 및 19f)는 평균(n=3)으로 표시된다.
도 20a-20d는 LEAPER에 의한 RNA 편집의 전장 전사체(transcriptome-wide) 특이성을 도시한다. 도 20a 및 20b는 대조군 RNA₁₅₁ 및 arRNA151-PPIB의 전장 전사체의 오프-타겟팅(오프-타겟ing) 분석을 도시한다. 온-타겟팅 부위(PPIB)는 적색으로 강조 표시된다. 대조군 RNA 및 PPIB-타겟팅 RNA군 모두에서 식별된 잠재적 오프-타겟 부위는 청색으로 라벨링된다. 도 20c는 오프-타겟 부위와 대응하는 대조군 RNA₁₅₁ 또는 arRNA₁₅₁ _- 사이의 예측된 어닐링 친화도를 도시한다.
PPIB. 오프-타겟 부위(편집 부위의 150개의 뉴클레오티드 상류 및 하류) 및 대응하는 대조군 RNA₁₅₁ 또는 arRNA₁₅₁-PPIB에 의해 형성된 이중 가닥 RNA의 최소 자유 에너지(ΔG)는 온라인 웹사이트 도구인 RNAhybrid를 사용하여 예측했다. 도 20d의 상부는 NCBI-BLAST를 통해 상동 서열을 검색함으로써 예측되는 arRNA₁₅₁-PPIB와 표시된 잠재적 오프-타겟 부위 사이의 고도로 상보적인 영역의 도식을 도시하고, 하부는 arRNA₁₅₁-PPIB의 온-타겟 부위 및 모든 예측된 오프-타겟 부위에 대한 편집률을 나타내는 딥 시퀀싱을 도시한다. 데이터는 평균±s.e.m(n=3)으로 표시된다.
도 21a-21b는 잠재적 오프-타겟의 평가를 도시한다. 도 21a는 NCBI-BLAST를 통해 상동성 서열을 검색함으로써 예측되는 arRNA₁₁₁-FANCC의 고도로 상보적인 영역 및 표시된 잠재적 오프-타겟 서열의 도식을 도시한다. 도 21b는 arRNA₁₁₁-FANCC의 온-타겟 부위 및 모든 예측된 오프-타겟 부위에서의 편집률을 나타내는 딥 시퀀싱을 도시한다. 모든 데이터는 평균±s.e.m(n=3)으로 표시된다.
도 22a-22f는 포유류 세포에서의 예시적인 LEAPER 방법 적용의 안전성 평가를 도시한다. 도 22a 및 22b는 전장 전사체 RNA 시퀀싱에 의한 네이티브 편집 부위에 대한 대조군 RNA₁₅₁(a) arRNA₁₅₁-PPIB(b)가 미치는 효과의 전장 전사체 분석을 도시한다. 피어슨의 상관 계수 분석은 네이티브 편집 부위에서 차등 RNA 편집률을 평가하기 위해 사용되었다. 도 22c 및 22d는 전사체 수준의 RNA-seq 데이터를 사용하여 대조군 RNA₁₅₁(c) arRNA₁₅₁-PPIB(d)의 효과의 차등 유전자 발현 분석을 도시한다. 피어슨의 상관 계수 분석을 사용하여, 차등 유전자 발현을 평가했다. 도 22e 및 22f는 선천적인 면역 반응에 대한 arRNA 형질감염의 효과를 도시한다. 표시된 arRNA 또는 폴리(I:C)를 HEK293T 세포에 형질감염시켰다. 총 RNA는 정량적 PCR을 사용하여 분석하여 IFN-β(e) 및 IL-6(f)의 발현 수준을 결정했다. 데이터(e 및 f)는 평균±s.e.m(n=3)으로 표시된다.
도 23a-23d는 LEAPER에 의한 돌연변이체 TP53W53X의 전사 조절 활성의 회복을 도시한다. 도 23a의 상부는 c158G>A 임상 관련 넌센스 돌연변이(Trp53Ter)를 함유하는 111개의 뉴클레오티드 arRNA에 의해 커버되는 TP53 전사물 서열의 도식을 도시한다. 흑색 화살표는 타겟팅된 아데노신을 나타낸다. 모든 아데노신은 적색으로 마크했다. 하부는 "편집하기 쉬운" 모티프에 대한 잠재적 오프-타겟을 최소화하기 위해, arRNA₁₁₁-AG1의 경우에는 A^46th에 대해 또한 arRNA₁₁₁-AG4의 경우에는 46번째 A, 46번째 A, 91번째 A 및 94번째 A에 대해 함께 A-G 미스매치를 갖는 TP53^W53X 전사물을 타겟팅하는 2개의 최적화된 arRNA의 설계를 도시한다. 도 23b는 arRNA₁₁₁, arRNA₁₁₁-AG1 및 arRNA₁₁₁-AG4에 의한 TP53^W53X 전사물에 대한 타겟팅된 편집을 나타내는 딥 시퀀싱 결과를 도시한다. 도 23c는 HEK293T TP53^-/-세포에서 TP53^W53X 전사물로부터 전장 p53 단백질의 회복된 생산을 나타내는 웨스턴 블롯을 도시한다. 도 23d는 공-형질감염된 레닐라 루시퍼레이스(레닐라 루시페라아제) 벡터에 의해 정규화된 p53-파이어플라이 루시퍼레이스(파이어플라이 루시페라아제) 리포터 시스템을 사용하여 복원된 p53 단백질의 전사 조절 활성의 검출을 도시한다. 데이터(b, c 및 d)는 평균±s.e.m(n=3)으로 표시되고; 짝을 이루지 않은 양측 스튜던트 t-검정은 *P<0.05; **P<0.01; ***P<0.001; ****P<0.0001이고; ns는 유의하지 않음을 나타낸다.
도 24는 예시적인 LEAPER 방법에 의한 돌연변이체 TP53W53X 전사물의 편집을 도시한다. 상부는 111개의 뉴클레오티드 arRNA에 의해 커버된 TP53 전사물 서열의 도식을 도시한다. 화살표는 타겟 아데노신을 표시한다. 모든 아데노신은 적색으로 마크했다. 하부는 TP53 전사물에서 표시된 arRNA로 커버된 아데노신의 편집률의 히트맵을 도시한다.
도 25는 Clin Var 데이터로부터의 G에서 A로의 돌연변이 및 대응하는 111개의 뉴클레오티드 arRNA를 함유하는 선택된 질환 관련 cDNA의 도식적 표현을 도시한다.
도 26은 예시적인 LEAPER 방법에 의한 병원성 돌연변이의 교정을 도시한다. 표시된 바와 같이(도 25 및 이하의 arRNA 및 대조군 RNA 및 질환 관련 cDNA의 서열의 표) 6개의 병원성 유전자로부터 임상 관련 돌연변이를 타겟팅하는, 대응하는 111개의 뉴클레오티드 arRNA에 의한 ClinVar 데이터로부터 질환 관련 G>A 돌연변이의 A에서 I로의 교정. 데이터는 평균±s.e.m(n=3)으로 표시되고; 짝을 이루지 않은 양측 스튜던트 t-검정은 *P<0.05; **P<0.01; ***P<0.001; ****P<0.0001이고; ns는 유의하지 않음을 나타낸다.
도 27a-27c는 예시적인 LEAPER 방법에 의한 다중의 인간 1차 세포에서의 RNA 편집을 도시한다. 도 27a는 LEAPER 매개 RNA 편집에 의해 유도된 EGFP 양성(EGFP⁺) 세포의 정량화를 도시한다. 인간 1차 폐섬유아세포 및 인간 1차 기관지 상피세포를 151개의 뉴클레오티드 대조군 RNA(대조군 RNA151) 또는 151개의 뉴클레오티드 타겟화 arRNA(arRNA151)와 함께 리포터-1로 형질감염시킨 다음, FACS 분석을 수행했다. 도 27b 및 27c는 인간 1차 폐섬유아세포, 인간 1차 기관지 상피 세포(b) 및 인간 1차 T 세포(c)에서의 PPIB 전사물에 대한 편집률을 나타내는 딥 시퀀싱 결과를 도시한다. a, b 및 미처리 군(c)에서의 데이터는 평균±s.e.m(n=3)으로 표시되고; 대조군 RNA₁₅₁ 및 arRNA₁₅₁(c)의 데이터는 평균±s.e.m(n=2)으로 표시된다.
도 28a-28d는 arRNA의 렌티바이러스 형질도입 및 합성된 arRNA 올리고뉴클레오티드의 전기천공에 의한 타겟팅된 편집을 도시한다. 도 28a는 EGFP⁺ 세포의 정량화를 도시한다. 리포터-1을 안정적으로 발현하는 HEK293T 세포는 대조군 RNA의 151개의 뉴클레오티드를 발현하는 렌티바이러스 또는 타겟으로 하는 arRNA로 감염되었다. FACS 분석은 감염 후 2일 및 8일 후에 수행되었다. EGFP⁺ 세포의 비율은 렌티바이러스 형질도입 효율(BFP⁺ 비율)에 의해 정규화되었다. 도 28b는 HEK293T 세포 내에 151개의 뉴클레오티드 arRNA의 렌티바이러스 형질도입시 PPIB 전사물에 대한 편집률을 나타내는 딥 시퀀싱 결과를 도시한다. 도 28c는 PPIB 서열 및 대응하는 111개의 뉴클레오티드 타겟팅 arRNA의 도식을 도시한다. *(적색)는 2'-O-메틸 및 포스포로티오에이트 결합 수식을 갖는 뉴클레오티드를 나타낸다. 도 28d는 인간 1차 T 세포 내로의 111개의 뉴클레오티드 합성 arRNA 올리고뉴클레오티드의 전기천공시 PPIB 전사물에 대한 편집률을 나타내는 딥 시퀀싱 결과를 도시한다.
도 29a-29e는 예시적인 LEAPER 방법에 의한 헐러 증후군 환자 유래의 1차 섬유아세포에서의 α-L-아이두로니데이스 활성의 복원을 도시한다. 도 29a의 상부는 환자 유래 섬유아세포 GM06214에서의 병원성 돌연변이의 유전 정보를 도시하고; 중간부는 IDUA 유전자(Trp402Ter)의 엑손 9에 동형 접합 TGG>TAG 돌연변이를 포함하는 GM06214 세포(흑색)의 IDUA 성숙 mRNA 서열 및 대응하는 111개의 뉴클레오티드 타겟팅 arRNA₁₁₁-IDUA-V1(청색)을 도시하고; 하부는 GM06214 세포의 IDUA pre-mRNA 서열(흑색) 및 대응하는 111개의 뉴클레오티드 타겟팅 arRNA₁₁₁-IDUA-V2(청색)의 도식을 도시한다. *(적색)은 2'-O-메틸 및 포스포로티오에이트 결합 수식을 갖는 뉴클레오티드를 나타낸다. 도 29b는 상이한 시점에서 4-메틸움벨리페릴 α-L-아이두로니데이스 기질을 사용하여 α-L-아이두로니데이스의 촉매 활성 측정을 도시한다. 데이터는 평균±s.e.m(n=2)으로 표시된다. 도 29c는 전기천공 48시간 후 GM06214 세포에서의 IDUA 전사물에 대한 타겟팅된 편집률을 나타내는 딥 시퀀싱 결과를 도시한다. 도 29d의 상부는 111개의 뉴클레오티드 arRNA에 의해 커버되는 IDUA 전사물 서열의 도식을 도시한다. 화살표는 타겟팅된 아데노신을 나타낸다. 모든 아데노신은 적색으로 마크했다. 하부는 IDUA 전사물에서 표시된 arRNA(청색의 굵은 프레임으로 마크됨)로 커버된 아데노신에 대한 편집률의 히트맵을 도시한다. 도 29e는 arRNA 또는 폴리(I:C) 전기천공시 I형 인터페론, 인터페론 자극 유전자 및 전염증성 유전자의 발현을 나타내는 정량적 PCR을 도시한다. 데이터는 평균(n=3)으로 표시된다.
도 30a-30c는 이중 형광 리포터(리포터-1, 리포터-2 및 리포터-3), mCherry 및 EGFP의 세 가지 버전을 도시한다. 도 30a는 리포터-1의 구조, 도 30b는 리포터-2의 구조, 및 도 30c는 리포터-3의 구조를 도시한다.
도 31은 AAV8-IDUA-adRNA151-KD2 및 AAV8-Random151-KD2의 플라스미드 정보를 도시한다.
도 32a-b는 AAV8-IDUA-adRNA151-KD2 및 AAV8-Random151-KD2가 주입된 MPS I 마우스의 α-L-아이두로니데이스 상대적 효소 활성을 GM01323 세포를 대조군으로 하여 도시한다.
도 33a-b는 AAV8-IDUA-adRNA151-KD2 및 AAV8-Random151-KD2가 주입된 MPS I 마우스의 RNA 편집 효율을 도시한다.

본 출원은 RNA 편집 방법(본 명세서에서 "LEAPER" 방법으로 칭해짐) 및 숙주 세포에서 타겟 RNA를 편집하도록, 본 명세서에서 탈아미노효소-리크루팅 RNA("dRNAs") 또는 ADAR-리크루팅 RNA("arRNAs")로 칭해진 특별히 설계된 RNA를 제공한다. 이론이나 가설에 얽매이지 않고, dRNA는 서열 특이적 방식으로 타겟 RNA에 혼성화를 통해 이중 가닥 RNA를 형성하도록 작용하여, 타겟 RNA에서의 타겟 아데노신을 탈아미노화하도록 RNA 아데노신 탈아미노효소(ADAR)(Adenosine Deaminase Acting on RNA)를 리크루팅한다. 이와 같이, 효율적인 RNA 편집은 숙주 세포에서 ADAR 단백질의 이소성(ectopic) 또는 과발현 없이 일부 실시형태에서 달성될 수 있다. 또한, RNA 편집 방법을 사용하여 개체에서의 질환 또는 상태를 치료 또는 예방하기 위한 방법 및 조성물이 제공된다.

본 명세서에 기재된 RNA 편집 방법은 Cas와 같은 가이드 핵산에 특이적으로 결합하는 단백질 및 ADAR을 포함하는 융합 단백질을 사용하지 않는다. 본 명세서에 기재된 탈아미노효소-리크루팅 RNA("dRNA")는 CRISPR/Cas 시스템에서 사용되는 crRNA, tracrRNA 또는 gRNA를 포함하지 않는다. 일부 실시형태에서, dRNA는 ADAR-리크루팅 도메인 또는 화학적 수식(들)을 포함하지 않는다. 일부 실시형태에서, dRNA는 바람직한 편집 효율을 달성할 수 있는 플라스미드 또는 바이러스 벡터로부터 발현되거나, 또는 올리고뉴클레오티드로 합성될 수 있다.

본 명세서에 기재된 LEAPER 방법은 타겟 전사체 및 레어 글로벌 오프-타겟(rare global off-target)에 대해 관리 가능한 오프-타겟 비율을 갖는다. 발명자들은 LEAPER 방법을 사용하여 특정 암 관련 점 돌연변이를 복구하여 p53 기능을 복원했다. 또한, 본 명세서에 기재된 LEAPER 방법은 다중의 인간 1차 세포를 포함하는 광범위한 세포 유형에 적용될 수 있으며, 또한 선천적 면역 반응을 유발하지 않고 헐러 증후군 환자 유래의 1차 섬유아세포에서 α-L-아이두로니데이스 촉매 활성을 복원하는 데 사용될 수 있다. 일부 실시형태에서, LEAPER 방법은 단일 분자(즉, dRNA) 시스템을 포함한다. 여기에 설명된 LEAPER 방법은 정밀하고 효율적인 RNA 편집을 가능하게 하여, 기본 연구 및 치료제에 대한 변형 가능성을 제공한다.

정의

본 발명은 특정 실시형태 및 소정 도면을 참조하여 설명될 것이지만, 본 발명은 이에 제한되지 않고 청구범위에 의해서만 제한된다. 청구범위의 참조 기호는 범위를 제한하는 것으로 해석되어서는 안된다. 용어 "포함하는"이 본 설명 및 청구범위에서 사용되는 경우, 다른 요소 또는 단계를 배제하지 않는다. 단수 명사를 지칭할 때 부정 관사 또는 정관사, 예를 들면 "a" 또는 "an", "the"가 사용되는 경우, 이것은 특별히 언급하지 않는 한 해당 명사의 복수형을 포함한다. 본 명세서에서 뉴클레오티드의 숫자 범위를 언급하기 위해, 그 사이에 있는 각각의 개재 숫자가 명백하게 고려된다. 예를 들면 40-260개의 뉴클레오티드 범위에 대해, 40개의 뉴클레오티드 및 260개의 뉴클레오티드의 수에 추가하여 40개와 260개의 뉴클레오티드 사이의 임의의 정수가 고려된다.

하기 용어 또는 정의는 단지 본 발명의 이해를 돕기 위해 제공된다. 본 명세서에서 구체적으로 정의되지 않는 한, 본 명세서에서 사용되는 모든 용어는 본 발명의 기술 분야에서 통상의 지식을 가진 자에게 동일한 의미를 갖는다. 의사들에게는 특히 본 분야의 정의 및 용어에 대해 Sambrook et al., Molecular Cloning:A Laboratory Manual, 2nd ed., Cold Spring Harbor Press, Plainsview, New York(1989); 및 Ausubel et al., Current Protocols in Molecular Biology(Supplement 47), John Wiley & Sons, New York(1999)이 참조된다. 본 명세서에 제공된 정의는 당업자에 의해 이해되는 범위보다 작은 범위를 갖는 것으로 해석되어서는 안된다.

용어 "탈아미노효소-리크루팅 RNA", "dRNA," "ADAR-리크루팅 RNA" 및 "arRNA"는 RNA에서 타겟 아데노신을 탈아미노화하기 위해 ADAR을 리크루팅할 수 있는 조작된 RNA를 지칭하기 위해 본 명세서에서 상호 교환적으로 사용된다.

용어 "폴리뉴클레오티드", "뉴클레오티드 서열" 및 "핵산"은 상호 교환적으로 사용된다. 이들은 임의의 길이의 뉴클레오티드의 고분자 형태, 데옥시리보뉴클레오티드 또는 리보뉴클레오티드, 또는 이들의 유사체를 지칭한다.

본 명세서에 사용된 용어 "아데닌", "구아닌", "시토신", "티민", "우라실" 및 "하이포크산틴"은 이와 같은 핵염기를 지칭한다. 용어 "아데노신", "구아노신", "시티딘", "티미딘", "우리딘" 및 "이노신"은 리보스 또는 데옥시리보스 당 부위에 연결된 핵염기를 지칭한다. 용어 "뉴클레오시드"는 리보스 또는 데옥시리보스에 연결된 핵염기를 지칭한다. 용어 "뉴클레오티드"는 각각의 핵염기-리보실-포스페이트 또는 핵염기-데옥시리보실-포스페이트를 지칭한다. 때때로 용어 아데노신 및 아데닌(약어 "A"), 구아노신 및 구아닌(약어 "G"), 사이토신 및 시티딘(약어 "C"), 우라실 및 우리딘(약어 "U"), 티민 및 티미딘(약어 "T"), 이노신 및 하이포크산틴(약어 "I")은 대응하는 핵염기, 뉴클레오시드 또는 뉴클레오티드를 지칭하기 위해 상호 교환적으로 사용된다. 때때로 용어 핵염기, 뉴클레오시드 및 뉴클레오티드는 문맥상 분명히 다르게 요구하지 않는 한, 상호 교환적으로 사용된다.

본 출원의 맥락에서, "타겟 RNA"는 탈아미노효소-리크루팅 RNA 서열이 완벽한 상보성 또는 실질적인 상보성을 갖도록 설계된 RNA 서열을 지칭하며, 타겟 서열과 dRNA 사이의 혼성화는 타겟 아데노신을 함유하는 이중 가닥 RNA(dsRNA) 영역을 형성하여, 타겟 아데노신을 탈아미노화하는 RNA 아데노신 탈아미노효소(ADAR)를 리크루팅한다. 일부 실시형태에서, ADAR은 진핵 세포(바람직하게는 포유동물 세포, 보다 바람직하게는 인간 세포)와 같은 숙주 세포에 자연적으로 존재한다. 일부 실시형태에서, ADAR은 숙주 세포내로 도입된다.

본 명세서에 사용된 "상보성"은 전통적인 왓슨-크릭(Watson-Crick) 염기쌍에 의해 다른 핵산과 수소 결합(들)을 형성하는 핵산의 능력을 지칭한다. 상보성 백분율은 제 2 핵산과 수소 결합(예를 들면 왓슨-크릭 염기 쌍)을 형성할 수 있는 핵산 분자 중의 잔기의 백분율(예를 들면 10 중 약 5, 6, 7, 8, 9, 10은 각각 약 50%, 60%, 70%, 80%, 90% 및 100% 상보적임)을 나타낸다. "완벽하게 상보적"이란 핵산 서열의 모든 인접 잔기가 제 2 핵산 서열에서의 동일한 수의 인접 잔기와 수소 결합을 형성하는 것을 의미한다. 본 명세서에 사용된 "실질적으로 상보적인"은 약 40, 50, 60, 70, 80, 100, 150, 200, 250개 이상의 뉴클레오티드의 영역에 걸쳐 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100% 중 어느 하나인 상보성의 정도를 의미하거나, 또는 엄격한 조건 하에서 혼성화하는 2개의 핵산을 의미한다.

본 명세서에서 사용된 바와 같이, 혼성화를 위한 "엄격한 조건"이란 타겟 서열에 상보성을 갖는 핵산이 주로 타겟 서열과 대부분 혼성화하고, 비타겟 서열에 실질적으로 혼성화하지 않는 조건을 의미한다. 엄격한 조건은 일반적으로 서열 의존적이며, 다수의 요인에 따라 달라진다. 일반적으로, 서열이 길수록 서열이 타겟 서열에 특이적으로 혼성화하는 온도가 높아진다. 엄격한 조건의 비제한적 예는 Tijssen(1993년), Laboratory Techniques In Biochemistry And Molecular Biology-Hybridization With Nucleic Acid Probes Part I, 제 2 Chapter "Overview of principles of hybridization and the strategy of nucleic acid probe assay" 엘제비어, 미국 뉴욕에 상세히 설명되어 있다.

"혼성화"는 하나 이상의 폴리뉴클레오티드가 반응하여 뉴클레오티드 잔기의 염기 사이의 수소 결합을 통해 안정화되는 복합체를 형성하는 반응을 의미한다. 수소 결합은 왓슨-크릭 염기 쌍, 후그스테인(Hoogstein) 결합에 의해 또는 임의의 다른 서열 특이적 방식으로 발생할 수 있다. 주어진 서열과 혼성화할 수 있는 서열을 주어진 서열의 "보체"라고 지칭된다.

본 명세서에서 사용되는 용어 "세포", "세포주" 및 "세포 배양"은 상호 교환적으로 사용되며, 이러한 모든 지정은 자손을 포함한다. 모든 자손은 고의적이거나 우발적인 돌연변이로 인해 DNA 함량이 정확하게 동일하지 않을 수 있다. 본래의 세포와 동일한 기능 또는 생물학적 활성을 갖는 변종 자손이 포함된다.

RNA 편집 방법

일부 실시형태에서, 탈아미노효소-리크루팅 RNA(dRNA) 또는 dRNA를 인코딩하는 구축물을 숙주 세포에 도입하는 단계를 포함하는, 숙주 세포(예를 들면 진핵 세포)에서 타겟 RNA를 편집하는 방법이 제공되며, 여기서 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 여기서 dRNA는 타겟 RNA 중의 타겟 아데노신(A)을 탈아미노화하도록 RNA 아데노신 탈아미노효소(ADAR)를 리크루팅할 수 있다.

일부 실시형태에서, dRNA 또는 dRNA를 인코딩하는 구축물을 숙주 세포에 도입하는 단계를 포함하는, 숙주 세포(예를 들면 진핵 세포)에서 타겟 RNA를 편집하는 방법이 제공되며, 여기서 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 여기서 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하도록 숙주 세포의 내인적으로 발현된 ADAR을 리크루팅한다. 일부 실시형태에서, 상기 방법은 단백질(예를 들면 Cas, ADAR 또는 ADAR와 Cas의 융합 단백질)을 인코딩하는 임의의 단백질 또는 구축물을 숙주 세포에 도입하는 단계를 포함하지 않는다.

일부 실시형태에서, (a) dRNA 또는 dRNA를 인코딩하는 구축물, 및 (b) ADAR 또는 ADAR을 인코딩하는 구축물을 숙주 세포에 도입하는 단계를 포함하는, 숙주 세포(예를 들면 진핵 세포)에서 타겟 RNA를 편집하는 방법이 제공되며, 여기서 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 여기서 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하도록 ADAR을 리크루팅한다. 일부 실시형태에서, ADAR은 숙주 세포의 내인적으로 인코딩된 ADAR이고, 여기서 ADAR의 도입은 숙주 세포에서 ADAR을 과발현하는 단계를 포함한다. 일부 실시형태에서, ADAR은 숙주 세포에 대해 외인성이다. 일부 실시형태에서, ADAR을 인코딩하는 구축물은 플라스미드와 같은 벡터 또는 바이러스 벡터(예를 들면 렌티바이러스 벡터)이다.

일부 실시형태에서, 복수의 dRNA 또는 복수의 dRNA를 인코팅하는 구축물을 숙주 세포에 도입하는 단계를 포함하는, 숙주 세포(예를 들면 진핵 세포)에서 복수(예를 들면 적어도 약 2, 3, 4, 5, 10, 20, 50, 100개 이상)의 타겟 RNA를 편집하는 방법이 제공되며, 여기서 각각의 dRNA는 복수의 타겟 RNA에서 대응하는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 여기서 각각의 dRNA는 대응하는 타겟 RNA에서 타겟 A를 탈아미노화하도록 ADAR을 리크루팅할 수 있다.

일부 실시형태에서, 복수의 dRNA 또는 복수의 dRNA를 인코팅하는 구축물을 숙주 세포에 도입하는 단계를 포함하는, 숙주 세포(예를 들면 진핵 세포)에서 복수(예를 들면 적어도 약 2, 3, 4, 5, 10, 20, 50, 100개 이상)의 타겟 RNA를 편집하는 방법이 제공되며, 여기서 각각의 dRNA는 복수의 타겟 RNA에서 대응하는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 여기서 각각의 dRNA는 대응하는 타겟 RNA에서 타겟 A를 탈아미노화하도록 내인적으로 발현된 ADAR를 리크루팅한다.

일부 실시형태에서, (a) 복수의 dRNA 또는 복수의 dRNA를 인코팅하는 구축물, 및 (b) ADAR 또는 ADAR을 인코팅하는 구축물을 숙주 세포에 도입하는 단계를 포함하는, 숙주 세포(예를 들면 진핵 세포)에서 복수(예를 들면 적어도 약 2, 3, 4, 5, 10, 20, 50, 100, 1000개 이상)의 타겟 RNA를 편집하는 방법이 제공되며, 여기서 각각의 dRNA는 복수의 타겟 RNA에서 대응하는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 여기서 각각의 dRNA는 대응하는 타겟 RNA에서 타겟 A를 탈아미노화하도록 ADAR을 리크루팅한다.

일 양태에서, 본 출원은 복수의 탈아미노효소-리크루팅 RNA, 탈아미노효소 리크루팅 RNA를 인코딩하는 하나 이상의 구축물, 또는 본 명세서에 기재된 라이브러리를 숙주 세포에 도입함으로써 숙주 세포에서 복수의 RNA를 편집하는 방법을 제공한다.

소정 실시형태에서, 타겟 RNA에 대한 편집 방법은 하나 이상의 타겟 RNA에서 하나 이상의 타겟 아데노신에 대해 탈아미노화 반응을 행하기 위해 RNA 아데노신 탈아미노효소(ADAR)를 리크루팅하도록 다수의 탈아미노효소-리크루팅 RNA 또는 다수의 탈아미노효소-리크루팅 RNA를 포함하는 하나 이상의 구축물을 숙주 세포에 도입하는 단계를 포함하고, 여기서 각각의 탈아미노효소-리크루팅 RNA는 대응하는 타겟 RNA에 상보적인 RNA 서열을 포함한다.

일 양태에서, 본 출원은 dRNA 또는 dRNA를 인코팅하는 구축물을 숙주 세포에 도입하는 단계를 포함하는, 숙주 세포(예를 들면 진핵 세포)에서 타겟 RNA에 의해 인코딩된 단백질 및/또는 타겟 RNA에서 하나 이상의 변형을 생성하는 방법을 제공하며, 여기서 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 여기서 하나 이상의 변형은 타겟 RNA에 의해 인코팅된 단백질의 점 돌연변이, 타겟 RNA에 의해 인코팅된 단백질의 잘못 접힘, 타겟 RNA에서의 조기 정지 코돈, 타겟 RNA에서의 비정상적 스플라이스 부위 및 타겟 RNA에서의 선택적 스플라이스 부위로 이루어진 군에서 선택된다.

일부 실시형태에서, 본 출원은 dRNA 또는 dRNA를 인코딩하는 구축물을 숙주 세포에 도입하는 단계를 포함하는, 숙주 세포(예를 들면 진핵 세포)에서 타겟 RNA 또는 타겟 RNA에 의해 인코딩된 단백질의 발현 또는 활성을 복원하는 방법을 제공하며, 여기서 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 여기서 타겟 RNA는 타겟 RNA에서 조기 정지 코돈, 비정상적 스플라이스 부위 또는 선택적 스플라이스 부위, 또는 단백질의 잘못 접힘을 야기하는 G로부터 A로의 돌연변이를 갖고, 여기서 dRNA는 A 돌연변이를 편집하기 위해 ADAR을 리크루팅함으로써, 타겟 RNA 또는 타겟 RNA에 의해 인코딩된 단백질의 발현 또는 활성을 복원시킨다.

소정 실시형태에서, 숙주 세포(예를 들면 진핵 세포)에서 타겟 RNA에 의해 인코딩된 단백질 및/또는 복수의 타겟 RNA에서 하나 이상의 변형을 생성하는 방법은, 복수의 탈아미노효소-리크루팅 RNA 또는 복수의 탈아미노효소-리크루팅 RNA를 인코딩하는 구축물을 숙주 세포에 도입하는 단계를 포함하고, 여기서 각각의 dRNA는 복수의 타겟 RNA에서 대응하는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 여기서 각각의 dRNA는 대응하는 타겟 A에서 타겟 A를 탈아미노화하도록 ADAR를 리크루팅할 수 있다.

일 양태에서, 본 출원은 숙주 세포에서 타겟 RNA를 편집하기 위해 본 명세서에 기재된 dRNA 중 어느 하나에 따른 탈아미노효소-리크루팅 RNA의 용도를 제공한다. 소정 실시형태에서, 탈아미노효소-리크루팅 RNA는 편집될 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함한다.

일 양태에서, 본 출원은 타겟 RNA 및/또는 타겟 RNA에 의해 인코딩된 단백질에 하나 이상의 변형을 생성하기 위해 본 명세서에 기재된 dRNA 중 어느 하나에 따른 탈아미노효소-리크루팅 RNA의 용도를 제공하며, 여기서 하나 이상의 변형은 타겟 RNA에 의해 인코딩된 단백질의 점 돌연변이, 타겟 RNA에 의해 인코딩된 단백질의 잘못 접힘, 타겟 RNA에서의 조기 정지 코돈, 타겟 RNA에서의 비정상적 스플라이스 부위, 및 타겟 RNA의 선택적 스플라이스 부위로 이루어진 군에서 선택된다. 소정 실시형태에서, 탈아미노효소-리크루팅 RNA는 편집될 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함한다.

또한, 본 발명은 타겟 RNA 서열에서 타겟 아데노신에 대한 탈아미노화 반응을 행하기 위해 자연적으로 내인성의 RNA 아데노신 탈아미노효소(ADAR)를 리크루팅하도록, 본 명세서에 기재된 바와 같은 dRNA 또는 dRNA를 인코팅하는 구축물을 진핵 세포에 도입하는 단계를 포함하는, 진핵 세포에서 타겟 RNA를 편집하기 위한 내인성 아데노신 탈아미노효소를 활용하는 방법에 관한 것이다.

본 명세서에 기재된 방법 또는 용도 중 어느 하나에 따른 소정 실시형태에서, dRNA는 약 40, 45, 50, 55, 60, 65, 70, 75, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240 또는 250개의 뉴클레오티드 중 어느 하나를 초과하여 포함한다. 소정 실시형태에서, dRNA는 약 40-260, 45-250, 50-240, 60-230, 65-220, 70-220, 70-210, 70-200, 70-190, 70-180, 70-170, 70-160, 70-150, 70-140, 70-130, 70-120, 70-110, 70-100, 70-90, 70-80, 75-200, 80-190, 85-180, 90-170, 95-160, 100-200, 100-150, 100-175, 110-200, 110-175, 110-150 또는 105-140개의 뉴클레오티드 길이 중 어느 하나이다. 일부 실시형태에서, dRNA는 약 71개의 뉴클레오티드 길이이다. 일부 실시형태에서, dRNA는 약 111개의 뉴클레오티드 길이이다.

본 명세서에 기재된 방법 또는 용도 중 어느 하나에 따른 소정 실시형태에서, dRNA는 ADAR-리크루팅 도메인을 포함하지 않는다. "ADAR-리크루팅 도메인"은 ADAR에 높은 친화성으로 결합하는 뉴클레오티드 서열 또는 구조, 또는 조작된 ADAR 구축물에서 ADAR에 융합된 결합 파트너에 결합하는 뉴클레오티드 서열일 수 있다. 예시적인 ADAR-리크루팅 도메인은, 이에 한정되는 것은 아니지만, GluR-2, GluR-B(R/G), GluR-B(Q/R), GluR-6(R/G), 5HT2C 및 FlnA(Q/R) 도메인을 들 수 있고; 예를 들면 그 전체가 본 명세서에 참조로 포함된 Wahlstedt, Helene 및 Marie, "Site-selective vs promiscuous A-to-I editing." Wiley Interdisciplinary Reviews:RNA 2.6(2011): 761-771을 참조한다. 일부 실시형태에서, dRNA는 이중 가닥 부분을 포함하지 않는다. 일부 실시형태에서, dRNA는 MS2 스템 루프와 같은 헤어핀을 포함하지 않는다. 일부 실시형태에서, dRNA는 단일 가닥이다. 일부 실시형태에서, ADAR은 DSB-결합 도메인을 포함하지 않는다. 일부 실시형태에서, dRNA는 상보적 RNA 서열로 이루어진다(또는 본질적으로 이루어진다).

본 명세서에 기재된 방법 또는 용도 중 어느 하나에 따른 소정 실시형태에서, dRNA는 화학적 변형을 포함하지 않는다. 일부 실시형태에서, dRNA는 화학 수식된 뉴클레오티드, 예를 들면 2'-O-메틸 뉴클레오티드 또는 포스포로티오에이트 연결을 갖는 뉴클레오티드를 포함하지 않는다. 일부 실시형태에서, dRNA는 처음 3개 및 마지막 3개의 잔기에서만 2'-O-메틸 및 포스포로티오에이트 연결 수식을 포함한다. 일부 실시형태에서, dRNA는 안티센스 올리고뉴클레오티드(ASO)가 아니다.

본 명세서에 기재된 방법 또는 용도 중 어느 하나에 따른 소정 실시형태에서, 숙주 세포는 원핵 세포이다. 일부 실시형태에서, 숙주 세포는 진핵 세포이다. 일부 실시형태에서, 숙주 세포는 포유류 세포이다. 일부 실시형태에서, 숙주 세포는 인간 세포이다. 일부 실시형태에서, 숙주 세포는 뮤린 세포이다. 일부 실시형태에서, 숙주 세포는 식물 세포 또는 진균 세포이다.

본 명세서에 기재된 방법 또는 용도 중 어느 하나에 따른 일부 실시형태에서, 숙주 세포는 HEK293T, HT29, A549, HepG2, RD, SF268, SW13 및 HeLa 세포와 같은 세포주이다. 일부 실시형태에서, 숙주 세포는 섬유아세포, 상피 세포 또는 면역 세포와 같은 1차 세포이다. 일부 실시형태에서, 숙주 세포는 T 세포이다. 일부 실시형태에서, 숙주 세포는 유사분열 후 세포이다. 일부 실시형태에서, 숙주 세포는 뇌 세포, 예를 들면 소뇌 세포와 같은 중추 신경계(CNS)의 세포이다.

일부 실시형태에서, dRNA 또는 dRNA를 인코딩하는 구축물을 숙주 세포에 도입하는 단계를 포함하는 1차 숙주 세포(예를 들면 T 세포 또는 CNS 세포)에서 타겟 RNA를 편집하는 방법이 제공되며, 여기서 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 여기서 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하도록 숙주 세포의 내인적으로 발현된 ADAR을 리크루팅한다.

본 명세서에 기재된 방법 또는 용도 중 어느 하나에 따른 소정 실시형태에서, ADAR은 숙주 세포에 대해 내인성이다. 일부 실시형태에서, RNA 아데노신 탈아미노효소(ADAR)는 숙주 세포에 자연적으로 또는 내인적으로 존재하며, 예를 들면 진핵 세포에 자연적으로 또는 내인적으로 존재한다. 일부 실시형태에서, ADAR은 숙주 세포에 의해 내인적으로 발현된다. 소정 실시형태에서, ADAR은 숙주 세포에 외인적으로 도입된다. 일부 실시형태에서, ADAR은 ADAR1 및/또는 ADAR2이다. 소정 실시형태에서, ADAR은 hADAR1, hADAR2, 마우스 ADAR1 및 ADAR2로 이루어진 군에서 선택된 하나 이상의 ADAR이다. 일부 실시형태에서, ADAR은 ADAR1의 p110 이소폼("ADAR1^p110") 및/또는 ADAR1의 p150 이소폼("ADAR1^p150")과 같은 ADAR1이다. 일부 실시형태에서, ADAR은 ADAR2이다. 일부 실시형태에서, ADAR은 숙주 세포에 의해 발현되는 ADAR2, 예를 들면 소뇌 세포에 의해 발현되는 ADAR2이다.

일부 실시형태에서, ADAR은 숙주 세포에 대해 외인성인 ADAR이다. 일부 실시형태에서, ADAR은 자연 발생 ADAR의 과활성 돌연변이체이다. 일부 실시형태에서, ADAR은 E1008Q 돌연변이를 포함하는 ADAR1이다. 일부 실시형태에서, ADAR은 결합 도메인을 포함하는 융합 단백질이 아니다. 일부 실시형태에서, ADAR은 조작된 이중 가닥 핵산 결합 도메인을 포함하지 않는다. 일부 실시형태에서, ADAR은 dRNA에서 상보적 RNA 서열에 융합되는 MS2 헤어핀에 결합하는 MCP 도메인을 포함하지 않는다. 일부 실시형태에서, ADAR은 DSB-결합 도메인을 포함하지 않는다.

본 명세서에 기재된 방법 또는 용도 중 어느 하나에 따른 일부 실시형태에서, 숙주 세포는 ADAR1의 높은 발현 수준(예를 들면 ADAR1^p110 및/또는 ADAR1^p150), 예를 들면 β-튜불린의 단백질 발현 수준에 비해 적어도 약 10%, 20%, 50%, 100%, 2x, 3x, 5x 또는 그 이상을 갖는다. 일부 실시형태에서, 숙주 세포는 ADAR2의 높은 발현 수준, 예를 들면 β-튜불린의 단백질 발현 수준에 대해 적어도 약 10%, 20%, 50%, 100%, 2x, 3x, 5x 또는 그 이상 중 어느 하나를 갖는다. 일부 실시형태에서, 숙주 세포는 ADAR3의 낮은 발현 수준, 예를 들면 β-튜불린의 단백질 발현 수준에 대해 약 5x, 3x, 2x, 100%, 50%, 20% 또는 그 이하 중 어느 하나를 갖는다.

본 명세서에 기재된 방법 또는 용도 중 어느 하나에 따른 소정 실시형태에서, 상보적 RNA 서열은 타겟 RNA에서 타겟 A에 정반대쪽에 시티딘, 아데노신 또는 우리딘을 포함한다. 일부 실시형태에서, 상보적 RNA 서열은 타겟 RNA에서 타겟 A의 정반대쪽에 시티딘 미스매치를 포함한다. 일부 실시형태에서, 시티딘 미스매치는 상보적 RNA 서열의 5' 말단으로부터 적어도 5개의 뉴클레오티드, 예를 들면 적어도 10, 15, 20, 25, 30개 또는 그 이상의 뉴클레오티드 이간되어 위치한다. 일부 실시형태에서, 시티딘 미스매치는 상보적 RNA 서열의 3' 말단으로부터 적어도 20개의 뉴클레오티드, 예를 들면 적어도 25, 30, 35개 또는 그 이상의 뉴클레오티드 이간되어 위치한다. 일부 실시형태에서, 시티딘 미스매치는 상보적 RNA 서열의 3' 말단으로부터 20개의 뉴클레오티드 이내(예를 들면 15, 10, 5개 이하)에 이간되어 위치되지 않는다. 일부 실시형태에서, 시티딘 미스매치는 상보적 RNA 서열의 3' 말단으로부터 적어도 20개의 뉴클레오티드(예를 들면 적어도 25, 30, 35개 또는 그 이상의 뉴클레오티드) 및 5' 말단으로부터 적어도 5개의 뉴클레오티드(예를 들면 적어도 10, 15, 20, 25, 30개 또는 그 이상의 뉴클레오티드) 이간되어 위치한다. 일부 실시형태에서, 시티딘 미스매치는 상보적 RNA 서열의 중심에 위치된다. 일부 실시형태에서, 시티딘 미스매치는 dRNA에서 상보적 서열의 중심의 20개의 뉴클레오티드 (예를 들면 15, 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1개의 뉴클레오티드) 이내에 위치한다.

본 명세서에 기재된 방법 또는 용도 중 어느 하나에 따른 소정 실시형태에서, 상보적 RNA 서열은 타겟 RNA에서 비타겟 아데노신에 각각 정반대쪽에 있는, 각각 1, 2, 3, 4, 5, 6개 또는 그 이상의 G와 같은 하나 이상의 구아노신(들)을 추가로 포함한다. 일부 실시형태에서, 상보적 RNA 서열은 타겟 RNA에서 비타겟 아데노신의 정반대쪽에 있는 2개 이상의 연속한 미스매치 뉴클레오티드(예를 들면 2, 3, 4, 5개 또는 그 이상의 미스매치 뉴클레오티드)를 포함한다. 일부 실시형태에서, 타겟 RNA는 약 20개 이하의 비타겟 A, 예를 들면 약 15, 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1개 이하의 비타겟 A 중 어느 하나를 포함한다. 비타겟 A 반대쪽에 있는 G 및 연속한 미스매치 뉴클레오티드는 ADAR에 의한 오프-타겟 편집 효과를 감소시킬 수 있다.

본 명세서에 기재된 방법 또는 용도 중 어느 하나에 따른 소정 실시형태에서, 타겟 A의 5' 최근접 이웃은 U, C, A 및 G에서 선택된 뉴클레오티드이며, 선호도는 U>C≒A>G이고, 또한 타겟 A의 3' 최근접 이웃은 G, C, A 및 U에서 선택된 뉴클레오티드이고, 선호도는 G>C>A≒U이다. 소정 실시형태에서, 타겟 A는 타겟 RNA에서 UAG, UAC, UAA, UAU, CAG, CAC, CAA, CAU, AAG, AAC, AAA, AAU, GAG, GAC, GAA 및 GAU로 이루어진 군에서 선택된 3-염기 모티프로 되어 있다. 소정 실시형태에서, 3-염기 모티프는 UAG이고, dRNA는 3-염기 모티프에서 U의 정반대쪽에 A, 타겟 A의 정반대쪽에 C, 및 G의 정반대쪽에 C, G 또는 U를 포함한다. 소정 실시형태에서, 3-염기 모티프는 타겟 RNA에서 UAG이고, dRNA는 타겟 RNA의 UAG의 반대쪽에 ACC, ACG 또는 ACU를 포함한다. 소정 실시형태에서, 3-염기 모티프는 타겟 RNA에서 UAG이고, dRNA는 타겟 RNA의 UAG의 반대쪽에 ACC를 포함한다.

본 명세서에 기재된 방법 또는 용도 중 어느 하나에 따른 소정 실시형태에서, 타겟 RNA는 프리메신저 RNA, 메신저 RNA, 리보솜 RNA, 트랜스퍼 RNA, 긴 논코딩 RNA 및 작은 RNA(예를 들면 miRNA)로 이루어진 군에서 선택되는 어느 하나이다. 일부 실시형태에서, 타겟 RNA는 프리메신저 RNA이다. 일부 실시형태에서, 타겟 RNA는 메신저 RNA이다.

본 명세서에 기재된 방법 또는 용도 중 어느 하나에 따른 소정 실시형태에서, 상기 방법은 ADAR3의 억제제를 숙주 세포에 도입하는 단계를 추가로 포함한다. 일부 실시형태에서, ADAR3의 억제제는 ADAR3에 대한 shRNA 또는 ADAR3에 대한 siRNA와 같은 ADAR3에 대한 RNAi이다. 일부 실시형태에서, 상기 방법은 숙주 세포에 인터페론 자극제를 도입하는 단계를 추가로 포함한다. 일부 실시형태에서, ADAR은 인터페론에 의해 유도될 수 있으며, 예를 들면 ADAR은 ADAR^p150이다. 일부 실시형태에서, 인터페론의 자극제는 IFNα이다. 일부 실시형태에서, ADAR3 억제제 및/또는 인터페론의 자극제는 dRNA를 인코딩하는 동일한 구축물(예를 들면 벡터)에 의해 인코딩된다.

본 명세서에 기재된 방법 또는 용도 중 어느 하나에 따른 소정 실시형태에서, 타겟 RNA의 편집 효율은 적어도 약 5%, 예를 들면 적어도 약 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65% 또는 그 이상 중 어느 하나이다. 일부 실시형태에서, 타겟 RNA의 편집 효율은 생체내(in vivo), 예를 들면 동물에서 적어도 약 5%(예를 들면 적어도 약 7%)이다. 일부 실시형태에서, 타겟 RNA의 편집 효율은 시험관내(in vitro) 또는 생체외(ex vivo) 세포에서 적어도 약 10%(예를 들면 적어도 약 15%)이다. 일부 실시형태에서, 편집 효율은 생어(생어) 시퀀싱에 의해 결정된다. 일부 실시형태에서, 편집 효율은 차세대 시퀀싱(next-generation sequencing)에 의해 결정된다.

본 명세서에 기재된 방법 또는 용도 중 어느 하나에 따른 소정 실시형태에서, 상기 방법은 낮은 오프-타겟 편집률을 갖는다. 일부 실시형태에서, 상기 방법은 타겟 RNA에서 비타겟 As에 대해 약 1% 미만(예를 들면 약 0.5%, 0.1%, 0.05%, 0.01%, 0.001% 또는 그 이하 중 어느 하나)의 편집 효율을 갖는다. 일부 실시형태에서, 상기 방법은 타겟 RNA에서 비타겟 As를 편집하지 않는다. 일부 실시형태에서, 상기 방법은 비타겟 RNA에서 As에 대해 약 0.1% 미만(예를 들면 약 0.05%, 0.01%, 0.005%, 0.001%, 0.0001% 또는 그 이하 중 어느 하나)의 편집 효율을 갖는다.

본 명세서에 기재된 방법 또는 용도 중 어느 하나에 따른 소정 실시형태에서, 상기 방법은 선천적 면역 반응과 같은 면역 반응을 유도하지 않는다. 일부 실시형태에서, 상기 방법은 숙주 세포에서 인터페론 및/또는 인터루킨 발현을 유도하지 않는다. 일부 실시형태에서, 상기 방법은 숙주 세포에서 IFN-β 및/또는 IL-6 발현을 유도하지 않는다.

또한, 본 명세서에 기재된 방법 중 어느 하나에 의해 생성된 편집된 편집된 RNA 또는 RNA를 갖는 숙주 세포가 제공된다. 일부 실시형태에서, 편집된 RNA는 이노신을 포함한다. 일부 실시형태에서, 숙주 세포는 미스센스 돌연변이, 조기 정지 코돈, 선택적 스플라이스 부위 또는 비정상적 스플라이스 부위를 갖는 RNA를 포함한다. 일부 실시형태에서, 숙주 세포는 돌연변이, 절단된 또는 잘못 접힌 단백질을 포함한다.

본 명세서에 기재된 바와 같은 "숙주 세포"는 본 명세서에 기재된 바와 같이 변형될 수 있는 한 숙주 세포로서 사용될 수 있는 임의의 세포 유형을 지칭한다. 예를 들면, 숙주 세포는 내인적으로 발현된 RNA 아데노신 탈아미노효소(ADAR)를 갖는 숙주 세포일 수 있고, 또는 RNA 아데노신 탈아미노효소(ADAR)가 당업계에 공지된 방법으로 도입된 숙주 세포일 수 있다. 예를 들면, 숙주 세포는 원핵 세포, 진핵 세포 또는 식물 세포일 수 있다. 일부 실시형태에서, 숙주 세포는 인간 세포주를 포함한 포유동물 세포주 또는 비인간 세포주와 같은 사전 확립된 세포주로부터 유래된다. 일부 실시형태에서, 숙주 세포는 인간 개체와 같은 개체로부터 유래된다.

본 명세서에서 사용되는 "도입하는" 또는 "도입"은 dRNA 또는 본 명세서에 기재된 벡터를 포함하는 하나 이상의 구축물, 그 하나 이상의 전사물과 같은 하나 이상의 폴리뉴클레오티드를 숙주 세포에 전달하는 것을 의미한다. 본 발명은 RNA, 예를 들면 프리메신저 RNA, 메신저 RNA, 리보솜 RNA, 트랜스퍼 RNA, 긴 논코딩 RNA 및 작은 RNA(예를 들면 miRNA)의 타겟팅된 편집을 가능하게 하기 위한 기본 플랫폼으로 사용된다. 본 출원의 방법은, 이에 한정되는 것은 아니지만, 바이러스, 리포솜, 전기천공, 미세주입 및 콘쥬게이션을 포함한 많은 전달 시스템을 채용하여, 본 명세서에 기재된 바와 같은 dRNA 또는 구축물을 숙주 세포에의 도입을 달성할 수 있다. 종래의 바이러스 및 비바이러스 기반 유전자 전달 방법이 핵산을 포유류 세포 또는 타겟 조직에 도입하기 위해 사용될 수 있다. 이러한 방법은 본 출원의 dRNA를 인코딩하는 핵산을 배양 세포 또는 숙주 유기체에 투여하기 위해 사용될 수 있다. 비바이러스 벡터 전달 시스템은 DNA 플라스미드, RNA(예를 들면 본 명세서에 기재된 구축물의 전사물), 네이키드 핵산, 및 리포솜과 같은 전달 비히클과 복합체화된 핵산을 포함한다. 바이러스 벡터 전달 시스템은 숙주 세포로 전달하기 위한 에피솜 또는 통합된 게놈을 가진 DNA 및 RNA 바이러스를 포함한다.

핵산의 비바이러스 전달 방법은 리포펙션, 뉴클레오펙션, 미세주입, 바이오리스틱스(biolistics) , 비로좀(virosome), 리포좀, 면역리포좀, 폴리양이온 또는 지질:핵산 콘쥬게이트, 전기천공, 나노입자, 엑소좀, 미세소포(microvesicle) 또는 유전자 총, 네이키드 DNA 및 인공 비리온을 포함한다.

핵산의 전달을 위한 RNA 또는 DNA 바이러스 기반 시스템의 사용은 바이러스를 특정 세포에 타겟팅하고 바이러스 페이로드를 세포핵으로 트래피킹(trafficking)하는데 높은 효율을 갖는다.

본 명세서에 기재된 방법 또는 용도 중 어느 하나에 따른 소정 실시형태에서, 상기 방법은 dRNA를 인코딩하는 바이러스 벡터(예를 들면 렌티바이러스 벡터)를 숙주 세포에 도입하는 단계를 포함한다. 일부 실시형태에서, 바이러스 벡터는 AAV, 예를 들면 AAV8이다. 일부 실시형태에서, 상기 방법은 dRNA를 인코딩하는 플라스미드를 숙주 세포에 도입하는 단계를 포함한다. 일부 실시형태에서, 상기 방법은 dRNA(예를 들면 합성 dRNA)를 숙주 세포에 도입(예를 들면 전기천공에 의해)하는 단계를 포함한다. 일부 실시형태에서, 상기 방법은 dRNA의 숙주 세포로의 형질감염을 포함한다.

탈아미노화 후, 타겟 RNA 및/또는 타겟 RNA에 의해 인코팅된 단백질의 변형은 타겟 RNA에서 타겟팅된 아데노신의 위치에 따라 상이한 방법을 사용하여 결정될 수 있다. 예를 들면 타겟 RNA에서 "A"가 "I"로 편집되었는지 여부를 결정하기 위해, 당업계에 공지된 RNA 시퀀싱 방법을 사용하여 RNA 서열의 변형을 검출할 수 있다. 타겟 아데노신이 mRNA의 코딩 영역에 위치하는 경우, RNA 편집은 mRNA에 의해 인코딩된 아미노산 서열에 변화를 일으킬 수 있다. 예를 들면, 점 돌연변이는 mRNA에서의 선천적 또는 후천적 점 돌연변이의 mRNA에 도입될 수 있으며, "A"가 "I"로 전환되기 때문에 야생형 유전자 산물(들)을 생성하기 위해 역전될 수 있다. 당업계에 공지된 방법에 의한 아미노산 시퀀싱을 사용하여 인코팅된 단백질에서 아미노산 잔기의 임의의 변화를 찾을 수 있다. 정지 코돈의 변형은 기능적, 연장된, 절단된, 전장 및/또는 야생형 단백질의 존재를 평가함으로써 결정될 수 있다. 예를 들면, 타겟 아데노신이 UGA, UAG 또는 UAA 정지 코돈에 위치하면, 타겟 A(UGA 또는 UAG) 또는 As(UAA)의 변형은 리드 스루 돌연변이(read through mutation) 및/또는 연장된 단백질을 생성할 수 있고, 또는 타겟 RNA에 의해 인코딩된 절단된 단백질은 기능적, 전장 및/또는 야생형 단백질을 생성하도록 역전될 수 있다. 또한, 타겟 RNA의 편집은 타겟 RNA에서 비정상적 스플라이스 부위 및/또는 선택적 스플라이스 부위를 생성할 수 있으며, 따라서 연장된, 절단된 또는 잘못 접힌 단백질, 또는 타겟 RNA에서 인코딩된 비정상적 스플라이싱 또는 선택적 스플라이싱 부위가 기능적, 제대로 접힌, 전체 길이 및/또는 야생형 단백질을 생성하도록 역전될 수 있게 한다. 일부 실시형태에서, 본 출원은 선천적 및 후천적 유전적 변화 모두, 예를 들면 미스센스 돌연변이, 조기 정지 코돈, 타겟 RNA에 의해 인코팅된 비정상적 스플라이싱 또는 선택적 스플라이싱 부위의 편집을 고려한다. 타겟 RNA에 의해 인코팅된 단백질의 기능을 평가하기 위한 공지된 방법을 사용하면, RNA 편집이 소망하는 효과를 달성하는지의 여부를 확인할 수 있다. 아데노신(A)에서 이노신(I)으로의 탈아미노화는 단백질을 인코팅하는 돌연변이 RNA의 타겟 위치에서 돌연변이된 A를 교정할 수 있기 때문에, 이노신으로의 탈아미노화의 식별은 기능적 단백질이 존재하는지의 여부, 또는 돌연변이된 아데노신의 존재에 의해 야기된 질환 또는 약물 내성 관련 RNA가 역전 또는 부분적으로 역전되었는지의 여부에 대한 평가를 제공할 수 있다. 마찬가지로, 아데노신(A)의 이노신(I)으로의 탈아미노화는 얻어지는 단백질에 점 돌연변이가 도입될 수 있기 때문에, 이노신으로의 탈아미노화의 식별은 질환의 원인 또는 질환의 관련 요인을 식별하기 위한 기능적 표시를 제공할 수 있다.

타겟 아데노신의 존재로 인해 비정상적 스플라이싱이 발생하면, 판독값은 비정상적 스플라이싱의 발생 및 빈도의 평가일 수 있다. 한편, 스플라이스 부위를 도입하기 위해 타겟 아데노신의 탈아미노화가 바람직한 경우, 유사한 접근 방식을 사용하여 필요한 유형의 스플라이싱이 발생하는지의 여부를 체크할 수 있다. 타겟 아데노신의 탈아미노화 후 이노신의 존재를 확인하기 위한 예시적인 적절한 방법은 당업자에게 잘 알려진 방법을 사용한 RT-PCR 및 시퀀싱이다.

타겟 아데노신(들)의 탈아미노화 효과는, 예를 들면 얻어진 단백질의 점 돌연변이, 조기 정지 코돈, 비정상적 스플라이스 부위, 선택적 스플라이스 부위 및 잘못 접힘을 포함한다. 이들 효과는 유전적으로 유전되거나 또는 후천적인 유전적 돌연변이에 의해 야기되는 질환과 관련된 RNA 및/또는 단백질의 구조적 및 기능적 변화를 유도할 수 있고, 또는 약물 내성 발생과 관련된 RNA 및/또는 단백질의 구조적 및 기능적 변화를 유도할 수 있다. 따라서, 본 출원의 dRNA, dRNA를 인코딩하는 구축물 및 RNA 편집 방법은 질환 관련 RNA 및/또는 단백질의 구조 및/또는 기능을 변경함으로써 유전성 유전 질환 또는 상태, 또는 후천적인 유전적 돌연변이와 관련된 질환 또는 상태의 예방 또는 치료에 사용될 수 있다.

일부 실시형태에서, 타겟 RNA는 조절 RNA이다. 일부 실시형태에서, 편집될 타겟 RNA는 리보솜 RNA, 트랜스퍼 RNA, 긴 논코딩 RNA 또는 작은 RNA(예를 들면 miRNA, pri-miRNA, pre-miRNA, piRNA, siRNA, snoRNA, snRNA, exRNA 또는 scaRNA)이다. 타겟 아데노신의 탈아미노화의 효과는, 예를 들면 3차원 구조의 변화 및/또는 타겟 RNA의 기능의 손실 또는 증가를 포함한, 리보솜 RNA, 트랜스퍼 RNA, 긴 논코딩 RNA 또는 작은 RNA(예를 들면 miRNA)의 구조적 및 기능적 변화를 포함한다. 일부 실시형태에서, 타겟 RNA에서의 타겟 As의 탈아미노화는 타겟 RNA의 하나 이상의 하류 분자(예를 들면 단백질, RNA 및/또는 대사산물)의 발현 수준을 변화시킨다. 하류 분자의 발현 수준의 변화는 발현 수준의 증가 또는 감소일 수 있다.

본 출원의 일부 실시형태는 타겟 유전자의 상이한 변이 또는 숙주 세포에서 상이한 유전자를 스크리닝하는데 유용한, 숙주 세포에서의 타겟 RNA의 다중 편집을 수반한다. 일부 실시형태에서, 상기 방법은 복수의 dRNA를 숙주 세포에 도입하는 단계를 포함하고, 복수의 dRNA 중 적어도 2개의 dRNA는 상이한 서열을 갖고 및/또는 상이한 타겟 RNA를 갖는다. 일부 실시형태에서, 각각의 dRNA는 상이한 서열 및/또는 상이한 타겟 RNA를 갖는다. 일부 실시형태에서, 상기 방법은 숙주 세포에서의 단일 타겟 RNA에서 복수(예를 들면 적어도 2, 3, 5, 10, 50, 100, 1000개 또는 그 이상)의 변형을 생성한다. 일부 실시형태에서, 상기 방법은 숙주 세포에서의 복수(예를 들면 적어도 2, 3, 5, 10, 50, 100, 1000개 또는 그 이상)의 타겟 RNA에서 변형을 생성한다. 일부 실시형태에서, 상기 방법은 복수의 숙주 세포 집단에서 복수의 타겟 RNA를 편집하는 단계를 포함한다. 일부 실시형태에서, 숙주 세포의 각각의 집단은 다른 숙주 세포의 집단과는 다른 dRNA 또는 상이한 타겟 RNA를 갖는 dRNA를 수용한다.

탈아미노효소- 리크루팅 RNA, 구축물 및 라이브러리

일 양태에서, 본 출원은 본 명세서에 기재된 방법 중 어느 하나에 유용한 탈아미노효소-리크루팅 RNA를 제공한다. 이 섹션에 설명된 dRNA 중 어느 하나는 본 명세서에 기재된 RNA 편집 및 치료 방법에 사용될 수 있다. dRNA에 대해 본 명세서에 기재된 임의의 특징 및 파라미터는 마치 각각의 모든 조합이 개별적으로 기재된 것처럼 서로 조합될 수 있다는 것을 의도한다. 본 명세서에 기재된 dRNA는 CRISPR/Cas 시스템에서 사용되는 tracrRNA, crRNA 또는 gRNA를 포함하지 않는다.

일부 실시형태에서, 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하는, ADAR을 리크루팅함으로써 타겟 RNA에서 타겟 아데노신의 탈아미노화를 위한 탈아미노효소-리크루팅 RNA(dRNA)가 제공된다.

일 양태에서, 본 발명은 본 명세서에 기재된 탈아미노효소-리크루팅 RNA 중 어느 하나를 포함하는 구축물을 제공한다. 소정 실시형태에서, 구축물은 바이러스 벡터(예를 들면 렌티바이러스 벡터) 또는 플라스미드이다. 일부 실시형태에서, 바이러스 벡터는 AAV8과 같은 AAV이다. 일부 실시형태에서, 구축물은 단일 dRNA를 인코딩한다. 일부 실시형태에서, 구축물은 복수(예를 들면 약 1, 2, 3, 4, 5, 10, 20개 또는 그 이상 중 어느 하나)의 dRNA를 인코딩한다.

일 양태에서, 본 출원은 본 명세서에 기재된 복수의 탈아미노효소-리크루팅 RNA 또는 복수의 구축물을 포함하는 라이브러리를 제공한다.

일 양태에서, 본 출원은 본 명세서에 기재된 탈아미노효소-리크루팅 RNA 또는 구축물을 포함하는 조성물 또는 숙주 세포를 제공한다. 소정 실시형태에서, 숙주 세포는 원핵 세포 또는 진핵 세포이다. 바람직하게는, 숙주 세포는 포유류 세포이다. 가장 바람직하게는, 숙주 세포는 인간 세포이다.

본 명세서에 기재된 dRNA, 구축물, 라이브러리 또는 조성물 중 어느 하나에 따른 소정 실시형태에서, 상보적 RNA 서열은 타겟 RNA에서 편집될 타겟 아데노신의 정반대쪽에 시티딘, 아데노신 또는 우리딘을 포함한다. 소정 실시형태에서, 상보적 RNA 서열은 타겟 RNA에서 비타겟 아데노신 각각의 정반대쪽에 하나 이상의 구아노신(들)을 추가로 포함한다. 소정 실시형태에서, 타겟 A의 5' 최근접 이웃은 U, C, A 및 G에서 선택된 뉴클레오티드이며, 선호도는 U＞C≒A>G이고, 타겟 RNA 서열의 3' 최근접 이웃은 G, C, A 및 U에서 선택된 뉴클레오티드이고, 선호도는 G>C＞A≒U이다. 일부 실시형태에서, 타겟 A의 5' 최근접 이웃은 U이다. 일부 실시형태에서, 타겟 A의 5' 최근접 이웃은 C 또는 A이다. 일부 실시형태에서, 타겟 A의 3' 최근접 이웃은 G이다. 일부 실시형태에서, 타겟 A의 3' 최근접 이웃은 C이다.

본 명세서에 기재된 dRNA, 구축물, 라이브러리 또는 조성물 중 어느 하나에 따른 소정 실시형태에서, 타겟 A는 타겟 RNA에서 UAG, UAC, UAA, UAU, CAG, CAC, CAA, CAU, AAG, AAC, AAA, AAU, GAG, GAC, GAA 및 GAU로 이루어진 군에서 선택된 3-염기 모티프로 되어 있다. 소정 실시형태에서, 3-염기 모티프는 UAG이고, dRNA는 3-염기 모티프에서 U의 정반대쪽에 A, 타겟 A의 정반대쪽에 C, 및 3-염기 모티프에서 G의 정반대쪽에 C, G 또는 U를 포함한다. 소정 실시형태에서, 3-염기 모티프는 타겟 RNA에서 UAG이고, dRNA는 타겟 RNA의 UAG의 반대쪽에 있는 ACC, ACG 또는 ACU를 포함한다.

일부 실시형태에서, dRNA는 타겟 RNA에서 타겟 A의 정반대쪽에 시티딘 미스매치를 포함한다. 일부 실시형태에서, 시티딘 미스매치는 상보적 RNA 서열의 중심으로부터 20, 15, 10, 5, 4, 3, 2 또는 1개의 뉴클레오티드 이내에서 이간된 것과 같이 상보적 RNA 서열의 중심에 가깝다. 일부 실시형태에서, 시티딘 미스매치는 상보적 RNA 서열의 5' 말단으로부터 적어도 5개의 뉴클레오티드 이간되어 있다. 일부 실시형태에서, 시티딘 미스매치는 상보적 RNA 서열의 3' 말단으로부터 적어도 20개의 뉴클레오티드 이간되어 있다.

본 명세서에 기재된 dRNA, 구축물, 라이브러리 또는 조성물 중 어느 하나에 따른 소정 실시형태에서, dRNA는 약 40, 45, 50, 55, 60, 65, 70, 75, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240 또는 250개의 뉴클레오티드 초과 중 어느 하나를 포함한다. 소정 실시형태에서, dRNA는 약 40-260, 45-250, 50-240, 60-230, 65-220, 70-210, 70-200, 70-190, 70-180, 70-170, 70-160, 70-150, 70-140, 70-130, 70-120, 70-110, 70-100, 70-90, 70-80, 75-200, 80-190, 85-180, 90 -170, 95-160, 100-150 또는 105-140개의 뉴클레오티드 길이 중 어느 하나이다.

일부 실시형태에서, dRNA는 서열 번호 25-44, 142-205, 341-342 중 어느 하나의 핵산 서열을 포함한다.

본 출원의 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함한다. 상보적 RNA 서열은 상보적 RNA 서열을 타겟 RNA에 혼성화할 수 있도록 타겟 RNA에 대해 완벽하게 상보적이거나 또는 실질적으로 상보적이다. 일부 실시형태에서, 상보적 RNA 서열은 타겟 RNA로서 100% 서열 상보성을 갖는다. 일부 실시형태에서, 상보적 RNA 서열은 타겟 RNA에서의 적어도 약 20, 40, 60, 80, 100, 150, 200개 또는 그 이상의 뉴클레오티드 중 어느 하나의 연속적인 신장에 걸쳐, 적어도 약 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 또는 그 이상 중 어느 하나의 상보적이다. 일부 실시형태에서, 상보적 RNA 서열과 타겟 RNA 사이의 혼성화에 의해 형성된 dsRNA는 하나 이상(예를 들면 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상)의 비-왓슨-크릭 염기쌍(즉, 미스매치)을 갖는다.

ADAR, 예를 들면 인간 ADAR 효소는 다수의 인자에 따라 다양한 특이성을 가진 이중 가닥 RNA(dsRNA) 구조를 편집한다. 한 가지 중요한 인자는 dsRNA 서열을 구성하는 두 가닥의 상보성의 정도이다. dRNA와 타겟 RNA 사이의 완벽한 상보성은 일반적으로 ADAR의 촉매 도메인이 비차등적 방식으로 아데노신을 탈아미노화하게한다. ADAR의 특이성과 효율은 dsRNA 영역에 미스매치를 도입함으로써 변경될 수 있다. 예를 들면, 바람직하게는 편집할 아데노신의 탈아미노화의 특이성과 효율을 증가시키기 위해서는 A-C 미스매치가 권장된다. 반대로, 타겟 A가 아닌 다른 A(아데노신) 위치(즉, "비타겟 A")에서, G-A 미스매치는 오프-타겟 편집을 저감시킬 수 있다. dRNA와 타겟 RNA 사이에 dsRNA의 혼성화 및 형성을 위해 실질적인 상보성이 있다면, dRNA와 그 타겟 RNA 사이에 dsRNA 형성을 위해 완벽한 상보성이 반드시 필요한 것은 아니다. 일부 실시형태에서, dRNA 서열 또는 그 단일 가닥 RNA 영역은, 최적으로 정렬된 경우, 적어도 약 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 중 어느 하나의 타겟 RNA에 대한 서열 상보성을 갖는다. 최적의 정렬은 서열 정렬을 위한 임의의 적합한 알고리즘을 사용하여 결정될 수 있으며, 그 비한정적인 예로는 스미스-워터만(Smith-Waterman) 알고리즘, 니들만 브니쉬(Needleman-Wunch) 알고리즘, 버로우즈-휠러 변환(Burrows-Wheeler Transform) 기반 알고리즘(예를 들면 버로우즈 휠러 얼라이너)을 들 수 있다.

또한, 타겟 아데노신에 이웃한 뉴클레오티드는 탈아미노화의 특이성 및 효율에 영향을 미친다. 예를 들면, 타겟 RNA 서열에서 편집할 타겟 아데노신의 5' 최근접 이웃은 U>C≒A>G의 선호도를 갖고, 타겟 RNA 서열에서 편집할 타겟 아데노신의 3' 최근접 이웃은 아데노신의 탈아미노화의 특이성 및 효율의 측면에서 G>C>A≒U의 선호도를 갖는다. 일부 실시형태에서, 타겟 아데노신이 타겟 RNA에서 UAG, UAC, UAA, UAU, CAG, CAC, CAA, CAU, AAG, AAC, AAA, AAU, GAG, GAC, GAA 및 GAU로 이루어진 군에서 선택된 3-염기 모티프로 있을 경우, 아데노신의 탈아미노화의 특이성 및 효율은 다른 3-염기 모티프에서의 아데노신보다 높다. 일부 실시형태에서, 편집될 타겟 아데노신이 3-염기 모티프 UAG, UAC, UAA, UAU, CAG, CAC, AAG, AAC 또는 AAA로 있을 경우, 아데노신의 탈아미노화 효율은 다른 모티프의 아데노신보다 훨씬 더 높다. 동일한 3-염기 모티프와 관련하여, 상이한 디자인의 dRNA는 또한 상이한 탈아미노화 효율로 이어질 수 있다. 3-염기 모티프 UAG를 예로 들면, 일부 실시형태에서, dRNA가 편집될 타겟 아데노신의 정반대쪽에 시티딘(C), 우리딘 정반대쪽에 아데노신(A), 및 구아노신 정반대쪽에 시티딘(C), 구아노신(G) 또는 우리딘(U)을 포함하는 경우, 타겟 아데노신의 탈아미노화의 효율이 다른 dRNA 서열을 사용하는 것보다 높다. 일부 실시형태에서, dRNA가 타겟 RNA의 UAG 반대쪽에 ACC, ACG 또는 ACU를 포함하는 경우, 타겟 RNA의 UAG에서의 A의 편집 효율이 약 25%-30%에 도달할 수 있다.

타겟 아데노신 이외에도, 타겟 RNA에 편집하는 것이 바람직하지 않은 하나 이상의 아데노신이 있을 수 있다. 이들 아데노신과 관련하여, 가능한 한 편집 효율을 저감시키는 것이 바람직하다. 본 발명에 의해, 구아노신이 타겟 RNA에서 아데노신의 정반대쪽에 있을 경우, 탈아미노화 효율이 현저히 감소된 것을 발견했다. 따라서, 오프-타겟 탈아미노화를 감소시키기 위해, dRNA는 타겟 RNA에서 편집될 타겟 아데노신 이외의 하나 이상의 아데노신(들)의 정반대쪽에 하나 이상의 구아노신을 포함하도록 설계될 수 있다.

소망하는 수준의 타겟 RNA 서열의 편집의 특이성 및 효율은 상이한 용도에 따라 달라질 수 있다. 본 특허 출원의 지침에 따라, 당업자는 그 요구에 따라 타겟 RNA 서열에 상보적이거나 또는 실질적으로 상보적인 서열을 갖는 dRNA를 설계할 수 있을 것이며, 또한 약간의 시행착오를 거쳐 소망하는 결과를 얻을 수 있을 것이다. 본 명세서에 사용된 용어 "미스매치"는 왓슨-크릭 염기 쌍 규칙에 따라 완벽한 염기 쌍을 형성하지 않는 이중 가닥 RNA(dsRNA)에서의 반대 뉴클레오티드를 의미한다. 미스매치 염기 쌍은, 예를 들면 G-A, C-A, U-C, A-A, G-G, C-C, U-U 염기 쌍을 포함한다. A-C 매치를 예로 들면, 타겟 A가 타겟 RNA에서 편집될 경우, dRNA는 편집될 A의 반대쪽에 C를 포함하도록 설계되어, 타겟 RNA와 dRNA 사이의 혼성화에 의해 형성된 dsRNA에서 A-C 미스매치가 생성된다.

일부 실시형태에서, dRNA와 타겟 RNA 사이의 혼성화에 의해 형성된 dsRNA는 미스매치를 포함하지 않는다. 일부 실시형태에서, dRNA와 타겟 RNA 사이의 혼성화에 의해 형성된 dsRNA는 하나 이상, 예를 들면 1, 2, 3, 4, 5, 6, 7개 또는 그 이상의 미스매치(예를 들면 동일한 유형의 상이한 미스매치 유형) 중 어느 하나를 포함한다. 일부 실시형태에서, dRNA와 타겟 RNA 사이의 혼성화에 의해 형성된 dsRNA는 1종 이상의 미스매치를 포함하며, 예를 들면 G-A, C-A, U-C, A-A, G-G, C-C 및 U-U로 이루어진 군에서 선택된 1, 2, 3, 4, 5, 6, 7종의 미스매치를 포함한다.

dRNA와 타겟 RNA 사이의 혼성화에 의해 형성된 dsRNA에서의 미스매치 뉴클레오티드는 타겟 RNA의 편집 효율을 촉진할 수 있는 벌지(bulge)를 형성할 수 있다. 미스매치에 의해 형성된 하나(타겟 아데노신에서만 형성됨) 이상의 벌지가 있을 수 있다. 추가의 벌지 유도 미스매치는 타겟 아데노신의 상류 및/또는 하류일 수 있다. 벌지는 단일 미스매치 벌지(하나의 미스매치 염기 쌍에 의해 발생) 또는 다중 미스매치 벌지(하나를 초과한 연속한 미스매치 염기 쌍, 바람직하게는 2개 또는 3개의 연속한 미스매치 염기 쌍에 의해 발생)일 수 있다.

dRNA에서의 상보적 RNA 서열은 단일 가닥이다. dRNA는 완전히 단일 가닥이거나 또는 하나 이상의(예를 들면 1, 2, 3 이상) 이중 가닥 영역 및/또는 하나 이상의 스템 루프 영역을 가질 수 있다. 일부 실시형태에서, 상보적 RNA 서열은 적어도 약 40, 45, 50, 55, 60, 65, 70, 75, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200개 또는 그 이상의 뉴클레오티드 중 어느 하나이다. 소정 실시형태에서, 상보적 RNA 서열은 약 40-260, 45-250, 50-240, 60-230, 65-220, 70-220, 70-210, 70-200, 70-190, 70-180, 70-170, 70-160, 70-150, 70-140, 70-130, 70-120, 70-110, 70-100, 70-90, 70-80, 75-200, 80-190, 85-180, 90-170, 95-160, 100-200, 100-150, 100-175, 110-200, 110-175, 110-150 또는 105-140개의 뉴클레오티드 길이이다. 일부 실시형태에서, 상보적 RNA 서열은 약 71개의 뉴클레오티드 길이이다. 일부 실시형태에서, 상보적 RNA 서열은 약 111개의 뉴클레오티드 길이이다.

일부 실시형태에서, 상보적 RNA 서열 외에도 dRNA는 dRNA를 안정화시키기 위한 영역, 예를 들면 하나 이상의 이중 가닥 영역 및/또는 스템 루프 영역을 추가로 포함한다. 일부 실시형태에서, dRNA의 이중 가닥 영역 또는 스템 루프 영역은 약 200, 150, 100, 50, 40, 30, 20, 10개 또는 그 이하의 염기쌍 중 어느 하나를 포함한다. 일부 실시형태에서, dRNA는 스템 루프 또는 이중 가닥 영역을 포함하지 않는다. 일부 실시형태에서, dRNA는 ADAR-리크루팅 도메인을 포함한다. 일부 실시형태에서, dRNA는 ADAR-리크루팅 도메인을 포함하지 않는다.

dRNA는 하나 이상의 변형을 포함할 수 있다. 일부 실시형태에서, dRNA는 핵염기 변형 및/또는 백본 변형을 포함한 하나 이상의 변형된 뉴클레오티드를 갖는다. RNA에 대한 예시적인 변형은 포스포로티오에이트 백본 변형, 리보스에서의 2'-치환(예를 들면 2'-O-메틸 및 2'-플루오로 치환), LNA 및 L-RNA를 포함하지만, 이에 한정되지는 않는다. 일부 실시형태에서, dRNA는 핵염기 또는 백본에 대한 변형을 갖지 않는다.

또한, 본 출원은 본 명세서에 기재된 dRNA를 포함하는 구축물을 고려한다. 본 명세서에 사용된 용어 "구축물"은 RNA로 전사되거나 또는 단백질로 발현될 수 있는 코딩 뉴클레오티드 서열을 포함하는 DNA 또는 RNA 분자를 지칭한다. 일부 실시형태에서, 구축물은 RNA 또는 단백질을 인코딩하는 뉴클레오티드 서열에 조작 가능하게 연결된 하나 이상의 조절 요소를 함유한다. 구축물이 숙주 세포에 도입될 때, 적합한 조건 하에서, 구축물 내의 코딩 뉴클레오티드 서열이 전사 또는 발현될 수 있다.

일부 실시형태에서, 구축물은 코딩 뉴클레오티드 서열에 조작 가능하게 연결되거나 또는 공간적으로 연결되는 프로모터를 포함하여 프로모터가 코딩 뉴클레오티드 서열의 전사 또는 발현을 제어한다. 프로모터는 그 제어 하에 코딩 뉴클레오티드 서열의 5'(상류)에 위치될 수 있다. 프로모터와 코딩 서열 사이의 거리는 그 프로모터와 유전자 사이의, 프로모터가 유래된 유전자에서 제어하는 거리와 거의 동일할 수 있다. 당업계에 공지된 바와 같이, 이 거리의 변화는 프로모터 기능의 손실 없이 수용될 수 있다. 일부 실시형태에서, 구축물은 코딩 뉴클레오티드 서열의 전사 또는 발현을 조절하는 5'UTR 및/또는 3'UTR을 포함한다.

일부 실시형태에서, 구축물은 본 출원에 개시된 dRNA 중 어느 하나를 인코딩하는 벡터이다. 용어 "벡터"는 이것이 연결된 또 다른 핵산을 수송할 수 있는 핵산 분자를 지칭한다. 벡터는 단일 가닥, 이중 가닥 또는 부분 이중 가닥인 핵산 분자; 하나 이상의 자유 말단을 포함하는 핵산 분자, 자유 말단(예를 들면 원형)이 없는 핵산 분자; DNA, RNA 또는 둘 다를 포함하는 핵산 분자; 및 당업계에 공지된 다른 다양한 폴리뉴클레오티드를 포함하고, 이들에 한정되지 않는다. 한 종류의 벡터는, 표준 분자 클로닝 기술과 같이 추가 DNA 세그먼트가 삽입될 수 있는 환형의 이중 가닥 DNA 루프를 지칭하는 "플라스미드"이다. 소정 벡터는 이들이 도입되는 숙주 세포에서 자율 복제할 수 있다(예를 들면 박테리아 복제 기점을 갖는 박테리아 벡터 및 에피솜 포유동물 벡터). 다른 벡터(예를 들면 비-에피솜 포유동물 벡터)는 숙주 세포에 도입될 때 숙주 세포의 게놈으로 통합되고, 이에 따라 숙주 게놈과 함께 복제된다. 더욱이, 소정 벡터는 이들이 조작 가능하게 연결된 코딩 뉴클레오티드 서열의 전사 또는 발현을 지시할 수 있다. 이러한 벡터는 본 명세서에서 "발현 벡터"라고 지칭된다.

재조합 발현 벡터는 숙주 세포에서 핵산의 전사 또는 발현에 적합한 형태로 본 발명의 핵산을 포함할 수 있다. 일부 실시형태에서, 재조합 발현 벡터는 하나 이상의 조절 요소를 포함하고, 전사 또는 발현에 사용될 숙주 세포를 기준으로 선택될 수 있고, 전사 또는 발현될 핵산 서열에 조작 가능하게 연결된다. 재조합 발현 벡터 내에서, "조작 가능하게 연결된"은 관심 있는 뉴클레오티드 서열이 뉴클레오티드 서열의 발현을 허용하는 방식으로 조절 요소(들)에 연결되는 것을 의미한다(예를 들면 시험관 내 전사/번역 시스템에서 또는 벡터가 숙주 세포에 도입될 때 숙주 세포에서).

일부 실시형태에서, dRNA를 인코딩하는 뉴클레오티드 서열을 포함하는 구축물(예를 들면 바이러스 벡터와 같은 벡터)이 제공된다. 일부 실시형태에서, ADAR을 인코딩하는 뉴클레오티드 서열을 포함하는 구축물(예를 들면 바이러스 벡터와 같은 벡터)이 제공된다. 일부 실시형태에서, dRNA를 인코딩하는 제 1 뉴클레오티드 서열 및 ADAR을 인코딩하는 제 2 뉴클레오티드 서열을 포함하는 구축물이 제공된다. 일부 실시형태에서, 제 1 뉴클레오티드 서열 및 제 2 뉴클레오티드 서열은 동일한 프로모터에 조작 가능하게 연결된다. 일부 실시형태에서, 제 1 뉴클레오티드 서열 및 제 2 뉴클레오티드 서열은 상이한 프로모터에 조작 가능하게 연결된다. 일부 실시형태에서, 프로모터는 유도성이다. 일부 실시형태에서, 구축물은 ADAR을 인코딩하지 않는다. 일부 실시형태에서, 벡터는 ADAR3의 억제제(예를 들면 ADAR3 shRNA 또는 siRNA) 및/또는 인터페론의 자극제(예를 들면 IFN-α)를 인코딩하는 핵산 서열(들)을 추가로 포함한다. 일부 실시형태에서, 구축물은 AAV8과 같은 AAV이다.

치료 방법

본 명세서에 기재된 RNA 편집 방법 및 조성물은, 이에 한정되는 것은 아니지만, 유전성 유전 질환 및 약물 내성을 포함한, 개체의 질환 또는 상태를 치료 또는 예방하는 데 사용될 수 있다.

일부 실시형태에서, 본 명세서에 기재된 RNA 편집 방법 중 어느 하나를 사용하여 타겟 RNA를 편집하는 단계를 포함하는, 생체외 개체(예를 들면 인간 개체)의 세포에서 타겟 RNA를 편집하는 방법이 제공된다.

일부 실시형태에서, dRNA 또는 dRNA를 인코딩하는 구축물을 개체의 세포에 도입하는 단계를 포함하는, 생체외 개체(예를 들면 인간 개체)의 세포에서 타겟 RNA를 편집하는 방법이 제공되며, 여기서 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 여기서 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하기 위해 ADAR을 리크루팅할 수 있다. 일부 실시형태에서, 타겟 RNA는 개체의 질환 또는 상태와 관련된다. 일부 실시형태에서, 질환 또는 상태는 유전성 유전 질환 또는 하나 이상의 후천적인 유전적 돌연변이(예를 들면 약물 내성)와 관련된 질환 또는 상태이다. 일부 실시형태에서, 상기 방법은 개체로부터 세포를 얻는 단계를 추가로 포함한다.

일부 실시형태에서, 본 명세서에 기재된 RNA 편집 방법 중 어느 하나를 사용하여 타겟 RNA를 편집하는 단계를 포함하는, 질환 또는 상태를 갖는 개체의 세포에서 타겟 RNA에 의해 인코딩된 타겟 RNA 또는 단백질의 발현 또는 활성을 복원하는 방법이 제공되고, 여기서 타겟 RNA는 질환 또는 상태와 관련된 G에서 A로의 돌연변이를 갖는다. 일부 실시형태에서, 상기 방법은 생체외에서 개체로부터 단리된 세포에 대해 수행된다. 일부 실시형태에서, 상기 방법은 생체내에서 수행된다.

일부 실시형태에서, 본 명세서에 기재된 RNA 편집 방법 중 어느 하나를 사용하여 개체의 세포에서 질환 또는 상태와 관련된 타겟 RNA를 편집하는 단계를 포함하는, 개체(예를 들면 인간 개체)의 질환 또는 상태를 치료 또는 예방하는 방법이 제공된다.

일부 실시형태에서, dRNA 또는 dRNA를 인코딩하는 구축물을 생체외에서 개체의 단리된 세포에 도입하는 단계를 포함하는, 개체(예를 들면 인간 개체)의 질환 또는 상태를 치료 또는 예방하는 방법이 제공되며, 여기서 dRNA는 질환 또는 상태와 관련된 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 여기서 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하기 위해 ADAR을 리크루팅할 수 있다. 일부 실시형태에서, ADAR은 단리된 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 단리된 세포에 도입하는 단계를 포함한다. 일부 실시형태에서, 상기 방법은 편집된 RNA를 갖는 세포를 배양하는 단계를 추가로 포함한다. 일부 실시형태에서, 상기 방법은 편집된 RNA를 갖는 세포를 개체에 투여하는 단계를 추가로 포함한다. 일부 실시형태에서, 질환 또는 상태는 유전성 유전 질환 또는 하나 이상의 후천적인 유전적 돌연변이(예를 들면 약물 내성)와 관련된 질환 또는 상태이다.

일부 실시형태에서, dRNA 또는 dRNA를 인코딩하는 구축물을 생체외에서 개체의 단리된 세포에 도입하는 단계를 포함하는, 개체(예를 들면 인간 개체)의 질환 또는 상태를 치료 또는 예방하는 방법이 제공되며, 여기서 dRNA는 질환 또는 상태와 관련된 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 여기서 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화화기 위해서 숙주 세포의 내인적으로 발현된 ADAR을 리크루팅할 수 있다. 일부 실시형태에서, 상기 방법은 편집된 RNA를 갖는 세포를 배양하는 단계를 추가로 포함한다. 일부 실시형태에서, 상기 방법은 편집된 RNA를 갖는 세포를 개체에 투여하는 단계를 추가로 포함한다. 일부 실시형태에서, 질환 또는 상태는 유전성 유전 질환 또는 하나 이상의 후천적인 유전적 돌연변이(예를 들면 약물 내성)와 관련된 질환 또는 상태이다.

일부 실시형태에서, 유효량의 dRNA 또는 dRNA를 인코딩하는 구축물을 개체에 투여하는 단계를 포함하는, 개체(예를 들면 인간 개체)의 질환 또는 상태를 치료 또는 예방하는 방법이 제공되며, 여기서 dRNA는 질환 또는 상태와 관련된 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 여기서 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하기 위해 ADAR을 리크루팅할 수 있다. 일부 실시형태에서, ADAR은 개체의 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 개체에 투여하는 단계를 포함한다. 일부 실시형태에서, 질환 또는 상태는 유전성 유전 질환 또는 하나 이상의 후천적인 유전적 돌연변이(예를 들면 약물 내성)와 관련된 질환 또는 상태이다.

본 출원의 방법을 사용한 치료에 적합한 질환 및 상태는 G에서 A로의 돌연변이와 같은 돌연변이, 예를 들면 RNA 전사물에서 미스센스 돌연변이, 조기 정지 코돈, 비정상적 스플라이싱 또는 선택적 스플라이싱으로 되는 G에서 A로의 돌연변이와 관련된 질환을 포함한다. 본 출원의 방법에 의해 복원될 수 있는 질환 관련 돌연변이의 예는 암과 관련된 TP53^W53X(예를 들면 158G>A), I형 점액다당류증(MPS I)과 관련된 IDUA^W402X(예를 들면 엑손 9에서의 TGG>TAG 돌연변이), 엘러스-단로스 증후군과 관련된 COL3A1^W1278X(예를 들면 3833G>A 돌연변이), 원발성 폐고혈압증과 관련된 BMPR2^W298X(예를 들면 893G>A), 주버트 증후군과 관련된 AHI1^W725X(예를 들면 2174G>A) 판코니 빈혈과 관련된 FANCC^W506X(예를 들면 1517G>A), 원발성 가족성 비대 심근병증과 관련된 MYBPC3^W1098X(예를 들면 3293G>A), X-염색체 연관 중증복합면역결핍증과 관련된 IL2RG^W237X(예를 들면 710G>A)을 포함하지만, 이에 한정되지는 않는다. 일부 실시형태에서, 질환 또는 상태는 암이다. 일부 실시형태에서, 질환 또는 상태는 단 유전성 질환이다. 일부 실시형태에서, 질환 또는 상태는 다유전성 질환이다.

일부 실시형태에서, 생체외에서 개체의 단리된 세포에 dRNA 또는 dRNA를 인코딩하는 구축물을 도입하는 단계를 포함하는, 개체에서 돌연변이(예를 들면 G>A 돌연변이)를 갖는 타겟 RNA와 관련된 암을 치료하는 방법이 제공되며, 여기서 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 여기서 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하기 위해서 ADAR을 리크루팅할 수 있어서, 타겟 RNA에서 돌연변이를 구제(rescue)할 수 있다. 일부 실시형태에서, ADAR은 단리된 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 단리된 세포에 도입하는 단계를 포함한다. 일부 실시형태에서, 타겟 RNA는 TP53^W53X(예를 들면 158G>A)이다. 일부 실시형태에서, dRNA는 서열 번호 195, 196 또는 197의 핵산 서열을 포함한다.

일부 실시형태에서, 유효량의 dRNA 또는 dRNA를 인코딩하는 구축물을 개체에 투여하는 단계를 포함하는, 개체에서 돌연변이(예를 들면 G>A 돌연변이)를 갖는 타겟 RNA로 암을 치료 또는 예방하는 방법이 제공되며, 여기서 dRNA는 질환 또는 상태와 관련된 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 여기서 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하기 위해 ADAR을 리크루팅할 수 있어서, 타겟 RNA에서 돌연변이를 구제할 수 있다. 일부 실시형태에서, ADAR은 개체의 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 개체에 투여하는 단계를 포함한다. 일부 실시형태에서, 타겟 RNA는 TP53^W53X(예를 들면 158G>A)이다. 일부 실시형태에서, dRNA는 서열 번호 195, 196 또는 197의 핵산 서열을 포함한다.

일부 실시형태에서, 생체외에서 개체의 단리된 세포에 dRNA 또는 dRNA를 인코딩 구축물을 도입하는 단계를 포함하는, 개체에서 돌연변이(예를 들면 G>A 돌연변이)를 갖는 타겟 RNA와 관련된 MPS I(예를 들면 헐러 증후군 또는 샤이에 증후군)를 치료하는 방법이 제공되며, 여기서 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 여기서 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하기 위해 ADAR을 리크루팅할 수 있어서, 타겟 RNA에서 돌연변이를 구제할 수 있다. 일부 실시형태에서, ADAR은 단리된 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 단리된 세포에 도입하는 단계를 포함한다. 일부 실시형태에서, 타겟 RNA는 IDUA^W402X(예를 들면 엑손 9에서의 TGG>TAG 돌연변이)이다. 일부 실시형태에서, dRNA는 서열 번호 204 또는 205의 핵산 서열을 포함한다.

일부 실시형태에서, 유효량의 dRNA 또는 dRNA를 인코딩하는 구축물을 개체에 투여하는 단계를 포함하는, 개체에서 돌연변이(예를 들면 G>A 돌연변이)를 갖는 타겟 RNA로 MPS I(예를 들면 헐러 증후군 또는 샤이에 증후군)를 치료 또는 예방하는 방법이 제공되며, 여기서 dRNA는 질환 또는 상태와 관련된 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 여기서 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하기 위해 ADAR을 리크루팅할 수 있어서, 타겟 RNA에서 돌연변이를 구제할 수 있다. 일부 실시형태에서, ADAR은 개체의 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 개체에 투여하는 단계를 포함한다. 일부 실시형태에서, 타겟 RNA는 IDUA^W402X(예를 들면 엑손 9에서의 TGG>TAG 돌연변이)이다. 일부 실시형태에서, dRNA는 서열 번호 204 또는 205의 핵산 서열을 포함한다.

일부 실시형태에서, 생체외에서 개체의 단리된 세포에 dRNA 또는 dRNA를 인코딩하는 구축물을 도입하는 단계를 포함하는, 개체에서 돌연변이(예를 들면 G>A 돌연변이)를 갖는 타겟 RNA와 관련된 엘러스-단로스 증후군을 치료 또는 예방하는 방법이 제공되며, 여기서 dRNA는 타겟 RNA에 혼성화하는 상보적인 RNA 서열을 포함하고, 여기서 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하기 위해 ADAR을 리크루팅할 수 있어서, 타겟 RNA에서 돌연변이를 구제할 수 있다. 일부 실시형태에서, ADAR은 단리된 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 단리된 세포에 도입하는 단계를 포함한다. 일부 실시형태에서, 타겟 RNA는 COL3A1^W1278X(예를 들면 3833G>A 돌연변이)이다. 일부 실시형태에서, dRNA는 서열 번호 198의 핵산 서열을 포함한다.

일부 실시형태에서, 유효량의 dRNA 또는 dRNA를 인코딩하는 구축물을 개체에 투여하는 단계를 포함하는, 개체에서 돌연변이(예를 들면 G>A 돌연변이)를 갖는 타겟 RNA로 엘러스-단로스 증후군을 치료 또는 예방하는 방법이 제공되며, 여기서 dRNA는 질환 또는 상태와 관련된 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 여기서 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하기 위해 ADAR을 리크루팅할 수 있어서, 타겟 RNA에서 돌연변이를 구제할 수 있다. 일부 실시형태에서, ADAR은 개체의 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 개체에 투여하는 단계를 포함한다. 일부 실시형태에서, 타겟 RNA는 COL3A1^W1278X(예를 들면 3833G>A 돌연변이)이다. 일부 실시형태에서, dRNA는 서열 번호 198의 핵산 서열을 포함한다.

일부 실시형태에서, 생체외에서 개체의 단리된 세포에 dRNA 또는 dRNA를 인코딩하는 구축물을 도입하는 단계를 포함하는, 개체에서 돌연변이(예를 들면 G>A 돌연변이)를 갖는 타겟 RNA와 관련된 원발성 폐고혈압증을 치료하는 방법이 제공되며, 여기서 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 여기서 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하기 위해 ADAR을 리크루팅할 수 있어서, 타겟 RNA에서 돌연변이를 구제할 수 있다. 일부 실시형태에서, ADAR은 단리된 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 단리된 세포에 도입하는 단계를 포함한다. 일부 실시형태에서, 타겟 RNA는 BMPR2^W298X(예를 들면 893G>A)이다. 일부 실시형태에서, dRNA는 서열 번호 199의 핵산 서열을 포함한다.

일부 실시형태에서, 유효량의 dRNA 또는 dRNA를 인코딩하는 구축물을 개체에 투여하는 단계를 포함하는, 개체에서 돌연변이(예를 들면 G>A 돌연변이)를 갖는 타겟 RNA로 원발성 폐고혈압증을 치료 또는 예방하는 방법이 제공되며, 여기서 dRNA는 질환 또는 상태와 관련된 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 여기서 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하기 위해 ADAR을 리크루팅할 수 있어서, 타겟 RNA에서 돌연변이를 구제할 수 있다. 일부 실시형태에서, ADAR은 개체의 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 개체에 투여하는 단계를 포함한다. 일부 실시형태에서, 타겟 RNA는 BMPR2^W298X(예를 들면 893G>A)이다. 일부 실시형태에서, dRNA는 서열 번호 199의 핵산 서열을 포함한다.

일부 실시형태에서, 생체외에서 개체의 단리된 세포에 dRNA 또는 dRNA를 인코딩하는 구축물을 도입하는 단계를 포함하는, 개체에서 돌연변이(예를 들면 G>A 돌연변이)를 갖는 타겟 RNA와 관련된 주버트 증후군을 치료하는 방법이 제공되며, 여기서 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 여기서 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하기 위해 ADAR을 리크루팅할 수 있어서, 타겟 RNA에서 돌연변이를 구제할 수 있다. 일부 실시형태에서, ADAR은 단리된 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 단리된 세포에 도입하는 단계를 포함한다. 일부 실시형태에서, 타겟 RNA는 AHI1^W725X(예를 들면 2174G>A)이다. 일부 실시형태에서, dRNA는 서열 번호 200의 핵산 서열을 포함한다.

일부 실시형태에서, 유효량의 dRNA 또는 dRNA를 인코딩하는 구축물을 개체에 투여하는 단계를 포함하는, 개체에서 돌연변이(예를 들면 G>A 돌연변이)를 갖는 타겟 RNA로 주버트 증후군을 치료 또는 예방하는 방법이 제공되며, 여기서 dRNA는 질환 또는 상태와 관련된 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 여기서 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하기 위해 ADAR을 리크루팅할 수 있어서, 타겟 RNA에서 돌연변이를 구제할 수 있다. 일부 실시형태에서, ADAR은 개체의 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 개체에 투여하는 단계를 포함한다. 일부 실시형태에서, 타겟 RNA는 AHI1^W725X(예를 들면 2174G>A)이다. 일부 실시형태에서, dRNA는 서열 번호 200의 핵산 서열을 포함한다.

일부 실시형태에서, 생체외에서 개체의 단리된 세포에 dRNA 또는 dRNA를 인코딩하는 구축물을 도입하는 단계를 포함하는, 개체에서 돌연변이(예를 들면 G>A 돌연변이)를 갖는 타겟 RNA와 관련된 판코니 빈혈을 치료하는 방법이 제공되며, 여기서 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 여기서 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하기 위해 ADAR을 리크루팅할 수 있어서, 타겟 RNA에서 돌연변이를 구제할 수 있다. 일부 실시형태에서, ADAR은 단리된 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 단리된 세포에 도입하는 단계를 포함한다. 일부 실시형태에서, 타겟 RNA는 FANCC^W506X(예를 들면 1517G>A)이다. 일부 실시형태에서, dRNA는 서열 번호 201의 핵산 서열을 포함한다.

일부 실시형태에서, 유효량의 dRNA 또는 dRNA를 인코딩하는 구축물을 개체에 투여하는 단계를 포함하는, 개체에서 돌연변이(예를 들면 G>A 돌연변이)를 갖는 타겟 RNA로 판코니 빈혈을 치료 또는 예방하는 방법이 제공되며, 여기서 dRNA는 질환 또는 상태와 관련된 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 여기서 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하기 위해 ADAR을 리크루팅할 수 있어서, 타겟 RNA에서 돌연변이를 구제할 수 있다. 일부 실시형태에서, ADAR은 개체의 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 개체에 투여하는 단계를 포함한다. 일부 실시형태에서, 타겟 RNA는 FANCC^W506X(예를 들면 1517G>A)이다. 일부 실시형태에서, dRNA는 서열 번호 201의 핵산 서열을 포함한다.

일부 실시형태에서, 세포외에서 dRNA 또는 dRNA를 인코딩하는 구축물을 개체의 단리된 세포에 도입하는 단계를 포함하는, 개체에서 돌연변이(예를 들면 G>A 돌연변이)를 갖는 타겟 RNA와 관련된 원발성 가족성 비대 심근병증을 치료하는 방법이 제공되며, 여기서 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 여기서 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하기 위해 ADAR을 리크루팅할 수 있어서, 타겟 RNA에서 돌연변이를 구제할 수 있다. 일부 실시형태에서, ADAR은 단리된 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 단리된 세포에 도입하는 단계를 포함한다. 일부 실시형태에서, 타겟 RNA는 MYBPC3^W1098X(예를 들면 3293G>A)이다. 일부 실시형태에서, dRNA는 서열 번호 202의 핵산 서열을 포함한다.

일부 실시형태에서, 유효량의 dRNA 또는 dRNA를 인코딩하는 구축물을 개체에 투여하는 단계를 포함하는, 개체에서 돌연변이(예를 들면 G>A 돌연변이)를 갖는 타겟 RNA로 원발성 가족성 비대 심근병증을 치료 또는 예방하는 방법이 제공되며, 여기서 dRNA는 질환 또는 상태와 관련된 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 여기서 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하기 위해 ADAR을 리크루팅할 수 있어서, 타겟 RNA에서 돌연변이를 구제할 수 있다. 일부 실시형태에서, ADAR은 개체의 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 개체에 투여하는 단계를 포함한다. 일부 실시형태에서, 타겟 RNA는 MYBPC3^W1098X(예를 들면 3293G>A)이다. 일부 실시형태에서, dRNA는 서열 번호 202의 핵산 서열을 포함한다.

일부 실시형태에서, 생체외에서 개체의 단리된 세포에 dRNA 또는 dRNA를 인코딩하는 구축물을 도입하는 단계를 포함하는, 개체에서 돌연변이(예를 들면 G>A 돌연변이)를 갖는 타겟 RNA와 관련된 X-염색체 연관 중증복합면역결핍증을 치료하는 방법이 제공되며, 여기서 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 여기서 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하기 위해 ADAR을 리크루팅할 수 있어서, 타겟 RNA에서 돌연변이를 구제할 수 있다. 일부 실시형태에서, ADAR은 단리된 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 단리된 세포에 도입하는 단계를 포함한다. 일부 실시형태에서, 타겟 RNA는 IL2RG^W237X(예를 들면 710G>A)이다. 일부 실시형태에서, dRNA는 서열 번호 203의 핵산 서열을 포함한다.

일부 실시형태에서, 유효량의 dRNA 또는 인코딩하는 구축물을 개체에 투여하는 단계를 포함하는, 개체에서 돌연변이(예를 들면 G>A 돌연변이)를 갖는 타겟 RNA로 X-염색체 연관 중증복합면역결핍증을 치료 또는 예방하는 방법이 제공되며, 여기서 dRNA는 질환 또는 상태와 관련된 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 여기서 dRNA는 타겟 RNA에서 타겟 A를 탈아미노화하기 위해 ADAR을 리크루팅할 수 있어서, 타겟 RNA에서 돌연변이를 구제할 수 있다. 일부 실시형태에서, ADAR은 개체의 세포에서 내인적으로 발현된 ADAR이다. 일부 실시형태에서, 상기 방법은 ADAR 또는 ADAR을 인코딩하는 구축물을 개체에 투여하는 단계를 포함한다. 일부 실시형태에서, 타겟 RNA는 IL2RG^W237X(예를 들면 710G>A)이다. 일부 실시형태에서, dRNA는 서열 번호 203의 핵산 서열을 포함한다.

본 명세서에 사용된 "치료" 또는 "치료하는"은 임상 결과를 포함한 유익하거나 또는 소망하는 결과를 얻기 위한 접근법이다. 본 발명의 목적을 위해, 유익하거나 또는 소망하는 임상 결과는 하기 중 하나 이상을 포함하지만, 이에 한정되지는 않는다: 질환으로 기인한 하나 이상의 증상의 감소, 질환의 정도 감소, 질환 안정화(예를 들면 질환의 예방 또는 악화 지연), 질환의 확산(예를 들면 전이)을 예방 또는 지연, 질환의 발생 또는 재발을 예방 또는 지연, 질환의 진행을 지연 또는 감속, 질환 상태의 개선, 질환의 차도(부분적 또는 전체적)를 제공, 질환을 치료하는 데 필요한 하나 이상의 다른 약물의 용량의 감소, 질환의 진행을 지연, 삶의 질의 증대, 및/또는 생존의 연장. 또한, "치료"에 포함되는 것은 질환 또는 상태의 병리학적 결과의 감소이다. 본 발명의 방법은 이러한 치료 측면 중 어느 하나 이상을 고려한다.

용어 "개체", "피험자" 및 "환자"는 인간을 포함한 포유동물을 기재하기 위해 본 명세서에서 상호교환적으로 사용된다. 개체는 인간, 소, 말, 고양이, 개, 설치류 또는 영장류를 포함하지만, 이에 한정되지 않는다. 일부 실시형태에서, 개체는 인간이다. 일부 실시형태에서, 개체는 약물 내성과 같은 질환 또는 상태를 앓고 있다. 일부 실시형태에서, 개체는 치료가 필요하다.

당업계에서 이해되는 바와 같이, "유효량"은 소망하는 치료 결과를 생성(예를 들면 질환 또는 상태의 하나 이상의 증상의 중증도의 저감 또는 중증도를 안정화시키는 기간을 저감시키거나, 또는 질환 또는 상태의 하나 이상의 증상의 제거)하기에 충분한 조성물(예를 들면 dRNA 또는 dRNA를 인코딩하는 구축물)의 양을 의미한다. 치료적 용도의 경우, 유익하거나 또는 소망하는 결과는, 예를 들면 질환의 합병증 및 질환의 진전 동안 나타나는 중간 병리학적 표현형을 포함한, 질환(생화학적, 조직학적 및/또는 거동적)으로 인한 하나 이상의 증상의 감소, 질환 또는 상태를 앓고 있는 개체의 삶의 질의 향상, 질환 치료에 필요한 다른 약물의 용량의 감소, 다른 약물의 효과 증대, 질환의 진행 지연 및/또는 환자의 생존 연장을 포함한다.

일반적으로, 조성물(예를 들면 dRNA 또는 dRNA를 인코딩하는 구축물)의 투여 량, 투여 일정 및 투여 경로는 개체의 크기 및 상태에 따라 결정될 수 있고, 또한 표준 약학적 관행에 따라 결정될 수 있다. 예시적인 투여 경로는 정맥 내, 동맥 내, 복강 내, 폐내, 방광 내, 근육 내, 기관 내, 피하, 안구 내, 척수강 내 또는 경피를 포함한다.

본 출원의 RNA 편집 방법은 동물 세포, 예를 들면 포유동물 세포에서 사용될 수 있을 뿐만 아니라, 식물 또는 진균의 RNA의 변형, 예를 들면 내인적으로 발현된 ADAR을 갖는 식물 또는 진균에도 사용될 수 있다. 본 명세서에 기재된 방법은 개선된 특성을 갖는 유전적으로 조작된 식물 및 진균을 생성하기 위해 사용될 수 있다.

조성물, 키트 및 제조 물품

또한, 본 명세서에 기재된 바와 같이 편집된 RNA를 갖는 dRNA, 구축물, 라이브러리 또는 숙주 세포 중 어느 하나를 포함하는 조성물(예를 들면 의약 조성물)이 본 명세서에 제공된다.

일부 실시형태에서, 본 명세서에 기재된 dRNA 또는 dRNA를 인코딩하는 구축물 중 어느 하나, 및 약학적으로 허용 가능한 담체, 부형제 또는 안정 화제를 포함하는 의약 조성물이 제공된다. 예시적인 약학적으로 허용 가능한 담체, 부형제 및 안정제는, 예를 들면 Remington's Pharmaceutical Sciences, 제 16 판, 오슬로, A. Ed.(1980년)에 기재되어 있다. 허용 가능한 담체, 부형제 또는 안정제는 사용되는 용량 및 농도에서 수용체에게 무독성이며, 또한 포스페이트, 시트레이트 및 기타 유기산과 같은 완충액; 아스코르브산 및 메티오닌을 포함한 항산화제; 방부제(옥타데실디메틸벤질암모늄 클로라이드; 헥사메토늄 클로라이드; 벤잘코늄 클로라이드, 벤제토늄 클로라이드; 페놀, 부틸 또는 벤질알콜; 메틸 또는 프로필파라벤과 같은 알킬파라벤; 카테콜; 레조르시놀; 시클로헥산올; 3-펜탄올; 및 m-크레졸); 저분자량(약 10개 미만의 잔기) 폴리펩티드; 혈청 알부민, 젤라틴 또는 면역글로불린과 같은 단백질; 올리비닐피롤리돈과 같은 친수성 폴리머; 글리신, 글루타민, 아스파라긴, 히스티딘, 아르기닌 또는 라이신과 같은 아미노산; 단당류, 이당류 및 포도당, 만노스 또는 덱스트린을 포함한 기타 탄수화물; EDTA와 같은 킬레이트제; 수 크로오스, 만니톨, 트레할로오스 또는 소르비톨과 같은 당; 나트륨과 같은 염 형성 반대 이온; 금속 착물(예를 들면 Zn-단백질 착물); 및/또는 TWEEN^TM, PLURONICS^TM 또는 폴리에틸렌글리콜(PEG)과 같은 비이온성 계면활성제를 포함한다. 일부 실시형태에서, 냉동건조된 제제가 제공된다. 생체내 투여에 사용되는 약학 조성물은 멸균되어야 한다. 이것은, 예를 들면 멸균 여과막을 통한 여과에 의해 쉽게 달성된다. 본 명세서에 기재된 바와 같은 dRNA, 구축물, 조성물, 라이브러리 또는 편집된 숙주 세포 중 어느 하나를 포함하는, 본 명세서에 기재된 RNA 편집 방법 또는 치료 방법 중 어느 하나에 유용한 키트 또는 제조 물품이 추가로 제공된다.

일부 실시형태에서, dRNA를 포함하는, 숙주 세포에서 타겟 RNA를 편집하기 위한 키트가 제공되며, 여기서 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 여기서 dRNA는 타겟 RNA에서 A를 탈아미노화하기 위해 ADAR을 리크루팅할 수 있다. 일부 실시형태에서, 키트는 ADAR 또는 ADAR을 인코딩하는 구축물을 추가로 포함한다. 일부 실시형태에서, 키트는 ADAR3의 억제제 또는 그 구축물을 추가로 포함한다. 일부 실시형태에서, 키트는 인터페론의 자극제 또는 그 구축물을 추가로 포함한다. 일부 실시형태에서, 키트는 본 명세서에 기재된 RNA 편집 방법 중 어느 하나를 수행하기 위한 설명서를 추가로 포함한다.

본 출원의 키트는 적절한 패키징에 있다. 적합한 포장은 바이알, 보틀, 병,가요성 패키징(예를 들면 밀봉된 마일라 또는 플라스틱 백) 등을 포함하지만, 이에 제한되지 않는다. 키트는 선택적으로 형질감염 또는 형질도입 시약, 세포 배양 배지, 완충액 및 해석적 정보와 같은 추가 구성 요소를 선택적으로 제공할 수 있다.

따라서, 본 출원은 또한 제조 물품을 제공한다. 제조 물품은 용기 및 용기 상에 또는 용기와 관련된 라벨 또는 패키지 삽입물을 포함할 수 있다. 적합한 용기는 바이알(예를 들면 밀봉된 바이알), 보틀, 병, 가요성 패키지 등을 포함한다. 일부 실시형태에서, 용기는 약학 조성물을 보유하고, 멸균 접근 포트(예를 들면 용기는 정맥주사액 백 또는 피하주사바늘로 뚫을 수 있는 마개를 갖는 바이알일 수 있음)를 가질 수 있다. 약학 조성물을 보유하는 용기는 재구성된 제제의 반복 투여(예를 들면 2-6회 투여)를 허용하는 멀티유즈 바이알일 수 있다. 패키지 삽입물은 그러한 제품의 사용에 관한 지시, 사용법, 용량, 투여, 금기 및/또는 경고에 대한 정보를 포함하는 치료 제품의 상업적 패키지에 관례상 포함된 설명서를 지칭한다. 부가적으로, 제조 물품은 주사용 정균수(BWFI), 포스페이트 완충 식염수, 링거 용액 및 덱스트로오스 용액과 같은 약학적으로 허용 가능한 완충액을 포함하는 제 2 용기를 추가로 포함할 수 있다. 다른 완충액, 희석제, 필터, 바늘 및 시린지를 포함한, 상업적이고 사용자 관점에서 소망되는 다른 재료를 추가로 포함할 수 있다.

키트 또는 제조 물품은 약국, 예를 들면 병원 약국 및 조제 약국에서 보관 및 사용하기에 충분한 양으로 패키징된, 약학 조성물의 다중 단위 용량 및 사용 설명서를 포함할 수 있다.

예시적인 실시형태

본 명세서에 제공된 실시형태는 다음과 같다:

1. 탈아미노효소-리크루팅 RNA(dRNA) 또는 dRNA를 인코딩하는 구축물을 숙주 세포에 도입하는 단계를 포함하는, 숙주 세포에서 타겟 RNA를 편집하는 방법으로서, 상기 dRNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 또한 상기 탈아미노효소-리크루팅 RNA는 타겟 RNA에서 타겟 아데노신을 탈아미노화하기 위해 RNA 아데노신 탈아미노효소(ADAR)를 리크루팅할 수 있다.

2. 실시형태 1에 있어서, 상기 RNA 서열은 상기 타겟 RNA에서 타겟 아데노신의 정반대쪽에 시티딘, 아데노신 또는 우리딘을 포함하는 방법.

3. 실시형태 2에 있어서, 상기 RNA 서열은 상기 타겟 RNA에서 타겟 아데노신의 정반대쪽에 시티딘 미스매치를 포함하는 방법.

4. 실시형태 3에 있어서, 상기 시티딘 미스매치는 상기 dRNA에서 상보적 서열의 3' 말단으로부터 적어도 20개의 뉴클레오티드 이간되고, 또한 상보적 서열의 5' 말단으로부터 적어도 5개의 뉴클레오티드 이간되어 위치되는 방법.

5. 실시형태 4에 있어서, 상기 시티딘 미스매치는 dRNA에 있어서 상보적 서열의 중심으로부터(예를 들면 중심에서) 10개의 뉴클레오티드 이내에 위치되는 방법.

6. 실시형태 1-5 중 어느 하나에 있어서, 상기 RNA 서열은 상기 타겟 RNA에서 비타겟 아데노신의 각각 반대쪽에 하나 이상의 구아노신을 추가로 포함하는 방법.

7. 실시형태 1-6 중 어느 하나에 있어서, 상기 상보적 서열은 상기 타겟 RNA에서 비타겟 아데노신의 반대쪽에 2개 이상의 연속한 미스매치 뉴클레오티드를 포함하는 방법.

8. 실시형태 1-7 중 어느 하나에 있어서, 상기 타겟 RNA에서 타겟 아데노신의 5' 최근접 이웃은 U, C, A 및 G에서 선택된 뉴클레오티드이고, 선호도는 U>C≒A>G이고, 상기 타겟 RNA에서 타겟 아데노신의 3' 최근접 이웃은 G, C, A 및 U에서 선택된 뉴클레오티드이고, 선호도는 G>C>A≒U이다.

9. 실시형태 1-8 중 어느 하나에 있어서, 상기 타겟 아데노신은 상기 타겟 RNA에서 UAG, UAC, UAA, UAU, CAG, CAC, CAA, CAU, AAG, AAC, AAA, AAU, GAG, GAC, GAA 및 GAU로 이루어진 군에서 선택된 3-염기 모티프로 있는 방법.

10. 실시형태 9에 있어서, 상기 3-염기 모티프는 UAG이고, 상기 탈아미노효소-리크루팅 RNA는 3-염기 모티프에서 우리딘의 정반대쪽에 A, 타겟 아데노신의 정반대쪽에 시티딘, 및 3-염기 모티프에서 구아노신의 정반대쪽에 시티딘, 구아노신 또는 우리딘을 포함하는 방법.

11. 실시형태 1-10 중 어느 하나에 있어서, 상기 탈아미노효소-리크루팅 RNA는 길이가 약 40-260개의 뉴클레오티드인 방법.

12. 실시형태 11에 있어서, 상기 탈아미노효소-리크루팅 RNA는 길이가 약 60-230개의 뉴클레오티드인 방법.

13. 실시형태 11 또는 12에 있어서, 상기 dRNA는 길이는 약 70개의 뉴클레오티드를 초과하는 방법.

14. 실시형태 11-13 중 어느 하나에 있어서, 상기 dRNA는 길이가 약 100개 내지 약 150개(예를 들면 약 110-150개)의 뉴클레오티드인 방법.

15. 실시형태 1-14 중 어느 하나에 있어서, 상기 타겟 RNA는 프리메신저 RNA, 메신저 RNA, 리보솜 RNA, 트랜스퍼 RNA, 긴 논코딩 RNA 및 작은 RNA로 이루어진 군에서 선택된 RNA인 방법.

16. 실시형태 15에 있어서, 상기 타겟 RNA는 프리메신저 RNA인 방법.

17. 실시형태 1-16 중 어느 하나에 있어서, 상기 ADAR은 숙주 세포에 의해 내인적으로 발현되는 방법.

18. 실시형태 1-16 중 어느 하나에 있어서, 상기 ADAR은 숙주 세포에 대해 외인성인 방법.

19. 실시형태 18에 있어서, 상기 ADAR을 숙주 세포에 도입하는 단계를 추가로 포함하는 방법.

20. 실시형태 18 또는 19에 있어서, 상기 ADAR이 E1008 돌연변이를 포함하는 방법.

21. 실시형태 1-20 중 어느 하나에 있어서, 상기 탈아미노효소-리크루팅 RNA는 단일 가닥 RNA인 방법.

22. 실시형태 1-20 중 어느 하나에 있어서, 상기 상보적 RNA 서열은 단일 가닥이고, 또한 상기 탈아미노효소-리크루팅 RNA는 하나 이상의 이중 가닥 영역을 추가로 포함하는 방법.

23. 실시형태 1-22 중 어느 하나에 있어서, 상기 dRNA는 ADAR-리크루팅 도메인(예를 들면 DSB-결합 도메인, GluR2 도메인, 또는 MS2 도메인)을 포함하지 않는 방법.

24. 실시형태 1-23 중 어느 하나에 있어서, 상기 dRNA는 화학 수식된 뉴클레오티드(예를 들면 2'-O-메틸 또는 포스포로티오에이트 수식)를 포함하지 않는 방법.

25. 실시형태 24에 있어서, 상기 dRNA를 인코딩하는 구축물을 숙주 세포에 도입하는 단계를 포함하고, 상기 구축물은 바이러스 벡터(예를 들면 렌티바이러스 벡터) 또는 플라스미드인 방법.

26. 실시형태 1-25 중 어느 하나에 있어서, 상기 타겟 RNA에서의 타겟 아데노신의 탈아미노화는 상기 타겟 RNA에서 미스센스 돌연변이, 조기 정지 코돈, 비정상 스플라이싱 또는 선택적 스플라이싱을 야기하거나, 또는 상기 타겟 RNA에서 미스센스 돌연변이, 조기 정지 코돈, 비정상적 스플라이싱 또는 선택적 스플라이싱의 역전을 야기하는 방법.

27. 실시형태 26에 있어서, 상기 타겟 RNA에서의 타겟 아데노신의 탈아미노화는 상기 타겟 RNA에 의해 인코팅된 단백질의 점 돌연변이, 절단, 연장 및/또는 잘못 접힘을 야기하거나, 또는 상기 타겟 RNA에서 미스센스 돌연변이, 조기 정지 코돈, 비정상적 스플라이싱 또는 선택적 스플라이싱의 역전에 의해 기능적, 전장, 정확하게 접힌 및/또는 야생형 단백질을 야기하는 방법.

28. 실시형태 1-27 중 어느 하나에 있어서, 상기 숙주 세포는 진핵 세포인 방법.

29. 실시형태 28에 있어서, 상기 숙주 세포는 포유류 세포인 방법.

30. 실시형태 29에 있어서, 상기 숙주 세포는 인간 또는 마우스 세포인 방법.

31. 실시형태 29 또는 30에 있어서, 상기 ADAR은 ADAR1 및/또는 ADAR2인 방법.

32. 실시형태 1-31 중 어느 하나에 있어서, 상기 숙주 세포는 1차 세포인 방법.

33. 실시형태 32에 있어서, 상기 숙주 세포는 T 세포인 방법.

34. 실시형태 32에 있어서, 상기 숙주 세포는 유사분열후 세포인 방법.

35. 실시형태 1-34 중 어느 하나에 있어서, 상기 ADAR3의 억제제를 숙주 세포에 도입하는 단계를 추가로 포함하는 방법.

36. 실시형태 1-35 중 어느 하나에 있어서, 인터페론의 자극제를 숙주 세포에 도입하는 단계를 추가로 포함하는 방법.

37. 실시형태 1-36 중 어느 하나에 있어서, 상이한 타겟 RNA를 각각 타겟팅하는 복수의 dRNA를 도입하는 단계를 포함하는 방법.

38. 실시형태 1-37 중 어느 하나에 있어서, 상기 타겟 RNA를 편집하는 효율은 적어도 약 5%(예를 들면 적어도 약 10%, 20% 또는 30%)인 방법.

39. 실시형태 1-38 중 어느 하나에 있어서, 상기 dRNA는 면역 반응을 유도하지 않는 방법.

40. 실시형태 1-39 중 어느 하나의 방법에 의해 생산된 편집된 RNA 또는 편집된 RNA를 갖는 숙주 세포.

41. 실시형태 1-39 중 어느 하나에 기재된 개체의 세포에서 질환 또는 상태와 관련된 타겟 RNA를 편집하는 단계를 포함하는, 개체에서의 질환 또는 상태를 치료 또는 예방하는 방법.

42. 실시형태 41에 있어서, 상기 질환 또는 상태는 유전성 유전 질환 또는 하나 이상의 후천적인 유전적 돌연변이와 관련된 질환 또는 상태인 방법.

43. 실시형태 41 또는 42에 있어서, 상기 타겟 RNA는 G에서 A로의 돌연변이를 갖는 방법.

44. 실시형태 41-43 중 어느 하나에 있어서, 상기 질환 또는 상태는 단일 유전 질환 또는 상태인 방법.

45. 실시형태 41-44 중 어느 하나에 있어서, 상기 질환 또는 상태가 다중 유전 질환 또는 상태인 방법.

46. 실시형태 41-45 중 어느 하나에 있어서,

(i) 상기 타겟 RNA는 TP53이고, 상기 질환 또는 상태는 암이고;

(ii) 상기 타겟 RNA는 IDUA이고, 상기 질환 또는 상태는 I형 점액 다당류증(MPS I)이고;

(iii) 상기 타겟 RNA는 COL3A1이고, 상기 질환 또는 상태는 엘러스-단로스 증후군이고;

(iv) 상기 타겟 RNA는 BMPR2이고, 상기 질환 또는 상태는 주버트 증후군이고;

(v) 상기 타겟 RNA는 FANCC이고, 상기 질환 또는 상태는 판코니 빈혈이고;

(vi) 상기 타겟 RNA는 MYBPC3이고, 상기 질환 또는 상태는 원발성 가족성 비대 심근병증이고; 또는

(vii) 상기 타겟 RNA는 IL2RG이고, 상기 질환 또는 상태는 X-염색체 연관 중증복합면역결핍증인 방법.

47. RNA 아데노신 탈아미노효소(ADAR)를 리크루팅함으로써 타겟 RNA에서의 타겟 아데노신을 탈아미노화하기 위한 탈아미노효소-리크루팅 RNA(dRNA)로서, 상기 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하는 탈아미노효소-리크루팅 RNA.

48. 실시형태 47에 있어서, 상기 RNA 서열은 상기 타겟 RNA에서 상기 타겟 아데노신의 정반대쪽에 시토신, 아데노신 또는 U를 포함하는 탈아미노효소-리크루팅 RNA.

49. 실시형태 48에 있어서, 상기 RNA 서열은 상기 타겟 RNA에서 타겟 아데노신의 정반대쪽에 시티딘 미스매치를 포함하는 dRNA.

50. 실시형태 49에 있어서, 상기 시티딘 미스매치는 dRNA에서 상보적 서열의 3' 말단으로부터 적어도 20개의 뉴클레오티드 이간되고, 또한 상보적 서열의 5' 말단으로부터 적어도 5개의 뉴클레오티드 이간되어 위치되는 dRNA.

51. 실시형태 50에 있어서, 상기 시티딘 미스매치가 dRNA에서 상보적 서열의 중심으로부터 10개의 뉴클레오티드 이내에(예를 들면 중심에) 위치되는 dRNA.

52. 실시형태 47-51 중 어느 하나에 있어서, 상기 RNA 서열은 상기 타겟 RNA에서 비타겟 아데노신에 각각 정반대쪽에 하나 이상의 구아노신을 추가로 포함하는 탈아미노효소-리크루팅 RNA.

53. 실시형태 47-51 중 어느 하나에 있어서, 상기 상보성 서열은 상기 타겟 RNA에서 비타겟 아데노신의 반대쪽에 2개 이상의 연속한 미스매치 뉴클레오티드를 포함하는 dRNA.

54. 실시형태 47-53 중 어느 하나에 있어서, 상기 타겟 아데노신은 상기 타겟 RNA에서 UAG, UAC, UAA, UAU, CAG, CAC, CAA, CAU, AAG, AAC, AAA, AAU, GAG, GAC, GAA 및 GAU로 이루어진 군에서 선택된 3-염기 모티프로 있는 탈아미노효소-리크루팅 RNA.

55. 실시형태 54에 있어서, 상기 3-염기 모티프는 UAG이고, 상기 dRNA는 3-염기 모티프에서 우리딘의 정반대쪽에 아데노신, 타겟 아데노신의 정반대쪽에 시티딘, 및 3-염기 모티프에서 구아노신의 정반대쪽에 시티딘, 구아노신 또는 우리딘을 포함하는 탈아미노효소-리크루팅 RNA.

56. 실시형태 55에 있어서, 상기 3-염기 모티프는 상기 타겟 RNA에서 UAG이고, 상기 탈아미노효소-리크루팅 RNA는 상기 타겟 RNA의 UAG 반대쪽에 ACC, ACG 또는 ACU를 포함하는 탈아미노효소-리크루팅 RNA.

57. 실시형태 47-56 중 어느 하나에 있어서, 탈아미노효소-리크루팅 RNA는 길이가 약 40-260개의 뉴클레오티드인 탈아미노효소-리크루팅 RNA.

58. 실시형태 57에 있어서, dRNA는 길이가 약 70개의 뉴클레오티드를 초과하는 dRNA.

59. 실시형태 57 또는 58에 있어서, dRNA는 길이가 약 100개 내지 약 150개의 뉴클레오티드(예를 들면 약 110~150개)인 dRNA.

60. 실시형태 47-59 중 어느 하나에 있어서, dRNA는 ADAR-리크루팅 도메인(예를 들면 DSB-결합 도메인, GluR2 도메인 또는 MS2 도메인)을 포함하지 않는 dRNA.

61. 실시형태 47-60 중 어느 하나에 있어서, dRNA는 화학 수식된 뉴클레오티드(예를 들면 2'-O-메틸 또는 포스포로티오에이트 수식)를 포함하지 않는 dRNA.

62. 실시형태 47-61 중 어느 하나에 기재된 탈아미노효소-리크루팅 RNA를 인코딩하는 구축물.

63. 실시형태 62에 있어서, 상기 구축물은 바이러스 벡터(예를 들면 렌티바이러스 벡터) 또는 플라스미드인 구축물.

64. 실시형태 47-61 중 어느 하나에 기재된 탈아미노효소-리크루팅 RNA 또는 실시형태 62 또는 63에 기재된 구축물을 복수개 포함하는 라이브러리.

65. 실시형태 47-61 중 어느 하나에 기재된 탈아미노효소-리크루팅 RNA, 실시형태 62 또는 63에 기재된 구축물, 또는 실시형태 64에 기재된 라이브러리를 포함하는 조성물.

66. 실시형태 47-61 중 어느 하나에 기재된 탈아미노효소-리크루팅 RNA 또는 실시형태 62 또는 63에 기재된 구축물을 포함하는 숙주 세포.

67. 실시형태 66에 있어서, 숙주 세포는 진핵 세포인 숙주 세포.

68. 실시형태 66 또는 67에 있어서, 숙주 세포는 1차 세포인 숙주 세포.

69. 탈아미노효소-리크루팅 RNA를 포함하는, 숙주 세포에서 타겟 RNA를 편집하기 위한 키트로서, 상기 탈아미노효소-리크루팅 RNA는 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 탈아미노효소-리크루팅 RNA는 타겟 RNA에서 타겟 아데노신을 탈아미노화하기 위해 ADAR을 리크루팅할 수 있는 키트.

실시예

이하의 실시예는 전적으로 본 출원을 예시하기 위한 것이며, 따라서 어떠한 방식으로든 본 발명을 제한하는 것으로 간주되어서는 안된다. 하기 실시예 및 상세한 설명은 제한이 아닌 예시로서 제공된다.

재료 및 방법

플라스미드 구축

이중 형광 리포터는 DNA를 코딩하는 mCherry 및 EGFP(EGFP 제 1 코돈 ATG가 삭제됨)를 PCR 증폭함으로써 클로닝했고, 3×GS 링커 및 타겟팅 DNA 서열은 PCR 동안 프라이머를 통해 추가했다. 그 다음, PCR 생성물을 IIs형 제한 효소 BsmB1(Thermo) 및 T4 DNA 리가아제(NEB)에 의해 절단 및 링크한 다음, pLenti 백본(pLenti-CMV-MCS-SV-Bsd, 스탠리 코언 실험실, 스탠포드 대학)에 삽입했다.

dLbuCas13 DNA를 Lbu 플라스미드(Addgene #83485)로부터 PCR 증폭했다. ADAR1DD 및 ADAR2DD를 샤먼 대학교의 Han의 실험실로부터 제공된 Adar1(p150) cDNA 및 Adar2 cDNA로부터 증폭시켰다. ADAR1DD 또는 ADAR2DD는 오버랩-PCR에 의해 dLbuCas13 DNA에 융합했고, 융합된 PCR 생성물은 pLenti 백본에 삽입했다.

포유류 세포에서의 dRNA의 발현을 위해, dRNA 서열을직접 합성하고(짧은 dRNA의 경우), 또한 오버랩핑 ssDNA를 합성함으로써 어닐링 또는 PCR 증폭하고, 생성물을 골든 게이트 클로닝(Golden-gate cloning)에 의해 U6 발현 하에 대응하는 벡터에 클로닝했다.

전장 Adar1(p110) 및 Adar1(p150)을 Adar1(p150) cDNA로부터 PCR 증폭했고, 전장 Adar2는 Adar2 cDNA로부터 PCR 증폭한 다음, 각각 pLenti 백본에 클로닝했다.

이중 형광 리포터의 3가지 버전(리포터-1, -2 및 -3)의 경우, mCherry 및 EGFP(EGFP의 개시 코돈 ATG가 삭제됨) 코딩 서열을 PCR 증폭하고, BsmBI(Thermo Fisher Scientific, ER0452)를 사용하여 분해한 다음, GGGGS 링커로 T4 DNA 리가아제(NEB, M0202L)-매개 결찰했다. 이어서, 결찰 생성물을 pLenti-CMV-MCS-PURO 백본에 삽입했다.

dLbuCas13-ADAR_DD(E1008Q) 발현 구축물의 경우, ADAR1_DD 유전자를 ADAR1^p150 구축물(샤먼 대학교의 Jiahuai Han의 실험실로부터 제공됨)로부터 증폭했다. dLbuCas13 유전자는 Lbu_C2c2_R472A_H477A_R1048A_H1053A 플라스미드(Addgene #83485)로부터 PCR에 의해 증폭했다. ADAR1_DD(고활성 E1008Q 변이체)를 오버랩 PCR에 의해 생성한 다음, dLbuCas13에 융합했다. 결찰 생성물을 pLenti-CMV-MCS-BSD 백본에 삽입했다.

arRNA 발현 구축물의 경우, arRNA의 서열을 합성하고, pLenti-sgRNA-lib 2.0(Addgene #89638) 백본에 골든 게이트 클로닝하고, arRNA의 전사를 hU6 프로모터에 의해 구동했다. ADAR 발현 구축물의 경우, 전장 ADAR1^p110 및 ADAR1^p150은 ADAR1^p150 구축물로부터 PCR 증폭했고, 전장 ADAR2는 ADAR2 구축물로부터 PCR 증폭했다(샤먼 대학교, Jiahuai Han의 실험실로부터 제공됨). 그 다음, 증폭된 생성물을 pLenti-CMV-MCS-BSD 백본에 클로닝했다. 병원성 돌연변이를 갖는 유전자를 발현하는 구축물의 경우, TP53의 전장 코딩 서열(Vigenebio에서 주문) 및 다른 6개의 질환 관련 유전자(COL3A1, BMPR2, AHI1, FANCC, MYBPC3 및 IL2RG, 중국 의학 과학원, 병원체 생물학 연구소, Jianwei Wang의 실험실로부터 제공됨)는 돌연변이유발 PCR을 통해 G>A 돌연변이를 도입하여 대응하는 유전자를 인코딩하는 구축물로부터 증폭했다. 증폭된 생성물은 Gibson 클로닝 방법⁵⁹을 통해 pLenti-CMV-MCS-mCherry 백본에 클로닝했다.

포유류 세포주 및 세포 배양

포유류 세포주를 둘베코 변형 이글 배지(Dulbecco's Modified Eagle Medium)(10-013-CV, Corning, 미구 매사추세츠주 트윅스버리)에서 배양하고, 10% 소 태아 혈청(Lanzhou Bailing Biotechnology Co., Ltd., 중국 란저우)을 첨가하고, 37℃에서 5% CO₂ 하에서 1% 페니실린-스트렙토마이신을 보충했다. Adar1-KO 세포주는 EdiGene China에서 구입했으며, 유전자형 분류 결과도 EdiGene China에 의해 제공되었다.

HeLa 및 B16 세포주는 Z. Jiang의 실험실(베이징 대학교)로부터 제공되었다. 또한, HEK293T 세포주는 C. Zhang의 실험실(베이징 대학교)로부터 제공되었다. RD 세포주는 J Wang의 실험실(병원체 생물학 연구소, 베이징 협화 의학원 & 중국 의학과학원)로부터 제공되었다. SF268 세포주는 중국 의학 과학원 기초 의학과학 연구소 세포 센터로부터 제공되었다. A549 및 SW13 세포주는 EdiGene Inc.로부터 제공되었다. HepG2, HT29, NIH3T3 및 MEF 세포주는 베이징 대학교의 본 출원인의 실험실에서 유지 관리했다. 이들 포유류 세포주는 10% 소 태아 혈청(CellMax, SA201.02)과 함께 둘베코 변형 이글 배지(Corning, 10-013-CV)에서 배양했으며, 37℃에서 5% CO₂ 하에서 1% 페니실린-스트렙토마이신을 추가로 보충했다. 달리 기재되어 있지 않는 한, 세포는 제조업체의 지침에 따라 X-tremeGENE HP DNA 형질감염 시약(Roche, 06366546001)으로 형질감염시켰다.

인간 1차 폐 섬유아세포(#3300) 및 인간 1차 기관지 상피세포(#3210)는 ScienCell Research Laboratories, Inc.에서 구입했으며, 섬유아세포 배지(ScienCell, #2301) 및 기관지 상피세포 배지(ScienCell, #3211)에서 각각 배양했다. 두 배지 모두 15% 소 태아 혈청(BI) 및 1% 페니실린-스트렙토마이신으 보충했다. 1차 GM06214 및 GM01323 세포는 Coriell Institute for Medical Research에서 주문했으며, 둘베코 변형 이글 배지(Corning, 10-013-CV)에서 15% 소 태아 혈청(BI) 및 1% 페니실린-스트렙토마이신과 함께 배양했다. 모든 세포는 37℃에서 5% CO₂ 하에서 배양했다.

리포터 시스템 형질감염, FACS 분석 및 생어 시퀀싱

이중 형광 리포터 편집 실험의 경우, 293T-WT 세포 또는 293T-Adar1-KO 세포를 6웰 플레이트(6×10⁵ 세포/웰)에 시딩하고, 24시간 후, 1.5㎍ 리포터 플라스미드 및 1.5㎍ dRNA 플라스미드를 X-tremeGENE HP DNA 형질감염 시약(06366546001; Roche, 독일 만하임)을 사용하여 공급업체의 프로토콜에 따라 공-형질감염시켰다. 48~72시간 후 세포를 수집하고 FACS 분석을 수행했다. 리포터 mRNA 편집을 추가로 확인하기 위해, 우리는 FACS Aria 유세포 분석기(BD Biosciences)를 사용하여 리포터 및 dRNA 플라스미드로 형질감염된 293T-WT 세포로부터 EGFP 양성 세포를 분류한 다음, 전체 RNA 단리(TIANGEN, DP430)를 했다. 그 다음, RNA를 RT-PCR(TIANGEN, KR103-04)을 통해 cDNA에 역전사하고, 타겟팅된 유전자좌를 대응하는 프라이머 쌍(23 PCR 사이클)으로 PCR 증폭하고, PCR 생성물을 생어 시퀀싱을 위해 정제했다.

Adar1(p110), Adar1(p150) 또는 Adar2 구제 및 과발현 실험의 경우, 293T-WT 세포 또는 293T-Adar1-KO 세포를 12웰 플레이트(2.5×10⁵세포/웰)에 시딩하고, 24시간 후 0.5㎍ 리포터 플라스미드, 0.5㎍ dRNA 플라스미드 및 0.5㎍ Adar1/2 플라스미드(대조군으로서 pLenti 백본)를 X-tremeGENE HP DNA 형질감염 시약(06366546001, Roche, 독일 만하임)을 사용하여 공-형질감염시켰다. 48∼72시간 후 세포를 수집하고 FACS 분석을 수행했다.

내인성 mRNA 실험을 위해, 293T-WT 세포를 6웰 플레이트(6×10⁵세포/웰)에 시딩했다. 대략 70%가 융합하면, 3㎍ dRNA 플라스미드를 X-tremeGENE HP DNA 형질감염 시약(06366546001, Roche, 독일 만하임)을 사용하여 형질감염시켰다. 72시간 후, 하기 RNA 단리를 위해 세포를 수집하고, FACS를 통해 GFP 양성 또는 BFP 양성 세포를 분류(대응하는 형광 마커에 따름)했다.

인간 1차 T 세포의 단리 및 배양

1차 인간 T 세포를 건강한 인간 기증자의 백혈구성분채집술 생성물로부터 단리했다. 간단히 말하면, 말초 혈액 단핵 세포(PBMC)는 피콜 원심 분리(Dakewei, AS1114546)에 의해 분리하고, T 세포는 PBMC로부터 EasySep 인간 T 세포 단리 키트(STEMCELL, 17951)를 사용하여 자기 음성 선택에 의해 단리했다. 단리 후, T 세포를 X-vivo15 배지, 10% FBS 및 IL2(1000U/ml)에서 배양하고, CD3/CD28 DynaBeads(ThermoFisher, 11131D)로 2일 동안 자극했다. 건강한 기증자의 백혈구 성분채집술 생성물은 AllCells LLC China로부터 구입했다. 모든 건강한 기증자에게 사전 동의를 구했다.

렌티바이러스 패키지 및 리포터 세포주 구축물

발현 플라스미드를 X-tremeGENE HP DNA 형질감염 시약을 통해 2개의 바이러스 패키징 플라스미드인 pR8.74 및 pVSVG(Addgene)와 함께 HEK293T-WT 세포로 공-형질감염시켰다. 72시간 후, 상등액 바이러스를 수집하고, -80℃에서 보관했다. HEK293T-WT 세포를 렌티바이러스로 감염시키고, 72시간 후, mCherry-양성 세포를 FACS를 통해 분류하고, 희석 방법을 제한함으로써 훨씬 낮은 EGFP 배경을 가진 이중 형광 리포터 시스템을 안정적으로 발현하는 단일 클론 세포주를 선택하기 위해 배양했다.

안정한 리포터 세포주의 경우, 리포터 구축물(pLenti-CMV-MCS-PURO 백본)을 2개의 바이러스 패키징 플라스미드인 pR8.74 및 pVSVG와 함께 HEK293T 세포에 공-형질감염시켰다. 72시간 후, 상등액 바이러스를 수집하고 -80℃에 보관했다. HEK293T 세포를 렌티바이러스로 감염시킨 다음, mCherry 양성 세포를 FACS를 통해 분류하고, 검출 가능한 EGFP 배경 없이 이중 형광 리포터 시스템을 안정적으로 발현하는 단일 클론 세포주를 선택하기 위해 배양했다. HEK293T ADAR1^-/- 및 TP53^-/- 세포주를 이전에 보고된 방법⁶⁰에 따라 생성했다. ADAR1-타겟팅 sgRNA 및 CMV 구동 퓨로마이신 내성 유전자를 포함하는 PCR 증폭 공여자 DNA를 HEK293T 세포에 공-형질감염시켰다. 그 다음, 세포를 형질감염 7일 후에 퓨로마이신으로 처리했다. 퓨로마이신 내성 세포로부터 단일 클론을 단리한 후, 시퀀싱 및 웨스턴 블롯을 통해 검증했다.

내인성 또는 외인성 발현 전사물의 RNA 편집

이중 형광 리포터에 대해 RNA 편집을 평가하기 위해, HEK293T 세포 또는 HEK293T ADAR1^-/- 세포를 6웰 플레이트(6×10⁵세포/웰)에 시딩했다. 24시간 후, 세포를 1.5㎍ 리포터 플라스미드 및 1.5㎍ arRNA 플라스미드로 공-형질감염시켰다. ADAR1^p110, ADAR1^p150 또는 ADAR2 단백질 발현의 효과를 조사하기 위해, 편집 효율을 EGFP 양성 비율 및 딥 시퀀싱에 의해 분석했다.

HEK293T ADAR1^-/- 세포를 12웰 플레이트(2.5×10⁵세포/웰)에 시딩했다. 24시간 후, 세포를 0.5㎍의 리포터 플라스미드, 0.5㎍의 arRNA 플라스미드 및 0.5㎍의 ADAR1/2 플라스미드(대조군으로서 pLenti 백본)로 공-형질감염시켰다. 편집 효율은 EGFP 양성 비율 및 딥 시퀀싱에 의해 분석했다.

내인성 mRNA 전사물에 대한 RNA 편집을 평가하기 위해, HEK293T 세포를 6웰 플레이트(6×10⁵세포/웰)에 시딩했다. 24시간 후, 세포를 3㎍의 arRNA 플라스미드로 형질감염시켰다. 편집 효율은 딥 시퀀싱에 의해 분석했다.

다중 세포주에서의 RNA 편집 효율을 평가하기 위해, 8-9×10⁴(RD, SF268, HeLa) 또는 1.5×10⁵(HEK293T) 세포를 12웰 플레이트에 시딩했다. HT29, A549, HepG2, SW13, NIH3T3, MEF 및 B16과 같이 형질감염이 어려운 세포의 경우, 2-2.5×10⁵세포를 6플레이트에 시딩했다. 24시간 후, 리포터와 arRNA 플라스미드를 이들 세포에 공-형질감염시켰다. 편집 효율은 EGFP 양성 비율에 의해 분석했다.

EGFP 양성 비율을 평가하기 위해, 형질감염 후 48∼72시간에서 세포를 형광 활성화 세포 분류(FACS) 분석에 의해 분류 및 수집했다. mCherry 신호는 리포터/arRNA-발현 세포를 위한 형광 선택 마커로 사용되었으며, EGFP+/mCherry+ 세포의 백분율을 편집 효율에 대한 판독값으로서 계산했다.

A에서 I로의 편집률의 NGS 정량화를 위해, 형질감염 후 48~72시간에서 세포를 FACS 분석에 의해 분류 및 수집한 다음, RNA 단리(TIANGEN, DP420)를 실시했다. 그 다음, RT-PCR(TIANGEN, KR103-04)을 통해 전체 RNA를 cDNA로 역전사하고, 타겟 유전자좌를 하기 표에 나열된 대응하는 프라이머로 PCR 증폭했다.

PCR 생성물은 생어 시퀀싱 또는 NGS(Illumina HiSeq X Ten)를 위해 정제되었다.

딥 시퀀싱

내인성 mRNA 편집 실험을 위해, 293T-WT 세포를 6웰 플레이트(6×10⁵세포/웰)에 시딩했다. 대략 70%가 융합하면, HEK293 세포를 X-tremeGENE HP DNA 형질감염 시약(Roche)을 사용하여 3㎍ dRNA로 형질감염시켰다. 72시간 후, FACS를 통해 GFP-양성 또는 BFP-양성 세포를 분류(대응하는 형광 마커에 따라)한 다음, RNA 단리를 수행했다. 그 다음, 단리된 RNA를 RT-PCR을 통해 cDNA에 역전사시키고, 특정한 타겟팅된 유전자좌를 대응하는 프라이머 쌍(23 PCR 사이클)으로 증폭하고, Illumina NextSeq에서 시퀀싱했다.

다중 세포주에서 테스트

HEK293T(양성 대조군) 및 HEK293T ADAR1^-/-(음성 대조군) 세포 외에, 상이한 조직 및 기관으로부터 유래하는 1개의 마우스 세포주(NIH3T3) 및 7개의 인간 세포주(RD, HeLa, SF268, A549, HepG2, HT-29, SW13)를 실험을 수행하기 위해 선택했다. 형질감염 효율이 더 높은 세포주의 경우, 약 8-9×10⁴세포(RD, HeLa, SF268) 또는 1.5×10⁵(HEK293T)를 12웰 플레이트의 각 웰에 플레이팅하고, 형질감염이 곤란한 것((A549, HepG2, HT-29, SW13, NIH3T3)에 대해서는, 2-2.5×10⁵세포를 6웰 플레이트에 플레이팅했다. 또한, 모든 이들 세포를 37℃에서 5% CO₂와 함께 10% 소 태아 혈청(FBS, CellMax)이 보충된 둘베코 변형 이글 배지(DMEM, Corning)에서 유지되었다. 24시간 후, CG2 리포터 및 71개의 뉴클레오티드 dRNA(35-C-35) 플라스미드를 X-tremeGENE HP DNA 형질감염 시약(Roche)을 사용하여 상이한 유형의 세포에 공-형질감염시켰다. 형질감염 48시간 후, 세포를 트립신화하고, FACS(BD)를 통해 분석했다. 형질감염 효율이 낮은 세포는 mCherry 및 BFP 양성 세포가 상당히 적었기 때문에, 6웰 플레이트에 플레이팅된 세포에 대해서는 FACS 분석을 위한 총 세포수를 1×10⁵까지 증가시켰다.

타겟팅된 부위에 대한 RNA 편집 분석

딥 시퀀싱 분석을 위해, arRNA 커버링 서열의 타겟팅된 부위 서열(상류 및 하류 20개의 뉴클레오티드)을 사용하여 인덱스를 생성했다. 판독은 BWA 버전 0.7.10-r789를 사용하여 정렬 및 정량화했다. 그 다음, 정렬 BAM은 Samtools에 의해 분류하고, RNA 편집 부위는 REDitools 버전 1.0.4를 사용하여 분석했다. 파라미터는 다음과 같다: -U[AG 또는 TC]-t 8-n 0.0-T 6-6 -e -d -u. 피셔(Fisher) 정확 검증(p-값<0.05)에 의해 계산된 arRNA 타겟팅 영역 내의 모든 유의한 A>G 전환은 arRNA에 의한 편집으로 간주했다. 타겟팅된 아데노신을 제외한 전환은 오프-타겟 편집이었다. 대조군과 실험군에서 동시에 나타난 돌연변이는 SNP로 간주했다.

전장 전사체 RNA-시퀀싱 분석

BFP 발현 카세트를 갖는 대조군 RNA₁₅₁ 또는 arRNA₁₅₁-PPIB-발현 플라스미드를 HEK293T 세포에 형질감염시켰다. BFP⁺ 세포는 형질감염 48시간 후 FACS에 의해 농축했고, RNA는 RNAprep Pure Micro 키트(TIANGEN, DP420)를 사용하여 정제했다. 그 다음, NEBNext Poly(A) mRNA Magnetic Isolation Module(New England Biolabs, E7490)을 사용하여 mRNA를 정제하고, NEBNext Ultra II RNA Library Prep Kit for Illumina(New England Biolabs, E7770)로 처리 한 다음, Illumina HiSeq X Ten 플랫폼(2×150-bp 페어드 엔드, 각 샘플에 대해 30G)을 사용한 딥 시퀀싱 분석을 했다. 형질감염으로 인한 비특이적 효과를 배제하기 위해, 형질감염 시약으로 세포만 처리한 모조군을 포함시켰다. 각 군에는 4개의 복제가 포함되었다.

생물정보학 분석 파이프라인은 Vogel et al²²에 의한 작업을 참조했다. 분석의 품질 관리는 FastQC를 사용하여 수행되었으며, 품질 트림은 Cutadapt를 기반으로 했다(각 판독에 대한 처음의 6bp는 트리밍되었고, 최대 20-bp가 품질 트리밍되었다). AWK 스크립트를 도입된 arRNA를 필터링하기 위해 사용했다. 트리밍 후, 길이가 90개의 뉴클레오티드 미만인 판독은 필터링했다. 이어서, 필터링된 판독은 STAR 소프트웨어⁶¹에 의해 참조 게놈(GRCh38-hg38)에 매핑했다. 우리는 변이체를 호출하기 위해 GATK Haplotypcaller⁶²를 사용했다. GATK에 의해 생성된 raw VCF 파일을 GATK VariantFiltration, bcftools 및 ANNOVAR⁶³에 의해 필터링하고 주석을 달았다. dbSNP에서의 변이체, 1000 Genome⁶⁴, EVS는 필터링했다. 그 다음, 각 군의 4개 복제물에서 공유된 변이체를 RNA 편집 부위로서 선택했다. 모조군의 RNA 편집 수준을 배경으로 간주하고, 대조군 RNA₁₅₁ 및 arRNA₁₅₁-PPIB의 글로벌 타겟을 모조군에서 변이체를 제함으로써 얻었다.

LEAPER가 자연적인 편집 항상성을 교란하는지를 평가하기 위해, 모조군과 arRNA₁₅₁-PPIB군(또는 대조군 RNA₁₅₁군)에 의해 공유된 글로벌 편집 부위를 분석했다. 네이티브 A에서 I로의 편집 부위에서의 차등 RNA 편집률은 피어슨의 상관 계수 분석을 이용하여 평가했다. 모조군과 arRNA₁₅₁-PPIB군(또는 대조군 RNA₁₅₁군) 사이의 편집률의 피어슨 상관 관계를 계산하고 도 6에 주석을 달았다.

X는 모조군에서의 각 부위의 편집률을 의미하고; Y는 대조군 RNA₁₅₁군(도 6a) 또는 arRNA₁₅₁-PPIB군(도 6b)에서의 각 부위의 편집률을 의미하고; σ_x는 X의 표준 편차이고; σ_Y는 Y의 표준 편차이고; μ_X는 X의 평균이고; μ_Y는 Y의 평균이고; E는 기대치이다.

RNA-Seq 데이터를 RNA 편집 이벤트에 의해 유도된 가능한 전사 변화의 문의(interrogation)에 대해 분석했다. 전장 전사체의 유전자 발현 분석은 HISAT2 및 STRINGTIE 소프트웨어⁶⁵를 사용하여 수행했다. 시퀀싱 데이터의 품질 관리를 위해 Cutadapt 및 FastQC를 사용했다. 그 다음, HISAT2를 사용하여 시퀀싱 판독을 참조 게놈(GRCh38-hg38)에 매핑한 다음, 상술한 바와 같이 피어슨의 상관 계수 분석을 수행했다.

웨스턴 블롯

우리는 ADAR1(Santa Cruz, sc-271854), ADAR2(Santa Cruz, sc-390995), ADAR3(Santa Cruz, sc-73410), p53(Santa Cruz, sc-99), KRAS(Sigma, SAB1404011); GAPDH(Santa Cruz, sc-47724) 및 β-튜불린(CWBiotech, CW0098)에 대해 각각 마우스 단일 클론 1차 항체를 사용했다. HRP-콘쥬게이티드 염소 항-마우스 IgG(H+L, 115-035-003) 2차 항체는 Jackson ImmunoResearch에서 구입했다. 2×10⁶개의 세포를 분류하여 용해시키고, 동일한 양의 각 용해물을 SDS-PAGE에 대해 로딩했다. 그 다음, 샘플 단백질을 PVDF 막(Bio-Rad Laboratories)으로 옮기고, ADAR 효소 중 하나에 대한 1차 항체(항-ADAR1, 1:500; 항-ADAR2, 1:100; 항-ADAR3, 1:800)로 면역블 롯팅한 다음, 2차 항체 배양(1:10,000)하고 노출시켰다. 스트리핑 버퍼(CWBiotech, CW0056)로 ADAR 단백질을 스트리핑한 후 β-튜불린을 동일한 PVDF 막에 다시 프로빙했다. 실험은 3회 반복했다. 반 정량적(semi-quantitative) 분석은 Image Lab 소프트웨어를 이용하여 행했다.

사이토카인 발현 분석

HEK293T 세포를 12개의 웰 플레이트(2×10⁵세포/웰)에 시딩했다. 약 70% 융합시, 세포를 1.5㎍의 arRNA로 형질감염시켰다. 양성 대조군으로서 1㎍의 폴리(I:C)(Invitrogen, tlrl-picw)를 형질감염시켰다. 48시간 후, 세포를 수집하고 RNA 단리(TIANGEN, DP430)를 행했다. 그 다음, 전체 RNA를 RT-PCR(TIANGEN, KR103-04)을 통해 cDNA에 역전사하고, 정량적 PCR(TAKARA, RR820a)에 의해 IFN-β및 IL-6의 발현을 측정했다. 프라이머의 서열은 상기 표에 나열했다.

p53의 전사 조절 활성 분석

p53의 전사 조절 활성을 검출하기 위해, TP53^W53X cDNA-발현 플라스미드 및 arRNA-발현 플라스미드를 p53-파이어플라이-루시페라아제 cis-리포팅 플라스미드(YRGene, VXS0446) 및 레닐라-루시페라아제 플라스미드(베이징 대학교 Z의 Jiang의 연구실로부터 제공됨)와 함께, HEK293T TP53^-/- 세포에 공-형질감염시켰다. 48시간 후, 세포를 수확하고, 제조사 프로토콜에 따라 Promega Dual-Glo 루시페라아제 에세이 시스템(Promega, E4030)으로 분석했다. 간단히 말해, 150μL Dual-Glo 루시페라아제 시약을 수확된 세포 펠릿에 추가하고, 30분 후 Infinite M200 리더(TECAN)에 의해 96웰 백색 플레이트에 100μL Dual-Glo 루시페라아제 시약(세포 용해)를 첨가함으로써 파이어플라이 발광을 측정했다. 30분 후, 100μL Dual-Glo stop과 Glo 시약을 각 웰에 순차적으로 첨가하여 레닐라 발광을 측정하고, 레닐라 발광에 대한 파이어플라이 발광의 비율을 계산했다.

1차 세포에서의 전기천공

인간 1차 폐 섬유아세포 또는 인간 1차 기관지 상피세포에서의 arRNA 발현 플라스미드 전기천공의 경우, 20㎍ 플라스미드를 Nucleofector^TM 2b 장치(Lonza) 및 Basic Nucleofector^TM 키트(Lonza, VPI-1002)로 전기천공하고, 전기천공 프로그램은 U-023였다. 인간 1차 T 세포에서의 arRNA 발현 플라스미드 전기천공의 경우, 20㎍ 플라스미드를 Nucleofector^TM 2b 장치(Lonza) 및 Human T cell Nucleofector^TM 키트(Lonza, VPA-1002)를 사용하여 인간 1차 T 세포에 전기천공하고, 전기천공 프로그램은 T-024였다. 전기천공 48시간 후, 세포를 분류하고 FACS 분석에 의해 수집 한 다음, 타겟팅된 RNA 편집 어세이를 위해 하기의 딥 시퀀싱을 수행했다. 형광 마커에 따라 전기천공 효율을 정규화했다.

인간 1차 T 세포 또는 1차 GM06214 세포에서 화학합성 arRNA 또는 대조군 RNA 전기천공을 위해, RNA 올리고를 최종 농도가 2μM인 100μL opti-MEM 배지(Gbico, 31985070)에 용해시켰다. 그 다음, 1×10E6 GM06214 세포 또는 3×10E6 T 세포를 상기 전기천공 혼합물로 재현탁하고, 1ms 동안 450V에서 애자일 펄스 인 비보 장치(Agile Pulse In Vivo Device)(BTX)로 전기천공했다. 그 다음, 세포를 하기 분석을 위해 따뜻한 배양 배지로 옮겼다.

α-L- 아이두로니데이스 ( IDUA ) 촉매 활성 분석

수확된 세포 펠릿을 재현탁하고 30분 동안 얼음 위에서 1×PBS 완충액에서 28μL 0.5% Triton X-100으로 용해시켰다. 그 다음, 25μL의 세포 용해물을 pH 3.5의 0.2 Triton X-100을 함유하는 0.4M 나트륨 포르메이트 완충액에 용해시킨 190μM 4-메틸움베릴페릴-α-L-아이두로니데이스 기질(Cayman, 2A-19543-500) 25μL에 첨가하고, 암중에서 37℃에서 90분간 배양했다. pH 10.3의 0.5M NaOH/글리신 완충액 200μL를 첨가함으로써 촉매 반응을 켄칭한 후, 4℃에서 2분간 원심 분리했다. 상층액을 96웰 플레이트에 옮기고, Infinite M200 리더(TECAN)로 365nm 여기 파장 및 450nm 방출 파장에서 형광을 측정했다.

실시예 1. 리포터에 대한 본 발명의 RNA 편집 방법의 테스트

Cas13 계열 단백질(C2c2)이 포유류 세포에서 RNA를 편집할 수 있다고 보고되어 있다. 우리는 다양한 조건 하에서 이 시스템을 추가로 테스트했다. 우선, mCherry와 EGFP 유전자 사이에 정지 코돈을 포함하는 3×GS 링커 타겟팅 서열을 도입함으로써, mCherry 및 EGFP 형광을 기반으로 한 이중 형광 리포터 시스템을 구축했다. 또한, 우리는 EGFP 번역의 누락을 저감하기 위해 EGFP의 개시 코돈 ATG를 삭제했다.

이중 형광 리포터-1은 mCherry의 서열(서열 번호: 1), 3×GS 링커 및 타겟팅된 A를 포함하는 서열(서열 번호: 2), 및 eGFP의 서열(서열 번호: 3)을 포함한다.

(3×GS 링커(이탤릭체 및 굵은체로 표시) 및 타겟팅된 A(더 크고 및 굵은 A로 표시)를 포함하는 서열 (서열번호:2)

이중 형광 리포터-2는 mCherry의 서열(서열번호: 1), 3×GS 링커(이탤릭체 및 굵은체로 표시) 및 타겟팅된 A(더 크고 굵은 A로 표시)를 포함하는 서열(서열번호: 4), 및 eGFP의 서열(서열 번호: 3)을 포함한다.

(3×GS 링커(이탤릭체 및 굵은 체로 표시) 및 타겟 A(더 크고 굵은 문자로 표시)를 포함하는 서열)(서열 번호 4))

이중 형광 리포터-3은 mCherry의 서열(서열 번호 1), 1×GS 링커(이탤릭체 및 굵은체로 표시) 및 타겟팅된 A를 포함하는 서열(서열 번호 5), 및 eGFP의 서열(서열 번호: 3)을 포함한다.

(1×GS 링커(이탤릭체 및 굵은체로 표시) 및 타겟팅된 A(더 크고 굵은 A로 표시)를 포함하는 서열)(서열 번호 5)

우리는 mCherry-3×GS 링커-TAG-EGFP를 pLenti-백본에 클로닝하고, 리포터 플라스미드를 렌티바이러스에 패킹하여 이중 형광 리포터를 발현하는 안정적인 세포주를 구축하는 293T 세포를 감염시켰다. 그 다음, 우리는 리포터 시스템으로서 EGFP 형광 배경이 낮은 단일 클론을 선택했다. 최적의 crRNA 디자인을 테스트하기 위해, LbucC2c2 crRNA 가이드를 타겟팅 아데노신에 걸쳐 28∼78개의 뉴클레오티드 길이의 스페이서로 타일링했다. 우리는 더 긴 crRNA 가이드가 더 높은 EGFP 양성 효율을 부여한다는 것을 발견했다. 놀랍게도, 우리가 임의의 dC2c2-ADARDD 발현 플라스미드의 코형질감염 없이 타겟팅 crRNA 플라스미드를 형질감염했을 때, EGFP 단백질이 실질적으로 발현된다. 예를 들면 서열 GGACCACCCCAAAAAUGAAUAUAACCAAAACUGAACAGCUCCUCGCCCUUGCUCACUGGCAGAGCCCUCCAGCAUCGCGAGCAGGCGCUGCCUCCUCCGCC(서열번호: 6)을 갖는 crRNA 가이드는 25% 이상의 EGFP 양성 효율을 부여했다. 이것은 정지 코돈 UAG의 아데닌이 크게 편집되었음을 나타낸다. 대조적으로, 랜덤 crRNA는 EGFP 음성 세포를 양성으로 되게 할 수 없었다(도 6a, 6b 및 6c). 이러한 결과를 기반으로 하여, 우리는 RNA 전사물의 과발현만이 RNA를 편집하기 위해 내인성 ADAR 효소를 활용할 수 있다고 추론했다.

또한, 우리는 RNA 가이드에서의 스캐폴드 RNA 서열을 삭제하여, 선형 가이드 RNA를 생성했다. 우리는 A-C 미스매치를 갖는 타겟팅 RNA에 상보적인 70개의 뉴클레오티드 길이의 RNA (AAACCGAGGGAUCAUAGGGGACUGAAUCCACCAUUCUUCUCCCAAUCCCUGCAACUCCUUCUUCCCCUGC (서열번호: 7))는 EGFP 음성 세포를 EGFP 양성 세포로 효율적으로 전환할 수 있는 반면, 70개의 뉴클레오티드 랜덤 RNA (UGAACAGCUCCUCGCCCUUGCUCACUGGCAGAGCCCUCCAGCAUCGCGAGCAGGCGCUGCCUCCUCCGCC (서열 번호 8)는 할 수 없었다(도 1a, 1b, 1c 및 1d). 따라서, 우리는 이 RNA를 dRNA(탈아미노효소-리크루팅 RNA)로 지정한다. 세포 내인성 ADAR이 dRNA에 의한 아데닌 탈아미노화를 수행하기 위해 리크루팅될 수 있는지를 확인하기 위해, 우리는 AdaR1 p110 및 AdaR1 p150 이중 녹아웃 293T 세포주에서 실험을 행했다(도 6e 및 6f). Adar1은 보편적으로 발현되는 반면, Adar2는 주로 뇌에서 높은 수준으로 발현되기 때문이다. 그래서, 우리는 dRNA에 의한 타겟팅 아데닌 탈아미노화는 Adar2가 아닌 Adar1에 의해 주로 매개된다는 것을 제안했다. 예상대로, 타겟팅 dRNA는 293T-Adar1-/- 세포에서 EGFP 발현을 유발할 수 없었지만, 외인성 AdaR1 p110, p150 또는 Adar2를 과발현하면 293T-Adar1-/- 세포에서 EGFP 발현을 구제할 수 있는 바(도 1e 및 1f). 293T 세포에서, dRNA는 타겟 RNA에 대한 아데닌 탈아미노화를 매개할 수 있도록 Adar1 또는 Adar2를 리크루팅할 수 있다는 것을 시사한다. 또한, 우리는 Adar1-p110 및 Adar2는 Adar1-p110 및 Adar1-p150의 상이한 세포 국재성으로 인해 가능할 수 있는, Adar1-p150(도 1g 및 도 6g)보다 더 높은 편집 활성을 갖는 것을 발견했다.

EGFP 형광의 복원이 타겟팅 RNA 편집 이벤트에 인한 것인지 확인하기 위해, RT-PCR을 통해 리포터-2 전사물의 dRNA 매개 편집을 직접 측정한 다음, 타겟팅된 생어 시퀀싱 및 차세대 시퀀싱을 행했다. 시퀀싱 결과는 타겟팅된 아데닌(A-C 미스매치 부위)에서 A에서 G로의 염기 전환이 나타났고, 편집률은 13%에 도달할 수 있었다(도 6h 및 도 1h). 게다가, 우리는 또한 증가된 이중 RNA 영역으로 인하여 가장 가능할 수 있는, 서열 창이 타겟팅된 아데닌에 근접하는 동안, A에서 G로의 약간의 편집이 관찰되어, 추후 우리는 수개의 전략으로 예기치 않은 편집을 제거하려고자 할 것이다.

실시예 2. dRNA 설계를 위한 요인의 최적화

다음으로, 우리는 더 높은 편집 효율을 달성하기 위해 dRNA를 최적화를 시작했다. 우선, 우리는 타겟팅된 아데닌의 반대쪽 부위의 염기가 편집하기 유리한지를 결정하는 것을 목표로 했다. 이전 연구에서는 타겟팅된 아데노신의 반대쪽 염기가 효율적인 편집에 영향을 미친다는 것을 나타내었다. 따라서, 우리는 타겟팅된 A의 반대쪽의 중간 위치에 미스매치 N(A, U, C 및 G)을 갖는 71개의 뉴클레오티드 dRNA를 설계했다. FACS 결과를 기반으로, 우리는 4개의 상이한 dRNA가 다음과 같이 효율적으로 편집되는 것을 발견했다: C>A>U>G(도 2a 및 2b). 최근에는, 타겟 UAG 부위에 기포가 거의 없는 것이 편집 효율에 유익할 수 있다는 것이 보고되어 있다. 따라서, 우리는 우리의 가설을 테스트하기 위해 타겟 UAG 부위를 갖는 2개 또는 3개의 미스매치 염기를 포함하는 dRNA를 설계했다. 골든 게이트 클로닝 방법을 사용하여, BFP 마커가 있는 dRNA 벡터에 대해 16개의 상이한 71개의 뉴클레오티드 dRNA를 설계하고 구축했다. 우리는 CCA 및 GCA 서열을 가진 dRNA가 효율이 가장 높았으며, 이는 적어도 UAG 타겟 부위의 경우에는 기포가 적을수록 A-I 편집에 대한 기여가 작다는 것을 의미한다. 게다가, NCA 서열의 4개의 dRNA는 GFP 양성 세포의 백분율이 더 높음으로써, 상보적인 U-A 염기 쌍이 ADAR 편집에 중요할 수 있다는 결론으로 이어졌다(도 2c 및 2d). 이어서, 리포터를 기반으로 한 상이한 길이의 dRNA의 효율을 테스트한다. dRNA는 중간 위치에서의 미스매치 C가 31개의 뉴클레오티드-221개의 뉴클레오티드 범위의 상이한 길이를 갖게 설계되었다. 우리는 dRNA가 길수록 편집 효율이 증가한다는 것을 발견했다. 리포터 시스템의 편집 피크는 171개의 뉴클레오티드 dRNA에 위치된다. 51nt dRNA는 우수한 효율(18%)로 리포터 시스템을 밝힐 수 있다(도 2e 및 2f). 마지막으로, 우리는 dRNA의 미스매치 C의 위치가 편집 효율에 영향을 미치는지의 여부를 조사했다. dRNA는 동일한 71개의 뉴클레오티드 길이로 유지되었고, 전사 개시와는 다른 위치의 미스매치 C가 설계되었다. FACS 결과에 기반하면, 반대쪽의 미스매치 C의 위치가 편집 효율에 영향을 미칠 수 있으며, 또한 dRNA의 5' 또는 3'에 위치한 미스매치 C는 낮은 효율을 갖는다는 것을 발견했다(도 2g 및 2h). 가능한 3-염기 모티프를 모두 포함하는 타겟 서열을 포함하는 16개의 상이한 리포터가 깁슨 클로닝을 통해 구축된 다음, pLenti 백본(pLenti-CMV-MCS-SV-Bsd, 스탠포드 대학교 스탠리 코언 실험실)에 클로닝되었다. 타겟 서열은 다음과 같다.

가능한 3-염기 모티프를 모두 포함하는 타겟 서열:

dRNA는 동일한 111bp 길이를 유지하고 중앙에서의 미스매치 C를 타겟 A를 향하게 설계했다.

12웰 세포 배양 클러스터에 있어서, 2×10⁵세포 HEK293T를 각 웰에 플레이 팅하고, 각 실험을 3회 반복 수행했다. 24시간 후, 0.5㎍ dRNA 플라스미드 및 0.5㎍ 리포터 타겟 플라스미드를 X-tremeGENE HP DNA 형질감염 시약(Roche)을 사용하여 세포에 공-형질감염시켰다. 48시간 후, 세포를 트립신화하고 FACS(BD)를 통해 mCherry 양성 세포에 대해 선택했다. 총 4×10⁵개의 세포를 수확하고, RNAprep 순수 세포/박테리아 키트(TIANGEN DP430)를 사용하여 전체 RNA를 추출했다. cDNA는 Quantscript RT Kit(TIANGEN KR103-04)를 사용하여 2㎍의 전체 RNA로부터 합성했다. 또한, 111개의 타겟 영역은 PCR을 통해 증폭했고, 딥 시퀀싱을 행했다.

우리는 16개의 상이한 3-염기 모티프 모두가 가변적인 효율일지라도 본 출원의 예시적인 RNA 편집 방법을 통해 편집될 수 있다는 것을 발견했다. 요약하면, 그 결과는 편집될 A의 5' 최근접 이웃은 U>C≒A>G의 선호도를 가지며, 편집될 A의 3' 최근접 이웃은 G>C>A≒U의 선호도를 갖는 것을 나타낸다. 데이터는 도 3a에서의 막대 차트 또는 도 3b의 히트맵으로서 나타내었다.

실시예 3. 내인성 유전자로부터 전사된 편집 RNA

다음으로, dRNA가 내인성 유전자로부터 전사된 mRNA를 매개할 수 있는지의 여부를 테스트했다. 우리는 KRAS, PPIB, β-액틴 및 GAPDH의 4개의 유전자를 타겟으로 하는 dRNA를 설계했다. KRAS mRNA의 경우, 우리는 91, 111, 131, 151, 171 및 191개의 뉴클레오티드 길이의 dRNA(도 4a)를 하기와 같은 서열을 갖게 설계했다.

차세대 시퀀싱 결과는 dRNA가 타겟팅된 KRAS mRNA를 최대 11.7% 편집 효율(도 4b)로 편집할 수 있다는 것을 나타냈다. 내인성 PPIB mRNA의 경우, 부위 1, 부위 2 및 부위 3의 3개의 부위를 타겟으로 했다. 우리는 각 부위 (도 4c)에 대해 151개의 뉴클레오티드 길이의 dRNA가 이하에 나타낸 바와 같은 서열을 갖게 설계했다.

차세대 시퀀싱 결과는 dRNA가 PPIB mRNA 부위 1을 최대 14% 편집률(도 4b)로 효율적으로 편집할 수 있다는 것을 나타냈다. PPIB mRNA 부위 2 및 부위 3의 경우, 편집 효율이 1.5% 및 0.6%였다(도 4e 및 4f). 내인성 β-액틴 mRNA의 경우, 우리는 2개의 타겟팅된 부위를 선택하고, 각 부위(도 4g)에 대한 dRNAfmf 이하에 나타낸 바와 같은 서열을 갖게 설계했다.

우리는 dRNA가 부위 1과 부위 2 모두에 대해 β-액틴 mRNA를 각 부위에 대해 최대 1.4% 편집 효율로 편집할 수 있다는 것을 발견했다(도 4h 및 도 8a). 또한, 우리는 dRNA-71개의 뉴클레오티드의 경우 0.6%, dRNA-131개의 뉴클레오티드의 경우 1.4%로, 더 긴 dRNA가 더 높은 편집 효율을 제공한다는 것을 관찰했다(도 3h). 또 다른 하우스키핑 유전자 GAPDH의 경우, 71개의 뉴클레오티드 dRNA (CAAGGUGCGGCUCCGGCCCCUCCCCUCUUCAAGGGGUCCACAUGGCAACUGUGAGGAGGGGAGAUUCAGUG (서열번호: 37))를 사용했고, 편집 효율은 아마도 짧은 dRNA 길이로 기인하여 0.3%이다(도 8b).

실시예 4. 예시적인 LEAPER 방법에 대한 오프 - 타겟팅 분석

치료 용도를 위해서는, 편집의 정확성이 매우 중요하다. 다음으로, 우리는 본 출원의 예시적인 RNA 편집 시스템의 특이성을 특성화하고자 했다. 분석을 위해 내인성 PPIB 부위 1과 KRAS 부위를 선택했다. PPIB 부위 1의 경우, dRNA가 커버된 영역 중에, A22, A30, A33, A34, A39, A49, A80, A91, A107 및 A140과 같은 타겟팅된 A76 측면에 위치하는 수개의 A 염기가 있다는 알 수 있었다. 측면에 있는 A 염기는 거의 편집되지 않은 반면, 타겟팅된 A76 염기(A-C 미스매치)는 최대 14%의 편집 효율을 나타냈다(도 5a 및 5b).

KRAS 부위의 경우, dRNA가 커버된 영역에서 타겟팅된 A56 염기의 측면에는 다수의 아데닌, 최대 29개의 측면 A 염기가 있다는 것을 알 수 있었다. KRAS mRNA 편집 결과로부터, 우리는 타겟팅된 A56 염기(A-C 미스매치)가 최대 11.7%의 편집 효율을 나타냈지만, 측면의 아데닌은 편집될 수 있다는 것을 발견했다(도 5c 및 5d). 다양한 오프-타겟팅된 아데닌이 편집된 한편, A41, A43, A45, A46, A74, A79와 같은 아데닌은 더욱 편집되는 것이 나타났다. 우리는 미편집된 A 염기의 5' 최근접 이웃이 G 또는 C인 반면, 효율적으로 편집된 아데닌의 5' 최근접 이웃은 T 또는 A라는 것을 발견했다. 이 관찰을 기반으로, 우리는 편집하기 쉬운 아데닌의 오프-타겟 편집을 최소화하기 위한 dRNA의 설계를 시작했다. 우리의 연구에 있어서, 우리는 ADAR이 A-A, A-U보다 A-C 미스매치를 선호하고, 또한 A-C 미스매치가 가장 선호되지 않는다는 것을 발견했다. 그래서, 우리는 5' 최근접 이웃이 U 또는 A인 오프-타겟팅 A 염기의 경우, A-G 미스매치가 오프-타겟팅 효과를 감소시키거나 또는 축소시킬 수 있다고 제안했다. 이전 연구에서는 A-G 미스매치가 ADAR에 의한 탈아미노화 편집을 차단할 수 있다고 보고되어 있다.

그래서, 다음으로 우리는 도 5d에 있어서의 통계적 결과 및 기존의 지식에 기반한 상이한 A-G 미스매치 조합을 포함하는 3종류의 91개의 뉴클레오티드 dRNA 변이체와 4종류의 111개의 뉴클레오티드 dRNA 변이체(이하에 표시된 바와 같은 서열을 가짐)를 설계했다: dRNA-AG1(A41, A46, A74); dRNA-AG2(A41, A43, A45, A46, A74, A79); dRNA-AG3(A31, A32, A33, A41, A43, A45, A46, A47, A74, A79); dRNA-AG4(A7, A31, A32, A33, A40, A41, A43, A45, A46, A47, A74, A79, A95)(도 4e).

그 다음, 이들 dRNA를 HEK293T 세포에 형질감염하고, 빈 벡터 및 71개의 뉴클레오티드 비타겟팅 dRNA 대조군 : (TCTCAGTCCAATGTATGGTCCGAGCACAAGCTCTAATCAAAGTCCGCGGGTGTAGACCGGTTGCCATAGGA (서열 번호 45))를 음성 대조군으로 사용했다. 91개의 뉴클레오티드 dRNA의 경우, 딥 시퀀싱 결과는 A-G 미스매치가 없는 dRNA-91의 경우 온-타겟 편집(A56) 효율이 7.9%인 것(도 4f)과 비교하여, dRNA-91-AG2의 경우 온-타겟 편집(A56)이 2.8%, dRNA-91-AG3의 경우 2.3%, dRNA-91-AG4의 경우 0.7%로 감소한 것으로 나타났다. 91개의 뉴클레오티드 dRNA의 경우, 온-타겟 편집(A56) 효율이 A-G 미스매치가 없는 dRNA-111의 경우 15.1%인 것(도 4f)과 비교하여, 온-타겟 편집(A56)이 dRNA-111-AG2의 경우 5.1%, dRNA-111-AG3의 경우 4.9%로 감소했고, 이는 dRNA가 길수록 더 많은 AG 미스매치를 견딜 수 있다는 것을 나타낸다. 그래서, 다음으로 우리는 상세한 오프-타겟 분석을 위해 111개의 뉴클레오티드 dRNA를 선택했다. 측면에 위치하는 A 염기 편집은 A7 및 A79 이외에는 극적으로 삭제되었다(도 4g). A7 염기의 경우, 오프-타겟 효과는 현재 dRNA 설계에 없는 이 부위에서 추가 A-G 미스매치 설계에 의해 방지될 수 있다. A79 염기의 경우, 인접한 2개의 A-G 미스매치 A78/A79를 도입하면 오프-타겟 효과를 제거하는 것을 도울 수 있다. 이러한 결과를 기반으로, 본 출원의 RNA 편집 시스템을 유전 질환 치료에 적용하는 것은 매우 유망하고 고무적이다.

실시예 5. 다중 세포주에서의 예시적인 LEAPER 방법 테스트

HEK293T 세포의 결과를 통해, 우리는 선형 dRNA 및 그 타겟 RNA에 의해 형성된 이중 가닥 RNA가 A-I 편집을 위해 내인성 ADAR 단백질을 리크루팅할 수 있다고 가정했다. 가설을 확인하기 위해, 우리의 RNA 편집 방법을 테스트하기 위해 더욱 많은 세포주를 선택했다. 결과는 도 9에 도시되어 있다. 다수의 세포주에서 얻은 결과는 RNA 편집 방법의 보편성을 증명했다. 첫째, 다양한 편집 효율에도 불구하고, dRNA를 사용하여 내인성 ADAR을 리크루팅하는 것은 7개의 상이한 조직 및 기관으로부터 유래된 다수의 인간 세포주에 적합했다. 또한, 이 방법은 인간 세포뿐만 아니라 마우스 세포에서도 작용할 수 있어서, 마우스에 대한 실험의 수행 가능성을 제공한다.

실시예 6. RNA 편집을 위한 내인성 ADAR 활용

효율적인 RNA 편집 플랫폼을 탐색하기 위해, 우리는 과활성 E1008Q 돌연변이 ADAR1(ADAR1_DD)⁴⁰의 탈아미노효소 도메인을 RNA 가이드된 RNA-타겟팅 CRISPR 이펙터⁴¹ 인 촉매 비활성 LbuCas13 (dCas13a)에 융합했다(도 10a). RNA 편집 효율을 평가하기 위해, 우리는 3×GGGGS 코딩 영역과 인프레임 UAG 정지 코돈을 포함하는 서열에 의해 연결된 mCherry 및 EGFP 유전자를 보유하는 대리(surrogate) 리포터를 구축했다(리포터-1, 도 10b). 리포터-형질감염된 세포는 mCherry 단백질만을 발현한 반면, 리포터 전사물의 UAG에 대한 타겟팅 편집은 정지 코돈을 UIG로 변환하여, 결과적으로 하류 EGFP 발현을 허용한다. 이러한 리포터는 EGFP 레벨의 모니터링을 통해 A에서 I로의 편집 효율을 측정 하는 것을 가능하게 한다. 그 다음, 우리는 Cas13a 인식 대상인 5' 스캐폴드를 함유하는 hU6 프로모터 구동 crRNA(CRISPR RNA)와 타겟팅을 위한 다양한 길이의 스페이서 서열(crRNA^Cas13a, LbuCas13 crRNA 서열을 따름)을 설계했다.

LbuCas13 crRNA 서열

타겟 전사물에 상보적인 서열은 모두 A-C 미스매치 부위에서 아데노신 탈아미노화가 우선적으로 발생¹³ ^, ¹⁴하기 때문에, 아데노신(A)과 미스페어링하는 시티딘(C)을 도입하기 위해 UAG 코돈의 반대쪽에 CCA를 포함한다. crRNA의 최적 길이를 테스트하기 위해, 상이한 길이의 비타겟팅 또는 타겟팅 crRNA를 리포터-1가 안정적으로 발현하는 HEK293T 세포에서 dCas13a-ADAR1_DD 단백질과 공동 발현시켰다. EGFP 발현의 출현에 의해 표시된 분명한 RNA 편집 효과는 적어도 40개의 뉴클레오티드 길이의 매칭 서열을 포함하는 crRNA를 이용하여 관찰되었으며, crRNA가 길수록 EGFP 양성 백분율이 높았다(도 10c). 놀랍게도, 긴 crRNA^Cas13a 단독의 발현은 EGFP 발현을 활성화하기에 충분한 것으로 나타났고, dCas13a-ADAR1_DD의 공동 발현은 오히려 crRNA 활성을 감소시켰다(도 10c, 10d). 70개의 뉴클레오티드(길이 계산을 위해 5'스캐폴드 제외) 대조군 RNA가 EGFP 발현을 활성화시킬 수 없었기 때문에 EGFP 발현은 명백히 서열 의존적이었다(도 10c, 10d).

소정의 긴 조작된 crRNA^Cas13a가 dCas13a-ADAR1_DD에 독립적인 RNA 편집을 가능하게 한다는 놀라운 발견으로, 우리는 crRNA로부터 Cas13a-리크루팅 스캐폴드 서열을 제거하기로 결정했다. crRNA₇₀은 EGFP 발현을 유발하는 가장 높은 활성을 가졌기 때문에(도 10c, 10d), 추가 테스트를 위해 Cas13a-리크루팅 스캐폴드가 없는 동일한 70개의 뉴클레오티드 길이의 가이드 RNA를 선택했다(도 11a 및 실시예에서 사용된 하기 arRNA 및 대조군 RNA의 서열).

이 선형 가이드 RNA는 리포터-1을 보유하는 전체 세포의 40% 근접하여 강력한 EGFP 발현을 유도한 것으로 밝혀졌다(도 11b, 상부). 내인성 ADAR 단백질이 이중 가닥 RNA(dsRNA) 기질¹²을 편집할 수 있기 때문에, 우리는 긴 가이드 RNA가 dsRNA 기질을 형성하도록 타겟 전사물과 어닐링할 수 있고, 결과적으로 타겟팅된 편집을 위해 내인성 ADAR 단백질을 리크루팅한다고 추론했다. 따라서, 우리는 그러한 가이드 RNA를 arRNA(ADAR-리크루팅 RNA)로 지정했다.

내인성 ADAR 단백질이 실제로 상기 관찰의 원인이 되는지를 확인하기 위해, ADAR 결핍 세포에서 arRNA 매개 RNA 편집을 조사하기 시작했다. ADAR2 mRNA는 HEK293T 세포에서 거의 검출되지 않았기 때문에(도 12a), 우리는 HEK293T ADAR1^-/- 세포를 생성하여, ADAR1과 ADAR2 모두에서 이 세포주가 결핍되도록 했다(도 11c, d). 실제로, ADAR1의 고갈은 arRNA₇₀에 의해 유도된 EGFP 신호를 제거했다(도 11b, 하부). 더욱이, HEK293T ADAR1^-/- 세포에서의 ADAR1^p110, ADAR1^p150 또는 ADAR2의 외인성 발현(도 11c, d)은 arRNA₇₀(도 11e, 도 12b)에 의한 EGFP 유도 손실을 성공적으로 구제한 바, arRNA-유도된 EGFP 리포터 발현은 이소폼(p110 및 p150) 또는 ADAR2에 의해 활성이 재구축될 수 있는 네이티브 ADAR1에만 의존했다는 것을 입증했다. arRNA₇₀-타겟팅 영역에 대한 생어 시퀀싱 분석은 유의한 A에서 I(G)로의 전환(도 11f)을 표시하는, UAG 이내에서의 예측된 아데노신 부위에서 A/G 중첩 피크를 나타냈다. 차세대 시퀀싱(NGS)은 A에서 I로의 전환이 전체 리포터 전사물의 약 13%임을 추가로 확인했다(도 11g). 정량적 PCR 분석은 arRNA의 가능한 RNAi 효과를 제외하고는 arRNA₇₀이 타겟팅된 전사물의 발현을 감소시키지 않았다는 것을 나타냈다(도 13) 종합적으로, 우리의 데이터는 arRNA가 조작된 A-C 미스매치를 통해 타겟팅된 전사물에 대해 상당한 수준의 편집을 생성할 수 있다는 것을 입증했다.

실시예 7. 다수의 세포주에서 RNA 편집을 가능하게 하는 LEAPER

내인성 ADAR 단백질의 발현은 LEAPER 매개 RNA 편집의 전제 조건이기 때문에, 우리는 HT29, A549, HepG2, RD, SF268, SW13 및 HeLa를 포함한 별개의 조직으로부터 유래된 세포주의 패널에서 LEAPER의 성능을 테스트했다. 우선, 웨스턴 블롯팅 분석을 사용하여 3종류의 ADAR 단백질 모두의 내인성 발현을 조사했다. ADAR1은 모든 시험된 세포주에서 고도로 발현되었으며, 웨스턴 블롯에서의 그 동일성은 음성 대조군인 HEK293T ADAR1^-/- 라인에 의해 확인되었다(도 14a, b). ADAR3은 HepG2 및 HeLa 세포에서만 검출되었다(도 14a, b). ADAR2는 어느 세포에서도 검출이 불가능했고, 이 결과는 ADAR2 단백질은 ADAR2 과발현 HEK293T 세포로부터 검출될 수 있었기 때문에, 웨스턴 블로팅의 실패에 기인하는 것은 아니었다(도 14a, b). 이러한 발견은 ADAR1은 보편적으로 존재하는 반면, ADAR2 및 ADAR3의 발현은 특정 조직으로 제한된다는¹¹ 이전의 보고와 일치한다.

그 다음, 이들 세포주에서 리포터-1을 타겟팅하는 재설계된 71개의 뉴클레오티드 arRNA(arRNA₇₁)의 편집 효율을 테스트하기 시작했다(도 15a 및 본 연구에서 사용된 arRNA 및 대조군 RNA의 서열은 상기 열거되어 있음).

LEAPER는 이 arRNA₇₁에 대한 모든 테스트된 세포에 있어서 작용했지만, 효과는 다양했다(도 14c). 이들 결과는 HepG2 및 HeLa 세포를 제외하고는 ADAR1/2 단백질 수준이 RNA 편집 수율과 상관관계가 있다⁴²는 이전 보고와 일치했다. ADAR1 수준과 편집 효율의 최적이 아닌 상관관계는 ADAR3이 RNA 편집에서 억제적 역할을 한다고 보고되어 있기 때문에 이들 두 라인에서 풍부한 ADAR3 발현(도 14a, b)에 기인했던 것 같다. 중요한 것은, LEAPER가 마우스 유래의 3개의 상이한 세포주(NIH3T3, 마우스 배아 섬유아세포(MEF) 및 B16)에도 작용하여(도 14d), 동물 및 질환 모델을 통해 치료 잠재력을 테스트할 수 있는 길을 열었다. 종합적으로, 우리는 LEAPER가 다양한 세포 유형과 다양한 유기체를 위한 다목적 도구라는 결론을 내린다.

실시예 8. LEAPER의 특성화 및 최적화

LEAPER를 더욱 잘 특성화하고 최적화하기 위해, 타겟팅된 전사물의 UAG 삼중항 내에서 아데노신 반대쪽에 있는 뉴클레오티드의 선택을 조사했다. HEK293T 세포에 있어서, 리포터-1-타겟팅 arRNA₇₁은 가변적 편집 효율을 나타냈고, 변화된 삼중항(5'-CNA, N은 A/U/C/G 중 하나를 나타냄)은 타겟팅된 UAG(본 연구에 사용된 arRNA 및 대조군 RNA의 서열은 상기에 열거되어 있음) 반대쪽에 있다. A-C 미스매치에 의해 가장 높은 편집 효율이 얻어졌고, 또한 A-G 미스매치는 가장 적지만 명백한 편집을 산출했다(도 16a). 그 다음, arRNA에서 A-C 미스매치 측면에 있는 뉴클레오티드의 선호도를 조사했다. 우리는 시티딘(5'-N¹CN²)을 둘러싼 5' 및 3' 이웃 부위의 16개의 조합을 모두 테스트했고(본 연구에서 사용된 arRNA 및 대조군 RNA의 서열은 상기에 열거되어 있음), 3' 이웃 아데노신은 효율적인 편집을 위해 필요로 되는 반면, 아데노신은 5' 부위에서 가장 바람직하지 않은 뉴클레오티드이다(도 16b, c). 따라서, 우리는 arRNA의 CCA 모티프가 UAG 부위를 타겟팅하는 가장 높은 편집 효율을 제공한다는 결론을 내렸다. arRNA에서의 3' 이웃 구아노신(5'-N¹CG)이 극적인 억제 효과를 나타냈다는 점에 주목할 가치가 있다(도 16b, c).

RNA의 길이는 타겟팅된 전사물에 대한 편집을 지시할 때 arRNA 효율과 관련이 있는 것으로 나타났다고(도 10c), 이는 이전 보고⁴²와 일치한다. 이 효과를 완전히 이해하기 위해, 2개의 상이한 리포터 전사물 - 리포터-1 및 리포터-2를 타겟팅하는 가변 길이의 arRNA를 테스트했다(도 15a, b). 둘 중 하나의 리포터를 타겟팅하기 위해, 31개의 뉴클레오티드~211개의 뉴클레오티드 범위에서 10개의 상이한 크기의 arRNA를 정가운데에 CCA 삼중항(UAG 타겟팅용)을 갖게 설계하고 테스트했다(본 연구에 사용된 arRNA 및 대조군 RNA의 서열은 상기에 열거되어 있음). 리포터 EGFP 활성을 기반으로, arRNA의 길이는 2개의 리포터 모두에 대해 편집 효율과 양의 상관 관계를 가졌으며, 111개의 뉴클레오티드~191개의 뉴클레오티드에서 피크에 달했다(도 16d). 하나의 arRNA₅₁이 작용하는 것으로 보였지만, arRNA가 2개의 리포터 모두에 대해 작용하기 위해서는 71개의 뉴클레오티드가 최소 길이였다(도 16d).

다음으로, 우리는 편집 효율에 대한 arRNA 내에서의 A-C 미스매치 위치의 효과를 검토했다. 테스트를 위한 모든 arRNA의 길이를 71개의 뉴클레오티드로 고정하고, arRNA 내에서 UAG-타겟팅 ACC 삼중항을 5'로부터 3'로 슬라이딩했다(본 연구에 사용된 arRNA 및 대조군 RNA의 서열은 상기에 나열되어 있음). A-C 미스매치를 중간 영역에 배치하면 편집 수율이 높아지고, 미스매치 부위를 3' 말단에 근접하여 갖는 arRNA가 양 리포터 모두에서 5' 말단에 근접하여 갖는 것보다 더 나은 결과를 내는 것으로 나타났다(도 16e). 편의를 위해, 우리는 모든 후속 연구에서 A-C 미스매치를 arRNA의 중심에 배치했다.

또한, 우리는 LEAPER의 타겟팅 유연성을 테스트하고, 타겟의 UAG가 RNA 편집되는 유일한 모티프인지의 여부를 확인하고자 했다. 리포터-3에 대한 모든 16개의 삼중항 조합(5'-N¹AN²)(도 15c)에 대해, 우리는 고정된 길이(111개의 뉴클레오티드)를 갖는 대응하는 arRNA를 사용하고, 편집 부위(AC 미스매치)를 제외하고는 arRNA 및 리포터에 대한 완벽한 시퀀싱 일치를 보장했다(도 16f 및 본 연구에 사용된 arRNA 및 대조군 RNA의 서열은 상기에 열거됨). NGS 결과는 모든 N¹AN² 모티프는 편집될 수 있음을 나타냈다. UAN²와 GAN²는 각각 가장 바람직한 모티프이고 가장 바람직하지 않은 모티프이다(도 16f, g). 종합적으로, 타겟 아데노신의 최근접 이웃 선호도는 5' U>C≒A>G 및 3' G>C>A≒U이다(도 16g).

실시예 9. LEAPER를 사용하여 내인성 전사물의 편집

다음으로, 우리는 LEAPER가 내인성 전사물을 효과적으로 편집할 수 있는지를 조사했다. 길이가 상이한 arRNA를 사용하여, PPIB, KRAS 및 SMAD4 유전자의 전사물에 있어서의 UAG 모티프, 및 FANCC 유전자 전사물에 있어서의 UAC 모티프를 타겟팅했다(도 17a, 본 연구에 사용된 arRNA 및 대조군 RNA의 서열은 상기에 열거됨). 고무적으로, NGS 결과에 따르면 가변적 효율이기는 하지만, 4개의 전사물 모두에 있어서 타겟팅된 아데노신 부위를 모두 4개의 크기를 갖는 그 대응하는 arRNA에 의해 편집했다(도 17b). 이전 관찰과 부합하여, arRNA가 길수록 더 높은 편집률을 산출하는 경향이 있다. 참고로, 151개의 뉴클레오티드 arRNA^PPIB는 PPIB 유전자의 전체 전사물 중∼50%를 편집했다(도 17b). 어떠한 arRNA도 타겟팅된 전사물(도 18a) 또는 최종의 단백질 수준(예를 들면 KRAS, 도 18b)에 대해 RNAi 효과를 나타내지 않았다. 게다가, LEAPER는 비 UAN 부위에서 대해 바람직한 편집률을 달성할 수 있으며(도 17c 및 본 연구에 사용된 arRNA 및 대조군 RNA의 서열은 상기에 나열되어 있음), 내인성 전사물의 편집에 대해 LEAPER의 유연성을 나타낸다. LEAPER의 능력을 더 자세히 알아보기 위해, 우리는 여러 부위를 동시에 타겟팅할 수 있는지의 여부를 테스트했다. 우리는 개별 arRNA를 사용한 것보다 훨씬 높은 효율을 가진 2개의 arRNA(본 연구에서 사용된 arRNA 및 대조군 RNA의 서열은 상기 나열되어 있음)의 동시 발현에 의해 TARDBP 및 FANCC 전사물의 다중 편집을 관찰한 바(도 17d). LEAPER는 다수의 타겟을 동시에 편집하는 데 매우 적합한 것으로 나타났다.

ADAR1/2는 RNA 이중체⁴⁴에서 다중 아데노신을 무차별적으로 탈아미노화하는 경향이 있으며, A-C 미스매치는 A에서 I로의 스위치를 안내하는 유일한 모티프가 아니라는 것(도 16a)을 주목해야 한다. 따라서, arRNA 커버리지 내의 타겟 전사물의 모든 아데노신은 원치않는 변형의 주요 근원인 다양한 수준의 편집이 가해진다고 가정하는 것이 합리적이다. arRNA가 길수록 이러한 오프-타겟의 가능성은 높아진다. 따라서, 우리는 이들 타겟팅된 전사물에서의 arRNA 커버링 영역 내의 모든 아데노신 부위를 조사했다. PPIB 전사물의 경우, 다양한 크기의 arRNA에 대한 시퀀싱 창 전체에 걸쳐 오프-타겟 편집이 거의 관찰되지 않았다(도 17e, f). 그러나, KRAS, SMAD4 및 FANCC 유전자를 타겟팅하는 경우에는, 다수의 오프-타겟 편집이 검출되었다(도 19a-f). 특히 KRAS의 경우, 30개의 아데노신 중 11개가 arRNA₁₁₁의 시퀀싱 창에서 상당한 A에서 I로의 전환을 겪었다(도 19a, b).

우리는 다음으로 이러한 원치 않는 오프-타겟 효과를 최소화하기 위한 전략을 개발하려고 시도했다. 우리는, A-G 미스매치가 UAG 타겟팅에 대한 편집을 억제했기 때문에(도 16a), 구아노신과 비타겟팅 아데노신을 페어링하면 바람직하지 않은 편집을 감소시킬 수 있다고 가정했다. 그 다음, 우리는 리포터-3에서와 같이 가능한 모든 삼중항 조합(5'-N¹AN²)에서 A-G 미스매치가 아데노신에 미치는 영향을 테스트했다(도 15c 및 본 연구에 사용된 arRNA 및 대조군 RNA의 서열은 상기에 열거됨). A-G 미스매치는 실제로 A-C 미스매치(도 16f)와 비교하여 UAG 또는 AAG 타겟팅(~2%)을 제외한 모든 테스트된 타겟에서 아데노신에 대한 편집을 감소시켰다(도 17g). 원치 않는 부위의 편집률을 더욱 감소시키기 위해, 우리는 2회의 연속한 미스매치 효과를 테스트했다. UAG 또는 AAG의 반대쪽에 있는 삼중항의 3' 말단 뉴클레오티드에서의 추가 미스매치가 그 상응하는 아데노신 편집을 폐지한 것으로 판명되었다(도 17h 및 본 연구에 사용된 arRNA 및 대조군 RNA의 서열은 상기에 열거됨). 이들 발견을 고려하여, 우리는 KRAS 전사물에서 오프-타겟을 줄이기 위해 이 규칙을 적용하려고 시도했다(도 19a). 우리는 우선 AAU(61번째), UAU(63번째), UAA(65번째), AAA(66번째), UAG(94번째) 및 AAG(99번째)를 포함하여, arRNA₁₁₁(도 17i, 도 19a 및 본 연구에 사용된 arRNA 및 대조군 RNA의 서열은 상기에 열거됨)에 의해 커버된 모든 "편집하기 쉬운" 모티프에 대해 A-G 미스매치를 생성한 arRNA(arRNA₁₁₁-AG6)를 설계했다. 이 arRNA₁₁₁-AG6은 ~5%의 온-타겟 편집률을 유지하면서 대부분의 오프-타겟 편집을 제거했다. 도 17g의 결과와 일치하여, 단일 A-G 미스매치는 AAG 모티프(99번째)에서 편집을 완전히 최소화할 수 없었다(도 17i 및 도 19a). 그 다음, 우리는 이중 미스매치(타겟팅된 모티프 5'-AAG의 반대쪽에 있는 5'-CGG)를 포함하여 arRNA₁₁₁-AG6에 대해 더 많은 미스매치를 추가했고, 또한 27번째, 98번째 및 115번째 아데노신(arRNA₁₁₁-AG9)(본 연구에 사용된 arRNA 및 대조군 RNA의 서열은 상기에 열거되어 있음)에 대한 편집을 완화하기 위해 3개의 추가 A-G 미스매치를 추가했다. 결과적으로, 우리는 타겟팅된 부위(A76)에 대한 편집률을 추가로 상실하지 않고 편집에 대해 훨씬 향상된 특이성을 달성했다(도 17i). 요약하면, 추가 규칙을 통합한 조작된 LEAPER는 내인성 전사물에 대해 효율적이고 더욱 정확한 RNA 편집을 가능하게 한다.

실시예 10. LEAPER의 RNA 편집 특이성

arRNA 커버된 dsRNA 영역 내에서 가능한 오프-타겟 효과에 추가하여, 우리는 arRNA의 부분 염기 쌍을 통해 다른 전사물에 대한 잠재적인 오프-타겟 효과에 대해서도 고려했다. 그 다음, 우리는 LEAPER의 글로벌 오프-타겟 효과를 평가하기 위해 전장 전사체 RNA-시퀀싱 분석을 수행했다. RNA-seq 분석을 행하기 전에 세포를 RNA₁₅₁ 대조군 또는 PPIB-특이적 arRNA(arRNA₁₅₁-PPIB) 발현 플라스미드로 형질감염시켰다. 우리는 RNA₁₅₁ 대조군(도 20a)에서 6개 및 arRNA₁₅₁-PPIB 군에서 5개(도 20b)의 잠재적인 오프-타겟을 확인했으며, NGS 분석에 기반한 PPIB 온-타겟 비율은 ∼37%였다(도 20b). 추가 분석에 따르면, EIF2AK2 전사물의 2개의 부위를 제외한 모든 부위가 SINE(Alu) 또는 LINE 영역(도 20a, b)에 위치하고, 둘 다 ADAR 매개 편집⁴⁵ 하기 쉬운 것으로 나타났으며, 이는 이들 타겟은 타겟 전사물과 arRNA 또는 대조군 RNA 사이의 페어링으로부터 유래되지 않을 수 있다는 것을 시사한다. 중요한 것은, 양 군 모두에서 2개의 오프-타겟팅 전사물인 WDR73과 SMYD4가 나타났으며, 이는 이들이 서열 의존적 RNA 편집할 가능성은 낮다는 것을 시사한다. 실제로, 최소 자유 에너지 분석은 모든 이들 가능한 오프-타겟 전사물이 대조군 RNA₁₅₁ 또는 arRNA₁₅₁-PPIB 중 하나를 사용하여 안정한 이중체를 형성하지 못했음을 시사했다(도 20c). arRNA가 서열 의존적 오프-타겟을 생성하는지 추가 테스트하기 위해, arRNA₁₅₁-PPIB 및 arRNA₁₁₁-FANCC 모두에 대해 NCBI BLAST를 사용하여 서열 유사성을 비교함으로써 잠재적인 오프-타겟 부위를 선택했다. arRNA₁₅₁-PPIB에 대한 TRAPPC12 전사물과 arRNA₁₁₁-FANCC에 대한 ST3GAL1, OSTM1-AS1 및 EHD2 전사물에 있어서의 3개 부위가 유력한 후보였다(도 20d 및 도 21a). NGS 분석은 이들 예측된 오프-타겟 부위의 어디에서도 편집이 검출되지 않았음이 나타났다(도 20d 및 도 21b). 이들 결과는 LEAPER가 타겟팅된 부위에서 효율적인 편집을 가능하게 하는 동시에, 검출 가능한 서열 의존적 오프-타겟 편집없이, 전사체 전체의 특이성을 유지할 수 있게 하는 것을 나타낸다.

실시예 11. 포유류 세포에서의 LEAPER의 안전성 평가

arRNA는 타겟 전사물에 대한 편집을 위해 내인성 ADAR 단백질에 의존하기 때문에, 우리는 외인성 arRNA의 추가가 너무 많은 ADAR1 또는 ADAR2 단백질을 차지함으로써 네이티브 RNA 편집 이벤트에 영향을 미치는 것이 아닌지 생각했다. 따라서, 우리는 전장 전사체 RNA-시퀀싱 결과로부터 모조군과 arRNA₁₅₁-PPIB 군이 공유한 A에서 I로의 RNA 편집 부위를 분석하고, 모조군과 RNA₁₅₁ 대조군 간의 비교도 분석했다. RNA₁₅₁ 대조군과 arRNA₁₅₁-PPIB 군은 모두 모조군과 비교하여 유의한 차이를 보이지 않았으며(도 22a, b), 이는 LEAPER가 네이티브 A에서 I로의 편집 이벤트를 촉진시키는 내인성 ADAR1의 정상적인 기능에 거의 영향을 미치지 않는다는 것을 나타낸다.

한편, 우리는 arRNA가 글로벌 유전자 발현에 영향을 미치는지 확인하기 위해 RNA-seq 데이터를 이용하여 차등 유전자 발현 분석을 수행했다. 우리는 RNA₁₅₁ 대조군과 arRNA₁₅₁-PPIB 모두 모조군과 비교하여 글로벌 유전자 발현에 영향을 미치지 않음을 발견했다(도 22c, d). 우리의 이전 관찰(도 18a)과 일치하여, arRNA는 PPIB의 발현에 어떤 RNAi 효과도 나타내지 않았다(도 22c, d).

arRNA가 타겟 전사물과 RNA 이중체를 형성하고, 또한 RNA 이중체가 선천성 면역 반응을 유도할 수 있다는 점을 고려하여, arRNA의 도입이 그러한 효과가 있는지 조사했다. 이를 테스트하기 위해, 유효한 것으로 입증된 4개의 유전자 전사물을 타겟팅하는 arRNA를 선택했다. 우리는 선천성 면역 활성화의 두 가지 특징인 인터페론-β(IFN-β)(도 22e) 또는 인터루킨-6(IL-6)(도 22f)의 어떤 mRNA 유도도 관찰되지 않았다. 양성 대조군으로서, 이중 가닥 RNA-폴리(I:C)의 합성 유사체는 강력한 IFN-β 및 IL-6 발현을 유도했다(도 22e, f). LEAPER는 안전한 치료제에 중요한 기능인 타겟 세포에서 면역원성을 유도하지 않는 것으로 보이다.

실시예 12. LEAPER에 의한 p53의 전사 조절 활성의 복원

이제 우리는 외래 단백질을 도입할 필요없이 RNA 편집의 새로운 방법을 확립 했으므로, 그 치료적 유용성을 입증하려고 시도했다. 우리는 우선 세포 항상성 유지에 중요한 역할을 하는 것으로 알려져 있지만, 인간 암의 >50%에서 빈번히 돌연변이를 겪는⁴⁶ 종양 억제 유전자 TP53을 타겟으로 했다. TP53에서의 c.158G>A 돌연변이는 임상적으로 관련된 넌센스 돌연변이(Trp53Ter)이며, 이것에 의해 비기능적 절단된 단백질⁴⁶로 되게 된다. 우리는 모두 TP53^W53X 전사물을 타겟팅하는(도 23a) 하나의 arRNA₁₁₁과 2개의 대체적 arRNA(arRNA₁₁₁-AG1 및 arRNA₁₁₁-AG4)(본 연구에 사용된 arRNA 및 대조군 RNA의 서열은 상기에 열거되어 있음)를 설계했으며, 후자의 2개는 잠재적인 오프-타겟을 최소화하도록 설계되었다. 우리는 네이티브 p53 단백질의 효과를 제거하기 위해 HEK293T TP53^-/- 세포주를 생성했다. TP53^W53X 타겟팅 arRNA의 3개의 형태 모두는 arRNA₁₁₁-AG1 및 arRNA₁₁₁-AG4에 대한 원치 않는 편집의 가변적 감소(도 24)와 함께, 돌연변이된 아데노신 부위에서 TP53^W53X 전사체의 25-35%가 전환되었다(도 23b). 웨스턴 블롯은 arRNA₁₁₁, arRNA₁₁₁-AG1 및 arRNA₁₁₁-AG4가 모두 HEK293T TP53^-/- 세포에서의 TP53^W53X 전사물을 기반으로 한 전장 p53의 단백질의 생산을 모두 구제할 수 있는 반면, RNA₁₁₁ 대조군은 할 수 없는 것으로 나타났다(도 23c).

복구된 p53 단백질이 완전히 기능하는지를 확인하기 위해, p53-루시페라아제 cis-리포팅 시스템⁴⁷ ^{, 48}을 사용하여 p53의 전사 조절 활성을 테스트했다. 세 가지 버전의 arRNA 모두 p53 활성을 복원할 수 있으며, 최적화된 버전 arRNA₁₁₁-AG1이 가장 잘 수행했다(도 23d). 결론적으로, 우리는 LEAPER가 TP53의 암 관련 조기 중지 코돈을 복구하고, 그 기능을 복원할 수 있음을 입증했다.

실시예 13. LEAPER에 의한 병원성 돌연변이의 교정

우리는 LEAPER가 더 많은 병원성 돌연변이를 교정하는 데 사용될 수 있는지의 여부를 조사했다. 엘러스-단로스 증후군의 COL3A1, 원발성 폐고혈압증의 BMPR2, 주버트 증후군의 AHI1, 판코니 빈혈의 FANCC, 원발성 가족성 비대 심근병증의 MYBPC3 및 X-염색체 연관 중증복합면역결핍증의 IL2RG의 6개의 병원성 유전자로부터의 임상적으로 관련된 돌연변이를 목표로, 우리는 대응하는 병원성 G>A 돌연변이를 담지하는 이들 각각의 유전자를 위한 111개의 뉴클레오티드 arRNA를 설계했다(도 25 및 본 연구에 사용된 arRNA 및 대조군 RNA의 서열이 상기 나열되어 있고, 또한 본 연구에서 다음의 질환 관련 cDNA가 사용됨).

본 연구에 사용된 질환 관련 cDNA

HEK293T 세포에서 arRNA/cDNA 쌍을 공동 발현함으로써, 우리는 모든 테스트에서 A>G 보정을 이용하여 상당한 양의 타겟 전사물을 확인했다(도 24). G>A 돌연변이는 인간에 있어서 알려진 질환 유발 점 돌연변이의 거의 절반을 차지하기¹⁰ ^{, 49} 때문에, LEAPER에 의한 A>G 변환은 치료제에 엄청난 기회를 제공할 수 있다.

실시예 14. LEAPER에 의한 다수의 인간 1차 세포에서의 RNA 편집

LEAPER의 임상적 유용성을 추가로 탐구하기 위해, 우리는 다수의 인간 1차 세포에서 방법을 테스트하기 시작했다. 우선, 우리는 리포터-1을 편집하기 위해 151개의 뉴클레오티드 arRNA(본 연구에서 사용된 arRNA 및 대조군 RNA의 서열은 상기에 열거됨)를 사용하여 인간 1차 폐 섬유아세포 및 인간 1차 기관지 상피 세포에서 LEAPER를 테스트했다(도 15a). EGFP 양성 세포의 35-45%는 양방의 인간 1차 세포 모두에서 LEAPER에 의해 얻어질 수 있었다(도 27a). 그 다음, 우리는 이 두 가지 1차 세포와 인간 1차 T 세포에서 내인성 유전자 PPIB를 편집하는데에 있어서 LEAPER를 테스트했으며, arRNA₁₅₁-PPIB가 1차 인간 1차 폐 섬유아세포, 기관지 상피 세포(도 27b) 및 일차 T 세포(도 27c)에서 편집률의 >40%, >80% 및 >30%를 달성할 수 있다는 것을 발견했다. 인간 1차 세포에서의 LEAPER의 높은 편집 효율은 특히 치료제에서의 잠재적인 용도에 고무적이다.

실시예 15. 렌티바이러스 발현 및 arRNA의 화학적 합성에 의한 효율적인 편집

그 다음, 우리는 LEAPER가 더욱 임상적으로 관련된 방법에 의해 전달될 수 있는지 조사했다. 우선, 렌티바이러스계 발현을 통해 arRNA의 효과를 테스트했다. 리포터-1 타겟팅 arRNA₁₅₁은 감염 2일 후(dpi) HEK293T 세포에서 리포터-1을 보유한 전체 세포의 40%를 초과해서 강력한 EGFP 발현을 유도했다. 8dpi에서, EGFP 비율은∼38%에 필적하는 수준으로 유지된 바(도 28a 및 본 연구에 사용된 arRNA 및 대조군 RNA의 서열은 상기에 열거됨), LEAPER는 지속적인 투여가 필요한 치료제에 맞추어질 수 있음을 시사한다. 네이티브 유전자 편집을 위해, 우리는 HEK293T 세포에서 렌티바이러스의 형질도입을 통해 PPIB-타겟팅 arRNA₁₅₁을 전달했고, 6 dpi에서 6% 이상의 타겟 편집률이 관찰되었다(도 28b).

다음으로, 우리는 합성된 arRNA 올리고뉴클레오티드와 LEAPER에 대한 전기천공 전달 방법을 테스트했다. PPIB 전사물을 타겟팅하는 111개의 뉴클레오티드 arRNA와 RNA 대조군은 arRNA의 처음 3개 및 마지막 3개의 잔기에서 2'-O-메틸 및 포스포로티오에이트 연결 수식으로 화학적으로 합성되었다(도 28c). 전기천공을 통해 T 세포에 도입된 후, arRNA₁₁₁-PPIB 올리고는 PPIB 전사물에 대해 ∼20%의 편집을 달성한 바(도 28d), LEAPER가 올리고뉴클레오티드 약물 개발에 대한 가능성을 갖고 있음을 나타낸다.

실시예 16. LEAPER에 의한 헐러 증후군 환자 유래의 1차 섬유아세포에서의 α-L-아이두로니데이스 활성의 복원

마지막으로, 우리는 뮤코다당류의 분해에 책임이 있는 리소좀 대사 효소인 α-L-아이두로니데이스(IDUA)의 결핍으로 인한 점액 다당류증 I형(MPS I)의 가장 심각한 아형인 단일 유전 질환-헐러 증후군 치료⁵⁰에서 LEAPER의 잠재력을 조사했다. 우리는 원래 헐러 증후군 환자로부터 단리된 1차 섬유아세포 GM06214를 선택했다. GM06214 세포는 IDUA 유전자의 엑손 9에서의 동형 접합성 TGG>TAG 돌연변이를 포함함으로써, 단백질에서 Trp402Ter 돌연변이로 된다. 우리는 IDUA의 성숙한 mRNA와 pre-mRNA를 각각 타겟으로 하는(도 29a 및 본 연구에 사용된 arRNA 및 대조군 RNA의 서열은 상기에 열거됨), 화학적 수식을 갖는 합성된 RNA 올리고뉴클레오티드에 의해, arRNA₁₁₁-IDUA-V1 및 arRNA₁₁₁-IDUA-V2의 두 가지 버전의 arRNA를 설계했다. arRNA₁₁₁-IDUA-V1 또는 arRNA₁₁₁-IDUA-V2를 전기천공을 통해 GM06214 세포에 도입한 후, 우리는 NGS 분석을 통해 타겟팅된 RNA 편집률 및 다른 시점에서 4-MU-α-L-아이두로니데이스 기질을 사용하여 α-L-아이두로니데이스의 촉매 활성을 측정했다. arRNA₁₁₁-IDUA-V1 및 arRNA₁₁₁-IDUA-V2 모두가 전기천공 후 시간에 따라 IDUA 결핍 GM06214 세포에서 IDUA 촉매 활성을 점진적으로 복원되었으며, 또한 arRNA₁₁₁-IDUA-V2는 arRNA₁₁₁-IDUA-V1보다 훨씬 우수하게 수행한 반면, α-L-아이두로니데이스 활성은 3개의 대조군에서 검출되지 않았다(도 29b).

LEAPER에 의해 GM06214에서 복원된 IDUA 활성이 헐러 증후군을 완화하는 정도를 추가로 평가하기 위해, 우리는 IDUA 유전자에 대한 이형 접합성 유전자형으로 인한 잔류 IDUA 활성으로 인하여 헐러 증후군보다 훨씬 더 가벼운 MPS I의 아형인 샤이에 증후군 환자로부터 또 다른 1차 섬유아세포인 GM01323 세포에서의 IDUA 활성을 조사했다. 우리는 arRNA₁₁₁-IDUA-V2를 보유하는 GM06214 세포에 있어서의 IDUA의 촉매 활성이 전기천공 48시간 후 GM01323 세포보다 더 높다는 것을 발견했다(도 29b). 이러한 결과와 일치하여, NGS 분석은 arRNA₁₁₁-IDUA-V2가 A에서 I로의 편집 중 거의 30%를 전환한 것으로, arRNA₁₁₁-IDUA-V1보다 훨씬 높은 비율을 나타냈다(도 29c). 추가 분석 결과, IDUA 전사물의 arRNA 커버된 영역 내에서 최소한의 원치 않는 편집이 검출된 것으로 나타났다(도 29d). 중요한 것은, LEAPER는 양성 대조군 역할을 하는 RNA 이중체 폴리(I:C)와 달리 arRNA₁₁₁-IDUA-V1도 arRNA₁₁₁-IDUA-V2도 I형 인터페론 및 전염증성 반응에 관련된 유전자 패널의 발현을 유도하지 않는다는 것을 입증한 바와 같이, 1차 세포에서 면역 반응을 유발하지 않는다(도 29e). 이러한 결과는 소정의 단일 유전 질환을 타겟으로 하는 LEAPER의 치료 잠재력을 나타냈다.

실시예 17. LEAPER에 의한 헐러 증후군 마우스에서의 α-L- 아이두로니데이스 활성의 복원

LEAPER가 마우스에 대한 실험을 수행할 수 있는 가능성을 제공함에 따라, 우리는 생체내에서 단일 유전 질환-헐러 증후군을 치료하기 위한 LEAPER의 잠재력을 조사했다. AAV(아데노 관련 바이러스)가 전달 시스템으로서 선택된다. 2개의 서열(서열 번호 341 및 서열 번호 342)을 플라스미드 AAV-U6-CMV-GFP 벡터에 삽입하고, 플라스미드를 PackGene Biotech에 의해 AAV8 바이러스에 패키징했다(도 31 참조). 바이러스 역가는 다음과 같다:

6개의 MPS I(idua W392X 마우스, B6.129S-Idua^tm1 ^. ^1Kmke ^/J) 수컷 마우스(4-10 주령)를 선택하고, 2개의 군으로 분류하고, 제 1 군의 3마리의 마우스 각각에 플라스미드 AAV8-IDUA-adRNA151-KD2가 패킹된 AAV8 바이러스의 1E12 GC를 꼬리 정맥을 통해 주사했고, 제 2 군의 다른 3마리 마우스 각각에 플라스미드 AAV8-Random151-KD2가 패킹된 AAV8 바이러스 1E12 GC뿐만 아니라 대조군을 꼬리 정맥을 통해 주입했다. 주사 28일 후, 마우스를 자궁 경부 탈구로 희생시키고 간을 채취했다. 우리는 2개의 군의 각 마우스에 대해 4-MU-α-L-아이두로니데이스 기질을 사용하여 마우스 간세포에서의 α-L-아이두로니데이스의 효소 활성을 측정했다. 간은 작은 조각으로 나누고, 분쇄 후의 한 부분을 (즉시) 효소 활성 측정을 위해 사용했다. 제 1 군의 평균 상대적 효소 활성은 제 2 군의 것보다 더 높다(도 32a 참조). 제 1 군의 각 마우스의 상대적 효소 활성은 제 2 군의 것보다 더 높다(도 32b, GM01323을 대조군으로 참조하고, 야생형 세포에 비해 0.3% α-L-아이두로니데이스 효소 활성을 가짐). 효소 활성의 결과로부터, 제 1 마우스군의 α-L-아이두로니데이스 활성이 복원되었음을 알 수 있다. TGG>TAG 돌연변이가 회복되고, LEAPER가 효과적인 RNA 편집을 제공하는지 확인하기 위해, 우리는 분쇄한 간의 다른 부분을 사용함으로써 2개의 군의 각 마우스에 대해 차세대 시퀀싱 분석을 통해 마우스 간세포에서의 타겟팅된 RNA 편집률을 측정했다. 다른 부분에는 NGS용 트리졸이 추가된다. 제 1 군의 평균 RNA 편집 효율은 제 2 군의 것보다 높다(도 33a 참조). 제 1 군의 각 마우스의 RNA 편집 효율은 제 2 군의 것보다 거의 높다(도 33b 참조). RNA 편집 효율의 결과로부터, LEAPER 방법이 최대 7%까지 효과적인 RNA 편집을 제공한다는 것을 알 수 있다.

질환 관련 유전자의 코딩 서열(CDS)

토론

게놈 편집 기술은 생물의학 연구에 혁명을 일으키고 있다. 징크 핑거 뉴클레아제(ZFN)¹, 전사 활성화제 유사 이펙터 뉴클레아제(TALEN)² ^-4, CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats) 시스템⁵ ^-7의 Cas 단백질과 같은 고활성 뉴클레아제가 무수한 유기체에서의 게놈을 조작하기 위해 성공적으로 설계되었다. 최근에 탈아미노효소는 이중 가닥 DNA를 파괴하지 않고 유전 암호를 정확하게 변경하는데 활용되었다. CRISPR-Cas9 시스템과 시티딘 또는 아데노신 탈아미노효소를 결합함으로써, 연구원들은 질환을 유발하는 돌연변이를 교정하기 위한 새로운 기회를 제공하는, 게놈 DNA8-10에서 C·G에서 T·A로 또는 A·T에서 G·C로 변환할 수 있게 하는 프로그래밍 가능한 염기 편집기를 만들었다.

DNA 외에도, RNA 변형은 게놈에 임의의 영구적인 변화를 일으키지 않고 단백질 기능을 변경할 수 있기 때문에, 유전자 교정을 위한 매력적인 타겟이다. ADAR 아데노신 탈아미노효소는 현재 RNA에 대한 정확한 염기 편집을 달성하기 위해 이용되고 있다. 포유류에서 ADAR1(이소형 p110 및 p150), ADAR2 및 ADAR3(촉매 불활성)¹¹ ^{, 12}의 3종류의 ADAR 단백질이 확인되었으며, 그 기질이 이중 가닥 RNA이며, 시토신(C)과 미스매치된 아데노신(A)은 이노신(I)으로 우선적으로 탈아미노화된다. 이노신은 번역¹³ ^{, 14} 동안 구아노신(G)을 모방하는 것으로 생각된다. 타겟팅된 RNA 편집을 달성하기 위해, ADAR 단백질 또는 그 촉매 도메인은 aλN 펩티드¹⁵ ^-17, SNAP-태그¹⁸ ^-22 또는 Cas 단백질(dCas13b)²³과 융합되었고, 가이드 RNA는 특정 부위에 키메라 ADAR 단백질을 리크루팅하도록 설계되었다. 대안적으로, R/G 모티프 함유(motif bearing) 가이드 RNA와 함께 ADAR1 또는 ADAR2 단백질을 과발현하는 것도 타겟팅된 RNA 편집²⁴ ^-27을 가능하게 하는 것으로 보고되었다.

포유류 시스템에서의 보고된 모든 핵산 편집 방법은 효소와 가이드 RNA의 2개의 구성 요소의 이소성 발현에 의존한다. 이러한 이진 시스템은 대부분의 연구에서 효율적으로 작동하지만, 일부 고유한 장애물은 특히 치료에서 광범위한 적용을 제한한다. 유전자 치료를 위한 가장 효과적인 생체내 전달은 바이러스 벡터²⁸를 통하고, 또한 매우 바람직한 아데노 관련 바이러스(AAV) 벡터는 화물 크기(~4.5kb)로 제한되어 있기 때문에, 단백질과 가이드 RNA²⁹ ^, ³⁰를 모두 수용하는 것이 어렵게 된다. ADAR1의 과발현은 최근 RNA에 대한 비정상적인 과대 편집으로 인해, 다발성 골수종에 발암성을 부여하고, 또한 실질적인 글로벌 오프-타겟팅 편집³²을 생성하는 것으로 보고되었다. 또한, 단백질의 이소성 발현 또는 비인간 유래의 그 도메인은 면역원성^{30, 33}을 유도해낼 수 있는 잠재적 위험을 갖는다. 더욱이, 기존의 적응성 면역력 및 p53 매개 DNA 손상 반응은 Cas9³⁴ ^-38과 같은 치료 단백질의 효능을 손상시킬 수 있다. RNA 편집을 위해 내인성 메커니즘을 활용하려는 시도가 있었지만, 이것은 사전조립된 타겟 전사물인 RNA 이중체를 제노푸스 배아³⁹에 주입하는 것만으로 시도되었다. 단백질의 이소성 발현에 의존하지 않는 강력한 핵산 편집을 위한 대체 기술이 더욱 필요로 된다. 여기에서, 우리는 RNA 편집을 위해 내인성 ADAR을 활용하는 새로운 접근 방식을 개발했다. 우리는 의도적으로 설계된 가이드 RNA를 발현하면 내인성 RNA에 대한 효율적이고 정확한 편집이 가능하고, 또한 병원성 돌연변이를 교정할 수 있다는 것을 보여주었다. 이러한 단항 핵산 편집 플랫폼은 치료 및 연구를 위한 새로운 길을 열 수 있다.

특히, 우리는 적절한 길이의 선형 arRNA의 발현이 타겟 전사물에 대해 아데노신을 이노신으로 편집하도록 내인성 ADAR 단백질을 가이딩할 수 있다는 것을 보여주었다. LEAPER라고 지칭되는 이 시스템은 내인성 ADAR 단백질을 사용하여 프로그래밍 가능한 핵산 편집을 달성하므로, 기존 접근 방식을 능가하는 장점을 가지고 있다.

LEAPER의 뛰어난 품질은 단순성이며, 이는 RNA 편집을 위해 내인성 단백질을 다이렉팅하기 위해 작은 크기의 RNA 분자에만 의존하기 때문이다. 이것은 RNAi를 연상시켜서, 작은 dsRNA가 타겟팅된 RNA 분해⁵¹를 위한 네이티브 메커니즘을 작동시킬 수 있다. 크기가 작기 때문에, arRNA는 다양한 바이러스 및 비바이러스 비히클에 의해 쉽게 전달될 수 있다. RNAi와 달리, LEAPER는 타겟팅된 전사물의 절단 또는 분해를 일으키지 않고 정확한 A에서 I로의 스위치를 촉진시킨다(도 18a). arRNA의 길이 요건은 RNAi보다 길지만, 세포 수준에서 면역 자극 효과를 유도하지도 않고(도 22e, f 및 도 29e) 또한 내인성 ADAR 단백질의 기능에도 영향을 주지 않음(도 22a, b)으로써, RNA 타겟팅을 위한 안전한 전략으로 되게 한다. 놀랍게도, ADAR 단백질 또는 그 촉매 도메인의 이소성 발현은 실질적인 글로벌 오프-타겟 편집³²을 유도하고 또한 암을 유발할 가능성이 있다는 것이 보고되어 있다.

최근에, 수개의 그룹은 시토신 염기 편집기가 이펙터 단백질의 발현으로 인해, 마우스 배아, 쌀 또는 인간 세포주에서 실질적인 오프-타겟 단일 뉴클레오티드 변이체를 생성할 수 있다고 보고했으며, 이는 잠재적인 치료 적용에 대한 LEAPER의 이점^52-54을 실증한다. 만족스럽게도, LEAPER는 드문 글로벌 오프-타겟 편집을 이끌어 내면서 효율적인 편집을 지원한다(도 20 및 도 21). 또한, LEAPER는 잠재적인 면역원성을 최소화하거나 또는 외부 단백질의 도입을 필요로 하는 다른 방법에 의해 일반적으로 공유되는 전달 장애를 극복할 수 있었다.

LEAPER의 경우, 우리는 소망하는 활성을 달성하기 위해 70개의 뉴클레오티드 이상의 최소 크기를 갖는 arRNA를 사용하는 것을 추천할 수 있다. 네이티브 컨텍스트에서, ADAR 단백질은 300개의 뉴클레오티드를 초과하는 이중체를 갖는 Alu 반복을 비특이적으로 편집한다⁵⁵. 중요한 것은, Alu 반복은 안정적인 분자 내 이중체를 형성하는 반면, LEAPER는 arRNA와 mRNA 또는 pre-mRNA 사이에서 분자 내 이중체가 생기게 하고, 이것은 덜 안정적이고 형성하기 더 어렵다. 따라서, 우리는 효과적인 편집을 위해 ADAR 단백질을 리크루팅 또는 도킹하기 위해서는 70개의 뉴클레오티드보다 긴 RNA 이중체가 화학양론적으로 중요하다고 가정했다. 실제로, 더 긴 arRNA는 이소적으로 발현된 리포터 및 내인성 전사물 모두에서 편집 수율이 더 높아졌다(도 16d 및 도 17b). 그러나, ADAR 단백질은 RNA 이중체에서 아데노신 염기를 무차별적으로 탈아미노화하기 때문에, 더 긴 arRNA는 타겟팅 창 내에서 더 많은 오프-타겟을 유발할 수 있다.

LEAPER는 네이티브 전사물을 효과적으로 타겟팅할 수 있지만, 편집 효율과 오프-타겟 비율은 다양했다. PPIB 전사물-타겟팅의 경우, 우리는 커버링 창 내에서 명백한 오프-타겟없이 타겟팅된 아데노신의 50%를 이노신으로 전환할 수 있다(도 17b, f). 다른 전사물에 대한 오프-타겟은 더욱 심각해졌다. 우리는 소망하지 않은 편집을 억제하기 위해 A-G 미스매치 또는 연속한 미스매치를 도입하는 것과 같은 오프-타겟을 감소시키도록 조작했다. 그러나, 미스매치가 너무 많으면 온-타겟 효율이 저하될 수 있다. 효율 및 잠재적인 오프-타겟을 고려하여, 내인성 전사물에 대한 편집을 위해서는 100∼150개의 뉴클레오티드 범위의 길이를 갖는 arRNA를 권장한다. 선택의 여지가 있는 경우, 원치 않는 편집의 가능성을 최소화하기 위해, 아데노신이 적은 영역을 선택하는 것이 좋다. 고무적으로, 우리는 arRNA-타겟팅된 전사물 이중체(도 20) 이외에는 어떤 오프-타겟도 검출하지 못했다.

우리는 개선된 편집 효율을 달성하기 위해 arRNA의 디자인을 최적화했으며, LEAPER가 유전자 기능을 조작하거나 병원성 돌연변이를 교정하는 데 활용될 수 있음을 입증했다. 또한, 우리는 LEAPER가 UAG에서만 작용하도록 제한되는 것이 아니라, 측면 뉴클레오티드에 관계없이 가능한 모든 아데노신과 함께 작용한다는 것을 보여주었다(도 16f, g 및 도 17c). 이러한 유연성은 특정 단일 점 돌연변이로 인한 유전 질환의 잠재적 치료 교정에 유리한다. 흥미롭게도, IDUA 전사물의 편집시, pre-mRNA를 타겟으로 하는 arRNA가 성숙한 RNA를 타겟으로 하는 것보다 더욱 효과적인 바, 핵이 ADAR 단백질에 대한 주요 작용 부위이고, LEAPER는 pre-mRNA 내의 스플라이스 부위를 변형함으로써 스플라이싱을 조작하기 위해 활용될 수 있음을 나타낸다. 또한, LEAPER는 다수의 유전자 전사물을 동시에 타겟팅하는 높은 효율을 입증했다(도 17d). LEAPER의 이러한 다중화 기능은 향후 소정의 다중 유전 질환을 치료하기 위해 개발될 수 있다.

RNA 수준에서 유전자 교정을 행하는 것이 유리하다. 첫째, 타겟팅된 전사물에 대한 편집은 게놈 또는 전사체 레퍼토리를 영구적으로 변경하지 않음으로써, 치료를 위해서는 RNA 편집 접근 방식이 게놈 편집 수단보다 더 안전하다. 또한, 일시적인 편집은 특정 상태의 간헐적인 변화로 인해 야기된 질환 치료의 시간적 제어에 매우 적합하다. 둘째, LEAPER 및 기타 RNA 편집 방법은 게놈에 DSB를 도입하지 않아서, 큰 DNA 단편의 바람직하지 않은 삭제가 발생할³⁷ 위험을 피할 수 있다. 닉케이스(nickase) Cas9를 채택한 DNA 염기 편집 방법은 여전히 게놈에서 인델을 생성⁸할 수 있다. 더욱이, 네이티브 DNA 복구 기계와는 별도로, LEAPER는 ADAR2의 높은 발현을 갖는 소뇌 세포¹¹와 같은 유사 분열 후 세포에서도 작용해야 한다.

우리는 LEAPER를 인간 세포주(도 14c), 마우스 세포주(도 14d) 및 1차 T 세포를 포함한 인간 1차 세포(도 27 및 도 28d)와 같은 광범위한 세포 유형에 적용할 수 있다는 것을 입증했다. 렌티바이러스 전달 또는 합성된 올리고를 통한 효율적인 편집은 치료법 개발의 잠재력을 높이다(도 28). 또한, LEAPER는 p53의 전사 조절 활성의 회복(도 7), 병원성 돌연변이의 교정(도 26), 헐러 증후군 환자 유래의 일차 섬유아세포에서 α-L-아이두로니데이스 활성의 회복(도 29)을 포함한 다양한 응용 분야에서 표현형 변화 또는 생리학적 변화를 일으킬 수 있었다. 따라서, LEAPER는 질환 치료에 엄청난 잠재력을 갖는다고 생각할 수 있다.

스태포스트(Stafforst)와 동료들은 합성 안티센스 올리고뉴클레오티드⁵⁶를 사용한 내인성 ADAR의 리크루팅을 통해 작용하는 RESTORE라는 칭해지는 새롭고 외견상으로는 유사한 RNA 편집 방법을 보고했다. RESTORE와 LEAPER 사이의 근본적인 차이는 내인성 ADAR 리크루팅을 위한 가이드 RNA의 고유한 특성에 있다. RESTORE의 가이드 RNA는 복잡한 화학적 변형에 의존하는 화학 합성의 안티센스 올리고뉴클레오티드(ASO)에 제한되는 반면, LEAPER의 arRNA는 바이러스 벡터 또는 비바이러스 벡터로부터 화학적 합성 및 발현 등 다양한 방법으로 생성될 수 있다(도 28 및 도 29). 중요한 것은, 화학적으로 심하게 변형된 ASO는 질환 치료에서 일시적으로 작용하도록 제한된다. 대조적으로, arRNA는 발현을 통해 생성될 수 있으며, 이는 지속적인 편집을 위해 특히 중요한 특징이다.

LEAPER의 효율 및 특이성에 관해서는 개선의 여지는 여전히 남아 있다. LEAPER는 내인성 ADAR에 의존하기 때문에, 타겟 세포에서의 ADAR 단백질의 발현 수준은 성공적인 편집을 위한 결정 요인 중 하나이다. 이전 보고⁵⁷ 및 우리의 관찰에 따르면(도 14a, b), ADAR1^p110은 조직 전반에 걸쳐 보편적으로 발현되는 바, LEAPER의 광범위한 적용 가능성을 보장한다. ADAR1^p150은 인터페론 유도성 이소폼⁵⁸이며, LEAPER에서 기능적이라는 것이 입증되었다(도 11e, 도 12b). 따라서, arRNA와 인터페론 자극 RNA의 공-형질감염은 소정의 상황에서 편집 효율을 더욱 향상시킬 수 있다. 대안적으로, ADAR3가 억제적 역할을 하기 때문에, ADAR3의 억제는 ADAR3 발현 세포에서 편집 효율을 향상시킬 수 있다. 더욱이, arRNA의 추가 수식은 편집 효율을 높일 수 있다. 예를 들면, 소정의 ADAR 리크루팅 스캐폴드와 융합된 arRNA는 국소 ADAR 단백질 농도를 증가시켜, 결과적으로 편집 수율을 높일 수 있다. 지금까지, 우리는 A에서 I로의 염기 전환을 위해 내인성 ADAR1/2 단백질만을 활용할 수 있었다. 유전적 요소의 수식을 위해, 특히 강력한 핵산 편집을 실현하기 위해 더 많은 고유 메커니즘이 유사하게 활용될 수 있는지 탐구하는 것은 흥미롭다.

전체적으로, 우리는 세포에서의 내인성 기계가 RNA 전사체를 편집하기 위해 채택될 수 있다는 원리의 증거를 제공했다. 우리는 LEAPER가 유전자 편집 기반 치료 및 연구를 위한 새로운 경로를 밝히는 간단하고 효율적이며 안전한 시스템임을 입증했다.

참조 문헌

<110> Peking University EdiGene Inc. <120> Methods and Compositions for Editing RNAs <130> FC00158PCT <141> 2019-09-28 <150> FB00038PCTR FC00109PCTR <151> 2018-10-12 2019-04-15 <160> 343 <170> SIPOSequenceListing 1.0 <210> 1 <211> 708 <212> DNA <213> Artificial Sequence <400> 1 atggtgagca agggcgagga ggataacatg gccatcatca aggagttcat gcgcttcaag 60 gtgcacatgg agggctccgt gaacggccac gagttcgaga tcgagggcga gggcgagggc 120 cgcccctacg agggcaccca gaccgccaag ctgaaggtga ccaagggtgg ccccctgccc 180 ttcgcctggg acatcctgtc ccctcagttc atgtacggct ccaaggccta cgtgaagcac 240 cccgccgaca tccccgacta cttgaagctg tccttccccg agggcttcaa gtgggagcgc 300 gtgatgaact tcgaggacgg cggcgtggtg accgtgaccc aggactcctc cctgcaggac 360 ggcgagttca tctacaaggt gaagctgcgc ggcaccaact tcccctccga cggccccgta 420 atgcagaaga agaccatggg ctgggaggcc tcctccgagc ggatgtaccc cgaggacggc 480 gccctgaagg gcgagatcaa gcagaggctg aagctgaagg acggcggcca ctacgacgct 540 gaggtcaaga ccacctacaa ggccaagaag cccgtgcagc tgcccggcgc ctacaacgtc 600 aacatcaagt tggacatcac ctcccacaac gaggactaca ccatcgtgga acagtacgaa 660 cgcgccgagg gccgccactc caccggcggc atggacgagc tgtacaag 708 <210> 2 <211> 99 <212> DNA <213> Artificial Sequence <400> 2 ctgcagggcg gaggaggcag cggcggagga ggcagcggcg gaggaggcag cagaaggtat 60 acacgccgga agaatctgta gagatccccg gtcgccacc 99 <210> 3 <211> 717 <212> DNA <213> Artificial Sequence <400> 3 gtgagcaagg gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc 60 gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc 120 aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc 180 gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcag 240 cacgacttct tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc 300 aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg 360 aaccgcatcg agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag 420 ctggagtaca actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc 480 atcaaggtga acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac 540 cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac 600 ctgagcaccc agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg 660 ctggagttcg tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaa 717 <210> 4 <211> 81 <212> DNA <213> Artificial Sequence <400> 4 ctgcagggcg gaggaggcag cggcggagga ggcagcggcg gaggaggcag cgcctgctcg 60 cgatgctaga gggctctgcc a 81 <210> 5 <211> 50 <212> DNA <213> Artificial Sequence <400> 5 ctgcagggcg gaggaggcag cgcctgctcg cgatgctaga gggctctgcc 50 <210> 6 <211> 101 <212> RNA <213> Artificial Sequence <400> 6 ggaccacccc aaaaaugaau auaaccaaaa cugaacagcu ccucgcccuu gcucacuggc 60 agagcccucc agcaucgcga gcaggcgcug ccuccuccgc c 101 <210> 7 <211> 70 <212> RNA <213> Artificial Sequence <400> 7 aaaccgaggg aucauagggg acugaaucca ccauucuucu cccaaucccu gcaacuccuu 60 cuuccccugc 70 <210> 8 <211> 70 <212> RNA <213> Artificial Sequence <400> 8 ugaacagcuc cucgcccuug cucacuggca gagcccucca gcaucgcgag caggcgcugc 60 cuccuccgcc 70 <210> 9 <211> 111 <212> DNA <213> Artificial Sequence <400> 9 atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgctatagg 60 gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111 <210> 10 <211> 111 <212> DNA <213> Artificial Sequence <400> 10 atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgctaaagg 60 gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111 <210> 11 <211> 111 <212> DNA <213> Artificial Sequence <400> 11 atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgctacagg 60 gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111 <210> 12 <211> 111 <212> DNA <213> Artificial Sequence <400> 12 atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgctagagg 60 gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111 <210> 13 <211> 111 <212> DNA <213> Artificial Sequence <400> 13 atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgcaatagg 60 gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111 <210> 14 <211> 111 <212> DNA <213> Artificial Sequence <400> 14 atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgcaaaagg 60 gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111 <210> 15 <211> 111 <212> DNA <213> Artificial Sequence <400> 15 atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgcaacagg 60 gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111 <210> 16 <211> 111 <212> DNA <213> Artificial Sequence <400> 16 atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgcaagagg 60 gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111 <210> 17 <211> 111 <212> DNA <213> Artificial Sequence <400> 17 atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgccatagg 60 gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111 <210> 18 <211> 111 <212> DNA <213> Artificial Sequence <400> 18 atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgccaaagg 60 gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111 <210> 19 <211> 111 <212> DNA <213> Artificial Sequence <400> 19 atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgccacagg 60 gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111 <210> 20 <211> 111 <212> DNA <213> Artificial Sequence <400> 20 atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgccagagg 60 gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111 <210> 21 <211> 111 <212> DNA <213> Artificial Sequence <400> 21 atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgcgatagg 60 gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111 <210> 22 <211> 111 <212> DNA <213> Artificial Sequence <400> 22 atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgcgaaagg 60 gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111 <210> 23 <211> 111 <212> DNA <213> Artificial Sequence <400> 23 atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgcgacagg 60 gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111 <210> 24 <211> 111 <212> DNA <213> Artificial Sequence <400> 24 atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgcgagagg 60 gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111 <210> 25 <211> 91 <212> RNA <213> Artificial Sequence <400> 25 uagcuguauc gucaaggcac ucuugccuac gccaccagcu ccaaccacca caaguuuaua 60 uucagucauu uucagcaggc cucucucccg c 91 <210> 26 <211> 111 <212> RNA <213> Artificial Sequence <400> 26 gauucugaau uagcuguauc gucaaggcac ucuugccuac gccaccagcu ccaacuacca 60 caaguuuaua uucagucauu uucagcaggc cucucucccg caccugggag c 111 <210> 27 <211> 131 <212> RNA <213> Artificial Sequence <400> 27 uccacaaaau gauucugaau uagcuguauc gucaaggcac ucuugccuac gccaccagcu 60 ccaacuacca caaguuuaua uucagucauu uucagcaggc cucucucccg caccugggag 120 ccgcugagcc u 131 <210> 28 <211> 151 <212> RNA <213> Artificial Sequence <400> 28 aucauauucg uccacaaaau gauucugaau uagcuguauc gucaaggcac ucuugccuac 60 gccaccagcu ccaaccacca caaguuuaua uucagucauu uucagcaggc cucucucccg 120 caccugggag ccgcugagcc ucuggccccg c 151 <210> 29 <211> 171 <212> RNA <213> Artificial Sequence <400> 29 cuauuguugg aucauauucg uccacaaaau gauucugaau uagcuguauc gucaaggcac 60 ucuugccuac gccaccagcu ccaaccacca caaguuuaua uucagucauu uucagcaggc 120 cucucucccg caccugggag ccgcugagcc ucuggccccg ccgccgccuu c 171 <210> 30 <211> 191 <212> RNA <213> Artificial Sequence <400> 30 uaggaauccu cuauuguugg aucauauucg uccacaaaau gauucugaau uagcuguauc 60 gucaaggcac ucuugccuac gccaccagcu ccaaccacca caaguuuaua uucagucauu 120 uucagcaggc cucucucccg caccugggag ccgcugagcc ucuggccccg ccgccgccuu 180 cagugccugc g 191 <210> 31 <211> 151 <212> RNA <213> Artificial Sequence <400> 31 gaggcgcagc auccacaggc ggaggcgaaa gcagcccgga cagcugaggc cggaagaggg 60 uggggccgcg guggccaggg agccggcgcc gccacgcgcg gguggggggg acugggguug 120 cucgcgggcu ccgggcgggc ggcgggcgcc g 151 <210> 32 <211> 151 <212> RNA <213> Artificial Sequence <400> 32 uccuguagcu aaggccacaa aauuauccac uguuuuugga acagucuuuc cgaagagacc 60 aaagaucacc cggcccacau cuucaucucc aauucguagg ucaaaauaca ccuugacggu 120 gacuuugggc cccuucuucu ucucaucggc c 151 <210> 33 <211> 151 <212> RNA <213> Artificial Sequence <400> 33 gcccuggauc augaaguccu ugauuacacg auggaauuug cuguuuuugu agccaaaucc 60 uuucucuccu guagccaagg ccacaaaauu auccacuguu uuuggaacag ucuuuccgaa 120 gagaccaaag aucacccggc cuacaucuuc a 151 <210> 34 <211> 72 <212> RNA <213> Artificial Sequence <400> 34 gcgcaaguua gguuuuguca agaaagggug uaacgcaacc aagucauagu ccgccuagaa 60 gcauuugcgg ug 72 <210> 35 <211> 131 <212> RNA <213> Artificial Sequence <400> 35 gccaugccaa ucucaucuug uuuucugcgc aaguuagguu uugucaagaa aggguguaac 60 gcaaccaagu cauaguccgc cuagaagcau uugcggugga cgauggaggg gccggacucg 120 ucauacuccu g 131 <210> 36 <211> 70 <212> RNA <213> Artificial Sequence <400> 36 ggacuuccug uaacaacgca ucucauauuu ggaaugacca uuaaaaaaac aacaaugugc 60 aaucaaaguc 70 <210> 37 <211> 71 <212> RNA <213> Artificial Sequence <400> 37 caaggugcgg cuccggcccc uccccucuuc aaggggucca cauggcaacu gugaggaggg 60 gagauucagu g 71 <210> 38 <211> 91 <212> RNA <213> Artificial Sequence <400> 38 uagcuguauc gucaaggcac ucgugccgac gccaccagcu ccaaccacca caaggggaga 60 gucagucagg gucagcaggc cucucucccg c 91 <210> 39 <211> 91 <212> RNA <213> Artificial Sequence <400> 39 uagcuguauc gucaaggcac ucuugccgac gccaccagcu ccaaccacca caaguguaua 60 gucagucauu uucagcaggc cucucucccg c 91 <210> 40 <211> 91 <212> RNA <213> Artificial Sequence <400> 40 uagcuggauc gucaaggcac ucgugccgac gccaccagcu ccaaccacca caaggggaga 60 ggcagucagg gucagcaggc cucucucccg c 91 <210> 41 <211> 111 <212> RNA <213> Artificial Sequence <400> 41 gauucugaau uagcuguauc gucaaggcac ucuugccgac gccaccagcu ccaaccacca 60 caaguguaua gucagucauu uucagcaggc cucucucccg caccugggag c 111 <210> 42 <211> 111 <212> RNA <213> Artificial Sequence <400> 42 gauucugaau uagcuguauc gucaaggcac ucgugccgac gccaccagcu ccaaccacca 60 caaguggaga gucagucauu uucagcaggc cucucucccg caccugggag c 111 <210> 43 <211> 111 <212> RNA <213> Artificial Sequence <400> 43 gauucugaau uagcuguauc gucaaggcac ucgugccgac gccaccagcu ccaaccacca 60 caaggggaga gucagucagg gucagcaggc cucucucccg caccugggag c 111 <210> 44 <211> 111 <212> RNA <213> Artificial Sequence <400> 44 gcuccccggu gcgggagaga ggccugcuga cccugacugc cucuccccuu guggugguug 60 gagcuggugg cgucggcacg agugccuuga cgauccagcu aauucagaau c 111 <210> 45 <211> 71 <212> DNA <213> Artificial Sequence <400> 45 tctcagtcca atgtatggtc cgagcacaag ctctaatcaa agtccgcggg tgtagaccgg 60 ttgccatagg a 71 <210> 46 <211> 31 <212> RNA <213> Artificial Sequence <400> 46 ggaccacccc aaaaaugaag gggacuaaaa c 31 <210> 47 <211> 70 <212> RNA <213> Artificial Sequence <400> 47 aaaccgaggg aucauagggg acugaaucca ccauucuucu cccaaucccu gcaacuccuu 60 cuuccccugc 70 <210> 48 <211> 14 <212> RNA <213> Artificial Sequence <400> 48 gcagagccuc cagc 14 <210> 49 <211> 21 <212> RNA <213> Artificial Sequence <400> 49 cucacuggca gagccuccag c 21 <210> 50 <211> 27 <212> RNA <213> Artificial Sequence <400> 50 cccuugcuca cuggcagagc cuccagc 27 <210> 51 <211> 33 <212> RNA <213> Artificial Sequence <400> 51 cucucgcccu ugcucacugg cagagccucc agc 33 <210> 52 <211> 38 <212> RNA <213> Artificial Sequence <400> 52 cucucgcccu ugcucacugg cagagccucc agcaucgc 38 <210> 53 <211> 45 <212> RNA <213> Artificial Sequence <400> 53 ugaacagcuc ucgcccuugc ucacuggcag agccuccagc aucgc 45 <210> 54 <211> 70 <212> RNA <213> Artificial Sequence <400> 54 ugaacagcuc cucgcccuug cucacuggca gagcccucca gcaucgcgag caggcgcugc 60 cuccuccgcc 70 <210> 55 <211> 70 <212> RNA <213> Artificial Sequence <400> 55 aaaccgaggg aucauagggg acugaaucca ccauucuucu cccaaucccu gcaacuccuu 60 cuuccccugc 70 <210> 56 <211> 70 <212> RNA <213> Artificial Sequence <400> 56 ugaacagcuc cucgcccuug cucacuggca gagcccucca gcaucgcgag caggcgcugc 60 cuccuccgcc 70 <210> 57 <211> 71 <212> RNA <213> Artificial Sequence <400> 57 ucucagucca auguaugguc cgagcacaag cucuaaucaa aguccgcggg uguagaccgg 60 uugccauagg a 71 <210> 58 <211> 71 <212> RNA <213> Artificial Sequence <400> 58 acagcuccuc gcccuugcuc acuggcagag cccuccagca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 59 <211> 71 <212> RNA <213> Artificial Sequence <400> 59 acagcuccuc gcccuugcuc acuggcagag cccucaagca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 60 <211> 71 <212> RNA <213> Artificial Sequence <400> 60 acagcuccuc gcccuugcuc acuggcagag cccucuagca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 61 <211> 71 <212> RNA <213> Artificial Sequence <400> 61 acagcuccuc gcccuugcuc acuggcagag cccucgagca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 62 <211> 71 <212> RNA <213> Artificial Sequence <400> 62 acagcuccuc gcccuugcuc acuggcagag cccugcagca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 63 <211> 71 <212> RNA <213> Artificial Sequence <400> 63 acagcuccuc gcccuugcuc acuggcagag cccuucagca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 64 <211> 71 <212> RNA <213> Artificial Sequence <400> 64 acagcuccuc gcccuugcuc acuggcagag cccuacagca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 65 <211> 71 <212> RNA <213> Artificial Sequence <400> 65 acagcuccuc gcccuugcuc acuggcagag cccuccugca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 66 <211> 71 <212> RNA <213> Artificial Sequence <400> 66 acagcuccuc gcccuugcuc acuggcagag cccugcugca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 67 <211> 71 <212> RNA <213> Artificial Sequence <400> 67 acagcuccuc gcccuugcuc acuggcagag cccuucugca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 68 <211> 71 <212> RNA <213> Artificial Sequence <400> 68 acagcuccuc gcccuugcuc acuggcagag cccuacugca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 69 <211> 71 <212> RNA <213> Artificial Sequence <400> 69 acagcuccuc gcccuugcuc acuggcagag cccucccgca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 70 <211> 71 <212> RNA <213> Artificial Sequence <400> 70 acagcuccuc gcccuugcuc acuggcagag cccugccgca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 71 <211> 71 <212> RNA <213> Artificial Sequence <400> 71 acagcuccuc gcccuugcuc acuggcagag cccuuccgca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 72 <211> 71 <212> RNA <213> Artificial Sequence <400> 72 acagcuccuc gcccuugcuc acuggcagag cccuaccgca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 73 <211> 71 <212> RNA <213> Artificial Sequence <400> 73 acagcuccuc gcccuugcuc acuggcagag cccuccggca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 74 <211> 71 <212> RNA <213> Artificial Sequence <400> 74 acagcuccuc gcccuugcuc acuggcagag cccugcugca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 75 <211> 71 <212> RNA <213> Artificial Sequence <400> 75 acagcuccuc gcccuugcuc acuggcagag cccuucggca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 76 <211> 71 <212> RNA <213> Artificial Sequence <400> 76 acagcuccuc gcccuugcuc acuggcagag cccuacggca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 77 <211> 31 <212> RNA <213> Artificial Sequence <400> 77 acuggcagag cccuccagca ucgcgagcag g 31 <210> 78 <211> 51 <212> RNA <213> Artificial Sequence <400> 78 gcccuugcuc acuggcagag cccuccagca ucgcgagcag gcgcugccuc c 51 <210> 79 <211> 71 <212> RNA <213> Artificial Sequence <400> 79 acagcuccuc gcccuugcuc acuggcagag cccuccagca ucgcgagcag gcgcugccuc 60 cuccgccgcu g 71 <210> 80 <211> 91 <212> RNA <213> Artificial Sequence <400> 80 accccgguga acagcuccuc gcccuugcuc acuggcagag cccuccagca ucgcgagcag 60 gcgcugccuc cuccgccgcu gccuccuccg c 91 <210> 81 <211> 131 <212> RNA <213> Artificial Sequence <400> 81 gcucgaccag gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag 60 cccuccagca ucgcgagcag gcgcugccuc cuccgccgcu gccuccuccg ccgcugccuc 120 cuccgcccug c 131 <210> 82 <211> 151 <212> RNA <213> Artificial Sequence <400> 82 ucgccgucca gcucgaccag gaugggcacc accccgguga acagcuccuc gcccuugcuc 60 acuggcagag cccuccagca ucgcgagcag gcgcugccuc cuccgccgcu gccuccuccg 120 ccgcugccuc cuccgcccug cagcuuguac a 151 <210> 83 <211> 171 <212> RNA <213> Artificial Sequence <400> 83 gccguuuacg ucgccgucca gcucgaccag gaugggcacc accccgguga acagcuccuc 60 gcccuugcuc acuggcagag cccuccagca ucgcgagcag gcgcugccuc cuccgccgcu 120 gccuccuccg ccgcugccuc cuccgcccug cagcuuguac agcucgucca u 171 <210> 84 <211> 191 <212> RNA <213> Artificial Sequence <400> 84 ugaacuugug gccguuuacg ucgccgucca gcucgaccag gaugggcacc accccgguga 60 acagcuccuc gcccuugcuc acuggcagag cccuccagca ucgcgagcag gcgcugccuc 120 cuccgccgcu gccuccuccg ccgcugccuc cuccgcccug cagcuuguac agcucgucca 180 ugccgccggu g 191 <210> 85 <211> 211 <212> RNA <213> Artificial Sequence <400> 85 ccggacacgc ugaacuugug gccguuuacg ucgccgucca gcucgaccag gaugggcacc 60 accccgguga acagcuccuc gcccuugcuc acuggcagag cccuccagca ucgcgagcag 120 gcgcugccuc cuccgccgcu gccuccuccg ccgcugccuc cuccgcccug cagcuuguac 180 agcucgucca ugccgccggu ggaguggcgg c 211 <210> 86 <211> 31 <212> RNA <213> Artificial Sequence <400> 86 gcgaccgggg aucuccacag auucuuccgg c 31 <210> 87 <211> 51 <212> RNA <213> Artificial Sequence <400> 87 gcucacggug gcgaccgggg aucuccacag auucuuccgg cguguauacc u 51 <210> 88 <211> 71 <212> RNA <213> Artificial Sequence <400> 88 ccucgcccuu gcucacggug gcgaccgggg aucuccacag auucuuccgg cguguauacc 60 uucugcugcc u 71 <210> 89 <211> 91 <212> RNA <213> Artificial Sequence <400> 89 gugaacagcu ccucgcccuu gcucacggug gcgaccgggg aucuccacag auucuuccgg 60 cguguauacc uucugcugcc uccuccgccg c 91 <210> 90 <211> 111 <212> RNA <213> Artificial Sequence <400> 90 caccaccccg gugaacagcu ccucgcccuu gcucacggug gcgaccgggg aucuccacag 60 auucuuccgg cguguauacc uucugcugcc uccuccgccg cugccuccuc c 111 <210> 91 <211> 131 <212> RNA <213> Artificial Sequence <400> 91 ccaggauggg caccaccccg gugaacagcu ccucgcccuu gcucacggug gcgaccgggg 60 aucuccacag auucuuccgg cguguauacc uucugcugcc uccuccgccg cugccuccuc 120 cgccgcugcc u 131 <210> 92 <211> 151 <212> RNA <213> Artificial Sequence <400> 92 uccagcucga ccaggauggg caccaccccg gugaacagcu ccucgcccuu gcucacggug 60 gcgaccgggg aucuccacag auucuuccgg cguguauacc uucugcugcc uccuccgccg 120 cugccuccuc cgccgcugcc uccuccgccc u 151 <210> 93 <211> 171 <212> RNA <213> Artificial Sequence <400> 93 cggcgacgua uccagcucga ccaggauggg caccaccccg gugaacagcu ccucgcccuu 60 gcucacggug gcgaccgggg aucuccacag auucuuccgg cguguauacc uucugcugcc 120 uccuccgccg cugccuccuc cgccgcugcc uccuccgccc ugcagcuugu a 171 <210> 94 <211> 191 <212> RNA <213> Artificial Sequence <400> 94 uguggccguu uacgucgccg uccagcucga ccaggauggg caccaccccg gugaacagcu 60 ccucgcccuu gcucacggug gcgaccgggg aucuccacag auucuuccgg cguguauacc 120 uucugcugcc uccuccgccg cugccuccuc cgccgcugcc uccuccgccc ugcagcuugu 180 acagcucguc c 191 <210> 95 <211> 211 <212> RNA <213> Artificial Sequence <400> 95 acgcugaacu uguggccguu uacgucgccg uccagcucga ccaggauggg caccaccccg 60 gugaacagcu ccucgcccuu gcucacggug gcgaccgggg aucuccacag auucuuccgg 120 cguguauacc uucugcugcc uccuccgccg cugccuccuc cgccgcugcc uccuccgccc 180 ugcagcuugu acagcucguc caugccgccg g 211 <210> 96 <211> 71 <212> RNA <213> Artificial Sequence <400> 96 cagcaucgcg agcaggcgcu gccuccuccg ccgcugccuc cuccgccgcu gccuccuccg 60 cccugcagcu u 71 <210> 97 <211> 71 <212> RNA <213> Artificial Sequence <400> 97 cccuccagca ucgcgagcag gcgcugccuc cuccgccgcu gccuccuccg ccgcugccuc 60 cuccgcccug c 71 <210> 98 <211> 71 <212> RNA <213> Artificial Sequence <400> 98 cagagcccuc cagcaucgcg agcaggcgcu gccuccuccg ccgcugccuc cuccgccgcu 60 gccuccuccg c 71 <210> 99 <211> 72 <212> RNA <213> Artificial Sequence <400> 99 acuggcagag cccucccagc aucgcgagca ggcgcugccu ccuccgccgc ugccuccucc 60 gccgcugccu cc 72 <210> 100 <211> 71 <212> RNA <213> Artificial Sequence <400> 100 ugcucacugg cagagcccuc cagcaucgcg agcaggcgcu gccuccuccg ccgcugccuc 60 cuccgccgcu g 71 <210> 101 <211> 71 <212> RNA <213> Artificial Sequence <400> 101 gcccuugcuc acuggcagag cccuccagca ucgcgagcag gcgcugccuc cuccgccgcu 60 gccuccuccg c 71 <210> 102 <211> 71 <212> RNA <213> Artificial Sequence <400> 102 uccucgcccu ugcucacugg cagagcccuc cagcaucgcg agcaggcgcu gccuccuccg 60 ccgcugccuc c 71 <210> 103 <211> 71 <212> RNA <213> Artificial Sequence <400> 103 ggugaacagc uccucgcccu ugcucacugg cagagcccuc cagcaucgcg agcaggcgcu 60 gccuccuccg c 71 <210> 104 <211> 71 <212> RNA <213> Artificial Sequence <400> 104 accccgguga acagcuccuc gcccuugcuc acuggcagag cccuccagca ucgcgagcag 60 gcgcugccuc c 71 <210> 105 <211> 71 <212> RNA <213> Artificial Sequence <400> 105 gcaccacccc ggugaacagc uccucgcccu ugcucacugg cagagcccuc cagcaucgcg 60 agcaggcgcu g 71 <210> 106 <211> 71 <212> RNA <213> Artificial Sequence <400> 106 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuccagca 60 ucgcgagcag g 71 <210> 107 <211> 71 <212> RNA <213> Artificial Sequence <400> 107 accaggaugg gcaccacccc ggugaacagc uccucgcccu ugcucacugg cagagcccuc 60 cagcaucgcg a 71 <210> 108 <211> 71 <212> RNA <213> Artificial Sequence <400> 108 gcucgaccag gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag 60 cccuccagca u 71 <210> 109 <211> 71 <212> RNA <213> Artificial Sequence <400> 109 guccagcucg accaggaugg gcaccacccc ggugaacagc uccucgcccu ugcucacugg 60 cagagcccuc c 71 <210> 110 <211> 71 <212> RNA <213> Artificial Sequence <400> 110 cacagauucu uccggcgugu auaccuucug cugccuccuc cgccgcugcc uccuccgccg 60 cugccuccuc c 71 <210> 111 <211> 71 <212> RNA <213> Artificial Sequence <400> 111 aucuccacag auucuuccgg cguguauacc uucugcugcc uccuccgccg cugccuccuc 60 cgccgcugcc u 71 <210> 112 <211> 71 <212> RNA <213> Artificial Sequence <400> 112 cggggaucuc cacagauucu uccggcgugu auaccuucug cugccuccuc cgccgcugcc 60 uccuccgccg c 71 <210> 113 <211> 71 <212> RNA <213> Artificial Sequence <400> 113 gcgaccgggg aucuccacag auucuuccgg cguguauacc uucugcugcc uccuccgccg 60 cugccuccuc c 71 <210> 114 <211> 71 <212> RNA <213> Artificial Sequence <400> 114 cgguggcgac cggggaucuc cacagauucu uccggcgugu auaccuucug cugccuccuc 60 cgccgcugcc u 71 <210> 115 <211> 71 <212> RNA <213> Artificial Sequence <400> 115 gcucacggug gcgaccgggg aucuccacag auucuuccgg cguguauacc uucugcugcc 60 uccuccgccg c 71 <210> 116 <211> 71 <212> RNA <213> Artificial Sequence <400> 116 cccuugcuca cgguggcgac cggggaucuc cacagauucu uccggcgugu auaccuucug 60 cugccuccuc c 71 <210> 117 <211> 71 <212> RNA <213> Artificial Sequence <400> 117 cagcuccucg cccuugcuca cgguggcgac cggggaucuc cacagauucu uccggcgugu 60 auaccuucug c 71 <210> 118 <211> 71 <212> RNA <213> Artificial Sequence <400> 118 gugaacagcu ccucgcccuu gcucacggug gcgaccgggg aucuccacag auucuuccgg 60 cguguauacc u 71 <210> 119 <211> 71 <212> RNA <213> Artificial Sequence <400> 119 ccccggugaa cagcuccucg cccuugcuca cgguggcgac cggggaucuc cacagauucu 60 uccggcgugu a 71 <210> 120 <211> 71 <212> RNA <213> Artificial Sequence <400> 120 caccaccccg gugaacagcu ccucgcccuu gcucacggug gcgaccgggg aucuccacag 60 auucuuccgg c 71 <210> 121 <211> 71 <212> RNA <213> Artificial Sequence <400> 121 augggcacca ccccggugaa cagcuccucg cccuugcuca cgguggcgac cggggaucuc 60 cacagauucu u 71 <210> 122 <211> 71 <212> RNA <213> Artificial Sequence <400> 122 ccaggauggg caccaccccg gugaacagcu ccucgcccuu gcucacggug gcgaccgggg 60 aucuccacag a 71 <210> 123 <211> 71 <212> RNA <213> Artificial Sequence <400> 123 cucgaccagg augggcacca ccccggugaa cagcuccucg cccuugcuca cgguggcgac 60 cggggaucuc c 71 <210> 124 <211> 111 <212> RNA <213> Artificial Sequence <400> 124 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuccagca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 125 <211> 111 <212> RNA <213> Artificial Sequence <400> 125 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccugcagca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 126 <211> 111 <212> RNA <213> Artificial Sequence <400> 126 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuucagca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 127 <211> 111 <212> RNA <213> Artificial Sequence <400> 127 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuacagca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 128 <211> 111 <212> RNA <213> Artificial Sequence <400> 128 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuccggca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 129 <211> 111 <212> RNA <213> Artificial Sequence <400> 129 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccugcggca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 130 <211> 111 <212> RNA <213> Artificial Sequence <400> 130 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuucggca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 131 <211> 111 <212> RNA <213> Artificial Sequence <400> 131 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuacggca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 132 <211> 111 <212> RNA <213> Artificial Sequence <400> 132 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuccugca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 133 <211> 111 <212> RNA <213> Artificial Sequence <400> 133 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccugcugca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 134 <211> 111 <212> RNA <213> Artificial Sequence <400> 134 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuacugca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 135 <211> 111 <212> RNA <213> Artificial Sequence <400> 135 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuucugca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 136 <211> 111 <212> RNA <213> Artificial Sequence <400> 136 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucccgca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 137 <211> 111 <212> RNA <213> Artificial Sequence <400> 137 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccugccgca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 138 <211> 111 <212> RNA <213> Artificial Sequence <400> 138 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuuccgca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 139 <211> 111 <212> RNA <213> Artificial Sequence <400> 139 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuaccgca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 140 <211> 111 <212> RNA <213> Artificial Sequence <400> 140 uaccgcuaca gccacgcuga uuucagcuau accugcccgg uauaaaggga cguucacacc 60 gcgauguucu cugcugggga auugcgcgau auucaggauu aaaagaagug c 111 <210> 141 <211> 151 <212> RNA <213> Artificial Sequence <400> 141 acuacaguug cuccgauauu uaggcuacgu caauaggcac uaacuuauug gcgcugguga 60 acggacuucc ucucgaguac cagaagauga cuacaaaacu ccuuuccauu gcgaguaucg 120 gagucuggcu caguuuggcc agggaggcac u 151 <210> 142 <211> 51 <212> RNA <213> Artificial Sequence <400> 142 cggaagaggg uggggccgcg guggccaggg agccggcgcc gccacgcgcg g 51 <210> 143 <211> 71 <212> RNA <213> Artificial Sequence <400> 143 cagcugaggc cggaagaggg uggggccgcg guggccaggg agccggcgcc gccacgcgcg 60 gguggggggg a 71 <210> 144 <211> 111 <212> RNA <213> Artificial Sequence <400> 144 ggaggcgaaa gcagcccgga cagcugaggc cggaagaggg uggggccgcg guggccaggg 60 agccggcgcc gccacgcgcg gguggggggg acugggguug cucgcgggcu c 111 <210> 145 <211> 151 <212> RNA <213> Artificial Sequence <400> 145 gaggcgcagc auccacaggc ggaggcgaaa gcagcccgga cagcugaggc cggaagaggg 60 uggggccgcg guggccaggg agccggcgcc gccacgcgcg gguggggggg acugggguug 120 cucgcgggcu ccgggcgggc ggcgggcgcc g 151 <210> 146 <211> 51 <212> RNA <213> Artificial Sequence <400> 146 ucuugccuac gccaccagcu ccaaccacca caaguuuaua uucagucauu u 51 <210> 147 <211> 111 <212> RNA <213> Artificial Sequence <400> 147 gauucugaau uagcuguauc gucaaggcac ucuugccuac gccaccagcu ccaaccacca 60 caaguuuaua uucagucauu uucagcaggc cucucucccg caccugggag c 111 <210> 148 <211> 151 <212> RNA <213> Artificial Sequence <400> 148 aucauauucg uccacaaaau gauucugaau uagcuguauc gucaaggcac ucuugccuac 60 gccaccagcu ccaaccacca caaguuuaua uucagucauu uucagcaggc cucucucccg 120 caccugggag ccgcugagcc ucuggccccg c 151 <210> 149 <211> 51 <212> RNA <213> Artificial Sequence <400> 149 ucggcauggu augaaguacu ucguccagga gcuggagggc ccgguguaag u 51 <210> 150 <211> 71 <212> RNA <213> Artificial Sequence <400> 150 gggucugcaa ucggcauggu augaaguacu ucguccagga gcuggagggc ccgguguaag 60 ugaauuucaa u 71 <210> 151 <211> 111 <212> RNA <213> Artificial Sequence <400> 151 gaccucaguc uaaagguugu gggucugcaa ucggcauggu augaaguacu ucguccagga 60 gcuggagggc ccgguguaag ugaauuucaa uccagcaagg uguuucuuug a 111 <210> 152 <211> 151 <212> RNA <213> Artificial Sequence <400> 152 uaagggcccc aacgguaaaa gaccucaguc uaaagguugu gggucugcaa ucggcauggu 60 augaaguacu ucguccagga gcuggagggc ccgguguaag ugaauuucaa uccagcaagg 120 uguuucuuug augcucuguc uuggguaauc c 151 <210> 153 <211> 51 <212> RNA <213> Artificial Sequence <400> 153 ugggggguuc ggcugccgac aucagcaauu gcucugccac caucucagcc c 51 <210> 154 <211> 71 <212> RNA <213> Artificial Sequence <400> 154 agcagggccg ugggggguuc ggcugccgac aucagcaauu gcucugccac caucucagcc 60 cauccuccga a 71 <210> 155 <211> 111 <212> RNA <213> Artificial Sequence <400> 155 aguagaaggc caagagccac agcagggccg ugggggguuc ggcugccgac aucagcaauu 60 gcucugccac caucucagcc cauccuccga agugaaugaa caggaaccag c 111 <210> 156 <211> 151 <212> RNA <213> Artificial Sequence <400> 156 ccucccauca cgggggccgu aguagaaggc caagagccac agcagggccg ugggggguuc 60 ggcugccgac aucagcaauu gcucugccac caucucagcc cauccuccga agugaaugaa 120 caggaaccag cucucaaagg gaccuccgca g 151 <210> 157 <211> 151 <212> DNA <213> Artificial Sequence <400> 157 gccaaacacc acatgcttgc catctagcca ggctgtcttg actgtcgtga tgaagaactg 60 ggagccgttg gtgtccttgc ctgcgttggc catgctcacc cagccaggcc cgtagtgctt 120 cagtttgaag ttctcatcgg ggaagcgctc a 151 <210> 158 <211> 151 <212> DNA <213> Artificial Sequence <400> 158 gggagtgggt ccgctccacc agatgccagc accggggcca gtgcagctca gagccctgtg 60 gcggactaca gggcccgcac agacggtcac tcaaagaaag atgtccctgt gccctactcc 120 ttggcgatgg caaagggctt ctccacctcg a 151 <210> 159 <211> 151 <212> DNA <213> Artificial Sequence <400> 159 tgcattttgt aaaatagata ctagcagatt gtcccaagat gtgtacagct cattctcaca 60 gcccagcgag ggcacctact ccacaaatgc gtggccacag gtcatcacct gtcctgtggc 120 cctggcgagc ctgatccctc acgccgggca c 151 <210> 160 <211> 151 <212> DNA <213> Artificial Sequence <400> 160 gctcattctc acagcccagc gagggcactt actccacaaa tgcgtggcca caggtcatca 60 cctgtcctgt ggccccggcg agcctgatcc ctcacgccgg gcacccacac ggcctgcgtg 120 ccttctagac ttgagttcgc agctctttaa g 151 <210> 161 <211> 151 <212> DNA <213> Artificial Sequence <400> 161 tcggccgggc cctgggggcg gtgggcgctg gccaggacgc ccaccgtgtg gttgctgtcc 60 aggacggtcc cggcccgcga cacttcggcc cagagctgct cctcatccag cagcgccagc 120 agccccatgg ccgtgagcac cggcttgcgc a 151 <210> 162 <211> 111 <212> RNA <213> Artificial Sequence <400> 162 ugaccagucu uaagaucuuu cuugaccugc accauaagaa cuucuccaaa gguaccaaaa 60 uacucuuuca gguccuguuc gguuguuuuc caugggagac ccaacacuau u 111 <210> 163 <211> 111 <212> RNA <213> Artificial Sequence <400> 163 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgagca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 164 <211> 111 <212> RNA <213> Artificial Sequence <400> 164 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuggagca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 165 <211> 111 <212> RNA <213> Artificial Sequence <400> 165 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuugagca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 166 <211> 111 <212> RNA <213> Artificial Sequence <400> 166 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuagagca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 167 <211> 111 <212> RNA <213> Artificial Sequence <400> 167 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgggca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 168 <211> 111 <212> RNA <213> Artificial Sequence <400> 168 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuggggca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 169 <211> 111 <212> RNA <213> Artificial Sequence <400> 169 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuugggca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 170 <211> 111 <212> RNA <213> Artificial Sequence <400> 170 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuagggca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 171 <211> 111 <212> RNA <213> Artificial Sequence <400> 171 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgugca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 172 <211> 111 <212> RNA <213> Artificial Sequence <400> 172 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuggugca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 173 <211> 111 <212> RNA <213> Artificial Sequence <400> 173 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuagugca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 174 <211> 111 <212> RNA <213> Artificial Sequence <400> 174 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuugugca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 175 <211> 111 <212> RNA <213> Artificial Sequence <400> 175 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgcgca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 176 <211> 111 <212> RNA <213> Artificial Sequence <400> 176 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuggcgca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 177 <211> 111 <212> RNA <213> Artificial Sequence <400> 177 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuugcgca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 178 <211> 111 <212> RNA <213> Artificial Sequence <400> 178 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuagcgca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 179 <211> 111 <212> RNA <213> Artificial Sequence <400> 179 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgagca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 180 <211> 111 <212> RNA <213> Artificial Sequence <400> 180 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuggagca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 181 <211> 111 <212> RNA <213> Artificial Sequence <400> 181 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuugagca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 182 <211> 111 <212> RNA <213> Artificial Sequence <400> 182 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuagagca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 183 <211> 111 <212> RNA <213> Artificial Sequence <400> 183 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgugca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 184 <211> 111 <212> RNA <213> Artificial Sequence <400> 184 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgggca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 185 <211> 111 <212> RNA <213> Artificial Sequence <400> 185 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgcgca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 186 <211> 111 <212> RNA <213> Artificial Sequence <400> 186 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgugca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 187 <211> 111 <212> RNA <213> Artificial Sequence <400> 187 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuggugca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 188 <211> 111 <212> RNA <213> Artificial Sequence <400> 188 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuugugca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 189 <211> 111 <212> RNA <213> Artificial Sequence <400> 189 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuagugca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 190 <211> 111 <212> RNA <213> Artificial Sequence <400> 190 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgagca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 191 <211> 111 <212> RNA <213> Artificial Sequence <400> 191 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgcgca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 192 <211> 111 <212> RNA <213> Artificial Sequence <400> 192 gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgggca 60 ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111 <210> 193 <211> 111 <212> RNA <213> Artificial Sequence <400> 193 gauucugaau uagcuguauc gucaaggcac ucgugccgac gccaccagcu ccaaccacca 60 caaguggaga gucagucauu uucagcaggc cucucucccg caccugggag c 111 <210> 194 <211> 111 <212> RNA <213> Artificial Sequence <400> 194 gauucugaau uagcuggauc gucaaggcac ucgggccgac gccaccagcu ccaaccacca 60 caaguggaga gucagucauu uucagcaggc cucucucccg caccggggag c 111 <210> 195 <211> 111 <212> RNA <213> Artificial Sequence <400> 195 gggagcagcc ucuggcauuc ugggagcuuc aucuggaccu gggucuucag ugaaccauug 60 uucaauaucg uccggggaca gcaucaaauc auccauugcu ugggacggca a 111 <210> 196 <211> 111 <212> RNA <213> Artificial Sequence <400> 196 gggagcagcc ucuggcauuc ugggagcuuc aucuggaccu gggucuucag ugaaccauug 60 uucaagaucg uccggggaca gcaucaaauc auccauugcu ugggacggca a 111 <210> 197 <211> 111 <212> RNA <213> Artificial Sequence <400> 197 gggagcagcc ucuggcaguc ggggagcuuc aucuggaccu gggucuucag ugaaccauug 60 uucaagaucg uccggggaca gcaucaaauc auccagugcu ugggacggca a 111 <210> 198 <211> 111 <212> RNA <213> Artificial Sequence <400> 198 cauauuacag aauaccuuga uagcauccaa uuugcauccu ugguuagggu caacccagua 60 uucuccacuc uugaguucag gauggcagaa uuucaggucu cugcaguuuc u 111 <210> 199 <211> 111 <212> RNA <213> Artificial Sequence <400> 199 gugaagauaa gccaguccuc uaguaacaga augagcaaga cggcaagagc uuacccaguc 60 acuugugugg agacuuaaau acuugcauaa agauccauug ggauaguacu c 111 <210> 200 <211> 111 <212> RNA <213> Artificial Sequence <400> 200 gugaacguca aacugucgga ccaauauggc agaaucuucu cucaucucaa cuuuccauau 60 ccguaucaug gaaucauagc auccuguaac uacuagcucu cuuacagcug g 111 <210> 201 <211> 111 <212> RNA <213> Artificial Sequence <400> 201 gccaaugauc ucgugaguua ucucagcagu gugagccauc agggugauga caucccaggc 60 gaucgugugg ccuccaggag cccagagcag gaaguugagg agaaggugcc u 111 <210> 202 <211> 111 <212> RNA <213> Artificial Sequence <400> 202 caagacggug aaccacucca uggucuucuu gucggcuuuc ugcacugugu acccccagag 60 cuccguguug ccgacauccu gggguggcuu ccacuccaga gccacauuaa g 111 <210> 203 <211> 111 <212> RNA <213> Artificial Sequence <400> 203 aggauucucu uuugaaguau ugcuccccca guggauuggg uggcuccauu cacuccaaug 60 cugagcacuu ccacagagug gguuaaagcg gcuccgaaca cgaaacgugu a 111 <210> 204 <211> 111 <212> RNA <213> Artificial Sequence <400> 204 gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60 cugcuccuca uccagcagcg ccagcagccc cauggccgug agcaccggcu u 111 <210> 205 <211> 111 <212> RNA <213> Artificial Sequence <400> 205 gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60 cugcuccuca ucugcggggc gggggggggc cgucgccgcg uggggucguu g 111 <210> 206 <211> 31 <212> DNA <213> Artificial Sequence <400> 206 tataactagt atggtgagca agggcgagga g 31 <210> 207 <211> 41 <212> DNA <213> Artificial Sequence <400> 207 tatacgtctc atctacagat tcttccggcg tgtatacctt c 41 <210> 208 <211> 53 <212> DNA <213> Artificial Sequence <400> 208 tatacgtctc atagagatcc ccggtcgcca ccgtgagcaa gggcgaggag ctg 53 <210> 209 <211> 36 <212> DNA <213> Artificial Sequence <400> 209 tataggcgcg ccttacttgt acagctcgtc catgcc 36 <210> 210 <211> 94 <212> DNA <213> Artificial Sequence <400> 210 tatacgtctc aaggcgctgc ctcctccgcc gctgcctcct ccgccgctgc ctcctccgcc 60 ctgcagcttg tacagctcgt ccatgccgcc ggtg 94 <210> 211 <211> 62 <212> DNA <213> Artificial Sequence <400> 211 tatacgtctc agcctgctcg cgatgctaga gggctctgcc agtgagcaag ggcgaggagc 60 tg 62 <210> 212 <211> 70 <212> DNA <213> Artificial Sequence <400> 212 tataactagt atggtggatt acaaggatga cgacgataag atgaaagtga cgaaggtagg 60 aggcatttcg 70 <210> 213 <211> 60 <212> DNA <213> Artificial Sequence <400> 213 atatggcgcg ccgttttcag actttttctc ttccattttg tattcaaaca taatcttcac 60 <210> 214 <211> 69 <212> DNA <213> Artificial Sequence <400> 214 tataggcgcg ccaggcggag gaggcagcgg cggaggaggc agcctcctcc tctcaaggtc 60 cccagaagc 69 <210> 215 <211> 64 <212> DNA <213> Artificial Sequence <400> 215 tatacctgca ggctacacct tgcgtttttt cttgggtact gggcagagat aaaagttctt 60 ttcc 64 <210> 216 <211> 24 <212> DNA <213> Artificial Sequence <400> 216 cactccaccg gcggcatgga cgag 24 <210> 217 <211> 28 <212> DNA <213> Artificial Sequence <400> 217 cacgctgaac ttgtggccgt ttacgtcg 28 <210> 218 <211> 40 <212> DNA <213> Artificial Sequence <400> 218 tataactagt atgaatccgc ggcaggggta ttccctcagc 40 <210> 219 <211> 73 <212> DNA <213> Artificial Sequence <400> 219 tataggcgcg ccctacttat cgtcgtcatc cttgtaatct actgggcaga gataaaagtt 60 cttttcctcc tgg 73 <210> 220 <211> 42 <212> DNA <213> Artificial Sequence <400> 220 tataactagt atggatatag aagatgaaga aaacatgagt tc 42 <210> 221 <211> 67 <212> DNA <213> Artificial Sequence <400> 221 tataggcgcg ccctacttat cgtcgtcatc cttgtaatcg ggcgtgagtg agaactggtc 60 ctgctcg 67 <210> 222 <211> 37 <212> DNA <213> Artificial Sequence <400> 222 tataactagt atggccgaga tcaaggagaa aatctgc 37 <210> 223 <211> 73 <212> DNA <213> Artificial Sequence <400> 223 tataggcgcg ccctacttat cgtcgtcatc cttgtaatct actgggcaga gataaaagtt 60 cttttcctcc tgg 73 <210> 224 <211> 19 <212> DNA <213> Artificial Sequence <400> 224 cgccatttcg gactgggag 19 <210> 225 <211> 25 <212> DNA <213> Artificial Sequence <400> 225 agagacaggt ttctccatca attac 25 <210> 226 <211> 16 <212> DNA <213> Artificial Sequence <400> 226 gagcccgcga gcaacc 16 <210> 227 <211> 20 <212> DNA <213> Artificial Sequence <400> 227 gcagcaggaa gaagacggac 20 <210> 228 <211> 23 <212> DNA <213> Artificial Sequence <400> 228 agaagcagtt gaagaccaga ctc 23 <210> 229 <211> 20 <212> DNA <213> Artificial Sequence <400> 229 ggccttcacc tggaccatag 20 <210> 230 <211> 22 <212> DNA <213> Artificial Sequence <400> 230 agagaagcag ttgaagacca ga 22 <210> 231 <211> 20 <212> DNA <213> Artificial Sequence <400> 231 cggccttcac ctggaccata 20 <210> 232 <211> 23 <212> DNA <213> Artificial Sequence <400> 232 cagagaagca gttgaagacc aga 23 <210> 233 <211> 20 <212> DNA <213> Artificial Sequence <400> 233 cggccttcac ctggaccata 20 <210> 234 <211> 20 <212> DNA <213> Artificial Sequence <400> 234 tttgtgaaag gctggggacc 20 <210> 235 <211> 25 <212> DNA <213> Artificial Sequence <400> 235 acaggattgt attttgtagt ccacc 25 <210> 236 <211> 23 <212> DNA <213> Artificial Sequence <400> 236 aggatgagtt ttgtgaaagg ctg 23 <210> 237 <211> 24 <212> DNA <213> Artificial Sequence <400> 237 attttgtagt ccaccatcct gata 24 <210> 238 <211> 22 <212> DNA <213> Artificial Sequence <400> 238 gatgagtttt gtgaaaggct gg 22 <210> 239 <211> 25 <212> DNA <213> Artificial Sequence <400> 239 attttgtagt ccaccatcct gataa 25 <210> 240 <211> 20 <212> DNA <213> Artificial Sequence <400> 240 cgaagagaac gagaccgcat 20 <210> 241 <211> 19 <212> DNA <213> Artificial Sequence <400> 241 gaagatggtg cacaccggg 19 <210> 242 <211> 22 <212> DNA <213> Artificial Sequence <400> 242 gacagatgct tcatcagcag tg 22 <210> 243 <211> 21 <212> DNA <213> Artificial Sequence <400> 243 cgaacaaagc caaacccctt t 21 <210> 244 <211> 25 <212> DNA <213> Artificial Sequence <400> 244 tctgttaatg gacaaataga aagcc 25 <210> 245 <211> 23 <212> DNA <213> Artificial Sequence <400> 245 ggaacattca aaggattggc act 23 <210> 246 <211> 20 <212> DNA <213> Artificial Sequence <400> 246 agtcactgca gatggacgca 20 <210> 247 <211> 22 <212> DNA <213> Artificial Sequence <400> 247 atctcgatgg gaaattgcag gt 22 <210> 248 <211> 25 <212> DNA <213> Artificial Sequence <400> 248 tcagagtttt acctcatcct tcttt 25 <210> 249 <211> 25 <212> DNA <213> Artificial Sequence <400> 249 cctgaataca tatgatgacc ttcag 25 <210> 250 <211> 20 <212> DNA <213> Artificial Sequence <400> 250 agggcacaga cacagacctc 20 <210> 251 <211> 21 <212> DNA <213> Artificial Sequence <400> 251 agggctttca atgccaagac g 21 <210> 252 <211> 19 <212> DNA <213> Artificial Sequence <400> 252 tgacaagcca agtcctccc 19 <210> 253 <211> 21 <212> DNA <213> Artificial Sequence <400> 253 attgccaatg atgagctctg g 21 <210> 254 <211> 25 <212> DNA <213> Artificial Sequence <400> 254 ttatagacat aagttctcct tgcct 25 <210> 255 <211> 20 <212> DNA <213> Artificial Sequence <400> 255 tcaatcccat ggagccaaca 20 <210> 256 <211> 50 <212> DNA <213> Artificial Sequence <400> 256 tacacgacgc tcttccgatc ttaagtagag gccgccactc caccggcggc 50 <210> 257 <211> 51 <212> DNA <213> Artificial Sequence <400> 257 tacacgacgc tcttccgatc tatcatgctt agccgccact ccaccggcgg c 51 <210> 258 <211> 52 <212> DNA <213> Artificial Sequence <400> 258 tacacgacgc tcttccgatc tgatgcacat ctgccgccac tccaccggcg gc 52 <210> 259 <211> 53 <212> DNA <213> Artificial Sequence <400> 259 tacacgacgc tcttccgatc tcgattgctc gacgccgcca ctccaccggc ggc 53 <210> 260 <211> 54 <212> DNA <213> Artificial Sequence <400> 260 tacacgacgc tcttccgatc ttcgatagca attcgccgcc actccaccgg cggc 54 <210> 261 <211> 55 <212> DNA <213> Artificial Sequence <400> 261 tacacgacgc tcttccgatc tatcgatagt tgcttgccgc cactccaccg gcggc 55 <210> 262 <211> 56 <212> DNA <213> Artificial Sequence <400> 262 tacacgacgc tcttccgatc tgatcgatcc agttaggccg ccactccacc ggcggc 56 <210> 263 <211> 57 <212> DNA <213> Artificial Sequence <400> 263 tacacgacgc tcttccgatc tcgatcgatt tgagcctgcc gccactccac cggcggc 57 <210> 264 <211> 58 <212> DNA <213> Artificial Sequence <400> 264 tacacgacgc tcttccgatc tacgatcgat acacgatcgc cgccactcca ccggcggc 58 <210> 265 <211> 59 <212> DNA <213> Artificial Sequence <400> 265 tacacgacgc tcttccgatc ttacgatcga tggtccagag ccgccactcc accggcggc 59 <210> 266 <211> 50 <212> DNA <213> Artificial Sequence <400> 266 agacgtgtgc tcttccgatc ttaagtagag tcgccgtcca gctcgaccag 50 <210> 267 <211> 51 <212> DNA <213> Artificial Sequence <400> 267 agacgtgtgc tcttccgatc tatcatgctt atcgccgtcc agctcgacca g 51 <210> 268 <211> 52 <212> DNA <213> Artificial Sequence <400> 268 agacgtgtgc tcttccgatc tgatgcacat cttcgccgtc cagctcgacc ag 52 <210> 269 <211> 53 <212> DNA <213> Artificial Sequence <400> 269 agacgtgtgc tcttccgatc tcgattgctc gactcgccgt ccagctcgac cag 53 <210> 270 <211> 54 <212> DNA <213> Artificial Sequence <400> 270 agacgtgtgc tcttccgatc ttcgatagca attctcgccg tccagctcga ccag 54 <210> 271 <211> 55 <212> DNA <213> Artificial Sequence <400> 271 agacgtgtgc tcttccgatc tatcgatagt tgctttcgcc gtccagctcg accag 55 <210> 272 <211> 56 <212> DNA <213> Artificial Sequence <400> 272 agacgtgtgc tcttccgatc tgatcgatcc agttagtcgc cgtccagctc gaccag 56 <210> 273 <211> 57 <212> DNA <213> Artificial Sequence <400> 273 agacgtgtgc tcttccgatc tcgatcgatt tgagccttcg ccgtccagct cgaccag 57 <210> 274 <211> 58 <212> DNA <213> Artificial Sequence <400> 274 agacgtgtgc tcttccgatc tacgatcgat acacgatctc gccgtccagc tcgaccag 58 <210> 275 <211> 59 <212> DNA <213> Artificial Sequence <400> 275 agacgtgtgc tcttccgatc ttacgatcga tggtccagat cgccgtccag ctcgaccag 59 <210> 276 <211> 18 <212> DNA <213> Artificial Sequence <400> 276 ggggaactcg ggcaacct 18 <210> 277 <211> 19 <212> DNA <213> Artificial Sequence <400> 277 gaatcggatc tgccccgtg 19 <210> 278 <211> 19 <212> DNA <213> Artificial Sequence <400> 278 catcgaggcc aagctggaa 19 <210> 279 <211> 20 <212> DNA <213> Artificial Sequence <400> 279 gtagtgagga gggagacccc 20 <210> 280 <211> 20 <212> DNA <213> Artificial Sequence <400> 280 aagcctcctt ccttccccaa 20 <210> 281 <211> 21 <212> DNA <213> Artificial Sequence <400> 281 atcgatacac tccctagccc a 21 <210> 282 <211> 22 <212> DNA <213> Artificial Sequence <400> 282 acaaattcgg tacatcctcg ac 22 <210> 283 <211> 21 <212> DNA <213> Artificial Sequence <400> 283 ttcagccatc tttggaaggt t 21 <210> 284 <211> 20 <212> DNA <213> Artificial Sequence <400> 284 acgccgcatt gaccatctat 20 <210> 285 <211> 20 <212> DNA <213> Artificial Sequence <400> 285 tagccaggag gttctcaaca 20 <210> 286 <211> 21 <212> DNA <213> Artificial Sequence <400> 286 ggcatggact gtggtcatga g 21 <210> 287 <211> 20 <212> DNA <213> Artificial Sequence <400> 287 tgcaccacca actgcttagc 20 <210> 288 <211> 22 <212> DNA <213> Artificial Sequence <400> 288 ccccgtaatg cagaagaaga cc 22 <210> 289 <211> 21 <212> DNA <213> Artificial Sequence <400> 289 gtccttcagc ttcagcctct g 21 <210> 290 <211> 20 <212> DNA <213> Artificial Sequence <400> 290 aacgcaacat gaaggtgctc 20 <210> 291 <211> 20 <212> DNA <213> Artificial Sequence <400> 291 accttgacgg tgactttggg 20 <210> 292 <211> 20 <212> DNA <213> Artificial Sequence <400> 292 cagtgcaatg agggaccagt 20 <210> 293 <211> 24 <212> DNA <213> Artificial Sequence <400> 293 aggaccatag gtacatcttc agag 24 <210> 294 <211> 22 <212> DNA <213> Artificial Sequence <400> 294 cgaacgagtt gtatcacctg ga 22 <210> 295 <211> 20 <212> DNA <213> Artificial Sequence <400> 295 cgatggctgt ccctcaaagt 20 <210> 296 <211> 23 <212> DNA <213> Artificial Sequence <400> 296 agttgctctt ttcactcaag gtc 23 <210> 297 <211> 21 <212> DNA <213> Artificial Sequence <400> 297 ttctctctga gttcagacgc t 21 <210> 298 <211> 52 <212> DNA <213> Artificial Sequence <400> 298 tacacgacgc tcttccgatc ttaagtagag tggcacagga ggaaagagca tc 52 <210> 299 <211> 49 <212> DNA <213> Artificial Sequence <400> 299 agacgtgtgc tcttccgatc ttaagtagag gcaccacctc catgccctc 49 <210> 300 <211> 49 <212> DNA <213> Artificial Sequence <400> 300 tacacgacgc tcttccgatc ttaagtagag catcgcagac tgcggcaag 49 <210> 301 <211> 52 <212> DNA <213> Artificial Sequence <400> 301 agacgtgtgc tcttccgatc ttaagtagag agtccatggg cctgtggaat gt 52 <210> 302 <211> 19 <212> DNA <213> Artificial Sequence <400> 302 gaaaaactgg cccgagagc 19 <210> 303 <211> 20 <212> DNA <213> Artificial Sequence <400> 303 ctgagtctgg gctgagggac 20 <210> 304 <211> 20 <212> DNA <213> Artificial Sequence <400> 304 cgcttccagg tcaacaacac 20 <210> 305 <211> 19 <212> DNA <213> Artificial Sequence <400> 305 ctcgcgtaga tcagcaccg 19 <210> 306 <211> 21 <212> DNA <213> Artificial Sequence <400> 306 cccctctgag tcaggaaaca t 21 <210> 307 <211> 19 <212> DNA <213> Artificial Sequence <400> 307 gaagatgaca ggggccagg 19 <210> 308 <211> 19 <212> DNA <213> Artificial Sequence <400> 308 tagcactggc tggaatgag 19 <210> 309 <211> 21 <212> DNA <213> Artificial Sequence <400> 309 gtttcggagg taacctgtaa g 21 <210> 310 <211> 20 <212> DNA <213> Artificial Sequence <400> 310 tacagcaacc atgagtacaa 20 <210> 311 <211> 19 <212> DNA <213> Artificial Sequence <400> 311 tcaggtgttt cacataggc 19 <210> 312 <211> 19 <212> DNA <213> Artificial Sequence <400> 312 ctgcaaccat gagtgagaa 19 <210> 313 <211> 21 <212> DNA <213> Artificial Sequence <400> 313 cctttgaggt gctttagata g 21 <210> 314 <211> 19 <212> DNA <213> Artificial Sequence <400> 314 gccctgagaa aggagacat 19 <210> 315 <211> 24 <212> DNA <213> Artificial Sequence <400> 315 ctgttctgga ggtactctag gtat 24 <210> 316 <211> 18 <212> DNA <213> Artificial Sequence <400> 316 tttgaagagg gctgagaa 18 <210> 317 <211> 19 <212> DNA <213> Artificial Sequence <400> 317 tgttctggat atttcatgg 19 <210> 318 <211> 20 <212> DNA <213> Artificial Sequence <400> 318 catctgcctc cccatattcc 20 <210> 319 <211> 22 <212> DNA <213> Artificial Sequence <400> 319 tccatcctag ctcatctcca aa 22 <210> 320 <211> 18 <212> DNA <213> Artificial Sequence <400> 320 tgctccagaa ggccagac 18 <210> 321 <211> 25 <212> DNA <213> Artificial Sequence <400> 321 ttcataaata ctactaaggc acagg 25 <210> 322 <211> 21 <212> DNA <213> Artificial Sequence <400> 322 acagatgaag tgctccttcc a 21 <210> 323 <211> 21 <212> DNA <213> Artificial Sequence <400> 323 gtcggagatt cgtagctgga t 21 <210> 324 <211> 21 <212> DNA <213> Artificial Sequence <400> 324 cattgtggcc aaggagatct g 21 <210> 325 <211> 21 <212> DNA <213> Artificial Sequence <400> 325 cttcggagtt tgggtttgct t 21 <210> 326 <211> 20 <212> DNA <213> Artificial Sequence <400> 326 catcacttgc tgctgacacg 20 <210> 327 <211> 18 <212> DNA <213> Artificial Sequence <400> 327 tgtggaatct gccgggag 18 <210> 328 <211> 18 <212> DNA <213> Artificial Sequence <400> 328 ctgactctaa gtggcatt 18 <210> 329 <211> 18 <212> DNA <213> Artificial Sequence <400> 329 tgatggcctt cgattctg 18 <210> 330 <211> 23 <212> DNA <213> Artificial Sequence <400> 330 cggagtcaac ggatttggtc gta 23 <210> 331 <211> 24 <212> DNA <213> Artificial Sequence <400> 331 agccttctcc atggtggtga agac 24 <210> 332 <211> 2820 <212> DNA <213> Artificial Sequence <400> 332 atggccgaga tcaaggagaa aatctgcgac tatctcttca atgtgtctga ctcctctgcc 60 ctgaatttgg ctaaaaatat tggccttacc aaggcccgag atataaatgc tgtgctaatt 120 gacatggaaa ggcaggggga tgtctataga caagggacaa cccctcccat atggcatttg 180 acagacaaga agcgagagag gatgcaaatc aagagaaata cgaacagtgt tcctgaaacc 240 gctccagctg caatccctga gaccaaaaga aacgcagagt tcctcacctg taatataccc 300 acatcaaatg cctcaaataa catggtaacc acagaaaaag tggagaatgg gcaggaacct 360 gtcataaagt tagaaaacag gcaagaggcc agaccagaac cagcaagact gaaaccacct 420 gttcattaca atggcccctc aaaagcaggg tatgttgact ttgaaaatgg ccagtgggcc 480 acagatgaca tcccagatga cttgaatagt atccgcgcag caccaggtga gtttcgagcc 540 atcatggaga tgccctcctt ctacagtcat ggcttgccac ggtgttcacc ctacaagaaa 600 ctgacagagt gccagctgaa gaaccccatc agcgggctgt tagaatatgc ccagttcgct 660 agtcaaacct gtgagttcaa catgatagag cagagtggac caccccatga acctcgattt 720 aaattccagg ttgtcatcaa tggccgagag tttcccccag ctgaagctgg aagcaagaaa 780 gtggccaagc aggatgcagc tatgaaagcc atgacaattc tgctagagga agccaaagcc 840 aaggacagtg gaaaatcaga agaatcatcc cactattcca cagagaaaga atcagagaag 900 actgcagagt cccagacccc caccccttca gccacatcct tcttttctgg gaagagcccc 960 gtcaccacac tgcttgagtg tatgcacaaa ttggggaact cctgcgaatt ccgtctcctg 1020 tccaaagaag gccctgccca tgaacccaag ttccaatact gtgttgcagt gggagcccaa 1080 actttcccca gtgtgagtgc tcccagcaag aaagtggcaa agcagatggc cgcagaggaa 1140 gccatgaagg ccctgcatgg ggaggcgacc aactccatgg cttctgataa ccagcctgaa 1200 ggtatgatct cagagtcact tgataacttg gaatccatga tgcccaacaa ggtcaggaag 1260 attggcgagc tcgtgagata cctgaacacc aaccctgtgg gtggcctttt ggagtacgcc 1320 cgctcccatg gctttgctgc tgaattcaag ttggtcgacc agtccggacc tcctcacgag 1380 cccaagttcg tttaccaagc aaaagttggg ggtcgctggt tcccagccgt ctgcgcacac 1440 agcaagaagc aaggcaagca ggaagcagca gatgcggctc tccgtgtctt gattggggag 1500 aacgagaagg cagaacgcat gggtttcaca gaggtaaccc cagtgacagg ggccagtctc 1560 agaagaacta tgctcctcct ctcaaggtcc ccagaagcac agccaaagac actccctctc 1620 actggcagca ccttccatga ccagatagcc atgctgagcc accggtgctt caacactctg 1680 actaacagct tccagccctc cttgctcggc cgcaagattc tggccgccat cattatgaaa 1740 aaagactctg aggacatggg tgtcgtcgtc agcttgggaa cagggaatcg ctgtgtaaaa 1800 ggagattctc tcagcctaaa aggagaaact gtcaatgact gccatgcaga aataatctcc 1860 cggagaggct tcatcaggtt tctctacagt gagttaatga aatacaactc ccagactgcg 1920 aaggatagta tatttgaacc tgctaaggga ggagaaaagc tccaaataaa aaagactgtg 1980 tcattccatc tgtatatcag cactgctccg tgtggagatg gcgccctctt tgacaagtcc 2040 tgcagcgacc gtgctatgga aagcacagaa tcccgccact accctgtctt cgagaatccc 2100 aaacaaggaa agctccgcac caaggtggag aacggagaag gcacaatccc tgtggaatcc 2160 agtgacattg tgcctacgtg ggatggcatt cggctcgggg agagactccg taccatgtcc 2220 tgtagtgaca aaatcctacg ctggaacgtg ctgggcctgc aaggggcact gttgacccac 2280 ttcctgcagc ccatttatct caaatctgtc acattgggtt accttttcag ccaagggcat 2340 ctgacccgtg ctatttgctg tcgtgtgaca agagatggga gtgcatttga ggatggacta 2400 cgacatccct ttattgtcaa ccaccccaag gttggcagag tcagcatata tgattccaaa 2460 aggcaatccg ggaagactaa ggagacaagc gtcaactggt gtctggctga tggctatgac 2520 ctggagatcc tggacggtac cagaggcact gtggatgggc cacggaatga attgtcccgg 2580 gtctccaaaa agaacatttt tcttctattt aagaagctct gctccttccg ttaccgcagg 2640 gatctactga gactctccta tggtgaggcc aagaaagctg cccgtgacta cgagacggcc 2700 aagaactact tcaaaaaagg cctgaaggat atgggctatg ggaactggat tagcaaaccc 2760 caggaggaaa agaactttta tctctgccca gtagattaca aggatgacga cgataagtag 2820 <210> 333 <211> 3705 <212> DNA <213> Artificial Sequence <400> 333 atgaatccgc ggcaggggta ttccctcagc ggatactaca cccatccatt tcaaggctat 60 gagcacagac agctcagata ccagcagcct gggccaggat cttcccccag tagtttcctg 120 cttaagcaaa tagaatttct caaggggcag ctcccagaag caccggtgat tggaaagcag 180 acaccgtcac tgccaccttc cctcccagga ctccggccaa ggtttccagt actacttgcc 240 tccagtacca gaggcaggca agtggacatc aggggtgtcc ccaggggcgt gcatctcgga 300 agtcaggggc tccagagagg gttccagcat ccttcaccac gtggcaggag tctgccacag 360 agaggtgttg attgcctttc ctcacatttc caggaactga gtatctacca agatcaggaa 420 caaaggatct taaagttcct ggaagagctt ggggaaggga aggccaccac agcacatgat 480 ctgtctggga aacttgggac tccgaagaaa gaaatcaatc gagttttata ctccctggca 540 aagaagggca agctacagaa agaggcagga acaccccctt tgtggaaaat cgcggtctcc 600 actcaggctt ggaaccagca cagcggagtg gtaagaccag acggtcatag ccaaggagcc 660 ccaaactcag acccgagttt ggaaccggaa gacagaaact ccacatctgt ctcagaagat 720 cttcttgagc cttttattgc agtctcagct caggcttgga accagcacag cggagtggta 780 agaccagaca gtcatagcca aggatcccca aactcagacc caggtttgga acctgaagac 840 agcaactcca catctgcctt ggaagatcct cttgagtttt tagacatggc cgagatcaag 900 gagaaaatct gcgactatct cttcaatgtg tctgactcct ctgccctgaa tttggctaaa 960 aatattggcc ttaccaaggc ccgagatata aatgctgtgc taattgacat ggaaaggcag 1020 ggggatgtct atagacaagg gacaacccct cccatatggc atttgacaga caagaagcga 1080 gagaggatgc aaatcaagag aaatacgaac agtgttcctg aaaccgctcc agctgcaatc 1140 cctgagacca aaagaaacgc agagttcctc acctgtaata tacccacatc aaatgcctca 1200 aataacatgg taaccacaga aaaagtggag aatgggcagg aacctgtcat aaagttagaa 1260 aacaggcaag aggccagacc agaaccagca agactgaaac cacctgttca ttacaatggc 1320 ccctcaaaag cagggtatgt tgactttgaa aatggccagt gggccacaga tgacatccca 1380 gatgacttga atagtatccg cgcagcacca ggtgagtttc gagccatcat ggagatgccc 1440 tccttctaca gtcatggctt gccacggtgt tcaccctaca agaaactgac agagtgccag 1500 ctgaagaacc ccatcagcgg gctgttagaa tatgcccagt tcgctagtca aacctgtgag 1560 ttcaacatga tagagcagag tggaccaccc catgaacctc gatttaaatt ccaggttgtc 1620 atcaatggcc gagagtttcc cccagctgaa gctggaagca agaaagtggc caagcaggat 1680 gcagctatga aagccatgac aattctgcta gaggaagcca aagccaagga cagtggaaaa 1740 tcagaagaat catcccacta ttccacagag aaagaatcag agaagactgc agagtcccag 1800 acccccaccc cttcagccac atccttcttt tctgggaaga gccccgtcac cacactgctt 1860 gagtgtatgc acaaattggg gaactcctgc gaattccgtc tcctgtccaa agaaggccct 1920 gcccatgaac ccaagttcca atactgtgtt gcagtgggag cccaaacttt ccccagtgtg 1980 agtgctccca gcaagaaagt ggcaaagcag atggccgcag aggaagccat gaaggccctg 2040 catggggagg cgaccaactc catggcttct gataaccagc ctgaaggtat gatctcagag 2100 tcacttgata acttggaatc catgatgccc aacaaggtca ggaagattgg cgagctcgtg 2160 agatacctga acaccaaccc tgtgggtggc cttttggagt acgcccgctc ccatggcttt 2220 gctgctgaat tcaagttggt cgaccagtcc ggacctcctc acgagcccaa gttcgtttac 2280 caagcaaaag ttgggggtcg ctggttccca gccgtctgcg cacacagcaa gaagcaaggc 2340 aagcaggaag cagcagatgc ggctctccgt gtcttgattg gggagaacga gaaggcagaa 2400 cgcatgggtt tcacagaggt aaccccagtg acaggggcca gtctcagaag aactatgctc 2460 ctcctctcaa ggtccccaga agcacagcca aagacactcc ctctcactgg cagcaccttc 2520 catgaccaga tagccatgct gagccaccgg tgcttcaaca ctctgactaa cagcttccag 2580 ccctccttgc tcggccgcaa gattctggcc gccatcatta tgaaaaaaga ctctgaggac 2640 atgggtgtcg tcgtcagctt gggaacaggg aatcgctgtg taaaaggaga ttctctcagc 2700 ctaaaaggag aaactgtcaa tgactgccat gcagaaataa tctcccggag aggcttcatc 2760 aggtttctct acagtgagtt aatgaaatac aactcccaga ctgcgaagga tagtatattt 2820 gaacctgcta agggaggaga aaagctccaa ataaaaaaga ctgtgtcatt ccatctgtat 2880 atcagcactg ctccgtgtgg agatggcgcc ctctttgaca agtcctgcag cgaccgtgct 2940 atggaaagca cagaatcccg ccactaccct gtcttcgaga atcccaaaca aggaaagctc 3000 cgcaccaagg tggagaacgg agaaggcaca atccctgtgg aatccagtga cattgtgcct 3060 acgtgggatg gcattcggct cggggagaga ctccgtacca tgtcctgtag tgacaaaatc 3120 ctacgctgga acgtgctggg cctgcaaggg gcactgttga cccacttcct gcagcccatt 3180 tatctcaaat ctgtcacatt gggttacctt ttcagccaag ggcatctgac ccgtgctatt 3240 tgctgtcgtg tgacaagaga tgggagtgca tttgaggatg gactacgaca tccctttatt 3300 gtcaaccacc ccaaggttgg cagagtcagc atatatgatt ccaaaaggca atccgggaag 3360 actaaggaga caagcgtcaa ctggtgtctg gctgatggct atgacctgga gatcctggac 3420 ggtaccagag gcactgtgga tgggccacgg aatgaattgt cccgggtctc caaaaagaac 3480 atttttcttc tatttaagaa gctctgctcc ttccgttacc gcagggatct actgagactc 3540 tcctatggtg aggccaagaa agctgcccgt gactacgaga cggccaagaa ctacttcaaa 3600 aaaggcctga aggatatggg ctatgggaac tggattagca aaccccagga ggaaaagaac 3660 ttttatctct gcccagtaga ttacaaggat gacgacgata agtag 3705 <210> 334 <211> 2130 <212> DNA <213> Artificial Sequence <400> 334 atggatatag aagatgaaga aaacatgagt tccagcagca ctgatgtgaa ggaaaaccgc 60 aatctggaca acgtgtcccc caaggatggc agcacacctg ggcctggcga gggctctcag 120 ctctccaatg ggggtggtgg tggccccggc agaaagcggc ccctggagga gggcagcaat 180 ggccactcca agtaccgcct gaagaaaagg aggaaaacac cagggcccgt cctccccaag 240 aacgccctga tgcagctgaa tgagatcaag cctggtttgc agtacacact cctgtcccag 300 actgggcccg tgcacgcgcc tttgtttgtc atgtctgtgg aggtgaatgg ccaggttttt 360 gagggctctg gtcccacaaa gaaaaaggca aaactccatg ctgctgagaa ggccttgagg 420 tctttcgttc agtttcctaa tgcctctgag gcccacctgg ccatggggag gaccctgtct 480 gtcaacacgg acttcacatc tgaccaggcc gacttccctg acacgctctt caatggtttt 540 gaaactcctg acaaggcgga gcctcccttt tacgtgggct ccaatgggga tgactccttc 600 agttccagcg gggacctcag cttgtctgct tccccggtgc ctgccagcct agcccagcct 660 cctctccctg ccttaccacc attcccaccc ccgagtggga agaatcccgt gatgatcttg 720 aacgaactgc gcccaggact caagtatgac ttcctctccg agagcgggga gagccatgcc 780 aagagcttcg tcatgtctgt ggtcgtggat ggtcagttct ttgaaggctc ggggagaaac 840 aagaagcttg ccaaggcccg ggctgcgcag tctgccctgg ccgccatttt taacttgcac 900 ttggatcaga cgccatctcg ccagcctatt cccagtgagg gtcttcagct gcatttaccg 960 caggttttag ctgacgctgt ctcacgcctg gtcctgggta agtttggtga cctgaccgac 1020 aacttctcct cccctcacgc tcgcagaaaa gtgctggctg gagtcgtcat gacaacaggc 1080 acagatgtta aagatgccaa ggtgataagt gtttctacag gaacaaaatg tattaatggt 1140 gaatacatga gtgatcgtgg ccttgcatta aatgactgcc atgcagaaat aatatctcgg 1200 agatccttgc tcagatttct ttatacacaa cttgagcttt acttaaataa caaagatgat 1260 caaaaaagat ccatctttca gaaatcagag cgaggggggt ttaggctgaa ggagaatgtc 1320 cagtttcatc tgtacatcag cacctctccc tgtggagatg ccagaatctt ctcaccacat 1380 gagccaatcc tggaagaacc agcagataga cacccaaatc gtaaagcaag aggacagcta 1440 cggaccaaaa tagagtctgg tgaggggacg attccagtgc gctccaatgc gagcatccaa 1500 acgtgggacg gggtgctgca aggggagcgg ctgctcacca tgtcctgcag tgacaagatt 1560 gcacgctgga acgtggtggg catccaggga tccctgctca gcattttcgt ggagcccatt 1620 tacttctcga gcatcatcct gggcagcctt taccacgggg accacctttc cagggccatg 1680 taccagcgga tctccaacat agaggacctg ccacctctct acaccctcaa caagcctttg 1740 ctcagtggca tcagcaatgc agaagcacgg cagccaggga aggcccccaa cttcagtgtc 1800 aactggacgg taggcgactc cgctattgag gtcatcaacg ccacgactgg gaaggatgag 1860 ctgggccgcg cgtcccgcct gtgtaagcac gcgttgtact gtcgctggat gcgtgtgcac 1920 ggcaaggttc cctcccactt actacgctcc aagattacca aacccaacgt gtaccatgag 1980 tccaagctgg cggcaaagga gtaccaggcc gccaaggcgc gtctgttcac agccttcatc 2040 aaggcggggc tgggggcctg ggtggagaag cccaccgagc aggaccagtt ctcactcacg 2100 cccgattaca aggatgacga cgataagtag 2130 <210> 335 <211> 4401 <212> DNA <213> Artificial Sequence <400> 335 atgatgagct ttgtgcaaaa ggggagctgg ctacttctcg ctctgcttca tcccactatt 60 attttggcac aacaggaagc tgttgaagga ggatgttccc atcttggtca gtcctatgcg 120 gatagagatg tctggaagcc agaaccatgc caaatatgtg tctgtgactc aggatccgtt 180 ctctgcgatg acataatatg tgacgatcaa gaattagact gccccaaccc agaaattcca 240 tttggagaat gttgtgcagt ttgcccacag cctccaactg ctcctactcg ccctcctaat 300 ggtcaaggac ctcaaggccc caagggagat ccaggccctc ctggtattcc tgggagaaat 360 ggtgaccctg gtattccagg acaaccaggg tcccctggtt ctcctggccc ccctggaatc 420 tgtgaatcat gccctactgg tcctcagaac tattctcccc agtatgattc atatgatgtc 480 aagtctggag tagcagtagg aggactcgca ggctatcctg gaccagctgg ccccccaggc 540 cctcccggtc cccctggtac atctggtcat cctggttccc ctggatctcc aggataccaa 600 ggaccccctg gtgaacctgg gcaagctggt ccttcaggcc ctccaggacc tcctggtgct 660 ataggtccat ctggtcctgc tggaaaagat ggagaatcag gtagacccgg acgacctgga 720 gagcgaggat tgcctggacc tccaggtatc aaaggtccag ctgggatacc tggattccct 780 ggtatgaaag gacacagagg cttcgatgga cgaaatggag aaaagggtga aacaggtgct 840 cctggattaa agggtgaaaa tggtcttcca ggcgaaaatg gagctcctgg acccatgggt 900 ccaagagggg ctcctggtga gcgaggacgg ccaggacttc ctggggctgc aggtgctcgg 960 ggtaatgacg gtgctcgagg cagtgatggt caaccaggcc ctcctggtcc tcctggaact 1020 gccggattcc ctggatcccc tggtgctaag ggtgaagttg gacctgcagg gtctcctggt 1080 tcaaatggtg cccctggaca aagaggagaa cctggacctc agggacacgc tggtgctcaa 1140 ggtcctcctg gccctcctgg gattaatggt agtcctggtg gtaaaggcga aatgggtccc 1200 gctggcattc ctggagctcc tggactgatg ggagcccggg gtcctccagg accagccggt 1260 gctaatggtg ctcctggact gcgaggtggt gcaggtgagc ctggtaagaa tggtgccaaa 1320 ggagagcccg gaccacgtgg tgaacgcggt gaggctggta ttccaggtgt tccaggagct 1380 aaaggcgaag atggcaagga tggatcacct ggagaacctg gtgcaaatgg gcttccagga 1440 gctgcaggag aaaggggtgc ccctgggttc cgaggacctg ctggaccaaa tggcatccca 1500 ggagaaaagg gtcctgctgg agagcgtggt gctccaggcc ctgcagggcc cagaggagct 1560 gctggagaac ctggcagaga tggcgtccct ggaggtccag gaatgagggg catgcccgga 1620 agtccaggag gaccaggaag tgatgggaaa ccagggcctc ccggaagtca aggagaaagt 1680 ggtcgaccag gtcctcctgg gccatctggt ccccgaggtc agcctggtgt catgggcttc 1740 cccggtccta aaggaaatga tggtgctcct ggtaagaatg gagaacgagg tggccctgga 1800 ggacctggcc ctcagggtcc tcctggaaag aatggtgaaa ctggacctca gggaccccca 1860 gggcctactg ggcctggtgg tgacaaagga gacacaggac cccctggtcc acaaggatta 1920 caaggcttgc ctggtacagg tggtcctcca ggagaaaatg gaaaacctgg ggaaccaggt 1980 ccaaagggtg atgccggtgc acctggagct ccaggaggca agggtgatgc tggtgcccct 2040 ggtgaacgtg gacctcctgg attggcaggg gccccaggac ttagaggtgg agctggtccc 2100 cctggtcccg aaggaggaaa gggtgctgct ggtcctcctg ggccacctgg tgctgctggt 2160 actcctggtc tgcaaggaat gcctggagaa agaggaggtc ttggaagtcc tggtccaaag 2220 ggtgacaagg gtgaaccagg cggtccaggt gctgatggtg tcccagggaa agatggccca 2280 aggggtccta ctggtcctat tggtcctcct ggcccagctg gccagcctgg agataagggt 2340 gaaggtggtg cccccggact tccaggtata gctggacctc gtggtagccc tggtgagaga 2400 ggtgaaactg gccctccagg acctgctggt ttccctggtg ctcctggaca gaatggtgaa 2460 cctggtggta aaggagaaag aggggctccg ggtgagaaag gtgaaggagg ccctcctgga 2520 gttgcaggac cccctggagg ttctggacct gctggtcctc ctggtcccca aggtgtcaaa 2580 ggtgaacgtg gcagtcctgg tggacctggt gctgctggct tccctggtgc tcgtggtctt 2640 cctggtcctc ctggtagtaa tggtaaccca ggacccccag gtcccagcgg ttctccaggc 2700 aaggatgggc ccccaggtcc tgcgggtaac actggtgctc ctggcagccc tggagtgtct 2760 ggaccaaaag gtgatgctgg ccaaccagga gagaagggat cgcctggtgc ccagggccca 2820 ccaggagctc caggcccact tgggattgct gggatcactg gagcacgggg tcttgcagga 2880 ccaccaggca tgccaggtcc taggggaagc cctggccctc agggtgtcaa gggtgaaagt 2940 gggaaaccag gagctaacgg tctcagtgga gaacgtggtc cccctggacc ccagggtctt 3000 cctggtctgg ctggtacagc tggtgaacct ggaagagatg gaaaccctgg atcagatggt 3060 cttccaggcc gagatggatc tcctggtggc aagggtgatc gtggtgaaaa tggctctcct 3120 ggtgcccctg gcgctcctgg tcatccaggc ccacctggtc ctgtcggtcc agctggaaag 3180 agtggtgaca gaggagaaag tggccctgct ggccctgctg gtgctcccgg tcctgctggt 3240 tcccgaggtg ctcctggtcc tcaaggccca cgtggtgaca aaggtgaaac aggtgaacgt 3300 ggagctgctg gcatcaaagg acatcgagga ttccctggta atccaggtgc cccaggttct 3360 ccaggccctg ctggtcagca gggtgcaatc ggcagtccag gacctgcagg ccccagagga 3420 cctgttggac ccagtggacc tcctggcaaa gatggaacca gtggacatcc aggtcccatt 3480 ggaccaccag ggcctcgagg taacagaggt gaaagaggat ctgagggctc cccaggccac 3540 ccagggcaac caggccctcc tggacctcct ggtgcccctg gtccttgctg tggtggtgtt 3600 ggagccgctg ccattgctgg gattggaggt gaaaaagctg gcggttttgc cccgtattat 3660 ggagatgaac caatggattt caaaatcaac accgatgaga ttatgacttc actcaagtct 3720 gttaatggac aaatagaaag cctcattagt cctgatggtt ctcgtaaaaa ccccgctaga 3780 aactgcagag acctgaaatt ctgccatcct gaactcaaga gtggagaata ctgggttgac 3840 cctaaccaag gatgcaaatt ggatgctatc aaggtattct gtaatatgga aactggggaa 3900 acatgcataa gtgccaatcc tttgaatgtt ccacggaaac actggtggac agattctagt 3960 gctgagaaga aacacgtttg gtttggagag tccatggatg gtggttttca gtttagctac 4020 ggcaatcctg aacttcctga agatgtcctt gatgtgcagc tggcattcct tcgacttctc 4080 tccagccgag cttcccagaa catcacatat cactgcaaaa atagcattgc atacatggat 4140 caggccagtg gaaatgtaaa gaaggccctg aagctgatgg ggtcaaatga aggtgaattc 4200 aaggctgaag gaaatagcaa attcacctac acagttctgg aggatggttg cacgaaacac 4260 actggggaat ggagcaaaac agtctttgaa tatcgaacac gcaaggctgt gagactacct 4320 attgtagata ttgcacccta tgacattggt ggtcctgatc aagaatttgg tgtggacgtt 4380 ggccctgttt gctttttata a 4401 <210> 336 <211> 3117 <212> DNA <213> Artificial Sequence <400> 336 atgacttcct cgctgcagcg gccctggcgg gtgccctggc taccatggac catcctgctg 60 gtcagcgctg cggctgcttc gcagaatcaa gaacggctat gtgcgtttaa agatccgtat 120 cagcaagacc ttgggatagg tgagagtaga atctctcatg aaaatgggac aatattatgc 180 tcgaaaggta gcacctgcta tggcctttgg gagaaatcaa aaggggacat aaatcttgta 240 aaacaaggat gttggtctca cattggagat ccccaagagt gtcactatga agaatgtgta 300 gtaactacca ctcctccctc aattcagaat ggaacatacc gtttctgctg ttgtagcaca 360 gatttatgta atgtcaactt tactgagaat tttccacctc ctgacacaac accactcagt 420 ccacctcatt catttaaccg agatgagaca ataatcattg ctttggcatc agtctctgta 480 ttagctgttt tgatagttgc cttatgcttt ggatacagaa tgttgacagg agaccgtaaa 540 caaggtcttc acagtatgaa catgatggag gcagcagcat ccgaaccctc tcttgatcta 600 gataatctga aactgttgga gctgattggc cgaggtcgat atggagcagt atataaaggc 660 tccttggatg agcgtccagt tgctgtaaaa gtgttttcct ttgcaaaccg tcagaatttt 720 atcaacgaaa agaacattta cagagtgcct ttgatggaac atgacaacat tgcccgcttt 780 atagttggag atgagagagt cactgcagat ggacgcatgg aatatttgct tgtgatggag 840 tactatccca atggatcttt atgcaagtat ttaagtctcc acacaagtga ctgggtaagc 900 tcttgccgtc ttgctcattc tgttactaga ggactggctt atcttcacac agaattacca 960 cgaggagatc attataaacc tgcaatttcc catcgagatt taaacagcag aaatgtccta 1020 gtgaaaaatg atggaacctg tgttattagt gactttggac tgtccatgag gctgactgga 1080 aatagactgg tgcgcccagg ggaggaagat aatgcagcca taagcgaggt tggcactatc 1140 agatatatgg caccagaagt gctagaagga gctgtgaact tgagggactg tgaatcagct 1200 ttgaaacaag tagacatgta tgctcttgga ctaatctatt gggagatatt tatgagatgt 1260 acagacctct tcccagggga atccgtacca gagtaccaga tggcttttca gacagaggtt 1320 ggaaaccatc ccacttttga ggatatgcag gttctcgtgt ctagggaaaa acagagaccc 1380 aagttcccag aagcctggaa agaaaatagc ctggcagtga ggtcactcaa ggagacaatc 1440 gaagactgtt gggaccagga tgcagaggct cggcttactg cacagtgtgc tgaggaaagg 1500 atggctgaac ttatgatgat ttgggaaaga aacaaatctg tgagcccaac agtcaatcca 1560 atgtctactg ctatgcagaa tgaacgcaac ctgtcacata ataggcgtgt gccaaaaatt 1620 ggtccttatc cagattattc ttcctcctca tacattgaag actctatcca tcatactgac 1680 agcatcgtga agaatatttc ctctgagcat tctatgtcca gcacaccttt gactataggg 1740 gaaaaaaacc gaaattcaat taactatgaa cgacagcaag cacaagctcg aatccccagc 1800 cctgaaacaa gtgtcaccag cctctccacc aacacaacaa ccacaaacac cacaggactc 1860 acgccaagta ctggcatgac tactatatct gagatgccat acccagatga aacaaatctg 1920 cataccacaa atgttgcaca gtcaattggg ccaacccctg tctgcttaca gctgacagaa 1980 gaagacttgg aaaccaacaa gctagaccca aaagaagttg ataagaacct caaggaaagc 2040 tctgatgaga atctcatgga gcactctctt aaacagttca gtggcccaga cccactgagc 2100 agtactagtt ctagcttgct ttacccactc ataaaacttg cagtagaagc aactggacag 2160 caggacttca cacagactgc aaatggccaa gcatgtttga ttcctgatgt tctgcctact 2220 cagatctatc ctctccccaa gcagcagaac cttcccaaga gacctactag tttgcctttg 2280 aacaccaaaa attcaacaaa agagccccgg ctaaaatttg gcagcaagca caaatcaaac 2340 ttgaaacaag tcgaaactgg agttgccaag atgaatacaa tcaatgcagc agaacctcat 2400 gtggtgacag tcaccatgaa tggtgtggca ggtagaaacc acagtgttaa ctcccatgct 2460 gccacaaccc aatatgccaa tgggacagta ctatctggcc aaacaaccaa catagtgaca 2520 catagggccc aagaaatgtt gcagaatcag tttattggtg aggacacccg gctgaatatt 2580 aattccagtc ctgatgagca tgagccttta ctgagacgag agcaacaagc tggccatgat 2640 gaaggtgttc tggatcgtct tgtggacagg agggaacggc cactagaagg tggccgaact 2700 aattccaata acaacaacag caatccatgt tcagaacaag atgttcttgc acagggtgtt 2760 ccaagcacag cagcagatcc tgggccatca aagcccagaa gagcacagag gcctaattct 2820 ctggatcttt cagccacaaa tgtcctggat ggcagcagta tacagatagg tgagtcaaca 2880 caagatggca aatcaggatc aggtgaaaag atcaagaaac gtgtgaaaac tccctattct 2940 cttaagcggt ggcgcccctc cacctgggtc atctccactg aatcgctgga ctgtgaagtc 3000 aacaataatg gcagtaacag ggcagttcat tccaaatcca gcactgctgt ttaccttgca 3060 gaaggaggca ctgctacaac catggtgtct aaagatatag gaatgaactg tctgtga 3117 <210> 337 <211> 3590 <212> DNA <213> Artificial Sequence <400> 337 atgcctacag ctgagagtga agcaaaagta aaaaccaaag ttcgctttga agaattgctt 60 aagacccaca gtgatctaat gcgtgaaaag aaaaaactga agaaaaaact tgtcaggtct 120 gaagaaaaca tctcacctga cactattaga agcaatcttc actatatgaa agaaactaca 180 agtgatgatc ccgacactat tagaagcaat cttccccata ttaaagaaac tacaagtgat 240 gatgtaagtg ctgctaacac taacaacctg aagaagagca cgagagtcac taaaaacaaa 300 ttgaggaaca cacagttagc aactgaaaat cctaatggtg atgctagtgt agaggaagac 360 aaacaaggaa agccaaataa aaaggtgata aagacggtgc cccagttgac tacacaagac 420 ctgaaaccgg aaactcctga gaataaggtt gattctacac accagaaaac acatacaaag 480 ccacagccag gcgttgatca tcagaaaagt gagaaggcaa atgagggaag agaagagact 540 gatttagaag aggatgaaga attgatgcaa gcatatcagt gccatgtaac tgaagaaatg 600 gcaaaggaga ttaagaggaa aataagaaag aaactgaaag aacagttgac ttactttccc 660 tcagatactt tattccatga tgacaaacta agcagtgaaa aaaggaaaaa gaaaaaggaa 720 gttccagtct tctctaaagc tgaaacaagt acattgacca tctctggtga cacagttgaa 780 ggtgaacaaa agaaagaatc ttcagttaga tcagtttctt cagattctca tcaagatgat 840 gaaataagct caatggaaca aagcacagaa gacagcatgc aagatgatac aaaacctaaa 900 ccaaaaaaaa caaaaaagaa gactaaagca gttgcagata ataatgaaga tgttgatggt 960 gatggtgttc atgaaataac aagccgagat agcccggttt atcccaaatg tttgcttgat 1020 gatgaccttg tcttgggagt ttacattcac cgaactgata gacttaagtc agattttatg 1080 atttctcacc caatggtaaa aattcatgtg gttgatgagc atactggtca atatgtcaag 1140 aaagatgata gtggacggcc tgtttcatct tactatgaaa aagagaatgt ggattatatt 1200 cttcctatta tgacccagcc atatgatttt aaacagttaa aatcaagact tccagagtgg 1260 gaagaacaaa ttgtatttaa tgaaaatttt ccctatttgc ttcgaggctc tgatgagagt 1320 cctaaagtca tcctgttctt tgagattctt gatttcttaa gcgtggatga aattaagaat 1380 aattctgagg ttcaaaacca agaatgtggc tttcggaaaa ttgcctgggc atttcttaag 1440 cttctgggag ccaatggaaa tgcaaacatc aactcaaaac ttcgcttgca gctatattac 1500 ccacctacta agcctcgatc cccattaagt gttgttgagg catttgaatg gtggtcaaaa 1560 tgtccaagaa atcattaccc atcaacactg tacgtaactg taagaggact gaaagttcca 1620 gactgtataa agccatctta ccgctctatg atggctcttc aggaggaaaa aggtaaacca 1680 gtgcattgtg aacgtcacca tgagtcaagc tcagtagaca cagaacctgg attagaagag 1740 tcaaaggaag taataaagtg gaaacgactc cctgggcagg cttgccgtat cccaaacaaa 1800 cacctcttct cactaaatgc aggagaacga ggatgttttt gtcttgattt ctcccacaat 1860 ggaagaatat tagcagcagc ttgtgccagc cgggatggat atccaattat tttatatgaa 1920 attccttctg gacgtttcat gagagaattg tgtggccacc tcaatatcat ttatgatctt 1980 tcctggtcaa aagatgatca ctacatcctt acttcatcat ctgatggcac tgccaggata 2040 tggaaaaatg aaataaacaa tacaaatact ttcagagttt tacctcatcc ttcttttgtt 2100 tacacggcta aattccatcc agctgtaaga gagctagtag ttacaggatg ctatgattcc 2160 atgatacgga tatggaaagt tgagatgaga gaagattctg ccatattggt ccgacagttt 2220 gacgttcaca aaagttttat caactcactt tgttttgata ctgaaggtca tcatatgtat 2280 tcaggagatt gtacaggggt gattgttgtt tggaatacct atgtcaagat taatgatttg 2340 gaacattcag tgcaccactg gactataaat aaggaaatta aagaaactga gtttaaggga 2400 attccaataa gttatttgga gattcatccc aatggaaaac gtttgttaat ccataccaaa 2460 gacagtactt tgagaattat ggatctccgg atattagtag caaggaagtt tgtaggagca 2520 gcaaattatc gggagaagat tcatagtact ttgactccat gtgggacttt tctgtttgct 2580 ggaagtgagg atggtatagt gtatgtttgg aacccagaaa caggagaaca agtagccatg 2640 tattctgact tgccattcaa gtcacccatt cgagacattt cttatcatcc atttgaaaat 2700 atggttgcat tctgtgcatt tgggcaaaat gagccaattc ttctgtatat ttacgatttc 2760 catgttgccc agcaggaggc tgaaatgttc aaacgctaca atggaacatt tccattacct 2820 ggaatacacc aaagtcaaga tgccctatgt acctgtccaa aactacccca tcaaggctct 2880 tttcagattg atgaatttgt ccacactgaa agttcttcaa cgaagatgca gctagtaaaa 2940 cagaggcttg aaactgtcac agaggtgata cgttcctgtg ctgcaaaagt caacaaaaat 3000 ctctcattta cttcaccacc agcagtttcc tcacaacagt ctaagttaaa gcagtcaaac 3060 atgctgaccg ctcaagagat tctacatcag tttggtttca ctcagaccgg gattatcagc 3120 atagaaagaa agccttgtaa ccatcaggta gatacagcac caacggtagt ggctctttat 3180 gactacacag cgaatcgatc agatgaacta accatccatc gcggagacat tatccgagtg 3240 tttttcaaag ataatgaaga ctggtggtat ggcagcatag gaaagggaca ggaaggttat 3300 tttccagcta atcatgtggc tagtgaaaca ctgtatcaag aactgcctcc tgagataaag 3360 gagcgatccc ctcctttaag ccctgaggaa aaaactaaaa tagaaaaatc tccagctcct 3420 caaaagcaat caatcaataa gaacaagtcc caggacttca gactaggctc agaatctatg 3480 acacattctg aaatgagaaa agaacagagc catgaggacc aaggacacat aatggataca 3540 cggatgagga agaacaagca agcaggcaga aaagtcactc taatagagta 3590 <210> 338 <211> 1677 <212> DNA <213> Artificial Sequence <400> 338 atggctcaag attcagtaga tctttcttgt gattatcagt tttggatgca gaagctttct 60 gtatgggatc aggcttccac tttggaaacc cagcaagaca cctgtcttca cgtggctcag 120 ttccaggagt tcctaaggaa gatgtatgaa gccttgaaag agatggattc taatacagtc 180 attgaaagat tccccacaat tggtcaactg ttggcaaaag cttgttggaa tccttttatt 240 ttagcatatg atgaaagcca aaaaattcta atatggtgct tatgttgtct aattaacaaa 300 gaaccacaga attctggaca atcaaaactt aactcctgga tacagggtgt attatctcat 360 atactttcag cactcagatt tgataaagaa gttgctcttt tcactcaagg tcttgggtat 420 gcacctatag attactatcc tggtttgctt aaaaatatgg ttttatcatt agcgtctgaa 480 ctcagagaga atcatcttaa tggatttaac actcaaaggc gaatggctcc cgagcgagtg 540 gcgtccctgt cacgagtttg tgtcccactt attaccctga cagatgttga ccccctggtg 600 gaggctctcc tcatctgtca tggacgtgaa cctcaggaaa tcctccagcc agagttcttt 660 gaggctgtaa acgaggccat tttgctgaag aagatttctc tccccatgtc agctgtagtc 720 tgcctctggc ttcggcacct tcccagcctt gaaaaagcaa tgctgcatct ttttgaaaag 780 ctaatctcca gtgagagaaa ttgtctgaga aggatcgaat gctttataaa agattcatcg 840 ctgcctcaag cagcctgcca ccctgccata ttccgggttg ttgatgagat gttcaggtgt 900 gcactcctgg aaaccgatgg ggccctggaa atcatagcca ctattcaggt gtttacgcag 960 tgctttgtag aagctctgga gaaagcaagc aagcagctgc ggtttgcact caagacctac 1020 tttccttaca cttctccatc tcttgccatg gtgctgctgc aagaccctca agatatccct 1080 cggggacact ggctccagac actgaagcat atttctgaac tgctcagaga agcagttgaa 1140 gaccagactc atgggtcctg cggaggtccc tttgagagct ggttcctgtt cattcacttc 1200 ggaggatggg ctgagatggt ggcagagcaa ttactgatgt cggcagccga accccccacg 1260 gccctgctgt ggctcttggc cttctactac ggcccccgtg atgggaggca gcagagagca 1320 cagactatgg tccaggtgaa ggccgtgctg ggccacctcc tggcaatgtc cagaagcagc 1380 agcctctcag cccaggacct gcagacggta gcaggacagg gcacagacac agacctcaga 1440 gctcctgcac aacagctgat caggcacctt ctcctcaact tcctgctctg ggctcctgga 1500 ggccacacga tcgcctggga tgtcatcacc ctgatggctc acactgctga gataactcac 1560 gagatcattg gctttcttga ccagaccttg tacagatgga atcgtcttgg cattgaaagc 1620 cctagatcag aaaaactggc ccgagagctc cttaaagagc tgcgaactca agtctag 1677 <210> 339 <211> 3825 <212> DNA <213> Artificial Sequence <400> 339 atgcctgagc cggggaagaa gccagtctca gcttttagca agaagccacg gtcagtggaa 60 gtggccgcag gcagccctgc cgtgttcgag gccgagacag agcgggcagg agtgaaggtg 120 cgctggcagc gcggaggcag tgacatcagc gccagcaaca agtacggcct ggccacagag 180 ggcacacggc atacgctgac agtgcgggaa gtgggccctg ccgaccaggg atcttacgca 240 gtcattgctg gctcctccaa ggtcaagttc gacctcaagg tcatagaggc agagaaggca 300 gagcccatgc tggcccctgc ccctgcccct gctgaggcca ctggagcccc tggagaagcc 360 ccggccccag ccgctgagct gggagaaagt gccccaagtc ccaaagggtc aagctcagca 420 gctctcaatg gtcctacccc tggagccccc gatgacccca ttggcctctt cgtgatgcgg 480 ccacaggatg gcgaggtgac cgtgggtggc agcatcacct tctcagcccg cgtggccggc 540 gccagcctcc tgaagccgcc tgtggtcaag tggttcaagg gcaaatgggt ggacctgagc 600 agcaaggtgg gccagcacct gcagctgcac gacagctacg accgcgccag caaggtctat 660 ctgttcgagc tgcacatcac cgatgcccag cctgccttca ctggcagcta ccgctgtgag 720 gtgtccacca aggacaaatt tgactgctcc aacttcaatc tcactgtcca cgaggccatg 780 ggcaccggag acctggacct cctatcagcc ttccgccgca cgagcctggc tggaggtggt 840 cggcggatca gtgatagcca tgaggacact gggattctgg acttcagctc actgctgaaa 900 aagagagaca gtttccggac cccgagggac tcgaagctgg aggcaccagc agaggaggac 960 gtgtgggaga tcctacggca ggcaccccca tctgagtacg agcgcatcgc cttccagtac 1020 ggcgtcactg acctgcgcgg catgctaaag aggctcaagg gcatgaggcg cgatgagaag 1080 aagagcacag cctttcagaa gaagctggag ccggcctacc aggtgagcaa aggccacaag 1140 atccggctga ccgtggaact ggctgaccat gacgctgagg tcaaatggct caagaatggc 1200 caggagatcc agatgagcgg cagcaagtac atctttgagt ccatcggtgc caagcgtacc 1260 ctgaccatca gccagtgctc attggcggac gacgcagcct accagtgcgt ggtgggtggc 1320 gagaagtgta gcacggagct ctttgtgaaa gagccccctg tgctcatcac gcgccccttg 1380 gaggaccagc tggtgatggt ggggcagcgg gtggagtttg agtgtgaagt atcggaggag 1440 ggggcgcaag tcaaatggct gaaggacggg gtggagctga cccgggagga gaccttcaaa 1500 taccggttca agaaggacgg gcagagacac cacctgatca tcaacgaggc catgctggag 1560 gacgcggggc actatgcact gtgcactagc gggggccagg cgctggctga gctcattgtg 1620 caggaaaaga agctggaggt gtaccagagc atcgcagacc tgatggtggg cgcaaaggac 1680 caggcggtgt tcaaatgtga ggtctcagat gagaatgttc ggggtgtgtg gctgaagaat 1740 gggaaggagc tggtgcccga cagccgcata aaggtgtccc acatcgggcg ggtccacaaa 1800 ctgaccattg acgacgtcac acctgccgac gaggctgact acagctttgt gcccgagggc 1860 ttcgcctgca acctgtcagc caagctccac ttcatggagg tcaagattga cttcgtaccc 1920 aggcaggaac ctcccaagat ccacctggac tgcccaggcc gcataccaga caccattgtg 1980 gttgtagctg gaaataagct acgtctggac gtccctatct ctggggaccc tgctcccact 2040 gtgatctggc agaaggctat cacgcagggg aataaggccc cagccaggcc agccccagat 2100 gccccagagg acacaggtga cagcgatgag tgggtgtttg acaagaagct gctgtgtgag 2160 accgagggcc gggtccgcgt ggagaccacc aaggaccgca gcatcttcac ggtcgagggg 2220 gcagagaagg aagatgaggg cgtctacacg gtcacagtga agaaccctgt gggcgaggac 2280 caggtcaacc tcacagtcaa ggtcatcgac gtgccagacg cacctgcggc ccccaagatc 2340 agcaacgtgg gagaggactc ctgcacagta cagtgggagc cgcctgccta cgatggcggg 2400 cagcccatcc tgggctacat cctggagcgc aagaagaaga agagctaccg gtggatgcgg 2460 ctgaacttcg acctgattca ggagctgagt catgaagcgc ggcgcatgat cgagggcgtg 2520 gtgtacgaga tgcgcgtcta cgcggtcaac gccatcggca tgtccaggcc cagccctgcc 2580 tcccagccct tcatgcctat cggtcccccc agcgaaccca cccacctggc agtagaggac 2640 gtctctgaca ccacggtctc cctcaagtgg cggcccccag agcgcgtggg agcaggaggc 2700 ctggatggct acagcgtgga gtactgccca gagggctgct cagagtgggt ggctgccctg 2760 caggggctga cagagcacac atcgatactg gtgaaggacc tgcccacggg ggcccggctg 2820 cttttccgag tgcgggcaca caatatggca gggcctggag cccctgttac caccacggag 2880 ccggtgacag tgcaggagat cctgcaacgg ccacggcttc agctgcccag gcacctgcgc 2940 cagaccattc agaagaaggt cggggagcct gtgaaccttc tcatcccttt ccagggcaag 3000 ccccggcctc aggtgacctg gaccaaagag gggcagcccc tggcaggcga ggaggtgagc 3060 atccgcaaca gccccacaga caccatcctg ttcatccggg ccgctcgccg cgtgcattca 3120 ggcacttacc aggtgacggt gcgcattgag aacatggagg acaaggccac gctggtgctg 3180 caggttgttg acaagccaag tcctccccag gatctccggg tgactgacgc ctggggtctt 3240 aatgtggctc tggagtggaa gccaccccag gatgtcggca acacggagct ctgggggtac 3300 acagtgcaga aagccgacaa gaagaccatg gagtggttca ccgtcttgga gcattaccgc 3360 cgcacccact gcgtggtgcc agagctcatc attggcaatg gctactactt ccgcgtcttc 3420 agccagaata tggttggctt tagtgacaga gcggccacca ccaaggagcc cgtctttatc 3480 cccagaccag gcatcaccta tgagccaccc aactataagg ccctggactt ctccgaggcc 3540 ccaagcttca cccagcccct ggtgaaccgc tcggtcatcg cgggctacac tgctatgctc 3600 tgctgtgctg tccggggtag ccccaagccc aagatttcct ggttcaagaa tggcctggac 3660 ctgggagaag acgcccgctt ccgcatgttc agcaagcagg gagtgttgac tctggagatt 3720 agaaagccct gcccctttga cgggggcatc tatgtctgca gggccaccaa cttacagggc 3780 gaggcacggt gtgagtgccg cctggaggtg cgagtgcctc agtga 3825 <210> 340 <211> 1110 <212> DNA <213> Artificial Sequence <400> 340 atgttgaagc catcattacc attcacatcc ctcttattcc tgcagctgcc cctgctggga 60 gtggggctga acacgacaat tctgacgccc aatgggaatg aagacaccac agctgatttc 120 ttcctgacca ctatgcccac tgactccctc agtgtttcca ctctgcccct cccagaggtt 180 cagtgttttg tgttcaatgt cgagtacatg aattgcactt ggaacagcag ctctgagccc 240 cagcctacca acctcactct gcattattgg tacaagaact cggataatga taaagtccag 300 aagtgcagcc actatctatt ctctgaagaa atcacttctg gctgtcagtt gcaaaaaaag 360 gagatccacc tctaccaaac atttgttgtt cagctccagg acccacggga acccaggaga 420 caggccacac agatgctaaa actgcagaat ctggtgatcc cctgggctcc agagaaccta 480 acacttcaca aactgagtga atcccagcta gaactgaact ggaacaacag attcttgaac 540 cactgtttgg agcacttggt gcagtaccgg actgactggg accacagctg gactgaacaa 600 tcagtggatt atagacataa gttctccttg cctagtgtgg atgggcagaa acgctacacg 660 tttcgtgttc ggagccgctt taacccactc tgtggaagtg ctcagcattg gagtgaatgg 720 agccacccaa tccactgggg gagcaatact tcaaaagaga atcctttcct gtttgcattg 780 gaagccgtgg ttatctctgt tggctccatg ggattgatta tcagccttct ctgtgtgtat 840 ttctggctgg aacggacgat gccccgaatt cccaccctga agaacctaga ggatcttgtt 900 actgaatacc acgggaactt ttcggcctgg agtggtgtgt ctaagggact ggctgagagt 960 ctgcagccag actacagtga acgactctgc ctcgtcagtg agattccccc aaaaggaggg 1020 gcccttgggg aggggcctgg ggcctcccca tgcaaccagc atagccccta ctgggccccc 1080 ccatgttaca ccctaaagcc tgaaacctga 1110 <210> 341 <211> 151 <212> DNA <213> Artificial Sequence <400> 341 gggtgatggg tgctggccag gacacccact gtatgattgc tgtccaacac agccccagcc 60 tttgagacct ctgcccagag ttgttctcca tccaacaggg ccatgagccc catgactgtg 120 agtactggct ttcgcagcaa ctgcacatgg g 151 <210> 342 <211> 151 <212> DNA <213> Artificial Sequence <400> 342 actacagttg ctccgatatt taggctacgt caataggcac taacttattg gcgctggtga 60 acggacttcc tctcgagtac cagaagatga ctacaaaact cctttccatt gcgagtatcg 120 gagtctggct cagtttggcc agggaggcac t 151 <210> 343 <211> 71 <212> RNA <213> Artificial Sequence <400> 343 gucaaggcac ucuugccuac gccaccagcu ccaaccacca caaguuuaua uucagucauu 60 uucagcaggc c 71

Claims

탈아미노효소-리크루팅 RNA(dRNA) 또는 dRNA를 인코딩하는 구축물을 숙주 세포에 도입하는 단계를 포함하는, 숙주 세포에서 타겟 RNA를 편집하는 방법으로서,
상기 dRNA는 상기 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 또한 상기 dRNA는 상기 타겟 RNA에서 타겟 아데노신을 탈아미노화하기 위해 RNA 아데노신 탈아미노효소(ADAR)를 리크루팅할 수 있는 숙주 세포에서 타겟 RNA를 편집하는 방법.
제 1 항에 있어서,
상기 dRNA는 길이가 70개의 뉴클레오티드를 초과하는 방법.
제 3 항에 있어서,
상기 dRNA는 길이가 약 100개 내지 약 150개의 뉴클레오티드인 방법.
제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
상기 ADAR은 숙주 세포에 의해 내인적으로 발현되는 방법.
제 1 항 내지 제 4 항 중 어느 한 항에 있어서,
상기 숙주 세포는 1차 세포인 방법.
제 5 항에 있어서,
상기 숙주 세포는 T 세포인 방법.
제 1 항 내지 제 6 항 중 어느 한 항에 있어서,
상기 dRNA는 ADAR-리크루팅 도메인을 포함하지 않는 방법.
제 1 항 내지 제 7 항 중 어느 한 항에 있어서,
상기 dRNA는 화학 수식된 뉴클레오티드를 포함하지 않는 방법.
제 8 항에 있어서,
상기 dRNA를 인코딩하는 구축물을 숙주 세포에 도입하는 단계를 포함하고, 상기 구축물은 바이러스 벡터 또는 플라스미드인 방법.
제 1 항 내지 제 9 항 중 어느 한 항에 있어서,
상기 RNA 서열은 상기 타겟 RNA에서 타겟 아데노신의 정반대쪽에 시티딘, 아데노신 또는 우리딘을 포함하는 방법.
제 10 항에 있어서,
상기 RNA 서열은 상기 타겟 RNA에서 타겟 아데노신의 정반대쪽에 시티딘 미스매치를 포함하는 방법.
제 11 항에 있어서,
상기 시티딘 미스매치는 상기 dRNA에서 상보적 서열의 3' 말단으로부터 적어도 20개의 뉴클레오티드 이간되고, 또한 상보적 서열의 5' 말단으로부터 적어도 5개의 뉴클레오티드 이간되어 위치되는 방법.
제 12 항에 있어서,
상기 시티딘 미스매치는 상기 dRNA에서 상보적 서열의 중심으로부터 10개의 뉴클레오티드 이내에 위치되는 방법.
제 1 항 내지 제 13 항 중 어느 한 항에 있어서,
상기 상보적 서열은 상기 타겟 RNA에서 비타겟 아데노신의 각각 반대쪽에 하나 이상의 구아노신을 추가로 포함하는 방법.
제 1 항 내지 제 14 항 중 어느 한 항에 있어서,
상기 상보적 서열은 상기 타겟 RNA에서 비타겟 아데노신의 반대쪽에 2개 이상의 연속한 미스매치 뉴클레오티드를 포함하는 방법.
제 1 항 내지 제 15 항 중 어느 한 항에 있어서,
상기 타겟 RNA에서의 타겟 아데노신의 5' 최근접 이웃은 U, C, A 및 G에서 선택된 뉴클레오티드이고, 선호도는 U>C≒A>G이고, 상기 타겟 RNA에서의 타겟 아데노신의 3' 최근접 이웃은 G, C, A 및 U에서 선택된 뉴클레오티드이고, 선호도는 G>C>A≒U인 방법.
제 1 항 내지 제 16 항 중 어느 한 항에 있어서,
상기 타겟 아데노신은 상기 타겟 RNA에서 UAG, UAC, UAA, UAU, CAG, CAC, CAA, CAU, AAG, AAC, AAA, AAU, GAG, GAC, GAA 및 GAU로 이루어진 군에서 선택된 3-염기 모티프로 있는 방법.
제 17 항에 있어서,
상기 3-염기 모티프는 UAG이고, 상기 dRNA는 3-염기 모티프에서 우리딘의 정반대쪽에 A, 타겟 아데노신의 정반대쪽에 시티딘, 및 3-염기 모티프에서 구아노신의 정반대쪽에 시티딘, 구아노신 또는 우리딘을 포함하는 방법.
제 1 항 내지 제 18 항 중 어느 한 항에 있어서,
상기 타겟 RNA는 프리메신저 RNA, 메신저 RNA, 리보솜 RNA, 트랜스퍼 RNA, 긴 논코딩 RNA 및 작은 RNA로 이루어진 군에서 선택된 RNA인 방법.
제 19 항에 있어서,
상기 타겟 RNA는 프리메신저 RNA인 방법.
제 1 항 내지 제 20 항 중 어느 한 항에 있어서,
ADAR3의 억제제를 숙주 세포에 도입하는 단계를 추가로 포함하는 방법.
제 1 항 내지 제 21 항 중 어느 한 항에 있어서,
인터페론의 자극제를 숙주 세포에 도입하는 단계를 추가로 포함하는 방법.
제 1 항 내지 제 22 항 중 어느 한 항에 있어서,
상이한 타겟 RNA를 각각 타겟팅하는 복수의 dRNA를 도입하는 단계를 포함하는 방법.
제 1 항 내지 제 23 항 중 어느 한 항에 있어서,
상기 타겟 RNA의 편집 효율은 적어도 5%인 방법.
제 1 항 내지 제 24 항 중 어느 한 항에 있어서,
상기 dRNA는 면역 반응을 유도하지 않는 방법.
제 1 항 내지 제 25 항 중 어느 한 항에 있어서,
외인성 ADAR을 숙주 세포에 도입하는 단계를 추가로 포함하는 방법.
제 26 항에 있어서,
상기 ADAR은 E1008 돌연변이를 포함하는 ADAR1인 방법.
제 1 항 내지 제 27 항 중 어느 한 항에 있어서,
상기 타겟 RNA에서의 타겟 아데노신의 탈아미노화는 상기 타겟 RNA에서 미스센스 돌연변이, 조기 정지 코돈, 비정상 스플라이싱 또는 선택적 스플라이싱을 야기하거나, 또는 상기 타겟 RNA에서 미스센스 돌연변이, 조기 정지 코돈, 비정상적 스플라이싱 또는 선택적 스플라이싱의 역전을 야기하는 방법.
제 28 항에 있어서,
상기 타겟 RNA에서의 타겟 아데노신의 탈아미노화는 상기 타겟 RNA에 의해 인코팅된 단백질의 점 돌연변이, 절단, 연장 및/또는 잘못 접힘을 야기하거나, 또는 상기 타겟 RNA에서 미스센스 돌연변이, 조기 정지 코돈, 비정상적 스플라이싱 또는 선택적 스플라이싱의 역전에 의한 기능적, 전장, 정확하게 접힌 및/또는 야생형 단백질을 야기하는 방법.
제 1 항 내지 제 29 항 중 어느 한 항에 있어서,
상기 숙주 세포는 진핵 세포인 방법.
제 30 항에 있어서,
상기 숙주 세포는 포유류 세포인 방법.
제 31 항에 있어서,
상기 숙주 세포는 인간 또는 마우스 세포인 방법.
제 31 항 또는 제 32 항에 있어서,
상기 ADAR은 ADAR1 및/또는 ADAR2인 방법.
제 1 항 내지 제 33 항 중 어느 한 항에 기재된 방법에 의해 생성된, 편집된 RNA 또는 편집된 RNA를 갖는 숙주 세포.
제 1 항 내지 제 33 항 중 어느 한 항에 기재된 방법에 따라, 개체의 세포에서 질환 또는 상태와 관련된 타겟 RNA를 편집하는 단계를 포함하는, 개체에서의 질환 또는 상태를 치료 또는 예방하는 방법.
제 35 항에 있어서,
상기 질환 또는 상태는 유전성 유전 질환 또는 하나 이상의 후천적인 유전적 돌연변이와 관련된 질환 또는 상태인 방법.
제 35 항 또는 제 36 항에 있어서,
상기 타겟 RNA는 G에서 A로의 돌연변이를 갖는 방법.
제 35 항 내지 제 37 항 중 어느 한 항에 있어서,
상기 질환 또는 상태가 단일 유전 질환 또는 상태인 방법.
제 35 항 내지 제 37 항 중 어느 한 항에 있어서,
상기 질환 또는 상태가 다중 유전 질환 또는 상태인 방법.
제 35 항 내지 제 37 항 중 어느 한 항에 있어서,
(i) 상기 타겟 RNA는 TP53이고, 상기 질환 또는 상태는 암이고;
(ii) 상기 타겟 RNA는 IDUA이고, 상기 질환 또는 상태는 I형 점액 다당류증(MPS I)이고;
(iii) 상기 타겟 RNA는 COL3A1이고, 상기 질환 또는 상태는 엘러스-단로스 증후군이고;
(iv) 상기 타겟 RNA는 BMPR2이고, 상기 질환 또는 상태는 주버트 증후군이고;
(v) 상기 타겟 RNA는 FANCC이고, 상기 질환 또는 상태가 판코니 빈혈이고;
(vi) 상기 타겟 RNA는 MYBPC3이고, 상기 질환 또는 상태는 원발성 가족성 비대 심근병증이고; 또는
(vii) 상기 타겟 RNA는 IL2RG이고, 상기 질환 또는 상태는 X-염색체 연관 중증복합면역결핍증인 방법.
RNA 아데노신 탈아미노효소(ADAR)를 리크루팅함으로써 타겟 RNA에서의 타겟 아데노신을 탈아미노화하기 위한 탈아미노효소-리크루팅 RNA(dRNA)로서, 상기 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하는 탈아미노효소-리크루팅 RNA.
서열 번호 25-44, 142-205, 341-342 중 어느 하나의 핵산 서열을 포함하는 dRNA.
제 41 항 또는 제 42 항에 기재된 dRNA를 인코딩하는 구축물.
제 41 항 또는 제 42 항에 기재된 dRNA 또는 제 43 항에 기재된 구축물을 복수 개 포함하는 라이브러리.
제 41 항 또는 제 42 항에 기재된 dRNA, 제 43 항에 기재된 구축물, 또는 제 44 항에 기재된 라이브러리를 포함하는 조성물.
제 41 항 또는 제 42 항에 기재된 dRNA 또는 제 43 항에 기재된 구축물을 포함하는 숙주 세포.
탈아미노효소-리크루팅 RNA를 포함하는, 숙주 세포에서 타겟 RNA를 편집하기 위한 키트로서,
상기 탈아미노효소-리크루팅 RNA는 상기 타겟 RNA에 혼성화하는 상보적 RNA 서열을 포함하고, 상기 탈아미노효소-리크루팅 RNA는 상기 타겟 RNA에서 타겟 아데노신을 탈아미노화하기 위해 ADAR을 리크루팅할 수 있는 키트.