KR20160118987A - LincRNA 삭제를 위한 sgRNA 쌍 - Google Patents

LincRNA 삭제를 위한 sgRNA 쌍 Download PDF

Info

Publication number
KR20160118987A
KR20160118987A KR1020160040433A KR20160040433A KR20160118987A KR 20160118987 A KR20160118987 A KR 20160118987A KR 1020160040433 A KR1020160040433 A KR 1020160040433A KR 20160040433 A KR20160040433 A KR 20160040433A KR 20160118987 A KR20160118987 A KR 20160118987A
Authority
KR
South Korea
Prior art keywords
sgrna
xist
deletion
rna
sequence
Prior art date
Application number
KR1020160040433A
Other languages
English (en)
Inventor
남진우
김형범
이현주
Original Assignee
한양대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한양대학교 산학협력단 filed Critical 한양대학교 산학협력단
Publication of KR20160118987A publication Critical patent/KR20160118987A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses

Abstract

본 발명은 lincRNA인 XIST 또는 RP11-307P5.1의 전체 또는 이의 일부를 삭제할 수 있는 가이드 서열로서의 sgRNA 쌍에 관한 것이다. 본 발명의 가이드 시퀀스, 삭제용 조성물 또는 발현벡터를 이용하면, XIST 또는 RP11-307P5.1 유전자의 전체 또는 원하는 일 부분을 높은 효율로 용이하게 삭제할 수 있다.

Description

LincRNA 삭제를 위한 sgRNA 쌍{Pair of sgRNAs for Deletion of LincRNA}
본 발명은 lincRNA인 XIST 또는 RP11-307P5.1의 전체 또는 이의 일부를 삭제할 수 있는 가이드 서열로서의 sgRNA 쌍에 관한 것이다.
lncRNA(long non-coding RNAs)는 핵과 세포질 모두로 국소화되는 RNA 분자이고, 전사에서 전사 후 단계까지 조절자 역할을 수행한다[1, 2]. 지금까지 수만의 포유류 lncRNA를 다양한 세포-유형에 대하여 준비된 고-처리량 RNA 시퀀싱(RNA-seq)을 통해 주석(annotated)해왔다[3-10]. 그러나 오직 몇백의 lncRNA만이 유전적 생화학적 접근을 통해 그들의 생물학적 역할이 밝혀졌고[1, 11-18], 대부분의 lncRNA는 그들의 기능적 역할에 대해 거의 알려져 있지 않다. lncRNA 열할을 밝히는 방법 중 하나는 특정의 lncRNA와 상호작용하는 타겟 분자(DNA, RNA, 또는 단백질)를 확인하는 것이다. 최근의 단백질-중심(protein-centric) 생화학적 정제 방법, 예를 들어 가교(cross-linking) 면역-침전에 이은 시퀀싱(CLIP-seq)이 수행되었지만, 대부분의 경우에서 타겟이 불명확했다[19, 20]. 상기 방법을 보완하기 위해, lncRNA-DNA, lncRNA-RNA 및 lncRNA-단백질 상호 작용을 확인하기 위한 lncRNA-중심 생화학적 정제 기술이 lncRNA와 직접적으로 상호작용하는 타겟을 확인하기 위해 소개되었다[21-25]. 예를 들어, Xist-DNA 상호작용을 검출하기 위한 RNA 안티센스 정제(RAP)는 30차원 공간 내의 X 염색체 전반에 걸쳐 퍼진 XCI를 성공적으로 검출하였다[24, 26]. 그러나 lncRNA-중심 접근은 종종 낮은 세포성 lncRNA 발현, 간접적 상호작용, 및 높은 신호 대 노이즈 비율에 의해 도전을 받는다[25, 27].
lncRNA의 기능적 연구의 가장 좋은 방법 중 하나는 기능 상실 연구(loss-of -function study)이다. 그러나 상동 재조합에 의한 종래 녹아웃은 시간 소비적이고, 비경제적이다[28-35]. 대신에 RNAi(RNA interference)가 내인성 lncRNA의 녹-다운을 쉽게 수행해왔다[36-40]. 비록 소수의 RNAi 연구가 성공적으로 적용되었지만, 표유류 RNAi 기계 및 외인성 siRNA는 세포질 내에 있고, 일시적으로 발현되기 때문에, 풍부한 핵 lncRNA는 외인성 siRNA에 의해 효과적으로 타겟팅될 수 없다[41]. 예를 들어, 매우 풍부한 암전이 관련 lncRNA인 MALAT1은 RNAi에 의해 효율적으로 감소-조절되지 않는다[41, 42].
프로그램 가능한 뉴클레아제의 최근의 진보는 타겟 유전자의 지놈 삭제[43] 또는 직접적인 전사 스톱[41, 44, 45]에 의해 lncRNA 유전자의 기능의 상실을 가능케 한다. 징크 핑거 뉴클레아제(ZFNs)를 사용하여 MALAT1 바로 상류에 RNA 불안정 요소를 통합하는 것은 lncRNA의 영구적이고, 효율적인 유전자 사일런싱을 가능케한다[41, 45]. TALEN(transcription activator-like effector nucleases)은 lncRNA[43] 및 miRNA[43, 46]를 방해하는데 적용되어왔다. 가장 최근에, 박테리아 CRISPR/Cas9 시스템으로부터 유래된 RGEN(RNA-guided engineered nuclease)이 단백질 코딩 유전자[47-50] 및 논코딩 RNA 유전자[51, 52]를 방해하는데 이용되어 왔다. RGEN은 효율적이고, 경제적이며, 쉽게 프로그램할 수 있는 지놈 에디팅 방법을 제공한다[53, 54]. TALEN 및 ZFN에 비하여, RGEN은 다중의 가이드 RNA를 이용하는 것에 의해 달성될 수 있는 다중의 지놈 에디팅을 위해 엔지니어링하기 더 쉽다[55]. 특정 lncRNA에 대한 기능 상실을 위한 가장 좋은 방법 중 하나는 인코딩 지놈 영역을 삭제하는 것이고, 큰 타겟팅 삭제가 타겟을 삭제하도록 하는 두 개의 이중-가닥 절단을 유도하는 다중 지놈 에디팅을 요구하는 점을 고려하면, RGEN은 TALEN 및 ZFN에 비하여 lncRNA의 기능 상실 연구에 있어서 뛰어날 것이다.
지놈-와이드 방법에서 lncRNA를 녹아웃 시키기 위해, lncRNA의 정교한 유전자 주석이 필요하다. 낮은 발현 레벨로 인해, 몇몇의 추정상의 lncRNAs는 절편상의 주석 및 전사 주변의 부족한 정의를 포함한다[4, 56]. lncRNA의 주변을 수정하기 위해, 전사 시작 부위(TSS)(Faulkner et al. 2009)의 지놈-와이드 프로파일링 및 절단(cleavage) 및 폴리아데닐화 부위(CPS)[58, 59]가 추가적인 증거로 이용될 수 있다. lncRNA에 대한 정확한 지도를 갖는다면, 높은 효율성 및 정확도를 갖는 sgRNA를 디자인하는 것은 lincRNA 유전자의 성공적인 삭제를 위한 중요한 단계이다. lincRNA 삭제를 위한 sgRNA는, lincRNA를 코딩하는 많은 지놈 로커스가 종종 높은 A/U 함량을 보이고[59] 반복 요소를 삽입하기 때문에[59-61] 조심스럽게 선택되어야 한다. 이러한 A/U-풍부 영역을 타겟팅하는 sgRNA 디자인은 더 효율적이지 못한 sgRNA를 제공할 수 있다[53, 62].
본 명세서 전체에 걸쳐 다수의 논문 및 특허문헌이 참조되고 그 인용이 표시되어 있다. 인용된 논문 및 특허문헌의 개시 내용은 그 전체로서 본 명세서에 참조로 삽입되어 본 발명이 속하는 기술 분야의 수준 및 본 발명의 내용이 보다 명확하게 설명된다.
본 발명자들은 XIST 또는 RP11-307P5.1의 전체 또는 이의 일부를 높은 효율로 삭제할 수 있는 가이드서열로서의 sgRNA 쌍을 발굴하고자 예의 연구 노력하였다. 그 결과 sgRNA 쌍의 선정에 가이드 서열 자체 및 타겟 서열의 섀넌 엔트로피(Shannon's entrophy)를 고려하여 특정의 sgRNA 쌍을 선정하는 경우 효율이 증대된 sgRNA 쌍을 선정할 수 있음을 규명함으로써, 본 발명을 완성하게 되었다.
따라서, 본 발명의 목적은 XIST 유전자 전체 또는 일부의 삭제(deletion)를 위한 절단부위 타겟팅용 가이드 시퀀스를 제공하는데 있다.
본 발명의 다른 목적은 XIST 유전자 전체 또는 일부의 삭제용 조성물을 제공하는데 있다.
본 발명의 또 다른 목적은 (a) 상술한 XIST에 대한 가이드 시퀀스; 및 (b) cas9을 발현하는 발현벡터를 제공하는데 있다.
본 발명의 또 다른 목적은 RP11-307P5.1 유전자 전체 또는 일부의 삭제(deletion)를 위한 절단부위 타겟팅용 가이드 시퀀스를 제공하는데 있다.
본 발명의 또 다른 목적은 RP11-307P5.1 유전자 전체 또는 일부의 삭제용 조성물을 제공하는데 있다.
본 발명의 또 다른 목적은 (a) 상술한 RP11-307P5.1에 대한 가이드 시퀀스; 및 (b) cas9을 발현하는 발현벡터를 제공하는데 있다.
본 발명의 다른 목적 및 이점은 하기의 발명의 상세한 설명, 청구범위 및 도면에 의해 보다 명확하게 된다.
본 발명의 일 양태에 따르면, 본 발명은 서열목록 제1서열 내지 제16서열로 나타낸 sgRNA들로 구성된 군으로부터 선택되는 2개의 sgRNA를 포함하는 XIST 유전자 전체 또는 일부의 삭제(deletion)를 위한 절단부위 타겟팅용 가이드 시퀀스를 제공한다.
본 발명자들은 XIST 또는 RP11-307P5.1의 전체 또는 이의 일부를 높은 효율로 삭제할 수 있는 가이드서열로서의 sgRNA 쌍을 발굴하고자 예의 연구 노력하였다. 그 결과 sgRNA 쌍의 선정에 가이드 서열 자체 및 타겟 서열의 섀넌 엔트로피(Shannon's entrophy)를 고려하여 특정의 sgRNA 쌍을 선정하는 경우 효율이 증대된 sgRNA 쌍을 선정할 수 있음을 규명하였다.
본 발명의 "XIST(X-inactive specific transcript) 유전자"는 단백질을 코딩하지 않는 유전자로서, 태반이 있는 포유동물(placental mammals)의 X 염색체 상에 위치하는 유전자로서, X 불활성화 공정의 주요 이펙터로서 역할한다.
본 명세서 상의 용어 "sgRNA(single guide RNA)"는 미생물의 면역체계인 CRISPR/Cas 시스템의 원리를 이용한 유전자 편집 시스템인 RGEN(RNA-Guided Engineered Nuclease)에서 이용되는 가이드 RNA 서열을 의미한다. 미생물의 면역 체계 상에서 발견되는 crRNA 및 tracrRNA 쌍과 같이 두 짧은 가닥의 RNA가 함께 가이드 RNA 서열로 작용할 수 있으나, 본 발명의 sgRNA는 루프를 갖는 한 가닥의 RNA 서열이다. 본 발명의 sgRNA는 삭제를 원하는 핵산의 타겟팅 부위의 양 말단에 대응되는 2개의 쌍의 조합으로서 이용될 수 있다. 본 발명의 sgRNA의 경우 XIST 유전자의 전체 또는 일부를 삭제하기 위한 2개의 sgRNA 쌍으로서 제공된다.
본 발명의 XIST 유전자의 전체 또는 일부를 삭제하기 위한 sgRNA 쌍은 서열목록 제1서열 내지 제16서열 중에서 삭제를 원하는 부위에 따라 적절히 선택된 2개의 sgRNA를 포함한다. 본 발명자들은 sgRNA를 선정하는데 있어서, 가이드 서열 자체의 2차 구조와 타겟 부위의 2차 구조의 열역학적 안정성 수치를 고려하여, 상기 수치가 sgRNA의 효율성과 음의 상관관계를 가짐을 이용함으로써 sgRNA를 효율적으로 설계할 수 있는 시스템을 구축하였다. 본 발명자들이 이용한 효율적인 sgRNA 구축 시스템은 셰넌 엔트로피(Shannon entropy), 자유 에너지(Free energy), 및 INDEL 스코어를 반영하는 특징을 갖는다(참조: 도 2의 b 내지 d). 이는 가이드 시퀀스 및 타겟 부위의 2차 구조를 반영하여 Cas9의 접근성에 미치는 영향을 반영한 것이다.
본 발명자들은 상기의 sgRNA 설계 시스템을 이용하여, XIST 유전자의 전체 또는 일부를 효율적으로 삭제할 수 있는 sgRNA를 도출하였다.
한편, 본 발명의 sgRNA는 서열목록 제1서열 내지 제16서열에 대하여 3' 말단 및 5'말단 방향으로 약 1-10 nt의 염기가 추가될 수 있다. 더욱 구체적으로는 1-9 nt, 보다 더 구체적으로 1-8 nt, 보다 더 구체적으로 1-7 nt, 보다 더 구체적으로 1-6 nt, 및 보다 더 구체적으로 1-5 nt의 염기가 추가될 수 있다. 구체적으로 예를 들면, 서열목록 제1서열의 경우 5' 말단에 5'-CATT-3', 5'-ATT-3', 5'-TT-3', 또는 T 염기서열을 추가적으로 더 포함할 수 있고, 3' 말단에 5'-GGGACT-3', 5'-GGACT-3', 5'-GACT-3', 5'-ACT-3', 5'-CT-3', 또는 T의 염기서열을 추가적으로 더 포함할 수 있다. 서열목록 제1서열 내지 제16서열에 대응되는 상기와 같은 확장된 염기 서열은 서열목록 제17서열 내지 제32서열에 순서대로 기재되어 있고, 확장되는 길이는 반드시 상기 서열에 제한되지 않으며, 당업계의 일반적인 상식에 따라 추가적으로 확장하는 것이 가능하다.
본 발명의 일 구현예에 있어서, 본 발명의 2개의 sgRNA는 서열목록 제3서열로 이루어진 sgRNA 및 서열목록 제15서열로 이루어진 sgRNA이고, XIST 유전자 전체의 삭제(deletion)를 위한 것이다. 본 발명자들은 본 발명의 sgRNA 들의 조합 중 (a) 서열목록 제2서열 또는 제3서열로부터 선택되는 sgRNA 및 (b) 서열목록 제15서열 또는 제16서열로 선택되는 sgRNA의 쌍이 XIST 전체를 삭제할 수 있지만, 그 중에서도 서열목록 제3서열의 sgRNA 및 서열목록 제15서열의 sgRNA를 이용하는 경우 가장 효율적으로 XIST 전체 서열을 삭제할 수 있음을 규명하였다.
본 발명의 다른 일 양태에 따르면, 본 발명은 (a) 상술한 XIST에 대한 가이드 시퀀스 및 (b) Cas9 뉴클레아제를 포함하는 XIST 유전자 전체 또는 일부의 삭제용 조성물을 제공한다. 본 발명의 "Cas9(CRISPR associated protein 9)"은 미생물의 CRISPR/Cas9 면역체계를 통해 현재 당업자들에게 잘 알려진 단백질로서, sgRNA의 가이드에 의해 핵산 서열의 타겟팅 부위에 접근하여 특정 부위를 절단하는 역할을 한다. 따라서, 본 발명의 XIST에 대한 가이드 시퀀스 및 Cas9 뉴클레아제를 포함하는 조성물의 경우, XIST 유전자의 전체 또는 일부를 삭제하는데 유용하게 이용될 수 있다.
본 발명의 또 다른 일 양태에 따르면, 본 발명은 (a) 상술한 XIST에 대한 가이드 시퀀스; 및 (b) Cas9을 발현하는 발현벡터를 제공한다. 본 발명의 발현벡터는 대상(subject)에 주입되어 sgRNA 쌍 및 Cas9을 함께 발현하여, XIST의 전체 또는 일부의 삭제를 위해 유용하게 이용될 수 있다.
본 발명의 벡터 시스템은 당업계에 공지된 다양한 방법을 통해 구축될 수 있으며, 이에 대한 구체적인 방법은 Sambrook et al., Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Laboratory Press(2001)에 개시되어 있으며, 이 문헌은 본 명세서에 참조로서 삽입된다.
본 발명의 벡터는 전형적으로 클로닝을 위한 벡터 또는 발현을 위한 벡터로서 구축될 수 있다. 또한, 본 발명의 벡터는 원핵 세포 또는 진핵 세포를 숙주로 하여 구축될 수 있다. 본 발명의 핵산 분자가 원핵 세포 유래이고, 배양의 편의성 등을 고려하여, 원핵 세포를 숙주로 하는 것이 바람직하다.
예를 들어, 본 발명의 벡터가 발현 벡터이고, 원핵 세포를 숙주로 하는 경우에는, 전사를 진행시킬 수 있는 강력한 프로모터 (예컨대, tac 프로모터, lac 프로모터, lacUV5 프로모터, lpp 프로모터, pL λ프로모터, pR λ프로모터, rac5 프로모터, amp 프로모터, recA 프로모터, SP6 프로머터, trp 프로모터 및 T7 프로모터 등), 해독의 개시를 위한 라이보좀 결합 자리 및 전사/해독 종결 서열을 포함하는 것이 일반적이다. 숙주 세포로서 E. coli가 이용되는 경우, E. coli 트립토판 생합성 경로의 프로모터 및 오퍼레이터 부위 (Yanofsky, C., J. Bacteriol., 158:1018-1024(1984)) 그리고 파아지 λ의 좌향 프로모터 (pL λ프로모터, Herskowitz, I. and Hagen, D., Ann. Rev. Genet., 14:399-445(1980))가 조절 부위로서 이용될 수 있다.
한편, 본 발명에 이용될 수 있는 벡터는 당업계에서 종종 사용되는 플라스미드(예: pSC101, ColE1, pBR322, pUC8/9, pHC79, pUC19 및 pET 등), 파지(예: λgt4·λB, λ-Charon, λΔz1 및 M13 등) 또는 바이러스(예: SV40 등)를 조작하여 제작될 수 있다.
한편, 본 발명의 벡터가 발현 벡터이고, 진핵 세포를 숙주로 하는 경우에는, 포유동물 세포의 지놈으로부터 유래된 프로모터(예: 메탈로티오닌 프로모터) 또는 포유동물 바이러스로부터 유래된 프로모터(예: 아데노바이러스 후기 프로모터, 백시니아 바이러스 7.5K 프로모터, SV40 프로모터, 사이토메갈로바이러스 프로모터 및 HSV의 tk 프로모터)가 이용될 수 있으며, 전사 종결 서열로서 폴리아데닐화 서열을 일반적으로 갖는다.
본 발명의 벡터는 그로부터 발현되는 Aβ42 표적용 펩타이드 프로브의 정제를 용이하게 하기 위하여, 다른 서열과 융합될 수도 있다. 융합되는 서열은 예컨대, 글루타티온 S-트랜스퍼라제 (Pharmacia, USA), 말토스 결합 단백질 (NEB, USA), FLAG (IBI, USA) 및 6x His (hexahistidine; Quiagen, USA) 등이 있고, 가장 바람직하게는 6x His이다. 상기 정제를 위한 추가적인 서열 때문에, 숙주에서 발현된 단백질은 친화성 크로마토그래피를 통하여 신속하고, 용이하게 정제된다.
한편, 본 발명의 발현 벡터는 선택표지로서, 당업계에서 통상적으로 이용되는 항생제 내성 유전자를 포함하며, 예를 들어 암피실린, 겐타마이신, 카베니실린, 클로람페니콜, 스트렙토마이신, 카나마이신, 게네티신, 네오마이신 및 테트라사이클린에 대한 내성 유전자가 있다.
본 발명의 또 다른 일 양태에 따르면, 본 발명은 서열목록 제33서열 내지 제38서열로 나타낸 sgRNA들로 구성된 군으로부터 선택되는 2개의 sgRNA를 포함하는 RP11-307P5.1 유전자 전체 또는 일부의 삭제(deletion)를 위한 절단부위 타겟팅용 가이드 시퀀스를 제공한다.
본 발명의 RP11-307P5.1 유전자는 K562 세포내에서 고 발현되는 lincRNA로서, 본 발명자들은 RP11-307P5.1 유전자에 대한 효율적인 sgRNA 설계를 통해 본 발명의 sgRNA 쌍을 설계하는데 이용된 방법이 다른 lincRNA 삭제를 위한 sgRNA 설계에 광범위하게 이용될 수 있음을 보였다.
본 발명의 일 구현예에 있어서, 본 발명의 2개의 sgRNA는 서열목록 제34서열로 이루어진 sgRNA 및 서열목록 제38서열로 이루어진 sgRNA이고, RP11-307P5.1 유전자 전체의 삭제(deletion)를 위한 것이다. 본 발명자들은 RP11-307P5.1 유전자의 5' 말단을 절단하는 서열목록 제33서열 또는 제34서열, 그리고 3' 말단 쪽을 절단하는 서열목록 제37서열 또는 제38서열 중 제34서열 및 제38서열을 이용하는 경우, 46%의 삭제 효율을 보임으로써 높은 효율로 RP11-307P5.1 유전자 전체를 삭제할 수 있음을 규명하였다.
본 발명의 RP11-307P5.1 유전자 전체 또는 일부의 삭제(deletion)를 위한 절단부위 타겟팅용 가이드 시퀀스의 경우, 상술한 XIST 전체 또는 일부 삭제용 가이드 시퀀스에 대한 설명 중 유전자의 종류만을 달리하며, 유전자의 종류가 달라짐에 따라 sgRNA의 서열이 달라지는 외의 내용은 동일하다.
본 발명의 또 다른 일 양태에 따르면, 본 발명은 (a) 상술한 RP11-307P5.1에 대한 가이드 시퀀스 및 (b) Cas9 뉴클레아제를 포함하는 RP11-307P5.1 유전자 전체 또는 일부의 삭제용 조성물을 제공한다.
본 발명의 RP11-307P5.1 유전자 전체 또는 일부의 삭제용 조성물의 경우에도 XIST 유전자 전체 또는 일부 삭제용 조성물에 대한 설명 중 유전자의 종류만을 달리하며, 유전자의 종류가 달라짐에 따라 sgRNA의 서열이 달라지는 외의 내용은 동일하다.
본 발명의 또 다른 일 양태에 따르면, 본 발명은 (a) 상술한 RP11-307P5.1에 대한 가이드 시퀀스; 및 (b) cas9을 발현하는 발현벡터를 제공한다. 본 발명의 발현벡터의 경우 XIST에 대한 가이드 시퀀스를 포함하는 상술한 본 발명의 다른 일 양태의 발현벡터와 비교하여 XIST에 대한 가이드 시퀀스 대신 RP11-307P5.1에 대한 가이드 시퀀스를 포함하는 외에 다른 내용은 상술한 본 발명의 다른 일 양태의 발현벡터에 대한 것과 동일하다.
본 발명의 특징 및 이점을 요약하면 다음과 같다:
(a) 본 발명은 XIST 또는 RP11-307P5.1 유전자의 전체 또는 일부의 삭제(deletion)를 위한 절단부위 타겟팅용 가이드 시퀀스를 제공한다.
(b) 본 발명은 XIST 또는 RP11-307P5.1 유전자의 전체 또는 일부의 삭제용 조성물을 제공한다.
(c) 본 발명은 (ⅰ) 상술한 XIST 또는 RP11-307P5.1에 대한 가이드 시퀀스; 및 (ⅱ) cas9을 발현하는 발현벡터를 제공한다.
(d) 본 발명의 가이드 시퀀스, 삭제용 조성물 또는 발현벡터를 이용하면, XIST 또는 RP11-307P5.1 유전자의 전체 또는 원하는 일 부분을 높은 효율로 용이하게 삭제할 수 있다.
도 1은 인간 lincRNA 및 INDEL 시스템의 특성을 나타낸다. 도 1의 A는 인간 lincRNAs의 수정(revising)에 대한 개략적 플로우를 나타낸다(자세한 내용은 실험 방법 참조). 도 1의 B는 9203 인간의 수정된 lincRNA 유전자의 길이의 누적된 분포를 나타낸다. 도 1의 C는 k 엑손 및 k-1 인트론을 포함하는 lincRNAs의 길이 분포를 나타내고, 회색 선은 k=1, 녹색 선은 k=2, 및 주황색 선은 k≥3 인 것을 나타낸다. 괄호 안의 수는 각각의 그룹에 대한 lincRNA의 수를 나타낸다. 도 1의 D는 1744 수정된 유니크 전사 시작 부위(transcription start sites, TSSs; 적색 선), 수-매칭된 수정되지 않은 TSSs(보라색 선), 및 수-매칭된 랜덤 부위(회색 실선)의 업스트립에서의 전사 인자 결합 부위(transcription factor binding sites, TFBS)의 빈도를 나타낸다. TFBSs는 크로마틴 면역-침전하고, ENCODE 프로젝트(Consirtium 2012)에서 많은 전사 인자에 대해 시퀀싱하여 프로파일된 데이터였다. 수-매칭된 수정되지 않은 부위 및 랜덤 부위의 100 코호트(cohorts)를 각각 시험하였고, 그들의 표준 오차를 각각의 값(bin)에 표시하였다. 도 1의 E는 lincRNAs 상의 보존 영역(conserved regions)의 길이를 보여주는 박스 플롯을 나타낸다. 도 1의 F는 lincRNA의 구조적 기능적 주석들, 예컨대 코딩 포텐셜, 다중 세포-유형에 결친 발현 시그니쳐, 보존된 엘리먼트, 및 RNA 패밀리 모티프를 통합하는 INDEL 데이터베이스의 개략적인 구조 및, lincRNA 좌위(loci)에 걸쳐 디자인된 모든 sgRNAs를 나타낸다. 메인 키는 INDEL 데이터베이스 내에서 모든 이용 가능한 표들과 연결된 lincRNA의 유전자 ID이다.
도 2는 lincRNA 삭제를 위한 후보군 sgRNA의 지놈-와이드 디자인을 나타낸다. 도 2의 A는 활성화되고, 특이적인 sgRNAs를 디자인하기 위한 개략적 플로우를 나타낸다. 전체에서, 효율과 특이도를 만족하는 4,311,039 sgRNAs를 lincRNA 녹아웃을 위해 선별하였다. 도 2의 B는 sgRNAs의 중앙 효능(median efficacy)(퍼센트 순위)과 그들의 셰년 엔트로피의 관계를 나타낸다. 청색(Doench et al. 2014) 및 적색 사각형(Wang et al. 2014)는 각각의 엔트로피 값(bin)의 퍼센트 순위의 중앙 값이다. 사각형의 휘스커(whisker)는 각각의 값(bin)의 표준 편차이다. 주황색 박스는 INDEL's 엔트로피 기준을 만족하는 선별된 sgRNAs를 나타낸다. 도 2의 C는 sgRNA의 효능 및 그들의 2차 구조의 관계를 나타낸다. 주황색 박스들은 INDEL's 자유 에너지 기준을 만족하는 선별된 sgRNA를 나타낸다. 반면에 도 2의 B에서 처럼, 도 2의 D는 모든 sgRNAs의 sgRNA 스코어의 분포를 나타내고, 도2의 E-H는 lincRNA 녹아웃에 대한 CRISPR/Cas9-기반 삭제 전략를 나타낸다. 전체 lincRNA 로커스의 삭제(도 2의 E), 및 sgRNAs의 짝을 이용한 부분적 삭제를 나타낸다: 프로모터 영역의 삭제(도 2의 F), 보존된 엘리먼트를 포함하는 엑손의 삭제(도 2의 G) 및 Rfam 모티프를 포함하는 엑손의 삭제(도 2의 H).
도 3은 짝지어진 Cas9 뉴클레아제-매개의 인간 lincRNA 유전자 en bloc 삭제를 나타낸다. 보다 구체적으로 짝지어진 Cas9 뉴클레아제-매개의 XIST 및 RP11-307P5.1 en bloc 삭제를 나타낸다. 도 3의 A는 인간 XIST 유전자 구조 및 타겟팅된 삭제 부위의 개략적인 묘사도를 나타낸다. 6개의 엑손을 나타내었다(E1-E6). 적색 화살표머리는 sgRNA 결합 부위(T2, T3, T15 및 T16)을 나타낸다. 30.9 kb의 타겟팅된 en bloc 삭제를 검정선과 적색 화살표 팁(T3 및 T15)로 나타내었다. F3 및 R6, 및 F1 및 R2는 각각 야생형 대립형질 및 타겟팅된 삭제를 갖는 대립형질을 위해 사용된 PCR 프라이머(보라색 화살표)를 나타낸다. 보라색 박스는 전사 인자 결합 부위(TFBSs)를 나타낸다. 도 3의 B는 각각의 sgRNA의 효율을 평가하기 위한 T7E1 분석 결과를 나타낸다. K562 세포를 Cas9 및 각각의 sgRNA(T2, T3, T15, T16)를 코딩하는 플라스미드로 형질감염 시킨 후 분석하였다. 돌연변이 빈도(indel[%])를 밴드 강도로부터 계산하였다. 더욱 효율적인 sgRNA를 빨간색으로 강조하였다. 형질감염되지 않은 세포를 대조군(Con)으로 사용하였다. 화살표 머리는 T7E1에 의해 절단된 DNA 밴드의 예상되는 위치를 나타낸다. M은 마커 레인(lane)을 나타낸다. 도 3의 C는 타겟팅된 삭제의 PCR 기반 검출을 나타낸다. 타겟팅된 삭제를 검출하기 위해 Cas9 및 sgRNA 짝(T3 및 T15)을 코딩하는 플라스미드로 형질감염된 K562 세포로부터 분리된 지놈 DNA를 PCR에 이용하였다. 화살표 머리는 타겟팅된 삭제를 함유하는 영역으로부터의 앰플리콘(amplicons)의 예상되는 위치를 나타낸다. 형질감염되지 않은 세포를 대조군(Con)으로서 이용하였다. 프라이머 및 sgRNA 짝을 좌측 및 우측 상에 각각 나타내었다. 도 3의 D는 단일-세포 유래의 클론에서의 타겟팅된 삭제의 PCR 기반평가를 나타낸다. Cas9 및 sgRNA를 코딩하는 플라스미드로 형질감염된 K562 세포 집단으로부터 유래된 개별 클론으로부터 분리한 지놈 DNA를 이용하여 PCR을 수행하였다. 상단의 수는 개별 클론 이름들을 나타낸다. M은 마커 레인이다. 도 3의 E는 전체 XIST 삭제를 함유하는 클론의 확인 결과를 나타낸다. 야생형 및 삭제된 대립형질을 다른 프라이머 쌍을 이용하여 PCR을 통해 검출하였다. 화살표머리는 앰플리콘의 예상되는 위치를 나타낸다. 도 3의 F는 XIST 야생형(WT) 대립형질 및 전체 XIST 유전자의 삭제를 함유하는 대립형질의 DNA 서열을 나타낸다. Cas9 인식 부위를 적색으로 나타내었고, PAM(protospacer adjacent motif) 서열을 굵은 글씨로 나타내었다. 점선은 삭제된 염기들을 나타낸다. 발생된 경우의 수를 첫 번째 괄호 안에 나타내었다(예를 들어, X9, X6, X4 및 X2는 각각의 시퀀스가 얼마나 많이 관찰되었는지를 나타낸다). 절단 부위들은 적색 화살표로 나타내었다. 결과적인 큰 삭제(large deletion)의 시퀀스 길이를 두 번째 괄호에 나타내었다. Indel은 마지막 괄호에 나타내었다.
도 4는 Cas9-유발의 lincRNA 유전자의 부분적인 삭제를 나타낸다. 도 4의 A는 인간 XIST 유전자 구조 및 타겟팅된 부분적인 삭제(segmental deletion, SD) 부위의 개략적인 묘사를 나타낸다. 6개의 엑손은 나타내었다(E1-E6). 적색 화살표머리는 sgRNA 결합 부위(T1-T16)를 나타낸다. 타겟팅된 삭제 부위를 검정 선(SD1-SD6)를 이용하여 나타내었다. F1-7 및 R1-8은 야생형 대립형질 및 타겟팅된 삭제를 갖는 대립형질의 삭제를 위해 사용된 PCR 프라이머(보라색 화살표)를 나타낸다. 밝은 보라색 박스는 전사 인자 결합 부위(TFBSs)를 나타낸다. 도 7의 B는 각각의 sgRNA의 효율을 평가하기 위한 T7E1 분석 결과를 나타낸다. K562 세포를 Cas9 및 각각의 sgRNA(T2, T3, T15, T16)를 코딩하는 플라스미드로 형질감염 시킨 후 분석하였다. 돌연변이 빈도(indel[%])를 밴드 강도로부터 계산하였다. 더욱 효율적인 sgRNA를 빨간색으로 강조하였다. 형질감염되지 않은 세포를 대조군(Con)으로 사용하였다. 화살표 머리는 T7E1에 의해 절단된 DNA 밴드의 예상되는 위치를 나타낸다. M은 마커 레인(lane)을 나타낸다. 도 4의 C는 타겟팅된 삭제의 PCR 기반 검출을 나타낸다. 타겟팅된 삭제를 검출하기 위해 Cas9 및 sgRNA 짝을 코딩하는 플라스미드로 형질감염된 K562 세포로부터 분리된 지놈 DNA를 PCR에 이용하였다. 화살표 머리는 타겟팅된 삭제를 함유하는 영역으로부터의 앰플리콘(amplicons)의 예상되는 위치를 나타낸다. 형질감염되지 않은 세포를 대조군(Con)으로서 이용하였다. 프라이머 및 sgRNA 짝을 좌측 및 우측 상에 각각 나타내었다. 도 4의 D는 단일-세포 유래의 클론에서의 타겟팅된 삭제의 PCR 기반평가를 나타낸다. Cas9 및 sgRNA를 코딩하는 플라스미드로 형질감염된 K562 세포 집단으로부터 유래된 개별 클론으로부터 분리한 지놈 DNA를 이용하여 PCR을 수행하였다. 화살표 머리들은 타겟팅된 삭제를 함유하는 영역으로부터의 앰플리콘의 예상되는 위치를 가리킨다. 상단의 수는 개별 클론 이름들을 나타낸다. M은 마커 레인이다. 도 4의 E는 XIST 및 RP11-307P5.1 유전자의 부분적 및 전체(SD 및 WD) 삭제를 함유하는 클론의 빈도들을 나타낸다. 도 4의 F는 야생형 대립형질 또한 없는 XIST 및 RP11-307P5.1 유전자의 부분적 및 전체(SD 및 WD) 삭제를 함유하는 클론의 빈도를 나타낸다.
도 5는 XIST 엑손 2 및 엑손 3에서의 Cas9-유발의 부분적 삭제를 나타낸다. 도 4의 A는 XIST 엑손 2 및 3의 Cas9-매개의 삭제의 개략적인 묘사를 나타낸다. 타겟팅된 절단 부위를 빨간 화살표로 나타내었다. 고 효율의 sgRNA의 결합 부위(T5 및 T8)을 주황색 및 하늘색 사각형으로 나타내었다. F1, F2 및 R2로 표시한 보라색 화살표들은 야생형 대립형질 및 타겟팅된 삭제를 갖는 대립형질의 검출을 위해 이용된 PCR 프라이머를 나타낸다. 도 4의 b는 XIST 엑손 2 및 3을 함유하는 클론을 확인한 것이다. 야생형 및 삭제된 대립형질은 다른 프라이머 쌍을 이용하여 PCR을 통해 검출하였다. 화살표 머리는 앰플리콘의 예상되는 위치를 나타낸다. 도 4의 c는 타겟팅된 큰 삭제(large deletion)을 갖는 클론으로부터의 대표적인 시퀀싱 크로마토그램을 나타낸다. 도 4의 d는 XIST 야생형(WT) 대립형질 및 엑손 2 및 3 삭제를 갖는 대립형질의 DNA 시퀀스를 나타낸다. Cas9 인식 부위를 빨간색으로 나타내었고, PAM(protospacer adjacent motif) 시퀀스를 굵은 글씨로 나타내었다. 점선은 삭제된 염기들을 나타낸다. 발생된 경우의 수를 첫 번째 괄호 안에 나타내었다(예를 들어, X7, X8 및 X5는 각각의 시퀀스가 얼마나 많이 관찰되었는지를 나타낸다). 절단 부위들은 화살표 머리로 나타내었다. 결과적인 큰 삭제(large deletion)의 시퀀스 길이를 두 번째 괄호에 나타내었다. Indel은 마지막 괄호에 나타내었다.
도 6은 Cas9-매개의 XIST 유전자의 삭제가 유전자의 기능적 소실을 야기함을 나타낸다. 도 6의 A 내지 G는 부모 세포(A; 대조군) 및 Cas9 뉴클레아제-유발의 전체(D) 또는 부분적 XIST 삭제(B, C, E 내지 G)를 갖는 클론에서의, XIST(분홍) 및 NEAT1(녹색)의 RNA 형광 in situ 하이브리드화 실험 결과를 나타낸다.
도 7은 RP11-307P5.1의 Cas9-유발의 en bloc 삭제를 나타낸다. 도 7의 A는 RP11-307P5.1(293.8 kb)의 Cas9-매개의 en bloc 삭제의 개략적인 묘사를 나타낸다. 타겟팅된 절단 부위를 적색 화살표로 나타내었다. 고 효율의 sgRNA의 결합 부위(T2 및 T6)는 주황색 및 하늘색 사각형으로 나타내었다. F1, F3 및 R4로 표시된 검정 화살표는 야생형 대립형질 및 타겟팅된 삭제를 갖는 대립형질의 검출을 위해 이용된 PCR 프라이머를 나타낸다. 도 7의 B는 각각의 sgRNA의 효율을 측정하기 위한 T7E1 분석을 나타낸다. Cas9 및 각각의 sgRNA(T1, T2, T5 및 T6)를 코딩하는 플라스미드로 형질감염시킨 후에 K562 세포를 분석하였다. 더욱 효율적인 sgRNA를 빨간색으로 강조하였다. 화살표 머리는 T7E1에 의해 절단된 DNA 밴드의 예상되는 위치를 나타낸다. M은 마커 레인(lane)을 나타낸다. 도 7의 C는 타겟팅된 삭제의 PCR-기반 검출을 나타낸다. Cas9 및 적절한 sgRNA 쌍(T2 및 T6)를 코딩하는 플라스미드로 형질감염된 K562 세포로부터 분리된 지놈 DNA를 F1 및 R4를 프라이머 쌍으로 이용하는 PCR에 이용하였다. 형질감염되지 않은 세포를 대조군(Con)으로 이용하였다. 화살표머리는 앰플리콘의 예상되는 위치를 나타낸다. 도 7의 D는 큰 삭제(large deletion)의 PCR-기반 평가를 나타낸다. Cas9 및 sgRNA를 코딩하는 플라스미드로 형질감염된 K562 세포로부터 유래된 클론으로부터 분리한 지놈 DNA를 이용하여 PCR을 수행하였다. 도 7의 E는 전체 RP11-307P5.1 삭제를 함유하는 클론을 확인한 것을 나타낸다. 야생형 및 삭제된 대립형질을 다른 프라이머 쌍을 이용하여 PCR로 검출하였다. 화살표 머리는 앰플리콘의 예상되는 위치를 나타낸다. 도 7의 F는 RP11-307P5.1 야생형(WT) 대립형질 및 전체 RP11-307P5.1가 삭제된 대립형질의 DNA 시퀀스를 나타낸다. Cas9 인식 부위를 빨간색으로 나타내었고, PAM(protospacer adjacent motif) 시퀀스를 굵은 글씨로 나타내었다. 점선은 삭제된 염기들을 나타낸다. 발생된 경우의 수를 첫 번째 괄호 안에 나타내었다. 절단 부위들은 화살표 머리로 나타내었다. 결과적인 큰 삭제(large deletion)의 시퀀스 길이를 두 번째 괄호에 나타내었다. Indel은 마지막 괄호에 나타내었다.
도 8은 lincRNA의 수정된 카탈로그를 나타낸다. 도 8의 a는 마우스 lincRNA 유전자의 주석(annotation)을 수정하기 위한 개략적인 플로우를 나타낸다. 도 8의 b는 1292 수정된 마우스 lincRNA 유전자의 누적 길이 분포를 나타낸다. 6883 bp는 50번째 퍼센트를 나타낸다; 유전자의 99.7%가 500 kb보다 작다. 도 8의 c는 k 엑손 및 k-1 인트론을 포함하는 마우스 lincRNA 유전자의 길이 분포를 나타낸다. 그밖에 자세한 것은 도 1c와 같다. 도 8의 d는 마우스 lincRNA에서의 보존된 영역의 길이를 보여주는 박스 플롯을 나타낸다. 길이 중앙값(median length)은 71 bp였다. 도 8의 e는 클러스터된 인간 lincRNA의 발현 힛맵(heatmap)을 나타낸다. 도 8의 f는 클러스터된 마우스 lincRNA의 발현 힛맵을 나타낸다. 도 8의 g는 업데이트된 TSS 및 CPS를 갖는 수정된 CTD-2201E18.3 유전자 구조를 나타낸다. 보라색 박스는 전사 인자 결합 부위(transcription factor binding sites, TFBSs)를 나타낸다.
도 9는 마우스 lincRNA를 타겟팅하는 sgRNA의 자유 에너지 및 GC 함량을 나타낸다. 도 9의 a는 마우스 lincRNA 유전자를 타겟팅하는 sgRNA의 셰넌 엔트로피 분포를 나타낸다. 그 밖에 자세한 사항은 도 2의 b에서와 같다. 도 9의 b는 sgRNA의 자유 에너지의 분포를 나타낸다. 그 밖에 자세한 사항은 도 2c에서와 같다. 도 9의 c는 마우스 INDEL 스코어의 분포를 나타낸다. 도 9의 d는 1841 CDS-타겟팅 sgRNA에 대한 INDEL 스코어(파란 원) 및 sgRNA 스코어(빨간 사각형)의 ROS(receiver operating characteristic) 커브를 나타낸다. 도 9의 e는 2449 rDNA-타겟팅 sgRNA에 대한 ROC 커브를 나타낸다. 그 밖에 자세한 사항은 도 9의 d에서와 같다.
도 10은 XIST RNA의 보존된 역할을 나타낸다. 도 10의 a는 XIST RNA-유도의 X 염색체 불활성화의 개략도를 나타낸다. X 염색체 상의 XIST 유전자로부터 전사된 RNA는 퍼져 있고, X 염색체 헤테로크로마틱 형성 및 사일런싱을 이끄는 XIST RNA 클라우드를 형성한다. 도 10의 b는 인간 XIST 및 마우스 Xist 엑손의 시퀀스 보존을 나타낸다. 엑손 및 인트론으로부터의 시퀀스들은 UCSC 지놈 브라우저로부터 다운로드 하였다; 마우스 엑손을 인간 엑손 및 인드론에 대해 NCBI로부터의 BLAST2를 이용하여 얼라인하였다. 괄호 안의 수들은 가장 긴 쿼리 커버리지를 갖는 블록의 시퀀스 동일성을 나타낸다.
도 11은 cas9 뉴클레아제 및 sgRNA를 코딩하는 플라스미드의 벡터 맵을 나타낸다. Cas9-2A-mRFP-2A-Puro(도 10의 a) 및 pRG2-sgRNA(도 10의 b)를 나타내었다. sgRNA(Single guide RNA)는 U6 프로모터(pU6)에 의해 전사된다. hSpCas9(스트렙토코커스 피오제네스(Streptococcus pyogenes)로부터 유래된 인간 코돈-최적화된 Cas9 뉴클레아제)는 CMV 프로모터에 의해 발현된다; E2A는 ERAV(equine rhinitis A virus) 2A; mRFP는 단량체 적색 형광단백질(monomeric red fluorescent protein); T2A는 토시아 아시그나 바이러스(Thosea asigna virus) 2A; Puro는 퓨로마이신 저항성 유전자(Puromycin resistance gene)이다. 암피실린 저항성 유전자(The ampicillin resistance gene, Amp)는 형질전환된 박테리아 세포의 선별을 가능케 한다.
도 12는 Cas9 뉴클레아제를 코딩하는 플라스미드로부터의 mRFP의 발현을 나타낸다. K562 세포의 Cas9-2A-mRFP-2A-Puro 및 pRG2-CT 플라스미드의 공동-형질감염 1일 후의 형광 현미경 분석을 나타낸다. 스케일 막대는 100 μm이다.
도 13은 XIST를 타겟팅하는 16개의 sgRNA 중 무작위로 선별한 12개의 sgRNA의 예측된 sgRNA 스코어 및 관찰된 indel 비율의 관계를 나타낸다.
도 14의 상단 좌측 패널은 인간 XIST 유전자 구조 및 타겟팅된 부분적 삭제(SD1; Cas9-매개의 XIST 엑손 1의 삭제) 부위의 개략도를 보여준다. sgRNA 결합 부위를 적색 화살표로 나타내었다. 타겟팅된 부분적인 삭제를 화살표 팁을 갖는 검정 선으로 나타내었다. 보라색 화살표는 야생형 대립형질 및 타겟팅된 삭제를 갖는 대립형질의 검출을 위해 이용된 PCR 프라이머를 나타낸다. 도 14의 상단 우측 패널은 XIST의 야생형(WT) 대립형질 및 부분적인 삭제(SD1)를 갖는 대립형질의 DNA 시퀀스를 나타낸다. Cas9 인식 부위를 적색으로 나타내었고, PAM(protospacer adjacent motif) 시퀀스를 굵은 글자로 나타내었다. 점선은 삭제된 염기들을 가리킨다. 발생된 경우의 수를 첫 번째 괄호 안에 나타내었다. 절단 부위들은 화살표 머리로 나타내었다. 결과적인 큰 삭제(large deletion)의 시퀀스 길이를 두 번째 괄호에 나타내었다. Indel은 마지막 괄호에 나타내었다.
도 15의 상단 좌측 패널은 인간 XIST 유전자 구조 및 타겟팅된 부분적 삭제(SD3; Cas9-매개의 XIST 엑손 1, 2, 및 3의 삭제) 부위의 개략도를 보여준다. sgRNA 결합 부위를 적색 화살표로 나타내었다. 타겟팅된 부분적인 삭제를 화살표 팁을 갖는 검정 선으로 나타내었다. 보라색 화살표는 야생형 대립형질 및 타겟팅된 삭제를 갖는 대립형질의 검출을 위해 이용된 PCR 프라이머를 나타낸다. 도 15의 상단 우측 패널은 XIST의 야생형(WT) 대립형질 및 부분적인 삭제(SD3)를 갖는 대립형질의 DNA 시퀀스를 나타낸다. Cas9 인식 부위를 적색으로 나타내었고, PAM(protospacer adjacent motif) 시퀀스를 굵은 글자로 나타내었다. 점선은 삭제된 염기들을 가리킨다. 발생된 경우의 수를 첫 번째 괄호 안에 나타내었다. 절단 부위들은 화살표 머리로 나타내었다. 결과적인 큰 삭제(large deletion)의 시퀀스 길이를 두 번째 괄호에 나타내었다. Indel은 마지막 괄호에 나타내었다.
도 16의 상단 좌측 패널은 인간 XIST 유전자 구조 및 타겟팅된 부분적 삭제(SD4; Cas9-매개의 XIST 엑손 4, 5, 및 6의 삭제) 부위의 개략도를 보여준다. sgRNA 결합 부위를 적색 화살표로 나타내었다. 타겟팅된 부분적인 삭제를 화살표 팁을 갖는 검정 선으로 나타내었다. 보라색 화살표는 야생형 대립형질 및 타겟팅된 삭제를 갖는 대립형질의 검출을 위해 이용된 PCR 프라이머를 나타낸다. 도 16의 상단 우측 패널은 XIST의 야생형(WT) 대립형질 및 부분적인 삭제(SD4)를 갖는 대립형질의 DNA 시퀀스를 나타낸다. Cas9 인식 부위를 적색으로 나타내었고, PAM(protospacer adjacent motif) 시퀀스를 굵은 글자로 나타내었다. 점선은 삭제된 염기들을 가리킨다. 발생된 경우의 수를 첫 번째 괄호 안에 나타내었다. 절단 부위들은 화살표 머리로 나타내었다. 결과적인 큰 삭제(large deletion)의 시퀀스 길이를 두 번째 괄호에 나타내었다. Indel은 마지막 괄호에 나타내었다.
도 17의 상단 좌측 패널은 인간 XIST 유전자 구조 및 타겟팅된 부분적 삭제(SD5; Cas9-매개의 XIST 프로모터의 삭제) 부위의 개략도를 보여준다. sgRNA 결합 부위를 적색 화살표로 나타내었다. 타겟팅된 부분적인 삭제를 화살표 팁을 갖는 검정 선으로 나타내었다. 보라색 화살표는 야생형 대립형질 및 타겟팅된 삭제를 갖는 대립형질의 검출을 위해 이용된 PCR 프라이머를 나타낸다. 도 17의 상단 우측 패널은 XIST의 야생형(WT) 대립형질 및 부분적인 삭제(SD5)를 갖는 대립형질의 DNA 시퀀스를 나타낸다. Cas9 인식 부위를 적색으로 나타내었고, PAM(protospacer adjacent motif) 시퀀스를 굵은 글자로 나타내었다. 점선은 삭제된 염기들을 가리킨다. 발생된 경우의 수를 첫 번째 괄호 안에 나타내었다. 절단 부위들은 화살표 머리로 나타내었다. 결과적인 큰 삭제(large deletion)의 시퀀스 길이를 두 번째 괄호에 나타내었다. Indel은 마지막 괄호에 나타내었다.
도 18의 상단 좌측 패널은 인간 XIST 유전자 구조 및 타겟팅된 부분적 삭제(SD6; Cas9-매개의 XIST 엑손 5의 삭제) 부위의 개략도를 보여준다. sgRNA 결합 부위를 적색 화살표로 나타내었다. 타겟팅된 부분적인 삭제를 화살표 팁을 갖는 검정 선으로 나타내었다. 보라색 화살표는 야생형 대립형질 및 타겟팅된 삭제를 갖는 대립형질의 검출을 위해 이용된 PCR 프라이머를 나타낸다. 도 18의 상단 우측 패널은 XIST의 야생형(WT) 대립형질 및 부분적인 삭제(SD6)를 갖는 대립형질의 DNA 시퀀스를 나타낸다. Cas9 인식 부위를 적색으로 나타내었고, PAM(protospacer adjacent motif) 시퀀스를 굵은 글자로 나타내었다. 점선은 삭제된 염기들을 가리킨다. 발생된 경우의 수를 첫 번째 괄호 안에 나타내었다. 절단 부위들은 화살표 머리로 나타내었다. 결과적인 큰 삭제(large deletion)의 시퀀스 길이를 두 번째 괄호에 나타내었다. Indel은 마지막 괄호에 나타내었다.
도 19는 RP11-307P5.1의 보존된 영역에서의 Cas9-유도의 삭제를 나타낸다. 도 19의 a는 RP11-307P5.1의 보존된 영역(98.8 kb)의 Cas9-매개의 삭제의 개략도이다. 타겟팅된 절단 부위를 적색 화살표로 나타내었다. 고 효율의 sgRNA의 결합 부위(T4 및 T6)는 주황색 및 하늘색 사각형으로 나타내었다. F2, F3 및 R4로 표시된 검정 화살표는 야생형 대립형질 및 타겟팅된 삭제를 갖는 대립형질의 검출을 위해 이용된 PCR 프라이머를 나타낸다. 도 19의 b는 각각의 sgRNA의 효율을 측정하기 위한 T7E1 분석을 나타낸다. Cas9 및 각각의 sgRNA(T3, T4, T5 및 T6)를 코딩하는 플라스미드로 형질감염시킨 후에 K562 세포를 분석하였다. 돌연변이 빈도(indel[%])를 밴드 강도로부터 계산하였다. 형질감염되지 않은 세포를 대조군(Con)으로 사용하였다. 화살표 머리는 T7E1에 의해 절단된 DNA 밴드의 예상되는 위치를 나타낸다. M은 마커 레인을 나타낸다. 도 19의 c는 타겟팅된 삭제의 PCR-기반 검출을 나타낸다. Cas9 및 적절한 sgRNA 쌍(T4 및 T6)를 코딩하는 플라스미드로 형질감염된 K562 세포로부터 분리된 지놈 DNA를 F2 및 R4를 프라이머 쌍으로 이용하는 PCR에 이용하였다. 형질감염되지 않은 세포를 대조군(Con)으로 이용하였다. 화살표머리는 앰플리콘의 예상되는 위치를 나타낸다. 도 19의 d는 큰 삭제(large deletion)의 PCR-기반 평가를 나타낸다. Cas9 및 sgRNA를 코딩하는 플라스미드로 형질감염된 K562 세포로부터 유래된 클론으로부터 분리한 지놈 DNA를 이용하여 PCR을 수행하였다. 도 19의 e는 RP11-307P5.1 보존된 영역의 삭제를 함유하는 클론을 확인한 것을 나타낸다. 그 밖에, 자세한 사항은 도 14에서와 같다. 도 19의 f는 RP11-307P5.1 야생형(WT) 대립형질 및 보존된 영역이 삭제된 대립형질의 DNA 시퀀스를 나타낸다. 그 밖에, 자세한 사항은 도 14에서와 같다.
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로, 본 발명의 요지에 따라 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 당업계에서 통상의 지식을 가진 자에 있어서 자명할 것이다.
실시예
실시예 1: 수정된 lincRNA 카탈로그의 구축
GENCODE 주석(annotation)(hg19: 버전 19, mm9: 버전 M1)으로부터 추측되거나 알려진 모든 lncRNA를 주요 CPS(major cleavage an polyadenylation sites)로 업데이트하였고, 많은 다른 세포-유형(인간에 대한 HeLa, HEK293, Huh7 및 IMR90 세포; 마우스에 대한 mES 및 3T3 세포, 및 간, 근육, 심장, 백색 지방, 및 신장 조직)을 교차하는 시퀀싱(3P-seq) 데이터(Nam et al. 2014)에 의한 폴리(A) 포지션 프로파일링으로부터 검출하였으며, NCBI 유전자 발현 옴니버스(GEO)(accession number: GSE52531)로부터 다운로드 하였다. 또한 lncRNA를 우성 전사 시작 부위(TSS)로 업데이트 하였다. FANTOM 프로젝트 내의 17 조직의 deepCAGE 데이터로부터 검출하였다. RSS 및 CPS 모두에서 업데이트된 추정상의 lncRNA 및 알려진 lncRNA(TSS 및 CPS 업데이트에 관하여)를 다음 단계에 이용하였다. 200 nt보다 길고 알려진 단백질-코딩 유전자 및 비-코딩 유전자(miRNA, snRNA, snoRNA, 및 구조 ncRNA 유전자)의 엑손과 겹치지 않는 RNA들은 다음 필터링 단계에 이용하였다(참조: 도 1a 및 도 8a). CPC(coding potential calculation) 스코어가 -0.3 이하인 인간 및 -0.2 이하인 마우스 RNA, 및 번역 효율(translation efficiency, TE)이 -5.0 이하인 인간 및 -3.7 이하인 마우스(Ingolia et al. 2009)의 로그 베이스 2를 수정된 lincRNA 카탈로그로서 보존하였다.
실시예 2: lincRNA의 발현 프로파일링
30 인간 세포 유형 및 53 마우스 세포 유형 및 프라이머리 조직을 커버하는ENCODE() 및 NCBI GEO( RNA-seq 데이터로 발현을 프로파일링하였다. RNA-seq 라이브러리를 준비하였고, 여러 실험실(인간에 대하여 California Institute of Technology (Caltech), Cold Spring Harbar Laboratory (CSHL), Genome Institute of Singapore (GIS), 및 HudsonAlpha Institute for Biotechnology (HudsonAlpha), 및 마우스에 대하여 Caltech, CSHL, Ludwig Institute for Cancer Research (LICR) and University of Washington (UW))로부터 시퀀싱하였다. 또한 HeLa, HEK293, Huh7(GSE52530), K-562(GSE47998 및 GSE34740) 및 hESC-H1(GSE51861)의 추가적인 RNA-seq 데이터를 NCBI GEO로부터 편집(compile)하였다. 읽어들인 것들을 레퍼런스 지놈들(인간에 대한 hg19(2009, 2) 및 마우스에 대한 mm9(2007, 7))에 대하여, 인간에 대한 "--segment-length 50 -g 1 -i 61 -l 265006 --min-segment-intron 61 --max-segment-intron 265006" 및 마우스에 대한 "--segment-length 50 -g 1 -i 52 -l 240764 --min-segment-intron 52 --max-segment-intron 240764" 맵핑 파라미터를 갖는 Tophat(버전 2.0.6)을 이용하여 정렬시켰다. 발현 지표(expression metrics)로서, RPM(reads per million mapped reads)을 인-하우스 파이톤 스트립트(in-house python script)를 이용하여 계산하였다.
실시예 3: lincRNA의 발현 클러스터
멤버들의 발현 시그니쳐(expression signature)가 유사한 발현 클러스터를 찾기 위해, 여러 샘플을 통해 lincRNA의 RPM을 비교하였다. lincRNA의 여러 아이소폼(isoform)에 대하여, 최상의 RPM을 갖는 하나를 클러스터링 분석하였다. lincRNA의 RPM을 표준화시켰고, 공개 클러스터링 프로그램인, 2014년 2월 16일자로 배포된 Expander 버전 6.3.1(Ulitsky et al. 2010)에 적용된 CLICK 알고리즘(Sharan 및 Shamir 2000)에 의해 클러스터링하였다.
실시예 4: lincRNA의 보존 도메인의 확립
각각의 lincRNA에 대하여, 보존 시그널을 UCSC 지놈 브라우저(Karolchik et al. 2014)로부터 탐색하였다. 99 척추동물의 다중 지놈 얼라인먼트(Margulies ey al. 2003)에 대하여 base-wise conservation 스코어를 phyloP(phylogenetic P-values)에 의해 사전-계산하였다. 보존 영역을 평균 보존 스코어가 각각 0.3, 0.5 또는 0.7 이상인 윈도우(window)로서 정의하였다. 최초 윈도우 사이즈는 50 bp로 세팅하였다. 그런 뒤, 윈도우를 평균 보존 스코어가 미리정한 값(0.3, 0.5 또는 0.7) 이하가 될 때까지 25 bp씩 확장시켰다.
실시예 5: gRNA의 효율에 영향을 주는 인자의 발굴
2449개의 rDNA-타겟팅 sgRNA(Wang et al. 2014) 및 1841개의 CDS-타겟팅 sgRNA의 효율을 사전 계산하고 퍼센트 순위에 의해 각각 순위를 매겼다. 가이드 시퀀스의 불확정성(uncertainty)은 퍼센트 순위와 연관되어 있었다. 시퀀스의 불확정성을 섀넌 엔트로피(shannon entropy)(Schneider 1997)에 의해 측정하였고, p i Xlog2 p i 의 합(sum)에 의해 계산하였으며, p i 는 각각의 i=[A 또는 T, G 또는 C]의 확률이다. 최대 엔트로피 1.0은 G/C 비율이 0.5인 것에 상응한다. sgRNA의 퍼센트 순위 및 엔트로피는 연관된다. 모든 시험한 가이드 시퀀스(또는 타겟 부위)의 2차 구조는 RNAfold(Hofacker 2003) 프로그램을 이용한 자유 에너지 값(free energy values)으로서 예측하였다. sgRNA의 sgRNA 스코어는 공개 프로그램(Doench et al. 2014)을 이용하여 계산하였다.
실시예 6: 오프-타겟 분석
sgRNA의 추측상의 오프-타겟을 찾기 위해, 모든 후보 가이드 시퀀스를, Bowtie 버전 1.0.0(Langmead et al. 2009)(with allowing mismatches)을 이용하여 레퍼런스 지놈에 대하여 맵핑한 뒤, 맵핑된 부위가 추정상의 오프-타겟인지 다음의 기준에 기초하여 시험하였다: 1) 오프-타겟 부위는 PAM(NGG)을 가져야 하고, 2) 오프-타겟에 대한 최대 미스매치가 3이며, 3) 미스매치가 4 이상이고, 6이하라면, 오프-타겟은 시드 영역(seed region)(gRNA의 3' 말단으로부터 10 bp) 내에 최대 1개의 미스매치를 갖는 것이 허용된다. 또한 공개된 오프-타겟 예측 프로그램을 이용하는 INDEL(Hsu et al. 2013)에서 선택된 모든 sgRNA의 오프-타겟 후보에 대하여 탐색하였다.
실시예 7: XIST 녹아웃 세포 및 부모 세포에서의 RNA-seq 데이터의 처리
XIST 녹아웃 및 부모 세포로부터 선택된 RNA를 Truseq stranded mRNA prep kit(Illumina)를 이용하여 구축하였고, RNA-seq을 하였다. RNA-seq reads를 인간 레퍼런스 지놈(hg19)에 대해 유니크-맵핑 파라미터 "-m 1"를 갖는 Bowtie 버전 1.0.0을 이용하여 맵핑하였다. 부모 및 녹아웃 세포 사이의 유전자의 발현 변화를 시험하기 위해(GENCODE 주석 버전 19에 기초하여), 각각의 유전자에 대한 RPM의 로그 베이스 2를 계산하였다.
실시예 8: Cas9 및 sgRNA를 코딩하는 플라스미드
CMV 프로모터-Cas9-2A-mRFP-2A-Puro 플라스미드(이하 "Cas9-Pure 벡터"라 함) 및 hU6-sgRNA 플라스미드를 각각 이용하여 Cas9 및 sgRNA를 발현시켰다. Cas9-Puro 및 hU6-sgRNA 플라스미드를 Toolgen사로부터 구입하였고, 상기 벡터들의 전체 시퀀스는 하기에 기술하였고, 벡터 맵은 도 11에 나타내었다. 각각의 타겟 시퀀스를 포함하는 올리고뉴클레오티드를 합성하였고(Bioneer), athermocycler를 이용하여 in vitro에서 어닐링하였다. sgRNA-코딩 벡터(pRG2-CT)를 Toolgen사로부터 구입하였고, Bsal로 절단(digestion)하였으며, 어닐링된 올리고뉴클레오티드로 라이게이션시켰다.
실시예 9: 세포 배양
K562(human erythromyeloblastoid leukemia cell line)를 American Type Culture Collection사로부터 구입하였고, 100 unit/mL 페니실린, 100 μg/mL 스트렙토마이신 및 10% 소 태아 혈청 보충된 Roswell Park Memorial Institute medium(RPMI; Invitrogen)에서 배양하였다.
실시예 10: 형질 감염
세포를 Cas9-Puro, sgRNA의 한 멤버를 코딩하는 U6-sgRNA, 및 sgRNA의 다른 멤버를 코딩하는 U6-sgRNA의 플라스미드 혼합물로 1:1:1의 중량비로 Neon(Invitrogen)을 이용하여 제조자의 지침에 따라 형질감염시켰다. 형질감염 하루 후, 퓨로마이신(Cat no. A11138-03, Invotrogen)를 배양 배지에 최종 농도가 2.5 μg/mL가 되도록 2일 동안 추가하였다. 형질감염 3일 후, 세포를 분석하였다.
실시예 11: T7E1 분석
T7E1 분석을 종래 기술된 대로 수행하였다(Kim et al. 2009; Kim et al. 2014). 요컨대, Wizard Genomic DNA purification Kit(Promega)를 이용하여 제조자의 지침에 따라 지놈 DNA를 분리하였다. 뉴클레아제 타겟 부위를 포함하는 영역을 적절한 프라이머(참조: 보충 표 S6A, B, C)를 이용하여 nested PCR-증폭 시켰다. 앰플리콘을 가열에 의해 변성(denatured)시키고, 어닐링시켜 이형2중가닥 DNA를 형성시켰으며, 37℃에서 20분간 T7 엔도뉴클레아제 1(New England Biolabs)의 5 unit으로 처리한 뒤, 2% 아가로스 겔 전기영동을 이용하여 분석하였다. 돌연변이 빈도를 밴드 강도를 기반으로 종래 기술된 대로, Image J 소프트웨어 및 다음의 식(Guschin et al. 2010)을 이용하여 계산하였다: 돌연변이 빈도(%)=100×(1-(1-절단 분획)1/2), 상기에서 절단 분획(fraction cleaved)은 절단된 밴드 및 절단되지 않은 밴드의 상대적인 농도의 합으로 나눈 절단된 밴드의 총 상대 농도이다.
실시예 12: 클론 분석
형질 감염 하루 후, K562 세포를 2.5 μg/mL 퓨로마이신의 존재하에서 이틀간 배양하였다. 항생제 선택(antibiotic selection) 이틀 후, 세포들을 획득하였고, 0.25 세포/웰의 평균 농도로 96-웰 플레이트에 접종하였다. 세포 접종 8일 후, 각각의 웰을 현미경으로 평가하였고, 단일 세포-유도 라운드 콜로니를 선별하였다(Ramakrishna et al. 2014b). 각각의 선별된 콜로니를 개별적으로 수확하였고, 24-웰 플레이트로 재 접종하였다. 계대 배양 3일 후, 지놈 DNA를 각각의 클론으로부터 분리하여 T7E1 분석하였고, 시퀀싱하였다.
실시예 13: 시퀀싱 분석
타겟 시퀀스를 포함하는 지놈 영역의 시퀀싱를 종래 기술된 대로 수행하였다(Ramakrishna et al. 2014a). 요컨대, 삭제된 lincRNA 타겟 부위의 정션(junction) 영역을 포함하는 PCR 앰플리콘을 T-Blunt 벡터(Promega)로 클로닝하였고, PCR 증폭을 위해 이용된 프라이머들을 이용하여 시퀀싱하였다.
실시예 14: XIST mRNA의 RT-PCR
총 RNA를 TRIzol 시약(Invitrogen)을 이용하여 제조자의 지침에 따라 세포로부터 추출하였고, Oligo-dT 프라이머(Qiagen) 및 AccuPower RT PreMix(Bioneer)를 이용하여 제조자의 지침에 따라 역전사(reverse transcription)를 수행하였다. 합성된 cDNA를 프라이머 쌍(정방향: 5'-GAGCACCTGCCCCTACTTATT-3'(XIST 엑손1(야생형)) 및 정방향: 5'-GTGAGCATAGGCACTCACCTT-3'(XIST 엑손1(T4+T5 삭제 클론)); 역방향: 5'-TTTGGGTCACATGCTGTGTG-3'(XIST 엑손6)). PCR 앰플리콘을 0.8% 아가로스 겔 전기영동에 의해 분석하였다. PCR 앰플리콘을 DNA 정제 키트(iNtRON biotechnology)를 이용하여 정제하였고, pGEM-T 벡터(Promega) 내로 클로닝하였다. 클로닝한 플라스미드를 T7 프라이머(5'-TAATACGACTCACTATAGGG-3') 및 SP6 프라이머(5'-TCTATAGTGTCACCTAAAT-3')를 이용하여 모세관 시퀀싱하였다.
실시예 15: XIST RNA FISH
K562 부모 세포 및 XIST 녹아웃 세포를 현탁 배양시켰다. PBS로 세척 후, 150000 세포를, 18 mm 라운드 커버슬립으로 코팅된 Cell-Tak(BD Biosciences) 상에 RT에서 10분간 가라앉혔다. 세포들을 PBS에서 가볍게 헹구고, PBS 내의 4% 포름알데히드에서 10분간 고정시켰다. PBS로 2회 세척 후, 세포를 얼음에서 5분 간 0.5% Triton X-100/PBS에서 투과성있게 하였다. 세포를 PBS에서 세척 하고, 일련의 70%, 90%, 및 100% 에탄올을 통해 탈수(dehydrated)시켰다. 혼성화(각 커버슬립 당 50% 포름알데히드, 2X SSC, 10% 덱스트란 설페이트, 1 μg 인간 COT-1 DNA, 20 ng의 변성된(denatured) XIST 엑손1(ChrX:73066222-73071379, hg19) 및/또는 NEAT1 프로브)를 37℃에서 가습 챔버(humidified chamber) 내에서 밤새 수행하였다. 세포들을 2X SSC에서 3회 세척하였다. 핵을 Hoechst 33342(Life technology)로 카운터 염색하였다. 60×/1.4 N.A. VC 대물 렌즈, Orca ER 카메라(Hamamatsu) 및 Volocity 소프트웨어(Promega)를 장착한 Nikon 90i 현미경 상에서 이미지화를 수행하였다. 모든 프로브들은 DNA 중합효소Ⅰ(Promega), DNAseⅠ(Promega), Fluorescein-dUTP(eEnzyme) 또는 Cy3-dUTP(Enzo Life Sciences)를 이용하여 nick 번역에 의해 제조하였다.
실시예 16: 데이터 평가
본 발명의 데이터는 NCBI의 Gene Expression Omnibus(Edgar et al. 2002)에 기탁되었고, GEO Series 접근 번호 GSE65830 ()를 통해 접근 가능하다.
결과
1. 기능적 증거에 의한 lincRNA 카탈로그의 구축
인간 lncRNA의 지놈 와이드 RGEN-기반 녹아웃을 위한 sgRNA를 디자인하기 위해, 먼저 현재의 lncRNA 주석(annotation)을 수정하였다; GENCODE 컨소시엄(http://www.gencodegenes.org/)으로부터 추정되는 및 알려진 lncRNA를 다음의 계산적인 파이프라인을 이용하여 재 시험하였다(참조: 도 1a). 첫째, 모든 가능성있는 GENCODE 비-코딩전사체 주석(annotation)을 TSS 및 CPS 내에서 실험적으로 지지하는 정보로 업데이트 하였다(참조: 도 1a). TSS 및 CPS 모두에서 업데이트된 추정상의 lncRNA 및 알려진 lncRNA로 다음 단계를 수행하였다. 둘째, 200 nt보다 길이나 짧거나 또는 알려진 단백질-코딩 및 비-코딩 유전자들의 엑손들과 겹치는 전사체들을 제거하여 잠재적인 코딩 전사체들의 절편들을 제외시켰고, lincRNA(long intervening ncRNAs)를 남겼다. 상기 lincRNA의 각각에 대해, 코딩 포텐셜을 재-평가하였고, 시퀀싱된 RNA가 리보솜에 의해 보호된 실험에서(Ingolia et al. 2011) (1) 문서화된 비-중복 단백질 시퀀스를 통한 상동 검색(homolgy search)에 의해 계산된 CPC(coding potential calculation) 스코어가 -0.3보다 더 큰(Jia et al. 2010) 것과 (2) 번역 효율(translation efficiency, TE)을 나타내는 리보솜 결합률(ribosome association rate)이 0.03 보다 더 큰 것을 제거하였다. 상기 필터링을 통해, 녹아웃의 수정된 세트로서, 6334개의 로커스로부터 9203 bona fide lincRNA 유전자를 유지하였다(참조: 도 1a). 인간 lincRNA 유전자의 사이즈는 200 bp 내지 1.5 Mb 범위였고, 평균 길이는 5306 bp였다(참조: 도 1b). lincRNA의 대부분(87.25%)은 다중-엑손 구조를 가졌다(참조: 도 1c). 동일한 절차를 통해, 786개의 로커스로부터의 1292개의 수정된 lincRNA를 또한 마우스에서 주석하였다(참조: 도 8a). 마우스 lincRNA 유전자의 평균 길이는 6883 bp였고, 98.5%는 다중-엑손 구조를 가졌다(참조: 도 8b, c).
각 lincRNA의 기능적 증거를 활용하기 위해, ENCODE 및 NCBI GEO의 RNA-seq 데이터를 갖는 많은 다른 세포-유형으로부터 프로파일된 발현 사인들을 수집하여 정리하고자 하였다. 적어도 하나의 세포 유형에서 0.1 보다 더 큰 RPM(reads per million)을 갖는 4067개의 linc RNA들 중, 유사한 발현 사인을 갖는 것들은 CLICK 알고리즘(Sharan 및 Shamir 2000)을 이용하여 클러스터링하였다. 결과적으로 3759개의 lincRNA들을, 상기 lincRNA들이 인간의 기능적 산물이라는 것을 나타내는(참조: 도 8e) 각각의 특이적 발현 사인을 갖는 30개의 클러스터로 그룹화 하였다. 동일한 접근을 가지고, 마우스에서 587 lincRNA들을 10개의 클러스터로 그룹화하였다(참조: 도 8F). 이러한 세포-유형 특이적 발현은 cis-액팅 요소들 및 그들의 결합 파트너들, 유전자의 업스트림의 전사 인자(TF)에 의해 일부 분명하다. 예를 들어, 본래의(original) TSS의 다운스트림에서 새로운 TSS를 갖는 수정된 CTD-2201E18.3 유전자 모델은 TSS의 인접 업스트림의 TF 결합 부위(TFBSs)을 포함하였다(참조: 도 8g). 사실, lincRNA의 1744개의 수정된 특별한 TSSs는 그들의 업스트림에서 수-매칭된 수정되지 않은 TSSs 및 랜덤 부위에서 보다 더 많은 TFBSs를 포함한다(참조: 도 1d). lincRNAs가 박혀있는 짧은 보존된 요소들로 존재하므로(Nam and Bartel 2012; Ulitsky and Bartel 2013), 그들의 로커스 상에서 lincRNA의 보존 영역을 시험하였다. 결과적으로 수정된 lincRNA의 40.6%(인간에 대해) 및 41.7%(마우스에 대해)가, 0.5보다 더 큰 평균 보존 스코어를 갖는 적어도 하나의 보존된 요소에 삽입되어 있고, 보존된 요소의 평균 길이는 인간에서 대략 235 bp이고 마우스에서 184 bp이며(참조: 도 1e; 도 8d), 이는 곤충에서 관찰되는 것보다 더욱 길다(Nam and Bartel 2012). 대부분의 보존된 도메인은 대개 1 kb 이내이다(참조: 도 1e; 도 8d). 보존된 도메인과 같지 않게, 약간의 lincRNA는 엑손 상의 그들 스스로의 모티프에 더하여 다른 Rfam 모티프를 포함한다. 인간에 대한 오직 7개의 lincRNA 및 마우스에 대한 5개 만이 그들의 엑손들 상의 적어도 하나의 RNA 패밀리 모티프에 삽입되어 있다. 우리는 새롭게 INDEL(Integrated Design for LincRNA deletion)라 불리는 데이터베이스 시스템을 구축하였고, 보존된 요소, Rfam 모티프 및 TFBSs와 같은 lincRNA에 관한 구조적 및 기능적 정보를 컴파일하였으며, 이는 삭제를 위한 lincRNA의 기능적 부분을 찾도록 돕는다.
2. 효율적이고 선별적인 lincRNA 녹아웃을 위한 sgRNAs의 디자인
특이적 lincRNA의 기능의 상실은 en bloc 또는 유전자 인코딩 lincRNA의 단편적 삭제에 의해 유도될 수 있다(Marahrens et al. 1997; Ripoche et al. 1997; Clerc and Avner 1998; Meller and Rattner 2002; Sleutels et al. 2002; Anguera et al. 2011; Nakagawa et al. 2011; Senner et al. 2011; Eissmann et al. 2012; Nakagawa et al. 2012; Grote et al. 2013; Li et al. 2013; Liu et al. 2013; Sauvageau et al. 2013; Dimitrova et al. 2014). 상기 삭제는 개재서열(intervening sequence)의 삭제를 이끄는 두(two) 이중-가닥 단절을 유도하는 뉴클레아제의 쌍을 이용하여 획득할 수 있다. 타겟 로커스의 지놈-와이드 녹아웃을 위한 sgRNA를 디자인하기 위해, PAM(protospacer adjacent motif)(NGG) 및 상기 PAMs에 인접한 지역을 갖는 모든 후보 sgRNA 타겟 부위을 lincRNA 로커스 상에서 최초로 확립하였다(참조: 도 2a). 효율적이고 특이적인 삭제를 위해, 각각의 sgRNA 쌍의 멤버는 두 특성이 요구된다: 높은 효율성 및 특이성. 높은 효율성을 갖는 sgRNA를 선별하기 위해, 두 독립적인 연구(Doench et al. 2014; Wang et al. 2014)로부터 사전-컴파일된 공개 데이터를 재-분석함으로써 sgRNAs의 예측 효능에서의 주요 특징을 조사하였다. 첫째, 핵산 염기가 매우 불확정한, 높은 섀넌 엔트로피(Schneider 1997)를 갖는 가이드 시퀀스(타겟 시퀀스와 같은)는 양 데이터에서 타겟팅에 더욱 효율적인 경향이 있다(참조: 도 2b). 타겟 부위의 2차 구조가 RNAi의 효율성에 영향을 주기 때문에(Amarzguioui and Prydz 2004; Reynolds et al. 2004), sgRNA의 타겟 부위의 열역학적 안정성 또한 효율성과 연결지어 시험하였다. 결과적으로 가장 불안정한 구조를 형성하는 부위가, 가장 안정한 2차 구조를 형성하는 것보다 약 3배 더 효율적인 이중-가닥 단절을 만들었다(참조: 도 2c). 추가적으로 sgRNAs의 효율을 예측하는 sgRNA 스코어는 최근 공개된 방법(Doench et al. 2014)을 이용하여 사전 계산하였다. 관찰에 근거하여, 높은 효율을 갖는 sgRNA를 선별하는 경험적 접근(heuristic approach)를 개발하였고, 다음의 기준을 만족한다: 섀넌 엔트로피는 0.7 이상이고, 자유 에너지는 -6 kcal/mol 이상이며, 평균 퍼센트는 극적으로 증가하고, sgRNA 스코어는 0.2 이상인 것이 선택된다(참조: 도 2a-d, 도 9a-c).
다음으로 지놈-와이드 얼라인먼트 및 공개된 오프-타겟 예측 프로그램(Hsu et al, 2013)을 이용하는 sgRNAs의 오프 타겟 효과를 시험하였다. INDEL 시스템은 lincRNAs의 구조적 및 기능적 주석에 더하여, 선별된 sgRNA 타겟 부위(SgRNAs) 및 그들의 연결된 정보를 통합하고, 전체 로커스(참조: 도 2e) 또는 TFBSs(참조: 도 2f), 보존 영역(참조: 도 2g), 및 Rfam 모티프(참조: 도 2h)와 같은 lincRNA의 단편 영역을 삭제하는 sgRNA의 쌍을 디자인하는 것을 도왔다. 상기 시스템을 이용하여, 각각이 최소의 오프-타겟 수 및 최고의 sgRNA 스코어를 갖는 sgRNA 쌍을 디자인하였고, 인간 및 마우스 lincRNA 유전자 전체를 삭제하였다.
또한 XIST 유전자에 대한 6개의 다른 부분들을 삭제하고자 하였다: 엑손 1의 일부 및 3' 스플라이싱 부위(SD1)를 포함하는 부분, 엑손 2 및 3을 포함하는 부분(SD2), SD1 및 SD2를 포함하는 부분(SD3), 엑손 4, 5, 및 6을 포함하는 부분(SD4), 프로모터를 포함하는 부분(SD5), 및 엑손 5의 3' 스플라이스 부위를 포함하는 부분(SD6)(참조: 도 4A). 추가적으로 RP11-3075.1의 부분(~98.9 kb)의 삭제를 위한 sgRNA 짝을 설계하였다(참조: 도 19A). 완전한 삭제를 위하여 기술된 절차를 이용하였고, 높은 돌연변이 빈도의 결과를 보이는 sgRNA 짝을 선별하였다(참조: 도 4B 및 도 19B).
3. 인간 세포 내의 lincRNA-인코딩 유전자 XIST 의 효율적인 녹아웃
XIST 유전자는, X 염색체 불활성화(X chromosome inactivation, XCI)의 선두 조절자(master regulator)인 추정상의 19 kb 스플라이싱되고 폴리아데닐화된 lincRNA를 코딩한다(참조: 도 10a)(Borsani et al. 1991; Brockdorff et al. 1992; Brown et al. 1992; Minkovsky et al. 2012). XIST는, 다른 포유류들과 비교되는 인간-특이적이고 보존된(conserved) 엑손으로 구성된다(참조: 도 10b)(Yen et al. 2007). 마우스 내의 Xist의 역할은, 초기 배아 발달 상의 여성-특이적 치사를 이끄는 그것의 절제(ablation)를 통해 상대적으로 잘 연구되어 왔다(Penny et al. 1996; Marahrens et al. 1997; Lee 2011). 그러나 유전자를 삭제하기 위한 적절한 도구의 부재로 인해, 인간 세포에서 유전자의 기능의 완전한 상실이 어렵기 때문에, 인간 세포내의 XIST의 역할은 부분적으로 밝혀지지 않았다.
인간 세포 내의 CRISPR/Cas 시스템을 이용하여, 짝지어진 이중-가닥 단절(double-strand breaks, DSBs)을 발생시킴으로써 XIST의 부분 및 전체 영역(TFBSs를 포함하는)을 삭제하는 것을 시도하였다(참조: 도 3a). 상기 지놈 편집(editing)을 위한 타겟 세포 주로서, 두 X 염색체를 갖고(Gribble et al. 2000), 높은 XIST 레벨을 발현하는 K562 세포를 선별하였다. INDEL에 의해 디자인된 sgRNA 및 낮은 효율을 갖는 것을 평가하기 위해, Cas9(참조: 도 11a, 도 12) 및 sgRNA(참조: 도 11b)를 인코딩하는 플라스미드로 형질감염된 K562 세포로부터 분리된 지놈 DNA를 이용하여 T7E1 분석을 수행하였다. 결과적으로 sgRNA들의 예측된 스코어 및 관찰된 효율은 서로 서로 미미하게 연관되어 있다(참조: 도 13). 각각의 로커스에 대한 두 다른 sgRNA를 시험하였고, 세포를 퓨로마이신으로 처리하여, 분석 전에 세포를 충분히 형질감염시켰다. 각각의 로커스 내에서, 높은 돌연변이 빈도를 야기하는 sgRNA를 선별하였고, 21% 내지 56% 빈도 범위에 걸친 돌연변이의 결과를 낳았다(참조: 도 4B). 상기의 선별된 sgRNA들은 이어지는 연구를 위해 이용하였다.
XIST의 명확한 영역을 삭제하기 위해, Cas9 및 sgRNA 짝을 인코딩하는 플라스미드로 K562 세포를 형질감염 시켰고, 그 후 지놈 DNA를 분리하였으며, 타겟팅된 삭제 검출을 위해 PCR을 수행하였다. PCR 산물의 겔 전기영동은 대략 620, 655, 660, 1380, 440, 510, 및 740 bp 사이즈의 앰플리콘을 나타내고, 비형질감염된 세포에서는 관찰되지 않으며(참조: 도 4C), 이는 타겟팅된 부분적인 삭제의 존재를 나타낸다.
삭제 빈도를 측정하고 삭제를 포함하는 클론을 얻기 위하여, 플라스미드 형질 감염 및 퓨로마이신 선별 후에 단일 세포-유래 클로날 컬쳐를 수행하였다. 지놈 DNA를 개별 클론으로부터 분리하였고, PCR 증폭시켰으며, 아가로스겔 전기영동에 이용하였다(참조: 도 4D). XIST 유전자의 타겟팅된 부분적인 삭제를 함유하는 클론의 프랙션은 25% 내지 56%(SD 1, 31% (5/16); SD2, 44% (7/16); SD3, 56% (9/16); SD4, 38% (6/16); SD5, 25% (4/16); SD6, 31% (5/16)) 범위였고; 유사하게 46%의 클론들이 RP11-3075.1 의 부분적인 삭제를 함유하였으며(참조: 도 4D), 선별된 sgRNA 짝이 타겟팅된 영역의 고 효율 삭제를 가능케 함을 보여준다. 부분적인 XISTRP11-3075.1 의 삭제를 한유하는 클론들 중에서, 20% 내지 80%(XIST에 대하여:SD1, 25%(1/4); SD2, 20%(1/5); SD3, 29%(2/7); SD4, 33%(2/6); SD5, 50%(2/4); SD6, 80%(4/5); RP11-3075.1에 대하여, 20% (3/15))는 야생형 대립형질을 함유하지 않으며, 타겟팅한 삭제를 함유하는 클론을 나타내고(참조: 도 4D), 높은 효율의 삭제를 나타낸다. 삭제를 함유하는 클론 중에서, 20%(1/5; 도 5), 25%(1/4; 도 13a 및 b), 29%(2/7; 도 14a, b), 33%(2/6; 도 15a, b), 40%(2/5; 도 16a, b)클론이 야생형 대립유전자를 함유하지 않으며, 이중 대립형질 삭제를 나타낸다. 다음으로 이중 대립형질 삭제를 함유하는 클론들의 삭제된 정션을 시퀀싱하였다. RP11-3075.1 로커스에 대한 몇몇 단일 클론들(도 19F의 클론 1 및 6; 도 3L의 클론 2, 3, 및 9) 내에서 3개까지의 다른 대립형질들을 관찰하였고, K562 세포가 염색체 6의 3 카피를 갖는다고 밝힌 종래 연구들과 일치한다(Gribble SM, Roberts I, Grace C, Andrews KM, Green AR, Nacheva EP: Cytogenetics of the chronic myeloid leukemia-derived cell line K562: karyotype clarification by multicolor fluorescence in situ hybridization, comparative genomic hybridization, and locus-specific fluorescence in situ hybridization. Cancer Genet Cytogenet 2000, 118(1):1-8.). 부분적인 삭제를 함유하는 대립형질들 중, 60% 내지 100%(XIST에 대하여: SD1, 60%(3/5); SD2, 50%(3/6); SD3, 67%(6/9); SD4, 100%(8/8); SD5, 50%(3/6); SD6, 100%(9/9); RP11-3075.1에 대하여, 100% (18/18))가 정션 부위에서 indel을 보였고(참조: 도 19F, 도 5, 도 14 내지 18), NHEJ의 오류가 나기 쉬운 경향과 일치한다.
타겟팅된 삭제의 사이즈에 대한 삭제를 함유하는 클론의 빈도를 관찰할 때, 0.4 내지 290 kb의 범위에서의 어떠한 경향도 관찰하지 않았다(참조: 도 4E). 그러나 삭제를 함유하는 클론들 중, 야생형 대립형질이 없는 클론들의 빈도는 타겟팅된 영역의 사이즈와의 powerlaw-relationship에 대해 유한(mild) 경향을 보였다(R-squared: 0.64 및 P<0.01; 도 4F).
4. XIST 의 부분적 및 en bloc 삭제의 표현형
부분적 또는 전체 XIST 삭제의 효과를 시험하기 위해, 엑손 1을 판별하는 프로브를 이용하여 XIST RNA에 대한 형광 in situ 혼성화(FISH)를 수행하였다. 상기 RNA FISH는 비형질감염 세포 내에서 관찰되는 XIST 클라우드가, en bloc XIST 삭제를 갖는 클론 내에서 존재하지 않음을 보였고(참조: 도 5A 및 5D), XIST 기능 상실을 보여주었다. XIST 클라우드 또한 프로모터 영역의 부분적인 삭제를 함유하는 클론(참조: 도 5E), 인간-특이적 엑손 2 및 약하게 보존된 엑손 3의 부분적인 삭제를 함유하는 클론(참조: 도 5F) 및 엑손 4, 5, 및 6의 부분적인 삭제를 함유하는 클론(참조: 도 5G) 내에서 존재하지 않았고, XIST 기능이 상기 타겟된 부분적인 삭제에 의해 상실됨을 보여준다.
en bloc XIST 삭제를 갖는 클론 및 다중-엑손 삭제 또는 프로모터 삭제를 갖는 세 클론들과 달리, 엑손 1의 컨스티튜티브 3' 스플라이스 부위의 부분적인 삭제를 함유하는 클론 및 엑손 5의 컨스티튜티브 3' 스플라이스 부위의 부분적인 삭제를 함유하는 클론은 XIST RNA 클루아드를 보이고(참조: 도 5B 및 5C), 이는 부분적인 삭제가 완전한 기능 상실의 결과를 초래하지 않는다는 것을 보여준다.
5. Cas9 뉴클레아제를 이용한 다른 lincRNA의 고 효율 삭제
다음으로 짝지어진 뉴클레아제를 이용하여 유사한 방법으로 다른 lincRNA를 삭제할 수 있는지를 시험하였다. K562 세포내에서 고 발현되는 lincRNA인 RP11-307P5.1의 부분적 삭제 및 en bloc 삭제에 대하여(참조: 도 6a; 도 17a), 상기 기술된대로 INDEL 시스템에 기초하여 각각의 타겟 부위에서 두 sgRNA를 디자인하였다. T7E1 분석은 각각의 타겟 부위에서 가장 높은 돌연변이 빈도를 이끄는 sgRNA가 이어지는 연구들을 위해 선별된 것을 나타내고, 59% 내지 61%의 돌연변이를 유도하였으며(참조: 도 6b, 도 17b), 이어지는 실험을 위해 선별되었다. RP11-307P5.1의 부분적 및 en bloc 삭제를 위해, K562 세포를 Cas9 및 sgRNA를 인코딩하는 플라스미드로 형질감염시켰고, 그들의 지놈 DNA를 분리하여 PCR을 수행하였다. PCR 산물의 겔 전기영동은 각각 대략 600-740 bp 앰플리콘을 나타내고, 비형질감염 대조군은 관찰되지 않으며(참조: 도 6c; 도 17c), ~100 및 294 kb 사이에 있는 영역을 삭제한 후, 두 타겟 부위가 합동한다는 것을 나타낸다. 단일 세포-유도 클론의 PCR 산물을 이용한 겔 전기영동이 ~100 kb 영역에 대한 65%(15/23) 삭제 및 ~294 kb 영역에 대한 46%(11/24) 삭제를 나타내고(참조: 도 6d; 도 17d), lincRNA의 대부분이 고 효율로 삭제될 수 있다는 것을 나타낸다(참조: 도 1b; 도 7b). 야생형 대립형질이 완전히 사라졌는지 확인하기 위해, 상기 클론들로부터의 지놈 DNA를 PCR 수행하였고, 겔 전기영동하였으며, 100 kb 삭제에 대한 20%(3/15) 클론 및 294 kb 삭제에 대한 9.1%(1/11) 클론 내에서 ~1060 bp 크기의 앰플리콘이 보이지 않았고(참조: 도 6e; 도 17e), 상기 클론들이 야생형 대립형질을 함유하지 않고, RP11-307P5.1에 대해 녹아웃이라는 것을 나타낸다. 삭제 정션에 대한 PCR 산물의 시퀀싱 분석은 RP11-307P5.1의 100 kb 및 294 kb의 타겟팅된 삭제를 입증하였다(참조: 도 6f; 도 17f). 야생형 대립형질을 갖지 않는 클론들은 1개(294 kb 삭제에 대한 클론 10), 2개(100 kb 삭제에 대한 클론 10 및 21), 1개(100 kb 삭제에 대한 클론 1) 클론 각각 내에서 1, 2 또는 3개의 다른 DNA 시퀀스를 나타내고, 반면에 야생형 대립형질을 포함하는 클론들은 8개(100 kb 삭제에 대한 클론 2, 3, 4 및 7, 그리고 294 kb 삭제에 대한 클론 1, 4, 7, 12) 및 4개(100 kb 삭제에 대한 클론 6, 294 kb 삭제에 대한 클론 2, 3, 9) 클론 각각 내에서 1개 또는 2개 다른 시퀀스를 나타낸다. 상기 3개까지 다른 대립형질의 관찰은 K562 세포가 세 개의 염색체 6를 갖는다는 이전의 보고와 상통한다(Gribble et al. 2000).
이상으로 본 발명의 특정한 부분을 상세히 기술하였는 바, 당업계의 통상의 지식을 가진 자에게 있어서 이러한 구체적인 기술은 단지 바람직한 구현 예일 뿐이며, 이에 본 발명의 범위가 제한되는 것이 아닌 점은 명백하다. 따라서, 본 발명의 실질적인 범위는 첨부된 청구항과 그의 등가물에 의하여 정의된다고 할 것이다.
참조 문헌
1. Geisler, S. & Coller, J. RNA in unexpected places: long non-coding RNA functions in diverse cellular contexts. Nat Rev Mol Cell Biol 14, 699-712 (2013).
2. Guttman, M. & Rinn, J.L. Modular regulatory principles of large non-coding RNAs. Nature 482, 339-46 (2012).
3. Iyer, M.K. et al. The landscape of long noncoding RNAs in the human transcriptome. Nat Genet (2015).
4. Derrien, T. et al. The GENCODE v7 catalog of human long noncoding RNAs: analysis of their gene structure, evolution, and expression. Genome Res 22, 1775-89 (2012).
5. Cabili, M.N. et al. Integrative annotation of human large intergenic noncoding RNAs reveals global properties and specific subclasses. Genes Dev 25, 1915-27 (2011).
6. Xie, C. et al. NONCODEv4: exploring the world of long non-coding RNA genes. Nucleic Acids Res 42, D98-103 (2014).
7. Khalil, A.M. et al. Many human large intergenic noncoding RNAs associate with chromatin-modifying complexes and affect gene expression. Proc Natl Acad Sci U S A 106, 11667-72 (2009).
8. Guttman, M. et al. Ab initio reconstruction of cell type-specific transcriptomes in mouse reveals the conserved multi-exonic structure of lincRNAs. Nat Biotechno l28, 503-10 (2010).
9. Brunner, A.L. et al. Transcriptional profiling of long non-coding RNAs and novel transcribed regions across a diverse panel of archived human cancers. Genome Biol 13, R75 (2012).
10. Memczak, S. et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature 495, 333-8 (2013).
11. Bassett, A.R. et al. Considerations when investigating lncRNA function in vivo. Elife 3, e03058 (2014).
12. Esteller, M. Non-coding RNAs in human disease. Nat Rev Genet 12, 861-74 (2011).
13. Ulitsky, I. & Bartel, D.P. lincRNAs: genomics, evolution, and mechanisms. Cell 154, 26-46 (2013).
14. Batista, P.J. & Chang, H.Y. Long noncoding RNAs: cellular address codes in development and disease. Cell 152, 1298-307 (2013).
15. Li, L. & Chang, H.Y. Physiological roles of long noncoding RNAs: insight from knockout mice. Trends Cell Biol 24, 594-602 (2014).
16. Gutschner, T. & Diederichs, S. The hallmarks of cancer: a long non-coding RNA point of view. RNA Bio l9, 703-19 (2012).
17. Du, Z. et al. Integrative genomic analyses reveal clinically relevant long noncoding RNAs in human cancer. Nat Struct Mol Bio l20, 908-13 (2013).
18. Lee, J.T. Epigenetic regulation by long noncoding RNAs. Science 338, 1435-9 (2012).
19. Licatalosi, D.D. et al. HITS-CLIP yields genome-wide insights into brain alternative RNA processing. Nature 456, 464-9 (2008).
20. Zhang, C. & Darnell, R.B. Mapping in vivo protein-RNA interactions at single-nucleotide resolution from HITS-CLIP data. Nat Biotechno l29, 607-14 (2011).
21. Helwak, A., Kudla, G., Dudnakova, T. & Tollervey, D. Mapping the human miRNA interactome by CLASH reveals frequent noncanonical binding. Cell 153, 654-65 (2013).
22. Simon, M.D. et al. The genomic binding sites of a noncoding RNA. Proc Natl Acad Sci U S A 108, 20497-502 (2011).
23. Chu, C., Qu, K., Zhong, F.L., Artandi, S.E. & Chang, H.Y. Genomic maps of long noncoding RNA occupancy reveal principles of RNA-chromatin interactions. Mol Cell 44, 667-78 (2011).
24. Engreitz, J.M. et al. The Xist lncRNA exploits three-dimensional genome architecture to spread across the X chromosome. Science 341, 1237973 (2013).
25. Engreitz, J.M. et al. RNA-RNA Interactions Enable Specific Targeting of Noncoding RNAs to Nascent Pre-mRNAs and Chromatin Sites. Cell 159, 188-99 (2014).
26. Simon, M.D. et al. High-resolution Xist binding maps reveal two-step spreading during X-chromosome inactivation. Nature 504, 465-9 (2013).
27. Mili, S. & Steitz, J.A. Evidence for reassociation of RNA-binding proteins after cell lysis: implications for the interpretation of immunoprecipitation analyses. RNA 10, 1692-4 (2004).
28. Sauvageau, M. et al. Multiple knockout mouse models reveal lincRNAs are required for life and brain development. Elife 2, e01749 (2013).
29. Yildirim, E. et al. Xist RNA is a potent suppressor of hematologic cancer in mice. Cell 152, 727-42 (2013).
30. Penny, G.D., Kay, G.F., Sheardown, S.A., Rastan, S. & Brockdorff, N. Requirement for Xist in X chromosome inactivation. Nature 379, 131-7 (1996).
31. Lee, J.T. Disruption of imprinted X inactivation by parent-of-origin effects at Tsix. Cell 103, 17-27 (2000).
32. Tian, D., Sun, S. & Lee, J.T. The long noncoding RNA, Jpx, is a molecular switch for X chromosome inactivation. Cell 143, 390-403 (2010).
33. Li, L. et al. Targeted disruption of Hotair leads to homeotic transformation and gene derepression. Cell Rep 5, 3-12 (2013).
34. Grote, P. et al. The tissue-specific lncRNA Fendrr is an essential regulator of heart and body wall development in the mouse. Dev Cell 24, 206-14 (2013).
35. Sleutels, F., Zwart, R. & Barlow, D.P. The non-coding Air RNA is required for silencing autosomal imprinted genes. Nature 415, 810-3 (2002).
36. Guttman, M. et al. lincRNAs act in the circuitry controlling pluripotency and differentiation. Nature 477, 295-300 (2011).
37. Hu, W., Yuan, B., Flygare, J. & Lodish, H.F. Long noncoding RNA-mediated anti-apoptotic activity in murine erythroid terminal differentiation. Genes Dev 25, 2573-8 (2011).
38. Ng, S.Y., Johnson, R. & Stanton, L.W. Human long non-coding RNAs promote pluripotency and neuronal differentiation by association with chromatin modifiers and transcription factors. EMBO J 31, 522-33 (2012).
39. Klattenhoff, C.A. et al. Braveheart, a long noncoding RNA required for cardiovascular lineage commitment. Cell 152, 570-83 (2013).
40. Sun, L. et al. Long noncoding RNAs regulate adipogenesis. Proc Natl Acad Sci U S A 110, 3387-92 (2013).
41. Gutschner, T., Baas, M. & Diederichs, S. Noncoding RNA gene silencing through genomic integration of RNA destabilizing elements using zinc finger nucleases. Genome Res 21, 1944-54 (2011).
42. Ji, Q. et al. Long non-coding RNA MALAT1 promotes tumour growth and metastasis in colorectal cancer through binding to SFPQ and releasing oncogene PTBP2 from SFPQ/PTBP2 complex. Br J Cancer 111, 736-48 (2014).
43. Liu, Y. et al. Inheritable and precise large genomic deletions of non-coding RNA genes in zebrafish using TALENs. PLoS One 8, e76387 (2013).
44. Xiang, J.F. et al. Human colorectal cancer-specific CCAT1-L lncRNA regulates long-range chromatin interactions at the MYC locus. Cell Res 24, 513-31 (2014).
45. Eissmann, M. et al. Loss of the abundant nuclear non-coding RNA MALAT1 is compatible with life and development. RNA Bio l9, 1076-87 (2012).
46. Kim, Y.K. et al. TALEN-based knockout library for human microRNAs. Nat Struct Mol Biol 20, 1458-64 (2013).
47. Cho, S.W., Kim, S., Kim, J.M. & Kim, J.S. Targeted genome engineering in human cells with the Cas9 RNA-guided endonuclease. Nat Biotechnol 31, 230-2 (2013).
48. Cong, L. et al. Multiplex genome engineering using CRISPR/Cas systems. Science 339, 819-23 (2013).
49. Mali, P. et al. RNA-guided human genome engineering via Cas9. Science 339, 823-6 (2013).
50. Jinek, M. et al. RNA-programmed genome editing in human cells. Elife 2, e00471 (2013).
51. Ho, T.T. et al. Targeting non-coding RNAs with the CRISPR/Cas9 system in human cell lines. Nucleic Acids Res (2014).
52. Han, J. et al. Efficient in vivo deletion of a large imprinted lncRNA by CRISPR/Cas9. RNA Biol 11, 829-35 (2014).
53. Wang, T., Wei, J.J., Sabatini, D.M. & Lander, E.S. Genetic screens in human cells using the CRISPR-Cas9 system. Science 343, 80-4 (2014).
54. Zhou, Y. et al. High-throughput screening of a CRISPR/Cas9 library for functional genomics in human cells. Nature 509, 487-91 (2014).
55. Kim, H. & Kim, J.S. A guide to genome engineering with programmable nucleases. Nat Rev Genet 15, 321-34 (2014).
56. van Bakel, H., Nislow, C., Blencowe, B.J. & Hughes, T.R. Most "dark matter" transcripts are associated with known genes. PLoS Bio l8, e1000371 (2010).
57. Faulkner, G.J. et al. The regulated retrotransposon transcriptome of mammalian cells. Nat Genet 41, 563-71 (2009).
58. Ulitsky, I., Shkumatava, A., Jan, C.H., Sive, H. & Bartel, D.P. Conserved function of lincRNAs in vertebrate embryonic development despite rapid sequence evolution. Cell 147, 1537-50 (2011).
59. Nam, J.W. & Bartel, D.P. Long noncoding RNAs in C. elegans. Genome Res 22, 2529-40 (2012).
60. Kelley, D. & Rinn, J. Transposable elements reveal a stem cell-specific class of long noncoding RNAs. Genome Biol 13, R107 (2012).
61. Kapusta, A. et al. Transposable elements are major contributors to the origin, diversification, and regulation of vertebrate long noncoding RNAs. PLoS Genet 9, e1003470 (2013).
62. Doench, J.G. et al. Rational design of highly active sgRNAs for CRISPR-Cas9-mediated gene inactivation. Nat Biotechnol (2014).
63. Jia, H. et al. Genome-wide computational identification and manual annotation of human long noncoding RNA genes. RNA 16, 1478-87 (2010).
64. Ingolia, N.T., Lareau, L.F. & Weissman, J.S. Ribosome profiling of mouse embryonic stem cells reveals the complexity and dynamics of mammalian proteomes. Cell 147, 789-802 (2011).
65. Sharan, R. & Shamir, R. CLICK: a clustering algorithm with applications to gene expression analysis. Proc Int Conf Intell Syst Mol Biol 8, 307-16 (2000).
66. Ripoche, M.A., Kress, C., Poirier, F. & Dandolo, L. Deletion of the H19 transcription unit reveals the existence of a putative imprinting control element. Genes Dev 11, 1596-604 (1997).
67. Meller, V.H. & Rattner, B.P. The roX genes encode redundant male-specific lethal transcripts required for targeting of the MSL complex. EMBO J 21, 1084-91 (2002).
68. Marahrens, Y., Panning, B., Dausman, J., Strauss, W. & Jaenisch, R. Xist-deficient mice are defective in dosage compensation but not spermatogenesis. Genes Dev 11, 156-66 (1997).
69. Clerc, P. & Avner, P. Role of the region 3' to Xist exon 6 in the counting process of X-chromosome inactivation. Nat Genet 19, 249-53 (1998).
70. Senner, C.E. et al. Disruption of a conserved region of Xist exon 1 impairs Xist RNA localisation and X-linked gene silencing during random and imprinted X chromosome inactivation. Development 138, 1541-50 (2011).
71. Dimitrova, N. et al. LincRNA-p21 activates p21 in cis to promote Polycomb target gene expression and to enforce the G1/S checkpoint. Mol Cell 54, 777-90 (2014).
72. Nakagawa, S., Naganuma, T., Shioi, G. & Hirose, T. Paraspeckles are subpopulation-specific nuclear bodies that are not essential in mice. J Cell Biol1 93, 31-9 (2011).
73. Nakagawa, S. et al. Malat1 is not an essential component of nuclear speckles in mice. RNA 18, 1487-99 (2012).
74. Anguera, M.C. et al. Tsx produces a long noncoding RNA and has general functions in the germline, stem cells, and brain. PLoS Genet 7, e1002248 (2011).
75. Schneider, T.D. Information content of individual genetic sequences. J Theor Biol 189, 427-41 (1997).
76. Amarzguioui, M. & Prydz, H. An algorithm for selection of functional siRNA sequences. Biochem Biophys Res Commun316, 1050-8 (2004).
77. Reynolds, A. et al. Rational siRNA design for RNA interference. Nat Biotechnol 22, 326-30 (2004).
78. Hsu, P.D. et al. DNA targeting specificity of RNA-guided Cas9 nucleases. Nat Biotechnol 31, 827-32 (2013).
79. Minkovsky, A., Patel, S. & Plath, K. Concise review: Pluripotency and the transcriptional inactivation of the female Mammalian X chromosome. Stem Cells 30, 48-54 (2012).
80. Borsani, G. et al. Characterization of a murine gene expressed from the inactive X chromosome. Nature 351, 325-9 (1991).
81. Brockdorff, N. et al. The product of the mouse Xist gene is a 15 kb inactive X-specific transcript containing no conserved ORF and located in the nucleus. Cell 71, 515-26 (1992).
82. Brown, C.J. et al. The human XIST gene: analysis of a 17 kb inactive X-specific RNA that contains conserved repeats and is highly localized within the nucleus. Cell 71, 527-42 (1992).
83. Lee, J.T. Gracefully ageing at 50, X-chromosome inactivation becomes a paradigm for RNA and chromatin control. Nat Rev Mol Cell Biol 12, 815-26 (2011).
84. Yen, Z.C., Meyer, I.M., Karalic, S. & Brown, C.J. A cross-species comparison of X-chromosome inactivation in Eutheria. Genomics 90, 453-63 (2007).
85. Gribble, S.M. et al. Cytogenetics of the chronic myeloid leukemia-derived cell line K562: karyotype clarification by multicolor fluorescence in situ hybridization, comparative genomic hybridization, and locus-specific fluorescence in situ hybridization. Cancer Genet Cytogenet1 18, 1-8 (2000).
86. Brown, C.J. & Willard, H.F. The human X-inactivation centre is not required for maintenance of X-chromosome inactivation. Nature 368, 154-6 (1994).
87. Csankovszki, G., Panning, B., Bates, B., Pehrson, J.R. & Jaenisch, R. Conditional deletion of Xist disrupts histone macroH2A localization but not maintenance of X inactivation. Nat Genet 22, 323-4 (1999).
88. Wutz, A. Gene silencing in X-chromosome inactivation: advances in understanding facultative heterochromatin formation. Nat Rev Genet 12, 542-53 (2011).
89. Anguera, M.C. et al. Molecular signatures of human induced pluripotent stem cells highlight sex differences and cancer genes. Cell Stem Cell 11, 75-90 (2012).
90. Zhang, L.F., Huynh, K.D. & Lee, J.T. Perinucleolar targeting of the inactive X during S phase: evidence for a role in the maintenance of silencing. Cell 129, 693-706 (2007).
91. Caparros, M.L., Alexiou, M., Webster, Z. & Brockdorff, N. Functional analysis of the highly conserved exon IV of XIST RNA. Cytogenet Genome Res 99, 99-105 (2002).
92. Wutz, A., Rasmussen, T.P. & Jaenisch, R. Chromosomal silencing and localization are mediated by different domains of Xist RNA. Nat Genet 30, 167-74 (2002).
93. Jones, P.A., Taylor, S.M., Mohandas, T. & Shapiro, L.J. Cell cycle-specific reactivation of an inactive X-chromosome locus by 5-azadeoxycytidine. Proc Natl Acad Sci U S A 79, 1215-9 (1982).
94. Ladd, P.D. et al. An antisense transcript spanning the CGG repeat region of FMR1 is upregulated in premutation carriers but silenced in full mutation individuals. Hum Mol Genet 16, 3174-87 (2007).
95. Wu, X. et al. Genome-wide binding of the CRISPR endonuclease Cas9 in mammalian cells. Nat Biotechnol 32, 670-6 (2014).
96. Bultmann, S. et al. Targeted transcriptional activation of silent oct4 pluripotency gene by combining designer TALEs and inhibition of epigenetic modifiers. Nucleic Acids Res 40, 5368-77 (2012).
97. Nam, J.W. et al. Global analyses of the effect of different cellular contexts on microRNA targeting. Mol Cell 53, 1031-43 (2014).
98. Kong, L. et al. CPC: assess the protein-coding potential of transcripts using sequence features and support vector machine. Nucleic Acids Res 35, W345-9 (2007).
99. Ingolia, N.T., Ghaemmaghami, S., Newman, J.R. & Weissman, J.S. Genome-wide analysis in vivo of translation with nucleotide resolution using ribosome profiling. Science 324, 218-23 (2009).
100. Ulitsky, I. et al. Expander: from expression microarrays to networks and functions. Nat Protoc 5, 303-22 (2010).
101. Karolchik, D. et al. The UCSC Genome Browser database: 2014 update. Nucleic Acids Res 42, D764-70 (2014).
102. Margulies, E.H., Blanchette, M., Program, N.C.S., Haussler, D. & Green, E.D. Identification and characterization of multi-species conserved sequences. Genome Res 13, 2507-18 (2003).
103. Hofacker, I.L. Vienna RNA secondary structure server. Nucleic Acids Res 31, 3429-31 (2003).
104. Langmead, B., Trapnell, C., Pop, M. & Salzberg, S.L. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome Biol 10, R25 (2009).
105. Kim, H.J., Lee, H.J., Kim, H., Cho, S.W. & Kim, J.S. Targeted genome editing in human cells with zinc finger nucleases constructed via modular assembly. Genome Res 19, 1279-88 (2009).
106. Kim, Y.H., Ramakrishna, S., Kim, H. & Kim, J.S. Enrichment of cells with TALEN-induced mutations using surrogate reporters. Methods 69, 108-17 (2014).
107. Guschin, D.Y. et al. A rapid and general assay for monitoring endogenous gene modification. Methods Mol Biol 649, 247-56 (2010).
108. Ramakrishna, S. et al. Gene disruption by cell-penetrating peptide-mediated delivery of Cas9 protein and guide RNA. Genome Res 24, 1020-7 (2014).
109. Ramakrishna, S. et al. Surrogate reporter-based enrichment of cells containing RNA-guided Cas9 nuclease-induced mutations. Nat Commun 5, 3378 (2014).
110. Edgar, R., Domrachev, M. & Lash, A.E. Gene Expression Omnibus: NCBI gene expression and hybridization array data repository. Nucleic Acids Res 30, 207-10 (2002).
111. Consortium, E.P. An integrated encyclopedia of DNA elements in the human genome. Nature 489, 57-74 (2012).
112. Johnson, M. et al. NCBI BLAST: a better web interface. Nucleic Acids Res 36, W5-9 (2008).
<110> IUCF-HYU (Industry-University Cooperation Foundation Hanyang University) <120> Pairs of sgRNAs for Deletion of LincRNA <130> PN150060P <150> 10-2015-0045980 <151> 2015-04-01 <160> 38 <170> KopatentIn 2.0 <210> 1 <211> 20 <212> RNA <213> sgRNA for XIST <400> 1 gagguuagua ccaucuucaa 20 <210> 2 <211> 20 <212> RNA <213> sgRNA for XIST <400> 2 uccuuagccc aucgggguau 20 <210> 3 <211> 20 <212> RNA <213> sgRNA for XIST <400> 3 accccgaugg gccagagugu 20 <210> 4 <211> 20 <212> RNA <213> sgRNA for XIST <400> 4 gugagcauag gcacucaccu 20 <210> 5 <211> 20 <212> RNA <213> sgRNA for XIST <400> 5 auaaccaagg ccccucuucc 20 <210> 6 <211> 20 <212> RNA <213> sgRNA for XIST <400> 6 acguuaacag gccaggaaga 20 <210> 7 <211> 20 <212> RNA <213> sgRNA for XIST <400> 7 ccaccuauag aaaagucaga 20 <210> 8 <211> 20 <212> RNA <213> sgRNA for XIST <400> 8 gaagaaggaa agaaacuuac 20 <210> 9 <211> 20 <212> RNA <213> sgRNA for XIST <400> 9 uuuuaaagca gaacacagcu 20 <210> 10 <211> 20 <212> RNA <213> sgRNA for XIST <400> 10 gcuuguaauu ccagggcuuu 20 <210> 11 <211> 20 <212> RNA <213> sgRNA for XIST <400> 11 aguggacauu uacaguugug 20 <210> 12 <211> 20 <212> RNA <213> sgRNA for XIST <400> 12 ucuucaugug gauugaagag 20 <210> 13 <211> 20 <212> RNA <213> sgRNA for XIST <400> 13 aggcauguug aucuucaggu 20 <210> 14 <211> 20 <212> RNA <213> sgRNA for XIST <400> 14 acgacagagu cucucacaaa 20 <210> 15 <211> 20 <212> RNA <213> sgRNA for XIST <400> 15 gcaagguuga agauaaucug 20 <210> 16 <211> 20 <212> RNA <213> sgRNA for XIST <400> 16 ccauccccag cugaagaaag 20 <210> 17 <211> 30 <212> RNA <213> extended sequence of SEQ ID NO:1 <400> 17 cauugagguu aguaccaucu ucaagggacu 30 <210> 18 <211> 30 <212> RNA <213> extended sequence of SEQ ID NO:2 <400> 18 uuuuuccuua gcccaucggg guaucggaua 30 <210> 19 <211> 30 <212> RNA <213> extended sequence of SEQ ID NO:3 <400> 19 cgucaccccg augggccaga guguuggggg 30 <210> 20 <211> 30 <212> RNA <213> extended sequence of SEQ ID NO:4 <400> 20 guaagugagc auaggcacuc accuuggaca 30 <210> 21 <211> 30 <212> RNA <213> extended sequence of SEQ ID NO:5 <400> 21 gcugauaacc aaggccccuc uuccuggccu 30 <210> 22 <211> 30 <212> RNA <213> extended sequence of SEQ ID NO:6 <400> 22 acauacguua acaggccagg aagaggggcc 30 <210> 23 <211> 30 <212> RNA <213> extended sequence of SEQ ID NO:7 <400> 23 gaugccaccu auagaaaagu cagagggucc 30 <210> 24 <211> 30 <212> RNA <213> extended sequence of SEQ ID NO:8 <400> 24 gugggaagaa ggaaagaaac uuacuggacc 30 <210> 25 <211> 30 <212> RNA <213> extended sequence of SEQ ID NO:9 <400> 25 uccuuuuuaa agcagaacac agcugggcau 30 <210> 26 <211> 30 <212> RNA <213> extended sequence of SEQ ID NO:10 <400> 26 uccugcuugu aauuccaggg cuuugggagg 30 <210> 27 <211> 30 <212> RNA <213> extended sequence of SEQ ID NO:11 <400> 27 gaagagugga cauuuacagu ugugcggagc 30 <210> 28 <211> 30 <212> RNA <213> extended sequence of SEQ ID NO:12 <400> 28 cuuuucuuca uguggauuga agaguggaca 30 <210> 29 <211> 30 <212> RNA <213> extended sequence of SEQ ID NO:13 <400> 29 ugccaggcau guugaucuuc aggugggaag 30 <210> 30 <211> 30 <212> RNA <213> extended sequence of SEQ ID NO:14 <400> 30 acugacgaca gagucucuca caaacggaga 30 <210> 31 <211> 30 <212> RNA <213> extended sequence of SEQ ID NO:15 <400> 31 gggagcaagg uugaagauaa ucugggguug 30 <210> 32 <211> 30 <212> RNA <213> extended sequence of SEQ ID NO:16 <400> 32 uuccccaucc ccagcugaag aaaggggugu 30 <210> 33 <211> 20 <212> RNA <213> sgRNA for RP11-307p5.1 <400> 33 ggauguuguc uguaugguaa 20 <210> 34 <211> 20 <212> RNA <213> sgRNA for RP11-307p5.1 <400> 34 guucaccaug cccugggaga 20 <210> 35 <211> 20 <212> RNA <213> sgRNA for RP11-307p5.1 <400> 35 uggauugacg acauaaaaua 20 <210> 36 <211> 20 <212> RNA <213> sgRNA for RP11-307p5.1 <400> 36 aaugcuauca ggaccacugg 20 <210> 37 <211> 20 <212> RNA <213> sgRNA for RP11-307p5.1 <400> 37 aauucgagcu uaaaacacga 20 <210> 38 <211> 20 <212> RNA <213> sgRNA for RP11-307p5.1 <400> 38 uuaauguuga gauaacguca 20

Claims (8)

  1. 서열목록 제1서열 내지 제16서열로 이루어진 sgRNA들로 구성된 군으로부터 선택되는 2개의 sgRNA를 포함하는 XIST 유전자 전체 또는 일부의 삭제(deletion)를 위한 절단부위 타겟팅용 가이드 시퀀스.
  2. 제 1 항에 있어서, 상기 2개의 sgRNA는 서열목록 제3서열로 이루어진 sgRNA 및 서열목록 제15서열로 이루어진 sgRNA이고, XIST 유전자 전체의 삭제(deletion)를 위한 것을 특징으로 하는, 가이드 시퀀스.
  3. (a) 제 1 항에 따르는 가이드 시퀀스 및 (b) Cas9 뉴클레아제를 포함하는 XIST 유전자 전체 또는 일부의 삭제용 조성물.
  4. (a) 제 1 항에 따르는 가이드 시퀀스; 및 (b) Cas9을 발현하는 것을 특징으로 하는 발현벡터.
  5. 서열목록 제33서열 내지 제38서열로 나타낸 sgRNA들로 구성된 군으로부터 선택되는 2개의 sgRNA를 포함하는 RP11-307P5.1 유전자 전체 또는 일부의 삭제(deletion)를 위한 절단부위 타겟팅용 가이드 시퀀스.
  6. 제 5 항에 있어서, 상기 2개의 sgRNA는 서열목록 제34서열로 이루어진 sgRNA 및 서열목록 제38서열로 이루어진 sgRNA이고, RP11-307P5.1 유전자 전체의 삭제(deletion)를 위한 것을 특징으로 하는, 가이드 시퀀스.
  7. (a) 제 5 항에 따르는 가이드 시퀀스 및 (b) Cas9 뉴클레아제를 포함하는 RP11-307P5.1 유전자 전체 또는 일부의 삭제용 조성물.
  8. (a) 제 5 항에 따르는 가이드 시퀀스; 및 (b) cas9을 발현하는 것을 특징으로 하는 발현벡터.
KR1020160040433A 2015-04-01 2016-04-01 LincRNA 삭제를 위한 sgRNA 쌍 KR20160118987A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020150045980 2015-04-01
KR20150045980 2015-04-01

Publications (1)

Publication Number Publication Date
KR20160118987A true KR20160118987A (ko) 2016-10-12

Family

ID=57173547

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160040433A KR20160118987A (ko) 2015-04-01 2016-04-01 LincRNA 삭제를 위한 sgRNA 쌍

Country Status (1)

Country Link
KR (1) KR20160118987A (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019191876A1 (en) * 2018-04-02 2019-10-10 Peking University Method for Screening and Identifying Functional lncRNAs
CN114807126A (zh) * 2021-01-22 2022-07-29 清华大学深圳国际研究生院 一种沉默长非编码rna表达的方法及其应用
US11624077B2 (en) 2017-08-08 2023-04-11 Peking University Gene knockout method
US11897920B2 (en) 2017-08-04 2024-02-13 Peking University Tale RVD specifically recognizing DNA base modified by methylation and application thereof

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11897920B2 (en) 2017-08-04 2024-02-13 Peking University Tale RVD specifically recognizing DNA base modified by methylation and application thereof
US11624077B2 (en) 2017-08-08 2023-04-11 Peking University Gene knockout method
WO2019191876A1 (en) * 2018-04-02 2019-10-10 Peking University Method for Screening and Identifying Functional lncRNAs
CN112384620A (zh) * 2018-04-02 2021-02-19 北京大学 用于筛选和鉴定功能性lncRNA的方法
CN112384620B (zh) * 2018-04-02 2023-06-30 北京大学 用于筛选和鉴定功能性lncRNA的方法
CN114807126A (zh) * 2021-01-22 2022-07-29 清华大学深圳国际研究生院 一种沉默长非编码rna表达的方法及其应用

Similar Documents

Publication Publication Date Title
Robinson et al. The how and why of lncRNA function: an innate immune perspective
Quinn et al. Unique features of long non-coding RNA biogenesis and function
Furlan et al. The Ftx noncoding locus controls X chromosome inactivation independently of its RNA products
Diao et al. A new class of temporarily phenotypic enhancers identified by CRISPR/Cas9-mediated genetic screening
Chuang et al. Integrative transcriptome sequencing reveals extensive alternative trans-splicing and cis-backsplicing in human cells
US11155814B2 (en) Methods for using DNA repair for cell engineering
Gent et al. Accessible DNA and relative depletion of H3K9me2 at maize loci undergoing RNA-directed DNA methylation
Shen et al. An intriguing RNA species—perspectives of circularized RNA
Ishizu et al. Somatic primary piRNA biogenesis driven by cis-acting RNA elements and trans-acting Yb
Mulholland et al. A modular open platform for systematic functional studies under physiological conditions
Mo et al. Advances and applications of single‐cell omics technologies in plant research
CN110343724B (zh) 用于筛选和鉴定功能性lncRNA的方法
KR20160118987A (ko) LincRNA 삭제를 위한 sgRNA 쌍
JP7244885B2 (ja) 機能的なIncRNAをスクリーニングおよび同定するための方法
US20220315920A1 (en) Type i crispr system as a tool for genome editing
Chen et al. Transposon activation mutagenesis as a screening tool for identifying resistance to cancer therapeutics
Yang et al. Silencing transposable elements in the Drosophila germline
Elling et al. Genome wide functional genetics in haploid cells
Zhang et al. Genome-wide analysis and functional annotation of chromatin-enriched noncoding RNAs in rice during somatic cell regeneration
Galupa et al. Inversion of a topological domain leads to restricted changes in its gene expression and affects interdomain communication
Estep et al. Immunoblot screening of CRISPR/Cas9-mediated gene knockouts without selection
Dou et al. Genome-wide discovery of circular RNAs in the leaf and seedling tissues of Arabidopsis thaliana
JP7210028B2 (ja) 遺伝子変異導入方法
Nowosad et al. Mutations in gene regulatory elements linked to human limb malformations
Bosco et al. KaryoCreate: a new CRISPR-based technology to generate chromosome-specific aneuploidy by targeting human centromeres

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application