JP7244885B2 - 機能的なIncRNAをスクリーニングおよび同定するための方法 - Google Patents

機能的なIncRNAをスクリーニングおよび同定するための方法 Download PDF

Info

Publication number
JP7244885B2
JP7244885B2 JP2020554242A JP2020554242A JP7244885B2 JP 7244885 B2 JP7244885 B2 JP 7244885B2 JP 2020554242 A JP2020554242 A JP 2020554242A JP 2020554242 A JP2020554242 A JP 2020554242A JP 7244885 B2 JP7244885 B2 JP 7244885B2
Authority
JP
Japan
Prior art keywords
rna
coding
sequence
cells
crispr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020554242A
Other languages
English (en)
Other versions
JP2021520205A (ja
Inventor
ウェイ,ウェンシォン
リゥ,イン
ツァオ,ヂョンヂォン
ワン,イーナン
グォ,ユー
ユェン,ポンフェイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Edigene Biotechnology Inc
Original Assignee
Peking University
Edigene Biotechnology Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University, Edigene Biotechnology Inc filed Critical Peking University
Publication of JP2021520205A publication Critical patent/JP2021520205A/ja
Application granted granted Critical
Publication of JP7244885B2 publication Critical patent/JP7244885B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2330/00Production
    • C12N2330/30Production chemically synthesised
    • C12N2330/31Libraries, arrays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16041Use of virus, viral particle or viral elements as a vector
    • C12N2740/16043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Description

本発明は、真核細胞のゲノム中のスプライス部位を標的とすることで長鎖ノンコーディングRNA(IncRNA)に対して遺伝子干渉を行い、これによって機能的なIncRNAをスクリーニングおよび同定することに関する。
強力なゲノム編集ツールとして、CRISPR-Cas9システムは、大規模なスクリーニングを通す遺伝子機能の同定に使用されている(非特許文献1-4)。ゲノムスケールでさえ、遺伝子干渉はほとんどエクソン内で生成されたフレームシフト突然変異によって達成される。ヒトゲノムの約2%のタンパク質コード遺伝子を除いて、残りの大量な転写物が非コードRNAであることはより多くの証拠によって示されている(非特許文献5)。その中で、>200ヌクレオチドのIncRNAは、明らかなタンパク質コーディングの可能性のない遺伝子の大きなサブセットを表す(非特許文献6-7)。以前の研究では、ヒトIncRNAの総数がタンパク質をコードする遺伝子の総数を超えており、その数が増加し続けていることは示されている(非特許文献8)。
IncRNAは、転写または転写後のレベルで、遺伝子発現をシスまたはトランスに調節することにより、様々な細胞プロセスで重要な役割を果たす(非特許文献9)。ヒトゲノムの何万もの遺伝子座は長鎖ノンコーディングRNA(IncRNA)をコードするものとしてラベル付けられているが、主にスケーラブルな遺伝子機能喪失法がないため、それらの機能はほとんど知られていない。一般的に、IncRNAはリーディングフレームの変化に敏感ではないため、CRISPR-Cas9システムを使用して従来の方法でその発現を破壊することは困難であり、CRISPR-Cas9システムを大規模に適用してその発現を破壊することはさらに困難である。前には、IncRNAの機能喪失スクリーニング(非特許文献9)のためにpgRNAライブラリーを介して欠失戦略を開発したが、そのスケールアップは面倒であった。RNA干渉(非特許文献10、11)またはCRISPRi(非特許文献12)に基づくスクリーニングがIncRNA機能の同定に効果的であることは研究によって証明されているが、RNAi方法には潜在的なオフターゲット問題があり(非特許文献13)、両方の方法も転写ノックダウンの有効性によって制限される。そのため、機能的な長鎖ノンコーディングRNAをスクリーニングおよび同定する、およびノンコーディングRNAの機能を大規模に干渉する効果的な方法が必要である。
Shalem, O. et al. Genome-scale CRISPR-Cas9 knockout screening in human cells. Science 343, 84-87 (2014). Wang, T., Wei, J. J., Sabatini, D. M. & Lander, E. S. Genetic screens in human cells using the CRISPR-Cas9 system. Science 343, 80-84 (2014). Koike-Yusa, H., Li, Y., Tan, E. P., Velasco-Herrera Mdel, C. & Yusa, K. Genome-wide recessive genetic screening in mammalian cells with a lentiviral CRISPR-guide RNA library. Nat Biotechnol 32, 267-273 (2014). Zhou, Y. et al. High-throughput screening of a CRISPR/Cas9 library for functional genomics in human cells. Nature 509, 487-491 (2014). Ezkurdia, I. et al. Multiple evidence strands suggest that there may be as few as 19,000 human protein-coding genes. Hum Mol Genet 23, 5866-5878 (2014). Rinn, J. L. & Chang, H. Y. Genome regulation by long noncoding RNAs. Annu Rev Biochem 81, 145-166 (2012). Quinn, J. J. & Chang, H. Y. Unique features of long non-coding RNA biogenesis and function. Nat Rev Genet 17, 47-62 (2016). Kretz, M. et al. Control of somatic tissue differentiation by the long non-coding RNA TINCR. Nature 493, 231-235 (2013). Zhu, S. et al. Genome-scale deletion screening of human long non-coding RNAs using a paired-guide RNA CRISPR-Cas9 library. Nat Biotechnol 34, 1279-1286 (2016). Guttman, M. et al. lincRNAs act in the circuitry controlling pluripotency and differentiation. Nature 477, 295-300 (2011). Lin, N. et al. An evolutionarily conserved long noncoding RNA TUNA controls pluripotency and neural lineage commitment. Mol Cell 53, 1005-1019 (2014). Liu, S. J. et al. CRISPRi-based genome-scale identification of functional long noncoding RNA loci in human cells. Science 355 (2017). Adamson, B., Smogorzewska, A., Sigoillot, F. D., King, R. W. & Elledge, S. J. A genome-wide homologous recombination screen identifies the RNA-binding protein RBMX as a component of the DNA-damage response. Nat Cell Biol 14, 318-328 (2012). Sambrook, Fritsch and Maniatis, MOLECULAR CLONING: A LABORATORY MANUAL, 2nd edition (1989). F. M. Ausubel, et al. eds., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY (1987). M.J. MacPherson, B.D. Hames and G.R. Taylor eds., METHODS IN ENZYMOLOGY (Academic Press, Inc.): PGR 2: A PRACTICAL APPROACH (1995). Harlow and Lane, eds. ANTIBODIES, A LABORATORY MANUAL, (1988). R.L Freshney, ed., ANIMAL CELL CULTURE (1987). Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990). Seed, 1987. Nature 329: 840 (Seed, B. An LFA-3 cDNA encodes a phospholipid-linked membrane protein homologous to its receptor CD2. Nature (1987) 329: 840-842.) Kaufman, et al., 1987. EMBO J. 6: 187- 195 (Randal J, Kaufman, et al. Translational efficiency of polycistronic mRNAs and their utilization to express heterologous genes in mammalian cells. The EMBO Journal (1987) 6: 187- 195) Clancy, Suzanne. RNA Splicing: Introns and exons and Spliceosome. Nature Education. 1, 31 (2008). Black, Douglas L. Mechanisms of Alternative Pre-Messenger RNA Splicing. Annual Review of Biochemistry. 72: 291-336 (2003). Ng, Bernard; Yang, Fan; et al. Increased noncanonical splicing of autoantigen transcripts provides the structural basis for expression of untolerized epitopes. Journal of Allergy and Clinical Immunology. 114: 1463-70(2004). Lim, KH; Ferraris, L; et al. Using positional distribution to identify splicing elements and predict pre-mRNA processing defects in human genes. Proc. Natl. Acad. Sci. USA. 108: 11093-11098 (2011). Warf, MB; Berglund, JA. Role of RNA structure in regulating pre-mRNA splicing. Trends Biochem. Sci. 35: 169-178 (2010). Warf, MB; Berglund, JA. Role of RNA structure in regulating pre-mRNA splicing. Trends Biochem. Sci. 35 (3): 169-178 (2010). Ren, Q. et al. A Dual-Reporter System for Real-Time Monitoring and High-throughput CRISPR/Cas9 Library Screening of the Hepatitis C Virus. Scientific reports 5, 8865 (2015). Wang, T. et al. Identification and characterization of essential genes in the human genome. Science 350, 1096-1101 (2015). Li, B. & Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC bioinformatics 12, 323 (2011). Leng, N. et al. EBSeq: an empirical Bayes hierarchical model for inference in RNA-seq experiments. Bioinformatics 29, 1035-1043 (2013). Jiao, X. et al. DAVID-WS: a stateful web service to facilitate gene/protein list analysis. Bioinformatics 28, 1805-1806 (2012). Crooks, G. E., Hon, G., Chandonia, J. M. & Brenner, S. E. WebLogo: a sequence logo generator. Genome Res 14, 1188-1190 (2004). Matlin, A. J., Clark, F. & Smith, C. W. Understanding alternative splicing: towards a cellular code. Nat Rev Mol Cell Biol 6, 386-398 (2005). Taggart, A. J., DeSimone, A. M., Shih, J. S., Filloux, M. E. & Fairbrother, W. G. Large-scale mapping of branchpoints in human pre-mRNA transcripts in vivo. Nat Struct Mol Biol 19, 719-721 (2012). Hsu, P. D. et al. DNA targeting specificity of RNA-guided Cas9 nucleases. Nat Biotechnol 31, 827-832 (2013). Xu, H. et al. Sequence determinants of improved CRISPR sgRNA design. Genome Res 25, 1147-1157 (2015). Heidari, N. et al. Genome-wide map of regulatory interactions in the human genome. Genome Res 24, 1905-1917 (2014). Muller, R. Y., Hammond, M. C., Rio, D. C. & Lee, Y. J. An Efficient Method for Electroporation of Small Interfering RNAs into ENCODE Project Tier 1 GM12878 and K562 Cell Lines. J Biomol Tech 26, 142-149 (2015). Joung, J. et al. Genome-scale activation screen identifies a lncRNA locus regulating a gene neighbourhood. Nature (2017). Goyal, A. et al. Challenges of CRISPR/Cas9 applications for long non-coding RNA genes. Nucleic Acids Res 45, e12 (2017).
本開示は特に、ゲノム領域の機能を研究するための方法、および調節機能を有するIncRNAをスクリーニングおよび同定するための方法を提供する。これらの方法は、ここで提供される新しく開発されたCRISPR/Casシステムをベースとしたライブラリースクリーニングに部分的に依存する。
一態様では、本発明の方法は、IncRNAスプライス部位周辺の特定のゲノム配列を切断するCRISPR/Casシステムの能力を利用して、エクソンスキッピングまたはイントロン保持をIncRNAに導入し、これにより、IncRNA機能の干渉または排除を引き起こす。標的とされるゲノム部位は、具体的には、長鎖ノンコーディングRNA(IncRNA)をコードするゲノム遺伝子のスプライス部位周辺のゲノム領域であり、この領域は、長鎖ノンコーディングRNAのSD部位またはSA部位周辺の-50bp~+75bpの領域にまたがり、より好ましくは、-30bp~+30bpの領域、もっとも好ましくは、前記長鎖ノンコーディングRNAのSD部位またはSA部位周辺の-10bp~+10bpの領域にまたがる。標的とされるIncRNAスプライス部位周辺の配列は切断され、宿主細胞中の細胞の非相同末端結合(NHEJ)メカニズムによって突然変異し、このような突然変異は、エクソンスキッピングおよび/またはイントロン保持を引き起こし、これによってIncRNAの機能または活動を実質的に排除する。
本分野で既知のように、CRISPR/Casシステムヌクレアーゼは、ゲノムDNAを切断するためにガイドRNAを必要とする。これらのガイドRNAは、(1)CRISPR/Casシステムヌクレアーゼが配列特異的な方法でゲノム位置の異なる配列を標的とする19~21のヌクレオチドのスペーサー配列(ガイドRNA)と、(2)ガイドRNAの間に位置し、ガイドRNAがCRISPR/Casシステムヌクレアーゼに結合できるようにするヘアピン配列とで構成される。
本文で提供される方法は、プロモーターに操作可能に連結された、長鎖ノンコーディングRNAのスプライス部位周辺のゲノム配列を標的とするガイド配列とヘアピン配列とを含むCRISPR/CasガイドRNA構築体を宿主細胞に導入し、前記ゲノム配列を標的とする前記ガイドRNA(guide RNA)を前記宿主細胞において発現させることに係る。一つの実施形態では、前記ガイド配列は、長鎖ノンコーディングRNAのSD部位またはSA部位周辺の-50bp~+75bpの領域のゲノム配列を標的とし、より好ましくは、長鎖ノンコーディングRNAのSD部位またはSA部位周辺の-30bp~+30bpの領域、最も好ましくは、長鎖ノンコーディングRNAのSD部位またはSA部位周辺の-10bp~+10bpの領域のゲノム配列を標的とする。
場合によっては、前記方法は、前記長鎖ノンコーディングRNAの機能プロファイルを決定することをさらに含む。ゲノム遺伝子(コーディング遺伝子またはノンコーディング遺伝子)の発現またはその遺伝子産物(コーディングタンパク質)の機能的活性は、IncRNA調節機能の表現とすることができる。あるいは、レポーター遺伝子のコード配列をゲノムに挿入する(例えば、元のコード配列の代わりとする)ことができ、その発現またはその遺伝子産物の機能的活性の変化を、当該長鎖ノンコーディングRNAの機能プロファイルの表現として使用することができる。場合によっては、レポーター遺伝子のコード配列は元のコード配列と融合し、しかも前記表現は、得られた融合タンパク質のmRNAまたはタンパク質発現または前記融合タンパク質の機能的活性である。
一態様では、本文に開示される方法は、例えば、細胞生存、細胞分裂、細胞代謝、アポトーシス、細胞サイクル、ヌクレオソームアセンブリ、シグナル伝達、多細胞生物の発達、免疫応答、細胞接着、血管新生などのIncRNAを含む、転写以外の細胞プロセスにおけるIncRNAをスクリーニングおよび同定することに使用することができる。一部の実施形態では、前記方法は、細胞生存、細胞分裂、細胞代謝、アポトーシス、細胞サイクル、ヌクレオソームアセンブリ、シグナル伝達、多細胞生物の発達、免疫応答、細胞接着、血管新生などからなる群より選択される細胞プロセスの変化を引き起こすIncRNAを同定することに使用することができる。一部の実施形態では、前記方法は、機能の喪失または機能の獲得など、細胞の表現型の変化を引き起こすIncRNAを同定することに使用することができる。一部の実施形態では、前記方法は、コード遺伝子および/または非コード遺伝子の転写の減少または増加を引き起こすIncRNAを同定することに使用することができる。前記方法は、1つまたは複数のIncRNAの効果を同時にまたは順次にまたは単独にまたは組み合わせて同定することに使用することができる。
例えば、細胞集団をCRISPR/CasガイドRNAライブラリーでトランスフェクトする。前記CRISPR/CasガイドRNAは、IncRNAのスプライス部位周辺のゲノム配列を標的とするガイドRNAの異なる配列をそれぞれコードし、前記細胞において前記ガイドRNAを発現させ、CRISPR/Casの存在下で、前記ガイドRNAはIncRNAのエクソンスキッピングおよび/またはイントロン保持を引き起こす。各細胞のRNAプロファイルとトランスクリプトームは、例えば、単一細胞RNAシーケンス(RNA-Seq)テクノロジーを使用して分析できるが、これに限定されない。前記分析により、RNA分子の種類と量を含む、RNAプロファイルに対する細胞ゲノム変異の影響が明らかになる。この方法は、エクソンスキッピングまたはイントロン保持を実現するガイドRNAの特性(例えば、配列)を同定することに使用することができる。したがって、エクソンスキッピングまたはイントロン保持の効果は、単一細胞での実験を通して細胞トランスクリプトーム全体ですぐに観察できる。
よって、本文は、プロモーターに操作可能に連結された、長鎖ノンコーディングRNAのスプライス部位周辺のゲノム配列を標的とするガイド配列とヘアピン配列とを含むCRISPR/CasガイドRNA構築体を提供する。
一部の実施形態では、前記真核生物ゲノムはヒトゲノムであってもよいので、CRISPR/Casガイド構築体はヒト細胞での使用を目的とすることができる。
前記ガイド配列の長さは、19~21ヌクレオチドであってもよい。前記ヘアピン配列の長さは、100ヌクレオチド未満、80ヌクレオチド未満、60ヌクレオチド未満、または約40ヌクレオチドであってもよい。他の実施形態では、前記ヘアピン配列の長さは、約20~60ヌクレオチド長であってもよい。転写されると、前記ヘアピン配列はCRISPR/Casヌクレアーゼに結合することができる。
前記CRISPR/Casガイド構築体は実質的にはDNAであり、転写されるとガイドRNAを生成する。
本文はさらに、上記宿主細胞のいずれかを含む細胞集団を提供する。この宿主細胞集団は、同種または異種であってもよい。
一部の実施形態では、前記細胞は、CRISPR/Casヌクレアーゼおよび/またはCRISPR/Casヌクレアーゼのコード配列をさらに含む。一部の実施形態では、前記細胞は、Cas9ヌクレアーゼおよび/またはCas9ヌクレアーゼのコード配列をさらに含む。
一部の実施形態では、レポータータンパク質またはレポータータンパク質を含む融合タンパク質のコード配列は、宿主細胞のゲノムに組み込まれる。
一部の実施形態では、前記宿主細胞が宿主細胞集団内にあり、各宿主細胞が独立してユニークなガイドRNA構築体を含む。
一部の実施形態では、各宿主細胞はユニークな機能的ガイドRNAを発現し、当該ガイドRNAの関与により、前記宿主細胞は前記集団内の他の宿主細胞と比較して異なるゲノム配列に変異する。
本願はさらに、IncRNAのスプライス部位周辺のゲノム配列を標的とするCRISPR/CasガイドRNAライブラリーを宿主細胞集団に導入することを含む、真核細胞ゲノムにおいて長鎖ノンコーディングRNAをスクリーニングまたは同定するためのハイスループット方法を提供し、前記細胞集団の各宿主細胞は独立してユニークな機能的ガイドRNAを含み、このユニークなガイドRNAを発現し、CRISPR/Casヌクレアーゼの存在下で、標的とされるゲノム配列を切断して変異させ、これによってIncRNAのエクソンスキッピングおよび/またはイントロン保持を引き起こす。
一部の実施形態では、前記ハイスループット方法は、細胞表現型の変化またはコード遺伝子または非コード遺伝子の発現の変化に対するIncRNAの影響を同定することをさらに含む。一部の実施形態では、各宿主細胞はユニークなガイドRNAを発現し、前記集団内の他の宿主細胞と比較して異なるゲノム配列に変異する。一部の実施形態では、前記コード遺伝子は前記細胞のゲノムに対して外因性または内因性である。一部の実施形態では、前記細胞表現型の変化は、機能の喪失または機能の獲得を含む。一部の実施形態では、前記コード遺伝子または非コード遺伝子の発現の変化は、コード遺伝子または非コード遺伝子の転写の増加または減少である。
本発明はさらに、本文に開示されたハイスループット方法によるIncRNAのスクリーニングまたは同定を提供する。これらのIncRNAは、XXbac-B135H6.15、RP11-848P1.5、AC005330.2、AP001062.9、AP005135.2、RP11-867G23.4、LINC01049、DGCR5、RP11-509A17.3、CTB-25J19.1、CTD-2517M22.17、CROCCP2、AC016629.8、CTC-490G23.4、RP11-117D22.1、AC067969.2、RP11-251M1.1、AC004471.9、AC004471.10、AC002472.11、RP11-429J17.7、RP11-56N19.5、TMEM191A、LL22NC03-102D1.18、LINC00410、LL22NC03-23C6.13、RP11-83J21.3、RP11-544A12.4、ANKRD62P1-PARP4P3、CTD-2031P19.5、XXbac-B444P24.8、RP11-464F9.21、TPTEP1、MIR17HG、およびBMS1P20を含むが、これらに限定されず、細胞の成長または増殖を調節するために使用できる。
本発明はさらに、長鎖ノンコーディングRNAの1つまたは複数のスプライス部位周辺の1つまたは複数のポリヌクレオチド配列を標的とする1つまたは複数のCRISPR/CasガイドRNAを真核細胞に導入し、これによって前記1つまたは複数のガイドRNAは、前記長鎖ノンコーディングRNAの1つまたは複数のスプライス部位周辺の1つまたは複数のポリヌクレオチド配列を標的とし、Casタンパク質の存在下で前記1つまたは複数のポリヌクレオチド配列を切断し、長鎖ノンコーディングRNAのイントロン保持および/またはエクソンスキッピングをもたらし、これによって長鎖ノンコーディングRNAの機能を干渉または排除することを含む、真核細胞における長鎖ノンコーディングRNAの機能を干渉または排除するための方法を提供する。一部の実施形態では、前記ガイドRNAは、長鎖ノンコーディングRNAのSD部位またはSA部位周辺の-50bp~+75bpの領域のポリヌクレオチド配列を標的とする。一部の実施形態では、前記ガイドRNAは、長鎖ノンコーディングRNAのSD部位またはSA部位周辺の-30bp~+30bpの領域のポリヌクレオチド配列を標的とする。一部の実施形態では、前記ガイドRNAは、長鎖ノンコーディングRNAのSD部位またはSA部位周辺の-10bp~+10bpの領域のポリヌクレオチド配列を標的とする。一部の実施形態では、前記CRISPR/CasヌクレアーゼはCas9またはCpflである。一部の実施形態では、前記細胞への導入は、ウイルス粒子、リポソーム、エレクトロポレーション、マイクロインジェクション、カップリング、ナノ粒子、エクソソーム、微小胞、または遺伝子銃を含む送達システムによるものであり、好ましくは、レンチウイルス粒子を含む送達システムによるものである。
図1のaは、ヒトスプライス部位のゲノム配列特性と塩基特異性を示す図である。y軸は、各遺伝子座の塩基の確率を示す。図1のbは、スプライスドナー(SD)またはスプライスアクセプター(SA)部位周辺を標的とするsgRNAによって引き起こされるイントロン保持またはエクソンスキッピングを示す模式図である。 この図は、必須リボソーム遺伝子のsgRNAライブラリーのスクリーニングにおいて重複実験間の相関関係を示す。HeLa細胞株(a)とHuh7.5細胞株(b)の0日目のコントロールサンプル(Ctrl)と15日目の実験サンプル(Exp)を含むスプライシングターゲティングライブラリーの正規化されたsgRNA読み取りカウントの散布図である。各サンプルの2つの重複実験間のSpearman相関係数(Spearman corr.)も報告されている。 HeLaおよびHuh7.5細胞株のリボソーム遺伝子を標的とするsgRNAライブラリーのCRISPRスクリーニングのディープシーケンス分析を示す図である。79のリボソーム遺伝子の5’SD部位周辺の-50bp~+75bpの領域、および3’SA部位周辺の-75bp~+50bpの領域を標的とするように、sgRNA飽和突然変異誘発ライブラリーを設計した。混合プラスミドライブラリーは、レンチウイルスによってCas9タンパク質を発現するHeLaおよびHuh7.5細胞に形質導入された。示された各遺伝子座でのすべてのsgRNAの損失を、正規化された読み取りカウントのlоg(Exp:Ctrl)で計算し、黒いバーは各遺伝子座でのすべてのsgRNAの平均倍数変化を表す。点線はスプライス部位の位置を示す。 スプライス部位の妨害を生成するsgRNAターゲット領域の同定を示す図である。図4のaは、HeLaおよびHuh7.5細胞株中の各遺伝子座での高効率sgRNAの正規化を示す図である。データは、損失が4倍を超えるsgRNAの数を示された遺伝子座で設計されたsgRNAの総数で割ることによって計算された。図4のbは、HeLaおよびHuh7.5細胞株におけるイントロン、5’SD部位およびエクソンを標的とする高効率sgRNAの比較を示す図である。各バーは、異なる領域で2倍または4倍を超える損失があるsgRNAの割合を表す。データは平均値±s.e.mとして表される。図4のcは、HeLaおよびHuh7.5細胞株におけるイントロン、3’SA部位およびエクソンを標的とする高効率sgRNAの比較を示す図である。データは平均値±s.e.mとして表される。 細胞の成長と増殖に必要なIncRNAを同定するためのCRISPRシステムの構築とゲノムスケールのスクリーニングを示す図である。図5のaは、CRISPRシステムの構築を示す図である。図5のbは、ターゲットスプライシングsgRNAライブラリーの構築、スクリーニング、およびデータ分析のフローを示す図である。図5のcは、2つの独立した重複間のsgRNA倍数変化の散布図である。図5のdは、非標的sgRNA、必須遺伝子とIncRNAを標的とするsgRNAのlоg(倍数変化)分布図である。各群の倍数変化を、t検定によって非標的sgRNAと比較した。***P<0.001。図5のeは、スプライシングターゲティングしたCRISPRによってスクリーニングされたネガティブに選択されたIncRNAのスクリーンスコアを示す図である。各IncRNAについて、すべてのターゲットsgRNAの倍数変化をWilcox検定によってネガティブコントロールsgRNAと比較し、生成されたP値をネガティブコントロール遺伝子の帰無分布(ネガティブコントロールsgRNAをランダムにサンプリングして得られた)によってさらに補正した。スクリーンスコアは、平均倍数変化と補正されたP値から計算された(方法部分参照)。トップ10のIncRNAとネガティブに選択された必須遺伝子はそれぞれラベル付けされた。 候補のIncRNA機能の検証を示す図である。図6のa~cは、K562およびGM12878細胞の細胞増殖に対する示されたsgRNAの影響を示し、これには、3つのコントロールsgRNA、非標的sgRNA、AAVS1遺伝子座を標的とするsgRNA、RPL18(細胞の成長に必須な遺伝子)のスプライス部位を標的とするsgRNA(a)と2つのネガティブに選択されたIncRNA(b、c)が含まれる。CMVプロモーターによって駆動されるEGFPマーカーを担持するsgRNAのレンチウイルス発現ベクターをそれぞれK562とGM12878細胞に形質導入した。EGFP陽性細胞の割合を3日ごとにFACSで測定し、sgRNA感染細胞を示した。最初のFACS分析は、感染の3日後(0日目と表記)に開始し、続いて混合細胞を12日間継代した。各サンプルの細胞増殖は、示された時点でのEGFP陽性細胞の割合を0日目の割合で割ることによって決定された。データは、3つの生物学的重複実験の平均値と標準偏差として表される。アスタリスク(*)は、t検定を使用して計算されBenjamini-Hochberg法を使用して補正された、アッセイの終了時(12日目)のAAVS1を標的とするsgRNAと比較したP値を表す。*P<0.05;**P<0.01;***P<0.001;****P<0.0001;NS、有意ではない。図6のdは、ターゲットスプライシングの戦略を通じて、GM12878細胞と比較して、K562細胞における最初の35の候補IncRNAの細胞増殖を示す図である。前記最初の35の候補IncRNAは、XXbac-B135H6.15、RP11-848P1.5、AC005330.2、AP001062.9、AP005135.2、RP11-867G23.4、LINC01049、DGCR5、RP11-509A17.3、CTB-25J19.1、CTD-2517M22.17、CROCCP2、AC016629.8、CTC-490G23.4、RP11-117D22.1、AC067969.2、RP11-251M1.1、AC004471.9、AC004471.10、AC002472.11、RP11-429J17.7、RP11-56N19.5、TMEM191A、LL22NC03-102D1.18、LINC00410、LL22NC03-23C6.13、RP11-83J21.3、RP11-544A12.4、ANKRD62P1-PARP4P3、CTD-2031P19.5、XXbac-B444P24.8、RP11-464F9.21、TPTEP1、MIR17HG、およびBMS1P20である。しきい値は80%に設定され、これは、12日目のsgRNA感染細胞の正規化された割合である。明るい灰色の点は、K562細胞でのみ必要なIncRNAを示し、暗い灰色の点は、K562とGM12878細胞の両方で成長表現型を示すものを示す。図6のeは、K562細胞の細胞増殖に対するIncRNA XXbac-B135H6.15の大きな断片の欠失の影響を示す図である。プロモーターと最初のエクソンを削除するために4対のgRNAが設計された。EGFPマーカーを含む骨格からもpgRNAを発現させ、図3に従って細胞増殖試験を実施した(a~c)。データは、3つの生物学的重複実験の平均値と標準偏差として表されている。アスタリスクは、t検定を使用して計算されBenjamini-Hochberg法を使用して補正された、15日目のAAVS1_p1と比較したP値を表す。*P<0.05;**P<0.01;***P<0.001;****P<0.0001;NS、有意ではない。図6のfは、スプライシングターゲティングとpgRNAを介した欠失法の間の上位IncRNA候補に対するノックアウト効果の相関を示す図である。 スプライシングターゲティング戦略を通して得られた最高ランキングのIncRNAの検証証拠を提供する。 スプライシングターゲティング戦略を通して得られた最高ランキングのIncRNAの検証証拠を提供する。 スプライシングターゲティング戦略を通して得られた最高ランキングのIncRNAの検証証拠を提供する。 スプライシングターゲティング戦略を通して得られた最高ランキングのIncRNAの検証証拠を提供する。 スプライシングターゲティング戦略を通して得られた最高ランキングのIncRNAの検証証拠を提供する。 スプライシングターゲティング戦略を通して得られた最高ランキングのIncRNAの検証証拠を提供する。 大きな断片の欠失による候補IncRNAの検証を提供する図である。図13のaは、AAVS1遺伝子座と必須遺伝子RPL19、RPL23Aの大きな断片の欠失によるK562細胞の細胞増殖試験を示す図である。AAVS1遺伝子座について2対のgRNAが設計され、プロモーターと最初のエクソンを削除するために各必須遺伝子について1対のgRNAが設計された。pgRNAの設計原理と成長効果の測定方法は図3のeで説明されたものと同じであり、残りの図もそれと同じである。データは、3つの生物学的重複実験の平均値と標準偏差として表されている。アスタリスクは、t検定を使用して計算されBenjamini-Hochberg法を使用して補正された、15日目のAAVS1_p1と比較したP値を表す。*P<0.05;**P<0.01;***P<0.001;****P<0.0001;NS、有意ではない。図13のbは、5つの候補IncRNAの大きな断片の欠失による細胞成長への影響を、スプライシングターゲティング戦略を通して検証した図である。 この図は、大きな断片の欠失による候補IncRNAの検証を提供し、6つの候補IncRNAは、K562細胞でのスプライシングターゲティング戦略によって検証しなかった。 K562およびGM12878細胞株におけるIncRNAs MIR17HGおよびBMS1P20の機能分析を示す図である。図15のaでは、最初の500遺伝子の発現パターンは、MIR17HG-およびBMS1P20-KO(ノックアウト)細胞とそれらに対応するコントロールで最も高い変動性を示した。図15のbは、K562およびGM12878細胞における最初の100の必須IncRNA候補の発現レベルを示す図である。図15のcは、野生型K562細胞と比較してMIR17HG-とBMS1P20-KO細胞でダウンレギュレートされた必須遺伝子の発現レベルを示す図である。図15のdは、MIR17HG-とBMS1P20-KO K562細胞の間の必須遺伝子のダウンレギュレーションを示すVeen図(Veen diagram)である。図15のeは、GM12878細胞と比較したK562細胞におけるBMS1P20のスプライシングターゲティングsgRNAの感染後の差次的発現の火山プロットである。黒と灰色の点は、それぞれすべての遺伝子と差次的に発現した遺伝子を表す。図15のfは、K562細胞でダウンレギュレート(上図)およびアップレギュレート(下図)された遺伝子の遺伝子オントロジー(GO)用語およびKEGG注釈である。 K562およびGM12878細胞におけるMIR17HGおよびBMS1P20のIncRNAノックアウトのRNA-seqプロファイルを示す図である。図16のaは、MIR17HG-KO(ノックアウト)、BMS1P20-KO、および野生型K562細胞の遺伝子発現レベルのペア散布図である。図16のbは、MIR17HGノックアウト、BMS1P20ノックアウト、および野生型GM12878細胞d遺伝子発現レベルのペア散布図である。図16のcは、K562細胞でMIR17HGおよびBMS1P20のスプライシングターゲティングsgRNAに感染した後、ダウンレギュレーションを示す保存された必須遺伝子の遺伝子オントロジーおよびKEGG注釈である。図16のdは、BMS1P20-KOと野生型K562細胞間の差次的発現の火山プロットである。図16のeは、BMS1P20-KOと野生型GM12878細胞間の差次的発現の火山プロットである。
定義
本発明は、特定の実施形態に基づいて図面を参照して説明されるが、本発明はそれに限定されず、保護範囲は請求の範囲によって限定される。請求項の中の参照記号は、いずれも範囲を制限するものとして解釈されるべきではない。図面では、説明のため、一部の要素のサイズが誇張されており、縮尺通りに描かれていない場合がある。本明細書および請求の範囲において「含む」という用語が使用される場合、その他の要素またはステップを除外しない。単数の名詞を言及する時に「1つ」、「一種」または「これ」、「この」などのような表現が使用されるが、特に明記しない限り、これらの表現には当該名詞の複数形も含まれる。
本発明はまた、本発明を理解するように以下の用語または定義を提供する。本文で特に定義しない限り、本文で使用されるすべての用語は、本発明の技術分野の当業者にとっての意味と同じ意味を有する。本分野におけるこれらの定義と用語について、具体的な実践者は、Sambrook et al.,Molecular Cloning:A Laboratory Manual,2nd ed.,Cold Spring Harbor Press,Plainsview,New York(1989);およびAusubel et al.,Current Protocols in Molecular Biology (Supplement 47),John Wiley & Sons,New York(1999)を参照することができる。本文で提供される定義は、当業者が理解する範囲よりも狭い範囲を有すると解釈されるべきではない。
「ポリヌクレオチド」、「ヌクレオチド」、「ヌクレオチド配列」、「核酸」、および「オリゴヌクレオチド」という用語は、置き換えて使用することができる。これは、任意の長さのポリマー形態のヌクレオチドを指し、デオキシリボヌクレオチドまたはリボヌクレオチドまたはそれらの類似体であってもよい。ポリヌクレオチドは、任意の三次元構造を有することができ、既知または未知の任意の機能を実行することができる。ポリヌクレオチドの非限定的な例として、遺伝子または遺伝子フラグメントのコードまたは非コード領域、遺伝子座、エクソン、イントロン、メッセンジャーRNA(mRNA)、長鎖ノンコーディングRNA(IncRNA)、トランスファーRNA、リボソームRNA、短い干渉RNA(siRNA)、短いヘアピンRNA(shRNA)、マイクロRNA(miRNA)、リボザイム、cDNA、組換えポリヌクレオチド、分岐鎖ポリヌクレオチド、プラスミド、ベクター、単離された任意の配列のDNA、単離された任意の配列のRNA、核酸プローブおよびプライマーが挙げられる。ポリヌクレオチドは、メチル化ヌクレオチドおよびヌクレオチド類似体などの1つまたは複数の修飾されたヌクレオチドを含んでもよい。存在する場合、ヌクレオチド構造への修飾は、ポリマーの組立の前または後に与えることができる。非ヌクレオチド成分をヌクレオチドの配列に挿入することができる。ポリヌクレオチドは、標識成分とのカップリングなどによって、多量体化後にさらに修飾することができる。
本発明の一態様では、「キメラRNA」、「キメラガイドRNA」、「ガイドRNA」、「単一ガイドRNA」、および「合成ガイドRNA」という用語は置き換えて使用することができ、ガイド配列、tracr配列、およびtracrシャペロン配列を含むポリヌクレオチド配列を指す。「ガイド配列」という用語は、標的部位を特定するガイドRNA内の約20bpの配列を指し、「ガイド」または「スペーサー」という用語と置き換えて使用することができる。
本文で使用されるように、「発現」とは、DNAテンプレートからのポリヌクレオチド転写(例えば、mRNAまたは他のRNA転写物になるなど)のプロセス、および/または転写されたmRNAがその後に、ペプチド、ポリペプチドまたはタンパク質へ翻訳されるプロセスをいう。転写物およびコードされたポリペプチドは、まとめて「遺伝子生成物」と呼ばれることができる。ポリヌクレオチドがゲノムDNAに由来する場合、発現には真核細胞におけるmRNAのスプライシングを含むことができる。
特に明記しない限り、本発明の実施は、本技術分野の技術的範囲内である、免疫学、生化学、化学、分子生物学、微生物学、細胞生物学、ゲノミクス、および組換えDNAの従来の技術を使用する。Sambrook,Fritsch and Maniatis,MOLECULAR CLONING:A LABORATORY MANUAL,2nd editiоn(1989);CURRENT PROTOCOLS IN MOLECULAR BIOLOGY(F. M. Ausubel et al.,eds.,(1987));シリーズMETHODS IN ENZYMOLOGY(Academic Press, Inc.):PGR 2:A PRACTICAL APPROACH(M.J. MacPherson,B.D. Hames and G.R. Taylor eds.(1995))、Harlow and Lane,eds.(1988) ANTIBODIES,A LABORATORY MANUAL,およびANIMAL CELL CULTURE(R.L Freshney,ed.(1987))(非特許文献14-18)を参照。
本発明のいくつかの態様は、1つまたは複数のベクターを含むベクターシステム、またはその中のベクターに係る。原核または真核細胞でCRISPR転写物(例えば、核酸転写物、タンパク質、または酵素)を発現するようにベクターを設計することができる。例えば、CRISPR転写物は、大腸菌のような細菌細胞、昆虫細胞、酵母細胞、または哺乳動物細胞などで発現させることができる。適切な宿主細胞は、Goeddel,GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY 185,Academic Press,San Diego,Calif.(1990)(非特許文献19)にも詳しく記載されている。あるいは、組換え発現ベクターは、例えば、T7プロモーター調節配列およびT7ポリメラーゼを使用して、インビトロで転写および翻訳することができる。
一部の実施形態では、哺乳動物発現ベクターを使用し、ベクターは哺乳動物細胞における1つまたは複数の配列の発現を駆動することができる。哺乳動物発現ベクターの例として、pCDM8(非特許文献20)とpMT2PC(非特許文献21)が挙げられる。哺乳動物細胞で使用される場合、発現ベクターの調節機能は、主に1つまたは複数の調節要素によって提供される。例えば、よく使用されるプロモーターは、ポリオーマウイルス、アデノウイルス2、サイトメガロウイルス、シミアンウイルス40、および本文に開示され、本分野で知られている他のプロモーターに由来する。原核細胞と真核細胞の両方に使用される他の適切な発現システムについて、例えば、Sambrook et al.,MOLECULAR CLONING:A LABORATORY MANUAL,2nd ed.,Cold Spring Harbor Laboratory,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,1989(非特許文献14)の16と17章を参照できる。
一般的に言えば、「CRISPRシステム」とは、CRISPR関連(「Cas」)遺伝子の転写物、およびCRISPR関連遺伝子の発現に参与する、またはその活動をガイドする他の要素をまとめて指し、これは、Cas遺伝子をコードする配列、tracr(トランス活性化CRISPR)配列(例えば、tracrRNAまたは活性化部分tracrRNA)、tracr-シャペロン配列(内因性CRISPRシステムの背景で「直接リピート」およびtracrRNA-処理された部分直接リピートをカバーする)、ガイド配列(内因性CRISPRシステムの背景で「スペーサー」とも呼ばれる)またはCRISPR遺伝子座に由来する他の配列と転写物を含む。一部の実施形態では、CRISPRシステムの1つまたは複数の要素は、タイプI、タイプII、またはタイプIIIのCRISPRシステムに由来する。
CRISPR複合体を形成する背景において、「標的配列」は、ガイド配列がそれに相補的になるように設計された配列であり、標的配列とガイド配列との間のハイブリダイゼーションは、CRISPR複合体の形成を促進する。ハイブリダイゼーションを引き起こしてCRISPR複合体の形成を促進するのに十分な相補性を持っている場合、完全な相補は必要ではない。
典型的には、内因性CRISPRシステムの背景において、CRISPR複合体の形成(ガイド配列と標的配列がハイブリダイズして1つ以上のCasタンパク質と複合することを含む)により、標的配列中または標的配列の近く(例えば、標的配列から1、2、3、4、5、6、7、8、9、10、20、50またはそれ以上の塩基対の範囲内)の1つの鎖または2つの鎖の切断が引き起こされる。理論に拘束されるつもりはなく、tracr配列は、野生型tracr配列の全部または一部(例えば、野生型tracr配列の約20以上、23以上、26以上、29以上、32以上、35以上、38以上、41以上、44以上、47以上、50以上、53以上、56以上、59以上、62以上、65以上、70以上、75以上、80以上、85以上、またはそれ以上のヌクレオチド)、または上記からなるtracr配列を含むことができ、さらにCRISPR複合体の一部を形成することができ、例えば、tracr配列の少なくとも一部に沿って、ガイド配列に操作可能に連結されたtracrシャペロン配列の全部または一部とハイブリダイズする。
一部の実施形態では、tracr配列とtracrシャペロン配列は、ハイブリダイズしてCRISPR複合体の形成に参加するのに十分な相補性を有する。標的配列と同様に、その機能を発揮するのに十分である限り、完全な相補は必要ではない。一部の実施形態では、最適なアラインメントの場合、tracr配列はtracrシャペロン配列の長さに沿って少なくとも50%、60%、70%、80%、90%、95%または99%の相補性を有する。
一部の実施形態では、CRISPRシステムの1つまたは複数の要素の発現を駆動する1つまたは複数のベクターを宿主細胞に導入して、CRISPRシステム要素の発現は、1つまたは複数の標的部位でのCRISPR複合体の形成をガイドする。別の実施形態では、宿主細胞は、Cas9および/またはOCT1を安定して発現するように操作される。
一般的に言えば、ガイド配列は、標的配列にハイブリダイズしてCRISPR複合体と標的配列との配列特異的結合をガイドするように標的ポリヌクレオチド配列と十分な相補性を有する任意のポリヌクレオチド配列である。一部の実施形態では、適切なアラインメントアルゴリズムを使用して最適なアラインメントを行う場合、ガイド配列およびそれに対応する標的配列間の相補程度は約50%以上、60%以上、75%以上、80%以上、85%以上、90%以上、95%以上、97.5%以上、99%以上またはそれ以上である。最適なアラインメントは、配列をアラインメントするための任意の適切なアルゴリズムを使用して決定でき、その非限定的な例として、Smith-Watermanアルゴリズム、Needleman-Wimschアルゴリズム、Burrows-Wheeler Transformに基づいたアルゴリズム(例えば、Burrows Wheeler Aligner)、ClustalW、Clustai X、BLAT、Novoalign(Novocraft Technologies,ELAND((Illumina,San Diego,CA)、SOAP(soap.genomics.org.cnで入手可能)およびMaq(maq.sourceforget.netで入手可能)などが挙げられる。一部の実施形態では、ガイド配列の長さは、約5以上、10以上、11以上、12以上、13以上、14以上、15以上、16以上、17以上、18以上、19以上、20以上、21以上、22以上、23以上、24以上、25以上、26以上、27以上、28以上、29以上、30以上、35以上、40以上、45以上、50以上、55以上、60以上、65以上、70以上、75以上、またはそれ以上のヌクレオチドであってもよい。一部の実施形態では、ガイド配列の長さは、約75未満、70未満、65未満、60未満、55未満、50未満、45未満、40未満、35未満、30未満、25未満、20未満、15未満、12未満、またはそれより少ないヌクレオチドであってもよい。CRISPR複合体と標的配列の配列特異的結合をガイドするガイド配列の能力は、任意の適切な測定方法により評価することができる。例えば、対応する標的配列を有する宿主細胞に、CRISPR複合体を形成するには十分なCRISPRシステムのコンポーネント(テストされるガイド配列を含む)を提供してもよく、例えば、CRISPR配列コンポーネントをコードするベクターを使用してトランスフェクションし、そして標的配列内の優先的な切断(例えば、本明細書に記載のSurveyorにより測定する)を評価することで行うことができる。同様に、標的ポリヌクレオチド配列の切断は、試験管内で、標的配列、CRISPR複合体(テストされるガイド配列と、ガイド配列と異なる対照ガイド配列とを含む)のコンポーネントを提供し、標的配列へのテストと対照ガイド配列の結合または切断率を比較して評価することができる。当業者が想到できる他の試験も使用可能である。
一部の実施形態では、CRISPR酵素は、1つまたは複数の異種タンパク質ドメインを含む融合タンパク質の一部である(例えば、CRISPR酵素以外の約1以上、2以上、3以上、4以上、5以上、6以上、7以上、8以上、9以上、10以上のドメイン)。CRISPR酵素融合タンパク質は、任意の追加のタンパク質配列、および選択されてもよい、任意の2つのドメイン間のリンカー配列を含むことができる。CRISPR酵素と融合できるタンパク質ドメインの例には、エピトープタグ、レポーター遺伝子配列、および、メチラーゼ活性、デメチラーゼ活性、転写活性化活性、転写阻害活性、転写放出因子活性、RNA切断活性、および核酸結合活性からなる群より選ばれる1つまたは複数の活性を有するタンパク質ドメインが含まれるが、これらに限定されない。
いくつかの局面において、本発明は、本文に記載されるベクターを含む1つまたは複数の構築体、その1つまたは複数の転写物、および/またはそれにより転写される1つまたは複数のタンパク質のような1つまたは複数のポリヌクレオチドを宿主に送達することを含む方法を提供する。本発明は、DNAベースのゲノムの標的修飾のための基本的なプラットフォームとして使用することができ、ウイルス、リポソーム、エレクトロポレーション、マイクロインジェクション、およびカップリングを含むが、これらに限定されない任意の送達システムと組み合わせて使用できる。いくつかの局面において、本発明はさらに、このような方法によって生成された細胞、およびこれらの細胞を含むまたはこれらの細胞によって生成された生物(動物、植物、または真菌など)を提供する。一部の実施形態では、ガイド配列と組み合わされた(およびそれと複合されていてもよい)CRISPR酵素を細胞に送達する。従来のウイルスおよび非ウイルスベースの遺伝子転移法を使用して、核酸を哺乳動物細胞または標的組織に導入することができる。このような方法は、CRISPRシステムのコンポーネントをコードする核酸を培地または宿主生物の細胞に投与するために使用することができる。非ウイルスベクター送達システムは、DNAプラスミド、RNA(例えば、本文に記載のベクター転写物)、裸の核酸、およびリポソームなどの送達ベクターと複合した核酸を含む。ウイルスベクター送達システムは、細胞に送達するためのエピソームまたは組み込まれたゲノムを有するDNAとRNAウイルスを含む。
核酸の非ウイルス送達法は、リポフェクション、ヌクレオフェクション、マイクロインジェクション、遺伝子銃、ウイルス粒子、リポソーム、免疫リポソーム、ポリカチオンまたは脂質:核酸コンジュゲート、裸のDNAおよび人口ウイルス粒子を含む。
RNAまたはDNAウイルスベースのシステムを使用して核酸を送達することは、生体の特定の細胞を標的とし、ウイルス負荷を核に輸送するという効率的な利点を持っている。
好ましい実施形態では、本発明の標的は、200ヌクレオチドを超える長さのRNA分子などの、長い転写されたRNA分子のクラスを代表する長鎖ノンコーディングRNA(IncRNA)を含む。そのサイズにより、IncRNAは、ミクロRNA(miRNA)、短い干渉(miRNA)、Piwi-相互作用RNA(piRNA)、核小体RNA(snоRNA)、短いヘアピンRNA(shRNA)およびその他の短いRNAのような小さい調節RNAと区別付けられる。IncRNAは、DNAまたはRNAに結合するか、タンパク質に結合することによって配列特異的な方法で機能を発揮することができる。miRNAと相反に、IncRNAは通常の作用モードで機能しないように見えるが、様々な方法で遺伝子発現とタンパク質合成を調節することができる。
タンパク質をコードする遺伝子に対する位置に基づいて、IncRNAを以下の遺伝子座バイオタイプに分類できる。すなわち、2本の鎖から遺伝的に転写される遺伝子間IncRNA;完全にタンパク質コード遺伝子のイントロンにより転写されるイントロンIncRNA;タンパク質コード遺伝子のセンス鎖から転写され、タンパク質コード遺伝子の一部と重複する、またはイントロンを介してタンパク質コード遺伝子の配列全体をカバーするタンパク質コード遺伝子からのエクソンを含むセンスIncRNA;および、エクソンまたはイントロン領域と重複するタンパク質コード遺伝子のアンチセンス鎖から転写される、またはイントロンを介してタンパク質コード配列全体をカバーするアンチセンスIncRNAに分類できる。ヒトトランスクリプトーム分析の最近の研究は、タンパク質コード配列がゲノム転写物のごく一部しか占めていないことを示している。ほとんどのヒトゲノム転写物は非コードRNAである。
「IncRNA」という用語は、広義に本発明の標的を指し、「IncRNA遺伝子」およびそれによって生成される「IncRNA転写物」を含む。
本文で使用されるように、「エクソン」という用語は、最終的な成熟RNA(RNAスプライシングによってイントロンが除去された後の遺伝子から生成される)の一部をコードする遺伝子の任意の部分を指す。エクソンという用語は、遺伝子内のDNA配列およびRNA転写物内の対応する配列を指す。RNAスプライシングでは、イントロンが除去され、エクソンは、成熟したメッセンジャーRNAの一部として互いに共有結合している。
「イントロン」は、最終的なRNA生成物の成熟過程中にRNAスプライシングによって除去される遺伝子内の任意のヌクレオチド配列である。イントロンという用語は、遺伝子内のDNA配列とRNA転写物内の対応する配列を指す。RNAスプライシング後、配列は最終的な成熟RNAにおいて結合される。イントロンは、ほとんどの生物や複数のウイルスの遺伝子に見られ、タンパク質、リボソームRNA(rRNA)、長鎖ノンコーディングRNA(IncRNA)、および転送RNA(tRNA)を生成する遺伝子など、複数の遺伝子に存在することができる。イントロンを含む遺伝子からタンパク質を生成する場合、RNAスプライシングは転写後および翻訳前のRNA加工経路の一部である。
本文で使用される「スプライシング」という用語は、新生前駆体RNA(pre-mRNA)を成熟RNAに編集すること、例えば、新生前駆体メッセンジャーRNA(pre-mRNA)転写物を成熟メッセンジャーRNA(mRNA)に編集することを意味する。ほとんどの真核生物のイントロンでは、スプライシングは、スプライスソーム(核内低分子リボ核タンパク質(snRNP)の複合体)によって触媒される一連の反応で実行される。スプライスソームイントロンは通常、真核生物のタンパク質をコードする遺伝子の配列内にある。イントロン内では、スプライシングに必要なのは、ドナー部位(イントロンの5’末端)、分岐部位(イントロンの3’末端の近く)、およびアクセプター部位(イントロンの3’末端)である。より大きく、高度に保存されていない領域内では、スプライスドナー(SD)部位は、イントロン5’末端にほとんど変更しない配列GTを含む。イントロン3’末端のスプライスアクセプター(SA)部位は、ほとんど変更しないAG配列でイントロンを終止する。AGの上流(5’方向)にピリミジン(CとT)またはポリピリミジントラクトが豊富な領域がある。ポリピリミジントラクトのさらなる上流には分岐点があり、ラリアート形成に関与するアデニンヌクレオチドを含む(非特許文献22、23)。
核pre-mRNAイントロンは、イントロンとエクソンの境界に位置する特定のイントロン配列を特徴とする。スプライシング反応が始まると、これらの配列はスプライスソームRNA分子によって認識される。ほとんどのスプライスソームは、5’スプライス部位においてGTを含み、3’スプライス部位においてAGを含むイントロンをスプライシングし、このようなスプライシングは、古典的なスプライシングまたはラリアート経路と呼ばれ、99%以上のスプライシングはこのようなものである。対照的に、イントロン隣接配列がGT-AG規則に従わない場合、非古典的なスプライシングが発生し、スプライシングの1%未満を占めると言われる(非特許文献24)。
Weblogo3ツールを使用したバイオインフォマティクス分析では、ヒトゲノムの中の約99%のイントロン領域が5’部位でGTに隣接し、3’部位でAGに隣接していることは示されている。これらのイントロン領域は、コード遺伝子と非コードRNAに適する。
エクソンスキッピングは、最終RNAが1つまたは複数のエクソンを「スキップ」することを引き起こすRNAスプライシングの形式である。一方、イントロン保持は、スプライシング後にイントロンが最終RNAに残るRNAスプライシングの形式である。
スプライシングは、pre-mRNA上のトランス作用性タンパク質(リプレッサーおよび活性化タンパク質)および対応するシス作用性調節部位(サイレンサーおよびエンハンサー)によって調節される。ただし、代替スプライシングの複雑さの一部として、スプライシング因子の影響はしばしば位置に依存することに注意されたい。つまり、エクソンの背景では、イントロンエンハンサー要素と組み合わせると、スプライシング活性化タンパク質として機能するスプライシング因子は、そのスプライシング要素と組み合わせる時にリプレッサータンパク質として機能でき、その逆も成立する(非特許文献25)。pre-mRNA転写物の二次構造は、スプライシング要素をまとめたり、マスクされないとスプライシング因子の結合要素として機能する配列をマスクしたりすることで、スプライシングを調節する役割を果たす(非特許文献26)。総じて、これらの要素は、異なる細胞条件下でスプライシングがどのように発生するかを制御する「スプライシングコード」を形成する。
真核細胞における遺伝子の修飾
本発明の方法は、スプライス部位を標的とするsgRNAを効果的に送達してエクソンスキッピングおよび/またはイントロン保持を引き起こすことで、コード遺伝子または非コード遺伝子のような遺伝子を干渉することに係る。IncRNAをコードする遺伝子の場合、この方法はIncRNAの機能に効果的に影響を与えることができる。
CRISPRスクリーニングにおけるスプライシングターゲティングの有効性を評価するために、79のリボソーム遺伝子のスプライス部位を標的とする飽和ライブラリーを設計した。これらの遺伝子のほとんどは、様々な細胞株での細胞増殖に必要である。このライブラリーは5,788のsgRNAを含み、その切断部位は、これら79の遺伝子の各5’SD(スプライスドナー)部位周辺の50bp~+75bp、および各3’SA(スプライスアクセプター)部位周辺の50bp~+75bpの範囲内にある。明らかに、スプライス部位に影響を与えるsgRNAは、エクソン領域のみを標的とするsgRNAより優れており、sgRNA切断部位からスプライス部位までの距離が近いほど、遺伝子破壊の効果が高くなり、SDとSAの場合、ピークポイントは少しエクソンに向かっている。
CRISPR/Cas9の作用メカニズムとライブラリースクリーニングの原則
本発明の方法は、CRISPR/Casシステムを利用する。Cas9は、微生物由来のタイプII CRISPR(クラスター化された規則的に間隔を空けた短いパリンドロームリピート)システムであり、単一のガイドRNA(gRNA)とペアになった時DNAを切断することが示されている。gRNAは17~21bpの配列を含み、Cas9をゲノム内の相補領域へガイドするので、二本鎖切断(DSB)部位を特異的に生成することが可能になり、細胞の非相同末端結合(NHEJ)メカニズムによってエラーが発生しやすい方法で修復される。Cas9は主に、gRNA配列の後にPAM配列(-NGG)であるゲノム部位を切断する。NHEJを介したCas9誘導DSBの修復は、切断部位に様々な異なる変異を誘導し、前記切断部位は通常、より小さい(<10bp)挿入/削除(indel)であるが、より大きい(>100bp)挿入/削除(indel)および単一の塩基変化を含むこともできる。
本発明のスプライシングターゲティング法は、ゲノム内の複数の(例えば、数千の)配列のスクリーニングに使用でき、それにより、これらの配列の機能を解明する。一部の実施形態では、本発明のスプライシングターゲティング法は、生存、増殖、または薬剤耐性に必要な遺伝子を同定するために、CRISPR/Cas9システムを使用して長鎖非コードRNAのハイスループットスクリーニングを含む。スクリーニングでは、例えば、レンチウイルスベクターを通じて、標的遺伝子内の数万のスプライス部位を標的とするgRNAを集合としてCas9とともにターゲット細胞に送達する。予期の表現型を選択した後、細胞内で濃縮され、または枯渇しているgRNAを特定することにより、当該表現型に必要な遺伝子を体系的に特定することができる。
上記のハイスループットCRISPR/Cas9に基づいた方法では、gRNAライブラリーをレンチウイルスベクターにクローンすることができる。この場合、感染多重度(MOI)を減らすことで単一細胞内のガイドRNAの数を制限する必要がある。通常、各細胞には単一のガイドRNAしかない。各細胞へのgRNAの組み込むはランダムであり、各細胞が1つのgRNAのみを発現するプールされたスクリーニング(pooled screen)が可能になる。なお、本発明のスプライス部位を標的とするgRNAベースのゲノムハイスループットスクリーニングは、コード遺伝子および調節遺伝子の他のCRISPRベースのハイスループットスクリーニングにも使用できる。
ガイドRNA
本分野で知られているように、CRISPR/Casシステムヌクレアーゼは、RNAをガイドしてゲノムDNAを切断する必要がある。これらのガイドRNAは、(1)CRISPR/Casシステムヌクレアーゼを配列特異的にゲノム部位を標的とする、可変配列(ガイド配列)の19~21ヌクレオチドスペーサー(ガイド)と、(2)ガイドRNA間で恒常であり、ガイドRNAとCRISPR/Casシステムヌクレアーゼとの結合を可能にする不変のヘアピン配列とから構成される。CRISPR/Casヌクレアーゼの存在下で、ガイドRNAは、細胞内でCRISPR/Casベースのゲノム切断イベントをトリガーする。
ガイド配列は、予期の標的配列に基づいて選択または設計される。一部の実施形態では、前記標的配列は、スプライス部位周辺の配列であり、例えば、細胞ゲノム中のIncRNAをコードする遺伝子のSD部位周辺の-50bp~+75bpの領域、好ましくはSD部位周辺の-30bp~+30bpの領域、最も好ましくはSD部位周辺の-10bp~+10bpの領域;SA部位周辺の-50bp~+75bpの領域、好ましくはSA部位周辺の-30bp~+30bpの領域、最も好ましくはSA部位周辺の-10bp~+10bpの領域である。例示的な標的配列は、標的ゲノムに特有の配列を含む。
例えば、化膿性連鎖球菌(S.pyogenes)Cas9の場合、ゲノム内の特有の標的配列は、M8N12XGGの形式のCas9標的部位を含むことができ、ここで、N12XGG(NはA、G、TまたはCであり、Xは任意の1つであってもよい)はゲノムには単一に発生する頻度(単一の発生率)を有する。ゲノム内の特有の標的配列は、M9N11XGGの形式の化膿性連鎖球菌Cas9標的部位を含むことができ、ここで、N11XGG(NはA、G、TまたはCであり、Xは任意の1つである)はゲノムには単一に発生する頻度を有する。
好熱連鎖球菌(S.thermophilus)CRISPR1 Cas9の場合、ゲノム内の特有の標的配列は、M8N12XXAGAAWの形式のCas標的部位を含むことができ、ここで、N12XXAGAAW(NはA、G、TまたはCであり、Xは任意の1つであってもよく、WはAまたはTである)はゲノムには単一に発生する頻度を有する。ゲノム内の特有の標的配列は、M9N11XXAGAAWの形式の好熱連鎖球菌CRISPR1 Cas9標的部位を含むことができ、ここで、N12XXAGAAW(NはA、G、TまたはCであり、Xは任意の1つであってもよく、WはAまたはTである)はゲノムには単一に発生する頻度を有する。
化膿性連鎖球菌Cas9の場合、ゲノム内の特有の標的配列は、M8N12XGGXGの形式の標的部位を含むことができ、ここで、N12XGGXG(NはA、G、TまたはCであり、Xは任意の1つであってもよい)はゲノムには単一に発生する頻度を有する。ゲノム内の特有の標的配列は、M9N11XGGXGの形式の化膿性連鎖球菌Cas9標的部位を含むことができ、ここで、N12XGGXG(NはA、G、TまたはCであり、Xは任意の1つであってもよい)はゲノムには単一に発生する頻度を有する。これらの各配列では、「M」はA、G、TまたはCであってもよく、配列を特有の配列として識別する時にそれを考慮する必要はない。
なお、CRISPR/Casヌクレアーゼによって認識及び結合できる限り、任意のヘアピン配列を使用できることを理解すべきである。
ガイドRNA構築体
一部の実施形態では、本発明は、ガイドRNA構築体に係る。前記ガイドRNA構築体は、(1)ガイド配列および(2)ガイドRNAヘアピン配列、並びに選択されていてもよい(3)ガイドRNAの転写を開始することができるプロモーター配列を含み得る。ガイドRNAヘアピン配列の非限定的な例として、Chen et al.,Cell.2013 Dec 19;155(7):1479-91に記載のFEヘアピン配列が挙げられる。プロモーターの例として、ヒトU6プロモーターが挙げられる。
一部の実施形態では、本発明は、(1)ガイド配列および(2)ガイドRNAヘアピン配列、並びに選択されていてもよい(3)ガイドRNAの転写を開始することができるプロモーター配列を含む、CRISPR/Casガイド構築体に係る。前記ガイド配列は、真核細胞ゲノムのスプライス部位周辺の配列を標的とし、例えば、前記ガイド配列は、IncRNAをコードする遺伝子のSD部位またはSA部位周辺の-50bp~+75bpの領域、好ましくはSD部位またはSA部位周辺の-30bp~+30bpの領域、最も好ましくはSD部位またはSA部位周辺の-10bp~+10bpの領域を標的とする。一部の実施形態では、ガイド配列は、エクソンスキッピングおよび/またはイントロン保持を誘導するように、真核細胞ゲノム内の長鎖ノンコーディングRNAをコードする遺伝子のスプライス部位を標的とし、これによって長鎖ノンコーディングRNAを破壊する。一部の実施形態では、前記真核細胞ゲノムはヒトゲノムである。一部の実施形態では、前記ガイド配列は長さが19~21ヌクレオチドである。一部の実施形態では、前記ヘアピン配列は、長さが約40ヌクレオチドであり、転写されると、CRISPR/Casヌクレアーゼに結合することができる。
CRISPR/Casシステムヌクレアーゼ
一部の実施形態では、CRISPR/CasヌクレアーゼはタイプII CRISPR/Casヌクレアーゼである。一部の実施形態では、CRISPR/CasヌクレアーゼはCas9ヌクレアーゼである。一部の実施形態では、Cas9ヌクレアーゼは、肺炎連鎖球菌、化膿性連鎖球菌、または好熱連鎖球菌Cas9であり、これらの生物に由来する変異Cas9を含むことができる。前記ヌクレアーゼは、Cas9の機能的に同等の変異体であってもよい。一部の実施形態では、前記CRISPR/Casヌクレアーゼは、真核細胞で発現するためにコドン最適化されている。一部の実施形態では、CRISPR/Casヌクレアーゼは、標的配列の位置で1つまたは2つの鎖の切断を引き起こす。CRISPR/Casシステムヌクレアーゼは、Cas9とCpflを含むが、これらに限定されない。
レポーター遺伝子とタンパク質、および読み取り
一部の実施形態では、レポーター遺伝子は、CRISPR/Casメカニズムを使用して細胞に組み込むことができる。例えば、プロモーター(例えば、U6プロモーター)、ガイドRNAヘアピン配列、および所望のゲノムの遺伝子座を標的とするガイド配列を含むプラスミドのような発現ベクターを使用可能であり、前記遺伝子座は、前記レポーター構築体に組み込まれる。このような発現ベクターは、ガイド配列を他の要素を含む発現構築体にクローニングすることによって調製することができる。レポータータンパク質コード配列を含むDNAフラグメントを生成することができ、レポータータンパク質コード配列に隣接する相同性アームに含まれるようにその後に修飾される。ガイドRNA発現ベクター、レポータータンパク質をコードする配列を含む増幅されたDNAフラグメントおよびCRISPR/Casヌクレアーゼ(またはヌクレアーゼをコードする発現ベクター)を宿主細胞に(例えば、エレクトロポレーションを介して)導入する。発現ベクターは、発現ベクターに首尾よく感染した細胞を濃縮するために、抗生物質耐性マーカーなどの追加の選択マーカーをさらに含むことができる。レポータータンパク質を発現する細胞をさらに選択することができる。
レポーター遺伝子は、潜在的にトランスフェクトされた細胞を特定し、調節配列の機能を評価するために使用される。一般的に言えば、レポーター遺伝子は宿主細胞に対して内因性でも固有のものでもなく、それによってコードされるタンパク質は簡単に測定できる。簡単に測定できるタンパク質をコードするレポーター遺伝子は本分野で既知であり、緑色蛍光タンパク質(GFP)、グルタチオンSトランスフェラーゼ(GST)、ホースラティッシュペルオキシダーゼ(HRP)、クロランフェニコールアセチルトランスフェラーゼ(CAT)β-ガラクトシダーゼ、β-グルクロニダーゼ、ルシフェラーゼ、HcRed、DsRed、シアン蛍光タンパク質(CFP)、黄色蛍光タンパク質(YFP)、および青色蛍光タンパク質(BFP)を含む自己励起蛍光タンパク質、細胞表面マーカー、ネオ抗生物質などの耐性遺伝子などを含むが、これらに限定されない。
発現ベクター
「ベクター」という用語は、それに結合した別の核酸を輸送できる核酸分子を指す。ベクターは、一本鎖、二本鎖、または部分的に二本鎖の核酸分子;1つまたは複数の自由端を含む、自由端を含まない(例えば、環状)核酸分子;DNA、RNA、またはその両方を含む核酸分子;および本分野で知られている他の様々なポリヌクレオチドを含むが、これらに限定されない。ベクターの1つのタイプは「プラスミド」であり、これは、標準的な分子クローニング技術のように、追加のDNAセグメントが挿入される環状二本鎖DNAループを指す。一部のベクターは、それらが導入された宿主細胞で自己複製することができる(例えば、細菌の複製開始点を有する細菌ベクターおよびエピソーム哺乳動物ベクター)。宿主細胞に導入されると、他のベクター(例えば、非エピソーム哺乳動物ベクター)が宿主細胞のゲノムに組み込まれ、これによって宿主ゲノムと共複製する。また、一部のベクターは、操作可能に連結された遺伝子の発現をガイドすることができる。このようなベクターは、本文では「発現ベクター」と呼ばれる。組換えDNA技術における発現ベクターは、しばしばプラスミドの形をとる。
組換え発現ベクターは、宿主細胞において核酸を発現するのに適した形態で本発明に記載の核酸を含み得る。これは、前記組換え発現ベクターが、発現される核酸配列と操作可能に連結される、発現に使用される宿主細胞に従って選択可能な1つまたは複数の調節エレメントを含むことを意味する。組換え発現ベクターにおいて、「操作可能に連結」することは、ヌクレオチド発現を可能にする方法で目的ヌクレオチド配列を調節エレメントに連結することを意図する(例えば、インビトロ転写/翻訳システムにおいて、または前記ベクターが宿主細胞に導入される時に宿主細胞において発現する)。
宿主細胞
実際、インビトロで培養でき、しかも本文に記載のように修飾できる限り、任意の真核細胞タイプを宿主細胞として使用することができる。好ましくは、前記宿主細胞は、予め確立された(pre-established)細胞株である。前記宿主細胞と細胞株は、ヒト細胞または細胞株、若しくは非ヒト、哺乳動物細胞または細胞株であってもよい。
実施例
材料と方法
1、細胞と試薬
Z.Jiang実験室(北京大学)からのHeLa細胞株は、Dulbecco’s modified Eagle’s培地(DMEM,Gibco C11995500BT)で培養した。S.Cohen実験室(スタンフォード大学医学部)からのHuh7.5細胞株は、1%MEM非必須アミノ酸(NEAA,Gibco 1140-050)を添加したDMEM(Gibco)で培養した。H.Wu実験室(北京大学)からのK562細胞とCoriellセルバンクからのGM12878細胞は、RPMI1640培地(Gibco11875-093)で培養した。すべての細胞に、10%ウシ胎児血清(FBS、CellMax BL102-02)および1%ペニシリン/ストレプトマイシンを補充し、37℃、5%COで培養した。
2、イントロン保持またはエクソンスキッピングをテストするための逆転写PCR(RT-PCR)
sgRNAをCMVプロモーターによって駆動されるmCherryマーカーを持つレンチウイルス発現ベクターにクローニングし、そしてHeLaOC細胞(非特許文献1-4)をMOI<1でウイルス感染により形質導入し、感染して72時間後に、mCherry陽性細胞をFACSで選別し、RNAprep精製細胞/細菌キット(TIANGEN DP430)を使用して各サンプルから総RNAを抽出した。Quantscript RTキット(TIANGEN KR103-04)を使用して2μgの総RNAからcDNAを合成し、TransTaq HiFi DNAポリメラーゼ(TransGen AP131-13)を使用してRT-PCR反応を実施した。
RPL18またはRPL11遺伝子を標的とするsgRNA配列:
sgRNA1RPL18:5’-GGACCAGCCACTCACCATCC(配列番号1)
sgRNA2RPL18:5’-AGCTTCATCTTCCGGATCTT(配列番号2)
sgRNA3RPL11:5’-TCCTTGTGACTACTCACCTT(配列番号3)
sgRNA4RPL11:5’-AACTCATACTCCCGCACCTG(配列番号4)
RT-PCRに使用されるプライマー:
1F:5’-CTGGGTCTTGTCTGTCTGGAA(配列番号5)
1R:5’-CTGGTGTTTACATTCAGCCCC(配列番号6)
2F:5’-GGCCAGAAGAACCAACTCCA(配列番号7)
2R:5’-GACAGTGCCACAGCCCTTAG(配列番号8)
3F:5’-TCAAGATGGCGTGTGGGATT(配列番号9)
3R:5’-GACCAGCAAATGGTGAAGCC(配列番号10);
4F:5’-GATCCTTTGGCATCCGGAGA(配列番号11)
4R:5’-GCTGATTCTGTGTTTGGCCC(配列番号12)
3、必須リボソーム遺伝子のスプライシングターゲティングsgRNAライブラリーの構築とスクリーニング
79のリボソーム遺伝子の注釈をNCBIから検索した。これらの79の遺伝子を標的とするすべての潜在的なsgRNAを、各5’SD部位周辺の-50bp~+75bp、および各3’SA部位周辺の-75bp~+50bpの領域でスキャンした。前記遺伝子は、
RPL10、RPL10A、RPL11、RPL12、RPL13、RPL13A、RPL14、RPL15、RPL17、RPL18、RPL18A、RPL19、RPL21、RPL22、RPL22L1、RPL23、RPL23A、RPL24、RPL26、RPL26L1、RPL27、RPL27A、RPL28、RPL29、RPL3、RPL30、RPL31、RPL32、RPL34、RPL35、RPL35A、RPL36、RPL36A、RPL36AL、RPL37、RPL37A、RPL38、RPL39、RPL39L、RPL3L、RPL4、RPL41、RPL5、RPL6、RPL7、RPL7A、RPL7L1、RPL8、RPL9、RPS10、RPS11、RPS12、RPS13、RPS14、RPS15、RPS15A、RPS16、RPS19、RPS2、RPS20、RPS21、RPS23、RPS24、RPS25、RPS26、RPS27、RPS27A、RPS27L、RPS28、RPS29、RPS3、RPS3A、RPS4X、RPS4Y1、RPS4Y2、RPS5、RPS6、RPS7、RPS8を含む。すべてのsgRNAが、ヒトゲノム内の他の遺伝子座と少なくとも2つのミスマッチを持つことを確保した。ライブラリー内のsgRNAの自然な切断効率を示すために、GC含有量を設計で考慮しなかった。CustmoArray 12Kアレイチップ(CustmoArray,Inc.)を使用して、79個のリボソーム遺伝子を標的とする合計5,788個のsgRNAを合成した。ここでは、79個のリボソーム遺伝子のうちRPL18遺伝子を例として使用して、sgRNAの設計を説明する。
Figure 0007244885000001
Figure 0007244885000002
Figure 0007244885000003
Figure 0007244885000004
Figure 0007244885000005
Figure 0007244885000006
Figure 0007244885000007
Figure 0007244885000008
Cas9を発現するHeLaおよびHuh7.5細胞において、これらのsgRNAを運ぶ細胞ライブラリーをMOI<0.3のレンチウイルス送達によって構築し(非特許文献28)、最小カバレッジは400倍であった。ウイルス感染の72時間後、FACS(BD)を通じてmCherryに従って前記細胞を選別した。DNeasy BloodとTissueキット(QIAGEN 69506)を使用して、ゲノムDNA抽出のために各ライブラリーからコントロール細胞(2.4×10)を収集し、ゲノムDNA抽出の前に試験細胞を15日間培養した。各重複について、レンチウイルスにより組み込まれたsgRNAコード領域をTransTaq HiFi DNAポリメラーゼ(TransGen AP131-13)でPCRによって増幅し、前述のようにさらにDNA Clean & Concentrator-25(Zymo Research Corporation D4034)を使用して精製した(非特許文献4、9)。Illumina (NEB E7370L)に使用されるNEBNext Ultra DNA Library Prepキットを使用して調製したライブラリーを、ハイスループットシーケンス分析(Illumina HiSeq2500)に使用した。
4、ゲノムスケールのヒトIncRNAライブラリーの設計と構築
14,470個のIncRNAを含むGENCODEデータセットV20からIncRNAの注釈を検索した。このデータセットにおいて、第一フィルタリングステップでは、スプライス部位のない2477個のIncRNAを除去した。残りのIncRNAについて、各5’SD部位および3’SA部位周辺の-10bp~+10bpの領域を標的とするすべての潜在的な20-nt sgRNAを設計した。切断効率と特異性を確保するために、ゲノム内の他の遺伝子座と少なくとも2つのミスマッチがあり、GC含有量が20%~80%のsgRNAのみを保持し、4bp T以上のヌクレオチドホモポリマーを含むsgRNAを除去した。最良のカバレッジを達成するために、K562細胞株のいずれか必須遺伝子(非特許文献15)を標的とせず、ミスマッチ部位の総数が2未満である限り、他の遺伝子座と1bpまたは0bpのミスマッチを持つ一部のsgRNAを保持した。最後に、10,996個のIncRNAを標的とする合計126,773個のsgRNAを合成した。このライブラリーには、500個のヒトゲノム中の非標的sgRNAをネガティブコントロールとしてふくめ、36の必須リボソーム遺伝子を標的とする350個のsgRNAをポジティブコントロールとして含めた。CustmoArray 90Kアレイチップ(CustmoArray,Inc.)を使用してオリゴヌクレオチドを合成し、ライブラリーの構築は上記の通りであった。
5、ゲノムスケールのIncRNAスクリーニング
2回の重複でそれぞれ合計5×10個のK562細胞を175cmフラスコ(Corning 431080)に播種した。24時間後、細胞をMOIが0.3未満(1000倍のカバレッジ)のsgRNAライブラリーレンチウイルスに感染させた。感染の48時間後、ライブラリー細胞をプロマイシン(3μg/ml;Solarbio P8230)で2日間処理した。各重複について、ゲノム抽出のために、0日目の対照サンプルとして合計1.3×10個の細胞を収集した。ウイルス感染の30日後、ゲノム抽出トNGS分析のために1.3×10個の細胞を単離した(非特許文献4、9)。
6、スクリーニングのコンピューター分析
シーケンス読み取りをhg38参照ゲノムにマッピングし、自家製のスクリプトによってデコードした。2つの重複のsgRNAカウントに対してクオンタイル正規化を実行してから、平均カウントおよび試験と対照群間の倍数変化を計算した。10個のネガティブコントロールsgRNA(各遺伝子置換)をランダムに選択することにより、1000個のネガティブコントロール遺伝子を生成した。そして、次の基準に基づいてノイズsgRNAをフィルタリングした:1回の重複でのsgRNAの倍数変化が、ポジティブコントロールsgRNAの平均倍数変化よりも低く、別の重複でネガティブコントロールsgRNAの平均倍数変化よりも高い場合、sgRNAをフィルタリングされたノイズsgRNAと見なす。ノイズフィルタリング後、各IncRNAについて、ネガティブコントロールと比較したsgRNAの倍数変化をWilcoxテストを通じて比較し、偽陽性率を減少するように、ネガティブコントロールによって生成された経験的分布を使用してp値を修正した。最終的に、スクリーンスコアを次のように定義した:スクリーンスコア=スケール(-lоg10(修正されたp値))+|スケール(lоg(sgRNA倍数変化))|。スクリーンスコアが2を超えるヒットを必須のIncRNAとして識別した。
7、IncRNAヒットの検証
上位2つのsgRNAを、スプライシング戦略の検証のためにライブラリーから選択した。前記sgRNAは、ゲノム内の他の遺伝子座に対して少なくとも2つのミスマッチを持つ。pgRNA削除戦略について、pgRNAが各IncRNAのプロモーターと最初のエクソンを削除するように設計された。次の原則に基づいてgRNAペアを設計した:(1)1つのsgRNAは転写開始部位(TSS)の上流の2.5~3.5kb領域を標的とし、もう1つはTSSの下流の0.2~1.5kb領域を標的とする;(2)コードまたは非コード遺伝子のエクソンまたはプロモーターと重複することを避ける。前記pgRNAペアの各sgRNAについて、(1)GC含有量が45%~70%であること、(2)sgRNAに4bp以上のホモポリマーが含まれていないこと、および(3)sgRNAには、ヒト遺伝子座の他の遺伝子座と2つを超えるミスマッチが含まれていることをさらに確保する。他の遺伝子座と2つのミスマッチを持っているが、オフターゲットサイトが2つ未満のsgRNAをいくつか含めた。
検証対象の選択されたIncRNAを標的とするすべてのsgRNAまたはpgRNAを、CMVプロモーターによって駆動されるEGFPタグを備えたレンチウイルスベクターに単独にクローニングした。ウイルスパッケージング後、sgRNAまたはpgRNAレンチウイルスを1.0未満のMOIでK562またはGM12878細胞に形質導入した。細胞増殖試験は、前の文献に記載された通りであった(非特許文献9)。
8、RNAシーケンスとデータ分析
IncRNA MIR17HGおよびBMS1P20のスプライス部位を標的とする2つのsgRNAをそれぞれ、EGFPタグを備えたレンチウイルスベクターにクローニングした。sgRNAをレンチウイルス感染(MOI<1)を介してK562またはGM12878細胞に送達した。感染の5日後、2×10個のEGFP陽性K562またはGM12878細胞をFACSで選別した。RNeasy Miniキット(QIAGEN 78254)を使用して各サンプルの総RNAを抽出し、NEBNext PolyA mRNA Magnetic Isolation Module(NEB E7490S)、NEBNext RNA First Strand Synthesis Module(NEB E7525S)、NEBNext mRNA Second Strand Synthesis Module(NEB E6111S)、およびIlluminaに用いられるNEBNext Ultra DNA Library Prepキット(NEB E7370L)に従ってRNA-seqライブラリーを調製した。Illumina HiSeq X Tenプラットフォーム(Genetron Health)を使用してすべてのサンプルについてNGS分析をした。ディープシーケンシングリードをhg38参照ゲノムにマッピングし、RSEM v1.2.25(非特許文献30)によって遺伝子発現を定量化した。EBSeqバージョン1.10.0(非特許文献31)によって差次的発現分析を行い、差次的発現遺伝子について、自己修正されたP値が0.05未満、しかも絶対lоg(倍数変化)が3を超えたものを選択した。DAVID6.8(非特許文献32)によって遺伝子オントロジー(Gene Ontology)とKEGG分析を実行した。
結果
公知常識と一致して、スプライス部位をマークする保存的な配列が存在する。Weblogo3ツール(非特許文献33)を使用したバイオインフォマティクス分析では、ヒトゲノムの中の約99%のイントロン領域が5’スプライスドナー(SD)部位でGTに隣接し、3’スプライスアクセプター(SA)部位でAGに隣接していることは示されている。なお、AG配列は主にSD部位のすぐ上流のエクソンの最後の2つの塩基として存在する(図1のa)。エクソンスキッピングおよび/またはイントロン保持の生成におけるsgRNAの有効性を確認するために、細胞成長と増殖に不可欠な2つのリボソーム遺伝子RPL18とRPL11のSDまたはSA部位を標的とするsgRNAを設計した。Cas9およびOCT1遺伝子(非特許文献4)を安定して発現するHeLa細胞で、SD部位を標的とするsgRNA1RPL18およびSA部位を標的とするsgRNA2RPL18が、ゲノム内のRPL18遺伝子座でそれぞれイントロン3保持とエクソン4スキッピングを生成したことは、逆転写PCR(RT-PCR)およびSangerシーケンシング分析によって確認された。RPL11遺伝子に対する同様の試みから同じ結果が得られ、sgRNA3RPL11とsgRNA4RPL11はRPL11遺伝子座でそれぞれイントロン2保持とエクソン4スキッピングを生成した。図1のbは、スプライスドナー(SD)またはスプライスアクセプター(SA)部位を標的とするsgRNAによって誘導されるイントロン保持とエクソンスキッピングを示している。
CRISPRスクリーニングにおけるターゲティングスプライシングの有効性をさらに評価するために、79のリボソーム遺伝子のスプライス部位を標的とする飽和ライブラリーを設計した。これらの79のリボソーム遺伝子は、多くの細胞株での細胞増殖に必要である(非特許文献29)。このライブラリーは5,788のsgRNAを含み、その切断部位は、これら79の遺伝子の各5’SD部位周辺の50bp~+75bp、および各3’SA部位周辺の-75bp~+50bpの範囲内にある。sgRNAの例について、表1を参照できる。
MOI(感染多重度)<0.3のレンチウイルスの送達により、これらのsgRNAを持つ細胞ライブラリーを、Cas9を発現するHeLa細胞及びHuh7.5細胞で構築した。15日間のライブラリー細胞の延長した細胞培養によってスクリーニングし、NGS分析に基づいて、細胞生存率の低下を引き起こすsgRNAを解読した。
15日間のテストサンプル(Exp)と対照サンプル(Ctrl)間のsgRNAのlоg倍数変化を計算することにより、すべてのsgRNAを並べ替え、sgRNA切断部位とそれに対応するSDまたはSA部位間の距離(塩基対の数)によってアラインメントした。HeLaおよびHuh7.5細胞におけるCtrlとExpの生物学的重複実験間のSpearman相関性は、すべての結果が高い再現性を有することはしめされた(図2)。遺伝子破壊に対するスプライシングターゲティングの有効性を反映するために、SD部位を標的とするデータおよびSA部位を標的とするデータを組み合わせ、SDまたはSA部位に対する物理的距離に応じてそれらを並べた(図3および図1のd)。明らかに、HeLaおよびHuh7.5細胞では、スプライス部位に影響を与えるsgRNAは、エクソン領域のみを標的とするsgRNAより優れている。sgRNA切断部位からスプライス部位までの距離が近いほど、遺伝子破壊の効果が高くなり、SDとSAの場合、ピークポイントは少しエクソンに向かっている(図3、1のd)。対照的に、イントロンを標的とする多数のsgRNAは、スクリーニングプロセス中に枯渇することはめったになく、遺伝子への破壊およびそれによる遺伝子機能の喪失が細胞の生存に与える影響が小さいことを示している。唯一の例外は、SA部位の近くのイントロン領域を標的とするsgRNA(非特許文献34、35)であり、これには、RNAスプライシングへの関与で知られている分岐点が含まれ、それに続くのが、ポリピリミジントラクトである。
いずれかの遺伝子座に対しても設計されたsgRNAの数は等しくないため、公平に比較するために、各遺伝子座の高効率sgRNA(損失が4倍を超えるsgRNA)の割合を比較した。このような標準化を通して、SDおよびSAを標的とするsgRNAが、エクソン領域のみを標的とするsgRNAよりもはるかに優れていることをさらに確認した(図4のa)。結果をよりよく定量化するために、すべてのsgRNAを、イントロンを標的とするsgRNA(sgRNAの切断部位はイントロン内にあり、SDまたはSA部位から少なくとも30bp離れている)、エクソンを標的とするsgRNA(sgRNAの切断部位はエクソン内にあり、SDまたはSA部位から少なくとも30bp離れている)、およびターゲティングスプライシングsgRNA(sgRNAの切断部位はSDまたはSA部位に隣接する-1-bp~+10bpの範囲にあり、-と+は、それぞれイントロンとエクソンの方法を示す)の三種類に分けた。HeLaおよびHuh7.5細胞では、2または4倍を超えた損失を引き起こしたsgRNAの中で、スプライシングターゲティングsgRNAの割合は、その他の2種類よりもはるかに高かった(図4のb、4のc)。
上記の結果に基づいて、その戦略はコード遺伝子および非コード遺伝子に普遍的に適用できるはずであると推測する。これは、RNAスプライシングが両方で非常に保存的なメカニズムであるからである。スプライス部位を標的とすることは、ヒト細胞におけるIncRNAの機能をエクソンスキッピングおよび/またはイントロン保持によって破壊する可能性があると想定して、ゲノムスケールのIncRNAの機能的なスクリーニングを確立するために特別なターゲティングスプライシングsgRNAライブラリーを設計して構築した。GENCODEデータベースV20から検索した14470個のIncRNAのうち、まずスプライス部位を欠く2,477個のIncRNAを除外した。また、他のいくつかのルールに従った:すべてのsgRNA切断部位はスプライス部位周辺の-10bp~+10bpの範囲内にあり、sgRNAが高い切断活性を有すると予測され(非特許文献29、36、37)、しかも既知の必須遺伝子のオフターゲットはない(方法部分参照)。最終的に、10,996の独特なIncRNAを標的とする126,773のsgRNAライブラリーを調製した。500の非標的対照sgRNAおよび必須リボソーム遺伝子を標的とする350のsgRNAと一緒に、Cas9タンパク質を安定して発現するように操作されたK562細胞において細胞ライブラリーを構築した(図5のaおよび図2のa)。0.3未満の低いMOIでレンチウイルス形質導入によって細胞ライブラリーを調製した。感染後、ライブラリー細胞を30日間継続的に培養し、細胞の成長と増殖に影響を与えるIncRNAをスクリーニングした。その後、NGS分析をsgRNAのデコードに使用した(非特許文献4、9)(図5のb)。
30日間培養した後、IncRNAおよび必須遺伝子を標的とするsgRNAは、非標的sgRNAと比較して枯渇しており(図5のc、5のd、図2のb、c)、細胞の生存または増殖に対する影響は示された。各IncRNAについて、非標的sgRNAと比較して、Wilcoxоn検定によってsgRNAの倍数をテスト計算してそのP値を得た。非標的sgRNAをランダムにサンプリングして「ネガティブコントロール遺伝子」を生成し、これによってIncRNAのP値をその分布によって補正した。各IncRNAについて、平均倍数変化と補正されたP値とを組み合わせてスクリーンスコアを計算した(方法部分参照)。これにより、スクリーンスコアが2であるしきい値に基づいて合計243の候補IncRNAを選択し、それらの枯渇は、K562細胞株で細胞成長阻害または細胞死を引き起こす(図5のe、図2のd)。スクリーンスコアによって、36の必須遺伝子はすべて、ネガティブセレクション遺伝子のランキングリストで有意に濃縮されており、これは、スクリーニング法とデータ分析法の信頼性を示している。
対応するsgRNAが2つの重複で一貫して枯渇しているネガティブに選択されたIncRNAから、更なる検証のために35のトップランクのIncRNA遺伝子を選択した。各候補について、ライブラリースクリーニングから得られた2つのトップランクのsgRNAを、EGFP選択タグを有するレンチウイルス骨格にクローニングした。非標的sgRNAおよび非機能性アデノ関連ウイルス組み込み部位1(AAVS1)遺伝子座を標的とするsgRNAを陰性対照として選択し、リボソーム遺伝子RPL18を標的とするsgRNAをポジティブコントロールとして含めた(図6のa、図3のa)。各sgRNAをK562細胞に形質導入し、EGFP陽性細胞の変化の割合に基づいて細胞増殖を定量化した。癌細胞と正常細胞のIncRNA機能の違いをさらに考察するために、検証するようにリンパ系幹細胞GM12878を含めた。この細胞は比較的に正常な核型を持ち、K562と同じくティア1のENCODE細胞株に属す(非特許文献24、25)。なお、35のトップランクのIncRNA遺伝子座を標的とするすべてのsgRNAは、K562細胞の細胞増殖を効果的に引き起こした(図6のb、c、図3のb、c、および図7~12)。その中で、18のIncRNAはGM12878の成長にも不可欠である(図6のb、図7~10、図3のb)。一方、6個および11個のIncRNAヒットは、GM12878での細胞生存率に対してそれぞれ弱い(図10)および検出できない影響を示した(図6のcおよび図11~12、図3のc)。これらの結果は、細胞型特異性の存在を示している。要するに、K562に必要なIncRNAの約半分は、GM12878細胞の成長に有意な影響を与えず、治療の可能性のある癌細胞のユニークなバイオマーカーを示している(図6のd、図3のd)。
検証実験とスクリーニング戦略(いずれもスプライシング干渉に依存)をさらに確認するために、pgRNAを介した削除方法(非特許文献9)を選択して、スクリーニングからのIncRNAヒットの作用を独立に研究した。検証済みの35のヒットから6つのIncRNAを選択し、上位ランクのスプライシングターゲティングsgRNAには特定のオフターゲットの可能性があるため、上記の検証に含まれなかった上位ヒットから別の6つの候補を選択した。これらの12のIncRNAのそれぞれについて、4ペアのpgRNAを、そのプロモーターと最初のエクソンを削除するように設計した(方法部分参照)。AAVS1遺伝子座またはリボソーム遺伝子RPL19とRPL23AをそれぞれpgRNAターゲティングネガティブコントロールまたはポジティブコントロールとして選択した(図13のa)。細胞増殖実験を通して、35の検証済みのヒットからの6つのIncRNAは、ターゲティングスプライシング戦略によって検証された表現型を再現した(図6のeおよび図13のb、図3のe)。ターゲティングスプライシングの検証結果は、削除戦略の結果とよい相関性があり(相関係数=0.93、P=0.002)(図6のf、図3のf)、これは、ターゲティングスプライシングがIncRNA遺伝子破壊に対して信頼でき、且つ強力な方法であることを示した。同様に、他の6つの候補IncRNAもK562細胞の成長に重要であることを実証した(図14)。これまでに、41の選択されたIncRNAはすべて、K562細胞の成長と増殖に極めて重要であることは確認された。
K562とGM12878細胞でこれらの異なる発現を引き起こすメカニズムをよりよく理解するために、両方の細胞株に必要なIncRNA MIR17HG(図6のb、図3のb)と、K562細胞の生存にのみ必要であるがGM12878で(図6のc、図3のc)必要ではないBMS1P20の機能をさらに探索した。MIR17HGまたはBMS1P20のノックアウトがある、またはない場合に、K562とGM12878の2つの細胞に対してRNA-seq分析をした。そのスプライス部位を標的とする2つのsgRNAで各IncRNAを破壊し、その有効性は検証実験で確認された(図6のb、c、図3のb、c)。対照とsgRNAターゲティングサンプル間で最も大きい変化を示した500個の遺伝子の発現レベルを評価し、2つのIncRNAをノックアウトした後に異なる発現パターンを観察した(図15のa、図4のa)。各細胞株における2つのIncRNAについて、同じスプライス部位を標的とし、発現パターンが類似した2つのsgRNAが示されている(図16のa、b)。K562細胞から同定されたトップランクの100の必須IncRNAの全体的な発現レベルは、GM12878細胞よりも野生型K562細胞において高かった(P=0.03、図15のb、図4のb)。
K562細胞株では、MIR17HGのスプライシングモードの変更は、細胞の成長と増殖に影響を与える既知の179の必須遺伝子をダウンレギュレートし(非特許文献15(P=0.01、図15のc、図4のc)、BMS1P20の破壊は、178の既知の必須遺伝子をダウンレギュレートした(非特許文献15)(P=0.05、図15のc、図4のc)。これは、これら2つのIncRNAがK562細胞の成長に影響する可能なメカニズムを示した。意外なことに、MIR17HGとBMS1P20は、GM12878細胞では異なる役割を果たすが、K562細胞の140の一般的な必須遺伝子に影響を与える(図15のd、図4のd)。これらの保存的な遺伝子は、翻訳開始、細胞分裂、およびDNA修復を調節する経路など、いくつかの必須な経路に富んでいる(図16のc)。BMS1P20の場合、対照細胞と比較して、このIncRNAの破壊は、K562とGM12878細胞における一連のコード遺伝子の発現をアップレギュレートまたはダウンレギュレートした(16のd~e)。さらに、IncRNAをノックアウトした後、K562とGM12878で差次的に発現する遺伝子を研究した(図15のe、図4のe)。K562でダウンレギュレートされたこれらの遺伝子は、p53シグナル伝達経路やPI3K-Aktシグナル伝達経路などのプロセスに富んでおり、細胞の成長と増殖に影響を与える可能性がある(図15のf、図4のf、上の図)。また、アップレギュレートされた遺伝子もあり(図15のf、図4のf、下の図)、これらの差次的に発現する遺伝子はすべて、これら2つの細胞株において、細胞の成長に影響を与える面では、BMS1P20ノックアウトによって引き起こされる表現型の変化に関連している。
要するに、タンパク質をコードする遺伝子とIncRNA遺伝子の干渉は、いずれもスプライス部位を標的とすることで実質的に増強することができる。タンパク質をコードする遺伝子にリーディングフレームシフト変異を生成するに加えて、ターゲティングスプライシングは遺伝子破壊に追加の機会を提供する。この特徴は、sgRNAを介してリーディングフレームに敏感ではない非コードRNAをノックアウトするためにかけがえのないものである。さらに、スプライス部位を破壊するこの戦略は、保存されたコード配列を持つ遺伝子を標的とする適切なsgRNAを設計することが難しい場合に特に効果的である可能性がある。
CRISPR-Cas9システムは、2つの戦略(ペアgRNA(pgRNA)削除(非特許文献9)とCRISPRi(非特許文献12))を通じて、機能的なIncRNAを大規模に特定するために適用されている。pgRNAを介したゲノム欠失よりも、CRISPRi戦略を使用して技術上ではスケールアップしやすいが、CRISPRiおよびCRISPRa法は通常、標的転写開始部位(TSS)の約1kbのウィンドウ内でのみ機能し(非特許文献12、26)、技術者がこの方法で直面するリスクは、ほぼ60%のIncRNA遺伝子座に隣接する遺伝子の発現に意図せずに影響を与えることである(非特許文献27)。スプライシングターゲティングの戦略は、単一のガイドRNAを使用して重複領域のほとんどを切断することを効果的に回避でき、隣接する遺伝子への影響を高い確率で回避できるため、偽陽性率を減らすことができる。総じていえば、CRISPRiは、標的遺伝子座を完全にノックアウトするのではなく、遺伝子発現レベルを低下させるだけなので、偽陰性の結果の余地が残った。
実験データに基づいて、本発明に記載の新しい方法は、コード遺伝子の陰性CRISPRスクリーニングにおいて有意な利点を有し、従来のエクソンターゲティング法を補完するものであり、しかも本発明の方法は、単一のガイドRNA-CRISPRライブラリーを使用して、非コード遺伝子の大規模な機能喪失スクリーニングを可能にする。また、スプライス部位の破壊によって生成されるエクソンスキッピングおよび/またはイントロン保持は、個々の非コードRNAの機能検証のために便利なアプローチを提供する。

Claims (8)

  1. 長鎖ノンコーディングRNAのスプライス部位周辺のゲノム配列を標的とする、プロモーターに操作可能に連結されたガイド配列とプロモーターに操作可能に連結されたガイドヘアピン配列とを含み、前記ガイド配列は、長鎖ノンコーディングRNAのSD部位またはSA部位周辺の-30bp~+30bpの領域のゲノム配列を標的とする、真核細胞のゲノム中で長鎖ノンコーディングRNAを干渉するためのCRISPR/CasガイドRNA構築体を複数含むライブラリー
  2. 前記CRISPR/CasガイドRNA構築体はウイルスベクターまたはプラスミドである、請求項1に記載のライブラリー
  3. 長鎖ノンコーディングRNAのスプライス部位周辺のゲノム配列を標的とする、プロモーターに操作可能に連結されたガイドRNAとガイドヘアピン配列とを含むCRISPR/CasガイドRNA構築体を宿主細胞に導入することと、
    前記ゲノム配列を標的とする前記ガイドRNAを前記宿主細胞において発現させ、CRISPR/Casヌクレアーゼの存在下で前記長鎖ノンコーディングRNAにエクソンスキッピングおよび/またはイントロン保持を導入してから前記長鎖ノンコーディングRNAの機能プロファイルを決定することと
    を含み、前記ガイドRNAのガイド配列は、長鎖ノンコーディングRNAのSD部位またはSA部位周辺の-30bp~+30bpの領域のゲノム配列を標的とし、
    前記宿主細胞が宿主細胞集団内にあり、各宿主細胞が独立してユニークなガイドRNA構築体を含む、
    長鎖ノンコーディングRNAの機能プロファイルを決定するための方法。
  4. 前記機能プロファイルは、細胞表現型の変化および/またはコード遺伝子または非コード遺伝子の発現の増加または減少を含む、請求項に記載の方法。
  5. 前記コード遺伝子は、外因性レポーター遺伝子またはゲノム内の元のコード遺伝子である、請求項に記載の方法。
  6. 真核細胞ゲノム中で長鎖ノンコーディングRNAをスクリーニングまたは同定するためのハイスループット方法である、請求項3~5のいずれか1項に記載の方法。
  7. 長鎖ノンコーディングRNAの1つまたは複数のスプライス部位周辺の1つまたは複数のポリヌクレオチド配列を標的とする1つまたは複数のCRISPR/CasガイドRNAを真核細胞に導入し、これによって1つまたは複数のガイドRNAは、長鎖ノンコーディングRNAの1つまたは複数のスプライス部位周辺の1つまたは複数のポリヌクレオチド配列を標的とし、Casタンパク質の存在下で前記1つまたは複数のポリヌクレオチド配列を切断し、長鎖ノンコーディングRNAのイントロン保持および/またはエクソンスキッピングをもたらし、これによって長鎖ノンコーディングRNAの機能を干渉または排除することを含む、真核細胞における長鎖ノンコーディングRNAの機能を干渉または排除するための方法であって、前記ガイドRNAのガイド配列は、長鎖ノンコーディングRNAのSD部位またはSA部位周辺の-30bp~+30bpの領域のポリヌクレオチド配列を標的とする、方法(但し、人間の生体内にある細胞にCRISPR/CasガイドRNAを導入する方法を除く)を使用して腫瘍細胞の成長または増殖に必要なIncRNAを同定および破壊して腫瘍細胞の成長または増殖を阻害することを含む、長鎖ノンコーディングRNA(IncRNA)の機能を干渉することによって腫瘍細胞の成長または増殖を阻害する方法
  8. 前記腫瘍細胞の成長または増殖に必要なIncRNAは、XXbac-B135H6.15、RP11-848P1.5、AC005330.2、AP001062.9、AP005135.2、RP11-867G23.4、LINC01049、DGCR5、RP11-509A17.3、CTB-25J19.1、CTD-2517M22.17、CROCCP2、AC016629.8、CTC-490G23.4、RP11-117D22.1、AC067969.2、RP11-251M1.1、AC004471.9、AC004471.10、AC002472.11、RP11-429J17.7、RP11-56N19.5、TMEM191A、LL22NC03-102D1.18、LINC00410、LL22NC03-23C6.13、RP11-83J21.3、RP11-544A12.4、ANKRD62P1-PARP4P3、CTD-2031P19.5、XXbac-B444P24.8、RP11-464F9.21、TPTEP1、MIR17HG、およびBMS1P20からなる群より選択される、請求項に記載の方法。
JP2020554242A 2018-04-02 2018-04-02 機能的なIncRNAをスクリーニングおよび同定するための方法 Active JP7244885B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2018/081635 WO2019191876A1 (en) 2018-04-02 2018-04-02 Method for Screening and Identifying Functional lncRNAs

Publications (2)

Publication Number Publication Date
JP2021520205A JP2021520205A (ja) 2021-08-19
JP7244885B2 true JP7244885B2 (ja) 2023-03-23

Family

ID=68100022

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020554242A Active JP7244885B2 (ja) 2018-04-02 2018-04-02 機能的なIncRNAをスクリーニングおよび同定するための方法

Country Status (5)

Country Link
US (1) US20210163936A1 (ja)
EP (1) EP3775205A4 (ja)
JP (1) JP7244885B2 (ja)
CN (1) CN112384620B (ja)
WO (1) WO2019191876A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3663310A4 (en) 2017-08-04 2021-08-11 Peking University TALE-RVD WITH SPECIFIC DETECTION OF A DNA BASE MODIFIED BY METHYLATION AND APPLICATION OF IT
CN111278983A (zh) 2017-08-08 2020-06-12 北京大学 基因敲除方法
US20240093190A1 (en) * 2021-01-19 2024-03-21 President And Fellows Of Harvard College Engineered nucleic acids targeting long noncoding rna involved in pathogenic infection
CN113151265A (zh) * 2021-03-19 2021-07-23 赖骞 基于CRISPR-dCase9系统抑制细胞核内lncRNA表达的方法
CN113327645B (zh) * 2021-04-15 2022-11-29 四川大学华西医院 一种长非编码rna及其在诊断治疗胆管癌中的应用
CN113380341B (zh) * 2021-06-10 2024-05-17 北京百奥智汇科技有限公司 一种药物靶标毒性预测模型的构建方法及其应用

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160118987A (ko) * 2015-04-01 2016-10-12 한양대학교 산학협력단 LincRNA 삭제를 위한 sgRNA 쌍
CN105316341B (zh) * 2015-12-08 2018-07-06 浙江理工大学 一种LncRNA及其在作为前列腺癌检测标记物或前列腺癌预后复发标记物中的应用
CN106637421B (zh) * 2016-10-28 2019-12-27 博雅缉因(北京)生物科技有限公司 双sgRNA文库的构建及其应用于高通量功能性筛选研究的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Nature Biotech.,2016年,Vol. 34,p. 1279-1286
Nature,2016年,Vol. 539,p. 452-455

Also Published As

Publication number Publication date
US20210163936A1 (en) 2021-06-03
WO2019191876A1 (en) 2019-10-10
EP3775205A4 (en) 2021-11-17
CN112384620B (zh) 2023-06-30
CN112384620A (zh) 2021-02-19
EP3775205A1 (en) 2021-02-17
JP2021520205A (ja) 2021-08-19

Similar Documents

Publication Publication Date Title
JP7244885B2 (ja) 機能的なIncRNAをスクリーニングおよび同定するための方法
Xu et al. Engineered miniature CRISPR-Cas system for mammalian genome regulation and editing
De Dieuleveult et al. Genome-wide nucleosome specificity and function of chromatin remodellers in ES cells
Wu et al. Widespread influence of 3′-end structures on mammalian mRNA processing and stability
Chen et al. Genome-wide identification of circular RNAs in Arabidopsis thaliana
Lu et al. Transcriptome-wide investigation of circular RNAs in rice
CN110343724B (zh) 用于筛选和鉴定功能性lncRNA的方法
Sanjana Genome-scale CRISPR pooled screens
Ke et al. Quantitative evaluation of all hexamers as exonic splicing elements
AU2019408503B2 (en) Compositions and methods for highly efficient genetic screening using barcoded guide rna constructs
Ishizu et al. Somatic primary piRNA biogenesis driven by cis-acting RNA elements and trans-acting Yb
Zhao et al. Massively parallel functional annotation of 3′ untranslated regions
Pontvianne et al. Histone methyltransferases regulating rRNA gene dose and dosage control in Arabidopsis
JP6012633B2 (ja) 特異的プロモーターの構築のための方法
JP2018532419A (ja) CRISPR−Cas sgRNAライブラリー
Zhang et al. A comprehensive map of intron branchpoints and lariat RNAs in plants
Velten et al. Transgene silencing and transgene-derived siRNA production in tobacco plants homozygous for an introduced AtMYB90 construct
S. Zibitt et al. Interrogating lncRNA functions via CRISPR/Cas systems
CN111349654A (zh) 使用加标签的向导rna构建体进行高效基因筛选的组合物和方法
Ross et al. Discovering functional motifs in long noncoding RNAs
US11946163B2 (en) Methods for measuring and improving CRISPR reagent function
Yates et al. A simple and rapid method for enzymatic synthesis of CRISPR-Cas9 sgRNA libraries
Siebert et al. Genetic analysis of human RNA binding motif protein 48 (RBM48) reveals an essential role in U12-type intron splicing
WO2023060539A1 (en) Compositions and methods for detecting target cleavage sites of crispr/cas nucleases and dna translocation
CN111334531A (zh) 高信噪比阴性遗传筛选方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201223

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201223

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220207

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220705

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221107

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20221107

C11 Written invitation by the commissioner to file amendments

Free format text: JAPANESE INTERMEDIATE CODE: C11

Effective date: 20221115

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20221227

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20230104

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230214

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230302

R150 Certificate of patent or registration of utility model

Ref document number: 7244885

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150