JP2022537477A - 機能的エレメントの同定方法 - Google Patents

機能的エレメントの同定方法 Download PDF

Info

Publication number
JP2022537477A
JP2022537477A JP2021557446A JP2021557446A JP2022537477A JP 2022537477 A JP2022537477 A JP 2022537477A JP 2021557446 A JP2021557446 A JP 2021557446A JP 2021557446 A JP2021557446 A JP 2021557446A JP 2022537477 A JP2022537477 A JP 2022537477A
Authority
JP
Japan
Prior art keywords
amino acid
score
deletion
deletions
protein
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021557446A
Other languages
English (en)
Inventor
文▲勝▼ 魏
▲軼▼楠 王
悦欣 周
心怡 ▲張▼
▲ディ▼ 岳
▲瑩▼ ▲劉▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Edigene Inc
Original Assignee
Peking University
Edigene Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University, Edigene Inc filed Critical Peking University
Publication of JP2022537477A publication Critical patent/JP2022537477A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1079Screening libraries by altering the phenotype or phenotypic trait of the host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6897Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids involving reporter genes operably linked to promoters
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • G16B35/10Design of libraries
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • G16B35/20Screening of libraries
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/10Applications; Uses in screening processes
    • C12N2320/11Applications; Uses in screening processes for the determination of target sites, i.e. of active nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2330/00Production
    • C12N2330/30Production chemically synthesised
    • C12N2330/31Libraries, arrays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Plant Pathology (AREA)
  • Library & Information Science (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本発明は、ゲノム配列の機能的エレメントを同定するための方法、およびゲノム配列の機能的エレメントを同定するために使用されるライブラリーを提供する。【選択図】なし

Description

本発明は、標的ゲノム領域または標的タンパク質の機能的エレメントを同定するための方法に関する。具体的には、本発明は、それらの自然生物学的背景におけるその機能に重要な要素を同定するためのハイスループット戦略に関する。
RNA誘導したCRISPR関連タンパク質9ヌクレアーゼ(RNA-guided CRISPR-associated protein 9 nucleases)は、二重鎖断裂(DSB)を生成することにより、標的ゲノムの遺伝子座にindel(挿入または欠失)と部位特異的突然変異を導入し、それにより内部修復メカニズム、特に非同源末端接続(NHEJ)を活性化する(1,2)。突然変異誘発は、特にリーディングフレームの転位は、遺伝子表現を完全に排除することができ、これによりCRISPR-Cas9システムをゲノム工学(3,4)、さらにはハイスループット機能スクリーニング(5-8)のための強力なツールとなる。高分解能で調節的エレメントまたはタンパク質コード配列の役割をよりよく理解するために、関連する生物学的アッセイにおいて、CRISPRによる飽和突然変異誘発は使用されている(9,10)。これらの試みはsgRNA コード領域からの間接的シークエンシングデータのみを収集したため、塩基識別の分解能には限界があった。さらに、特に目的タンパク質が細胞の活性に不必要である場合、この戦略を使用して完全な機能ドメインまたは重要なアミノ酸情報を取得することは不可能である。伝統的な方法は、主に共免疫沈殿(Co-IP)とトランケーション突然変異誘発(11)の組み合わせなどの体外生化学的測定が主であったが、これらの技術は、時間がかかり、労力がかかり、分解能が低く、いずれも天然の生物学的環境で不可能であることは言うまでもない。したがって、当技術分野では、目的タンパク質またはゲノム配列の機能的エレメントを同定するために、より正確で包括的な戦略および方法が強く求められている。
M. Jinek et al., A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science337, 816-821 (2012). M. E. Burkard, A. Santamaria, P. V. Jallepalli, Enabling and disabling polo-like kinase 1 inhibition through chemical genetics. ACS chemical biology7, 978-981 (2012). L. Cong et al., Multiplex Genome Engineering Using CRISPR/Cas Systems. Science339, 819-823 (2013). P. Mali et al., RNA-guided human genome engineering via Cas9. Science339, 823-826 (2013). O. Shalem et al., Genome-scale CRISPR-Cas9 knockout screening in human cells. Science343, 84-87 (2014). T. Wang, J. J. Wei, D. M. Sabatini, E. S. Lander, Genetic screens in human cells using the CRISPR-Cas9 system. Science343, 80-84 (2014). H. Koike-Yusa, Y. Li, E. P. Tan, C. Velasco-Herrera Mdel, K. Yusa, Genome-wide recessive genetic screening in mammalian cells with a lentiviral CRISPR-guide RNA library. Nat Biotechnol32, 267-273 (2014). Y. Zhou et al., High-throughput screening of a CRISPR/Cas9 library for functional genomics in human cells. Nature509, 487-491 (2014). G. M. Findlay, E. A. Boyle, R. J. Hause, J. C. Klein, J. Shendure, Saturation editing of genomic regions by multiplex homology-directed repair. Nature513, 120-123 (2014). M. C. Canver et al., BCL11A enhancer dissection by Cas9-mediated in situ saturating mutagenesis. Nature527, 192-197 (2015). P. Yuan et al., Chondroitin sulfate proteoglycan 4 functions as the cellular receptor for Clostridium difficile toxin B. Cell Res25, 157-168 (2015). J. Duan, L. Nilsson, B. Lambert, Structural and functional analysis of mutations at the human hypoxanthine phosphoribosyl transferase (HPRT1) locus. Human mutation23, 599-611 (2004). M. Steegmaier et al., BI 2536, a potent and selective inhibitor of polo-like kinase 1, inhibits tumor growth in vivo. Curr Biol17, 316-322 (2007). D. Chen, M. Frezza, S. Schmitt, J. Kanwar, Q. P. Dou, Bortezomib as the first proteasome inhibitor anticancer drug: current status and future perspectives. Curr Cancer Drug Targets11, 239-253 (2011). M. van Overbeek et al., DNA Repair Profiling Reveals Nonrandom Outcomes at Cas9-Mediated Breaks. Mol Cell63, 633-646 (2016). S. Zhu et al., Genome-scale deletion screening of human long non-coding RNAs using a paired-guide RNA CRISPR-Cas9 library. Nat Biotechnol34, 1279-1286 (2016). T. Mitamura et al., Structure-function analysis of the diphtheria toxin receptor toxin binding site by site-directed mutagenesis. J Biol Chem272, 27084-27090 (1997). S. Fu et al., The structure of tumor endothelial marker 8 (TEM8) extracellular domain and implications for its receptor function for recognizing anthrax toxin. PLoS One5, e11203 (2010). T. Hart et al., High-Resolution CRISPR Screens Reveal Fitness Genes and Genotype-Specific Cancer Liabilities. Cell163, 1515-1526 (2015). S. Lu, J. Wang, The resistance mechanisms of proteasome inhibitor bortezomib. Biomark Res1, 13 (2013). N. E. Franke et al., Impaired bortezomib binding to mutant beta5 subunit of the proteasome is the underlying basis for bortezomib resistance in leukemia cells. Leukemia26, 757-768 (2012). S. A. Wacker, B. R. Houghtaling, O. Elemento, T. M. Kapoor, Using transcriptome sequencing to identify mechanisms of drug action and resistance. Nat Chem Biol8, 235-237 (2012). R. N. Murugan et al., Plk1-targeted small molecule inhibitors: molecular basis for their potency and specificity. Mol Cells32, 209-220 (2011). C. D. Richardson, G. J. Ray, M. A. DeWitt, G. L. Curie, J. E. Corn, Enhancing homology-directed genome editing by catalytically active and inactive CRISPR-Cas9 using asymmetric donor DNA. Nat Biotechnol, (2016). L. H. de Wilt et al., Proteasome-based mechanisms of intrinsic and acquired bortezomib resistance in non-small cell lung cancer. Biochem Pharmacol83, 207-217 (2012). E. Suzuki et al., Molecular mechanisms of bortezomib resistant adenocarcinoma cells. PLoS One6, e27996 (2011). G. T. Hess et al., Directed evolution using dCas9-targeted somatic hypermutation in mammalian cells. Nat Methods, (2016). A. D. Garst et al., Genome-wide mapping of mutations at single-nucleotide resolution for protein, metabolic and genome engineering. Nat Biotechnol35, 48-55 (2017).
本発明は、CRISPR増強飽和突然変異誘発および分類DNA断片シークエンシングとの結合法と呼ばれ、目的ゲノム領域または目的タンパク質の機能的エレメントを同定するためのハイスループット戦略および方法を提供することによって、前述のニーズの少なくともいくつかを満たす戦略または方法である(CRISPR-mpowered aturation utagenesis combined with ssorted-DNA-fragment equencing,CRESMAS)。具体的には、本発明は飽和突然変異誘発を適用し、表現型変化を引き起こすインフレーム突然変異(インフレーム欠失およびミスセンス部位特異的突然変異)のみを検索し、標的遺伝子の重要度にかかわらず、ゲノム領域またはタンパク質の機能に関連するキーサイトを同定する。
このアプローチを使用して、本発明者らは、六種のタンパク質、三種の細菌毒素受容体および三種のがん薬物ターゲットをマッピングし、既知のドメインまたはサイトおよび薬物または毒素敏感性に重要な役割を果たす新しいアミノ酸を含む単一アミノ酸分解能でそれらの統合機能図を取得した。さらに、この新規なアプローチは、重要な残基の包括かつ正確な単アミノ酸置換パターンを明らかにし、タンパク質の機能を除去したり、薬剤耐性を与えることができる。拡張可能なCRESMAS戦略は極めて高い精度と高効率を有し、高分解能で複数のタンパク質の配列-機能マッピングを行うことができ、且つタンパク質機能と薬剤耐性のメカニズムの研究を加速する可能性がある。
一態様では、本発明は、目的タンパク質の機能的エレメントを同定する方法に関し、当該方法は、各アミノ酸をカバーする複数の突然変異を提供するためにCRISPRシステムを用いる飽和誘変を行うこと、機能喪失表現型を引き起こすインフレーム突然変異の検索すること、シークエンシング分析するためにPCRがsgRNAコード領域および標的遺伝子のcDNAを増幅すること、および目的タンパク質に必要なアミノ酸を同定するためにシーケンシングデータを分析のための計算プロセスを確立することを含む。一実施形態では、目的タンパク質の機能的エレメントの同定は、単アミノ酸分解能で行われる。一実施形態では、目的タンパク質の機能的エレメントは、その天然の生物学的背景において同定される。一実施形態では、インフレーム突然変異は、インフレーム欠失およびミスセンス部位特異的突然変異である。
一実施形態では、CRISPRシステムを用いることによる飽和変異誘発は、目的タンパク質の全長にわたる各アミノ酸のsgRNA を設計することを含む。一実施形態では、各sgRNAはDSBサイトの周囲約10bp、例えば、7~13bp、例えば、8bp、9bp、10bp、11bp、および12bpに影響を及ぼすように設計される。一実施形態では、インフレーム欠失は、“運転者の欠失”(単一のアミノ酸欠失のみを含む)または“乗客の欠失”(複数のアミノ酸欠失を含む)などの運転者の欠失を含む。
一実施形態では、計算プロセスは以下を含む:
公開されているバイオインフォマティクスツールを使用して、標的遺伝子の参照配列にシークエンシングリードをマッピングし、前記バイオインフォマティクスツールは、例えば、Bowtie2 2.3.2およびSAMtools 1.3.1。
リードをフィルターし、ミスセンス突然変異またはインフレーム欠失などを保持する。
ミスセンス突然変異を含む断片について、各アミノ酸の突然変異比率を以下のように計算する:
Figure 2022537477000001
インフレーム欠失を含む断片について、各アミノ酸の欠失比率を以下のように計算する:
Figure 2022537477000002
インフレーム欠失をコードし、またアミノ酸欠失の数により、単一のアミノ酸欠失のみであれば「運転者の欠失」、複数のアミノ酸欠失であれば「乗客の欠失」としてインフレーム欠失を分類する。
実験群と対照群との間の倍数変化を計算し、
各アミノ酸の必須性スコアを以下のように算出する:
突然変異倍数変化については、全ての倍数変化に基づいてヌル分布を確立し、各アミノ酸について計算しスコア突然変異=-log10(P値)、
欠失の倍数変化に対し、まず調整可能なパラメーターαを適用して、運転者の欠失と乗客の欠失に次のように重みを付ける:
欠失倍数変化=運転者の倍数変化+α*乗客の倍数変化、続いて、100回並べ替えてヌル分布を確立し、且つアミノ酸ごとに計算しスコア欠失=-log10(P値)、
スコア突然変異及びスコア欠失を以下のように正規化する:
Figure 2022537477000003
スコア突然変異及びスコア欠失の重みを計算する:
a =欠失の倍数変化>1のアミノ酸の数
b =突然変異の倍数変化>1のアミノ酸の数
Figure 2022537477000004
必須性スコアの計算は以下のとおりである:
必須性スコア=wGHIJIKLM*スコアGHIJIKLM + wSTUTIKLM*スコアSTUTIKLM
一実施形態では、本方法は、必須スコアに従ってアミノ酸の機能的重要度に基づいてアミノ酸をランク付けすることをさらに含む。
一態様では、本発明は一種類のライブラリーに関し、複数のCRISPR-CasシステムガイドRNAを含むゲノム配列の機能的エレメントを同定するためにCRESMASに用いられ、前記ガイドRNAが、100個以上のゲノム配列を標的とし、前記ゲノム配列には、連続ゲノム領域の1000塩基対ごとにPAM配列の上流にある非重複切断部位が含むゲノム配列の機能的エレメント同定するためのライブラリーである。
一実施形態では、ライブラリー内の各RNAはDSBサイトの周囲約10bp、例えば、7~13bp、例えば、8bp、9bp、10bp、11bp、および12bpに影響を及ぼすように設計される。一実施形態では、ライブラリーは連続するゲノム領域内の各PAM配列の上流のゲノム配列を標的とするガイドRNA を含む。一実施形態では、PAM配列は、少なくとも一種類のCasタンパク質に特異的である。一実施形態では、CRISPR-CasシステムのガイドRNAは、少なくとも1つのCasタンパク質の特異性が複数のPAM配列より多いことを基づいて選択される一実施形態では、前記目的遺伝子の表現は、前記複数のCRISPR-CasシステムガイドRNAの中の少なくとも一つのガイドRNAの前記標的化とすることによって変化される。一実施形態では、前記ライブラリーは細胞集団、好ましく、真核細胞集団に導入される。一実施形態では、前記標的化は連続ゲノム領域のNHEJを引き起こす。一実施形態では、標的化は100以上の配列、例えば、約1,000以上の配列、約100,000以上の配列に対するものである。
一実施形態では、標的化は、細胞集団中の各細胞に一つまたは複数のベクターを導入するベクターシステムを含み、前記ベクターシステムは、操作された非天然のCRISPR-Casシステム含み、それは:
I.Cabタンパク質またはCasタンパク質をコードするポリヌクレオチド配列は、調節的エレメントに作動可能に接続され、
II. CRISPR-CasシステムガイドRNA、
そのうち成分IおよびIIが同じまたは異なるベクター内にあり、そこに転写されたガイド配列を含むガイドRNAが、crispr-casシステムと連続するゲノム領域内の標的配列の配列に特異的に結合するようにガイドし、これにより、Casタンパク質が連続するゲノム領域を切断するように誘導する。
一実施形態では、一つ以上のベクターはプラスミドベクターである。調節的エレメントは、誘導性プロモーターであり、好ましくは、誘導性プロモーターはドキシサイクリン(doxycycline)誘導性プロモーターである。
一態様では、本発明はCRESMAS方法に関し、それは以下を含む:
(a) 前記請求項のいずれか1項に記載のライブラリーを、各細胞が1つ以下のガイドRNAを含む少なくとも1つのCasタンパクを含む細胞集団に改造するように導入すること;
(b) 細胞表現型の変化に基づいて細胞を少なくとも二組に選別する;
(c) 各グループにガイドRNA の相対的な表現(representation)を存在し、それによって各グループに存在するガイドRNAの表現によって前記細胞表現型の変化に関連するゲノム部位を決定する;
(d) シークエンシングのために、標的遺伝子の1つまたは複数のcDNAまたはDNA配列を増幅する;
(e) シークエンシングリードを標的遺伝子の参照配列にマッピングする;
(f) リードをフィルターし、ミスセンス突然変異またはインフレームに欠失したリードのみを保持する;および
(g) バイオインフォマティクスプロセスを適用することにより、細胞の表現型に対する各アミノ酸またはヌクレオチドの重みが決定される。
一実施プロモーターまたはエンハンサー形態では、細胞表現型の変化は、目的遺伝子の転写および/または表現の増加または減少である。一実施形態では、細胞を高発現グループと低発現グループに分類される。一実施形態では、細胞表現型の変化は、機能喪失または機能獲得を含む。一実施形態では、当方法は、単一のアミノ酸分解能で目的タンパク質の機能的エレメントを同定するために使用される。
一実施形態では、上記の方法はノンコーディングRNA、プロモーターまたはエンハンサーの機能マップを同定するために用いられる。形態では、唯一の変更は、目的タンパク質の機能的エレメントが同定される場合、cDNAの代わりにゲノム上の標的領域のPCR増幅を実行する。
一態様では、本発明は化合物に対する耐性に関連する機能的エレメントをスクリーニングする方法に関し、それは以下を含む:
(a) 上記ライブラリーのいずれかを、Casタンパク質を含むように改造された細胞集団に導入し、ここで、該細胞集団の各細胞は1つ以下のガイドRNAを含む;
(b) 化合物による細胞集団を処理する;及び
(c) 処理前と比較して、前記化合物で処理した後のガイドRNAの表現(Termanent)を決定することにより、指示RNAをリッチにすることにより、前記化合物に対する耐性に関連するゲノム部位を特定する;
(d) シークエンシングのために、標的遺伝子の1つまたは複数のcDNAまたはDNA配列を増幅する;
(e) シークエンシングリードを標的遺伝子の参照配列にマッピングする;
(f) リードをフィルターし、ミスセンス突然変異またはインフレームに欠失したリードのみを保持する;および
(g) バイオインフォマティクスプロセスを適用することにより、化合物に対する各アミノ酸またはヌクレオチドの抵抗性の重み付けを決定される。
ある実施形態では、バイオインフォマティクスプロセスは以下を含む:
(h) ミスセンス突然変異を含む断片について、各アミノ酸の突然変異比率を以下のように計算する:
Figure 2022537477000005
(i)インフレーム欠失を含む断片について、各アミノ酸の欠失比率を以下のように計算する:
Figure 2022537477000006
(j) インフレーム欠失をコードし、またアミノ酸欠失の数により、単一のアミノ酸欠失のみであれば「運転者の欠失」、複数のアミノ酸欠失であれば「乗客の欠失」としてインフレーム欠失を分類する。
(k) 実験群と対照群との間の倍数変化を計算し、
(l) 各アミノ酸の必須性スコアを以下のように算出する:
(1) 突然変異倍数変化については、全ての倍数変化に基づいてヌル分布を確立し、各アミノ酸について計算しスコア突然変異=-log10(P値)、
(2) 欠失の倍数変化に対し、まず調整可能なパラメーターαを適用して、運転者の欠失と乗客の欠失に次のように重みを付ける:
欠失倍数変化=運転者の倍数変化+α*乗客の倍数変化、続いて、100回並べ替えてヌル分布を確立し、且つアミノ酸ごとに計算しスコア欠失=-log10(P値)、
(3) スコア突然変異及びスコア欠失を以下のように正規化する:
Figure 2022537477000007
(4) スコア突然変異及びスコア欠失の重みを計算する:
a =欠失の倍数変化>1のアミノ酸の数
b =突然変異の倍数変化>1のアミノ酸の数
Figure 2022537477000008
(5) 必須性スコアの計算は以下のとおりである:
必須スコア=wGHIJIKLM*スコアGHIJIKLM+wSTUTIKLM*スコアSTUTIKLM
本明細書の方法では、化合物は、真核細胞内の1つ以上のゲノム領域またはタンパク質の構造および/または機能に影響を与える任意の化合物であり得る。例えば、それは、本明細書に例示されるように、毒素または薬物であり得る。一部の実施形態では、真核細胞はヒト細胞である。真核細胞はヒト細胞である。
一態様では、本発明は、目的タンパク質の機能的要素を同定するための方法であり、当該方法は、細胞集団に導入されたCRISPR-Casシステムを用いてタンパク質をコードするゲノム遺伝子を破壊することによる目的タンパク質の飽和突然変異誘発を行い、DNAシークエンシングの決定による表現型変化に関する破壊されたゲノム部位を決定し、標的遺伝子のcDNAをシークエンシングし、表現型の変化を引き起こすインフレーム突然変異を検索すること、および単一のアミノ酸分解能で目的タンパク質の機能的エレメントを同定するためのバイオインフォマティクスプロセスを確立し、シークエンシングデータを分析することを含む。この方法では、目的のタンパク質の機能的エレメントは、その天然の生物学的背景において同定される。
この方法において、インフレーム突然変異が、インフレーム欠失及びミスセンス特異的突然変異である。一部の実施形態では、破壊は細胞集団内の各細胞に一つ又は複数のベクターのベクターシステムを導入することを含み、前記ベクターシステムが、操作された非天然のCRISPR-Casシステムを含み、それは以下を含む:
I.Cabタンパク質またはCasタンパク質をコードするポリヌクレオチド配列は、調節的エレメントに作動可能に接続され、および。
II.標的タンパク質をコードするゲノム遺伝子のガイドRNA、
成分IとIIは同じまたは異なるベクター上にあり、それらが転写されると、ガイド配列を含むガイドRNAがcrispr-casシステムとゲノム遺伝子の標的配列とは特異的に結合するように指示し、Casタンパク質によるゲノム領域の切断を誘導する。
一実施形態では、一つ以上のベクターはプラスミドベクターである。一実施形態では、調節的エレメントは誘導性プロモーターである。一実施形態では、ゲノム遺伝子内の1000塩基対ごとに、ガイドRNAはPAM配列の上流に重複しない切断サイトを含む少なくとも100のゲノム配列を標的とする。一実施形態では、各ガイドRNA は、DSB サイトの周囲約10bp(例えば、7~13bp、例えば、8、9、10、11、12bp)に影響を及ぼすように設計される。一実施形態では、前記ライブラリーは、ゲノム遺伝子内の各PAM配列の上流にあるゲノム配列を標的とするガイドRNAが含まれる。一実施形態では、PAM配列は、少なくとも一種類のCasタンパク質に特異的である。
一実施形態では、CRISPR-CasシステムのガイドRNAは、少なくとも1つのCasタンパク質の特異性が複数のPAM配列より多いことを基づいて選択される一実施形態では、前記目的遺伝子の表現は、前記複数のCRISPR-CasシステムガイドRNAの中の少なくとも一つのガイドRNAの前記標的化とすることによって変化される。一実施形態では、前記標的化はゲノム遺伝子のNHEJを引き起こす。
一態様では、本発明は、例えば本発明のいずれかの方法により、タンパク質のゲノム遺伝子の機能に重要なゲノム部位またはアミノ酸サイトとして同定された機能的エレメントを突然変異させることにより遺伝子またはタンパク質を修飾する方法に関する。該方法によってタンパク質の機能に重要であると同定されたアミノ酸サイトにおいてアミノ酸置換および/または欠失を有する変異体タンパク質も検討される。
図1A-1Bは、RESMASワークフローである。薬物または毒素の処理によってライブラリーのスクリーニングを行い、次にsgRNAコードおよび標的遺伝子のcDNAをNGS のための増幅をする。ミスセンス突然変異のみを有するリードを収集し、部位特異的突然変異倍数変化の計算および突然変異パターン分析のために用いる。インフレーム欠失を含むリードを、欠失におけるアミノ酸(a.a.)の数によって分類し、回収して欠失倍数変化を計算する。必須スコアは、インフレーム欠失およびミスセンス突然変異からの情報を利用することによって計算される。 図1A-1Bは、RESMASワークフローである。薬物または毒素の処理によってライブラリーのスクリーニングを行い、次にsgRNAコードおよび標的遺伝子のcDNAをNGS のための増幅をする。ミスセンス突然変異のみを有するリードを収集し、部位特異的突然変異倍数変化の計算および突然変異パターン分析のために用いる。インフレーム欠失を含むリードを、欠失におけるアミノ酸(a.a.)の数によって分類し、回収して欠失倍数変化を計算する。必須スコアは、インフレーム欠失およびミスセンス突然変異からの情報を利用することによって計算される。 図2A~2Eは、CRESMASスクリーニングの実験条件である。図2Aは、指示された処置時間でのHeLa細胞死に対する3つの抗がん剤の用量効果である。図2Bは、スクリーニングにおける各遺伝子のsgRNAのカバーエリアは、各sgRNAはその切断サイトの上流と下流で10bpに影響すると想定されることを示す。x軸は、アミノ酸がカバーするsgRNA の数を表す。y軸は、sgRNAの影響を受けるアミノ酸(a.a.)の数を表す。図2Cはライブラリー内のsgRNA配列の分布と比較する。図2Dは標的cDNAのPCR増幅の概略図である。異なる遺伝子に使用されるプライマーを表4に列挙する。図2Eは標的cDNAのPCR増幅(左)とDNA断片の平均長さを250bpへの切断(右)である。 図2A~2Eは、CRESMASスクリーニングの実験条件である。図2Aは、指示された処置時間でのHeLa 細胞死に対する3つの抗がん剤の用量効果である。図2Bは、スクリーニングにおける各遺伝子のsgRNAのカバーエリアは、各sgRNAはその切断サイトの上流と下流で10bpに影響すると想定されることを示す。x 軸は、アミノ酸がカバーするsgRNA の数を表す。y 軸は、sgRNAの影響を受けるアミノ酸(a.a.)の数を表す。図2Cはライブラリー内のsgRNA配列の分布と比較する。図2Dは標的cDNA のPCR 増幅の概略図である。異なる遺伝子に使用されるプライマーを表4に列挙する。図2Eは標的cDNA のPCR 増幅(左)とDNA断片の平均長さを250 bpへの切断(右)である。 図2A ~2Eは、CRESMASスクリーニングの実験条件である。図2Aは、指示された処置時間でのHeLa 細胞死に対する3つの抗がん剤の用量効果である。図2Bは、スクリーニングにおける各遺伝子のsgRNAのカバーエリアは、各sgRNAはその切断サイトの上流と下流で10bpに影響すると想定されることを示す。x 軸は、アミノ酸がカバーするsgRNA の数を表す。y 軸は、sgRNAの影響を受けるアミノ酸(a.a.)の数を表す。図2Cはライブラリー内のsgRNA配列の分布と比較する。図2Dは標的cDNA のPCR 増幅の概略図である。異なる遺伝子に使用されるプライマーを表4に列挙する。図2Eは標的cDNA のPCR 増幅(左)とDNA断片の平均長さを250 bpへの切断(右)である。 図2A ~2Eは、CRESMASスクリーニングの実験条件である。図2Aは、指示された処置時間でのHeLa 細胞死に対する3つの抗がん剤の用量効果である。図2Bは、スクリーニングにおける各遺伝子のsgRNAのカバーエリアは、各sgRNAはその切断サイトの上流と下流で10bpに影響すると想定されることを示す。x 軸は、アミノ酸がカバーするsgRNA の数を表す。y 軸は、sgRNAの影響を受けるアミノ酸(a.a.)の数を表す。図2Cはライブラリー内のsgRNA配列の分布と比較する。図2Dは標的cDNA のPCR 増幅の概略図である。異なる遺伝子に使用されるプライマーを表4に列挙する。図2Eは標的cDNA のPCR 増幅(左)とDNA断片の平均長さを250 bpへの切断(右)である。 図2A ~2Eは、CRESMASスクリーニングの実験条件である。図2Aは、指示された処置時間でのHeLa 細胞死に対する3つの抗がん剤の用量効果である。図2Bは、スクリーニングにおける各遺伝子のsgRNAのカバーエリアは、各sgRNAはその切断サイトの上流と下流で10bpに影響すると想定されることを示す。x 軸は、アミノ酸がカバーするsgRNA の数を表す。y 軸は、sgRNAの影響を受けるアミノ酸(a.a.)の数を表す。図2Cはライブラリー内のsgRNA配列の分布と比較する。図2Dは標的cDNA のPCR 増幅の概略図である。異なる遺伝子に使用されるプライマーを表4に列挙する。図2Eは標的cDNA のPCR 増幅(左)とDNA断片の平均長さを250bpへの切断(右)である。 図3A~3Bは、ライブラリー品質と編集タイプの配布である。図3Aは、対照群の各遺伝子から検出された部位特異的突然変異、挿入および欠失のパーセンテージ、及びスクリーニング後の二回の繰り返し。図3Bは、二回の繰り返しの間の対数スケールでスクリーニングした後のsgRNA倍数変化の散布図である。 図3A~3Bは、ライブラリー品質と編集タイプの配布である。図3Aは、対照群の各遺伝子から検出された部位特異的突然変異、挿入および欠失のパーセンテージ、及びスクリーニング後の二回の繰り返し。図3Bは、二回の繰り返しの間の対数スケールでスクリーニングした後のsgRNA倍数変化の散布図である。 図4A ~4Bは繰り返しの欠失倍数変化および部位特異的突然変異倍数変化の散布図である。図4A は、二回の繰り返しの間のスクリーニング後の欠失倍率変化の散布図である。図4Bは、二回の繰り返しの間のスクリーニング後の部位特異的突然変異倍数変化の散布図である。 図4A ~4Bは繰り返しの欠失倍数変化および部位特異的突然変異倍数変化の散布図である。図4A は、二回の繰り返しの間のスクリーニング後の欠失倍率変化の散布図である。図4Bは、二回の繰り返しの間のスクリーニング後の部位特異的突然変異倍数変化の散布図である。 図5A ~5CはPA毒性の媒介におけるANTXR1に必須の重要なアミノ酸のCRESMAS同定を示す。図5Aは、PAスクリーニングにおけるANTXR1を標的とするsgRNAの評価を示す。ANTXR1タンパク質に対する各sgRNAの位置は、x軸に沿って示す。図5Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応する。ANTXR1のマルチドメイン(multi-domain)の概略図であり、PA結合部位を示す。図5CはANTXR1の各アミノ酸の必須スコアを示す。上位のヒットは濃い灰色で示され、既知の重要なアミノ酸を三角で示す。 図5A ~5CはPA毒性の媒介におけるANTXR1に必須の重要なアミノ酸のCRESMAS同定を示す。図5Aは、PAスクリーニングにおけるANTXR1を標的とするsgRNAの評価を示す。ANTXR1タンパク質に対する各sgRNAの位置は、x軸に沿って示す。図5Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応する。ANTXR1のマルチドメイン(multi-domain)の概略図であり、PA結合部位を示す。図5CはANTXR1の各アミノ酸の必須スコアを示す。上位のヒットは濃い灰色で示され、既知の重要なアミノ酸を三角で示す。 図5A ~5CはPA毒性の媒介におけるANTXR1に必須の重要なアミノ酸のCRESMAS同定を示す。図5Aは、PAスクリーニングにおけるANTXR1を標的とするsgRNAの評価を示す。ANTXR1タンパク質に対する各sgRNAの位置は、x軸に沿って示す。図5Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応する。ANTXR1のマルチドメイン(multi-domain)の概略図であり、PA結合部位を示す。図5CはANTXR1の各アミノ酸の必須スコアを示す。上位のヒットは濃い灰色で示され、既知の重要なアミノ酸を三角で示す。 図6A ~6Cは、CSPG4がTcdB毒性を媒介するために必要な重要なアミノ酸のCRESMAS同定を示す。図6A は、TcdBスクリーニングにおけるCSPG 4を標的とするsgRNAの評価を示す。CSPG 4タンパク質に対する各sgRNAの位置は、x軸に沿って示す。図6Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応する。図は、CSPG4のマルチドメイン(multi-domain)の概略図であり、TcdB結合部位を示す。図6CはCSPG 4の各アミノ酸の必須スコアを示す。上位のヒットは濃い灰色で示される。 図6A ~6Cは、CSPG4がTcdB毒性を媒介するために必要な重要なアミノ酸のCRESMAS同定を示す。図6A は、TcdBスクリーニングにおけるCSPG 4を標的とするsgRNAの評価を示す。CSPG 4タンパク質に対する各sgRNAの位置は、x軸に沿って示す。図6Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応する。図は、CSPG4のマルチドメイン(multi-domain)の概略図であり、TcdB結合部位を示す。図6CはCSPG 4の各アミノ酸の必須スコアを示す。上位のヒットは濃い灰色で示される。 図6A ~6Cは、CSPG4がTcdB毒性を媒介するために必要な重要なアミノ酸のCRESMAS同定を示す。図6A は、TcdBスクリーニングにおけるCSPG 4を標的とするsgRNAの評価を示す。CSPG 4タンパク質に対する各sgRNAの位置は、x軸に沿って示す。図6Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応する。図は、CSPG4のマルチドメイン(multi-domain)の概略図であり、TcdB結合部位を示す。図6CはCSPG 4の各アミノ酸の必須スコアを示す。上位のヒットは濃い灰色で示される。 図7A ~7DはHBEGF がDT 毒性を媒介するのに必須の重要なアミノ酸のCRESMAS同定を示す。図7A は、DTスクリーニングにおけるHBEGF を標的とするsgRNA の評価である。HBEGF タンパク質に対する各sgRNA の位置をx 軸に沿って示す。sgRNA の位置はsgRNA の切断サイトとして定義され、倍数変化は各アミノ酸を標的とするコドンのsgRNAの平均倍数変化である。図7B は、各アミノ酸の対応する欠失および部位特異的突然変異の倍率変化である。グレーのバーは複数のアミノ酸の欠失を示す。グレーのバーの幅は、欠失したアミノ酸の数と相関する。各単一アミノ酸のグレースケール割り当ては10%である。グレースケールを重ねて、異なる欠失パターンにおける任意の特定のアミノ酸の統計的重要度を示す。アスタリスクは、タンパク質の機能に重要な既知の残基を示す。HBEGFの多領域図を図に示され、既知のDT結合領域であるEGF 様ドメインを示す。図7C は、HBEGF の各アミノ酸の必須スコアを示す。上位のヒットは濃いグレーで示され、既知の重要なアミノ酸は三角形である。図7D は、DT に対する細胞の敏感性に対する単一アミノ酸の欠失の影響を示す。細胞を異なる濃度のDTで処理し、毒素処理の48時間後にMTT細胞毒性の測定を実施した。データは、平均±s. d.、n =5として表す。 図7A ~7DはHBEGF がDT 毒性を媒介するのに必須の重要なアミノ酸のCRESMAS同定を示す。図7A は、DTスクリーニングにおけるHBEGF を標的とするsgRNA の評価である。HBEGF タンパク質に対する各sgRNA の位置をx 軸に沿って示す。sgRNA の位置はsgRNA の切断サイトとして定義され、倍数変化は各アミノ酸を標的とするコドンのsgRNAの平均倍数変化である。図7B は、各アミノ酸の対応する欠失および部位特異的突然変異の倍率変化である。グレーのバーは複数のアミノ酸の欠失を示す。グレーのバーの幅は、欠失したアミノ酸の数と相関する。各単一アミノ酸のグレースケール割り当ては10%である。グレースケールを重ねて、異なる欠失パターンにおける任意の特定のアミノ酸の統計的重要度を示す。アスタリスクは、タンパク質の機能に重要な既知の残基を示す。HBEGFの多領域図を図に示され、既知のDT結合領域であるEGF 様ドメインを示す。図7Cは、HBEGF の各アミノ酸の必須スコアを示す。上位のヒットは濃いグレーで示され、既知の重要なアミノ酸は三角形である。図7D は、DT に対する細胞の敏感性に対する単一アミノ酸の欠失の影響を示す。細胞を異なる濃度のDTで処理し、毒素処理の48時間後にMTT細胞毒性の測定を実施した。データは、平均±s. d.、n =5として表す。 図7A ~7DはHBEGF がDT 毒性を媒介するのに必須の重要なアミノ酸のCRESMAS同定を示す。図7A は、DTスクリーニングにおけるHBEGF を標的とするsgRNA の評価である。HBEGF タンパク質に対する各sgRNA の位置をx 軸に沿って示す。sgRNA の位置はsgRNA の切断サイトとして定義され、倍数変化は各アミノ酸を標的とするコドンのsgRNAの平均倍数変化である。図7B は、各アミノ酸の対応する欠失および部位特異的突然変異の倍率変化である。グレーのバーは複数のアミノ酸の欠失を示す。グレーのバーの幅は、欠失したアミノ酸の数と相関する。各単一アミノ酸のグレースケール割り当ては10%である。グレースケールを重ねて、異なる欠失パターンにおける任意の特定のアミノ酸の統計的重要度を示す。アスタリスクは、タンパク質の機能に重要な既知の残基を示す。HBEGFの多領域図を図に示され、既知のDT結合領域であるEGF 様ドメインを示す。図7C は、HBEGF の各アミノ酸の必須スコアを示す。上位のヒットは濃いグレーで示され、既知の重要なアミノ酸は三角形である。図7D は、DT に対する細胞の敏感性に対する単一アミノ酸の欠失の影響を示す。細胞を異なる濃度のDTで処理し、毒素処理の48時間後にMTT細胞毒性の測定を実施した。データは、平均±s. d.、n =5として表す。 図7A ~7DはHBEGF がDT 毒性を媒介するのに必須の重要なアミノ酸のCRESMAS同定を示す。図7A は、DTスクリーニングにおけるHBEGF を標的とするsgRNA の評価である。HBEGF タンパク質に対する各sgRNA の位置をx 軸に沿って示す。sgRNA の位置はsgRNA の切断サイトとして定義され、倍数変化は各アミノ酸を標的とするコドンのsgRNAの平均倍数変化である。図7B は、各アミノ酸の対応する欠失および部位特異的突然変異の倍率変化である。グレーのバーは複数のアミノ酸の欠失を示す。グレーのバーの幅は、欠失したアミノ酸の数と相関する。各単一アミノ酸のグレースケール割り当ては10%である。グレースケールを重ねて、異なる欠失パターンにおける任意の特定のアミノ酸の統計的重要度を示す。アスタリスクは、タンパク質の機能に重要な既知の残基を示す。HBEGFの多領域図を図に示され、既知のDT結合領域であるEGF 様ドメインを示す。図7C は、HBEGF の各アミノ酸の必須スコアを示す。上位のヒットは濃いグレーで示され、既知の重要なアミノ酸は三角形である。図7D は、DT に対する細胞の敏感性に対する単一アミノ酸の欠失の影響を示す。細胞を異なる濃度のDTで処理し、毒素処理の48時間後にMTT細胞毒性の測定を実施した。データは、平均±s. d.、n =5として表す。 図8A ~8C 6-TG 殺傷におけるHPRT 1に必須の重要なアミノ酸のCRESMAS同定を示す。図8A は、ホウレンチゾミスクリーニングにおけるHPRT1を標的とするsgRNA の評価を示す。HPRT1タンパク質に対する各sgRNA の位置は、x 軸に沿って示す。図8Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応する。下の図はHPRT 1のマルチドメイン概略図を示す。図8C は、HPRT 1の各アミノ酸の必須スコアを示す。上位のヒットは濃い灰色で示される。 図8A ~8C 6-TG 殺傷におけるHPRT 1に必須の重要なアミノ酸のCRESMAS同定を示す。図8A は、ホウレンチゾミスクリーニングにおけるHPRT1を標的とするsgRNA の評価を示す。HPRT1タンパク質に対する各sgRNA の位置は、x 軸に沿って示す。図8Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応する。下の図はHPRT 1のマルチドメイン概略図を示す。図8C は、HPRT 1の各アミノ酸の必須スコアを示す。上位のヒットは濃い灰色で示される。 図8A ~8C 6-TG 殺傷におけるHPRT 1に必須の重要なアミノ酸のCRESMAS同定を示す。図8A は、ホウレンチゾミスクリーニングにおけるHPRT1を標的とするsgRNA の評価を示す。HPRT1タンパク質に対する各sgRNA の位置は、x 軸に沿って示す。図8Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応する。下の図はHPRT 1のマルチドメイン概略図を示す。図8C は、HPRT 1の各アミノ酸の必須スコアを示す。上位のヒットは濃い灰色で示される。 図9A ~9Eは、PSMB5がホウレンチゾミの死滅に必須の重要なアミノ酸のCRESMAS同定を示す。図9A は、ホウレンチゾミスクリーニングにおけるPSMB 5を標的とするsgRNA の評価を示す。PSMB 5タンパク質に対する各sgRNA の位置は、x 軸に沿って示す。図9Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応する。図9Cは、PSMB 5の各アミノ酸の必要性スコアを示す。上位のヒットは濃いグレーで示され、既知の重要なアミノ酸は三角形である。図9Dは、PSMB5の特異的突然変異がボレンテゾミに対する細胞敏感性に与える影響のMTT保存力の測定である。図9Eは、PSMB5の特定する特異的突然変異がホウレンテゾミに対する細胞感受性に影響を与える。データは、平均±s. d.、n =6として表す。 図9A ~9Eは、PSMB5がホウレンチゾミの死滅に必須の重要なアミノ酸のCRESMAS同定を示す。図9A は、ホウレンチゾミスクリーニングにおけるPSMB 5を標的とするsgRNA の評価を示す。PSMB 5タンパク質に対する各sgRNA の位置は、x 軸に沿って示す。図9Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応する。図9Cは、PSMB 5の各アミノ酸の必要性スコアを示す。上位のヒットは濃いグレーで示され、既知の重要なアミノ酸は三角形である。図9Dは、PSMB5の特異的突然変異がボレンテゾミに対する細胞敏感性に与える影響のMTT保存力の測定である。図9Eは、PSMB5の特定する特異的突然変異がホウレンテゾミに対する細胞感受性に影響を与える。データは、平均±s. d.、n =6として表す。 図9A ~9Eは、PSMB5がホウレンチゾミの死滅に必須の重要なアミノ酸のCRESMAS同定を示す。図9A は、ホウレンチゾミスクリーニングにおけるPSMB 5を標的とするsgRNA の評価を示す。PSMB 5タンパク質に対する各sgRNA の位置は、x 軸に沿って示す。図9Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応する。図9Cは、PSMB 5の各アミノ酸の必要性スコアを示す。上位のヒットは濃いグレーで示され、既知の重要なアミノ酸は三角形である。図9Dは、PSMB5の特異的突然変異がボレンテゾミに対する細胞敏感性に与える影響のMTT保存力の測定である。図9Eは、PSMB5の特定する特異的突然変異がホウレンテゾミに対する細胞感受性に影響を与える。データは、平均±s. d.、n =6として表す。 図9A ~9Eは、PSMB5がホウレンチゾミの死滅に必須の重要なアミノ酸のCRESMAS同定を示す。図9A は、ホウレンチゾミスクリーニングにおけるPSMB 5を標的とするsgRNA の評価を示す。PSMB 5タンパク質に対する各sgRNA の位置は、x 軸に沿って示す。図9Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応する。図9Cは、PSMB 5の各アミノ酸の必要性スコアを示す。上位のヒットは濃いグレーで示され、既知の重要なアミノ酸は三角形である。図9Dは、PSMB5の特異的突然変異がボレンテゾミに対する細胞敏感性に与える影響のMTT保存力の測定である。図9Eは、PSMB5の特定する特異的突然変異がホウレンテゾミに対する細胞感受性に影響を与える。データは、平均±s. d.、n =6として表す。 図9A ~9Eは、PSMB5がホウレンチゾミの死滅に必須の重要なアミノ酸のCRESMAS同定を示す。図9A は、ホウレンチゾミスクリーニングにおけるPSMB 5を標的とするsgRNA の評価を示す。PSMB 5タンパク質に対する各sgRNA の位置は、x 軸に沿って示す。図9Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応する。図9Cは、PSMB 5の各アミノ酸の必要性スコアを示す。上位のヒットは濃いグレーで示され、既知の重要なアミノ酸は三角形である。図9Dは、PSMB5の特異的突然変異がボレンテゾミに対する細胞敏感性に与える影響のMTT保存力の測定である。図9Eは、PSMB5の特定する特異的突然変異がホウレンテゾミに対する細胞感受性に影響を与える。データは、平均±s. d.、n =6として表す。 図10A ~10D は、BI 2536死滅においてPLK 1に必須の重要なアミノ酸のCRESMAS同定である。図10A は、ホウレンチゾミスクリーニングにおけるPLK 1を標的とするsgRNA の評価を示す。PLK 1タンパク質に対する各sgRNA の位置は、x 軸に沿って示す。図10Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応する。図10Cは、 PLK 1の各アミノ酸の必須スコアを示す。上位のヒットは濃いグレーで示され、既知の重要なアミノ酸は三角形である。図10D は、BI 2536に対する細胞の敏感性に対するPLK 1の指定された部位特異的突然変異の影響を決定するためのMTT活性測定図である。 図10A ~10D は、BI 2536死滅においてPLK 1に必須の重要なアミノ酸のCRESMAS同定である。図10A は、ホウレンチゾミスクリーニングにおけるPLK 1を標的とするsgRNA の評価を示す。PLK 1タンパク質に対する各sgRNA の位置は、x 軸に沿って示す。図10Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応する。図10Cは、 PLK 1の各アミノ酸の必須スコアを示す。上位のヒットは濃いグレーで示され、既知の重要なアミノ酸は三角形である。図10D は、BI 2536に対する細胞の敏感性に対するPLK 1の指定された部位特異的突然変異の影響を決定するためのMTT活性測定図である。 図10A ~10D は、BI 2536死滅においてPLK 1に必須の重要なアミノ酸のCRESMAS同定である。図10A は、ホウレンチゾミスクリーニングにおけるPLK 1を標的とするsgRNA の評価を示す。PLK 1タンパク質に対する各sgRNA の位置は、x 軸に沿って示す。図10Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応する。図10Cは、 PLK 1の各アミノ酸の必須スコアを示す。上位のヒットは濃いグレーで示され、既知の重要なアミノ酸は三角形である。図10D は、BI 2536に対する細胞の敏感性に対するPLK 1の指定された部位特異的突然変異の影響を決定するためのMTT活性測定図である。 図10A ~10D は、BI 2536死滅においてPLK 1に必須の重要なアミノ酸のCRESMAS同定である。図10A は、ホウレンチゾミスクリーニングにおけるPLK 1を標的とするsgRNA の評価を示す。PLK 1タンパク質に対する各sgRNA の位置は、x 軸に沿って示す。図10Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応する。図10Cは、 PLK 1の各アミノ酸の必須スコアを示す。上位のヒットは濃いグレーで示され、既知の重要なアミノ酸は三角形である。図10D は、BI 2536に対する細胞の敏感性に対するPLK 1の指定された部位特異的突然変異の影響を決定するためのMTT活性測定図である。 図11は、ssODNドナーのトランスフェクションの有無にかかわらずプールされた細胞からのPSMB5のアミノ酸変異のシーケンスクロマトグラムである。 プールされた細胞からのPSMB 5におけるアミノ酸変異の配列決定クロマトグラムである。図は、変異したアミノ酸を示す。 図12は、ホウレンチゾミ耐性細胞クローンの配列情報である。sgRNA 配列に下線を引く;影付きのヌクレオチドはPAM 配列を表す;下にドットが付いた文字と四角でマークされた文字は、それぞれ野生型と突然変異型アミノ酸を表す。 図13A ~13Hは、PSMB 5およびPLK 1の上位ヒットの部位特異的突然変異パターンである。ヒートマップは、PSMB 5図13A およびPLK 1図13B の上位ヒットの特定アミノ酸の部位特異的突然変異の多様性を示す。棒グラフは、V90PSMB5 図13C、A386PLK1 図13D、M104PSMB5及びC122PSMB5 図13E、F183PLK1及びR136PLK1 図13F、A105PSMB5及びA43PSMB5図13G の20個アミノ酸置換のパーセンテージを表す。側鎖の性質に応じて、20個のアミノ酸は異なる棒状形態の4つのグループ(非極性、極性、酸性、塩基性)に分けられる。元のアミノ酸をグレーの影で強調表示される。図13H はA105PSMB5とA43PSMB5との間のアミノ酸分布の散布図である。 図13A ~13Hは、PSMB 5およびPLK 1の上位ヒットの部位特異的突然変異パターンである。ヒートマップは、PSMB 5図13A およびPLK 1図13B の上位ヒットの特定アミノ酸の部位特異的突然変異の多様性を示す。棒グラフは、V90PSMB5 図13C、A386PLK1 図13D、M104PSMB5及びC122PSMB5 図13E、F183PLK1及びR136PLK1 図13F、A105PSMB5及びA43PSMB5図13G の20個アミノ酸置換のパーセンテージを表す。側鎖の性質に応じて、20個のアミノ酸は異なる棒状形態の4つのグループ(非極性、極性、酸性、塩基性)に分けられる。元のアミノ酸をグレーの影で強調表示される。図13H はA105PSMB5とA43PSMB5との間のアミノ酸分布の散布図である。 図13A ~13Hは、PSMB 5およびPLK 1の上位ヒットの部位特異的突然変異パターンである。ヒートマップは、PSMB 5図13A およびPLK 1図13B の上位ヒットの特定アミノ酸の部位特異的突然変異の多様性を示す。棒グラフは、V90PSMB5 図13C、A386PLK1 図13D、M104PSMB5及びC122PSMB5 図13E、F183PLK1及びR136PLK1 図13F、A105PSMB5及びA43PSMB5図13G の20個アミノ酸置換のパーセンテージを表す。側鎖の性質に応じて、20個のアミノ酸は異なる棒状形態の4つのグループ(非極性、極性、酸性、塩基性)に分けられる。元のアミノ酸をグレーの影で強調表示される。図13H はA105PSMB5とA43PSMB5との間のアミノ酸分布の散布図である。 図13A ~13Hは、PSMB 5およびPLK 1の上位ヒットの部位特異的突然変異パターンである。ヒートマップは、PSMB 5図13A およびPLK 1図13B の上位ヒットの特定アミノ酸の部位特異的突然変異の多様性を示す。棒グラフは、V90PSMB5 図13C、A386PLK1 図13D、M104PSMB5及びC122PSMB5 図13E、F183PLK1及びR136PLK1 図13F、A105PSMB5及びA43PSMB5図13G の20個アミノ酸置換のパーセンテージを表す。側鎖の性質に応じて、20個のアミノ酸は異なる棒状形態の4つのグループ(非極性、極性、酸性、塩基性)に分けられる。元のアミノ酸をグレーの影で強調表示される。図13H はA105PSMB5とA43PSMB5との間のアミノ酸分布の散布図である。 図13A ~13Hは、PSMB 5およびPLK 1の上位ヒットの部位特異的突然変異パターンである。ヒートマップは、PSMB 5図13A およびPLK 1図13B の上位ヒットの特定アミノ酸の部位特異的突然変異の多様性を示す。棒グラフは、V90PSMB5 図13C、A386PLK1 図13D、M104PSMB5及びC122PSMB5 図13E、F183PLK1及びR136PLK1 図13F、A105PSMB5及びA43PSMB5図13G の20個アミノ酸置換のパーセンテージを表す。側鎖の性質に応じて、20個のアミノ酸は異なる棒状形態の4つのグループ(非極性、極性、酸性、塩基性)に分けられる。元のアミノ酸をグレーの影で強調表示される。図13H はA105PSMB5とA43PSMB5との間のアミノ酸分布の散布図である。 図13A ~13Hは、PSMB 5およびPLK 1の上位ヒットの部位特異的突然変異パターンである。ヒートマップは、PSMB 5図13A およびPLK 1図13B の上位ヒットの特定アミノ酸の部位特異的突然変異の多様性を示す。棒グラフは、V90PSMB5 図13C、A386PLK1 図13D、M104PSMB5及びC122PSMB5 図13E、F183PLK1及びR136PLK1 図13F、A105PSMB5及びA43PSMB5図13G の20個アミノ酸置換のパーセンテージを表す。側鎖の性質に応じて、20個のアミノ酸は異なる棒状形態の4つのグループ(非極性、極性、酸性、塩基性)に分けられる。元のアミノ酸をグレーの影で強調表示される。図13H はA105PSMB5とA43PSMB5との間のアミノ酸分布の散布図である。 図13A ~13Hは、PSMB 5およびPLK 1の上位ヒットの部位特異的突然変異パターンである。ヒートマップは、PSMB 5図13A およびPLK 1図13B の上位ヒットの特定アミノ酸の部位特異的突然変異の多様性を示す。棒グラフは、V90PSMB5 図13C、A386PLK1 図13D、M104PSMB5及びC122PSMB5 図13E、F183PLK1及びR136PLK1 図13F、A105PSMB5及びA43PSMB5図13G の20個アミノ酸置換のパーセンテージを表す。側鎖の性質に応じて、20個のアミノ酸は異なる棒状形態の4つのグループ(非極性、極性、酸性、塩基性)に分けられる。元のアミノ酸をグレーの影で強調表示される。図13H はA105PSMB5とA43PSMB5との間のアミノ酸分布の散布図である。 図13A ~13Hは、PSMB 5およびPLK 1の上位ヒットの部位特異的突然変異パターンである。ヒートマップは、PSMB 5図13A およびPLK 1図13B の上位ヒットの特定アミノ酸の部位特異的突然変異の多様性を示す。棒グラフは、V90PSMB5 図13C、A386PLK1 図13D、M104PSMB5及びC122PSMB5 図13E、F183PLK1及びR136PLK1 図13F、A105PSMB5及びA43PSMB5図13G の20個アミノ酸置換のパーセンテージを表す。側鎖の性質に応じて、20個のアミノ酸は異なる棒状形態の4つのグループ(非極性、極性、酸性、塩基性)に分けられる。元のアミノ酸をグレーの影で強調表示される。図13H はA105PSMB5とA43PSMB5との間のアミノ酸分布の散布図である。
本明細書に記載される方法およびツールは、ゲノム編集に関心があり得る関連する機能単位の同定を可能にするために、ゲノム領域の体系的な調査に関する。したがって、一態様では、本発明は、ゲノム領域を調査する方法を提供し、該方法は、ディープスキャニング突然変異誘発ライブラリーを生成することおよびライブラリーを導入することによって変更された細胞集団の表現型の変化について調査することを含む。
したがって、本発明の一態様は、複数のcrispr-casシステムガイドRNAを含むことができ、少なくとも1つの連続するゲノム領域内でゲノム配列を標的化することができるガイド配列を含むことができるディープスキャン突然変異誘導ライブラリーを含む。より具体的には、ライブラリーのガイドRNA は、ゲノム領域内の代表的な数のゲノム配列を標的とすべきであると想定される。例えば、ガイドRNA は、想定されるゲノム領域内の少なくとも50個、より具体的には少なくとも100個のゲノム配列を標的とすべきである。
ゲノム領域を標的とする能力は、PAM (前間隔配列隣接基底系列)の存在によって決定される;すなわち、CRISPR複合体によって認識される短い配列である。PAMの正確な配列および長さの要件は、使用されるCRISPR酵素によって異なるが、PAMは通常、前間隔配列(すなわち、標的配列)に隣接する2~5塩基対の配列である。当技術分野で既知のPAM 配列であり、且つ当業者は所与のCRISPR酵素に対するPAM配列を同定することができる。具体的な実施形態では、PAM 配列は、少なくとも一つのCas タンパク質に特異的であるように選択され得る。代替実施形態では、ガイダンス配列RNAは、少なくとも1つのCasタンパク質に特異的な複数のPAM配列に基づいて選択され得る。
具体的な実施形態では、ライブラリーは、ゲノム領域内のPAM配列1000塩基対毎の上流の非重複切断部位を含む少なくとも100のゲノム配列を含む。具体的な実施形態では、ライブラリーは連続するゲノム領域内の各PAM 配列の上流のゲノム配列を標的とするガイドRNA を含む。
該ライブラリーには、生物体目的のゲノム領域を標的とするガイドRNA を含む。本発明のいくつかの実施形態において、生物または対象は、真核生物(ヒトを含む哺乳動物を含む)または非ヒト真核生物または非ヒト動物または非ヒト哺乳動物である。一部の実施形態では、生物体または対象は非ヒト動物であり、節足動物、例えば昆虫であってもよいし、線虫であってもよい。本発明のいくつかの方法において、生物または対象は植物である。本発明のいくつかの方法において、生物または対象は、哺乳動物、例えばヒトまたは非ヒト哺乳動物である。非ヒト哺乳動物は、例えば、齧歯動物(好ましくは、マウスまたはラット)、有蹄類動物、または霊長類動物であり得る。本発明のいくつかの方法において、生物または対象は、微細藻類を含む藻類または真菌である。
本明細書で提供される方法およびツールは、連続ゲノム領域を調べるのに特に有利である。そのような連続的なゲノム領域はゲノム全体までを含むことができるが、特に有利なのは、ゲノムの機能的エレメントが調査される方法であり、これは通常、ゲノムDNAの50~100kbの領域などの限られた領域をカバーする。特定の目的は、コードゲノム領域の調査にこの方法の使用することである。当業者であれば、本発明の方法を使用して、例えば、目的遺伝子のコード領域の5’および3’領域のような非コードゲノム領域を問い合わせることができ、これは、目的のタンパク質を問い合わせた場合のcDNAではなく、プランを改変することによってゲノム上の標的領域にPCR増幅可能であることが理解できる。
CRISPR/Casシステムは、連続する目的のゲノム領域内の複数の配列を特異的に標的化するために本発明で使用することができる。前記標的化は通常、工学的に非自然的に存在するcrispr-casシステムを含む1つまたは複数のベクターのベクターシステムを細胞グループの各細胞に導入することを含み、前記CRISPR-Casシステムは、少なくとも1種類のCasタンパク質とガイドRNAを含む。これらの方法では、Cas タンパク質とガイドRNA はシステムの同じまたは異なるベクターに配置し、各細胞に統合されることができ、したがって、各ガイド配列は、細胞グループの各細胞における連続するゲノム領域内の配列を標的とする。より具体的に細胞集団の細胞で表現するプロモーターに適した細胞内での表現を保証するために、Casタンパク質は調節的エレメントと動作可能に接続されている。具体の実施形態では、プロモーターは、ドキシサイクリン誘導性プロモーターなどの誘導性プロモーターである。細胞集団の細胞で転写されると、ガイド配列を含むガイドRNAは、CRISPR-Casシステムをガイドし、連続ゲノム領域の標的配列と配列特異的に結合する。一般に、crispr-casシステムの結合は、Casタンパク質による連続ゲノム領域の切断を誘導する。
本出願は、表現型の変化に関連する機能的エレメントをスクリーニングする方法を提供する。表現型の変化は、DNA、RNA、タンパク質および/または細胞機能レベルを含む一つまたは複数のレベルで検出することができる。表現型の変化は、細胞の生存、成長、免疫応答、毒素や薬物などの化合物に対する耐性において検出することができる。
表現型の変化に関連するゲノム部位をスクリーニングする方法は、本明細書で企図される目的のゲノム領域を標的とするガイドRNA のライブラリーを細胞集団に導入することを含む。一般に、前記細胞はCas タンパク質を含むように改造される。しかしながら、具体の実施形態では、Cas タンパク質はまた、ガイドRNA と同時に導入することができる。本明細書で企図される方法において、細胞集団にライブラリーを導入して、コロニーの各細胞が一つのガイドRNAを含まないようにする。その後、細胞は通常、観察された表現型に基づいて選別され、それらが細胞において表現型の変化を引き起こすか否かに基づいて、表現型の変化に関連するゲノム部位が同定される。一般的に、この方法では、表現型に基づいて細胞を少なくとも2つのグループに分類し、各グループに存在するガイドRNAの相対的な表現(representation)を決定し、かつ表現型の変化に関連するゲノム部位を各グループに存在する指導RNAの表現によって決定される。
本出願では、化合物に対する耐性に関連するゲノム部位をスクリーニングする方法も提供し、これにより、細胞が化合物と接触し、化合物に対する表現型応答に基づいてスクリーニングされる。より具体的には、このような方法は、本明細書で企図されるCRISPR/CasシステムガイドRNAのライブラリを細胞集団(Casタンパク質を含むように改造された、または同時に導入された)に導入し、この化合物で細胞集団を処理すること;また、初期の時点と比較して後の時点での化合物による処置後したガイドRNA の表現を決定する。これらの方法では、化合物耐性に関連するゲノム部位は、濃縮されたガイドRNA によって決定される。
具体の実施形態では、この方法は、ゲノム部位を含む領域のシークエンシングまたは全ゲノムのシークエンシングをさらに含み得る。
本出願はまた、本発明の方法を使用して薬剤耐性に関連する機能的エレメントをスクリーニングする方法に関する。
本明細書に記載される他の実施形態は、本明細書に開示される方法によって同定された遺伝子の一つまたは複数の機能的領域のゲノム破壊のための治療方法およびツールに関する。本明細書に記載のこれらおよびさらなる実施形態は、ゲノム領域または目的タンパク質における機能領域の部分的の発見に基づく。
本明細書に例示された具体の方法では、カバー密度を最大化するために、2つのタイプの前間区領域シーケンスはモチーフ(PAM)に隣接しており、NGGおよびNAGは共にsgRNAの設計に含まれる。抗がん剤または毒素を用いたライブラリースクリーニングの後、ゲノムDNAを抽出してsgRNAバーコードの従来のPCR増幅に用い、続いてNGS分析を行う。同時に、RNA 逆転写からの標的遺伝子のPCR増幅を行い、長さ約250bpの断片化されたPCR産物がNGSを受ける。次に、野生型配列、またはアウトフレー挿入欠落の断片やインフレーム挿入の配列を含む配列をフィルターし、部位特異的突然変異またはインフレーム欠失を含む配列のみが、さらなる分析のために保持されるようにする。部位特異的突然変異については、本発明者らは、同義またはナンセンス変異をスクリーニングし続け、ミスセンス突然変異を含む突然変異のみを保持した。インフレーム欠失の場合、各リードによって引き起こされたアミノ酸欠失の数によって突然変異タイプを分類し、単アミノ酸欠失のみが含む場合が「運転者の欠失」、複数のアミノ酸欠失を含む場合が「乗客の欠失」として分類した。欠失パターンをデコードした後、欠失倍数変化を計算した。同様に、ミスセンス突然変異の倍数変化も計算した。次に、標的遺伝子にウィンドウのスライドを適用することによって、フィルターされたリードのすべての情報を用いて、ミスセンス突然変異、運転者の欠失、および乗客の欠失の倍数変化の加重平均値を計算した。次に、ランク付けによって加重平均値の有意水準を推定し、各アミノ酸の必須スコアを得た。このスコアは、インフレーム欠失および部位特異的突然変異の状況をカウントし、各アミノ酸の必須性を定量化し、機能的重要度に従ってアミノ酸をランク付けすることを可能にする。同時に、各アミノ酸のミスセンス突然変異のパーセンテージを計算することによってアミノ酸置換パターンの取得を試みた。この単純化されたワークフローおよびバイオインフォマティクスプロセスは、天然の生物学的環境におけるタンパク質の重要な機能的エレメントの同定を可能にすることが目的である。
本発明は、具体の実施形態および特定の図面を参照して説明されるが、本発明はそれらに限定されず、特許請求の範囲によってのみ限定される。請求項における任意の参照符号は、範囲を限定するものとして解釈されるべきではない。記載される図面は概略的なものに過ぎず、非限定的である。図面において、説明の目的のために、いくつかのエレメントのサイズは誇張され、縮尺通りに描かれていない場合がある。用語「含む」は、本明細書および特許請求の範囲で使用される場合、他の要素またはステップを排除しない。単数名詞に言及する場合、不定冠詞または定冠詞「一つ(a)」または「一種(an)」、「前記(the)」を使用し、特に明記しない限り、該名詞の複数形を含む。
特に明記がない限り、本発明の実施は、免疫学、生化学、化学、分子生物学、微生物学、細胞生物学、ゲノム学および組換えDNAの従来の技術を当技術の範囲内で採用する。参照Sambrook,Fritsch和Maniatis,MOLECULAR CLONING:A LABORATORY MANUAL,第2版(1989); CURRENT PROTOCOLS IN MOLECULAR BIOLOGY(F.M.Ausubel等編集,(1987)); METHODS IN ENZYMOLOGYシリーズ(Academic Press,Inc。):PGR 2:A PRACTICAL APPROACH(M.J.MacPherson,B.D.Hames和G.R.Taylor編集(1995)),Harlow和Lane編集。(1988)ANTIBODIES,A LABORATORY MANUAL,and ANIMAL CELL CULTURE(R.LFreshney,ed.(1987))。
以下の用語または定義の提供は、本発明の理解に役立つ。本明細書で明確に定義されない限り、本明細書で使用される全ての用語は、本発明の当業者と同じ意味を有する。業者は特に本分野の定義および用語のSambrook等,Molecular Cloning:に注目する;A Laboratory Manual, 第2版, Cold Spring Harbor Press, Plainsview, New York (1989); およびAusubel等, Current Protocols in Molecular Biology (Supplement 47) , John Wiley &Sons, New York (1999)。
遺伝学において、「ナンセンス突然変異」とはDNA配列の部位特異的突然変異であり、早すぎる終止コドン、または転写されたmRNAのナンセンスコドン、および切断された、不完全な、通常は非機能的タンパク質産物を招く。ナンセンス突然変異の機能的効果は、コードDNA 中の終止コドンの位置次第である。例えば、ナンセンス突然変異の役割は、ナンセンス突然変異がどの程度元の終止コドンに接近し、およびタンパク質の機能的サブドメインが影響を受ける程度に依存する。ナンセンス突然変異は、単一のヌクレオチドの変化が異なるアミノ酸置換を引き起こす部位特異的突然変異である「ミスセンス突然変異」とは異なる。
「同義置換または突然変異」とは、タンパク質をコードする遺伝子のエクソンにおける一つの塩基の別の塩基に進化的置換であり、その結果、生成されたアミノ酸配列は修飾されていない。これが可能なのは、遺伝暗号が「縮重」しているため可能であり、これは一部のアミノ酸は複数の3塩基対コドンによってコードされていることを意味する。特定のアミノ酸の一部のコドンは、同じアミノ酸をコードする他のコドンとは一つの塩基対しか異なるものがあるので、「通常」塩基突然変異の代わりに一つの代替物を用いると、遺伝子を翻訳する際、同じアミノ酸が成長中のポリペプチド鎖に混ぜてしまうことを招く。
タンパク質は、あってもなくてもよい領と必須領域の両方が含まれ、必須領域の突然変異がその機能を失う。対応するDNAコード配列では、リーディングフレームのシフトを引き起こす突然変異は、突然変異が重要なサイトで発生するか非重要なサイトで発生するかに関係なく、遺伝子表現を破壊によってその機能を破壊する高い可能性がある。抗がん剤または細菌毒素のタンパク質をターゲットした場合、インフレーム欠失または部位特異的突然変異(ナンセンス突然変異を除く)は、そのような突然変異が非重要なサイトで発生した場合、耐性表現型を生成しない。非必須遺伝子について、各対立遺伝子の破壊は「機能喪失表現型」を実現するために必要な条件である。これらの劣性突然変異タイプは以下のうちの1つである可能性がある:フレームシフト挿入欠失、インフレーム欠失、またはキーサイトに影響を及ぼすミスセンス部位特異的突然変異。必須遺伝子について、唯一の薬剤耐性シナリオは、タンパク質の表現と細胞活性に対する重要な役割を変更することなく、インフレーム欠失またはミスセンス突然変異が薬物標的のキーサイトに影響を与える。これらの突然変異は優性であるため、「機能獲得表現型」を達成するには、1つの対立遺伝子の適切な突然変異で十分である。
野生型二倍体細胞において、遺伝子を有する二つの野生型対立遺伝子は、いずれも正常な遺伝子産物を生じる。ヘテロ接合体(優性または劣性の重要な遺伝子型をテストする)において、単一の野生型対立遺伝子は、野生型表現型を生じるのに十分な正常遺伝子産物を提供することができる。そのような場合、“機能喪失型突然変異”は劣性である。ある場合によっては、細胞は単一の野生型対立遺伝子の活性レベルを「上げる」ことができ、ヘテロ接合子における野生型遺伝子産物の総量がホモ接合の野生型の半分を超える。しかしながら、突然変異事象は、該遺伝子にいくつかの新しい機能を付与する。ヘテロ接合体では、新しい機能が表現されるので、「機能獲得型突然変異」は優性対立遺伝子のように作用し、何らかの新たな表現型を生成する可能性が高い。
「飽和突然変異誘発」は、単一のコドンまたはコドンセットをランダム化して、その位置に全ての可能なアミノ酸を生成するランダムな突然変異誘発技術である。
「コドン」は三つのヌクレオチドのセットであり、あるアミノ酸をコードするトリプレットである。最初のコドンがリーディングフレームを確立し、新しいコドンが始まる。タンパク質のアミノ酸主鎖配列は連続するトリプレットで定義される。コドンは、タンパク質合成のための遺伝情報の翻訳する鍵である。mRNA の翻訳が開始されると、「リーディングフレーム」を設定し、トリプレットが次々と読み取られる間に「リーディングフレーム」を維持する。遺伝子コードの読み取りは、mRNAのコドンを監視する三つのルールに縛られる。まず、コドンは5’から3’の方向に読み取られる。第二に、コドンは重複せず、かつ情報にギャップはない。上記のように、最後のルールは、情報を「リーディングフレーム」に固定されて翻訳することである。
「フレームシフト突然変異」は、フレームエラーまたはリーディングフレームシフトとも呼ばれ、3で割り切れないDNA配列のヌクレオチド数のindel(挿入または欠失)によって引き起こされる遺伝突然変異である。コドンの遺伝子発現のトリプレット性質のために、挿入または欠失はリーディングフレームを変更する可能性があり、その結果、本来とはまったく異なる翻訳になってしまう。フレームシフト突然変異は通常、突然変異後にコドンが異なるアミノ酸をコードするように読み取られる。フレームシフト変異はまた、配列内で遭遇する最初の終止コドン(“UAA ”、“UGA ”または“UAG ”)を変化させる。生じるペプチドは異常に短いか異常長い可能性があり、かつ機能しない可能性が高い。
「アウトフレー挿入欠失(Out-of-frame indel)」は遺伝子コードに「リーディングフレーム」の外側の挿入および/または欠損(indel)を読み取らせることを指し、「インフレーム欠失」はDNA配列の中で3で割り切れる数のヌクレオチドの欠失であるため、この欠失はリーディングフレームを変更しない。
本明細書における「CRISPRシステム」は、一般的に、Cas 遺伝子をコードする配列、tracr(トランス活性化CRISPR)配列(例えば、tracrRNAまたは活性部分tracrRNA)、tracrメイト(tracr-mate )配列(内因性CRISPRシステムのコンテキストでの「ダイレクトリピート(direct repeat)」とtracrRNAプロセッシングの部分的なダイレクトリピートを含む)、ガイド配列(内因性CRISPRシステムのコンテキストでは「間隔配列(spacer)」とも呼ばれる”)、またはCRISPR遺伝子座からの他の配列およびトランスクリプトを含む、CRISPR関連(「Cas」)遺伝子の表現に関与したり、またはを活性化を指示するトランスクリプトやその他の要素を指す。一部の実施形態では、CRISPRシステムの1つ以上の要素は、タイプI、タイプII、またはタイプIII のCRISPRシステムから得られる。
発現ベクター内で、「動作可能に連結された」とは、ヌクレオチド配列の発現を可能にする方法(例えば、体外転写/翻訳システムにおいて、またはベクターが標的細胞に導入された際に、標的細胞の中におる)で目的の調節配列との接続を示すことが意図される。
CRISPR複合体の形成における文脈では、「標的配列」とは、ガイド配列が相互補完的に設計されていることを示す配列であり、標的配列とガイド配列とのハイブリッドがCRISPR複合体の形成を促進する。ハイブリッドを引き起こし、CRISPR複合体の形成を促進するのに十分な相補性がある限り、完全な相補性は必要ではない。
一般的に内因性CRISPRシステムの場合、CRISPR複合体(標的配列にハイブリッドするガイドし、一つまたは複数のCas タンパク質と複合体を形成するガイド配列を含む)による標的序列の中や近く(例えば離れが1個や2個、3個、4個、5個、6個、7個、8個、9個、10個、20個、50個またはそれ以上の塩基対以内)の1つまたは2つの鎖の切断をもたらす。理論に拘束されることを望まないが、tracr配列は、野生型tracr配列の全部または部分(例えば、野生型tracr配列の約20、26、32、45、48、54、63、67、85またはそれ以上のヌクレオチド)を含むか、またはこれらから構成されてもよく、CRISPR複合体の一部を形成してもよい、例えば、tracr配列の少なくとも一部に沿ってtracrメイト(tracr mate)配列の全部または一部とハイブリッドすることによって、前記tracrメイト配列がガイド配列に作動可能に連結された。
いくつかの実施形態では、tracr配列およびtracrメイト配列が十分な相補性を有し、ハイブリッドしてCRISPR複合体の形成に関与する。標的配列と同様に、機能を達成するのに十分である限り、完全な相補性は必要とされない。いくつかの実施形態において、最適に整列された場合、tracr配列は、tracrパートナー配列と少なくとも50%、60%、70%、80%、90%、95%、または99%の配列相補性を有する。
一部の実施形態では、CRISPRシステムの1つ以上のエレメントの表現を駆動する1つ以上のベクターを宿主細胞に導入して、CRISPRシステムのエレメントの表現が1つ以上の標的サイトでガイドし、CRISPR複合体の形成を導く。別の実施形態において、宿主細胞は、Cas 9および/またはOCT 1を安定して発現するように工学化される。
一般に、指示配列は、任意のポリヌクレオチド配列であり、それは、標的ポリヌクレオチド配列と十分な相補性を有し、標的配列とハイブリッドし、CRISPR複合体の標的配列への配列特異的結合を指示する。一部の実施形態では、適切なアラインメントアルゴリズムを使用して最適なアラインメントを行う場合、指示配列とその対応する標的配列との間の補完性は、約50%、60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%またはそれ以上である。最適なアラインメントは、配列をアラインメントするための任意の適切なアルゴリズムを使用して決定することができ、その非限定的な例は、Smith-Watermanアルゴリズム,Needleman-Wimschアルゴリズム,Burrows-Wheelerに基づいて変換のアルゴリズム(例えばBurrows Wheeler Aligner),ClustalW, Clustai X, BLAT, Novoalign (Novocraft Technologies, ELAND (I!fumma, San Diego, CA),SOAP(soap.genomics.org.cnで入手可能)およびMaq(maq.sourceforge.netで入手可能)。一部の実施形態では、ガイド配列の長さは、約5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75個またはそれ以上のヌクレオチドより多く。一部の実施形態では、ガイド配列の長さは、約75、50、45、40、35、30、25、20、15、12、11、10個またはそれ以下のヌクレオチド未満である。ガイド配列は、CR1SPR複合体と標的配列の配列に特異的結合させるガイド能力を任意の適切な測定により評価することができ、例えば、CRISPR複合体を形成するのに十分なCRISPRシステムの成分(試験すべきガイド配列を含む)を対応する標的配列を持つ宿主細胞に提供することができ、例えば、以下のように行われる:CRISPR配列の成分をコードしたベクター転写を用いて、次に、標的配列内で優先カットの評価を行い、例えば、本明細書で説明するSurveyor測定によって行われる。同様に、標的ポリヌクレオチド配列の切断は以下のように試験管内で評価することができる:標的配列、CRISPR複合体の構成要素が提供され、複合体は、テストすべきガイド配列およびテストガイド配列とは異なるコントロールガイド配列を含み、かつ結合または比較テストとコントロールのガイド配列反応との間の標的配列の切断速度を比較する。他の測定も可能であり、当業者であれば思いつくであろう。
一部の実施形態では、CRISPR酵素は1つ以上の異種タンパク質ドメインを含む融合タンパク質の一部である(例えば、CRISPR酵素に加えて、約1、2、3、4、5、6、7、8、9、10またはそれ以上のドメインより多く)。CRISPR酵素融合タンパク質は、任意の追加のタンパク質配列、および任意の2つのドメイン間の任意結合配列を含むことができる。CRISPR酵素に融合できるタンパク質ドメインの例には、エピトープタグ、レポーター遺伝子配列および以下の活性のうちの1つ以上を有するタンパク質ドメインがあるがこれに限定されない:メチル化酵素活性、脱メチル化酵素活性、転写活性化活性、転写阻害活性、転写放出因子活性、歴史的修飾活性、RNA切断活性および核酸結合活性。
一部の態様では、本発明は、1つまたは複数のマルチヌクレオチド(例えば、本明細書で説明する1つまたは複数のベクター、1つまたは複数のトランスクリプト、および/またはそこから転写された1つまたは複数のタンパク質)を宿主細胞に送達する方法を提供する。本発明は、DNAに基づくゲノムを標的修飾するための基本プラットフォームの役割を果たす。ウイルス、リポソーム、電気穿孔、顕微鏡注射、およびコンジュゲーションを含むがこれらに限定されない多くの送達システムと相対することができる。
一部の態様では、本発明はさらに、これらの方法によって生成された細胞、およびそれによって産生される生物(例えば、動物、植物、または真菌)をさらに提供する。
一部の実施形態では、CRISPR酵素は、ガイド配列と組み合わせて(かつ選択的にガイド配列と複合する)細胞に送達される。従来のウイルスベースおよび非ウイルスベースの遺伝子転移法は、哺乳動物細胞または標的組織に核酸を導入するために利用可能である。このような方法は、CRISPRシステムのコンポーネントをコードする核酸を培養物や宿主生物の細胞に施用するために使用することができる。非ウイルスベクター送達システムには、DNAプラスミド、RNA(例えば、本明細書に記載のベクターのトランスクリプト)、ヌード核酸、およびリポソームなどの送達ベクターと複合した核酸が含まれる。ウィルス送達システムには、細胞に送達されるエピソーム(episomal)または統合ゲノムを持つDNAおよびRNAウイルスが含まれる。
gRNAの設計が比較的容易であることと、Cas9が任意の遺伝子座を実際に修飾する能力により、CRISPR/Cas9は本発明においてスクリーニング実験に用いられる。スクリーニング実験では、CRISPRが集めたライブラリーまたはCRISPRライブラリーは、数千個のプラスミドで構成されており、各プラスミドには、標的タンパク質の全長にまたがる異なる標的配列に向けられたgRNAが含まれる。具体的には、標的タンパク質の飽和突然変異誘発を達成するために、sgRNAは2種類のプレスペーサー隣接モチーフ(PAM)、NGGおよびNAGを含むように設計されており、かつ各sgRNA はDSBサイトの周囲の10bp に影響を与えて、カバー密度を最大にするように設計された。CRISPRスクリーニング実験は順遺伝的スクリーニングである可能性があり、この中で望ましい表現型は既知するが、タンパク質のキーとなるアミノ酸は既知しない。一般的に、CRISPRに基づくスクリーニングは、レンチウイルスを用いて「プールされた」gRNAライブラリーを哺乳類のCas9表現細胞株に送することによって実行される。gRNAライブラリーで形質導入した後、目的表現型(例えば生存、薬物や毒素耐性、成長や増殖)について突然変異細胞をスクリーニングして、タンパク質の機能と望ましい表現型に重要なアミノ酸を同定する。
プールされたレンチウイルスgRNA ライブラリーは、レンチウイルス転移するベクターの異種混合物であり、各ベクターは、特定配列に対する単一のgRNA をコードし、各配列を標的とするいくつかのgRNA がライブラリーに存在する。
プールされたレンチウイルスCRISPRライブラリーを用いたスクリーニングの実施は、ライブラリー増幅、細胞形質導入、遺伝子スクリーニング、およびデータ分析を含む多段階プロセスである。簡単に言うと、gRNAを含むプラスミドの初期ストックを増幅してDNAの総量を増加させ、増幅されたライブラリーを使って個別のgRNAまたはgRNA + Cas9を含むレンチウイルスを生成する。単一ベクターライブラリーについては、単一のgRNA およびCas 9を含むレンチウイルスで野生型細胞を形質導入することによって、突然変異細胞を1つのステップで作製した。多くの場合、マルチキャリアライブラリーでは、gRNA文庫を用いてCasを発現させる細胞が伝達される。両方の場合において、形質導入された細胞は、gRNAとCas9を含む細胞を濃縮するために選択され、得られた突然変異細胞集団を目的の特定の表現型についてスクリーニングされた。最終集団からのゲノムDNAの次世代配列決定(NGS)は、スクリーニング中に濃縮または消費されたgRNAを同定する。最後にバイオインフォマティクスプロセスを設計して得られたデータを分析する。
ライブラリ増幅
通常に、プールされたレンチウイルスCRISPR gRNAライブラリーはDNA等分の試料として送達され、多くの場合、DNA の量は実験に使用するには不十分である。このような場合、最初のステップはライブラリーを「増幅」することであり、これは全グループにおける個々のgRNAプラスミドの相対的な割合を維持しながらプラスミドDNAの量を増やすことを意味する。ライブラリーDNA を細菌に変換し、細菌の中で一定期間増殖させた後に、プラスミドDNA を収穫することで増幅する。ほとんどのライブラリーでは、電気穿孔を使用すると転換効率が向上するため、化学転化の代わりに電気穿孔を使用される。多くの場合、転化された細菌は、適切な抗生物質を含むLB 寒天プレート上で増殖し、これは、プレート上での増殖がライブラリーの表現(representation)を維持し、増殖中に急速に増殖するプラスミドが濃縮される可能性を低下させるのに役立つためである。転化および増幅されたgRNA プラスミドの数の推定値は、希釈プレートアッセイを行うことによって得ることができる。このために、形質転換されたサンプルを希釈し、抗生物質を含むLBプレートにプレーティングし、プレート上で生じる細菌コロニーの数を、増幅されたライブラリーに存在するgRNAプラスミドの総数の間接的な測定値として使用しました。この測定は重要な制御手段であり、機能スクリーニングに使用する前に最終的な増幅ライブラリーの内容を既知する。
細胞の形質導入
ライブラリーが増幅され、代表性が確認されると、次のステップは、プールされたgRNAライブラリーを含有するレンチウイルスを作製することである。一般的に、CRISPRライブラリー及び適切なパッケージングおよびエンベロープベクター(例えば、Didier Trono社の実験室からのpsPAX2、Addgene、プラスミド#12260、pMD2.G、Didier Trono社の実験室からのAddgene、プラスミド#12259、AddgeneからのpVSVGとpR8.74)を用いてHEK293T細胞をトランスフェクトする。あるいは、レンチウイルスパッケージング細胞型はgRNAライブラリーのみでトランスフェクトされてもよい。トランスフェクションしてから48時間以降に培地を収集することを提案する解決手段が多いが、最大ウイルス力価は特定のライブラリーに応じて変化するので、いくらかの最適化を必要とする可能性がある。
形質導入ステップの目的は、Cas9および単一gRNAを安定的に共発現する突然変異細胞集団を生成することである。1つのステップにおいて野生型細胞から突然変異細胞を直接生成することができるため、gRNAおよびCas9を含む単一ベクターライブラリーはマルチベクターシステムよりも使用しやすい。その後、レンチウイルス形質導入後に選択して、Cas9およびgRNAについてポジティブである細胞集団を単離した。抗生物質を用いて選択する場合、Cas9およびgRNAを含有する細胞のみを選択するために、死滅曲線を実行して最適な抗生物質濃度を決定すべきである。
理論的には、任意の細胞型をスクリーニングに使用することができるが、細胞の最終的なコロニーは、スクリーニング前にライブラリーの代表性を維持するために、十分な数でなければならない。スクリーニングに必要な細胞の確実な数は、検討される特定のライブラリーに基づいて変動する。これを理解するための最も簡単な方法は、最終的な突然変異細胞集団から復帰作業して、スクリーニングの開始時に必要な細胞の確実な数を決定する。例えば、10000個のgRNAのライブラリーが100×の代表で使用されると仮定する。このライブラリーを用いたスクリーニングに必要な細胞の最小数は10000個のgRNAs×100個の細胞/gRNA=10個の細胞である(スクリーニングのための対照条件を除く)。複数のgRNAを単一の細胞に伝達すると、複数の遺伝子変化を引き起こし、どの突然変異が観察された表現型を実際にもたらすかが不明であるようになるため、最終的なコロニーにおける各細胞は1つのgRNAのみを含まなければならない。したがって、<1の感染多重度(MOI)(すなわち、1つの細胞当たりにウイルス粒子が1つ未満)でレンチウイルスgRNAライブラリーを細胞に形質導入することを提案する解決手段が多い。
遺伝子スクリーニング
遺伝子スクリーニングは、ポジティブ(スクリーニング中に濃縮されたgRNAを示す)またはネガティブ(スクリーニング中に枯渇したgRNAを示す)として広く定義され得る。CRISPRライブラリーは、突然変異時に化学療法薬に対する耐性を付与する遺伝子を探すために、ポジティブ選択薬物スクリーニングに使用することができる。ポジティブ選択薬物スクリーニングでは、突然変異細胞集団を処理して、遺伝子変更により耐薬性を促進する細胞を選択的に濃縮するために、全ての野生型細胞を死滅させる(死滅曲線)最適濃度を決定することが重要であり得る。さらに、ゲノムDNAにおける最終的なgRNA数を、並行して実行される対照条件(例えば、ベクター対照)と比較して、gRNA分布の薬物非依存的変化を制御し、例えば、薬物の非存在下での所与のgRNAによる細胞増殖に対する影響、またはベクター自体の影響を制御する。一方、ネガティブスクリーニングは、スクリーニング中にコロニーから排除されたgRNAを同定するために用いられ、それらが他のコロニーに対して選択的劣性であることを示す。ネガティブ選択によるスクリーニングの例として、所定の期間にわたって突然変異細胞を増殖させ、しばらくした時点と最初の時点のgRNA分布を比較する。
データ分析
任意の成功したスクリーニングの最終結果は、観察された表現型に必要な標的配列または要素を有するgRNAが濃縮(ポジティブセレクション)または消費される(ネガティブセレクション)変異細胞の集団を取得することである。したがって、データ解析ステップの目的は、実験群において枯渇または濃縮されたgRNA および配列またはエレメントを同定することである。細胞の最終的なコロニーは数千種類のgRNAを含んでいると考えられるため、ゲノム配列の分析には次世代シークエンシング(next-generation sequencing NGS)が必要である。個々のgRNAプラスミドは、ゲノムDNA中に存在する全ての他のgRNAとgRNAを区別するバーコードを含む。したがって、CRISPRスクリーニングデータからの分析の最初のステップは、PCRを使用してゲノムDNAに対するgRNAを増幅し、NGSを実行して最終的な突然変異細胞集団に存在するgRNAを特定することである。NGSの最終的な結果は、すべてのバーコードの元のカウントであり、そこからgRNA配列と標的遺伝子を推定することができる。
配列またはエレメントが“ヒット”であるかどうかを判断する1つの方法は、配列またはエレメントを標的にしたサンプル中の濃縮または枯渇したgRNAの量を定性比較することである。前の節で述べたように、ライブラリには通常、遺伝子ごとに複数の異なるgRNAが含まれており、かつ特定の遺伝子に対する複数のgRNAの一致した濃縮または消費は、特定の配列対が観察される表現型にとって重要であることを示す有力な証拠である。同じターゲットに向けられた2つの異なるgRNAが同じオフターゲット効果を持つことは不可能であるため、いくつかのgRNAをオフターゲット効果の内部コントロールとして使用することができる。しかしながら、ヒットを定義するために任意の閾値を設定すること(例えば、六つのgRNA のうちの二つがヒットを満たすこと)は、潜在的な偏差の原因であり得るか、または偽陽性もしくは陰性の結果をもたらし得る。これを回避するために、様々な統計分析を用いて、偏差のない方法でヒットを決定することもできる。各スクリーニングは異なるため、どの統計方法が特定のスクリーニングに最も適合するかを知ることは非常に重要である。
本発明のデータ分析プロセスにおいて、野生型配列またはアウトフレー挿入欠失もしくはインフレーム挿入を含む配列のデータをフィルターし、部位特異的突然変異またはインフレーム欠失を含む配列のみが、さらなる分析のために保持されるようにする。部位特異的突然変異については、同義またはナンセンス突然変異をフィルターし、ミスセンス突然変異を含む突然変異のみを保持する。インフレーム欠失の場合、毎回のリードに引き起こされたアミノ酸欠失の数に基づいて突然変異タイプを分類する必要があり、単アミノ酸欠失のみが含む場合が「運転者の欠失」という類に定義される;複数のアミノ酸欠失を含む場合が「乗客の欠失」という類に定義される。バイオインフォマティクス分析は具体的に以下を含む:
ミスセンス突然変異を含む断片について、各アミノ酸の突然変異比率を以下のように計算する:
Figure 2022537477000009
インフレーム欠失を含む断片について、各アミノ酸の欠失比率を以下のように計算する:
Figure 2022537477000010
各アミノ酸の必須性スコアを以下のように算出する:
突然変異倍数変化については、全ての倍数変化に基づいてヌル分布を確立し、各アミノ酸について計算しスコア突然変異=-log 10(P 値)、
欠失の倍数変化に対し、まず調整可能なパラメーターαを適用して、欠失した運転者と欠失した乗客に次のように重みを付ける:
欠失倍数変化=運転者の倍数変化+α*乗客の倍数変化、続いて、100回並べ替えてヌル分布を確立し、且つアミノ酸ごとに計算しスコア欠失=-log 10(P 値)、
スコア突然変異及びスコア欠失を以下のように正規化する:
Figure 2022537477000011
スコア突然変異及びスコア欠失の重みを計算する:
a =欠失の倍数変化>1のアミノ酸の数
b =突然変異の倍数変化>1のアミノ酸の数
Figure 2022537477000012
必須性スコアの計算は以下のとおりである:
必須スコア=wGHIJIKLM*スコアGHIJIKLM+wSTUTIKLM*スコアSTUTIKLM
最後に、アミノ酸は必須スコアに従ってそれらの機能的重要度に基づいてランク付けされる。
材料と方法
細胞と試薬
Cas9を安定して表現するHeLa細胞およびHEK293T細胞を、胎牛血清(FBS, CellMax)を10%含むドゥルベコ改良イーグル培地(DMEM、Corning)で、5%CO2の状態に37℃で培養した。
プラスミド構築
pLL3.7(Addgene)のU6プロモーターをヒトU6プロモーター、ccdBボックス、sgRNAステントに置き換えることにより、sgRNAベクター(plenti-sgrna-gfp)がクローされた。Cas 9表現ベクター(pLenti-OC-IRES-BSD)は以前に報告された。pHR-SFFVKRAB-dCas9-P2A-mCherry (Addgene)のKRAB-dCas9エレメントをヒトHBEGFコード配列と3xFLAGに置き換えることにより、pcDNA-HBEGFがクローされた。単一のアミノ酸欠失を有するHBEGFのcDNAを発現するベクターを、PCR定点誘変(PfuUltraII融合HS DNAポリメラーゼ、STRATAGENE)により構築された。HBEGF の異なる欠失突然変異体を生成するために使用されたプライマーを以下に列挙する。
HBEGF-29-F 5’-GACCGGAAAGTCCGTTTGCAAGAGGCAG-3’
(SEQ ID NO: 1)
HBEGF-29-R 5’-CTAGCCCTCTCCGCCGCTCCAGGCTC-3’
(SEQ ID NO: 2)
HBEGF-63-F 5’-GACCGGAAAGTCCGTTTGCAAGAGGCAG-3’
(SEQ ID NO: 1)
HBEGF-63-R 5’-CTGCCTCTTGCAAACGGACTTTCCGGTC-3’
(SEQ ID NO: 3)
HBEGF-70-F 5’-GCAAGAGGCAGATCTGCTTTTGAGAGTC-3’
(SEQ ID NO: 4)
HBEGF-70-R 5’-GACTCTCAAAAGCAGATCTGCCTCTTGC-3’
(SEQ ID NO: 5)
HBEGF-115-F 5’-CGGAAATACAAGGACTGCATCCATGGAG -3’
(SEQ ID NO: 6)
HBEGF-115-R 5’-CTCCATGGATGCAGTCCTTGTATTTCCG -3’
(SEQ ID NO: 7)
HBEGF-119-F 5’-GGACTTCTGCATCCATGAATGCAAATATGTG-3’ (SEQ ID NO: 8)
HBEGF-119-R 5’-CACATATTTGCATTCATGGATGCAGAAGTCC -3’ (SEQ ID NO: 9)
HBEGF-125-F 5’-GAATGCAAATATGTGGAGCTCCGGGCTCC-3’
(SEQ ID NO: 10)
HBEGF-125-R 5’-GGAGCCCGGAGCTCCACATATTTGCATTC-3’
(SEQ ID NO: 11)
HBEGF-127-F 5’-ATGTGAAGGAGCGGGCTCCCTCCTGC -3’
(SEQ ID NO: 12)
HBEGF-127-R 5’-GCAGGAGGGAGCCCGCTCCTTCACAT-3’
(SEQ ID NO: 13)
HEBGF-133-F 5’-GCTCCCTCCTGCTGCCACCCGGGTTAC -3’
(SEQ ID NO: 14)
HBEGF-133-R 5’-GTAACCCGGGTGGCAGCAGGAGGGAGC -3’
(SEQ ID NO: 15)
HEBGF-134-F 5’-CCCTCCTGCATCCACCCGGGTTACC -3’
(SEQ ID NO: 16)
HBEGF-134-R 5’-GGTAACCCGGGTGGATGCAGGAGGG -3’
(SEQ ID NO: 17)
HEBGF-138-F 5’-CTGCCACCCGGGTCATGGAGAGAGGTGTC-3’
(SEQ ID NO: 18)
HBEGF-138-R 5’-GACACCTCTCTCCATGACCCGGGTGGCAG-3’
(SEQ ID NO: 19)
HEBGF-141-F 5’-CCGGGTTACCATGGAAGGTGTCATGGGC-3’
(SEQ ID NO: 20)
HBEGF-141-R 5’-GCCCATGACACCTTCCATGGTAACCCGG-3’
(SEQ ID NO: 21)
HEBGF-152-F 5’-GCCTCCCAGTGGAACGCTTATATACCTATG-3’
(SEQ ID NO: 22)
HBEGF-152-R 5’-CATAGGTATATAAGCGTTCCACTGGGAGGC-3’ (SEQ ID NO: 23)
HEBGF-153-F 5’-CCTCCCAGTGGAAAATTTATATACCTATGACC-3’ (SEQ ID NO: 24)
HBEGF-153-R 5’-GGTCATAGGTATATAAATTTTCCACTGGGAGG-3(SEQ ID NO: 25)
sgRNA ライブラリー設計
標的遺伝子のhg19CDS配列をUCSCゲノムブラウザー(https://genome.ucsc.edu/)からダウンロードし、自作のスクリプトを使用して、NAGまたはNGG PAM配列を持つすべての潜在的なsgRNAをライブラリーを構築するために設計した。
CRISPR/Cas9 sgRNAライブラリーの構築
三つの薬物関連タンパク質および三つの毒素受容体をそれぞれ標的とする1、236、および3、712のsgRNA を含む二つのライブラリーを構築した。sgRNA をコードするアレイベースのオリゴヌクレオチドをPCR によって合成し、5’末端にBsmBI認識部位を含む対応するプライマーを用いて増幅した。sgRNA をコードするアレイベースのオリゴヌクレオチドをPCR 増幅するために使用されるプライマー(薬物関連タンパク質を標的とするsgRNA オリゴヌクレオチドを増幅するために使用されるプライマー)を以下に列挙する。
薬物ライブラリーF 5’-TTGTGGAAAGGACGAAACCG-3’ (SEQ ID NO: 26)
薬物ライブラリーR 5’-(SEQ ID NO :27)
毒素ライブラリーF 5’-TCTTCATATCGTATCGTGCG-3’ (SEQ ID NO: 28)
毒素ライブラリーR 5’-TAGTCGCTAGGCTATAACGT-3’ (SEQ ID NO: 29)
増幅されたDNA産物は、ゴールデンゲート(Golden Gate)法を使用してベクターに接続された。次いで、ライゲーション混合物をTrans1-T1コンピテントセル(Transgen)に形質転換して、プラスミドライブラリーを生成した。続いて、X-tremeGENE HP DNA転写試薬(Roche)を使用して、sgRNAプラスミドライブラリーを2つのウイルスパッケージングプラスミドpVSVGおよびpR8.74(Addgene)とともにHEK293T細胞に転写した。次いで、HeLa 細胞を低MOI (約0、3)のレンチウイルスで感染させ、EGFP +細胞を感染した後の48時間でFACS によって収集した。
ライブラリースクリーニング
BI 2536およびホウレンテゾミのスクリーニングについては、それぞれ3.5 × 106個の細胞を持つ150mmのシャーレ2個からなる実験を繰り返した。接種後24時間、適切な濃度の薬物で細胞を処理する。スクリーニングの最初のラウンドでは、ライブラリー細胞を4ng/mlのBI2536で1.5日培養し、または4ng/mlのホウレゾミで3日培養した後、新鮮なDMEMで培養した。耐性細胞を再度接種し、5-10日間培養し、その後の薬物スクリーニングに使用する。スクリーニングの第二ラウンドのでは、ライブラリー細胞を5ng/mlのBI2536と4日間、または8ng/mlのホウベンゾミと5日間インキュベートした。クリーニングの第二ラウンドのでは、ライブラリー細胞を6ng/ml のBI 2536と3日間インキュベートした。6-TGスクリーニングでは、合計1.8×10個のライブラリー細胞を150mmシャーレにプレートあたり3×10個の細胞でプレーティングした。三つの細胞プレートを一つの繰り返しとしてグループに分けた。細胞を、250ng/ml の6-TG で6日間処理し、生き残した細胞を増殖のために再播種し、次のラウンドのスクリーニングに用いた。第二ラウンドおよび第三ラウンドについて、ライブラリー細胞を、250ng/mlおよび300ng/ml の6-TG とそれぞれ4日間インキュベートした。TcdBスクリーニングのために、150mm の四つのペトリ皿にそれぞれ、3.5×10個の細胞を実験的反復として播種した。スクリーニングの各ラウンドで、細胞は適切な濃度で処理された:第一ラウンドは70 ng / ml、2第二ラウンドと第三ラウンドは100 ng / mlであった。HBEGF およびANTXR1スクリーニングの詳細は、本発明者らの以前の報告と同じである(1)
スクリーニングされた各耐性細胞を収集して、ゲノムDNAとトータルRNAを抽出にもちいて、逆転写を実行した。次に、PCR 増幅によって得られた標的遺伝子のsgRNA コード領域およびcDNA を次世代シークエンシング(NGS )分析にかけた。
候補sgRNA 配列の同定
DNeasy BloodとTissueキット(Qiagen)を用いて適切な数のライブラリー細胞からゲノムDNAを抽出した。異なる薬物/毒素処理に対して、ライブラリー細胞の適切な数は異なる: ANTXR 1は、6.25×10個、CSPG 4は、3×10個、HBEGF は、2.5×10個、HPRT 1は、1.75×10個、PLK 1は、6.3×10個、PSMB 5は、3×10個。sgRNA領域は、プライマーを用いてsgRNAの側面配列をアニーリングした26サイクルのPCRにより増幅される。各リピートのPCR産物をプールし、DNA Clean&Concentrator-5(Zymo Research Corporation)で精製し、異なるバーコード(NEB#7370、#7335、#7500)でインデックスを付け、NGSで分析した。
cDNA 調製及びシークエンシング
RNAprep純粋な細胞/細菌キット(TIANGEN)を使用してライブラリー細胞からトータルRNAを抽出し、Quantscript RTキット(TIANGEN)を使用してcDNAを合成した。二ステップの方法でNGSライブラリを構築する。第一ステップはPCR増幅cDNA(26個のサイクル;PrimeSTAR HS DNAポリメラーゼ、Takara)を含む。異なる遺伝子のためのプライマー(cDNA増幅プライマー)を表1に示した。
Figure 2022537477000013
CSPG 4のコード配列長は約6.9kbであり、3つの増幅反応を用いて,その全長を含むオーバーラップフラグメント(~50 bp)を得る。各cDNA 断片のPCR 産物をプールし、精製した(DNA Clean&Concentrator-5,Zymo Research Corporation)。次に、CovarisS2システムを使用して各遺伝子の1μgのcDNAを約250bpにカットした。DNA Clean & concentrator-5キット(Zymo Research Corporation)を用いてカットされた製品を精製して濃縮し、また、異なるバーコードを使用して、NGS分析用のインデックスを作成した。
機能ドメインのアルゴリズムの同定
Bowtie2 2.3.2を使用してシーケンスリードをターゲット遺伝子の参照配列にマッピングし、SAMtools1.3.1を使用して選別した。次に、リードをフィルターして、ミスセンス突然変異またはインフレーム欠失のみを含むリードを保持した。ミスセンス突然変異を含む断片について、各アミノ酸の突然変異率を次のように計算した:
Figure 2022537477000014
インフレーム欠失を含む断片について、各アミノ酸の欠失比率を以下のように計算した:
Figure 2022537477000015
そして、それらが生成したアミノ酸の欠失の数に基づいて突然変異のタイプを分類し、一つのアミノ酸しか欠落していない場合が「運転士の欠失(driver deletions)」、複数の場合が「乗客の欠失(passenger deletions)」として分類した。突然変異/欠失の比率を決定し、欠失パターンをデコードした後、実験群と対照群との間の倍数変化を計算した。
次に、各アミノ酸の必須性スコアを以下のように算出する:突然変異倍数変化については、全ての倍数変化に基づいてヌル分布を確立し、各アミノ酸について計算しスコア突然変異=-log 10(P 値)。欠失の倍数変化に対し、まず調整可能なパラメーターαを適用して、運転者の欠失と乗客の欠失に次のように重みを付ける:
欠失倍数変化=運転者倍数変化+α*乗客倍数変化。
続いて、並べ替えてヌル分布(null distribution)を確立し、(且つアミノ酸ごとに計算したスコア欠失=-log 10(P 値)。次に、スコア突然変異及びスコア欠失は以下のように正規化した:
Figure 2022537477000016
続いて、計算したスコア突然変異及びスコア欠失の重みが以下のとおりである:
a =欠失の倍数変化>1のアミノ酸の数
b =突然変異の倍数変化>1のアミノ酸の数
Figure 2022537477000017
最終的に、必須性スコアの計算は以下のとおりである:
必須スコア=wGHIJIKLM*スコアGHIJIKLM+wSTUTIKLM*スコアSTUTIKLM
スクリーニング結果の検証
PSMB5およびPLK1の重要な突然変異を検証するために、sgRNAは突然変異部位の近くに設計され、検証された残基の代わりに119 ntのssODNドナーごとに1つのアミノ酸をコードする。すべてのsgRNA(重要な変異を検証するために使用されるsgRNA配列)およびssODNドナー配列(ssODNドナーは検証された残基の代わりにアミノ酸をコードする)を以下の表2に示した。
Figure 2022537477000018
HeLa 細胞は、6穴あき板で1μgのsgRNAと2μgのssODNドナーを転写した。1.5×10個の細胞を、転写後14日間、薬選択の24時間前に6穴あき板に接種する。適切な用量の薬物で細胞を72時間処理する:ホウレンチゾミ(8ng/ml ); BI2536(10ng/ml)。TIANampゲノムDNAキット(TIANGEN)を使って薬剤耐性細胞のゲノムを抽出する。
TransTaq DNAポリメラーゼの高忠実度(Transgen)を使用して突然変異サイトを増幅し、通用なDNA精製キット(TIANGEN)を用いて精製した。プライマー(PSMB 5遺伝子突然変異部位を増幅するためのプライマー)を表3に列挙した。
Figure 2022537477000019
PCR断片をpEASY-T5 Zeroクローンキット(Transgen)にクローンしてシークエンシングに用いる。
細胞毒性の測定
薬物または毒素処理の24時間前に、96穴あき板(ジフテリア毒素(DT)用の5,000個の細胞とホウレンチゾミ用の3000個の細胞)に播種し、 異なる濃度のホウレンチゾミまたはDTを添加した。細胞を37°Cで48時間(DT )または72時間(ホウレンチゾミ)インキュベートし、そして、1mg/ml のMTT (3-[4.5-ジメチルチアゾール-2-イル]-2.5-ジフェニルテトラゾール臭化物)を添加した。BioTek Cytation5(BioTek Instruments)を使用して、570nmでのスペクトロメータの読み取り値を収集しました。
結果
タンパク質マッピング機能エレメントにおけるアプローチを試験するために、本発明者らは、細菌毒素受容体をコードする三つの遺伝子(ANTXR 1、CSPG 4およびHBEGF )およびがん薬物標的をコードする三つの遺伝子(HPRT 1、PLK 1およびPSMB 5)(表4)を選択した。
Figure 2022537477000020
本発明者らは、HeLa細胞を選択してスクリーニングのためのCRISPRライブラリーを構築し、それは、HPRT1(12)を標的とする6-TG(チオグアニン)、PLK1(13)を標的とするBI2536、およびPSMB5(14)を標的とするボルテゾミブなど、この細胞株における毒素(8、11)および薬物の適切な死滅条件を決定したためである(図2A)。
標的遺伝子については、sgRNAをコンピュータ(in silico)上で設計し、チップ上でプール(pool)として合成して、3つの受容体コード化遺伝子の全長をカバーする飽和CRISPRライブラリー、および3つの薬物標的をカバーする別のライブラリーを構築した(図2B)。
処理された対照スクリーニングを除いて、本発明者らは6つの処理中のそれぞれに対して2回の繰り返し機能スクリーニングを行った。各sgRNAがDSB部位の周囲の10-bp(15)に影響を及ぼすと仮定すると(図2C)、6つの遺伝子のsgRNAカバレッジは約0.99であった。毒素(PA/LFnDTA毒素、ジフテリア毒素、またはクロストリジウム・ディフィシル毒素B)または薬物(6-TG、BI2536、またはボルテゾミブ)による処理を三回した後、抵抗性細胞を得て、NGS分析による通常のsgRNA解読(8、16)のためにゲノムDNAを抽出した。
同時に、これらの得た耐性細胞を全RNA単離および逆転写に供してcDNAを得、その後、これをPCR増幅のためのテンプレートとして使用した。特異的プライマー増幅を用いて標的遺伝子の全長cDNAを得た。CSPG4などの大型遺伝子については、その全長をカバーするように三対のプライマーを使用して3つの重複するフラグメントを増幅した。選択的スプライシングを有する遺伝子については、全ての代替転写物が含まれることを確実にするために、特異的プライマー対を設計した(図2Dおよび表1)。NGSのサイズ要件のため、PCRフラグメントを、平均的に250-bpの小さなサイズにさらに分割した(図2E)。全ての実験手順の後、本発明者らは、シークエンシングデータを分析して標的遺伝子の機能に不可欠なアミノ酸を決定するための計算手順を確立した。
全て6つの標的の対照ライブラリーの突然変異パーセントは低レベルであり、これらの値はスクリーニング後に有意に増加し、特に、CRISPRライブラリーが生成したインデルであった。全ての対照群における比較的高い点突然変異率は、PCR増幅およびNGSにおいて生じたエラーに起因する可能性がある。しかしながら、点突然変異のリードは、全ての6回のスクリーニング後に増加し、何らかの点突然変異が耐性表現型に確実に寄与することを示した(図3A)。次いで、本発明者らは、2回の繰り返し間のsgRNA倍数変化と欠失突然変異および点突然変異との関連性によりスクリーニングの品質を評価すると、sgRNA倍数変化の相関係数範囲が0.36~0.85(図3B)、欠失が0.45~0.99(図4A)、点突然変異が0.61~0.99(図4)であることを見出し、本発明の方法の高い一致性が示された。全て3つの毒素受容体が細胞生存に必須ではないため、スクリーニング後のsgRNAは、そのコード配列にわたって均一に分布し(図3A、図5Aおよび図6A)、これは、これらの大部分がフレームシフトインデルを生成することができ、標的遺伝子発現の破壊を引き起こすことを示している。興味深いことに、3つの毒素受容体のC-末端部分に対応するコード領域を標的とする大部分のsgRNAは、一貫して濃縮することができず(図3A、図5Aおよび図6A)、これは、その大部分の細胞内C-末端領域が機能的に必須ではないことを示している。しかしながら、sgRNAコード領域のNGSは、多くの配列-機能情報を明らかにすることができなかった。
CRESMASポリシーおよび簡略化アルゴリズムを用いて、機能的に関連するアミノ酸マップを得ることができる。本発明者らは、このアミノ酸欠失型の意味が曖昧ではないため、ドライバ欠失には意図的に実線を割り当て、一方、乗客欠失には灰色線(10%の割合)を割り当てた。本発明者らはまた、問い合わせを容易にするために、単一のミスセンス突然変異データと欠失データを1つのグラフに組み合わせた。単一アミノ酸欠失と同様に、ミスセンス点突然変異によるタンパク質機能の喪失は、影響を受けたアミノ酸がタンパク質の機能に非常に重要であることを示す。
ジフテリア毒素(DT)の受容体をコードするHBEGFの機能的スクリーニングについては、ほとんどの耐性細胞は、報告されたDT結合部位(17)であるEGF様ドメイン(図7B)において欠失を有する。必要性スコアを計算し、以下の表6に示す。
Figure 2022537477000021
Figure 2022537477000022
Figure 2022537477000023
Figure 2022537477000024
Figure 2022537477000025
Figure 2022537477000026
必須性スコアを計算することにより(表6)、本発明者らは、スコアが最も高いアミノ酸がEGF様ドメインに確実に濃縮されることを見出し、毒素結合の調節におけるこのドメインの必要性がさらに確認された。全てのアミノ酸の中で、DT-HBEGF相互作用に必要な3つの既知のアミノ酸であるF115、L127、およびE141(17)は、上位(第21位、第15位、および第28位)である。重要なことに、CRESMAS方法は、これらの3つ以外の多くの新しい部位が受容体機能にとって重要であることを明らかにした(図7C)。本発明者らの結果を検証するために、本発明者らは、HeLaHEGF-/-細胞(8)においてレンチウイルス感染によって野生型または突然変異体HBEGF cDNAを発現させた。本発明者らは、5つの上位の部位(G119、K125、I133、C134、Y138)、3つの既知のポジティブ部位、および五つの下位(L29、D63、D70、N152、R153)の部位を検証した。HeLa HBEGF-/-は、DTに対する全体的な耐性を示し、野生型HBEGF発現は、毒素に対する細胞の感受性を回復させることができる。これらの5つの上位の部位(G119、K125、I133、C134、Y138)のうちの1つの単一アミノ酸欠失、または既知のポジティブ部位(F115、L127、E141)のうちの1つの単一アミノ酸欠失を含有する突然変異体HBEGFのすべての発現は、DTに対する細胞の感受性をレスキューすることができなかったが、5つの下位の部位(L29、D63、D70、N152、R153)のうちのいずれかの欠失を有する突然変異体HBEGFは、野生型と同様にレスキューした(図7D)。これらの結果は、EGF様ドメイン中の何らかのアミノ酸がDT-により誘発された細胞毒性に必要であるという本発明者らのスクリーニング結果を裏付ける。注目すべきことに、HBEGFについてDT結合ドメイン中のいくつかのアミノ酸がスクリーニングされたという事実は、CRESMASが低い偽陽性率を有することを示す。
炭疽毒素の受容体ANTXR1について、すべての耐性細胞は、細胞質ドメインをコードする領域を除いて、コード領域全体にわたって様々な欠失を有し(図5Bおよび5C)、これは、炭疽毒素とANTXR1との間の相互作用が受容体の細胞外領域によって支配されることを示している。既知のPA結合部位(18)及び膜貫通ドメインに加えて、様々な程度の重要度を示す多くの新規アミノ酸が同定された(図5B)。sgRNAシークエンシングの結果(図5A)と一致して、細胞質領域内のアミノ酸の大部分は不必要であり(図5B)、これもまた、低偽陽性率を示している。炭疽毒性の媒介においてANTXR1機能に重要な高順位アミノ酸であって、2つの既知の部位H57およびE155(18)(図5C)を含むものは、必須性スコアの計算によって決定された。
CSPG4、クロストリジウム・ディフィシル毒素B(TcdB)の受容体について、突然変異体のピークは、主に最初と最後の両方のCSPGリピートに位置した(図6B及び6C)。最初のCSPGリピートは、既知のTcdB結合部位(11)であり、最後の2つのリピートは新たな発見である。重要なことに、上記のHBEGFおよびANTXR1の両方とは異なり、ほとんどの情報データは欠失突然変異に由来し、CSPG4にはT778に影響を及ぼすミスセンス点突然変異が存在し、これは高度に濃縮されており(図6B)、このアミノ酸がTcdB毒性を媒介する受容体にとって重要であることを示している。
がん薬物標的をコードする3つの遺伝子について、HPRT1は非必須遺伝子であり、PLK1およびPSMB5は2つの必須遺伝子(19)である。非必須標的HPRT1について、ライブラリーの6-TGスクリーニングは、sgRNAの大部分が濃縮され、均一に分布しており(図8A)、細菌毒素スクリーニングからのものと同様の結果を示した(図3A、5A、6A)。タンパク質全体における各アミノ酸の重要な役割が完全に埋められる。CRESMAS方法は、6-TGに対する細胞の感受性の媒介において、HPRT1の機能にとって重要な多くの部位が存在することを示した(図8B)。この観察結果は、四量体HPRT1の既知の構造と一致し、必須性スコアの高い部位の分布も一致した(図8C)(12)
必須の標的であるPLK1およびPSMB5について、sgRNAシークエンシングは、sgRNAのインフレーム突然変異が発生した何らかの重要なアミノ酸のおおよその位置を確実に提供した(図9Aおよび図10A)。sgRNA濃縮は間接的な証拠を提供し、解像度が低いため、本発明者らは、CRESMASポリシーが、より正確でより包括的なグラフをより詳細に明らかにすると考える。実際には、PSMB5およびPLK1において、タンパク質機能に重要なより多くのアミノ酸が高精度で同定された(図9Bおよび図10B)。注目すべきことに、最終的なスクリーニング結果は、ミスセンス突然変異および可変数の欠失を含み、両方の場合での最も高い必須アミノ酸が、必須性スコアに基づいて得られた(図9Cおよび図10C)。ここでも、本発明者らは、PSMB5におけるBortezomibと相互作用した既知の重要部位(R78、T80、M104、A108、C122、およびG242)(20-22)および新規の必須残基(図9B-C)を同定した。同様に、本発明者らは、BI2536-PLK1相互作用にとって重要な既知の残基R136(22、23)および新規の必須残基F183(図10B-C)を同定した。
ミスセンス点突然変異は、PSMB5およびPLK1に薬物耐性を付与する主な形態であるため、本発明者らは、欠失ではなく特定の点突然変異を生成して検証に用いるためにssODN媒介の方法(24)を用いると決定した。本発明者らは、PSMB5中の9個のアミノ酸残基(R78、T80、V90、M104、A108、D110、C111、C122、およびG242)を選択し、対照としてD110、C111を含めた。点突然変異のための適切なアミノ酸を選択するために、スクリーニング結果または以前に報告された突然変異型からの選択が好ましい。残りについては、全ての置換をアラニンにした(表2)。以下のいずれかの突然変異を含むドナーでトランスフェクトされた細胞は、可変数のボルテゾミブ耐性コロニーであるR78N、T80A、V90A、M104A、A108T、C122F、およびG242Dを生成した(図9D)。対照的に、D110AおよびC111Aはボルテゾミブ耐性コロニーを生成することができず、これは、本発明者らの検証方法が信頼できることを示している(図9D)。興味深いことに、本発明者らのスクリーニングおよび検証結果とはことなり、SW1573およびCEM(21、25)においてC111部位がPSMB5にとって重要であることが以前に報告された(図9D)。この違いは、アミノ酸の作用が生物学的環境から影響を受けること、または耐性表現型生成の代わりに正しいアミノ酸を生成することができないことを示す。ボルテゾミブ耐性のプールされた細胞を検証するために、本発明者らは、遺伝子座を標的とするゲノム領域をシークエンシングし、これらの全て7つの部位が予想される突然変異を含むことを確認した(図11および表3)。本発明者らの結果をさらに検証するために、本発明者らは、いくつかの突然変異プールから個々のクローンを単離し(図12)、細胞生存アッセイを行った。点突然変異のR78N、V90L、A108T、C122F、およびG242Dがボルテゾミブに耐性を付与することを証明した(図9E)。これらのうち、T80およびA108はPSMB5とボルテゾミブ(20-22)の直接結合に係り、R78、M104およびC122の突然変異は、薬物結合部位構造を破壊することによってボルテゾミブに耐性(22、26、27)を付与することが報告された。G242は、ボルテゾミブ感受性に関連する別の既知の部位であるが、メカニズムはまだ不明である(27)。V90部位は新たな発見である。本発明者らは、2つの独立したV90Lクローンを選択し、両者は全て薬物耐性を付与した。V90が薬物感受性をどのように媒介するか、V90突然変異がボルテゾミブ結合ポケット(binding pocket)の周囲の構造を変化させるかどうかは、まだ決定されていない。
PLK1について、本発明者らは、2つの上位にある残基(R136、F183)および1つの潜在的な偽陰性部位(C67)を検証した。報告によれば、R136はBI2536の重要なアミノ酸であり、PLK1とBI2536との結合時、F183が構造的に重要である(22、23)。これらの3つの部位の1つにおける点突然変異は、プールされたアッセイにおいてBI2536に抵抗性を付与した(図10D)。
ミスセンス突然変異については、各アミノ酸は19種の非同義置換を有する。本発明者らは、異なる置換が異なる効果を有し得るが、いくつかの変化が表現型の差異を生じ得ないと仮定する。CRESMASポリシーがこのような詳細を生成できるかどうかを調べるために、本発明者らは、各PSMB5およびPLK1スクリーニングから最初の10個のヒットのミスセンス突然変異データを検索し、アミノ酸パターン分析を行った。本発明者らは、これらのアミノ酸の明確なパターン選好を明らかにし、何らかの置換のみが細胞に薬物耐性を付与し得ることを示した(図13A-B)。ほとんどの部位における複数の置換は、薬物阻害の致死作用を回避することができ、例えばV90PSMB5およびA386PK1(図13C-D)が挙げられ、いくつかの部位における単一の特定の置換のみは薬物耐性を付与することができ、例えば、PSMB5についてはM104IおよびC122Yが挙げられ(図13E)、PLK1についてはF183Lが挙げられる(図13F)。R136GPLK1は、唯一の突然変異型ではないが、BI2536細胞に耐性を付与する主要な形態である(図13F)。同様に興味深いことに、PSMB5、A105、およびA43のうち2つの部位が非常に類似した突然変異選好パターンを有し(図13G)、そのPearson相関係数が0.54である(図13H)ことが留意される。
要するに、CRESMASは配列-機能マッピングを生成する強力な方法である。突然変異誘発切断を使用して潜在的な機能ドメインを同定することは、通常、非常に面倒であり、タンパク質のサイズが大きすぎると、ますます困難になる。ターゲットタンパク質の全長にわたる各アミノ酸の意味を評価することは、不可能ではないにしても技術的に困難である。最近、Gills及び共同研究者らは、細菌又は酵母においてターゲットタンパク質の機能関連突然変異をマッピングする方法を記載したが、この方法は、相同組換え率に大きく依存し、高等真核生物におけるその効率的な適用を妨げる(28)。大型タンパク質を処理する場合、CRESMASは非常に強力である。さらに、複数の遺伝子を同時にスキャンして、その対応するタンパク質の機能エレメントを得ることができる。
CRISPR飽和突然変異誘発は、各アミノ酸を網羅する多重突然変異を提供する。多くの他の方法とは異なり、インフレームまたは点突然変異の方面においてごくわずかな割合のNGSデータのみがCRESMASに有用なリードである。本発明者らは、データ前処理中に大量のリードをフィルタリングしたが、本発明者らのバイオインフォマティクスプロセスが十分に高感度であり、中程度のシークエンシング深度で残りのリードから機能エレメントをマッピングできることを見出した。本発明者らが全て6つのアッセイにおいてタンパク質機能に重要なアミノ酸の大部分を同定できるという事実は、CRESMASが低い偽陰性率を有することを示す。
CRESMAS方法は突然変異によりタンパク質機能を消失させるすべての残基を潜在的に発見する可能性がある。しかしながら、これは、CRESMASスクリーニングから得られた各ヒットがタンパク質機能に直接関連することを意味しない。いくつかの残基は、所与のタンパク質の全体構造にとって重要であるが、タンパク質の酵素活性またはその相互作用パートナーとの接触を直接媒介しない場合がある。例えば、本発明者らは、毒素のエンドサイトーシスに直接関与することなく受容体機能を維持する重要な領域であるANTXR1の膜貫通ドメイン内に位置する複数のヒット(図5B)を同定した。
CRESMASポリシーは、単なるタンパク質の研究に限定されない。それはまた、非コードRNA、プロモーターおよびエンハンサーなどの調節エレメントの機能ダイヤグラムを得るのに非常に適している。解決手段の補正は、上記のcDNA上ではなくゲノム上の標的化領域上でのPCR増幅である。
本発明は、標的ゲノム領域または標的タンパク質の機能的エレメントを同定するための方法に関する。具体的には、本発明は、それらの自然生物学的背景におけるその機能に重要なエレメントを同定するためのハイスループット戦略に関する。
RNA誘導CRISPR関連タンパク質9ヌクレアーゼ(RNA-guided CRISPR-associated protein 9 nucleases)は、二本鎖切断(DSB)を生成することにより、標的ゲノムの遺伝子座にindel(挿入または欠失)と部位特異的突然変異を導入し、それにより内部修復メカニズム、特に非相同末端結合(NHEJ)を活性化する(1,2)。突然変異は、特にリーディングフレームの移動(フレームシフト)をもたらす誘発は、遺伝子発現を完全に排除することができ、これによりCRISPR-Cas9システムをゲノム工学(3,4)、さらにはハイスループット機能スクリーニング(5-8)のための強力なツールとなる。高分解能で調節的エレメントまたはタンパク質コード配列の役割をよりよく解明するために、関連する生物学的アッセイにおいて、CRISPRによる飽和突然変異誘発は使用されている(9,10)。これらの試みはsgRNA コード領域からの間接的シークエンシングデータのみを収集したため、塩基識別の分解能には限界があった。さらに、特に目的タンパク質が細胞の活性に不必要である場合、この戦略を使用して完全な機能ドメインまたは重要なアミノ酸情報を取得することは不可能である。伝統的な方法は、主に共免疫沈(Co-IP)とトランケーション突然変異誘発(11)の組み合わせなどの体外生化学的測定が主であったが、これらの技術は、時間がかかり、労力がかかり、分解能が低く、いずれも天然の生物学的環境で不可能であることは言うまでもない。したがって、当技術分野では、目的タンパク質またはゲノム配列の機能的エレメントを同定するために、より正確で包括的な戦略および方法が強く求められている。
M. Jinek et al., A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science337, 816-821 (2012). M. E. Burkard, A. Santamaria, P. V. Jallepalli, Enabling and disabling polo-like kinase 1 inhibition through chemical genetics. ACS chemical biology7, 978-981 (2012). L. Cong et al., Multiplex Genome Engineering Using CRISPR/Cas Systems. Science339, 819-823 (2013). P. Mali et al., RNA-guided human genome engineering via Cas9. Science339, 823-826 (2013). O. Shalem et al., Genome-scale CRISPR-Cas9 knockout screening in human cells. Science343, 84-87 (2014). T. Wang, J. J. Wei, D. M. Sabatini, E. S. Lander, Genetic screens in human cells using the CRISPR-Cas9 system. Science343, 80-84 (2014). H. Koike-Yusa, Y. Li, E. P. Tan, C. Velasco-Herrera Mdel, K. Yusa, Genome-wide recessive genetic screening in mammalian cells with a lentiviral CRISPR-guide RNA library. Nat Biotechnol32, 267-273 (2014). Y. Zhou et al., High-throughput screening of a CRISPR/Cas9 library for functional genomics in human cells. Nature509, 487-491 (2014). G. M. Findlay, E. A. Boyle, R. J. Hause, J. C. Klein, J. Shendure, Saturation editing of genomic regions by multiplex homology-directed repair. Nature513, 120-123 (2014). M. C. Canver et al., BCL11A enhancer dissection by Cas9-mediated in situ saturating mutagenesis. Nature527, 192-197 (2015). P. Yuan et al., Chondroitin sulfate proteoglycan 4 functions as the cellular receptor for Clostridium difficile toxin B. Cell Res25, 157-168 (2015). J. Duan, L. Nilsson, B. Lambert, Structural and functional analysis of mutations at the human hypoxanthine phosphoribosyl transferase (HPRT1) locus. Human mutation23, 599-611 (2004). M. Steegmaier et al., BI 2536, a potent and selective inhibitor of polo-like kinase 1, inhibits tumor growth in vivo. Curr Biol17, 316-322 (2007). D. Chen, M. Frezza, S. Schmitt, J. Kanwar, Q. P. Dou, Bortezomib as the first proteasome inhibitor anticancer drug: current status and future perspectives. Curr Cancer Drug Targets11, 239-253 (2011). M. van Overbeek et al., DNA Repair Profiling Reveals Nonrandom Outcomes at Cas9-Mediated Breaks. Mol Cell63, 633-646 (2016). S. Zhu et al., Genome-scale deletion screening of human long non-coding RNAs using a paired-guide RNA CRISPR-Cas9 library. Nat Biotechnol34, 1279-1286 (2016). T. Mitamura et al., Structure-function analysis of the diphtheria toxin receptor toxin binding site by site-directed mutagenesis. J Biol Chem272, 27084-27090 (1997). S. Fu et al., The structure of tumor endothelial marker 8 (TEM8) extracellular domain and implications for its receptor function for recognizing anthrax toxin. PLoS One5, e11203 (2010). T. Hart et al., High-Resolution CRISPR Screens Reveal Fitness Genes and Genotype-Specific Cancer Liabilities. Cell163, 1515-1526 (2015). S. Lu, J. Wang, The resistance mechanisms of proteasome inhibitor bortezomib. Biomark Res1, 13 (2013). N. E. Franke et al., Impaired bortezomib binding to mutant beta5 subunit of the proteasome is the underlying basis for bortezomib resistance in leukemia cells. Leukemia26, 757-768 (2012). S. A. Wacker, B. R. Houghtaling, O. Elemento, T. M. Kapoor, Using transcriptome sequencing to identify mechanisms of drug action and resistance. Nat Chem Biol8, 235-237 (2012). R. N. Murugan et al., Plk1-targeted small molecule inhibitors: molecular basis for their potency and specificity. Mol Cells32, 209-220 (2011). C. D. Richardson, G. J. Ray, M. A. DeWitt, G. L. Curie, J. E. Corn, Enhancing homology-directed genome editing by catalytically active and inactive CRISPR-Cas9 using asymmetric donor DNA. Nat Biotechnol, (2016). L. H. de Wilt et al., Proteasome-based mechanisms of intrinsic and acquired bortezomib resistance in non-small cell lung cancer. Biochem Pharmacol83, 207-217 (2012). E. Suzuki et al., Molecular mechanisms of bortezomib resistant adenocarcinoma cells. PLoS One6, e27996 (2011). G. T. Hess et al., Directed evolution using dCas9-targeted somatic hypermutation in mammalian cells. Nat Methods, (2016). A. D. Garst et al., Genome-wide mapping of mutations at single-nucleotide resolution for protein, metabolic and genome engineering. Nat Biotechnol35, 48-55 (2017).
本発明は、CRISPR強化された飽和突然変異誘発および分類DNA断片シークエンシングとの組み合わせ方法と呼ばれ、目的ゲノム領域または目的タンパク質の機能的エレメントを同定するためのハイスループット戦略および方法を提供することによって、前述のニーズの少なくともいくつかを満たCRISPR-mpowered aturation utagenesis combined with ssorted-DNA-fragment equencing,CRESMAS)。具体的には、本発明は飽和突然変異誘発を適用し、表現型変化を引き起こすインフレーム突然変異(インフレーム欠失およびミスセンス部位特異的突然変異)のみを検索し、標的遺伝子の重要度にかかわらず、ゲノム領域またはタンパク質の機能に関連するキーサイトを同定する。
この方法を使用して、本発明者らは、六種のタンパク質、三種の細菌毒素受容体および三種のがん薬物ターゲットをマッピングし、単一アミノ酸分解能でそれらの、既知のドメインまたはサイト(部位)および薬物または毒素感受性に重要な役割を果たす新しいアミノ酸を含む統合機能図を取得した。さらに、この新規な方法は、重要な残基の包括かつ正確な単アミノ酸置換パターンを明らかにし、タンパク質の機能を除去したり、薬剤耐性を与えることができる。拡張可能なCRESMAS戦略は極めて高い精度と高効率を有し、高分解能で複数のタンパク質の配列-機能マッピングを行うことができ、且つタンパク質機能と薬剤耐性のメカニズムの研究を加速する可能性がある。
一態様では、本発明は、目的タンパク質の機能的エレメントを同定する方法に関し、当該方法は、各アミノ酸をカバーする複数の突然変異を提供するためにCRISPRシステムを用いる飽和誘変を行うこと、機能喪失表現型を引き起こすインフレーム突然変異の検索すること、シークエンシング分析するためにPCRによりsgRNAコード領域および標的遺伝子のcDNAを増幅すること、および目的タンパク質に必要なアミノ酸を同定するためにシーケンシングデータを分析のための計算プロセスを確立することを含む。一実施形態では、目的タンパク質の機能的エレメントの同定は、単アミノ酸分解能で行われる。一実施形態では、目的タンパク質の機能的エレメントは、その天然の生物学的背景において同定される。一実施形態では、インフレーム突然変異は、インフレーム欠失およびミスセンス部位特異的突然変異である。
一実施形態では、CRISPRシステムを用いることによる飽和変異誘発は、目的タン
パク質の全長にわたる各アミノ酸のsgRNA を設計することを含む。一実施形態では
、各sgRNAはDSBサイトの周囲約10bp、例えば、7~13bp、例えば、8b
p、9bp、10bp、11bp、および12bpに影響を及ぼすように設計される。一
実施形態では、インフレーム欠失は、“運転者の欠失”(単一のアミノ酸欠失のみを含む
)または“乗客の欠失”(複数のアミノ酸欠失を含む)などの運転者の欠失を含む。
一実施形態では、計算プロセスは以下を含む:
公衆の使用可能なバイオインフォマティクスツールを使用して、標的遺伝子の参照配列にシークエンシングリードをマッピングし、前記バイオインフォマティクスツールは、例えば、Bowtie2 2.3.2およびSAMtools 1.3.1である
リードをフィルターし、ミスセンス突然変異またはインフレーム欠失などを保持する。
ミスセンス突然変異を含む断片について、各アミノ酸の突然変異比率を以下のように計算する:
Figure 2022537477000090
インフレーム欠失を含む断片について、各アミノ酸の欠失比率を以下のように計算する:
Figure 2022537477000091
インフレーム欠失をコードし、またアミノ酸欠失の数により、単一のアミノ酸欠失のみであれば「運転者の欠失」、複数のアミノ酸欠失であれば「乗客の欠失」としてインフレーム欠失を分類する。
実験群と対照群との間の倍数変化を計算する。
各アミノ酸の必須性スコアを以下のように算出する:
突然変異倍数変化については、全ての倍数変化に基づいてヌル分布を確立し、各アミノ酸についてスコア突然変異=-log10(P値)を計算する。
欠失の倍数変化に対し、まず調整可能なパラメーターαを適用して、運転者の欠失と乗客の欠失に次のように重み付けを付ける:
欠失倍数変化=運転者の倍数変化+α乗客の倍数変化、続いて、100回並べ替えてヌル分布を確立し、且つアミノ酸ごとにスコア欠失=-log10(P値)を計算する。
スコア突然変異及びスコア欠失を以下のように正規化する:
Figure 2022537477000092
スコア突然変異及びスコア欠失の重み付けを計算する:
a =欠失の倍数変化>1のアミノ酸の数
b =突然変異の倍数変化>1のアミノ酸の数
Figure 2022537477000093
必須性スコアの計算は以下のとおりである:
必須性スコア=wGHIJIKLM スコアGHIJIKLM + wSTUTIKLM スコアSTUTIKLM
一実施形態では、本方法は、必須スコアに従ってアミノ酸の機能的重要度に基づいてア
ミノ酸をランク付けすることをさらに含む。
一態様では、本発明はライブラリーに関し、複数のCRISPR-CasシステムガイドRNAを含むゲノム配列の機能的エレメントを同定するためにCRESMASに用いられ、前記ガイドRNAが、少なくとも1つの連続ゲノム領域内の複数のゲノム配列を標的とすることができるガイド配列を含み、100個以上のゲノム配列を標的とし、前記ゲノム配列には、連続ゲノム領域の1000塩基対ごとにPAM配列の上流にある非重複切断部位が含む。
一実施形態では、ライブラリー内の各RNAはDSBサイトの周囲約10bp、例えば、7~13bp、例えば、8bp、9bp、10bp、11bp、および12bpに影響を及ぼすように設計される。一実施形態では、ライブラリーは連続ゲノム領域内の各PAM配列の上流のゲノム配列を標的とするガイドRNA を含む。一実施形態では、PAM配列は、少なくとも一種類のCasタンパク質に特異的である。一実施形態では、CRISPR-CasシステムのガイドRNAは、少なくとも1つのCasタンパク質特異的な複数のPAM配列基づいて選択される一実施形態では、前記目的遺伝子の表現は、前記複数のCRISPR-CasシステムガイドRNAの中の少なくとも一つのガイドRNAの前記標的によって変化される。一実施形態では、前記ライブラリーは細胞集団、好ましく、真核細胞集団に導入される。一実施形態では、前記標的は連続ゲノム領域のNHEJを引き起こす。一実施形態では、標的は100以上の配列、例えば、約1,000以上の配列、約100,000以上の配列に対するものである。
一実施形態では、標的は、細胞集団中の各細胞に一つまたは複数のベクターベクターシステムを導入することを含み、前記ベクターシステムは、操作された非天然のCRISPR-Casシステム含み、それは
I.調節的エレメントに作動可能に接続される、Cabタンパク質またはCasタンパク質をコードするポリヌクレオチド配
II.CRISPR-CasシステムガイドRNAを含む。
そのうち成分IおよびIIが同じまたは異なるベクター内にあり、そこに転写されたガイド配列を含むガイドRNAが、CRISPR-Casシステムと連続ゲノム領域内の標的配列の配列特的結ガイドし、これにより、Casタンパク質が前記続ゲノム領域を切断するように誘導する。
一実施形態では、前記一つ以上のベクターはプラスミドベクターである。調節的エレメントは、誘導性プロモーターであり、好ましくは、誘導性プロモーターはドキシサイクリン(doxycycline)誘導性プロモーターである。
一態様では、本発明はCRESMAS方法に関し
(a) 前記請求項のいずれか1項に記載のライブラリーを、少なくとも1つのCasタンパクを含む改造された細胞集団に導入し、前記集団の各細胞が1つ以下のガイドRNAを含むこと;
(b) 細胞表現型の変化に基づいて細胞を少なくとも二つのグループに選別すること
(c) 各グループに存在するガイドRNAの相対的な表現(representation)を決定し、それによって各グループに存在するガイドRNAの表現によって前記細胞表現型の変化に関連するゲノム部位を決定すること
(d) シークエンシングのために、標的された1つまたは複数の遺伝子の1つまたは複数のcDNAまたはDNA配列を増幅すること
(e) シークエンシングリードを標的された遺伝子の参照配列にマッピングする;
(f) リードをフィルターし、ミスセンス突然変異またはインフレーム欠を有するリードのみを残すこと;および
(g) バイオインフォマティクスプロセスを適用することにより、細胞の表現型に対す
る各アミノ酸またはヌクレオチドの重み付けが決定されること、を含む
一実施形態では、細胞表現型の変化は、目的遺伝子の転写および/または発現の増加または減少である。一実施形態では、細胞を高発現グループと低発現グループに分類される。一実施形態では、細胞表現型の変化は、機能喪失または機能獲得を含む。一実施形態では、当方法は、単一のアミノ酸分解能で目的タンパク質の機能的エレメントを同定するために使用される。
一実施形態では、上記の方法はノンコーディングRNA、プロモーターまたはエンハンサーの機能を同定するために用いられる。形態では、唯一の修飾は、目的タンパク質の機能的エレメントが同定される場合、cDNAの代わりにゲノム上の標的領域のPCR増幅を実行する。
一態様では、本発明は化合物に対する耐性に関連する機能的エレメントをスクリーニン
グする方法に関し
(a) 上記のいずれかのライブラリーを、Casタンパク質を含むように改造された細胞集団に導入し、ここで、該細胞集団の各細胞は1つ以下のガイドRNAを含むこと;
(b) 化合物によ細胞集団を処理すること;及び
(c) 処理前と比較して、前記化合物で処理した後のガイドRNAの表現(representation)を決定することにより、ガイドRNAを濃縮することにより、前記化合物に対する耐性に関連するゲノム部位を特定すること
(d) シークエンシングのために、標的された1つまたは複数の遺伝子の1つまたは複数のcDNAまたはDNA配列を増幅すること
(e) シークエンシングリードを標的された遺伝子の参照配列にマッピングすること
(f) リードをフィルターし、ミスセンス突然変異またはインフレーム欠失を有するリードのみを残すこと;および
(g) バイオインフォマティクスプロセスを適用することにより、化合物に対する各ア
ミノ酸またはヌクレオチドの抵抗性の重み付けを決定されることを、含む
ある実施形態では、バイオインフォマティクスプロセスは以下を含む:
(h) ミスセンス突然変異を含む断片について、各アミノ酸の突然変異比率を以下のように計算する:
Figure 2022537477000094
(i)インフレーム欠失を含む断片について、各アミノ酸の欠失比率を以下のように計算
する:
Figure 2022537477000095
(j) インフレーム欠失をコードし、また欠失されたアミノ酸の数により、単一のアミノ酸欠失のみであれば「運転者の欠失」、複数のアミノ酸欠失であれば「乗客の欠失」としてインフレーム欠失を分類する。
(k) 実験群と対照群との間の倍数変化を計算し、
(l) 各アミノ酸の必須性スコアを以下のように算出する:
(1) 突然変異倍数変化については、全ての倍数変化に基づいてヌル分布を確立し、各
アミノ酸についてスコア突然変異=-log10(P値)を計算する
(2) 欠失の倍数変化に対し、まず調整可能なパラメーターαを適用して、運転者の欠
失と乗客の欠失に次のように重みを付ける:
欠失倍数変化=運転者の倍数変化+α乗客の倍数変化、続いて、100回並べ替えてヌ
ル分布を確立し、且つアミノ酸ごとにスコア欠失=-log10(P値)を計算する
(3) スコア突然変異及びスコア欠失を以下のように正規化する:
Figure 2022537477000096
(4) スコア突然変異及びスコア欠失の重み付けを計算する:
a =欠失の倍数変化>1のアミノ酸の数
b =突然変異の倍数変化>1のアミノ酸の数
Figure 2022537477000097
(5) 必須性スコアの計算は以下のとおりである:
必須スコア=wGHIJIKLM スコアGHIJIKLM+wSTUTIKLM スコアSTUTIKLM
本明細書の方法では、前記化合物は、真核細胞内の1つ以上のゲノム領域またはタンパク質の構造および/または機能に影響を与える任意の化合物であり得る。例えば、それは、本明細書に例示されるように、毒素または薬物であり得る。一部の実施形態では、真核細胞はヒト細胞である
局面では、本発明は、目的タンパク質の機能的要素を同定するための方法であり、当
該方法は、細胞集団に導入されたCRISPR-Casシステムを用いてタンパク質をコ
ードするゲノム遺伝子を破壊することによる目的タンパク質の飽和突然変異誘発を行い、
DNAシークエンシングによる表現型変化に関する破壊されたゲノム部位を決定し、標的遺伝子のcDNAをシークエンシングし、表現型の変化を引き起こすインフレーム突然変異を検索すること、および単一のアミノ酸分解能で目的タンパク質の機能的エレメントを同定するためのバイオインフォマティクスプロセスを確立し、シークエンシングデータを分析することを含む。この方法では、目的のタンパク質の機能的エレメントは、その天然の生物学的背景において同定される。
この方法において、インフレーム突然変異が、インフレーム欠失及びミスセンス特異的
突然変異である。一部の実施形態では、前記破壊は細胞集団内の各細胞に一つ又は複数のベクターのベクターシステムを導入することを含み、前記ベクターシステムが
I.調節的エレメントに作動可能に接続された、Cabタンパク質またはCasタンパク質をコードするポリヌクレオチド配列およ
II.ンパク質をコードするゲノム遺伝子を標的とするガイドRNA、を含む、操作された非天然のCRISPR-Casシステムを含む。
なお、成分IとIIは同じまたは異なるベクター上にあり、転写され、ガイド配列を含むガイドRNAがCRISPRasシステムとゲノム遺伝子の標的配列とは配列特異的に結合するようにガイドし、これにより、Casタンパク質によるゲノム領域の切断を誘導する。
一実施形態では、前記一つ以上のベクターはプラスミドベクターである。一実施形態では、調節的エレメントは誘導性プロモーターである。一実施形態では、ゲノム遺伝子内の1000塩基対ごとに、ガイドRNAはPAM配列の上流にある非重複切断部位を含む少なくとも100のゲノム配列を標的とする。一実施形態では、各ガイドRNAは、DSBサイトの周囲約10bp(例えば、7~13bp、例えば、8、9、10、11、12bp)に影響を及ぼすように設計される。一実施形態では、前記ライブラリーは、ゲノム遺伝子内の各PAM配列の上流にあるゲノム配列を標的とするガイドRNAが含まれる。一実施形態では、PAM配列は、少なくとも一種類のCasタンパク質に特異的である。
一実施形態では、CRISPR-CasシステムのガイドRNAは、少なくとも1つの
Casタンパク質の特異的な複数のPAM配列基づいて選択される一実施形態では、前記目的遺伝子の表現は、前記複数のCRISPR-CasシステムガイドRNAの中の少なくとも一つのガイドRNAの前記標的によって変化される。一実施形態では、前記標的はゲノム遺伝子のNHEJを引き起こす。
局面では、本発明は、例えば本発明のいずれかの方法により、タンパク質のゲノム遺
伝子の機能に重要なゲノム部位またはアミノ酸サイトとして同定された機能的エレメント
を突然変異させることにより遺伝子またはタンパク質を修飾する方法に関する。該方法に
よってタンパク質の機能に重要であると同定されたアミノ酸サイトにおいてアミノ酸置換
および/または欠失を有する変異体タンパク質も検討される。
図1A-1Bは、RESMASワークフローである。薬物または毒素の処理によってライブラリーのスクリーニングを行い、次にsgRNAバーコードおよび標的遺伝子のcDNAをNGSのため増幅をする。ミスセンス突然変異のみを有するリードを収集し、部位特異的突然変異倍数変化の計算および突然変異パターン分析のために用いる。インフレーム欠失を含むリードを、欠失におけるアミノ酸(a.a.)の数によって分類し、収集して欠失倍数変化を計算する。必須スコアは、インフレーム欠失およびミスセンス突然変異からの情報を利用することによって計算される。 図1A-1Bは、RESMASワークフローである。薬物または毒素の処理によってライブラリーのスクリーニングを行い、次にsgRNAバーコードおよび標的遺伝子のcDNAをNGSのため増幅をする。ミスセンス突然変異のみを有するリードを収集し、部位特異的突然変異倍数変化の計算および突然変異パターン分析のために用いる。インフレーム欠失を含むリードを、欠失におけるアミノ酸(a.a.)の数によって分類し、収集して欠失倍数変化を計算する。必須スコアは、インフレーム欠失およびミスセンス突然変異からの情報を利用することによって計算される。 図2A~2Eは、CRESMASスクリーニングの実験条件である。図2Aは、所定された処理時間でのHeLa細胞死に対する3つの抗がん剤の用量効果である。図2Bは、スクリーニングにおける各遺伝子のsgRNAのカバーエリアであり、各sgRNAはその切断サイトの上流と下流で10bpに影響すると想定される。x軸は、アミノ酸がカバーするsgRNAの数を表す。y軸は、sgRNAの影響を受けるアミノ酸(a.a.)の数を表す。図2Cは対照ライブラリー内のsgRNA配列の分布である。図2Dは標的cDNAのPCR増幅の概略図である。異なる遺伝子に使用されるプライマーを表4に列挙する。図2Eは標的cDNAのPCR増幅(左)とDNA断片の平均長さを250bpへ切断(右)したことを示す 図2A~2Eは、CRESMASスクリーニングの実験条件である。図2Aは、所定された処理時間でのHeLa細胞死に対する3つの抗がん剤の用量効果である。図2Bは、スクリーニングにおける各遺伝子のsgRNAのカバーエリアであり、各sgRNAはその切断サイトの上流と下流で10bpに影響すると想定される。x軸は、アミノ酸がカバーするsgRNAの数を表す。y軸は、sgRNAの影響を受けるアミノ酸(a.a.)の数を表す。図2Cは対照ライブラリー内のsgRNA配列の分布である。図2Dは標的cDNAのPCR増幅の概略図である。異なる遺伝子に使用されるプライマーを表4に列挙する。図2Eは標的cDNAのPCR増幅(左)とDNA断片の平均長さを250bpへ切断(右)したことを示す 図2A~2Eは、CRESMASスクリーニングの実験条件である。図2Aは、所定された処理時間でのHeLa細胞死に対する3つの抗がん剤の用量効果である。図2Bは、スクリーニングにおける各遺伝子のsgRNAのカバーエリアであり、各sgRNAはその切断サイトの上流と下流で10bpに影響すると想定される。x軸は、アミノ酸がカバーするsgRNAの数を表す。y軸は、sgRNAの影響を受けるアミノ酸(a.a.)の数を表す。図2Cは対照ライブラリー内のsgRNA配列の分布である。図2Dは標的cDNAのPCR増幅の概略図である。異なる遺伝子に使用されるプライマーを表4に列挙する。図2Eは標的cDNAのPCR増幅(左)とDNA断片の平均長さを250bpへ切断(右)したことを示す 図2A~2Eは、CRESMASスクリーニングの実験条件である。図2Aは、所定された処理時間でのHeLa細胞死に対する3つの抗がん剤の用量効果である。図2Bは、スクリーニングにおける各遺伝子のsgRNAのカバーエリアであり、各sgRNAはその切断サイトの上流と下流で10bpに影響すると想定される。x軸は、アミノ酸がカバーするsgRNAの数を表す。y軸は、sgRNAの影響を受けるアミノ酸(a.a.)の数を表す。図2Cは対照ライブラリー内のsgRNA配列の分布である。図2Dは標的cDNAのPCR増幅の概略図である。異なる遺伝子に使用されるプライマーを表4に列挙する。図2Eは標的cDNAのPCR増幅(左)とDNA断片の平均長さを250bpへ切断(右)したことを示す 図2A~2Eは、CRESMASスクリーニングの実験条件である。図2Aは、所定された処理時間でのHeLa細胞死に対する3つの抗がん剤の用量効果である。図2Bは、スクリーニングにおける各遺伝子のsgRNAのカバーエリアであり、各sgRNAはその切断サイトの上流と下流で10bpに影響すると想定される。x軸は、アミノ酸がカバーするsgRNAの数を表す。y軸は、sgRNAの影響を受けるアミノ酸(a.a.)の数を表す。図2Cは対照ライブラリー内のsgRNA配列の分布である。図2Dは標的cDNAのPCR増幅の概略図である。異なる遺伝子に使用されるプライマーを表4に列挙する。図2Eは標的cDNAのPCR増幅(左)とDNA断片の平均長さを250bpへ切断(右)したことを示す 図3A~3Bは、ライブラリー品質と編集タイプの分布である。図3Aは、対照群の各遺伝子から検出された部位特異的突然変異、挿入および欠失のパーセンテージ、及びスクリーニング後の二回の繰り返しである。図3Bは、二回の繰り返しの間の対数スケールでスクリーニングした後のsgRNA倍数変化の散布図である。 図3A~3Bは、ライブラリー品質と編集タイプの分布である。図3Aは、対照群の各遺伝子から検出された部位特異的突然変異、挿入および欠失のパーセンテージ、及びスクリーニング後の二回の繰り返しである。図3Bは、二回の繰り返しの間の対数スケールでスクリーニングした後のsgRNA倍数変化の散布図である。 図4A~4Bは繰り返しの欠失倍数変化および部位特異的突然変異倍数変化の散布図である。図4Aは、二回の繰り返しの間のスクリーニング後の欠失倍率変化の散布図である。図4Bは、二回の繰り返しの間のスクリーニング後の部位特異的突然変異倍数変化の散布図である。 図4A~4Bは繰り返しの欠失倍数変化および部位特異的突然変異倍数変化の散布図である。図4Aは、二回の繰り返しの間のスクリーニング後の欠失倍率変化の散布図である。図4Bは、二回の繰り返しの間のスクリーニング後の部位特異的突然変異倍数変化の散布図である。 図5A~5CはPA毒性の媒介におけるANTXR1に必須の重要なアミノ酸のCRESMAS同定を示す。図5Aは、PAスクリーニングにおけるANTXR1を標的とするsgRNAの評価を示す。ANTXR1タンパク質に対する各sgRNAの位置は、x軸に沿って示す。図5Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応する。ANTXR1のマルチドメイン(multi-domain)の概略図であり、PA結合部位を示す。図5CはANTXR1の各アミノ酸の必須スコアを示す。上位のヒットは濃い灰色で示され、既知の重要なアミノ酸を三角で示す。 図5A~5CはPA毒性の媒介におけるANTXR1に必須の重要なアミノ酸のCRESMAS同定を示す。図5Aは、PAスクリーニングにおけるANTXR1を標的とするsgRNAの評価を示す。ANTXR1タンパク質に対する各sgRNAの位置は、x軸に沿って示す。図5Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応する。ANTXR1のマルチドメイン(multi-domain)の概略図であり、PA結合部位を示す。図5CはANTXR1の各アミノ酸の必須スコアを示す。上位のヒットは濃い灰色で示され、既知の重要なアミノ酸を三角で示す。 図5A~5CはPA毒性の媒介におけるANTXR1に必須の重要なアミノ酸のCRESMAS同定を示す。図5Aは、PAスクリーニングにおけるANTXR1を標的とするsgRNAの評価を示す。ANTXR1タンパク質に対する各sgRNAの位置は、x軸に沿って示す。図5Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応する。ANTXR1のマルチドメイン(multi-domain)の概略図であり、PA結合部位を示す。図5CはANTXR1の各アミノ酸の必須スコアを示す。上位のヒットは濃い灰色で示され、既知の重要なアミノ酸を三角で示す。 図6A~6Cは、CSPG4がTcdB毒性を媒介するために必要な重要なアミノ酸のCRESMAS同定を示す。図6Aは、TcdBスクリーニングにおけるCSPG4を標的とするsgRNAの評価を示す。CSPG4タンパク質に対する各sgRNAの位置は、x軸に沿って示す。図6Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応し、同図は、TcdB結合部位を示したCSPG4のマルチドメイン(multi-domain)の概略図を示す。図6CはCSPG4の各アミノ酸の必須スコアを示す。上位のヒットは濃い灰色で示される。 図6A~6Cは、CSPG4がTcdB毒性を媒介するために必要な重要なアミノ酸のCRESMAS同定を示す。図6Aは、TcdBスクリーニングにおけるCSPG4を標的とするsgRNAの評価を示す。CSPG4タンパク質に対する各sgRNAの位置は、x軸に沿って示す。図6Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応し、同図は、TcdB結合部位を示したCSPG4のマルチドメイン(multi-domain)の概略図を示す。図6CはCSPG4の各アミノ酸の必須スコアを示す。上位のヒットは濃い灰色で示される。 図6A~6Cは、CSPG4がTcdB毒性を媒介するために必要な重要なアミノ酸のCRESMAS同定を示す。図6Aは、TcdBスクリーニングにおけるCSPG4を標的とするsgRNAの評価を示す。CSPG4タンパク質に対する各sgRNAの位置は、x軸に沿って示す。図6Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応し、同図は、TcdB結合部位を示したCSPG4のマルチドメイン(multi-domain)の概略図を示す。図6CはCSPG4の各アミノ酸の必須スコアを示す。上位のヒットは濃い灰色で示される。 図7A~7DはHBEGFがDT毒性を媒介するのに必須の重要なアミノ酸のCRESMAS同定を示す。図7Aは、DTスクリーニングにおけるHBEGFを標的とするsgRNAの評価である。HBEGFタンパク質に対する各sgRNAの位置をx軸に沿って示す。sgRNAの位置はsgRNAの切断サイトとして定義され、倍数変化は各アミノ酸を標的とするコドンのsgRNAの平均倍数変化である。図7Bは、各アミノ酸の対応する欠失および部位特異的突然変異の倍率変化である。グレーのバーは複数のアミノ酸の欠失を示す。グレーのバーの幅は、欠失したアミノ酸の数と相関している。各単一アミノ酸のグレースケール割り当ては10%である。グレースケールを重ねて、異なる欠失パターンにおける任意の特定のアミノ酸の統計的重要度を示す。アスタリスクは、タンパク質の機能に重要な既知の残基を示す。HBEGFのマルチドメインの概略図を図に示され、既知のDT結合領域であるEGF様ドメインを示す。図7Cは、HBEGFの各アミノ酸の必須スコアを示す。上位のヒットは濃いグレーで示され、既知の重要なアミノ酸は三角形である。図7Dは、DTに対する細胞の感受性に対する単一アミノ酸の欠失の影響を示す。細胞を異なる濃度のDTで処理し、毒素処理の48時間後にMTT細胞毒性の測定を実施した。データは、平均±s.d.、n=5として表す。 図7A~7DはHBEGFがDT毒性を媒介するのに必須の重要なアミノ酸のCRESMAS同定を示す。図7Aは、DTスクリーニングにおけるHBEGFを標的とするsgRNAの評価である。HBEGFタンパク質に対する各sgRNAの位置をx軸に沿って示す。sgRNAの位置はsgRNAの切断サイトとして定義され、倍数変化は各アミノ酸を標的とするコドンのsgRNAの平均倍数変化である。図7Bは、各アミノ酸の対応する欠失および部位特異的突然変異の倍率変化である。グレーのバーは複数のアミノ酸の欠失を示す。グレーのバーの幅は、欠失したアミノ酸の数と相関している。各単一アミノ酸のグレースケール割り当ては10%である。グレースケールを重ねて、異なる欠失パターンにおける任意の特定のアミノ酸の統計的重要度を示す。アスタリスクは、タンパク質の機能に重要な既知の残基を示す。HBEGFのマルチドメインの概略図を図に示され、既知のDT結合領域であるEGF様ドメインを示す。図7Cは、HBEGFの各アミノ酸の必須スコアを示す。上位のヒットは濃いグレーで示され、既知の重要なアミノ酸は三角形である。図7Dは、DTに対する細胞の感受性に対する単一アミノ酸の欠失の影響を示す。細胞を異なる濃度のDTで処理し、毒素処理の48時間後にMTT細胞毒性の測定を実施した。データは、平均±s.d.、n=5として表す。 図7A~7DはHBEGFがDT毒性を媒介するのに必須の重要なアミノ酸のCRESMAS同定を示す。図7Aは、DTスクリーニングにおけるHBEGFを標的とするsgRNAの評価である。HBEGFタンパク質に対する各sgRNAの位置をx軸に沿って示す。sgRNAの位置はsgRNAの切断サイトとして定義され、倍数変化は各アミノ酸を標的とするコドンのsgRNAの平均倍数変化である。図7Bは、各アミノ酸の対応する欠失および部位特異的突然変異の倍率変化である。グレーのバーは複数のアミノ酸の欠失を示す。グレーのバーの幅は、欠失したアミノ酸の数と相関している。各単一アミノ酸のグレースケール割り当ては10%である。グレースケールを重ねて、異なる欠失パターンにおける任意の特定のアミノ酸の統計的重要度を示す。アスタリスクは、タンパク質の機能に重要な既知の残基を示す。HBEGFのマルチドメインの概略図を図に示され、既知のDT結合領域であるEGF様ドメインを示す。図7Cは、HBEGFの各アミノ酸の必須スコアを示す。上位のヒットは濃いグレーで示され、既知の重要なアミノ酸は三角形である。図7Dは、DTに対する細胞の感受性に対する単一アミノ酸の欠失の影響を示す。細胞を異なる濃度のDTで処理し、毒素処理の48時間後にMTT細胞毒性の測定を実施した。データは、平均±s.d.、n=5として表す。 図7A~7DはHBEGFがDT毒性を媒介するのに必須の重要なアミノ酸のCRESMAS同定を示す。図7Aは、DTスクリーニングにおけるHBEGFを標的とするsgRNAの評価である。HBEGFタンパク質に対する各sgRNAの位置をx軸に沿って示す。sgRNAの位置はsgRNAの切断サイトとして定義され、倍数変化は各アミノ酸を標的とするコドンのsgRNAの平均倍数変化である。図7Bは、各アミノ酸の対応する欠失および部位特異的突然変異の倍率変化である。グレーのバーは複数のアミノ酸の欠失を示す。グレーのバーの幅は、欠失したアミノ酸の数と相関している。各単一アミノ酸のグレースケール割り当ては10%である。グレースケールを重ねて、異なる欠失パターンにおける任意の特定のアミノ酸の統計的重要度を示す。アスタリスクは、タンパク質の機能に重要な既知の残基を示す。HBEGFのマルチドメインの概略図を図に示され、既知のDT結合領域であるEGF様ドメインを示す。図7Cは、HBEGFの各アミノ酸の必須スコアを示す。上位のヒットは濃いグレーで示され、既知の重要なアミノ酸は三角形である。図7Dは、DTに対する細胞の感受性に対する単一アミノ酸の欠失の影響を示す。細胞を異なる濃度のDTで処理し、毒素処理の48時間後にMTT細胞毒性の測定を実施した。データは、平均±s.d.、n=5として表す。 図8A~8Cは、6-TG殺傷におけるHPRT1に必須の重要なアミノ酸のCRESMAS同定を示す。図8Aは、ボルテゾミブによるクリーニングにおけるHPRT1を標的とするsgRNAの評価を示す。HPRT1タンパク質に対する各sgRNAの位置は、x軸に沿って示す。図8Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応する。下の図はHPRT1のマルチドメイン概略図を示す。図8Cは、HPRT1の各アミノ酸の必須スコアを示す。上位のヒットは濃い灰色で示される。 図8A~8Cは、6-TG殺傷におけるHPRT1に必須の重要なアミノ酸のCRESMAS同定を示す。図8Aは、ボルテゾミブによるクリーニングにおけるHPRT1を標的とするsgRNAの評価を示す。HPRT1タンパク質に対する各sgRNAの位置は、x軸に沿って示す。図8Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応する。下の図はHPRT1のマルチドメイン概略図を示す。図8Cは、HPRT1の各アミノ酸の必須スコアを示す。上位のヒットは濃い灰色で示される。 図8A~8Cは、6-TG殺傷におけるHPRT1に必須の重要なアミノ酸のCRESMAS同定を示す。図8Aは、ボルテゾミブによるクリーニングにおけるHPRT1を標的とするsgRNAの評価を示す。HPRT1タンパク質に対する各sgRNAの位置は、x軸に沿って示す。図8Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応する。下の図はHPRT1のマルチドメイン概略図を示す。図8Cは、HPRT1の各アミノ酸の必須スコアを示す。上位のヒットは濃い灰色で示される。 図9A~9Eは、PSMB5がボルテゾミブの死滅に必須の重要なアミノ酸のCRESMAS同定を示す。図9Aは、ボルテゾミブクリーニングにおけるPSMB5を標的とするsgRNAの評価を示す。PSMB5タンパク質に対する各sgRNAの位置は、x軸に沿って示す。図9Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応する。図9Cは、PSMB5の各アミノ酸の必要性スコアを示す。上位のヒットは濃いグレーで示され、既知の重要なアミノ酸は三角形である。図9Dは、PSMB5の特異的突然変異がボルテゾミブに対する細胞感受性に与える影響のMTT保存力の測定である。図9Eは、PSMB5の特定する特異的突然変異がボルテゾミブに対する細胞感受性に影響を与える。データは、平均±s.d.、n=6として表す。 図9A~9Eは、PSMB5がボルテゾミブの死滅に必須の重要なアミノ酸のCRESMAS同定を示す。図9Aは、ボルテゾミブクリーニングにおけるPSMB5を標的とするsgRNAの評価を示す。PSMB5タンパク質に対する各sgRNAの位置は、x軸に沿って示す。図9Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応する。図9Cは、PSMB5の各アミノ酸の必要性スコアを示す。上位のヒットは濃いグレーで示され、既知の重要なアミノ酸は三角形である。図9Dは、PSMB5の特異的突然変異がボルテゾミブに対する細胞感受性に与える影響のMTT保存力の測定である。図9Eは、PSMB5の特定する特異的突然変異がボルテゾミブに対する細胞感受性に影響を与える。データは、平均±s.d.、n=6として表す。 図9A~9Eは、PSMB5がボルテゾミブの死滅に必須の重要なアミノ酸のCRESMAS同定を示す。図9Aは、ボルテゾミブクリーニングにおけるPSMB5を標的とするsgRNAの評価を示す。PSMB5タンパク質に対する各sgRNAの位置は、x軸に沿って示す。図9Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応する。図9Cは、PSMB5の各アミノ酸の必要性スコアを示す。上位のヒットは濃いグレーで示され、既知の重要なアミノ酸は三角形である。図9Dは、PSMB5の特異的突然変異がボルテゾミブに対する細胞感受性に与える影響のMTT保存力の測定である。図9Eは、PSMB5の特定する特異的突然変異がボルテゾミブに対する細胞感受性に影響を与える。データは、平均±s.d.、n=6として表す。 図9A~9Eは、PSMB5がボルテゾミブの死滅に必須の重要なアミノ酸のCRESMAS同定を示す。図9Aは、ボルテゾミブクリーニングにおけるPSMB5を標的とするsgRNAの評価を示す。PSMB5タンパク質に対する各sgRNAの位置は、x軸に沿って示す。図9Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応する。図9Cは、PSMB5の各アミノ酸の必要性スコアを示す。上位のヒットは濃いグレーで示され、既知の重要なアミノ酸は三角形である。図9Dは、PSMB5の特異的突然変異がボルテゾミブに対する細胞感受性に与える影響のMTT保存力の測定である。図9Eは、PSMB5の特定する特異的突然変異がボルテゾミブに対する細胞感受性に影響を与える。データは、平均±s.d.、n=6として表す。 図9A~9Eは、PSMB5がボルテゾミブの死滅に必須の重要なアミノ酸のCRESMAS同定を示す。図9Aは、ボルテゾミブクリーニングにおけるPSMB5を標的とするsgRNAの評価を示す。PSMB5タンパク質に対する各sgRNAの位置は、x軸に沿って示す。図9Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応する。図9Cは、PSMB5の各アミノ酸の必要性スコアを示す。上位のヒットは濃いグレーで示され、既知の重要なアミノ酸は三角形である。図9Dは、PSMB5の特異的突然変異がボルテゾミブに対する細胞感受性に与える影響のMTT保存力の測定である。図9Eは、PSMB5の特定する特異的突然変異がボルテゾミブに対する細胞感受性に影響を与える。データは、平均±s.d.、n=6として表す。 図10A~10Dは、BI2536死滅においてPLK1に必須の重要なアミノ酸のCRESMAS同定である。図10Aは、ボルテゾミブクリーニングにおけるPLK1を標的とするsgRNAの評価を示す。PLK1タンパク質に対する各sgRNAの位置は、x軸に沿って示す。図10Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応する。図10Cは、PLK1の各アミノ酸の必須スコアを示す。上位のヒットは濃いグレーで示され、既知の重要なアミノ酸は三角形で示される。図10Dは、BI2536に対する細胞の感受性に対するPLK1の指定された部位特異的突然変異の影響を決定するためのMTT活性測定図である。 図10A~10Dは、BI2536死滅においてPLK1に必須の重要なアミノ酸のCRESMAS同定である。図10Aは、ボルテゾミブクリーニングにおけるPLK1を標的とするsgRNAの評価を示す。PLK1タンパク質に対する各sgRNAの位置は、x軸に沿って示す。図10Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応する。図10Cは、PLK1の各アミノ酸の必須スコアを示す。上位のヒットは濃いグレーで示され、既知の重要なアミノ酸は三角形で示される。図10Dは、BI2536に対する細胞の感受性に対するPLK1の指定された部位特異的突然変異の影響を決定するためのMTT活性測定図である。 図10A~10Dは、BI2536死滅においてPLK1に必須の重要なアミノ酸のCRESMAS同定である。図10Aは、ボルテゾミブクリーニングにおけるPLK1を標的とするsgRNAの評価を示す。PLK1タンパク質に対する各sgRNAの位置は、x軸に沿って示す。図10Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応する。図10Cは、PLK1の各アミノ酸の必須スコアを示す。上位のヒットは濃いグレーで示され、既知の重要なアミノ酸は三角形で示される。図10Dは、BI2536に対する細胞の感受性に対するPLK1の指定された部位特異的突然変異の影響を決定するためのMTT活性測定図である。 図10A~10Dは、BI2536死滅においてPLK1に必須の重要なアミノ酸のCRESMAS同定である。図10Aは、ボルテゾミブクリーニングにおけるPLK1を標的とするsgRNAの評価を示す。PLK1タンパク質に対する各sgRNAの位置は、x軸に沿って示す。図10Bは、各アミノ酸の欠失と部位特異的突然変異倍数の倍率変化に対応する。図10Cは、PLK1の各アミノ酸の必須スコアを示す。上位のヒットは濃いグレーで示され、既知の重要なアミノ酸は三角形で示される。図10Dは、BI2536に対する細胞の感受性に対するPLK1の指定された部位特異的突然変異の影響を決定するためのMTT活性測定図である。 図11は、ssODNドナーのトランスフェクションの有無にかかわらず、プールされた細胞からのPSMB5におけるアミノ酸変異の配列決定クロマトグラムである。図は、変異したアミノ酸を示す。 図12は、ボルテゾミブ耐性細胞クローンの配列情報である。sgRNA配列に下線を引く;影付きのヌクレオチドはPAM配列を表す;下にドットが付いた文字と四角でマークされた文字は、それぞれ野生型と突然変異型アミノ酸を表す。 図13A~13Hは、PSMB5およびPLK1の上位ヒットの部位特異的突然変異パターンである。ヒートマップは、PSMB5図13AおよびPLK1図13Bの上位ヒットの特定アミノ酸の部位特異的突然変異の多様性を示す。棒グラフは、V90PSMB5図13C、A386PLK1図13D、M104PSMB5及びC122PSMB5図13E、F183PLK1及びR136PLK1図13F、A105PSMB5及びA43PSMB5図13Gの20個アミノ酸置換のパーセンテージを表す。側鎖の性質に応じて、20個のアミノ酸は異なる棒状形態の4つのグループ(非極性、極性、酸性、塩基性)に分けられる。元のアミノ酸をグレーの影で強調表示される。図13HはA105PSMB5とA43PSMB5との間のアミノ酸分布の散布図である。 図13A~13Hは、PSMB5およびPLK1の上位ヒットの部位特異的突然変異パターンである。ヒートマップは、PSMB5図13AおよびPLK1図13Bの上位ヒットの特定アミノ酸の部位特異的突然変異の多様性を示す。棒グラフは、V90PSMB5図13C、A386PLK1図13D、M104PSMB5及びC122PSMB5図13E、F183PLK1及びR136PLK1図13F、A105PSMB5及びA43PSMB5図13Gの20個アミノ酸置換のパーセンテージを表す。側鎖の性質に応じて、20個のアミノ酸は異なる棒状形態の4つのグループ(非極性、極性、酸性、塩基性)に分けられる。元のアミノ酸をグレーの影で強調表示される。図13HはA105PSMB5とA43PSMB5との間のアミノ酸分布の散布図である。 図13A~13Hは、PSMB5およびPLK1の上位ヒットの部位特異的突然変異パターンである。ヒートマップは、PSMB5図13AおよびPLK1図13Bの上位ヒットの特定アミノ酸の部位特異的突然変異の多様性を示す。棒グラフは、V90PSMB5図13C、A386PLK1図13D、M104PSMB5及びC122PSMB5図13E、F183PLK1及びR136PLK1図13F、A105PSMB5及びA43PSMB5図13Gの20個アミノ酸置換のパーセンテージを表す。側鎖の性質に応じて、20個のアミノ酸は異なる棒状形態の4つのグループ(非極性、極性、酸性、塩基性)に分けられる。元のアミノ酸をグレーの影で強調表示される。図13HはA105PSMB5とA43PSMB5との間のアミノ酸分布の散布図である。 図13A~13Hは、PSMB5およびPLK1の上位ヒットの部位特異的突然変異パターンである。ヒートマップは、PSMB5図13AおよびPLK1図13Bの上位ヒットの特定アミノ酸の部位特異的突然変異の多様性を示す。棒グラフは、V90PSMB5図13C、A386PLK1図13D、M104PSMB5及びC122PSMB5図13E、F183PLK1及びR136PLK1図13F、A105PSMB5及びA43PSMB5図13Gの20個アミノ酸置換のパーセンテージを表す。側鎖の性質に応じて、20個のアミノ酸は異なる棒状形態の4つのグループ(非極性、極性、酸性、塩基性)に分けられる。元のアミノ酸をグレーの影で強調表示される。図13HはA105PSMB5とA43PSMB5との間のアミノ酸分布の散布図である。 図13A~13Hは、PSMB5およびPLK1の上位ヒットの部位特異的突然変異パターンである。ヒートマップは、PSMB5図13AおよびPLK1図13Bの上位ヒットの特定アミノ酸の部位特異的突然変異の多様性を示す。棒グラフは、V90PSMB5図13C、A386PLK1図13D、M104PSMB5及びC122PSMB5図13E、F183PLK1及びR136PLK1図13F、A105PSMB5及びA43PSMB5図13Gの20個アミノ酸置換のパーセンテージを表す。側鎖の性質に応じて、20個のアミノ酸は異なる棒状形態の4つのグループ(非極性、極性、酸性、塩基性)に分けられる。元のアミノ酸をグレーの影で強調表示される。図13HはA105PSMB5とA43PSMB5との間のアミノ酸分布の散布図である。 図13A~13Hは、PSMB5およびPLK1の上位ヒットの部位特異的突然変異パターンである。ヒートマップは、PSMB5図13AおよびPLK1図13Bの上位ヒットの特定アミノ酸の部位特異的突然変異の多様性を示す。棒グラフは、V90PSMB5図13C、A386PLK1図13D、M104PSMB5及びC122PSMB5図13E、F183PLK1及びR136PLK1図13F、A105PSMB5及びA43PSMB5図13Gの20個アミノ酸置換のパーセンテージを表す。側鎖の性質に応じて、20個のアミノ酸は異なる棒状形態の4つのグループ(非極性、極性、酸性、塩基性)に分けられる。元のアミノ酸をグレーの影で強調表示される。図13HはA105PSMB5とA43PSMB5との間のアミノ酸分布の散布図である。 図13A~13Hは、PSMB5およびPLK1の上位ヒットの部位特異的突然変異パターンである。ヒートマップは、PSMB5図13AおよびPLK1図13Bの上位ヒットの特定アミノ酸の部位特異的突然変異の多様性を示す。棒グラフは、V90PSMB5図13C、A386PLK1図13D、M104PSMB5及びC122PSMB5図13E、F183PLK1及びR136PLK1図13F、A105PSMB5及びA43PSMB5図13Gの20個アミノ酸置換のパーセンテージを表す。側鎖の性質に応じて、20個のアミノ酸は異なる棒状形態の4つのグループ(非極性、極性、酸性、塩基性)に分けられる。元のアミノ酸をグレーの影で強調表示される。図13HはA105PSMB5とA43PSMB5との間のアミノ酸分布の散布図である。 図13A~13Hは、PSMB5およびPLK1の上位ヒットの部位特異的突然変異パターンである。ヒートマップは、PSMB5図13AおよびPLK1図13Bの上位ヒットの特定アミノ酸の部位特異的突然変異の多様性を示す。棒グラフは、V90PSMB5図13C、A386PLK1図13D、M104PSMB5及びC122PSMB5図13E、F183PLK1及びR136PLK1図13F、A105PSMB5及びA43PSMB5図13Gの20個アミノ酸置換のパーセンテージを表す。側鎖の性質に応じて、20個のアミノ酸は異なる棒状形態の4つのグループ(非極性、極性、酸性、塩基性)に分けられる。元のアミノ酸をグレーの影で強調表示される。図13HはA105PSMB5とA43PSMB5との間のアミノ酸分布の散布図である。
本明細書に記載される方法およびツールは、ゲノム編集に関心があり得る関連する機能単位の同定を可能にするために、ゲノム領域の体系的な調査に関する。したがって、一態様では、本発明は、ゲノム領域を調査する方法を提供し、該方法は、ディープスキャニング突然変異誘発ライブラリーを生成することおよびライブラリーを導入することによって変更された細胞集団の表現型の変化について調査することを含む。
したがって、本発明の一態様は、複数のCRISPR-CasシステムガイドRNAを含むことができるディープスキャン突然変異誘導ライブラリーを含み前記CRISPR-CasシステムガイドRNAは、少なくとも1つの連続ゲノム領域内でゲノム配列を標的化することができるガイド配列を含むことができる。より具体的には、想定されるライブラリーのガイドRNAは、ゲノム領域内の代表的な数のゲノム配列を標的とすべきである。例えば、ガイドRNAは、想定されるゲノム領域内の少なくとも50個、より具体的には少なくとも100個のゲノム配列を標的とすべきである。
ゲノム領域を標的とする能力は、PAM(プロトスペーサー隣接モチーフ)の存在によって決定される;すなわち、CRISPR複合体によって認識される短い配列である。PAMの正確な配列および長さの要件は、使用されるCRISPR酵素によって異なるが、PAMは通常、プロトスペーサー(すなわち、標的配列)に隣接する2~5塩基対の配列である。当技術分野で既知のPAM配列であり、且つ当業者は所のCRISPR酵素に対するPAM配列を同定することができる。具体的な実施形態では、PAM 配列は、少なくとも一つのCasタンパク質に特異的であるように選択され得る。代替実施形態では、ガイド配列RNAは、少なくとも1つのCasタンパク質に特異的な複数のPAM配列に基づいて選択され得る。
具体的な実施形態では、ライブラリーは、ゲノム領域内の1000塩基対ごとPAM配列の上流の非重複切断部位を含む少なくとも100のゲノム配列を含む。具体的な実施形態では、ライブラリーは連続ゲノム領域内の各PAM 配列の上流のゲノム配列を標的とするガイドRNAを含む。
該ライブラリーには、生物体的ゲノム領域を標的とするガイドRNAを含む。本発明のいくつかの実施形態において、生物または被験者は、真核生物(ヒトを含む哺乳動物を含む)または非ヒト真核生物または非ヒト動物または非ヒト哺乳動物である。一部の実施形態では、生物体または被験者は非ヒト動物であり、節足動物、例えば昆虫であってもよいし、線虫であってもよい。本発明のいくつかの方法において、生物または被験者は植物である。本発明のいくつかの方法において、生物または被験者は、哺乳動物、例えばヒトまたは非ヒト哺乳動物である。非ヒト哺乳動物は、例えば、げっ歯動物(好ましくは、マウスまたはラット)、有蹄類動物、または霊長類動物であり得る。本発明のいくつかの方法において、生物または被験者は、微細藻類を含む藻類または真菌である。
本明細書で提供される方法およびツールは、連続ゲノム領域を調べるのに特に有利である。そのような連続的なゲノム領域はゲノム全体までを含むことができるが、特に有利なのは、ゲノムの機能的エレメントが調査される方法であり、これは通常、ゲノムDNAの50~100kbの領域などのゲノムの限られた領域をカバーする。特定の目的は、コードゲノム領域の調査にこの方法の使用することである。当業者であれば、本発明の方法を使用して、例えば、目的遺伝子のコード領域の5’および3’領域のようなノンコーディングゲノム領域を調査することができ、これは、目的のタンパク質を調査した場合のcDNAではなく、プランを改変することによってゲノム上の標的領域PCR増幅ることが理解できる。
CRISPR/Casシステムは、連続する目的のゲノム領域内の複数の配列を特異的に標的化するために本発明で使用することができる。前記標的化は通常、工学操作された、非自然的に存在するCRISPR-Casシステムを含む1つまたは複数のベクターのベクターシステムを細胞集団の各細胞に導入することを含み、前記CRISPR-Casシステムは、少なくとも1種類のCasタンパク質とガイドRNAを含む。これらの方法では、Casタンパク質とガイドRNAはシステムの同じまたは異なるベクターに配置され、各細胞に組み込まれることができ、したがって、各ガイド配列は、細胞集団の各細胞における連続ゲノム領域内の配列を標的とする。細胞内での発現を保証するために、Casタンパク質は調節的エレメントと動作可能に連結されており、より具体的に、細胞集団の前記細胞で発現するプロモーターに適する。具体の実施形態では、プロモーターは、ドキシサイクリン誘導性プロモーターなどの誘導性プロモーターである。細胞集団の細胞で転写されると、ガイド配列を含むガイドRNAは、CRISPR-Casシステムを連続ゲノム領域の標的配列と配列特異的に結合するようにガイドする。一般に、CRISPR-Casシステムの結合は、Casタンパク質による連続ゲノム領域の切断を誘導する。
本出願は、表現型の変化に関連する機能的エレメントをスクリーニングする方法を提供する。表現型の変化は、DNA、RNA、タンパク質および/または細胞機能レベルを含む一つまたは複数のレベルで検出することができる。表現型の変化は、細胞の生存、成長、免疫応答、毒素や薬物などの化合物に対する耐性において検出することができる。
表現型の変化に関連するゲノム部位をスクリーニングする方法は、本明細書で企図される目的のゲノム領域を標的とするガイドRNAのライブラリーを細胞集団に導入することを含む。一般に、前記細胞はCasタンパク質を含むように改造される。しかしながら、具体の実施形態では、Casタンパク質はまた、ガイドRNAと同時に導入することができる。本明細書で企図される方法において、細胞集団にライブラリーを導入して、集団の各細胞が一つ以下のガイドRNAを含ようにする。その後、細胞は通常、観察された表現型に基づいて選別され、それらが細胞において表現型の変化を引き起こすか否かに基づいて、表現型の変化に関連するゲノム部位が同定される。一般的に、この方法では、表現型に基づいて細胞を少なくとも2つのグループに分類し、各グループに存在するガイドRNAの相対的な表現(representation)を決定し、かつ表現型の変化に関連するゲノム部位を各グループに存在する指導RNAの表現によって決定される。
本出願では、化合物に対する耐性に関連するゲノム部位をスクリーニングする方法も提供し、これにより、細胞が化合物と接触し、前記化合物に対する表現型応答に基づいてスクリーニングされる。より具体的には、このような方法は、本明細書で企図されるCRISPR/CasシステムガイドRNAのライブラリを細胞集団(Casタンパク質を含むように改造された、または同時にCasタンパク質が導入された)に導入し、この化合物で細胞集団を処理すること;また、初期の時点と比較して後の時点での化合物による処置したガイドRNAの表現を決定する。これらの方法では、化合物耐性に関連するゲノム部位は、濃縮されたガイドRNAによって決定される。
具体の実施形態では、前記方法は、ゲノム部位を含む領域のシークエンシングまたは全ゲノムのシークエンシングをさらに含み得る。
本出願はまた、本発明の方法を使用して薬剤耐性に関連する機能的エレメントをスクリーニングする方法に関する。
本明細書に記載される他の実施形態は、本明細書に開示される方法によって同定された遺伝子の一つまたは複数の機能的領域のゲノム破壊のための治療方法およびツールに関する。本明細書に記載のこれらおよびさらなる実施形態は、部分的にゲノム領域または目的タンパク質における機能領域の発見に基づく。
本明細書に例示された具体の方法では、カバー密度を最大化するために、2つのタイプのプロトスペーサー隣接モチーフ(PAM)、即ちNGGおよびNAGは共にsgRNAの設計に含まれる。抗がん剤または毒素を用いたライブラリースクリーニングの後、ゲノムDNAを抽出してsgRNAバーコードの従来のPCR増幅に用い、続いてNGS分析を行う。同時に、RNA逆転写からの標的遺伝子のPCR増幅を行い、長さ約250bpの断片化されたPCR産物がNGSを受ける。次に、野生型配列、またはアウトフレー挿入欠落の断片やインフレーム挿入の配列を含む配列をフィルターし、部位特異的突然変異またはインフレーム欠失を含む配列のみが、さらなる分析のために保持されるようにする。部位特異的突然変異については、本発明者らは、同義またはナンセンス変異をスクリーニングし続け、ミスセンス突然変異を含む突然変異のみを保持した。インフレーム欠失の場合、各リードによって引き起こされたアミノ酸欠失の数によって突然変異タイプを分類し、単アミノ酸欠失のみが含む場合が「運転者の欠失」、複数のアミノ酸欠失を含む場合が「乗客の欠失」として分類した。欠失パターンをデコードした後、欠失倍数変化を計算した。同様に、ミスセンス突然変異の倍数変化も計算した。次に、標的遺伝子にウィンドウのスライドを適用することによって、フィルターされたリードのすべての情報を用いて、ミスセンス突然変異、運転者の欠失、および乗客の欠失の倍数変化の加重平均値を計算した。次に、ランク付けによって加重平均値の有意水準を推定し、各アミノ酸の必須スコアを得た。このスコアは、インフレーム欠失および部位特異的突然変異の状況をカウントし、各アミノ酸の必須性を定量化し、機能的重要度に従ってアミノ酸をランク付けすることを可能にする。同時に、各アミノ酸のミスセンス突然変異のパーセンテージを計算することによってアミノ酸置換パターンの取得を試みた。この単純化されたワークフローおよびバイオインフォマティクスプロセスは、天然の生物学的環境におけるタンパク質の重要な機能的エレメントの同定を可能にすることが目的である。
本発明は、具体の実施形態および特定の図面を参照して説明されるが、本発明はそれらに限定されず、特許請求の範囲によってのみ限定される。請求項における任意の参照符号は、範囲を限定するものとして解釈されるべきではない。記載される図面は概略的なものに過ぎず、非限定的である。図面において、説明の目的のために、いくつかのエレメントのサイズは誇張され、縮尺通りに描かれていない場合がある。用語「含む」は、本明細書および特許請求の範囲で使用される場合、他の要素またはステップを排除しない。単数名詞に言及する場合、不定冠詞または定冠詞「一つ(a)」または「一種(an)」、「前記(the)」を使用し、特に明記しない限り、該名詞の複数形を含む。
特に明記がない限り、本発明の実施は、免疫学、生化学、化学、分子生物学、微生物学、細胞生物学、ゲノム学および組換えDNAの従来の技術を当技術の範囲内で採用する。Sambrook,FritschManiatis,MOLECULAR CLONING:A LABORATORY MANUAL,バージョン2(1989);CURRENT PROTOCOLS IN MOLECULAR BIOLOGY(F.M.Ausubel編集,(1987)); METHODS IN ENZYMOLOGYシリーズ(Academic Press,Inc。):PGR 2:A PRACTICAL APPROACH(M.J.MacPherson,B.D.HamesG.R.Taylor編集(1995)),HarlowとLane編集。(1988)ANTIBODIES,A LABORATORY MANUAL,and ANIMAL CELL CULTURE(R.LFreshney,ed.(1987))を参照してください
以下の用語または定義の提供は、本発明の理解に役立つ。本明細書で明確に定義されな
い限り、本明細書で使用される全ての用語は、本発明の当業者と同じ意味を有する。業者は特に本分野の定義および用語に関するSambrook,Molecular Cloning:A Laboratory Manual,バージョン2,Cold Spring Harbor Press,Plainsview, New York (1989); およびAusubelら, Current Protocols in Molecular Biology (Supplement 47),John Wiley &Sons, New York (1999)を参照できる
遺伝学において、「ナンセンス突然変異」とはDNA配列の部位特異的突然変異であり、早期終止コドン、または転写されたmRNAのナンセンスコドン、および切断された、不完全な、通常は非機能的タンパク質産物を招く。ナンセンス突然変異の機能的効果は、コードDNA中の終止コドンの位置次第である。例えば、ナンセンス突然変異の役割は、ナンセンス突然変異がどの程度元の終止コドンに接近し、およびタンパク質の機能的サブドメインが影響を受ける程度に依存する。ナンセンス突然変異は、単一のヌクレオチドの変化が異なるアミノ酸置換を引き起こす部位特異的突然変異である「ミスセンス突然変異」とは異なる。
「同義置換または突然変異」とは、タンパク質をコードする遺伝子のエクソンにおける一つの塩基の別の塩基に進化的置換であり、その結果、生成されたアミノ酸配列は修飾されていない。これが可能なのは、遺伝暗号が「縮重」しているためであり、これは一部のアミノ酸は複数の3塩基対コドンによってコードされていることを意味する。特定のアミノ酸の一部のコドンは、同じアミノ酸をコードする他のコドンとは一つの塩基対しか異なるものがあるので、「通常」塩基の代わりに一つの代替物を用いる突然変異は、遺伝子を翻訳する際、同じアミノ酸が成長中のポリペプチド鎖に混ぜてしまうことを招く。
タンパク質は、あってもなくてもよい領と必須領域の両方が含まれ、必須領域の突然変異がその機能を失う。対応するDNAコード配列では、リーディングフレームのシフトを引き起こす突然変異のいずれかは、突然変異が重要なサイト(キーサイト)で発生するか非重要なサイトで発生するかに関係なく、遺伝子発現を破壊することによってその機能を破壊する高い可能性がある。抗がん剤または細菌毒素のタンパク質をターゲットした場合、インフレーム欠失または部位特異的突然変異(ナンセンス突然変異を除く)は、そのような突然変異が非重要なサイトで発生した場合、耐性表現型を生成しない。非必須遺伝子について、各対立遺伝子の破壊は「機能喪失表現型」を実現するために必要な条件である。これらの劣性突然変異タイプはフレームシフト挿入欠失、インフレーム欠失、またはキーサイトに影響を及ぼすミスセンス突然変異のうちの1つである可能性がある。必須遺伝子について、唯一の薬剤耐性シナリオは、タンパク質の発現と細胞活性に対する重要な役割を変更することなく、インフレーム欠失またはミスセンス突然変異が薬物標的のキーサイトに影響を与える。これらの突然変異は優性であるため、「機能獲得表現型」を達成するには、1つの対立遺伝子の適切な突然変異で十分である。
野生型二倍体細胞において、遺伝子を有する二つの野生型対立遺伝子は、いずれも正常な遺伝子産物を生じる。ヘテロ接合体(優性または劣性をテストするための重要な遺伝子型)において、単一の野生型対立遺伝子は、野生型表現型を生じるのに十分な正常遺伝子産物を提供することができる。そのような場合、“機能喪失型突然変異”は劣性である。ある場合によっては、細胞は単一の野生型対立遺伝子の活性レベルを「アップレギュレーション」ことができ、ヘテロ接合子における野生型遺伝子産物の総量がホモ接合の野生型の半分を超える。しかしながら、突然変異イベントは、該遺伝子にいくつかの新しい機能を付与する。ヘテロ接合体では、新しい機能が表現されるので、「機能獲得型突然変異」は優性対立遺伝子のように作用し、何らかの新たな表現型を生成する可能性が高い。
「飽和突然変異誘発」は、単一のコドンまたはコドンセットをランダム化して、その位置に全ての可能なアミノ酸を生成するランダム突然変異誘発技術である。
「コドン」は三つのヌクレオチドのセットであり、あるアミノ酸をコードするトリプレットである。最初のコドンがリーディングフレームを確立し、新しいコドンが始まる。タンパク質のアミノ酸主鎖配列は連続するトリプレットで定義される。コドンは、タンパク質合成のための遺伝情報の翻訳鍵である。mRNAの翻訳が開始されると、「リーディングフレーム」を設定し、トリプレットが次々と読み取られる間に「リーディングフレーム」を維持する。遺伝子コードの読み取りは、mRNAのコドンを監視する三つのルールに縛られる。まず、コドンは5’から3’の方向に読み取られる。第二に、コドンは重複せず、かつ情報にギャップはない。上記のように、最後のルールは、情報を「リーディングフレーム」に固定されて翻訳することである。
「フレームシフト突然変異」は、フレームエラーまたはリーディングフレームシフトとも呼ばれ、DNA配列における3で割り切れないヌクレオチドのindel(挿入または欠失)によって引き起こされる遺伝突然変異である。コドンの遺伝子発現のトリプレット性質のために、挿入または欠失はリーディングフレームを変更する可能性があり、その結果、本来とはまったく異なる翻訳になってしまう。フレームシフト突然変異は通常、突然変異後にコドンが異なるアミノ酸をコードするように読み取られる。フレームシフト変異はまた、配列内で遭遇する最初の終止コドン(“UAA”、“UGA”または“UAG”)を変化させる。生じるペプチドは異常に短いか異常長い可能性があり、かつ機能しない可能性が高い。
「アウトフレー挿入欠失(Out-of-frame indel)」は遺伝子コード「リーディングフレーム」の外側挿入および/または欠損(indel)を読み取らせることを引き起こすものと指し、「インフレーム欠失」はDNA配列の中で3で割り切れる数のヌクレオチドの欠失であるため、この欠失はリーディングフレームを変更しない。
本明細書における「CRISPRシステム」は、一般的に、Cas 遺伝子をコードする配列、tracr(トランス活性化CRISPR)配列(例えば、tracrRNAまたは活性部分tracrRNA)、tracrメイト(tracr-mate )配列(内因性CRISPRシステムのコンテキストでの「ダイレクトリピート(direct repeat)」とtracrRNAプロセッシングの部分的なダイレクトリピートを含む)、ガイド配列(内因性CRISPRシステムのコンテキストでは「スペーサー配列(spacer)」とも呼ばれる”)、またはCRISPR遺伝子座からの他の配列およびトランスクリプトを含む、CRISPR関連(「Cas」)遺伝子の発現に関与したり、または活性化を指示するトランスクリプトやその他の要素を指す。一部の実施形態では、CRISPRシステムの1つ以上の要素は、タイプI、タイプII、またはタイプIII のCRISPRシステムから得られる。
発現ベクター内で、「動作可能に連結された」とは、目的ヌクレオチド配列が、ヌクレオチド配列の発現を可能にする方法(例えば、in vitro転写/翻訳システムにおいて、またはベクターが標的細胞に導入された際に、標的細胞の中におる)で目的の調節配列との連結を示すことが意図される。
CRISPR複合体の形成における文脈では、「標的配列」とは、ガイド配列がそれと相補的に設計されていることを示す配列であり、標的配列とガイド配列とのハイブリッドがCRISPR複合体の形成を促進する。ハイブリッドを引き起こし、CRISPR複合体の形成を促進するのに十分な相補性がある限り、完全な相補性は必要ではない。
一般的に内因性CRISPRシステムの場合、CRISPR複合体(標的配列にハイブリッドし、一つまたは複数のCasタンパク質と複合体を形成するガイド配列を含む)を形成することは、標的序列の中や近く(例えば1個や2個、3個、4個、5個、6個、7個、8個、9個、10個、20個、50個またはそれ以上の塩基対以内離れたところ)の1つまたは2つの鎖の切断をもたらす。理論に拘束されることを望まないが、tracr配列は、野生型tracr配列の全部または部分(例えば、野生型tracr配列の約20、26、32、45、48、54、63、67、85またはそれ以上のヌクレオチド)を含むか、またはこれらから構成されてもよく、CRISPR複合体の一部を形成してもよい、例えば、tracr配列の少なくとも一部に沿ってtracrメイト(tracr mate)配列の全部または一部とハイブリッドすることによって、前記tracrメイト配列がガイド配列に作動可能に連結された。
いくつかの実施形態では、tracr配列およびtracrメイト配列が十分な相補性を有し、ハイブリッドしてCRISPR複合体の形成に関与する。標的配列と同様に、機能を達成するのに十分である限り、完全な相補性は必要とされない。いくつかの実施形態において、最適にアラインメントされた場合、tracr配列は、tracrメイト配列と少なくとも50%、60%、70%、80%、90%、95%、または99%の配列相補性を有する。
一部の実施形態では、CRISPRシステムの1つ以上のエレメントの発現を駆動する1つ以上のベクターを宿主細胞に導入して、CRISPRシステムのエレメントの発現が1つ以上の標的サイトでCRISPR複合体形成するようにガイドする。別の実施形態において、宿主細胞は、Cas9および/またはOCT1を安定して発現するように工学操作される。
一般に、指示配列は、任意のポリヌクレオチド配列であり、それは、標的ポリヌクレオチド配列と十分な相補性を有し、標的配列とハイブリッドし、CRISPR複合体の標的配列への配列特異的結合を指示する。一部の実施形態では、適切なアラインメントアルゴリズムを使用して最適なアラインメントを行う場合、指示配列とその対応する標的配列との間の相補性は、約50%、60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%またはそれ以上である。最適なアラインメントは、配列をアラインメントするための任意の適切なアルゴリズムを使用して決定することができ、その非限定的な例は、Smith-Watermanアルゴリズム,Needleman-Wimschアルゴリズム,Burrows-Wheelerに基づいて変換のアルゴリズム(例えばBurrows Wheeler Aligner),ClustalW, Clustai X, BLAT, Novoalign (Novocraft Technologies, ELAND (I!fumma, San Diego, CA),SOAP(soap.genomics.org.cnで入手可能)およびMaq(maq.sourceforge.netで入手可能)。一部の実施形態では、ガイド配列の長さは、約5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75個またはそれ以上のヌクレオチドである。一部の実施形態では、ガイド配列の長さは、約75、50、45、40、35、30、25、20、15、12、11、10個またはそれ以下のヌクレオチドである。ガイド配列は、CR1SPR複合体と標的配列特異的結合ガイドする能力を任意の適切な測定方法により評価することができ、例えば、CRISPR複合体を形成するのに十分なCRISPRシステムの成分(テストされるガイド配列を含む)を対応する標
的配列を持つ宿主細胞に提供することができ、例えば、以下のように行われる:CRISPR配列の成分をコードするベクターでトランスフェクトし、次に、標的配列内で優先切断の評価を行い、例えば、本明細書で説明するSurveyor測定によって行われる。同様に、標的ポリヌクレオチド配列の切断は以下のように試験管内で評価することができる:テストされるガイド配列およびテストガイド配列とは異なるコントロールガイド配列を含む、標的配列、CRISPR複合体の構成要素が提供され、そして結合またはテストとコントロールガイド配列との反応との間の標的配列の切断速度を比較する。他の測定も可能であり、当業者であれば思いつくであろう。
一部の実施形態では、CRISPR酵素は1つ以上の異種タンパク質ドメインを含む融合タンパク質の一部である(例えば、CRISPR酵素に加えて、約1、2、3、4、5、6、7、8、9、10またはそれ以上のドメイン)。CRISPR酵素融合タンパク質は、任意の追加のタンパク質配列、および任意の2つのドメイン間の任意リンカー配列を含むことができる。CRISPR酵素に融合できるタンパク質ドメインの例には、エピトープタグ、レポーター遺伝子配列およびメチル化酵素活性、脱メチル化酵素活性、転写活性化活性、転写阻害活性、転写放出因子活性、歴史的(historic)修飾活性、RNA切断活性および核酸結合活性のうちの1つ以上を有するタンパク質ドメインがあるがこれに限定されない。
一部の態様では、本発明は、1つまたは複数のポリヌクレオチド(例えば、本明細書に記載の1つまたは複数のベクター、1つまたは複数のトランスクリプト、および/またはそこから転写された1つまたは複数のタンパク質)を宿主細胞に送達する方法を提供する。本発明は、DNAに基づくゲノムを標的修飾するための基本プラットフォームの役割を果たす。ウイルス、リポソーム、エレクトロポレーション、顕微鏡注射、およびコンジュゲーションを含むがこれらに限定されない多くの送達システムと組み合わせることができる。
一部の態様では、本発明はさらに、これらの方法によって生成された細胞、およびそれらの細胞によって産生される生物(例えば、動物、植物、または真菌)をさらに提供する。
一部の実施形態では、CRISPR酵素は、ガイド配列と組み合わせて(かつ選択的にガイド配列と複合する)細胞に送達される。従来のウイルスおよび非ウイルスによる遺伝子導入法は、哺乳動物細胞または標的組織に核酸を導入するために利用可能である。このような方法は、CRISPRシステムのコンポーネントをコードする核酸培養物や宿主生物の細胞に投与するために使用することができる。非ウイルスベクター送達システムには、DNAプラスミド、RNA(例えば、本明細書に記載のベクターのトランスクリプト)、裸の核酸、およびリポソームなどの送達ベクターと複合した核酸が含まれる。ウィルス送達システムには、細胞に送達されるエピソーム(episomal)または組み込まれたゲノムを持つDNAおよびRNAウイルスが含まれる。
gRNAの設計が比較的容易であることと、Cas9が任意の遺伝子座を実際に修飾する能力により、CRISPR/Cas9は本発明においてスクリーニング実験に用いられる。スクリーニング実験では、CRISPRがプールされたライブラリーまたはCRISPRライブラリーは、数千個のプラスミドで構成されており、各プラスミドには、標的タンパク質の全長にる異なる標的配列に向けられたgRNAが含まれる。具体的には、標的タンパク質の飽和突然変異誘発を達成するために、sgRNAは2種類のプロトスペーサー隣接モチーフ(PAM)、即ちNGGおよびNAGを含むように設計されており、かつ各sgRNA はDSBサイトの周囲の10bpに影響を与えて、カバー密度を最大にするように設計された。CRISPRスクリーニング実験は順遺伝的スクリーニングであってもよく、この中で望ましい表現型は既知するが、タンパク質のキーとなるアミノ酸は既知しない。一般的に、CRISPRに基づくスクリーニングは、レンチウイルスを用いて「プールされた」gRNAライブラリーを哺乳類のCas9発現細胞株に送することによって実行される。gRNAライブラリーで形質導入した後、目的表現型(例えば生存、薬物や毒素耐性、成長や増殖)について突然変異細胞をスクリーニングして、タンパク質の機能と望ましい表現型に重要なアミノ酸を同定する。
プールされたレンチウイルスgRNAライブラリーは、レンチウイルストランスファーベクターの異種混合物であり、各ベクターは、特定配列に対する単一のgRNAをコードし、各配列を標的とするいくつかのgRNAがライブラリーに存在する。
プールされたレンチウイルスCRISPRライブラリーを用いたスクリーニングの実施は、ライブラリー増幅、細胞形質導入、遺伝子スクリーニング、およびデータ分析を含む多段階プロセスである。簡単に言うと、gRNAを含むプラスミドの初期ストックを増幅してDNAの総量を増加させ、増幅されたライブラリーを使って個別のgRNAまたはgRNA+Cas9を含むレンチウイルスを生成する。単一ベクターライブラリーについては、単一のgRNAおよびCas9を含むレンチウイルスで野生型細胞を形質導入することによって、突然変異細胞を1つのステップで作製した。多くの場合、マルチベクターライブラリーでは、gRNAライブラリーを用いてCasを発現させる細胞が形質導入される。両方の場合において、形質導入された細胞は、gRNAとCas9を含む細胞を濃縮するために選択され、得られた突然変異細胞集団を目的の特定の表現型についてスクリーニングされた。最終集団からのゲノムDNAの次世代シーケンシング(NGS)は、スクリーニング中に濃縮または消費されたgRNAを同定する。最後にバイオインフォマティクスプロセスを設計して得られたデータを分析する。
ライブラリ増幅
通常に、プールされたレンチウイルスCRISPR gRNAライブラリーはDNAアリコートとして送達され、多くの場合、DNA の量は実験に使用するには不十分である。このような場合、最初のステップはライブラリーを「増幅」することであり、これは全グループにおける個々のgRNAプラスミドの相対的な割合を維持しながらプラスミドDNAの量を増やすことを意味する。ライブラリーDNA細菌に形質転換され、細菌の中で一定期間増殖させた後に、プラスミドDNAを回収することで増幅される。ほとんどのライブラリーでは、エレクトロポレーションを使用すると転換効率が向上するため、化学形質転化の代わりにエレクトロポレーションを使用される。多くの場合、転化された細菌は、適切な抗生物質を含むLB寒天プレート上で増殖し、これは、プレート上での増殖がライブラリーの表現(representation)を維持し、増殖中に急速に増殖するプラスミドが濃縮される可能性を低下させるのに役立つためである。形質転換および増幅されたgRNAプラスミドの数の推定値は、希釈プレートアッセイを行うことによって得ることができる。このために、形質転換されたサンプルを希釈し、抗生物質を含むLBプレートにプレーティングし、プレート上で生じる細菌コロニーの数を、増幅されたライブラリーに存在するgRNAプラスミドの総数の間接的な測定値として使用した。この測定は重要な制御手段として、機能スクリーニングに使用される前に最終的増幅されたライブラリーの内容を把握する。
細胞の形質導入
ライブラリーが増幅され、代表性が確認されると、次のステップは、プールされたgRNAライブラリーを含有するレンチウイルスを作製することである。一般的に、CRISPRライブラリー及び適切なパッケージングおよびエンベロープベクター(例えば、Didier Tronoの実験室からのpsPAX2、Addgene、プラスミド#12260、pMD2.G、Didier Tronoの実験室からのAddgene、プラスミド#12259、AddgeneからのpVSVGとpR8.74)を用いてHEK293T細胞をトランスフェクトする。あるいは、レンチウイルスパッケージング細胞型はgRNAライブラリーのみでトランスフェクトされてもよい。トランスフェクしてから48時間以降に培地を収集することを提案する解決手段が多いが、最大ウイルス力価は特定のライブラリーに応じて変化するので、ある程度の最適化を必要とする可能性がある。
形質導入ステップの目的は、Cas9および単一gRNAを安定的に共発現する突然変異細胞集団を生成することである。1つのステップにおいて野生型細胞から突然変異細胞を直接生成することができるため、gRNAおよびCas9を含む単一ベクターライブラリーはマルチベクターシステムよりも使用しやすい。その後、レンチウイルス形質導入後に選択して、Cas9およびgRNAに陽性の細胞集団を単離した。抗生物質を用いて選択する場合、Cas9およびgRNAを含有する細胞のみを選択するために、死滅曲線を実行して最適な抗生物質濃度を決定すべきである。
理論的には、任意の細胞型をスクリーニングに使用することができるが、細胞の最終集団は、スクリーニング前にライブラリーの代表性を維持するために、十分な数でなければならない。スクリーニングに必要な細胞の確実な数は、検討される特定のライブラリーに応じて変動する。これを把握するための最も簡単な方法は、最終的な突然変異細胞集団から復帰作業して、スクリーニングの開始時に必要な細胞の確実な数を決定する。例えば、10000個のgRNAのライブラリーが100×の代表で使用されると仮定する。このライブラリーを用いたスクリーニングに必要な細胞の最小数は10000個のgRNAs×100個の細胞/gRNA=10個の細胞である(スクリーニングのための対照条件を除く)。複数のgRNAを単一の細胞に伝達すると、複数の遺伝子変化を引き起こし、どの突然変異が観察された表現型を実際にもたらすかが不明であるようになるため、最終集団における各細胞は1つのgRNAのみを含まなければならない。したがって、<1の感染多重度(MOI)(すなわち、1つの細胞当たりにウイルス粒子が1つ未満)でレンチウイルスgRNAライブラリーを細胞に形質導入することを提案する解決手段が多い。
遺伝子スクリーニング
遺伝子スクリーニングは、ポジティブ(スクリーニング中に濃縮されたgRNAを示す)またはネガティブ(スクリーニング中に枯渇したgRNAを示す)として広く定義され得る。CRISPRライブラリーは、突然変異時に化学療法薬に対する耐性を付与する遺伝子を探すために、ポジティブ選択薬物スクリーニングに使用することができる。ポジティブ選択薬物スクリーニングでは、突然変異細胞集団を処理して、遺伝子修飾されて耐薬性を促進する細胞を選択的に濃縮するために、全ての野生型細胞を死滅させる(死滅曲線)最適濃度を決定することが重要であり得る。さらに、ゲノムDNAにおける最終的なgRNA数を、並行して実行される対照条件(例えば、ベクター対照)と比較して、gRNA分布の薬物非依存的変化を制御し、例えば、薬物の非存在下での所のgRNAによる細胞増殖に対する影響、またはベクター自体の影響を制御する。一方、ネガティブスクリーニングは、スクリーニング中に集団から排除されたgRNAを同定するために用いられ、それらが他の集団に対して選択的劣性であることを示す。ネガティブ選択によるスクリーニングの例として、所定の期間にわたって突然変異細胞を増殖させ、しばらくした時点と最初の時点のgRNA分布を比較する。
データ分析
任意の成功したスクリーニングの最終結果は、観察された表現型に必要な標的配列または要素を有するgRNAが濃縮(ポジティブセレクション)または消費される(ネガティブセレクション)変異細胞の集団を取得することである。したがって、データ解析ステップの目的は、実験群において枯渇または濃縮されたgRNAおよび配列またはエレメントを同定することである。細胞の最終的な集団は数千種類のgRNAを含んでいると考えられるため、ゲノム配列の分析には次世代シークエンシング(next-generation sequencing NGS)が必要である。個々のgRNAプラスミドは、当該gRNAとゲノムDNA中に存在する全ての他のgRNAとを区別するバーコードを含む。したがって、CRISPRスクリーニングデータからの分析の最初のステップは、PCRを使用してゲノムDNAに対するgRNAを増幅し、NGSを実行して最終的な突然変異細胞集団にどのようなgRNAが存在するかを特定することである。NGSの最終的な結果は、すべてのバーコードの元のカウントであり、そこからgRNA配列と標的遺伝子を推定することができる。
配列またはエレメントが“ヒット”であるかどうかを判断する1つの方法は、所定のサンプル中の、配列またはエレメントを標的にした濃縮または枯渇したgRNAの量を定性的に比較することである。前の節で述べたように、ライブラリには通常、遺伝子ごとに複数の異なるgRNAが含まれており、かつ特定の遺伝子に対する複数のgRNAの一致した濃縮または消費は、特定の配列対が観察される表現型にとって重要であることを示す有力な証拠である。同じターゲットに向けられた2つの異なるgRNAが同じオフターゲット効果を持つことは不可能であるため、いくつかのgRNAをオフターゲット効果の内部コントロールとして使用することができる。しかしながら、ヒットを定義するために任意の閾値を設定すること(例えば、六つのgRNAのうちの二つがヒットを満たすこと)は、潜在的な偏差の原因であり得るか、または偽陽性もしくは陰性の結果をもたらし得る。これを回避するために、様々な統計分析を用いて、偏差のない方法でヒットを決定することもできる。各スクリーニングは異なるため、どの統計方法が特定のスクリーニングに最も適合するかを知ることは非常に重要である。
本発明のデータ分析プロセスにおいて、野生型配列またはアウトフレー挿入欠失もしくはインフレーム挿入を含む配列のデータをフィルターし、部位特異的突然変異またはインフレーム欠失を含む配列のみが、さらなる分析のために保持されるようにする。部位特異的突然変異については、同義またはナンセンス突然変異をフィルターし、ミスセンス突然変異を含む突然変異のみを保持する。インフレーム欠失の場合、毎回のリードに引き起こされたアミノ酸欠失の数に基づいて突然変異タイプを分類する必要があり、単アミノ酸欠失のみが含む場合が「運転者の欠失」というタイプに定義される;複数のアミノ酸欠失を含む場合が「乗客の欠失」というタイプに定義される。バイオインフォマティクス分析は具体的に以下を含む:
ミスセンス突然変異を含む断片について、各アミノ酸の突然変異比率を以下のように計算する:
Figure 2022537477000098
インフレーム欠失を含む断片について、各アミノ酸の欠失比率を以下のように計算する:
Figure 2022537477000099
各アミノ酸の基本スコアを以下のように算出する:
突然変異倍数変化については、全ての倍数変化に基づいてヌル分布を確立し、各アミノ酸についてスコア突然変異=-log10(P値)を計算する
欠失の倍数変化に対し、まず調整可能なパラメーターαを適用して、運転者の欠失と乗の欠失に次のように重みを付ける:
欠失倍数変化=運転者の倍数変化+α乗客の倍数変化、続いて、100回並べ替えてヌル分布を確立し、且つアミノ酸ごとにスコア欠失=-log10(P値)を計算する
スコア突然変異及びスコア欠失を以下のように正規化する:
Figure 2022537477000100
スコア突然変異及びスコア欠失の重み付けを計算する:
a=欠失の倍数変化>1のアミノ酸の数
b=突然変異の倍数変化>1のアミノ酸の数
Figure 2022537477000101
必須性スコアの計算は以下のとおりである:
必須スコア=wGHIJIKLM スコアGHIJIKLM+wSTUTIKLM スコアSTUTIKLM
最後に、アミノ酸は必須スコアに従ってそれらの機能的重要度に基づいてランク付けされる。
材料と方法
細胞と試薬
Cas9を安定して発現するHeLa細胞およびHEK293T細胞を、ウシ胎児血清(FBS,CellMax)を10%含むドゥルベコ改良イーグル培地(DMEM、Corning)で、5%CO 37℃で培養した。
プラスミド構築
pLL3.7(Addgene)のU6プロモーターをヒトU6プロモーター、ccdBボックス、sgRNAスキャフォールドに置き換え、sgRNAベクター(plenti-sgrna-gfp)がクローされた。Cas9発現ベクター(pLenti-OC-IRES-BSD)は以前に報告された。pHR-SFFVKRAB-dCas9-P2A-mCherry (Addgene)のKRAB-dCas9エレメントをヒトHBEGFコード配列と3xFLAGに置き換え、pcDNA-HBEGFがクローされた。単一のアミノ酸欠失を有するHBEGFを発現するcDNAベクターを、PCR部位特異的変異誘発(PfuUltraII融合HS DNAポリメラーゼ、STRATAGENE)により構築された。HBEGFの異なる欠失突然変異体を生成するために使用されたプライマーを以下に挙げる
HBEGF-29-F 5’-GACCGGAAAGTCCGTTTGCAAGAGGCAG-3’
(SEQ ID NO:1)
HBEGF-29-R 5’-CTAGCCCTCTCCGCCGCTCCAGGCTC-3’
(SEQ ID NO:2)
HBEGF-63-F 5’-GACCGGAAAGTCCGTTTGCAAGAGGCAG-3’
(SEQ ID NO:1)
HBEGF-63-R 5’-CTGCCTCTTGCAAACGGACTTTCCGGTC-3’
(SEQ ID NO:3)
HBEGF-70-F 5’-GCAAGAGGCAGATCTGCTTTTGAGAGTC-3’
(SEQ ID NO:4)
HBEGF-70-R 5’-GACTCTCAAAAGCAGATCTGCCTCTTGC-3’
(SEQ ID NO:5)
HBEGF-115-F 5’-CGGAAATACAAGGACTGCATCCATGGAG -3’
(SEQ ID NO:6)
HBEGF-115-R 5’-CTCCATGGATGCAGTCCTTGTATTTCCG -3’
(SEQ ID NO:7)
HBEGF-119-F 5’-GGACTTCTGCATCCATGAATGCAAATATGTG-3’ (SEQ ID NO:8)
HBEGF-119-R 5’-CACATATTTGCATTCATGGATGCAGAAGTCC -3’ (SEQ ID NO:9)
HBEGF-125-F 5’-GAATGCAAATATGTGGAGCTCCGGGCTCC-3’
(SEQ ID NO:10)
HBEGF-125-R 5’-GGAGCCCGGAGCTCCACATATTTGCATTC-3’
(SEQ ID NO:11)
HBEGF-127-F 5’-ATGTGAAGGAGCGGGCTCCCTCCTGC -3’
(SEQ ID NO:12)
HBEGF-127-R 5’-GCAGGAGGGAGCCCGCTCCTTCACAT-3’
(SEQ ID NO:13)
HEBGF-133-F 5’-GCTCCCTCCTGCTGCCACCCGGGTTAC -3’
(SEQ ID NO:14)
HBEGF-133-R 5’-GTAACCCGGGTGGCAGCAGGAGGGAGC -3’
(SEQ ID NO:15)
HEBGF-134-F 5’-CCCTCCTGCATCCACCCGGGTTACC -3’
(SEQ ID NO:16)
HBEGF-134-R 5’-GGTAACCCGGGTGGATGCAGGAGGG -3’
(SEQ ID NO:17)
HEBGF-138-F 5’-CTGCCACCCGGGTCATGGAGAGAGGTGTC-3’
(SEQ ID NO:18)
HBEGF-138-R 5’-GACACCTCTCTCCATGACCCGGGTGGCAG-3’
(SEQ ID NO:19)
HEBGF-141-F 5’-CCGGGTTACCATGGAAGGTGTCATGGGC-3’
(SEQ ID NO:20)
HBEGF-141-R 5’-GCCCATGACACCTTCCATGGTAACCCGG-3’
(SEQ ID NO:21)
HEBGF-152-F 5’-GCCTCCCAGTGGAACGCTTATATACCTATG-3’
(SEQ ID NO:22)
HBEGF-152-R 5’-CATAGGTATATAAGCGTTCCACTGGGAGGC-3’ (SEQ ID NO:23)
HEBGF-153-F 5’-CCTCCCAGTGGAAAATTTATATACCTATGACC-3’ (SEQ ID NO:24)
HBEGF-153-R 5’-GGTCATAGGTATATAAATTTTCCACTGGGAGG-3(SEQ ID NO:25)
sgRNA ライブラリー設計
標的遺伝子のhg19CDS配列をUCSCゲノムブラウザー(https://genome.ucsc.edu/)からダウンロードし、自作のスクリプトを使用して、ライブラリーを構築するために、NAGまたはNGG PAM配列を持つすべての潜在的なsgRNAを設計した。
CRISPR/Cas9 sgRNAライブラリーの構築
それぞれ三つの薬物関連タンパク質および三つの毒素受容体をそれぞれ標的とする1236および3712個のsgRNAを含む二つのライブラリーを構築した。sgRNAをコードするアレイベースのオリゴヌクレオチドをPCRによって合成し、5’末端にBsmBI認識部位を含む対応するプライマーを用いて増幅した。sgRNAをコードするアレイベースのオリゴヌクレオチドをPCR 増幅するために使用されるプライマー(薬物関連タンパク質を標的とするsgRNA オリゴヌクレオチドを増幅するために使用されるプライマー)を以下に挙げる
薬物ライブラリーF 5’-TTGTGGAAAGGACGAAACCG-3’ (SEQ ID NO:26)
薬物ライブラリーR 5’-(SEQ ID NO:27)
毒素ライブラリーF 5’-TCTTCATATCGTATCGTGCG-3’ (SEQ ID NO:28)
毒素ライブラリーR 5’-TAGTCGCTAGGCTATAACGT-3’ (SEQ ID NO:29)
増幅されたDNA産物は、ゴールデンゲート(Golden Gate)法を使用してベクターにライゲーションされた。次いで、ライゲーション混合物をTrans1-T1コンピテント
セル(Transgen)に形質転換して、プラスミドライブラリーを生成した。続いて、X-tremeGENE HP DNAトランスフェクション試薬(Roche)を使用して、sgRNAプラスミドライブラリーを2つのウイルスパッケージングプラスミドpVSVGおよびpR8.74(Addgene)とともにHEK293T細胞にトランスフェクトした。次いで、HeLa細胞を低MOI(約0、3)のレンチウイルスで感染させ、感染した後の48時間でFACS によってEGFP 細胞を収集した。
ライブラリースクリーニング
BI 2536およびボルテゾミブのスクリーニングについては、実験ごとにそれぞれ3.5×10個の細胞を持つ150mmのシャーレ2個を繰り返した。接種後24時間、適切な濃度の薬物で細胞を処理する。スクリーニングの最初のラウンドでは、ライブラリー細胞を4ng/mlのBI2536で1.5日培養し、または4ng/mlのボルテゾミブで3日培養した後、新鮮なDMEMで培養した。耐性細胞を再度播種し、5-10日間培養し、ラウンドの薬物スクリーニングに使用する。スクリーニングの第二ラウンドでは、ライブラリー細胞を5ng/mlのBI2536と4日間、または8ng/mlのボルテゾミブと5日間インキュベートした。クリーニングの第ラウンドでは、ライブラリー細胞を6ng/mlのBI 2536と3日間インキュベートした。6-TGスクリーニングでは、合計1.8×10個のライブラリー細胞を150mmシャーレにプレートあたり3×10個の細胞でプレーティングした。三つの細胞プレートを一つの繰り返しとして一つのグループに分けた。細胞を、250ng/mlの6-TGで6日間処理し、生き残した細胞を増殖のために再播種し、次のラウンドのスクリーニングに用いた。第二ラウンドおよび第三ラウンドについて、ライブラリー細胞を、250ng/mlおよび300ng/mlの6-TGとそれぞれ4日間インキュベートした。TcdBスクリーニングのために、150mmの四つのペトリ皿にそれぞれ、3.5×10個の細胞を実験的繰り返しとして播種した。スクリーニングの各ラウンドで、細胞は適切な濃度で処理された:第一ラウンドは70ng/ml、第二ラウンドと第三ラウンドは100ng/mlであった。HBEGFおよびANTXR1スクリーニングの詳細は、本発明者らの以前の報告と同じである(1)
スクリーニングされた各耐性細胞を収集して、ゲノムDNAとトータルRNAを抽出にもちいて、逆転写を実行した。次に、PCR増幅によって得られた標的遺伝子のsgRNAコード領域およびcDNAを次世代シークエンシング(NGS)分析にかけた。
候補sgRNA配列の同定
DNeasy BloodとTissueキット(Qiagen)を用いて適切な数のライブラリー細胞からゲノムDNAを抽出した。異なる薬物/毒素処理に対して、ライブラリー細胞の適切な数は異なる:ANTXR1は、6.25×10個、CSPG4は、3×10個、HBEGFは、2.5×10個、HPRT1は、1.75×10個、PLK1は、6.3×10個、PSMB 5は、3×10である。sgRNA領域は、プライマーを用いてsgRNAの隣接配列をアニーリングした26サイクルのPCRにより増幅される。各リピートのPCR産物をプールし、DNA Clean&Concentrator-5(Zymo Research Corporation)で精製し、異なるバーコード(NEB#7370、#7335、#7500)でインデックスを付け、NGSで分析した。
cDNA 調製及びシークエンシング
RNAprepピュアセル/バクテリアキット(TIANGEN)を使用してライブラリー細胞からトータルRNAを抽出し、Quantscript RTキット(TIANGEN)を使用してcDNAを合成した。二ステップの方法でNGSライブラリを構築する。第一ステップはPCRによりcDNAを増幅する(26個のサイクル;PrimeSTAR HS DNAポリメラーゼ、Takara)を含む。異なる遺伝子のためのプライマー(cDNA増幅プライマー)を表1に示した。
Figure 2022537477000102
CSPG4のコード配列長は約6.9kbであり、3つの増幅反応を用いてその全長を含むオーバーラップフラグメント(~50bp)を得。各cDNA断片のPCR産物を集めて、精製した(DNA Clean&Concentrator-5,Zymo Research Corporation)。次に、CovarisS2システムを使用して各遺伝子の1μgのcDNAを約250bpに切断した。DNA Clean & concentrator-5キット(Zymo Research Corporation)を用いて切断された産物を精製して濃縮し、また、異なるバーコードを使用して、NGS分析用のインデックスを作成した。
機能ドメインの同定の計算方法
Bowtie2 2.3.2を使用してシークエンシングリードをターゲット遺伝子の参照配列にマッピングし、SAMtools1.3.1を使用して選別した。次に、リードをフィルターして、ミスセンス突然変異またはインフレーム欠失のみを含むリードをした。ミスセンス突然変異を含む断片について、各アミノ酸の突然変異率を次のように計算した:
Figure 2022537477000103
インフレーム欠失を含む断片について、各アミノ酸の欠失比率を以下のように計算した:
Figure 2022537477000104
そして、それらが生成したアミノ酸の欠失の数に基づいて突然変異のタイプを分類し、一つのアミノ酸しか欠落していない場合が「運転の欠失(driver deletions)」、複数のアミノ酸欠失の場合が「乗客の欠失(passenger deletions)」として分類した。突然変異/欠失の比率を決定し、欠失パターンをデコードした後、実験群と対照群との間の倍数変化を計算した。
次に、各アミノ酸の必須性スコアを以下のように算出した。突然変異倍数変化については、全ての倍数変化に基づいてヌル分布を確立し、各アミノ酸についてスコア突然変異=-log10(P値)を計算した。欠失の倍数変化に対し、まず調整可能なパラメーターαを適用して、運転者の欠失と乗客の欠失に次のように重みを付けた。
欠失倍数変化=運転者倍数変化+α乗客倍数変化。
続いて、並べ替えてヌル分布(null distribution)を確立し、(且つアミノ酸ごとにスコア欠失=-log10(P値)を計算した。次に、スコア突然変異
及びスコア欠失は以下のように正規化した
Figure 2022537477000105
続いて、スコア突然変異及びスコア欠失の重み付けを以下のとおり計算した。
a=欠失の倍数変化>1のアミノ酸の数
b=突然変異の倍数変化>1のアミノ酸の数
Figure 2022537477000106
最終的に、必須性スコアの計算は以下のとおりである:
必須スコア=wGHIJIKLM スコアGHIJIKLM+wSTUTIKLM スコアSTUTIKLM
スクリーニング結果の検証
PSMB5およびPLK1の重要な突然変異を検証するために、sgRNAは突然変異部位の近くに設計され、検証された残基の代わりに119ntのssODNドナーごとに1つのアミノ酸をコードする。すべてのsgRNA(重要な変異を検証するためsgRNA配列)およびssODNドナー配列(ssODNドナーは検証された残基の代わりに一つのアミノ酸をコードする)を以下の表2に示した。
Figure 2022537477000107
HeLa細胞、6ウェルプレートで1μgのsgRNAと2μgのssODNドナーをトランスフェクトした。1.5×10個の細胞を、トランスフェクション後14日間、薬物による選択の24時間前に6ウェルプレート播種した。適切な用量の薬物で細胞を72時間処理した(ボルテゾミブ(8ng/ml)BI2536(10ng/ml)。TIANampゲノムDNAキット(TIANGEN)を使って薬剤耐性細胞のゲノムを抽出した
TransTaq DNAポリメラーゼの高忠実度(Transgen)を使用して突然変異サイトを増幅し、汎用のDNA精製キット(TIANGEN)を用いて精製した。プライマー(PSMB5遺伝子突然変異部位を増幅するためのプライマー)を表3に挙げた
Figure 2022537477000108
PCR断片をpEASY-T5 Zeroクローンキット(Transgen)にクローンしてシークエンシングに用い
細胞毒性の測定
薬物または毒素処理の24時間前に、96ウェルプレートに細胞(ジフテリア毒素(DT)用の5,000個の細胞とボルテゾミブ用の3000個の細胞)播種し、異なる濃度のボルテゾミブまたはDTを添加した。細胞を37℃で48時間(DT)または72時間(ボルテゾミブ)インキュベートした後に、1mg/mlのMTT(3-[4.5-ジメチルチアゾール-2-イル]-2.5-ジフェニルテトラゾール臭化物)を添加した。BioTek Cytation5(BioTek Instruments)を使用して、570nmでの分光光度計の読み取り値を収集した
結果
タンパク質マッピング機能エレメントにおけるCRESMAS方法テストするために、本発明者らは、細菌毒素受容体をコードする三つの遺伝子(ANTXR1、CSPG4およびHBEGF)および抗がん剤ターゲットをコードする三つの遺伝子(HPRT1、PLK1およびPSMB5)(表4)を選択した。
Figure 2022537477000109
本発明者らは、HeLa細胞を選択してスクリーニングのためのCRISPRライブラリーを構築し、それは、HPRT1(12)を標的とする6-TG(チオグアニン)、PLK1(13)を標的とするBI2536、およびPSMB5(14)を標的とするボルテゾミブなど、この細胞株における毒素(8、11)および薬物の適切な傷害条件を決定したためである(図2A)。
標的遺伝子については、sgRNAをコンピュータ(in silico)上で設計し、チップ上でプール(pool)として合成して、3つの受容体コーディング遺伝子の全長をカバーする飽和CRISPRライブラリー、および3つの薬物ターゲットをカバーする別のライブラリーを構築した(図2B)。
処理されていない対照スクリーニングを除いて、本発明者らは6つの処理中のそれぞれに対して機能スクリーニングを2回繰り返した。各sgRNAがDSB部位の周囲の10-bp(15)に影響を及ぼすと仮定すると(図2C)、6つの遺伝子のsgRNAカバレッジは約0.99であった。毒素(PA/LFnDTA毒素、ジフテリア毒素、またはクロストリジウム・ディフィシル毒素B)または薬物(6-TG、BI2536、またはボルテゾミブ)による処理を三回した後、性細胞を得て、NGS分析による通常のsgRNA解読(デクリプション) (8、16)のためにゲノムDNAを抽出した。
同時に、これらの得た耐性細胞を全RNA単離および逆転写に供してcDNAを得、これをPCR増幅のための鋳型(テンプレートとして使用した。特異的プライマを用いた増幅によって標的遺伝子の全長cDNAを得た。CSPG4などの大型遺伝子については、その全長をカバーするように三対のプライマーを使用して3つのオーバーラップしたフラグメントを増幅した。選択的スプライシングを有する遺伝子については、全ての代替転写物(トランスクリプト)が含まれることを確実にするために、特異的プライマー対を設計した(図2Dおよび表1)。NGSのサイズ要件のため、PCRフラグメントを、平均的に250-bpの小さなサイズにさらに分割した(図2E)。全ての実験手順の後、本発明者らは、シークエンシングデータを分析して標的遺伝子の機能に不可欠なアミノ酸を決定するための計算手順を確立した。
全て6つのターゲットの対照ライブラリーの突然変異パーセントは低レベルであり、これらの値、特に、CRISPRライブラリーで生成した挿入欠失はスクリーニング後に有意に増加した。全ての対照群における比較的高い点突然変異率は、PCR増幅およびNGSにおいて生じたエラーに起因する可能性がある。しかしながら、点突然変異のリードは、6回のスクリーニングのいずれかの後に増加し、何らかの点突然変異が耐性表現型に確実に寄与することを示した(図3A)。次いで、本発明者らは、2回の繰り返し間のsgRNA倍数変化と欠失突然変異および点突然変異との関連性によりスクリーニングの品質を評価すると、sgRNA倍数変化の相関係数範囲が0.36~0.85(図3B)、欠失が0.45~0.99(図4A)、点突然変異が0.61~0.99(図4)であることを見出し、本発明の方法の高い一致性が示された。全て3つの毒素受容体が細胞生存に必須ではないため、スクリーニング後のsgRNAは、そのコード配列にわたって均一に分布し(図3A、図5Aおよび図6A)、これは、これらの大部分がフレームシフト挿入欠失を生成することができ、標的遺伝子発現の破壊を引き起こすことを示している。興味深いことに、3つの毒素受容体のC-末端部分に対応するコード領域を標的とする大部分のsgRNAは、一貫して濃縮することができず(図3A、図5Aおよび図6A)、これは、その大部分の細胞内C-末端領域が機能的に必須ではないことを示している。しかしながら、sgRNAコード領域のNGSは、多くの配列-機能情報を明らかにすることができなかった。
CRESMASポリシーおよび簡略化アルゴリズムを用いて、機能的に関連するアミノ酸マップを得ることができる。本発明者らは、運転者欠失には、このアミノ酸欠失型の意味が曖昧ではないため、意図的に実線を割り当て、一方、乗客欠失には灰色線(10%の割合)を割り当てた。本発明者らはまた、見やすくするために、単一のミスセンス突然変異データと欠失データを1つのグラフに合併した。単一アミノ酸欠失と同様に、ミスセンス点突然変異によるタンパク質機能の喪失は、影響を受けたアミノ酸がタンパク質の機能に非常に重要であることを示す。
ジフテリア毒素(DT)の受容体をコードするHBEGFの機能的スクリーニングについては、ほとんどの耐性細胞は、報告されたDT結合部位(17)であるEGF様ドメイン(図7B)において欠失を有する。必要性スコアを計算し、以下の表6に示す。
Figure 2022537477000110

Figure 2022537477000111

Figure 2022537477000112

Figure 2022537477000113

Figure 2022537477000114

Figure 2022537477000115
必須性スコアを計算したことにより(表6)、本発明者らは、スコアが最も高いアミノ酸がEGF様ドメインに確実に濃縮されることを見出し、毒素結合の調節におけるこのドメインの必要性がさらに確認された。全てのアミノ酸の中で、DT-HBEGF相互作用に必要な3つの既知のアミノ酸であるF115、L127、およびE141(17)は、上位(第21位、第15位、および第28位)である。重要なことに、CRESMAS方法は、これらの3つ以外の多くの新しい部位が受容体機能にとって重要であることを明らかにした(図7C)。本発明者らの結果を検証するために、本発明者らは、HeLaHEGF-/-細胞(8)においてレンチウイルス感染によって野生型または突然変異体HBEGF cDNAを発現させた。本発明者らは、5つの上位の部位(G119、K125、I133、C134、Y138)、3つの既知のポジティブ部位、および五つの下位(L29、D63、D70、N152、R153)の部位を検証した。HeLa HBEGF-/-は、DTに対する全体的な耐性を示し、野生型HBEGFは、毒素に対する細胞の感受性を回復させることを示した。これらの5つの上位の部位(G119、K125、I133、C134、Y138)のうちの1つの単一アミノ酸欠失、または既知のポジティブ部位(F115、L127、E141)のうちの1つの単一アミノ酸欠失を含有する突然変異体HBEGFのすべての発現は、DTに対する細胞の感受性をレスキューすることができなかったが、5つの下位の部位(L29、D63、D70、N152、R153)のうちのいずれかの欠失を有する突然変異体HBEGFは、野生型と同様にレスキューした(図7D)。これらの結果は、EGF様ドメイン中の何らかのアミノ酸がDT-により誘発された細胞毒性に必要であるという本発明者らのスクリーニング結果を裏付ける。注目すべきことに、HBEGFについてDT結合ドメイン中のいくつかのアミノ酸がスクリーニングされたという事実は、CRESMASが低い偽陽性率を有することを示す。
炭疽毒素の受容体ANTXR1について、すべての耐性細胞は、細胞質ドメインをコードする領域を除いて、コード領域全体にわたって様々な欠失を有し(図5Bおよび5C)、これは、炭疽毒素とANTXR1との間の相互作用が受容体の細胞外領域によって支配されることを示している。既知のPA結合部位(18)及び膜貫通ドメインに加えて、様々な程度の重要度を示す多くの新規アミノ酸が同定された(図5B)。sgRNAシークエンシングの結果(図5A)と一致して、細胞質領域内のアミノ酸の大部分は不必要であり(図5B)、これもまた、CRESMASの低偽陽性率を示している。炭疽毒性の媒介においてANTXR1機能に重要な高順位アミノ酸であって、2つの既知の部位H57およびE155(18)(図5C)を含むものは、必須性スコアの計算によって決定された。
CSPG4、クロストリジウム・ディフィシル毒素B(TcdB)の受容体について、突然変異体のピークは、主に最初と最後の両方のCSPGリピートに位置した(図6B及び6C)。最初のCSPGリピートは、既知のTcdB結合部位(11)であり、最後の2つのリピートは新た発見されたものである。重要なことに、上記のHBEGFおよびANTXR1の両方とは異なり、ほとんどの情報データは欠失突然変異に由来し、CSPG4にはT778に影響を及ぼす高度に濃縮されているミスセンス点突然変異が存在しおり(図6B)、このアミノ酸がTcdB毒性を媒介する受容体にとって重要であることを示している。
抗がん剤ターゲットをコードする3つの遺伝子について、HPRT1は非必須遺伝子であり、PLK1およびPSMB5は2つの必須遺伝子(19)である。非必須ターゲットHPRT1について、ライブラリーの6-TGスクリーニングは、ほとんどのsgRNAが濃縮され、均一に分布しており(図8A)、細菌毒素スクリーニングからのものと同様の結果を示した(図3A、5A、6A)。タンパク質全体における各アミノ酸の重要な役割が完全に埋められる。CRESMAS方法は、6-TGに対する細胞の感受性の媒介において、HPRT1の機能にとって重要な多くの部位が存在することを示した(図8B)。この観察結果は、四量体HPRT1の既知の構造と一致し、必須性スコアの高い部位の分布も一致した(図8C)(12)
必須のターゲットであるPLK1およびPSMB5について、sgRNAシークエンシングは、sgRNAのインフレーム突然変異が発生した何らかの重要なアミノ酸のおおよその位置を確実に提供した(図9Aおよび図10A)。sgRNA濃縮は間接的な証拠を提供し、解像度が低いため、本発明者らは、CRESMASポリシーが、より正確でより包括的なグラフをより詳細に明らかにすると考える。実際には、PSMB5およびPLK1において、タンパク質機能に重要なより多くのアミノ酸が高精度で同定された(図9Bおよび図10B)。注目すべきことに、最終的なスクリーニング結果は、ミスセンス突然変異および可変数の欠失を含み、両方の場合での最も高い必須アミノ酸が、必須性スコアに基づいて得られた(図9Cおよび図10C)。ここでも、本発明者らは、PSMB5におけるBortezomibと相互作用した既知の重要部位(R78、T80、M104、A108、C122、およびG242)(20-22)および新規の必須残基(図9B-C)を同定した。同様に、本発明者らは、BI2536-PLK1相互作用にとって重要な既
知の残基R136(22、23)および新規の必須残基F183(図10B-C)を同定した。
ミスセンス点突然変異は、PSMB5およびPLK1に薬物耐性を付与する主な形態であるため、本発明者らは、ssODN媒介の方法 (24) を用いて、欠失ではなく特定の点突然変異を生成して検証に用いることと決定した。本発明者らは、PSMB5中の9個のアミノ酸残基(R78、T80、V90、M104、A108、D110、C111、C122、およびG242)を選択し、対照としてD110C111を含めた。点突然変異のための適切なアミノ酸を選択するために、スクリーニング結果または以前に報告された突然変異型からのが好ましい。残りについては、全ての置換をアラニンにした(表2)。以下のいずれかの突然変異を含むドナーでトランスフェクトされた細胞は、可変数のボルテゾミブ耐性コロニーであるR78N、T80A、V90A、M104A、A108T、C122F、およびG242Dを生成した(図9D)。対照的に、D110AおよびC111Aはボルテゾミブ耐性コロニーを生成することができず、これは、本発明者らの検証方法が信頼できることを示している(図9D)。興味深いことに、本発明者らのスクリーニングおよび検証結果とはなり、SW1573およびCEM(21、25)においてC111部位がPSMB5にとって重要であることが以前に報告された(図9D)。この違いは、アミノ酸の作用が生物学的環境から影響を受けること、または耐性表現型生成のために正しいアミノ酸置換を生成することができないことを示す。ボルテゾミブ耐性のプールされた細胞を検証するために、本発明者らは、遺伝子座を標的とするゲノム領域をシークエンシングし、これらの全て7つの部位が予想される突然変異を含むことを確
認した(図11および表3)。本発明者らの結果をさらに検証するために、本発明者らは、いくつかの突然変異ライブラリーから個々のクローンを単離し(図12)、細胞生存アッセイを行った。点突然変異のR78N、V90L、A108T、C122F、およびG242Dがボルテゾミブに耐性を付与することを証明した(図9E)。これらのうち、T80およびA108はPSMB5とボルテゾミブ(20-22)の直接結合に関与し、R78、M104およびC122の突然変異は、薬物結合部位構造を破壊することによってボルテゾミブに耐性(22、26、27)を付与することが報告された。G242は、メカニズムはまだ不明であるが、ボルテゾミブ感受性に関連する別の既知の部位であ 27)。V90部位は新たな発見である。本発明者らは、2つの独立したV90Lクローンを選択し、両者は全て薬物耐性を付与した。V90が薬物感受性をどのように媒介するか、V90突然変異がボルテゾミブ結合ポケット(binding pocket)の周囲の構造を変化させるかどうかは、まだ決定されていない。
PLK1について、本発明者らは、2つの上位にある残基(R136、F183)および1つの潜在的な偽陰性部位(C67)を検証した。報告によれば、R136はBI2536の重要なアミノ酸であり、PLK1とBI2536との結合時、F183が構造的に重要である(22、23)。これらの3つの部位の1つにおける点突然変異は、プールされたアッセイにおいてBI2536に抵抗性を付与した(図10D)。
ミスセンス突然変異については、各アミノ酸は19種の非同義置換を有する。本発明者らは、異なる置換が異なる効果を有し得るが、いくつかの変化が表現型の差異を生じ得ないと仮定する。CRESMASポリシーがこのような詳細を生成できるかどうかを調べるために、本発明者らは、各PSMB5およびPLK1スクリーニングから最初の10個のヒットのミスセンス突然変異データを検索し、アミノ酸パターン分析を行った。本発明者らは、これらのアミノ酸の明確なパターン選好を明らかにし、何らかの置換のみが細胞に薬物耐性を付与し得ることを示した(図13A-B)。ほとんどの部位における複数の置換は、薬物阻害の致死作用を回避することができ、例えばV90PSMB5およびA386PK1(図13C-D)が挙げられ、いくつかの部位における単一の特定の置換のみは薬物耐性を付与することができ、例えば、PSMB5についてはM104IおよびC122Yが挙げられ(図13E)、PLK1についてはF183Lが挙げられる(図13F)。R136GPLK1は、唯一の突然変異型ではないが、BI2536細胞に耐性を付与する主要な形態である(図13F)。同様に興味深いことに、PSMB5、A105、およびA43のうち2つの部位が非常に類似した突然変異選好パターンを有し(図13G)、そのPearson相関係数が0.54である(図13H)ことが留意される。
要するに、CRESMASは配列-機能マッピングを生成する強力な方法である。トランケーション突然変異誘発を使用して潜在的な機能ドメインを同定することは、通常、非常に面倒であり、タンパク質のサイズが大きすぎると、ますます困難になる。目的タンパク質の全長にわたる各アミノ酸の意味を評価することは、不可能ではないにしても技術的に困難である。最近、Gills及び共同研究者らは、細菌又は酵母において目的タンパク質の機能関連突然変異をマッピングする方法を記載したが、この方法は、相同組換え率に大きく依存し、高等真核生物におけるその効率的な適用を妨げる(28)。大型タンパク質を処理する場合、CRESMASは非常に強力である。さらに、複数の遺伝子を同時にスキャンして、その対応するタンパク質の機能エレメントを得ることができる。
CRISPR飽和突然変異誘発は、各アミノ酸を網羅する多重突然変異を提供する。多くの他の方法とは異なり、インフレームまたは点突然変異の方面においてごくわずかな割合のNGSデータのみがCRESMASに有用なリードである。本発明者らは、データ前処理中に大量のリードをフィルタリングしたが、本発明者らのバイオインフォマティクスプロセスが十分に高感度であり、中程度のシークエンシング深度で残りのリードから機能エレメントをマッピングできることを見出した。本発明者らが全て6つのアッセイにおいてタンパク質機能に重要なアミノ酸の大部分を同定できるという事実は、CRESMASが低い偽陰性率を有することを示す。
CRESMAS方法は突然変異によりタンパク質機能を消失させるすべての残基を潜在的に発見する可能性がある。しかしながら、これは、CRESMASスクリーニングから得られた各ヒットがタンパク質機能に直接関連することを意味しない。いくつかの残基は、所のタンパク質の全体構造にとって重要であるが、タンパク質の酵素活性またはその相互作用パートナーとの接触を直接媒介しない場合がある。例えば、本発明者らは、毒素のエンドサイトーシスに直接関与することなく受容体機能を維持する重要な領域であるANTXR1の膜貫通ドメイン内に位置する複数のヒット(図5B)を同定した。
CRESMASポリシーは、単なるタンパク質の研究に限定されない。それはまた、ノンコーディングRNA、プロモーターおよびエンハンサーなどの調節エレメントの機能を得るのに非常に適している。解決手段の補正は、上記のcDNA上ではなくゲノム上の標的化領域上でのPCR増幅である。

Claims (42)

  1. ゲノム配列の機能的エレメントを同定するためのライブラリーであって、複数のCRISPR-CasシステムガイドRNAを含み、前記ガイドRNAは、少なくとも1つの連続ゲノム領域内の複数のゲノム配列を標的とすることができるガイド配列を含み、前記ガイドRNAは、100個以上のゲノム配列を標的とし、前記ゲノム配列には、前記連続ゲノム領域の1000塩基対ごとにPAM配列の上流にある非重複切断部位を含む、ライブラリー。
  2. 前記ライブラリーは前記連続するゲノム領域内の各PAM 配列の上流にあるゲノム配列を標的とするガイドRNAを含む、請求項1に記載のライブラリー。
  3. 各ガイドRNA が、DSB 部位の周囲約10bp に影響を及ぼすように設計されている、請求項1または2に記載のライブラリー。
  4. 前記PAM配列が少なくとも1つのCasタンパク質に特異的である、請求項1から3のいずれか一項に記載のライブラリー。
  5. 前記CRISPR-CasシステムガイドRNAが、少なくとも1つのCasタンパク質に特異的な複数のPAM配列に基づいて選択される、請求項1から4のいずれか一項に記載のライブラリー。
  6. 前記標的が、前記連続ゲノム領域のNHEJ をもたらす、請求項1から5のいずれか一項に記載のライブラリー。
  7. 前記複数のCRISPR-Cas システムガイドRNA のうちの少なくとも一つのガイドRNAの前記標的は、細胞表現型を変化させ、および/または遺伝子の転写および/または発現を増加または減少させる、請求項1から6のいずれか一項に記載のライブラリー。
  8. プラスミドライブラリー又はウイルスライブラリーである、請求項1から7のいずれか一項に記載のライブラリー。
  9. ベクターライブラリー又は宿主細胞ライブラリーである、請求項1から7のいずれか一項に記載のライブラリー。
  10. ゲノム配列の機能的エレメントを同定する方法であって、
    (a) 前記請求項のいずれか1項に記載のライブラリーを、各細胞が1つ以下のガイドRNAを含む、少なくとも1つのCasタンパクを含むことに適合する細胞集団に導入すること;
    (b) 細胞表現型の変化に基づいて前記細胞を少なくとも二つのグループに選別すること;
    (c) 各グループにガイドRNA の相対的な表現を決定し、それによって各グループに存在するガイドRNAの表現によって前記細胞表現型の変化に関連するゲノム部位を決定すること;
    (d) シークエンシングのために、標的遺伝子の1つまたは複数のcDNAまたはDNA配列を増幅すること、
    (e) シークエンシングリードを前記標的遺伝子の参照配列にマッピングすること;
    (f) 前記リードをフィルターし、ミスセンス突然変異またはインフレーム欠失を有するリードのみを残すこと;および
    (g) バイオインフォマティクスプロセスを適用することにより、前記細胞の表現型に対する各アミノ酸またはヌクレオチドの重み付けが決定されること、を含む、方法。
  11. 前記細胞表現型の変化は、機能の喪失、機能の獲得、遺伝子転写の減少、遺伝子転写の増加、遺伝子発現の減少および遺伝子発現の増加からなる群から選択される、請求項10に記載の方法。
  12. 前記ゲノム配列が機能性タンパク質をコードするために使用される、請求項10又は11に記載の方法。
  13. 単一アミノ酸分解能で前記タンパク質の機能的エレメントを同定するために使用される、請求項12に記載の方法。
  14. 前記ゲノム配列が、非コードRNAまたは遺伝子調節的エレメントをコードするために使用される、請求項10または11に記載の方法。
  15. 前記遺伝子調節的エレメントが、プロモーター又はエンハンサーである、請求項14に記載の方法。
  16. 前記同定が天然の生物学的背景にある、請求項10~15のいずれか一項に記載の方法。
  17. 前記バイオインフォマティクスフローは
    (h) ミスセンス突然変異を含む断片について、各アミノ酸の突然変異比率を以下のように計算する:
    Figure 2022537477000027
    (i)インフレーム欠失を含む断片について、各アミノ酸の欠失比率を以下のように計算する:
    Figure 2022537477000028
    (j) インフレーム欠失をデコードし、アミノ酸欠失の数により、単一のアミノ酸欠失のみであれば「運転者の欠失」、複数のアミノ酸欠失であれば「乗客の欠失」としてインフレーム欠失を分類する;
    (k) 実験群と対照群との間の倍数変化を計算する、
    (l) 各アミノ酸の必須性スコアを以下のように算出する:
    (1) 突然変異倍数変化については、全ての倍数変化に基づいてヌル分布を確立し、各アミノ酸についてスコア突然変異=-log 10(P 値)を計算する、
    (2) 欠失の倍数変化に対し、まず調整可能なパラメーターαを適用して、運転者の欠失と乗客の欠失に次のように重み付けを付ける:
    欠失倍数変化=運転者の倍数変化+α*乗客の倍数変化、続いて、100回並べ替えてヌル分布を確立し、且つアミノ酸ごとにスコア欠失=-log 10(P 値)を計算する、
    (3)スコア突然変異及びスコア欠失を以下のように正規化する:
    Figure 2022537477000029
    (4) スコア突然変異及びスコア欠失の重み付けを計算する:
    a =欠失の倍数変化>1のアミノ酸の数
    b =突然変異の倍数変化>1のアミノ酸の数
    Figure 2022537477000030
    (5) 必須性スコアの計算は
    必須スコア=wGHIJIKLM*スコアGHIJIKLM+wSTUTIKLM*スコアSTUTIKLM
    である、ことを含み、請求項10~16のいずれか一項に記載の方法。
  18. 薬物又は毒素の耐性に関連する機能的エレメントをスクリーニングする方法であって、
    (a) 前記請求項のいずれか1項に記載のライブラリーを、各細胞が1つ以下のガイドRNAを含む、少なくとも1つのCasタンパクを含むことに適合する細胞集団に導入すること;
    (b) 前記薬物又は毒素で前記細胞集団を処理し且つ前記薬物又は毒素に対する耐性の変化に基づいて細胞を少なくとも二つのグループに分類すること;
    (c) 各グループにガイドRNA の相対的な表現を決定し、それによって各グループに存在するガイドRNAの表現によって前記耐性の変化に関連するゲノム部位を決定すること;
    (d) シークエンシングのために、標的遺伝子の1つまたは複数のcDNAまたはDNA配列を増幅すること、
    (e) シークエンシングリードを前記標的遺伝子の参照配列にマッピングすること;
    (f) 前記リードをフィルターし、ミスセンス突然変異またはインフレーム欠失を有するリードのみを残すこと;および
    (g) バイオインフォマティクスプロセスを適用することにより、前記薬物または毒素に対する各アミノ酸またはヌクレオチドの耐性の重み付けを決定されること、を含む方法。
  19. 前記ゲノム配列が、機能性タンパク質をコードするものである、請求項18に記載の方法。
  20. 単一アミノ酸分解能で前記タンパク質の機能的エレメントを同定するために使用される、請求項19に記載の方法。
  21. 前記ゲノム配列が、ノンコーディングRNAまたは遺伝子調節的エレメントをコードするために使用される、請求項18に記載の方法。
  22. 前記遺伝子調節的エレメントが、プロモーター又はエンハンサーである、請求項21に記載の方法。
  23. 前記同定が天然の生物学的背景にある、請求項18~22のいずれか一項に記載の方法。
  24. 前記細胞集団が、少なくとも一つの連続ゲノム領域内の複数のゲノム配列を標的とすることが可能なガイド配列を含む複数のガイドRNA に導入され、前記ガイドRNA が、連続するゲノム領域内の1000塩基対ごとのPAM配列の上流にある非重複切断部位を含む。連続ゲノム領域内の1000塩基対ごとのPAM配列の上流にある非重複切断部位を含むなくとも100のゲノム配列を標的とする、請求項18~23のいずれか一項に記載の方法。
  25. 各ガイドRNA が、DSB 部位の周囲約10bp に影響を及ぼすように設計される、請求項24に記載の方法。
  26. 前記PAM 配列が、少なくとも一つのCas タンパク質に特異的である、請求項24または25に記載の方法。
  27. 前記CRISPR-CasシステムのガイドRNAは、少なくとも1つのCasタンパク質に特異性的な複数のPAM配列に基づいて、選択される、請求項24~26のいずれか一項に記載の方法。
  28. 前記バイオインフォマティクスパイプラインが
    (h) ミスセンス突然変異を含む断片について、各アミノ酸の突然変異比率を以下のように計算する:
    Figure 2022537477000031
    (i)インフレーム欠失を含む断片について、各アミノ酸の欠失比率を以下のように計算する:
    Figure 2022537477000032
    (j) インフレーム欠失をデコードし、またアミノ酸欠失の数により、単一のアミノ酸欠失のみであれば「運転者の欠失」、複数のアミノ酸欠失であれば「乗客の欠失」としてインフレーム欠失を分類する、
    (k) 実験群と対照群との間の倍数変化を計算する、
    (l) 各アミノ酸の必須性スコアを以下のように算出する:
    (1) 突然変異倍数変化については、全ての倍数変化に基づいてヌル分布を確立し、各アミノ酸についてスコア突然変異=-log 10(P 値)を計算する、
    (2) 欠失の倍数変化に対し、まず調整可能なパラメーターαを適用して、欠失した運転者と欠失した乗客に次のように重みを付ける:
    欠失倍数変化=運転者の倍数変化+α*乗客の倍数変化、続いて、100回並べ替えてヌル分布を確立し、且つアミノ酸ごとにスコア欠失=-log 10(P 値)を計算する、
    (3) スコア突然変異及びスコア欠失を以下のように正規化する:
    Figure 2022537477000033
    (4) スコア突然変異及びスコア欠失の重み付けを計算する:
    a =欠失倍数変化>1のアミノ酸の数
    b =突然変異の倍数変化>1のアミノ酸の数
    Figure 2022537477000034
    (5) 必須性スコアの計算は
    必須性スコア=wGHIJIKLMGHIJIKLM + wSTUTIKLM*スコアSTUTIKLMであること、を含む、請求項18~27のいずれか一項に記載の方法。
  29. 目的タンパク質の機能的エレメントを同定する方法であって、細胞集団に導入されたCRISPR-Casシステムを用いて前記目的タンパク質をコードするゲノム遺伝子を破壊することで、前記目的タンパク質に飽和突然変異誘発を行い、標的遺伝子のDNA およびcDNA をシークエンシングすることにより表現型の変化に関連する破壊されたゲノム部位を決定し、前記表現型の変化を引き起こすインフレーム突然変異を検索すること、および単一のアミノ酸分解能で前記目的タンパク質の機能的エレメントを同定するためのバイオインフォマティクスプロセスを確立することを含む、方法。
  30. 前記目的タンパク質の機能的エレメントは、その天然の生物学的背景において同定される、請求項29に記載の方法。
  31. インフレーム突然変異が、インフレーム欠失及びミスセンス部位特異的突然変異である、請求項29又は30に記載の方法。
  32. 前記細胞表現型の変化は、機能の喪失、機能の獲得、遺伝子転写の減少、遺伝子転写の増加、遺伝子発現の減少および遺伝子発現の増加からなる群から選択される、請求項29~31のいずれか一項に記載の方法。
  33. 単一アミノ酸分解能で前記タンパク質の機能的エレメントを同定するための、請求項29~32のいずれか一項に記載の方法。
  34. 前記破壊は前記細胞集団内の各細胞に一つ又は複数のベクターのベクターシステムを導入することを含み、前記ベクターシステムが、
    I. 調節的エレメントに作動可能に連結されたCas タンパク質またはCas タンパク質をコードするポリヌクレオチド配列、および
    II. 前記目的タンパク質をコードするゲノム遺伝子を標的とするガイドRNAを、含む、操作された非天然のCRISPR-Casシステムを含み、
    成分IとIIは同じまたは異なるベクター上にあり、それらが転写されると、ガイド配列を含むガイドRNAがCRISPR-Casシステムとゲノム遺伝子の標的配列とは特異的に結合するようにガイドし、前記Casタンパク質によるゲノム領域の切断を誘導する、請求項29~33のいずれか一項に記載の方法。
  35. 前記1つまたは複数のベクターはプラスミドベクターである、請求項34に記載の方法。
  36. 前記調節的エレメントが、誘導性プロモーターである、請求項34または35に記載の方法。
  37. 前記集団内の各細胞が一つ以下のガイドRNA を含み、前記細胞集団に導入された複数のガイドRNA が、前記目的タンパク質をコードする少なくとも1つの連続ゲノム領域内の複数のゲノム配列を標的とすることができるガイド配列を含み、そのガイドRNAは、100個以上のゲノム配列を標的とし、前記ゲノム配列には、前記連続ゲノム領域の1000塩基対ごとにPAM配列の上流にある非重複切断部位を含む、請求項29~36のいずれか一項に記載の方法。
  38. 各ガイドRNA が、DSB 部位の周囲約10bp に影響を及ぼすように設計される、請求項37に記載の方法。
  39. 前記PAM 配列が、少なくとも一つのCas タンパク質に特異的である、請求項37または38に記載の方法。
  40. 前記CRISPR-CasシステムのガイドRNA が、少なくとも一つのCas タンパク質に特異的な複数のPAM 配列に基づいて選択される、請求項29~39のいずれか一項に記載の方法。
  41. 前記バイオインフォマティクスフローは
    前記バイオインフォマティクスツールを用いて、シークエンシングリードを標的遺伝子の参照配列にマッピングする、
    リードをフィルターし、ミスセンス突然変異またはインフレーム欠失を有するリードのみを残す、
    ミスセンス突然変異を含む断片について、各アミノ酸の突然変異比率を以下のように計算する:
    Figure 2022537477000035
    ii )インフレーム欠失を含む断片について、各アミノ酸の欠失比率を以下のように計算する:
    Figure 2022537477000036
    ii )インフレーム欠失をデコードし、アミノ酸欠失の数により、単一のアミノ酸欠失のみであれば「運転者の欠失」、複数のアミノ酸欠失であれば「乗客の欠失」としてインフレーム欠失を分類する、
    iii )実験群と対照群との間の倍数変化を計算する、
    iv )各アミノ酸の必須性スコアを以下のように算出する:
    (1) 突然変異倍数変化については、全ての倍数変化に基づいてヌル分布を確立し、各アミノ酸についてスコア突然変異=-log 10(P 値)を計算する、
    (2) 欠失の倍数変化に対し、まず調整可能なパラメーターαを適用して、欠失した運転者と欠失した乗客に次のように重みを付ける:
    欠失倍数変化=運転者の倍数変化+α*乗客の倍数変化、続いて、100回並べ替えてヌル分布を確立し、且つアミノ酸ごとにスコア欠失=-log 10(P 値)を計算する、
    (3) スコア突然変異及びスコア欠失を以下のように正規化する:
    Figure 2022537477000037
    (4) スコア突然変異及びスコア欠失の重み付けを計算する:
    a =欠失の倍数変化>1のアミノ酸の数
    b =突然変異の倍数変化>1のアミノ酸の数
    Figure 2022537477000038
    (5) 必須性スコアの計算は
    必須性スコア=wGHIJIKLMGHIJIKLM + wSTUTIKLM*スコアSTUTIKLMであることを含む、請求項29~40のいずれか一項に記載の方法。
  42. 必須スコアに基づいてアミノ酸の機能的重要度に基づいてアミノ酸をランク付けすることをさらに含む、請求項41に記載の方法。
JP2021557446A 2019-03-26 2020-03-26 機能的エレメントの同定方法 Pending JP2022537477A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN2019079729 2019-03-26
CNPCT/CN2019/079729 2019-03-26
PCT/CN2020/081283 WO2020192712A1 (en) 2019-03-26 2020-03-26 Method for identifying functional elements

Publications (1)

Publication Number Publication Date
JP2022537477A true JP2022537477A (ja) 2022-08-26

Family

ID=72611084

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021557446A Pending JP2022537477A (ja) 2019-03-26 2020-03-26 機能的エレメントの同定方法

Country Status (8)

Country Link
US (1) US20220186210A1 (ja)
EP (1) EP3947788A4 (ja)
JP (1) JP2022537477A (ja)
KR (1) KR20220004980A (ja)
CN (1) CN113939617A (ja)
AU (1) AU2020248911B2 (ja)
CA (1) CA3134400A1 (ja)
WO (1) WO2020192712A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3663310A4 (en) 2017-08-04 2021-08-11 Peking University TALE-RVD WITH SPECIFIC DETECTION OF A DNA BASE MODIFIED BY METHYLATION AND APPLICATION OF IT
US11624077B2 (en) 2017-08-08 2023-04-11 Peking University Gene knockout method
CR20220063A (es) 2019-07-12 2022-07-22 Univ Beijing Edición de ácido ribonucleico (arn) dirigido aprovechando la adenosina desaminasa que actúa sobre ácido ribonucleico endógeno (adar) utilizando ácidos ribonucleicos (arn) modificados genéticamente
KR20240003760A (ko) * 2022-06-29 2024-01-09 서울대학교산학협력단 RNA 안정성 또는 mRNA 번역 증가용 신규 조절 엘리먼트,이와 상호작용하는 ZCCHC2, 및 이들의 용도

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016182893A1 (en) * 2015-05-08 2016-11-17 Teh Broad Institute Inc. Functional genomics using crispr-cas systems for saturating mutagenesis of non-coding elements, compositions, methods, libraries and applications thereof
WO2017219027A1 (en) * 2016-06-17 2017-12-21 The Broad Institute Inc. Type vi crispr orthologs and systems
JP2018524018A (ja) * 2015-05-08 2018-08-30 ザ チルドレンズ メディカル センター コーポレイション 胎児型ヘモグロビン再誘導のための、bcl11aエンハンサー機能性領域を標的とする方法
WO2018191388A1 (en) * 2017-04-12 2018-10-18 The Broad Institute, Inc. Novel type vi crispr orthologs and systems

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016182893A1 (en) * 2015-05-08 2016-11-17 Teh Broad Institute Inc. Functional genomics using crispr-cas systems for saturating mutagenesis of non-coding elements, compositions, methods, libraries and applications thereof
JP2018524018A (ja) * 2015-05-08 2018-08-30 ザ チルドレンズ メディカル センター コーポレイション 胎児型ヘモグロビン再誘導のための、bcl11aエンハンサー機能性領域を標的とする方法
WO2017219027A1 (en) * 2016-06-17 2017-12-21 The Broad Institute Inc. Type vi crispr orthologs and systems
WO2018191388A1 (en) * 2017-04-12 2018-10-18 The Broad Institute, Inc. Novel type vi crispr orthologs and systems

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
細胞, vol. 51, no. 3, JPN6023022007, 20 March 2019 (2019-03-20), pages 21 - 24, ISSN: 0005077616 *

Also Published As

Publication number Publication date
AU2020248911B2 (en) 2022-12-15
US20220186210A1 (en) 2022-06-16
EP3947788A1 (en) 2022-02-09
AU2020248911A1 (en) 2021-11-04
CN113939617A (zh) 2022-01-14
EP3947788A4 (en) 2022-06-08
WO2020192712A1 (en) 2020-10-01
KR20220004980A (ko) 2022-01-12
CA3134400A1 (en) 2020-10-01

Similar Documents

Publication Publication Date Title
US11098326B2 (en) Using RNA-guided FokI nucleases (RFNs) to increase specificity for RNA-guided genome editing
JP2022537477A (ja) 機能的エレメントの同定方法
KR102598819B1 (ko) 서열결정에 의해 평가된 DSB의 게놈 전체에 걸친 비편향된 확인 (GUIDE-Seq)
US10011850B2 (en) Using RNA-guided FokI Nucleases (RFNs) to increase specificity for RNA-Guided Genome Editing
CN113646434B (zh) 使用加标签的向导rna构建体进行高效基因筛选的组合物和方法
JP2018532419A (ja) CRISPR−Cas sgRNAライブラリー
CN110520528A (zh) 高保真性cas9变体及其应用
JP7308380B2 (ja) 遺伝子編集技術を用いたインビトロ部位特異的変異導入のための方法
EP3519570B1 (en) Method to analyze and optimize gene editing modules and delivery approaches
JP2019514379A (ja) Rna誘導型ヌクレアーゼ活性のインビボ高スループット評価のための方法
Moyer et al. Generation of a conditional analog-sensitive kinase in human cells using CRISPR/Cas9-mediated genome engineering
Malina et al. Adapting CRISPR/Cas9 for functional genomics screens
Karagyaur et al. Practical recommendations for improving efficiency and accuracy of the CRISPR/Cas9 genome editing system
Escudero et al. Primary and promiscuous functions coexist during evolutionary innovation through whole protein domain acquisitions
CN114729011A (zh) 新型crispr dna靶向酶及系统
US20190218544A1 (en) Gene editing, identifying edited cells, and kits for use therein
Cebrailoglu et al. CRISPR-Cas: removing boundaries of the nature
CN111748848B (zh) 鉴定功能元件的方法
WO2024119052A2 (en) Genomic cryptography
Escudero García-Calderón et al. Primary and promiscuous functions coexist during evolutionary innovation through whole protein domain acquisitions
US20060123491A1 (en) Method for a (high through-put) screening detection of genetic modifications in genome engineering

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220509

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220509

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230606

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20240109