JP2022023144A - 遺伝子発現調節のための人為的なゲノム操作 - Google Patents

遺伝子発現調節のための人為的なゲノム操作 Download PDF

Info

Publication number
JP2022023144A
JP2022023144A JP2021170086A JP2021170086A JP2022023144A JP 2022023144 A JP2022023144 A JP 2022023144A JP 2021170086 A JP2021170086 A JP 2021170086A JP 2021170086 A JP2021170086 A JP 2021170086A JP 2022023144 A JP2022023144 A JP 2022023144A
Authority
JP
Japan
Prior art keywords
gene
sequence
nucleic acid
domain
array
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021170086A
Other languages
English (en)
Other versions
JP7440043B2 (ja
JP2022023144A5 (ja
Inventor
ジュン キム、セオク
Seok Joong Kim
ウー ソン、ドン
Dong Woo Song
ヨン リー、ジェ
Jae Yong Lee
ミン リー、ジュン
Jung Min Lee
ボン チョ、ギュ
Gyu Bon Cho
スク ベ、ヒー
Hee Sook Bae
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toolgen Inc
Original Assignee
Toolgen Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toolgen Inc filed Critical Toolgen Inc
Publication of JP2022023144A publication Critical patent/JP2022023144A/ja
Publication of JP2022023144A5 publication Critical patent/JP2022023144A5/ja
Application granted granted Critical
Publication of JP7440043B2 publication Critical patent/JP7440043B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1138Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against receptors or cell surface proteins
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/10Applications; Uses in screening processes
    • C12N2320/11Applications; Uses in screening processes for the determination of target sites, i.e. of active nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/30Special therapeutic applications
    • C12N2320/34Allele or polymorphism specific uses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Virology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Cell Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

【課題】重複遺伝子の発現を制御するための発現制御組成物、およびそれを使用する方法を提供する。【解決手段】重複遺伝子の発現を制御するための発現制御組成物、またはそれを使用する方法に関し、より具体的には、重複遺伝子の転写調節領域を標的とすることができるガイド核酸を含む発現制御組成物、ならびに重複遺伝子の転写調節領域を人為的に操作および/または修飾することにより重複遺伝子の発現を制御する方法に関する。加えて、本発明は、重複遺伝子の発現を制御するための発現制御組成物を使用して、遺伝子重複によって引き起こされる疾患を治療または改善する方法に関する。【選択図】図5

Description

本発明は、重複遺伝子の発現を制御するための発現制御組成物、およびそれを使用する方法に関する。より具体的には、本発明は、重複遺伝子の転写調節領域を標的とすることができるガイド核酸を含む発現制御組成物、ならびに発現制御組成物を使用して重複遺伝子の転写調節領域を人為的に操作および/または修飾することにより重複遺伝子の発現を制御する方法に関する。加えて、本発明は、重複遺伝子の発現を制御するための発現制御組成物を使用して、遺伝子重複によって引き起こされる疾患を治療または改善する方法に関する。
遺伝子重複は、染色体の遺伝子組換えで生じるエラーの1つであり、染色体の部分領域を複製する複製現象である。遺伝子重複とは、次世代に継代される変異の一種である。遺伝子重複は、染色体の部分領域の非複製に起因する遺伝子欠失とともに、遺伝子発現に影響を及ぼす。
遺伝子重複は、遺伝性疾患も引き起こす。代表的には、シャルコー・マリー・トゥース病(Charcot-Marie-Tooth)(CMT)1A型は、染色体の特異領域で起こる遺伝子重複から生じ、手足の末梢神経発達に関与する遺伝子の過剰発現は、遺伝子重複に起因して起こり、ひいては手足の奇形の原因となる。
したがって、遺伝子が、適切な位置、ならびに細胞増殖、死、老化および分化などの生物学的プロセスが正常に機能する適切な時期に発現されることが重要である。不適切な時期と位置で遺伝子が不適切に発現される場合、特に、遺伝子重複によって引き起こされる異常な遺伝子発現は疾患につながる可能性があるため、各遺伝子の発現を制御する分子のメカニズムを理解する必要があるのと、各遺伝子に関連する転写調節因子を同定することが重要である。遺伝子発現を正確に制御できるさまざまな転写調節因子、たとえば、プロモーター、遠位制御エレメント、および転写因子、アクチベーター、およびコアクチベーターであって、遺伝子発現の制御に関与するものがある。
遺伝子発現は、転写調節因子の変化により制御される可能性があり、転写調節因子の異常な変化は、遺伝子の異常発現を引き起こし、それによって疾患を誘導する可能性がある。したがって、転写調節因子の変化は、さまざまな疾患を引き起こしたり、疾患を改善および治療したりする可能性がある。
しかしながら、転写調節因子を制御する現在の方法は、一時的な遺伝子発現のみを制御し、継続的な遺伝子発現調節は困難である。このため、遺伝子発現の異常性または困難性に起因する疾患を治療するための基本的な治療法はない。したがって、遺伝子編集または転写調節因子の修飾により、より継続的な治療効果を示す方法が必要とされている。
1.Hamdan,H.,Kockara,N.T.,Jolly,L.A.,Haun,S.,and Wight,P.A.(2015).Control of human PLP1 expression through transcriptional regulatory elements and alternatively spliced exons in itron 1.ASN Neuro 7. 2.Hamdan,H.,Patyal,P., Kockara,N.T.,and Wight,P.A.(2018).The wmN1 enhancer region in itron 1 is required for expression of human PLP1.Glia. 3.Meng,F.,Zolova,O.,Kokorina,N.A.,Dobretsova,A.,and Wight,P.A.(2005).Characterization of an itronic enhancer that regulates myelin proteolipid protein(Plp)gene expression in oligodendrocytes.J Neurosci Res 82,346-356. 4.Tuason,M.C.,Rastikerdar,A.,Kuhlmann,T.,Goujet-Zalc,C.,Zalc,B.,Dib,S.,Friedman,H.,and Peterson,A.(2008).Separate proteolipid protein/DM20 enhancers serve different lineages and stages of development.J Neurosci 28,6895-6903. 5.Wight,P.A.(2017).Effects of itron 1 Sequences on Human PLP1 Expression:Implications for PLP1-Related Disorders.ASN Neuro 9,1759091417720583.
開示
技術的課題
本発明は、細胞のゲノムに存在する重複遺伝子の発現を制御するための発現制御組成物を提供することに関する。
本発明はまた、真核細胞のゲノムに存在する重複遺伝子の発現を制御する方法を提供することに関する。
本発明はまた、発現制御組成物を使用して遺伝子重複疾患を治療する方法を提供することに関する。
技術的解決策
上記の目的を達成するために、本発明は、細胞のゲノムに存在する重複遺伝子の発現を制御するための発現制御組成物に関する。より具体的には、本発明は、重複遺伝子の転写調節領域を標的とすることができるガイド核酸を含む発現制御組成物、ならびに発現制御組成物を使用して重複遺伝子の転写調節領域を人為的に操作および/または修飾することにより重複遺伝子の発現を制御する方法に関する。加えて、本発明は、重複遺伝子の発現を制御するための発現制御組成物を使用して、遺伝子重複によって引き起こされる疾患を治療または改善する方法に関する。
本発明は、細胞のゲノムに存在する重複遺伝子の発現を制御するための発現制御組成物を提供する。
一態様では、発現制御組成物は、以下のものを含み得る。
重複遺伝子の転写調節領域に存在する標的配列を標的とすることができるガイド核酸またはそれをコードする核酸;および
1つまたは複数のエディタータンパク質またはそれをコードする核酸。ガイド核酸は、重複された遺伝子の転写調節領域に存在する標的配列を標的とすることができるガイドドメイン
ここで、ガイドドメインは、重複された遺伝子の転写調節領域に存在する標的配列のガイド核酸結合配列と相補的な結合を形成することができるヌクレオチド配列を含み得る。
ここで、ガイドドメインは、重複された遺伝子の転写調節領域内の標的配列のガイド核酸結合配列と相補的な結合を形成し得る。
ここで、相補的な結合は、0~5つのミスマッチ結合を含み得る。
ガイド核酸は、第1の相補的ドメイン、第2の相補的ドメイン、近位ドメインおよびテールドメインからなる群より選択される1つまたは複数のドメインを含み得る。
エディタータンパク質はCRISPR酵素であり得る。
ガイド核酸とエディタータンパク質は、ガイド核酸-エディタータンパク質複合体を形成し得る。
ここで、ガイド核酸-エディタータンパク質複合体は、ガイド核酸の部分核酸をエディタータンパク質の部分アミノ酸と相互作用させることにより形成され得る。
転写調節領域は、プロモーター領域、エンハンサー領域、サイレンサー領域、インシュレーター領域および遺伝子座制御領域(LCR)からなる群より選択される1つまたは複数の領域であり得る。
標的配列は、重複遺伝子の転写調節領域に位置する連続した10~25nt(ヌクレオチド)配列であり得る。
標的配列は、重複遺伝子のプロモーター領域内またはそれに隣接して位置する連続した10~25ヌクレオチド配列であり得る。
ここで、標的配列は、重複遺伝子のコアプロモーター領域内またはそれに隣接して位置する連続した10~25ヌクレオチド配列であり得る。ここで、標的配列は、重複遺伝子のコアプロモーター領域のTATAボックス領域を含む連続した10~25ヌクレオチド配列、またはTATAボックス領域に隣接して位置する連続した10~25ヌクレオチド配列であり得る。
ここで、標的配列は、重複遺伝子のコアプロモーター領域に存在する5'-TATA-3'配列の全体または一部を含む連続した10~25ヌクレオチド配列であり得る。
ここで、標的配列は、重複遺伝子のコアプロモーター領域に存在する5'-TATAWAW-3'(W=AまたはT)配列の全体または一部を含む連続した10~25ヌクレオチド配列であり得る。
ここで、標的配列は、重複遺伝子のコアプロモーター領域に存在する5'-TATAWAWR-3'(W=AまたはT、R=AまたはG)配列の全体または一部を含む連続した10~25ヌクレオチド配列であり得る。
ここで、標的配列は、5'-CATAAAA-3'配列、5'-CATAAAA-3'配列、5'-TATAA-3'配列、5'-TATAAAA-3'配列、5'-CATAAATA-3'配列、5'-TATATAA-3'配列、5'-TATATATATATATAA-3'配列、5'-TATATTATA-3'配列、5'-TATAAA-3'配列、5'-TATAAAATA-3'配列、5'-TATATA-3'配列、5'-GATTAAAAA-3'配列、5'-TATAAAAA-3'配列、5'-TTATAA-3'配列、5'-TTTTAAAA-3'配列、5'-TCTTTAAAA-3'配列、5'-GACATTTAA-3'配列、5'-TGATATCAA-3'配列、5'-TATAAATA-3'配列、5'-TATAAGA-3'配列、5'-AATAAA-3'配列、5'-TTTATA-3'配列、5'-CATAAAAA-3'配列、5'-TATACA-3'配列、5'-TTTAAGA-3'配列、5'-GATAAAG-3'配列、5'-TATAACA-3'配列、5'-TCTTATCTT-3'配列、5'-TTGTACTTT-3'配列、5'-CATATAA-3'配列、5'-TATAAAT-3'配列、5'-TATATATAAAAAAAA-3'配列、および5'-CATAAATAAAAAAAATTA-3'配列からなる群より選択される配列の全体または一部を含む連続した10~25ヌクレオチド配列であり得る。
ここで、標的配列は、5'-TATA-3'配列、5'-CATAAAA-3'配列、5'-CATAAAA-3'配列、5'-TATAA-3'配列、5'-TATAAAA-3'配列、5'-CATAAATA-3'配列、5'-TATATAA-3'配列、5'-TATATATATATATAA-3'配列、5'-TATATTATA-3'配列、5'-TATAAA-3'配列、5'-TATAAAATA-3'配列、5'-TATATA-3'配列、5'-GATTAAAAA-3'配列、5'-TATAAAAA-3'配列、5'-TTATAA-3'配列、5'-TTTTAAAA-3'配列、5'-TCTTTAAAA-3'配列、5'-GACATTTAA-3'配列、5'-TGATATCAA-3'配列、5'-TATAAATA-3'配列、5'-TATAAGA-3'配列、5'-AATAAA-3'配列、5'-TTTATA-3'配列、5'-CATAAAAA-3'配列、5'-TATACA-3'配列、5'-TTTAAGA-3'配列、5'-GATAAAG-3'配列、5'-TATAACA-3'配列、5'-TCTTATCTT-3'配列、5'-TTGTACTTT-3'配列、5'-CATATAA-3'配列、5'-TATAAAT-3'配列、5'-TATATATAAAAAAAA-3'配列および5'-CATAAATAAAAAAAATTA-3'配列からなる群より選択される配列の5'末端または3'末端に位置する連続した10~25ヌクレオチド配列であり得る。
標的配列は、重複遺伝子のエンハンサー領域に位置する連続した10~25ヌクレオチド配列であり得る。標的配列は、重複遺伝子のエンハンサー領域に隣接して位置する連続した10~25ヌクレオチド配列であり得る。
標的配列は、重複遺伝子の転写調節領域内の核酸配列におけるPAM(プロトスペーサー隣接モチーフ)配列の5'末端および/または3'末端に隣接して位置する連続した10~25ヌクレオチド配列であり得る。
ここで、PAM配列は、CRISPR酵素に従って決定され得る。
CRISPR酵素は、Cas9タンパク質またはCpf1タンパク質であり得る。
ここで、Cas9タンパク質は、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)由来のCas9タンパク質、カンピロバクター・ジェジュニ(Campylobacter jejuni)由来のCas9タンパク質、ストレプトコッカス・サーモフィラス(Streptococcus thermophilus)由来のCas9タンパク質、スタフィロコッカス・アウレウス(Staphylococcus aureus)由来のCas9タンパク質およびナイセリア・メニンギティディス(Neisseria meningitidis)由来のCas9タンパク質からなる群より選択される1つまたは複数のCas9タンパク質であり得る。
重複遺伝子は、PMP22遺伝子、PLP1遺伝子、MECP2遺伝子、SOX3遺伝子、RAI1遺伝子、TBX1遺伝子、ELN遺伝子、JAGGED1遺伝子、NSD1遺伝子、MMP23遺伝子、LMB1遺伝子、SNCA遺伝子およびAPP遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
重複遺伝子は癌遺伝子であり得る。
ここで、癌遺伝子は、MYC遺伝子、ERBB2(HER2)遺伝子、CCND1(サイクリンD1)遺伝子、FGFR1遺伝子、FGFR2遺伝子、HRAS遺伝子、KRAS遺伝子、MYB遺伝子、MDM2遺伝子、CCNE(サイクリンE)遺伝子、MET遺伝子、CDK4遺伝子、ERBB1遺伝子、MYCN遺伝子、AKT2遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
細胞は真核細胞であり得る。
真核細胞は哺乳類細胞であり得る。
ガイド核酸とエディタータンパク質は、それぞれ核酸配列の形態で1つまたは複数のベクターに存在し得る。
ここで、ベクターは、プラスミドまたはウイルスベクターであり得る。
ここで、ウイルスベクターは、レトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴ウイルス(AAV)、ワクシニアウイルス、ポックスウイルスおよび単純ヘルペスウイルスからなる群より選択される1つまたは複数のウイルスベクターであり得る。
発現制御組成物は、ガイド核酸とエディタータンパク質とをガイド核酸-エディタータンパク質複合体の形態で含み得る。
発現制御組成物はさらにドナーを含み得る。
本発明は、真核細胞のゲノムに存在する重複遺伝子の発現を制御する方法を提供する。
一態様では、真核細胞のゲノムに存在する重複遺伝子の発現を制御する方法は、発現制御組成物を真核細胞に導入することを含み得る。
発現制御組成物は、以下のものを含み得る:
重複遺伝子の転写調節領域に存在する標的配列を標的とすることができるガイド核酸またはそれをコードする核酸;および
1つまたは複数のエディタータンパク質またはそれをコードする核酸。
真核細胞は哺乳類細胞であり得る。
ガイド核酸は、重複された遺伝子の転写調節領域に存在する標的配列を標的とすることができるガイドドメインを含み得る。
ここで、ガイドドメインは、重複された遺伝子の転写調節領域に存在する標的配列のガイド核酸結合配列と相補的な結合を形成することができるヌクレオチド配列を含み得る。
ここで、ガイドドメインは、重複された遺伝子の転写調節領域内の標的配列のガイド核酸結合配列と相補的な結合を形成し得る。
ここで、相補的な結合は、0~5つのミスマッチ結合を含み得る。
ガイド核酸は、第1の相補的ドメイン、第2の相補的ドメイン、近位ドメインおよびテールドメインからなる群より選択される1つまたは複数のドメインを含み得る。
エディタータンパク質はCRISPR酵素であり得る。
ガイド核酸とエディタータンパク質は、ガイド核酸-エディタータンパク質複合体を形成し得る。
ここで、ガイド核酸-エディタータンパク質複合体は、ガイド核酸の部分核酸をエディタータンパク質の部分アミノ酸と相互作用させることにより形成され得る。
発現制御組成物は、ガイド核酸とエディタータンパク質とをガイド核酸-エディタータンパク質複合体の形態で含み得る。
発現制御組成物は、ガイド核酸とエディタータンパク質がそれぞれ核酸の形態で含まれる1つまたは複数のベクターを含み得る。
導入は、エレクトロポレーション、リポソーム、プラスミド、ウイルスベクター、ナノ粒子、およびタンパク質移行ドメイン(PTD)融合タンパク質法から選択される1つまたは複数の方法により行われ得る。
本発明は、遺伝子重複疾患を治療する方法を提供する。
一態様では、遺伝子重複疾患を治療する方法は、治療対象への発現制御組成物の投与を含み得る。
発現制御組成物は、以下のものを含み得る:
重複遺伝子の転写調節領域に存在する標的配列を標的とすることができるガイド核酸またはそれをコードする核酸;および
1つまたは複数のエディタータンパク質またはそれをコードする核酸。
ガイド核酸は、重複された遺伝子の転写調節領域に存在する標的配列を標的とすることができるガイドドメインを含み得る。
ここで、ガイドドメインは、重複された遺伝子の転写調節領域に存在する標的配列のガイド核酸結合配列と相補的な結合を形成することができるヌクレオチド配列を含み得る。
ここで、ガイドドメインは、重複された遺伝子の転写調節領域内の標的配列のガイド核酸結合配列と相補的な結合を形成し得る。
ここで、相補的結合は、0~5つのミスマッチ結合を含み得る。
ガイド核酸は、第1の相補的ドメイン、第2の相補的ドメイン、近位ドメインおよびテールドメインからなる群より選択される1つまたは複数のドメインを含み得る。
エディタータンパク質はCRISPR酵素であり得る。
ガイド核酸とエディタータンパク質は、ガイド核酸-エディタータンパク質複合体を形成し得る。
ここで、ガイド核酸-エディタータンパク質複合体は、ガイド核酸の部分核酸をエディタータンパク質の部分アミノ酸と相互作用させることにより形成され得る。
遺伝子重複疾患は、シャルコー・マリー・トゥース病1A型(CMT1A)、デジェリン・ソッタス病(DSD)、先天性髄鞘形成不全神経障害(CHN)、ルーシー・レヴィー症候群(RLS)、ペリツェウス・メルツバッハー病(PMD)、MECP2重複症候群、X連鎖下垂体機能低下症(XLHP)、ポトツキ-ルプスキ(Potocki-Lupski)症候群(PTLS)、ヴェロカルディオフェイシャル症候群(VCFS)、ウィリアムズ・ビューレン症候群(WBS)、アラジール症候群(AS)、成長遅延症候群、早期閉鎖頭蓋縫合、常染色体優性白質ジストロフィー(ADLD)、パーキンソン病またはアルツハイマー病であり得る。
遺伝子重複疾患は、癌遺伝子重複によって引き起こされる癌であり得る。
ここで、癌遺伝子重複によって引き起こされる癌は、乳癌、子宮頸癌、結腸直腸癌、食道癌、胃癌、膠芽腫、頭頸部癌、肝細胞癌、神経芽細胞腫、卵巣癌、肉腫または小細胞肺癌であり得る。
治療対象は、ヒト、サル、マウスおよびラットを含む哺乳類であり得る。
投与は、注入、輸液、インプランテーションまたはトランスプランテーションにより行われ得る。
有利な効果
本発明は、発現制御組成物により重複遺伝子の発現を制御することができる。より具体的には、重複遺伝子の転写調節領域を標的とすることができるガイド核酸を含む発現制御組成物を使用することにより重複遺伝子の転写調節領域を人為的に操作および/または修飾することにより重複遺伝子の発現を制御することができる。遺伝子重複によって引き起こされる疾患は、重複遺伝子の発現を制御するための発現制御組成物を使用して改善または治療することもできる。
SpCas9-sgRNAに基づく遺伝子操作によるインデル頻度(%)を示す一連の結果であり、sgRNAの標的部位が区分されたTATAボックスを示す。 SpCas9-sgRNAに基づく遺伝子操作によるインデル頻度(%)を示す一連の結果であり、sgRNAの標的部位が区分されたエンハンサーのそれぞれのインデル頻度を示す。
CjCas9-sgRNAに基づく遺伝子操作によるインデル頻度(%)を示す一連の結果であり、sgRNAの標的部位が区分されたTATAボックスを示す。 CjCas9-sgRNAに基づく遺伝子操作によるインデル頻度(%)を示す一連の結果であり、sgRNAの標的部位が区分されたエンハンサーのそれぞれのインデル頻度を示す。
シュワン様細胞におけるヒトPMP22遺伝子の調節エレメントを標的とするSpCas9-sgRNAによる遺伝子操作効果を示す。
ヒトPMP22のCDSを標的とするSpCas9-sgRNAにより誘導されるフレームシフト変異比を示す。
デュアルsgRNAの処理によるヒトPMP22のごく一部の欠失を示す。
ヒトシュワン様細胞におけるSpCas9-sgRNAによるヒトPMP22のmRNA発現の減少を示すグラフである。
ヒト初代シュワン細胞におけるヒトPMP22遺伝子の各標的部位でのSpCas9-sgRNAによるPMP22の有効かつ特異的な発現減少を示すグラフであり、各標的部位でのSpCas9-sgRNAによるインデル頻度の測定結果を示す。 ヒト初代シュワン細胞におけるヒトPMP22遺伝子の各標的部位でのSpCas9-sgRNAによるPMP22の有効かつ特異的な発現減少を示すグラフであり、各標的部位のミエリン形成シグナル因子およびRNP複合体の処理の有無にかかわらずqRT-PCRにより測定されるPMP22の相対的なmRNA発現比較結果(n=3、一元配置分散分析およびテューキー事後検定:p<0.05)を示す。 ヒト初代シュワン細胞におけるヒトPMP22遺伝子の各標的部位でのSpCas9-sgRNAによるPMP22の有効かつ特異的な発現減少を示すグラフであり、遠位エンハンサー部位(遠位エンハンサー領域)BとCを標的とするSpCas9-sgRNAによるインデル頻度の測定結果を示す。
in vitroにおけるヒトPMP22遺伝子のTATAボックス部位を標的とするCRISPR-Cas9を介したPMP22の有効かつ特異的な発現減少を示すグラフであり、ヒトPMP22位置のプロモーター領域を標的とする標的配列を示す。 in vitroにおけるヒトPMP22遺伝子のTATAボックス部位を標的とするCRISPR-Cas9を介したPMP22の有効かつ特異的な発現減少を示すグラフであり、左端のグラフ、中央のグラフ、ならびに右端のグラフは、ヒト初代シュワン細胞における標的ディープシーケンシングを使用したインデル頻度の測定結果、総インデル頻度のうちTATAボックス1変異頻度の測定結果(n=3)、ならびにヒト初代シュワン細胞におけるミエリン形成シグナル因子およびRNP複合体の処理の有無にかかわらずqRT-PCRにより測定されるPMP22の相対的mRNA発現の比較結果(n=3、一元配置分散分析およびテューキー事後検定:p<0.05)をそれぞれ示す。
ヒト初代シュワン細胞における標的ディープシーケンシングによるin silicoオフターゲット分析を介して判明したオフターゲットおよびオンターゲットにおけるPMP22-TATA RNPによるインデル頻度を示し、インデル頻度を示すグラフである。 ヒト初代シュワン細胞における標的ディープシーケンシングによるin silicoオフターゲット分析を介して判明したオフターゲットおよびオンターゲットにおけるPMP22-TATA RNPによるインデル頻度を示し、高頻度のインデルを示す。 ヒト初代シュワン細胞における標的ディープシーケンシングによるin silicoオフターゲット分析を介して判明したオフターゲットおよびオンターゲットにおけるPMP22-TATA RNPによるインデル頻度を示し、in silicoオフターゲット分析を介して判明したオフターゲット部位を示す。
ヒトの全ゲノムにおいてPMP22-TATA RNPによって切断される部位を示す一連の結果であり、ゲノムワイドなCircosプロットを示す。 ヒトの全ゲノムにおいてPMP22-TATA RNPによって切断される部位を示す一連の結果であり、in silicoオフターゲット分析を介して判明したオフターゲット部位のうちDigenome-seqにより現れるオフターゲット部位を示す。 ヒトの全ゲノムにおいてPMP22-TATA RNPによって切断される部位を示す一連の結果であり、オフターゲット部位におけるインデル頻度を示すグラフである。
C22マウスにおけるPMP22‐TATA RNA療法を使用した治療アプローチを概略的に示す。
CMT1AマウスにおけるCRISPR/Cas9によるPMP22の発現阻害を介した疾患表現型の軽減を示す一連の結果であり、(a)は、mRosa26またはPMP22-TATA RNP複合体で治療された坐骨神経における標的ディープシーケンシングを使用したインデル頻度を示すグラフ(n=3)であり、(b)は、総インデル頻度のうちTATAボックス1変異頻度の測定結果(n=3)を示し、(c)は、mRosa26またはPMP22-TATA RNP複合体で治療された坐骨神経からのqRT-PCRを使用したPMP22の発現mRNAの相対量を比較するグラフである。
in silico分析によるマウスゲノムにおけるPMP22-TATA sgRNAのオフターゲット部位およびインデル頻度を示す一連の結果であり、オフターゲット部位を示す。 in silico分析によるマウスゲノムにおけるPMP22-TATA sgRNAのオフターゲット部位およびインデル頻度を示す一連の結果であり、各オフターゲット部位でのインデル頻度を示すグラフである。
CMT1AマウスにおけるCRISPR/Cas9によるPMP22の発現阻害を介した疾患表現型の軽減を示す一連の結果であり、mRosa26またはPMP22-TATA RNP複合体で処理された坐骨神経組織の半薄切片の一連の画像である。 CMT1AマウスにおけるCRISPR/Cas9によるPMP22の発現阻害を介した疾患表現型の軽減を示す一連の結果であり、上のグラフと下のグラフは、PMP22-TATA RNPで処理されたマウスにおいてg比が増加することを示す散布図と、MP22-TATA RNPで処理されたマウスにおいて有髄軸索の直径が増加することを示すグラフをそれぞれ示す。
CMT1AマウスにおけるCRISPR/Cas9によるPMP22の発現阻害を介した電気生理学的な変化を示す一連の結果であり、(a)遠位潜時(DL)の変化を示すグラフであり、(b)運動神経伝導速度(NCV)の変化を示すグラフであり、(c)複合筋活動電位(CMAP)の変化を示すグラフ(mRosa26 RNPの場合はn=7、PMP22-TATAの場合はn=10)である。
CMT1AマウスにおけるCRISPR/Cas9によるPMP22の発現阻害に起因した運動行動の一連の分析結果であり、上のグラフと下のグラフは、ロータロッド試験の結果(mRosa26 RNPの場合はn=7、PMP22-TATAの場合はn=11)と、マウスが8週齢から16週齢になるまで毎週測定したロータロッド試験の結果(mRosa26 RNPの場合はn=7、PMP22-TATAの場合はn=11)をそれぞれ示す。 CMT1AマウスにおけるCRISPR/Cas9によるPMP22の発現阻害に起因した運動行動の一連の分析結果であり、上のグラフと下の画像は、mRosa26またはPMP22-TATA RNP複合体で処理されたC22マウスの腓腹筋重量/体重の比と、mRosa26またはPMP22-TATA RNP複合体で処理されたC22マウスの一連の腓腹筋画像をそれぞれ示すグラフである。
PMD治療戦略を示す概略図であって、PLP1遺伝子のTATAボックス領域とエンハンサー領域を標的とするsgRNAを設計した。エンハンサー領域を標的とするsgRNAの場合、2つのsgRNAを使用してエンハンサーを除去する戦略が示される。ここで、エンハンサー領域の上流を標的とするsgRNAはUpと表示され、その下流を標的とするsgRNAはDownと表示され、UpとDownはまた、表5と6における位置に従って表示される。
例示的な実施形態で使用されるCjCas9プラスミドを示す。
mPlp1のTATAボックス領域を標的とするSpCas9-sgRNAのスクリーニング結果を示す一連のグラフである。(a)は、NIH-3T3細胞において確認されたインデル頻度(%)を示し、(b)は、N20.1細胞において確認されたインデル頻度(%)を示す。ここで、使用したsgRNAは、mPlp1-TATA-Sp-01を標的とするsgRNAであり、グラフ上の標的配列に表示される数字で区別した。
mPlp1のTATAボックス領域を標的とするCjCas9-sgRNAのスクリーニング結果を示す一連のグラフである。(a)は、NIH-3T3細胞において確認されたインデル頻度(%)を示し、(b)は、N20.1細胞において確認されたインデル頻度(%)を示す。ここで、使用されるsgRNAは、mPlp1-TATA-Cj-01~mPlp1-TATA-Cj-04であり、グラフ上の標的配列に表示される数字で区別した。
mPlp1のエンハンサー(wMN1エンハンサー)領域を標的とするSpCas9-sgRNAのスクリーニング結果を示す一連のグラフである。(a)は、NIH-3T3細胞において確認されたインデル頻度(%)を示し、(b)は、N20.1細胞において確認されたインデル頻度(%)を示す。ここで、使用したsgRNAは、mPlp1-wMN1-Sp-01~mPlp1-wMN1-Sp-36であり、グラフ上の標的配列に表示される数字で区別した。
mPlp1のエンハンサー(wMN1エンハンサー)領域を標的とするCjCas9-sgRNAのスクリーニング結果を示すグラフである。(a)は、NIH-3T3細胞において確認されたインデル頻度(%)を示し、(b)は、N20.1細胞において確認されたインデル頻度(%)を示す。ここで、使用したsgRNAは、mPlp1-wMN1-Cj-01~mPlp1-wMN1-Sp-28であり、グラフ上の標的配列に表示される数字で区別した。
mPlp1のTATAボックスとエンハンサー(wMN1エンハンサー)領域を標的とするSpCas9-sgRNAおよびCjCas9-sgRNAによるPlpのmRNA発現レベルを示す一連のグラフである。(a)は、SpCas9-sgRNAによるPlpのmRNA発現レベルを示し、ここで、TATAボックス領域を標的とするmPlp1-TATA-Sp-01ならびにエンハンサーを標的とするmPlp1-wMN1-Sp-07+mPlp1-wMN1-Sp-27およびmPlp1-wMN1-Sp-08+mPlp1-wMN1-Sp-27をsgRNAとして使用した。 (b)は、CjCas9-sgRNAによるPlpのmRNA発現レベルを示し、ここで、TATAボックス領域を標的とするmPlp1-TATA-Cj-02およびmPlp1-TATA-Cj-03;ならびにエンハンサーを標的とするmPlp1-wMN1-Cj-06+mPlp1-wMN1-Cj-09、mPlp1-wMN1-Cj-06+mPlp1-wMN1-Cj-10およびmPlp1-wMN1-Cj-06+mPlp1-wMN1-Cj-19をsgRNAとして使用した。mRosa26を対照として使用した。
hPLP1のエンハンサー(wMN1エンハンサー)領域を標的とするSpCas9-sgRNAのスクリーニング結果を示すグラフであり、Jurkat細胞において確認されたインデル頻度(%)を示し、使用したsgRNAは、hPLP1-wMN1-Sp-01~hPLP1-wMN1-Sp-36であり、グラフ上の標的配列に表示される数字で区別した。
hPLP1のエンハンサー(wMN1エンハンサー)領域を標的とするCjCas9-sgRNAのスクリーニング結果を示すグラフであり、293T細胞において確認されたインデル頻度(%)を示し、使用したsgRNAは、hPLP1-wMN1-Cj-01~hPLP1-wMN1-Cj-36であり、グラフ上の標的配列に表示される数字で区別した。
別様に定義されない限り、本明細書で使用されるすべての技術用語および科学用語は、本発明が属する分野の当業者によって一般に理解されるのと同じ意味を有する。本明細書に記載のものと類似または同一の方法および材料を本発明の実施または試験に使用することができるが、適切な方法および材料を以下に記載する。本明細書で言及されるすべての出版物、特許出願、特許および他の参考文献は、参照によりその全体が組み込まれる。加えて、材料、方法および実施例は、単なる例示であり、限定することを意図したものではない。本明細書で開示される一態様は、発現制御組成物に関する。
発現制御組成物は、遺伝子重複により重複遺伝子の発現を制御するための組成物である。
「遺伝子重複」とは、ゲノム内に2つ以上の同一遺伝子が存在することを意味する。遺伝子重複には、ゲノム内に同じ遺伝子の2つ以上の部分を有することも含まれる。たとえば、遺伝子重複とは、ゲノム内に2つ以上の完全長A遺伝子、またはゲノム内に1つの完全長A遺伝子と、A遺伝子の1つまたは複数の部分、たとえばエクソン1が存在することを意味し得る。たとえば、遺伝子重複とは、ゲノム内に2つの全長B遺伝子と、B遺伝子の1つまたは複数の部分、たとえばエクソン1およびエクソン2が存在することを意味し得る。遺伝子重複の種類はさまざまであり得、遺伝子重複には、ゲノム内の全長遺伝子および/または遺伝子の部分配列の重複(すなわち2つ以上)が含まれる。
加えて、遺伝子重複には、染色体の部分領域を複製する複製現象が含まれ、それは染色体の遺伝子組換え中に起こる。そのような遺伝子重複とは、遺伝子変異の一種であり、次世代に継代される。遺伝子重複は、遺伝子の部分領域が複製されないために起こる遺伝子の欠失とともに、遺伝子発現に影響を及ぼす。
ここで、遺伝子重複の対象、すなわち2つ以上の数で存在する遺伝子を「重複遺伝子(duplication gene)」と呼ぶ。
重複遺伝子は、遺伝子重複によりゲノム内の総コピー数が増加した遺伝子であり得る。
重複遺伝子は、遺伝子重複により部分領域のみが重複されている変異遺伝子であり得る。ここで、変異遺伝子は、遺伝子の全配列中の1つまたは複数のヌクレオチド配列が重複されている遺伝子であり得る。あるいは、変異遺伝子は、遺伝子重複により遺伝子の部分核酸断片が複製されている遺伝子であり得る。ここで、核酸断片は、50bp以上のヌクレオチド配列を有し得る。
遺伝子重複には、全ゲノム重複が含まれる。
遺伝子重複には、標的遺伝子重複が含まれる。ここで、標的遺伝子重複とは、新しい種の環境変化への分化と適応において、特定の環境に適した関連遺伝子が増幅または消失し、ほとんどの複製がトランスポゾンにより行われる遺伝子重複の一種である。
遺伝子重複には、異所性組換えが含まれる。ここで、異所性組換えは、相同染色体の減数分裂中の不均等なクロスオーバーに起因する複製のために2つの染色体間の反復配列の程度に従って起こる。クロスオーバーでの重複と相互欠失が発生する。異所性組換えは、転位因子などの典型的な反復遺伝因子によって媒介され、組換えによって引き起こされる複製をもたらす。
遺伝子重複には、複製のずれが含まれる。ここで、複製のずれは、DNA複製中のエラーによる短い遺伝子配列の複製であり、DNAポリメラーゼが変性DNA鎖に誤って付着し、DNA鎖が再び複製されるときに起こる。複製のずれはまた、反復遺伝要素によって頻繁に媒介される。
遺伝子重複には、レトロトランスポジションが含まれる。ここで、レトロトランスポジションは、レトロウイルスまたはレトロエレメント侵入細胞によって媒介される複製であって、遺伝子の逆転写が行われてレトロ遺伝子が形成され、レトロ遺伝子の組換えにより遺伝子重複が行われる。レトロトランスポジションは、レトロ転位因子などの遺伝的因子によって媒介される。
遺伝子重複は、重複遺伝子から転写されたmRNAの発現を増加させることができる。ここで、転写されたmRNAの発現は、遺伝子重複が起こらない状態と比較して増加し得る。
遺伝子重複は、重複遺伝子によりコードされるタンパク質の発現を増加させることができる。ここで、タンパク質の発現は、遺伝子重複が起こらない状態と比較して増加し得る。
遺伝子重複は、重複遺伝子によりコードされるタンパク質の機能障害を引き起こし得る。
ここで、機能不全は、タンパク質の機能亢進、抑制機能、および第3の機能であり得る。
遺伝子重複は、遺伝子重複疾患を引き起こし得る。
「遺伝子重複疾患」とは、遺伝子重複によって引き起こされる疾患であり、重複遺伝子の異常増幅により遺伝的異常を引き起こし、過剰発現またはそれによって異常に生成されるタンパク質によって病理学的特徴を誘導するすべての疾患または障害を含む。ここで、「病理学的特徴」とは、生物の細胞レベルでの変化、ならびに疾患に基づく組織、器官および個人レベルでの変化を指す。
遺伝子重複疾患は、シャルコー・マリー・トゥース病1A型(CMT1A)、デジェリン・ソッタス病(DSD)、先天性髄鞘形成不全神経障害(CHN)、ルーシー・レヴィー症候群(RLS)、ペリツェウス・メルツバッハー病(PMD)、MECP2重複症候群、X連鎖下垂体機能低下症(XLHP)、ポトツキ-ルプスキ症候群(PTLS)、ヴェロカルディオフェイシャル症候群(VCFS)、ウィリアムズ・ビューレン症候群(WBS)、アラジール症候群(AS)、成長遅延症候群、早期閉鎖頭蓋縫合、常染色体優性白質ジストロフィー(ADLD)、パーキンソン病またはアルツハイマー病であり得る。
遺伝子重複疾患は、癌遺伝子重複によって引き起こされる癌であり得る。
ここで、癌遺伝子重複によって引き起こされる癌は、乳癌、子宮頸癌、結腸直腸癌、食道癌、胃癌、膠芽腫、頭頸部癌、肝細胞癌、神経芽細胞腫、卵巣癌、肉腫または小細胞肺癌であり得る。
遺伝子重複疾患は、PMP22遺伝子、PLP1遺伝子、MECP2遺伝子、SOX3遺伝子、RAI1遺伝子、TBX1遺伝子、ELN遺伝子、JAGGED1遺伝子、NSD1遺伝子、MMP23遺伝子、LMB1遺伝子、SNCA遺伝子およびAPP遺伝子の重複によって引き起こされる疾患であり得る。
遺伝子重複疾患は、MYC遺伝子、ERBB2(HER2)遺伝子、CCND1(サイクリンD1)遺伝子、FGFR1遺伝子、FGFR2遺伝子、HRAS遺伝子、KRAS遺伝子、MYB遺伝子、MDM2遺伝子、CCNE(サイクリンE)遺伝子、MET遺伝子、CDK4遺伝子、ERBB1遺伝子、MYCN遺伝子またはAKT2遺伝子の重複によって引き起こされる疾患であり得る。
遺伝子重複疾患は、重複遺伝子の転写されたmRNAの発現の異常な増加によって引き起こされる疾患であり得る。
遺伝子重複疾患は、重複遺伝子によりコードされるタンパク質の発現の異常な増加によって引き起こされる疾患であり得る。
発現制御組成物は、重複遺伝子の転写により生成されるmRNAの発現の制御に使用され得る。
発現制御組成物は、重複遺伝子によりコードされるタンパク質の発現の制御に使用され得る。
発現制御組成物は、重複遺伝子の人為的な修飾または操作に使用され得る。
ここで、「人為的に修飾または操作(人為的に修飾、操作または改変された)」とは、天然に存在する状態ではなく、人為的に修飾された状態を指す。以下、非天然に人為的に修飾または操作された重複遺伝子は、人為重複遺伝子と同義で使用され得る。
「発現制御システム」とは、人為的に操作された重複遺伝子の発現の制御に起因して起こるすべての現象、ならびに発現制御システムに直接または間接的に関与するすべての材料、組成物、方法および使用を含む用語である。
発現制御組成物は、重複遺伝子の転写調節領域の人為的な操作または修飾に使用され得る。
ここで、「転写調節領域(転写制御領域)」とは、遺伝子のDNAに基づいてRNAを合成するプロセス全体を制御する領域であり、遺伝子のDNA配列および/または遺伝子の近位DNA配列の転写因子と相互作用するすべての領域を含む。ここで、転写因子は、活性化されるとDNAの特異領域、すなわち遺伝子に近い応答エレメントに結合し、それによって遺伝子発現を促進または阻害するタンパク質であり、応答要素は、転写調節領域に含まれる。転写調節領域の種類と位置は遺伝子に従って異なり得、同じ種でも個体間で核酸配列に違いがあり得る。
転写調節領域は、プロモーター、エンハンサー、サイレンサー、インシュレーターおよび/または遺伝子座制御領域(LCR)であり得る。
プロモーターは、コアプロモーター、近位プロモーターおよび/または遠位プロモーターであり得る。
ここで、コアプロモーターは、転写開始部位(TSS)、RNAポリメラーゼ結合部位、転写因子結合部位および/またはTATAボックスを含み得る。
TATAボックスは、Rpb4/Rbp7の転写を開始するために使用される開始部位の25塩基対上流に位置する領域であり得る。
TATAボックスは、TSSの30塩基対上流に位置する領域であり得る。
TATAボックスは、TSSの40~100塩基対上流に位置する領域であり得る。
たとえば、TATAボックスは、プロモーターおよび/またはコアプロモーターに存在する5'-TATA(A/T)A(A/T)-3'配列を含む領域であり得る。あるいは、TATAボックスは、プロモーターおよび/またはコアプロモーターに存在する5'-TATA(A/T)A(A/T)(A/G)-3'配列を含む領域であり得る。
たとえば、TATAボックスは、プロモーターおよび/またはコアプロモーターに存在する5'-CATAAAA-3'配列、5'-CATAAAA-3'配列、5'-TATAA-3'配列、5'-TATAAAA-3'配列、5'-CATAAATA-3'配列、5'-TATATAA-3'配列、5'-TATATATATATATAA-3'配列、5'-TATATTATA-3'配列、5'-TATAAA-3'配列、5'-TATAAAATA-3'配列、5'-TATATA-3'配列、5'-GATTAAAAA-3'配列、5'-TATAAAAA-3'配列、5'-TTATAA-3'配列、5'-TTTTAAAA-3'配列、5'-TCTTTAAAA-3'配列、5'-GACATTTAA-3'配列、5'-TGATATCAA-3'配列、5'-TATAAATA-3'配列、5'-TATAAGA-3'配列、5'-AATAAA-3'配列、5'-TTTATA-3'配列、5'-CATAAAAA-3'配列、5'-TATACA-3'配列、5'-TTTAAGA-3'配列、5'-GATAAAG-3'配列、5'-TATAACA-3'配列、5'-TCTTATCTT-3'配列、5'-TTGTACTTT-3'配列、5'-CATATAA-3'配列、5'-TATAAAT-3'配列、5'-TATATATAAAAAAAA-3'配列および5'-CATAAATAAAAAAAATTA-3'配列からなる群より選択される1つまたは複数の配列を含む領域であり得る。
たとえば、TATAボックスは、プロモーターおよび/またはコアプロモーターに存在するTATA結合タンパク質(TBP)が結合する領域であり得る。
ここで、近位プロモーターは、TSS、CpG部位および/または特定の転写因子結合部位の1~300bp上流の領域を含み得る。
エンハンサーは、エンハンサーボックス(Eボックス)を含み得る。
インシュレーターは、エンハンサーとプロモーターとの間の相互作用を阻害する領域、または抑制されたクロマチンの拡大を妨げる領域であり得る。
遺伝子座制御領域(LCR)は、エンハンサー、サイレンサー、インシュレーター、MARおよびSARなどの多数のシス作用因子が存在する領域であり得る。本明細書に開示される一態様として、発現制御組成物は、ガイド核酸を含み得る。
発現制御組成物は、重複遺伝子を標的とするガイド核酸またはそれをコードする核酸配列を含み得る。
「ガイド核酸」とは、標的核酸、遺伝子または染色体を認識し、エディタータンパク質と相互作用するヌクレオチド配列を指す。ここで、ガイド核酸は、標的核酸、遺伝子または染色体の部分ヌクレオチド配列に相補的に結合し得る。加えて、ガイド核酸の部分ヌクレオチド配列は、エディタータンパク質のいくつかのアミノ酸と相互作用し、それによってガイド核酸-エディタータンパク質複合体を形成し得る。
ガイド核酸は、標的核酸、遺伝子または染色体の標的領域に位置するようにガイド核酸-エディタータンパク質複合体を誘導する機能を果たし得る。
ガイド核酸は、DNA、RNAまたはDNA/RNAハイブリッドの形態で存在し得、5~150ntの核酸配列を有し得る。
ガイド核酸は、1つの連続した核酸配列を有し得る。
たとえば、1つの連続した核酸配列は(N)であり得、ここで、Nは、A、T、CもしくはG、またはA、U、CもしくはGを表し、mは1~150の整数である。
ガイド核酸は、2つ以上の連続した核酸配列を有し得る。
たとえば、2つ以上の連続核酸配列は、(N)および(N)であり得、ここで、Nは、A、T、CもしくはG、またはA、U、CもしくはGを表し、mとoは1~150の整数であり、mとoは互いに同じでも異なっていてもよい。
ガイド核酸は、1つまたは複数のドメインを含み得る。
ドメインは、ガイドドメイン、第1の相補的ドメイン、リンカードメイン、第2の相補的ドメイン、近位ドメイン、またはテールドメインであり得るが、これらに限定されない。
ここで、1つのガイド核酸は、2つ以上の機能的ドメインを有し得る。ここで、2つ以上の機能的ドメインは、互いに異なっていてもよい。一例として、1つのガイド核酸は、ガイドドメインと第1の相補的ドメインを有し得る。別の例では、1つのガイド核酸は、第2の相補的ドメイン、近位ドメインおよびテールドメインを有し得る。さらに別の例では、1つのガイド核酸は、ガイドドメイン、第1の相補的ドメイン、第2の相補的ドメイン、近位ドメインおよびテールドメインを有し得る。あるいは、1つのガイド核酸に含まれる2つ以上の機能的ドメインは、互いに同じであり得る。一例として、1つのガイド核酸は、2つ以上の近位ドメインを有し得る。別の例として、1つのガイド核酸は、2つ以上のテールドメインを有し得る。しかしながら、1つのガイド核酸に含まれる機能的ドメインが同じドメインであるという説明は、2つの機能的ドメインの配列が同じであることを意味しない。配列が異なっていても、機能的に同じ機能を果たす場合、2つの機能的ドメインは同じドメインであり得る。
機能的ドメインについては、以下で詳しく説明する。i)ガイドドメイン
「ガイドドメイン」という用語は、標的遺伝子の転写調節領域内の核酸の二本鎖のいずれかの鎖の部分配列と相補的に結合することができるドメインであり、標的遺伝子の転写調節領域内の核酸との特異的な相互作用のために作用する。たとえば、ガイドドメインは、標的遺伝子の転写調節領域内の核酸における特定のヌクレオチド配列に位置するガイド核酸-エディタータンパク質複合体を誘導する機能を果たし得る。
ガイドドメインは、10~35ヌクレオチド配列であり得る。
一例では、ガイドドメインは、10~35、15~35、20~35、25~35または30~35ヌクレオチド配列であり得る。
別の例では、ガイドドメインは、10~15、15~20、20~25、25~30または30~35ヌクレオチド配列であり得る。
ガイドドメインは、ガイド配列を含み得る。
「ガイド配列」という用語は、標的遺伝子の転写調節領域内の核酸の二本鎖のいずれかの鎖の部分配列に相補的なヌクレオチド配列である。ここで、ガイド配列は、少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%以上の相補性または完全な相補性を有するヌクレオチド配列であり得る。
ガイド配列は、10~25ヌクレオチド配列であり得る。
一例では、ガイド配列は、10~25、15~25または20~25ヌクレオチド配列であり得る。
別の例では、ガイド配列は、10~15、15~20または20~25ヌクレオチド配列であり得る。
加えて、ガイドドメインは、追加のヌクレオチド配列をさらに含み得る。
追加のヌクレオチド配列を利用して、ガイドドメインの機能を改善または低下させることができる。
追加のヌクレオチド配列を利用して、ガイド配列の機能を改善または低下させることができる。
追加のヌクレオチド配列は、1~10ヌクレオチド配列であり得る。
一例では、追加のヌクレオチド配列は、2~10、4~10、6~10または8~10ヌクレオチド配列であり得る。
別の例では、追加のヌクレオチド配列は、1~3、3~6または7~10ヌクレオチド配列であり得る。
一実施形態では、追加のヌクレオチド配列は、1、2、3、4、5、6、7、8、9または10ヌクレオチド配列であり得る。
たとえば、追加のヌクレオチド配列は、1つのヌクレオチド配列G(グアニン)、または2つのヌクレオチド配列GGであり得る。
追加のヌクレオチド配列は、ガイド配列の5'末端に配置され得る。
追加のヌクレオチド配列は、ガイド配列の3'末端に配置され得る。
ii)第1の相補的ドメイン
「第1の相補的ドメイン」という用語は、後述する第2の相補的ドメインに相補的なヌクレオチド配列を含むドメインであり、第2の相補的ドメインと二本鎖を形成するのに十分な相補性を有する。たとえば、第1の相補的ドメインは、第2の相補的ドメインに対して少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%以上の相補性または完全な相補性を有するヌクレオチド配列であり得る。
第1の相補的ドメインは、相補的結合により第2の相補的ドメインと二本鎖を形成し得る。ここで、形成された二本鎖は、エディタータンパク質のいくつかのアミノ酸と相互作用することによりガイド核酸-エディタータンパク質複合体を形成するように作用し得る。
第1の相補的ドメインは、5~35ヌクレオチド配列であり得る。
一例では、第1の相補的ドメインは、5~35、10~35、15~35、20~35、25~35または30~35ヌクレオチド配列であり得る。
別の例では、第1の相補的ドメインは、1~5、5~10、10~15、15~20、20~25、25~30または30~35ヌクレオチド配列であり得る。
iii)リンカードメイン
「リンカードメイン」という用語は、2つ以上のドメインを連結するヌクレオチド配列であり、それらは2つ以上の同一または異なるドメインである。リンカードメインは、共有結合または非共有結合により2つ以上のドメインと連結され得、または共有結合もしくは非共有結合により2つ以上のドメインを連結し得る。
リンカードメインは、1~30ヌクレオチド配列であり得る。
一例では、リンカードメインは、1~5、5~10、10~15、15~20、20~25または25~30ヌクレオチド配列であり得る。
別の例では、リンカードメインは、1~30、5~30、10~30、15~30、20~30または25~30ヌクレオチド配列であり得る。
iv)第2の相補的ドメイン
「第2の相補的ドメイン」という用語は、上記の第1の相補的ドメインに相補的なヌクレオチド配列を含むドメインであり、第1の相補的ドメインと二本鎖を形成するのに十分な相補性を有する。たとえば、第2の相補的ドメインは、第1の相補的ドメインに対して少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%以上の相補性または完全な相補性を有するヌクレオチド配列であり得る。
第2の相補的ドメインは、相補的結合により第1の相補的ドメインと二本鎖を形成し得る。ここで、形成された二本鎖は、エディタータンパク質のいくつかのアミノ酸と相互作用することによりガイド核酸-エディタータンパク質複合体を形成するように作用し得る。第2の相補的ドメインは、第1の相補的ドメインに相補的なヌクレオチド配列、および第1の相補的ドメインに対して相補性を有しないヌクレオチド配列、たとえば、第1の相補的ドメインと二本鎖を形成しないヌクレオチド配列を有し得、第1の相補的ドメインよりも長い塩基配列を有し得る。
第2の相補的ドメインは、5~35ヌクレオチド配列であり得る。
一例では、第2の相補的ドメインは、5~35、10~35、15~35、20~35、25~35または30~35ヌクレオチド配列であり得る。
別の例では、第2の相補的ドメインは、1~5、5~10、10~15、15~20、20~25、25~30または30~35ヌクレオチド配列であり得る。
v)近位ドメイン
「近位ドメイン」という用語は、第2の相補的ドメインに隣接して位置するヌクレオチド配列である。
近位ドメインは、その中に相補的なヌクレオチド配列を有し得、相補的なヌクレオチド配列により二本鎖で形成され得る。
近位ドメインは、1~20ヌクレオチド配列であり得る。
一例では、近位ドメインは、1~20、5~20、10~20または15~20ヌクレオチド配列であり得る。
別の例では、近位ドメインは、1~5、5~10、10~15または15~20ヌクレオチド配列であり得る。
vi)テールドメイン
「テールドメイン」という用語は、ガイド核酸の両端のうちの1つまたは複数の端に位置するヌクレオチド配列である。
テールドメインは、その中に相補的なヌクレオチド配列を有していてもよいか、相補的なヌクレオチド配列のために二本鎖で形成されていてもよい。
テールドメインは、1~50ヌクレオチド配列であり得る。
一例では、テールドメインは、5~50、10~50、15~50、20~50、25~50、30~50、35~50、40~50または45~50ヌクレオチド配列であり得る。
別の例では、テールドメインは、1~5、5~10、10~15、15~20、20~25、25~30、30~35、35~40、40~45または45~50ヌクレオチド配列であり得る。
一方、ドメイン、すなわちガイドドメイン、第1の相補的ドメイン、リンカードメイン、第2の相補的ドメイン、近位ドメインおよびテールドメインに含まれる核酸配列の一部または全体は、選択的または追加で化学修飾を含み得る。
化学修飾は、メチル化、アセチル化、リン酸化、ホスホロチオエート結合、ロックされた核酸(LNA)、2'-O-メチル3'ホスホロチオエート(MS)または2'-O-メチル3'チオPACE(MSP)であり得るが、これらに限定されない。
ガイド核酸は、1つまたは複数のドメインを含む。
ガイド核酸は、ガイドドメインを含み得る。
ガイド核酸は、第1の相補的ドメインを含み得る。
ガイド核酸は、リンカードメインを含み得る。
ガイド核酸は、第2の相補的ドメインを含み得る。
ガイド核酸は、近位ドメインを含み得る。
ガイド核酸は、テールドメインを含み得る。
ここで、1、2、3、4、5、6またはそれ以上のドメインが存在し得る。
ガイド核酸は、1、2、3、4、5、6またはそれ以上のガイドドメインを含み得る。
ガイド核酸は、1、2、3、4、5、6またはそれ以上の第1の相補的ドメインを含み得る。
ガイド核酸は、1、2、3、4、5、6またはそれ以上のリンカードメインを含み得る。
ガイド核酸は、1、2、3、4、5、6またはそれ以上の第2の相補的ドメインを含み得る。
ガイド核酸は、1、2、3、4、5、6またはそれ以上の近位ドメインを含み得る。
ガイド核酸は、1、2、3、4、5、6またはそれ以上のテールドメインを含み得る。
ここで、ガイド核酸では、1種類のドメインが重複されていてもよい。
ガイド核酸は、重複の有無にかかわらずいくつかのドメインを含み得る。
ガイド核酸は、同じ種類のドメインを含み得る。ここで、同じ種類のドメインは、同じ核酸配列または異なる核酸配列を有し得る。
ガイド核酸は、2種類のドメインを含み得る。ここで、2つの異なる種類のドメインは、異なる核酸配列または同じ核酸配列を有し得る。
ガイド核酸は、3種類のドメインを含み得る。ここで、3つの異なる種類のドメインは、異なる核酸配列または同じ核酸配列を有し得る。
ガイド核酸は、4種類のドメインを含み得る。ここで、4つの異なる種類のドメインは、異なる核酸配列または同じ核酸配列を有し得る。
ガイド核酸は、5種類のドメインを含み得る。ここで、5つの異なる種類のドメインは、異なる核酸配列または同じ核酸配列を有し得る。
ガイド核酸は、6種類のドメインを含み得る。ここで、6つの異なる種類のドメインは、異なる核酸配列または同じ核酸配列を有し得る。
たとえば、ガイド核酸は、[ガイドドメイン]-[第1の相補的ドメイン]-[リンカードメイン]-[第2の相補的ドメイン]-[リンカードメイン]-[ガイドドメイン]-[第1の相補的ドメイン]-[リンカードメイン]-[第2の相補的ドメイン]からなり得る。ここで、2つのガイドドメインは、異なるまたは同じ標的のためのガイド配列を含み得、2つの第1の相補的ドメインと2つの第2の相補的ドメインは、同じまたは異なる核酸配列を有し得る。ガイドドメインが異なる標的のガイド配列を含む場合、ガイド核酸は2つの異なる標的に特異的に結合し得、ここで、特異的結合は、同時にまたは連続して行われ得る。加えて、リンカードメインは、特定の酵素によって切断され、ガイド核酸は、特定の酵素の存在下で2つまたは3つの部分に分割される。本明細書に開示される例示的な一実施形態では、ガイド核酸はgRNAであり得る。
「gRNA」という用語は、標的遺伝子の転写調節領域内の核酸に関して、gRNA-CRISPR酵素複合体、すなわちCRISPR複合体を特異的に標的とすることができるRNAを指す。加えて、gRNAは、標的遺伝子の転写調節領域内の核酸に特異的なRNAであり、それはCRISPR酵素に結合し、標的遺伝子の転写調節領域にCRISPR酵素をガイドする。
gRNAは、複数のドメインを含み得る。各ドメインに基づき、相互作用は、gRNA鎖の3次元構造もしくは活性型において、またはこれらの鎖間で起こり得る。
gRNAは、一本鎖gRNA(単一RNA分子、単一gRNAまたはsgRNA);または二本鎖gRNA(2つ以上、一般には2つの別個のRNA分子を含む)と呼ばれ得る。
例示的な一実施形態では、一本鎖gRNAは、ガイドドメイン、すなわち、標的遺伝子の転写調節領域内の核酸と相補的な結合を形成することができるガイド配列を含むドメイン;第1の相補的ドメイン;リンカードメイン;第1の相補的ドメイン配列に相補的な配列を有し、それによって第1の相補的ドメインと二本鎖核酸を形成するドメインである第2の相補的ドメイン;近位ドメイン;および任意にテールドメインを5'-3'方向に含み得る。
別の実施形態では、二本鎖gRNAは、ガイドドメイン、すなわち、標的遺伝子の転写調節領域内の核酸と相補的な結合を形成することができるガイド配列を含むドメインおよび第1の相補的ドメインを含む第1鎖、ならびに、第1の相補的ドメイン配列に相補的な配列を有し、それによって第1の相補的ドメインと二本鎖核酸を形成するドメインである第2の相補的ドメイン、近位ドメイン、および任意にテールドメインを5'-3'方向に含む第2鎖を含み得る。
ここで、第1鎖はcrRNAと呼ばれ、第2鎖はtracrRNAと呼ばれ得る。crRNAは、ガイドドメインと第1の相補的ドメインを含み得、tracrRNAは、第2の相補的ドメイン、近位ドメインおよび任意にテールドメインを含み得る。
さらに別の実施形態では、一本鎖gRNAは、ガイドドメイン、すなわち、標的遺伝子の転写調節領域内の核酸と相補的な結合を形成することができるガイド配列を含むドメイン;第1の相補的ドメイン;第2の相補的ドメイン;第1の相補的ドメイン配列に相補的な配列を有し、それによって5'-3'方向に第1の相補的ドメインと二本鎖核酸を形成するドメインを含み得る。
ここで、第1の相補的ドメインは、天然の第1の相補的ドメインと相同性を有していてもよいし、天然の第1の相補的ドメインに由来していてもよい。加えて、第1の相補的ドメインは、天然に存在する種に応じて第1の相補的ドメインのヌクレオチド配列に違いを有していてもよく、天然に存在する種に含まれる第1の相補的ドメインに由来していてもよいか、天然に存在する種に含まれる第1の相補的ドメインと部分的または完全な相同性を有していてもよい。
例示的な一実施形態では、第1の相補的ドメインは、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)、カンピロバクター・ジェジュニ(Campylobacter jejuni)、ストレプトコッカス・サーモフィラス(Streptococcus thermophilus)、スタフィロコッカス・アウレウス(Staphylococcus aureus)もしくはナイセリア・メニンギティディス(Neisseria meningitidis)の第1の相補的ドメイン、またはそれらに由来する第1の相補的ドメインと部分的、すなわち少なくとも50%以上、もしくは完全な相同性を有し得る。
たとえば、第1の相補的ドメインが、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)の第1の相補的ドメインまたはそれに由来する第1の相補的ドメインである場合、第1の相補的ドメインは、5'-GUUUUAGAGCUA-3'、または5'-GUUUUAGAGCUA-3'と部分的、すなわち少なくとも50%以上、もしくは完全な相同性を有するヌクレオチド配列であり得る。ここで、第1の相補的ドメインは(X)をさらに含み得、5'-GUUUUAGAGCUA(X)-3'がもたらされる。Xは、塩基A、T、UおよびGからなる群から選択され得、nはヌクレオチドの数を表し得、それは5~15の整数である。ここで、(X)は、同じヌクレオチドのn個の繰り返し、またはA、T、UおよびGのn個のヌクレオチドの混合物であり得る。
別の実施形態では、第1の相補的ドメインがカンピロバクター・ジェジュニ(Campylobacter jejuni)の第1の相補的ドメインまたはそれに由来する第1の相補的ドメインである場合、第1の相補的ドメインは、5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'、または5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'と部分的、すなわち少なくとも50%以上、もしくは完全な相同性を有するヌクレオチド配列であり得る。ここで、第1の相補的ドメインは(X)をさらに含み得、5'-GUUUUAGUCCCUUUUUAAAUUUCUU(X)-3'がもたらされる。Xは、ヌクレオチドA、T、UおよびGからなる群から選択され得、nはヌクレオチドの数を表し得、それは5~15の整数である。ここで、(X)は、同じヌクレオチドのn個の繰り返し、またはA、T、UおよびGのn個のヌクレオチドの混合物を表し得る。
別の実施形態では、第1の相補的ドメインは、Parcubacteria bacterium(GWC2011_GWC2_44_17)、Lachnospiraceae bacterium(MC2017)、Butyrivibrio proteoclasiicus、Peregrinibacteria bacterium(GW2011_GWA_33_10)、Acidaminococcus sp.(BV3L6)、Porphyromonas macacae、Lachnospiraceae bacterium(ND2006)、Porphyromonas crevioricanis、Prevotella disiens、Moraxella bovoculi(237)、Smiihella sp.(SC_KO8D17)、Leptospira inadai、Lachnospiraceae bacterium(MA2020)、Francisella novicida(U112)、Candidatus Methanoplasma termitumもしくはEubacterium eligensの第1の相補的ドメイン、またはそれらに由来する第1の相補的ドメインと部分的、すなわち少なくとも50%以上、もしくは完全な相同性を有し得る。
たとえば、第1の相補的ドメインがParcubacteria bacteriumの第1の相補的ドメインまたはそれに由来する第1の相補的ドメインである場合、第1の相補的ドメインは、5'-UUUGUAGAU-3'、または5'-UUUGUAGAU-3'と部分的、すなわち少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。ここで、第1の相補的ドメインは(X)をさらに含み得、5'-(X)UUUGUAGAU-3'がもたらされる。Xは、ヌクレオチドA、T、UおよびGからなる群から選択され得、nはヌクレオチドの数を表し得、それは1~5の整数である。ここで、(X)は、同じヌクレオチドのn個の繰り返し、またはA、T、UおよびGのn個のヌクレオチドの混合物を表し得る。
ここで、リンカードメインは、第1の相補的ドメインを第2の相補的ドメインに連結するヌクレオチド配列であり得る。
リンカードメインは、第1の相補的ドメインと第2の相補的ドメインのそれぞれと共有結合または非共有結合を形成し得る。
リンカードメインは、共有結合または非共有結合により第1の相補的ドメインを第2の相補的ドメインに連結し得る。
リンカードメインは、一本鎖gRNA分子に使用するのに適しており、リンカードメインを使用して、二本鎖gRNAの第1鎖および第2鎖に連結されるか、共有結合または非共有結合により第1鎖を第2鎖と連結することにより一本鎖gRNAを生成することができる。
リンカードメインを使用して、二本鎖gRNAのcrRNAおよびtracrRNAに連結されるか、共有結合または非共有結合によりcrRNAをtracrRNAと連結することにより一本鎖gRNAを生成することができる。
ここで、第2の相補的ドメインは、天然の第2の相補的ドメインと相同性を有していてもよいし、天然の第2の相補的ドメインに由来していてもよい。加えて、第2の相補的ドメインは、天然に存在する種に従って第2の相補的ドメインのヌクレオチド配列に違いを有していてもよく、天然に存在する種に含まれる第2の相補的ドメインに由来していてもよいか、天然に存在する種に含まれる第2の相補的ドメインと部分的または完全な相同性を有していてもよい。
例示的な一実施形態では、第2の相補的ドメインは、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)、カンピロバクター・ジェジュニ(Campylobacter jejuni)、ストレプトコッカス・サーモフィラス(Streptococcus thermophilus)、スタフィロコッカス・アウレウス(Staphylococcus aureus)もしくはナイセリア・メニンギティディス(Neisseria meningitidis)の第2の相補的ドメイン、またはそれらに由来する第2の相補的ドメインと部分的、すなわち少なくとも50%以上、もしくは完全な相同性を有し得る。
たとえば、第2の相補的ドメインが、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)の第2の相補的ドメインまたはそれに由来する第2の相補的ドメインである場合、第2の相補的ドメインは、5'-UAGCAAGUUAAAAU-3'、または5'-UAGCAAGUUAAAAU-3'(第1の相補的ドメインと二本鎖を形成するヌクレオチド配列には下線が引かれている)と部分的、すなわち少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。ここで、第2の相補的ドメインは、(X)および/または(X)をさらに含み得、5'-(X)UAGCAAGUUAAAAU(X)-3'がもたらされる。Xは、ヌクレオチドA、T、UおよびGからなる群から選択され得、nとmのそれぞれは、ヌクレオチドの数を表し得、ここで、nは1~15の整数であり得、mは1~6の整数であり得る。ここで、(X)は、同じヌクレオチドのn個の繰り返し、またはA、T、UおよびGのn個のヌクレオチドの混合物を表す。加えて、(X)は、同じヌクレオチドのm個の繰り返し、またはA、T、UおよびGのm個のヌクレオチドの混合物を表し得る。
別の例において、第2の相補的ドメインが、カンピロバクター・ジェジュニ(Campylobacter jejuni)の第2の相補的ドメインまたはそれに由来する第2の相補的ドメインである場合、第2の相補的ドメインは、5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'、または5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'(第1の相補的ドメインと二本鎖を形成するヌクレオチド配列には下線が引かれている)と部分的、すなわち少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。ここで、第2の相補的ドメインは、(X)および/または(X)をさらに含み得、5'-(X)AAGAAAUUUAAAAAGGGACUAAAAU(X)(X)-3'がもたらされる。Xは、ヌクレオチドA、T、UおよびGからなる群から選択され得、nとmのそれぞれは、ヌクレオチドの数を表し得、ここで、nは1~15の整数であり得、mは1~6の整数であり得る。ここで、(X)は、同じヌクレオチドのn個の繰り返し、またはA、T、UおよびGのn個のヌクレオチドの混合物を表す。加えて、(X)は、同じヌクレオチドのm個の繰り返し、またはA、T、UおよびGのm個のヌクレオチドの混合物を表し得る。
別の実施形態では、第2の相補的ドメインは、Parcubacteria bacterium(GWC2011_GWC2_44_17)、Lachnospiraceae bacterium(MC2017)、Butyrivibrio proteoclasiicus、Peregrinibacteria bacterium(GW2011_GWA_33_10)、Acidaminococcus sp.(BV3L6)、Porphyromonas macacae、Lachnospiraceae bacterium(ND2006)、Porphyromonas crevioricanis、Prevotella disiens、Moraxella bovoculi(237)、Smiihella sp.(SC_KO8D17)、Leptospira inadai、Lachnospiraceae bacterium(MA2020)、Francisella novicida(U112)、Candidatus Methanoplasma termitumもしくはEubacterium eligensの第2の相補的ドメイン、またはそれらに由来する第2の相補的ドメインと部分的、すなわち少なくとも50%以上、もしくは完全な相同性を有し得る。
たとえば、第2の相補的ドメインがParcubacteria bacteriumの第2の相補的ドメインまたはそれに由来する第2の相補的ドメインである場合、第2の相補的ドメインは、5'-AAAUUUCUACU-3'、または5'-AAAUUUCUACU-3'(第1の相補的ドメインと二本鎖を形成するヌクレオチド配列には下線が引かれている)と部分的、すなわち少なくとも50%以上の相同性を有し得るヌクレオチド配列であり得る。ここで、第2の相補的ドメインは(X)および/または(X)をさらに含み得、5'-(X)AAAUUUCUACU(X)-3'がもたらされる。Xは、ヌクレオチドA、T、UおよびGからなる群から選択され得、nとmのそれぞれは、ヌクレオチドの数を表し得、ここで、nは1~10の整数であり得、mは1~6の整数であり得る。ここで、(X)は、同じヌクレオチドのn個の繰り返し、またはA、T、UおよびGのn個のヌクレオチドの混合物を表す。加えて、(X)は、同じヌクレオチドのm個の繰り返し、またはA、T、UおよびGのm個のヌクレオチドの混合物を表し得る。
ここで、第1の相補的ドメインと第2の相補的ドメインは、互いに相補的に結合し得る。
第1の相補的ドメインと第2の相補的ドメインは、相補的結合により二本鎖を形成し得る。
形成された二本鎖は、CRISPR酵素と相互作用し得る。
任意に、第1の相補的ドメインは、第2鎖の第2の相補的ドメインに相補的に結合しない追加のヌクレオチド配列を含み得る。
ここで、追加のヌクレオチド配列は、1~15ヌクレオチド配列であり得る。たとえば、追加のヌクレオチド配列は、1~5、5~10または10~15ヌクレオチド配列であり得る。
ここで、近位ドメインは、第2の相補的ドメインの3'端方向に位置するドメインであり得る。
近位ドメインは、天然の近位ドメインと相同性を有していてもよいし、天然の近位ドメインに由来していてもよい。加えて、近位ドメインは、天然に存在する種に従ってヌクレオチド配列に違いを有していてもよく、天然に存在する種に含まれる近位ドメインに由来していてもよいか、天然に存在する種に含まれる近位ドメインと部分的または完全な相同性を有していてもよい。
例示的な一実施形態では、近位ドメインは、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)、カンピロバクター・ジェジュニ(Campylobacter jejuni)、ストレプトコッカス・サーモフィラス(Streptococcus thermophilus)、スタフィロコッカス・アウレウス(Staphylococcus aureus)もしくはナイセリア・メニンギティディス(Neisseria meningitidis)の近位ドメイン、またはそれらに由来する近位ドメインと部分的、すなわち少なくとも50%以上、もしくは完全な相同性を有し得る。
たとえば、近位ドメインが、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)の近位ドメインまたはそれに由来する近位ドメインである場合、近位ドメインは、5'-AAGGCUAGUCCG-3'、または5'-AAGGCUAGUCCG-3'と部分的、すなわち少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。ここで、近位ドメインは、(X)をさらに含み得、5'-AAGGCUAGUCCG(X)-3'がもたらされる。Xは、ヌクレオチドA、T、UおよびGからなる群から選択され得、nはヌクレオチドの数を表し得、それは1~15の整数である。ここで、(X)は、同じヌクレオチドのn個の繰り返し、またはA、T、UおよびGのn個のヌクレオチドの混合物を表す。
さらに別の例では、近位ドメインが、カンピロバクター・ジェジュニ(Campylobacter jejuni)の近位ドメインまたはそれに由来する近位ドメインである場合、近位ドメインは、5'-AAAGAGUUUGC-3'、または5'-AAAGAGUUUGC-3'と部分的、すなわち少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。ここで、近位ドメインは、(X)をさらに含み得、5'-AAAGAGUUUGC(X)-3'がもたらされる。Xは、ヌクレオチドA、T、UおよびGからなる群から選択され得、nはヌクレオチドの数を表し得、それは1~40の整数である。ここで、(X)は、同じヌクレオチドのn個の繰り返し、またはA、T、UおよびGのn個のヌクレオチドの混合物を表す。
ここで、テールドメインは、一本鎖gRNAの3'末端または二本鎖gRNAの第1の鎖または第2鎖に選択的に付加され得るドメインである。
テールドメインは、天然のテールドメインと相同性を有していてもよいし、天然のテールドメインに由来していてもよい。加えて、テールドメインは、天然に存在する種に従ってヌクレオチド配列に違いを有していてもよく、天然に存在する種に含まれるテールドメインに由来していてもよいか、天然に存在する種に含まれるテールドメインと部分的または完全な相同性を有していてもよい。
例示的な一実施形態では、テールドメインは、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)、カンピロバクター・ジェジュニ(Campylobacter jejuni)、ストレプトコッカス・サーモフィラス(Streptococcus thermophilus)、スタフィロコッカス・アウレウス(Staphylococcus aureus)もしくはナイセリア・メニンギティディス(Neisseria meningitidis)のテールドメイン、またはそれらに由来するテールドメインと部分的、すなわち少なくとも50%以上、もしくは完全な相同性を有し得る。
たとえば、テールドメインが、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)のテールドメインまたはそれに由来するテールドメインである場合、テールドメインは、5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'、または5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'と部分的、すなわち少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。ここで、テールドメインは、(X)をさらに含み得、5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(X)-3'がもたらされる。Xは、ヌクレオチドA、T、UおよびGからなる群から選択され得、nはヌクレオチドの数を表し得、それは1~15の整数である。ここで、(X)は、同じヌクレオチドのn個の繰り返し、またはA、T、UおよびGのn個のヌクレオチドの混合物を表す。
別の例では、テールドメインが、カンピロバクター・ジェジュニ(Campylobacter jejuni)のテールドメインまたはそれに由来するテールドメインである場合、テールドメインは、5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'、または5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'と部分的、すなわち少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。ここで、テールドメインは、(X)をさらに含み得、5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU(X)-3'がもたらされる。Xは、ヌクレオチドA、T、UおよびGからなる群から選択され得、nはヌクレオチドの数を表し得、それは1~15の整数である。ここで、(X)は、同じヌクレオチドのn個の繰り返し、またはA、T、UおよびGのn個のヌクレオチドの混合物を表す。
別の実施形態では、テールドメインは、in vitroまたはin vivo転写方法に関与する3'末端に1~10ヌクレオチド配列を含み得る。
たとえば、T7プロモーターがgRNAのin vitro転写に使用される場合、テールドメインはDNAテンプレートの3'末端に存在する任意のヌクレオチド配列であり得る。加えて、U6プロモーターがin vivo転写で使用される場合、テールドメインはUUUUUUであり得、H1プロモーターが転写で使用される場合、テールドメインはUUUUであり得、pol-IIIプロモーターが使用される場合、テールドメインは、いくつかのウラシルヌクレオチドまたは代替ヌクレオチドを含み得る。
gRNAは、上記のように複数のドメインを含み得るため、核酸配列の長さは、gRNAに含まれるドメインに従って調節され、相互作用は、各ドメインに基づき、gRNAの三次元構造の鎖もしくは活性型において、またはこれらの鎖間で起こり得る。
gRNAは、一本鎖gRNA(単一RNA分子);または二本鎖gRNA(2つ以上、一般には2つの別個のRNA分子を含む)と呼ばれ得る。
二本鎖gRNA
二本鎖gRNAは、第1鎖と第2鎖からなる。
ここで、第1鎖は、
5'-[ガイドドメイン]-[第1の相補的ドメイン]-3'からなり、
第2鎖は、5'-[第2の相補的ドメイン]-[近位ドメイン]-3'または
5'-[第2の相補的ドメイン]-[近位ドメイン]-[テールドメイン]-3'
からなる。
ここで、第1鎖はcrRNAと呼ばれ得、第2鎖はtracrRNAと呼ばれ得る。
ここで、第1鎖と第2鎖は、追加のヌクレオチド配列を任意に含み得る。
一例では、第1鎖は、
5'-(Ntarget)-(Q)-3';または
5'-(X)-(Ntarget)-(X)-(Q)-(X)-3'であり得る。
ここで、Ntargetは、標的遺伝子の転写調節領域内の核酸の二本鎖のいずれかの鎖の部分配列に相補的なヌクレオチド配列であり、標的遺伝子の転写調節領域内の核酸上の標的配列に従って変化し得るヌクレオチド配列領域である。
ここで、(Q)は、第2鎖の第2の相補的ドメインと相補的な結合を形成することができる第1の相補的ドメインを含むヌクレオチド配列である。(Q)は、天然に存在する種の第1の相補的ドメインと部分的または完全な相同性を有する配列であり得、第1の相補的ドメインのヌクレオチド配列は、種の起源に応じて変化し得る。Qは、A、U、CおよびGからなる群からそれぞれ独立して選択され得、mはヌクレオチドの数であり得、それは5~35の整数である。
たとえば、第1の相補的ドメインが、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)の第1の相補的ドメインまたはストレプトコッカス・ピオゲネス(Streptococcus pyogenes)由来の第1の相補的ドメインと部分的または完全な相同性を有する場合、(Q)は、5'-GUUUUAGAGCUA-3'、または5'-GUUUUAGAGCUA-3'と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
別の例では、第1の相補的ドメインが、カンピロバクター・ジェジュニ(Campylobacter jejuni)の第1の相補的ドメインまたはカンピロバクター・ジェジュニ(Campylobacter jejuni)由来の第1の相補的ドメインと部分的または完全な相同性を有する場合、(Q)は、5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'、または5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
さらに別の例では、第1の相補的ドメインが、ストレプトコッカス・サーモフィラス(Streptococcus thermophilus)の第1の相補的ドメインまたはストレプトコッカス・サーモフィラス(Streptococcus thermophilus)由来の第1の相補的ドメインと部分的または完全な相同性を有する場合、(Q)は、5'-GUUUUAGAGCUGUGUUGUUUCG-3'、または5'-GUUUUAGAGCUGUGUUGUUUCG-3'と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
加えて、(X)、(X)および(X)のそれぞれは、選択的に追加のヌクレオチド配列であり、ここで、Xは、A、U、CおよびGからなる群からそれぞれ独立して選択され、a、bおよびcのそれぞれは、ヌクレオチドの数であり得、それは0または1~20の整数である。
例示的な一実施形態では、第2鎖は5'-(Z)-(P)-3';または5'-(X)-(Z)-(X)-(P)-(X)-3'であり得る。
別の実施形態では、第2鎖は、5'-(Z)-(P)-(F)-3';または5'-(X)-(Z)-(X)-(P)-(X)-(F)-3'であり得る。
ここで、(Z)は、第1鎖の第1の相補的ドメインと相補的な結合を形成することができる第2の相補的ドメインを含むヌクレオチド配列である。(Z)は、天然に存在する種の第2の相補的ドメインと部分的または完全な相同性を有する配列であり得、第2の相補的ドメインのヌクレオチド配列は、種の起源に応じて修飾され得る。Zは、A、U、CおよびGからなる群からそれぞれ独立して選択され得、hはヌクレオチドの数であり得、それは5~50の整数である。
たとえば、第2の相補的ドメインがストレプトコッカス・ピオゲネス(Streptococcus pyogenes)の第2の相補的ドメインまたはそれに由来する第2の相補的ドメインと部分的または完全な相同性を有する場合、(Z)は、5'-UAGCAAGUUAAAAU-3'、または5'-UAGCAAGUUAAAAU-3'と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
別の例では、第2の相補的ドメインがカンピロバクター・ジェジュニ(Campylobacter jejuni)の第2の相補的ドメインまたはそれに由来する第2の相補的ドメインと部分的または完全な相同性を有する場合、(Z)は、5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'、または5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
さらに別の例では、第2の相補的ドメインがストレプトコッカス・サーモフィラス(Streptococcus thermophilus)の第2の相補的ドメインまたはそれに由来する第2の相補的ドメインと部分的または完全な相同性を有する場合、(Z)は、5'-CGAAACAACACAGCGAGUUAAAAU-3'、または5'-CGAAACAACACAGCGAGUUAAAAU-3'と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
(P)は、天然に存在する種の近位ドメインと部分的または完全な相同性を有し得る近位ドメインを含むヌクレオチド配列であり、近位ドメインのヌクレオチド配列は、種の起源に応じて修飾され得る。 Pは、A、U、CおよびGからなる群からそれぞれ独立して選択され得、kは、1~20の整数であるヌクレオチドの数であり得る。
たとえば、近位ドメインがストレプトコッカス・ピオゲネス(Streptococcus pyogenes)の近位ドメインまたはそれに由来する近位ドメインと部分的または完全な相同性を有する場合、(P)は、5'-AAGGCUAGUCCG-3'、または5'-AAGGCUAGUCCG-3'と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
別の例では、近位ドメインがカンピロバクター・ジェジュニ(Campylobacter jejuni)の近位ドメインまたはそれに由来する近位ドメインと部分的または完全な相同性を有する場合、(P)は、5'-AAAGAGUUUGC-3'、または5'-AAAGAGUUUGC-3'と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
さらに別の例では、近位ドメインがストレプトコッカス・サーモフィラス(Streptococcus thermophilus)の近位ドメインまたはそれに由来する近位ドメインと部分的または完全な相同性を有する場合、(P)は、5'-AAGGCUUAGUCCG-3'、または5'-AAGGCUUAGUCCG-3'と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
(F)は、テールドメインを含み、天然に存在する種のテールドメインと部分的または完全な相同性を有するヌクレオチド配列であり得、テールドメインのヌクレオチド配列は、種の起源に応じて修飾され得る。Fは、A、U、CおよびGからなる群からそれぞれ独立して選択されてもよく、iはヌクレオチドの数であり得、それは1~50の整数である。
たとえば、テールドメインがストレプトコッカス・ピオゲネス(Streptococcus pyogenes)のテールドメインまたはそれに由来するテールドメインと部分的または完全な相同性を有する場合、(F)は、5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'、または5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
別の例では、テールドメインがカンピロバクター・ジェジュニ(Campylobacter jejuni)のテールドメインまたはそれに由来するテールドメインと部分的または完全な相同性を有する場合、(F)は、5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'、または5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
さらに別の例では、テールドメインがストレプトコッカス・サーモフィラス(Streptococcus thermophilus)のテールドメインまたはそれに由来するテールドメインと部分的または完全な相同性を有する場合、(F)は、5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'、または5'- UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
加えて、(F)は、in vitroまたはin vivo転写法に関与する3'末端に1~10ヌクレオチド配列を含み得る。
たとえば、T7プロモーターがgRNAのin vitro転写に使用される場合、テールドメインはDNAテンプレートの3'末端に存在する任意のヌクレオチド配列であり得る。加えて、U6プロモーターがin vivo転写で使用される場合、テールドメインはUUUUUUであり得、H1プロモーターが転写で使用される場合、テールドメインはUUUUであり得、pol-IIIプロモーターが使用される場合、テールドメインは、いくつかのウラシルヌクレオチドまたは代替ヌクレオチドを含み得る。
加えて、(X)、(X)および(X)は、選択的に追加されるヌクレオチド配列であり得、Xは、A、U、CおよびGからなる群からそれぞれ独立して選択され、d、eおよびfのそれぞれは、ヌクレオチドの数であり得、それは0または1~20の整数である。
一本鎖gRNA
一本鎖gRNAは、第1の一本鎖gRNAと第2の一本鎖gRNAに分類され得る。
第1の一本鎖gRNA
第1の一本鎖gRNAは、二本鎖gRNAの第1鎖または第2鎖がリンカードメインにより連結されている一本鎖gRNAである。
具体的には、一本鎖gRNAは、
5'-[ガイドドメイン]-[第1の相補的ドメイン]-[リンカードメイン]-[第2の相補的ドメイン]-3'、
5'-[ガイドドメイン]-[第1の相補的ドメイン]-[リンカードメイン]-[第2の相補的ドメイン]-[近位ドメイン]-3'または
5'-[ガイドドメイン]-[第1の相補的ドメイン]-[リンカードメイン]-[第2の相補的ドメイン]-[近位ドメイン]-[テールドメイン]-3'
からなり得る。
第1の一本鎖gRNAは、追加のヌクレオチド配列を選択的に含み得る。
例示的な一実施形態では、第1の一本鎖gRNAは、
5'-(Ntarget)-(Q)-(L)-(Z)-3';
5'-(Ntarget)―(Q)-(L)-(Z)-(P)-3';または
5'-(Ntarget)―(Q)-(L)-(Z)-(P)-(F)-3'
であり得る。
別の実施形態では、一本鎖gRNAは、
5'-(X)-(Ntarget)-(X)-(Q)-(X)-(L)-(X)-(Z)-(X)-3';
5'-(X)-(Ntarget)-(X)-(Q)-(X)-(L)-(X)-(Z)-(X)-(P)-(X)-3';または
5'-(X)-(Ntarget)-(X)-(Q)-(X)-(L)-(X)-(Z)-(X)-(P)-(X)-(F)-3'
であり得る。
ここで、Ntargetは、標的遺伝子の転写調節領域内の核酸の二本鎖のいずれかの鎖の部分配列に相補的なヌクレオチド配列であり、標的遺伝子の転写調節領域内の核酸上の標的配列に従って変化し得るヌクレオチド配列領域である。
ここで、(Q)は、第2の相補的ドメインと相補的な結合を形成することができる第1の相補的ドメインを含むヌクレオチド配列を含む。(Q)は、天然に存在する種の第1の相補的ドメインと部分的または完全な相同性を有する配列であり得、第1の相補的ドメインのヌクレオチド配列は、種の起源に応じて変化し得る。Qは、A、U、CおよびGからなる群からそれぞれ独立して選択され得、mはヌクレオチドの数であり得、それは5~35の整数である。
たとえば、第1の相補的ドメインが、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)の第1の相補的ドメインまたはそれに由来する第1の相補的ドメインと部分的または完全な相同性を有する場合、(Q)は、5'-GUUUUAGAGCUA-3'、または5'-GUUUUAGAGCUA-3'と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
別の例では、第1の相補的ドメインが、カンピロバクター・ジェジュニ(Campylobacter jejuni)の第1の相補的ドメインまたはそれに由来する第1の相補的ドメインと部分的または完全な相同性を有する場合、(Q)は、5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'、または5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
さらに別の例では、第1の相補的ドメインが、ストレプトコッカス・サーモフィラス(Streptococcus thermophilus)の第1の相補的ドメインまたはそれに由来する第1の相補的ドメインと部分的または完全な相同性を有する場合、(Q)は、5'-GUUUUAGAGCUGUGUUGUUUCG-3'、または5'-GUUUUAGAGCUGUGUUGUUUCG-3'と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
加えて、(L)は、リンカードメインを含むヌクレオチド配列であり、第1の相補的ドメインを第2の相補的ドメインに連結し、それによって一本鎖gRNAを生成する。ここで、Lは、A、U、CおよびGからなる群からそれぞれ独立して選択され得、jは、1~30の整数であるヌクレオチドの数であり得る。
(Z)は、第2の相補的ドメインを含むヌクレオチド配列であり、第1の相補的ドメインと相補的に結合することができるヌクレオチド配列を含む。(Z)は、天然に存在する種の第2の相補的ドメインと部分的または完全な相同性を有する配列であり得、第2の相補的ドメインのヌクレオチド配列は、種の起源に応じて改変され得る。Zは、A、U、CおよびGからなる群からそれぞれ独立して選択され得、hはヌクレオチドの数であり得、それは5~50の整数である。
たとえば、第2の相補的ドメインがストレプトコッカス・ピオゲネス(Streptococcus pyogenes)の第2の相補的ドメインまたはそれに由来する第2の相補的ドメインと部分的または完全な相同性を有する場合、(Z)は、5'-UAGCAAGUUAAAAU-3'、または5'-UAGCAAGUUAAAAU-3'と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
別の例では、第2の相補的ドメインがカンピロバクター・ジェジュニ(Campylobacter jejuni)の第2の相補的ドメインまたはそれに由来する第2の相補的ドメインと部分的または完全な相同性を有する場合、(Z)は、5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'、または5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
さらに別の例では、第2の相補的ドメインがストレプトコッカス・サーモフィラス(Streptococcus thermophilus)の第2の相補的ドメインまたはそれに由来する第2の相補的ドメインと部分的または完全な相同性を有する場合、(Z)は、5'-CGAAACAACACAGCGAGUUAAAAU-3'、または5'-CGAAACAACACAGCGAGUUAAAAU-3'と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
(P)は、天然に存在する種の近位ドメインと部分的または完全な相同性を有し得る近位ドメインを含むヌクレオチド配列であり、近位ドメインのヌクレオチド配列は、種の起源に応じて修飾され得る。Pは、A、U、CおよびGからなる群からそれぞれ独立して選択され得、kは、1~20の整数であるヌクレオチドの数であり得る。
たとえば、近位ドメインがストレプトコッカス・ピオゲネス(Streptococcus pyogenes)の近位ドメインまたはそれに由来する近位ドメインと部分的または完全な相同性を有する場合、(P)は、5'-AAGGCUAGUCCG-3'、または5'-AAGGCUAGUCCG-3'と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
別の例では、近位ドメインがカンピロバクター・ジェジュニ(Campylobacter jejuni)の近位ドメインまたはそれに由来する近位ドメインと部分的または完全な相同性を有する場合、(P)は、5'-AAAGAGUUUGC-3'、または5'-AAAGAGUUUGC-3'と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
さらに別の例では、近位ドメインがストレプトコッカス・サーモフィラス(Streptococcus thermophilus)の近位ドメインまたはそれに由来する近位ドメインと部分的または完全な相同性を有する場合、(P)は、5'-AAGGCUUAGUCCG-3'、または5'-AAGGCUUAGUCCG-3'と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
(F)は、テールドメインを含み、天然に存在する種のテールドメインと部分的または完全な相同性を有するヌクレオチド配列であり得、テールドメインのヌクレオチド配列は、種の起源に応じて修飾され得る。Fは、A、U、CおよびGからなる群からそれぞれ独立して選択されてもよく、iはヌクレオチドの数であり得、それは1~50の整数である。
たとえば、テールドメインがストレプトコッカス・ピオゲネス(Streptococcus pyogenes)のテールドメインまたはそれに由来するテールドメインと部分的または完全な相同性を有する場合、(F)は、5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'、または5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
別の例では、テールドメインがカンピロバクター・ジェジュニ(Campylobacter jejuni)のテールドメインまたはそれに由来するテールドメインと部分的または完全な相同性を有する場合、(F)は、5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'、または5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
さらに別の例では、テールドメインがストレプトコッカス・サーモフィラス(Streptococcus thermophilus)のテールドメインまたはそれに由来するテールドメインと部分的または完全な相同性を有する場合、(F)は、5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'、または5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
加えて、(F)は、in vitroまたはin vivo転写法に関与する3'末端に1~10ヌクレオチド配列を含み得る。
たとえば、T7プロモーターがgRNAのin vitro転写に使用される場合、テールドメインはDNAテンプレートの3'末端に存在する任意のヌクレオチド配列であり得る。加えて、U6プロモーターがin vivo転写で使用される場合、テールドメインはUUUUUUであり得、H1プロモーターが転写で使用される場合、テールドメインはUUUUであり得、pol-IIIプロモーターが使用される場合、テールドメインは、いくつかのウラシルヌクレオチドまたは代替ヌクレオチドを含み得る。
加えて、(X)、(X)、(X)、(X)、(X)および(X)は、選択的に追加されるヌクレオチド配列であり得、ここで、Xは、A、U、CおよびGからなる群からそれぞれ独立して選択され、a、b、c、d、eおよびfのそれぞれは、ヌクレオチドの数であり得、それは0または1~20の整数である。
第2の一本鎖gRNA
第2の一本鎖gRNAは、ガイドドメイン、第1の相補的ドメインおよび第2の相補的ドメインからなる一本鎖gRNAであり得る。
ここで、第2の一本鎖gRNAは、以下のものからなり得る:
5'-[第2の相補的ドメイン]-[第1の相補的ドメイン]-[ガイドドメイン]-3';または
5'-[第2の相補的ドメイン]-[リンカードメイン]-[第1の相補的ドメイン]-[ガイドドメイン]-3'。
第2の一本鎖gRNAは、追加のヌクレオチド配列を選択的に含み得る。
例示的な一実施形態では、第2の一本鎖gRNAは、
5'-(Z)-(Q)-(Ntarget)-3';または
5'-(X)-(Z)-(X)-(Q)-(X)-(Ntarget)―3'であり得る。
別の実施形態では、一本鎖gRNAは、
5'-(Z)-(L)-(Q)-(Ntarget)-3';または
5'-(X)-(Z)-(L)-(Q)-(X)-(Ntarget)―3'であり得る。
ここで、Ntargetは、標的遺伝子の転写調節領域内の核酸の二本鎖のいずれかの鎖の部分配列に相補的なヌクレオチド配列であり、標的遺伝子の転写調節領域上の標的配列に従って変化することができるヌクレオチド配列領域である。(Q)は、第1の相補的ドメインを含むヌクレオチド配列であり、第2の相補的ドメインと相補的に結合することができるヌクレオチド配列を含む。(Q)は、天然に存在する種の第1の相補的ドメインと部分的または完全な相同性を有する配列であり得、第1の相補的ドメインのヌクレオチド配列は、種の起源に応じて変化し得る。Qは、A、U、CおよびGからなる群からそれぞれ独立して選択され得、mはヌクレオチドの数であり得、それは5~35の整数である。
たとえば、第1の相補的ドメインが、Parcubacteria bacteriumの第1の相補的ドメインまたはそれに由来する第1の相補的ドメインと部分的または完全な相同性を有する場合、(Q)は、5'-UUUGUAGAU-3'、または5'-UUUGUAGAU-3'と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
(Z)は、第2の相補的ドメインを含むヌクレオチド配列であり、第2の相補的ドメインと相補的に結合することができるヌクレオチド配列を含む。(Z)は、天然に存在する種の第2の相補的ドメインと部分的または完全な相同性を有する配列であり得、第2の相補的ドメインのヌクレオチド配列は、種の起源に応じて修飾され得る。Zは、A、U、CおよびGからなる群からそれぞれ独立して選択され得、mはヌクレオチドの数であり得、それは5~50の整数である。
たとえば、第2の相補的ドメインが、Parcubacteria bacteriumの第2の相補的ドメイン、またはParcubacteria bacterium由来の第2の相補的ドメインと部分的または完全な相同性を有する場合、(Z)は、5'-AAAUUUCUACU-3'、または5'-AAAUUUCUACU-3'と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
加えて、(L)は、リンカードメインを含むヌクレオチド配列であり、それは第1の相補的ドメインを第2の相補的ドメインに連結する。ここで、Lは、A、U、CおよびGからなる群からそれぞれ独立して選択され得、jは、1~30の整数であるヌクレオチドの数であり得る。
加えて、(X)、(X)および(X)の各々は、選択的に追加されるヌクレオチド配列であり得、ここで、Xは、A、U、CおよびGからなる群からそれぞれ独立して選択され、a、bおよびcは、ヌクレオチドの数であり得、それは0または1~20の整数である。本明細書の例示的な一実施形態では、ガイド核酸は、重複遺伝子の転写調節領域内の標的配列に相補的に結合するgRNAであり得る。
「標的配列」とは、標的遺伝子の転写調節領域に存在するヌクレオチド配列であり、具体的には、標的遺伝子の転写調節領域内の標的領域の部分ヌクレオチド配列であり、ここで、「標的領域」とは、標的遺伝子の転写調節領域内のガイド核酸エディタータンパク質によって修飾され得る領域である。
以下、標的配列は、2種類のヌクレオチド配列情報の両方を指すために使用され得る。たとえば、標的遺伝子の場合、標的配列は、標的遺伝子DNAの転写鎖のヌクレオチド配列情報、または非転写鎖のヌクレオチド配列情報を指し得る。
たとえば、標的配列は、標的遺伝子Aの標的領域内の部分ヌクレオチド配列(転写鎖)、すなわち5'-ATCATTGGCAGACTAGTTCG-3'と、それに相補的なヌクレオチド配列(非転写鎖)、すなわち5'-CGAACTAGTCTGCCAATGAT-3'を指し得る。
標的配列は、5~50nt配列であり得る。
例示的な一実施形態では、標的配列は、16ヌクレオチド配列、17ヌクレオチド配列、18ヌクレオチド配列、19ヌクレオチド配列、20ヌクレオチド配列、21ヌクレオチド配列、22ヌクレオチド配列、23ヌクレオチド配列、24ヌクレオチド配列または25ヌクレオチド配列であり得る。
標的配列は、ガイド核酸結合配列またはガイド核酸非結合配列を含む。
「ガイド核酸結合配列」とは、ガイド核酸のガイドドメインに含まれるガイド配列と部分的または完全な相補性を有するヌクレオチド配列であり、ガイド核酸のガイドドメインに含まれるガイド配列と相補的に結合していてもよい。標的配列およびガイド核酸結合配列は、標的遺伝子の転写調節領域に応じて遺伝子改変または編集される標的に従って変化し得るヌクレオチド配列であり得、標的遺伝子の転写調節領域内の核酸配列に従ってさまざまな手法で設計され得る。
「ガイド核酸非結合配列」とは、ガイド核酸のガイドドメインに含まれるガイド配列と部分的または完全な相同性を有するヌクレオチド配列であり、ガイド核酸のガイドドメインに含まれるガイド配列と相補的に結合していなくてもよい。加えて、ガイド核酸非結合配列は、ガイド核酸結合配列と相補性を有するヌクレオチド配列であり得、ガイド核酸結合配列と相補的に結合していてもよい。
ガイド核酸結合配列は、標的配列の部分ヌクレオチド配列と、標的配列に含まれる互いに異なる配列順序を有する2つのヌクレオチド配列のうちの1つのヌクレオチド配列、すなわち、互いに相補的に結合することができる2つのヌクレオチド配列のうちの1つであり得る。ここで、ガイド核酸非結合配列は、標的配列のガイド核酸結合配列以外のヌクレオチド配列であり得る。
たとえば、標的遺伝子Aの転写調節領域内の標的領域の部分ヌクレオチド配列、すなわち5'-ATCATTGGCAGACTAGTTCG-3'と、ヌクレオチド配列、すなわち、それに相補的である5'-CGAACTAGTCTGCCAATGAT-3'が標的配列として使用される場合、ガイド核酸結合配列は、2つの標的配列、すなわち5'-ATCATTGGCAGACTAGTTCG-3'または5'-CGAACTAGTCTGCCAATGAT-3'のうちの1つであり得る。ここで、ガイド核酸結合配列が5'-ATCATTGGCAGACTAGTTCG-3'である場合、ガイド核酸非結合配列は5'-CGAACTAGTCTGCCAATGAT-3'であり得、ガイド核酸結合配列が5'-CGAACTAGTCTGCCAATGAT-3'である場合、ガイド核酸非結合配列は5'-ATCATTGGCAGACTAGTTCG-3'であり得る。
ガイド核酸結合配列は、標的配列の1つ、すなわち、転写鎖と同じヌクレオチド配列および非転写鎖と同じヌクレオチド配列であり得る。ここで、ガイド核酸非結合配列は、標的配列のガイド核酸結合配列以外のヌクレオチド配列、すなわち、転写鎖と同じヌクレオチド配列および非転写鎖と同じであるヌクレオチド配列から選択されるものであり得る。
ガイド核酸結合配列は、標的配列と同じ長さを有し得る。
ガイド核酸非結合配列は、標的配列またはガイド核酸結合配列と同じ長さを有し得る。
ガイド核酸結合配列は、5~50ヌクレオチド配列であり得る。
例示的な一実施形態では、ガイド核酸結合配列は、16ヌクレオチド配列、17ヌクレオチド配列、18ヌクレオチド配列、19ヌクレオチド配列、20ヌクレオチド配列、21ヌクレオチド配列、22ヌクレオチド配列、23ヌクレオチド配列、24ヌクレオチド配列または25ヌクレオチド配列であり得る。
ガイド核酸非結合配列は、5~50ヌクレオチド配列であり得る。
例示的な一実施形態では、ガイド核酸非結合配列は、16ヌクレオチド配列、17ヌクレオチド配列、18ヌクレオチド配列、19ヌクレオチド配列、20ヌクレオチド配列、21ヌクレオチド配列、22ヌクレオチド配列、23ヌクレオチド配列、24ヌクレオチド配列または25ヌクレオチド配列であり得る。
ガイド核酸結合配列は、ガイド核酸のガイドドメインに含まれるガイド配列に部分的または完全に相補的に結合してもよく、ガイド核酸結合配列の長さは、ガイド配列の長さと同じであり得る。
ガイド核酸結合配列は、ガイド核酸のガイドドメインに含まれるガイド配列に相補的なヌクレオチド配列、たとえば、少なくとも70%、75%、80%、85%、90%、95%以上の相補性または完全な相補性を有するヌクレオチド配列であり得る。
一例として、ガイド核酸結合配列は、ガイド核酸のガイドドメインに含まれるガイド配列に相補的ではない1~8ヌクレオチド配列を有していても、含んでいてもよい。
ガイド核酸非結合配列は、ガイド核酸のガイドドメインに含まれるガイド配列と部分的または完全な相同性を有してもよく、ガイド核酸非結合配列の長さはガイド配列の長さと同じであり得る。
ガイド核酸非結合配列は、ガイド核酸のガイドドメインに含まれるガイド配列と相同性を有するヌクレオチド配列、たとえば、少なくとも70%、75%、80%、85%、90%、95%以上の相同性または完全な相同性を有するヌクレオチド配列であり得る。
一例では、ガイド核酸非結合配列は、ガイド核酸のガイドドメインに含まれるガイド配列と相同ではない1~8ヌクレオチド配列を有していても含んでいてもよい。
ガイド核酸非結合配列は、ガイド核酸結合配列と相補的に結合してもよく、ガイド核酸非結合配列は、ガイド核酸結合配列と同じ長さを有していてもよい。
ガイド核酸非結合配列は、ガイド核酸結合配列に相補的なヌクレオチド配列、たとえば、少なくとも90%、95%以上の相補性または完全な相補性を有するヌクレオチド配列であり得る。
一例では、ガイド核酸非結合配列は、ガイド核酸結合配列に相補的ではない1~2ヌクレオチド配列を有しても含んでいてもよい。
加えて、ガイド核酸結合配列は、エディタータンパク質によって認識されるヌクレオチド配列の付近に位置するヌクレオチド配列であり得る。
一例では、ガイド核酸結合配列は、エディタータンパク質によって認識されるヌクレオチド配列の5'末端および/または3'末端に隣接して位置する連続した5~50ヌクレオチド配列であり得る。
加えて、ガイド核酸非結合配列は、エディタータンパク質によって認識されるヌクレオチド配列の付近に位置するヌクレオチド配列であり得る。
一例では、ガイド核酸非結合配列は、エディタータンパク質によって認識されるヌクレオチド配列の5'末端および/または3'末端に隣接して位置する連続した5~50ヌクレオチド配列であり得る。
「ターゲティング」とは、標的遺伝子の転写調節領域に存在する標的配列のガイド核酸結合配列との相補的結合を指す。ここで、相補的結合は、100%完全な相補的結合、または70%以上100%未満の不完全な相補的結合であり得る。したがって、「ターゲティングgRNA」とは、標的遺伝子の転写調節領域に存在する標的配列のガイド核酸結合配列に相補的に結合するgRNAを指す。
本明細書に開示される標的遺伝子は、重複遺伝子であり得る。
本明細書に開示される標的遺伝子は、PMP22遺伝子、PLP1遺伝子、MECP2遺伝子、SOX3遺伝子、RAI1遺伝子、TBX1遺伝子、ELN遺伝子、JAGGED1遺伝子、NSD1遺伝子、MMP23遺伝子、LMB1遺伝子、SNCA遺伝子および/またはAPP遺伝子であり得る。
本明細書に開示される標的遺伝子は、癌遺伝子であり得る。
ここで、癌遺伝子は、MYC遺伝子、ERBB2(HER2)遺伝子、CCND1(サイクリンD1)遺伝子、FGFR1遺伝子、FGFR2遺伝子、HRAS遺伝子、KRAS遺伝子、MYB遺伝子、MDM2遺伝子、 CCNE(サイクリンE)遺伝子、MET遺伝子、CDK4遺伝子、ERBB1遺伝子、MYCN遺伝子および/またはAKT2遺伝子であり得る。
例示的な実施形態では、本明細書で開示される標的配列は、重複遺伝子のプロモーター領域に位置する連続した10~35ヌクレオチド配列であり得る。
ここで、重複遺伝子は、PMP22遺伝子、PLP1遺伝子、MECP2遺伝子、SOX3遺伝子、RAI1遺伝子、TBX1遺伝子、ELN遺伝子、JAGGED1遺伝子、NSD1遺伝子、MMP23遺伝子、LMB1遺伝子、SNCA遺伝子およびAPP遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
あるいは、重複遺伝子は、MYC遺伝子、ERBB2(HER2)遺伝子、CCND1(サイクリンD1)遺伝子、FGFR1遺伝子、FGFR2遺伝子、HRAS遺伝子、KRAS遺伝子、MYB遺伝子、MDM2遺伝子、CCNE(サイクリンE)遺伝子、MET遺伝子、CDK4遺伝子、ERBB1遺伝子、MYCN遺伝子およびAKT2遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
標的配列は、10~35ヌクレオチド配列、15~35ヌクレオチド配列、20~35ヌクレオチド配列、25~35ヌクレオチド配列または30~35ヌクレオチド配列であり得る。
あるいは、標的配列は、10~15ヌクレオチド配列、15~20ヌクレオチド配列、20~25ヌクレオチド配列、25~30ヌクレオチド配列または30~35ヌクレオチド配列であり得る。
一例では、標的配列は、重複遺伝子のコアプロモーター領域に位置する連続した10~25ヌクレオチド配列であり得る。
たとえば、標的配列は、重複遺伝子のTTSを含む領域またはその付近の領域に位置する連続した10~25ヌクレオチド配列であり得る。
たとえば、標的配列は、重複遺伝子のRNAポリメラーゼ結合領域を含む領域またはその付近の領域に位置する連続した10~25ヌクレオチド配列であり得る。
たとえば、標的配列は、重複遺伝子の転写因子結合領域を含む領域またはその付近の領域に位置する連続した10~25ヌクレオチド配列であり得る。
たとえば、標的配列は、重複遺伝子のTATAボックスを含む領域またはその付近の領域に位置する連続した10~25ヌクレオチド配列であり得る。
たとえば、標的配列は、重複遺伝子のコアプロモーター領域に存在する5'-TATA(A/T)A(A/T)-3'配列の全体または一部を含む連続した10~25ヌクレオチド配列であり得る。
たとえば、標的配列は、重複遺伝子のコアプロモーター領域に存在する5'-TATA(A/T)A(A/T)(A/G)-3'配列の全体または一部を含む連続した10~25ヌクレオチド配列であり得る。
たとえば、標的配列は、重複遺伝子のコアプロモーター領域に存在する5'-CATAAAA-3'配列、5'-CATAAAA-3'配列、5'-TATAA-3'配列、5'-TATAAAA-3'配列、5'-CATAAATA-3'配列、5'-TATATAA-3'配列、5'-TATATATATATATAA-3'配列、5'-TATATTATA-3'配列、5'-TATAAA-3'配列、5'-TATAAAATA-3'配列、5'-TATATA-3'配列、5'-GATTAAAAA-3'配列、5'-TATAAAAA-3'配列、5'-TTATAA-3'配列、5'-TTTTAAAA-3'配列、5'-TCTTTAAAA-3'配列、5'-GACATTTAA-3'配列、5'-TGATATCAA-3'配列、5'-TATAAATA-3'配列、5'-TATAAGA-3'配列、5'-AATAAA-3'配列、5'-TTTATA-3'配列、5'-CATAAAAA-3'配列、5'-TATACA-3'配列、5'-TTTAAGA-3'配列、5'-GATAAAG-3'配列、5'-TATAACA-3'配列、5'-TCTTATCTT-3'配列、5'-TTGTACTTT-3'配列、5'-CATATAA-3'配列、5'-TATAAAT-3'配列、5'-TATATATAAAAAAAA-3'配列および5'-CATAAATAAAAAAAATTA-3'配列からなる群より選択される1つまたは複数の配列の全体または一部を含む連続した10~25ヌクレオチド配列であり得る。
たとえば、標的配列は、重複遺伝子のコアプロモーター領域に存在するTATA結合タンパク質(TBP)結合核酸配列の全体または一部を含む連続した10~25ヌクレオチド配列であり得る。
別の例では、標的配列は、重複遺伝子の近位プロモーター領域に位置する連続した10~25ヌクレオチド配列であり得る。
たとえば、標的配列は、重複遺伝子のTSSの1~300bpの上流領域に位置する連続した10~25ヌクレオチド配列であり得る。
さらに別の例では、標的配列は、重複遺伝子の遠位プロモーター領域に位置する連続した10~25ヌクレオチド配列であり得る。
本明細書に開示される標的配列は、重複遺伝子のエンハンサー領域に位置する連続した10~35ヌクレオチド配列であり得る。
ここで、重複遺伝子は、PMP22遺伝子、PLP1遺伝子、MECP2遺伝子、SOX3遺伝子、RAI1遺伝子、TBX1遺伝子、ELN遺伝子、JAGGED1遺伝子、NSD1遺伝子、MMP23遺伝子、LMB1遺伝子、SNCA遺伝子およびAPP遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
あるいは、重複遺伝子は、MYC遺伝子、ERBB2(HER2)遺伝子、CCND1(サイクリンD1)遺伝子、FGFR1遺伝子、FGFR2遺伝子、HRAS遺伝子、KRAS遺伝子、MYB遺伝子、MDM2遺伝子、CCNE(サイクリンE)遺伝子、MET遺伝子、CDK4遺伝子、ERBB1遺伝子、MYCN遺伝子およびAKT2遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
標的配列は、10~35ヌクレオチド配列、15~35ヌクレオチド配列、20~35ヌクレオチド配列、25~35ヌクレオチド配列または30~35ヌクレオチド配列であり得る。
あるいは、標的配列は、10~15ヌクレオチド配列、15~20ヌクレオチド配列、20~25ヌクレオチド配列、25~30ヌクレオチド配列または30~35ヌクレオチド配列であり得る。
たとえば、標的配列は、重複遺伝子のエンハンサーボックス(Eボックス)を含む領域またはその付近の領域に位置する連続した10~25ヌクレオチド配列であり得る。
たとえば、標的配列は、重複遺伝子のイントロンに存在するエンハンサー領域に位置する連続した10~35ヌクレオチド配列であり得る。
本明細書に開示される標的配列は、重複遺伝子のインシュレーター領域に位置する連続した10~35ヌクレオチド配列であり得る。
ここで、重複遺伝子は、PMP22遺伝子、PLP1遺伝子、MECP2遺伝子、SOX3遺伝子、RAI1遺伝子、TBX1遺伝子、ELN遺伝子、JAGGED1遺伝子、NSD1遺伝子、MMP23遺伝子、LMB1遺伝子、SNCA遺伝子、APP遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
あるいは、重複遺伝子は、MYC遺伝子、ERBB2(HER2)遺伝子、CCND1(サイクリンD1)遺伝子、FGFR1遺伝子、FGFR2遺伝子、HRAS遺伝子、KRAS遺伝子、MYB遺伝子、MDM2遺伝子、CCNE(サイクリンE)遺伝子、MET遺伝子、CDK4遺伝子、ERBB1遺伝子、MYCN遺伝子およびAKT2遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
標的配列は、10~35ヌクレオチド配列、15~35ヌクレオチド配列、20~35ヌクレオチド配列、25~35ヌクレオチド配列または30~35ヌクレオチド配列であり得る。
あるいは、標的配列は、10~15ヌクレオチド配列、15~20ヌクレオチド配列、20~25ヌクレオチド配列、25~30ヌクレオチド配列または30~35ヌクレオチド配列であり得る。
本明細書に開示される標的配列は、重複遺伝子のサイレンサー領域に位置する連続した10~35ヌクレオチド配列であり得る。
ここで、重複遺伝子は、PMP22遺伝子、PLP1遺伝子、MECP2遺伝子、SOX3遺伝子、RAI1遺伝子、TBX1遺伝子、ELN遺伝子、JAGGED1遺伝子、NSD1遺伝子、MMP23遺伝子、LMB1遺伝子、SNCA遺伝子、APP遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
あるいは、重複遺伝子は、MYC遺伝子、ERBB2(HER2)遺伝子、CCND1(サイクリンD1)遺伝子、FGFR1遺伝子、FGFR2遺伝子、HRAS遺伝子、KRAS遺伝子、MYB遺伝子、MDM2遺伝子、CCNE(サイクリンE)遺伝子、MET遺伝子、CDK4遺伝子、ERBB1遺伝子、MYCN遺伝子およびAKT2遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
標的配列は、10~35ヌクレオチド配列、15~35ヌクレオチド配列、20~35ヌクレオチド配列、25~35ヌクレオチド配列または30~35ヌクレオチド配列であり得る。
あるいは、標的配列は、10~15ヌクレオチド配列、15~20ヌクレオチド配列、20~25ヌクレオチド配列、25~30ヌクレオチド配列または30~35ヌクレオチド配列であり得る。
本明細書に開示される標的配列は、重複遺伝子の遺伝子座制御領域(LCR)に位置する連続した10~35ヌクレオチド配列であり得る。
ここで、重複遺伝子は、PMP22遺伝子、PLP1遺伝子、MECP2遺伝子、SOX3遺伝子、RAI1遺伝子、TBX1遺伝子、ELN遺伝子、JAGGED1遺伝子、NSD1遺伝子、MMP23遺伝子、LMB1遺伝子、SNCA遺伝子およびAPP遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
あるいは、重複遺伝子は、MYC遺伝子、ERBB2(HER2)遺伝子、CCND1(サイクリンD1)遺伝子、FGFR1遺伝子、FGFR2遺伝子、HRAS遺伝子、KRAS遺伝子、MYB遺伝子、MDM2遺伝子、CCNE(サイクリンE)遺伝子、MET遺伝子、CDK4遺伝子、ERBB1遺伝子、MYCN遺伝子およびAKT2遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
標的配列は、10~35ヌクレオチド配列、15~35ヌクレオチド配列、20~35ヌクレオチド配列、25~35ヌクレオチド配列または30~35ヌクレオチド配列であり得る。
あるいは、標的配列は、10~15ヌクレオチド配列、15~20ヌクレオチド配列、20~25ヌクレオチド配列、25~30ヌクレオチド配列または30~35ヌクレオチド配列であり得る。
本明細書に開示される標的配列は、重複遺伝子の転写調節領域に位置するプロトスペーサー隣接モチーフ(PAM)配列の5'末端および/または3'末端に隣接する連続した10~35ヌクレオチド配列であり得る。
ここで、重複遺伝子は、PMP22遺伝子、PLP1遺伝子、MECP2遺伝子、SOX3遺伝子、RAI1遺伝子、TBX1遺伝子、ELN遺伝子、JAGGED1遺伝子、NSD1遺伝子、MMP23遺伝子、LMB1遺伝子、SNCA遺伝子およびAPP遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
あるいは、重複遺伝子は、MYC遺伝子、ERBB2(HER2)遺伝子、CCND1(サイクリンD1)遺伝子、FGFR1遺伝子、FGFR2遺伝子、HRAS遺伝子、KRAS遺伝子、MYB遺伝子、MDM2遺伝子、CCNE(サイクリンE)遺伝子、MET遺伝子、CDK4遺伝子、ERBB1遺伝子、MYCN遺伝子およびAKT2遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
ここで、重複遺伝子の転写調節領域は、重複遺伝子のプロモーター、エンハンサー、サイレンサー、インシュレーターまたは遺伝子座制御領域(LCR)であり得る。
「プロトスペーサー隣接モチーフ(PAM)配列」とは、エディタータンパク質によって認識されるヌクレオチド配列である。ここで、PAM配列は、エディタータンパク質およびエディタータンパク質由来の種の種類に従って異なるヌクレオチド配列を有し得る。
ここで、PAM配列は、たとえば、以下の配列の1つまたは複数の配列(5'-3'の方向で説明される)であり得る。
NGG(Nは、A、T、CまたはGである);NNNNRYAC(Nは、それぞれ独立してA、T、CまたはGであり、Rは、AまたはGであり、Yは、CまたはTである);NNAGAAW(Nは、それぞれ独立してA、T、CまたはGであり、Wは、AまたはTである);NNNNGATT(Nは、それぞれ独立してA、T、CまたはGである);NNGRR(T)(Nは、それぞれ独立してA、T、CまたはGであり、Rは、AまたはGである);TTN(Nは、A、T、CまたはGである)。
標的配列は、10~35ヌクレオチド配列、15~35ヌクレオチド配列、20~35ヌクレオチド配列、25~35ヌクレオチド配列または30~35ヌクレオチド配列であり得る。
あるいは、標的配列は、10~15ヌクレオチド配列、15~20ヌクレオチド配列、20~25ヌクレオチド配列、25~30ヌクレオチド配列または30~35ヌクレオチド配列であり得る。
例示的な実施形態では、エディタータンパク質によって認識されるPAM配列が5'-NGG-3'、5'-NAG-3'および/または5'-NGA-3'(N=A、T、GもしくはC;またはA、U、GもしくはC)である場合、標的配列は、重複遺伝子の転写調節領域内の5'-NGG-3'、5'-NAG-3'および/または5'-NGA-3'(N=A、T、GもしくはC;またはA、U、GもしくはC)配列の5'末端および/または3'末端に隣接して位置する連続した10~25ヌクレオチド配列であり得る。
別の例示的な実施形態では、エディタータンパク質によって認識されるPAM配列が5'-NGGNG-3'および/または5'-NNAGAAW-3'(W=AまたはT、N=A、T、GもしくはC;またはA、U、GもしくはC)である場合、標的配列は、重複遺伝子の転写調節領域内の5'-NGGNG-3'および/または5'-NNAGAAW-3'(W=AまたはT、N=A、T、GもしくはC;またはA、U、GもしくはC)配列の5'末端および/または3'末端に隣接して位置する連続した10~25ヌクレオチド配列であり得る。
さらに別の例示的な実施形態では、エディタータンパク質によって認識されるPAM配列が5'-NNNNGATT-3'および/または5'-NNNGCTT-3'(N=A、T、GもしくはC;またはA、U、GもしくはC)である場合、標的配列は、重複遺伝子の転写調節領域内の5'-NNNNGATT-3'および/または5'-NNNGCTT-3'(N=A、T、GもしくはC;またはA、U、GもしくはC)配列の5'末端および/または3'末端に隣接して位置する連続した10~25ヌクレオチド配列であり得る。
例示的な一実施形態では、エディタータンパク質によって認識されるPAM配列が5'-NNNVRYAC-3'(V=G、CもしくはA;R=AもしくはG、およびY=CもしくはT、N=A、T、GもしくはC;またはA、U、GもしくはC)である場合、標的配列は、重複遺伝子の転写調節領域内の5'-NNNVRYAC-3'(V=G、CもしくはA;R=AもしくはG、およびY=CもしくはT、N=A、T、GもしくはC;またはA、U、GもしくはC)配列の5'末端および/または3'末端に隣接して位置する連続した10~25ヌクレオチド配列であり得る。
別の例示的な実施形態では、エディタータンパク質によって認識されるPAM配列が5'-NAAR-3'(R=AもしくはG、およびN=A、T、GもしくはC;またはA、U、GもしくはC)である場合、標的配列は、重複遺伝子の転写調節領域内の5'-NAAR-3'(R=AもしくはG、およびN=A、T、GもしくはC;またはA、U、GもしくはC)配列の5'末端および/または3'末端に隣接して位置する連続した10~25ヌクレオチド配列であり得る。
さらに別の例示的な実施形態では、エディタータンパク質によって認識されるPAM配列が5'-NNGRR-3'、5'-NNGRRT-3'、および/または5'-NNGRRV-3'(R=AもしくはG、およびV=G、CもしくはA、N=A、T、GもしくはC;またはA、U、GもしくはC)である場合、標的配列は、重複遺伝子の転写調節領域内の5'-NNGRR-3'、5'-NNGRRT-3'、および/または5'-NNGRRV-3'(R=AもしくはG、およびV=G、CもしくはA、N=A、T、GもしくはC;またはA、U、GもしくはC)配列の5'末端および/または3'末端に隣接して位置する連続した10~25ヌクレオチド配列であり得る。
例示的な一実施形態では、エディタータンパク質によって認識されるPAM配列が5'-TTN-3'(N=A、T、GもしくはC;またはA、U、GもしくはC)である場合、標的配列は、重複遺伝子の転写調節領域内の5'-TTN-3'(N=A、T、GもしくはC;またはA、U、GもしくはC)に隣接して位置する連続した10~25ヌクレオチド配列であり得る。
以下、本明細書に開示される例示的な実施形態で使用され得る標的配列の例を、表1、2、3、4、5および6に列挙する。表1、2、3、4、5および6に開示される標的配列は、ガイド核酸非結合配列であり、その相補的配列、すなわちガイド核酸結合配列は、表に列挙された配列から予測され得る。加えて、表1、2、3、4、5および6に示されるsgRNAは、エディタータンパク質に応じて、SpCas9の場合はSp、CjCas9の場合はCjと命名した。
[表1]
SpCas9のヒトPMP22遺伝子の標的配列
Figure 2022023144000002
[表2]
CjCas9のヒトPMP22遺伝子の標的配列
Figure 2022023144000003
[表3]
SpCas9のヒトPLP1遺伝子の標的配列
Figure 2022023144000004
Figure 2022023144000005
[表4]
CjCas9のヒトPLP1遺伝子の標的配列
Figure 2022023144000006
Figure 2022023144000007
[表5]
SpCas9のマウスPlp1遺伝子の標的配列
Figure 2022023144000008
Figure 2022023144000009
Figure 2022023144000010
[表6]
CjCas9のマウスPlp1遺伝子の標的配列
Figure 2022023144000011
Figure 2022023144000012
本明細書に開示される一態様として、発現制御組成物は、ガイド核酸およびエディタータンパク質を含み得る。
発現制御組成物は、以下のものを含み得る。
(a)重複遺伝子の転写調節領域に位置する標的配列を標的とすることができるガイド核酸またはそれをコードする核酸配列;および
(b)1つまたは複数のエディタータンパク質またはそれをコードする核酸配列。
重複遺伝子に関する説明は上記の通りである。
転写調節領域に関する説明は上記の通りである。
標的配列に関する説明は上記の通りである。
発現制御組成物は、ガイド核酸-エディタータンパク質複合体を含み得る。
「ガイド核酸-エディタータンパク質複合体」という用語は、ガイド核酸とエディタータンパク質との間の相互作用を介して形成される複合体を指す。
ガイド核酸に関する説明は上記の通りである。
「エディタータンパク質」という用語は、核酸に直接結合するか、核酸に直接結合することなく、核酸と相互作用することができるペプチド、ポリペプチドまたはタンパク質を指す。
ここで、核酸は、標的核酸、遺伝子または染色体に含まれる核酸であり得る。
ここで、核酸はガイド核酸であり得る。
エディタータンパク質は酵素であり得る。
ここで、「酵素」という用語は、核酸、遺伝子または染色体を切断することができるドメインを含むポリペプチドまたはタンパク質を指す。
酵素は、ヌクレアーゼまたは制限酵素であり得る。
エディタータンパク質は、完全な活性酵素を含み得る。
ここで、「完全活性酵素」とは、野性型酵素の核酸、遺伝子または染色体切断機能と同じ機能を有する酵素を指す。たとえば、二本鎖DNAを切断する野性型酵素は、二本鎖DNAを完全に切断する完全な活性酵素であり得る。別の例として、二本鎖DNAを切断する野性型酵素が人為的改変によりアミノ酸配列の部分配列の欠失または置換を受ける場合、人為的に改変された酵素バリアントは、野性型酵素のように二本鎖DNAを切断し、人為的に改変された酵素バリアントは、完全な活性酵素であり得る。
加えて、完全な活性酵素は、野性型酵素と比較して改善された機能を有する酵素を含み得る。たとえば、二本鎖DNAを切断する野性型酵素の修飾または操作された特定の形態は、野性型酵素よりも大きい完全な酵素活性、すなわち、二本鎖DNAを切断する活性の増加を有し得る。
エディタータンパク質は、不完全または部分的に活性な酵素を含み得る。
ここで、「不完全または部分的に活性な酵素」とは、野性型酵素の核酸、遺伝子または染色体切断機能のいくつかを有する酵素を指す。たとえば、二本鎖DNAを切断する野性型酵素の修飾または操作された特定の形態は、第1の機能を有する形態または第2の機能を有する形態であり得る。ここで、第1の機能は、二本鎖DNAの第1鎖を切断する機能であり、第2の機能は、二本鎖DNAの第2鎖を切断する機能であり得る。ここで、第1の機能を有する酵素または第2の機能を有する酵素は、不完全または部分的に活性な酵素であり得る。
エディタータンパク質は不活性酵素を含み得る。
ここで、「不活性酵素」とは、野性型酵素の核酸、遺伝子または染色体切断機能が完全に不活性化されている酵素を指す。たとえば、野性型酵素の修飾または操作された特定の形態は、第1および第2の機能の両方が失われた形態であり得、すなわち、二本鎖DNAの第1鎖を切断する第1の機能と、その第2鎖を切断する第2の機能の両方が失われている。ここで、第1および第2の機能のすべてが失われている酵素は、不活性な酵素であり得る。
エディタータンパク質は融合タンパク質であり得る。
ここで、「融合タンパク質」という用語は、酵素を追加のドメイン、ペプチド、ポリペプチドまたはタンパク質と融合させることにより生成されるタンパク質を指す。
追加のドメイン、ペプチド、ポリペプチドまたはタンパク質は、酵素と同じまたは異なる機能を有する機能的ドメイン、ペプチド、ポリペプチドまたはタンパク質であり得る。
融合タンパク質は、機能的ドメイン、ペプチド、ポリペプチドまたはタンパク質が、酵素のアミノ末端もしくはその近傍;酵素のカルボキシル末端もしくはその近傍;酵素の中央部;またはそれらの組合せの1つまたは複数に付加された形態であり得る。
ここで、機能的ドメイン、ペプチド、ポリペプチドまたはタンパク質は、メチラーゼ活性、デメチラーゼ活性、転写活性化活性、転写抑制活性、転写放出因子活性、ヒストン修飾活性、RNA切断活性もしくは核酸結合活性を有するドメイン、ペプチド、ポリペプチド、もしくはタンパク質、または(ペプチドを含む)タンパク質の単離および精製用のタグもしくはレポーター遺伝子であり得るが、本発明はそれらに限定されない。
機能的ドメイン、ペプチド、ポリペプチドまたはタンパク質は、デアミナーゼであり得る。タグは、ヒスチジン(His)タグ、V5タグ、FLAGタグ、インフルエンザ血球凝集素(HA)タグ、Mycタグ、VSV-Gタグ、チオレドキシン(Trx)タグを含み、レポーター遺伝子は、グルタチオン-S-トランスフェラーゼ(GST)、ホースラディッシュ・ペルオキシダーゼ(HRP)、クロラムフェニコールアセチルトランスフェラーゼ(CAT)、β-ガラクトシダーゼ、β-グルクロニダーゼ、ルシフェラーゼ、自家蛍光タンパク質であって、緑色蛍光タンパク質(GFP)、HcRed、DsRed、シアン蛍光タンパク質(CFP)、黄色蛍光タンパク質(YFP)および青色蛍光タンパク質(BFP)などのタンパク質を含むが、本発明はそれらに限定されない。
加えて、機能的ドメイン、ペプチド、ポリペプチドまたはタンパク質は、核局在化配列またはシグナル(NLS)または核外移行配列もしくはシグナル(NES)であり得る。
NLSは、アミノ酸配列PKKKRKVを有するSV40ウイルスラージT抗原のNLS;ヌクレオプラスミンに由来するNLS(たとえば、配列KRPAATKKAGQAKKKKを有するヌクレオプラスミン双節型NLS);アミノ酸配列PAAKRVKLDまたはRQRRNELKRSPを有するc-myc NLS;配列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGYを有するhRNPA1 M9 NLS;インポーチン-α由来のIBBドメイン配列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV;筋腫Tタンパク質配列VSRKRPRPおよびPPKKARED;ヒトP53配列POPKKKPL;マウスc-abl IV配列SALIKKKKKMAP;インフルエンザウイルスNS1配列DRLRRおよび配列PKQKKRK;デルタ(D)型肝炎ウイルス抗原配列RKLKKKIKKL;マウスMx1タンパク質配列REKKKFLKRR;ヒトポリ(ADP-リボース)ポリメラーゼ配列KRKGDEVDGVDEVAKKKSKK;またはステロイドホルモン受容体(ヒト)グルココルチコイド配列RKCLQAGMNLEARKTKKであり得るが、本発明はそれらに限定されない。
追加のドメイン、ペプチド、ポリペプチドまたはタンパク質は、特定の機能を果たさない非機能的ドメイン、ペプチド、ポリペプチドまたはタンパク質であり得る。ここで、非機能的ドメイン、ペプチド、ポリペプチドまたはタンパク質は、酵素機能に影響を及ぼさないドメイン、ペプチド、ポリペプチドまたはタンパク質であり得る。
融合タンパク質は、非機能的ドメイン、ペプチド、ポリペプチドまたはタンパク質が、酵素のアミノ末端もしくはその近傍;酵素のカルボキシル末端もしくはその近傍;酵素の中央部;またはそれらの組合せの1つまたは複数に付加された形態であり得る。
エディタータンパク質は、天然の酵素または融合タンパク質であり得る。
エディタータンパク質は、部分的に修飾された天然酵素または融合タンパク質の形態で存在し得る。
エディタータンパク質は、人為的に生成された酵素または融合タンパク質であり得、それは天然には存在しない。
エディタータンパク質は、部分的に修飾された人為的な酵素または融合タンパク質の形態で存在し得、それは天然には存在しない。
ここで、修飾は、エディタータンパク質に含まれるアミノ酸の置換、除去、付加、またはそれらの組合せであり得る。
あるいは、修飾は、エディタータンパク質をコードするヌクレオチド配列内のいくつかのヌクレオチドの置換、除去、追加、またはそれらの組合せであり得る。
加えて、任意に、発現制御組成物は、挿入される所望の特定のヌクレオチド配列、またはそれをコードする核酸配列を有するドナーをさらに含み得る。
ここで、挿入される核酸配列は、重複遺伝子の転写調節領域内の部分ヌクレオチド配列であり得る。
ここで、挿入される核酸配列は、重複遺伝子の転写調節領域内に変異を導入するために使用される核酸配列であり得る。ここで、変異は、重複遺伝子の転写を妨げる変異であり得る。
「ドナー」という用語は、損傷した遺伝子または核酸の相同組換え(HR)に基づく修復に役立つヌクレオチド配列を指す。
ドナーは、二本鎖または一本鎖核酸であり得る。
ドナーは、線形または円形で存在し得る。
ドナーは、標的遺伝子の転写調節領域内の核酸と相同性を有するヌクレオチド配列を含み得る。
たとえば、ドナーは、特定のヌクレオチド配列が挿入される位置、たとえば、損傷した核酸の上流(左)および下流(右)にあるヌクレオチド配列のそれぞれと相同性を有するヌクレオチド配列を含み得る。ここで、挿入される特定のヌクレオチド配列は、損傷した核酸の下流のヌクレオチド配列と相同性を有するヌクレオチド配列と、損傷した核酸の上流のヌクレオチド配列と相同性を有するヌクレオチド配列との間に位置し得る。ここで、相同性を有するヌクレオチド配列は、少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%または95%以上の相同性または完全な相同性を有し得る。
ドナーは、特定の核酸配列を含み得る。
ここで、特定の核酸配列は、標的遺伝子の部分ヌクレオチド配列またはそれに類似したヌクレオチド配列であり得る。標的遺伝子の部分ヌクレオチド配列は、たとえば、変異を有する標的遺伝子を編集するための変異が編集された正常な核酸配列を含み得る。あるいは、標的遺伝子の部分類似ヌクレオチド配列は、正常な標的遺伝子を変異させるための標的遺伝子の部分正常核酸配列の一部が修飾された変異誘導核酸配列を含み得る。
ここで、特定の核酸配列は、外因性核酸配列であり得る。たとえば、外因性核酸配列は、標的遺伝子を有する細胞内で発現されることが所望される外因性遺伝子であり得る。
ここで、特定の核酸配列は、標的遺伝子を有する細胞内で発現されることが所望される核酸配列であり得る。たとえば、特定の核酸配列は、標的遺伝子を有する細胞で発現する特定の遺伝子であり得、この場合、特定の遺伝子は、ドナーを有する発現制御組成物により細胞内でコピー数が増加し、ひいては高度に発現され得る。
任意に、ドナーは、追加のヌクレオチド配列を含み得る。ここで、追加の核酸配列は、ドナーの安定性、標的への挿入の効率、または相同組換えの効率を高めるのに役立ち得る。
たとえば、追加のヌクレオチド配列は、AおよびTヌクレオチドリッチな核酸配列、すなわちA-Tリッチなドメインであり得る。たとえば、追加のヌクレオチド配列は、足場/マトリックス付着領域(SMAR)であり得る。
本明細書に開示されるガイド核酸、エディタータンパク質またはガイド核酸-エディタータンパク質複合体は、さまざまな手法で対象内に送達または導入され得る。
ここで、「対象」という用語は、ガイド核酸、エディタータンパク質またはガイド核酸-エディタータンパク質複合体が導入される生物、ガイド核酸、エディタータンパク質、またはガイド核酸エディタータンパク質複合体が機能する生物、または生物から得られた検体またはサンプルを指す。
対象は、ガイド核酸-エディタータンパク質複合体の標的遺伝子または染色体を含む生物であり得る。
生物は、動物、動物組織または動物細胞であり得る。
生物は、ヒト、ヒト組織またはヒト細胞であり得る。
組織は、眼球、皮膚、肝臓、腎臓、心臓、肺、脳、筋肉組織または血液であり得る。
細胞は、線維芽細胞、シュワン細胞、神経細胞、希突起膠細胞、筋芽細胞、グリア細胞、マクロファージ、免疫細胞、肝細胞、網膜色素上皮細胞、癌細胞または幹細胞であり得る。
検体またはサンプルは、標的遺伝子または染色体を含む生物から取得され得、唾液、血液、網膜組織、脳組織、シュワン細胞、希突起膠細胞、筋芽細胞、線維芽細胞、ニューロン、グリア細胞、マクロファージ、肝細胞、免疫細胞、癌細胞または幹細胞であり得る。
好ましくは、対象は、重複遺伝子を含む生物であり得る。ここで、対象は、重複遺伝子が遺伝子重複状態にある生物であり得る。
ガイド核酸、エディタータンパク質またはガイド核酸-エディタータンパク質複合体は、DNA、RNAの形態もしくは混合形態で対象に送達または導入され得る。
ここで、ガイド核酸および/またはエディタータンパク質は、当該技術分野で公知の方法により、DNA、RNAの形態もしくは混合形態で対象に送達または導入され得る。
あるいは、ガイド核酸および/またはエディタータンパク質をコードするDNA、RNAまたはそれらの混合物の形態は、ベクター、非ベクターもしくはそれらの組合せによって対象に送達または導入され得る。
ベクターは、ウイルスまたは非ウイルスベクター(たとえばプラスミド)であり得る。
非ベクターは、裸のDNA、DNA複合体またはmRNAであり得る。
例示的な一実施形態では、ガイド核酸および/またはエディタータンパク質をコードする核酸配列は、ベクターによって対象に送達または導入され得る。
ベクターは、ガイド核酸および/またはエディタータンパク質をコードする核酸配列を含み得る。
一例では、ベクターは、ガイド核酸とエディタータンパク質をそれぞれコードする核酸配列を同時に含み得る。
別の例では、ベクターは、ガイド核酸をコードする核酸配列を含み得る。
一例として、ガイド核酸に含まれるドメインは、すべて1つのベクターに含まれていてもよいし、分割されて異なるベクターに含まれていてもよい。
別の例では、ベクターは、エディタータンパク質をコードする核酸配列を含み得る。
一例として、エディタータンパク質の場合、エディタータンパク質をコードする核酸配列は1つのベクターに含まれていてもよいし、分割されていくつかのベクターに含まれていてもよい。
ベクターは、1つまたは複数の調節/制御コンポーネントを含み得る。
ここで、調節/制御コンポーネントは、プロモーター、エンハンサー、イントロン、ポリアデニル化シグナル、コザックコンセンサス配列、内部リボソーム進入部位(IRES)、スプライスアクセプターおよび/または2A配列を含み得る。
プロモーターは、RNAポリメラーゼIIによって認識されるプロモーターであり得る。
プロモーターは、RNAポリメラーゼIIIによって認識されるプロモーターであり得る。
プロモーターは、誘導性プロモーターであり得る。
プロモーターは、対象特異的なプロモーターであり得る。
プロモーターは、ウイルス性または非ウイルス性プロモーターであり得る。
プロモーターは、制御領域(すなわち、ガイド核酸またはエディタータンパク質をコードする核酸配列)に応じて適切なプロモーターを使用してもよい。
たとえば、ガイド核酸に有用なプロモーターは、H1、EF-1a、tRNAまたはU6プロモーターであり得る。たとえば、エディタータンパク質に有用なプロモーターは、CMV、EF-1a、EFS、MSCV、PGKまたはCAGプロモーターであり得る。
ベクターは、ウイルスベクターまたは組換えウイルスベクターであり得る。
ウイルスは、DNAウイルスまたはRNAウイルスであり得る。
ここで、DNAウイルスは、二本鎖DNA(dsDNA)ウイルスまたは一本鎖DNA(ssDNA)ウイルスであり得る。
ここで、RNAウイルスは、一本鎖RNA(ssRNA)ウイルスであり得る。
ここで、ウイルスは、レトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴ウイルス(AAV)、ワクシニアウイルス、ポックスウイルスまたは単純ヘルペスウイルスであり得るが、本発明はこれらに限定されない。
一般に、ウイルスは宿主(たとえば細胞)に感染し得、それによってウイルスの遺伝情報をコードする核酸を宿主に導入するか、遺伝情報をコードする核酸を宿主ゲノムに挿入する。そのような特徴を有するウイルスを使用して、ガイド核酸および/またはエディタータンパク質を対象に導入することができる。ウイルスを使用して導入されたガイド核酸および/またはエディタータンパク質は、対象(たとえば細胞)内で一時的に発現され得る。あるいは、ウイルスを使用して導入されたガイド核酸および/またはエディタータンパク質は、長期間にわたって(たとえば、1、2もしくは3週間、1、2、3、6もしくは9か月、1年もしくは2年、または恒久的に)対象(たとえば細胞)内で連続的に発現され得る。
ウイルスのパッケージング容量は、ウイルスの種類に応じて、少なくとも2~50kbで異なり得る。そのようなパッケージング容量に応じて、ガイド核酸もしくはエディタータンパク質を含むウイルスベクター、またはガイド核酸とエディタータンパク質の両方を含むウイルスベクターを設計することができる。あるいは、ガイド核酸、エディタータンパク質および追加のコンポーネントを含むウイルスベクターを設計することができる。
一例では、ガイド核酸および/またはエディタータンパク質をコードする核酸配列は、組換えレンチウイルスによって送達または導入され得る。
別の例では、ガイド核酸および/またはエディタータンパク質をコードする核酸配列は、組換えアデノウイルスによって送達または導入され得る。
さらに別の例では、ガイド核酸および/またはエディタータンパク質をコードする核酸配列は、組換えAAVによって送達または導入され得る。
さらに別の例では、ガイド核酸および/またはエディタータンパク質をコードする核酸配列は、ハイブリッドウイルス、たとえば本明細書に挙げたウイルスの1つまたは複数のハイブリッドによって送達または導入され得る。
別の例示的な実施形態では、ガイド核酸および/またはエディタータンパク質をコードする核酸配列は、非ベクターによって対象に送達または導入され得る。
非ベクターは、ガイド核酸および/またはエディタータンパク質をコードする核酸配列を含み得る。
非ベクターは、裸のDNA、DNA複合体、mRNA、またはそれらの混合物であり得る。
非ベクターは、エレクトロポレーション、遺伝子銃、ソノポレーション、マグネトフェクション、一過性の細胞圧縮もしくは圧搾(たとえば、文献[Lee,et al,(2012)Nano Lett.,12,6322-6327]に記載)、脂質媒介トランスフェクション、デンドリマー、ナノ粒子、リン酸カルシウム、シリカ、ケイ酸塩(Ormosil)、またはそれらの組合せによって対象に送達または導入され得る。
一例では、エレクトロポレーションを介した送達は、細胞と、ガイド核酸および/またはエディタータンパク質をコードする核酸配列とを、カートリッジ、チャンバまたはキュベット内で混合し、細胞に所定の持続時間および振幅で電気刺激を適用することにより行われ得る。
別の例では、非ベクターは、ナノ粒子を使用して送達され得る。ナノ粒子は、無機ナノ粒子(たとえば、磁性ナノ粒子、シリカなど)または有機ナノ粒子(たとえば、ポリエチレングリコール(PEG)でコーティングされた脂質など)であり得る。ナノ粒子の外表面には、付着可能な正に荷電したポリマー(たとえば、ポリエチレンイミン、ポリリジン、ポリセリンなど)と共役されていてもよい。
特定の実施形態では、非ベクターは、脂質シェルを使用して送達され得る。
特定の実施形態では、非ベクターは、エクソソームを使用して送達され得る。エクソソームは、タンパク質とRNAを導入するための内因性のナノ小胞であり、それはRNAを脳や別の標的器官に送達することができる。
特定の実施形態では、非ベクターは、リポソームを使用して送達され得る。リポソームは、内部の水性区画を囲む単一または複数の層状脂質二重層と、比較的不透明な外部の親油性リン脂質二重層で構成される球状小胞構造である。リポソームはいくつかの異なる種類の脂質から作られ得るが、リン脂質は、最も一般には、薬物担体としてリポソームを生成するために使用される。
加えて、非ベクターの送達のための組成物は、他の添加剤を含み得る。
エディタータンパク質は、ペプチド、ポリペプチドまたはタンパク質の形態で対象に送達または導入され得る。
エディタータンパク質は、当該技術分野で知られている方法により、ペプチド、ポリペプチド、またはタンパク質の形態で対象に送達または導入され得る。
ペプチド、ポリペプチドまたはタンパク質の形態は、エレクトロポレーション、マイクロインジェクション、一過性の細胞圧縮もしくは圧搾(たとえば、文献[Lee,et al,(2012)Nano Lett.,12,6322-6327]に記載)、脂質媒介トランスフェクション、ナノ粒子、リポソーム、ペプチド媒介送達またはそれらの組合せにより対象に送達または導入され得る。
ペプチド、ポリペプチドまたはタンパク質は、ガイド核酸をコードする核酸配列とともに送達され得る。
一例では、エレクトロポレーションを介した導入は、ガイド核酸と共に、またはガイド核酸無しでエディタータンパク質が導入される細胞をカートリッジ、チャンバまたはキュベットにおいて混合し、細胞に所定の持続時間と振幅で電気刺激を加えることにより行われ得る。
ガイド核酸とエディタータンパク質は、核酸とタンパク質を混合する形態で対象に送達または導入され得る。
ガイド核酸とエディタータンパク質は、ガイド核酸-エディタータンパク質複合体の形態で対象に送達または導入され得る。
たとえば、ガイド核酸は、DNA、RNAまたはそれらの混合物であり得る。エディタータンパク質は、ペプチド、ポリペプチドまたはタンパク質であり得る。
一例では、ガイド核酸とエディタータンパク質は、RNA型ガイド核酸とタンパク質型エディタータンパク質を含むガイド核酸-エディタータンパク質複合体、すなわちリボ核タンパク質(RNP)の形態で対象に送達または導入され得る。
本明細書に開示されるガイド核酸-エディタータンパク質複合体は、標的核酸、遺伝子または染色体を修飾し得る。
たとえば、ガイド核酸-エディタータンパク質複合体は、標的核酸、遺伝子または染色体の配列の修飾を誘導する。 その結果、標的核酸、遺伝子または染色体により発現されるタンパク質は、構造および/または機能について修飾され得るか、タンパク質の発現が制御または阻害され得る。
ガイド核酸-エディタータンパク質複合体は、DNA、RNA、遺伝子または染色体レベルで作用し得る。
一例では、ガイド核酸-エディタータンパク質複合体は、標的遺伝子の転写調節領域を操作または修飾して、標的遺伝子によりコードされるタンパク質の発現を制御(たとえば、抑制、阻害、減少、増加、または促進)することができ、または、その活性が制御されている(たとえば、抑制、阻害、減少、増加、または促進されている)または修飾されたタンパク質を発現する。
ガイド核酸-エディタータンパク質複合体は、遺伝子の転写および翻訳段階で作用し得る。
一例では、ガイド核酸-エディタータンパク質複合体は、標的遺伝子の転写を促進または阻害し、それによって標的遺伝子によりコードされるタンパク質の発現を制御(たとえば、抑制、阻害、減少、増加または促進)し得る。
別の例では、ガイド核酸-エディタータンパク質複合体は、標的遺伝子の翻訳を促進または阻害し、それによって標的遺伝子によりコードされるタンパク質の発現を制御(たとえば、抑制、阻害、減少、増加または促進)し得る。本明細書に開示される例示的な一実施形態では、発現制御組成物は、gRNAおよびCRISPR酵素を含み得る。
発現制御組成物は、以下のものを含み得る:
(a)重複遺伝子の転写調節領域に位置する標的配列を標的とすることができるgRNAまたはそれをコードする核酸配列;および
(b)1つまたは複数のCRISPR酵素またはそれをコードする核酸配列。
重複遺伝子に関する説明は上記の通りである。
転写調節領域に関する説明は上記の通りである。
標的配列に関する説明は上記の通りである。
発現制御組成物は、gRNA-CRISPR酵素複合体を含み得る。
「gRNA-CRISPR酵素複合体」という用語は、gRNAとCRISPR酵素との相互作用により形成される複合体を指す。
gRNAに関する説明は上記の通りである。
「CRISPR酵素」という用語は、CRISPR-Casシステムの主要なタンパク質コンポーネントであり、gRNAと複合体を形成し、CRISPR-Casシステムをもたらす。
CRISPR酵素は、CRISPR酵素またはポリペプチド(もしくはタンパク質)をコードする配列を有する核酸であり得る。
CRISPR酵素は、II型CRISPR酵素であり得る。
II型CRISPR酵素の結晶構造は、2種類以上の天然微生物II型CRISPR酵素分子の研究(Jinek et al.,Science,343(6176):1247997,2014)ならびにgRNAと複合させたストレプトコッカス・ピオゲネス(Streptococcus pyogenes)Cas9(SpCas9)の研究(Nishimasu et al.,Cell,156:935-949,2014;およびAnders et al.,Nature,2014,doi:10.1038/nature13579)に従って決定されていた。
II型CRISPR酵素は、2つのローブ、すなわち、認識(REC)ローブとヌクレアーゼ(NUC)ローブとを含み、各ローブはいくつかのドメインを含む。
RECローブは、アルギニンリッチなブリッジヘリックス(BH)ドメイン、REC1ドメイン、およびREC2ドメインを含む。
ここで、BHドメインは、アルギニンリッチな長いα-ヘリックスの領域であり、REC1ドメインとREC2ドメインは、gRNAに形成された二本鎖、たとえば、一本鎖gRNA、二本鎖gRNAまたはtracrRNAを認識するのに重要な役割を果たす。
NUCローブは、RuvCドメイン、HNHドメインおよびPAM相互作用(PI)ドメインを含む。ここで、RuvCドメインは、RuvC様ドメインを包含し、HNHドメインは、HNH様ドメインを包含する。
ここで、RuvCドメインは、II型CRISPR酵素を有する天然に存在する微生物ファミリーのメンバーと構造的類似性を共有し、一本鎖、たとえば、標的遺伝子の転写調節領域内の核酸の非相補鎖、すなわち、gRNAと相補的な結合を形成しない鎖を切断する。RuvCドメインは、当該技術分野ではRuvC Iドメイン、RuvC IIドメインまたはRuvC IIIドメインを指すこともあり、一般にはRuvC I、RuvC IIまたはRuvC IIIと呼ばれる。
HNHドメインは、HNHエンドヌクレアーゼと構造的類似性を共有し、一本鎖、たとえば、標的核酸分子の相補鎖、すなわち、gRNAと相補的な結合を形成する鎖を切断する。HNHドメインは、RuvC IIモチーフとRuvC IIIモチーフとの間に位置している。
PIドメインは、標的遺伝子の転写調節領域内の特定のヌクレオチド配列、すなわちプロトスペーサー隣接モチーフ(PAM)を認識するか、PAMと相互作用する。ここで、PAMは、II型CRISPR酵素の起源に応じて異なり得る。たとえば、CRISPR酵素がSpCas9である場合、PAMは5'-NGG-3'であり得、CRISPR酵素がストレプトコッカス・サーモフィルス(Streptococcus thermophilus)Cas9(StCas9)である場合、PAMは5'-NNAGAAW-3'(W=AまたはT)であり得、CRISPR酵素がナイセリア・メニンギティディス(Neisseria meningitides)Cas9(NmCas9)である場合、PAMは5'-NNNNGATT-3'であり得、CRISPR酵素がカンピロバクター・ジェジュニ(Campylobacter jejuni)Cas9(CjCas9)である場合、PAMは5'-NNNVRYAC-3'(V=G、CまたはA、R=AまたはG、Y=CまたはT)であり得、ここで、Nは、A、T、GもしくはC;またはA、U、GもしくはCであり得る。しかしながら、PAMは上記酵素の起源に応じて決定されることが一般に理解されているが、上記起源に由来する酵素の変異体に関する研究の進展に応じて、PAMは変更され得る。
II型CRISPR酵素はCas9であり得る。
Cas9は、さまざまな微生物、たとえば、Streptococcus pyogenes、Streptococcus thermophilus、Streptococcus sp.、Staphylococcus aureus、Nocardiopsis dassonvillei、Streptomyces pristinaespiralis、Streptomyces viridochromogenes、Streptomyces viridochromogenes、Streptosporangium roseum、Streptosporangium roseum、AlicyclobacHlus acidocaldarius、Bacillus pseudomycoides、Bacillus selenitireducens、Exiguobacterium sibiricum、Lactobacillus delbrueckii、Lactobacillus salivarius、Microscilla marina、Burkholderiales bacterium、Polaromonas naphthalenivorans、Polaromonas sp.、Crocosphaera watsonii、Cyanothece sp.、Microcystis aeruginosa、Synechococcus sp.、Acetohalobium arabaticum、Ammonifex degensii、Caldicelulosiruptor bescii、Candidatus Desulforudis、Clostridium botulinum、Clostridium difficile、Finegoldia magna、Natranaerobius thermophilus、Pelotomaculum thermopropionicum、Acidithiobacillus caldus、Acidithiobacillus ferrooxidans、Allochromatium vinosum、Marinobacter sp.、Nitrosococcus halophilus、Nitrosococcus watsoni、Pseudoalteromonas haloplanktis、Ktedonobacter racemifer、Methanohalobium evestigatum、Anabaena variabilis、Nodularia spumigena、Nostoc sp.、Arthrospira maxima、Arthrospira platensis)、Arthrospira sp.)、Lyngbya sp.、Microcoleus chthonoplastes、Oscillatoria sp.、Petrotoga mobilis、Thermosipho africanusおよびAcaryochloris marinaに由来し得る。
Cas9は、gRNAに結合して、標的遺伝子の転写調節領域の標的配列もしくは位置を切断または修飾する酵素であり、gRNAと相補的な結合を形成する核酸鎖を切断することができるHNHドメインと、gRNAと非相補的な結合を形成する核酸鎖を切断することができるRuvCドメインと、標的と相互作用するRECドメインと、PAMを認識するPIドメインとからなり得る。Cas9の特異的な構造特性については、Hiroshi Nishimasu et al.(2014)Cell 156:935-949を参照することができる。
Cas9は、天然に存在する微生物から単離されるか、組換え法または合成法によって非天然に産生され得る。
加えて、CRISPR酵素はV型CRISPR酵素であり得る。
V型CRISPR酵素は、II型CRISPR酵素のRuvCドメインに対応する同様のRuvCドメインを含み、II型CRISPR酵素のHNHドメインの代わりのNucドメインと、標的を認識するRECおよびWEDドメインと、PAMを認識するPIドメインとからなり得る。V型CRISPR酵素の特異的な構造特性については、Takashi Yamano et al.(2016)Cell 165:949-962を参照することができる。
V型CRISPR酵素はgRNAと相互作用し、それによってgRNA-CRISPR酵素複合体、すなわちCRISPR複合体を形成し、gRNAと協調してガイド配列がPAM配列を含む標的配列に接近することを可能にし得る。ここで、標的遺伝子の転写調節領域内の核酸との相互作用についてのV型CRISPR酵素の能力は、PAM配列に依存している。
PAM配列は、標的遺伝子の転写調節領域に存在する配列であり得、V型CRISPR酵素のPIドメインによって認識される。PAM配列は、V型CRISPR酵素の起源に応じて異なる配列を有し得る。すなわち、各種は、特異的に認識可能なPAM配列を有する。たとえば、Cpf1によって認識されるPAM配列は5'-TTN-3'(Nは、A、T、CまたはGである)であり得る。PAMは上記の酵素の起源に応じて決定されることが一般に理解されているが、対応する起源に由来する酵素の変異体に関する研究の進展に応じて、PAMは変更され得る。
V型CRISPR酵素はCpf1であり得る。
Cpf1は、Streptococcus、Campylobacter、Nitratifractor、Staphylococcus、Parvibaculum、Roseburia、Neisseria、Gluconacetobacter、Azospirillum、Sphaerochaeta、Lactobacillus、Eubacterium、Corynebacter、Carnobacterium、Rhodobacter、Listeria、Paludibacter、Clostridium、Lachnospiraceae、Clostridiaridium、Leptotrichia、Francisella、Legionella、Alicyclobacillus、Methanomethyophilus、Porphyromonas、Prevotella、Bacteroidetes、Helcococcus、Letospira、Desulfovibrio、Desulfonatronum、Opitutaceae、Tuberibacillus、Bacillus、Brevibacillus、MethylobacteriumまたはAcidaminococcusに由来し得る。
Cpf1は、Cas9のRuvCドメインに対応するRuvC様ドメイン、Cas9のHNHドメインの代わりのNucドメイン、標的を認識するRECおよびWEDドメイン、ならびにPAMを認識するPIドメインからなり得る。Cpf1の特異的な構造特性については、Takashi Yamano et al.(2016)Cell 165:949-962を参照することができる。
Cpf1は、天然に存在する微生物から単離されるか、組換え法または合成法によって非天然に産生され得る。
CRISPR酵素は、標的遺伝子の転写調節領域内の二本鎖核酸を切断する機能を有するヌクレアーゼまたは制限酵素であり得る。
CRISPR酵素は、完全な活性CRISPR酵素であり得る。
「完全な活性」という用語は、酵素が野性型CRISPR酵素と同じ機能を有する状態を指し、そのような状態のCRISPR酵素は、完全な活性CRISPR酵素と呼ばれる。ここで、「野性型CRISPR酵素の機能」とは、酵素が、二本鎖DNAを切断する機能、すなわち、二本鎖DNAの第1鎖を切断する第1の機能および二本鎖DNAの第2鎖を切断する第2の機能を有する状態を指す。
完全な活性CRISPR酵素は、二本鎖DNAを切断する野性型CRISPR酵素であり得る。
完全な活性CRISPR酵素は、二本鎖DNAを切断する野性型CRISPR酵素を修飾または操作することにより形成されるCRISPR酵素バリアントであり得る。
CRISPR酵素バリアントは、野性型CRISPR酵素のアミノ酸配列の1つまたは複数のアミノ酸が他のアミノ酸で置換されているか、1つまたは複数のアミノ酸が除去されている酵素であり得る。
CRISPR酵素バリアントは、1つまたは複数のアミノ酸が野性型CRISPR酵素のアミノ酸配列に付加されている酵素であり得る。ここで、付加されたアミノ酸の位置は、野性型酵素のN末端、C末端またはアミノ酸配列であり得る。
CRISPR酵素バリアントは、野性型CRISPR酵素と比較して機能が改善された完全な活性酵素であり得る。
たとえば、野性型CRISPR酵素の特異的に修飾または操作された形態、すなわちCRISPR酵素バリアントは、切断される二本鎖DNAに結合しないか、それとは一定の距離を維持しながら、二本鎖DNAを切断し得る。この場合、修飾または操作された形態は、野性型CRISPR酵素と比較して、機能活性が改善された完全な活性CRISPR酵素であり得る。
CRISPR酵素バリアントは、野性型CRISPR酵素と比較して機能が低下した完全な活性CRISPR酵素であり得る。
たとえば、野性型CRISPR酵素の修飾または操作された特定の形態、すなわちCRISPR酵素バリアントは、切断される二本鎖DNAに非常に近いか、それと特異的な結合を形成しながら、二本鎖DNAを切断し得る。ここで、特異的な結合は、たとえば、CRISPR酵素の特異領域のアミノ酸と切断位置のDNA配列との間の結合であり得る。この場合、修飾または操作された形態は、野性型CRISPR酵素と比較して機能活性が低下した完全な活性CRISPR酵素であり得る。
CRISPR酵素は、不完全または部分的に活性なCRISPR酵素であり得る。
「不完全または部分的に活性」という用語は、酵素が、野性型CRISPR酵素の機能、すなわち、二本鎖DNAの第1鎖を切断する第1の機能および二本鎖DNAの第2鎖を切断する第2の機能から選択される1つを有する状態を指す。この状態のCRISPR酵素は、不完全または部分的に活性なCRISPR酵素と呼ばれる。加えて、不完全または部分的に活性なCRISPR酵素は、ニッカーゼと呼ばれ得る。
「ニッカーゼ」という用語は、標的遺伝子の転写調節領域内の核酸の二本鎖の一方の鎖のみを切断するように操作または修飾されたCRISPR酵素を指し、ニッカーゼは、一本鎖、たとえば、標的遺伝子の転写調節領域内の核酸のgRNAに相補的または非相補的である鎖を切断するヌクレアーゼ活性を有する。したがって、二本鎖を切断するには、2つのニッカーゼのヌクレアーゼ活性が必要である。
ニッカーゼは、RuvCドメインによって引き起こされるヌクレアーゼ活性を有し得る。すなわち、ニッカーゼは、HNHドメインのヌクレアーゼ活性を含まなくてよく、このために、HNHドメインを操作または修飾してもよい。
一例では、CRISPR酵素がII型CRISPR酵素である場合、ニッカーゼは、修飾されたHNHドメインを含むII型CRISPR酵素であり得る。
たとえば、II型CRISPR酵素が野性型SpCas9である場合、ニッカーゼは、野性型SpCas9のアミノ酸配列の840番目のアミノ酸をヒスチジンからアラニンへ変異させる変異によって、HNHドメインのヌクレアーゼ活性が不活性化されたSpCas9バリアントであり得る。それによって産生されるニッカーゼ、すなわちSpCas9バリアントは、RuvCドメインのヌクレアーゼ活性を有しているため、標的遺伝子の転写調節領域内の核酸の非相補鎖である鎖、すなわち、gRNAと相補的結合を形成しない鎖を切断することができる。
別の例では、II型CRISPR酵素が野性型CjCas9である場合、ニッカーゼは、野性型CjCas9のアミノ酸配列の559番目のアミノ酸をヒスチジンからアラニンへ変異させる変異によって、HNHドメインのヌクレアーゼ活性が不活性化されたCjCas9バリアントであり得る。それによって産生されるニッカーゼ、すなわち、CjCas9バリアントは、RuvCドメインのヌクレアーゼ活性を有しているため、標的遺伝子の転写調節領域内の核酸の非相補鎖である鎖、すなわち、gRNAと相補的結合を形成しない鎖を切断することができる。
加えて、ニッカーゼは、CRISPR酵素のHNHドメインによって引き起こされるヌクレアーゼ活性を有し得る。すなわち、ニッカーゼは、RuvCドメインのヌクレアーゼ活性を含まなくてよく、このために、RuvCドメインを操作または修飾してもよい。
一例では、CRISPR酵素がII型CRISPR酵素である場合、ニッカーゼは、修飾されたRuvCドメインを含むII型CRISPR酵素であり得る。
たとえば、II型CRISPR酵素が野性型SpCas9である場合、ニッカーゼは、野性型SpCas9のアミノ酸配列の10番目のアミノ酸をアスパラギン酸からアラニンへ変異させる変異によって、RuvCドメインのヌクレアーゼ活性が不活性化されたSpCas9バリアントであり得る。それによって産生されるニッカーゼ、すなわち、SpCas9バリアントは、HNHドメインのヌクレアーゼ活性を有しているため、標的遺伝子の転写調節領域内の核酸の相補鎖である鎖、すなわち、gRNAと相補的結合を形成する鎖を切断することができる。
別の例では、II型CRISPR酵素が野性型CjCas9とした場合、ニッカーゼは、野性型CjCas9のアミノ酸配列の8番目のアミノ酸をアスパラギン酸からアラニンへ変異させる変異によって、RuvCドメインのヌクレアーゼ活性が不活性化されたCjCas9バリアントであり得る。それによって産生されるニッカーゼ、すなわち、CjCas9バリアントは、HNHドメインのヌクレアーゼ活性を有しているため、標的遺伝子の転写調節領域内の核酸の相補鎖である鎖、すなわち、gRNAと相補的結合を形成する鎖を切断することができる。
CRISPR酵素は、不活性なCRISPR酵素であり得る。
「不活性」という用語は、野性型CRISPR酵素の機能、すなわち、二本鎖DNAの第1鎖を切断する第1の機能および二本鎖DNAの第2鎖を切断する第2の機能の両方を失われている状態を指す。そのような状態のCRISPR酵素は、不活性CRISPR酵素と呼ばれる。
不活性CRISPR酵素は、野性型CRISPR酵素のヌクレアーゼ活性を有するドメインの変化により、ヌクレアーゼ不活性を有し得る。
不活性なCRISPR酵素は、RuvCドメインおよびHNHドメイン内の変異により、ヌクレアーゼ不活性を有し得る。すなわち、不活性なCRISPR酵素は、CRISPR酵素のRuvCドメインおよびHNHドメインによって引き起こされるヌクレアーゼ活性を含まなくてよく、このために、RuvCドメインおよびHNHドメインを操作または修飾してもよい。
一例では、CRISPR酵素がII型CRISPR酵素である場合、不活性なCRISPR酵素は、修飾されたRuvCドメインおよび修飾されたHNHドメインを含むII型CRISPR酵素であり得る。
たとえば、II型CRISPR酵素が野性型SpCas9である場合、不活性CRISPR酵素は、野性型SpCas9のアミノ酸配列の10番目のアスパラギン酸と840番目のヒスチジンの両方のアラニンへの変異により、RuvCドメインとHNHドメインのヌクレアーゼ活性が不活性化されたSpCas9バリアントであり得る。ここで、産生される不活性なCRISPR酵素、すなわち、SpCas9バリアントは、RuvCドメインおよびHNHドメインのヌクレアーゼ活性が不活性化されているため、標的遺伝子の転写調節領域内の二本鎖核酸は、完全に切断され得る。
別の例では、II型CRISPR酵素が野性型CjCas9である場合、不活性なCRISPR酵素は、野性型CjCas9のアミノ酸配列の8番目のアスパラギン酸と559番目のヒスチジンの両方のアラニンへの変異により、RuvCドメインとHNHドメインのヌクレアーゼ活性が不活性化されたCjCas9バリアントであり得る。ここで、産生される不活性なCRISPR酵素、すなわち、CjCas9バリアントは、RuvCドメインおよびHNHドメインのヌクレアーゼ活性が不活性化されているため、標的遺伝子の転写調節領域内の二本鎖核酸は、完全には切断されないことがあり得る。
CRISPR酵素は、ヘリカーゼ活性、すなわち、上記のヌクレアーゼ活性に加えて、二本鎖核酸のらせん構造をほどく能力を有し得る。
加えて、CRISPR酵素は、完全に活性な、不完全もしくは部分的に活性な、または不活性なヘリカーゼ活性を有するように修飾されていてもよい。
CRISPR酵素は、野性型CRISPR酵素を人為的に操作または修飾することにより生成されるCRISPR酵素バリアントであり得る。
CRISPR酵素バリアントは、野性型CRISPR酵素の機能、すなわち、二本鎖DNAの第1鎖を切断する第1の機能および/または二本鎖DNAの第2鎖を切断する第2の機能を修飾するための人為的に操作または修飾されたCRISPR酵素バリアントであり得る。
たとえば、CRISPR酵素バリアントは、野性型CRISPR酵素の機能の第1の機能が失われた形態であり得る。
あるいは、CRISPR酵素バリアントは、野性型CRISPR酵素の機能の第2の機能が失われた形態であり得る。
たとえば、CRISPR酵素バリアントは、野性型CRISPR酵素の機能、すなわち、第1の機能と第2の機能の両方が失われた形態であり得る。
CRISPR酵素バリアントは、gRNAとの相互作用によりgRNA-CRISPR酵素複合体を形成し得る。
CRISPR酵素バリアントは、野性型CRISPR酵素のgRNAと相互作用する機能を修飾するための人為的に操作または修飾されたCRISPR酵素バリアントであり得る。
たとえば、CRISPR酵素バリアントは、野性型CRISPR酵素と比較して、gRNAとの相互作用が低下した形態であり得る。
あるいは、CRISPR酵素バリアントは、野性型CRISPR酵素と比較して、gRNAとの相互作用が増加した形態であり得る。
たとえば、CRISPR酵素バリアントは、野性型CRISPR酵素の第1の機能を有し、gRNAとの相互作用が低下した形態であり得る。
あるいは、CRISPR酵素バリアントは、野性型CRISPR酵素の第1の機能を有し、gRNAとの相互作用が増加した形態であり得る。
たとえば、CRISPR酵素バリアントは、野性型CRISPR酵素の第2の機能を有し、gRNAとの相互作用が低下した形態であり得る。
あるいは、CRISPR酵素バリアントは、野性型CRISPR酵素の第2の機能を有し、gRNAとの相互作用が増加した形態であり得る。
たとえば、CRISPR酵素バリアントは、野性型CRISPR酵素の第1の機能および第2の機能を有さず、gRNAとの相互作用が低下した形態であり得る。
あるいは、CRISPR酵素バリアントは、野性型CRISPR酵素の第1の機能および第2の機能を有さず、gRNAとの相互作用が増加した形態であり得る。
ここで、gRNAとCRISPR酵素バリアントとの間の相互作用強度に応じて、さまざまなgRNA-CRISPR酵素複合体が形成され得、CRISPR酵素バリアントに応じて、標的配列に近づくか、切断する機能に違いがあり得る。
たとえば、gRNAとの相互作用が低下したCRISPR酵素バリアントにより形成されたgRNA-CRISPR酵素複合体は、gRNAに完全に相補的に結合する標的配列に非常に接近または局在化した場合のみ、標的配列の二本鎖または一本鎖を切断し得る。
CRISPR酵素バリアントは、野性型CRISPR酵素のアミノ酸配列の少なくとも1つのアミノ酸が修飾された形態であり得る。
例として、CRISPR酵素バリアントは、野性型CRISPR酵素のアミノ酸配列のうち少なくとも1つのアミノ酸が置換された形態であり得る。
別の例として、CRISPR酵素バリアントは、野性型CRISPR酵素のアミノ酸配列の少なくとも1つのアミノ酸が欠失された形態であり得る。
さらに別の例として、CRISPR酵素バリアントは、野性型CRISPR酵素のアミノ酸配列の少なくとも1つのアミノ酸が付加された形態であり得る。
一例では、CRISPR酵素バリアントは、野性型CRISPR酵素のアミノ酸配列の少なくとも1つのアミノ酸が置換、欠失および/または付加された形態であり得る。
加えて、任意に、CRISPR酵素バリアントは、野性型CRISPR酵素の本来の機能、すなわち、二本鎖DNAの第1鎖を切断する第1の機能およびその第2鎖を切断する第2の機能に加えて、機能的ドメインをさらに含み得る。ここで、CRISPR酵素バリアントは、野性型CRISPR酵素の本来の機能に加えて、追加の機能を有し得る。
機能的ドメインは、メチラーゼ活性、デメチラーゼ活性、転写活性化活性、転写抑制活性、転写放出因子活性、ヒストン修飾活性、RNA切断活性もしくは核酸結合活性、または(ペプチドを含む)タンパク質の単離および精製用のタグもしくはレポーター遺伝子を有するドメインであり得るが、本発明はそれらに限定されない。
タグは、ヒスチジン(His)タグ、V5タグ、FLAGタグ、インフルエンザ血球凝集素(HA)タグ、Mycタグ、VSV-Gタグおよびチオレドキシン(Trx)タグを含み、レポーター遺伝子は、グルタチオン-S-トランスフェラーゼ(GST)、ホースラディッシュ・ペルオキシダーゼ(HRP)、クロラムフェニコールアセチルトランスフェラーゼ(CAT)、β-ガラクトシダーゼ、β-グルクロニダーゼ、ルシフェラーゼ、自家蛍光タンパク質であって、緑色蛍光タンパク質(GFP)、HcRed、DsRed、シアン蛍光タンパク質(CFP)、黄色蛍光タンパク質(YFP)および青色蛍光タンパク質(BFP)などのタンパク質を含むが、本発明はそれらに限定されない。
機能的ドメインはデアミナーゼであり得る。
たとえば、シチジンデアミナーゼは、不完全または部分的に活性なCRISPR酵素に対する機能的ドメインとしてさらに含まれ得る。例示的な一実施形態では、融合タンパク質は、シチジンデアミナーゼ、たとえばアポリポタンパク質B編集複合体1(APOBEC1)をSpCas9ニッカーゼに添加することにより産生され得る。上記のように形成された[SpCas9ニッカーゼ]-[APOBEC1]は、C~TもしくはUのヌクレオチド編集、またはG~Aのヌクレオチド編集に使用され得る。
別の例では、アデニンデアミナーゼは、不完全または部分的に活性なCRISPR酵素に対する機能的ドメインとしてさらに含まれ得る。例示的な一実施形態では、アデニンデアミナーゼ、たとえばTadAバリアント、ADAR2バリアントまたはADAT2バリアントをSpCas9ニッカーゼに加えることにより、融合タンパク質が産生され得る。融合タンパク質はヌクレオチドAをイノシンに修飾するため、上記のように形成された[SpCas9ニッカーゼ]-[TadAバリアント]、[SpCas9ニッカーゼ]-[ADAR2バリアント]または[SpCas9ニッカーゼ]-[ADAT2バリアント]は、A~Gのヌクレオチド編集、またはT~Cのヌクレオチド編集に使用され得、修飾されたイノシンはポリメラーゼによってヌクレオチドGとして認識され、それによって実質的にA~Gのヌクレオチド編集を示す。
機能的ドメインは、核局在化配列またはシグナル(NLS)または核外移行配列またはシグナル(NES)であり得る。
一例では、CRISPR酵素は、1つまたは複数のNLSを含み得る。ここで、1つまたは複数のNLSが、CRISPR酵素のN末端もしくはその近傍;当該酵素のC末端もしくはその近傍;またはそれらの組合せに含まれ得る。NLSは、以下のNLSに由来するNLS配列であり得るが、本発明はそれらに限定されない:アミノ酸配列PKKKRKVを有するSV40ウイルスラージT抗原のNLS;ヌクレオプラスミンからのNLS(たとえば、配列KRPAATKKAGQAKKKKを有するヌクレオプラスミン双節型NLS);アミノ酸配列PAAKRVKLDまたはRQRRNELKRSPを有するc-myc NLS;配列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGYを有するhRNPA1 M9 NLS;インポーチン-αからのIBBドメインの配列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV;筋腫Tタンパク質の配列VSRKRPRPおよびPPKKARED;ヒトP53の配列POPKKKPL;マウスc-abl IVの配列SALIKKKKKMAP;インフルエンザウイルスNS1の配列DRLRRおよび配列PKQKKRK;D型肝炎ウイルス抗原の配列RKLKKKIKKL;マウスMx1タンパク質の配列REKKKFLKRR;ヒトポリ(ADP-リボース)ポリメラーゼの配列KRKGDEVDGVDEVAKKKSKK;またはステロイドホルモン受容体(ヒト)グルココルチコイドの配列に由来するNLS配列RKCLQAGMNLEARKTKK。
加えて、CRISPR酵素変異体は、CRISPR酵素を2つ以上の部分に分割することにより調製されるスプリット型CRISPR酵素を含み得る。「スプリット」という用語は、タンパク質の機能的もしくは構造的分割またはタンパク質の2つ以上の部分へのランダムな分割を指す。
スプリット型CRISPR酵素は、完全、不完全もしくは部分的に活性な酵素または不活性な酵素であり得る。
たとえば、CRISPR酵素がSpCas9である場合、SpCas9は、残基656であるチロシンと残基657であるスレオニンとの間の2つの部分に分割され得、それによってスプリットSpCas9が生成される。
スプリット型CRISPR酵素は、再構成のための追加のドメイン、ペプチド、ポリペプチドまたはタンパク質を選択的に含み得る。
再構成のための追加のドメイン、ペプチド、ポリペプチドまたはタンパク質は、構造的に野性型CRISPR酵素と同じまたは類似するスプリット型CRISPR酵素の形成のために組み立てられ得る。
再構成のための追加のドメイン、ペプチド、ポリペプチドまたはタンパク質は、FRBおよびFKBP二量化ドメイン;インテイン;ERTおよびVPRドメイン;または特定の条件下でヘテロダイマーを形成するドメインであり得る。
たとえば、CRISPR酵素がSpCas9である場合、SpCas9は、残基713であるセリンと残基714であるグリシンとの間の2つの部分に分割され得、それによってスプリットSpCas9が生成される。FRBドメインは2つの部分の一方に連結され、FKBPドメインはもう一方に連結される。それによって生成されるスプリットSpCas9では、FRBドメインとFKBPドメインは、ラパマイシンが存在する環境において二量体で形成され得、それによって再構成されたCRISPR酵素が生成される。
本明細書に開示されるCRISPR酵素またはCRISPR酵素バリアントは、それをコードする配列を有するポリペプチド、タンパク質または核酸であり得、CRISPR酵素またはCRISPR酵素バリアントを導入するために対象に対してコドン最適化され得る。
「コドン最適化」という用語は、天然配列の少なくとも1つのコドンを、宿主細胞においてより高頻度または最も高頻度で使用されるコドンに置き換える一方、天然アミノ酸配列を維持することにより核酸配列を修飾して宿主細胞内での発現を向上させるためのプロセスを指す。さまざまな種は、特定のアミノ酸の特定のコドンについて特定のバイアスを有し、コドンバイアス(生物間のコドン使用頻度の差)は、mRNAの翻訳の効率と相関することが多く、このことは、翻訳されるコドンの特性と特異的なtRNA分子の入手可能性に依存すると考えられる。細胞内で選択されるtRNAの優位性は、一般にペプチド合成において最も高頻度で使用されるコドンを反映している。したがって、遺伝子は、所与の生物中の最適な遺伝子発現のためにコドン最適化に基づき個別に調整され得る。
本明細書に開示されるgRNA、CRISPR酵素またはgRNA-CRISPR酵素複合体は、さまざまな送達方法およびさまざまな形態により対象に送達または導入され得る。
主題関連の説明は上記の通りである。
例示的な一実施形態では、gRNAおよび/またはCRISPR酵素をコードする核酸配列は、ベクターによって対象に送達または導入され得る。
ベクターは、gRNAおよび/またはCRISPR酵素をコードする核酸配列を含み得る。
一例では、ベクターは、gRNAおよびCRISPR酵素をコードする核酸配列を同時に含み得る。
別の例では、ベクターは、gRNAをコードする核酸配列を含み得る。
たとえば、gRNAに含まれるドメインは、1つのベクターに含まれていても、分割されて異なるベクターに含まれていてもよい。
別の例では、ベクターは、CRISPR酵素をコードする核酸配列を含み得る。
たとえば、CRISPR酵素の場合、CRISPR酵素をコードする核酸配列は1つのベクターに含まれていても、分割されていくつかのベクターに含まれていてもよい。
ベクターは、1つまたは複数の調節/制御コンポーネントを含み得る。
ここで、調節/制御コンポーネントは、プロモーター、エンハンサー、イントロン、ポリアデニル化シグナル、コザックコンセンサス配列、内部リボソーム進入部位(IRES)、スプライスアクセプターおよび/または2A配列を含み得る。
プロモーターは、RNAポリメラーゼIIによって認識されるプロモーターであり得る。
プロモーターは、RNAポリメラーゼIIIによって認識されるプロモーターであり得る。
プロモーターは、誘導性プロモーターであり得る。
プロモーターは、対象特異的プロモーターであり得る。
プロモーターは、ウイルス性または非ウイルス性プロモーターであり得る。
プロモーターは、制御領域(すなわち、gRNAおよび/またはCRISPR酵素をコードする核酸配列)に応じて適切なプロモーターを使用してもよい。
たとえば、gRNAに有用なプロモーターは、H1、EF-1a、tRNAまたはU6プロモーターであり得る。たとえば、CRISPR酵素に有用なプロモーターは、CMV、EF-1a、EFS、MSCV、PGKまたはCAGプロモーターであり得る。
ベクターは、ウイルスベクターまたは組換えウイルスベクターであり得る。
ウイルスは、DNAウイルスまたはRNAウイルスであり得る。
ここで、DNAウイルスは、二本鎖DNA(dsDNA)ウイルスまたは一本鎖DNA(ssDNA)ウイルスであり得る。
ここで、RNAウイルスは、一本鎖RNA(ssRNA)ウイルスであり得る。ウイルスは、レトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴ウイルス(AAV)、ワクシニアウイルス、ポックスウイルスまたは単純ヘルペスウイルスであり得るが、本発明はこれらに限定されない。
一例では、gRNAおよび/またはCRISPR酵素をコードする核酸配列は、組換えレンチウイルスによって送達または導入され得る。
別の例では、gRNAおよび/またはCRISPR酵素をコードする核酸配列は、組換えアデノウイルスにより送達または導入され得る。さらに別の例では、gRNAおよび/またはCRISPR酵素をコードする核酸配列は、組換えAAVにより送達または導入され得る。さらに別の例では、gRNAおよび/またはCRISPR酵素をコードする核酸配列は、ハイブリッドウイルス、たとえば本明細書に記載のウイルスの1つまたは複数のハイブリッドによって送達または導入され得る。
例示的な一実施形態では、gRNA-CRISPR酵素複合体は、対象に送達または導入され得る。
たとえば、gRNAは、DNA、RNAまたはそれらの混合物の形態で存在し得る。CRISPR酵素は、ペプチド、ポリペプチドまたはタンパク質の形態で存在し得る。
一例では、gRNAおよびCRISPR酵素は、RNA型gRNAおよびタンパク質型CRISPR、すなわちリボ核タンパク質(RNP)を含むgRNA-CRISPR酵素複合体の形態で対象に送達または導入され得る。
gRNA-CRISPR酵素複合体は、エレクトロポレーション、マイクロインジェクション、一過性の細胞圧縮もしくは圧搾(たとえば、文献[Lee,et al,(2012)Nano Lett.,12,6322-6327]に記載)、脂質媒介トランスフェクション、ナノ粒子、リポソーム、ペプチド媒介送達またはそれらの組合せにより対象に送達または導入され得る。本明細書に開示されるgRNA-CRISPR酵素複合体を使用して、標的遺伝子、すなわち重複遺伝子の転写調節領域を人為的に操作または修飾することができる。
標的遺伝子の転写調節領域は、上記のgRNA-CRISPR酵素複合体、すなわちCRISPR複合体を使用して操作または修飾され得る。ここで、標的遺伝子の転写調節領域の操作または修飾は、i)標的遺伝子の転写調節領域の切断または損傷と、ii)損傷した転写調節領域の修復の両方を含み得る。
i)標的遺伝子の転写調節領域の切断または損傷は、CRISPR複合体を使用した標的遺伝子の転写調節領域の切断または損傷、特に転写調節領域の標的配列の切断または損傷であり得る。
標的配列は、gRNA-CRISPR酵素複合体の標的になり得、標的配列はCRISPR酵素によって認識されるPAM配列を含んでも含んでいなくてもよい。そのような標的配列は、gRNAの設計に関与している者に重要な基準を提供する。
標的配列は、gRNA-CRISPR酵素複合体のgRNAによって特異的に認識され得るため、gRNA-CRISPR酵素複合体は、認識された標的配列の近くに位置し得る。
標的部位での「切断」とは、ポリヌクレオチドの共有結合骨格の破損を指す。 切断は、ホスホジエステル結合の酵素的または化学的加水分解を含むが、本発明はそれに限定されない。これ以外に、切断はさまざまな方法によって行われ得る。一本鎖切断と二本鎖切断の両方が可能であり、ここで、二本鎖切断は、2つの異なる一本鎖切断から生じ得る。二本鎖切断により、平滑末端または付着末端(もしくは粘着末端)が生じ得る。
一例では、CRISPR複合体を使用した標的遺伝子の転写調節領域の切断または損傷は、標的配列の二本鎖の切断または損傷全体であり得る。
例示的な一実施形態では、CRISPR酵素が野性型SpCas9である場合、gRNAと相補的な結合を形成する標的配列の二本鎖は、CRISPR複合体によって完全に切断され得る。
別の例示的な実施形態では、CRISPR酵素がSpCas9ニッカーゼ(D10A)およびSpCas9ニッカーゼ(H840A)である場合、gRNAと相補的な結合を形成する標的配列の2本の一本鎖は、各CRISPR複合体によってそれぞれ切断され得る。すなわち、gRNAと相補的な結合を形成する標的配列の相補的な一本鎖はSpCas9ニッカーゼ(D10A)によって切断され得、gRNAと相補的な結合を形成する標的配列の非相補的な一本鎖はSpCas9ニッカーゼ(H840A)によって切断され得、これらの切断は、順次または同時に行われ得る。
別の例では、CRISPR複合体を使用した標的遺伝子の転写調節領域の切断または損傷は、標的配列の二本鎖のうちの一本鎖のみの切断または損傷であり得る。ここで、一本鎖は、gRNAに相補的に結合する標的配列のガイド核酸結合配列、すなわち相補的な一本鎖、またはgRNAに相補的に結合しない非ガイド核酸結合配列、すなわちgRNAと非相補的な一本鎖であり得る。
例示的な一実施形態では、CRISPR酵素がSpCas9ニッカーゼ(D10A)である場合、CRISPR複合体は、SpCas9ニッカーゼ(D10A)により、gRNAに相補的に結合する標的配列のガイド核酸結合配列、すなわち相補的な一本鎖を切断してよく、gRNAに相補的に結合しない非ガイド核酸結合配列、すなわちgRNAと非相補的な一本鎖を切断しなくてよい。
別の例示的な実施形態では、CRISPR酵素がSpCas9ニッカーゼ(H840A)である場合、CRISPR複合体は、SpCas9ニッカーゼ(H840A)により、gRNAに相補的に結合しない標的配列の非ガイド核酸結合配列、すなわちgRNAと非相補的な一本鎖を切断してよく、gRNAに相補的に結合する標的配列のガイド核酸結合配列、すなわち相補的な一本鎖を切断しなくてよい。
さらに別の例では、CRISPR複合体を使用した標的遺伝子の転写調節領域の切断または損傷は、核酸断片の部分的な除去であり得る。
例示的な一実施形態では、CRISPR複合体が、野性型SpCas9と、異なる標的配列を有する2つのgRNAから構成される場合、第1のgRNAと相補的な結合を形成する標的配列の二本鎖が切断され得、第2のgRNAと相補的な結合を形成する標的配列の二本鎖が切断され得、第1および第2のgRNAならびにSpCas9によって核酸断片の除去がもたらされる。
たとえば、2つのCRISPR複合体が、エンハンサーの上流に存在する標的配列に相補的に結合する1つのgRNAと、エンハンサーの下流に存在する標的配列に相補的に結合する他方のgRNAなどの異なる標的配列に相補的に結合する2つのgRNAと、野性型SpCas9とからなる場合、第1のgRNAに相補的に結合するエンハンサーの上流に存在する標的配列の二本鎖が切断され得、第2のgRNAに相補的に結合するエンハンサーの下流に存在する標的配列の二本鎖が切断され得、それによって、核酸断片、すなわちエンハンサー領域が、第1のgRNA、第2のgRNAおよびSpCas9によって除去される。
ii)損傷した転写調節領域の修復は、非相同末端結合(NHEJ)および相同性指向修復(HDR)を介して行われる修復または復元であり得る。
非相同末端結合(NHEJ)は、切断された二本鎖または一本鎖の両端をつなぎ合わせることにより、DNAの二本鎖の破損を復元または修復する方法であり、一般に、二本鎖の破損(たとえば切断)によって形成された2つの適合性のある末端が頻繁に互いに接触して2つの端部を完全につなぎ合わせる場合、破損した二本鎖が回復される。NHEJは、細胞周期全体で使用することができる修復方法であり、通常、G1期のように細胞内でテンプレートとして使用される相同ゲノムがない場合に起こる。
NHEJを使用した損傷遺伝子または核酸の修復プロセスでは、NHEJ修復領域で核酸配列のいくつかの挿入および/または欠失(インデル)が起こり、そのような挿入および/または欠失が、リーディングフレームのシフトを引き起こし、フレームシフトされたトランスクリプトームmRNAがもたらされる。その結果、先天機能は、ナンセンス媒介の崩壊または正常なタンパク質の合成の失敗のために失われる。加えて、リーディングフレームが維持される間、かなりの量の配列の挿入または欠失が起こる変異が、タンパク質の機能が破壊を引き起こし得る。変異は遺伝子座に依存する。なぜなら、タンパク質の有意でない領域の変異よりも、有意な機能的ドメインの変異の許容度がおそらく低いからである。
NHEJによって天然状態で生成されるインデル変異を期待することは不可能であるが、特異的インデル配列が所定の破損領域で優先され、ミクロ相同性の小さな領域に由来し得る。従来、欠失の長さは1bp~50bpの範囲であり、挿入はより短くなる傾向にあり、破損領域を直接囲む短い反復配列を頻繁に含む。
加えて、NHEJは変異を引き起こすプロセスであり、特異的な最終配列を生成する必要がない場合は、小さな配列のモチーフを欠失するのに使用することができる。
発現がCRISPR複合体により標的化された転写調節領域により制御される標的遺伝子の特異的ノックアウトは、そのようなNHEJを使用して行われ得る。標的遺伝子の転写調節領域の二本鎖または2本の一本鎖は、Cas9またはCpf1などのCRISPR酵素を使用して切断され得、破損した二本鎖または二本の一本鎖は、NHEJを介したインデルを有し、それによって、発現が転写調節領域によって制御される標的遺伝子の特異的ノックアウトを誘導する。
一例では、標的遺伝子の転写調節領域の二本鎖は、CRISPR複合体を使用して切断され得、NHEJを介して修復することにより、修復領域にさまざまなインデル(挿入および欠失)が生成され得る。
「インデル」という用語は、DNAのヌクレオチド配列に部分ヌクレオチドを挿入またはDNAのヌクレオチド配列から部分ヌクレオチドを欠失することによって形成されるバリエーションを指す。上記のようにgRNA-CRISPR酵素複合体が標的遺伝子の転写調節領域で標的配列を切断する場合、HDRまたはNHEJによる修復中に標的配列にインデルが導入され得る。
相同性指向修復(HDR)は、エラーのない修正方法であり、相同配列をテンプレートとして使用して、損傷した転写調節領域を修復または復元し、一般に、破損DNAを修復または復元、すなわち細胞の先天情報を復元し、破損DNAは、修飾されていない相補的なヌクレオチド配列の情報または姉妹染色分体の情報を使用して修復される。HDRの最も一般的な種類は相同組換え(HR)である。HDRは、通常、活発に分裂している細胞のS期またはG2/M期に起こる修復または復元方法である。
細胞の相補的ヌクレオチド配列または姉妹クロマチンを使用するのではなく、HDRを使用して損傷DNAを修復または復元するために、相補的ヌクレオチド配列または相同的ヌクレオチド配列の情報を使用して人為的に合成されたDNAテンプレート、すなわち、相補的ヌクレオチド配列または相同ヌクレオチド配列を含む核酸テンプレートが細胞に提供され得、それによって破損DNAが修復される。ここで、核酸配列または核酸断片を核酸テンプレートにさらに加えて破損DNAを修復する場合、破損DNAにさらに加えられた核酸配列または核酸断片をノックインしてもよい。さらに追加された核酸配列または核酸断片は、正常な遺伝子、または細胞内で発現される遺伝子もしくは核酸への変異によって修飾された標的遺伝子の転写調節領域を修正するための核酸配列または核酸断片であり得るが、本発明はそれらに限定されない。
一例では、標的遺伝子酸の転写調節領域の二本鎖または一本鎖が、CRISPR複合体を使用して切断され得、切断部位に隣接するヌクレオチド配列に相補的なヌクレオチド配列を含む核酸テンプレートが細胞に提供され得、標的遺伝子の転写調節領域の切断されたヌクレオチド配列は、HDRを介して修復または復元され得る。
ここで、相補的ヌクレオチド配列を含む核酸テンプレートは、破損DNAの相補的ヌクレオチド配列、すなわち切断された二本鎖または一本鎖を有し得、破損DNAに挿入される核酸配列または核酸断片をさらに含み得る。追加の核酸配列または核酸断片は、相補的ヌクレオチド配列および挿入される核酸配列または核酸断片を含む核酸テンプレートを使用して、破損DNA、すなわち標的遺伝子の転写調節領域の切断部位に挿入され得る。ここで、挿入される核酸配列または核酸断片および追加の核酸配列または核酸断片は、正常な遺伝子、または細胞内で発現される遺伝子もしくは核酸への変異によって修飾された標的遺伝子の転写調節領域を修正するための核酸配列または核酸断片であり得る。相補的ヌクレオチド配列は、破損DNAとの相補的な結合を有するヌクレオチド配列、すなわち、標的遺伝子の転写調節領域の切断された二本鎖または一本鎖の右および左のヌクレオチド配列であり得る。あるいは、相補的ヌクレオチド配列は、破損DNAとの相補的な結合を有するヌクレオチド配列、すなわち、標的遺伝子の転写調節領域の切断された二本鎖または一本鎖の3'および5'末端を有するヌクレオチド配列であり得る。相補的ヌクレオチド配列は15~3000ヌクレオチド配列であり得、相補的ヌクレオチド配列の長さまたはサイズは、核酸テンプレートまたは標的遺伝子の転写調節領域のサイズに従って適切に設計され得る。ここで、核酸テンプレートは、二本鎖または一本鎖の核酸であり得、線状または環状であり得るが、本発明はそれらに限定されない。
別の例では、標的遺伝子酸の転写調節領域の二本鎖または一本鎖が、CRISPR複合体を使用して切断され得、切断部位に隣接するヌクレオチド配列と相同のヌクレオチド配列を含む核酸テンプレートが細胞に提供され得、標的遺伝子の転写調節領域の切断されたヌクレオチド配列は、HDRを介して修復または復元され得る。
ここで、相同ヌクレオチド配列を含む核酸テンプレートは、破損DNAの相同ヌクレオチド配列、すなわち切断された二本鎖または一本鎖を有し得、破損DNAに挿入される核酸配列または核酸断片をさらに含み得る。追加の核酸配列または核酸断片は、相同ヌクレオチド配列および挿入される核酸配列または核酸断片を含む核酸テンプレートを使用して、破損DNA、すなわち標的遺伝子の転写調節領域の切断部位に挿入され得る。ここで、挿入される核酸配列または核酸断片および追加の核酸配列または核酸断片は、正常な遺伝子、または細胞内で発現される遺伝子もしくは核酸への変異によって修飾された標的遺伝子または核酸の転写調節領域を修正するための核酸配列または核酸断片であり得る。相同ヌクレオチド配列は、破損DNAと相同性を有するヌクレオチド配列、すなわち、転写調節領域の切断された二本鎖の右および左のヌクレオチド配列であり得る。あるいは、相同ヌクレオチド配列は、破損DNAとの相同性を有するヌクレオチド配列、すなわち、転写調節領域の切断された二本鎖または一本鎖の3'および5'末端を有するヌクレオチド配列であり得る。相同ヌクレオチド配列は15~3000ヌクレオチド配列であり得、相同ヌクレオチド配列の長さまたはサイズは、核酸テンプレートまたは標的遺伝子の転写調節領域のサイズに従って適切に設計され得る。ここで、核酸テンプレートは、二本鎖または一本鎖の核酸であり得、線状または環状であり得るが、本発明はそれらに限定されない。
NHEJおよびHDR以外にも、損傷した転写調節領域を修復または復元するためのさまざまな方法がある。たとえば、損傷した転写調節領域を修復または復元する方法は、一本鎖アニーリング、一本鎖破損修復、ミスマッチ修復、ヌクレオチド切断修復、またはヌクレオチド切断修復を使用する方法であり得る。
一本鎖アニーリング(SSA)は、標的核酸に存在する2つの反復配列間の二本鎖切断を修復する方法で、一般に30ヌクレオチド超の反復配列を使用する。反復配列は、(粘着末端を有するように)破損した各末端の標的核酸の二本鎖に対して一本鎖を有するように切断され、切断後、反復配列を含む一本鎖オーバーハングがRPAタンパク質でコーティングされ、反復配列が互いに不適切にアニーリングすることが防がれる。RAD52は、オーバーハング上の各反復配列に結合し、相補的な反復配列をアニーリングすることができる配列が配置される。アニーリング後、オーバーハングの一本鎖フラップが切断され、新しいDNAの合成により一定のギャップが埋められてDNA二本鎖が復元される。この修復のその結果、2つの反復間のDNA配列が欠失され、欠失の長さは、本明細書で使用される2つの反復の位置と、切断の進行の経路または程度を含むさまざまな要因に依存し得る。
SSAは、HDRと同様に、相補配列、すなわち相補反復配列を利用するが、対照的に、標的核酸配列を修飾または修正するための核酸テンプレートは必要としない。
ゲノムの一本鎖破損は、上記の修復メカニズムとは別個のメカニズム、一本鎖破損修復(SSBR)を介して修復される。一本鎖DNA破損の場合、PARP1および/またはPARP2は破損を認識し、修復機構を補充する。DNA破損に対するPARP1の結合と活性は一時的であり、SSBRは、損傷領域でのSSBRタンパク質複合体の安定性を促進することにより促進される。SSBR複合体の最も重要なタンパク質はXRCC1であり、それはDNAの3'および5'末端処理を促進するタンパク質と相互作用してDNAを安定化する。末端処理は、一般に、損傷した3'末端のヒドロキシル化状態への修復、および/または損傷した5'末端のリン酸部分への修復に関与し、末端が処理された後、DNAギャップが埋められる。DNAギャップを埋めるための2つの方法、すなわち、短いパッチ修復と長いパッチ修復があり、短いパッチ修復は、単一ヌクレオチドの挿入を含む。DNAギャップが埋められた後、DNAリガーゼが末端結合を促進する。
ミスマッチ修復(MMR)は、ミスマッチDNAヌクレオチドに対して機能する。MSH2/6またはMSH2/3の各複合体は、ATPase活性を有しており、ひいてはミスマッチの認識と修復の開始に重要な役割を果たし、MSH2/6は、主にヌクレオチド間のミスマッチを認識し、1つまたは2つのヌクレオチドミスマッチを識別するが、MSH2/3は、主により大きなミスマッチを認識する。
塩基除去修復(BER)は、細胞周期全体を通じて有効であり、小さな非ヘリックス歪みの塩基損傷領域をゲノムから除去するために使用される修復方法である。損傷DNAでは、ヌクレオチドをリン酸-デオキシリボース骨格につなぎ合わせるN-グリコシド結合を切断することにより損傷ヌクレオチドが除去され、次いでホスホジエステル骨格が切断され、それによって一本鎖DNAの破損が生じる。それによって形成される破損した一本鎖末端が除去され、除去された一本鎖により生じたギャップが新しい相補的ヌクレオチドで埋められ、次いで新たに埋められた相補的ヌクレオチドの末端がDNAリガーゼにより骨格とライゲーションされ、損傷DNAが修復される。
ヌクレオチド除去修復(NER)は、DNAから大きなヘリックス歪み損傷を除去するために重要な切除機構であり、損傷が認識されると、損傷領域を含む短い一本鎖DNAセグメントが除去され、22~30ヌクレオチドの一本鎖ギャップが生じる。生じたギャップは、新しい相補的なヌクレオチドで埋められ、新たに埋められた相補的なヌクレオチドの端部がDNAリガーゼによって骨格とライゲーションされ、損傷DNAが修復される。
gRNA-CRISPR酵素複合体による標的遺伝子の転写調節領域の人為的操作の効果は、主にノックアウト(ノック-アウト)、ノックダウン、ノックイン(ノック-イン)および発現の増加であり得る。
「ノックアウト」という用語は、標的遺伝子または核酸の不活性化を指し、「標的遺伝子または核酸の不活性化」とは、標的遺伝子または核酸の転写および/または翻訳が起こらない状態を指す。疾患を引き起こす遺伝子または異常な機能を有する遺伝子の転写および翻訳は、ノックアウトを介して阻害され得、タンパク質発現が防がれる。
たとえば、gRNA-CRISPR酵素複合体、すなわちCRISPR複合体を使用して標的遺伝子の転写調節領域が編集される場合、CRISPR複合体を使用して標的遺伝子の転写調節領域が切断され得る。CRISPR複合体を使用して損傷を受けた転写調節領域は、NHEJによって修復され得る。損傷した転写調節領域では、NHEJによってインデルが生成され、ひいては損傷した転写調節領域が不活性化され、それによって標的遺伝子または染色体特異的ノックアウトが誘導される。
別の例では、gRNA-CRISPR酵素複合体、すなわちCRISPR複合体とドナーを使用して標的遺伝子の転写調節領域が編集される場合、CRISPR複合体を使用して標的遺伝子の転写調節領域が切断され得る。CRISPR複合体を使用して損傷を受けた転写調節領域は、ドナーを使用してHDRによって修復され得る。ここで、ドナーは、相同ヌクレオチド配列と挿入が望まれるヌクレオチド配列を含む。ここで、挿入されるヌクレオチド配列の数は、挿入位置または目的に応じて異なり得る。損傷した転写調節領域がドナーを使用して修復されると、挿入されるヌクレオチド配列が、損傷したヌクレオチド配列領域に挿入されるため、転写調節領域が不活性化され、それによって標的遺伝子または染色体特異的ノックアウトが誘導される。
「ノックダウン」という用語は、標的遺伝子もしくは核酸の転写および/または翻訳の減少、または標的タンパク質の発現を指す。ノックダウンを介して遺伝子またはタンパク質の過剰発現を調節することにより、疾患の発症が予防され得るか、疾患が治療され得る。
たとえば、gRNA-CRISPR酵素複合体、すなわちCRISPR複合体を使用して標的遺伝子の転写調節領域が編集される場合、CRISPR複合体を使用して標的遺伝子の転写調節領域が切断され得る。CRISPR複合体を使用して損傷を受けた転写調節領域は、NHEJによって修復され得る。損傷した転写調節領域では、NHEJによってインデルが生成される、ひいては損傷した転写調節領域が不活性化され、それによって標的遺伝子または染色体特異的ノックダウンが誘導される。
別の例では、gRNA-CRISPR酵素複合体、すなわちCRISPR複合体とドナーを使用して標的遺伝子の転写調節領域が編集される場合、CRISPR複合体を使用して標的遺伝子の転写調節領域が切断され得る。CRISPR複合体を使用して損傷を受けた転写調節領域は、ドナーを使用してHDRによって修復され得る。ここで、ドナーは、相同ヌクレオチド配列と挿入が望まれるヌクレオチド配列を含む。ここで、挿入されるヌクレオチド配列の数は、挿入位置または目的に応じて異なり得る。ドナーを使用して損傷した転写調節領域が修復されると、挿入されるヌクレオチド配列が、損傷したヌクレオチド配列領域に挿入されるため、転写調節領域が不活性化され、それによって標的遺伝子または染色体特異的ノックダウンが誘導される。
たとえば、gRNA-CRISPR不活性酵素転写阻害活性ドメイン複合体、すなわち転写阻害活性ドメインを含むCRISPR不活性複合体を使用して、標的遺伝子の転写調節領域が編集される場合、CRISPR不活性複合体は、標的遺伝子の転写調節領域に特異的に結合し、転写調節領域の活性は、CRISPR-不活性複合体に含まれる転写阻害活性ドメインによって阻害され、それによって標的遺伝子または染色体の発現を阻害するノックダウンが誘導される。
「ノックイン」という用語は、標的遺伝子または核酸への特定の核酸または遺伝子の挿入を指し、ここで、「特定の核酸または遺伝子」とは、挿入または発現される対象の遺伝子または核酸を指す。疾患を誘発する変異遺伝子が、ノックインを介して正常な遺伝子の発現を誘導するために、正常への修正または正常な遺伝子の挿入によって疾患治療に利用され得る。
加えて、ノックインは、ドナーさらに必要とし得る。
たとえば、gRNA-CRISPR酵素複合体、すなわちCRISPR複合体とドナーを使用して標的遺伝子または核酸が編集される場合、CRISPR複合体を使用して標的遺伝子または核酸が切断され得る。CRISPR複合体を使用して損傷した標的遺伝子または核酸は、ドナーを使用してHDRによって修復され得る。ここで、ドナーは、特定の核酸または遺伝子を含み得、特定の核酸または遺伝子を損傷した遺伝子または染色体に挿入するために使用され得る。ここで、挿入された特定の核酸または遺伝子は、タンパク質の発現を誘導し得る。
「発現の増加」とは、人為的な操作前と比較して、標的遺伝子もしくは核酸の転写および/または翻訳または標的タンパク質の発現の増加を指す。疾患は、過小発現もしくは非発現の遺伝子またはタンパク質の発現を制御することにより予防または治療され得る。
たとえば、gRNA-CRISPR酵素複合体、すなわちCRISPR複合体を使用して標的遺伝子の転写調節領域が編集される場合、CRISPR複合体を使用して標的遺伝子の転写調節領域が切断され得る。CRISPR複合体を使用して損傷を受けた転写調節領域は、NHEJによって修復され得る。損傷した転写調節領域では、NHEJによってインデルが生成され、それによって転写調節領域の活性が増加し、正常な標的遺伝子または染色体の発現が誘導される。本明細書に開示される1つの例示的な実施形態では、gRNA-CRISPR酵素複合体は、重複遺伝子の転写調節領域に人為的な操作または修飾を加えることができる。
gRNA-CRISPR酵素複合体は、重複遺伝子の転写調節領域内の標的配列を特異的に認識し得る。
ここで、重複遺伝子は、PMP22遺伝子、PLP1遺伝子、MECP2遺伝子、SOX3遺伝子、RAI1遺伝子、TBX1遺伝子、ELN遺伝子、JAGGED1遺伝子、NSD1遺伝子、MMP23遺伝子、LMB1遺伝子、SNCA遺伝子およびAPP遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
あるいは、重複遺伝子は、MYC遺伝子、ERBB2(HER2)遺伝子、CCND1(サイクリンD1)遺伝子、FGFR1遺伝子、FGFR2遺伝子、HRAS遺伝子、KRAS遺伝子、MYB遺伝子、MDM2遺伝子、CCNE(サイクリンE)遺伝子、MET遺伝子、CDK4遺伝子、ERBB1遺伝子、MYCN遺伝子およびAKT2遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
転写調節領域の説明は上記の通りである。
標的配列は、gRNA-CRISPR酵素複合体のgRNAによって特異的に認識され得るため、gRNA-CRISPR酵素複合体は、認識された標的配列の近くに位置し得る。
標的配列は、重複遺伝子の転写調節領域で人為的な修飾が起こる部位または領域であり得る。
標的配列の説明は上記の通りである。
例示的な一実施形態では、標的配列は、表1、2、3および4に列挙されている1つまたは複数のヌクレオチド配列であり得る。
gRNA-CRISPR酵素複合体は、gRNAとCRISPR酵素からなる。
gRNAは、重複遺伝子の転写調節領域内の標的配列のガイド核酸結合配列に部分的または完全に相補的に結合することができるガイドドメインを含み得る。
ガイドドメインは、ガイド核酸結合配列に対して少なくとも70%、75%、80%、85%、90%、95%以上が相補的、または完全に相補的であり得る。
ガイドドメインは、重複遺伝子の転写調節領域内の標的配列のガイド核酸結合配列に相補的なヌクレオチド配列を含み得る。ここで、相補的ヌクレオチド配列は、0~5、0~4、0~3、または0~2個のミスマッチを含み得る。
gRNAは、第1の相補的ドメイン、リンカードメイン、第2の相補的ドメイン、近位ドメインおよびテールドメインからなる群より選択される1つまたは複数のドメインを含み得る。
ここで、CRISPR酵素は、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)由来のCas9タンパク質、カンピロバクター・ジェジュニ(Campylobacter jejuni)由来のCas9タンパク質、ストレプトコッカス・サーモフィラス(Streptococcus thermophilus)由来のCas9タンパク質、スタフィロコッカス・アウレウス(Staphylococcus aureus)由来のCas9タンパク質およびナイセリア・メニンギティディス(Neisseria meningitidis)由来のCas9タンパク質およびCpf1タンパク質からなる群より選択される1つまたは複数の酵素であり得る。一例では、エディタータンパク質は、カンピロバクター・ジェジュニ(Campylobacter jejuni)由来のCas9タンパク質またはスタフィロコッカス・アウレウス(Staphylococcus aureus)由来のCas9タンパク質であり得る。
gRNA-CRISPR酵素複合体は、重複遺伝子の転写調節領域にさまざまな人為的な操作または修飾を加えることができる
重複遺伝子の人為的に操作または修飾された転写調節領域は、標的配列に位置するか、標的配列の5'末端および/または3'末端に隣接して位置する1~50bpの連続したヌクレオチド配列領域に対する以下の1つまたは複数の改変を含み得る:
i)1つまたは複数のヌクレオチドの欠失、
ii)1つまたは複数のヌクレオチドの野性型遺伝子とは異なるヌクレオチドへの置換、
iii)1つまたは複数のヌクレオチドの挿入、または
iv)i)~iii)から選択される2つ以上の組合せ。
たとえば、重複遺伝子の人為的に操作または修飾された転写調節領域は、標的配列に位置するか、標的配列の5'末端および/または3'末端に隣接して位置する1~50bpの連続したヌクレオチド配列領域内の1つまたは複数のヌクレオチドの欠失を含み得る。一例では、欠失ヌクレオチドは、1、2、3、4または5つの連続的または非連続的な塩基対であり得る。別の例では、欠失ヌクレオチドは、2bp以上の連続したヌクレオチドからなるヌクレオチド断片であり得る。ここで、ヌクレオチド断片は、2~5、6~10、11~15、16~20、21~25、26~30、31~35、36~40、41~45、または46~50塩基対であり得る。さらに別の例では、欠失ヌクレオチドは2つ以上のヌクレオチド断片であり得る。ここで、2つ以上のヌクレオチド断片は、それぞれ非連続的なヌクレオチド配列、すなわち1つまたは複数のヌクレオチド配列ギャップを有するヌクレオチド断片であり得、2つ以上の欠失ヌクレオチド断片による2つ以上の欠失部位を有し得る。
あるいは、たとえば、重複遺伝子の人為的に操作または修飾された転写調節領域は、標的配列に位置するか、標的配列の5'末端および/または3'末端に隣接して位置する1~50bpの連続したヌクレオチド配列領域内の1つまたは複数のヌクレオチドの挿入を含み得る。一例では、挿入されるヌクレオチドは、1、2、3、4または5つの連続した塩基対であり得る。別の例では、挿入されるヌクレオチドは、5つ以上の連続した塩基対からなるヌクレオチド断片であり得る。ここで、ヌクレオチド断片は、5~10、11~50、50~100、100~200、200~300、300~400、400~500、500~750、または750~1000塩基対であり得る。さらに別の例では、挿入されるヌクレオチドは、特異的遺伝子の部分的または完全なヌクレオチド配列であり得る。ここで、特異的遺伝子は、外部から入力された遺伝子であり、重複遺伝子を有するヒト細胞などの対象には含まれない。あるいは、特異的遺伝子は、たとえばヒト細胞のゲノムに存在する遺伝子などの重複遺伝子とともに、ヒト細胞などの対象に含まれる遺伝子であり得る
あるいは、たとえば、重複遺伝子の人為的に操作または修飾された転写調節領域は、標的配列に位置するか、標的配列の5'末端および/または3'末端に隣接して位置する1~50bpの連続したヌクレオチド配列領域内の1つまたは複数のヌクレオチドの欠失および挿入を含み得る。一例では、欠失ヌクレオチドは、1、2、3、4または5つの連続的または非連続的な塩基対であり得る。ここで、挿入されるヌクレオチドは、1、2、3、4または5つの塩基対;ヌクレオチド断片;または特異的遺伝子の部分的または完全なヌクレオチド配列であり得、欠失および挿入は順次または同時に起こり得る。ここで、挿入されるヌクレオチド断片は、5~10、11~50、50~100、100~200、200~300、300~400、400~500、500~750、または750~1000塩基対であり得る。ここで、特異的遺伝子は、重複遺伝子を有するヒト細胞などの対象の外部から入力された遺伝子であり得る。あるいは、特異的遺伝子は、たとえばヒト細胞のゲノムに存在する遺伝子などの重複遺伝子とともに、ヒト細胞などの対象に含まれる遺伝子であり得る。別の例では、欠失ヌクレオチドは、2塩基対以上からなるヌクレオチド断片であり得る。ここで、欠失ヌクレオチド断片は、2~5、6~10、11~15、16~20、21~25、26~30、31~35、36~40、41~45、または46~50塩基対であり得る。ここで、挿入されるヌクレオチドは、1、2、3、4または5塩基対;ヌクレオチド断片;または特異的遺伝子の部分的または完全なヌクレオチド配列であり得、欠失および挿入は順次または同時に起こり得る。さらに別の例では、欠失ヌクレオチドは2つ以上のヌクレオチド断片であり得る。ここで、挿入されるヌクレオチドは、1、2、3、4または5塩基対;ヌクレオチド断片;または特異的遺伝子の部分的または完全なヌクレオチド配列であり得、欠失および挿入は順次または同時に起こり得る。加えて、欠失された2つ以上の部位の一部またはすべてで挿入が起こり得る。
gRNA-CRISPR酵素複合体は、gRNAおよびCRISPR酵素の種類に応じて、重複遺伝子の転写調節領域にさまざまな人為的な操作または修飾を加えることができる。
一例では、CRISPR酵素がSpCas9タンパク質である場合、重複遺伝子の人為的に操作または修飾された転写調節領域は、標的領域に存在する5'-NGG-3'(Nは、A、T、GまたはCである)PAM配列の5'末端および/または3'末端に隣接して位置する1~50bp、1~40bp、1~30bp、または好ましくは1~25bpの連続したヌクレオチド配列領域に以下の1つまたは複数の改変を含み得る:
i)1つまたは複数のヌクレオチドの欠失、
ii)1つまたは複数のヌクレオチドの野性型遺伝子とは異なるヌクレオチドへの置換、
iii)1つまたは複数のヌクレオチドの挿入、または
iv)i)~iii)から選択される2つ以上の組合せ。
別の例では、CRISPR酵素がCjCas9タンパク質である場合、重複遺伝子の人為的に操作または修飾された転写調節領域は、標的配列に存在する5'-NNNNRYAC-3'(Nは、それぞれ独立してA、T、CまたはGであり、Rは、AまたはGであり、Yは、CまたはTである)PAM配列の5'末端および/または3'末端に隣接して位置する1~50bp、1~40bp、1~30bp、または好ましくは1~25bpの連続したヌクレオチド配列領域に以下の1つまたは複数の改変を含み得る:
i)1つまたは複数のヌクレオチドの欠失、
ii)1つまたは複数のヌクレオチドの野性型遺伝子とは異なるヌクレオチドへの置換、
iii)1つまたは複数のヌクレオチドの挿入、または
iv)i)~iii)から選択される2つ以上の組合せ。
さらに別の例では、CRISPR酵素がStCas9タンパク質である場合、重複遺伝子の人為的に操作または修飾された転写調節領域は、標的配列に存在する5'-NNAGAAW-3'(Nは、それぞれ独立してA、T、CまたはGであり、Wは、AまたはTである)PAM配列の5'末端および/または3'末端に隣接して位置する1~50bp、1~40bp、1~30bp、または好ましくは1~25bpの連続したヌクレオチド配列領域に以下の1つまたは複数の改変を含み得る:
i)1つまたは複数のヌクレオチドの欠失、
ii)1つまたは複数のヌクレオチドの野性型遺伝子とは異なるヌクレオチドへの置換、
iii)1つまたは複数のヌクレオチドの挿入、または
iv)i)~iii)から選択される2つ以上の組合せ。
一例では、CRISPR酵素がNmCas9タンパク質である場合、重複遺伝子の人為的に操作または修飾された転写調節領域は、標的配列に存在する5'-NNNNGATT-3'(Nは、それぞれ独立してA、T、CまたはGである)PAM配列の5'末端および/または3'末端に隣接して位置する1~50bp、1~40bp、1~30bp、または好ましくは1~25bpの連続したヌクレオチド配列領域に以下の1つまたは複数の改変を含み得る:
i)1つまたは複数のヌクレオチドの欠失、
ii)1つまたは複数のヌクレオチドの野性型遺伝子とは異なるヌクレオチドへの置換、
iii)1つまたは複数のヌクレオチドの挿入、または
iv)i)~iii)から選択される2つ以上の組合せ。
別の例では、CRISPR酵素がSaCas9タンパク質である場合、重複遺伝子の人為的に操作または修飾された転写調節領域は、標的配列に存在する5'-NNGRR(T)-3'(Nが、それぞれ独立してA、T、CまたはGであり、RがAまたはGであり、(T)が任意に含まれる配列を指す)PAM配列の5'末端および/または3'末端に隣接して位置する1~50bp、1~40bp、1~30bp、または好ましくは1~25bpの連続したヌクレオチド配列領域に以下の1つまたは複数の改変を含み得る:
i)1つまたは複数のヌクレオチドの欠失、
ii)1つまたは複数のヌクレオチドの野性型遺伝子とは異なるヌクレオチドへの置換、
iii)1つまたは複数のヌクレオチドの挿入、または
iv)i)~iii)から選択される2つ以上の組合せ。
さらに別の例では、CRISPR酵素がCpf1タンパク質である場合、重複遺伝子の人為的に操作または修飾された転写調節領域は、標的配列に存在する5'-TTN-3'(Nは、A、T、CまたはGである)PAM配列の5'末端および/または3'末端に隣接して位置する1~50bp、1~40bp、1~30bp、または好ましくは1~25bpの連続したヌクレオチド配列領域に以下の1つまたは複数の改変を含み得る:
i)1つまたは複数のヌクレオチドの欠失、
ii)1つまたは複数のヌクレオチドの野性型遺伝子とは異なるヌクレオチドへの置換、
iii)1つまたは複数のヌクレオチドの挿入、または
iv)i)~iii)から選択される2つ以上の組合せ。
gRNA-CRISPR酵素複合体による重複遺伝子の転写調節領域を人為的に操作する効果はノックアウトであり得る。
gRNA-CRISPR酵素複合体による重複遺伝子によりコードされるタンパク質の発現は阻害され得る。
gRNA-CRISPR酵素複合体による重複遺伝子の転写調節領域を人為的に操作する効果はノックダウンであり得る。
gRNA-CRISPR酵素複合体による重複遺伝子によりコードされるタンパク質の発現は減少し得る。
gRNA-CRISPR酵素複合体による重複遺伝子の転写調節領域を人為的に操作する効果はノックインであり得る。
ここで、ノックイン効果は、gRNA-CRISPR酵素複合体と、外因性のヌクレオチド配列または遺伝子を追加で含むドナーによって誘導され得る。
gRNA-CRISPR酵素複合体とドナーによる重複遺伝子の転写調節領域を人為的に操作する効果は、外因性のヌクレオチド配列または遺伝子によりコードされるペプチドまたはタンパク質を発現させることにより誘導され得る。
ここで、ノックイン効果は、gRNA-CRISPR酵素複合体と、挿入が望まれるヌクレオチド配列を含むドナーによって誘導され得る。本明細書で開示される一態様は、発現を制御する方法に関する。
本明細書に開示される1つの例示的な実施形態は、in vivo、ex vivoまたはin vitroで行われ得る重複遺伝子の発現を制御する方法に関する。
いくつかの実施形態では、この方法は、ヒトまたは非ヒト動物からの細胞または細胞のコロニーをサンプリングし、1つまたは複数の細胞を修飾することを含み得る。培養は、ex vivoのどの段階でも行われ得る。1つまたは複数の細胞は、非ヒト動物または植物に再導入され得る。
この方法は、真核細胞を人為的に改変する方法であり得、それは、重複遺伝子を有する真核細胞に発現制御組成物を導入することを含む。
発現制御組成物の説明は上記の通りである。
一実施形態では、発現制御組成物は以下のものを含み得る:
(a)重複遺伝子の転写調節領域に位置する標的配列を標的とすることができるガイド核酸またはそれをコードする核酸配列;および
(b)ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)由来のCas9タンパク質、カンピロバクター・ジェジュニ(Campylobacter jejuni)由来のCas9タンパク質、ストレプトコッカス・サーモフィラス(Streptococcus thermophilus)由来のCas9タンパク質、スタフィロコッカス・アウレウス(Staphylococcus aureus)由来のCas9タンパク質およびナイセリア・メニンギティディス(Neisseria meningitidis)由来のCas9タンパク質およびCpf1タンパク質、または当該タンパク質をコードする核酸配列からなる群より選択される1つまたは複数のタンパク質を含むエディタータンパク質。
ここで、重複遺伝子は、PMP22遺伝子、PLP1遺伝子、MECP2遺伝子、SOX3遺伝子、RAI1遺伝子、TBX1遺伝子、ELN遺伝子、JAGGED1遺伝子、NSD1遺伝子、MMP23遺伝子、LMB1遺伝子、SNCA遺伝子およびAPP遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
あるいは、重複遺伝子は、MYC遺伝子、ERBB2(HER2)遺伝子、CCND1(サイクリンD1)遺伝子、FGFR1遺伝子、FGFR2遺伝子、HRAS遺伝子、KRAS遺伝子、MYB遺伝子、MDM2遺伝子、CCNE(サイクリンE)遺伝子、MET遺伝子、CDK4遺伝子、ERBB1遺伝子、MYCN遺伝子およびAKT2遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
転写調節領域の説明は上記の通りである。
ガイド核酸とエディタータンパク質は、個々の核酸配列の形態で、またはガイド核酸とエディタータンパク質の結合により複合体を形成することによって、1つまたは複数のベクターに存在してもよい。
任意に、発現制御組成物は、挿入されることが望ましい核酸配列またはそれをコードする核酸配列を含むドナーをさらに含み得る。
ガイド核酸、エディタータンパク質および/またはドナーは、個々の核酸配列の形態で1つまたは複数のベクターに存在してもよい。
導入段階は、in vivoまたはex vivoで行われ得る。
たとえば、導入段階は、エレクトロポレーション、リポソーム、プラスミド、ウイルスベクター、ナノ粒子、およびタンパク質移行ドメイン(PTD)融合タンパク質法から選択される1つまたは複数の方法に行われ得る。
たとえば、ウイルスベクターは、レトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴ウイルス(AAV)、ワクシニアウイルス、ポックスウイルスまたは単純ヘルペスウイルスからなる群より選択される1つまたは複数のものであり得る。本明細書に開示される一態様は、発現を制御して遺伝子重複疾患を治療するための組成物を使用して遺伝子重複疾患を治療する方法に関する。
本明細書に開示される例示的な一実施形態は、重複遺伝子の転写調節領域を治療対象に人為的に操作するための発現制御組成物の投与を含む方法を用いた遺伝子重複疾患の治療の使用に関する。
ここで、治療対象には、ヒト、サルなどの霊長類、ならびにマウスおよびラットなどの齧歯類を含む哺乳類が含まれ得る。
遺伝子重複疾患の説明は上記の通りである。
例示的な一実施形態では、遺伝子重複疾患は、PMP22遺伝子の重複により生じる疾患であり得る。
一例では、PMP22遺伝子の重複によって生じる疾患は、シャルコー・マリー・トゥース病1A型(CMT1A)、デジェリン・ソッタス病(DSS)、先天性低髄鞘形成不全神経障害(CHN)、またはルーシー・レヴィー症候群(RLS)であり得る。
- シャルコー・マリー・トゥース病(CMT) CMT疾患は、ヒト染色体で起こる遺伝子重複によって引き起こされる遺伝性疾患であり、手足の末梢神経の発達に関与する遺伝子が変異によって複製され、それによってシャンパンボトルを逆さにしたような形状などの変形が引き起こされる。CMT疾患は、米国では100,000人中36人に起こる比較的よく見られる遺伝性神経疾患であり、患者数は世界で280万人であり、韓国でも約17,000人と推定される。CMT疾患は、遺伝的側面に従って、CMT1、CMT2、CMT3、CMT4およびCMTXの合計5つのタイプに大きく分類され、CMT1、CMT2およびCMT3が優性で、子供では50%の確率で遺伝され、CMT4は劣性で、25%の確率で遺伝される。CMT1とCMT2は、ほとんどの国内患者で優性に遺伝され(それぞれ80%と20~40%)、CMT3とCMT4は非常にまれである。CMTXは、X染色体に沿った母系を通じて遺伝されるが、その頻度は10~20%である。CMT1は、ニューロンの軸索を囲む髄鞘のタンパク質の形成に関与する遺伝子重複による遺伝子発現の正常なプロセスを行えないことによって引き起こされる疾患である。CMT1は3つのタイプに分類される。CMT1Aは常染色体優性遺伝病であり、染色体番号17 17p11.2-p12に位置するPMP22遺伝子の重複によって引き起こされ、髄鞘の重要なコンポーネントであるPMP22の過剰発現によって引き起こされる髄鞘の構造的および機能的異常をもたらす。
CMT2は軸索異常に関連し、神経伝導速度が正常状態に近い間に運動感覚神経の活動電位がかなり低下した神経障害であり、CMT3はきわめて希少な常染色体劣性遺伝病として幼少期に起こり、臨床症状と神経伝導速度の低下が非常に激しいタイプである。CMT4はまた、発症年齢が早く、臨床症状が重度のタイプであり、常染色体劣性遺伝され、X染色体と関連付けられている間にCMTXが起こるタイプであり、男性のその症状は、女性の症状よりも重篤である。
デジェリン・ソッタス病(Dejerine-Sottas syndrom、DSS)
DSSは、幼い頃に起こる脱髄性運動感覚神経障害であり、通常、常染色体優性遺伝される疾患であるが、常染色体劣性遺伝もされ、重度の脱髄性神経障害を示し、乳児期からの運動神経の異常を示し、非常に遅い神経伝導と脳脊髄液中の特定のタンパク質の増加を示すことを特徴とする。デジェリン・ソッタス病の進行速度は非常に速く、歩行障害が幼い頃から始まり、遺伝もされるが、散発的に起こる。CMT1Aと同様に、PMP22の重複がDSSの一部の患者のうちに見られ、加えて、対応する遺伝子のミスセンス変異が存在することが確認された。
- 先天性髄鞘形成不全神経障害(CHN)CHNは、出生直後に症状が現れる神経系疾患であり、その主な症状として、呼吸不全、筋力低下、筋肉運動不調和、筋緊張の低下、反射喪失、運動協調障害(運動神経症;運動失調症)、麻痺または感覚異常が現れ、同じ割合で男女に影響を及ぼす。CHNは、運動神経と感覚神経に障害が起こる遺伝病であり、髄鞘の脱髄と髄鞘再生が繰り返される間に、髄鞘形成が減少することを特徴とする。
- ルーシー・レヴィー症候群(RLS)
RLSは、希少なタイプの遺伝性運動感覚神経障害であり、1926年にルーシーとレヴィー他によって最初に記述され、手足の振戦、歩行損失などが他の遺伝性運動感覚神経障害よりも深刻なケースであるが、後に同じ症状がさまざまな遺伝性運動感覚神経障害サブタイプで発見されたため、RLSは、遺伝性運動感覚神経障害に現れる1つの症状と現在見なされている。RLSの場合、ミエリンタンパク質ゼロ遺伝子としてのMPZ遺伝子の変異は、RLSを有することが最初に報告された患者の遺伝子検査で発見され、他の患者では、末梢神経のミエリンタンパク質22の遺伝子としてPMP22遺伝子の重複があるケースが報告されている。
例示的な一実施形態では、遺伝子重複疾患は、PLP1遺伝子の重複により生じる疾患であり得る。
一例では、PLP1遺伝子の重複により生じる疾患は、ペリツェウス・メルツバッハー病(PMD)であり得る。
- ペリツェウス・メルツバッハー病(PMD)
ペリツェウス・メルツバッハー病(PMD)(PMD)は、中枢神経系の白質の髄鞘発育不全によるさまざまな神経症状を示す非常に希少なスダノフィル性白質ジストロフィーである。その有病率は約1/400,000と推定される。1885年にペリツェウスが初めて報告したものは、染色体X依存的に遺伝される発達性脳対麻痺を有し、疾患の初めに示される眼振、運動失調、こわばり、後天性小頭症を特徴とする1つのファミリーである。PMDの臨床徴候は、乳児期および小児期の初期に現れ、PMDの特徴的な臨床症状は、振子眼振、喘鳴、精神運動発達障害または変性、運動失調、不規則運動、不随意運動、口腔機能障害、および精神遅滞である。
PMDは、オリゴデンドロサイトの減少とプロテオリピドタンパク質(PLP)の合成障害による中枢神経系の白質の髄鞘発育不全によって引き起こされる神経変性疾患または白質ジストロフィーである。プロテオリピドタンパク質(PLP)は、中枢神経系の髄鞘に最も豊富に存在するタンパク質であり、染色体Xの長腕に位置するPLP1遺伝子(Xq22)の変異により異常に発現または産生され、中枢神経系に髄鞘発育不全を引き起こす。PMDは、脳組織病理学的に、脂質と反応するアゾ化合物によって引き起こされるスーダンレッドに対して親和性を有し、髄鞘の分解を指し、半卵円中心、小脳および脳幹で観察される。しかしながら、分解産物が見つからないため、PMDの原因は、脱髄ではなく、髄鞘発育不全または髄鞘形成不全であると考えられる。一般に、PMDの先天型は、完全な髄鞘形成不全によって特徴付けられ、PMDの古典型は、部分的な髄鞘形成不全によって特徴付けられる。部分的な髄鞘形成不全が起こると、正常な髄質白質は虎斑の外観を示す。髄鞘形成不全を伴う病変の軸索とニューロンは、一般によく保存され、希少なオリゴデンドロサイトの数は減少し、アストロサイトと線維性グリオーシスの増加が白質に見られ、萎縮が小多脳回と小脳の顆粒層に見られる。男性患者の80%以上で、染色体Xの長腕に位置するPLP1遺伝子(Xq22)の変異が見つかっている。これらの患者のうち、10~30%が遺伝子に点突然変異を有しており、この場合、より重篤な臨床症状を示すことが知られている。PLP1遺伝子全体を複製する現象は、PMD患者の60~70%以上でより頻繁に見られる。最近、PLP1遺伝子は染色体Xに位置しているため、一般に、PMDは染色体X依存的に遺伝され、家族歴を有し、ほとんどが男性に起こる。しかしながら、PMDの病因はPLP1遺伝子だけでは説明され得ず、PMDの先天型は常染色体劣性であり、PMDの成人型は常染色体優性であり、またはPMDは家族歴なしで散発的に起こる。まれに、PMDの症状は女性でもほとんど発現されないことが報告されている。
例示的な一実施形態では、遺伝子重複疾患は、MECP2遺伝子の重複により起こる疾患であり得る。
一例では、MECP2遺伝子の重複によって引き起こされる疾患はMECP2重複症候群であり得る。
- MECP2重複症候群
MECP2重複症候群と呼ばれる脳疾患は、MECP2遺伝子を有する染色体Xの特異領域で起こる遺伝物質の重複によって引き起こされる。この疾患にはさまざまな症状が伴われ、筋緊張低下、発達遅延、呼吸器感染、発語異常、発作、自閉症行動および重度の知的障害などの症状が含まれる。
この疾患は遺伝性疾患であるが、家族歴がなくても起こる。MECP2重複症候群は、主に男性で起こり、MECP2遺伝子欠損により起こるレット症候群は、主に女性で起こる。
例示的な一実施形態では、遺伝子重複疾患は、RAI1遺伝子の重複によって引き起こされる疾患であり得る。
一例では、RAI1遺伝子重複によって引き起こされる疾患は、ポトツキ-ルプスキ症候群(PTLS)であり得る。
- ポトツキ-ルプスキ症候群(PTLS)
PTLSは、17番染色体の短腕に11.2領域(17p11.2)の微小重複を有する連続遺伝子症候群であり、1996年にPTLSの最初の研究事例が報告された。PTLSは、レチノイン酸誘導-1(RAI1)遺伝子を有する17p11.2での1.3~3.7Mbの重複により起こることが知られている。PTLSは希少疾患とみなされ、その発生率は20,000人の新生児に1人と予想される。PTLSは、さまざまな先天性異常と精神遅滞を特徴とし、PTLSの症例の80%は自閉症スペクトラム障害を有している。加えて、PTLSの他の特有の特性には、睡眠時無呼吸、構造的心血管異常、異常な社会的行動、学習障害、注意欠陥障害、強迫行動および身長の低さが含まれる。
例示的な一実施形態では、遺伝子重複疾患は、ELN遺伝子の重複によって引き起こされる疾患であり得る。
一例では、ELN遺伝子重複によって引き起こされる疾患は、ウィリアムズ・ビューレン症候群(WBS)であり得る。
- ウィリアムズ・ビューレン症候群(WBS)
WBSは、特徴的な臨床所見を有する7番染色体の異常に関連する近位遺伝子症候群であり、WBSの発生率は20,000人の新生児に1人である。7番染色体(7q11.23)の長腕の近位部分の微小欠失の原因として、この領域では、血管壁などの弾性組織を形成するエラスチンタンパク質の産生に関連するエラスチン遺伝子、および認知能力に関連するLIMK1遺伝子を含むさまざまな遺伝子が位置している。そのような遺伝子の欠失により、さまざまな特徴的な外観と臨床症状が示される。7q11.23の微小欠失はほとんどの場合には天然に起こり、微小欠失の家族歴が示されることはめったにない。WBSの子供は、わずかに隆起した小さな鼻先、長い人中、幅広な口、ふっくらした唇、小さな頬(頬部低形成)、腫れぼったい目、爪の形成障害、および外反母趾などの特徴的な外観を有している。
例示的な一実施形態では、遺伝子重複疾患は、JAGGED1遺伝子の重複によって引き起こされる疾患であり得る。
一例では、JAGGED1遺伝子の重複によって引き起こされる疾患は、アラジール症候群(AS)であり得る。
- アラジール症候群(AS)
ASは、肝臓の胆管の数がかなり減少し、胆汁うっ滞を誘導し、心血管系、骨格系、眼球、顔、膵臓、および神経発達の異常を伴う症候群である。 外国の報告によると、ASの発生率は1/100,000であり、疾患の特性により、軽度の症状の患者を含む場合、その発生率は高くなると予想される。ASは、20番染色体の短腕に位置するJAGGED1遺伝子の異常により起こる。現在、原因となる変異または重複が、遺伝子検査により症例の50~70%で見られることが知られている。
ASの臨床症状は、一般に生後3ヶ月以内に表れる。ASは、黄疸と胆汁うっ滞が連続しているために新生児期によく見られ、慢性肝疾患のために小児期に見られ、成人期後期にも見られる。ASにはさまざまな臨床症状があり、不完全に遺伝されることがあるため、診断が難しくなり得る。ほとんどの患者は、黄疸と胆汁うっ滞の症状、それに起因するかゆみ、乳児期に進行性肝不全を有している。黄疸は、ほとんどの患者で観察され、半数を超える患者で小児期後半まで続く。胆汁うっ滞に起因するかゆみが起こり、一部の子供は皮下組織に黄色腫を有している。肝臓の合成機能は比較的よく維持されているが、患者の約20%は肝硬変と肝不全を発症する。
例示的な一実施形態では、遺伝子重複疾患は、SNCA遺伝子の重複によって引き起こされる疾患であり得る。
一例では、SNCA遺伝子の重複によって引き起こされる疾患は、パーキンソン病であり得る。
- パーキンソン病
パーキンソン病は、通常、振戦、筋肉のこわばり、動作緩慢などの運動障害をよく示す疾患である。パーキンソン病が適切に治療されないと、運動障害が徐々に進行し、歩行や日常活動が困難になる。パーキンソン病は、主に高齢者に起こる疾患であり、年齢とともに疾患の発症リスクが徐々に増加し得る。韓国には正確な統計データはないが、パーキンソン病は1,000人中1~2人の割合で起こると推定される。高齢者で起こるパーキンソン病のほとんどの症例は、さまざまな研究を通じて遺伝的要因による影響が少ないことが知られている。しかしながら、40歳未満の若い年齢で起こるパーキンソン病の一部の症例は、遺伝的要因に関連していることが知られている。
パーキンソン病は、黒質に存在するドーパミンニューロンが徐々に死ぬため、ドーパミン濃度の低下によって引き起こされる疾患である。パーキンソン病の別の病理学的特徴は、脳剖検で観察されるタンパク質凝集体の形成であり、これはレビー小体と呼ばれる。レビー小体は、主要コンポーネントであるα-シヌクレインと呼ばれるタンパク質を有し、レビー小体とα-シヌクレインは、レビー小体認知症やシヌクレイノパチーなどの他の疾患にも関連している。α-シヌクレインの凝集は、中脳ではなく迷走神経と前嗅核で始まり、最終段階で中脳を介して大脳皮質に広がる。α-シヌクレインがパーキンソン病の進行に従って脳のさまざまな領域に広範囲に広がるという仮説は、α-シヌクレインが1つの細胞から放出されて別の細胞に伝達されるという最近の報告によって裏付けられている。
パーキンソン病の遺伝率は、レビー小体の主要コンポーネントであるα-シヌクレインの変異体(A53TおよびA30P)がパーキンソン病を誘導するという報告によって最初に示唆された。その後、α-シヌクレイン遺伝子(SNCA)の重複と三重化がパーキンソン病の他の原因であると報告されていた。これは、α-シヌクレインタンパク質の変異に加えて、正常なタンパク質の過剰発現が細胞内でのα-シヌクレインの蓄積と凝集体の形成につながり、パーキンソン病の発症をもたらすことを意味する。
例示的な一実施形態では、遺伝子重複疾患は、APP遺伝子の重複によって引き起こされる疾患であり得る。
一例では、APP遺伝子重複によって引き起こされる疾患は、アルツハイマー病であり得る。
- アルツハイマー病
アルツハイマー病は、記憶の進行性変性につながる脳の異常によって引き起こされる疾患である。加えて、アルツハイマー病は認知症を引き起こし、これが日常生活を妨げるのに十分な知的機能(思考、記憶および推理)の深刻な喪失をもたらす。ほとんどの場合、アルツハイマー病は65歳を超えて起こるが、65歳以前に発生することはめったにないとされ得る。米国では、65~74歳の約3%、75~84歳の約19%、85歳以上の約50%がアルツハイマー病に罹患している。韓国では、農村地域に基づいた最近の調査によると、60歳以上の人の約21%が認知症であり、罹患者の約63%がアルツハイマー型認知症であることが報告されている。2006年には、世界で266,000人がアルツハイマー病に罹患した。アルツハイマー病は2050年までに85人に1人に影響を及ぼすと予想されている。
この疾患の特徴は人によって異なるが、それらのいくつかは罹患者に共通している。初期の症状は、加齢に起因する単純な症状やストレスに起因する症状と誤解される傾向がある。疾患の初期段階では、罹患者は、名前、日付および場所が記憶から消える共通の短期記憶喪失を経験する。疾患が悪化すると、混乱、集中行動、双極性障害、言語障害、および長期記憶喪失の症状が示される。その結果、身体機能が失われ、死に至る。個人ごとに異なる症状があるため、疾患が人にどのような影響を及ぼすのかを予測することは困難である。アルツハイマー病が疑われる場合、通常、思考または行動能力が検査される診断が行われ、必要に応じて脳検査が行われる。しかしながら、正確な診断のためには、脳神経を調査する必要がある。アルツハイマー病が起こっているにもかかわらず、一般に疾患が完全に診断されるまでに時間がかかるため、診断なしで数年間疾患が進行することがある。疾患が起こった場合、平均余命は7年であり、罹患者の3%未満が診断後14年存命している。
アルツハイマー病は、神経変性疾患に分類される。この疾患の原因は完全には理解されていないが、アミロイド斑が正常なアルツハイマー病のタンパク質を修飾して斑の塊を形成し、内因性機能が失われると推定される。アルツハイマー病は、全体的な脳萎縮、心室拡大、神経原線維変化および神経炎性プラークなどの組織病理学的特徴を有している。
例示的な一実施形態では、遺伝子重複疾患は、SOX3遺伝子、TBX1遺伝子、NSD1遺伝子、MMP23遺伝子またはLMB1遺伝子の重複によって引き起こされる疾患であり得る。
一例では、遺伝子重複疾患は、X連鎖下垂体機能低下症(XLHP)、ヴェロカルディオフェイシャル症候群(VCFS)、成長遅延症候群、早期閉鎖頭蓋縫合または常染色体優性白質ジストロフィー(ADLD)であり得る。
例示的な一実施形態では、遺伝子重複疾患は、癌遺伝子の重複により生じる癌であり得る。
ここで、癌遺伝子は、MYC遺伝子、ERBB2(HER2)遺伝子、CCND1(サイクリンD1)遺伝子、FGFR1遺伝子、FGFR2遺伝子、HRAS遺伝子、KRAS遺伝子、MYB遺伝子、MDM2遺伝子、CCNE(サイクリンE)遺伝子、MET遺伝子、CDK4遺伝子、ERBB1遺伝子、MYCN遺伝子およびAKT2遺伝子であり得る。
一例では、癌は、乳癌、子宮頸癌、結腸直腸癌、食道癌、胃癌、膠芽腫、頭頸部癌、肝細胞癌、神経芽細胞腫、卵巣癌、肉腫または小細胞肺癌であり得る。
本明細書に開示される例示的な一実施形態は、重複遺伝子の転写調節領域を人為的に操作することができる発現制御組成物を含む医薬組成物を提供する。
発現制御組成物の説明は上記の通りである。
例示的な一実施形態では、発現制御組成物は以下のものを含み得る:
(a)重複遺伝子の転写調節領域に位置する標的配列を標的とすることができるガイド核酸またはそれをコードする核酸配列;および
(b)ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)由来のCas9タンパク質、カンピロバクター・ジェジュニ(Campylobacter jejuni)由来のCas9タンパク質、ストレプトコッカス・サーモフィラス(Streptococcus thermophilus)由来のCas9タンパク質、スタフィロコッカス・アウレウス(Staphylococcus aureus)由来のCas9タンパク質およびナイセリア・メニンギティディス(Neisseria meningitidis)由来のCas9タンパク質およびCpf1タンパク質、または当該タンパク質をコードする核酸配列からなる群より選択される1つまたは複数のタンパク質を含むエディタータンパク質。
ここで、重複遺伝子は、PMP22遺伝子、PLP1遺伝子、MECP2遺伝子、SOX3遺伝子、RAI1遺伝子、TBX1遺伝子、ELN遺伝子、JAGGED1遺伝子、NSD1遺伝子、MMP23遺伝子、LMB1遺伝子、SNCA遺伝子およびAPP遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
あるいは、重複遺伝子は、MYC遺伝子、ERBB2(HER2)遺伝子、CCND1(サイクリンD1)遺伝子、FGFR1遺伝子、FGFR2遺伝子、HRAS遺伝子、KRAS遺伝子、MYB遺伝子、MDM2遺伝子、CCNE(サイクリンE)遺伝子、MET遺伝子、CDK4遺伝子、ERBB1遺伝子、MYCN遺伝子およびAKT2遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
転写調節領域の説明は上記の通りである。
ガイド核酸とエディタータンパク質のそれぞれは、核酸配列の形態で、またはガイド核酸とエディタータンパク質の結合により複合体を形成することによって、1つまたは複数のベクターに存在してもよい。
任意に、発現制御組成物は、挿入されることが望ましい核酸配列またはそれをコードする核酸配列を含むドナーをさらに含み得る。
ガイド核酸、エディタータンパク質および/またはドナーのそれぞれは、核酸配列の形態で1つまたは複数のベクターに存在してもよい。
医薬組成物は、追加の要素をさらに含み得る。
追加の要素は、対象の体内への送達に適したキャリアを含み得る。
本明細書に開示される例示的な一実施形態は、遺伝子重複疾患を治療する方法を提供し、これは、遺伝子重複疾患を治療する遺伝子重複疾患を有する生物に遺伝子改変用組成物を投与することを含む。
治療方法は、生体に存在する重複遺伝子の転写調節領域を操作することにより重複遺伝子の発現を制御する治療方法であり得る。そのような方法は、生体に存在する重複遺伝子の転写調節領域を操作するための発現制御組成物を直接注入することにより行われ得る。
発現制御組成物の説明は上記の通りである。
例示的な一実施形態では、発現制御組成物は以下のものを含み得る:
(a)重複遺伝子の転写調節領域に位置する標的配列を標的とすることができるガイド核酸またはそれをコードする核酸配列;および
(b)ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)由来のCas9タンパク質、カンピロバクター・ジェジュニ(Campylobacter jejuni)由来のCas9タンパク質、ストレプトコッカス・サーモフィラス(Streptococcus thermophilus)由来のCas9タンパク質、スタフィロコッカス・アウレウス(Staphylococcus aureus)由来のCas9タンパク質およびナイセリア・メニンギティディス(Neisseria meningitidis)由来のCas9タンパク質およびCpf1タンパク質、または当該タンパク質をコードする核酸配列からなる群より選択される1つまたは複数のタンパク質を含むエディタータンパク質。
ここで、重複遺伝子は、PMP22遺伝子、PLP1遺伝子、MECP2遺伝子、SOX3遺伝子、RAI1遺伝子、TBX1遺伝子、ELN遺伝子、JAGGED1遺伝子、NSD1遺伝子、MMP23遺伝子、LMB1遺伝子、SNCA遺伝子およびAPP遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
あるいは、重複遺伝子は、MYC遺伝子、ERBB2(HER2)遺伝子、CCND1(サイクリンD1)遺伝子、FGFR1遺伝子、FGFR2遺伝子、HRAS遺伝子、KRAS遺伝子、MYB遺伝子、MDM2遺伝子、CCNE(サイクリンE)遺伝子、MET遺伝子、CDK4遺伝子、ERBB1遺伝子、MYCN遺伝子およびAKT2遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
転写調節領域の説明は上記の通りである。
ガイド核酸とエディタータンパク質のそれぞれは、核酸配列の形態で、またはガイド核酸とエディタータンパク質の結合により複合体を形成することによって、1つまたは複数のベクターに存在してもよい。
任意に、発現制御組成物は、挿入されることが望ましい核酸配列またはそれをコードする核酸配列を含むドナーをさらに含み得る。
ガイド核酸、エディタータンパク質および/またはドナーのそれぞれは、核酸配列の形態で1つまたは複数のベクターに存在してもよい。
ここで、ベクターは、プラスミドまたはウイルスベクターであり得る。
ここで、ウイルスベクターは、レトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴ウイルス(AAV)、ワクシニアウイルス、ポックスウイルスまたは単純ヘルペスウイルスからなる群より選択される1つまたは複数のものであり得る。
遺伝子重複疾患の説明は上記のとおりである。
遺伝子重複疾患は、シャルコー・マリー・トゥース病1A型(CMT1A)、デジェリン・ソッタス病(DSD)、先天性髄鞘形成不全神経障害(CHN)、ルーシー・レヴィー症候群(RLS)、ペリツェウス・メルツバッハー病(PMD)、MECP2重複症候群、X連鎖下垂体機能低下症(XLHP)、ポトツキ-ルプスキ症候群(PTLS)、ヴェロカルディオフェイシャル症候群(VCFS)、ウィリアムズ・ビューレン症候群(WBS)、アラジール症候群(AS)、成長遅延症候群、早期閉鎖頭蓋縫合、常染色体優性白質ジストロフィー(ADLD)、パーキンソン病またはアルツハイマー病であり得る。
加えて、癌は、乳癌、子宮頸癌、結腸直腸癌、食道癌、胃癌、膠芽腫、頭頸部癌、肝細胞癌、神経芽細胞腫、卵巣癌、肉腫または小細胞肺癌であり得る。
発現制御組成物は、遺伝子重複疾患を有する治療対象に投与され得る。
治療対象には、ヒト、サルなどの霊長類、ならびにマウスおよびラットなどの齧歯類を含む哺乳類が含まれ得る。
発現制御組成物は、治療対象に投与され得る。
投与は、注入、輸液、インプランテーションまたはトランスプランテーションにより行われ得る。
投与は、神経内、網膜下、皮下、皮内、眼内、硝子体内、腫瘍内、結節内、髄内、筋肉内、静脈内、リンパ内、および腹腔内経路から選択される投与経路を介して行われ得る。
発現制御組成物の用量(所定の所望の効果を得るための薬学的有効量)は、約10~10細胞/kg(投与対象の体重)、たとえば約10~10細胞/kg(体重)であり、この数値範囲のすべての整数から選択され得るが、本発明はそれらに限定されない。 組成物は、投与対象の年齢、健康状態および体重、同時治療の種類、ならびに可能であれば治療の頻度および所望の効果を考慮して適切に処方され得る。
重複遺伝子の転写調節領域が、本明細書に開示されるいくつかの例示的な実施形態による方法および組成物によって人為的に操作される場合、重複遺伝子のmRNAおよび/またはタンパク質の発現が制御され得るため、異常に発現される重複遺伝子の発現を正常に制御する効果を得ることができる。
以下、実施例を参照して本発明をさらに詳細に説明する。
これらの実施例は、本発明をさらに詳細に説明するために提供されているに過ぎず、本発明の範囲が以下の実施例に限定されないことは当業者には明らかであろう。
実験方法
1.gRNAの設計
CRISPR RGEN Tools(www.rgenome.net)を使用して、ヒトPMP22遺伝子、ヒトPLP1遺伝子、およびマウスPLP1遺伝子のCRISPR/Cas9標的領域をスクリーニングした。PMP22遺伝子とPLP1遺伝子の標的領域は、CRISPR酵素の種類によって異なり得る。プロモーター領域(TATAボックス)およびエンハンサー領域(たとえば、EGR2、SOX10またはTEAD1結合領域)の標的配列;またはSpCas9のヒトPMP22遺伝子の遠位エンハンサー領域BもしくはCを、上記の表1にまとめており、CjCas9のヒトPMP22遺伝子のプロモーター領域(TATAボックス)およびエンハンサー領域(たとえばEGR2またはSOX10結合領域)の標的配列を表2にまとめている。加えて、SpCas9のヒトPLP1遺伝子のプロモーター領域(TATAボックス領域)およびエンハンサー領域(たとえばwmN1エンハンサー)の標的配列を上記の表3にまとめており、CjCas9のヒトPLP1遺伝子のプロモーター領域(TATAボックス領域)およびエンハンサー領域(たとえばwmN1エンハンサー)の標的配列を上記の表4にまとめている。SpCas9のマウスPLP1遺伝子のプロモーター領域(TATAボックス領域)およびエンハンサー領域(たとえばwmN1エンハンサー)の標的配列を上記の表5にまとめており、CjCas9のマウスPLP1遺伝子のプロモーター領域(TATAボックス領域)およびエンハンサー領域(たとえばwmN1エンハンサー)の標的配列は、上記の表6にまとめている。
すべてのgRNAは、キメラ一本鎖RNA(sgRNA)の形態で生成した。標的配列を除くCjおよびSp特異的なsgRNAの骨格配列は、5'-GUUUUAGUCCCUGAAAAGGGACUAAAAUAAAGAGUUUGCGGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'および5'-GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'である。
2.gRNAの構築と合成
sgRNAをAAVベクターにパッケージングするか、RNAで合成した。ウイルスベクターにsgRNAを挿入するために、sgRNAの20~22塩基配列に対応するDNAオリゴヌクレオチドを設計およびアニーリングし、BsmBIサイトを使用してpRGEN-CAS9(自社開発)ベクターにライゲーションした。Cas9および5'末端に可変標的配列を含むsgRNAを、それぞれCMVおよびU6プロモーターを介して発現させた。
さらに、RNPによる送達システムでは、Phusion Taqを介した重合によって生成される2つの部分的に相補的なオリゴヌクレオチドをアニーリングすることによりテンプレートを生成した後、sgRNAをT7 RNAポリメラーゼによって転写した。転写したsgRNAを精製し、分光法を使用して定量化した。
3.Cas9タンパク質の精製
NLSおよびHAエピトープを含むコドン最適化Cas9 DNA配列をpET28ベクターにサブクローニングし、最適な培養条件下でIPTGを使用してBL21(DE3)で発現させた。発現させたCas9タンパク質をNi-NTAアガロースビーズを使用して精製し、適切な緩衝液で透析した。Cas9の活性は、周知の有効なsgRNAを使用したin vitro切断試験で確認した。
4.細胞培養
メーカーのマニュアルに従って、ヒトシュワン様細胞株(ATCC)およびヒト初代シュワン細胞(ScienCell)を培養した。ヒトシュワン様細胞は、1×ペニシリン/ストレプトマイシン(WelGene)および10%ウシ胎児血清(WelGene)を添加した高濃度のグルコースを含むダルベッコ変法イーグル培地(DMEM)(WelGene)で培養した。
ヒト初代シュワン細胞は、ベンダーが提供するシュワン細胞培養液(ScienCell)で維持した。分化のために、1%ウシ胎児血清(WelGene)、髄鞘形成(ミエリン形成)シグナル用のNrg1(Peprotech)100ng/mL、およびdbcAMP(Sigma-Aldrich)100μMを添加した低濃度のグルコースを含むDMEM(WelGene)で細胞を7日間培養した。
5.形質導入(トランスフェクション)
形質導入(トランスフェクション)のために、4μgのCas9タンパク質(ToolGen)と1μgのsgRNAを含むRNP複合体を室温で15分間インキュベートした。その後、RNP複合体を、10μlのエレクトロポレーションチップとNeonネオンエレクトロポレーター(ThermoFisher)を使用してエレクトロポレーションし、2×10個の細胞に送達した。標的化ディープシーケンシングでは、ゲノムDNA(gDNA)を形質導入の72時間後に形質導入細胞から収集した。
6.In vitroリアルタイムPCR(qRT-PCR)
RNeasy minikit(Qiagen)を使用して、メーカーのプロトコルに従ってヒト初代シュワン細胞からmRNAを抽出した。その後、高容量cDNA逆転写キット(ThermoFisher)を使用して、100ngのmRNAを逆転写した。QuantStudio 3(ThermoFisher)を使用したメーカーのプロトコルに従って、100ngのTaqman Gene発現マスターミックスでqRT-PCRを行った。Ct値を使用してPMP22発現レベルを計算し、GAPDHを内因性対照として使用した。本研究で使用したTaqmanプローブ(ThermoFisher)を下記の表7にまとめている。
[表7]
Figure 2022023144000013
7.標的化ディープシーケンシング
Phusionポリメラーゼtaq(New England BioLabs)を使用して、形質導入細胞から抽出されたgDNAからPCRによってオンターゲットサイトを増幅した。その後、PCR増幅産物としてMi-Seq(Illumina)を使用して、ペアエンドディープシーケンシングを行った。オンラインのCas-Analyzerツール(www.rgenome.net)を使用して、ディープシーケンシングの結果を分析した。Cas9によるインデルのその結果、PAM配列の3bp上流で変異が起こったかどうかを確認した。本研究で使用したプライマーは、下記の表8にまとめている。 [表8]
Figure 2022023144000014
Figure 2022023144000015
8.in silicoオフターゲットサイトの設計
オフターゲットの可能性があるサイトは、オンラインツール(www.rgenome.net)を使用してin silicoで設計した。最大3bpのミスマッチをオフターゲットサイトとみなした。
9.Digenome-seq
DNeasy Blood&Tissue Kit(Qiagen)を使用して、ベンダーのプロトコルに従ってHeLa細胞のゲノムDNAを精製した。あらかじめインキュベートしたCas9タンパク質(100nM)およびsgRNA(300nM)を、1mLの反応溶液(100mMのNaCl、50mMのTris-HCl、10mMのMgCl、100μg/mlのBSA、pH7.9)でゲノムDNA(10μg)と37℃にて8時間混合した。切断されたゲノムDNAをRNase A(50μg/mL)で処理し、DNeasy Tissue Kit(Qiagen)を使用して再度精製した。1μgの切断されたゲノムDNAをCovarisシステムを使用して断片に断片化し、ライブラリーを作成するためのアダプターをDNA断片に付加した。その後、ライブラリーは、HiSeq X Ten Sequencer(Illumina)を使用して、30~40×(Macrogen)の配列深度で全ゲノムシーケンシング(WGS)にかけた。In vitro切断スコアを、ゲノムにおける切断された各塩基配列の位置でのDNA切断スコアリングシステムによって計算した。
10.マウスと神経内注入
本研究で使用したC22マウス系統(B6;CBACa-Tg(PMP22)C22Clh/H)をMRC Harwell(Oxfordshire,UK)から購入した。C22マウス(オス4匹、メス7匹)をPMP22-TATA RNPで処理した。神経内注入は、以前の研究と同じ方法で行った(Daisuke Ino.,J Vis Exp.,(2016)115)。6日齢のマウスに麻酔をかけ、手術によりマウスの坐骨神経を露出させた。神経損傷を最小限に抑えるために、坐骨切痕の終わりに、マイクロインジェクターに取り付けられている引っ張られたガラス製マイクロピペットを直ちに使用して、神経内注入を直ちに行った。マウスあたり11μgのCas9タンパク質と2.75μgのsgRNAのRNP複合体を、Lipofectamine 3000(Invitrogen,Carlsbad,CA,USA)とともにマウスに注入した。本研究で使用したすべての動物の管理、使用および処理は、国際実験動物ケア評価認証協会に従って、Samsung Animal Management and Use Committee(SMC-20170206001)が立案したガイドラインのもとで行った。
11.ロータロッド実験(ロータロッド試験)
ロータロッド装置(B.S.Technolab INC.,Korea)を使用して運動協調を評価した。この実験は、マウスのバランスと運動協調を評価するために行った。実験の前に、マウスは3日間のトレーニング期間を経た。実験では、ロータロッド実験用に水平回転ロッド(21rpm)を使用した。マウスの回転ロッドの保持時間を測定し、マウスを最大300秒間ロッドにとどまらせた。
12.電気生理学的試験
電気生理学的状態を評価するために、以前の研究と同じ方法で神経伝導試験(NCS)を行った。(Jinho Lee.,J Biomed Sci.,(2015)22,43)。要約すると、マウスを炭酸ガスで麻酔し、実験中に1.5%イソフルランを供給するノーズコーンを使用して麻酔を維持した。毛は端から後足まで完全に除去した。NCSは、Nicolet VikingQuest装置(Natus Medical)を使用して行った。坐骨神経の運動神経伝導試験では、遠位部と近位部からの反応をそれぞれ、腱に参照電極を取り付けた腓腹筋に活動記録針電極を配置し、記録電極に近い位置に、刺激負電極を、股関節の内側の中心および眼窩後部の大腿部の中心線に向かって6mmの距離で配置することにより測定した。遠位潜時(DL)、運動神経伝導速度(MNCV)、および複合筋活動電位(CMAP)の振幅を測定した。最大過刺激時にCMAPを測定した。
13.神経の組織構造と画像
マウスの坐骨神経を生検し、影響を受けたサンプルの病理学的検査を顕微鏡による分析により行った。2%グルタルアルデヒドを含む25mMカコジル酸バッファーを使用して、サンプルをそれぞれ固定した。半薄切片をトルイジンブルーで染色した。1%OsO4で1時間インキュベーションした後、サンプルをエタノールで脱水し、プロピレンオキシドを通過させ、エポキシ樹脂(Epon 812,Oken,Nagano,Japan)に包埋した。ライカウルトラミクロトーム(Leica Microsystems)を使用して、細胞を特定の厚さ(1μm)にスライスし、トルイジンブルーで30~45秒間染色した。g比(軸索直径/線維直径)は、Zeiss Zen 2プログラム(Carl Zeiss,Oberkochen,Germany)を使用してミエリンの内径と外径を測定することにより計算した。
14.統計分析
mRNA発現レベルに関連するデータの統計的有意性は、ポストホックTukeyの多重比較を使用した一元配置分散分析によって評価した。他の種類の提示データは、Mann-Whitney U試験(http://www.socscistatistics.com/tests/mannwhitney/Default2.aspx)を使用して計算した。本研究で作成したデータとグラフは、GraphPad Prismを使用して分析した。有意水準は0.05に設定した。
15.Plp1遺伝子ターゲティングのためのsgRNAスクリーニング
マウス線維芽細胞、NIH-3T3(ATCC、CRL-1658)、筋芽細胞、すなわちC2C12系統(ATCC、CRL-1772)およびオリゴデンドロサイト細胞、N20.1(Cedarlane Laboratories,CLU108-P)をメーカーのマニュアルに従って培養した。細胞は、1×ペニシリン/ストレプトマイシン(WelGene)および10%ウシ胎児血清(WelGene)を添加した高濃度グルコース含有ダルベッコ変法イーグル培地(DMEM)で37℃および5%COで培養した。CRISPR/Cas9組成物のトランスフェクションのために、4μgのCas9タンパク質と1μgのsgRNAまたはCjCas9プラスミドからなるRNP複合体(SpCas9)(図18)を調製した。その後、RNP複合体またはCjCas9プラスミドを、10μlのエレクトロポレーションチップとNeonエレクトロポレーター(ThermoFisher)を使用したエレクトロポレーションにより2×10個の細胞に送達した。トランスフェクションの72時間後の標的化ディープシーケンシングでは、トランスフェクトされた細胞からゲノムDNA(gDNA)を収集した。
16.Plp1遺伝子のダウンレギュレーションアッセイ
RNeasy mini kit(Qiagen)を使用して、メーカーのプロトコルに従ってN20.1細胞株からmRNAを抽出した。その後、高容量cDNA逆転写キット(ThermoFisher)を使用して、1μgのmRNAを逆転写した。メーカーのプロトコルに従って、QuantStudio 3(ThermoFisher)を使用して、100ngのTaqman遺伝子発現マスターミックスでリアルタイム定量逆転写ポリメラーゼ連鎖反応(qRT-PCR)を行った。C値を使用してPlp1発現レベルを計算し、Gapdhを内因性対照として使用した。この研究で使用したTaqmanプローブ(ThermoFisher)を、下記の表9にまとめている。
[表9]
Figure 2022023144000016
17. PLP1遺伝子ターゲティングのためのsgRNAスクリーニング
ヒトリンパ芽球Jurkat細胞株(ATCC,TIB-152)およびヒト上皮293T細胞株(ATCC,CRL-3216)をメーカーのマニュアルに従って培養した。細胞は、1×ペニシリン/ストレプトマイシン(WelGene)および10%ウシ胎児血清(WelGene)を添加した高濃度グルコース含有ダルベッコ変法イーグル培地(DMEM)で37℃および5%COで培養した。CRISPR/Cas9組成物のトランスフェクションのために、4μgのCas9タンパク質と1μgのsgRNAまたはCjCas9プラスミドからなるRNP複合体(SpCas9)(図18)を調製した。その後、RNP複合体またはCjCas9プラスミドを、10μlのエレクトロポレーションチップとNeonエレクトロポレーター(ThermoFisher)を使用したエレクトロポレーションにより2×10個の細胞に送達した。トランスフェクションの72時間後の標的化ディープシーケンシングでは、トランスフェクトされた細胞からゲノムDNA(gDNA)を収集した。
実施例1.PMP22遺伝子のsgRNAスクリーニング
ヒトPMP22の発現を正常範囲に減少させることができる治療的に有効なsgRNA配列をスクリーニングするために、PMP遺伝子のプロモーター(TATAボックス)およびイントロンエンハンサー結合部位を標的とするように設計されたさまざまなsgRNAおよびCas9でヒト細胞株を形質導入した。要するに、JurkatヒトT細胞をSpCas9スクリーニングに使用し、HEK293T細胞をCjCas9に使用した。gDNAを細胞から収集し、標的化ディープシーケンシングにかけた。sgRNA配列によって誘導される変異のさまざまなパターンは、NHEJを介したインデルによって同定された。いくつかのSpCas9-sgRNAは、2つの調節部位にインデルを強く誘導した(図1aおよび図1b)。インデルの30~40%が特異的CjCas9-sgRNAで誘導されることが確認された(図2aおよび図2b)。
実施例2.シュワン様細胞の遺伝子操作
sgRNAによって引き起こされた有効なインデル変異がヒト細胞で同定されたが、その効果がシュワン細胞でも可能かどうかは不確定である。したがって、シュワン細胞におけるPMP22発現阻害と遺伝子操作の効果を調査するために、シュワン様細胞であるsNF2.0細胞を使用してSpCas9-sgRNA効果を確認した。Jurkat細胞で同定された有効なSpCas9-sgRNAをsNF02.0細胞で繰り返し試験した。形質導入後、同じ高インデル頻度が同じsgRNAによって得られたことが、ディープシーケンシング解析によって確認された。プロモーター(TATAボックス)部位およびエンハンサー結合部位を標的とする単一sgRNAの形質導入は、それぞれ31%および59%のインデルを誘導した(図3)。興味深いことに、ミエリン遺伝子の主要な制御因子(たとえばEGRまたはSOX10結合部位)または重要なTATAボックスを含む40~50bpの小さな欠失が、デュアルsgRNAで処理された細胞の非常に多くの細胞で見られた(図5)。
実施例3.遺伝子操作によるPMP22の発現制御
有効なsgRNAによるPMP22の発現の変化を評価するために、シュワン様細胞を分化させ、qRT-PCRを行った。その結果、PMP22を標的とするsgRNAのほとんどがPMP22の発現を有効に阻害した(図6)。単一sgRNAを使用した場合、PMP22の発現は、Cas9のみで処理した対照と比較して約30%減少し、デュアルsgRNAを使用した場合、PMP22の発現は、Cas9のみ処理した対照と比較して約50%減少した。
実施例4.シュワン細胞の遺伝子操作
PMP22の発現抑制と遺伝子操作効果がシュワン様細胞であらかじめ確認された後、前の結果がヒト初代シュワン細胞で同様の効果を示すかどうかが確認された。標的部位に応じたインデル頻度は、ヒト初代シュワン細胞のヒトPMP22遺伝子の各標的部位でSpCas9-sgRNAを使用して観察された。その結果、TATAボックス、エンハンサー、およびPMP22遺伝子のコード配列を標的とするsgRNAのほとんどの標的部位でインデル頻度が高いことが確認された(図7a)。さらに、TATAボックスとエンハンサーをそれぞれ標的とするデュアルsgRNAを使用した場合でも、高いインデル頻度が示された。標的部位でインデルが生じることが、遠位エンハンサー部位BおよびCをコードする配列を標的とするsgRNAを追加で使用して確認され(図7c)、この場合、APOC3を標的とするsgRNAを対照として使用した。
加えて、各標的部位でSpCas9-sgRNAがPMP22遺伝子の発現の減少を引き起こすかどうかを確認するために、qRT-PCR分析を行った。PMP22はシュワン細胞の分化の最終段階で転写されるため、ヒト初代シュワン細胞は、Neuregulin-1(Nrg1)およびジブチリル環状AMP(dbcAMP)を含む周知の分化シグナル因子で7日間処理した。その結果、Nrg1およびdbcAMPで処理しなかった細胞と比較して、Nrg1およびdbcAMPで処理した細胞ではPMP22の発現が9倍増加することが確認された。対照的に、細胞を各標的部位でSpCas9-sgRNAで処理した場合、PMP22の発現が4~6倍誘導されることが確認された。これは、各標的部位でのSpCas9-sgRNAによるPMP22の各標的部位修飾に起因したPMP22の発現阻害によるものであると判断される(図7b)。
実施例5.ヒトPMP22遺伝子のTATAボックス部位を標的とするCRISPR/Cas9を使用したPMP22の有効かつ特異的な発現の減少の効果
実験を、あらかじめスクリーニングされたTATAボックス部位を標的とするsgRNAsの中で高いインデル効率を示し、TATAボックスを標的とし得るsgRNA_TATA_Sp#1(以下、PMP22-TATA sgRNAと記載)を選択することにより、ヒト初代シュワン細胞で行った。インデルを、ヒト初代シュワン細胞にsgRNAおよびCas9タンパク質を含むRNP複合体を形質導入することにより誘導し(図8bの(b))、標的化ディープシーケンシング解析を介して、総インデルの89.54±1.39%がヒトPMP22のTATAボックス部位で生成されたことが確認された(図8bの(c))。
加えて、PMP22のTATAボックスで形成された変異がPMP22遺伝子の発現の減少を引き起こしたかどうかを確認するために、qRT-PCR分析を行った。PMP22はシュワン細胞の分化の最終段階で転写されるため、ヒト初代シュワン細胞は、Neuregulin-1(Nrg1)およびジブチリル環状AMP(dbcAMP)を含む周知の分化シグナル因子で7日間処理した。その結果、Nrg1およびdbcAMPで処理しなかった細胞と比較して、Nrg1およびdbcAMPで処理した細胞ではPMP22の発現が9倍増加することが確認された。対照的に、細胞をPMP22-TATA RNPと一緒に処理した場合、PMP22の発現が6倍誘導されることが確認された。これは、CRISPR/Cas9によるPMP22のTATA修飾によるPMP22の発現阻害によるものであると判断される(図8b)。分化シグナル因子とAAVS1標的RNPの両方で処理された対照では、PMP22遺伝子の発現に違いは確認され得なかった。
PMP22-TATA RNPの特異性を確認するために、in silicoベースのオフターゲット分析を行った。標的化ディープシーケンシングにより、in silico分析により確認されたオフターゲット部位で、シーケンシングエラー率(平均0.1%)を超えるインデル変異は確認されなかった(図9a)。in silicoベースのオフターゲット分析は偏りのあるアプローチであり得るため、Digenome-seq(偏りのないシーケンシングベースのオフターゲット分析全体)も行った。その結果、in vitroでPMP22-TATA RNPにより切断された9つのオフターゲット部位を確認することができた(図10a、図10b)。しかしながら、標的化ディープシーケンシングによる再分析の結果、オフターゲットサイトで異常なインデル変異は見られなかった(図10c)。
これらの結果は、PMP22-TATA RNPによるPMP22のTATAボックスの有効かつ特異的な修飾が、ヒト初代シュワン細胞におけるPMP22の転写レベルを制御し得ることを示している。
実施例6.CMT1AマウスにおけるCRISPR/Cas9を介したPMP22の発現阻害による疾患表現型の軽減効果
in vivoでのPMP22-TATA RNPによるPMP22転写制御を試験するために、リポソームに囲まれたPMP22-TATA RNPをC22マウスの坐骨神経に直接注入した(図11)。この場合、Rosa26(mRosa26)を標的とするRNP複合体を対照として使用した。mRosa26 RNPまたはPMP22-TATA RNPを6日齢(p6)マウスの左坐骨神経(同側)に神経内注入して送達し、右坐骨神経を内部対照(対側)として使用した。注入の4週間後、坐骨神経からゲノムDNAを収集することにより、標的化ディープシーケンシングを介してRNP複合体の神経内送達効率を確認した。その結果、mRosa26 RNPおよびPMP22-TATA RNPでそれぞれ処理されたすべての坐骨神経は、約11%のインデル効率を示した(図12のa)。さらに、98.48±0.15%のTATAボックス変異が、in vitro結果と一致する全体のインデルシーケンシング読み取りにおいて確認された(図12のb)。
加えて、in vivoでのTATAボックス変異によるPMP22の発現阻害を確認するために、坐骨神経全体から抽出したmRNAのqRT-PCR分析をRNP処理した坐骨神経に対して行った。in vitro結果と同様に、PMP22遺伝子の発現が対照と比較して38%減少したことが確認された(図12のc)。
PMP22-TATA RNPによって坐骨神経にオフターゲット変異が起こったかどうかを確認するために、in silicoベースのオフターゲット分析を行った。その結果、マウスゲノムから3bp以上のミスマッチを含む8つのオフターゲットが確認され(図13a)、標的化ディープシーケンシングを行った結果、PMP22-TATA RNPで処理した神経(同側)からシーケンシングエラー率を超えるインデル変異は確認されなかった(図13b)。
PMP22-TATA RNAによって引き起こされるPMP22の転写の減少が脱髄を防ぐことができるかどうかを試験するために、PMP22-TATA RNPまたはmRosa26 RNPで処理したC22マウスの坐骨神経を得て、その半薄断面をトルイジンブルーで染色した(ミエリン染色)。さらに、g比を測定するために、軸索直径および線維(ミエリンを含む軸索)直径を測定した。その結果、PMP22-TATA RNPで処理した実験群では、より厚いミエリンシートが形成されたことが確認され得た(図14a、図14b)。加えて、実験群をPMP22-TATA RNPで処理した場合、mRosa26 RNPで処理した対照と比較して、大きな直径を有する軸索の数が増加することがわかった(図14a、図14b)。PMP22-TATA RNPで処理した実験群(16.5%)で直径6μm以上の大きな有髄線維の数を測定した結果が、対照群よりもはっきりとした治療効果を示している(2.6%、p<0.01)。
ミエリン形成の組織学的分析の大幅な改善を考慮して、2つの群の電気生理学的プロファイルを調査した。その結果、mRosa26 RNPで処理された対照(図15のa、図15のb)と比較して、PMP22-TATA RNPで処理された実験群の坐骨神経では、遠位潜時(DL)が減少し、運動神経伝導速度(NCV)が増加したことが確認され、これらの結果は、PMP22-TATA RNPで処理された神経におけるミエリンの厚さと軸索直径の増加に対応する。さらに、PMP22-TATA RNPで処理された神経において複合筋活動電位(CMAP)の振幅がかなり増加したことが確認され(図15のc)、これは前の結果に対応する。
PMP22-TATA RNPによる組織学的および電気生理学的に改善された効果を考慮して、マウスの運動行動をロータロッド実験で分析した。その結果、PMP22-TATA RNPで処理されたマウス(11~16週齢)は、mRosa26 RNPで処理されたマウス(11~16週齢)よりもロッド上に長く留まることが確認された(図16a)。さらに、MP22-TATA RNPで処理されたマウスは、mRosa26 RNPで処理されたマウスと比較して筋肉が増加したことが確認された(図16b)。
これらの結果は、CMT1AなどのPMP22の過剰発現による脱髄を軽減または治療するためのPMP22-TATA RNPの治療効果を示している。
したがって、前述の結果は、PMP22のプロモーター部位を標的とするCRISPR/Cas9を使用したPMP22の発現阻害効果を示している。さらに、これらの結果は、C22マウスの坐骨神経へのPMP22-TATA RNPの直接の非ウイルス送達が、PMP22の過剰発現によって引き起こされる脱髄に関連する臨床的および神経病理学的表現型を改善し得ることを示している。したがって、PMP22の転写調節領域のCRISPR/Cas9を介した修飾は、CMT1Aおよび脱髄性神経障害を示す他の疾患の治療に優れた戦略であると考えられる。
実施例7.PLP遺伝子発現調節効果
PLP1遺伝子が複製されると、PLP1遺伝子が過剰発現し、PMD疾患の主な原因になる。したがって、PMD疾患の治療に対してPLP1転写を制御するために、PLP遺伝子の転写調節領域をCRISPR/Cas9を使用して人為的に改変し、その効果を確認した。
このために、SpCas9およびCjCas9スクリーニングを、マウスPlp1のプロモーター配列およびエンハンサー(wMN1)のTATAボックスに対して行い、最も高い活性を有するsgRNAを選択し、次いでqRT-PCRによりPlp1のダウンレギュレーションを確認した(図17)。ここで、Plp1のエンハンサーは、ASE(Hamdan et al.,2015;Meng et al.,2005;Wight,2017)またはwMN1(Hamdan et al.,2018;Tuason et al.,2008)領域であり得る。
sgRNAスクリーニングの結果に基づいて、高いインデル率を有するSpCas9およびCjCas9の各sgRNAの選択(図19~22および表10)を、Plp1のTATAボックスおよびwMN1エンハンサー領域が、オリゴデンドロサイト、すなわち、Plp1遺伝子を発現するN20.1細胞株を使用して標的にされた場合に行い、Plp1遺伝子のダウンレギュレーションにつながり得るものに関する研究を、qRT-PCRによって行った。
[表10]
Figure 2022023144000017
スクリーニングされたsgRNAリスト(mPlp1-TATA、mPlp1-wmN1 SpCas9およびCjCas9リードsgRNAリスト)
その結果、SpCas9およびCjCas9を使用したPlp1のTATAボックスまたはwmN1エンハンサー領域のターゲティングが、Plp1の有意なダウンレギュレーションをもたらすことが確認された(図23)。加えて、ヒトPLP1遺伝子のwmN1エンハンサー領域のSpCas9およびCjCas9スクリーニングを行って、インデル率(%)を確認した(図24および25)。
したがって、PLP1の転写調節領域のCRISPR/Cas9を介した人為的な修飾は、PMD治療の優れた戦略であると考えられる。
遺伝子重複疾患の治療薬は、重複遺伝子の発現を制御するための発現制御組成物を使用して得ることができる。たとえば、重複遺伝子の転写調節領域を標的とすることができるガイド核酸を含む発現制御組成物は、重複遺伝子の転写調節領域を人為的に操作および/または修飾することにより重複遺伝子の発現を制御することにより、遺伝子重複に起因する疾患の治療薬として使用することができる。
実施例で使用される重複遺伝子およびプライマー配列の転写調節領域の標的配列
本発明は、重複遺伝子の発現を制御するための発現制御組成物、およびそれを使用する方法に関する。より具体的には、本発明は、重複遺伝子の転写調節領域を標的とすることができるガイド核酸を含む発現制御組成物、ならびに発現制御組成物を使用して重複遺伝子の転写調節領域を人為的に操作および/または修飾することにより重複遺伝子の発現を制御する方法に関する。加えて、本発明は、重複遺伝子の発現を制御するための発現制御組成物を使用して、遺伝子重複によって引き起こされる疾患を治療または改善する方法に関する。
遺伝子重複は、染色体の遺伝子組換えで生じるエラーの1つであり、染色体の部分領域を複製する複製現象である。遺伝子重複とは、次世代に継代される変異の一種である。遺伝子重複は、染色体の部分領域の非複製に起因する遺伝子欠失とともに、遺伝子発現に影響を及ぼす。
遺伝子重複は、遺伝性疾患も引き起こす。代表的には、シャルコー・マリー・トゥース病(Charcot-Marie-Tooth)(CMT)1A型は、染色体の特異領域で起こる遺伝子重複から生じ、手足の末梢神経発達に関与する遺伝子の過剰発現は、遺伝子重複に起因して起こり、ひいては手足の奇形の原因となる。
したがって、遺伝子が、適切な位置、ならびに細胞増殖、死、老化および分化などの生物学的プロセスが正常に機能する適切な時期に発現されることが重要である。不適切な時期と位置で遺伝子が不適切に発現される場合、特に、遺伝子重複によって引き起こされる異常な遺伝子発現は疾患につながる可能性があるため、各遺伝子の発現を制御する分子のメカニズムを理解する必要があるのと、各遺伝子に関連する転写調節因子を同定することが重要である。遺伝子発現を正確に制御できるさまざまな転写調節因子、たとえば、プロモーター、遠位制御エレメント、および転写因子、アクチベーター、およびコアクチベーターであって、遺伝子発現の制御に関与するものがある。
遺伝子発現は、転写調節因子の変化により制御される可能性があり、転写調節因子の異常な変化は、遺伝子の異常発現を引き起こし、それによって疾患を誘導する可能性がある。したがって、転写調節因子の変化は、さまざまな疾患を引き起こしたり、疾患を改善および治療したりする可能性がある。
しかしながら、転写調節因子を制御する現在の方法は、一時的な遺伝子発現のみを制御し、継続的な遺伝子発現調節は困難である。このため、遺伝子発現の異常性または困難性に起因する疾患を治療するための基本的な治療法はない。したがって、遺伝子編集または転写調節因子の修飾により、より継続的な治療効果を示す方法が必要とされている。
1.Hamdan,H.,Kockara,N.T.,Jolly,L.A.,Haun,S.,and Wight,P.A.(2015).Control of human PLP1 expression through transcriptional regulatory elements and alternatively spliced exons in itron 1.ASN Neuro 7. 2.Hamdan,H.,Patyal,P., Kockara,N.T.,and Wight,P.A.(2018).The wmN1 enhancer region in itron 1 is required for expression of human PLP1.Glia. 3.Meng,F.,Zolova,O.,Kokorina,N.A.,Dobretsova,A.,and Wight,P.A.(2005).Characterization of an itronic enhancer that regulates myelin proteolipid protein(Plp)gene expression in oligodendrocytes.J Neurosci Res 82,346-356. 4.Tuason,M.C.,Rastikerdar,A.,Kuhlmann,T.,Goujet-Zalc,C.,Zalc,B.,Dib,S.,Friedman,H.,and Peterson,A.(2008).Separate proteolipid protein/DM20 enhancers serve different lineages and stages of development.J Neurosci 28,6895-6903. 5.Wight,P.A.(2017).Effects of itron 1 Sequences on Human PLP1 Expression:Implications for PLP1-Related Disorders.ASN Neuro 9,1759091417720583.
開示
技術的課題
本発明は、細胞のゲノムに存在する重複遺伝子の発現を制御するための発現制御組成物を提供することに関する。
本発明はまた、真核細胞のゲノムに存在する重複遺伝子の発現を制御する方法を提供することに関する。
本発明はまた、発現制御組成物を使用して遺伝子重複疾患を治療する方法を提供することに関する。
技術的解決策
上記の目的を達成するために、本発明は、細胞のゲノムに存在する重複遺伝子の発現を制御するための発現制御組成物に関する。より具体的には、本発明は、重複遺伝子の転写調節領域を標的とすることができるガイド核酸を含む発現制御組成物、ならびに発現制御組成物を使用して重複遺伝子の転写調節領域を人為的に操作および/または修飾することにより重複遺伝子の発現を制御する方法に関する。加えて、本発明は、重複遺伝子の発現を制御するための発現制御組成物を使用して、遺伝子重複によって引き起こされる疾患を治療または改善する方法に関する。
本発明は、細胞のゲノムに存在する重複遺伝子の発現を制御するための発現制御組成物を提供する。
一態様では、発現制御組成物は、以下のものを含み得る。
重複遺伝子の転写調節領域に存在する標的配列を標的とすることができるガイド核酸またはそれをコードする核酸;および
1つまたは複数のエディタータンパク質またはそれをコードする核酸。ガイド核酸は、重複された遺伝子の転写調節領域に存在する標的配列を標的とすることができるガイドドメイン
ここで、ガイドドメインは、重複された遺伝子の転写調節領域に存在する標的配列のガイド核酸結合配列と相補的な結合を形成することができるヌクレオチド配列を含み得る。
ここで、ガイドドメインは、重複された遺伝子の転写調節領域内の標的配列のガイド核酸結合配列と相補的な結合を形成し得る。
ここで、相補的な結合は、0~5つのミスマッチ結合を含み得る。
ガイド核酸は、第1の相補的ドメイン、第2の相補的ドメイン、近位ドメインおよびテールドメインからなる群より選択される1つまたは複数のドメインを含み得る。
エディタータンパク質はCRISPR酵素であり得る。
ガイド核酸とエディタータンパク質は、ガイド核酸-エディタータンパク質複合体を形成し得る。
ここで、ガイド核酸-エディタータンパク質複合体は、ガイド核酸の部分核酸をエディタータンパク質の部分アミノ酸と相互作用させることにより形成され得る。
転写調節領域は、プロモーター領域、エンハンサー領域、サイレンサー領域、インシュレーター領域および遺伝子座制御領域(LCR)からなる群より選択される1つまたは複数の領域であり得る。
標的配列は、重複遺伝子の転写調節領域に位置する連続した10~25nt(ヌクレオチド)配列であり得る。
標的配列は、重複遺伝子のプロモーター領域内またはそれに隣接して位置する連続した10~25ヌクレオチド配列であり得る。
ここで、標的配列は、重複遺伝子のコアプロモーター領域内またはそれに隣接して位置する連続した10~25ヌクレオチド配列であり得る。ここで、標的配列は、重複遺伝子のコアプロモーター領域のTATAボックス領域を含む連続した10~25ヌクレオチド配列、またはTATAボックス領域に隣接して位置する連続した10~25ヌクレオチド配列であり得る。
ここで、標的配列は、重複遺伝子のコアプロモーター領域に存在する5'-TATA-3'(SEQ ID NO:261)配列の全体または一部を含む連続した10~25ヌクレオチド配列であり得る。
ここで、標的配列は、重複遺伝子のコアプロモーター領域に存在する5'-TATAWAW-3'(W=AまたはT)(SEQ ID NO:262)配列の全体または一部を含む連続した10~25ヌクレオチド配列であり得る。
ここで、標的配列は、重複遺伝子のコアプロモーター領域に存在する5'-TATAWAWR-3'(W=AまたはT、R=AまたはG)配列の全体または一部を含む連続した10~25ヌクレオチド配列であり得る。
ここで、標的配列は、5'-CATAAAA-3'(SEQ ID NO:264)配列、'-TATAA-3'(SEQ ID NO:265)配列、5'-TATAAAA-3'(SEQ ID NO:266)配列、5'-CATAAATA-3'(SEQ ID NO:267)配列、5'-TATATAA-3'(SEQ ID NO:268)配列、5'-TATATATATATATAA-3'(SEQ ID NO:269)配列、5'-TATATTATA-3'(SEQ ID NO:270)配列、5'-TATAAA-3'(SEQ ID NO:271)配列、5'-TATAAAATA-3'(SEQ ID NO:272)配列、5'-TATATA-3'(SEQ ID NO:273)配列、5'-GATTAAAAA-3'(SEQ ID NO:274)配列、5'-TATAAAAA-3'(SEQ ID NO:275)配列、5'-TTATAA-3'(SEQ ID NO:276)配列、5'-TTTTAAAA-3'(SEQ ID NO:277)配列、5'-TCTTTAAAA-3'(SEQ ID NO:278)配列、5'-GACATTTAA-3'(SEQ ID NO:279)配列、5'-TGATATCAA-3'(SEQ ID NO:280)配列、5'-TATAAATA-3'(SEQ ID NO:281)配列、5'-TATAAGA-3'(SEQ ID NO:282)配列、5'-AATAAA-3'(SEQ ID NO:283)配列、5'-TTTATA-3'(SEQ ID NO:284)配列、5'-CATAAAAA-3'配列(SEQ ID NO:285)、5'-TATACA-3'(SEQ ID NO:286)配列、5'-TTTAAGA-3'(SEQ ID NO:287)配列、5'-GATAAAG-3'(SEQ ID NO:288)配列、5'-TATAACA-3'(SEQ ID NO:289)配列、5'-TCTTATCTT-3'(SEQ ID NO:290)配列、5'-TTGTACTTT-3'(SEQ ID NO:291)配列、5'-CATATAA-3'(SEQ ID NO:292)配列、5'-TATAAAT-3'(SEQ ID NO:293)配列、5'-TATATATAAAAAAAA-3'(SEQ ID NO:294)配列、および5'-CATAAATAAAAAAAATTA-3'(SEQ ID NO:295)配列からなる群より選択される配列の全体または一部を含む連続した10~25ヌクレオチド配列であり得る。
ここで、標的配列は、5'-TATA-3'(SEQ ID NO:261)配列、5'-CATAAAA-3'(SEQ ID NO:264)配列、5'-TATAA-3'(SEQ ID NO:265)配列、5'-TATAAAA-3'(SEQ ID NO:266)配列、5'-CATAAATA-3'(SEQ ID NO:267)配列、5'-TATATAA-3'(SEQ ID NO:268)配列、5'-TATATATATATATAA-3'(SEQ ID NO:269)配列、5'-TATATTATA-3'(SEQ ID NO:270)配列、5'-TATAAA-3'(SEQ ID NO:271)配列、5'-TATAAAATA-3'(SEQ ID NO:272)配列、5'-TATATA-3'(SEQ ID NO:273)配列、5'-GATTAAAAA-3'(SEQ ID NO:274)配列、5'-TATAAAAA-3'(SEQ ID NO:275)配列、5'-TTATAA-3'(SEQ ID NO:276)配列、5'-TTTTAAAA-3'(SEQ ID NO:277)配列、5'-TCTTTAAAA-3'(SEQ ID NO:278)配列、5'-GACATTTAA-3'(SEQ ID NO:279)配列、5'-TGATATCAA-3'(SEQ ID NO:280)配列、5'-TATAAATA-3'(SEQ ID NO:281)配列、5'-TATAAGA-3'(SEQ ID NO:282)配列、5'-AATAAA-3'(SEQ ID NO:283)配列、5'-TTTATA-3'(SEQ ID NO:284)配列、5'-CATAAAAA-3'(SEQ ID NO:285)配列、5'-TATACA-3'(SEQ ID NO:286)配列、5'-TTTAAGA-3'(SEQ ID NO:287)配列、5'-GATAAAG-3'(SEQ ID NO:288)配列、5'-TATAACA-3'(SEQ ID NO:289)配列、5'-TCTTATCTT-3'(SEQ ID NO:290)配列、5'-TTGTACTTT-3'(SEQ ID NO:291)配列、5'-CATATAA-3'(SEQ ID NO:292)配列、5'-TATAAAT-3'(SEQ ID NO:293)配列、5'-TATATATAAAAAAAA-3'(SEQ ID NO:294)配列および5'-CATAAATAAAAAAAATTA-3'(SEQ ID NO:295)配列からなる群より選択される配列の5'末端または3'末端に位置する連続した10~25ヌクレオチド配列であり得る。
標的配列は、重複遺伝子のエンハンサー領域に位置する連続した10~25ヌクレオチド配列であり得る。標的配列は、重複遺伝子のエンハンサー領域に隣接して位置する連続した10~25ヌクレオチド配列であり得る。
標的配列は、重複遺伝子の転写調節領域内の核酸配列におけるPAM(プロトスペーサー隣接モチーフ)配列の5'末端および/または3'末端に隣接して位置する連続した10~25ヌクレオチド配列であり得る。
ここで、PAM配列は、CRISPR酵素に従って決定され得る。
CRISPR酵素は、Cas9タンパク質またはCpf1タンパク質であり得る。
ここで、Cas9タンパク質は、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)由来のCas9タンパク質、カンピロバクター・ジェジュニ(Campylobacter jejuni)由来のCas9タンパク質、ストレプトコッカス・サーモフィラス(Streptococcus thermophilus)由来のCas9タンパク質、スタフィロコッカス・アウレウス(Staphylococcus aureus)由来のCas9タンパク質およびナイセリア・メニンギティディス(Neisseria meningitidis)由来のCas9タンパク質からなる群より選択される1つまたは複数のCas9タンパク質であり得る。
重複遺伝子は、PMP22遺伝子、PLP1遺伝子、MECP2遺伝子、SOX3遺伝子、RAI1遺伝子、TBX1遺伝子、ELN遺伝子、JAGGED1遺伝子、NSD1遺伝子、MMP23遺伝子、LMB1遺伝子、SNCA遺伝子およびAPP遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
重複遺伝子は癌遺伝子であり得る。
ここで、癌遺伝子は、MYC遺伝子、ERBB2(HER2)遺伝子、CCND1(サイクリンD1)遺伝子、FGFR1遺伝子、FGFR2遺伝子、HRAS遺伝子、KRAS遺伝子、MYB遺伝子、MDM2遺伝子、CCNE(サイクリンE)遺伝子、MET遺伝子、CDK4遺伝子、ERBB1遺伝子、MYCN遺伝子、AKT2遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
細胞は真核細胞であり得る。
真核細胞は哺乳類細胞であり得る。
ガイド核酸とエディタータンパク質は、それぞれ核酸配列の形態で1つまたは複数のベクターに存在し得る。
ここで、ベクターは、プラスミドまたはウイルスベクターであり得る。
ここで、ウイルスベクターは、レトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴ウイルス(AAV)、ワクシニアウイルス、ポックスウイルスおよび単純ヘルペスウイルスからなる群より選択される1つまたは複数のウイルスベクターであり得る。
発現制御組成物は、ガイド核酸とエディタータンパク質とをガイド核酸-エディタータンパク質複合体の形態で含み得る。
発現制御組成物はさらにドナーを含み得る。
本発明は、真核細胞のゲノムに存在する重複遺伝子の発現を制御する方法を提供する。
一態様では、真核細胞のゲノムに存在する重複遺伝子の発現を制御する方法は、発現制御組成物を真核細胞に導入することを含み得る。
発現制御組成物は、以下のものを含み得る:
重複遺伝子の転写調節領域に存在する標的配列を標的とすることができるガイド核酸またはそれをコードする核酸;および
1つまたは複数のエディタータンパク質またはそれをコードする核酸。
真核細胞は哺乳類細胞であり得る。
ガイド核酸は、重複された遺伝子の転写調節領域に存在する標的配列を標的とすることができるガイドドメインを含み得る。
ここで、ガイドドメインは、重複された遺伝子の転写調節領域に存在する標的配列のガイド核酸結合配列と相補的な結合を形成することができるヌクレオチド配列を含み得る。
ここで、ガイドドメインは、重複された遺伝子の転写調節領域内の標的配列のガイド核酸結合配列と相補的な結合を形成し得る。
ここで、相補的な結合は、0~5つのミスマッチ結合を含み得る。
ガイド核酸は、第1の相補的ドメイン、第2の相補的ドメイン、近位ドメインおよびテールドメインからなる群より選択される1つまたは複数のドメインを含み得る。
エディタータンパク質はCRISPR酵素であり得る。
ガイド核酸とエディタータンパク質は、ガイド核酸-エディタータンパク質複合体を形成し得る。
ここで、ガイド核酸-エディタータンパク質複合体は、ガイド核酸の部分核酸をエディタータンパク質の部分アミノ酸と相互作用させることにより形成され得る。
発現制御組成物は、ガイド核酸とエディタータンパク質とをガイド核酸-エディタータンパク質複合体の形態で含み得る。
発現制御組成物は、ガイド核酸とエディタータンパク質がそれぞれ核酸の形態で含まれる1つまたは複数のベクターを含み得る。
導入は、エレクトロポレーション、リポソーム、プラスミド、ウイルスベクター、ナノ粒子、およびタンパク質移行ドメイン(PTD)融合タンパク質法から選択される1つまたは複数の方法により行われ得る。
本発明は、遺伝子重複疾患を治療する方法を提供する。
一態様では、遺伝子重複疾患を治療する方法は、治療対象への発現制御組成物の投与を含み得る。
発現制御組成物は、以下のものを含み得る:
重複遺伝子の転写調節領域に存在する標的配列を標的とすることができるガイド核酸またはそれをコードする核酸;および
1つまたは複数のエディタータンパク質またはそれをコードする核酸。
ガイド核酸は、重複された遺伝子の転写調節領域に存在する標的配列を標的とすることができるガイドドメインを含み得る。
ここで、ガイドドメインは、重複された遺伝子の転写調節領域に存在する標的配列のガイド核酸結合配列と相補的な結合を形成することができるヌクレオチド配列を含み得る。
ここで、ガイドドメインは、重複された遺伝子の転写調節領域内の標的配列のガイド核酸結合配列と相補的な結合を形成し得る。
ここで、相補的結合は、0~5つのミスマッチ結合を含み得る。
ガイド核酸は、第1の相補的ドメイン、第2の相補的ドメイン、近位ドメインおよびテールドメインからなる群より選択される1つまたは複数のドメインを含み得る。
エディタータンパク質はCRISPR酵素であり得る。
ガイド核酸とエディタータンパク質は、ガイド核酸-エディタータンパク質複合体を形成し得る。
ここで、ガイド核酸-エディタータンパク質複合体は、ガイド核酸の部分核酸をエディタータンパク質の部分アミノ酸と相互作用させることにより形成され得る。
遺伝子重複疾患は、シャルコー・マリー・トゥース病1A型(CMT1A)、デジェリン・ソッタス病(DSD)、先天性髄鞘形成不全神経障害(CHN)、ルーシー・レヴィー症候群(RLS)、ペリツェウス・メルツバッハー病(PMD)、MECP2重複症候群、X連鎖下垂体機能低下症(XLHP)、ポトツキ-ルプスキ(Potocki-Lupski)症候群(PTLS)、ヴェロカルディオフェイシャル症候群(VCFS)、ウィリアムズ・ビューレン症候群(WBS)、アラジール症候群(AS)、成長遅延症候群、早期閉鎖頭蓋縫合、常染色体優性白質ジストロフィー(ADLD)、パーキンソン病またはアルツハイマー病であり得る。
遺伝子重複疾患は、癌遺伝子重複によって引き起こされる癌であり得る。
ここで、癌遺伝子重複によって引き起こされる癌は、乳癌、子宮頸癌、結腸直腸癌、食道癌、胃癌、膠芽腫、頭頸部癌、肝細胞癌、神経芽細胞腫、卵巣癌、肉腫または小細胞肺癌であり得る。
治療対象は、ヒト、サル、マウスおよびラットを含む哺乳類であり得る。
投与は、注入、輸液、インプランテーションまたはトランスプランテーションにより行われ得る。
有利な効果
本発明は、発現制御組成物により重複遺伝子の発現を制御することができる。より具体的には、重複遺伝子の転写調節領域を標的とすることができるガイド核酸を含む発現制御組成物を使用することにより重複遺伝子の転写調節領域を人為的に操作および/または修飾することにより重複遺伝子の発現を制御することができる。遺伝子重複によって引き起こされる疾患は、重複遺伝子の発現を制御するための発現制御組成物を使用して改善または治療することもできる。
SpCas9-sgRNAに基づく遺伝子操作によるインデル頻度(%)を示す一連の結果であり、sgRNAの標的部位が区分されたTATAボックスを示す。 SpCas9-sgRNAに基づく遺伝子操作によるインデル頻度(%)を示す一連の結果であり、sgRNAの標的部位が区分されたエンハンサーのそれぞれのインデル頻度を示す。
CjCas9-sgRNAに基づく遺伝子操作によるインデル頻度(%)を示す一連の結果であり、sgRNAの標的部位が区分されたTATAボックスを示す。 CjCas9-sgRNAに基づく遺伝子操作によるインデル頻度(%)を示す一連の結果であり、sgRNAの標的部位が区分されたエンハンサーのそれぞれのインデル頻度を示す。
シュワン様細胞におけるヒトPMP22遺伝子の調節エレメントを標的とするSpCas9-sgRNAによる遺伝子操作効果を示す。
ヒトPMP22のCDSを標的とするSpCas9-sgRNAにより誘導されるフレームシフト変異比を示す。
デュアルsgRNAの処理によるヒトPMP22のごく一部の欠失を示す。Sox10およびEgr2の配列を含むWT配列はSEQ ID NO:330であり、その一部が欠失された変異配列はSEQ ID NO:331である。Enh-Sp5およびEnh-Sp16の標的配列はSEQ ID NO:332および333である。加えて、TATAボックスを含むWT配列はSEQ ID NO: 334であり、その一部が欠失された変異配列はSEQ ID NO: 335である。TATA-Sp12およびTATA-Sp14の標的配列はSEQ ID NO:336および337である。
ヒトシュワン様細胞におけるSpCas9-sgRNAによるヒトPMP22のmRNA発現の減少を示すグラフである。
ヒト初代シュワン細胞におけるヒトPMP22遺伝子の各標的部位でのSpCas9-sgRNAによるPMP22の有効かつ特異的な発現減少を示すグラフであり、各標的部位でのSpCas9-sgRNAによるインデル頻度の測定結果を示す。 ヒト初代シュワン細胞におけるヒトPMP22遺伝子の各標的部位でのSpCas9-sgRNAによるPMP22の有効かつ特異的な発現減少を示すグラフであり、各標的部位のミエリン形成シグナル因子およびRNP複合体の処理の有無にかかわらずqRT-PCRにより測定されるPMP22の相対的なmRNA発現比較結果(n=3、一元配置分散分析およびテューキー事後検定:p<0.05)を示す。 ヒト初代シュワン細胞におけるヒトPMP22遺伝子の各標的部位でのSpCas9-sgRNAによるPMP22の有効かつ特異的な発現減少を示すグラフであり、遠位エンハンサー部位(遠位エンハンサー領域)BとCを標的とするSpCas9-sgRNAによるインデル頻度の測定結果を示す。
in vitroにおけるヒトPMP22遺伝子のTATAボックス部位を標的とするCRISPR-Cas9を介したPMP22の有効かつ特異的な発現減少を示すグラフであり、ヒトPMP22位置のプロモーター領域を標的とする標的配列(プロモータ領域の一部の配列はSEQ ID NO:338(上の鎖)および339(下の鎖))を示す。 in vitroにおけるヒトPMP22遺伝子のTATAボックス部位を標的とするCRISPR-Cas9を介したPMP22の有効かつ特異的な発現減少を示すグラフであり、左端のグラフ、中央のグラフ、ならびに右端のグラフは、ヒト初代シュワン細胞における標的ディープシーケンシングを使用したインデル頻度の測定結果、総インデル頻度のうちTATAボックス1変異頻度の測定結果(n=3)、ならびにヒト初代シュワン細胞におけるミエリン形成シグナル因子およびRNP複合体の処理の有無にかかわらずqRT-PCRにより測定されるPMP22の相対的mRNA発現の比較結果(n=3、一元配置分散分析およびテューキー事後検定:p<0.05)をそれぞれ示す。
ヒト初代シュワン細胞における標的ディープシーケンシングによるin silicoオフターゲット分析を介して判明したオフターゲットおよびオンターゲットにおけるPMP22-TATA RNPによるインデル頻度を示し、インデル頻度を示すグラフである。 ヒト初代シュワン細胞における標的ディープシーケンシングによるin silicoオフターゲット分析を介して判明したオフターゲットおよびオンターゲットにおけるPMP22-TATA RNPによるインデル頻度を示し、高頻度のインデルを示す(WTのローカル配列はSEQ ID NO:340、インデルを含むローカル配列はSEQ ID NO:341~345(Indel-1~-4の順)) ヒト初代シュワン細胞における標的ディープシーケンシングによるin silicoオフターゲット分析を介して判明したオフターゲットおよびオンターゲットにおけるPMP22-TATA RNPによるインデル頻度を示し、in silicoオフターゲット分析を介して判明したオフターゲット部位を示す(オンターゲット配列はSEQ ID NO:346、オフターゲット配列はSEQ ID NO:347~364(Off1からOff18の順))。
ヒトの全ゲノムにおいてPMP22-TATA RNPによって切断される部位を示す一連の結果であり、ゲノムワイドなCircosプロットを示す。 ヒトの全ゲノムにおいてPMP22-TATA RNPによって切断される部位を示す一連の結果であり、in silicoオフターゲット分析を介して判明したオフターゲット部位のうちDigenome-seqにより現れるオフターゲット部位を示す。オンターゲット配列はSEQ ID NO:346であり、オフターゲット配列はSEQ ID NO:365~373(Off1~Off9の順)である。 ヒトの全ゲノムにおいてPMP22-TATA RNPによって切断される部位を示す一連の結果であり、オフターゲット部位におけるインデル頻度を示すグラフである。オンターゲット配列はSEQ ID NO:346であり、オフターゲット配列はSEQ ID NO:365~373(Off1~Off9の順)である。
C22マウスにおけるPMP22‐TATA RNA療法を使用した治療アプローチを概略的に示す。
CMT1AマウスにおけるCRISPR/Cas9によるPMP22の発現阻害を介した疾患表現型の軽減を示す一連の結果であり、(a)は、mRosa26またはPMP22-TATA RNP複合体で治療された坐骨神経における標的ディープシーケンシングを使用したインデル頻度を示すグラフ(n=3)であり、(b)は、総インデル頻度のうちTATAボックス1変異頻度の測定結果(n=3)を示し、(c)は、mRosa26またはPMP22-TATA RNP複合体で治療された坐骨神経からのqRT-PCRを使用したPMP22の発現mRNAの相対量を比較するグラフである。
in silico分析によるマウスゲノムにおけるPMP22-TATA sgRNAのオフターゲット部位およびインデル頻度を示す一連の結果であり、オフターゲット部位を示す。オンターゲット配列はSEQ ID NO:346であり、オフターゲット配列は374~381(Off1~Off8の順)である。 in silico分析によるマウスゲノムにおけるPMP22-TATA sgRNAのオフターゲット部位およびインデル頻度を示す一連の結果であり、各オフターゲット部位でのインデル頻度を示すグラフである。オンターゲット配列はSEQ ID NO:346であり、オフターゲット配列は374~381(Off1~Off8の順)である。
CMT1AマウスにおけるCRISPR/Cas9によるPMP22の発現阻害を介した疾患表現型の軽減を示す一連の結果であり、mRosa26またはPMP22-TATA RNP複合体で処理された坐骨神経組織の半薄切片の一連の画像である。 CMT1AマウスにおけるCRISPR/Cas9によるPMP22の発現阻害を介した疾患表現型の軽減を示す一連の結果であり、上のグラフと下のグラフは、PMP22-TATA RNPで処理されたマウスにおいてg比が増加することを示す散布図と、MP22-TATA RNPで処理されたマウスにおいて有髄軸索の直径が増加することを示すグラフをそれぞれ示す。
CMT1AマウスにおけるCRISPR/Cas9によるPMP22の発現阻害を介した電気生理学的な変化を示す一連の結果であり、(a)遠位潜時(DL)の変化を示すグラフであり、(b)運動神経伝導速度(NCV)の変化を示すグラフであり、(c)複合筋活動電位(CMAP)の変化を示すグラフ(mRosa26 RNPの場合はn=7、PMP22-TATAの場合はn=10)である。
CMT1AマウスにおけるCRISPR/Cas9によるPMP22の発現阻害に起因した運動行動の一連の分析結果であり、上のグラフと下のグラフは、ロータロッド試験の結果(mRosa26 RNPの場合はn=7、PMP22-TATAの場合はn=11)と、マウスが8週齢から16週齢になるまで毎週測定したロータロッド試験の結果(mRosa26 RNPの場合はn=7、PMP22-TATAの場合はn=11)をそれぞれ示す。 CMT1AマウスにおけるCRISPR/Cas9によるPMP22の発現阻害に起因した運動行動の一連の分析結果であり、上のグラフと下の画像は、mRosa26またはPMP22-TATA RNP複合体で処理されたC22マウスの腓腹筋重量/体重の比と、mRosa26またはPMP22-TATA RNP複合体で処理されたC22マウスの一連の腓腹筋画像をそれぞれ示すグラフである。
PMD治療戦略を示す概略図であって、PLP1遺伝子のTATAボックス領域とエンハンサー領域を標的とするsgRNAを設計した。エンハンサー領域を標的とするsgRNAの場合、2つのsgRNAを使用してエンハンサーを除去する戦略が示される。ここで、エンハンサー領域の上流を標的とするsgRNAはUpと表示され、その下流を標的とするsgRNAはDownと表示され、UpとDownはまた、表5と6における位置に従って表示される。
例示的な実施形態で使用されるCjCas9プラスミドを示す。
mPlp1のTATAボックス領域を標的とするSpCas9-sgRNAのスクリーニング結果を示す一連のグラフである。(a)は、NIH-3T3細胞において確認されたインデル頻度(%)を示し、(b)は、N20.1細胞において確認されたインデル頻度(%)を示す。ここで、使用したsgRNAは、mPlp1-TATA-Sp-01を標的とするsgRNAであり、グラフ上の標的配列に表示される数字で区別した。
mPlp1のTATAボックス領域を標的とするCjCas9-sgRNAのスクリーニング結果を示す一連のグラフである。(a)は、NIH-3T3細胞において確認されたインデル頻度(%)を示し、(b)は、N20.1細胞において確認されたインデル頻度(%)を示す。ここで、使用されるsgRNAは、mPlp1-TATA-Cj-01~mPlp1-TATA-Cj-04であり、グラフ上の標的配列に表示される数字で区別した。
mPlp1のエンハンサー(wMN1エンハンサー)領域を標的とするSpCas9-sgRNAのスクリーニング結果を示す一連のグラフである。(a)は、NIH-3T3細胞において確認されたインデル頻度(%)を示し、(b)は、N20.1細胞において確認されたインデル頻度(%)を示す。ここで、使用したsgRNAは、mPlp1-wMN1-Sp-01~mPlp1-wMN1-Sp-36であり、グラフ上の標的配列に表示される数字で区別した。
mPlp1のエンハンサー(wMN1エンハンサー)領域を標的とするCjCas9-sgRNAのスクリーニング結果を示すグラフである。(a)は、NIH-3T3細胞において確認されたインデル頻度(%)を示し、(b)は、N20.1細胞において確認されたインデル頻度(%)を示す。ここで、使用したsgRNAは、mPlp1-wMN1-Cj-01~mPlp1-wMN1-Cj-28であり、グラフ上の標的配列に表示される数字で区別した。
mPlp1のTATAボックスとエンハンサー(wMN1エンハンサー)領域を標的とするSpCas9-sgRNAおよびCjCas9-sgRNAによるPlpのmRNA発現レベルを示す一連のグラフである。(a)は、SpCas9-sgRNAによるPlpのmRNA発現レベルを示し、ここで、TATAボックス領域を標的とするmPlp1-TATA-Sp-01ならびにエンハンサーを標的とするmPlp1-wMN1-Sp-07+mPlp1-wMN1-Sp-27およびmPlp1-wMN1-Sp-08+mPlp1-wMN1-Sp-27をsgRNAとして使用した。 (b)は、CjCas9-sgRNAによるPlpのmRNA発現レベルを示し、ここで、TATAボックス領域を標的とするmPlp1-TATA-Cj-02およびmPlp1-TATA-Cj-03;ならびにエンハンサーを標的とするmPlp1-wMN1-Cj-06+mPlp1-wMN1-Cj-09、mPlp1-wMN1-Cj-06+mPlp1-wMN1-Cj-10およびmPlp1-wMN1-Cj-06+mPlp1-wMN1-Cj-19をsgRNAとして使用した。mRosa26を対照として使用した。
hPLP1のエンハンサー(wMN1エンハンサー)領域を標的とするSpCas9-sgRNAのスクリーニング結果を示すグラフであり、Jurkat細胞において確認されたインデル頻度(%)を示し、使用したsgRNAは、hPLP1-wMN1-Sp-01~hPLP1-wMN1-Sp-36であり、グラフ上の標的配列に表示される数字で区別した。
hPLP1のエンハンサー(wMN1エンハンサー)領域を標的とするCjCas9-sgRNAのスクリーニング結果を示すグラフであり、293T細胞において確認されたインデル頻度(%)を示し、使用したsgRNAは、hPLP1-wMN1-Cj-01~hPLP1-wMN1-Cj-36であり、グラフ上の標的配列に表示される数字で区別した。
別様に定義されない限り、本明細書で使用されるすべての技術用語および科学用語は、本発明が属する分野の当業者によって一般に理解されるのと同じ意味を有する。本明細書に記載のものと類似または同一の方法および材料を本発明の実施または試験に使用することができるが、適切な方法および材料を以下に記載する。本明細書で言及されるすべての出版物、特許出願、特許および他の参考文献は、参照によりその全体が組み込まれる。加えて、材料、方法および実施例は、単なる例示であり、限定することを意図したものではない。本明細書で開示される一態様は、発現制御組成物に関する。
発現制御組成物は、遺伝子重複により重複遺伝子の発現を制御するための組成物である。
「遺伝子重複」とは、ゲノム内に2つ以上の同一遺伝子が存在することを意味する。遺伝子重複には、ゲノム内に同じ遺伝子の2つ以上の部分を有することも含まれる。たとえば、遺伝子重複とは、ゲノム内に2つ以上の完全長A遺伝子、またはゲノム内に1つの完全長A遺伝子と、A遺伝子の1つまたは複数の部分、たとえばエクソン1が存在することを意味し得る。たとえば、遺伝子重複とは、ゲノム内に2つの全長B遺伝子と、B遺伝子の1つまたは複数の部分、たとえばエクソン1およびエクソン2が存在することを意味し得る。遺伝子重複の種類はさまざまであり得、遺伝子重複には、ゲノム内の全長遺伝子および/または遺伝子の部分配列の重複(すなわち2つ以上)が含まれる。
加えて、遺伝子重複には、染色体の部分領域を複製する複製現象が含まれ、それは染色体の遺伝子組換え中に起こる。そのような遺伝子重複とは、遺伝子変異の一種であり、次世代に継代される。遺伝子重複は、遺伝子の部分領域が複製されないために起こる遺伝子の欠失とともに、遺伝子発現に影響を及ぼす。
ここで、遺伝子重複の対象、すなわち2つ以上の数で存在する遺伝子を「重複遺伝子(duplication gene)」と呼ぶ。
重複遺伝子は、遺伝子重複によりゲノム内の総コピー数が増加した遺伝子であり得る。
重複遺伝子は、遺伝子重複により部分領域のみが重複されている変異遺伝子であり得る。ここで、変異遺伝子は、遺伝子の全配列中の1つまたは複数のヌクレオチド配列が重複されている遺伝子であり得る。あるいは、変異遺伝子は、遺伝子重複により遺伝子の部分核酸断片が複製されている遺伝子であり得る。ここで、核酸断片は、50bp以上のヌクレオチド配列を有し得る。
遺伝子重複には、全ゲノム重複が含まれる。
遺伝子重複には、標的遺伝子重複が含まれる。ここで、標的遺伝子重複とは、新しい種の環境変化への分化と適応において、特定の環境に適した関連遺伝子が増幅または消失し、ほとんどの複製がトランスポゾンにより行われる遺伝子重複の一種である。
遺伝子重複には、異所性組換えが含まれる。ここで、異所性組換えは、相同染色体の減数分裂中の不均等なクロスオーバーに起因する複製のために2つの染色体間の反復配列の程度に従って起こる。クロスオーバーでの重複と相互欠失が発生する。異所性組換えは、転位因子などの典型的な反復遺伝因子によって媒介され、組換えによって引き起こされる複製をもたらす。
遺伝子重複には、複製のずれが含まれる。ここで、複製のずれは、DNA複製中のエラーによる短い遺伝子配列の複製であり、DNAポリメラーゼが変性DNA鎖に誤って付着し、DNA鎖が再び複製されるときに起こる。複製のずれはまた、反復遺伝要素によって頻繁に媒介される。
遺伝子重複には、レトロトランスポジションが含まれる。ここで、レトロトランスポジションは、レトロウイルスまたはレトロエレメント侵入細胞によって媒介される複製であって、遺伝子の逆転写が行われてレトロ遺伝子が形成され、レトロ遺伝子の組換えにより遺伝子重複が行われる。レトロトランスポジションは、レトロ転位因子などの遺伝的因子によって媒介される。
遺伝子重複は、重複遺伝子から転写されたmRNAの発現を増加させることができる。ここで、転写されたmRNAの発現は、遺伝子重複が起こらない状態と比較して増加し得る。
遺伝子重複は、重複遺伝子によりコードされるタンパク質の発現を増加させることができる。ここで、タンパク質の発現は、遺伝子重複が起こらない状態と比較して増加し得る。
遺伝子重複は、重複遺伝子によりコードされるタンパク質の機能障害を引き起こし得る。
ここで、機能不全は、タンパク質の機能亢進、抑制機能、および第3の機能であり得る。
遺伝子重複は、遺伝子重複疾患を引き起こし得る。
「遺伝子重複疾患」とは、遺伝子重複によって引き起こされる疾患であり、重複遺伝子の異常増幅により遺伝的異常を引き起こし、過剰発現またはそれによって異常に生成されるタンパク質によって病理学的特徴を誘導するすべての疾患または障害を含む。ここで、「病理学的特徴」とは、生物の細胞レベルでの変化、ならびに疾患に基づく組織、器官および個人レベルでの変化を指す。
遺伝子重複疾患は、シャルコー・マリー・トゥース病1A型(CMT1A)、デジェリン・ソッタス病(DSD)、先天性髄鞘形成不全神経障害(CHN)、ルーシー・レヴィー症候群(RLS)、ペリツェウス・メルツバッハー病(PMD)、MECP2重複症候群、X連鎖下垂体機能低下症(XLHP)、ポトツキ-ルプスキ症候群(PTLS)、ヴェロカルディオフェイシャル症候群(VCFS)、ウィリアムズ・ビューレン症候群(WBS)、アラジール症候群(AS)、成長遅延症候群、早期閉鎖頭蓋縫合、常染色体優性白質ジストロフィー(ADLD)、パーキンソン病またはアルツハイマー病であり得る。
遺伝子重複疾患は、癌遺伝子重複によって引き起こされる癌であり得る。
ここで、癌遺伝子重複によって引き起こされる癌は、乳癌、子宮頸癌、結腸直腸癌、食道癌、胃癌、膠芽腫、頭頸部癌、肝細胞癌、神経芽細胞腫、卵巣癌、肉腫または小細胞肺癌であり得る。
遺伝子重複疾患は、PMP22遺伝子、PLP1遺伝子、MECP2遺伝子、SOX3遺伝子、RAI1遺伝子、TBX1遺伝子、ELN遺伝子、JAGGED1遺伝子、NSD1遺伝子、MMP23遺伝子、LMB1遺伝子、SNCA遺伝子およびAPP遺伝子の重複によって引き起こされる疾患であり得る。
遺伝子重複疾患は、MYC遺伝子、ERBB2(HER2)遺伝子、CCND1(サイクリンD1)遺伝子、FGFR1遺伝子、FGFR2遺伝子、HRAS遺伝子、KRAS遺伝子、MYB遺伝子、MDM2遺伝子、CCNE(サイクリンE)遺伝子、MET遺伝子、CDK4遺伝子、ERBB1遺伝子、MYCN遺伝子またはAKT2遺伝子の重複によって引き起こされる疾患であり得る。
遺伝子重複疾患は、重複遺伝子の転写されたmRNAの発現の異常な増加によって引き起こされる疾患であり得る。
遺伝子重複疾患は、重複遺伝子によりコードされるタンパク質の発現の異常な増加によって引き起こされる疾患であり得る。
発現制御組成物は、重複遺伝子の転写により生成されるmRNAの発現の制御に使用され得る。
発現制御組成物は、重複遺伝子によりコードされるタンパク質の発現の制御に使用され得る。
発現制御組成物は、重複遺伝子の人為的な修飾または操作に使用され得る。
ここで、「人為的に修飾または操作(人為的に修飾、操作または改変された)」とは、天然に存在する状態ではなく、人為的に修飾された状態を指す。 以下、非天然に人為的に修飾または操作された重複遺伝子は、人為重複遺伝子と同義で使用され得る。
「発現制御システム」とは、人為的に操作された重複遺伝子の発現の制御に起因して起こるすべての現象、ならびに発現制御システムに直接または間接的に関与するすべての材料、組成物、方法および使用を含む用語である。
発現制御組成物は、重複遺伝子の転写調節領域の人為的な操作または修飾に使用され得る。
ここで、「転写調節領域(転写制御領域)」とは、遺伝子のDNAに基づいてRNAを合成するプロセス全体を制御する領域であり、遺伝子のDNA配列および/または遺伝子の近位DNA配列の転写因子と相互作用するすべての領域を含む。ここで、転写因子は、活性化されるとDNAの特異領域、すなわち遺伝子に近い応答エレメントに結合し、それによって遺伝子発現を促進または阻害するタンパク質であり、応答要素は、転写調節領域に含まれる。転写調節領域の種類と位置は遺伝子に従って異なり得、同じ種でも個体間で核酸配列に違いがあり得る。
転写調節領域は、プロモーター、エンハンサー、サイレンサー、インシュレーターおよび/または遺伝子座制御領域(LCR)であり得る。
プロモーターは、コアプロモーター、近位プロモーターおよび/または遠位プロモーターであり得る。
ここで、コアプロモーターは、転写開始部位(TSS)、RNAポリメラーゼ結合部位、転写因子結合部位および/またはTATAボックスを含み得る。
TATAボックスは、Rpb4/Rbp7の転写を開始するために使用される開始部位の25塩基対上流に位置する領域であり得る。
TATAボックスは、TSSの30塩基対上流に位置する領域であり得る。
TATAボックスは、TSSの40~100塩基対上流に位置する領域であり得る。
たとえば、TATAボックスは、プロモーターおよび/またはコアプロモーターに存在する5'-TATA(A/T)A(A/T)-3'配列を含む領域であり得る。あるいは、TATAボックスは、プロモーターおよび/またはコアプロモーターに存在する5'-TATA(A/T)A(A/T)(A/G)-3'配列を含む領域であり得る。
たとえば、TATAボックスは、プロモーターおよび/またはコアプロモーターに存在する5'-CATAAAA-3'(SEQ ID NO:264)配列、5'-TATAA-3'(SEQ ID NO:265)配列、5'-TATAAAA-3'(SEQ ID NO:266)配列、5'-CATAAATA-3'(SEQ ID NO:267)配列、5'-TATATAA-3'(SEQ ID NO:268)配列、5'-TATATATATATATAA-3'(SEQ ID NO:269)配列、5'-TATATTATA-3'(SEQ ID NO:270)配列、5'-TATAAA-3'(SEQ ID NO:271)配列、5'-TATAAAATA-3'(SEQ ID NO:272)配列、5'-TATATA-3'(SEQ ID NO:273)配列、5'-GATTAAAAA-3'(SEQ ID NO:274)配列、5'-TATAAAAA-3'(SEQ ID NO:275)配列、5'-TTATAA-3'(SEQ ID NO:276)配列、5'-TTTTAAAA-3'(SEQ ID NO:277)配列、5'-TCTTTAAAA-3'(SEQ ID NO:278)配列、5'-GACATTTAA-3'(SEQ ID NO:279)配列、5'-TGATATCAA-3'(SEQ ID NO:280)配列、5'-TATAAATA-3'(SEQ ID NO:281)配列、5'-TATAAGA-3'(SEQ ID NO:282)配列、5'-AATAAA-3'(SEQ ID NO:283)配列、5'-TTTATA-3'(SEQ ID NO:284)配列、5'-CATAAAAA-3'(SEQ ID NO:285)配列、5'-TATACA-3'(SEQ ID NO:286)配列、5'-TTTAAGA-3'(SEQ ID NO:287)配列、5'-GATAAAG-3'(SEQ ID NO:288)配列、5'-TATAACA-3'(SEQ ID NO:289)配列、5'-TCTTATCTT-3'(SEQ ID NO:290)配列、5'-TTGTACTTT-3'(SEQ ID NO:291)配列、5'-CATATAA-3'(SEQ ID NO:292)配列、5'-TATAAAT-3'(SEQ ID NO:293)配列、5'-TATATATAAAAAAAA-3'(SEQ ID NO:294)配列および5'-CATAAATAAAAAAAATTA-3'(SEQ ID NO:295)配列からなる群より選択される1つまたは複数の配列を含む領域であり得る。
たとえば、TATAボックスは、プロモーターおよび/またはコアプロモーターに存在するTATA結合タンパク質(TBP)が結合する領域であり得る。
ここで、近位プロモーターは、TSS、CpG部位および/または特定の転写因子結合部位の1~300bp上流の領域を含み得る。
エンハンサーは、エンハンサーボックス(Eボックス)を含み得る。
インシュレーターは、エンハンサーとプロモーターとの間の相互作用を阻害する領域、または抑制されたクロマチンの拡大を妨げる領域であり得る。
遺伝子座制御領域(LCR)は、エンハンサー、サイレンサー、インシュレーター、MARおよびSARなどの多数のシス作用因子が存在する領域であり得る。本明細書に開示される一態様として、発現制御組成物は、ガイド核酸を含み得る。
発現制御組成物は、重複遺伝子を標的とするガイド核酸またはそれをコードする核酸配列を含み得る。
「ガイド核酸」とは、標的核酸、遺伝子または染色体を認識し、エディタータンパク質と相互作用するヌクレオチド配列を指す。ここで、ガイド核酸は、標的核酸、遺伝子または染色体の部分ヌクレオチド配列に相補的に結合し得る。加えて、ガイド核酸の部分ヌクレオチド配列は、エディタータンパク質のいくつかのアミノ酸と相互作用し、それによってガイド核酸-エディタータンパク質複合体を形成し得る。
ガイド核酸は、標的核酸、遺伝子または染色体の標的領域に位置するようにガイド核酸-エディタータンパク質複合体を誘導する機能を果たし得る。
ガイド核酸は、DNA、RNAまたはDNA/RNAハイブリッドの形態で存在し得、5~150ntの核酸配列を有し得る。
ガイド核酸は、1つの連続した核酸配列を有し得る。
たとえば、1つの連続した核酸配列は(N)であり得、ここで、Nは、A、T、CもしくはG、またはA、U、CもしくはGを表し、mは1~150の整数である。
ガイド核酸は、2つ以上の連続した核酸配列を有し得る。
たとえば、2つ以上の連続核酸配列は、(N)および(N)であり得、ここで、Nは、A、T、CもしくはG、またはA、U、CもしくはGを表し、mとoは1~150の整数であり、mとoは互いに同じでも異なっていてもよい。
ガイド核酸は、1つまたは複数のドメインを含み得る。
ドメインは、ガイドドメイン、第1の相補的ドメイン、リンカードメイン、第2の相補的ドメイン、近位ドメイン、またはテールドメインであり得るが、これらに限定されない。
ここで、1つのガイド核酸は、2つ以上の機能的ドメインを有し得る。ここで、2つ以上の機能的ドメインは、互いに異なっていてもよい。一例として、1つのガイド核酸は、ガイドドメインと第1の相補的ドメインを有し得る。別の例では、1つのガイド核酸は、第2の相補的ドメイン、近位ドメインおよびテールドメインを有し得る。さらに別の例では、1つのガイド核酸は、ガイドドメイン、第1の相補的ドメイン、第2の相補的ドメイン、近位ドメインおよびテールドメインを有し得る。あるいは、1つのガイド核酸に含まれる2つ以上の機能的ドメインは、互いに同じであり得る。一例として、1つのガイド核酸は、2つ以上の近位ドメインを有し得る。別の例として、1つのガイド核酸は、2つ以上のテールドメインを有し得る。しかしながら、1つのガイド核酸に含まれる機能的ドメインが同じドメインであるという説明は、2つの機能的ドメインの配列が同じであることを意味しない。配列が異なっていても、機能的に同じ機能を果たす場合、2つの機能的ドメインは同じドメインであり得る。
機能的ドメインについては、以下で詳しく説明する。i)ガイドドメイン
「ガイドドメイン」という用語は、標的遺伝子の転写調節領域内の核酸の二本鎖のいずれかの鎖の部分配列と相補的に結合することができるドメインであり、標的遺伝子の転写調節領域内の核酸との特異的な相互作用のために作用する。たとえば、ガイドドメインは、標的遺伝子の転写調節領域内の核酸における特定のヌクレオチド配列に位置するガイド核酸-エディタータンパク質複合体を誘導する機能を果たし得る。
ガイドドメインは、10~35ヌクレオチド配列であり得る。
一例では、ガイドドメインは、10~35、15~35、20~35、25~35または30~35ヌクレオチド配列であり得る。
別の例では、ガイドドメインは、10~15、15~20、20~25、25~30または30~35ヌクレオチド配列であり得る。
ガイドドメインは、ガイド配列を含み得る。
「ガイド配列」という用語は、標的遺伝子の転写調節領域内の核酸の二本鎖のいずれかの鎖の部分配列に相補的なヌクレオチド配列である。ここで、ガイド配列は、少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%以上の相補性または完全な相補性を有するヌクレオチド配列であり得る。
ガイド配列は、10~25ヌクレオチド配列であり得る。
一例では、ガイド配列は、10~25、15~25または20~25ヌクレオチド配列であり得る。
別の例では、ガイド配列は、10~15、15~20または20~25ヌクレオチド配列であり得る。
加えて、ガイドドメインは、追加のヌクレオチド配列をさらに含み得る。
追加のヌクレオチド配列を利用して、ガイドドメインの機能を改善または低下させることができる。
追加のヌクレオチド配列を利用して、ガイド配列の機能を改善または低下させることができる。
追加のヌクレオチド配列は、1~10ヌクレオチド配列であり得る。
一例では、追加のヌクレオチド配列は、2~10、4~10、6~10または8~10ヌクレオチド配列であり得る。
別の例では、追加のヌクレオチド配列は、1~3、3~6または7~10ヌクレオチド配列であり得る。
一実施形態では、追加のヌクレオチド配列は、1、2、3、4、5、6、7、8、9または10ヌクレオチド配列であり得る。
たとえば、追加のヌクレオチド配列は、1つのヌクレオチド配列G(グアニン)、または2つのヌクレオチド配列GGであり得る。
追加のヌクレオチド配列は、ガイド配列の5'末端に配置され得る。
追加のヌクレオチド配列は、ガイド配列の3'末端に配置され得る。
ii)第1の相補的ドメイン
「第1の相補的ドメイン」という用語は、後述する第2の相補的ドメインに相補的なヌクレオチド配列を含むドメインであり、第2の相補的ドメインと二本鎖を形成するのに十分な相補性を有する。たとえば、第1の相補的ドメインは、第2の相補的ドメインに対して少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%以上の相補性または完全な相補性を有するヌクレオチド配列であり得る。
第1の相補的ドメインは、相補的結合により第2の相補的ドメインと二本鎖を形成し得る。ここで、形成された二本鎖は、エディタータンパク質のいくつかのアミノ酸と相互作用することによりガイド核酸-エディタータンパク質複合体を形成するように作用し得る。
第1の相補的ドメインは、5~35ヌクレオチド配列であり得る。
一例では、第1の相補的ドメインは、5~35、10~35、15~35、20~35、25~35または30~35ヌクレオチド配列であり得る。
別の例では、第1の相補的ドメインは、1~5、5~10、10~15、15~20、20~25、25~30または30~35ヌクレオチド配列であり得る。
iii)リンカードメイン
「リンカードメイン」という用語は、2つ以上のドメインを連結するヌクレオチド配列であり、それらは2つ以上の同一または異なるドメインである。リンカードメインは、共有結合または非共有結合により2つ以上のドメインと連結され得、または共有結合もしくは非共有結合により2つ以上のドメインを連結し得る。
リンカードメインは、1~30ヌクレオチド配列であり得る。
一例では、リンカードメインは、1~5、5~10、10~15、15~20、20~25または25~30ヌクレオチド配列であり得る。
別の例では、リンカードメインは、1~30、5~30、10~30、15~30、20~30または25~30ヌクレオチド配列であり得る。
iv)第2の相補的ドメイン
「第2の相補的ドメイン」という用語は、上記の第1の相補的ドメインに相補的なヌクレオチド配列を含むドメインであり、第1の相補的ドメインと二本鎖を形成するのに十分な相補性を有する。たとえば、第2の相補的ドメインは、第1の相補的ドメインに対して少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%以上の相補性または完全な相補性を有するヌクレオチド配列であり得る。
第2の相補的ドメインは、相補的結合により第1の相補的ドメインと二本鎖を形成し得る。ここで、形成された二本鎖は、エディタータンパク質のいくつかのアミノ酸と相互作用することによりガイド核酸-エディタータンパク質複合体を形成するように作用し得る。第2の相補的ドメインは、第1の相補的ドメインに相補的なヌクレオチド配列、および第1の相補的ドメインに対して相補性を有しないヌクレオチド配列、たとえば、第1の相補的ドメインと二本鎖を形成しないヌクレオチド配列を有し得、第1の相補的ドメインよりも長い塩基配列を有し得る。
第2の相補的ドメインは、5~35ヌクレオチド配列であり得る。
一例では、第2の相補的ドメインは、5~35、10~35、15~35、20~35、25~35または30~35ヌクレオチド配列であり得る。
別の例では、第2の相補的ドメインは、1~5、5~10、10~15、15~20、20~25、25~30または30~35ヌクレオチド配列であり得る。
v)近位ドメイン
「近位ドメイン」という用語は、第2の相補的ドメインに隣接して位置するヌクレオチド配列である。
近位ドメインは、その中に相補的なヌクレオチド配列を有し得、相補的なヌクレオチド配列により二本鎖で形成され得る。
近位ドメインは、1~20ヌクレオチド配列であり得る。
一例では、近位ドメインは、1~20、5~20、10~20または15~20ヌクレオチド配列であり得る。
別の例では、近位ドメインは、1~5、5~10、10~15または15~20ヌクレオチド配列であり得る。
vi)テールドメイン
「テールドメイン」という用語は、ガイド核酸の両端のうちの1つまたは複数の端に位置するヌクレオチド配列である。
テールドメインは、その中に相補的なヌクレオチド配列を有していてもよいか、相補的なヌクレオチド配列のために二本鎖で形成されていてもよい。
テールドメインは、1~50ヌクレオチド配列であり得る。
一例では、テールドメインは、5~50、10~50、15~50、20~50、25~50、30~50、35~50、40~50または45~50ヌクレオチド配列であり得る。
別の例では、テールドメインは、1~5、5~10、10~15、15~20、20~25、25~30、30~35、35~40、40~45または45~50ヌクレオチド配列であり得る。
一方、ドメイン、すなわちガイドドメイン、第1の相補的ドメイン、リンカードメイン、第2の相補的ドメイン、近位ドメインおよびテールドメインに含まれる核酸配列の一部または全体は、選択的または追加で化学修飾を含み得る。
化学修飾は、メチル化、アセチル化、リン酸化、ホスホロチオエート結合、ロックされた核酸(LNA)、2'-O-メチル3'ホスホロチオエート(MS)または2'-O-メチル3'チオPACE(MSP)であり得るが、これらに限定されない。
ガイド核酸は、1つまたは複数のドメインを含む。
ガイド核酸は、ガイドドメインを含み得る。
ガイド核酸は、第1の相補的ドメインを含み得る。
ガイド核酸は、リンカードメインを含み得る。
ガイド核酸は、第2の相補的ドメインを含み得る。
ガイド核酸は、近位ドメインを含み得る。
ガイド核酸は、テールドメインを含み得る。
ここで、1、2、3、4、5、6またはそれ以上のドメインが存在し得る。
ガイド核酸は、1、2、3、4、5、6またはそれ以上のガイドドメインを含み得る。
ガイド核酸は、1、2、3、4、5、6またはそれ以上の第1の相補的ドメインを含み得る。
ガイド核酸は、1、2、3、4、5、6またはそれ以上のリンカードメインを含み得る。
ガイド核酸は、1、2、3、4、5、6またはそれ以上の第2の相補的ドメインを含み得る。
ガイド核酸は、1、2、3、4、5、6またはそれ以上の近位ドメインを含み得る。
ガイド核酸は、1、2、3、4、5、6またはそれ以上のテールドメインを含み得る。
ここで、ガイド核酸では、1種類のドメインが重複されていてもよい。
ガイド核酸は、重複の有無にかかわらずいくつかのドメインを含み得る。
ガイド核酸は、同じ種類のドメインを含み得る。ここで、同じ種類のドメインは、同じ核酸配列または異なる核酸配列を有し得る。
ガイド核酸は、2種類のドメインを含み得る。ここで、2つの異なる種類のドメインは、異なる核酸配列または同じ核酸配列を有し得る。
ガイド核酸は、3種類のドメインを含み得る。ここで、3つの異なる種類のドメインは、異なる核酸配列または同じ核酸配列を有し得る。
ガイド核酸は、4種類のドメインを含み得る。ここで、4つの異なる種類のドメインは、異なる核酸配列または同じ核酸配列を有し得る。
ガイド核酸は、5種類のドメインを含み得る。ここで、5つの異なる種類のドメインは、異なる核酸配列または同じ核酸配列を有し得る。
ガイド核酸は、6種類のドメインを含み得る。ここで、6つの異なる種類のドメインは、異なる核酸配列または同じ核酸配列を有し得る。
たとえば、ガイド核酸は、[ガイドドメイン]-[第1の相補的ドメイン]-[リンカードメイン]-[第2の相補的ドメイン]-[リンカードメイン]-[ガイドドメイン]-[第1の相補的ドメイン]-[リンカードメイン]-[第2の相補的ドメイン]からなり得る。ここで、2つのガイドドメインは、異なるまたは同じ標的のためのガイド配列を含み得、2つの第1の相補的ドメインと2つの第2の相補的ドメインは、同じまたは異なる核酸配列を有し得る。ガイドドメインが異なる標的のガイド配列を含む場合、ガイド核酸は2つの異なる標的に特異的に結合し得、ここで、特異的結合は、同時にまたは連続して行われ得る。加えて、リンカードメインは、特定の酵素によって切断され、ガイド核酸は、特定の酵素の存在下で2つまたは3つの部分に分割される。本明細書に開示される例示的な一実施形態では、ガイド核酸はgRNAであり得る。
「gRNA」という用語は、標的遺伝子の転写調節領域内の核酸に関して、gRNA-CRISPR酵素複合体、すなわちCRISPR複合体を特異的に標的とすることができるRNAを指す。加えて、gRNAは、標的遺伝子の転写調節領域内の核酸に特異的なRNAであり、それはCRISPR酵素に結合し、標的遺伝子の転写調節領域にCRISPR酵素をガイドする。
gRNAは、複数のドメインを含み得る。各ドメインに基づき、相互作用は、gRNA鎖の3次元構造もしくは活性型において、またはこれらの鎖間で起こり得る。
gRNAは、一本鎖gRNA(単一RNA分子、単一gRNAまたはsgRNA);または二本鎖gRNA(2つ以上、一般には2つの別個のRNA分子を含む)と呼ばれ得る。
例示的な一実施形態では、一本鎖gRNAは、ガイドドメイン、すなわち、標的遺伝子の転写調節領域内の核酸と相補的な結合を形成することができるガイド配列を含むドメイン;第1の相補的ドメイン;リンカードメイン;第1の相補的ドメイン配列に相補的な配列を有し、それによって第1の相補的ドメインと二本鎖核酸を形成するドメインである第2の相補的ドメイン;近位ドメイン;および任意にテールドメインを5'-3'方向に含み得る。
別の実施形態では、二本鎖gRNAは、ガイドドメイン、すなわち、標的遺伝子の転写調節領域内の核酸と相補的な結合を形成することができるガイド配列を含むドメインおよび第1の相補的ドメインを含む第1鎖、ならびに、第1の相補的ドメイン配列に相補的な配列を有し、それによって第1の相補的ドメインと二本鎖核酸を形成するドメインである第2の相補的ドメイン、近位ドメイン、および任意にテールドメインを5'-3'方向に含む第2鎖を含み得る。
ここで、第1鎖はcrRNAと呼ばれ、第2鎖はtracrRNAと呼ばれ得る。crRNAは、ガイドドメインと第1の相補的ドメインを含み得、tracrRNAは、第2の相補的ドメイン、近位ドメインおよび任意にテールドメインを含み得る。
さらに別の実施形態では、一本鎖gRNAは、ガイドドメイン、すなわち、標的遺伝子の転写調節領域内の核酸と相補的な結合を形成することができるガイド配列を含むドメイン;第1の相補的ドメイン;第2の相補的ドメイン;第1の相補的ドメイン配列に相補的な配列を有し、それによって5'-3'方向に第1の相補的ドメインと二本鎖核酸を形成するドメインを含み得る。
ここで、第1の相補的ドメインは、天然の第1の相補的ドメインと相同性を有していてもよいし、天然の第1の相補的ドメインに由来していてもよい。加えて、第1の相補的ドメインは、天然に存在する種に応じて第1の相補的ドメインのヌクレオチド配列に違いを有していてもよく、天然に存在する種に含まれる第1の相補的ドメインに由来していてもよいか、天然に存在する種に含まれる第1の相補的ドメインと部分的または完全な相同性を有していてもよい。
例示的な一実施形態では、第1の相補的ドメインは、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)、カンピロバクター・ジェジュニ(Campylobacter jejuni)、ストレプトコッカス・サーモフィラス(Streptococcus thermophilus)、スタフィロコッカス・アウレウス(Staphylococcus aureus)もしくはナイセリア・メニンギティディス(Neisseria meningitidis)の第1の相補的ドメイン、またはそれらに由来する第1の相補的ドメインと部分的、すなわち少なくとも50%以上、もしくは完全な相同性を有し得る。
たとえば、第1の相補的ドメインが、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)の第1の相補的ドメインまたはそれに由来する第1の相補的ドメインである場合、第1の相補的ドメインは、5'-GUUUUAGAGCUA-3'(SEQ ID NO:296)、または5'-GUUUUAGAGCUA-3'(SEQ ID NO:296)と部分的、すなわち少なくとも50%以上、もしくは完全な相同性を有するヌクレオチド配列であり得る。ここで、第1の相補的ドメインは(X)をさらに含み得、5'-GUUUUAGAGCUA(X)-3'(SEQ ID NO:296)がもたらされる。Xは、塩基A、T、UおよびGからなる群から選択され得、nはヌクレオチドの数を表し得、それは5~15の整数である。ここで、(X)は、同じヌクレオチドのn個の繰り返し、またはA、T、UおよびGのn個のヌクレオチドの混合物であり得る。
別の実施形態では、第1の相補的ドメインがカンピロバクター・ジェジュニ(Campylobacter jejuni)の第1の相補的ドメインまたはそれに由来する第1の相補的ドメインである場合、第1の相補的ドメインは、5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'(SEQ ID NO:297)、または5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'(SEQ ID NO:297)と部分的、すなわち少なくとも50%以上、もしくは完全な相同性を有するヌクレオチド配列であり得る。ここで、第1の相補的ドメインは(X)をさらに含み得、5'-GUUUUAGUCCCUUUUUAAAUUUCUU(X)-3'(SEQ ID NO:297)がもたらされる。Xは、ヌクレオチドA、T、UおよびGからなる群から選択され得、nはヌクレオチドの数を表し得、それは5~15の整数である。ここで、(X)は、同じヌクレオチドのn個の繰り返し、またはA、T、UおよびGのn個のヌクレオチドの混合物を表し得る。
別の実施形態では、第1の相補的ドメインは、Parcubacteria bacterium(GWC2011_GWC2_44_17)、Lachnospiraceae bacterium(MC2017)、Butyrivibrio proteoclasiicus、Peregrinibacteria bacterium(GW2011_GWA_33_10)、Acidaminococcus sp.(BV3L6)、Porphyromonas macacae、Lachnospiraceae bacterium(ND2006)、Porphyromonas crevioricanis、Prevotella disiens、Moraxella bovoculi(237)、Smiihella sp.(SC_KO8D17)、Leptospira inadai、Lachnospiraceae bacterium(MA2020)、Francisella novicida(U112)、Candidatus Methanoplasma termitumもしくはEubacterium eligensの第1の相補的ドメイン、またはそれらに由来する第1の相補的ドメインと部分的、すなわち少なくとも50%以上、もしくは完全な相同性を有し得る。
たとえば、第1の相補的ドメインがParcubacteria bacteriumの第1の相補的ドメインまたはそれに由来する第1の相補的ドメインである場合、第1の相補的ドメインは、5'-UUUGUAGAU-3'(SEQ ID NO:298)、または5'-UUUGUAGAU-3'(SEQ ID NO:298)と部分的、すなわち少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。ここで、第1の相補的ドメインは(X)をさらに含み得、5'-(X)UUUGUAGAU-3'(SEQ ID NO:298)がもたらされる。Xは、ヌクレオチドA、T、UおよびGからなる群から選択され得、nはヌクレオチドの数を表し得、それは1~5の整数である。ここで、(X)は、同じヌクレオチドのn個の繰り返し、またはA、T、UおよびGのn個のヌクレオチドの混合物を表し得る。
ここで、リンカードメインは、第1の相補的ドメインを第2の相補的ドメインに連結するヌクレオチド配列であり得る。
リンカードメインは、第1の相補的ドメインと第2の相補的ドメインのそれぞれと共有結合または非共有結合を形成し得る。
リンカードメインは、共有結合または非共有結合により第1の相補的ドメインを第2の相補的ドメインに連結し得る。
リンカードメインは、一本鎖gRNA分子に使用するのに適しており、リンカードメインを使用して、二本鎖gRNAの第1鎖および第2鎖に連結されるか、共有結合または非共有結合により第1鎖を第2鎖と連結することにより一本鎖gRNAを生成することができる。
リンカードメインを使用して、二本鎖gRNAのcrRNAおよびtracrRNAに連結されるか、共有結合または非共有結合によりcrRNAをtracrRNAと連結することにより一本鎖gRNAを生成することができる。
ここで、第2の相補的ドメインは、天然の第2の相補的ドメインと相同性を有していてもよいし、天然の第2の相補的ドメインに由来していてもよい。加えて、第2の相補的ドメインは、天然に存在する種に従って第2の相補的ドメインのヌクレオチド配列に違いを有していてもよく、天然に存在する種に含まれる第2の相補的ドメインに由来していてもよいか、天然に存在する種に含まれる第2の相補的ドメインと部分的または完全な相同性を有していてもよい。
例示的な一実施形態では、第2の相補的ドメインは、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)、カンピロバクター・ジェジュニ(Campylobacter jejuni)、ストレプトコッカス・サーモフィラス(Streptococcus thermophilus)、スタフィロコッカス・アウレウス(Staphylococcus aureus)もしくはナイセリア・メニンギティディス(Neisseria meningitidis)の第2の相補的ドメイン、またはそれらに由来する第2の相補的ドメインと部分的、すなわち少なくとも50%以上、もしくは完全な相同性を有し得る。
たとえば、第2の相補的ドメインが、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)の第2の相補的ドメインまたはそれに由来する第2の相補的ドメインである場合、第2の相補的ドメインは、5'-UAGCAAGUUAAAAU-3'(SEQ ID NO:299)、または5'-UAGCAAGUUAAAAU-3'(SEQ ID NO:299)(第1の相補的ドメインと二本鎖を形成するヌクレオチド配列には下線が引かれている)と部分的、すなわち少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。ここで、第2の相補的ドメインは、(X)および/または(X)をさらに含み得、5'-(X)UAGCAAGUUAAAAU(X)-3'(SEQ ID NO:299)がもたらされる。Xは、ヌクレオチドA、T、UおよびGからなる群から選択され得、nとmのそれぞれは、ヌクレオチドの数を表し得、ここで、nは1~15の整数であり得、mは1~6の整数であり得る。ここで、(X)は、同じヌクレオチドのn個の繰り返し、またはA、T、UおよびGのn個のヌクレオチドの混合物を表す。加えて、(X)は、同じヌクレオチドのm個の繰り返し、またはA、T、UおよびGのm個のヌクレオチドの混合物を表し得る。
別の例において、第2の相補的ドメインが、カンピロバクター・ジェジュニ(Campylobacter jejuni)の第2の相補的ドメインまたはそれに由来する第2の相補的ドメインである場合、第2の相補的ドメインは、5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'(SEQ ID NO:300)、または5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'(SEQ ID NO:300)(第1の相補的ドメインと二本鎖を形成するヌクレオチド配列には下線が引かれている)と部分的、すなわち少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。ここで、第2の相補的ドメインは、(X)および/または(X)をさらに含み得、5'-(X)AAGAAAUUUAAAAAGGGACUAAAAU(X)(X)-3'(SEQ ID NO:300)がもたらされる。Xは、ヌクレオチドA、T、UおよびGからなる群から選択され得、nとmのそれぞれは、ヌクレオチドの数を表し得、ここで、nは1~15の整数であり得、mは1~6の整数であり得る。ここで、(X)は、同じヌクレオチドのn個の繰り返し、またはA、T、UおよびGのn個のヌクレオチドの混合物を表す。加えて、(X)は、同じヌクレオチドのm個の繰り返し、またはA、T、UおよびGのm個のヌクレオチドの混合物を表し得る。
別の実施形態では、第2の相補的ドメインは、Parcubacteria bacterium(GWC2011_GWC2_44_17)、Lachnospiraceae bacterium(MC2017)、Butyrivibrio proteoclasiicus、Peregrinibacteria bacterium(GW2011_GWA_33_10)、Acidaminococcus sp.(BV3L6)、Porphyromonas macacae、Lachnospiraceae bacterium(ND2006)、Porphyromonas crevioricanis、Prevotella disiens、Moraxella bovoculi(237)、Smiihella sp.(SC_KO8D17)、Leptospira inadai、Lachnospiraceae bacterium(MA2020)、Francisella novicida(U112)、Candidatus Methanoplasma termitumもしくはEubacterium eligensの第2の相補的ドメイン、またはそれらに由来する第2の相補的ドメインと部分的、すなわち少なくとも50%以上、もしくは完全な相同性を有し得る。
たとえば、第2の相補的ドメインがParcubacteria bacteriumの第2の相補的ドメインまたはそれに由来する第2の相補的ドメインである場合、第2の相補的ドメインは、5'-AAAUUUCUACU-3'(SEQ ID NO:301)、または5'-AAAUUUCUACU-3'(SEQ ID NO:301)(第1の相補的ドメインと二本鎖を形成するヌクレオチド配列には下線が引かれている)と部分的、すなわち少なくとも50%以上の相同性を有し得るヌクレオチド配列であり得る。ここで、第2の相補的ドメインは(X)および/または(X)をさらに含み得、5'-(X)AAAUUUCUACU(X)-3'(SEQ ID NO:301)がもたらされる。Xは、ヌクレオチドA、T、UおよびGからなる群から選択され得、nとmのそれぞれは、ヌクレオチドの数を表し得、ここで、nは1~10の整数であり得、mは1~6の整数であり得る。ここで、(X)は、同じヌクレオチドのn個の繰り返し、またはA、T、UおよびGのn個のヌクレオチドの混合物を表す。加えて、(X)は、同じヌクレオチドのm個の繰り返し、またはA、T、UおよびGのm個のヌクレオチドの混合物を表し得る。
ここで、第1の相補的ドメインと第2の相補的ドメインは、互いに相補的に結合し得る。
第1の相補的ドメインと第2の相補的ドメインは、相補的結合により二本鎖を形成し得る。
形成された二本鎖は、CRISPR酵素と相互作用し得る。
任意に、第1の相補的ドメインは、第2鎖の第2の相補的ドメインに相補的に結合しない追加のヌクレオチド配列を含み得る。
ここで、追加のヌクレオチド配列は、1~15ヌクレオチド配列であり得る。たとえば、追加のヌクレオチド配列は、1~5、5~10または10~15ヌクレオチド配列であり得る。
ここで、近位ドメインは、第2の相補的ドメインの3'端方向に位置するドメインであり得る。
近位ドメインは、天然の近位ドメインと相同性を有していてもよいし、天然の近位ドメインに由来していてもよい。加えて、近位ドメインは、天然に存在する種に従ってヌクレオチド配列に違いを有していてもよく、天然に存在する種に含まれる近位ドメインに由来していてもよいか、天然に存在する種に含まれる近位ドメインと部分的または完全な相同性を有していてもよい。
例示的な一実施形態では、近位ドメインは、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)、カンピロバクター・ジェジュニ(Campylobacter jejuni)、ストレプトコッカス・サーモフィラス(Streptococcus thermophilus)、スタフィロコッカス・アウレウス(Staphylococcus aureus)もしくはナイセリア・メニンギティディス(Neisseria meningitidis)の近位ドメイン、またはそれらに由来する近位ドメインと部分的、すなわち少なくとも50%以上、もしくは完全な相同性を有し得る。
たとえば、近位ドメインが、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)の近位ドメインまたはそれに由来する近位ドメインである場合、近位ドメインは、5'-AAGGCUAGUCCG-3'(SEQ ID NO:302)、または5'-AAGGCUAGUCCG-3'(SEQ ID NO:302)と部分的、すなわち少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。ここで、近位ドメインは、(X)をさらに含み得、5'-AAGGCUAGUCCG(X)-3'(SEQ ID NO:302)がもたらされる。Xは、ヌクレオチドA、T、UおよびGからなる群から選択され得、nはヌクレオチドの数を表し得、それは1~15の整数である。ここで、(X)は、同じヌクレオチドのn個の繰り返し、またはA、T、UおよびGのn個のヌクレオチドの混合物を表す。
さらに別の例では、近位ドメインが、カンピロバクター・ジェジュニ(Campylobacter jejuni)の近位ドメインまたはそれに由来する近位ドメインである場合、近位ドメインは、5'-AAAGAGUUUGC-3'(SEQ ID NO:303)、または5'-AAAGAGUUUGC-3'(SEQ ID NO:303)と部分的、すなわち少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。ここで、近位ドメインは、(X)をさらに含み得、5'-AAAGAGUUUGC(X)-3'(SEQ ID NO:303)がもたらされる。Xは、ヌクレオチドA、T、UおよびGからなる群から選択され得、nはヌクレオチドの数を表し得、それは1~40の整数である。ここで、(X)は、同じヌクレオチドのn個の繰り返し、またはA、T、UおよびGのn個のヌクレオチドの混合物を表す。
ここで、テールドメインは、一本鎖gRNAの3'末端または二本鎖gRNAの第1の鎖または第2鎖に選択的に付加され得るドメインである。
テールドメインは、天然のテールドメインと相同性を有していてもよいし、天然のテールドメインに由来していてもよい。加えて、テールドメインは、天然に存在する種に従ってヌクレオチド配列に違いを有していてもよく、天然に存在する種に含まれるテールドメインに由来していてもよいか、天然に存在する種に含まれるテールドメインと部分的または完全な相同性を有していてもよい。
例示的な一実施形態では、テールドメインは、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)、カンピロバクター・ジェジュニ(Campylobacter jejuni)、ストレプトコッカス・サーモフィラス(Streptococcus thermophilus)、スタフィロコッカス・アウレウス(Staphylococcus aureus)もしくはナイセリア・メニンギティディス(Neisseria meningitidis)のテールドメイン、またはそれらに由来するテールドメインと部分的、すなわち少なくとも50%以上、もしくは完全な相同性を有し得る。
たとえば、テールドメインが、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)のテールドメインまたはそれに由来するテールドメインである場合、テールドメインは、5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'(SEQ ID NO:304)、または5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'(SEQ ID NO:304)と部分的、すなわち少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。ここで、テールドメインは、(X)をさらに含み得、5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(X)-3'(SEQ ID NO:304)がもたらされる。Xは、ヌクレオチドA、T、UおよびGからなる群から選択され得、nはヌクレオチドの数を表し得、それは1~15の整数である。ここで、(X)は、同じヌクレオチドのn個の繰り返し、またはA、T、UおよびGのn個のヌクレオチドの混合物を表す。
別の例では、テールドメインが、カンピロバクター・ジェジュニ(Campylobacter jejuni)のテールドメインまたはそれに由来するテールドメインである場合、テールドメインは、5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'(SEQ ID NO:305)、または5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'(SEQ ID NO:305)と部分的、すなわち少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。ここで、テールドメインは、(X)をさらに含み得、5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU(X)-3'(SEQ ID NO:305)がもたらされる。Xは、ヌクレオチドA、T、UおよびGからなる群から選択され得、nはヌクレオチドの数を表し得、それは1~15の整数である。ここで、(X)は、同じヌクレオチドのn個の繰り返し、またはA、T、UおよびGのn個のヌクレオチドの混合物を表す。
別の実施形態では、テールドメインは、in vitroまたはin vivo転写方法に関与する3'末端に1~10ntの配列を含み得る。
たとえば、T7プロモーターがgRNAのin vitro転写に使用される場合、テールドメインはDNAテンプレートの3'末端に存在する任意のヌクレオチド配列であり得る。加えて、U6プロモーターがin vivo転写で使用される場合、テールドメインはUUUUUUであり得、H1プロモーターが転写で使用される場合、テールドメインはUUUUであり得、pol-IIIプロモーターが使用される場合、テールドメインは、いくつかのウラシルヌクレオチドまたは代替ヌクレオチドを含み得る。
gRNAは、上記のように複数のドメインを含み得るため、核酸配列の長さは、gRNAに含まれるドメインに従って調節され、相互作用は、各ドメインに基づき、gRNAの三次元構造の鎖もしくは活性型において、またはこれらの鎖間で起こり得る。
gRNAは、一本鎖gRNA(単一RNA分子);または二本鎖gRNA(2つ以上、一般には2つの別個のRNA分子を含む)と呼ばれ得る。
二本鎖gRNA
二本鎖gRNAは、第1鎖と第2鎖からなる。
ここで、第1鎖は、
5'-[ガイドドメイン]-[第1の相補的ドメイン]-3'からなり、
第2鎖は、5'-[第2の相補的ドメイン]-[近位ドメイン]-3'または
5'-[第2の相補的ドメイン]-[近位ドメイン]-[テールドメイン]-3'
からなる。
ここで、第1鎖はcrRNAと呼ばれ得、第2鎖はtracrRNAと呼ばれ得る。
ここで、第1鎖と第2鎖は、追加のヌクレオチド配列を任意に含み得る。
一例では、第1鎖は、
5'-(Ntarget)-(Q)-3';または
5'-(X)-(Ntarget)-(X)-(Q)-(X)-3'であり得る。
ここで、Ntargetは、標的遺伝子の転写調節領域内の核酸の二本鎖のいずれかの鎖の部分配列に相補的なヌクレオチド配列であり、標的遺伝子の転写調節領域内の核酸上の標的配列に従って変化し得るヌクレオチド配列領域である。
ここで、(Q)は、第2鎖の第2の相補的ドメインと相補的な結合を形成することができる第1の相補的ドメインを含むヌクレオチド配列である。(Q)は、天然に存在する種の第1の相補的ドメインと部分的または完全な相同性を有する配列であり得、第1の相補的ドメインのヌクレオチド配列は、種の起源に応じて変化し得る。Qは、A、U、CおよびGからなる群からそれぞれ独立して選択され得、mはヌクレオチドの数であり得、それは5~35の整数である。
たとえば、第1の相補的ドメインが、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)の第1の相補的ドメインまたはストレプトコッカス・ピオゲネス(Streptococcus pyogenes)由来の第1の相補的ドメインと部分的または完全な相同性を有する場合、(Q)は、5'-GUUUUAGAGCUA-3'(SEQ ID NO:296)、または5'-GUUUUAGAGCUA-3'(SEQ ID NO:296)と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
別の例では、第1の相補的ドメインが、カンピロバクター・ジェジュニ(Campylobacter jejuni)の第1の相補的ドメインまたはカンピロバクター・ジェジュニ(Campylobacter jejuni)由来の第1の相補的ドメインと部分的または完全な相同性を有する場合、(Q)は、5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'(SEQ ID NO:297)、または5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'(SEQ ID NO:297)と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
さらに別の例では、第1の相補的ドメインが、ストレプトコッカス・サーモフィラス(Streptococcus thermophilus)の第1の相補的ドメインまたはストレプトコッカス・サーモフィラス(Streptococcus thermophilus)由来の第1の相補的ドメインと部分的または完全な相同性を有する場合、(Q)は、5'-GUUUUAGAGCUGUGUUGUUUCG-3'(SEQ ID NO:306)、または5'-GUUUUAGAGCUGUGUUGUUUCG-3'(SEQ ID NO:306)と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
加えて、(X)、(X)および(X)のそれぞれは、選択的に追加のヌクレオチド配列であり、ここで、Xは、A、U、CおよびGからなる群からそれぞれ独立して選択され、a、bおよびcのそれぞれは、ヌクレオチドの数であり得、それは0または1~20の整数である。
例示的な一実施形態では、第2鎖は5'-(Z)-(P)-3';または5'-(X)-(Z)-(X)-(P)-(X)-3'であり得る。
別の実施形態では、第2鎖は、5'-(Z)-(P)-(F)-3';または5'-(X)-(Z)-(X)-(P)-(X)-(F)-3'であり得る。
ここで、(Z)は、第1鎖の第1の相補的ドメインと相補的な結合を形成することができる第2の相補的ドメインを含むヌクレオチド配列である。(Z)は、天然に存在する種の第2の相補的ドメインと部分的または完全な相同性を有する配列であり得、第2の相補的ドメインのヌクレオチド配列は、種の起源に応じて修飾され得る。Zは、A、U、CおよびGからなる群からそれぞれ独立して選択され得、hはヌクレオチドの数であり得、それは5~50の整数である。
たとえば、第2の相補的ドメインがストレプトコッカス・ピオゲネス(Streptococcus pyogenes)の第2の相補的ドメインまたはそれに由来する第2の相補的ドメインと部分的または完全な相同性を有する場合、(Z)は、5'-UAGCAAGUUAAAAU-3'(SEQ ID NO:299)、または5'-UAGCAAGUUAAAAU-3'(SEQ ID NO:299)と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
別の例では、第2の相補的ドメインがカンピロバクター・ジェジュニ(Campylobacter jejuni)の第2の相補的ドメインまたはそれに由来する第2の相補的ドメインと部分的または完全な相同性を有する場合、(Z)は、5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'(SEQ ID NO:300)、または5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'(SEQ ID NO:300)と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
さらに別の例では、第2の相補的ドメインがストレプトコッカス・サーモフィラス(Streptococcus thermophilus)の第2の相補的ドメインまたはそれに由来する第2の相補的ドメインと部分的または完全な相同性を有する場合、(Z)は、5'-CGAAACAACACAGCGAGUUAAAAU-3'(SEQ ID NO:307)、または5'-CGAAACAACACAGCGAGUUAAAAU-3'(SEQ ID NO:307)と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
(P)は、天然に存在する種の近位ドメインと部分的または完全な相同性を有し得る近位ドメインを含むヌクレオチド配列であり、近位ドメインのヌクレオチド配列は、種の起源に応じて修飾され得る。 Pは、A、U、CおよびGからなる群からそれぞれ独立して選択され得、kは、1~20の整数であるヌクレオチドの数であり得る。
たとえば、近位ドメインがストレプトコッカス・ピオゲネス(Streptococcus pyogenes)の近位ドメインまたはそれに由来する近位ドメインと部分的または完全な相同性を有する場合、(P)は、5'-AAGGCUAGUCCG-3'(SEQ ID NO:302)、または5'-AAGGCUAGUCCG-3'(SEQ ID NO:302)と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
別の例では、近位ドメインがカンピロバクター・ジェジュニ(Campylobacter jejuni)の近位ドメインまたはそれに由来する近位ドメインと部分的または完全な相同性を有する場合、(P)は、5'-AAAGAGUUUGC-3'(SEQ ID NO:303)、または5'-AAAGAGUUUGC-3'(SEQ ID NO:303)と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
さらに別の例では、近位ドメインがストレプトコッカス・サーモフィラス(Streptococcus thermophilus)の近位ドメインまたはそれに由来する近位ドメインと部分的または完全な相同性を有する場合、(P)は、5'-AAGGCUUAGUCCG-3'(SEQ ID NO:308)、または5'-AAGGCUUAGUCCG-3'(SEQ ID NO:308)と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
(F)は、テールドメインを含み、天然に存在する種のテールドメインと部分的または完全な相同性を有するヌクレオチド配列であり得、テールドメインのヌクレオチド配列は、種の起源に応じて修飾され得る。Fは、A、U、CおよびGからなる群からそれぞれ独立して選択されてもよく、iはヌクレオチドの数であり得、それは1~50の整数である。
たとえば、テールドメインがストレプトコッカス・ピオゲネス(Streptococcus pyogenes)のテールドメインまたはそれに由来するテールドメインと部分的または完全な相同性を有する場合、(F)は、5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'(SEQ ID NO:304)、または5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'(SEQ ID NO:304)と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
別の例では、テールドメインがカンピロバクター・ジェジュニ(Campylobacter jejuni)のテールドメインまたはそれに由来するテールドメインと部分的または完全な相同性を有する場合、(F)は、5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'(SEQ ID NO:305)、または5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'(SEQ ID NO:305)と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
さらに別の例では、テールドメインがストレプトコッカス・サーモフィラス(Streptococcus thermophilus)のテールドメインまたはそれに由来するテールドメインと部分的または完全な相同性を有する場合、(F)は、5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'(SEQ ID NO:309)、または5'- UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'(SEQ ID NO:309)と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
加えて、(F)は、in vitroまたはin vivo転写法に関与する3'末端に1~10ヌクレオチド配列を含み得る。
たとえば、T7プロモーターがgRNAのin vitro転写に使用される場合、テールドメインはDNAテンプレートの3'末端に存在する任意のヌクレオチド配列であり得る。加えて、U6プロモーターがin vivo転写で使用される場合、テールドメインはUUUUUUであり得、H1プロモーターが転写で使用される場合、テールドメインはUUUUであり得、pol-IIIプロモーターが使用される場合、テールドメインは、いくつかのウラシルヌクレオチドまたは代替ヌクレオチドを含み得る。
加えて、(X)、(X)および(X)は、選択的に追加されるヌクレオチド配列であり得、Xは、A、U、CおよびGからなる群からそれぞれ独立して選択され、d、eおよびfのそれぞれは、ヌクレオチドの数であり得、それは0または1~20の整数である。
一本鎖gRNA
一本鎖gRNAは、第1の一本鎖gRNAと第2の一本鎖gRNAに分類され得る。
第1の一本鎖gRNA
第1の一本鎖gRNAは、二本鎖gRNAの第1鎖または第2鎖がリンカードメインにより連結されている一本鎖gRNAである。
具体的には、一本鎖gRNAは、
5'-[ガイドドメイン]-[第1の相補的ドメイン]-[リンカードメイン]-[第2の相補的ドメイン]-3'、
5'-[ガイドドメイン]-[第1の相補的ドメイン]-[リンカードメイン]-[第2の相補的ドメイン]-[近位ドメイン]-3'または
5'-[ガイドドメイン]-[第1の相補的ドメイン]-[リンカードメイン]-[第2の相補的ドメイン]-[近位ドメイン]-[テールドメイン]-3'
からなり得る。
第1の一本鎖gRNAは、追加のヌクレオチド配列を選択的に含み得る。
例示的な一実施形態では、第1の一本鎖gRNAは、
5'-(Ntarget)-(Q)-(L)-(Z)-3';
5'-(Ntarget)―(Q)-(L)-(Z)-(P)-3';または
5'-(Ntarget)―(Q)-(L)-(Z)-(P)-(F)-3'
であり得る。
別の実施形態では、一本鎖gRNAは、
5'-(X)-(Ntarget)-(X)-(Q)-(X)-(L)-(X)-(Z)-(X)-3';
5'-(X)-(Ntarget)-(X)-(Q)-(X)-(L)-(X)-(Z)-(X)-(P)-(X)-3';または
5'-(X)-(Ntarget)-(X)-(Q)-(X)-(L)-(X)-(Z)-(X)-(P)-(X)-(F)-3'
であり得る。
ここで、Ntargetは、標的遺伝子の転写調節領域内の核酸の二本鎖のいずれかの鎖の部分配列に相補的なヌクレオチド配列であり、標的遺伝子の転写調節領域内の核酸上の標的配列に従って変化し得るヌクレオチド配列領域である。
ここで、(Q)は、第2の相補的ドメインと相補的な結合を形成することができる第1の相補的ドメインを含むヌクレオチド配列を含む。(Q)は、天然に存在する種の第1の相補的ドメインと部分的または完全な相同性を有する配列であり得、第1の相補的ドメインのヌクレオチド配列は、種の起源に応じて変化し得る。Qは、A、U、CおよびGからなる群からそれぞれ独立して選択され得、mはヌクレオチドの数であり得、それは5~35の整数である。
たとえば、第1の相補的ドメインが、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)の第1の相補的ドメインまたはそれに由来する第1の相補的ドメインと部分的または完全な相同性を有する場合、(Q)は、5'-GUUUUAGAGCUA-3'(SEQ ID NO:296)、または5'-GUUUUAGAGCUA-3'(SEQ ID NO:296)と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
別の例では、第1の相補的ドメインが、カンピロバクター・ジェジュニ(Campylobacter jejuni)の第1の相補的ドメインまたはそれに由来する第1の相補的ドメインと部分的または完全な相同性を有する場合、(Q)は、5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'(SEQ ID NO:297)、または5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'(SEQ ID NO:297)と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
さらに別の例では、第1の相補的ドメインが、ストレプトコッカス・サーモフィラス(Streptococcus thermophilus)の第1の相補的ドメインまたはそれに由来する第1の相補的ドメインと部分的または完全な相同性を有する場合、(Q)は、5'-GUUUUAGAGCUGUGUUGUUUCG-3'(SEQ ID NO:306)、または5'-GUUUUAGAGCUGUGUUGUUUCG-3'(SEQ ID NO:306)と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
加えて、(L)は、リンカードメインを含むヌクレオチド配列であり、第1の相補的ドメインを第2の相補的ドメインに連結し、それによって一本鎖gRNAを生成する。ここで、Lは、A、U、CおよびGからなる群からそれぞれ独立して選択され得、jは、1~30の整数であるヌクレオチドの数であり得る。
(Z)は、第2の相補的ドメインを含むヌクレオチド配列であり、第1の相補的ドメインと相補的に結合することができるヌクレオチド配列を含む。(Z)は、天然に存在する種の第2の相補的ドメインと部分的または完全な相同性を有する配列であり得、第2の相補的ドメインのヌクレオチド配列は、種の起源に応じて改変され得る。Zは、A、U、CおよびGからなる群からそれぞれ独立して選択され得、hはヌクレオチドの数であり得、それは5~50の整数である。
たとえば、第2の相補的ドメインがストレプトコッカス・ピオゲネス(Streptococcus pyogenes)の第2の相補的ドメインまたはそれに由来する第2の相補的ドメインと部分的または完全な相同性を有する場合、(Z)は、5'-UAGCAAGUUAAAAU-3'(SEQ ID NO:299)、または5'-UAGCAAGUUAAAAU-3'(SEQ ID NO:299)と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
別の例では、第2の相補的ドメインがカンピロバクター・ジェジュニ(Campylobacter jejuni)の第2の相補的ドメインまたはそれに由来する第2の相補的ドメインと部分的または完全な相同性を有する場合、(Z)は、5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'(SEQ ID NO:300)、または5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'(SEQ ID NO:300)と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
さらに別の例では、第2の相補的ドメインがストレプトコッカス・サーモフィラス(Streptococcus thermophilus)の第2の相補的ドメインまたはそれに由来する第2の相補的ドメインと部分的または完全な相同性を有する場合、(Z)は、5'-CGAAACAACACAGCGAGUUAAAAU-3'(SEQ ID NO:307)、または5'-CGAAACAACACAGCGAGUUAAAAU-3'(SEQ ID NO:307)と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
(P)は、天然に存在する種の近位ドメインと部分的または完全な相同性を有し得る近位ドメインを含むヌクレオチド配列であり、近位ドメインのヌクレオチド配列は、種の起源に応じて修飾され得る。Pは、A、U、CおよびGからなる群からそれぞれ独立して選択され得、kは、1~20の整数であるヌクレオチドの数であり得る。
たとえば、近位ドメインがストレプトコッカス・ピオゲネス(Streptococcus pyogenes)の近位ドメインまたはそれに由来する近位ドメインと部分的または完全な相同性を有する場合、(P)は、5'-AAGGCUAGUCCG-3'(SEQ ID NO:302)、または5'-AAGGCUAGUCCG-3'(SEQ ID NO:302)と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
別の例では、近位ドメインがカンピロバクター・ジェジュニ(Campylobacter jejuni)の近位ドメインまたはそれに由来する近位ドメインと部分的または完全な相同性を有する場合、(P)は、5'-AAAGAGUUUGC-3'(SEQ ID NO:303)、または5'-AAAGAGUUUGC-3'(SEQ ID NO:303)と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
さらに別の例では、近位ドメインがストレプトコッカス・サーモフィラス(Streptococcus thermophilus)の近位ドメインまたはそれに由来する近位ドメインと部分的または完全な相同性を有する場合、(P)は、5'-AAGGCUUAGUCCG-3'(SEQ ID NO:308)、または5'-AAGGCUUAGUCCG-3'(SEQ ID NO:308)と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
(F)は、テールドメインを含み、天然に存在する種のテールドメインと部分的または完全な相同性を有するヌクレオチド配列であり得、テールドメインのヌクレオチド配列は、種の起源に応じて修飾され得る。Fは、A、U、CおよびGからなる群からそれぞれ独立して選択されてもよく、iはヌクレオチドの数であり得、それは1~50の整数である。
たとえば、テールドメインがストレプトコッカス・ピオゲネス(Streptococcus pyogenes)のテールドメインまたはそれに由来するテールドメインと部分的または完全な相同性を有する場合、(F)は、5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'(SEQ ID NO:304)、または5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3' (SEQ ID NO:304)と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
別の例では、テールドメインがカンピロバクター・ジェジュニ(Campylobacter jejuni)のテールドメインまたはそれに由来するテールドメインと部分的または完全な相同性を有する場合、(F)は、5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'(SEQ ID NO:305)、または5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'(SEQ ID NO:305)と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
さらに別の例では、テールドメインがストレプトコッカス・サーモフィラス(Streptococcus thermophilus)のテールドメインまたはそれに由来するテールドメインと部分的または完全な相同性を有する場合、(F)は、5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'(SEQ ID NO:309)、または5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'(SEQ ID NO:309)と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
加えて、(F)は、in vitroまたはin vivo転写法に関与する3'末端に1~10ヌクレオチド配列を含み得る。
たとえば、T7プロモーターがgRNAのin vitro転写に使用される場合、テールドメインはDNAテンプレートの3'末端に存在する任意のヌクレオチド配列であり得る。加えて、U6プロモーターがin vivo転写で使用される場合、テールドメインはUUUUUUであり得、H1プロモーターが転写で使用される場合、テールドメインはUUUUであり得、pol-IIIプロモーターが使用される場合、テールドメインは、いくつかのウラシルヌクレオチドまたは代替ヌクレオチドを含み得る。
加えて、(X)、(X)、(X)、(X)、(X)および(X)は、選択的に追加されるヌクレオチド配列であり得、ここで、Xは、A、U、CおよびGからなる群からそれぞれ独立して選択され、a、b、c、d、eおよびfのそれぞれは、ヌクレオチドの数であり得、それは0または1~20の整数である。
第2の一本鎖gRNA
第2の一本鎖gRNAは、ガイドドメイン、第1の相補的ドメインおよび第2の相補的ドメインからなる一本鎖gRNAであり得る。
ここで、第2の一本鎖gRNAは、以下のものからなり得る:
5'-[第2の相補的ドメイン]-[第1の相補的ドメイン]-[ガイドドメイン]-3';または
5'-[第2の相補的ドメイン]-[リンカードメイン]-[第1の相補的ドメイン]-[ガイドドメイン]-3'。
第2の一本鎖gRNAは、追加のヌクレオチド配列を選択的に含み得る。
例示的な一実施形態では、第2の一本鎖gRNAは、
5'-(Z)-(Q)-(Ntarget)-3';または
5'-(X)-(Z)-(X)-(Q)-(X)-(Ntarget)―3'であり得る。
別の実施形態では、一本鎖gRNAは、
5'-(Z)-(L)-(Q)-(Ntarget)-3';または
5'-(X)-(Z)-(L)-(Q)-(X)-(Ntarget)―3'であり得る。
ここで、Ntargetは、標的遺伝子の転写調節領域内の核酸の二本鎖のいずれかの鎖の部分配列に相補的なヌクレオチド配列であり、標的遺伝子の転写調節領域上の標的配列に従って変化することができるヌクレオチド配列領域である。(Q)は、第1の相補的ドメインを含むヌクレオチド配列であり、第2の相補的ドメインと相補的に結合することができるヌクレオチド配列を含む。(Q)は、天然に存在する種の第1の相補的ドメインと部分的または完全な相同性を有する配列であり得、第1の相補的ドメインのヌクレオチド配列は、種の起源に応じて変化し得る。Qは、A、U、CおよびGからなる群からそれぞれ独立して選択され得、mはヌクレオチドの数であり得、それは5~35の整数である。
たとえば、第1の相補的ドメインが、Parcubacteria bacteriumの第1の相補的ドメインまたはそれに由来する第1の相補的ドメインと部分的または完全な相同性を有する場合、(Q)は、5'-UUUGUAGAU-3'(SEQ ID NO:298)、または5'-UUUGUAGAU-3'(SEQ ID NO:298)と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
(Z)は、第2の相補的ドメインを含むヌクレオチド配列であり、第2の相補的ドメインと相補的に結合することができるヌクレオチド配列を含む。(Z)は、天然に存在する種の第2の相補的ドメインと部分的または完全な相同性を有する配列であり得、第2の相補的ドメインのヌクレオチド配列は、種の起源に応じて修飾され得る。Zは、A、U、CおよびGからなる群からそれぞれ独立して選択され得、mはヌクレオチドの数であり得、それは5~50の整数である。
たとえば、第2の相補的ドメインが、Parcubacteria bacteriumの第2の相補的ドメイン、またはParcubacteria bacterium由来の第2の相補的ドメインと部分的または完全な相同性を有する場合、(Z)は、5'-AAAUUUCUACU-3'(SEQ ID NO:301)、または5'-AAAUUUCUACU-3'(SEQ ID NO:301)と少なくとも50%以上の相同性を有するヌクレオチド配列であり得る。
加えて、(L)は、リンカードメインを含むヌクレオチド配列であり、それは第1の相補的ドメインを第2の相補的ドメインに連結する。ここで、Lは、A、U、CおよびGからなる群からそれぞれ独立して選択され得、jは、1~30の整数であるヌクレオチドの数であり得る。
加えて、(X)、(X)および(X)の各々は、選択的に追加されるヌクレオチド配列であり得、ここで、Xは、A、U、CおよびGからなる群からそれぞれ独立して選択され、a、bおよびcは、ヌクレオチドの数であり得、それは0または1~20の整数である。本明細書の例示的な一実施形態では、ガイド核酸は、重複遺伝子の転写調節領域内の標的配列に相補的に結合するgRNAであり得る。
「標的配列」とは、標的遺伝子の転写調節領域に存在するヌクレオチド配列であり、具体的には、標的遺伝子の転写調節領域内の標的領域の部分ヌクレオチド配列であり、ここで、「標的領域」とは、標的遺伝子の転写調節領域内のガイド核酸エディタータンパク質によって修飾され得る領域である。
以下、標的配列は、2種類のヌクレオチド配列情報の両方を指すために使用され得る。たとえば、標的遺伝子の場合、標的配列は、標的遺伝子DNAの転写鎖のヌクレオチド配列情報、または非転写鎖のヌクレオチド配列情報を指し得る。
たとえば、標的配列は、標的遺伝子Aの標的領域内の部分ヌクレオチド配列(転写鎖)、すなわち5'-ATCATTGGCAGACTAGTTCG-3'(SEQ ID NO:310)と、それに相補的なヌクレオチド配列(非転写鎖)、すなわち5'-CGAACTAGTCTGCCAATGAT-3'(SEQ ID NO:310)を指し得る。
標的配列は、5~50nt配列であり得る。
例示的な一実施形態では、標的配列は、16ヌクレオチド配列、17ヌクレオチド配列、18ヌクレオチド配列、19ヌクレオチド配列、20ヌクレオチド配列、21ヌクレオチド配列、22ヌクレオチド配列、23ヌクレオチド配列、24ヌクレオチド配列または25ヌクレオチド配列であり得る。
標的配列は、ガイド核酸結合配列またはガイド核酸非結合配列を含む。
「ガイド核酸結合配列」とは、ガイド核酸のガイドドメインに含まれるガイド配列と部分的または完全な相補性を有するヌクレオチド配列であり、ガイド核酸のガイドドメインに含まれるガイド配列と相補的に結合していてもよい。標的配列およびガイド核酸結合配列は、標的遺伝子の転写調節領域に応じて遺伝子改変または編集される標的に従って変化し得るヌクレオチド配列であり得、標的遺伝子の転写調節領域内の核酸配列に従ってさまざまな手法で設計され得る。
「ガイド核酸非結合配列」とは、ガイド核酸のガイドドメインに含まれるガイド配列と部分的または完全な相同性を有するヌクレオチド配列であり、ガイド核酸のガイドドメインに含まれるガイド配列と相補的に結合していなくてもよい。加えて、ガイド核酸非結合配列は、ガイド核酸結合配列と相補性を有するヌクレオチド配列であり得、ガイド核酸結合配列と相補的に結合していてもよい。
ガイド核酸結合配列は、標的配列の部分ヌクレオチド配列と、標的配列に含まれる互いに異なる配列順序を有する2つのヌクレオチド配列のうちの1つのヌクレオチド配列、すなわち、互いに相補的に結合することができる2つのヌクレオチド配列のうちの1つであり得る。ここで、ガイド核酸非結合配列は、標的配列のガイド核酸結合配列以外のヌクレオチド配列であり得る。
たとえば、標的遺伝子Aの転写調節領域内の標的領域の部分ヌクレオチド配列、すなわち5'-ATCATTGGCAGACTAGTTCG-3'(SEQ ID NO:310)と、ヌクレオチド配列、すなわち、それに相補的である5'-CGAACTAGTCTGCCAATGAT-3'(SEQ ID NO:311)が標的配列として使用される場合、ガイド核酸結合配列は、2つの標的配列、すなわち5'-ATCATTGGCAGACTAGTTCG-3'(SEQ ID NO:310)または5'-CGAACTAGTCTGCCAATGAT-3'(SEQ ID NO:311)のうちの1つであり得る。ここで、ガイド核酸結合配列が5'-ATCATTGGCAGACTAGTTCG-3'(SEQ ID NO:310)である場合、ガイド核酸非結合配列は5'-CGAACTAGTCTGCCAATGAT-3'(SEQ ID NO:311)であり得、ガイド核酸結合配列が5'-CGAACTAGTCTGCCAATGAT-3'(SEQ ID NO:311)である場合、ガイド核酸非結合配列は5'-ATCATTGGCAGACTAGTTCG-3'(SEQ ID NO:310)であり得る。
ガイド核酸結合配列は、標的配列の1つ、すなわち、転写鎖と同じヌクレオチド配列および非転写鎖と同じヌクレオチド配列であり得る。ここで、ガイド核酸非結合配列は、標的配列のガイド核酸結合配列以外のヌクレオチド配列、すなわち、転写鎖と同じヌクレオチド配列および非転写鎖と同じであるヌクレオチド配列から選択されるものであり得る。
ガイド核酸結合配列は、標的配列と同じ長さを有し得る。
ガイド核酸非結合配列は、標的配列またはガイド核酸結合配列と同じ長さを有し得る。
ガイド核酸結合配列は、5~50ヌクレオチド配列であり得る。
例示的な一実施形態では、ガイド核酸結合配列は、16ヌクレオチド配列、17ヌクレオチド配列、18ヌクレオチド配列、19ヌクレオチド配列、20ヌクレオチド配列、21ヌクレオチド配列、22ヌクレオチド配列、23ヌクレオチド配列、24ヌクレオチド配列または25ヌクレオチド配列であり得る。
ガイド核酸非結合配列は、5~50ヌクレオチド配列であり得る。
例示的な一実施形態では、ガイド核酸非結合配列は、16ヌクレオチド配列、17ヌクレオチド配列、18ヌクレオチド配列、19ヌクレオチド配列、20ヌクレオチド配列、21ヌクレオチド配列、22ヌクレオチド配列、23ヌクレオチド配列、24ヌクレオチド配列または25ヌクレオチド配列であり得る。
ガイド核酸結合配列は、ガイド核酸のガイドドメインに含まれるガイド配列に部分的または完全に相補的に結合してもよく、ガイド核酸結合配列の長さは、ガイド配列の長さと同じであり得る。
ガイド核酸結合配列は、ガイド核酸のガイドドメインに含まれるガイド配列に相補的なヌクレオチド配列、たとえば、少なくとも70%、75%、80%、85%、90%、95%以上の相補性または完全な相補性を有するヌクレオチド配列であり得る。
一例として、ガイド核酸結合配列は、ガイド核酸のガイドドメインに含まれるガイド配列に相補的ではない1~8ヌクレオチド配列を有していても、含んでいてもよい。
ガイド核酸非結合配列は、ガイド核酸のガイドドメインに含まれるガイド配列と部分的または完全な相同性を有してもよく、ガイド核酸非結合配列の長さはガイド配列の長さと同じであり得る。
ガイド核酸非結合配列は、ガイド核酸のガイドドメインに含まれるガイド配列と相同性を有するヌクレオチド配列、たとえば、少なくとも70%、75%、80%、85%、90%、95%以上の相同性または完全な相同性を有するヌクレオチド配列であり得る。
一例では、ガイド核酸非結合配列は、ガイド核酸のガイドドメインに含まれるガイド配列と相同ではない1~8ヌクレオチド配列を有していても含んでいてもよい。
ガイド核酸非結合配列は、ガイド核酸結合配列と相補的に結合してもよく、ガイド核酸非結合配列は、ガイド核酸結合配列と同じ長さを有していてもよい。
ガイド核酸非結合配列は、ガイド核酸結合配列に相補的なヌクレオチド配列、たとえば、少なくとも90%、95%以上の相補性または完全な相補性を有するヌクレオチド配列であり得る。
一例では、ガイド核酸非結合配列は、ガイド核酸結合配列に相補的ではない1~2ヌクレオチド配列を有しても含んでいてもよい。
加えて、ガイド核酸結合配列は、エディタータンパク質によって認識されるヌクレオチド配列の付近に位置するヌクレオチド配列であり得る。
一例では、ガイド核酸結合配列は、エディタータンパク質によって認識されるヌクレオチド配列の5'末端および/または3'末端に隣接して位置する連続した5~50ヌクレオチド配列であり得る。
加えて、ガイド核酸非結合配列は、エディタータンパク質によって認識されるヌクレオチド配列の付近に位置するヌクレオチド配列であり得る。
一例では、ガイド核酸非結合配列は、エディタータンパク質によって認識されるヌクレオチド配列の5'末端および/または3'末端に隣接して位置する連続した5~50ヌクレオチド配列であり得る。
「ターゲティング」とは、標的遺伝子の転写調節領域に存在する標的配列のガイド核酸結合配列との相補的結合を指す。ここで、相補的結合は、100%完全な相補的結合、または70%以上100%未満の不完全な相補的結合であり得る。したがって、「ターゲティングgRNA」とは、標的遺伝子の転写調節領域に存在する標的配列のガイド核酸結合配列に相補的に結合するgRNAを指す。
本明細書に開示される標的遺伝子は、重複遺伝子であり得る。
本明細書に開示される標的遺伝子は、PMP22遺伝子、PLP1遺伝子、MECP2遺伝子、SOX3遺伝子、RAI1遺伝子、TBX1遺伝子、ELN遺伝子、JAGGED1遺伝子、NSD1遺伝子、MMP23遺伝子、LMB1遺伝子、SNCA遺伝子および/またはAPP遺伝子であり得る。
本明細書に開示される標的遺伝子は、癌遺伝子であり得る。
ここで、癌遺伝子は、MYC遺伝子、ERBB2(HER2)遺伝子、CCND1(サイクリンD1)遺伝子、FGFR1遺伝子、FGFR2遺伝子、HRAS遺伝子、KRAS遺伝子、MYB遺伝子、MDM2遺伝子、 CCNE(サイクリンE)遺伝子、MET遺伝子、CDK4遺伝子、ERBB1遺伝子、MYCN遺伝子および/またはAKT2遺伝子であり得る。
例示的な実施形態では、本明細書で開示される標的配列は、重複遺伝子のプロモーター領域に位置する連続した10~35ヌクレオチド配列であり得る。
ここで、重複遺伝子は、PMP22遺伝子、PLP1遺伝子、MECP2遺伝子、SOX3遺伝子、RAI1遺伝子、TBX1遺伝子、ELN遺伝子、JAGGED1遺伝子、NSD1遺伝子、MMP23遺伝子、LMB1遺伝子、SNCA遺伝子およびAPP遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
あるいは、重複遺伝子は、MYC遺伝子、ERBB2(HER2)遺伝子、CCND1(サイクリンD1)遺伝子、FGFR1遺伝子、FGFR2遺伝子、HRAS遺伝子、KRAS遺伝子、MYB遺伝子、MDM2遺伝子、CCNE(サイクリンE)遺伝子、MET遺伝子、CDK4遺伝子、ERBB1遺伝子、MYCN遺伝子およびAKT2遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
標的配列は、10~35ヌクレオチド配列、15~35ヌクレオチド配列、20~35ヌクレオチド配列、25~35ヌクレオチド配列または30~35ヌクレオチド配列であり得る。
あるいは、標的配列は、10~15ヌクレオチド配列、15~20ヌクレオチド配列、20~25ヌクレオチド配列、25~30ヌクレオチド配列または30~35ヌクレオチド配列であり得る。
一例では、標的配列は、重複遺伝子のコアプロモーター領域に位置する連続した10~25ヌクレオチド配列であり得る。
たとえば、標的配列は、重複遺伝子のTTSを含む領域またはその付近の領域に位置する連続した10~25ヌクレオチド配列であり得る。
たとえば、標的配列は、重複遺伝子のRNAポリメラーゼ結合領域を含む領域またはその付近の領域に位置する連続した10~25ヌクレオチド配列であり得る。
たとえば、標的配列は、重複遺伝子の転写因子結合領域を含む領域またはその付近の領域に位置する連続した10~25ヌクレオチド配列であり得る。
たとえば、標的配列は、重複遺伝子のTATAボックスを含む領域またはその付近の領域に位置する連続した10~25ヌクレオチド配列であり得る。
たとえば、標的配列は、重複遺伝子のコアプロモーター領域に存在する5'-TATA(A/T)A(A/T)-3'配列の全体または一部を含む連続した10~25ヌクレオチド配列であり得る。
たとえば、標的配列は、重複遺伝子のコアプロモーター領域に存在する5'-TATA(A/T)A(A/T)(A/G)-3'配列の全体または一部を含む連続した10~25ヌクレオチド配列であり得る。
たとえば、標的配列は、重複遺伝子のコアプロモーター領域に存在する5'-CATAAAA-3'(SEQ ID NO:264)配列、5'-TATAA-3'(SEQ ID NO:265)配列、5'-TATAAAA-3'(SEQ ID NO:266)配列、5'-CATAAATA-3'(SEQ ID NO:267)配列、5'-TATATAA-3'(SEQ ID NO:268)配列、5'-TATATATATATATAA-3'(SEQ ID NO:269)配列、5'-TATATTATA-3'(SEQ ID NO:270)配列、5'-TATAAA-3'(SEQ ID NO:271)配列、5'-TATAAAATA-3'(SEQ ID NO:272)配列、5'-TATATA-3'(SEQ ID NO:273)配列、5'-GATTAAAAA-3'(SEQ ID NO:274)配列、5'-TATAAAAA-3'(SEQ ID NO:275)配列、5'-TTATAA-3'(SEQ ID NO:276)配列、5'-TTTTAAAA-3'(SEQ ID NO:277)配列、5'-TCTTTAAAA-3'(SEQ ID NO:278)配列、5'-GACATTTAA-3'(SEQ ID NO:279)配列、5'-TGATATCAA-3'(SEQ ID NO:280)配列、5'-TATAAATA-3'(SEQ ID NO:281)配列、5'-TATAAGA-3'(SEQ ID NO:282)配列、5'-AATAAA-3'(SEQ ID NO:283)配列、5'-TTTATA-3'(SEQ ID NO:284)配列、5'-CATAAAAA-3'(SEQ ID NO:285)配列、5'-TATACA-3'(SEQ ID NO:286)配列、5'-TTTAAGA-3'(SEQ ID NO:287)配列、5'-GATAAAG-3'(SEQ ID NO:288)配列、5'-TATAACA-3'(SEQ ID NO:289)配列、5'-TCTTATCTT-3'(SEQ ID NO:290)配列、5'-TTGTACTTT-3'(SEQ ID NO:291)配列、5'-CATATAA-3'(SEQ ID NO:292)配列、5'-TATAAAT-3'(SEQ ID NO:293)配列、5'-TATATATAAAAAAAA-3'(SEQ ID NO:294)配列および5'-CATAAATAAAAAAAATTA-3'(SEQ ID NO:295)配列からなる群より選択される1つまたは複数の配列の全体または一部を含む連続した10~25ヌクレオチド配列であり得る。
たとえば、標的配列は、重複遺伝子のコアプロモーター領域に存在するTATA結合タンパク質(TBP)結合核酸配列の全体または一部を含む連続した10~25ヌクレオチド配列であり得る。
別の例では、標的配列は、重複遺伝子の近位プロモーター領域に位置する連続した10~25ヌクレオチド配列であり得る。
たとえば、標的配列は、重複遺伝子のTSSの1~300bpの上流領域に位置する10~25ntの連続配列であり得る。
さらに別の例では、標的配列は、重複遺伝子の遠位プロモーター領域に位置する連続した10~25ヌクレオチド配列であり得る。
本明細書に開示される標的配列は、重複遺伝子のエンハンサー領域に位置する連続した10~35ヌクレオチド配列であり得る。
ここで、重複遺伝子は、PMP22遺伝子、PLP1遺伝子、MECP2遺伝子、SOX3遺伝子、RAI1遺伝子、TBX1遺伝子、ELN遺伝子、JAGGED1遺伝子、NSD1遺伝子、MMP23遺伝子、LMB1遺伝子、SNCA遺伝子およびAPP遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
あるいは、重複遺伝子は、MYC遺伝子、ERBB2(HER2)遺伝子、CCND1(サイクリンD1)遺伝子、FGFR1遺伝子、FGFR2遺伝子、HRAS遺伝子、KRAS遺伝子、MYB遺伝子、MDM2遺伝子、CCNE(サイクリンE)遺伝子、MET遺伝子、CDK4遺伝子、ERBB1遺伝子、MYCN遺伝子およびAKT2遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
標的配列は、10~35ヌクレオチド配列、15~35ヌクレオチド配列、20~35ヌクレオチド配列、25~35ヌクレオチド配列または30~35ヌクレオチド配列であり得る。
あるいは、標的配列は、10~15ヌクレオチド配列、15~20ヌクレオチド配列、20~25ヌクレオチド配列、25~30ヌクレオチド配列または30~35ヌクレオチド配列であり得る。
たとえば、標的配列は、重複遺伝子のエンハンサーボックス(Eボックス)を含む領域またはその付近の領域に位置する連続した10~25ヌクレオチド配列であり得る。
たとえば、標的配列は、重複遺伝子のイントロンに存在するエンハンサー領域に位置する連続した10~35ヌクレオチド配列であり得る。
本明細書に開示される標的配列は、重複遺伝子のインシュレーター領域に位置する連続した10~35ヌクレオチド配列であり得る。
ここで、重複遺伝子は、PMP22遺伝子、PLP1遺伝子、MECP2遺伝子、SOX3遺伝子、RAI1遺伝子、TBX1遺伝子、ELN遺伝子、JAGGED1遺伝子、NSD1遺伝子、MMP23遺伝子、LMB1遺伝子、SNCA遺伝子、APP遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
あるいは、重複遺伝子は、MYC遺伝子、ERBB2(HER2)遺伝子、CCND1(サイクリンD1)遺伝子、FGFR1遺伝子、FGFR2遺伝子、HRAS遺伝子、KRAS遺伝子、MYB遺伝子、MDM2遺伝子、CCNE(サイクリンE)遺伝子、MET遺伝子、CDK4遺伝子、ERBB1遺伝子、MYCN遺伝子およびAKT2遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
標的配列は、10~35ヌクレオチド配列、15~35ヌクレオチド配列、20~35ヌクレオチド配列、25~35ヌクレオチド配列または30~35ヌクレオチド配列であり得る。
あるいは、標的配列は、10~15ヌクレオチド配列、15~20ヌクレオチド配列、20~25ヌクレオチド配列、25~30ヌクレオチド配列または30~35ヌクレオチド配列であり得る。
本明細書に開示される標的配列は、重複遺伝子のサイレンサー領域に位置する連続した10~35ヌクレオチド配列であり得る。
ここで、重複遺伝子は、PMP22遺伝子、PLP1遺伝子、MECP2遺伝子、SOX3遺伝子、RAI1遺伝子、TBX1遺伝子、ELN遺伝子、JAGGED1遺伝子、NSD1遺伝子、MMP23遺伝子、LMB1遺伝子、SNCA遺伝子、APP遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
あるいは、重複遺伝子は、MYC遺伝子、ERBB2(HER2)遺伝子、CCND1(サイクリンD1)遺伝子、FGFR1遺伝子、FGFR2遺伝子、HRAS遺伝子、KRAS遺伝子、MYB遺伝子、MDM2遺伝子、CCNE(サイクリンE)遺伝子、MET遺伝子、CDK4遺伝子、ERBB1遺伝子、MYCN遺伝子およびAKT2遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
標的配列は、10~35ヌクレオチド配列、15~35ヌクレオチド配列、20~35ヌクレオチド配列、25~35ヌクレオチド配列または30~35ヌクレオチド配列であり得る。
あるいは、標的配列は、10~15ヌクレオチド配列、15~20ヌクレオチド配列、20~25ヌクレオチド配列、25~30ヌクレオチド配列または30~35ヌクレオチド配列であり得る。
本明細書に開示される標的配列は、重複遺伝子の遺伝子座制御領域(LCR)に位置する連続した10~35ヌクレオチド配列であり得る。
ここで、重複遺伝子は、PMP22遺伝子、PLP1遺伝子、MECP2遺伝子、SOX3遺伝子、RAI1遺伝子、TBX1遺伝子、ELN遺伝子、JAGGED1遺伝子、NSD1遺伝子、MMP23遺伝子、LMB1遺伝子、SNCA遺伝子およびAPP遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
あるいは、重複遺伝子は、MYC遺伝子、ERBB2(HER2)遺伝子、CCND1(サイクリンD1)遺伝子、FGFR1遺伝子、FGFR2遺伝子、HRAS遺伝子、KRAS遺伝子、MYB遺伝子、MDM2遺伝子、CCNE(サイクリンE)遺伝子、MET遺伝子、CDK4遺伝子、ERBB1遺伝子、MYCN遺伝子およびAKT2遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
標的配列は、10~35ヌクレオチド配列、15~35ヌクレオチド配列、20~35ヌクレオチド配列、25~35ヌクレオチド配列または30~35ヌクレオチド配列であり得る。
あるいは、標的配列は、10~15ヌクレオチド配列、15~20ヌクレオチド配列、20~25ヌクレオチド配列、25~30ヌクレオチド配列または30~35ヌクレオチド配列であり得る。
本明細書に開示される標的配列は、重複遺伝子の転写調節領域に位置するプロトスペーサー隣接モチーフ(PAM)配列の5'末端および/または3'末端に隣接する連続した10~35ヌクレオチド配列であり得る。
ここで、重複遺伝子は、PMP22遺伝子、PLP1遺伝子、MECP2遺伝子、SOX3遺伝子、RAI1遺伝子、TBX1遺伝子、ELN遺伝子、JAGGED1遺伝子、NSD1遺伝子、MMP23遺伝子、LMB1遺伝子、SNCA遺伝子およびAPP遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
あるいは、重複遺伝子は、MYC遺伝子、ERBB2(HER2)遺伝子、CCND1(サイクリンD1)遺伝子、FGFR1遺伝子、FGFR2遺伝子、HRAS遺伝子、KRAS遺伝子、MYB遺伝子、MDM2遺伝子、CCNE(サイクリンE)遺伝子、MET遺伝子、CDK4遺伝子、ERBB1遺伝子、MYCN遺伝子およびAKT2遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
ここで、重複遺伝子の転写調節領域は、重複遺伝子のプロモーター、エンハンサー、サイレンサー、インシュレーターまたは遺伝子座制御領域(LCR)であり得る。
「プロトスペーサー隣接モチーフ(PAM)配列」とは、エディタータンパク質によって認識されるヌクレオチド配列である。ここで、PAM配列は、エディタータンパク質およびエディタータンパク質由来の種の種類に従って異なるヌクレオチド配列を有し得る。
ここで、PAM配列は、たとえば、以下の配列の1つまたは複数の配列(5'-3'の方向で説明される)であり得る。
NGG(Nは、A、T、CまたはGである);NNNNRYAC(Nは、それぞれ独立してA、T、CまたはGであり、Rは、AまたはGであり、Yは、CまたはTである);NNAGAAW(Nは、それぞれ独立してA、T、CまたはGであり、Wは、AまたはTである);NNNNGATT(Nは、それぞれ独立してA、T、CまたはGである);NNGRR(T)(Nは、それぞれ独立してA、T、CまたはGであり、Rは、AまたはGである);TTN(Nは、A、T、CまたはGである)。
標的配列は、10~35ヌクレオチド配列、15~35ヌクレオチド配列、20~35ヌクレオチド配列、25~35ヌクレオチド配列または30~35ヌクレオチド配列であり得る。
あるいは、標的配列は、10~15ヌクレオチド配列、15~20ヌクレオチド配列、20~25ヌクレオチド配列、25~30ヌクレオチド配列または30~35ヌクレオチド配列であり得る。
例示的な実施形態では、エディタータンパク質によって認識されるPAM配列が5'-NGG-3'、5'-NAG-3'および/または5'-NGA-3'(N=A、T、GもしくはC;またはA、U、GもしくはC)である場合、標的配列は、重複遺伝子の転写調節領域内の5'-NGG-3'、5'-NAG-3'および/または5'-NGA-3'(N=A、T、GもしくはC;またはA、U、GもしくはC)配列の5'末端および/または3'末端に隣接して位置する連続した10~25ヌクレオチド配列であり得る。
別の例示的な実施形態では、エディタータンパク質によって認識されるPAM配列が5'-NGGNG-3'および/または5'-NNAGAAW-3'(W=AまたはT、N=A、T、GもしくはC;またはA、U、GもしくはC)である場合、標的配列は、重複遺伝子の転写調節領域内の5'-NGGNG-3'および/または5'-NNAGAAW-3'(W=AまたはT、N=A、T、GもしくはC;またはA、U、GもしくはC)配列の5'末端および/または3'末端に隣接して位置する連続した10~25ヌクレオチド配列であり得る。
さらに別の例示的な実施形態では、エディタータンパク質によって認識されるPAM配列が5'-NNNNGATT-3'および/または5'-NNNGCTT-3'(N=A、T、GもしくはC;またはA、U、GもしくはC)である場合、標的配列は、重複遺伝子の転写調節領域内の5'-NNNNGATT-3'および/または5'-NNNGCTT-3'(N=A、T、GもしくはC;またはA、U、GもしくはC)配列の5'末端および/または3'末端に隣接して位置する連続した10~25ヌクレオチド配列であり得る。
例示的な一実施形態では、エディタータンパク質によって認識されるPAM配列が5'-NNNVRYAC-3'(V=G、CもしくはA;R=AもしくはG、およびY=CもしくはT、N=A、T、GもしくはC;またはA、U、GもしくはC)である場合、標的配列は、重複遺伝子の転写調節領域内の5'-NNNVRYAC-3'(V=G、CもしくはA;R=AもしくはG、およびY=CもしくはT、N=A、T、GもしくはC;またはA、U、GもしくはC)配列の5'末端および/または3'末端に隣接して位置する連続した10~25ヌクレオチド配列であり得る。
別の例示的な実施形態では、エディタータンパク質によって認識されるPAM配列が5'-NAAR-3'(R=AもしくはG、およびN=A、T、GもしくはC;またはA、U、GもしくはC)である場合、標的配列は、重複遺伝子の転写調節領域内の5'-NAAR-3'(R=AもしくはG、およびN=A、T、GもしくはC;またはA、U、GもしくはC)配列の5'末端および/または3'末端に隣接して位置する連続した10~25ヌクレオチド配列であり得る。
さらに別の例示的な実施形態では、エディタータンパク質によって認識されるPAM配列が5'-NNGRR-3'、5'-NNGRRT-3'、および/または5'-NNGRRV-3'(R=AもしくはG、およびV=G、CもしくはA、N=A、T、GもしくはC;またはA、U、GもしくはC)である場合、標的配列は、重複遺伝子の転写調節領域内の5'-NNGRR-3'、5'-NNGRRT-3'、および/または5'-NNGRRV-3'(R=AもしくはG、およびV=G、CもしくはA、N=A、T、GもしくはC;またはA、U、GもしくはC)配列の5'末端および/または3'末端に隣接して位置する連続した10~25ヌクレオチド配列であり得る。
例示的な一実施形態では、エディタータンパク質によって認識されるPAM配列が5'-TTN-3'(N=A、T、GもしくはC;またはA、U、GもしくはC)である場合、標的配列は、重複遺伝子の転写調節領域内の5'-TTN-3'(N=A、T、GもしくはC;またはA、U、GもしくはC)に隣接して位置する連続した10~25ヌクレオチド配列であり得る。
以下、本明細書に開示される例示的な実施形態で使用され得る標的配列の例を、表1、2、3、4、5および6に列挙する。表1、2、3、4、5および6に開示される標的配列は、ガイド核酸非結合配列であり、その相補的配列、すなわちガイド核酸結合配列は、表に列挙された配列から予測され得る。加えて、表1、2、3、4、5および6に示されるsgRNAは、エディタータンパク質に応じて、SpCas9の場合はSp、CjCas9の場合はCjと命名した。
[表1]
SpCas9のヒトPMP22遺伝子の標的配列
Figure 2022023144000055
[表2]
CjCas9のヒトPMP22遺伝子の標的配列
Figure 2022023144000056
[表3]
SpCas9のヒトPLP1遺伝子の標的配列
Figure 2022023144000057
Figure 2022023144000058
[表4]
CjCas9のヒトPLP1遺伝子の標的配列
Figure 2022023144000059
Figure 2022023144000060
[表5]
SpCas9のマウスPlp1遺伝子の標的配列
Figure 2022023144000061
Figure 2022023144000062
[表6]
CjCas9のマウスPlp1遺伝子の標的配列
Figure 2022023144000063
Figure 2022023144000064
本明細書に開示される一態様として、発現制御組成物は、ガイド核酸およびエディタータンパク質を含み得る。
発現制御組成物は、以下のものを含み得る。
(a)重複遺伝子の転写調節領域に位置する標的配列を標的とすることができるガイド核酸またはそれをコードする核酸配列;および
(b)1つまたは複数のエディタータンパク質またはそれをコードする核酸配列。
重複遺伝子に関する説明は上記の通りである。
転写調節領域に関する説明は上記の通りである。
標的配列に関する説明は上記の通りである。
発現制御組成物は、ガイド核酸-エディタータンパク質複合体を含み得る。
「ガイド核酸-エディタータンパク質複合体」という用語は、ガイド核酸とエディタータンパク質との間の相互作用を介して形成される複合体を指す。
ガイド核酸に関する説明は上記の通りである。
「エディタータンパク質」という用語は、核酸に直接結合するか、核酸に直接結合することなく、核酸と相互作用することができるペプチド、ポリペプチドまたはタンパク質を指す。
ここで、核酸は、標的核酸、遺伝子または染色体に含まれる核酸であり得る。
ここで、核酸はガイド核酸であり得る。
エディタータンパク質は酵素であり得る。
ここで、「酵素」という用語は、核酸、遺伝子または染色体を切断することができるドメインを含むポリペプチドまたはタンパク質を指す。
酵素は、ヌクレアーゼまたは制限酵素であり得る。
エディタータンパク質は、完全な活性酵素を含み得る。
ここで、「完全活性酵素」とは、野性型酵素の核酸、遺伝子または染色体切断機能と同じ機能を有する酵素を指す。たとえば、二本鎖DNAを切断する野性型酵素は、二本鎖DNAを完全に切断する完全な活性酵素であり得る。別の例として、二本鎖DNAを切断する野性型酵素が人為的改変によりアミノ酸配列の部分配列の欠失または置換を受ける場合、人為的に改変された酵素バリアントは、野性型酵素のように二本鎖DNAを切断し、人為的に改変された酵素バリアントは、完全な活性酵素であり得る。
加えて、完全な活性酵素は、野性型酵素と比較して改善された機能を有する酵素を含み得る。たとえば、二本鎖DNAを切断する野性型酵素の修飾または操作された特定の形態は、野性型酵素よりも大きい完全な酵素活性、すなわち、二本鎖DNAを切断する活性の増加を有し得る。
エディタータンパク質は、不完全または部分的に活性な酵素を含み得る。
ここで、「不完全または部分的に活性な酵素」とは、野性型酵素の核酸、遺伝子または染色体切断機能のいくつかを有する酵素を指す。たとえば、二本鎖DNAを切断する野性型酵素の修飾または操作された特定の形態は、第1の機能を有する形態または第2の機能を有する形態であり得る。ここで、第1の機能は、二本鎖DNAの第1鎖を切断する機能であり、第2の機能は、二本鎖DNAの第2鎖を切断する機能であり得る。ここで、第1の機能を有する酵素または第2の機能を有する酵素は、不完全または部分的に活性な酵素であり得る。
エディタータンパク質は不活性酵素を含み得る。
ここで、「不活性酵素」とは、野性型酵素の核酸、遺伝子または染色体切断機能が完全に不活性化されている酵素を指す。たとえば、野性型酵素の修飾または操作された特定の形態は、第1および第2の機能の両方が失われた形態であり得、すなわち、二本鎖DNAの第1鎖を切断する第1の機能と、その第2鎖を切断する第2の機能の両方が失われている。ここで、第1および第2の機能のすべてが失われている酵素は、不活性な酵素であり得る。
エディタータンパク質は融合タンパク質であり得る。
ここで、「融合タンパク質」という用語は、酵素を追加のドメイン、ペプチド、ポリペプチドまたはタンパク質と融合させることにより生成されるタンパク質を指す。
追加のドメイン、ペプチド、ポリペプチドまたはタンパク質は、酵素と同じまたは異なる機能を有する機能的ドメイン、ペプチド、ポリペプチドまたはタンパク質であり得る。
融合タンパク質は、機能的ドメイン、ペプチド、ポリペプチドまたはタンパク質が、酵素のアミノカルボキシル末端もしくはその近傍;酵素のカルボキシルアミノ末端もしくはその近傍;酵素の中央部;またはそれらの組合せの1つまたは複数に付加された形態であり得る。
ここで、機能的ドメイン、ペプチド、ポリペプチドまたはタンパク質は、メチラーゼ活性、デメチラーゼ活性、転写活性化活性、転写抑制活性、転写放出因子活性、ヒストン修飾活性、RNA切断活性もしくは核酸結合活性を有するドメイン、ペプチド、ポリペプチド、もしくはタンパク質、または(ペプチドを含む)タンパク質の単離および精製用のタグもしくはレポーター遺伝子であり得るが、本発明はそれらに限定されない。
機能的ドメイン、ペプチド、ポリペプチドまたはタンパク質は、デアミナーゼであり得る。タグは、ヒスチジン(His)タグ、V5タグ、FLAGタグ、インフルエンザ血球凝集素(HA)タグ、Mycタグ、VSV-Gタグ、チオレドキシン(Trx)タグを含み、レポーター遺伝子は、グルタチオン-S-トランスフェラーゼ(GST)、ホースラディッシュ・ペルオキシダーゼ(HRP)、クロラムフェニコールアセチルトランスフェラーゼ(CAT)、β-ガラクトシダーゼ、β-グルクロニダーゼ、ルシフェラーゼ、自家蛍光タンパク質であって、緑色蛍光タンパク質(GFP)、HcRed、DsRed、シアン蛍光タンパク質(CFP)、黄色蛍光タンパク質(YFP)および青色蛍光タンパク質(BFP)などのタンパク質を含むが、本発明はそれらに限定されない。
加えて、機能的ドメイン、ペプチド、ポリペプチドまたはタンパク質は、核局在化配列またはシグナル(NLS)または核外移行配列もしくはシグナル(NES)であり得る。
NLSは、アミノ酸配列PKKKRKV(SEQ ID NO:312)を有するSV40ウイルスラージT抗原のNLS;ヌクレオプラスミンに由来するNLS(たとえば、配列KRPAATKKAGQAKKKK(SEQ ID NO:313)を有するヌクレオプラスミン双節型NLS);アミノ酸配列PAAKRVKLD(SEQ ID NO:314)またはRQRRNELKRSP(SEQ ID NO:315)を有するc-myc NLS;配列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO:316)を有するhRNPA1 M9 NLS;インポーチン-α由来のIBBドメイン配列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:317);筋腫Tタンパク質配列VSRKRPRP(SEQ ID NO:318)およびPPKKARED(SEQ ID NO:319);ヒトP53配列PQPKKKPL(SEQ ID NO:320);マウスc-abl IV配列SALIKKKKKMAP(SEQ ID NO:321);インフルエンザウイルスNS1配列DRLRR(SEQ ID NO:322)および配列PKQKKRK(SEQ ID NO:323);デルタ(D)型肝炎ウイルス抗原配列RKLKKKIKKL(SEQ ID NO:324);マウスMx1タンパク質配列REKKKFLKRR(SEQ ID NO:325);ヒトポリ(ADP-リボース)ポリメラーゼ配列KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:326);またはステロイドホルモン受容体(ヒト)グルココルチコイド配列RKCLQAGMNLEARKTKK(SEQ ID NO:327)であり得るが、本発明はそれらに限定されない。
追加のドメイン、ペプチド、ポリペプチドまたはタンパク質は、特定の機能を果たさない非機能的ドメイン、ペプチド、ポリペプチドまたはタンパク質であり得る。ここで、非機能的ドメイン、ペプチド、ポリペプチドまたはタンパク質は、酵素機能に影響を及ぼさないドメイン、ペプチド、ポリペプチドまたはタンパク質であり得る。
融合タンパク質は、非機能的ドメイン、ペプチド、ポリペプチドまたはタンパク質が、酵素のアミノ末端もしくはその近傍;酵素のカルボキシル末端もしくはその近傍;酵素の中央部;またはそれらの組合せの1つまたは複数に付加された形態であり得る。
エディタータンパク質は、天然の酵素または融合タンパク質であり得る。
エディタータンパク質は、部分的に修飾された天然酵素または融合タンパク質の形態で存在し得る。
エディタータンパク質は、人為的に生成された酵素または融合タンパク質であり得、それは天然には存在しない。
エディタータンパク質は、部分的に修飾された人為的な酵素または融合タンパク質の形態で存在し得、それは天然には存在しない。
ここで、修飾は、エディタータンパク質に含まれるアミノ酸の置換、除去、付加、またはそれらの組合せであり得る。
あるいは、修飾は、エディタータンパク質をコードするヌクレオチド配列内のいくつかのヌクレオチドの置換、除去、追加、またはそれらの組合せであり得る。
加えて、任意に、発現制御組成物は、挿入される所望の特定のヌクレオチド配列、またはそれをコードする核酸配列を有するドナーをさらに含み得る。
ここで、挿入される核酸配列は、重複遺伝子の転写調節領域内の部分ヌクレオチド配列であり得る。
ここで、挿入される核酸配列は、重複遺伝子の転写調節領域内に変異を導入するために使用される核酸配列であり得る。ここで、変異は、重複遺伝子の転写を妨げる変異であり得る。
「ドナー」という用語は、損傷した遺伝子または核酸の相同組換え(HR)に基づく修復に役立つヌクレオチド配列を指す。
ドナーは、二本鎖または一本鎖核酸であり得る。
ドナーは、線形または円形で存在し得る。
ドナーは、標的遺伝子の転写調節領域内の核酸と相同性を有するヌクレオチド配列を含み得る。
たとえば、ドナーは、特定のヌクレオチド配列が挿入される位置、たとえば、損傷した核酸の上流(左)および下流(右)にあるヌクレオチド配列のそれぞれと相同性を有するヌクレオチド配列を含み得る。ここで、挿入される特定のヌクレオチド配列は、損傷した核酸の下流のヌクレオチド配列と相同性を有するヌクレオチド配列と、損傷した核酸の上流のヌクレオチド配列と相同性を有するヌクレオチド配列との間に位置し得る。ここで、相同性を有するヌクレオチド配列は、少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%または95%以上の相同性または完全な相同性を有し得る。
ドナーは、特定の核酸配列を含み得る。
ここで、特定の核酸配列は、標的遺伝子の部分ヌクレオチド配列またはそれに類似したヌクレオチド配列であり得る。標的遺伝子の部分ヌクレオチド配列は、たとえば、変異を有する標的遺伝子を編集するための変異が編集された正常な核酸配列を含み得る。あるいは、標的遺伝子の部分類似ヌクレオチド配列は、正常な標的遺伝子を変異させるための標的遺伝子の部分正常核酸配列の一部が修飾された変異誘導核酸配列を含み得る。
ここで、特定の核酸配列は、外因性核酸配列であり得る。たとえば、外因性核酸配列は、標的遺伝子を有する細胞内で発現されることが所望される外因性遺伝子であり得る。
ここで、特定の核酸配列は、標的遺伝子を有する細胞内で発現されることが所望される核酸配列であり得る。たとえば、特定の核酸配列は、標的遺伝子を有する細胞で発現する特定の遺伝子であり得、この場合、特定の遺伝子は、ドナーを有する発現制御組成物により細胞内でコピー数が増加し、ひいては高度に発現され得る。
任意に、ドナーは、追加のヌクレオチド配列を含み得る。ここで、追加のヌクレオチド配列は、ドナーの安定性、標的への挿入の効率、または相同組換えの効率を高めるのに役立ち得る。
たとえば、追加のヌクレオチド配列は、AおよびTヌクレオチドリッチな核酸配列、すなわちA-Tリッチなドメインであり得る。たとえば、追加のヌクレオチド配列は、足場/マトリックス付着領域(SMAR)であり得る。
本明細書に開示されるガイド核酸、エディタータンパク質またはガイド核酸-エディタータンパク質複合体は、さまざまな手法で対象内に送達または導入され得る。
ここで、「対象」という用語は、ガイド核酸、エディタータンパク質またはガイド核酸-エディタータンパク質複合体が導入される生物、ガイド核酸、エディタータンパク質、またはガイド核酸エディタータンパク質複合体が機能する生物、または生物から得られた検体またはサンプルを指す。
対象は、ガイド核酸-エディタータンパク質複合体の標的遺伝子または染色体を含む生物であり得る。
生物は、動物、動物組織または動物細胞であり得る。
生物は、ヒト、ヒト組織またはヒト細胞であり得る。
組織は、眼球、皮膚、肝臓、腎臓、心臓、肺、脳、筋肉組織または血液であり得る。
細胞は、線維芽細胞、シュワン細胞、神経細胞、希突起膠細胞、筋芽細胞、グリア細胞、マクロファージ、免疫細胞、肝細胞、網膜色素上皮細胞、癌細胞または幹細胞であり得る。
検体またはサンプルは、標的遺伝子または染色体を含む生物から取得され得、唾液、血液、網膜組織、脳組織、シュワン細胞、希突起膠細胞、筋芽細胞、線維芽細胞、ニューロン、グリア細胞、マクロファージ、肝細胞、免疫細胞、癌細胞または幹細胞であり得る。
好ましくは、対象は、重複遺伝子を含む生物であり得る。ここで、対象は、重複遺伝子が遺伝子重複状態にある生物であり得る。
ガイド核酸、エディタータンパク質またはガイド核酸-エディタータンパク質複合体は、DNA、RNAの形態もしくは混合形態で対象に送達または導入され得る。
ここで、ガイド核酸および/またはエディタータンパク質は、当該技術分野で公知の方法により、DNA、RNAの形態もしくは混合形態で対象に送達または導入され得る。
あるいは、ガイド核酸および/またはエディタータンパク質をコードするDNA、RNAまたはそれらの混合物の形態は、ベクター、非ベクターもしくはそれらの組合せによって対象に送達または導入され得る。
ベクターは、ウイルスまたは非ウイルスベクター(たとえばプラスミド)であり得る。
非ベクターは、裸のDNA、DNA複合体またはmRNAであり得る。
例示的な一実施形態では、ガイド核酸および/またはエディタータンパク質をコードする核酸配列は、ベクターによって対象に送達または導入され得る。
ベクターは、ガイド核酸および/またはエディタータンパク質をコードする核酸配列を含み得る。
一例では、ベクターは、ガイド核酸とエディタータンパク質をそれぞれコードする核酸配列を同時に含み得る。
別の例では、ベクターは、ガイド核酸をコードする核酸配列を含み得る。
一例として、ガイド核酸に含まれるドメインは、すべて1つのベクターに含まれていてもよいし、分割されて異なるベクターに含まれていてもよい。
別の例では、ベクターは、エディタータンパク質をコードする核酸配列を含み得る。
一例として、エディタータンパク質の場合、エディタータンパク質をコードする核酸配列は1つのベクターに含まれていてもよいし、分割されていくつかのベクターに含まれていてもよい。
ベクターは、1つまたは複数の調節/制御コンポーネントを含み得る。
ここで、調節/制御コンポーネントは、プロモーター、エンハンサー、イントロン、ポリアデニル化シグナル、コザックコンセンサス配列、内部リボソーム進入部位(IRES)、スプライスアクセプターおよび/または2A配列を含み得る。
プロモーターは、RNAポリメラーゼIIによって認識されるプロモーターであり得る。
プロモーターは、RNAポリメラーゼIIIによって認識されるプロモーターであり得る。
プロモーターは、誘導性プロモーターであり得る。
プロモーターは、対象特異的なプロモーターであり得る。
プロモーターは、ウイルス性または非ウイルス性プロモーターであり得る。
プロモーターは、制御領域(すなわち、ガイド核酸またはエディタータンパク質をコードする核酸配列)に応じて適切なプロモーターを使用してもよい。
たとえば、ガイド核酸に有用なプロモーターは、H1、EF-1a、tRNAまたはU6プロモーターであり得る。たとえば、エディタータンパク質に有用なプロモーターは、CMV、EF-1a、EFS、MSCV、PGKまたはCAGプロモーターであり得る。
ベクターは、ウイルスベクターまたは組換えウイルスベクターであり得る。
ウイルスは、DNAウイルスまたはRNAウイルスであり得る。
ここで、DNAウイルスは、二本鎖DNA(dsDNA)ウイルスまたは一本鎖DNA(ssDNA)ウイルスであり得る。
ここで、RNAウイルスは、一本鎖RNA(ssRNA)ウイルスであり得る。
ここで、ウイルスは、レトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴ウイルス(AAV)、ワクシニアウイルス、ポックスウイルスまたは単純ヘルペスウイルスであり得るが、本発明はこれらに限定されない。
一般に、ウイルスは宿主(たとえば細胞)に感染し得、それによってウイルスの遺伝情報をコードする核酸を宿主に導入するか、遺伝情報をコードする核酸を宿主ゲノムに挿入する。そのような特徴を有するウイルスを使用して、ガイド核酸および/またはエディタータンパク質を対象に導入することができる。ウイルスを使用して導入されたガイド核酸および/またはエディタータンパク質は、対象(たとえば細胞)内で一時的に発現され得る。あるいは、ウイルスを使用して導入されたガイド核酸および/またはエディタータンパク質は、長期間にわたって(たとえば、1、2もしくは3週間、1、2、3、6もしくは9か月、1年もしくは2年、または恒久的に)対象(たとえば細胞)内で連続的に発現され得る。
ウイルスのパッケージング容量は、ウイルスの種類に応じて、少なくとも2~50kbで異なり得る。そのようなパッケージング容量に応じて、ガイド核酸もしくはエディタータンパク質を含むウイルスベクター、またはガイド核酸とエディタータンパク質の両方を含むウイルスベクターを設計することができる。あるいは、ガイド核酸、エディタータンパク質および追加のコンポーネントを含むウイルスベクターを設計することができる。
一例では、ガイド核酸および/またはエディタータンパク質をコードする核酸配列は、組換えレンチウイルスによって送達または導入され得る。
別の例では、ガイド核酸および/またはエディタータンパク質をコードする核酸配列は、組換えアデノウイルスによって送達または導入され得る。
さらに別の例では、ガイド核酸および/またはエディタータンパク質をコードする核酸配列は、組換えAAVによって送達または導入され得る。
さらに別の例では、ガイド核酸および/またはエディタータンパク質をコードする核酸配列は、ハイブリッドウイルス、たとえば本明細書に挙げたウイルスの1つまたは複数のハイブリッドによって送達または導入され得る。
別の例示的な実施形態では、ガイド核酸および/またはエディタータンパク質をコードする核酸配列は、非ベクターによって対象に送達または導入され得る。
非ベクターは、ガイド核酸および/またはエディタータンパク質をコードする核酸配列を含み得る。
非ベクターは、裸のDNA、DNA複合体、mRNA、またはそれらの混合物であり得る。
非ベクターは、エレクトロポレーション、遺伝子銃、ソノポレーション、マグネトフェクション、一過性の細胞圧縮もしくは圧搾(たとえば、文献[Lee,et al,(2012)Nano Lett.,12,6322-6327]に記載)、脂質媒介トランスフェクション、デンドリマー、ナノ粒子、リン酸カルシウム、シリカ、ケイ酸塩(Ormosil)、またはそれらの組合せによって対象に送達または導入され得る。
一例では、エレクトロポレーションを介した送達は、細胞と、ガイド核酸および/またはエディタータンパク質をコードする核酸配列とを、カートリッジ、チャンバまたはキュベット内で混合し、細胞に所定の持続時間および振幅で電気刺激を適用することにより行われ得る。
別の例では、非ベクターは、ナノ粒子を使用して送達され得る。ナノ粒子は、無機ナノ粒子(たとえば、磁性ナノ粒子、シリカなど)または有機ナノ粒子(たとえば、ポリエチレングリコール(PEG)でコーティングされた脂質など)であり得る。ナノ粒子の外表面には、付着可能な正に荷電したポリマー(たとえば、ポリエチレンイミン、ポリリジン、ポリセリンなど)と共役されていてもよい。
特定の実施形態では、非ベクターは、脂質シェルを使用して送達され得る。
特定の実施形態では、非ベクターは、エクソソームを使用して送達され得る。エクソソームは、タンパク質とRNAを導入するための内因性のナノ小胞であり、それはRNAを脳や別の標的器官に送達することができる。
特定の実施形態では、非ベクターは、リポソームを使用して送達され得る。リポソームは、内部の水性区画を囲む単一または複数の層状脂質二重層と、比較的不透明な外部の親油性リン脂質二重層で構成される球状小胞構造である。リポソームはいくつかの異なる種類の脂質から作られ得るが、リン脂質は、最も一般には、薬物担体としてリポソームを生成するために使用される。
加えて、非ベクターの送達のための組成物は、他の添加剤を含み得る。
エディタータンパク質は、ペプチド、ポリペプチドまたはタンパク質の形態で対象に送達または導入され得る。
エディタータンパク質は、当該技術分野で知られている方法により、ペプチド、ポリペプチド、またはタンパク質の形態で対象に送達または導入され得る。
ペプチド、ポリペプチドまたはタンパク質の形態は、エレクトロポレーション、マイクロインジェクション、一過性の細胞圧縮もしくは圧搾(たとえば、文献[Lee,et al,(2012)Nano Lett.,12,6322-6327]に記載)、脂質媒介トランスフェクション、ナノ粒子、リポソーム、ペプチド媒介送達またはそれらの組合せにより対象に送達または導入され得る。
ペプチド、ポリペプチドまたはタンパク質は、ガイド核酸をコードする核酸配列とともに送達され得る。
一例では、エレクトロポレーションを介した導入は、ガイド核酸と共に、またはガイド核酸無しでエディタータンパク質が導入される細胞をカートリッジ、チャンバまたはキュベットにおいて混合し、細胞に所定の持続時間と振幅で電気刺激を加えることにより行われ得る。
ガイド核酸とエディタータンパク質は、核酸とタンパク質を混合する形態で対象に送達または導入され得る。
ガイド核酸とエディタータンパク質は、ガイド核酸-エディタータンパク質複合体の形態で対象に送達または導入され得る。
たとえば、ガイド核酸は、DNA、RNAまたはそれらの混合物であり得る。エディタータンパク質は、ペプチド、ポリペプチドまたはタンパク質であり得る。
一例では、ガイド核酸とエディタータンパク質は、RNA型ガイド核酸とタンパク質型エディタータンパク質を含むガイド核酸-エディタータンパク質複合体、すなわちリボ核タンパク質(RNP)の形態で対象に送達または導入され得る。
本明細書に開示されるガイド核酸-エディタータンパク質複合体は、標的核酸、遺伝子または染色体を修飾し得る。
たとえば、ガイド核酸-エディタータンパク質複合体は、標的核酸、遺伝子または染色体の配列の修飾を誘導する。 その結果、標的核酸、遺伝子または染色体により発現されるタンパク質は、構造および/または機能について修飾され得るか、タンパク質の発現が制御または阻害され得る。
ガイド核酸-エディタータンパク質複合体は、DNA、RNA、遺伝子または染色体レベルで作用し得る。
一例では、ガイド核酸-エディタータンパク質複合体は、標的遺伝子の転写調節領域を操作または修飾して、標的遺伝子によりコードされるタンパク質の発現を制御(たとえば、抑制、阻害、減少、増加、または促進)することができ、または、その活性が制御されている(たとえば、抑制、阻害、減少、増加、または促進されている)または修飾されたタンパク質を発現する。
ガイド核酸-エディタータンパク質複合体は、遺伝子の転写および翻訳段階で作用し得る。
一例では、ガイド核酸-エディタータンパク質複合体は、標的遺伝子の転写を促進または阻害し、それによって標的遺伝子によりコードされるタンパク質の発現を制御(たとえば、抑制、阻害、減少、増加または促進)し得る。
別の例では、ガイド核酸-エディタータンパク質複合体は、標的遺伝子の翻訳を促進または阻害し、それによって標的遺伝子によりコードされるタンパク質の発現を制御(たとえば、抑制、阻害、減少、増加または促進)し得る。本明細書に開示される例示的な一実施形態では、発現制御組成物は、gRNAおよびCRISPR酵素を含み得る。
発現制御組成物は、以下のものを含み得る:
(a)重複遺伝子の転写調節領域に位置する標的配列を標的とすることができるgRNAまたはそれをコードする核酸配列;および
(b)1つまたは複数のCRISPR酵素またはそれをコードする核酸配列。
重複遺伝子に関する説明は上記の通りである。
転写調節領域に関する説明は上記の通りである。
標的配列に関する説明は上記の通りである。
発現制御組成物は、gRNA-CRISPR酵素複合体を含み得る。
「gRNA-CRISPR酵素複合体」という用語は、gRNAとCRISPR酵素との相互作用により形成される複合体を指す。
gRNAに関する説明は上記の通りである。
「CRISPR酵素」という用語は、CRISPR-Casシステムの主要なタンパク質コンポーネントであり、gRNAと複合体を形成し、CRISPR-Casシステムをもたらす。
CRISPR酵素は、CRISPR酵素またはポリペプチド(もしくはタンパク質)をコードする配列を有する核酸であり得る。
CRISPR酵素は、II型CRISPR酵素であり得る。
II型CRISPR酵素の結晶構造は、2種類以上の天然微生物II型CRISPR酵素分子の研究(Jinek et al.,Science,343(6176):1247997,2014)ならびにgRNAと複合させたストレプトコッカス・ピオゲネス(Streptococcus pyogenes)Cas9(SpCas9)の研究(Nishimasu et al.,Cell,156:935-949,2014;およびAnders et al.,Nature,2014,doi:10.1038/nature13579)に従って決定されていた。
II型CRISPR酵素は、2つのローブ、すなわち、認識(REC)ローブとヌクレアーゼ(NUC)ローブとを含み、各ローブはいくつかのドメインを含む。
RECローブは、アルギニンリッチなブリッジヘリックス(BH)ドメイン、REC1ドメイン、およびREC2ドメインを含む。
ここで、BHドメインは、アルギニンリッチな長いα-ヘリックスの領域であり、REC1ドメインとREC2ドメインは、gRNAに形成された二本鎖、たとえば、一本鎖gRNA、二本鎖gRNAまたはtracrRNAを認識するのに重要な役割を果たす。
NUCローブは、RuvCドメイン、HNHドメインおよびPAM相互作用(PI)ドメインを含む。ここで、RuvCドメインは、RuvC様ドメインを包含し、HNHドメインは、HNH様ドメインを包含する。
ここで、RuvCドメインは、II型CRISPR酵素を有する天然に存在する微生物ファミリーのメンバーと構造的類似性を共有し、一本鎖、たとえば、標的遺伝子の転写調節領域内の核酸の非相補鎖、すなわち、gRNAと相補的な結合を形成しない鎖を切断する。RuvCドメインは、当該技術分野ではRuvC Iドメイン、RuvC IIドメインまたはRuvC IIIドメインを指すこともあり、一般にはRuvC I、RuvC IIまたはRuvC IIIと呼ばれる。
HNHドメインは、HNHエンドヌクレアーゼと構造的類似性を共有し、一本鎖、たとえば、標的核酸分子の相補鎖、すなわち、gRNAと相補的な結合を形成する鎖を切断する。HNHドメインは、RuvC IIモチーフとRuvC IIIモチーフとの間に位置している。
PIドメインは、標的遺伝子の転写調節領域内の特定のヌクレオチド配列、すなわちプロトスペーサー隣接モチーフ(PAM)を認識するか、PAMと相互作用する。ここで、PAMは、II型CRISPR酵素の起源に応じて異なり得る。たとえば、CRISPR酵素がSpCas9である場合、PAMは5'-NGG-3'であり得、CRISPR酵素がストレプトコッカス・サーモフィルス(Streptococcus thermophilus)Cas9(StCas9)である場合、PAMは5'-NNAGAAW-3'(W=AまたはT)であり得、CRISPR酵素がナイセリア・メニンギティディス(Neisseria meningitides)Cas9(NmCas9)である場合、PAMは5'-NNNNGATT-3'であり得、CRISPR酵素がカンピロバクター・ジェジュニ(Campylobacter jejuni)Cas9(CjCas9)である場合、PAMは5'-NNNVRYAC-3'(V=G、CまたはA、R=AまたはG、Y=CまたはT)であり得、ここで、Nは、A、T、GもしくはC;またはA、U、GもしくはCであり得る。しかしながら、PAMは上記酵素の起源に応じて決定されることが一般に理解されているが、上記起源に由来する酵素の変異体に関する研究の進展に応じて、PAMは変更され得る。
II型CRISPR酵素はCas9であり得る。
Cas9は、さまざまな微生物、たとえば、Streptococcus pyogenes、Streptococcus thermophilus、Streptococcus sp.、Staphylococcus aureus、Nocardiopsis dassonvillei、Streptomyces pristinaespiralis、Streptomyces viridochromogenes、Streptomyces viridochromogenes、Streptosporangium roseum、Streptosporangium roseum、AlicyclobacHlus acidocaldarius、Bacillus pseudomycoides、Bacillus selenitireducens、Exiguobacterium sibiricum、Lactobacillus delbrueckii、Lactobacillus salivarius、Microscilla marina、Burkholderiales bacterium、Polaromonas naphthalenivorans、Polaromonas sp.、Crocosphaera watsonii、Cyanothece sp.、Microcystis aeruginosa、Synechococcus sp.、Acetohalobium arabaticum、Ammonifex degensii、Caldicelulosiruptor bescii、Candidatus Desulforudis、Clostridium botulinum、Clostridium difficile、Finegoldia magna、Natranaerobius thermophilus、Pelotomaculum thermopropionicum、Acidithiobacillus caldus、Acidithiobacillus ferrooxidans、Allochromatium vinosum、Marinobacter sp.、Nitrosococcus halophilus、Nitrosococcus watsoni、Pseudoalteromonas haloplanktis、Ktedonobacter racemifer、Methanohalobium evestigatum、Anabaena variabilis、Nodularia spumigena、Nostoc sp.、Arthrospira maxima、Arthrospira platensis)、Arthrospira sp.)、Lyngbya sp.、Microcoleus chthonoplastes、Oscillatoria sp.、Petrotoga mobilis、Thermosipho africanusおよびAcaryochloris marinaに由来し得る。
Cas9は、gRNAに結合して、標的遺伝子の転写調節領域の標的配列もしくは位置を切断または修飾する酵素であり、gRNAと相補的な結合を形成する核酸鎖を切断することができるHNHドメインと、gRNAと非相補的な結合を形成する核酸鎖を切断することができるRuvCドメインと、標的と相互作用するRECドメインと、PAMを認識するPIドメインとからなり得る。Cas9の特異的な構造特性については、Hiroshi Nishimasu et al.(2014)Cell 156:935-949を参照することができる。
Cas9は、天然に存在する微生物から単離されるか、組換え法または合成法によって非天然に産生され得る。
加えて、CRISPR酵素はV型CRISPR酵素であり得る。
V型CRISPR酵素は、II型CRISPR酵素のRuvCドメインに対応する同様のRuvCドメインを含み、II型CRISPR酵素のHNHドメインの代わりのNucドメインと、標的を認識するRECおよびWEDドメインと、PAMを認識するPIドメインとからなり得る。V型CRISPR酵素の特異的な構造特性については、Takashi Yamano et al.(2016)Cell 165:949-962を参照することができる。
V型CRISPR酵素はgRNAと相互作用し、それによってgRNA-CRISPR酵素複合体、すなわちCRISPR複合体を形成し、gRNAと協調してガイド配列がPAM配列を含む標的配列に接近することを可能にし得る。ここで、標的遺伝子の転写調節領域内の核酸との相互作用についてのV型CRISPR酵素の能力は、PAM配列に依存している。
PAM配列は、標的遺伝子の転写調節領域に存在する配列であり得、V型CRISPR酵素のPIドメインによって認識される。PAM配列は、V型CRISPR酵素の起源に応じて異なる配列を有し得る。すなわち、各種は、特異的に認識可能なPAM配列を有する。たとえば、Cpf1によって認識されるPAM配列は5'-TTN-3'(Nは、A、T、CまたはGである)であり得る。PAMは上記の酵素の起源に応じて決定されることが一般に理解されているが、対応する起源に由来する酵素の変異体に関する研究の進展に応じて、PAMは変更され得る。
V型CRISPR酵素はCpf1であり得る。
Cpf1は、Streptococcus、Campylobacter、Nitratifractor、Staphylococcus、Parvibaculum、Roseburia、Neisseria、Gluconacetobacter、Azospirillum、Sphaerochaeta、Lactobacillus、Eubacterium、Corynebacter、Carnobacterium、Rhodobacter、Listeria、Paludibacter、Clostridium、Lachnospiraceae、Clostridiaridium、Leptotrichia、Francisella、Legionella、Alicyclobacillus、Methanomethyophilus、Porphyromonas、Prevotella、Bacteroidetes、Helcococcus、Letospira、Desulfovibrio、Desulfonatronum、Opitutaceae、Tuberibacillus、Bacillus、Brevibacillus、MethylobacteriumまたはAcidaminococcusに由来し得る。
Cpf1は、Cas9のRuvCドメインに対応するRuvC様ドメイン、Cas9のHNHドメインの代わりのNucドメイン、標的を認識するRECおよびWEDドメイン、ならびにPAMを認識するPIドメインからなり得る。Cpf1の特異的な構造特性については、Takashi Yamano et al.(2016)Cell 165:949-962を参照することができる。
Cpf1は、天然に存在する微生物から単離されるか、組換え法または合成法によって非天然に産生され得る。
CRISPR酵素は、標的遺伝子の転写調節領域内の二本鎖核酸を切断する機能を有するヌクレアーゼまたは制限酵素であり得る。
CRISPR酵素は、完全な活性CRISPR酵素であり得る。
「完全な活性」という用語は、酵素が野性型CRISPR酵素と同じ機能を有する状態を指し、そのような状態のCRISPR酵素は、完全な活性CRISPR酵素と呼ばれる。ここで、「野性型CRISPR酵素の機能」とは、酵素が、二本鎖DNAを切断する機能、すなわち、二本鎖DNAの第1鎖を切断する第1の機能および二本鎖DNAの第2鎖を切断する第2の機能を有する状態を指す。
完全な活性CRISPR酵素は、二本鎖DNAを切断する野性型CRISPR酵素であり得る。
完全な活性CRISPR酵素は、二本鎖DNAを切断する野性型CRISPR酵素を修飾または操作することにより形成されるCRISPR酵素バリアントであり得る。
CRISPR酵素バリアントは、野性型CRISPR酵素のアミノ酸配列の1つまたは複数のアミノ酸が他のアミノ酸で置換されているか、1つまたは複数のアミノ酸が除去されている酵素であり得る。
CRISPR酵素バリアントは、1つまたは複数のアミノ酸が野性型CRISPR酵素のアミノ酸配列に付加されている酵素であり得る。ここで、付加されたアミノ酸の位置は、野性型酵素のN末端、C末端またはアミノ酸配列であり得る。
CRISPR酵素バリアントは、野性型CRISPR酵素と比較して機能が改善された完全な活性酵素であり得る。
たとえば、野性型CRISPR酵素の特異的に修飾または操作された形態、すなわちCRISPR酵素バリアントは、切断される二本鎖DNAに結合しないか、それとは一定の距離を維持しながら、二本鎖DNAを切断し得る。この場合、修飾または操作された形態は、野性型CRISPR酵素と比較して、機能活性が改善された完全な活性CRISPR酵素であり得る。
CRISPR酵素バリアントは、野性型CRISPR酵素と比較して機能が低下した完全な活性CRISPR酵素であり得る。
たとえば、野性型CRISPR酵素の修飾または操作された特定の形態、すなわちCRISPR酵素バリアントは、切断される二本鎖DNAに非常に近いか、それと特異的な結合を形成しながら、二本鎖DNAを切断し得る。ここで、特異的な結合は、たとえば、CRISPR酵素の特異領域のアミノ酸と切断位置のDNA配列との間の結合であり得る。この場合、修飾または操作された形態は、野性型CRISPR酵素と比較して機能活性が低下した完全な活性CRISPR酵素であり得る。
CRISPR酵素は、不完全または部分的に活性なCRISPR酵素であり得る。
「不完全または部分的に活性」という用語は、酵素が、野性型CRISPR酵素の機能、すなわち、二本鎖DNAの第1鎖を切断する第1の機能および二本鎖DNAの第2鎖を切断する第2の機能から選択される1つを有する状態を指す。この状態のCRISPR酵素は、不完全または部分的に活性なCRISPR酵素と呼ばれる。加えて、不完全または部分的に活性なCRISPR酵素は、ニッカーゼと呼ばれ得る。
「ニッカーゼ」という用語は、標的遺伝子の転写調節領域内の核酸の二本鎖の一方の鎖のみを切断するように操作または修飾されたCRISPR酵素を指し、ニッカーゼは、一本鎖、たとえば、標的遺伝子の転写調節領域内の核酸のgRNAに相補的または非相補的である鎖を切断するヌクレアーゼ活性を有する。したがって、二本鎖を切断するには、2つのニッカーゼのヌクレアーゼ活性が必要である。
ニッカーゼは、RuvCドメインによって引き起こされるヌクレアーゼ活性を有し得る。すなわち、ニッカーゼは、HNHドメインのヌクレアーゼ活性を含まなくてよく、このために、HNHドメインを操作または修飾してもよい。
一例では、CRISPR酵素がII型CRISPR酵素である場合、ニッカーゼは、修飾されたHNHドメインを含むII型CRISPR酵素であり得る。
たとえば、II型CRISPR酵素が野性型SpCas9である場合、ニッカーゼは、野性型SpCas9のアミノ酸配列の840番目のアミノ酸をヒスチジンからアラニンへ変異させる変異によって、HNHドメインのヌクレアーゼ活性が不活性化されたSpCas9バリアントであり得る。それによって産生されるニッカーゼ、すなわちSpCas9バリアントは、RuvCドメインのヌクレアーゼ活性を有しているため、標的遺伝子の転写調節領域内の核酸の非相補鎖である鎖、すなわち、gRNAと相補的結合を形成しない鎖を切断することができる。
別の例では、II型CRISPR酵素が野性型CjCas9である場合、ニッカーゼは、野性型CjCas9のアミノ酸配列の559番目のアミノ酸をヒスチジンからアラニンへ変異させる変異によって、HNHドメインのヌクレアーゼ活性が不活性化されたCjCas9バリアントであり得る。それによって産生されるニッカーゼ、すなわち、CjCas9バリアントは、RuvCドメインのヌクレアーゼ活性を有しているため、標的遺伝子の転写調節領域内の核酸の非相補鎖である鎖、すなわち、gRNAと相補的結合を形成しない鎖を切断することができる。
加えて、ニッカーゼは、CRISPR酵素のHNHドメインによって引き起こされるヌクレアーゼ活性を有し得る。すなわち、ニッカーゼは、RuvCドメインのヌクレアーゼ活性を含まなくてよく、このために、RuvCドメインを操作または修飾してもよい。
一例では、CRISPR酵素がII型CRISPR酵素である場合、ニッカーゼは、修飾されたRuvCドメインを含むII型CRISPR酵素であり得る。
たとえば、II型CRISPR酵素が野性型SpCas9である場合、ニッカーゼは、野性型SpCas9のアミノ酸配列の10番目のアミノ酸をアスパラギン酸からアラニンへ変異させる変異によって、RuvCドメインのヌクレアーゼ活性が不活性化されたSpCas9バリアントであり得る。それによって産生されるニッカーゼ、すなわち、SpCas9バリアントは、HNHドメインのヌクレアーゼ活性を有しているため、標的遺伝子の転写調節領域内の核酸の相補鎖である鎖、すなわち、gRNAと相補的結合を形成する鎖を切断することができる。
別の例では、II型CRISPR酵素が野性型CjCas9とした場合、ニッカーゼは、野性型CjCas9のアミノ酸配列の8番目のアミノ酸をアスパラギン酸からアラニンへ変異させる変異によって、RuvCドメインのヌクレアーゼ活性が不活性化されたCjCas9バリアントであり得る。それによって産生されるニッカーゼ、すなわち、CjCas9バリアントは、HNHドメインのヌクレアーゼ活性を有しているため、標的遺伝子の転写調節領域内の核酸の相補鎖である鎖、すなわち、gRNAと相補的結合を形成する鎖を切断することができる。
CRISPR酵素は、不活性なCRISPR酵素であり得る。
「不活性」という用語は、野性型CRISPR酵素の機能、すなわち、二本鎖DNAの第1鎖を切断する第1の機能および二本鎖DNAの第2鎖を切断する第2の機能の両方を失われている状態を指す。そのような状態のCRISPR酵素は、不活性CRISPR酵素と呼ばれる。
不活性CRISPR酵素は、野性型CRISPR酵素のヌクレアーゼ活性を有するドメインの変化により、ヌクレアーゼ不活性を有し得る。
不活性なCRISPR酵素は、RuvCドメインおよびHNHドメイン内の変異により、ヌクレアーゼ不活性を有し得る。すなわち、不活性なCRISPR酵素は、CRISPR酵素のRuvCドメインおよびHNHドメインによって引き起こされるヌクレアーゼ活性を含まなくてよく、このために、RuvCドメインおよびHNHドメインを操作または修飾してもよい。
一例では、CRISPR酵素がII型CRISPR酵素である場合、不活性なCRISPR酵素は、修飾されたRuvCドメインおよび修飾されたHNHドメインを含むII型CRISPR酵素であり得る。
たとえば、II型CRISPR酵素が野性型SpCas9である場合、不活性CRISPR酵素は、野性型SpCas9のアミノ酸配列の10番目のアスパラギン酸と840番目のヒスチジンの両方のアラニンへの変異により、RuvCドメインとHNHドメインのヌクレアーゼ活性が不活性化されたSpCas9バリアントであり得る。ここで、産生される不活性なCRISPR酵素、すなわち、SpCas9バリアントは、RuvCドメインおよびHNHドメインのヌクレアーゼ活性が不活性化されているため、標的遺伝子の転写調節領域内の二本鎖核酸は、完全に切断され得る。
別の例では、II型CRISPR酵素が野性型CjCas9である場合、不活性なCRISPR酵素は、野性型CjCas9のアミノ酸配列の8番目のアスパラギン酸と559番目のヒスチジンの両方のアラニンへの変異により、RuvCドメインとHNHドメインのヌクレアーゼ活性が不活性化されたCjCas9バリアントであり得る。ここで、産生される不活性なCRISPR酵素、すなわち、CjCas9バリアントは、RuvCドメインおよびHNHドメインのヌクレアーゼ活性が不活性化されているため、標的遺伝子の転写調節領域内の二本鎖核酸は、完全には切断されないことがあり得る。
CRISPR酵素は、ヘリカーゼ活性、すなわち、上記のヌクレアーゼ活性に加えて、二本鎖核酸のらせん構造をほどく能力を有し得る。
加えて、CRISPR酵素は、完全に活性な、不完全もしくは部分的に活性な、または不活性なヘリカーゼ活性を有するように修飾されていてもよい。
CRISPR酵素は、野性型CRISPR酵素を人為的に操作または修飾することにより生成されるCRISPR酵素バリアントであり得る。
CRISPR酵素バリアントは、野性型CRISPR酵素の機能、すなわち、二本鎖DNAの第1鎖を切断する第1の機能および/または二本鎖DNAの第2鎖を切断する第2の機能を修飾するための人為的に操作または修飾されたCRISPR酵素バリアントであり得る。
たとえば、CRISPR酵素バリアントは、野性型CRISPR酵素の機能の第1の機能が失われた形態であり得る。
あるいは、CRISPR酵素バリアントは、野性型CRISPR酵素の機能の第2の機能が失われた形態であり得る。
たとえば、CRISPR酵素バリアントは、野性型CRISPR酵素の機能、すなわち、第1の機能と第2の機能の両方が失われた形態であり得る。
CRISPR酵素バリアントは、gRNAとの相互作用によりgRNA-CRISPR酵素複合体を形成し得る。
CRISPR酵素バリアントは、野性型CRISPR酵素のgRNAと相互作用する機能を修飾するための人為的に操作または修飾されたCRISPR酵素バリアントであり得る。
たとえば、CRISPR酵素バリアントは、野性型CRISPR酵素と比較して、gRNAとの相互作用が低下した形態であり得る。
あるいは、CRISPR酵素バリアントは、野性型CRISPR酵素と比較して、gRNAとの相互作用が増加した形態であり得る。
たとえば、CRISPR酵素バリアントは、野性型CRISPR酵素の第1の機能を有し、gRNAとの相互作用が低下した形態であり得る。
あるいは、CRISPR酵素バリアントは、野性型CRISPR酵素の第1の機能を有し、gRNAとの相互作用が増加した形態であり得る。
たとえば、CRISPR酵素バリアントは、野性型CRISPR酵素の第2の機能を有し、gRNAとの相互作用が低下した形態であり得る。
あるいは、CRISPR酵素バリアントは、野性型CRISPR酵素の第2の機能を有し、gRNAとの相互作用が増加した形態であり得る。
たとえば、CRISPR酵素バリアントは、野性型CRISPR酵素の第1の機能および第2の機能を有さず、gRNAとの相互作用が低下した形態であり得る。
あるいは、CRISPR酵素バリアントは、野性型CRISPR酵素の第1の機能および第2の機能を有さず、gRNAとの相互作用が増加した形態であり得る。
ここで、gRNAとCRISPR酵素バリアントとの間の相互作用強度に応じて、さまざまなgRNA-CRISPR酵素複合体が形成され得、CRISPR酵素バリアントに応じて、標的配列に近づくか、切断する機能に違いがあり得る。
たとえば、gRNAとの相互作用が低下したCRISPR酵素バリアントにより形成されたgRNA-CRISPR酵素複合体は、gRNAに完全に相補的に結合する標的配列に非常に接近または局在化した場合のみ、標的配列の二本鎖または一本鎖を切断し得る。
CRISPR酵素バリアントは、野性型CRISPR酵素のアミノ酸配列の少なくとも1つのアミノ酸が修飾された形態であり得る。
例として、CRISPR酵素バリアントは、野性型CRISPR酵素のアミノ酸配列のうち少なくとも1つのアミノ酸が置換された形態であり得る。
別の例として、CRISPR酵素バリアントは、野性型CRISPR酵素のアミノ酸配列の少なくとも1つのアミノ酸が欠失された形態であり得る。
さらに別の例として、CRISPR酵素バリアントは、野性型CRISPR酵素のアミノ酸配列の少なくとも1つのアミノ酸が付加された形態であり得る。
一例では、CRISPR酵素バリアントは、野性型CRISPR酵素のアミノ酸配列の少なくとも1つのアミノ酸が置換、欠失および/または付加された形態であり得る。
加えて、任意に、CRISPR酵素バリアントは、野性型CRISPR酵素の本来の機能、すなわち、二本鎖DNAの第1鎖を切断する第1の機能およびその第2鎖を切断する第2の機能に加えて、機能的ドメインをさらに含み得る。ここで、CRISPR酵素バリアントは、野性型CRISPR酵素の本来の機能に加えて、追加の機能を有し得る。
機能的ドメインは、メチラーゼ活性、デメチラーゼ活性、転写活性化活性、転写抑制活性、転写放出因子活性、ヒストン修飾活性、RNA切断活性もしくは核酸結合活性、または(ペプチドを含む)タンパク質の単離および精製用のタグもしくはレポーター遺伝子を有するドメインであり得るが、本発明はそれらに限定されない。
タグは、ヒスチジン(His)タグ、V5タグ、FLAGタグ、インフルエンザ血球凝集素(HA)タグ、Mycタグ、VSV-Gタグおよびチオレドキシン(Trx)タグを含み、レポーター遺伝子は、グルタチオン-S-トランスフェラーゼ(GST)、ホースラディッシュ・ペルオキシダーゼ(HRP)、クロラムフェニコールアセチルトランスフェラーゼ(CAT)、β-ガラクトシダーゼ、β-グルクロニダーゼ、ルシフェラーゼ、自家蛍光タンパク質であって、緑色蛍光タンパク質(GFP)、HcRed、DsRed、シアン蛍光タンパク質(CFP)、黄色蛍光タンパク質(YFP)および青色蛍光タンパク質(BFP)などのタンパク質を含むが、本発明はそれらに限定されない。
機能的ドメインはデアミナーゼであり得る。
たとえば、シチジンデアミナーゼは、不完全または部分的に活性なCRISPR酵素に対する機能的ドメインとしてさらに含まれ得る。例示的な一実施形態では、融合タンパク質は、シチジンデアミナーゼ、たとえばアポリポタンパク質B編集複合体1(APOBEC1)をSpCas9ニッカーゼに添加することにより産生され得る。上記のように形成された[SpCas9ニッカーゼ]-[APOBEC1]は、C~TもしくはUのヌクレオチド編集、またはG~Aのヌクレオチド編集に使用され得る。
別の例では、アデニンデアミナーゼは、不完全または部分的に活性なCRISPR酵素に対する機能的ドメインとしてさらに含まれ得る。例示的な一実施形態では、アデニンデアミナーゼ、たとえばTadAバリアント、ADAR2バリアントまたはADAT2バリアントをSpCas9ニッカーゼに加えることにより、融合タンパク質が産生され得る。融合タンパク質はヌクレオチドAをイノシンに修飾するため、上記のように形成された[SpCas9ニッカーゼ]-[TadAバリアント]、[SpCas9ニッカーゼ]-[ADAR2バリアント]または[SpCas9ニッカーゼ]-[ADAT2バリアント]は、A~Gのヌクレオチド編集、またはT~Cのヌクレオチド編集に使用され得、修飾されたイノシンはポリメラーゼによってヌクレオチドGとして認識され、それによって実質的にA~Gのヌクレオチド編集を示す。
機能的ドメインは、核局在化配列またはシグナル(NLS)または核外移行配列またはシグナル(NES)であり得る。
一例では、CRISPR酵素は、1つまたは複数のNLSを含み得る。ここで、1つまたは複数のNLSが、CRISPR酵素のN末端もしくはその近傍;当該酵素のC末端もしくはその近傍;またはそれらの組合せに含まれ得る。NLSは、以下のNLSに由来するNLS配列であり得るが、本発明はそれらに限定されない:アミノ酸配列PKKKRKV(SEQ ID NO:312)を有するSV40ウイルスラージT抗原のNLS;ヌクレオプラスミンからのNLS(たとえば、配列KRPAATKKAGQAKKKK(SEQ ID NO:313)を有するヌクレオプラスミン双節型NLS);アミノ酸配列PAAKRVKLD(SEQ ID NO:314)またはRQRRNELKRSP(SEQ ID NO:315)を有するc-myc NLS;配列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO:316)を有するhRNPA1 M9 NLS;インポーチン-αからのIBBドメインの配列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:317);筋腫Tタンパク質の配列VSRKRPRP(SEQ ID NO:318)およびPPKKARED(SEQ ID NO:319);ヒトP53の配列PQPKKKPL(SEQ ID NO:320);マウスc-abl IVの配列SALIKKKKKMAP(SEQ ID NO:321);インフルエンザウイルスNS1の配列DRLRR(SEQ ID NO:322)および配列PKQKKRK(SEQ ID NO:323);D型肝炎ウイルス抗原の配列RKLKKKIKKL(SEQ ID NO:324);マウスMx1タンパク質の配列REKKKFLKRR(SEQ ID NO:325);ヒトポリ(ADP-リボース)ポリメラーゼの配列KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:326);またはステロイドホルモン受容体(ヒト)グルココルチコイドの配列に由来するNLS配列RKCLQAGMNLEARKTKK(SEQ ID NO:327)
加えて、CRISPR酵素変異体は、CRISPR酵素を2つ以上の部分に分割することにより調製されるスプリット型CRISPR酵素を含み得る。「スプリット」という用語は、タンパク質の機能的もしくは構造的分割またはタンパク質の2つ以上の部分へのランダムな分割を指す。
スプリット型CRISPR酵素は、完全、不完全もしくは部分的に活性な酵素または不活性な酵素であり得る。
たとえば、CRISPR酵素がSpCas9である場合、SpCas9は、残基656であるチロシンと残基657であるスレオニンとの間の2つの部分に分割され得、それによってスプリットSpCas9が生成される。
スプリット型CRISPR酵素は、再構成のための追加のドメイン、ペプチド、ポリペプチドまたはタンパク質を選択的に含み得る。
再構成のための追加のドメイン、ペプチド、ポリペプチドまたはタンパク質は、構造的に野性型CRISPR酵素と同じまたは類似するスプリット型CRISPR酵素の形成のために組み立てられ得る。
再構成のための追加のドメイン、ペプチド、ポリペプチドまたはタンパク質は、FRBおよびFKBP二量化ドメイン;インテイン;ERTおよびVPRドメイン;または特定の条件下でヘテロダイマーを形成するドメインであり得る。
たとえば、CRISPR酵素がSpCas9である場合、SpCas9は、残基713であるセリンと残基714であるグリシンとの間の2つの部分に分割され得、それによってスプリットSpCas9が生成される。FRBドメインは2つの部分の一方に連結され、FKBPドメインはもう一方に連結される。それによって生成されるスプリットSpCas9では、FRBドメインとFKBPドメインは、ラパマイシンが存在する環境において二量体で形成され得、それによって再構成されたCRISPR酵素が生成される。
本明細書に開示されるCRISPR酵素またはCRISPR酵素バリアントは、それをコードする配列を有するポリペプチド、タンパク質または核酸であり得、CRISPR酵素またはCRISPR酵素バリアントを導入するために対象に対してコドン最適化され得る。
「コドン最適化」という用語は、天然配列の少なくとも1つのコドンを、宿主細胞においてより高頻度または最も高頻度で使用されるコドンに置き換える一方、天然アミノ酸配列を維持することにより核酸配列を修飾して宿主細胞内での発現を向上させるためのプロセスを指す。さまざまな種は、特定のアミノ酸の特定のコドンについて特定のバイアスを有し、コドンバイアス(生物間のコドン使用頻度の差)は、mRNAの翻訳の効率と相関することが多く、このことは、翻訳されるコドンの特性と特異的なtRNA分子の入手可能性に依存すると考えられる。細胞内で選択されるtRNAの優位性は、一般にペプチド合成において最も高頻度で使用されるコドンを反映している。したがって、遺伝子は、所与の生物中の最適な遺伝子発現のためにコドン最適化に基づき個別に調整され得る。
本明細書に開示されるgRNA、CRISPR酵素またはgRNA-CRISPR酵素複合体は、さまざまな送達方法およびさまざまな形態により対象に送達または導入され得る。
主題関連の説明は上記の通りである。
例示的な一実施形態では、gRNAおよび/またはCRISPR酵素をコードする核酸配列は、ベクターによって対象に送達または導入され得る。
ベクターは、gRNAおよび/またはCRISPR酵素をコードする核酸配列を含み得る。
一例では、ベクターは、gRNAおよびCRISPR酵素をコードする核酸配列を同時に含み得る。
別の例では、ベクターは、gRNAをコードする核酸配列を含み得る。
たとえば、gRNAに含まれるドメインは、1つのベクターに含まれていても、分割されて異なるベクターに含まれていてもよい。
別の例では、ベクターは、CRISPR酵素をコードする核酸配列を含み得る。
たとえば、CRISPR酵素の場合、CRISPR酵素をコードする核酸配列は1つのベクターに含まれていても、分割されていくつかのベクターに含まれていてもよい。
ベクターは、1つまたは複数の調節/制御コンポーネントを含み得る。
ここで、調節/制御コンポーネントは、プロモーター、エンハンサー、イントロン、ポリアデニル化シグナル、コザックコンセンサス配列、内部リボソーム進入部位(IRES)、スプライスアクセプターおよび/または2A配列を含み得る。
プロモーターは、RNAポリメラーゼIIによって認識されるプロモーターであり得る。
プロモーターは、RNAポリメラーゼIIIによって認識されるプロモーターであり得る。
プロモーターは、誘導性プロモーターであり得る。
プロモーターは、対象特異的プロモーターであり得る。
プロモーターは、ウイルス性または非ウイルス性プロモーターであり得る。
プロモーターは、制御領域(すなわち、gRNAおよび/またはCRISPR酵素をコードする核酸配列)に応じて適切なプロモーターを使用してもよい。
たとえば、gRNAに有用なプロモーターは、H1、EF-1a、tRNAまたはU6プロモーターであり得る。たとえば、CRISPR酵素に有用なプロモーターは、CMV、EF-1a、EFS、MSCV、PGKまたはCAGプロモーターであり得る。
ベクターは、ウイルスベクターまたは組換えウイルスベクターであり得る。
ウイルスは、DNAウイルスまたはRNAウイルスであり得る。
ここで、DNAウイルスは、二本鎖DNA(dsDNA)ウイルスまたは一本鎖DNA(ssDNA)ウイルスであり得る。
ここで、RNAウイルスは、一本鎖RNA(ssRNA)ウイルスであり得る。ウイルスは、レトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴ウイルス(AAV)、ワクシニアウイルス、ポックスウイルスまたは単純ヘルペスウイルスであり得るが、本発明はこれらに限定されない。
一例では、gRNAおよび/またはCRISPR酵素をコードする核酸配列は、組換えレンチウイルスによって送達または導入され得る。
別の例では、gRNAおよび/またはCRISPR酵素をコードする核酸配列は、組換えアデノウイルスにより送達または導入され得る。さらに別の例では、gRNAおよび/またはCRISPR酵素をコードする核酸配列は、組換えAAVにより送達または導入され得る。さらに別の例では、gRNAおよび/またはCRISPR酵素をコードする核酸配列は、ハイブリッドウイルス、たとえば本明細書に記載のウイルスの1つまたは複数のハイブリッドによって送達または導入され得る。
例示的な一実施形態では、gRNA-CRISPR酵素複合体は、対象に送達または導入され得る。
たとえば、gRNAは、DNA、RNAまたはそれらの混合物の形態で存在し得る。CRISPR酵素は、ペプチド、ポリペプチドまたはタンパク質の形態で存在し得る。
一例では、gRNAおよびCRISPR酵素は、RNA型gRNAおよびタンパク質型CRISPR、すなわちリボ核タンパク質(RNP)を含むgRNA-CRISPR酵素複合体の形態で対象に送達または導入され得る。
gRNA-CRISPR酵素複合体は、エレクトロポレーション、マイクロインジェクション、一過性の細胞圧縮もしくは圧搾(たとえば、文献[Lee,et al,(2012)Nano Lett.,12,6322-6327]に記載)、脂質媒介トランスフェクション、ナノ粒子、リポソーム、ペプチド媒介送達またはそれらの組合せにより対象に送達または導入され得る。本明細書に開示されるgRNA-CRISPR酵素複合体を使用して、標的遺伝子、すなわち重複遺伝子の転写調節領域を人為的に操作または修飾することができる。
標的遺伝子の転写調節領域は、上記のgRNA-CRISPR酵素複合体、すなわちCRISPR複合体を使用して操作または修飾され得る。ここで、標的遺伝子の転写調節領域の操作または修飾は、i)標的遺伝子の転写調節領域の切断または損傷と、ii)損傷した転写調節領域の修復の両方を含み得る。
i)標的遺伝子の転写調節領域の切断または損傷は、CRISPR複合体を使用した標的遺伝子の転写調節領域の切断または損傷、特に転写調節領域の標的配列の切断または損傷であり得る。
標的配列は、gRNA-CRISPR酵素複合体の標的になり得、標的配列はCRISPR酵素によって認識されるPAM配列を含んでも含んでいなくてもよい。そのような標的配列は、gRNAの設計に関与している者に重要な基準を提供する。
標的配列は、gRNA-CRISPR酵素複合体のgRNAによって特異的に認識され得るため、gRNA-CRISPR酵素複合体は、認識された標的配列の近くに位置し得る。
標的部位での「切断」とは、ポリヌクレオチドの共有結合骨格の破損を指す。 切断は、ホスホジエステル結合の酵素的または化学的加水分解を含むが、本発明はそれに限定されない。これ以外に、切断はさまざまな方法によって行われ得る。一本鎖切断と二本鎖切断の両方が可能であり、ここで、二本鎖切断は、2つの異なる一本鎖切断から生じ得る。二本鎖切断により、平滑末端または付着末端(もしくは粘着末端)が生じ得る。
一例では、CRISPR複合体を使用した標的遺伝子の転写調節領域の切断または損傷は、標的配列の二本鎖の切断または損傷全体であり得る。
例示的な一実施形態では、CRISPR酵素が野性型SpCas9である場合、gRNAと相補的な結合を形成する標的配列の二本鎖は、CRISPR複合体によって完全に切断され得る。
別の例示的な実施形態では、CRISPR酵素がSpCas9ニッカーゼ(D10A)およびSpCas9ニッカーゼ(H840A)である場合、gRNAと相補的な結合を形成する標的配列の2本の一本鎖は、各CRISPR複合体によってそれぞれ切断され得る。すなわち、gRNAと相補的な結合を形成する標的配列の相補的な一本鎖はSpCas9ニッカーゼ(D10A)によって切断され得、gRNAと相補的な結合を形成する標的配列の非相補的な一本鎖はSpCas9ニッカーゼ(H840A)によって切断され得、これらの切断は、順次または同時に行われ得る。
別の例では、CRISPR複合体を使用した標的遺伝子の転写調節領域の切断または損傷は、標的配列の二本鎖のうちの一本鎖のみの切断または損傷であり得る。ここで、一本鎖は、gRNAに相補的に結合する標的配列のガイド核酸結合配列、すなわち相補的な一本鎖、またはgRNAに相補的に結合しない非ガイド核酸結合配列、すなわちgRNAと非相補的な一本鎖であり得る。
例示的な一実施形態では、CRISPR酵素がSpCas9ニッカーゼ(D10A)である場合、CRISPR複合体は、SpCas9ニッカーゼ(D10A)により、gRNAに相補的に結合する標的配列のガイド核酸結合配列、すなわち相補的な一本鎖を切断してよく、gRNAに相補的に結合しない非ガイド核酸結合配列、すなわちgRNAと非相補的な一本鎖を切断しなくてよい。
別の例示的な実施形態では、CRISPR酵素がSpCas9ニッカーゼ(H840A)である場合、CRISPR複合体は、SpCas9ニッカーゼ(H840A)により、gRNAに相補的に結合しない標的配列の非ガイド核酸結合配列、すなわちgRNAと非相補的な一本鎖を切断してよく、gRNAに相補的に結合する標的配列のガイド核酸結合配列、すなわち相補的な一本鎖を切断しなくてよい。
さらに別の例では、CRISPR複合体を使用した標的遺伝子の転写調節領域の切断または損傷は、核酸断片の部分的な除去であり得る。
例示的な一実施形態では、CRISPR複合体が、野性型SpCas9と、異なる標的配列を有する2つのgRNAから構成される場合、第1のgRNAと相補的な結合を形成する標的配列の二本鎖が切断され得、第2のgRNAと相補的な結合を形成する標的配列の二本鎖が切断され得、第1および第2のgRNAならびにSpCas9によって核酸断片の除去がもたらされる。
たとえば、2つのCRISPR複合体が、エンハンサーの上流に存在する標的配列に相補的に結合する1つのgRNAと、エンハンサーの下流に存在する標的配列に相補的に結合する他方のgRNAなどの異なる標的配列に相補的に結合する2つのgRNAと、野性型SpCas9とからなる場合、第1のgRNAに相補的に結合するエンハンサーの上流に存在する標的配列の二本鎖が切断され得、第2のgRNAに相補的に結合するエンハンサーの下流に存在する標的配列の二本鎖が切断され得、それによって、核酸断片、すなわちエンハンサー領域が、第1のgRNA、第2のgRNAおよびSpCas9によって除去される。
ii)損傷した転写調節領域の修復は、非相同末端結合(NHEJ)および相同性指向修復(HDR)を介して行われる修復または復元であり得る。
非相同末端結合(NHEJ)は、切断された二本鎖または一本鎖の両端をつなぎ合わせることにより、DNAの二本鎖の破損を復元または修復する方法であり、一般に、二本鎖の破損(たとえば切断)によって形成された2つの適合性のある末端が頻繁に互いに接触して2つの端部を完全につなぎ合わせる場合、破損した二本鎖が回復される。NHEJは、細胞周期全体で使用することができる修復方法であり、通常、G1期のように細胞内でテンプレートとして使用される相同ゲノムがない場合に起こる。
NHEJを使用した損傷遺伝子または核酸の修復プロセスでは、NHEJ修復領域で核酸配列のいくつかの挿入および/または欠失(インデル)が起こり、そのような挿入および/または欠失が、リーディングフレームのシフトを引き起こし、フレームシフトされたトランスクリプトームmRNAがもたらされる。その結果、先天機能は、ナンセンス媒介の崩壊または正常なタンパク質の合成の失敗のために失われる。加えて、リーディングフレームが維持される間、かなりの量の配列の挿入または欠失が起こる変異が、タンパク質の機能が破壊を引き起こし得る。変異は遺伝子座に依存する。なぜなら、タンパク質の有意でない領域の変異よりも、有意な機能的ドメインの変異の許容度がおそらく低いからである。
NHEJによって天然状態で生成されるインデル変異を期待することは不可能であるが、特異的インデル配列が所定の破損領域で優先され、ミクロ相同性の小さな領域に由来し得る。従来、欠失の長さは1bp~50bpの範囲であり、挿入はより短くなる傾向にあり、破損領域を直接囲む短い反復配列を頻繁に含む。
加えて、NHEJは変異を引き起こすプロセスであり、特異的な最終配列を生成する必要がない場合は、小さな配列のモチーフを欠失するのに使用することができる。
発現がCRISPR複合体により標的化された転写調節領域により制御される標的遺伝子の特異的ノックアウトは、そのようなNHEJを使用して行われ得る。標的遺伝子の転写調節領域の二本鎖または2本の一本鎖は、Cas9またはCpf1などのCRISPR酵素を使用して切断され得、破損した二本鎖または二本の一本鎖は、NHEJを介したインデルを有し、それによって、発現が転写調節領域によって制御される標的遺伝子の特異的ノックアウトを誘導する。
一例では、標的遺伝子の転写調節領域の二本鎖は、CRISPR複合体を使用して切断され得、NHEJを介して修復することにより、修復領域にさまざまなインデル(挿入および欠失)が生成され得る。
「インデル」という用語は、DNAのヌクレオチド配列に部分ヌクレオチドを挿入またはDNAのヌクレオチド配列から部分ヌクレオチドを欠失することによって形成されるバリエーションを指す。上記のようにgRNA-CRISPR酵素複合体が標的遺伝子の転写調節領域で標的配列を切断する場合、HDRまたはNHEJによる修復中に標的配列にインデルが導入され得る。
相同性指向修復(HDR)は、エラーのない修正方法であり、相同配列をテンプレートとして使用して、損傷した転写調節領域を修復または復元し、一般に、破損DNAを修復または復元、すなわち細胞の先天情報を復元し、破損DNAは、修飾されていない相補的なヌクレオチド配列の情報または姉妹染色分体の情報を使用して修復される。HDRの最も一般的な種類は相同組換え(HR)である。HDRは、通常、活発に分裂している細胞のS期またはG2/M期に起こる修復または復元方法である。
細胞の相補的ヌクレオチド配列または姉妹クロマチンを使用するのではなく、HDRを使用して損傷DNAを修復または復元するために、相補的ヌクレオチド配列または相同的ヌクレオチド配列の情報を使用して人為的に合成されたDNAテンプレート、すなわち、相補的ヌクレオチド配列または相同ヌクレオチド配列を含む核酸テンプレートが細胞に提供され得、それによって破損DNAが修復される。ここで、核酸配列または核酸断片を核酸テンプレートにさらに加えて破損DNAを修復する場合、破損DNAにさらに加えられた核酸配列または核酸断片をノックインしてもよい。さらに追加された核酸配列または核酸断片は、正常な遺伝子、または細胞内で発現される遺伝子もしくは核酸への変異によって修飾された標的遺伝子の転写調節領域を修正するための核酸配列または核酸断片であり得るが、本発明はそれらに限定されない。
一例では、標的遺伝子酸の転写調節領域の二本鎖または一本鎖が、CRISPR複合体を使用して切断され得、切断部位に隣接するヌクレオチド配列に相補的なヌクレオチド配列を含む核酸テンプレートが細胞に提供され得、標的遺伝子の転写調節領域の切断されたヌクレオチド配列は、HDRを介して修復または復元され得る。
ここで、相補的ヌクレオチド配列を含む核酸テンプレートは、破損DNAの相補的ヌクレオチド配列、すなわち切断された二本鎖または一本鎖を有し得、破損DNAに挿入される核酸配列または核酸断片をさらに含み得る。追加の核酸配列または核酸断片は、相補的ヌクレオチド配列および挿入される核酸配列または核酸断片を含む核酸テンプレートを使用して、破損DNA、すなわち標的遺伝子の転写調節領域の切断部位に挿入され得る。ここで、挿入される核酸配列または核酸断片および追加の核酸配列または核酸断片は、正常な遺伝子、または細胞内で発現される遺伝子もしくは核酸への変異によって修飾された標的遺伝子の転写調節領域を修正するための核酸配列または核酸断片であり得る。相補的ヌクレオチド配列は、破損DNAとの相補的な結合を有するヌクレオチド配列、すなわち、標的遺伝子の転写調節領域の切断された二本鎖または一本鎖の右および左のヌクレオチド配列であり得る。あるいは、相補的ヌクレオチド配列は、破損DNAとの相補的な結合を有するヌクレオチド配列、すなわち、標的遺伝子の転写調節領域の切断された二本鎖または一本鎖の3'および5'末端を有するヌクレオチド配列であり得る。相補的ヌクレオチド配列は15~3000ヌクレオチド配列であり得、相補的ヌクレオチド配列の長さまたはサイズは、核酸テンプレートまたは標的遺伝子の転写調節領域のサイズに従って適切に設計され得る。ここで、核酸テンプレートは、二本鎖または一本鎖の核酸であり得、線状または環状であり得るが、本発明はそれらに限定されない。
別の例では、標的遺伝子酸の転写調節領域の二本鎖または一本鎖が、CRISPR複合体を使用して切断され得、切断部位に隣接するヌクレオチド配列と相同のヌクレオチド配列を含む核酸テンプレートが細胞に提供され得、標的遺伝子の転写調節領域の切断されたヌクレオチド配列は、HDRを介して修復または復元され得る。
ここで、相同ヌクレオチド配列を含む核酸テンプレートは、破損DNAの相同ヌクレオチド配列、すなわち切断された二本鎖または一本鎖を有し得、破損DNAに挿入される核酸配列または核酸断片をさらに含み得る。追加の核酸配列または核酸断片は、相同ヌクレオチド配列および挿入される核酸配列または核酸断片を含む核酸テンプレートを使用して、破損DNA、すなわち標的遺伝子の転写調節領域の切断部位に挿入され得る。ここで、挿入される核酸配列または核酸断片および追加の核酸配列または核酸断片は、正常な遺伝子、または細胞内で発現される遺伝子もしくは核酸への変異によって修飾された標的遺伝子または核酸の転写調節領域を修正するための核酸配列または核酸断片であり得る。相同ヌクレオチド配列は、破損DNAと相同性を有するヌクレオチド配列、すなわち、転写調節領域の切断された二本鎖の右および左のヌクレオチド配列であり得る。あるいは、相同ヌクレオチド配列は、破損DNAとの相同性を有するヌクレオチド配列、すなわち、転写調節領域の切断された二本鎖または一本鎖の3'および5'末端を有するヌクレオチド配列であり得る。相同ヌクレオチド配列は15~3000ヌクレオチド配列であり得、相同ヌクレオチド配列の長さまたはサイズは、核酸テンプレートまたは標的遺伝子の転写調節領域のサイズに従って適切に設計され得る。ここで、核酸テンプレートは、二本鎖または一本鎖の核酸であり得、線状または環状であり得るが、本発明はそれらに限定されない。
NHEJおよびHDR以外にも、損傷した転写調節領域を修復または復元するためのさまざまな方法がある。たとえば、損傷した転写調節領域を修復または復元する方法は、一本鎖アニーリング、一本鎖破損修復、ミスマッチ修復、ヌクレオチド切断修復、またはヌクレオチド切断修復を使用する方法であり得る。
一本鎖アニーリング(SSA)は、標的核酸に存在する2つの反復配列間の二本鎖切断を修復する方法で、一般に30ヌクレオチド超の反復配列を使用する。反復配列は、(粘着末端を有するように)破損した各末端の標的核酸の二本鎖に対して一本鎖を有するように切断され、切断後、反復配列を含む一本鎖オーバーハングがRPAタンパク質でコーティングされ、反復配列が互いに不適切にアニーリングすることが防がれる。RAD52は、オーバーハング上の各反復配列に結合し、相補的な反復配列をアニーリングすることができる配列が配置される。アニーリング後、オーバーハングの一本鎖フラップが切断され、新しいDNAの合成により一定のギャップが埋められてDNA二本鎖が復元される。この修復のその結果、2つの反復間のDNA配列が欠失され、欠失の長さは、本明細書で使用される2つの反復の位置と、切断の進行の経路または程度を含むさまざまな要因に依存し得る。
SSAは、HDRと同様に、相補配列、すなわち相補反復配列を利用するが、対照的に、標的核酸配列を修飾または修正するための核酸テンプレートは必要としない。
ゲノムの一本鎖破損は、上記の修復メカニズムとは別個のメカニズム、一本鎖破損修復(SSBR)を介して修復される。一本鎖DNA破損の場合、PARP1および/またはPARP2は破損を認識し、修復機構を補充する。DNA破損に対するPARP1の結合と活性は一時的であり、SSBRは、損傷領域でのSSBRタンパク質複合体の安定性を促進することにより促進される。SSBR複合体の最も重要なタンパク質はXRCC1であり、それはDNAの3'および5'末端処理を促進するタンパク質と相互作用してDNAを安定化する。末端処理は、一般に、損傷した3'末端のヒドロキシル化状態への修復、および/または損傷した5'末端のリン酸部分への修復に関与し、末端が処理された後、DNAギャップが埋められる。DNAギャップを埋めるための2つの方法、すなわち、短いパッチ修復と長いパッチ修復があり、短いパッチ修復は、単一ヌクレオチドの挿入を含む。DNAギャップが埋められた後、DNAリガーゼが末端結合を促進する。
ミスマッチ修復(MMR)は、ミスマッチDNAヌクレオチドに対して機能する。MSH2/6またはMSH2/3の各複合体は、ATPase活性を有しており、ひいてはミスマッチの認識と修復の開始に重要な役割を果たし、MSH2/6は、主にヌクレオチド間のミスマッチを認識し、1つまたは2つのヌクレオチドミスマッチを識別するが、MSH2/3は、主により大きなミスマッチを認識する。
塩基除去修復(BER)は、細胞周期全体を通じて有効であり、小さな非ヘリックス歪みの塩基損傷領域をゲノムから除去するために使用される修復方法である。損傷DNAでは、ヌクレオチドをリン酸-デオキシリボース骨格につなぎ合わせるN-グリコシド結合を切断することにより損傷ヌクレオチドが除去され、次いでホスホジエステル骨格が切断され、それによって一本鎖DNAの破損が生じる。それによって形成される破損した一本鎖末端が除去され、除去された一本鎖により生じたギャップが新しい相補的ヌクレオチドで埋められ、次いで新たに埋められた相補的ヌクレオチドの末端がDNAリガーゼにより骨格とライゲーションされ、損傷DNAが修復される。
ヌクレオチド除去修復(NER)は、DNAから大きなヘリックス歪み損傷を除去するために重要な切除機構であり、損傷が認識されると、損傷領域を含む短い一本鎖DNAセグメントが除去され、22~30ヌクレオチドの一本鎖ギャップが生じる。生じたギャップは、新しい相補的なヌクレオチドで埋められ、新たに埋められた相補的なヌクレオチドの端部がDNAリガーゼによって骨格とライゲーションされ、損傷DNAが修復される。
gRNA-CRISPR酵素複合体による標的遺伝子の転写調節領域の人為的操作の効果は、主にノックアウト(ノック-アウト)、ノックダウン、ノックイン(ノック-イン)および発現の増加であり得る。
「ノックアウト」という用語は、標的遺伝子または核酸の不活性化を指し、「標的遺伝子または核酸の不活性化」とは、標的遺伝子または核酸の転写および/または翻訳が起こらない状態を指す。疾患を引き起こす遺伝子または異常な機能を有する遺伝子の転写および翻訳は、ノックアウトを介して阻害され得、タンパク質発現が防がれる。
たとえば、gRNA-CRISPR酵素複合体、すなわちCRISPR複合体を使用して標的遺伝子の転写調節領域が編集される場合、CRISPR複合体を使用して標的遺伝子の転写調節領域が切断され得る。CRISPR複合体を使用して損傷を受けた転写調節領域は、NHEJによって修復され得る。損傷した転写調節領域では、NHEJによってインデルが生成され、ひいては損傷した転写調節領域が不活性化され、それによって標的遺伝子または染色体特異的ノックアウトが誘導される。
別の例では、gRNA-CRISPR酵素複合体、すなわちCRISPR複合体とドナーを使用して標的遺伝子の転写調節領域が編集される場合、CRISPR複合体を使用して標的遺伝子の転写調節領域が切断され得る。CRISPR複合体を使用して損傷を受けた転写調節領域は、ドナーを使用してHDRによって修復され得る。ここで、ドナーは、相同ヌクレオチド配列と挿入が望まれるヌクレオチド配列を含む。ここで、挿入されるヌクレオチド配列の数は、挿入位置または目的に応じて異なり得る。損傷した転写調節領域がドナーを使用して修復されると、挿入されるヌクレオチド配列が、損傷したヌクレオチド配列領域に挿入されるため、転写調節領域が不活性化され、それによって標的遺伝子または染色体特異的ノックアウトが誘導される。
「ノックダウン」という用語は、標的遺伝子もしくは核酸の転写および/または翻訳の減少、または標的タンパク質の発現を指す。ノックダウンを介して遺伝子またはタンパク質の過剰発現を調節することにより、疾患の発症が予防され得るか、疾患が治療され得る。
たとえば、gRNA-CRISPR酵素複合体、すなわちCRISPR複合体を使用して標的遺伝子の転写調節領域が編集される場合、CRISPR複合体を使用して標的遺伝子の転写調節領域が切断され得る。CRISPR複合体を使用して損傷を受けた転写調節領域は、NHEJによって修復され得る。損傷した転写調節領域では、NHEJによってインデルが生成される、ひいては損傷した転写調節領域が不活性化され、それによって標的遺伝子または染色体特異的ノックダウンが誘導される。
別の例では、gRNA-CRISPR酵素複合体、すなわちCRISPR複合体とドナーを使用して標的遺伝子の転写調節領域が編集される場合、CRISPR複合体を使用して標的遺伝子の転写調節領域が切断され得る。CRISPR複合体を使用して損傷を受けた転写調節領域は、ドナーを使用してHDRによって修復され得る。ここで、ドナーは、相同ヌクレオチド配列と挿入が望まれるヌクレオチド配列を含む。ここで、挿入されるヌクレオチド配列の数は、挿入位置または目的に応じて異なり得る。ドナーを使用して損傷した転写調節領域が修復されると、挿入されるヌクレオチド配列が、損傷したヌクレオチド配列領域に挿入されるため、転写調節領域が不活性化され、それによって標的遺伝子または染色体特異的ノックダウンが誘導される。
たとえば、gRNA-CRISPR不活性酵素転写阻害活性ドメイン複合体、すなわち転写阻害活性ドメインを含むCRISPR不活性複合体を使用して、標的遺伝子の転写調節領域が編集される場合、CRISPR不活性複合体は、標的遺伝子の転写調節領域に特異的に結合し、転写調節領域の活性は、CRISPR-不活性複合体に含まれる転写阻害活性ドメインによって阻害され、それによって標的遺伝子または染色体の発現を阻害するノックダウンが誘導される。
「ノックイン」という用語は、標的遺伝子または核酸への特定の核酸または遺伝子の挿入を指し、ここで、「特定の核酸または遺伝子」とは、挿入または発現される対象の遺伝子または核酸を指す。疾患を誘発する変異遺伝子が、ノックインを介して正常な遺伝子の発現を誘導するために、正常への修正または正常な遺伝子の挿入によって疾患治療に利用され得る。
加えて、ノックインは、ドナーさらに必要とし得る。
たとえば、gRNA-CRISPR酵素複合体、すなわちCRISPR複合体とドナーを使用して標的遺伝子または核酸が編集される場合、CRISPR複合体を使用して標的遺伝子または核酸が切断され得る。CRISPR複合体を使用して損傷した標的遺伝子または核酸は、ドナーを使用してHDRによって修復され得る。ここで、ドナーは、特定の核酸または遺伝子を含み得、特定の核酸または遺伝子を損傷した遺伝子または染色体に挿入するために使用され得る。ここで、挿入された特定の核酸または遺伝子は、タンパク質の発現を誘導し得る。
「発現の増加」とは、人為的な操作前と比較して、標的遺伝子もしくは核酸の転写および/または翻訳または標的タンパク質の発現の増加を指す。疾患は、過小発現もしくは非発現の遺伝子またはタンパク質の発現を制御することにより予防または治療され得る。
たとえば、gRNA-CRISPR酵素複合体、すなわちCRISPR複合体を使用して標的遺伝子の転写調節領域が編集される場合、CRISPR複合体を使用して標的遺伝子の転写調節領域が切断され得る。CRISPR複合体を使用して損傷を受けた転写調節領域は、NHEJによって修復され得る。損傷した転写調節領域では、NHEJによってインデルが生成され、それによって転写調節領域の活性が増加し、正常な標的遺伝子または染色体の発現が誘導される。本明細書に開示される1つの例示的な実施形態では、gRNA-CRISPR酵素複合体は、重複遺伝子の転写調節領域に人為的な操作または修飾を加えることができる。
gRNA-CRISPR酵素複合体は、重複遺伝子の転写調節領域内の標的配列を特異的に認識し得る。
ここで、重複遺伝子は、PMP22遺伝子、PLP1遺伝子、MECP2遺伝子、SOX3遺伝子、RAI1遺伝子、TBX1遺伝子、ELN遺伝子、JAGGED1遺伝子、NSD1遺伝子、MMP23遺伝子、LMB1遺伝子、SNCA遺伝子およびAPP遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
あるいは、重複遺伝子は、MYC遺伝子、ERBB2(HER2)遺伝子、CCND1(サイクリンD1)遺伝子、FGFR1遺伝子、FGFR2遺伝子、HRAS遺伝子、KRAS遺伝子、MYB遺伝子、MDM2遺伝子、CCNE(サイクリンE)遺伝子、MET遺伝子、CDK4遺伝子、ERBB1遺伝子、MYCN遺伝子およびAKT2遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
転写調節領域の説明は上記の通りである。
標的配列は、gRNA-CRISPR酵素複合体のgRNAによって特異的に認識され得るため、gRNA-CRISPR酵素複合体は、認識された標的配列の近くに位置し得る。
標的配列は、重複遺伝子の転写調節領域で人為的な修飾が起こる部位または領域であり得る。
標的配列の説明は上記の通りである。
例示的な一実施形態では、標的配列は、表1、2、3および4に列挙されている1つまたは複数のヌクレオチド配列であり得る。
gRNA-CRISPR酵素複合体は、gRNAとCRISPR酵素からなる。
gRNAは、重複遺伝子の転写調節領域内の標的配列のガイド核酸結合配列に部分的または完全に相補的に結合することができるガイドドメインを含み得る。
ガイドドメインは、ガイド核酸結合配列に対して少なくとも70%、75%、80%、85%、90%、95%以上が相補的、または完全に相補的であり得る。
ガイドドメインは、重複遺伝子の転写調節領域内の標的配列のガイド核酸結合配列に相補的なヌクレオチド配列を含み得る。ここで、相補的ヌクレオチド配列は、0~5、0~4、0~3、または0~2個のミスマッチを含み得る。
gRNAは、第1の相補的ドメイン、リンカードメイン、第2の相補的ドメイン、近位ドメインおよびテールドメインからなる群より選択される1つまたは複数のドメインを含み得る。
ここで、CRISPR酵素は、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)由来のCas9タンパク質、カンピロバクター・ジェジュニ(Campylobacter jejuni)由来のCas9タンパク質、ストレプトコッカス・サーモフィラス(Streptococcus thermophilus)由来のCas9タンパク質、スタフィロコッカス・アウレウス(Staphylococcus aureus)由来のCas9タンパク質およびナイセリア・メニンギティディス(Neisseria meningitidis)由来のCas9タンパク質およびCpf1タンパク質からなる群より選択される1つまたは複数の酵素であり得る。一例では、エディタータンパク質は、カンピロバクター・ジェジュニ(Campylobacter jejuni)由来のCas9タンパク質またはスタフィロコッカス・アウレウス(Staphylococcus aureus)由来のCas9タンパク質であり得る。
gRNA-CRISPR酵素複合体は、重複遺伝子の転写調節領域にさまざまな人為的な操作または修飾を加えることができる
重複遺伝子の人為的に操作または修飾された転写調節領域は、標的配列に位置するか、標的配列の5'末端および/または3'末端に隣接して位置する1~50bpの連続したヌクレオチド配列領域に対する以下の1つまたは複数の改変を含み得る:
i)1つまたは複数のヌクレオチドの欠失、
ii)1つまたは複数のヌクレオチドの野性型遺伝子とは異なるヌクレオチドへの置換、
iii)1つまたは複数のヌクレオチドの挿入、または
iv)i)~iii)から選択される2つ以上の組合せ。
たとえば、重複遺伝子の人為的に操作または修飾された転写調節領域は、標的配列に位置するか、標的配列の5'末端および/または3'末端に隣接して位置する1~50bpの連続したヌクレオチド配列領域内の1つまたは複数のヌクレオチドの欠失を含み得る。一例では、欠失ヌクレオチドは、1、2、3、4または5つの連続的または非連続的な塩基対であり得る。別の例では、欠失ヌクレオチドは、2bp以上の連続したヌクレオチドからなるヌクレオチド断片であり得る。ここで、ヌクレオチド断片は、2~5、6~10、11~15、16~20、21~25、26~30、31~35、36~40、41~45、または46~50塩基対であり得る。さらに別の例では、欠失ヌクレオチドは2つ以上のヌクレオチド断片であり得る。ここで、2つ以上のヌクレオチド断片は、それぞれ非連続的なヌクレオチド配列、すなわち1つまたは複数のヌクレオチド配列ギャップを有するヌクレオチド断片であり得、2つ以上の欠失ヌクレオチド断片による2つ以上の欠失部位を有し得る。
あるいは、たとえば、重複遺伝子の人為的に操作または修飾された転写調節領域は、標的配列に位置するか、標的配列の5'末端および/または3'末端に隣接して位置する1~50bpの連続したヌクレオチド配列領域内の1つまたは複数のヌクレオチドの挿入を含み得る。一例では、挿入されるヌクレオチドは、1、2、3、4または5つの連続した塩基対であり得る。別の例では、挿入されるヌクレオチドは、5つ以上の連続した塩基対からなるヌクレオチド断片であり得る。ここで、ヌクレオチド断片は、5~10、11~50、50~100、100~200、200~300、300~400、400~500、500~750、または750~1000塩基対であり得る。さらに別の例では、挿入されるヌクレオチドは、特異的遺伝子の部分的または完全なヌクレオチド配列であり得る。ここで、特異的遺伝子は、外部から入力された遺伝子であり、重複遺伝子を有するヒト細胞などの対象には含まれない。あるいは、特異的遺伝子は、たとえばヒト細胞のゲノムに存在する遺伝子などの重複遺伝子とともに、ヒト細胞などの対象に含まれる遺伝子であり得る
あるいは、たとえば、重複遺伝子の人為的に操作または修飾された転写調節領域は、標的配列に位置するか、標的配列の5'末端および/または3'末端に隣接して位置する1~50bpの連続したヌクレオチド配列領域内の1つまたは複数のヌクレオチドの欠失および挿入を含み得る。一例では、欠失ヌクレオチドは、1、2、3、4または5つの連続的または非連続的な塩基対であり得る。ここで、挿入されるヌクレオチドは、1、2、3、4または5つの塩基対;ヌクレオチド断片;または特異的遺伝子の部分的または完全なヌクレオチド配列であり得、欠失および挿入は順次または同時に起こり得る。ここで、挿入されるヌクレオチド断片は、5~10、11~50、50~100、100~200、200~300、300~400、400~500、500~750、または750~1000塩基対であり得る。ここで、特異的遺伝子は、重複遺伝子を有するヒト細胞などの対象の外部から入力された遺伝子であり得る。あるいは、特異的遺伝子は、たとえばヒト細胞のゲノムに存在する遺伝子などの重複遺伝子とともに、ヒト細胞などの対象に含まれる遺伝子であり得る。別の例では、欠失ヌクレオチドは、2塩基対以上からなるヌクレオチド断片であり得る。ここで、欠失ヌクレオチド断片は、2~5、6~10、11~15、16~20、21~25、26~30、31~35、36~40、41~45、または46~50塩基対であり得る。ここで、挿入されるヌクレオチドは、1、2、3、4または5塩基対;ヌクレオチド断片;または特異的遺伝子の部分的または完全なヌクレオチド配列であり得、欠失および挿入は順次または同時に起こり得る。さらに別の例では、欠失ヌクレオチドは2つ以上のヌクレオチド断片であり得る。ここで、挿入されるヌクレオチドは、1、2、3、4または5塩基対;ヌクレオチド断片;または特異的遺伝子の部分的または完全なヌクレオチド配列であり得、欠失および挿入は順次または同時に起こり得る。加えて、欠失された2つ以上の部位の一部またはすべてで挿入が起こり得る。
gRNA-CRISPR酵素複合体は、gRNAおよびCRISPR酵素の種類に応じて、重複遺伝子の転写調節領域にさまざまな人為的な操作または修飾を加えることができる。
一例では、CRISPR酵素がSpCas9タンパク質である場合、重複遺伝子の人為的に操作または修飾された転写調節領域は、標的領域に存在する5'-NGG-3'(Nは、A、T、GまたはCである)PAM配列の5'末端および/または3'末端に隣接して位置する1~50bp、1~40bp、1~30bp、または好ましくは1~25bpの連続したヌクレオチド配列領域に以下の1つまたは複数の改変を含み得る:
i)1つまたは複数のヌクレオチドの欠失、
ii)1つまたは複数のヌクレオチドの野性型遺伝子とは異なるヌクレオチドへの置換、
iii)1つまたは複数のヌクレオチドの挿入、または
iv)i)~iii)から選択される2つ以上の組合せ。
別の例では、CRISPR酵素がCjCas9タンパク質である場合、重複遺伝子の人為的に操作または修飾された転写調節領域は、標的配列に存在する5'-NNNNRYAC-3'(Nは、それぞれ独立してA、T、CまたはGであり、Rは、AまたはGであり、Yは、CまたはTである)PAM配列の5'末端および/または3'末端に隣接して位置する1~50bp、1~40bp、1~30bp、または好ましくは1~25bpの連続したヌクレオチド配列領域に以下の1つまたは複数の改変を含み得る:
i)1つまたは複数のヌクレオチドの欠失、
ii)1つまたは複数のヌクレオチドの野性型遺伝子とは異なるヌクレオチドへの置換、
iii)1つまたは複数のヌクレオチドの挿入、または
iv)i)~iii)から選択される2つ以上の組合せ。
さらに別の例では、CRISPR酵素がStCas9タンパク質である場合、重複遺伝子の人為的に操作または修飾された転写調節領域は、標的配列に存在する5'-NNAGAAW-3'(Nは、それぞれ独立してA、T、CまたはGであり、Wは、AまたはTである)PAM配列の5'末端および/または3'末端に隣接して位置する1~50bp、1~40bp、1~30bp、または好ましくは1~25bpの連続したヌクレオチド配列領域に以下の1つまたは複数の改変を含み得る:
i)1つまたは複数のヌクレオチドの欠失、
ii)1つまたは複数のヌクレオチドの野性型遺伝子とは異なるヌクレオチドへの置換、
iii)1つまたは複数のヌクレオチドの挿入、または
iv)i)~iii)から選択される2つ以上の組合せ。
一例では、CRISPR酵素がNmCas9タンパク質である場合、重複遺伝子の人為的に操作または修飾された転写調節領域は、標的配列に存在する5'-NNNNGATT-3'(Nは、それぞれ独立してA、T、CまたはGである)PAM配列の5'末端および/または3'末端に隣接して位置する1~50bp、1~40bp、1~30bp、または好ましくは1~25bpの連続したヌクレオチド配列領域に以下の1つまたは複数の改変を含み得る:
i)1つまたは複数のヌクレオチドの欠失、
ii)1つまたは複数のヌクレオチドの野性型遺伝子とは異なるヌクレオチドへの置換、
iii)1つまたは複数のヌクレオチドの挿入、または
iv)i)~iii)から選択される2つ以上の組合せ。
別の例では、CRISPR酵素がSaCas9タンパク質である場合、重複遺伝子の人為的に操作または修飾された転写調節領域は、標的配列に存在する5'-NNGRR(T)-3'(Nが、それぞれ独立してA、T、CまたはGであり、RがAまたはGであり、(T)が任意に含まれる配列を指す)PAM配列の5'末端および/または3'末端に隣接して位置する1~50bp、1~40bp、1~30bp、または好ましくは1~25bpの連続したヌクレオチド配列領域に以下の1つまたは複数の改変を含み得る:
i)1つまたは複数のヌクレオチドの欠失、
ii)1つまたは複数のヌクレオチドの野性型遺伝子とは異なるヌクレオチドへの置換、
iii)1つまたは複数のヌクレオチドの挿入、または
iv)i)~iii)から選択される2つ以上の組合せ。
さらに別の例では、CRISPR酵素がCpf1タンパク質である場合、重複遺伝子の人為的に操作または修飾された転写調節領域は、標的配列に存在する5'-TTN-3'(Nは、A、T、CまたはGである)PAM配列の5'末端および/または3'末端に隣接して位置する1~50bp、1~40bp、1~30bp、または好ましくは1~25bpの連続したヌクレオチド配列領域に以下の1つまたは複数の改変を含み得る:
i)1つまたは複数のヌクレオチドの欠失、
ii)1つまたは複数のヌクレオチドの野性型遺伝子とは異なるヌクレオチドへの置換、
iii)1つまたは複数のヌクレオチドの挿入、または
iv)i)~iii)から選択される2つ以上の組合せ。
gRNA-CRISPR酵素複合体による重複遺伝子の転写調節領域を人為的に操作する効果はノックアウトであり得る。
gRNA-CRISPR酵素複合体による重複遺伝子によりコードされるタンパク質の発現は阻害され得る。
gRNA-CRISPR酵素複合体による重複遺伝子の転写調節領域を人為的に操作する効果はノックダウンであり得る。
gRNA-CRISPR酵素複合体による重複遺伝子によりコードされるタンパク質の発現は減少し得る。
gRNA-CRISPR酵素複合体による重複遺伝子の転写調節領域を人為的に操作する効果はノックインであり得る。
ここで、ノックイン効果は、gRNA-CRISPR酵素複合体と、外因性のヌクレオチド配列または遺伝子を追加で含むドナーによって誘導され得る。
gRNA-CRISPR酵素複合体とドナーによる重複遺伝子の転写調節領域を人為的に操作する効果は、外因性のヌクレオチド配列または遺伝子によりコードされるペプチドまたはタンパク質を発現させることにより誘導され得る。
ここで、ノックイン効果は、gRNA-CRISPR酵素複合体と、挿入が望まれるヌクレオチド配列を含むドナーによって誘導され得る。本明細書で開示される一態様は、発現を制御する方法に関する。
本明細書に開示される1つの例示的な実施形態は、in vivo、ex vivoまたはin vitroで行われ得る重複遺伝子の発現を制御する方法に関する。
いくつかの実施形態では、この方法は、ヒトまたは非ヒト動物からの細胞または細胞のコロニーをサンプリングし、1つまたは複数の細胞を修飾することを含み得る。培養は、ex vivoのどの段階でも行われ得る。1つまたは複数の細胞は、非ヒト動物または植物に再導入され得る。
この方法は、真核細胞を人為的に改変する方法であり得、それは、重複遺伝子を有する真核細胞に発現制御組成物を導入することを含む。
発現制御組成物の説明は上記の通りである。
一実施形態では、発現制御組成物は以下のものを含み得る:
(a)重複遺伝子の転写調節領域に位置する標的配列を標的とすることができるガイド核酸またはそれをコードする核酸配列;および
(b)ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)由来のCas9タンパク質、カンピロバクター・ジェジュニ(Campylobacter jejuni)由来のCas9タンパク質、ストレプトコッカス・サーモフィラス(Streptococcus thermophilus)由来のCas9タンパク質、スタフィロコッカス・アウレウス(Staphylococcus aureus)由来のCas9タンパク質およびナイセリア・メニンギティディス(Neisseria meningitidis)由来のCas9タンパク質およびCpf1タンパク質、または当該タンパク質をコードする核酸配列からなる群より選択される1つまたは複数のタンパク質を含むエディタータンパク質。
ここで、重複遺伝子は、PMP22遺伝子、PLP1遺伝子、MECP2遺伝子、SOX3遺伝子、RAI1遺伝子、TBX1遺伝子、ELN遺伝子、JAGGED1遺伝子、NSD1遺伝子、MMP23遺伝子、LMB1遺伝子、SNCA遺伝子およびAPP遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
あるいは、重複遺伝子は、MYC遺伝子、ERBB2(HER2)遺伝子、CCND1(サイクリンD1)遺伝子、FGFR1遺伝子、FGFR2遺伝子、HRAS遺伝子、KRAS遺伝子、MYB遺伝子、MDM2遺伝子、CCNE(サイクリンE)遺伝子、MET遺伝子、CDK4遺伝子、ERBB1遺伝子、MYCN遺伝子およびAKT2遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
転写調節領域の説明は上記の通りである。
ガイド核酸とエディタータンパク質は、個々の核酸配列の形態で、またはガイド核酸とエディタータンパク質の結合により複合体を形成することによって、1つまたは複数のベクターに存在してもよい。
任意に、発現制御組成物は、挿入されることが望ましい核酸配列またはそれをコードする核酸配列を含むドナーをさらに含み得る。
ガイド核酸、エディタータンパク質および/またはドナーは、個々の核酸配列の形態で1つまたは複数のベクターに存在してもよい。
導入段階は、in vivoまたはex vivoで行われ得る。
たとえば、導入段階は、エレクトロポレーション、リポソーム、プラスミド、ウイルスベクター、ナノ粒子、およびタンパク質移行ドメイン(PTD)融合タンパク質法から選択される1つまたは複数の方法に行われ得る。
たとえば、ウイルスベクターは、レトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴ウイルス(AAV)、ワクシニアウイルス、ポックスウイルスまたは単純ヘルペスウイルスからなる群より選択される1つまたは複数のものであり得る。本明細書に開示される一態様は、発現を制御して遺伝子重複疾患を治療するための組成物を使用して遺伝子重複疾患を治療する方法に関する。
本明細書に開示される例示的な一実施形態は、重複遺伝子の転写調節領域を治療対象に人為的に操作するための発現制御組成物の投与を含む方法を用いた遺伝子重複疾患の治療の使用に関する。
ここで、治療対象には、ヒト、サルなどの霊長類、ならびにマウスおよびラットなどの齧歯類を含む哺乳類が含まれ得る。
遺伝子重複疾患の説明は上記の通りである。
例示的な一実施形態では、遺伝子重複疾患は、PMP22遺伝子の重複により生じる疾患であり得る。
一例では、PMP22遺伝子の重複によって生じる疾患は、シャルコー・マリー・トゥース病1A型(CMT1A)、デジェリン・ソッタス病(DSS)、先天性低髄鞘形成不全神経障害(CHN)、またはルーシー・レヴィー症候群(RLS)であり得る。
- シャルコー・マリー・トゥース病(CMT) CMT疾患は、ヒト染色体で起こる遺伝子重複によって引き起こされる遺伝性疾患であり、手足の末梢神経の発達に関与する遺伝子が変異によって複製され、それによってシャンパンボトルを逆さにしたような形状などの変形が引き起こされる。CMT疾患は、米国では100,000人中36人に起こる比較的よく見られる遺伝性神経疾患であり、患者数は世界で280万人であり、韓国でも約17,000人と推定される。CMT疾患は、遺伝的側面に従って、CMT1、CMT2、CMT3、CMT4およびCMTXの合計5つのタイプに大きく分類され、CMT1、CMT2およびCMT3が優性で、子供では50%の確率で遺伝され、CMT4は劣性で、25%の確率で遺伝される。CMT1とCMT2は、ほとんどの国内患者で優性に遺伝され(それぞれ80%と20~40%)、CMT3とCMT4は非常にまれである。CMTXは、X染色体に沿った母系を通じて遺伝されるが、その頻度は10~20%である。CMT1は、ニューロンの軸索を囲む髄鞘のタンパク質の形成に関与する遺伝子重複による遺伝子発現の正常なプロセスを行えないことによって引き起こされる疾患である。CMT1は3つのタイプに分類される。CMT1Aは常染色体優性遺伝病であり、染色体番号17 17p11.2-p12に位置するPMP22遺伝子の重複によって引き起こされ、髄鞘の重要なコンポーネントであるPMP22の過剰発現によって引き起こされる髄鞘の構造的および機能的異常をもたらす。
CMT2は軸索異常に関連し、神経伝導速度が正常状態に近い間に運動感覚神経の活動電位がかなり低下した神経障害であり、CMT3はきわめて希少な常染色体劣性遺伝病として幼少期に起こり、臨床症状と神経伝導速度の低下が非常に激しいタイプである。CMT4はまた、発症年齢が早く、臨床症状が重度のタイプであり、常染色体劣性遺伝され、X染色体と関連付けられている間にCMTXが起こるタイプであり、男性のその症状は、女性の症状よりも重篤である。
デジェリン・ソッタス病(Dejerine-Sottas syndrom、DSS)
DSSは、幼い頃に起こる脱髄性運動感覚神経障害であり、通常、常染色体優性遺伝される疾患であるが、常染色体劣性遺伝もされ、重度の脱髄性神経障害を示し、乳児期からの運動神経の異常を示し、非常に遅い神経伝導と脳脊髄液中の特定のタンパク質の増加を示すことを特徴とする。デジェリン・ソッタス病の進行速度は非常に速く、歩行障害が幼い頃から始まり、遺伝もされるが、散発的に起こる。CMT1Aと同様に、PMP22の重複がDSSの一部の患者のうちに見られ、加えて、対応する遺伝子のミスセンス変異が存在することが確認された。
- 先天性髄鞘形成不全神経障害(CHN)CHNは、出生直後に症状が現れる神経系疾患であり、その主な症状として、呼吸不全、筋力低下、筋肉運動不調和、筋緊張の低下、反射喪失、運動協調障害(運動神経症;運動失調症)、麻痺または感覚異常が現れ、同じ割合で男女に影響を及ぼす。CHNは、運動神経と感覚神経に障害が起こる遺伝病であり、髄鞘の脱髄と髄鞘再生が繰り返される間に、髄鞘形成が減少することを特徴とする。
- ルーシー・レヴィー症候群(RLS)
RLSは、希少なタイプの遺伝性運動感覚神経障害であり、1926年にルーシーとレヴィー他によって最初に記述され、手足の振戦、歩行損失などが他の遺伝性運動感覚神経障害よりも深刻なケースであるが、後に同じ症状がさまざまな遺伝性運動感覚神経障害サブタイプで発見されたため、RLSは、遺伝性運動感覚神経障害に現れる1つの症状と現在見なされている。RLSの場合、ミエリンタンパク質ゼロ遺伝子としてのMPZ遺伝子の変異は、RLSを有することが最初に報告された患者の遺伝子検査で発見され、他の患者では、末梢神経のミエリンタンパク質22の遺伝子としてPMP22遺伝子の重複があるケースが報告されている。
例示的な一実施形態では、遺伝子重複疾患は、PLP1遺伝子の重複により生じる疾患であり得る。
一例では、PLP1遺伝子の重複により生じる疾患は、ペリツェウス・メルツバッハー病(PMD)であり得る。
- ペリツェウス・メルツバッハー病(PMD)
ペリツェウス・メルツバッハー病(PMD)(PMD)は、中枢神経系の白質の髄鞘発育不全によるさまざまな神経症状を示す非常に希少なスダノフィル性白質ジストロフィーである。その有病率は約1/400,000と推定される。1885年にペリツェウスが初めて報告したものは、染色体X依存的に遺伝される発達性脳対麻痺を有し、疾患の初めに示される眼振、運動失調、こわばり、後天性小頭症を特徴とする1つのファミリーである。PMDの臨床徴候は、乳児期および小児期の初期に現れ、PMDの特徴的な臨床症状は、振子眼振、喘鳴、精神運動発達障害または変性、運動失調、不規則運動、不随意運動、口腔機能障害、および精神遅滞である。
PMDは、オリゴデンドロサイトの減少とプロテオリピドタンパク質(PLP)の合成障害による中枢神経系の白質の髄鞘発育不全によって引き起こされる神経変性疾患または白質ジストロフィーである。プロテオリピドタンパク質(PLP)は、中枢神経系の髄鞘に最も豊富に存在するタンパク質であり、染色体Xの長腕に位置するPLP1遺伝子(Xq22)の変異により異常に発現または産生され、中枢神経系に髄鞘発育不全を引き起こす。PMDは、脳組織病理学的に、脂質と反応するアゾ化合物によって引き起こされるスーダンレッドに対して親和性を有し、髄鞘の分解を指し、半卵円中心、小脳および脳幹で観察される。しかしながら、分解産物が見つからないため、PMDの原因は、脱髄ではなく、髄鞘発育不全または髄鞘形成不全であると考えられる。一般に、PMDの先天型は、完全な髄鞘形成不全によって特徴付けられ、PMDの古典型は、部分的な髄鞘形成不全によって特徴付けられる。部分的な髄鞘形成不全が起こると、正常な髄質白質は虎斑の外観を示す。髄鞘形成不全を伴う病変の軸索とニューロンは、一般によく保存され、希少なオリゴデンドロサイトの数は減少し、アストロサイトと線維性グリオーシスの増加が白質に見られ、萎縮が小多脳回と小脳の顆粒層に見られる。男性患者の80%以上で、染色体Xの長腕に位置するPLP1遺伝子(Xq22)の変異が見つかっている。これらの患者のうち、10~30%が遺伝子に点突然変異を有しており、この場合、より重篤な臨床症状を示すことが知られている。PLP1遺伝子全体を複製する現象は、PMD患者の60~70%以上でより頻繁に見られる。最近、PLP1遺伝子は染色体Xに位置しているため、一般に、PMDは染色体X依存的に遺伝され、家族歴を有し、ほとんどが男性に起こる。しかしながら、PMDの病因はPLP1遺伝子だけでは説明され得ず、PMDの先天型は常染色体劣性であり、PMDの成人型は常染色体優性であり、またはPMDは家族歴なしで散発的に起こる。まれに、PMDの症状は女性でもほとんど発現されないことが報告されている。
例示的な一実施形態では、遺伝子重複疾患は、MECP2遺伝子の重複により起こる疾患であり得る。
一例では、MECP2遺伝子の重複によって引き起こされる疾患はMECP2重複症候群であり得る。
- MECP2重複症候群
MECP2重複症候群と呼ばれる脳疾患は、MECP2遺伝子を有する染色体Xの特異領域で起こる遺伝物質の重複によって引き起こされる。この疾患にはさまざまな症状が伴われ、筋緊張低下、発達遅延、呼吸器感染、発語異常、発作、自閉症行動および重度の知的障害などの症状が含まれる。
この疾患は遺伝性疾患であるが、家族歴がなくても起こる。MECP2重複症候群は、主に男性で起こり、MECP2遺伝子欠損により起こるレット症候群は、主に女性で起こる。
例示的な一実施形態では、遺伝子重複疾患は、RAI1遺伝子の重複によって引き起こされる疾患であり得る。
一例では、RAI1遺伝子重複によって引き起こされる疾患は、ポトツキ-ルプスキ症候群(PTLS)であり得る。
- ポトツキ-ルプスキ症候群(PTLS)
PTLSは、17番染色体の短腕に11.2領域(17p11.2)の微小重複を有する連続遺伝子症候群であり、1996年にPTLSの最初の研究事例が報告された。PTLSは、レチノイン酸誘導-1(RAI1)遺伝子を有する17p11.2での1.3~3.7Mbの重複により起こることが知られている。PTLSは希少疾患とみなされ、その発生率は20,000人の新生児に1人と予想される。PTLSは、さまざまな先天性異常と精神遅滞を特徴とし、PTLSの症例の80%は自閉症スペクトラム障害を有している。加えて、PTLSの他の特有の特性には、睡眠時無呼吸、構造的心血管異常、異常な社会的行動、学習障害、注意欠陥障害、強迫行動および身長の低さが含まれる。
例示的な一実施形態では、遺伝子重複疾患は、ELN遺伝子の重複によって引き起こされる疾患であり得る。
一例では、ELN遺伝子重複によって引き起こされる疾患は、ウィリアムズ・ビューレン症候群(WBS)であり得る。
- ウィリアムズ・ビューレン症候群(WBS)
WBSは、特徴的な臨床所見を有する7番染色体の異常に関連する近位遺伝子症候群であり、WBSの発生率は20,000人の新生児に1人である。7番染色体(7q11.23)の長腕の近位部分の微小欠失の原因として、この領域では、血管壁などの弾性組織を形成するエラスチンタンパク質の産生に関連するエラスチン遺伝子、および認知能力に関連するLIMK1遺伝子を含むさまざまな遺伝子が位置している。そのような遺伝子の欠失により、さまざまな特徴的な外観と臨床症状が示される。7q11.23の微小欠失はほとんどの場合には天然に起こり、微小欠失の家族歴が示されることはめったにない。WBSの子供は、わずかに隆起した小さな鼻先、長い人中、幅広な口、ふっくらした唇、小さな頬(頬部低形成)、腫れぼったい目、爪の形成障害、および外反母趾などの特徴的な外観を有している。
例示的な一実施形態では、遺伝子重複疾患は、JAGGED1遺伝子の重複によって引き起こされる疾患であり得る。
一例では、JAGGED1遺伝子の重複によって引き起こされる疾患は、アラジール症候群(AS)であり得る。
- アラジール症候群(AS)
ASは、肝臓の胆管の数がかなり減少し、胆汁うっ滞を誘導し、心血管系、骨格系、眼球、顔、膵臓、および神経発達の異常を伴う症候群である。 外国の報告によると、ASの発生率は1/100,000であり、疾患の特性により、軽度の症状の患者を含む場合、その発生率は高くなると予想される。ASは、20番染色体の短腕に位置するJAGGED1遺伝子の異常により起こる。現在、原因となる変異または重複が、遺伝子検査により症例の50~70%で見られることが知られている。
ASの臨床症状は、一般に生後3ヶ月以内に表れる。ASは、黄疸と胆汁うっ滞が連続しているために新生児期によく見られ、慢性肝疾患のために小児期に見られ、成人期後期にも見られる。ASにはさまざまな臨床症状があり、不完全に遺伝されることがあるため、診断が難しくなり得る。ほとんどの患者は、黄疸と胆汁うっ滞の症状、それに起因するかゆみ、乳児期に進行性肝不全を有している。黄疸は、ほとんどの患者で観察され、半数を超える患者で小児期後半まで続く。胆汁うっ滞に起因するかゆみが起こり、一部の子供は皮下組織に黄色腫を有している。肝臓の合成機能は比較的よく維持されているが、患者の約20%は肝硬変と肝不全を発症する。
例示的な一実施形態では、遺伝子重複疾患は、SNCA遺伝子の重複によって引き起こされる疾患であり得る。
一例では、SNCA遺伝子の重複によって引き起こされる疾患は、パーキンソン病であり得る。
- パーキンソン病
パーキンソン病は、通常、振戦、筋肉のこわばり、動作緩慢などの運動障害をよく示す疾患である。パーキンソン病が適切に治療されないと、運動障害が徐々に進行し、歩行や日常活動が困難になる。パーキンソン病は、主に高齢者に起こる疾患であり、年齢とともに疾患の発症リスクが徐々に増加し得る。韓国には正確な統計データはないが、パーキンソン病は1,000人中1~2人の割合で起こると推定される。高齢者で起こるパーキンソン病のほとんどの症例は、さまざまな研究を通じて遺伝的要因による影響が少ないことが知られている。しかしながら、40歳未満の若い年齢で起こるパーキンソン病の一部の症例は、遺伝的要因に関連していることが知られている。
パーキンソン病は、黒質に存在するドーパミンニューロンが徐々に死ぬため、ドーパミン濃度の低下によって引き起こされる疾患である。パーキンソン病の別の病理学的特徴は、脳剖検で観察されるタンパク質凝集体の形成であり、これはレビー小体と呼ばれる。レビー小体は、主要コンポーネントであるα-シヌクレインと呼ばれるタンパク質を有し、レビー小体とα-シヌクレインは、レビー小体認知症やシヌクレイノパチーなどの他の疾患にも関連している。α-シヌクレインの凝集は、中脳ではなく迷走神経と前嗅核で始まり、最終段階で中脳を介して大脳皮質に広がる。α-シヌクレインがパーキンソン病の進行に従って脳のさまざまな領域に広範囲に広がるという仮説は、α-シヌクレインが1つの細胞から放出されて別の細胞に伝達されるという最近の報告によって裏付けられている。
パーキンソン病の遺伝率は、レビー小体の主要コンポーネントであるα-シヌクレインの変異体(A53TおよびA30P)がパーキンソン病を誘導するという報告によって最初に示唆された。その後、α-シヌクレイン遺伝子(SNCA)の重複と三重化がパーキンソン病の他の原因であると報告されていた。これは、α-シヌクレインタンパク質の変異に加えて、正常なタンパク質の過剰発現が細胞内でのα-シヌクレインの蓄積と凝集体の形成につながり、パーキンソン病の発症をもたらすことを意味する。
例示的な一実施形態では、遺伝子重複疾患は、APP遺伝子の重複によって引き起こされる疾患であり得る。
一例では、APP遺伝子重複によって引き起こされる疾患は、アルツハイマー病であり得る。
- アルツハイマー病
アルツハイマー病は、記憶の進行性変性につながる脳の異常によって引き起こされる疾患である。加えて、アルツハイマー病は認知症を引き起こし、これが日常生活を妨げるのに十分な知的機能(思考、記憶および推理)の深刻な喪失をもたらす。ほとんどの場合、アルツハイマー病は65歳を超えて起こるが、65歳以前に発生することはめったにないとされ得る。米国では、65~74歳の約3%、75~84歳の約19%、85歳以上の約50%がアルツハイマー病に罹患している。韓国では、農村地域に基づいた最近の調査によると、60歳以上の人の約21%が認知症であり、罹患者の約63%がアルツハイマー型認知症であることが報告されている。2006年には、世界で266,000人がアルツハイマー病に罹患した。アルツハイマー病は2050年までに85人に1人に影響を及ぼすと予想されている。
この疾患の特徴は人によって異なるが、それらのいくつかは罹患者に共通している。初期の症状は、加齢に起因する単純な症状やストレスに起因する症状と誤解される傾向がある。疾患の初期段階では、罹患者は、名前、日付および場所が記憶から消える共通の短期記憶喪失を経験する。疾患が悪化すると、混乱、集中行動、双極性障害、言語障害、および長期記憶喪失の症状が示される。その結果、身体機能が失われ、死に至る。個人ごとに異なる症状があるため、疾患が人にどのような影響を及ぼすのかを予測することは困難である。アルツハイマー病が疑われる場合、通常、思考または行動能力が検査される診断が行われ、必要に応じて脳検査が行われる。しかしながら、正確な診断のためには、脳神経を調査する必要がある。アルツハイマー病が起こっているにもかかわらず、一般に疾患が完全に診断されるまでに時間がかかるため、診断なしで数年間疾患が進行することがある。疾患が起こった場合、平均余命は7年であり、罹患者の3%未満が診断後14年存命している。
アルツハイマー病は、神経変性疾患に分類される。この疾患の原因は完全には理解されていないが、アミロイド斑が正常なアルツハイマー病のタンパク質を修飾して斑の塊を形成し、内因性機能が失われると推定される。アルツハイマー病は、全体的な脳萎縮、心室拡大、神経原線維変化および神経炎性プラークなどの組織病理学的特徴を有している。
例示的な一実施形態では、遺伝子重複疾患は、SOX3遺伝子、TBX1遺伝子、NSD1遺伝子、MMP23遺伝子またはLMB1遺伝子の重複によって引き起こされる疾患であり得る。
一例では、遺伝子重複疾患は、X連鎖下垂体機能低下症(XLHP)、ヴェロカルディオフェイシャル症候群(VCFS)、成長遅延症候群、早期閉鎖頭蓋縫合または常染色体優性白質ジストロフィー(ADLD)であり得る。
例示的な一実施形態では、遺伝子重複疾患は、癌遺伝子の重複により生じる癌であり得る。
ここで、癌遺伝子は、MYC遺伝子、ERBB2(HER2)遺伝子、CCND1(サイクリンD1)遺伝子、FGFR1遺伝子、FGFR2遺伝子、HRAS遺伝子、KRAS遺伝子、MYB遺伝子、MDM2遺伝子、CCNE(サイクリンE)遺伝子、MET遺伝子、CDK4遺伝子、ERBB1遺伝子、MYCN遺伝子およびAKT2遺伝子であり得る。
一例では、遺伝子重複疾患は、乳癌、子宮頸癌、結腸直腸癌、食道癌、胃癌、膠芽腫、頭頸部癌、肝細胞癌、神経芽細胞腫、卵巣癌、肉腫または小細胞肺癌であり得る。
本明細書に開示される例示的な一実施形態は、重複遺伝子の転写調節領域を人為的に操作することができる発現制御組成物を含む医薬組成物を提供する。
発現制御組成物の説明は上記の通りである。
例示的な一実施形態では、発現制御組成物は以下のものを含み得る:
(a)重複遺伝子の転写調節領域に位置する標的配列を標的とすることができるガイド核酸またはそれをコードする核酸配列;および
(b)ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)由来のCas9タンパク質、カンピロバクター・ジェジュニ(Campylobacter jejuni)由来のCas9タンパク質、ストレプトコッカス・サーモフィラス(Streptococcus thermophilus)由来のCas9タンパク質、スタフィロコッカス・アウレウス(Staphylococcus aureus)由来のCas9タンパク質およびナイセリア・メニンギティディス(Neisseria meningitidis)由来のCas9タンパク質およびCpf1タンパク質、または当該タンパク質をコードする核酸配列からなる群より選択される1つまたは複数のタンパク質を含むエディタータンパク質。
ここで、重複遺伝子は、PMP22遺伝子、PLP1遺伝子、MECP2遺伝子、SOX3遺伝子、RAI1遺伝子、TBX1遺伝子、ELN遺伝子、JAGGED1遺伝子、NSD1遺伝子、MMP23遺伝子、LMB1遺伝子、SNCA遺伝子およびAPP遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
あるいは、重複遺伝子は、MYC遺伝子、ERBB2(HER2)遺伝子、CCND1(サイクリンD1)遺伝子、FGFR1遺伝子、FGFR2遺伝子、HRAS遺伝子、KRAS遺伝子、MYB遺伝子、MDM2遺伝子、CCNE(サイクリンE)遺伝子、MET遺伝子、CDK4遺伝子、ERBB1遺伝子、MYCN遺伝子およびAKT2遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
転写調節領域の説明は上記の通りである。
ガイド核酸とエディタータンパク質のそれぞれは、核酸配列の形態で、またはガイド核酸とエディタータンパク質の結合により複合体を形成することによって、1つまたは複数のベクターに存在してもよい。
任意に、発現制御組成物は、挿入されることが望ましい核酸配列またはそれをコードする核酸配列を含むドナーをさらに含み得る。
ガイド核酸、エディタータンパク質および/またはドナーのそれぞれは、核酸配列の形態で1つまたは複数のベクターに存在してもよい。
医薬組成物は、追加の要素をさらに含み得る。
追加の要素は、対象の体内への送達に適したキャリアを含み得る。
本明細書に開示される例示的な一実施形態は、遺伝子重複疾患を治療する方法を提供し、これは、遺伝子重複疾患を治療する遺伝子重複疾患を有する生物に遺伝子改変用組成物を投与することを含む。
治療方法は、生体に存在する重複遺伝子の転写調節領域を操作することにより重複遺伝子の発現を制御する治療方法であり得る。そのような方法は、生体に存在する重複遺伝子の転写調節領域を操作するための発現制御組成物を直接注入することにより行われ得る。
発現制御組成物の説明は上記の通りである。
例示的な一実施形態では、発現制御組成物は以下のものを含み得る:
(a)重複遺伝子の転写調節領域に位置する標的配列を標的とすることができるガイド核酸またはそれをコードする核酸配列;および
(b)ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)由来のCas9タンパク質、カンピロバクター・ジェジュニ(Campylobacter jejuni)由来のCas9タンパク質、ストレプトコッカス・サーモフィラス(Streptococcus thermophilus)由来のCas9タンパク質、スタフィロコッカス・アウレウス(Staphylococcus aureus)由来のCas9タンパク質およびナイセリア・メニンギティディス(Neisseria meningitidis)由来のCas9タンパク質およびCpf1タンパク質、または当該タンパク質をコードする核酸配列からなる群より選択される1つまたは複数のタンパク質を含むエディタータンパク質。
ここで、重複遺伝子は、PMP22遺伝子、PLP1遺伝子、MECP2遺伝子、SOX3遺伝子、RAI1遺伝子、TBX1遺伝子、ELN遺伝子、JAGGED1遺伝子、NSD1遺伝子、MMP23遺伝子、LMB1遺伝子、SNCA遺伝子およびAPP遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
あるいは、重複遺伝子は、MYC遺伝子、ERBB2(HER2)遺伝子、CCND1(サイクリンD1)遺伝子、FGFR1遺伝子、FGFR2遺伝子、HRAS遺伝子、KRAS遺伝子、MYB遺伝子、MDM2遺伝子、CCNE(サイクリンE)遺伝子、MET遺伝子、CDK4遺伝子、ERBB1遺伝子、MYCN遺伝子およびAKT2遺伝子からなる群より選択される1つまたは複数の遺伝子であり得る。
転写調節領域の説明は上記の通りである。
ガイド核酸とエディタータンパク質のそれぞれは、核酸配列の形態で、またはガイド核酸とエディタータンパク質の結合により複合体を形成することによって、1つまたは複数のベクターに存在してもよい。
任意に、発現制御組成物は、挿入されることが望ましい核酸配列またはそれをコードする核酸配列を含むドナーをさらに含み得る。
ガイド核酸、エディタータンパク質および/またはドナーのそれぞれは、核酸配列の形態で1つまたは複数のベクターに存在してもよい。
ここで、ベクターは、プラスミドまたはウイルスベクターであり得る。
ここで、ウイルスベクターは、レトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴ウイルス(AAV)、ワクシニアウイルス、ポックスウイルスまたは単純ヘルペスウイルスからなる群より選択される1つまたは複数のものであり得る。
遺伝子重複疾患の説明は上記のとおりである。
遺伝子重複疾患は、シャルコー・マリー・トゥース病1A型(CMT1A)、デジェリン・ソッタス病(DSD)、先天性髄鞘形成不全神経障害(CHN)、ルーシー・レヴィー症候群(RLS)、ペリツェウス・メルツバッハー病(PMD)、MECP2重複症候群、X連鎖下垂体機能低下症(XLHP)、ポトツキ-ルプスキ症候群(PTLS)、ヴェロカルディオフェイシャル症候群(VCFS)、ウィリアムズ・ビューレン症候群(WBS)、アラジール症候群(AS)、成長遅延症候群、早期閉鎖頭蓋縫合、常染色体優性白質ジストロフィー(ADLD)、パーキンソン病またはアルツハイマー病であり得る。
加えて、癌は、乳癌、子宮頸癌、結腸直腸癌、食道癌、胃癌、膠芽腫、頭頸部癌、肝細胞癌、神経芽細胞腫、卵巣癌、肉腫または小細胞肺癌であり得る。
発現制御組成物は、遺伝子重複疾患を有する治療対象に投与され得る。
治療対象には、ヒト、サルなどの霊長類、ならびにマウスおよびラットなどの齧歯類を含む哺乳類が含まれ得る。
発現制御組成物は、治療対象に投与され得る。
投与は、注入、輸液、インプランテーションまたはトランスプランテーションにより行われ得る。
投与は、神経内、網膜下、皮下、皮内、眼内、硝子体内、腫瘍内、結節内、髄内、筋肉内、静脈内、リンパ内、および腹腔内経路から選択される投与経路を介して行われ得る。
発現制御組成物の用量(所定の所望の効果を得るための薬学的有効量)は、約10~10細胞/kg(投与対象の体重)、たとえば約10~10細胞/kg(体重)であり、この数値範囲のすべての整数から選択され得るが、本発明はそれらに限定されない。 組成物は、投与対象の年齢、健康状態および体重、同時治療の種類、ならびに可能であれば治療の頻度および所望の効果を考慮して適切に処方され得る。
重複遺伝子の転写調節領域が、本明細書に開示されるいくつかの例示的な実施形態による方法および組成物によって人為的に操作される場合、重複遺伝子のmRNAおよび/またはタンパク質の発現が制御され得るため、異常に発現される重複遺伝子の発現を正常に制御する効果を得ることができる。
以下、実施例を参照して本発明をさらに詳細に説明する。
これらの実施例は、本発明をさらに詳細に説明するために提供されているに過ぎず、本発明の範囲が以下の実施例に限定されないことは当業者には明らかであろう。
実験方法
1.gRNAの設計
CRISPR RGEN Tools(www.rgenome.net)を使用して、ヒトPMP22遺伝子、ヒトPLP1遺伝子、およびマウスPLP1遺伝子のCRISPR/Cas9標的領域をスクリーニングした。PMP22遺伝子とPLP1遺伝子の標的領域は、CRISPR酵素の種類によって異なり得る。プロモーター領域(TATAボックス)およびエンハンサー領域(たとえば、EGR2、SOX10またはTEAD1結合領域)の標的配列;またはSpCas9のヒトPMP22遺伝子の遠位エンハンサー領域BもしくはCを、上記の表1にまとめており、CjCas9のヒトPMP22遺伝子のプロモーター領域(TATAボックス)およびエンハンサー領域(たとえばEGR2またはSOX10結合領域)の標的配列を表2にまとめている。加えて、SpCas9のヒトPLP1遺伝子のプロモーター領域(TATAボックス領域)およびエンハンサー領域(たとえばwmN1エンハンサー)の標的配列を上記の表3にまとめており、CjCas9のヒトPLP1遺伝子のプロモーター領域(TATAボックス領域)およびエンハンサー領域(たとえばwmN1エンハンサー)の標的配列を上記の表4にまとめている。SpCas9のマウスPLP1遺伝子のプロモーター領域(TATAボックス領域)およびエンハンサー領域(たとえばwmN1エンハンサー)の標的配列を上記の表5にまとめており、CjCas9のマウスPLP1遺伝子のプロモーター領域(TATAボックス領域)およびエンハンサー領域(たとえばwmN1エンハンサー)の標的配列は、上記の表6にまとめている。
すべてのgRNAは、キメラ一本鎖RNA(sgRNA)の形態で生成した。標的配列を除くCjおよびSp特異的なsgRNAの骨格配列は、5'-GUUUUAGUCCCUGAAAAGGGACUAAAAUAAAGAGUUUGCGGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'(SEQ ID NO:328)および5'-GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'(SEQ ID NO:329)である。
2.gRNAの構築と合成
sgRNAをAAVベクターにパッケージングするか、RNAで合成した。ウイルスベクターにsgRNAを挿入するために、sgRNAの20~22塩基配列に対応するDNAオリゴヌクレオチドを設計およびアニーリングし、BsmBIサイトを使用してpRGEN-CAS9(自社開発)ベクターにライゲーションした。Cas9および5'末端に可変標的配列を含むsgRNAを、それぞれCMVおよびU6プロモーターを介して発現させた。
さらに、RNPによる送達システムでは、Phusion Taqを介した重合によって生成される2つの部分的に相補的なオリゴヌクレオチドをアニーリングすることによりテンプレートを生成した後、sgRNAをT7 RNAポリメラーゼによって転写した。転写したsgRNAを精製し、分光法を使用して定量化した。
3.Cas9タンパク質の精製
NLSおよびHAエピトープを含むコドン最適化Cas9 DNA配列をpET28ベクターにサブクローニングし、最適な培養条件下でIPTGを使用してBL21(DE3)で発現させた。発現させたCas9タンパク質をNi-NTAアガロースビーズを使用して精製し、適切な緩衝液で透析した。Cas9の活性は、周知の有効なsgRNAを使用したin vitro切断試験で確認した。
4.細胞培養
メーカーのマニュアルに従って、ヒトシュワン様細胞株(ATCC)およびヒト初代シュワン細胞(ScienCell)を培養した。ヒトシュワン様細胞は、1×ペニシリン/ストレプトマイシン(WelGene)および10%ウシ胎児血清(WelGene)を添加した高濃度のグルコースを含むダルベッコ変法イーグル培地(DMEM)(WelGene)で培養した。
ヒト初代シュワン細胞は、ベンダーが提供するシュワン細胞培養液(ScienCell)で維持した。分化のために、1%ウシ胎児血清(WelGene)、髄鞘形成(ミエリン形成)シグナル用のNrg1(Peprotech)100ng/mL、およびdbcAMP(Sigma-Aldrich)100μMを添加した低濃度のグルコースを含むDMEM(WelGene)で細胞を7日間培養した。
5.形質導入(トランスフェクション)
形質導入(トランスフェクション)のために、4μgのCas9タンパク質(ToolGen)と1μgのsgRNAを含むRNP複合体を室温で15分間インキュベートした。その後、RNP複合体を、10μlのエレクトロポレーションチップとNeonネオンエレクトロポレーター(ThermoFisher)を使用してエレクトロポレーションし、2×10個の細胞に送達した。標的化ディープシーケンシングでは、ゲノムDNA(gDNA)を形質導入の72時間後に形質導入細胞から収集した。
6.In vitroリアルタイムPCR(qRT-PCR)
RNeasy minikit(Qiagen)を使用して、メーカーのプロトコルに従ってヒト初代シュワン細胞からmRNAを抽出した。その後、高容量cDNA逆転写キット(ThermoFisher)を使用して、100ngのmRNAを逆転写した。QuantStudio 3(ThermoFisher)を使用したメーカーのプロトコルに従って、100ngのTaqman Gene発現マスターミックスでqRT-PCRを行った。Ct値を使用してPMP22発現レベルを計算し、GAPDHを内因性対照として使用した。本研究で使用したTaqmanプローブ(ThermoFisher)を下記の表7にまとめている。
[表7]
Figure 2022023144000065
7.標的化ディープシーケンシング
Phusionポリメラーゼtaq(New England BioLabs)を使用して、形質導入細胞から抽出されたgDNAからPCRによってオンターゲットサイトを増幅した。その後、PCR増幅産物としてMi-Seq(Illumina)を使用して、ペアエンドディープシーケンシングを行った。オンラインのCas-Analyzerツール(www.rgenome.net)を使用して、ディープシーケンシングの結果を分析した。Cas9によるインデルのその結果、PAM配列の3bp上流で変異が起こったかどうかを確認した。本研究で使用したプライマーは、下記の表8にまとめている。
[表8]
Figure 2022023144000066
Figure 2022023144000067
8.in silicoオフターゲットサイトの設計
オフターゲットの可能性があるサイトは、オンラインツール(www.rgenome.net)を使用してin silicoで設計した。最大3bpのミスマッチをオフターゲットサイトとみなした。
9.Digenome-seq
DNeasy Blood&Tissue Kit(Qiagen)を使用して、ベンダーのプロトコルに従ってHeLa細胞のゲノムDNAを精製した。あらかじめインキュベートしたCas9タンパク質(100nM)およびsgRNA(300nM)を、1mLの反応溶液(100mMのNaCl、50mMのTris-HCl、10mMのMgCl、100μg/mlのBSA、pH7.9)でゲノムDNA(10μg)と37℃にて8時間混合した。切断されたゲノムDNAをRNase A(50μg/mL)で処理し、DNeasy Tissue Kit(Qiagen)を使用して再度精製した。1μgの切断されたゲノムDNAをCovarisシステムを使用して断片に断片化し、ライブラリーを作成するためのアダプターをDNA断片に付加した。その後、ライブラリーは、HiSeq X Ten Sequencer(Illumina)を使用して、30~40×(Macrogen)の配列深度で全ゲノムシーケンシング(WGS)にかけた。In vitro切断スコアを、ゲノムにおける切断された各塩基配列の位置でのDNA切断スコアリングシステムによって計算した。
10.マウスと神経内注入
本研究で使用したC22マウス系統(B6;CBACa-Tg(PMP22)C22Clh/H)をMRC Harwell(Oxfordshire,UK)から購入した。C22マウス(オス4匹、メス7匹)をPMP22-TATA RNPで処理した。神経内注入は、以前の研究と同じ方法で行った(Daisuke Ino.,J Vis Exp.,(2016)115)。6日齢のマウスに麻酔をかけ、手術によりマウスの坐骨神経を露出させた。神経損傷を最小限に抑えるために、坐骨切痕の終わりに、マイクロインジェクターに取り付けられている引っ張られたガラス製マイクロピペットを直ちに使用して、神経内注入を直ちに行った。マウスあたり11μgのCas9タンパク質と2.75μgのsgRNAのRNP複合体を、Lipofectamine 3000(Invitrogen,Carlsbad,CA,USA)とともにマウスに注入した。本研究で使用したすべての動物の管理、使用および処理は、国際実験動物ケア評価認証協会に従って、Samsung Animal Management and Use Committee(SMC-20170206001)が立案したガイドラインのもとで行った。
11.ロータロッド実験(ロータロッド試験)
ロータロッド装置(B.S.Technolab INC.,Korea)を使用して運動協調を評価した。この実験は、マウスのバランスと運動協調を評価するために行った。実験の前に、マウスは3日間のトレーニング期間を経た。実験では、ロータロッド実験用に水平回転ロッド(21rpm)を使用した。マウスの回転ロッドの保持時間を測定し、マウスを最大300秒間ロッドにとどまらせた。
12.電気生理学的試験
電気生理学的状態を評価するために、以前の研究と同じ方法で神経伝導試験(NCS)を行った。(Jinho Lee.,J Biomed Sci.,(2015)22,43)。要約すると、マウスを炭酸ガスで麻酔し、実験中に1.5%イソフルランを供給するノーズコーンを使用して麻酔を維持した。毛は端から後足まで完全に除去した。NCSは、Nicolet VikingQuest装置(Natus Medical)を使用して行った。坐骨神経の運動神経伝導試験では、遠位部と近位部からの反応をそれぞれ、腱に参照電極を取り付けた腓腹筋に活動記録針電極を配置し、記録電極に近い位置に、刺激負電極を、股関節の内側の中心および眼窩後部の大腿部の中心線に向かって6mmの距離で配置することにより測定した。遠位潜時(DL)、運動神経伝導速度(MNCV)、および複合筋活動電位(CMAP)の振幅を測定した。最大過刺激時にCMAPを測定した。
13.神経の組織構造と画像
マウスの坐骨神経を生検し、影響を受けたサンプルの病理学的検査を顕微鏡による分析により行った。2%グルタルアルデヒドを含む25mMカコジル酸バッファーを使用して、サンプルをそれぞれ固定した。半薄切片をトルイジンブルーで染色した。1%OsO4で1時間インキュベーションした後、サンプルをエタノールで脱水し、プロピレンオキシドを通過させ、エポキシ樹脂(Epon 812,Oken,Nagano,Japan)に包埋した。ライカウルトラミクロトーム(Leica Microsystems)を使用して、細胞を特定の厚さ(1μm)にスライスし、トルイジンブルーで30~45秒間染色した。g比(軸索直径/線維直径)は、Zeiss Zen 2プログラム(Carl Zeiss,Oberkochen,Germany)を使用してミエリンの内径と外径を測定することにより計算した。
14.統計分析
mRNA発現レベルに関連するデータの統計的有意性は、ポストホックTukeyの多重比較を使用した一元配置分散分析によって評価した。他の種類の提示データは、Mann-Whitney U試験(http://www.socscistatistics.com/tests/mannwhitney/Default2.aspx)を使用して計算した。本研究で作成したデータとグラフは、GraphPad Prismを使用して分析した。有意水準は0.05に設定した。
15.Plp1遺伝子ターゲティングのためのsgRNAスクリーニング
マウス線維芽細胞、NIH-3T3(ATCC、CRL-1658)、筋芽細胞、すなわちC2C12系統(ATCC、CRL-1772)およびオリゴデンドロサイト細胞、N20.1(Cedarlane Laboratories,CLU108-P)をメーカーのマニュアルに従って培養した。細胞は、1×ペニシリン/ストレプトマイシン(WelGene)および10%ウシ胎児血清(WelGene)を添加した高濃度グルコース含有ダルベッコ変法イーグル培地(DMEM)で37℃および5%COで培養した。CRISPR/Cas9組成物のトランスフェクションのために、4μgのCas9タンパク質と1μgのsgRNAまたはCjCas9プラスミドからなるRNP複合体(SpCas9)(図18)を調製した。その後、RNP複合体またはCjCas9プラスミドを、10μlのエレクトロポレーションチップとNeonエレクトロポレーター(ThermoFisher)を使用したエレクトロポレーションにより2×10個の細胞に送達した。トランスフェクションの72時間後の標的化ディープシーケンシングでは、トランスフェクトされた細胞からゲノムDNA(gDNA)を収集した。
16.Plp1遺伝子のダウンレギュレーションアッセイ
RNeasy mini kit(Qiagen)を使用して、メーカーのプロトコルに従ってN20.1細胞株からmRNAを抽出した。その後、高容量cDNA逆転写キット(ThermoFisher)を使用して、1μgのmRNAを逆転写した。メーカーのプロトコルに従って、QuantStudio 3(ThermoFisher)を使用して、100ngのTaqman遺伝子発現マスターミックスでリアルタイム定量逆転写ポリメラーゼ連鎖反応(qRT-PCR)を行った。C値を使用してPlp1発現レベルを計算し、Gapdhを内因性対照として使用した。この研究で使用したTaqmanプローブ(ThermoFisher)を、下記の表9にまとめている。
[表9]
Figure 2022023144000068
17. PLP1遺伝子ターゲティングのためのsgRNAスクリーニング
ヒトリンパ芽球Jurkat細胞株(ATCC,TIB-152)およびヒト上皮293T細胞株(ATCC,CRL-3216)をメーカーのマニュアルに従って培養した。細胞は、1×ペニシリン/ストレプトマイシン(WelGene)および10%ウシ胎児血清(WelGene)を添加した高濃度グルコース含有ダルベッコ変法イーグル培地(DMEM)で37℃および5%COで培養した。CRISPR/Cas9組成物のトランスフェクションのために、4μgのCas9タンパク質と1μgのsgRNAまたはCjCas9プラスミドからなるRNP複合体(SpCas9)(図18)を調製した。その後、RNP複合体またはCjCas9プラスミドを、10μlのエレクトロポレーションチップとNeonエレクトロポレーター(ThermoFisher)を使用したエレクトロポレーションにより2×10個の細胞に送達した。トランスフェクションの72時間後の標的化ディープシーケンシングでは、トランスフェクトされた細胞からゲノムDNA(gDNA)を収集した。
実施例1.PMP22遺伝子のsgRNAスクリーニング
ヒトPMP22の発現を正常範囲に減少させることができる治療的に有効なsgRNA配列をスクリーニングするために、PMP遺伝子のプロモーター(TATAボックス)およびイントロンエンハンサー結合部位を標的とするように設計されたさまざまなsgRNAおよびCas9でヒト細胞株を形質導入した。要するに、JurkatヒトT細胞をSpCas9スクリーニングに使用し、HEK293T細胞をCjCas9に使用した。gDNAを細胞から収集し、標的化ディープシーケンシングにかけた。sgRNA配列によって誘導される変異のさまざまなパターンは、NHEJを介したインデルによって同定された。いくつかのSpCas9-sgRNAは、2つの調節部位にインデルを強く誘導した(図1aおよび図1b)。インデルの30~40%が特異的CjCas9-sgRNAで誘導されることが確認された(図2aおよび図2b)。
実施例2.シュワン様細胞の遺伝子操作
sgRNAによって引き起こされた有効なインデル変異がヒト細胞で同定されたが、その効果がシュワン細胞でも可能かどうかは不確定である。したがって、シュワン細胞におけるPMP22発現阻害と遺伝子操作の効果を調査するために、シュワン様細胞であるsNF2.0細胞を使用してSpCas9-sgRNA効果を確認した。Jurkat細胞で同定された有効なSpCas9-sgRNAをsNF02.0細胞で繰り返し試験した。形質導入後、同じ高インデル頻度が同じsgRNAによって得られたことが、ディープシーケンシング解析によって確認された。プロモーター(TATAボックス)部位およびエンハンサー結合部位を標的とする単一sgRNAの形質導入は、それぞれ31%および59%のインデルを誘導した(図3)。興味深いことに、ミエリン遺伝子の主要な制御因子(たとえばEGRまたはSOX10結合部位)または重要なTATAボックスを含む40~50bpの小さな欠失が、デュアルsgRNAで処理された細胞の非常に多くの細胞で見られた(図5)。
実施例3.遺伝子操作によるPMP22の発現制御
有効なsgRNAによるPMP22の発現の変化を評価するために、シュワン様細胞を分化させ、qRT-PCRを行った。その結果、PMP22を標的とするsgRNAのほとんどがPMP22の発現を有効に阻害した(図6)。単一sgRNAを使用した場合、PMP22の発現は、Cas9のみで処理した対照と比較して約30%減少し、デュアルsgRNAを使用した場合、PMP22の発現は、Cas9のみ処理した対照と比較して約50%減少した。
実施例4.シュワン細胞の遺伝子操作
PMP22の発現抑制と遺伝子操作効果がシュワン様細胞であらかじめ確認された後、前の結果がヒト初代シュワン細胞で同様の効果を示すかどうかが確認された。標的部位に応じたインデル頻度は、ヒト初代シュワン細胞のヒトPMP22遺伝子の各標的部位でSpCas9-sgRNAを使用して観察された。その結果、TATAボックス、エンハンサー、およびPMP22遺伝子のコード配列を標的とするsgRNAのほとんどの標的部位でインデル頻度が高いことが確認された(図7a)。さらに、TATAボックスとエンハンサーをそれぞれ標的とするデュアルsgRNAを使用した場合でも、高いインデル頻度が示された。標的部位でインデルが生じることが、遠位エンハンサー部位BおよびCをコードする配列を標的とするsgRNAを追加で使用して確認され(図7c)、この場合、APOC3を標的とするsgRNAを対照として使用した。
加えて、各標的部位でSpCas9-sgRNAがPMP22遺伝子の発現の減少を引き起こすかどうかを確認するために、qRT-PCR分析を行った。PMP22はシュワン細胞の分化の最終段階で転写されるため、ヒト初代シュワン細胞は、Neuregulin-1(Nrg1)およびジブチリル環状AMP(dbcAMP)を含む周知の分化シグナル因子で7日間処理した。その結果、Nrg1およびdbcAMPで処理しなかった細胞と比較して、Nrg1およびdbcAMPで処理した細胞ではPMP22の発現が9倍増加することが確認された。対照的に、細胞を各標的部位でSpCas9-sgRNAで処理した場合、PMP22の発現が4~6倍誘導されることが確認された。これは、各標的部位でのSpCas9-sgRNAによるPMP22の各標的部位修飾に起因したPMP22の発現阻害によるものであると判断される(図7b)。
実施例5.ヒトPMP22遺伝子のTATAボックス部位を標的とするCRISPR/Cas9を使用したPMP22の有効かつ特異的な発現の減少の効果
実験を、あらかじめスクリーニングされたTATAボックス部位を標的とするsgRNAsの中で高いインデル効率を示し、TATAボックスを標的とし得るsgRNA_TATA_Sp#1(以下、PMP22-TATA sgRNAと記載)を選択することにより、ヒト初代シュワン細胞で行った。インデルを、ヒト初代シュワン細胞にsgRNAおよびCas9タンパク質を含むRNP複合体を形質導入することにより誘導し(図8bの(b))、標的化ディープシーケンシング解析を介して、総インデルの89.54±1.39%がヒトPMP22のTATAボックス部位で生成されたことが確認された(図8bの(c))。
加えて、PMP22のTATAボックスで形成された変異がPMP22遺伝子の発現の減少を引き起こしたかどうかを確認するために、qRT-PCR分析を行った。PMP22はシュワン細胞の分化の最終段階で転写されるため、ヒト初代シュワン細胞は、Neuregulin-1(Nrg1)およびジブチリル環状AMP(dbcAMP)を含む周知の分化シグナル因子で7日間処理した。その結果、Nrg1およびdbcAMPで処理しなかった細胞と比較して、Nrg1およびdbcAMPで処理した細胞ではPMP22の発現が9倍増加することが確認された。対照的に、細胞をPMP22-TATA RNPと一緒に処理した場合、PMP22の発現が6倍誘導されることが確認された。これは、CRISPR/Cas9によるPMP22のTATA修飾によるPMP22の発現阻害によるものであると判断される(図8b)。分化シグナル因子とAAVS1標的RNPの両方で処理された対照では、PMP22遺伝子の発現に違いは確認され得なかった。
PMP22-TATA RNPの特異性を確認するために、in silicoベースのオフターゲット分析を行った。標的化ディープシーケンシングにより、in silico分析により確認されたオフターゲット部位で、シーケンシングエラー率(平均0.1%)を超えるインデル変異は確認されなかった(図9a)。in silicoベースのオフターゲット分析は偏りのあるアプローチであり得るため、Digenome-seq(偏りのないシーケンシングベースのオフターゲット分析全体)も行った。その結果、in vitroでPMP22-TATA RNPにより切断された9つのオフターゲット部位を確認することができた(図10a、図10b)。しかしながら、標的化ディープシーケンシングによる再分析の結果、オフターゲットサイトで異常なインデル変異は見られなかった(図10c)。
これらの結果は、PMP22-TATA RNPによるPMP22のTATAボックスの有効かつ特異的な修飾が、ヒト初代シュワン細胞におけるPMP22の転写レベルを制御し得ることを示している。
実施例6.CMT1AマウスにおけるCRISPR/Cas9を介したPMP22の発現阻害による疾患表現型の軽減効果
in vivoでのPMP22-TATA RNPによるPMP22転写制御を試験するために、リポソームに囲まれたPMP22-TATA RNPをC22マウスの坐骨神経に直接注入した(図11)。この場合、Rosa26(mRosa26)を標的とするRNP複合体を対照として使用した。mRosa26 RNPまたはPMP22-TATA RNPを6日齢(p6)マウスの左坐骨神経(同側)に神経内注入して送達し、右坐骨神経を内部対照(対側)として使用した。注入の4週間後、坐骨神経からゲノムDNAを収集することにより、標的化ディープシーケンシングを介してRNP複合体の神経内送達効率を確認した。その結果、mRosa26 RNPおよびPMP22-TATA RNPでそれぞれ処理されたすべての坐骨神経は、約11%のインデル効率を示した(図12のa)。さらに、98.48±0.15%のTATAボックス変異が、in vitro結果と一致する全体のインデルシーケンシング読み取りにおいて確認された(図12のb)。
加えて、in vivoでのTATAボックス変異によるPMP22の発現阻害を確認するために、坐骨神経全体から抽出したmRNAのqRT-PCR分析をRNP処理した坐骨神経に対して行った。in vitro結果と同様に、PMP22遺伝子の発現が対照と比較して38%減少したことが確認された(図12のc)。
PMP22-TATA RNPによって坐骨神経にオフターゲット変異が起こったかどうかを確認するために、in silicoベースのオフターゲット分析を行った。その結果、マウスゲノムから3bp以上のミスマッチを含む8つのオフターゲットが確認され(図13a)、標的化ディープシーケンシングを行った結果、PMP22-TATA RNPで処理した神経(同側)からシーケンシングエラー率を超えるインデル変異は確認されなかった(図13b)。
PMP22-TATA RNAによって引き起こされるPMP22の転写の減少が脱髄を防ぐことができるかどうかを試験するために、PMP22-TATA RNPまたはmRosa26 RNPで処理したC22マウスの坐骨神経を得て、その半薄断面をトルイジンブルーで染色した(ミエリン染色)。さらに、g比を測定するために、軸索直径および線維(ミエリンを含む軸索)直径を測定した。その結果、PMP22-TATA RNPで処理した実験群では、より厚いミエリンシートが形成されたことが確認され得た(図14a、図14b)。加えて、実験群をPMP22-TATA RNPで処理した場合、mRosa26 RNPで処理した対照と比較して、大きな直径を有する軸索の数が増加することがわかった(図14a、図14b)。PMP22-TATA RNPで処理した実験群(16.5%)で直径6μm以上の大きな有髄線維の数を測定した結果が、対照群よりもはっきりとした治療効果を示している(2.6%、p<0.01)。
ミエリン形成の組織学的分析の大幅な改善を考慮して、2つの群の電気生理学的プロファイルを調査した。その結果、mRosa26 RNPで処理された対照(図15のa、図15のb)と比較して、PMP22-TATA RNPで処理された実験群の坐骨神経では、遠位潜時(DL)が減少し、運動神経伝導速度(NCV)が増加したことが確認され、これらの結果は、PMP22-TATA RNPで処理された神経におけるミエリンの厚さと軸索直径の増加に対応する。さらに、PMP22-TATA RNPで処理された神経において複合筋活動電位(CMAP)の振幅がかなり増加したことが確認され(図15のc)、これは前の結果に対応する。
PMP22-TATA RNPによる組織学的および電気生理学的に改善された効果を考慮して、マウスの運動行動をロータロッド実験で分析した。その結果、PMP22-TATA RNPで処理されたマウス(11~16週齢)は、mRosa26 RNPで処理されたマウス(11~16週齢)よりもロッド上に長く留まることが確認された(図16a)。さらに、MP22-TATA RNPで処理されたマウスは、mRosa26 RNPで処理されたマウスと比較して筋肉が増加したことが確認された(図16b)。
これらの結果は、CMT1AなどのPMP22の過剰発現による脱髄を軽減または治療するためのPMP22-TATA RNPの治療効果を示している。
したがって、前述の結果は、PMP22のプロモーター部位を標的とするCRISPR/Cas9を使用したPMP22の発現阻害効果を示している。さらに、これらの結果は、C22マウスの坐骨神経へのPMP22-TATA RNPの直接の非ウイルス送達が、PMP22の過剰発現によって引き起こされる脱髄に関連する臨床的および神経病理学的表現型を改善し得ることを示している。したがって、PMP22の転写調節領域のCRISPR/Cas9を介した修飾は、CMT1Aおよび脱髄性神経障害を示す他の疾患の治療に優れた戦略であると考えられる。
実施例7.PLP遺伝子発現調節効果
PLP1遺伝子が複製されると、PLP1遺伝子が過剰発現し、PMD疾患の主な原因になる。したがって、PMD疾患の治療に対してPLP1転写を制御するために、PLP遺伝子の転写調節領域をCRISPR/Cas9を使用して人為的に改変し、その効果を確認した。
このために、SpCas9およびCjCas9スクリーニングを、マウスPlp1のプロモーター配列およびエンハンサー(wMN1)のTATAボックスに対して行い、最も高い活性を有するsgRNAを選択し、次いでqRT-PCRによりPlp1のダウンレギュレーションを確認した(図17)。ここで、Plp1のエンハンサーは、ASE(Hamdan et al.,2015;Meng et al.,2005;Wight,2017)またはwMN1(Hamdan et al.,2018;Tuason et al.,2008)領域であり得る。
sgRNAスクリーニングの結果に基づいて、高いインデル率を有するSpCas9およびCjCas9の各sgRNAの選択(図19~22および表10)を、Plp1のTATAボックスおよびwMN1エンハンサー領域が、オリゴデンドロサイト、すなわち、Plp1遺伝子を発現するN20.1細胞株を使用して標的にされた場合に行い、Plp1遺伝子のダウンレギュレーションにつながり得るものに関する研究を、qRT-PCRによって行った。
[表10]
Figure 2022023144000069
スクリーニングされたsgRNAリスト(mPlp1-TATA、mPlp1-wmN1 SpCas9およびCjCas9リードsgRNAリスト)
その結果、SpCas9およびCjCas9を使用したPlp1のTATAボックスまたはwmN1エンハンサー領域のターゲティングが、Plp1の有意なダウンレギュレーションをもたらすことが確認された(図23)。加えて、ヒトPLP1遺伝子のwmN1エンハンサー領域のSpCas9およびCjCas9スクリーニングを行って、インデル率(%)を確認した(図24および25)。
したがって、PLP1の転写調節領域のCRISPR/Cas9を介した人為的な修飾は、PMD治療の優れた戦略であると考えられる。
[項目1]
細胞のゲノムに存在する重複遺伝子の発現制御組成物であって、組成物は、重複遺伝子の転写調節領域内の標的配列を標的とすることができるガイド核酸またはガイド核酸をコードする核酸;および1つまたは複数のエディタータンパク質またはエディタータンパク質をコードする核酸を含み、
ここで、ガイド核酸は、重複遺伝子の転写調節領域内の標的配列を標的とすることができるガイドドメインを含み、
ここで、ガイドドメインは、重複遺伝子の転写調節領域内の標的配列のガイド核酸結合配列と相補的な結合を形成することができるヌクレオチド配列を含み、
ここで、ガイドドメインは、重複遺伝子の転写調節領域内の標的配列のガイド核酸結合配列と相補的に結合することができ、
ここで、相補的な結合は、0~5つのミスマッチ結合を含み、
ここで、ガイド核酸は、第1の相補的ドメイン、リンカードメイン、第2の相補的ドメイン、近位ドメインおよびテールドメインからなる群より選択される1つまたは複数のドメインを含み、
ここで、エディタータンパク質はCRISPR酵素であり、
ここで、ガイド核酸とエディタータンパク質は、ガイド核酸-エディタータンパク質複合体を形成することができ、
ここで、ガイド核酸-エディタータンパク質複合体は、ガイド核酸の部分核酸とエディタータンパク質のいくつかのアミノ酸との相互作用により形成することができる、発現制御組成物。
[項目2]
転写調節領域が、プロモーター領域、エンハンサー領域、サイレンサー領域、インシュレーター領域および遺伝子座制御領域(LCR)からなる群より選択される1つまたは複数の領域である、項目1に記載の発現制御組成物。
[項目3]
標的配列が、重複遺伝子の転写調節領域に位置する連続した10~25ヌクレオチド配列である、項目1に記載の発現制御組成物。
[項目4]
標的配列が、重複遺伝子のプロモーター領域内またはプロモーター領域に隣接して位置する連続した10~25ヌクレオチド配列である、項目1に記載の発現制御組成物。
[項目5]
標的配列が、重複遺伝子のコアプロモーター領域内またはコアプロモーター領域に隣接して位置する連続した10~25ヌクレオチド配列である、項目4に記載の発現制御組成物。
[項目6]
標的配列が、重複遺伝子のコアプロモーター内のTATAボックスを含む連続した10~25ヌクレオチド配列、またはTATAボックスに隣接する連続した10~25ヌクレオチド配列である、項目5に記載の発現制御組成物。
[項目7]
標的配列が、重複遺伝子のコアプロモーターに存在する5'-TATA-3'配列の全体または一部を含む連続した10~25ヌクレオチド配列である、項目5に記載の発現制御組成物。
[項目8]
標的配列が、重複遺伝子のコアプロモーターに存在する5'-TATAWAW-3'(W=AまたはT)配列の全体または一部を含む連続した10~25ヌクレオチド配列である、項目5に記載の発現制御組成物。
[項目9]
標的配列が、重複遺伝子のコアプロモーターに存在する5'-TATAWAWR-3'(W=AまたはT、R=AまたはG)配列の全体または一部を含む連続した10~25ヌクレオチド配列である、項目5に記載の発現制御組成物。
[項目10]
標的配列が、重複遺伝子のコアプロモーターに存在する5'-CATAAAA-3'配列、5'-CATAAAA-3'配列、5'-TATAA-3'配列、5'-TATAAAA-3'配列、5'-CATAAATA-3'配列、5'-TATATAA-3'配列、5'-TATATATATATATAA-3'配列、5'-TATATTATA-3'配列、5'-TATAAA-3'配列、5'-TATAAAATA-3'配列、5'-TATATA-3'配列、5'-GATTAAAAA-3'配列、5'-TATAAAAA-3'配列、5'-TTATAA-3'配列、5'-TTTTAAAA-3'配列、5'-TCTTTAAAA-3'配列、5'-GACATTTAA-3'配列、5'-TGATATCAA-3'配列、5'-TATAAATA-3'配列、5'-TATAAGA-3'配列、5'-AATAAA-3'配列、5'-TTTATA-3'配列、5'-CATAAAAA-3'配列、5'-TATACA-3'配列、5'-TTTAAGA-3'配列、5'-GATAAAG-3'配列、5'-TATAACA-3'配列、5'-TCTTATCTT-3'配列、5'-TTGTACTTT-3'配列、5'-CATATAA-3'配列、5'-TATAAAT-3'配列、5'-TATATATAAAAAAAA-3'配列および5'-CATAAATAAAAAAAATTA-3'配列からなる群より選択される1つまたは複数の配列の全体または一部を含む連続した10~25ヌクレオチド配列である、項目5に記載の発現制御組成物。
[項目11]
標的配列が、5'-TATA-3'配列、5'-CATAAAA-3'配列、5'-CATAAAA-3'配列、5'-TATAA-3'配列、5'-TATAAAA-3'配列、5'-CATAAATA-3'配列、5'-TATATAA-3'配列、5'-TATATATATATATAA-3'配列、5'-TATATTATA-3'配列、5'-TATAAA-3'配列、5'-TATAAAATA-3'配列、5'-TATATA-3'配列、5'-GATTAAAAA-3'配列、5'-TATAAAAA-3'配列、5'-TTATAA-3'配列、5'-TTTTAAAA-3'配列、5'-TCTTTAAAA-3'配列、5'-GACATTTAA-3'配列、5'-TGATATCAA-3'配列、5'-TATAAATA-3'配列、5'-TATAAGA-3'配列、5'-AATAAA-3'配列、5'-TTTATA-3'配列、5'-CATAAAAA-3'配列、5'-TATACA-3'配列、5'-TTTAAGA-3'配列、5'-GATAAAG-3'配列、5'-TATAACA-3'配列、5'-TCTTATCTT-3'配列、5'-TTGTACTTT-3'配列、5'-CATATAA-3'配列、5'-TATAAAT-3'配列、5'-TATATATAAAAAAAA-3'配列および5'-CATAAATAAAAAAAATTA-3'配列からなる群より選択される1つまたは複数の配列の3'末端または5'末端に位置する連続した10~25ヌクレオチド配列である、項目5に記載の発現制御組成物。
[項目12]
標的配列が、重複遺伝子のエンハンサー領域に位置する連続した10~25ヌクレオチド配列である、項目1に記載の発現制御組成物。
[項目13]
標的配列が、重複遺伝子のエンハンサー領域に隣接する連続した10~25ヌクレオチド配列である、項目1に記載の発現制御組成物。
[項目14]
標的配列が、重複遺伝子の転写調節領域内の核酸配列におけるPAM(プロトスペーサー隣接モチーフ)配列の5'末端および/または3'末端に隣接する連続した10~25ヌクレオチド配列である、項目1に記載の発現制御組成物。
[項目15]
PAM配列が、CRISPR酵素に従って決定される、項目14に記載の発現制御組成物。
[項目16]
CRISPR酵素がCas9タンパク質またはCpf1タンパク質である、項目1に記載の発現制御組成物。
[項目17]
Cas9タンパク質が、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)由来のCas9タンパク質、カンピロバクター・ジェジュニ(Campylobacter jejuni)由来のCas9タンパク質、ストレプトコッカス・サーモフィラス(Streptococcus thermophilus)由来のCas9タンパク質、スタフィロコッカス・アウレウス(Staphylococcus aureus)由来のCas9タンパク質およびナイセリア・メニンギティディス(Neisseria meningitidis)由来のCas9タンパク質からなる群より選択される1つまたは複数のCas9タンパク質である、項目16に記載の発現制御組成物。
[項目18]
重複遺伝子が、PMP22遺伝子、PLP1遺伝子、MECP2遺伝子、SOX3遺伝子、RAI1遺伝子、TBX1遺伝子、ELN遺伝子、JAGGED1遺伝子、NSD1遺伝子、MMP23遺伝子、LMB1遺伝子、SNCA遺伝子およびAPP遺伝子からなる群より選択される1つまたは複数の遺伝子である、項目1に記載の発現制御組成物。
[項目19]
細胞が真核細胞である、項目1に記載の発現制御組成物。
[項目20]
真核細胞が哺乳類細胞である、項目19に記載の発現制御組成物。
[項目21]
ガイド核酸とエディタータンパク質とがそれぞれ核酸の形態で1つまたは複数のベクターに存在する、項目1に記載の発現制御組成物。
[項目22]
ベクターがプラスミドまたはウイルスベクターである、項目21に記載の発現制御組成物。
[項目23]
ウイルスベクターは、レトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴ウイルス(AAV)、ワクシニアウイルス、ポックスウイルスおよび単純ヘルペスウイルスからなる群より選択される1つまたは複数のウイルスベクターである、項目22に記載の発現制御組成物。
[項目24]
重複遺伝子の発現制御組成物が、ガイド核酸とエディタータンパク質とをガイド核酸-エディタータンパク質複合体の形態で含む、項目1に記載の発現制御組成物。
[項目25]
重複遺伝子の発現制御組成物がドナーをさらに含む、項目1に記載の発現制御組成物。
[項目26]
真核細胞のゲノムに存在する重複遺伝子の発現を調節する方法であって、方法は、重複遺伝子の発現を制御するための発現制御組成物を導入する段階を含み、
ここで、発現制御組成物は、重複遺伝子の転写調節領域内に存在する標的配列を標的とすることができるガイド核酸またはガイド核酸をコードする核酸;および1つまたは複数のエディタータンパク質またはエディタータンパク質をコードする核酸を含み、
ここで、真核細胞は哺乳類細胞であり、
ここで、ガイド核酸は、重複遺伝子の転写調節領域に存在する標的配列を標的とすることができるガイドドメインを含み、
ここで、ガイドドメインは、重複遺伝子の転写調節領域内に存在する標的配列のガイド核酸結合配列と相補的な結合を形成することができ、
ここで、ガイドドメインは、重複遺伝子の転写調節領域内に存在する標的配列のガイド核酸結合配列と相補的に結合することができ、
ここで、相補的な結合は、0~5つのミスマッチ結合を含み、
ここで、ガイド核酸は、第1の相補的ドメイン、リンカードメイン、第2の相補的ドメイン、近位ドメインおよびテールドメインからなる群より選択される1つまたは複数のドメインを含み、
ここで、エディタータンパク質はCRISPR酵素であり、
ここで、CRISPR酵素はCas9タンパク質またはCpf1タンパク質であり、
ここで、ガイド核酸とエディタータンパク質とは、ガイド核酸-エディタータンパク質複合体を形成することができ、
ここで、ガイド核酸-エディタータンパク質複合体は、ガイド核酸の部分核酸とエディタータンパク質のいくつかのアミノ酸との相互作用により形成することができる、方法。
[項目27]
発現制御組成物が、ガイド核酸とエディタータンパク質とをガイド核酸-エディタータンパク質複合体の形態で含む、項目26に記載の方法。
[項目28]
発現制御組成物が、ガイド核酸とエディタータンパク質とをそれぞれ核酸の形態で含む1つまたは複数のベクターを含む、項目26に記載の方法。
[項目29]
導入を、エレクトロポレーション、リポソーム、ウイルスベクター、プラスミド、ナノ粒子およびタンパク質移行ドメイン(PTD)から選択される1つまたは複数の方法により行う、項目26に記載の方法。
[項目30]
遺伝子重複疾患を治療するための方法であって、方法は、治療対象において重複遺伝子の発現制御組成物を投与する段階を含み、
ここで、発現制御組成物は、重複遺伝子の転写調節領域内に存在する標的配列を標的とすることができるガイド核酸またはガイド核酸をコードする核酸;および1つまたは複数のエディタータンパク質またはエディタータンパク質をコードする核酸を含み、
ここで、ガイド核酸は、重複遺伝子の転写調節領域内に存在する標的配列を標的とすることができるガイドドメインを含み、
ここで、ガイドドメインは、重複遺伝子の転写調節領域内に存在する標的配列のガイド核酸結合配列と相補的な結合を形成することができ、
ここで、ガイドドメインは、重複遺伝子の転写調節領域内に存在する標的配列のガイド核酸結合配列と相補的に結合することができ、
ここで、相補的な結合は、0~5つのミスマッチ結合を含み、
ここで、ガイド核酸は、第1の相補的ドメイン、リンカードメイン、第2の相補的ドメイン、近位ドメインおよびテールドメインからなる群より選択される1つまたは複数のドメインを含み、
ここで、エディタータンパク質はCRISPR酵素であり、
ここで、CRISPR酵素はCas9タンパク質またはCpf1タンパク質であり、
ここで、ガイド核酸とエディタータンパク質とは、ガイド核酸-エディタータンパク質複合体を形成することができ、
ここで、ガイド核酸-エディタータンパク質複合体は、ガイド核酸の部分核酸とエディタータンパク質のいくつかのアミノ酸との相互作用により形成することができる、方法。
[項目31]
遺伝子重複疾患が、シャルコー・マリー・トゥース病1A型(CMT1A)、デジェリン・ソッタス病(DSD)、先天性髄鞘形成不全神経障害(CHN)、ルーシー・レヴィー症候群(RLS)、ペリツェウス・メルツバッハー病(PMD)、MECP2重複症候群、X連鎖下垂体機能低下症(XLHP)、ポトツキ-ルプスキ症候群(PTLS)、ヴェロカルディオフェイシャル症候群(VCFS)、ウィリアムズ・ビューレン症候群(WBS)、アラジール症候群(AS)、成長遅延症候群、早期閉鎖頭蓋縫合、常染色体優性白質ジストロフィー(ADLD)、パーキンソン病またはアルツハイマー病であり得る、項目30に記載の方法。
[項目32]
治療対象が、ヒト、サル、マウスおよびラットを含む哺乳類である、項目30に記載の方法。
[項目33]
投与を、注入、輸液、インプランテーションまたはトランスプランテーションにより行うことができる、項目30に記載の方法。
遺伝子重複疾患の治療薬は、重複遺伝子の発現を制御するための発現制御組成物を使用して得ることができる。たとえば、重複遺伝子の転写調節領域を標的とすることができるガイド核酸を含む発現制御組成物は、重複遺伝子の転写調節領域を人為的に操作および/または修飾することにより重複遺伝子の発現を制御することにより、遺伝子重複に起因する疾患の治療薬として使用することができる。
実施例で使用される重複遺伝子およびプライマー配列の転写調節領域の標的配列

Claims (33)

  1. 細胞のゲノムに存在する重複遺伝子の発現制御組成物であって、前記組成物は、前記重複遺伝子の転写調節領域内の標的配列を標的とすることができるガイド核酸または前記ガイド核酸をコードする核酸;および1つまたは複数のエディタータンパク質または前記エディタータンパク質をコードする核酸を含み、
    ここで、前記ガイド核酸は、前記重複遺伝子の前記転写調節領域内の前記標的配列を標的とすることができるガイドドメインを含み、
    ここで、前記ガイドドメインは、前記重複遺伝子の前記転写調節領域内の前記標的配列のガイド核酸結合配列と相補的な結合を形成することができるヌクレオチド配列を含み、
    ここで、前記ガイドドメインは、前記重複遺伝子の前記転写調節領域内の前記標的配列のガイド核酸結合配列と相補的に結合することができ、
    ここで、前記相補的な結合は、0~5つのミスマッチ結合を含み、
    ここで、前記ガイド核酸は、第1の相補的ドメイン、リンカードメイン、第2の相補的ドメイン、近位ドメインおよびテールドメインからなる群より選択される1つまたは複数のドメインを含み、
    ここで、前記エディタータンパク質はCRISPR酵素であり、
    ここで、前記ガイド核酸と前記エディタータンパク質は、ガイド核酸-エディタータンパク質複合体を形成することができ、
    ここで、前記ガイド核酸-エディタータンパク質複合体は、前記ガイド核酸の部分核酸と前記エディタータンパク質のいくつかのアミノ酸との相互作用により形成することができる、発現制御組成物。
  2. 前記転写調節領域が、プロモーター領域、エンハンサー領域、サイレンサー領域、インシュレーター領域および遺伝子座制御領域(LCR)からなる群より選択される1つまたは複数の領域である、請求項1に記載の発現制御組成物。
  3. 前記標的配列が、前記重複遺伝子の前記転写調節領域に位置する連続した10~25ヌクレオチド配列である、請求項1に記載の発現制御組成物。
  4. 前記標的配列が、前記重複遺伝子のプロモーター領域内または前記プロモーター領域に隣接して位置する連続した10~25ヌクレオチド配列である、請求項1に記載の発現制御組成物。
  5. 前記標的配列が、前記重複遺伝子のコアプロモーター領域内または前記コアプロモーター領域に隣接して位置する連続した10~25ヌクレオチド配列である、請求項4に記載の発現制御組成物。
  6. 前記標的配列が、前記重複遺伝子の前記コアプロモーター内のTATAボックスを含む連続した10~25ヌクレオチド配列、または前記TATAボックスに隣接する連続した10~25ヌクレオチド配列である、請求項5に記載の発現制御組成物。
  7. 前記標的配列が、前記重複遺伝子の前記コアプロモーターに存在する5'-TATA-3'配列の全体または一部を含む連続した10~25ヌクレオチド配列である、請求項5に記載の発現制御組成物。
  8. 前記標的配列が、前記重複遺伝子の前記コアプロモーターに存在する5'-TATAWAW-3'(W=AまたはT)配列の全体または一部を含む連続した10~25ヌクレオチド配列である、請求項5に記載の発現制御組成物。
  9. 前記標的配列が、前記重複遺伝子の前記コアプロモーターに存在する5'-TATAWAWR-3'(W=AまたはT、R=AまたはG)配列の全体または一部を含む連続した10~25ヌクレオチド配列である、請求項5に記載の発現制御組成物。
  10. 前記標的配列が、前記重複遺伝子の前記コアプロモーターに存在する5'-CATAAAA-3'配列、5'-CATAAAA-3'配列、5'-TATAA-3'配列、5'-TATAAAA-3'配列、5'-CATAAATA-3'配列、5'-TATATAA-3'配列、5'-TATATATATATATAA-3'配列、5'-TATATTATA-3'配列、5'-TATAAA-3'配列、5'-TATAAAATA-3'配列、5'-TATATA-3'配列、5'-GATTAAAAA-3'配列、5'-TATAAAAA-3'配列、5'-TTATAA-3'配列、5'-TTTTAAAA-3'配列、5'-TCTTTAAAA-3'配列、5'-GACATTTAA-3'配列、5'-TGATATCAA-3'配列、5'-TATAAATA-3'配列、5'-TATAAGA-3'配列、5'-AATAAA-3'配列、5'-TTTATA-3'配列、5'-CATAAAAA-3'配列、5'-TATACA-3'配列、5'-TTTAAGA-3'配列、5'-GATAAAG-3'配列、5'-TATAACA-3'配列、5'-TCTTATCTT-3'配列、5'-TTGTACTTT-3'配列、5'-CATATAA-3'配列、5'-TATAAAT-3'配列、5'-TATATATAAAAAAAA-3'配列および5'-CATAAATAAAAAAAATTA-3'配列からなる群より選択される1つまたは複数の配列の全体または一部を含む連続した10~25ヌクレオチド配列である、請求項5に記載の発現制御組成物。
  11. 前記標的配列が、5'-TATA-3'配列、5'-CATAAAA-3'配列、5'-CATAAAA-3'配列、5'-TATAA-3'配列、5'-TATAAAA-3'配列、5'-CATAAATA-3'配列、5'-TATATAA-3'配列、5'-TATATATATATATAA-3'配列、5'-TATATTATA-3'配列、5'-TATAAA-3'配列、5'-TATAAAATA-3'配列、5'-TATATA-3'配列、5'-GATTAAAAA-3'配列、5'-TATAAAAA-3'配列、5'-TTATAA-3'配列、5'-TTTTAAAA-3'配列、5'-TCTTTAAAA-3'配列、5'-GACATTTAA-3'配列、5'-TGATATCAA-3'配列、5'-TATAAATA-3'配列、5'-TATAAGA-3'配列、5'-AATAAA-3'配列、5'-TTTATA-3'配列、5'-CATAAAAA-3'配列、5'-TATACA-3'配列、5'-TTTAAGA-3'配列、5'-GATAAAG-3'配列、5'-TATAACA-3'配列、5'-TCTTATCTT-3'配列、5'-TTGTACTTT-3'配列、5'-CATATAA-3'配列、5'-TATAAAT-3'配列、5'-TATATATAAAAAAAA-3'配列および5'-CATAAATAAAAAAAATTA-3'配列からなる群より選択される1つまたは複数の配列の3'末端または5'末端に位置する連続した10~25ヌクレオチド配列である、請求項5に記載の発現制御組成物。
  12. 前記標的配列が、前記重複遺伝子のエンハンサー領域に位置する連続した10~25ヌクレオチド配列である、請求項1に記載の発現制御組成物。
  13. 前記標的配列が、前記重複遺伝子の前記エンハンサー領域に隣接する連続した10~25ヌクレオチド配列である、請求項1に記載の発現制御組成物。
  14. 前記標的配列が、前記重複遺伝子の前記転写調節領域内の核酸配列におけるPAM(プロトスペーサー隣接モチーフ)配列の5'末端および/または3'末端に隣接する連続した10~25ヌクレオチド配列である、請求項1に記載の発現制御組成物。
  15. 前記PAM配列が、前記CRISPR酵素に従って決定される、請求項14に記載の発現制御組成物。
  16. 前記CRISPR酵素がCas9タンパク質またはCpf1タンパク質である、請求項1に記載の発現制御組成物。
  17. 前記Cas9タンパク質が、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)由来のCas9タンパク質、カンピロバクター・ジェジュニ(Campylobacter jejuni)由来のCas9タンパク質、ストレプトコッカス・サーモフィラス(Streptococcus thermophilus)由来のCas9タンパク質、スタフィロコッカス・アウレウス(Staphylococcus aureus)由来のCas9タンパク質およびナイセリア・メニンギティディス(Neisseria meningitidis)由来のCas9タンパク質からなる群より選択される1つまたは複数のCas9タンパク質である、請求項16に記載の発現制御組成物。
  18. 前記重複遺伝子が、PMP22遺伝子、PLP1遺伝子、MECP2遺伝子、SOX3遺伝子、RAI1遺伝子、TBX1遺伝子、ELN遺伝子、JAGGED1遺伝子、NSD1遺伝子、MMP23遺伝子、LMB1遺伝子、SNCA遺伝子およびAPP遺伝子からなる群より選択される1つまたは複数の遺伝子である、請求項1に記載の発現制御組成物。
  19. 前記細胞が真核細胞である、請求項1に記載の発現制御組成物。
  20. 前記真核細胞が哺乳類細胞である、請求項19に記載の発現制御組成物。
  21. 前記ガイド核酸と前記エディタータンパク質とがそれぞれ核酸の形態で1つまたは複数のベクターに存在する、請求項1に記載の発現制御組成物。
  22. 前記ベクターがプラスミドまたはウイルスベクターである、請求項21に記載の発現制御組成物。
  23. 前記ウイルスベクターは、レトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴ウイルス(AAV)、ワクシニアウイルス、ポックスウイルスおよび単純ヘルペスウイルスからなる群より選択される1つまたは複数のウイルスベクターである、請求項22に記載の発現制御組成物。
  24. 前記重複遺伝子の前記発現制御組成物が、前記ガイド核酸と前記エディタータンパク質とを前記ガイド核酸-エディタータンパク質複合体の形態で含む、請求項1に記載の発現制御組成物。
  25. 前記重複遺伝子の前記発現制御組成物がドナーをさらに含む、請求項1に記載の発現制御組成物。
  26. 真核細胞のゲノムに存在する重複遺伝子の発現を調節する方法であって、前記方法は、前記重複遺伝子の発現を制御するための発現制御組成物を導入する段階を含み、
    ここで、前記発現制御組成物は、前記重複遺伝子の転写調節領域内に存在する標的配列を標的とすることができるガイド核酸または前記ガイド核酸をコードする核酸;および1つまたは複数のエディタータンパク質または前記エディタータンパク質をコードする核酸を含み、
    ここで、前記真核細胞は哺乳類細胞であり、
    ここで、前記ガイド核酸は、前記重複遺伝子の転写調節領域に存在する標的配列を標的とすることができるガイドドメインを含み、
    ここで、前記ガイドドメインは、前記重複遺伝子の転写調節領域内に存在する前記標的配列のガイド核酸結合配列と相補的な結合を形成することができ、
    ここで、前記ガイドドメインは、前記重複遺伝子の転写調節領域内に存在する前記標的配列のガイド核酸結合配列と相補的に結合することができ、
    ここで、前記相補的な結合は、0~5つのミスマッチ結合を含み、
    ここで、前記ガイド核酸は、第1の相補的ドメイン、リンカードメイン、第2の相補的ドメイン、近位ドメインおよびテールドメインからなる群より選択される1つまたは複数のドメインを含み、
    ここで、前記エディタータンパク質はCRISPR酵素であり、
    ここで、前記CRISPR酵素はCas9タンパク質またはCpf1タンパク質であり、
    ここで、前記ガイド核酸と前記エディタータンパク質とは、ガイド核酸-エディタータンパク質複合体を形成することができ、
    ここで、前記ガイド核酸-エディタータンパク質複合体は、前記ガイド核酸の部分核酸と前記エディタータンパク質のいくつかのアミノ酸との相互作用により形成することができる、方法。
  27. 前記発現制御組成物が、前記ガイド核酸と前記エディタータンパク質とを前記ガイド核酸-エディタータンパク質複合体の形態で含む、請求項26に記載の方法。
  28. 前記発現制御組成物が、前記ガイド核酸と前記エディタータンパク質とをそれぞれ核酸の形態で含む1つまたは複数のベクターを含む、請求項26に記載の方法。
  29. 前記導入を、エレクトロポレーション、リポソーム、ウイルスベクター、プラスミド、ナノ粒子およびタンパク質移行ドメイン(PTD)から選択される1つまたは複数の方法により行う、請求項26に記載の方法。
  30. 遺伝子重複疾患を治療するための方法であって、前記方法は、治療対象において重複遺伝子の発現制御組成物を投与する段階を含み、
    ここで、前記発現制御組成物は、前記重複遺伝子の転写調節領域内に存在する標的配列を標的とすることができるガイド核酸または前記ガイド核酸をコードする核酸;および1つまたは複数のエディタータンパク質または前記エディタータンパク質をコードする核酸を含み、
    ここで、前記ガイド核酸は、前記重複遺伝子の転写調節領域内に存在する標的配列を標的とすることができるガイドドメインを含み、
    ここで、前記ガイドドメインは、前記重複遺伝子の転写調節領域内に存在する前記標的配列のガイド核酸結合配列と相補的な結合を形成することができ、
    ここで、前記ガイドドメインは、前記重複遺伝子の転写調節領域内に存在する前記標的配列のガイド核酸結合配列と相補的に結合することができ、
    ここで、前記相補的な結合は、0~5つのミスマッチ結合を含み、
    ここで、前記ガイド核酸は、第1の相補的ドメイン、リンカードメイン、第2の相補的ドメイン、近位ドメインおよびテールドメインからなる群より選択される1つまたは複数のドメインを含み、
    ここで、前記エディタータンパク質はCRISPR酵素であり、
    ここで、前記CRISPR酵素はCas9タンパク質またはCpf1タンパク質であり、
    ここで、前記ガイド核酸と前記エディタータンパク質とは、ガイド核酸-エディタータンパク質複合体を形成することができ、
    ここで、前記ガイド核酸-エディタータンパク質複合体は、前記ガイド核酸の部分核酸と前記エディタータンパク質のいくつかのアミノ酸との相互作用により形成することができる、方法。
  31. 前記遺伝子重複疾患が、シャルコー・マリー・トゥース病1A型(CMT1A)、デジェリン・ソッタス病(DSD)、先天性髄鞘形成不全神経障害(CHN)、ルーシー・レヴィー症候群(RLS)、ペリツェウス・メルツバッハー病(PMD)、MECP2重複症候群、X連鎖下垂体機能低下症(XLHP)、ポトツキ-ルプスキ症候群(PTLS)、ヴェロカルディオフェイシャル症候群(VCFS)、ウィリアムズ・ビューレン症候群(WBS)、アラジール症候群(AS)、成長遅延症候群、早期閉鎖頭蓋縫合、常染色体優性白質ジストロフィー(ADLD)、パーキンソン病またはアルツハイマー病であり得る、請求項30に記載の方法。
  32. 前記治療対象が、ヒト、サル、マウスおよびラットを含む哺乳類である、請求項30に記載の方法。
  33. 前記投与を、注入、輸液、インプランテーションまたはトランスプランテーションにより行うことができる、請求項30に記載の方法。
JP2021170086A 2017-09-28 2021-10-18 遺伝子発現調節のための人為的なゲノム操作 Active JP7440043B2 (ja)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US201762564478P 2017-09-28 2017-09-28
US62/564,478 2017-09-28
US201762565868P 2017-09-29 2017-09-29
US62/565,868 2017-09-29
PCT/KR2018/011424 WO2019066490A2 (ko) 2017-09-28 2018-09-27 유전자 발현 조절을 위한 인위적인 게놈 조작
JP2020513755A JP2020536501A (ja) 2017-09-28 2018-09-27 遺伝子発現調節のための人為的なゲノム操作

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2020513755A Division JP2020536501A (ja) 2017-09-28 2018-09-27 遺伝子発現調節のための人為的なゲノム操作

Publications (3)

Publication Number Publication Date
JP2022023144A true JP2022023144A (ja) 2022-02-07
JP2022023144A5 JP2022023144A5 (ja) 2022-07-12
JP7440043B2 JP7440043B2 (ja) 2024-02-28

Family

ID=65902054

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2020513755A Pending JP2020536501A (ja) 2017-09-28 2018-09-27 遺伝子発現調節のための人為的なゲノム操作
JP2021170086A Active JP7440043B2 (ja) 2017-09-28 2021-10-18 遺伝子発現調節のための人為的なゲノム操作

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2020513755A Pending JP2020536501A (ja) 2017-09-28 2018-09-27 遺伝子発現調節のための人為的なゲノム操作

Country Status (9)

Country Link
EP (1) EP3690047A4 (ja)
JP (2) JP2020536501A (ja)
CN (1) CN111527208B (ja)
AU (1) AU2018339164B2 (ja)
BR (1) BR112020006428A2 (ja)
CA (1) CA3077153A1 (ja)
RU (2) RU2767201C2 (ja)
SG (1) SG11202002130WA (ja)
WO (1) WO2019066490A2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110577970B (zh) * 2019-08-08 2022-11-18 复旦大学 CRISPR/Sa-SlutCas9基因编辑系统及其应用
CN110577969B (zh) * 2019-08-08 2022-07-22 复旦大学 CRISPR/Sa-SlugCas9基因编辑系统及其应用
CN110577972B (zh) * 2019-08-08 2022-10-11 复旦大学 CRISPR/Sa-ShaCas9基因编辑系统及其应用
KR20230134477A (ko) * 2020-12-01 2023-09-21 더 리서치 인스티튜트 앳 네이션와이드 칠드런스 하스피탈 말초 미엘린 단백질-22의 발현 억제를 위한 생성물및 방법
WO2022167421A1 (en) * 2021-02-02 2022-08-11 Limagrain Europe Linkage of a distal promoter to a gene of interest by gene editing to modify gene expression
CN114426982B (zh) * 2022-02-22 2024-03-22 上海交通大学 一种细胞代谢重编程的方法及其应用
CN116536357A (zh) * 2023-04-17 2023-08-04 中国医学科学院输血研究所 构建CRISPR/Cas12a中sgRNA剪切活性筛选系统的方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018106782A1 (en) * 2016-12-08 2018-06-14 Case Western Reserve University Methods and compositions for enhancing functional myelin production

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116064533A (zh) * 2012-10-23 2023-05-05 基因工具股份有限公司 用于切割靶dna的组合物及其用途
ES2553782T3 (es) * 2012-12-12 2015-12-11 The Broad Institute, Inc. Ingeniería de sistemas, métodos y composiciones de guía optimizadas para manipulación de secuencias
PT3456831T (pt) * 2013-04-16 2021-09-10 Regeneron Pharma Modificação alvejada do genoma de rato
US9388430B2 (en) * 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
WO2015048577A2 (en) * 2013-09-27 2015-04-02 Editas Medicine, Inc. Crispr-related methods and compositions
CN111269902A (zh) * 2013-12-12 2020-06-12 布罗德研究所有限公司 Crispr-cas系统和组合物的递送及用途
JP6905755B2 (ja) * 2015-08-25 2021-07-21 デューク ユニバーシティ Rnaガイド型エンドヌクレアーゼを使用してゲノム工学における特異性を改善する組成物および方法
KR20180120670A (ko) * 2015-11-13 2018-11-06 아벨리노 랩 유에스에이, 인크. 각막 이상증의 치료 방법
CN110248957B (zh) * 2016-11-14 2023-12-19 株式会社图尔金 经人工操纵的sc功能控制系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018106782A1 (en) * 2016-12-08 2018-06-14 Case Western Reserve University Methods and compositions for enhancing functional myelin production

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CELL, vol. vol.159, p.647-661, JPN6022049246, 2014, ISSN: 0004926349 *
J. NEUROSCI. RES., vol. vol.90, p.1701-1712, JPN6022049247, 2012, ISSN: 0004926350 *

Also Published As

Publication number Publication date
JP7440043B2 (ja) 2024-02-28
BR112020006428A2 (pt) 2020-09-24
EP3690047A2 (en) 2020-08-05
SG11202002130WA (en) 2020-04-29
EP3690047A4 (en) 2021-11-03
AU2018339164A1 (en) 2020-04-09
RU2767201C2 (ru) 2022-03-16
CN111527208B (zh) 2024-05-14
WO2019066490A2 (ko) 2019-04-04
KR20190037145A (ko) 2019-04-05
WO2019066490A3 (ko) 2019-06-27
RU2020114785A3 (ja) 2021-10-28
CN111527208A (zh) 2020-08-11
RU2020114785A (ru) 2021-10-28
CA3077153A1 (en) 2019-04-04
JP2020536501A (ja) 2020-12-17
AU2018339164B2 (en) 2022-06-16
RU2022103641A (ru) 2022-03-18

Similar Documents

Publication Publication Date Title
JP7440043B2 (ja) 遺伝子発現調節のための人為的なゲノム操作
Jo et al. CRISPR-Cas9–mediated therapeutic editing of Rpe65 ameliorates the disease phenotypes in a mouse model of Leber congenital amaurosis
KR102259006B1 (ko) 인위적으로 조작된 신생혈관형성 조절 시스템
JP7338937B2 (ja) 人工的に操作されたsc機能制御システム
JP7416406B2 (ja) 機能的ミエリン産生を増進させるための方法および組成物
KR102662879B1 (ko) 망막 기능장애 질환 치료를 위한 유전자 조작
US20230295652A1 (en) Artificial genome manipulation for gene expression regulation
JP2020528735A (ja) 反復伸長変異のためのゲノム編集システム
KR102670361B1 (ko) 유전자 발현 조절을 위한 인위적인 게놈 조작
Liu et al. Allele-specific gene-editing approach for vision loss restoration in RHO-associated retinitis pigmentosa
Croci CRISPR-Cas9 gene editing: a new promising treatment for Rett syndrome

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211117

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220704

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221122

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230421

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230801

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20231031

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240116

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240206

R150 Certificate of patent or registration of utility model

Ref document number: 7440043

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150