JP2024517939A - 編集タンパク質の発現のための方法および組成物 - Google Patents

編集タンパク質の発現のための方法および組成物 Download PDF

Info

Publication number
JP2024517939A
JP2024517939A JP2023569888A JP2023569888A JP2024517939A JP 2024517939 A JP2024517939 A JP 2024517939A JP 2023569888 A JP2023569888 A JP 2023569888A JP 2023569888 A JP2023569888 A JP 2023569888A JP 2024517939 A JP2024517939 A JP 2024517939A
Authority
JP
Japan
Prior art keywords
nucleic acid
rna
molecule
grna
protein
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023569888A
Other languages
English (en)
Inventor
ルーカス クリストフ バックマン,
サミュエル ローレンス パフ,
Original Assignee
ソーク インスティテュート フォー バイオロジカル スタディーズ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソーク インスティテュート フォー バイオロジカル スタディーズ filed Critical ソーク インスティテュート フォー バイオロジカル スタディーズ
Publication of JP2024517939A publication Critical patent/JP2024517939A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/40Systems of functionally co-operating vectors

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Virology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Peptides Or Proteins (AREA)

Abstract

RNA分子を使用するための方法を含めた、RNA分子を再構成するための組成物および系が本明細書で提供される。例えば、そのような分子を使用して、タンパク質コード配列を2つまたはそれよりも多くのウイルスベクター(例えば、AAV)を通じて送達し、それにより、細胞における全長タンパク質の再構成をもたらすことができる。そのような方法を使用して、核酸分子の編集に関与するタンパク質を送達する、例えば、遺伝子疾患またはがんを処置することができる。

Description

関連出願との相互参照
本出願は、その全体が参照により本明細書に組み込まれる、2021年5月14日出願の米国特許仮出願第63/189,048号の優先権を主張するものである。
分野
本開示は、2つまたはそれよりも多くのRNA分子の結合を可能にし、それにより、遺伝子編集に関与するタンパク質、例えばCasヌクレアーゼまたは触媒として不活性な形態のCasヌクレアーゼ、などの全長タンパク質の発現を可能にする系、キット、組成物、および方法を提供する。
背景
遺伝子療法は、機能喪失型変異によって引き起こされる遺伝子疾患を処置するための有望な方法である。一般には置換遺伝子がAAVなどのベクターを使用して標的細胞に再導入され、これはこのウイルスが細胞への進入に関して一般に安全かつ効率的であるからである。しかし、AAVの場合では、従来のカプシドを使用して約5000ヌクレオチドよりも多くを封入することが難しい。大きなタンパク質をコードする遺伝子の長さは多くの場合にAAVのパッケージングに関する制約を超え、多くの遺伝子疾患は依然として処置不可能なままである。この制限を克服するための戦略がこれまで探究されてきたが、非効率的であることが判明したか、潜在的に毒性がある短縮されたタンパク質の高レベルの発現がもたらされたか、またはその両方である。疾患を処置するために大きなタンパク質を送達するための安全な高効率の戦略が必要とされている。
概要
標的タンパク質、例えば、核酸配列(例えば、遺伝子などの標的DNAまたはRNA)を編集するために使用されるタンパク質を発現させるための組成物が本明細書で提供される。同じ細胞に個別に導入された2つまたはそれよりも多くの合成核酸分子から産生される核酸編集タンパク質を発現させるための組成物および方法が包含される。この戦略を使用することで、全長核酸編集タンパク質および1つまたは複数のガイドRNAを同じ細胞に提供し、それにより、標的化核酸編集をもたらすことができる。細胞は、例えば必須遺伝子の変異を修復するために標的化核酸編集を必要とするものであり得る。一実施例では、組成物は(a)第1のRNA分子であって、5’から3’に、(i)核酸編集タンパク質のN末端部分のコード配列;(ii)スプライスドナー;および(iii)第1の二量体形成ドメインを含む、第1のRNA分子;ならびに(b)第2のRNA分子であって、5’から3’に、(i)第1の二量体形成ドメインに結合する第2の二量体形成ドメイン;(ii)分岐点配列;(iii)ポリピリミジントラクト;(iv)スプライスアクセプター;および(v)核酸編集タンパク質のC末端部分のコード配列を含む、第2のRNA分子を含む。一部の実施例では、そのような組成物は、(c)第1の標的核酸分子に特異的な少なくとも1つの第1のガイドRNA(gRNA)を含む第3のRNA分子であって、少なくとも1つの第1のgRNAが、核酸編集タンパク質を第1の標的核酸分子上の標的編集部位に方向付ける、第3のRNA分子;(d)(i)核酸編集タンパク質を第1の核酸分子上の同じもしくは異なる標的編集部位に方向付ける、第1の標的核酸分子に特異的な少なくとも1つの第2のgRNA、もしくは(ii)核酸編集タンパク質を第2の標的核酸分子上の標的編集部位に方向付ける、第2の標的核酸分子に特異的な少なくとも1つの第2のgRNAを含む、第4のRNA分子;(e)(i)核酸編集タンパク質を第1の核酸分子上の第1のgRNAおよび第2のgRNAと同じもしくは異なる標的編集部位に方向付ける、第1の標的核酸分子に特異的な少なくとも1つの第3のgRNA、(ii)核酸編集タンパク質を第2の核酸分子上の第2のgRNAと同じもしくは異なる標的編集部位に方向付ける、第2の標的核酸分子に特異的な少なくとも1つの第3のgRNA、もしくは(iii)核酸編集タンパク質を第3の標的核酸分子上の標的編集部位に方向付ける、第3の標的核酸分子に特異的な少なくとも1つの第3のgRNAを含む、第5のRNA分子;ならびに/または、(f)(i)核酸編集タンパク質を第1の核酸分子上の第1のgRNA、第2のgRNA、および第3のgRNAと同じもしくは異なる標的編集部位に方向付ける、第1の標的核酸分子に特異的な少なくとも1つの第4のgRNA、(ii)核酸編集タンパク質を第2の核酸分子上の第2のgRNAおよび第3のgRNAと同じもしくは異なる標的編集部位に方向付ける、第2の標的核酸分子に特異的な少なくとも1つの第4のgRNA、(iii)核酸編集タンパク質を第3の標的核酸分子上の第3のgRNAと同じもしくは異なる標的編集部位に方向付ける、第3の標的核酸分子に特異的な少なくとも1つの第4のgRNA、もしくは(iv)核酸編集タンパク質を第4の標的核酸分子上の標的編集部位に方向付ける、第4の標的核酸分子に特異的な少なくとも1つの第4のgRNAを含む、第6のRNA分子、のうちの1つまたは複数をさらに含む。
一実施例では、組成物は(a)第1のRNA分子であって、5’から3’に、(i)核酸編集タンパク質のN末端部分のコード配列;(ii)スプライスドナー;および(iii)第1の二量体形成ドメインを含む、第1のRNA分子;ならびに(b)第2のRNA分子であって、5’から3’に、(i)第1の二量体形成ドメインに結合する第2の二量体形成ドメイン;(ii)分岐点配列;(iii)ポリピリミジントラクト;(iv)スプライスアクセプター;および(v)核酸編集タンパク質のC末端部分のコード配列を含む、第2のRNA分子を含む。一部の実施例では、そのような組成物は、(c)それぞれ第1の標的核酸分子に特異的な少なくとも1つの第1のcrisprRNA(crRNA)および少なくとも1つの第1のtracrRNAを含み、少なくとも1つの第1のcrRNAおよび少なくとも1つの第1のtracrRNAが、核酸編集タンパク質を第1の標的核酸分子上の標的編集部位に方向付ける、第3のRNA分子および第4のRNA分子;(d)(i)それぞれ第1の標的核酸分子に特異的な少なくとも1つの第2のcrRNAおよび少なくとも1つの第2のtracrRNAを含み、少なくとも1つの第2のcrRNAおよび少なくとも1つの第2のtracrRNAが、核酸編集タンパク質を第1の核酸分子上の第1のcrRNAおよび第1のtracrRNAおよび第2のcrRNA、および第2のtracrRNAと同じもしくは異なる標的編集部位に方向付けるか、もしくは(ii)第2の標的核酸分子に特異的な少なくとも1つの第2のcrRNAを含み、少なくとも1つの第2のcrRNAおよび少なくとも1つの第2のtracrRNAが、核酸編集タンパク質を第2の標的核酸分子上の標的編集部位に方向付ける、第5のRNA分子および第6のRNA分子;(e)(i)それぞれ第1の標的核酸分子に特異的な少なくとも1つの第3のcRNAおよび少なくとも1つの第3のtracrRNAを含み、少なくとも1つの第3のcrRNAおよび少なくとも1つの第3のtracrRNAが、核酸編集タンパク質を第1の核酸分子上の第1のcrRNAおよび第1のtracrRNAおよび第2のcrRNAおよび第2のtracrRNAと同じもしくは異なる標的編集部位に方向付けるか、(ii)第2の標的核酸分子に特異的な少なくとも1つの第3のcRNAを含み、少なくとも1つの第3のcrRNAおよび少なくとも1つの第3のtracrRNAが、核酸編集タンパク質を第2の核酸分子上の第2のcrRNAおよび第2のtracrRNAと同じもしくは異なる標的編集部位に方向付けるか、もしくは(iii)第3の標的核酸分子に特異的な少なくとも1つの第3のcRNAを含み、少なくとも1つの第3のcrRNAおよび少なくとも1つの第3のtracrRNAが、核酸編集タンパク質を第3の標的核酸分子上の標的編集部位に方向付ける、第7のRNA分子および第8のRNA分子;ならびに/または(f)(i)それぞれ第1の標的核酸分子に特異的な少なくとも1つの第4のcrRNA、および少なくとも1つの第4のtracrRNAを含み、少なくとも1つの第4のcrRNAおよび少なくとも1つの第4のtracrRNAが、核酸編集タンパク質を第1の核酸分子上の第1のcrRNAおよび第1のtracrRNA、第2のcrRNAおよび第2のtracrRNA、および第3のcrRNAおよび第3のtracrRNAと同じもしくは異なる標的編集部位に方向付けるか、(ii)第2の標的核酸分子に特異的な少なくとも1つの第4のcrRNAを含み、少なくとも1つの第4のcrRNAおよび少なくとも1つの第4のtracrRNAが、核酸編集タンパク質を第2の核酸分子上の第2のcrRNAおよび第2のtracrRNA、および第3のcrRNAおよび第3のtracrRNAと同じもしくは異なる標的編集部位に方向付けるか、(iii)第3の標的核酸分子に特異的な少なくとも1つの第4のcrRNAを含み、少なくとも1つの第4のcrRNAおよび少なくとも1つの第4のtracrRNAが、核酸編集タンパク質を第3の標的核酸分子上の第3のcrRNAおよび第3のtracrRNAと同じもしくは異なる標的編集部位に方向付けるか、もしくは(iv)第4の標的核酸分子に特異的な少なくとも1つの第4のcrRNAを含み、少なくとも1つの第4のcrRNAおよび少なくとも1つの第4のtracrRNAが、核酸編集タンパク質を第4の標的核酸分子上の標的編集部位に方向付ける、第9のRNA分子および第10のRNA分子のうちの1つまたは複数をさらに含む。
一部の実施例では、第1の二量体形成ドメインと第2の二量体形成ドメインは、直接結合、間接結合、または両方によって結合している。
一部の実施例では、二量体形成ドメインは、キッシングループドメインまたは低多様性(hypodiverse)ドメインである。
一部の実施例では、第1のRNA分子および/または第2のRNA分子は、少なくとも1つのスプライスエンハンサーを含む。
標的タンパク質を発現させるための組成物も提供される。そのような組成物は(i)(a)のRNA分子および(c)のRNA分子、または(a)のRNA分子(c)のRNA分子および(d)のRNA分子をコードする第1の合成DNA分子;ならびに(ii)(b)のRNA分子および(e)のRNA分子、または(b)のRNA分子、(e)のRNA分子および(f)のRNA分子をコードする第2の合成DNA分子を含み得る。一部の実施例では、第1の合成DNA分子は(i)第1のRNA分子をコードする配列に作動可能に連結した第1のプロモーター;および(b)第2のRNA分子をコードする配列に作動可能に連結した第2のプロモーターを含む。
記載の組成物を含む、核酸編集タンパク質を発現させるための系も提供される。
本明細書に開示される系または系によってコードされるRNAを例えば標的核酸分子とハイブリダイズする妥当なガイド核酸分子と組み合わせて使用して、細胞において核酸編集タンパク質を発現させる方法も提供される。そのような方法は、系を細胞に導入するステップと、第1の合成RNA分子および第2の合成RNA分子を同じ細胞において発現させるステップとを含み得る。一部の実施例では、細胞は対象内に存在し、方法により、標的DNAまたはRNA(例えば、遺伝子)の変異によって引き起こされる遺伝子疾患などの、対象における疾患が処置される。一部の実施例では、遺伝子疾患は、デュシェンヌ型筋ジストロフィー、血友病A、スタルガルト病、またはアッシャー症候群である。
添付図を参照しながら進める以下の詳細な説明から本明細書に開示される前述のおよび他の目的および特色がより明白になる。
本特許または出願のファイルは、カラーで製作された少なくとも1つの図面を含有する。カラーの図面(複数可)を伴う本特許または特許出願公開のコピーは、要請し、必要な料金を支払えば、特許庁により提供される。
図1Aは、ベクター設計(左)ならびにRNA相互作用およびスプライシング(右)の概略図を示す。左:5’トランススプライス(trsp)DNAベクター:白抜きの矢印は2つの反対方向のプロモーターである。RFPをコードするドメインおよびポリアデニル化エレメントを伴う3’UTRは、YFPのN末端部分(n-yfp)、続いて、スプライスドナー配列(SD)、下流イントロンスプライシングエンハンサー(DISE)、および2つのイントロンスプライシングエンハンサー(2×ISE)、結合ドメイン(BD、二量体形成ドメインとも称される)、および安定なステムループボックスBエレメント(ボックスB)、自己切断性ハンマーヘッド型リボザイム(HHrz)、最後にポリアデニル化エレメントを含有する3’UTRから反対方向に発現される。n-yfpセグメントには小さなイントロンが挿入されている(n-yfp内の白色のセグメント)。3’trsp DNAベクター:白抜きの矢印は2つの反対方向のプロモーターである。BFPをコードするドメインおよびポリアデニル化エレメントを伴う3’UTRは、相補的結合ドメイン(抗BD、二量体形成ドメインとも称される)、続いて、3つのイントロンスプライシングエンハンサー配列(3×ISE)、分岐点(BP)、ポリピリミジントラクト(PPT)、スプライスアクセプター配列(SA)、YFPコード配列のC末端部分(c-terminal proton)、最後にポリアデニル化エレメントを含有する3’UTRから反対方向に発現される。右:YFPタンパク質をコードするmRNAが生成されるプレmRNA相互作用(5’trsp-RNA+3’trsp-RNA)およびトランス-スプライシングが示されている。
図1Bは、N末端発現プラスミドのみのトランスフェクションではYFP蛍光がもたらされないことを示す。
図1Cは、C末端発現プラスミドのみのトランスフェクションではYFP蛍光がもたらされないことを示す。
図1Dは、結合ドメインを有さないN末端断片およびC末端断片の発現では、低レベルのYFP誘導が示されることを示す。
図1Eは、ループ状構成の合理的に設計された二量体形成/結合ドメイン(二本鎖ステム構造を形成する相補配列によって中断された、全てピリミジンからなるかまたは全てプリンからなる低多様性配列)を示す。
図1Fは、「ループ状」二量体形成ドメイン構成の3Dレンダリングを示す。
図1Gは、C末端側半分に結合ドメインを有さない陰性対照を示す。
図1Hは、N末端側半分に結合ドメインを有さない陰性対照を示す。
図1Iは、N末端側半分およびC末端側半分の両方におけるループ状構成のマッチする結合ドメインにより、細胞の90%において強力なYFP誘導が示されることを示す。
図1J~1Nは、完全に開いた構成をもたらす配列を含有する排他的にピリミジン(またはその代わりに排他的にプリン)で構成される150ヌクレオチドの低多様性配列を有する結合ドメインの構成についての図1E~1Iにおけるものと等価のデータを表す。
図1Jは、相補的な(complimentary)塩基対合のための完全に開いた構成を
もたらす150ヌクレオチドの低多様性ピリミジン配列を示す。
図1Kは、(1J)の150ヌクレオチドの低多様性ピリミジン配列の3Dレンダリングを示す。
図1Lは、相補的な低多様性結合ドメインを欠く、C末端YFPをコードする構築物を用いた対照HEK293T細胞へのトランスフェクションを示す。YFPを発現するトランスフェクトされた細胞はわずかである。
図1Mは、相補的な低多様性結合ドメインを欠く、N末端YFPをコードする構築物を用いた対照HEK293T細胞へのトランスフェクションを示す。YFPを発現するトランスフェクトされた細胞はわずかである。
図1Nは、どちらも相補的な低多様性の二量体形成結合ドメインを有するN末端YFP構築物およびC末端YFP構築物を用いたHEK293T細胞へのトランスフェクションを示す。多くの細胞がYFPを高レベルで発現する。
図1Oは、図1Gに示されている細胞についての代表的な蛍光画像を示す。トランスフェクションについての陽性マーカー(RFP+BFP)は発現されるが、YFPタンパク質は効率的には再構成されない。
図1Pは、図1Lに示されている細胞についての代表的な蛍光画像を示す。トランスフェクションについての陽性マーカー(RFP+BFP)が発現され、RFPおよびBFPダブルポジティブである細胞においてYFPタンパク質が高レベルで再構成される。
図1Qは、図1D、図1G~1I、および図1L~1Nに示されている条件の比較を示す。N:結合ドメインなし、ループ:ループ状低多様性結合ドメイン構成、Lin:直鎖状低多様性構成。
図2Aは、ベクター設計の概略図を示す。黄色蛍光タンパク質(YFP)のタンパク質コード配列はN末端、中間断片(m-yfp)およびC末端断片に分割される。n断片をコードするRNAとm断片をコードするRNAの結合部がループ状設計の結合ドメイン(BD1)によって結合し、m断片とc断片の結合部がループ状結合ドメイン(BD2)によって結合する。ピリミジン(Y)配列およびプリン(R)配列は、m断片の自己環状化が回避され、また、N断片とC断片の直接の組換えが回避されるように配置される。N末端断片をトランスフェクション対照として赤色蛍光タンパク質と共発現させ、C末端断片をトランスフェクション対照として青色蛍光タンパク質と共発現させる。プロモーター配列が白抜きの矢印で示されている。スプライスドナー(SD)部位およびスプライスアクセプター(SA)部位が示されている。図1AにおけるSAの上流(5’側)およびSDの下流(3’側)に使用したものと類似したスプライスエンハンサー、ポリピリミジントラクトおよび分岐点を含むイントロンスプライシングエレメントを含める。
図2Bは、プラスミドI+II+III(図2Aを参照されたい)のヒト細胞株へのトランスフェクションにより、トランスフェクトされた細胞の80%において高レベルのYFP発現が効率的に再構成されることを示す。
図2Cは、yfp蛍光が示されない、n断片およびm断片(プラスミドI+II、図2Aを参照されたい)の発現(陰性対照)の代表的な蛍光画像を示す。
図2Dは、yfp蛍光が示されない、m断片およびc断片(プラスミドII+III、図2Aを参照されたい)の発現(陰性対照)の代表的な蛍光画像を示す。
図2Eは、3つの断片全て(プラスミドI+II+III、図2Aを参照されたい)の共トランスフェクションによって強力なYFP蛍光が誘導されることを示す代表的な蛍光画像を示す。
図3A~3Dは、マウス新生仔(P3)への全身投与後に2つのAAV2/8から発現された2つの断片(配列番号1および2)からの黄色蛍光タンパク質(YFP)の効率的な再構成を表す。(A)YFPのN末端側半分の断片をコードするAAV1、およびC末端側半分の断片をコードするAAV2を示す。AAV1+AAV2を等しい力価で混合し、マウスに静脈内注射した。注射の3週間後に組織試料を採取した。(B)屠殺時点の若齢マウスの肝臓におけるYFP蛍光を示す(緑色)。注射していない肝臓が比較のために示されている(対照:YFPは検出されなかった)。コンテキストとしてDRAQ5核染色が赤紫色で示されている。(C)屠殺時点の心筋における強力なYFP蛍光(緑色)を示す。上のパネルは、肉眼で見える像およびコンテキストとして赤色自家蛍光(赤紫色)を示す。下のパネルは、コンテキストとしてDRAQ5核染色を用いた断面(赤紫色)を示す。YFPを欠く、注射していないマウス心臓が対照として示されている。(D)屠殺時点の肢の骨格筋における強力なYFP蛍光を示す。比較として注射していないマウス肢が示されている(陰性対照、YFPは検出されなかった)。上のパネルは、赤紫色の赤色自家蛍光を伴う肉眼で見える像を示す。下のパネルは、肢を通した断面の顕微鏡レベルの画像を示す。下のパネルは、コンテキストとして赤紫色のDRAQ5核染色を示す。
図4A~4Bは、マウス新生仔(P3)における、3つのAAV2/8を筋肉内注射した後のマウス前脛骨筋における3つの断片(それぞれ配列番号145、146および2)からの黄色蛍光タンパク質(YFP)の効率的な再構成を表す。(A)YFPのN末端断片、M断片、およびC末端断片を別々に有する3つのAAV粒子の概略図を示す(図2Aと類似)。(B)3つのウイルス粒子全てを注射したマウスの前脛骨筋の縦断面における強力なYFP蛍光を示す。コンテキストとしてDRAQ5核染色が赤紫色で示されている。
図5A~5Fは、成体マウス前脛骨筋における2つの断片からおよび3つの断片からの黄色蛍光タンパク質(YFP)の効率的な再構成を表す。(A)合成RNA二量体形成および組換えドメインを備えたYFPコード配列のN末端側半分およびC末端側半分を示す。(B)これらの2つの断片を発現する2つのAAV移入プラスミドを成体マウス前脛骨(TA)筋に経皮的に電気穿孔により導入し、電気穿孔の5日後に強力な蛍光が検出されたことを示す。(C)反対側の注射していないTAでは蛍光は検出可能でなかったことを示す。(D)合成RNA二量体形成および組換えドメインを備えたYFPコード配列のN末端、中間、およびC末端を示し、各断片がそれに隣接する断片と連結する。(E)これらの3つの断片を発現する3つのAAV移入プラスミドの経皮的な電気穿孔を示す。3つの断片からのYFPの効率的な再構成を示す強力なYFP蛍光が検出される。(F)反対側の注射していないTAにおける蛍光を示す。コンテキストとして蛍光チャネルがグレースケール写真に重ね合わせられている。
図6Aは、2つの核酸分子110、150を使用する、本明細書に開示されるRNA組換え方法のための例示的な系であって、標的タンパク質が2つの部分に分けられ、各部分が異なる核酸分子によってコードされている、系を提示する概略図である。一部の実施例では、系の核酸分子110、150はDNAであり、プロモーター112、152を含む。一部の実施例では、系の核酸分子110、150はRNAであり、したがって、プロモーター112、152を欠く。図面は一定の縮尺ではない。
図6Bは、ステムを形成し得る配列が散在する低多様性配列を含み、それにより、シュードノット形成の非存在下で開いており、塩基対合に利用可能な局所的なRNAループがもたらされる、例示的な二量体形成ドメイン(例えば、図6Aの122、154)を提示する概略図である。図面は一定の縮尺ではない。
図6Cは、分子110のプレmRNA二量体形成ドメイン122(図6A)と分子150のプレmRNA二量体形成ドメイン154(図6A)の相互作用およびハイブリダイゼーション(塩基対合)により、スプライソソーム成分によるN末端コード配列114およびC末端コード配列164の組換えが可能になることを示す概略図である。これにより、融合したN末端タンパク質コード配列114の3’末端とC末端タンパク質配列164の5’末端、およびN末端部分とC末端部分の間のシームレス結合部がもたらされる。図面は一定の縮尺ではない。
図6Dは、3つの核酸分子110、200、150を使用する本明細書に開示されるRNA組換え方法のための例示的な系であって、標的タンパク質が3つの部分(N末端、中間、C末端)に分けられ、各部分が異なる核酸分子によってコードされている、系を提示する概略図である。転写前は、系の核酸分子110、150、200はDNAであり、プロモーター112、152、202を含む。転写後は、系の核酸分子110、150、200はRNAであり、したがって、プロモーター112、152、202を欠く。図面は一定の縮尺ではない。
図6Eは、分子110の二量体形成ドメイン122(図6D)と分子200の二量体形成ドメイン204(図6D)の相互作用およびハイブリダイゼーション(塩基対合)、ならびに分子200の二量体形成ドメイン226(図6D)と分子150の二量体形成ドメイン154(図6D)の相互作用およびハイブリダイゼーション(塩基対合)により、スプライソソーム成分によるN末端コード配列114、中間コード配列216、およびC末端コード配列164の組換えが可能になることを示す概略図である。これにより、融合したN末端コード配列114の3’末端と中間タンパク質配列216の5’末端、ならびに融合した中間コード配列216の3’末端とC末端配列216の5’末端、ならびにN末端部分、中間部分、およびC末端部分の間のシームレス結合部がもたらされる。一部の実施例では、例えば、転写後には、示されているエレメントはRNAである。図面は一定の縮尺ではない。
図6Fは、2つの核酸分子110、150を使用する、本明細書に開示されるRNA組換え方法のための例示的な系であって、標的タンパク質が2つの部分に分けられ、各部分が異なる核酸分子によってコードされている、系を提示する概略図である。この例では、DNAがRNAに転写されており、したがって、系の核酸分子110、150はRNAであり、したがって、DNAには存在するプロモーター112、152を欠く(図6Aを参照されたい)。図面は一定の縮尺ではない。
図6Gは、2つのDNA分子110、150を使用する、本明細書に開示されるRNA組換え方法のための例示的な組成物または系であって、核酸編集タンパク質が2つの部分114、164に分けられ、各部分がそれぞれ異なるDNA分子110、150によってコードされている、組成物または系を提示する概略図である。一部の実施例では、プロモーター112、152により各コード配列114、164の発現を駆動する。この例の系は、1つまたは複数の標的核酸分子に特異的な1つまたは複数のガイド核酸分子(例えば、gRNAまたはgRNAコード配列)140、141、171、172を含む。しかし、そのようなガイド核酸分子140、141、171、172は必要に応じたものであり、一部の実施例では、分子110、150の一部として提供される代わりに、別々に、例えば別々のベクターの一部として提供される。この例では、核酸分子110、150の5’末端および3’末端の付近に必要に応じたガイド核酸分子140、141、171、172が示されているが、本開示はそのような位置に限定されない。1つまたは複数のガイド核酸分子140、141、171、172が存在する場合、それらの発現をプロモーター142、143、173、174によって駆動することができる。系は、分子110、150の各5’末端および3’末端にパルボウイルス末端逆位反復配列(ITR)176、177、178、179を必要に応じて含み得る。この図は、分子110、150がDNAである実施形態を示すものであるが、一部の実施例では(例えば、転写後)、系の核酸分子110、150はRNAであり、したがって、ガイド核酸分子140、141、171、172、プロモーター112、152、142、143、173、174およびパルボウイルスITR176、177、178、179を欠く。図面は一定の縮尺ではない。
図6Hは、3つのDNA分子110、200、150を使用する本明細書に開示されるRNA組換え方法のための例示的な系または組成物であって、核酸編集タンパク質が3つの部分(N末端、中間、C末端、それぞれ114、216、154)に分けられ、各部分がそれぞれ異なる核酸分子110、200、150によってコードされている、系または組成物を提示する概略図である。一部の実施例では、プロモーター112、202、152により各コード配列114、216、164の発現を駆動する。この例の系は、1つまたは複数の標的核酸分子に特異的な1つまたは複数のガイド核酸分子(例えば、gRNAまたはgRNAコード配列)140、141、231、232、171、172を含む。しかし、そのようなガイド核酸分子140、141、231、232、171、172は必要に応じたものであり、一部の実施例では、分子110、200、150の一部として提供される代わりに、別々に、例えば、別々のベクターの一部として提供される。この例は、核酸分子110、200、150の5’末端および3’末端の付近の必要に応じたガイド核酸分子140、141、231、232、171、172を示すものであるが、本開示はそのような位置に限定されない。1つまたは複数のガイド核酸分子140、141、231、232、171、172が存在する場合、それらの発現は、プロモーター142、143、233、234、173、174によって駆動することができる。系は、分子110、200、150の各5’末端および3’末端にパルボウイルス末端逆位反復配列(ITR)176、177、235、236、178、179を必要に応じて含み得る。この図は、系の分子110、150、200がDNAである実施形態を示すものであるが、転写後は、系の核酸分子110、150、200はRNAになり、したがって、ガイド核酸分子140、141、171、172、321、232、プロモーター112、152、202、142、143、233、234、173、174およびパルボウイルスITR176、177、235、236、178、179を欠く。図面は一定の縮尺ではない。
図7Aは、本明細書に開示されるRNA組換え方法のための例示的な系であって、図6Aと同様に2つの核酸分子500、600を使用するが、二量体形成ドメインが、同じ標的分子700を認識するアプタマー512、602である、系を提示する概略図である。一部の実施例では、例えば、転写後には、示されているエレメントはRNAである。図面は一定の縮尺ではない。
図7Bは、本明細書に開示されるRNA組換え方法のための例示的な系であって、図7Aに関連し、同じ標的分子を認識する二量体形成ドメインを使用する、系を提示する概略図である。ここで、二量体形成ドメインによって認識される標的は、特定のRNA分子である(図7Aの分子700、例えば、タンパク質または小分子の代わりに)。各ドメインは、例えば、がん特異的転写物などの、標的細胞(すなわち、標的タンパク質の発現が望まれる細胞)においてのみ発現されるmRNA分子の異なる部分を認識する。一部の実施例では、例えば、転写後には、示されているエレメントはRNAである。図面は一定の縮尺ではない。
図7Cは、図6Aおよび7Aと同様に2つの核酸分子800、900を使用する、本明細書に開示されるRNA組換え方法のための例示的な系を提示する概略図であり、二量体形成ドメイン812、902が、二量体形成ドメインが互いに相互作用することを妨げ、したがって、N末端コード配列802とC末端コード配列914の組換えを妨げるかまたは低減するオリゴヌクレオチド1000とハイブリダイズしていることを示す。一部の実施例では、例えば、転写後には、示されているエレメントはRNAである。図面は一定の縮尺ではない。
図8は、3’非翻訳領域内のWPRE3配列の存在下(w/)または非存在下(w/o)でのYFPタンパク質の発現の再構成を比較した棒グラフである。試料当たりN=3の反復実験が示されている。
図9Aは、高親和性の二量体形成のためのキッシングループ相互作用を含む二量体形成ドメイン(例えば、図6Aの122、154)の使用の例を提示する概略図である。本明細書に提示される教示を使用すれば、本明細書に開示されるコード部分のいずれか(例えば、YFP)を他の標的タンパク質コード配列で置き換えることができることが理解されよう。図面は一定の縮尺ではない。
図9Bは、分割されたYFPの半分の両方をトランスフェクトしたHEK293T細胞におけるRFP、BFP、およびYFPシグナルを示す。低多様性設計原理と接着した直鎖状二量体形成ドメインまたはキッシングループ-ループ相互作用のために設計された構造化された二量体形成ドメインのいずれかが備わっている。強力な黄色蛍光シグナルにより効率的な再構成が示される。
図10A~10Zは、系および方法と共に使用することができる例示的な合成核酸分子である。一部の実施例では、合成核酸分子は、配列番号1(図10A~10B)、2(図10C~10E)、7(図10E)、8(図10F)、9(図10G)、10(図10H)、11(図10I)、12(図10J)、13(図10K)、14(図10L)、15(図10M)、16(図10N)、17(図10O)、18(図10P)、19(図10Q)、20(図10R~10U)、および21(図10V~10Z)のうちのいずれか1つの配列に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%または100%の配列同一性を有する(as)が、異なる標的タンパク質コード配列を有する。したがって、本明細書に提示される系または方法のいずれかと共に使用されるイントロン領域は、配列番号1、2、3、4、7、8、9、10、11、12、13、14、15、16、17、18、19、20、または21のイントロン配列のいずれかに対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%または100%の配列同一性を有し得る。例えば、図10A~Dは、全長YFPを発現させるために使用することができる例示的な(A、B)第1の合成分子(配列番号1)および(C、D)第2の合成分子(配列番号2)を示し、一方、配列番号3および4は、対応する、YFPコード部分を伴わない合成イントロン部分を提示する。一部の実施例では、合成イントロン配列は、配列番号3または4に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%または100%の配列同一性を有する。したがって、本明細書に提示される任意の合成分子(例えば、配列番号1のnt544~1032および配列番号2のnt905~1141)のコード配列部分を別のコード配列部分で置き換えることができる。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 同上。
図11は、長さが異なるランダムな相補的な塩基対合する結合ドメイン(50bp、100bp、150bp、200bp、300bp、400bp、および500bp)の再構成効率を示す棒グラフである。YFP蛍光強度中央値が匹敵するRFPおよびBFPトランスフェクションレベルを有する細胞間で比較されている。条件当たりn=3の試料。条件当たりn=3の試料。
図12A~12Bは、スプライスエンハンサーを合成イントロンに含めることにより再構成効率が上昇することを示す。図12Aは、使用した5’-N末端構築物および3’-C末端構築物(配列番号1および2)の概略図である。(略語に関しては図1Aを参照されたい)。図12Bは、細胞への配列番号1および2またはΔによって示されるそれらの種々の短縮のトランスフェクション後に得られたYFP蛍光を示す棒グラフである。条件当たりn=3の試料。
図13A~13Dは、2つの断片(配列番号147および148)からの全長flpリコンビナーゼ(Flpo)の再構成による正中線交差皮質ニューロン(midline-crossing cortical neuron)追跡を示す。(A)flpoを再構成するために使用した5’配列および3’配列の略図(図12Aの構築物と類似)。(B)N-flpoをコードするAAVウイルスおよびC-flpoをコードするAAVウイルスをそれぞれ皮質の左側領域および右側領域に注射した、注射したflp-レポーターマウス系統の略図である。(CおよびD)は、脳の反対側の半球に突き出し、したがって、N-flpoウイルスおよびC-flpoウイルスの両方に感染した皮質ニューロンのニューロン細胞体および軸索標識を示す。コンテキストとしてHoechst染色(核)が示されている。
図14A~14Dは、細胞培養物中およびマウス一次運動野におけるin vivoでの特大カーゴ(すなわち、長いRNAによってコードされるタンパク質)の発現を示す。(A)長いスタッファー配列(中断なしのオープンリーディングフレーム;それぞれ配列番号22および23)を含む、YFPを再構成するために使用した5’配列および3’配列の略図。(B)HEK 293T細胞における特大YFP構築物の再構成効率の定量的リアルタイムPCR分析。条件当たりN=3。(C)一過性にトランスフェクトされたHEK 293T細胞のフローサイトメトリーによって評価した、全長特大YFP発現および分割-REJ発現からの再構成されたYFPタンパク質の発現。異なる条件に対して等しいトランスフェクション対照(青色および赤色)蛍光を有する細胞集団間で黄色蛍光強度中央値が比較されている。Y軸は黄色蛍光強度中央値[a.u.]を示す。条件当たりN=3。(D)マウス一次運動野への注射の概略図、および、in vivoにおける長い(2401アミノ酸)YFPタンパク質の上首尾の再構成を示す注射の10日後の脳組織の画像。 同上。
図15A~15Cは、N末端HAタグ(N末端シグナルペプチドの代わり)を有する全長ヒト凝固第VIII因子(FVIII)(2317アミノ酸)の効率的な再構成を示す。(A)FVIIIを再構成するために使用した5’配列および3’配列の略図(それぞれ配列番号24および25)。(B)結合部のPCR増幅。(C)FVIIIの発現を示すウエスタンブロット。レーン1~3:全長FVIIIの発現(290kDaのバンドは全長プロセシングされていないFVIIIを示す)。レーン4~6:再構成されたFVIIIの発現(290kDaのバンドは首尾よく再構成されたFVIIIを示す)。レーン7および8:N末端のみの発現は、290kDaの全長FVIIIバンドが存在しないことを示す。全てのレーンに関して:予測されるタンパク質プロセシング産物が約75kDaから約210kDaまでにわたって観察される。FVIIIはマウス抗HA一次抗体を使用してプローブする。全てのレーンに清澄化した細胞タンパク質抽出物5マイクログラムをローディングした。ローディング対照としてGAPDH(ウサギ抗GAPDH)をプローブする。 同上。
図16A~16Fは、C末端FLAGタグを有する全長ヒトAbca4(2300アミノ酸)の効率的な再構成を示す。(A)Abca4を再構成するために使用した5’配列および3’配列の略図(それぞれ配列番号20および21)、ならびに結合部にわたるサンガーシーケンシングトレース。(B)結合部のPCR増幅。(C)5’断片および3’断片の組換えをアッセイするために使用したプローブの略図。(D)HEK 293T細胞における発現の2日後の再構成効率のPCRによる定量化。条件当たりN=2。(E)Abca4の発現を示すウエスタンブロット。レーン1~3:全長Abca4の発現(約260kDaのバンドは全長Abca4を示す)。レーン4~6:再構成されたAbca4の発現(260kDaのバンドは首尾よく再構成されたAbca4を示す)。レーン7および8:トランスフェクションなし対照(すなわち、HEK 293t溶解物のみ)は、いかなるシグナルも存在しないことを示す。Abca4はマウス抗FLAG一次抗体を使用してプローブする。全てのレーンに清澄化した細胞タンパク質抽出物5マイクログラムをローディングした。ローディング対照としてGAPDH(ウサギ抗GAPDH)をプローブする。(F)示差的BFP濃度について正規化した(E)におけるウエスタンブロットの定量化。データは全長発現対照の平均に対して正規化されたものとして示されている。 同上。
図17Aおよび17Bは、(A)HIV-1に基づくキッシングループ二量体形成ドメイン(N断片、配列番号139、C断片、配列番号140);および(B)HIV-2に基づくキッシングループ二量体形成ドメイン(N断片、配列番号141、C断片、配列番号142)を提示する。
図18A~18Cは、C末端FLAGタグを有する全長マウスOtof(2019アミノ酸)の効率的な再構成を示す。使用した5’分子および3’分子のDNA配列が配列番号155および156に示されている。(A)Otofの発現を示すウエスタンブロット。レーン1~3:全長Otofの発現(約250kDaのバンドは全長Otofを示す)。レーン4~6:再構成されたOtofの発現(250kDaのバンドは首尾よく再構成されたOtofを示す)。レーン7:トランスフェクションなし対照(すなわち、HEK 293t溶解物のみ)は、いかなるシグナルも存在しないことを示す。Otofはマウス抗FLAG一次抗体を使用してプローブする。全てのレーンに清澄化した細胞タンパク質抽出物5マイクログラムをローディングした。ローディング対照としてGAPDH(ウサギ抗GAPDH)をプローブする。(B)ウエスタンブロットの生の定量化および(C)示差的BFP濃度について正規化。データは全長発現対照の平均に対して正規化されたものとして示されている。
図19A~19Cは、C末端FLAGタグを有する全長ヒトMyo7a(2243アミノ酸)の効率的な再構成を示す。使用した5’分子および3’分子のDNA配列が配列番号157および158に示されている。(A)Myo7aの発現を示すウエスタンブロット。レーン1~3:全長Myo7aの発現(約270kDaのバンドは全長Myo7aを示す)。レーン4~6:再構成されたMyo7aの発現(270kDaのバンドは首尾よく再構成されたMyo7aを示す)。レーン7:トランスフェクションなし対照(すなわち、HEK 293t溶解物のみ)は、いかなるシグナルも存在しないことを示す。Myo7aはマウス抗FLAG一次抗体を使用してプローブする。全てのレーンに清澄化した細胞タンパク質抽出物5マイクログラムをローディングした。ローディング対照としてGAPDH(ウサギ抗GAPDH)をプローブする。(B)ウエスタンブロットの生の定量化および(C)示差的BFP濃度について正規化。データは全長発現対照の平均に対して正規化されたものとして示されている。
図20A~20Dは、全長DCas9-VPR(1951アミノ酸)の効率的な再構成を示す。使用した5’分子および3’分子のDNA配列が配列番号159および160に示されている。(A)DCas9-VPRの発現を示すウエスタンブロット。レーン1~3:全長DCas9-VPRの発現(約250kDaのバンドは全長DCas9-VPRを示す)。レーン4~6:再構成されたDCas9-VPRの発現(250kDaのバンドは首尾よく再構成されたDCas9-VPRを示す)。レーン7:トランスフェクションなし対照(すなわち、HEK 293t溶解物のみ)は、いかなるシグナルも存在しないことを示す。DCas9-VPRをマウス抗Cas9一次抗体を使用してプローブする。全てのレーンに清澄化した細胞タンパク質抽出物5マイクログラムをローディングした。ローディング対照としてGAPDH(ウサギ抗GAPDH)をプローブする。(B)ウエスタンブロットの生の定量化および(C)示差的BFP濃度について正規化。データは全長発現対照の平均に対して正規化されたものとして示されている。(D)HEK 293T細胞におけるYFP発現プラスミドの転写活性化の例。全長dCas9-VPR(上のパネル)または二方向分割REJデュアルdCas9-VPR(下のパネル)を非標的化ガイドRNA発現プラスミド(左側のパネル)またはUAS標的化ガイドRNA発現プラスミド(右側のパネル)と共に一過性にトランスフェクトする。全ての細胞に、dCas9-VPRが黄色蛍光タンパク質の発現をもたらす最小プロモーターの上流領域にターゲティングされるまで転写的に不活性であるUAS-YFPプラスミドもトランスフェクトする。赤色蛍光タンパク質(RFP)をdCas9-VPRのN末端断片と共に発現させ、青色蛍光タンパク質(BFP)をそれぞれ全長dCas9-VPRまたはdCas9-VPRのC末端断片と共に発現させる。RFPおよびBFPはトランスフェクション対照としての役割を果たす。UAS標的化ガイドRNAと対合した全長dCas9-VPRならびに二方向分割dCas9-VPRどちらが発現されても、黄色蛍光タンパク質の発現が観察され、これにより、再構成された全長タンパク質の機能性が確認される。
図21A~21Dは、全長ヒト化プライムエディター(2118アミノ酸)の効率的な再構成を示す。使用した5’分子および3’分子のDNA配列が配列番号161および162に示されている。(A)プライムエディターの発現を示すウエスタンブロット。レーン1~3:全長プライムエディターの発現(約260kDaのバンドは全長プライムエディターを示す)。レーン4~6:再構成されたプライムエディターの発現(260kDaのバンドは首尾よく再構成されたプライムエディターを示す)。レーン7:トランスフェクションなし対照(すなわち、HEK 293t溶解物のみ)は、いかなるシグナルも存在しないことを示す。プライムエディターをマウス抗Cas9一次抗体を使用してプローブする。全てのレーンに清澄化した細胞タンパク質抽出物5マイクログラムをローディングした。ローディング対照としてGAPDH(ウサギ抗GAPDH)をプローブする。(B)ウエスタンブロットの生の定量化および(C)示差的BFP濃度について正規化。データは全長発現対照の平均に対して正規化されたものとして示されている。(D)プライムエディターにより誘導されるGからTへの塩基転換変異がHEK293T細胞のFANCF遺伝子座およびVEGFA3遺伝子座において誘導されたことを示す。上のパネルは、それぞれFANCF遺伝子座およびVEGFA3遺伝子座の配列コンテキストを示す。灰色の矢印はプライムエディターガイドRNA(pegRNA)によって標的化される配列を示す。プロトスペーサー隣接モチーフ(PAM)が灰色の四角で示されている。Tへの塩基転換の標的とされるGが配列内で強調表示されている。ゲノム遺伝子座についてサンガーシーケンシングを3つの条件で使用して配列決定する。上のパネルは、無編集野生型条件についての代表的なサンガートレースを示す。上から2番目のパネルは、全長の発現されたプライムエディター構築物を表す代表的なサンガートレースを示す。黒い四角で強調表示されている領域は、サンガーシーケンシングにおけるTバンドの出現を示し、これにより、細胞の一部への編集の上首尾の組み入れが示される。一番下のパネルは、二方向分割再構成プライムエディターを用いて編集された細胞についての代表的なサンガートレースを示す。Tトレース(黒い四角)の出現により、2つの断片から再構成された場合のプライムエディターの機能性が実証される。
図22A~22Cは、全長ヒト化シトシン塩基エディター(AncBE4)(1854アミノ酸)の効率的な再構成を示す。使用した5’分子および3’分子のDNA配列が配列番号163および164に示されている。(A)AncBE4の発現を示すウエスタンブロット。レーン1~3:全長AncBE4の発現(約230kDaのバンドは全長AncBE4を示す)。レーン4~6:再構成されたAncBE4の発現(230kDaのバンドは首尾よく再構成されたAncBE4を示す)。レーン7:トランスフェクションなし対照(すなわち、HEK 293t溶解物のみ)は、いかなるシグナルも存在しないことを示す。AncBE4をマウス抗Cas9一次抗体を使用してプローブする。全てのレーンに清澄化した細胞タンパク質抽出物5マイクログラムをローディングした。ローディング対照としてGAPDH(ウサギ抗GAPDH)をプローブする。(B)ウエスタンブロットの生の定量化。データは全長発現対照の平均に対して正規化されたものとして示されている。(C)AncBE4により誘導されるCからTへの転位変異がHEK293T細胞のEMX1遺伝子座およびHEK部位3遺伝子座において誘導されたことを示す。上のパネルは、それぞれEMX1およびHEK部位3遺伝子座の配列コンテキストを示す。灰色の矢印は、AncBE4 gRNAによって標的化される配列を示す。プロトスペーサー隣接モチーフ(PAM)が灰色の四角で示されている。Tへの転位の標的とされるCが配列内で強調表示されている。ゲノム遺伝子座についてサンガーシーケンシングを3つの条件で使用して配列決定する。上のパネルは、無編集野生型条件についての代表的なサンガートレースを示す。上から2番目のパネルは、全長の発現されたAncBE4構築物を表す代表的なサンガートレースを示す。黒い四角で強調表示されている領域は、サンガーシーケンシングにおけるTバンドの出現を示し、これにより、細胞の一部への編集の上首尾の組み入れが示される。一番下のパネルは、二方向分割再構成AncBE4を用いて編集された細胞についての代表的なサンガートレースを示す。Tトレース(黒い四角)の出現により、2つの断片から再構成された場合のAncBE4の機能性が実証される。
図23A~23Cは、全長ヒト化アデニン塩基エディター(ABE8e)(1606アミノ酸)(例えば、配列番号225、226)の効率的な再構成を示す。使用した5’分子および3’分子のDNA配列が配列番号165および166に示されている。(A)ABE8eの発現を示すウエスタンブロット。レーン1~3:全長ABE8eの発現(約230kDaのバンドは全長ABE8eを示す)。レーン4~6:再構成されたABE8eの発現(230kDaのバンドは首尾よく再構成されたABE8eを示す)。レーン7:トランスフェクションなし対照(すなわち、HEK293t溶解物のみ)は、いかなるシグナルも存在しないことを示す。ABE8eをマウス抗Cas9一次抗体を使用してプローブする。全てのレーンに清澄化した細胞タンパク質抽出物5マイクログラムをローディングした。GAPDH(ウサギ抗GAPDH)をローディング対照としてプローブする。(B)ウエスタンブロットの生の定量。データは全長発現対照の平均に対して正規化されたものとして示されている。(C)ABE8eにより誘導されるAからGへの転位変異がHEK293t細胞のBCL11A遺伝子座およびHGB1/2遺伝子座において誘導されたことを示す。上のパネルは、それぞれBCL11AおよびHGB1/2遺伝子座の配列コンテキストを示す。灰色の矢印はABE8eガイドRNA(gRNA)によって標的化される配列を示す。プロトスペーサー隣接モチーフ(PAM)が灰色の四角で示されている。Gへの転位の標的とされるAが配列内で強調表示されている。ゲノム遺伝子座についてサンガーシーケンシングを3つの条件で使用して配列決定する。上のパネルは、無編集野生型条件についての代表的なサンガートレースを示す。上から2番目のパネルは、全長発現されたABE8e構築物を表す代表的なサンガートレースを示す。黒い四角で強調表示されている領域は、サンガーシーケンシングにおけるGバンドの出現を示し、これにより、細胞の一部への編集の上首尾の組み入れが示される。一番下のパネルは、二方向分割再構成ABE8eを用いて編集された細胞についての代表的なサンガートレースを示す。Gトレース(黒い四角)の出現により、2つの断片から再構成された場合のABE8eの機能性が実証される。
図23D~Gは、デュシェンヌ型筋ジストロフィーのmdxマウスモデルにおける中途終止コドンを補正するための、全長ヒト化アデニン塩基エディター(ABE8e)(1606アミノ酸)の効率的な再構成を示す。(D)実験の概略図。ABE8e塩基エディターを、コードDNAが2つの別々のアデノ随伴ウイルスカプシドに個別にパッケージングされた2つの断片に分割する。CRISPR gRNAを、AからGへの変換によりTAA終止コドンがCAAコドンに変換されるように、中途終止コドンの遺伝子座を標的とするように設計する。(E)黄色蛍光タンパク質(YFP)を、中途終止コドンの周囲のmdxコード配列の短い一続きで接続された2つのコード断片に分割する。YFPの第1の半分は、オープンリーディングフレームが中途TAA終止コドンによって終止する場合、非蛍光である。終止コドン補正の結果、蛍光が付与された完全なYFP配列の翻訳がもたらされる(この構築物は、YFP-編集-レポーターと称される)。左側のパネルは、HEK293T細胞に、YFP-編集-レポーター(赤色蛍光トランスフェクション対照を共発現する)、およびN末端ABE8eベクター、およびC末端ABE8eベクター、および非標的化gRNAをトランスフェクトした場合にはYFP蛍光が存在しないことを示す。右側のパネルは、YFP-編集-レポーター(赤色蛍光トランスフェクション対照を共発現する)、およびN末端ABE8eベクター、およびC末端ABE8eベクター、およびmdx遺伝子座標的化gRNAを共トランスフェクトした場合には高いパーセンテージの細胞においてYFP蛍光が発現されることを示す。(F)処置された筋肉におけるジストロフィンの発現をもたらす、mdx中途終止コドンのin vivo編集を示す。雄mdx変異マウスに、アデノ随伴ウイルス8ベクターにパッケージングされたN末端ABE8eとC末端ABE8eの混合物(ベクター当たり5×1010個のウイルスゲノム、合計で筋肉当たり1×1011個のウイルスゲノム)を注射した。ウイルスゲノムは、2つのゲノムのそれぞれに2つのgRNA発現カセット(RNAポリメラーゼIIIプロモーターおよびgRNA配列で構成される)を含有する。ウイルスミックスを前脛骨筋に筋肉内注射した。右上のパネルは、参照として野生型前脛骨筋横断面におけるジストロフィン染色を示す。左下のパネルは、無処置の前脛骨筋組織を示す。右下のパネルは、2つのアデノ随伴ウイルスを注射した前脛骨筋におけるジストロフィンの発現を示す。(G)ABE8eを発現させるためにアデノ随伴ウイルスミックスを用いて処置した前脛骨筋のジストロフィン発現(上のパネル)、ABE8e発現(中央のパネル)、およびGAPDHローディング対照(下のパネル)を示す。これにより、ABE8e塩基エディターを使用したジストロフィン発現のレスキューが例示される。 同上。 同上。 同上。
下流イントロンスプライシングエンハンサー(DISE)およびイントロンスプライシングエンハンサー(ISE)およびアクセプター配列のRNA末端結合の効率に対する影響。(A)スクリーニング設定の概略図。5’断片は、DNA構築物からヒトCMVプロモーターおよびエンハンサーを使用して転写されるRNA分子である。生じるRNA分子は、大きなカーゴサイズをシミュレートするための長いスタッファーオープンリーディングフレームを含有する。このスタッファー配列は2A自己切断性ペプチド配列で終わり、続いて、黄色蛍光タンパク質の5’断片のコード領域(n-yfp)が続く。yfpの5’断片はスプライスドナー部位(SD)で終わる。このスプライスドナー部位の後にRNA末端結合モジュールの5’イントロン部分が続く。DISEおよびISE配列のRNA末端結合反応効率に対する影響を決定するために、5’イントロン部分は3つの断片:5’から3’に:ds:下流セグメント;m:中間イントロンセグメント;dd:ドナー遠位セグメントに細分される。5’イントロン部分の後に三峰性キッシングループRNA二量体形成ドメインが続く。メッセージは短いポリアデニル化シグナルで終結する。この5’RNA分子の全体の長さは、大きなカーゴの再構成シナリオをシミュレートするために、約4kbである。3’断片は、DNA構築物からヒトCMVプロモーターおよびエンハンサーを使用して転写されるRNA分子である。3’断片は5’断片をコードするRNA分子のものと相補的な三峰性キッシングループRNA二量体形成ドメインで始まる。二量体形成ドメインの後にRNA末端結合モジュールの3’イントロン部分が続く。この3’イントロン部分は3つのセグメント:ad:アクセプター遠位セグメント;m:中間イントロンセグメント;ap:アクセプター近位セグメントに細分される。アクセプター近位セグメントは、どちらもスプライソソーム媒介性RNA結合反応に必須である分岐点およびポリピリミジントラクトのバリエーションを有する。スプライスアクセプター(SA)部位の後に3’yfpコード配列が続き、その後に自己切断性2A配列が続き、その後に長いスタッファーオープンリーディングフレームが続く。メッセージはSV40ポリアデニル化シグナルで終結する。3’RNA分子の全体の長さは、大きなカーゴの再構成シナリオをシミュレートするために、約4kbである。2つのRNA分子(5’断片と3’断片)の会合は三峰性キッシングループRNA二量体形成ドメインによって媒介され、スプライソソームの動員およびRNA末端結合反応はイントロンセグメントによって媒介される。上首尾のRNA末端結合により、yfpオープンリーディングフレームの再構成およびその後のYFPの翻訳がもたらされる。(B)フローサイトメトリーによって決定されるYFP蛍光強度中央値が複数のイントロン構成について示されている。第1の群分け(棒1~9)では、潜在的な下流イントロンスプライシングエンハンサー配列の選択を、棒1~8に示されているコンセンサススプライスドナー部位(DNA構築物ではGTAAGTATTおよびRNA配列ではGUAAGUAUU)と対にした。これらを、4つの塩基全ての等しい部分で構成されるスクランブル配列が後ろに続くコンセンサススプライスドナー(ds9)と比較する。第2の群分け、m1~m16では、潜在的なイントロンスプライシングエンハンサーの選択をスクランブル配列(m16)と比較した。最後の群分けでは、潜在的な強力な分岐点、ポリピリミジントラクト、およびスプライスアクセプターの選択を比較した。参照構築物は、全てが非可変位置にあるスクランブル配列とコンセンサスドナー、続いて、ds位置にあるスクランブル配列およびコンセンサススプライスアクセプター配列で構成された(ここで、ポリピリミジントラクト全体は、それぞれDNA構築物ではTで構成され、RNA断片ではUで構成される)。(C)使用した異なるDISE、ISE、およびスプライスアクセプターエレメントの一覧表。 同上。 同上。
図25A~25Bは、本明細書に開示される方法を使用したマウス筋肉における塩基エディターのin vivo発現、およびジストロフィン遺伝子変異の補正を示す。(A)野生型(wt)マウス、無処置のmdx-4cvマウス、および処置されたmdx-4cvマウス由来の筋肉抽出物におけるジストロフィン、Cas9-ABE、およびGAPDHの発現を示すウエスタンブロット。(B)野生型(wt)マウス、無処置のmdx-4cvマウス、および処置されたmdx-4cvマウスの筋肉におけるジストロフィン発現の免疫組織化学的分析。
配列表
添付の配列表に列挙されている核酸配列およびアミノ酸配列は、37C.F.R.1.822において定義されている通り、ヌクレオチド塩基については標準的な文字略語、およびアミノ酸については3文字コードを使用して示されている。各核酸配列の一方の鎖のみが示されているが、示されている鎖への言及のいずれにも相補鎖が含まれると理解されたい。配列表は、2022年5月16日に作成された299KBのASCIIテキストファイルとして提出され、それは参照により本明細書に組み込まれる。添付の配列表において:
配列番号1および2は、それぞれ、全長YFPを発現させるために使用したN末端配列およびC末端配列である。配列番号1、CMVプロモーターnt1~543、YFPコード配列nt544~1032、合成イントロンnt1033~1436、および非翻訳ポリA領域nt1437~1491。配列番号2、CMVプロモーターnt1~522、合成イントロンnt523~904、YFPコード配列nt905~1141、およびnt1142~1302は非翻訳ポリA領域である。
配列番号3および4は、それぞれ、所望の全長タンパク質を発現させるために使用することができる5’イントロン配列および3’イントロン配列であり、ここで、全長タンパク質のN末端部分を配列番号3のnt1に付加することができ、全長タンパク質のC末端部分を配列番号4のnt382に付加することができる。
配列番号5および6は、それぞれ、全長YFPを発現させるために使用したN末端コード配列およびC末端コード配列である。
配列番号7は、例示的な合成イントロン二量体形成ドメインである(図10E)。
配列番号8は、イントロンスプライシングエンハンサーを有さない例示的な合成イントロンである(図10F)。
配列番号9は、イントロンスプライシングエンハンサーを有さない例示的な合成イントロンである(図10G)。
配列番号10は、イントロンスプライシングエンハンサーを有さない例示的な合成イントロンである(図10H)。
配列番号11は、結合ドメインを有さない例示的な合成イントロンである(図10I)。
配列番号12は、二量体形成ドメインを有する例示的な合成イントロンである(図10J)。
配列番号13は、二量体形成ドメインを有する例示的な合成イントロンである(図10K)。
配列番号14は、イントロンスプライシングエンハンサーを有さない例示的な合成イントロンである(図10L)。
配列番号15は、DISEのみを有する例示的な合成イントロンである(図10M)。
配列番号16は、HHrzを有さない例示的な合成イントロンである(図10N)。
配列番号17は、イントロンスプライシングエンハンサーを有さない例示的な合成イントロンである(図10O)。
配列番号18は、結合ドメインを有する例示的なU12依存性イントロンである(図10P)。
配列番号19は、結合ドメインを有する例示的なU12依存性イントロンである(図10Q)。
配列番号20および21は、それぞれ、全長Abca4をもたらすRNA(プレmRNA)を発現させるために使用したN末端DNA配列およびC末端DNA配列である。配列番号20において、N末端Abca4コード領域に対応する配列がnt22~3702に存在し、nt3703~3912は合成イントロンであり、3921~3969は非翻訳ポリA領域である。配列番号20は、nt3703~3711のスプライスドナー、nt3714~3737のラットFGFR2 DISE、nt3747~3770のcTNTイントロンスプライシングエンハンサー、nt3782~3794のM2イントロンスプライシングエンハンサー、およびnt3801~3975のキッシングループ二量体形成ドメインも含有する。配列番号21において、nt1~228は合成イントロンであり、nt229~3366はC末端Abca4コード領域であり、3367~3447はFLAGエピトープタグであり、nt3476~3607は非翻訳ポリA領域(シグナル)である。配列番号21は、nt3~114のキッシングループ二量体形成ドメイン、nt121~133のM2イントロンスプライシングエンハンサー、nt140~163のcTNTイントロンスプライシングエンハンサー、nt175~187のM2イントロンスプライシングエンハンサー、nt194~201の分岐点モチーフ、nt207~226のポリピリミジントラクト、およびnt228にスプライスアクセプターも含有する。
配列番号22および23は、それぞれ、長い全長YFPをもたらすRNA(プレmRNA)を発現させるために使用したN末端DNA配列およびC末端DNA配列あり、それぞれスプライスエンハンサーを含む。配列番号22において、N末端YFPコード領域はnt22~3702であり、nt3703~3912は合成イントロンであり、3921~3969は非翻訳ポリA領域である。配列番号22は、nt3703~3711のスプライスドナー、nt3714~3737のラットFGFR2 DISE、nt3747~3770のcTNTイントロンスプライシングエンハンサー、3782~3794にM2イントロンスプライシングエンハンサー、および3801~3975にキッシングループ二量体形成ドメインも含有する。配列番号23において、nt1~225は合成イントロンであり、nt226~3747はC末端YFPコード領域であり、nt3748~3912は非翻訳ポリA領域である。配列番号23は、nt3~114のキッシングループ二量体形成ドメイン、nt118~130のM2イントロンスプライシングエンハンサー、nt137~160のcTNTイントロンスプライシングエンハンサー、nt172~184のM2イントロンスプライシングエンハンサー、nt191~198の分岐点モチーフ、nt204~223のポリピリミジントラクト、およびnt225にスプライスアクセプターを含む。
配列番号24および25は、それぞれ、全長ヒト第VIII因子をもたらすRNA(プレmRNA)を発現させるために使用したN末端配列およびC末端配列である。配列番号24において、N末端HAエピトープタグntを有するN末端FVIIIコード領域がnt22~3561に存在し、nt3562~3771は合成イントロンであり、nt3780~3828は非翻訳ポリA領域である。配列番号24は、nt3562~3570のスプライスドナー、nt3573~3596のラットFGFR2 DISE、nt3606~3629のcTNTイントロンスプライシングエンハンサー、nt3641~3653のM2イントロンスプライシングエンハンサー、およびnt3660~3834のキッシングループ二量体形成ドメインも含有する。配列番号25において、nt1~225は合成イントロンであり、nt226~3636はC末端FVIIIコード領域であり、nt3665~3797は非翻訳ポリA領域である。配列番号25は、nt3703~3711のスプライスドナー、nt3714~3737のラットFGFR2 DISE、nt3747~3770のcTNTイントロンスプライシングエンハンサー、3782~3794のM2イントロンスプライシングエンハンサー、およびnt3801~3975のキッシングループ二量体形成ドメインも含有する。
配列番号26~136は、本明細書に提示される系で使用することができる例示的なスプライシングエンハンサーである(例えば、図6Aの118、120、156)。
配列番号137および138は、例示的なスプライスドナー配列である。
配列番号139および140は、それぞれ、HIV-1に基づくキッシングループ二量体形成ドメインのN断片およびC断片である。
配列番号141および142は、それぞれ、HIV-2に基づくキッシングループ二量体形成ドメインのN断片およびC断片である。
配列番号143は、例示的な潜在スプライスアクセプター配列である。
配列番号144は、例示的な分岐点コンセンサス配列である。
配列番号145および146は、それぞれ、全長YFPを発現させるために配列番号2(C末端断片)と一緒に使用したN配列および中間配列である。配列番号145において、nt1~543はCMVプロモーター配列であり、nt544~849はN末端YFPコード領域であり、nt850~1305は合成イントロンである。配列番号146において、nt1~522はCMVプロモーター配列であり、nt523~901は合成イントロンであり、nt902~1084は中間YFPコード領域であり、nt1085~1543は非翻訳ポリA領域である。
配列番号147および148は、それぞれ、全長Flpoを発現させるために使用した5’合成配列および3’合成配列である。配列番号147において、nt1~540はCMVプロモーター配列であり、nt541~1112はN末端Flpoコード領域であり、nt1113~1571は合成イントロンである。配列番号148において、nt1~522はCMVプロモーター配列であり、nt523~904は合成イントロンであり、nt905~1604はC末端Flpoコード領域であり、nt1605~1765は非翻訳ポリA領域である。
配列番号149および150は、例示的な低多様性配列である。
配列番号151および152は、例示的なスプライスドナーコンセンサス配列である。
配列番号153は、HIV-2キッシングループ二量体形成ドメイン(配列番号141および142、図17B)に基づく例示的なキッシングループである。
配列番号154は、例示的なコザック増強開始コドンである。
配列番号155および156は、マウスOtofコード配列をin vivoで発現させるために使用することができる例示的な構築物である。配列番号155は、N末端Otof RNAを生成するために使用される。配列番号155は、nt1~522のヒトCMVエンハンサーおよびプロモーター、nt523の推定転写開始部位、およびnt4263~4311のポリアデニル化シグナルを含む。配列番号155は、N末端Otof RNAエレメントを以下の通りコードする:コザック配列を含む5’非翻訳領域nt523~546;5’オトフェルリンコード配列nt547~4044;5’合成イントロン配列nt4045~4142;5’三峰性キッシングループ二量体形成ドメインnt4143~4254;およびnt4255~4262のリンカー。配列番号155は、C末端Otof RNAを生成するために使用される。それは、nt1~522のヒトCMVエンハンサーおよびプロモーター、nt523の推定転写開始部位、およびnt3335~3467のポリアデニル化シグナルを含む。それは、C末端Otof RNAエレメントを以下の通りコードする:3’三峰性キッシングループ二量体形成ドメインnt525~636;3’合成イントロン配列nt637~747;3’オトフェルリンコード配列nt748~3225;C末端3×Flagタグnt3226~3306;およびnt3307~3334のリンカー。
配列番号157および158は、ヒトミオシンVIIA(Myo7a)コード配列をin vivoで発現させるために使用することができる例示的な構築物である。配列番号157は、N末端Myo7a RNAを生成するために使用される。配列番号157は、nt1~522のヒトCMVエンハンサーおよびプロモーター、nt523の推定転写開始部位、およびnt4344~4392のポリアデニル化シグナルを含む。配列番号157は、N末端Myo7A RNAエレメントを以下の通りコードする:コザック配列を含む5’非翻訳領域nt523~543;5’Myo7aコード配列nt544~4125;5’合成イントロン配列nt4126~4223;5’三峰性キッシングループ二量体形成ドメインnt4224~4335;およびnt4336~4343のリンカー。配列番号158は、C末端Myo7a RNAを生成するために使用される。配列番号158は、nt1~522のヒトCMVエンハンサーおよびプロモーター、nt523の推定転写開始部位、およびnt3923~4055のポリアデニル化シグナルを含む。配列番号158は、C末端Myo7a RNAエレメントを以下の通りコードする:3’三峰性キッシングループ二量体形成ドメインnt525~636;3’合成イントロン配列nt637~747;3’Myo7aコード配列nt748~3813;C末端3×Flagタグnt3814~3894;およびnt3895~3922のリンカー。
配列番号159および160は、VPR転写活性化因子ドメインと融合した全長の酵素的に不活性型のCas9(dCas9-VPR)コード配列をin vivoで発現させるために使用することができる例示的な構築物である。配列番号159は、N末端DCas9-VPR RNAを生成するために使用される。配列番号159は、nt1~522のヒトCMVエンハンサーおよびプロモーター、nt523の推定転写開始部位、およびnt4112~4161のポリアデニル化シグナルを含む。配列番号159は、N末端DCas9-VPR RNAエレメントを以下の通りコードする:コザック配列を含む5’非翻訳領域nt523~543;5’DCas9-VPRコード配列nt544~3894;5’合成イントロン配列nt3895~3992;5’三峰性キッシングループ二量体形成ドメインnt3993~4104;およびリンカーnt4105~4112。配列番号160は、C末端DCas9-VPR RNAを生成するために使用される。配列番号160は、nt1~522のヒトCMVエンハンサーおよびプロモーター、nt523の推定転写開始部位、およびポリアデニル化シグナルzt nt3278~3410を含む。配列番号160は、C末端DCas9-VPR RNAエレメントを以下の通りコードする:3’三峰性キッシングループ二量体形成ドメインnt525~636;3’合成イントロン配列nt637~747;3’DCas9-VPRコード配列nt748~3249;およびnt3250~3277のリンカー。
配列番号161および162は、全長ヒト化Cas9プライムエディター(プライムエディター)コード配列をin vivoで発現させるために使用することができる例示的な構築物である。配列番号161は、N末端プライムエディター配列を以下の通りコードする:ヒトCMVエンハンサーおよびプロモーターnt1~522;推定転写開始部位nt523;コザック配列を含む5’非翻訳領域nt523~543;5’プライムエディターコード配列nt544~3894;5’合成イントロン配列nt3895~3992;5’三峰性キッシングループ二量体形成ドメインnt3993~4104;リンカーnt4105~4112;ポリアデニル化シグナルnt4112~4161。配列番号162は、C末端プライムエディター配列を以下の通りコードする:ヒトCMVエンハンサーおよびプロモーターnt1~522;推定転写開始部位nt523;3’三峰性キッシングループ二量体形成ドメインnt525~636;3’合成イントロン配列nt637~747;3’プライムエディターコード配列nt748~3750;リンカーnt3751~3778;ポリアデニル化シグナルnt3779~3911。
配列番号163および164は、全長ヒト化シトシン塩基エディター(AncBE4)コード配列をin vivoで発現させるために使用することができる例示的な構築物である。配列番号163は、N末端AncBE4配列を以下の通りコードする:ヒトCMVエンハンサーおよびプロモーターnt1~522;推定転写開始部位nt523;コザック配列を含む5’非翻訳領域nt523~540;5’AncBE4コード配列nt541~2892;5’合成イントロン配列nt2893~2990;5’三峰性キッシングループ二量体形成ドメインnt2991~3102;リンカーnt3103~3110;ポリアデニル化シグナルnt3111~3159。配列番号164は、C末端AncBE4配列を以下の通りコードする:ヒトCMVエンハンサーおよびプロモーターnt1~522;推定転写開始部位nt523;3’三峰性キッシングループ二量体形成ドメインnt525~636;3’合成イントロン配列nt637~747;3’AncBE4コード配列nt748~3957;リンカーnt3958~3982;ポリアデニル化シグナルnt3983~4115。
配列番号165および166は、全長ヒト化アデニン塩基エディター(ABE8e)コード配列をin vivoで発現させるために使用することができる例示的な構築物である。配列番号165は、N末端ABE8e配列を以下の通りコードする:ヒトCMVエンハンサーおよびプロモーターnt1~522;推定転写開始部位nt523;コザック配列を含む5’非翻訳領域nt523~540;5’ABE8eコード配列nt541~2706;5’合成イントロン配列nt2707~2804;5’三峰性キッシングループ二量体形成ドメインnt2805~2916;リンカーnt2917~2924;ポリアデニル化シグナルnt2925~2973。配列番号166は、C末端Abe8e配列を以下の通りコードする:ヒトCMVエンハンサーおよびプロモーターnt1~522;推定転写開始部位nt523;3’三峰性キッシングループ二量体形成ドメインnt525~636;3’合成イントロン配列nt637~747;3’ABE8eコード配列nt748~3399;リンカーnt3400~3427;ポリアデニル化シグナルnt3428~3560。
配列番号167は、例示的なキッシングループドメイン(GATTTTTGACCTGCTCGATTGTCCACTGCGAGCAGGTCTTTTGGAGTCGGGCGAGGCGGAAGCCCGACTCCTTTTGGCATGCACGCTAGCCGCGTCGTGCATGCCTTTTATC)である。
配列番号168は、例示的なISE、M2(GGGTTATGGGACC)である。
配列番号169は、例示的なISE、cTNT(GGCTGAGGGAAGGACTGTCCTGGG)である。
配列番号170は、例示的なDISE、ラット FGFR2(CTCTTTCTTTCCATGGGTTGGCCT)である。
配列番号171および172は、全長YFPコード配列を発現させるために使用することができる例示的な構築物である。配列番号171は、N末端YFP配列を以下の通りコードする:ヒトCMVエンハンサーおよびプロモーターnt1~522;推定転写開始部位nt523;コザック配列を含む5’非翻訳領域nt523~543;5’スタッファーオープンリーディングフレームnt544~3654;自己切断性2A配列nt3655~3729;5’黄色蛍光タンパク質セグメントnt3730~4224;5’合成イントロン配列(可変)nt4225~4294;5’三峰性キッシングループ二量体形成ドメイン(大文字):4295~4406;リンカーnt4407~4414;ポリアデニル化シグナルnt4415~4463。配列番号172は、C末端YFP配列を以下の通りコードする:名称:3’イントロンスクリーニング分割YFP;ヒトCMVエンハンサーおよびプロモーターnt1~522;推定転写開始部位nt523;3’三峰性キッシングループ二量体形成ドメインnt525~636;3’合成イントロン配列(可変)nt637~706;3’yfpコード配列nt707~940;自己切断性2A配列nt941~1006;3’スタッファーオープンリーディングフレームnt1007~4228;リンカーnt4229~4265;ポリアデニル化シグナルnt4257~4388。
配列番号173~180は、例示的なイントロンスプライシングエンハンサー配列である。
配列番号181は、スクランブル配列である。
配列番号182~196は、例示的なイントロンスプライシングエンハンサー配列である。
配列番号197~198は、スクランブル配列である。
配列番号199~203は、例示的なイントロンスプライシングエンハンサー配列である。
配列番号204は、スクランブル配列である。
配列番号205は、例示的な分岐点配列(TACTAACA)である。
配列番号206は、例示的なポリアデニル化シグナルAATAAAATATCTTTATTTTCATTACATCTGTGTGTTGGTTTTTTGTGTGである。
配列番号207および208は、それぞれ例示的なCas9コード配列およびタンパク質配列である。
配列番号209および210は、それぞれ例示的なdCas9コード配列およびタンパク質配列である。
配列番号211および212は、それぞれ例示的なCas13dの核酸配列およびアミノ酸配列である。
配列番号213および214は、それぞれ例示的なCas13dの核酸配列およびアミノ酸配列である。
配列番号215および216は、例示的な死んだ(dead)Cas13d(例えば、触媒として不活性な)アミノ酸配列である。
配列番号217は、例示的なネイティブなHEPNドメインRXXXXHである。
配列番号218~221は、例示的な核局在化シグナルコード配列およびタンパク質配列である。
配列番号222は、例示的なCas13dタンパク質配列である。
配列番号223は、gRNA配列に含まれ、RNAの編集のために配列番号212のCas13dタンパク質と共に使用され得る例示的なDR配列である。
配列番号224は、gRNA配列に含まれ、RNAの編集のために配列番号のCas13dタンパク質と共に使用され得る例示的なDR配列である。
配列番号225および226は、全長ヒト化アデニン塩基エディター(ABE8e)コード配列をin vivoで発現させるために使用することができる例示的な構築物である。配列番号225は、N末端ABE8e配列をコードし、以下の通り2つのgRNA発現カセットを含む:nt1~141 AAV2末端逆位反復配列;nt159~255 CRISPR gRNA(逆向き)、nt256~504ヒトU6 RNAポリメラーゼIIIプロモーター(逆向き)、nt512~1019 CMVプロモーター、nt1034~1051 5’非翻訳領域、nt1052~3217 N末端ABE8eエディター、nt3218~3315合成イントロン配列、nt3316~3427二量体形成ドメイン、nt3436~3485ポリアデニル化シグナル、nt3492~3706 H1ポリメラーゼIIIプロモーター、nt3707~3803 CRISPR gRNA、およびnt3825~3965 AAV2末端逆位反復配列。配列番号225は、配列番号165および追加されたgRNA発現カセットを含む。配列番号226は、C末端ABE8e配列をコードし、以下の通り2つのgRNA発現カセットを含む:nt1~141 AAV2末端逆位反復配列、nt159~255 CRISPR gRNA(逆向き)、nt256~504ヒトU6 RNAポリメラーゼIIIプロモーター(逆向き)、nt512~1019 CMVプロモーター、nt1036~1147二量体形成ドメイン、nt1259~3910 3’ABE8eコード配列、nt3939~4069ポリアデニル化シグナル、nt4078~4292 H1ポリメラーゼIIIプロモーター、nt4293~4389 CRISPR gRNA、およびnt4411~4551 AAV2末端逆位反復配列。配列番号226は、配列番号166および追加されたgRNA発現カセットを含む。
詳細な説明
特に断りのない限り、技術用語は従来の使用に従って使用されている。分子生物学における一般的な用語の定義は、Benjamin Lewin, Genes VII, published by Oxford University Press, 1999;Kendrew et al. (eds.), The Encyclopedia of Molecular Biology, published by Blackwell Science Ltd., 1994;およびRobert A. Meyers (ed.), Molecular Biology and Biotechnology: a Comprehensive Desk Reference, published by VCH Publishers, Inc., 1995;および他の同様の参考文献において見いだすことができる。
本明細書で使用される場合、「1つの(a)」、「1つの(an)」、および「その(the)」という単数形は、文脈によりそうでないことが明白に示されない限り、単数ならびに複数の両方を指す。本明細書で使用される場合、「含む(comprises)」という用語は、「含む(includes)」を意味する。したがって、「核酸分子を含む(comprising a nucleic acid molecule)」は、他の要素を排除せず、「核酸分子を含む(including a nucleic acid molecule)」を意味する。核酸に関して示されるありとあらゆる塩基サイズは、別段の指定のない限り、おおよそのものであり、説明目的で提示されることもさらに理解されるべきである。本明細書に記載のものと同様または同等である多くの方法および材料を使用することができるが、特定の適切な方法および材料を以下に記載する。矛盾する場合は、用語の説明を含めた本明細書が支配する。さらに、材料、方法および実施例は単に例示的なものであり、それに限定されるものではない。特許出願および特許を含めた全ての参考文献、ならびにGenBank受託番号は、それらの全体が参照により本明細書に組み込まれる。
本明細書に開示される種々の実施形態の概説を容易にするために、以下の特定の用語に関する説明を提示する:
投与:対象に、本明細書に提示される治療用核酸分子(例えば、核酸エディタータンパク質、gRNA、もしくは両方の1つもしくは複数の部分をコードするもの)または他の治療剤などの作用物質を任意の効果的な経路によって提供または与薬すること。例示的な投与経路としては、これだけに限定されないが、注射(例えば、皮下、筋肉内、皮内、腹腔内、髄腔内、腫瘍内、骨内、および静脈内)、経皮、鼻腔内、および吸入経路が挙げられる。投与は、全身性のものまたは局所的なものであり得る。
アプタマー:特定の標的作用物質または分子に高い親和性および特異性で結合する核酸分子(例えば、DNAまたはRNAなど)。アプタマーは、本明細書に開示される核酸分子に二量体形成ドメインとして使用することができる。一実施例では、2つのアプタマーが互いに、例えば、標準的な塩基対合、非標準的な塩基対相互作用、非塩基対合相互作用、またはこれらの組合せによって結合して、二量体形成を媒介し得る。一実施例では、アプタマーにより、アプタマーによって認識される1つまたは複数の標的の存在下でのみ、RNA二量体形成(およびその後の組換え)が可能になる。アプタマーは、試験管内進化法(systematic evolution of ligands by exponential enrichment)(SELEX)と称されるコンビナトリアル選択プロセスによって得られている(例えば、Ellington et al., Nature 1990, 346, 818-822;Tuerk and Gold Science 1990, 249, 505-510;Liu et al., Chem. Rev. 2009, 109, 1948-1998;Shamah et al., Acc. Chem. Res. 2008, 41, 130-138;Famulok, et al., Chem. Rev. 2007, 107, 3715-3743;Manimala et al., Recent Dev. Nucleic Acids Res. 2004, 1, 207-231;Famulok et al., Acc. Chem. Res. 2000, 33, 591-599;Hesselberth, et al., Rev. Mol. Biotech. 2000, 74, 15-25;Wilson et al., Annu. Rev. Biochem. 1999, 68, 611-647;Morris et al., Proc. Natl. Acad. Sci. U.S.A. 1998, 95, 2902-2907を参照されたい)。そのようなプロセスにおいて
、目的の標的分子に結合することができるDNA分子またはRNA分子は、1014~1015種の異なる配列からなる核酸ライブラリーから、選択、増幅および変異の反復ステップによって選択される。アプタマーのそれらの標的に対する親和性は抗体の親和性と競合し得、解離定数はピコモル濃度範囲の低さである(Morris et al., Proc. Natl. Acad. Sci. U.S.A. 1998, 95, 2902-2907;Green et al., Biochemistry 1996,
35, 14413-14424)。
アデノシンなどの小有機分子から、トロンビンなどのタンパク質、さらにはウイルスおよび細胞までの広範囲の標的に対して特異的なアプタマーが同定されている(Liu et al., Chem. Rev. 2009, 109, 1948-1998;Lee et al., Nucleic Acids Res. 2004, 32, D95-D100;Navani and Li, Curr. Opin. Chem. Biol. 2006, 10, 272-281;Song et al., TrAC, Trends Anal. Chem. 2008, 27, 108-117)。例えば、金属イオン、例えば、Zn(II)(Ciesiolka et al., RNA 1: 538-550, 1995)およびNi(II)(Hofmann et al., RNA、3: 1289-1300, 1997);ヌクレオチド、例えば、アデノシン三リン酸(ATP)(Huizenga and Szostak, Biochemistry, 34: 656-665, 1995);およびグアニン(Kiga et al., Nucleic Acids Res., 26: 1755-60, 1998);補因子、例えば、NAD(Kiga et al., Nucleic Acids Res., 26: 1755-60, 1998)およびフラビン(Lauhon and Szostak, J. Am. Chem. Soc., 117: 1246-57, 1995);抗生物質、例えば、バイオマイシン(Wallis et al., Chem. Biol. 4: 357-366, 1997)およびストレプトマイシン(WallaceおよびSchroeder, RNA 4: 112-123, 1998);タンパク質、例えば、HIV逆転写酵素(Chaloin et al., Nucleic Acids Res., 30: 4001-8, 2002)およびC型肝炎ウイルスRNA依存性RNAポリメラーゼ(Biroccio et al., J. Virol. 76: 3688-96, 2002);毒素、例えば、コレラ全毒素およびブドウ球菌エンテロトキシンB(Bruno and Kiel, BioTechniques, 32:pp. 178-180 and 182-183, 2002);ならびに細菌胞子、例えば、炭疽菌(Bruno and Kiel, Biosensors & Bioelectronics, 14: 457-464, 1999)を認識するアプタマーが利用可能である。
結合:2つの二量体形成ドメイン間など、1つの核酸分子と別の核酸分子(またはそれ自体)のハイブリダイゼーション、またはアプタマーとその標的の結合などの、2つの物質または分子間の会合。オリゴヌクレオチド分子と別の核酸分子は、それらのオリゴヌクレオチド分子と標的核酸の間に結合の検出を可能にする十分な数の相補的な塩基対が存在する場合、結合するまたは安定に結合する。一部の実施例では、核酸分子間の結合は直接起こり得る。一部の実施例では、核酸分子間の結合は、間接的に、例えば中間分子を通じて起こり得る。直接結合または間接結合のいずれも標準的な塩基対合によって、非標準的な塩基対相互作用によって、非塩基対相互作用によって、またはこれらの組合せで起こり得る。非標準的な塩基対相互作用は、これだけに限定されないが、フーグスティーン塩基対およびゆらぎ塩基対を含めた当業者に公知の任意の安定化の手段によって起こり得る。非塩基対相互作用は、中間分子を通じた結合を含み得る。一部の実施例では、直接結合は、キッシングループ二量体形成ドメイン間のものである。一部の実施例では、直接結合は低多様性二量体形成ドメイン間のものである。一部の実施例では、直接結合はアプタマー領域間のものである。一部の実施例では、アプタマー領域間の直接結合は非標準的な塩基対相互作用を伴う。一部の実施例では、アプタマー領域間の直接結合は標準的な塩基対合および非標準的な塩基対相互作用を伴う。一部の実施例では、間接結合は核酸架橋を通じて起こる。一部の実施例では、核酸架橋はmRNAである。核酸架橋の非限定的な例は図7Bに示されている。一部の実施例では、間接結合はアプタマー分子を通じて起こる。アプタマー分子を通じた間接結合の非限定的な例は図7Aに示されている。一部の実施形態では、アプタマー分子を通じた間接結合はアプタマー分子と結合領域の間の非塩基対相互作用を伴う。一部の実施形態では、アプタマー分子を通じた間接結合はアプタマー分子と結合領域の間の非塩基対相互作用、および結合領域間の塩基対合相互作用を伴う。
C末端部分:タンパク質のC末端残基またはその付近から始まる連続した一続きのアミノ酸を含むタンパク質配列の領域。タンパク質のC末端部分は、連続した一続きのアミノ酸(例えば、いくつかのアミノ酸残基)によって定義することができる。
がん:異常なまたは制御されない細胞成長を特徴とする悪性腫瘍(malignant
tumor)。多くの場合がんに関連する他の特色としては、転移、近隣の細胞の正常機能への干渉、サイトカインまたは他の分泌産物の異常なレベルでの放出、および炎症応答または免疫学的応答の抑制または増悪、周囲または遠位の組織または器官、例えば、リンパ節などへの浸潤が挙げられる。「転移性疾患」は、元の腫瘍部位を離れ、例えば血流またはリンパ系を介して体の他の部分に移動するがん細胞を指す。
Cas9:原核生物ウイルスに対するCRISPR-Cas免疫防御に関与するRNA誘導型DNAエンドヌクレアーゼ酵素。Cas9は、二重らせんの各鎖に1つずつ、2つの活性なカット部位(HNHおよびRuvC)を有する。S.pyogenes由来の例示的なネイティブなCas9配列が配列番号208に示されている。
エンドヌクレアーゼ活性は低減または消失しているが、dsDNAにはなお結合する、触媒として不活性な(非活性化または死んだ)Cas9(dCas9)タンパク質も本開示に包含される。一部の実施例では、dCas9は、RuvCおよびHNHヌクレアーゼドメインに1つまたは複数の変異、例えば、以下の点変異のうちの1つまたは複数を含む:D10A、E762A、D839A、H840A、N854A、N863A、およびD986A(例えば、配列番号208における番号付けに基づいて)。D10A置換およびH840A置換を有する例示的なdCas9配列が配列番号210に示されている。一実施例では、dCas9タンパク質は、変異D10A、H840A、D839A、およびN863Aを有する(例えば、Esvelt et al., Nat. Meth. 10: 1116-21, 2013を参照されたい)。
Cas9およびdCas9配列は公的に入手可能である。例えば、GenBank(登録商標)受託番号CP012045.1のヌクレオチド796693..800799およびCP014139.1のヌクレオチド1100046..1104152によりCas9核酸が開示され、GenBank(登録商標)受託番号NP_269215.1、AMA70685.1、およびAKP81606.1によりCas9タンパク質が開示される。一部の実施例では、非活性化形態のCas9(dCas9)は、ヌクレアーゼ欠損したものである(例えば、GenBank(登録商標)受託番号AKA60242.1およびKR011748.1に示されているもの)。活性化可能なCas9タンパク質が米国特許出願公開第2018-0073002-A1号に提示されている。ある特定の実施例では、本明細書において開示される組成物または方法において使用されるCas9またはdCas9は、そのような配列(例えば、配列番号207、208、209、および210)に対して少なくとも80%の配列同一性、例えば、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%の配列同一性、または100%の配列同一性を有し、本明細書において開示される組成物および方法への使用可能性を保持する(例えば、本明細書に開示される2つまたはそれよりも多くの別々の分子によってコードすることができ、その後、本明細書に提示されるREJ法によって組み換えることができる)。
Cas13d:RNAをカットし得るまたはそれに結合し得る、RNA誘導型RNAエンドヌクレアーゼ酵素。Cas13dタンパク質は、特定の二次構造を有するgRNAに存在するダイレクトリピート(DR)配列を特異的に認識する。Cas13dタンパク質は、1つまたは2つのHEPNドメインを含む。ネイティブなHEPNドメインは、配列RXXXXH(配列番号217)を含み、ここで、Xは任意のアミノ酸である。変異したHEPNドメイン(複数可)を含み、したがって、RNAをカットすることができないが、gRNAをプロセシングすることはできる、触媒として不活性なまたは「死んだ」Cas13dも本開示に包含される(例えば、配列番号215および216参照)。そのような死んだCas13d(dCas13d)をプレmRNAのシス-エレメントにターゲティングして、選択的スプライシングを操作することができる。
例示的なネイティブなおよびバリアントCas13dタンパク質配列はWO2019/040664、US10,876,101およびUS10,392,616(全てその全体が参照により本明細書に組み込まれる)に、ならびに本明細書において配列番号212、214、215、216、および222として、提示される。
一実施例では、全長(短縮されていない(non-truncated))Cas13dタンパク質は、870アミノ酸から1080アミノ酸の間の長さである。一実施例では、Cas13dタンパク質は、Clostridiales目の細菌のゲノム配列またはメタゲノム配列に由来する。一実施例では、Cas13dタンパク質の対応するDR配列は、Cas13d gRNAを含む分子内のスペーサー配列の5’末端に位置する。一実施例では、Cas13d gRNA内のDR配列は、プロセシングされていないCas13dガイドアレイ転写物のDR配列と比べて5’末端において短縮されている(例えば、少なくとも1nt、少なくとも2nt、少なくとも3nt、少なくとも4nt、少なくとも5nt、例えば、1~3nt、3~6nt、5~7nt、または5~10nt短縮されている)。一実施例では、Cas13d gRNA内のDR配列は、Cas13dタンパク質によって5’末端において5~7nt短縮されている。一実施例では、Cas13dタンパク質により、スペーサー-標的2重鎖の3’末端に隣接する標的RNAを、a、U、GまたはCリボヌクレオチドのいずれかで、および5’末端に隣接する標的RNAを、a、U、GまたはCリボヌクレオチドのいずれかでカットすることができる。
一実施例では、Cas13dタンパク質は、配列番号212、214、215、216、または222に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%または少なくとも99%の配列同一性を有する。一実施例では、Cas13dコード配列は、配列番号212、214、215、216、または222に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%または少なくとも99%の配列同一性を有するCas13dタンパク質をコードする。一実施例では、Cas13dコード配列は、配列番号211または213に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%または少なくとも99%の配列同一性を有する。
相補性:核酸の、別の核酸配列と従来のワトソン・クリック塩基対合または他の従来のものではない型のいずれかによって水素結合(複数可)を形成する能力。パーセント相補性は、核酸分子(例えば、標的DNAまたはRNA)内の、第2の核酸配列、例えばgRNAと水素結合(例えば、ワトソン・クリック塩基対合)を形成し得る残基のパーセンテージを示す(例えば、10個のうち5個、6個、7個、8個、9個、10個であれば、50%相補的、60%相補的、70%相補的、80%相補的、90%相補的、および100%相補的である)。「完全に相補的」とは、核酸配列の連続した残基の全てが第2の核酸配列内の同じ数の連続した残基と水素結合することを意味する。「実質的に相補的」とは、本明細書で使用される場合、相補性の程度が、8ヌクレオチド、9ヌクレオチド、10ヌクレオチド、11ヌクレオチド、12ヌクレオチド、13ヌクレオチド、14ヌクレオチド、15ヌクレオチド、16ヌクレオチド、17ヌクレオチド、18ヌクレオチド、19ヌクレオチド、20ヌクレオチド、21ヌクレオチド、22ヌクレオチド、23ヌクレオチド、24ヌクレオチド、25ヌクレオチド、30ヌクレオチド、35ヌクレオチド、40ヌクレオチド、45ヌクレオチド、50ヌクレオチド、もしくはそれよりも長い領域にわたって少なくとも60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%、もしくは100%であることを指すか、または、2つの核酸がストリンジェントな条件下でハイブリダイズすることを指す。したがって、一部の実施例では、第1の二量体形成ドメインと第2の二量体形成ドメインは、互いに完全に相補的である(例えば、100%)。他の例では、第1の二量体形成ドメインと第2の二量体形成ドメインは、互いに実質的に相補的である(例えば、少なくとも80%)。
接触:固体または液体の形態を含め、直接の物理的な関連に置かれること。接触は、in vitroもしくはex vivoでは、例えば、試薬を試料(例えば、細胞を含有するものなど)に添加することによって、またはin vivoでは対象に投与することによって生じさせることができる。
CRISPR/Cas系:プラスミドおよびファージなどの外来遺伝子エレメントに対する抵抗性を付与し、獲得免疫の一形態をもたらす原核生物免疫系。系は、Casヌクレアーゼ(例えば、Cas9、Cas13d)と、標的RNAまたはDNAに特異的に結合し、Casヌクレアーゼを標的部位に方向付けるガイドRNA(gRNA)とを含む。本明細書において開示される組成物、系、および方法を使用して、2つまたはそれよりも多くの異なるDNA分子からCasヌクレアーゼを発現させることができ、一部の実施例では、当該DNA分子は、遺伝子発現を調節するため、例えば、標的核酸分子の発現を増加もしくは低減させるため、および/または標的核酸分子の配列を編集するため(例えば、疾患に関連する1つもしくは複数の変異、例えば、置換、挿入もしくは欠失を修復するため)の1つまたは複数のgRNAをさらにコードする。
死んだガイドRNA(dgRNA):野生型Casヌクレアーゼ(例えば、Cas9)を標的核酸に向けてガイドすることはできるが二本鎖DNA切断は誘導しないガイドRNA(gRNA)。短くされたgRNAは約14~15ヌクレオチドの短くされた標的化配列を含有し、一方、死んでいないgRNAは約20ヌクレオチドの標的化配列を含有する。dgRNAは、例えば、全てその全体が参照により本明細書に組み込まれるDahlman et al. (2015) Nat. Biotechnol. 33: 1159-1161;Kiani et al. (2015) Nat. Methods, 12: 1051-1054;およびHsin-Kai Liao et al. (2017) Cell, 171: 1495-1507にさらに記載されている。一部の実施例では、dgRNAは、RNA分子である(例えば、細胞において発現させる場合)。一部の実施例では、dgRNAは、DNA分子によってコードされる(例えば、ウイルスベクターなどのベクター内にある場合)。
DNA編集:DNA内の所望の位置における部位特異的な鎖の切断を作り出すヌクレアーゼ(例えば、Cas9、Cas13dまたはその死んだバージョン)を使用して細胞または生物体においてDNA分子(またはDNAのヌクレオチド)を挿入する、欠失させるまたは置き換える、遺伝子操作の型。誘導された切断は修復され、それにより、標的化変異または修復がもたらされる。例えば、本明細書に提示されるREJ系を使用してCasヌクレアーゼを発現させるCRISPR/Cas法を使用して、がん(例えば、乳がん、結腸がん、肺がん、前立腺がん、黒色腫)、感染性疾患(例えば、HIV、肝炎、HPV、およびウエストナイルウイルス)、または神経変性障害(例えば、ハンチントン病またはALS)に関連するものなどの1つまたは複数の標的DNAの配列を編集することができる。例えば、DNA編集を使用して、疾患またはウイルス感染を処置することができる。
DNA挿入部位:外因性ポリヌクレオチドの挿入の標的とされるまたは外因性ポリヌクレオチドの挿入を受けたDNAの部位。本明細書に開示される方法は、DNAをDNA挿入部位における操作の標的とするために使用することができる、本明細書に提示される2つまたはそれよりも多くの核酸分子から発現される核酸エディターの使用を包含する。
ダウンレギュレートされたまたはノックダウンされた:標的核酸またはタンパク質などの分子の発現に関して使用される場合、標的核酸またはタンパク質の産生の低減をもたらすが、一部の実施例では標的RNA産物または標的核酸機能の完全な排除をもたらすものではない任意のプロセスを指す。一実施例では、ダウンレギュレーションまたはノックダウンは、検出可能な標的核酸/タンパク質の発現または活性の完全な排除をもたらすものではない。一部の実施例では、標的核酸のダウンレギュレーションまたはノックダウンは、標的RNAの翻訳を低減し、したがって、対応するタンパク質の存在を低減し得るプロセスを含む。本明細書に開示される系を、任意の標的核酸/目的のタンパク質をダウンレギュレートするために使用することができる。
ダウンレギュレーションまたはノックダウンは、標的核酸/タンパク質の任意の検出可能な低減を含む。ある特定の実施例では、細胞または無細胞系における検出可能な標的核酸/タンパク質は、対照(対応する無処理の細胞または試料において検出される標的核酸/タンパク質の量など)と比較して少なくとも10%、少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%低減する(例えば、40%~90%、40%~80%または50%~95%の低減など)。一実施例では、対照は、正常な細胞(例えば、本明細書に提示されるRNA組換えのための核酸分子を含まない非組換え細胞)における発現の相対量である。
有効量:有益なまたは所望の結果をもたらすために十分である、作用物質(例えば、Cas9またはCas13dタンパク質などの核酸編集タンパク質の異なる部分をそれぞれがコードする複数のベクターを、例えば、有効量の、核酸標的とハイブリダイズすることができる1つまたは複数のgRNAと組み合わせて提供する系)の量。有効量は、例えば核酸標的とハイブリダイズすることができる1つまたは複数のgRNAと組み合わせて有益なまたは所望の結果をもたらすために十分である、正しく結合したRNAまたは産生された核酸編集タンパク質の量を指す場合もある。
有効量(治療有効量とも称される)は、処置される対象および疾患状態、対象の体重および年齢、疾患状態の重症度、投与様式などの1つまたは複数に応じて変動し得、それは当業者が決定することができる。有益な治療効果としては、診断的決定の実施可能性;疾患、症状、障害、または病的状態の好転;疾患、症状、障害または状態の発症の減少または防止;および疾患、症状、障害または病的状態を概ね打ち消すことを挙げることができる。
一実施形態では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子の「有効量」は、遺伝子疾患またはがんなどの疾患を処置するために十分なものである。一実施形態では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子の「有効量」は、処置される患者の生存時間を、例えば、少なくとも10%、少なくとも20%、少なくとも25%、少なくとも50%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも200%、少なくとも300%、少なくとも400%、少なくとも500%、または少なくとも600%(本明細書に提示される2つまたはそれよりも多くの合成核酸分子を投与しない場合と比較して)増大させるために十分な量である。一実施形態では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子の「有効量」は、処置される患者の生存時間を、例えば、少なくとも6カ月、少なくとも9カ月、少なくとも1年、少なくとも1.5年、少なくとも2年、少なくとも2.5年、少なくとも3年、少なくとも4年、少なくとも5年、少なくとも10年、少なくとも12年、少なくとも15年、または少なくとも20年(本明細書に提示される2つまたはそれよりも多くの合成核酸分子を投与しない場合と比較して)増大させるために十分な量である。一実施形態では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子の「有効量」は、処置される患者(DMD患者など)の可動性を、例えば、少なくとも10%、少なくとも20%、少なくとも25%、少なくとも50%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも200%、少なくとも300%、少なくとも400%、少なくとも500%、または少なくとも600%(本明細書に提示される2つまたはそれよりも多くの合成核酸分子を投与しない場合と比較して)増大させるために十分な量である。一実施形態では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子の「有効量」は、処置される患者(DMD患者など)の可動性を、例えば、少なくとも10%、少なくとも20%、少なくとも25%、少なくとも50%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも200%、少なくとも300%、少なくとも400%、少なくとも500%、または少なくとも600%(本明細書に提示される2つまたはそれよりも多くの合成核酸分子を投与しない場合と比較して)増大させるために十分な量である。一実施形態では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子の「有効量」は、処置される患者(DMD患者など)の認知能力を、例えば、少なくとも10%、少なくとも20%、少なくとも25%、少なくとも50%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも200%、少なくとも300%、少なくとも400%、少なくとも500%、または少なくとも600%(本明細書に提示される2つまたはそれよりも多くの合成核酸分子を投与しない場合と比較して)増大させるために十分な量である。一実施形態では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子の「有効量」は、処置される患者(DMD患者など)の呼吸機能を、例えば、少なくとも10%、少なくとも20%、少なくとも25%、少なくとも50%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも200%、少なくとも300%、少なくとも400%、少なくとも500%、または少なくとも600%(本明細書に提示される2つまたはそれよりも多くの合成核酸分子を投与しない場合と比較して)増大させるために十分な量である。一実施形態では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子の「有効量」は、処置される患者(血友病患者など)の血液凝固を、例えば、少なくとも10%、少なくとも20%、少なくとも25%、少なくとも50%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも200%、少なくとも300%、少なくとも400%、少なくとも500%、または少なくとも600%(本明細書に提示される2つまたはそれよりも多くの合成核酸分子を投与しない場合と比較して)増大させるために十分な量である。一実施形態では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子の「有効量」は、処置される患者(アッシャー症候群またはスタルガルト病の患者など)の視覚を、例えば、少なくとも10%、少なくとも20%、少なくとも25%、少なくとも50%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも200%、少なくとも300%、少なくとも400%、少なくとも500%、または少なくとも600%(本明細書に提示される2つまたはそれよりも多くの合成核酸分子を投与しない場合と比較して)増大させるために十分な量である。一実施形態では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子の「有効量」は、処置される患者(アッシャー症候群の患者など)の聴覚を、例えば、少なくとも10%、少なくとも20%、少なくとも25%、少なくとも50%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも200%、少なくとも300%、少なくとも400%、少なくとも500%、または少なくとも600%(本明細書に提示される2つまたはそれよりも多くの合成核酸分子を投与しない場合と比較して)増大させるために十分な量である。
一実施形態では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子の「有効量」は、処置されるDMD患者の腓腹筋サイズを、例えば、少なくとも10%、少なくとも20%、少なくとも25%、少なくとも50%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも90%、または少なくとも95%(本明細書に提示される2つまたはそれよりも多くの合成核酸分子を投与しない場合と比較して)減少させるために十分な量である。一実施形態では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子の「有効量」は、処置されるDMD患者の心筋症筋肉のサイズを、例えば、少なくとも10%、少なくとも20%、少なくとも25%、少なくとも50%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも90%、または少なくとも95%(本明細書に提示される2つまたはそれよりも多くの合成核酸分子を投与しない場合と比較して)減少させるために十分な量である。一部の実施例では、これらの効果の組合せが実現される。
ガイドRNA(gRNA):Casヌクレアーゼ(または死んだCasヌクレアーゼ)タンパク質を標的DNA(例えば、ゲノム配列)または標的RNA配列などの標的核酸配列に方向付けるために使用される合成核酸配列。gRNA分子は、単一の核酸分子の一部としてか、または2つもしくはそれよりも多くの核酸分子に分けてかを問わず、(1)標的核酸に対して配列相補性を有する部分(例えば、少なくとも80%、少なくとも90%、少なくとも95%、または100%の配列相補性、および(2)Casヌクレアーゼに結合する二次構造、を有する部分を含む。したがって、Casタンパク質の標的核酸を、単にgRNA内に存在する標的配列を変化させることによって変化させることができる(CRISPR-Cas9 Structures and Mechanisms. Fuguo Jiang and Jennifer A. Doudna, Annual Review of Biophysics, 46:1, 505-529 (2017)を参照されたい)。一部の実施例では、gRNAは、RNA分子である(例えば、細胞において発現させる場合)。一部の実施例では、gRNAは、DNA分子によってコードされる(例えば、ウイルスベクターなどのベクターの一部の場合)。gRNAは、修飾塩基または化学修飾を含んでよい(例えば、Latorre et al., Angewandte Chemie 55: 3548-50, 2016を参照されたい)。
一部の実施例では、gRNAは、2つまたはそれよりも多くのMS2結合ループ配列を含み、これらを、GC含量を増加させるように、および/または反復コンテンツを短くするようにネイティブなMS2結合ループ配列から改変することができる。一部の実施例では、GC含量を増加させるように、および/または反復コンテンツを短くするようにgRNAが改変される。
一部の実施例では、gRNAは、死んだガイドRNA(dgRNA)である。gRNAのGC含量を増加させることおよび/または反復コンテンツを短くすることを使用して、gRNAを、dgRNA、すなわち、Casヌクレアーゼを標的核酸配列に方向付けることはできるが、DNA二本鎖切断(またはRNA一本鎖切断)は誘導しないガイド核酸分子に変換することができる。
一実施例では、gRNAは、Cas DNAヌクレアーゼ(例えば、Cas9)を標的DNAに方向付ける。そのような一実施例では、gRNAは、5’から3’に、(1)標的DNA配列とハイブリダイズする(および一部の実施例では標的DNA配列を編集する)ように設計された配列を含むCRISPR RNA(crRNA)領域、およびトランス活性化crRNA(tracrRNA)とハイブリダイズする領域、ならびに(2)Casとの結合に必要な足場配列(tracrRNA)を含む。したがって、gRNAは、crRNAとtracrRNAとを組み合わせて単一のRNA転写物にしたものであってよい(当技術分野では単一ガイドRNA、sgRNAと称される;簡単にするために、本明細書では「gRNA」という用語に包含される)。この実施例では、crRNAのある領域が、tracrRNAとハイブリダイズして、Casエンドヌクレアーゼタンパク質と結合し、当該タンパク質を標的DNA分子にガイドする独特の二重RNAハイブリッド構造を形成する。一部の実施例では、cRNAとtracrRNAは、2つの別々のRNA分子である(例えば、2ピースのgRNA;簡単にするために、これも本明細書では「gRNA」という用語に包含される)。一部の実施例では、プロトスペーサー隣接モチーフ(PAM)が、編集される標的DNAの部位(例えば、PAMの約3nt上流のCas9切断部位)のすぐ後ろに続く。
別の実施例では、gRNAは、Cas RNAヌクレアーゼ(例えば、Cas13d)を標的RNAに方向付ける。そのような一実施例では、gRNAは、5’から3’に、(1)ダイレクトリピート(DR)領域を含有するcrRNA、ならびに(2)例えばCas13a、Cas13c、およびCas 13dヌクレアーゼに対するスペーサーを含む。一実施例では、gRNAは、約36ntのDR、その後に約28~32ntのスペーサー配列を含む。別のそのような実施例では、gRNAは、5’から3’に、(1)スペーサー、および(2)例えば、Cas13bヌクレアーゼに対するDR領域を含有するcrRNAを含む。一部の実施例では、gRNAは、Cas RNAヌクレアーゼまたは他のRNaseによってプロセシング(短縮/修飾)されて、より短い「成熟」形態になる。DRは、Cas RNAヌクレアーゼタンパク質とgRNAの相互作用を容易にする二次構造を含有する、gRNAの定常部分である。スペーサー部分は、gRNAの可変部分であり、標的RNA配列とハイブリダイズするように(および一部の実施例では標的RNA配列を編集するように)設計された配列を含む。一部の実施例では、全長スペーサーは約28~32nt(例えば、30~32nt)の長さであり、一方、成熟(プロセシングされた)スペーサーは約14~30ntである。
ハイブリダイゼーション:核酸のハイブリダイゼーションは、2つの核酸分子が互いにある量の水素結合をなす場合に生じる。ハイブリダイゼーションのストリンジェンシーは、核酸周囲の環境条件、ハイブリダイゼーション方法の性質、ならびに使用される組成物および核酸の長さに応じて変動し得る。特定の程度のストリンジェンシーを達成するために必要なハイブリダイゼーション条件に関する算出は、Sambrook et al., Molecular
Cloning: A Laboratory Manual (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 2001);およびTijssen, Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes Part I, Chapter 2(Elsevier, New York, 1993)において考察されている。T
は、核酸の所与の鎖の50%がその相補鎖とハイブリダイズする温度である。
増加または減少:それぞれ、対照値(例えば、本明細書で提供される2つまたはそれよりも多くの合成核酸分子の投与がないなど、治療剤なしを表す値)からの数量(quantity)の統計的に有意な正の変化または負の変化。増加は正の変化であり、例えば、対照値と比較して少なくとも50%、少なくとも100%、少なくとも200%、少なくとも300%、少なくとも400%または少なくとも500%の増加である。減少は負の変化であり、例えば、対照値と比較して少なくとも20%、少なくとも25%、少なくとも50%、少なくとも75%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%、または少なくとも100%の減少である。一部の実施例では、減少は、100%未満、例えば、90%以下、95%以下、または99%以下の減少である。
単離された:「単離された」生物学的成分(例えば、核酸分子またはタンパク質)は、その成分が存在する生物体の細胞または組織内の他の生物学的成分、例えば、他の細胞(例えば、RBC)、染色体および染色体外DNAおよびRNA、ならびにタンパク質から実質的に分離されているか、それとは別に作製されているか、またはそれから離して精製されている。「単離された」核酸およびタンパク質は、標準的な精製方法によって精製された核酸およびタンパク質を含む。この用語は、宿主細胞において組換え発現によって調製された核酸およびタンパク質ならびに化学的に合成された核酸およびタンパク質も包含する。
キッシングループ/キッシングステムループ:2つのヘアピンループ間の塩基がペア相互作用を形成する場合に形成されるRNA構造。これらの分子間「キッシング相互作用」は、1つのヘアピンループ内の対合していないヌクレオチドが、別のヘアピンループ内の対合していないヌクレオチドと塩基対合して、安定な相互作用複合体を形成する場合に生じる。例として図9Aを参照されたい。
N末端部分:タンパク質のN末端残基から始まる連続した一続きのアミノ酸を含むタンパク質配列の領域。タンパク質のN末端部分は、連続した一続きのアミノ酸(例えば、いくつかのアミノ酸残基)によって定義することができる。
天然に存在しない、合成の、または操作された:本明細書では互換的に使用され、人間の手の関与を示す用語。これらの用語は、核酸分子またはポリペプチドについて言及する場合、その核酸分子またはポリペプチドが、それらが天然では天然に関連し、天然に見いだされる少なくとも1つの他の成分を少なくとも実質的に含まないことを示す。さらに、これらの用語は、核酸分子またはポリペプチドが天然に見いだされない配列を有することを示し得る。
核酸分子:天然のヌクレオチド/リボヌクレオチド、および/または、天然に存在するヌクレオチドと同様に核酸分子とハイブリダイズする、天然のヌクレオチド/リボヌクレオチドの類似体を含み得るデオキシリボヌクレオチド(DNA)またはリボヌクレオチド(RNA)ポリマー。核酸分子は、一本鎖(ss)DNAまたはRNA分子または二本鎖(ds)核酸分子であり得る。RNAまたはmRNAは、本明細書で使用される場合、プレmRNA分子、または成熟RNA転写物を指し得る。プレmRNA分子は、プロセシングによって除去される配列、例えば、本明細書に記載の二量体形成ドメインの結合後にスプライシングによって除去されるイントロン配列を含む。本明細書に記載の核酸分子は、例えば、DNA発現ベクターに関してはDNA上のプロモーターによりRNAが転写されるところのDNA分子であり得る。
作動可能に連結した:第1の核酸配列が第2の核酸配列との機能的関係に置かれている場合、第1の核酸配列は第2の核酸配列に作動可能に連結している。例えば、プロモーターが核酸配列の発現に影響を及ぼす、例えば、プロモーターが、スプライスされるとタンパク質(例えば、核酸編集タンパク質コード配列の一部)の発現をもたらし得るプレmRNAの転写に影響を及ぼす場合、プロモーター配列はその核酸配列に作動可能に連結している。
薬学的に許容される担体:本開示において有用な薬学的に許容される担体は従来のものである。Remington's Pharmaceutical Sciences, by E. W. Martin, Mack Publishing Co., Easton, PA, 15th Edition (1975)には、本明細書に開示される核酸分子などの治療剤の薬学的送達に適した組成物および製剤が記載されている。
一般に、担体の性質は、使用される特定の投与形式に依存する。例えば、非経口製剤は、通常、例えば、水、生理的食塩水、平衡塩類溶液、水性デキストロース、グリセロールなどの薬学的にかつ生理的に許容される流体を含む注射可能な流体をビヒクルとして含む。投与される医薬組成物は、生物学的に中性の担体に加えて、微量の無毒性補助物質、例えば、湿潤剤または乳化剤、保存剤、およびpH緩衝剤など、例えば、酢酸ナトリウムまたはソルビタンモノラウレートを含有し得る。
ポリペプチド、ペプチドおよびタンパク質:任意の長さのアミノ酸のポリマーを指す。ポリマーは直鎖であっても分枝であってもよく、修飾されたアミノ酸を含んでもよく、また、非アミノ酸によって中断されていてもよい。この用語は、修飾されたアミノ酸ポリマー;例えば、ジスルフィド結合の形成、グリコシル化、脂質付加、アセチル化、リン酸化、または標識成分とのコンジュゲーションなどの任意の他の操作を受けたアミノ酸ポリマーも包含する。本明細書で使用される場合、「アミノ酸」という用語は、グリシンおよびD光学異性体またはL光学異性体の両方、ならびにアミノ酸類似体およびペプチド模倣体を含めた、天然アミノ酸および/または天然ではないアミノ酸または合成アミノ酸を含む。一実施例では、タンパク質は、Cas9、Cas13d、またはジンクフィンガーヌクレアーゼなどの核酸編集タンパク質である。一実施例では、タンパク質は、遺伝子疾患などの疾患に関連するものである(例えば、表1~4参照)。一実施例では、タンパク質は、例えばがんなどの疾患の処置に使用されるものなどの、治療用タンパク質である。一実施例では、タンパク質は、少なくとも50アミノ酸の長さ、少なくとも100アミノ酸の長さ、少なくとも500アミノ酸の長さ、少なくとも1000アミノ酸の長さ、少なくとも1500アミノ酸の長さ、例えば、少なくとも2000アミノ酸、少なくとも2500アミノ酸、少なくとも3000アミノ酸、または少なくとも5000アミノ酸である。
ポリピリミジントラクト:転写後修飾のプロセスの間にRNAスプライシングを行うために特殊化されたタンパク質複合体であるスプライソソームのアセンブリを促進する、プレメッセンジャーRNA(mRNA)の領域。このトラクトは、主にウラシルなどのピリミジンヌクレオチドであり得、一部の実施例では、15~20塩基対の長さであり、スプライスされるイントロンの3’末端の約5~40塩基対前に位置する。
プロモーター/エンハンサー:核酸配列の転写を方向付ける一群の核酸制御配列。プロモーターは、転写の開始部位近くに必要な核酸配列、例えば、ポリメラーゼII型プロモーターの場合ではTATAエレメントを含む。プロモーターはまた、必要に応じて、転写の開始部位から数千塩基対ものところに位置し得る遠位のエンハンサーまたはリプレッサーエレメントも含む。一部の実施例では、プロモーター配列+その対応するコード配列は、AAVの容量よりも大きい。一部の実施例では、標的タンパク質のプロモーター配列は、少なくとも3500nt、少なくとも4000nt、少なくとも5000nt、またはさらには少なくとも6000ntである。
「構成的プロモーター」は、絶えず活性であり、外部のシグナルまたは分子による調節を受けないプロモーターである。対照的に、「誘導性プロモーター」の活性は、外部のシグナルまたは分子(例えば、転写因子)によって調節される。構成的プロモーターおよび誘導性プロモーターのどちらも本明細書に提示される方法および系において使用することができる(例えば、Bitter et al., Methods in Enzymology 153: 516-544, 1987を参照されたい)。組織特異的プロモーターは、本明細書に提示される方法および系において、例えば、主に所望の組織または目的の細胞、例えば、筋肉、ニューロン、骨、皮膚、血液、特定の器官(例えば、肝臓、膵臓)、または特定の細胞型(例えば、リンパ球)における発現を方向付けるために使用することができる。一部の実施例では、本明細書で使用されるプロモーターは、発現させる標的タンパク質に対して内因性である。一部の実施例では、本明細書で使用されるプロモーターは、発現させる標的タンパク質に対して外因性である。
プロモーター依存性遺伝子発現を細胞型特異的、組織特異的に制御可能にする、または外部のシグナルもしくは作用物質による誘導性にするために十分であるプロモーターエレメントも包含され、そのようなエレメントは、遺伝子の5’領域または3’領域に位置し得る。組換えDNAまたは合成技法によって作製されたプロモーターを使用して核酸配列の転写をもたらすこともできる。
本明細書に提示される方法および系と共に使用することができる例示的なプロモーターとしては、これだけに限定されないが、SV40プロモーター、サイトメガロウイルス(CMV)プロモーター(必要に応じてCMVエンハンサーを伴う)、pol IIIプロモーター(例えば、U6プロモーターおよびH1プロモーター)、pol IIプロモーター(例えば、レトロウイルスラウス肉腫ウイルス(RSV)LTRプロモーター(必要に応じてRSVエンハンサーを伴う)、ジヒドロ葉酸レダクターゼプロモーター、β-アクチンプロモーター、ホスホグリセロールキナーゼ(PGK)プロモーター、およびEF1αプロモーター)が挙げられる。
組換え:組換え核酸分子またはタンパク質配列は、天然に存在しない配列を有するか、または、2つの、そうでなければ分離されている配列のセグメントの人工的な組合せによって作出された配列を有するものである(例えば、核酸編集タンパク質コード配列の一部、例えば、コード配列の約3分の1、半分、または3分の2を含むウイルスベクター)。この人工的な組合せは、例えば、単離された核酸のセグメントの化学合成または人工的な操作によって、例えば、遺伝子操作技法によって達成することができる。同様に、組換えまたはトランスジェニック細胞は、組換え核酸分子を含有するものである。
RNA編集:RNA内の所望の位置における部位特異的な鎖の切断を作り出す操作されたヌクレアーゼ(例えば、Cas13dおよびdCas13dタンパク質)を使用して細胞または生物体におけるRNA分子(またはRNAのリボヌクレオチド)を挿入する、欠失させる、または置き換える遺伝子操作の型。誘導された切断は修復され、それにより、標的化変異または修復がもたらされる。例えば、本明細書に提示されるREJ系を使用してCasヌクレアーゼを発現させるCRISPR/Cas法を使用して、がん(例えば、乳がん、結腸がん、肺がん、前立腺がん、黒色腫)、感染性疾患(例えば、HIV、肝炎、HPV、およびウエストナイルウイルス)、または神経変性障害(例えば、ハンチントン病またはALS)に関連するものなどの1つまたは複数の標的RNAの配列を編集することができる。例えば、RNA編集を使用して、疾患またはウイルス感染を処置することができる。
RNA挿入部位:外因性ポリヌクレオチドもしくはポリリボヌクレオチドの挿入の標的とされるまたは外因性ポリヌクレオチドもしくはポリリボヌクレオチドの挿入を受けたRNAの部位。本明細書に開示される方法は、RNAをRNA挿入部位における操作の標的とするために使用することができる、本明細書に提示される2つまたはそれよりも多くの核酸分子から発現された核酸エディターの使用を包含する。
配列同一性:アミノ酸(またはヌクレオチド)配列間の類似性は、他には配列同一性と称される、配列間の類似性に関して表される。配列同一性は、パーセンテージ同一性(または類似性または相同性)に関して測定される頻度が高い;パーセンテージが高いほど、2つの配列の類似性が大きい。
比較のために配列をアラインメントする方法は公知である。種々のプログラムおよびアラインメントアルゴリズムが、Smith and Waterman, Adv. Appl. Math. 2:482, 1981;Needleman and Wunsch, J. Mol. Biol. 48:443, 1970;Pearson and Lipman, Proc. Natl. Acad. Sci. U.S.A. 85:2444, 1988;Higgins and Sharp, Gene 73:237, 1988;Higgins and Sharp, CABIOS 5:151, 1989; Corpet et al., Nucleic Acids Research 16:10881, 1988;およびPearson and Lipman, Proc. Natl. Acad. Sci. U.S.A. 85:2444, 1988に記載されている。Altschul et al., Nature Genet. 6:119, 1994には、配列アラインメント法および相同性の算出に関する詳細な考察が提示されている。
配列解析プログラムblastp、blastn、blastx、tblastnおよびtblastxと関連して使用するためのNCBI Basic Local Alignment Search Tool(BLAST)(Altschul et al., J. Mol. Biol. 215: 403, 1990)がNational Center for Biotechnology Information(NCBI、Bethesda、MD)およびインターネットを含めたいくつかの供給源から入手可能である。このプログラムを使用してどのように配列同一性を決定するかの説明は、インターネット上のNCBIウェブサイトで入手可能である。
ネイティブなタンパク質またはコード配列(例えば、DMD、第8因子、第9因子、またはABCA4配列)のバリアントは、一般には、NCBI Blast 2.0、デフォルトパラメータに設定されたギャップ挿入blastpを使用してアミノ酸配列とのアラインメント全長にわたって計数して、少なくとも約80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%または少なくとも99%の配列同一性を有することを特徴とする。約30アミノ酸を超えるアミノ酸配列の比較に関しては、Blast 2配列関数を用い、デフォルトパラメータ(ギャップ存在コスト(gap existence cost)11、および1残基当たりのギャップコスト(per residue gap cost)1)に設定されたデフォルトのBLOSUM62行列を使用する。短いペプチド(およそ30アミノ酸未満)をアラインメントする場合には、Blast 2配列関数を使用し、デフォルトパラメータ(オープンギャップ(open gap)9、エクステンションギャップ(extension gap)1ペナルティ)に設定されたPAM30行列を用いてアラインメントを実施すべきである。参照配列に対してさらに大きな類似性を有するタンパク質は、この方法によって評価した場合、ますます大きなパーセンテージ同一性、例えば、少なくとも95%、少なくとも98%、または少なくとも99%の配列同一性を示す。配列の全体未満を配列同一性について比較する場合、ホモログおよびバリアントは、一般には、10~20アミノ酸の短いウインドウにわたって少なくとも80%の配列同一性を有し、参照配列に対するそれらの類似性に応じて少なくとも85%または少なくとも90%または少なくとも95%の配列同一性を有し得る。そのような短いウインドウにわたって配列同一性を決定するための方法は、インターネット上のNCBIウェブサイトで入手可能である。これらの配列同一性の範囲は単にガイダンスとして提供され、提供された範囲外の極めて意義深いホモログを得ることができる可能性がある。
本明細書に開示される核酸配列のバリアント(例えば、合成イントロン配列およびコード配列)は、一般には、デフォルトパラメータに設定されたNCBI Blast 2.0、ギャップ挿入blastnを使用し、核酸配列とのアラインメント全長にわたって計数して、少なくとも約80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%または少なくとも99%の配列同一性を有することを特徴とする。これらの配列同一性の範囲は単にガイダンスとして提供され、提供された範囲外の機能的配列を得ることができる可能性があることが当業者には理解されよう。
対象:哺乳動物、例えば、ヒト。哺乳動物としては、これだけに限定されないが、マウス、サル、ヒト、農場動物、競技動物、および愛玩動物が挙げられる。一実施形態では、対象は、非ヒト哺乳動物対象、例えば、サルもしくは他の非ヒト霊長類、マウス、ラット、ウサギ、ブタ、ヤギ、ヒツジ、イルカ、イヌ、ネコ、ウマ、またはウシである。一部の実施例では、対象は、マウス、ウサギ、またはラットなどの実験動物/生物体である。一部の実施例では、本明細書に開示される方法を使用して処置される対象はヒトである。
一部の実施例では、対象は、本明細書に開示される方法を使用して処置することができる、表1~4に列挙されているものなどの遺伝子疾患を有する。一部の実施例では、本明細書に開示される方法を使用して処置される対象は遺伝子疾患を有するヒト対象である。一部の実施例では、本明細書に開示される方法を使用して処置される対象はがんを有するヒト対象である。一部の実施例では、本明細書に開示される方法を使用して処置される対象は、細菌またはウイルス感染などの感染を有するヒト対象である。
標的核酸:変更されるおよび/またはその発現がモジュレートされる配列を有する遺伝子などの核酸分子、例えばDNAまたはRNA配列。一部の実施例では、標的核酸分子は、1つの核酸分子、同じ核酸分子(例えば、同じRNAもしくは遺伝子)の2つもしくはそれよりも多くの部分、2つもしくはそれよりも多くの異なる核酸分子(例えば、2つの異なる遺伝子もしくは2つの異なるRNA)、または2つもしくはそれよりも多くの異なる核酸分子の2つもしくはそれよりも多くの部分である。標的核酸分子は、1つまたは複数の標的編集部位を含み得、当該標的編集部位は、変更される、例えば、置換、欠失、または挿入がなされる、標的核酸分子の領域(例えば、標的の1つまたは複数のヌクレオチドまたはリボヌクレオチド、例えば、少なくとも10個、少なくとも15個、少なくとも20個、または少なくとも30個の連続したヌクレオチドまたはリボヌクレオチド)である。一部の実施例では、標的核酸分子は、発現がモジュレートされる、例えば、遺伝子産物の発現(例えば、タンパク質)が増加または低減されるものである。一実施例では、標的核酸分子は、発現の活性化が望まれるDNA、RNA、または遺伝子である。一実施例では、標的核酸分子は、発現の低減または消失が望まれるDNA、RNA、または遺伝子である。一実施例では、標的核酸分子は、疾患をもたらす1つまたは複数の点変異を有するDNA、RNA、または遺伝子である(例えば、表1~4に列挙されているもの)。一部の実施例では、標的化配列(例えば、gRNAのもの)は、標的遺伝子/核酸に対して相補性を有する。他の例では、標的化配列(例えば、gRNAのもの)は、標的核酸分子のプロモーターおよび/または調節エレメントに対して相補性を有する。一部の実施例では、標的核酸配列はDNAであり、プロトスペーサー隣接モチーフ(PAM)のすぐ隣に存在する。一部の実施例では、標的核酸配列は、細胞内の他の核酸配列と比較して独特である。
標的化配列:標的核酸配列に対して相補性を有するgRNAの部分。一部の実施例では、標的化配列は、発現の活性化または抑止が望まれる標的核酸のプロモーターまたは調節エレメントに対して相補性を有する。一部の実施例では、gRNAの標的化配列は約14~30ntであり、標的核酸配列に対して、標的配列とハイブリダイズし、Casヌクレアーゼの標的核酸配列への配列特異的結合を方向付けるために十分な相補性を有する。一部の実施形態では、gRNAの標的化配列とその対応する標的核酸の間の相補性の程度は、適切なアラインメントアルゴリズムを使用して最適にアラインメントした場合、約50%、約60%、約75%、約80%、約85%、約90%、約95%、約97.5%、約98%、約99%、もしくはそれよりも大きい、または約50%よりも大きい、約60%よりも大きい、約75%よりも大きい、約80%よりも大きい、約85%よりも大きい、約90%よりも大きい、約95%よりも大きい、約97.5%よりも大きい、約98%よりも大きい、約99%よりも大きい、もしくはそれよりも大きい。一部の実施形態では、相補性の程度は100%である。最適なアラインメントは、配列をアラインメントするための任意の適切なアルゴリズムを使用することで決定することができ、アルゴリズムの非限定的な例としては、Smith-Watermanアルゴリズム、Needleman-Wunschアルゴリズム、Burrows-Wheeler Transformに基づくアルゴリズム(例えば、Burrows Wheeler Aligner)、ClustalW、Clustal X、BLAT、Novoalign(Novocraft Technologies、ELAND(Illumina、San Diego、Calif.)、SOAP(soap.genomics.org.cnにおいて入手可能)、およびMaq(maq.sourceforge.netにおいて入手可能)が挙げられる。
治療剤:対象に投与されるといくらかの有益な効果をもたらす1つまたは複数の分子または化合物を指す。本明細書に開示される合成核酸分子および本明細書に提示される系は治療剤である。有益な治療効果としては、診断的決定の実施が可能になること;疾患、症状、障害、または病的状態の好転;疾患、症状、障害または状態の発症の減少または防止;および疾患、症状、障害または病的状態を概ね打ち消すことを挙げることができる。
転写活性化因子:遺伝子などの核酸分子の転写を増加させるタンパク質またはタンパク質ドメイン。そのようなタンパク質を本明細書に提示される組成物、系および方法に使用することができる。そのようなタンパク質およびタンパク質ドメインは、DNA結合ドメインおよび転写を活性化するためのドメインを有し得る。これらの活性化因子を、CasヌクレアーゼまたはgRNAに結合させることによって系に導入することができる。そのような活性化因子の例としては、VP64、p65、筋原性分化1(MyoD1)、熱ショック転写因子(HSF)1、RTA、CBP、SET7/9、またはこれらの任意の組合せ(例えば、p65およびHSF1)が挙げられる。
形質導入された、形質転換された、およびトランスフェクトされた:ウイルスまたはベクターにより核酸分子が細胞に移入された場合、ウイルスまたはベクターにより細胞への「形質導入」がなされた。細胞は、核酸の細胞ゲノムへの組み入れによってか、またはエピソーム複製によってのいずれかで核酸が細胞によって安定に複製される場合、細胞に形質導入された核酸により「形質転換」または「トランスフェクト」されたものである。
これらの用語は、ウイルスベクターを用いたトランスフェクション、プラスミドベクターを用いた形質転換、ならびに電気穿孔、リポフェクション、パーティクルガン加速および当技術分野における他の方法によるネイキッドDNAの導入を含めた、核酸分子をそのような細胞に導入することができる全ての技法を包含する。一部の実施例では、方法は、化学的方法(例えば、リン酸カルシウムトランスフェクション)、物理的方法(例えば、電気穿孔、微量注射、粒子衝撃)、融合(例えば、リポソーム)、受容体媒介性エンドサイトーシス(例えば、DNA-タンパク質複合体、ウイルスエンベロープ/カプシド-DNA複合体)および組換えウイルスなどのウイルスによる生物学的感染である(Wolff, J. A.、ed, Gene Therapeutics, Birkhauser, Boston, USA, 1994)。核酸分子を細胞に導入するための方法は公知である(例えば、米国特許第6,110,743号を参照されたい)。これらの方法を使用して、本明細書に開示される核酸分子を細胞に形質導入することができる。
導入遺伝子:例えばAAVなどのベクターによって供給される、外因性遺伝子。一実施例では、導入遺伝子は、例えば、プロモーター配列に作動可能に連結した、核酸編集タンパク質の一部、例えば、核酸編集タンパク質の約3分の1、半分、または3分の2をコードする。一実施例では、導入遺伝子は、例えば、プロモーター配列に作動可能に連結した、Casヌクレアーゼコード配列の一部、例えば、Casヌクレアーゼコード配列の約3分の1、半分、または3分の2を含む。
処置すること(treating)、処置(treatment)、および治療(therapy):症状の軽減、寛解、減少などの任意の客観的または主観的パラメータ、または状態を患者がより耐えられるものにすること、退化もしくは減退の速度を緩徐化すること、退化の最終点を衰弱がより小さいものにすること、対象の身体もしくは精神的ウエルビーイングを改善すること、または生存の長さを延長することを含めた、傷害、病変または状態の減弱または好転に関する任意の成功または成功のしるし。処置は、身体検査、血液検査および他の臨床検査などの結果を含めた客観的または主観的パラメータによって評価することができる。一部の実施例では、本明細書に開示される方法を用いた処置により、遺伝子疾患に付随する症状の数または重症度の低減、例えば、処置される、遺伝子疾患を有する患者の生存時間の増大がもたらされる。
一部の実施例では、本明細書に開示される方法を用いた処置により、DMDまたは他の遺伝子疾患に付随する症状の数または重症度の低減、例えば、生存の増加、可動性(例えば、歩行、よじのぼり)の増大、認知能力の改善、腓腹筋サイズの低下、心筋症の低減、視覚の改善、聴覚の改善、血液凝固の改善、または呼吸機能の改善がもたらされる。一部の実施例では、これらの効果の組合せが実現される。
腫瘍、新形成、悪性疾患またはがん:新生物は、過剰な細胞分裂に起因する組織または細胞の異常な成長である。新生物の成長により、腫瘍が生じ得る。個体における腫瘍の量は、腫瘍の数、体積、または重量として測定することができる「腫瘍量」である。転移しない腫瘍は「良性」と称される。周囲の組織に浸潤し、かつ/または転移する可能性がある腫瘍は「悪性」と称される。「非がん組織」は、悪性新生物が形成されるものと同じ器官に由来するが、新生物の特徴的な病変を有さない組織である。一般に、非がん組織は、組織学的に正常に見える。「正常組織」は、ある器官に由来する組織であり、ここで、当該器官は、がんまたは当該器官の別の疾患もしくは障害の影響を受けていない。「がんを有さない」対象は、当該器官のがんを有すると診断されておらず、検出可能ながんを有していない。
本明細書に開示される方法および系を用いて処置することができるがんなどの例示的な腫瘍としては、固形腫瘍、例えば、乳癌(例えば、小葉癌および腺管癌)、肉腫、肺癌(例えば、非小細胞癌、大細胞癌、扁平上皮癌、および腺癌)、肺の中皮腫、結腸直腸腺癌、胃癌、前立腺腺癌、卵巣癌(例えば、漿液性嚢胞腺癌および粘液性嚢胞腺癌)、卵巣胚細胞腫瘍、精巣癌および胚細胞腫瘍、膵臓腺癌、胆管腺癌、肝細胞癌、膀胱癌(例えば、移行上皮癌、腺癌、および扁平上皮癌を含む)、腎細胞腺癌、子宮内膜癌(例えば、腺癌およびミュラー管混合腫瘍(癌肉腫)を含む)、子宮頚内膜癌、子宮頸外膜癌、および膣癌(例えば、子宮頚内膜、子宮頸外膜、および膣のそれぞれの腺癌および扁平上皮癌)、皮膚の腫瘍(例えば、扁平上皮癌、基底細胞癌、悪性黒色腫、皮膚付属器腫瘍(skin
appendage tumor)、カポジ肉腫、皮膚リンパ腫、皮膚付属器腫瘍(skin adnexal tumor)および種々の型の肉腫およびメルケル細胞癌)、食道癌、上咽頭癌および中咽頭癌(上咽頭および中咽頭の扁平上皮癌および腺癌を含む)、唾液腺癌、脳および中枢神経系の腫瘍(例えば、グリア起源の腫瘍、ニューロン起源の腫瘍、および髄膜起源の腫瘍を含む)、末梢神経の腫瘍、軟部組織肉腫、および骨および軟骨の肉腫、ならびにリンパ腫瘍(B細胞およびT細胞悪性リンパ腫を含む)が挙げられる。一実施例では、腫瘍は腺癌である。
方法および系はまた、液性腫瘍、例えば、リンパ性、白血球、または他の型の白血病を処置するために使用することもできる。特定の例では、処置される腫瘍は、白血病(例えば、急性リンパ芽球性白血病(ALL)、慢性リンパ球性白血病(CLL)、急性骨髄性白血病(AML)、慢性骨髄性白血病(CML)、ヘアリー細胞白血病(HCL)、T細胞前リンパ球性白血病(T-PLL)、大顆粒リンパ球性白血病、および成人T細胞白血病)、リンパ腫(例えば、ホジキンリンパ腫および非ホジキンリンパ腫)、ならびに骨髄腫などの、血液の腫瘍である。
アップレギュレートされた:標的核酸/タンパク質などの分子の発現に関して使用される場合、標的核酸/タンパク質の産生の増加をもたらす任意のプロセスを指す。一部の実施例では、標的RNAのアップレギュレーションまたは活性化は、標的RNAの翻訳を増加させ、したがって、対応するタンパク質の存在を増加し得るプロセスを含む。アップレギュレートされる分子は、本明細書に記載の組成物および方法の標的核酸もしくは当該核酸分子から発現されるタンパク質、例えば、REJ分割系において組み換えられた転写物から産生される核酸エディタータンパク質;編集された標的核酸および/もしくは当該核酸から産生される、得られるタンパク質;または標的核酸もしくはタンパク質もしくは編集された標的核酸および/もしくは得られるタンパク質の代表的なマーカー、代理、もしくは機能的指標であり得る。
アップレギュレーションは、標的核酸/タンパク質の任意の検出可能な増加を含む。ある特定の実施例では、細胞または無細胞系における検出可能な標的核酸/タンパク質の発現が、対照と比較して少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも100%、少なくとも200%、少なくとも400%、または少なくとも500%増加する。対照は、本明細書に提示される核酸分子を用いて処理されていない対応する試料において検出される標的核酸/タンパク質の量であり得る。一実施例では、対照は、正常な細胞(例えば、本明細書に提示される系を含まない非組換え細胞)における発現の相対量である。対照と、本明細書に記載の組成物および方法の核酸分子から発現される標的核酸もしくはタンパク質、例えば、REJ分割系において組み換えられた転写物から産生された核酸エディタータンパク質;編集された標的核酸および/もしくは当該核酸から産生される、得られるタンパク質;または標的核酸もしくはタンパク質もしくは編集された標的核酸および/もしくは得られるタンパク質の代表的なマーカー、代理、もしくは機能的指標を比較することができる。比較のために使用される対照は、当業者によって決定される任意の妥当な対照であってよい。陽性対照は、対応するmRNAおよび/または全長構築物から産生されるタンパク質の量であり得る。陰性対照は、対応するmRNAおよび/または空もしくは他の点で欠陥のある構築物から産生されるタンパク質の量であり得る。対照と、標的核酸、または、細胞において、本明細書に提示される組成物および方法を使用して核酸分子から発現された核酸エディタータンパク質の存在下で産生されたタンパク質を比較することができる。本明細書に記載の通り、細胞において本組成物および方法を使用して核酸分子から核酸編集タンパク質を発現させると、組み換えられた核酸編集タンパク質がその標的核酸を編集し得る。編集された核酸および/または当該核酸から産生されたタンパク質を、正常な細胞(例えば、編集が必要な標的核酸を有さず、本明細書に提示される系を含まない非組換え「正常」細胞)における対応する核酸、例えばmRNA、および/または標的核酸から産生されたタンパク質の量であり得る陽性対照と比較することができる。編集された核酸および/または当該核酸から産生されたタンパク質を、無処理の細胞(例えば、編集が必要な標的核酸を有し、本明細書に提示される系を含まない非組換え「変異」細胞)における対応する核酸、例えばmRNA、および/または標的核酸から産生されたタンパク質の量であり得る陰性対照と比較することができる。検出可能な陽性対照である標的核酸および/またはタンパク質の発現(例えば、細胞または無細胞系)と比べた検出可能な標的核酸および/またはタンパク質の発現は、それぞれ、陽性対照における発現の20%~500%であり得る。陽性対照における発現と比べた細胞または無細胞系における検出可能な標的核酸および/またはタンパク質の発現は、約20%~約500%であり得る。陽性対照における発現と比べた細胞または無細胞系における検出可能な標的核酸および/またはタンパク質の発現は、約20%~約30%、約20%~約40%、約20%~約50%、約20%~約60%、約20%~約70%、約20%~約90%、約20%~約95%、約20%~約100%、約20%~約150%、約20%~約200%、約20%~約500%、約30%~約40%、約30%~約50%、約30%~約60%、約30%~約70%、約30%~約90%、約30%~約95%、約30%~約100%、約30%~約150%、約30%~約200%、約30%~約500%、約40%~約50%、約40%~約60%、約40%~約70%、約40%~約90%、約40%~約95%、約40%~約100%、約40%~約150%、約40%~約200%、約40%~約500%、約50%~約60%、約50%~約70%、約50%~約90%、約50%~約95%、約50%~約100%、約50%~約150%、約50%~約200%、約50%~約500%、約60%~約70%、約60%~約90%、約60%~約95%、約60%~約100%、約60%~約150%、約60%~約200%、約60%~約500%、約70%~約90%、約70%~約95%、約70%~約100%、約70%~約150%、約70%~約200%、約70%~約500%、約90%~約95%、約90%~約100%、約90%~約150%、約90%~約200%、約90%~約500%、約95%~約100%、約95%~約150%、約95%~約200%、約95%~約500%、約100%~約150%、約100%~約200%、約100%~約500%、約150%~約200%、約150%~約500%、または約200%~約500%であり得る。陽性対照における発現と比べた細胞または無細胞系における検出可能な標的核酸および/またはタンパク質の発現は、約20%、約30%、約40%、約50%、約60%、約70%、約90%、約95%、約100%、約150%、約200%、または約500%であり得る。陽性対照の発現と比べた細胞または無細胞系における検出可能な標的核酸および/またはタンパク質の発現は、少なくとも約20%、約30%、約40%、約50%、約60%、約70%、約90%、約95%、約100%、約150%、または約200%であり得る。陽性対照における発現と比べた細胞または無細胞系における検出可能な標的核酸および/またはタンパク質の発現は、多くとも約30%、約40%、約50%、約60%、約70%、約90%、約95%、約100%、約150%、約200%、または約500%であり得る。
編集された核酸および/または当該核酸から産生されたタンパク質を、無処理の細胞(例えば、編集が必要な標的核酸を有し、本明細書に提示される系を含まない非組み換え「変異」細胞)における対応する核酸、例えば、mRNA、および/または標的核酸から産生されたタンパク質の量であり得る陰性対照と比較することができる。検出可能な標的核酸および/またはタンパク質の発現は、検出可能な陰性対照である標的核酸および/またはタンパク質の発現と比べて、それぞれ20%~500%増加し得る。細胞または無細胞系における検出可能な標的核酸/タンパク質の発現は、陰性対照と比べて、約20%~約30%、約20%~約40%、約20%~約50%、約20%~約60%、約20%~約70%、約20%~約90%、約20%~約95%、約20%~約100%、約20%~約150%、約20%~約200%、約20%~約500%、約30%~約40%、約30%~約50%、約30%~約60%、約30%~約70%、約30%~約90%、約30%~約95%、約30%~約100%、約30%~約150%、約30%~約200%、約30%~約500%、約40%~約50%、約40%~約60%、約40%~約70%、約40%~約90%、約40%~約95%、約40%~約100%、約40%~約150%、約40%~約200%、約40%~約500%、約50%~約60%、約50%~約70%、約50%~約90%、約50%~約95%、約50%~約100%、約50%~約150%、約50%~約200%、約50%~約500%、約60%~約70%、約60%~約90%、約60%~約95%、約60%~約100%、約60%~約150%、約60%~約200%、約60%~約500%、約70%~約90%、約70%~約95%、約70%~約100%、約70%~約150%、約70%~約200%、約70%~約500%、約90%~約95%、約90%~約100%、約90%~約150%、約90%~約200%、約90%~約500%、約95%~約100%、約95%~約150%、約95%~約200%、約95%~約500%、約100%~約150%、約100%~約200%、約100%~約500%、約150%~約200%、約150%~約500%、または約200%~約500%増加し得る。細胞または無細胞系における検出可能な標的核酸/タンパク質の発現は、陰性対照と比べて、約20%、約30%、約40%、約50%、約60%、約70%、約90%、約95%、約100%、約150%、約200%、または約500%増加し得る。細胞または無細胞系における検出可能な標的核酸/タンパク質の発現は、陰性対照と比べて、少なくとも約20%、約30%、約40%、約50%、約60%、約70%、約90%、約95%、約100%、約150%、または約200%増加し得る。細胞または無細胞系における検出可能な標的核酸/タンパク質の発現は、陰性対照と比べて、多くとも約30%、約40%、約50%、約60%、約70%、約90%、約95%、約100%、約150%、約200%、または約500%増加し得る。
~のために十分な条件下で:所望の活性を可能にする任意の環境を説明するために使用される句。一実施例では、所望の活性は、疾患の処置に必要な、タンパク質の発現または活性の増加である。一実施例では、所望の活性は、疾患の処置に必要な、タンパク質の発現または活性の低減である。一実施例では、所望の活性は、疾患の処置に必要な、補正されたタンパク質配列の発現である。一実施例では、所望の活性は、例えば、本明細書に開示される方法および系を使用した、in vivoにおけるDMD(または表1~4に列挙されている他の遺伝子疾患)などの遺伝子疾患の処置またはその進行の緩徐化である。
ベクター:宿主細胞において複製するおよび/または宿主細胞に組み込まれるベクターの能力を妨害することなく外来核酸分子を導入することができる核酸分子。ベクターとしては、これだけに限定されないが、一本鎖、二本鎖、または部分的に二本鎖の核酸分子;1つまたは複数の遊離末端を含む核酸分子、遊離末端を含まない(例えば、環状)核酸分子;DNA、RNA、または両方を含む核酸分子;および他の種類のポリヌクレオチドが挙げられる。
ベクターは、複製開始点などの、宿主細胞における複製を可能にする核酸配列を含み得る。ベクターは、1つまたは複数の選択マーカー遺伝子および他の遺伝子エレメントも含み得る。組込みベクターは、それ自体を宿主核酸に組み込むことが可能である。発現ベクターは、挿入された遺伝子(1つまたは複数)の転写および翻訳を可能にするために必要な調節配列を含有するベクターである。
ベクターの型の1つは「プラスミド」であり、これは、標準的な分子クローニング技法によってなどで追加的なDNAセグメントを挿入することができる環状二本鎖DNAループを指す。別の型のベクターはウイルスベクターであり、ウイルス(例えば、レトロウイルス、複製欠損レトロウイルス、アデノウイルス、複製欠損アデノウイルス、およびアデノ随伴ウイルス)へのパッケージングのためのウイルス由来のDNAまたはRNA配列がベクター内に存在する。ウイルスベクターは、宿主細胞へのトランスフェクションのためにウイルスによって運ばれるポリヌクレオチドも含む。一部の実施形態では、ベクターはレンチウイルスベクター(例えば、組込み欠損レンチウイルスベクター)またはアデノ随伴ウイルス(AAV)ベクターである。
一部の実施形態では、ベクターは、AAV血清型AAV9またはAAVrh.10などのAAVである。一部の実施形態では、ベクターは、例えば静脈内投与後に血液脳関門を透過することができるものである。アデノ随伴ウイルス血清型rh.10(AAV.rh10)ベクターは血液脳関門を部分的に透過し、高レベルかつ広がった導入遺伝子発現をもたらす。
II.いくつかの実施形態の概要
遺伝子疾患に罹患している患者を治癒させるための1つの手法は、遺伝子編集治療(一般に遺伝子治療と称される)である。そのような手法では、欠陥のある遺伝子を、例えばウイルスベクターによって送達されるその遺伝子のインタクトなバージョンで置き換え、それにより、数カ月から数年までの持続的な発現が実現される。アデノ関連ウイルス(AAV)は臨床的な遺伝子置換療法に使用されてきたが、パッケージング容量が制限される(例えば、約5kb未満)。したがって、約5kbというサイズの制限を超える遺伝子の遺伝子置換を実現するためには、このパッケージングの制限を克服するための戦略が必要である。例えば、一部のプロモーターが単独で、コード配列が単独で、またはプロモーターとコード配列の組合せで、AAVの約5kbというサイズの制限を超える。したがって、そのようなプロモーターおよびコード配列によってコードされるそのようなタンパク質を、本明細書に開示される系を使用して発現させることができる。
核酸編集、例えば、標的DNAまたはRNA分子の編集、例えば、遺伝子編集のいくつかの方法を使用して、標的の発現をアップレギュレートまたはダウンレギュレートすること、ならびに標的における変異を補正することができる。そのような方法の例としては、DNAを編集するCRISPR/Cas法(例えば、Cas9またはdCas9 DNAエンドヌクレアーゼを使用する)、RNAを編集するCRISPR/Cas法(例えば、Cas13dまたはdCas13d RNAエンドヌクレアーゼを使用する)、ゲノム編集のジンクフィンガーヌクレアーゼ法(例えば、ジンクフィンガーDNA結合ドメインおよびDNA切断ドメインを含むジンクフィンガーヌクレアーゼを使用する)、ならびにゲノム編集の転写活性化因子様エフェクターヌクレアーゼ(TALEN)に基づく方法(例えば、転写活性化因子様エフェクターヌクレアーゼ(TALEN)タンパク質を使用する)が挙げられる。そのような方法は全て、細胞において標的核酸配列(例えば、標的DNAまたはRNA配列)を挿入する、欠失させる、および/または横断することができるヌクレアーゼである核酸編集タンパク質の使用に依拠する。したがって、核酸編集タンパク質により、標的DNAまたはRNA配列における1つまたは複数の選択されたヌクレオチドまたはリボヌクレオチドの挿入、欠失、および/または置換をもたらすことができる。しかし、上記の通り、AAVなどのベクターのカーゴの制限により、疾患を処置するために十分なレベルの核酸編集タンパク質を(および一部の実施例では対応するgRNAも)産生させることが難しい可能性がある。
2つのRNA分子の、これらのRNA断片の一方または両方の天然に存在するイントロン配列を使用したスプライシング媒介性組換えは非効率的である。第1に、これらの天然のイントロン配列は、天然に存在するイントロン由来の配列であり、4種のRNAヌクレオチド全ての混合で構成される。そのような配列は、分子間相互作用に利用可能になるのではなく強力な分子内塩基対を形成することによりトランス相互作用を妨害し得る構造に折りたたまれる傾向がある。第2に、高等真核生物におけるエクソン定義はイントロンではなくエクソンによって駆動されるので、これらの天然に存在するイントロン配列はスプライソソーム成分を強力に誘引するように進化していない。以前の戦略のこれらの2つの制限は、本発明において、天然には見いだされない合成イントロン配列を設計することによって対処される。これらの合成配列は、スプライソソーム動員を強力に誘引および刺激する一方で、2つのRNA断片が1つにまとまることを妨害する二次構造(および一部の実施例では三次構造などの他の構造)を最小化するエレメントを含有する。
本発明者らは、大きな遺伝子のコード配列を複数の一連の断片から効率的に再構成するために使用することができる、新規の核酸に基づくエレメントを開発した。本明細書に提示される組成物、系および方法は、全長RNAを複数の一連の断片から再構成することを可能にする。全長RNA、例えば、メッセンジャーRNA転写物の再構成により今度は全長の「再構成された」タンパク質の産生がもたらされる。本明細書に開示される方法および系は先行方法とは異なる。本明細書に開示される高度に効率的な合成イントロンには、非共有結合により連結したRNA(プレmRNA)間でのRNAスプライシング反応を効率的に駆動するRNAエレメント(またはこれらのエレメントをコードするDNA)の最適な配置を利用する。当該方法/系は、標的核酸分子を編集して遺伝子疾患を処置するための核酸編集タンパク質の治療レベルにより密接に近づく高レベルの機能的核酸編集タンパク質を生じさせるので、トランス-スプライシングを利用する以前の試みからの著しい前進である。この革新は、相補鎖を有する(本質的に低いシス結合能も有する)第2のRNAとのトランス相互作用に干渉する強力なシス結合相互作用を形成することが本質的に不可能である非天然RNAドメインを選択することに基づく。パートナーとなった二量体形成ドメイン、例えば、第1の二量体形成ドメインと第2の二量体形成ドメイン、第2の二量体形成ドメインと第3の二量体形成ドメイン、第3の二量体形成ドメインと第4の二量体形成ドメイン、第4の二量体形成ドメインと第5の二量体形成ドメイン、または第5の二量体形成ドメインと第6の二量体形成ドメインの結合領域間の分子間相互作用は、単一の二量体形成ドメイン上の結合領域と、同じ二量体形成ドメイン内の他の配列との分子内相互作用よりも強力であり得る。例えば、第1のキッシングループ二量体形成ドメイン内の一本鎖キッシングループ構造は、第2のキッシングループ二量体形成ドメイン内のその相補的なキッシングループ構造と、同じ二量体形成ドメイン上の他の配列よりも強力に結合、ハイブリダイズ、または会合し得る。同じ二量体形成ドメイン内に、分子間よりも分子内でより強力に結合する領域、例えば、ステムループ構造のステムが存在し得ることが理解される。得られた二量体形成ドメインは、それらの意図された標的、すなわち、パートナー二量体形成ドメイン上の相補的な結合領域に選択的にかつ効率的に結合する安定して利用手可能な一本鎖結合領域を含む。この戦略により、別々の鋳型から合成される転写物の前例のない再構成効率が可能になり、それにより、高レベルの標的タンパク質または治療用核酸の産生がもたらされる。そのような最適化された合成核酸分子およびそれらを使用するための方法の多数の例が本明細書に提示される。これらの最適化された二量体形成ドメインおよび/または合成イントロンは、RNAスプライシングを容易にする最適化されたモチーフ(スプライスドナー、スプライスアクセプター、スプライスエンハンサー、およびスプライス分岐点配列を含む)と組み合わせて使用される非天然配列(例えば、ヒト細胞において見いだされず、かつ/または別の生物系において見いだされない配列)を含み得る。合成核酸は、非天然核酸配列、例えば、ヒト細胞において見いだされず、かつ/または別の生物系において見いだされない配列であり得る。RNA鎖のトランス二量体形成を、効率的なスプライシングを媒介する妥当なRNAモチーフに関して最適化することにより、in vivoおよびin vitroにおいて、高レベルの機能的核酸編集タンパク質を産生する同じ細胞において2つまたは3つの異なるRNAを正確にかつ効率的に共有結合により連結することができることが本明細書で初めて実証される。最終的にシスでのRNAスプライシングが後に続いてDNA組換え部位が成熟転写物から削除されるDNA組換えによってDNAレベルで非効率的な組合せがもたらされる「ハイブリッド」手法とは異なり、本明細書に開示される方法/系では、2つのタンパク質コードRNA断片がプレmRNAレベルで結合し、非機能的および/または有害な産物をコードする組換え産物が産生されるリスクがより低い、より効率的な反応が促進される。
データから、効率的な合成RNA二量体形成および組換えドメイン(sRdRドメイン、RNA末端結合(REJ)ドメインとも称される)を使用することにより、同じ細胞において2つの別々の核酸構築物から発現させた2つの別々の遺伝子断片から核酸編集タンパク質の全長mRNAを再構成することによって核酸編集タンパク質を効率的に産生させることができることが実証される。所望のガイドRNA、例えばgRNAを2つの構築物のうちの一方から、または異なる構築物から発現させることができる。任意の標的核酸を編集して任意の遺伝子疾患を処置するために、本明細書に開示される方法および系を使用して、ABE8eのような大きな遺伝子をコードする転写物を再構成することができる。これらの知見に基づいて、核酸編集タンパク質の発現が役立つものなどの任意の遺伝子疾患(例えば、表1~4に列挙されている障害を参照されたい)を処置することができる。核酸編集タンパク質を使用して処置することができる他の疾患としては、がんおよび感染性疾患(例えば、細菌またはウイルス感染)が挙げられる。他の適用としては、研究およびバイオテクノロジーへの適用が挙げられる。
一部の実施形態では、本開示は、処置することを必要とする対象を、対象の細胞における標的核酸配列を変更することによって処置するために本開示の核酸編集組成物および系を使用するための方法を提供する。核酸編集の使用は、文献、例えば、その全体が参照により本明細書に組み込まれる米国特許出願第2020/392473号、"Novel CRISPR enzymes and systems"に記載されている。
一部の実施形態では、本明細書に記載の組成物、系、および方法を、疾患または障害を有する対象を、タンパク質または別の遺伝子産物、例えば、RNAの産生の欠陥または低減を引き起こす核酸変異を修復することによって処置するために使用する。一部の実施形態では、欠陥のあるタンパク質または遺伝子産物は、活性が低下している、非機能的である、または毒性である。一部の実施形態では、変異は遺伝子のコード領域または非コード領域内に存在する。一部の実施形態では、疾患または障害は、非機能的なまたは他の点で欠陥のある遺伝子産物をもたらす、遺伝子のコード領域内の変異によって引き起こされるものであり、変異を修復することにより、機能的な遺伝子産物の発現が回復する。一部の実施形態では、疾患または障害は、遺伝子の調節領域、例えば、プロモーター領域またはスプライシングエレメント内の変異によって引き起こされるものであり、変異を修復することにより、遺伝子産物の正常なまたは望ましいレベルの発現がアップレギュレーションまたはダウンレギュレーションによって回復する。一部の実施形態では、スプライシングがエクソンをスキップするように変更され、それにより、正常なまたは望ましいレベルの機能的な遺伝子産物が回復するように変異を導入することができる。一部の実施形態では、機能的な遺伝子産物のレベルが対照、例えば無処置対照と比較してモジュレートされる。
一部の実施形態では、機能喪失型変異を有する疾患遺伝子は、参照により本明細書に組み込まれるChen and Altman, 2017, "Opportunities for developing therapies for rare genetic diseases: focus on gain of function and allostery," Orphanet Journal of Rare Diseases 12: 61の表2から複写した表1に列挙されている疾患遺伝子である。一部の実施形態では、本明細書に記載の核酸編集組成物、系、および方法を使用して、表1に列挙されている疾患を処置する。
表1.機能喪失型変異に起因する遺伝子疾患
対応する疾患名、OMIM識別子、変異遺伝子および公知のアロステリック活性化因子が列挙されている。アロステリック活性化因子はアロステリックデータベースで検索されたものである。残りの潜在的な候補は追加ファイル1:表S8において見いだすことができる
一部の実施形態では、本明細書に記載の組成物および方法は、疾患または障害を有する対象を、核酸変異を導入して、望ましくないゲノム配列を破壊するおよび/または対象の細胞における望ましくない遺伝子産物の産生をダウンレギュレートすることによって処置するために有用である。一部の実施形態では、望ましくないゲノム配列および/または望ましくない遺伝子産物の産生を、コード領域または非コード領域を変更することによってダウンレギュレートする。一部の実施形態では、1つまたは複数の調節配列(例えば、プロモーターまたはエンハンサー)を変更する。一部の実施形態では、スプライシングまたはRNAプロセシングの他の側面(例えば、ポリアデニル化、細胞内局在化、または半減期)をモジュレートする配列を、望ましくないゲノム配列が破壊されるおよび/または望ましくない遺伝子産物のレベルがダウンレギュレートされるように変更する。一部の実施形態では、望ましくないゲノム配列のコード領域を、変異、例えば、欠失、ミスセンス変異、フレームシフト変異、または終止コドンが導入され、それにより、望ましくないゲノム配列の活性のダウンレギュレーションおよび/または望ましくない遺伝子産物の産生のダウンレギュレーションがもたらされるように変更する。一部の実施形態では、活性および/または遺伝子産物のレベルが対照、例えば、無処置対照と比較してダウンレギュレートされる。一部の実施形態では、本明細書に記載の核酸編集組成物、系、および方法を使用して標的化するための望ましくないゲノム配列には、文献に記載されているいずれか、例えば、機能獲得型変異を有する癌遺伝子または疾患遺伝子が含まれ得る。一部の実施形態では、癌遺伝子は、表2に列挙されているいずれかである。一部の実施形態では、本明細書に記載の核酸編集組成物、系、および方法を使用して、表2に列挙されているがんを処置する。
表2. 癌遺伝子
一部の実施形態では、機能獲得型変異を有する疾患遺伝子は、神経変性疾患遺伝子である。一部の実施形態では、神経変性疾患遺伝子は、Chen and Altman, 2017の表1から複写した表3に列挙されているいずれかである。一部の実施形態では、本明細書に記載の核酸編集組成物、系、および方法を使用して、表3に列挙されている神経変性疾患を処置する。
表3.機能獲得型変異に起因する遺伝子疾患
対応する疾患名、OMIM識別子、および変異遺伝子が列挙されている。疾患は型の列に示されている通り分子機構ごとに群分けされている。残りの潜在的な候補は追加ファイル1:表S7において見いだすことができる
断片化された遺伝子を複数のAAVから再構成するための既存の戦略に伴う制限のいくつかに対処するために、標的細胞において2つまたはそれよりも多くの個々の合成RNA分子を連続してアラインメントし、組み換える系を本明細書において提供する。個々の合成RNA分子は、それぞれが、二量体形成ドメインおよびRNAスプライシングに必要なエレメントを含有する合成イントロン配列を含み、それにより、二量体形成ドメインが互いに正しい順序で結合すると、個々の断片の効率的なRNA組換えが媒介される。一実施例では、2つの断片からのコード配列の再構成は、第1の合成イントロン(A)をN末端コード断片の3’末端に付加し、相補的な第2の合成のドメイン(A’)をC末端コード断片の5’末端に付加することによって実現される。2つのRNAは細胞の内在性RNAスプライシング機構(すなわち、スプライソソーム機構)によって組み換えられる。合成イントロンドメインは、二機能性エレメント:(1)組み換えられる両半分(two halves)間の塩基対合を媒介するための二量体形成ドメイン、および(2)2つのRNA分子の効率的な再構成を媒介するためにスプライシング機構を効率的に動員するように最適化されたドメインを含有する。
合成イントロンドメインは、スプライシングされていないRNAによってタンパク質がコードされることを防止するためのエレメントを含み得る。一部の実施例では、合成イントロンは、配列番号159、160、161、162、163、164、165および166に提示される任意の合成イントロンに対して少なくとも50%、少なくとも60%、少なくとも70%、少なくとも75%、80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む(例えば、図10A~10Z参照)。一部の実施例では、合成イントロンは、配列番号159、160、161、162、163、164、165、および166に提示される任意の合成イントロンに対して少なくとも50% 少なくとも60%、少なくとも70%、少なくとも75%、80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%、または100%の配列同一性を有するが、提示されるプロモーター配列を伴わない配列によってコードされるRNA分子である。配列番号159、160、161、162、163、164、165、および166に提示される分子はいずれも、タンパク質コード部分(例えば、図6Aの114および164)が目的の別の核酸編集タンパク質コード配列で置き換えられるように改変することができる(例えば、配列番号1、2、22または23のYFPコード配列をCas9またはCas13dタンパク質コード配列で置き換えることができる)ことが当業者には理解されよう。したがって、配列番号159、160、161、162、163、164、165、および166に提示される任意の合成イントロン部分に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する合成イントロン分子も本明細書に提示される。配列番号159、160、161、162、163、164、165、および166に提示される任意の合成イントロンに対して少なくとも50% 少なくとも60%、少なくとも70%、少なくとも75%、80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%、または100%の配列同一性を有するが、提示されるプロモーター配列を伴わない配列によってコードされる合成イントロンRNA分子も提供される。
例示的な二量体形成ドメインを、それらの内部の二次/三次構造が最小限になる/最適化されるようにバイオインフォマティクスにより選択した。試験した二量体形成ドメインは、分子内アニーリングを回避するために、長いひと続きの、多様性が低いヌクレオチド配列を含有するものであった。分子内アニーリングを回避することにより、これらの二量体形成ドメインは開いた構成で存在し、したがって、対応する相補的な二量体形成ドメイン配列との対合に利用可能になる。合成イントロンドメインは、スプライシング機構の効率的な動員をもたらすイントロンスプライス増強エレメントを含有する。
本明細書に開示されるRNA分子は、少なくとも、相補的な二量体形成ドメインと結合させてRNAの効率的なスプライシングおよび組換えを可能にするために利用可能な、開いた、利用可能な一本鎖領域を有するように設計される。一部の実施例では、これは、結合ドメインにプリンのみまたはピリミジンのみを利用することによって実現される。プリンがそれら自体と対合することができないこと(ピリミジンも同様)に起因して、これらのひと続きのRNAは、開いた予測される構造を有する。
RNA分子は細胞において一本鎖として存在する。一本鎖であることで、RNA分子は本質的にそれら自体とハイブリダイズしやすく、それにより、強力な二次構造および三次構造を形成する。最も安定な塩基対はGとC、AとU、およびGとUのゆらぎ対である。熱力学的に、2つの塩基の対合が開いた構成よりも選好される。効率的な合成核酸分子を設計するためには、互いに相補性を有する2つの二量体形成ドメインが開いた構成で存在し、したがって、二量体形成ドメインが分子間塩基対合に利用可能になるようにする。合成核酸分子の他の部分間の分子内塩基対合を回避するために、適合しない塩基を含有する長いひと続きの多様でない配列を含めることができる。例えば、長いひと続きの、ピリミジン(すなわち、CおよびT)またはプリン(すなわち、AおよびG)を合成核酸分子内に存在させることができる。ピリミジンは他のピリミジンと標準の塩基対を形成することができず、プリンは他のプリンと標準の塩基対を形成することができない。そのような一続きの、プリンまたはピリミジンは、2~3塩基から200~300塩基までにわたり得る。これらのひと続きは分子内で結合することができないので、相補的な断片との分子間塩基対合に利用可能である。例えば、合成核酸分子AおよびA’を、Aがピリミジンストレッチ(例えば、5’-CCUU(...)CCUU-3’)を含有し、A’が相補的なプリン配列(例えば、5’-AAGG(...)AAGG-3’)を含有するように構成することができる。
本明細書に開示される合成核酸分子(例えば、RNAまたはRNAをコードするDNA)を、ゲノム内の正しくない部位へのあらゆるオフターゲットの結合が最小限になるように設計する。オフターゲットの結合は、核酸分子の配列を変更することによって低減することができる。
開いた合成核酸構成を実現するために一続きの低多様性RNA塩基を使用するという同じ設計原理を、二量体形成ドメインにおける一続きの一塩基の使用、例えば、一連のCと塩基対合する一連のG、および一連のUと塩基対合する一連のAの使用に拡張することができる。
2つまたはそれよりも多くの合成核酸分子の組換えを増加させるために、以下の方法を使用することができる。RNAスプライシングは、イントロンの5’末端(スプライスドナー部位)およびイントロンの3’末端(スプライスアクセプター部位、それに付随する分岐点配列およびポリピリミジントラクトと共に)へのスプライソソーム成分の動員に依存する。異なるリボ核タンパク質がイントロンにタンパク質関連低分子核内RNA(snRNA)とイントロン配列の塩基対合を通じて動員される。完全にマッチするコンセンサス配列をRNA二量体形成および組換えドメイン内に置くことにより、スプライソソーム成分の動員を容易にすることができ、それにより今度はスプライソソーム媒介性組換えの効率を増強する。以前に特徴付けられたイントロンスプライスエンハンサー配列により、イントロンスプライスエンハンサーと称される追加的なスプライシング促進因子を動員することができる。
一部の実施例では、RNAスプライシング配列に天然に存在するRNA配列を使用する代わりに、コンセンサス配列を使用する。例えば、スプライスドナー、スプライスアクセプター、スプライスエンハンサーおよびスプライス分岐点配列を含めた、スプライシングに関与する任意の配列にコンセンサス配列を使用することができる。これらの合成核酸分子を用い、ex vivo、in vitro、またはin vivoで細胞において2つ(またはそれよりも多く)のRNA分子を順次結合することができる。合成核酸分子は、コードされる合成イントロンドメインの外側に、任意のプロモーターおよびコード配列を含み得る。例えば、2つの合成核酸分子に単一の核酸編集遺伝子の両半分を担持させることができる。これをin vitroおよびin vivoにおいて、黄色蛍光タンパク質(YFP)の両半分を再構成することによって試験し、効率的であることが示された(図3A~3D参照)。
合成核酸分子のモジュラー性により、最適化された相補的な二量体形成ドメインのコンビナトリアルセットを使用した複数のRNA断片の一連の組換え(すなわち、>2)の実現の効率を試験することが可能になった(図4A~4B)。トランスフェクトされた細胞の>80%で3分割黄色蛍光タンパク質が効率的に再構成され、高レベルで発現された。
これらの結果から、単一の遺伝子治療ベクター、例えばAAVに収まるには長すぎるプロモーターおよび/またはコード配列を有する核酸編集タンパク質を発現させる場合などに、少なくとも3つの異なる合成核酸分子から単一のRNA分子を再構成することができることが実証される。
一部の実施例では、本発明の組成物、系、キット、および方法の合成核酸分子、例えば合成DNA分子は、逆転写酵素によるRNAウイルスゲノムの転写によって作製される。
本明細書に開示される系により、個々の断片間の効率的なRNA組換えが可能になる。一部の実施例では、本開示の組成物、系または方法を使用して実現される再構成(すなわち、スプライシングまたは組換え)効率を、当業者に公知の任意の適切な方法を使用して決定する。一部の実施例では、再構成効率は、対照RNAと比べた正しく結合されたRNAの尺度、または対照タンパク質と比べた全長核酸編集タンパク質もしくはタンパク質活性の尺度によって表される。一部の実施例では、対照RNAは結合していないRNAであり、その場合、再構成効率は、結合していないRNAと比べた結合したRNAの尺度によって表される。この測定は、結合部RNAおよび結合していない3’RNA種3’を検出し、比較することによって行うことができる(例えば、結合部RNA:3’RNA)。2つよりも多くのRNAを結合させる一部の実施例では、結合部のいずれかまたは全てにおける結合を評価する。一部の実施例では、再構成効率は、タンパク質断片または不活性タンパク質と比べた全長または活性核酸編集タンパク質の尺度によって表される。
一部の実施例では、再構成、組換えまたはスプライシングの効率(異なるRNA分子上に存在する2つもしくはそれよりも多くの異なるコード配列の正しい結合、および/または所望の全長タンパク質の産生の尺度)は、約10%~約100%である。合成イントロンドメインは、スプライシングされていないRNAによってタンパク質がコードされることを防止するエレメントを含み得る。一部の実施例では、再構成効率は、約10%~約15%、約10%~約20%、約10%~約25%、約10%~約30%、約10%~約40%、約10%~約50%、約10%~約60%、約10%~約70%、約10%~約80%、約10%~約90%、約10%~約100%、約15%~約20%、約15%~約25%、約15%~約30%、約15%~約40%、約15%~約50%、約15%~約60%、約15%~約70%、約15%~約80%、約15%~約90%、約15%~約100%、約20%~約25%、約20%~約30%、約20%~約40%、約20%~約50%、約20%~約60%、約20%~約70%、約20%~約80%、約20%~約90%、約20%~約100%、約25%~約30%、約25%~約40%、約25%~約50%、約25%~約60%、約25%~約70%、約25%~約80%、約25%~約90%、約25%~約100%、約30%~約40%、約30%~約50%、約30%~約60%、約30%~約70%、約30%~約80%、約30%~約90%、約30%~約100%、約40%~約50%、約40%~約60%、約40%~約70%、約40%~約80%、約40%~約90%、約40%~約100%、約50%~約60%、約50%~約70%、約50%~約80%、約50%~約90%、約50%~約100%、約60%~約70%、約60%~約80%、約60%~約90%、約60%~約100%、約70%~約80%、約70%~約90%、約70%~約100%、約80%~約90%、約80%~約100%、または約90%~約100%である。一部の実施例では、再構成効率は、約10%、約15%、約20%、約25%、約30%、約40%、約50%、約60%、約70%、約80%、約90%、または約100%である。一部の実施例では、再構成効率は、少なくとも約10%、約15%、約20%、約25%、約30%、約40%、約50%、約60%、約70%、約80%、または約90%である。一部の実施例では、再構成効率は、多くとも約15%、約20%、約25%、約30%、約40%、約50%、約60%、約70%、約80%、約90%、または約100%である。
一部の実施例では、再構成、組換えまたはスプライシングの効率(本実施例では、異なるRNA分子上に存在する2つの異なる核酸編集タンパク質コード配列の正しい結合、および/または所望の核酸編集全長タンパク質の産生の尺度であり、ここで、2つの異なる核酸編集タンパク質コード配列は、約3200nt~9000nt、例えば、約4000~9000nt、約4400~9000nt、約3200~4000nt、約3200~3600nt、例えば、約4500nt、約4000nt、約3800nt、約3600nt、または約3200ntの転写物をコードする)は、約10%~約100%である。一部の実施例では、2つの部分からなる系を使用した再構成効率は、約10%~約15%、約10%~約20%、約10%~約25%、約10%~約30%、約10%~約40%、約10%~約50%、約10%~約60%、約10%~約70%、約10%~約80%、約10%~約90%、約10%~約100%、約15%~約20%、約15%~約25%、約15%~約30%、約15%~約40%、約15%~約50%、約15%~約60%、約15%~約70%、約15%~約80%、約15%~約90%、約15%~約100%、約20%~約25%、約20%~約30%、約20%~約40%、約20%~約50%、約20%~約60%、約20%~約70%、約20%~約80%、約20%~約90%、約20%~約100%、約25%~約30%、約25%~約40%、約25%~約50%、約25%~約60%、約25%~約70%、約25%~約80%、約25%~約90%、約25%~約100%、約30%~約40%、約30%~約50%、約30%~約60%、約30%~約70%、約30%~約80%、約30%~約90%、約30%~約100%、約40%~約50%、約40%~約60%、約40%~約70%、約40%~約80%、約40%~約90%、約40%~約100%、約50%~約60%、約50%~約70%、約50%~約80%、約50%~約90%、約50%~約100%、約60%~約70%、約60%~約80%、約60%~約90%、約60%~約100%、約70%~約80%、約70%~約90%、約70%~約100%、約80%~約90%、約80%~約100%、または約90%~約100%である。一部の実施例では、再構成効率は、約10%、約15%、約20%、約25%、約30%、約40%、約50%、約60%、約70%、約80%、約90%、または約100%である。一部の実施例では、再構成効率は、少なくとも約10%、約15%、約20%、約25%、約30%、約40%、約50%、約60%、約70%、約80%、または約90%である。一部の実施例では、再構成効率は、多くとも約15%、約20%、約25%、約30%、約40%、約50%、約60%、約70%、約80%、約90%、または約100%である。
一部の実施例では、再構成、組換えまたはスプライシングの効率(本実施例では、異なるRNA分子上に存在する2つの異なる核酸編集タンパク質コード配列の正しい結合、および/または所望の全長核酸編集タンパク質の産生の尺度であり、ここで、2つの異なる核酸編集タンパク質コード配列は、約4000ntの転写物をコードする)は、約40%~約60%、例えば、約40%~約50%、約42%~約47%、例えば、約45%である。
一部の実施例では、再構成、組換えまたはスプライシングの効率(本実施例では、異なるRNA分子上に存在する2つの異なる核酸編集タンパク質コード配列の正しい結合、および/または所望の核酸編集全長タンパク質の産生の尺度であり、ここで、2つの異なる核酸編集タンパク質コード配列は、約3800ntの転写物をコードする)は、約40%~約60%、例えば、約40%~約50%、約42%~約47%、例えば、約45%である。
一部の実施例では、再構成、組換えまたはスプライシングの効率(本実施例では、異なるRNA分子上に存在する2つの異なる核酸編集タンパク質コード配列の正しい結合、および/または所望の核酸編集全長タンパク質の産生の尺度であり、ここで、2つの異なる核酸編集タンパク質コード配列は、約3600ntの転写物をコードする)は、約25%~約50%、例えば、約30%~約40%、例えば、約35%である。
一部の実施例では、再構成、組換えまたはスプライシングの効率(本実施例では、異なるRNA分子上に存在する2つの異なる核酸編集タンパク質コード配列の正しい結合、および/または所望の核酸編集全長タンパク質の産生の尺度であり、ここで、2つの異なる核酸編集タンパク質コード配列は、約3200ntの転写物をコードする)は、約25%~約50%、例えば、約30%~約40%、例えば、約35%である。
一部の実施例では、再構成、組換えまたはスプライシングの効率(本実施例では、異なるRNA分子上に存在する3つの異なる核酸編集タンパク質コード配列の正しい結合、および/または所望の全長核酸編集タンパク質の産生の尺度であり、ここで、3つの異なる核酸編集タンパク質コード配列は、約3200nt~約13,500nt、例えば、約4000nt~約5,000nt、約4000nt~約13,500nt、約6000nt~約12,000nt、約6000nt~約10,000nt、または約8000nt~約12,000nt、例えば、最大約13,500ntの転写物をコードする)は、約10%~約100%である。一部の実施例では、3つの部分からなる系を使用した再構成効率は、約10%~約15%、約10%~約20%、約10%~約25%、約10%~約30%、約10%~約40%、約10%~約50%、約10%~約60%、約10%~約70%、約10%~約80%、約10%~約90%、約10%~約100%、約15%~約20%、約15%~約25%、約15%~約30%、約15%~約40%、約15%~約50%、約15%~約60%、約15%~約70%、約15%~約80%、約15%~約90%、約15%~約100%、約20%~約25%、約20%~約30%、約20%~約40%、約20%~約50%、約20%~約60%、約20%~約70%、約20%~約80%、約20%~約90%、約20%~約100%、約25%~約30%、約25%~約40%、約25%~約50%、約25%~約60%、約25%~約70%、約25%~約80%、約25%~約90%、約25%~約100%、約30%~約40%、約30%~約50%、約30%~約60%、約30%~約70%、約30%~約80%、約30%~約90%、約30%~約100%、約40%~約50%、約40%~約60%、約40%~約70%、約40%~約80%、約40%~約90%、約40%~約100%、約50%~約60%、約50%~約70%、約50%~約80%、約50%~約90%、約50%~約100%、約60%~約70%、約60%~約80%、約60%~約90%、約60%~約100%、約70%~約80%、約70%~約90%、約70%~約100%、約80%~約90%、約80%~約100%、または約90%~約100%である。一部の実施例では、再構成効率は、約10%、約15%、約20%、約25%、約30%、約40%、約50%、約60%、約70%、約80%、約90%、または約100%である。一部の実施例では、再構成効率は、少なくとも約10%、約15%、約20%、約25%、約30%、約40%、約50%、約60%、約70%、約80%、または約90%である。一部の実施例では、再構成効率は、多くとも約15%、約20%、約25%、約30%、約40%、約50%、約60%、約70%、約80%、約90%、または約100%である。
一部の実施例では、再構成、組換えまたはスプライシングの効率(本実施例では、異なるRNA分子上に存在する4つの異なる核酸編集タンパク質コード配列の正しい結合、および/または所望の全長核酸編集タンパク質の産生の尺度であり、ここで、4つの異なる核酸編集タンパク質コード配列は、約3200nt~約18,000nt、例えば、約4000nt~約18,000nt、約4000nt~約5,000nt、約10,000nt~約18,000nt、約15,000nt~約18,000nt、または約12,000nt~約15,000nt、例えば、最大約18,000ntの転写物をコードする)は、約10%~約100%である。一部の実施例では、4つの部分からなる系を使用した再構成効率は、約10%~約15%、約10%~約20%、約10%~約25%、約10%~約30%、約10%~約40%、約10%~約50%、約10%~約60%、約10%~約70%、約10%~約80%、約10%~約90%、約10%~約100%、約15%~約20%、約15%~約25%、約15%~約30%、約15%~約40%、約15%~約50%、約15%~約60%、約15%~約70%、約15%~約80%、約15%~約90%、約15%~約100%、約20%~約25%、約20%~約30%、約20%~約40%、約20%~約50%、約20%~約60%、約20%~約70%、約20%~約80%、約20%~約90%、約20%~約100%、約25%~約30%、約25%~約40%、約25%~約50%、約25%~約60%、約25%~約70%、約25%~約80%、約25%~約90%、約25%~約100%、約30%~約40%、約30%~約50%、約30%~約60%、約30%~約70%、約30%~約80%、約30%~約90%、約30%~約100%、約40%~約50%、約40%~約60%、約40%~約70%、約40%~約80%、約40%~約90%、約40%~約100%、約50%~約60%、約50%~約70%、約50%~約80%、約50%~約90%、約50%~約100%、約60%~約70%、約60%~約80%、約60%~約90%、約60%~約100%、約70%~約80%、約70%~約90%、約70%~約100%、約80%~約90%、約80%~約100%、または約90%~約100%である。一部の実施例では、再構成効率は、約10%、約15%、約20%、約25%、約30%、約40%、約50%、約60%、約70%、約80%、約90%、または約100%である。一部の実施例では、再構成効率は、少なくとも約10%、約15%、約20%、約25%、約30%、約40%、約50%、約60%、約70%、約80%、または約90%である。一部の実施例では、再構成効率は、多くとも約15%、約20%、約25%、約30%、約40%、約50%、約60%、約70%、約80%、約90%、または約100%である。一部の実施例では、本開示の組成物、系または方法を、当業者に公知の任意の適切な方法を使用してRNAまたはタンパク質の産生レベルを決定することによって評価する。一部の実施例では、RNA産生レベルは、対照RNAと比べた正しく結合されたRNAの尺度、または対照と比べた全長タンパク質の尺度によって表される。一部の実施例では、対照RNAは対応する変異体RNAまたは内因性RNAである。例えば、トランスフェクトされた細胞において産生された結合したRNAの量の変異体または内因性RNAの量に対する比をトランスフェクトされていない細胞における同じ比と比較して、正しく結合されたRNAの産生レベルを決定する。一部の実施例では、正しく結合されたRNA、全長タンパク質、またはタンパク質活性の量の、対照RNAの量、または対照タンパク質の量もしくは活性に対する比を比較する。
一部の実施例では、実現されるRNA産生レベルは、5%~100%である。一部の実施例では、実現されるRNA産生レベルは、約5%~約100%である。一部の実施例では、実現されるRNA産生レベルは、約5%~約10%、約5%~約20%、約5%~約25%、約5%~約30%、約5%~約40%、約5%~約50%、約5%~約60%、約5%~約70%、約5%~約80%、約5%~約90%、約5%~約100%、約10%~約20%、約10%~約25%、約10%~約30%、約10%~約40%、約10%~約50%、約10%~約60%、約10%~約70%、約10%~約80%、約10%~約90%、約10%~約100%、約20%~約25%、約20%~約30%、約20%~約40%、約20%~約50%、約20%~約60%、約20%~約70%、約20%~約80%、約20%~約90%、約20%~約100%、約25%~約30%、約25%~約40%、約25%~約50%、約25%~約60%、約25%~約70%、約25%~約80%、約25%~約90%、約25%~約100%、約30%~約40%、約30%~約50%、約30%~約60%、約30%~約70%、約30%~約80%、約30%~約90%、約30%~約100%、約40%~約50%、約40%~約60%、約40%~約70%、約40%~約80%、約40%~約90%、約40%~約100%、約50%~約60%、約50%~約70%、約50%~約80%、約50%~約90%、約50%~約100%、約60%~約70%、約60%~約80%、約60%~約90%、約60%~約100%、約70%~約80%、約70%~約90%、約70%~約100%、約80%~約90%、約80%~約100%、または約90%~約100%である。一部の実施例では、実現されるRNA産生レベルは、約5%、約10%、約20%、約25%、約30%、約40%、約50%、約60%、約70%、約80%、約90%、または約100%である。一部の実施例では、実現されるRNA産生レベルは、少なくとも約5%、約10%、約20%、約25%、約30%、約40%、約50%、約60%、約70%、約80%、または約90%である。一部の実施例では、実現されるRNA産生レベルは、多くとも約10%、約20%、約25%、約30%、約40%、約50%、約60%、約70%、約80%、約90%、または約100%である。
一部の実施例では、タンパク質産生レベルは、対照タンパク質の全長核酸編集タンパク質または核酸編集タンパク質活性の量と比べた全長核酸編集タンパク質または核酸編集タンパク質活性の量の尺度によって表される。一部の実施例では、対照タンパク質は、対応する変異体タンパク質または内因性タンパク質である。例えば、トランスフェクトされた細胞において産生された全長核酸編集タンパク質またはタンパク質活性の量の変異体タンパク質または内因性タンパク質の量に対する比をトランスフェクトされていない細胞における同じ比と比較する。一部の実施例では、対照タンパク質は、例えば、対照全長タンパク質を発現するように操作された細胞(ここで、細胞は本発明の構築物をトランスフェクトされていない)または対照全長タンパク質を発現する正常な対象由来のトランスフェクトされていない細胞において産生される全長核酸編集タンパク質であり、タンパク質産生レベルは、トランスフェクトされた細胞における核酸編集タンパク質の量または活性を測定し、それを対照タンパク質のものと比較することによって決定される。一部の実施例では、対照タンパク質は、構築物をトランスフェクトされた細胞またはトランスフェクトされていない細胞において産生されるタンパク質の変異体形態であり、全長タンパク質またはタンパク質活性の量を対照タンパク質のものと比較して、タンパク質産生レベルを決定する。一部の実施例では、全長タンパク質またはタンパク質活性の量を内因性タンパク質またはハウスキーピングタンパク質のものと比較して、タンパク質産生レベルを決定する。
一部の実施例では、実現されるタンパク質産生レベルは、約1%~約100%である。一部の実施例では、実現されるタンパク質産生レベルは、約10%~約100%である。一部の実施例では、実現されるタンパク質産生レベルは、約10%~約20%、約10%~約30%、約10%~約40%、約10%~約50%、約10%~約60%、約10%~約70%、約10%~約75%、約10%~約80%、約10%~約85%、約10%~約90%、約10%~約100%、約20%~約30%、約20%~約40%、約20%~約50%、約20%~約60%、約20%~約70%、約20%~約75%、約20%~約80%、約20%~約85%、約20%~約90%、約20%~約100%、約30%~約40%、約30%~約50%、約30%~約60%、約30%~約70%、約30%~約75%、約30%~約80%、約30%~約85%、約30%~約90%、約30%~約100%、約40%~約50%、約40%~約60%、約40%~約70%、約40%~約75%、約40%~約80%、約40%~約85%、約40%~約90%、約40%~約100%、約50%~約60%、約50%~約70%、約50%~約75%、約50%~約80%、約50%~約85%、約50%~約90%、約50%~約100%、約60%~約70%、約60%~約75%、約60%~約80%、約60%~約85%、約60%~約90%、約60%~約100%、約70%~約75%、約70%~約80%、約70%~約85%、約70%~約90%、約70%~約100%、約75%~約80%、約75%~約85%、約75%~約90%、約75%~約100%、約80%~約85%、約80%~約90%、約80%~約100%、約85%~約90%、約85%~約100%、または約90%~約100%である。一部の実施例では、実現されるタンパク質産生レベルは、約10%、約20%、約30%、約40%、約50%、約60%、約70%、約75%、約80%、約85%、約90%、または約100%である。一部の実施例では、実現されるタンパク質産生レベルは、少なくとも約10%、約20%、約30%、約40%、約50%、約60%、約70%、約75%、約80%、約85%、または約90%である。一部の実施例では、実現されるタンパク質産生レベルは、多くとも約20%、約30%、約40%、約50%、約60%、約70%、約75%、約80%、約85%、約90%、または約100%である。
一部の実施例では、実現されるタンパク質活性レベルは、約50%~約100%である。一部の実施例では、実現されるタンパク質活性レベルは、約50%~約100%である。一部の実施例では、実現されるタンパク質活性レベルは、約50%~約55%、約50%~約60%、約50%~約65%、約50%~約70%、約50%~約75%、約50%~約80%、約50%~約85%、約50%~約90%、約50%~約95%、約50%~約100%、約55%~約60%、約55%~約65%、約55%~約70%、約55%~約75%、約55%~約80%、約55%~約85%、約55%~約90%、約55%~約95%、約55%~約100%、約60%~約65%、約60%~約70%、約60%~約75%、約60%~約80%、約60%~約85%、約60%~約90%、約60%~約95%、約60%~約100%、約65%~約70%、約65%~約75%、約65%~約80%、約65%~約85%、約65%~約90%、約65%~約95%、約65%~約100%、約70%~約75%、約70%~約80%、約70%~約85%、約70%~約90%、約70%~約95%、約70%~約100%、約75%~約80%、約75%~約85%、約75%~約90%、約75%~約95%、約75%~約100%、約80%~約85%、約80%~約90%、約80%~約95%、約80%~約100%、約85%~約90%、約85%~約95%、約85%~約100%、約90%~約95%、約90%~約100%、または約95%~約100%である。一部の実施例では、実現されるタンパク質活性レベルは、約50%、約55%、約60%、約65%、約70%、約75%、約80%、約85%、約90%、約95%、または約100%である。一部の実施例では、実現されるタンパク質活性レベルは、少なくとも約50%、約55%、約60%、約65%、約70%、約75%、約80%、約85%、約90%、または約95%である。一部の実施例では、実現されるタンパク質活性レベルは、多くとも約55%、約60%、約65%、約70%、約75%、約80%、約85%、約90%、約95%、または約100%である。
一部の実施例では、細胞において産生される正しく結合されたRNAまたは全長核酸編集タンパク質の量は、例えば、1つまたは複数のgRNAの発現と組み合わせて、特定の状態または疾患に関して当業者によって理解される通り、対象における状態または疾患を好転させるまたは治癒させるために十分なものである。一部の実施例では、細胞において産生される正しく結合されたRNAまたは全長核酸編集タンパク質の量は(例えば、1つまたは複数のgRNAの発現と組み合わせて)有効量である。一部の実施例では、この量は、正常な細胞において産生されるRNAまたはタンパク質の量の約50%~100%に相当する。一部の実施例では、この量は、正常な細胞において産生されるRNAまたはタンパク質の量の約40%~約100%に相当する。一部の実施例では、この量は、正常な細胞において産生されるRNAまたはタンパク質の量の約40%~約45%、約40%~約50%、約40%~約55%、約40%~約60%、約40%~約65%、約40%~約70%、約40%~約75%、約40%~約80%、約40%~約85%、約40%~約90%、約40%~約100%、約45%~約50%、約45%~約55%、約45%~約60%、約45%~約65%、約45%~約70%、約45%~約75%、約45%~約80%、約45%~約85%、約45%~約90%、約45%~約100%、約50%~約55%、約50%~約60%、約50%~約65%、約50%~約70%、約50%~約75%、約50%~約80%、約50%~約85%、約50%~約90%、約50%~約100%、約55%~約60%、約55%~約65%、約55%~約70%、約55%~約75%、約55%~約80%、約55%~約85%、約55%~約90%、約55%~約100%、約60%~約65%、約60%~約70%、約60%~約75%、約60%~約80%、約60%~約85%、約60%~約90%、約60%~約100%、約65%~約70%、約65%~約75%、約65%~約80%、約65%~約85%、約65%~約90%、約65%~約100%、約70%~約75%、約70%~約80%、約70%~約85%、約70%~約90%、約70%~約100%、約75%~約80%、約75%~約85%、約75%~約90%、約75%~約100%、約80%~約85%、約80%~約90%、約80%~約100%、約85%~約90%、約85%~約100%、または約90%~約100%に相当する。一部の実施例では、この量は、正常な細胞において産生されるRNAまたはタンパク質の量の約40%、約45%、約50%、約55%、約60%、約65%、約70%、約75%、約80%、約85%、約90%、または約100%に相当する。一部の実施例では、この量は、正常な細胞において産生されるRNAまたはタンパク質の量の、少なくとも約40%、約45%、約50%、約55%、約60%、約65%、約70%、約75%、約80%、約85%、または約90%に相当する。一部の実施例では、この量は、正常な細胞において産生されるRNAまたはタンパク質の量の、多くとも約45%、約50%、約55%、約60%、約65%、約70%、約75%、約80%、約85%、約90%、または約100%に相当する。
組換え効率または産生レベルを決定するために使用するRNAまたはタンパク質の測定は、当業者に公知の任意の適切な方法によって行うことができる。一部の実施例では、発現された機能的タンパク質の量を例えばウエスタンブロット法によって測定することにより、組換え効率または産生レベルを決定する。一部の実施例では、例えば、2つのプローブに基づく定量的リアルタイムPCRを使用してRNA転写物を測定することにより、組換え効率または産生レベルを決定する。例えば、第1のアッセイは、3’エクソンコード配列に完全に含有される配列(3’プローブで標識)にわたる。第2のアッセイは、5’エクソンコード配列と3’エクソンコード配列の間の結合部(結合部プローブで標識)にわたる。再構成効率は、(結合部プローブ計数)/(3’プローブ計数)の比として算出することができる。「再構成効率」、「組換え効率」および「スプライシング効率」は、本明細書では互換的に使用される。
本明細書に提示される組成物および方法を使用して実現される再構成されたタンパク質の発現のレベル、または核酸配列の上首尾の編集のレベル(および、例えば、コードされるタンパク質の産生)は、間接的な測定値、例えば、代表的なマーカー、代理、または機能的指標のレベルに基づいて評価することができる。当業者に公知の任意のそのようなマーカーを、本開示に従って再構成または編集されたタンパク質のレベルの評価に使用し、それに基づいて対照と比較することができる。例えば、ジストロフィン-糖タンパク質複合体(DGC)またはそのサブ複合体の形成により、ジストロフィン機能の回復が表され得る。例えば、それぞれの全体が参照により本明細書に組み込まれるGao and McNally, 2015, "The Dystrophin Complex: structure, function and implications for therapy" Compr Physiol. 2015 5(3): 1223-39、およびOmairi, et al., 2019, "Regulation of the dystrophinassociated glycoprotein complex composition by the metabolic properties of muscle fibres," Scientific Reports (2019) 9: 2770を参照されたい。
一部の実施例では、二量体形成ドメインは、約20~約1000nt、または約50~約160nt、または約50~約500nt、または約50~1000ntであり、ここで、再構成効率は、有効量の正しく結合されたRNAまたは全長核酸編集タンパク質の産生をもたらすものである。一部の実施例では、二量体形成ドメインは約50~約160ntであり、ここで、再構成効率は、有効量の正しく結合されたRNAまたは全長核酸編集タンパク質の産生をもたらすものである。
複数のRNA分子間の効率的な組換えの実現により、単一のAAVのパッケージングの制限を超えた導入遺伝子のAAVへのパッケージングおよび送達が可能になる。AAVパッケージングの制限は、大きな遺伝子の非存在/欠陥によって引き起こされる疾患に対する遺伝子療法の手法の主要な障害である。この系の適用の1つは、核酸編集タンパク質および標的遺伝子に特異的な1つまたは複数のgRNAを、パッケージング容量が制限されたウイルスベクターを使用して発現させることである。疾患および遺伝子としては、これだけに限定されないが、(疾患(遺伝子、OMIM遺伝子識別子)):1)デュシェンヌ型筋ジストロフィーおよびベッカー型筋ジストロフィー(ジストロフィン、OMIM:300377);2)ジスフェルリン異常症(ジスフェルリン、OMIM:603009);3)嚢胞性線維症(CFTR、OMIM:602421);4)アッシャー症候群1B(ミオシンVIIA、OMIM:276903);5)スタルガルト病1(ABCA4、OMIM:601691);6)血友病A(凝固第VIII因子、OMIM:300841);7)フォン・ヴィルブランド病(フォン・ヴィルブランド因子、OMIM:613160);8)マルファン症候群(フィブリリン1、OMIM:134797);9)フォンレックリングハウゼン病(神経線維腫症-1、OMIM:162200)、および聴力損失(OTOF、OMIM:603681)が挙げられる。一部の実施形態では、標的核酸は、ジストロフィン;ジスフェルリン;ミオシンVIIA;フィブリリン1;神経線維腫症-1;ヘモグロビンのβ-グロビン鎖;凝固因子I;凝固因子II;凝固因子III;凝固因子IV;凝固因子V;凝固因子VI;凝固因子VII;凝固因子VIII;凝固因子IX;凝固因子X;凝固因子XI;凝固因子XII;凝固因子XIII;HBA1;HBA2;HBB;HBD;フォン・ヴィルブランド因子;MTHFR;FANCA;FANCC;FANCD2;FANCG;FANCJ;ADAMTS13;第V因子ライデンプロトロンビン;IL-2RG、JAK3、IL-2受容体ガンマ鎖;IL-4受容体ガンマ鎖;IL-7受容体ガンマ鎖;IL-9受容体ガンマ鎖;IL-15受容体ガンマ鎖;IL-21受容体ガンマ鎖;RAG1;RAG2;CXCR4;IL7受容体;ADA;PNP;WAS;CYBA、CYBB、NCF1、NCF2、NCF4;ベータ2インテグリン;C-Cケモカイン受容体5型(CCR5)、MSRB1;CSCR4;P17;PSIP1;CCR5;DMD;G6Pase;CEP290;ABCA4;MAGT1;アリールスルファターゼA(ARSA);ABCD1;IDS;IDUA;IDUA;SGSH;NAGLU;HGSNAT;GNS;GALNS;GLB1;ARSB;GUSB;HYAL1;MAN2B1;SMPD1;NPC1;NPC2;CFTR;PKD-1;PDK-2;PDK-3;HEXA;GBA;HTT;NF-1;NF2;APOB;LDLR;LDLRAP1;PCSK9;BCR-ABL;ASXL1;RUNX2;EPHA1;PD-1;アンドロゲン受容体;E6;E7;CD;NGF;ARSA;MBP;WASP;AADC;CLN2;ASPA;GAN;MT-ND4;SGSH;SUMF1;GAD;NTRN;TH;CH1;GDNF;GAA;SMN;およびチミジンキナーゼから選択されるタンパク質をコードする(野生型の場合)遺伝子に存在する。他のものを表1~4に提示する。例えば、ゲノム点変異を処置するまたは遺伝子を活性化するもしくは過剰発現させるために、核酸編集タンパク質、および、例えば1つまたは複数の(for example or more)標的核酸に特異的なgRNAの発現を、本明細書に提示される開示される系を使用して発現させることができる。核酸編集タンパク質の送達は、本明細書に提示される手法を使用して当該タンパク質を複数の断片に分割することによって実現することができる。
本明細書に開示される方法および系の追加的な適用としては、標的化遺伝子発現のための交差遺伝子送達(intersectional gene delivery)が挙げられる。断片化された遺伝子をコードする2つのウイルスの示差的感染/発現パターンを使用することができる。再構成されたタンパク質は、いずれのウイルスもそれ自体で発現する交差を表す重複する細胞集団において発現される。そのような適用の例としては、以下を挙げることができる:(1)タンパク質の両半分(または3つの3分の1、または他の部分)を、逆行輸送されるウイルスベクターを使用して2つ(またはそれよりも多く)の投影標的から送達して、二股のデュアル投影ニューロンを標識すること、(2)集団Aにおいて活性であるプロモーターの制御下にある1つの断片および、集団Bにおいて活性なプロモーターからの第2の断片を送達して、A∪B集団に対する特異的なタグ付け/操作を行うこと、(3)タンパク質の第1の半分を、集団Aに対するトロピズムを有するウイルスベクターを用いて送達し、第2の半分を、集団Bに対するトロピズムを有するウイルスベクターを用いて送達して、A∪B集団に対する特異的なタグ付け/操作を行うこと。またはこれらの手法の組合せ。
一実施例では、二量体形成ドメインは、例えば、(a)アプタマーによって認識される小分子トリガー、または(b)両半分に結合し、したがって、二量体形成を刺激する、細胞内に存在するタンパク質の存在下で二量体形成を容易にするためのアプタマー配列である。
一部の実施形態では、末端結合に必要なRNA-RNA相互作用を、例えば、(a)両半分に対する相同性を有するアンチセンスオリゴヌクレオチド配列(ssDNAにより誘発される二量体形成)など、他のヌクレオチドによって正にまたは負に制御することができる。そのような実施例では、両方の半分に対する相補配列を有するアンチセンスオリゴヌクレオチドが2つの分子に架橋してひとつにし、したがって、2つの分子のスプライソソーム媒介性組換えが容易になる。(b)2つの結合しているRNAのうちの一方に対する相同性を有するアンチセンスオリゴヌクレオチド配列は、2つの分子のRNA二量体形成を妨げ、遺伝子発現のためのオフスイッチの役割を果たすことができるか、または、(c)両半分に対して相同性を有する内因性細胞RNA(RNAにより誘発される二量体形成)。そのような実施例では、両方の半分に対する相補配列を有する細胞RNA(例えば、mRNAまたはレトロエレメント)が2つの分子に架橋してひとつにし、したがって、2つの分子のスプライソソーム媒介性組換えが容易になる。
これらの分子、タンパク質、またはRNA媒介性相互作用により、制御可能な/微調整された遺伝子発現レベルが可能になる:結合ドメイン(例えば、アンチセンスオリゴヌクレオチド、小分子、内因性細胞RNA)と相互作用する分子の用量設定を行うことにより、両半分間の二量体形成効率をモジュレートして、プロモーター活性とは無関係に発現レベルを調節することができる。そのような分割方式(installment)は、狭い範囲のタンパク質の発現レベルが必要な場合に使用することができる。
III.系
2つまたはそれよりも多くのRNA分子、例えば、少なくとも2種、少なくとも3種、少なくとも4種、または少なくとも5種の異なるRNA分子(例えば、2種、3種、4種、5種、6種、7種、8種、9種または10種の異なるRNA分子)を、二量体形成配列を含有する合成イントロンを使用して組み換えるために使用することができる系が本明細書に提示される。タンパク質レベルでの2つの断片の断片化および再構成とは異なり、本明細書に開示される手法では、適切な分割点を見つけるための広範囲にわたるタンパク質操作が必要ない。RNAレベルでの再構成により、タンパク質の2つの断片のシームレス結合が可能になる。本明細書に開示される方法および系により、大きな遺伝子(および対応するタンパク質)、例えば、約4.5kbよりも大きい、少なくとも5kbよりも大きい、少なくとも5.5kbよりも大きい、少なくとも6kbよりも大きい、少なくともkbよりも大きい、少なくとも8kbよりも大きい、少なくとも8kbよりも大きい、少なくとも10kbよりも大きい、少なくとも13.5kbよりも大きい、または少なくとも18kbよりも大きいものを、2つまたはそれよりも多くの断片または部分に分けることが可能になり、そのそれぞれを別々のベクター、例えば複数のAAVによって細胞または対象に導入することができる。一部の実施例では、本明細書に開示される方法および系により、核酸編集遺伝子(および対応するタンパク質、例えば、Casヌクレアーゼ)、例えば、少なくとも約2kbよりも大きい、少なくとも2.5kb、少なくとも3kb、少なくとも3.5kb、または少なくとも4kbのものを、2つまたはそれよりも多くの断片または部分に分けることが可能になり、そのそれぞれを別々のベクター、例えば複数のAAVによって細胞または対象に導入することができ、ここで、そのようなベクターは、1つまたは複数の標的核酸分子に特異的な(例えば、編集される、例えば、1つまたは複数のヌクレオチドまたはリボヌクレオチドの欠失、挿入、または置換がなされる1つまたは複数の標的部位に対して特異的な)1つまたは複数のgRNAコード配列をさらに含み得る。一部の実施例では、例えば、ベクターから発現されるgRNA分子の数を増加させるために、同じ1つまたは複数のgRNAコード配列の複数のコピーが存在する。一実施例では、系は、2つのRNA分子を組み換えるための2つの部分を含み、ここで、例えば、標的タンパク質は少なくとも約4500nt~約9000nt、例えば、4000nt~5000ntによってコードされる。一実施例では、系は、3つのRNA分子を組み換えるための3つの部分を含み、ここで、例えば、核酸編集タンパク質は、最大約13,500nt、例えば、約2000nt~約13,500ntまたは3000nt~5000ntによってコードされる。一実施例では、系は、4つのRNA分子を組み換えるための4つの部分を含み、ここで、例えば、核酸編集タンパク質は、最大約18,000nt、例えば、約2000nt~約18,000ntまたは2000nt~5000ntによってコードされる。これは、ベクターにおいて利用可能な空間の制限を克服するのに役立つ。一部の実施例では、内因性プロモーターの長さが、AAVで発現されるその対応する遺伝子の容量を制限する。一部の実施例では、コード配列の長さが、AAVで発現されるその容量を制限する。一部の実施例では、内因性プロモーターの長さおよびそのコード配列の長さが、AAVで共に発現されるそれらの容量を制限する。本明細書に開示される系は、以前はAAVで発現させることが難しかったそのような長い配列を発現させるために使用することができる。本明細書に開示される系はまた、gRNAの量が律速となり得るため、例えば、核酸編集タンパク質と組み合わせて、1つまたは複数のgRNAの多数のコピーを発現させるためにも使用することができる。一部の実施例では、本明細書に開示されるDNAおよび系は、少なくとも2のgRNA、少なくとも3のgRNA、少なくとも4のgRNA、少なくとも5のgRNA、少なくとも10のgRNA、少なくとも20のgRNA、少なくとも50のgRNA、少なくとも75のgRNA、少なくとも100のgRNA、少なくとも200のgRNA、少なくとも500のgRNA、または少なくとも1000のgRNAを発現させ、ここで、gRNAは、同じ核酸分子および同じ標的部位を標的とすることができる、同じ核酸分子および同じ核酸分子内の2つまたはそれよりも多くの標的部位を標的とすることができる、2つまたはそれよりも多くの異なる核酸分子(例えば、それぞれ異なる標的核酸分子内の1つまたは複数の標的部位)を標的とすることができる、またはこれらの組合せであり得る。
一部の実施例では、1つまたは複数のgRNAは、単一遺伝子疾患、劣性遺伝子疾患、遺伝子の変異によって引き起こされる疾患などの疾患に関連する遺伝子などの核酸分子を標的とする。そのような疾患の例としては、これだけに限定されないが、血友病A(凝固第VIII因子とも称されるF8遺伝子、7kbコード領域の変異によって引き起こされる)、血友病B(F9遺伝子の変異によって引き起こされる)、デュシェンヌ型筋ジストロフィー(ジストロフィン遺伝子、11kbコード領域の変異によって引き起こされる)、鎌状赤血球貧血(約3.5kbのプロモーターを有するヘモグロビンのベータグロビンドメインの変異によって引き起こされる)、スタルガルト病(ABCA4遺伝子、6.9kbのコード領域の変異によって引き起こされる)、アッシャー症候群(MYO7A、7kbコード領域の変異によって引き起こされ、聴力損失および視覚障害)が挙げられる。一実施例では、遺伝子は、遺伝子の点変異によって引き起こされるものである。
一実施例では、1つまたは複数のgRNAは、がん、例えば、乳がん、肺がん、前立腺がん、肝臓がん、腎臓がん、脳がん、骨がん、卵巣がん、子宮がん、皮膚がん、または結腸がんなどの疾患を処置するために、遺伝子などの核酸分子を標的とする。
一部の実施例では、核酸編集タンパク質をコードし、本明細書に開示される方法および系に使用されるRNA配列を、標的生物体または細胞における発現のためにコドン最適化する、例えば、ヒト、イヌ、ブタ、ネコ、マウス、またはラットの細胞における発現のためにコドン最適化する。したがって、一部の実施例では、RNAコード配列は、好ましいコドンを含む(例えば、利用が少ない稀なコドンを含まない)。コドン最適化は、標的生物体または細胞において豊富なtRNAレベルを同定することによって実施することができる。一部の実施例では、RNA組換え反応を最大にするために、タンパク質をコードするRNA配列を潜在スプライスドナーおよびアクセプター部位について脱富化する。
一部の実施例では、核酸編集タンパク質を2つの部分、例えば、およそ2つの等しい半分(または他の割合、例えば、約1/3を発現する部分Aと約2/3を発現する部分B、または約1/4を発現する部分Aと約3/4を発現する部分Bなど)に分ける。しかし、各部分のヌクレオチドの数が同じである必要はない(または同じ数のアミノ酸をコードする必要はない)。そのような実施例では、方法に2つの合成核酸分子(例えば、RNAまたはそのようなRNAをコードするDNA)を使用することができ、そのうちの一方はタンパク質のN末端部分のコード配列を含み、他方はタンパク質のC末端部分のコード配列を含む。この基礎に基づいて、タンパク質を2つの断片または部分に分けることに加えて、核酸編集タンパク質を2つよりも多くの断片、例えば3つの断片に分けるまたは分割することができることが当業者には理解されよう。3つのRNA分子のイントロン配列の設計原理は2つのRNA分子のものと同様であるが、代わりに、2つの結合部のうちの一方について二量体形成ドメインの異なる対を利用する。したがって、例えば、N末端タンパク質コード配列の後には特定の結合ドメイン(例えば、第1の二量体形成配列)を有するイントロン配列が続き、中間コード配列は、第1の二量体形成配列に対する相補配列(第2の二量体形成配列)を有するイントロン配列を含む。中間コード断片の後には別の二量体形成配列(第3の二量体形成配列、第2の二量体形成配列とは異なる)を有する別のイントロン断片が続く。第3の断片はタンパク質のC末端コード配列を含み、また、第3の二量体形成配列と相補的な二量体形成配列(第4の二量体形成配列)を有するイントロン領域を含む。1つよりも多くの中間部分の使用では、2つの中間部分を、それぞれの部分が区別されることが理解されるように、例えば、中間部分および第1の中間部分、または第1の中間部分および第2の中間部分、または、第1の中間部分、第2の中間部分および第3の中間部分と称することができる。
一実施例では、核酸編集タンパク質をN末端部分とC末端部分に分け(例えば、大まかに半分、または等しくない配分、例えば、1/3と2/3または1/4と3/4に分け)、それらを、本明細書に開示される系および方法を使用して再構成することができる。図6Aおよび6Gを参照すると、そのような実施例では、系は、少なくとも2つの合成核酸分子110、150を含む。各核酸分子110、150はDNAまたはRNAで構成され得る(RNAの場合、対応するプロモーター112、152は存在しない)。一部の実施例では、110、150はそれぞれ、およそ少なくとも100ヌクレオチド/リボヌクレオチド(nt)の長さ、例えば、少なくとも200nt、少なくとも300nt、少なくとも500nt、少なくとも1000nt、少なくとも2000nt、少なくとも3000nt、少なくとも4000nt、少なくとも5000nt、少なくとも6000nt、少なくとも7000nt、少なくとも8000nt、少なくとも10,000nt、例えば、200~10,000nt、200~8000nt、500~5000nt、800~3000nt、1000~300nt、または200~1000ntである。分子110、150は、天然および/または非天然ヌクレオチドまたはリボヌクレオチドを含み得る。
分子110は、スプライスドナー116を含むので、系の5’に位置する分子である。分子110がDNAである実施形態では、分子110は、RNA分子をコードする配列に作動可能に連結したプロモーター112を含み、RNA分子は、5’から3’に:標的タンパク質コード配列の3’末端にスプライスジャンクションを含む、標的タンパク質のN末端部分のコード配列114、SD116、必要に応じたDISE118、必要に応じたISE120、二量体形成ドメイン122、および必要に応じたポリアデニル化配列124を含む。任意のプロモーター112(またはエンハンサー)、例えばRNAポリメラーゼIIを利用するもの、例えば構成的プロモーターまたは誘導性プロモーターを使用することができる。一部の実施例では、プロモーター112は、筋組織(例えば、骨格筋組織もしくは心筋組織)、眼の組織(例えば、網膜組織)、内耳組織、肝組織、膵組織、肺組織、皮膚組織、骨、または腎組織において構成的に活性なものなどの、組織特異的プロモーターである。一部の実施例では、プロモーター112は、がん細胞、または正常な細胞において構成的に活性なものなどの細胞特異的プロモーターである。一部の実施例では、プロモーター112は、発現させるタンパク質の内因性プロモーターであり、一部の実施例では、長い(例えば、少なくとも2500nt、少なくとも3000nt、少なくとも4000nt、少なくとも5000nt、または少なくとも7500nt)。一部の実施例では、プロモーター112は、少なくとも約50ヌクレオチド(nt)の長さ、例えば、少なくとも100の長さ、少なくとも200の長さ、少なくとも300の長さ、少なくとも500の長さ、少なくとも1000の長さ、少なくとも2000の長さ、少なくとも3000の長さ、少なくとも4000の長さ、少なくとも5000の長さ、少なくとも6000の長さ、少なくとも7000の長さ、少なくとも8000ntの長さ、少なくとも9000ntの長さ、または少なくとも10,000ntの長さ、例えば、50~10,000ntの長さ、100~5000ntの長さ、500~5000ntの長さ、または50~1000ntの長さである。一部の実施例では、分子110はDNAであり、少なくとも200nt、少なくとも300nt、少なくとも500nt、少なくとも800nt、少なくとも1000nt、少なくとも2000nt、少なくとも3000nt、少なくとも4000nt、少なくとも5000nt、少なくとも6000nt、少なくとも7000nt、または少なくとも8000nt、例えば、200~10,000nt、200~8000nt、500~5000nt、800~3000nt、1000~300nt、または200~1000ntの長さである。図6Fに示されている通り、分子110がRNAである実施形態では、例えば、DNAのRNAへの転写後、分子110はプロモーター112を含まず、114は、核酸編集タンパク質のN末端部分のコード配列によってコードされるRNAである。一部の実施例では、分子110はRNAであり、プロモーター112を含まず、少なくとも200nt、少なくとも300nt、少なくとも500nt、少なくとも1000nt、少なくとも2000nt、少なくとも3000nt、少なくとも4000nt、少なくとも5000nt、少なくとも6000nt、少なくとも7000nt、または少なくとも8000nt、例えば、200~10,000nt、200~8000nt、500~5000nt、800~3000nt、1000~300nt、または200~1000ntの長さである。分子110(プロモーター112を有するまたは有さない)は、天然および/または非天然ヌクレオチドまたはリボヌクレオチドを含み得る。
N末端コード配列(またはそれによってコードされるRNA配列)114の3’末端の周囲のスプライスジャンクションは、分子110、150が導入される標的細胞または生物体において見いだされるコンセンサス配列とマッチし得る。ヒトでは、スプライスジャンクション配列は、U2依存性イントロンに関しては5’スプライス部位の-1位および-2位のAG(アデニン-グアニン)もしくはUG(ウラシル-グアニン)またはU12依存性イントロンに関してはAG、UG、CU(シトシン-ウラシル)、もしくはUUである。したがって、一部の実施例では、スプライスジャンクションは2ntの長さであり、N末端コード部分114の3’末端はAG、UG、CUまたはUUである。一部の実施例では、核酸編集タンパク質の一部をコードするDNA分子は、複数のスプライスジャンクションの一部をコードする配列を、例えば、核酸編集タンパク質のN末端部分をコードするDNA分子の3’末端、および核酸編集タンパク質のC末端部分をコードするDNA分子の5’末端に含む。
分子110の残りの3’末端部分はイントロン130である。一部の実施例では、イントロン配列130は、およそ少なくとも10nt、例えば、少なくとも20nt、少なくとも50nt、少なくとも100nt、少なくとも250nt、少なくとも250nt、少なくとも300nt、少なくとも400nt、または少なくとも500ntの長さ、例えば、20~500nt、20~250nt、20~100nt、50~100nt、または50~200ntの長さである。N末端コード配列(またはそれによってコードされるRNA)114のすぐ後ろはスプライスドナー(SD)116(例えば、SDヒトコンセンサス配列などのSDコンセンサス配列)である。したがって、イントロン配列130のSD116はN末端コード配列114に対して3’側にある。SD116はRNA分子に結合するためのスプライソソーム成分の認識配列を形成する。SD116の配列は、分子110、150が導入される標的細胞または生物体において見いだされるSDコンセンサス配列であり得る。一部の実施例では、SD116は、少なくとも2nt、例えば、少なくとも5nt、または少なくとも10ntの長さ、例えば、2~10nt、2~8nt、2~5または5~10ntである。SD116を使用してU2またはU12依存性スプライシング機構を動員することができる。一実施例では、U2依存性スプライシングをヒト細胞において使用し、SD116配列はGUAAGUAUUを含むかまたはGUAAGUAUUである。一実施例では、U12依存性スプライシングをヒト細胞において使用し、SD116配列はAUAUCCUUUUUA(配列番号137)またはGUAUCCUUUUUA(配列番号138)を含むかまたはAUAUCCUUUUUA(配列番号137)またはGUAUCCUUUUUA(配列番号138)である。全体を通して、RNA配列はヌクレオチドA、G、UおよびCを使用して記載することができ、DNA配列はヌクレオチドA、G、TおよびCを使用して記載することができることが理解される。転写されて1つまたは複数のRNA分子を形成するDNA分子によって構成されると本明細書に記載される配列、および翻訳され得る(すなわち、タンパク質コード配列)または翻訳され得ない(例えば、gRNA)RNA分子によって構成されると記載される配列は、当業者が認識することができる意図された機能を有する配列であることも理解される。例えば、本開示のDNA分子に存在するgRNA配列は、その転写後に機能的になる配列を有する。別の例として、本開示のDNA分子に存在する標的タンパク質コード配列は、DNAから転写されるmRNAから標的タンパク質に翻訳され得る配列を有する。DNAもしくはRNA分子によってコードされる、またはDNAもしくはRNA分子によって構成されると称される配列は、本開示を読めば当業者には理解される、意図された機能的産物をもたらすものである。
イントロン配列130は、必要に応じて、スプライソソームの作用を刺激する(例えば、活性を増大させる)、下流イントロンスプライスエンハンサー(DISE)118およびイントロンスプライスエンハンサー(ISE)120と称されるスプライシングエンハンサー配列のセットのうちの一方または両方を含む。一部の実施例では、イントロン配列130は、少なくとも2つのスプライシングエンハンサー配列、例えば、少なくとも3つ、少なくとも4つ、または少なくとも5つのスプライシングエンハンサー配列を含む。例示的なスプライシングエンハンサー配列はDISE118およびISE120を含む。一部の実施例では、1つまたは複数のスプライシングエンハンサー配列118、120をイントロン配列130に含めることにより、スプライシング効率が少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも75%、少なくとも80%、少なくとも90%または少なくとも95%上昇する。使用することができる例示的なスプライシングエンハンサー配列は、配列番号26~136、151、および152、ならびにGGGTTT、GGTGGT、TTTGGG、GAGGGG、GGTATT、GTAACG、GGGGGTAGG、GGAGGGTTT、GGGTGGTGT TTCAT、CCATTT、TTTTAAA、TGCAT、TGCATG、TGTGTT、CTAAC、TCTCT、TCTGT、TCTTT、TGCATG、CTAAC、CTGCT、TAACC、AGCTT、TTCATTA、GTTAG、TTTTGC、ACTAAT、ATGTTT、CTCTG、GGG、GGG(N)2-4GGG、TGGG、YCAY、UGCAUG、または3x(G3~61~7)に提示される。一部の実施例では、DISE118は、存在する場合、少なくとも3nt、少なくとも4nt、少なくとも5nt、少なくとも10nt、少なくとも25nt、少なくとも50nt、少なくとも75nt、または少なくとも100ntの長さ、例えば、3~10nt、3~11nt、4~11nt、5~11nt、10~50nt、5~100nt、10~25nt、10~20nt、または20~75ntであってよく、DISE118の配列は、CUCUUUCUUUTCCAUGGGUUGGCU(配列番号134)、TGCATG、CTAAC、CTGCT、TAACC、AGCTT、TTCATTA、GTTAG、TTTTGC、ACTAAT、ATGTTTまたはCTCTGであるかまたはそれを含む。一部の実施例では、ISE120は、存在する場合、およそ少なくとも3nt、少なくとも4nt、少なくとも5nt、少なくとも10nt、例えば、少なくとも20nt、少なくとも25nt、少なくとも30nt、少なくとも40nt、または少なくとも50ntの長さ、例えば、3~10nt、3~11nt、4~11nt、5~11nt、10~50nt、20~25nt、10~25nt、10~20nt、または20~40ntの長さであり得る。一実施例では、ISE120の配列は、GGCUGAGGGAAGGACUGUCCUGGG(配列番号135)、GGGUUAUGGGACC(配列番号136)、TTCAT、CCATTT、TTTTAAA、TGCAT、TGCATG、TGTGTT、CTAAC、TCTCT、TCTGT、またはTCTTTであるかまたはそれを含む。一部の実施例では、イントロン配列130は、少なくとも2つ、少なくとも3つ、または少なくとも4つのISE120を含む。一部の実施例では、ISE120は、配列番号173、174、175、176、177、178、179、180、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、199、200、201、202、または203に対して少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または100%の配列同一性を有する少なくとも1つの配列、例えば、少なくとも2つ、少なくとも3つのそのような配列、例えば、1つ、2つ、3つ、4つまたは5つのそのような配列であるかまたはそれを含む。一部の実施例では、DISE118は、配列番号173、174、175、176、177、178、179、180、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、199、200、201、202、または203に対して少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または100%の配列同一性を有する少なくとも1つの配列、例えば、少なくとも2つ、少なくとも3つのそのような配列、例えば、1つ、2つ、3つ、4つまたは5つのそのような配列であるかまたはそれを含む。
SD116(および存在する場合、エンハンサー配列118、120も)の3’側に、N末端コード配列(またはそれによってコードされるRNA)114とC末端コード配列154をひとつに合わせるために使用される二量体形成ドメイン122が続く。分子110のイントロン配列130部分は、必要に応じて、3’末端に、その断片の転写を終結させるポリアデニル化部位124を含み得る。一部の実施例では、ポリアデニル化配列124は、少なくとも15個のA、例えば、15~30個または15~20個のAのポリA配列である。
一部の実施例では、第1の二量体形成ドメイン122(および分子150の第2の二量体形成ドメイン154)は、複数の対合していないヌクレオチドを含む(すなわち、分子110自体の構造内で対合していない)。二量体形成ドメイン内に対合していないヌクレオチドを有することにより、5’(または第1の)二量体形成ドメイン122と3’(または第2の)二量体形成ドメイン154が塩基対合を通じて相互作用することが可能になる。この相互作用を通じて、分子110と150が近傍に保たれ、それにより、スプライソソームがN末端コード領域(またはそれによってコードされるRNA)114とC末端コード領域(またはそれによってコードされるRNA)164を結合することによって2つの分子を組み換えるように促される。
一実施例では、二量体形成ドメイン122(および154)は多様性が限られたヌクレオチドを含有する「低多様性配列」を含み、したがって、各分子110、150の二次構造において二量体形成ドメイン122(および154)自体がステムループを形成する可能性は低い。そのような低多様性二量体形成ドメイン122(および154)は、タンパク質のN末端およびC末端をコードするDNA(またはそれによってコードされるRNA)114、164の配列とは無関係に、比較的開いた構成であり得る。これにより、第1の二量体形成ドメイン122のヌクレオチドを対応する分子150の第2の二量体形成ドメイン154との塩基対の形成に利用可能にすることが可能になり、それにより、その後のN末端コード配列(またはそれによってコードされるRNA)114とC末端コード配列(またはそれによってコードされるRNA)164の結合が可能になる。一部の実施例では、第1の二量体形成ドメインおよび第2の二量体形成ドメイン122、154は、ステムを形成し得る配列が散在する低多様性配列を含み、それにより、シュードノット形成の非存在下で開いており、塩基対合に利用可能な局所的なRNAループがもたらされる(図6B)。例示的な低多様性配列は、繰り返される一連のU(例えば、30~500個のU)、繰り返される一連のA(例えば、30~500個のAなど)、繰り返される一連のG(例えば、30~500個のG)、繰り返される一連のC(例えば、30~500個のC)、AおよびGのみを含有する混合物(例えば、30~500個のAおよびG、例えば、繰り返され得るAAAGAAGGAA(...)(配列番号149))、CおよびUのみを含有する混合物(例えば、30~500個のCおよびU、例えば、繰り返され得るCUUUCUUUUCUU(...)(配列番号150))を含む。他の例示的な低多様性配列は、低多様性配列によって挟まれたヘリックスを形成する相補配列を含む。
一部の実施例では、第1の二量体形成ドメインおよび第2の二量体形成ドメイン122、154は、プリンのみを含むか、またはピリミジンのみを含む。一実施例では、第1の二量体形成ドメイン122はプリンのみを含み、一方、第2の二量体形成ドメイン154ピリミジンのみを含む。別の例では、第1の二量体形成ドメイン122はピリミジンのみを含み、一方、第2の二量体形成ドメイン154はプリンのみを含む。プリンはそれら自体で対合することができないので(ピリミジンも同様に)、これらの一続きのRNAは、開いた予測される構造を有する。
一部の実施例では、第1の二量体形成ドメインおよび第2の二量体形成ドメイン122、154は、スプライスドナーコンセンサス配列NNNAGGUNNNN(配列番号151)またはNNNUGGUNNNN(配列番号152)(式中、Nは任意のヌクレオチドを指す)と同様の配列などの、RNA組換えと競合する可能性がある潜在スプライスアクセプターを含まない。一部の実施例では、第1の二量体形成ドメイン122は、1000nt以下、例えば750nt以下、または500ntを超える、例えば、6~1000nt、10~1000nt、20~1000nt、30~1000nt、30~750nt、30~500nt、50~500nt、50~100nt、もしくは100~250ntである。一部の実施例では、第1の二量体形成ドメイン122は、50ntよりも大きい、例えば、少なくとも51nt、少なくとも100nt、少なくとも150nt、少なくとも161nt、または少なくとも170nt、例えば、51~159nt、51~150nt、51~120nt、51~100nt、もしくは51~70ntである。一部の実施例では、第1の二量体形成ドメイン122は、160ntよりも大きい、例えば、少なくとも161nt、少なくとも170nt、少なくとも180nt、少なくとも200nt、少なくとも300nt、少なくとも400nt、少なくとも500nt、少なくとも600nt、少なくとも700nt、少なくとも800nt、少なくとも900nt、もしくは少なくとも1000nt、例えば、161~100nt、161~500nt、161~300nt、161~200nt、もしくは161~170ntである。一部の実施例では、第1の二量体形成ドメイン122は、50nt未満、例えば、6~49nt、6~45nt、6~40nt、6~30nt、6~20nt、または6~10ntである。
一部の実施例では、二量体形成ドメインは、20~160nt、50~500nt、または500~1000ntである。一部の実施例では、二量体形成ドメインは、約20nt~約160ntである。一部の実施例では、二量体形成ドメインは、約20nt~約40nt、約20nt~約50nt、約20nt~約70nt、約20nt~約90nt、約20nt~約100nt、約20nt~約110nt、約20nt~約120nt、約20nt~約130nt、約20nt~約140nt、約20nt~約150nt、約20nt~約160nt、約40nt~約50nt、約40nt~約70nt、約40nt~約90nt、約40nt~約100nt、約40nt~約110nt、約40nt~約120nt、約40nt~約130nt、約40nt~約140nt、約40nt~約150nt、約40nt~約160nt、約50nt~約70nt、約50nt~約90nt、約50nt~約100nt、約50nt~約110nt、約50nt~約120nt、約50nt~約130nt、約50nt~約140nt、約50nt~約150nt、約50nt~約160nt、約70nt~約90nt、約70nt~約100nt、約70nt~約110nt、約70nt~約120nt、約70nt~約130nt、約70nt~約140nt、約70nt~約150nt、約70nt~約160nt、約90nt~約100nt、約90nt~約110nt、約90nt~約120nt、約90nt~約130nt、約90nt~約140nt、約90nt~約150nt、約90nt~約160nt、約100nt~約110nt、約100nt~約120nt、約100nt~約130nt、約100nt~約140nt、約100nt~約150nt、約100nt~約160nt、約110nt~約120nt、約110nt~約130nt、約110nt~約140nt、約110nt~約150nt、約110nt~約160nt、約120nt~約130nt、約120nt~約140nt、約120nt~約150nt、約120nt~約160nt、約130nt~約140nt、約130nt~約150nt、約130nt~約160nt、約140nt~約150nt、約140nt~約160nt、または約150nt~約160ntである。一部の実施例では、二量体形成ドメインは、約20nt、約40nt、約50nt、約70nt、約90nt、約100nt、約110nt、約120nt、約130nt、約140nt、約150nt、または約160ntである。一部の実施例では、二量体形成ドメインは、少なくとも約20nt、約40nt、約50nt、約70nt、約90nt、約100nt、約110nt、約120nt、約130nt、約140nt、または約150ntである。一部の実施例では、二量体形成ドメインは、多くても約40nt、約50nt、約70nt、約90nt、約100nt、約110nt、約120nt、約130nt、約140nt、約150nt、または約160ntである。
一部の実施例では、二量体形成ドメインは、約50nt~約500ntである。一部の実施例では、二量体形成ドメインは、約50nt~約100nt、約50nt~約150nt、約50nt~約200nt、約50nt~約250nt、約50nt~約300nt、約50nt~約350nt、約50nt~約400nt、約50nt~約500nt、約100nt~約150nt、約100nt~約200nt、約100nt~約250nt、約100nt~約300nt、約100nt~約350nt、約100nt~約400nt、約100nt~約500nt、約150nt~約200nt、約150nt~約250nt、約150nt~約300nt、約150nt~約350nt、約150nt~約400nt、約150nt~約500nt、約200nt~約250nt、約200nt~約300nt、約200nt~約350nt、約200nt~約400nt、約200nt~約500nt、約250nt~約300nt、約250nt~約350nt、約250nt~約400nt、約250nt~約500nt、約300nt~約350nt、約300nt~約400nt、約300nt~約500nt、約350nt~約400nt、約350nt~約500nt、または約400nt~約500ntである。一部の実施例では、二量体形成ドメインは、約50nt、約100nt、約150nt、約200nt、約250nt、約300nt、約350nt、約400nt、または約500ntである。一部の実施例では、二量体形成ドメインは、少なくとも約50nt、約100nt、約150nt、約200nt、約250nt、約300nt、約350nt、または約400ntである。一部の実施例では、二量体形成ドメインは、多くても約100nt、約150nt、約200nt、約250nt、約300nt、約350nt、約400nt、または約500ntである。
一部の実施例では、第1の二量体形成ドメインおよび第2の二量体形成ドメイン122および154の配列をin silico構造予測スクリーニング(例えば、RNAフォールディング構造予測を使用して、可能性のある二量体形成ドメイン配列のライブラリーをスクリーニングする;二量体形成ドメインおよび対応する抗二量体形成ドメインの両方における対合していないヌクレオチドの割合が大きい配列を選択する)、低多様性ヌクレオチド設計(例えば、二量体形成ドメインを、それ自体と折りたたむことができない配列であるUのみ、Aのみ、Cのみ、Gのみ、R(GおよびA)のみ、またはY(UおよびC)のみのリピート配列などの一続きの低多様性配列を含むように設計する)、または経験的スクリーニング(例えば、二量体形成ドメインおよび対応する抗二量体形成ドメインのライブラリーを合成し、最大の組換え効率についてスクリーニングする)によって決定する。
一部の実施例では、第1の二量体形成ドメインおよび第2の二量体形成ドメイン122、154の配列を、それらの対応物との強力なキッシングループ相互作用を形成することができる相補的なRNAヘアピン構造(ステムループとも称される)を含有するように設計する。一部の実施例では、コード配列の3つまたはそれよりも多くの部分を結合するために、3個またはそれよりも多くの二量体形成ドメイン、例えば、4個またはそれよりも多くまたは5個またはそれよりも多くの二量体形成ドメイン、例えば、3個、4個、5個、6個、7個、8個、9個または10個の二量体形成ドメインを使用する場合にキッシングループを使用する(例えば、図6E)。キッシングループの各ヘアピンループ(またはステムループ)は、非相補配列の領域(例えば、ループを形成する)によって分離された少なくとも2つの相補配列(例えば、ステムを形成する)で構成される。一部の実施例では、二量体形成ドメインは、1個またはそれよりも多く(例えば、少なくとも2個、少なくとも3個、少なくとも4個、または少なくとも5個、例えば、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、もしくは20個)のループで構成され得る。複数のループを用いる一部の実施例では、ループの全部または一部を繰り返すことができる。複数のループを用いる一部の実施例では、全部または一部のループは異なり得る。一部の実施例では、各相補配列は約4~100ntであり、約3~20ntのループによって分離されている。2つの相補配列間の塩基対合により、例えば、少なくとも4bp、少なくとも5bp、少なくとも10bp、少なくとも20bp、少なくとも30bp、少なくとも40bp、少なくとも50bp、少なくとも75bp、少なくとも90bp、または少なくとも100bp、例えば、4~100bp、5~75bp、または10~50bpのヘリックス(またはステム)がもたらされる。一部の実施例では、ループ部分は、少なくとも3nt、少なくとも5nt、少なくとも10nt、少なくとも15nt、または少なくとも20nt、例えば、3~20nt、5~15ntもしくは5~10ntであり、ここで、ループは塩基対合していない。2つのヘアピンループ間の相補配列により、塩基対合、およびキッシングループ/キッシングステムループ相互作用の生成がもたらされる。一部の実施例では、2つのヘアピンループ間の相補配列は、1つのループの少なくとも3ヌクレオチドと第2のループの少なくとも3ヌクレオチドの間、例えば、第1のループの少なくとも4nt、少なくとも5nt、少なくとも6nt、少なくとも7nt、少なくとも8nt、少なくとも9nt、少なくとも10nt、少なくとも11nt、少なくとも12nt、少なくとも13nt、少なくとも14nt、少なくとも15nt、少なくとも16nt、少なくとも17nt、少なくとも19nt、または少なくとも20nt(例えば、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、11nt、12nt、13nt、14nt、15nt、16nt、17nt、18nt、19ntまたは20nt)と、第2のループの少なくとも4nt、少なくとも5nt、少なくとも6nt、少なくとも7nt、少なくとも8nt、少なくとも9nt、少なくとも10nt、少なくとも11nt、少なくとも12nt、少なくとも13nt、少なくとも14nt、少なくとも15nt、少なくとも16nt、少なくとも17nt、少なくとも19nt、または少なくとも20nt(例えば、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、11nt、12nt、13nt、14nt、15nt、16nt、17nt、18nt、19ntまたは20nt)の間に存在する。一部の実施例では、2つのヘアピンループ間の相補配列は、総ループ配列の少なくとも15%、少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、または100%の間で存在する。
一部の場合では、キッシングループのステムを、2つのRNA分子間でトランスに塩基対合するように選択する。そのような実施例では、1つの分子上の1つのヘアピンループと第2の分子上の別のヘアピンループのキッシングループ相互作用の形成後、最初のヘアピンループのそれぞれのステム(またはヘリックス)領域が、鎖置換/侵入および2重鎖形成の伸長を通じて2つのRNA分子間でトランスに塩基対合し得る。一部の実施例では、最初のループ配列内で、2重鎖形成の伸長後にヌクレオチドの最大約85%が塩基対合していないまま残り得る(例えば、ヌクレオチドの約15%が2つのループ間で対合している)。一部の実施例では、キッシングループは、HIV-1 DISループに基づくものであり(配列番号139および140、図17A)、6ヌクレオチドの相補配列の5’側に2つのAヌクレオチド、続いて、3’側に1つのAヌクレオチドを含む(例えば、AANNNNNNA、式中、NはA、U、G、またはCのいずれであってもよい)。一部の実施例では、キッシングループは、HIV-2キッシングループ二量体形成ドメインに基づくものであり(配列番号141および142、図17B)、6ヌクレオチドの相補配列の5’側にGヌクレオチドおよびAヌクレオチド、続いて、3’側に3つのAヌクレオチドを含む(例えば、GANNNNNNAAA(配列番号153)、式中、Nは、A、U、G、またはCであり得る)。
1つの構成では、伸長した2重鎖における高いパーセンテージのマッチをもたらす最初のステムにミスマッチが含まれることにより、2重鎖形成の伸長が選好される。したがって、一部の実施例では、ヘアピンループのヘリックスまたはステム領域は、最初に対合していない塩基対を最大30%含有し得る(例えば、塩基対の30%以下、20%以下、15%以下、10%以下、5%以下、または1%以下、例えば、1~30%、5~30%、10~30%、または25~30%が最初に対合していない)。対合していないこれらの領域は、バルジ、ミスマッチ、または内部ループを形成し得る。
2つのヘアピンループの相互作用(キッシングループ相互作用)に加えて、他の形態のループ相互作用を第1の二量体形成ドメインおよび第2の二量体形成ドメイン122、154に対して利用することができる。一実施例では、ループはバルジであり、塩基対合したヘリックスの一方の鎖は、ステム構造からはみ出た1つまたは複数のヌクレオチドを含有する。例示的なバルジは、少なくとも1nt、少なくとも2nt、少なくとも3nt、少なくとも4nt、少なくとも5nt、少なくとも10ntまたは少なくとも20nt、例えば、1~20nt、1~15nt、1~10nt、もしくは5~10nt、または1nt、2nt、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、11nt、12nt、13nt、14nt、15nt、16nt、17nt、18nt、19ntもしくは20ntである。一実施例では、ループは内部ループであり、例えば、ヘリックス内の1つまたはそれよりも多くのヌクレオチドがミスマッチであり、その結果、ミスマッチの位置で内部ループによって中断されたヘリックスが生じる。一部の実施例では、ヘリックスは、鎖のそれぞれにおいて少なくとも4nt(例えば、少なくとも5nt、少なくとも10nt、少なくとも20nt、少なくとも30nt、少なくとも40nt、少なくとも50nt、少なくとも75nt、少なくとも90nt、または少なくとも100nt、例えば、4~100nt、5~75nt、または10~50nt、例えば、4~100nt)であり、内部ループの両側において少なくとも1nt(例えば、鎖のそれぞれにおいて少なくとも2nt、少なくとも3nt、少なくとも4nt、少なくとも5nt、少なくとも10ntもしくは少なくとも20nt、例えば、1~20nt、1~15nt、1~10nt、もしくは5~10nt、または1nt、2nt、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、11nt、12nt、13nt、14nt、15nt、16nt、17nt、18nt、19ntもしくは20nt)である。一実施例では、ループは多分枝ループであり、3つのヘリックスまたはステムが、1つまたは複数の対合していないヌクレオチドにより3つのヘリックスが接続された三角形を形成する(from)。一部の実施例では、ヘリックスのそれぞれは少なくとも4bp(例えば、少なくとも5bp、少なくとも10bp、少なくとも20bp、少なくとも30bp、少なくとも40bp、少なくとも50bp、少なくとも75bp、少なくとも90bp、または少なくとも100bp、例えば、4~100bp、5~75bp、または10~50bp)であり、三角形を形成する対合していないヌクレオチドは少なくとも3nt(例えば、少なくとも4nt、少なくとも5nt、少なくとも10nt、少なくとも20、少なくとも15、少なくとも30、少なくとも40、少なくとも50、または少なくとも60nt、例えば、3~60nt、3~30nt、3~25nt、または5~20nt、例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、2、25、30、35、40、45、50、55または60ヌクレオチド)である。キッシング相互作用はこれらの型のループの任意の2つの間(例えば、それぞれが1つまたは複数のヘリックスを含む2つまたはそれよりも多くの結合ドメインの間)で生じ得る。一部の実施例では、最初のループキッシング相互作用後に2重鎖形成の伸長を可能にするために、一方の二量体形成ドメイン(例えば、第1の二量体形成ドメイン122)内のヘリックスは他方の結合ドメイン(例えば、第2の二量体形成ドメイン154)内に直接対応物を有する。一部の実施例では、ループを生成するためのヘリックスを含有する二量体形成ドメインは、2つまたはそれよりも多くの二量体形成ドメイン(例えば、図6Aの122、154)が相互作用すると単一のキッシングステムループを形成する。一部の実施例では、ヘリックスを含有する二量体形成ドメインは、2つまたはそれよりも多くの二量体形成ドメイン(例えば、図6Aの122、154)が相互作用すると、キッシングループ相互作用のための複数のループを形成する。一部の実施例では、1つまたは複数の二量体形成ドメイン(例えば、図6Aの122)は、バルジ、一塩基バルジ、ミスマッチまたは内部ループ、またはG-Uゆらぎ対が含まれることによって不安定化するヘリックスを含有するが、他方の結合ドメイン(例えば、図6Aの154)とマッチして、最初のキッシング/対合後の2重鎖形成の伸長が選好される。一部の実施例では、1つまたは複数の二量体形成ドメイン(例えば、図6A、6Gの122)は、不安定化されたヘリックスを含有し、これが安定化されると(例えば、テオフィリン切り換えキッシングループ)、第2の二量体形成ドメイン(例えば、図6A、6Gの122)とループ-ループ相互作用(例えば、キッシング/対合)を通じて相互作用することができるループが露出する。
一部の実施例では、これらのステムループは、少なくとも10nt、例えば、少なくとも20nt、少なくとも25nt、少なくとも50nt、少なくとも75nt、または少なくとも100ntの長さ、例えば、10~50nt、20~25nt、10~100nt、10~20nt、または20~40ntの長さを含有する。各二量体形成ドメインは、個々のステムループを少なくとも1個、例えば、個々のステムループを少なくとも2個、少なくとも5個、少なくとも10個、少なくとも15個、または少なくとも20個、例えば、1~20個、2~5個または1~10個含有し得る。
一部の実施例では、コード配列の3~10個の部分を2~9個のキッシングループによって結合する、例えば、3個の部分を2個のキッシングループによって結合する、4個の部分を3個のキッシングループによって結合するなどであり、ここで、2~9個のキッシングループのそれぞれは異なるものである。一部の実施例では、キッシングループは、複数のステムループ、例えば、2~20個のステムループを含む。一部の実施例では、キッシングループ内の複数のステムループのそれぞれは同じものである。一部の実施例では、キッシングループ内の複数のステムループのそれぞれは異なるものである。一部の実施例では、二量体形成ドメインは、1~20個のステムループを含む。一部の実施例では、二量体形成ドメインは、1個のステムループ~20個のステムループを含む。一部の実施例では、二量体形成ドメインは、1個のステムループ~2個のステムループ、1個のステムループ~3個のステムループ、1個のステムループ~4個のステムループ、1個のステムループ~5個のステムループ、1個のステムループ~6個のステムループ、1個のステムループ~7個のステムループ、1個のステムループ~8個のステムループ、1個のステムループ~9個のステムループ、1個のステムループ~10個のステムループ、1個のステムループ~15個のステムループ、1個のステムループ~20個のステムループ、2個のステムループ~3個のステムループ、2個のステムループ~4個のステムループ、2個のステムループ~5個のステムループ、2個のステムループ~6個のステムループ、2個のステムループ~7個のステムループ、2個のステムループ~8個のステムループ、2個のステムループ~9個のステムループ、2個のステムループ~10個のステムループ、2個のステムループ~15個のステムループ、2個のステムループ~20個のステムループ、3個のステムループ~4個のステムループ、3個のステムループ~5個のステムループ、3個のステムループ~6個のステムループ、3個のステムループ~7個のステムループ、3個のステムループ~8個のステムループ、3個のステムループ~9個のステムループ、3個のステムループ~10個のステムループ、3個のステムループ~15個のステムループ、3個のステムループ~20個のステムループ、4個のステムループ~5個のステムループ、4個のステムループ~6個のステムループ、4個のステムループ~7個のステムループ、4個のステムループ~8個のステムループ、4個のステムループ~9個のステムループ、4個のステムループ~10個のステムループ、4個のステムループ~15個のステムループ、4個のステムループ~20個のステムループ、5個のステムループ~6個のステムループ、5個のステムループ~7個のステムループ、5個のステムループ~8個のステムループ、5個のステムループ~9個のステムループ、5個のステムループ~10個のステムループ、5個のステムループ~15個のステムループ、5個のステムループ~20個のステムループ、6個のステムループ~7個のステムループ、6個のステムループ~8個のステムループ、6個のステムループ~9個のステムループ、6個のステムループ~10個のステムループ、6個のステムループ~15個のステムループ、6個のステムループ~20個のステムループ、7個のステムループ~8個のステムループ、7個のステムループ~9個のステムループ、7個のステムループ~10個のステムループ、7個のステムループ~15個のステムループ、7個のステムループ~20個のステムループ、8個のステムループ~9個のステムループ、8個のステムループ~10個のステムループ、8個のステムループ~15個のステムループ、8個のステムループ~20個のステムループ、9個のステムループ~10個のステムループ、9個のステムループ~15個のステムループ、9個のステムループ~20個のステムループ、10個のステムループ~15個のステムループ、10個のステムループ~20個のステムループ、または15個のステムループ~20個のステムループを含む。一部の実施例では、二量体形成ドメインは、1個のステムループ、2個のステムループ、3個のステムループ、4個のステムループ、5個のステムループ、6個のステムループ、7個のステムループ、8個のステムループ、9個のステムループ、10個のステムループ、15個のステムループ、または20個のステムループを含む。一部の実施例では、二量体形成ドメインは、少なくとも1個のステムループ、2個のステムループ、3個のステムループ、4個のステムループ、5個のステムループ、6個のステムループ、7個のステムループ、8個のステムループ、9個のステムループ、10個のステムループ、または15個のステムループを含む。一部の実施例では、二量体形成ドメインは、多くても2個のステムループ、3個のステムループ、4個のステムループ、5個のステムループ、6個のステムループ、7個のステムループ、8個のステムループ、9個のステムループ、10個のステムループ、15個のステムループ、または20個のステムループを含む。
2つまたはそれよりも多くの二量体形成ドメイン(例えば、図6A、6Gの122、154)が、コード配列の組換えを生じさせるために十分に、互いに結合するまたは相互作用することを可能にする他の機構を使用することができる。一部の実施例では、2つまたはそれよりも多くの二量体形成ドメイン(例えば、図6A、6Gの122、154)は、互いに、例えば、非塩基対合相互作用を通じて相互作用することができるか、または、共通の分子(例えば、タンパク質、ATP、金属イオン、補因子、または合成リガンド)に結合することができる、核酸アプタマー(例えば、RNAアプタマー)である。一部の実施例では、2つまたはそれよりも多くの二量体形成ドメイン(例えば、図6A、6Gの122、154)は、互いにはハイブリダイズしないが、両方とも(または全て)同じ架橋核酸分子とハイブリダイズする。一部の実施例では、そのような架橋核酸分子を細胞、組織、または生物体に外因的に提供することができる。一部の実施例では、そのような架橋核酸分子は細胞内部のDNAまたはRNA配列、例えば、転写物またはゲノム遺伝子座であり得る。一部の実施例では、2つまたはそれよりも多くの二量体形成ドメイン(例えば、図6A、6Gの122、154)は互いに、例えば非塩基対合相互作用を通じて相互作用することができる配列である。
分子150は、3’に位置する分子であり、スプライスアクセプター(SA)162および第2の二量体形成ドメイン154を含む。分子150がDNAである実施形態では、分子150は、第2のプロモーター152、続いて、イントロン配列170を含む。プロモーター152をイントロン配列170に作動可能に連結することができる。構成的プロモーターまたは誘導性プロモーターの任意のプロモーター152を使用することができる。一部の実施例では、プロモーター152は、筋組織(例えば、骨格筋組織もしくは心筋組織)、眼の組織(例えば、網膜組織)、内耳組織、肝組織、膵組織、肺組織、皮膚組織、骨、または腎組織において構成的に活性なものなどの組織特異的プロモーターである。一部の実施例では、プロモーター112は、がん細胞、または正常な細胞において構成的に活性なものなどの細胞特異的プロモーターである。一部の実施例では、プロモーター112は、発現させる標的タンパク質の内因性プロモーターであり、一部の実施例では、長い(例えば、少なくとも2500nt、少なくとも3000nt、少なくとも4000nt、少なくとも5000nt、または少なくとも7500nt)。一部の実施例では、プロモーター112は、少なくとも約50ヌクレオチド(nt)の長さ、例えば、少なくとも100nt、少なくとも200nt、少なくとも300nt、少なくとも500nt、少なくとも1000nt、少なくとも2000nt、少なくとも3000nt、少なくとも4000nt、少なくとも5000nt、少なくとも6000nt、少なくとも7000nt、少なくとも8000nt、少なくとも9000nt、または少なくとも10,000nt、例えば、50~10,000nt、100~5000nt、500~5000nt、または50~1000ntの長さである。一部の実施例では、プロモーター112とプロモーター152は同じプロモーターである。他の例では、プロモーター112とプロモーター152は異なるプロモーターである。一部の実施例では、分子150はDNAであり、少なくとも200nt、少なくとも300nt、少なくとも500nt、少なくとも1000nt、少なくとも2000nt、少なくとも3000nt、少なくとも4000nt、少なくとも5000nt、少なくとも6000nt、少なくとも7000nt、または少なくとも8000nt、例えば、200~10,000nt、200~8000nt、500~5000nt、または200~1000ntの長さである。図6Fに示されている通り、分子150がRNAである、例えば、DNAからRNAへの発現後の実施形態では、分子150はもはやプロモーター152を含まず、164は、核酸編集タンパク質のC末端部分のコード配列によってコードされるRNAである。一部の実施例では、分子150はRNAであり、プロモーター152を含まず、少なくとも200nt、少なくとも300nt、少なくとも500nt、少なくとも1000nt、少なくとも2000nt、少なくとも3000nt、少なくとも4000nt、少なくとも5000nt、少なくとも6000nt、少なくとも7000nt、または少なくとも8000nt、例えば、200~10,000nt、200~8000nt、500~5000nt、または200~1000ntの長さである。分子150(プロモーター152を有するまたは有さない)は、天然および/または非天然ヌクレオチドまたはリボヌクレオチドを含み得る。
イントロン配列170は、第2の二量体形成ドメイン154、必要に応じたISE156、分岐点158、ポリピリミジントラクト160、続いて、スプライスアクセプター配列162を含む。一部の実施例では、イントロン配列130は、およそ少なくとも10nt、例えば、少なくとも20nt、少なくとも30nt、少なくとも50nt、少なくとも100nt、少なくとも250nt、少なくとも250nt、少なくとも300nt、少なくとも400nt、または少なくとも500ntの長さ、例えば、20~500、20~250、20~100、50~100、30~500、または50~200ntの長さである。
第2の二量体形成ドメイン154は、分子110の第1の二量体形成ドメイン122配列の逆相補物である配列を有する。したがって、上記の第1の二量体形成ドメイン122と同じ設計の特色および考慮事項が第2の二量体形成ドメイン154にも当てはまる。例えば、一部の実施例では、第2の二量体形成ドメイン154は、第1の二量体形成ドメイン122とキッシングループ相互作用を形成することができるステムループを含有する。一部の実施例では、第2の二量体形成ドメイン154は、RNA組換えと競合する可能性がある潜在スプライスアクセプター(例えば、NNNAGGUNNN;配列番号143)を含まない。一部の実施例では、第2の二量体形成ドメイン154は低多様性配列を有する。一部の実施例では、第2の二量体形成ドメイン154は、1000nt以下、例えば、750nt以下、または500ntを超える、例えば、30~1000nt、30~750nt、30~500nt、50~500nt、50~100nt、または100~250ntである。一部の実施例では、第2の二量体形成ドメイン154は、50ntよりも大きい、例えば、少なくとも51nt、少なくとも100nt、少なくとも150nt、少なくとも161nt、または少なくとも170nt、例えば、51~159nt、51~150nt、51~120nt、51~100nt、または51~70ntである。一部の実施例では、第2の二量体形成ドメイン154は、160ntよりも大きい、例えば、少なくとも161nt、少なくとも170nt、少なくとも180nt、少なくとも200nt、少なくとも300nt、少なくとも400nt、少なくとも500nt、少なくとも600nt、少なくとも700nt、少なくとも800nt、少なくとも900nt、または少なくとも1000nt、例えば、161~100nt、161~500nt、161~300nt、161~200nt、または161~170ntである。一部の実施例では、第2の二量体形成ドメイン154は、50nt未満、例えば、6~49nt、6~45nt、6~40nt、6~30nt、6~20nt、または6~10ntである。
第2の二量体形成ドメイン154に対して3’側は、必要に応じたISE156、分岐点配列158(例えば、分岐点コンセンサス配列)、ポリピリミジントラクト160、続いて、スプライスアクセプター配列162である。ISE156は、分子110のISE120およびDISE118と同様に、スプライソソームを刺激して組換え反応を触媒する。一部の実施例では、イントロン配列150は、少なくとも2つのISE156、例えば、少なくとも3つ、少なくとも4つ、または少なくとも5つのISE156を含む。例示的なスプライシングエンハンサー配列はISE156を含む。一部の実施例では、1つまたは複数のスプライシングエンハンサー配列156をイントロン配列150に含めることにより、組換えまたはスプライシングの効率が少なくとも10%、少なくとも20%、少なくとも30%、少なくとも40%、または少なくとも50%上昇する。使用することができる例示的なスプライシングエンハンサー配列は、配列番号26~136、151、および152、ならびにGGGTTT、GGTGGT、TTTGGG、GAGGGG、GGTATT、GTAACG、GGGGGTAGG、GGAGGGTTT、GGGTGGTGT TTCAT、CCATTT、TTTTAAA、TGCAT、TGCATG、TGTGTT、CTAAC、TCTCT、TCTGT、TCTTT、TGCATG、CTAAC、CTGCT、TAACC、AGCTT、TTCATTA、GTTAG、TTTTGC、ACTAAT、ATGTTT、CTCTG、GGG、GGG(N)2-4GGG、TGGG、YCAY、UGCAUG、または3x(G3~61~7)に提示される。一部の実施例では、ISE156は、存在する場合、およそ少なくとも3nt、少なくとも4nt、少なくとも5nt、少なくとも10nt、例えば、少なくとも20nt、少なくとも25nt、少なくとも30nt、少なくとも40nt、または少なくとも50ntの長さ、例えば、3~10nt、3~11nt、4~11nt、5~11nt、10~50nt、20~25nt、10~25nt、10~20nt、または20~40ntの長さであり得る。一実施例では、ISE156の配列は、GGCUGAGGGAAGGACUGUCCUGGG(配列番号135)、GGGUUAUGGGACC(配列番号136)、TTCAT、CCATTT、TTTTAAA、TGCAT、TGCATG、TGTGTT、CTAAC、TCTCT、TCTGT、またはTCTTTであるかまたはそれを含む。一部の実施例では、ISE120とISE156は同じ配列である。他の例では、ISE120とISE156は異なる配列である。
第2の二量体形成ドメイン154(および存在する場合にはISE156)に対して3’側は、分岐点配列158(例えば、分岐点コンセンサス配列)、ポリピリミジントラクト160、続いて、スプライスアクセプター配列162(例えば、スプライスアクセプターコンセンサス配列)である。分岐点158の配列は、標的細胞または生物体の種のコンセンサス配列に基づく。例えば、ヒトスプライシングに関しては、コンセンサス配列は、YUNAYを含み得るかまたはYUNAYであり得る。したがって、使用される配列はU2依存性イントロンに関してはCUAAC、またはU12依存性イントロンに関してはUUUUCCUUAACU(配列番号144)であり得る。
ポリピリミジントラクト160は、C、U、またはCおよびUヌクレオチドの両方、例えば、CnUyを含み(ここで、n+yは10ヌクレオチドよりも大きいかまたはそれと等しい)、また、3’スプライスジャンクションに対してヌクレオチド-3~-22を含み得る。一部の実施例では、ポリピリミジントラクト160は、少なくとも80%のYヌクレオチド(すなわち、U、C、またはUおよびCの両方)を含む。一部の実施例では、ポリピリミジントラクト160はポリCまたはポリU配列である。一部の実施例では、ポリピリミジントラクト160は少なくとも15個のU、例えば、15~30個または15~20個のUであるポリU配列である。分岐点158およびポリピリミジントラクト160は必須のスプライシング成分である。SA162の配列は、標的細胞または生物体の種のコンセンサス配列に基づくものであり得る。例えば、ヒトでは、SA配列は、U2依存性イントロンに関しては3’スプライス部位に対して-1位および-2位のAGであり、U12依存性イントロンに関してはACまたはAGであり得る。したがって、一部の実施例では、SA162は2ntの長さ、例えば、AGまたはACであり得る。
SA162のすぐ後ろは、5’末端にスプライスジャンクションを有する標的タンパク質164のC末端部分をコードするDNA配列を含むエクソン配列である。核酸編集タンパク質164のC末端部分をコードするDNA配列の5’末端のスプライスジャンクションは分子110、150が導入される標的細胞または生物体において見いだされるコンセンサス配列とマッチし得る。一部の実施例では、スプライスジャンクションは、U2依存性イントロンに関しては3’スプライス部位に対して+1位および+2位のGAもしくはGU、またはU12依存性イントロンに関してはGUもしくはAUであり得る。したがって、一部の実施例では、スプライスジャンクションは2ntの長さであり、C末端コード部分164の5’末端はGA、GU、またはAUである。
分子150のイントロン部分170の後のエクソン配列は、核酸編集タンパク質の第2のコード部分(例えば、半分)、例えば、C末端断片164、および必要に応じたポリアデニル化配列166を含む。したがって、分子150は、核酸編集タンパク質のC末端部分をコードする配列164を含む。分子150の3’末端は、必要に応じて、スプライソソームのアセンブリを促進するポリアデニル化配列166を含む。一部の実施例では、ポリアデニル化配列166は、少なくとも15個のA、例えば、15~30個または15~20個のAのポリA配列である。一部の実施例では、ポリアデニル化配列166とポリアデニル化配列124は同じ配列である。他の例では、ポリアデニル化配列166とポリアデニル化配列124は異なる配列である。
一部の実施例では、N末端コード領域114および/またはC末端コード領域164はネイティブなコード配列である。例えば、コード配列は、本明細書に開示される系が導入される細胞または生物体において見いだされるもの(例えば、ヒト細胞または対象への導入の場合、ヒトコード配列)である。一部の実施例では、例えば、tRNA利用可能性を最大にするため、または潜在スプライス部位を脱富化させるため(例えば、正しくないスプライシングを減少させるかまたは回避し、正しい結合部形成を促進するため)に、N末端コード領域114および/またはC末端コード領域164をネイティブなコード配列と比べてコドン最適化する。一部の実施例では、N末端コード領域114および/またはC末端コード領域164の一部をネイティブなコード配列と比べてコドン最適化する、例えば、各結合部(例えば、114の3’末端、および164の5’末端)に隣接する約200ntをコドン最適化するかまたはエクソンスプライスエンハンサー部位(ESE)(SRタンパク質に結合する)を含有するように変更することができる。例えば、コード配列は、本明細書に開示される系が導入される細胞または生物体において見いだされないものであり得る(例えば、マウス細胞または対象への導入の場合、ヒトコード配列)。
一部の実施例では、N末端コード領域114および/またはC末端コード領域164は、天然のまたは合成のいずれかの性質であるイントロンを含み、スプライスドナー部位とアクセプター部位の両方を含有する。例えば、発現させるコード配列の内部に包埋されたイントロンを配列116の上流(例えば、約200nt上流)、N末端コード領域114の内部に含めることもでき、発現させるコード配列の内部に包埋されたイントロンを配列162の下流(例えば、約200nt下流)およびC末端コード領域164の内部を含めることもでき、あるいはその両方である。そのようなイントロンを含めることを使用して、トランス-スプライシングイントロンドナーおよびアクセプターへのスプライシング機構の付着を刺激することができる。一部の実施例では、そのような(刺激性)イントロンは、110および150を発現させる宿主に由来するものであり得る。一部の実施例では、そのような(刺激性)イントロンは、他の生物体に由来するもの、またはウイルス起源、または合成起源のものであり得る。
一部の実施例では、分子150を安定化するための配列を含めること(例えば、図6Aの150の3’非翻訳領域内の164と166の間に配置する)により、組み換えられた産物の発現効率を少なくとも25%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、または少なくとも75%、例えば、25~95%、25~75%、25~60%、25~50%、40~95%、40~60%、または50~60%上昇させることができる。一部の実施例では、組み換えられた産物の発現効率を増強するための安定化エレメントとしてウッドチャック転写後調節エレメント(WPRE)またはその短縮型(例えば、WPRE3)を3’-UTR内に含める。一部の実施例では、WPRE配列は、GenBank受託番号J04514のnt1093~1684またはWPRE3の247bpの配列に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または100%の配列同一性を有する。
図6Gに示されている通り、一部の実施例では、核酸編集タンパク質を発現させるために使用される系またはDNAは、1つまたは複数のgRNAコード配列140、141、171、172をさらに含み得る。各gRNAは、標的核酸分子と特異的にハイブリダイズする第1の部分(一部の実施例では、少なくとも15nt、少なくとも16nt、少なくとも17nt、少なくとも18nt、少なくとも19nt、少なくとも20nt、少なくとも25nt、少なくとも30nt、少なくとも35nt、少なくとも40nt、例えば、15~50nt、15~40nt、15~30nt、15~25nt、28~32nt、25~35nt、17~24nt、または17~20nt、例えば、約20ntである)、および、核酸編集タンパク質に結合する第2の部分(一部の実施例では、少なくとも20nt、少なくとも30nt、少なくとも40nt、少なくとも50nt、少なくとも60nt、少なくとも70nt、少なくとも75nt、少なくとも80nt、少なくとも90nt、または少なくとも100nt、例えば、20~200nt、25~150nt、30~100nt、15~30nt、30~75nt、または75~100ntである)を含む。一部の実施例では、標的核酸分子と特異的にハイブリダイズするgRNAの部分のGC含量は約40~80%である。一部の実施例では、1つのgRNAコード配列140、141、171、および172は、少なくとも約60nt、少なくとも約75nt、少なくとも約80nt、少なくとも約90nt、少なくとも約100nt、少なくとも約110nt、または少なくとも約120nt、例えば、60~300nt、60~200nt、80~200nt、90~200nt、100~150nt、または100~120ntである。各gRNA140、141、171、172の発現は、それぞれ、gRNAに作動可能に連結したプロモーター142、143、173、174によって駆動することができる。一実施例では、各プロモーター142、143、173、174は同じである。しかし、各ガイド核酸分子140、141、171、172に対するプロモーターは異なってもよい。一部の実施例では、プロモーターは、ポリメラーゼIIIプロモーター、例えば、ヒトまたはマウスU6またはH1プロモーターである。発現されると、得られたgRNAは、発現された核酸エディターと複合体を形成し、それにより、gRNAがハイブリダイズする核酸分子の編集が可能になる。したがって、一部の実施例では、系またはRNA組成物は図6Cに示されている通りであり、N末端コード配列114とC末端コード配列164の結合を示しており、ここで、系またはRNAは、1つまたは複数の追加のRNA分子、すなわち、1つまたは複数の(on or more)gRNA分子(各gRNA140、141、171、172から発現される)を含み得る。一部の実施例では、図6Cの系またはRNA組成物は、互いとハイブリダイズして示されている(shown hybridized to one another)2つのRNA分子を含み、また(a)第1の標的核酸分子に特異的な少なくとも1つの第1のgRNAを含む第3のRNA分子であって、少なくとも1つの第1のgRNAが、核酸編集タンパク質を第1の標的核酸分子上の標的編集部位に方向付ける、第3のRNA分子;(b)(i)核酸編集タンパク質を第1の核酸分子上の同じもしくは異なる標的編集部位に方向付ける、第1の標的核酸分子に特異的な少なくとも1つの第2のgRNA、または(i)核酸編集タンパク質を第2の標的核酸分子上の標的編集部位に方向付ける、第2の標的核酸分子に特異的な少なくとも1つの第2のgRNA、を含む第4のRNA分子;(c)(i)核酸編集タンパク質を第1の核酸分子上の第1のgRNAおよび第2のgRNAと同じもしくは異なる標的編集部位に方向付ける、第1の標的核酸分子に特異的な少なくとも1つの第3のgRNA、(ii)核酸編集タンパク質を第2の核酸分子上の第2のgRNAと同じもしくは異なる標的編集部位に方向付ける、第2の標的核酸分子に特異的な少なくとも1つの第3のgRNA、または(iii)核酸編集タンパク質を第3の標的核酸分子上の標的編集部位に方向付ける、第3の標的核酸分子に特異的な少なくとも1つの第3のgRNA、を含む第5のRNA分子;ならびに(d)(i)核酸編集タンパク質を第1の核酸分子上の第1のgRNA、第2のgRNA、および第3のgRNAと同じもしくは異なる標的編集部位に方向付ける、第1の標的核酸分子に特異的な少なくとも1つの第4のgRNA、(ii)核酸編集タンパク質を第2の核酸分子上の第2のgRNAおよび第3のgRNAと同じもしくは異なる標的編集部位に方向付ける、第2の標的核酸分子に特異的な少なくとも1つの第4のgRNA、(iii)核酸編集タンパク質を第3の標的核酸分子上の第3のgRNAと同じもしくは異なる標的編集部位に方向付ける、第3の標的核酸分子に特異的な少なくとも1つの第4のgRNA、または(iv)核酸編集タンパク質を第4の標的核酸分子上の標的編集部位に方向付ける、第4の標的核酸分子に特異的な少なくとも1つの第4のgRNA、を含む第6のRNA分子のうちの1つまたは複数をさらに含む。
1つまたは複数のgRNAコード配列140、141、171、172は図6Gでは各分子110、150の5’末端および3’末端付近に示されているが、gRNAコード配列140、141、171、172は、各分子110、150内の他の箇所に位置していてもよい。さらに、プロモーター-gRNAコード配列は、N末端およびC末端コード配列114、164の発現の方向に対して順向きであっても逆向きであってもよい。したがって、一部の実施例では、分子110は(a)N末端コード配列114の上流の1つもしくは複数のプロモーター/gRNAコード配列(例えば、142/140)(b)N末端コード配列114の下流の1つもしくは複数のプロモーター/gRNAコード配列(例えば、143/141)、または(c)(a)と(b)の両方を含み、一部の実施例では、分子140は(d)C末端コード配列164の上流の1つもしくは複数のプロモーター/gRNAコード配列(例えば、173/171)(e)C末端コード配列164の下流の1つもしくは複数のプロモーター/gRNAコード配列(例えば、174/172)、または(d)と(e)の両方を含む。
図6Gは、4つのgRNA140、141、171、172の存在を例証する。しかし、系またはDNAは、4つよりも少ないまたは4つよりも多くのgRNAを含んでもよい。一部の実施例では、系、DNA、またはRNAは、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも20、少なくとも25、少なくとも50、少なくとも100、少なくとも500、または少なくとも500のgRNA配列またはコード配列を含む。系、DNAまたはRNA組成物のgRNAは(1)同じ核酸分子(例えば、遺伝子)および標的核酸の同じ標的編集部位を標的とすることができる;(2)同じ核酸分子(例えば、遺伝子)および標的核酸の異なる標的編集部位を標的とすることができる;(3)異なる核酸分子(例えば、遺伝子)を標的とすることができる;または(4)これらの任意の組合せであり得る。一部の実施例では、gRNAコード配列140、141、171、172のうちの1つまたは複数は、2つまたはそれよりも多くのgRNAを含み、より多量のgRNAの発現を可能にするカセットである。一部の実施例では、カセットは、少なくとも2のgRNA、少なくとも3のgRNA、少なくとも4のgRNA、少なくとも5のgRNA、少なくとも10のgRNA、少なくとも20のgRNA、少なくとも50のgRNA、少なくとも100のgRNA、または少なくとも500のgRNAをコードし、ここで、カセット内の各gRNAコード配列の配列は同じであっても異なっていてもよい。
図6Gは、4つのgRNAコード配列140、141、171、172を分子110、150の一部として例証する。しかし、一実施例では、1つまたは複数のgRNAコード配列140、141、171、172は、分子110、150の一部ではなく、その代わりに、1つまたは複数の別々のDNA合成分子、例えば、1つまたは複数の他のベクターから発現される。したがって、一部の系およびDNA実施形態では、1つまたは複数のgRNAをコードする追加の合成DNA分子が提供される(例えば、分子110、150に加えて)。一実施例では、系またはDNAは、プロモーターに作動可能に連結した第1のgRNAをコードする少なくとも1つの追加の合成DNA、例えば、プロモーターに作動可能に連結した1つまたは複数のgRNAをコードする合成DNAをさらに含む。
図6Gは、各分子110、150上の5’末端および3’末端のパルボウイルス末端逆位反復配列(ITR)176、177、178、179の存在を例証する。パルボウイルスITRは、複製開始点(original of replication)を含み、AAVの複製を補助するために使用される。そのようなITRをAAVなどのパルボウイルスパッケージングプラスミドと共に使用することができる。しかし、配列176、177、178、179は必要に応じたものである。一実施例では、パルボウイルスITRはアデノ随伴ウイルス(AAV)ITRである。
図6Cに示されている通り、分子110の第1の二量体形成ドメイン122と分子150の第2の二量体形成ドメイン154の相互作用およびハイブリダイゼーション(塩基対合)により、スプライソソーム成分によるN末端コード配列114およびC末端コード配列164の組換えが可能になる。具体的には、N末端タンパク質コード配列114の3’末端がC末端タンパク質配列164の5’末端と2つの部分の間のシームレス結合部として融合する。図6Gに例示されているものなどの、系またはDNA組成物がgRNAコード配列を含む実施例では、同じ相互作用およびハイブリダイゼーションが起こって、N末端コード配列114およびC末端コード配列164が組み換えられ、機能的な核酸編集タンパク質の発現が可能になる。140、141、171、および172から発現されるgRNA(分子110、150の一部としてであるか、1つまたは複数の異なるDNA分子から発現されるかにかかわらず)は、発現が起こった細胞内に存在し、発現された核酸編集タンパク質と複合体を形成して(例えば、tracrRNAおよびgRNAのDR配列との相互作用によって)、標的核酸分子の核酸編集を可能にする。
図6Dおよび6Hは、核酸編集タンパク質が3つの部分、N末端部分、中間部分、およびC末端部分(各部分は同様のサイズであっても異なるサイズであってもよい)に分けられる系の概略図を示す。したがって、核酸編集タンパク質を任意の数の所望のセグメントまたは部分に分けることができ、分子の妥当な数を本明細書に提示される情報を使用して設計することができることが当業者には理解されよう。そのような実施例では、系は、少なくとも3つの合成核酸分子110、200、および150を含み、ここで、分子110はタンパク質のN末端部分をコードする分子114を含み、分子200はタンパク質の中間部分をコードする分子216を含み、分子150はタンパク質のC末端部分をコードする分子164を含む。各核酸分子110、200、150はDNAで構成され得、翻訳後は、プロモーター112、202、152が存在しないRNAであり得る。一部の実施例では、110、200、150(プロモーター112、202、152を有するまたは有さない)はそれぞれ、少なくとも約100ヌクレオチド/リボヌクレオチド(nt)の長さ、例えば、少なくとも200nt、少なくとも300nt、少なくとも500nt、少なくとも1000nt、少なくとも2000nt、少なくとも3000nt、少なくとも4000nt、少なくとも5000nt、少なくとも6000nt、少なくとも7000nt、または少なくとも8000nt、例えば、200~10,000nt、200~8000nt、500~5000nt、または200~1000ntである。分子110、150、200(プロモーター112、202、152を有するまたは有さない)は、天然および/または非天然ヌクレオチドまたはリボヌクレオチドを含み得る。2つ(またはそれよりも多く)の直交性の二量体形成ドメインを使用することに加えて、2つのイントロンのうちの一方はU2型イントロンであり得、第2のイントロンはU12型イントロンであり得る。U2依存性イントロンおよびU12依存性イントロンのスプライスドナーおよびアクセプターは、この2つの型のイントロン間でコンセンサス認識配列が異なるので、最小の交差反応性を示す。どちらの戦略(すなわち、直交性の二量体形成ドメイン、およびU2型イントロン対U12型イントロン)によっても、3つの断片の正しい順序での組換えが促進される(例えば、第1の断片が最後の断片と直接結合することが回避され、および中間断片がそれ自体で環状化することが回避される)。
図6Dおよび6Hの分子110は、図1Aおよび6Gに関して上に開示されていると同じ特色、すなわち、RNA分子をコードする配列に作動可能に連結したプロモーター112を含み、RNA分子は、5’から3’に:標的タンパク質コード配列の3’末端にスプライスジャンクションを含む、標的タンパク質のN末端部分のコード配列114、SD116、必要に応じたDISE118、必要に応じたISE120、二量体形成ドメイン122、および必要に応じたポリアデニル化配列124を含むが、第1の二量体形成ドメイン122は分子200の第3の二量体形成ドメイン204に対する逆相補性を有する。図6Fに示されている通り、分子110がRNAである、例えば、DNAのRNAへの発現後の実施形態では、分子110は、プロモーター112を含まず、114は、標的タンパク質のN末端部分のコード配列によってコードされるRNAである。分子110(プロモーター112を有するまたは有さない)は、天然および/または非天然ヌクレオチドまたはリボヌクレオチドを含み得る。
図6Dおよび6Hの分子150は、図1Aおよび6Gに関して上に開示されているものと同じ特色、すなわち、RNA分子をコードする配列と作動可能に連結したプロモーター152を含み、RNA分子は、5’から3’に:第2の二量体形成ドメイン154、必要に応じたISE156、分岐点配列158、ポリピリミジントラクト160、スプライスアクセプター(SA)162;および標的タンパク質コード配列の5’末端にスプライスジャンクションを含む、標的タンパク質のC末端部分のコード配列164、および必要に応じてポリアデニル化配列166を含む。第2の二量体形成ドメイン154は分子200の第4の二量体形成ドメイン226に対する逆相補性を有する。分子150(プロモーター152を有するまたは有さない)は、天然および/または非天然ヌクレオチドまたはリボヌクレオチドを含み得る。
分子200によりそれぞれ分子110および分子150の二量体形成ドメイン122、154に対して逆相補性を有する二量体形成ドメインが提供されることによってN末端コード領域114とC末端コード領域164の結合が可能になる。分子200は、2つのイントロン配列230、240を含め、分子110および分子150の両方の特色を含む。具体的には、分子200がDNAである実施形態では、分子220は、RNA分子をコードする配列に作動可能に連結したプロモーター210(プロモーター112および/または152と同じものであっても異なるものであってもよい)を含み、RNA分子は、5’から3’に:第3の二量体形成ドメイン204(図6Dの分子110の第1の二量体形成ドメイン122に対して逆相補物である)、必要に応じたISE206、分岐点208、ポリピリミジントラクト210、SA212、標的タンパク質の中間部分のコード配列216であって、標的タンパク質コード配列の5’末端にスプライスジャンクションを含み、標的タンパク質コード配列の3’末端にスプライスジャンクションを含む、標的タンパク質の中間部分のコード配列216、SD220、必要に応じたDISE222、必要に応じたISE224、第4の二量体形成ドメイン226(図6Dの分子150の第4の二量体形成ドメイン154に対して逆相補物である)、および必要に応じたポリアデニル化配列228を含む。一部の実施例では、分子220はDNAであり、少なくとも200nt、少なくとも300nt、少なくとも500nt、少なくとも1000nt、少なくとも2000nt、少なくとも3000nt、少なくとも4000nt、少なくとも5000nt、少なくとも6000nt、少なくとも7000nt、または少なくとも8000nt、例えば、200~10,000nt、200~8000nt、500~5000nt、または200~1000ntの長さである。分子200がRNAである、例えば、DNAのRNAへの発現後の実施形態では、分子200はもはやプロモーター202を含まず、216は標的タンパク質の中間部分のコード配列によってコードされるRNAである。一部の実施例では、分子200はRNAであり、プロモーター202を含まず、少なくとも200nt、少なくとも300nt、少なくとも500nt、少なくとも1000nt、少なくとも2000nt、少なくとも3000nt、少なくとも4000nt、少なくとも5000nt、少なくとも6000nt、少なくとも7000nt、または少なくとも8000nt、例えば、200~10,000nt、200~8000nt、500~5000nt、または200~1000ntの長さである。分子200(プロモーター202を有するまたは有さない)は、天然および/または非天然ヌクレオチドまたはリボヌクレオチドを含み得る。
図6Hに示されている通り、一部の実施例では、核酸編集タンパク質を発現させるために使用される系またはDNAは、1つまたは複数のgRNAコード配列140、141、171、172、231、232をさらに含み得る。各gRNAは、標的核酸分子と特異的にハイブリダイズする第1の部分(一部の実施例では、少なくとも15nt、少なくとも16nt、少なくとも17nt、少なくとも18nt、少なくとも19nt、少なくとも20nt、少なくとも25nt、少なくとも30nt、少なくとも35nt、少なくとも40nt、例えば、15~50nt、15~40nt、15~30nt、15~25nt、28~32nt、25~35nt、17~24nt、または17~20nt、例えば、約20ntである)、および、核酸編集タンパク質に結合する第2の部分(一部の実施例では、少なくとも20nt、少なくとも30nt、少なくとも40nt、少なくとも50nt、少なくとも60nt、少なくとも70nt、少なくとも75nt、少なくとも80nt、少なくとも90nt、または少なくとも100nt、例えば、20~200nt、25~150nt、30~100nt、15~30nt、30~75nt、または75~100ntである)を含む。一部の実施例では、標的核酸分子と特異的にハイブリダイズするgRNAの部分のGC含量は約40~80%である。一部の実施例では、1つのgRNAコード配列140、141、171、172、231、232は、少なくとも約60nt、少なくとも約75nt、少なくとも約80nt、少なくとも約90nt、少なくとも約100nt、少なくとも約110nt、または少なくとも約120nt、例えば、60~300nt、60~200nt、80~200nt、90~200nt、100~150nt、または100~120ntである。各gRNA140、141、171、172、231、232の発現は、それぞれ、gRNAに作動可能に連結したプロモーター142、143、173、174、233、234によって駆動することができる。一実施例では、各プロモーター142、143、173、174、233、234は同じである。しかし、各ガイド核酸分子140、141、171、172、233、234に対するプロモーターは異なってもよい。一部の実施例では、プロモーター142、143、173、174、233、234は、ポリメラーゼIIIプロモーター、例えば、ヒトまたはマウスU6またはH1プロモーターである。発現されると、得られたgRNAは、発現された核酸エディターと複合体を形成し、それにより、gRNAがハイブリダイズする核酸分子の編集が可能になる。したがって、一部の実施例では、系またはRNA組成物は、N末端コード配列114、中間コード配列216、およびC末端コード配列164の結合を示す図6Eに示されている通りであり、ここで、系またはRNAは、1つまたは複数の追加のRNA分子、すなわち、1つまたは複数のgRNA分子(各gRNA140、141、171、172、231、232から発現される)を含み得る。一部の実施例では、図6Eの系またはRNA組成物は、互いとハイブリダイズして示されている3つのRNA分子を含み、(a)第1の標的核酸分子に特異的な少なくとも1つの第1のgRNAを含む第4のRNA分子であって、少なくとも1つの第1のgRNAが、核酸編集タンパク質を第1の標的核酸分子上の標的編集部位に方向付ける、第4のRNA分子;(b)(i)核酸編集タンパク質を第1の核酸分子上の同じもしくは異なる標的編集部位に方向付ける、第1の標的核酸分子に特異的な少なくとも1つの第2のgRNA、または(i)核酸編集タンパク質を第2の標的核酸分子上の標的編集部位に方向付ける、第2の標的核酸分子に特異的な少なくとも1つの第2のgRNA、を含む第5のRNA分子;(c)(i)核酸編集タンパク質を第1の核酸分子上の第1のgRNAおよび第2のgRNAと同じもしくは異なる標的編集部位に方向付ける、第1の標的核酸分子に特異的な少なくとも1つの第3のgRNA、(ii)核酸編集タンパク質を第2の核酸分子上の第2のgRNAと同じもしくは異なる標的編集部位に方向付ける、第2の標的核酸分子に特異的な少なくとも1つの第3のgRNA、または(iii)核酸編集タンパク質を第3の標的核酸分子上の標的編集部位に方向付ける、第3の標的核酸分子に特異的な少なくとも1つの第3のgRNA、を含む第6のRNA分子;(d)(i)核酸編集タンパク質を第1の核酸分子上の第1のgRNA、第2のgRNA、および第3のgRNAと同じもしくは異なる標的編集部位に方向付ける、第1の標的核酸分子に特異的な少なくとも1つの第4のgRNA(ii)核酸編集タンパク質を第2の核酸分子上の第2のgRNAおよび第3のgRNAと同じもしくは異なる標的編集部位に方向付ける、第2の標的核酸分子に特異的な少なくとも1つの第4のgRNA、(iii)核酸編集タンパク質を第3の標的核酸分子上の第3のgRNAと同じもしくは異なる標的編集部位に方向付ける、第3の標的核酸分子に特異的な少なくとも1つの第4のgRNA、または(iv)核酸編集タンパク質を第4の標的核酸分子上の標的編集部位に方向付ける、第4の標的核酸分子に特異的な少なくとも1つの第4のgRNA、を含む第7のRNA分子;(e)少なくとも1つの第5のgRNAを含む第7のRNA分子、ならびに(f)少なくとも1つの第6のgRNAを含む第8のRNA分子、のうちの1つまたは複数をさらに含む。
1つまたは複数のgRNAコード配列140、141、171、172、231、232が図6Hでは各分子110、150の5’末端および3’末端付近に示されているが、gRNAコード配列140、141、171、172は各分子110、150内の他の箇所に位置していてもよい。さらに、プロモーター-gRNAコード配列は、N末端コード配列、中間コード配列、およびC末端コード配列114、216、164の発現の方向に対して順向きであっても逆向きであってもよい。さらに、プロモーター-gRNAコード配列は、N末端コード配列、中間コード配列、およびC末端コード配列114、216、164の発現の方向に対して順向きであっても逆向きであってもよい。したがって、一部の実施例では、分子110は、(a)N末端コード配列114の上流の1つもしくは複数のプロモーター/gRNAコード配列(例えば、142/140)(b)N末端コード配列114の下流の1つもしくは複数のプロモーター/gRNAコード配列(例えば、143/141)、または(c)(a)と(b)の両方を含み、一部の実施例では、分子140は、(d)C末端コード配列164の上流の1つもしくは複数のプロモーター/gRNAコード配列(例えば、173/171)(e)C末端コード配列164の下流の1つもしくは複数のプロモーター/gRNAコード配列(例えば、174/172)、または(f)(d)と(e)の両方を含み、一部の実施例では、分子200は、(g)中間コード配列216の上流の1つもしくは複数のプロモーター/gRNAコード配列(例えば、233/231)、(h)中間コード配列216の下流の1つもしくは複数のプロモーター/gRNAコード配列(例えば、234/232)、または(i)(g)と(h)の両方を含む。
図6Hは、6つのgRNA140、141、171、172、231、232の存在を例証する。しかし、系またはDNAは、6つよりも少ないまた6つよりも多くのgRNAを含んでもよい。一部の実施例では、系、DNA、またはRNAは、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも20、少なくとも25、少なくとも50、少なくとも100、少なくとも500、または少なくとも500のgRNA配列またはコード配列を含む。系、DNAまたはRNA組成物のgRNAは、(1)同じ核酸分子(例えば、遺伝子)および標的核酸の同じ標的編集部位を標的とするもの;(2)同じ核酸分子(例えば、遺伝子)および標的核酸の異なる標的編集部位を標的とする;(3)異なる核酸分子(例えば、遺伝子)を標的とする;または(4)これらの任意の組合せであり得る。一部の実施例では、gRNAコード配列140、141、171、172、231、232のうちの1つまたは複数は、2つまたはそれよりも多くのgRNAを含み、より多量のgRNAの発現を可能にするカセットである。一部の実施例では、カセットは、少なくとも2のgRNA、少なくとも3のgRNA、少なくとも4のgRNA、少なくとも5のgRNA、少なくとも10のgRNA、少なくとも20のgRNA、少なくとも50のgRNA、少なくとも100のgRNA、または少なくとも500のgRNAをコードし、ここで、カセット内の各gRNAコード配列の配列は同じまたは異なり得る。
図6Hは、4つのgRNAコード配列140、141、171、172、231、232を分子110、150、200の一部として例証する。しかし、一実施例では、1つまたは複数のgRNAコード配列140、141、171、172、231、232は、分子110、150、200の一部ではなく、その代わりに、1つまたは複数の別々のDNA合成分子、例えば、1つまたは複数の他のベクターから発現される。したがって、一部の系およびDNA実施形態では、1つまたは複数のgRNAをコードする追加の合成DNA分子が提供される(例えば、分子110、150、200に加えて)。一実施例では、系またはDNAは、プロモーターに作動可能に連結した第1のgRNAをコードする少なくとも1つの追加の合成DNA、例えば、プロモーターに作動可能に連結した1つまたは複数のgRNAをコードする合成DNAをさらに含む。
図6Hは、各分子110、200、150上の5’末端および3’末端のパルボウイルス末端逆位反復配列(ITR)176、177、178、179、235、236の存在を例証する。そのようなITRをAAVなどのパルボウイルスパッケージングプラスミドと共に使用することができる。しかし、配列176、177、178、179、235、236は必要に応じて存在する。
図6Eに示されている通り、分子110の第1の二量体形成ドメイン122と分子200の第3の二量体形成ドメイン204の相互作用およびハイブリダイゼーション(塩基対合)、および分子200の第4の二量体形成ドメイン226と分子150の第2の二量体形成ドメイン154の相互作用およびハイブリダイゼーション(塩基対合)により、スプライソソーム成分によるN末端コード配列114、中間コード配列216、およびC末端コード配列164の組換えが可能になる。具体的には、3つの部分間のシームレス結合部として、N末端タンパク質コード配列114の3’末端が中間タンパク質配列216の5’末端と融合し、中間タンパク質配列216の3’末端がC末端タンパク質配列164の5’末端と融合する。図6Hに例示されているものなどの、系またはDNA組成物がgRNAコード配列を含む実施例では、同じ相互作用およびハイブリダイゼーションが起こって、N末端コード配列114、中間コード配列216、およびC末端コード配列164が組み換えられ、それにより、機能的な核酸編集タンパク質の発現が可能になる。140、141、171、172、231、232から発現されるgRNA(分子110、150、200の一部としてか、1つまたは複数の異なるDNA分子から発現されるかにかかわらず)は、発現が起こった細胞内に存在し、発現された核酸編集タンパク質と複合体を形成して(例えば、tracrRNAおよびgRNAのDR配列との相互作用によって)、標的核酸分子の核酸編集を可能にする。
代替二量体形成ドメインが図7A~7Bおよび9Aに示されている。すなわち、互いにハイブリダイズする二量体形成ドメイン(例えば、112~204、226~154、図6C、6E)の使用に対する代替として、一実施例では、アプタマー配列を使用する。図7Aに示されている通り、合成核酸分子500、600の両方において、アプタマー配列512、602を二量体形成ドメインの代わりに使用し、アプタマーがそれらと標的(例えば、アデノシン、ドーパミン、またはカフェイン)との相互作用を介して一体となる。そのような実施例では、各分子500、600のアプタマー配列512、602が同じ配列であり得る、またはさらには異なる配列であり得る。図7Aの分子500は、図6Aおよび6Gの分子110に関して上に開示されているものと同じ特色を含み、DNAである場合には、RNA分子をコードする配列に作動可能に連結したプロモーターを含み、RNA分子は、5’から3’に:核酸編集タンパク質コード配列の3’末端にスプライスジャンクションを含む、核酸編集タンパク質のN末端部分のコード配列502、SD506、必要に応じたDISE508、必要に応じたISE510、第1の二量体形成ドメインの代わりに第1のアプタマー512、および必要に応じたポリアデニル化配列を含む。分子500がRNAである実施形態では、例えば、DNA分子から転写された場合、分子500はプロモーターを含まない(例えば図7Aに示されている通り)。同様に、図7Aの分子600は、図6Aおよび6Gの分子150に関して上に開示されているものと同じ特色を含み、DNAである場合には、RNA分子をコードする配列に作動可能に連結したプロモーターを含み、RNA分子は、5’から3’に:第2の二量体形成ドメイン154の代わりにアプタマー602、必要に応じたISE604、分岐点606、ポリピリミジントラクト608、SA610、5’末端にスプライスジャンクションを有する、標的タンパク質のC末端部分614をコードするDNA、および必要に応じたポリアデニル化配列616を含む。分子600がRNAである実施形態では、例えば、DNA分子から転写された場合、分子500はプロモーターを含まない(例えば図7Aに示されている通り)。2つのアプタマー512、602の互いとのまたは分子700との相互作用により、スプライソソーム成分によるN末端コード配列502とC末端コード配列614の組換えが可能になる。具体的には、N末端タンパク質コード配列502の3’末端がC末端タンパク質配列614の5’末端と2つの部分の間のシームレス結合部として融合する。分子500および600は、天然および/または非天然ヌクレオチドまたはリボヌクレオチドを含み得る。
一部の実施例では、アプタマー配列512、602は、同じ標的700に認識する(例えば、特異的に結合する)(図7A)、またはさらには異なる標的を認識し得る(その場合、カフェイン/ドーパミンハイブリッド分子などの、各アプタマーによって特異的に認識される各分子、またはアプタマーによって認識される分子の一部を含む合成分子も本明細書に提示される系と共に投与する)。アプタマーによって認識される例示的な標的としては、細胞タンパク質、小分子、外因性タンパク質、またはRNA分子が挙げられる。
図7Bは、図7Aと同様の例を示す。二量体形成ドメイン(図7Aの512、602)はRNA分子を認識する。図7Bに示されている例では、各ドメインは、標的細胞(核酸編集タンパク質の発現が望まれる細胞)においてのみ発現されるmRNA分子の異なる部分、例えば、がん特異的転写物を認識する。そのような実施例では、RNAで構成されるコード配列(図7Aの502、614)は、二量体形成ドメインによって認識される特定のRNA分子の存在下でのみ組み換えられる。ここで、核酸編集タンパク質はがん細胞においてのみ発現され、正常な細胞では発現されない。そのような系により、核酸編集タンパク質の発現を制御することが可能になる。
図7Cは、例示的な「オフスイッチ」例を提示する。ここで、結合/ハイブリダイゼーションについて競合する抗結合ドメインオリゴヌクレオチド(例えば、RNAまたはDNA)1000(1つが812の逆相補物であり、1つが912の逆相補物である2つの異なる抗結合ドメインオリゴヌクレオチド1000であり得る)を提供することにより、合成核酸分子800、900の二量体形成ドメイン812、902(互いに逆相補物である)のハイブリダイゼーション/結合を低減することができる。したがって、抗結合ドメインオリゴヌクレオチド1000は、それぞれN末端およびC末端コード部分802および914によってコードされるタンパク質の再構成に対する「オフスイッチ」として作用し得る。図7Cの分子800は、RNA分子(したがって、プロモーターを欠く)である図6Aおよび6Gの分子110に関して上に開示されているものと同じ特色を含み、RNA分子は、5’から3’に:核酸編集タンパク質コード配列の3’末端にスプライスジャンクションを含む、核酸編集タンパク質のN末端部分のコード配列802、SD806、必要に応じたDISE808、必要に応じたISE810、二量体形成ドメイン812、および必要に応じたポリアデニル化配列814を含む。同様に、図7Cの分子900は、RNA分子(したがって、プロモーターを欠く)である図6Aおよび6Gの分子150に関して上に開示されているものと同じ特色を含み、RNA分子は、5’から3’に:抗二量体形成ドメイン902、必要に応じたISE904、分岐点906、ポリピリミジントラクト908、SA910、核酸編集タンパク質のC末端部分をコードするRNA914、および必要に応じたポリアデニル化配列916を含む。2つの二量体形成ドメイン812、902は、抗結合ドメインオリゴヌクレオチド1000の存在下では互いに相互作用/ハイブリダイズすることができず、したがって、N末端コード配列802とC末端コード配列914の組換えが妨げられるかまたは低減する。分子800および900は、天然および/または非天然ヌクレオチドまたはリボヌクレオチドを含み得る。
図9Aは、二量体形成のために逆相補配列ハイブリダイゼーションの代わりにキッシングループ相互作用を使用する例示的な二量体形成ドメインを提示する。キッシングループ相互作用は、2つのRNAヘアピンのループ内の塩基が2つのRNA分子間に相互作用する対を形成した場合に形成される。n-yfpと標識された左側の分子は、スプライスドナー部位、下流イントロンスプライシングエンハンサーエレメント、および2つのイントロンスプライシングエンハンサーエレメントを含有する合成イントロンと連結した、yfpのN末端断片をコードするRNA分子を表す。この分子の二量体形成ドメインは3つのRNAヘアピンループを含み、それらはそれぞれがステム(RNAがそれ自体とハイブリダイズする)およびループ(RNAがそれ自体とハイブリダイズしない)で構成される。この例では、二量体形成ドメインは、3つのステムおよびループエレメント(ヘアピンループとも称される)を含有し、三峰性キッシングループ二量体形成ドメインと称される。c-yfpと標識された右側の分子は、yfpのC末端の部分をコードするRNA分子を表す。この分子は、5’から3’まで、3つのヘアピンループのセットを含有する三峰性キッシングループ二量体形成ドメインで構成される。ループ部分は、相補的なn-yfp分子上の対応するループとキッシングループ相互作用を形成し得る。三峰性キッシングループ二量体形成ドメインの後には、3つのイントロンスプライシングエンハンサー配列、分岐点配列、ポリピリミジントラクト、およびスプライスアクセプター部位を含有する合成イントロン配列が続く。合成イントロン配列の後にC末端yfpコード配列が続き、その後、ポリアデニル化シグナルを含有する3’非翻訳領域が続く。図の上部にキッシングループ相互作用の代表的な三次元レンダリングが示されている。このレンダリングは、ねじれた形態のヘアピンループがどのようにループ残基を外側に露出させ、キッシングループ相互作用に利用可能にするかを例示する。
2つの分子が結び付くと、スプライソソームによりトランス-スプライシング反応が媒介され、その結果、N末端ypfコード配列とC末端ypfコード配列が結合され、次いで、それにより全長蛍光タンパク質の発現が可能になる。
図6A~6C、6F、6G、7A、7B、7Cおよび9Aには系に2つの合成核酸分子を使用する(すなわち、核酸編集タンパク質コード配列を2つの合成核酸分子に分割する)実施形態が示されているが、そのような実施形態を、本明細書における教示を使用して2つよりも多くの合成核酸分子、例えば、3個、4個、5個、6個、7個、8個、9個、または10個の合成核酸分子を用いて同様に使用することができることが当業者には理解されよう。
一部の実施例では、系は、アセンブルされていない/組み換えられていない断片の発現を抑制する核酸分子を含む。そのような実施例では、全長コード配列の2つまたはそれよりも多くの部分(例えば、それぞれ図6Aおよび6Gの110の114、150の164)が組み換えられていない場合、核酸分子により、組み換えられなかった全長コード配列の各部分の全長核酸編集タンパク質の発現が抑制される。例えば、そのような抑制性核酸分子は、RNAが核の外に出たらRNAを不安定化すること、翻訳を妨げること、シフトした開始コドンからの翻訳を刺激すること、マイクロRNA標的部位を含有すること、または、翻訳されるとタンパク質活性を抑制するかもしくはタンパク質に分解のためのフラグを立てるタンパク質デグロンもしくは不安定化ドメインを含有することができる。
一実施例では、組み換えられていないRNA分子の不安定化は、自己切断性RNA配列(例えば、ハンマーヘッド型リボザイムまたはHDVリボザイム)を合成イントロンへと、例えば、図6A、6Fまたは6Gのイントロン配列130内の任意の位置に含めることによって実現される。一実施例では、RNA分子の切断により、RNAを安定化するポリA尾部の喪失がもたらされ、それにより、組み換えられていないタンパク質の図6A、6Fまたは6Gのオープンリーディングフレーム114からの発現が抑制され得る。一実施例では、図6A、6Fまたは6Gのコード配列164の一部または全部を含むオープンリーディングフレームの発現の低減をもたらし得る5’末端CAPを切断するために、自己切断性RNA配列を図6A、6Fまたは6Gのイントロン配列170内の任意の位置に含める。一実施例では、自己切断性RNA配列をCsy4標的部位などのRNA切断酵素標的部位で置換する。
一部の実施例では、抑制性核酸分子は、図6A、6Fまたは6Gのオープンリーディングフレーム配列164に対して-1、-2、+1、または+2ヌクレオチドシフトしたオープンリーディングフレームの翻訳を方向付ける開始コドン(ATG)またはコザック増強開始コドン(GCCGCCACCATG(配列番号154)もしくはGCCACCATGもしくはACCATG)を図6A、6Fまたは6Gのイントロン配列170内の任意の位置に含む。一実施例では、このデコイ開始コドン戦略を使用して、抑制されるべき図6A、6Fまたは6Gの配列164のオープンリーディングフレームから離れるように翻訳を方向付けることにより、アセンブルされていない断片の発現を低減または抑制する。
一部の実施例では、抑制性核酸分子は、1つまたは複数のマイクロRNA標的部位を図6A、6Fまたは6Gのイントロン配列130内の任意の位置、および/または図6Aまたは6Fのイントロン配列170内の任意の位置に含む。特定の分子(例えば、図6A、6Fまたは6Gの110または150)が核から送り出されると、マイクロRNA/低分子ヘアピン型RNA依存性分解を受け、それにより、核から送り出された結合していないRNAを分解/抑制することにより、意図されたものではない結合していない断片の発現が抑制され得る。一実施例では、そのようなマイクロRNA標的配列は、図6A、6Fまたは6Gの分子110および150が導入される細胞、または組織、または動物において発現されることが分かっているマイクロRNAと相補的なものであり得る。一実施例では、このマイクロRNA標的配列は、細胞、または組織、または動物に導入される配列と相補的である。一実施例では、そのようなマイクロRNAを、RNAポリメラーゼIII依存性プロモーターから低分子ヘアピン型RNAの形式で発現させることができる。一実施例では、そのようなマイクロRNAをRNAポリメラーゼII依存性プロモーターから発現させ、マイクロRNAプロセシングループに包埋させる(例えば、mir30足場)ことができる。
一部の実施例では、オープンリーディングフレーム(例えば、図6A~6Hの114)からの組み換えられていないタンパク質産物の不安定化を、図6A、6Fまたは6Gのイントロン配列130における終止コドンの出現を枯渇させ、図6A、6Fまたは6Gのイントロン配列130内の任意の位置に配置され、図6A、6Fまたは6Gの配列114から外側に伸びたオープンリーディングフレームとインフレームである、タンパク質に分解のためのフラグを立てることができるインフレームのタンパク質シグナルをコードするRNA配列(例えば、デグロン配列)を追加的に含めることによって実現することができる。一実施例では、デグロン配列は、PEST配列のもの、またはCL1デグロン配列のものであり得る。使用するデグロン配列はプロテアソーム依存性、プロテアソーム非依存性、ユビキチン依存性、またはユビキチン非依存性経路を使用し得る。一実施例では、組み換えられていないタンパク質の不安定化を、同じまたは異なるデグロン配列のいくつかを含めることによって増強する。
一部の実施例では、図6A~6Hのいずれかのオープンリーディングフレーム配列164からの組み換えられていないタンパク質産物の不安定化は、図6A~6Hのいずれかの配列164内のオープンリーディングフレームとインフレームの開始コドン(ATG)、その後にデグロン配列を図6A~6Hのいずれかのイントロン配列170の任意の位置に導入することによって実現される。この例では、デグロン配列はN末端で組み換えられていないタンパク質断片と結合し、組み換えられていないタンパク質断片は分解のフラグを立てられることによって抑制される。
IV.例示的な核酸エディター
図6A~6Hに示されている通り、2つ(またはそれよりも多く)の核酸分子110、200、150を使用する本明細書に開示されるRNA組換え方法を使用して、核酸編集タンパク質を発現させることができる。図6Gおよび6Hに示されている通り、一部の実施例では、核酸分子110、200、150は、1つまたは複数のgRNAコード配列(例えば、140、141、231、323、171、172)をさらに含み、これらの発現はプロモーター(例えば、142、143、322、234、173、174)によって駆動することができる。しかし、一部の実施例では、核酸分子110、200、150はgRNAコード配列を含まず、その代わりに、そのようなgRNAコード配列(およびプロモーター)を1つまたは複数の他の合成DNA分子(例えば、1つまたは複数のベクター)で提供することができる。一部の実施例では、本明細書に提示される系、DNA組成物、またはRNA組成物は、2つまたはそれよりも多くのgRNA分子またはコード配列を含み、それらは、一部の実施例では、1つまたは複数のカセットの一部であり得る。一部の実施例では、本明細書に提示される系、DNA組成物、またはRNA組成物は、2つまたはそれよりも多くのgRNA分子またはコード配列、例えば、2、3、4、5、6、7、8、9または10のgRNA分子またはコード配列を含み、ここで、各gRNAは同じであり得る(例えば、同じgRNAの複数のコピー)、または異なり得る(例えば、特定の標的それぞれに対するgRNA)、またはこれらの組合せ(例えば、複数の標的に対する複数のgRNA)であり得る。
核酸配列を編集する能力を有するタンパク質を、遺伝子配列などのDNAまたはRNA配列を編集するために使用することができる。一部の実施例では、そのようなタンパク質を、(a)標的核酸分子から1つまたは複数のヌクレオチドまたはリボヌクレオチドを欠失させるまたは除去するため、(b)標的核酸分子から1つまたは複数のヌクレオチドまたはリボヌクレオチドを挿入するため、(c)標的核酸分子内の1つまたは複数のヌクレオチドまたはリボヌクレオチドを置換するため、または(a)(b)および(c)の組合せのために使用する。特定の実施例では、核酸編集タンパク質は、RNA誘導型ヌクレアーゼなどのヌクレアーゼである。一実施例では、核酸編集タンパク質はCasヌクレアーゼである。例示的なCasヌクレアーゼとしては、DNA分子(例えば、ゲノム配列)を編集することができるもの、例えば、Cas9およびdCas9、ならびに、RNAを編集することができるもの、例えば、Cas13dおよびdCas13dが挙げられる。他の例示的な核酸編集タンパク質としては、TALENS、およびジンクフィンガーヌクレアーゼが挙げられる。一部の実施例では、核酸編集タンパク質は、別のペプチドまたはタンパク質を含む融合タンパク質である。一実施例では、核酸エディターコード配列(例えば、114、216、164)は、哺乳動物のまたはヒトの細胞に対してコドン最適化される。
一実施例では、核酸エディターとして、DNAを編集するためのCasヌクレアーゼ、例えば、Streptococcus pyogenes由来のCas9(SpCas9)、Staphylococcus aureus由来のCas9(SaCas9)、Streptococcus thermophilus由来のCas9(StCas9)、Neisseria meningitidis由来のCas9(NmCas9)、Francisella novicida由来のCas9(FnCas9)、Campylobacter jejuni由来のCas9(CjCas9)、CasX、CasY、Cas12a(Cpf1)、Cas12b(C2c1)、Cas14aが挙げられる。一実施例では、核酸エディターは、DNAを編集するためのCasヌクレアーゼ、例えば、Cas9ニッカーゼ、高忠実度Cas9(SpCas9-HF-1)、eSPCas9、HypaCas9、FokIと融合したdCas9、xCas9、SpRY、またはSpGである。一実施例では、核酸エディターは、触媒として死んだCas9(dead Cas9)(dCas9)である。一実施例では、核酸エディターは、DNAを編集するためのこれらのCasヌクレアーゼのいずれかと、少なくとも1つの他のペプチドまたはタンパク質(例えば、シトシン塩基エディター、アデニン塩基エディター、または両方)とを含む融合タンパク質である。一部の実施例では、Casヌクレアーゼは融合タンパク質のN末端またはC末端に存在する。
一実施例では、核酸エディターは、RNAを編集するためのCasヌクレアーゼ、例えば、Cas13a、Cas13b、Cas13cおよびCas13dである。一実施例では、核酸エディターは、触媒として死んだCas13a(dCas13a)、Cas13b(dCas13b、例えば、dPspCas13b)、Cas13c(dCas13c)またはCas13d(dCas13d)である。一実施例では、核酸エディターは、これらのDNAを編集するためのCasヌクレアーゼのいずれかと、少なくとも1つの他のペプチドまたはタンパク質(例えば、シトシン塩基エディター、アデニン塩基エディター、または両方)とを含む融合タンパク質である。一部の実施例では、Casヌクレアーゼは融合タンパク質のN末端またはC末端に存在する。
一実施例では、核酸エディターは、不活性な/死んだCas酵素(例えば、dCas9またはdCas13)と、プログラム可能なエピゲノム操作のためのエピジェネティック修飾因子、例えば、p300、LSD1、MQ1、およびTET1を含む融合タンパク質である。一部の実施例では、Casヌクレアーゼは融合タンパク質のN末端またはC末端に存在する。
したがって、一部の実施例では、核酸エディターを2つ(またはそれよりも多く)の部分に分け、ここで、各部分は、異なる核酸分子110、200、150によってコードされる。例えば、タンパク質を2つの区画(例えば、半分または大まかに半分)に分ける場合、核酸エディター114のN末端部分を核酸分子110にコードさせることができ、一方、核酸エディター164のC末端部分を核酸分子150にコードさせることができる。系または組成物がDNAである実施例では、コード配列114、164の発現を駆動するために1つまたは複数のプロモーター112、152を含めることができる。系または組成物がRNAである場合、1つまたは複数のプロモーター112、202、152、gRNAコード配列140、141、231、232、171、172、ならびにそれらの対応するプロモーター142、143、233、234、173、174、およびITR176、177、235、236、176、179は存在しない。一部の実施例では、核酸エディタータンパク質(融合タンパク質の一部であり得る)は、少なくとも500アミノ酸、少なくとも600アミノ酸、少なくとも700アミノ酸、少なくとも800アミノ酸、少なくとも900アミノ酸、少なくとも1000アミノ酸、少なくとも1100アミノ酸、少なくとも1200アミノ酸、または少なくとも1300アミノ酸である。
一部の実施例では、本明細書に開示される方法によって編集されるDNAまたはRNAは、1つまたは複数の変異、例えば、1つまたは複数のヌクレオチドの置換、欠失または付加を含み、ネイティブな/変異していない配列を含むように編集することができる。一実施例では、細胞、例えばヒト細胞、例えば対象内の細胞における標的DNAまたはRNAの発現をモジュレートする(すなわち、アップレギュレートするまたはダウンレギュレートする)ために、そのような方法を使用して、DNAまたはRNA配列を編集する。一実施例では、複数の標的を同時にまたは同時期に編集する(例えば、少なくとも2つの異なる標的、例えば、2、3、4、5、6、7、8、9または10の異なる標的を、例えば、複数のgRNAを使用することによって)。一部の実施例では、複数の標的は、同じ遺伝子内に存在する。他の例では、複数の標的は異なる遺伝子に存在する。標的の例が表1~4に提示されている。
A.CRISPR/Cas9またはCRISPR/dCas9
一部の実施例では、分子110、150のN末端およびC末端コード部分114、164(および3つの分子を使用する場合、200の中間コード部分216)は、遺伝子配列などのDNA配列を編集するためのCasヌクレアーゼをコードする。一部の実施例では、分子110、150のN末端およびC末端コード部分114、164(および3つの分子を使用する場合、200の中間コード部分216)は、Cas9タンパク質(例えば、配列番号208)またはdCas9タンパク質(例えば、配列番号210)をコードする。そのような実施例では、110、150を含むDNA組成物は、1つまたは複数のgRNAコード配列をさらに含み得る。gRNAは、114、164(または114、216、164)によってコードされる特定のCas9またはdCas9タンパク質に基づいて設計され、Cas9またはdCas9タンパク質を標的核酸配列に方向付けるために使用される。DNA編集の実施例におけるgRNAとしては、標的DNAと相補的な部分(例えば、少なくとも10nt、少なくとも12nt、少なくとも13nt、少なくとも14nt、少なくとも15nt、少なくとも16nt、少なくとも17nt、少なくとも18nt、少なくとも20nt、または少なくとも25nt、例えば、14~30nt、例えば、17~20nt)およびtracrRNA(Casヌクレアーゼについての結合足場)を有するcrispr RNA(crRNA)が挙げられる。gRNAのcrRNA部分内の標的化配列を変化させることにより、任意の目的のDNAを標的化することができる。一部の実施例では、gRNAは、死んだガイドRNA(dgRNA)である。一部の実施例では、Cas9またはdCas9タンパク質の使用には、編集されるDNA内の標的遺伝子座/配列にPAM配列が存在する必要がある。1つまたは複数のgRNAを、分子110、分子150、または両方にコードさせる、例えば、プロモーターから発現させることができる。一部の実施例では、1つまたは複数のgRNAを1つまたは複数の追加のDNA分子、例えば、異なるベクターにコードさせることができる。
一部の実施例では、ネイティブなまたは野生型Cas9配列を使用する(例えば、配列番号207および208)。一実施例では、変異したCas9配列を使用する(例えば、配列番号209および210)。一実施例では、変異した「ニッカーゼ」バージョンのCas9(Cas9ヌクレアーゼ酵素のD10A変異体)を使用し、それにより、二本鎖切断の代わりに一本鎖DNA切断を生じさせる。一実施例では、触媒として不活性なCas9(dCas9)を使用して、標的核酸分子の転写に干渉することによって遺伝子発現をノックダウンする。dCas9を追加のリプレッサーペプチドと融合することができる。活性化因子ペプチドと融合した触媒として不活性なCas9(dCas9)により、遺伝子発現を活性化するまたは増加させることができる(例えば、標的遺伝子のアップレギュレーションが望まれる遺伝障害を処置するために)。
一実施例では、114、164もしくは114、216、164によってコードされるCas9タンパク質、または114、164もしくは114、216、164によってコードされる融合タンパク質のCas9部分は、配列番号208に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有し、DNAエンドヌクレアーゼ活性を保持する。一実施例では、114、164もしくは114、216、164のCas9コード配列、または114、164もしくは114、216、164によってコードされる融合タンパク質のCas9コード配列部分は、配列番号207に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有し、DNAエンドヌクレアーゼ活性を有するタンパク質をコードする。
一実施例では、114、164もしくは114、216、164によってコードされるdCas9タンパク質、または114、164もしくは114、216、164によってコードされる融合タンパク質のdCas9部分は、配列番号210に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性、DNAエンドヌクレアーゼ活性が低下しているまたはDNAエンドヌクレアーゼ活性を有さないが、dsDNAに結合することができ、一部の実施例では、1つまたは複数のD10A、E762A、D839A、H840A、N854A、N863A、およびD986A置換を含む。一実施例では、114、164もしくは114、216、164のdCas9コード配列、または114、164もしくは114、216、164によってコードされる融合タンパク質のdCas9コード配列部分は、配列番号209に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有し、DNAエンドヌクレアーゼ活性が低下しているまたはDNAエンドヌクレアーゼ活性を有さないが、dsDNAに結合することができるタンパク質をコードし、一部の実施例では、1つまたは複数のD10A、E762A、D839A、H840A、N854A、N863A、およびD986A置換を有するタンパク質をコードする。
一部の実施例では、114、164または114、216、164によってコードされるCas9またはdCas9は、例えば、Cas9もしくはdCas9のN末端もしくはC末端に、またはCas9もしくはdCas9内の任意の場所に別のタンパク質またはペプチドをさらに含む融合タンパク質である。
本明細書に提示される組成物によってコードされるCas9またはdCas9は、1つまたは複数の核局在化シグナル(NLS)をさらに含み得る。したがって、一部の実施例では、NLS-Cas9またはNLS-dDas9融合タンパク質がコードされる。例示的なNLS配列としては、SPKKKRKVEAS(配列番号218;例えば、AGCCCCAAGAAgAAGAGaAAGGTGGAGGCCAGC、配列番号219によってコードされる)およびGPKKKRKVAAA(SV40ラージT抗原NLS、配列番号220;例えば、ggacctaagaaaaagaggaaggtggcggccgct、配列番号221によってコードされる)が挙げられる。一部の実施例では、NLSは、Cas9またはdCas9タンパク質のN末端に存在する。一部の実施例では、NLSは、Cas9またはdCas9タンパク質のC末端に存在する。一部の実施例では、NLS-Cas9またはNLS-dDas9融合タンパク質は、例えばCas9/dCas9タンパク質のN末端とC末端に、2つまたはそれよりも多くのNLSを含む。一部の実施例では、NLSはCas9/dCas9タンパク質の内部に存在する。
一実施例では、Cas9またはdCas9融合タンパク質は、転写活性化ドメイン、例えば、VP64、P65、MyoD1、HSF1、RTA、CBP、SET7/9、またはこれらの任意の組合せを含む。したがって、一部の実施例では、114、164または114、216、164は、Cas9またはdCas9と、VP64、P65、MyoD1、HSF1、RTA、CBP、およびSET7/9のうちの1つまたは複数とを含む融合タンパク質をコードする。一実施例では、融合タンパク質は、dCas9-VP64である(VP64の1つまたは複数のコピー、例えば、1つ、2つ、3つ、4つ、または5つのVP64タンパク質を含み得る)。一実施例では、融合タンパク質は、dCas9-VP64-P65-Rta(VPR)である。一実施例では、融合タンパク質は、dCas9-CBPである。CBPは、ヒストンアセチルトランスフェラーゼドメインである。転写活性化ドメインの存在を使用して、標的遺伝子の転写を活性化することができる。一部の実施例では、Cas9またはdCas9は、転写活性化ドメイン、例えば、VP64、P65、MyoD1、HSF1、RTA、CBP、SET7/9、またはこれらの任意の組合せをさらに含まない。
一部の実施例では、114、164または114、216、164によってコードされるCas9またはdCas9は、塩基エディター(BE)、例えば、シトシン塩基エディター(CBE)またはアデニン塩基エディター(ABE)をさらに含む融合タンパク質である。CBEは、CからTへの変化(または逆の鎖のGからAへの変化)を媒介する。ABEはAをGに変化させる(または逆の鎖のTをCに変化させる)。
一部の実施例では、114、164または114、216、164によってコードされるCas9またはdCas9は、DNAにおけるT・AからC・Gへの点変異を補正するシトシン塩基エディター(CBE)をさらに含む融合タンパク質である。例示的なCBEは、シチジンデアミナーゼ(例えば、ウミヤツメ由来のもの[AID]、CDA1、またはAPOBEC3G)である。これらの融合物により、DNAがカットされることなくシトシンがウラシルに変換される。続いてDNA複製または修復によってウラシルがチミンに変換される。ウラシルDNAグリコシラーゼ(UGI)のインヒビターをdCas9と融合することにより、UをC変異に戻す塩基除去修復が防止される。一実施例では、Casニッカーゼ-シチジンデアミナーゼ融合タンパク質(BE3)を使用し、それにより、改変されていないDNA鎖にニックが生じ、したがって、細胞には「新たに合成された」ものに見える。したがって、細胞はU含有鎖を鋳型として使用してそのDNAを修復し、それにより、塩基編集をコピーする。一実施例では、融合タンパク質は、シチジンデアミナーゼと融合した高忠実度Cas9バリアントHF-Cas9(HF-BE3)である。一実施例では、Casニッカーゼ-シチジンデアミナーゼ融合タンパク質(ターゲット-AID)を使用する。一実施例では、融合タンパク質HF-Cas9-BE3を使用する。一実施例では、融合タンパク質BE4、BE4max、AncBE4またはAncBE4maxを使用する。一実施例では、融合タンパク質は、ウラシルグリコシラーゼ阻害剤(UGI)の1つ(BE3)または2つ(BE4)の単量体とつながった、機能が損なわれた形態のCas9(D10Aニッカーゼ)と融合したシチジンデアミナーゼを含み、それにより、ヒトゲノムDNAにおける、ウラシル中間体の形成を通じたC・G塩基対のT・A塩基対への変換が可能になる。一実施例では、融合タンパク質は、RrA3F、AmAPOBEC1、SsAPOBEC3B、またはPpAPOBEC1のいずれかを有するBE4を含む。一実施例では、融合タンパク質は、RrA3F[wt、F130L]、AmAPOBEC1、SsAPOBEC3B[wt、R54Q]、またはPpAPOBEC1[wt、H122A、R33A]のいずれかを有するBE4を含む。
一実施例では、114、164または114、216、164によってコードされるCas9またはdCas9は、アデニンをイノシンに変換することができ、それにより、ゲノムDNAにおけるA・TのG・Cへの変換をもたらし得るアデニン塩基エディター(ABE)をさらに含む融合タンパク質である。例示的なABEとしては、ABE6.3、7.8、7.9および7.10、ならびにABEmax、ABE8s(例えば、ABE8e(TadA-8e V106W)Richter et al., Nature biotech. 38: 883-91, 2020を参照されたい)が挙げられる。
一実施例では、114、164または114、216、164によってコードされるCas9またはdCas9は、ABEおよびCBE、例えば、SPACE(Cas9に対してminiABEmax-V82Gおよびターゲット-AIDを使用する)、ならびにシチジンデアミナーゼおよびアデノシンデアミナーゼの両方とCas9ニッカーゼの融合物をさらに含む融合タンパク質である。
一実施例では、114、164または114、216、164によってコードされるCas9またはdCas9は、逆転写酵素をさらに含む融合タンパク質である。一実施例では、dCas9は、dCas9 H840Aニッカーゼである。一部のそのような実施例では、使用されるgRNAは、典型的なgRNAよりも長いプライム編集gRNA(pegRNA)である。pegRNAは、プライマー結合部位(PBS)および逆転写酵素(RT)鋳型配列を含有する伸長したgRNAを含む。
一実施例では、114、164または114、216、164によってコードされるCas9またはdCas9は、バクテリオファージタンパク質Gamをさらに含む融合タンパク質である(例えば、Cas9またはdCas9のN末端に含み、シチジンデアミナーゼ(例えば、AID、CDA1、またはAPOBEC3G)をさらに含み得る)。
一部の実施例では、Cas9ヌクレアーゼを使用する代わりに、CRISPR RNA誘導型Foklヌクレアーゼを使用する(例えば、Tsai et al., Nature Biotechnol. 32: 569-76, 2014を参照されたい)。したがって、一部の実施例では、114、164または114、216、164は、Fok1コード配列を含む。二量体RNA誘導型FokIヌクレアーゼ(RFN)は、ヒト細胞における伸長した配列を認識し、内因性遺伝子を編集することができる。RFN切断活性は、2つのガイドRNA(gRNA)のDNAへの規定された間隔および方向での結合に依存する。
B.CRISPR/Cas13dまたはCRISPR/dCas13d
一部の実施例では、分子110、150のN末端およびC末端コード部分114、164(および3つの分子を使用する場合、200の中間コード部分216)は、RNA配列を編集するためのCas13dタンパク質(例えば、配列番号212、214、222)をコードする。一部の実施例では、分子110、150のN末端およびC末端コード部分114、164(および3つの分子を使用する場合、200の中間コード部分216)は、RNA配列を編集するための死んだCas13d(dCas13d)タンパク質(例えば、配列番号216)をコードする。そのような実施例では、110、150を含むDNA組成物は、1つまたは複数のgRNAコード配列をさらに含み得る。gRNAは、114、164(または114、216、164)によってコードされる特定のCas13dまたはdCas13タンパク質に基づいて設計され、Cas13dまたはdCas13タンパク質を標的核酸配列に方向付けるために使用される。DNA編集の実施例におけるgRNAは、(1)Cas13dまたはdCas13dとgRNAの相互作用を容易にする二次構造を有するダイレクトリピート(DR)領域を含有するcrispr RNA(crRNA)(例えば、少なくとも10nt、少なくとも12nt、少なくとも13nt、少なくとも14nt、少なくとも15nt、少なくとも16nt、少なくとも17nt、少なくとも18nt、少なくとも20nt、少なくとも25nt、少なくとも30nt、または少なくとも36nt、例えば、20~40nt、例えば、30~36nt)、および(2)標的RNAと相補的な部分を有するスペーサー(例えば、少なくとも10nt、少なくとも12nt、少なくとも13nt、少なくとも14nt、少なくとも15nt、少なくとも16nt、少なくとも17nt、少なくとも18nt、少なくとも20nt、少なくとも25nt、少なくとも30nt、または少なくとも32nt、例えば、20~40nt、30~32nt、または25~35nt)を含む。一部の実施例では、gRNA(またはそれをコードするDNA)は、5’末端に一定のダイレクトリピートDRを含み、3’末端に可変のスペーサーを含む。一部の実施例では、プロセシングされていないgRNAは、36ntのDRの後に30~32ntのスペーサー配列が続く。gRNAは、発現された後、Cas13dまたはdCas13または他のRNaseによってプロセシング(短縮/修飾)されて、より短い「成熟」形態になる。gRNAのスペーサー部分内の標的化配列を変化させることにより、任意の目的のRNAを標的化することができる。一部の実施例では、Cas13dまたはdCas13dタンパク質を使用することにより、編集されるRNA内の標的遺伝子座/配列にPAM配列が存在する必要がなくなる。1つまたは複数のgRNAを分子110、分子150、または両方によってコードさせる、例えば、プロモーターから発現させることができる。一部の実施例では、1つまたは複数のgRNAを1つまたは複数の追加のDNA分子、例えば、異なるベクターによってコードさせることができる。DR配列はCas13dタンパク質に依存する。例えば、配列番号212に示されているCas13dを使用する場合、gRNAのDR配列は、
であり得る(配列番号223;下線は、予測される成熟形態の配列を示し、標的RNAと相補的な約10~40ntまたは14~30ntを有するスペーサーがDRの3’末端に付加されていてもよい)。例えば、配列番号214に示されているCas13dを使用する場合、gRNAのDR配列は、
であり得る(配列番号224;下線は、予測される成熟形態の配列を示し、標的RNAと相補的な約10~40ntまたは14~30ntを有するスペーサーがDRの3’末端に付加されていてもよい)。
一部の実施例では、ネイティブなまたは野生型またはネイティブなCas13d配列を使用する(例えば、配列番号207および208)。一実施例では、変異したCas9配列を使用する(例えば、配列番号212、214および222)。一実施例では、変異バージョンのCas13d、例えば、死んだCas13d(一方または両方の変異HEPNドメイン(複数可)を有しており、したがって、RNAをカットすることはできないが、gRNAをプロセシングすることはできる、Cas13の触媒として不活性なもの。配列番号216参照)を使用する。
一実施例では、114、164もしくは114、216、164によってコードされるCas13dタンパク質、または114、164もしくは114、216、164によってコードされる融合タンパク質のdCas13d部分は、配列番号212、214、または222に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有し、RNAエンドヌクレアーゼ活性を保持する。一実施例では、114、164もしくは114、216、164のCas13dコード配列、または114、164もしくは114、216、164によってコードされる融合タンパク質のCas13dコード配列部分は、配列番号211または213に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有し、RNAエンドヌクレアーゼ活性を有するタンパク質をコードする。
一実施例では、114、164もしくは114、216、164によってコードされるdCas13dタンパク質、または114、164もしくは114、216、164によってコードされる融合タンパク質のdCas13d部分は、配列番号216に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性、触媒として不活性であるが、gRNAをプロセシングすることはでき、一部の実施例では、一方または両方のHEPNドメインに変異を含む。一実施例では、114、164もしくは114、216、164のdCas13dコード配列、または114、164もしくは114、216、164によってコードされる融合タンパク質のdCas13dコード配列部分は、配列番号215に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を有し、触媒として不活性であるタンパク質をコードするが、gRNAをプロセシングすることはでき、一部の実施例では、一方または両方のHEPNドメインにおける変異をコードする。
一部の実施例では、114、164または114、216、164によってコードされるCas13dまたはdCas13dは、別のタンパク質またはペプチドを、例えば、as13dまたはdCas13dのN末端またはC末端、またはas13dまたはdCas13d内の任意の場所にさらに含む融合タンパク質である。
本明細書に提示される組成物によってコードされるCas13dまたはdCas13dは、1つまたは複数の核局在化シグナル(NLS)をさらに含み得る。したがって、一部の実施例では、NLS-Cas13dまたはNLS-dDas13d融合タンパク質がコードされる。例示的なNLS配列としては、SPKKKRKVEAS(配列番号218;例えば、AGCCCCAAGAAgAAGAGaAAGGTGGAGGCCAGC、配列番号219によってコードされる)およびGPKKKRKVAAA(SV40ラージT抗原NLS、配列番号220;例えば、ggacctaagaaaaagaggaaggtggcggccgct、配列番号221によってコードされる)が挙げられる。一部の実施例では、NLSは、as13dまたはdCas13dタンパク質のN末端に存在する。一部の実施例では、NLSは、as13dまたはdCas13dタンパク質のC末端に存在する。一部の実施例では、NLS-Cas13dまたはNLS-dDas13d融合タンパク質は、2つまたはそれよりも多くのNLSを、例えば、as13dまたはdCas13dタンパク質のN末端とC末端に含む。一部の実施例では、NLSは、Cas13dまたはdCas13dタンパク質の内部に存在する。
一部の実施例では、114、164または114、216、164によってコードされるCas13dまたはdCas13dは、塩基エディター(BE)、例えば、RNA塩基エディター、例えば、ADAR(RNAに対して作用するアデノシンデアミナーゼ)をさらに含む融合タンパク質である。このタンパク質はアデニンをイノシンに変換する。
C.ジンクフィンガーヌクレアーゼ(ZFN)および転写活性化因子様エフェクターヌクレアーゼ(TALEN)
ジンクフィンガーヌクレアーゼ(ZFN)および転写活性化因子様エフェクターヌクレアーゼ(TALEN)は、非特異的DNA切断ドメイン(例えば、Fok1ヌクレアーゼ)に連結されたプログラム可能な配列特異的DNA結合モジュールで構成されるキメラヌクレアーゼである。ZFNおよびTALENは、特定のゲノム位置における、誤りがちな非相同末端結合または相同組換え修復を刺激するDNA二本鎖切断を誘導することによって広範囲の遺伝子改変を可能にする(総説についてはGaj et al., Trends Biotechnol. 31: 397-405, 2013を参照されたい)。ジンクフィンガータンパク質およびTALEを、酵素的ドメイン、例えば、DNAの組込み、除去、および逆位を触媒する部位特異的ヌクレアーゼ、リコンビナーゼおよびトランスポザーゼと融合することができる。標的化遺伝子付加を必要とする適用に関しては、リコンビナーゼ活性およびトランスポザーゼ活性は、ドナーDNAのゲノム内への挿入を特徴とし、それにより、オフターゲットの効果を直接モニタリングすることが可能になる。
一部の実施例では、分子110、150のN末端およびC末端コード部分114、164(および3つの分子を使用する場合、200の中間コード部分216)は、遺伝子配列などのDNA配列を編集するための少なくとも1つ(例えば、1つまたは2つ)のZFNタンパク質またはZFN融合タンパク質をコードする。そのような実施例では、gRNA配列は含まれない(例えば、140、141、142、143、171、172、173、および174は省かれる)。
ジンクフィンガーヌクレアーゼに基づく操作では、ZFNを使用して、ゲノムDNAを所望の位置でカットする。それぞれが2つの機能性ドメインを含有する2つのZFNを使用する。第1のドメインは、それぞれがDNAの独特の六量体(6bp)配列を認識する少なくとも2つ(例えば、2つ、3つ、4つ、5つまたは6つ)のジンクフィンガーモジュールの鎖で構成されるDNA結合ドメインである。それぞれが≧24bpの特異性を有する2つのフィンガーモジュールをつなぎ合わせてジンクフィンガータンパク質を形成する。第2のドメインは、Foklエンドヌクレアーゼを含むDNA切断ドメイン(例えば、触媒ドメイン)である。DNA結合ドメインとDNA切断ドメインを融合すると、高度に特異的な「ゲノムのはさみ」の対が作り出される。これにより、ゲノムの編集、例えば、遺伝子をダウンレギュレートまたはアップレギュレートすることが可能になる。例えば、本明細書に開示される系および組成物を使用して細胞において2つのZFNを発現させることにより、標的部位の周囲を認識し、ヘテロ二量体形成するZFN対がもたらされる。ZFN対は二本鎖切断を生じさせ、次いで、標的DNAから解離する。対応する修復鋳型がZFN対と共トランスフェクトされていれば、それにより、相同組換えによる標的遺伝子の修復(例えば、欠失、挿入、置換、または他の遺伝的変更を修復する)がもたらされる。したがって、修復鋳型を、変異した遺伝子が修復されるようにまたは遺伝子発現もしくは活性がアップレギュレートされるように設計することができる。対応する修復鋳型がZFN対と共トランスフェクトされていなければ、標的遺伝子の破壊(例えば、非相同末端結合によって導入された変異に起因したダウンレギュレーション)がもたらされる。
いくつかの手法を使用して、表1~4に列挙されている遺伝子(または本明細書に提示される障害に関連する他の遺伝子)などの標的核酸(複数可)に対して特異的なジンクフィンガーヌクレアーゼを設計することができる。最も普及しているものは、ジンクフィンガーユニットと公知の特異性を組み合わせること(モジュラーアセンブリ)を伴う。最良の特異性および最良の細胞の耐性をもたらす組合せを同定するために、細菌、酵母または哺乳動物の細胞を使用する種々の選択技法が開発されている。ジンクフィンガーDNA結合ドメインは、亜鉛イオンの配位によって構造が安定化された結合ドメイン内のアミノ酸配列の領域である1つまたは複数のジンクフィンガーによってDNAに配列特異的に結合するタンパク質ドメインである。ジンクフィンガー結合ドメイン、例えば、ジンクフィンガーの認識へリックスを、所定のヌクレオチド配列に結合するように「操作」することができる(例えば、CXCR4または他の標的に結合するように操作する)。ジンクフィンガー結合ドメインの設計に関する合理的な基準としては、既存のZFN対設計および結合データの情報が保存されているデータベース内の情報を処理するための置換規則およびコンピュータ化されたアルゴリズムの適用が挙げられる。例えば、米国特許第5,789,538号;米国特許第5,925,523号;米国特許第6,007,988号;米国特許第6,013,453号;米国特許第6,140,081号;米国特許第6,200,759号;米国特許第6,453,242号;および米国特許第6,534,261号;ならびにPCT公開第WO95/19431号;同第WO96/06166号;同第WO98/53057号;同第WO98/53058号;同第WO98/53059号;同第WO98/53060号;同第WO98/54311号;同第WO00/27878号;同第WO01/60970号;同第WO01/88197号;同第WO02/016536号;同第WO02/099084および同第WO03/016496号を参照されたい。
一部の実施例では、ZFNの2種の異なるセット(対)を使用し、例えば、一方のセットが1つの標的核酸分子に特異的であり、他方のセットが第2の標的核酸分子に特異的であるようにする。ZFNの2種よりも多くの異なるセット(例えば、少なくとも2種、少なくとも3種、少なくとも4種、または少なくとも5種の異なるセット、例えば、2種、3種、4種、5種、6種、7種、8種、9種、または10種の異なるセット)を使用することができることが当業者には理解されよう。一実施例では、分子の110、150(または110、150、200)の複数の組合せを使用し、ここで、それぞれの組合せで1つのZFNが発現される。
一部の実施例では、分子110、150のN末端およびC末端コード部分114、164(および3つの分子を使用する場合、200の中間コード部分216)は、遺伝子配列などのDNA配列を編集するためのTALENまたはTALEN融合タンパク質をコードする。TALENを設計するための方法(例えば、Bogdanove and Voytas, Science. 333 (6051) : 1843-6, 2011;Cermak et al., Nucleic Acids Res. 39: e82, 2011;Sander et al., Nat Biotechnol. 29 (8): 697-8, 2011を参照されたい)およびTALEN媒介性遺伝子標的化を実施するための方法(例えば、Hockenmeyer et al., Nat Biotechnol 29: 731-734を参照されたい)を本開示に適用することができる。
TALEN法では、任意の所望のDNA配列(例えば、表1~4の遺伝子)に結合するように設計することができるTALE DNA結合ドメインは、植物に感染するある特定の細菌(Xanthomonas)によって分泌されるDNA結合タンパク質であるTALエフェクターに由来する。これらをDNA切断ドメインと組み合わせる。DNA結合ドメインは、12番目および13番目のアミノ酸以外は高度に保存された33~35アミノ酸配列のリピートを含有する。これらの2つの位置は高度に可変性であり(反復可変二残基、RVD)、特定のヌクレオチド認識を有する。このアミノ酸配列とDNA認識の関連性により、妥当なRVDを含有するリピートセグメントの組合せを選択することによって特定のDNA結合ドメインを操作することが可能になっている。例えば、FokIエンドヌクレアーゼの末端に由来する非特異的DNA切断ドメインを使用して、ハイブリッドヌクレアーゼを構築することができる。FokIドメインは二量体として機能し、したがって、標的ゲノム内の部位に対する独特のDNA結合ドメインを有する2つの構築物を適当な向きおよび間隔で使用することにより、優れた特異性が可能になる。TALE DNA結合ドメインとFokI切断ドメインの間のアミノ酸残基の数、および2つの個々のTALEN結合部位の塩基の数はどちらも変動させることができる。
TALENはジンクフィンガーヌクレアーゼを設計するためにも同様に使用される。TALE特異性は、反復可変二残基(RVD)として公知の2つの超可変アミノ酸によって決定される。ジンクフィンガーと同様に、モジュラーTALEリピートを、連続したDNA配列を認識するように連結する。しかし、ジンクフィンガータンパク質とは対照的に、ゲノム内の単一の部位に対応することができるTALEの長いアレイを構築するためにリピート間の連結を再操作する必要はない。
一部の実施例では、TALENの2つの異なるセット(対)を使用し、例えば、一方のセットが1つの標的核酸分子に特異的であり、他方のセットが第2の標的核酸分子に特異的であるようにする。ZFNの2種よりも多くの異なるセット(例えば、少なくとも2種、少なくとも3種、少なくとも4種、または少なくとも5種の異なるセット、例えば、2種、3種、4種、5種、6種、7種、8種、9種、または10種の異なるセット)を使用することができることが当業者には理解されよう。一実施例では、分子の110、150(または110、150、200)の複数の組合せを使用し、ここで、それぞれの組合せで1つのTALENが発現される。
本開示の組成物および方法を、全長核酸エディタータンパク質のin vivoにおける発現を実現するため、例えば、ゲノム点変異を処置するために使用することができる。例えば、第1のRNA分子は、第1の合成RNA二量体形成および組換えドメイン(イントロンおよび結合ドメインである)に付加した核酸エディタータンパク質コード配列の第1の部分を含む。この分子は第1のベクター/プラスミドから発現される。第2のRNA分子は、相補的な第2のRNA二量体形成および組換えドメインに付加した核酸タンパク質コード配列(nucleic protein coding sequence)の第2の部分を含み、第2のベクター/プラスミドから発現される。これらのDNAベクター/プラスミド(第1のDNA分子および第2のDNA分子)の一方または両方は、例えば図6Gに例示されている通り、RNAポリメラーゼIIIプロモーターおよびgRNA/ガイドRNA/gRNA配列で構成されるgRNA/ガイドRNA/gRNA発現カセットを含有し得る。例えば、本開示の組成物は、gRNA/ガイドRNA/gRNA発現カセットを1~8個含み得る。本開示の組成物中のgRNA/ガイドRNA/gRNA発現カセットの数は、1~2個、1~3個、1~4個、1~5個、1~6個、1~7個、1~8個、2~3個、2~4個、2~5個、2~6個、2~7個、2~8個、3~4個、3~5個、3~6個、3~7個、3~8個、4~5個、4~6個、4~7個、4~8個、5~6個、5~7個、5~8個、6~7個、6~8個、または7~8個であり得る。本開示の組成物中のgRNA/ガイドRNA/gRNA発現カセットの数は、1個、2個、3個、4個、5個、6個、7個、または8個であり得る。本開示の組成物中のgRNA/ガイドRNA/gRNA発現カセットの数は、少なくとも1個、2個、3個、4個、5個、6個、または7個であり得る。本開示の組成物中のgRNA/ガイドRNA/gRNA発現カセットの数は、多くて2個、3個、4個、5個、6個、7個、または8個であり得る。2つのRNA分子が同じ標的細胞において発現されると、核酸エディタータンパク質コード転写物の2つの部分が組み換えられて全長核酸エディタータンパク質転写物が形成され、次いでそれがタンパク質に翻訳される。
第1のDNA分子は、5’から3’に、以下の配列を含み得る:AAV末端逆位反復配列;gRNA配列(逆向き);プロモーター(逆向き);プロモーター;5’非翻訳領域;核酸エディターコード配列のN末端部分;第1の二量体形成ドメインを含むおよび/またはそれと重複する合成イントロン配列;ポリアデニル化シグナル配列;プロモーター;gRNA配列;ならびにAAV末端逆位反復配列。第2のDNA分子は、5’から3’に、以下の配列を含み得る:AAV末端逆位反復配列;gRNA配列(逆向き);プロモーター(逆向き)、プロモーター、第2の二量体形成ドメインを含むおよび/またはそれと重複する合成イントロン配列;核酸エディターコード配列のC末端部分;ポリアデニル化シグナル配列;プロモーター;gRNA配列;ならびにAAV末端逆位反復配列。
第1のDNA分子は、5’から3’に、以下の配列を含み得る:AAV末端逆位反復配列;gRNA配列(逆向き);RNAポリメラーゼIIIプロモーター(逆向き);プロモーター;5’非翻訳領域;核酸エディターコード配列のN末端部分;第1の二量体形成ドメインを含むおよび/またはそれと重複する合成イントロン配列;ポリアデニル化シグナル配列;RNAポリメラーゼIIIプロモーター;gRNA配列;ならびにAAV末端逆位反復配列。第2のDNA分子は、5’から3’に、以下の配列を含み得る:AAV末端逆位反復配列;gRNA配列(逆向き);RNAポリメラーゼIIIプロモーター(逆向き)、プロモーター、第2の二量体形成ドメインを含むおよび/またはそれと重複する合成イントロン配列;核酸エディターコード配列のC末端部分;ポリアデニル化シグナル配列;RNAポリメラーゼIIIプロモーター;gRNA配列;ならびにAAV末端逆位反復配列。
第1のDNA分子は、5’から3’に、以下の配列を含み得る:AAV2末端逆位反復配列;gRNA配列(逆向き);RNAポリメラーゼIIIプロモーター(逆向き);プロモーター;5’非翻訳領域;核酸エディターコード配列のN末端部分;第1の二量体形成ドメインを含むおよび/またはそれと重複する合成イントロン配列;ポリアデニル化シグナル配列;RNAポリメラーゼIIIプロモーター;gRNA配列;ならびにAAV2末端逆位反復配列。第2のDNA分子は、5’から3’に、以下の配列を含み得る:AAV2末端逆位反復配列;gRNA配列(逆向き);RNAポリメラーゼIIIプロモーター(逆向き)、プロモーター、第2の二量体形成ドメインを含むおよび/またはそれと重複する合成イントロン配列;核酸エディターコード配列のC末端部分;ポリアデニル化シグナル配列;RNAポリメラーゼIIIプロモーター;gRNA配列;ならびにAAV2末端逆位反復配列。
第1のDNA分子は、5’から3’に、以下の配列を含み得る:AAV2末端逆位反復配列;gRNA配列(逆向き);RNAポリメラーゼIIIプロモーター(逆向き);CMVプロモーター;5’非翻訳領域;核酸エディターコード配列のN末端部分;第1の二量体形成ドメインを含むおよび/またはそれと重複する合成イントロン配列;ポリアデニル化シグナル配列;H1 RNAポリメラーゼIIIプロモーター;gRNA配列;ならびにAAV2末端逆位反復配列。第2のDNA分子は、5’から3’に、以下の配列を含み得る:AAV2末端逆位反復配列;gRNA配列(逆向き);ヒトU6 RNAポリメラーゼIIIプロモーター(逆向き)、CMVプロモーター;第2の二量体形成ドメインを含むおよび/またはそれと重複する合成イントロン配列;核酸エディターコード配列のC末端部分;ポリアデニル化シグナル配列;H1 RNAポリメラーゼIIIプロモーター;gRNA配列;ならびにAAV2末端逆位反復配列。
一部の実施形態では、それぞれ、第1のDNA分子は、dCas9-VPRのN末端部分、プライムエディターのN末端部分、AncBE4のN末端部分、またはABE8eのN末端部分をコードする第1のRNA分子をコードする配列を含み、第2のDNA分子は、dCas9-VPRのC末端部分、プライムエディターのC末端部分、AncBE4のC末端部分、またはABE8eのC末端部分をコードする第1のRNA分子をコードする配列を含む。
一部の実施形態では、dCas9-VPRタンパク質のN末端部分をコードする第1のRNA分子をコードする第1のDNA分子の配列は、配列番号159を含む。一部の実施形態では、配列は、配列番号159に対して約80%~約100%のパーセント配列同一性を有する。一部の実施形態では、配列は、配列番号159に対して約80~約100の%配列同一性を有する。一部の実施形態では、配列は、配列番号159に対して約80~約85、約80~約90、約80~約95、約80~約96、約80~約97、約80~約98、約80~約99、約80~約100、約85~約90、約85~約95、約85~約96、約85~約97、約85~約98、約85~約99、約85~約100、約90~約95、約90~約96、約90~約97、約90~約98、約90~約99、約90~約100、約95~約96、約95~約97、約95~約98、約95~約99、約95~約100、約96~約97、約96~約98、約96~約99、約96~約100、約97~約98、約97~約99、約97~約100、約98~約99、約98~約100、または約99~約100の%配列同一性を有する。一部の実施形態では、配列は、配列番号159に対して約80、約85、約90、約95、約96、約97、約98、約99、または約100の%配列同一性を有する。一部の実施形態では、配列は、配列番号159に対して少なくとも約80、約85、約90、約95、約96、約97、約98、または約99の%配列同一性を有する。一部の実施形態では、配列は、配列番号159に対して多くとも約85、約90、約95、約96、約97、約98、約99、または約100の%配列同一性を有する。
一部の実施形態では、dCas9-VPRタンパク質のC末端部分をコードする第1のRNA分子をコードする第2のDNA分子の配列は、配列番号160を含む。一部の実施形態では、配列は、配列番号160に対して約80%~約100%のパーセント配列同一性を有する。一部の実施形態では、配列は、配列番号160に対して約80~約100の%配列同一性を有する。一部の実施形態では、配列は、配列番号160に対して約80~約85、約80~約90、約80~約95、約80~約96、約80~約97、約80~約98、約80~約99、約80~約100、約85~約90、約85~約95、約85~約96、約85~約97、約85~約98、約85~約99、約85~約100、約90~約95、約90~約96、約90~約97、約90~約98、約90~約99、約90~約100、約95~約96、約95~約97、約95~約98、約95~約99、約95~約100、約96~約97、約96~約98、約96~約99、約96~約100、約97~約98、約97~約99、約97~約100、約98~約99、約98~約100、または約99~約100の%配列同一性を有する。一部の実施形態では、配列は、配列番号160に対して約80、約85、約90、約95、約96、約97、約98、約99、または約100の%配列同一性を有する。一部の実施形態では、配列は、配列番号160に対して少なくとも約80、約85、約90、約95、約96、約97、約98、または約99の%配列同一性を有する。一部の実施形態では、配列は、配列番号160に対して多くとも約85、約90、約95、約96、約97、約98、約99、または約100の%配列同一性を有する。
一部の実施形態では、プライムエディタータンパク質のN末端部分をコードするRNAをコードする配列は、配列番号161を含む。一部の実施形態では、配列は、配列番号161に対して約80%~約100%のパーセント配列同一性を有する。一部の実施形態では、配列は、配列番号161に対して約80~約100の%配列同一性を有する。一部の実施形態では、配列は、配列番号161に対して約80~約85、約80~約90、約80~約95、約80~約96、約80~約97、約80~約98、約80~約99、約80~約100、約85~約90、約85~約95、約85~約96、約85~約97、約85~約98、約85~約99、約85~約100、約90~約95、約90~約96、約90~約97、約90~約98、約90~約99、約90~約100、約95~約96、約95~約97、約95~約98、約95~約99、約95~約100、約96~約97、約96~約98、約96~約99、約96~約100、約97~約98、約97~約99、約97~約100、約98~約99、約98~約100、または約99~約100の%配列同一性を有する。一部の実施形態では、配列は、配列番号161に対して約80、約85、約90、約95、約96、約97、約98、約99、または約100の%配列同一性を有する。一部の実施形態では、配列は、配列番号161に対して少なくとも約80、約85、約90、約95、約96、約97、約98、または約99の%配列同一性を有する。一部の実施形態では、配列は、配列番号161に対して多くとも約85、約90、約95、約96、約97、約98、約99、または約100の%配列同一性を有する。
一部の実施形態では、プライムエディタータンパク質のC末端部分をコードするRNAをコードする配列は、配列番号162を含む。一部の実施形態では、配列は、配列番号162に対して約80%~約100%のパーセント配列同一性を有する。一部の実施形態では、配列は、配列番号162に対して約80~約100の%配列同一性を有する。
一部の実施形態では、配列は、配列番号162に対して約80~約85、約80~約90、約80~約95、約80~約96、約80~約97、約80~約98、約80~約99、約80~約100、約85~約90、約85~約95、約85~約96、約85~約97、約85~約98、約85~約99、約85~約100、約90~約95、約90~約96、約90~約97、約90~約98、約90~約99、約90~約100、約95~約96、約95~約97、約95~約98、約95~約99、約95~約100、約96~約97、約96~約98、約96~約99、約96~約100、約97~約98、約97~約99、約97~約100、約98~約99、約98~約100、または約99~約100の%配列同一性を有する。一部の実施形態では、配列は、配列番号162に対して約80、約85、約90、約95、約96、約97、約98、約99、または約100の%配列同一性を有する。一部の実施形態では、配列は、配列番号162に対して少なくとも約80、約85、約90、約95、約96、約97、約98、または約99の%配列同一性を有する。一部の実施形態では、配列は、配列番号162に対して多くとも約85、約90、約95、約96、約97、約98、約99、または約100の%配列同一性を有する。
一部の実施形態では、AncBE4タンパク質のN末端部分をコードするRNAをコードする配列は、配列番号163を含む。一部の実施形態では、配列は、配列番号163に対して約80%~約100%のパーセント配列同一性を有する。一部の実施形態では、配列は、配列番号163に対して約80~約100の%配列同一性を有する。一部の実施形態では、配列は、配列番号163に対して約80~約85、約80~約90、約80~約95、約80~約96、約80~約97、約80~約98、約80~約99、約80~約100、約85~約90、約85~約95、約85~約96、約85~約97、約85~約98、約85~約99、約85~約100、約90~約95、約90~約96、約90~約97、約90~約98、約90~約99、約90~約100、約95~約96、約95~約97、約95~約98、約95~約99、約95~約100、約96~約97、約96~約98、約96~約99、約96~約100、約97~約98、約97~約99、約97~約100、約98~約99、約98~約100、または約99~約100の%配列同一性を有する。一部の実施形態では、配列は、配列番号163に対して約80、約85、約90、約95、約96、約97、約98、約99、または約100の%配列同一性を有する。一部の実施形態では、配列は、配列番号163に対して少なくとも約80、約85、約90、約95、約96、約97、約98、または約99の%配列同一性を有する。一部の実施形態では、配列は、配列番号163に対して多くとも約85、約90、約95、約96、約97、約98、約99、または約100の%配列同一性を有する。
一部の実施形態では、AncBE4タンパク質のC末端部分をコードするRNAをコードする配列は、配列番号164を含む。一部の実施形態では、配列は、配列番号164に対して約80%~約100%のパーセント配列同一性を有する。一部の実施形態では、配列は、配列番号164に対して約80~約100の%配列同一性を有する。一部の実施形態では、配列は、配列番号164に対して約80~約85、約80~約90、約80~約95、約80~約96、約80~約97、約80~約98、約80~約99、約80~約100、約85~約90、約85~約95、約85~約96、約85~約97、約85~約98、約85~約99、約85~約100、約90~約95、約90~約96、約90~約97、約90~約98、約90~約99、約90~約100、約95~約96、約95~約97、約95~約98、約95~約99、約95~約100、約96~約97、約96~約98、約96~約99、約96~約100、約97~約98、約97~約99、約97~約100、約98~約99、約98~約100、または約99~約100の%配列同一性を有する。一部の実施形態では、配列は、配列番号164に対して約80、約85、約90、約95、約96、約97、約98、約99、または約100の%配列同一性を有する。一部の実施形態では、配列は、配列番号164に対して少なくとも約80、約85、約90、約95、約96、約97、約98、または約99の%配列同一性を有する。一部の実施形態では、配列は、配列番号164に対して多くとも約85、約90、約95、約96、約97、約98、約99、または約100の%配列同一性を有する。
一部の実施形態では、ABE8eタンパク質のN末端部分をコードするRNAをコードする配列は、配列番号165を含む。一部の実施形態では、配列は、配列番号165に対して約80%~約100%のパーセント配列同一性を有する。一部の実施形態では、配列は、配列番号165に対して約80~約100の%配列同一性を有する。一部の実施形態では、配列は、配列番号165に対して約80~約85、約80~約90、約80~約95、約80~約96、約80~約97、約80~約98、約80~約99、約80~約100、約85~約90、約85~約95、約85~約96、約85~約97、約85~約98、約85~約99、約85~約100、約90~約95、約90~約96、約90~約97、約90~約98、約90~約99、約90~約100、約95~約96、約95~約97、約95~約98、約95~約99、約95~約100、約96~約97、約96~約98、約96~約99、約96~約100、約97~約98、約97~約99、約97~約100、約98~約99、約98~約100、または約99~約100の%配列同一性を有する。一部の実施形態では、配列は、配列番号165に対して約80、約85、約90、約95、約96、約97、約98、約99、または約100の%配列同一性を有する。一部の実施形態では、配列は、配列番号165に対して少なくとも約80、約85、約90、約95、約96、約97、約98、または約99の%配列同一性を有する。一部の実施形態では、配列は、配列番号165に対して多くとも約85、約90、約95、約96、約97、約98、約99、または約100の%配列同一性を有する。
一部の実施形態では、ABE8eタンパク質のC末端部分をコードするRNAをコードする配列は、配列番号166を含む。一部の実施形態では、配列は、配列番号166に対して約80%~約100%のパーセント配列同一性を有する。一部の実施形態では、配列は、配列番号166に対して約80~約100の%配列同一性を有する。一部の実施形態では、配列は、配列番号166に対して約80~約85、約80~約90、約80~約95、約80~約96、約80~約97、約80~約98、約80~約99、約80~約100、約85~約90、約85~約95、約85~約96、約85~約97、約85~約98、約85~約99、約85~約100、約90~約95、約90~約96、約90~約97、約90~約98、約90~約99、約90~約100、約95~約96、約95~約97、約95~約98、約95~約99、約95~約100、約96~約97、約96~約98、約96~約99、約96~約100、約97~約98、約97~約99、約97~約100、約98~約99、約98~約100、または約99~約100の%配列同一性を有する。一部の実施形態では、配列は、配列番号166に対して約80、約85、約90、約95、約96、約97、約98、約99、または約100の%配列同一性を有する。一部の実施形態では、配列は、配列番号166に対して少なくとも約80、約85、約90、約95、約96、約97、約98、または約99の%配列同一性を有する。一部の実施形態では、配列は、配列番号166に対して多くとも約85、約90、約95、約96、約97、約98、約99、または約100の%配列同一性を有する。
ABE8eタンパク質のN末端部分をコードする第1のRNA分子をコードし、少なくとも1つのgRNA/ガイドRNA/gRNA発現カセットをさらに含む第1のDNA分子の配列は、配列番号225を含み得る。一部の実施形態では、配列は、配列番号225に対して約80~約100の%配列同一性を有する。一部の実施形態では、配列は、配列番号225に対して約80~約85、約80~約90、約80~約95、約80~約96、約80~約97、約80~約98、約80~約99、約80~約100、約85~約90、約85~約95、約85~約96、約85~約97、約85~約98、約85~約99、約85~約100、約90~約95、約90~約96、約90~約97、約90~約98、約90~約99、約90~約100、約95~約96、約95~約97、約95~約98、約95~約99、約95~約100、約96~約97、約96~約98、約96~約99、約96~約100、約97~約98、約97~約99、約97~約100、約98~約99、約98~約100、または約99~約100の%配列同一性を有する。一部の実施形態では、配列は、配列番号225に対して約80、約85、約90、約95、約96、約97、約98、約99、または約100の%配列同一性を有する。一部の実施形態では、配列は、配列番号225に対して少なくとも約80、約85、約90、約95、約96、約97、約98、または約99の%配列同一性を有する。一部の実施形態では、配列は、配列番号225に対して多くとも約85、約90、約95、約96、約97、約98、約99、または約100の%配列同一性を有する。
ABE8eタンパク質のN末端部分をコードする第2のRNA分子をコードし、少なくとも1つのgRNA/ガイドRNA/gRNA発現カセットをさらに含む第2のDNA分子の配列は、配列番号226を含み得る。一部の実施形態では、配列は、配列番号226に対して約80~約100の%配列同一性を有する。一部の実施形態では、配列は、配列番号226に対して約80~約85、約80~約90、約80~約95、約80~約96、約80~約97、約80~約98、約80~約99、約80~約100、約85~約90、約85~約95、約85~約96、約85~約97、約85~約98、約85~約99、約85~約100、約90~約95、約90~約96、約90~約97、約90~約98、約90~約99、約90~約100、約95~約96、約95~約97、約95~約98、約95~約99、約95~約100、約96~約97、約96~約98、約96~約99、約96~約100、約97~約98、約97~約99、約97~約100、約98~約99、約98~約100、または約99~約100の%配列同一性を有する。一部の実施形態では、配列は、配列番号226に対して約80、約85、約90、約95、約96、約97、約98、約99、または約100の%配列同一性を有する。一部の実施形態では、配列は、配列番号226に対して少なくとも約80、約85、約90、約95、約96、約97、約98、または約99の%配列同一性を有する。一部の実施形態では、配列は、配列番号226に対して多くとも約85、約90、約95、約96、約97、約98、約99、または約100の%配列同一性を有する。
IV.組成物およびキット
本明細書に提示される2つまたはそれよりも多くの合成核酸分子を含む組成物およびキットが提供され、ここで、2つまたはそれよりも多く(例えば、2、3、4、5、6、7、8、9または10)の合成核酸分子は、組み換えられると全長タンパク質をコードする。一部の実施例では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子は、DNAである。一部の実施例では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子は、RNAであり、プロモーター配列を含まない。一実施例では、組成物またはキットは、本明細書に提示される2つの合成核酸分子を含み、2つの合成核酸分子のそれぞれが、核酸編集タンパク質の異なる部分をコードする(すなわち、N末端およびC末端、ここで、2つの分子間で組換えが起こるとコード配列全体が生成される)。一実施例では、組成物またはキットは、本明細書に提示される3つの合成核酸分子を含み、3つの合成核酸分子のそれぞれが、核酸編集タンパク質、例えば、Cas9、dCas9、Cas13d、またはdCas13d(またはこれらのうちのいずれか1つの融合タンパク質)の異なる部分をコードする(すなわち、N末端、中間、およびC末端、ここで、3つの分子間で組換えが起こるとコード配列全体が生成される)。一実施例では、組成物またはキットは、本明細書に提示される4つまたはそれよりも多くの合成核酸分子を含み、4つまたはそれよりも多くの(four of more)合成核酸分子のそれぞれが、核酸編集タンパク質の異なる部分をコードする(すなわち、N末端、第1の中間、第2の中間(および必要に応じて追加の中間)、およびC末端、ここで、4つまたはそれよりも多くの合成核酸分子間で組換えが起こるとコード配列全体が生成される)。一実施例では、組成物またはキットは、本明細書に提示される2つまたはそれよりも多くの合成核酸分子の2つまたはそれよりも多くのセットを含み、合成核酸分子のセットのそれぞれが、異なる核酸編集タンパク質をコードする。一部の実施例では、組成物およびキットは、プロモーターに作動可能に連結していてよい、1つもしくは複数のgRNA(例えば、複数のgRNAを含有するカセット)を含有する核酸分子、または1つもしくは複数のgRNAコード配列をコードする(例えば、複数のgRNAを含有するカセットをコードする)核酸分子をさらに含む。
一実施例では、組成物またはキット中の各合成核酸分子は、AAVまたは他の遺伝子療法用ベクターなどのベクターの一部である。一実施例では、組成物またはキットは、2つまたはそれよりも多くの開示される合成核酸分子を含む細胞、例えば細菌細胞または真核細胞を含み、ここで、合成核酸分子は組み換えられると全長核酸編集タンパク質をコードする。
そのような組成物は、薬学的に許容される担体(例えば、食塩水、水、グリセロール、DMSO、またはPBS)を含み得る。一部の実施例では、組成物は、液体、凍結乾燥粉末、または凍結保存されたものである。
一部の実施例では、キットは、例えば、細胞型特異的取り込みを方向付けるため/エンドソームからの脱出を増強するため/血液脳関門の横断を可能にするなどのために送達系(例えば、リポソーム、粒子、エキソソーム、または微小胞)を含む。一部の実施例では、キットは、細菌細胞、植物細胞、昆虫細胞、または哺乳動物細胞を成長させるための妥当な媒体などの細胞培養培地または成長培地をさらに含む。一部の実施例では、キットのそのようなパーツは別々の容器に入れられている。例示的な容器としてはプラスチックまたはガラスバイアルまたは管が挙げられる。
一部の実施例では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子はそれぞれ別々の容器に入れられている。一部の実施例では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子の2つまたはそれよりも多くのセットは別々の容器に入れられている。
V.処置方法
本明細書に開示される方法および系は、任意の目的の核酸編集タンパク質を、例えば、治療用ウイルス(例えば、AAV)によって発現させるにはタンパク質が大きすぎる場合、または治療用ウイルス(例えば、AAV)によって発現させるには完全な遺伝子配列(例えば、内因性プロモーター+コード配列)が大きすぎる場合に、発現させるために使用することができる。そのような場合では、本明細書に開示される系を使用して核酸編集タンパク質(the nucleic acid editing protein protein)のコード配列を2つまたはそれよりも多くの部分に分け、正しい順序で組み換え、それにより、所望のときと場所でタンパク質を発現させることを可能にすることができる。組成物および系は、編集される(例えば、表1~4のいずれかに列挙されている疾患を処置するために)核酸分子を標的とする1つまたは複数のgRNA(またはプロモーターに作動可能に連結した1つまたは複数のgRNAをコードする核酸分子)をさらに含み得る。
処置される対象は、表1~4に列挙されているものなどの単一遺伝子(monogenetic)障害を有するものなどの任意の哺乳動物であり得る。一実施例では、対象はがんを有する。したがって、ヒト、ネコ、ブタ、ラット、マウス、ウシ、ヤギ、およびイヌを開示される方法で処置することができる。一部の実施例では、対象は6カ月齢未満のヒト乳児である。一部の実施例では、対象は1歳未満のヒト乳児である。一部の実施例では、対象は若年のヒトである。一部の実施例では、対象は少なくとも18歳のヒト成人である。一部の実施例では、対象は女性である。一部の実施例では、対象は男性である。
対象を処置するために使用される本明細書に提示される2つまたはそれよりも多くの合成核酸分子を処置される対象に適合させることができる。したがって、例えば、処置される対象がイヌの場合、核酸編集タンパク質のイヌコード配列を使用することができ、イントロン配列をイヌ細胞における発現のために最適化することができ、処置される対象がヒトの場合、核酸編集タンパク質のヒトコード配列を使用することができ、イントロン配列をヒト細胞における発現のために最適化することができる。
本明細書に提示される2つまたはそれよりも多くの合成核酸分子は、アデノ随伴ベクター(AAV)、例えば、AAV血清型rh.10などのベクターの一部として投与することができる。一部の実施例では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子のうちの1つを含むベクター(例えば、AAV)を、静脈内になど、全身的に投与する。したがって、コード配列を本明細書に提示される2つの合成核酸分子に分ける場合、2つのAAVを投与し、各AAVが本明細書に提示される2つの合成核酸分子のうちの1つを含む。
本明細書に提示される2つまたはそれよりも多くの合成核酸分子を、治療有効量で、例えば、AAVとして投与する。一部の実施例では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子を、ウイルスベクター(例えば、AAV)の一部である場合、対象当たり少なくとも1×1010ゲノムコピー(gc)、少なくとも1×1011gc、少なくとも2×1011gc、少なくとも1×1012gc、少なくとも2×1012gc、少なくとも1×1013gc、少なくとも2×1013gc、または対象当たり少なくとも1×1014gc、例えば、対象当たり2×1010gc、対象当たり2×1011gc、対象当たり2×1012gc、対象当たり2×1013gc、または対象当たり2×1014gcの用量で投与する。一部の実施例では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子を、ウイルスベクター(例えば、AAV)の一部である場合、少なくとも1×1010gc/kg、少なくとも5×1010gc/kg、少なくとも1×1011gc/kg、少なくとも5×1011gc/kg、少なくとも1×1012gc/kg、少なくとも5×1012gc/kg、少なくとも1×1013gc/kg、または少なくとも4×1013gc/kg、例えば、4×1010gc/kg、4×1011gc/kg、4×1012gc/kg、または4×1013gc/kgの用量で投与する。
一部の実施例では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子を、ウイルスベクター(例えば、AAV)の一部として、対象当たり、または対象の処置面積当たり約1×1010ゲノムコピー(gc)~約1×1014の用量で投与する。一部の実施形態では、対象当たり、または対象の処置面積当たりの投与される用量は、約1×1010gc~約1×1014gcである。一部の実施形態では、対象当たり、または対象の処置面積当たりの投与される用量は、約1×1010gc~約1×1011gc、約1×1010gc~約1×1012gc、約1×1010gc~約1×1013gc、約1×1010~約1×1014gc、約1×1011gc~約1×1012gc、約1×1011gc~約1×1013gc、約1×1011gc~約1×1014gc、約1×1012gc~約1×1013gc、約1×1012gc~約1×1014gc、または約13gc~約1×1014gcである。一部の実施形態では、対象当たり、または対象の処置面積当たりの投与される用量は、約1×1010gc、約1×1011gc、約1×1012gc、約1×1013gc、または約1×1014gcである。部の実施形態では、対象当たり、または対象の処置面積当たりの投与される用量は、少なくとも約1×1010gc、約1×1011gc、約1×1012gc、または約1×1013gcである。一部の実施形態では、対象当たり、または対象の処置面積当たりの投与される用量は、多くて約1×1011gc、約1×1012gc、約1×1013gc、または約1×1014gcである。
一部の実施形態では、治療有効量の本開示の系を投与することにより、標的核酸の発現および/または標的核酸からのタンパク質の産生が対照(例えば、無処置)と比較して回復する。一部の実施形態では、対象当たりまたは対象の処置面積当たり約1×1010、2×1010、3×1010、4×1010、5×1010、6×1010、7×1010、8×1010、9×1010、または1×1011gcを含めた、約1×1010gc~約1×1011を含む、約1×1010gc~約1×1014gcの用量を含む治療有効量の本開示の系を投与することにより、標的核酸の発現および/または標的核酸からのタンパク質の産生が対照(例えば、無処置)と比較して回復する。一部の実施形態では、対照発現と比較した発現の回復は、約20%~100%、またはそれよりも大きい。一部の実施形態では、対照発現と比較した発現の回復は、約20%~約100%、またはそれよりも大きい。一部の実施形態では、対照発現と比較した発現の回復は、約20%~約30%、約20%~約40%、約20%~約50%、約20%~約60%、約20%~約70%、約20%~約75%、約20%~約80%、約20%~約85%、約20%~約90%、約20%~約95%、約20%~約100%、約30%~約40%、約30%~約50%、約30%~約60%、約30%~約70%、約30%~約75%、約30%~約80%、約30%~約85%、約30%~約90%、約30%~約95%、約30%~約100%、約40%~約50%、約40%~約60%、約40%~約70%、約40%~約75%、約40%~約80%、約40%~約85%、約40%~約90%、約40%~約95%、約40%~約100%、約50%~約60%、約50%~約70%、約50%~約75%、約50%~約80%、約50%~約85%、約50%~約90%、約50%~約95%、約50%~約100%、約60%~約70%、約60%~約75%、約60%~約80%、約60%~約85%、約60%~約90%、約60%~約95%、約60%~約100%、約70%~約75%、約70%~約80%、約70%~約85%、約70%~約90%、約70%~約95%、約70%~約100%、約75%~約80%、約75%~約85%、約75%~約90%、約75%~約95%、約75%~約100%、約80%~約85%、約80%~約90%、約80%~約95%、約80%~約100%、約85%~約90%、約85%~約95%、約85%~約100%、約90%~約95%、約90%~約100%、または約95%~約100%、またはそれよりも大きい。一部の実施形態では、対照発現と比較した発現の回復は、約20%、約30%、約40%、約50%、約60%、約70%、約75%、約80%、約85%、約90%、約95%、または約100%、またはそれよりも大きい。一部の実施形態では、対照発現と比較した発現の回復は、少なくとも約20%、約30%、約40%、約50%、約60%、約70%、約75%、約80%、約85%、約90%、または約95%、またはそれよりも大きい。一部の実施形態では、対照発現と比較した発現の回復は、多くとも約30%、約40%、約50%、約60%、約70%、約75%、約80%、約85%、約90%、約95%、または約100%、またはそれよりも大きい。一部の実施形態では、回復するタンパク質はジストロフィンであり、処置領域は筋肉または筋肉群である。一部の実施形態では、筋肉または筋肉群は、試験動物、例えばマウスの後肢の前脛骨筋(TA)である。一部の実施形態では、投与は、注射(例えば、皮下、筋肉内、皮内、腹腔内、髄腔内、腫瘍内、骨内、または静脈内)によるものである。
一部の実施形態では、治療有効量の本開示の系を投与することにより、標的核酸の発現および/または標的核酸からのタンパク質の産生が対照(例えば、無処置)と比較して低減する。一部の実施形態では、対象当たりまたは対象の処置面積当たり約1×1010、2×1010、3×1010、4×1010、5×1010、6×1010、7×1010、8×1010、9×1010、または1×1011gcを含めた、約1×1010gc~約1×1011を含む、約1×1010gc~約1×1014gcの用量を含む治療有効量の本開示の系を投与することにより、標的核酸の発現および/または標的核酸からのタンパク質の産生が対照(例えば、無処置)と比較して低減する。一部の実施形態では、対照発現と比較した発現の低減は約20%~100%である。一部の実施形態では、対照発現と比較した発現の低減は約20%~約100%である。一部の実施形態では、対照発現と比較した発現の低減は約20%~約30%、約20%~約40%、約20%~約50%、約20%~約60%、約20%~約70%、約20%~約75%、約20%~約80%、約20%~約85%、約20%~約90%、約20%~約95%、約20%~約100%、約30%~約40%、約30%~約50%、約30%~約60%、約30%~約70%、約30%~約75%、約30%~約80%、約30%~約85%、約30%~約90%、約30%~約95%、約30%~約100%、約40%~約50%、約40%~約60%、約40%~約70%、約40%~約75%、約40%~約80%、約40%~約85%、約40%~約90%、約40%~約95%、約40%~約100%、約50%~約60%、約50%~約70%、約50%~約75%、約50%~約80%、約50%~約85%、約50%~約90%、約50%~約95%、約50%~約100%、約60%~約70%、約60%~約75%、約60%~約80%、約60%~約85%、約60%~約90%、約60%~約95%、約60%~約100%、約70%~約75%、約70%~約80%、約70%~約85%、約70%~約90%、約70%~約95%、約70%~約100%、約75%~約80%、約75%~約85%、約75%~約90%、約75%~約95%、約75%~約100%、約80%~約85%、約80%~約90%、約80%~約95%、約80%~約100%、約85%~約90%、約85%~約95%、約85%~約100%、約90%~約95%、約90%~約100%、または約95%~約100%である。一部の実施形態では、対照発現と比較した発現の低減は約20%、約30%、約40%、約50%、約60%、約70%、約75%、約80%、約85%、約90%、約95%、または約100%である。一部の実施形態では、対照発現と比較した発現の低減は少なくとも約20%、約30%、約40%、約50%、約60%、約70%、約75%、約80%、約85%、約90%、または約95%である。一部の実施形態では、対照発現と比較した発現の低減は多くとも約30%、約40%、約50%、約60%、約70%、約75%、約80%、約85%、約90%、約95%、または約100%である。
血液中のAAVカプシド特異的T細胞などの有害な症状が発生した場合、コルチコステロイドを投与することができる(例えば、Nathwani et al., N Engl J Med. 365 (25): 2357-65, 2011を参照されたい)。
本明細書に開示される方法を用いて処置することができる疾患としては、任意の血液の遺伝子疾患(例えば、鎌状赤血球症、原発性免疫不全疾患)、HIV(例えばHIV-1)、および血液悪性腫瘍またはがんが挙げられる。原発性免疫不全疾患およびそれらの対応する変異の例としては、Al-Herz et al. (Frontiers in Immunology, volume 5, article 162, April 22, 2014、その全体が参照により本明細書に組み込まれる)に列挙されているものが挙げられる。血液悪性腫瘍またはがんは、血液、骨髄、およびリンパ節に影響を及ぼす腫瘍である。例としては、白血病(例えば、急性リンパ芽球性白血病、急性骨髄性白血病、慢性リンパ球性白血病、慢性骨髄性白血病、急性単球性白血病)、リンパ腫(例えば、ホジキンリンパ腫および非ホジキンリンパ腫)、および骨髄腫が挙げられる。一部の実施例では、疾患は単一遺伝子疾患である。表1に本明細書に開示される系および方法によって標的化することができる例示的な障害および遺伝子の一覧を提示する。さらなる例がrarediseases.info.nih.gov/diseases/diseases-by-category/5/congenital-and-genetic-diseases(一覧が参照により本明細書に組み込まれる)に提示される。タンパク質の欠失(例えば、劣性変異)またはタンパク質の不足によって引き起こされるあらゆる遺伝子疾患に本明細書に開示される系および方法が有益であり得る。遺伝子のコード領域が比較的小さい場合、本明細書に開示される系および方法は、遺伝子発現を妥当な細胞型に妥当なレベルで方向付けるための組織特異的プロモーターまたは特異的非コードRNAセグメントなどの調節配列を付加するために有用である。
表4: 例示的な障害および対応する変異
本明細書に開示される方法および系の使用を、表1に列挙されている障害のいずれかまたは他の公知の遺伝障害を処置するために使用することができる。本明細書に開示される方法は、がん細胞において毒素またはチミジンキナーゼなどの治療用タンパク質を発現させることが有益であり得るがんなどの他の障害を処置するためにも使用することができる。全長チミジンキナーゼを発現する本明細書に提示される2つまたはそれよりも多くの合成分子を対象に投与する場合、対象にガンシクロビルも投与する。処置により、障害の全ての特徴を100%除去する必要はないが、それらを低減することができる。特定の実施例を以下に提示するが、この教示に基づいて、他の障害の症状に同様に影響を及ぼすことができることが理解されよう。例えば、本明細書に開示される方法を使用して、対象によって発現されないかもしくは発現が低減しているタンパク質の発現を増大させること、または対象によって望ましくなく発現されるかもしくは発現が低減しているタンパク質の発現を低減することができる。例えば、本明細書に開示される方法を使用して、遺伝子疾患の望ましくない影響を処置または低減することができる。
例えば、本明細書に開示される方法および系により、ヘモグロビンの全長野生型β-グロビン鎖を発現させることによって鎌状赤血球症の望ましくない影響を処置または低減することができる。一実施例では、本明細書に開示される方法により、レシピエント対象における鎌状赤血球症の症状(例えば、血液中の鎌状赤血球の存在、疼痛、虚血、壊死、貧血、血管閉塞性発作、無形成発作、脾臓血球貯留発作(splenic sequestration crisis)、および溶血性発作のうちの1つまたは複数)が低減し、例えば、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも70%、または少なくとも90%低減する(治療用核酸分子を投与しない場合と比較して)。一実施例では、本明細書に開示される方法により、レシピエント対象における鎌状赤血球の数が減少し、例えば、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも70%、少なくとも90%、または少なくとも95%減少する(治療用核酸分子を投与しない場合と比較して)。
例えば、本明細書に開示される方法および系により、全長野生型第V因子ライデンまたはプロトロンビン遺伝子を発現させることによって血栓形成傾向の望ましくない影響を処置または低減することができる。一実施例では、本明細書に開示される方法により、レシピエント対象(recipie7nt subject)における血栓形成傾向の症状(例えば、深部静脈血栓症などの血栓症、肺塞栓症、静脈血栓塞栓症、腫脹、胸痛、動悸のうちの1つまたは複数)が低減し、例えば、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも70%、または少なくとも90%の低減である(治療用核酸分子を投与しない場合と比較して)。一実施例では、本明細書に開示される方法により、レシピエント対象における凝固因子の活性が低下し、例えば、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも70%、少なくとも90%、または少なくとも95%の低下である(治療用核酸分子を投与しない場合と比較して)。
例えば、本明細書に開示される方法および系により、全長野生型CD40リガンド遺伝子を発現させることによってCD40リガンド欠損症の望ましくない影響を処置または低減することができる。一実施例では、本明細書に開示される方法により、レシピエント対象におけるCD40リガンド欠損症(例えば、血清中IgMの上昇、他の免疫グロブリンの低血清中レベル、日和見感染症、自己免疫および悪性腫瘍のうちの1つまたは複数)の症状が低減し、例えば、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも70%、または少なくとも90%の低減である(治療用核酸分子を投与しない場合と比較して)。一実施例では、本明細書に開示される方法により、レシピエント対象におけるCD40リガンド欠損の量または活性が増大し、例えば、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも70%、少なくとも90%、少なくとも100%、少なくとも200%または少なくとも500%の増大である(治療用核酸分子を投与しない場合と比較して)。
例えば、本明細書に開示される方法を使用して、遺伝子欠陥に起因する原発性免疫不全疾患の望ましくない影響を処置または低減することができる。例えば、本明細書に開示される方法および系(例えばAAVを使用し、2つまたはそれよりも多くの合成核酸分子を使用して対象において欠如しているかまたは欠陥がある機能的タンパク質を発現させることができる)により、原発性免疫不全疾患の望ましくない影響を処置または低減することができる。一実施例では、本明細書に開示される方法により、レシピエント対象における原発性免疫不全疾患の症状(例えば、細菌感染、真菌感染、ウイルス感染、寄生虫感染、リンパ腺腫脹、脾腫、創傷、および体重減少のうちの1つまたは複数)が低減し、例えば、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも70%、または少なくとも90%の低減である(治療用核酸分子を投与しない場合と比較して)。一実施例では、本明細書に開示される方法により、原発性免疫不全障害を有するレシピエント対象における免疫細胞(例えば、CD8細胞などのT細胞)の数が増加し、例えば、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも70%、少なくとも90%、少なくとも95%、少なくとも100%、少なくとも200%、少なくとも300%、少なくとも400%、または少なくとも500%の増加である(治療用核酸分子を投与しない場合と比較して)。一実施例では、本明細書に開示される方法により、原発性免疫不全障害を有するレシピエント対象における感染症(例えば、細菌、ウイルス、真菌、またはこれらの組合せ)の数が一定期間にわたって(例えば、1年を超えて)減少し、例えば、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも70%、少なくとも90%、または少なくとも95%の減少である(治療用核酸分子を投与しない場合と比較して)。
例えば、本明細書に開示される方法を使用して、単一遺伝子障害の望ましくない影響を処置または低減することができる。例えば、本明細書に開示される方法(例えばAAVを使用し、2つまたはそれよりも多くの合成核酸分子を使用して対象において欠如しているかまたは欠陥がある機能的タンパク質を発現させることができる)により、単一遺伝子障害の望ましくない影響を処置または低減することができる。一実施例では、本明細書に開示される方法により、レシピエント対象における単一遺伝子障害の症状が低減し、例えば、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも70%、または少なくとも90%の低減である(治療用核酸分子を投与しない場合と比較して)。一実施例では、本明細書に開示される方法により、単一遺伝子障害を有するレシピエント対象では通常発現されない正常なタンパク質の量が増加し、例えば、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも70%、少なくとも90%、少なくとも95%、少なくとも100%、少なくとも200%、少なくとも300%、少なくとも400%、または少なくとも500%の増加である(治療用核酸分子を投与しない場合と比較して)。
例えば、本明細書に開示される方法を使用して、レシピエント対象における血液悪性腫瘍の望ましくない影響を処置または低減することができる。一実施例では、本明細書に開示される方法により、レシピエント対象(例えば、白血病を有する対象)における異常な白血球(例えばB細胞)の数が減少し、例えば、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも70%、または少なくとも90%の減少である(本明細書に開示される治療を施行しない場合と比較して)。一実施例では、本明細書に開示される治療の施行は、リンパ腫の望ましくない影響を処置または低減する、例えば、リンパ腫のサイズ、リンパ腫の体積、リンパ腫の成長速度、リンパ腫の転移を低減するために使用することができ、例えば、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも70%、または少なくとも90%の低減である(本明細書に開示される治療を施行しない場合と比較して)。一実施例では、本明細書に開示される治療の施行は、多発性骨髄腫の望ましくない影響を処置または低減する、例えば、レシピエント対象における異常な形質細胞の数を減少させるために使用することができ、例えば、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも70%、または少なくとも90%の減少である(本明細書に開示される治療を施行しない場合と比較して)。
例えば、本明細書に開示される方法を使用して、レシピエント対象における遺伝子欠陥に起因するものなどの悪性腫瘍の望ましくない影響を処置または低減することができる。一実施例では、本明細書に開示される方法により、レシピエント対象(例えば、本明細書において列挙されているがんを有する対象)におけるがん細胞の数、腫瘍のサイズ、腫瘍の体積、または転移の数が低減し、例えば、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも70%、または少なくとも90%の低減である(本明細書に開示される治療を施行しない場合と比較して)。一実施例では、本明細書に開示される治療の施行は、リンパ腫の望ましくない影響を処置または低減する、例えば、腫瘍のサイズ、腫瘍の体積、がんの成長速度、がんの転移を低減するために使用することができ、例えば、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも70%、または少なくとも90%の低減である(本明細書に開示される治療を施行しない場合と比較して)。
例えば、本明細書に開示される方法を使用して、レシピエント対象における遺伝子欠陥に起因する神経疾患の望ましくない影響を処置または低減することができる。一実施例では、本明細書に開示される方法により、レシピエント対象(例えば、上に列挙されている神経疾患を有する対象)における神経機能が増大し、例えば、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも70%、少なくとも90%、少なくとも100%、少なくとも200%、少なくとも300%、少なくとも400%、または少なくとも500%の増大である(本明細書に開示される治療を施行しない場合と比較して)。
VI.例示的な実施形態
1 核酸編集タンパク質を発現させるための組成物であって、
(a)第1のRNA分子であって、5’から3’に、
(i)前記核酸編集タンパク質のN末端部分のコード配列;
(ii)スプライスドナー;および
(iii)第1の二量体形成ドメイン
を含む、第1のRNA分子;ならびに
(b)第2のRNA分子であって、5’から3’に、
(i)前記第1の二量体形成ドメインに結合する第2の二量体形成ドメイン;
(ii)分岐点配列;
(iii)ポリピリミジントラクト;
(iv)スプライスアクセプター;および
(v)前記核酸編集タンパク質のC末端部分のコード配列
を含む、第2のRNA分子;
(c)必要に応じて、第1の標的核酸分子に特異的な少なくとも1つの第1のガイドRNA(gRNA)を含む第3のRNA分子であって、前記少なくとも1つの第1のgRNAが、前記核酸編集タンパク質を前記第1の標的核酸分子上の標的編集部位に方向付ける、第3のRNA分子;
(d)必要に応じて、(i)前記核酸編集タンパク質を前記第1の核酸分子上の同じもしくは異なる標的編集部位に方向付ける、前記第1の標的核酸分子に特異的な少なくとも1つの第2のgRNA、または(ii)前記核酸編集タンパク質を第2の標的核酸分子上の標的編集部位に方向付ける、前記第2の標的核酸分子に特異的な少なくとも1つの第2のgRNAを含む、第4のRNA分子、
(e)必要に応じて、(i)前記核酸編集タンパク質を前記第1の核酸分子上の前記第1のgRNAおよび前記第2のgRNAと同じもしくは異なる標的編集部位に方向付ける、前記第1の標的核酸分子に特異的な少なくとも1つの第3のgRNA、(ii)前記核酸編集タンパク質を前記第2の核酸分子上の前記第2のgRNAと同じもしくは異なる標的編集部位に方向付ける、前記第2の標的核酸分子に特異的な少なくとも1つの第3のgRNA、または(iii)前記核酸編集タンパク質を第3の標的核酸分子上の標的編集部位に方向付ける、前記第3の標的核酸分子に特異的な少なくとも1つの第3のgRNAを含む、第5のRNA分子;ならびに
(f)必要に応じて、(i)前記核酸編集タンパク質を前記第1の核酸分子上の前記第1のgRNA、前記第2のgRNA、および前記第3のgRNAと同じもしくは異なる標的編集部位に方向付ける、前記第1の標的核酸分子に特異的な少なくとも1つの第4のgRNA、(ii)前記核酸編集タンパク質を前記第2の核酸分子上の前記第2のgRNAのおよび前記第3のgRNAと同じもしくは異なる標的編集部位に方向付ける、前記第2の標的核酸分子に特異的な少なくとも1つの第4のgRNA、(iii)前記核酸編集タンパク質を前記第3の標的核酸分子上の前記第3のgRNAと同じもしくは異なる標的編集部位に方向付ける、前記第3の標的核酸分子に特異的な少なくとも1つの第4のgRNA、または(iv)前記核酸編集タンパク質を第4の標的核酸分子上の標的編集部位に方向付ける、前記第4の標的核酸分子に特異的な少なくとも1つの第4のgRNAを含む、第6のRNA分子
を含む、組成物。
2 前記第1の二量体形成ドメインと前記第2の二量体形成ドメインが、直接結合、間接結合、またはこれらの組合せによって結合している、実施形態1に記載の組成物。
3 直接結合または間接結合が、塩基対合相互作用、非標準的な塩基対合相互作用、非塩基対合相互作用、またはこれらの組合せを含む、実施形態2に記載の組成物。
4 直接結合が、キッシングループ間または低多様性領域間の塩基対合相互作用を含む、実施形態2または3に記載の組成物。
5 直接結合が、アプタマー領域間の非標準的な塩基対合相互作用、非標準的な塩基対合相互作用、非塩基対合相互作用、またはこれらの組合せを含む、実施形態2または3に記載の組成物。
6 間接結合が、核酸架橋を通じた塩基対合相互作用を含む、実施形態2または3に記載の組成物。
7 間接結合が、アプタマーとアプタマーの標的との間、または2つのアプタマー間の非塩基対合相互作用を含む、実施形態2に記載の組成物。
8 前記第1の二量体形成ドメインまたは前記第2の二量体形成ドメインが、潜在スプライスアクセプターを含まない、実施形態1から7までのいずれか一項に記載の組成物。
9 前記二量体形成ドメインが、アプタマー配列二量体形成ドメインと直接結合しているかまたは間接的に結合している、実施形態1から8までのいずれか一項に記載の組成物。
10 前記二量体形成ドメインが、キッシングループ相互作用ドメインである、実施形態1から9までのいずれか一項に記載の組成物。
11 前記標的編集部位が、疾患に関連する標的核酸分子または標的核酸分子の調節領域の一部である、実施形態1から10までのいずれか一項に記載の組成物。
12 前記疾患が、単一遺伝子疾患である、実施形態11に記載の組成物。
13 前記第1の標的核酸分子、前記第2の標的核酸分子、前記第3の標的核酸分子、および/または前記第4の標的核酸分子が、前記疾患をもたらす1つまたは複数の点変異を含む、実施形態1から12までのいずれか一項に記載の組成物。
14 前記疾患ならびに前記第1の標的核酸分子、前記第2の標的核酸分子、前記第3の標的核酸分子、および/または前記第4の標的核酸分子が、表1~4に列挙されているものである、実施形態11から13までのいずれか一項に記載の組成物。
15 前記第1のRNA分子が、前記スプライスドナーに対して3’側であり前記第1の二量体形成ドメインに対して5’側の下流イントロンスプライスエンハンサー(DISE)、前記スプライスドナーに対して3’側であり前記第1の二量体形成ドメインに対して5’側のイントロンスプライスエンハンサー(ISE)のうちの一方もしくは両方をさらに含む;および/または
前記第2のRNA分子が、前記第2の二量体形成ドメインに対して3’側であり前記分岐点配列に対して5’側のISE、および前記スプライスドナーに対して3’側であり前記二量体形成ドメインに対して5’側のDISEのうちの一方もしくは両方をさらに含む;
またはこれらの任意の組合せである、実施形態1から14までのいずれか一項に記載の組成物。
16 前記第1のRNA分子が、前記スプライスドナーに対して3’側の任意の場所に位置を占めた自己切断性RNA配列またはRNA切断酵素標的配列をさらに含み、したがって、3’に位置するポリアデニル化尾部を切断して、組み換えられていないRNA分子からのタンパク質断片の発現を低減または抑制するか;
前記第2のRNA分子が、前記分岐点配列に対して5’側の任意の場所に位置を占めた自己切断性RNA配列またはRNA切断酵素標的配列をさらに含み、したがって、5’に位置するRNAキャップを切断して、組み換えられていないRNA分子からのタンパク質断片の発現を低減または抑制するか;
前記第2のRNA分子が、前記スプライスアクセプターの3’側にあるオープンリーディングフレームに関してシフトされる開始コドンを前記分岐点配列に対して5’側の任意の場所にさらに含んで、組み換えられていないRNA分子からの核酸編集タンパク質断片の翻訳を低減または抑制するか;
前記第1のRNA分子が、前記スプライスドナーに対して3’側の任意の場所にマイクロRNA標的部位をさらに含み、したがって、結合していないRNA断片が核の外側に出るとマイクロRNA依存性分解を受けるか;
前記第2のRNA分子が、前記コード配列に対して3’側の任意の場所にマイクロRNA標的部位をさらに含み、したがって、結合していないRNA断片が核の外側に出るとマイクロRNA依存性分解を受けるか;
前記第1のRNA分子が、デグロンタンパク質分解タグをコードする配列を、前記スプライスドナーに対して3’側の任意の場所に前記スプライスドナー部位の5’側にある前記核酸編集タンパク質のオープンリーディングフレームとインフレームになるようにさらに含み、したがって、結合していないタンパク質断片が分解に関してタグ付けされるか;
前記第2のRNA分子が、開始コドンおよびインフレームのデグロンタンパク質分解タグを、前記分岐点配列に対して5’側の任意の場所に前記スプライスアクセプター部位の3’側の前記核酸編集タンパク質のオープンリーディングフレームとインフレームになるようにさらに含み、したがって、結合していないタンパク質断片が分解に関してタグ付けされるか;
またはこれらの任意の組合せである、実施形態1から15までのいずれか一項に記載の組成物。
17 前記核酸編集タンパク質が、Casヌクレアーゼ、ジンクフィンガーヌクレアーゼ、または転写活性化因子様エフェクターヌクレアーゼを含む、実施形態1から16までのいずれか一項に記載の組成物。
18 前記第1の標的核酸分子、前記第2の標的核酸分子、前記第3の標的核酸分子、および/または前記第4の標的核酸分子が、標的DNA分子であり、前記少なくとも1つの第1のgRNA、第2のgRNA、第3のgRNA、および/または第4のgRNAが、crRNAおよびtracrRNAを含む、実施形態1から17までのいずれか一項に記載の組成物。
19 前記核酸編集タンパク質が、Cas9または死んだCas9(dCas9)を含む、実施形態18に記載の組成物。
20 前記Cas9タンパク質が、配列番号208に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を含み、RNA誘導型DNAエンドヌクレアーゼとして機能し得るか;
前記Cas9タンパク質が、配列番号207に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を含む配列によってコードされ、RNA誘導型DNAエンドヌクレアーゼをコードするか;
前記dCas9タンパク質が、配列番号210に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を含み、触媒として不活性であるか;
前記dCas9タンパク質が、配列番号209に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を含む配列によってコードされ、触媒として不活性であるタンパク質をコードする、実施形態19に記載の組成物。
21 前記Cas9またはdCas9が、融合タンパク質の一部である、実施形態19または20に記載の組成物。
22 前記融合タンパク質が、Cas9またはdCas9と、転写活性化ドメイン、例えば、VP64、P65、MyoD1、HSF1、RTA、CBP、SET7/9、またはこれらの任意の組合せ;
シトシン塩基エディター(CBE)、例えば、ウミヤツメ由来のもの[AID]、CDA1、またはAPOBEC3G;
バクテリオファージタンパク質Gam;および
アデニン塩基エディター(ABE)、例えば、ABE 6.3、7.8、7.9、7.10、ABEmax、ABE8e(TadA-8e V106W)などのABE8sのうちの1つまたは複数とを含む、実施形態21に記載の組成物。
23 前記第1の標的核酸分子、前記第2の標的核酸分子、前記第3の標的核酸分子、および/または前記第4の標的核酸分子が、標的RNAであり、前記少なくとも1つの第1のgRNA、第2のgRNA、第3のgRNA、および/または第4のgRNAが、1つまたは複数のダイレクトリピートおよび1つまたは複数のスペーサーを含む、実施形態1から17までのいずれか一項に記載の組成物。
24 前記核酸編集タンパク質が、Cas13a、Cas13b、Cas13c、Cas13dまたは死んだCas13d(dCas13d)を含む、実施形態23に記載の組成物。
25 前記Cas13dタンパク質が、配列番号212、215、または222に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を含み、RNA誘導型RNAエンドヌクレアーゼとして機能し得るか;
前記Cas13dタンパク質が、配列番号211または213に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を含む配列によってコードされ、RNA誘導型RNAエンドヌクレアーゼをコードするか;
前記dCas13dタンパク質が、配列番号215または216に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を含み、触媒として不活性であるか;
前記dCas13dタンパク質が、配列番号215または216に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を含むタンパク質をコードし、触媒として不活性であるタンパク質をコードする配列によってコードされる、実施形態24に記載の組成物。
26 前記Cas13a、Cas13b、Cas13c、Cas13dまたはdCas13dが、融合タンパク質の一部である、実施形態24または25に記載の組成物。
27 前記融合タンパク質が、Cas13a、Cas13b、Cas13c、Cas13dまたはdCas13dと、
転写活性化ドメイン、例えば、VP64、P65、MyoD1、HSF1、RTA、CBP、SET7/9、またはこれらの任意の組合せ;
シトシン塩基エディター(CBE)、例えば、ウミヤツメ由来のもの[AID]、CDA1、またはAPOBEC3G;
バクテリオファージタンパク質Gam;および
アデニン塩基エディター(ABE)、例えば、ABE 6.3、7.8、7.9、7.10、ABEmax、ABE8e(TadA-8e V106W)などのABE8sのうちの1つまたは複数とを含む、実施形態26に記載の組成物。
28 前記少なくとも1つの第1のgRNA、第2のgRNA、第3のgRNA、および/または第4のgRNAが、前記第1のgRNA、前記第2のgRNA、前記第3のgRNA、および/または前記第4のgRNAのそれぞれの複数のコピーを含む、実施形態1から27までのいずれか一項に記載の組成物。
29 前記第1のRNA分子および前記第2のRNA分子のそれぞれの5’末端および3’末端にパルボウイルス末端逆位反復配列(ITR)をさらに含む、実施形態1から27までのいずれか一項に記載の組成物。
30 実施形態1から29までのいずれか一項に記載の組成物を発現させるためのDNA分子組成物であって、
(i)(a)のRNA分子、および必要に応じて、(c)のRNA分子、(d)のRNA分子、または(c)のRNA分子と(d)のRNA分子の両方をコードする第1の合成DNA分子;ならびに
(ii)(b)のRNA分子、および必要に応じて、(e)のRNA分子、(f)のRNA分子、または(e)のRNA分子と(f)のRNA分子の両方をコードする第2の合成DNA分子
を含む、DNA分子組成物。
31 (a)前記核酸編集タンパク質のN末端部分をコードするDNA配列に作動可能に連結した第1のプロモーター;
(b)前記核酸編集タンパク質のC末端部分をコードするDNA配列に作動可能に連結した第2のプロモーター
(c)前記第1の合成DNA分子が前記(c)のRNA分子をコードするDNA分子を含む場合、前記少なくとも1つの第1のgRNAをコードする配列に作動可能に連結した第3のプロモーター;
(d)前記第1の合成DNA分子が前記(d)のRNA分子をコードするDNA分子を含む場合、前記少なくとも1つの第2のgRNAをコードする配列に作動可能に連結した第4のプロモーター;
(e)前記第2の合成DNA分子が前記(e)のRNA分子をコードするDNA分子を含む場合、前記少なくとも1つの第3のgRNAをコードする配列に作動可能に連結した第5のプロモーター;および
(f)前記第2の合成DNA分子が前記(d)のRNA分子をコードするDNA分子を含む場合、前記少なくとも1つの第4のgRNAをコードする配列に作動可能に連結した第6のプロモーター
をさらに含む、実施形態30に記載のDNA分子。
32 各プロモーターが、独立に選択される、実施形態31に記載の組成物。
33 前記第1プロモーターと前記第2のプロモーターが同じプロモーターである;
前記第1のプロモーターと前記第2のプロモーターが異なるプロモーターである;
前記第3のプロモーター、前記第4のプロモーター、前記第5のプロモーターおよび前記第6のプロモーターが同じプロモーターである;
前記第3のプロモーター、前記第4のプロモーター、前記第5のプロモーターおよび前記第6のプロモーターが異なるプロモーターである、または
これらの組合せである、
実施形態31または32に記載の組成物。
34 前記第1のプロモーターおよび前記第2のプロモーターのそれぞれが、独立に、構成的プロモーター;組織特異的プロモーター;および前記核酸編集タンパク質に対して内因性のプロモーターから選択される、実施形態30から32までのいずれか一項に記載の組成物。
35 前記第3のプロモーター、前記第4のプロモーター、前記第5のプロモーターおよび前記第6のプロモーターのそれぞれが、U6またはH1プロモーターなどのポリメラーゼIIIプロモーターである、実施形態30から34までのいずれか一項に記載の組成物。
36 実施形態30から35までのいずれか一項に記載の組成物を含む、核酸編集タンパク質を発現させるための系。
37 細胞に導入されると、前記RNA分子を適当な順序で産生させ、組み換え、それにより、前記核酸編集タンパク質の全長コード配列をもたらす、実施形態36に記載の系。
38 前記第1の合成RNA分子と前記第2の合成RNA分子のそれぞれが、別々のウイルスベクターから転写される、実施形態36または37に記載の系。
39 前記ウイルスベクターが、AAVである、実施形態38に記載の系。
40 合成DNA分子のそれぞれが、約2500nt~約5000nt、2,500nt~約2,750nt、約2,500nt~約3,000nt、約2,500nt~約3,250nt、約2,500nt~約3,500nt、約2,500nt~約3,750nt、約2,500nt~約4,000nt、約2,500nt~約4,250nt、約2,500nt~約4,500nt、約2,500nt~約4,750nt、約2,500nt~約5,000nt、約2,750nt~約3,000nt、約2,750nt~約3,250nt、約2,750nt~約3,500nt、約2,750nt~約3,750nt、約2,750nt~約4,000nt、約2,750nt~約4,250nt、約2,750nt~約4,500nt、約2,750nt~約4,750nt、約2,750nt~約5,000nt、約3,000nt~約3,250nt、約3,000nt~約3,500nt、約3,000nt~約3,750nt、約3,000nt~約4,000nt、約3,000nt~約4,250nt、約3,000nt~約4,500nt、約3,000nt~約4,750nt、約3,000nt~約5,000nt、約3,250nt~約3,500nt、約3,250nt~約3,750nt、約3,250nt~約4,000nt、約3,250nt~約4,250nt、約3,250nt~約4,500nt、約3,250nt~約4,750nt、約3,250nt~約5,000nt、約3,500nt~約3,750nt、約3,500nt~約4,000nt、約3,500nt~約4,250nt、約3,500nt~約4,500nt、約3,500nt~約4,750nt、約3,500nt~約5,000nt、約3,750nt~約4,000nt、約3,750nt~約4,250nt、約3,750nt~約4,500nt、約3,750nt~約4,750nt、約3,750nt~約5,000nt、約4,000nt~約4,250nt、約4,000nt~約4,500nt、約4,000nt~約4,750nt、約4,000nt~約5,000nt、約4,250nt~約4,500nt、約4,250nt~約4,750nt、約4,250nt~約5,000nt、約4,500nt~約4,750nt、約4,500nt~約5,000nt、約4,750nt~約5,000nt、約2,500nt、約2,750nt、約3,000nt、約3,250nt、約3,500nt、約3,750nt、約4,000nt、約4,250nt、約4,500nt、約4,750nt、および約5,000ntから独立に選択されるサイズを有する、実施形態36から39までのいずれか一項に記載の系。
41 前記系の合成DNA分子によってコードされる前記核酸編集タンパク質のN末端部分のコード配列、または前記核酸編集タンパク質のC末端部分のコード配列のそれぞれが、約2500~4500nt、約2,500nt~約2,750nt、約2,500nt~約3,000nt、約2,500nt~約3,250nt、約2,500nt~約3,500nt、約2,500nt~約3,750nt、約2,500nt~約4,000nt、約2,500nt~約4,250nt、約2,500nt~約4,500nt、約2,750nt~約3,000nt、約2,750nt~約3,250nt、約2,750nt~約3,500nt、約2,750nt~約3,750nt、約2,750nt~約4,000nt、約2,750nt~約4,250nt、約2,750nt~約4,500nt、約3,000nt~約3,250nt、約3,000nt~約3,500nt、約3,000nt~約3,750nt、約3,000nt~約4,000nt、約3,000nt~約4,250nt、約3,000nt~約4,500nt、約3,250nt~約3,500nt、約3,250nt~約3,750nt、約3,250nt~約4,000nt、約3,250nt~約4,250nt、約3,250nt~約4,500nt、約3,500nt~約3,750nt、約3,500nt~約4,000nt、約3,500nt~約4,250nt、約3,500nt~約4,500nt、約3,750nt~約4,000nt、約3,750nt~約4,250nt、約3,750nt~約4,500nt、約4,000nt~約4,250nt、約4,000nt~約4,500nt、約4,250nt~約4,500nt、約2,500nt、約2,750nt、約3,000nt、約3,250nt、約3,500nt、約3,750nt、約4,000nt、約4,250nt、および約4,500ntから独立に選択されるサイズを有する、実施形態36から40までのいずれか一項に記載の系。
42 前記系の合成DNA分子によってコードされるRNA分子のいずれか一方または両方が、それぞれ、約2500~4500nt、約2,500nt~約2,750nt、約2,500nt~約3,000nt、約2,500nt~約3,250nt、約2,500nt~約3,500nt、約2,500nt~約3,750nt、約2,500nt~約4,000nt、約2,500nt~約4,250nt、約2,500nt~約4,500nt、約2,750nt~約3,000nt、約2,750nt~約3,250nt、約2,750nt~約3,500nt、約2,750nt~約3,750nt、約2,750nt~約4,000nt、約2,750nt~約4,250nt、約2,750nt~約4,500nt、約3,000nt~約3,250nt、約3,000nt~約3,500nt、約3,000nt~約3,750nt、約3,000nt~約4,000nt、約3,000nt~約4,250nt、約3,000nt~約4,500nt、約3,250nt~約3,500nt、約3,250nt~約3,750nt、約3,250nt~約4,000nt、約3,250nt~約4,250nt、約3,250nt~約4,500nt、約3,500nt~約3,750nt、約3,500nt~約4,000nt、約3,500nt~約4,250nt、約3,500nt~約4,500nt、約3,750nt~約4,000nt、約3,750nt~約4,250nt、約3,750nt~約4,500nt、約4,000nt~約4,250nt、約4,000nt~約4,500nt、約4,250nt~約4,500nt、約2,500nt、約2,750nt、約3,000nt、約3,250nt、約3,500nt、約3,750nt、約4,000nt、約4,250nt、および約4,500ntから独立に選択されるサイズを有する、実施形態36から41までのいずれか一項に記載の系。
43 実施形態30から35までのいずれか一項に記載の組成物を含み、
前記合成DNA分子が、約5000nt~約10,000nt、約5,000nt~約5,500nt、約5,000nt~約6,000nt、約5,000nt~約6,500nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,000nt~約8,500nt、約5,000nt~約9,000nt、約5,000nt~約9,500nt、約5,000nt~約10,000nt、約5,500nt~約6,000nt、約5,500nt~約6,500nt、約5,500nt~約7,000nt、約5,500nt~約7,500nt、約5,500nt~約8,000nt、約5,500nt~約8,500nt、約5,500nt~約9,000nt、約5,500nt~約9,500nt、約5,500nt~約10,000nt、約6,000nt~約6,500nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,000nt~約8,500nt、約6,000nt~約9,000nt、約6,000nt~約9,500nt、約6,000nt~約10,000nt、約6,500nt~約7,000nt、約6,500nt~約7,500nt、約6,500nt~約8,000nt、約6,500nt~約8,500nt、約6,500nt~約9,000nt、約6,500nt~約9,500nt、約6,500nt~約10,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、約7,000nt~約8,500nt、約7,000nt~約9,000nt、約7,000nt~約9,500nt、約7,000nt~約10,000nt、約7,500nt~約8,000nt、約7,500nt~約8,500nt、約7,500nt~約9,000nt、約7,500nt~約9,500nt、約7,500nt~約10,000nt、約8,000nt~約8,500nt、約8,000nt~約9,000nt、約8,000nt~約9,500nt、約8,000nt~約10,000nt、約8,500nt~約9,000nt、約8,500nt~約9,500nt、約8,500nt~約10,000nt、約9,000nt~約9,500nt、約9,000nt~約10,000nt、約9,500nt~約10,000nt、約5,000nt、約5,500nt、約6,000nt、約6,500nt、約7,000nt、約7,500nt、約8,000nt、約8,500nt、約9,000nt、約9,500nt、および約10,000ntから選択される総サイズを有し;
総核酸編集タンパク質コード配列が、約2000nt~約8000nt、約2,000nt~約3,000nt、約2,000nt~約3,500nt、約2,000nt~約4,000nt、約2,000nt~約4,500nt、約2,000nt~約5,000nt、約2,000nt~約5,500nt、約2,000nt~約6,000nt、約2,000nt~約6,500nt、約2,000nt~約7,000nt、約2,000nt~約7,500nt、約2,000nt~約8,000nt、約3,000nt~約3,500nt、約3,000nt~約4,000nt、約3,000nt~約4,500nt、約3,000nt~約5,000nt、約3,000nt~約5,500nt、約3,000nt~約6,000nt、約3,000nt~約6,500nt、約3,000nt~約7,000nt、約3,000nt~約7,500nt、約3,000nt~約8,000nt、約3,500nt~約4,000nt、約3,500nt~約4,500nt、約3,500nt~約5,000nt、約3,500nt~約5,500nt、約3,500nt~約6,000nt、約3,500nt~約6,500nt、約3,500nt~約7,000nt、約3,500nt~約7,500nt、約3,500nt~約8,000nt、約4,000nt~約4,500nt、約4,000nt~約5,000nt、約4,000nt~約5,500nt、約4,000nt~約6,000nt、約4,000nt~約6,500nt、約4,000nt~約7,000nt、約4,000nt~約7,500nt、約4,000nt~約8,000nt、約4,500nt~約5,000nt、約4,500nt~約5,500nt、約4,500nt~約6,000nt、約4,500nt~約6,500nt、約4,500nt~約7,000nt、約4,500nt~約7,500nt、約4,500nt~約8,000nt、約5,000nt~約5,500nt、約5,000nt~約6,000nt、約5,000nt~約6,500nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,500nt~約6,000nt、約5,500nt~約6,500nt、約5,500nt~約7,000nt、約5,500nt~約7,500nt、約5,500nt~約8,000nt、約6,000nt~約6,500nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,500nt~約7,000nt、約6,500nt~約7,500nt、約6,500nt~約8,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、または約7,500nt~約8,000ntから選択され、総標的タンパク質コード配列が、約2,000nt、約3,000nt、約3,500nt、約4,000nt、約4,500nt、約5,000nt、約5,500nt、約6,000nt、約6,500nt、約7,000nt、約7,500nt、および約8,000ntであり;かつ/または、
2つの前記合成DNA分子によってコードされるRNA分子の合計サイズが、約5,000nt~約9000nt、約5,000nt~約5,500nt、約5,000nt~約6,000nt、約5,000nt~約6,500nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,000nt~約8,500nt、約5,000nt~約9,000nt、約5,500nt~約6,000nt、約5,500nt~約6,500nt、約5,500nt~約7,000nt、約5,500nt~約7,500nt、約5,500nt~約8,000nt、約5,500nt~約8,500nt、約5,500nt~約9,000nt、約6,000nt~約6,500nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,000nt~約8,500nt、約6,000nt~約9,000nt、約6,500nt~約7,000nt、約6,500nt~約7,500nt、約6,500nt~約8,000nt、約6,500nt~約8,500nt、約6,500nt~約9,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、約7,000nt~約8,500nt、約7,000nt~約9,000nt、約7,500nt~約8,000nt、約7,500nt~約8,500nt、約7,500nt~約9,000nt、約8,000nt~約8,500nt、約8,000nt~約9,000nt、約8,500nt~約9,000nt、約5,000nt、約5,500nt、約6,000nt、約6,500nt、約7,000nt、約7,500nt、約8,000nt、約8,500nt、および約9,000ntから選択される、実施形態36から42までのいずれか一項に記載の系。
44 前記第1の二量体形成ドメインおよび前記第2の二量体形成ドメインが、それぞれ、1000nt以下、例えば、少なくとも50nt、少なくとも100nt、少なくとも150nt、少なくとも200nt、少なくとも300nt、少なくとも400nt、少なくとも500nt、50~1000nt、50~500nt、50~150nt、50nt、100nt、150nt、200nt、250nt、300nt、400nt、または500ntであり;前記系の組換え効率が、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、または約100%である、実施形態36から43までのいずれか一項に記載の系。
45 各二量体形成ドメインが、1000nt以下、例えば、少なくとも50nt、少なくとも100nt、少なくとも150nt、少なくとも200nt、少なくとも300nt、少なくとも400nt、少なくとも500nt、50~1000nt、50~500nt、50~150nt、50nt、100nt、150nt、200nt、250nt、300nt、400nt、または500ntであり;前記系の組換え効率が、少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも90%、または約100%である、実施形態36から44までのいずれか一項に記載の系。
46 RNA組換え効率が、約10%~約100%、約10%~約20%、約10%~約30%、約10%~約35%、約10%~約40%、約10%~約45%、約10%~約50%、約10%~約55%、約10%~約60%、約10%~約70%、約10%~約80%、約10%~約90%、約20%~約30%、約20%~約35%、約20%~約40%、約20%~約45%、約20%~約50%、約20%~約55%、約20%~約60%、約20%~約70%、約20%~約80%、約20%~約90%、約30%~約35%、約30%~約40%、約30%~約45%、約30%~約50%、約30%~約55%、約30%~約60%、約30%~約70%、約30%~約80%、約30%~約90%、約35%~約40%、約35%~約45%、約35%~約50%、約35%~約55%、約35%~約60%、約35%~約70%、約35%~約80%、約35%~約90%、約40%~約45%、約40%~約50%、約40%~約55%、約40%~約60%、約40%~約70%、約40%~約80%、約40%~約90%、約45%~約50%、約45%~約55%、約45%~約60%、約45%~約70%、約45%~約80%、約45%~約90%、約50%~約55%、約50%~約60%、約50%~約70%、約50%~約80%、約50%~約90%、約55%~約60%、約55%~約70%、約55%~約80%、約55%~約90%、約60%~約70%、約60%~約80%、約60%~約90%、約70%~約80%、約70%~約90%、約80%~約90%、約10%、約20%、約30%、約35%、約40%、約45%、約50%、約55%、約60%、約70%、約80%、約90%、約95%、または約100%である、実施形態36から45までのいずれか一項に記載の系。
47 実施形態36から46までのいずれか一項に記載の系を含む組成物。
48 それぞれ核酸編集タンパク質の少なくとも一部分をコードする第1のRNA分子、第2のRNA分子、第3のRNA分子および必要に応じて第4のRNA分子を含む、実施形態47に記載の組成物。
49 実施形態36から46までのいずれか一項に記載の系、または実施形態47および48のいずれか一項に記載の組成物を含むキットであって、前記第1の合成核酸分子、前記第2の合成核酸分子、前記第3の合成核酸分子および前記第4の合成核酸分子のいずれかが別々の容器に入っていてよく、必要に応じて薬学的に許容される担体などのバッファーをさらに含む、キット。
50 細胞において核酸編集タンパク質を発現させる方法であって、実施形態36から46までのいずれか一項に記載の系、または実施形態47もしくは48に記載の組成物を細胞に導入するステップと、前記第1のRNA分子と前記第2のRNA分子を前記細胞において発現させるステップとを含み、前記細胞において前記核酸編集タンパク質が産生される、方法。
51 前記細胞が、対象内に存在し、導入するステップが、治療有効量の前記系を前記対象に投与することを含む、実施形態50に記載の方法。
52 前記対象における標的核酸分子の変異によって引き起こされる遺伝子疾患を処置し、前記核酸編集タンパク質および必要に応じて前記第1のgRNAおよび前記第2のgRNAの発現、ならびに前記対象における前記変異の補正をもたらす、実施形態51に記載の方法。
53 前記遺伝子疾患が、機能喪失型変異に起因するものであり、前記少なくとも1つの第1のgRNA、第2のgRNA、第3のgRNAおよび/もしくは第4のgRNAが、表1に列挙されている核酸を標的とする配列を含み、前記方法により、表1に列挙されている対応する疾患が処置されるか;
前記標的核酸が、癌遺伝子であり、前記少なくとも1つの第1のgRNA、第2のgRNA、第3のgRNAおよび/もしくは第4のgRNAが、表2の癌遺伝子を標的とする配列を含み、前記方法により、表2に列挙されている対応するがんが処置されるか;
前記遺伝子疾患が、機能獲得型変異に起因するものであり、前記少なくとも1つの第1のgRNA、第2のgRNA、第3のgRNAおよび/もしくは第4のgRNAが、表3に列挙されている核酸を標的とする配列を含み、前記方法により、表3に列挙されている対応する疾患が処置されるか;または
前記遺伝子疾患が、表4に列挙されているものであり、少なくとも1つの第1のgRNA、第2のgRNA、第3のgRNAおよび/もしくは第4のgRNAが、表4に列挙されている核酸を標的とする配列を含み、前記方法により、表4に列挙されている対応する疾患が処置される、実施形態52に記載の方法。
54 前記第1のRNA分子および前記第2のRNA分子のうちの一方または両方が、配列番号159、160、161、162、163、164、165、166、225、および226のうちのいずれか1つに提示される合成イントロンに対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%、または100%の配列同一性を含む、実施形態36から46までのいずれか一項に記載の系、実施形態1から35まで、47および48のいずれか一項に記載の組成物、または実施形態50から53までのいずれか一項に記載の方法。
55 前記第1のRNA分子および前記第2のRNA分子のうちの一方または両方が、配列番号159、160、161、162、163、164、165、166、225、または226によってコードされるRNAから選択される合成イントロンを含む、実施形態36から46までおよび54のいずれか一項に記載の系、実施形態1から35まで、47および48のいずれか一項に記載の組成物、または実施形態50から53までのいずれか一項に記載の方法。
56 前記第1のRNA分子および前記第2のRNA分子のうちの一方または両方が、タンパク質コード配列の一部をさらに含む、実施形態36から46まで、54、および55のいずれかに記載の系、実施形態1から16まで、32および33のいずれか一項に記載の組成物、または実施形態35から38までのいずれか一項に記載の方法。
57 前記タンパク質コード配列の前記一部が、前記タンパク質コード配列のN末端側半分、N末端部分、C末端側半分、またはC末端部分を含む、実施形態36から46までおよび54から56までのいずれかに記載の系、実施形態1から35まで、47および48のいずれか一項に記載の組成物、または実施形態50から53までのいずれか一項に記載の方法。
57 (a)第1のRNA分子であって、5’から3’に、(i)少なくとも1つの第1のgRNA、(ii)前記核酸編集タンパク質のN末端部分のコード配列;(iii)スプライスドナー;(ii-2)DISE、ISE、または両方;(iv)第1の二量体形成ドメイン;および(v)少なくとも1つの第2のgRNAを含む、第1のRNA分子、ならびに(b)第2のRNA分子であって、5’から3’に、(i)少なくとも1つの第3のgRNA、(ii)前記第1の二量体形成ドメインに結合する第2の二量体形成ドメイン;(i-2)少なくとも1つのISE配列;(iii)分岐点配列;(ii)ポリピリミジントラクト;(v)スプライスアクセプター;(vi)前記核酸編集タンパク質のC末端部分のコード配列、および(vii)少なくとも1つの第4のgRNAを含む、第2のRNA分子を含む、実施形態36から46までおよび54から56までのいずれか一項に記載の系、実施形態1から35まで、47および48のいずれか一項に記載の組成物、または実施形態50から53までのいずれか一項に記載の方法。
58 (a)第1のRNA分子であって、5’から3’に、(i)少なくとも1つの第1のgRNA、(ii)前記核酸編集タンパク質のN末端部分のコード配列;(iii)スプライスドナー;(ii-2)DISE、ISE、およびISE;および(iv)第1の二量体形成ドメイン;および(v)少なくとも1つの第2のgRNAを含む、第1のRNA分子、ならびに(b)第2のRNA分子であって、5’から3’に、(i)少なくとも1つの第3のgRNA、(ii)前記第1の二量体形成ドメインに結合する第2の二量体形成ドメイン;(i-2)3つのISE配列;(iii)分岐点配列;(iv)ポリピリミジントラクト;(v)スプライスアクセプター;(vi)前記核酸編集タンパク質のC末端部分のコード配列および(vii)少なくとも1つの第4のgRNAを含む第2のRNA分子を含む、実施形態36から46までおよび54から57までのいずれか一項に記載の系、実施形態1から35まで、47および48のいずれか一項に記載の組成物、または実施形態50から53までのいずれか一項に記載の方法。
59 前記第1のRNA分子および前記第2のRNA分子のうちのいずれか1つまたは2つのそれぞれが、約2500~4500nt、約2,500nt~約2,750nt、約2,500nt~約3,000nt、約2,500nt~約3,250nt、約2,500nt~約3,500nt、約2,500nt~約3,750nt、約2,500nt~約4,000nt、約2,500nt~約4,250nt、約2,500nt~約4,500nt、約2,750nt~約3,000nt、約2,750nt~約3,250nt、約2,750nt~約3,500nt、約2,750nt~約3,750nt、約2,750nt~約4,000nt、約2,750nt~約4,250nt、約2,750nt~約4,500nt、約3,000nt~約3,250nt、約3,000nt~約3,500nt、約3,000nt~約3,750nt、約3,000nt~約4,000nt、約3,000nt~約4,250nt、約3,000nt~約4,500nt、約3,250nt~約3,500nt、約3,250nt~約3,750nt、約3,250nt~約4,000nt、約3,250nt~約4,250nt、約3,250nt~約4,500nt、約3,500nt~約3,750nt、約3,500nt~約4,000nt、約3,500nt~約4,250nt、約3,500nt~約4,500nt、約3,750nt~約4,000nt、約3,750nt~約4,250nt、約3,750nt~約4,500nt、約4,000nt~約4,250nt、約4,000nt~約4,500nt、約4,250nt~約4,500nt、約2,500nt、約2,750nt、約3,000nt、約3,250nt、約3,500nt、約3,750nt、約4,000nt、約4,250nt、および約4,500ntから独立に選択されるサイズを有する、実施形態1から35までのいずれか一項に記載の組成物。
60 前記総核酸編集タンパク質コード配列のサイズが、約2000nt~約8000nt、約2,000nt~約3,000nt、約2,000nt~約3,500nt、約2,000nt~約4,000nt、約2,000nt~約4,500nt、約2,000nt~約5,000nt、約2,000nt~約5,500nt、約2,000nt~約6,000nt、約2,000nt~約6,500nt、約2,000nt~約7,000nt、約2,000nt~約7,500nt、約2,000nt~約8,000nt、約3,000nt~約3,500nt、約3,000nt~約4,000nt、約3,000nt~約4,500nt、約3,000nt~約5,000nt、約3,000nt~約5,500nt、約3,000nt~約6,000nt、約3,000nt~約6,500nt、約3,000nt~約7,000nt、約3,000nt~約7,500nt、約3,000nt~約8,000nt、約3,500nt~約4,000nt、約3,500nt~約4,500nt、約3,500nt~約5,000nt、約3,500nt~約5,500nt、約3,500nt~約6,000nt、約3,500nt~約6,500nt、約3,500nt~約7,000nt、約3,500nt~約7,500nt、約3,500nt~約8,000nt、約4,000nt~約4,500nt、約4,000nt~約5,000nt、約4,000nt~約5,500nt、約4,000nt~約6,000nt、約4,000nt~約6,500nt、約4,000nt~約7,000nt、約4,000nt~約7,500nt、約4,000nt~約8,000nt、約4,500nt~約5,000nt、約4,500nt~約5,500nt、約4,500nt~約6,000nt、約4,500nt~約6,500nt、約4,500nt~約7,000nt、約4,500nt~約7,500nt、約4,500nt~約8,000nt、約5,000nt~約5,500nt、約5,000nt~約6,000nt、約5,000nt~約6,500nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,500nt~約6,000nt、約5,500nt~約6,500nt、約5,500nt~約7,000nt、約5,500nt~約7,500nt、約5,500nt~約8,000nt、約6,000nt~約6,500nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,500nt~約7,000nt、約6,500nt~約7,500nt、約6,500nt~約8,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、約7,500nt~約8,000nt、約2,000nt、約3,000nt、約3,500nt、約4,000nt、約4,500nt、約5,000nt、約5,500nt、約6,000nt、約6,500nt、約7,000nt、約7,500nt、もしくは約8,000ntであり、かつ/または、
2つの前記RNA分子の合計サイズが、約5,000nt~約9000nt、約5,000nt~約5,500nt、約5,000nt~約6,000nt、約5,000nt~約6,500nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,000nt~約8,500nt、約5,000nt~約9,000nt、約5,500nt~約6,000nt、約5,500nt~約6,500nt、約5,500nt~約7,000nt、約5,500nt~約7,500nt、約5,500nt~約8,000nt、約5,500nt~約8,500nt、約5,500nt~約9,000nt、約6,000nt~約6,500nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,000nt~約8,500nt、約6,000nt~約9,000nt、約6,500nt~約7,000nt、約6,500nt~約7,500nt、約6,500nt~約8,000nt、約6,500nt~約8,500nt、約6,500nt~約9,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、約7,000nt~約8,500nt、約7,000nt~約9,000nt、約7,500nt~約8,000nt、約7,500nt~約8,500nt、約7,500nt~約9,000nt、約8,000nt~約8,500nt、約8,000nt~約9,000nt、約8,500nt~約9,000nt、約5,000nt、約5,500nt、約6,000nt、約6,500nt、約7,000nt、約7,500nt、約8,000nt、約8,500nt、もしくは約9,000ntである、実施形態1から35までのいずれか一項に記載の組成物。
61 前記第1の二量体形成ドメインおよび前記第2の二量体形成ドメインのそれぞれが、1000nt以下、例えば、少なくとも50nt、少なくとも100nt、少なくとも150nt、少なくとも200nt、少なくとも300nt、少なくとも400nt、少なくとも500nt、50~1000nt、50~500nt、50~150nt、50nt、100nt、150nt、200nt、250nt、300nt、400nt、または500ntであり、前記系の組換え効率が、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、または少なくとも約95%である、実施形態1から35までのいずれか一項に記載の組成物。
62 各二量体形成ドメインが、1000nt以下、例えば、少なくとも50nt、少なくとも100nt、少なくとも150nt、少なくとも200nt、少なくとも300nt、少なくとも400nt、少なくとも500nt、50~1000nt、50~500nt、50~150nt、50nt、100nt、150nt、200nt、250nt、300nt、400nt、または500ntであり、前記系の組換え効率が、少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも75%、少なくとも80%、または少なくとも90%である、実施形態1から35までのいずれか一項に記載の組成物。
63 RNA組換え効率が、約10%~約100%、約10%~約20%、約10%~約30%、約10%~約35%、約10%~約40%、約10%~約45%、約10%~約50%、約10%~約55%、約10%~約60%、約10%~約70%、約10%~約80%、約10%~約90%、約20%~約30%、約20%~約35%、約20%~約40%、約20%~約45%、約20%~約50%、約20%~約55%、約20%~約60%、約20%~約70%、約20%~約80%、約20%~約90%、約30%~約35%、約30%~約40%、約30%~約45%、約30%~約50%、約30%~約55%、約30%~約60%、約30%~約70%、約30%~約80%、約30%~約90%、約35%~約40%、約35%~約45%、約35%~約50%、約35%~約55%、約35%~約60%、約35%~約70%、約35%~約80%、約35%~約90%、約40%~約45%、約40%~約50%、約40%~約55%、約40%~約60%、約40%~約70%、約40%~約80%、約40%~約90%、約45%~約50%、約45%~約55%、約45%~約60%、約45%~約70%、約45%~約80%、約45%~約90%、約50%~約55%、約50%~約60%、約50%~約70%、約50%~約80%、約50%~約90%、約55%~約60%、約55%~約70%、約55%~約80%、約55%~約90%、約60%~約70%、約60%~約80%、約60%~約90%、約70%~約80%、約70%~約90%、約80%~約90%、約10%、約20%、約30%、約35%、約40%、約45%、約50%、約55%、約60%、約70%、約80%、約90%、約95%、または約100%である、実施形態1から35までのいずれか一項に記載の組成物。
64 (a)前記第1のRNA分子および前記第2のRNA分子のそれぞれが、約2500nt~4500ntであり;
(b)前記総核酸編集タンパク質コード配列のサイズが、約2000nt~約8000ntであり;かつ/または、
(c)2つの前記RNA分子の合計サイズが、約5,000nt~約9000ntであり;
RNA組換え効率が、約10%~約100%である、実施形態1から35までのいずれか一項に記載の組成物。
65 1つまたは複数の標的核酸分子に特異的な1つまたは複数のgRNAを含む1つまたは複数の追加のRNA分子をさらに含む、実施形態1から29までのいずれか一項に記載の組成物。
66 1つまたは複数の標的核酸分子に特異的な1つまたは複数のgRNAをコードする1つまたは複数の追加のDNA分子をさらに含む、実施形態30から35までのいずれか一項に記載の組成物。
デュシェンヌ型筋ジストロフィー(DMD)の処置
デュシェンヌ型筋ジストロフィー(DMD、MIM:310200)は、進行性の筋力低下および変性を特徴とする致死的な遺伝性疾患である。疾患が進行するにつれ、変性している筋線維が脂肪および線維化組織によって置き換えられる。DMDの起源は遺伝子ジストロフィン(MIM:300377)の欠損である。ジストロフィン遺伝子は22kbpの領域にわたり、変異を起こしやすい。したがって、DMDは、一部の場合では、疾患を引き起こす変異の家族歴を有さない患者においても散発的に顕在化し得る。DMDは、ジストロフィン異常症として公知の4つの状態のうちの1つである。この群に属する他の3つの疾患は、ベッカー型筋ジストロフィー(BMD、DMDの軽症型);DMDとBMDの中間の臨床所見;および臨床的な骨格筋疾患または随意筋疾患がほとんどまたは全く伴わないDMD関連拡張型心筋症(心疾患)である。したがって、一部の実施例では、DMD、BMD、DMDとBMDの中間の臨床所見;または臨床的な骨格筋疾患または随意筋疾患がほとんどまたは全く伴わないDMD関連拡張型心筋症(心疾患)を有する患者を、本明細書に開示される系および方法を用いて処置する。
本明細書に開示される方法および系を、ジストロフィン変異を標的とする1つまたは複数のgRNAを発現させることによってDMDの単一遺伝子性の原因を処置するために使用することができる。ジストロフィンを単一のAAVから発現させる現行の方法では、短くした/短縮されたバージョンのジストロフィン(マイクロジストロフィンおよびミニジストロフィン)を利用する。これらの短縮されたジストロフィン送達治療のいくつかが第I/II相臨床試験において試験されている(NCT03362502、NCT00428935、NCT03368742、NCT03375164)。これらの短縮されたバージョンのジストロフィンは、DMDにおけるジストロフィン欠損の最悪の結果を好転させることはできるが、短縮されたバージョンでは全長タンパク質のロッド領域およびヒンジ領域の重要なドメインが欠如しているので、全長ジストロフィンと比較して完全な機能性を有さないことが予測される。本明細書に開示される方法および系では、「多重化された」AAVの組合せを使用することにより、高い感染効率(MOI、すなわち、高力価)で導入した場合に複数のAAVウイルスを同じ細胞に効率的に感染させることができるので、AAVのトランスジェニックペイロードのサイズ制限が緩和される。
したがって、一部の実施例では、組み換えられると全長核酸エディタータンパク質コード配列が生じる、2つ、3つ、4つまたは5つの異なる合成RNA分子(それぞれ異なるAAVとして)を含むセットなど、開示される合成分子のセットの1つをそれぞれが含有する2つまたはそれよりも多くのAAVを含む組成物をDMD対象に治療有効量で投与し(例えば、i.v.)、ここで、組成物は、ジストロフィン変異を標的とする1つまたは複数のgRNAをさらに含む。
VII.例示的な実施形態-2
1.標的タンパク質を発現させるための系であって、(a)5’から3’に:標的タンパク質のN末端部分のコード配列;スプライスドナー;および第1の二量体形成ドメインを含むRNA分子をコードする配列に作動可能に連結した第1のプロモーターを含む第1の合成核酸分子;ならびに(b)5’から3’に:第1の二量体形成ドメインに結合する第2の二量体形成ドメイン;分岐点配列;ポリピリミジントラクト;スプライスアクセプター;および標的タンパク質のC末端部分のコード配列を含むRNA分子をコードする配列に作動可能に連結した第2のプロモーターを含む第2の合成核酸分子を含む、系。
2.標的タンパク質を発現させるための系であって、(a)5’から3’に:標的タンパク質のN末端部分のコード配列;スプライスドナー;および第1の二量体形成ドメインを含むRNA分子をコードする配列に作動可能に連結した第1のプロモーターを含む第1の合成核酸分子;ならびに(b)5’から3’に:第1の二量体形成ドメインに結合する第2の二量体形成ドメイン;分岐点配列;ポリピリミジントラクト;スプライスアクセプター;および標的タンパク質の中間部分のコード配列;第2のスプライスドナー;および第3の二量体形成ドメインを含むRNA分子をコードする配列に作動可能に連結した第2のプロモーターを含む第2の合成核酸分子;ならびに(c)5’から3’に:第3の二量体形成ドメインに結合する第4の二量体形成ドメイン;分岐点配列;ポリピリミジントラクト;スプライスアクセプター;および標的タンパク質のC末端部分のコード配列を含むRNA分子をコードする配列に作動可能に連結した第3のプロモーターを含む第3の合成核酸分子を含む、系。
3.標的タンパク質を発現させるための系であって、
(a)5’から3’に:標的タンパク質のN末端部分のコード配列、スプライスドナー、および第1の二量体形成ドメインを含むRNA分子をコードする配列に作動可能に連結した第1のプロモーターを含む第1の合成核酸分子;(b)5’から3’に:第1の二量体形成ドメインに結合する第2の二量体形成ドメイン;分岐点配列;ポリピリミジントラクト;スプライスアクセプター;および標的タンパク質の中間部分のコード配列;第2のスプライスドナー;および第3の二量体形成ドメインを含むRNA分子をコードする配列に作動可能に連結した第2のプロモーターを含む第2の合成核酸分子;ならびに(c)5’から3’に:第3の二量体形成ドメインに結合する第4の二量体形成ドメイン;分岐点配列;ポリピリミジントラクト;スプライスアクセプター;および標的タンパク質の第1の中間部分のコード配列;第2のスプライスドナー;および第5の二量体形成ドメインを含むRNA分子をコードする配列に作動可能に連結した第3のプロモーターを含む第3の合成核酸分子;ならびに(c)5’から3’に:第5の二量体形成ドメインに結合する第6の二量体形成ドメイン;分岐点配列;ポリピリミジントラクト;スプライスアクセプター;および標的タンパク質のC末端部分のコード配列を含むRNA分子をコードする配列に作動可能に連結した第4のプロモーターを含む第4の合成核酸分子を含む、系。
4.各プロモーターが、独立に選択される、実施形態1から3までのいずれか1つの系。
5.第1のプロモーターと第2のプロモーターが同じプロモーターである;第1のプロモーターと第2のプロモーターが異なるプロモーターである;第1のプロモーター、第2のプロモーター、および第3のプロモーターが同じプロモーターである;第1のプロモーター、第2のプロモーター、および第3のプロモーターが異なるプロモーターである;第1のプロモーター、第2のプロモーター、第3のプロモーター、および第4のプロモーターが同じプロモーターである;または、第1のプロモーター、第2のプロモーター、第3のプロモーターおよび第4のプロモーターが異なるプロモーターである、実施形態1から4までのいずれか1つの系。
6.第1のプロモーター、第2のプロモーター、第3のプロモーター、および第4のプロモーターのそれぞれが、独立に、構成的プロモーター;組織特異的プロモーター;および標的タンパク質に対して内因性のプロモーターから選択される、実施形態1から5までのいずれか1つの系。
7.第1の二量体形成ドメインと第2の二量体形成ドメイン、第3の二量体形成ドメインと第4の二量体形成ドメイン、および/または第5の二量体形成ドメインと第6の二量体形成ドメインが、直接結合、間接結合、またはこれらの組合せによって結合している、実施形態1から6までのいずれか1つの系。
8.直接結合または間接結合が、塩基対合相互作用、非標準的な塩基対合相互作用、非塩基対合相互作用、またはこれらの組合せを含む、請求項7に記載の組成物。
9.直接結合が、キッシングループ間または低多様性領域間の塩基対合相互作用を含む、請求項7または8の組成物。
10.直接結合が、アプタマー領域間の非標準的な塩基対合相互作用、非標準的な塩基対合相互作用、非塩基対合相互作用、またはこれらの組合せを含む、請求項7または8の組成物。
11.間接結合が、核酸架橋を通じた塩基対合相互作用を含む、請求項7または8の組成物。
12.間接結合が、アプタマーとアプタマーの標的との間、または2つのアプタマー間の非塩基対合相互作用を含む、請求項7または8の組成物。
13.第1の二量体形成ドメイン、第2の二量体形成ドメイン、第3の二量体形成ドメイン、第4の二量体形成ドメイン、第5の二量体形成ドメインおよび/または第6の二量体形成ドメインが、潜在スプライスアクセプターを含まない、実施形態1から12までのいずれか1つの系。
14.直接結合しているかまたは間接的に結合しているアプタマー配列二量体形成ドメインの対を少なくとも1つ含む、実施形態1から13までのいずれか1つの系。
15.キッシングループ相互作用二量体形成ドメインの対を少なくとも1つ含む、実施形態1から14までのいずれか1つの系。
16.標的タンパク質が、疾患に関連するタンパク質、または治療用タンパク質である、実施形態1から15までのいずれか1つの系。
17.疾患が、単一遺伝子疾患である、実施形態16の系。
18.治療用タンパク質が、毒素である、実施形態17の系。
19.疾患および標的タンパク質が、表1に列挙されているものである、実施形態16から18までのいずれか1つの系。
20.第1の合成核酸分子、第2の合成核酸分子、第3の合成核酸分子、および/または第4の合成核酸分子が、第1の合成核酸分子、第2の合成核酸分子、第3の合成核酸分子、または第4の合成核酸分子の3’末端にポリアデニル化配列をさらに含む、実施形態1から19までのいずれか1つの系。
21.第1の合成核酸分子が、スプライスドナーに対して3’側かつ第1の二量体形成ドメインに対して5’側の下流イントロンスプライスエンハンサー(DISE)、スプライスドナーに対して3’側かつ第1の二量体形成ドメインに対して5’側のイントロンスプライスエンハンサー(ISE)の一方または両方をさらに含む;ならびに/または、第2の合成核酸分子が、第2の二量体形成ドメインに対して3’側かつ分岐点配列に対して5’側のISE、およびスプライスドナーに対して3’側かつ二量体形成ドメインに対して5’側のDISEのうちの一方または両方をさらに含む;ならびにこれらの任意の組合せである、実施形態1または4から20までのいずれか1つの系。
22.第1の合成核酸分子が、第1のスプライスドナーに対して3’側かつ第1の二量体形成ドメインに対して5’側のDISE、第1のスプライスドナーに対して3’側かつ第1の二量体形成ドメインに対して5’側のISE、またはDISEとISEの両方をさらに含む;第2の合成核酸分子が、第2の二量体形成ドメインに対して3’側かつ第1の分岐点配列に対して5’側のISE、第2のスプライスドナーに対して3’側かつ第2の二量体形成ドメインに対して5’側のDISE、第2のスプライスドナーに対して3’側かつ第3の二量体形成ドメインに対して5’側のISE、もしくはこれらの組合せをさらに含む;ならびに/または第3の合成核酸分子が、第4の二量体形成ドメインに対して3’側かつ第2の分岐点配列に対して5’側のISEをさらに含む;ならびにこれらの任意の組合せである、実施形態2または4から20までのいずれか1つの系。
23.第1の合成核酸分子が、第1のスプライスドナーに対して3’側かつ第1の二量体形成ドメインに対して5’側のDISE、第1のスプライスドナーに対して3’側かつ第1の二量体形成ドメインに対して5’側のISE、またはDISEとISEの両方をさらに含む;第2の合成核酸分子が、第2の二量体形成ドメインに対して3’側かつ第1の分岐点配列に対して5’側のISE、第2のスプライスドナーに対して3’側かつ第2の二量体形成ドメインに対して5’側のDISE、第2のスプライスドナーに対して3’側かつ第3の二量体形成ドメインに対して5’側のISE、もしくはこれらの組合せをさらに含む;第3の合成核酸分子が、第4の二量体形成ドメインに対して3’側かつ第2の分岐点配列に対して5’側のISEをさらに含む;ならびに/または第4の合成核酸分子が、第5の二量体形成ドメインに対して3’側かつ第3の分岐点配列に対して5’側のISE、第3のスプライスドナーに対して3’側かつ第5の二量体形成ドメインに対して5’側のDISE、第3のスプライスドナーに対して3’側かつ第6の二量体形成ドメインに対して5’側のISE、もしくはこれらの組合せをさらに含む;ならびにこれらの任意の組合せである、実施形態3から20までのいずれか1つの系。
24.細胞に導入されると、RNA分子を適当な順序で産生させ、組み換え、それにより、標的タンパク質の全長コード配列をもたらす、実施形態1から23までのいずれか1つの系。
25.第1の合成核酸分子、第2の合成核酸分子、第3の合成核酸分子および第4の合成核酸分子のそれぞれが、別々のウイルスベクターの一部である、実施形態1から24までのいずれか1つの系。
26.ウイルスベクターが、AAVである、実施形態25の系。
27.
第1の合成核酸分子および/または第3の合成核酸分子が、スプライスドナーに対して3’側の任意の場所に位置を占めた自己切断性RNA配列またはRNA切断酵素標的配列をさらに含み、したがって、当該配列により3’に位置するポリアデニル化尾部が切断されて、組み換えられていないRNA分子からのタンパク質断片の発現が低減または抑制される;
第2の合成核酸分子および/または第4の合成核酸分子が、分岐点配列に対して5’側の任意の場所に位置を占めた自己切断性RNA配列またはRNA切断酵素標的配列をさらに含み、したがって、当該配列により5’に位置するRNAキャップが切断されて、組み換えられていないRNA分子からのタンパク質断片の発現が低減または抑制される;
第2の合成核酸分子および/または第4の合成核酸分子が、スプライスアクセプターに対して3’側にあるオープンリーディングフレームに対してシフトされる開始コドンを分岐点配列に対して5’側の任意の場所にさらに含んで、組み換えられていないRNA分子からの標的タンパク質断片の翻訳が低減または抑制される;
第1の合成核酸分子および/または第3の合成核酸分子が、スプライスドナーに対して3’側の任意の場所にマイクロRNA標的部位をさらに含み、したがって、結合していないRNA断片が、核の外側に出るとマイクロRNA依存性分解を受ける;
第2の合成核酸分子および/または第4の合成核酸分子が、コード配列に対して3’側の任意の場所にマイクロRNA標的部位をさらに含み、したがって、結合していないRNA断片が、核の外側に出るとマイクロRNA依存性分解を受ける;
第1の合成核酸分子および/または第3の合成核酸分子が、デグロンタンパク質分解タグをコードする配列を、スプライスドナーに対して3’側の任意の場所にスプライスドナー部位の5’側にある標的タンパク質のオープンリーディングフレームとインフレームになるようにさらに含み、したがって、結合していないタンパク質断片が分解に関してタグ付けされる;
第2の合成核酸分子および/または第4の合成核酸分子が、開始コドンおよびインフレームのデグロンタンパク質分解タグを、分岐点配列に対して5’側の任意の場所にスプライスアクセプター部位の3’側の標的タンパク質のオープンリーディングフレームとインフレームになるようにさらに含み、したがって、結合していないタンパク質断片が分解に関してタグ付けされる;
またはこれらの組合せである、
実施形態1から26までのいずれか1つの系。
28.系の任意の1つ、2つ、3つ、または4つの合成核酸分子のそれぞれが、約2500nt~約5000nt、2,500nt~約2,750nt、約2,500nt~約3,000nt、約2,500nt~約3,250nt、約2,500nt~約3,500nt、約2,500nt~約3,750nt、約2,500nt~約4,000nt、約2,500nt~約4,250nt、約2,500nt~約4,500nt、約2,500nt~約4,750nt、約2,500nt~約5,000nt、約2,750nt~約3,000nt、約2,750nt~約3,250nt、約2,750nt~約3,500nt、約2,750nt~約3,750nt、約2,750nt~約4,000nt、約2,750nt~約4,250nt、約2,750nt~約4,500nt、約2,750nt~約4,750nt、約2,750nt~約5,000nt、約3,000nt~約3,250nt、約3,000nt~約3,500nt、約3,000nt~約3,750nt、約3,000nt~約4,000nt、約3,000nt~約4,250nt、約3,000nt~約4,500nt、約3,000nt~約4,750nt、約3,000nt~約5,000nt、約3,250nt~約3,500nt、約3,250nt~約3,750nt、約3,250nt~約4,000nt、約3,250nt~約4,250nt、約3,250nt~約4,500nt、約3,250nt~約4,750nt、約3,250nt~約5,000nt、約3,500nt~約3,750nt、約3,500nt~約4,000nt、約3,500nt~約4,250nt、約3,500nt~約4,500nt、約3,500nt~約4,750nt、約3,500nt~約5,000nt、約3,750nt~約4,000nt、約3,750nt~約4,250nt、約3,750nt~約4,500nt、約3,750nt~約4,750nt、約3,750nt~約5,000nt、約4,000nt~約4,250nt、約4,000nt~約4,500nt、約4,000nt~約4,750nt、約4,000nt~約5,000nt、約4,250nt~約4,500nt、約4,250nt~約4,750nt、約4,250nt~約5,000nt、約4,500nt~約4,750nt、約4,500nt~約5,000nt、約4,750nt~約5,000nt、約2,500nt、約2,750nt、約3,000nt、約3,250nt、約3,500nt、約3,750nt、約4,000nt、約4,250nt、約4,500nt、約4,750nt、および約5,000ntから独立に選択されるサイズを有する、実施形態1から27までのいずれか1つの系。
29.系の合成核酸分子によってコードされる標的タンパク質のN末端部分のコード配列、標的タンパク質の中間部分のコード配列、または標的タンパク質のC末端部分のコード配列のそれぞれが、約1000nt~約4000nt、約1,000nt~約1,500nt、約1,000nt~約2,000nt、約1,000nt~約2,500nt、約1,000nt~約3,000nt、約1,000nt~約3,500nt、約1,000nt~約4,000nt、約1,500nt~約2,000nt、約1,500nt~約2,500nt、約1,500nt~約3,000nt、約1,500nt~約3,500nt、約1,500nt~約4,000nt、約2,000nt~約2,500nt、約2,000nt~約3,000nt、約2,000nt~約3,500nt、約2,000nt~約4,000nt、約2,500nt~約3,000nt、約2,500nt~約3,500nt、約2,500nt~約4,000nt、約3,000nt~約3,500nt、約3,000nt~約4,000nt、約3,500nt~約4,000nt、約1,000nt、約1,500nt、約2,000nt、約2,500nt、約3,000nt、約3,500nt、および約4,000ntから独立に選択されるサイズを有する、実施形態1から28までのいずれか1つの系。
30.それぞれ系の1つ、2つ、3つまたは4つのいずれかの合成核酸分子によってコードされる1つ、2つ、3つ、または4つのいずれかのRNAのそれぞれが、約2500~4500nt、約2,500nt~約2,750nt、約2,500nt~約3,000nt、約2,500nt~約3,250nt、約2,500nt~約3,500nt、約2,500nt~約3,750nt、約2,500nt~約4,000nt、約2,500nt~約4,250nt、約2,500nt~約4,500nt、約2,750nt~約3,000nt、約2,750nt~約3,250nt、約2,750nt~約3,500nt、約2,750nt~約3,750nt、約2,750nt~約4,000nt、約2,750nt~約4,250nt、約2,750nt~約4,500nt、約3,000nt~約3,250nt、約3,000nt~約3,500nt、約3,000nt~約3,750nt、約3,000nt~約4,000nt、約3,000nt~約4,250nt、約3,000nt~約4,500nt、約3,250nt~約3,500nt、約3,250nt~約3,750nt、約3,250nt~約4,000nt、約3,250nt~約4,250nt、約3,250nt~約4,500nt、約3,500nt~約3,750nt、約3,500nt~約4,000nt、約3,500nt~約4,250nt、約3,500nt~約4,500nt、約3,750nt~約4,000nt、約3,750nt~約4,250nt、約3,750nt~約4,500nt、約4,000nt~約4,250nt、約4,000nt~約4,500nt、約4,250nt~約4,500nt、約2,500nt、約2,750nt、約3,000nt、約3,250nt、約3,500nt、約3,750nt、約4,000nt、約4,250nt、および約4,500ntから独立に選択されるサイズを有する、実施形態1から29までのいずれか1つの系。
31.合成核酸分子が、約5000nt~約10,000nt、約5,000nt~約5,500nt、約5,000nt~約6,000nt、約5,000nt~約6,500nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,000nt~約8,500nt、約5,000nt~約9,000nt、約5,000nt~約9,500nt、約5,000nt~約10,000nt、約5,500nt~約6,000nt、約5,500nt~約6,500nt、約5,500nt~約7,000nt、約5,500nt~約7,500nt、約5,500nt~約8,000nt、約5,500nt~約8,500nt、約5,500nt~約9,000nt、約5,500nt~約9,500nt、約5,500nt~約10,000nt、約6,000nt~約6,500nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,000nt~約8,500nt、約6,000nt~約9,000nt、約6,000nt~約9,500nt、約6,000nt~約10,000nt、約6,500nt~約7,000nt、約6,500nt~約7,500nt、約6,500nt~約8,000nt、約6,500nt~約8,500nt、約6,500nt~約9,000nt、約6,500nt~約9,500nt、約6,500nt~約10,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、約7,000nt~約8,500nt、約7,000nt~約9,000nt、約7,000nt~約9,500nt、約7,000nt~約10,000nt、約7,500nt~約8,000nt、約7,500nt~約8,500nt、約7,500nt~約9,000nt、約7,500nt~約9,500nt、約7,500nt~約10,000nt、約8,000nt~約8,500nt、約8,000nt~約9,000nt、約8,000nt~約9,500nt、約8,000nt~約10,000nt、約8,500nt~約9,000nt、約8,500nt~約9,500nt、約8,500nt~約10,000nt、約9,000nt~約9,500nt、約9,000nt~約10,000nt、約9,500nt~約10,000nt、約5,000nt、約5,500nt、約6,000nt、約6,500nt、約7,000nt、約7,500nt、約8,000nt、約8,500nt、約9,000nt、約9,500nt、および約10,000ntから選択される総サイズを有する;
総標的タンパク質コード配列が、約2000nt~約8000nt、約2,000nt~約3,000nt、約2,000nt~約3,500nt、約2,000nt~約4,000nt、約2,000nt~約4,500nt、約2,000nt~約5,000nt、約2,000nt~約5,500nt、約2,000nt~約6,000nt、約2,000nt~約6,500nt、約2,000nt~約7,000nt、約2,000nt~約7,500nt、約2,000nt~約8,000nt、約3,000nt~約3,500nt、約3,000nt~約4,000nt、約3,000nt~約4,500nt、約3,000nt~約5,000nt、約3,000nt~約5,500nt、約3,000nt~約6,000nt、約3,000nt~約6,500nt、約3,000nt~約7,000nt、約3,000nt~約7,500nt、約3,000nt~約8,000nt、約3,500nt~約4,000nt、約3,500nt~約4,500nt、約3,500nt~約5,000nt、約3,500nt~約5,500nt、約3,500nt~約6,000nt、約3,500nt~約6,500nt、約3,500nt~約7,000nt、約3,500nt~約7,500nt、約3,500nt~約8,000nt、約4,000nt~約4,500nt、約4,000nt~約5,000nt、約4,000nt~約5,500nt、約4,000nt~約6,000nt、約4,000nt~約6,500nt、約4,000nt~約7,000nt、約4,000nt~約7,500nt、約4,000nt~約8,000nt、約4,500nt~約5,000nt、約4,500nt~約5,500nt、約4,500nt~約6,000nt、約4,500nt~約6,500nt、約4,500nt~約7,000nt、約4,500nt~約7,500nt、約4,500nt~約8,000nt、約5,000nt~約5,500nt、約5,000nt~約6,000nt、約5,000nt~約6,500nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,500nt~約6,000nt、約5,500nt~約6,500nt、約5,500nt~約7,000nt、約5,500nt~約7,500nt、約5,500nt~約8,000nt、約6,000nt~約6,500nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,500nt~約7,000nt、約6,500nt~約7,500nt、約6,500nt~約8,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、または約7,500nt~約8,000ntから選択され、総標的タンパク質コード配列が、約2,000nt、約3,000nt、約3,500nt、約4,000nt、約4,500nt、約5,000nt、約5,500nt、約6,000nt、約6,500nt、約7,000nt、約7,500nt、および約8,000ntである;ならびに/または
2つの合成核酸分子によってコードされるRNAが、約5,000nt~約9000nt、約5,000nt~約5,500nt、約5,000nt~約6,000nt、約5,000nt~約6,500nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,000nt~約8,500nt、約5,000nt~約9,000nt、約5,500nt~約6,000nt、約5,500nt~約6,500nt、約5,500nt~約7,000nt、約5,500nt~約7,500nt、約5,500nt~約8,000nt、約5,500nt~約8,500nt、約5,500nt~約9,000nt、約6,000nt~約6,500nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,000nt~約8,500nt、約6,000nt~約9,000nt、約6,500nt~約7,000nt、約6,500nt~約7,500nt、約6,500nt~約8,000nt、約6,500nt~約8,500nt、約6,500nt~約9,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、約7,000nt~約8,500nt、約7,000nt~約9,000nt、約7,500nt~約8,000nt、約7,500nt~約8,500nt、約7,500nt~約9,000nt、約8,000nt~約8,500nt、約8,000nt~約9,000nt、もしくは約8,500nt~約9,000ntから選択される総サイズを有し、2つの合成核酸分子によってコードされるRNAが、約5,000nt、約5,500nt、約6,000nt、約6,500nt、約7,000nt、約7,500nt、約8,000nt、約8,500nt、および約9,000ntの総サイズを有する、
実施形態1および4から30までのいずれか1つの系。
32.合成核酸分子が、約7500nt~約15,000nt、約7,500nt~約8,500nt、約7,500nt~約9,500nt、約7,500nt~約10,000nt、約7,500nt~約10,500nt、約7,500nt~約11,000nt、約7,500nt~約11,500nt、約7,500nt~約12,000nt、約7,500nt~約12,500nt、約7,500nt~約13,000nt、約7,500nt~約14,000nt、約7,500nt~約15,000nt、約8,500nt~約9,500nt、約8,500nt~約10,000nt、約8,500nt~約10,500nt、約8,500nt~約11,000nt、約8,500nt~約11,500nt、約8,500nt~約12,000nt、約8,500nt~約12,500nt、約8,500nt~約13,000nt、約8,500nt~約14,000nt、約8,500nt~約15,000nt、約9,500nt~約10,000nt、約9,500nt~約10,500nt、約9,500nt~約11,000nt、約9,500nt~約11,500nt、約9,500nt~約12,000nt、約9,500nt~約12,500nt、約9,500nt~約13,000nt、約9,500nt~約14,000nt、約9,500nt~約15,000nt、約10,000nt~約10,500nt、約10,000nt~約11,000nt、約10,000nt~約11,500nt、約10,000nt~約12,000nt、約10,000nt~約12,500nt、約10,000nt~約13,000nt、約10,000nt~約14,000nt、約10,000nt~約15,000nt、約10,500nt~約11,000nt、約10,500nt~約11,500nt、約10,500nt~約12,000nt、約10,500nt~約12,500nt、約10,500nt~約13,000nt、約10,500nt~約14,000nt、約10,500nt~約15,000nt、約11,000nt~約11,500nt、約11,000nt~約12,000nt、約11,000nt~約12,500nt、約11,000nt~約13,000nt、約11,000nt~約14,000nt、約11,000nt~約15,000nt、約11,500nt~約12,000nt、約11,500nt~約12,500nt、約11,500nt~約13,000nt、約11,500nt~約14,000nt、約11,500nt~約15,000nt、約12,000nt~約12,500nt、約12,000nt~約13,000nt、約12,000nt~約14,000nt、約12,000nt~約15,000nt、約12,500nt~約13,000nt、約12,500nt~約14,000nt、約12,500nt~約15,000nt、約13,000nt~約14,000nt、約13,000nt~約15,000nt、または約14,000nt~約15,000ntから選択される総サイズを有し、合成核酸分子が、約7,500nt、約8,500nt、約9,500nt、約10,000nt、約10,500nt、約11,000nt、約11,500nt、約12,000nt、約12,500nt、約13,000nt、約14,000nt、および約15,000ntの総サイズを有する;
総標的タンパク質コード配列が、約3000nt~約12,000nt、約3,000nt~約4,000nt、約3,000nt~約5,000nt、約3,000nt~約6,000nt、約3,000nt~約7,000nt、約3,000nt~約7,500nt、約3,000nt~約8,000nt、約3,000nt~約8,500nt、約3,000nt~約9,000nt、約3,000nt~約1,000nt、約3,000nt~約11,000nt、約3,000nt~約12,000nt、約4,000nt~約5,000nt、約4,000nt~約6,000nt、約4,000nt~約7,000nt、約4,000nt~約7,500nt、約4,000nt~約8,000nt、約4,000nt~約8,500nt、約4,000nt~約9,000nt、約4,000nt~約1,000nt、約4,000nt~約11,000nt、約4,000nt~約12,000nt、約5,000nt~約6,000nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,000nt~約8,500nt、約5,000nt~約9,000nt、約5,000nt~約1,000nt、約5,000nt~約11,000nt、約5,000nt~約12,000nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,000nt~約8,500nt、約6,000nt~約9,000nt、約6,000nt~約1,000nt、約6,000nt~約11,000nt、約6,000nt~約12,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、約7,000nt~約8,500nt、約7,000nt~約9,000nt、約7,000nt~約1,000nt、約7,000nt~約11,000nt、約7,000nt~約12,000nt、約7,500nt~約8,000nt、約7,500nt~約8,500nt、約7,500nt~約9,000nt、約7,500nt~約1,000nt、約7,500nt~約11,000nt、約7,500nt~約12,000nt、約8,000nt~約8,500nt、約8,000nt~約9,000nt、約8,000nt~約1,000nt、約8,000nt~約11,000nt、約8,000nt~約12,000nt、約8,500nt~約9,000nt、約8,500nt~約1,000nt、約8,500nt~約11,000nt、約8,500nt~約12,000nt、約9,000nt~約1,000nt、約9,000nt~約11,000nt、約9,000nt~約12,000nt、約1,000nt~約11,000nt、約1,000nt~約12,000nt、もしくは約11,000nt~約12,000ntから選択され、総標的タンパク質コード配列が、約3,000nt、約4,000nt、約5,000nt、約6,000nt、約7,000nt、約7,500nt、約8,000nt、約8,500nt、約9,000nt、約1,000nt、約11,000nt、および約12,000ntである;ならびに/または
3つの合成核酸分子によってコードされるRNAが、約7500nt~約13,500nt、約7,500nt~約8,500nt、約7,500nt~約9,000nt、約7,500nt~約9,500nt、約7,500nt~約10,000nt、約7,500nt~約10,500nt、約7,500nt~約11,000nt、約7,500nt~約11,500nt、約7,500nt~約12,000nt、約7,500nt~約12,500nt、約7,500nt~約13,000nt、約7,500nt~約13,500nt、約8,500nt~約9,000nt、約8,500nt~約9,500nt、約8,500nt~約10,000nt、約8,500nt~約10,500nt、約8,500nt~約11,000nt、約8,500nt~約11,500nt、約8,500nt~約12,000nt、約8,500nt~約12,500nt、約8,500nt~約13,000nt、約8,500nt~約13,500nt、約9,000nt~約9,500nt、約9,000nt~約10,000nt、約9,000nt~約10,500nt、約9,000nt~約11,000nt、約9,000nt~約11,500nt、約9,000nt~約12,000nt、約9,000nt~約12,500nt、約9,000nt~約13,000nt、約9,000nt~約13,500nt、約9,500nt~約10,000nt、約9,500nt~約10,500nt、約9,500nt~約11,000nt、約9,500nt~約11,500nt、約9,500nt~約12,000nt、約9,500nt~約12,500nt、約9,500nt~約13,000nt、約9,500nt~約13,500nt、約10,000nt~約10,500nt、約10,000nt~約11,000nt、約10,000nt~約11,500nt、約10,000nt~約12,000nt、約10,000nt~約12,500nt、約10,000nt~約13,000nt、約10,000nt~約13,500nt、約10,500nt~約11,000nt、約10,500nt~約11,500nt、約10,500nt~約12,000nt、約10,500nt~約12,500nt、約10,500nt~約13,000nt、約10,500nt~約13,500nt、約11,000nt~約11,500nt、約11,000nt~約12,000nt、約11,000nt~約12,500nt、約11,000nt~約13,000nt、約11,000nt~約13,500nt、約11,500nt~約12,000nt、約11,500nt~約12,500nt、約11,500nt~約13,000nt、約11,500nt~約13,500nt、約12,000nt~約12,500nt、約12,000nt~約13,000nt、約12,000nt~約13,500nt、約12,500nt~約13,000nt、約12,500nt~約13,500nt、もしくは約13,000nt~約13,500ntから選択される総サイズを有し、2つの合成核酸分子によってコードされるRNAが、約7,500nt、約8,500nt、約9,000nt、約9,500nt、約10,000nt、約10,500nt、約11,000nt、約11,500nt、約12,000nt、約12,500nt、約13,000nt、および約13,500ntの総サイズを有する、
実施形態2および4から30までのいずれか1つの系。
33.合成核酸分子が、約10,000nt~約20,000nt、約10,000nt~約11,000nt、約10,000nt~約12,000nt、約10,000nt~約13,000nt、約10,000nt~約14,000nt、約10,000nt~約15,000nt、約10,000nt~約16,000nt、約10,000nt~約17,000nt、約10,000nt~約18,000nt、約10,000nt~約19,000nt、約10,000nt~約20,000nt、約11,000nt~約12,000nt、約11,000nt~約13,000nt、約11,000nt~約14,000nt、約11,000nt~約15,000nt、約11,000nt~約16,000nt、約11,000nt~約17,000nt、約11,000nt~約18,000nt、約11,000nt~約19,000nt、約11,000nt~約20,000nt、約12,000nt~約13,000nt、約12,000nt~約14,000nt、約12,000nt~約15,000nt、約12,000nt~約16,000nt、約12,000nt~約17,000nt、約12,000nt~約18,000nt、約12,000nt~約19,000nt、約12,000nt~約20,000nt、約13,000nt~約14,000nt、約13,000nt~約15,000nt、約13,000nt~約16,000nt、約13,000nt~約17,000nt、約13,000nt~約18,000nt、約13,000nt~約19,000nt、約13,000nt~約20,000nt、約14,000nt~約15,000nt、約14,000nt~約16,000nt、約14,000nt~約17,000nt、約14,000nt~約18,000nt、約14,000nt~約19,000nt、約14,000nt~約20,000nt、約15,000nt~約16,000nt、約15,000nt~約17,000nt、約15,000nt~約18,000nt、約15,000nt~約19,000nt、約15,000nt~約20,000nt、約16,000nt~約17,000nt、約16,000nt~約18,000nt、約16,000nt~約19,000nt、約16,000nt~約20,000nt、約17,000nt~約18,000nt、約17,000nt~約19,000nt、約17,000nt~約20,000nt、約18,000nt~約19,000nt、約18,000nt~約20,000nt、もしくは約19,000nt~約20,000ntから選択される総サイズを有し、合成核酸分子が、約10,000nt、約11,000nt、約12,000nt、約13,000nt、約14,000nt、約15,000nt、約16,000nt、約17,000nt、約18,000nt、約19,000nt、および約20,000ntの総サイズを有する;
総標的タンパク質コード配列が、約4000nt~約16,000nt、約5,000nt~約6,000nt、約5,000nt~約7,000nt、約5,000nt~約8,000nt、約5,000nt~約9,000nt、約5,000nt~約10,000nt、約5,000nt~約11,000nt、約5,000nt~約12,000nt、約5,000nt~約13,000nt、約5,000nt~約14,000nt、約5,000nt~約15,000nt、約5,000nt~約16,000nt、約6,000nt~約7,000nt、約6,000nt~約8,000nt、約6,000nt~約9,000nt、約6,000nt~約10,000nt、約6,000nt~約11,000nt、約6,000nt~約12,000nt、約6,000nt~約13,000nt、約6,000nt~約14,000nt、約6,000nt~約15,000nt、約6,000nt~約16,000nt、約7,000nt~約8,000nt、約7,000nt~約9,000nt、約7,000nt~約10,000nt、約7,000nt~約11,000nt、約7,000nt~約12,000nt、約7,000nt~約13,000nt、約7,000nt~約14,000nt、約7,000nt~約15,000nt、約7,000nt~約16,000nt、約8,000nt~約9,000nt、約8,000nt~約10,000nt、約8,000nt~約11,000nt、約8,000nt~約12,000nt、約8,000nt~約13,000nt、約8,000nt~約14,000nt、約8,000nt~約15,000nt、約8,000nt~約16,000nt、約9,000nt~約10,000nt、約9,000nt~約11,000nt、約9,000nt~約12,000nt、約9,000nt~約13,000nt、約9,000nt~約14,000nt、約9,000nt~約15,000nt、約9,000nt~約16,000nt、約10,000nt~約11,000nt、約10,000nt~約12,000nt、約10,000nt~約13,000nt、約10,000nt~約14,000nt、約10,000nt~約15,000nt、約10,000nt~約16,000nt、約11,000nt~約12,000nt、約11,000nt~約13,000nt、約11,000nt~約14,000nt、約11,000nt~約15,000nt、約11,000nt~約16,000nt、約12,000nt~約13,000nt、約12,000nt~約14,000nt、約12,000nt~約15,000nt、約12,000nt~約16,000nt、約13,000nt~約14,000nt、約13,000nt~約15,000nt、約13,000nt~約16,000nt、約14,000nt~約15,000nt、約14,000nt~約16,000nt、または約15,000nt~約16,000ntから選択され、総標的タンパク質コード配列が、約5,000nt、約6,000nt、約7,000nt、約8,000nt、約9,000nt、約10,000nt、約11,000nt、約12,000nt、約13,000nt、約14,000nt、約15,000nt、もしくは約16,000ntであり、総標的タンパク質コード配列が、少なくとも約5,000nt、約6,000nt、約7,000nt、約8,000nt、約9,000nt、約10,000nt、約11,000nt、約12,000nt、約13,000nt、約14,000nt、および約15,000ntである;ならびに/または、
2つの合成核酸分子によってコードされるRNAが、約10,000nt~約18,000nt、約10,000nt~約11,000nt、約10,000nt~約12,000nt、約10,000nt~約13,000nt、約10,000nt~約14,000nt、約10,000nt~約15,000nt、約10,000nt~約16,000nt、約10,000nt~約17,000nt、約10,000nt~約18,000nt、約11,000nt~約12,000nt、約11,000nt~約13,000nt、約11,000nt~約14,000nt、約11,000nt~約15,000nt、約11,000nt~約16,000nt、約11,000nt~約17,000nt、約11,000nt~約18,000nt、約12,000nt~約13,000nt、約12,000nt~約14,000nt、約12,000nt~約15,000nt、約12,000nt~約16,000nt、約12,000nt~約17,000nt、約12,000nt~約18,000nt、約13,000nt~約14,000nt、約13,000nt~約15,000nt、約13,000nt~約16,000nt、約13,000nt~約17,000nt、約13,000nt~約18,000nt、約14,000nt~約15,000nt、約14,000nt~約16,000nt、約14,000nt~約17,000nt、約14,000nt~約18,000nt、約15,000nt~約16,000nt、約15,000nt~約17,000nt、約15,000nt~約18,000nt、約16,000nt~約17,000nt、約16,000nt~約18,000nt、もしくは約17,000nt~約18,000ntから選択される総サイズを有し、2つの合成核酸分子によってコードされるRNAが、約10,000nt、約11,000nt、約12,000nt、約13,000nt、約14,000nt、約15,000nt、約16,000nt、約17,000nt、および約18,000ntの総サイズを有する、
実施形態3および4から30までのいずれか1つの系。
34.RNA組換え効率が、約10%~約95%、約10%~約20%、約10%~約30%、約10%~約35%、約10%~約40%、約10%~約45%、約10%~約50%、約10%~約55%、約10%~約60%、約10%~約70%、約10%~約80%、約10%~約90%、約20%~約30%、約20%~約35%、約20%~約40%、約20%~約45%、約20%~約50%、約20%~約55%、約20%~約60%、約20%~約70%、約20%~約80%、約20%~約90%、約30%~約35%、約30%~約40%、約30%~約45%、約30%~約50%、約30%~約55%、約30%~約60%、約30%~約70%、約30%~約80%、約30%~約90%、約35%~約40%、約35%~約45%、約35%~約50%、約35%~約55%、約35%~約60%、約35%~約70%、約35%~約80%、約35%~約90%、約40%~約45%、約40%~約50%、約40%~約55%、約40%~約60%、約40%~約70%、約40%~約80%、約40%~約90%、約45%~約50%、約45%~約55%、約45%~約60%、約45%~約70%、約45%~約80%、約45%~約90%、約50%~約55%、約50%~約60%、約50%~約70%、約50%~約80%、約50%~約90%、約55%~約60%、約55%~約70%、約55%~約80%、約55%~約90%、約60%~約70%、約60%~約80%、約60%~約90%、約70%~約80%、約70%~約90%、約80%~約90%、約10%、約20%、約30%、約35%、約40%、約45%、約50%、約55%、約60%、約70%、約80%、または約90%、または約95%である、実施形態1から33までのいずれか1つの系。
35.第1の二量体形成ドメインおよび第2の二量体形成ドメイン、第3の二量体形成ドメインおよび第4の二量体形成ドメイン、ならびに/または第5の二量体形成ドメインおよび第6の二量体形成ドメインのそれぞれが、1000nt以下、例えば、少なくとも50nt、少なくとも100nt、少なくとも150nt、少なくとも200nt、少なくとも300nt、少なくとも400nt、少なくとも500nt、50~1000nt、50~500nt、50~150nt、50nt、100nt、150nt、200nt、250nt、300nt、400nt、または500ntであり;系の組換え効率が、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、または少なくとも約95%である、実施形態1から34までのいずれか1つの系。
36.各二量体形成ドメインが、1000nt以下、例えば、少なくとも50nt、少なくとも100nt、少なくとも150nt、少なくとも200nt、少なくとも300nt、少なくとも400nt、少なくとも500nt、50~1000nt、50~500nt、50~150nt、50nt、100nt、150nt、200nt、250nt、300nt、400nt、または500ntであり;系の組換え効率が、少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも75%、少なくとも80%、または少なくとも90%である、実施形態1から35までのいずれか1つの系。
37.実施形態1から36までのいずれか1つの系を含む組成物。
38.実施形態1から37までのいずれか1つに記載のRNA分子を含む組成物。
39.実施形態1から37までのいずれか1つに記載のRNA分子を1つ、2つ、3つ、または4つ含む組成物。
40.それぞれジストロフィン、第8因子、ABCA4、またはMYO7Aの少なくとも一部分をコードする、第1の合成核酸またはRNA分子、第2の合成核酸またはRNA分子、第3の合成核酸またはRNA分子および必要に応じて第4の合成核酸またはRNA分子を含む、実施形態37から39までのいずれか1つの組成物。
41.実施形態1から36までのいずれか1つに記載のRNA分子。
42.実施形態1から41までのいずれか1つの系、または実施形態37から40までのいずれか1つの組成物を含み、第1の合成核酸分子、第2の合成核酸分子、第3の合成核酸分子および第4の合成核酸分子のいずれかが別々の容器に入っていてよく、必要に応じて薬学的に許容される担体などのバッファーをさらに含む、キット。
43.細胞において標的タンパク質を発現させる方法であって、実施形態1から36までのいずれか1つの系または実施形態35から37までのいずれか1つの組成物を細胞に導入するステップと、第1の合成RNA分子と第2の合成RNA分子、第1の合成RNA分子、第2の合成RNA分子、および第3の合成RNA分子、または第1の合成RNA分子、第2の合成RNA分子、第3の合成RNA分子および第4の合成RNA分子を細胞において発現させるステップとを含み、細胞において標的タンパク質が産生される、方法。
44.細胞が、対象内に存在し、導入するステップが、系を治療有効量で対象に投与することを含む、実施形態43の方法。
45.対象における標的タンパク質をコードする遺伝子の変異によって引き起こされる遺伝子疾患を処置し、対象における機能的標的タンパク質の発現をもたらす、実施形態44の方法。
46.
遺伝子疾患がデュシェンヌ型筋ジストロフィーであり、標的タンパク質がジストロフィンである;
遺伝子疾患が血友病Aであり、標的タンパク質がF8である;
遺伝子疾患がスタルガルト病であり、標的タンパク質がABCA4である;または
遺伝子疾患がアッシャー症候群であり、標的タンパク質がMYO7Aである、
実施形態45の方法。
47.配列番号1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、145、146、147、148、155、156、157、158、159、160、161、162、163、164、165、および166のうちのいずれか1つに提示される合成イントロンに対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%、または100%の配列同一性を含む核酸分子。
48.合成イントロンが、配列番号20のnt3703~3975、配列番号21のnt1~228、配列番号22のnt3703~3975、配列番号23のnt1~225、配列番号24のnt3560~3828、または配列番号25のnt1~225である、実施形態47の核酸分子。
49.タンパク質コード配列の一部をさらに含む、実施形態47または48の合成核酸分子。
50.タンパク質コード配列の一部が、タンパク質コード配列のN末端側半分、N末端側の3分の1、中間部分、C末端側半分、またはC末端側の3分の1を含む、実施形態49の合成核酸分子。
51.少なくとも1つの合成核酸分子が、実施形態47から50までのいずれか1つに記載の核酸分子を含む合成イントロンを含む、実施形態1から36までのいずれか1つの系または実施形態37から40までのいずれか1つの組成物。
52.合成核酸が、逆転写酵素によるRNAウイルスゲノムの転写によって生じたDNAである、先行する実施形態のいずれかの組成物、系、方法、またはキット。
VIII.例示的な実施形態-3
1.標的タンパク質を発現させるための組成物であって、(a)第1のRNA分子であって、5’から3’に、(i)標的タンパク質のN末端部分のコード配列;(ii)スプライスドナー;および(iii)第1の二量体形成ドメインを含む、第1のRNA分子;ならびに(b)第2のRNA分子であって、5’から3’に、(i)第1の二量体形成ドメインに結合する第2の二量体形成ドメイン;(ii)分岐点配列;(iii)ポリピリミジントラクト;(iv)スプライスアクセプター;および(v)標的タンパク質のC末端部分のコード配列を含む、第2のRNA分子を含む、組成物。
2.標的タンパク質を発現させるための組成物であって(a)第1のRNA分子であって、5’から3’に、(i)標的タンパク質のN末端部分のコード配列;(ii)スプライスドナー;および(iii)第1の二量体形成ドメインを含む、第1のRNA分子;ならびに(b)第2のRNA分子であって、5’から3’に、(i)第1の二量体形成ドメインに結合する第2の二量体形成ドメイン;(ii)分岐点配列;(iii)ポリピリミジントラクト;(iv)スプライスアクセプター;(v)標的タンパク質の中間部分のコード配列;(vi)第2のスプライスドナー;および(vii)第3の二量体形成ドメインを含む、第2のRNA分子;ならびに(c)第3のRNA分子であって、5’から3’に、(i)第3の二量体形成ドメインに結合する第4の二量体形成ドメイン;(ii)分岐点配列;(iii)ポリピリミジントラクト;(iv)スプライスアクセプター;および(v)標的タンパク質のC末端部分のコード配列を含む、第3のRNA分子を含む、組成物。
3.標的タンパク質を発現させるための組成物であって(a)第1のRNA分子であって、5’から3’に、(i)標的タンパク質のN末端部分のコード配列、(ii)スプライスドナー;および(iii)第1の二量体形成ドメインを含む、第1のRNA分子;(b)第2のRNA分子であって、5’から3’に、(i)第1の二量体形成ドメインに結合する第2の二量体形成ドメイン;(ii)分岐点配列;(iii)ポリピリミジントラクト;(iv)スプライスアクセプター;(v)標的タンパク質の中間部分のコード配列;(vi)第2のスプライスドナー;および(vii)第3の二量体形成ドメインを含む、第2のRNA分子;ならびに(c)第3のRNA分子であって、5’から3’に、(i)第3の二量体形成ドメインに結合する第4の二量体形成ドメイン;(ii)分岐点配列;(iii)ポリピリミジントラクト;(iv)スプライスアクセプター;(v)標的タンパク質の第1の中間部分のコード配列;(vi)第2のスプライスドナー;および(vii)第5の二量体形成ドメインを含む、第3のRNA分子;ならびに(d)第4のRNA分子であって、5’から3’に、(i)第5の二量体形成ドメインに結合する第6の二量体形成ドメイン;(ii)分岐点配列;(iii)ポリピリミジントラクト;(iv)スプライスアクセプター;および(v)標的タンパク質のC末端部分のコード配列を含む、第4のRNA分子を含む、組成物。
4.第1の二量体形成ドメインと第2の二量体形成ドメイン、第3の二量体形成ドメインと第4の二量体形成ドメイン、および/または第5の二量体形成ドメインと第6の二量体形成ドメインが、直接結合、間接結合、またはこれらの組合せによって結合している、実施形態1から3までのいずれか1つに記載の組成物。
5 直接結合または間接結合が、塩基対合相互作用、非標準的な塩基対合相互作用、非塩基対合相互作用、またはこれらの組合せを含む、実施形態4に記載の組成物。
6 直接結合が、キッシングループ間または低多様性領域間の塩基対合相互作用を含む、実施形態4または5に記載の組成物。
7 直接結合が、アプタマー領域間の非標準的な塩基対合相互作用、非標準的な塩基対合相互作用、非塩基対合相互作用、またはこれらの組合せを含む、実施形態4または5に記載の組成物。
8 間接結合が、核酸架橋を通じた塩基対合相互作用を含む、実施形態4または5に記載の組成物。
9.間接結合が、アプタマーとアプタマーの標的剤との間、または2つのアプタマー間の非塩基対合相互作用を含む、請求項4または5に記載の組成物。
10.第1の二量体形成ドメイン、第2の二量体形成ドメイン、第3の二量体形成ドメイン、第4の二量体形成ドメイン、第5の二量体形成ドメインおよび/または第6の二量体形成ドメインが、潜在スプライスアクセプターを含まない、実施形態1から9までのいずれか1つに記載の組成物。
11.直接結合しているかまたは間接的に結合しているアプタマー配列二量体形成ドメインの対を少なくとも1つ含む、実施形態1から10までのいずれか1つに記載の組成物。
12.キッシングループ相互作用二量体形成ドメインの対を少なくとも1つ含む、実施形態1から11までのいずれか1つに記載の組成物。
13.標的タンパク質が、疾患に関連するタンパク質、または治療用タンパク質である、実施形態1から12までのいずれか1つに記載の組成物。
14.疾患が、単一遺伝子疾患である、実施形態13の組成物。
15.治療用タンパク質が、毒素である、実施形態14の組成物。
16.疾患および標的タンパク質が、表1に列挙されているものである、実施形態13から15までのいずれか1つに記載の組成物。
17.第1のRNA分子、第2のRNA分子、第3のRNA分子、および/または第4のRNA分子が、第1のRNA分子、第2のRNA分子、第3のRNA分子、または第4のRNA分子の3’末端にポリA尾部をさらに含む、実施形態1から16までのいずれか1つに記載の組成物。
18 前記第1のRNA分子が、前記スプライスドナーに対して3’側であり前記第1の二量体形成ドメインに対して5’側の下流イントロンスプライスエンハンサー(DISE)、前記スプライスドナーに対して3’側であり前記第1の二量体形成ドメインに対して5’側のイントロンスプライスエンハンサー(ISE)のうちの一方もしくは両方をさらに含む;および/または
前記第2のRNA分子が、前記第2の二量体形成ドメインに対して3’側であり前記分岐点配列に対して5’側のISE、および前記スプライスドナーに対して3’側であり前記二量体形成ドメインに対して5’側のDISEのうちの一方もしくは両方をさらに含む;
またはこれらの任意の組合せである、実施形態1または4から17までのいずれか一項に記載の組成物。
19.
第1のRNA分子が、第1のスプライスドナーに対して3’側かつ第1の二量体形成ドメインに対して5’側のDISE、第1のスプライスドナーに対して3’側かつ第1の二量体形成ドメインに対して5’側のISE、もしくは両方をさらに含む;
RNA分子が、第2の二量体形成ドメインに対して3’側かつ第1の分岐点配列に対して5’側のISE、第2のスプライスドナーに対して3’側かつ第2の二量体形成ドメインに対して5’側のDISE、第2のスプライスドナーに対して3’側かつ第3の二量体形成ドメインに対して5’側のISE、もしくはこれらの任意の組合せをさらに含む;ならびに/または
第3のRNA分子が、第4の二量体形成ドメインに対して3’側かつ第2の分岐点配列に対して5’側のISEをさらに含む;
またはこれらの任意の組合せである、
実施形態2または4から17までのいずれか1つの組成物。
20.
第1のRNA分子が、第1のスプライスドナーに対して3’側かつ第1の二量体形成ドメインに対して5’側のDISE、第1のスプライスドナーに対して3’側かつ第1の二量体形成ドメインに対して5’側のISE、または両方をさらに含む;
第2のRNA分子が、第2の二量体形成ドメインに対して3’側かつ第1の分岐点配列に対して5’側のISE、第2のスプライスドナーに対して3’側かつ第2の二量体形成ドメインに対して5’側のDISE、第2のスプライスドナーに対して3’側かつ第3の二量体形成ドメインに対して5’側のISE、もしくはこれらの任意の組合せをさらに含む;
第3のRNA分子が、第4の二量体形成ドメインに対して3’側かつ第2の分岐点配列に対して5’側のISEをさらに含む;ならびに/または
第4のRNA分子が、第5の二量体形成ドメインに対して3’側かつ第3の分岐点配列に対して5’側のISE、第3のスプライスドナーに対して3’側かつ第5の二量体形成ドメインに対して5’側のDISE、第3のスプライスドナーに対して3’側かつ第6の二量体形成ドメインに対して5’側のISE、もしくはこれらの任意の組合せをさらに含む;
またはこれらの任意の組合せである、
実施形態3から17までのいずれか1つの組成物。
24. 第1のRNA分子および/または第3のRNA分子が、スプライスドナーに対して3’側の任意の場所に位置を占めた自己切断性RNA配列またはRNA切断酵素標的配列をさらに含み、したがって、当該配列により3’に位置するポリアデニル化尾部が切断されて、組み換えられていないRNA分子からのタンパク質断片の発現が低減または抑制される;
第2のRNA分子および/または第4のRNA分子が、分岐点配列に対して5’側の任意の場所に位置を占めた自己切断性RNA配列またはRNA切断酵素標的配列をさらに含み、したがって、当該配列により5’に位置するRNAキャップが切断されて、組み換えられていないRNA分子からのタンパク質断片の発現が低減または抑制される;
第2のRNA分子および/または第4のRNA分子が、スプライスアクセプターに対して3’側にあるオープンリーディングフレームに対してシフトされる開始コドンを分岐点配列に対して5’側の任意の場所にさらに含んで、組み換えられていないRNA分子からの標的タンパク質断片の翻訳が低減または抑制される;
第1のRNA分子および/または第3のRNA分子が、スプライスドナーに対して3’側の任意の場所にマイクロRNA標的部位をさらに含み、したがって、結合していないRNA断片が、核の外側に出るとマイクロRNA依存性分解を受ける;
第2のRNA分子および/または第4のRNA分子が、コード配列に対して3’側の任意の場所にマイクロRNA標的部位をさらに含み、したがって、結合していないRNA断片が、核の外側に出るとマイクロRNA依存性分解を受ける;
第1のRNA分子および/または第3のRNA分子が、デグロンタンパク質分解タグをコードする配列を、スプライスドナーに対して3’側の任意の場所にスプライスドナー部位の5’側にある標的タンパク質のオープンリーディングフレームとインフレームになるようにさらに含み、したがって、結合していないタンパク質断片が分解に関してタグ付けされる;
第2のRNA分子および/または第4のRNA分子が、開始コドンおよびインフレームのデグロンタンパク質分解タグを、分岐点配列に対して5’側の任意の場所にスプライスアクセプター部位の3’側の標的タンパク質のオープンリーディングフレームとインフレームになるようにさらに含み、したがって、結合していないタンパク質断片が分解に関してタグ付けされる;
またはこれらの任意の組合せである、
実施形態1から23までのいずれか1つの組成物。
25.標的タンパク質を発現させるための組成物であって、(a)実施形態1および4から24までのいずれか1つの第1のRNA分子をコードする第1の合成DNA分子であって、(i)第1のRNA分子をコードする配列に作動可能に連結した第1のプロモーターを含む、第1の合成DNA分子;ならびに(b)実施形態1および4から24までのいずれか1つの第2のRNA分子をコードする第2の合成DNA分子であって、(i)第2のRNA分子をコードする配列に作動可能に連結した第2のプロモーターを含む、第2の合成DNA分子を含む組成物。
26.標的タンパク質を発現させるための組成物であって、(a)実施形態2および4から24までのいずれか1つの第1のRNA分子をコードする第1の合成DNA分子であって、(i)第1のRNA分子をコードする配列に作動可能に連結した第1のプロモーターを含む、第1の合成DNA分子;(b)実施形態2および4から24までのいずれか1つの第2のRNA分子をコードする第2の合成DNA分子であって、(i)第2のRNA分子をコードする配列に作動可能に連結した第2のプロモーターを含む、第2の合成DNA分子;および(c)実施形態2および4から24までのいずれか1つの第3のRNA分子をコードする第3の合成DNA分子であって、(i)第3のRNA分子をコードする配列に作動可能に連結した第3のプロモーターを含む、第3の合成DNA分子を含む組成物。
27.標的タンパク質を発現させるための組成物であって、(a)実施形態3および4から24までのいずれか1つの第1のRNA分子をコードする第1の合成DNA分子であって、(i)第1のRNA分子をコードする配列に作動可能に連結した第1のプロモーターを含む、第1の合成DNA分子;(b)実施形態3および4から24までのいずれか1つの第2のRNA分子をコードする第2の合成DNA分子であって、(i)第2のRNA分子をコードする配列に作動可能に連結した第2のプロモーターを含む、第2の合成DNA分子;(c)実施形態3および4から24までのいずれか1つの第3のRNA分子をコードする第3の合成DNA分子であって、(i)第3のRNA分子をコードする配列に作動可能に連結した第3のプロモーターを含む、第3の合成DNA分子;および(d)実施形態3および4から24までのいずれか1つの第4のRNA分子をコードする第4の合成DNA分子であって、(i)第4のRNA分子をコードする配列に作動可能に連結した第4のプロモーターを含む、第4の合成DNA分子を含む組成物。
28.各プロモーターが、独立に選択される、実施形態25から27までのいずれか1つの組成物。
29.
第1のプロモーターと第2のプロモーターが同じプロモーターである;
第1のプロモーターと第2のプロモーターが異なるプロモーターである;
第1のプロモーター、第2のプロモーター、および第3のプロモーターが同じプロモーターである;
第1のプロモーター、第2のプロモーター、および第3のプロモーターが異なるプロモーターである;
第1のプロモーター、第2のプロモーター、第3のプロモーター、および第4のプロモーターが同じプロモーターである;または、
第1のプロモーター、第2のプロモーター、第3のプロモーターおよび第4のプロモーターが異なるプロモーターである、
実施形態25から28までのいずれか1つの組成物。
30.第1のプロモーター、第2のプロモーター、第3のプロモーター、および第4のプロモーターのそれぞれが、独立に、構成的プロモーター;組織特異的プロモーター;および標的タンパク質に対して内因性のプロモーターから選択される、実施形態25から29までのいずれか1つの組成物。
31.実施形態25から30までのいずれか1つの組成物を含む、標的タンパク質を発現させるための系。
32.細胞に導入されると、RNA分子を適当な順序で産生させ、組み換え、それにより、標的タンパク質の全長コード配列をもたらす、実施形態31の系。
33.第1のRNA分子および第2のRNA分子(2つの部分からなる系において)のそれぞれ、第1のRNA分子、第2のRNA分子および第3のRNA分子(3つの部分からなる系において)のそれぞれ、または第1のRNA分子、第2のRNA分子、第3のRNA分子および第4のRNA分子(4つの部分からなる系において)のそれぞれが、別々のウイルスベクターから転写される、実施形態31または32に記載の系。
34.ウイルスベクターが、AAVである、実施形態31から33までのいずれか1つの系。
35.系の第1の合成DNA分子、第2の合成DNA分子、第3の合成DNA分子、または第4の合成DNA分子のそれぞれが、約2500nt~約5000nt、2,500nt~約2,750nt、約2,500nt~約3,000nt、約2,500nt~約3,250nt、約2,500nt~約3,500nt、約2,500nt~約3,750nt、約2,500nt~約4,000nt、約2,500nt~約4,250nt、約2,500nt~約4,500nt、約2,500nt~約4,750nt、約2,500nt~約5,000nt、約2,750nt~約3,000nt、約2,750nt~約3,250nt、約2,750nt~約3,500nt、約2,750nt~約3,750nt、約2,750nt~約4,000nt、約2,750nt~約4,250nt、約2,750nt~約4,500nt、約2,750nt~約4,750nt、約2,750nt~約5,000nt、約3,000nt~約3,250nt、約3,000nt~約3,500nt、約3,000nt~約3,750nt、約3,000nt~約4,000nt、約3,000nt~約4,250nt、約3,000nt~約4,500nt、約3,000nt~約4,750nt、約3,000nt~約5,000nt、約3,250nt~約3,500nt、約3,250nt~約3,750nt、約3,250nt~約4,000nt、約3,250nt~約4,250nt、約3,250nt~約4,500nt、約3,250nt~約4,750nt、約3,250nt~約5,000nt、約3,500nt~約3,750nt、約3,500nt~約4,000nt、約3,500nt~約4,250nt、約3,500nt~約4,500nt、約3,500nt~約4,750nt、約3,500nt~約5,000nt、約3,750nt~約4,000nt、約3,750nt~約4,250nt、約3,750nt~約4,500nt、約3,750nt~約4,750nt、約3,750nt~約5,000nt、約4,000nt~約4,250nt、約4,000nt~約4,500nt、約4,000nt~約4,750nt、約4,000nt~約5,000nt、約4,250nt~約4,500nt、約4,250nt~約4,750nt、約4,250nt~約5,000nt、約4,500nt~約4,750nt、約4,500nt~約5,000nt、約4,750nt~約5,000nt、約2,500nt、約2,750nt、約3,000nt、約3,250nt、約3,500nt、約3,750nt、約4,000nt、約4,250nt、約4,500nt、約4,750nt、および約5,000ntから独立に選択されるサイズを有する、実施形態31から34までのいずれか1つの系。
36.系の合成DNA分子によってコードされる標的タンパク質のN末端部分のコード配列(2つの部分からなる系、3つの部分からなる系、または4つの部分からなる系において)、標的タンパク質の中間部分のコード配列(3つの部分からなる系において)、標的タンパク質の第1の中間部分のコード配列(4つの部分からなる系において)、または標的タンパク質のC末端部分のコード配列(2つの部分からなる系、3つの部分からなる系、または4つの部分からなる系において)は、約1,000nt~約4,500ntから独立に選択されるサイズをそれぞれが有し、から独立に選択されるサイズをそれぞれが有し、約1,000nt~約1,500nt、約1,000nt~約2,000nt、約1,000nt~約2,500nt、約1,000nt~約3,000nt、約1,000nt~約3,500nt、約1,000nt~約4,000nt、約1,000nt~約4,500nt、約1,500nt~約2,000nt、約1,500nt~約2,500nt、約1,500nt~約3,000nt、約1,500nt~約3,500nt、約1,500nt~約4,000nt、約1,500nt~約4,500nt、約2,000nt~約2,500nt、約2,000nt~約3,000nt、約2,000nt~約3,500nt、約2,000nt~約4,000nt、約2,000nt~約4,500nt、約2,500nt~約3,000nt、約2,500nt~約3,500nt、約2,500nt~約4,000nt、約2,500nt~約4,500nt、約3,000nt~約3,500nt、約3,000nt~約4,000nt、約3,000nt~約4,500nt、約3,500nt~約4,000nt、約3,500nt~約4,500nt、約4,000nt~約4,500nt、約1,000nt、約1,500nt、約2,000nt、約2,500nt、約3,000nt、約3,500nt、約4,000nt、または約4,500ntから独立に選択されるサイズをそれぞれが有する、実施形態31から35までのいずれか1つの系。
37.それぞれ系の1つ、2つ、3つ、または4つの合成DNA分子のいずれかによってコードされる1つ、2つ、3つ、または4つのRNA分子のいずれかが、それぞれ、約2500~4500nt、約2,500nt~約2,750nt、約2,500nt~約3,000nt、約2,500nt~約3,250nt、約2,500nt~約3,500nt、約2,500nt~約3,750nt、約2,500nt~約4,000nt、約2,500nt~約4,250nt、約2,500nt~約4,500nt、約2,750nt~約3,000nt、約2,750nt~約3,250nt、約2,750nt~約3,500nt、約2,750nt~約3,750nt、約2,750nt~約4,000nt、約2,750nt~約4,250nt、約2,750nt~約4,500nt、約3,000nt~約3,250nt、約3,000nt~約3,500nt、約3,000nt~約3,750nt、約3,000nt~約4,000nt、約3,000nt~約4,250nt、約3,000nt~約4,500nt、約3,250nt~約3,500nt、約3,250nt~約3,750nt、約3,250nt~約4,000nt、約3,250nt~約4,250nt、約3,250nt~約4,500nt、約3,500nt~約3,750nt、約3,500nt~約4,000nt、約3,500nt~約4,250nt、約3,500nt~約4,500nt、約3,750nt~約4,000nt、約3,750nt~約4,250nt、約3,750nt~約4,500nt、約4,000nt~約4,250nt、約4,000nt~約4,500nt、約4,250nt~約4,500nt、約2,500nt、約2,750nt、約3,000nt、約3,250nt、約3,500nt、約3,750nt、約4,000nt、約4,250nt、および約4,500ntから独立に選択されるサイズを有する、実施形態31から36までのいずれか1つの系。
38.実施形態25および28から30までの組成物を含み、
第1の合成DNA分子および第2の合成DNA分子が、約5000nt~約10,000nt、約5,000nt~約5,500nt、約5,000nt~約6,000nt、約5,000nt~約6,500nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,000nt~約8,500nt、約5,000nt~約9,000nt、約5,000nt~約9,500nt、約5,000nt~約10,000nt、約5,500nt~約6,000nt、約5,500nt~約6,500nt、約5,500nt~約7,000nt、約5,500nt~約7,500nt、約5,500nt~約8,000nt、約5,500nt~約8,500nt、約5,500nt~約9,000nt、約5,500nt~約9,500nt、約5,500nt~約10,000nt、約6,000nt~約6,500nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,000nt~約8,500nt、約6,000nt~約9,000nt、約6,000nt~約9,500nt、約6,000nt~約10,000nt、約6,500nt~約7,000nt、約6,500nt~約7,500nt、約6,500nt~約8,000nt、約6,500nt~約8,500nt、約6,500nt~約9,000nt、約6,500nt~約9,500nt、約6,500nt~約10,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、約7,000nt~約8,500nt、約7,000nt~約9,000nt、約7,000nt~約9,500nt、約7,000nt~約10,000nt、約7,500nt~約8,000nt、約7,500nt~約8,500nt、約7,500nt~約9,000nt、約7,500nt~約9,500nt、約7,500nt~約10,000nt、約8,000nt~約8,500nt、約8,000nt~約9,000nt、約8,000nt~約9,500nt、約8,000nt~約10,000nt、約8,500nt~約9,000nt、約8,500nt~約9,500nt、約8,500nt~約10,000nt、約9,000nt~約9,500nt、約9,000nt~約10,000nt、約9,500nt~約10,000nt、約5,000nt、約5,500nt、約6,000nt、約6,500nt、約7,000nt、約7,500nt、約8,000nt、約8,500nt、約9,000nt、約9,500nt、および約10,000ntから選択される総サイズを有する;
総標的タンパク質コード配列のサイズが、約2000nt~約8000nt、約2,000nt~約3,000nt、約2,000nt~約3,500nt、約2,000nt~約4,000nt、約2,000nt~約4,500nt、約2,000nt~約5,000nt、約2,000nt~約5,500nt、約2,000nt~約6,000nt、約2,000nt~約6,500nt、約2,000nt~約7,000nt、約2,000nt~約7,500nt、約2,000nt~約8,000nt、約3,000nt~約3,500nt、約3,000nt~約4,000nt、約3,000nt~約4,500nt、約3,000nt~約5,000nt、約3,000nt~約5,500nt、約3,000nt~約6,000nt、約3,000nt~約6,500nt、約3,000nt~約7,000nt、約3,000nt~約7,500nt、約3,000nt~約8,000nt、約3,500nt~約4,000nt、約3,500nt~約4,500nt、約3,500nt~約5,000nt、約3,500nt~約5,500nt、約3,500nt~約6,000nt、約3,500nt~約6,500nt、約3,500nt~約7,000nt、約3,500nt~約7,500nt、約3,500nt~約8,000nt、約4,000nt~約4,500nt、約4,000nt~約5,000nt、約4,000nt~約5,500nt、約4,000nt~約6,000nt、約4,000nt~約6,500nt、約4,000nt~約7,000nt、約4,000nt~約7,500nt、約4,000nt~約8,000nt、約4,500nt~約5,000nt、約4,500nt~約5,500nt、約4,500nt~約6,000nt、約4,500nt~約6,500nt、約4,500nt~約7,000nt、約4,500nt~約7,500nt、約4,500nt~約8,000nt、約5,000nt~約5,500nt、約5,000nt~約6,000nt、約5,000nt~約6,500nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,500nt~約6,000nt、約5,500nt~約6,500nt、約5,500nt~約7,000nt、約5,500nt~約7,500nt、約5,500nt~約8,000nt、約6,000nt~約6,500nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,500nt~約7,000nt、約6,500nt~約7,500nt、約6,500nt~約8,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、もしくは約7,500nt~約8,000ntから選択され、総標的タンパク質コード配列が、約2,000nt、約3,000nt、約3,500nt、約4,000nt、約4,500nt、約5,000nt、約5,500nt、約6,000nt、約6,500nt、約7,000nt、約7,500nt、および約8,000ntである;ならびに/または、
2つの合成DNA分子によってコードされるRNA分子の合計サイズが、約5,000nt~約9000nt、約5,000nt~約5,500nt、約5,000nt~約6,000nt、約5,000nt~約6,500nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,000nt~約8,500nt、約5,000nt~約9,000nt、約5,500nt~約6,000nt、約5,500nt~約6,500nt、約5,500nt~約7,000nt、約5,500nt~約7,500nt、約5,500nt~約8,000nt、約5,500nt~約8,500nt、約5,500nt~約9,000nt、約6,000nt~約6,500nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,000nt~約8,500nt、約6,000nt~約9,000nt、約6,500nt~約7,000nt、約6,500nt~約7,500nt、約6,500nt~約8,000nt、約6,500nt~約8,500nt、約6,500nt~約9,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、約7,000nt~約8,500nt、約7,000nt~約9,000nt、約7,500nt~約8,000nt、約7,500nt~約8,500nt、約7,500nt~約9,000nt、約8,000nt~約8,500nt、約8,000nt~約9,000nt、約8,500nt~約9,000nt、約5,000nt、約5,500nt、約6,000nt、約6,500nt、約7,000nt、約7,500nt、約8,000nt、約8,500nt、または約9,000ntである、
実施形態31から37までのいずれか1つの系。
39.実施形態26および28から30までのいずれか1つの組成物を含み、
第1の合成DNA分子、第2の合成DNA分子、および第3の合成DNA分子が、約7500nt~約15,000nt、約7,500nt~約8,500nt、約7,500nt~約9,500nt、約7,500nt~約10,000nt、約7,500nt~約10,500nt、約7,500nt~約11,000nt、約7,500nt~約11,500nt、約7,500nt~約12,000nt、約7,500nt~約12,500nt、約7,500nt~約13,000nt、約7,500nt~約14,000nt、約7,500nt~約15,000nt、約8,500nt~約9,500nt、約8,500nt~約10,000nt、約8,500nt~約10,500nt、約8,500nt~約11,000nt、約8,500nt~約11,500nt、約8,500nt~約12,000nt、約8,500nt~約12,500nt、約8,500nt~約13,000nt、約8,500nt~約14,000nt、約8,500nt~約15,000nt、約9,500nt~約10,000nt、約9,500nt~約10,500nt、約9,500nt~約11,000nt、約9,500nt~約11,500nt、約9,500nt~約12,000nt、約9,500nt~約12,500nt、約9,500nt~約13,000nt、約9,500nt~約14,000nt、約9,500nt~約15,000nt、約10,000nt~約10,500nt、約10,000nt~約11,000nt、約10,000nt~約11,500nt、約10,000nt~約12,000nt、約10,000nt~約12,500nt、約10,000nt~約13,000nt、約10,000nt~約14,000nt、約10,000nt~約15,000nt、約10,500nt~約11,000nt、約10,500nt~約11,500nt、約10,500nt~約12,000nt、約10,500nt~約12,500nt、約10,500nt~約13,000nt、約10,500nt~約14,000nt、約10,500nt~約15,000nt、約11,000nt~約11,500nt、約11,000nt~約12,000nt、約11,000nt~約12,500nt、約11,000nt~約13,000nt、約11,000nt~約14,000nt、約11,000nt~約15,000nt、約11,500nt~約12,000nt、約11,500nt~約12,500nt、約11,500nt~約13,000nt、約11,500nt~約14,000nt、約11,500nt~約15,000nt、約12,000nt~約12,500nt、約12,000nt~約13,000nt、約12,000nt~約14,000nt、約12,000nt~約15,000nt、約12,500nt~約13,000nt、約12,500nt~約14,000nt、約12,500nt~約15,000nt、約13,000nt~約14,000nt、約13,000nt~約15,000nt、または約14,000nt~約15,000nt、約7,500nt、約8,500nt、約9,500nt、約10,000nt、約10,500nt、約11,000nt、約11,500nt、約12,000nt、約12,500nt、約13,000nt、約14,000nt、または約15,000ntの総サイズを有する;
総標的タンパク質コード配列が、約3000nt~約12,000nt、約3,000nt~約4,000nt、約3,000nt~約5,000nt、約3,000nt~約6,000nt、約3,000nt~約7,000nt、約3,000nt~約7,500nt、約3,000nt~約8,000nt、約3,000nt~約8,500nt、約3,000nt~約9,000nt、約3,000nt~約1,000nt、約3,000nt~約11,000nt、約3,000nt~約12,000nt、約4,000nt~約5,000nt、約4,000nt~約6,000nt、約4,000nt~約7,000nt、約4,000nt~約7,500nt、約4,000nt~約8,000nt、約4,000nt~約8,500nt、約4,000nt~約9,000nt、約4,000nt~約1,000nt、約4,000nt~約11,000nt、約4,000nt~約12,000nt、約5,000nt~約6,000nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,000nt~約8,500nt、約5,000nt~約9,000nt、約5,000nt~約1,000nt、約5,000nt~約11,000nt、約5,000nt~約12,000nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,000nt~約8,500nt、約6,000nt~約9,000nt、約6,000nt~約1,000nt、約6,000nt~約11,000nt、約6,000nt~約12,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、約7,000nt~約8,500nt、約7,000nt~約9,000nt、約7,000nt~約1,000nt、約7,000nt~約11,000nt、約7,000nt~約12,000nt、約7,500nt~約8,000nt、約7,500nt~約8,500nt、約7,500nt~約9,000nt、約7,500nt~約1,000nt、約7,500nt~約11,000nt、約7,500nt~約12,000nt、約8,000nt~約8,500nt、約8,000nt~約9,000nt、約8,000nt~約1,000nt、約8,000nt~約11,000nt、約8,000nt~約12,000nt、約8,500nt~約9,000nt、約8,500nt~約1,000nt、約8,500nt~約11,000nt、約8,500nt~約12,000nt、約9,000nt~約1,000nt、約9,000nt~約11,000nt、約9,000nt~約12,000nt、約1,000nt~約11,000nt、約1,000nt~約12,000nt、約11,000nt~約12,000nt、約3,000nt、約4,000nt、約5,000nt、約6,000nt、約7,000nt、約7,500nt、約8,000nt、約8,500nt、約9,000nt、約1,000nt、約11,000nt、もしくは約12,000nt;ならびに/または、
3つの合成DNA分子によってコードされるRNA分子の合計サイズが、約7500nt~約13,500nt、約7,500nt~約8,500nt、約7,500nt~約9,000nt、約7,500nt~約9,500nt、約7,500nt~約10,000nt、約7,500nt~約10,500nt、約7,500nt~約11,000nt、約7,500nt~約11,500nt、約7,500nt~約12,000nt、約7,500nt~約12,500nt、約7,500nt~約13,000nt、約7,500nt~約13,500nt、約8,500nt~約9,000nt、約8,500nt~約9,500nt、約8,500nt~約10,000nt、約8,500nt~約10,500nt、約8,500nt~約11,000nt、約8,500nt~約11,500nt、約8,500nt~約12,000nt、約8,500nt~約12,500nt、約8,500nt~約13,000nt、約8,500nt~約13,500nt、約9,000nt~約9,500nt、約9,000nt~約10,000nt、約9,000nt~約10,500nt、約9,000nt~約11,000nt、約9,000nt~約11,500nt、約9,000nt~約12,000nt、約9,000nt~約12,500nt、約9,000nt~約13,000nt、約9,000nt~約13,500nt、約9,500nt~約10,000nt、約9,500nt~約10,500nt、約9,500nt~約11,000nt、約9,500nt~約11,500nt、約9,500nt~約12,000nt、約9,500nt~約12,500nt、約9,500nt~約13,000nt、約9,500nt~約13,500nt、約10,000nt~約10,500nt、約10,000nt~約11,000nt、約10,000nt~約11,500nt、約10,000nt~約12,000nt、約10,000nt~約12,500nt、約10,000nt~約13,000nt、約10,000nt~約13,500nt、約10,500nt~約11,000nt、約10,500nt~約11,500nt、約10,500nt~約12,000nt、約10,500nt~約12,500nt、約10,500nt~約13,000nt、約10,500nt~約13,500nt、約11,000nt~約11,500nt、約11,000nt~約12,000nt、約11,000nt~約12,500nt、約11,000nt~約13,000nt、約11,000nt~約13,500nt、約11,500nt~約12,000nt、約11,500nt~約12,500nt、約11,500nt~約13,000nt、約11,500nt~約13,500nt、約12,000nt~約12,500nt、約12,000nt~約13,000nt、約12,000nt~約13,500nt、約12,500nt~約13,000nt、約12,500nt~約13,500nt、約13,000nt~約13,500nt、約7,500nt、約8,500nt、約9,000nt、約9,500nt、約10,000nt、約10,500nt、約11,000nt、約11,500nt、約12,000nt、約12,500nt、約13,000nt、または約13,500ntである、
実施形態31から36までのいずれか1つの系。
40.
実施形態27および28から30までのいずれか1つの組成物を含み、
第1の合成DNA分子、第2の合成DNA分子、第3の合成DNA分子および第4の合成DNA分子が、約10,000nt~約20,000nt、約10,000nt~約11,000nt、約10,000nt~約12,000nt、約10,000nt~約13,000nt、約10,000nt~約14,000nt、約10,000nt~約15,000nt、約10,000nt~約16,000nt、約10,000nt~約17,000nt、約10,000nt~約18,000nt、約10,000nt~約19,000nt、約10,000nt~約20,000nt、約11,000nt~約12,000nt、約11,000nt~約13,000nt、約11,000nt~約14,000nt、約11,000nt~約15,000nt、約11,000nt~約16,000nt、約11,000nt~約17,000nt、約11,000nt~約18,000nt、約11,000nt~約19,000nt、約11,000nt~約20,000nt、約12,000nt~約13,000nt、約12,000nt~約14,000nt、約12,000nt~約15,000nt、約12,000nt~約16,000nt、約12,000nt~約17,000nt、約12,000nt~約18,000nt、約12,000nt~約19,000nt、約12,000nt~約20,000nt、約13,000nt~約14,000nt、約13,000nt~約15,000nt、約13,000nt~約16,000nt、約13,000nt~約17,000nt、約13,000nt~約18,000nt、約13,000nt~約19,000nt、約13,000nt~約20,000nt、約14,000nt~約15,000nt、約14,000nt~約16,000nt、約14,000nt~約17,000nt、約14,000nt~約18,000nt、約14,000nt~約19,000nt、約14,000nt~約20,000nt、約15,000nt~約16,000nt、約15,000nt~約17,000nt、約15,000nt~約18,000nt、約15,000nt~約19,000nt、約15,000nt~約20,000nt、約16,000nt~約17,000nt、約16,000nt~約18,000nt、約16,000nt~約19,000nt、約16,000nt~約20,000nt、約17,000nt~約18,000nt、約17,000nt~約19,000nt、約17,000nt~約20,000nt、約18,000nt~約19,000nt、約18,000nt~約20,000nt、約19,000nt~約20,000nt、約10,000nt、約11,000nt、約12,000nt、約13,000nt、約14,000nt、約15,000nt、約16,000nt、約17,000nt、約18,000nt、約19,000nt、もしくは約20,000ntの総サイズを有する;
総標的タンパク質コード配列が、約4000nt~約16,000nt、約5,000nt~約6,000nt、約5,000nt~約7,000nt、約5,000nt~約8,000nt、約5,000nt~約9,000nt、約5,000nt~約10,000nt、約5,000nt~約11,000nt、約5,000nt~約12,000nt、約5,000nt~約13,000nt、約5,000nt~約14,000nt、約5,000nt~約15,000nt、約5,000nt~約16,000nt、約6,000nt~約7,000nt、約6,000nt~約8,000nt、約6,000nt~約9,000nt、約6,000nt~約10,000nt、約6,000nt~約11,000nt、約6,000nt~約12,000nt、約6,000nt~約13,000nt、約6,000nt~約14,000nt、約6,000nt~約15,000nt、約6,000nt~約16,000nt、約7,000nt~約8,000nt、約7,000nt~約9,000nt、約7,000nt~約10,000nt、約7,000nt~約11,000nt、約7,000nt~約12,000nt、約7,000nt~約13,000nt、約7,000nt~約14,000nt、約7,000nt~約15,000nt、約7,000nt~約16,000nt、約8,000nt~約9,000nt、約8,000nt~約10,000nt、約8,000nt~約11,000nt、約8,000nt~約12,000nt、約8,000nt~約13,000nt、約8,000nt~約14,000nt、約8,000nt~約15,000nt、約8,000nt~約16,000nt、約9,000nt~約10,000nt、約9,000nt~約11,000nt、約9,000nt~約12,000nt、約9,000nt~約13,000nt、約9,000nt~約14,000nt、約9,000nt~約15,000nt、約9,000nt~約16,000nt、約10,000nt~約11,000nt、約10,000nt~約12,000nt、約10,000nt~約13,000nt、約10,000nt~約14,000nt、約10,000nt~約15,000nt、約10,000nt~約16,000nt、約11,000nt~約12,000nt、約11,000nt~約13,000nt、約11,000nt~約14,000nt、約11,000nt~約15,000nt、約11,000nt~約16,000nt、約12,000nt~約13,000nt、約12,000nt~約14,000nt、約12,000nt~約15,000nt、約12,000nt~約16,000nt、約13,000nt~約14,000nt、約13,000nt~約15,000nt、約13,000nt~約16,000nt、約14,000nt~約15,000nt、約14,000nt~約16,000nt、もしくは約15,000nt~約16,000ntであり、総標的タンパク質コード配列が、約5,000nt、約6,000nt、約7,000nt、約8,000nt、約9,000nt、約10,000nt、約11,000nt、約12,000nt、約13,000nt、約14,000nt、約15,000nt、約16,000nt、約5,000nt、約6,000nt、約7,000nt、約8,000nt、約9,000nt、約10,000nt、約11,000nt、約12,000nt、約13,000nt、約14,000nt、もしくは約15,000ntである;ならびに/または
4つの合成DNA分子によってコードされるRNA分子の合計サイズが、約10,000nt~約18,000nt、約10,000nt~約11,000nt、約10,000nt~約12,000nt、約10,000nt~約13,000nt、約10,000nt~約14,000nt、約10,000nt~約15,000nt、約10,000nt~約16,000nt、約10,000nt~約17,000nt、約10,000nt~約18,000nt、約11,000nt~約12,000nt、約11,000nt~約13,000nt、約11,000nt~約14,000nt、約11,000nt~約15,000nt、約11,000nt~約16,000nt、約11,000nt~約17,000nt、約11,000nt~約18,000nt、約12,000nt~約13,000nt、約12,000nt~約14,000nt、約12,000nt~約15,000nt、約12,000nt~約16,000nt、約12,000nt~約17,000nt、約12,000nt~約18,000nt、約13,000nt~約14,000nt、約13,000nt~約15,000nt、約13,000nt~約16,000nt、約13,000nt~約17,000nt、約13,000nt~約18,000nt、約14,000nt~約15,000nt、約14,000nt~約16,000nt、約14,000nt~約17,000nt、約14,000nt~約18,000nt、約15,000nt~約16,000nt、約15,000nt~約17,000nt、約15,000nt~約18,000nt、約16,000nt~約17,000nt、約16,000nt~約18,000nt、約17,000nt~約18,000nt、約10,000nt、約11,000nt、約12,000nt、約13,000nt、約14,000nt、約15,000nt、約16,000nt、約17,000nt、もしくは約18,000ntである、
実施形態31から36までのいずれか1つの系。
41.第1の二量体形成ドメインおよび第2の二量体形成ドメイン、第3の二量体形成ドメインおよび第4の二量体形成ドメイン、および/または第5の二量体形成ドメインおよび第6の二量体形成ドメインが、それぞれ、1000nt以下、例えば、少なくとも50nt、少なくとも100nt、少なくとも150nt、少なくとも200nt、少なくとも300nt、少なくとも400nt、少なくとも500nt、50~1000nt、50~500nt、50~150nt、50nt、100nt、150nt、200nt、250nt、300nt、400nt、または500ntであり;系の組換え効率が、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、または約100%である、実施形態31から40までのいずれか1つの系。
42.各二量体形成ドメインが、1000nt以下、例えば、少なくとも50nt、少なくとも100nt、少なくとも150nt、少なくとも200nt、少なくとも300nt、少なくとも400nt、少なくとも500nt、50~1000nt、50~500nt、50~150nt、50nt、100nt、150nt、200nt、250nt、300nt、400nt、または500ntであり;系の組換え効率が、少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも90%、または約100%である、実施形態31から41までのいずれか1つの系。
43.RNA組換え効率が、約10%~約100%、約10%~約20%、約10%~約30%、約10%~約35%、約10%~約40%、約10%~約45%、約10%~約50%、約10%~約55%、約10%~約60%、約10%~約70%、約10%~約80%、約10%~約90%、約20%~約30%、約20%~約35%、約20%~約40%、約20%~約45%、約20%~約50%、約20%~約55%、約20%~約60%、約20%~約70%、約20%~約80%、約20%~約90%、約30%~約35%、約30%~約40%、約30%~約45%、約30%~約50%、約30%~約55%、約30%~約60%、約30%~約70%、約30%~約80%、約30%~約90%、約35%~約40%、約35%~約45%、約35%~約50%、約35%~約55%、約35%~約60%、約35%~約70%、約35%~約80%、約35%~約90%、約40%~約45%、約40%~約50%、約40%~約55%、約40%~約60%、約40%~約70%、約40%~約80%、約40%~約90%、約45%~約50%、約45%~約55%、約45%~約60%、約45%~約70%、約45%~約80%、約45%~約90%、約50%~約55%、約50%~約60%、約50%~約70%、約50%~約80%、約50%~約90%、約55%~約60%、約55%~約70%、約55%~約80%、約55%~約90%、約60%~約70%、約60%~約80%、約60%~約90%、約70%~約80%、約70%~約90%、約80%~約90%、約10%、約20%、約30%、約35%、約40%、約45%、約50%、約55%、約60%、約70%、約80%、約90%、約95%、または約100%である、実施形態31から42までのいずれか1つの系。
44.実施形態31から43までのいずれか1つの系を含む組成物。
45.それぞれジストロフィン、第8因子、ABCA4、またはMYO7Aの少なくとも一部分をコードする第1のRNA分子、第2のRNA分子、第3のRNA分子および必要に応じて第4のRNA分子を含む、実施形態44の組成物。
46.実施形態31から43までのいずれか1つの系、または実施形態44および45のいずれか1つの組成物を含むキットであって、第1の合成核酸分子、第2の合成核酸分子、第3の合成核酸分子および第4の合成核酸分子のいずれかが別々の容器に入っていてよく、必要に応じて薬学的に許容される担体などのバッファーをさらに含む、キット。
47.細胞において標的タンパク質を発現させる方法であって、実施形態31から43までのいずれか1つの系、または実施形態44および45のいずれか1つの組成物を細胞に導入するステップと、第1のRNA分子と第2のRNA分子、第1のRNA分子、第2のRNA分子、および第3のRNA分子、または第1のRNA分子、第2のRNA分子、第3のRNA分子および第4のRNA分子を細胞において発現させるステップとを含み、細胞において標的タンパク質が産生される、方法。
48.細胞が、対象内に存在し、導入するステップが、系を治療有効量で対象に投与することを含む、実施形態47の方法。
49.対象における標的タンパク質をコードする遺伝子の変異によって引き起こされる遺伝子疾患を処置し、対象における機能的標的タンパク質の発現をもたらす、実施形態48の方法。
50.
遺伝子疾患がデュシェンヌ型筋ジストロフィーであり、標的タンパク質がジストロフィンである;
遺伝子疾患が血友病Aであり、標的タンパク質がF8である;
遺伝子疾患がスタルガルト病であり、標的タンパク質がABCA4である;または
遺伝子疾患がアッシャー症候群であり、標的タンパク質がMYO7Aである、
実施形態49の方法。
51.1つ、2つ、3つ、または4つのRNA分子が、配列番号1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、145、146、147、148、155、156、157、158、159、160、161、162、163、164、165、および166のうちのいずれか1つに提示される合成イントロンに対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%、または100%の配列同一性を含む、実施形態31から43までのいずれか1つの系、実施形態1から24まで、44および45のいずれか1つの組成物、実施形態46のキット、または実施形態47から50までのいずれか1つの方法。
52.1つ、2つ、3つ、または4つのRNA分子が、配列番号20のnt3703~3975、配列番号21のnt1~228、配列番号22のnt3703~3975、配列番号23のnt1~225、配列番号24のnt3560~3828、および配列番号25のnt1~225から選択される合成イントロンを含む、実施形態31から43まで、および51のいずれか1つの系、実施形態1から24まで、44および45のいずれか1つの組成物、実施形態46のキット、または実施形態47から50までのいずれか1つの方法。
53.1つ、2つ、3つ、または4つのRNA分子が、タンパク質コード配列の一部をさらに含む、実施形態31から43まで、51、および52のいずれかの系、実施形態1から24まで、44および45のいずれか1つの組成物、または実施形態47から50までのいずれか1つの方法。
54.タンパク質コード配列の一部が、タンパク質コード配列のN末端側半分、N末端側の3分の1、中間部分、第1の中間部分、C末端側半分、またはC末端側の3分の1を含む、実施形態31から43まで、および51から53までのいずれかの系、実施形態1から24まで、44および45のいずれか1つの組成物、または実施形態47から50までのいずれか1つの方法。
55.(a)第1のRNA分子であって、5’から3’に、(i)標的タンパク質のN末端部分のコード配列;(ii)スプライスドナー;(ii-2)DISE、ISE、または両方;および(iii)第1の二量体形成ドメインを含む、第1のRNA分子;ならびに(b)第2のRNA分子であって、5’から3’に、(i)第1の二量体形成ドメインに結合する第2の二量体形成ドメイン;(i-2)少なくとも1つのISE配列;(ii)分岐点配列;(iii)ポリピリミジントラクト;(iv)スプライスアクセプター;および(v)標的タンパク質のC末端部分のコード配列を含む、第2のRNA分子を含む、実施形態31から43までおよび51から54までのいずれか1つの系、実施形態1から24まで、44および45のいずれか1つの組成物、または実施形態47から50までのいずれか1つの方法。
56.(a)第1のRNA分子であって、5’から3’に、(i)標的タンパク質のN末端部分のコード配列;(ii)スプライスドナー;(ii-2)DISE、ISE、およびISE;および(iii)第1の二量体形成ドメインを含む、第1のRNA分子;ならびに(b)第2のRNA分子であって、5’から3’に、(i)第1の二量体形成ドメインに結合する第2の二量体形成ドメイン;(i-2)3つのISE配列;(ii)分岐点配列;(iii)ポリピリミジントラクト;(iv)スプライスアクセプター;および(v)標的タンパク質のC末端部分のコード配列を含む、第2のRNA分子を含む、実施形態31から43までおよび51から55までのいずれか1つの系、実施形態1から24まで、44および45のいずれか1つの組成物、または実施形態47から50までのいずれか1つの方法。
57.それぞれ、2つのRNA分子のうちのいずれか1つもしくは2つ、または、3つのRNA分子のうちのいずれか1つ、2つもしくは3つ、または、4つのRNA分子のうちのいずれか1つ、2つ、3つ、もしくは4つが、それぞれ、約2500~4500nt、約2,500nt~約2,750nt、約2,500nt~約3,000nt、約2,500nt~約3,250nt、約2,500nt~約3,500nt、約2,500nt~約3,750nt、約2,500nt~約4,000nt、約2,500nt~約4,250nt、約2,500nt~約4,500nt、約2,750nt~約3,000nt、約2,750nt~約3,250nt、約2,750nt~約3,500nt、約2,750nt~約3,750nt、約2,750nt~約4,000nt、約2,750nt~約4,250nt、約2,750nt~約4,500nt、約3,000nt~約3,250nt、約3,000nt~約3,500nt、約3,000nt~約3,750nt、約3,000nt~約4,000nt、約3,000nt~約4,250nt、約3,000nt~約4,500nt、約3,250nt~約3,500nt、約3,250nt~約3,750nt、約3,250nt~約4,000nt、約3,250nt~約4,250nt、約3,250nt~約4,500nt、約3,500nt~約3,750nt、約3,500nt~約4,000nt、約3,500nt~約4,250nt、約3,500nt~約4,500nt、約3,750nt~約4,000nt、約3,750nt~約4,250nt、約3,750nt~約4,500nt、約4,000nt~約4,250nt、約4,000nt~約4,500nt、約4,250nt~約4,500nt、約2,500nt、約2,750nt、約3,000nt、約3,250nt、約3,500nt、約3,750nt、約4,000nt、約4,250nt、および約4,500ntから独立に選択されるサイズを有する、実施形態1および4から24までのいずれか1つの組成物、または、実施形態2および4から24までのいずれか1つの組成物、または、実施形態3および4から24までのいずれか1つの組成物。
58.総標的タンパク質コード配列が、約2000nt~約8000nt、約2,000nt~約3,000nt、約2,000nt~約3,500nt、約2,000nt~約4,000nt、約2,000nt~約4,500nt、約2,000nt~約5,000nt、約2,000nt~約5,500nt、約2,000nt~約6,000nt、約2,000nt~約6,500nt、約2,000nt~約7,000nt、約2,000nt~約7,500nt、約2,000nt~約8,000nt、約3,000nt~約3,500nt、約3,000nt~約4,000nt、約3,000nt~約4,500nt、約3,000nt~約5,000nt、約3,000nt~約5,500nt、約3,000nt~約6,000nt、約3,000nt~約6,500nt、約3,000nt~約7,000nt、約3,000nt~約7,500nt、約3,000nt~約8,000nt、約3,500nt~約4,000nt、約3,500nt~約4,500nt、約3,500nt~約5,000nt、約3,500nt~約5,500nt、約3,500nt~約6,000nt、約3,500nt~約6,500nt、約3,500nt~約7,000nt、約3,500nt~約7,500nt、約3,500nt~約8,000nt、約4,000nt~約4,500nt、約4,000nt~約5,000nt、約4,000nt~約5,500nt、約4,000nt~約6,000nt、約4,000nt~約6,500nt、約4,000nt~約7,000nt、約4,000nt~約7,500nt、約4,000nt~約8,000nt、約4,500nt~約5,000nt、約4,500nt~約5,500nt、約4,500nt~約6,000nt、約4,500nt~約6,500nt、約4,500nt~約7,000nt、約4,500nt~約7,500nt、約4,500nt~約8,000nt、約5,000nt~約5,500nt、約5,000nt~約6,000nt、約5,000nt~約6,500nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,500nt~約6,000nt、約5,500nt~約6,500nt、約5,500nt~約7,000nt、約5,500nt~約7,500nt、約5,500nt~約8,000nt、約6,000nt~約6,500nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,500nt~約7,000nt、約6,500nt~約7,500nt、約6,500nt~約8,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、もしくは約7,500nt~約8,000ntであり、総標的タンパク質コード配列が、約2,000nt、約3,000nt、約3,500nt、約4,000nt、約4,500nt、約5,000nt、約5,500nt、約6,000nt、約6,500nt、約7,000nt、約7,500nt、もしくは約8,000ntである;および/または、
2つのRNA分子の合計サイズが、約5,000nt~約9000nt、約5,000nt~約5,500nt、約5,000nt~約6,000nt、約5,000nt~約6,500nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,000nt~約8,500nt、約5,000nt~約9,000nt、約5,500nt~約6,000nt、約5,500nt~約6,500nt、約5,500nt~約7,000nt、約5,500nt~約7,500nt、約5,500nt~約8,000nt、約5,500nt~約8,500nt、約5,500nt~約9,000nt、約6,000nt~約6,500nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,000nt~約8,500nt、約6,000nt~約9,000nt、約6,500nt~約7,000nt、約6,500nt~約7,500nt、約6,500nt~約8,000nt、約6,500nt~約8,500nt、約6,500nt~約9,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、約7,000nt~約8,500nt、約7,000nt~約9,000nt、約7,500nt~約8,000nt、約7,500nt~約8,500nt、約7,500nt~約9,000nt、約8,000nt~約8,500nt、約8,000nt~約9,000nt、約8,500nt~約9,000nt、約5,000nt、約5,500nt、約6,000nt、約6,500nt、約7,000nt、約7,500nt、約8,000nt、約8,500nt、もしくは約9,000ntである、実施形態1および4から24までのいずれか1つの組成物。
59.総標的タンパク質コード配列のサイズが、約3000nt~約12,000nt、約3,000nt~約4,000nt、約3,000nt~約5,000nt、約3,000nt~約6,000nt、約3,000nt~約7,000nt、約3,000nt~約7,500nt、約3,000nt~約8,000nt、約3,000nt~約8,500nt、約3,000nt~約9,000nt、約3,000nt~約1,000nt、約3,000nt~約11,000nt、約3,000nt~約12,000nt、約4,000nt~約5,000nt、約4,000nt~約6,000nt、約4,000nt~約7,000nt、約4,000nt~約7,500nt、約4,000nt~約8,000nt、約4,000nt~約8,500nt、約4,000nt~約9,000nt、約4,000nt~約1,000nt、約4,000nt~約11,000nt、約4,000nt~約12,000nt、約5,000nt~約6,000nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,000nt~約8,500nt、約5,000nt~約9,000nt、約5,000nt~約1,000nt、約5,000nt~約11,000nt、約5,000nt~約12,000nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,000nt~約8,500nt、約6,000nt~約9,000nt、約6,000nt~約1,000nt、約6,000nt~約11,000nt、約6,000nt~約12,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、約7,000nt~約8,500nt、約7,000nt~約9,000nt、約7,000nt~約1,000nt、約7,000nt~約11,000nt、約7,000nt~約12,000nt、約7,500nt~約8,000nt、約7,500nt~約8,500nt、約7,500nt~約9,000nt、約7,500nt~約1,000nt、約7,500nt~約11,000nt、約7,500nt~約12,000nt、約8,000nt~約8,500nt、約8,000nt~約9,000nt、約8,000nt~約1,000nt、約8,000nt~約11,000nt、約8,000nt~約12,000nt、約8,500nt~約9,000nt、約8,500nt~約1,000nt、約8,500nt~約11,000nt、約8,500nt~約12,000nt、約9,000nt~約1,000nt、約9,000nt~約11,000nt、約9,000nt~約12,000nt、約1,000nt~約11,000nt、約1,000nt~約12,000nt、約11,000nt~約12,000nt、約3,000nt、約4,000nt、約5,000nt、約6,000nt、約7,000nt、約7,500nt、約8,000nt、約8,500nt、約9,000nt、約1,000nt、約11,000nt、もしくは約12,000ntである;および/または、
3つのRNA分子の合計サイズが、約7500nt~約13,500nt、約7,500nt~約8,500nt、約7,500nt~約9,000nt、約7,500nt~約9,500nt、約7,500nt~約10,000nt、約7,500nt~約10,500nt、約7,500nt~約11,000nt、約7,500nt~約11,500nt、約7,500nt~約12,000nt、約7,500nt~約12,500nt、約7,500nt~約13,000nt、約7,500nt~約13,500nt、約8,500nt~約9,000nt、約8,500nt~約9,500nt、約8,500nt~約10,000nt、約8,500nt~約10,500nt、約8,500nt~約11,000nt、約8,500nt~約11,500nt、約8,500nt~約12,000nt、約8,500nt~約12,500nt、約8,500nt~約13,000nt、約8,500nt~約13,500nt、約9,000nt~約9,500nt、約9,000nt~約10,000nt、約9,000nt~約10,500nt、約9,000nt~約11,000nt、約9,000nt~約11,500nt、約9,000nt~約12,000nt、約9,000nt~約12,500nt、約9,000nt~約13,000nt、約9,000nt~約13,500nt、約9,500nt~約10,000nt、約9,500nt~約10,500nt、約9,500nt~約11,000nt、約9,500nt~約11,500nt、約9,500nt~約12,000nt、約9,500nt~約12,500nt、約9,500nt~約13,000nt、約9,500nt~約13,500nt、約10,000nt~約10,500nt、約10,000nt~約11,000nt、約10,000nt~約11,500nt、約10,000nt~約12,000nt、約10,000nt~約12,500nt、約10,000nt~約13,000nt、約10,000nt~約13,500nt、約10,500nt~約11,000nt、約10,500nt~約11,500nt、約10,500nt~約12,000nt、約10,500nt~約12,500nt、約10,500nt~約13,000nt、約10,500nt~約13,500nt、約11,000nt~約11,500nt、約11,000nt~約12,000nt、約11,000nt~約12,500nt、約11,000nt~約13,000nt、約11,000nt~約13,500nt、約11,500nt~約12,000nt、約11,500nt~約12,500nt、約11,500nt~約13,000nt、約11,500nt~約13,500nt、約12,000nt~約12,500nt、約12,000nt~約13,000nt、約12,000nt~約13,500nt、約12,500nt~約13,000nt、約12,500nt~約13,500nt、約13,000nt~約13,500nt、約7,500nt、約8,500nt、約9,000nt、約9,500nt、約10,000nt、約10,500nt、約11,000nt、約11,500nt、約12,000nt、約12,500nt、約13,000nt、もしくは約13,500ntである、
実施形態2および4から24までのいずれか1つの組成物。
60.総標的タンパク質コード配列のサイズが、約4000nt~約16,000nt、約5,000nt~約6,000nt、約5,000nt~約7,000nt、約5,000nt~約8,000nt、約5,000nt~約9,000nt、約5,000nt~約10,000nt、約5,000nt~約11,000nt、約5,000nt~約12,000nt、約5,000nt~約13,000nt、約5,000nt~約14,000nt、約5,000nt~約15,000nt、約5,000nt~約16,000nt、約6,000nt~約7,000nt、約6,000nt~約8,000nt、約6,000nt~約9,000nt、約6,000nt~約10,000nt、約6,000nt~約11,000nt、約6,000nt~約12,000nt、約6,000nt~約13,000nt、約6,000nt~約14,000nt、約6,000nt~約15,000nt、約6,000nt~約16,000nt、約7,000nt~約8,000nt、約7,000nt~約9,000nt、約7,000nt~約10,000nt、約7,000nt~約11,000nt、約7,000nt~約12,000nt、約7,000nt~約13,000nt、約7,000nt~約14,000nt、約7,000nt~約15,000nt、約7,000nt~約16,000nt、約8,000nt~約9,000nt、約8,000nt~約10,000nt、約8,000nt~約11,000nt、約8,000nt~約12,000nt、約8,000nt~約13,000nt、約8,000nt~約14,000nt、約8,000nt~約15,000nt、約8,000nt~約16,000nt、約9,000nt~約10,000nt、約9,000nt~約11,000nt、約9,000nt~約12,000nt、約9,000nt~約13,000nt、約9,000nt~約14,000nt、約9,000nt~約15,000nt、約9,000nt~約16,000nt、約10,000nt~約11,000nt、約10,000nt~約12,000nt、約10,000nt~約13,000nt、約10,000nt~約14,000nt、約10,000nt~約15,000nt、約10,000nt~約16,000nt、約11,000nt~約12,000nt、約11,000nt~約13,000nt、約11,000nt~約14,000nt、約11,000nt~約15,000nt、約11,000nt~約16,000nt、約12,000nt~約13,000nt、約12,000nt~約14,000nt、約12,000nt~約15,000nt、約12,000nt~約16,000nt、約13,000nt~約14,000nt、約13,000nt~約15,000nt、約13,000nt~約16,000nt、約14,000nt~約15,000nt、約14,000nt~約16,000nt、または約15,000nt~約16,000ntであり、総標的タンパク質コード配列が、約5,000nt、約6,000nt、約7,000nt、約8,000nt、約9,000nt、約10,000nt、約11,000nt、約12,000nt、約13,000nt、約14,000nt、約15,000nt、約16,000nt、約5,000nt、約6,000nt、約7,000nt、約8,000nt、約9,000nt、約10,000nt、約11,000nt、約12,000nt、約13,000nt、約14,000nt、または約15,000ntである;ならびに/または
4つの合成DNA分子によってコードされるRNA分子の合計サイズが、約10,000nt~約18,000nt、約10,000nt~約11,000nt、約10,000nt~約12,000nt、約10,000nt~約13,000nt、約10,000nt~約14,000nt、約10,000nt~約15,000nt、約10,000nt~約16,000nt、約10,000nt~約17,000nt、約10,000nt~約18,000nt、約11,000nt~約12,000nt、約11,000nt~約13,000nt、約11,000nt~約14,000nt、約11,000nt~約15,000nt、約11,000nt~約16,000nt、約11,000nt~約17,000nt、約11,000nt~約18,000nt、約12,000nt~約13,000nt、約12,000nt~約14,000nt、約12,000nt~約15,000nt、約12,000nt~約16,000nt、約12,000nt~約17,000nt、約12,000nt~約18,000nt、約13,000nt~約14,000nt、約13,000nt~約15,000nt、約13,000nt~約16,000nt、約13,000nt~約17,000nt、約13,000nt~約18,000nt、約14,000nt~約15,000nt、約14,000nt~約16,000nt、約14,000nt~約17,000nt、約14,000nt~約18,000nt、約15,000nt~約16,000nt、約15,000nt~約17,000nt、約15,000nt~約18,000nt、約16,000nt~約17,000nt、約16,000nt~約18,000nt、約17,000nt~約18,000nt、約10,000nt、約11,000nt、約12,000nt、約13,000nt、約14,000nt、約15,000nt、約16,000nt、約17,000nt、または約18,000ntである、
実施形態3および4から24までのいずれか1つの組成物。
61.第1の二量体形成ドメインおよび第2の二量体形成ドメイン、第3の二量体形成ドメインおよび第4の二量体形成ドメイン、および/または第5の二量体形成ドメインおよび第6の二量体形成ドメインが、それぞれ、1000nt以下、例えば、少なくとも50nt、少なくとも100nt、少なくとも150nt、少なくとも200nt、少なくとも300nt、少なくとも400nt、少なくとも500nt、50~1000nt、50~500nt、50~150nt、50nt、100nt、150nt、200nt、250nt、300nt、400nt、または500ntであり;系の組換え効率が、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、または少なくとも約95%である、実施形態1から24までおよび57から60までのいずれか1つの系。
62.各二量体形成ドメインが、1000nt以下、例えば、少なくとも50nt、少なくとも100nt、少なくとも150nt、少なくとも200nt、少なくとも300nt、少なくとも400nt、少なくとも500nt、50~1000nt、50~500nt、50~150nt、50nt、100nt、150nt、200nt、250nt、300nt、400nt、または500ntであり;系の組換え効率が、少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも75%、少なくとも80%、または少なくとも90%である、実施形態1から24までおよび57から61までのいずれか1つの系。
63.RNA組換え効率が、約10%~約100%、約10%~約20%、約10%~約30%、約10%~約35%、約10%~約40%、約10%~約45%、約10%~約50%、約10%~約55%、約10%~約60%、約10%~約70%、約10%~約80%、約10%~約90%、約20%~約30%、約20%~約35%、約20%~約40%、約20%~約45%、約20%~約50%、約20%~約55%、約20%~約60%、約20%~約70%、約20%~約80%、約20%~約90%、約30%~約35%、約30%~約40%、約30%~約45%、約30%~約50%、約30%~約55%、約30%~約60%、約30%~約70%、約30%~約80%、約30%~約90%、約35%~約40%、約35%~約45%、約35%~約50%、約35%~約55%、約35%~約60%、約35%~約70%、約35%~約80%、約35%~約90%、約40%~約45%、約40%~約50%、約40%~約55%、約40%~約60%、約40%~約70%、約40%~約80%、約40%~約90%、約45%~約50%、約45%~約55%、約45%~約60%、約45%~約70%、約45%~約80%、約45%~約90%、約50%~約55%、約50%~約60%、約50%~約70%、約50%~約80%、約50%~約90%、約55%~約60%、約55%~約70%、約55%~約80%、約55%~約90%、約60%~約70%、約60%~約80%、約60%~約90%、約70%~約80%、約70%~約90%、約80%~約90%、約10%、約20%、約30%、約35%、約40%、約45%、約50%、約55%、約60%、約70%、約80%、約90%、約95%、または約100%である、実施形態1から24までおよび57から62までのいずれか1つの組成物。
64.合成DNAが、逆転写酵素によるRNAウイルスゲノムの転写によって生じたものである、実施形態25から30までおよび44から45までのいずれか1つの組成物、実施形態31から43までのいずれか1つの系、または実施形態47から50のいずれか1つの方法。
本明細書に記載の本明細書に開示される任意の実施形態を、必要に応じて、核酸エディタータンパク質の発現に関する記載の組成物、系、方法およびキットに適用できることが理解される。本開示は、対象における疾患を処置する、または他の点でそれを必要とする対象に利益をもたらすための、本明細書に記載の組成物、系、方法またはキットの使用、および、対象における疾患の処置における使用のため、または他の点でそれを必要とする対象に利益をもたらすための、本明細書に記載の組成物、系、方法またはキットを包含する。
(実施例1)
合成RNA二量体形成および組換えドメイン
図1Aは、ベクター設計(左)ならびにRNA相互作用およびスプライシング(右)の概略図を示す。左:5’トランススプライス(trsp)DNAベクター:白抜きの矢印は2つの反対方向のプロモーターである。RFPをコードするドメインおよびポリアデニル化エレメントを伴う3’UTRは、YFPのN末端部分(n-yfp)、続いて、スプライスドナー配列(SD)、下流イントロンスプライシングエンハンサー(DISE)、および2つのイントロンスプライシングエンハンサー(2×ISE)、結合ドメイン(BD、二量体形成ドメインとも称される)、および安定なステムループボックスBエレメント(ボックスB)、自己切断性ハンマーヘッド型リボザイム(HHrz)、最後にポリアデニル化エレメントを含有する3’UTRから反対方向に発現される。n-yfpセグメントには小さなイントロンが挿入されている(n-yfp内の白色のセグメント)。3’trsp DNAベクター:白抜きの矢印は2つの反対方向のプロモーターである。BFPをコードするドメインおよびポリアデニル化エレメントを伴う3’UTRは、相補的結合ドメイン(抗BD、二量体形成ドメインとも称される)、続いて、3つのイントロンスプライシングエンハンサー配列(3×ISE)、分岐点(BP)、ポリピリミジントラクト(PPT)、スプライスアクセプター配列(SA)、YFPコード配列のC末端部分、最後にポリアデニル化エレメントを含有する3’UTRから反対方向に発現される。右:YFPタンパク質をコードするmRNAが生成されるプレmRNA相互作用(5’trsp-RNA+3’trsp-RNA)およびトランス-スプライシングが示されている。
図1Bは、N末端発現プラスミドのみのトランスフェクションではYFP蛍光がもたらされないことを示す。20kのRFP+細胞を示すフローサイトメトリー。
図1Cは、C末端発現プラスミドのみのトランスフェクションではYFP蛍光がもたらされないことを示す。20kのBFP+細胞を示すフローサイトメトリー。
図1Dは、結合ドメインを有さないN末端断片およびC末端断片の発現では、低レベルのYFP誘導が示されることを示す。20kのBFP+細胞についての赤色蛍光値および緑色蛍光値を示すフローサイトメトリー。
図1Eは、ループ状構成の合理的に設計された二量体形成/結合ドメインを示す。排他的にピリミジンまたは排他的にプリンを含有する低多様性配列のセグメントの間を安定なステム配列が占める。RNAフォールディング予測により、結合ドメインとその相補配列の間の塩基対合に利用可能な、6つの、開いた一続きの配列が示される(1~6の番号が付されている)。
図1Fは、6つの、開いた一続きの配列(1~6の番号が付されている)を示す、「ループ状」二量体形成ドメイン構成の3Dレンダリングを示す。
図1Gは、C末端側半分に結合ドメインを有さない陰性対照を示す。20kのBFP+細胞についての赤色蛍光値および緑色蛍光値を示すフローサイトメトリー。
図1Hは、N末端側半分に結合ドメインを有さない陰性対照を示す。20kのBFP+細胞についての赤色蛍光値および緑色蛍光値を示すフローサイトメトリー。
図1Iは、N末端側半分およびC末端側半分の両方におけるマッチする結合ドメインにより、細胞の90%において強力なYFP誘導が示されることを示す。20kのBFP+細胞についての赤色蛍光値および緑色蛍光値を示すフローサイトメトリー。
図1J~1Nは、完全に開いた構成をもたらす、一続きの、150個の排他的にピリミジンまたは排他的にプリンを含有する低多様性配列を有する結合ドメインの構成についての図1E~1Iにおけるものと等価のデータを表す。
図1Oは、図1Gに示されている細胞についての代表的な蛍光画像を示す。
図1Pは、図1Lに示されている細胞についての代表的な蛍光画像を示す。
図1Qは、図1D、図1G~1I、および図1L~1Nに示されている条件の比較を示す。YFP誘導係数が算出される:(#R+Y+÷#R+Y-)×100×med.Y-fluor(R+Y+)。N末端上のネイティブなイントロン(マウスパルブアルブミン遺伝子のイントロンI)およびC末端断片上のそのイントロンに対して最適化された結合ドメインの組換え効率の比較について示されている(白色の棒)。これにより、最適化された合成RNA二量体形成および組換えドメインが有益であることが例示される。
(実施例2)
3つの合成断片からのタンパク質の再構成
図2Aは、例示的なベクター設計の概略図を示す。YFPのタンパク質コード配列をN末端断片、中間断片(m-yfp)およびC末端断片に分割する。n断片とm断片の結合部をループ状設計の結合ドメイン(BD1)によって結合し、m断片とc断片の結合部をループ状結合ドメイン(BD2)によって結合する。ピリミジン(Y)配列およびプリン(R)配列を、m断片の自己環状化が回避され、また、N断片とC断片の直接組換えが回避されるように配置する。N末端断片をトランスフェクション対照としての赤色蛍光タンパク質と共発現させ、C末端断片をトランスフェクション対照としての青色蛍光タンパク質と共発現させる。
図2Bは、3つの断片上のマッチする結合ドメイン全てにより、細胞の80%において強力なYFP誘導が示されることを示す。20kのBFP+細胞についての赤色蛍光値および緑色蛍光値を示すフローサイトメトリー。
図2Cは、n断片およびm断片のみの発現ではYFP蛍光が示されないことの代表的な蛍光画像を示す(陰性対照)。
図2Dは、m断片およびc断片のみの発現ではYFP蛍光が示されないことの代表的な蛍光画像を示す(陰性対照)。
図2Eは、3つの断片全ての共トランスフェクションによって強力なYFP蛍光が誘導されることを示す代表的な蛍光画像を示す。
(実施例3)
2つの部分に分けられ再構成された全長YFPのin vivo送達
2つの断片からのYFPコード配列の再構成は、1つがYFPのN末端をコードする半分の断片を含み、1つがC末端をコードする半分の断片を含む、2つの合成RNA配列(図3A)(配列番号1および2)を使用することによって実現される。各断片が、マウス新生仔(P3)への全身(iv)投与後にAAV2/8から発現された。マウス当たり、2つの断片のそれぞれについて合計1.88×1011個のウイルスゲノムを投与した。3週間後に蛍光顕微鏡法を使用して肝臓、心筋、および骨格筋におけるYFPの発現を検出した。
図3Bに示されている通り、若齢マウスの肝臓において全長YFPの発現が検出されたが、注射していない肝臓ではYFP発現は示されなかった。
図3Cに示されている通り、若齢マウスの心筋において全長YFPの発現が検出されたが、注射していない心筋ではYFP発現は示されなかった。
図3Dに示されている通り、肢の骨格筋において全長YFPの発現が検出されたが、注射していない肝臓ではYFP発現は示されなかった。
したがって、本明細書に開示される系を使用して、in vivoにおいて2つまたはそれよりも多くの別々の合成RNA分子から全長タンパク質を発現させることができる。
(実施例4)
3つの部分に分けられ再構成された全長YFPのin vivo送達
3つの断片からのYFPコード配列の再構成は、1つがYFPのN末端断片を含み、1つがYFPの中間断片を含み、1つがC末端断片を含む、3つの合成RNA配列(図4A)(それぞれ配列番号145、146および2)によって実現される。
各断片が、マウス新生仔(P3)の前脛骨筋への筋肉内注射後にAAV2/8から発現された。断片それぞれについて合計1×1011個のウイルスゲノムを筋肉内投与した。3週間後に蛍光顕微鏡法を使用して骨格筋におけるYFPの発現を検出した。
図4Bに示されている通り、全長YFP蛍光の発現が前脛骨筋において観察された。
したがって、本明細書に開示される系を使用して、in vivoにおいて3つまたはそれよりも多くの別々の合成RNA分子から全長タンパク質を発現させることができる。
(実施例5)
再構成された全長タンパク質のin vivo送達
in vivoにおける3部分sRdR系の実現性を実証するために、YFPの断片を含有する2つまたは3つのいずれかのAAV移入プラスミド(AAVのDNA前駆体プラスミド)の組合せを成体マウスの後肢の前脛骨筋(TA)に経皮的に電気穿孔により導入した。筋肉内電気穿孔の5日後に、2つの部分に分割したYFP系ならびに3つの部分に分割したYFP系の両方の効率的な再構成が観察された(図5A~5F)。
図5A~5Fは、成体マウス前脛骨筋における2つの断片からおよび3つの断片からのYFPの効率的な再構成を表す。図5Aは、合成RNA二量体形成および組換えドメインを備えたYFPコード配列のN末端側半分およびC末端側半分を示す。図5Bは、これらの2つの断片を発現する2つのAAV移入プラスミドを成体マウス前脛骨(TA)筋に経皮的に電気穿孔により導入し、電気穿孔の5日後に強力な蛍光が検出されたことを示す。図5Cは、反対側の注射していないTAでは蛍光は検出可能でなかったことを示す。図5Dは、N末端、中間、およびC末端YFPコード配列が、各断片をその隣接する断片(複数可)に結合する合成RNA二量体形成および組換えドメインを備えていることを示す。図5Eは、これらの3つの断片を発現する3つのAAV移入プラスミドの経皮的な電気穿孔を示す。3つの断片からのYFPの効率的な再構成を示す強力なYFP蛍光が検出される。図5Fは、反対側の注射していないTAにおける蛍光を示す。コンテキストとして蛍光チャネルがグレースケール写真に重ね合わせられている。
2つまたは3つのベクターを使用して、肝臓、心筋(cardiac muscle)および骨格筋(2つのAAVベクター)、ならびに骨格筋(3つのAAVベクター)においてYFPを首尾よく発現させた。
したがって、本明細書に提示される合成RNA二量体形成および組換え系を筋肉において配置することができる。これらの結果に基づいて、YFPコード配列をジストロフィン(または他の遺伝子)コード配列で置換して、所望の対象および/または組織におけるAAVからの治療用全長ジストロフィン(または他の遺伝子)発現を実現することができる。
(実施例6)
DMDを処置するための、再構成された全長ジストロフィンの送達
デュシェンヌ型筋ジストロフィー(DMD)に罹患している患者に対する全長ジストロフィンを使用した効果的な遺伝子療法は依然として困難なままであり、それは、この大きなタンパク質のコード配列が大多数のウイルスベクターの容量を超えるからである。遺伝子置換療法における一般的かつ好ましい遺伝子送達方法はアデノ随伴ウイルス(AAV)である。AAVは、無毒性であり、忍容性が良好であり、また、ゲノムへのランダムな組込みを伴わずに置換遺伝子の長期にわたる発現をもたらす。しかし、ジストロフィン遺伝子は、単一のウイルスによって送達するには大きすぎる。断片に分解する場合、全長ジストロフィンは、最低3つのウイルスを使用することでのみ送達することができる。
「マイクロジストロフィン」または「ミニジストロフィン」と称されるより小さなバージョンのジストロフィンが現在ジストロフィン遺伝子置換療法に関して試験されているが、これらの短縮されたバージョンのジストロフィンは、タンパク質のロッドおよびヒンジ区画内の重要なドメインが欠如しているので、完全な機能性を有さないことが予測される。現在まで、この制限を克服するための過去の試みでは、DMDを処置するために必要な効率は得られていない。
ジストロフィンを含めた大きな遺伝子のコード配列を複数の一連の断片から効率的に再構成するために使用することができる新規の技術が本明細書に提示される。この技術を送達ベクターとしてのAAVと組み合わせて使用することで、全長ジストロフィンがDMDのマウスモデル(ならびにブタおよびイヌモデル)において発現される。一実施例では、対象はDMDを有するヒト成人、若年、または乳児である。例えば、本明細書に開示される方法および系を使用して、全長ジストロフィンをコードする合成RNA二量体形成および組換えドメインを2つまたは3つのAAVによって送達することができる(例えば、各AAVにより全長コード配列の半分または3分の1を送達する)。一実施例では、AAVは、筋指向性AAV(例えば、筋肉に優先的に感染するもの)。この手法を使用して、DMDのマウスまたはイヌモデルにおいて、ならびにヒト対象においてジストロフィーの症状を好転させるかまたはその発症を防止することができる。
パート1:効率的に再構成される3分割ジストロフィン発現カセットを構築する。in
vitroにおいて全長ジストロフィンコード配列を効率的に再構成すると同時に、個々の発現カセットがそれぞれ従来のAAVベクターのパッケージングの制限の範囲内に入る3つの発現カセットを構築する。治療的に有効なレベルのジストロフィンを実現するために、ジストロフィンのおよそ生理的なレベルまたは適度に超生理的なレベルが実現されるように発現系を最適化することができる。ジストロフィンの最大50倍の過剰発現が許容され、有害作用は伴わない。ジストロフィンコード配列をその長さに沿って複数の異なる点で分割することができる。しかし、再構成の効率は局所的なRNA微小環境の影響を受け、再構成効率の極大化は、いくつかの可能な分割点での効率を比較することによって経験的に行われる。天然のジストロフィンコード配列を最適な発現のためにコドン最適化し、最大の再構成効率に適応するように改変することができる。本明細書に開示される合成RNA二量体形成および組換え手法を使用して3分割前駆体から全長ジストロフィンコード配列を再構成することができることが予想される。異なる構成のスクリーニングにおいて、最も効率的なジストロフィンの再構成(例えば、ほぼ生理的または適度に超生理的なレベル)をもたらす3つの発現カセットのセットを選択する。HEK293T細胞またはヒト骨格筋細胞(HSkMC、初代またはトランス分化させたもの)において実験を実施することができる。内因性定量的RT-PCRプローブと外因性特異的定量的RT-PCRプローブとを使用し、外因性ジストロフィンタンパク質におけるエピトープタグの検出およびウエスタンブロット分析により、異なる構成の分割/再構成されたジストロフィンの再構成効率を決定する。
パート2:再構成されていない断片に対する全長ジストロフィン発現を最大にする。再構成されていないジストロフィンの断片化されたバックグラウンド発現の抑制を、合成RNA二量体形成および組換えドメインを改変することによって実現することができる。RNA組換えが無効であることによって引き起こされる再構成されていない断片の発現により、ジストロフィン断片のバックグラウンド発現がもたらされ得る。さらに、この断片化されたバックグラウンド発現抑制を、合成RNA二量体形成および組換えドメインを改変することによって実現することができる。本明細書に開示される手法を用いて、ジストロフィンの各断片を別々に転写する。RNAレベルで再構成が起こる。したがって、個々の断片がそれぞれ、再構成されることなく潜在的に翻訳され得る。ウエスタンブロットにおいて、全長ジストロフィンはおよそ430kDaで泳動氏、これらの断片はその約2/3(約290kDa)および1/3(約140kDa)のサイズで泳動する。再構成されていない断片の発現が回避され、ジストロフィンの全長発現が選好されるように合成RNA二量体形成および組換えドメインを最適化することができる。これは、例えば、デグロン配列を戦略的に配置すること、組み換えられていない断片のRNA核外移行を妨害すること、およびデコイ翻訳開始点を導入することによって実現することができる。実験をHEK293TおよびHSkMCに対して行う。ジストロフィンコード配列を、ウエスタンブロット分析を使用してジストロフィンの十分に再構成されていない断片を同定および定量化することを可能にするエピトープタグでブックエンドすることができる。これらのジストロフィン断片の細胞分布をヒト骨格筋細胞における免疫組織化学的検査を使用して評価する。さらに、定量的RT PCR組換え結合部を使用して、RNAレベルで効率的な再構成がどのくらい起こるかを決定することを含め、従来の分子生物学技法を使用して断片抑制の定量的評価を行う。断片化されたジストロフィン発現が低レベルで観察されることが予想される。合成RNA二量体形成および組換えドメインを改変することにより、これらの断片を抑制することができる。
パート3.in vitroおよびin vivoにおける発現のための全長ジストロフィンモジュールの高力価AAVストックを創出する。ジストロフィンを発現するAAVを高純度および3×1013GC/mlよりも多いウイルスゲノム計数で作製する。3つの筋指向性AAV血清型を作製する:AAV2/8、AAV2/9、およびAAV2/rh10。3部分に分割された蛍光タンパク質、エピトープタグでブックエンドされた、3部分に分割された全長ジストロフィン(上のパート2を参照されたい)、および、タグ付けされていない、3部分に分割された全長ジストロフィンを作製し、その結果、27種の高力価AAV調製物が生じる。治療用AAV粒子の全身送達には高濃度の大きなウイルス調製物が必要である。3つの別々のウイルスからのジストロフィンの再構成された発現を実現するために、ウイルスの反復投与を実施することができる。HEK293T細胞におけるAAV産生。イオジキサノールまたはCsCl精製。全てのバッチをin vitroにおいてHEK293Tおよびヒト骨格筋細胞で試験する。パート1および2における概説の通り、再構成効率および望ましくない断片発現を評価する。
パート4.in vivoにおけるFLD-AAVモジュールの発現/再構成レベルならびにin vivoにおける全長ジストロフィンを発現するAAVモジュールの組織分布を測定する。これらを、代理指標として3部分に分割された蛍光タンパク質に関して評価する。in vivo送達に関しては、新生マウスおよび若齢マウスにおける直接筋肉内送達(心筋および骨格筋)と全身性静脈内送達を比較する。上記の実施例において示されている通り、FLD-AAVの直接筋肉注射により全長ジストロフィンの効率的な発現がもたらされ得る。FLD-AAVの全身送達を免疫組織化学的検査およびウエスタンブロット分析を使用して調査する。新生マウスおよび若齢マウスにおける直接筋肉内送達および全身性静脈内送達を含めた異なる投与経路を比較する。この分析は以下に焦点を当てる:(1)骨格筋(主要な前肢、後肢、肩、腹部および顔の筋肉)、および速筋と遅筋とでの示差的感染力(differential infectivity)を、前脛骨筋とヒラメ筋を比較することによって評価する、(2)心筋(cardiac muscle)における発現、ならびに(3)肝臓における発現。この動物のコホートを高力価AAV注射に関する可能性のある有害作用についてモニタリングする。
AAVの直接筋肉注射はFLD-AAVモジュールを送達するための手法であるが(図5A~5Fにおける結果が上首尾である可能性があることを踏まえて)、それにもかかわらず、臨床的展望から、ウイルスの全身性i.v.送達を使用して全長ジストロフィン発現を実現することが望ましい。in vitroにおけるFLD-AAV試験を使用して、AAVコピー数と再構成されるジストロフィンレベルがどのように相関するかを決定する。組織分布および再構成の効率をin vivoで評価し、また、最適な組織分布を実現するために異なる送達パラダイム(例えば、血清型、ウイルス力価、適用の経路、繰り返し適用の数)を調査する。組織カバレッジおよび発現レベルを評価する。筋線維の一部しかジストロフィンを発現しない場合であっても(例えば、非ストレス条件下で心筋細胞の約50%のみでジストロフィンが欠損している正常な心機能)、有益な転帰を実現することができる。生理的なレベルのジストロフィンおよび超生理的なレベルのジストロフィンのどちらにも治療的価値がある。定量的評価をパート1および2に概説の通り実施する。in vivoにおける筋肉内ウイルス適用および全身性ウイルス適用を新生仔マウスまたは若齢マウスに対して無菌条件下で実施する。
パート5.FLD-AAVを用いてDMDマウスモデル(mdx)を処置し、疾患の発症/進行を評価する。新生仔mdxマウスにおけるFLD-AAV送達により、ミオパチーおよび心筋症の発症および進行が防止され得る。再構成された全長ジストロフィンのウイルスによる送達の最適化(パート1~4)の後、FLD-AAVによる処置をDMDのマウスモデルに施行する。これらのマウスは、それらが交配される遺伝的背景に応じて、ヒトDMDよりもあまり目立たないミオパチーを示す。より重症の表現型を示す遺伝的背景を有するマウス(D2.B10-Dmdmdx)では、後肢衰弱、筋重量減少、筋線維の減少、ならびに脂肪および線維症の増加が示される。これらのパラメータを野生型対照マウス、処置されたmdxマウス、および処置されていないmdxマウスの間で比較することができる。所望の転帰は疾患の発症/進行の好転または防止である。
ジストロフィン遺伝子に変異を有する2種のマウス系統、C57BL/10ScSn-Dmdmdx/J、およびD2.B10-Dmdmdx/Jを使用する。FLD-AAVを、パート4の下で記載されている確立されたパラメータに従って送達する。動物に、出生後第1週に、mdxマウスにおける筋壊死の発症前の時間ウインドウ内に注射を行う。野生型マウス、処置されたmdxマウスおよびビヒクル/擬処置されたmdxマウスを、骨格および心臓のミオパチーに関する行動および解剖学的徴候について評価する。運動学的および筋電図記録試験装置を使用して、平均台、握力、水平はしご、トレッドミルスピード負荷、地上での自発運動の運動学的評価、および水泳の運動学的評価(周辺温度および冷水負荷)などの種々の運動課題に関するこれらのマウスの成績を評価する。化学的負荷後にmdxマウスにおいてFLD-AAV治療により心筋症が示されることを防止できるかどうかを決定する。
これらの実験の所望の転帰は疾患の発症/進行の好転または防止である。
(実施例7)
再構成された全長MYO7Aの送達によりアッシャー症候群を処置する
MYO7Aコード配列の第1の半分を合成RNA二量体形成および組換えドメインに付加し、第1のベクター/プラスミドから発現させる。MYO7Aの第2の半分を相補的なRNA二量体形成および組換えドメインに付加し、第2のベクター/プラスミドから発現させる。同じ細胞において一緒に発現させると、MYO7Aの両半分が組み換えられて全長MYO7A転写物が形成され、次いでそれがタンパク質に翻訳される。
(実施例8)
転写/発現論理ゲート
標的遺伝子を2つの非機能性の半分に割り、それを2つの異なるプロモーターから、または2つの異なる送達ビヒクルを使用して発現させることにより、交差発現パターンをもたらすことができる。
例えば、本明細書に提示される第1の合成核酸分子のプロモーター1により、例えば、細胞型A、B、およびCにおけるコード配列のN末端側半分の発現を駆動することができ、一方、本明細書に提示される第2の合成核酸分子のプロモーター2により、細胞A、D、E、およびFのサブセットにおけるC末端側半分の発現を駆動する。そのような実施例では、標的タンパク質をコードするエフェクター遺伝子は重複する領域(本実施例では細胞集団A)においてのみ発現される。
両半分を条件付きで、例えば、リコンビナーゼの存在下で発現されるようにすることにより、同様の交差性を使用することができる。別のレベルでは、両半分を、異なるトロピズムを有する2つのウイルスを用いて送達することによって交差性を実現することができる。
(実施例9)
相補性
本明細書に開示される方法および系を使用して、別々のプラスミドに、両方のプラスミドが存在する場合にのみ活性になる2つの非機能性の半分をコードさせることにより、任意の遺伝子(および対応する標的タンパク質)を相補性の部分にすることができる(LacZのアルファ相補性の原理と同様)。
(実施例10)
トリガーRNA
本明細書に開示される系および方法を、標的タンパク質のコード配列の2つまたはそれよりも多くの部分の再構成が特定の「トリガー」RNA分子の存在に依存するように構成することができる。図7Bに示されている通り、本実施例では、各合成核酸分子の二量体形成ドメインは互いに逆相補物ではないが、その代わりに、2つの合成核酸分子に架橋してひとつにする橋としての機能を果たす「トリガーRNA」である第3のRNA分子の隣接する領域と特異的にハイブリダイズする。この例では、系により、レポーター/エフェクタータンパク質の「細胞型特異的誘発」を可能にする特定のRNA分子の存在を「報告」することができる。
(実施例11)
3’-UTRへの安定化エレメントの包含
本実施例では、RNAを安定化する3’-UTR内の配列の存在下での分割されたコード配列の組換えを評価するために使用する方法を記載する。ウッドチャック肝炎転写後調節エレメント3(WPRE3)を例示的な安定化配列として使用した。WPRE3の代わりに他のRNA配列安定化物質を使用することができることが当業者には理解されよう。
本明細書に開示される合成RNA二量体形成および組換え手法を使用して再構成される二方向分割YFPについてのYFP蛍光中央値をフローサイトメトリーによって測定した。C末端YFPコード断片の後にはポリアデニル化シグナルのみが続くか(WPRE3なし)、または短縮されたバージョンのウッドチャック肝炎転写後調節エレメント、WPRE3が続き、その後、ポリアデニル化シグナルが続く(WPRE3で標識する)。N末端YFPコード断片を双方向プロモーターからトランスフェクション対照としての赤色蛍光タンパク質と共発現させる。C末端断片を双方向プロモーターからトランスフェクション対照としての青色蛍光タンパク質と共発現させる。赤色蛍光対照値と青色蛍光対照値が等しい細胞を条件間で比較する。
図8に示されている通り、3’-UTRに安定化エレメントを含めることにより、組み換えられた全長YFPの発現効率が約50~60%上昇した。この増強は、WPRE配列により、WPRE配列が含有されるRNA分子の核外移行が刺激され、このRNA分子の核外移行は、スプライソソーム媒介性RNA結合が起こり得る前に図6Aの分子150が核外に運ばれ、したがって分子150が非機能的になることによってRNA結合反応(したがって、遺伝子発現)に負の影響を及ぼし得るにもかかわらず、観察される。
したがって、本明細書に開示される合成分子(例えば、配列番号159、160、161、162、163、164、165、および166のいずれか)を、RNA配列安定化物質をさらに含むように改変することができる。
(実施例12)
結合ドメインの長さの再構成効率に対する影響
結合ドメインの長さを以下の通り評価した。YFPを2つの非蛍光の半分に分割した(配列番号1および2、結合ドメインの長さが異なる)。培養したHEK 293T細胞における異なる長さの結合ドメイン(50~500ヌクレオチドにわたる)についての再構成効率を評価した。N末端YFPを双方向CMVプロモーターからトランスフェクション対照としての赤色蛍光タンパク質(RFP)と共に発現させる。C末端YFPを双方向CMVプロモーターからトランスフェクション対照としての青色蛍光タンパク質(BFP)と共に発現させる。異なる結合ドメインの長さについて、YFP蛍光強度中央値を比較した。匹敵するRFPおよびBFPトランスフェクションレベルを有する細胞を条件間で比較する。
図11に示されている通り、全ての分子でいくらかのレベルの全長YFPの発現が実現され、再構成効率の程度は様々であった。結合ドメインの長さが150bpおよびそれよりも短い(例えば、50~150bp)場合に最大の性能が観察されたが、最大500bpの結合ドメインの長さでもなお組み換えられ、全長YFPの発現が可能であった。
(実施例13)
スプライシングエンハンサー配列の影響
本実施例では、本明細書に開示される合成イントロンに1つまたは複数のイントロンスプライシングエンハンサー配列(例えば、図6Aの118、120、156)を含めることの影響を評価するために使用する方法を記載する。
YFPを2つの非蛍光の半分に分割した(図12A)。培養したHEK 293T細胞における異なるイントロン構成についての再構成効率を評価した。N末端YFPを双方向CMVプロモーターからトランスフェクション対照としての赤色蛍光タンパク質(RFP)と共に発現させた。C末端YFPを双方向CMVプロモーターからトランスフェクション対照としての青色蛍光タンパク質(BFP)と共に発現させた。異なるイントロン構成について、YFP蛍光強度中央値を比較する。匹敵するRFPおよびBFPトランスフェクションレベルを有する細胞を条件間で比較する。
図12Aに示されている通り、5’分子(配列番号1)は、YFPのN末端部分のコード領域(n-yfp)、続いて、スプライスドナー配列(SD)、下流イントロンスプライシングエンハンサー(DISE)、および2つのイントロンスプライシングエンハンサー(2×ISE)、結合ドメイン(BD)、自己切断性ハンマーヘッド型リボザイム(HHrz)、最後にポリアデニル化シグナル(pA)を含む。3’分子(配列番号2)は、相補的結合ドメイン(抗BD)、続いて、3つのイントロンスプライシングエンハンサー配列(3×ISE)、分岐点(BP)、ポリピリミジントラクト(PPT)、スプライスアクセプター配列(SA)、YFPコード配列のC末端部分、最後にポリアデニル化シグナル(pA)を含む。
図12Bに示されている通り、5’分子および3’分子の両方にスプライスエンハンサーを含めることにより、全長YFPの再構成効率が上昇する。スプライスエンハンサーを除去することにより、2つのコード配列の再構成効率が約50~90%低下する。最初の縦棒では、YFPが参照構成(配列番号1および2)を用いて再構成されており、2番目の縦棒は、5’断片のISEエレメントの欠失を伴う場合の再構成効率を示し、3番目の縦棒は、5’断片のISEおよびDISEの欠失後の再構成効率を示す。4番目の縦棒は、5’断片のHHrzの欠失後の再構成効率を示す。5番目の縦棒は、参照構成を使用した再構成効率を示す。6番目の縦棒は、3’断片のISEエレメントの欠失後の再構成効率を示す。7番目は5’断片および3’断片の両方のISEならびに5’断片のDISEの欠失後の再構成効率を示す。
(実施例14)
デュアル投影追跡
本実施例では、2つの断片(配列番号147および148)からの全長flpリコンビナーゼ(Flpo)の再構成によるデュアル投影追跡を実施するための方法を記載する。図13Aに示されている通り、Flpリコンビナーゼ遺伝子を2つの非機能性の半分に分割した。Flpo遺伝子のN末端側半分をその3’末端において合成イントロン配列、続いて二量体形成ドメイン配列(RNA末端結合モジュール、REJ)と結合した。Flpo遺伝子のC末端側半分をその5’末端において合成イントロンおよび二量体形成ドメイン(REJ-モジュール)と結合した。細胞に両方の構築物が感染し、各構築物からプレmRNAが発現されると、プレmRNAが二量体形成ドメイン(図13Aにおいて濃い並行した棒によって示されている)で結合し、得られた複合体がスプライスされて全長FlpoリコンビナーゼmRNA転写物が生じる。したがって、2つの断片の再構成によって機能的なリコンビナーゼタンパク質が生じた。図13Bは、flpo依存性赤色蛍光タンパク質(tdTomato)(Rosa-CAG-frt-STOP-frt-tdTomato)を有するflp活性レポーターマウスの概略図を示す。2つの合成核酸(DNA)構築物を別々のアデノ随伴ウイルス(逆行輸送される血清型AAV2/retro)にパッケージングした。第1の構築物を運ぶウイルスであるAAV2/retro-n-flpoをマウスの左一次運動野に注射し、第2の構築物を運ぶウイルスであるAAV2/retro-c-flpoをマウスの右一次運動野に注射した。
図13C~13Dに示されている通り、軸索が正中線を交差している一次運動野細胞が赤色蛍光タンパク質で標識される(図13Cおよび13Dにおいて白色に見える)。コンテキストとしてHoechst染色(核)が示されている。
(実施例15)
in vivoにおける長いタンパク質の発現
本実施例では、細胞培養物中およびマウス一次運動野におけるin vivoでの特大カーゴの効率的な発現を実現するために使用する方法を記載する。
2つのウイルスのアデノ随伴ウイルス(AAV)カーゴ容量をいっぱいにする(すなわち、単一のAAVのパッケージング容量を超える)、疾患を引き起こす大きな遺伝子をシミュレートするために、分割したYFPコード配列を大きな中断なしのオープンリーディングフレームの内部に包埋した。N末端(すなわち、5’側)では、2A自己切断性ペプチドをコードする配列が後に続く長いスタッファー配列(すなわち、中断なしのオープンリーディングフレーム)にYFPコード配列の第1の部分が隣接する。C末端(すなわち、3’側)では、YFPコード配列の第2の部分の後に2A自己切断性ペプチドコード配列が続き、次いで、長いスタッファー配列(すなわち、および中断なしのオープンリーディングフレーム)が続く(図14A)。プレmRNA分子をコードする第1の合成DNA分子および第2の合成DNA分子が、プロモーター配列を除いて、配列番号22および23に示されている。得られる発現されたRNA分子はそれぞれ配列番号22の1位にある転写開始部位および配列番号23の1位にある転写開始部位とポリA尾部の間の約4000ntである。得られる転写されたプレmRNA分子(5’断片;配列番号22から転写される)は、スタッファーオープンリーディングフレームを含有し、その後には自己切断性2Aペプチドコード配列が続き、その後、YFPのN末端部分をコードする配列が続き、その後、合成イントロンおよび二量体形成ドメイン(キッシングループアーキテクチャを有する)、ならびにポリA尾部が続く。C末端プレmRNA分子(3’断片;配列番号23から転写される)は、相補的なキッシングループ二量体形成ドメイン、合成イントロン配列、その後のC末端YFPコード配列、その後の自己切断性2Aペプチドコード配列、その後のスタッファーオープンリーディングフレーム、その後のポリA尾部で構成される。
プレmRNA分子が産生された後、二量体形成ドメインが結合し、スプライシングによりプレmRNAが結合して全長mRNAが生じる。翻訳の間に、YFPに隣接する2A切断配列によりN末端スタッファー配列およびC末端スタッファー配列の切断ならびに機能的YFPタンパク質の産生がもたらされる。
RNAレベルでの再構成効率を決定するために、2つのプローブに基づく(5’加水分解)定量的リアルタイムPCRアッセイを使用する。第1のアッセイは、3’エクソンYFP配列に完全に含有される配列にわたる(3’プローブで標識)。第2のアッセイは、5’エクソンYFP配列と3’エクソンYFP配列の結合部にわたる(結合部プローブで標識)。再構成効率は(結合部プローブ計数)/(3’プローブ計数)の比として算出される。
HEK 293T細胞における特大YFP構築物の再構成効率の定量的リアルタイムPCR分析を実施した。全長特大YFPを参照として使用する。全長特大YFP比を1に設定する(図14B)。再構成された比を、全長に対する分率として表す(標識された分割-REJ(分割RNA末端結合))。再構成効率は以下の通り算出される:結合部/3’プライム。図14Bに示されている通り、分割-REJ系でRNAの約60%が結合した。
全長特大YFP発現および分割-REJ発現からの再構成されたYFPタンパク質の発現を、一過性にトランスフェクトされたHEK 293T細胞のフローサイトメトリーによって評価した。図14Cに示されている通り、分割REJ系により、大きなカーゴであっても約45%の結合効率が実現された。
大きなYFPタンパク質の再構成に関するin vivo分析を以下の通り実施した。3×10vg/注射/断片を含有するアデノ随伴ウイルス2/8を60nl、マウスの一次運動野に注射した。注射の10日後に組織を回収した。図14Dに示されている通り、バルク組織においてYFP蛍光が容易に検出可能である(左上、中央上のパネル、マウス脳の肉眼で見える上面図、YFP蛍光に加えてコンテキストとして自家蛍光が示されている)。運動野の層5内のウイルス注射部位およびその周囲において強力なYFPシグナルが検出される(右側のパネル、皮質層に1~6の番号が付されている、おおよその注射の深さが灰色の棒で示されている、スケールバー=100マイクロメートル)。したがって、本明細書に開示される系を使用して、大きなタンパク質をin vivoで発現させることができる。
(実施例16)
第VIII因子の発現
本実施例では、全長ヒト凝固第VIII因子(FVIII)の効率的な再構成を実現するために使用する方法を記載する。
図15Aに示されている実験に使用した5’核酸分子および3’核酸分子の概略図(プレRNA分子をコードするDNAがそれぞれ配列番号24および25に記載されている)。各半分が約3.8kbのFVIIIコード配列を含む。得られる、FVIIIコード配列のRNA5’配列を含有するN末端側半分(例えば、図6Aの110に概略的に示されている)はその後に効率的な合成イントロンおよび二量体形成ドメイン(キッシングループアーキテクチャ)、ならびにポリA尾部が続く。FVIIIコード配列の3’配列を含有するC末端側半分(例えば、図6Aの150)はその前に相補的なキッシングループ二量体形成ドメイン、および効率的な合成イントロン配列がある。RNAレベルでの再構成効率を決定するために、2つのプローブに基づく(5’-加水分解)定量的リアルタイムPCRアッセイを使用する。第1のアッセイは、3’エクソンFVIII配列に完全に含有される配列にわたる(3’プローブで標識)。第2のアッセイは、5’エクソンFVIII配列と3’エクソンFVIII配列の結合部にわたる(結合部プローブで標識)。再構成効率は(結合部プローブ計数)/(3’プローブ計数)の比として算出される。
HEK 293T細胞における発現の2日後の再構成効率のPCRによる定量化を実施した。全長FVIIIを参照として使用する。全長FVIII比を1に設定する。再構成されたFVIIIアッセイ比を全長に対する分率として表す(分割-REJで標識)。図15Bに示されている通り、約40~60%の再構成効率が実現された(つまり、2つのRNAのうちの約40~60%が分割-REJ系において結合された)。
in vitroにおけるFVIIIの発現を実証するためにウエスタンブロッティングを使用した。FVIIIのN末端にHAタグでタグ付けした。構築物を2日間にわたってHEK 293T細胞において発現させる。図15Cに示されている通り、本明細書に開示される分割-REJ系により、in vitroにおいて全長FVIIIが首尾よく発現された。
これらの知見に基づいて、例えば、血友病Aを処置するために、in vivoにおける全長FVIIIタンパク質の発現を実現することができる。例えば、FVIIIコード配列の第1の半分を合成RNA二量体形成および組換えドメインに付加し、第1のベクター/プラスミドから発現させる。FVIIIの第2の半分を相補的なRNA二量体形成および組換えドメインに付加し、第2のベクター/プラスミドから発現させる。同じ細胞において一緒に発現させると、FVIIIの両半分が組み換えられ全長FVIII転写物が形成され、次いでそれがタンパク質に翻訳される。例えば、N末端FVIIIコード配列を含む、配列番号24に対して少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または100%の配列同一性を有する配列、およびC末端FVIIIコード配列を含む配列番号25をin vivo発現に利用することができる。
(実施例17)
Abca4の発現
本実施例では、全長ヒトATP結合カセットサブファミリーAメンバー4(Abca4)の効率的な再構成を実現するために使用する方法を記載する。
使用した5’分子および3’分子の概略図が図16A示されている(プレRNA分子をコードするDNAはそれぞれ配列番号20および21に記載されている)。5’側半分は約3.6kbのAbca4コード配列を含み、3’側半分は約3.2kbのAbca4コード領域とそれに加えてC末端3×FLAGタグを含む。5’側配列は、コード配列のN末端側半分、その後に効率的な合成イントロン配列および第1の二量体形成ドメイン(キッシングループ)を含有する。コード配列のC末端側半分を含有する3’側配列の前には相補的な(キッシングループ)二量体形成ドメインおよび効率的な合成イントロン配列がある。結合部にわたるサンガーシーケンシングトレースが示されている。
図16Bに示されている通り、結合部のPCR増幅により、2つのコード配列の忠実な結合が実証される。RNAレベルでの再構成効率を決定するために、2つのプローブに基づく(5’-加水分解)定量的リアルタイムPCRアッセイを使用する(図16C)。第1のアッセイは、3’エクソンAbca4配列に完全に含有される配列にわたる(3’プローブで標識)。第2のアッセイは、5’エクソンAbca4配列と3’エクソンAbca4配列の結合部にわたる(結合部プローブで標識)。再構成効率は(結合部プローブ計数)/(3’プローブ計数)の比として算出される。HEK 293T細胞における発現の2日後の再構成効率のPCRによる定量が図16Dに示されている。全長Abca4を参照として使用する。平均全長Abca4比を1に設定する。再構成されたAbca4アッセイ比を全長に対する分率として表す(分割-REJで標識)。図16Dに示されている通り、約35%の再構成効率が実現された(つまり、2つのRNAのうちの約30~40%が分割-REJ系において結合された)。
in vitroにおけるAbca4の発現を実証するためにウエスタンブロッティングを使用した。Abca4のC末端に3×FLAG-タグでタグ付けする。構築物を2日間にわたってHEK 293T細胞において発現させる。図16Eに示されている通り、本明細書に開示される分割-REJ系により、in vitroにおいて全長Abca4が首尾よく発現された。
ウエスタンブロットの定量が図16Fに示されている。条件間での示差的トランスフェクション効率について正規化するために、全長プラスミドおよびC末端プラスミドをトランスフェクション対照としての青色蛍光タンパク質と共発現させる。各試料におけるBFP濃度をドットブロットによって決定し、条件間での正規化に使用した。図16Fに示されている通り、再構成されたAbca4が直接全長発現と比較しておよそ40%のレベルで発現される。したがって、ウエスタンブロットによって決定されるタンパク質レベルによりqPCRによって決定されるRNA再構成効率がよく追跡される。
これらの知見に基づいて、例えば、スタルガルト病を処置するために、in vivoにおける全長ABCA4タンパク質の発現を実現することができる。例えば、ABCA4コード配列の第1の半分を合成RNA二量体形成および組換えドメインに付加し、第1のベクター/プラスミドから発現させる。ABCA4の第2の半分を相補的なRNA二量体形成および組換えドメインに付加し、第2のベクター/プラスミドから発現させる。同じ細胞において一緒に発現させると、ABCA4の両半分が組み換えられ全長ABCA4転写物が形成され、次いでそれがタンパク質に翻訳される。例えば、N末端Abca4コード配列を含む、配列番号20に対して少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または100%の配列同一性を有する配列(図10R~10U)、およびC末端Abca4コード配列を含む配列番号21(図10V~10Z)をin vivo発現に利用することができる。
(実施例18)
Otofの発現
本実施例では、全長マウスオトフェルリン(Otof)の効率的な再構成を実現するために使用する方法を記載する。
使用した5’DNA分子および3’DNA分子の配列がそれぞれ配列番号155および156に示されている。5’側半分は約3.5kbのOtofコード配列を含み、3’側半分は約2.5kbのOtofコード領域とそれに加えてC末端3×FLAGタグを含む。C末端側半分を含有する3’側配列(例えば、図6Aの150)の前には相補的結合ドメインおよび効率的な合成イントロン配列がある。ヒトOTOFコード配列(例えば、GenBank受託番号NM_001287489.2またはNM_194248.3)で配列番号155および156のマウスコード配列を置換することができることが当業者には理解されよう。
in vitroにおけるOtofの発現を実証するためにウエスタンブロッティングを使用した。ウエスタンブロットによる検出のためにOtofをC末端に3×FLAG-タグでタグ付けする。構築物を2日間にわたってHEK 293T細胞において発現させる。図18Aに示されている通り、本明細書に開示される分割-REJ系により、in vitroにおいて全長Otofが首尾よく発現された。
ウエスタンブロットの定量が図18B~Cに示されている。生の定量が左側の棒プロット(図18B)に全長対照に対する分率として示されている。条件間での示差的トランスフェクション効率について正規化するために、全長プラスミドおよびC末端プラスミドをトランスフェクション対照としての青色蛍光タンパク質と共発現させる。細胞を回収する前に各試料におけるBFP濃度を共焦点蛍光顕微鏡法によって決定し、条件間での正規化に使用した。正規化された定量が右側の棒プロット(図18C)に全長対照に対する正規化された分率として示されている。図18Cに示されている通り、再構成されたOtofが直接全長発現と比較しておよそ30%のレベルで発現される。
これらの知見に基づいて、例えば、常染色体劣性聴覚消失9を処置するために、in vivoにおける全長OTOFタンパク質の発現を実現することができる。例えば、OTOFコード配列の第1の半分を合成RNA二量体形成および組換えドメイン(イントロンおよび結合ドメインである)に付加し、第1のベクター/プラスミドから発現させる。OTOFの第2の半分を相補的なRNA二量体形成および組換えドメインに付加し、第2のベクター/プラスミドから発現させる。同じ細胞において一緒に発現させると、2つのRNA分子が標的細胞において発現され、OTOFコード転写物の両半分が組み換えられ全長OTOF転写物が形成され、次いでそれがタンパク質に翻訳される。例えば、聴力損失を処置するために、例えば、N末端Otofコード配列を含む、配列番号155に対して少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または100%の配列同一性を有する配列、およびC末端Otofコード配列を含む配列番号156をin vivo発現に利用することができる。
(実施例19)
Myo7aの発現
本実施例では、全長ヒトミオシンVIIA(Myo7a)の効率的な再構成を実現するために使用する方法を記載する。
使用した5’DNA分子および3’DNA分子の配列がそれぞれ配列番号157および158に示されている。5’側半分は約3.6kbのMyo7aコード配列を含み、3’側半分は約3.1kbのMyo7aコード領域とそれに加えてC末端3×FLAGタグを含む。C末端側半分を含有する3’側配列(例えば、図6Aの150)の前には相補的結合ドメインおよび効率的な合成イントロン配列がある。
in vitroにおけるMyo7aの発現を実証するためにウエスタンブロッティングを使用した。ウエスタンブロットによる検出のためにMyo7aのC末端に3×FLAG-タグでタグ付けする。構築物を2日間にわたってHEK 293T細胞において発現させる。図19Aに示されている通り、本明細書に開示される分割-REJ系により、in vitroにおいて全長Myo7aが首尾よく発現された。
ウエスタンブロットの定量が図19B~19Cに示されている。生の定量が左側の棒プロット(図19B)に全長対照に対する分率として示されている。条件間での示差的トランスフェクション効率について正規化するために、全長プラスミドおよびC末端プラスミドをトランスフェクション対照としての青色蛍光タンパク質と共発現させる。細胞を回収する前に各試料におけるBFP濃度を共焦点蛍光顕微鏡法によって決定し、条件間での正規化に使用した。正規化された定量が右側の棒プロット(図19C)に全長対照に対する正規化された分率として示されている。図19Cに示されている通り、再構成されたMyo7aが直接全長発現と比較しておよそ60%のレベルで発現される。
これらの知見に基づいて、例えば、アッシャー症候群、1B型を処置するために、in
vivoにおける全長MYO7Aタンパク質の発現を実現することができる。例えば、MYO7Aコード配列の第1の半分を合成RNA二量体形成および組換えドメイン(イントロンおよび結合ドメインである)に付加し、第1のベクター/プラスミドから発現させる。MYO7Aの第2の半分を相補的なRNA二量体形成および組換えドメインに付加し、第2のベクター/プラスミドから発現させる。同じ細胞において一緒に発現させると、2つのRNA分子が標的細胞において発現され、両半分のMYO7Aコード転写物が組み換えられ全長MYO7A転写物が形成され、次いでそれがタンパク質に翻訳される。例えば、N末端Myo7aコード配列を含む、配列番号157に対して少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または100%の配列同一性を有する配列、およびC末端Myo7aコード配列を含む配列番号158をin vivo発現に利用することができる。
(実施例20)
2つの部分からなる系におけるdCas9-VPRの発現
本実施例では、VPR転写活性化因子ドメインに融合した全長の酵素的に不活性型のCas9(dCas9-VPR)の効率的な再構成を実現するために使用する方法を記載する。
使用した5’DNA分子および3’DNA分子(第1のRNA分子および第2のRNA分子をコードする第1のDNA分子および第2のDNA分子)の配列がそれぞれ配列番号159および160に示されている。第1のDNA分子は約3.3kbのdCas9-VPRコード配列(dCas9N末端部分)を含み、第2のDNA分子は約2.5kbのdCas9-VPRコード配列(dCas9C末端部分)を含む。5’側配列(第1のDNA分子)によってコードされるRNAは、dCas9のN末端部分(例えば、図6Aの110)、その後の効率的な合成イントロン配列および相補的な結合ドメイン(第1の二量体形成ドメイン)をコードする。3’側配列(第2のDNA分子)によってコードされるRNAは、dCas9のC末端部分(例えば、図6Aの150)、その前の相補的な結合ドメイン(第2の二量体形成ドメイン)および効率的な合成イントロン配列をコードする。
in vitroにおけるdCas9-VPRの発現を実証するために、ウエスタンブロッティングを使用した。構築物をHEK293T細胞において2日間にわたって発現させた。図20Aに示されている通り、本明細書に開示される分割-REJ系(「REJ-デュアル」)によりin vitroで全長dCas9-VPRが首尾よく発現された。
ウエスタンブロットの定量が図20B~20Cに示されている。生の定量が左側の棒プロット(図20B)に全長対照に対する分率として示されている。全長対照dCas9-VPRはインタクトな遺伝子を含む単一の構築物から産生された。条件間での示差的トランスフェクション効率について正規化するために、使用した全長プラスミドおよびC末端プラスミドをトランスフェクション対照としての青色蛍光タンパク質(BFP)と共発現させる。細胞を回収する前に各試料におけるBFP濃度を共焦点蛍光顕微鏡法によって決定し、条件間での正規化に使用した。正規化された定量が右側の棒プロット(図20C)に全長対照に対する正規化された分率として示されている。図20Cに示されている通り、再構成されたdCas9-VPRが直接全長発現と比較しておよそ35%のレベルで発現される。HEK293t細胞においてUASを標的とするガイドRNAと共に発現させると(図20D)、全長dCas9-VPRおよび二方向分割再構成dCas9-VPRのどちらによってもUAS-YFPプラスミドからの黄色蛍光タンパク質の発現が誘導され、それにより、再構成されたdCas9-VPRの機能性が実証される。
これらの知見に基づいて、例えば、遺伝子を活性化するまたは過剰発現させるために、in vivoにおける全長dCas9-VPRタンパク質の発現を実現することができる。例えば、第1のRNA分子は、第1の合成RNA二量体形成および組換えドメイン(イントロンおよび結合ドメインである)に付加したdCAS9-VPRタンパク質コード配列の第1の部分を含む。この分子は第1のベクター/プラスミドから発現される。第2のRNA分子は相補的な第2のRNA二量体形成および組換えドメインに付加したdCAS9-VPRタンパク質コード配列の第2の部分を含み、第2のベクター/プラスミドから発現される。2つのRNA分子が同じ標的細胞において発現されると、DCAS9-VPRコード転写物の2つの部分が組み換えられて全長dCAS9-VPR転写物が形成され、次いでそれがタンパク質に翻訳される。例えば、N末端dCas9-VPRコード配列を含む配列番号159、およびC末端dCas9-VPRコード配列を含む配列番号160に対して少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または100%の配列同一性を有する配列をin vivo発現に利用することができる。
(実施例21)
2つの部分からなる系におけるプライムエディターの発現
本実施例では、全長ヒト化Cas9プライムエディター(プライムエディター)の効率的な再構成を実現するために使用する方法を記載する。
使用した5’DNA分子および3’DNA分子(第1のRNA分子および第2のRNA分子をコードする第1のDNA分子および第2のDNA分子)の配列がそれぞれ配列番号161および162に示されている。第1のDNA分子は約3.3kbのプライムエディターコード配列(N末端部分)を含み、第2の部分は、約3.0kbのプライムエディターコード配列(C末端部分)を含む。5’側配列(第1のDNA分子)によってコードされるRNAは、プライムエディターのN末端部分(例えば、図6Aの110)、その後の効率的な合成イントロン配列および相補的な結合ドメイン(第1の二量体形成ドメイン)をコードする。3’側配列(第2のDNA分子)によってコードされるRNAは、プライムエディターのC末端部分(例えば、図6Aの150)、その前の相補的な結合ドメイン(第2の二量体形成ドメイン)および効率的な合成イントロン配列をコードする。
in vitroにおけるプライムエディターの発現を実証するために、ウエスタンブロッティングを使用した。構築物をHEK293t細胞において2日間にわたって発現させた。図21Aに示されている通り、本明細書に開示される分割-REJ系により、in vitroにおいて全長プライムエディターが首尾よく発現された。
ウエスタンブロットの定量が図21B~21Cに示されている。生の定量が左側の棒プロット(図21B)に全長対照に対する分率として示されている。全長対照プライムエディターはインタクトな遺伝子を含む単一の構築物から産生された。条件間での示差的トランスフェクション効率について正規化するために、使用した全長プラスミドおよびC末端プラスミドをトランスフェクション対照としての青色蛍光タンパク質と共発現させた。細胞を回収する前に各試料におけるBFP濃度を共焦点蛍光顕微鏡法によって決定し、条件間での正規化に使用した。正規化された定量が右側の棒プロット(図21C)に全長対照に対する正規化された分率として示されている。図21Cに示されている通り、再構成されたプライムエディターが直接全長発現と比較しておよそ60%のレベルで発現される。図21Dは、全長プライムエディターおよび二方向分割プライムエディターを使用して標的化されたGからTへの塩基転換変異を導入することができることを示し、それにより、二方向分割プライムエディター構築物から産生されたタンパク質の機能性が実証される。
これらの知見に基づいて、例えば、ゲノム点変異を処置するために、in vivoにおける全長プライムエディタータンパク質の発現を実現することができる。例えば、第1のRNA分子は、第1の合成RNA二量体形成および組換えドメイン(イントロンおよび結合ドメインである)に付加されたプライムエディターコード配列の第1の部分を含む。この分子は第1のベクター/プラスミドから発現される。第2のRNA分子は、第2の相補的なRNA二量体形成および組換えドメインに付加されたプライムエディタータンパク質コード配列の第2の部分を含み、第2のベクター/プラスミドから発現される。2つのRNA分子が同じ標的細胞において発現されると、プライムエディターコード転写物の2つの部分が組み換えられて全長プライムエディター転写物が形成され、次いでそれがタンパク質に翻訳される。例えば、N末端プライムエディターコード配列を含む配列番号161、およびC末端プライムエディターコード配列を含む配列番号162に対して少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または100%の配列同一性を有する配列をin vivo発現に利用することができる。
(実施例22)
2つの部分からなる系におけるAncBE4の発現
本実施例では、全長ヒト化Cas9シトシン塩基エディター(AncBE4)の効率的な再構成を実現するために使用する方法を記載する。
使用した5’DNA分子および3’DNA分子(第1のRNA分子および第2のRNA分子をコードする第1のDNA分子および第2のDNA分子)の配列がそれぞれ配列番号163および164に示されている。第1のDNA分子は約2.4kbのAncBE4コード配列(AncBE4 N末端部分)を含み、第2のDNA分子は約3.2kbのAncBE4コード配列(AncBE4 C末端部分)を含む。5’側配列(第1のDNA分子)によってコードされるRNAは、AncBE4のN末端部分(例えば、図6Aの110)、その後の効率的な合成イントロン配列および相補的な結合ドメイン(第1の二量体形成ドメイン)をコードする。3’側配列によって(第2のDNA分子によって)コードされるRNAは、C末端部分(例えば、図6Aの150)、その前の相補的な結合ドメインおよび効率的な合成イントロン配列をコードする。
in vitroにおけるAncBE4の発現を実証するために、ウエスタンブロッティングを使用した。構築物を2日間にわたってHEK 293T細胞において発現させる。図22Aに示されている通り、本明細書に開示される分割-REJ系により、in vitroにおいて全長AncBE4が首尾よく発現された。
ウエスタンブロットの定量が図22Bに示されている。生の定量が左側の棒プロット(図22B)に全長対照に対する分率として示されている。全長対照AncBE4はインタクトな遺伝子を含む単一の構築物から産生された。図22Bに示されている通り、再構成されたAncBE4が直接全長発現と比較しておよそ40~50%のレベルで発現される。図22Cは、全長および二方向分割AncBE4を使用して標的化されたCからTへの転位変異を導入することができることを示し、それにより二方向分割AncBE4構築物の機能性が実証される。
これらの知見に基づいて、例えば、ゲノム点変異を処置するために、in vivoにおける全長ANCBE4タンパク質の発現を実現することができる。例えば、第1のRNA分子は、第1の合成RNA二量体形成および組換えドメイン(イントロンおよび結合ドメインである)に付加したANCBE4タンパク質コード配列の第1の部分を含む。この分子は第1のベクター/プラスミドから発現される。相補的なRNA二量体形成および組換えドメインに付加したANCBE4タンパク質コード配列の第2の部分を含む第2のRNA分子を第2のベクター/プラスミドから発現させる。2つのRNA分子が同じ標的細胞において発現されると、ANCBE4コード転写物の2つの部分が組み換えられて全長ANCBE4転写物が形成され、次いでそれがタンパク質に翻訳される。例えば、N末端AncBE4コード配列を含む、配列番号163に対して少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または100%の配列同一性を有する配列、およびC末端AncBE4コード配列を含む配列番号164をin vivo発現に利用することができる。
(実施例23)
in vivoにおけるABE8eの発現およびジストロフィン変異のレスキュー
本実施例では、in vivoにおける全長ヒト化Cas9アデノシン塩基エディター(ABE8e)の効率的な再構成を実現し、それにより、mdx中途終止コドンの編集および処置された筋肉におけるジストロフィンの発現をもたらすために使用する方法を記載する。
使用した5’DNA分子および3’DNA分子の配列がそれぞれ配列番号225および26に示されている(上記のgRNA発現カセットを含む)。配列番号225および226内の塩基エディター発現構築物はそれぞれ配列番号165および166によって構成される。第1のDNA分子(配列番号225および165内)は約2.4kbのABE8eコード配列(ABE8e N末端部分)を含み、第2のDNA分子(配列番号226および166内)は約3.2kbのABE8eコード配列を含む。5’側配列(第1のDNA分子)によってコードされるRNAは、ABE8eのN末端部分(例えば、図6Aの110)をコードする。3’側配列(第2のDNA分子)によってコードされるRNAは、C末端部分(例えば、図6Aの150)およびその前の相補的な結合ドメイン(第2の二量体形成ドメイン)および効率的な合成イントロン配列をコードする。
in vitroにおけるABE8eの発現を実証するために、ウエスタンブロッティングを使用した。構築物をHEK293t細胞において2日間にわたって発現させた。図23Aに示されている通り、本明細書に開示される分割-REJ系により、in vitroにおいて全長ABE8eが首尾よく発現された。
ウエスタンブロットの定量が図23Bに示されている。生の定量が左側の棒プロット(図23B)に全長対照に対する分率として示されている。全長対照ABE8eはインタクトな遺伝子を含む単一の構築物から産生された。図23Bに示されている通り、再構成されたABE8eが直接全長発現と比較しておよそ70%のレベルで発現される。図23Cは、全長および二方向分割ABE8e構築物を使用して標的化されたCからTへの転位変異を導入することができることを示し、それにより、二方向分割ABE8e構築物の機能性が実証される。
中途終止コドンを補正するための全長ヒト化アデニン塩基エディター(ABE8e)(1606アミノ酸)の効率的な再構成および発現を実証するために、デュシェンヌ型筋ジストロフィーのmdx-4cvマウスモデルにおいて中途終止コドンを補正する実施例が図23D~Gに示されている。図23Dは実験の概略図を示す。ABE8e塩基エディターを2つの断片に分割し、そのコードDNAを2つの別々のアデノ随伴ウイルスカプシドに個別にパッケージングする。CRISPR gRNAを、AからGへの変換によりTAA終止コドンがCAAコドンに変換されるように、中途終止コドンの遺伝子座を標的とするように設計する。
ABE8e塩基エディターおよび設計されたCRISPR gRNAの機能性を実証するために、黄色蛍光タンパク質(YFP)を、中途終止コドンの周囲のmdxコード配列の短い一続きで接続された2つのコード断片に分割することを図23Eに示す。YFPの第1の半分は、オープンリーディングフレームが中途TAA終止コドンによって終止する場合には非蛍光である。終止コドン補正の結果、蛍光が付与された完全なYFP配列の翻訳がもたらされる(この構築物はYFP-編集-レポーターと称される)。左側のパネルは、HEK293T細胞にYFP-編集-レポーター(赤色蛍光トランスフェクション対照を共発現する)、N末端ABE8eベクター、C末端ABE8eベクター、および非標的化gRNAをトランスフェクトした場合にはYFP蛍光が存在しないこと示す。右側のパネルは、YFP-編集-レポーター(赤色蛍光トランスフェクション対照を共発現する)、N末端ABE8eベクター、C末端ABE8eベクター、およびmdx遺伝子座標的化gRNAを共トランスフェクトした細胞では高いパーセンテージでYFP蛍光が発現されること示す。
効率的な合成イントロン配列を使用して再構成された分割ABE8e塩基エディターのin vivo活性を実証するために、処置された筋肉におけるジストロフィンの発現をもたらすmdx中途終止コドンのin vivo編集を図23Fに示す。雄mdx変異マウスに、アデノ随伴ウイルス8ベクター中にパッケージングされたN末端ABE8e構築物とC末端ABE8e構築物の混合物を注射する。ウイルスゲノムはそれぞれが2つのgRNA発現カセット(RNAポリメラーゼIIIプロモーターとgRNA配列で構成される)を含有する。ウイルスミックスを前脛骨筋に筋肉内注射した。右上のパネルは、参照として野生型前脛骨筋横断面におけるジストロフィン染色を示す(例えば、陽性対照)。左下のパネルは、無処置の前脛骨筋組織を示す(例えば、陰性対照)。右下のパネルは、2つのアデノ随伴ウイルスを注射した前脛骨筋におけるジストロフィンの発現を示す。
効率的な合成イントロン配列を使用して再構成された分割ABE8e塩基エディターを使用した中途終止コドンの補正をさらに実証するために、ABE8eを発現させるためにアデノ随伴ウイルスミックスを用いて処置した前脛骨筋のジストロフィン発現(上のパネル)、ABE8e発現(中央のパネル)、およびGAPDHローディング対照(下のパネル)を図23Gに示す。これにより、ABE8e塩基エディターを使用したジストロフィン発現のレスキューが例示される。
これらの知見に基づいて、例えば、ゲノム点変異を処置するために、in vivoにおける全長ABE8eタンパク質の発現を実現することができる。例えば、第1のRNA分子は、第1の合成RNA二量体形成および組換えドメイン(イントロンおよび結合ドメインである)に付加したABE8eタンパク質コード配列の第1の部分を含む。この分子は第1のベクター/プラスミドから発現される。第2のRNA分子は、相補的な第2のRNA二量体形成および組換えドメインに付加したABE8eタンパク質コード配列の第2の部分を含み、第2のベクター/プラスミドから発現される。例えば図6Gに例示される通り、これらのDNAベクター/プラスミドの一方または両方が、RNAポリメラーゼIIIプロモーターとgRNA/ガイドRNA/gRNA配列で構成されるgRNA/ガイドRNA/gRNA発現カセットを含有する。例えば、本開示の組成物は、少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、少なくとも7つ、少なくとも8つのgRNA/ガイドRNA/gRNA発現カセットを含み得る。2つのRNA分子が同じ標的細胞において発現されると、ABE8eコード転写物の2つの部分が組み換えられて全長ABE8e転写物が形成され、次いでそれがタンパク質に翻訳される。例えば、N末端ABE8eコード配列を含む配列番号165、およびC末端ABE8eコード配列を含む配列番号166に対して少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または100%の配列同一性を有する配列をin vivo発現に利用することができる。
(実施例24)
RNA断片の長さが増すと二方向分割遺伝子の再構成が低減する
5’断片をコードするRNA分子および3’断片をコードするRNA分子の長さの影響を評価した。
黄色蛍光タンパク質(yfp)コード配列を2つの断片に分割した。RNAコード分子を伸長させるために、スタッファーオープンリーディングフレームをそれぞれ5’断片の5’末端および3’断片の3’末端に組み込んだ。5’yfpコード配列を、伸長させたスタッファーオープンリーディングフレームに自己切断性2A配列を介して融合した。yfpの3’yfpコード配列を伸長させたスタッファーオープンリーディングフレームに自己切断性2A配列を介して連結した。yfpの5’断片とyfpの3’断片の分割点にRNA末端結合モジュール(合成イントロンとそれに加えて結合ドメイン)を組み込んだ。自己切断性2A配列により、翻訳後にYFPタンパク質をそれぞれのスタッファーオープンリーディングフレームから分離することが可能になる。異なる長さのスタッファーオープンリーディングフレームを組み入れることにより、4種の5’断片コード構築物および4種の3’断片コード構築物をアセンブルした。これらの構築物から転写されたRNA(タンパク質コード配列とそれに加えて合成イントロンおよび結合ドメイン)の長さは、5’断片については1000nt、2000nt、3000nt、および4000ntであり、3’断片については1000nt、2000nt、3000nt、および4000ntであった。
YFP再構成の効率を全部で16種の5’断片と3’断片の対の間で比較した。この比較では、最も短い構築物(すなわち、5’-1000ntと3’-1000nt)を対にした場合にYFPが最も効率的に再構成された。より長いスタッファー配列を有する断片を対にした場合には再構成効率の低下が観察された。最も短い対(5’-1000ntと3’-1000nt)に対するパーセントとして、以下のYFP再構成効率が認められた:
5’-1000ntと3’-1000nt:100%
5’-1000ntと3’-2000nt:約40%
5’-1000ntと3’-3000nt:約20%
5’-1000ntと3’-4000nt:約16%
5’-2000ntと3’-1000nt:約55%
5’-2000ntと3’-2000nt:約30%
5’-2000ntと3’-3000nt:約20%
5’-2000ntと3’-4000nt:約15%
5’-3000ntと3’-1000nt:約60%
5’-3000ntと3’-2000nt:約40%
5’-3000ntと3’-3000nt:約25%
5’-3000ntと3’-4000nt:約20%
5’-4000ntと3’-1000nt:約40%
5’-4000ntと3’-2000nt:約35%
5’-4000ntと3’-3000nt:約20%
5’-4000ntと3’-4000nt:約15%。
これらのデータにより、分割された遺伝子の5’コード配列および3’コード配列をコードする断片の長さが増すにつれて分割された遺伝子の再構成の効率が低下することが例示される。
(実施例25)
下流イントロンスプライシングエンハンサーおよびイントロンスプライシングエンハンサー配列を用いたRNA末端結合反応の増強。
本実施例では、特定のスプライシングエンハンサー配列を組み入れることによって2つのRNA分子の効率的な結合を実現するために使用する方法を記載する。
イントロンスプライシングエンハンサー配列を選択することの効果を、分割された黄色蛍光タンパク質(YFP)を三峰性キッシングループRNA二量体形成ドメインおよびイントロンセグメントの種々のライブラリーで構成されるRNA末端結合モジュールを使用して再構成するスクリーニングプラットフォームを使用して調査した。使用した5’DNA分子および3’DNA分子の配列がそれぞれ配列番号171および172に示されている(以下の表5の配列のうちの少なくとも1つ、例えば、これらの配列の1つ、2つ、3つ、4つまたは5つなど、配列内の一連のNはイントロンライブラリー配置の部位を示す)。
in vitroにおける再構成されたyfpの発現を実証するために、フローサイトメトリーを使用して、5’DNA分子および3’DNA分子をトランスフェクトしたHEK293T細胞におけるyfp蛍光強度を決定した。図24Aに示されている通り、本明細書に開示される分割-REJ系のイントロン部分を個々のセグメントに細分して、RNA結合反応を容易にする効率的なイントロンスプライシングエンハンサー配列についてスクリーニングした。構築物の5’イントロン部分の3つの位置および3’イントロン部分の3つの位置に使用した配列が配列番号173~204に示され(表5)、図24Cに列挙されている。
表5: 例示的なイントロンスプライシングエンハンサー配列
フローサイトメトリーの定量が図24Bに示されている。5’スプライス部位選択促進スプライシング因子TIA-1(T細胞により制限される細胞内抗原-1)の動員を刺激するためにイントロン配列を組み入れることにより、RNA末端結合を増加させることができる。一部の実施例では、WGGGモチーフを含有する配列によりRNA末端結合が増強される。
これらの知見に基づいて、in vivoにおける分割されたタンパク質全長の発現を、RNA末端結合モジュールの特定のイントロンスプライシングエンハンサー配列をイントロン部分に組み入れることによって増強することができる。例えば、配列番号173~180、182~196、または199~203のいずれか1つに対して少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または100%の配列同一性を有する1つまたは複数の配列(例えば、1つ、2つ、または3つの配列)をRNA末端結合反応産物のin vivo発現に利用することができる(例えば、本明細書に提示される任意の実施形態のISEとして使用することができる)。
(実施例26)
in vivoにおけるジストロフィンの補正
本実施例では、本明細書に開示される方法を使用してin vivoにおいて遺伝子を編集することができることをさらに実証する方法および結果を記載する。
使用した2つの部分からなる(デュアル)REJ Cas9-アデニン塩基エディター(ABE)系は、それぞれがAAV8ベクターにパッケージングされた配列番号225および226を含む、実施例23に記載のものであった。これらの2つの構築物(第1のDNA分子および第2のDNA分子)では、核酸編集タンパク質が、それぞれ配列番号165および166の部分配列によって2つの部分にコードされる。系をmdx-4cvマウス(変異Dmd遺伝子を有し、筋線維の壊死、線維症および中心に核を有する骨格筋線維を示す)の前脛骨筋に2つのAAV8ベクターを直接筋肉内注射することによって投与した(全部で筋肉当たり2×1011個のウイルスゲノム)。4週齢の時点で注射を行い、その後、8週齢の時点で安楽死させた。野生型(wt)マウス、無処置のマウス、および処置されたマウスにおける、Cas9-ABEおよび筋肉抽出物におけるジストロフィン発現をウエスタンブロットによって定量した。
図25Aに示されている通り、処置されたmdx-4cvマウスでは、Cas9-ABEが頑強に発現され、それにより、筋肉におけるジストロフィン発現の回復がもたらされるが、一方、無処置のmdx-4cvマウスではそのような発現は示されない。GAPDH発現を使用してタンパク質抽出物濃度をモニタリングした。
図25Bに示されている通り、抗ジストロフィン一次抗体を使用して免疫組織化学的検査によって可視化した筋肉におけるジストロフィン発現から、処置されたマウスでは筋肉片における特徴的なジストロフィン-サルコグリカン(sacroglycan)複合体の回復が示されるが、無処置のマウスではそれが示されないことが実証される。
本明細書に開示される原理を適用することができる多くの可能性のある実施形態を考慮して、例示されている実施形態は単に本発明の例であり、本発明の範囲を限定するものと解釈されるべきではないことが認識されるべきである。そうではなく、本発明の範囲は、以下の特許請求の範囲によって定義される。したがって、これらの特許請求の範囲の範囲および主旨に入る全てが本発明者らの発明であることを主張する。

Claims (67)

  1. 核酸編集タンパク質を発現させるための組成物であって、
    (a)第1のRNA分子であって、5’から3’に、
    (i)前記核酸編集タンパク質のN末端部分のコード配列;
    (ii)スプライスドナー;および
    (iii)第1の二量体形成ドメイン
    を含む、第1のRNA分子;ならびに
    (b)第2のRNA分子であって、5’から3’に、
    (i)前記第1の二量体形成ドメインに結合する第2の二量体形成ドメイン;
    (ii)分岐点配列;
    (iii)ポリピリミジントラクト;
    (iv)スプライスアクセプター;および
    (v)前記核酸編集タンパク質のC末端部分のコード配列
    を含む、第2のRNA分子;
    (c)必要に応じて、第1の標的核酸分子に特異的な少なくとも1つの第1のガイドRNA(gRNA)を含む第3のRNA分子であって、前記少なくとも1つの第1のgRNAが、前記核酸編集タンパク質を前記第1の標的核酸分子上の標的編集部位に方向付ける、第3のRNA分子;
    (d)必要に応じて、(i)前記核酸編集タンパク質を前記第1の核酸分子上の同じもしくは異なる標的編集部位に方向付ける、前記第1の標的核酸分子に特異的な少なくとも1つの第2のgRNA、または(ii)前記核酸編集タンパク質を第2の標的核酸分子上の標的編集部位に方向付ける、前記第2の標的核酸分子に特異的な少なくとも1つの第2のgRNAを含む、第4のRNA分子、
    (e)必要に応じて、(i)前記核酸編集タンパク質を前記第1の核酸分子上の前記第1のgRNAおよび前記第2のgRNAと同じもしくは異なる標的編集部位に方向付ける、前記第1の標的核酸分子に特異的な少なくとも1つの第3のgRNA、(ii)前記核酸編集タンパク質を前記第2の核酸分子上の前記第2のgRNAと同じもしくは異なる標的編集部位に方向付ける、前記第2の標的核酸分子に特異的な少なくとも1つの第3のgRNA、または(iii)前記核酸編集タンパク質を第3の標的核酸分子上の標的編集部位に方向付ける、前記第3の標的核酸分子に特異的な少なくとも1つの第3のgRNAを含む、第5のRNA分子;ならびに
    (f)必要に応じて、(i)前記核酸編集タンパク質を前記第1の核酸分子上の前記第1のgRNA、前記第2のgRNA、および前記第3のgRNAと同じもしくは異なる標的編集部位に方向付ける、前記第1の標的核酸分子に特異的な少なくとも1つの第4のgRNA、(ii)前記核酸編集タンパク質を前記第2の核酸分子上の前記第2のgRNAのおよび前記第3のgRNAと同じもしくは異なる標的編集部位に方向付ける、前記第2の標的核酸分子に特異的な少なくとも1つの第4のgRNA、(iii)前記核酸編集タンパク質を前記第3の標的核酸分子上の前記第3のgRNAと同じもしくは異なる標的編集部位に方向付ける、前記第3の標的核酸分子に特異的な少なくとも1つの第4のgRNA、または(iv)前記核酸編集タンパク質を第4の標的核酸分子上の標的編集部位に方向付ける、前記第4の標的核酸分子に特異的な少なくとも1つの第4のgRNAを含む、第6のRNA分子
    を含む、組成物。
  2. 前記第1の二量体形成ドメインと前記第2の二量体形成ドメインが、直接結合、間接結合、またはこれらの組合せによって結合している、請求項1に記載の組成物。
  3. 直接結合または間接結合が、塩基対合相互作用、非標準的な塩基対合相互作用、非塩基対合相互作用、またはこれらの組合せを含む、請求項2に記載の組成物。
  4. 直接結合が、キッシングループ間または低多様性領域間の塩基対合相互作用を含む、請求項2または3に記載の組成物。
  5. 直接結合が、アプタマー領域間の非標準的な塩基対合相互作用、非標準的な塩基対合相互作用、非塩基対合相互作用、またはこれらの組合せを含む、請求項2または3に記載の組成物。
  6. 間接結合が、核酸架橋を通じた塩基対合相互作用を含む、請求項2または3に記載の組成物。
  7. 間接結合が、アプタマーとアプタマーの標的との間、または2つのアプタマー間の非塩基対合相互作用を含む、請求項2に記載の組成物。
  8. 前記第1の二量体形成ドメインまたは前記第2の二量体形成ドメインが、潜在スプライスアクセプターを含まない、請求項1から7までのいずれか一項に記載の組成物。
  9. 前記二量体形成ドメインが、アプタマー配列二量体形成ドメインと直接結合しているかまたは間接的に結合している、請求項1から8までのいずれか一項に記載の組成物。
  10. 前記二量体形成ドメインが、キッシングループ相互作用ドメインである、請求項1から9までのいずれか一項に記載の組成物。
  11. 前記標的編集部位が、疾患に関連する標的核酸分子または標的核酸分子の調節領域の一部である、請求項1から10までのいずれか一項に記載の組成物。
  12. 前記疾患が、単一遺伝子疾患である、請求項11に記載の組成物。
  13. 前記第1の標的核酸分子、前記第2の標的核酸分子、前記第3の標的核酸分子、および/または前記第4の標的核酸分子が、前記疾患をもたらす1つまたは複数の点変異を含む、請求項1から12までのいずれか一項に記載の組成物。
  14. 前記疾患ならびに前記第1の標的核酸分子、前記第2の標的核酸分子、前記第3の標的核酸分子、および/または前記第4の標的核酸分子が、表1~4に列挙されているものである、請求項11から13までのいずれか一項に記載の組成物。
  15. 前記第1のRNA分子が、前記スプライスドナーに対して3’側であり前記第1の二量体形成ドメインに対して5’側の下流イントロンスプライスエンハンサー(DISE)、前記スプライスドナーに対して3’側であり前記第1の二量体形成ドメインに対して5’側のイントロンスプライスエンハンサー(ISE)のうちの一方もしくは両方をさらに含む;および/または
    前記第2のRNA分子が、前記第2の二量体形成ドメインに対して3’側であり前記分岐点配列に対して5’側のISE、および前記スプライスドナーに対して3’側であり前記二量体形成ドメインに対して5’側のDISEのうちの一方もしくは両方をさらに含む;
    またはこれらの任意の組合せである、請求項1から14までのいずれか一項に記載の組成物。
  16. 前記第1のRNA分子が、前記スプライスドナーに対して3’側の任意の場所に位置を占めた自己切断性RNA配列またはRNA切断酵素標的配列をさらに含み、したがって、3’に位置するポリアデニル化尾部を切断して、組み換えられていないRNA分子からのタンパク質断片の発現を低減または抑制するか;
    前記第2のRNA分子が、前記分岐点配列に対して5’側の任意の場所に位置を占めた自己切断性RNA配列またはRNA切断酵素標的配列をさらに含み、したがって、5’に位置するRNAキャップを切断して、組み換えられていないRNA分子からのタンパク質断片の発現を低減または抑制するか;
    前記第2のRNA分子が、前記スプライスアクセプターの3’側にあるオープンリーディングフレームに関してシフトされる開始コドンを前記分岐点配列に対して5’側の任意の場所にさらに含んで、組み換えられていないRNA分子からの核酸編集タンパク質断片の翻訳を低減または抑制するか;
    前記第1のRNA分子が、前記スプライスドナーに対して3’側の任意の場所にマイクロRNA標的部位をさらに含み、したがって、結合していないRNA断片が核の外側に出るとマイクロRNA依存性分解を受けるか;
    前記第2のRNA分子が、前記コード配列に対して3’側の任意の場所にマイクロRNA標的部位をさらに含み、したがって、結合していないRNA断片が核の外側に出るとマイクロRNA依存性分解を受けるか;
    前記第1のRNA分子が、デグロンタンパク質分解タグをコードする配列を、前記スプライスドナーに対して3’側の任意の場所に前記スプライスドナー部位の5’側にある前記核酸編集タンパク質のオープンリーディングフレームとインフレームになるようにさらに含み、したがって、結合していないタンパク質断片が分解に関してタグ付けされるか;
    前記第2のRNA分子が、開始コドンおよびインフレームのデグロンタンパク質分解タグを、前記分岐点配列に対して5’側の任意の場所に前記スプライスアクセプター部位の3’側の前記核酸編集タンパク質のオープンリーディングフレームとインフレームになるようにさらに含み、したがって、結合していないタンパク質断片が分解に関してタグ付けされるか;
    またはこれらの任意の組合せである、請求項1から15までのいずれか一項に記載の組成物。
  17. 前記核酸編集タンパク質が、Casヌクレアーゼ、ジンクフィンガーヌクレアーゼ、または転写活性化因子様エフェクターヌクレアーゼを含む、請求項1から16までのいずれか一項に記載の組成物。
  18. 前記第1の標的核酸分子、前記第2の標的核酸分子、前記第3の標的核酸分子、および/または前記第4の標的核酸分子が、標的DNA分子であり、前記少なくとも1つの第1のgRNA、第2のgRNA、第3のgRNA、および/または第4のgRNAが、crRNAおよびtracrRNAを含む、請求項1から17までのいずれか一項に記載の組成物。
  19. 前記核酸編集タンパク質が、Cas9または死んだCas9(dCas9)を含む、請求項18に記載の組成物。
  20. 前記Cas9タンパク質が、配列番号208に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を含み、RNA誘導型DNAエンドヌクレアーゼとして機能し得るか;
    前記Cas9タンパク質が、配列番号207に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を含む配列によってコードされ、RNA誘導型DNAエンドヌクレアーゼをコードするか;
    前記dCas9タンパク質が、配列番号210に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を含み、触媒として不活性であるか;
    前記dCas9タンパク質が、配列番号209に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を含む配列によってコードされ、触媒として不活性であるタンパク質をコードする、請求項19に記載の組成物。
  21. 前記Cas9またはdCas9が、融合タンパク質の一部である、請求項19または20に記載の組成物。
  22. 前記融合タンパク質が、Cas9またはdCas9と、転写活性化ドメイン、例えば、VP64、P65、MyoD1、HSF1、RTA、CBP、SET7/9、またはこれらの任意の組合せ;
    シトシン塩基エディター(CBE)、例えば、ウミヤツメ由来のもの[AID]、CDA1、またはAPOBEC3G;
    バクテリオファージタンパク質Gam;および
    アデニン塩基エディター(ABE)、例えば、ABE 6.3、7.8、7.9、7.10、ABEmax、ABE8e(TadA-8e V106W)などのABE8sのうちの1つまたは複数とを含む、請求項21に記載の組成物。
  23. 前記第1の標的核酸分子、前記第2の標的核酸分子、前記第3の標的核酸分子、および/または前記第4の標的核酸分子が、標的RNAであり、前記少なくとも1つの第1のgRNA、第2のgRNA、第3のgRNA、および/または第4のgRNAが、1つまたは複数のダイレクトリピートおよび1つまたは複数のスペーサーを含む、請求項1から17までのいずれか一項に記載の組成物。
  24. 前記核酸編集タンパク質が、Cas13a、Cas13b、Cas13c、Cas13dまたは死んだCas13d(dCas13d)を含む、請求項23に記載の組成物。
  25. 前記Cas13dタンパク質が、配列番号212、215、または222に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を含み、RNA誘導型RNAエンドヌクレアーゼとして機能し得るか;
    前記Cas13dタンパク質が、配列番号211または213に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を含む配列によってコードされ、RNA誘導型RNAエンドヌクレアーゼをコードするか;
    前記dCas13dタンパク質が、配列番号215または216に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を含み、触媒として不活性であるか;
    前記dCas13dタンパク質が、配列番号215または216に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の配列同一性を含むタンパク質をコードし、触媒として不活性であるタンパク質をコードする配列によってコードされる、請求項24に記載の組成物。
  26. 前記Cas13a、Cas13b、Cas13c、Cas13dまたはdCas13dが、融合タンパク質の一部である、請求項24または25に記載の組成物。
  27. 前記融合タンパク質が、Cas13a、Cas13b、Cas13c、Cas13dまたはdCas13dと、
    転写活性化ドメイン、例えば、VP64、P65、MyoD1、HSF1、RTA、CBP、SET7/9、またはこれらの任意の組合せ;
    シトシン塩基エディター(CBE)、例えば、ウミヤツメ由来のもの[AID]、CDA1、またはAPOBEC3G;
    バクテリオファージタンパク質Gam;および
    アデニン塩基エディター(ABE)、例えば、ABE 6.3、7.8、7.9、7.10、ABEmax、ABE8e(TadA-8e V106W)などのABE8sのうちの1つまたは複数とを含む、請求項26に記載の組成物。
  28. 前記少なくとも1つの第1のgRNA、第2のgRNA、第3のgRNA、および/または第4のgRNAが、前記第1のgRNA、前記第2のgRNA、前記第3のgRNA、および/または前記第4のgRNAのそれぞれの複数のコピーを含む、請求項1から27までのいずれか一項に記載の組成物。
  29. 前記第1のRNA分子および前記第2のRNA分子のそれぞれの5’末端および3’末端にパルボウイルス末端逆位反復配列(ITR)をさらに含む、請求項1から27までのいずれか一項に記載の組成物。
  30. 請求項1から29までのいずれか一項に記載の組成物を発現させるためのDNA分子組成物であって、
    (i)(a)のRNA分子、および必要に応じて、(c)のRNA分子、(d)のRNA分子、または(c)のRNA分子と(d)のRNA分子の両方をコードする第1の合成DNA分子;ならびに
    (ii)(b)のRNA分子、および必要に応じて、(e)のRNA分子、(f)のRNA分子、または(e)のRNA分子と(f)のRNA分子の両方をコードする第2の合成DNA分子
    を含む、DNA分子組成物。
  31. (a)前記核酸編集タンパク質のN末端部分をコードするDNA配列に作動可能に連結した第1のプロモーター;
    (b)前記核酸編集タンパク質のC末端部分をコードするDNA配列に作動可能に連結した第2のプロモーター
    (c)前記第1の合成DNA分子が前記(c)のRNA分子をコードするDNA分子を含む場合、前記少なくとも1つの第1のgRNAをコードする配列に作動可能に連結した第3のプロモーター;
    (d)前記第1の合成DNA分子が前記(d)のRNA分子をコードするDNA分子を含む場合、前記少なくとも1つの第2のgRNAをコードする配列に作動可能に連結した第4のプロモーター;
    (e)前記第2の合成DNA分子が前記(e)のRNA分子をコードするDNA分子を含む場合、前記少なくとも1つの第3のgRNAをコードする配列に作動可能に連結した第5のプロモーター;および
    (f)前記第2の合成DNA分子が前記(d)のRNA分子をコードするDNA分子を含む場合、前記少なくとも1つの第4のgRNAをコードする配列に作動可能に連結した第6のプロモーター
    をさらに含む、請求項30に記載のDNA分子。
  32. 各プロモーターが、独立に選択される、請求項31に記載の組成物。
  33. 前記第1プロモーターと前記第2のプロモーターが同じプロモーターである;
    前記第1のプロモーターと前記第2のプロモーターが異なるプロモーターである;
    前記第3のプロモーター、前記第4のプロモーター、前記第5のプロモーターおよび前記第6のプロモーターが同じプロモーターである;
    前記第3のプロモーター、前記第4のプロモーター、前記第5のプロモーターおよび前記第6のプロモーターが異なるプロモーターである、または
    これらの組合せである、
    請求項31または32に記載の組成物。
  34. 前記第1のプロモーターおよび前記第2のプロモーターのそれぞれが、独立に、構成的プロモーター;組織特異的プロモーター;および前記核酸編集タンパク質に対して内因性のプロモーターから選択される、請求項30から32までのいずれか一項に記載の組成物。
  35. 前記第3のプロモーター、前記第4のプロモーター、前記第5のプロモーターおよび前記第6のプロモーターのそれぞれが、U6またはH1プロモーターなどのポリメラーゼIIIプロモーターである、請求項30から34までのいずれか一項に記載の組成物。
  36. 請求項30から35までのいずれか一項に記載の組成物を含む、核酸編集タンパク質を発現させるための系。
  37. 細胞に導入されると、前記RNA分子を適当な順序で産生させ、組み換え、それにより、前記核酸編集タンパク質の全長コード配列をもたらす、請求項36に記載の系。
  38. 前記第1の合成RNA分子と前記第2の合成RNA分子のそれぞれが、別々のウイルスベクターから転写される、請求項36または37に記載の系。
  39. 前記ウイルスベクターが、AAVである、請求項38に記載の系。
  40. 合成DNA分子のそれぞれが、約2500nt~約5000nt、2,500nt~約2,750nt、約2,500nt~約3,000nt、約2,500nt~約3,250nt、約2,500nt~約3,500nt、約2,500nt~約3,750nt、約2,500nt~約4,000nt、約2,500nt~約4,250nt、約2,500nt~約4,500nt、約2,500nt~約4,750nt、約2,500nt~約5,000nt、約2,750nt~約3,000nt、約2,750nt~約3,250nt、約2,750nt~約3,500nt、約2,750nt~約3,750nt、約2,750nt~約4,000nt、約2,750nt~約4,250nt、約2,750nt~約4,500nt、約2,750nt~約4,750nt、約2,750nt~約5,000nt、約3,000nt~約3,250nt、約3,000nt~約3,500nt、約3,000nt~約3,750nt、約3,000nt~約4,000nt、約3,000nt~約4,250nt、約3,000nt~約4,500nt、約3,000nt~約4,750nt、約3,000nt~約5,000nt、約3,250nt~約3,500nt、約3,250nt~約3,750nt、約3,250nt~約4,000nt、約3,250nt~約4,250nt、約3,250nt~約4,500nt、約3,250nt~約4,750nt、約3,250nt~約5,000nt、約3,500nt~約3,750nt、約3,500nt~約4,000nt、約3,500nt~約4,250nt、約3,500nt~約4,500nt、約3,500nt~約4,750nt、約3,500nt~約5,000nt、約3,750nt~約4,000nt、約3,750nt~約4,250nt、約3,750nt~約4,500nt、約3,750nt~約4,750nt、約3,750nt~約5,000nt、約4,000nt~約4,250nt、約4,000nt~約4,500nt、約4,000nt~約4,750nt、約4,000nt~約5,000nt、約4,250nt~約4,500nt、約4,250nt~約4,750nt、約4,250nt~約5,000nt、約4,500nt~約4,750nt、約4,500nt~約5,000nt、約4,750nt~約5,000nt、約2,500nt、約2,750nt、約3,000nt、約3,250nt、約3,500nt、約3,750nt、約4,000nt、約4,250nt、約4,500nt、約4,750nt、および約5,000ntから独立に選択されるサイズを有する、請求項36から39までのいずれか一項に記載の系。
  41. 前記系の合成DNA分子によってコードされる前記核酸編集タンパク質のN末端部分のコード配列、または前記核酸編集タンパク質のC末端部分のコード配列のそれぞれが、約2500~4500nt、約2,500nt~約2,750nt、約2,500nt~約3,000nt、約2,500nt~約3,250nt、約2,500nt~約3,500nt、約2,500nt~約3,750nt、約2,500nt~約4,000nt、約2,500nt~約4,250nt、約2,500nt~約4,500nt、約2,750nt~約3,000nt、約2,750nt~約3,250nt、約2,750nt~約3,500nt、約2,750nt~約3,750nt、約2,750nt~約4,000nt、約2,750nt~約4,250nt、約2,750nt~約4,500nt、約3,000nt~約3,250nt、約3,000nt~約3,500nt、約3,000nt~約3,750nt、約3,000nt~約4,000nt、約3,000nt~約4,250nt、約3,000nt~約4,500nt、約3,250nt~約3,500nt、約3,250nt~約3,750nt、約3,250nt~約4,000nt、約3,250nt~約4,250nt、約3,250nt~約4,500nt、約3,500nt~約3,750nt、約3,500nt~約4,000nt、約3,500nt~約4,250nt、約3,500nt~約4,500nt、約3,750nt~約4,000nt、約3,750nt~約4,250nt、約3,750nt~約4,500nt、約4,000nt~約4,250nt、約4,000nt~約4,500nt、約4,250nt~約4,500nt、約2,500nt、約2,750nt、約3,000nt、約3,250nt、約3,500nt、約3,750nt、約4,000nt、約4,250nt、および約4,500ntから独立に選択されるサイズを有する、請求項36から40までのいずれか一項に記載の系。
  42. 前記系の合成DNA分子によってコードされるRNA分子のいずれか一方または両方が、それぞれ、約2500~4500nt、約2,500nt~約2,750nt、約2,500nt~約3,000nt、約2,500nt~約3,250nt、約2,500nt~約3,500nt、約2,500nt~約3,750nt、約2,500nt~約4,000nt、約2,500nt~約4,250nt、約2,500nt~約4,500nt、約2,750nt~約3,000nt、約2,750nt~約3,250nt、約2,750nt~約3,500nt、約2,750nt~約3,750nt、約2,750nt~約4,000nt、約2,750nt~約4,250nt、約2,750nt~約4,500nt、約3,000nt~約3,250nt、約3,000nt~約3,500nt、約3,000nt~約3,750nt、約3,000nt~約4,000nt、約3,000nt~約4,250nt、約3,000nt~約4,500nt、約3,250nt~約3,500nt、約3,250nt~約3,750nt、約3,250nt~約4,000nt、約3,250nt~約4,250nt、約3,250nt~約4,500nt、約3,500nt~約3,750nt、約3,500nt~約4,000nt、約3,500nt~約4,250nt、約3,500nt~約4,500nt、約3,750nt~約4,000nt、約3,750nt~約4,250nt、約3,750nt~約4,500nt、約4,000nt~約4,250nt、約4,000nt~約4,500nt、約4,250nt~約4,500nt、約2,500nt、約2,750nt、約3,000nt、約3,250nt、約3,500nt、約3,750nt、約4,000nt、約4,250nt、および約4,500ntから独立に選択されるサイズを有する、請求項36から41までのいずれか一項に記載の系。
  43. 請求項30から35までのいずれか一項に記載の組成物を含み、
    前記合成DNA分子が、約5000nt~約10,000nt、約5,000nt~約5,500nt、約5,000nt~約6,000nt、約5,000nt~約6,500nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,000nt~約8,500nt、約5,000nt~約9,000nt、約5,000nt~約9,500nt、約5,000nt~約10,000nt、約5,500nt~約6,000nt、約5,500nt~約6,500nt、約5,500nt~約7,000nt、約5,500nt~約7,500nt、約5,500nt~約8,000nt、約5,500nt~約8,500nt、約5,500nt~約9,000nt、約5,500nt~約9,500nt、約5,500nt~約10,000nt、約6,000nt~約6,500nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,000nt~約8,500nt、約6,000nt~約9,000nt、約6,000nt~約9,500nt、約6,000nt~約10,000nt、約6,500nt~約7,000nt、約6,500nt~約7,500nt、約6,500nt~約8,000nt、約6,500nt~約8,500nt、約6,500nt~約9,000nt、約6,500nt~約9,500nt、約6,500nt~約10,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、約7,000nt~約8,500nt、約7,000nt~約9,000nt、約7,000nt~約9,500nt、約7,000nt~約10,000nt、約7,500nt~約8,000nt、約7,500nt~約8,500nt、約7,500nt~約9,000nt、約7,500nt~約9,500nt、約7,500nt~約10,000nt、約8,000nt~約8,500nt、約8,000nt~約9,000nt、約8,000nt~約9,500nt、約8,000nt~約10,000nt、約8,500nt~約9,000nt、約8,500nt~約9,500nt、約8,500nt~約10,000nt、約9,000nt~約9,500nt、約9,000nt~約10,000nt、約9,500nt~約10,000nt、約5,000nt、約5,500nt、約6,000nt、約6,500nt、約7,000nt、約7,500nt、約8,000nt、約8,500nt、約9,000nt、約9,500nt、および約10,000ntから選択される総サイズを有し;
    総核酸編集タンパク質コード配列が、約2000nt~約8000nt、約2,000nt~約3,000nt、約2,000nt~約3,500nt、約2,000nt~約4,000nt、約2,000nt~約4,500nt、約2,000nt~約5,000nt、約2,000nt~約5,500nt、約2,000nt~約6,000nt、約2,000nt~約6,500nt、約2,000nt~約7,000nt、約2,000nt~約7,500nt、約2,000nt~約8,000nt、約3,000nt~約3,500nt、約3,000nt~約4,000nt、約3,000nt~約4,500nt、約3,000nt~約5,000nt、約3,000nt~約5,500nt、約3,000nt~約6,000nt、約3,000nt~約6,500nt、約3,000nt~約7,000nt、約3,000nt~約7,500nt、約3,000nt~約8,000nt、約3,500nt~約4,000nt、約3,500nt~約4,500nt、約3,500nt~約5,000nt、約3,500nt~約5,500nt、約3,500nt~約6,000nt、約3,500nt~約6,500nt、約3,500nt~約7,000nt、約3,500nt~約7,500nt、約3,500nt~約8,000nt、約4,000nt~約4,500nt、約4,000nt~約5,000nt、約4,000nt~約5,500nt、約4,000nt~約6,000nt、約4,000nt~約6,500nt、約4,000nt~約7,000nt、約4,000nt~約7,500nt、約4,000nt~約8,000nt、約4,500nt~約5,000nt、約4,500nt~約5,500nt、約4,500nt~約6,000nt、約4,500nt~約6,500nt、約4,500nt~約7,000nt、約4,500nt~約7,500nt、約4,500nt~約8,000nt、約5,000nt~約5,500nt、約5,000nt~約6,000nt、約5,000nt~約6,500nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,500nt~約6,000nt、約5,500nt~約6,500nt、約5,500nt~約7,000nt、約5,500nt~約7,500nt、約5,500nt~約8,000nt、約6,000nt~約6,500nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,500nt~約7,000nt、約6,500nt~約7,500nt、約6,500nt~約8,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、または約7,500nt~約8,000ntから選択され、総標的タンパク質コード配列が、約2,000nt、約3,000nt、約3,500nt、約4,000nt、約4,500nt、約5,000nt、約5,500nt、約6,000nt、約6,500nt、約7,000nt、約7,500nt、および約8,000ntであり;かつ/または、
    2つの前記合成DNA分子によってコードされるRNA分子の合計サイズが、約5,000nt~約9000nt、約5,000nt~約5,500nt、約5,000nt~約6,000nt、約5,000nt~約6,500nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,000nt~約8,500nt、約5,000nt~約9,000nt、約5,500nt~約6,000nt、約5,500nt~約6,500nt、約5,500nt~約7,000nt、約5,500nt~約7,500nt、約5,500nt~約8,000nt、約5,500nt~約8,500nt、約5,500nt~約9,000nt、約6,000nt~約6,500nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,000nt~約8,500nt、約6,000nt~約9,000nt、約6,500nt~約7,000nt、約6,500nt~約7,500nt、約6,500nt~約8,000nt、約6,500nt~約8,500nt、約6,500nt~約9,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、約7,000nt~約8,500nt、約7,000nt~約9,000nt、約7,500nt~約8,000nt、約7,500nt~約8,500nt、約7,500nt~約9,000nt、約8,000nt~約8,500nt、約8,000nt~約9,000nt、約8,500nt~約9,000nt、約5,000nt、約5,500nt、約6,000nt、約6,500nt、約7,000nt、約7,500nt、約8,000nt、約8,500nt、および約9,000ntから選択される、請求項36から42までのいずれか一項に記載の系。
  44. 前記第1の二量体形成ドメインおよび前記第2の二量体形成ドメインが、それぞれ、1000nt以下、例えば、少なくとも50nt、少なくとも100nt、少なくとも150nt、少なくとも200nt、少なくとも300nt、少なくとも400nt、少なくとも500nt、50~1000nt、50~500nt、50~150nt、50nt、100nt、150nt、200nt、250nt、300nt、400nt、または500ntであり;前記系の組換え効率が、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、または約100%である、請求項36から43までのいずれか一項に記載の系。
  45. 各二量体形成ドメインが、1000nt以下、例えば、少なくとも50nt、少なくとも100nt、少なくとも150nt、少なくとも200nt、少なくとも300nt、少なくとも400nt、少なくとも500nt、50~1000nt、50~500nt、50~150nt、50nt、100nt、150nt、200nt、250nt、300nt、400nt、または500ntであり;前記系の組換え効率が、少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも90%、または約100%である、請求項36から44までのいずれか一項に記載の系。
  46. RNA組換え効率が、約10%~約100%、約10%~約20%、約10%~約30%、約10%~約35%、約10%~約40%、約10%~約45%、約10%~約50%、約10%~約55%、約10%~約60%、約10%~約70%、約10%~約80%、約10%~約90%、約20%~約30%、約20%~約35%、約20%~約40%、約20%~約45%、約20%~約50%、約20%~約55%、約20%~約60%、約20%~約70%、約20%~約80%、約20%~約90%、約30%~約35%、約30%~約40%、約30%~約45%、約30%~約50%、約30%~約55%、約30%~約60%、約30%~約70%、約30%~約80%、約30%~約90%、約35%~約40%、約35%~約45%、約35%~約50%、約35%~約55%、約35%~約60%、約35%~約70%、約35%~約80%、約35%~約90%、約40%~約45%、約40%~約50%、約40%~約55%、約40%~約60%、約40%~約70%、約40%~約80%、約40%~約90%、約45%~約50%、約45%~約55%、約45%~約60%、約45%~約70%、約45%~約80%、約45%~約90%、約50%~約55%、約50%~約60%、約50%~約70%、約50%~約80%、約50%~約90%、約55%~約60%、約55%~約70%、約55%~約80%、約55%~約90%、約60%~約70%、約60%~約80%、約60%~約90%、約70%~約80%、約70%~約90%、約80%~約90%、約10%、約20%、約30%、約35%、約40%、約45%、約50%、約55%、約60%、約70%、約80%、約90%、約95%、または約100%である、請求項36から45までのいずれか一項に記載の系。
  47. 請求項36から46までのいずれか一項に記載の系を含む組成物。
  48. それぞれ核酸編集タンパク質の少なくとも一部分をコードする第1のRNA分子、第2のRNA分子、第3のRNA分子および必要に応じて第4のRNA分子を含む、請求項47に記載の組成物。
  49. 請求項36から46までのいずれか一項に記載の系、または請求項47および48のいずれか一項に記載の組成物を含むキットであって、前記第1の合成核酸分子、前記第2の合成核酸分子、前記第3の合成核酸分子および前記第4の合成核酸分子のいずれかが別々の容器に入っていてよく、必要に応じて薬学的に許容される担体などのバッファーをさらに含む、キット。
  50. 細胞において核酸編集タンパク質を発現させる方法であって、請求項36から46までのいずれか一項に記載の系、または請求項47もしくは48に記載の組成物を細胞に導入するステップと、前記第1のRNA分子と前記第2のRNA分子を前記細胞において発現させるステップとを含み、前記細胞において前記核酸編集タンパク質が産生される、方法。
  51. 前記細胞が、対象内に存在し、導入するステップが、治療有効量の前記系を前記対象に投与することを含む、請求項50に記載の方法。
  52. 前記対象における標的核酸分子の変異によって引き起こされる遺伝子疾患を処置し、前記核酸編集タンパク質および必要に応じて前記第1のgRNAおよび前記第2のgRNAの発現、ならびに前記対象における前記変異の補正をもたらす、請求項51に記載の方法。
  53. 前記遺伝子疾患が、機能喪失型変異に起因するものであり、前記少なくとも1つの第1のgRNA、第2のgRNA、第3のgRNAおよび/もしくは第4のgRNAが、表1に列挙されている核酸を標的とする配列を含み、前記方法により、表1に列挙されている対応する疾患が処置されるか;
    前記標的核酸が、癌遺伝子であり、前記少なくとも1つの第1のgRNA、第2のgRNA、第3のgRNAおよび/もしくは第4のgRNAが、表2の癌遺伝子を標的とする配列を含み、前記方法により、表2に列挙されている対応するがんが処置されるか;
    前記遺伝子疾患が、機能獲得型変異に起因するものであり、前記少なくとも1つの第1のgRNA、第2のgRNA、第3のgRNAおよび/もしくは第4のgRNAが、表3に列挙されている核酸を標的とする配列を含み、前記方法により、表3に列挙されている対応する疾患が処置されるか;または
    前記遺伝子疾患が、表4に列挙されているものであり、少なくとも1つの第1のgRNA、第2のgRNA、第3のgRNAおよび/もしくは第4のgRNAが、表4に列挙されている核酸を標的とする配列を含み、前記方法により、表4に列挙されている対応する疾患が処置される、請求項52に記載の方法。
  54. 前記第1のRNA分子および前記第2のRNA分子のうちの一方または両方が、配列番号159、160、161、162、163、164、165、166、225、および226のうちのいずれか1つに提示される合成イントロンに対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%、または100%の配列同一性を含む、請求項36から46までのいずれか一項に記載の系、請求項1から35まで、47および48のいずれか一項に記載の組成物、または請求項50から53までのいずれか一項に記載の方法。
  55. 前記第1のRNA分子および前記第2のRNA分子のうちの一方または両方が、配列番号159、160、161、162、163、164、165、166、225、または226によってコードされるRNAから選択される合成イントロンを含む、請求項36から46までおよび54のいずれか一項に記載の系、請求項1から35まで、47および48のいずれか一項に記載の組成物、または請求項50から53までのいずれか一項に記載の方法。
  56. 前記第1のRNA分子および前記第2のRNA分子のうちの一方または両方が、タンパク質コード配列の一部をさらに含む、請求項36から46まで、54、および55のいずれかに記載の系、請求項1から16まで、32および33のいずれか一項に記載の組成物、または請求項35から38までのいずれか一項に記載の方法。
  57. 前記タンパク質コード配列の前記一部が、前記タンパク質コード配列のN末端側半分、N末端部分、C末端側半分、またはC末端部分を含む、請求項36から46までおよび54から56までのいずれかに記載の系、請求項1から35まで、47および48のいずれか一項に記載の組成物、または請求項50から53までのいずれか一項に記載の方法。
  58. (a)第1のRNA分子であって、5’から3’に、(i)少なくとも1つの第1のgRNA、(ii)前記核酸編集タンパク質のN末端部分のコード配列;(iii)スプライスドナー;(ii-2)DISE、ISE、または両方;(iv)第1の二量体形成ドメイン;および(v)少なくとも1つの第2のgRNAを含む、第1のRNA分子、ならびに(b)第2のRNA分子であって、5’から3’に、(i)少なくとも1つの第3のgRNA、(ii)前記第1の二量体形成ドメインに結合する第2の二量体形成ドメイン;(i-2)少なくとも1つのISE配列;(iii)分岐点配列;(ii)ポリピリミジントラクト;(v)スプライスアクセプター;(vi)前記核酸編集タンパク質のC末端部分のコード配列、および(vii)少なくとも1つの第4のgRNAを含む、第2のRNA分子を含む、請求項36から46までおよび54から56までのいずれか一項に記載の系、請求項1から35まで、47および48のいずれか一項に記載の組成物、または請求項50から53までのいずれか一項に記載の方法。
  59. (a)第1のRNA分子であって、5’から3’に、(i)少なくとも1つの第1のgRNA、(ii)前記核酸編集タンパク質のN末端部分のコード配列;(iii)スプライスドナー;(ii-2)DISE、ISE、およびISE;および(iv)第1の二量体形成ドメイン;および(v)少なくとも1つの第2のgRNAを含む、第1のRNA分子、ならびに(b)第2のRNA分子であって、5’から3’に、(i)少なくとも1つの第3のgRNA、(ii)前記第1の二量体形成ドメインに結合する第2の二量体形成ドメイン;(i-2)3つのISE配列;(iii)分岐点配列;(iv)ポリピリミジントラクト;(v)スプライスアクセプター;(vi)前記核酸編集タンパク質のC末端部分のコード配列および(vii)少なくとも1つの第4のgRNAを含む第2のRNA分子を含む、請求項36から46までおよび54から57までのいずれか一項に記載の系、請求項1から35まで、47および48のいずれか一項に記載の組成物、または請求項50から53までのいずれか一項に記載の方法。
  60. 前記第1のRNA分子および前記第2のRNA分子のうちのいずれか1つまたは2つのそれぞれが、約2500~4500nt、約2,500nt~約2,750nt、約2,500nt~約3,000nt、約2,500nt~約3,250nt、約2,500nt~約3,500nt、約2,500nt~約3,750nt、約2,500nt~約4,000nt、約2,500nt~約4,250nt、約2,500nt~約4,500nt、約2,750nt~約3,000nt、約2,750nt~約3,250nt、約2,750nt~約3,500nt、約2,750nt~約3,750nt、約2,750nt~約4,000nt、約2,750nt~約4,250nt、約2,750nt~約4,500nt、約3,000nt~約3,250nt、約3,000nt~約3,500nt、約3,000nt~約3,750nt、約3,000nt~約4,000nt、約3,000nt~約4,250nt、約3,000nt~約4,500nt、約3,250nt~約3,500nt、約3,250nt~約3,750nt、約3,250nt~約4,000nt、約3,250nt~約4,250nt、約3,250nt~約4,500nt、約3,500nt~約3,750nt、約3,500nt~約4,000nt、約3,500nt~約4,250nt、約3,500nt~約4,500nt、約3,750nt~約4,000nt、約3,750nt~約4,250nt、約3,750nt~約4,500nt、約4,000nt~約4,250nt、約4,000nt~約4,500nt、約4,250nt~約4,500nt、約2,500nt、約2,750nt、約3,000nt、約3,250nt、約3,500nt、約3,750nt、約4,000nt、約4,250nt、および約4,500ntから独立に選択されるサイズを有する、請求項1から35までのいずれか一項に記載の組成物。
  61. 前記総核酸編集タンパク質コード配列のサイズが、約2000nt~約8000nt、約2,000nt~約3,000nt、約2,000nt~約3,500nt、約2,000nt~約4,000nt、約2,000nt~約4,500nt、約2,000nt~約5,000nt、約2,000nt~約5,500nt、約2,000nt~約6,000nt、約2,000nt~約6,500nt、約2,000nt~約7,000nt、約2,000nt~約7,500nt、約2,000nt~約8,000nt、約3,000nt~約3,500nt、約3,000nt~約4,000nt、約3,000nt~約4,500nt、約3,000nt~約5,000nt、約3,000nt~約5,500nt、約3,000nt~約6,000nt、約3,000nt~約6,500nt、約3,000nt~約7,000nt、約3,000nt~約7,500nt、約3,000nt~約8,000nt、約3,500nt~約4,000nt、約3,500nt~約4,500nt、約3,500nt~約5,000nt、約3,500nt~約5,500nt、約3,500nt~約6,000nt、約3,500nt~約6,500nt、約3,500nt~約7,000nt、約3,500nt~約7,500nt、約3,500nt~約8,000nt、約4,000nt~約4,500nt、約4,000nt~約5,000nt、約4,000nt~約5,500nt、約4,000nt~約6,000nt、約4,000nt~約6,500nt、約4,000nt~約7,000nt、約4,000nt~約7,500nt、約4,000nt~約8,000nt、約4,500nt~約5,000nt、約4,500nt~約5,500nt、約4,500nt~約6,000nt、約4,500nt~約6,500nt、約4,500nt~約7,000nt、約4,500nt~約7,500nt、約4,500nt~約8,000nt、約5,000nt~約5,500nt、約5,000nt~約6,000nt、約5,000nt~約6,500nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,500nt~約6,000nt、約5,500nt~約6,500nt、約5,500nt~約7,000nt、約5,500nt~約7,500nt、約5,500nt~約8,000nt、約6,000nt~約6,500nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,500nt~約7,000nt、約6,500nt~約7,500nt、約6,500nt~約8,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、約7,500nt~約8,000nt、約2,000nt、約3,000nt、約3,500nt、約4,000nt、約4,500nt、約5,000nt、約5,500nt、約6,000nt、約6,500nt、約7,000nt、約7,500nt、もしくは約8,000ntであり、かつ/または、
    2つの前記RNA分子の合計サイズが、約5,000nt~約9000nt、約5,000nt~約5,500nt、約5,000nt~約6,000nt、約5,000nt~約6,500nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,000nt~約8,500nt、約5,000nt~約9,000nt、約5,500nt~約6,000nt、約5,500nt~約6,500nt、約5,500nt~約7,000nt、約5,500nt~約7,500nt、約5,500nt~約8,000nt、約5,500nt~約8,500nt、約5,500nt~約9,000nt、約6,000nt~約6,500nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,000nt~約8,500nt、約6,000nt~約9,000nt、約6,500nt~約7,000nt、約6,500nt~約7,500nt、約6,500nt~約8,000nt、約6,500nt~約8,500nt、約6,500nt~約9,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、約7,000nt~約8,500nt、約7,000nt~約9,000nt、約7,500nt~約8,000nt、約7,500nt~約8,500nt、約7,500nt~約9,000nt、約8,000nt~約8,500nt、約8,000nt~約9,000nt、約8,500nt~約9,000nt、約5,000nt、約5,500nt、約6,000nt、約6,500nt、約7,000nt、約7,500nt、約8,000nt、約8,500nt、もしくは約9,000ntである、請求項1から35までのいずれか一項に記載の組成物。
  62. 前記第1の二量体形成ドメインおよび前記第2の二量体形成ドメインのそれぞれが、1000nt以下、例えば、少なくとも50nt、少なくとも100nt、少なくとも150nt、少なくとも200nt、少なくとも300nt、少なくとも400nt、少なくとも500nt、50~1000nt、50~500nt、50~150nt、50nt、100nt、150nt、200nt、250nt、300nt、400nt、または500ntであり、前記系の組換え効率が、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、または少なくとも約95%である、請求項1から35までのいずれか一項に記載の組成物。
  63. 各二量体形成ドメインが、1000nt以下、例えば、少なくとも50nt、少なくとも100nt、少なくとも150nt、少なくとも200nt、少なくとも300nt、少なくとも400nt、少なくとも500nt、50~1000nt、50~500nt、50~150nt、50nt、100nt、150nt、200nt、250nt、300nt、400nt、または500ntであり、前記系の組換え効率が、少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも75%、少なくとも80%、または少なくとも90%である、請求項1から35までのいずれか一項に記載の組成物。
  64. RNA組換え効率が、約10%~約100%、約10%~約20%、約10%~約30%、約10%~約35%、約10%~約40%、約10%~約45%、約10%~約50%、約10%~約55%、約10%~約60%、約10%~約70%、約10%~約80%、約10%~約90%、約20%~約30%、約20%~約35%、約20%~約40%、約20%~約45%、約20%~約50%、約20%~約55%、約20%~約60%、約20%~約70%、約20%~約80%、約20%~約90%、約30%~約35%、約30%~約40%、約30%~約45%、約30%~約50%、約30%~約55%、約30%~約60%、約30%~約70%、約30%~約80%、約30%~約90%、約35%~約40%、約35%~約45%、約35%~約50%、約35%~約55%、約35%~約60%、約35%~約70%、約35%~約80%、約35%~約90%、約40%~約45%、約40%~約50%、約40%~約55%、約40%~約60%、約40%~約70%、約40%~約80%、約40%~約90%、約45%~約50%、約45%~約55%、約45%~約60%、約45%~約70%、約45%~約80%、約45%~約90%、約50%~約55%、約50%~約60%、約50%~約70%、約50%~約80%、約50%~約90%、約55%~約60%、約55%~約70%、約55%~約80%、約55%~約90%、約60%~約70%、約60%~約80%、約60%~約90%、約70%~約80%、約70%~約90%、約80%~約90%、約10%、約20%、約30%、約35%、約40%、約45%、約50%、約55%、約60%、約70%、約80%、約90%、約95%、または約100%である、請求項1から35までのいずれか一項に記載の組成物。
  65. (a)前記第1のRNA分子および前記第2のRNA分子のそれぞれが、約2500nt~4500ntであり;
    (b)前記総核酸編集タンパク質コード配列のサイズが、約2000nt~約8000ntであり;かつ/または、
    (c)2つの前記RNA分子の合計サイズが、約5,000nt~約9000ntであり;
    RNA組換え効率が、約10%~約100%である、請求項1から35までのいずれか一項に記載の組成物。
  66. 1つまたは複数の標的核酸分子に特異的な1つまたは複数のgRNAを含む1つまたは複数の追加のRNA分子をさらに含む、請求項1から29までのいずれか一項に記載の組成物。
  67. 1つまたは複数の標的核酸分子に特異的な1つまたは複数のgRNAをコードする1つまたは複数の追加のDNA分子をさらに含む、請求項30から35までのいずれか一項に記載の組成物。
JP2023569888A 2021-05-14 2022-05-16 編集タンパク質の発現のための方法および組成物 Pending JP2024517939A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163189048P 2021-05-14 2021-05-14
US63/189,048 2021-05-14
PCT/US2022/029459 WO2022241316A1 (en) 2021-05-14 2022-05-16 Methods and compositions for expression of editing proteins

Publications (1)

Publication Number Publication Date
JP2024517939A true JP2024517939A (ja) 2024-04-23

Family

ID=84028577

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023569888A Pending JP2024517939A (ja) 2021-05-14 2022-05-16 編集タンパク質の発現のための方法および組成物

Country Status (3)

Country Link
EP (1) EP4341419A1 (ja)
JP (1) JP2024517939A (ja)
WO (1) WO2022241316A1 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020205604A1 (en) * 2019-03-29 2020-10-08 Salk Institute For Biological Studies High-efficiency reconstitution of rna molecules

Also Published As

Publication number Publication date
EP4341419A1 (en) 2024-03-27
WO2022241316A1 (en) 2022-11-17

Similar Documents

Publication Publication Date Title
US11268086B2 (en) CRISPR/CAS-related methods and compositions for treating Leber's Congenital Amaurosis 10 (LCA10)
US20230026726A1 (en) Crispr/cas-related methods and compositions for treating sickle cell disease
CA3026055A1 (en) Novel crispr enzymes and systems
KR20180120752A (ko) 베타 이상헤모글로빈증의 치료를 위한 crispr/cas-관련 방법 및 조성물
AU2016326711A1 (en) Use of exonucleases to improve CRISPR/Cas-mediated genome editing
WO2015148860A1 (en) Crispr/cas-related methods and compositions for treating beta-thalassemia
EP3126495A1 (en) Crispr/cas-related methods and compositions for treating primary open angle glaucoma
US20220145347A1 (en) High-efficiency reconstitution of rna molecules
US20220273818A1 (en) Compositions and methods for treating cep290-associated disease
US20230295725A1 (en) Compositions and methods for treating cep290-associated disease
US20230038993A1 (en) Compositions and methods for treating cep290-associated disease
JP2023549456A (ja) デュシェンヌ型筋ジストロフィーの処置のための大きい変異ホットスポットの二重aavベクター媒介欠失
US20220265855A1 (en) Compositions and methods for high-efficiency recombination of rna molecules
JP2024504608A (ja) 遺伝子操作rnaを使用した内因性adarの活用による標的化rnaの編集
JP2024517939A (ja) 編集タンパク質の発現のための方法および組成物
EP4373846A1 (en) A method for in vivo gene therapy to cure scd without myeloablative toxicity
JP2023548860A (ja) Casとdnaポリメラーゼとの会合による、予測可能かつテンプレートフリーの遺伝子編集の強化