CN115397984A - 重组酶组合物和使用方法 - Google Patents

重组酶组合物和使用方法 Download PDF

Info

Publication number
CN115397984A
CN115397984A CN202080094315.0A CN202080094315A CN115397984A CN 115397984 A CN115397984 A CN 115397984A CN 202080094315 A CN202080094315 A CN 202080094315A CN 115397984 A CN115397984 A CN 115397984A
Authority
CN
China
Prior art keywords
sequence
dna
palindromic
cell
recombinase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080094315.0A
Other languages
English (en)
Inventor
J.R.鲁本斯
R.J.基托里克
S.H.克利弗
C.G.S.科塔-拉穆西诺
Y.付
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Flagship Pioneering Innovations VI Inc
Original Assignee
Flagship Pioneering Innovations VI Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Flagship Pioneering Innovations VI Inc filed Critical Flagship Pioneering Innovations VI Inc
Publication of CN115397984A publication Critical patent/CN115397984A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y306/00Hydrolases acting on acid anhydrides (3.6)
    • C12Y306/04Hydrolases acting on acid anhydrides (3.6) acting on acid anhydrides; involved in cellular and subcellular movement (3.6.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/38Vector systems having a special element relevant for transcription being a stuffer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/46Vector systems having a special element relevant for transcription elements influencing chromatin structure, e.g. scaffold/matrix attachment region, methylation free island

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Virology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Cosmetics (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

披露了用于调控靶基因组的方法和组合物。

Description

重组酶组合物和使用方法
发明内容
本披露涉及用于体内或体外改变宿主细胞、组织或受试者中一个或多个位置处的基因组的新颖组合物、系统和方法。特别地,本发明的特征在于用于使用重组酶多肽(例如,丝氨酸重组酶,例如,如本文所述)将外源遗传元件引入宿主基因组中的组合物、系统和方法。
列举的实施例
1.一种用于修饰DNA的系统,该系统包含:
a)重组酶多肽,该重组酶多肽包含表3A、3B、或3C的氨基酸序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的氨基酸序列,或编码该重组酶多肽的核酸;以及
b)双链插入DNA,该双链插入DNA包含:
(i)与(a)的重组酶多肽结合的DNA识别序列,
所述DNA识别序列具有第一副回文序列和第二副回文序列,其中每个副回文序列为约15-35或20-30个核苷酸,并且该第一和第二副回文序列一起构成出现在如下核苷酸序列内的副回文区,该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与所述副回文区具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于所述副回文区具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入、或缺失)的核苷酸序列,并且
所述DNA识别序列进一步包含约2-20个核苷酸的核心序列,其中该核心序列位于该第一和第二副回文序列之间,以及
(ii)异源对象序列。
2.一种用于修饰DNA的系统,该系统包含:
a)重组酶多肽,该重组酶多肽包含表3A、3B、或3C的氨基酸序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的氨基酸序列,或编码该重组酶多肽的核酸;以及
b)插入DNA,该插入DNA包含:
(i)与(a)的该重组酶多肽结合的人第一副回文序列和人第二副回文序列,其中每个副回文序列为约15-35或20-30个核苷酸,并且该第一和第二副回文序列一起构成出现在如下核苷酸序列内的副回文区,该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与所述副回文区具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于所述副回文区具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入、或缺失)的核苷酸序列,并且
所述DNA识别序列进一步包含约2-20个核苷酸的核心序列,其中该核心序列位于该第一和第二副回文序列之间,以及
(ii)任选地,异源对象序列。
2a.一种用于修饰DNA的系统,该系统包含:
a)重组酶多肽,该重组酶多肽包含表3A、3B、或3C的氨基酸序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的氨基酸序列,或编码该重组酶多肽的核酸;以及
b)双链插入DNA,该双链插入DNA包含:
(i)与(a)的该重组酶多肽结合的DNA识别序列,其中任选地,该DNA识别序列包含出现在如下核苷酸序列内的约30-70或40-60个核苷酸的序列,该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于其具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入、或缺失)的核苷酸序列;以及
(ii)异源对象序列。
3.如实施例1或2所述的系统,其中该重组酶多肽包含与表3A、3B、或3C的氨基酸序列具有至少70%序列同一性的氨基酸序列。
4.如实施例1或2所述的系统,其中该重组酶多肽包含与表3A、3B、或3C的氨基酸序列具有至少75%序列同一性的氨基酸序列。
5.如实施例1或2所述的系统,其中该重组酶多肽包含与表3A、3B、或3C的氨基酸序列具有至少80%序列同一性的氨基酸序列。
6.如实施例1或2所述的系统,其中该重组酶多肽包含与表3A、3B、或3C的氨基酸序列具有至少85%序列同一性的氨基酸序列。
7.如实施例1或2所述的系统,其中该重组酶多肽包含与表3A、3B、或3C的氨基酸序列具有至少90%序列同一性的氨基酸序列。
8.如实施例1或2所述的系统,其中该重组酶多肽包含与表3A、3B、或3C的氨基酸序列具有至少95%序列同一性的氨基酸序列。
9.如实施例1或2所述的系统,其中该重组酶多肽包含与表3A、3B、或3C的氨基酸序列具有至少96%序列同一性的氨基酸序列。
10.如实施例1或2所述的系统,其中该重组酶多肽包含与表3A、3B、或3C的氨基酸序列具有至少97%序列同一性的氨基酸序列。
11.如实施例1或2所述的系统,其中该重组酶多肽包含与表3A、3B、或3C的氨基酸序列具有至少98%序列同一性的氨基酸序列。
12.如实施例1或2所述的系统,其中该重组酶多肽包含与表3A、3B、或3C的氨基酸序列具有至少99%序列同一性的氨基酸序列。
13.如实施例1或2所述的系统,其中该重组酶多肽包含与表3A、3B、或3C的氨基酸序列具有100%序列同一性的氨基酸序列。
14.如实施例1-13中任一项所述的系统,其中(a)和(b)在分开的容器中。
15.如实施例1-13中任一项所述的系统,其中(a)和(b)是混合的。
15a.如实施例1-15中任一项所述的系统,其中(b)包含线性双链DNA。
15b.如实施例1-15中任一项所述的系统,其中(b)包含环状双链DNA。
15c.如实施例15a所述的系统,其中(b)包含:
(iii)与(a)的重组酶多肽结合的第二DNA识别序列,所述第二DNA识别序列具有第三副回文序列和第四副回文序列,其中每个副回文序列为约15-35或20-30个核苷酸,并且该第三和第四副回文序列一起构成出现在如下核苷酸序列内的副回文区,该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与所述副回文区具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于所述副回文区具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入、或缺失)的核苷酸序列,并且
所述第二DNA识别序列进一步包含约2-20个核苷酸的核心序列,其中该核心序列位于该第三和第四副回文序列之间。
15d-a.如实施例15c所述的系统,其中该第一DNA识别序列具有与该第二DNA识别序列相同的序列。
15d-b.如实施例15c所述的系统,其中该第一DNA识别序列不具有与该第二DNA识别序列相同的序列(例如,其中该第二DNA识别序列相对于该第一DNA识别序列包含至少一个取代、缺失或插入)。
15d1.如实施例15d-b所述的系统,其中该第一DNA识别序列与该第二DNA识别序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性。
15e.如实施例15c-15d1中任一项所述的系统,其中该异源对象序列位于该第一DNA识别序列和该第二DNA识别序列之间。
15f.一种系统,其包含编码Gene Writing系统的多肽的第一环状RNA;以及
包含Gene Writing系统的模板核酸的第二环状RNA。
15g.一种用于修饰DNA的系统,该系统包含:
(a)多肽或编码多肽的核酸,其中该多肽包含(i)逆转录酶结构域和(ii)内切核酸酶结构域;以及
(b)模板核酸,该模板核酸包含(i)与该多肽结合的序列,(ii)异源对象序列,和(iii)对于(a)(i)、(a)(ii)、(b)(i)、或其组合是异源的核酶。
15h.如实施例15g所述的系统,其中该核酶对于(b)(i)是异源的。
15i.如实施例15g或15h所述的系统,其中该模板核酸包含(iv)第二核酶,例如对于(a)(i)、(a)(ii)、(b)(i)、或其组合是内源的第二核酶,例如其中该第二核酶对于(b)(i)是内源的。
15j.如实施例15g或15h所述的系统,其中该异源核酶替代对于(a)(i)、(a)(ii)、(b)(i)、或其组合是内源的核酶,例如其中该第二核酶对于(b)(i)是内源的。
15k.如实施例15f-15j中任一项所述的系统,其进一步包含编码Gene Writing系统的多肽的mRNA。
15l.如实施例15f-15k中任一项所述的系统,其进一步包含编码Gene Writing系统的多肽的DNA。
15m.如实施例15f-15l中任一项所述的系统,其进一步包含含有Gene Writing系统的插入DNA的DNA。
15n.如实施例15f-15m中任一项所述的系统,其进一步包含含有Gene Writing系统的插入DNA和多肽的DNA。
16.一种细胞(例如,真核细胞,例如,哺乳动物细胞,例如,人细胞;或原核细胞),其包含:重组酶多肽,该重组酶多肽包含表3A、3B、或3C的氨基酸序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的氨基酸序列,或编码该重组酶多肽的核酸。
16a.一种细胞,其包含如实施例1-15e中任一项所述的系统。
17.如实施例16所述的细胞,其进一步包含含有以下的插入DNA:
(i)与该重组酶多肽结合的DNA识别序列,
所述DNA识别序列具有第一副回文序列和第二副回文序列,其中每个副回文序列为约15-35或20-30个核苷酸,并且该第一和第二副回文序列一起构成出现在如下核苷酸序列内的副回文区,该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与所述副回文区具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于所述副回文区具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入、或缺失)的核苷酸序列,并且
所述DNA识别序列进一步包含约2-20个核苷酸的核心序列,其中该核心序列位于该第一和第二副回文序列之间;以及
(ii)任选地,异源对象序列。
17a.如实施例16所述的细胞,其进一步包含含有以下的插入DNA:
(i)与(a)的该重组酶多肽结合的DNA识别序列,其中任选地,该DNA识别序列包含出现在如下核苷酸序列内的约30-70或40-60个核苷酸的序列,该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与所述副回文区具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于所述副回文区具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入、或缺失)的核苷酸序列;以及
(ii)任选地,异源对象序列。
18.一种细胞(例如,真核细胞,例如,哺乳动物细胞,例如,人细胞;或原核细胞),其包含:
(i)DNA识别序列,所述DNA识别序列具有第一副回文序列和第二副回文序列,其中每个副回文序列为约15-35或20-30个核苷酸,并且该第一和第二副回文序列一起构成出现在如下核苷酸序列内的副回文区,该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与所述副回文区具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于所述副回文区具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入、或缺失)的核苷酸序列,并且
所述DNA识别序列进一步包含约2-20个核苷酸的核心序列,其中该核心序列位于该第一和第二副回文序列之间;以及
(ii)异源对象序列。
18a.一种细胞(例如,真核细胞,例如,哺乳动物细胞,例如,人细胞;或原核细胞),其在染色体上包含:
(i)约15-35或20-30个核苷酸的第一副回文序列,该第一副回文序列出现在如下核苷酸序列内,该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与所述副回文序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于所述副回文序列具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入、或缺失)的核苷酸序列,
(ii)约15-35或20-30个核苷酸的第二副回文序列,该第二副回文序列出现在如下核苷酸序列内,该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与所述副回文序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于所述副回文序列具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入、或缺失)的核苷酸序列,以及
(iii)位于(i)和(ii)之间的异源对象序列。
19a.如实施例18所述的细胞,其中该DNA识别序列和异源对象序列都位于染色体外核酸上。
19.如实施例18或19a中任一项所述的细胞,其中该DNA识别序列在该异源对象序列的1、2、3、4、5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、或100个核苷酸内。
19c.如实施例19a或19中任一项所述的细胞,其中该染色体外核酸包含:
(iii)第二DNA识别序列,所述第二DNA识别序列具有第三副回文序列和第四副回文序列,其中每个副回文序列为约15-35或20-30个核苷酸,并且该第三和第四副回文序列一起构成出现在如下核苷酸序列内的副回文区,该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与所述副回文区具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于所述副回文区具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入、或缺失)的核苷酸序列,并且
所述第二DNA识别序列进一步包含约2-20个核苷酸的核心序列,其中该核心序列位于该第三和第四副回文序列之间。
19c1.如实施例19c所述的细胞,其中该第一DNA识别序列具有与该第二DNA识别序列相同的序列。
19c2.如实施例19c所述的细胞,其中该第一DNA识别序列不具有与该第二DNA识别序列相同的序列(例如,其中该第二DNA识别序列相对于该第一DNA识别序列包含至少一个取代、缺失或插入)。
19c3.如实施例19c2所述的细胞,其中该第一DNA识别序列与该第二DNA识别序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性。
19c4.如实施例19c-19c3中任一项所述的细胞,其中该染色体外核酸是线性的。
19c5.如实施例19c-19c4中任一项所述的细胞,其中该细胞包含:
(iv)第三DNA识别序列,所述第三DNA识别序列具有第五副回文序列和第六副回文序列,其中每个副回文序列为约15-35或20-30个核苷酸,并且该第五和第六副回文序列一起构成出现在如下核苷酸序列内的副回文区,该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与所述副回文区具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于所述副回文区具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入、或缺失)的核苷酸序列,并且
所述第三DNA识别序列进一步包含约2-20个核苷酸的核心序列,其中该核心序列位于该第五和第六副回文序列之间,
其中该第三DNA识别序列在染色体上。
19c6.如实施例19c5所述的细胞,其中该第三DNA识别序列不具有与该第一DNA识别序列,该第二DNA识别序列或该第一和第二DNA识别序列二者相同的序列(例如,其中该第三DNA识别序列相对于该第一和/或第二DNA识别序列包含至少一个取代、缺失或插入)。
19c7.如实施例19c6所述的细胞,其中该第三DNA识别序列与该第一DNA识别序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性。
19c8.如实施例19c6或19c7中任一项所述的细胞,其中该第三DNA识别序列与该第二DNA识别序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性。
19c9.如实施例19c5-19c8中任一项所述的细胞,其中该细胞包含:
(v)第四DNA识别序列,所述第四DNA识别序列具有第七副回文序列和第八副回文序列,其中每个副回文序列为约15-35或20-30个核苷酸,并且该第七和第八副回文序列一起构成出现在如下核苷酸序列内的副回文区,该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于所述副回文区具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入、或缺失)的核苷酸序列,并且
所述第四DNA识别序列进一步包含约2-20个核苷酸的核心序列,其中该核心序列位于该第七和第八副回文序列之间,
其中该第四DNA识别序列与该第三DNA识别序列在同一染色体上。
19c10.如实施例19c9所述的细胞,其中该第四DNA识别序列不具有与该第一DNA识别序列,该第二DNA识别序列或该第一和第二DNA识别序列二者相同的序列(例如,其中该第四DNA识别序列相对于该第一和/或第二DNA识别序列包含至少一个取代、缺失或插入)。
19c11.如实施例19c10所述的细胞,其中该第四DNA识别序列与该第一DNA识别序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性。
19c12.如实施例19c10或19c11中任一项所述的细胞,其中该第四DNA识别序列与该第二DNA识别序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性。
19c13.如实施例19c9-19c12中任一项所述的细胞,其中该第四DNA识别序列具有与该第三DNA识别序列相同的序列。
19c14.如实施例19c13所述的细胞,其中该第四DNA识别序列不具有与该第四DNA识别序列相同的序列(例如,其中该第四DNA识别序列相对于该第三DNA识别序列包含至少一个取代、缺失或插入)。
19c15.如实施例19c14所述的细胞,其中该第四DNA识别序列与该第三DNA识别序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性。
19c16.如实施例19c10-19c15中任一项所述的细胞,其中该第三DNA识别序列和第四DNA识别序列在该染色体上在彼此的5、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800或900个碱基内,或在彼此的1、2、3、4、5、6、7、8、9或10千碱基内。
20.如实施例16a-18中任一项所述的细胞,其中该DNA识别序列在染色体中并且该异源对象序列在染色体外核酸上。
21.如实施例16-20中任一项所述的细胞,其中该细胞是真核细胞。
22.如实施例21所述的细胞,其中该细胞是哺乳动物细胞。
23.如实施例22所述的细胞,其中该细胞是人细胞。
24.如实施例16-20中任一项所述的细胞,其中该细胞是原核细胞(例如,细菌细胞)。
26.如实施例25所述的分离的真核细胞,其中该细胞是动物细胞(例如,哺乳动物细胞)或植物细胞。
27.如实施例26所述的分离的真核细胞,其中该哺乳动物细胞是人细胞。
28.如实施例26所述的分离的真核细胞,其中该动物细胞是牛细胞、马细胞、猪细胞、山羊细胞、绵羊细胞、鸡细胞或火鸡细胞。
29.如实施例26所述的分离的真核细胞,其中该植物细胞是玉米细胞、大豆细胞、小麦细胞或水稻细胞。
30.一种修饰真核细胞(例如,哺乳动物细胞,例如,人细胞)的基因组的方法,该方法包括使该细胞与以下接触:
a)重组酶多肽,该重组酶多肽包含表3A、3B、或3C的氨基酸序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的序列,或编码该重组酶多肽的核酸;以及
b)插入DNA,该插入DNA包含:
(i)与(a)的重组酶多肽结合的DNA识别序列,
所述DNA识别序列具有第一副回文序列和第二副回文序列,其中每个副回文序列为约15-35或20-30个核苷酸,并且该第一和第二副回文序列一起构成出现在如下核苷酸序列内的副回文区,该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与所述副回文区具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于所述副回文区具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入、或缺失)的核苷酸序列,并且
所述DNA识别序列进一步包含约2-20个核苷酸的核心序列,其中该核心序列位于该第一和第二副回文序列之间,以及
(ii)异源对象序列,
从而对该真核细胞的基因组进行修饰。
30a.一种修饰真核细胞(例如,哺乳动物细胞,例如,人细胞)的基因组的方法,该方法包括使该细胞与以下接触:
a)重组酶多肽,该重组酶多肽包含表3A、3B、或3C的氨基酸序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的序列,或编码该重组酶多肽的核酸;以及
b)插入DNA,该插入DNA包含:
(i)与(a)的该重组酶多肽结合的DNA识别序列,其中任选地,该DNA识别序列包含出现在如下核苷酸序列内的约30-70或40-60个核苷酸的序列,该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与所述副回文区具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于所述副回文区具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入、或缺失)的核苷酸序列;并且
所述DNA识别序列进一步包含约2-20个核苷酸的核心序列,其中该核心序列位于该第一和第二副回文序列之间,以及
(ii)异源对象序列,
从而对该真核细胞的基因组进行修饰。
31.一种将异源对象序列插入真核细胞(例如,哺乳动物细胞,例如,人细胞)的基因组的方法,该方法包括使该细胞与以下接触:
a)重组酶多肽,该重组酶多肽包含表3A、3B、或3C的氨基酸序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的序列,或编码该多肽的核酸;以及
b)插入DNA,该插入DNA包含:
(i)与(a)的重组酶多肽结合的DNA识别序列,
所述DNA识别序列具有第一副回文序列和第二副回文序列,其中每个副回文序列为约15-35或20-30个核苷酸,并且该第一和第二副回文序列一起构成出现在如下核苷酸序列内的副回文区,该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与所述副回文区具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于所述副回文区具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入、或缺失)的核苷酸序列,并且
所述DNA识别序列进一步包含约2-20个核苷酸的核心序列,其中该核心序列位于该第一和第二副回文序列之间,以及
(ii)异源对象序列,
从而例如以例如在实例5的测定中所测量的该真核细胞群体的至少约0.1%(例如,至少约0.1%、0.5%、1%、5%、10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、或100%)的频率将该异源对象序列插入该真核细胞的基因组。
31a.一种将异源对象序列插入真核细胞(例如,哺乳动物细胞,例如,人细胞)的基因组的方法,该方法包括使该细胞与以下接触:
a)重组酶多肽,该重组酶多肽包含表3A、3B、或3C的氨基酸序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的序列,或编码该多肽的核酸;以及
b)插入DNA,该插入DNA包含:
(i)与(a)的该重组酶多肽结合的DNA识别序列,其中任选地,该DNA识别序列包含出现在如下核苷酸序列内的约30-70或40-60个核苷酸的序列,该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于其具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入、或缺失)的核苷酸序列;以及
(ii)异源对象序列,
从而例如以例如在实例5的测定中所测量的该真核细胞群体的至少约0.1%(例如,至少约0.1%、0.5%、1%、5%、10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、或100%)的频率将该异源对象序列插入该真核细胞的基因组。
32.如实施例30-31a中任一项所述的方法,其中(a)和(b)分开或一起施用。
33.如实施例30-31a中任一项所述的方法,其中(a)在(b)的施用之前、与其同时、或在其之后施用。
34.如实施例30-33中任一项所述的方法,其中(a)包含编码该多肽的核酸。
35.如实施例34所述的方法,其中(a)的核酸和(b)的插入DNA位于同一核酸分子上、例如位于同一载体上。
36.如实施例34所述的方法,其中(a)的核酸和(b)的插入DNA位于分开的核酸分子上。
37.如实施例30-36中任一项所述的方法,其中该细胞仅具有一个与该插入DNA的DNA识别序列相容的内源DNA识别序列。
38.如实施例30-36中任一项所述的方法,其中该细胞具有两个或更多个与该插入DNA的DNA识别序列相容的内源DNA识别序列。
38a.如实施例30-38中任一项所述的方法,其中(b)的插入DNA包含与(a)的重组酶多肽结合的第二DNA识别序列,
所述第二DNA识别序列具有第三副回文序列和第四副回文序列,其中每个副回文序列为约15-35或20-30个核苷酸,并且该第三和第四副回文序列一起构成出现在如下核苷酸序列内的副回文区,该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与所述副回文区具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于所述副回文区具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入、或缺失)的核苷酸序列,并且
所述第二DNA识别序列进一步包含约2-20个核苷酸的核心序列,其中该核心序列位于该第三和第四副回文序列之间。
38b.如实施例38a所述的方法,其中该第一DNA识别序列具有与该第二DNA识别序列相同的序列。
38c.如实施例38a所述的方法,其中该第一DNA识别序列不具有与该第二DNA识别序列相同的序列(例如,其中该第二DNA识别序列相对于该第一DNA识别序列包含至少一个取代、缺失或插入)。
38d.如实施例38c所述的方法,其中该第一DNA识别序列与该第二DNA识别序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性。
38e.如实施例38a-38d中任一项所述的方法,该异源对象序列位于该第一DNA识别序列和该第二DNA识别序列之间。
38f.如前述实施例中任一项所述的方法,其中该重组酶多肽包含整合酶,例如,如表30或图1A中所列的。
38g.如实施例38f所述的方法,其中该重组酶多肽包含如表30中所列的整合酶,并且该DNA识别序列包含来自表2A、2B或2C的相应行号的识别序列。
38h.如实施例38f或38g所述的方法,其中该重组酶多肽包含Int101的氨基酸序列(例如,如表3A、3B或3C中所列的相应氨基酸序列的序列,例如,对应于行号475或登录号ASN71805.1),任选地其中该DNA识别序列包含来自表2A、2B或2C的相应行号的识别序列(例如,如行号475中所列的)。
38i.如实施例38f或38g所述的方法,其中该重组酶多肽包含Int78的氨基酸序列(例如,如表3A、3B或3C中所列的相应氨基酸序列的序列,例如,对应于行号371或登录号ARW58518.1),任选地其中该DNA识别序列包含来自表2A、2B或2C的相应行号的识别序列(例如,如行号371中所列的)。
38j.如实施例38f或38g所述的方法,其中该重组酶多肽包含Int79的氨基酸序列(例如,如表3A、3B或3C中所列的相应氨基酸序列的序列,例如,对应于行号360或登录号ARW58461.1),任选地其中该DNA识别序列包含来自表2A、2B或2C的相应行号的识别序列(例如,如行号360中所列的)。
38k.如实施例38f或38g所述的方法,其中该重组酶多肽包含Int30的氨基酸序列(例如,如表3A、3B或3C中所列的相应氨基酸序列的序列,例如,对应于行号436或登录号YP_009103095.1),任选地其中该DNA识别序列包含来自表2A、2B或2C的相应行号的识别序列(例如,如行号436中所列的)。
38l.如实施例38f或38g所述的方法,其中该重组酶多肽包含Int3的氨基酸序列(例如,如表3A、3B或3C中所列的相应氨基酸序列的序列,例如,对应于行号1200或登录号YP_459991.1),任选地其中该DNA识别序列包含来自表2A、2B或2C的相应行号的识别序列(例如,如行号1200中所列的)。
38m.如实施例38f或38g所述的方法,其中该重组酶多肽包含Int38的氨基酸序列(例如,如表3A、3B或3C中所列的相应氨基酸序列的序列,例如,对应于行号408或登录号YP_009223181.1),任选地其中该DNA识别序列包含来自表2A、2B或2C的相应行号的识别序列(例如,如行号408中所列的)。
38n.如实施例38f或38g所述的方法,其中该重组酶多肽包含Int95的氨基酸序列(例如,如表3A、3B或3C中所列的相应氨基酸序列的序列,例如,对应于行号460或登录号AFV15398.1),任选地其中该DNA识别序列包含来自表2A、2B或2C的相应行号的识别序列(例如,如行号460中所列的)。
38o.如实施例38f或38g所述的方法,其中该重组酶多肽包含Int51的氨基酸序列(例如,如表3A、3B或3C中所列的相应氨基酸序列的序列,例如,对应于行号159或登录号AOT24690.1),任选地其中该DNA识别序列包含来自表2A、2B或2C的相应行号的识别序列(例如,如行号159中所列的)。
38p.如实施例38f或38g所述的方法,其中该重组酶多肽包含Int18的氨基酸序列(例如,如表3A、3B或3C中所列的相应氨基酸序列的序列,例如,对应于行号103或登录号AGR47239.1),任选地其中该DNA识别序列包含来自表2A、2B或2C的相应行号的识别序列(例如,如行号103中所列的)。
39.一种分离的重组酶多肽,该分离的重组酶多肽包含表3A、3B或3C的氨基酸序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的序列。
40.如实施例39所述的分离的重组酶多肽,其相对于表3A、3B或3C的重组酶序列包含至少一个插入、缺失、或取代。
41.如实施例40所述的分离的重组酶多肽,其中该分离的重组酶多肽结合真核(例如,哺乳动物,例如,人)基因组基因座(例如,出现在如下核苷酸序列内的副回文区,该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与所述副回文区具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于所述副回文区具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入、或缺失)的核苷酸序列)。
41a.如实施例39或40中任一项所述的分离的重组酶多肽,其中该分离的重组酶多肽结合出现在如下核苷酸序列内的副回文区,该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与所述副回文区具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于所述副回文区具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入、或缺失)的核苷酸序列。
42.如实施例40-41a中任一项所述的分离的重组酶多肽,其中该分离的重组酶多肽相对于表3A、3B或3C的相应未经修饰的氨基酸序列对该基因组基因座的亲和力增加至少2倍、3倍、4倍、或5倍。
43.一种分离的核酸,该分离的核酸编码如下重组酶多肽,该重组酶多肽包含表3A、3B或3C的氨基酸序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的氨基酸序列。
44.如实施例43所述的分离的核酸,其编码如下重组酶多肽,该重组酶多肽相对于表3A、3B或3C的重组酶序列包含至少一个插入、缺失、或取代。
45.如实施例43或44所述的分离的核酸序列,其中该氨基酸序列的密码子被改变(例如,被优化)用于在哺乳动物细胞例如人细胞中表达。
46.如实施例43-45中任一项所述的分离的核酸,其进一步包含异源启动子(例如,哺乳动物启动子,例如,组织特异性启动子)、微小RNA(例如,组织特异性限制性miRNA)、聚腺苷酸化信号或异源有效负载。
47.一种分离的核酸(例如,DNA),该分离的核酸包含:(i)DNA识别序列,所述DNA识别序列具有第一副回文序列和第二副回文序列,其中每个副回文序列为约15-35或20-30个核苷酸,并且该第一和第二副回文序列一起构成出现在如下核苷酸序列内的副回文区,该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与所述副回文区具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于所述副回文区具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入、或缺失)的核苷酸序列,并且
所述DNA识别序列进一步包含约2-20个核苷酸的核心序列,其中该核心序列位于该第一和第二副回文序列之间,以及
(ii)异源对象序列。
47a.一种分离的核酸(例如,DNA),该分离的核酸包含:
(i)与(a)的该重组酶多肽结合的DNA识别序列,其中任选地,该DNA识别序列包含出现在如下核苷酸序列内的约30-70或40-60个核苷酸的序列,该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于所述副回文区具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入、或缺失)的核苷酸序列;以及
(ii)任选地,异源对象序列。
48.如实施例47或47a中任一项所述的分离的核酸序列,其与表3A、3B或3C的重组酶多肽结合。
48a.如实施例47-48中任一项所述的分离的核酸,其中该DNA识别序列(例如,一个或多个副回文序列)相对于表2A、2B或2C的左区列或右区列的序列中出现的识别序列(或其部分)包含至少一个插入、缺失或取代。
48b.如实施例48a所述的分离的核酸,其中该DNA识别序列(例如,副回文区)相对于相应未经修饰的DNA识别序列(例如,副回文区)对该重组酶多肽的亲和力增加至少2倍、3倍、4倍、或5倍。
48c.如实施例48a或48b中任一项所述的分离的核酸,其中该重组酶多肽相对于相应未经修饰的DNA识别序列(例如,副回文区)对该DNA识别序列(例如,副回文区)处的重组酶活性增加至少2倍、3倍、4倍、或5倍。
49.一种制备重组酶多肽的方法,该方法包括:
a)提供核酸,该核酸编码如下重组酶多肽,该重组酶多肽包含表3A、3B或3C的氨基酸序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的序列,以及
b)在允许该重组酶多肽产生的条件下将该核酸引入细胞(例如,真核细胞或原核细胞,例如,如本文所述),
从而制备该重组酶多肽。
50.一种制备重组酶多肽的方法,该方法包括:
a)提供包含如下核酸的细胞(例如,原核或真核细胞),该核酸编码如下重组酶多肽,该重组酶多肽包含表3A、3B或3C的氨基酸序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的序列,和
b)在允许该重组酶多肽产生的条件下孵育该细胞,
从而制备该重组酶多肽。
51.一种制备包含DNA识别序列和异源序列的插入DNA的方法,该方法包括:
a)提供核酸,该核酸包含:
(i)与如下重组酶多肽结合的DNA识别序列,该重组酶多肽包含表3A、3B或3C的氨基酸序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的序列,
所述DNA识别序列具有第一副回文序列和第二副回文序列,其中每个副回文序列为约15-35或20-30个核苷酸,并且该第一和第二副回文序列一起构成出现在如下核苷酸序列内的副回文区,该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与所述副回文区具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于所述副回文区具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入、或缺失)的核苷酸序列,并且
所述DNA识别序列进一步包含约2-20个核苷酸的核心序列,其中该核心序列位于该第一和第二副回文序列之间,以及
(ii)异源对象序列,以及
b)在允许该核酸复制的条件下将该核酸引入细胞(例如,真核细胞或原核细胞,例如,如本文所述),
从而制备该插入DNA。
51a.如实施例51所述的方法,其中该核酸包含:
(iii)与该重组酶多肽结合的第二DNA识别序列,
所述第二DNA识别序列具有第三副回文序列和第四副回文序列,其中每个副回文序列为约15-35或20-30个核苷酸,并且该第三和第四副回文序列一起构成出现在如下核苷酸序列内的副回文区,该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与所述副回文区具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于所述副回文区具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入、或缺失)的核苷酸序列,并且
所述第二DNA识别序列进一步包含约2-20个核苷酸的核心序列,其中该核心序列位于该第三和第四副回文序列之间。
51b.如实施例51a所述的方法,其中该第一DNA识别序列具有与该第二DNA识别序列相同的序列。
51c.如实施例51a所述的方法,其中该第一DNA识别序列不具有与该第二DNA识别序列相同的序列(例如,其中该第二DNA识别序列相对于该第一DNA识别序列包含至少一个取代、缺失或插入)。
51d.如实施例51c所述的方法,其中该第一DNA识别序列与该第二DNA识别序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性。
51e.如实施例51a-51d中任一项所述的方法,该异源对象序列位于该第一DNA识别序列和该第二DNA识别序列之间。
51f.如实施例51-51e中任一项所述的方法,其中提供包括使用克隆技术(例如,限制性消化和/或连接)、使用重组技术或获得核酸(例如,来自第三方提供者)。
52.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该重组酶多肽相对于表3A、3B或3C的氨基酸序列包含至少一个插入、缺失、或取代。
53.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该重组酶多肽相对于表3A、3B或3C的氨基酸序列在N末端、C末端、或N末端和C末端两端包含截短。
54.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该重组酶多肽包含核定位序列,例如内源核定位序列或异源核定位序列。
55.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该异源对象序列以例如在实例5的测定中所测量的该细胞的群体的至少约0.1%(例如,至少约0.1%、0.5%、1%、5%、10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、或100%)的效率插入该细胞的基因组。
56.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中在至少约1%(例如,至少约1%、5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、99.9%或100%)的插入事件中将该异源对象序列插入该细胞的基因组内的位点中(例如,包含出现在如下核苷酸序列内的序列的位点:该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于其具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入、或缺失)的核苷酸序列;和/或对应于表3A、3B或3C中列出的重组酶的行号的核苷酸序列),例如,如通过实例4的测定所测量的。
57.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中在细胞群体(例如,与该系统接触)中,在该群体中至少1%、5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、99.9%或100%的细胞中将该异源对象序列插入该细胞的基因组内的1-10,例如1-9、1-8、1-7、1-6、1-5、1-4、1-3、2-10、2-5、2-4、3-10、3-5、或5-10个位点中(例如,包含出现在如下核苷酸序列内的序列的位点:该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于其具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入、或缺失)的核苷酸序列;和/或对应于表3A、3B或3C中列出的重组酶的行号的核苷酸序列),例如,如通过实例5的测定所测量的。
58.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中在与该系统接触的细胞群体中,在该群体中至少1%、5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、99.9%或100%的细胞中将该异源对象序列恰好插入该细胞的基因组内的一个位点中(例如,包含出现在如下核苷酸序列内的序列的位点:该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于其具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入、或缺失)的核苷酸序列;和/或对应于表3A、3B或3C中列出的重组酶的行号的核苷酸序列),例如,如通过实例4的测定所测量的。
59.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中将该异源对象序列插入该细胞的基因组内的1-10,例如1-9、1-8、1-7、1-6、1-5、1-4、1-3、2-10、2-5、2-4、3-10、3-5、或5-10个位点中(例如,包含出现在如下核苷酸序列内的序列的位点:该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于其具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入、或缺失)的核苷酸序列;和/或对应于表3A、3B或3C中列出的重组酶的行的核苷酸序列),例如,如通过实例4的测定所测量的。
60.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该重组酶多肽与该插入DNA结合。
61.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中通过提供编码该重组酶多肽的核酸来提供该重组酶多肽。
62.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,它们导致例如在实例5的测定中所测量的该异源对象序列插入至少约0.1%(例如,至少约0.1%、0.5%、1%、5%、10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、或100%)的这些细胞的群体的基因组的插入频率。
62a.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,它们导致例如在实例13的测定中所测量的该异源对象序列插入至少约0.1%(例如,至少约0.1%、0.5%、1%、5%、10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、或100%)的这些细胞的群体的基因组的插入频率。
62b.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,它们导致例如在实例7的测定中所测量的该异源对象序列插入至少约0.1%(例如,至少约0.1%、0.5%、1%、5%、10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、或100%)的这些细胞的群体的基因组的插入频率。
63.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该第一副回文序列包含出现在如下序列中的15-35或20-30个核苷酸,例如13、14、15、16、17、18、19、或2015、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个核苷酸的第一序列,该序列为表2A、2B或2C的左区列或右区列中发现的序列,或相对于其具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个取代、插入或缺失的序列。
64.如实施例63所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该第二副回文序列包含15-35或20-30个核苷酸,例如15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个核苷酸的第二序列,该第二序列出现在如下序列内:该序列为在表2A、2B或2C的左区列或右区列中发现的序列,13、14、15、16、17、18、19或20,或相对于其具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个取代、插入或缺失的序列。
65.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该插入DNA进一步包含核心序列,该核心序列包含位于在表2A、2B或2C的左区列或右区列中发现的第一和第二副回文序列之间的约2-20,例如2-16个核苷酸,或相对于其具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个取代、插入或缺失的序列。
66.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该第一和第二副回文序列构成完全回文序列。
67.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该第一和/或第二副回文序列包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个非回文位置。
69.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该第一和第二副回文序列长度相同。
70.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该核心序列长度为约2-20个核苷酸(例如,2-16个核苷酸)。
71.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该核心序列例如核心二核苷酸能够与人基因组中的对应序列例如二核苷酸或其反向互补序列杂交。
72.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该核心序列与人基因组中的对应序列具有至少10%、20%、30%、40%、50%、60%、70%、80%、或90%同一性。
73.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该核心序列与人基因组中的对应序列具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个错配。
74.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该核心序列(例如核心二核苷酸)当被该重组酶切割时形成能够与人基因组中的对应序列杂交的粘性末端。
75.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该异源对象序列包含真核基因(例如哺乳动物基因,例如人基因,例如血液因子(例如,基因组因子I、II、V、VII、X、XI、XII或XIII)或酶(例如溶酶体酶)),或合成人基因(例如嵌合抗原受体)。
76.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该插入DNA包含异源对象序列和DNA识别序列。
77.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该插入DNA包含编码该重组酶多肽的核酸序列。
78.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该插入DNA和编码该重组酶多肽的核酸存在于分开的核酸分子中。
79.如实施例1-77中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该插入DNA和编码该重组酶多肽的核酸存在于同一核酸分子中。
80.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该插入DNA进一步包含:
(a)开放阅读框,例如编码多肽的序列,例如酶(例如,溶酶体酶)、血液因子、外显子;
(b)非编码和/或调节序列,例如结合转录调控剂的序列,例如启动子(例如,异源启动子)、增强子、绝缘子;
(c)剪接受体位点;
(d)聚A位点;
(e)表观遗传修饰位点;或
(f)基因表达单元。
81.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该插入DNA包含质粒、病毒载体(例如,慢病毒载体或游离病毒载体)或其他自我复制载体。
82.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该细胞不包含由该异源对象序列构成的内源人基因,或不包含由所述基因编码的蛋白质。
83.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该细胞来自如下生物,该生物不包含由该异源对象序列构成的内源人基因,或不包含由所述基因编码的蛋白质。
84.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该细胞包含内源人DNA识别序列。
85.如实施例84所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该内源人DNA识别序列可操作地连接至人基因组内的位点,例如,位于人基因组内的某一位点,该位点具有以下标准中的至少1、2、3、4、5、6、7、8或9项:
(i)距癌症相关基因>300kb;
(ii)距miRNA/其他功能性小RNA>300kb;
(iii)距5'基因末端>50kb;
(iv)距复制起点>50kb;
(v)距任何极保守元件>50kb;
(vi)转录活性低(即无mRNA+/-25kb);(vii)不在拷贝数可变区中;
(viii)在开放染色质中;和/或
(ix)是唯一的,例如,在人基因组中有1个拷贝。
85a.如实施例84或85中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该细胞包含第二内源人DNA识别序列。
85b.如实施例85a所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该第二内源人DNA识别序列可操作地连接至人基因组内的位点,例如,位于人基因组内的某一位点,该位点具有以下标准中的至少1、2、3、4、5、6、7、8或9项:
(i)距癌症相关基因>300kb;
(ii)距miRNA/其他功能性小RNA>300kb;
(iii)距5'基因末端>50kb;
(iv)距复制起点>50kb;
(v)距任何极保守元件>50kb;
(vi)转录活性低(即无mRNA+/-25kb);(vii)不在拷贝数可变区中;
(viii)在开放染色质中;和/或
(ix)是唯一的,例如,在人基因组中有1个拷贝。
86.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该细胞是动物细胞,例如哺乳动物细胞,例如人细胞。
87.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该细胞是植物细胞。
88.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该细胞未经基因修饰。
89.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该细胞不包含attB或attP位点。
89a.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该细胞(例如,在与该系统接触之前)包含假识别序列。
89b.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该细胞(例如,在与该系统接触之前)恰好包含一个假识别序列。
90.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该重组酶多肽包含对应于表3A、3B或3C的单个氨基酸序列的氨基酸序列。
91.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该重组酶多肽包含表3A、3B或3C的多个氨基酸序列的全部或一部分。
92.如实施例91所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该重组酶多肽包含来自表3A、3B或3C的第一重组酶多肽序列的一部分的第一氨基酸序列和来自表3A、3B或3C的第二不同重组酶多肽序列的一部分的第二氨基酸序列。
93.如实施例92所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该第一氨基酸序列对应于该第一重组酶多肽的结构域(例如,N末端催化结构域、重组酶结构域、锌带结构域或C末端DNA结合结构域)。
94.如实施例92或93中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该第二氨基酸序列对应于该第二重组酶多肽的结构域(例如,N末端催化结构域、重组酶结构域、锌带结构域或C末端DNA结合结构域),例如,与该第一氨基酸序列的结构域不同的结构域。
95.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该插入DNA的一个或多个核心序列包含核心二核苷酸,该核心二核苷酸已被改变以匹配基因组DNA中的靶识别序列的核心二核苷酸(并且任选地不匹配该基因组DNA中的非靶识别序列的至少一个核心二核苷酸)。
96.如前述实施例中任一项所述的系统、细胞、方法、分离的重组酶多肽、或分离的核酸,其中该插入DNA的一个或多个核心序列包含核心二核苷酸,该核心二核苷酸已被改变以匹配在表2A、2B或2C的左区列或右区列中的核苷酸序列内出现的识别序列的核心二核苷酸(并且任选地不匹配在表2A、2B或2C的左区列或右区列中的核苷酸序列内出现的非靶识别序列的至少一个核心二核苷酸)。
100.如前述实施例中任一项所述的系统或方法,其中该编码该重组酶多肽的核酸在病毒载体、例如AAV载体中。
101.如前述实施例中任一项所述的系统或方法,其中该双链插入DNA在病毒载体、例如AAV载体中。
102.如前述实施例中任一项所述的系统或方法,其中该编码该重组酶多肽的核酸是mRNA,其中任选地该mRNA在LNP中。
103.如前述实施例中任一项所述的系统或方法,其中该双链插入DNA不在病毒载体中,例如,其中该双链插入DNA是裸DNA或转染试剂中的DNA。
104.如前述实施例中任一项所述的系统或方法,其中:
编码该重组酶多肽的核酸在第一病毒载体,例如第一AAV载体中,并且
该插入DNA在第二病毒载体,例如第二AAV载体中。
105.如前述实施例中任一项所述的系统或方法,其中:
该编码该重组酶多肽的核酸是mRNA,其中任选地该mRNA在LNP中,并且
该插入DNA在病毒载体、例如AAV载体中。
106.如前述实施例中任一项所述的系统或方法,其中:
该编码该重组酶多肽的核酸是mRNA,并且
该双链插入DNA不在病毒载体中,例如,其中该双链插入DNA是裸DNA或转染试剂中的DNA。
107.如前述实施例中任一项所述的系统或方法,其中该插入DNA具有至少1kb、2kb、3kb、4kb、5kb、6kb、7kb、8kb、9kb、10kb、20kb、30kb、40kb、50kb、60kb、70kb、80kb、90kb、100kb、110kb、120kb、130kb、140kb、或150kb的长度。
108.如前述实施例中任一项所述的系统或方法,其中该插入DNA不包含抗生素抗性基因或任何其他细菌基因或部分。
R1.如前述实施例中任一项所述的系统、试剂盒、多肽或反应混合物,其中该系统包含一个或多个环状RNA分子(circRNA)。
R2.如实施例R1所述的系统、试剂盒、多肽或反应混合物,其中该circRNA编码GeneWriter多肽。
R3.如实施例R1-R2A中任一项所述的系统、试剂盒、多肽或反应混合物,其中将circRNA递送至宿主细胞。
R4.如前述实施例中任一项所述的系统、试剂盒、多肽或反应混合物,其中该circRNA能够例如在宿主细胞中,例如在该宿主细胞的细胞核中被线性化。
R4A.如前述实施例中任一项所述的系统、试剂盒、多肽或反应混合物,其中该circRNA包含切割位点。
R4A1.如实施例R4A所述的系统、试剂盒、多肽或反应混合物,其中该circRNA进一步包含第二切割位点。
R4B.如实施例R4A或R4A1所述的系统、试剂盒、多肽或反应混合物,其中该切割位点可被核酶,例如包含在该circRNA中的核酶切割(例如,通过自切割)。
R5.如前述实施例中任一项所述的系统、试剂盒、多肽或反应混合物,其中该circRNA包含核酶序列。
R6.如实施例R5所述的系统、试剂盒、多肽或反应混合物,其中该核酶序列能够例如在宿主细胞中,例如在该宿主细胞的细胞核中自切割。
R6A.如实施例R5-R6中任一项所述的系统、试剂盒、多肽或反应混合物,其中该核酶是诱导型核酶。
R7.如实施例R5-R6A中任一项所述的系统、试剂盒、多肽或反应混合物,其中该核酶是蛋白反应性核酶,例如对核蛋白,例如基因组相互作用蛋白,例如表观遗传修饰物,例如EZH2有反应的核酶。
R8.如实施例R5-R7中任一项所述的系统、试剂盒、多肽或反应混合物,其中该核酶是核酸反应性核酶。
R8A.如实施例R8所述的系统、试剂盒、多肽或反应混合物,其中该核酶的催化活性(例如,自催化活性)在靶核酸分子(例如,RNA分子,例如,mRNA、miRNA、ncRNA、lncRNA、tRNA、snRNA、或mtRNA)存在下被激活。
R9A.如实施例R5-R7中任一项所述的系统、试剂盒、多肽或反应混合物,其中该核酶对靶蛋白(例如MS2外壳蛋白)有反应。
R9B.如实施例R8A所述的系统、试剂盒、多肽或反应混合物,其中该靶蛋白定位于细胞质或定位于细胞核(例如,表观遗传修饰物或转录因子)。
R9C.如实施例R5-R8中任一项所述的系统、试剂盒、多肽或反应混合物,其中该核酶包含B2或ALU逆转录转座子的核酶序列,或与其具有至少85%、90%、95%、96%、97%、98%或99%序列同一性的核酸序列。
R10A.如实施例R5-R8中任一项所述的系统、试剂盒、多肽或反应混合物,其中该核酶包含烟草环斑病毒锤头状核酶的序列,或与其具有至少85%、90%、95%、96%、97%、98%或99%序列同一性的核酸序列。
R10B.如实施例R5-R8中任一项所述的系统、试剂盒、多肽或反应混合物,其中该核酶包含丁型肝炎病毒(HDV)核酶的序列,或与其具有至少85%、90%、95%、96%、97%、98%或99%序列同一性的核酸序列。
R11.如实施例R5-X中任一项所述的系统、试剂盒、多肽或反应混合物,其中该核酶被靶细胞或靶组织中表达的部分激活。
R12.如实施例R5-X中任一项所述的系统、试剂盒、多肽或反应混合物,其中该核酶被在靶亚细胞区室(例如,细胞核、核仁、细胞质或线粒体)中表达的部分激活。
R4A.如前述实施例中任一项所述的系统、试剂盒、多肽或反应混合物,其中该核酶包含在环状RNA或线性RNA中。
M1.如前述实施例中任一项所述的系统、试剂盒、多肽或反应混合物,其中该系统、多肽和/或编码它们的DNA被配制为脂质纳米颗粒(LNP)。
M2a.如实施例M1所述的系统、试剂盒、多肽或反应混合物,其中该脂质纳米颗粒(或包含多个脂质纳米颗粒的配制品)缺乏反应性杂质(例如醛),或包含低于预选水平的反应性杂质(例如醛)。
M2.如实施例M1所述的系统、试剂盒、多肽或反应混合物,其中该脂质纳米颗粒(或包含多个该脂质纳米颗粒的配制品)缺乏醛,或包含低于预选水平的醛。
M3.如实施例M1或M2所述的系统、试剂盒、多肽或反应混合物,其中该脂质纳米颗粒包含在包含多个这些脂质纳米颗粒的配制品中。
M4.如实施例M3所述的系统、试剂盒、多肽或反应混合物,其中该脂质纳米颗粒配制品使用一种或多种脂质试剂产生,该一种或多种脂质试剂包含小于5%、4%、3%、2%、1%、0.9%、0.8%、0.7%、0.6%、0.5%、0.4%、0.3%、0.2%或0.1%的总反应性杂质(例如醛)含量。
M5.如实施例M4所述的系统、试剂盒、多肽或反应混合物,其中该脂质纳米颗粒配制品使用一种或多种脂质试剂产生,该一种或多种脂质试剂包含小于3%总反应性杂质(例如醛)含量。
M6.如实施例M3-M5中任一项所述的系统、试剂盒、多肽或反应混合物,其中该脂质纳米颗粒配制品使用一种或多种脂质试剂产生,该一种或多种脂质试剂包含小于5%、4%、3%、2%、1%、0.9%、0.8%、0.7%、0.6%、0.5%、0.4%、0.3%、0.2%或0.1%的任何单一反应性杂质(例如醛)物质。
M7.如实施例M6所述的系统、试剂盒、多肽或反应混合物,其中该脂质纳米颗粒配制品使用一种或多种脂质试剂产生,该一种或多种脂质试剂包含小于0.3%的任何单一反应性杂质(例如醛)物质。
M8.如实施例M6所述的系统、试剂盒、多肽或反应混合物,其中该脂质纳米颗粒配制品使用一种或多种脂质试剂产生,该一种或多种脂质试剂包含小于0.1%的任何单一反应性杂质(例如醛)物质。
M9.如实施例M3-M8中任一项所述的系统、试剂盒、多肽或反应混合物,其中该脂质纳米颗粒配制品包含小于5%、4%、3%、2%、1%、0.9%、0.8%、0.7%、0.6%、0.5%、0.4%、0.3%、0.2%或0.1%的总反应性杂质(例如醛)含量。
M10.如实施例M9所述的系统、试剂盒、多肽或反应混合物,其中该脂质纳米颗粒配制品包含小于3%的总反应性杂质(例如醛)含量。
M11.如实施例M3-M10中任一项所述的系统、试剂盒、多肽或反应混合物,其中该脂质纳米颗粒配制品包含小于5%、4%、3%、2%、1%、0.9%、0.8%、0.7%、0.6%、0.5%、0.4%、0.3%、0.2%或0.1%的任何单一反应性杂质(例如醛)物质。
M12.如实施例M11所述的系统、试剂盒、多肽或反应混合物,其中该脂质纳米颗粒配制品包含小于0.3%的任何单一反应性杂质(例如醛)物质。
M13.如实施例M11所述的系统、试剂盒、多肽或反应混合物,其中该脂质纳米颗粒配制品包含小于0.1%的任何单一反应性杂质(例如醛)物质。
M14.如实施例M1-M13中任一项所述的系统、试剂盒、多肽或反应混合物,其中用于如本文所述的脂质纳米颗粒或其配制品的一种或多种或任选地所有脂质试剂包含小于5%、4%、3%、2%、1%、0.9%、0.8%、0.7%、0.6%、0.5%、0.4%、0.3%、0.2%或0.1%的总反应性杂质(例如醛)含量。
M15.如实施例M14所述的系统、试剂盒、多肽或反应混合物,其中用于如本文所述的脂质纳米颗粒或其配制品的一种或多种或任选地所有脂质试剂包含小于3%的总反应性杂质(例如醛)含量。
M16.如实施例M1-M15中任一项所述的系统、试剂盒、多肽或反应混合物,其中用于如本文所述的脂质纳米颗粒或其配制品的一种或多种或任选地所有脂质试剂包含小于5%、4%、3%、2%、1%、0.9%、0.8%、0.7%、0.6%、0.5%、0.4%、0.3%、0.2%或0.1%的任何单一反应性杂质(例如醛)物质。
M17.如实施例M16所述的系统、试剂盒、多肽或反应混合物,其中用于如本文所述的脂质纳米颗粒或其配制品的一种或多种或任选地所有脂质试剂包含小于0.3%的任何单一反应性杂质(例如醛)物质。
M18.如实施例M16所述的系统、试剂盒、多肽或反应混合物,其中用于如本文所述的脂质纳米颗粒或其配制品的一种或多种或任选地所有脂质试剂包含小于0.1%的任何单一反应性杂质(例如醛)物质。
M19.如实施例M1-M18中任一项所述的系统、试剂盒、多肽或反应混合物,其中总醛含量和/或任何单一反应性杂质(例如醛)物质的量通过液相色谱法(LC),例如与串联质谱法(MS/MS)联用,例如根据实例26中所述的方法来测定。
M20.如实施例M1-M18中任一项所述的系统、试剂盒、多肽或反应混合物,其中总醛含量和/或反应性杂质(例如醛)物质的量通过检测与例如脂质试剂中反应性杂质(例如醛)的存在相关的核酸分子(例如,如本文所述)的一个或多个化学修饰来测定。
M21.如实施例M1-M18中任一项所述的系统、试剂盒、多肽或反应混合物,其中总醛含量和/或醛物质的量通过检测与例如脂质试剂中反应性杂质(例如醛)的存在相关的核苷酸或核苷(例如,核糖核苷酸或核糖核苷,例如包含在核酸分子中或从核酸分子分离,例如,如本文所述)的一个或多个化学修饰来测定,例如,如实例27中所述。
M22.如实施例M21所述的系统、试剂盒、多肽或反应混合物,其中核酸分子、核苷酸或核苷的化学修饰通过测定一个或多个修饰的核苷酸或核苷的存在来检测,例如使用LC-MS/MS分析,例如,如实例27中所述。
T1.一种脂质纳米颗粒(LNP),其包含任一前述实施例所述的系统、多肽(或编码其的RNA)、核酸分子、或编码该系统或多肽的DNA。
T2.一种系统,其包含第一脂质纳米颗粒,该第一脂质纳米颗粒包含Gene Writing系统(例如,如本文所述)的多肽(或编码其的DNA或RNA);以及
第二脂质纳米颗粒,该第二脂质纳米颗粒包含Gene Writing系统(例如,如本文所述)的核酸分子。
T3.如任一前述实施例所述的系统、试剂盒、多肽或反应混合物,其中该系统、核酸分子、多肽和/或编码其的DNA被配制为脂质纳米颗粒(LNP)。
U1.如任一前述实施例所述的系统、试剂盒、多肽或反应混合物,其中该丝氨酸重组酶包含丝氨酸重组酶的至少一个活性位点特征,例如cd00338、cd03767、cd03768、cd03769或cd03770。
U2.如任一前述实施例所述的系统、试剂盒、多肽或反应混合物,其中该丝氨酸重组酶包含从可公开获得的数据库(例如,InterPro、UniProt或保守结构域数据库(如Lu等人Nucleic Acids Res[核酸研究]48,D265-268(2020)所述;通过引用以其全文并入本文))中鉴定的结构域,例如,如本文所述。
U3.如任一前述实施例所述的系统、试剂盒、多肽或反应混合物,其中该丝氨酸重组酶包含通过扫描丝氨酸重组酶结构域(例如,如本文所述)的核酸序列的开放阅读框或全框翻译鉴定的结构域,例如使用预测工具,例如InterProScan,例如,如本文所述。
V0.如任一前述实施例所述的系统、试剂盒、多肽、细胞(例如,通过本文的方法制备的细胞)、方法或反应混合物,其中该异源对象序列在细胞的基因组中的靶位点中(例如,插入到其中),其中任选地,该靶位点依次包含(i)第一副回文序列(例如,attL位点),(ii)异源对象序列,和(iii)第二副回文序列(例如,attR位点)。
V1.如实施例V0所述的系统、试剂盒、多肽、细胞、方法或反应混合物,其中该细胞(例如,通过本文的方法制备的细胞)在(i)该第一副回文序列和(ii)该异源对象序列之间包含插入或缺失,或者其中该细胞在(ii)该异源对象序列和(iii)该第二副回文序列之间包含插入或缺失。
V3.如实施例V1所述的系统、试剂盒、多肽、细胞、方法或反应混合物,其中该插入或缺失包含该靶位点的核酸序列的少于20个核苷酸或碱基对,例如少于20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或少于1个核苷酸或碱基对。
V4.如实施例V1所述的系统、试剂盒、多肽、细胞、方法或反应混合物,其中该插入包含少于20个核苷酸或碱基对,例如少于20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或少于1个核苷酸或碱基对。
V5.如实施例V1所述的系统、试剂盒、多肽、细胞、方法或反应混合物,其中该缺失包含该靶位点的先前序列的少于20个核苷酸或碱基对,例如少于20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或少于1个核苷酸或碱基对。
V6.如实施例V0-V5中任一项所述的系统、试剂盒、多肽、细胞、方法或反应混合物,其中该靶位点的识别序列(例如,attB、attP或其假位点,例如,如表4X中所列)的核心区(例如,中心二核苷酸)与识别序列(例如,attP或attB位点,例如,如表4X中所列,在插入DNA上)的核心区(例如,中心二核苷酸)包含约95%、96%、97%、98%、99%或100%同一性。
V7.如实施例V6所述的系统、试剂盒、多肽、细胞、方法或反应混合物,其中该靶位点中的插入或缺失的数目低于同一性百分比较低的其他方面类似细胞中的插入或缺失的数目。
V8.如实施例V7所述的系统、试剂盒、多肽、细胞、方法或反应混合物,其中插入或缺失事件的数目低至少1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2.0、3.0、4.0、5.0、10、20、30、40、50、60、70、80、90或至少100倍。
V9.如实施例V0-V8中任一项所述的系统、试剂盒、多肽、细胞、方法或反应混合物,其中该靶位点不包含多个插入(例如,头对尾或头对头重复)。
V9a.如实施例V0-V9中任一项所述的系统、试剂盒、多肽、细胞、方法或反应混合物,其中该靶位点包含少于100、75、50、45、40、35、30、25、20、15、14、13、12、11、10、9、8、7、6、5、4、3或2个拷贝的该异源对象序列或其片段。
V10.如实施例V0-V9a中任一项所述的系统、试剂盒、多肽、细胞、方法或反应混合物,其中该靶位点包含单拷贝的异源对象序列或其片段。
V11.如实施例V0-V10中任一项所述的系统、试剂盒、多肽、细胞、方法或反应混合物,其中(例如,在细胞群体中),显示多于一个拷贝的该异源对象序列或其片段的靶位点少于包含至少一个拷贝的该异源对象序列或其片段的靶位点的95%、90%、80%、70%、60%、50%、40%、30%、20%、10%、9%、8%、7%、6%、4%、4%、3%、2%或1%。
V12.如实施例V0-V11中任一项所述的系统、试剂盒、多肽、细胞、方法或反应混合物,其中(例如,在细胞群体中),显示多于2个拷贝的该异源对象序列或其片段的靶位点少于包含至少一个拷贝的该异源对象序列或其片段的靶位点的95%、90%、80%、70%、60%、50%、40%、30%、20%、10%、9%、8%、7%、6%、4%、4%、3%、2%或1%。
V13.如实施例V0-V12中任一项所述的系统、试剂盒、多肽、细胞、方法或反应混合物,其中(例如,在细胞群体中),显示多于3个拷贝的该异源对象序列或其片段的靶位点少于包含至少一个拷贝的该异源对象序列或其片段的靶位点的95%、90%、80%、70%、60%、50%、40%、30%、20%、10%、9%、8%、7%、6%、4%、4%、3%、2%或1%。
V14.如实施例V0-V13中任一项所述的系统、试剂盒、多肽、细胞、方法或反应混合物,其中该靶位点包含一个或多个ITR(例如AAV ITR),例如1、2、3、4个或更多个ITR,例如其中一个或多个ITR位于(i)该第一副回文序列和(iii)该第二副回文序列之间。
V15.如实施例V14所述的系统、试剂盒、多肽、细胞、方法或反应混合物,其中(例如,在细胞群体中),在(i)第一副回文序列和(iii)第二副回文序列之间包含ITR(例如,AAVITR)的靶位点是包含至少一个拷贝的异源对象序列或其片段的靶位点的至少1%、5%、10%、20%、30%、40%、50%、60%、70%、80%或90%。
V16.如实施例V14或V15所述的系统、试剂盒、多肽、细胞、方法或反应混合物,其中该插入位点包含一个或多个拷贝的异源对象序列或其片段。
V17.如实施例V0-V16中任一项所述的系统、试剂盒、多肽、细胞、方法或反应混合物,其中该靶位点依次包含(i)第一副回文序列,和(ii)异源对象序列。
V18.如实施例V17所述的系统、试剂盒、多肽、细胞、方法或反应混合物,其中该靶位点不包含(iii)第二副回文序列。
V19.如实施例V0-V17中任一项所述的系统、试剂盒、多肽、细胞、方法或反应混合物,其中该靶位点包含(iii)第二副回文序列,其中(ii)位于(i)和(iii)之间。
V20.如实施例V0-V19中任一项所述的系统、试剂盒、多肽、细胞、方法或反应混合物,其中(例如,在细胞群体中),与包含一个或更少的副回文序列(例如,attL或attP序列)的靶位点的百分比相比,包含(i)第一副回文序列和(iii)第三副回文序列的靶位点包含更高百分比的完整异源对象序列(例如,至少0.1x、0.2x、0.3x、0.4x、0.5x、0.6x、0.7x、0.8x、0.9x、1.0x、1.5x、2.0x、3x、4x、5x、6x、7x、8x、9x、10x或更多百分比的完整异源对象序列)。
本披露考虑前述各方面和/或实施例中任何一个或多个的所有组合,以及在具体实施方式和实例中所阐述的实施例中任何一个或多个的组合。
定义
约,大约:当本文使用的术语“约”或“大约”用于一个或多个目的值是指类似于所述参考值的值。在某些实施例中,术语“大约”或“约”是指在所述参考值的任一方向(大于或小于)上落入15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或更小的值的范围,除非另有说明或从上下文明显看出(除非这样的数值超过可能值的100%)。
结构域:如本文所用,术语“结构域”是指有助于生物分子的特定功能的生物分子的结构。结构域可以包含生物分子的连续区域(例如,连续序列)或不同的非连续区域(例如,非连续序列)。蛋白质结构域的实例包括但不限于核定位序列、重组酶结构域、DNA识别结构域(例如,其结合或能够结合识别位点,例如,如本文所述)、重组酶N末端结构域(也称为催化结构域)、重组酶结构域、C末端锌带结构域和表4中所列的结构域。在一些实施例中,锌带结构域进一步包含卷曲螺旋基序。在一些实施例中,重组酶结构域和锌带结构域统称为C末端结构域。在一些实施例中,N末端结构域通过αE接头或螺旋连接至C末端结构域。在一些实施例中,N末端结构域为50至250个氨基酸、或100-200个氨基酸、或130-170个氨基酸之间,例如约150个氨基酸。在一些实施例中,C末端结构域是200-800个氨基酸,或300-500个氨基酸。在一些实施例中,重组酶结构域为50至150个氨基酸之间。在一些实施例中,锌带结构域为30至100个氨基酸之间;核酸的结构域的实例是调节结构域,例如转录因子结合结构域、识别序列、识别序列的臂(例如,5'或3'臂)、核心序列或对象序列(例如,异源对象序列)。在一些实施例中,重组酶多肽包含表3A、3B或3C的多肽或其片段或变体的一个或多个结构域(例如,重组酶结构域或DNA识别结构域)。
外源的:如本文所用,术语外源的,当相对于生物分子(例如核酸序列或多肽)使用时,意指通过人工将生物分子引入宿主基因组、细胞或生物中。例如,使用重组DNA技术或其他方法添加到现有基因组、细胞、组织或受试者中的核酸对于现有核酸序列、细胞、组织或受试者而言是外源的。
基因组安全港位点(GSH位点):基因组安全港位点是宿主基因组中的位点,该位点能够容纳新遗传材料的整合,例如,使得插入的遗传元件不会引起宿主基因组的显著改变对宿主细胞或生物构成风险。GSH位点通常满足以下标准中的1、2、3、4、5、6、7、8或9项:(i)距癌症相关基因>300kb;(ii)距miRNA/其他功能性小RNA>300kb;(iii)距5'基因末端>50kb;(iv)距复制起点>50kb;(v)距任何极保守元件>50kb;(vi)转录活性低(即无mRNA+/-25kb);(vii)不在拷贝数可变区中;(viii)在开放染色质中;和/或(ix)是唯一的,在人基因组中有1个拷贝。满足一些或所有这些标准的人基因组中GSH位点的实例包括:(i)腺相关病毒位点1(AAVS1),它是AAV病毒在19号染色体上整合的天然存在的位点;(ii)趋化因子(C-C基序)受体5(CCR5)基因,一种被称为HIV-1共同受体的趋化因子受体基因;(iii)小鼠Rosa26基因座的人直系同源物;(iv)rDNA基因座。另外的GSH位点是已知的,并且描述于例如Pellenz等人,2018年8月20日电子公开(https://doi.org/10.1101/396390)中。
异源的:当用于参考第二元件来描述第一元件时,术语异源的意指第一元件和第二元件在自然界中不以如所描述的布置存在。例如,异源多肽、核酸分子、构建体或序列是指(a)对于表达其的细胞而言不是天然的多肽、核酸分子或多肽或核酸分子序列的一部分,(b)相对于其天然状态已发生改变或突变的多肽或核酸分子或多肽或核酸分子的一部分,或(c)具有与在类似条件下的天然表达水平相比改变的表达的多肽或核酸分子。例如,异源调节序列(例如启动子、增强子)可以用于调节基因或核酸分子的表达,其方式不同于基因或核酸分子通常在自然界中表达的方式。在某些实施例中,异源核酸分子可以存在于天然宿主细胞基因组中,但是可以具有改变的表达水平或具有不同的序列或两者。在其他实施例中,异源核酸分子对于宿主细胞或宿主基因组可能不是内源的,而是通过转化(例如,转染、电穿孔)引入宿主细胞的,其中所添加的分子可以整合到宿主基因组中,或可以作为染色体外遗传材料短暂存在(例如,mRNA)或半稳定存在超过一代(例如,游离病毒载体、质粒或其他自我复制载体)。
突变或突变的:当应用于核酸序列时,术语“突变的”意指与参考(例如天然)核酸序列相比,核酸序列中的核苷酸可以被插入、缺失或改变。可以在基因座处进行单个改变(点突变),或者可以在单个基因座处插入、缺失或改变多个核苷酸。另外,可以在核酸序列内的任何数目的基因座处进行一个或多个改变。核酸序列可以通过本领域已知的任何方法进行突变。
核酸分子:核酸分子是指RNA和DNA分子两者,包括但不限于cDNA、基因组DNA和mRNA,并且还包括合成的核酸分子,例如化学合成或重组产生的核酸分子,例如如本文所述的DNA模板。核酸分子可以是双链或单链、环状或线性的。如果是单链,则核酸分子可以是有义链或反义链。除非另有说明,并且作为本文以通用格式“SEQ ID NO:”描述的所有序列的实例,“包含SEQ ID NO:1的核酸”是指其至少一部分具有(i)SEQ ID NO:1的序列,或(ii)与SEQ ID NO:1互补的序列的核酸。两者之间的选择取决于使用SEQ ID NO:1的上下文。例如,如果将核酸用作探针,则两者之间的选择取决于探针与期望的靶互补的要求。如本领域技术人员将容易理解的,本披露的核酸序列可以被化学或生物化学修饰或可以含有非天然或衍生的核苷酸碱基。此类修饰包括例如标签,甲基化,用类似物取代一个或多个天然存在的核苷酸,核苷酸间修饰,例如不带电荷的连接(例如,甲基膦酸酯、磷酸三酯、氨基磷酸酯、氨基甲酸酯等)、带电荷的连接(例如,硫代磷酸酯、二硫代磷酸酯等),侧链部分(例如,多肽),嵌入剂(例如,吖啶、补骨脂素等),螯合剂,烷基化剂和经修饰的连接(例如,α异头核酸等等)。还包括合成的分子,它们模拟多核苷酸经由氢键和其他化学相互作用与指定序列结合的能力。此类分子是本领域已知的,并且包括例如其中肽键替代分子主链中的磷酸键的那些。其他修饰可以包括,例如,其中核糖环含有桥接部分或其他结构(例如在“锁定”核酸中发现的修饰)的类似物。
基因表达单元:基因表达单元是核酸序列,其包含与至少一个效应子序列可操作地连接的至少一个调节核酸序列。当第一核酸序列被放置成与第二核酸序列有功能关系时,该第一核酸序列与该第二核酸序列可操作地连接。例如,如果启动子或增强子影响编码序列的转录或表达,则该启动子或增强子与该编码序列可操作地连接。可操作地连接的DNA序列可以是连续的或非连续的。在需要连接两个蛋白质编码区的情况下,可操作地连接的序列可以在同一阅读框中。
宿主:如本文所用,术语宿主基因组或宿主细胞是指已将蛋白质和/或遗传材料引入其中的细胞和/或其基因组。应当理解,此类术语不仅旨在指特定的受试者细胞和/或基因组,而且还指这种细胞的子代和/或这种细胞的子代的基因组。因为由于突变或环境影响,某些修饰可能在后代中发生,所以这种子代实际上可能与亲本细胞不同,但仍包括在本文所用的术语“宿主细胞”的范围内。宿主基因组或宿主细胞可以是在培养物中生长的分离的细胞或细胞系,或者是从这种细胞或细胞系分离的基因组材料,或者可以是构成活组织或生物的宿主细胞或宿主基因组。在一些情况下,宿主细胞可以是动物细胞或植物细胞,例如,如本文所述。在某些情况下,宿主细胞可以是牛细胞、马细胞、猪细胞、山羊细胞、绵羊细胞、鸡细胞或火鸡细胞。在某些情况下,宿主细胞可以是玉米细胞、大豆细胞、小麦细胞或水稻细胞。
重组酶多肽:如本文所用,重组酶多肽是指具有催化核酸分子(例如,DNA分子)重组反应的功能能力的多肽。重组反应可以包括,例如,一条或多条核酸链断裂(例如,双链断裂),接着是两条核酸链末端(例如,粘性末端)的连接。在一些情况下,重组反应包括将插入核酸插入例如靶位点,例如在基因组或构建体中的靶位点。在一些情况下,重组反应包括核酸的翻转或反转,例如在基因组或构建体中。在一些情况下,重组反应包括例如从基因组或构建体中去除核酸。在一些情况下,重组酶多肽包含天然存在的重组酶(例如,丝氨酸重组酶,例如,PhiC31重组酶或Gin重组酶)的一个或多个结构元件。在某些情况下,重组酶多肽包含与本文所述的重组酶(例如,如表3A、3B或3C中所列)具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在一些实施例中,重组酶多肽包含丝氨酸重组酶,例如丝氨酸整合酶。在一些实施例中,丝氨酸重组酶(例如丝氨酸整合酶)包含重组酶结构域、催化结构域或锌带结构域中的一个或多个(例如全部)。在一些实施例中,丝氨酸重组酶(例如丝氨酸整合酶)包含表4中所列的结构域(例如,除了重组酶结构域、催化结构域或锌带结构域中的一个或多个之外或替换重组酶结构域、催化结构域或锌带结构域中的一个或多个)。在一些情况下,重组酶多肽具有天然存在的重组酶(例如丝氨酸重组酶,例如PhiC31重组酶或Gin重组酶)的一个或多个功能特征。在一些实施例中,重组酶多肽是350-900个氨基酸、或425-700个氨基酸。在一些情况下,重组酶多肽识别(例如结合)核酸分子中的识别序列(例如,在表2A、2B或2C的左区和/或右区列中的序列中出现的识别序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的序列)。在一些实施例中,重组酶可以促进第一识别序列(例如attB或假attB)和第二基因组识别序列(例如attP或假attP)之间的重组。在一些实施例中,重组酶多肽作为分离的单体不具有活性。在一些实施例中,重组酶多肽与一个或多个其他重组酶多肽协同催化重组反应(例如,每个重组反应两个或四个重组酶多肽)。在一些实施例中,重组酶多肽作为二聚体具有活性。在一些实施例中,重组酶在识别序列处组装成二聚体。在一些实施例中,重组酶多肽作为四聚体具有活性。在一些实施例中,重组酶在识别序列处组装成四聚体。在一些实施例中,重组酶多肽是重组的(例如,非天然存在的)重组酶多肽。在一些实施例中,重组的重组酶多肽包含衍生自多个重组酶多肽的氨基酸序列(例如,重组的重组酶多肽包含来自第一重组酶多肽的第一结构域和来自第二重组酶多肽的第二结构域)。
插入核酸分子:如本文所用,插入核酸分子(例如,插入DNA)是如下核酸分子(例如,DNA分子),该核酸分子被或将被至少部分地插入靶核酸分子(例如,基因组DNA)内的靶位点。插入核酸分子可以包括,例如,相对于靶核酸分子(例如,基因组DNA)异源的核酸序列。在一些情况下,插入核酸分子包含对象序列(例如,异源对象序列)。在一些情况下,插入核酸分子包含DNA识别序列,例如,存在于靶核酸中的DNA识别序列的同源DNA识别序列。在一些实施例中,插入核酸分子是环状的,而在一些实施例中,插入核酸分子是线性的。在一些实施例中,插入核酸分子包含两个或更多个DNA识别序列(例如,两个DNA识别序列),例如,各自与靶核酸中存在的DNA识别序列同源。在一些实施例中,插入核酸分子也称为模板核酸分子(例如,模板DNA)。
识别序列:识别序列(例如,DNA识别序列)通常是指由重组酶多肽识别(例如,能够被该重组酶多肽结合)的核酸(例如,DNA)序列,例如,如本文所述。在一些情况下,识别序列包含两个识别序列,一个位于整合位点(核酸要整合到其中的位点),另一个邻近要引入整合位点的目的核酸。识别序列一般称为attB和attP。识别序列可以是天然的或相对于天然序列被改变。识别序列的长度可以变化,但典型地为约20至约200nt,约30至90nt,更通常为30至70个核苷酸。识别序列典型地如下排列:AttB以从5′至3′attB5′-核心区-attB3′的相对顺序包含第一DNA序列attB5′,核心区和第二DNA序列attB3′。AttP以从5′至3′attP5′-核心区-attP3′的相对顺序包含第一DNA序列attP5′,核心区和第二DNA序列attP3′。在一些实施例中,attB5’和attB3’是副回文的(例如,一个序列是相对于另一个序列的回文结构或与相对于另一个序列的回文结构具有至少20%、30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性)。在一些实施例中,attP5’和attP3’识别序列是副回文的(例如,一个序列是相对于另一个序列的回文结构或与相对于另一个序列的回文结构具有至少20%、30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性)。在一些实施例中,attB5’和attB3’识别序列彼此副回文,并且attP5’和attP3’识别序列彼此副回文。在一些实施例中,attB5’和attB3’以及attP5’和attP3’序列是相似的但不一定具有相同数量的核苷酸。因为attB和attP是不同的序列,所以重组将产生既不是attB序列也不是attP序列的一段核酸(左和右称为attL或attR)。在不希望受理论约束的情况下,attL/attR和attB/attP之间的差异可能使得attL和attR位点作为重组位点不易被相关重组酶识别,因此降低了该酶催化第二个重组反应的可能性,该第二个重组反应将逆转第一个重组反应。识别序列典型地被重组酶二聚体结合。在一些实施例中,重组酶多肽的αE螺旋、重组酶结构域、接头结构域和/或锌带结构域中的一个或多个接触识别序列。在一些情况下,识别序列包含出现在如下序列内的核酸序列,该序列为表2A、2B或2C的左区列或右区列中的序列,例如表2A、2B或2C的左区列或右区列中的序列内的20-200nt序列,例如表2A、2B或2C的左区列或右区列中的序列内的30-70nt序列,或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的序列。在一些实施例中,识别序列也称为附接位点。在一些实施例中,当描述基因组中出现且作为Gene Writing活性的位点的识别序列时,识别序列被称为靶序列或靶位点。
假识别序列:识别序列存在于多种生物的基因组中,其中识别序列不一定具有与野生型识别序列相同的核苷酸序列(对于给定的重组酶);但是此类天然识别序列仍然足以促进重组酶介导的重组。此类识别序列是在本文中称为“假识别序列”的那些。“假识别序列”是包含被重组酶识别(例如,能够被其结合)的识别序列的DNA序列,其中该识别序列:在一个或多个核苷酸上与相应的野生型重组酶识别序列不同,和/或作为内源序列存在于基因组中,该基因组与重组酶的野生型识别序列所在的基因组序列不同。在一些实施例中,对于给定的重组酶,假识别序列在功能上等同于野生型重组序列,出现在与天然发现重组酶的生物不同的生物中,并且相对于野生型识别序列可能具有序列变异。“假attP位点”或“假attB位点”是指分别与野生型噬菌体(attP)或细菌(attB)附接位点序列(例如噬菌体整合酶,如噬菌体PhiC31)的识别序列相似的假识别序列。在一些实施例中,attP或假attP位点存在于宿主细胞的基因组中,而attB或假attB位点存在于本文所述系统中的靶向载体上。在一些实施例中,attB或假attB位点存在于宿主细胞的基因组中,而attP或假attP位点存在于本文所述系统中的靶向载体上。“假att位点”是更通用的术语,其可以指假attP位点或假attB位点。att位点或假att位点可以存在于线性或环状核酸分子上。假识别序列的鉴定可通过例如使用序列比对和分析来完成,其中查询序列是目的识别序列(例如噬菌体/细菌系统的attB和/或attP)。例如:如果使用attB查询序列鉴定基因组识别序列,则其被称为假attB位点;如果使用attP查询序列鉴定基因组识别序列,则其被称为假attP位点。在一些实施例中,假识别序列与被重组酶(例如,αE螺旋、重组酶结构域、接头结构域和/或锌带结构域中的一个或多个,如通过引用并入的Li H等人,2018,J Mol Biol[分子生物学杂志],430(21):4401-4418所述的)识别(例如,能够结合)的野生型识别序列共享高序列相似性。在一些实施例中,假识别序列比重组酶的野生型识别序列更强地被重组酶结合或作用。假识别序列也可称为“假位点”。在一些实施例中,假位点可能与亲本序列完全不同,例如,如Thyagarajan等人Mol Cell Biol[分子细胞生物学]21(12):3926-3934(2001)中所述。在一些实施例中,如本文所用的假位点可能与天然识别序列具有小于70%,例如小于70%、60%、50%、40%或小于30%同一性。在一些实施例中,如本文所用的假位点可能与天然识别序列具有大于20%,例如大于20%、30%、40%、50%、60%或大于70%同一性。
杂合识别序列:如本文所用的“杂合识别序列”是指由多个识别序列(例如野生型和/或假识别序列)的部分构建的识别序列。在一些实施例中,多个识别序列都是相同重组酶的识别序列(例如,被相同重组酶识别的野生型识别序列和假识别序列)。在一些实施例中,杂合重组位点的核心序列的序列5'(例如attB5'或attP5')匹配假识别序列,并且杂合识别序列的核心序列的序列3'(例如attB3'或attP3')匹配野生型识别序列。在一些实施例中,杂合重组位点的核心序列的序列5'(例如attB5'或attP5')匹配野生型识别序列,并且杂合识别序列的核心序列的序列3'(例如attB3'或attP3')匹配假识别序列。在一些实施例中,杂合重组位点的核心序列的序列5'(例如attB5'或attP5')匹配假识别序列,并且杂合识别序列的核心序列的序列3'(例如attB3'或attP3')匹配野生型识别序列。在一些实施例中,杂合识别序列可由来自野生型attB位点的核心序列的5′区和来自野生型attP识别序列的核心序列的3′区组成,或反之亦然。鉴于本说明书的教导,此类杂合识别序列的其他组合对于本领域普通技术人员将是显而易见的。在一些实施例中,适用于本文的识别序列是杂合识别序列。
核心序列:如本文所用的核心序列是指位于识别序列的两个臂之间的核酸序列,例如位于一对副回文序列之间。在一些实施例中,核心序列位于attB5′和attB3′之间,或attP5′和attP3′之间。在一些情况下,核心序列可以被重组酶多肽(例如,识别包含两个副回文序列的识别序列的重组酶多肽)切割,例如形成粘性末端,例如3'突出端。在一些实施例中,attB和attP的核心序列是相同的。在一些实施例中,attB和attP的核心序列不相同,例如具有小于99%、95%、90%、80%、70%、60%、50%、40%、30%或20%同一性。在一些实施例中,核心序列长度为约2-20个核苷酸,例如2-16个核苷酸,例如约4个核苷酸或长度约2个核苷酸(例如长度恰好2个核苷酸)。在一些实施例中,核心序列包含对应于两个相邻核苷酸的核心二核苷酸,其中识别附近的副回文序列的重组酶可切割核心二核苷酸一侧上的DNA,例如形成粘性末端。在一些实施例中,attB和/或attP位点的核心序列的核心二核苷酸是相同的,例如,切割attP和/或attB位点形成相容的粘性末端。在一些实施例中,核心序列包含在表2A、2B或2C的左区列或右区列中的核苷酸序列内出现的核酸序列。在一些实施例中,核心序列包含不源自表2A、2B或2C的左区列或右区列中的核苷酸序列内的核酸序列。
对象序列:如本文所用,术语对象序列是指可以例如通过重组酶多肽被理想地插入靶核酸分子中的核酸区段,例如,如本文所述。在一些实施例中,插入DNA包含DNA识别序列和对于该DNA识别序列异源的对象序列,该对象序列在本文通常被称为“异源对象序列”。在一些情况下,对象序列相对于其所插入的核酸分子可以是异源的。在一些情况下,对象序列包含编码基因(例如,真核基因,例如,哺乳动物基因,例如,人基因)的核酸序列或其他目的载物(cargo)(例如,编码功能性RNA例如siRNA或miRNA的序列),例如,如本文所述。在某些情况下,基因编码多肽(例如,血液因子或酶)。在一些情况下,对象序列包含一个或多个编码可选择标志物(例如,营养缺陷型标志物或抗生素标志物)的核酸序列、和/或核酸控制元件(例如,启动子、增强子、沉默子或绝缘子)。
副回文:如本文所用,术语“副回文”是指一对核酸序列的特性,其中一个核酸序列是相对于另一个核酸序列的回文结构,或者与相对于另一个核酸序列的回文结构具有至少30%(例如,至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、或100%),例如至少50%序列同一性,或者相对于另一个核酸序列具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列错配。如本文所用,“副回文序列”是指相对于彼此是副回文的一对核酸序列中的至少一个。如本文所用,“副回文区”是指包含两个副回文序列的核酸序列或其部分。在一些情况下,副回文区包含核酸区段侧翼的两个副回文序列,例如,包含核心序列。
附图说明
图1A:10种示例性丝氨酸整合酶在人细胞中的活性。用整合酶表达质粒和模板质粒转染HEK293T细胞,该模板质粒携带520bp的含有attP的区域,接着是由CMV启动子驱动的EGFP报告子。显示了转染后第21天通过流式细胞术观察到的EGFP阳性细胞的百分比。
图1B:评估不同AAV供体形式的整合、稳定性和表达的策略。单个attB*或attP*供体利用AAV转导到细胞核后双链环化DNA的形成。这种构型还包括整合后的ITR序列。双attB-attB*或attP-attP*供体不需要在AAV转导后双链环化DNA的形成。整合稳定性和表达的读数使用液滴数字PCR(ddPCR)和流式细胞术(FLOW)。
图2:AAV构建体说明。第一行显示:ITR,填充片段(500),attP*,PEF1a,EGFP,WPRE,hGHpA,ITR;AAV2血清型。第二行显示:ITR,填充片段(500),attP,PEF1a,EGFP,WPRE,hGHpA,attP*,填充片段(500),ITR;AAV2血清型。第三行显示:ITR,填充片段(500),attB*,PEF1a,EGFP,WPRE,hGHpA,ITR;AAV2血清型。第四行显示:ITR,填充片段(500),attB,PEF1a,EGFP,WPRE,hGHpA,attB*,填充片段(500),ITR;AAV2血清型。第五行显示:ITR,PEF1a,hcoBXB1,WPRE,hGHpA,ITR;AAV2血清型。第六行显示:ITR,PEF1a,mcoBXB1,WPRE,hGHpA,ITR;AAV6血清型。
图3A和3B:将丝氨酸整合酶和模板DNA双重AAV递送至哺乳动物细胞。(A)实验示意图。将BXB1丝氨酸重组酶和模板DNA作为单独的AAV病毒载体共同递送到BXB着陆垫细胞系中。(B)液滴数字PCR(ddPCR)测定以评估在转导后3天和7天BXB1丝氨酸重组酶和转基因至attP-attP*着陆垫细胞系中的整合(%CNV/着陆垫)。黑色圆点(每对灰色圆点的右侧)表示仅模板样品并落在y轴上的0%处。灰色圆点(每对黑色圆点的左侧)表示模板+BXB1整合酶并落在y轴上的1%-6%之间。
图4A和4B:对哺乳动物细胞进行BXB1整合酶的mRNA递送和模板DNA的AAV递送。(A)实验示意图。对BXB1着陆垫细胞系进行BXB1丝氨酸重组酶的mRNA递送和模板DNA的AAV递送。(B)液滴数字PCR(ddPCR)测定以评估mRNA转染/AAV转导后3天BXB1丝氨酸重组酶和转基因至attP-attP*着陆垫细胞系中的整合(%CNV/着陆垫)。黑色圆点(每对灰色圆点的右侧)表示仅模板样品并落在y轴上的0%处。灰色圆点(每对黑色圆点的左侧)表示模板+BXB1整合酶并落在y轴上的大于0%处。
图5A和5B:重组酶识别位点的一般结构和识别位点在本文披露的左区和右区序列中的存在。(A)识别序列的一般特征。如本文所定义的丝氨酸重组酶通常包含中心二核苷酸、核心序列和本质上可以是副回文的侧翼臂。本文描述了Bxb1重组酶的attP和attB识别序列(表3A,行号204)。这些序列共享以粗体表示的中心二核苷酸,这对于两个位点之间的成功重组是重要的。用黑框轮廓表示的识别位点的臂可以不同程度地共享回文序列,因此在本文中被称为“副回文”。相对于相对臂为回文的核苷酸用带下划线文本表示。另外,识别序列共享attP和attB位点之间共有的核心,此处用灰色阴影表示。核心序列至少包含中心二核苷酸,但可以包括另外的序列。(B)表2的左区或右区包含同源重组酶的attP位点。表2包含本文所述的示例性重组酶的示例性识别位点。例如,表1或表3(例如表1A或表3A)中重组酶的attP位点在表2(例如表2A)中的左区或右区中找到。此处显示,Bxb1整合酶的attP位点(表1A和表3A,行号204)可在表2A的相应行(行号204)中找到。Bxb1的attP位点在左区序列中显示为带下划线和粗体文本。
具体实施方式
本披露涉及用于例如体内或体外靶向、编辑、修饰或操纵细胞、组织或受试者中DNA序列中的一个或多个位置处的DNA序列(例如,将异源对象DNA序列插入哺乳动物基因组的靶位点)的组合物、系统和方法。对象DNA序列可以包括例如编码序列、调节序列、基因表达单元。
Gene-writerTM基因组编辑器
本发明提供了可用于例如通过对包含可被重组酶多肽结合的同源识别序列的两个DNA序列进行重组来修饰或操纵DNA序列的重组酶多肽(例如,丝氨酸重组酶多肽,例如,如表3A、3B、或3C中所列)。在一些实施例中,Gene WriterTM基因编辑器系统可以包含:(A)多肽或编码多肽的核酸,其中该多肽包含(i)含有重组酶活性的结构域,和(ii)含有DNA结合功能的结构域(例如,DNA识别结构域,其例如结合或能够结合识别序列,例如,如本文所述);以及(B)插入DNA,该插入DNA包含(i)结合多肽的序列(例如,如本文所述的识别序列)和任选地(ii)对象序列(例如,异源对象序列)。在一些实施例中,含有重组酶活性的结构域和含有DNA结合功能的结构域是相同的结构域。例如,Gene Writer基因组编辑器蛋白可包含DNA结合结构域和重组酶结构域。在某些实施例中,Gene WriterTM基因编辑器多肽的元件可以源自重组酶多肽(例如,丝氨酸重组酶)的序列,例如,如本文所述,例如,如表3A、3B、或3C中所列。在一些实施例中,Gene Writer基因组编辑器与第二多肽组合。在一些实施例中,第二多肽源自重组酶多肽(例如,丝氨酸重组酶),例如,如本文所述,例如,如表3A、3B、或3C中所列。
Gene Writer基因编辑器系统的重组酶多肽组分
可用于本文所述的系统、细胞和方法的示例性重组酶多肽家族包括丝氨酸重组酶。通常,丝氨酸重组酶是催化两个识别序列之间的位点特异性重组的酶。这两个识别序列可以例如在同一核酸(例如,DNA)分子上,或可以存在于两个分开的核酸(例如,DNA)分子中。在一些实施例中,丝氨酸重组酶多肽包含重组酶N末端结构域(也称为催化结构域)、重组酶结构域和C末端锌带结构域。在一些实施例中,锌带结构域进一步包含卷曲螺旋基序。在一些实施例中,重组酶结构域和锌带结构域统称为C末端结构域。在一些实施例中,N末端结构域为50至250个氨基酸,或100-200个氨基酸,或130-170个氨基酸之间。在一些实施例中,C末端结构域是200-800个氨基酸,或300-500个氨基酸。在一些实施例中,重组酶结构域为50至150个氨基酸之间。在一些实施例中,锌带结构域为30至100个氨基酸之间。在一些实施例中,N末端结构域经由长螺旋(有时称为αE螺旋或接头)与重组酶结构域连接。在一些实施例中,重组酶结构域和锌带结构域经由短接头连接。丝氨酸重组酶以及重组酶多肽的非限制性实例列于表3A、3B或3C中。
在一些实施例中,重组的重组酶通过交换结构域来构建。在一些实施例中,重组酶N末端结构域可以与异源重组酶C末端结构域配对。在一些实施例中,催化结构域可以与异源重组酶结构域、锌带结构域、αE螺旋和/或短接头配对。在一些实施例中,C末端结构域可以包含异源重组酶结构域、锌带结构域、αE螺旋和/或短接头。在一些实施例中,重组酶多肽的DNA结合元件被异源DNA结合元件(例如锌指结构域、TAL结构域或基于Watson-crick的靶向结构域,例如CRISPR/Cas系统)修饰或替代。
在不希望受理论约束的情况下,丝氨酸重组酶利用短的特异性DNA序列(例如attP和attB),这些序列是识别序列的实例。在整合反应期间,重组酶以二聚体形式与attP和attB结合,介导位点的缔合以形成四聚体突触复合体,并催化链交换以整合DNA,形成新的识别序列位点attL和attR。新的识别位点attL和attR例如按5′至3′的顺序包含:attB5′-核心-attP3′,和attP5′-核心-attB3′。在不希望受理论约束的情况下,逆反应(其中通过attL和attR序列之间的位点特异性重组切除DNA)以降低的频率发生或不在没有重组定向因子(RDF)的情况下发生。这导致稳定整合,几乎没有或没有可检测到的重组酶介导的切除,即“单向”重组。
虽然不希望受机制描述的束缚,但重组酶催化的链交换典型地分两个步骤发生:(1)切割和(2)涉及在重组酶和一条或多条DNA链之间形成的共价蛋白质-DNA中间体的重新连接。重组酶通过二聚体形式与它们的DNA底物结合起作用,并通过蛋白质-蛋白质相互作用将位点聚集在一起以形成四聚体突触复合体。四个亚基中的每一个中的亲核丝氨酸的活化导致DNA切割,产生2nt 3′突出端和与凹陷的5′末端结合的瞬时磷酸丝氨酰键。DNA链交换通过亚基旋转发生。3′二核苷酸突出端与凹陷的5′碱基碱基配对,3′OH在切割反应的逆反应中攻击磷酸丝氨酰键以连接重组半位点。丝氨酸重组酶的结构、活性和生物学的进一步细节描述于以下参考文献中,这些参考文献通过引用并入:Smith MCM.2014.Phage-encoded serine integrases and other large serine recombinases.[噬菌体编码的丝氨酸整合酶和其他大型丝氨酸重组酶]Microbiol Spectrum[微生物谱]3(4):MDNA3-0059-2014;Rutherford K和Van Duyne G D.2014.The ins and outs of serine integrasesite-specific recombination.[丝氨酸整合酶位点特异性重组的细节]Current Opinionin Structural Biology[结构生物学新观点]24:125-131;Van Duyne G D和RutherfordK.2013.Large Serine Recombinase domain structure and attachment site binding.[大型丝氨酸重组酶结构域结构和附接位点结合]Critical Reviews in Biochemistryand Molecular Biology[生物化学与分子生物学评论]48(5):471-491。
本领域技术人员可以例如通过使用常规序列分析工具(如基本局部比对搜索工具(BLAST)或CD-搜索(CD-Search)(用于保守结构域分析)),来确定重组酶多肽(例如,丝氨酸重组酶)及其结构域的核酸和对应的多肽序列。其他序列分析工具是已知的并且可以在例如https://molbiol-tools.ca,例如在https://molbiol-tools.ca/Motifs.htm上找到。在一些实施例中,本文所述的丝氨酸重组酶包括丝氨酸重组酶的至少一个已知活性位点特征,例如,cd00338、cd03767、cd03768、cd03769、或cd03770。含有这些结构域的蛋白质可以另外通过在蛋白质数据库上搜索结构域来找到,例如InterPro(Mitchell等人NucleicAcids Res[核酸研究]47,D351-360(2019))、UniProt(The UniProt Consortium[UniProt协会]Nucleic Acids Res[核酸研究]47,D506-515(2019))、或保守结构域数据库(Lu等人Nucleic Acids Res[核酸研究]48,D265-268(2020)),或通过使用预测工具(例如InterProScan)扫描丝氨酸重组酶结构域的核酸序列的开放阅读框或全框翻译来找到。
虽然本披露提供了许多特定的丝氨酸重组酶序列,但是应当理解,本文所述的方法也可以用其他丝氨酸重组酶进行。例如,本文所述的组合物或方法可涉及具有选自例如cd00338、cd03767、cd03768、cd03769或cd03770的活性位点特征的丝氨酸重组酶。在一些实施例中,丝氨酸重组酶具有超过400个氨基酸的长度(例如,至少400、500、600、700、800、900或1000个氨基酸)。在一些实施例中,重组酶包含表3A-3C中任一个中所列的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或更多个结构域(例如,表3A-3C中任一个的单行中所列)。在一些实施例中,重组酶包含表4中所列的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或更多个结构域。在一些实施例中,用于鉴定重组酶的方法包括确定多肽是否包含表3A-3C中任一个中所列的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或更多个结构域(例如,表3A-3C中任一个的单行中所列)。在一些实施例中,鉴定重组酶的方法包括确定多肽是否包含表4中所列的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或更多个结构域。
示例性重组酶多肽
在一些实施例中,Gene WriterTM基因编辑器系统包含重组酶多肽(例如,丝氨酸重组酶多肽),例如,如本文所述。通常,重组酶多肽(例如,丝氨酸重组酶多肽)特异性结合核酸识别序列并在识别序列内的位点(例如,识别序列内的核心序列)处催化重组反应。在一些实施例中,重组酶多肽对识别序列或其部分(例如,其核心序列)与另一个核酸序列(例如,包含同源识别序列和任选地对象序列(例如,异源对象序列)的插入DNA)之间的重组进行催化。例如,重组酶多肽(例如,丝氨酸重组酶多肽)可以催化重组反应,使对象序列或其部分插入另一个核酸分子(例如,基因组DNA分子,例如,染色体或线粒体DNA)。
下表3A、3B或3C(参见Protseq列)提供了示例性重组酶多肽,例如丝氨酸重组酶(例如,丝氨酸整合酶)或其片段的氨基酸序列。表2A、2B或2C提供了在来源生物中编码示例性丝氨酸重组酶的核酸序列的侧翼核酸序列(分别参见标记为左区和右区的列);这些侧翼核酸序列中的一个或两个包含相应重组酶的天然识别序列或其部分(例如,包含attP位点或其部分)。表3A、3B或3C包含以前未被鉴定为丝氨酸重组酶的氨基酸序列,表2A、2B或2C包含以前未知其DNA识别序列的丝氨酸重组酶的相应侧翼核酸序列(以及由此的DNA识别序列)。来源序列的描述(参见表1A、1B或1C的描述列),重组酶的来源生物(参见表1A、1B或1C的生物列),重组酶的氨基酸序列的长度(参见表1A、1B或1C的蛋白质序列长度列),编码重组酶的核酸序列的基因组登录号(表1A、1B或1C的基因组登录列),重组酶的蛋白质登录号(表1A、1B或1C的蛋白质登录列)和重组酶编码序列(包括所示侧翼核酸序列)的基因组位置坐标(表1A、1B或1C的G开始和G终止列)如下给出。鉴定为存在于示例性重组酶序列中的结构域也基于氨基酸序列的InterPro分析鉴定(参见表3A、3B或3C的结构域列)。参见,例如https://omictools.com/interpro-tool。表4中提供了结构域命名的简要说明。表1A、1B或1C中每个登录号的氨基酸序列和基因组序列通过引用以其全文并入本文。出现在表2A、2B或2C中列出的侧翼核酸序列中的每个天然识别序列或其部分可包含以下中的一种、两种或三种:(i)第一副回文序列,(ii)核心序列,和/或(iii)第二副回文序列,其中第一和第二副回文序列相对于彼此是副回文的。
在一些实施例中,当选择成对的副回文序列时,本文披露的表的使用者基于在具有彼此相同行号的行中披露的序列来选择每个序列。例如,在一些实施例中,包含含有第一副回文序列和第二副回文序列的DNA识别序列的细胞将包含与表2A、2B或2C的同一行中披露的序列相关的第一和第二副回文序列。在一些实施例中,当选择与示例性重组酶多肽一起使用的DNA识别序列(例如,副回文序列)时,DNA识别序列(例如,副回文序列)选自或涉及与示例性重组酶多肽具有相同行号的行中的序列。
Figure BDA0003761233040000501
Figure BDA0003761233040000511
Figure BDA0003761233040000521
Figure BDA0003761233040000531
Figure BDA0003761233040000541
Figure BDA0003761233040000551
Figure BDA0003761233040000561
Figure BDA0003761233040000571
Figure BDA0003761233040000581
Figure BDA0003761233040000591
Figure BDA0003761233040000601
Figure BDA0003761233040000611
Figure BDA0003761233040000621
Figure BDA0003761233040000631
Figure BDA0003761233040000641
Figure BDA0003761233040000651
Figure BDA0003761233040000661
Figure BDA0003761233040000671
Figure BDA0003761233040000681
Figure BDA0003761233040000691
Figure BDA0003761233040000701
Figure BDA0003761233040000711
Figure BDA0003761233040000721
Figure BDA0003761233040000731
Figure BDA0003761233040000741
Figure BDA0003761233040000751
Figure BDA0003761233040000761
Figure BDA0003761233040000771
Figure BDA0003761233040000781
Figure BDA0003761233040000791
Figure BDA0003761233040000801
Figure BDA0003761233040000811
Figure BDA0003761233040000821
Figure BDA0003761233040000831
Figure BDA0003761233040000841
Figure BDA0003761233040000851
Figure BDA0003761233040000861
Figure BDA0003761233040000871
Figure BDA0003761233040000881
Figure BDA0003761233040000891
Figure BDA0003761233040000901
Figure BDA0003761233040000911
Figure BDA0003761233040000921
Figure BDA0003761233040000931
Figure BDA0003761233040000941
Figure BDA0003761233040000951
Figure BDA0003761233040000961
Figure BDA0003761233040000971
Figure BDA0003761233040000981
Figure BDA0003761233040000991
Figure BDA0003761233040001001
Figure BDA0003761233040001011
Figure BDA0003761233040001021
Figure BDA0003761233040001031
Figure BDA0003761233040001041
Figure BDA0003761233040001051
Figure BDA0003761233040001061
Figure BDA0003761233040001071
Figure BDA0003761233040001081
Figure BDA0003761233040001091
Figure BDA0003761233040001101
Figure BDA0003761233040001111
Figure BDA0003761233040001121
Figure BDA0003761233040001131
Figure BDA0003761233040001141
Figure BDA0003761233040001151
Figure BDA0003761233040001161
Figure BDA0003761233040001171
Figure BDA0003761233040001181
Figure BDA0003761233040001191
Figure BDA0003761233040001201
Figure BDA0003761233040001211
Figure BDA0003761233040001221
Figure BDA0003761233040001231
Figure BDA0003761233040001241
Figure BDA0003761233040001251
Figure BDA0003761233040001261
Figure BDA0003761233040001271
Figure BDA0003761233040001281
Figure BDA0003761233040001291
Figure BDA0003761233040001301
Figure BDA0003761233040001311
Figure BDA0003761233040001321
Figure BDA0003761233040001331
Figure BDA0003761233040001341
Figure BDA0003761233040001351
Figure BDA0003761233040001361
Figure BDA0003761233040001371
Figure BDA0003761233040001381
Figure BDA0003761233040001391
Figure BDA0003761233040001401
Figure BDA0003761233040001411
Figure BDA0003761233040001421
Figure BDA0003761233040001431
Figure BDA0003761233040001441
Figure BDA0003761233040001451
Figure BDA0003761233040001461
Figure BDA0003761233040001471
Figure BDA0003761233040001481
Figure BDA0003761233040001491
Figure BDA0003761233040001501
Figure BDA0003761233040001511
Figure BDA0003761233040001521
Figure BDA0003761233040001531
Figure BDA0003761233040001541
Figure BDA0003761233040001551
Figure BDA0003761233040001561
Figure BDA0003761233040001571
Figure BDA0003761233040001581
Figure BDA0003761233040001591
Figure BDA0003761233040001601
Figure BDA0003761233040001611
Figure BDA0003761233040001621
Figure BDA0003761233040001631
Figure BDA0003761233040001641
Figure BDA0003761233040001651
Figure BDA0003761233040001661
Figure BDA0003761233040001671
Figure BDA0003761233040001681
Figure BDA0003761233040001691
Figure BDA0003761233040001701
Figure BDA0003761233040001711
Figure BDA0003761233040001721
Figure BDA0003761233040001731
Figure BDA0003761233040001741
Figure BDA0003761233040001751
Figure BDA0003761233040001761
Figure BDA0003761233040001771
Figure BDA0003761233040001781
Figure BDA0003761233040001791
Figure BDA0003761233040001801
Figure BDA0003761233040001811
Figure BDA0003761233040001821
Figure BDA0003761233040001831
Figure BDA0003761233040001841
Figure BDA0003761233040001851
Figure BDA0003761233040001861
Figure BDA0003761233040001871
Figure BDA0003761233040001881
Figure BDA0003761233040001891
Figure BDA0003761233040001901
Figure BDA0003761233040001911
Figure BDA0003761233040001921
Figure BDA0003761233040001931
Figure BDA0003761233040001941
Figure BDA0003761233040001951
Figure BDA0003761233040001961
Figure BDA0003761233040001971
Figure BDA0003761233040001981
Figure BDA0003761233040001991
Figure BDA0003761233040002001
Figure BDA0003761233040002011
Figure BDA0003761233040002021
Figure BDA0003761233040002031
Figure BDA0003761233040002041
Figure BDA0003761233040002051
Figure BDA0003761233040002061
Figure BDA0003761233040002071
Figure BDA0003761233040002081
Figure BDA0003761233040002091
Figure BDA0003761233040002101
Figure BDA0003761233040002111
Figure BDA0003761233040002121
Figure BDA0003761233040002131
Figure BDA0003761233040002141
Figure BDA0003761233040002151
Figure BDA0003761233040002161
Figure BDA0003761233040002171
Figure BDA0003761233040002181
Figure BDA0003761233040002191
Figure BDA0003761233040002201
Figure BDA0003761233040002211
Figure BDA0003761233040002221
Figure BDA0003761233040002231
Figure BDA0003761233040002241
Figure BDA0003761233040002251
Figure BDA0003761233040002261
Figure BDA0003761233040002271
Figure BDA0003761233040002281
Figure BDA0003761233040002291
Figure BDA0003761233040002301
Figure BDA0003761233040002311
Figure BDA0003761233040002321
Figure BDA0003761233040002331
Figure BDA0003761233040002341
Figure BDA0003761233040002351
Figure BDA0003761233040002361
Figure BDA0003761233040002371
Figure BDA0003761233040002381
Figure BDA0003761233040002391
Figure BDA0003761233040002401
Figure BDA0003761233040002411
Figure BDA0003761233040002421
Figure BDA0003761233040002431
Figure BDA0003761233040002441
Figure BDA0003761233040002451
Figure BDA0003761233040002461
Figure BDA0003761233040002471
Figure BDA0003761233040002481
Figure BDA0003761233040002491
Figure BDA0003761233040002501
Figure BDA0003761233040002511
Figure BDA0003761233040002521
Figure BDA0003761233040002531
Figure BDA0003761233040002541
Figure BDA0003761233040002551
Figure BDA0003761233040002561
Figure BDA0003761233040002571
Figure BDA0003761233040002581
Figure BDA0003761233040002591
Figure BDA0003761233040002601
Figure BDA0003761233040002611
Figure BDA0003761233040002621
Figure BDA0003761233040002631
Figure BDA0003761233040002641
Figure BDA0003761233040002651
Figure BDA0003761233040002661
Figure BDA0003761233040002671
Figure BDA0003761233040002681
Figure BDA0003761233040002691
Figure BDA0003761233040002701
Figure BDA0003761233040002711
Figure BDA0003761233040002721
Figure BDA0003761233040002731
Figure BDA0003761233040002741
Figure BDA0003761233040002751
Figure BDA0003761233040002761
Figure BDA0003761233040002771
Figure BDA0003761233040002781
Figure BDA0003761233040002791
Figure BDA0003761233040002801
Figure BDA0003761233040002811
Figure BDA0003761233040002821
Figure BDA0003761233040002831
Figure BDA0003761233040002841
Figure BDA0003761233040002851
Figure BDA0003761233040002861
Figure BDA0003761233040002871
Figure BDA0003761233040002881
Figure BDA0003761233040002891
Figure BDA0003761233040002901
Figure BDA0003761233040002911
Figure BDA0003761233040002921
Figure BDA0003761233040002931
Figure BDA0003761233040002941
Figure BDA0003761233040002951
Figure BDA0003761233040002961
Figure BDA0003761233040002971
Figure BDA0003761233040002981
Figure BDA0003761233040002991
Figure BDA0003761233040003001
Figure BDA0003761233040003011
Figure BDA0003761233040003021
Figure BDA0003761233040003031
Figure BDA0003761233040003041
Figure BDA0003761233040003051
Figure BDA0003761233040003061
Figure BDA0003761233040003071
Figure BDA0003761233040003081
Figure BDA0003761233040003091
Figure BDA0003761233040003101
Figure BDA0003761233040003111
Figure BDA0003761233040003121
Figure BDA0003761233040003131
Figure BDA0003761233040003141
Figure BDA0003761233040003151
Figure BDA0003761233040003161
Figure BDA0003761233040003171
Figure BDA0003761233040003181
Figure BDA0003761233040003191
Figure BDA0003761233040003201
Figure BDA0003761233040003211
Figure BDA0003761233040003221
Figure BDA0003761233040003231
Figure BDA0003761233040003241
Figure BDA0003761233040003251
Figure BDA0003761233040003261
Figure BDA0003761233040003271
Figure BDA0003761233040003281
Figure BDA0003761233040003291
Figure BDA0003761233040003301
Figure BDA0003761233040003311
Figure BDA0003761233040003321
Figure BDA0003761233040003331
Figure BDA0003761233040003341
Figure BDA0003761233040003351
Figure BDA0003761233040003361
Figure BDA0003761233040003371
Figure BDA0003761233040003381
Figure BDA0003761233040003391
Figure BDA0003761233040003401
Figure BDA0003761233040003411
Figure BDA0003761233040003421
Figure BDA0003761233040003431
Figure BDA0003761233040003441
Figure BDA0003761233040003451
Figure BDA0003761233040003461
Figure BDA0003761233040003471
Figure BDA0003761233040003481
Figure BDA0003761233040003491
Figure BDA0003761233040003501
Figure BDA0003761233040003511
Figure BDA0003761233040003521
Figure BDA0003761233040003531
Figure BDA0003761233040003541
Figure BDA0003761233040003551
Figure BDA0003761233040003561
Figure BDA0003761233040003571
Figure BDA0003761233040003581
Figure BDA0003761233040003591
Figure BDA0003761233040003601
Figure BDA0003761233040003611
Figure BDA0003761233040003621
Figure BDA0003761233040003631
Figure BDA0003761233040003641
Figure BDA0003761233040003651
Figure BDA0003761233040003661
Figure BDA0003761233040003671
Figure BDA0003761233040003681
Figure BDA0003761233040003691
Figure BDA0003761233040003701
Figure BDA0003761233040003711
Figure BDA0003761233040003721
Figure BDA0003761233040003731
Figure BDA0003761233040003741
Figure BDA0003761233040003751
Figure BDA0003761233040003761
Figure BDA0003761233040003771
Figure BDA0003761233040003781
Figure BDA0003761233040003791
Figure BDA0003761233040003801
Figure BDA0003761233040003811
Figure BDA0003761233040003821
Figure BDA0003761233040003831
Figure BDA0003761233040003841
Figure BDA0003761233040003851
Figure BDA0003761233040003861
Figure BDA0003761233040003871
Figure BDA0003761233040003881
Figure BDA0003761233040003891
Figure BDA0003761233040003901
Figure BDA0003761233040003911
Figure BDA0003761233040003921
Figure BDA0003761233040003931
Figure BDA0003761233040003941
Figure BDA0003761233040003951
Figure BDA0003761233040003961
Figure BDA0003761233040003971
Figure BDA0003761233040003981
Figure BDA0003761233040003991
Figure BDA0003761233040004001
Figure BDA0003761233040004011
Figure BDA0003761233040004021
Figure BDA0003761233040004031
Figure BDA0003761233040004041
Figure BDA0003761233040004051
Figure BDA0003761233040004061
Figure BDA0003761233040004071
Figure BDA0003761233040004081
Figure BDA0003761233040004091
Figure BDA0003761233040004101
Figure BDA0003761233040004111
Figure BDA0003761233040004121
Figure BDA0003761233040004131
Figure BDA0003761233040004141
Figure BDA0003761233040004151
Figure BDA0003761233040004161
Figure BDA0003761233040004171
Figure BDA0003761233040004181
Figure BDA0003761233040004191
Figure BDA0003761233040004201
Figure BDA0003761233040004211
Figure BDA0003761233040004221
Figure BDA0003761233040004231
Figure BDA0003761233040004241
Figure BDA0003761233040004251
Figure BDA0003761233040004261
Figure BDA0003761233040004271
Figure BDA0003761233040004281
Figure BDA0003761233040004291
Figure BDA0003761233040004301
Figure BDA0003761233040004311
Figure BDA0003761233040004321
Figure BDA0003761233040004331
Figure BDA0003761233040004341
Figure BDA0003761233040004351
Figure BDA0003761233040004361
Figure BDA0003761233040004371
Figure BDA0003761233040004381
Figure BDA0003761233040004391
Figure BDA0003761233040004401
Figure BDA0003761233040004411
Figure BDA0003761233040004421
Figure BDA0003761233040004431
Figure BDA0003761233040004441
Figure BDA0003761233040004451
Figure BDA0003761233040004461
Figure BDA0003761233040004471
Figure BDA0003761233040004481
Figure BDA0003761233040004491
Figure BDA0003761233040004501
Figure BDA0003761233040004511
Figure BDA0003761233040004521
Figure BDA0003761233040004531
Figure BDA0003761233040004541
Figure BDA0003761233040004551
Figure BDA0003761233040004561
Figure BDA0003761233040004571
Figure BDA0003761233040004581
Figure BDA0003761233040004591
Figure BDA0003761233040004601
Figure BDA0003761233040004611
Figure BDA0003761233040004621
Figure BDA0003761233040004631
Figure BDA0003761233040004641
Figure BDA0003761233040004651
Figure BDA0003761233040004661
Figure BDA0003761233040004671
Figure BDA0003761233040004681
Figure BDA0003761233040004691
Figure BDA0003761233040004701
Figure BDA0003761233040004711
Figure BDA0003761233040004721
Figure BDA0003761233040004731
Figure BDA0003761233040004741
Figure BDA0003761233040004751
Figure BDA0003761233040004761
Figure BDA0003761233040004771
Figure BDA0003761233040004781
Figure BDA0003761233040004791
Figure BDA0003761233040004801
Figure BDA0003761233040004811
Figure BDA0003761233040004821
Figure BDA0003761233040004831
Figure BDA0003761233040004841
Figure BDA0003761233040004851
Figure BDA0003761233040004861
Figure BDA0003761233040004871
Figure BDA0003761233040004881
Figure BDA0003761233040004891
Figure BDA0003761233040004901
Figure BDA0003761233040004911
Figure BDA0003761233040004921
Figure BDA0003761233040004931
Figure BDA0003761233040004941
Figure BDA0003761233040004951
Figure BDA0003761233040004961
Figure BDA0003761233040004971
Figure BDA0003761233040004981
Figure BDA0003761233040004991
Figure BDA0003761233040005001
Figure BDA0003761233040005011
Figure BDA0003761233040005021
Figure BDA0003761233040005031
Figure BDA0003761233040005041
Figure BDA0003761233040005051
Figure BDA0003761233040005061
Figure BDA0003761233040005071
Figure BDA0003761233040005081
Figure BDA0003761233040005091
Figure BDA0003761233040005101
Figure BDA0003761233040005111
Figure BDA0003761233040005121
Figure BDA0003761233040005131
Figure BDA0003761233040005141
Figure BDA0003761233040005151
Figure BDA0003761233040005161
Figure BDA0003761233040005171
Figure BDA0003761233040005181
Figure BDA0003761233040005191
Figure BDA0003761233040005201
Figure BDA0003761233040005211
Figure BDA0003761233040005221
Figure BDA0003761233040005231
Figure BDA0003761233040005241
Figure BDA0003761233040005251
Figure BDA0003761233040005261
Figure BDA0003761233040005271
Figure BDA0003761233040005281
Figure BDA0003761233040005291
Figure BDA0003761233040005301
Figure BDA0003761233040005311
Figure BDA0003761233040005321
Figure BDA0003761233040005331
Figure BDA0003761233040005341
Figure BDA0003761233040005351
在一些实施例中,包含表2A的第329行的左区核酸序列的序列(例如,包含SEQ IDNO:290的核酸序列的序列)包含以下核酸序列:TCAAAGGTTGATGTTACTGCTGATAATGTAGATATCATATTTAAATTCCAACTCGCTTAATTGCGAGTTTTTATTTCGTTTATTTCAATTAAGGTAACTAAAAAACTCCTTTTAAGGAGTTTCTGTAATCAATTAATTTCTTCAATATATTTTATTTGGTCCCATAGTTCATCAGTTATCTCATGCATAGAAGGTTTTTGTTTTGTTTGTATTAGATATCCTTTCTCCTTAAGCATGTTAACTACTTTCTTTAGTTTCTG(SEQID NO:3800)。
在一些实施例中,包含表2A的第524行的左区核酸序列的序列(例如,包含SEQ IDNO:470的核酸序列的序列)包含以下核酸序列:TTAATTAAAAAAATAGACGTATGGAACGATAATAAAATTAAGATCCACTGGAATATTTAATTTTTTAGGCGCTTTACGCCTTTTTTCGTATATTAGGTATTTCCAATTGAAACCGGTTATATCTAATATACGAAATTATACAACAAAAAGCCCCAGTGACCATTGCATAATCTGCAACAACCACTAGGGCTAAATTTTTATTGACGTTGTGAGTAAACAACTGAATTGAGTTGCTGTTGGTTAACACCATTGGCAATATC(SEQID NO:3801)。
在一些实施例中,重组酶识别位点(例如,如本文所述)包含attB序列。在一些实施例中,重组酶识别位点(例如,如本文所述)包含attP序列。在一些实施例中,重组酶识别位点(例如,如本文所述)包含attB序列和attP序列。在实施例中,attB序列选自表4X中列出的序列。在实施例中,attP序列选自表4X中列出的序列。在一些实施例中,重组酶识别位点(例如,如本文所述)包含attB序列和attP序列,其中这些attB和attP序列各自包含表4X的单行中列出的序列。
在一些实施例中,DNA识别序列(例如,如本文所述)包含attB序列。在一些实施例中,DNA识别序列(例如,如本文所述)包含attP序列。在一些实施例中,DNA识别序列(例如,如本文所述)包含attB序列和attP序列。在实施例中,attB序列选自表4X中列出的序列。在实施例中,attP序列选自表4X中列出的序列。在一些实施例中,DNA识别序列(例如,如本文所述)包含attB序列和attP序列,其中这些attB和attP序列各自包含表4X的单行中列出的序列。
在一些实施例中,重组酶多肽(例如,包含在如本文所述的系统或细胞中)包含如表3A、3B或3C中列出的氨基酸序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在一些实施例中,重组酶多肽(例如,包含在如本文所述的系统或细胞中)或其部分与如表3A,3B或3C中列出的重组酶结构域、DNA识别结构域(例如,结合或能够结合识别位点,例如,如本文所述)、重组酶N末端结构域(也称为催化结构域)、锌带结构域、锌带结构域的卷曲螺旋基序或重组酶多肽的C末端结构域(例如,重组酶结构域和锌带结构域)的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。在一些实施例中,重组酶多肽(例如,包含在如本文所述的系统或细胞中)具有包含如表3A、3B或3C中列出的氨基酸序列或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的重组酶多肽的DNA结合活性和/或重组酶活性中的一种或多种。
在一些实施例中,插入DNA(例如,包含在如本文所述的系统或细胞中)包含出现在如下核苷酸序列内的核酸识别序列,该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的核苷酸序列,或相对于其具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入或缺失)的核酸序列。在一些实施例中,插入DNA(例如,包含在如本文所述的系统或细胞中)包含出现在如下核苷酸序列内的一个或多个(例如,两个)副回文序列,该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列内,或与所述副回文序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的核酸序列,或相对于所述副回文区具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入或缺失)的核酸序列。在一些实施例中,插入DNA(例如,包含在如本文所述的系统或细胞中)包含出现在如下核苷酸序列内的核酸识别序列的间隔子(例如,核心序列),该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核酸序列,或相对于其具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入或缺失)的核酸序列。在某些实施例中,插入DNA进一步包含异源对象序列。
在一些实施例中,插入DNA(例如,包含在如本文所述的系统或细胞中)包含出现在如下核苷酸序列内的核酸识别序列,该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核酸序列,或相对于其具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入或缺失)的核酸序列,该核酸识别序列与假识别序列(例如,人识别序列)同源。
在一些实施例中,用于本文所述的组合物或方法的插入DNA或重组酶多肽引导异源对象序列插入安全港评分为至少3、4、5、6、7、或8的位置。
在某些实施例中,插入DNA与人DNA识别序列之间的重组导致整合的核酸分子的形成,该整合的核酸分子包含位于整合序列(例如,异源对象序列)侧翼的两个识别序列。在不希望受理论约束的情况下,丝氨酸重组酶促进包含attB和attP位点的识别序列之间的重组,并且通过重组形成包含attL和attR位点的识别序列,例如整合序列的侧翼。虽然丝氨酸重组酶可以识别例如结合到attL或attR位点,但丝氨酸重组酶将不会明显地(例如不会)促进使用attL或attR位点的重组(例如,在不存在另外的因子的情况下)。attL和attR位点包括产生它们的attP和attB位点的重组部分。在某些实施例中,与以下中的一个或多个(例如,以下中的一个、两个或全部三个)相比,整合的核酸分子的两个重组后识别序列中的一个或两个包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、或更多个错配:(i)天然识别序列,(ii)插入DNA上的识别序列,和/或(iii)假识别序列(例如,人DNA识别序列)。在实施例中,与天然识别序列相比,整合的核酸分子的两个重组后识别序列中的一个或两个包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、或更多个错配。在一些实施例中,错配存在于核心序列中。考虑到,在一些实施例中,与重组酶对一个或多个识别序列天然识别序列、插入DNA识别序列和/或人DNA识别序列的结合和/或活性相比,整合的核酸分子的一个或多个识别序列与天然识别序列、插入DNA识别序列和/或人DNA识别序列之间的这些差异导致重组酶多肽与整合的核酸分子的识别序列之间的结合亲和力降低和/或重组酶多肽对整合的核酸分子的识别序列的重组酶活性降低(例如消除)。
在一些实施例中,假识别序列(例如,人DNA识别序列)位于基因组安全港位点中或附近(例如,在基因组安全港位点的1、2、3、4、5、10、15、20、30、40、50、75、100、150、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、或10,000个核苷酸内)。在一些实施例中,假识别序列(例如,人识别序列)位于基因组中某一位置,该位置满足以下标准中的1、2、3、4、5、6、7、8或9项:(i)距癌症相关基因>300kb;(ii)距miRNA/其他功能性小RNA>300kb;(iii)距5'基因末端>50kb;(iv)距复制起点>50kb;(v)距任何极保守元件>50kb;(vi)转录活性低(即无mRNA+/-25kb);(vii)不在拷贝数可变区中;(viii)在开放染色质中;和/或(ix)是唯一的,在人基因组中有1个拷贝。
在实施例中,如本文所述的细胞或系统包含以下中的一项或多项(例如,1、2、或3项):(i)表3A、3B、或3C或3B的行号X的行中列出的重组酶多肽(其中X是数字1至表3A、3B、或3C的最大行号),或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列;(ii)插入DNA,其包含出现在如下核苷酸序列内的DNA识别序列,该核苷酸序列为表2A、2B、或2C的具有行号X的行的左区列或右区列中的核苷酸序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核酸序列,或相对于其具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入、或与缺失)的核酸序列,任选地其中该插入DNA进一步包含对象序列(例如,异源对象序列);和/或(iii)基因组,其包含出现在如下序列中的假识别序列(例如,人识别序列)的序列,该序列为表2A、2B或2C的左区列或右区列的序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的核酸序列,或相对于所述副回文区具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入或缺失)的核酸序列。
在一些实施例中,重组酶识别位点,例如attB、attP、attL或attR位点,可以通过可用的软件工具预测。在一些实施例中,识别位点可通过噬菌体预测工具预测,例如PhiSpy(Akhter等人Nucleic Acids Res[核酸研究]40(16):e126(2012))或PHASTER(Arndt等人Nucleic Acids Res[核酸研究]44:W16-W21(2016)),其通过引用并入本文。在一些实施例中,在其天然背景下(例如在细菌噬菌体基因组、质粒或细菌基因组中)接近整合酶编码序列的区域(例如表2A、2B或2C的左区或右区)包含重组酶的天然附接位点。在一些实施例中,最小附接位点可通过测试整合酶近端序列(例如表2A、2B或2C的左区或右区)的片段凭经验发现,直到发现足以用于生产性重组反应的最小序列。在一些实施例中,分析整合酶近端序列(例如表2A、2B或2C的左区或右区)或其片段以确定各核苷酸的重要性,例如根据通过引用以其全文并入本文的Bessen等人Nat Commun[自然通讯]10:1937(2019)的方法以文库格式进行分析。在一些实施例中,通过用于改变的蛋白质-核酸相互作用特性的进化过程选择重组酶或重组酶识别位点,例如,Gene Writer系统中使用的重组酶如通过引用以其全文并入本文的WO 2017015545中所述进化。在一些实施例中,重组酶和/或重组酶识别位点通过预测天然宿主基因组中的整合元件(例如,整合的细菌噬菌体或整合的质粒)的末端来发现,例如,如通过引用以其全文并入本文的Yang等人Nat Methods[自然方法]11(12):1261-1266(2014)中所述。
在一些实施例中,attL或attR位点存在于人基因组中且模板DNA包含同源位点,例如,如果基因组包含attL序列,则模板包含attR序列。在一些实施例中,当在Gene Writing系统中使用attL/R识别位点时,该系统还包含重组定向因子(RDF),以能够识别和重组这些位点。在一些实施例中,Gene Writer多肽和同源RDF作为融合多肽提供。示例性重组酶-RDF融合描述于通过引用以其全文并入本文的Olorunniji等人Nucleic Acids Res[核酸研究]45(14):8635-8645(2017)中。
在一些实施例中,如本文所述的Gene WritingTM系统的一种或多种蛋白质组分可以与模板(例如,DNA模板)预先缔合。例如,在一些实施例中,可以首先将Gene WriterTM多肽与DNA模板组合以形成脱氧核糖核蛋白(DNP)复合物。在一些实施例中,DNP可经由例如转染、核转染、病毒、囊泡、LNP、外泌体、融合体递送至细胞。在一些实施例中,模板DNA可以首先与DNA弯曲因子例如HMGB1缔合,以便在随后与转座酶组分接触时促进切除和转座。有关DNP递送的另外的描述例如在以下中找到:Guha和Calos J Mol Biol[分子生物学杂志](2020),该文献通过引用以其全文并入本文。
在一些实施例中,本文所述的多肽包含一个或多个(例如,2、3、4、5个)核靶向序列,例如核定位序列(NLS)。在一些实施例中,NLS是两组分NLS。在一些实施例中,NLS促进了包含NLS的蛋白质导入到细胞核中。在一些实施例中,将NLS与本文所述的Gene Writer的N末端融合。在一些实施例中,将NLS与Gene Writer的C末端融合。在一些实施例中,将NLS与Cas结构域的N末端或C末端融合。在一些实施例中,在NLS与Gene Writer的邻近结构域之间布置接头序列。
在一些实施例中,NLS包含氨基酸序列MDSLLMNRRKFLYQFKNVRWAKGRRETYLC(SEQ IDNO:3432)、PKKRKVEGADKRTADGSEFESPKKKRKV(SEQ ID NO:3433)、RKSGKIAAIWKRPRKPKKKRKVKRTADGSEFESPKKKRKV(SEQ ID NO:3434)、KKTELQTTNAENKTKKL(SEQ ID NO:3435)、或KRGINDRNFWRGENGRKTR(SEQ ID NO:3436)、KRPAATKKAGQAKKKK(SEQ ID NO:3437),或其功能性片段或变体。示例性NLS序列还描述于PCT/EP2000/011690中,该专利的内容针对其对示例性核定位序列的披露通过引用并入本文。
在一些实施例中,NLS是两组分NLS。两组分NLS典型地包含由间隔子序列(其长度可以是例如约10个氨基酸)间隔开的两个碱性氨基酸簇。单组分NLS典型地缺乏间隔子。两组分NLS的实例是核浆素NLS,具有序列KR[PAATKKAGQA]KKKK(SEQ ID NO:3437),其中间隔子置于括号内。另一个示例性两组分NLS具有序列PKKKRKVEGADKRTADGSEFESPKKKRKV(SEQID NO:3438)。示例性NLS描述于国际申请WO 2020051561中,该申请通过引用以其全文并入本文,包括其关于核定位序列的披露。
DNA结合结构域
在一些实施例中,重组酶多肽(例如,如本文所述的系统或细胞中包含的重组酶多肽),例如酪氨酸重组酶,包含DNA结合结构域(例如,靶结合结构域或模板结合结构域)。
在一些实施例中,本文所述的重组酶多肽可被重新定向至人基因组中的确定的靶位点。在一些实施例中,可以将本文所述的重组酶与异源结构域(例如,异源DNA结合结构域)融合。在一些实施例中,可以将重组酶与异源DNA结合结构域(例如,来自锌指、TAL、大范围核酸酶、转录因子或序列指导的DNA结合元件的DNA结合结构域)融合。在一些实施例中,可以将重组酶与来自序列指导的DNA结合元件(例如,CRISPR相关的(Cas)DNA结合元件,例如,Cas9)的DNA结合结构域融合。在一些实施例中,与重组酶结构域融合的DNA结合元件可以含有使其他催化功能失活的突变,例如,使内切核酸酶活性失活的突变,例如,产生失活的大范围核酸酶或部分或完全失活的Cas蛋白的突变,例如,产生切口酶Cas9或失活Cas9(dCas9)的突变。例如,Standage-Beier等人CRISPR J[CRISPR杂志]2(4):209-222(2019)描述了使用与Tn3解离酶(整合酶Cas9、iCas9)融合的dCas9,该酶在靶位点处采用两个单体融合蛋白的适当间隔,用于协同靶向将报告系统序列特异性整合到HEK293细胞的基因组中。通过DNA结合结构域靶向重组酶的另外的实例包括锌指融合物(锌指重组酶,ZFR(Gaj等人Nucleic Acids Res[核酸研究]41(6):3937-3946(2013));RecZF(Gersbach等人NucleicAcids Res[核酸研究]38(12):4198-4206(2010)))、TALE融合物(TALE重组酶,TALER(Mercer等人Nucleic Acids Res[核酸研究]40(21):11163-11172(2012)))、和dCas9融合物(重组酶Cas9,recCas9(Chaikind等人Nucleic Acids Res[核酸研究]44(20):9758-9770(2016));整合酶Cas9,iCas9(Standage-Beier等人CRISPR J[CRISPR杂志]2(4):209-222(2019))),所有这些文献通过引用并入本文。
在一些实施例中,DNA结合结构域包含酿脓链球菌(Streptococcus pyogenes)Cas9(SpCas9)或其功能性片段或变体。在一些实施例中,DNA结合结构域包含经修饰的SpCas9。在实施例中,经修饰的SpCas9包含改变了原间隔子邻近基序(PAM)特异性的修饰。在实施例中,PAM对核酸序列5’-NGT-3’具有特异性。在实施例中,经修饰的SpCas9包含例如在位置L1111、D1135、G1218、E1219、A1322、或R1335中的一个或多个处的一个或多个氨基酸取代,例如,该一个或多个氨基酸取代选自L1111R、D1135V、G1218R、E1219F、A1322R、R1335V。在实施例中,经修饰的SpCas9包含氨基酸取代T1337R和一个或多个另外的氨基酸取代,例如,该一个或多个另外的氨基酸取代选自L1111、D1135L、S1136R、G1218S、E1219V、D1332A、D1332S、D1332T、D1332V、D1332L、D1332K、D1332R、R1335Q、T1337、T1337L、T1337Q、T1337I、T1337V、T1337F、T1337S、T1337N、T1337K、T1337H、T1337Q、和T1337M,或其对应的氨基酸取代。在实施例中,经修饰的SpCas9包含:(i)一个或多个氨基酸取代,其选自D1135L、S1136R、G1218S、E1219V、A1322R、R1335Q、和T1337;以及(ii)一个或多个氨基酸取代,其选自L1111R、G1218R、E1219F、D1332A、D1332S、D1332T、D1332V、D1332L、D1332K、D1332R、T1337L、T1337I、T1337V、T1337F、T1337S、T1337N、T1337K、T1337R、T1337H、T1337Q、和T1337M,或这些所列举氨基酸取代的对应的氨基酸取代。
在一些实施例中,DNA结合结构域包含Cas结构域、例如Cas9结构域。在实施例中,DNA结合结构域包含核酸酶活性Cas结构域、Cas切口酶(nCas)结构域、或核酸酶非活性Cas(dCas)结构域。在实施例中,DNA结合结构域包含核酸酶活性Cas9结构域、Cas9切口酶(nCas9)结构域、或核酸酶非活性Cas9(dCas9)结构域。在一些实施例中,DNA结合结构域包含Cas9(例如,dCas9和nCas9)的Cas9结构域、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、或Cas12i。在一些实施例中,DNA结合结构域包含Cas9(例如,dCas9和nCas9)、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、或Cas12i。在一些实施例中,DNA结合结构域包含酿脓链球菌或嗜热链球菌(S.thermophilus)Cas9或其功能性片段。在一些实施例中,DNA结合结构域包含Cas9序列,例如,如Chylinski,Rhun,和Charpentier(2013)RNA Biology[RNA生物学]10:5,726-737中所述;该文献通过引用并入本文。在一些实施例中,DNA结合结构域包含Cas(例如,Cas9,例如,如本文所述)的HNH核酸酶亚结构域和/或RuvC1亚结构域,或其变体。在一些实施例中,DNA结合结构域包含Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、或Cas12i。在一些实施例中,DNA结合结构域包含Cas多肽(例如,酶)或其功能性片段。在实施例中,Cas多肽(例如,酶)选自Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas8a、Cas8b、Cas8c、Cas9(例如,Csn1或Csx12)、Cas10、Cas10d、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csx11、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、II型Cas效应子蛋白、V型Cas效应子蛋白、VI型Cas效应子蛋白、CARF、DinG、Cpf1、Cas12b/C2c1、Cas12c/C2c3、Cas12b/C2c1、Cas12c/C2c3、SpCas9(K855A)、eSpCas9(1.1)、SpCas9-HF1、超精确的Cas9变体(HypaCas9)、其同源物、其经修饰的或经工程化的版本、和/或其功能性片段。在实施例中,Cas9包含例如选自H840A、D10A、P475A、W476A、N477A、D1125A、W1126A、和D1127A的一个或多个取代。在实施例中,Cas9包含在选自以下的位置处的一个或多个突变:D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、和/或A987,例如,选自D10A、G12A、G17A、E762A、H840A、N854A、N863A、H982A、H983A、A984A、和/或D986A的一个或多个取代。在一些实施例中,DNA结合结构域包含来自溃疡棒状杆菌(Corynebacteriumulcerans)、白喉棒状杆菌(Corynebacterium diphtheria)、食蚜螺菌(Spiroplasmasyrphidicola)、中间普雷沃菌(Prevotella intermedia)、台湾螺原体(Spiroplasmataiwanense)、鱼型链球菌(Streptococcus iniae)、波罗的海贝尔氏菌(Belliellabaltica)、扭曲冷弯曲菌(Psychroflexus torquis)、嗜热链球菌、英诺克李斯特菌(Listeria innocua)、空肠弯曲菌(Campylobacter jejuni)、脑膜炎奈瑟菌(Neisseriameningitidis)、酿脓链球菌、或金黄色葡萄球菌(Staphylococcus aureus)的Cas(例如,Cas9)序列、或其片段或变体。
在一些实施例中,DNA结合结构域包含例如包含一个或多个取代(例如,在位置D917、E1006A、D1255处)或其任何组合的Cpf1结构域,该一个或多个取代例如选自D917A、E1006A、D1255A、D917A/E1006A、D917A/D1255A、E1006A/D1255A、和D917A/E1006A/D1255A。
在一些实施例中,DNA结合结构域包含spCas9、spCas9-VRQR、spCas9-VRER、xCas9(sp)、saCas9、saCas9-KKH、spCas9-MQKSER、spCas9-LRKIQK、或spCas9-LRVSQL。
在一些实施例中,DNA结合结构域包含如以下表37中所列的氨基酸序列,或与其具有至少80%、85%、90%、95%、96%、97%、98%、或99%序列同一性的氨基酸序列。在一些实施例中,DNA结合结构域包含如下氨基酸序列,该氨基酸序列相对于本文所述的氨基酸序列中的任一个具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、或50个差异(例如,突变)。
表37.参考序列中的每一个通过引用以其全文并入。
Figure BDA0003761233040005451
Figure BDA0003761233040005461
Figure BDA0003761233040005471
在一些实施例中,Cas多肽结合引导DNA结合的gRNA。在一些实施例中,gRNA例如从5’至3’包含:(1)gRNA间隔子;(2)gRNA支架。在一些实施例中:
(1)是约18-22nt(例如,20nt)的Cas9间隔子。
(2)是包含一个或多个发夹环(例如,1、2、或3个环)的gRNA支架,用于使模板与切口酶Cas9结构域缔合。在一些实施例中,gRNA支架携带序列,从5’至3’为GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCC(SEQ ID NO:3444)。
在一些实施例中,本文所述的Gene Writing系统用于在HEK293、K562、U2OS、或HeLa细胞中进行编辑。在一些实施例中,Gene Writing系统用于在原代细胞(例如,来自E18.5小鼠的原代皮层神经元)中进行编辑。
在一些实施例中,本文所述的系统或方法涉及美国专利申请公开号20200063126、20190002889、或20190002875(其中每个通过引用以其全文并入本文)中所述的CRISPR DNA靶向酶或系统或其功能片段或变体。例如,在一些实施例中,本文所述的GeneWriter多肽或Cas内切核酸酶包含本段中提及的任何申请的多肽序列,并且在一些实施例中,指导RNA包含本段中提及的任何申请的核酸序列。
在一些实施例中,DNA结合结构域(例如,靶结合结构域或模板结合结构域)包含大范围核酸酶结构域、或其功能性片段。在一些实施例中,大范围核酸酶结构域具有内切核酸酶活性、例如双链切割和/或切口酶活性。在其他实施例中,大范围核酸酶结构域具有降低的活性,例如,缺乏内切核酸酶活性,例如,该大范围核酸酶无催化活性。在一些实施例中,无催化活性的大范围核酸酶用作DNA结合结构域,例如,如Fonfara等人Nucleic Acids Res[核酸研究]40(2):847-860(2012)中所述,该文献通过引用以其全文并入本文。在实施例中,该DNA结合结构域相对于野生型DNA结合结构域包含一个或多个修饰、例如经由定向进化(例如,噬菌体辅助的连续进化(PACE))的修饰。
内含肽
在一些实施例中,如下文更详细地描述的,可以例如在第一结构域将内含肽-N与本文所述的多肽(例如,Gene Writer多肽)的N末端部分融合。在实施例中,可以将内含肽-C与本文所述的多肽的C末端部分融合(例如,在第二结构域),例如,以便将N末端部分与C末端部分连接,从而将第一和第二结构域连接。在一些实施例中,第一和第二结构域各自独立地选自DNA结合结构域和催化结构域、例如重组酶结构域。在一些实施例中,使用本文所述的内含肽策略使单个结构域断裂,例如,DNA结合结构域,例如,dCas9结构域。
在一些实施例中,本文所述的系统或方法涉及内含肽,该内含肽是自我剪接蛋白质内含子(例如,肽),例如,其连接侧翼N末端和C末端外显肽(例如,待连接的片段)。在一些情况下,内含肽可以包含蛋白质的片段,该片段能够在称为蛋白质剪接的过程中自我切除并将剩余的片段(外显肽)与肽键连接。内含肽也称为“蛋白质内含子”。本文将内含肽自我切除并将蛋白质的剩余部分连接的过程称为“蛋白质剪接”或“内含肽介导的蛋白质剪接”。在一些实施例中,前体蛋白(在内含肽介导的蛋白质剪接之前的含内含肽的蛋白质)的内含肽来自两个基因。这种内含肽在本文称为断裂内含肽(例如,断裂内含肽-N和断裂内含肽-C)。例如,在蓝细菌中,DNA聚合酶III的催化亚基a(即DnaE)由两个分开的基因dnaE-n和dnaE-c编码。由dnaE-n基因编码的内含肽在本文可以称为“内含肽-N”。由dnaE-c基因编码的内含肽在本文可以称为“内含肽-C”。
内含肽用于连接异源蛋白质片段的用途描述于例如Wood等人,J.Biol.Chem.[生物化学杂志]289(21);14512-9(2014)(通过引用以其全文并入本文)中。例如,当与分开的蛋白质片段融合时,内含肽IntN和IntC可以彼此识别,自我剪除,和/或同时连接它们所融合的蛋白质片段的侧翼N末端和C末端外显肽,从而从两个蛋白质片段重构全长蛋白质。
在一些实施例中,使用基于dnaE内含肽的合成内含肽,即Cfa-N(例如,断裂内含肽-N)和Cfa-C(例如,断裂内含肽-C)内含肽对。此类内含肽的实例已在例如Stevens等人,JAm Chem Soc.[美国化学学会杂志]2016年2月24日;138(7):2162-5(通过引用以其全文并入本文)中进行了描述。根据本披露可以使用的内含肽对的非限制性实例包括:Cfa DnaE内含肽、Ssp GyrB内含肽、Ssp DnaX内含肽、Ter DnaE3内含肽、Ter ThyX内含肽、Rma DnaB内含肽和Cne Prp8内含肽(例如,如美国专利号8,394,604中所述,该专利通过引用并入本文)。
在一些实施例中,可以将内含肽-N和内含肽-C分别与断裂Cas9的N末端部分和断裂Cas9的C末端部分融合,以便将断裂Cas9的N末端部分和断裂Cas9的C末端部分连接。例如,在一些实施例中,将内含肽-N与断裂Cas9的N末端部分的C末端融合,即形成N—[断裂Cas9的N末端部分]-[内含肽-N]~C的结构。在一些实施例中,将内含肽-C与断裂Cas9的C末端部分的N末端融合,即形成N-[内含肽-C]~[断裂Cas9的C末端部分]-C的结构。用于连接与内含肽融合的蛋白质(例如,断裂Cas9)的内含肽介导的蛋白质剪接的机制描述于Shah等人,Chem Sci.[化学科学]2014;5(l):446-46l中,该文献通过引用并入本文。用于设计和使用内含肽的方法在本领域已知,并且例如由WO 2020051561、W0 2014004336、WO2017132580、US20150344549、和US 20180127780进行了描述,其中每个通过引用以其全文并入本文。
在一些实施例中,断裂是指分成两个或更多个片段。在一些实施例中,断裂Cas9蛋白或断裂Cas9包含Cas9蛋白,该蛋白作为由两个分开的核苷酸序列编码的N末端片段和C末端片段来提供。可以对与Cas9蛋白的N末端部分和C末端部分对应的多肽进行剪接以形成重构的Cas9蛋白。在实施例中,将Cas9蛋白在该蛋白的无序区内分成两个片段,例如,如Nishimasu等人,Cell[细胞],第156卷,第5期,第935-949页,2014中所述,或如Jiang等人(2016)Science[科学]351:867-871和PDB文件:5F9R中所述(其中每个通过引用以其全文并入本文)。无序区域可通过本领域已知的一种或多种蛋白质结构测定技术测定,包括但不限于X射线晶体学、NMR光谱学、电子显微术(例如,cryoEM)和/或计算机模拟蛋白质建模。在一些实施例中,将蛋白质在例如氨基酸A292-G364、F445-K483、或E565-T637之间的SpCas9的区域内的任何C、T、A、或S处,或在任何其他Cas9、Cas9变体(例如,nCas9、dCas9)或其他napDNAbp中的对应位置处分成两个片段。在其他实施例中,将蛋白质在SpCas9 T310、T313、A456、S469、或C574处分成两个片段。在一些实施例中,将蛋白质分成两个片段的过程称为对蛋白质的断裂。
在一些实施例中,蛋白质片段的长度范围为约2-1000个氨基酸(例如,2-10、10-50、50-100、100-200、200-300、300-400、400-500、500-600、600-700、700-800、800-900、或900-1000个之间的氨基酸)。在一些实施例中,蛋白质片段的长度范围为约5-500个氨基酸(例如,5-10、10-50、50-100、100-200、200-300、300-400、或400-500个之间的氨基酸)。在一些实施例中,蛋白质片段的长度范围为约20-200个氨基酸(例如,20-30、30-40、40-50、50-100、或100-200个之间的氨基酸)。
在一些实施例中,将Gene Writer多肽的部分或片段,例如,如本文所述,与内含肽融合。可以将核酸酶与内含肽的N末端或C末端融合。在一些实施例中,将融合蛋白的部分或片段与内含肽融合并与AAV衣壳蛋白融合。可以将内含肽、核酸酶和衣壳蛋白以任何排列方式(例如,核酸酶-内含肽-衣壳、内含肽-核酸酶-衣壳、衣壳-内含肽-核酸酶等)融合在一起。在一些实施例中,将内含肽的N末端与融合蛋白的C末端融合,并将内含肽的C末端与AAV衣壳蛋白的N末端融合。
在一些实施例中,将Gene Writer多肽(例如,包含切口酶Cas9结构域的多肽)与内含肽-N融合,并将包含聚合酶结构域的多肽与内含肽-C融合。
以下提供了内含肽的示例性核苷酸和氨基酸序列:
DnaE内含肽-N DNA:
Figure BDA0003761233040005511
DnaE内含肽-N蛋白质:
Figure BDA0003761233040005512
DnaE内含肽-C DNA:
Figure BDA0003761233040005513
内含肽-C:
MIKIATRKYLGKQNVYDIGVERDHNFALKNGFIASN(SEQ ID NO:3448)
Cfa-N DNA:
Figure BDA0003761233040005514
Cfa-N蛋白质:
Figure BDA0003761233040005515
Cfa-C DNA:
Figure BDA0003761233040005521
Cfa-C蛋白质:
MKRTADGSEFESPKKKRKVKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN(SEQ ID NO:3452)
基因组安全港位点
在一些实施例中,Gene Writer靶向基因组安全港位点(例如,引导将异源对象序列插入安全港评分为至少3、4、5、6、7、或8的位置)。在一些实施例中,基因组安全港位点是Natural HarborTM位点。在一些实施例中,Natural HarborTM位点源自移动遗传元件的天然靶标,例如,重组酶、转座子、逆转录转座子或逆转录病毒。鉴于移动元件的天然靶标的进化选择,其可充当基因组整合的理想位置。在一些实施例中,Natural HarborTM位点是核糖体DNA(rDNA)。在一些实施例中,Natural HarborTM位点是5S rDNA、18S rDNA、5.8S rDNA或28SrDNA。在一些实施例中,Natural HarborTM位点是5S rDNA中的Mutsu位点。在一些实施例中,Natural HarborTM位点是28S rDNA中的R2位点、R5位点、R6位点、R4位点、R1位点、R9位点或RT位点。在一些实施例中,Natural HarborTM位点是18S rDNA中的R8位点或R7位点。在一些实施例中,Natural HarborTM位点是编码转移RNA(tRNA)的DNA。在一些实施例中,NaturalHarborTM位点是编码tRNA-Asp或tRNA-Glu的DNA。在一些实施例中,Natural HarborTM位点是编码剪接体RNA的DNA。在一些实施例中,Natural HarborTM位点是编码小核RNA(snRNA)例如U2snRNA的DNA。
因此,在一些方面,本披露提供了如下方法,该方法包括使用本文所述的GeneWriter系统将异源对象序列插入Natural HarborTM位点。在一些实施例中,NaturalHarborTM位点是在下表4A中描述的位点。在一些实施例中,将异源对象序列插入NaturalHarborTM位点的20、50、100、150、200、250、500或1000个碱基对内。在一些实施例中,将异源对象序列插入Natural HarborTM位点的0.1kb、0.25kb、0.5kb、0.75、kb、1kb、2kb、3kb、4kb、5kb、7.5kb、10kb、15kb、20kb、25kb、50、75kb或100kb内。在一些实施例中,将异源对象序列插入与表4A所示序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的位点。在一些实施例中,将异源对象序列插入与表4A所示序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的位点的20、50、100、150、200、250、500或1000个碱基对内,或该位点的0.1kb、0.25kb、0.5kb、0.75、kb、1kb、2kb、3kb、4kb、5kb、7.5kb、10kb、15kb、20kb、25kb、50、75kb或100kb内。在一些实施例中,将异源对象序列插入表4A第5列中所示的基因内,或该基因的20、50、100、150、200、250、500或1000个碱基对内,或该基因的0.1kb、0.25kb、0.5kb、0.75、kb、1kb、2kb、3kb、4kb、5kb、7.5kb、10kb、15kb、20kb、25kb、50、75kb或100kb内。
表4A.
Natural HarborTM位点。第1列指示插入Natural HarborTM位点的逆转录转座子。第2列指示在Natural HarborTM位点处的基因。第3列和第4列显示了插入位点5'和3'的示例性人基因组序列(例如,250bp)。第5列和第6列列出了示例基因符号和对应的基因ID。
Figure BDA0003761233040005531
Figure BDA0003761233040005541
Figure BDA0003761233040005551
Figure BDA0003761233040005561
Figure BDA0003761233040005571
Figure BDA0003761233040005581
Figure BDA0003761233040005591
Gene WritersTM的另外的功能性特征
在一些情况下,如本文所述的Gene Writer可以由一个或多个功能性测量值或特征来表征。在一些实施例中,DNA结合结构域(例如,靶结合结构域)具有下文所述的一个或多个功能性特征。在一些实施例中,模板结合结构域具有下文所述的一个或多个功能性特征。在一些实施例中,模板(例如,模板DNA)具有下文所述的一个或多个功能性特征。在一些实施例中,被Gene Writer改变的靶位点在被Gene Writer改变后具有下文所述的一个或多个功能性特征。
Gene Writer多肽
DNA结合结构域
在一些实施例中,DNA结合结构域能够以比参考DNA结合结构域更大的亲和力结合靶序列(例如,dsDNA靶序列)。在一些实施例中,参考DNA结合结构域是来自链霉菌属细菌噬菌体phiC31的phiC31重组酶的DNA结合结构域。在一些实施例中,DNA结合结构域能够以100pM-10nM之间(例如,100pM-1nM或1nM-10nM之间)的亲和力结合靶序列(例如,dsDNA靶序列)。
在一些实施例中,DNA结合结构域对其靶序列(例如,dsDNA靶序列)的亲和力在体外测量,例如,通过热泳法,例如,如Asmari等人Methods[方法]146:107-119(2018)(通过引用以其全文并入本文)中所述。
在实施例中,在例如约100倍摩尔过量的摩尔过量的乱序序列竞争者dsDNA存在的情况下,DNA结合结构域能够例如以100pM-10nM之间(例如,100pM-1nM或1nM-10nM之间)的亲和力结合其靶序列(例如,dsDNA靶序列)。
在一些实施例中,发现DNA结合结构域与其靶序列(例如,dsDNA靶序列)缔合的频率大于靶细胞(例如,人靶细胞)基因组中的任何其他序列,例如,如通过ChIP-seq(例如,在HEK293T细胞中)所测量的,例如,如He和Pu(2010)Curr.Protoc Mol Biol[当前分子生物学协议]第21章(通过引用以其全文并入本文)中所述。在一些实施例中,发现DNA结合结构域与其靶序列(例如,dsDNA靶序列)以比靶细胞的基因组中任何其他序列更频繁至少约5倍或10倍的频率缔合,例如,如通过ChIP-seq(例如,在HEK293T细胞中)测量的,例如,如He和Pu(2010),同上中所述。
模板结合结构域
在一些实施例中,模板结合结构域能够以比参考DNA结合结构域更大的亲和力结合模板DNA。在一些实施例中,参考DNA结合结构域是来自链霉菌属细菌噬菌体phiC31的phiC31重组酶的DNA结合结构域。在一些实施例中,模板结合结构域能够以100pM-10nM之间(例如,100pM-1nM或1nM-10nM之间)的亲和力结合模板DNA。在一些实施例中,DNA结合结构域对其模板DNA的亲和力在体外测量,例如,通过热泳法,例如,如Asmari等人Methods[方法]146:107-119(2018)(通过引用以其全文并入本文)中所述。在一些实施例中,DNA结合结构域对其模板DNA的亲和力在细胞中测量(例如,通过FRET或ChIP-Seq)。
在一些实施例中,DNA结合结构域与模板DNA在体外缔合,其中至少50%的模板DNA在存在10nM竞争者DNA的情况下结合,例如,如Yant等人Mol Cell Biol[分子细胞生物学]24(20):9239-9247(2004)(通过引用以其全文并入本文)中所述。在一些实施例中,DNA结合结构域与模板DNA在细胞中(例如,在HEK293T细胞中)缔合,缔合频率比与乱序DNA缔合的频率高至少约5倍或10倍。在一些实施例中,DNA结合结构域与模板DNA或乱序DNA之间的缔合频率通过ChIP-seq测量,例如,如He和Pu(2010),同上中所述。
靶位点
在一些实施例中,在Gene Writing之后,整合序列周围的靶位点例如在少于约50%或10%的整合事件中包含有限数量的插入或缺失,例如,如通过对靶位点的长读段扩增子测序所确定的,例如,如Karst等人(2020)bioRxiv doi.org/10.1101/645903(通过引用以其全文并入本文)中所述。例如,在通过phiC31整合酶将插入DNA整合到人基因组假位点之后已经观察到插入缺失,如Thyagarajan等人Mol Cell Biol[分子与细胞生物学]21(12):3926-3934(2001)所述,该文献的传授内容通过引用以其全文并入本文。在一些实施例中,本发明的Gene Writing系统可导致靶位点(例如,插入DNA整合的位点,例如,与插入DNA的整合相邻)处的基因组修饰(例如,插入或缺失),该修饰包含小于20nt,例如小于20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或小于1nt的DNA。在一些实施例中,本发明的Gene Writing系统可导致靶位点(例如,插入DNA整合的位点,例如,与插入DNA的整合相邻)处的插入,该插入包含小于20个核苷酸或碱基对,例如小于20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或小于1个核苷酸或碱基对的DNA。在一些实施例中,本发明的Gene Writing系统可导致靶位点(例如,插入DNA整合的位点,例如,与插入DNA的整合相邻)处的缺失,该缺失包含小于20个核苷酸或碱基对,例如小于20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或小于1个核苷酸或碱基对的基因组DNA。在一些实施例中,当靶位点(例如,attB、attP或其假位点)处的识别序列的核心区(例如,中心二核苷酸)与插入DNA上的识别序列(例如,attP或attB位点)的核心区(例如,中心二核苷酸)具有100%同一性时,插入或缺失事件的比例较低。在一些实施例中,当靶位点处的识别序列的中心二核苷酸与插入DNA中的识别序列的中心二核苷酸相同时,非预期插入或缺失事件的比例在靶基因组位点处较低,例如低至少1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2.0、3.0、4.0、5.0、10、20、30、40、50、60、70、80、90、或至少低100倍。
在一些实施例中,靶位点不显示多个插入事件(例如,头对尾或头对头重复),例如,如通过对靶位点的长读段扩增子测序(例如,如Karst等人(2020),同上中所述),或通过分子梳(实例29)所确定的。在一些实施例中,靶位点在靶位点处显示少于100个插入拷贝,例如,75个插入拷贝、50个插入拷贝、45个插入拷贝、40个插入拷贝、35个插入拷贝、30个插入拷贝、25个插入拷贝、20个插入拷贝、15个插入拷贝、14个插入拷贝、13个插入拷贝、12个插入拷贝、11个插入拷贝、10个插入拷贝、9个插入拷贝、8个插入拷贝、7个插入拷贝、6个插入拷贝、5个插入拷贝、4个插入拷贝、3个插入拷贝、2个插入拷贝或单个插入拷贝。在一些实施例中,显示多于一个拷贝的插入物序列的靶位点存在于少于95%的含有插入物的靶位点中,例如,少于90%、80%、70%、60%、50%、40%、30%、20%、10%、9%、8%、7%、6%、4%、4%、3%、2%或少于1%的含有插入物的靶位点中,例如,如通过对靶位点的长读段扩增子测序(例如,如Karst等人(2020),同上中所述),或通过分子梳(实施例29)所确定的。在一些实施例中,显示多于两个拷贝的插入物序列的靶位点存在于少于95%的含有插入物的靶位点中,例如,少于90%、80%、70%、60%、50%、40%、30%、20%、10%、9%、8%、7%、6%、4%、4%、3%、2%或少于1%的含有插入物的靶位点中,例如,如通过对靶位点的长读段扩增子测序(例如,如Karst等人(2020),同上中所述),或通过分子梳(实例29)所确定的。在一些实施例中,显示多于三个拷贝的插入物序列的靶位点存在于少于95%的含有插入物的靶位点中,例如,少于90%、80%、70%、60%、50%、40%、30%、20%、10%、9%、8%、7%、6%、4%、4%、3%、2%或少于1%的含有插入物的靶位点中,例如,如通过对靶位点的长读段扩增子测序(例如,如Karst等人(2020),同上中所述,或通过分子梳(实例29))所确定的。在一些实施例中,靶位点在每个靶位点显示至少1、2、3、4、5、6、7、8、9、10或更多个拷贝。在一些实施例中,显示多个拷贝的插入物序列的靶位点存在于1%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%或更多的含有插入物的靶位点中,例如,如通过对靶位点的长读段扩增子测序(例如,如Karst等人(2020),同上中所述),或通过分子梳(实例29)所确定的。在一些实施例中,拷贝是连环体,即是连环化的。在一些实施例中,靶位点含有对应于模板DNA(例如,整个质粒、微环或病毒载体基因组)的整合序列。在一些实施例中,靶位点含有完全整合的模板分子。在一些实施例中,靶位点含有载体DNA(例如,AAV ITR)的组分。在一些实施例中,靶位点在整合后含有0、1、2、3、4、5、6、7、8、9、10或更多个ITR。在一些实施例中,至少一个ITR在整合后存在于至少1%的靶位点中,例如整合后至少1%、5%、10%、15%、20%、25%、50%、60%、70%、80%、90%、95%、96%、97%、98%或至少99%的靶位点中。在一些实施例中,至少一个ITR在整合后存在于少于50%的靶位点中,例如,整合后少于50%、40%、30%、20%、10%、9%、8%、7%、6%、4%、4%、3%、2%或少于1%的靶位点中,例如,如通过对靶位点的长读段扩增子测序(例如,如Karst等人(2020),同上中所述),或通过分子梳(实例29)所确定的。在一些实施例中,多个拷贝以头对头、尾对尾或头对尾排列或其混合排列。在一些实施例中,例如,当在整合之前通过第一次重组事件首先从病毒载体或质粒切除模板DNA时,靶位点在超过约50%的事件中,例如在超过约50%、40%、30%、20%、10%、9%、8%、7%、6%、4%、4%、3%、2%或超过约1%的事件中不含有插入,该插入包含对于识别位点侧翼盒外源的DNA,例如载体DNA,例如AAV ITR,例如,如通过对靶位点的长读段扩增子测序(例如,如Karst等人(2020),同上中所述),或通过分子梳(实例29)所确定的。在一些实施例中,整合的DNA不包含任何细菌抗生素抗性基因。
在一些实施例中,通过本文所述的Gene Writing系统在靶位点处整合的DNA包含末端杂合识别序列(例如,第一和/或第二副回文序列,例如,如本文所述),例如,通过插入DNA的识别位点(例如,插入DNA的attP或attB)与靶DNA中的识别位点(例如,attP或attB位点或其假位点)之间的重组形成的attL和attR序列。在一些实施例中,整合的DNA在末端杂合识别序列(例如,attL和attR序列)之间包含一个或多个ITR,例如,1、2、3、4或更多个ITR。在一些实施例中,至少1%的具有整合DNA的靶位点在末端杂合识别序列(例如,attL和attR序列)之间包含ITR,例如至少1%、5%、10%、20%、30%、40%、50%、60%、70%、80%或至少90%的整合DNA。在一些实施例中,在末端杂合识别序列(例如,attL和attR序列)之间包含ITR的整合DNA包含单拷贝的插入DNA,例如是单体插入。在一些实施例中,单体插入包含末端杂合识别序列,例如attL和attR序列,并且缺乏任何内部ITR。在一些实施例中,单体插入包含末端杂合识别序列,例如attL和attR序列,和单个内部ITR。在一些实施例中,单体插入包含末端杂合识别序列,例如attL和attR序列,和多个内部ITR,例如两个内部ITR。在一些实施例中,在末端杂合识别序列(例如attL和attR序列)之间包含ITR的整合DNA包含多个拷贝的插入DNA,例如是连环化插入。在一些实施例中,连环化插入包含末端杂合识别序列,例如attL和attR序列,和至少两个,例如至少2、3或4个拷贝的插入DNA。在一些实施例中,与具有更多拷贝的插入DNA的那些插入相比,包含末端杂合识别序列(例如attL和attR序列)的插入(包含更少拷贝的插入DNA)以更高的频率出现(例如,具有1个拷贝的插入出现频率高于具有2个拷贝的插入,具有2个拷贝的插入出现频率高于具有3个拷贝的插入,或具有1个拷贝的插入出现频率高于具有3个拷贝的插入),显示更高的发生频率,例如频繁1.1、1.2、1.3、1.4、1.5、2.0、2.5、3.0、4.0、5.0、10、20、30、40、50、60、70、80、90、100或更高倍。在一些实施例中,单体插入比二聚体插入更频繁出现,例如比二聚体插入频繁至少1.1、1.2、1.3、1.4、1.5、2.0、2.5、3.0、4.0、5.0、10、20、30、40、50、60、70、80、90、100倍或更多倍。在一些实施例中,二聚体插入比三聚体插入更频繁出现,例如比三聚体插入频繁至少1.1、1.2、1.3、1.4、1.5、2.0、2.5、3.0、4.0、5.0、10、20、30、40、50、60、70、80、90、100倍或更多倍。在一些实施例中,单体加上二聚体插入比串联插入(3个或更多个插入)更频繁出现,例如比串联插入频繁至少1.1、1.2、1.3、1.4、1.5、2.0、2.5、3.0、4.0、5.0、10、20、30、40、50、60、70、80、90、100或更多倍。在一些实施例中,连环化插入包含末端杂合识别序列,例如attL和attR序列,和一个或多个内部重组酶识别序列,例如1、2、3、4或更多个内部识别序列,例如attB或attP序列。在一些实施例中,连环化插入包含末端杂合识别序列,例如attL和attR序列,和一个或多个内部ITR,例如1、2、3、4、5、6或更多个内部ITR。如本文所述,插入DNA、识别序列和ITR的拷贝数以及这些组分的相对定位可使用实施例29中所述的分子梳和Kaykov等人Sci Rep[科学报告]6:19636(2016)中所述测定,所述文献通过引用以其全文并入本文。
在一些实施例中,可以发生插入事件,其中整合DNA不包含末端杂合识别序列,例如attL和attR序列。在一些实施例中,整合DNA可包含一个末端识别序列,例如attL或attR序列。在一些实施例中,整合DNA可以不具有任何末端杂合识别序列,例如attL或attR,例如整合DNA的任何末端都不包含杂合识别序列,例如attL或attR序列。在一些实施例中,不包含末端杂合识别序列(例如attL或attR序列)的整合DNA包含插入DNA的片段(例如不完全插入DNA,例如具有不完全启动子、基因或异源对象序列的插入DNA)。在一些实施例中,不包含末端杂合识别序列(例如attL或attR序列)的整合DNA包含不完全的多个插入DNA序列,例如包含少于1个、多于1个且少于2个、多于2个且少于3个、多于3个且少于4个、或另一不完全的多个拷贝的完全插入DNA。
在一些实施例中,在使用Gene Writing系统后,与包含一个或更少的末端杂合识别序列(例如attL或attR序列)的新整合DNA相比,包含末端杂合识别序列(例如attL和attR序列)的新整合DNA以更高频率存在于细胞或细胞群体中,例如占超过50%、超过60%、超过70%、超过80%、超过90%、超过95%、超过96%、超过97%、超过98%、超过99%、超过99.5%或超过99.9%的总插入事件,如通过本文所述的测定(例如长读段测序或分子梳)所测量的。在一些实施例中,在使用Gene Writing系统后,与包含一个或更少的末端杂合识别序列(例如attL或attP序列)的整合事件的平均插入DNA拷贝数相比,包含末端杂合识别序列(例如attL和attR序列)的新整合DNA包含每个插入事件更低的平均插入DNA拷贝数,例如包含每个插入事件平均少至少0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1.0、1.5或2.0个拷贝。在一些实施例中,在使用Gene Writing系统后,与包含一个或更少的末端杂合识别序列(例如attL或attP序列)的插入DNA序列的百分比相比,包含末端杂合识别序列(例如attL和attR序列)的新整合DNA包含更高百分比的完全插入DNA序列,例如包含至少0.1x、0.2x、0.3x、0.4x、0.5x、0.6x、0.7x、0.8x、0.9x、1.0x、1.5x、2.0x、3x、4x、5x、6x、7x、8x、9x、10x或更多百分比的完全插入DNA序列。
在一些实施例中,本文所述的Gene Writer能够位点特异性地编辑靶DNA,例如,将模板DNA插入靶DNA。在一些实施例中,位点特异性的Gene Writer能够产生编辑(例如,插入),该编辑存在于靶位点处的频率高于基因组中任何其他位点。在一些实施例中,位点特异性的Gene Writer能够在靶位点中产生编辑(例如,插入),频率为在人基因组中所有其他位点处频率的至少2、3、4、5、10、50、100、或1000倍。在一些实施方案中,整合位点的位置通过单向测序确定,例如,如实例18中。在用于文库制备的接头或引物中掺入独特的分子标识符(UMI)允许对离散插入事件进行定量,这可以在中靶插入与所有其他插入之间进行比较,以确定对已定义靶位点的偏好。在一些实施例中,使用反向PCR方法来确定特定GeneWriter所靶向的整合位点,例如,如实例30中。
在一些实施例中,Gene Writing系统用于编辑存在于人基因组中单个位置的靶DNA序列。在一些实施例中,Gene Writing系统用于编辑存在于人基因组中单个同源染色体上的单个位置的靶DNA序列,例如,是单倍型特异性的。在一些实施例中,Gene Writing系统用于编辑存在于人基因组中两个同源染色体上的单个位置的靶DNA序列。在一些实施例中,Gene Writing系统用于编辑存在于基因组中多个位置(例如,基因组中至少2、3、4、5、10、20、50、100、200、500、1000、5000、10000、100000、200000、500000、1000000个(例如,Alu元件)位置)的靶DNA序列。在一些实施例中,本文所用的Gene Writing系统在人基因组中的单个靶序列处进行整合,该单个靶序列可存在于一个或多个位置。在一些实施例中,本文所用的Gene Writing系统在多个序列(在人基因组中存在至少一次)处进行整合,例如识别在人基因组中存在至少一次的多于1个,例如多于1、2、3、4、5、10、20、50或多于100个序列,或少于100个,例如少于100、90、80、70、60、50、40、30、25、20、15、10或少于5个序列。因此,在一些实施例中,本文所述的Gene Writing可导致以每个细胞至少1个,例如至少1、2、3、4、5、6、7、8、9或至少10个拷贝,或每个细胞少于10个,例如少于10、9、8、7、6、5、4、3或少于2个拷贝整合插入DNA。
在一些实施例中,Gene Writer系统能够编辑基因组而不引入不希望的突变。在一些实施例中,Gene Writer系统能够通过将模板(例如,模板DNA)插入基因组来编辑基因组。在一些实施例中,基因组中所得的修饰含有相对于模板DNA序列的最小突变。在一些实施例中,基因组插入相对于模板DNA的平均错误率为少于10-4、10-5、或10-6个突变/核苷酸。在一些实施例中,相对于被引入靶细胞的模板DNA的突变的数量平均为少于1、2、3、4、5、10、20、30、40、50、60、70、80、90、或100个核苷酸/基因组。在一些实施例中,靶基因组中插入的错误率通过遍及已知靶位点的长读段扩增子测序(例如,如Karst等人(2020),同上中所述)并与模板DNA序列进行比较来确定。在一些实施例中,通过该方法列举的错误包括相对于模板序列的核苷酸取代。在一些实施例中,通过该方法列举的错误包括相对于模板序列的核苷酸缺失。在一些实施例中,通过该方法列举的错误包括相对于模板序列的核苷酸插入。在一些实施例中,通过该方法列举的错误包括相对于模板序列的一个或多个核苷酸取代、缺失或插入的组合。
整合事件的效率可以用作Gene Writer系统对靶位点或靶细胞编辑的量度。在一些实施例中,本文所述的Gene Writer系统能够在靶位点或靶细胞的一部分中整合异源对象序列。在一些实施例中,Gene Writer系统能够编辑至少1%、2%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%、99.5%、99.9%或100%的靶基因座,如通过在遍及靶标的扩增和使用长读段扩增子测序分析时对编辑的检测来测量的,例如,如Karst等人(2020)中所述。在一些实施例中,Gene Writer系统能够以遍及细胞群体至少0.1个(例如,至少0.1、0.5、1、2、3、4、5、10、或100个)拷贝/基因组的平均拷贝数(如相对于参考基因(例如,RPP30)归一化的)编辑细胞,例如,如通过利用转基因特异性引物-探针集的ddPCR确定的,例如,如根据Lin等人Hum Gene Ther Methods[人类基因治疗方法]27(5):197-208(2016)中的方法。
在一些实施例中,每细胞拷贝数通过单细胞ddPCR(sc-ddPCR)分析,例如,如根据Igarashi等人Mol Ther Methods Clin Dev[分子治疗方法与临床发展]6:8-16(2017)的方法,该文献通过引用以其全文并入本文。在一些实施例中,至少1%(例如,至少1%、2%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%、99.5%、99.9%或100%)的靶细胞对整合呈阳性,如通过使用转基因特异性引物-探针集的sc-ddPCR评估的。在一些实施例中,平均拷贝数为至少0.1个(例如,至少0.1、0.5、1、2、3、4、5、10、或100个)拷贝/细胞,如通过使用转基因特异性引物-探针集的sc-ddPCR测量的。
在一些实施例中,靶位点包含一对核酸序列,其中一个核酸序列是相对于另一个核酸序列的回文结构,或者与相对于另一个核酸序列的回文结构具有至少20%(例如,至少20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、或100%),例如至少50%序列同一性,或者相对于另一个核酸序列具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列错配。
插入DNA
在一些实施例中,如本文所述的插入DNA包含如下核酸序列,该核酸序列可以例如通过重组酶多肽(例如,丝氨酸重组酶多肽)整合到靶DNA分子中,例如,如本文所述。插入DNA典型地能够结合系统的一个或多个重组酶多肽(例如,重组酶多肽的多个拷贝)。在一些实施例中,插入DNA包含如下区域,该区域能够结合重组酶多肽(例如,如本文所述的识别序列)。
在一些实施例中,插入DNA可以包含用于插入靶DNA的对象序列。对象序列可以是编码的或非编码的。在一些实施例中,对象序列可以包含开放阅读框。在一些实施例中,插入DNA包含科扎克(Kozak)序列。在一些实施例中,插入DNA包含内部核糖体进入位点。在一些实施例中,插入DNA包含自切割肽,例如T2A或P2A位点。在一些实施例中,插入DNA包含起始密码子。在一些实施例中,插入DNA包含剪接受体位点。在一些实施例中,插入DNA包含剪接供体位点。在一些实施例中,插入DNA例如在终止密码子的下游包含微小RNA结合位点。在一些实施例中,插入DNA例如在开放阅读框的终止密码子下游包含聚A尾。在一些实施例中,插入DNA包含一个或多个外显子。在一些实施例中,插入DNA包含一个或多个内含子。在一些实施例中,插入DNA包含真核转录终止子。在一些实施例中,插入DNA包含增强的翻译元件或翻译增强元件。在一些实施例中,插入DNA包含微小RNA序列、siRNA序列、指导RNA序列、piwiRNA序列。在一些实施例中,插入DNA包含由至少一个可操作地连接至效应子序列的调节区构成的基因表达单元。效应子序列可以是转录成RNA的序列(例如,编码序列或非编码序列,例如编码微小RNA的序列)。在一些实施例中,对象序列可以含有非编码序列。例如,插入DNA可以包含启动子或增强子序列。在一些实施例中,插入DNA包含组织特异性启动子或增强子,其中的每个可以是单向的或双向的。在一些实施例中,启动子是RNA聚合酶I启动子、RNA聚合酶II启动子或RNA聚合酶III启动子。在一些实施例中,启动子包含TATA元件。在一些实施例中,启动子包含B识别元件。在一些实施例中,启动子具有针对转录因子的一个或多个结合位点。
在一些实施例中,将插入DNA的对象序列插入靶基因组的内源内含子中。在一些实施例中,将插入DNA的对象序列插入靶基因组中,从而充当新的外显子。在一些实施例中,将对象序列插入靶基因组导致天然外显子的替换或天然外显子的跳过。在一些实施例中,将插入DNA的对象序列插入靶基因组的基因组安全港位点中,例如AAVS1、CCR5、或ROSA26中。在一些实施例中,将插入DNA的对象序列添加到基因组的基因间区域或基因内区域中。在一些实施例中,将插入DNA的对象序列添加到基因组的内源活性基因的5’或3’的0.1kb、0.25kb、0.5kb、0.75、kb,1kb、2kb、3kb、4kb、5kb、7.5kb、10kb、15kb、20kb、25kb、50、75kb或100kb之内。在一些实施例中,将插入DNA的对象序列添加到基因组的内源启动子或增强子的5’或3’的0.1kb、0.25kb、0.5kb、0.75、kb、1kb、2kb、3kb、4kb,5kb、7.5kb、10kb、15kb、20kb、25kb、50、75kb或100kb之内。在一些实施例中,插入DNA的对象序列可以是例如在50-50,000个碱基对之间(例如,在50-40,000bp之间,在500-30,000bp之间,在500-20,000bp之间,在100-15,000bp之间,在500-10,000bp之间,在50-10,000bp之间,在50-5,000bp之间)。在一些实施例中,插入DNA的对象序列可以是例如1-50个碱基对。
在某些实施例中,可以鉴定、设计、工程化和构建插入DNA,以包含改变或指定靶细胞或靶生物的基因组功能的序列,例如通过将异源编码区引入基因组;影响或引起外显子结构/替代性剪接;引起内源基因的破坏;引起内源基因的转录激活;引起内源DNA的表观遗传调节;引起可操作地连接的基因的上调或下调等。在某些实施例中,可以将插入DNA工程化以包含编码外显子和/或转基因的序列,提供与转录因子激活剂、阻遏物、增强子等及其组合的结合位点。在其他实施例中,编码序列可以进一步用剪接受体位点、聚A尾定制。
插入DNA可与靶DNA具有某种同源性。在一些实施例中,插入DNA具有与靶DNA或其部分完全同源的至少3、4、5、6、7、8、9、10或更多个碱基。在一些实施例中,插入DNA具有与靶DNA或其部分至少50%、60%、70%、80%、85%、90%、95%、97%、98%、99%或100%同源的至少10、15、20、25、30、40、50、60、80、100、120、140、160、180、200或更多个碱基。
作为本文所述的其他递送方法的替代方案,在一些实施例中,递送至细胞的核酸(例如,编码重组酶的核酸、或模板核酸,或两者)被设计为微环,其中与Gene WritingTM不相关的质粒主链序列在施用于细胞之前被去除。已经证明与主链含有细菌部分(例如,细菌复制起点、抗生素选择盒)的质粒相比,微环可实现更高的转染效率和基因表达,并已被用于提高转座效率(Sharma等人Mol Ther Nucleic Acids[分子治疗-核酸]2:E74(2013))。在一些实施例中,编码Gene WriterTM多肽的DNA载体以微环形式递送。在一些实施例中,含有Gene WriterTM模板的DNA载体以微环形式递送。在用于递送核酸的此类替代性手段的一些实施例中,细菌部分侧翼有重组位点,例如attP/attB、loxP、FRT位点。在一些实施例中,同源重组酶的添加可实现分子内重组和细菌部分的切除。在一些实施例中,通过phiC31重组酶识别重组酶位点。在一些实施例中,通过Cre重组酶识别重组酶位点。在一些实施例中,通过FLP重组酶识别重组酶位点。在一些实施例中,微环产生于稳定表达诱导型微环组装酶的产细菌菌株中,例如,大肠杆菌(E.coli)菌株,例如根据Kay等人Nat Biotechnol[自然生物技术]28(12):1287-1289(2010)的生产菌株。微环DNA载体的制备和生产方法描述于US9233174,其通过引用以其全文并入本文。
除了质粒DNA之外,还可以通过从病毒主链(例如,AAV载体)中切除所需的构建体(例如,重组酶表达盒或治疗性表达盒)来产生微环。此前已证明从病毒主链中切除供体序列并使其环化,可能对转座酶介导的整合效率很重要(Yant等人Nat Biotechnol[自然生物技术]20(10):999-1005(2002))。在一些实施例中,首先配制微环,然后将其递送至靶细胞。在其他实施例中,通过共递送重组酶在细胞内由DNA载体(例如,质粒DNA、rAAV、scAAV、ceDNA、“狗骨头DNA”(doggybone DNA))形成微环,导致侧翼是重组酶识别位点的核酸的切除和环化,该核酸为例如编码Gene WriterTM多肽的核酸、或DNA模板、或两者。在一些实施例中,针对第一切除事件(例如,分子内重组)和第二整合(例如,靶位点整合)事件使用相同的重组酶。在一些实施例中,将切除的环状DNA上的重组位点(例如,在第一重组事件之后,例如,分子内重组之后)用作第二重组(例如,靶位点整合)事件的模板识别位点。
在一些实施例中,本文所述的微环DNA通过重组酶切除事件产生,并且GeneWriter用以通过重组酶整合事件插入微环DNA。在一些实施例中,切除事件和整合事件由相同的酶催化,例如由相同的丝氨酸重组酶催化。在一些实施例中,从载体切除的盒侧接attL和attR位点,并且切除事件导致产生用于在同源基因组attP或attB位点处整合的attB或attP位点。在一些实施例中,涉及attL和attR位点的切除事件通过添加重组定向因子(RDF)来催化,该重组定向因子使得Gene Writer重组酶多肽能够进行切除。在一些实施例中,Gene Writer重组酶多肽用于在不存在RDF下催化整合事件。
接头
在一些实施例中,本文所述的组合物和系统的结构域(例如,重组酶结构域和/或重组酶多肽的DNA识别结构域,例如,如本文所述)可以通过接头连接。本文所述的包含接头元件的组合物具有S1-L-S2的一般形式,其中S1和S2可以相同或不同,并代表通过接头彼此缔合的两个结构域部分(例如,各自是多肽或核酸结构域)。在一些实施例中,接头可以连接两个多肽。在一些实施例中,接头可以连接两个核酸分子。在一些实施例中,接头可以连接多肽和核酸分子。接头可以是化学键,例如一个或多个共价键或非共价键。接头可以是柔性的、刚性的和/或可切割的。在一些实施例中,接头是肽接头。通常,肽接头的长度是至少2、3、4、5、6、7、8、9、10或更多个氨基酸,例如,长度是2-50个氨基酸,长度是2-30个氨基酸。
最常用的柔性接头具有的序列主要由Gly和Ser残基(“GS”接头)段组成。柔性接头可以有用于连接需要一定程度的移动或相互作用的结构域,并且可以包括小的、非极性的(例如Gly)或极性的(例如Ser或Thr)氨基酸。Ser或Thr的掺入还可以通过与水分子形成氢键来维持接头在水溶液中的稳定性,且因此减少了接头与其他部分之间的不利相互作用。此类接头的实例包括具有结构[GGS]>1或[GGGS]>1(SEQ ID NO:3441)的那些。刚性接头有用于保持各结构域之间的固定距离并维持它们的独立功能。当结构域的空间分离对于保持药剂中一种或多种组分的稳定性或生物活性至关重要时,刚性接头也可以是有用的。刚性接头可以具有α螺旋结构或富含脯氨酸的序列(Pro-rich序列)、(XP)n,其中X表示任何氨基酸,优选Ala、Lys或Glu。可切割接头可以在体内释放游离的功能性结构域。在一些实施例中,接头可以在特异性条件下(例如在还原剂或蛋白酶的存在下)切割。体内可切割接头可利用二硫键的可逆性质。一个实例包括两个Cys残基之间的凝血酶敏感性序列(例如,PRS)。CPRSC的体外凝血酶处理导致凝血酶敏感性序列的切割,而可逆的二硫键保持完整。此类接头是已知的,并且例如在Chen等人2013.Fusion Protein Linkers:Property,Design andFunctionality.[融合蛋白接头:特性、设计和功能]Adv Drug Deliv Rev.[先进药物输送评论]65(10):1357-1369中描述。本文所述组合物中接头的体内切割也可以通过蛋白酶进行,该蛋白酶在病理条件下(例如癌症或炎症)在体内、在特定细胞或组织中、或在受限的某些细胞区室内表达。许多蛋白酶的特异性在受限的区室中提供了对接头的较缓慢切割。
在一些实施例中,氨基酸接头是存在于天然多肽的此类结构域之间的内源氨基酸(或与之同源)。在一些实施例中,存在于此类结构域之间的内源氨基酸被取代,但是长度与天然长度没有变化。在一些实施例中,将另外的氨基酸残基添加至结构域之间的天然存在的氨基酸残基。
在一些实施例中,氨基酸接头被计算地设计或筛选以最大化蛋白质功能(Anad等人,FEBS Letters[FEBS通讯],587:19,2013)。
另外的Gene Writer特征
在一些实施例中,Gene Writer系统可以在不需要内源宿主因子的情况下产生完整的书写。在一些实施例中,该系统可以在不需要DNA修复的情况下产生完整的书写。在一些实施例中,该系统可以在不引起DNA损伤应答的情况下产生完整的书写。
在一些实施例中,该系统不需要通过NHEJ途径、同源重组修复途径、碱基切除修复途径或其任何组合进行DNA修复。DNA修复途径的参与可以例如经由DNA修复途径抑制剂或DNA修复途径缺陷细胞系的应用来测定。例如,当应用DNA修复途径抑制剂时,可以首先进行PrestoBlue细胞生存力测定,以确定抑制剂的毒性以及是否应进行任何归一化。SCR7是NHEJ的抑制剂,其可在Gene WriterTM递送过程中以一系列稀释度使用。PARP蛋白是核酶,其作为同二聚体与单链和双链断裂结合。因此,其抑制剂可用于相关DNA修复途径的测试,包括同源重组修复途径和碱基切除修复途径。实验程序与SCR7的实验程序相同。具有核苷酸切除修复(NER)途径的核心蛋白缺陷的细胞系可用于测试NER对Gene WritingTM的影响。在将Gene WriterTM系统递送到细胞中之后,可将ddPCR用于评估在抑制DNA修复途径的情况下异源对象序列的插入。还可以进行测序分析以评估某些DNA修复途径是否起作用。在一些实施例中,进入基因组中的Gene WritingTM不会因本文所述的DNA修复途径的敲除而减少。在一些实施例中,进入基因组中的Gene WritingTM不会因DNA修复途径的敲除而减少超过50%。
Gene Writing中的环状RNA
预期在靶细胞内的配制、递送或Gene Writing反应期间采用环状和/或线性RNA状态可能是有用的。因此,在本文所述的任何方面的一些实施例中,Gene Writing系统包含一个或多个环状RNA(circRNA)。在本文所述的任何方面的一些实施例中,Gene Writing系统包含一个或多个线性RNA。在一些实施例中,本文所述的核酸(例如,编码Gene Writer多肽的核酸分子,或两者)是circRNA。在一些实施例中,环状RNA分子编码Gene Writer多肽。在一些实施例中,将编码Gene Writer多肽的circRNA分子递送至宿主细胞。在一些实施例中,环状RNA分子编码重组酶,例如,如本文所述。在一些实施例中,将编码重组酶的circRNA分子递送至宿主细胞。在一些实施例中,编码Gene Writer多肽的circRNA分子在翻译之前被线性化(例如,在宿主细胞中)。
已发现环状RNA(circRNA)天然存在于细胞中,并且已发现其具有不同的功能,包括在人类细胞中的非编码和蛋白编码作用。已显示,可以通过将自剪接内含子掺入到RNA分子(或编码RNA分子的DNA)中,导致RNA环化来工程化circRNA,并且工程化的circRNA可以具有增强的蛋白质产生和稳定性(Wesselhoeft等人Nature Communications[自然通讯]2018)。在一些实施例中,Gene WriterTM多肽被编码为circRNA。在某些实施例中,模板核酸是DNA,例如dsDNA或ssDNA。
在一些实施例中,circRNA包含一个或多个核酶序列。在一些实施例中,核酶序列被激活用于例如在宿主细胞中自切割,例如,从而导致circRNA的线性化。在一些实施例中,当镁的浓度达到例如在宿主细胞中切割的足够水平时,核酶被激活。在一些实施例中,circRNA在递送至宿主细胞之前保持在低镁环境中。在一些实施例中,核酶是蛋白反应性核酶。在一些实施例中,核酶是核酸反应性核酶。
在一些实施例中,circRNA在靶细胞的细胞核中被线性化。在一些实施例中,细胞核中circRNA的线性化涉及细胞核中存在的组分,例如以激活切割事件。例如,B2和ALU逆转录转座子含有自切割核酶,其活性通过与多梳蛋白EZH2相互作用而增强(Hernandez等人PNAS[美国国家科学院院刊]117(1):415-425(2020))。因此,在一些实施例中,将核酶(例如来自B2或ALU元件的核酶)掺入到例如Gene Writing系统的circRNA中,该核酶对核元件(例如核蛋白,例如基因组相互作用蛋白,例如表观遗传修饰剂,例如EZH2)有反应。在一些实施例中,circRNA的核定位导致核酶的自催化活性增加和circRNA的线性化。
在一些实施例中,可诱导的核酶(例如,在本文所述的circRNA中)是合成产生的,例如,通过利用蛋白质配体反应性适体设计。已描述了利用烟草环斑病毒锤头状核酶的卫星RNA与MS2外壳蛋白适体的系统(Kennedy等人Nucleic Acids Res[核酸研究]42(19):12306-12321(2014),其通过引用以其全文并入本文),其在MS2外壳蛋白的存在下导致核酶活性的激活。在实施例中,这样的系统对定位于细胞质或细胞核的蛋白质配体产生反应。在一些实施例中,蛋白质配体不是MS2。已描述了产生针对靶配体的RNA适体的方法,例如,基于通过指数富集的配体系统进化(SELEX)(Tuerk和Gold,Science[科学]249(4968):505-510(1990);Ellington和Szostak,Nature[自然]346(6287):818-822(1990);其中每个的方法都通过引用并入文中),并且在一些情况下,借助于计算机设计(Bell等人PNAS[美国国家科学院院刊]117(15):8486-8493,其方法通过引用并入本文)。因此,在一些实施例中,产生用于靶配体的适体并将其掺入合成核酶系统中,例如引发核酶介导的切割和circRNA线性化,例如在蛋白质配体存在下。在一些实施例中,circRNA线性化在细胞质中被引发,例如,使用与细胞质中的配体缔合的适体。在一些实施例中,circRNA线性化在细胞核中被引发,例如,使用与细胞核中的配体缔合的适体。在实施例中,细胞核中的配体包含表观遗传修饰剂或转录因子。在一些实施例中,引发线性化的配体以高于脱靶细胞的水平存在于中靶细胞中。
还预期核酸反应性核酶系统可用于circRNA线性化。例如,在例如Penchovsky(Biotechnology Advances[生物技术进展]32(5):1015-1027(2014),通过引用并入本文)中描述了感测确定的靶核酸分子以引发核酶激活的生物传感器。通过这些方法,核酶自然折叠成非活性状态,并且仅在存在确定的靶核酸分子(例如,RNA分子)的情况下才被激活。在一些实施例中,Gene Writing系统的circRNA包含核酸反应性核酶,其在存在确定的靶核酸(例如RNA,例如mRNA、miRNA、指导RNA、gRNA、sgRNA、ncRNA、lncRNA、tRNA、snRNA或mtRNA)的情况下被激活。在一些实施例中,引发线性化的核酸以高于脱靶细胞的水平存在于中靶细胞中。
在本文任何方面的一些实施例中,Gene Writing系统掺入一种或多种对目的靶组织或靶细胞具有可诱导特异性的核酶,例如,被目的靶组织或靶细胞中以较高水平存在的配体或核酸激活的核酶。在一些实施例中,Gene Writing系统掺入对亚细胞区室(例如细胞核、核仁、细胞质或线粒体)具有可诱导特异性的核酶。在一些实施例中,核酶被以较高水平存在于靶亚细胞区室中的配体或核酸激活。在一些实施例中,Gene Writing系统的RNA组分作为circRNA提供,例如通过线性化激活。在一些实施例中,编码Gene Writing多肽的circRNA的线性化激活分子进行翻译。在一些实施例中,激活Gene Writing系统的circRNA组分的信号以更高水平存在于中靶细胞或组织中,例如使得该系统在这些细胞中被特异性激活。
在一些实施例中,Gene Writing系统的RNA组分作为通过线性化失活的circRNA提供。在一些实施例中,编码Gene Writing多肽的circRNA通过切割和降解而失活。在一些实施例中,编码Gene Writing多肽的circRNA通过将翻译信号与多肽的编码序列分开的切割而失活。在一些实施例中,使Gene Writing系统的circRNA组分失活的信号以较高水平存在于脱靶细胞或组织中,使得该系统在这些细胞中被特异性失活。
Gene Writer的进化变体
在一些实施例中,本发明提供了Gene Writer的进化变体。在一些实施例中,进化变体可以通过对参考Gene Writer或其中包含的片段或结构域之一进行诱变处理而产生。在一些实施例中,使一个或多个结构域(例如,催化结构域或DNA结合结构域(例如,靶结合结构域或模板结合结构域),包括例如序列指导的DNA结合元件)进化。在一些实施例中,可以使一个或多个此类进化变体结构域单独进化或与其他结构域一起进化。在一些实施例中,可以将一个或多个进化变体结构域与一个或多个未进化的同源组分或一个或多个同源组分的进化的变体组合,例如,该一个或多个同源组分的进化的变体能以并行或连续方式进化。
在一些实施例中,对参考Gene Writer或其片段或结构域进行诱变处理的过程包括对该参考Gene Writer或其片段或结构域进行诱变处理。在实施例中,诱变包括连续进化方法(例如,PACE)或非连续进化方法(例如,PANCE),例如,如本文所述。在一些实施例中,进化的Gene Writer或其片段或结构域(例如,DNA结合结构域,例如,靶结合结构域或模板结合结构域)包含引入其氨基酸序列的相对于参考Gene Writer或其片段或结构域的氨基酸序列的一个或多个氨基酸变异。在实施例中,氨基酸序列变异可以包括参考Gene Writer的氨基酸序列内的一个或多个突变的残基(例如,保守取代、非保守取代、或其组合),例如,该一个或多个突变的残基是由于编码gene writer的核苷酸序列的变化(例如,该编码序列中任何特定位置处密码子的变化),该变化引起一个或多个氨基酸(例如,截短的蛋白质)的缺失、一个或多个氨基酸的插入或前述内容的任何组合。进化变体Gene Writer可以包括GeneWriter的一个或多个组分或结构域中的变体(例如,引入催化结构域、DNA结合结构域或其组合的变体)。
在一些方面,本文明提供了使用或包含Gene Writer的进化变体的Gene Writer、系统、试剂盒和方法,例如,采用了Gene Writer的进化的变体或由PACE或PANCE生产或可由其生产的Gene Writer。在实施例中,未进化的参考Gene Writer是如本文披露的GeneWriter。
如本文所用,术语“噬菌体辅助的连续进化(PACE)”通常是指采用噬菌体作为病毒载体的连续进化。PACE技术的实例已描述于例如以下中:2009年9月8日提交的国际PCT申请号PCT/US 2009/056194,其于2010年3月11日公开为WO 2010/028347;2011年12月22日提交的国际PCT申请PCT/US 2011/066747,其于2012年6月28日公开为WO 2012/088381;2015年5月5日发布的美国专利号9,023,594;2017年9月26日发布的美国专利号9,771,574;2016年7月19日发布的美国专利号9,394,537;2015年1月20日提交的国际PCT申请PCT/US 2015/012022,其于2015年9月11日公开为WO 2015/134121;2019年1月15日发布的美国专利号10,179,911;以及2016年4月15日提交的国际PCT申请PCT/US 2016/027795,其于2016年10月20日公开为WO 2016/168631,其中每个的全部内容通过引用并入本文。
如本文所用,术语“噬菌体辅助的非连续进化(PANCE)”通常是指采用噬菌体作为病毒载体的非连续进化。PANCE技术的实例已描述于例如Suzuki T.等人,Crystalstructures reveal an elusive functional domain of pyrrolysyl-tRNA synthetase[晶体结构揭示了吡咯赖氨酰tRNA合成酶的难以捉摸的功能性结构域],Nat Chem Biol.[自然化学生物学]13(12):1261-1266(2017)中,该文献通过引用以其全文并入本文。简言之,PANCE是一种使用进化中的选择噬菌体(SP)的连续烧瓶转移进行快速体内定向进化的技术,其中含有要在新鲜宿主细胞(例如,大肠杆菌细胞)中进化的目的基因。宿主细胞内的基因可能保持不变,而SP中含有的基因则连续进化。噬菌体生长后,可以使用被感染的细胞的等分试样来转染后续含有宿主大肠杆菌的烧瓶。这一过程可以重复和/或继续,直到期望的表型实现进化,例如,持续所需的转移次数。
本领域技术人员通过参考(尤其是)前述参考文献可以容易地理解将PACE和PANCE应用于Gene Writer的方法。用于例如使用噬菌体颗粒例如在宿主细胞群体中引导基因组修饰蛋白或系统的连续进化的另外的示例性方法可用于产生Gene Writer或其片段或亚结构域的进化变体。此类方法的非限制性实例描述于以下中:2009年9月8日提交的国际PCT申请PCT/US2009/056194,其于2010年3月11日公开为WO 2010/028347;2011年12月22日提交的国际PCT申请PCT/US 2011/066747,其于2012年6月28日公开为WO 2012/088381;2015年5月5日发布的美国专利号9,023,594;2017年9月26日发布的美国专利号9,771,574;2016年7月19日发布的美国专利号9,394,537;2015年1月20日提交的国际PCT申请PCT/US 2015/012022,其于2015年9月11日公开为WO 2015/134121;2019年1月15日发布的美国专利号10,179,911;2019年6月14日提交的国际申请号PCT/US2019/37216;2019年1月31日公开的国际专利公开WO 2019/023680;2016年4月15日提交的国际PCT申请PCT/US 2016/027795,其于2016年10月20日公开为WO 2016/168631;以及2019年8月23日提交的国际专利公开号PCT/US 2019/47996;其中每个通过引用以其全文并入本文。
在一些非限制性说明性实施例中,进化变体Gene Writer、或其片段或结构域的进化方法包括:(a)使宿主细胞群体与包含目的基因(起始Gene Writer或其片段或结构域)的病毒载体群体接触,其中:(1)宿主细胞易于被病毒载体感染;(2)宿主细胞对产生病毒颗粒所需的病毒基因进行表达;(3)产生感染性病毒颗粒所需的至少一种病毒基因的表达取决于目的基因的功能;和/或(4)病毒载体允许蛋白质在宿主细胞中表达,并且可以被宿主细胞复制和包装成病毒颗粒。在一些实施例中,该方法包括(b)使宿主细胞与诱变剂接触,其使用具有提高突变率的突变的宿主细胞(例如,通过携带突变质粒或某种基因组修饰—例如,校对受损的DNA聚合酶、SOS基因,例如UmuC、UmuD'、和/或RecA,如果与质粒结合,这些突变可能在诱导型启动子的控制下)或其组合。在一些实施例中,该方法包括(c)在允许病毒复制和产生病毒颗粒的条件下孵育宿主细胞群体,其中从宿主细胞群体中去除宿主细胞,并将新鲜的、未感染的宿主细胞引入到宿主细胞群体中,从而补充宿主细胞群体并产生宿主细胞流。在一些实施例中,将细胞在允许目的基因获得突变的条件下孵育。在一些实施例中,该方法进一步包括(d)从宿主细胞群体中分离病毒载体的突变版本,该突变版本编码进化基因产物(例如,进化变体Gene Writer、或其片段或结构域)。
本领域技术人员将理解在上述框架内可采用的各种特征。例如,在一些实施例中,病毒载体或噬菌体是丝状噬菌体,例如M13噬菌体,例如M13选择噬菌体。在某些实施例中,产生感染性病毒颗粒所需的基因是M13基因III(gIII)。在实施例中,噬菌体可能缺乏功能性gIII,但不同的是包含gI、gII、gIV、gV、gVI、gVII、gVIII、gIX、和gX。在一些实施例中,感染性VSV颗粒的产生涉及包膜蛋白VSV-G。各种实施例可以使用不同的逆转录病毒载体,例如鼠白血病病毒载体或慢病毒载体。在实施例中,利用VSV-G包膜蛋白(例如,作为病毒的天然包膜蛋白的替代物)可以有效包装逆转录病毒载体。
在一些实施例中,根据合适数量的病毒生命周期孵育宿主细胞,例如至少10、至少20、至少30、至少40、至少50、至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1250、至少1500、至少1750、至少2000、至少2500、至少3000、至少4000、至少5000、至少7500、至少10000或更多个连续的病毒生命周期,在M13噬菌体的说明性和非限制性实例中,每个病毒生命周期为10-20分钟。类似地,可以调节条件以调整宿主细胞在宿主细胞群体中保留的时间,例如约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约30、约35、约40、约45、约50、约55、约60、约70、约80、约90、约100、约120、约150、或约180分钟。可以部分地通过宿主细胞的密度来控制宿主细胞群体,或者在一些实施例中,流入物中的宿主细胞密度为例如103个细胞/ml、约104个细胞/ml、约105个细胞/ml、约5-105个细胞/ml、约106个细胞/ml、约5-106个细胞/ml、约107个细胞/ml、约5-107个细胞/ml、约108个细胞/ml、约5-108个细胞/ml、约109个细胞/ml、约5·109个细胞/ml、约1010个细胞/ml、或约5·1010个细胞/ml。
核酸
启动子
在一些实施例中,一个或多个启动子或增强子元件与例如控制异源对象序列表达的编码Gene Writer多肽的核酸或模板核酸可操作地连接。在某些实施例中,该一个或多个启动子或增强子元件包含细胞类型或组织特异性元件。在一些实施例中,启动子或增强子是相同的或源自天然地控制异源对象序列表达的启动子或增强子。例如,鸟氨酸转氨甲酰酶启动子和增强子可用于在本发明提供的系统或方法中控制鸟氨酸转氨甲酰酶基因的表达以便纠正鸟氨酸转氨甲酰酶缺陷。在一些实施例中,启动子是表4B中的启动子或其功能性片段或变体。
可以例如在统一资源定位符(例如,https://www.invivogen.com/tissue- specific-promoters)中找到可商购的示例性组织特异性启动子。在一些实施例中,启动子是天然启动子或最小启动子,例如由来自给定基因的5’区域的单个片段组成。在一些实施例中,天然启动子包含核心启动子及其天然5’UTR。在一些实施例中,5’UTR包含内含子。在其他实施例中,这些包括复合型启动子,这些复合型启动子组合了起点不同的启动子元件,或由远端增强子与起点相同的最小启动子组装而产生。在一些实施例中,一个或多个组织特异性表达控制序列包含PCT公开号WO2020014209(通过引用以其全文并入本文)的表2或表3中的一个或多个序列。
示例性细胞或组织特异性启动子在以下各表中提供,并且编码它们的示例性核酸序列是本领域已知的并且可以使用多种资源轻松地访问,例如NCBI数据库,包括RefSeq,以及真核启动子数据库(http://epd.epfl.ch//index.php)。
表4B.示例性细胞或组织特异性启动子
Figure BDA0003761233040005791
Figure BDA0003761233040005801
表4C.另外的示例性细胞或组织特异性启动子
Figure BDA0003761233040005802
Figure BDA0003761233040005811
Figure BDA0003761233040005821
Figure BDA0003761233040005831
取决于所利用的宿主/载体系统,可以在表达载体中使用许多合适的转录和翻译控制元件中的任一种,包括组成型和诱导型启动子、转录增强子元件、转录终止子等(参见例如,Bitter等人(1987)Methods in Enzymology[酶学方法],153:516-544;其通过引用以其全文并入本文)。
在一些实施例中,编码Gene Writer的核酸或模板核酸与控制元件(例如,转录控制元件,例如启动子)可操作地连接。在一些实施例中,转录控制元件可以在真核细胞(例如,哺乳动物细胞)或原核细胞(例如,细菌或古细菌细胞)中起作用。在一些实施例中,编码多肽的核苷酸序列与例如允许该编码多肽的核苷酸序列在原核和真核细胞中表达的多个控制元件可操作地连接。
出于说明目的,空间上受限的启动子的实例包括但不限于神经元特异性启动子、脂肪细胞特异性启动子、心肌细胞特异性启动子、平滑肌特异性启动子、光感受器特异性启动子等。神经元特异性空间上受限的启动子包括但不限于神经元特异性烯醇化酶(NSE)启动子(参见例如EMBL HSENO2、X51956);芳香族氨基酸脱羧酶(AADC)启动子、神经丝启动子(参见例如,GenBank HUMNFL,L04147);突触蛋白启动子(参见例如,GenBank HUMSYNIB,M55301);thy-1启动子(参见例如,Chen等人(1987)Cell[细胞]51:7-19;以及Llewellyn,等人(2010)Nat.Med.[自然·医学]16(10):1161-1166);5-羟色胺受体启动子(参见例如,GenBank S62283);酪氨酸羟化酶启动子(TH)(参见例如,Oh等人(2009)Gene Ther[基因治疗]16:437;Sasaoka等人(1992)Mol.Brain Res.[分子脑研究]16:274;Boundy等人(1998)J.Neurosci.[神经科学杂志]18:9989;以及Kaneda等人(1991)Neuron[神经元]6:583-594);GnRH启动子(参见例如,Radovick等人(1991)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]88:3402-3406);L7启动子(参见例如,Oberdick等人(1990)Science[科学]248:223-226);DNMT启动子(参见例如,Bartge等人(1988)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]85:3648-3652);脑啡肽启动子(参见例如,Comb等人(1988)EMBO J.[欧洲分子生物学学会杂志]17:3793-3805);髓鞘碱性蛋白(MBP)启动子;Ca2+-钙调蛋白依赖性蛋白激酶II-α(CamKIIα)启动子(参见例如,Mayford等人(1996)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]93:13250;以及Casanova等人(2001)Genesis[遗传]31:37);CMV增强子/血小板源性生长因子-β启动子(参见例如,Liu等人(2004)Gene Therapy[基因治疗]11:52-60);等。
脂肪细胞特异性的空间上受限的启动子包括但不限于:aP2基因启动子/增强子,例如,人aP2基因的-5.4kb至+21bp区域(参见例如,Tozzo等人(1997)Endocrinol[内分泌学].138:1604;Ross等人(1990)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]87:9590;以及Pavjani等人(2005)Nat.Med.[自然·医学]11:797);葡萄糖转运蛋白-4(GLUT4)启动子(参见例如,Knight等人(2003)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]100:14725);脂肪酸转位酶(FAT/CD36)启动子(参见例如,Kuriki等人(2002)Biol.Pharm.Bull[生物和医药学报].25:1476;以及Sato等人(2002)J.Biol.Chem.[生物化学杂志]277:15703);硬脂酰基-辅酶A去饱和酶-1(SCD1)启动子(Tabor等人(1999)J.Biol.Chem.[生物化学杂志]274:20603);瘦素启动子(参见例如,Mason等人(1998)Endocrinol.[内分泌学]139:1013;以及Chen等人(1999)Biochem.Biophys.Res.Comm.[生物化学与生物物理研究通讯]262:187);脂连蛋白启动子(参见例如,Kita等人(2005)Biochem.Biophys.Res.Comm.[生物化学与生物物理研究通讯]331:484;以及Chakrabarti(2010)Endocrinol.[内分泌学]151:2408);降脂蛋白启动子(参见例如,Platt等人(1989)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]86:7490);抗胰岛素蛋白启动子(参见例如,Seo等人(2003)Molec.Endocrinol.[分子内分泌学]17:1522);等。
心肌细胞特异性的空间上受限的启动子包括但不限于源自以下基因的控制序列:肌球蛋白轻链-2、α-肌球蛋白重链、AE3、心肌肌钙蛋白C、心肌肌动蛋白等。Franz等人(1997)Cardiovasc.Res.[心血管研究]35:560-566;Robbins等人(1995)Ann.N.Y.Acad.Sci.[纽约科学院年鉴]752:492-505;Linn等人(1995)Circ.Res.[循环研究]76:584-591;Parmacek等人(1994)Mol.Cell.Biol.[分子细胞生物学]14:1870-1885;Hunter等人(1993)Hypertension[高血压]22:608-617;以及Sartorelli等人(1992)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]89:4047-4051。
平滑肌特异性的空间上受限的启动子包括但不限于SM22α启动子(参见例如,Akyürek等人(2000)Mol.Med.[分子医学]6:983;以及美国专利号7,169,874);平滑肌细胞分化特异性抗原(smoothelin)启动子(参见例如,WO 2001/018048);α-平滑肌肌动蛋白启动子;等。例如,已经证明SM22α启动子的0.4kb区域(其中存在两个CArG元件)介导血管平滑肌细胞特异性表达(参见例如,Kim,等人(1997)Mol.Cell.Biol.[分子细胞生物学]17,2266-2278;Li,等人,(1996)J.Cell Biol.[细胞生物学杂志]132,849-859;以及Moessler,等人(1996)Development[发育]122,2415-2425)。
光感受器特异性的空间上受限的启动子包括但不限于视紫红质启动子;视紫红质激酶启动子(Young等人(2003)Ophthalmol.Vis.Sci.[眼科学与视觉科学]44:4076;β磷酸二酯酶基因启动子(Nicoud等人(2007)J.Gene Med.[基因医学杂志]9:1015);视网膜色素变性基因启动子(Nicoud等人(2007)同上);光感受器间维生素A类结合蛋白(IRBP)基因增强子(Nicoud等人(2007)同上);IRBP基因启动子(Yokoyama等人(1992)Exp Eye Res.[实验眼科研究杂志]55:225);等。
非限制性示例性细胞特异性启动子
本领域已知的细胞特异性启动子可用于引导Gene Writer蛋白的表达,例如,如本文所述。非限制性示例性哺乳动物细胞特异性启动子已被表征并用于以细胞特异性方式表达Cre重组酶的小鼠。某些非限制性示例性哺乳动物细胞特异性启动子列于US 9845481的表1中,该文献通过引用并入本文。
在一些实施例中,细胞特异性启动子是在植物中具有活性的启动子。许多示例性的细胞特异性植物启动子是本领域已知的。参见例如,美国专利号5,097,025;5,783,393;5,880,330;5,981,727;7,557,264;6,291,666;7,132,526;以及7,323,622;以及美国公开号2010/0269226;2007/0180580;2005/0034192;以及2005/0086712,出于任何目的这些均通过引用以其全文并入本文。
在一些实施例中,如本文所述的载体包含表达盒。如本文所用,术语“表达盒”是指包含足以表达本发明的核酸分子的核酸元件的核酸构建体。典型地,表达盒包含本发明的与启动子序列可操作地连接的核酸分子。术语“可操作地连接”是指两个或更多个核酸片段在单个核酸片段上的缔合,这样使得一个核酸片段的功能受到另一个的影响。例如,当启动子能够影响编码序列的表达时,则该启动子与该编码序列可操作地连接(例如,该编码序列在该启动子的转录控制之下)。编码序列能以有义或反义取向与调节序列可操作地连接。在某些实施例中,启动子是异源启动子。如本文所用,术语“异源启动子”是指在自然界中未发现与给定编码序列可操作地连接的启动子。在某些实施例中,表达盒可以包含另外的元件,例如,内含子、增强子、聚腺苷酸化位点、土拨鼠应答元件(WRE)和/或已知影响编码序列表达水平的其他元件。“启动子”典型地控制编码序列或功能性RNA的表达。在某些实施例中,启动子序列包含近端和更远端上游元件,并可以进一步包含增强子元件。“增强子”典型地可以刺激启动子的活性,且可以是启动子的固有元件或被插入以增强启动子的水平或组织特异性的异源元件。在某些实施例中,启动子整体源自天然基因。在某些实施例中,启动子由源自不同天然存在的启动子的不同元件构成。在某些实施例中,启动子包含合成的核苷酸序列。本领域技术人员将理解,不同的启动子将引导基因在不同的组织或细胞类型中、或在不同的发育阶段、或应答于不同的环境条件或应答于药物或转录辅助因子的存在或不存在的表达。普遍存在的、细胞类型特异性的、组织特异性的、发育阶段特异性的和条件性的启动子,例如,药物应答性启动子(例如,四环素应答性启动子)为本领域技术人员所熟知。启动子的实例包括但不限于:磷酸甘油酸激酶(PKG)启动子、CAG(CMV增强子、鸡β肌动蛋白启动子(CBA)和兔β珠蛋白内含子的复合物)、NSE(神经元特异性烯醇化酶)、突触蛋白或NeuN启动子、SV40早期启动子、小鼠乳腺肿瘤病毒LTR启动子;腺病毒主要晚期启动子(AdMLP);单纯疱疹病毒(HSV)启动子、巨细胞病毒(CMV)启动子例如CMV立即早期启动子区(CMVIE)、SFFV启动子、劳斯肉瘤病毒(RSV)启动子、合成启动子、杂合启动子等。其他启动子可以是人类来源的或来自其他物种(包括来自小鼠)。常见的启动子包括例如:人巨细胞病毒(CMV)立即早期基因启动子、SV40早期启动子、劳斯肉瘤病毒长末端重复序列、[β]-肌动蛋白、大鼠胰岛素启动子、磷酸甘油酸激酶启动子、人α-1抗胰蛋白酶(hAAT)启动子、甲状腺素转运蛋白启动子、TBG启动子和其他肝脏特异性启动子、结蛋白启动子和类似的肌肉特异性启动子、EF1-α启动子、CAG启动子和其他组成型启动子、具有多组织特异性的杂合启动子、对神经元特异的启动子(如突触蛋白)和甘油醛-3-磷酸脱氢酶启动子,所有这些都是本领域技术人员熟知且容易获得的启动子,可用于获得目的编码序列的高水平表达。另外,源自非病毒基因(如鼠金属硫蛋白基因)的序列也将在本文找到用途。此类启动子序列可商购自例如Stratagene公司(Stratagene)(加利福尼亚州圣地亚哥(San Diego,CA))。另外的示例性启动子序列描述于例如WO 2018213786A1(其通过引用以其全文并入本文)中。
在一些实施例中,载脂蛋白E增强子(ApoE)或其功能性片段用于例如促使在肝脏中的表达。在一些实施例中,使用两个拷贝的ApoE增强子或其功能性片段。在一些实施例中,ApoE增强子或其功能性片段与启动子(例如,人α-1抗胰蛋白酶(hAAT)启动子)组合使用。
在一些实施例中,调节序列赋予组织特异性基因表达能力。在一些情况下,组织特异性调节序列结合以组织特异性方式诱导转录的组织特异性转录因子。各种组织特异性调节序列(例如,启动子、增强子等)是本领域已知的。示例性组织特异性调节序列包括但不限于以下组织特异性启动子:肝脏特异性甲状腺素结合球蛋白(TBG)启动子、胰岛素启动子、胰高血糖素启动子、生长抑素启动子、胰多肽(PPY)启动子、突触蛋白-1(Syn)启动子、肌酸激酶(MCK)启动子、哺乳动物结蛋白(DES)启动子、α-肌球蛋白重链(a-MHC)启动子或心肌肌钙蛋白T(cTnT)启动子。其他示例性启动子包括:β-肌动蛋白启动子、乙型肝炎病毒核心启动子,Sandig等人,Gene Ther.[基因治疗],3:1002-9(1996);甲胎蛋白(AFP)启动子,Arbuthnot等人,Hum.Gene Ther.[人类基因治疗],7:1503-14(1996)),骨钙素启动子(Stein等人,Mol.Biol.Rep.[分子生物学报告],24:185-96(1997));骨唾液蛋白启动子(Chen等人,J.Bone Miner.Res.[骨与矿物质研究杂志]11:654-64(1996)),CD2启动子(Hansal等人,J.Immunol.[免疫学杂志],161:1063-8(1998);免疫球蛋白重链启动子;T细胞受体α链启动子,神经元例如神经元特异性烯醇化酶(NSE)启动子(Andersen等人Cell.Mol.Neurobiol.[细胞和分子神经生物学],13:503-15(1993)),神经丝轻链基因启动子(Piccioli等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊],88:5611-5(1991)),和神经元特异性vgf基因启动子(Piccioli等人,Neuron[神经元],15:373-84(1995)),以及其他。另外的示例性启动子序列描述于例如美国专利号10300146(其通过引用以其全文并入本文)中。在一些实施例中,组织特异性调节元件(例如,组织特异性启动子)选自已知与在给定组织中高度表达的基因可操作地连接的一种,例如,如通过RNA-seq或蛋白质表达数据、或其组合所测量的。用于通过表达分析组织特异性的方法教授于Fagerberg等人MolCell Proteomics[分子与细胞蛋白质组学]13(2):397-406(2014)中,该文献通过引用以其全文并入本文。
在一些实施例中,本文所述的载体是多顺反子表达构建体。多顺反子表达构建体包括例如携带第一表达盒和第二表达盒的构建体,该第一表达盒例如包含第一启动子和第一编码核酸序列,该第二表达盒例如包含第二启动子和第二编码核酸序列。在一些情况下,此类多顺反子表达构建体可特别用于递送非翻译基因产物(例如发夹RNA)以及多肽(例如,gene writer和gene writer模板)。在一些实施例中,多顺反子表达构建体可以表现出一种或多种所包括的转基因的降低的表达水平,例如,这是因为启动子干扰或存在非常接近的不相容的核酸元件。如果多顺反子表达构建体是病毒载体的一部分,则在一些情况下,自我互补核酸序列的存在可能会干扰病毒繁殖或包装所需结构的形成。
在一些实施例中,序列编码含发夹的RNA。在一些实施例中,发夹RNA是指导RNA、模板RNA、shRNA、或microRNA。在一些实施例中,第一启动子是RNA聚合酶I启动子。在一些实施例中,第一启动子是RNA聚合酶II启动子。在一些实施例中,第二启动子是RNA聚合酶III启动子。在一些实施例中,第二启动子是U6或H1启动子。在一些实施例中,核酸构建体包含AAV构建体B1或B2的结构。
在不希望受理论约束的情况下,与含有仅一个顺反子的表达系统相比,多顺反子表达构建体可能无法实现最佳的表达水平。利用包含两个或更多个启动子元件的多顺反子表达构建体实现的表达水平降低的所认为的原因之一是启动子干扰现象(参见例如,Curtin J A,Dane A P,Swanson A,Alexander I E,Ginn S L.Bidirectional promoterinterference between two widely used internal heterologous promoters in alate-generation lentiviral construct[晚期慢病毒构建体中两个广泛使用的内部异源启动子之间的双向启动子干扰].Gene Ther[基因治疗].2008年3月;15(5):384-90;和Martin-Duque P,Jezzard S,Kaftansis L,Vassaux G.Direct comparison of theinsulating properties of two genetic elements in an adenoviral vectorcontaining two different expression cassettes[在含有两个不同表达盒的腺病毒载体中对两个遗传元件的绝缘特性的直接比较].Hum Gene Ther[人类基因疗法].2004年10月;15(10):995-1002;两个参考文献均通过引用并入本文以披露启动子干扰现象)。在一些实施例中,可以通过以下克服启动子干扰的问题,例如通过产生包含仅一个启动子的多顺反子表达构建体,该启动子促进由内部核糖体进入位点分开的多个编码核酸序列的转录;或通过将包含具有转录绝缘子元件的自身启动子的顺反子分开。在一些实施例中,多个顺反子的单启动子驱动的表达可能导致顺反子的不均匀表达水平。在一些实施例中,不能有效地分离启动子并且分离元件可能与一些基因转移载体(例如,一些逆转录病毒载体)不相容。
微小RNA
微小RNA(miRNA)和其他小干扰核酸通常经由靶RNA转录物切割/降解或靶信使RNA(mRNA)的翻译抑制来调节基因表达。在一些情况下,miRNA可以天然表达,典型地作为最终的19-25个非翻译RNA产物。miRNA通常通过与靶mRNA的3′非翻译区(UTR)的序列特异性相互作用来表现出它们的活性。这些内源表达的miRNA可以形成发夹前体,这些发夹前体随后被加工成miRNA双链体,并进一步加工成成熟的单链miRNA分子。这种成熟的miRNA通常指导多蛋白复合物miRISC,miRISC基于其与成熟miRNA的互补性来识别靶mRNA的靶3′UTR区。有用的转基因产物可以包括例如调节连接的多肽表达的miRNA或miRNA结合位点。miRNA基因的非限制性列表;例如,在如US 10300146,22:25-25:48(其通过引用并入)中所列的那些方法的方法中,这些基因及其同源物的产物可用作转基因或用作小干扰核酸(例如,miRNA海绵、反义寡核苷酸)的靶标。在一些实施例中,将一个或多个前述miRNA的一个或多个结合位点掺入转基因(例如,由rAAV载体递送的转基因)中,例如以抑制转基因在携带该转基因的动物的一种或多种组织中的表达。在一些实施例中,可以选择结合位点以便以组织特异性方式控制转基因的表达。例如,可以将肝脏特异性miR-122的结合位点掺入转基因中以抑制该转基因在肝脏中的表达。另外的示例性miRNA序列描述于例如美国专利号10300146(其通过引用以其全文并入本文)中。
miR抑制剂或miRNA抑制剂通常是阻断miRNA表达和/或加工的药剂。此类药剂的实例包括但不限于:抑制miRNA与Drosha复合物相互作用的微小RNA拮抗剂、微小RNA特异性反义、微小RNA海绵和微小RNA寡核苷酸(双链、发夹、短寡核苷酸)。微小RNA抑制剂(例如,miRNA海绵)可以在来自转基因的细胞中表达(例如,如Ebert,M.S.Nature Methods[自然方法],2007年8月12日电子公开中所述;其通过引用以其全文并入本文)。在一些实施例中,微小RNA海绵或其他miR抑制剂与AAV一起使用。微小RNA海绵通常通过互补七聚体种子序列特异性抑制miRNA。在一些实施例中,可以使用单个海绵序列沉默整个miRNA家族。其他用于在细胞中沉默miRNA功能(miRNA靶标的去阻抑)的方法对于本领域普通技术人员来说将是显而易见的。
在一些实施例中,如本文所述的miRNA包含PCT公开号WO2020014209的表4中所列的序列,该PCT公开通过引用并入本文。还通过引用并入本文的是来自WO 2020014209的示例性miRNA序列的列表。
在一些实施例中,在一部分细胞中使Gene Writing系统的组分(例如,编码GeneWriter多肽的核酸、编码转基因的核酸)沉默是有利的。在一些实施例中,限制GeneWriting系统的组分的表达以选择目的组织内的细胞类型是有利的。
例如,已知在给定组织(例如肝脏)中,巨噬细胞和免疫细胞(例如肝脏中的枯否细胞)可参与Gene Writing系统的一种或多种组分的递送媒介物的摄取。在一些实施例中,在巨噬细胞和免疫细胞例如枯否细胞中高度表达的至少一种miRNA的至少一个结合位点包括在Gene Writing系统的至少一种组分中,例如编码Gene Writing多肽或转基因的核酸。在一些实施例中,靶向一个或多个结合位点的miRNA列于本文参考的表中,例如miR-142,例如成熟miRNA hsa-miR-142-5p或hsa-miR-142-3p。
在一些实施例中,在转基因的Gene Writer表达或过表达可能具有毒性作用的细胞中降低Gene Writer水平和/或Gene Writer活性可能是有益的。例如,已显示将转基因过表达盒递送至背根神经节神经元可导致基因治疗的毒性(参见Hordeaux等人Sci TranslMed[科学转化医学]12(569):eaba9188(2020),其通过引用以其全文并入本文)。在一些实施例中,可将至少一个miRNA结合位点掺入Gene Writing系统的核酸组分中以降低系统组分在神经元例如背根神经节神经元中的表达。在一些实施例中,掺入Gene Writing系统的核酸组分中以降低系统组分在神经元中的表达的至少一个miRNA结合位点是miR-182的结合位点,例如成熟miRNA hsa-miR-182-5p或hsa-miR-182-3p。在一些实施例中,掺入GeneWriting系统的核酸组分中以降低系统组分在神经元中的表达的至少一个miRNA结合位点是miR-183的结合位点,例如成熟miRNA hsa-miR-183-5p或hsa-miR-183-3p。在一些实施例中,miRNA结合位点的组合可用于增强Gene Writing系统的一种或多种组分对目的组织或细胞类型的表达的限制。
下表提供了示例性miRNA和相应的表达细胞,例如,在一些实施例中,可以将miRNA的结合位点(互补序列)掺入转基因或多肽核酸中,例如,以降低在该脱靶细胞中的表达。
表4D:来自脱靶细胞和组织的示例性miRNA
Figure BDA0003761233040005911
Figure BDA0003761233040005921
5’UTR和3’UTR
在某些实施例中,包含编码Gene Writer多肽(例如,如本文所述)的开放阅读框的核酸包含5’UTR和/或3’UTR。在实施例中,用于蛋白质表达的5’UTR和3’UTR,例如用于GeneWriter多肽或异源对象序列的mRNA(或编码RNA的DNA),包含优化的表达序列。在一些实施例中,5’UTR包含GGGAAAUAAGAGAGAAAAGAAGAGUAAGAAGAAAUAUAAGAGCCACC(SEQ ID NO:3475)和/或3’UTR包含UGAUAAUAGGCUGGAGCCUCGGUGGCCAUGCUUCUUGCCCCUUGGGCCUCCCCCCAGCCCCUCCUCCCCUUCCUGCACCCGUACCCCCGUGGUCUUUGAAUAAAGUCUGA(SEQ ID NO:3476),例如,如Richner等人Cell[细胞]168(6):P1114-1125(2017)中所述,其中的序列通过引用并入本文。
在一些实施例中,Gene Writer系统的开放阅读框,例如,编码Gene Writer多肽的mRNA(或编码mRNA的DNA)的ORF或异源对象序列的mRNA(或编码mRNA的DNA)的一个或多个ORF,侧翼有增强其表达的5’和/或3’非翻译区(UTR)。在一些实施例中,系统的mRNA组分(或从DNA组分产生的转录物)的5’UTR包含序列5’-GGGAAAUAAGAGAGAAAAGAAGAGUAAGAAGAAAUAUAAGAGCCACC-3’(SEQ ID NO:3475)。在一些实施例中,系统的mRNA组分(或从DNA组分产生的转录物)的3’UTR包含序列5’-UGAUAAUAGGCUGGAGCCUCGGUGGCCAUGCUUCUUGCCCCUUGGGCCUCCCCCCAGCCCCUCCUCCCCUUCCUGCACCCGUACCCCCGUGGUCUUUGAAUAAAGUCUGA-3’(SEQ ID NO:3476)。Richner等人Cell[细胞]168(6):P1114-1125(2017)已经证明5’UTR和3’UTR的这种组合实现了可操作地连接的ORF的理想表达,该文献的传授内容和序列通过引用并入本文。在一些实施例中,本文所述的系统包含编码转录物的DNA,其中该DNA包含对应的5’UTR和3’UTR序列,其中T取代以上所列的序列中的U。在一些实施例中,用于产生系统的RNA组分的DNA载体进一步包含用于启动体外转录的5’UTR上游的启动子,例如T7、T3、或SP6启动子。以上5’UTR以GGG开头,这对于使用T7 RNA聚合酶优化转录是合适的开始。对于调整转录水平和改变转录起始位点核苷酸以适应替代性的5’UTR,Davidson等人.Pac Symp Biocomput[Pac Symp生物计算]433-443(2010)的传授内容描述了满足这两个特征的T7启动子变体及其发现方法。
病毒载体及其组分
除了如本文所述的相关酶或结构域的来源,例如作为本文所用的重组酶和DNA结合结构域(例如,Cre重组酶、λ整合酶或来自AAV Rep蛋白的DNA结合结构域)的来源,病毒是用于本文所述的系统的有用的递送媒介物来源。一些酶可以具有多种活性。在一些实施例中,用作Gene Writer递送系统或其组分来源的病毒可选自如Baltimore Bacteriol Rev[细菌综述]35(3):235-241(1971)所述的组。
在一些实施例中,病毒选自组I病毒,例如,该病毒是DNA病毒并将dsDNA包装成病毒体。在一些实施例中,组I病毒选自例如腺病毒、疱疹病毒、痘病毒。
在一些实施例中,病毒选自组II病毒,例如,该病毒是DNA病毒并将ssDNA包装成病毒体。在一些实施例中,组II病毒选自例如细小病毒。在一些实施例中,细小病毒是依赖性细小病毒,例如腺相关病毒(AAV)。
在一些实施例中,病毒选自组III病毒,例如,该病毒是RNA病毒并将dsRNA包装成病毒体。在一些实施例中,组III病毒选自例如呼肠孤病毒。在一些实施例中,包含在此类病毒体中的dsRNA的一条或两条链是编码分子,在转导至宿主细胞后能够直接用作mRNA,例如,在转导至宿主细胞后可以直接翻译成蛋白质而不需要任何干预性核酸复制或聚合步骤。
在一些实施例中,病毒选自组IV病毒,例如,该病毒是RNA病毒并将ssRNA(+)包装成病毒体。在一些实施例中,组IV病毒选自例如冠状病毒、小RNA病毒、披膜病毒。在一些实施例中,包含在此类病毒体中的ssRNA(+)是编码分子,在转导至宿主细胞后能够直接用作mRNA,例如,在转导至宿主细胞后可以直接翻译成蛋白质而不需要任何干预性核酸复制或聚合步骤。
在一些实施例中,病毒选自组V病毒,例如,该病毒是RNA病毒并将ssRNA(-)包装成病毒体。在一些实施例中,组V病毒选自例如正黏病毒、弹状病毒。在一些实施例中,具有ssRNA(-)基因组的RNA病毒还在病毒体内携带酶,该酶被转导至具有病毒基因组的宿主细胞,例如RNA依赖性RNA聚合酶,能够将ssRNA(-)拷贝到可以由宿主直接翻译的ssRNA(+)。
在一些实施例中,病毒选自组VI病毒,例如,该病毒是逆转录病毒并将ssRNA(+)包装成病毒体。在一些实施例中,组VI病毒选自例如逆转录病毒。在一些实施例中,逆转录病毒是慢病毒,例如,HIV-1、HIV-2、SIV、BIV。在一些实施例中,逆转录病毒是泡沫病毒属(spumavirus),例如泡沫病毒(foamy virus),例如HFV、SFV、BFV。在一些实施例中,包含在此类病毒体中的ssRNA(+)是编码分子,在转导至宿主细胞后能够直接用作mRNA,例如,在转导至宿主细胞后可以直接翻译成蛋白质而不需要任何干预性核酸复制或聚合步骤。在一些实施例中,ssRNA(+)首先被逆转录并拷贝以产生dsDNA基因组中间体,mRNA可以由该基因组中间体在宿主细胞中得以转录。在一些实施例中,具有ssRNA(+)基因组的RNA病毒还在病毒体内携带酶,该酶被转导至具有病毒基因组的宿主细胞,例如RNA依赖性DNA聚合酶,能够将ssRNA(+)拷贝到可以转录为mRNA并由宿主翻译的dsDNA。
在一些实施例中,病毒选自组VII病毒,例如,该病毒是逆转录病毒并将dsRNA包装成病毒体。在一些实施例中,组VII病毒选自例如嗜肝DNA病毒。在一些实施例中,包含在此类病毒体中的dsRNA的一条或两条链是编码分子,在转导至宿主细胞后能够直接用作mRNA,例如,在转导至宿主细胞后可以直接翻译成蛋白质而不需要任何干预性核酸复制或聚合步骤。在一些实施例中,包含在此类病毒体中的dsRNA的一条或两条链首先被逆转录并拷贝以产生dsDNA基因组中间体,mRNA可以由该基因组中间体在宿主细胞中得以转录。在一些实施例中,具有dsRNA基因组的RNA病毒还在病毒体内携带酶,该酶被转导至具有病毒基因组的宿主细胞,例如RNA依赖性DNA聚合酶,能够将dsRNA拷贝到可以转录为mRNA并由宿主翻译的dsDNA。
在一些实施例中,本发明中用于递送核酸的病毒体还可以携带参与Gene Writing过程的酶。例如,病毒体可以包含与核酸一起被递送到宿主细胞中的重组酶结构域。在一些实施例中,模板核酸可以与病毒体内的Gene Writer多肽缔合,从而在从病毒颗粒转导核酸后两者被共同递送至靶细胞。在一些实施例中,病毒体中的核酸可以包含DNA,例如线性ssDNA、线性dsDNA、环状ssDNA、环状dsDNA、微环DNA、dbDNA、ceDNA。在一些实施例中,病毒体中的核酸可以包含RNA,例如线性ssRNA、线性dsRNA、环状ssRNA、环状dsRNA。在一些实施例中,病毒基因组可以在转导至宿主细胞后环化,例如,线性ssRNA分子可以经历共价连接以形成环状ssRNA,线性dsRNA分子可以经历共价连接以形成环状dsRNA或一个或多个环状ssRNA。在一些实施例中,病毒基因组可以通过在宿主细胞中的滚环复制来复制。在一些实施例中,病毒基因组可以包含单个核酸分子,例如,包含非分段基因组。在一些实施例中,病毒基因组可以包含两个或更多个核酸分子,例如,包含分段基因组。在一些实施例中,病毒体中的核酸可以与一种或蛋白质缔合。在一些实施例中,病毒体中的一种或多种蛋白质可在转导后被递送至宿主细胞。在一些实施例中,可通过向靶核酸添加病毒体包装信号而使天然病毒适于核酸递送,其中宿主细胞用于包装含有包装信号的靶核酸。
在一些实施例中,用作递送媒介物的病毒体可以包含共生人类病毒。在一些实施例中,用作递送媒介物的病毒体可以包含指环病毒,其用途描述于WO 2018232017A1中,该文献通过引用以其全文并入本文。
组合物和系统的产生
如本领域技术人员将理解的那样,设计和构建核酸构建体和蛋白质或多肽(例如本文所述的系统、构建体和多肽)的方法在本领域中是常规的。通常,可以使用重组方法。通常,参见Smales和James(编辑),Therapeutic Proteins:Methods and Protocols[治疗性蛋白:方法和方案](Methods in Molecular Biology[分子生物学方法]),Humana Press[胡玛纳出版社](2005);以及Crommelin,Sindelar和Meibohm(编辑),PharmaceuticalBiotechnology:Fundamentals and Applications[药物生物技术:基础与应用],Springer[斯普林格出版社](2013)。设计、制备、评估、纯化和操纵核酸组合物的方法描述于Green和Sambrook(编辑),Molecular Cloning:A Laboratory Manual[分子克隆:实验室手册](第四版),Cold Spring Harbor Laboratory Press[冷泉港实验室出版社](2012)。
用于产生本文所述的治疗性药物蛋白质或多肽的示例性方法涉及在哺乳动物细胞中表达,尽管也可以使用昆虫细胞、酵母、细菌、或其他细胞,在适当的启动子控制下,产生重组蛋白。哺乳动物表达载体可以包含非转录元件,如复制起点、合适的启动子、以及其他5'或3’侧翼非转录序列;以及5'或3'非翻译序列,如必要的核糖体结合位点、聚腺苷酸化位点、剪接供体和受体位点、以及终止序列。源自SV40病毒基因组的DNA序列,例如SV40起点、早期启动子、剪接和聚腺苷酸化位点可以用于提供异源DNA序列表达所需的其他遗传元件。在以下文献中描述了用于与细菌、真菌、酵母、和哺乳动物细胞宿主一起使用的适当的克隆和表达载体:Green和Sambrook,Molecular Cloning:A Laboratory Manual[分子克隆:实验室手册](第四版),Cold Spring Harbor Laboratory Press[冷泉港实验室出版社](2012)。
各种哺乳动物细胞培养系统可以用于表达和制造重组蛋白。哺乳动物表达系统的实例包括CHO、COS、HEK293、HeLA和BHK细胞系。在以下文献中描述了用于生产蛋白治疗剂的宿主细胞培养的过程:Zhou和Kantardjieff(编辑),Mammalian Cell Cultures forBiologics Manufacturing[用于生物制品制造的哺乳动物细胞培养](Advances inBiochemical Engineering/Biotechnology[生物化学工程/生物科技的进展]),Springer[斯普林格出版社](2014)。本文所述的组合物可包括载体,例如编码重组蛋白的病毒载体,例如慢病毒载体。在一些实施例中,载体,例如病毒载体,可以包含编码重组蛋白的核酸。
在以下文献中描述了蛋白治疗剂的纯化:Franks,Protein Biotechnology:Isolation,Characterization,and Stabilization[蛋白生物技术:分离、表征、和稳定化],Humana Press[胡玛纳出版社](2013);以及Cutler,Protein PurificationProtocols[蛋白纯化方案](Methods in Molecular Biology[分子生物学方法]),HumanaPress[胡玛纳出版社](2010)。
本披露部分地涉及核酸和氨基酸序列与参考序列或彼此的比较以确定所述序列之间的%同一性或错配数量。本领域技术人员将理解许多方法和/或工具可用于进行这样的测定,包括NCBI的BLAST和执行两个输入序列的全局序列比对的成对比对工具(例如,使用Needleman-Wunsch比对算法),例如欧洲生物信息学研究所(EBI)和欧洲分子生物学实验室(EMBL)EMBOSS Needle工具。
RNA(例如,gRNA或mRNA,例如,编码GeneWriter的mRNA)也可以如本文所述产生。在一些实施例中,RNA区段可以通过化学合成产生。在一些实施例中,RNA区段可以通过核酸模板的体外转录产生,例如通过提供RNA聚合酶以作用于DNA模板的同源启动子以产生RNA转录物。在一些实施例中,使用例如T7、T3、或SP6 RNA聚合酶或其衍生物进行体外转录,该RNA聚合酶或其衍生物作用于DNA(例如,dsDNA、ssDNA、线性DNA、质粒DNA、线性DNA扩增子、线性化质粒DNA),该DNA例如编码RNA区段,例如在同源启动子(例如,T7、T3或SP6启动子)的转录控制下。在一些实施例中,化学合成和体外转录的组合用于产生RNA区段以便组装。在实施例中,gRNA通过化学合成产生,且异源对象序列区段通过体外转录产生。在不希望受理论约束的情况下,体外转录可能更适合于产生较长的RNA分子。在一些实施例中,可以降低体外转录的反应温度,例如低于37℃(例如,在0-10C、10-20C、或20-30C之间),以使全长转录物的比例更高(参见Krieg Nucleic Acids Res[核酸研究]18:6463(1990),其通过引用以其全文并入本文)。在一些实施例中,采用用于长转录物的改进合成的方案来合成长RNA(例如,大于5kb的RNA),例如使用例如可以在体外产生27kb转录物的T7 RiboMAX Express(Thiel等人J Gen Virol[普通病毒学杂志]82(6):1273-1281(2001))。在一些实施例中,如本文所述对RNA分子的修饰可以在RNA区段合成期间(例如,通过包含经修饰的核苷酸或替代性的结合化学物质)、在通过化学或酶促过程合成RNA区段之后、在一个或多个RNA区段组装之后或其组合中掺入。
在一些实施例中,使用T7聚合酶介导的DNA依赖性RNA转录从线性化DNA模板体外合成系统的mRNA(例如,编码Gene Writer多肽的mRNA),其中UTP任选地被1-甲基假UTP取代。在一些实施例中,转录物掺入了5′和3′UTR,例如,GGGAAAUAAGAGAGAAAAGAAGAGUAAGAAGAAAUAUAAGAGCCACC(SEQ ID NO:3475)和UGAUAAUAGGCUGGAGCCUCGGUGGCCAUGCUUCUUGCCCCUUGGGCCUCCCCCCAGCCCCUCCUCCCCUUCCUGCACCCGUACCCCCGUGGUCUUUGAAUAAAGUCUGA(SEQ IDNO:3476),或其功能性片段或变体,并且任选地包括聚A尾,该聚A尾可在DNA模板中编码或在转录后酶促地添加。在一些实施例中,将供体甲基基团(例如,S-腺苷甲硫氨酸)添加到具有帽0(cap 0)结构的甲基化的加帽RNA中以产生提高mRNA翻译效率的帽1结构(Richner等人Cell[细胞]168(6):P1114-1125(2017))。
在一些实施例中,来自T7启动子的转录物以GGG基序起始。在一些实施例中,来自T7启动子的转录物不以GGG基序起始。已经表明,在转录起始处的GGG基序尽管提供了更高的产率,但由于转录物在模板链的三个C残基上发生从+1到+3的滑移,转录起始处的GGG基序可能导致T7 RNAP合成聚(G)产物的阶梯(Imburgio等人.Biochemistry[生物化学]39(34):10419-10430(2000))。对于调整转录水平和改变转录起始位点核苷酸以适应替代性的5’UTR,Davidson等人.Pac Symp Biocomput[Pac Symp生物计算]433-443(2010)的传授内容描述了满足这两个特征的T7启动子变体及其发现方法。
在一些实施例中,RNA区段可以通过共价偶联彼此连接。在一些实施例中,RNA连接酶(例如,T4 RNA连接酶)可用于将两个或更多个RNA区段彼此连接。当使用诸如RNA连接酶的试剂时,5′末端典型地与3′末端连接。在一些实施例中,如果将两个区段连接,则可以形成两种可能的线性构建体(即,(1)5′-区段1-区段2-3′和(2)5′-区段2-区段1-3′)。在一些实施例中,还可以发生分子内环化。这两个问题可以例如通过阻断一个5′末端或一个3′末端以使RNA连接酶不能将末端连接到另一个末端来解决。在实施例中,如果需要构建体5′-区段1-区段2-3′,则将阻断基团置于区段1的5′端或区段2的3′端可导致仅形成正确的线性连接产物和/或防止分子内环化。用于共价连接两个核酸(例如,RNA)区段的组合物和方法连同包括使用RNA连接酶将两个单链RNA区段彼此定向连接的方法披露于例如US20160102322A1(通过引用以其全文并入本文)中。
可以与例如T4 RNA连接酶结合使用的末端阻断剂的一个实例是双脱氧终止子。T4RNA连接酶典型地催化5′-磷酸和3′-羟基末端之间磷酸二酯键的ATP依赖性连接。在一些实施例中,当使用T4 RNA连接酶时,合适的末端必须存在于被连接的末端上。在末端阻断T4RNA连接酶的一种手段包括不具有正确的末端形式。通常,具有5-羟基或3'-磷酸的RNA区段的末端不会充当T4 RNA连接酶的底物。
可用于连接RNA区段的另外的示例性方法是通过点击化学(例如,如美国专利号7,375,234和7,070,941以及美国专利公开号2013/0046084中所述,其中的全部披露通过引用并入本文)。例如,一种示例性的点击化学反应是在炔烃基团和叠氮化物基团之间进行(参见US 20160102322 A1的图11,其通过引用以其全文并入本文)。任何点击反应都有可能被用于连接RNA区段(例如,Cu-叠氮化物-炔烃、菌株促进的叠氮化物-炔烃、施陶丁格(Staudinger)连接、四嗪连接、光诱导的四唑-烯烃、硫醇-烯、NHS酯、环氧化物、异氰酸酯和醛-氨基氧基)。在一些实施例中,使用点击化学反应连接RNA分子是有利的,因为点击化学反应快速、模块化、高效,通常不产生有毒废产物,可以用水作为溶剂进行,和/或可以设置成具有立体特异性。
在一些实施例中,可以使用叠氮化物-炔烃胡伊斯根环加成(HuisgenCycloaddition)反应连接RNA区段,该反应典型地是叠氮化物与末端或内部炔烃之间的1,3-偶极环加成,其得到用于连接RNA区段的1,2,3-三唑。在不希望受理论约束的情况下,该连接方法的一个优点可以是该反应可以通过添加所需的Cu(I)离子来引发。可以连接RNA区段的其他示例性机制包括但不限于使用卤素(F—、Br—、I—)/炔烃加成反应、羰基/巯基/马来酰亚胺、和羧基/胺键。例如,可以在3′处用硫醇修饰一个RNA分子(使用二硫键亚酰胺和通用支持物或二硫化物修饰的支持物),并且可以在5′处用acrydite修饰另一个RNA分子(使用丙烯酸亚磷酰胺),然后可以通过迈克尔(Michael)加成反应将两个RNA分子连接。该策略也可以应用于逐步连接多个RNA分子。还提供了用于将多于两个(例如,三个、四个、五个、六个等)RNA分子彼此连接的方法。在不希望受理论约束的情况下,当所需的RNA分子长于约40个核苷酸时,这可能是有用的,例如,使得化学合成效率降低,例如,如US20160102322 A1(其通过引用以其全文并入本文)中所指明。
举例来说,tracrRNA的长度典型地为大约80个核苷酸。此类RNA分子可以例如通过诸如体外转录或化学合成的过程来产生。在一些实施例中,当化学合成用于产生此类RNA分子时,它们可以作为单一合成产物或通过将两个或更多个合成的RNA区段彼此连接来产生。在实施例中,当三个或更多个RNA区段彼此连接时,可以使用不同的方法将各个区段连接在一起。此外,RNA区段可以在一锅(例如,容器、器皿、孔、管、板或其他接受器)中、全部同时或在一锅中在不同时间或在不同锅中在不同时间彼此连接。在非限制性实例中,为了按数字顺序组装RNA区段1、2和3,可以首先将RNA区段1和2从5'到3'彼此连接。然后可以纯化反应产物的反应混合物组分(例如,通过色谱法),然后放置在第二锅中,以便将3′末端与RNA区段3的5′末端连接。然后可以将最终反应产物与RNA区段3的5′末端连接。
在另一个非限制性实例中,RNA区段1(约30个核苷酸)是crRNA的靶基因座识别序列和发夹区1的部分。RNA区段2(约35个核苷酸)含有发夹区1的其余部分和发夹区1与发夹区2之间的一些线性tracrRNA。RNA区段3(约35个核苷酸)含有发夹区1与发夹区2之间的线性tracrRNA的其余部分以及全部的发夹区2。在该实例中,使用点击化学将RNA区段2和3从5′到3′连接。此外,反应产物的5′和3′末端均被磷酸化。然后使反应产物与具有3′末端羟基基团的RNA区段1和T4 RNA连接酶接触以产生指导RNA分子。
许多另外的连接化学物质可以用于根据本发明的方法连接RNA区段。这些化学物质中的一些阐述于US 20160102322 A1的表6中,该文献通过引用以其全文并入本文。
载体
本披露部分地提供了编码本文所述的Gene Writer多肽、本文所述的模板核酸、或两者的核酸(例如,载体)。在一些实施例中,载体包含选择性标志物,例如,抗生素抗性标志物。在一些实施例中,抗生素抗性标志物是卡那霉素抗性标志物。在一些实施例中,抗生素抗性标志物不赋予对β-内酰胺抗生素的抗性。在一些实施例中,载体不包含氨苄西林抗性标志物。在一些实施例中,载体包含卡那霉素抗性标志物而不包含氨苄西林抗性标志物。在一些实施例中,将编码Gene Writer多肽的载体整合到靶细胞基因组中(例如,在施用于靶细胞、组织、器官或受试者后)。在一些实施例中,不将编码Gene Writer多肽的载体整合到靶细胞基因组中(例如,在施用于靶细胞、组织、器官或受试者后)。在一些实施例中,不将包含模板核酸(例如,模板DNA)的载体整合到靶细胞基因组中(例如,在施用于靶细胞、组织、器官或受试者后)。在一些实施例中,如果将载体整合到靶细胞基因组中的靶位点中,则不将选择性标志物整合到基因组中。在一些实施例中,如果将载体整合到靶细胞基因组中的靶位点中,则不将参与载体维持的基因或序列(例如,质粒维持基因)整合到基因组中。在一些实施例中,如果将载体整合到靶细胞基因组中的靶位点中,则不将转移调节序列(例如,反向末端重复序列,例如,来自AAV)整合到基因组中。在一些实施例中,向靶细胞、组织、器官或受试者施用载体(例如,编码本文所述的Gene Writer多肽、本文所述的模板核酸、或两者的载体)可使载体的部分整合到所述靶细胞、组织、器官或受试者的一个或多个基因组中的一个或多个靶位点中。在一些实施例中,包含整合材料的少于99%、95%、90%、80%、70%、60%、50%、40%、30%、20%、10%、5%、4%、3%、2%、或1%的靶位点(例如,没有靶位点)包含来自载体的选择性标志物(例如,抗生素抗性基因)、转移调节序列(例如,反向末端重复序列,例如,来自AAV)、或两者。
AAV载体
在一些实施例中,编码本文所述的Gene Writer多肽、本文所述的模板核酸、或两者的载体是腺相关病毒(AAV)载体,例如,其包含AAV基因组。在一些实施例中,AAV基因组包含分别编码四种复制蛋白和三种衣壳蛋白的两个基因。在一些实施例中,基因的侧翼中任何一侧有145-bp的反向末端重复序列(ITR)。在一些实施例中,病毒体包含例如以1:1:10比率产生的多达三种衣壳蛋白(Vp1、Vp2、和/或Vp3)。在一些实施例中,衣壳蛋白产生自相同的开放阅读框和/或差异剪接(Vp1)和替代性的翻译起始位点(分别为Vp2和Vp3)。通常,Vp3是病毒体中最丰富的亚基,并参与细胞表面的受体识别,从而定义了病毒的嗜性。在一些实施例中,Vp1在Vp1的N末端包含例如在病毒感染性方面起作用的磷脂酶结构域。
在一些实施例中,病毒载体的包装能力限制了可以包装到载体中的碱基编辑器的大小。例如,AAV的包装能力可以是约4.5kb(例如,约3.0、3.5、4.0、4.5、5.0、5.5、或6.0kb),例如,包括一个或两个反向末端重复序列(ITR),例如,145个碱基ITR。
在一些实施例中,重组AAV(rAAV)包含在载体转基因盒侧翼的顺式作用145-bpITR,例如,提供高达4.5kb用于外源DNA的包装。感染后,在一些情况下,rAAV可以表达本文所述的蛋白质,并通过以环状头对尾连环体形式游离地存在而持续存在而不整合到宿主基因组中。rAAV可以例如在体外和体内使用。在一些实施例中,AAV介导的基因递送要求基因的编码序列的长度在大小上等于或大于野生型AAV基因组。
超过该大小的基因的AAV递送和/或大的生理调节元件的使用可以例如通过将要递送的一种或多种蛋白质分成两个或更多个片段来完成。在一些实施例中,N末端片段与断裂的内含肽-N融合。在一些实施例中,C末端片段与断裂的内含肽-C融合。在实施例中,将片段包装到两个或更多个AAV载体中。
在一些实施例中,通过将大的转基因表达盒分成两个单独的半部分(5端和3端,或头和尾)来产生双重AAV载体,例如,其中盒的每一半被包装在单个AAV载体中(其<5kb)。在一些实施例中,然后可以在通过两个双重AAV载体对同一细胞进行的共感染后实现全长转基因表达盒的重新组装。在一些实施例中,共感染之后是以下中的一项或多项:(1)5和3基因组之间的同源重组(HR)(双重AAV重叠载体);(2)5和3基因组的ITR介导的尾对头连环化(双重AAV反式剪接载体);和/或(3)这两种机制的组合(双重AAV杂合载体)。在一些实施例中,体内使用双重AAV载体导致全长蛋白质的表达。在一些实施例中,双重AAV载体平台的使用代表了用于大小大于约4.0、4.1、4.2、4.3、4.4、4.5、4.6、4.7、4.8、4.9、或5.0kb的转基因的有效且可行的基因转移策略。在一些实施例中,AAV载体还可用于例如在核酸和肽的体外生产中用靶核酸转导细胞。在一些实施例中,AAV载体可用于体内和离体基因治疗程序(参见例如,West等人,Virology[病毒学]160:38-47(1987);美国专利号4,797,368;WO 93/24641;Kotin,Human Gene Therapy[人类基因疗法]5:793-801(1994);Muzyczka,J.Clin.Invest.[临床研究杂志]94:1351(1994);其中每个通过引用以其全文并入本文)。重组AAV载体的构建描述于许多公开物中,包括美国专利号5,173,414;Tratschin等人,Mol.Cell.Biol.[分子细胞生物学]5:3251-3260(1985);Tratschin,等人,Mol.Cell.Biol.[分子细胞生物学]4:2072-2081(1984);Hermonat和Muzyczka,PNAS[美国国家科学院院刊]81:6466-6470(1984);以及Samulski等人,J.Virol.[病毒学杂志]63:03822-3828(1989)(其通过引用以其全文并入本文)。
在一些实施例中,本文所述的Gene Writer(例如,具有或不具有一种或多种指导核酸)可以使用AAV、慢病毒、腺病毒或其他质粒或病毒载体类型进行递送,特别是使用来自以下文献的配制品和剂量:例如,美国专利号8,454,972(针对腺病毒的配制品、剂量)、美国专利号8,404,658(针对AAV的配制品、剂量)和美国专利号5,846,946(针对DNA质粒的配制品、剂量)以及来自临床试验和关于涉及慢病毒、AAV和腺病毒的临床试验的公开物。例如,对于AAV,施用途径、配制品和剂量可如美国专利号8,454,972和涉及AAV的临床试验中所述。对于腺病毒,施用途径、配制品和剂量可如美国专利号8,404,658和涉及腺病毒的临床试验中所述。对于质粒递送,施用途径、配制品和剂量可如美国专利号5,846,946和涉及质粒的临床研究中所述。剂量可以基于或外推为平均70kg的个体(例如男性成人),并且可以针对患者、受试者、不同重量和物种的哺乳动物进行调整。施用频率在医学或兽医学从业者(例如医师、兽医师)的范围之内,其取决于常规因素,包括患者或受试者的年龄、性别、一般健康状况、其他状况以及着手解决的特定病症或症状。在一些实施例中,可以将病毒载体注射到目的组织中。对于细胞类型特异性Gene Writing,在一些实施例中,Gene Writer和任选的指导核酸的表达可以由细胞类型特异性启动子驱动。
在一些实施例中,例如,由于纯化方法不需要可以激活免疫反应的细胞颗粒的超速离心,AAV允许低毒性。在一些实施例中,AAV允许引起插入诱变的可能性低,原因是例如它基本上不整合到宿主基因组中。
在一些实施例中,AAV具有约4.4、4.5、4.6、4.7、或4.75kb的包装限制。在一些实施例中,Gene Writer、启动子和转录终止子可以配合在单个病毒载体中。在一些情况下,SpCas9(4.1kb)可能难以包装成AAV。因此,在一些实施例中,使用长度比其他Gene Writer或碱基编辑器短的Gene Writer。在一些实施例中,Gene Writer小于约4.5kb、4.4kb、4.3kb、4.2kb、4.1kb、4kb、3.9kb、3.8kb、3.7kb、3.6kb、3.5kb、3.4kb、3.3kb、3.2kb、3.1kb、3kb、2.9kb、2.8kb、2.7kb、2.6kb、2.5kb、2kb、或1.5kb。
AAV可以是AAV1、AAV2、AAV5或其任何组合。在一些实施例中,AAV的类型是根据要靶向的细胞来选择的;例如,可选择AAV血清型1、2、5或杂合衣壳AAV1、AAV2、AAV5或其任何组合用于靶向脑或神经元细胞;或者可以选择AAV4用于靶向心脏组织。在一些实施例中,选择AAV8用于递送至肝脏。关于这些细胞的示例性AAV血清型描述于例如Grimm,D.等人,J.Virol.[病毒学杂志]82:5887-5911(2008)(其通过引用以其全文并入本文)中。在一些实施例中,AAV是指所有血清型、亚型和天然存在的AAV以及重组AAV。AAV可用于指代病毒本身或其衍生物。在一些实施例中,AAV包括AAV1、AAV2、AAV3、AAV3B、AAV4、AAV5、AAV6、AAV6.2、AAV7、AAVrh.64Rl、AAVhu.37、AAVrh.8、AAVrh.32.33、AAV8、AAV9、AAV-DJ、AAV2/8、AAVrhlO、AAVLK03、AV10、AAV11、AAV 12、rhlO、和其杂合体,禽AAV、牛AAV、犬AAV、马AAV、灵长类动物AAV、非灵长类动物AAV、和羊AAV。各种AAV血清型的基因组序列,以及天然末端重复序列(TR)、Rep蛋白和衣壳亚基的序列是本领域已知的。此类序列可在文献或公共数据库如GenBank中找到。表5中列出了另外的示例性AAV血清型。
表5:病毒递送方式
Figure BDA0003761233040006041
Figure BDA0003761233040006051
在一些实施例中,药物组合物(例如,包含如本文所述的AAV的药物组合物)具有少于10%的空衣壳、少于8%的空衣壳、少于7%的空衣壳、少于5%的空衣壳、少于3%的空衣壳、或少于1%的空衣壳。在一些实施例中,药物组合物具有少于约5%的空衣壳。在一些实施例中,空衣壳的数量低于检测限。在一些实施例中,药物组合物具有少量空衣壳是有利的,原因是例如空衣壳可能产生例如很少或没有实质性的治疗益处的不良应答(例如,免疫应答、炎性应答、肝脏应答和/或心脏应答)。
在一些实施例中,药物组合物中的残余宿主细胞蛋白(rHCP)少于或等于100ng/mlrHCP/1x1013vg/ml,例如,少于或等于40ng/ml rHCP/1x1013vg/ml或1-50ng/ml rHCP/1x1013vg/ml。在一些实施例中,药物组合物包含少于10ng rHCP/l.0x1013vg、或少于5ngrHCP/1.0x1013vg、少于4ng rHCP/1.0x1013vg、或少于3ng rHCP/1.0x1013vg,或介于之间的任何浓度。在一些实施例中,药物组合物中的残余宿主细胞DNA(hcDNA)少于或等于5x106pg/ml hcDNA/1x1013vg/ml、少于或等于1.2x106pg/ml hcDNA/1x1013vg/ml、或1x105pg/ml hcDNA/1x1013vg/ml。在一些实施例中,所述药物组合物中的残余宿主细胞DNA少于5.0x105pg/1x1013vg、少于2.0x105pg/l.0x1013vg、少于1.1x105pg/1.0x1013vg、少于1.0x105pg hcDNA/1.0x1013vg、少于0.9x105pg hcDNA/1.0x1013vg、少于0.8x105pg hcDNA/1.0x1013vg,或介于之间的任何浓度。
在一些实施例中,药物组合物中的残余质粒DNA少于或等于1.7x105pg/ml/1.0x1013vg/ml、或1x105pg/ml/1x1.0x1013vg/ml、或1.7x106pg/ml/1.0x1013vg/ml。在一些实施例中,药物组合物中的残余DNA质粒少于10.0x105pg/1.0x1013vg、少于8.0x105pg/1.0x1013vg或少于6.8x105pg/1.0x1013vg。在实施例中,药物组合物包含少于0.5ng/1.0x1013vg、少于0.3ng/1.0x1013vg、少于0.22ng/1.0x1013vg或少于0.2ng/1.0x1013vg或任何中间浓度的牛血清白蛋白(BSA)。在实施例中,药物组合物中的全能核酸酶(benzonase)为少于0.2ng/1.0x1013vg、少于0.1ng/1.0x1013vg、少于0.09ng/1.0x1013vg、少于0.08ng/1.0x1013vg或任何中间浓度。在实施例中,药物组合物中的泊洛沙姆188(Poloxamer 188)为约10至150ppm、约15至100ppm或约20至80ppm。在实施例中,药物组合物中的铯为少于50pg/g(ppm)、少于30pg/g(ppm)或少于20pg/g(ppm)或任何中间浓度。
在实施例中,药物组合物包含少于10%、少于8%、少于7%、少于6%、少于5%、少于4%、少于3%、少于2%或介于之间的任何百分比的总杂质,例如,如通过SDS-PAGE测定。在实施例中,例如,如通过SDS-PAGE测定的总纯度为大于90%、大于92%、大于93%、大于94%、大于95%、大于96%、大于97%、大于98%、或介于之间的任何百分比。在实施例中,例如,如通过SDS-PAGE测量的,没有单一的未命名相关杂质多于5%、多于4%、多于3%或多于2%、或介于之间的任何百分比。在实施例中,药物组合物包含的填充的衣壳相对于总衣壳(例如,如通过分析型超速离心测量的峰1+峰2)的百分比为大于85%、大于86%、大于87%、大于88%、大于89%、大于90%、大于91%、大于91.9%、大于92%、大于93%,或介于之间的任何百分比。在药物组合物的实施例中,通过分析型超速离心在峰1中测量的填充的衣壳的百分比为20%-80%、25%-75%、30%-75%、35%-75%或37.4%-70.3%。在药物组合物的实施例中,通过分析型超速离心在峰2中测量的填充的衣壳的百分比为20%-80%、20%-70%、22%-65%、24%-62%、或24.9%-60.1%。
在一个实施例中,药物组合物包含1.0至5.0x1013vg/mL、1.2至3.0x1013vg/mL或1.7至2.3x1013vg/ml的基因组效价。在一个实施例中,药物组合物显示出小于5CFU/mL、小于4CFU/mL、小于3CFU/mL、小于2CFU/mL或小于1CFU/mL或任何中间浓度的生物负载。在实施例中,根据USP,例如USP<85>(通过引用以其全文并入)的内毒素的量少于1.0EU/mL、少于0.8EU/mL或少于0.75EU/mL。在实施例中,根据USP,例如USP<785>(通过引用以其全文并入)的药物组合物的渗透压摩尔浓度为350至450mOsm/kg、370至440mOsm/kg或390至430mOsm/kg。在实施例中,药物组合物含有少于1200个大于25μm的颗粒/容器、少于1000个大于25μm的颗粒/容器、少于500个大于25μm的颗粒/容器或任何中间值。在实施例中,药物组合物含有少于10,000个大于10μm的颗粒/容器、少于8000个大于10μm的颗粒/容器、或少于600个大于10pm的颗粒/容器。
在一个实施例中,药物组合物具有0.5至5.0x1013vg/mL、1.0至4.0x1013vg/mL、1.5至3.0x1013vg/ml或1.7至2.3x1013vg/ml的基因组效价。在一个实施例中,本文所述的药物组合物包含以下中的一项或多项:小于约0.09ng全能核酸酶/1.0x1013vg,小于约30pg/g(ppm)的铯,约20至80ppm泊洛沙姆188,小于约0.22ng BSA/1.0x1013vg,小于约6.8x105pg的残余DNA质粒/1.0x1013vg,小于约1.1x105pg的残余hcDNA/1.0x1013vg,小于约4ng的rHCP/1.0x1013vg,pH 7.7至8.3,约390至430mOsm/kg,小于约600个大小>25μm的颗粒/容器,小于约6000个大小>10μm的颗粒/容器,约1.7x1013-2.3x1013vg/mL基因组效价,约3.9x108至8.4x1010IU/1.0x1013vg的感染效价,约100-300pg/1.0x1013vg的总蛋白,在约7.5x1013vg/kg剂量的病毒载体情况下A7SMA小鼠>24天的平均存活,根据基于体外细胞的测定的约70%至130%相对效力和/或小于约5%空衣壳。在各种实施例中,本文所述的药物组合物包含本文讨论的任何病毒颗粒,该药物组合物保留了参考标准品的±20%之间、±15%之间、±10%之间、或±5%内的效力。在一些实施例中,使用合适的体外细胞测定或体内动物模型来测量效力。
WO 2019094253中传授了制备、表征和给予AAV颗粒的另外的方法,该文献通过引用以其全文并入本文。
可与本发明一致采用的另外的rAAV构建体包括Wang等人2019中所述的那些,可获得于://doi.org/10.1038/s41573-019-0012-9,包括其表1,其通过引用以其全文并入。
试剂盒、制品和药物组合物
在一个方面,本披露提供了一种试剂盒,该试剂盒包含Gene Writer或GeneWriting系统,例如,如本文所述。在一些实施例中,该试剂盒包含Gene Writer多肽(或编码该多肽的核酸)和模板DNA。在一些实施例中,该试剂盒进一步包含用于将系统引入细胞的试剂,例如转染试剂、LNP等。在一些实施例中,该试剂盒适用于本文所述的任何方法。在一些实施例中,该试剂盒包含一种或多种元件、组合物(例如,药物组合物)、Gene Writer和/或Gene Writer系统,或其功能性片段或组分,它们例如布置在制品中。在一些实施例中,该试剂盒包含其使用说明书。
在一个方面,本披露提供了一种制品,例如,其中布置有本文所述的试剂盒或其组分。
在一个方面,本披露提供了一种药物组合物,该药物组合物包含Gene Writer或Gene Writing系统,例如,如本文所述。在一些实施例中,药物组合物进一步包含药学上可接受的载剂或赋形剂。在一些实施例中,药物组合物包含模板DNA。
化学、制造和控制(CMC)
在例如以下文献中描述了蛋白治疗剂的纯化:Franks,Protein Biotechnology:Isolation,Characterization,and Stabilization[蛋白生物技术:分离、表征、和稳定化],Humana Press[胡玛纳出版社](2013);以及Cutler,Protein PurificationProtocols[蛋白纯化方案](Methods in Molecular Biology[分子生物学方法]),HumanaPress[胡玛纳出版社](2010)。
在一些实施例中,Gene WriterTM系统、多肽和/或模板核酸(例如,模板DNA)符合某些质量标准。在一些实施例中,通过本文所述的方法产生的Gene WriterTM系统、多肽和/或模板核酸(例如,模板DNA)符合某些质量标准。因此,在一些方面,本披露涉及制造符合某些质量标准的Gene WriterTM系统、多肽和/或模板核酸的方法,例如,其中对所述质量标准进行测定。在一些方面,本披露还涉及在Gene WriterTM系统、多肽和/或模板核酸中测定所述质量标准的方法。在一些实施例中,质量标准包括但不限于以下中的一项或多项(例如,1、2、3、4、5、6、7、8、9、10、11、或12项):
(i)模板DNA或编码GeneWriter多肽的mRNA的长度,例如,该DNA或mRNA的长度是否超出参考长度或在参考长度范围内,例如是否存在的至少80%、85%、90%、95%、96%、97%、98%、或99%的DNA或mRNA的长度大于100、125、150、175、或200个核苷酸;
(ii)mRNA上聚A尾的存在、不存在和/或长度,例如是否存在的至少80%、85%、90%、95%、96%、97%、98%、或99%的mRNA含有聚A尾(例如,长度为至少5、10(SEQ ID NO:3540)、20(SEQ ID NO:3541)、30(SEQ ID NO:3542)、50(SEQ ID NO:3543)、70(SEQ ID NO:3544)、100(SEQ ID NO:3545)个核苷酸的聚A尾);
(iii)mRNA上5’帽的存在、不存在和/或类型,例如是否存在的至少80%、85%、90%、95%、96%、97%、98%、或99%的mRNA含有5’帽,例如该帽是否是7-甲基鸟苷帽,例如O-Me-m7G帽;
(iv)mRNA中一种或多种经修饰的核苷酸(例如,选自假尿苷、二氢尿苷、肌苷、7-甲基鸟苷、1-N-甲基假尿苷(1-Me-Ψ)、5-甲氧基尿苷(5-MO-U)、5-甲基胞苷(5mC)或锁定的核苷酸)的存在、不存在和/或类型,例如是否存在的至少80%、85%、90%、95%、96%、97%、98%、或99%的mRNA含有一种或多种经修饰的核苷酸;
(v)模板DNA或mRNA的稳定性(例如,随着时间的推移和/或在预选条件下),例如是否至少80%、85%、90%、95%、96%、97%、98%、或99%的DNA或mRNA在稳定性测试后保持完整(例如,长度大于100、125、150、175或200个核苷酸);
(vi)模板DNA或mRNA在用于修饰DNA的系统中的效力,例如,在测定了包含DNA或mRNA的系统的效力之后,是否至少1%的靶位点被修饰;
(vii)多肽、第一多肽或第二多肽的长度,例如,该多肽、第一多肽或第二多肽的长度是否超出参考长度或在参考长度范围内,例如是否存在的至少80%、85%、90%、95%、96%、97%、98%、或99%的多肽、第一多肽或第二多肽的长度大于600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1600、1700、1800、1900、或2000个氨基酸(并且任选地,长度不超过2500、2000、1500、1400、1300、1200、1100、1000、900、800、700、或600个氨基酸);
(viii)多肽、第一多肽或第二多肽上翻译后修饰的存在、不存在和/或类型,例如是否至少80%、85%、90%、95%、96%、97%、98%、或99%的多肽、第一多肽或第二多肽含有磷酸化、甲基化、乙酰化、肉豆蔻酰化、棕榈酰化、异戊二烯化、glipyatyon或脂酰化,或其任何组合;
(ix)多肽、第一多肽或第二多肽中一种或多种人工、合成或非典型氨基酸(例如,选自鸟氨酸、β-丙氨酸、GABA、δ-氨基乙酰丙酸、PABA、D-氨基酸(例如,D-丙氨酸或D-谷氨酸)、氨基异丁酸、脱氢丙氨酸、胱硫醚、羊毛硫氨酸、甲烯胱氨酸、二氨基庚二酸、高丙氨酸、正缬氨酸、正亮氨酸、高正亮氨酸(Homonorleucine)、高丝氨酸、O-甲基-高丝氨酸和O-乙基-高丝氨酸、乙硫氨酸、硒代半胱氨酸、硒代高半胱氨酸、硒代甲硫氨酸、硒代乙硫氨酸、碲代半胱氨酸或碲代甲硫氨酸)的存在、不存在和/或类型,例如是否存在的至少80%、85%、90%、95%、96%、97%、98%、或99%的多肽、第一多肽或第二多肽含有一个或多个人工、合成或非典型氨基酸;
(x)多肽、第一多肽或第二多肽的稳定性(例如,随着时间的推移和/或在预选条件下),例如是否至少80%、85%、90%、95%、96%、97%、98%、或99%的多肽、第一多肽或第二多肽在稳定性测试后保持完整(例如,长度大于600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1600、1700、1800、1900、或2000个氨基酸(并且任选地,长度不超过2500、2000、1500、1400、1300、1200、1100、1000、900、800、700、或600个氨基酸));
(xi)多肽、第一多肽或第二多肽在用于修饰DNA的系统中的效力,例如在测定了包含多肽、第一多肽或第二多肽的系统的效力之后是否至少1%的靶位点被修饰;或
(xii)热原、病毒、真菌、细菌病原体或宿主细胞蛋白中的一种或多种的存在、不存在、和/或水平,例如,系统是否不含或基本上不含热原、病毒、真菌、细菌病原体或宿主细胞蛋白污染。
在一些实施例中,本文所述的系统或药物组合物不含内毒素。
在一些实施例中,对热原、病毒、真菌、细菌病原体和/或宿主细胞蛋白中的一种或多种的存在、不存在、和/或水平进行确定。在实施例中,对系统是否不含或基本上不含热原、病毒、真菌、细菌病原体和/或宿主细胞蛋白污染进行确定。
在一些实施例中,如本文所述的药物组合物或系统具有以下特征中的一项或多项(例如,1、2、3或4项):
(a)相对于编码多肽的RNA的少于1%(例如,少于0.5%、0.4%、0.3%、0.2%、或0.1%)的DNA模板,例如,以摩尔计;
(b)相对于编码多肽的RNA的少于1%(例如,少于0.5%、0.4%、0.3%、0.2%、或0.1%)的未加帽RNA,例如,以摩尔计;
(c)相对于编码多肽的RNA的小于1%(例如,小于0.5%、0.4%、0.3%、0.2%、或0.1%)的部分长度RNA,例如,以摩尔计;
(d)基本上缺乏未反应的帽二核苷酸。
示例性异源对象序列
在一些实施例中,本文提供的系统或方法包含异源对象序列,其中该异源对象序列或其反向互补序列编码蛋白质(例如,抗体)或肽。在一些实施例中,疗法是由监管机构例如FDA批准的疗法。
在一些实施例中,蛋白质或肽是来自THPdb数据库的蛋白质或肽(Usmani等人PLoSOne[公共科学图书馆·综合]12(7):e0181748(2017),其通过引用以其全文并入本文)。在一些实施例中,蛋白质或肽是表5B中披露的蛋白质或肽。在一些实施例中,本文披露的系统或方法,例如包含Gene Writer的那些系统或方法,可用于将来自表5B的蛋白质或肽的表达盒整合到宿主细胞中,以使蛋白质或肽能够在宿主中表达。在一些实施例中,表5B第一列中的蛋白质或肽的序列可以在表5B第三列中提供的专利或申请中找到,这些专利或申请通过引用以其全文并入。
在一些实施例中,蛋白质或肽是Lu等人J Biomed Sci[生物医学科学杂志]27(1):1(2020)的表1中披露的抗体,该文献通过引用以其全文并入本文。在一些实施例中,蛋白质或肽是表29中披露的抗体。在一些实施例中,本文披露的系统或方法,例如包含GeneWriter的那些系统或方法,可用于将来自表29的抗体的表达盒整合到宿主细胞中,以使抗体能够在宿主中表达。在一些实施例中,本文所述的系统或方法用于在具有表29的第3列的适应证的受试者中表达与表29的第2列的靶标结合的药剂(例如,表29的第1列的单克隆抗体)。
表5B.示例性蛋白质和肽治疗剂。
Figure BDA0003761233040006111
Figure BDA0003761233040006121
Figure BDA0003761233040006131
Figure BDA0003761233040006141
Figure BDA0003761233040006151
Figure BDA0003761233040006161
Figure BDA0003761233040006171
Figure BDA0003761233040006181
Figure BDA0003761233040006191
Figure BDA0003761233040006201
表29.示例性单克隆抗体疗法。
Figure BDA0003761233040006202
Figure BDA0003761233040006211
Figure BDA0003761233040006221
Figure BDA0003761233040006231
应用
使用本文所述的系统,任选地使用本文所述的任何递送方式(包括纳米颗粒递送方式,例如脂质纳米颗粒,和病毒递送方式,例如AAV),本发明还提供用于修饰DNA分子(例如核DNA,即在细胞的基因组中)的应用(方法),无论是体外、离体、原位或体内,例如在生物(例如受试者,包括哺乳动物受试者,例如人)的组织中。通过将编码基因整合到DNA序列模板中,Gene Writer系统可以满足治疗需求,例如,通过在具有功能丧失性突变的个体中提供治疗性转基因(例如,包含在如本文所述的对象序列中)的表达,通过以正常转基因代替功能获得性突变,通过提供调节序列以消除功能获得性突变表达,和/或通过控制可操作地连接的基因、转基因及其系统的表达。在某些实施例中,对象序列(例如,异源对象序列)包含编码对宿主细胞的治疗需要特异的功能性元件(例如,多肽或非编码RNA,例如,如本文所述)的编码序列。在一些实施例中,对象序列(例如,异源对象序列)包含启动子,例如组织特异性启动子或增强子。在一些实施例中,启动子可以与编码序列可操作地连接。
在某些方面,本发明提供了修饰细胞、组织或受试者中的靶DNA链的方法,其包括向该细胞、组织或受试者施用如本文所述的系统(任选地通过本文所述的方式),其中该系统将异源对象序列插入靶DNA链中,从而修饰该靶DNA链。在某些实施例中,异源对象序列因此在细胞、组织或受试者中表达。在一些实施例中,细胞、组织或受试者是哺乳动物(例如人)细胞、组织或受试者。如此修饰的示例性细胞包括肝细胞、肺上皮细胞、离子细胞。这样的细胞可以是原代细胞或不是永生化的。在相关方面,本发明还提供了治疗哺乳动物组织的方法,该方法包括向哺乳动物施用如本文所述的系统,从而治疗该组织,其中该组织缺乏异源对象序列。在前述方面和实施例中任一个的某些实施例中,Gene Writer多肽作为瞬时存在的核酸提供。
在一些实施例中,本发明的系统能够在靶DNA中产生插入。设想本文所述的系统能够导致外源非编码核酸(例如miRNA、lncRNA、shRNA、siRNA、tRNA、mtRNA、gRNA或rRNA)的表达,蛋白编码序列(例如治疗性蛋白或调节蛋白)的表达,调节元件(例如启动子、增强子、转录因子结合位点、表观遗传修饰位点、miRNA结合位点、剪接供体或受体位点、或终止序列)的掺入,或其他DNA序列(例如间隔子)的掺入。根据插入的内容和背景,因此可以表达外源蛋白或改变内源蛋白或细胞系统的表达。在一些实施例中,Gene Writing系统可用于通过插入诱变敲除内源基因,例如通过将插入DNA整合到编码或调节区中。在一些实施例中,Gene Writing系统可用于同时引发转基因盒(例如CAR)的表达,同时通过介导编码转基因盒的插入DNA整合到内源基因或基因座中来破坏内源基因或基因座(例如TRAC)的表达。在一些实施例中,Gene Writing系统可用于通过将转基因表达盒整合到内源等位基因中来替代等位基因,从而破坏其表达。
在实施例中,Gene WriterTM基因编辑器系统可以提供包含例如治疗剂(例如,治疗性转基因)的对象序列,该治疗剂表达例如替换型血液因子或替换型酶例如溶酶体酶。例如,本文所述的组合物、系统和方法可用于在靶人基因组中表达半乳糖苷酶α或β以治疗法布里病(Fabry Disease);针对戈谢病(Gaucher Disease)的伊米苷酶、塔格苷酶(taliglucerase)α、维拉苷酶(velaglucerase)α或阿糖脑苷酶;针对溶酶体酸性脂肪酶缺乏症(沃尔曼病(Wolman disease)/CESD)的塞贝脂酶α;针对黏多醣贮积症的拉罗尼酶、艾度硫酸酯酶、依罗硫酸酯酶α、或加硫酶;针对庞贝病的阿糖苷酶α。例如,本文所述的组合物、系统和方法可用于在靶人基因组中表达因子I、II、V、VII、X、XI、XII或XIII,以改善血液因子缺陷。
在一些实施例中,异源对象序列编码细胞内蛋白(例如,细胞质蛋白、核蛋白、细胞器蛋白如线粒体蛋白或溶酶体蛋白或膜蛋白)。在一些实施例中,异源对象序列编码膜蛋白,例如除CAR以外的膜蛋白和/或内源人膜蛋白。在一些实施例中,异源对象序列编码细胞外蛋白。在一些实施例中,异源对象序列编码酶,结构蛋白,信号传导蛋白、调节蛋白、转运蛋白、感觉蛋白、运动蛋白、防御蛋白或储存蛋白。其他蛋白包括免疫受体蛋白,例如合成免疫受体蛋白如嵌合抗原受体蛋白(CAR)、T细胞受体、B细胞受体或抗体。
Gene WritingTM系统可用于修饰免疫细胞。在一些实施例中,Gene WritingTM系统可用于修饰T细胞。在一些实施例中,T细胞可包括任何T细胞亚群,例如CD4+、CD8+、γ-δ、初始T细胞、干细胞记忆T细胞、中央记忆T细胞或亚群的混合物。在一些实施例中,GeneWritingTM系统可用于递送或修饰T细胞中的T细胞受体(TCR)。在一些实施例中,GeneWritingTM系统可用于将至少一种嵌合抗原受体(CAR)递送至T细胞。在一些实施例中,GeneWritingTM系统可用于将至少一种CAR递送至天然杀伤(NK)细胞。在一些实施例中,GeneWritingTM系统可用于将至少一种CAR递送至天然杀伤T(NKT)细胞。在一些实施例中,GeneWritingTM系统可用于将至少一种CAR递送至祖细胞,例如T、NK或NKT细胞的祖细胞。在一些实施例中,用至少一种CAR修饰的细胞(例如,CAR-T细胞、CAR-NK细胞、CAR-NKT细胞)或用至少一种CAR修饰的细胞的组合(例如,CAR-NK/T细胞的混合物)用于治疗病症,该病症如在通过引用以其全文并入本文的MacKay,等人Nat Biotechnol[自然生物技术]38,233-244(2020)中的CAR疗法的可靶向图谱中鉴定的病症。在一些实施例中,免疫细胞包含对选自由以下组成的组的肿瘤或病原体抗原具有特异性的CAR:AChR(胎儿乙酰胆碱受体)、ADGRE2、AFP(甲胎蛋白)、BAFF-R、BCMA、CAIX(碳酸酐酶IX)、CCR1、CCR4、CEA(癌胚抗原)、CD3、CD5、CD8、CD7、CD10、CD13、CD14、CD15、CD19、CD20、CD22、CD30、CD33、CLLI、CD34、CD38、CD41、CD44、CD49f、CD56、CD61、CD64、CD68、CD70、CD74、CD99、CD117、CD123、CD133、CD138、CD44v6、CD267、CD269、CDS、CLEC12A、CS1、EGP-2(上皮糖蛋白-2)、EGP-40(上皮糖蛋白-40)、EGFR(HER1)、EGFR-VIII、EpCAM(上皮细胞黏附分子)、EphA2、ERBB2(HER2,人表皮生长因子受体2)、ERBB3、ERBB4、FBP(叶酸结合蛋白)、Flt3受体、叶酸受体-α、GD2(神经节苷脂G2)、GD3(神经节苷脂G3)、GPC3(磷脂酰肌醇蛋白聚糖3)、GPI00、hTERT(人端粒酶逆转录酶)、ICAM-1、整合素B7、白介素6受体、IL13Ra2(白介素13受体30亚基α-2)、κ-轻链、KDR(激酶插入结构域受体)、LeY(Lewis Y)、L1CAM(LI细胞黏附分子)、LILRB2(白细胞免疫球蛋白样受体B2)、MARTI、MAGE-A1(黑素瘤相关抗原Al)、MAGE-A3、MSLN(间皮素)、MUC16(黏蛋白16)、MUCI(黏蛋白I)、KG2D配体、NY-ESO-1(癌-睾丸抗原)、PRI(蛋白酶3)、TRBCI、TRBC2、TFM-3、TACI、酪氨酸酶、存活蛋白、hTERT、癌胚抗原(h5T4)、p53、PSCA(前列腺干细胞抗原)、PSMA(前列腺特异性膜抗原)、hRORl、TAG-72(肿瘤相关糖蛋白72)、VEGF-R2(血管内皮生长因子R2)、WT-1(肾母细胞瘤蛋白)和HIV(人免疫缺陷病毒)、乙型肝炎、丙型肝炎、CMV(巨细胞病毒)、EBV(EB病毒)、HPV(人乳头瘤病毒)的抗原。
在一些实施例中,离体修饰免疫细胞,例如T细胞、NK细胞、NKT细胞或祖细胞,然后递送至患者。在一些实施例中,通过本文提及的方法中的一种递送Gene WriterTM系统,并且在患者体内修饰免疫细胞,例如T细胞、NK细胞、NKT细胞或祖细胞。
在一些实施例中,Gene Writing系统可用于同时或依次对靶细胞进行多个修饰。在一些实施例中,Gene Writing系统可用于进一步修饰已修饰的细胞。在一些实施例中,Gene Writing系统可用于修饰通过互补技术编辑的细胞,例如基因编辑的细胞,例如具有一个或多个CRISPR敲除的细胞。在一些实施例中,先前经编辑的细胞是T细胞。在一些实施例中,先前的修饰包括T细胞中例如内源性TCR(例如TRAC、TRBC)、I类HLA(B2M)、PD1、CD52、CTLA-4、TIM-3、LAG-3、DGK的基因敲除。在一些实施例中,Gene Writing系统用于将TCR或CAR插入先前已修饰的T细胞中。
施用
本文所述的组合物和系统可以在体外或体内使用。在一些实施例中,例如在体外或体内将系统或系统的组分递送至细胞(例如,哺乳动物细胞,例如人细胞)。本领域技术人员将理解,可以以多肽、核酸(例如,DNA、RNA)及其组合的形式递送Gene Writer系统的组分。
在一些实施例中,系统和/或系统的组分以核酸的形式递送。例如,可以以编码重组酶多肽的DNA或RNA的形式递送重组酶多肽。在一些实施例中,系统或系统的组分(例如,插入DNA和编码重组酶多肽的核酸分子)在1、2、3、4或更多个不同的核酸分子上递送。在一些实施例中,系统或系统的组分作为DNA和RNA的组合递送。在一些实施例中,系统或系统的组分作为DNA和蛋白质的组合递送。在一些实施例中,系统或系统的组分作为RNA和蛋白质的组合递送。在一些实施例中,重组酶多肽作为蛋白质递送。
在一些实施例中,使用载体将系统或系统的组分递送至细胞,例如哺乳动物细胞或人细胞。载体可以是例如质粒或病毒。在一些实施例中,递送是体内、体外、离体或原位的。在一些实施例中,病毒是腺相关病毒(AAV)、慢病毒、腺病毒。在一些实施例中,系统或系统的组分与病毒样颗粒或病毒体一起被递送至细胞。在一些实施例中,递送使用一种以上的病毒、病毒样颗粒或病毒体。
在一些实施例中,重组酶对线性或环状单链或双链DNA具有活性。在一些实施例中,重组酶在DNA在细胞中从单链转化为双链后对其具有活性。在一些实施例中,重组酶在DNA在细胞中形成连环体后对其具有活性。在一些实施例中,在插入DNA从单链转化为双链后,将重组酶多肽递送至细胞或在细胞中表达。
在一些实施例中,重组酶识别序列存在于编码重组酶多肽的核酸的5'和3'。在一些实施例中,重组酶识别序列是具有相容间隔子区和中心二核苷酸的attB和attP。在一些实施例中,重组酶识别序列具有与插入DNA上或基因组中靶位点处的重组酶识别序列不同的间隔子区和/或中心二核苷酸。在一些实施例中,重组酶识别位点不与插入DNA上或基因组中的重组酶识别位点相互作用。在一些实施例中,重组酶识别序列与编码重组酶多肽的开放阅读框的核酸直接相邻。在一些实施例中,重组酶识别序列在重组酶的基因表达单元的外部。在一些实施例中,重组酶识别序列(例如attB和attP)处于相同的5'至3'方向。在一些实施例中,重组酶识别序列(例如attB和attP)处于相反的5'至3'方向。在一些实施例中,重组酶多肽重组位于编码重组酶多肽的核酸的5'和3'的识别序列,导致重组酶基因表达降低。
在一些实施例中,插入DNA上存在多个重组酶识别序列。在一些实施例中,插入DNA包含两个或更多个识别序列。在一些实施例中,插入DNA包含三个或更多个识别序列。在一些实施例中,插入DNA包含彼此相容的两个识别序列(例如attB和attP)和与插入DNA上的其他识别序列不相容的第三识别序列(例如attB或attP)。在一些实施例中,插入DNA上彼此相容的识别序列与靶基因组中的识别序列不相容。在一些实施例中,插入DNA上与插入DNA上的其他识别序列不相容的识别序列与靶基因组中的识别序列相容。在一些实施例中,彼此相容的识别序列具有相容的间隔子区和中心二核苷酸,并且不相容的识别序列具有不相容的间隔子区和中心二核苷酸。在一些实施例中,插入DNA上的相容识别序列处于相同的5'至3'方向。在一些实施例中,重组酶作用于插入DNA上的相容识别序列以形成环状DNA。在一些实施例中,所得环状DNA包含attL、attR和attP或attB序列,其中attP或attB序列与靶基因组中的识别序列相容。在一些实施例中,本文所述的多个重组酶识别序列存在于病毒载体基因组中。
在一个实施例中,本文所述的组合物和系统可以配制在脂质体或其他类似的囊泡中。脂质体是球形囊泡结构,这些球形囊泡结构由围绕内部水性隔室的单层或多层的脂质双层和相对不可渗透的外部亲脂性磷脂双层构成。脂质体可以是阴离子的、中性的或阳离子的。脂质体具有生物相容性,无毒,可以递送亲水性和亲脂性药物分子,保护其货物免受血浆酶的降解,并将其装载运输穿过生物膜和血脑屏障(BBB)(关于综述,参见,例如,Spuch和Navarro,Journal of Drug Delivery[药物递送杂志],第2011卷,文章ID469679,第12页,2011.doi:10.1155/2011/469679)。
囊泡可以由若干种不同类型的脂质制成;然而,磷脂最常用于生成脂质体作为药物载剂。用于制备多层囊泡脂质的方法是本领域已知的(参见例如美国专利号6,693,086,其关于多层囊泡脂质制备的传授内容通过引用并入本文)。尽管当脂质膜与水性溶液混合时,囊泡形成可以是自发的,但也可以通过经由使用均质器、超声波仪或挤压设备以振荡的形式施加力来加快囊泡形成(关于综述,参见例如,Spuch和Navarro,Journal of DrugDelivery[药物递送杂志],第2011卷,文章ID 469679,第12页,2011.doi:10.1155/2011/469679)。可以通过挤出通过具有减小尺寸的过滤器来制备挤出的脂质,如Templeton等人,Nature Biotech[自然生物技术],15:647-652,1997中所述,该文献关于挤出脂质制备的传授内容通过引用并入本文。
脂质纳米颗粒是为本文所述的药物组合物提供生物相容性和可生物降解的递送系统的载剂的另一个实例。纳米结构化的脂质载剂(NLC)是经修饰的固体脂质纳米颗粒(SLN),这些经修饰的固体脂质纳米颗粒保留了SLN的特征、改善了药物稳定性和负载能力、并且防止了药物泄漏。聚合物纳米颗粒(PNP)是药物递送的重要组成部分。这些纳米颗粒可以有效地将药物递送引导至特定靶标并且改善药物稳定性和受控的药物释放。也可以使用脂质聚合物纳米颗粒(PLN),即一种组合了脂质体和聚合物的新型载剂。这些纳米颗粒具有PNP和脂质体的互补优势。PLN由核-壳结构构成;聚合物核提供了稳定的结构,并且磷脂壳提供了良好的生物相容性。这样,这两种组分增加了药物包封效率、促进了表面修饰、并且防止了水溶性药物的泄漏。对于综述,参见例如,Li等人2017,Nanomaterials[纳米材料]7,122;doi:10.3390/nano7060122。
外泌体也可用作本文所述的组合物和系统的药物递送媒介物。对于综述,参见Ha等人2016年7月.Acta Pharmaceutica Sinica B[药学学报]第6卷第4期,第287-296页;https://doi.org/10.1016/j.apsb.2016.02.001。
在一些实施例中,本文所述的系统的至少一种组分包含融合体。融合体与靶细胞相互作用并融合,并因此可用作多种分子的递送媒介物。它们通常由封闭管腔或腔的两亲性脂质双层和与两亲性脂质双层相互作用的融合原组成。融合原组分已被证明是可工程化的,以便赋予融合和有效负载递送的靶细胞特异性,从而允许产生具有可编程细胞特异性的递送媒介物(参见例如,PCT公开号WO/2020014209中与融合体设计、制备和使用相关的部分,该PCT公开通过引用以其全文并入本文)。
可以将Gene Writer系统引入细胞、组织和多细胞生物中。在一些实施例中,系统或系统的组分经由机械手段或物理手段递送至细胞。
以下文献中描述了蛋白治疗剂的配制品:Meyer(编辑),Therapeutic ProteinDrug Products:Practical Approaches to formulation in the Laboratory,Manufacturing,and the Clinic[治疗性蛋白药物产品:实验室、制造和临床中配制品的实践方法],Woodhead Publishing Series[伍德海德出版系列](2012)。
在一些实施例中,本文所述的Gene WriterTM系统被递送至来自大脑、小脑、肾上腺、卵巢、胰腺、甲状旁腺、垂体、睾丸、甲状腺、乳房、脾脏、扁桃体、胸腺、淋巴结、骨髓、肺、心肌、食道、胃、小肠、结肠、肝脏、唾液腺、肾脏、前列腺、血液、或其他细胞或组织类型的组织或细胞。在一些实施例中,本文所述的Gene WriterTM系统用于治疗疾病,例如癌症、炎性疾病、传染病、遗传缺陷或其他疾病。癌症可以是大脑、小脑、肾上腺、卵巢、胰腺、甲状旁腺、垂体、睾丸、甲状腺、乳房、脾脏、扁桃体、胸腺、淋巴结、骨髓、肺、心肌、食道、胃、小肠、结肠、肝脏、唾液腺、肾脏、前列腺、血液、或其他细胞或组织类型的癌症,并且可以包括多种癌症。
在一些实施例中,本文所述的Gene WriterTM系统通过肠内施用(例如口服、直肠、胃肠、舌下、唇下或颊部施用)来施用。在一些实施例中,本文所述的Gene WriterTM系统通过肠胃外施用(例如,静脉内、肌内、皮下、皮内、硬膜外、脑内、脑室内、表皮、经鼻、动脉内、关节内、海绵窦内、眼内、骨内输注、腹膜内、鞘内、宫内、阴道内、膀胱内、血管周围或经粘膜施用)来施用。在一些实施例中,本文所述的Gene WriterTM系统通过局部施用(例如,透皮施用)来施用。
在一些实施例中,如本文所述的Gene WriterTM系统可用于修饰动物细胞、植物细胞或真菌细胞。在一些实施例中,如本文所述的Gene WriterTM系统可用于修饰哺乳动物细胞(例如,人细胞)。在一些实施例中,如本文所述的Gene WriterTM系统可用于修饰来自家畜动物(例如,牛、马、绵羊、山羊、猪、美洲驼、羊驼、骆驼、牦牛、鸡、鸭、鹅或鸵鸟)的细胞。在一些实施例中,如本文所述的Gene WriterTM系统可用作实验室工具或研究工具,或用于实验室方法或研究方法中,例如以修饰动物细胞例如哺乳动物细胞(例如,人细胞)、植物细胞或真菌细胞。
在一些实施例中,如本文所述的Gene WriterTM系统可用于表达蛋白质、模板或异源对象序列(例如,在动物细胞例如哺乳动物细胞(例如,人细胞)、植物细胞中、或真菌细胞中)。在一些实施例中,如本文所述的Gene WriterTM系统可用于在诱导型启动子(例如,小分子诱导型启动子)的控制下表达蛋白质、模板或异源对象序列。在一些实施例中,GeneWriting系统或其有效负载被设计用于例如通过使用诱导型启动子的可调控制。例如,驱动目的基因的启动子(例如,Tet)在整合时可能是沉默的,但在一些情况下,可能在暴露于小分子诱导剂(例如,强力霉素)时被激活。在一些实施例中,可调表达允许基因(例如,治疗性基因)的治疗后控制,例如,允许小分子依赖性给药效果。在实施例中,小分子依赖性给药效果包括在时间和/或空间上改变基因产物的水平,例如,通过局部施用。在一些实施例中,本文所述的系统中使用的启动子可以是诱导型的,例如应答于宿主的内源分子和/或对其施用的外源小分子。
适合适应证的治疗
在一些实施例中,本文所述的Gene WriterTM系统或其组分或部分(例如,如本文所述的多肽或核酸)用于治疗疾病、障碍或病症。在一些实施例中,本文所述的Gene WriterTM系统或其组分或部分用于治疗表X1-X6中任一个中所列的疾病、障碍或病症。在一些实施例中,本文所述的Gene WriterTM系统或其组分或部分用于治疗造血干细胞(HSC)疾病、障碍或病症,例如,如表X1中所列。在一些实施例中,本文所述的Gene WriterTM系统或其组分或部分用于治疗肾脏疾病、障碍或病症,例如,如表X2中所列。在一些实施例中,本文所述的GeneWriterTM系统或其组分或部分用于治疗肝脏疾病、障碍或病症,例如,如表X3中所列。在一些实施例中,本文所述的Gene WriterTM系统或其组分或部分用于治疗肺疾病、障碍或病症,例如,如表X4中所列。在一些实施例中,本文所述的Gene WriterTM系统或其组分或部分用于治疗骨骼肌疾病、障碍或病症,例如,如表X5中所列。在一些实施例中,本文所述的GeneWriterTM系统或其组分或部分用于治疗皮肤疾病、障碍或病症,例如,如表X6中所列。
表X1-X6:针对将用于重组酶的转Gene Writer选择的适应证
表X1:HSC
Figure BDA0003761233040006311
Figure BDA0003761233040006321
表X2:肾脏
疾病 受影响的基因
先天性肾病综合征 NPHS2
胱氨酸病 CTNS
表X3:肝脏
Figure BDA0003761233040006322
Figure BDA0003761233040006331
表X4:肺
Figure BDA0003761233040006341
表X5:骨骼肌
疾病 受影响的基因
贝克肌营养不良 DMD
贝克肌强直 CLCN1
贝特莱姆肌病(Bethlem myopathy) COL6A2
中心核肌病,X-连接的(管状(motubular)) MTM1
先天性肌无力综合征 CHRNE
进行性假肥大性肌营养不良 DMD
埃默里-德赖弗斯肌营养不良,AD LMNA
肢带肌营养不良2A CAPN3
肢带肌营养不良,2D型 SGCA
表X6:皮肤
Figure BDA0003761233040006342
Figure BDA0003761233040006351
在一些实施例中,Gene Writing系统可用于治疗健康个体,例如作为预防性疗法。在一些实施例中,可以靶向Gene Writing系统以产生突变,例如敲除突变,其已显示对目的疾病具有保护性。在一些实施例中,Gene Writing系统可用于将保护性等位基因插入基因组,例如表达降低发生特定疾病风险的蛋白质变体的转基因。在一些实施例中,转基因的整合用于通过提供一个或多个另外拷贝来增加内源蛋白的水平。在一些实施例中,GeneWriting系统可用于掺入调节元件,例如启动子、增强子、转录因子结合位点、miRNA结合位点或表观遗传修饰位点,以改变内源基因的表达,从而降低疾病风险或减轻其严重性。在一些实施例中,Gene Writing系统可用于替换内源蛋白的一个或多个外显子以去除增加疾病风险的等位基因或将等位基因改变为赋予疾病保护的等位基因。
植物修饰方法
本文所述的Gene Writer系统可用于修饰植物或植物部分(例如,叶、根、花、果实或种子)例如以增加植物的适应度。
A.向植物的递送
本文提供了将本文所述的Gene Writer系统递送至植物的方法。包括用于通过使植物或其一部分与Gene Writer系统接触而将Gene Writer系统递送至植物的方法。这些方法可用于修饰植物以例如增加植物的适应度。
更特别地,在一些实施例中,本文所述的核酸(例如,编码GeneWriter的核酸)可以在载体中编码,例如邻近植物启动子(例如,植物载体(例如,pHUC411)中的玉蜀黍泛素启动子(ZmUBI))而插入。在一些实施例中,本文所述的核酸经由农杆菌被引入植物(例如,粳稻)或植物的一部分(例如,植物的愈伤组织)。在一些实施例中,本文所述的系统和方法可以通过用无效等位基因(例如,在起始密码子处含有碱基取代)替换植物基因(例如,潮霉素磷酸转移酶(HPT))而用于植物。用于修饰植物基因组的系统和方法描述于Xu等人Developmentof plant prime-editing systems for precise genome editing[用于精确基因组编辑的植物引导编辑系统的开发],2020,Plant Communications[植物通讯]中。
在一方面,本文提供了一种增加植物的适应度的方法,该方法包括向该植物递送本文所述的Gene Writer系统(例如,以有效的量和持续时间)以相对于未经处理的植物(例如,未递送该Gene Writer系统的植物)增加该植物的适应度。
由于递送Gene Writer系统而产生的植物适应度的增加能以多种方式表现出来,例如,从而导致植物的更好的生产,例如改善的产率,改善的植物活力或从植物中收获的产物的质量,农业或园艺业所希望的收获前或收获后的性状(例如,味道、外观、货架期)的改善,或在其他方面使人类受益的性状(例如,减少变应原产生)的改善。改善的植物产率涉及相对于在相同条件下但不应用本发明组合物而生产的植物的相同产品的产率或与应用常规植物修饰剂相比,按可测量量计植物的产品的产率的增加(例如,如通过植物生物质、谷物、种子或果实产率、蛋白质含量、碳水化合物或油含量或叶面积测量的)。例如,产率可以增加至少约0.5%、约1%、约2%、约3%、约4%、约5%、约10%、约20%、约30%、约40%、约50%、约60%、约70%、约80%、约90%、约100%、或大于100%。在一些情况下,相对于未处理的植物,该方法有效地将产率增加约2x倍、5x倍、10x倍、25x倍、50x倍、75x倍、100x倍、或大于100x倍。产率可以以在某种基础上植物或植物的产品的重量或体积计的量来表示。基础可以以时间、生长面积、生产的植物的重量、或所用原材料的量来表示。例如,此类方法可以增加植物组织的产率,这些植物组织包括但不限于:种子、果实、仁、圆荚、块茎、根和叶。
由于递送Gene Writer系统而产生的植物适应度的增加也可以通过其他手段来测量,如相对于在相同条件下但不施用本发明组合物或应用常规植物修饰剂而生产的植物的相同因素,以活力等级的增加或改善、林分(每单位面积的植物数量)的增加、植物高度、秆围、秆长、叶数量、叶尺寸、植物冠层、视觉外观(诸如更绿的叶颜色)、根等级、出苗、蛋白质含量、分蘖的增加、更大的叶、更多的叶、更少的死的基生叶、分蘖更强、所需肥料更少、所需种子更少、分蘖更多产、开花更早、提早的谷物或种子成熟度、更少的植物节(verse)(倒伏)、芽生长的增加、更早萌发、或这些因素的任何组合,按可测量或可察觉的量来测量。
因此,本文提供了一种修饰植物的方法,该方法包括向植物递送有效量的本文提供的Gene Writer系统中的任一种,其中该方法修饰该植物并由此相对于未经处理的植物引入或增加该植物中的有益性状(例如,增加约1%、2%、5%、10%、20%、30%、40%、50%、60%,70%、80%、90%、100%或大于100%)。特别地,该方法相对于未经处理的植物可以增加植物的适应度(例如,增加约1%、2%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%或大于100%)。
在一些情况下,植物适应度的增加是以下方面的增加(例如,增加约1%、2%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%或大于100%):抗病性、耐旱性、耐热性、耐寒性、耐盐性、金属耐受性、除草剂耐受性、化学耐受性、水分利用效率、氮利用、对氮胁迫的抗性、固氮、有害生物抗性、草食动物抗性、病原体抗性、产率、限水条件下的产率、活力、生长、光合能力、营养、蛋白质含量、碳水化合物含量、油含量、生物质、芽长、根长、根结构、种子重量、或可收获产物的量。
在一些情况下,适应度的增加是发育、生长、产率、对非生物胁迫源的抗性或对生物胁迫源的抗性增加(例如,增加约1%、2%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%或大于100%)。非生物胁迫是指植物或植物部分所经受的环境胁迫条件,包括例如干旱胁迫、盐胁迫、热胁迫、冷胁迫和低营养胁迫。生物胁迫是指植物或植物部分所经受的环境胁迫条件,包括例如线虫胁迫、食草昆虫胁迫、真菌病原体胁迫、细菌病原体胁迫或病毒病原体胁迫。胁迫可以是暂时的,例如几个小时,几天,几个月或永久的,例如持续植物的一生。
在一些,从植物收获的产物质量中(10%、20%、30%、40%、50%、60%、70%、80%、90%、100%或大于100%)。例如,植物适应度的增加可以是从植物收获的产物的商业上有利的特征(例如,味道或外观)的改善。在其他情况下,植物适应度的增加是从植物收获的产物的货架期的增加(例如,增加约1%、2%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%或大于100%)。
可替代地,适应度的增加可以是对人类或动物健康有益的性状的改变,例如变应原产生的减少。例如,适应度的增加可以是刺激动物(例如人)中免疫应答的变应原(例如花粉)的产生减少(例如,减少约1%、2%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%或大于100%)。
植物的修饰(例如,适应度的增加)可能来自一个或多个植物部分的修饰。例如,可以通过接触植物的叶、种子、花粉、根、果实、芽、花、细胞,原生质体或组织(例如分生组织)来修饰植物。因此,在另一方面,本文提供了一种增加植物的适应度的方法,该方法包括使植物的花粉与有效量的本文中植物修饰组合物中的任一种接触,其中相对于未经处理的植物,该方法使植物的适应度增加(例如,增加约1%、2%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%或大于100%)。
在又另一方面,本文提供了一种增加植物的适应度的方法,该方法包括使植物的种子与有效量的本文披露的Gene Writer系统中的任一种接触,其中相对于未经处理的植物,该方法使植物的适应度增加(例如,增加约1%、2%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%或大于100%)。
在另一方面,本文提供了一种包括使植物的原生质体与有效量的本文所述的GeneWriter系统中的任一种接触的方法,其中相对于未经处理的植物,该方法使植物的适应度增加(例如,增加约1%、2%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%,或大于100%)。
在另外的方面,本文提供了一种增加植物的适应度的方法,该方法包括使植物的植物细胞与有效量的本文所述的Gene Writer系统中的任一种接触,其中相对于未经处理的植物,该方法使植物的适应度增加(例如,增加约1%、2%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%,或大于100%)。
在另一方面,本文提供了一种增加植物的适应度的方法,该方法包括使植物的分生组织与有效量的本文的植物修饰组合物中的任一种接触,其中相对于未经处理的植物,该方法使植物的适应度增加(例如,增加约1%、2%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%,或大于100%)。
在另一方面,本文提供了一种增加植物的适应度的方法,该方法包括使植物的胚与有效量的本文的植物修饰组合物中的任一种接触,其中相对于未经处理的植物,该方法使植物的适应度增加(例如,增加约1%、2%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%,或大于100%)。
B.应用方法
本文所述的植物可以以允许将组合物递送或施用于植物的任何合适方式暴露于本文所述的任何Gene Writer系统组合物。Gene Writer系统可以单独递送或与其他活性(例如,肥料剂)或非活性物质组合递送,并且可以通过例如喷雾、注射(例如显微注射)、通过植物、倾倒、浸渍,以浓缩液体、凝胶、溶液、悬浮液、喷雾、粉剂、丸剂、块剂、砖剂等(配制成递送有效浓度的植物修饰组合物)的形式来应用。应用本文所述的组合物的量和位置通常取决于植物的习性、植物可被植物修饰组合物靶向的生命周期阶段、将施用的位置、以及植物修饰组合物的物理和功能特征。
在一些情况下,通过例如背包喷雾、空中喷雾、作物喷雾/尘剂等将组合物直接喷雾到植物(例如作物)上。在将Gene Writer系统递送至植物的情况下,接受Gene Writer系统的植物可以处于植物生长的任何阶段。例如,配制的植物修饰组合物可以在植物生长的早期阶段以种子包衣或根处理剂的形式或在作物周期的后期阶段以总植物处理剂的形式来应用。在一些情况下,植物修饰组合物可以作为局部剂应用于植物。
此外,可以将Gene Writer系统(例如,在植物生长的土壤中,或在用于浇灌植物的水中)作为通过植物的组织而吸收和分布的内吸剂(systemic agent)应用。在一些情况下,植物或食物生物可以经遗传转化以表达Gene Writer系统。
延迟释放或持续释放也可以通过以下方式完成:向Gene Writer系统或具有一种或多种植物修饰组合物的组合物包覆可溶解或生物可侵蚀的包衣层(诸如明胶),该包衣层在使用环境中溶解或侵蚀,从而然后使植物修饰组合物Gene Writer系统位置可用,或者通过将药剂分散在可溶解或可侵蚀的基质中。此类持续释放和/或分配方式装置可有利地用于始终维持本文所述的一种或多种植物修饰组合物的有效浓度。
在一些情况下,将Gene Writer系统递送至植物的一部分,例如叶、种子、花粉、根、果实、芽、或花,或其组织、细胞或原生质体。在一些情况下,将Gene Writer系统递送至植物的细胞。在一些情况下,将Gene Writer系统递送至植物的原生质体。在一些情况下,将GeneWriter系统递送至植物的组织。例如,可以将组合物递送至植物的分生组织(例如,顶端分生组织、侧生分生组织或间生分生组织)。在一些情况下,将组合物递送至植物的永久组织(例如,简单组织(例如,薄壁组织、厚角组织或厚壁组织)或复杂的永久组织(例如,木质部或韧皮部))。在一些情况下,将Gene Writer系统递送至植物胚。
C.植物
可以将多种植物递送至本文所述的Gene Writer系统或用其处理。可以根据本发明方法递送Gene Writer系统(即,“处理的”)的植物包括整株植物及其部分,包括但不限于芽营养器官/结构(例如,叶、茎和块茎)、根、花和花器官/结构(例如,苞片、萼片、花瓣、雄蕊、心皮、花药和胚珠)、种子(包括胚、胚乳、子叶、和种皮)和果实(成熟的子房)、植物组织(例如,维管组织、基本组织等)和细胞(例如,保卫细胞、卵细胞等)及其子代。植物部分可以进一步指如以下的植物部分:芽、根、茎、种子、托叶、叶、花瓣、花、胚珠、苞片、枝、叶柄、节间、树皮、短柔毛、分蘖、根茎、叶状体(frond)、叶片、花粉、雄蕊等。
可以在本文披露的方法中处理的植物的类别包括高等植物和低等植物类别,包括被子植物(单子叶植物和双子叶植物)、裸子植物、蕨类、木贼类植物、裸蕨植物、石松类植物、苔藓植物、和藻类(例如,多细胞藻类或单细胞藻类)。可以根据本发明方法处理的植物进一步包括任何维管植物,例如单子叶植物或双子叶植物或裸子植物,包括但不限于苜蓿、苹果、拟南芥属、香蕉、大麦、卡诺拉油菜、蓖麻籽、菊花、三叶草、可可、咖啡、棉花、棉籽、玉米、海甘蓝、蔓越莓、黄瓜、石斛兰、薯蓣、桉树、羊茅草、亚麻、唐菖蒲、百合科、亚麻籽、粟、甜瓜、芥菜、燕麦、油棕、油菜、番木瓜、花生、菠萝、观赏植物、菜豆、马铃薯、油菜籽、水稻、黑麦、黑麦草、红花、芝麻、高粱、大豆、甜菜、甘蔗、向日葵、草莓、烟草、番茄、草皮草、小麦和蔬菜作物(如莴苣、芹菜、西兰花、花椰菜、葫芦);水果树和坚果树,如苹果、梨、桃、橙子、葡萄柚、柠檬、酸橙、扁桃、山核桃、胡桃、榛子;藤本植物,如葡萄(例如,葡萄园)、猕猴桃、蛇麻子(hop);水果灌木和悬钩子,如覆盆子、黑莓、醋栗;林木,如水曲柳、松树、冷杉、枫树、橡树、栗树、杨树(popular);与苜蓿、卡诺拉油菜、蓖麻籽、玉米、棉花、海甘蓝、亚麻、亚麻籽、芥菜、油棕、油菜、花生、马铃薯、水稻、红花、芝麻、大豆、甜菜、向日葵、烟草、番茄、和小麦。可以根据本发明的方法处理的植物包括任何作物植物,例如,草料作物、油籽作物、谷物作物、水果作物、蔬菜作物、纤维作物、香料作物、坚果作物、草皮作物、糖作物、饮料作物、和森林作物。在某些情况下,在该方法中处理的作物植物是大豆植物。在其他某些情况下,作物植物是小麦。在某些情况下,作物植物是玉米。在某些情况下,作物植物是棉花。在某些情况下,作物植物是苜蓿。在某些情况下,作物植物是甜菜。在某些情况下,作物植物是水稻。在某些情况下,作物植物是马铃薯。在某些情况下,作物植物是番茄。
在某些情况下,植物是作物。此类作物植物的实例包括但不限于单子叶植物和双子叶植物,包括但不限于饲养料或草料豆类、观赏植物、食物作物、树木、或灌木,选自枫属物种(Acer spp.)、葱属物种(Allium spp.)、苋属物种(Amaranthus spp.)、凤梨(Ananascomosus)、旱芹(Apium graveolens)、花生属物种(Arachis spp)、石刁柏(Asparagusofficinalis)、甜菜(Beta vulgaris)、芸苔属物种(Brassica spp.)(例如,欧洲油菜(Brassica napus)、芜菁(Brassica rapa ssp.)(卡诺拉油菜、油菜、白菜型油菜(turniprape))、野茶树(Camellia sinensis)、美人蕉(Canna indica)、大麻(Cannabis saliva)、辣椒属物种(Capsicum spp.)、栗属物种(Castanea spp.)、栽培菊苣(Cichoriumendivia)、西瓜(Citrullus lanatus)、柑橘属物种(Citrus spp.)、椰子属物种(Cocosspp.)、咖啡属物种(Coffea spp.)、芫荽(Coriandrum sativum)、榛属物种(Corylusspp.)、山楂属物种(Crataegus spp.)、南瓜属物种(Cucurbita spp.)、黄瓜属物种(Cucumis spp.)、胡萝卜(Daucus carota)、水青冈属物种(Fagus spp.)、无花果(Ficuscarica)、草莓属物种(Fragaria spp.)、银杏(Ginkgo biloba)、大豆属违章(Glycinespp.)(例如,大豆(Glycine max)、黄豆(Soja hispida)或大豆(Soja max))、陆地棉(Gossypium hirsutum)、向日葵属物种(Helianthus spp.)(例如,向日葵)、木槿属物种(Hibiscus spp.)、大麦属物种(Hordeum spp.)(例如,大麦(Hordeum vulgare))、甘薯(Ipomoea batatas)、胡桃属物种(Juglans spp.)、莴苣(Lactuca sativa)、亚麻(Linumusitatissimum)、荔枝(Litchi chinensis)、莲属物种(Lotus spp.)、棱角丝瓜(Luffaacutangula)、羽扇豆属物种(Lupinus spp.)、蕃茄属物种(Lycopersicon spp.)(例如,番茄(Lycopersicon esculenturn))、圣女果(Lycopersicon lycopersicum)、梨形番茄(Lycopersicon pyriforme)、苹果属物种(Malus spp.)、紫花苜蓿(Medicago sativa)、薄荷属物种(Mentha spp.)、芒(Miscanthus sinensis)、黑桑(Morus nigra)、芭蕉属物种(Musa spp.)、烟草属物种(Nicotiana spp.)、木犀榄属物种(Olea spp.)、稻属物种(Oryzaspp.)(例如,稻(Oryza sativa))、宽叶野生稻(Oryza latifolia)、黍稷(Panicummiliaceum)、柳枝稷(Panicum virgatum)、西番莲(Passiflora edulis)、欧芹(Petroselinumcrispum)、菜豆属物种(Phaseolus spp.)、松属物种(Pinus spp.)、阿月浑子(Pistacia vera)、豌豆属物种(Pisum spp.)、早熟禾属物种(Poa spp.)、杨属物种(Populus spp.)、李属物种(Prunus spp.)、西洋梨(Pyrus communis)、栎属物种(Quercusspp.)、萝卜(Raphanus sativus)、波叶大黄(Rheum rhabarbarum)、茶藨子属物种(Ribesspp.)、蓖麻(Ricinus communis)、悬钩子属物种(Rubus spp.)、甘蔗属物种(Saccharumspp.)、柳属物种(Salix sp.)、接骨木属物种(Sambucus spp.)、黑麦(Secale cereale)、胡麻属物种(Sesamum spp.)、白芥属物种(Sinapis spp.)、茄属物种(Solanum spp.)(例如,马铃薯(Solanum tuberosum)、红茄(Solanum integrifolium)或番茄(Solanumlycopersicum))、双色高粱(Sorghum bicolor)、石茅(Sorghum halepense)、菠菜属物种(Spinacia spp.)、罗晃子(Tamarindus indica)、可可树(Theobroma cacao)、三叶草属物种(Trifolium spp.)、小黑麦(Triticosecale rimpaui)、小麦属物种(Triticum spp.)(例如,普通小麦(Triticum aestivum))、硬粒小麦(Triticum durum)、圆锥小麦(Triticumturgidum)、Triticum hybernum、马卡小麦(Triticum macha)、Triticum sativum或Triticum vulgare)、越橘属物种(Vaccinium spp.)、蚕豆属物种(Vicia spp.)、豇豆属物种(Vigna spp.)、香堇菜(Viola odorata)、葡萄属物种(Vitis spp.)、和玉米(Zea mays)。在某些实施例中,作物植物是水稻、油菜、卡诺拉油菜、大豆、玉米(玉蜀黍(maize))、棉花、甘蔗、苜蓿、高粱、或小麦。
用于本发明的植物或植物部分包括任何植物发育阶段的植物。在某些情况下,可以在萌发、幼苗生长、营养生长、和繁殖生长的阶段进行递送。在某些情况下,向植物的递送在营养生长和繁殖生长阶段期间进行。在一些情况下,将组合物递送至植物的花粉。在一些情况下,将组合物递送至植物的种子。在一些情况下,将组合物递送至植物的原生质体。在一些情况下,将组合物递送至植物的组织。例如,可以将组合物递送至植物的分生组织(例如,顶端分生组织、侧生分生组织或间生分生组织)。在一些情况下,将组合物递送至植物的永久组织(例如,简单组织(例如,薄壁组织、厚角组织或厚壁组织)或复杂的永久组织(例如,木质部或韧皮部))。在一些情况下,将组合物递送至植物胚。在一些情况下,将组合物递送至植物细胞。营养生长和繁殖生长阶段在本文中也称为“成株”或“成熟”植物。
在将Gene Writer系统递送至植物部分的情况下,可以通过植物修饰剂对植物部分进行修饰。可替代地,Gene Writer系统可以被分布到植物的其他部分(例如,通过植物的循环系统),其他部分随后被植物修饰剂修饰。
脂质纳米颗粒
本发明提供的方法和系统可以采用任何合适的载剂或递送形式,在某些实施例中包括脂质纳米颗粒(LNP)。在一些实施例中,脂质纳米颗粒包含一种或多种离子脂质,诸如非阳离子脂质(例如,中性或阴离子或两性离子脂质);一种或多种缀合的脂质(诸如WO2019217941的表5中描述的PEG缀合的脂质或缀合至聚合物的脂质;其通过引用以其全文并入本文);一种或多种固醇(例如,胆固醇);以及,任选地,一种或多种靶向分子(例如,缀合的受体、受体配体、抗体);或前述内容的组合。
可用于形成纳米颗粒(例如,脂质纳米颗粒)的脂质包括例如WO2019217941的表4中描述的那些,其通过引用并入-例如,含脂质的纳米颗粒可包含WO 2019217941的表4中的一种或多种脂质。脂质纳米颗粒可以包括另外的要素,诸如聚合物,诸如通过引用并入的WO2019217941的表5中描述的聚合物。
在一些实施例中,缀合的脂质,当存在时,可以包括以下的一种或多种:PEG-二酰基甘油(DAG)(诸如l-(单甲氧基-聚乙二醇)-2,3-二肉豆蔻酰甘油(PEG-DMG))、PEG-二烷氧基丙基(DAA)、PEG-磷脂、PEG-神经酰胺(Cer)、聚乙二醇化磷脂酰乙醇胺(PEG-PE)、PEG琥珀酸二酰基甘油(PEGS-DAG)(诸如4-0-(2',3'-二(十四烷酰氧基)丙基-l-0-(w-甲氧基(聚乙氧基)乙基)丁二酸酯(PEG-S-DMG))、PEG二烷氧基丙基氨基甲酸酯、N-(羰基-甲氧基聚乙二醇2000)-1,2-二硬脂酰-sn-甘油-3-磷酸乙醇胺钠盐,以及在WO 2019051289的表2中描述的那些(通过引用并入)和前述的组合。
在一些实施例中,可掺入脂质纳米颗粒中的固醇包括胆固醇或胆固醇衍生物中的一种或多种,诸如通过引用并入的W02009/127060或US2010/0130588中的那些。另外的示例性固醇包括植物固醇,包括通过引用并入本文的Eygeris等人(2020),dx.doi.org/10.1021/acs.nanolett.0c01386中描述的那些。
在一些实施例中,脂质颗粒包含可电离脂质、非阳离子脂质、抑制颗粒聚集的缀合脂质和固醇。这些组分的量可以独立地变化,以获得所需特性。例如,在一些实施例中,脂质纳米颗粒包含可电离脂质,其量为总脂质的约20mol%至约90mol%(在其他实施例中,其可为存在于脂质纳米颗粒中的总脂质的20%-70%(mol)、30%-60%(mol)或40%-50%(mol);约50mol%至约90mol%);非阳离子脂质,其量为总脂质的约5mol%至约30mol%;缀合脂质,其量为总脂质的约0.5mol%至约20mol%;以及固醇,其量为总脂质的约20mol%至约50mol%。总脂质与核酸(例如,编码Gene Writer或模板核酸)的比率可以根据需要而变化。例如,总脂质与核酸(质量或重量)的比率可为约10:1至约30:1。
在一些实施例中,脂质与核酸的比率(质量/质量比;w/w比)可以在约1:1至约25:1、约10:1至约14:1、约3:1至约15:1、约4:1至约10:1、约5:1至约9:1、或约6:1至约9:1的范围内。可以调节脂质和核酸的量以提供所需的N/P比,例如3、4、5、6、7、8、9、10或更高的N/P比。通常,脂质纳米颗粒配制品的总脂质含量可在约5mg/ml至约30mg/mL的范围内。
可用于脂质纳米颗粒配制品中的示例性可电离脂质包括但不限于通过引用并入本文的WO 2019051289的表1中所列的那些。另外的示例性脂质包括但不限于下式中的一种或多种:US 2016/0311759的X;US 20150376115或US 2016/0376224中的I;US 20160151284的I、II或III;US 20170210967的I、IA、II或IIA;US 20150140070的I-c;US 2013/0178541的A;US 2013/0303587或US 2013/0123338的I;US 2015/0141678的I;US 2015/0239926的II、III、IV或V;US 2017/0119904的I;WO 2017/117528的I或II;US 2012/0149894的A;US2015/0057373的A;WO 2013/116126的A;US 2013/0090372的A;US 2013/0274523的A;US2013/0274504的A;US 2013/0053572的A;W0 2013/016058的A;W0 2012/162210的A;US2008/042973的I;US 2012/01287670的I、II、III或IV;US 2014/0200257的I或II;US 2015/0203446的I、II或III;US 2015/0005363的I或III;US 2014/0308304的I、IA、IB、IC、ID、II、IIA、IIB、IIC、IID或III-XXIV;US 2013/0338210;W0 2009/132131的I、II、III或IV;US2012/01011478的A;US 2012/0027796的I或XXXV;US 2012/0058144的XIV或XVII;US 2013/0323269;US 2011/0117125的I;US 2011/0256175的I、II或III;US 2012/0202871的I、II、III、IV、V、VI、VII、VIII、IX、X、XI、XII;US 2011/0076335的I、II、III、IV、V、VI、VII、VIII、X、XII、XIII、XIV、XV或XVI;US 2006/008378的I或II;US 2013/0123338的I;US 2015/0064242的I或X-A-Y-Z;US 2013/0022649的XVI、XVII或XVIII;US 2013/0116307的I、II或III;US 2013/0116307的I、II或III;US 2010/0062967的I或II;US 2013/0189351的I-X;US2014/0039032的I;US 2018/0028664的V;US2016/0317458的I;US 2013/0195920的I。
在一些实施例中,可电离脂质是MC3(6Z,9Z,28Z,3lZ)-三十七烷-6,9,28,3l-四烯-l9-基-4-(二甲基氨基)丁酸酯(DLin-MC3-DMA或MC3),例如,如WO 2019051289 A9(通过引用以其全文并入本文)的实例9中所述。在一些实施例中,可电离脂质是脂质ATX-002,例如,如WO 2019051289 A9(通过引用以其全文并入本文)的实例10中所述。在一些实施例中,可电离脂质是(l3Z,l6Z)-A,A-二甲基-3-壬基二十二-l3,l6-二烯-l-胺(化合物32),例如,如WO 2019051289A9(通过引用以其全文并入本文)的实例11中所述。在一些实施例中,可电离脂质是化合物6或化合物22,例如,如WO 2019051289A9(通过引用以其全文并入本文)的实例12中所述。
示例性非阳离子脂质包括但不限于二硬脂酰-sn-甘油基-磷酸乙醇胺、二硬脂酰磷脂酰胆碱(DSPC)、二油酰磷脂酰胆碱(DOPC)、二棕榈酰磷脂酰胆碱(DPPC)、二油酰磷脂酰胆碱(DOPG)、二棕榈酰磷脂酰甘油(DPPG)、二油酰磷脂酰乙醇胺(DOPE)、棕榈酰油酰磷脂酰胆碱(POPC)、棕榈酰油酰磷脂酰乙醇胺(POPE)、二油酰-磷脂酰乙醇胺4-(N-马来酰亚胺甲基)-环己烷-1-羧酸酯(DOPE-mal)、二棕榈酰磷脂酰乙醇胺(DPPE)、二肉豆蔻酰磷酸乙醇胺(DMPE)、二硬脂酰-磷脂酰-乙醇胺(DSPE)、单甲基-磷脂酰乙醇胺(诸如16-O-单甲基PE)、二甲基-磷脂酰乙醇胺(诸如16-O-二甲基PE)、l8-l-反式PE、l-硬脂酰-2-油酰-磷脂酰乙醇胺(SOPE)、氢化大豆磷脂酰胆碱(HSPC)、卵磷脂酰胆碱(EPC)、二油酰磷脂酰丝氨酸(DOPS)、神经鞘磷脂(SM)、二肉豆蔻酰磷脂酰胆碱(DMPC)、二肉豆蔻酰磷脂酰甘油(DMPG)、二硬脂酰磷脂酰甘油(DSPG)、二芥酰基磷脂酰胆碱(DEPC)、棕榈酰油酰磷脂酰甘油(POPG)、二反油烯酰-磷脂酰乙醇胺(DEPE)、卵磷脂、磷脂酰乙醇胺、溶血卵磷脂、溶血磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰肌醇、鞘磷脂、卵鞘磷脂(ESM)、脑磷脂、心磷脂、磷脂酸、脑苷脂、双十六烷基磷酸、溶血磷脂酰胆碱、二亚油酰基磷脂酰胆碱或其混合物。应当理解,也可以使用其他二酰基磷脂酰胆碱和二酰基磷脂酰乙醇胺磷脂。这些脂质中的酰基基团优选为源自具有C10-C24碳链的脂肪酸的酰基基团,例如月桂酰基、肉豆蔻酰基、棕榈酰基、硬脂酰基或油酰基。在某些实施例中,另外的示例性脂质包括但不限于通过引用并入本文的Kim等人(2020)dx.doi.org/10.1021/acs.nanolett.0c01386中描述的那些。在一些实施例中,此类脂质包括发现会改善用mRNA进行肝脏转染的植物脂质(例如DGTS)。
适合用于脂质纳米颗粒中的非阳离子脂质的其他实例包括但不限于非磷脂质,例如硬脂胺、十二烷基胺、十六烷基胺、乙酰基棕榈酸酯、蓖麻酸甘油酯、硬脂酸十六烷基酯、肉豆蔻酸异丙酯、两性丙烯酸聚合物、三乙醇胺-月桂基硫酸盐、烷基-芳基硫酸盐、聚乙氧基化脂肪酸酰胺、双十八烷基二甲基溴化铵、神经酰胺、鞘磷脂等。其他非阳离子脂质在WO2017/099823或美国专利公开US 2018/0028664中描述,其内容通过引用以其全文并入本文。
在一些实施例中,非阳离子脂质是油酸或通过引用以其全文并入的US 2018/0028664的式I、II或IV的化合物。非阳离子脂质可以占脂质纳米颗粒中存在的总脂质的例如0-30%(摩尔)。在一些实施例中,非阳离子脂质含量是脂质纳米颗粒中存在的总脂质的5%-20%(摩尔)或10%-15%(摩尔)。在实施例中,可电离脂质与中性脂质的摩尔比为约2:1至约8:1(例如,约2:1、3:1、4:1、5:1、6:1、7:1或8:1)。
在一些实施例中,脂质纳米颗粒不包含任何磷脂。
在一些方面,脂质纳米颗粒可进一步包含诸如固醇的组分以提供膜完整性。可用于脂质纳米颗粒中的一种示例性固醇是胆固醇及其衍生物。胆固醇衍生物的非限制性实例包括极性类似物,诸如5a-胆甾烷醇、53-粪甾烷醇、胆甾醇基-(2,-羟基)-乙基醚、胆甾醇基-(4'-羟基)-丁基醚和6-酮胆甾烷醇;非极性类似物,诸如5a-胆甾烷、胆甾烯酮、5a-胆甾烷酮、5p-胆甾烷酮和胆甾醇癸酸酯;及其混合物。在一些实施例中,胆固醇衍生物是极性类似物,例如,胆甾醇基-(4'-羟基)-丁基醚。示例性的胆固醇衍生物在PCT公开WO 2009/127060和美国专利公开US 2010/0130588中描述,其中每个通过引用以其全文并入本文。
在一些实施例中,提供膜完整性的组分,诸如固醇,可占脂质纳米颗粒中存在的总脂质的0-50%(摩尔)(例如,0-10%、10%-20%、20%-30%、30%-40%或40%-50%)。在一些实施例中,此类组分是脂质纳米颗粒的总脂质含量的20%-50%(摩尔)、30%-40%(摩尔)。
在一些实施例中,脂质纳米颗粒可包含聚乙二醇(PEG)或缀合的脂质分子。通常,这些用于抑制脂质纳米颗粒的聚集和/或提供空间稳定。示例性的缀合脂质包括但不限于PEG-脂质缀合物、聚噁唑啉(POZ)-脂质缀合物、聚酰胺-脂质缀合物(诸如ATTA-脂质缀合物)、阳离子聚合物脂质(CPL)缀合物及其混合物。在一些实施例中,缀合脂质分子是PEG-脂质缀合物,例如(甲氧基聚乙二醇)缀合脂质。
示例性的PEG-脂质缀合物包括但不限于PEG-二酰基甘油(DAG)(诸如l-(单甲氧基-聚乙二醇)-2,3-二肉豆蔻酰甘油(PEG-DMG))、PEG-二烷氧基丙基(DAA)、PEG-磷脂、PEG-神经酰胺(Cer)、聚乙二醇化磷脂酰乙醇胺(PEG-PE)、PEG琥珀酸二酰基甘油(PEGS-DAG)(诸如4-0-(2',3'-二(十四烷酰氧基)丙基-l-0-(w-甲氧基(聚乙氧基)乙基)丁二酸酯(PEG-S-DMG))、PEG二烷氧基丙基氨基甲酸酯、N-(羰基-甲氧基聚乙二醇2000)-l,2-二硬脂酰-sn-甘油-3-磷酸乙醇胺钠盐或其混合物。另外的示例性PEG-脂质缀合物例如在US 5,885,6l3、US 6,287,59l、US 2003/0077829、US 2003/0077829、US 2005/0175682、US 2008/0020058、US 2011/0117125、US 2010/0130588、US 2016/0376224、US 2017/0119904和US/099823中描述,所有这些的内容通过引用以其全文并入本文。在一些实施例中,PEG-脂质是US 2018/0028664的式III、III-a-I、III-a-2、III-b-1、III-b-2或V的化合物,其内容通过引用以其全文并入本文。在一些实施例中,PEG-脂质具有US 20150376115或US 2016/0376224的式II,两者的内容通过引用以其全文并入本文。在一些实施例中,PEG-DAA缀合物可以是例如PEG-二月桂基氧基丙基、PEG-二肉豆蔻基氧基丙基、PEG-二棕榈基氧基丙基或PEG-二硬脂基氧基丙基。PEG-脂质可以是以下的一种或多种:PEG-DMG、PEG-二月桂基甘油、PEG-二棕榈酰甘油、PEG-二硬脂基甘油、PEG-二月桂基甘油脂酰胺、PEG-二肉豆蔻基甘油脂酰胺、PEG-二棕榈酰甘油脂酰胺、PEG-二硬脂基甘油脂酰胺、PEG-胆固醇(l-[8'-(胆甾-5-烯-3[β]-氧基)甲酰胺基-3',6'-二氧杂辛基]氨基甲酰基-[ω]-甲基-聚(乙二醇)、PEG-DMB(3,4-双十四烷氧基苄基-[ω]-甲基-聚(乙二醇)醚)和1,2-二肉豆蔻酰基-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000]。在一些实施例中,PEG-脂质包含PEG-DMG、1,2-二肉豆蔻酰基-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000]。在一些实施例中,PEG-脂质包含选自以下的结构:
Figure BDA0003761233040006481
在一些实施例中,与PEG以外的分子缀合的脂质也可用于代替PEG-脂质。例如,聚噁唑啉(POZ)-脂质缀合物、聚酰胺-脂质缀合物(诸如ATTA-脂质缀合物)和阳离子聚合物脂质(GPL)缀合物可用于代替PEG-脂质或与PEG-脂质一起使用。
示例性的缀合脂质,即PEG-脂质、(POZ)-脂质缀合物、ATTA-脂质缀合物和阳离子聚合物-脂质在WO 2019051289 A9的表2中列出的PCT和LIS专利申请中描述,所有这些的内容通过引用以其全文并入本文。
在一些实施例中,PEG或缀合脂质可以占脂质纳米颗粒中存在的总脂质的0-20%(摩尔)。在一些实施例中,PEG或缀合脂质的含量为脂质纳米颗粒中存在的总脂质的0.5%-10%或2%-5%(摩尔)。可电离脂质、非阳离子脂质、固醇和PEG/缀合脂质的摩尔比可以根据需要变化。例如,脂质颗粒可包含按组合物的摩尔或总重量计30%-70%的可电离脂质,按组合物的摩尔或总重量计0-60%的胆固醇,按组合物的摩尔或总重量计0-30%的非阳离子脂质和按组合物的摩尔或总重量计1%-10%的缀合脂质。优选地,组合物包含按组合物的摩尔或总重量计30%-40%的可电离脂质,按组合物的摩尔或总重量计40%-50%的胆固醇,和按组合物的摩尔或总重量计10%-20%的非阳离子脂质。在一些其他实施例中,该组合物是按组合物的摩尔或总重量计50%-75%的可电离脂质,按组合物的摩尔或总重量计20%-40%的胆固醇和按组合物的摩尔或总重量计5%至10%的非阳离子脂质以及按组合物的摩尔或总重量计1%-10%的缀合脂质。该组合物可以含有按组合物的摩尔或总重量计60%-70%的可电离脂质,按组合物的摩尔或总重量计25%-35%的胆固醇,以及按组合物的摩尔或总重量计5%-10%的非阳离子脂质。该组合物还可含有按组合物的摩尔或总重量计至多90%的可电离脂质和按组合物的摩尔或总重量计2%至15%的非阳离子脂质。配制品也可以是脂质纳米颗粒配制品,例如包含按组合物的摩尔或总重量计8%-30%的可电离脂质,按组合物的摩尔或总重量计5%-30%的非阳离子脂质,以及按组合物的摩尔或总重量计0-20%的胆固醇;按组合物的摩尔或总重量计4%-25%的可电离脂质,按组合物的摩尔或总重量计4%-25%的非阳离子脂质,按组合物的摩尔或总重量计2%至25%的胆固醇,按组合物的摩尔或总重量计10%至35%的缀合脂质,以及按组合物的摩尔或总重量计5%的胆固醇;或按组合物的摩尔或总重量计2%-30%的可电离脂质,按组合物的摩尔或总重量计2%-30%的非阳离子脂质,按组合物的摩尔或总重量计1%至15%的胆固醇,按组合物的摩尔或总重量计2%至35%的缀合脂质,以及按组合物的摩尔或总重量计1%-20%的胆固醇;或按组合物的摩尔或总重量计甚至高达90%的可电离脂质和按组合物的摩尔或总重量计2%-10%的非阳离子脂质,或按组合物的摩尔或总重量计甚至100%的阳离子脂质。在一些实施例中,脂质颗粒配制品包含摩尔比为50:10:38.5:1.5的可电离脂质、磷脂、胆固醇和聚乙二醇化脂质。在一些其他实施例中,脂质颗粒配制品包含摩尔比为60:38.5:1.5的可电离脂质、胆固醇和聚乙二醇化脂质。
在一些实施例中,脂质颗粒包含可电离脂质、非阳离子脂质(例如磷脂)、固醇(例如胆固醇)和聚乙二醇化脂质,其中可电离脂质的脂质摩尔比在20至70摩尔%的范围内,目标为40-60,非阳离子脂质的摩尔百分比在0至30的范围内,目标为0至15,固醇的摩尔百分比在20至70的范围内,目标为30至50,并且聚乙二醇化脂质的摩尔百分比在1至6的范围内,目标为2至5。
在一些实施例中,脂质颗粒包含摩尔比为50:10:38.5:1.5的可电离脂质/非阳离子脂质/固醇/缀合脂质。
在一个方面,本披露提供了包含磷脂、卵磷脂、磷脂酰胆碱和磷脂酰乙醇胺的脂质纳米颗粒配制品。
在一些实施例中,还可以包括一种或多种另外的化合物。那些化合物可以单独施用,或者另外的化合物可以包括在本发明的脂质纳米颗粒中。换言之,除核酸或至少第二核酸之外,脂质纳米颗粒可含有不同于第一核酸的其他化合物。非限制性地,其他另外的化合物可以选自由以下组成的组:小的或大的有机分子或无机分子、单糖、二糖、三糖、寡糖、多糖、肽、蛋白质、其肽类似物和衍生物、肽模拟物、核酸、核酸类似物和衍生物、由生物材料制成的提取物,或其任何组合。
在一些实施例中,通过添加靶向结构域将LNP定向至特定组织。例如,可以将生物配体展示在LNP的表面,以增强与展示同源受体的细胞的相互作用,从而推动与细胞表达受体的组织的缔合和向其中的载物递送。在一些实施例中,生物配体可以是驱动递送至肝脏的配体,例如展示GalNAc的LNP促使核酸载物递送至展示无唾液酸糖蛋白受体(ASGPR)的肝细胞。Akinc等人Mol Ther[分子治疗]18(7):1357-1364(2010)的工作传授了将三价GalNAc配体与PEG-脂质缀合(GalNAc-PEG-DSG)以产生依赖于ASGPR的LNP以获得可观察的LNP载物效应(参见,例如,Akinc等人2010,同上的图6)。其他展示配体的LNP配制品,例如掺入叶酸、转铁蛋白或抗体的配制品,在WO 2017223135中进行了讨论,其通过引用以其全文并入本文,此外还有在其中使用的参考文献也并入本文:即,Kolhatkar等人,Curr Drug DiscovTechnol[当代药物发现技术].2011 8:197-206;Musacchio和Torchilin,Front Biosci.[生物科学前沿]2011 16:1388-1412;Yu等人,Mol Membr Biol.[分子膜生物学]2010 27:286-298;Patil等人,Crit Rev Ther Drug Carrier Syst[治疗性药物载剂系统的重要评论].2008 25:1-61;Benoit等人,Biomacromolecules[生物大分子].2011 12:2708-2714;Zhao等人,Expert Opin Drug Deliv[药物递送专家观点].2008 5:309-319;Akinc等人,Mol Ther[分子治疗].2010 18:1357-1364;Srinivasan等人,Methods Mol Biol[分子生物学方法].2012 820:105-116;Ben-Arie等人,Methods Mol Biol[分子生物学方法].2012757:497-507;Peer 2010J Control Release[控释杂志].20:63-68;Peer等人,Proc NatlAcad Sci U S A.[美国国家科学院院刊]2007 104:4095-4100;Kim等人,Methods MolBiol.[分子生物学方法]2011 721:339-353;Subramanya等人,Mol Ther[分子治疗].201018:2028-2037;Song等人,Nat Biotechnol.[自然生物技术]2005 23:709-717;Peer等人,Science[科学].2008 319:627-630;以及Peer和Lieberman,Gene Ther[基因治疗].201118:1127-1133。
在一些实施例中,通过将选择性器官靶向(Selective ORgan Targeting,SORT)分子添加至包含传统组分(例如可电离的阳离子脂质、两亲性磷脂、胆固醇和聚(乙二醇)(PEG))的配制品中来针对组织特异性活性对LNP进行选择。Cheng等人Nat Nanotechnol[自然纳米技术]15(4):313-320(2020)的传授内容证明,添加补充的“SORT”组分可根据SORT分子的百分比和生物物理特性精确地改变体内RNA递送谱并介导组织特异性(例如,肺、肝脏、脾脏)基因递送和编辑。
在一些实施例中,LNP包含生物可降解的可电离脂质。在一些实施例中,LNP包含(9Z,l2Z)-3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙基氨基)丙氧基)羰基)氧基)甲基)丙基十八碳-9,l2-二烯酸酯,也称为3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙基氨基)丙氧基)羰基)氧基)甲基)丙基(9Z,l2Z)-十八碳-9,l2-二烯酸酯)或另一种可电离脂质。参见,例如WO 2019/067992、WO/2017/173054、WO 2015/095340和WO 2014/136086,以及其中提供的参考文献的脂质。在一些实施例中,在LNP脂质的上下文中术语阳离子和可电离是可互换的,例如,其中可电离脂质根据pH是阳离子的。
在一些实施例中,可以将Gene Writer系统的多个组分制备为单一LNP配制品,例如,LNP配制品包含编码Gene Writer多肽的mRNA和RNA模板。可以改变核酸组分的比率以便最大化治疗剂的特性。在一些实施例中,RNA模板与编码Gene Writer多肽的mRNA的比率为按摩尔比计约1:1至100:1,例如约1:1至20:1、约20:1至40:1、约40:1至60:1、约60:1至80:1、或约80:1至100:1。在其他实施例中,可以由单独的配制品制备多种核酸的系统,例如,包含模板RNA的一种LNP配制品和包含编码Gene Writer多肽的mRNA的第二LNP配制品。在一些实施例中,该系统可以包含配制到LNP中的多于两种核酸组分。在一些实施例中,该系统可以包含蛋白质(例如,Gene Writer多肽)以及配制到至少一种LNP配制品中的模板RNA。
在一些实施例中,LNP配制品的平均LNP直径可以在数十nm和数百nm之间,例如通过动态光散射(DLS)测量的。在一些实施例中,LNP配制品的平均LNP直径可以为约40nm至约150nm,诸如约40nm、45nm、50nm、55nm、60nm、65nm、70nm、75nm、80nm、85nm、90nm、95nm、100nm、105nm、110nm、115nm、120nm、125nm、130nm、135nm、140nm、145nm或150nm。在一些实施例中,LNP配制品的平均LNP直径可为约50nm至约100nm、约50nm至约90nm、约50nm至约80nm、约50nm至约70nm、约50nm至约60nm、约60nm至约100nm、约60nm至约90nm、约60nm至约80nm、约60nm至约70nm、约70nm至约100nm、约70nm至约90nm、约70nm至约80nm、约80nm至约100nm、约80nm至约90nm或约90nm至约100nm。在一些实施例中,LNP配制品的平均LNP直径可为约70nm至约100nm。在特定实施例中,LNP配制品的平均LNP直径可为约80nm。在一些实施例中,LNP配制品的平均LNP直径可为约100nm。在一些实施例中,LNP配制品的平均LNP直径范围为约l mm至约500mm、约5mm至约200mm、约10mm至约100mm、约20mm至约80mm、约25mm至约60mm、约30mm至约55mm、约35mm至约50mm,或约38mm至约42mm。
在一些情况下,LNP可以是相对均质的。多分散性指数可用于指示LNP的均质性,例如脂质纳米颗粒的粒度分布。小的(例如,小于0.3)多分散性指数通常指示窄的粒度分布。LNP的多分散性指数可为约0至约0.25,诸如0.01、0.02、0.03、0.04、0.05、0.06、0.07、0.08、0.09、0.10、0.11、0.12、0.13、0.14、0.15、0.16、0.17、0.18、0.19、0.20、0.21、0.22、0.23、0.24或0.25。在一些实施例中,LNP的多分散性指数可为约0.10至约0.20。
LNP的ζ电位可用于指示组合物的电动电位。在一些实施例中,ζ电位可以描述LNP的表面电荷。具有相对低电荷(正电荷或负电荷)的脂质纳米颗粒通常是期望的,因为更高电荷的物质可能不理想地与体内的细胞、组织和其他元素相互作用。在一些实施例中,LNP的ζ电位可为约-10mV至约+20mV、约-10mV至约+15mV、约-10mV至约+10mV、约-10mV至约+5mV、约-10mV至约0mV、约-10mV至约-5mV、约-5mV至约+20mV、约-5mV至约+15mV、约-5mV至约+10mV、约-5mV至约+5mV、约-5mV至约0mV、约0mV至约+20mV、约0mV至约+15mV、约0mV至约+10mV、约0mV至约+5mV、约+5mV至约+20mV、约+5mV至约+15mV或约+5mV至约+10mV。
蛋白质和/或核酸(例如,Gene Writer多肽或编码该多肽的mRNA)的包封效率描述了相对于所提供的初始量,在制备后被包封或以其他方式与LNP缔合的蛋白质和/或核酸的量。包封效率理想的是较高(例如,接近100%)。包封效率可以例如通过比较在用一种或多种有机溶剂或洗涤剂破碎脂质纳米颗粒之前和之后含有脂质纳米颗粒的溶液中蛋白质或核酸的量来测量。阴离子交换树脂可用于测量溶液中游离蛋白质或核酸(例如RNA)的量。荧光可用于测量溶液中游离蛋白质和/或核酸(例如RNA)的量。对于本文所述的脂质纳米颗粒,蛋白质和/或核酸的包封效率可以是至少50%,例如50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。在一些实施例中,包封效率可以是至少80%。在一些实施例中,包封效率可以是至少90%。在一些实施例中,包封效率可以是至少95%。
LNP可以任选地包含一层或多层包衣。在一些实施例中,LNP可以配制在具有包衣的胶囊、膜或片剂中。包含本文所述的组合物的胶囊、膜或片剂可具有任何可用的尺寸、拉伸强度、硬度或密度。
另外的示例性脂质、配制品、方法和LNP表征由WO 2020061457传授,其通过引用以其全文并入本文。
在一些实施例中,使用Lipofectamine MessengerMax(赛默飞世尔(ThermoFisher))或TransIT-mRNA转染试剂(米卢斯生物(Mirus Bio))进行体外或离体细胞脂质转染。在某些实施例中,使用GenVoy_ILM可电离脂质混合物(精密纳米系统(PrecisionNanoSystems))配制LNP。在某些实施例中,使用2,2-二亚油烯基-4-二甲基氨基乙基-[1,3]-二氧戊环(DLin-KC2-DMA)或二亚油烯基甲基-4-二甲基氨基丁酸酯(DLin-MC3-DMA或MC3)配制LNP,其配制和体内用途在Jayaraman等人Angew Chem Int Ed Engl[德国应用化学]51(34):8529-8533(2012)中传授,其通过引用以其全文并入本文。
优化用于递送CRISPR-Cas系统(例如Cas9-gRNA RNP、gRNA、Cas9mRNA)的LNP配制品在两者均通过引用并入的WO 2019067992和WO 2019067910中描述。
可用于递送核酸的另外的特定LNP配制品在两者均通过引用并入的US 8158601和US 8168775中描述,其包括帕替西兰(patisiran)中使用的以名称ONPATTRO销售的配制品。
Gene Writer LNP的示例性给药可包括约0.1、0.25、0.3、0.5、1、2、3、4、5、6、8、10或100mg/kg(RNA)。包含编码系统的一种或多种组分的核酸的AAV的示例性给药可包括约1011、1012、1013和1014vg/kg的MOI。
在一些实施例中,脂质纳米颗粒(或包含脂质纳米颗粒的配制品)缺乏反应性杂质(例如,醛或酮),或包含低于预选水平的反应性杂质(例如,醛或酮)。虽然不希望受理论约束,但在一些实施例中,脂质试剂用于制备脂质纳米颗粒配制品,并且脂质试剂可包含污染性反应性杂质(例如,醛或酮)。可以基于具有低于预选水平的反应性杂质(例如,醛或酮)来选择用于制造的脂质试剂。在不希望受理论约束的情况下,在一些实施例中,醛可引起RNA的修饰和损伤,例如,碱基之间的交联和/或脂质与RNA的共价缀合(例如,形成脂质-RNA加合物)。在一些情况下,这可能导致逆转录酶反应失败和/或例如在一个或多个病变的一个或多个位点掺入不适当的碱基,例如新合成的靶DNA中的突变。
在一些实施例中,脂质纳米颗粒配制品使用包含小于5%、4%、3%、2%、1%、0.9%、0.8%、0.7%、0.6%、0.5%、0.4%、0.3%、0.2%或0.1%的总反应性杂质(例如醛)含量的脂质试剂产生。在一些实施例中,脂质纳米颗粒配制品使用包含小于5%、4%、3%、2%、1%、0.9%、0.8%、0.7%、0.6%、0.5%、0.4%、0.3%、0.2%或0.1%的任何单一反应性杂质(例如醛)物质的脂质试剂产生。在一些实施例中,脂质纳米颗粒配制品使用脂质试剂产生,该脂质试剂包含:(i)小于5%、4%、3%、2%、1%、0.9%、0.8%、0.7%、0.6%、0.5%、0.4%、0.3%、0.2%或0.1%的总反应性杂质(例如醛)含量;和(ii)小于5%、4%、3%、2%、1%、0.9%、0.8%、0.7%、0.6%、0.5%、0.4%、0.3%、0.2%或0.1%的任何单一反应性杂质(例如醛)物质。在一些实施例中,脂质纳米颗粒配制品使用多种脂质试剂产生,并且多种脂质试剂中的每一种独立地满足本段落中所述的一个或多个标准。在一些实施例中,多种脂质试剂中的每一种满足相同的标准,例如本段落的标准。
在一些实施例中,脂质纳米颗粒配制品包含小于5%、4%、3%、2%、1%、0.9%、0.8%、0.7%、0.6%、0.5%、0.4%、0.3%、0.2%或0.1%的总反应性杂质(例如醛)含量。在一些实施例中,脂质纳米颗粒配制品包含小于5%、4%、3%、2%、1%、0.9%、0.8%、0.7%、0.6%、0.5%、0.4%、0.3%、0.2%或0.1%的任何单一反应性杂质(例如醛)物质。在一些实施例中,脂质纳米颗粒配制品包含:(i)小于5%、4%、3%、2%、1%、0.9%、0.8%、0.7%、0.6%、0.5%、0.4%、0.3%、0.2%或0.1%的总反应性杂质(例如醛)含量;和(ii)小于5%、4%、3%、2%、1%、0.9%、0.8%、0.7%、0.6%、0.5%、0.4%、0.3%、0.2%或0.1%的任何单一反应性杂质(例如醛)物质。
在一些实施例中,用于如本文所述的脂质纳米颗粒或其配制品的一种或多种或任选地所有脂质试剂包含小于5%、4%、3%、2%、1%、0.9%、0.8%、0.7%、0.6%、0.5%、0.4%、0.3%、0.2%或0.1%的总反应性杂质(例如醛)含量。在一些实施例中,用于如本文所述的脂质纳米颗粒或其配制品的一种或多种或任选地所有脂质试剂包含小于5%、4%、3%、2%、1%、0.9%、0.8%、0.7%、0.6%、0.5%、0.4%、0.3%、0.2%或0.1%的任何单一反应性杂质(例如醛)物质。在一些实施例中,用于本文所述的脂质纳米颗粒或其配制品的一种或多种或任选地所有脂质试剂包含:(i)小于5%、4%、3%、2%、1%、0.9%、0.8%、0.7%、0.6%、0.5%、0.4%、0.3%、0.2%或0.1%的总反应性杂质(例如醛)含量;和(ii)小于5%、4%、3%、2%、1%、0.9%、0.8%、0.7%、0.6%、0.5%、0.4%、0.3%、0.2%或0.1%的任何单一反应性杂质(例如醛)物质。
在一些实施例中,例如根据实例26中所述的方法,通过液相色谱法(LC),例如与串联质谱法(MS/MS)联用,测定总醛含量和/或任何单一反应性杂质(例如醛)物质的量。在一些实施例中,反应性杂质(例如醛)含量和/或反应性杂质(例如醛)物质的量通过检测与例如脂质试剂中反应性杂质(例如醛)的存在相关的核酸分子(例如RNA分子,例如如本文所述)的一个或多个化学修饰来确定。在一些实施例中,反应性杂质(例如醛)含量和/或反应性杂质(例如醛)物质的量通过检测与例如脂质试剂中反应性杂质(例如醛)的存在相关的核苷酸或核苷(例如核糖核苷酸或核糖核苷,例如包含在模板核酸中或从模板核酸分离,例如本文所述)的一个或多个化学修饰来确定,例如,如实例27中所述。在实施例中,核酸分子、核苷酸或核苷的化学修饰通过测定一个或多个修饰的核苷酸或核苷的存在来检测,例如使用LC-MS/MS分析,例如,如实例27中所述。
在一些实施例中,本文所述的核酸(例如,RNA)(例如,模板核酸或编码GeneWriter的核酸)不包含醛修饰,或包含少于预选量的醛修饰。在一些实施例中,平均每1000个核苷酸,核酸具有少于50、20、10、5、2或1个醛修饰,例如,其中两个核苷酸的单个交联是单个醛修饰。在一些实施例中,醛修饰是RNA加合物(例如脂质-RNA加合物)。在一些实施例中,醛修饰的核苷酸是碱基之间的交联。在一些实施例中,本文所述的核酸(例如RNA)在核苷酸之间包含少于50、20、10、5、2或1个交联。
所有的公开物、专利申请、专利、以及本文引用的其他公开物和参考文献(例如,序列数据库参考号)通过引用以其全文并入本文。例如,本文例如在本文的任何表中提及的所有GenBank、Unigene和Entrez序列都通过引用并入。除非另外指明,否则本文指定的序列登录号(包括在本文任一表中)是指截至2019年7月19日的当前数据库条目。当一个基因或蛋白质引用多个序列登录号时,所有序列变体都包括在内。
实例
通过以下实例进一步说明本发明。提供这些实例仅出于说明目的,而不应以任何方式解释为限制本发明的范围或内容。
实例1:将Gene WriterTM系统递送至哺乳动物细胞
该实例描述了将Gene WriterTM基因组编辑系统递送至哺乳动物细胞,用于将外源DNA位点特异性地插入哺乳动物细胞基因组。
在该实例中,Gene WriterTM系统的多肽组分是选自表3A、3B或3C的重组酶蛋白,并且模板DNA组分是包含靶重组位点的质粒DNA,例如,出现在表2A、2B或2C的相应行中的左区列或右区列中的核苷酸序列内的识别序列。
HEK293T细胞用以下测试剂转染:
1.乱序DNA对照
2.编码上述多肽的DNA
3.上述模板DNA
4.2和3的组合
转染后,将HEK293T细胞培养至少4天,然后测定位点特异性基因组编辑。从每组HEK293细胞中分离基因组DNA。用侧接合适序列或基因组基因座的引物进行PCR。PCR产物在琼脂糖凝胶上电泳以测量扩增的DNA的长度。
仅在用以上第4组的完整Gene WriterTM系统转染的细胞中观察到预期长度的PCR产物,其表明可将DNA质粒模板插入靶基因组中的成功的Gene WritingTM基因组编辑事件。
实例2:使用Gene WriterTM系统将基因表达单元靶向递送至哺乳动物细胞中。
该实例描述了Gene Writer基因组编辑器的制备和使用,以将异源基因表达单元插入哺乳动物基因组。
在该实例中,重组酶蛋白选自表3A、3B或3C。重组酶蛋白靶向重组酶多肽识别序列的适当基因组拷贝用于DNA整合。模板DNA组分是包含靶重组位点(存在于表2A、2B或2C的相应行中的左区列或右区列中的核苷酸序列内的识别序列)和基因表达单元的质粒DNA。基因表达单元包含与至少一个编码序列可操作地连接的至少一个调节序列。在该实例中,调节序列包括CMV启动子和增强子、增强的翻译元件和WPRE。编码序列是GFP开放阅读框。
HEK293细胞用以下测试剂转染:
1.乱序DNA对照
2.编码上述多肽的DNA
3.上述模板DNA
4.2和3的组合
转染后,将HEK293细胞培养至少4天,并测定位点特异性Gene Writing基因组编辑。从HEK293细胞中分离出基因组DNA,并使用位于基因组中靶整合位点侧翼的引物进行PCR。PCR产物在琼脂糖凝胶上电泳以测量DNA的长度。在用第4组测试剂(完整的GeneWriterTM系统)转染的细胞中检测到预期长度的PCR产物,其指示成功的Gene WritingTM基因组编辑事件。
将转染的细胞再培养10天,然后在多个细胞培养传代后经由流式细胞术测定GFP表达。计算来自每个细胞群体的GFP阳性细胞的百分比。在用第4组测试剂转染的HEK293细胞群体中检测到GFP阳性细胞,表明表达了经由Gene Writing基因组编辑添加到哺乳动物细胞基因组中的基因表达单元。
实例3:使用Gene WriterTM系统将剪接受体靶向递送至哺乳动物细胞中。
该实例描述了Gene Writing基因组编辑系统的制备和使用,以将异源序列添加到内含子区中,充当上游外显子的剪接受体。将新外显子剪接到第一内含子中(该新外显子在5’端包含剪接受体位点,在3’端包含聚A尾)将产生成熟的mRNA,其包含与新外显子剪接的天然基因座的第一天然外显子。
在该实例中,重组酶蛋白选自表3A、3B或3C。重组酶蛋白靶向基因组(例如HEK293基因组)中的相容识别位点用于DNA整合。模板DNA编码GFP,其具有紧接成熟GFP的第一个氨基酸5’的剪接受体位点(起始密码子被去除),和终止密码子下游的3’聚A尾。
HEK293细胞用以下测试剂转染:
1.乱序DNA对照
2.编码上述多肽的DNA
3.上述模板DNA
4.2和3的组合
转染后,将HEK293细胞培养至少4天,并测定位点特异性Gene Writing基因组编辑和适当的mRNA加工。从HEK293细胞分离基因组DNA。进行逆转录PCR以测量包含靶基因座的第一天然外显子和新外显子的成熟mRNA。RT-PCR反应使用与靶基因座(例如靶基因座的第一天然外显子)结合的正向引物和与GFP结合的反向引物进行。RT-PCR产物在琼脂糖凝胶上电泳以测量DNA的长度。在用第4组测试剂转染的细胞中检测到预期长度的PCR产物,其表明成功的Gene Writing基因组编辑事件和成功的剪接事件。该结果将表明Gene Writing基因组编辑系统可以将编码基因的异源序列添加到靶基因座(例如内含子区)中,以充当上游外显子的剪接受体。
将转染的细胞再培养10天,然后在多个细胞培养传代后经由流式细胞术测定GFP表达。计算来自每个细胞群体的GFP阳性细胞的百分比。在用第4组测试剂转染的HEK293细胞群体中检测到GFP阳性细胞,表明表达了经由Gene Writing基因组编辑添加到哺乳动物细胞基因组中的基因表达单元。
实例4:哺乳动物细胞中Gene Writing的特异性
该实例描述了将Gene WriterTM基因组系统递送至哺乳动物细胞,用于将外源DNA位点特异性地插入哺乳动物细胞基因组中,以及对位点特异性插入特异性的测量。
在该实例中,如任何前述实例中所述,在HEK293T细胞中进行Gene Writing。转染后,将HEK293T细胞培养至少4天,然后测定位点特异性基因组编辑。如Schmidt等人NatureMethods[自然方法]4,1051-1057(2007)中所述使用对模板DNA特异的正向引物进行线性扩增PCR,线性扩增PCR将扩增相邻的基因组DNA。然后使用下一代测序技术在MiSeq仪器上对扩增的PCR产物进行测序。将MiSeq读数映射到HEK293T基因组,以鉴定基因组中的整合位点。
映射到靶基因组位点的LAM-PCR测序读数的百分比是Gene Writer的特异性。
LAM-PCR测序读数映射到的总基因组位点的数量是总整合位点的数量。
实例5:哺乳动物细胞中Gene Writing的效率
该实例描述了将Gene WriterTM基因组系统递送至哺乳动物细胞,用于将外源DNA位点特异性地插入哺乳动物细胞基因组中,以及对Gene Writing的效率的测量。
在该实例中,如任何前述实例中所述,在HEK293T细胞中进行Gene Writing。转染后,将HEK293T细胞培养至少4天,然后测定位点特异性基因组编辑。如Lin等人,Human GeneTherapy Methods[人类基因治疗方法]27(5),197-208,2016中所述进行数字液滴PCR。正向引物与模板DNA结合,且反向引物结合在适当基因组整合位点的一侧,因此仅在整合靶DNA时才预期发生PCR扩增。针对靶位点的探针含有FAM荧光团,且用于测量基因组中靶DNA的拷贝数。对管家基因(例如RPP30)特异的引物和HEX荧光团探针用于测量每个液滴的基因组DNA拷贝数。
相对于每个液滴的管家DNA拷贝数归一化的每个液滴的靶DNA拷贝数是GeneWriter的效率。
实例6:细胞中重组酶的拷贝数的确定
以下实例描述了每细胞基础上重组酶的绝对定量。该测量使用基于AQUA质谱的方法进行,例如,可在以下统一资源定位符(URL):https://www.sciencedirect.com/science/article/pii/S1046202304002087?via%3Dihub访问。
在将重组酶和DNA模板递送至细胞后,允许重组进行24小时,之后对细胞进行定量,且然后通过该MS方法进行定量。该方法涉及两个阶段。
在第一阶段,检查重组酶的氨基酸序列,并选择有代表性的胰蛋白酶肽进行分析。然后合成AQUA肽,其氨基酸序列精确模拟蛋白水解过程中产生的对应天然肽。然而,在一个残基处掺入稳定的同位素,以使质谱仪能够区分分析物和内标。合成肽和天然肽共有相同的物理化学特性,包括色谱共洗脱、电离效率和碎片离子的相对分布,但由于它们的质量差异而在质谱仪中检测到差异。接下来通过LC-MS/MS技术分析合成肽,以确认肽的保留时间、确定碎片离子强度并选择离子用于SRM分析。在这种SRM实验中,三重四极杆质谱仪涉及选择第一个扫描四极杆或Q1中的预期前体离子。仅具有这一质荷比(m/z)的离子会被引导到碰撞池(Q2)中以进行碎片化。所得产物离子被传递到第三个四极杆(Q3),其中单个碎片离子的m/z比在狭窄的m/z窗口中进行监测。
第二阶段涉及对来自细胞或组织裂解物的重组酶进行定量。定量的细胞数量或组织质量用于启动反应,并用于将定量相对于每细胞基础归一化。在蛋白水解之前分离细胞裂解物以经由SDS-PAGE增加测定的动态范围,然后切除重组酶迁移的凝胶区域。进行凝胶内消化以获得天然胰蛋白酶肽。凝胶内消化是在AQUA肽存在的情况下进行的,在消化过程中将该肽添加到凝胶块中。在蛋白水解之后,使用在第一阶段期间确定的参数在LC-SRM实验中分析包含重肽和轻肽两者的复杂肽混合物。
基于质谱的定量结果被转换为加载的蛋白质数量,以确定每个细胞的重组酶数量。
实例7:细胞内DNA的拷贝数
Q-FISH
以下实例描述了每细胞基础上对递送的DNA模板的定量。在该实例中,重组酶整合的DNA含有DNA探针结合位点。在将重组酶和DNA模板递送至细胞后,允许重组进行24小时,之后对细胞进行定量,并准备细胞用于定量荧光原位杂交(Q-FISH)。使用FISH标签DNA橙色试剂盒(FISH Tag DNA Orange Kit)和Alex Fluor 555染料(赛默飞世尔公司(ThermoFisher)目录号F32948)进行Q-FISH。简而言之,与DNA模板上的DNA探针结合位点结合的DNA探针是通过试剂盒手册中所述的切口平移、染料标记和纯化的程序产生的。然后按照试剂盒手册中所述用DNA探针标记细胞。在维持在37C和5% CO2的同时,将细胞在具有63x油浸物镜的蔡司公司(Zeiss)LSM 710共聚焦显微镜上成像。DNA探针经过555nm激光激发以刺激Alexa Flour。编写MATLAB脚本来测量相对于用已知数量的DNA生成的标准的AlexFluor强度。使用该方法,确定了递送至细胞的模板DNA的量。
qPCR
以下实例描述了每细胞基础上对递送的DNA模板的定量。在该实例中,重组酶整合的DNA含有DNA探针结合位点。在将重组酶和DNA模板递送至细胞后,允许重组进行24小时,之后定量细胞,并制备细胞用于定量PCR(qPCR)。使用针对该方案的标准试剂盒进行qPCR,例如赛默飞世尔公司TaqMan产品(https://www.thermofisher.com/us/en/home/life-science/pcr/real-time-pcr/real-time-pcr-assays-search.html)。简而言之,设计的引物可特异性扩增所递送模板DNA的区域以及特定扩增子的探针。通过使用定量的纯模板DNA的连续稀释来生成标准曲线,以将阈值Ct数与DNA模板数相关联。然后从被分析的细胞中提取DNA,并按照制造商的说明与所有另外的组分一起输入到qPCR反应中。然后在适当的qPCR机器上分析样品以确定Ct数,然后将Ct数映射到标准曲线以进行绝对定量。使用该方法,确定了递送至细胞的模板DNA的量。
实例8:DNA:重组酶的细胞内比率
以下实例描述了对靶细胞中重组酶蛋白与模板DNA细胞比率的确定。在将重组酶和DNA模板递送至细胞后,允许重组进行24小时,之后对细胞进行定量,并准备细胞用于如上述实例中所述对重组酶和模板DNA进行定量。然后将这两个值(每个细胞的重组酶和每个细胞的模板DNA)相除(每个细胞的重组酶/每个细胞的模板DNA)以确定这些量的总体平均比率。使用该方法,确定了递送至细胞的重组酶与模板DNA的比率。
实例9:DNA损伤应答抑制剂存在下的活性-NHEJ抑制剂存在下的活性
以下实例描述了在非同源末端连接抑制剂存在的情况下重组酶蛋白活性的测定,以强调重组酶活性不依赖于这些途径中涉及的蛋白质的表达。简而言之,进行上述实例中概述以确定重组酶活性效率的测定。然而,在这种情况下,进行了两个单独的实验。
在实验1中,在递送重组酶和模板DNA之后24小时,将1μM的NHEJ抑制剂Scr7(https://www.sigmaaldrich.com/catalog/product/sigma/sml1546?lang=en&region=US)添加到细胞生长培养基中以抑制该途径。方案的所有其他元素都是相同的。
在实验2中,对细胞的操纵与实验1相同,但未向培养基中添加抑制剂。根据上述实例对两个实验的效率进行分析,并确定相对于未抑制活性的抑制活性百分比。
实例10:DNA损伤应答抑制剂存在下的活性-HDR抑制剂存在下的活性
以下实例描述了在同源重组的抑制剂存在的情况下重组酶蛋白活性的测定,以强调重组酶活性不依赖于这些途径中涉及的蛋白质的表达。简而言之,进行上述实例中概述以确定重组酶活性效率的测定。然而,在这种情况下,进行了两个单独的实验。
在实验1中,在递送重组酶和模板DNA之后24小时,将1μM的HR抑制剂B02(https://www.selleckchem.com/products/b02.html)添加到细胞生长培养基中以抑制该途径。方案的所有其他元素都是相同的。
在实验2中:对细胞的操纵与实验1相同,但未向培养基中添加抑制剂。根据上述实例对两个实验的效率进行分析,并确定相对于未抑制活性的抑制活性百分比。
实例11:核重组酶相对于细胞质重组酶的百分比
以下实例描述了对靶细胞核中重组酶蛋白与靶细胞细胞质中重组酶蛋白比率的确定。如本文所述将重组酶和DNA模板递送至细胞后12小时时,对细胞进行定量并准备细胞用于分析。使用以下标准试剂盒,按照制造商的说明:赛默飞世尔公司的NE-PER核和细胞质提取将细胞分成核和细胞质部分。将细胞质和核部分皆保留,然后进行上述实例中概述的基于质谱的重组酶定量测定。使用该方法,确定了细胞中核重组酶与细胞质重组酶的比率。
实例12:向植物细胞的递送
该实例说明了将至少一种重组酶递送至植物细胞的方法,其中该植物细胞位于植物或植物部分中。更特别地,该实例描述了将Gene Writing重组酶及其模板DNA递送至非表皮植物细胞(即,大豆胚中的细胞),以便在切除的大豆胚的种系细胞中编辑内源植物基因(即,八氢番茄红素脱氢酶,PDS)。该实例描述了将编码所递送转基因的多核苷酸通过多重屏障(例如,多个细胞层、种皮、细胞壁、质膜)直接递送到大豆种系细胞中,从而导致靶核苷酸序列PDS的可遗传改变。所描述的方法不采用常用技术细菌介导的转化(例如,通过土壤杆菌属物种)或基因枪法。
将质粒设计用于在大豆(橹豆(Glycine max))中递送重组酶和靶向内源八氢番茄红素脱氢酶(PDS)的单一模板DNA。对本领域技术人员显而易见的是,很容易设计编码其他重组酶和模板DNA序列的类似质粒,任选地包括不同的元件(例如,不同的启动子、终止子、可选择或可检测的标志物、细胞穿透肽、核定位信号、叶绿体转运肽或线粒体靶向肽等),并以类似方式使用。
在第一系列实验中,使用递送剂和电穿孔的组合将这些载体递送至大豆胚中的非表皮植物细胞。成熟、干燥的大豆种子(栽培品种威廉姆斯82(cv.Williams 82))如下进行表面灭菌。将干燥的大豆种子在封闭室中放置4小时,该封闭室中放置含有100毫升5%次氯酸钠溶液的烧杯,向该烧杯中新添加4毫升盐酸。在该灭菌处理之后使种子保持干燥。通过手动使用剃刀刀片将灭菌的种子分成两半,并手动将胚与子叶分离。每个测试或对照处理针对20个切除的胚进行。然后进行以下一系列实验。
实验1:制备在无菌过滤的milliQ水中的0.01% CTAB(十六烷基三甲基溴化铵,一种季铵表面活性剂)中含有载体(每种质粒每微升100纳克)的递送溶液。将每种溶液冷却至4摄氏度,并将500微升直接添加到胚中,然后立即将其置于真空室中的冰上并进行负压(2x10"3毫巴)处理15分钟。在冷却/负压处理之后,使用设置有以下参数(50V,25毫秒脉冲长度,对于99个脉冲的75毫秒脉冲间隔)的BTX-Harvard ECM-830电穿孔装置对胚胎进行电流处理。
实验2:条件与实验1相同,不同之处在于与递送溶液的初始接触和负压处理在室温下进行。
实验3:条件与实验1相同,不同之处在于递送溶液在没有CTAB的情况下制备但包括0.1% Silwet L-77TM(CAS号27306-78-1,可从纽约奥尔巴尼迈图高性能材料公司(Momentive Performance Materials,Albany,N.Y)获得)。接受每次处理的胚中有一半(20个中的10个)接受电穿孔,而另一半胚不接受。
实验4:条件与实验3相同,不同之处在于制备了几种递送溶液,其中每种进一步包括20微克/毫升的一种单壁碳纳米管制剂,该制剂选自目录号为704113、750530、724777、和805033的那些(均可从密苏里州圣路易斯西格玛奥德里奇公司(Sigma-Aldrich,St.Louis,MO)获得)。接受每次处理的胚中有一半(20个中的10个)接受电穿孔,而另一半胚不接受。
实验5:条件与实验3相同,不同之处在于递送溶液进一步包括20微克/毫升的三乙氧基丙基氨基硅烷官能化二氧化硅纳米颗粒(目录号791334,密苏里州圣路易斯西格玛奥德里奇公司)。接受每次处理的胚中有一半(20个中的10个)接受电穿孔,而另一半胚不接受。
实验6:条件与实验3相同,不同之处在于递送溶液进一步包括9微克/毫升支链聚乙烯亚胺,分子量为25,000(CAS号9002-98-6,目录号408727,密苏里州圣路易斯西格玛奥德里奇公司)或9微克/毫升支链聚乙烯亚胺,分子量为800(CAS号25987-06-8,目录号408719,密苏里州圣路易斯西格玛奥德里奇公司)。接受每次处理的胚中有一半(20个中的10个)接受电穿孔,而另一半胚不接受。
实验7:条件与实验3相同,不同之处在于递送溶液进一步包括20%v/v二甲亚砜(DMSO,目录号D4540,密苏里州圣路易斯西格玛奥德里奇公司)。接受每次处理的胚中有一半(20个中的10个)接受电穿孔,而另一半胚不接受。
实验8:条件与实验3相同,不同之处在于递送溶液进一步含有50微摩尔的九精氨酸(RRRRRRRRR,SEQ ID NO:3477)。接受每次处理的胚中有一半(20个中的10个)接受电穿孔,而另一半胚不接受。
实验9:条件与实验3相同,不同之处在于真空处理之后,将胚和处理溶液转移到微量离心管中并在4000x g下离心2、5、10或20分钟。接受每次处理的胚中有一半(20个中的10个)接受电穿孔,而另一半胚不接受。
实验10:条件与实验3相同,不同之处在于真空处理之后,将胚和处理溶液转移到微量离心管中并在4000x g下离心2、5、10或20分钟。
实验11:条件与实验4相同,不同之处在于真空处理之后,将胚和处理溶液转移到微量离心管中并在4000x g下离心2、5、10或20分钟。
实验12:条件与实验5相同,不同之处在于真空处理之后,将胚和处理溶液转移到微量离心管中并在4000x g下离心2、5、10或20分钟。
递送处理后,将每个处理组的胚用无菌水洗涤5次,转移到含有1/2MS固体培养基(2.165g Murashige和Skoog培养基盐,目录号MSP0501,犹他州史密斯菲尔德凯西森实验室(Caisson Laboratories,Smithfield,UT))、10克蔗糖和8克Bacto琼脂的培养皿中,用蒸馏水定容至1.00升,并置于设置为25摄氏度的组织培养箱中。待胚伸长、发育成根、出现真叶后,将幼苗移入土壤中长出。对所有内源PDS等位基因的修饰导致植物无法产生叶绿素并具有可见的漂白表型。对所有内源PDS等位基因的一部分的修饰使植物仍然能够产生叶绿素;对于改变的PDS基因杂合的植物将长成种子,且可遗传的基因组修饰的效率由子代种子的分子分析确定。
实例13:人细胞中重组酶介导的质粒整合。
该实例描述了基于丝氨酸重组酶的Gene Writer系统用于将模板DNA靶向整合到人基因组中的用途。更特别地,该实例描述了将双质粒系统转染到HEK293T细胞中用于体外Gene Writing,例如作为评价新Gene Writing多肽在人细胞中的整合活性的手段。
简言之,设计了双质粒系统,其包含:1)整合酶表达质粒,例如编码人密码子优化的丝氨酸整合酶(例如来自表3A、表3B或表3C的丝氨酸整合酶)的质粒,其通过哺乳动物CMV启动子驱动,和2)模板质粒,例如包含以下的质粒:(i)包含丝氨酸整合酶的识别位点的序列,例如来自丝氨酸整合酶的内源侧翼区的约500bp序列,例如来自表2A、表2B或表2C的相应行的序列;(ii)用于在哺乳动物细胞中表达的启动子,例如CMV启动子;(iii)其表达受(ii)控制的报告基因,例如EGFP基因;(iv)自切割多肽,例如T2A肽;(v)能够在哺乳动物细胞中选择的标记,例如嘌呤霉素抗性基因;和(vi)终止信号,例如聚A尾。在不希望受理论约束的情况下,模板质粒的一些实施例可包含以方向(i)、(ii)、(iii)、(iv)、(v)出现的元件。
为了将Gene Writer系统递送到HEK293T细胞中,用以下任一种转染约120,000个细胞:(1)50ng模板质粒和225ng转染平衡质粒(仅模板对照);或(2)50ng模板质粒,25ng整合酶表达质粒和225ng转染平衡质粒,使用TransIT-293试剂(麦鲁斯生物公司(Mirusbio))根据制造商说明书。转染后三天,使用流式细胞术测量递送效率以确定GFP阳性细胞的百分比。在时程实验的第3天和第13天之间细胞分裂。在第13天和第27天之间,将已分裂的转染细胞维持在两种条件中的一种中:1)将细胞的子集维持在正常细胞培养基中,并且每3-4天进行流式细胞术以确定来自成功整合的模板的GFP表达;2)将细胞的子集维持在补充有1μg/mL嘌呤霉素的培养基中,其中在约2周的选择后收获嘌呤霉素抗性细胞。在一些情况下,在人细胞中表现出活性的Gene Writer系统在第21天在至少3%的细胞中产生可检测的报告子表达,例如,在如通过流式细胞术测定的至少3%的细胞中可检测的GFP表达。在一些情况下,在人细胞中表现出活性的Gene Writer系统导致一定百分比的细胞中可检测的报告子表达,该百分比大于用仅模板对照所表现的报告子表达的百分比,例如,高于转染条件(1),例如,与仅模板对照相比高至少2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、或1000倍。
为了确定活性Gene Writer使用的整合位点,收获维持在嘌呤霉素选择下的平行培养物用于基因组分离并通过单向测序测定进行分析,如本文实例18中所述。
如下表30中所示,在人细胞中测定Gene Writer多肽(例如来自表3A、表3B或表3C的丝氨酸重组酶)对包含GFP表达盒和识别序列(例如来自表2A、表2B或表2C的相应行的识别序列)的模板DNA的整合(参见实例13)。
表30:人细胞中重组酶介导的整合的筛选数据
Figure BDA0003761233040006661
Figure BDA0003761233040006671
Figure BDA0003761233040006681
Figure BDA0003761233040006691
Figure BDA0003761233040006701
Figure BDA0003761233040006711
Figure BDA0003761233040006721
Figure BDA0003761233040006731
Figure BDA0003761233040006741
Figure BDA0003761233040006751
Figure BDA0003761233040006761
Figure BDA0003761233040006771
Figure BDA0003761233040006781
Figure BDA0003761233040006791
Figure BDA0003761233040006801
Figure BDA0003761233040006811
Figure BDA0003761233040006821
单个多肽和同源识别序列在表30中显示,它们的行号(对应于表1A、1B、1C、2A、2B、2C、3A、3B、3C中的行号)在第1列中,并在第3列中指定整合酶标识名称(“Int ID”)。整合效率在第4列中表示为表达GFP的细胞的百分比(“%GFP+”),如在没有抗生素选择的情况下在转染后第21天通过流式细胞术测量的。
在另一个实例中,用整合酶表达质粒和模板质粒转染HEK293T细胞,该模板质粒携带520bp的含有attP的区域,接着是由CMV启动子驱动的EGFP报告子。通过流式细胞术分析转染后第21天EGFP阳性细胞的百分比。如图1A中所示,与阳性对照整合酶PhiC31相比,所描绘的9种整合酶中的9种在293T细胞中实现了更高的整合效率。显示的整合酶的数据包含大于2个重复。
实例14:丝氨酸整合酶和模板DNA向哺乳动物细胞的双重AAV递送
该实例说明了基于丝氨酸重组酶的Gene Writer系统用于将模板DNA靶向整合到人基因组中的用途。更特别地,重组酶(例如具有来自表3A、3B或3C的氨基酸序列的整合酶,例如Bxb1重组酶蛋白(表3A行号204)),和包含相关附接位点的模板DNA(例如来自表2A、2B或2C的左区或右区的序列,例如来自表2A行号204的左区),作为单独的AAV病毒载体共同递送至HEK293T细胞以将DNA精确且有效地插入含有相应的Bxb1附接着陆垫位点的哺乳动物细胞基因组中。
使用以下不同的AAV供体形式评估两种转基因构型以确定整合、稳定性和表达(图1B):1)包含attP*或attB*的模板,其利用在细胞核中AAV转导后形成双链环化DNA;或2)包含双附接位点attP-attP*或attB-attB*的模板,其可以在细胞核中AAV转导后不依赖于DNA的双链环化而整合到哺乳动物基因组中。
为了制备用于模板的Bxb1介导的基因组整合的HEK293T细胞,产生含有Bxb1attP-attP*或Bxb1 attB-attB*位点的HEK293T着陆垫细胞系。在慢病毒转染之前,将HEK293T细胞接种在10cm平板(5×106个细胞)中。第二天用慢病毒载体质粒DNA(含有attP-attP*或attB-attB*)进行使用Lenti-X Packaging Single Shots(VSV-G,宝生物工程株式会社(Takara Bio))的慢病毒转导。进行慢病毒滴定并且使用0.22μm过滤器过滤病毒并且制备1mL慢病毒等分试样并储存在-80℃下。将HEK293T细胞以1×105个细胞/孔接种在4×6孔板中。然后用attP-attP*或attB-attB*慢病毒转导HEK293T细胞并培养48小时,然后开始嘌呤霉素选择(1μg/mL)。将细胞在嘌呤霉素选择下保持至少7天,然后扩大至150mm培养板。然后收获细胞的基因组DNA(gDNA)并通过ddPCR测定慢病毒整合拷贝数。
基于pAAV-CMV-EGFP-WPRE-pA病毒骨架(Sirion生物技术公司(Sirion Biotech))产生含有Bxb1整合酶或相应的Bxb1 attP*/attP-attP*供体或Bxb1attB*/attB-attB*供体的腺相关病毒载体,但用EF1a启动子替换CMV启动子。使用人密码子优化的Bxb1(GenScript公司)产生pAAV-Ef1a-BXB1-WPRE-pA。pAAV-填充片段-attP*(Bxb1)-Ef1a-EGFP-WPRE-pA和pAAV-填充片段-attB*(Bxb1)-Ef1a-EGFP-WPRE-pA模板构建体在5’AAV2 ITR序列和Ef1a启动子之间含有500bp填充片段序列。pAAV-填充片段-attP(Bxb1)-Ef1a-EGFP-WPRE-pA-attP*(Bxb1)-填充片段和pAAV-填充片段-attB(Bxb1)-Ef1a-EGFP-WPRE-pA-attB*(Bxb1)-填充片段供体构建体在AAV2 ITR序列和Ef1a启动子之间含有500bp填充片段序列,以及在3’attP*/attB*附接位点和3’AAV2 ITR序列之间含有500bp填充片段序列(图2)。以上列出的AAV载体以113总vg规模包装到AAV2血清型(Sirion生物技术公司)中:AAV2-Ef1a-BXB1-WPRE-pA、AAV2-填充片段-attP*(BXB1)-Ef1a-EGFP-WPRE-pA、AAV2-填充片段-attB*(BXB1)-Ef1a-EGFP-WPRE-pA、AAV2-填充片段-attP(BXB1)-Ef1a-EGFP-WPRE-pA-attP*(BXB1)-填充片段、AAV2-填充片段-attB(BXB1)-Ef1a-EGFP-WPRE-pA-attB*(BXB1)-填充片段。
将含有attP-attP*或attB-attB*着陆垫位点的HEK293T着陆垫细胞以40,000个细胞/孔接种在48孔板规格中。24小时后,测试以下条件:用1)有或没有AAV2-Ef1a-BXB1整合酶的AAV2-attP*-Ef1a-EGFP,2)有或没有AAV2-Ef1a-BXB1整合酶的AAV2-attP-attP*-Ef1a-EGFP供体,3)有或没有AAV2-Ef1a-BXB1整合酶的AAV2-attB*-Ef1a-EGFP,4)有或没有AAV2-Ef1a-BXB1整合酶的AAV2-attB-attB*-Ef1a-EGFP进行双重AAV转导(图3A)。包含整合酶的AAV以约25,000的MOI给药,并且包含模板的AAV以约75,000的MOI给药。为了评估双重AAV递送丝氨酸整合酶和包含其识别位点的模板以整合到人基因组中的效率,在转导后第3天和第7天进行ddPCR以定量整合事件(%CNV/着陆垫)。使用attB*供体检测到约5%整合到attP-attP*着陆垫细胞系,并且该整合在两个时间点都是稳定且一致的(图3B),表明通过双重AAV递送系统成功进行DNA Gene Writing。
实例15:用于在人细胞中位点特异性整合的Gene Writing多肽和模板DNA的体外 组合mRNA和AAV递送
该实例说明了Gene Writer系统用于将外源DNA位点特异性地插入哺乳动物细胞基因组的用途。更特别地,将重组酶(例如具有来自表3A、3B或3C的氨基酸序列的整合酶,例如Bxb1重组酶蛋白(表3A行号204)),和包含相关附接位点的模板DNA(例如来自表2A、2B或2C的左区或右区的序列,例如来自表2A行号204的左区)引入HEK293T着陆垫细胞系中。在该实例中,将重组酶作为编码该重组酶的mRNA递送,将模板DNA经由AAV递送。
将含有attP-attP*或attB-attB*着陆垫位点的HEK293T着陆垫细胞(参见实例14)以40,000个细胞/孔接种在48孔板规格中。24小时后,测试以下条件:1)有或没有编码BXB1整合酶的mRNA的AAV2-attP*-Ef1a-EGFP;2)有或没有编码BXB1整合酶的mRNA的AAV2-attP-attP*-Ef1a-EGFP供体;3)有或没有编码BXB1整合酶的mRNA的AAV2-attB*-Ef1a-EGFP;以及4)有或没有编码BXB1整合酶的mRNA的AAV2-attB-attB*-Ef1a-EGFP(图4A)。编码整合酶的mRNA以约1μg给药,并且包含模板的AAV以约75,000的MOI给药。还通过以下条件评估递送时间:1)在同一天进行BXB1整合酶的mRNA递送和模板DNA的AAV递送,2)BXB1整合酶的mRNA递送在模板DNA的AAV递送之前24小时,3)模板DNA的AAV递送在BXB1整合酶的mRNA递送之前24小时。进行ddPCR以评估通过丝氨酸整合酶的mRNA递送和包含其附接的模板的AAV递送介导的整合,进行ddPCR以测定mRNA转染后和AAV转导后第3天的整合(%CNV/着陆垫)。使用attP*供体检测到约2%-4%整合到attB-attB*着陆垫293T细胞系(图4B)。附接位点供体的AAV递送在BXB1整合酶的mRNA递送之前24小时实现约4%的最高%CNV/着陆垫(图3B)。这些结果表明成功的DNA Gene Writing基因组编辑事件,其插入了位点特异性的AAV递送的DNA片段,由丝氨酸整合酶的mRNA递送和其各自位点特异性附接位点的AAV递送介导。
实例16:向HSC的Gene Writing多肽和模板DNA的离体组合mRNA和AAV递送以便治 疗β-地中海贫血和镰状细胞疾病
该实例描述了将编码整合酶的mRNA和AAV模板DNA递送到C34+细胞(造血干细胞和祖细胞)中,以便编写活跃表达的γ-珠蛋白基因盒来治疗引起β-地中海贫血和镰状细胞疾病的基因突变。
在该实例中,AAV6用于递送模板DNA。更特别地,AAV6模板DNA依次包括5’ITR、整合酶附接位点(例如attP或attB,例如来自表2A、2B或2C的左区或右区)、pol II启动子(例如人β-珠蛋白启动子)、人胎儿γ-珠蛋白编码序列、聚A尾和3’ITR。考虑到电穿孔试剂的最大体积限制,将整合酶mRNA和AAV6模板经由不同的条件共同递送到CD34细胞中,这些条件为例如:1)将AAV6模板和整合酶mRNA共电穿孔;2)在AAV6供体转导前15分钟对整合酶mRNA进行电穿孔。
电穿孔/转导后,将细胞在CD34维持培养基中培养2天。然后,收获约10%的经处理细胞用于基因组DNA分离以确定整合效率。将其余的细胞转移到红细胞扩增和分化培养基中。分化约20天后,进行三项测定以确定红细胞分化后γ-珠蛋白的整合:1)用NucRed(赛默飞世尔科技公司(Thermo Fisher Scientific))对细胞子集进行染色以确定去核率;2)用异硫氰酸荧光素(FITC)缀合的抗γ-珠蛋白抗体(圣克鲁斯公司(Santa Cruz))对细胞子集进行染色,以确定胎儿血红蛋白阳性细胞的百分比;3)收获细胞子集用于HPLC以确定γ-珠蛋白链表达。
实例17:用于产生CAR-T细胞的Gene Writer多肽和环状DNA模板的离体递送
在该实例中,将Gene Writing系统作为脱氧核糖核蛋白(DNP)递送至离体人原代T细胞以产生CAR-T细胞,例如用于治疗B细胞淋巴瘤的CAR-T细胞。
制备并纯化Gene Writer多肽,例如整合酶,例如具有来自表3A、3B或3C的序列的整合酶,以直接以其活性蛋白形式使用。对于模板组分,在该实例中使用了缺少质粒主链和细菌序列的微环DNA质粒,例如,根据Chen等人Mol Ther[分子治疗]8(3):495-500(2003)的方法制备,其中首先使用重组事件来切除这些外来的质粒维持功能以最小化质粒大小和细胞反应。模板DNA微环依次包含整合酶附接位点(attP或attB)(例如来自表2A、2B或2C的左区或右区)、pol II启动子(例如EF-1)、人密码子优化的嵌合抗原受体(包括细胞外配体结合结构域、跨膜结构域和细胞内信号传导结构域),例如CD19特异性Hu19-CD828Z(GenbankMN698642;Brudno等人Nat Med[自然医学]26:270-280(2020))CAR分子、和聚A尾。首先将模板DNA与纯化的整合酶蛋白混合,并在室温下孵育15-30分钟以形成DNP复合物。然后,将DNP复合物被核转染到活化的T细胞中。使用用于分子定量的ddPCR测定通过Gene Writer系统的整合,并通过流式细胞术测量CAR表达。
实例18:用于确定整合位点的单向测序测定
在该实例中,进行单向测序以确定具有全基因组特异性的无偏谱的未知整合位点的序列。
通过使用包含整合酶和用于插入的模板DNA的Gene Writing系统,如前面的实例进行整合实验。将整合酶和供体质粒转染到293T细胞中。在转染后72小时提取基因组DNA并根据以下方法进行单向测序。首先,通过基因组DNA的片段化、末端修复和接头连接创建下一代文库。接下来,使用与模板特异性序列结合的正向引物和与测序接头结合的反向引物,通过两步巢式PCR扩增携带模板DNA整合事件的片段化基因组DNA。将PCR产物在毛细管凝胶电泳仪上可视化,纯化,并通过Qubit(赛默飞世尔公司)定量。最终文库在Miseq上使用300bp配对末端读数(依诺米那公司(Illumina))进行测序。通过检测位于插入物侧翼的DNA并将该序列映射回人基因组序列(例如,hg38)来进行数据分析。
实例19:编码Gene Writer多肽的mRNA的产生
在该实例中,通过体外转录从mRNA表达整合酶。mRNA模板质粒包括T7启动子,接着是5’UTR、整合酶编码序列、3’UTR和约100个核苷酸长的聚(A)尾。将质粒通过酶促限制线性化,产生聚(A)尾下游的平端或5’突出端,并用于使用T7聚合酶(NEB)进行的体外转录(IVT)。IVT后,将RNA用DNA酶I(NEB)处理。缓冲液交换后,在GTP和SAM(NEB)存在的情况下,使用牛痘加帽酶(NEB)和2’-O-甲基转移酶(NEB)进行酶促加帽。使用硅胶柱(例如,Monarch
Figure BDA0003761233040006871
RNA纯化试剂盒)对加帽RNA进行纯化和浓缩,并通过2mM柠檬酸钠pH 6.5缓冲。
实例20:双重AAV载体用于治疗CFTR小鼠模型的囊性纤维化的用途
在该实例中,将Gene Writing系统作为双重AAV载体系统递送以便治疗小鼠疾病模型中的囊性纤维化。囊性纤维化是一种由CTFR基因突变引起的肺疾病,其可以通过将野生型CTFR基因插入肺细胞基因组来治疗,肺细胞例如为在呼吸性细支气管和柱状无纤毛细胞中发现的终末细支气管中的细胞。
将Gene Writing多肽(例如,包含表3A、3B或3C的序列)和包含同源附接位点(例如,attB或attP位点,例如,表2A、2B或2C的左区或右区序列)的模板DNA包装到AAV6衣壳中,其中多肽的表达由CAG启动子驱动,根据Halbert等人Hum Gene Ther[人类基因治疗]18(4):344-354(2007)的传授内容,已表明其组合对鼠呼吸道上皮细胞中的高水平转导和表达有效。
如前所述(Santry等人BMC Biotechnol[BMC生物技术]17:43(2017)),使用改良的鼻内施用将AAV制剂通过鼻内方式共同递送给CFTR基因敲除(Cftrtm1Unc)小鼠(杰克逊实验室(The Jackson Labs))。简言之,将AAV包装、纯化和浓缩,其具有整合酶或模板DNA,包含在pol II启动子例如CAG启动子控制下的CFTR基因,以及同源附接位点。在一些实施例中,CFTR表达盒的侧翼是整合酶附接位点。使用改良的鼻内施用将制备的AAV分别以1×1010-1×1012vg/小鼠范围内的剂量递送至CFTR敲除小鼠。一周后,收获肺组织并用于基因组提取和组织分析。为了测量整合效率,使用ddPCR对CFTR基因整合进行定量,以确定包含或缺少插入物的细胞和靶位点的比例。为了测定来自成功整合的CFTR的表达,通过免疫组织化学法分析组织以确定表达和病理学。
实例21:通过引入瞬时表达整合酶治疗鸟氨酸氨甲酰基转移酶缺乏症的方法
鸟氨酸氨甲酰基转移酶(OTC)缺乏症是一种罕见的遗传性障碍,由于不能有效分解氮而导致氨积累。氨的积累会导致高氨血症,这种疾病可能会使人衰弱,且在严重的情况下会致命。该实例描述了通过递送和表达编码Gene Writer多肽的mRNA(例如,来自表3A、3B或3C的整合酶序列)以及递送提供模板DNA用于整合的AAV对OTC缺乏症的治疗。AAV模板包含在pol II启动子控制下的人OTC基因的野生型拷贝(例如ApoE.hAAT),和同源附接位点(例如attB或attP位点,例如表2A、2B或2C的左区或右区序列)。在一些实施例中,OTC表达盒的侧翼是整合酶附接位点。
在该实例中,整合酶mRNA的LNP配制品遵循LNP-INT-01的配制品(Finn等人CellReports[细胞报告]22:2227-2235(2018)传授的方法,其通过引用并入本文)并且模板DNA被配制在AAV2/8中(Ginn等人JHEP Reports[JHEP报告](2019)传授的方法,其通过引用并入本文)。简言之,通过经由面部颞浅静脉注射含有整合酶mRNA的LNP配制品(1-3mg/kg)和含有模板DNA的AAV(1×1010-1×1012vg/小鼠)治疗新生Spfash小鼠(杰克逊实验室)来恢复OTC缺乏症(Lampe等人J Vis Exp[可视化实验杂志]93:e52037(2014))。Spfash小鼠具有一些残留的小鼠OTC活性,在一些实施例中,通过施用表达针对小鼠OTC的shRNA的AAV使其沉默,如前所述(Cunningham等人Mol Ther[分子治疗]19(5):854-859(2011),其方法通过引用并入文)。OTC酶活性、氨水平和乳清酸如前所述进行测量(Cunningham等人Mol Ther[分子治疗]19(5):854-859(2011))。1周后,收获小鼠肝脏并用于gDNA提取和组织分析。hOTC的整合效率通过ddPCR对提取的gDNA进行测量。通过免疫组织化学法分析小鼠肝脏组织以确认hOTC表达。
实例22:Gene Writing将大有效负载整合到人细胞中的用途
该实例描述了在体外进行的整合酶介导的大有效负载向人细胞中的整合。
在该实例中,Gene Writer多肽组分包含编码整合酶的mRNA,例如,表3A、3B或3C的整合酶序列,以及包含以下的模板DNA:同源附接位点,例如,attB或attP位点,例如,表2A、2B或2C的左区或右区;GFP表达盒,例如与EGFP可操作地连接的CMV启动子;以及填充片断序列,使总质粒大小达到大约20kb。
简言之,将HEK293T细胞与整合酶mRNA和大模板DNA共电穿孔。三天后,测量整合效率和特异性。为了测量整合效率,对基因组DNA进行液滴数字PCR(ddPCR),例如,如Lin等人Hum Gene Ther Methods[人类基因治疗方法]27(5):197-208(2016)所述,使用跨整合结点扩增的引物-探针组,例如,一个引物与模板DNA退火,另一个引物与基因组的适当侧翼区域退火,使得仅对整合事件进行定量。数据相对于内部参考基因(例如,RPP30)归一化,且效率表示为整个细胞群体中每基因组的平均整合事件。为了测量特异性,通过单向测序来评估基因组DNA中的整合事件以确定基因组坐标,如实例18中所述。
实例23:Gene Writing离体将细菌人工染色体整合到人胚胎干细胞中的用途
该实例描述了整合酶介导的细菌人工染色体(BAC)向人胚胎干细胞(hESC)中的整合。
BAC载体能够维持非常大(>100kb)的DNA有效负载,且因此可以携带许多基因或复杂的基因回路,这些基因或复杂的基因回路可能在细胞工程中有用。尽管已经证明了它们整合到hESC中(Rostovskaya等人Nucleic Acids Res[核酸研究]40(19):e150(2012)),但这是使用在它们的整合模式中缺乏序列特异性的转座子实现的。该实例描述了大型构建体的序列特异性整合。
在该实例中,经工程化以携带所需有效负载的BAC进一步包含附接位点(例如attB或attP位点,例如来自表2A、2B或2C的左区或右区),该附接位点能够被Gene Writer多肽(例如整合酶,例如具有表3A、3B或3C的序列的整合酶)识别。根据Rostovskaya等人NucleicAcids Res[核酸研究]40(19):e150(2012)的传授内容,通过电穿孔或脂质转染将大约150kb BAC引入hESC。三天后,测量整合效率和特异性。为了测量整合效率,对基因组DNA进行液滴数字PCR(ddPCR),例如,如Lin等人Hum Gene Ther Methods[人类基因治疗方法]27(5):197-208(2016)所述,使用跨整合结点扩增的引物-探针组,例如,一个引物与模板DNA退火,另一个引物与基因组的适当侧翼区域退火,使得仅对整合事件进行定量。数据相对于内部参考基因(例如,RPP30)归一化,且效率表示为整个细胞群体中每基因组的平均整合事件。为了测量特异性,通过单向测序来评估基因组DNA中的整合事件以确定基因组坐标,如实例18中所述。
实例24:双重AAV载体将转基因整合到含有整合酶着陆垫位点的小鼠模型中的用
整合酶蛋白天然存在于细菌噬菌体中,并利用噬菌体基因组的序列(attP)将其基因组的一部分在特定序列(attB)处整合到细菌的基因组中。当与携带具有适当识别序列(例如attP或attB)的插入DNA的供体载体和具有相应识别序列(例如attB或attP)的靶或宿主基因组一起提供时,整合酶蛋白可用作驱动因子以将DNA整合到基因组中。对在宿主基因组中发现的具有有效整合的特定序列的这种要求可能限制整合酶将转基因插入小鼠基因组中的使用和/或功效,这使得创建小鼠模型或治疗在小鼠遗传疾病模型的背景中发现的疾病具有挑战性。在该实例中,经工程化以在其基因组中具有attP识别位点(例如,用于Bxb1整合酶的attP序列)的小鼠用于通过递送1)具有目的序列且进一步包含attB识别位点(例如,用于Bxb1整合酶的attB序列)的插入DNA和2)催化将插入DNA整合到基因组attP位点中的整合酶(例如,Bxb1整合酶)来证明靶向整合。此外,在该实例中,所用的Bxb1特异性attP和attB识别序列具有从GT变为GA的中心二核苷酸。在一些实例中,目的DNA序列是包含RNA聚合酶II启动子序列(例如,人甲状腺素结合球蛋白,TBG)和治疗性蛋白的DNA编码区或报告基因(例如,海肾荧光素酶)的异源对象序列。
简言之,将AAV(例如,AAV-DJ)包装、纯化和浓缩,其具有包含编码整合酶蛋白(例如,Bxb1)的DNA或包含插入DNA(例如,在TBG启动子控制下的海肾荧光素酶和所述的attB序列)的构建体。稳定整合了attP识别序列的小鼠经由腹膜内注射以1×1010–1×1013vg/病毒/小鼠的剂量共施用两种AAV病毒中的一种或两种。如前所述,通过肝脏以及其他器官的单向测序随时间监测整合。荧光素酶表达的活体成像如前所述进行监测(Bhaumik,S.,和Gambhir,S.S.,PNAS[美国国家科学院院刊]2002,https://doi.org/10.1073/pnas.012611099)。
实例25:用掺入多个基因的单一组合物治疗多种疾病
鸟氨酸氨甲酰基转移酶(OTC)缺乏症和I型瓜氨酸血症是由不同基因(分别为OTC和ASS1)中的突变引起的不同疾病,它们都导致尿素循环中断,最终导致血液中氮(作为氨)的积累。氨的积累导致高氨血症,其最终可引起组织和神经毒性,伴有衰弱和潜在的致命后果。
本实例描述了可提供用于治疗一种以上疾病的单一Gene Writing系统的设计和使用。更特别地,该实例描述了通过递送和表达编码Gene Writer多肽的mRNA(例如,来自表3A、表3B或表3C的整合酶序列)和包含用于整合的模板DNA的AAV来治疗OTC缺乏症或I型瓜氨酸血症。本实例中的模板DNA包含在pol II启动子(例如ApoE.hAAT)控制下由自切割肽(例如2A)分开的人OTC和ASS1基因的功能性拷贝,和同源附接位点(例如attB或attP位点,例如表2A、表2B或表2C的左区或右区序列)。在一些实施例中,包含OTC和ASS1的表达盒侧接整合酶附接位点。所描述的组合物用于治疗OTC缺乏症或I型瓜氨酸血症。
在该实例中,整合酶mRNA的LNP配制品遵循LNP-INT-01的配制品(Finn等人CellReports[细胞报告]22:2227-2235(2018)传授的方法,其通过引用并入本文)并且模板DNA被包装在AAV2/8中(Ginn等人JHEP Reports[JHEP报告](2019)传授的方法,其通过引用并入本文)。简言之,通过经由面部颞浅静脉注射含有整合酶mRNA的LNP配制品(1-3mg/kg)和含有模板DNA的AAV(1×1010-1×1012vg/小鼠)治疗新生Spfash小鼠(杰克逊实验室)来恢复OTC缺乏症(Lampe等人J Vis Exp[可视化实验杂志]93:e52037(2014))。Spfash小鼠具有一些残留的小鼠OTC活性,在一些实施例中,通过施用表达针对小鼠OTC的shRNA的AAV使其沉默,如前所述(Cunningham等人Mol Ther[分子治疗]19(5):854-859(2011),其方法通过引用并入文)。OTC酶活性、氨水平和乳清酸如前所述进行测量(Cunningham等人Mol Ther[分子治疗]19(5):854-859(2011))。
1周后,收获小鼠肝脏并用于gDNA提取和组织分析。hOTC的整合效率通过ddPCR对提取的gDNA进行测量。通过免疫组织化学法分析小鼠肝脏组织以确认hOTC表达。
在一些实施例中,上述用于治疗OTC缺乏症模型的相同组合物也可用于治疗I型瓜氨酸血症。简言之,通过使用所述的LNP和AAV治疗新生儿致死性精氨基琥珀酸合成酶(ASS)敲除小鼠模型来恢复ASS1缺乏症(Cindy Y Kok等人,Mol Ther.[分子治疗]21(10):1823-1831(2013),其方法通过引用以其全文并入本文)。特别地,经由面部颞浅静脉向ASS敲除小鼠注射含有整合酶mRNA的LNP配制品(1-3mg/kg)和含有模板DNA的AAV(1×1010-1×1012vg/小鼠)(Lampe等人J Vis Exp[可视化实验杂志]93:e52037(2014))。氨水平、乳清酸和总体小鼠存活率如先前所述测量(Cindy Y Kok等人,Mol Ther.[分子治疗]21(10):1823-1831(2013))。2-4-8周后,收获小鼠肝脏并用于gDNA提取和组织分析。hASS1的整合效率通过ddPCR对提取的gDNA进行测量。通过免疫组织化学法分析小鼠肝脏组织以确认hASS1表达。
在一些实施例中,Gene Writing系统将OTC-ASS1表达盒整合到OTC缺乏症和ASS1敲除小鼠模型中。同一系统因此在两种模型中恢复了健康的尿素循环。在一些实施例中,血氨水平从高氨血症降低至正常水平,例如用Gene Writing系统治疗的OTC缺乏症或ASS1敲除小鼠相对于对照小鼠显示血氨水平降低至少2、5、10、50或至少100倍。在一些实施例中,乳清酸水平从升高的水平降低至正常水平,例如,用Gene Writing系统治疗的OTC缺乏症或ASS1敲除小鼠相对于对照小鼠显示乳清酸水平降低至少2、5、10、50或至少100倍。
实例26:具有降低的醛含量的脂质试剂的选择
在该实例中,选择脂质用于含有一种或多种Gene Writing组分核酸的脂质纳米颗粒配制品的下游使用,并且至少部分基于不存在污染醛或低水平的污染醛来选择脂质。脂质试剂中的反应性醛基可在LNP配制期间引起对一种或多种组分核酸(例如RNA,例如模板RNA)的化学修饰。因此,在一些实施例中,脂质试剂的醛含量被最小化。
液相色谱(LC)与串联质谱法(MS/MS)联用可用于分离、表征和定量试剂的醛含量,例如,如Zurek等人.The Analyst[分析家]124(9):1291-1295(1999)所述,通过引用并入本文。在此,将每种脂质试剂进行LC-MS/MS分析。LC/MS-MS方法首先用C8 HPLC柱分离脂质和一种或多种杂质,然后用质谱仪对这些分子进行检测和结构测定。如果醛存在于脂质试剂中,则使用结构上与醛相同但由于C13和N15标记而较重的稳定同位素标记(SIL)标准对其进行定量。将适量的SIL标准掺加到脂质试剂中。然后将混合物进行LC-MS/MS分析。通过将SIL标准的量乘以峰比(未知/SIL)来测定污染醛的量。如所述定量脂质试剂中的任何一个或多个鉴定的醛。在一些实施例中,发现选择用于LNP配制品的脂质原料不包含高于选定水平的任何污染性醛含量。在一些实施例中,用于配制的一种或多种且任选地所有脂质试剂包含小于3%的总醛含量。在一些实施例中,用于配制的一种或多种且任选地所有脂质试剂包含少于0.3%的任何单一醛物质。在一些实施例中,配制中使用的一种或多种且任选地所有脂质试剂包含少于0.3%的任何单一醛物质和少于3%的总醛含量。
实例27:在配制期间由醛引起的RNA修饰的定量
在该实例中,在配制后分析RNA分子以确定在配制过程中可能发生的任何修饰的程度,例如检测由脂质试剂的醛污染引起的化学修饰(参见例如实例26)。
RNA修饰可以通过分析核糖核苷来检测,例如根据Su等人Nature Protocols[自然实验手册]9:828-841(2014)的方法,其通过引用以其全文并入本文。在该方法中,将RNA消化成核苷混合物,然后进行LC-MS/MS分析。配制后RNA包含在LNP中,并且其必须首先通过在80%异丙醇中与GlycoBlue共沉淀而从脂质中分离。离心后,将含有RNA的沉淀小心地转移到新的Eppendorf管中,向其中添加酶混合物(全能核酸酶、1型磷酸二酯酶、磷酸酶)以将RNA消化成核苷。将Eppendorf管置于37℃下预热的Thermomixer上1小时。将所得核苷混合物通过LC-MS/MS方法直接分析,该方法首先用C18柱分离核苷和修饰的核苷,然后用质谱检测它们。
如果脂质试剂中的一个或多个醛引起了化学修饰,则数据分析将使一个或多个修饰的核苷与一个或多个醛相关联。可以使用SIL标准定量修饰的核苷,SIL标准在结构上与天然核苷相同,不同之处在于由于C13和N15标记而更重。将适当量的SIL标准掺加到核苷消化物中,然后对其进行LC-MS/MS分析。通过将SIL标准的量乘以峰比(未知/SIL)获得修饰核苷的量。LC-MS/MS能够同时定量所有靶标分子。
在一些实施例中,与在脂质纳米颗粒配制过程中使用较高纯度的脂质试剂作为材料相比,使用具有较高杂质醛含量的脂质试剂导致较高水平的RNA修饰。因此,在优选的实施例中,使用较高纯度的脂质试剂,其导致RNA修饰低于可接受的水平。
实例28:用于在体内将CAR整合到T细胞中的Gene Writer
该实例描述了体内Gene WriterTM基因组编辑系统递送的T细胞,用于整合和稳定表达遗传有效负载。特别地,靶向的纳米颗粒用于递送Gene Writing系统,该系统能够将嵌合抗原受体(CAR)表达盒整合到T细胞基因组中以在鼠模型中产生CAR-T细胞。
在该实例中,Gene Writing系统包含编码Gene Writing多肽(例如本文所述的重组酶)的mRNA,和包含重组酶识别位点和转基因盒的插入DNA,其中该转基因盒包含由EF1a启动子驱动的CD19特异性m194-1BBz CAR的编码序列(Smith等人Nat Nanotechnol[自然纳米技术]12(8):813-820(2017))。为了实现向T细胞的特异性递送,产生携带针对CD4的缀合mAb的靶向LNP(tLNP)。参见,例如,Ramishetti等人ACS Nano[美国化学学会纳米]9(7):6706-6716(2015)。可替代地,针对CD3的mAb的缀合可用于靶向CD4+和CD8+T细胞(Smith等人Nat Nanotechnol[自然纳米技术]12(8):813-820(2017))。在其他实施例中,用于体内递送至T细胞的纳米颗粒是缺乏靶向配体的受约束的纳米颗粒,如Lokugamage等人Adv Mater[先进材料]31(41):e1902251(2019)所教导的。
tLNP可以通过首先制备核酸混合物(例如,多肽mRNA:模板DNA摩尔比为1:40)与脂质混合物(胆固醇、DSPC、PEG-DMG、Dlin-MC3-DMA和DSPE-PEG-马来酰亚胺),然后将所需的DTT还原的mAb(例如抗CD4,例如克隆YTS.177)化学缀合到LNP上的马来酰亚胺官能团上来制备。参见Ramishetti等人ACS Nano[美国化学学会纳米]9(7):6706-6716(2015)。
向6至8周龄C57BL6/J小鼠静脉内注射配制的LNP,剂量为1mg RNA/kg体重。在施用后第一天和第三天,将血液收集在肝素包被的收集管中,并使用Ficoll-Paque PLUS(通用电气医疗集团(GE Healthcare))通过密度离心分离白细胞。施用后五天,将动物安乐死,收获血液和器官(脾脏、淋巴结、骨髓细胞)用于T细胞分析。使用特异性免疫分选通过FACS检测抗CD19 CAR的表达。通过如本文所述的方法,例如分子梳或Q-FISH确认阳性细胞的整合。
实例29:通过分子梳表征整合位点。
已知AAV基因组在递送至细胞后经历多种分子内和分子间重组机制(McCarty等人Annu Rev Genet[遗传学年评]38:819-45(2004))。由于插入DNA可以经由AAV载体递送,有可能的是在此背景下,一些分子可以作为连环体存在,并且当用作Gene Writing的底物时,这些连环化的插入DNA分子可以导致多于一个拷贝的原始插入DNA的整合。因此,分析导致模板DNA的单个相对于连环化插入的整合事件的分数,每个整合位点的平均拷贝数和连环化分子的方向(例如,头对头或头对尾构象的频率)可能是有用的。本实例描述了在人细胞中AAV介导的Gene Writing系统递送后,使用分子梳技术来确定整合位点的构型。
Bxb1重组酶(表3A,行号204)是已用于将DNA整合到已被修饰以在基因组中含有合适的识别位点的人细胞中的酶,该酶在此用作本文披露的重组酶系统的代表性实例。在该实例中,通过用含有BXB1 attP-attP*位点的慢病毒载体进行单拷贝感染产生HEK293T着陆垫细胞系。为了进行重组酶介导的整合,首先将单拷贝着陆垫细胞以约40,000个细胞/孔接种在48孔板中。在接种后约24小时,在存在或不存在包含Bxb1整合酶编码序列的第二AAV的情况下,用包含插入DNA的AAV转导含有BXB1 attB*供体(与着陆垫中的attP*位点同源的识别位点)的腺相关病毒载体。转导后2周,收获约10%的AAV转导细胞,并使用对着陆垫位点具有特异性的ddPCR测定来分析gDNA以确认整合(%CNV/着陆垫)。用于分子梳的方法遵循Kaykov等人Sci Rep[科学报告]6:19636(2016)的方法,其通过引用以其全文并入本文。简言之,提取来自每个转导样品的约300,000个转导细胞的高分子量基因组DNA到琼脂糖塞中。然后,将基因组DNA分子以受控和一致的方式在玻璃表面上机械拉伸并对齐,使得能够沿DNA纤维的长度进行精确和直接的测量。使用预标记的DNA探针进行原位杂交,使得整合位点构型分析能够可视化。使用三种不同的颜色标记Bxb1 attP-attP*着陆垫(靶位点)、AAV Bxb1 attB*供体序列(插入DNA)和参考基因RPP30的探针,以区分来自每种探针的信号。杂交后,获得荧光信号并定量。通过这种方法,不同荧光信号相对于彼此的数量和位置提供了整合DNA内插入拷贝数和方向的视图。
实例30:反向PCR测定整合位点
该实例描述了Gene Writer系统的整合位点的表征。在一些实施例中,GeneWriter系统可以对单个靶位点或靶序列表现出高度的特异性。在其他实施例中,GeneWriter系统可以具有更松弛的特异性,并催化插入DNA在基因组的多个位置的整合。因此,对于任何给定的Gene Writer,确定其整合谱的宽度是有用的。
在该实例中,使用Gene Writing系统修饰HEK293T细胞的基因组,如任何前述实例中所述。转染后,将HEK293T细胞培养至少4天,然后测定位点特异性基因组编辑。首先用产生不相容粘性末端并在插入DNA中切割至少一次的成对的限制性酶消化基因组DNA,然后自连接以产生理想地包含插入DNA和侧翼基因组DNA的环状DNA。如Olivares等人NatBiotechnol[自然生物技术]20:1124-1128(2002)中所述(其方法通过引用以其全文并入本文)使用对插入DNA特异的正向和反向引物进行反向PCR扩增,其将导致相邻基因组DNA的扩增。然后使用下一代测序技术在MiSeq仪器上对扩增的PCR产物进行测序。对于序列分析,将MiSeq读数映射到HEK293T基因组以鉴定整合位置。在一些实施例中,本文所述的GeneWriter系统导致在单个位点的可检测整合。在一些实施例中,本文所述的Gene Writer系统导致在有限数目的位点,例如少于100、90、80、70、60、50、45、40、35、30、25、20、15、10、9、8、7、6、5、4、3或少于2个位点的可检测整合。在其他实施例中,本文所述的Gene Writer系统导致在超过100个位点的可检测整合。

Claims (10)

1.一种用于修饰DNA的系统,该系统包含:
a)重组酶多肽,该重组酶多肽包含表3A、3B、或3C的氨基酸序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的氨基酸序列,或编码该重组酶多肽的核酸;以及
b)双链插入DNA,该双链插入DNA包含:
(i)与(a)的重组酶多肽结合的DNA识别序列,
所述DNA识别序列具有第一副回文序列和第二副回文序列,其中每个副回文序列为约15-35或20-30个核苷酸,并且该第一和第二副回文序列一起构成出现在如下核苷酸序列内的副回文区,该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与所述副回文区具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于所述副回文区具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入、或缺失)的核苷酸序列,并且
所述DNA识别序列进一步包含约2-20个核苷酸的核心序列,其中该核心序列位于该第一和第二副回文序列之间,以及
(ii)异源对象序列。
2.一种真核细胞(例如,哺乳动物细胞,例如,人细胞),其包含:重组酶多肽,该重组酶多肽包含表3A、3B、或3C的氨基酸序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的氨基酸序列,或编码该重组酶多肽的核酸。
3.一种真核细胞(例如,哺乳动物细胞,例如,人细胞),其包含:
(i)DNA识别序列,所述DNA识别序列包含第一副回文序列和第二副回文序列,
其中每个副回文序列为约15-35或20-30个核苷酸,并且该第一和第二副回文序列一起构成出现在如下核苷酸序列内的副回文区,该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与所述副回文区具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于所述副回文区具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入、或缺失)的核苷酸序列,
其中所述DNA识别序列进一步包含约2-20个核苷酸的核心序列,其中该核心序列位于该第一和第二副回文序列之间;以及
(ii)异源对象序列。
4.一种修饰真核细胞(例如,哺乳动物细胞,例如,人细胞)的基因组的方法,该方法包括使该细胞与以下接触:
a)重组酶多肽,该重组酶多肽包含表3A、3B、或3C的氨基酸序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的序列,或编码该重组酶多肽的核酸;以及
b)插入DNA,该插入DNA包含:
(i)与(a)的重组酶多肽结合的DNA识别序列,所述DNA识别序列具有第一副回文序列和第二副回文序列,其中每个副回文序列为约15-35或20-30个核苷酸,并且该第一和第二副回文序列一起构成出现在如下核苷酸序列内的副回文区,该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与所述副回文区具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于所述副回文区具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入、或缺失)的核苷酸序列,
其中所述DNA识别序列进一步包含约2-20个核苷酸的核心序列,其中该核心序列位于该第一和第二副回文序列之间,以及
(ii)异源对象序列,
从而对该真核细胞的基因组进行修饰。
5.一种将异源对象序列插入真核细胞(例如,哺乳动物细胞,例如,人细胞)的基因组的方法,该方法包括使该细胞与以下接触:
a)重组酶多肽,该重组酶多肽包含表3A、3B、或3C的氨基酸序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的序列,或编码该多肽的核酸;以及
b)插入DNA,该插入DNA包含:
(i)与(a)的重组酶多肽结合的DNA识别序列,所述DNA识别序列具有第一副回文序列和第二副回文序列,其中每个副回文序列为约15-35或20-30个核苷酸,并且该第一和第二副回文序列一起构成出现在如下核苷酸序列内的副回文区,该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与所述副回文区具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于所述副回文区具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入、或缺失)的核苷酸序列,并且
其中所述DNA识别序列进一步包含约2-20个核苷酸的核心序列,其中该核心序列位于该第一和第二副回文序列之间,以及
(ii)异源对象序列,
从而例如以,例如在实例5的测定中所测量的该真核细胞群体的至少约0.1%(例如,至少约0.1%、0.5%、1%、5%、10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、或100%)的频率将该异源对象序列插入该真核细胞的基因组。
6.一种分离的重组酶多肽,该分离的重组酶多肽包含表3A、3B或3C的氨基酸序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的序列。
7.一种分离的核酸,该分离的核酸编码如下重组酶多肽,该重组酶多肽包含表3A、3B或3C的氨基酸序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的氨基酸序列。
8.一种分离的核酸(例如,DNA),该分离的核酸包含:
(i)DNA识别序列,所述DNA识别序列具有第一副回文序列和第二副回文序列,其中每个副回文序列为约15-35或20-30个核苷酸,并且该第一和第二副回文序列一起构成出现在如下核苷酸序列内的副回文区,该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与所述副回文区具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于所述副回文区具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入、或缺失)的核苷酸序列,并且
所述DNA识别序列进一步包含约2-20个核苷酸的核心序列,其中该核心序列位于该第一和第二副回文序列之间,以及
(ii)异源对象序列。
9.一种制备重组酶多肽的方法,该方法包括:
a)提供核酸,该核酸编码如下重组酶多肽,该重组酶多肽包含表3A、3B或3C的氨基酸序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的序列,以及
b)在允许该重组酶多肽产生的条件下将该核酸引入真核细胞,
从而制备该重组酶多肽。
10.一种制备包含DNA识别序列和异源序列的插入DNA的方法,该方法包括:
a)提供核酸,该核酸包含:
(i)与如下重组酶多肽结合的DNA识别序列,该重组酶多肽包含表3A、3B或3C的氨基酸序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的序列,
所述DNA识别序列具有第一副回文序列和第二副回文序列,其中每个副回文序列为约15-35或20-30个核苷酸,并且该第一和第二副回文序列一起构成出现在如下核苷酸序列内的副回文区,该核苷酸序列为表2A、2B或2C的左区列或右区列中的核苷酸序列,或与所述副回文区具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列,或相对于所述副回文区具有不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个序列改变(例如,取代、插入、或缺失)的核苷酸序列,并且
所述DNA识别序列进一步包含约2-20个核苷酸的核心序列,其中该核心序列位于该第一和第二副回文序列之间,以及
(ii)异源对象序列,以及
b)在允许该核酸复制的条件下将该核酸引入细胞(例如,真核细胞或原核细胞,例如,如本文所述),
从而制备该插入DNA。
CN202080094315.0A 2019-11-22 2020-11-22 重组酶组合物和使用方法 Pending CN115397984A (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201962939525P 2019-11-22 2019-11-22
US62/939,525 2019-11-22
US202063039309P 2020-06-15 2020-06-15
US63/039,309 2020-06-15
US202063068402P 2020-08-21 2020-08-21
US63/068,402 2020-08-21
PCT/US2020/061705 WO2021102390A1 (en) 2019-11-22 2020-11-22 Recombinase compositions and methods of use

Publications (1)

Publication Number Publication Date
CN115397984A true CN115397984A (zh) 2022-11-25

Family

ID=75980912

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080094315.0A Pending CN115397984A (zh) 2019-11-22 2020-11-22 重组酶组合物和使用方法

Country Status (6)

Country Link
US (1) US20230131847A1 (zh)
EP (1) EP4061940A1 (zh)
JP (1) JP2023502473A (zh)
CN (1) CN115397984A (zh)
CA (1) CA3162499A1 (zh)
WO (1) WO2021102390A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116234917A (zh) 2020-07-27 2023-06-06 安杰瑞姆生物科学公司 Dna分子组合物及其制备方法和使用方法
AU2022366969A1 (en) * 2021-10-14 2024-05-09 Asimov Inc. Integrases, landing pad architectures, and engineered cells comprising the same
WO2023114992A1 (en) * 2021-12-17 2023-06-22 Massachusetts Institute Of Technology Programmable insertion approaches via reverse transcriptase recruitment

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2850668B1 (fr) * 2003-01-31 2005-04-08 Centre Nat Rech Scient Elements genetiques mobiles appartenant a la famille mariner chez les eucaryotes hydrothermaux
WO2008100424A2 (en) * 2007-02-09 2008-08-21 University Of Hawaii Animals and cells with genomic target sites for transposase-mediated transgenesis
EP2527448A1 (en) * 2011-05-23 2012-11-28 Novozymes A/S Simultaneous site-specific integrations of multiple gene-copies in filamentous fungi
CA3147875A1 (en) * 2019-07-19 2021-01-28 Flagship Pioneering Innovations Vi, Llc Recombinase compositions and methods of use

Also Published As

Publication number Publication date
EP4061940A1 (en) 2022-09-28
WO2021102390A8 (en) 2022-06-16
JP2023502473A (ja) 2023-01-24
WO2021102390A1 (en) 2021-05-27
CA3162499A1 (en) 2021-05-27
US20230131847A1 (en) 2023-04-27

Similar Documents

Publication Publication Date Title
US11111506B2 (en) Compositions and methods of engineered CRISPR-Cas9 systems using split-nexus Cas9-associated polynucleotides
US20230235358A1 (en) Host defense suppressing methods and compositions for modulating a genome
CN116209756A (zh) 调控基因组的方法和组合物
CN116209770A (zh) 用于调控基因组的改善的方法和组合物
JP2023516692A (ja) ゲノムを調節するための方法及び組成物
CN115397984A (zh) 重组酶组合物和使用方法
CN114423869A (zh) 重组酶组合物和使用方法
EP4305165A1 (en) Lentivirus with altered integrase activity
EP4347859A1 (en) Integrase compositions and methods
WO2023039407A2 (en) Methods and compositions for modulating a genome
CN116490610A (zh) 调控基因组的方法和组合物

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination