CN114616002A - 使用由脂质纳米颗粒递送的crispr/cas系统在动物中进行的转录调控 - Google Patents

使用由脂质纳米颗粒递送的crispr/cas系统在动物中进行的转录调控 Download PDF

Info

Publication number
CN114616002A
CN114616002A CN202080075542.9A CN202080075542A CN114616002A CN 114616002 A CN114616002 A CN 114616002A CN 202080075542 A CN202080075542 A CN 202080075542A CN 114616002 A CN114616002 A CN 114616002A
Authority
CN
China
Prior art keywords
protein
sequence
lipid nanoparticle
chimeric
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080075542.9A
Other languages
English (en)
Inventor
查琳·亨特
苏珊娜·哈特福德
国春·龚
布莱恩·扎姆布罗维兹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Regeneron Pharmaceuticals Inc
Original Assignee
Regeneron Pharmaceuticals Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Regeneron Pharmaceuticals Inc filed Critical Regeneron Pharmaceuticals Inc
Publication of CN114616002A publication Critical patent/CN114616002A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0083Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the administration regime
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/88Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation using microencapsulation, e.g. using amphiphile liposome vesicle
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/69Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the conjugate being characterised by physical or galenical forms, e.g. emulsion, particle, inclusion complex, stent or kit
    • A61K47/6921Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the conjugate being characterised by physical or galenical forms, e.g. emulsion, particle, inclusion complex, stent or kit the form being a particulate, a powder, an adsorbate, a bead or a sphere
    • A61K47/6927Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the conjugate being characterised by physical or galenical forms, e.g. emulsion, particle, inclusion complex, stent or kit the form being a particulate, a powder, an adsorbate, a bead or a sphere the form being a solid microparticle having no hollow or gas-filled cores
    • A61K47/6929Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the conjugate being characterised by physical or galenical forms, e.g. emulsion, particle, inclusion complex, stent or kit the form being a particulate, a powder, an adsorbate, a bead or a sphere the form being a solid microparticle having no hollow or gas-filled cores the form being a nanoparticle, e.g. an immuno-nanoparticle
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0008Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0008Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
    • A61K48/0025Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the non-active part clearly interacts with the delivered nucleic acid
    • A61K48/0041Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the non-active part clearly interacts with the delivered nucleic acid the non-active part being polymeric
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/0012Galenical forms characterised by the site of application
    • A61K9/0019Injectable compositions; Intramuscular, intravenous, arterial, subcutaneous administration; Compositions to be administered through the skin in an invasive manner
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/48Preparations in capsules, e.g. of gelatin, of chocolate
    • A61K9/50Microcapsules having a gas, liquid or semi-solid filling; Solid microparticles or pellets surrounded by a distinct coating layer, e.g. coated microspheres, coated drug crystals
    • A61K9/51Nanocapsules; Nanoparticles
    • A61K9/5107Excipients; Inactive ingredients
    • A61K9/5123Organic compounds, e.g. fats, sugars
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/48Preparations in capsules, e.g. of gelatin, of chocolate
    • A61K9/50Microcapsules having a gas, liquid or semi-solid filling; Solid microparticles or pellets surrounded by a distinct coating layer, e.g. coated microspheres, coated drug crystals
    • A61K9/51Nanocapsules; Nanoparticles
    • A61K9/5107Excipients; Inactive ingredients
    • A61K9/513Organic macromolecular compounds; Dendrimers
    • A61K9/5146Organic macromolecular compounds; Dendrimers obtained otherwise than by reactions only involving carbon-to-carbon unsaturated bonds, e.g. polyethylene glycol, polyamines, polyanhydrides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/31Chemical structure of the backbone
    • C12N2310/313Phosphorodithioates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/31Chemical structure of the backbone
    • C12N2310/315Phosphorothioates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/32Chemical structure of the sugar
    • C12N2310/3212'-O-R Modification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/34Spatial arrangement of the modifications
    • C12N2310/344Position-specific modifications, e.g. on every purine, at the 3'-end
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Biochemistry (AREA)
  • Epidemiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Nanotechnology (AREA)
  • Immunology (AREA)
  • Optics & Photonics (AREA)
  • Dermatology (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicinal Preparation (AREA)

Abstract

提供了在同一脂质纳米颗粒中一起包含CRISPR/Cas协同激活介体系统组分的脂质纳米颗粒,以及使用此类脂质纳米颗粒来增加体内和离体靶基因表达和评估CRISPR/Cas协同激活介体系统增加体内和离体靶基因表达的能力的方法。

Description

使用由脂质纳米颗粒递送的CRISPR/CAS系统在动物中进行的 转录调控
相关申请的交叉引用
本申请要求于2019年9月13日提交的美国申请第62/900,080号和于2020年6月23日提交的美国申请第63/042,762号的权益,这些美国申请中的每一个以全文引用的方式并入本文用于所有目的。
通过EFS WEB作为文本文件提交的序列表的引用
写入文件693746SEQLIST.txt中的序列表为122千字节,创建于2020年9月11日,并且特此通过引用并入。
背景技术
基因表达在许多生物过程(如发育和疾病)中受到严格控制。转录因子通过与靶基因的增强子和启动子区域处的特定DNA序列结合来调控基因表达,并通过它们的效应子域调节转录。基于相同的原理,已经通过将各种功能域与DNA结合域融合而生成人工转录因子(ATF),该DNA结合域被设计为与感兴趣的基因结合,从而调节它们的表达。然而,这些ATF的结合特异性通常是退化的并且难以预测,并且ATF的复杂和耗时的设计和生成限制了它们的应用。
基于CRISPR/Cas的激活是功能基因探询的强大工具,但递送困难限制了其在体内的应用。体内的一个限制是需要同时将所有组分引入活生物体中,使得所有组分到达同一细胞并诱导靶基因转录的稳健和持续增加。需要更好的方法和工具来在体内引入CRISPR/Cas试剂。
发明内容
提供了在同一脂质纳米颗粒中一起包含CRISPR/Cas协同激活介体系统组分的脂质纳米颗粒,以及使用此类脂质纳米颗粒来增加真核基因组、细胞和生物体中体内和离体靶基因表达和评估CRISPR/Cas协同激活介体系统增加真核基因组、细胞和生物体中体内和离体靶基因表达的能力的方法。
在一个方面,提供了用于将负荷物递送至靶基因以增加靶基因在动物或细胞中的表达的脂质纳米颗粒(LNP)。在一些此类LNP中,该负荷物包含:(a)编码嵌合规律间隔成簇短回文重复序列(CRISPR)相关联(Cas)蛋白的核酸,该蛋白包含与一个或多个转录激活域融合的无核酸酶活性的Cas蛋白;(b)编码嵌合衔接蛋白的核酸,该嵌合衔接蛋白包含与一个或多个转录激活域融合的衔接蛋白;以及(c)一个或多个向导RNA或编码该一个或多个向导RNA的一个或多个核酸,每个向导RNA包含嵌合衔接蛋白可特异性结合的一个或多个衔接结合元件,并且其中一个或多个向导RNA中的每一个能够与Cas蛋白形成复合物并将其导向至靶基因内的靶序列,从而增加靶基因的表达。
在一些此类LNP中,多顺反子或双顺反子核酸包含(a)和(b)。任选地,(a)和(b)通过多顺反子或双顺反子核酸中的2A蛋白编码序列链接。在一些此类LNP中,(a)和(b)是单独的核酸。在一些此类LNP中,(a)和(b)各自均为信使RNA(mRNA)的形式。任选地,mRNA被修饰为被假尿苷完全取代。任选地,mRNA是包含(a)和(b)的多顺反子或双顺反子核酸,其中该mRNA包含SEQ ID NO:61所示的序列或包含与SEQ ID NO:61所示序列至少90%、95%、96%、97%、98%、99%或100%相同的序列(并且任选地编码与SEQ ID NO:61相同的蛋白)。在一些此类LNP中,(c)为RNA的形式。任选地,一个或多个向导RNA中的每一个被修饰以在5'末端和/或3'末端包含一个或多个稳定末端修饰。任选地,一个或多个向导RNA中的每一个的5'末端和/或3'末端被修饰以包含一个或多个硫代磷酸酯键。任选地,一个或多个向导RNA中的每一个的5'末端和/或3'末端被修饰以包含一个或多个2'-O-甲基修饰。
在一些此类LNP中,靶序列包含靶基因内的调控序列。任选地,调控序列包含启动子或增强子。在一些此类LNP中,靶序列在靶基因的转录起始位点的200个碱基对内。任选地,靶序列在转录起始位点上游200个碱基对和转录起始位点下游1个碱基对的区域内。
在一些此类LNP中,一个或多个向导RNA中的每一个均包含嵌合衔接蛋白可以特异性结合的两个衔接结合元件。任选地,第一衔接结合元件处于所述一个或多个向导RNA中的每个向导RNA的第一环内,并且第二衔接结合元件处于所述一个或多个向导RNA中的每个向导RNA的第二环内。任选地,一个或多个向导RNA中的每一个是包含与反式激活CRISPR RNA(tracrRNA)部分融合的CRISPR RNA(crRNA)部分的单个向导RNA,并且第一环是对应于SEQID NO:12、14、52或53的残基13至16的四环,并且第二环是对应于SEQ ID NO:12、14、52或53的残基53至56的茎环2。
在一些此类LNP中,衔接结合元件包含SEQ ID NO:16所示的序列。任选地,一个或多个向导RNA中的每一个包含SEQ ID NO:40、45、56或57所示的序列。
在一些此类LNP中,一个或多个向导RNA中的至少一个靶向Ttr基因,任选地,其中靶向Ttr的向导RNA靶向包含SEQ ID NO:34至36中任一个所示的序列的序列,或者任选地,其中靶向Ttr的向导RNA包含SEQ ID NO:37至39和55中任一个所示的序列。
在一些此类LNP中,一个或多个向导RNA靶向两个或更多个靶基因。在一些此类LNP中,一个或多个向导RNA包含靶向单个靶基因的多个向导RNA。在一些此类LNP中,一个或多个向导RNA包含靶向单个靶基因的至少三个向导RNA。任选地,该至少三个向导RNA靶向小鼠Ttr基因座,并且其中第一向导RNA靶向包含SEQ ID NO:34的序列或者包含SEQ ID NO:37所示的序列,第二向导RNA靶向包含序列SEQ ID NO:35的序列或者包含SEQ ID NO:38所示的序列,并且第三向导RNA靶向包含SEQ ID NO:36的序列或者包含SEQ ID NO:39或55所示的序列。
在一些此类LNP中,Cas蛋白是Cas9蛋白。任选地,Cas9蛋白为酿脓链球菌Cas9蛋白、空肠弯曲杆菌Cas9蛋白或金黄色葡萄球菌Cas9蛋白。任选地,当与酿脓链球菌Cas9蛋白最佳比对时,Cas9蛋白包含对应于D10A和N863A或D10A和H840A的突变。
在一些此类LNP中,编码Cas蛋白的序列经过密码子优化以在动物或细胞中表达。
在一些此类LNP中,嵌合Cas蛋白中的一个或多个转录激活子域选自:VP16、VP64、p65、MyoD1、HSF1、RTA、SET7/9及其组合。任选地,嵌合Cas蛋白中的一个或多个转录激活子域包含VP64。任选地,嵌合Cas蛋白从N端到C端包含:无催化活性的Cas蛋白;核定位信号;以及VP64转录激活子域。任选地,嵌合Cas蛋白包含与SEQ ID NO:1所示的序列至少90%、95%、96%、97%、98%、99%或100%相同的序列。任选地,编码嵌合Cas蛋白的核酸包含与SEQ ID NO:25所示的序列至少90%、95%、96%、97%、98%、99%或100%相同的序列。
在一些此类LNP中,衔接蛋白位于嵌合衔接蛋白的N末端,并且一个或多个转录激活域位于嵌合衔接蛋白的C末端。在一些此类LNP中,衔接蛋白包含MS2外壳蛋白或其功能片段或变体。在一些此类LNP中,嵌合衔接蛋白中的一个或多个转录激活域选自:VP16、VP64、p65、MyoD1、HSF1、RTA、SET7/9及其组合。任选地,嵌合衔接蛋白中的一个或多个转录激活域包含p65和HSF1。任选地,嵌合衔接蛋白从N端到C端包含:MS2外壳蛋白;核定位信号;p65转录激活域;以及HSF1转录激活域。任选地,嵌合衔接蛋白包含与SEQ ID NO:6所示的序列至少90%、95%、96%、97%、98%、99%或100%相同的序列。任选地,编码嵌合衔接蛋白的核酸包含与SEQ ID NO:27所示的序列至少90%、95%、96%、97%、98%、99%或100%相同的序列。
在一些此类LNP中,动物是非人动物。在一些此类LNP中,动物是哺乳动物。任选地,所述哺乳动物是啮齿动物。任选地,该啮齿动物是大鼠或小鼠。任选地,该啮齿动物是小鼠。在一些此类LNP中,动物是人。在一些此类LNP中,靶基因是在肝脏中表达的基因。
在一些此类LNP中,靶基因是疾病相关联基因。在一些此类LNP中,靶基因的表达或活性降低与疾病、病症或综合征相关联或者成为疾病、病症或综合征的病因。在一些此类LNP中,靶基因是单倍体不足基因或者是OTC、HBG1或HBG2。任选地,单倍体不足基因是KCNQ4、PINK1、TP73、GLUT1、MYH、ABCA4、LRH-1、PAX8、SLC40A1、BMPR2、PKD2、PIK3R1、HMGA1、GCK、ELN、GTF3、GATA3、BUB3、PAX6、FLI1、HNF1A、PKD1、MC4R、DMPK或MYH9。任选地,该单倍体不足基因为表2或表3中的任一种基因。在一些此类LNP中,靶基因的表达或活性增加与疾病、病症或综合征相关联或者成为疾病、病症或综合征的病因。
一些此类LNP包含阳离子脂质、中性脂质、辅助脂质和隐形脂质。任选地,阳离子脂质是MC3和/或中性脂质是DSPC和/或辅助脂质是胆固醇和/或隐形脂质是PEG-DMG。任选地,LNP包含摩尔比为约50:10:38.5:1.5的MC3、DSPC、胆固醇和PEG-DMG。
在另一方面,提供了用于在动物体内或在离体或在体动物细胞中增加靶基因的表达的方法。同样地,提供了用于在体外在动物细胞中增加靶基因的表达的方法。一些此类方法包含向动物或细胞中引入:(a)编码嵌合规律间隔成簇短回文重复序列(CRISPR)相关联(Cas)蛋白的核酸,该蛋白包含与一个或多个转录激活域融合的无核酸酶活性的Cas蛋白;(b)编码嵌合衔接蛋白的核酸,该嵌合衔接蛋白包含与一个或多个转录激活域融合的衔接蛋白;以及(c)一个或多个向导RNA或编码该一个或多个向导RNA的一个或多个核酸,每个向导RNA包含嵌合衔接蛋白可特异性结合的一个或多个衔接结合元件,并且其中一个或多个向导RNA中的每一个能够与Cas蛋白形成复合物并将其导向至靶基因内的靶序列,从而增加靶基因的表达,其中(a)、(b)和(c)一起在同一脂质纳米颗粒(LNP)中递送。
在一些此类方法中,多顺反子或双顺反子核酸包含(a)和(b)。任选地,(a)和(b)通过多顺反子或双顺反子核酸中的2A蛋白编码序列链接。在一些此类方法中,(a)和(b)是单独的核酸。在一些此类方法中,(a)和(b)各自均以信使RNA(mRNA)的形式引入。任选地,mRNA被修饰为被假尿苷完全取代。任选地,mRNA是包含(a)和(b)的多顺反子或双顺反子核酸,其中该mRNA包含SEQ ID NO:61所示的序列或包含与SEQ ID NO:61所示序列至少90%、95%、96%、97%、98%、99%或100%相同的序列(并且任选地编码与SEQ ID NO:61相同的蛋白)。在一些此类方法中,(c)以RNA的形式引入。任选地,一个或多个向导RNA中的每一个被修饰以在5'末端和/或3'末端包含一个或多个稳定末端修饰。任选地,一个或多个向导RNA中的每一个的5'末端和/或3'末端被修饰以包含一个或多个硫代磷酸酯键。任选地,一个或多个向导RNA中的每一个的5'末端和/或3'末端被修饰以包含一个或多个2'-O-甲基修饰。
在一些此类方法中,靶序列包含靶基因内的调控序列。任选地,调控序列包含启动子或增强子。在一些此类方法中,靶序列在靶基因的转录起始位点的200个碱基对内。任选地,靶序列在转录起始位点上游200个碱基对和转录起始位点下游1个碱基对的区域内。
在一些此类方法中,一个或多个向导RNA中的每一个均包含嵌合衔接蛋白可以特异性结合的两个衔接结合元件。任选地,第一衔接结合元件处于所述一个或多个向导RNA中的每个向导RNA的第一环内,并且第二衔接结合元件处于所述一个或多个向导RNA中的每个向导RNA的第二环内。任选地,一个或多个向导RNA中的每一个是包含与反式激活CRISPRRNA(tracrRNA)部分融合的CRISPR RNA(crRNA)部分的单个向导RNA,并且第一环是对应于SEQ ID NO:12、14、52或53的残基13至16的四环,并且第二环是对应于SEQ ID NO:12、14、52或53的残基53至56的茎环2。
在一些此类方法中,衔接结合元件包含SEQ ID NO:16所示的序列。任选地,一个或多个向导RNA中的每一个包含SEQ ID NO:40、45、56或57所示的序列。
在一些此类方法中,一个或多个向导RNA中的至少一个靶向Ttr基因,任选地,其中靶向Ttr的向导RNA靶向包含SEQ ID NO:34至36中任一个所示的序列的序列,或者任选地,其中靶向Ttr的向导RNA包含SEQ ID NO:37至39和55中任一个所示的序列。
在一些此类方法中,一个或多个向导RNA靶向两个或更多个靶基因。在一些此类方法中,一个或多个向导RNA包含靶向单个靶基因的多个向导RNA。在一些此类方法中,一个或多个向导RNA包含靶向单个靶基因的至少三个向导RNA。任选地,该至少三个向导RNA靶向小鼠Ttr基因座,并且其中第一向导RNA靶向包含SEQ ID NO:34的序列或者包含SEQ ID NO:37所示的序列,第二向导RNA靶向包含序列SEQ ID NO:35的序列或者包含SEQ ID NO:38所示的序列,并且第三向导RNA靶向包含SEQ ID NO:36的序列或者包含SEQ ID NO:39或55所示的序列。
在一些此类方法中,所述Cas蛋白是Cas9蛋白。任选地,Cas9蛋白为酿脓链球菌Cas9蛋白、空肠弯曲杆菌Cas9蛋白或金黄色葡萄球菌Cas9蛋白。任选地,当与酿脓链球菌Cas9蛋白最佳比对时,Cas9蛋白包含对应于D10A和N863A或D10A和H840A的突变。
在一些此类方法中,编码Cas蛋白的序列经过密码子优化以在动物中表达。
在一些此类方法中,嵌合Cas蛋白中的一个或多个转录激活子域选自:VP16、VP64、p65、MyoD1、HSF1、RTA、SET7/9及其组合。任选地,嵌合Cas蛋白中的一个或多个转录激活子域包含VP64。任选地,嵌合Cas蛋白从N端到C端包含:无催化活性的Cas蛋白;核定位信号;以及VP64转录激活子域。任选地,嵌合Cas蛋白包含与SEQ ID NO:1所示的序列至少90%、95%、96%、97%、98%、99%或100%相同的序列。任选地,编码嵌合Cas蛋白的核酸包含与SEQ ID NO:25所示的序列至少90%、95%、96%、97%、98%、99%或100%相同的序列。
在一些此类方法中,衔接蛋白位于嵌合衔接蛋白的N末端,并且一个或多个转录激活域位于嵌合衔接蛋白的C末端。在一些此类方法中,衔接蛋白包含MS2外壳蛋白或其功能片段或变体。在一些此类方法中,嵌合衔接蛋白中的一个或多个转录激活域选自:VP16、VP64、p65、MyoD1、HSF1、RTA、SET7/9及其组合。任选地,嵌合衔接蛋白中的一个或多个转录激活域包含p65和HSF1。任选地,嵌合衔接蛋白从N端到C端包含:MS2外壳蛋白;核定位信号;p65转录激活域;以及HSF1转录激活域。任选地,嵌合衔接蛋白包含与SEQ ID NO:6所示的序列至少90%、95%、96%、97%、98%、99%或100%相同的序列。任选地,编码嵌合衔接蛋白的核酸包含与SEQ ID NO:27所示的序列至少90%、95%、96%、97%、98%、99%或100%相同的序列。
在一些此类方法中,动物是非人动物。在一些此类方法中,动物是哺乳动物。任选地,所述哺乳动物是啮齿动物。任选地,该啮齿动物是大鼠或小鼠。任选地,该啮齿动物是小鼠。在一些此类方法中,动物是人。在一些此类方法中,动物是需要增加靶基因表达的对象,其中靶基因在对象中低表达,并且该低表达与对象中的疾病、病症或综合征相关联或者成为疾病、病症或综合征的病因。在一些此类方法中,靶基因是在肝脏中表达的基因。在一些此类方法中,将一个或多个向导RNA施用于动物的途径是静脉内注射、实质内注射、腹膜内注射、经鼻安装或玻璃体内注射。
在一些此类方法中,靶基因是疾病相关联基因。在一些此类方法中,靶基因的表达或活性降低与疾病、病症或综合征相关联或者成为疾病、病症或综合征的病因。在一些此类方法中,靶基因是单倍体不足基因或者是OTC、HBG1或HBG2。任选地,单倍体不足基因是KCNQ4、PINK1、TP73、GLUT1、MYH、ABCA4、LRH-1、PAX8、SLC40A1、BMPR2、PKD2、PIK3R1、HMGA1、GCK、ELN、GTF3、GATA3、BUB3、PAX6、FLI1、HNF1A、PKD1、MC4R、DMPK或MYH9。任选地,该单倍体不足基因为表2或表3中的任一种基因。在一些此类方法中,靶基因的表达或活性增加与疾病、病症或综合征相关联或者成为疾病、病症或综合征的病因。
在一些此类方法中,脂质纳米颗粒包含阳离子脂质、中性脂质、辅助脂质和隐形脂质。任选地,阳离子脂质是MC3和/或中性脂质是DSPC和/或辅助脂质是胆固醇和/或隐形脂质是PEG-DMG。任选地,脂质纳米颗粒包含摩尔比为约50:10:38.5:1.5的MC3、DSPC、胆固醇和PEG-DMG。
在一些此类方法中,靶基因的表达增加相对于对照动物或细胞高出至少0.5倍、1倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍或20倍。在一些此类方法中,靶基因表达增加的持续时间为至少约1天、至少约2天、至少约3天、至少约4天、至少约5天、至少约6天、至少约1周、至少约2周、至少约3周、至少约4周、至少约1个月或至少约2个月。
在一些此类方法中,将包含(a)、(b)和(c)的脂质纳米颗粒循序引入动物或细胞中两次或更多次。在一些此类方法中,将包含(a)、(b)和(c)的脂质纳米颗粒循序引入动物或细胞中三次或更多次。任选地,在每次循序引入脂质纳米颗粒后,靶基因的表达增加至至少相同的水平。任选地,与仅引入脂质纳米颗粒一次的方法相比,靶基因的表达增加至更高的水平。
附图说明
图1(未按比例)示出了Ttr向导RNA阵列的示意图。向导RNA阵列等位基因从5'到3'包含:第一U6启动子;第一向导RNA编码序列;第二U6启动子;第二向导RNA编码序列;第三U6启动子;和第三向导RNA编码序列。
图2(未按比例)示出了设计三个向导RNA的示意图,这些向导RNA靶向Ttr转录起始位点的上游。
图3示出了通用单个向导RNA(SEQ ID NO:45)的示意图,其中四环和茎环2已被MS2结合适体替换以促进融合到转录激活域的嵌合MS2外壳蛋白(MCP)的募集。
图4示出了通过ELISA测定的在未处理的dCas9 SAM小鼠、用AAV8-GFP处理的dCas9SAM小鼠,以及用包含Ttr向导RNA阵列的AAV8处理的dCas9 SAM小鼠中的TTR循环血清水平。示出了注射后5天、19天、2个月、3个月、4个月、5个月、6个月、7个月和8个月的结果。
图5A和5B示出了通过ELISA测定的在未处理的dCas9 SAM小鼠和用包含Ttr向导RNA的LNP(R-LNP 277)处理的dCas9 SAM小鼠中,TTR循环血清水平(图5A)和TTR循环血清水平相对于基线的百分比变化(图5B)。示出了注射后1、3、6、8、10、13、17、20、27、34和67天的结果。
图6示出了通过ELISA测定的在未处理的dCas9 SAM小鼠和用包含Ttr向导RNA的LNP(R-LNP 277)处理的dCas9 SAM小鼠中的TTR循环水平。示出了0.5mpk、1mpk和2mpk剂量在注射后1周、2周、3周、4周、5周、6周和7周的结果。所有值均绘制为平均值+/-SD。星号指示显著性,并且星号数指示小数点后0的数量(TTEST)。
图7A示出了在dCas9 SAM小鼠(R26SAM/SAM)中循序四周给药LNPTtrgA2时的TTR循环水平。用0.5mpk的合成Ttr gA2 SAM向导配制LNP颗粒,并在零周和/或四周时引入到纯合dCas9 SAM小鼠(R26SAM/SAM)(n=5)中。每周取血通过ELISA确定蛋白表达水平。所有值均绘制为平均值+/-SD。星号指示显著性,并且星号数指示小数点后0的数量(TTEST)。
图7B示出了在dCas9 SAM小鼠(R26SAM/SAM)中循序两周给药LNPTtrgA2时的TTR循环水平。用0.5mpk的合成Ttr gA2 SAM向导配制LNP颗粒,并在零周和/或两周时引入到纯合dCas9 SAM小鼠(R26SAM/SAM)(n=5)中。每周取血通过ELISA确定蛋白表达水平。所有值均绘制为平均值+/-SD。星号指示显著性,并且星号数指示小数点后0的数量(TTEST)。
图8示出了在dCas9 SAM小鼠(R26SAM/SAM)中循序零周、两周和四周给药LNPTtrgA2时的TTR循环水平。用0.5mpk的合成Ttr gA2 SAM向导配制LNP颗粒,并在零周、两周和四周或仅在零周时引入到纯合dCas9 SAM小鼠(R26SAM/SAM)(n=5)中。每周取血通过ELISA确定蛋白表达水平。所有值均绘制为平均值+/-SD。
图9示出了用合成Ttr SAM向导和SAM mRNA(经假尿苷修饰或未经修饰)配制的LNP颗粒向野生型小鼠给药后的TTR循环水平。使用未处理小鼠作为阴性对照。在指示的时间点取血通过ELISA确定蛋白表达水平。所有值均绘制为平均值+/-SEM。
定义
本文可互换使用的术语“蛋白质”、“多肽”、和“肽”包含任何长度的聚合形式的氨基酸,包含编码氨基酸和非编码氨基酸以及以化学方式或生物化学方式修饰的氨基酸或以化学方式或生物化学方式衍生的氨基酸。这些术语还包含已经修饰的聚合物,如具有经修饰的肽骨架的多肽。术语“结构域”是指具有特定功能或结构的蛋白质或多肽的任何部分。
蛋白被视为具有“N端”和“C端”。术语“N端”涉及蛋白或多肽的起点,其终止于具有游离胺基(-NH2)的氨基酸。术语“C端”是指氨基酸链(蛋白质或多肽)的末端,其终止于游离羧基(-COOH)。
本文可互换使用的术语“核酸”和“多核苷酸”包含任何长度的聚合形式的核苷酸,包含核糖核苷酸、脱氧核糖核苷酸、或其类似物或经过修饰的形式。所述核苷酸包含单链、双链和多链DNA或RNA、基因组DNA、cDNA、DNA-RNA杂交体、和包括嘌呤碱基、嘧啶碱基或其它天然的、以化学方式修饰的、以生物化学方式修饰的、非天然的或衍生的核苷酸碱基的聚合物。
核酸被视为具有“5'末端”和“3'末端”,因为以使得一个单核苷酸戊糖环的5'磷酸通过磷酸二酯键在一个方向上与其相邻的单核苷酸戊糖环的3'氧附着的方式使单核苷酸反应以形成寡核苷酸。如果寡核苷酸的5'磷酸不与单核苷酸戊糖环的3'氧相连,那么将寡核苷酸的端称为“5'末端”。如果寡核苷酸的3'氧不与另一个单核苷酸戊糖环的5'磷酸相连,那么将寡核苷酸的端称为“3'末端”。即使核酸序列处于更大的寡核苷酸的内部,所述核酸序列也可以被视为具有5'末端和3'末端。在线性或环状DNA分子中,离散元件被称为“下游”或3'元件的“上游”或5'。
术语“表达载体”或“表达构建体”或“表达盒”是指含有期望编码序列的重组核酸,所述期望编码序列可操作地连接到在特定宿主细胞或生物体中表达可操作地连接的编码序列所必需的适当核酸序列。在原核生物中表达所必需的核酸序列通常包含启动子、操纵子(任选的)和核糖体结合位点以及其它序列。众所周知,真核细胞利用启动子、增强子以及终止信号和多聚腺苷酸化信号,但是在不牺牲必要表达的情况下可以删除一些元素并添加其它元素。
术语“靶向载体”是指可以通过同源重组、非同源末端连接介导的连结或任何其它重组方式引入到细胞基因组中的靶位置的重组核酸。
关于蛋白、核酸和细胞的术语“分离的”包括相对于通常可以原位存在的其它细胞或生物体组分相对纯化的蛋白、核酸和细胞,直至并且包括蛋白、核酸或细胞的基本上纯的制备。术语“分离的”还包括不具有天然存在的对应物的蛋白和核酸,或者已经化学合成并且因此基本上未被其它蛋白或核酸污染的蛋白或核酸。术语“分离的”还包含已经从与蛋白质、核酸或细胞天然伴随的大多数其它细胞组分或生物体组分(例如,其它细胞蛋白、核酸或细胞或胞外组分)中分离或纯化的蛋白质、核酸或细胞。
术语“野生型”包含具有在正常(与突变、患病、改变等相比)状态或情况下发现的结构和/或活性的实体。野生型基因和多肽通常以多种不同形式(例如,等位基因)存在。
术语“内源序列”是指在细胞或真核生物体(例如,动物、非人动物、哺乳动物或非人哺乳动物)内天然存在的核酸序列。例如,非人动物的内源性Ttr序列是指天然存在于非人动物的Ttr基因座处的天然Ttr序列。
“外源性”分子或序列包含通常不以所述形式存在于细胞中的分子或序列。正常存在包含关于细胞的特定发育阶段和环境条件的存在。例如,外源性分子或序列可以包含细胞内对应的内源性序列的突变版本(如内源性序列的人源化版本),或者可以包含与细胞内的内源性序列相对应但形式不同(即,不在染色体内)的序列。相比之下,内源性分子或序列包含在特定环境条件下在特定发育阶段在特定细胞中通常以所述形式存在的分子或序列。
当在核酸或蛋白质的上下文中使用时,术语“异源的”指示核酸或蛋白质包括在同一分子中并非天然地一起出现的至少两个区段。例如,当关于核酸的段或蛋白质的区段使用时,术语“异源的”指示核酸或蛋白质包括在自然界中未发现彼此处于相同关系(例如,连接在一起)的两个或更多个子序列。举例来说,核酸载体的“异源”区域是在自然界中未发现与其它分子缔合的另一个核酸分子内或与其附着的核酸区段。例如,核酸载体的异源区域可以包含侧接有在自然界中未发现与编码序列缔合的序列的编码序列。同样地,蛋白质的“异源”区域是在自然界中未发现与其它肽分子缔合的另一个肽分子(例如,融合蛋白或具有标签的蛋白质)内或与其附着的氨基酸的区段。相似地,核酸或蛋白质可以包括异源标记或异源分泌或定位序列。
“密码子优化”利用密码子的简并性,如指定氨基酸的三碱基对密码子组合的多样性所展示的,并且通常包含通过用宿主细胞的基因中更频繁或最频繁使用的密码子置换天然序列的至少一个密码子同时维持天然氨基酸序列来修饰核酸序列以在特定宿主细胞中增强表达的过程。例如,与天然存在的核酸序列相比,可以修饰对Cas9蛋白进行编码的核酸以置换在给定的原核或真核细胞中具有更高使用频率的密码子,包含细菌细胞、酵母细胞、人细胞、非人细胞、哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞、仓鼠细胞或任何其它宿主细胞。密码子使用表很容易获得,例如,在“密码子使用数据库”中获得。这些表可以通过多种方式进行调整。参见Nakamura等人,(2000)《核酸研究(Nucleic AcidsResearch)》28(1):292,该文献以全文引用的方式并入本文用于所有目的。也可获得用于在特定宿主中表达的特定序列的密码子优化的计算机算法(参见例如,《基因伪造(GeneForge)》)。
术语“基因座”是指基因(或显著序列)、DNA序列、多肽编码序列或生物体的基因组的染色体上的位置的特异性定位。例如,“Ttr基因座”可以指Ttr基因、Ttr DNA序列、TTR编码序列或在生物体的基因组的染色体上的Ttr位置的特定位置,该Ttr位置已经被鉴别为此类序列存在的位置。“Ttr基因座”可以包含Ttr基因的调控元件,包括例如增强子、启动子、5'和/或3'非翻译区(UTR)或其组合。
术语“基因”是指染色体中的对产物(例如,RNA产物和/或多肽产物)进行编码并且包含被非编码内含子中断的编码区和定位于5'末端和3'末端两者上的编码区附近而使得基因与全长mRNA(包含5'和3'非翻译序列)相对应的序列的DNA序列。术语“基因”还包含其它非编码序列,包含调节序列(例如,启动子、增强子和转录因子结合位点)、聚腺苷酸化信号、内部核糖体进入位点、沉默子、绝缘序列和基质附着区域。这些序列可以靠近基因的编码区(例如,在10kb内)或处于远处的位点,并且所述序列影响基因的转录和翻译的水平或速率。
术语“等位基因”是指基因的变体形式。一些基因具有多种不同的形式,所述基因定位于染色体上的相同位置或基因位点处。二倍体生物体在每个基因座处具有两个等位基因。每对等位基因表示特异性基因座的基因型。如果在特定基因座处有两个相同的等位基因,则基因型被描述为纯合的,如果两个等位基因不同,则基因型被描述为杂合的。
“启动子”是DNA的调控区,其通常包括能够引导RNA聚合酶II在特定多核苷酸序列的适当转录起始位点处起始RNA合成的TATA盒。启动子可以另外包括影响转录起始速率的其它区域。本文所公开的启动子序列调节可操作连接的多核苷酸的转录。启动子可以在本文所公开的细胞类型(例如,真核细胞、非人哺乳动物细胞、人细胞、啮齿动物细胞、多能性细胞、单细胞期胚胎、分化细胞或其组合)中的一种或多种细胞类型中具有活性。启动子可以是例如组成型活性启动子、条件型启动子、诱导型启动子、时间受限启动子(例如,受发育调控的启动子)或空间受限启动子(例如,细胞特异性或组织特异性启动子)。启动子的实例可以例如在WO 2013/176772中找到,所述文献出于所有目的通过引用整体并入本文。
组成型启动子是在所有发育阶段的所有组织或特定组织中都具有活性的启动子。组成型启动子的实例包含人巨细胞病毒即刻早期(hCMV)启动子、小鼠巨细胞病毒即刻早期(mCMV)启动子、人延伸因子1α(hEF1α)启动子、小鼠延伸因子1α(mEF1α)启动子、小鼠磷酸甘油酸激酶(PGK)启动子、鸡β肌动蛋白杂合(CAG或CBh)启动子、SV40早期启动子和β2微管蛋白启动子。
诱导型启动子的实例包含例如化学调节启动子和物理调节启动子。化学调控启动子包括例如醇调控启动子(例如,醇脱氢酶(alcA)基因启动子)、四环素调控启动子(例如,四环素响应性启动子、四环素操纵子序列(tetO)、tet-On启动子或tet-Off启动子)、类固醇调控启动子(例如,大鼠糖皮质激素受体、雌激素受体启动子或蜕皮激素受体启动子)或金属调控启动子(例如,金属蛋白启动子)。物理调节启动子包含例如温度调节启动子(例如,热休克启动子)和光调节启动子(例如,光诱导型启动子或光抑制型启动子)。
组织特异性启动子可以是例如神经元特异性启动子、神经胶质特异性启动子、肌肉细胞特异性启动子、心脏细胞特异性启动子、肾细胞特异性启动子、骨细胞特异性启动子、内皮细胞特异性启动子或免疫细胞特异性启动子(例如,B细胞启动子或T细胞启动子)。
发育调节启动子包含例如仅在胚胎发育期或仅在成体细胞中具有活性的启动子。
“可操作的连接”或“可操作地连接”包含将两种或多种组分(例如启动子和另一种序列元件)并置使得两种组分正常发挥功能,并使得至少一种组分能够介导施加在至少一种其它组分上的功能。例如,如果启动子响应于存在或不存在一种或多种转录调控因子而控制编码序列的转录水平,则所述启动子可以与编码序列可操作地连接。可操作的连接可以包含这些彼此相邻或以反式作用的序列(例如,调控序列可以在一定距离处起作用以控制编码序列的转录)。
核酸的“互补性”意味着由于其核碱基团的取向,一条核酸链中的核苷酸序列与另一条相对核酸链上的序列形成氢键。DNA中的互补碱基通常是A与T和C与G。在RNA中,其通常是C与G和U与A。互补可以是完美的或者实质性的/足够的。两个核酸之间的完美互补意味着所述两个核酸可以形成双链体,其中双链体中的每个碱基都通过沃森-克里克配对(Watson-Crick pairing)与互补碱基键合。“基本上”或“足够”互补意味着一条链中的序列与相对链中的序列不完全和/或完全互补,但两条链上的碱基之间发生足够的键合以在一组杂交条件下形成稳定的杂合复合物(例如,盐浓度和温度)。此类条件可以通过使用序列和标准数学计算来预测杂交链的Tm(熔融温度),或通过使用常规方法的Tm经验测定来预测。Tm包含在两条核酸链之间形成的杂交复合物群变性50%(即,双链核酸分子群半解离成单链)时的温度。在低于Tm的温度下,有利于杂交复合物的形成,而在高于Tm的温度下,有利于杂交复合物中的链的熔融或分离。可以通过使用例如Tm=81.5+0.41(%G+C)来估计在1MNaCl水溶液中具有已知G+C含量的核酸的Tm,但是其它已知的Tm计算考虑了核酸结构特性。
“杂交条件”包含其中一条核酸链通过互补链相互作用和氢键与第二核酸链键合,以产生杂交复合物的累积环境。此类条件包含含有核酸的水性或有机溶液的化学组分和其浓度(例如,盐、螯合剂、甲酰胺)以及混合物的温度。如温育时间的长度或反应室尺寸等其它因素可能对环境产生影响。参见例如,Sambrook等人,《分子克隆:实验室手册(MolecularCloning,A Laboratory Manual)》,第2版,第1.90-1.91,9.47-9.51,11.47-11.57页(纽约冷泉港的冷泉港实验室出版社(Cold Spring Harbor Laboratory Press,Cold SpringHarbor,N.Y.),1989),该文献以全文引用的方式并入本文用于所有目的。
杂交要求两个核酸含有互补序列,但是碱基之间有可能错配。两个核酸之间杂交的适当条件取决于核酸的长度和互补程度,这些变量是众所周知的。两个核苷酸序列之间的互补程度越大,具有这些序列的核酸杂交体的解链温度(Tm)值就越大。对于具有较短互补段(例如,在35个或更少、30个或更少、25个或更少、22个或更少、20个或更少或18个或更少的核苷酸上互补)的核酸之间的杂交,错配位置变得尤为重要(参见Sambrook等人,同上,11.7-11.8)。通常,可杂交核酸的长度为至少约10个核苷酸。可杂交核酸的说明性最小长度包含至少约15个核苷酸、至少约20个核苷酸、至少约22个核苷酸、至少约25个核苷酸和至少约30个核苷酸。此外,可以根据如互补区的长度和互补程度等因素,根据需要调整温度和洗涤溶液盐浓度。
多核苷酸序列不必与其可特异性杂交的靶核酸具有100%互补性。此外,多核苷酸可以在一个或多个段上杂交,使得插入或相邻段不参与杂交事件(例如,环结构或发夹结构)。多核苷酸(例如,gRNA)可以包括与其靶向的靶核酸序列内的靶区域的至少70%、至少80%、至少90%、至少95%、至少99%或100%的序列互补性。例如,其中20个核苷酸中的18个与靶区域互补并因此特异性杂交的gRNA将表示90%的互补性。在此实施例中,剩余的非互补核苷酸可以与互补核苷酸成簇或散布并且不需要彼此相邻或与互补核苷酸相邻。
核酸内特定核酸序列段之间的互补性百分比可以通过以下方式常规地确定:使用BLAST程序(基本局部比对搜索工具)和PowerBLAST程序(Altschul等人(1990)《分子生物学杂志(J.Mol.Biol.)》215(3):403-410;Zhang和Madden(1997)《基因组研究(Genome Res.)》7(6):649-656)或使用Gap程序(威斯康星州麦迪逊大学研究园(University ResearchPark,Madison Wis.),遗传学计算机组,Unix第8版,威斯康星序列分析包),该程序使用默认设置,其使用史密斯-沃特曼(Smith and Waterman)(1981)算法《应用数学进展(Adv.Appl.Math.)》2(4):482-489。
本文所提供的方法和组合物采用多种不同的组分。贯穿说明书的一些组分可以具有活性变体和片段。此类组分包含例如Cas蛋白、CRISPR RNA、tracrRNA和向导RNA。这些组分中的每个组分的生物活性在本文其它地方描述。术语“功能性”是指蛋白质或核酸(或其片段或变体)表现出生物活性或功能的先天能力。此类生物活性或功能可以包含例如Cas蛋白结合向导RNA和靶DNA序列的能力。与原始分子相比,功能性片段或变体的生物学功能可以相同或实际上可以改变(例如,关于其特异性或选择性或功效)但保留分子的基本生物学功能。
术语“变体”是指与群体中最普遍的序列不同的核苷酸序列(例如,相差一个核苷酸)或与群体中最普遍的序列不同的蛋白质序列(例如,相差一个氨基酸)。
当提及蛋白时,术语“片段”意指比全长蛋白更短或具有更少氨基酸的蛋白。当提及核酸时,术语“片段”意指比全长核酸更短或具有更少核苷酸的核酸。当提及蛋白质片段时,片段可以是例如N端片段(即,去除蛋白质的C末端的一部分)、C端片段(即,去除蛋白质的N末端的一部分)或内部片段(即,去除蛋白质的N末端和C末端中的每个末端的一部分)。当提及核酸片段时,片段可以是例如5'片段(即,去除核酸的3'末端的一部分)、3'片段(即,去除核酸的5'末端的一部分)或内部片段(即,去除核酸的5'末端和3'末端中的每个末端的一部分)。
在两个多核苷酸或多肽序列的上下文中,“序列同一性”或“同一性”是指当在指定的比较窗口上针对最大对应性进行比对时两个序列中相同的残基。当提及蛋白质的序列同一性的百分比时,不相同的残基位置通常因保守性氨基酸取代而不同,其中氨基酸残基被具有相似化学性质(例如,电荷或疏水性)的其它氨基酸残基取代,因此不改变分子的功能性质。当序列的保守性取代不同时,可以将百分比序列同一性向上调整以校正取代的保守性质。因此类保守性取代而不同的序列被视为具有“序列类似性”或“类似性”。用于进行这种调整的方法众所周知。通常,这涉及将保守性取代计为部分错配而不是完全错配,从而增加百分比序列同一性。因此,例如,当相同氨基酸的所得得分为1,非保守性取代的所得得分为零时,保守性取代的所得得分介于零与1之间。例如,通过在项目PC/GENE(加利福尼亚州山景城的Intelligenetics公司(Intelligenetics,Mountain View,California))中的实施方式计算保守性取代的得分。
“序列同一性百分比”包含通过在比较窗口上比较两个最佳比对序列测定的值(完全匹配残基的最大数量),其中在比较窗口中的多核苷酸序列部分与参考序列(不包括添加物或缺失部分)相比可以包括添加物或缺失部分(即缺口),以实现两个序列的最佳比对。通过测定在两个序列中出现相同核酸碱基或氨基酸残基的位置数计算百分比来得到匹配位置数,用匹配位置数除以比较窗口中的位置总数,并将结果乘以100以得到序列同一性的百分比。除非另有说明(例如,较短的序列包含连接的异源序列),否则所述比较窗口为两个所比较序列中较短序列的全长。
除非另有说明,否则序列同一性/相似性值包含使用以下参数使用第10版GAP获得的值:使用GAP权重50、长度权重3以及nwsgapdna.cmp得分矩阵的核苷酸序列的同一性百分比和相似性百分比;使用GAP权重8和长度权重2以及BLOSUM62得分矩阵的氨基酸序列的同一性百分比和相似性百分比;或其任何等效程序。“等效程序”包含当与第10版GAP生成的对应比对进行比较时针对所讨论的任何两个序列产生具有相同核苷酸或氨基酸残基匹配和相同百分比序列同一性的比对的任何序列比较程序。
术语“保守性氨基酸取代”是指用具有相似大小、电荷或极性的不同氨基酸取代序列中正常存在的氨基酸。保守性取代的实例包含用非极性(疏水性)残基(如异亮氨酸、缬氨酸或亮氨酸)取代另一种非极性残基。同样地,保守性取代的实例包含用一种极性(亲水性)残基取代另一种极性残基,如精氨酸与赖氨酸之间的极性残基、谷氨酰胺与天冬酰胺之间的极性残基或甘氨酸与丝氨酸之间的极性残基。另外,用碱性残基(如赖氨酸、精氨酸或组氨酸)取代另一种碱性残基或者用一种酸性残基(如天冬氨酸或谷氨酸)取代另一种酸性残基是保守性取代另外的实例。非保守性取代的实例包含用非极性(疏水性)氨基酸残基(如异亮氨酸、缬氨酸、亮氨酸、丙氨酸或甲硫氨酸)取代极性(亲水性)残基(如半胱氨酸、谷氨酰胺、谷氨酸或赖氨酸)和/或用极性残基取代非极性残基。典型的氨基酸分类总结在下表1中。
表1:氨基酸分类。
Figure BDA0003620588300000161
“同源”序列(例如,核酸序列)包含与已知参考序列相同或基本上相似的序列,使得其例如与已知参考序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性。同源序列可以包含例如直系同源序列和旁系同源序列。例如,同源基因通常通过物种形成事件(直系同源基因)或基因复制事件(旁系同源基因)从共同的祖先DNA序列下降。“直系同源”基因包含不同物种中通过物种形成从共同祖先基因进化而来的基因。直系同源物通常在进化过程中保留相同的功能。“旁系同源”基因包含通过基因组内的复制相关的基因。旁系同源物可以在进化过程中进化出新的功能。
术语“体外(in vitro)”包括人工环境和在人工环境(例如,试管或分离的细胞或细胞系)内发生的过程或反应。术语“体内(in vivo)”包含自然环境(例如,细胞、生物体或身体)以及在自然环境内发生的过程或反应。术语“离体”包含已从个体体内取出的细胞以及在此类细胞内发生的过程或反应。
术语“报告基因”是指具有对基因产物(通常是酶)进行编码的序列的核酸,当包括与内源或异源启动子和/或增强子元件可操作地连接的报告基因序列的构建体被引入到含有(或者可以使其含有)激活启动子和/或增强子元件所必需的因子的细胞中时,所述核酸易于且可定量地进行测定。报告基因的实例包含但不限于对β-半乳糖苷酶(lacZ)进行编码的基因、细菌氯霉素乙酰转移酶(cat)基因、萤火虫荧光素酶基因、对β-葡萄糖醛酸酶(GUS)进行编码的基因和对荧光蛋白进行编码的基因。“报告蛋白”是指由报告基因编码的蛋白质。
如本文所使用的,术语“荧光报告蛋白”意指基于荧光可检测的报告蛋白,其中荧光可以直接来自报告蛋白、报告蛋白在荧光底物上的活性,或对与荧光标记的化合物结合具有亲和力的蛋白质。荧光蛋白的实例包含绿色荧光蛋白(例如,GFP、GFP-2、tagGFP、turboGFP、eGFP、祖母绿(Emerald)、Azami绿、单体Azami绿、CopGFP、AceGFP和ZsGreenl)、黄色荧光蛋白(例如,YFP、eYFP、柠檬黄、Venus、YPet、PhiYFP和ZsYellowl)、蓝色荧光蛋白(例如,BFP、eBFP、eBFP2、石青、mKalamal、GFPuv、天蓝色和T-天蓝色(T-sapphire))、青色荧光蛋白(例如CFP、eCFP、蔚蓝色(Cerulean)、CyPet、AmCyanl和Midoriishi-青色)、红色荧光蛋白(例如,RFP、mKate、mKate2、mPlum、DsRed单体、mCherry、mRFP1、DsRed-表达、DsRed2、DsRed-单体、HcRed-Tandem、HcRedl、AsRed2、eqFP611、mRaspberry、mStrawberry和Jred)、橙色荧光蛋白(例如,mOrange、mKO、Kusabira-橙色、单体Kusabira-橙色、mTangerine和tdTomato),以及可以通过流式细胞术方法检测到细胞中存在的任何其它合适的荧光蛋白。
“包括(comprising)”或“包含(including)”一个或多个所列举的元件的组合物或方法可以包含其它未具体列举的元件。例如,“包括”或“包含”蛋白质的组合物可以单独含有蛋白质或与其它成分组合的蛋白质。过渡短语“基本上由……组成”意指权利要求的范围应被解释为涵盖权利要求中所列举的指定要素以及对要求保护的发明的基本和新颖特性没有实质性影响的那些要素。因此,当在本发明的权利要求中使用时,术语“基本上由……组成”不应被解释为等效于“包括”。
“任选的(optional)”或“任选地(optionally)”是指随后描述的事件或情况可能发生或可能不发生并且此描述包含其中所述事件或情况发生的实例以及其中所述事件或情况不发生的实例。
数值范围的指定包含所述范围内或定义所述范围的所有整数以及由所述范围内的整数定义的所有子范围。
除非从上下文中明显看出,否则术语“约”涵盖规定值的标准测量误差范围(例如,SEM)内的值。
术语“和/或”是指并且涵盖关联的所列项中的一个或多个所列项的任何和所有可能组合以及在以替代性方案(“或”)解释时组合的缺少。
术语“或”是指特定列表中的任何一个成员,并且还包含所述列表成员的任何组合。
除非上下文另外明确指明,否则本文中的单数形式“一个(a)”、“一种(an)”和“所述(the)”包含复数个提及物。例如,术语“蛋白质”或“至少一种蛋白质”可以包含多种蛋白质,包含其混合物。
除非另外指示,否则统计学上显著意指p≤0.05。
具体实施方式
I.概述
提供了在同一脂质纳米颗粒中一起包含CRISPR/Cas协同激活介体系统组分的脂质纳米颗粒,以及使用此类脂质纳米颗粒来增加体内和离体靶基因表达和评估CRISPR/Cas协同激活介体系统增加体内和离体靶基因表达的能力的方法。
CRISPR/Cas9,一种RNA导向的DNA核酸内切酶,催化DNA在其向导RNA的结合位点处形成双链断裂。在Cas9中已经鉴别出了两个重要的催化域:RuvC和HNH域。RuvC域启动与向导RNA不互补的DNA链的切割,并且HNH域切割与向导RNA互补的DNA链。任一域均可以失活以使Cas9成为切口酶,或者两个域均可以突变以形成催化上死亡的Cas9(dCas9)。尽管dCas9不会引起链断裂,但催化上死亡的蛋白可用于将其它蛋白运送到特定的基因组区域。这是CRISPR/Cas9系统激活和抑制变体的基础。
在dCas9协同激活介体(SAM)系统中,数个激活域相互作用以引起比任一个因素单独诱导的更大的基因响应。在该系统的初始迭代中,需要引入三种慢病毒。第一慢病毒将含有直接融合到VP64域的dCas9,VP64域是由单纯疱疹病毒蛋白16的四个串联拷贝组成的转录激活子。当VP64与在转录起始位点附近结合的蛋白融合时,它会充当强转录激活子。第二慢病毒将引进与两种附加激活转录因子融合的MS2外壳蛋白(MCP),这两种激活转录因子为:热休克因子1(HSF1)和转录因子65(p65)。MCP自然地与MS2茎环结合。在该系统中,MCP与工程化到CRISPR相关联sgRNA中的MS2茎环相互作用,并且从而将结合的转录因子运送到适当的基因组位置。第三慢病毒将引入含有MS2环的sgRNA。虽然三组分系统在细胞培养中具有一定的灵活性,但这种设置在动物模型中不太理想。
腺相关联病毒(AAV)通常被认为对基因治疗是安全的,因为它们具有低免疫原性并且具有高度可预测的整合位点(人染色体19上的AAVS1)。然而,为了提高它们作为基因治疗载体的安全性,WT AAV的整合能力已被消除,使得这些载体作为附加体保留在宿主细胞核中。在引入宿主中后,针对AAV的免疫响应通常仅限于中和抗体,而没有明确定义的细胞毒性响应。在分裂细胞中,AAV DNA通过细胞分裂被稀释,使得需要施用更多的病毒来持续治疗响应。这些随后的暴露可能会导致病毒的快速中和,并且因此降低宿主反应。为了解决这个问题,研究人员将使用替代血清型进行循序感染,尽管这受到血清型特异性的阻碍。基于AAV的疗法的另一个问题是相对较小的克隆容量:两个反向末端重复序列之间的4.6kb。由于dCas9 SAM的完整编码序列为~5.8kb(无启动子),并非所有SAM组分都可以从单个AAV中表达。
解决这个问题的一种方法是在两个或更多个AAV中表达所述元件,并希望它们都感染同一细胞。然而,这对于治疗解决方案来说不太理想。考虑到这一点,我们着手优化该系统,使得其可以进行临床翻译。
脂质纳米颗粒(LNP)是AAV的一种有吸引力的替代品,因为它们通过利用内源性内吞机制经由LDL受体引进分子,从而安全并且有效地将核酸递送至细胞。一旦被引入生物体,调配物的变化可能会影响颗粒的稳定性和趋向性。此外,各种配体的缀合还可以提高LNP的靶特异性。这种递送方法的一个警告是对宿主细胞的瞬时作用,因为递送至细胞的mRNA在一些情况下可以在细胞摄入的48小时内被清除。然而,对LNP递送没有免疫响应,这允许良好耐受的循序给药。此外,在具有催化活性的Cas9的情况下,具有催化活性的Cas9和sgRNA的递送将使靶序列产生永久性的变化,其可能在材料已经从细胞中清除后长时间繁殖。然而,用无催化活性的Cas9(催化上死亡的Cas9或dCas9)进行的转录激活不会导致永久性的遗传变化。此外,该递送系统在递送具有稳定末端修饰的dCas9 SAM向导RNA方面的应用受到RNA合成技术的限制。这些限制已经妨碍了具有稳定末端修饰的SAM sgRNA的生成,因为这些分子大于110个核苷酸的平台最大值。
虽然经由递送LNP配制的SAM gRNA上调靶基因预期会持续显著更短的时间,但令人惊讶的是,我们能够使用LNP介导的递送实现显著的转录激活,其瞬时性远低于预期。SAMsgRNA与所有其它SAM组分的LNP递送是对治疗性dCas9 SAM应用的显著增强,因为我们现在可以(1)确保dCas9 SAM转录物和SAM sgRNA着陆在同一细胞中,(2)用调配物/配体掺入介导增加的组织特异性,(3)向生物体重新给药而不必担心免疫响应,以及(4)生成更稳定的表达水平。总之,核酸递送的这种组合以安全且出乎意料的稳定方式极大地增强了潜在的dCas9应用。
II.增加靶基因的转录或表达和评估CRISPR/Cas增加体内或离体靶基因的转录或表达的能力的方法
提供了使用本文所述的脂质纳米颗粒(LNP)来增加或激活靶基因的表达或转录或者评估本文所述的CRISPR/Cas协同激活介体(SAM)系统增加/激活体内或离体靶基因的表达或转录的能力的各种方法。这些方法和组合物可以用于增加真核基因组、细胞或生物体中靶基因的转录或表达。此类LNP在同一LNP中一起包含协同激活介体系统的所有组分(一个或多个向导RNA或核酸编码、嵌合Cas蛋白或核酸编码,以及嵌合衔接蛋白或核酸编码)。例如,此类方法可以包含向细胞或真核生物体(例如,动物、非人动物、哺乳动物或非人哺乳动物)中引入:(a)编码嵌合规律间隔成簇短回文重复序列(CRISPR)相关联(Cas)蛋白的核酸,该蛋白包含与一个或多个转录激活域融合的无核酸酶活性的Cas蛋白;(b)编码嵌合衔接蛋白的核酸,该嵌合衔接蛋白包含与一个或多个转录激活域融合的衔接蛋白;以及(c)一个或多个向导RNA或编码该一个或多个向导RNA的一个或多个核酸,每个向导RNA包含嵌合衔接蛋白可特异性结合的一个或多个衔接结合元件,并且其中一个或多个向导RNA中的每一个能够与Cas蛋白形成复合物并将其导向至靶基因内的靶序列,从而增加靶基因的表达,其中所有三种组分在同一LNP中一起递送。在一个实例中,引入编码嵌合Cas蛋白和嵌合衔接蛋白两者的多顺反子或双顺反子核酸(例如,DNA或mRNA)(本文称为SAM盒或SAM mRNA)。例如,如本文别处更详细描述的那样,编码嵌合Cas蛋白的序列和编码嵌合衔接蛋白的序列可以通过编码2A蛋白的序列链接。引入真核生物体是指用于将组分递送至真核生物体以使它们能进入一个或多个细胞和这些细胞内的靶基因的任何方法。同样地,引入细胞是指用于将组分递送至细胞中以使它们能进入细胞内的靶基因的任何方法。合适的嵌合Cas蛋白、嵌合衔接蛋白和向导RNA在本文别处更详细地描述。一个或多个向导RNA可与嵌合Cas蛋白和嵌合衔接蛋白形成复合物并将它们导向至一个或多个靶基因内的靶序列,从而增加一个或多个靶基因的表达。此类方法还可以包含评估一个或多个靶基因的表达或转录。
提供用于增加或激活靶基因的表达或转录或者评估CRISPR/Cas SAM系统增加/激活体内靶基因的表达或转录的能力的各种方法也可以用于增加或激活靶基因的表达或转录或者评估CRISPR/Cas SAM系统在细胞中增加/激活离体靶基因的表达或转录的能力。提供用于增加或激活靶基因的表达或转录或者评估CRISPR/Cas SAM系统增加/激活体内靶基因的表达或转录的能力的各种方法也可以用于增加或激活靶基因的表达或转录或者评估CRISPR/Cas SAM系统在细胞中增加/激活体外靶基因的表达或转录的能力。
在一些方法中,细胞或生物体可以循序用相同的脂质纳米颗粒重新给药两次或更多次。例如,可以循序将脂质纳米颗粒引入细胞或生物体中至少约2、至少约3、至少约4、至少约5、至少约6、至少约7、至少约8、至少约9,或至少约10次。脂质纳米颗粒的给药之间的间隔可以是任何合适的时间量。例如,间隔可以是至少约1天、至少约2天、至少约3天、至少约4天、至少约5天、至少约6天、至少约7天、至少约1周、至少约2周、至少约3周、至少约4周、至少约5周、至少约6周、至少约7周、至少约8周、至少约1个月、至少约2个月、至少约3个月或至少约4个月。例如,脂质纳米颗粒的给药之间的间隔可以是至少约1周(例如,约1周)、至少约2周(例如,约2周)、至少约4周(例如,约4周)、约1周至约5周、约1周至约4周、约1周至约3周、约1周至约2周、约2周至约5周、约2周至约4周、约2周至约3周、约3周至约5周、约3周至约4周,或约4周至约5周。在一个实例中,脂质纳米颗粒的给药之间的间隔可以是约2周。
在一些方法中,在每次循序引入脂质纳米颗粒后,靶基因的表达增加至至少约相同的水平。在一些方法中,靶基因的表达通过循序重新给药维持在约相同的水平。在一些方法中,用脂质纳米颗粒重新给药后靶基因的表达增加至比单次给药脂质纳米颗粒更高的水平(例如,重新给药脂质纳米颗粒时的靶基因表达的增加高于没有重新给药时的靶基因表达的增加)。
任选地,可以引入两个或更多个向导RNA,它们各自被设计为靶向靶基因内的不同向导RNA靶序列。例如,可以设计两个或更多个、三个或更多个、四个或更多个,或五个或更多个向导RNA以靶向单个靶基因(例如,可以使用两个、三个、四个或五个向导RNA,每个向导RNA靶向相同靶基因内的不同向导RNA靶序列)。替代地或附加地,可以引入两个或更多个、三个或更多个、四个或更多个,或五个或更多个向导RNA,每个向导RNA被设计为靶向不同靶基因(例如,两个或更多个、三个或更多个、四个或更多个,或五个或更多个不同靶基因)中的不同向导RNA靶序列(即,多路复用)。例如,可以使用两个、三个、四个或五个向导RNA,每个向导RNA靶向不同的靶基因。
嵌合Cas蛋白、嵌合衔接蛋白和向导RNA可以以任何形式(向导RNA的DNA或RNA;嵌合Cas蛋白和嵌合衔接蛋白的DNA、RNA或蛋白)经由本文别处公开的任何施用途径引入细胞或真核生物体。在一些方法中向导RNA、嵌合Cas蛋白和嵌合衔接蛋白可以以组织特异性方式引入(例如,以肝脏特异性方式引入)。
编码嵌合Cas蛋白和嵌合衔接蛋白的向导RNA和mRNA(例如,SAM mRNA)可以在5'末端和/或3'末端包含一个或多个稳定末端修饰,如本文别处更详细描述的那样。作为一个实例,RNA的5'末端和/或3'末端可以包含一个或多个硫代磷酸酯键。例如,向导RNA可以包含向导RNA的5'或3'末端处的2、3或4个末端核苷酸之间的硫代磷酸酯键。作为另一个实例,RNA的5'末端和/或3'末端可以包含一个或多个2'-O-甲基修饰。例如,RNA可以在前三个5'和3'端RNA残基处包括2'-O-甲基类似物和3'硫代磷酸酯核苷酸间键。例如,向导RNA可以在RNA的5'和/或3'末端(例如,5'末端)处的2个、3个或4个末端核苷酸处包括2'-O-甲基修饰。参见例如WO 2017/173054 A1和Finn等人(2018),《细胞报告(Cell Rep.)》22(9):2227-2235,所述文献中的每个文献出于所有目的通过引用整体并入本文。作为另一个实例,RNA(例如,mRNA)可以在5'末端被加帽(例如,其中+1核糖核苷酸在核糖的2'O位置被甲基化的帽1结构),可以被聚腺苷酸化,并且还可以任选地被修饰以被假尿苷完全取代(即,所有标准尿嘧啶残基均被假尿苷替换,假尿苷是一种尿嘧啶与碳-碳键而不是氮-碳键相连的尿苷异构体)。对向导RNA和mRNA的其它可能的修饰在本文别处更详细地描述。在具体实例中,RNA在前三个5'和3'端RNA残基处包括2'-O-甲基类似物和3'硫代磷酸酯核苷酸间键。此类化学修饰可以例如为RNA提供更大的稳定性和免受核酸外切酶,允许RNA在细胞内比未经修饰的RNA持续更长时间。例如,此类化学修饰还可以防止先天的细胞内免疫应答,所述先天的细胞内免疫应答可以主动降解RNA或触发导致细胞死亡的免疫级联反应。
向导RNA可以靶向靶基因中适合增加靶基因转录的任何位置。例如,向导RNA的靶序列可以包含靶基因内的调控序列,如启动子或增强子。同样地,靶序列可以与基因的转录起始位点邻近。例如,靶序列可以在转录起始位点1000、900、800、700、600、500、400、300、200、190、180、170、160、150、140、130、120、110、100、90、80、70、60、50、40、30、20、10、5或1个碱基对内、在转录起始位点上游1000、900、800、700、600、500、400、300、200、190、180、170、160、150、140、130、120、110、100、90、80、70、60、50、40、30、20、10、5或1个碱基对内,或者在转录起始位点下游1000、900、800、700、600、500、400、300、200、190、180、170、160、150、140、130、120、110、100、90、80、70、60、50、40、30、20、10、5或1个碱基对内。作为具体实例,靶序列可以在靶基因的转录起始位点约200个碱基对内,或者可以在转录起始位点上游约200个碱基对内和转录起始位点下游1个碱基对内。
本文公开的方法还可以包含评估靶基因的表达。测量表达或活性的方法将取决于被修饰的靶基因。评估靶基因的增加的转录或表达的方法是众所周知的。
例如,如果靶基因包含编码RNA或蛋白的基因,则评估表达的方法可以包含测量经编码的RNA和/或蛋白的表达或活性。例如,如果经编码的蛋白是释放到血清中的蛋白,则可以测量经编码的蛋白的血清水平。用于测量RNA和蛋白的水平和活性的测定法是众所周知的。
评估靶基因在真核生物体(例如,动物、非人动物、哺乳动物或非人哺乳动物)中的表达可以在来自任何组织或器官的任何细胞类型中进行。例如,可以在来自相同组织或器官的多个细胞类型中或在来自组织或器官内多个位置的细胞中评估靶基因的表达。这可以提供关于靶向靶组织或器官内的哪些细胞类型或者CRISPR/Cas到达组织或器官的哪些部分并修饰它们的信息。作为另一个实例,可以在多个类型的组织或多个器官中评估靶基因的表达。在靶向特定组织或器官的方法中,这可以提供关于靶向该组织或器官的有效性以及其它组织或器官中是否存在脱靶效应的信息。
在一些方法中,例如通过评估肝细胞中由靶基因组基因座表达的分泌蛋白的血清水平来评估靶基因在肝细胞中的表达。如果靶基因编码具有特定酶活性的蛋白,则评估可以包含测量靶基因的表达和/或由靶基因编码的蛋白的活性。替代地或附加地,评估可以包含评估从真核生物体(例如,动物、非人动物、哺乳动物或非人哺乳动物)分离的一个或多个细胞中的表达。评估可以包含从真核生物体(例如,动物、非人动物、哺乳动物或非人哺乳动物)中分离靶器官或组织,并评估靶基因在靶器官或组织中的表达。评估还可以包含评估靶基因在靶器官或组织内的两种或更多种不同细胞类型中的表达。类似地,评估可以包含从真核生物体(例如,动物、非人动物、哺乳动物或非人哺乳动物)分离非靶器官或组织(例如,两个或更多个非靶器官或组织),并评估靶基因在非靶器官或组织中的表达。
在一些方法中,靶基因可以是本文别处所述的疾病相关联基因。作为一个实例,疾病相关联基因可以是与未患病对照的组织或细胞相比,在来源于受疾病影响的组织的细胞中以异常水平或异常形式产生转录或翻译产物的任何基因。它可能是以异常高水平表达的基因,其中改变的表达与疾病的发生和/或发展相关。它可能是以异常低水平表达的基因,其中改变的表达与疾病的发生和/或发展相关。疾病相关联基因也指具有导致疾病病因的突变或遗传变异的基因。转录或翻译的产物可能是已知的或未知的,并且可能处于正常或异常水平。例如,靶基因可以是与蛋白聚集疾病或病症相关联的基因。作为具体的实例,靶基因可以是与蛋白聚集疾病或病症相关联的基因(例如,Ttr),并且该方法可以包含增加该靶基因的表达以模拟蛋白聚集疾病或病症。在一些具体的方法中,靶基因可以是Ttr。任选地,Ttr基因可以包含致病突变(例如,引起淀粉样变性的突变)或致病突变的组合。此类突变的实例例如在WO 2018/007871中提供,该文献以全文引用的方式并入本文用于所有目的。
在一些方法中,靶基因可以是在受试者中该基因产生的增加将是有益的任何基因(例如,疾病相关联基因)。例如,此类靶基因的转录减少、来自此类靶基因的基因产物量减少,或来自此类靶基因的基因产物的活性降低可能与疾病相关联、可能使疾病恶化,或者可能引起疾病,使得靶基因的转录或表达增加将是有益的。此类基因的一个实例是OTC(Entrez Gene ID5009)。OTC缺乏(鸟氨酸转氨甲酰酶缺乏)的特征是血液中的氨升高,其被认为是一种神经毒素并且可以由高蛋白饮食引起。这是一种X连锁疾病,并且主要影响男性,但由于随机X失活,女性可以发展出较温和的形式。有许多突变会导致疾病的一系列严重程度,因为一些突变仍然允许产生一些野生型OTC。作为一个实例,与野生型受试者相比,OTC中的突变剪接位点可导致受试者具有约5%的OTC酶活性。正是这些患者以及有症状的女性将受益于通过递送SAM mRNA和靶向OTC启动子的向导RNA来增加OTC的表达,因为野生型OTC的表达增加将允许清除血液中过量的氨。增加基因的产生对将受试者有益的其它基因实例包括用于增加胎儿血红蛋白表达的HBG1(Entrez Gene ID 3047)和HBG2(EntrezGene ID 3048)。增加基因的产生对将受试者有益的其它基因实例包括单倍体不足基因。单倍体不足是当基因的一个拷贝失活或缺失,并且该基因的剩余功能拷贝不足以产生所需的基因产物以保持正常功能时发生的情况。换句话说,对于一些基因,二倍体基因组中一个功能拷贝的缺失或失活会将生物体的表型改变为异常或疾病状态。这些基因被称为单倍体不足,因为这些基因的一个正常拷贝不足以产生正常或野生型表型。单倍体不足基因的一个功能拷贝的丢失与包括神经障碍和智力迟钝在内的疾病有关,并且单倍体不足基因还可以影响一个人对疾病和/或药物副作用的易感性。表2和3中提供了单倍体不足基因和与一个功能拷贝的丢失相关联的相关联疾病/病症/综合征的实例。另见Dang等人(2008)《欧洲人类遗传学杂志(Eur.J.Hum.Genet.)》,16(11):1350-1357,该文献以全文引用的方式并入本文用于所有目的。
表2:表3中单倍体不足基因表达的实例的子组。
Figure BDA0003620588300000251
表3:单倍体不足基因表达的实例。
Figure BDA0003620588300000252
Figure BDA0003620588300000261
Figure BDA0003620588300000271
Figure BDA0003620588300000281
Figure BDA0003620588300000291
Figure BDA0003620588300000301
Figure BDA0003620588300000311
Figure BDA0003620588300000321
Figure BDA0003620588300000331
可以实现靶基因表达的任何统计学上显著的增加。例如,相对于对照真核基因组、细胞或生物体(例如,在RNA水平或蛋白水平上测量),靶基因表达的增加可以为至少约0.5倍、至少约1倍、至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍或至少约20倍。同样地,靶基因表达增加的持续时间可以是任何合适的时间。例如,靶基因表达增加的持续时间可以为至少约1天、至少约2天、至少约3天、至少约4天、至少约5天、至少约6天、至少约1周、至少约2周、至少约3周、至少约4周、至少约1个月或至少约2个月。在具体实例中,相对于对照真核基因组、细胞或生物体,在引入CRISPR/Cas协同激活介体(SAM)系统之后的1天、2天、3天、4天、5天、6天、1周、2周、3周、4周或1个月时靶基因表达的增加可以为至少约0.5倍、至少约1倍、至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍或至少约20倍。在一个实例中,在使用0.5mg/kg LNP或1mg/kg LNP或2mg/kg LNP的剂量1、2或3周后增加为至少约2倍。在另一个实例中,在使用0.5mg/kg LNP或1mg/kg LNP或2mg/kg LNP的剂量1、2或3周后增加为至少约3倍。在另一个实例中,在使用0.5mg/kg LNP或1mg/kg LNP或2mg/kg LNP的剂量1、2或3周后增加为至少约4倍。在另一个实例中,在使用0.5mg/kg LNP或1mg/kg LNP或2mg/kg LNP的剂量1、2或3周后增加为至少约5倍。在另一个实例中,在使用0.5mg/kg LNP或1mg/kg LNP或2mg/kg LNP的剂量1、2或3周后增加为至少约6倍。在另一个实施例中,在使用0.5mg/kg LNP或1mg/kg LNP或2mg/kg LNP的剂量1、2或3周后增加为至少约7倍。在另一个实施例中,在使用0.5mg/kg LNP或1mg/kg LNP或2mg/kg LNP的剂量1、2或3周后增加为至少约8倍。在另一个实施例中,在使用0.5mg/kg LNP或1mg/kg LNP或2mg/kg LNP的剂量1、2或3周后增加为至少约9倍。在另一个实施例中,在使用0.5mg/kg LNP或1mg/kg LNP或2mg/kg LNP的剂量1、2或3周后增加为至少约10倍。靶基因表达的增加可以以接近恒定的水平(即,不显示随时间降低的模式)持续至少约1天、至少约2天、至少约3天、至少约4天、至少约5天、至少约6天、至少约1周、至少约2周、至少约3周、至少约4周或更长。
该方法可以用于增加任何真核基因组、细胞或生物体中靶基因的转录或表达。基因组、细胞或真核生物体(例如,动物、非人动物、哺乳动物或非人哺乳动物)可以是雄性或雌性。在一些方法中,靶基因的转录或表达在有需要的受试者(例如,生物体或动物或哺乳动物,如人)中增加。例如,有需要的受试者可以是患有与以下因素相关联、被以下因素恶化,或由以下因素引起的疾病、病症或综合征的受试者:靶基因的转录或表达减少、靶基因的基因产物量减少,或靶基因的基因产物的活性降低;使得增加靶基因的转录或表达,增加靶基因的基因产物量,或增加靶基因的基因产物的活性将是有益的。相对于没有疾病、病症或综合征的对照受试者,靶基因在受试者中可能低表达或低水平表达。例如,增加靶基因的转录或表达、增加靶基因的基因产物量或增加靶基因的基因产物的活性可以治疗受试者的疾病、病症或综合征。此类疾病、病症或综合征的实例包括与单倍体不足相关联的疾病、病症或综合征。增加转录或表达将对其有益的单倍体不足基因和其它基因的实例在表2和3中以及本文别处提供。
本文提供的真核基因组、细胞或生物体可以是例如多细胞真核生物体、非人真核生物体、动物、非人动物、哺乳动物、非人哺乳动物、人、非人、啮齿动物、小鼠或大鼠基因组、细胞或生物体。真核细胞包括例如真菌细胞(例如,酵母)、植物细胞、动物细胞、哺乳动物细胞、非人哺乳动物细胞和人细胞。术语“动物”包含哺乳动物、鱼类和鸟类。哺乳动物包含例如人、非人灵长类动物、猴子、猿、猫、狗、马、公牛、鹿、野牛、绵羊、兔、啮齿动物(例如,小鼠、大鼠、仓鼠和豚鼠)和家畜(例如,牛种,如奶牛和公牛;绵羊种,如绵羊和山羊;以及猪种,如猪和野猪)。鸟类包含例如鸡、火鸡、鸵鸟、鹅和鸭。还包含家养动物和农业动物。术语“非人动物”不包含人。
细胞也可以呈任何类型的未分化或分化状态。例如,细胞可以是全能细胞、多能细胞(例如,人多能细胞或非人多能细胞,如小鼠胚胎干(ES)细胞或大鼠ES细胞)或非多能细胞。全能细胞包含可以产生任何细胞类型的未分化细胞,并且多能性细胞包含具有发育成超过一种分化细胞类型的能力的未分化细胞。此类多能和/或全能细胞可以是例如ES细胞或ES样细胞,如诱导多能干(iPS)细胞。ES细胞包含在引入到胚胎中时能够对发育胚胎的任何组织做出贡献的胚胎源性全能或多能性细胞。ES细胞可以源自囊胚的内细胞团,并且能够分化成三种脊椎动物胚层(内胚层、外胚层和中胚层)中的任何层的细胞。
人多能细胞的实例包括人ES细胞、人成体干细胞、发育受限的人祖细胞和人诱导的多能干(iPS)细胞,如致敏人iPS细胞和幼稚人iPS细胞。诱导的多能干细胞包括可以直接衍生自分化的成体细胞的多能干细胞。人iPS细胞可以通过将特定组的重编程因子引入细胞中产生,这些重编程因子可以包括例如Oct3/4、Sox家族转录因子(例如,Sox1、Sox2、Sox3、Sox15)、Myc家族转录因子(例如,c-Myc、l-Myc、n-Myc)、Krüppel样家族(KLF)转录因子(例如,KLF1、KLF2、KLF4、KLF5)和/或相关转录因子,如NANOG、LIN28和/或Glis1。人iPS细胞也可以例如通过使用miRNA、模拟转录因子作用的小分子或细胞谱系特异性分子产生。人iPS细胞的特征在于它们分化成三种脊椎动物胚层(例如内胚层、外胚层或中胚层)的任何细胞的能力。人iPS细胞的特征还在于它们在合适的体外培养条件下无限增殖的能力。参见例如Takahashi和Yamanaka(2006)《细胞(Cell)》126:663-676,该文献以全文引用的方式并入本文用于所有目的。致敏人ES细胞和致敏人iPS细胞包括表达与植入后外胚层细胞的特征类似的特征并用于谱系特异性和分化的细胞。幼稚人ES细胞和幼稚人iPS细胞包括表达与植入前胚胎的内细胞团的ES细胞的特征类似的特征并且不用于谱系特异性的细胞。参见例如Nichols和Smith(2009)《细胞干细胞(Cell Stem Cell)》4:487-492,该文献以全文引用的方式并入本文用于所有目的。
本文所提供的细胞还可以是生殖细胞(例如,精子或卵母细胞)。细胞可以是有丝分裂感受态细胞或有丝分裂非活性细胞、减数分裂感受态细胞或减数分裂非活性细胞。相似地,细胞还可以是初生体细胞或不是初生体细胞的细胞。体细胞包含任何不是配子、生殖细胞、配子母细胞或未分化干细胞的细胞。例如,细胞可以是肝细胞、肾细胞、造血细胞、内皮细胞、上皮细胞、成纤维细胞、间充质细胞、角质形成细胞、血细胞、黑素细胞、单核细胞、单个核细胞、单核细胞前体、B细胞、红细胞-巨核细胞、嗜酸性粒细胞、巨噬细胞、T细胞、胰岛β细胞、外分泌细胞、胰腺祖细胞、内分泌祖细胞、脂肪细胞、前脂肪细胞、神经元、神经胶质细胞、神经干细胞、神经元、成肝细胞、肝细胞、心肌细胞、骨骼肌细胞、平滑肌细胞、导管细胞、腺泡细胞、α细胞、β细胞、δ细胞、PP细胞、胆管细胞、白色或棕色脂肪细胞或眼细胞(例如,小梁网细胞、视网膜色素上皮细胞、视网膜微血管内皮细胞、视网膜周细胞、结膜上皮细胞、结膜成纤维细胞、虹膜色素上皮细胞、角膜细胞、晶状体上皮细胞、非色素睫状上皮细胞、眼脉络膜成纤维细胞、感光细胞、神经节细胞、双极细胞、水平细胞或无长突细胞)。例如,细胞可以是肝细胞(liver cell),如成肝细胞或肝细胞(hepatocyte)。
本文所提供的合适的细胞还包含原代细胞。原代细胞包含直接从生物体、器官或组织中分离的细胞或细胞培养物。原代细胞包含既不转化也不永生的细胞。所述原代细胞包含从生物体、器官或组织中获得的任何细胞,所述细胞先前未在组织培养物中进行传代,或者先前已经在组织培养物中进行传代但不能无限期地在组织培养中进行传代。此类细胞可以通过常规技术分离并且包含例如体细胞、造血细胞、内皮细胞、上皮细胞、成纤维细胞、间充质细胞、角质形成细胞、黑素细胞、单核细胞、单一核细胞、脂肪细胞、前脂肪细胞、神经元、神经胶质细胞、肝细胞、骨骼肌成肌细胞和平滑肌细胞。例如,原代细胞可以来源于结缔组织、肌肉组织、神经系统组织或上皮组织。此类细胞可以通过常规技术分离并且包含例如肝细胞。
本文所提供的其它合适的细胞包含永生化细胞。永生化细胞包含来自多细胞生物体的细胞,其通常不会无限增殖但由于突变或改变而逃避正常细胞衰老并且替代地可以继续进行分裂。此类突变或改变可以天然存在或有意诱导。永生化细胞的实例包括中国仓鼠卵巢(CHO)细胞、人胚胎肾细胞(例如,HEK 293细胞或293T细胞)和小鼠胚胎成纤维细胞(例如,3T3细胞)。永生化细胞系的具体实例是HepG2人肝癌细胞系。多种类型的永生化细胞是众所周知的。永生化或原代细胞包含通常用于培养或表达重组基因或蛋白质的细胞。
本文所提供的细胞还包含单细胞期胚胎(即,受精的卵母细胞或受精卵)。此类单细胞期胚胎(例如,啮齿动物单细胞期胚胎)可以来自任何遗传背景(例如,对于小鼠,BALB/c、C57BL/6、129或其组合),可以是新鲜的或冷冻的,并且可以源自自然育种或体外受精。
本文所提供的细胞可以是正常的、健康的细胞,或者可以是患病或携带突变体的细胞。
真核基因组、细胞或生物体可以来自任何遗传背景。例如,合适的小鼠可以来自129品系、C57BL/6品系、129和C57BL/6的混合、BALB/c品系或Swiss Webster品系。129品系的实例包含129P1、129P2、129P3、129X1、129S1(例如,129S1/SV,129S1/Svlm)、129S2、129S4、129S5、129S9/SvEvH、129S6(129/SvEvTac)、129S7、129S8、129T1和129T2。参见例如Festing等人(1999)《哺乳动物基因组(Mamm.Genome)》10(8):836,所述文献出于所有目的通过引用整体并入本文。C57BL品系的实例包含C57BL/A、C57BL/An、C57BL/GrFa、C57BL/Kal_wN、C57BL/6、C57BL/6J、C57BL/6ByJ、C57BL/6NJ、C57BL/10、C57BL/10ScSn、C57BL/10Cr和C57BL/Ola。合适的小鼠还可以来自上述129品系和上述C57BL/6品系的混合(例如,50%129和50%C57BL/6)。同样地,合适的小鼠可以来自上述129品系的混合或上述BL/6品系的混合(例如,129S6(129/SvEvTac)品系)。
相似地,大鼠可以来自任何大鼠品系,包含例如ACI大鼠品系、黑刺鼠(DA)大鼠品系、威斯塔(Wistar)大鼠品系、LEA大鼠品系、斯泼累格多雷(Sprague Dawley,SD)大鼠品系或费舍尔(Fischer)大鼠品系,如费舍尔F344或费舍尔F6。大鼠还可以从源自上述两种或更多种品系的混合品系中获得。例如,合适的大鼠可以来自DA品系或ACI品系。ACI大鼠品系的特征在于具有腹部和足部呈白色的黑刺鼠以及RT1av1单倍型。此类品系可从多种来源获得,包含哈兰实验室(Harlan Laboratories)。黑刺鼠(DA)大鼠品系的特征在于具有刺鼠皮毛和RT1av1单倍型。此类大鼠可从多种来源获得,包含查尔斯河和哈兰实验室(Charles Riverand Harlan Laboratories)。在一些情况下,合适的大鼠可以来自近交大鼠品系。参见例如US 2014/0235933,所述文献出于所有目的通过引用整体并入本文。
还提供了用于优化CRISPR/Cas SAM系统向细胞或真核生物体(例如,动物、非人动物、哺乳动物或非人哺乳动物)的递送或优化体内或离体CRISPR/Cas转录激活活性的多种方法。此类方法可以包含例如:(a)在第一真核生物体(例如,动物、非人动物、哺乳动物或非人哺乳动物)或第一细胞中首次如上所述执行测试CRISPR/Cas SAM系统增加靶基因转录或表达的能力的方法;(b)改变变量并在具有改变的变量的第二真核生物体(例如,动物、非人动物、哺乳动物或非人哺乳动物;即,相同物种)或第二细胞中第二次执行该方法;以及(c)比较步骤(a)中靶基因的表达/转录与步骤(b)中靶基因的表达/转录,并选择导致靶基因最高表达/转录的方法。
替代地或附加地,可以选择导致最高功效、最高一致性或最高特异性的方法。更高功效是指靶基因的更高水平的表达/转录(例如,在特定靶细胞类型内、在特定靶组织内,或在特定靶器官内靶向更高百分比的细胞)。更高一致性是指在靶向多于一种类型的细胞、组织或器官的情况下,不同类型的靶向细胞、组织或器官中靶基因的表达/转录的更一致的增加(例如,靶器官内更多数量的细胞类型的表达/转录增加)。如果靶向特定器官,则更高的一致性也可以指在器官内的所有位置中的表达/转录的更一致的增加。更高的特异性可以指对于所靶向的一个或多个靶基因的更高的特异性、对于所靶向的细胞类型的更高的特异性、对于所靶向的组织类型的更高的特异性或者对于所靶向的器官的更高的特异性。例如,增加的靶特异性是指对其它基因的较少脱靶效应(例如,在非预期的脱靶基因组基因座(例如,相邻基因组基因座)处具有增加的转录的较低百分比的靶向细胞,而不是具有增加的靶基因的转录或除了具有增加的靶基因的转录之外)。同样地,增加的细胞类型、组织或器官类型特异性是指在靶向特定的细胞类型、组织类型或器官类型的情况下,脱靶细胞类型、组织类型或器官类型中的较少效应(即,增加的表达/转录)(例如,当靶向特定器官(例如,肝脏)时,器官或组织中不是预期靶标的细胞中的效应较少(即,增加的表达/转录))。
被改变的变量可以是任何参数。作为一个实例,改变的变量可以是用于将SAM组分(嵌合Cas蛋白、嵌合衔接蛋白和向导RNA)引入细胞或真核生物体(例如,动物、非人动物、哺乳动物或非人哺乳动物)的施用途径。如静脉内、玻璃体内、实质内和鼻内滴注等施用途径的实例在本文其它地方公开。
作为另一个实例,改变的变量可以是所引入的SAM组分的浓度或量。作为另一个实例,改变的变量可以是引入SAM组分的次数或频率(即,引入LNP的次数或频率)。作为另一个实例,改变的变量可以是引入SAM组分的形式。例如,向导RNA可以以DNA或RNA的形式引入,并且嵌合Cas蛋白和嵌合衔接蛋白可以以DNA、RNA或蛋白的形式引入。类似地,向导RNA或嵌合Cas蛋白或嵌合衔接蛋白(或编码此类组分的核酸)可以包含用于稳定性、减少脱靶效应、促进递送等的各种修饰组合。作为另一个实例,改变的变量可以是所引入的向导RNA的序列(例如,引入具有不同序列的不同向导RNA或靶向不同的向导RNA靶序列)。
还提供了使用由本文公开的方法生成的真核细胞或生物体来增加或激活靶基因(特别是其过表达与疾病相关联或者成为疾病的病因的靶基因)的表达或转录的方法。此类具有增加的靶基因表达的真核细胞或生物体(靶基因的过表达与疾病相关联或者成为疾病的病因)可用于例如筛选针对疾病的治疗或预防效果或降低靶基因表达的功效的化合物。此类方法可以包含例如,如本文别处所述,增加或激活真核细胞或生物体中靶基因的转录,将试剂或化合物引入真核细胞或生物体,并且然后评估试剂或化合物的活性(例如,与未用试剂或化合物处理的对照真核细胞或生物体相比,在用试剂或化合物处理的真核细胞或生物体中)。评估可以包含例如评估靶基因的表达(例如,在mRNA水平或在蛋白水平),其中靶基因表达的降低可以指示治疗或预防效果。替代地或附加地,评估可以包含评估与靶基因过表达相关联或由靶基因过表达引起的疾病的一个或多个体征或症状,其中体征或症状的存在的减少或改善可以指示治疗或预防效果.如果筛选的试剂或化合物显示出治疗或预防效果,则可以选择其作为候选治疗或预防试剂或化合物。
还提供了用于在有需要的受试者中增加或激活靶基因的表达或转录的方法,其中靶基因的表达或活性降低与疾病、病症或综合征相关联或者成为疾病、病症或综合征的病因。例如,此类方法可以用于增加或激活靶基因(特别是其低表达与疾病或病症相关联或成为疾病或病症的病因,或者与对疾病或病症或药物的副作用的易感性相关联或成为对疾病或病症或药物的副作用的易感性的病因的靶基因)的表达或转录。例如,靶基因可以是在受试者中低表达或低水平表达的基因,并且低表达或低水平表达与疾病、病症或综合征相关联或者成为疾病、病症或综合征的病因。此类靶基因的转录减少、来自此类靶基因的基因产物量减少,或来自此类靶基因的基因产物的活性降低可能与疾病相关联、可能使疾病恶化,或者可能引起疾病,使得靶基因的转录或表达增加将是有益的。此类基因的一个实例是OTC(Entrez Gene ID 5009)。此类基因的其它实例是HBG1(Entrez Gene ID 3047)和HBG2(Entrez Gene ID 3048)。此类基因的其它实例包括单倍体不足基因,如表2和3中的那些。受试者可以是例如靶基因表达或活性降低的受试者,如患有与单倍体不足相关联的疾病、病症或综合征的受试者。
III.CRISPR/Cas协同激活介体(SAM)系统
本文公开的方法和组合物(例如脂质纳米颗粒)利用规律间隔成簇短回文重复序列(CRISPR)/基于CRISPR相关联(Cas)的协同激活介体(SAM)系统,用于在体内或离体激活靶基因转录的方法,和评估SAM系统或此类系统的组分(例如,向导RNA)在体内或离体激活靶基因组基因座转录的能力。本文所述的SAM系统组分全部在同一脂质纳米颗粒中一起递送并且包含如本文别处所述的嵌合Cas蛋白、嵌合衔接蛋白和向导RNA以激活靶基因的转录。嵌合Cas蛋白(例如,嵌合Cas蛋白,如嵌合Cas9蛋白,如嵌合酿脓链球菌Cas9蛋白、嵌合空肠弯曲杆菌Cas9蛋白或嵌合金黄色葡萄球菌Cas9蛋白(例如,衍生自酿脓链球菌Cas9蛋白、空肠弯曲杆菌Cas9蛋白,或金黄色葡萄球菌Cas9蛋白的嵌合Cas9蛋白)和嵌合衔接蛋白(例如,包含与向导RNA内的衔接结合元件特异性结合的衔接蛋白和一个或多个异源转录激活域)在本文别处更详细地描述。在一个实例中,嵌合Cas蛋白和嵌合衔接蛋白在单个多顺反子或双顺反子核酸(例如,DNA或mRNA)(称为SAM盒或SAM mRNA)中递送。例如,如本文别处更详细描述的那样,编码嵌合Cas蛋白的序列和编码嵌合衔接蛋白的序列可以通过编码2A蛋白的序列链接。在具体实例中,嵌合Cas蛋白(例如,NLS-Cas9-NLS-VP64,其中,例如,5'NLS是单部分的并且3'NLS是双部分的)可以作为多顺反子或双顺反子mRNA(例如,体外转录的mRNA)提供,其也编码嵌合衔接蛋白(例如,MS2(MCP)-NLS-p65-HSF1)。编码嵌合Cas蛋白和嵌合衔接蛋白的核酸可以通过编码2A蛋白的核酸链接。作为一个实例,mRNA从5'到3'可以包含:NLS-Cas9-NLS-VP64-2A-MS2(MCP)-NLS-p65-HSF1。mRNA可以在5'末端被加帽(例如,其中+1核糖核苷酸在核糖的2'O位置被甲基化的帽1结构),可以被聚腺苷酸化(聚(A)尾),并且还可以任选地被修饰为被假尿苷完全取代。
CRISPR/Cas系统包含转录本和涉及Cas基因表达或引导其活性的其它元件。CRISPR/Cas系统可以是例如I型、II型、III型系统或V型系统(例如,V-A亚型或V-B亚型)。在本文所公开的组合物和方法中使用的CRISPR/Cas系统可以是非天然存在的。“非天然存在的”系统包含表明涉及人工的任何事物,如系统的一种或多种组分从其自然存在的状态改变或突变,至少基本上不含所述组分在自然界中与其天然相关的至少一种其它组分或与所述组分不与其天然相关的至少一种其它组分相关。例如,一些CRISPR/Cas系统采用包括非天然一起存在的gRNA和Cas蛋白的非天然存在的CRISPR复合物,采用非天然存在的Cas蛋白,或者采用非天然存在的gRNA。
本文公开的方法和组合物通过使用或测试CRISPR复合物(包括与嵌合Cas蛋白和嵌合衔接蛋白复合的向导RNA(gRNA))在体内诱导靶基因组基因座的转录激活的能力来使用CRISPR/Cas系统。
A.嵌合Cas蛋白
提供了可以结合本文别处公开的向导RNA以激活靶基因的转录的嵌合Cas蛋白。此类嵌合Cas蛋白可以包含:(a)DNA结合域,其是能够与向导RNA形成复合物并与靶序列结合的规律间隔成簇短回文重复序列(CRISPR)相关联(Cas)蛋白或其功能片段或变体;和(b)一个或多个转录激活域或其功能片段或变体。例如,此类融合蛋白可以包含1、2、3、4、5或更多个转录激活域(例如,两个或更多个异源转录激活域或三个或更多个异源转录激活域)。在一个实例中,嵌合Cas蛋白可以包含无催化活性的Cas蛋白(例如,dCas9)和VP64转录激活域或其功能片段或变体。例如,此类嵌合Cas蛋白可以包含以下氨基酸序列、基本上由以下氨基酸序列组成,或由以下氨基酸序列组成:与SEQ ID NO:1所示的dCas9-VP64嵌合Cas蛋白序列至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。然而,还提供了其中转录激活域包含其它转录激活域或其功能片段或变体和/或其中Cas蛋白包含其它Cas蛋白(例如,无催化活性的Cas蛋白)的嵌合Cas蛋白。其它合适的转录激活域的实例在本文别处提供。
转录激活结构域可以位于N端处、C端处或Cas蛋白内的任何位置处。例如,当与酿脓链球菌Cas9蛋白最佳比对时,转录激活域可以连接至酿脓链球菌Cas9蛋白的Rec1域、Rec2域、HNH域或PI域,或直系同源Cas9蛋白或同源或直系同源Cas蛋白的任何对应区域。例如,转录激活域可以连接到位置553的Rec1域、位置575的Rec1域、位置175-306内的任何位置的Rec2域或替换位置175-306内的部分或整个区域、位置715-901内的任何位置的HNH域或替换位置715-901内的部分或整个区域,或酿脓链球菌Cas9蛋白的位置1153的PI域。参见例如WO 2016/049258,该文献以全文引用的方式并入本文用于所有目的。如本文别处所述,转录激活域可以在一侧或两侧侧接一个或多个接头。
嵌合Cas蛋白也可以与附加的异源多肽可操作地链接或融合。融合或链接的异源多肽可以位于N端、C端或嵌合Cas蛋白内部的任何位置。例如,嵌合Cas蛋白还可以包含核定位信号。合适的核定位信号和对Cas蛋白的其它修饰的实例在本文别处更详细地描述。
嵌合Cas蛋白可以以任何形式提供。例如,嵌合Cas蛋白可以以蛋白的形式提供,如与gRNA复合的嵌合Cas蛋白。替代地,可以以编码嵌合Cas蛋白的核酸的形式提供嵌合Cas蛋白,如RNA(例如,信使RNA(mRNA))或DNA。在具体实例中,嵌合Cas蛋白可以作为mRNA(例如,体外转录的mRNA)提供,如也编码嵌合衔接蛋白的多顺反子或双顺反子mRNA。任选地,可以对编码嵌合Cas蛋白的核酸进行密码子优化以在特定细胞或生物体中有效翻译成蛋白。例如,与天然存在的多核苷酸序列相比,可以修饰编码嵌合Cas蛋白的核酸以取代在真核细胞、非人真核细胞、动物细胞、非人动物细胞、哺乳动物细胞、非人哺乳动物细胞、人细胞、非人细胞、啮齿动物细胞、小鼠细胞、大鼠细胞或任何其它感兴趣的宿主细胞中具有更高使用频率的密码子。当编码嵌合Cas蛋白的核酸被引入到细胞中时,嵌合Cas蛋白可以在细胞中进行瞬时、条件性或组成性表达。
可以修饰作为mRNA提供的嵌合Cas蛋白以提高稳定性和/或免疫原性特性。可以对mRNA内的一种或多种核苷进行修饰。对mRNA核碱基的化学修饰的实例包括假尿苷、1-甲基-假尿苷和5-甲基-胞苷。编码嵌合Cas蛋白的mRNA也可以被加帽。帽可以是,例如,其中+1核糖核苷酸在核糖的2'O位置被甲基化的帽1结构。例如,加帽可以在体内产生优异的活性(例如,通过模拟天然帽),可以产生减少对宿主先天免疫系统的刺激的天然结构(例如,可以减少先天免疫系统中的模式识别受体的激活)。编码嵌合Cas蛋白的mRNA也可以被聚腺苷酸化(以包含聚(A)尾)。编码嵌合Cas蛋白的mRNA也可以被修饰以包括假尿苷(例如,可以被假尿苷完全取代)。例如,可以使用含有N1-甲基假尿苷的加帽和聚腺苷酸化的嵌合Cas mRNA。同样地,嵌合Cas mRNA可以通过使用同义密码子消耗尿苷来修饰。其它可能的修饰在本文别处更详细地描述。
可以修饰作为mRNA提供的嵌合Cas蛋白以提高稳定性和/或免疫原性特性。可以对mRNA内的一种或多种核苷进行修饰。对mRNA核碱基的化学修饰的实例包括假尿苷、1-甲基-假尿苷和5-甲基-胞苷。编码嵌合Cas蛋白的mRNA也可以被加帽。帽可以是,例如,其中+1核糖核苷酸在核糖的2'O位置被甲基化的帽1结构。例如,加帽可以在体内产生优异的活性(例如,通过模拟天然帽),可以产生减少对宿主先天免疫系统的刺激的天然结构(例如,可以减少先天免疫系统中的模式识别受体的激活)。编码嵌合Cas蛋白的mRNA也可以被聚腺苷酸化(以包含聚(A)尾)。编码嵌合Cas蛋白的mRNA也可以被修饰以包括假尿苷(例如,可以被假尿苷完全取代)。例如,可以使用含有N1-甲基假尿苷的加帽和聚腺苷酸化的嵌合Cas mRNA。同样地,嵌合Cas mRNA可以通过使用同义密码子消耗尿苷来修饰。
嵌合Cas mRNA可以在至少一个、多个或所有尿苷位置包含经修饰的尿苷。经修饰的尿苷可以是在5位置被修饰(例如,用卤素、甲基或乙基)的尿苷。经修饰的尿苷可以是在1位置被修饰(例如,用卤素、甲基或乙基)的假尿苷。经修饰的尿苷可以是例如假尿苷、N1-甲基-假尿苷、5-甲氧基尿苷、5-碘尿苷或其组合。在一些实例中,经修饰的尿苷是5-甲氧基尿苷。在一些实例中,经修饰的尿苷是5-碘尿苷。在一些实例中,经修饰的尿苷是假尿苷。在一些实例中,经修饰的尿苷是N1-甲基-假尿苷。在一些实例中,经修饰的尿苷是假尿苷和N1-甲基-假尿苷的组合。在一些实例中,经修饰的尿苷是假尿苷和5-甲氧基尿苷的组合。在一些实例中,经修饰的尿苷是N1-甲基假尿苷和5-甲氧基尿苷的组合。在一些实例中,经修饰的尿苷是5-碘尿苷和N1-甲基-假尿苷的组合。在一些实例中,经修饰的尿苷是假尿苷和5-碘尿苷的组合。在一些实例中,经修饰的尿苷是5-碘尿苷和5-甲氧基尿苷的组合。
本文公开的嵌合Cas mRNA还可以包含5'帽,如Cap0、Cap1或Cap2。5'帽通常是通过5'-三磷酸酯链接到mRNA的5'至3'链的第一核苷酸(即,第一近帽核苷酸)的5'位置的7-甲基鸟嘌呤核糖核苷酸(其可以被进一步修饰,例如,关于ARCA)。在Cap0中,mRNA的第一和第二近帽核苷酸的核糖均包含2'-羟基。在Cap1中,mRNA的第一和第二转录核苷酸的核糖分别包含2'-甲氧基和2'-羟基。在Cap2中,mRNA的第一和第二近帽核苷酸的核糖均包含2'-甲氧基。参见例如Katibah等人(2014)《美国科学院院报(Proc.Natl.Acad.Sci.U.S.A.)》111(33):12025-30和Abbas等人(2017)《美国科学院院报》114(11):E2106-E2115,它们中的每一个以全文引用的方式并入本文用于所有目的。大多数内源性高等真核mRNA,包括哺乳动物mRNA,如人mRNA,均包含Cap1或Cap2。Cap0和其它不同于Cap1和Cap2的帽结构可能在哺乳动物(如人类)中具有免疫原性,因为先天免疫系统的组分(如IFIT-1和IFIT-5)将其识别为非自身,这可能导致细胞因子升高水平(包括I型干扰素)。先天免疫系统的组分如IFIT-1和IFIT-5也可能与eIF4E竞争mRNA与Cap1或Cap2以外的帽的结合,从而潜在地抑制mRNA的翻译。
可以共转录地包括帽。例如,ARCA(抗反向帽类似物;赛默飞世尔科技公司(ThermoFisher Scientific)商品目录号第AM8045号)是包含与鸟嘌呤核糖核苷酸的5'位置链接的7-甲基鸟嘌呤3'-甲氧基-5'-三磷酸酯的帽类似物,其可在体外在起始时掺入转录物中。ARCA产生Cap0帽,其中第一近帽核苷酸的2'位置是羟基。参见例如Stepinski等人,(2001)《RNA》7:1486-1495,该文献以全文引用的方式并入本文用于所有目的。
CleanCapTM AG(m7G(5')ppp(5')(2'OMeA)pG;TriLink生物技术公司商品目录号第N-7113号)或CleanCapTM GG(m7G(5')ppp(5')(2'OMeG)pG;TriLink生物技术公司商品目录号第N-7133号)可用于共转录地提供Cap1结构。3'-O-甲基化版本的CleanCapTM AG和CleanCapTM GG也可从TriLink生物技术公司获得,商品目录号分别为第N-7413和第N-7433号。
替代地,可以在转录后将帽添加到RNA。例如,牛痘加帽酶是可商购的(新英格兰生物实验室(New England Biolabs)商品目录号第M2080S号)并具有由其D1亚基提供的RNA三磷酸酶和鸟苷酸转移酶活性,以及由其D12亚基提供的鸟嘌呤甲基转移酶活性。因此,在S-腺苷甲硫氨酸和GTP的存在下,它可以将7-甲基鸟嘌呤添加到RNA中,从而产生Cap0。参见例如Guo和Moss(1990)《美国科学院院报》87:4023-4027,和Mao和Shuman(1994)《生物化学杂志》269:24472-24479,它们中的每一个以全文引用的方式并入本文用于所有目的。
嵌合Cas mRNA还可以包含聚腺苷酸化(聚A)尾。例如,聚A尾可以包含至少20个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个或至少100个腺嘌呤,以及任选地多达300个腺嘌呤。例如,聚A尾可以包含95、96、97、98、99或100个腺嘌呤核苷酸。
编码嵌合Cas蛋白的核酸可用于稳定整合到细胞的基因组中并可操作地链接到细胞中有活性的启动子。替代地,编码嵌合Cas蛋白的核酸可以与表达构建体中的启动子可操作地链接。表达构建体包括能够引导基因或其它感兴趣的核酸序列(例如,嵌合Cas基因)的表达并且可以将此类感兴趣的核酸序列转移到靶细胞的任何核酸构建体。例如,编码嵌合Cas蛋白的核酸可以在包含编码gRNA的DNA的载体中。可替代地,其可以在与包括对gRNA进行编码的DNA的载体分离的载体或质粒中。可以用于表达构建体的启动子包括在例如真核细胞、非人真核细胞、动物细胞、非人动物细胞、哺乳动物细胞、非人哺乳动物细胞、人细胞、非人细胞、啮齿动物细胞、小鼠细胞、多能细胞、胚胎干(ES)细胞、成体干细胞、发育受限的祖细胞、诱导的多能干(iPS)细胞或单细胞期胚胎中的一个或多个中具有活性的启动子。此类启动子可以是例如条件启动子、诱导型启动子、组成型启动子或组织特异性启动子。任选地,启动子可以是双向启动子,其在一个方向上驱动嵌合Cas蛋白的表达并且在另一个方向上驱动向导RNA的表达。此类双向启动子可以由以下各项组成:(1)含有3个外部控制元件:远侧序列元件(DSE)、近侧序列元件(PSE)和TATA框的完整的、常规的、单向的Pol III启动子;(2)包括在相反定向上与DSE的5'末端融合的PSE和TATA盒的第二基本Pol III启动子。例如,在H1启动子中,DSE邻近PSE和TATA框,并且可以通过产生杂合启动子使启动子双向化,其中通过源自U6启动子的附加PSE和TATA盒来控制反向转录。参见例如US 2016/0074535,所述文献出于所有目的通过引用整体并入本文。使用双向启动子同时表达编码嵌合Cas蛋白和向导RNA的基因允许生成紧凑表达盒以促进递送。
(1)Cas蛋白
Cas蛋白通常包括可以与向导RNA相互作用的至少一个RNA识别或结合结构域。Cas蛋白的功能片段或功能变体是保留与向导RNA形成复合物并结合靶基因中的靶序列(并且例如激活靶基因的转录)的能力的功能片段或功能变体。
除了如本文别处所述的转录激活结构域之外,Cas蛋白还可以包含核酸酶域(例如,DNase域或RNase域)、DNA结合域、解旋酶域、蛋白-蛋白相互作用域、二聚化域和其它域。一些此类结构域(例如,DNase结构域)可以来自天然Cas蛋白。可以添加其它此类结构域以制备经修饰的Cas蛋白。核酸酶结构域对核酸切割具有催化活性,所述核酸切割包含核酸分子的共价键的断裂。切割可以产生平末端或交错末端,并且其可以是单链或双链的。例如,野生型Cas9蛋白通常将产生钝性切割产物。替代地,野生型Cpf1蛋白(例如,FnCpf1)可以产生具有5-核苷酸5'突出端的切割产物,其中切割发生在非靶向链上的PAM序列的第18个碱基对之后和靶向链上的第23个碱基对之后。Cas蛋白可以具有完整的切割活性以在靶基因组基因座处产生双链断裂(例如,具有平末端的双链断裂),或者其可以是在靶基因组基因座处产生单链断裂的切口酶。在一个实例中,本文公开的嵌合Cas蛋白的Cas蛋白部分已被修饰以具有降低的核酸酶活性(例如,与野生型Cas蛋白相比,核酸酶活性减少至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)或基本上缺乏所有核酸酶活性(即,与野生型Cas蛋白相比,核酸酶活性减少至少90%、95%、97%,98%、99%或100%,或具有不超过约0%、1%、2%、3%、5%或10%的野生型Cas蛋白的核酸酶活性)。无核酸酶活性的Cas蛋白是在其催化(即,核酸酶)域中具有已知为失活性突变的突变(例如,在Cpf1蛋白中的RuvC样内切核酸酶域中的失活性突变,或在Cas9中的HNH内切核酸酶域和ruvc样内切核酸酶域两者中的失活性突变)的Cas蛋白,或与野生型Cas蛋白相比具有减少至少约97%、98%、99%或100%的核酸酶活性的Cas蛋白。下文公开了降低或基本上消除核酸酶活性的不同Cas蛋白突变的实例。
Cas蛋白的实例包含Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5e(CasD)、Cas6、Cas6e、Cas6f、Cas7、Cas8a1、Cas8a2、Cas8b、Cas8c、Cas9(Csn1或Csx12)、Cas10、Cas10d、CasF、CasG、CasH、Csy1、Csy2、Csy3、Cse1(CasA)、Cse2(CasB)、Cse3(CasE)、Cse4(CasC)、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4和Cu1966以及其同源物或经修饰的版本。
示范性Cas蛋白是Cas9蛋白或衍生自Cas9蛋白的蛋白。Cas9蛋白来自II型CRISPR/Cas系统,并且通常共享具有保守结构的四个关键基序。基序1、2和4是类似RuvC的基序,并且基序3是HNH基序。示例性Cas9蛋白来自酿脓链球菌(Streptococcus pyogenes)、嗜热链球菌(Streptococcus thermophilus)、链球菌(Streptococcus sp.)、金黄色葡萄球菌(Staphylococcus aureus)、达松维尔拟诺卡氏菌(Nocardiopsisdassonvillei)、始旋链霉菌(Streptomyces pristinaespiralis)、绿产色链霉菌(Streptomycesviridochromogenes)、绿产色链霉菌(Streptomyces viridochromogenes)、链孢囊菌(Streptosporangiumroseum)、链孢囊菌(Streptosporangiumroseum)、酸热脂环酸杆菌(Alicyclobacillus acidocaldarius)、假蕈状芽孢杆菌(Bacillus pseudomycoides)、硒化芽孢杆菌(Bacillus selenitireducens)、西伯利亚微小杆菌(Exiguobacteriumsibiricum)、德氏乳酸杆菌(Lactobacillus delbrueckii)、唾液乳杆菌(Lactobacillus salivarius)、海洋微颤菌(Microscilla marina)、伯克氏菌目细菌(Burkholderiales bacterium)、食萘极地单胞菌(Polaromonasnaphthalenivorans)、极地单胞菌(Polaromonas sp.)、瓦氏鳄球藻(Crocosphaerawatsonii)、蓝丝菌(Cyanothecesp.)、铜绿微囊藻(Microcystis aeruginosa)、聚球藻(Synechococcus sp.)、阿拉伯糖醋酸杆菌(Acetohalobiumarabaticum)、德根斯产氨菌(Ammonifexdegensii)、热解纤维素菌(Caldicelulosiruptorbecscii)、候选金矿菌(CandidatusDesulforudis)、肉毒杆菌(Clostridium botulinum)、艰难梭菌(Clostridium difficile)、大芬戈尔德菌(Finegoldia magna)、嗜热盐碱厌氧菌(Natranaerobius thermophilus)、丙酸降解菌(Pelotomaculumthermopropionicum)、喜温嗜酸硫杆菌(Acidithiobacilluscaldus)、嗜酸氧化亚铁硫杆菌(Acidithiobacillusferrooxidans)、异色变色菌(Allochromatiumvinosum)、海杆菌(Marinobactersp.)、嗜盐亚硝化球菌(Nitrosococcushalophilus)、沃森亚硝化球菌(Nitrosococcuswatsoni)、嗜盐假交替单胞菌(Pseudoalteromonashaloplanktis)、雷氏纤线杆菌(Ktedonobacterracemifer)、伊芙氏甲烷盐菌(Methanohalobiumevestigatum)、鱼腥藻(Anabaenavariabilis)、泡沫节球藻(Nodulariaspumigena)、念珠藻(Nostoc sp.)、节旋藻(Arthrospira maxima)、盘状节旋藻(Arthrospira platensis)、节旋藻(Arthrospira sp.)、鞘丝藻(Lyngbya sp.)、原型微鞘藻(Microcoleuschthonoplastes)、颤蓝细菌(Oscillatoria sp.)、运动石袍菌(Petrotogamobilis)、非洲栖热腔菌(Thermosipho africanus)、深海阿卡罗虎尾草(Acaryochloris marina)、脑膜炎奈瑟氏菌(Neisseria meningitidis)或空肠弯曲杆菌(Campylobacter jejuni)。Cas9家族成员的另外实例在WO 2014/131833中进行描述,所述文献出于所有目的通过引用整体并入本文。来自酿脓链球菌的Cas9(SpCas9)(指定SwissProt登录号Q99ZW2)是示例性Cas9蛋白。来自金黄色葡萄球菌的Cas9(SaCas9)(指定UniProt登录号J7RUA5)是另一示例性Cas9蛋白。来自空肠弯曲杆菌的Cas9(CjCas9)(指定UniProt登录号Q0P897)是另一种示例性Cas9蛋白。参见例如,Kim等人(2017),《自然通讯(Nat.Commun.)》8:14500,所述文献出于所有目的通过引用整体并入本文。SaCas9小于SpCas9,并且CjCas9小于SaCas9和SpCas9两者。来自脑膜炎奈瑟氏球菌的Cas9(Nme2Cas9)是另一种示例性Cas9蛋白。参见例如Edraki等人,(2019)《分子细胞(Mol.Cell)》73(4):714-726,该文献以全文引用的方式并入本文用于所有目的。来自嗜热链球菌的Cas9蛋白(例如,由CRISPR1基因座编码的嗜热链球菌LMD-9Cas9(St1Cas9)或来自CRISPR3基因座的嗜热链球菌Cas9(St3Cas9))是其它示例性Cas9蛋白。来自新凶手弗朗西丝菌(Francisellanovicida)(FnCas9)的Cas9或识别置换性PAM(E1369R/E1449H/R1556A取代)的RHA新凶手弗朗西斯菌Cas9变体是其它示例性Cas9蛋白。这些和其它示例性Cas9蛋白例如在Cebrian-Serrano和Davies(2017),《哺乳动物基因组(Mamm.Genome)》28(7):247-261中综述,所述文献出于所有目的通过引用整体并入本文。在WO 2013/176772、WO 2014/065596、WO 2016/106121和WO 2019/067910中提供了Cas9编码序列、Cas9 mRNA和Cas9蛋白序列的实例,它们中的每一个以全文引用的方式并入本文用于所有目的。ORF和Cas9氨基酸序列的具体实例在WO 2019/067910第段的表30中提供,并且Cas9 mRNA和ORF的具体实例在WO 2019/067910的第至段中提供。
Cas蛋白的另一个实例是Cpf1(来自普雷沃氏菌(Prevotella)和弗朗西斯氏菌(Francisella)1的CRISPR)蛋白。Cpf1是含有与Cas9的对应结构域同源的RuvC样核酸酶结构域以及与特征性富含精氨酸的Cas9簇的对应物的大蛋白质(约1300个氨基酸)。然而,Cpf1缺乏Cas9蛋白中存在的HNH核酸酶结构域,并且RuvC样结构域在Cpf1序列中是连续的,而Cas9则相反,其含有包含HNH结构域的长插入物。参见例如,Zetsche等人(2015),《细胞》163(3):759-771,所述文献出于所有目的通过引用整体并入本文。示例性Cpf1蛋白来自土拉弗朗西斯菌(Francisellatularensis)1、土拉弗朗西丝菌新凶手亚种(Francisellatularensis subsp.novicida)、易北河普雷沃氏菌(Prevotellaalbensis)、毛螺菌科细菌(Lachnospiraceae bacterium)MC20171、解蛋白丁酸弧菌(Butyrivibrioproteoclasticus)、异域菌门细菌(Peregrinibacteria bacterium)GW2011_GWA2_33_10、俭菌超门细菌(Parcubacteria bacterium)GW2011_GWC2_44_17、史密斯氏菌属(Smithella sp.)SCADC、氨基酸球菌属(Acidaminococcussp.)BV3L6、毛螺菌科细菌(Lachnospiraceae bacterium)MA2020、候选白蚁甲烷支原体(CandidatusMethanoplasmatermitum)、挑剔真杆菌(Eubacterium eligens)、牛眼莫拉氏菌(Moraxella bovoculi)237、稻田氏钩端螺旋体(Leptospira inadai)、毛螺菌科细菌(Lachnospiraceae bacterium)ND2006、狗口腔卟啉单胞菌(Porphyromonascrevioricanis)3、解糖胨普雷沃氏菌(Prevotelladisiens)和猕猴卟啉单胞菌(Porphyromonasmacacae)。来自新凶手弗朗西丝氏菌(Francisellanovicida)U112的Cpf1(FnCpf1;指定UniProt登录号A0Q7Q2)是示例性Cpf1蛋白。
Cas蛋白可以是野生型蛋白(即,自然界中存在的那些蛋白)、经修饰的Cas蛋白(即,Cas蛋白变体)或野生型或经修饰的Cas蛋白的片段。就野生型或经修饰的Cas蛋白的催化活性而言,Cas蛋白也可以是活性变体或片段。就催化活性而言,活性变体或片段可以包括与野生型或经修饰的Cas蛋白或其部分具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,其中活性变体保留在期望的切割位点处切割的能力,并因此保留切口诱导或双链断裂诱导活性。对切口诱导或双链断裂诱导活性的测定是已知的,并且通常测量Cas蛋白对含有切割位点的DNA底物的总体活性和特异性。
经修饰的Cas蛋白的一个实例是经修饰的SpCas9-HF1蛋白,其是具有设计成减少非特异性DNA接触的改变(N497A/R661A/Q695A/Q926A)的酿脓链球菌Cas9的高保真变体。参见例如,Kleinstiver等人(2016),《自然(Nature)》529(7587):490-495,所述文献出于所有目的通过引用整体并入本文。经修饰Cas蛋白的另一个实例是被设计成减少脱靶效应的经修饰的eSpCas9变体(K848A/K1003A/R1060A)。参见例如,Slaymaker等人(2016),《科学(Science)》351(6268):84-88,所述文献出于所有目的通过引用整体并入本文。其它SpCas9变体包含K855A和K810A/K1003A/R1060A。这些和其它经修饰的Cas蛋白例如在Cebrian-Serrano和Davies(2017),《哺乳动物Genome)》28(7):247-261中综述,所述文献出于所有目的通过引用整体并入本文。另一种经修饰Cas9蛋白的实例是xCas9,其是可以识别扩大范围的PAM序列的SpCas9变体。参见例如Hu等人(2018),《自然(Nature)》556:57-63,所述文献出于所有目的通过引用整体并入本文。
可以修饰Cas蛋白以增加或减少核酸结合亲和力、核酸结合特异性和酶活性中的一种或多种。也可以修饰Cas蛋白以改变蛋白质的任何其它活性或性质,如稳定性。例如,Cas蛋白的一个或多个核酸酶结构域可以是经修饰的、缺失的或失活的,或者可以截断Cas蛋白以去除对蛋白质功能不必要的结构域或优化(例如,增强或减少)Cas蛋白的活性或性质。
Cas蛋白可以包括至少一个核酸酶结构域,如DNase结构域。例如,野生型Cpf1蛋白通常包括切割靶DNA的两条链的RuvC样结构域,其可能呈二聚体构型。Cas蛋白还可以包括至少两个核酸酶结构域,如DNase结构域。例如,野生型Cas9蛋白通常包括RuvC样核酸酶结构域和HNH样核酸酶结构域。RuvC和HNH结构域可以各自切割不同的双链DNA链,以在DNA中形成双链断裂。参见例如Jinek等人(2012)《科学(Science)》337(6096):816-821,所述文献出于所有目的通过引用整体并入本文。
核酸酶结构域中的一个或多个或所有核酸酶结构域可以缺失或突变,使得其不再具有功能或具有降低的核酸酶活性。例如,如果Cas9蛋白中的核酸酶结构域之一进行缺失或突变,则所得Cas9蛋白可以被称为切口酶,并且可以在双链靶DNA内产生单链断裂,但不会产生双链断裂(即,其可以切割互补链或非互补链,但不能同时切割两者)。如果两个核酸酶结构域都缺失或突变,则所得Cas蛋白(例如,Cas9)切割双链DNA(例如,核酸酶无效或无核酸酶活性的Cas蛋白,或催化上死亡的Cas蛋白(dCas))的两条链的能力将降低。将Cas9转化为切口酶的突变的实例是来自酿脓链球菌的Cas9的RuvC结构域中的D10A(在Cas9的位置10处天冬氨酸转化为丙氨酸)突变。同样地,来自酿脓链球菌的Cas9的HNH结构域中的H939A(在氨基酸位置839处组氨酸到丙氨酸)、H840A(在氨基酸位置840处组氨酸到丙氨酸)或N863A(在氨基酸位置N863处天冬酰胺到丙氨酸)可以将Cas9转化为切口酶。将Cas9转化为切口酶的突变的其它实例包含来自嗜热链球菌的Cas9的对应突变。参见例如Sapranauskas等人(2011)《核酸研究》39(21):9275-9282和WO 2013/141680,它们中的每一个以全文引用的方式并入本文用于所有目的。可以使用如定点诱变、PCR介导的诱变或总基因合成等方法产生此类突变。产生切口酶的其它突变实例可以在例如WO 2013/176772和WO2013/142578中找到,所述文献中的每个文献出于所有目的通过引用整体并入本文。如果Cas蛋白中的所有核酸酶结构域都缺失或突变(例如,Cas9蛋白中的两个核酸酶结构域都缺失或突变),则所得Cas蛋白(例如,Cas9)切割双链DNA(例如,核酸酶无效或无核酸酶活性的Cas蛋白)的两条链的能力将降低。一个具体实例是D10A/H840A酿脓链球菌Cas9双突变体或者当与酿脓链球菌Cas9最佳比对时来自另一物种的Cas9中的对应双突变体。另一个具体实例是D10A/N863A酿脓链球菌Cas9双突变体或者当与酿脓链球菌Cas9最佳比对时来自另一物种的Cas9中的对应双突变体。无催化活性的Cas9蛋白(dCas9)的一个实例包含以下氨基酸序列、基本上由以下氨基酸序列组成,或由以下氨基酸序列组成:与SEQ ID NO:2所示的dCas9蛋白序列至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。
xCas9的催化结构域中的失活突变的实例与上述针对SpCas9的突变相同。金黄色葡萄球菌Cas9蛋白催化结构域中的失活突变的实例也是已知的。例如,金黄色葡萄球菌Cas9酶(SaCas9)可以包括用于产生无核酸酶活性的Cas蛋白的位置N580处的取代(例如,N580A取代)和位置D10处的取代(例如,D10A取代)。参见例如WO 2016/106236,所述文献出于所有目的通过引用整体并入本文。Nme2Cas9的催化结构域中的失活突变的实例也是已知的(例如,D16A和H588A的组合)。St1Cas9的催化结构域中失活突变的实例也是已知的(例如,D9A、D598A、H599A和N622A的组合)。St3Cas9的催化结构域中的失活突变的实例也是已知的(例如,D10A和N870A的组合)。CjCas9催化结构域中的失活突变的实例也是已知的(例如,D8A和H559A的组合)。FnCas9和RHA FnCas9的催化结构域中的失活突变的实例也是已知的(例如,N995A)。
Cpf1蛋白的催化结构域中的失活突变的实例也是已知的。参考来自新凶手弗朗西丝氏菌U112(FnCpf1)、氨基酸球菌BV3L6(AsCpf1)、毛螺科菌ND2006(LbCpf1)和牛眼莫拉氏菌237(MbCpf1 Cpf1)的Cpf1蛋白,此类突变可以包含AsCpf1的位置908、993或1263处或Cpf1直系同源物中的对应位置处,或LbCpf1的位置832、925、947或1180或Cpf1直系同源物中的对应位置处的突变。此类突变可以包含例如AsCpf1的突变D908A、E993A和D1263A或Cpf1直系同源物中的对应突变或LbCpf1的D832A、E925A、D947A和D1180A或Cpf1直系同源物中的对应突变中的一种或多种突变。参见例如US 2016/0208243,所述文献出于所有目的通过引用整体并入本文。
Cas蛋白也可以作为融合蛋白与异源多肽可操作地连接。例如,除了转录激活域之外,Cas蛋白也可以与切割域或表观遗传修饰域融合。参见WO 2014/089290,所述文献出于所有目的通过引用整体并入本文。Cas蛋白也可以与异源多肽融合,提供增加或减少的稳定性。融合结构域或异源多肽可以定位于N端、C端或Cas蛋白内部。
举例来说,Cas蛋白可以与提供亚细胞定位的一种或多种异源多肽融合。此类异源多肽可以包含例如一种或多种核定位信号(NLS),如用于靶向细胞核的单组分SV40 NLS和/或双组分α-输入蛋白NLS、用于靶向线粒体的线粒体定位信号、ER保留信号等。参见例如Lange等人(2007)《生物化学杂志(J.Biol.Chem.)》282(8):5101-5105,所述文献出于所有目的通过引用整体并入本文。此类亚细胞定位信号可以定位于N端、C端或Cas蛋白内的任何位置。NLS可以包含碱性氨基酸的段,并且可以是单部分序列或双部分序列。任选地,Cas蛋白可以包含两个或更多个NLS,包括N端处的NLS(例如,α-输入蛋白NLS或单部分NLS)和C端处的NLS(例如,SV40 NLS或双部分NLS)。Cas蛋白还可以包括N端处的两个或更多个NLS和/或C端处的两个或更多个NLS。
在一个实例中,Cas蛋白可以与1至10个NLS、1至5个NLS或一个NLS融合。在使用一个NLS的情况下,NLS可以链接在Cas序列的N端或C端处。它也可以插入到Cas序列的内部。在其它实例中,Cas蛋白可以与多于一个NLS融合。例如,Cas蛋白可以与2、3、4或5个NLS融合或可以与两个NLS融合。在某些情况下,两个NLS可以相同(例如,两个SV40 NLS)或不同。例如,Cas蛋白可以融合到链接在羧基端的两个SV40 NLS序列。在另一个实例中,Cas蛋白可以与两个NLS融合,一个链接在N端并且一个链接在C端。在另一个实例中,Cas蛋白可以与3个NLS融合。在另一个实例中,Cas蛋白可以不与NLS融合。在一些实例中,NLS可以是单部分序列,例如,SV40 NLS、PKKKRKV(SEQ ID NO:58)或PKKKRRV(SEQ ID NO:59)。在一些实例中,NLS可以是双部分序列,如核质蛋白的NLS,KRPAATKKAGQAKKKK(SEQ ID NO:60)。在具体实例中,单个PKKKRKV(SEQ ID NO:58)NLS可以链接在RNA导向的DNA结合剂的C端。一个或多个接头任选地包括在融合位点处。
Cas蛋白也可以与细胞穿透性结构域或蛋白质转导结构域可操作地连接。例如,细胞穿透性结构域可以源自HIV-1TAT蛋白、来自人乙型肝炎病毒的TLM细胞穿透基序、MPG、Pep-1、VP22、来自单纯疱疹病毒的细胞穿透性肽或聚精氨酸肽序列。参见例如WO2014/089290和WO 2013/176772,所述文献中的每个文献出于所有目的通过引用整体并入本文。细胞穿透性结构域可以定位于N端、C端或Cas蛋白内的任何位置。
Cas蛋白也可以与异源多肽可操作地连接以便于进行追踪或纯化,如荧光蛋白、纯化标签或表位标签。荧光蛋白的实例包含绿色荧光蛋白(例如,GFP、GFP-2、tagGFP、turboGFP、eGFP、祖母绿、Azami绿、单体Azami绿、CopGFP、AceGFP、ZsGreenl)、黄色荧光蛋白(例如,YFP、eYFP、柠檬黄、Venus、YPet、PhiYFP、ZsYellowl)、蓝色荧光蛋白(例如,eBFP、eBFP2、石青、mKalamal、GFPuv、天蓝色、T-天蓝色(T-sapphire))、青色荧光蛋白(例如,eCFP、蔚蓝色(Cerulean)、CyPet、AmCyanl、Midoriishi-青色)、红色荧光蛋白(例如,mKate、mKate2、mPlum、DsRed单体、mCherry、mRFP1、DsRed-表达、DsRed2、DsRed-单体、HcRed-Tandem、HcRedl、AsRed2、eqFP611、mRaspberry、mStrawberry、Jred)、橙色荧光蛋白(例如,mOrange、mKO、Kusabira-橙色、单体Kusabira-橙色、mTangerine、tdTomato)和任何其它合适的荧光蛋白。标签的实例包含谷胱甘肽-S-转移酶(GST)、几丁质结合蛋白(CBP)、麦芽糖结合蛋白、硫氧还蛋白(TRX)、多(NANP)、串联亲和纯化(TAP)标签、myc、AcV5、AU1、AU5、E、ECS、E2、FLAG、血球凝集素(HA)、nus、Softag1、Softag3、Strep、SBP、Glu-Glu、HSV、KT3、S、S1、T7、V5、VSV-G、组氨酸(His)、生物素羧基载体蛋白(BCCP)和钙调蛋白。
Cas蛋白还可以与经标记的核酸栓系。此类拴系(即,物理链接)可以通过共价相互作用或非共价相互作用来实现,并且拴系可以是直接的(例如,通过直接融合或化学缀合,这可以通过蛋白上的半胱氨酸或赖氨酸残基的修饰或内含子修饰来实现),或者可以通过如链霉亲和素或适体等一个或多个中间接头或衔接子分子来实现。参见例如,Pierce等人(2005),《药物化学短评(Mini Rev.Med.Chem.)》5(1):41-55;Duckworth等人(2007),《德国应用化学会刊(Angew.Chem.Int.Ed.Engl.)》46(46):8819-8822;Schaeffer和Dixon(2009),《澳大利亚化学杂志(Australian J.Chem.)》62(10):1328-1332;Goodman等人(2009),《生物化学(Chembiochem.)》10(9):1551-1557;以及Khatwani等人(2012)《生物有机化学与医药化学(Bioorg.Med.Chem.)》20(14):4532-4539,所述文献中的每个文献出于所有目的通过引用整体并入本文。用于合成蛋白质-核酸缀合物的非共价策略包含生物素-链霉亲和素和镍-组氨酸方法。可以通过使用多种化学反应连接适当功能化的核酸和蛋白质来合成共价蛋白质-核酸缀合物。这些化学反应中的一些化学反应涉及将寡核苷酸直接附着到蛋白质表面上的氨基酸残基(例如,赖氨酸胺或半胱氨酸硫醇),而其它更复杂的方案需要蛋白质的翻译后修饰或者催化或反应蛋白结构域的参与。用于蛋白质与核酸共价附着的方法可以包含例如寡核苷酸与蛋白质赖氨酸或半胱氨酸残基的化学交联、表达的蛋白质连接、化学酶法和光适体的使用。经标记的核酸可以与Cas蛋白内的C端、N端或内部区域栓系。在一个实例中,经标记的核酸与Cas蛋白的C端或N端栓系。同样地,Cas蛋白可以与经标记的核酸内的5'末端、3'末端或内部区域栓系。也就是说,经标记的核酸可以以任何取向和极性拴系。例如,Cas蛋白可以与经标记的核酸的5'末端或3'末端栓系。
(2)转录激活域
本文公开的嵌合Cas蛋白可以包含一个或多个转录激活域。转录激活域包括天然存在的转录因子区域,这些区域与DNA结合域(例如,与向导RNA复合的无催化活性的Cas蛋白)结合,可以通过直接接触转录机器或通过其它蛋白(如共激活子)来激活来自启动子的转录。转录激活域还包括转录因子的此类区域的功能片段或变体,以及衍生自天然的、天然存在的转录激活域或人工产生或合成以激活靶基因转录的工程化转录激活域。功能片段是当可操作地链接到合适的DNA结合域时能够激活靶基因转录的片段。功能变体是当可操作地链接到合适的DNA结合域时能够激活靶基因转录的变体。
用于本文公开的嵌合Cas蛋白的特定转录激活域包含VP64转录激活域或其功能片段或变体。VP64是来自单纯疱疹VP16激活域的最小激活域的四聚体重复。例如,转录激活域可以包含以下氨基酸序列、基本上由以下氨基酸序列组成,或由以下氨基酸序列组成:与SEQ ID NO:3所示的VP64转录激活域蛋白序列至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。
转录激活域的其它实例包括单纯疱疹病毒VP16反式激活域、VP64(单纯疱疹病毒VP16的四重串联重复)、NF-κB p65(NF-κB反式激活亚基p65)激活域、MyoD1反式激活域、HSF1反式激活域(来自人热休克因子1的反式激活域)、RTA(Epstein Barr病毒R反式激活子激活域)、SET7/9反式激活域、p53激活域1、p53激活域2、CREB(cAMP响应元件结合蛋白)激活域、E2A激活域、NFAT(激活的T细胞的核因子)激活域,及其功能片段和变体。参见例如US2016/0298125、US 2016/0281072和WO 2016/049258,它们中的每一个以全文引用的方式并入本文用于所有目的。转录激活域的其它实例包括Gcn4、MLL、Rtg3、Gln3、Oaf1、Pip2、Pdr1、Pdr3、Pho4、Leu3及其功能片段和变体。参见例如US 2016/0298125,该文献以全文引用的方式并入本文用于所有目的。转录激活域的其它实例包括Spl、Vax、GATA4及其功能片段和变体。参见例如WO 2016/149484,该文献以全文引用的方式并入本文用于所有目的。其它实例包括来自Oct1、Oct-2A、AP-2、CTF1、P300、CBP、PCAF、SRC1、PvALF、ERF-2、OsGAI、HALF-1、C1、AP1、ARF-5、ARF-6、ARF-7、ARF-8、CPRF1、CPRF4、MYC-RP/GP和TRAB1PC4的激活域及其功能片段和变体。参见例如US 2016/0237456、EP3045537和WO 2011/146121,所述文献中的每个文献出于所有目的通过引用整体并入。附加的合适转录激活域也是已知的。参见例如WO2011/146121,该文献以全文引用的方式并入本文用于所有目的。
B.嵌合衔接蛋白
还提供了可以结合到本文别处公开的向导RNA的嵌合衔接蛋白。本文公开的嵌合衔接蛋白可用于dCas协同激活介体(SAM)样系统,以增加针对靶基因内的靶序列的转录激活域的数量和多样性,从而激活靶基因的转录。
此类嵌合衔接蛋白包括:(a)与向导RNA内的衔接结合元件特异性结合的衔接子(即,衔接结构域或衔接蛋白);以及(b)一个或多个异源转录激活结构域。例如,此类融合蛋白可以包括1、2、3、4、5或更多个转录激活结构域(例如,两个或更多个异源转录激活结构域或三个或更多个异源转录激活结构域)。在一个实例中,此类嵌合衔接蛋白可以包括:(a)与向导RNA中的衔接结合元件特异性结合的衔接子(即,衔接结构域或衔接蛋白);以及(b)两个或更多个转录激活结构域。例如,嵌合衔接蛋白可以包括:(a)与向导RNA中的一个或多个MS2适体(例如,向导RNA中的单独定位中的两个MS2适体)特异性结合的MS2外壳蛋白衔接子;以及(b)一个或多个(例如,两个或更多个转录激活结构域)。例如,两个转录激活结构域可以是p65和HSF1转录激活结构域或其功能片段或变体。然而,还提供了其中转录激活结构域包括其它转录激活结构域或其功能片段或变体的嵌合衔接蛋白。
一个或多个转录激活结构域可以与衔接子直接融合。可替代地,一个或多个转录激活结构域可以通过接头或接头组合或通过一个或多个另外的结构域连接到衔接子。同样,如果存在两个或更多个转录激活结构域,则所述结构域可以直接彼此融合或可以通过接头或接头组合或通过一个或多个另外的结构域彼此连接。可以用于这些融合蛋白的接头可以包含不干扰融合蛋白的功能的任何序列。示例性接头是短的(例如,2-20个氨基酸)并且通常是柔性的(例如,包括具有高自由度的氨基酸,如甘氨酸、丙氨酸和丝氨酸)。接头的一些具体实例包含由GGGS(SEQ ID NO:4)或GGGGS(SEQ ID NO:5)(如GGGS(SEQ ID NO:4)或GGGGS(SEQ ID NO:5)的两个、三个、四个或更多个重复的任何组合)组成的一个或多个单元。也可以使用其它接头序列。
一个或多个转录激活结构域和衔接子可以在嵌合衔接蛋白内呈任何顺序。作为一种选择,一个或多个转录激活结构域可以在衔接子的C端并且衔接子可以在一个或多个转录激活结构域的N端。例如,一个或多个转录激活结构域可以在嵌合衔接蛋白的C端,并且衔接子可以在嵌合衔接蛋白的N端。然而,一个或多个转录激活结构域可以在衔接子的C端而不在嵌合衔接蛋白的C端(例如,如果核定位信号处于嵌合衔接蛋白的C端处)。同样,衔接子可以在一个或多个转录激活结构域的N端而不在嵌合衔接蛋白的N端处(例如,如果核定位信号处于嵌合衔接蛋白的N端处)。作为另一种选择,一个或多个转录激活结构域可以在衔接子的N端并且衔接子可以在一个或多个转录激活结构域的C端。例如,一个或多个转录激活结构域可以在嵌合衔接蛋白的N端,并且衔接子可以在嵌合衔接蛋白的C端。作为另一种选择,如果嵌合衔接蛋白包括两个或更多个转录激活结构域,则两个或更多个转录激活结构域可以位于衔接子的侧翼。
嵌合衔接蛋白也可以与另外的异源多肽可操作地连接或融合。融合或连接的异源多肽可以定位于N端、C端或嵌合衔接蛋白内部的任何位置。例如,嵌合衔接蛋白可以进一步包括核定位信号。此类蛋白质的具体实例包括与MS2外壳蛋白(MCP)的p65转录激活结构域C端和p65转录激活结构域的HSF1转录激活结构域C端(直接或通过NLS)连接的MS2外壳蛋白(衔接子)。此类蛋白质可以从N端到C端包括:MCP;核定位信号;p65转录激活结构域;以及HSF1转录激活结构域。例如,嵌合衔接蛋白可以包含以下氨基酸序列、基本上由以下氨基酸序列组成,或由以下氨基酸序列组成:与SEQ ID NO:6所示的MCP-p65-HSF1嵌合衔接蛋白序列至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。
嵌合衔接蛋白也可以与提供亚细胞定位的一个或多个异源多肽融合或链接。此类异源多肽可以包括例如一个或多个核定位信号(NLS),如用于靶向细胞核的SV40 NLS和/或α-输入蛋白NLS、用于靶向线粒体的线粒体定位信号、ER保留信号等等。参见例如Lange等人(2007)《生物化学杂志(J.Biol.Chem.)》282(8):5101-5105,所述文献出于所有目的通过引用整体并入本文。此类亚细胞定位信号可以位于嵌合衔接蛋白内的N端、C端或任何位置(例如,在嵌合衔接蛋白的衔接蛋白组分的C端或N端或在嵌合衔接蛋白的转录激活子域组分的C端或N端)。NLS可以包含例如碱性氨基酸的段,并且可以是单部分序列或双部分序列。任选地,嵌合衔接蛋白包含两个或更多个NLS,包括N端处的NLS(例如,α-输入蛋白NLS)和/或C端处的NLS(例如,SV40 NLS)。嵌合衔接蛋白还可以包含N端处的两个或更多个NLS和/或C端处的两个或更多个NLS。
在一个实例中,嵌合衔接蛋白可以与1至10个NLS、1至5个NLS或一个NLS融合。在使用一个NLS的情况下,NLS可以链接在嵌合衔接蛋白序列的N端或C端处。它也可以插入到嵌合衔接蛋白序列的内部。在其它实例中,嵌合衔接蛋白可以与多于一个NLS融合。例如,嵌合衔接蛋白可以与2、3、4或5个NLS融合或可以与两个NLS融合。在某些情况下,两个NLS可以相同(例如,两个SV40 NLS)或不同。例如,嵌合衔接蛋白可以融合到链接在羧基端的两个SV40NLS序列。在另一个实例中,嵌合衔接蛋白可以与两个NLS融合,一个链接在N端并且一个链接在C端。在另一个实例中,嵌合衔接蛋白可以与3个NLS融合。在另一个实例中,嵌合衔接蛋白可以不与NLS融合。在一些实例中,NLS可以是单部分序列,例如,SV40 NLS、PKKKRKV(SEQID NO:58)或PKKKRRV(SEQ ID NO:59)。在一些实例中,NLS可以是双部分序列,如核质蛋白的NLS,KRPAATKKAGQAKKKK(SEQ ID NO:60)。在具体实例中,单个PKKKRKV(SEQ ID NO:58)NLS可以链接在RNA导向的DNA结合剂的C端。一个或多个接头任选地包括在融合位点处。
嵌合衔接蛋白也可以与细胞穿透性域或蛋白转导域可操作地链接。例如,细胞穿透性结构域可以源自HIV-1TAT蛋白、来自人乙型肝炎病毒的TLM细胞穿透基序、MPG、Pep-1、VP22、来自单纯疱疹病毒的细胞穿透性肽或聚精氨酸肽序列。参见例如WO 2014/089290和WO2013/176772,它们中的每一个以全文引用的方式并入本文用于所有目的。作为另一个实例,嵌合衔接蛋白可以与异源多肽融合或链接,从而提供增加或减少的稳定性。
嵌合衔接蛋白也可以与异源多肽可操作地链接以便于进行追踪或纯化,如荧光蛋白、纯化标签或表位标签。荧光蛋白的实例包含绿色荧光蛋白(例如,GFP、GFP-2、tagGFP、turboGFP、eGFP、祖母绿、Azami绿、单体Azami绿、CopGFP、AceGFP、ZsGreenl)、黄色荧光蛋白(例如,YFP、eYFP、柠檬黄、Venus、YPet、PhiYFP、ZsYellowl)、蓝色荧光蛋白(例如,eBFP、eBFP2、石青、mKalamal、GFPuv、天蓝色、T-天蓝色(T-sapphire))、青色荧光蛋白(例如,eCFP、蔚蓝色(Cerulean)、CyPet、AmCyanl、Midoriishi-青色)、红色荧光蛋白(例如,mKate、mKate2、mPlum、DsRed单体、mCherry、mRFP1、DsRed-表达、DsRed2、DsRed-单体、HcRed-Tandem、HcRedl、AsRed2、eqFP611、mRaspberry、mStrawberry、Jred)、橙色荧光蛋白(例如,mOrange、mKO、Kusabira-橙色、单体Kusabira-橙色、mTangerine、tdTomato)和任何其它合适的荧光蛋白。标签的实例包含谷胱甘肽-S-转移酶(GST)、几丁质结合蛋白(CBP)、麦芽糖结合蛋白、硫氧还蛋白(TRX)、聚(NANP)、串联亲和纯化(TAP)标签、myc、AcV5、AU1、AU5、E、ECS、E2、FLAG、血凝素(HA)、nus、Softag1、Softag3、Strep、SBP、Glu-Glu、HSV、KT3、S、S1、T7、V5、VSV-G、组氨酸(His)、生物素羧基载体蛋白(BCCP)和钙调蛋白。
嵌合衔接蛋白还可以与经标记的核酸拴系。此类拴系(即,物理链接)可以通过共价相互作用或非共价相互作用来实现,并且拴系可以是直接的(例如,通过直接融合或化学缀合,这可以通过蛋白上的半胱氨酸或赖氨酸残基的修饰或内含子修饰来实现),或者可以通过如链霉亲和素或适体等一个或多个中间接头或衔接子分子来实现。参见例如,Pierce等人(2005),《药物化学短评(Mini Rev.Med.Chem.)》5(1):41-55;Duckworth等人(2007),《德国应用化学会刊(Angew.Chem.Int.Ed.Engl.)》46(46):8819-8822;Schaeffer和Dixon(2009),《澳大利亚化学杂志(Australian J.Chem.)》62(10):1328-1332;Goodman等人(2009),《生物化学(Chembiochem.)》10(9):1551-1557;以及Khatwani等人(2012)《生物有机化学与医药化学(Bioorg.Med.Chem.)》20(14):4532-4539,所述文献中的每个文献出于所有目的通过引用整体并入本文。用于合成蛋白质-核酸缀合物的非共价策略包含生物素-链霉亲和素和镍-组氨酸方法。可以通过使用多种化学反应连接适当功能化的核酸和蛋白质来合成共价蛋白质-核酸缀合物。这些化学反应中的一些化学反应涉及将寡核苷酸直接附着到蛋白质表面上的氨基酸残基(例如,赖氨酸胺或半胱氨酸硫醇),而其它更复杂的方案需要蛋白质的翻译后修饰或者催化或反应蛋白结构域的参与。用于蛋白质与核酸共价附着的方法可以包含例如寡核苷酸与蛋白质赖氨酸或半胱氨酸残基的化学交联、表达的蛋白质连接、化学酶法和光适体的使用。经标记的核酸可以与嵌合衔接蛋白内的C端、N端或内部区域拴系。同样地,嵌合衔接蛋白可以与经标记的核酸内的5'末端、3'末端或内部区域拴系。也就是说,经标记的核酸可以以任何取向和极性拴系。
嵌合衔接蛋白可以以任何形式提供。例如,嵌合衔接蛋白可以以蛋白的形式提供,如与gRNA复合的嵌合衔接蛋白。替代地,可以以编码嵌合衔接蛋白的核酸的形式提供嵌合衔接蛋白,如RNA(例如,信使RNA(mRNA))或DNA。在具体实例中,嵌合衔接蛋白可以作为mRNA(例如,体外转录的mRNA)提供,如也编码嵌合Cas蛋白的多顺反子或双顺反子mRNA。任选地,可以对编码嵌合衔接蛋白的核酸进行密码子优化以在特定细胞或生物体中有效翻译成蛋白。例如,与天然存在的多核苷酸序列相比,可以修饰编码嵌合衔接蛋白的核酸以取代在真核细胞、非人真核细胞、动物细胞、非人动物细胞、哺乳动物细胞、非人哺乳动物细胞、人细胞、非人细胞、啮齿动物细胞、小鼠细胞、大鼠细胞或任何其它感兴趣的宿主细胞中具有更高使用频率的密码子。当编码嵌合衔接蛋白的核酸被引入到细胞中时,嵌合衔接蛋白可以在细胞中进行瞬时、条件性或组成性表达。
可以修饰作为mRNA提供的嵌合衔接蛋白以提高稳定性和/或免疫原性特性。可以对mRNA内的一种或多种核苷进行修饰。对mRNA核碱基的化学修饰的实例包括假尿苷、1-甲基-假尿苷和5-甲基-胞苷。编码嵌合衔接蛋白的mRNA也可以被加帽。帽可以是,例如,其中+1核糖核苷酸在核糖的2'O位置被甲基化的帽1结构。例如,加帽可以在体内产生优异的活性(例如,通过模拟天然帽),可以产生减少对宿主先天免疫系统的刺激的天然结构(例如,可以减少先天免疫系统中的模式识别受体的激活)。编码嵌合衔接蛋白的mRNA也可以被聚腺苷酸化(以包含聚(A)尾)。编码嵌合衔接蛋白的mRNA也可以被修饰以包括假尿苷(例如,可以被假尿苷完全取代)。例如,可以使用含有N1-甲基假尿苷的加帽和聚腺苷酸化的嵌合衔接mRNA。同样地,嵌合衔接mRNA可以通过使用同义密码子消耗尿苷来修饰。其它可能的修饰在本文别处更详细地描述。
可以修饰作为mRNA提供的嵌合衔接蛋白以提高稳定性和/或免疫原性特性。可以对mRNA内的一种或多种核苷进行修饰。对mRNA核碱基的化学修饰的实例包括假尿苷、1-甲基-假尿苷和5-甲基-胞苷。编码嵌合衔接蛋白的mRNA也可以被加帽。帽可以是,例如,其中+1核糖核苷酸在核糖的2'O位置被甲基化的帽1结构。例如,加帽可以在体内产生优异的活性(例如,通过模拟天然帽),可以产生减少对宿主先天免疫系统的刺激的天然结构(例如,可以减少先天免疫系统中的模式识别受体的激活)。编码嵌合衔接蛋白的mRNA也可以被聚腺苷酸化(以包含聚(A)尾)。编码嵌合衔接蛋白的mRNA也可以被修饰以包括假尿苷(例如,可以被假尿苷完全取代)。例如,可以使用含有N1-甲基假尿苷的加帽和聚腺苷酸化的嵌合衔接mRNA。同样地,嵌合衔接mRNA可以通过使用同义密码子消耗尿苷来修饰。
嵌合衔接mRNA可以在至少一个、多个或所有尿苷位置包含经修饰的尿苷。经修饰的尿苷可以是在5位置被修饰(例如,用卤素、甲基或乙基)的尿苷。经修饰的尿苷可以是在1位置被修饰(例如,用卤素、甲基或乙基)的假尿苷。经修饰的尿苷可以是例如假尿苷、N1-甲基-假尿苷、5-甲氧基尿苷、5-碘尿苷或其组合。在一些实例中,经修饰的尿苷是5-甲氧基尿苷。在一些实例中,经修饰的尿苷是5-碘尿苷。在一些实例中,经修饰的尿苷是假尿苷。在一些实例中,经修饰的尿苷是N1-甲基-假尿苷。在一些实例中,经修饰的尿苷是假尿苷和N1-甲基-假尿苷的组合。在一些实例中,经修饰的尿苷是假尿苷和5-甲氧基尿苷的组合。在一些实例中,经修饰的尿苷是N1-甲基假尿苷和5-甲氧基尿苷的组合。在一些实例中,经修饰的尿苷是5-碘尿苷和N1-甲基-假尿苷的组合。在一些实例中,经修饰的尿苷是假尿苷和5-碘尿苷的组合。在一些实例中,经修饰的尿苷是5-碘尿苷和5-甲氧基尿苷的组合。
本文公开的嵌合衔接mRNA还可以包含5'帽,如Cap0、Cap1或Cap2。5'帽通常是通过5'-三磷酸酯链接到mRNA的5'至3'链的第一核苷酸(即,第一近帽核苷酸)的5'位置的7-甲基鸟嘌呤核糖核苷酸(其可以被进一步修饰,例如,关于ARCA)。在Cap0中,mRNA的第一和第二近帽核苷酸的核糖均包含2'-羟基。在Cap1中,mRNA的第一和第二转录核苷酸的核糖分别包含2'-甲氧基和2'-羟基。在Cap2中,mRNA的第一和第二近帽核苷酸的核糖均包含2'-甲氧基。参见例如Katibah等人(2014)《美国科学院院报(Proc.Natl.Acad.Sci.U.S.A.)》111(33):12025-30和Abbas等人(2017)《美国科学院院报》114(11):E2106-E2115,它们中的每一个以全文引用的方式并入本文用于所有目的。大多数内源性高等真核mRNA,包括哺乳动物mRNA,如人mRNA,均包含Cap1或Cap2。Cap0和其它不同于Cap1和Cap2的帽结构可能在哺乳动物(如人类)中具有免疫原性,因为先天免疫系统的组分(如IFIT-1和IFIT-5)将其识别为非自身,这可能导致细胞因子升高水平(包括I型干扰素)。先天免疫系统的组分如IFIT-1和IFIT-5也可能与eIF4E竞争mRNA与Cap1或Cap2以外的帽的结合,从而潜在地抑制mRNA的翻译。
可以共转录地包括帽。例如,ARCA(抗反向帽类似物;赛默飞世尔科技公司(ThermoFisher Scientific)商品目录号第AM8045号)是包含与鸟嘌呤核糖核苷酸的5'位置链接的7-甲基鸟嘌呤3'-甲氧基-5'-三磷酸酯的帽类似物,其可在体外在起始时掺入转录物中。ARCA产生Cap0帽,其中第一近帽核苷酸的2'位置是羟基。参见例如Stepinski等人,(2001)《RNA》7:1486-1495,该文献以全文引用的方式并入本文用于所有目的。
CleanCapTM AG(m7G(5')ppp(5')(2'OMeA)pG;TriLink生物技术公司商品目录号第N-7113号)或CleanCapTM GG(m7G(5')ppp(5')(2'OMeG)pG;TriLink生物技术公司商品目录号第N-7133号)可用于共转录地提供Cap1结构。3'-O-甲基化版本的CleanCapTM AG和CleanCapTM GG也可从TriLink生物技术公司获得,商品目录号分别为第N-7413和第N-7433号。
替代地,可以在转录后将帽添加到RNA。例如,牛痘加帽酶是可商购的(新英格兰生物实验室(New England Biolabs)商品目录号第M2080S号)并具有由其D1亚基提供的RNA三磷酸酶和鸟苷酸转移酶活性,以及由其D12亚基提供的鸟嘌呤甲基转移酶活性。因此,在S-腺苷甲硫氨酸和GTP的存在下,它可以将7-甲基鸟嘌呤添加到RNA中,从而产生Cap0。参见例如Guo和Moss(1990)《美国科学院院报》87:4023-4027,和Mao和Shuman(1994)《生物化学杂志》269:24472-24479,它们中的每一个以全文引用的方式并入本文用于所有目的。
嵌合衔接mRNA还可以包含聚腺苷酸化(聚A)尾。例如,聚A尾可以包含至少20个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个或至少100个腺嘌呤,以及任选地多达300个腺嘌呤。例如,聚A尾可以包含95、96、97、98、99或100个腺嘌呤核苷酸。
编码嵌合衔接蛋白的核酸可以稳定地整合在细胞的基因组中,并可操作地链接到细胞中有活性的启动子。替代地,编码嵌合衔接蛋白的核酸可以与表达构建体中的启动子可操作地链接。表达构建体包括能够引导基因或其它感兴趣的核酸序列(例如,嵌合衔接基因)的表达并且可以将此类感兴趣的核酸序列转移到靶细胞的任何核酸构建体。例如,编码嵌合衔接蛋白的核酸可以在包含编码gRNA和/或嵌合Cas蛋白的DNA的载体中。替代地,其可以在与包含编码gRNA的DNA或编码嵌合Cas蛋白的DNA的载体分离的载体或质粒中。可以用于表达构建体的启动子包括在例如真核细胞、非人真核细胞、动物细胞、非人动物细胞、哺乳动物细胞、非人哺乳动物细胞、人细胞、非人细胞、啮齿动物细胞、小鼠细胞、多能细胞、胚胎干(ES)细胞、成体干细胞、发育受限的祖细胞、诱导的多能干(iPS)细胞或单细胞期胚胎中的一个或多个中具有活性的启动子。此类启动子可以是例如条件启动子、诱导型启动子、组成型启动子或组织特异性启动子。任选地,启动子可以是双向启动子。此类双向启动子可以由以下各项组成:(1)含有3个外部控制元件:远侧序列元件(DSE)、近侧序列元件(PSE)和TATA框的完整的、常规的、单向的Pol III启动子;(2)包括在相反定向上与DSE的5'末端融合的PSE和TATA盒的第二基本Pol III启动子。例如,在H1启动子中,DSE邻近PSE和TATA框,并且可以通过产生杂合启动子使启动子双向化,其中通过源自U6启动子的附加PSE和TATA盒来控制反向转录。参见例如US 2016/0074535,所述文献出于所有目的通过引用整体并入本文。
(1)衔接子
衔接子(即,衔接结构域或衔接蛋白)是特异性识别并与不同序列结合(例如,与不同DNA和/或RNA序列,如序列特异性方式的适体结合)的核酸结合结构域(例如,DNA结合结构域和/或RNA结合结构域)。适体包含通过其采用特异性三维构象的能力可以以高亲和力和特异性与靶分子结合的核酸。例如,此类衔接子可以与特异性RNA序列和二级结构结合。这些序列(即,衔接结合元件)可以被工程化成向导RNA。例如,MS2适体可以被工程化成向导RNA,以特异性结合MS2外壳蛋白(MCP)。例如,衔接子可以包含以下氨基酸序列、基本上由以下氨基酸序列组成,或由以下氨基酸序列组成:与SEQ ID NO:7所示的MCP序列至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。
衔接子和靶标的一些具体实例包括存在于噬菌体外壳蛋白多样性内的RNA结合蛋白/适体组合。例如,可以使用以下衔接蛋白或其功能片段或变体:MS2外壳蛋白(MCP)、PP7、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M1l、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、
Figure BDA0003620588300000601
ΦCb8r、ΦCb12r、ΦCb23r、7s和PRR1。参见例如WO 2016/049258,该文献以全文引用的方式并入本文用于所有目的。衔接蛋白的功能片段或功能变体是保留与特定衔接结合元件结合的能力(例如,以序列特异性方式与特定衔接结合序列结合的能力)的功能片段或功能变体。例如,可以使用PP7假单胞菌噬菌体外壳蛋白变体,其中氨基酸68-69突变为SG并且氨基酸70-75从野生型蛋白中缺失。参见例如Wu等人(2012)《生物物理学杂志(Biophys.J.)》102(12):2936-2944,和Chao等人(2007)《自然结构与分子生物学(Nat.Struct.Mol.Biol.)》15(1):103-105,它们中的每一个以全文引用的方式并入本文用于所有目的。同样地,可以使用MCP变体,如N55K突变体。参见例如Spingola和Peabody(1994)《生物化学杂志》269(12):9006-9010,该文献以全文引用的方式并入本文用于所有目的。
可以使用的衔接蛋白的其它实例包括全部或部分内切核糖核酸酶Csy4或λN蛋白(例如,它的DNA结合)。参见例如WO 2016/0312198,该文献以全文引用的方式并入本文用于所有目的。
(2)转录激活域
本文公开的嵌合衔接蛋白包括一个或多个转录激活结构域。此类转录激活结构域可以是天然存在的转录激活结构域,可以是天然存在的转录激活结构域的功能片段或功能变体,或者可以是工程化或合成的转录激活结构域。可以使用的转录激活域包括在本文别处描述的用于嵌合Cas蛋白的那些。
用于本文公开的嵌合衔接蛋白的特定转录激活域包含p65和/或HSF1转录激活域或其功能片段或变体。HSF1转录激活域可以是人热休克因子1(HSF1)的转录激活域。p65转录激活域可以是转录因子p65的转录激活域,也称为核因子NF-κ-B p65亚基,由RELA基因编码。作为一个实例,转录激活域可以包含以下氨基酸序列、基本上由以下氨基酸序列组成,或由以下氨基酸序列组成:与SEQ ID NO:8所示的p65转录激活域蛋白序列至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。作为另一个实例,转录激活域可以包含以下氨基酸序列、基本上由以下氨基酸序列组成,或由以下氨基酸序列组成:与SEQ ID NO:9所示的HSF1转录激活域蛋白序列至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。
C.SAM向导RNA
还提供了可以结合本文别处公开的嵌合Cas蛋白和嵌合衔接蛋白以激活靶基因转录的向导RNA。
一个或多个向导RNA可用于本文公开的方法或组合物。例如,可以使用两个或更多个、三个或更多个、四个或更多个,或五个或更多个向导RNA。两个或更多个向导RNA可以靶向单个靶基因中的不同靶序列。例如,两个或更多个、三个或更多个、四个或更多个,或五个或更多个向导RNA可以各自靶向单个靶基因中的不同靶序列。类似地,向导RNA可以靶向多个靶基因(例如,两个或更多个、三个或更多个、四个或更多个,或五个或更多个靶基因)。向导RNA靶序列的实例在本文别处公开。
(1)向导RNA
“向导RNA”或“gRNA”是与Cas蛋白(例如,Cas9蛋白)结合并将Cas蛋白靶向靶DNA内的特定位置的RNA分子。向导RNA可以包含两个区段:“DNA靶向区段”(也称为“向导序列”)和“蛋白结合区段”。“区段”包括分子的一部分或区域,如RNA中的核苷酸的连续段。一些gRNA,如Cas9的那些,可以包括两个单独的RNA分子:“激活因子RNA”(例如,tracrRNA)和“靶向因子RNA”(例如,CRISPR RNA或crRNA)。其它gRNA是单个RNA分子(单个RNA多核苷酸),其也可以被称为“单个分子gRNA”、“单个向导RNA”或“sgRNA”。参见例如WO 2013/176772、WO 2014/065596、WO 2014/089290、WO2014/093622、WO 2014/099750、WO 2013/142578和WO 2014/131833,它们中的每一个以全文引用的方式并入本文用于所有目的。向导RNA可以指CRISPRRNA(crRNA)或crRNA和反式激活CRISPR RNA(tracrRNA)的组合。crRNA和tracrRNA可以结合为单个RNA分子(单个向导RNA或sgRNA)或在两个单独的RNA分子(双向导RNA或dgRNA)中结合。例如,对于Cas9,单向导RNA可以包括(例如,通过连接子)与tracrRNA融合的crRNA。例如,对于Cpf1,只需要crRNA就可以实现与靶序列的结合。术语“向导RNA”和“gRNA”包含双分子(即,模块化)gRNA和单分子gRNA两者。在本文公开的一些方法和组合物中,C5gRNA是酿脓链球菌Cas9 gRNA或其等价物。在本文公开的一些方法和组合物中,C5gRNA是金黄色葡萄球菌Cas9 gRNA或其等价物。
示范性双分子gRNA包含crRNA样(“CRISPR RNA”或“靶向子RNA”或“crRNA”或“crRNA重复序列”)分子和对应的tracrRNA样(“反式激活CRISPR RNA”或“激活子RNA”)或“tracrRNA”)分子。crRNA包括gRNA的DNA靶向片段(单链)和核苷酸段,所述核苷酸段形成gRNA的蛋白质结合片段的dsRNA双链体的一半。定位在DNA靶向区段下游(3')的crRNA尾的实例包含GUUUUAGAGCUAUGCU(SEQ ID NO:10)、基本上由其组成或由其组成。本文公开的DNA靶向区段中的任一个都可以与SEQ ID NO:10的5'末端连接以形成crRNA。
对应的tracrRNA(激活因子RNA)包括形成gRNA的蛋白质结合区段的dsRNA双链体的另一半的核苷酸段。crRNA的核苷酸段与tracrRNA的核苷酸段互补并且与其杂交,以形成gRNA的蛋白质结合结构域的dsRNA双链体。因此,每个crRNA可以被视为具有对应的tracrRNA。tracrRNA序列的实例包含AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUU(SEQ ID NO:11)、AAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(SEQ ID NO:50)、GUUGGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQ ID NO:51)中的任一个、基本上由其组成或由其组成。
在需要crRNA和tracrRNA两者的系统中,crRNA和对应的tracrRNA杂交以形成gRNA。在仅需要crRNA的系统中,crRNA可以是gRNA。crRNA另外提供与靶DNA的互补链杂交的单链DNA靶向区段。如果用于细胞内的修饰,则给定的crRNA或tracrRNA分子的确切序列可以被设计成对将使用RNA分子的物种具有特异性。参见例如Mali等人,(2013)《科学》339(6121):823-826;Jinek等人,(2012)《科学》337(6096):816-821;Hwang等人,(2013)《自然生物技术》31(3):227-229;Jiang等人,(2013)《自然生物技术》31(3):233-239;以及Cong等人,(2013)《科学》339(6121):819-823,它们中的每一个以全文引用的方式并入本文用于所有目的。
给定gRNA的DNA靶向区段(crRNA)包括与靶DNA的互补链上的序列互补的核苷酸序列,如下文更详细地描述的。gRNA的DNA靶向区段通过杂交(即,碱基配对)以序列特异性方式与靶DNA相互作用。因此,DNA靶向区段的核苷酸序列可以不同,并且测定gRNA和靶DNA将与其相互作用的靶DNA内的定位。可以修饰主题gRNA的DNA靶向区段以与靶DNA内的任何期望序列杂交。天然存在的crRNA因CRISPR/Cas系统和生物体而不同,但通常含有长度为21到72个核苷酸的侧接有长度为21到46个核苷酸的两个直接重复序列(DR)的靶向区段(参见例如,WO 2014/131833,所述文献出于所有目的通过引用整体并入本文)。在酿脓链球菌的情况下,DR的长度为36个核苷酸,并且靶向区段的长度为30个核苷酸。定位于3'的DR与对应的tracrRNA互补并杂交,后者进而与Cas蛋白结合。
DNA靶向区段的长度可以为例如至少约12、15、17、18、19、20、25、30、35或40个核苷酸。此类DNA靶向区段的长度可以为例如约12到约100、约12到约80、约12到约50、约12到约40、约12到约30、约12到约25或约12到约20个核苷酸。例如,DNA靶向区段可以为约15到约25个核苷酸(例如,约17到约20个核苷酸或约17、18、19或20个核苷酸)。参见例如US 2016/0024523,所述文献出于所有目的通过引用整体并入本文。对于来自酿脓链球菌的Cas9,典型的DNA靶向区段的长度介于16与20个核苷酸之间或长度介于17与20个核苷酸之间。对于来自金黄色葡萄球菌的Cas9,典型的DNA靶向区段的长度介于21与23个核苷酸之间。对于Cpf1,典型的DNA靶向区段的长度为至少16个核苷酸或至少18个核苷酸。
在一个实例中,DNA靶向区段的长度可以为约20个核苷酸。然而,更短和更长的序列也可用于靶向区段(例如,长度为15至25个核苷酸,如15、16、17、18、19、20、21、22、23、24或25个核苷酸)。DNA靶向区段和对应的向导RNA靶序列之间的相同程度(或DNA靶向区段和向导RNA靶序列的另一链之间的互补程度)可以是例如约75%、约80%、约85%、约90%、约95%、约96%、约97%、约98%、约99%或约100%。DNA靶向区段和对应的向导RNA靶序列可以含有一个或多个错配。例如,向导RNA的DNA靶向区段和对应的向导RNA靶序列可以含有1至4、1至3、1至2、1、2、3或4个错配(例如,其中向导RNA靶序列的总长度为至少17个、至少18个、至少19个或至少20个或更多个核苷酸)。例如,向导RNA的DNA靶向区段和对应的向导RNA靶序列可以含有1至4、1至3、1至2、1、2、3或4个错配,其中向导RNA靶序列的总长度为20个核苷酸。
TracrRNA可以呈任何形式(例如,全长tracrRNA或活性部分tracrRNA)并具有不同长度。TracrRNA可以包含初级转录本或经处理的形式。例如,tracrRNA(作为单向导RNA的一部分或作为作为双分子gRNA的一部分的单独分子)可以包括野生型tracrRNA序列(例如,野生型tracrRNA序列的约或超过约20、26、32、45、48、54、63、67、85或更多个核苷酸)、基本上由其组成或由其组成。来自酿脓链球菌的野生型tracrRNA序列的实例包含171-核苷酸、89-核苷酸、75-核苷酸和65-核苷酸版本。参见例如Deltcheva等人(2011)《自然》471(7340):602-607;WO 2014/093661,所述文献中的每个文献出于所有目的通过引用整体并入本文。单向导RNA(sgRNA)内的tracrRNA的实例包含在+48、+54、+67和+85版本的sgRNA中发现的tracrRNA区段,其中“+n”指示野生型tracrRNA的至多+n个核苷酸包含在sgRNA中。参见US8,697,359,所述文献出于所有目的通过引用整体并入本文。
向导RNA的DNA靶向区段与靶DNA的互补链之间的互补性百分比可以为至少60%(例如,至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少98%、至少99%或100%)。DNA靶向片段与靶DNA的互补链之间的互补性百分比在约20个连续核苷酸上可以为至少60%。举例来说,DNA靶向区段与靶DNA的互补链之间的互补性百分比在靶DNA的互补链的5'末端处的14个连续核苷酸上可以为100%,并且在剩余部分上低至0%。在此类情况下,DNA靶向片段可以被视为长度为14个核苷酸。作为另一个实例,DNA靶向区段与靶DNA的互补链之间的互补性百分比在靶DNA的互补链的5'末端处的七个连续核苷酸上可以为100%,并且在剩余部分上低至0%。在此类情况下,DNA靶向区段可以被视为长度为7个核苷酸。在一些向导RNA中,DNA靶向区段内的至少17个核苷酸与靶DNA的互补链互补。例如,DNA靶向区段的长度可以是20个核苷酸,并且可以包括与靶DNA的互补链的1、2或3个错配。在一个实例中,错配不与对应于原型间隔子相邻基序(PAM)序列的互补链的区域(即,PAM序列的反向补体)相邻(例如,错配处于向导RNA的DNA靶向区段的5'末端中,或者错配距离对应于PAM序列的互补链的区域至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18或19个碱基对)。
gRNA的蛋白质结合区段可以包括彼此互补的两个核苷酸段。蛋白质结合区段的互补核苷酸杂交形成双链RNA双链体(dsRNA)。主题gRNA的蛋白质结合片段与Cas蛋白相互作用,并且gRNA通过DNA靶向片段将结合的Cas蛋白引导到靶DNA内的特异性核苷酸序列。
单向导RNA可以包括DNA靶向区段和支架序列(即,向导RNA的蛋白质结合或Cas结合序列)。例如,此类向导RNA可以具有与3'支架序列连接的5'DNA靶向区段。示范性支架序列包含以下各项、基本上由以下各项组成或由以下各项组成:GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCU(版本1;SEQ ID NO:12);GUUGGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(版本2;SEQ ID NO:13);GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(版本3;SEQ ID NO:14);GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(版本4;SEQ ID NO:15);GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(版本5;SEQ ID NO:52);GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(版本6;SEQ ID NO:53);或GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(版本7;SEQ ID NO:54)。靶向本文公开的向导RNA靶序列中的任一个的向导RNA可以包括例如与向导RNA的3'末端上的示范性向导RNA支架序列中的任一个融合的向导RNA的5'末端上的DNA靶向区段。即,本文所公开的DNA靶向区段中的任何DNA靶向区段可以与上述支架序列中的任何支架序列的5'末端连接以形成单向导RNA(嵌合向导RNA)。
向导RNA可以包含提供另外的期望特征的修饰或序列(例如,经修饰或经调控的稳定性;亚细胞靶向;用荧光标记追踪;蛋白质或蛋白质复合物的结合位点;等等)。也就是说,向导RNA可以包括一个或多个经修饰核苷或核苷酸,或一个或多个非天然和/或天然存在的组分或构型,其用于代替或补充标准的A、G、C和U残基.此类修饰的实例包括例如5'帽(例如,7-甲基鸟苷酸帽(m7G));3'聚腺苷酸化尾(即,3'聚(A)尾);核糖开关序列(例如,以允许调控稳定性和/或调控蛋白和/或蛋白复合物的可及性);稳定性控制序列;形成dsRNA双链体(即,发夹)的序列;将RNA靶向亚细胞位置(例如,细胞核、线粒体、叶绿体等等)的修饰或序列;提供追踪的修饰或序列(例如,与荧光分子直接缀合、与促进荧光检测的部分缀合、允许荧光检测的序列等);为蛋白(例如,作用于DNA的蛋白,如转录激活子)提供结合位点的修饰或序列;及其组合。修饰的其它实例包含工程化茎环双链体结构、工程化凸起区、茎环双链体结构的工程化发夹3'或其任何组合。参见例如US 2015/0376586,所述文献出于所有目的通过引用整体并入本文。凸起可以是由crRNA样区域和最小tracrRNA样区域构成的双链体内的核苷酸的未配对区域。凸起在双链体的一侧可以包括未配对的5'-XXXY-3',其中X是任何嘌呤,并且Y可以包括可以与相对链上的核苷酸形成摇摆对的核苷酸;并且在双链体的另一侧包括未配对核苷酸区。
未经修饰的核酸可能易于降解。外源性核酸也可以诱导先天免疫应答。修饰可以有助于引入稳定性并降低免疫原性。向导RNA可以包含经修饰的核苷和经修饰的核苷酸,包括例如以下各项中的一个或多个:(1)磷酸二酯主链键中的非连接磷酸氧中的一个或两个和/或连接磷酸氧中的一个或多个的改变或替换(示范性主链修饰);(2)核糖的组成的改变或替换,如核糖上的2'羟基的改变或替换(示范性糖修饰);(3)用脱磷接头替换(例如,批量替换)磷酸酯部分(示范性主链修饰);(4)天然存在的核碱基的修饰或替换,包括用非标准核碱基(示范性碱基修饰);(5)核糖-磷酸酯主链的替换或修饰(示范性主链修饰);(6)寡核苷酸的3'末端或5'末端的修饰(例如,末端磷酸基团的去除、修饰或替换,或部分、帽或接头的缀合(此类3'或5'帽修饰可以包含糖和/或主链修饰));以及(7)糖的修饰或替换(示范性糖修饰)。其它可能的向导RNA修饰包含尿嘧啶或聚尿嘧啶束的修饰或替代。参见例如WO2015/048577和US 2016/0237455,所述文献中的每个文献出于所有目的通过引用整体并入本文。可以对如Cas mRNA等Cas编码核酸进行类似的修饰。例如,可以通过使用同义密码子耗尽尿苷来修饰Cas mRNA。
可以组合如上所列出的化学修饰以提供经修饰的gRNA和/或mRNA,其包含可具有两个、三个、四个或更多个修饰的残基(核苷和核苷酸)。例如,经修饰残基可以具有经修饰的糖和经修饰的核碱基。在一个实例中,gRNA的每个碱基均被修饰(例如,所有碱基均具有经修饰的磷酸基团,如硫代磷酸酯基团)。例如,gRNA的所有或基本上所有磷酸基团均可以被硫代磷酸酯基团替换。替代地或附加地,经修饰的gRNA可以在5'末端处或其附近包含至少一个经修饰残基。替代地或附加地,经修饰的gRNA可以在3'末端处或其附近包含至少一个经修饰残基。
一些gRNA包含一个、两个、三个或更多个经修饰残基。例如,经修饰的gRNA中至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或100%的位置可以是经修饰的核苷或核苷酸。
未经修饰的核酸可能易于降解。外源性核酸也可以诱导先天免疫应答。修饰可以有助于引入稳定性并降低免疫原性。本文所述的一些gRNA可以含有一个或多个经修饰的核苷或核苷酸以向细胞内或基于血清的核酸酶引入稳定性。当引入细胞群时,本文所述的一些经修饰的gRNA可以表现出降低的先天免疫响应。
本文公开的gRNA可以包含主链修饰,其中经修饰残基的磷酸基团可以通过用不同的取代基替换氧中的一个或多个来修饰。修饰可以包括用如本文所述的经修饰的磷酸基团批量替换未经修饰的磷酸酯部分。磷酸酯主链的主链修饰还可以包括导致不带电接头或具有不对称电荷分布的带电接头的改变。
经修饰磷酸基团的实例包括硫代磷酸酯、硒代磷酸酯、硼酸磷酸酯、硼酸磷酸酯、膦酸氢酯、亚氨代磷酸酯、烷基或芳基膦酸酯和磷酸三酯。未经修饰的磷酸基团中的磷原子是非手性的。然而,用上述原子或原子团中的一个替换非桥接氧中的一个可以使磷原子手性。立体异构磷原子可以具有“R”构型(Rp)或“S”构型(Sp)。主链也可以通过用氮(桥接的亚氨代磷酸酯)、硫(桥接的硫代磷酸酯)和碳(桥接的亚甲基膦酸酯)替换桥接氧(即,将磷酸酯与核苷链接的氧)来修饰。替换可以发生在链接氧处或两个链接氧处。
在某些主链修饰中,磷酸基团可以被不含磷的连接头替换。在一些实施例中,带电荷的磷酸基团可以被中性部分替换。可以替换磷酸基团的部分的实例可以包括但不限于例如膦酸甲酯、羟氨基、硅氧烷、碳酸酯、羧甲基、氨基甲酸酯、酰胺、硫醚、环氧乙烷接头、磺酸酯、磺酰胺、硫代甲缩醛、甲缩醛、肟、亚甲基亚氨基、亚甲基甲基亚氨基、亚甲基肼基、亚甲基二甲基肼基和亚甲基氧基甲基亚氨基。
也可以构建可以模拟核酸的支架,其中磷酸酯接头和核糖被核酸酶抗性核苷或核苷酸替代物替换。此类修饰可以包含主链和糖修饰。在一些实施例中,核碱基可以由替代主链拴系。实例可以包括但不限于吗啉代、环丁基、吡咯烷和肽核酸(PNA)核苷替代物。
经修饰的核苷和经修饰的核苷酸可以包括对糖基团的一个或多个修饰(糖修饰)。例如,2'羟基(OH)可以被修饰(例如,被多个不同的氧或脱氧取代基替换。对2'羟基的修饰可以增强核酸的稳定性,因为羟基不能再被去质子化以形成2'-醇盐离子。
2'羟基修饰的实例可以包括烷氧基或芳氧基(OR,其中“R”可以是例如烷基、环烷基、芳基、芳烷基、杂芳基或糖);聚乙二醇(PEG)、O(CH2CH2O)nCH2CH2OR,其中R可以是例如H或任选取代的烷基,并且n可以是0至20的整数(例如0至4、0至8、0至10、0至16、1至4、1至8、1至10、1至16、1至20、2至4、2至8、2至10、2至16、2至20、4至8、4至10、4至16和4至20)。2'羟基修饰可以是2'-O-Me。同样地,2'羟基修饰可以是2'-氟修饰,其用氟化物替换2'羟基。2'羟基修饰可以包括锁定核酸(LNA),其中2'羟基可以例如通过C1-6亚烷基或C1-6杂亚烷基桥接到相同核糖的4'碳,其中示范性桥可以包括亚甲基、丙烯、醚或氨基桥;O-氨基(其中氨基可以是例如NH2;烷基氨基、二烷基氨基、杂环基、芳基氨基、二芳基氨基、杂芳基氨基或二杂芳基氨基、乙二胺或聚氨基)和氨基烷氧基、O(CH2)n-氨基(其中氨基可以是例如NH2;烷基氨基、二烷基氨基、杂环基、芳基氨基、二芳基氨基、杂芳基氨基或二杂芳基氨基、乙二胺或聚氨基)。2'羟基修饰可以包括未锁定的核酸(UNA),其中核糖环缺少C2'-C3'键。2'羟基修饰可以包括甲氧基乙基(MOE),(OCH2CH2OCH3,例如,PEG衍生物)。
脱氧2'修饰可以包括氢(即,脱氧核糖,例如,在部分dsRNA的突出部分);卤素(例如溴、氯、氟或碘);氨基(其中氨基可以是例如NH2;烷基氨基、二烷基氨基、杂环基、芳基氨基、二芳基氨基、杂芳基氨基、二杂芳基氨基或氨基酸);NH(CH2CH2NH)nCH2CH2-氨基(其中氨基可以是,例如,如本文所述)、-NHC(O)R(其中R可以是,例如,烷基、环烷基、芳基、芳烷基,杂芳基或糖)、氰基;巯基;烷基硫代烷基;硫代烷氧基;以及烷基、环烷基、芳基、烯基和炔基,它们可以任选地被例如本文所述的氨基取代。
糖修饰可以包含糖基团,该糖基团还可以含有具有与核糖中对应碳的立体化学构型相反的立体化学构型的一个或多个碳。因此,经修饰的核酸可以包括含有例如阿拉伯糖作为糖的核苷酸。经修饰的核酸还可以包括脱碱基糖。这些脱碱基糖也可以在组成糖原子中的一个或多个处被进一步修饰。经修饰的核酸还可以包括呈L形式的一个或多个糖(例如L-核苷)。
本文所述的经修饰核苷和经修饰核苷酸(其可掺入经修饰核酸中)可以包括经修饰的碱基,也称为核碱基。核碱基的实例包括但不限于腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和尿嘧啶(U)。这些核碱基可以被修饰或完全替换以提供可以掺入经修饰核酸中的经修饰残基。核苷酸的核碱基可以独立地选自嘌呤、嘧啶、嘌呤类似物或嘧啶类似物。在一些实施例中,核碱基可以包括例如碱基的天然存在和合成衍生物。
在双向导RNA中,crRNA和tracrRNA中的每一个均可以含有修饰。此类修饰可以在crRNA和/或tracrRNA的一端或两端。在sgRNA中,sgRNA的一端或两端的一个或多个残基可以被化学修饰,和/或内部核苷可以被修饰,和/或整个sgRNA可以被化学修饰。一些gRNA包含5'末端修饰。一些gRNA包含3'末端修饰。
本文公开的向导RNA可以包含WO 2018/107028 A1中公开的修饰模式中的一个,该文献以全文引用的方式并入本文用于所有目的。本文公开的向导RNA还可以包含US2017/0114334中公开的结构/修饰模式中的一个,该文献以全文引用的方式并入本文用于所有目的。本文公开的向导RNA还可以包含在WO 2017/136794、WO 2017/004279、US2018/0187186或US 2019/0048338中公开的结构/修饰模式中的一个,它们中的每一个以全文引用的方式并入本文用于所有目的。
举例来说,向导RNA的5'末端或3'末端的核苷酸可以包含硫代磷酸酯键(例如,碱基可以具有经修饰的磷酸酯基,所述经修饰的磷酸酯基是硫代磷酸酯基)。例如,向导RNA可以包含向导RNA的5'或3'末端处的2、3或4个末端核苷酸之间的硫代磷酸酯键。作为另一个实例,向导RNA的5'和/或3'末端的核苷酸可以具有2'-O-甲基修饰。例如,向导RNA可以包含向导RNA的5'和/或3'末端(例如,5'末端)的2、3或4个端核苷酸处的2'-O-甲基修饰。参见例如WO 2017/173054 A1和Finn等人(2018)《细胞报告(Cell Rep.)》22(9):2227-2235,它们中的每一个以全文引用的方式并入本文用于所有目的。其它可能的修饰在本文别处更详细地描述。在具体实例中,向导RNA包含前三个5'和3'末端RNA残基处的2'-O-甲基类似物和3'硫代磷酸酯核苷酸间键。此类化学修饰可以例如提供更大的稳定性和防止核酸外切酶向导RNA,允许所述向导RNA比未经修饰的向导RNA在细胞内持续更长时间。例如,此类化学修饰还可以防止先天的细胞内免疫应答,所述先天的细胞内免疫应答可以主动降解RNA或触发导致细胞死亡的免疫级联反应。
作为一个实例,本文所述的向导RNA中的任一个可以包含至少一个修饰。在一个实例中,该至少一个修饰包含2'-O-甲基(2'-O-Me)修饰的核苷酸、核苷酸之间的硫代磷酸酯(PS)键、2'-氟(2'-F)修饰的核苷酸,或其组合。例如,该至少一个修饰可以包含2'-O-甲基(2'-O-Me)修饰的核苷酸。替代地或附加地,该至少一个修饰可以包含核苷酸之间的硫代磷酸酯(PS)键。替代地或附加地,该至少一个修饰可以包含2'-氟(2'-F)修饰的核苷酸。在一个实例中,本文所述的向导RNA包含一个或多个2'-O-甲基(2'-O-Me)修饰的核苷酸和核苷酸之间的一个或多个硫代磷酸酯(PS)键。
修饰可以发生在向导RNA中的任何地方。作为一个实例,向导RNA包含在向导RNA的5'末端的前五个核苷酸中的一个或多个处的修饰,向导RNA包含在向导RNA的3'末端的最后五个核苷酸中的一个或多个处的修饰,或其组合。例如,向导RNA可以包含向导RNA的前四个核苷酸之间的硫代磷酸酯键、向导RNA的最后四个核苷酸之间的硫代磷酸酯键,或其组合。替代地或附加地,向导RNA可以包含在向导RNA的5'末端的前三个核苷酸处的2'-O-Me修饰的核苷酸,可以包含在向导RNA的3'末端的最后三个核苷酸处的2'-O-Me修饰的核苷酸,或其组合。
已显示影响核苷酸糖环的另一种化学修饰是卤素取代。例如,核苷酸糖环上的2'-氟(2'-F)取代可以增加寡核苷酸结合亲和力和核酸酶稳定性。脱碱基核苷酸是指那些缺乏含氮碱基的核苷酸。反向碱基是指具有从正常5'至3'键反向的键(即,5'至5'键或3'至3'键)的碱基。
脱碱基核苷酸可以通过反向键连接。例如,脱碱基核苷酸可经由5'至5'键连接至末端5'核苷酸,或脱碱基核苷酸可经由3'至3'键连接至末端3'核苷酸。在末端5'或3'核苷酸处的反向脱碱基核苷酸也可称为反向脱碱基端帽。
在一个实例中,5'端处的前三个、四个或五个核苷酸中的一个或多个,以及3'端处的最后三个、四个或五个核苷酸中的一个或多个被修饰。修饰可以是,例如,2'-O-Me、2'-F、反向脱碱基核苷酸、硫代磷酸酯键或其它众所周知的提高稳定性和/或性能的核苷酸修饰。
在另一个实例中,5'端处的前四个核苷酸和3'端处的最后四个核苷酸可以用硫代磷酸酯键链接。
在另一个实例中,5'端处的前三个核苷酸和3'端处的最后三个核苷酸可以包含2'-O-甲基(2'-O-Me)修饰的核苷酸。在另一个实例中,5'端处的前三个核苷酸和3'端处的最后三个核苷酸包含2'-氟(2'-F)修饰的核苷酸。在另一个实例中,5'端处的前三个核苷酸和3'端处的最后三个核苷酸包含反向脱碱基核苷酸。
在一些向导RNA(例如,单向导RNA)中,向导RNA的至少一个环(例如,两个环)通过插入与一个或多个衔接子(即,衔接蛋白或结构域)结合的不同RNA序列而被修饰.此类衔接蛋白可以用于进一步募集一个或多个异源功能域,如转录激活域。包括此类衔接蛋白(即,嵌合衔接蛋白)的融合蛋白的实例在本文别处公开。例如,MS2结合环ggccAACAUGAGGAUCACCCAUGUCUGCAGggcc(SEQ ID NO:16)可以替换SEQ ID NO:12、14、52或53所示的sgRNA支架(主链)或WO 2016/049258和Konermann等人(2015)《自然》517(7536):583-588中所描述的酿脓链球菌CRISPR/Cas9系统的sgRNA主链的核苷酸+13至+16和核苷酸+53至+56,这些文献中的每一个以全文引用的方式并入本文用于所有目的。参见例如图3。本文所使用的向导RNA编号是指向导RNA支架序列(即,向导RNA的DNA靶向区段下游的序列)中的核苷酸编号。例如,向导RNA支架的第一个核苷酸是+1,支架的第二个核苷酸是+2,等等。与SEQ ID NO:12、14、52或53中的核苷酸+13至+16相对应的残基是跨越SEQ ID NO:12、14、52或53中的核苷酸+9至+21的区域(本文中被称为四环的区域)中的环序列。与SEQ ID NO:12、14、52或53中的核苷酸+53至+56相对应的残基是跨越SEQ ID NO:12、14、52或53中的核苷酸+48至+61的区域(本文中被称为茎环2的区域)中的环序列。SEQ ID NO:12、14、52或53中的其它茎环序列包含茎环1(核苷酸+33至+41)和茎环3(核苷酸+63至+75)。所得结构是其中四环和茎环2序列中的每一个都被MS2结合环替代的sgRNA支架。四环和茎环2以使得添加MS2结合环不应干扰任何Cas9残基的方式从Cas9蛋白中突出。另外地,四环和茎环2位点与DNA的接近表明定位到这些定位可能导致DNA与任何募集的蛋白质如转录激活因子之间的高度相互作用。因此,在一些sgRNA中,对应于SEQ ID NO:12、14、52或53所示的向导RNA支架的+13至+16的核苷酸和/或对应于+53至+56的核苷酸或对应残基在与这些支架/主链中的任一个支架/主链最佳比对时被能够与一个或多个衔接蛋白或域结合的不同RNA序列替换。可替代地或另外地,可以将衔接结合序列添加到向导RNA的5'端或3'端。在四环和茎环2区域中包含MS2结合环的示范性向导RNA支架可以包含SEQ ID NO:40或56所示的序列、基本上由其组成或由其组成。在四环和茎环2区域中包含MS2结合环的示范性通用单个向导RNA可以包含SEQID NO:45或57所示的序列、基本上由其组成或由其组成。
可以以任何形式提供向导RNA。例如,gRNA可以以RNA的形式提供,作为两个分子(单独的crRNA和tracrRNA)或作为一个分子(sgRNA),并且任选地以与Cas蛋白的复合物的形式提供。gRNA也可以以对gRNA进行编码的DNA的形式提供。对gRNA进行编码的DNA可以编码单个RNA分子(sgRNA)或单独的RNA分子(例如,单独的crRNA和tracrRNA)。在后一种情况下,对gRNA进行编码的DNA可以作为一个DNA分子或作为分别对crRNA和tracrRNA进行编码的单独DNA分子提供。
当gRNA以DNA的形式提供时,gRNA可以在细胞中瞬时、有条件或组成型表达。对gRNA进行编码的DNA可以稳定地整合到细胞的基因组中,并且与在细胞中具有活性的启动子可操作地连接。可替代地,对gRNA进行编码的DNA可以与表达构建体中的启动子可操作地连接。例如,编码gRNA的DNA可以处于包含异源核酸的载体中。可以用于此类表达构建体的启动子包括在例如真核细胞、非人真核细胞、动物细胞、非人动物细胞、哺乳动物细胞、非人哺乳动物细胞、人细胞、非人细胞、啮齿动物细胞、小鼠细胞、多能细胞、胚胎干(ES)细胞、成体干细胞、发育受限的祖细胞、诱导的多能干(iPS)细胞或单细胞期胚胎中的一个或多个中具有活性的启动子。此类启动子可以是例如条件启动子、诱导型启动子、组成型启动子或组织特异性启动子。此类启动子也可以是例如双向启动子。合适启动子的具体实例包含RNA聚合酶III启动子,如人U6启动子、大鼠U6聚合酶III启动子或小鼠U6聚合酶III启动子。
可替代地,可以通过各种其它方法制备gRNA。例如,可以使用例如T7 RNA聚合酶通过体外转录制备gRNA(参见例如,WO 2014/089290和WO 2014/065596,所述文献中的每个文献出于所有目的通过引用整体并入本文)。向导RNA也可以是通过化学合成制备的合成产生的分子。例如,可以化学合成向导RNA以在前三个5'和3'端RNA残基处包括2'-O-甲基类似物和3'硫代磷酸酯核苷酸间键。
向导RNA(或对向导RNA进行编码的核酸)可以在包括一个或多个向导RNA(例如,1个、2个、3个、4个或更多个向导RNA)和增加向导RNA稳定性(例如,延长在给定储存条件(例如,-20℃、4℃或环境温度)下降解产物保持在阈值以下的时间,如低于起始核酸或蛋白质重量的0.5%;或增加体内稳定性)的载体的组合物中。此类载体的非限制性实例包含聚乳酸(PLA)微球体、聚(D,L-乳酸-乙醇酸共聚物)(PLGA)微球体、脂质体、胶束、反胶束、脂质螺旋体和脂质微管。此类组合物可以进一步包括Cas蛋白,如Cas9蛋白,或对Cas蛋白进行编码的核酸。
(2)向导RNA靶序列
用于向导RNA的靶DNA包含存在于DNA中的核酸序列,gRNA的DNA靶向区段将与其结合,前提是存在足够的结合条件。合适的DNA/RNA结合条件包含细胞中通常存在的生理条件。其它合适的DNA/RNA结合条件(例如,无细胞系统中的条件)是本领域已知的(参见例如,《分子克隆:实验室手册》,第3版(Sambrook等人,海港实验室出版社(Harbor LaboratoryPress)2001),所述文献出于所有目的通过引用整体并入本文)。与gRNA互补并杂交的靶DNA的链可以被称为“互补链”,并且与“互补链”互补(并且因此不与Cas蛋白或gRNA互补)的靶DNA的链可以称为“非互补链”或“模板链”。
靶DNA包含与向导RNA杂交的互补链上的序列和非互补链上的对应序列(例如,与前间区序列邻近基序(PAM)邻近)。如本文所使用的,术语“向导RNA靶序列”具体指非互补链上的与向导RNA在互补链上与其杂交的序列相对应(即,其反向补体)的序列。即,向导RNA靶序列是指非互补链上的与PAM相邻(例如,在Cas9的情况下,PAM的上游或5')的序列。向导RNA靶序列等同于向导RNA的DNA靶向区段,但具有胸腺嘧啶而不是尿嘧啶。举例来说,SpCas9酶的向导RNA靶序列可以指非互补链上的5'-NGG-3'PAM上游的序列。向导RNA被设计成与靶DNA的互补链互补,其中向导RNA的DNA靶向区段与靶DNA的互补链之间的杂交促进了CRISPR复合物的形成。不一定需要完全互补,条件是存在足够的互补性来引起杂交并促进CRISPR复合物的形成。如果向导RNA在本文中被称为靶向向导RNA靶序列,则意味着向导RNA与靶DNA的互补链序列杂交,所述互补链序列是非互补链上的向导RNA靶序列的反向补体。
靶DNA或向导RNA靶序列可以包括任何多核苷酸,并且可以定位于例如细胞的细胞核或细胞质中或细胞的细胞器如线粒体或叶绿体内。靶DNA或向导RNA靶序列可以是细胞内源性或外源性的任何核酸序列。向导RNA靶序列可以是编码基因产物(例如,蛋白质)的序列或非编码序列(例如,调节序列)或者可以包含两者。
优选的可以是靶序列与基因的转录起始位点邻近。例如,靶序列可以在转录起始位点1000、900、800、700、600、500、400、300、200、190、180、170、160、150、140、130、120、110、100、90、80、70、60、50、40、30、20、10、5或1个碱基对内、在转录起始位点上游1000、900、800、700、600、500、400、300、200、190、180、170、160、150、140、130、120、110、100、90、80、70、60、50、40、30、20、10、5或1个碱基对内,或者在转录起始位点下游1000、900、800、700、600、500、400、300、200、190、180、170、160、150、140、130、120、110、100、90、80、70、60、50、40、30、20、10、5或1个碱基对内。任选地,靶序列处于转录起始位点上游200个碱基对和转录起始位点下游1个碱基对的区域内(-200到+1)。
靶序列可以在希望被靶向以用于转录激活的任何基因内。在一些情况下,靶基因可以是非表达基因或弱表达基因(例如,仅在背景之上最低限度地表达,如1.1倍、1.2倍、1.3倍、1.4倍、1.5倍、1.6倍、1.7倍、1.8倍、1.9倍或2倍)。与对照基因相比,靶基因也可以是低水平表达的基因。靶基因也可以是表观遗传沉默的基因。术语“表观遗传沉默”是指由于遗传变化以外的机制(如突变),没有被转录或被转录的水平相对于对照样品(例如,对应的对照细胞,如正常细胞)中的基因的转录水平降低的基因。基因沉默的表观遗传机制是众所周知的,并且包括例如基因的5'调控区域的CpG岛中CpG二核苷酸的高甲基化和由于例如组蛋白乙酰化引起的染色质中的结构变化,使得基因转录被减少或抑制。
靶基因可以包括在特定器官或组织(如肝脏)中表达的基因。靶基因可以包括疾病相关联基因。疾病相关联基因是指与未患病对照的组织或细胞相比,在来源于受疾病影响的组织的细胞中以异常水平或异常形式产生转录或翻译产物的任何基因。它可能是以异常高水平表达的基因,其中改变的表达与疾病的发生和/或发展相关。疾病相关联基因也指具有导致疾病病因的突变或遗传变异的基因。转录或翻译的产物可能是已知的或未知的,并且可能处于正常或异常水平。例如,靶基因可以是与蛋白聚集疾病和病症相关联的基因,如阿尔茨海默病、帕金森病、亨廷顿病、肌萎缩侧索硬化症、朊病毒病和淀粉样变性如转甲状腺素蛋白淀粉样变性(例如,Ttr)。靶基因还可以是涉及与疾病或病症(如高胆固醇血症或动脉粥样硬化)相关的途径的基因,或者当过表达时可以模拟此类疾病或病症的基因。靶基因还可以是在一个或多个类型的癌症中表达或过表达的基因。参见例如Santarius等人(2010)《癌症自然评论(Nat.Rev.Cancer)》10(1):59-64,该文献以全文引用的方式并入本文用于所有目的。
此类靶基因的一个具体实例是Ttr基因。任选地,Ttr基因可以包含致病突变(例如,引起淀粉样变性的突变)。此类突变的实例例如在WO 2018/007871中提供,该文献以全文引用的方式并入本文用于所有目的。示范性人TTR蛋白和示范性人TTR基因分别由UniProt ID P02766和Entrez Gene ID 7276鉴别。示范性小鼠TTR蛋白和示范性小鼠Ttr基因分别由UniProt ID P07309和Entrez Gene ID 22139鉴别。转甲状腺素蛋白(TTR)是一种在血清和脑脊液中发现的蛋白质,其携带甲状腺激素和视黄醇结合蛋白至视黄醇。肝脏将TTR分泌到血液中,而脉络丛将其分泌到脑脊液中。TTR也在视网膜色素上皮中产生并且分泌到玻璃体中。错误折叠和聚集的TTR在淀粉样蛋白疾病老年系统性淀粉样变性(SSA)、家族性淀粉样蛋白多发性神经病变(FAP)和家族性淀粉样蛋白心肌病(FAC)中的多个组织和器官中积聚。转甲状腺素蛋白(TTR)是一种127-氨基酸、55kDa血清和脑脊液转运蛋白,主要由肝脏合成,但也由脉络丛产生。其还被称为前白蛋白、甲状腺素结合前白蛋白、ATTR、TBPA、CTS、CTS1、HEL111、HsT2651和PALB。在其天然状态下,TTR以四聚体的形式存在。在纯合子中,同源四聚体包括相同的富含127-氨基酸β片层亚基。在杂合子中,TTR四聚体可以由变体和/或野生型亚基组成,通常以统计学方式组合。TTR负责在血清和脑脊液中携带甲状腺素(T4)和视黄醇结合的RBP(视黄醇结合蛋白)。小鼠Ttr基因中的向导RNA靶序列(不包括PAM)的实例分别在SEQ ID NO:34、35和36中示出。SEQ ID NO:34位于Ttr转录起始位点的-63(基因组坐标:build mm10,chr18,+链,20665187–20665209),SEQ ID NO:35位于Ttr转录起始位点的-134(基因组坐标:build mm10,chr18,+链,20665116–20665138),并且SEQ IDNO:36位于Ttr转录起始位点的-112(基因组坐标:build mm10,chr18,+链,20665138–20665160)。对应于分别在SEQ ID NO:34、35和36中示出的向导RNA靶序列的向导RNA DNA靶向区段分别在SEQ ID NO:41、42和43中示出。包含这些DNA靶向区段的单个向导RNA的实例分别在SEQ ID NO:37、38和39或55中示出。
疾病相关联基因还可以包括在受试者中该基因产生的增加将是有益的任何基因(例如,以治疗或预防疾病)。此类基因可以是其低表达或低水平表达与疾病、病症或综合征相关联或者成为疾病、病症或综合征的病因的基因。例如,此类靶基因的转录减少、来自此类靶基因的基因产物量减少,或来自此类靶基因的基因产物的活性降低可能与疾病相关联、可能使疾病恶化,或者可能引起疾病,使得靶基因的转录或表达增加将是有益的。此类基因的一个实例是OTC(Entrez Gene ID 5009)。此类基因的其它实例是HBG1(Entrez GeneID 3047)和HBG2(Entrez Gene ID 3048)。此类基因的其它实例包括单倍体不足基因,如表2和3中的那些。
Cas蛋白对靶DNA的位点特异性结合和切割可以发生在由(i)向导RNA与靶DNA的互补链之间的碱基配对互补性和(ii)靶DNA的非互补链中的短基序(被称为原型间隔子相邻基序(PAM))两者测定的定位处。PAM可以侧接向导RNA靶序列。任选地,向导RNA靶序列可以在3'末端上侧接有PAM(例如,对于Cas9)。可替代地,向导RNA靶序列可以在5'末端上侧接有PAM(例如,对于Cpf1)。例如,Cas蛋白的切割位点可以是PAM序列上游或下游(例如,向导RNA靶序列内)的约1到约10或约2到约5个碱基对(例如,3个碱基对)。在SpCas9的情况下,PAM序列(即,非互补链上)可以是5'-N1GG-3',其中N1是任何DNA核苷酸,并且PAM紧接着靶DNA的非互补链上的向导RNA靶序列的3'。因此,对应于互补链上的PAM的序列(即,反向补体)将是5'-CCN2-3',其中N2是任何DNA核苷酸并且紧接着向导RNA的DNA靶向片段在靶DNA的互补链上与其杂交的序列的5'。在一些此类情况下,N1和N2可以是互补的,并且N1-N2碱基对可以是任何碱基对(例如,N1=C并且N2=G;N1=G并且N2=C;N1=A并且N2=T;或N1=T并且N2=A)。在来自金黄色葡萄球菌的Cas9的情况下,PAM可以是NNGRRT或NNGRR,其中N可以是A、G、C或T,并且R可以是G或A。在来自空肠弯曲杆菌的Cas9的情况下,PAM可以是例如NNNNACAC或NNNNRYAC,其中N可以是A、G、C或T,并且R可以是G或A。在一些情况下(例如,对于FnCpf1),PAM序列可以是5'末端上游并具有序列5'-TTN-3'。
向导RNA靶序列的实例是紧接在SpCas9蛋白识别的NGG基序之前的20个核苷酸的DNA序列。例如,向导RNA靶序列加PAM的两个实例是GN19NGG(SEQ ID NO:17)或N20NGG(SEQID NO:18)。参见例如,WO 2014/165825,所述文献出于所有目的通过引用整体并入本文。5'末端处的鸟嘌呤可以促进细胞中RNA聚合酶的转录。向导RNA靶序列加PAM的其它实例可以包括5'末端处的两个鸟嘌呤核苷酸(例如,GGN20NGG;SEQ ID NO:19)以促进体外T7聚合酶的高效转录。参见例如,WO 2014/065596,所述文献出于所有目的通过引用整体并入本文。其它向导RNA靶序列加PAM可以具有长度介于4至22个核苷酸之间的SEQ ID NO:17至19,包括5'G或GG和3'GG或NGG。又其它向导RNA靶序列加PAM可以具有长度介于14至20个核苷酸之间的SEQ ID NO:17至19。
与靶DNA杂交的CRISPR复合物的形成可以导致在对应于向导RNA靶序列(即,靶DNA的非互补链上的向导RNA靶序列和互补链上的向导RNA与其杂交的反向补体)的区域内或附近的靶DNA的一条或两条链的切割。例如,切割位点可以处于向导RNA靶序列内(例如,处于相对于PAM序列的所定义的定位处)。“切割位点”包含Cas蛋白产生单链断裂或双链断裂的靶DNA的位置。切割位点可以仅在双链DNA的一条链上(例如,当使用切口酶时)或在两条链上。切割位点可以在两条链上的相同位置处(产生平端;例如,Cas9))或可以在每条链上的不同位点处(产生交错末端(即,突出端);例如,Cpf1)。例如,可以通过使用两种Cas蛋白产生交错末端,其中每一种在不同链的不同切割位点处产生单链断裂,从而产生双链断裂。例如,第一切口酶可以在双链DNA(dsDNA)的第一条链上产生单链断裂,并且第二切口酶可以在dsDNA的第二条链上产生单链断裂,使得产生突出序列。在一些情况下,第一链上的切口酶的向导RNA靶序列或切割位点与第二链上的切口酶的向导RNA靶序列或切割位点相隔至少2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个、25个、30个、40个、50个、75个、100个、250个、500个或1,000个碱基对。
D.编码嵌合Cas蛋白、嵌合衔接蛋白、向导RNA或协同激活介体的核酸
本文别处详细描述的嵌合Cas蛋白、嵌合衔接蛋白和向导RNA可以在本文公开的方法和组合物中以核酸(例如,DNA或RNA)的形式提供。例如,核酸可以是嵌合Cas蛋白表达盒、嵌合衔接蛋白表达盒、协同激活介体(SAM)表达盒(其包含编码嵌合Cas蛋白和嵌合衔接蛋白两者的核酸)、向导RNA表达盒,或其任何组合。此类核酸可以是RNA(例如,信使RNA(mRNA))或DNA,可以是单链或双链的,并且可以是线性的或环状的。例如,核酸可以是嵌合Cas蛋白mRNA、嵌合衔接蛋白mRNA、协同激活介体(SAM)mRNA(其包含编码嵌合Cas蛋白和嵌合衔接蛋白两者的核酸)、向导RNA,或其任何组合。DNA可以是如表达载体或靶向载体等载体的一部分。载体还可以是病毒载体,如腺病毒、腺关联病毒、慢病毒和逆转录病毒载体。当本文公开的核酸中的任一个被引入细胞中时,经编码的嵌合DNA靶向蛋白、嵌合衔接蛋白或向导RNA可以在细胞中进行瞬时、条件性或组成性表达。
任选地,可以对核酸进行密码子优化以在特定细胞或生物体中有效翻译成蛋白。例如,与天然存在的多核苷酸序列相比,可以修饰核酸以取代在真核细胞、非人真核细胞、动物细胞、非人动物细胞、哺乳动物细胞、非人哺乳动物细胞、人细胞、非人细胞、啮齿动物细胞、小鼠细胞、大鼠细胞或任何其它感兴趣的宿主细胞中具有更高使用频率的密码子。
在一些组合物和方法中,Cas蛋白、嵌合衔接蛋白和向导RNA可以以RNA的形式提供。此类RNA可以是经修饰的RNA。参见例如WO 2017/173054、US 2019/0136231和WO2018/107028,它们中的每一个以全文引用的方式并入本文用于所有目的。例如,RNA中的一个或多个可以被修饰成包含5'末端和/或3'末端处的一个或多个稳定末端修饰。此类修饰可以包括例如5'末端和/或3'末端处的一个或多个硫代磷酸酯键或5'末端和/或3'末端(例如,5'端或3'端)处的一个或多个2'-O-甲基修饰。作为一个实例,至少5'末端的前1、2、3或4个核苷酸可以被修饰,并且至少3'末端的最后1、2、3或4个核苷酸可以被修饰。例如,此类修饰可以包括在5'末端的前1、2、3或4个核苷酸处的2'-O-甲基修饰的核苷酸和/或在3'末端的最后1、2、3或4个核苷酸处的2'-O-甲基修饰的核苷酸。附加地或替代地,此类修饰可以包括例如在5'末端的前四个核苷酸中的一个或多个之间或在3'末端的最后四个核苷酸中的一个或多个之间的硫代、磷酸酯键。例如,5'末端的前四个核苷酸可以通过硫代磷酸酯键链接,和/或3'末端的最后四个核苷酸可以通过硫代磷酸酯键链接。在具体实例中,RNA(例如,向导RNA,如化学合成的向导RNA)在前三个5'和3'端RNA残基处包括2'-O-甲基类似物和3'硫代磷酸酯核苷酸间键。此类化学修饰可以例如提供更大的稳定性和防止核酸外切酶向导RNA,允许所述向导RNA比未经修饰的向导RNA在细胞内持续更长时间。例如,此类化学修饰还可以防止先天的细胞内免疫应答,所述先天的细胞内免疫应答可以主动降解RNA或触发导致细胞死亡的免疫级联反应。
经修饰的核苷或核苷酸可以存在于向导RNA或mRNA中。包含一个或多个经修饰核苷或核苷酸的向导RNA或mRNA称为经修饰RNA,以描述一个或多个非天然和/或天然存在的组分或构型的存在,这些组分或构型用于替代或补充标准A、G、C和U残基。经修饰的核苷和核苷酸可以包括以下各项中的一个或多个:(1)磷酸二酯主链键中的非连接磷酸氧中的一个或两个和/或连接磷酸氧中的一个或多个的改变或替换(主链修饰);(2)核糖的组成的改变或替换(例如,核糖上的2'羟基的改变或替换)(糖修饰);(3)用脱磷接头批量替换磷酸酯部分(主链修饰);(4)天然存在的核碱基的修饰或替换(例如,用非标准核碱基)(碱基修饰);(5)核糖-磷酸酯主链的替换或修饰(主链修饰);(6)寡核苷酸的3'末端或5'末端的修饰(例如,末端磷酸基团的去除、修饰或替换,或部分、帽或接头的缀合(此类3'或5'帽修饰可以包含糖和/或主链修饰));以及(7)糖的修饰或替换(糖修饰)。
可以组合修饰以提供包含核苷和核苷酸(残基)的经修饰RNA,其可以具有两个、三个、四个或更多个修饰。例如,经修饰残基可以具有经修饰的糖和经修饰的核碱基。在一些实例中,gRNA或mRNA的每个碱基均被修饰(例如,所有碱基均具有经修饰的磷酸基团,如硫代磷酸酯基团)。例如,gRNA或mRNA分子的所有或基本上所有磷酸基团均可以被硫代磷酸酯基团替换。在其它实例中,经修饰的RNA在RNA的5'末端处或其附近和/或在RNA的3'末端处或其附近包含至少一个经修饰残基。
在一些实例中,经修饰的gRNA或mRNA包含一个、两个、三个或更多个经修饰残基。在一些实例中,gRNA或mRNA在gRNA或mRNA的5'和3'末端中的每一个处包含一个、两个、三个或更多个经修饰残基。在一些实例中,经修饰的mRNA包含5、10、15、50、100、200、300、400、500、600、700、800、900、1000或更多个经修饰残基。在一些实例中,经修饰的gRNA或mRNA中至少5%(例如,至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或约100%)的的位置是经修饰的核苷或核苷酸。
未经修饰的核酸可能易于被例如细胞核酸酶降解。例如,核酸酶可以水解核酸磷酸二酯键。为了提供稳定性,本文所述的RNA(例如,向导RNA或嵌合Cas蛋白mRNA或嵌合衔接蛋白mRNA)可以含有一个或多个经修饰的核苷或核苷酸。在一些实例中,本文所述的经修饰的RNA分子在体内和离体引入细胞群时可以表现出降低的先天免疫响应。术语先天性免疫响应包括对外源核酸(包括单链核酸)的细胞响应,其涉及诱导细胞因子表达和释放(特别是干扰素),以及细胞死亡。
在主链修饰的一些实例中,经修饰残基的磷酸基团可以通过用不同的取代基替换氧中的一个或多个来修饰。此外,经修饰残基(例如,经修饰的核酸中存在的经修饰残基)可以包括用如本文所述的经修饰的磷酸基团批量替换未经修饰的磷酸酯部分。在一些实例中,磷酸酯主链的主链修饰可以包括导致不带电接头或具有不对称电荷分布的带电接头的改变。
经修饰磷酸基团的实例包括硫代磷酸酯、硒代磷酸酯、硼酸磷酸酯、硼酸磷酸酯、膦酸氢酯、亚氨代磷酸酯、烷基或芳基膦酸酯和磷酸三酯。未经修饰的磷酸基团中的磷原子是非手性的。然而,用上述原子或原子团中的一个替换非桥接氧中的一个可以使磷原子手性。立体异构磷原子可以具有“R”构型或“S”构型。主链也可以通过用氮(桥接的亚氨代磷酸酯)、硫(桥接的硫代磷酸酯)和碳(桥接的亚甲基膦酸酯)替换桥接氧(即,将磷酸酯与核苷链接的氧)来修饰。替换可以发生在链接氧处或两个链接氧处。
在某些主链修饰中,磷酸基团可以被不含磷的连接头替换。例如,带电荷的磷酸基团可以被中性部分替换。可以替换磷酸基团的部分的实例包括例如膦酸甲酯、羟氨基、硅氧烷、碳酸酯、羧甲基、氨基甲酸酯、酰胺、硫醚、环氧乙烷接头、磺酸酯、磺酰胺、硫代甲缩醛、甲缩醛、肟、亚甲基亚氨基、亚甲基甲基亚氨基、亚甲基肼基、亚甲基二甲基肼基和亚甲基氧基甲基亚氨基。
也可以构建可以模拟核酸的支架,其中磷酸酯接头和核糖被核酸酶抗性核苷或核苷酸替代物替换。此类修饰可以包含主链和糖修饰。例如,核碱基可以由替代主链拴系。实例包括吗啉代、环丁基、吡咯烷和肽核酸(PNA)核苷替代物。
经修饰的核苷和经修饰的核苷酸还可以包括对糖基团的一个或多个修饰。例如,2'羟基(OH)可以被多个不同的氧或脱氧取代基修饰或替换。对2'羟基的此类修饰可以增强核酸的稳定性,因为羟基不能再被去质子化以形成2'-醇盐离子。
2'羟基修饰的实例包括烷氧基或芳氧基(OR,其中R可以是例如烷基、环烷基、芳基、芳烷基、杂芳基或糖)或聚乙二醇(PEG)、O(CH2CH2O)nCH2CH2OR,其中R可以是例如H或任选取代的烷基,并且n可以是0至20的整数(例如0至4、0至8、0至10、0至16、1至4、1至8、1至10、1至16、1至20、2至4、2至8、2至10、2至16、2至20、4至8、4至10、4至16和4至20)。在一个实例中,2'羟基修饰可以是2'-O-Me。在另一个实例中,2'羟基修饰可以是2'-氟修饰,其用氟化物替换2'羟基。在其它实例中,2'羟基修饰可以包括锁定核酸(LNA),其中2'羟基可以例如通过C1-6亚烷基或C1-6杂亚烷基桥接到相同核糖的4'碳。示范性桥可以包括亚甲基、丙烯、醚或氨基桥;O-氨基(其中氨基可以是例如NH2;烷基氨基、二烷基氨基、杂环基、芳基氨基、二芳基氨基、杂芳基氨基或二杂芳基氨基、乙二胺或聚氨基)和氨基烷氧基、O(CH2)n-氨基(其中氨基可以是例如NH2、烷基氨基、二烷基氨基、杂环基、芳基氨基、二芳基氨基、杂芳基氨基或二杂芳基氨基、乙二胺或聚氨基)。在一些实例中,2'羟基修饰可以包括未锁定的核酸(UNA),其中核糖环缺少C2'-C3'键。在一些实例中,2'羟基修饰可以包括甲氧基乙基(MOE),(OCH2CH2OCH3,例如,PEG衍生物)。
脱氧2'修饰可以包括氢(即,脱氧核糖,例如,在部分dsRNA的突出部分);卤素(例如,溴、氯、氟或碘);氨基(其中氨基可以是例如-NH2、烷基氨基、二烷基氨基、杂环基、芳基氨基、二芳基氨基、杂芳基氨基、二杂芳基氨基或氨基酸);NH(CH2CH2NH)nCH2CH2-氨基(其中氨基可以是,例如,如本文所述)、-NHC(O)R(其中R可以是,例如,烷基、环烷基、芳基、芳烷基,杂芳基或糖)、氰基;巯基;烷基硫代烷基;硫代烷氧基;以及烷基、环烷基、芳基、烯基和炔基,它们可以任选地被例如本文所述的氨基取代。
糖修饰可以包含糖基团,该糖基团还可以含有具有与核糖中对应碳的立体化学构型相反的立体化学构型的一个或多个碳。因此,经修饰的核酸可以包括含有例如阿拉伯糖作为糖的核苷酸。经修饰的核酸还可以包括脱碱基糖。这些脱碱基糖也可以在组成糖原子中的一个或多个处被进一步修饰。经修饰的核酸还可以包括呈L形式的一个或多个糖(例如,L-核苷)。
本文所述的经修饰核苷和经修饰核苷酸(其可掺入经修饰核酸中)可以包括经修饰的碱基,也称为核碱基。核碱基的实例包括但不限于腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和尿嘧啶(U)。这些核碱基可以被修饰或完全替换以提供可以掺入经修饰核酸中的经修饰残基。核苷酸的核碱基可以独立地选自嘌呤、嘧啶、嘌呤类似物或嘧啶类似物。在一些实例中,核碱基可以包括例如碱基的天然存在和合成衍生物。
gRNA或mRNA的一端或两端处的一个或多个残基可以被化学修饰,或者整个gRNA或mRNA可以被化学修饰。一些实例包含5'末端修饰。一些示例实施例包含3'末端修饰。在某些gRNA中,gRNA分子单链突出端中的一个或多个或所有核苷酸均为脱氧核苷酸。在某些经修饰的mRNA中,mRNA可以含有5'末端和/或3'末端修饰。
可以修饰作为mRNA提供的嵌合Cas蛋白、嵌合衔接蛋白或这两者以提高稳定性和/或免疫原性特性。可以对mRNA内的一种或多种核苷进行修饰。对mRNA核碱基的化学修饰的实例包括假尿苷、1-甲基-假尿苷和5-甲基-胞苷。编码嵌合Cas蛋白的mRNA、编码嵌合衔接蛋白的mRNA或编码两者的SAM mRNA也可以被加帽。帽可以是,例如,其中+1核糖核苷酸在核糖的2'O位置被甲基化的帽1结构。例如,加帽可以在体内产生优异的活性(例如,通过模拟天然帽),可以产生减少对宿主先天免疫系统的刺激的天然结构(例如,可以减少先天免疫系统中的模式识别受体的激活)。编码嵌合Cas蛋白的mRNA、编码嵌合衔接蛋白的mRNA或编码两者的SAM mRNA也可以被聚腺苷酸化(以包含聚(A)尾)。编码嵌合Cas蛋白的mRNA、编码嵌合衔接蛋白的mRNA或编码两者的SAM mRNA也可以被修饰以包括假尿苷(例如,可以被假尿苷完全取代)。例如,可以使用含有N1-甲基假尿苷的加帽和聚腺苷酸化的嵌合Cas mRNA、嵌合衔接蛋白mRNA或SAM mRNA。同样地,嵌合Cas mRNA、嵌合衔接蛋白mRNA或SAM mRNA可以通过使用同义密码子消耗尿苷来修饰。其它可能的修饰在本文别处更详细地描述。
可以修饰作为mRNA提供的嵌合Cas蛋白和/或嵌合衔接蛋白以提高稳定性和/或免疫原性特性。可以对mRNA内的一种或多种核苷进行修饰。对mRNA核碱基的化学修饰的实例包括假尿苷、1-甲基-假尿苷和5-甲基-胞苷。编码嵌合Cas蛋白的mRNA、编码嵌合衔接蛋白的mRNA或编码两者的SAM mRNA也可以被加帽。帽可以是,例如,其中+1核糖核苷酸在核糖的2'O位置被甲基化的帽1结构。例如,加帽可以在体内产生优异的活性(例如,通过模拟天然帽),可以产生减少对宿主先天免疫系统的刺激的天然结构(例如,可以减少先天免疫系统中的模式识别受体的激活)。编码嵌合Cas蛋白的mRNA、编码嵌合衔接蛋白的mRNA或编码两者的SAM mRNA也可以被聚腺苷酸化(以包含聚(A)尾)。编码嵌合Cas蛋白的mRNA、编码嵌合衔接蛋白的mRNA或编码两者的SAM mRNA也可以被修饰以包括假尿苷(例如,可以被假尿苷完全取代)。例如,可以使用含有N1-甲基假尿苷的加帽和聚腺苷酸化的嵌合Cas mRNA、嵌合衔接蛋白或SAM mRNA。同样地,嵌合Cas mRNA、嵌合衔接蛋白mRNA或SAM mRNA可以通过使用同义密码子消耗尿苷来修饰。
嵌合Cas mRNA、嵌合衔接mRNA或SAM mRNA可以在至少一个、多个或所有尿苷位置包含经修饰的尿苷。经修饰的尿苷可以是在5位置被修饰(例如,用卤素、甲基或乙基)的尿苷。经修饰的尿苷可以是在1位置被修饰(例如,用卤素、甲基或乙基)的假尿苷。经修饰的尿苷可以是例如假尿苷、N1-甲基-假尿苷、5-甲氧基尿苷、5-碘尿苷或其组合。在一些实例中,经修饰的尿苷是5-甲氧基尿苷。在一些实例中,经修饰的尿苷是5-碘尿苷。在一些实例中,经修饰的尿苷是假尿苷。在一些实例中,经修饰的尿苷是N1-甲基-假尿苷。在一些实例中,经修饰的尿苷是假尿苷和N1-甲基-假尿苷的组合。在一些实例中,经修饰的尿苷是假尿苷和5-甲氧基尿苷的组合。在一些实例中,经修饰的尿苷是N1-甲基假尿苷和5-甲氧基尿苷的组合。在一些实例中,经修饰的尿苷是5-碘尿苷和N1-甲基-假尿苷的组合。在一些实例中,经修饰的尿苷是假尿苷和5-碘尿苷的组合。在一些实例中,经修饰的尿苷是5-碘尿苷和5-甲氧基尿苷的组合。
本文公开的嵌合Cas mRNA、嵌合衔接蛋白mRNA或SAM mRNA还可以包含5'帽,如Cap0、Cap1或Cap2。5'帽通常是通过5'-三磷酸酯链接到mRNA的5'至3'链的第一核苷酸(即,第一近帽核苷酸)的5'位置的7-甲基鸟嘌呤核糖核苷酸(其可以被进一步修饰,例如,关于ARCA)。在Cap0中,mRNA的第一和第二近帽核苷酸的核糖均包含2'-羟基。在Cap1中,mRNA的第一和第二转录核苷酸的核糖分别包含2'-甲氧基和2'-羟基。在Cap2中,mRNA的第一和第二近帽核苷酸的核糖均包含2'-甲氧基。参见例如Katibah等人(2014)《美国科学院院报(Proc.Natl.Acad.Sci.U.S.A.)》111(33):12025-30和Abbas等人(2017)《美国科学院院报》114(11):E2106-E2115,它们中的每一个以全文引用的方式并入本文用于所有目的。大多数内源性高等真核mRNA,包括哺乳动物mRNA,如人mRNA,均包含Cap1或Cap2。Cap0和其它不同于Cap1和Cap2的帽结构可能在哺乳动物(如人类)中具有免疫原性,因为先天免疫系统的组分(如IFIT-1和IFIT-5)将其识别为非自身,这可能导致细胞因子升高水平(包括I型干扰素)。先天免疫系统的组分如IFIT-1和IFIT-5也可能与eIF4E竞争mRNA与Cap1或Cap2以外的帽的结合,从而潜在地抑制mRNA的翻译。
可以共转录地包括帽。例如,ARCA(抗反向帽类似物;赛默飞世尔科技公司(ThermoFisher Scientific)商品目录号第AM8045号)是包含与鸟嘌呤核糖核苷酸的5'位置链接的7-甲基鸟嘌呤3'-甲氧基-5'-三磷酸酯的帽类似物,其可在体外在起始时掺入转录物中。ARCA产生Cap0帽,其中第一近帽核苷酸的2'位置是羟基。参见例如Stepinski等人,(2001)《RNA》7:1486-1495,该文献以全文引用的方式并入本文用于所有目的。
CleanCapTM AG(m7G(5')ppp(5')(2'OMeA)pG;TriLink生物技术公司商品目录号第N-7113号)或CleanCapTM GG(m7G(5')ppp(5')(2'OMeG)pG;TriLink生物技术公司商品目录号第N-7133号)可用于共转录地提供Cap1结构。3'-O-甲基化版本的CleanCapTM AG和CleanCapTM GG也可从TriLink生物技术公司获得,商品目录号分别为第N-7413和第N-7433号。
替代地,可以在转录后将帽添加到RNA。例如,牛痘加帽酶是可商购的(新英格兰生物实验室(New England Biolabs)商品目录号第M2080S号)并具有由其D1亚基提供的RNA三磷酸酶和鸟苷酸转移酶活性,以及由其D12亚基提供的鸟嘌呤甲基转移酶活性。因此,在S-腺苷甲硫氨酸和GTP的存在下,它可以将7-甲基鸟嘌呤添加到RNA中,从而产生Cap0。参见例如Guo和Moss(1990)《美国科学院院报》87:4023-4027,和Mao和Shuman(1994)《生物化学杂志》269:24472-24479,它们中的每一个以全文引用的方式并入本文用于所有目的。
嵌合Cas mRNA、嵌合衔接蛋白mRNA或SAM mRNA还可以包含聚腺苷酸化(聚A)尾。例如,聚A尾可以包含至少20个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个或至少100个腺嘌呤,以及任选地多达300个腺嘌呤。例如,聚A尾可以包含95、96、97、98、99或100个腺嘌呤核苷酸。
替代地,Cas蛋白、嵌合衔接蛋白和向导RNA可以以DNA的形式提供。DNA或表达盒可以用于稳定整合到细胞或真核生物体(例如,动物、非人动物、哺乳动物或非人哺乳动物)的基因组(即,染色体)中,或者它可以用于在染色体外部表达(例如,染色体外复制DNA)。稳定整合的表达盒或核酸可以随机整合到真核生物体(例如动物、非人动物、哺乳动物或非人哺乳动物)的基因组中(即,转基因),或者它们可以整合到真核生物体(例如,动物、非人动物、哺乳动物或非人哺乳动物)的基因组的预定区域中(即,敲入)。
本文所述的核酸或表达盒可以可操作地链接到任何合适的启动子以在真核生物体(例如,动物、非人动物、哺乳动物或非人哺乳动物)体内表达或离体在细胞内表达。真核生物体(例如,动物、非人动物、哺乳动物或非人哺乳动物)可以是如本文别处所述的任何合适的真核生物体(例如,动物、非人动物、哺乳动物或非人哺乳动物)。作为一个实例,核酸或表达盒(例如,嵌合Cas蛋白表达盒、嵌合衔接蛋白表达盒或包含编码嵌合Cas蛋白和嵌合衔接蛋白两者的核酸的SAM盒)可以用于可操作地链接到基因组基因座处的内源启动子。替代地,盒核酸或表达盒可以可操作地链接到外源启动子,如组成型活性启动子(例如,CAG启动子或U6启动子)、条件型启动子、诱导型启动子、时间受限启动子(例如,发育调控启动子)或空间受限启动子(例如,细胞特异性或组织特异性启动子)。此类启动子是众所周知的并且在本文别处讨论。可以在表达构建体中使用的启动子包括例如在真核细胞、非人真核细胞、动物细胞、非人动物细胞、哺乳动物细胞、非人哺乳动物细胞、人细胞、非人细胞、啮齿动物细胞、小鼠细胞、大鼠细胞、仓鼠细胞、兔细胞、多能细胞、胚胎干(ES)细胞或合子中的一个或多个中具有活性的启动子。此类启动子可以是例如条件启动子、诱导型启动子、组成型启动子或组织特异性启动子。
例如,编码向导RNA的核酸可以可操作地链接到U6启动子,如人U6启动子或小鼠U6启动子。合适的启动子(例如,用于表达向导RNA)的具体实例包括RNA聚合酶III启动子,如人U6启动子、大鼠U6聚合酶III启动子或小鼠U6聚合酶III启动子。
任选地,启动子可以是驱动一个基因(例如,编码嵌合Cas蛋白的基因)和另一个方向上的第二基因(例如,编码向导RNA或嵌合衔接蛋白的基因)的表达的双向启动子。此类双向启动子可以由以下各项组成:(1)含有3个外部控制元件:远侧序列元件(DSE)、近侧序列元件(PSE)和TATA框的完整的、常规的、单向的Pol III启动子;(2)包括在相反定向上与DSE的5'末端融合的PSE和TATA盒的第二基本Pol III启动子。例如,在H1启动子中,DSE邻近PSE和TATA框,并且可以通过产生杂合启动子使启动子双向化,其中通过源自U6启动子的附加PSE和TATA盒来控制反向转录。参见例如US 2016/0074535,所述文献出于所有目的通过引用整体并入本文。使用双向启动子同时表达两个基因允许生成紧凑的表达盒以促进递送。
核酸中的一个或多个可以一起在多顺反子表达构建体或多顺反子信使RNA中。例如,编码嵌合Cas蛋白的核酸和编码嵌合衔接蛋白的核酸可以一起在双顺反子表达构建体中。多顺反子表达载体同时表达来自相同mRNA(即,由相同启动子产生的转录物)的两种或更多种单独的蛋白质。用于蛋白质多顺反子表达的合适策略包含例如使用2A肽和使用内部核糖体进入位点(IRES)。例如,此类构建体可以包含:(1)编码一个或多个嵌合Cas蛋白和一个或多个嵌合衔接蛋白的核酸;(2)编码两个或更多个嵌合衔接蛋白的核酸;(3)编码两个或更多个嵌合Cas蛋白的核酸;(4)编码两个或更多个向导RNA的核酸;(5)编码一个或多个嵌合Cas蛋白和一个或多个向导RNA的核酸;(6)编码一个或多个嵌合衔接蛋白和一个或多个向导RNA的核酸;或(7)编码一个或多个嵌合Cas蛋白、一个或多个嵌合衔接蛋白和一个或多个向导RNA的核酸。作为一个实例,此类多顺反子载体可以使用一个或多个内部核糖体进入位点(IRES)以允许从mRNA的内部区域引发翻译。作为另一个实例,此类多顺反子载体可以使用一种或多种2A肽。这些肽是长度通常为18-22个氨基酸的小“自切割”肽,并且从相同mRNA产生等摩尔水平的多个基因。核糖体在2A肽的C端跳过甘氨酰-脯氨酰肽键的合成,从而导致2A肽与其直接下游肽之间的“切割”。参见例如Kim等人(2011)《公共科学图书馆·综合》6(4):e18556,所述文献出于所有目的通过引用整体并入本文。“切割”发生在C端上存在的甘氨酸与脯氨酸残基之间,这意味着上游顺反子将在末端添加一些另外的残基,而下游顺反子将从脯氨酸开始。因此,“切断”的下游肽在其N端具有脯氨酸。2A介导的切割是所有真核细胞中的普遍现象。已从小核糖核酸病毒、昆虫病毒和C型轮状病毒中鉴定出2A肽。参见例如Szymczak等人(2005)《生物疗法专家意见(Expert Opin.Biol.Ther.》5(5):627-638,该文献以全文引用的方式并入本文用于所有目的。可以使用的2A肽的实例包括:Thoseaasigna病毒2A(T2A);猪捷申病毒-12A(P2A);马鼻炎A病毒(ERAV)2A(E2A);以及FMDV2A(F2A)。示范性T2A、P2A、E2A和F2A序列包括以下各项:T2A(EGRGSLLTCGDVEENPGP;SEQ IDNO:20);P2A(ATNFSLLKQAGDVEENPGP;SEQ ID NO:21);E2A(QCTNYALLKLAGDVESNPGP;SEQ IDNO:22);以及F2A(VKQTLNFDLLKLAGDVESNPGP;SEQ ID NO:23)。GSG残基可以添加到这些肽中的任何肽的5'端以提高切割效率。
核酸或表达盒中的任一个还可以包含编码序列上游的聚腺苷酸化信号或转录终止子。例如,嵌合Cas蛋白表达盒、嵌合衔接蛋白表达盒、SAM表达盒或向导RNA表达盒可以在表达盒中的编码序列上游包含聚腺苷酸化信号或转录终止子。聚腺苷酸化信号或转录终止子可以侧接有由位点特异性重组酶识别的重组酶识别位点。聚腺苷酸化信号或转录终止子阻止由编码序列(例如,嵌合Cas蛋白、嵌合衔接蛋白、向导RNA或重组酶)编码的蛋白质或RNA的转录和表达。然而,在暴露于位点特异性重组酶后,聚腺苷酸化信号或转录终止子将被切除,并且可以表达蛋白质或RNA。
如果以组织特异性或发育期特异性方式切除聚腺苷酸化信号或转录终止子,则表达盒(例如,嵌合Cas蛋白表达盒或SAM表达盒)的此类构型可以在包含表达盒的真核生物体(例如,动物、非人动物、哺乳动物或非人哺乳动物)中实现组织特异性表达或发育期特异性表达。例如,在嵌合Cas蛋白的情况下,这可以降低由于嵌合Cas蛋白在细胞或真核生物体(例如,动物、非人动物、哺乳动物或非人哺乳动物)中延长表达而导致的毒性,或减少嵌合Cas蛋白在真核生物体(例如,动物、非人动物、哺乳动物或非人哺乳动物)中在不希望的发育期或在不希望的细胞或组织类型中的表达。参见例如Parikh等人(2015)《公共科学图书馆·综合》10(1):e0116484,该文献以全文引用的方式并入本文用于所有目的。如果包含表达盒的真核生物(例如,动物、非人动物、哺乳动物或非人哺乳动物)还包含可操作地链接到组织特异性或发育期特异性启动子的位点特异性重组酶的编码序列,则可以实现以组织特异性或发育期特异性方式切除聚腺苷酸化信号或转录终止子。然后,聚腺苷酸化信号或转录终止子将仅在那些组织中或在那些发育阶段被切除,从而实现组织特异性表达或发育阶段特异性表达。在一个实例中,嵌合Cas蛋白、嵌合衔接蛋白、嵌合Cas蛋白和嵌合衔接蛋白,或向导RNA可以以肝脏特异性方式表达。
可以使用任何转录终止子或聚腺苷酸化信号。如本文所使用的,“转录终止子”是指引起转录终止的DNA序列。在真核生物中,转录终止子被蛋白质因子识别,并且聚腺苷酸化在终止之后,所述聚腺苷酸化是在poly(A)聚合酶存在的情况下向mRNA转录物添加poly(A)尾部的过程。哺乳动物poly(A)信号通常由约45个核苷酸长的核心序列组成,所述核心序列可以侧接有用于增强切割和聚腺苷酸化效率的不同辅助序列。核心序列由以下组成:mRNA中高度保守的上游元件(AATAAA或AAUAAA),所述上游元件被称为poly A识别基序或poly A识别序列,由切割和聚腺苷酸化特异性因子(CPSF)识别;以及受切割刺激因子(CstF)约束的定义不清的下游区域(在Us或Gs和Us中富集)。可以使用的转录终止子的实例包含例如人生长激素(HGH)聚腺苷酸化信号、猿猴病毒40(SV40)晚期聚腺苷酸化信号、兔β-珠蛋白聚腺苷酸化信号、牛生长激素(BGH)聚腺苷酸化信号、磷酸甘油酸激酶(PGK)聚腺苷酸化信号、AOX1转录终止序列、CYC1转录终止序列或已知适合于调节真核细胞中基因表达的任何转录终止序列。
位点特异性重组酶包含可以促进重组酶识别位点之间重组的酶,其中两个重组位点在单个核酸内或在单独的核酸上物理分离。重组酶的实例包含Cre、Flp和Dre重组酶。Cre重组酶基因的一个实例是Crei,其中两个对Cre重组酶进行编码的外显子被内含子隔开,以防止其在原核细胞中表达。此类重组酶可以进一步包括用于促进定位到核(例如,NLS-Crei)的核定位信号。重组酶识别位点包含由位点特异性重组酶识别并且可以用作重组事件的底物的核苷酸序列。重组酶识别位点的实例包含FRT、FRT11、FRT71、attp、att、rox和lox位点,如loxP、lox511、lox2272、lox66、lox71、loxM2和lox5171。
本文公开的表达盒也可以包含其它组分。此类表达盒(例如,嵌合Cas蛋白表达盒、嵌合衔接蛋白表达盒、SAM表达盒、向导RNA表达盒或重组酶表达盒)还可以包含在表达盒5'末端的3'剪接序列和/或编码序列之后的第二聚腺苷酸化信号(例如,编码嵌合Cas蛋白、嵌合衔接蛋白或向导RNA)。术语3'剪接序列是指3'内含子/外显子边界处可以被识别并通过剪接机制结合的核酸序列。表达盒还可以包含选择盒,其包含例如抗药性蛋白的编码序列。合适的选择标志物的实例包括新霉素磷酸转移酶(neor)、潮霉素B磷酸转移酶(hygr)、嘌呤霉素-N-乙酰转移酶(puror)、杀稻瘟素S脱氨酶(bsrr)、黄嘌呤/鸟嘌呤磷酸核糖转移酶(gpt)和单纯疱疹病毒胸苷激酶(HSV-k)。任选地,选择盒可以侧接有位点特异性重组酶的重组酶识别位点。如果表达盒还包含侧接如上所述编码序列上游的聚腺苷酸化信号的重组酶识别位点,则选择盒可以侧接相同的重组酶识别位点,或者可以侧接被不同的重组酶识别的一组不同的重组酶识别位点。
表达盒还可以包含编码一个或多个报告蛋白,如荧光蛋白(例如,绿色荧光蛋白)的核酸。可以使用任何合适的报告蛋白。例如,可以使用荧光报告蛋白,或者可以使用非荧光报告蛋白。本文别处提供了荧光报告蛋白的实例。非荧光报告蛋白包括例如可用于组织化学或生物发光测定的报告蛋白,如β-半乳糖苷酶、萤光素酶(例如,海肾萤光素酶、萤火虫萤光素酶和NanoLuc萤光素酶)和β-葡萄糖醛酸酶。表达盒可以包括可以在流式细胞术测定中检测到的报告蛋白(例如,荧光报告蛋白,如绿色荧光蛋白)和/或可以在组织化学测定中检测到的报告蛋白(例如,β-半乳糖苷酶蛋白)。此类组织化学测定的一个实例是通过通过水解X-Gal(5溴-4-氯-3-吲哚基-b-D-半乳糖皮蒽)(其产生蓝色沉淀物),或使用荧光底物,如β-甲基伞形基半乳糖苷(MUG)和荧光素二半乳糖苷(FDG)对原位β-半乳糖苷酶表达进行组织化学可视化。
本文所述的表达盒可以是任何形式。例如,表达盒可以在载体或质粒中。表达盒可以可操作地链接到能够引导蛋白或RNA表达的表达构建体中的启动子(例如,在去除上游聚腺苷酸化信号后)。替代地,表达盒可以在靶向载体中。例如,靶向载体可以包含侧接表达盒的同源臂,其中同源臂适用于引导与所需靶基因组基因座的重组以促进内源序列的基因组整合和/或替换。
编码无催化活性的Cas蛋白的核酸的具体实例可以包含以下核酸、基本上由以下核酸组成,或由以下核酸组成:编码与SEQ ID NO:2所示的dCas9蛋白序列至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列的核酸。任选地,核酸可以包含以下核酸、基本上由以下核酸组成,或由以下核酸组成:编码与SEQ IDNO:24所示的序列至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列的核酸(任选地,其中该序列编码与SEQ ID NO:2所示的dCas9蛋白序列至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的蛋白)。
编码嵌合Cas蛋白的核酸的具体实例可以包含以下核酸、基本上由以下核酸组成,或由以下核酸组成:编码与SEQ ID NO:1所示的嵌合Cas蛋白序列至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列的核酸。任选地,核酸可以包含以下核酸、基本上由以下核酸组成,或由以下核酸组成:编码与SEQ ID NO:25所示的序列至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列的核酸(任选地,其中该序列编码与SEQ ID NO:1所示的嵌合Cas蛋白序列至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的蛋白)。
编码衔接子的核酸的具体实例可以包含以下核酸、基本上由以下核酸组成,或由以下核酸组成:编码与SEQ ID NO:7所示的MCP序列至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列的核酸。任选地,核酸可以包含以下核酸、基本上由以下核酸组成,或由以下核酸组成:编码与SEQ ID NO:26所示的序列至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列的核酸(任选地,其中该序列编码与SEQ ID NO:7所示的MCP序列至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的蛋白)。
编码嵌合衔接蛋白的核酸的具体实例可以包含以下核酸、基本上由以下核酸组成,或由以下核酸组成:编码与SEQ ID NO:6所示的嵌合衔接蛋白序列至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列的核酸。任选地,核酸可以包含以下核酸、基本上由以下核酸组成,或由以下核酸组成:编码与SEQ IDNO:27所示的序列至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列的核酸(任选地,其中该序列编码与SEQ ID NO:6所示的嵌合衔接蛋白序列至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的蛋白)。
编码转录激活域的核酸的具体实例可以包含以下核酸、基本上由以下核酸组成,或由以下核酸组成:编码与SEQ ID NO:3、8或9中分别所示的VP64、p65或HSF1序列至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列的核酸。任选地,核酸可以包含以下核酸、基本上由以下核酸组成,或由以下核酸组成:编码与SEQ ID NO:28、29或30中分别所示的序列至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列的核酸(任选地,其中该序列编码与SEQID NO:3、8或9中分别所示的VP64、p65或HSF1序列至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的蛋白)。
协同激活介体(SAM)表达盒的一个实例从5'到3'包含:(a)3'剪接序列;(b)第一重组酶识别位点(例如,loxP位点);(c)抗药性基因的编码序列(例如,新霉素磷酸转移酶(neor)编码序列);(d)聚腺苷酸化信号;(e)第二重组酶识别位点(例如,loxP位点);(f)嵌合Cas蛋白编码序列(例如,dCas9-NLS-VP64融合蛋白);(g)2A蛋白编码序列(例如,T2A编码序列);以及(e)嵌合衔接蛋白编码序列(例如,MCP-NLS-p65-HSF1)。参见例如SEQ ID NO:31(SEQ ID NO:46所示的编码序列和SEQ ID NO:44所示的编码蛋白,以及SEQ ID NO:61所示的mRNA序列)。
通用向导RNA阵列表达盒的一个实例从5'到3'包含:(a)3'剪接序列;(b)第一重组酶识别位点(例如,rox位点);(c)抗药性基因的编码序列(例如,嘌呤霉素-N-乙酰转移酶(puror)编码序列);(d)聚腺苷酸化信号;(e)第二重组酶识别位点(例如,rox位点);(f)包含一个或多个向导RNA基因的向导RNA(例如,第一U6启动子后接第一向导RNA编码序列,第二U6启动子后接第二向导RNA编码序列,以及第三U6启动子后接第三向导RNA编码序列)。参见例如SEQ ID NO:32。包含启动子和向导RNA编码序列的SEQ ID NO:32区域在SEQ ID NO:47中示出。此类编码靶向小鼠Ttr的向导RNA的向导RNA阵列表达盒在SEQ ID NO:33中示出。包含启动子和向导RNA编码序列的SEQ ID NO:33的区域在SEQ ID NO:48中示出。
通用向导RNA阵列表达盒的另一个实例包含一个或多个向导RNA基因(例如,第一U6启动子后接第一向导RNA编码序列,第二U6启动子后接第二向导RNA编码序列,以及第三U6启动子后接第三向导RNA编码序列)。此类通用向导RNA阵列表达盒在SEQ ID NO:48中示出。用于特定基因的此类向导RNA阵列表达盒的实例在例如SEQ ID NO:33、48和49中示出。
IV.脂质纳米颗粒和将向导RNA和其它组分引入细胞和真核生物体
本文还公开了用于将同一LNP中的所有SAM系统组分递送至细胞或真核生物体以便增加靶基因的转录或表达的脂质纳米颗粒(LNP)。本文公开的方法包含在同一LNP中一起将协同激活介体(SAM)系统的所有组分(一个或多个向导RNA或核酸编码、嵌合Cas蛋白或核酸编码,以及嵌合衔接蛋白或核酸编码)引入细胞或真核生物体(例如,动物、非人动物、哺乳动物或非人哺乳动物)。例如,此类LNP可以包含负荷物,该负荷物包含:(a)编码嵌合规律间隔成簇短回文重复序列(CRISPR)相关联(Cas)蛋白的核酸,该蛋白包含与一个或多个转录激活域融合的无核酸酶活性的Cas蛋白;(b)编码嵌合衔接蛋白的核酸,该嵌合衔接蛋白包含与一个或多个转录激活域融合的衔接子;以及(c)一个或多个向导RNA或编码该一个或多个向导RNA的一个或多个核酸,每个向导RNA包含嵌合衔接蛋白可特异性结合的一个或多个衔接结合元件,并且其中一个或多个向导RNA中的每一个能够与Cas蛋白形成复合物并将其导向至靶基因内的靶序列,从而增加靶基因的表达。在一个实例中,协同激活介体系统的所有组分以RNA的形式在同一LNP中一起引入。“引入”包括以核酸或蛋白进入细胞内部或真核生物体(例如,动物、非人动物、哺乳动物或非人哺乳动物)内的细胞内部的方式向细胞或真核生物体(例如,动物、非人动物、哺乳动物或非人哺乳动物)呈递核酸或蛋白。
可以将向导RNA以RNA的形式(例如,体外转录的RNA)或对向导RNA进行编码的DNA的形式引入到细胞中。同样地,可以将如嵌合Cas蛋白和嵌合衔接蛋白等蛋白组分以DNA、RNA或蛋白的形式引入到细胞中。当以DNA的形式引入时,对向导RNA进行编码的DNA可以可操作地连接到在细胞中具有活性的启动子。此类DNA可以在一种或多种表达构建体中。例如,此类表达构建体可以是单个核酸分子的组分。可替代地,其可以在两个或多个核酸分子之间以任何组合分离(即,对一种或多种CRISPR RNA进行编码的DNA和对一种或多种tracrRNA进行编码的DNA可以是单独的核酸分子的组分)。编码嵌合Cas蛋白、嵌合衔接蛋白或向导RNA的核酸在本文别处更详细地讨论。
在具体实例中,一个或多个向导RNA、嵌合Cas蛋白和嵌合衔接蛋白各自以RNA的形式经由LNP介导的递送在同一LNP中引入。如本文别处更详细讨论的,RNA中的一种或多种可以被修饰成包括5'端和/或3'端处的一种或多种稳定端修饰。此类修饰可以包含例如5'端和/或3'端处的一个或多个硫代磷酸酯键或5'端和/或3'端处的一个或多个2'-O-甲基修饰。通过此类方法的递送导致瞬时Cas表达和/或向导RNA的存在,并且生物可降解脂质提高清除率、提高耐受性并降低免疫原性。脂质调配物可以保护生物分子免于降解,同时改善其细胞摄取。
脂质纳米颗粒是包括通过分子间力彼此物理相关的多个脂质分子的颗粒。这些颗粒包含微球体(包含单层和多层囊泡,例如,脂质体)、乳液中的分散相、胶束或悬浮液中的内相。此类脂质纳米颗粒可以用于封装一个或多个核酸或蛋白质以供递送。含有阳离子脂质的调配物可用于递送如核酸等聚阴离子。其它可以包含在内的脂质是中性脂质(即,不带电荷或两性离子脂质)、阴离子脂质、增强转染的辅助脂质和增加纳米颗粒可以在体内存在的时间长度的隐形脂质。合适的阳离子脂质、中性脂质、阴离子脂质、辅助脂质和隐形脂质的实例可以在WO 2016/010840 A1和WO 2017/173054 A1中找到,所述文献出于所有目的通过引用整体并入本文。示例性脂质纳米颗粒可以包括阳离子脂质和一种或多种其它组分。在一个实例中,其它组分可以包括如胆固醇等辅助脂质。在另一个实例中,其它组分可以包括如胆固醇等辅助脂质和如DSPC等中性脂质。在另一个实例中,其它组分可以包括如胆固醇等辅助脂质、如DSPC等任选的中性脂质以及如S010、S024、S027、S031或S033等隐形脂质。
LNP可以含有以下中的一种或多种或全部:(i)用于封装和用于内体逃逸的脂质;(ii)用于稳定的中性脂质;(iii)用于稳定的辅助脂质;(iv)隐形脂质。参见例如,Finn等人(2018),《细胞报告》22(9):2227-2235和WO 2017/173054 A1,所述文献中的每个文献出于所有目的通过引用整体并入本文。在某些LNP中,负荷物可以包括向导RNA或编码向导RNA的核酸。在某些LNP中,负荷物可以包括SAM mRNA和向导RNA或编码向导RNA的核酸。
用于包封和内体逃逸的脂质可以是阳离子脂质。脂质还可以是生物可降解脂质,如生物可降解可电离脂质。合适的脂质的一个实例是脂质A或LP01,即(9Z,12Z)-3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙基十八-9,12-二烯酸酯,也被称为3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙基(9Z,12Z)-十八-9,12-二烯酸酯。参见例如,Finn等人(2018),《细胞报告》22(9):2227-2235和WO 2017/173054A1,所述文献中的每个文献出于所有目的通过引用整体并入本文。合适的脂质的另一个实例是脂质B,即((5-((二甲氨基)甲基)-1,3-亚苯基)双(氧))双(辛烷-8,1-二基)双(癸酸酯),也被称为((5-((二甲氨基)甲基)-1,3-亚苯基)双(氧基))双(辛烷-8,1-二基)双(癸酸酯)。合适的脂质的另一个实例是脂质C,即2-((4-(((3-(二甲氨基)丙氧基)羰基)氧基)十六酰基)氧基)丙烷-1,3-二基(9Z,9'Z,12Z,12'Z)-双(十八-9,12-二烯酸酯)。合适的脂质的另一个实例是脂质D,即3-(((3-(二甲氨基)丙氧基)羰基)氧基)-13-(辛酰氧基)十三烷基3-辛基十一烷酸酯。其它合适的脂质包括三十七-6,9,28,31-四烯-19-基4-(二甲氨基)丁酸酯(也被称为[(6Z,9Z,28Z,31Z)-三十七-6,9,28,31-四烯-19-基]4-(二甲氨基)丁酸酯或Dlin-MC3-DMA(MC3))。
适用于本文所述的LNP的一些此类脂质在体内是生物可降解的。例如,包括此类脂质的LNP包含在8小时、10小时、12小时、24小时或48小时或3天、4天、5天、6天、7天或10天内从血浆中清除脂质的至少75%的那些。作为另一个实例,LNP的至少50%在8小时、10小时、12小时、24小时或48小时或3天、4天、5天、6天、7天或10天内从血浆中清除。
根据其所在的介质的pH值,此类脂质可以是可电离的。例如,在微酸性介质中,脂质可以被质子化并且因此带有正电荷。相反,在弱碱性介质中,例如在pH大约为7.35的血液中,脂质可能不会被质子化并且因此不带电荷。在一些实施例中,脂质可以在至少约9、9.5或10的pH下质子化。这种脂质带电荷的能力与其固有pKa有关。例如,脂质的pKa可以独立地处于约5.8到约6.2的范围内。
中性脂质的作用是稳定和改善LNP的处理。合适的中性脂质的实例包含各种中性、不带电荷或两性离子脂质。适用于本公开的中性磷脂的实例包括但不限于5-十七烷基苯-1,3-二醇(间苯二酚)、二棕榈酰磷脂酰胆碱(DPPC)、二硬脂酰磷脂酰胆碱或1,2-二硬脂酰-sn-甘油-3-磷酸胆碱(DSPC)、磷酸胆碱(DOPC)、二肉豆蔻酰磷脂酰胆碱(DMPC)、磷脂酰胆碱(PLPC)、1,2-二花生四烯酰-sn-甘油-3-磷酸胆碱(DAPC)、磷脂酰乙醇胺(PE)、卵磷脂酰胆碱(EPC)、二月桂酰磷脂酰胆碱(DLPC)、二肉豆蔻酰磷脂酰胆碱(DMPC)、1-肉豆蔻酰-2-棕榈酰磷脂酰胆碱(MPPC)、1-棕榈酰-2-肉豆蔻酰磷脂酰胆碱(PMPC)、1-棕榈酰-2-硬脂酰磷脂酰胆碱(PSPC)、1,2-二花生酰-sn-甘油-3-磷酸胆碱(DBPC)、1-硬脂酰-2-棕榈酰磷脂酰胆碱(SPPC)、1,2-二二十碳烯酰-sn-甘油-3-磷酸胆碱(DEPC)、棕榈酰油酰磷脂酰胆碱(POPC)、溶血磷脂酰胆碱、二油酰磷脂酰乙醇胺(DOPE)、二亚油酰磷脂酰胆碱二硬脂酰磷脂酰乙醇胺(DSPE)、二肉豆蔻酰磷脂酰乙醇胺(DMPE)、二棕榈酰磷脂酰乙醇胺(DPPE)、棕榈酰油酰磷脂酰乙醇胺(POPE)、溶血磷脂酰乙醇胺、1-硬脂酰-2-油酰-sn-甘油-3-磷酸胆碱(SOPC)和其组合。例如,中性磷脂可以选自由以下组成的组:二硬脂酰磷脂酰胆碱(DSPC)和二肉豆蔻酰磷脂酰乙醇胺(DMPE)。
辅助脂质包含增强转染的脂质。辅助脂质增强转染的机制可以包含增强颗粒稳定性。在某些情况下,辅助脂质可以增强膜融合性。辅助脂质包含类固醇、甾醇和烷基间苯二酚。合适的辅助脂质的实例包含胆固醇、5-十七烷基间苯二酚和胆固醇半琥珀酸酯。在一个实例中,辅助脂质可以是胆固醇或胆固醇半琥珀酸酯。
隐形脂质包含改变纳米颗粒可以在体内存在的时间长度的脂质。隐形脂质可以通过例如减少颗粒聚集和控制粒度来帮助调配过程。隐形脂质可以调节LNP的药代动力学性质。合适的隐形脂质包含具有连接到脂质部分的亲水性头部基团的脂质。
隐形脂质的亲水性头部基团可以包括例如选自基于PEG(有时称为聚(环氧乙烷))、聚(噁唑啉)、聚(乙烯醇)、聚(甘油)、聚(N-乙烯基吡咯烷酮)、聚氨基酸和聚N-(2-羟丙基)甲基丙烯酰胺的聚合物的聚合物部分。术语PEG意指任何聚乙二醇或其它聚亚烷基醚聚合物。在某些LNP调配物中,PEG是PEG-2K,也被称为PEG 2000,其平均分子量为约2,000道尔顿。参见例如WO 2017/173054 A1,所述文献出于所有目的通过引用整体并入本文。
隐形脂质的脂质部分可以衍生自例如二酰基甘油或二烷基甘酰胺,其包含包括二烷基甘油或二烷基甘酰胺基团的那些,所述二烷基甘油或二烷基甘酰胺基团具有独立地包括约C4到约C40个饱和或不饱和碳原子的烷基链长度,其中链可以包括一个或多个官能团,例如酰胺或酯。二酰基甘油或二烷基甘酰胺基团可以进一步包括一个或多个经取代的烷基。
作为一个实例,隐形脂质可以选自PEG-二月桂酰甘油、PEG-二肉豆蔻酰甘油(PEG-DMG)、PEG-二棕榈酰甘油、PEG-二硬脂酰甘油(PEG-DSPE)、PEG-二月桂甘酰胺、PEG-二肉豆蔻甘酰胺、PEG-二棕榈酰甘酰胺和PEG-二硬脂酰甘酰胺、PEG-胆固醇(l-[8'-(胆甾-5-en-3[β]-氧基)甲酰胺基-3',6'-二氧杂辛基]氨甲酰基-[ω]-甲基-聚(乙二醇)、PEG-DMB(3,4-二十四烷基苄基-[ω]-甲基-聚(乙二醇)醚)、1,2-二肉豆蔻酰-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000](PEG2k-DMG)、1,2-二硬脂酰-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000](PEG2k-DSPE)、1,2-二硬脂酰-sn-甘油、甲氧基聚乙烯乙二醇(PEG2k-DSG)、聚(乙二醇)-2000-二甲基丙烯酸酯(PEG2k-DMA)和1,2-二硬脂氧基丙基-3-胺-N-[甲氧基(聚乙二醇)-2000](PEG2k-DSA)。在一个特定实例中,隐形脂质可以是PEG2k-DMG。
LNP可以包括调配物中相应摩尔比的组分脂质。CCD脂质的mol-%可以为例如约30mol-%到约60mol-%、约35mol-%到约55mol-%、约40mol-%到约50mol-%、约42mol-%到约47mol-%或约45%。辅助脂质的mol-%可以为例如约30mol-%到约60mol-%、约35mol-%到约55mol-%、约40mol-%到约50mol-%、约41mol-%到约46mol-%或约44mol-%。中性脂质的mol-%可以为例如约1mol-%到约20mol-%、约5mol-%到约15mol-%、约7mol-%到约12mol-%或约9mol-%。隐形脂质的mol-%可以为例如约1mol-%到约10mol-%、约1mol-%到约5mol-%、约1mol-%到约3mol-%、约2mol-%或约1mol-%。
LNP在生物可降解脂质(N)的带正电荷的胺基团与待封装的核酸的带负电荷的磷酸基团(P)之间可以具有不同的比率。这可以由等式N/P在数学上表示。例如,N/P比率可以为约0.5至约100、约1至约50、约1至约25、约1至约10、约1至约7、约3至约5、约4至约5、约4、约4.5或约5。N/P比率也可以为约4到约7或约4.5到约6。在具体实例中,N/P比率可以为4.5或者可以为6。
在一些LNP中,负荷物可以包含Cas mRNA或SAM mRNA(例如,编码例如通过2A编码序列分开的嵌合Cas蛋白和嵌合衔接蛋白两者的双顺反子mRNA)和gRNA。Cas mRNA/SAMmRNA和gRNA的比率可以不同。例如,LNP调配物的Cas mRNA/SAM mRNA与gRNA核酸的比率的范围可以为约25:1至约1:25、约10:1至约1:10、约5:1至约1:5,或为约1:1。替代地,LNP调配物的Cas mRNA/SAM mRNA与gRNA核酸的比率可以为约1:1至约1:5,或为约10:1。替代地,LNP调配物的Cas mRNA/SAM mRNA与gRNA核酸的比率可以为约1:10、25:1、10:1、5:1、3:1、1:1、1:3、1:5、1:10或1:25。替代地,LNP调配物的Cas mRNA/SAM mRNA与gRNA核酸的比率可以为约1:1至约1:2。在具体实例中,Cas mRNA/SAM mRNA与gRNA的比率可以为约1:1或约1:2。
LNP的示范性剂量包括约0.1、约0.25、约0.3、约0.5、约1、约2、约3、约4、约5、约6、约8或约10mg/kg体重(mpk)或约0.1至约10、约0.25至约10、约0.3至约10、约0.5至约10、约1至约10、约2至约10、约3至约10、约4至约10、约5至约10、约6至约10、约8至约10、约0.1至约8、约0.1至约6、约0.1至约5、约0.1至约4、约0.1至约3、约0.1至约2、约0.1至约1、约0.1至约0.5、约0.1至约0.3、约0.1至约0.25、约0.25至约8、约0.3至约6、约0.5至约5、约1至约5,或约2至约3mg/kg体重(相对于总RNA(Cas9 mRNA和gRNA)负荷物含量)。此类LNP可以例如静脉内施用。在一个实例中,可以使用约0.01mg/kg至约10mg/kg、约0.1至约10mg/kg或约0.01至约0.3mg/kg的LNP剂量。例如,可以使用约0.01、约0.03、约0.1、约0.3、约0.5、约1、约2、约3或约10mg/kg的LNP剂量。在一个实例中,可以使用约0.5至约10、约0.5至约5、约0.5至约3、约1至约10、约1至约5、约1至约3,或约1至约2mg/kg的LNP剂量。
合适的LNP的具体实例的氮磷(N/P)比率为4.5,并且含有摩尔比为45:44:9:2的可生物降解阳离子脂质、胆固醇、DSPC和PEG2k-DMG。生物可降解阳离子脂质可以是(9Z,12Z)-3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙基十八-9,12-二烯酸酯,也被称为3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙基(9Z,12Z)-十八-9,12-二烯酸酯。参见例如Finn等人(2018)《细胞报告》22(9):2227-2235,所述文献出于所有目的通过引用整体并入本文。Cas9 mRNA/SAMmRNA与向导RNA的重量比可以为1:1。合适的LNP的另一个具体实例含有摩尔比为50:38.5:10:1.5的Dlin-MC3-DMA(MC3)、胆固醇、DSPC和PEG-DMG。
合适的LNP的另一个具体实例的氮磷(N/P)比率为6,并且含有摩尔比为50:38:9:3的可生物降解阳离子脂质、胆固醇、DSPC和PEG2k-DMG。生物可降解阳离子脂质可以是(9Z,12Z)-3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙基十八-9,12-二烯酸酯,也被称为3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙基(9Z,12Z)-十八-9,12-二烯酸酯。Cas9 mRNA/SAM mRNA与向导RNA的重量比可以为1:2。
合适的LNP的另一个具体实例的氮磷(N/P)比率为3,并且含有阳离子脂质、结构脂质、胆固醇(例如,胆固醇(ovine)(Avanti 700000))和PEG2k-DMG(例如,PEG-DMG 2000(NOF美国公司-
Figure BDA0003620588300000951
GM-020(DMG-PEG)),比率为50:10:38.5:1.5或47:10:42:1。结构脂质可以是例如DSPC(例如DSPC(Avanti 850365))、SOPC、DOPC或DOPE。阳离子/可电离脂质可以是,例如,Dlin-MC3-DMA(例如,Dlin-MC3-DMA(Biofine国际公司)。
合适的LNP的另一个具体实例含有比率为45:9:44:2的Dlin-MC3-DMA、DSPC、胆固醇和PEG脂质。合适的LNP的另一个具体实例含有比率为50:10:39:1的Dlin-MC3-DMA、DOPE、胆固醇和PEG脂质或PEG DMG。合适的LNP的另一个具体实例具有比率为55:10:32.5:2.5的Dlin-MC3-DMA、DSPC、胆固醇和PEG2k-DMG。合适的LNP的另一个具体实例具有比率为50:10:38.5:1.5的Dlin-MC3-DMA、DSPC、胆固醇和PEG-DMG。合适的LNP的另一个具体实例具有比率为50:10:38.5:1.5的Dlin-MC3-DMA、DSPC、胆固醇和PEG-DMG。
体内施用可以通过任何合适的途径,包含例如肠胃外、静脉内、口服、皮下、动脉内、颅内、鞘内、腹膜内、局部、鼻内或肌肉内施用。全身施用方式包含例如口服和肠胃外途径。肠胃外途径的实例包含静脉内、动脉内、骨内、肌肉内、皮内、皮下、鼻内和腹膜内途径。具体的实例是静脉输液。鼻滴注和玻璃体内注射是其它具体实例。局部施用模式包括例如鞘内、脑室内、脑实质内(例如,局部脑实质内递送至纹状体(例如,进入尾状核或进入壳核种)、大脑皮层、中央前回、海马体(例如,进入齿状回或CA3区域)、颞叶皮层、杏仁核、额叶皮层、丘脑、小脑、髓质、下丘脑、顶盖、被盖或黑质)、眼内、眶内、结膜下、玻璃体内、视网膜下和经巩膜途径。与全身施用(例如,静脉内)相比,当局部施用(例如,脑实质内或玻璃体内)时,显著更少量的组分(与全身方法相比)可以发挥作用。局部施用方式还可以降低或消除当全身施用治疗有效量的组分时可能发生的潜在毒副作用的发生率。
体内施用可以通过任何合适的途径,包含例如肠胃外、静脉内、口服、皮下、动脉内、颅内、鞘内、腹膜内、局部、鼻内或肌肉内施用。具体的实例是静脉输液。鼻滴注和玻璃体内注射是其它具体实例。可以使用一个或多个生理学和药学上可接受的载体、稀释剂、赋形剂或助剂来调配包含向导RNA(或编码向导RNA的核酸)的组合物。调配物可以取决于所选择的施用途径。术语“药学上可接受的”意指载体、稀释剂、赋形剂或助剂与调配物的其它成分相容并且对其接受者基本上无害。
施用频率和给药次数可以取决于例如向导RNA或嵌合Cas蛋白或嵌合衔接蛋白mRNA的半衰期和施用途径以及其它因素。将核酸或蛋白引入到细胞或真核生物体(例如,动物、非人动物、哺乳动物或非人哺乳动物)中可以在一段时间内执行一次或多次。例如,引入可以按以下频率执行:一段时间内仅一次、一段时间内至少两次、一段时间内至少三次、一段时间内至少四次、一段时间内至少五次、一段时间内至少六次、一段时间内至少七次、一段时间内至少八次、一段时间内至少九次、一段时间内至少十次、至少十一次、一段时间内至少十二次、一段时间内至少十三次、一段时间内至少十四次、一段时间内至少十五次、一段时间内至少十六次、一段时间内至少十七次、一段时间内至少十八次、一段时间内至少十九次或一段时间内至少二十次。
LNP的示范性剂量包括约0.1、约0.25、约0.3、约0.5、约1、约2、约3、约4、约5、约6、约8或约10mg/kg体重(mpk)或约0.1至约10、约0.25至约10、约0.3至约10、约0.5至约10、约1至约10、约2至约10、约3至约10、约4至约10、约5至约10、约6至约10、约8至约10、约0.1至约8、约0.1至约6、约0.1至约5、约0.1至约4、约0.1至约3、约0.1至约2、约0.1至约1、约0.1至约0.5、约0.1至约0.3、约0.1至约0.25、约0.25至约8、约0.3至约6、约0.5至约5、约1至约5,或约2至约3mg/kg体重(相对于总RNA(Cas9 mRNA和gRNA)负荷物含量)。此类LNP可以例如静脉内施用。
出于所有目的,上文或下文引用的所有专利申请、网站、其它出版物、登录号等都通过引用整体并入,其程度如同每个单独的项目被单独并且具体地指出通过引用的方式并入。如果序列的不同版本与不同时间的登录号相关联,则意指在本申请的有效提交日期与登录号相关联的版本。有效提交日期是指实际提交日期或提及登记号的优先权申请的提交日期(在适用情况下)中较早的日期。同样地,如果出版物、网站等的不同版本在不同时间发布,除非另有说明,否则指在申请的有效提交日期最近发布的版本。除非另外具体说明,否则本发明的任何特征、步骤、元件、实施例或方面都可以与任何其它特征、步骤、元件、实施例或方面结合使用。尽管为了清楚和理解起见,已通过图解和实例方式详细地对本发明进行了描述,但显而易见的是,可以在所附权利要求的范围内进行某些改变和修改。
序列简要说明
使用核苷酸碱基的标准字母缩写和氨基酸的三字母代码示出随附序列表中列出的核苷酸和氨基酸序列。核苷酸序列遵循从序列的5'末端开始并且向前(即,在每行中从左到右)到达3'末端的标准惯例。每个核苷酸序列仅示出一条链,但任何提及的显示链均应理解为包含互补链。当提供对氨基酸序列进行编码的核苷酸序列时,应当理解的是还提供了其对相同氨基酸序列进行编码的密码子简并变体。当提供编码氨基酸序列的DNA序列时,应当理解,还提供了编码相同氨基酸序列的RNA序列(通过用尿嘧啶替换胸腺嘧啶)。氨基酸序列遵循从序列的氨基端开始并且向前(即,在每行中从左到右)到达羧基端的标准惯例。
表4:序列描述。
Figure BDA0003620588300000981
Figure BDA0003620588300000991
实例
实例1:LNP介导的dCas9 SAM递送
在该实例中,我们集中于使用dCas9(催化上死亡的Cas9)协同激活介体(SAM)系统上调基因表达。在该系统中,数个激活域相互作用以引起比任一个因素单独诱导的更大的基因响应。组分包括:(1)直接融合到VP64域的dCas9,VP64域是由单纯疱疹病毒蛋白16的四个串联拷贝组成的转录激活子;(2)融合到两种附加激活转录因子的MS2外壳蛋白(MCP),这两种激活转录因子为:热休克因子1(HSF1)和转录因子65(p65);以及(3)含有MS2环的sgRNA(包括MS2结合环使得长度从~97个核苷酸增加到~166个核苷酸)。当VP64与在转录起始位点附近结合的蛋白融合时,它会充当强转录激活子。MCP自然地与MS2茎环结合。在该系统中,MCP与工程化到CRISPR相关联sgRNA中的MS2茎环相互作用,并且从而将结合的转录因子运送到适当的基因组位置。
该系统的初始迭代使用三个独立的慢病毒来递送三个独立的组分。虽然三组分系统在细胞培养中具有一定的灵活性,但这种设置在动物模型中不太理想。相反,我们首先选择引入dCas9、VP64、MCP、HSF1和p65作为由鼠科动物Rosa26启动子驱动的转录物。然后,我们可以通过将重组腺相关病毒(AAV)注射到小鼠尾静脉中来引入向导RNA,以进行肝脏特异性上调。WT AAV通常被认为对基因治疗是安全的,因为它们具有低免疫原性并且具有高度可预测的整合位点(人19号染色体上的AAVS1)。然而,为了提高它们作为基因治疗载体的安全性,WT AAV的整合能力已被消除,使得这些载体作为附加体保留在宿主细胞核中。出于本实例的目的,所有AAV参考均指示重组变体。在引入宿主中后,针对AAV的免疫响应通常仅限于中和抗体,而没有明确定义的细胞毒性响应。在非分裂细胞中,这些AAV附加体在宿主细胞的生命中保持完整。在分裂细胞中,AAV DNA通过细胞分裂被稀释,使得需要施用更多的病毒来持续治疗响应。这些随后的暴露可能会导致病毒的快速中和,并且因此降低宿主反应。为了解决这个问题,研究人员将使用替代血清型进行循序感染,尽管这受到血清型特异性的阻碍。
基于AAV的疗法的另一个问题是相对较小的克隆容量:两个反向末端重复序列之间的4.6kb。由于dCas9 SAM的完整编码序列为~5.8kb(无启动子),我们无法从单个AAV中表达所有组分。解决此问题的一种方法是在dCas9 SAM小鼠背景中工作,其中小鼠包含基因组整合到Rosa26基因座的第一内含子中的dCas9-NLS-VP64-T2A-MCP-NLS-p65-HSF1表达盒(SAM表达盒),使得小鼠表达除了gRNA之外SAM系统的所有组分。参见例如于2019年3月19日提交的美国专利申请第16/358,395号和于2019年3月19日提交的PCT专利申请第PCT/US2019/023009号,它们中的每一个以全文引用的方式并入本文用于所有目的。在这些小鼠中,表达盒中的酿脓链球菌dCas9编码序列(CDS)进行了密码子优化以在小鼠中表达。经编码的dCas9包括以下突变以使Cas9无核酸酶活性:D10A和N863A。dCas9-NLS-VP64-T2A-MCP-NLS-p65-HSF1表达盒(SAM表达盒)如SEQ ID NO:31所示。协同激活介体(SAM)编码序列(dCas9-VP64-T2A-MCP-p65-HSF1)在SEQ ID NO:46中示出并编码在SEQ ID NO:44中示出的蛋白。协同激活介体(SAM)mRNA序列(dCas9-VP64-T2A-MCP-p65-HSF1)在SEQ ID NO:61中示出。表达盒靶向Rosa26基因座的第一内含子,以利用Rosa26基因座的强通用表达和靶向Rosa26基因座的容易性。
然而,出于显而易见的原因,在临床环境中不能选择使用表达dCas9-SAM的小鼠。替代地,可以在两个或更多个AAV中表达所述元件,并希望它们均感染同一细胞。同样地,这对于治疗解决方案来说不太理想。考虑到这一点,我们着手优化该系统,使得其可以进行临床翻译。
脂质纳米颗粒(LNP)是AAV的一种有吸引力的替代品,因为它们通过利用内源性内吞机制经由LDL受体引进分子,从而安全并且有效地将核酸递送至细胞。一旦被引入生物体,调配物的变化可能会影响颗粒的稳定性和趋向性。此外,各种配体的缀合还可以提高LNP的靶特异性。这种递送方法的一个警告是对宿主细胞的瞬时作用,因为在一些情况下,通过LNP递送至肝细胞的野生型Cas9 mRNA可以在细胞摄入后的几天内被清除(数据未示出)。然而,对LNP递送没有免疫响应,这允许良好耐受的循序给药。不幸的是,此类递送系统在dCas9SAM基因激活中的应用受到RNA合成技术的限制。这些限制已经妨碍了具有稳定末端修饰的SAM sgRNA的生成,因为这些分子大于110个核苷酸的平台最大值。然而,最近,RNA合成技术已将其容量增加至200个合成核苷酸,并具有末端修饰,允许我们评价SAM sgRNA的LNP递送。
为了创建淀粉样变性研究模型,我们测试了针对转甲状腺素蛋白(Ttr)的SAMgRNA递送。野生型TTR可以解离、错误折叠和聚集,导致诱导疾病的淀粉样蛋白积聚。
我们通过尾静脉注射表达三个TtrSAM向导的阵列的肝脏特异性AAV(血清型8)来精确过表达Ttr基因。Ttr向导RNA阵列如图1和SEQ ID NO:33所描绘。包括启动子和向导RNA编码序列的区域在SEQ ID NO:48中示出。由阵列中的向导RNA靶向的小鼠Ttr基因中的向导RNA靶序列(不包括PAM)分别在SEQ ID NO:34(ACGGTTGCCCTCTTTCCCAA)、SEQ ID NO:35(ACTGTCAGACTCAAAGGTGC)和SEQ ID NO:36(GACAATAAGTAGTCTTACTC)中示出。SEQ ID NO:34(TtrgA)位于Ttr转录起始位点的-63,SEQ ID NO:35(TtrgA2)位于Ttr转录起始位点的-134,并且SEQ ID NO:36(TtrgA3)位于Ttr转录起始位点的-112。靶向这些向导RNA靶序列的单个向导RNA分别在SEQ ID NO:37、38和39中示出。这些向导被设计为将dCas9 SAM组分引导至Ttr转录起始位点(TSS)上游的100-200bp区域。参见图2。每个向导RNA(包括MS2茎环)的结构的一般示意图示于图3(SEQ ID NO:45)中。
评估了三组小鼠:(1)Rosa26-dCas9-SAM(未处理);(2)Rosa26-dCas9-SAM(AAV8-GFP);和(3)Rosa26-dCas9-SAM(AAV8-gTTR阵列(三个向导靶向Ttr))。这些小鼠在八周龄时注射了AAV8-GFP或AAV8-gTTR阵列,并在注射后跟踪至八个月。在各个早期时间点并且然后每月通过ELISA测量TTR的血清量,并观察这些动物的任何病理变化。虽然在注射后8个月在这些动物中未观察到病理变化,但到第19天,它们的循环TTR初始增加11倍,到注射后5个月,发现TTR为升高为约4倍的稳定状态水平。如图4所示,用无关病毒处理的dCas9SAM小鼠维持大约1000μg/mL的循环TTR,类似于WT小鼠。同时,到第19天,用表达AAV的SAM向导阵列给药的dCas9 SAM小鼠的循环TTR蛋白水平飙升至11,000μg/mL。参见图4。随着病毒颗粒被中和或自然稳态恢复,该水平随着时间的推移缓慢下降。参见图4。无论哪种方式,预期循环TTR蛋白水平将在一年内下降至接近野生型,而无法向究小鼠重新给药。
虽然预期LNP上调会持续显著更短的时间,但重新给药的益处可以克服这一限制。考虑到这一点,我们努力表征单个SAM Ttr sgRNA的单个LNP递送可以维持多长时间的蛋白升高。评估了二组小鼠:(1)Rosa26-dCas9-SAM(未处理);和(2)Rosa26-dCas9-SAM(R-LNP277-gTTR(一个向导靶向Ttr))。由向导RNA靶向的小鼠Ttr基因中的向导RNA靶序列(不包括PAM)在SEQ ID NO:36(GACAATAAGTAGTCTTACTC)中示出。靶向该向导RNA靶序列的单个向导RNA在SEQ ID NO:55中示出。单个向导RNA被修改以在前三个5'和最后三个3'残基处包括2'-O-甲基类似物和3'硫代磷酸酯核苷酸间键。
对于LNP调配物,使用(6Z,9Z,28Z,31Z)-三十七-6,9,28,31-四烯-19基4-(二甲氨基)丁酸酯(MC3;Biofine)、1,2-二硬脂酰-sn-甘油-3-磷酸胆碱(DSPC;Avanti)、胆固醇(Chol;Avanti)和在乙醇中50mM的1,2-二肉豆蔻酰-sn-甘油甲氧基聚乙二醇(PEG-DMG(2000);NOF)的储液。混合这些脂质以产生50:10:38.5:1.5(MC3:DSPC:Chol:PEG-DMG)的摩尔比。gRNA在10mM柠檬酸钠(pH 5)中制备成225μg/mL。通过使用BenchTopNanoassemblr(Precision Nanosystems公司)的微流体混合,RNA和脂质以12mL/min的流速和3:1的RNA:脂质体积比混合。将LNP稀释到PBS(pH 7.4)中以稀释乙醇,并且后续使用离心过滤器(Amicon,10kD截留)浓缩。通过改良的Ribrogreen测定(Life Technologies公司)对RNA进行定量,并在TE和具有2%Triton X-100的TE中对LNP进行定量。通过测量Triton-X100样品(总RNA)-TE样品(游离RNA)中的RNA来确定总封装RNA。在递送至动物之前,LNP通过0.22μm注射器式滤器过滤并在PBS(pH 7.4)中稀释至适当浓度,用于静脉内注射的总体积为200μL。
在组(1)中测试3只小鼠,并且在组(2)中测试2只小鼠。这些小鼠在12周龄时注射了在200μL PBS中的1mpk LNP,并在注射后跟踪至67天。在各个早期时间点并且然后每月通过ELISA测量TTR的血清量。令人惊讶的是,4,000μg/mL的增加的TTR蛋白水平持续数周保持恒定水平,表明上调远没有预期的那么短暂。参见图5A和5B。值得注意的是,虽然与AAV递送相关联的蛋白的初始峰值要高得多,但我们的LNP递送仅包括三种SAM TtrsgRNA中的一种。此外,通过LNP递送实现的TTR上调在数周内保持在相当恒定的水平,而通过AAV递送诱导实现的上调高度不稳定(初始在19天内急剧增加,并且然后随着时间的推移不断下降)。AAV递送诱导了强烈的初始上调并允许表达超过一年,但随着时间的推移它持续下降。LNP递送允许表达快速增加并且稳定数周,之后如果不提供后续给药,蛋白水平可能恢复正常。
我们接下来评估了施用不同剂量的LNP的效果。通过LNP以三种剂量将如以上实验中的单个SAM Ttr sgRNA(Ttr gA3)引入雄性Rosa26-dCas9-SAM小鼠:0.5毫克每千克小鼠体重(mpk)、1mpk和2mpk。经由尾静脉注射LNP,以表征单剂量LNP可以维持多长时间的蛋白升高。这种瞬时递送方法产生了大约三周的剂量依赖性基因激活,并使血清TTR水平升高了超过一个月。此外,通过ELISA观察到了剂量依赖性升高。最低剂量增加了7倍,而最高剂量增加了15倍。参见图6。进行了第二项研究以评价循序给药的影响。在研究开始时,所有小鼠均被注射了0.5mpk的用Ttr gA2配制的LNP,并且每周抽血一次。这些小鼠的子组在两周或四周时再注射另外的0.5mpk LNP,另外注射幼稚小鼠以确认LNP功能(图7A和7B)。在所有情况下,重新给药均成功地增强了Ttr表达。在单个时间点成功向动物重新给药而没有不良影响表明对相同动物进行循序给药可能是可行的。进行了一项附加研究,其中小鼠被给药3次:在第0天用0.5mpk的用Ttr gA2配制的LNP,在第2周再次用0.5mpk,以及在第4周用0.5mpk的最终给药。我们观察到TTR持续上调超过2倍,持续7周。参见图8。
单个LNP被配制为包括负荷物,其包括编码协同激活介体(dCas9-VP64-T2A-MCP-p65-HSF1)的体外转录的mRNA和化学合成的靶向Ttr的SAM sgRNA。mRNA被加帽和聚腺苷酸化,并且未经修饰或经假尿苷(psu)修饰(所有标准尿嘧啶残基均被假尿苷替换,假尿苷是一种尿嘧啶与碳-碳键而不是氮-碳键相连的尿苷异构体)。SAM gRNA被修饰以在前三个5'和3'端RNA残基处包括2'-O-甲基类似物和3'硫代磷酸酯核苷酸间键。在第0天向野生型小鼠注射2mpk的含有靶向Ttr(TtrgA2)的经修饰的mRNA和SAM sgRNA的LNP或含有未经修饰mRNA和SAM sgRNA的LNP,并在21天内测量TTR的血清水平。使用未处理的野生型小鼠作为阴性对照。如图9所示,含有靶向Ttr的经修饰的mRNA和SAM sgRNA的LNP到第6天成功地将TTR血清水平从低于1000μg/mL提高到超过3000μg/mL,并且含有靶向Ttr的未经修饰的mRNA和SAM sgRNA的LNP在较小程度上增加了TTR血清水平。单剂量的这种上调持续至少2周。
然后生成如上配制的单个LNP以包括负荷物,其包括编码协同激活介体(dCas9-VP64-T2A-MCP-p65-HSF1)的体外转录的mRNA和靶向相同基因的多个化学合成的SAMsgRNA。mRNA被聚腺苷酸化和加帽(TriLink
Figure BDA0003620588300001041
),并且sgRNA被修饰以在前三个5'和3'端RNA残基处包括2'-O-甲基类似物和3'硫代磷酸酯核苷酸间键。向野生型小鼠注射LNP,并评估SAM sgRNA靶向的靶基因的表达。
SAM sgRNA与所有其它SAM组分的LNP递送是对治疗性dCas9 SAM应用的显著增强,因为我们现在可以(1)确保dCas9 SAM转录物和SAM sgRNA着陆在同一细胞中,(2)用调配物/配体掺入介导增加的组织特异性,(3)向生物体重新给药而不必担心免疫响应,以及(4)生成更稳定的表达水平。总之,核酸递送的这种组合以安全且出乎意料的稳定方式极大地增强了潜在的dCas9应用。
序列表
<110> 瑞泽恩制药公司
<120> 使用由脂质纳米颗粒递送的CRISPR/CAS系统在动物中进行的转录调控
<130> 057766/693746
<150> US 62/900,080
<151> 2019-09-13
<150> US 63/042,762
<151> 2020-06-23
<160> 61
<170> PatentIn version 3.5
<210> 1
<211> 1471
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 1
Met Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys
1 5 10 15
Lys Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Ser Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
1385 1390 1395
Gly Gly Ser Gly Pro Lys Lys Lys Arg Lys Val Ala Ala Ala Gly
1400 1405 1410
Ser Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
1415 1420 1425
Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser
1430 1435 1440
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala
1445 1450 1455
Leu Asp Asp Phe Asp Leu Asp Met Leu Ile Asn Cys Thr
1460 1465 1470
<210> 2
<211> 1384
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 2
Met Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys
1 5 10 15
Lys Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp
<210> 3
<211> 62
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 3
Ala Ala Ala Gly Ser Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu
1 5 10 15
Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
20 25 30
Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp
35 40 45
Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Ile Asn Cys Thr
50 55 60
<210> 4
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 4
Gly Gly Gly Ser
1
<210> 5
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 5
Gly Gly Gly Gly Ser
1 5
<210> 6
<211> 473
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 6
Met Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Gly Thr
1 5 10 15
Gly Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu
20 25 30
Trp Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser
35 40 45
Val Arg Gln Ser Ser Ala Gln Lys Arg Lys Tyr Thr Ile Lys Val Glu
50 55 60
Val Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val
65 70 75 80
Ala Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe
85 90 95
Ala Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu
100 105 110
Leu Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly
115 120 125
Ile Tyr Ser Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
130 135 140
Gly Gly Ser Gly Pro Lys Lys Lys Arg Lys Val Ala Ala Ala Gly Ser
145 150 155 160
Pro Ser Gly Gln Ile Ser Asn Gln Ala Leu Ala Leu Ala Pro Ser Ser
165 170 175
Ala Pro Val Leu Ala Gln Thr Met Val Pro Ser Ser Ala Met Val Pro
180 185 190
Leu Ala Gln Pro Pro Ala Pro Ala Pro Val Leu Thr Pro Gly Pro Pro
195 200 205
Gln Ser Leu Ser Ala Pro Val Pro Lys Ser Thr Gln Ala Gly Glu Gly
210 215 220
Thr Leu Ser Glu Ala Leu Leu His Leu Gln Phe Asp Ala Asp Glu Asp
225 230 235 240
Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Gly Val Phe Thr Asp
245 250 255
Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly
260 265 270
Val Ser Met Ser His Ser Thr Ala Glu Pro Met Leu Met Glu Tyr Pro
275 280 285
Glu Ala Ile Thr Arg Leu Val Thr Gly Ser Gln Arg Pro Pro Asp Pro
290 295 300
Ala Pro Thr Pro Leu Gly Thr Ser Gly Leu Pro Asn Gly Leu Ser Gly
305 310 315 320
Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu
325 330 335
Ser Gln Ile Ser Ser Ser Gly Gln Gly Gly Gly Gly Ser Gly Phe Ser
340 345 350
Val Asp Thr Ser Ala Leu Leu Asp Leu Phe Ser Pro Ser Val Thr Val
355 360 365
Pro Asp Met Ser Leu Pro Asp Leu Asp Ser Ser Leu Ala Ser Ile Gln
370 375 380
Glu Leu Leu Ser Pro Gln Glu Pro Pro Arg Pro Pro Glu Ala Glu Asn
385 390 395 400
Ser Ser Pro Asp Ser Gly Lys Gln Leu Val His Tyr Thr Ala Gln Pro
405 410 415
Leu Phe Leu Leu Asp Pro Gly Ser Val Asp Thr Gly Ser Asn Asp Leu
420 425 430
Pro Val Leu Phe Glu Leu Gly Glu Gly Ser Tyr Phe Ser Glu Gly Asp
435 440 445
Gly Phe Ala Glu Asp Pro Thr Ile Ser Leu Leu Thr Gly Ser Glu Pro
450 455 460
Pro Lys Ala Lys Asp Pro Thr Val Ser
465 470
<210> 7
<211> 130
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 7
Met Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Gly Thr
1 5 10 15
Gly Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu
20 25 30
Trp Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser
35 40 45
Val Arg Gln Ser Ser Ala Gln Lys Arg Lys Tyr Thr Ile Lys Val Glu
50 55 60
Val Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val
65 70 75 80
Ala Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe
85 90 95
Ala Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu
100 105 110
Leu Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly
115 120 125
Ile Tyr
130
<210> 8
<211> 181
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 8
Pro Ser Gly Gln Ile Ser Asn Gln Ala Leu Ala Leu Ala Pro Ser Ser
1 5 10 15
Ala Pro Val Leu Ala Gln Thr Met Val Pro Ser Ser Ala Met Val Pro
20 25 30
Leu Ala Gln Pro Pro Ala Pro Ala Pro Val Leu Thr Pro Gly Pro Pro
35 40 45
Gln Ser Leu Ser Ala Pro Val Pro Lys Ser Thr Gln Ala Gly Glu Gly
50 55 60
Thr Leu Ser Glu Ala Leu Leu His Leu Gln Phe Asp Ala Asp Glu Asp
65 70 75 80
Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Gly Val Phe Thr Asp
85 90 95
Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly
100 105 110
Val Ser Met Ser His Ser Thr Ala Glu Pro Met Leu Met Glu Tyr Pro
115 120 125
Glu Ala Ile Thr Arg Leu Val Thr Gly Ser Gln Arg Pro Pro Asp Pro
130 135 140
Ala Pro Thr Pro Leu Gly Thr Ser Gly Leu Pro Asn Gly Leu Ser Gly
145 150 155 160
Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu
165 170 175
Ser Gln Ile Ser Ser
180
<210> 9
<211> 124
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 9
Gly Phe Ser Val Asp Thr Ser Ala Leu Leu Asp Leu Phe Ser Pro Ser
1 5 10 15
Val Thr Val Pro Asp Met Ser Leu Pro Asp Leu Asp Ser Ser Leu Ala
20 25 30
Ser Ile Gln Glu Leu Leu Ser Pro Gln Glu Pro Pro Arg Pro Pro Glu
35 40 45
Ala Glu Asn Ser Ser Pro Asp Ser Gly Lys Gln Leu Val His Tyr Thr
50 55 60
Ala Gln Pro Leu Phe Leu Leu Asp Pro Gly Ser Val Asp Thr Gly Ser
65 70 75 80
Asn Asp Leu Pro Val Leu Phe Glu Leu Gly Glu Gly Ser Tyr Phe Ser
85 90 95
Glu Gly Asp Gly Phe Ala Glu Asp Pro Thr Ile Ser Leu Leu Thr Gly
100 105 110
Ser Glu Pro Pro Lys Ala Lys Asp Pro Thr Val Ser
115 120
<210> 10
<211> 16
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 10
guuuuagagc uaugcu 16
<210> 11
<211> 67
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 11
agcauagcaa guuaaaauaa ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg 60
gugcuuu 67
<210> 12
<211> 77
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 12
guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60
ggcaccgagu cggugcu 77
<210> 13
<211> 82
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 13
guuggaacca uucaaaacag cauagcaagu uaaaauaagg cuaguccguu aucaacuuga 60
aaaaguggca ccgagucggu gc 82
<210> 14
<211> 76
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 14
guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60
ggcaccgagu cggugc 76
<210> 15
<211> 86
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 15
guuuaagagc uaugcuggaa acagcauagc aaguuuaaau aaggcuaguc cguuaucaac 60
uugaaaaagu ggcaccgagu cggugc 86
<210> 16
<211> 34
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 16
ggccaacaug aggaucaccc augucugcag ggcc 34
<210> 17
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (2)..(21)
<223> n是a、c、g或t
<400> 17
gnnnnnnnnn nnnnnnnnnn ngg 23
<210> 18
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(21)
<223> n是a、c、g或t
<400> 18
nnnnnnnnnn nnnnnnnnnn ngg 23
<210> 19
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (3)..(23)
<223> n是a、c、g或t
<400> 19
ggnnnnnnnn nnnnnnnnnn nnngg 25
<210> 20
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 20
Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro
1 5 10 15
Gly Pro
<210> 21
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 21
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly Pro
<210> 22
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 22
Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp Val Glu Ser
1 5 10 15
Asn Pro Gly Pro
20
<210> 23
<211> 22
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 23
Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val
1 5 10 15
Glu Ser Asn Pro Gly Pro
20
<210> 24
<211> 4152
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 24
atgaaaaggc cggcggccac gaaaaaggcc ggccaggcaa aaaagaaaaa ggacaagaag 60
tacagcatcg gcctggccat cggcaccaac tctgtgggct gggccgtgat caccgacgag 120
tacaaggtgc ccagcaagaa attcaaggtg ctgggcaaca ccgaccggca cagcatcaag 180
aagaacctga tcggagccct gctgttcgac agcggcgaaa cagccgaggc cacccggctg 240
aagagaaccg ccagaagaag atacaccaga cggaagaacc ggatctgcta tctgcaagag 300
atcttcagca acgagatggc caaggtggac gacagcttct tccacagact ggaagagtcc 360
ttcctggtgg aagaggataa gaagcacgag cggcacccca tcttcggcaa catcgtggac 420
gaggtggcct accacgagaa gtaccccacc atctaccacc tgagaaagaa actggtggac 480
agcaccgaca aggccgacct gcggctgatc tatctggccc tggcccacat gatcaagttc 540
cggggccact tcctgatcga gggcgacctg aaccccgaca acagcgacgt ggacaagctg 600
ttcatccagc tggtgcagac ctacaaccag ctgttcgagg aaaaccccat caacgccagc 660
ggcgtggacg ccaaggccat cctgtctgcc agactgagca agagcagacg gctggaaaat 720
ctgatcgccc agctgcccgg cgagaagaag aatggcctgt tcggcaacct gattgccctg 780
agcctgggcc tgacccccaa cttcaagagc aacttcgacc tggccgagga tgccaaactg 840
cagctgagca aggacaccta cgacgacgac ctggacaacc tgctggccca gatcggcgac 900
cagtacgccg acctgtttct ggccgccaag aacctgtccg acgccatcct gctgagcgac 960
atcctgagag tgaacaccga gatcaccaag gcccccctga gcgcctctat gatcaagaga 1020
tacgacgagc accaccagga cctgaccctg ctgaaagctc tcgtgcggca gcagctgcct 1080
gagaagtaca aagagatttt cttcgaccag agcaagaacg gctacgccgg ctacattgac 1140
ggcggagcca gccaggaaga gttctacaag ttcatcaagc ccatcctgga aaagatggac 1200
ggcaccgagg aactgctcgt gaagctgaac agagaggacc tgctgcggaa gcagcggacc 1260
ttcgacaacg gcagcatccc ccaccagatc cacctgggag agctgcacgc cattctgcgg 1320
cggcaggaag atttttaccc attcctgaag gacaaccggg aaaagatcga gaagatcctg 1380
accttccgca tcccctacta cgtgggccct ctggccaggg gaaacagcag attcgcctgg 1440
atgaccagaa agagcgagga aaccatcacc ccctggaact tcgaggaagt ggtggacaag 1500
ggcgcttccg cccagagctt catcgagcgg atgaccaact tcgataagaa cctgcccaac 1560
gagaaggtgc tgcccaagca cagcctgctg tacgagtact tcaccgtgta taacgagctg 1620
accaaagtga aatacgtgac cgagggaatg agaaagcccg ccttcctgag cggcgagcag 1680
aaaaaggcca tcgtggacct gctgttcaag accaaccgga aagtgaccgt gaagcagctg 1740
aaagaggact acttcaagaa aatcgagtgc ttcgactccg tggaaatctc cggcgtggaa 1800
gatcggttca acgcctccct gggcacatac cacgatctgc tgaaaattat caaggacaag 1860
gacttcctgg acaatgagga aaacgaggac attctggaag atatcgtgct gaccctgaca 1920
ctgtttgagg acagagagat gatcgaggaa cggctgaaaa cctatgccca cctgttcgac 1980
gacaaagtga tgaagcagct gaagcggcgg agatacaccg gctggggcag gctgagccgg 2040
aagctgatca acggcatccg ggacaagcag tccggcaaga caatcctgga tttcctgaag 2100
tccgacggct tcgccaacag aaacttcatg cagctgatcc acgacgacag cctgaccttt 2160
aaagaggaca tccagaaagc ccaggtgtcc ggccagggcg atagcctgca cgagcacatt 2220
gccaatctgg ccggcagccc cgccattaag aagggcatcc tgcagacagt gaaggtggtg 2280
gacgagctcg tgaaagtgat gggccggcac aagcccgaga acatcgtgat cgaaatggcc 2340
agagagaacc agaccaccca gaagggacag aagaacagcc gcgagagaat gaagcggatc 2400
gaagagggca tcaaagagct gggcagccag atcctgaaag aacaccccgt ggaaaacacc 2460
cagctgcaga acgagaagct gtacctgtac tacctgcaga atgggcggga tatgtacgtg 2520
gaccaggaac tggacatcaa ccggctgtcc gactacgatg tggaccacat cgtgcctcag 2580
agctttctga aggacgactc catcgacaac aaggtgctga ccagaagcga caaggcccgg 2640
ggcaagagcg acaacgtgcc ctccgaagag gtcgtgaaga agatgaagaa ctactggcgg 2700
cagctgctga acgccaagct gattacccag agaaagttcg acaatctgac caaggccgag 2760
agaggcggcc tgagcgaact ggataaggcc ggcttcatca agagacagct ggtggaaacc 2820
cggcagatca caaagcacgt ggcacagatc ctggactccc ggatgaacac taagtacgac 2880
gagaatgaca agctgatccg ggaagtgaaa gtgatcaccc tgaagtccaa gctggtgtcc 2940
gatttccgga aggatttcca gttttacaaa gtgcgcgaga tcaacaacta ccaccacgcc 3000
cacgacgcct acctgaacgc cgtcgtggga accgccctga tcaaaaagta ccctaagctg 3060
gaaagcgagt tcgtgtacgg cgactacaag gtgtacgacg tgcggaagat gatcgccaag 3120
agcgagcagg aaatcggcaa ggctaccgcc aagtacttct tctacagcaa catcatgaac 3180
tttttcaaga ccgagattac cctggccaac ggcgagatcc ggaagcggcc tctgatcgag 3240
acaaacggcg aaaccgggga gatcgtgtgg gataagggcc gggattttgc caccgtgcgg 3300
aaagtgctga gcatgcccca agtgaatatc gtgaaaaaga ccgaggtgca gacaggcggc 3360
ttcagcaaag agtctatcct gcccaagagg aacagcgata agctgatcgc cagaaagaag 3420
gactgggacc ctaagaagta cggcggcttc gacagcccca ccgtggccta ttctgtgctg 3480
gtggtggcca aagtggaaaa gggcaagtcc aagaaactga agagtgtgaa agagctgctg 3540
gggatcacca tcatggaaag aagcagcttc gagaagaatc ccatcgactt tctggaagcc 3600
aagggctaca aagaagtgaa aaaggacctg atcatcaagc tgcctaagta ctccctgttc 3660
gagctggaaa acggccggaa gagaatgctg gcctctgccg gcgaactgca gaagggaaac 3720
gaactggccc tgccctccaa atatgtgaac ttcctgtacc tggccagcca ctatgagaag 3780
ctgaagggct cccccgagga taatgagcag aaacagctgt ttgtggaaca gcacaagcac 3840
tacctggacg agatcatcga gcagatcagc gagttctcca agagagtgat cctggccgac 3900
gctaatctgg acaaagtgct gtccgcctac aacaagcacc gggataagcc catcagagag 3960
caggccgaga atatcatcca cctgtttacc ctgaccaatc tgggagcccc tgccgccttc 4020
aagtactttg acaccaccat cgaccggaag aggtacacca gcaccaaaga ggtgctggac 4080
gccaccctga tccaccagag catcaccggc ctgtacgaga cacggatcga cctgtctcag 4140
ctgggaggcg ac 4152
<210> 25
<211> 4414
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 25
atgaaaaggc cggcggccac gaaaaaggcc ggccaggcaa aaaagaaaaa ggacaagaag 60
tacagcatcg gcctggccat cggcaccaac tctgtgggct gggccgtgat caccgacgag 120
tacaaggtgc ccagcaagaa attcaaggtg ctgggcaaca ccgaccggca cagcatcaag 180
aagaacctga tcggagccct gctgttcgac agcggcgaaa cagccgaggc cacccggctg 240
aagagaaccg ccagaagaag atacaccaga cggaagaacc ggatctgcta tctgcaagag 300
atcttcagca acgagatggc caaggtggac gacagcttct tccacagact ggaagagtcc 360
ttcctggtgg aagaggataa gaagcacgag cggcacccca tcttcggcaa catcgtggac 420
gaggtggcct accacgagaa gtaccccacc atctaccacc tgagaaagaa actggtggac 480
agcaccgaca aggccgacct gcggctgatc tatctggccc tggcccacat gatcaagttc 540
cggggccact tcctgatcga gggcgacctg aaccccgaca acagcgacgt ggacaagctg 600
ttcatccagc tggtgcagac ctacaaccag ctgttcgagg aaaaccccat caacgccagc 660
ggcgtggacg ccaaggccat cctgtctgcc agactgagca agagcagacg gctggaaaat 720
ctgatcgccc agctgcccgg cgagaagaag aatggcctgt tcggcaacct gattgccctg 780
agcctgggcc tgacccccaa cttcaagagc aacttcgacc tggccgagga tgccaaactg 840
cagctgagca aggacaccta cgacgacgac ctggacaacc tgctggccca gatcggcgac 900
cagtacgccg acctgtttct ggccgccaag aacctgtccg acgccatcct gctgagcgac 960
atcctgagag tgaacaccga gatcaccaag gcccccctga gcgcctctat gatcaagaga 1020
tacgacgagc accaccagga cctgaccctg ctgaaagctc tcgtgcggca gcagctgcct 1080
gagaagtaca aagagatttt cttcgaccag agcaagaacg gctacgccgg ctacattgac 1140
ggcggagcca gccaggaaga gttctacaag ttcatcaagc ccatcctgga aaagatggac 1200
ggcaccgagg aactgctcgt gaagctgaac agagaggacc tgctgcggaa gcagcggacc 1260
ttcgacaacg gcagcatccc ccaccagatc cacctgggag agctgcacgc cattctgcgg 1320
cggcaggaag atttttaccc attcctgaag gacaaccggg aaaagatcga gaagatcctg 1380
accttccgca tcccctacta cgtgggccct ctggccaggg gaaacagcag attcgcctgg 1440
atgaccagaa agagcgagga aaccatcacc ccctggaact tcgaggaagt ggtggacaag 1500
ggcgcttccg cccagagctt catcgagcgg atgaccaact tcgataagaa cctgcccaac 1560
gagaaggtgc tgcccaagca cagcctgctg tacgagtact tcaccgtgta taacgagctg 1620
accaaagtga aatacgtgac cgagggaatg agaaagcccg ccttcctgag cggcgagcag 1680
aaaaaggcca tcgtggacct gctgttcaag accaaccgga aagtgaccgt gaagcagctg 1740
aaagaggact acttcaagaa aatcgagtgc ttcgactccg tggaaatctc cggcgtggaa 1800
gatcggttca acgcctccct gggcacatac cacgatctgc tgaaaattat caaggacaag 1860
gacttcctgg acaatgagga aaacgaggac attctggaag atatcgtgct gaccctgaca 1920
ctgtttgagg acagagagat gatcgaggaa cggctgaaaa cctatgccca cctgttcgac 1980
gacaaagtga tgaagcagct gaagcggcgg agatacaccg gctggggcag gctgagccgg 2040
aagctgatca acggcatccg ggacaagcag tccggcaaga caatcctgga tttcctgaag 2100
tccgacggct tcgccaacag aaacttcatg cagctgatcc acgacgacag cctgaccttt 2160
aaagaggaca tccagaaagc ccaggtgtcc ggccagggcg atagcctgca cgagcacatt 2220
gccaatctgg ccggcagccc cgccattaag aagggcatcc tgcagacagt gaaggtggtg 2280
gacgagctcg tgaaagtgat gggccggcac aagcccgaga acatcgtgat cgaaatggcc 2340
agagagaacc agaccaccca gaagggacag aagaacagcc gcgagagaat gaagcggatc 2400
gaagagggca tcaaagagct gggcagccag atcctgaaag aacaccccgt ggaaaacacc 2460
cagctgcaga acgagaagct gtacctgtac tacctgcaga atgggcggga tatgtacgtg 2520
gaccaggaac tggacatcaa ccggctgtcc gactacgatg tggaccacat cgtgcctcag 2580
agctttctga aggacgactc catcgacaac aaggtgctga ccagaagcga caaggcccgg 2640
ggcaagagcg acaacgtgcc ctccgaagag gtcgtgaaga agatgaagaa ctactggcgg 2700
cagctgctga acgccaagct gattacccag agaaagttcg acaatctgac caaggccgag 2760
agaggcggcc tgagcgaact ggataaggcc ggcttcatca agagacagct ggtggaaacc 2820
cggcagatca caaagcacgt ggcacagatc ctggactccc ggatgaacac taagtacgac 2880
gagaatgaca agctgatccg ggaagtgaaa gtgatcaccc tgaagtccaa gctggtgtcc 2940
gatttccgga aggatttcca gttttacaaa gtgcgcgaga tcaacaacta ccaccacgcc 3000
cacgacgcct acctgaacgc cgtcgtggga accgccctga tcaaaaagta ccctaagctg 3060
gaaagcgagt tcgtgtacgg cgactacaag gtgtacgacg tgcggaagat gatcgccaag 3120
agcgagcagg aaatcggcaa ggctaccgcc aagtacttct tctacagcaa catcatgaac 3180
tttttcaaga ccgagattac cctggccaac ggcgagatcc ggaagcggcc tctgatcgag 3240
acaaacggcg aaaccgggga gatcgtgtgg gataagggcc gggattttgc caccgtgcgg 3300
aaagtgctga gcatgcccca agtgaatatc gtgaaaaaga ccgaggtgca gacaggcggc 3360
ttcagcaaag agtctatcct gcccaagagg aacagcgata agctgatcgc cagaaagaag 3420
gactgggacc ctaagaagta cggcggcttc gacagcccca ccgtggccta ttctgtgctg 3480
gtggtggcca aagtggaaaa gggcaagtcc aagaaactga agagtgtgaa agagctgctg 3540
gggatcacca tcatggaaag aagcagcttc gagaagaatc ccatcgactt tctggaagcc 3600
aagggctaca aagaagtgaa aaaggacctg atcatcaagc tgcctaagta ctccctgttc 3660
gagctggaaa acggccggaa gagaatgctg gcctctgccg gcgaactgca gaagggaaac 3720
gaactggccc tgccctccaa atatgtgaac ttcctgtacc tggccagcca ctatgagaag 3780
ctgaagggct cccccgagga taatgagcag aaacagctgt ttgtggaaca gcacaagcac 3840
tacctggacg agatcatcga gcagatcagc gagttctcca agagagtgat cctggccgac 3900
gctaatctgg acaaagtgct gtccgcctac aacaagcacc gggataagcc catcagagag 3960
caggccgaga atatcatcca cctgtttacc ctgaccaatc tgggagcccc tgccgccttc 4020
aagtactttg acaccaccat cgaccggaag aggtacacca gcaccaaaga ggtgctggac 4080
gccaccctga tccaccagag catcaccggc ctgtacgaga cacggatcga cctgtctcag 4140
ctgggaggcg acagcgctgg aggaggtgga agcggaggag gaggaagcgg aggaggaggt 4200
agcggaccta agaaaaagag gaaggtggcg gccgctggat ccggacgggc tgacgcattg 4260
gacgattttg atctggatat gctgggaagt gacgccctcg atgattttga ccttgacatg 4320
cttggttcgg atgcccttga tgactttgac ctcgacatgc tcggcagtga cgcccttgat 4380
gatttcgacc tggacatgct gattaactgt acag 4414
<210> 26
<211> 390
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 26
atggcttcaa actttactca gttcgtgctc gtggacaatg gtgggacagg ggatgtgaca 60
gtggctcctt ctaatttcgc taatggggtg gcagagtgga tcagctccaa ctcacggagc 120
caggcctaca aggtgacatg cagcgtcagg cagtctagtg cccagaagag aaagtatacc 180
atcaaggtgg aggtccccaa agtggctacc cagacagtgg gcggagtcga actgcctgtc 240
gccgcttgga ggtcctacct gaacatggag ctcactatcc caattttcgc taccaattct 300
gactgtgaac tcatcgtgaa ggcaatgcag gggctcctca aagacggtaa tcctatccct 360
tccgccatcg ccgctaactc aggtatctac 390
<210> 27
<211> 1419
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 27
atggcttcaa actttactca gttcgtgctc gtggacaatg gtgggacagg ggatgtgaca 60
gtggctcctt ctaatttcgc taatggggtg gcagagtgga tcagctccaa ctcacggagc 120
caggcctaca aggtgacatg cagcgtcagg cagtctagtg cccagaagag aaagtatacc 180
atcaaggtgg aggtccccaa agtggctacc cagacagtgg gcggagtcga actgcctgtc 240
gccgcttgga ggtcctacct gaacatggag ctcactatcc caattttcgc taccaattct 300
gactgtgaac tcatcgtgaa ggcaatgcag gggctcctca aagacggtaa tcctatccct 360
tccgccatcg ccgctaactc aggtatctac agcgctggag gaggtggaag cggaggagga 420
ggaagcggag gaggaggtag cggacctaag aaaaagagga aggtggcggc cgctggatcc 480
ccttcagggc agatcagcaa ccaggccctg gctctggccc ctagctccgc tccagtgctg 540
gcccagacta tggtgccctc tagtgctatg gtgcctctgg cccagccacc tgctccagcc 600
cctgtgctga ccccaggacc accccagtca ctgagcgctc cagtgcccaa gtctacacag 660
gccggcgagg ggactctgag tgaagctctg ctgcacctgc agttcgacgc tgatgaggac 720
ctgggagctc tgctggggaa cagcaccgat cccggagtgt tcacagatct ggcctccgtg 780
gacaactctg agtttcagca gctgctgaat cagggcgtgt ccatgtctca tagtacagcc 840
gaaccaatgc tgatggagta ccccgaagcc attacccggc tggtgaccgg cagccagcgg 900
ccccccgacc ccgctccaac tcccctggga accagcggcc tgcctaatgg gctgtccgga 960
gatgaagact tctcaagcat cgctgatatg gactttagtg ccctgctgtc acagatttcc 1020
tctagtgggc agggaggagg tggaagcggc ttcagcgtgg acaccagtgc cctgctggac 1080
ctgttcagcc cctcggtgac cgtgcccgac atgagcctgc ctgaccttga cagcagcctg 1140
gccagtatcc aagagctcct gtctccccag gagcccccca ggcctcccga ggcagagaac 1200
agcagcccgg attcagggaa gcagctggtg cactacacag cgcagccgct gttcctgctg 1260
gaccccggct ccgtggacac cgggagcaac gacctgccgg tgctgtttga gctgggagag 1320
ggctcctact tctccgaagg ggacggcttc gccgaggacc ccaccatctc cctgctgaca 1380
ggctcggagc ctcccaaagc caaggacccc actgtctcc 1419
<210> 28
<211> 187
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 28
gcggccgctg gatccggacg ggctgacgca ttggacgatt ttgatctgga tatgctggga 60
agtgacgccc tcgatgattt tgaccttgac atgcttggtt cggatgccct tgatgacttt 120
gacctcgaca tgctcggcag tgacgccctt gatgatttcg acctggacat gctgattaac 180
tgtacag 187
<210> 29
<211> 543
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 29
ccttcagggc agatcagcaa ccaggccctg gctctggccc ctagctccgc tccagtgctg 60
gcccagacta tggtgccctc tagtgctatg gtgcctctgg cccagccacc tgctccagcc 120
cctgtgctga ccccaggacc accccagtca ctgagcgctc cagtgcccaa gtctacacag 180
gccggcgagg ggactctgag tgaagctctg ctgcacctgc agttcgacgc tgatgaggac 240
ctgggagctc tgctggggaa cagcaccgat cccggagtgt tcacagatct ggcctccgtg 300
gacaactctg agtttcagca gctgctgaat cagggcgtgt ccatgtctca tagtacagcc 360
gaaccaatgc tgatggagta ccccgaagcc attacccggc tggtgaccgg cagccagcgg 420
ccccccgacc ccgctccaac tcccctggga accagcggcc tgcctaatgg gctgtccgga 480
gatgaagact tctcaagcat cgctgatatg gactttagtg ccctgctgtc acagatttcc 540
tct 543
<210> 30
<211> 372
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 30
ggcttcagcg tggacaccag tgccctgctg gacctgttca gcccctcggt gaccgtgccc 60
gacatgagcc tgcctgacct tgacagcagc ctggccagta tccaagagct cctgtctccc 120
caggagcccc ccaggcctcc cgaggcagag aacagcagcc cggattcagg gaagcagctg 180
gtgcactaca cagcgcagcc gctgttcctg ctggaccccg gctccgtgga caccgggagc 240
aacgacctgc cggtgctgtt tgagctggga gagggctcct acttctccga aggggacggc 300
ttcgccgagg accccaccat ctccctgctg acaggctcgg agcctcccaa agccaaggac 360
cccactgtct cc 372
<210> 31
<211> 9043
<212> DNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(34)
<223> 第一loxP位点
<220>
<221> misc_feature
<222> (125 )..(928)
<223> 编码新霉素磷酸转移酶以抵抗新霉素家族抗生素的序列
<220>
<221> misc_feature
<222> (937)..(2190)
<223> 聚腺苷酸化信号
<220>
<221> misc_feature
<222> (2218)..(2251)
<223> 第二loxP位点
<220>
<221> misc_feature
<222> (2306)..(6457)
<223> 经密码子优化的dCas9编码序列
<220>
<221> misc_feature
<222> (2309)..(2356)
<223> NLS
<220>
<221> misc_feature
<222> (6512 )..(6532)
<223> NLS
<220>
<221> misc_feature
<222> (6533)..(6719)
<223> VP64
<220>
<221> misc_feature
<222> (6719)..(6781)
<223> 带有5’ GSG的T2A编码序列
<220>
<221> misc_feature
<222> (6782)..(7171)
<223> MCP
<220>
<221> misc_feature
<222> (7226)..(7246)
<223> NLS
<220>
<221> misc_feature
<222> (7262)..(7804)
<223> p65
<220>
<221> misc_feature
<222> (7829)..(8200)
<223> HSF1
<220>
<221> misc_feature
<222> (8224)..(8820)
<223> 土拨鼠肝炎病毒转录后调控元件
(WPRE)
<400> 31
ataacttcgt ataatgtatg ctatacgaag ttattaggtc cctcgacctg caggaattgt 60
tgacaattaa tcatcggcat agtatatcgg catagtataa tacgacaagg tgaggaacta 120
aaccatggga tcggccattg aacaagatgg attgcacgca ggttctccgg ccgcttgggt 180
ggagaggcta ttcggctatg actgggcaca acagacaatc ggctgctctg atgccgccgt 240
gttccggctg tcagcgcagg ggcgcccggt tctttttgtc aagaccgacc tgtccggtgc 300
cctgaatgaa ctgcaggacg aggcagcgcg gctatcgtgg ctggccacga cgggcgttcc 360
ttgcgcagct gtgctcgacg ttgtcactga agcgggaagg gactggctgc tattgggcga 420
agtgccgggg caggatctcc tgtcatctca ccttgctcct gccgagaaag tatccatcat 480
ggctgatgca atgcggcggc tgcatacgct tgatccggct acctgcccat tcgaccacca 540
agcgaaacat cgcatcgagc gagcacgtac tcggatggaa gccggtcttg tcgatcagga 600
tgatctggac gaagagcatc aggggctcgc gccagccgaa ctgttcgcca ggctcaaggc 660
gcgcatgccc gacggcgatg atctcgtcgt gacccatggc gatgcctgct tgccgaatat 720
catggtggaa aatggccgct tttctggatt catcgactgt ggccggctgg gtgtggcgga 780
ccgctatcag gacatagcgt tggctacccg tgatattgct gaagagcttg gcggcgaatg 840
ggctgaccgc ttcctcgtgc tttacggtat cgccgctccc gattcgcagc gcatcgcctt 900
ctatcgcctt cttgacgagt tcttctgagg ggatccgctg taagtctgca gaaattgatg 960
atctattaaa caataaagat gtccactaaa atggaagttt ttcctgtcat actttgttaa 1020
gaagggtgag aacagagtac ctacattttg aatggaagga ttggagctac gggggtgggg 1080
gtggggtggg attagataaa tgcctgctct ttactgaagg ctctttacta ttgctttatg 1140
ataatgtttc atagttggat atcataattt aaacaagcaa aaccaaatta agggccagct 1200
cattcctccc actcatgatc tatagatcta tagatctctc gtgggatcat tgtttttctc 1260
ttgattccca ctttgtggtt ctaagtactg tggtttccaa atgtgtcagt ttcatagcct 1320
gaagaacgag atcagcagcc tctgttccac atacacttca ttctcagtat tgttttgcca 1380
agttctaatt ccatcagaag cttgcagatc tgcgactcta gaggatctgc gactctagag 1440
gatcataatc agccatacca catttgtaga ggttttactt gctttaaaaa acctcccaca 1500
cctccccctg aacctgaaac ataaaatgaa tgcaattgtt gttgttaact tgtttattgc 1560
agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 1620
ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctggat 1680
ctgcgactct agaggatcat aatcagccat accacatttg tagaggtttt acttgcttta 1740
aaaaacctcc cacacctccc cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt 1800
aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 1860
aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct 1920
tatcatgtct ggatctgcga ctctagagga tcataatcag ccataccaca tttgtagagg 1980
ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat aaaatgaatg 2040
caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa agcaatagca 2100
tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac 2160
tcatcaatgt atcttatcat gtctggatcc ccatcaagct gatccggaac ccttaatata 2220
acttcgtata atgtatgcta tacgaagtta ttaggtccct cgacctgcag cccaagctag 2280
tgcccgggaa ttcgctaggg ccaccatgaa aaggccggcg gccacgaaaa aggccggcca 2340
ggcaaaaaag aaaaaggaca agaagtacag catcggcctg gccatcggca ccaactctgt 2400
gggctgggcc gtgatcaccg acgagtacaa ggtgcccagc aagaaattca aggtgctggg 2460
caacaccgac cggcacagca tcaagaagaa cctgatcgga gccctgctgt tcgacagcgg 2520
cgaaacagcc gaggccaccc ggctgaagag aaccgccaga agaagataca ccagacggaa 2580
gaaccggatc tgctatctgc aagagatctt cagcaacgag atggccaagg tggacgacag 2640
cttcttccac agactggaag agtccttcct ggtggaagag gataagaagc acgagcggca 2700
ccccatcttc ggcaacatcg tggacgaggt ggcctaccac gagaagtacc ccaccatcta 2760
ccacctgaga aagaaactgg tggacagcac cgacaaggcc gacctgcggc tgatctatct 2820
ggccctggcc cacatgatca agttccgggg ccacttcctg atcgagggcg acctgaaccc 2880
cgacaacagc gacgtggaca agctgttcat ccagctggtg cagacctaca accagctgtt 2940
cgaggaaaac cccatcaacg ccagcggcgt ggacgccaag gccatcctgt ctgccagact 3000
gagcaagagc agacggctgg aaaatctgat cgcccagctg cccggcgaga agaagaatgg 3060
cctgttcggc aacctgattg ccctgagcct gggcctgacc cccaacttca agagcaactt 3120
cgacctggcc gaggatgcca aactgcagct gagcaaggac acctacgacg acgacctgga 3180
caacctgctg gcccagatcg gcgaccagta cgccgacctg tttctggccg ccaagaacct 3240
gtccgacgcc atcctgctga gcgacatcct gagagtgaac accgagatca ccaaggcccc 3300
cctgagcgcc tctatgatca agagatacga cgagcaccac caggacctga ccctgctgaa 3360
agctctcgtg cggcagcagc tgcctgagaa gtacaaagag attttcttcg accagagcaa 3420
gaacggctac gccggctaca ttgacggcgg agccagccag gaagagttct acaagttcat 3480
caagcccatc ctggaaaaga tggacggcac cgaggaactg ctcgtgaagc tgaacagaga 3540
ggacctgctg cggaagcagc ggaccttcga caacggcagc atcccccacc agatccacct 3600
gggagagctg cacgccattc tgcggcggca ggaagatttt tacccattcc tgaaggacaa 3660
ccgggaaaag atcgagaaga tcctgacctt ccgcatcccc tactacgtgg gccctctggc 3720
caggggaaac agcagattcg cctggatgac cagaaagagc gaggaaacca tcaccccctg 3780
gaacttcgag gaagtggtgg acaagggcgc ttccgcccag agcttcatcg agcggatgac 3840
caacttcgat aagaacctgc ccaacgagaa ggtgctgccc aagcacagcc tgctgtacga 3900
gtacttcacc gtgtataacg agctgaccaa agtgaaatac gtgaccgagg gaatgagaaa 3960
gcccgccttc ctgagcggcg agcagaaaaa ggccatcgtg gacctgctgt tcaagaccaa 4020
ccggaaagtg accgtgaagc agctgaaaga ggactacttc aagaaaatcg agtgcttcga 4080
ctccgtggaa atctccggcg tggaagatcg gttcaacgcc tccctgggca cataccacga 4140
tctgctgaaa attatcaagg acaaggactt cctggacaat gaggaaaacg aggacattct 4200
ggaagatatc gtgctgaccc tgacactgtt tgaggacaga gagatgatcg aggaacggct 4260
gaaaacctat gcccacctgt tcgacgacaa agtgatgaag cagctgaagc ggcggagata 4320
caccggctgg ggcaggctga gccggaagct gatcaacggc atccgggaca agcagtccgg 4380
caagacaatc ctggatttcc tgaagtccga cggcttcgcc aacagaaact tcatgcagct 4440
gatccacgac gacagcctga cctttaaaga ggacatccag aaagcccagg tgtccggcca 4500
gggcgatagc ctgcacgagc acattgccaa tctggccggc agccccgcca ttaagaaggg 4560
catcctgcag acagtgaagg tggtggacga gctcgtgaaa gtgatgggcc ggcacaagcc 4620
cgagaacatc gtgatcgaaa tggccagaga gaaccagacc acccagaagg gacagaagaa 4680
cagccgcgag agaatgaagc ggatcgaaga gggcatcaaa gagctgggca gccagatcct 4740
gaaagaacac cccgtggaaa acacccagct gcagaacgag aagctgtacc tgtactacct 4800
gcagaatggg cgggatatgt acgtggacca ggaactggac atcaaccggc tgtccgacta 4860
cgatgtggac cacatcgtgc ctcagagctt tctgaaggac gactccatcg acaacaaggt 4920
gctgaccaga agcgacaagg cccggggcaa gagcgacaac gtgccctccg aagaggtcgt 4980
gaagaagatg aagaactact ggcggcagct gctgaacgcc aagctgatta cccagagaaa 5040
gttcgacaat ctgaccaagg ccgagagagg cggcctgagc gaactggata aggccggctt 5100
catcaagaga cagctggtgg aaacccggca gatcacaaag cacgtggcac agatcctgga 5160
ctcccggatg aacactaagt acgacgagaa tgacaagctg atccgggaag tgaaagtgat 5220
caccctgaag tccaagctgg tgtccgattt ccggaaggat ttccagtttt acaaagtgcg 5280
cgagatcaac aactaccacc acgcccacga cgcctacctg aacgccgtcg tgggaaccgc 5340
cctgatcaaa aagtacccta agctggaaag cgagttcgtg tacggcgact acaaggtgta 5400
cgacgtgcgg aagatgatcg ccaagagcga gcaggaaatc ggcaaggcta ccgccaagta 5460
cttcttctac agcaacatca tgaacttttt caagaccgag attaccctgg ccaacggcga 5520
gatccggaag cggcctctga tcgagacaaa cggcgaaacc ggggagatcg tgtgggataa 5580
gggccgggat tttgccaccg tgcggaaagt gctgagcatg ccccaagtga atatcgtgaa 5640
aaagaccgag gtgcagacag gcggcttcag caaagagtct atcctgccca agaggaacag 5700
cgataagctg atcgccagaa agaaggactg ggaccctaag aagtacggcg gcttcgacag 5760
ccccaccgtg gcctattctg tgctggtggt ggccaaagtg gaaaagggca agtccaagaa 5820
actgaagagt gtgaaagagc tgctggggat caccatcatg gaaagaagca gcttcgagaa 5880
gaatcccatc gactttctgg aagccaaggg ctacaaagaa gtgaaaaagg acctgatcat 5940
caagctgcct aagtactccc tgttcgagct ggaaaacggc cggaagagaa tgctggcctc 6000
tgccggcgaa ctgcagaagg gaaacgaact ggccctgccc tccaaatatg tgaacttcct 6060
gtacctggcc agccactatg agaagctgaa gggctccccc gaggataatg agcagaaaca 6120
gctgtttgtg gaacagcaca agcactacct ggacgagatc atcgagcaga tcagcgagtt 6180
ctccaagaga gtgatcctgg ccgacgctaa tctggacaaa gtgctgtccg cctacaacaa 6240
gcaccgggat aagcccatca gagagcaggc cgagaatatc atccacctgt ttaccctgac 6300
caatctggga gcccctgccg ccttcaagta ctttgacacc accatcgacc ggaagaggta 6360
caccagcacc aaagaggtgc tggacgccac cctgatccac cagagcatca ccggcctgta 6420
cgagacacgg atcgacctgt ctcagctggg aggcgacagc gctggaggag gtggaagcgg 6480
aggaggagga agcggaggag gaggtagcgg acctaagaaa aagaggaagg tggcggccgc 6540
tggatccgga cgggctgacg cattggacga ttttgatctg gatatgctgg gaagtgacgc 6600
cctcgatgat tttgaccttg acatgcttgg ttcggatgcc cttgatgact ttgacctcga 6660
catgctcggc agtgacgccc ttgatgattt cgacctggac atgctgatta actgtacagg 6720
cagtggagag ggcagaggaa gtctgctaac atgcggtgac gtcgaggaga atcctggccc 6780
aatggcttca aactttactc agttcgtgct cgtggacaat ggtgggacag gggatgtgac 6840
agtggctcct tctaatttcg ctaatggggt ggcagagtgg atcagctcca actcacggag 6900
ccaggcctac aaggtgacat gcagcgtcag gcagtctagt gcccagaaga gaaagtatac 6960
catcaaggtg gaggtcccca aagtggctac ccagacagtg ggcggagtcg aactgcctgt 7020
cgccgcttgg aggtcctacc tgaacatgga gctcactatc ccaattttcg ctaccaattc 7080
tgactgtgaa ctcatcgtga aggcaatgca ggggctcctc aaagacggta atcctatccc 7140
ttccgccatc gccgctaact caggtatcta cagcgctgga ggaggtggaa gcggaggagg 7200
aggaagcgga ggaggaggta gcggacctaa gaaaaagagg aaggtggcgg ccgctggatc 7260
cccttcaggg cagatcagca accaggccct ggctctggcc cctagctccg ctccagtgct 7320
ggcccagact atggtgccct ctagtgctat ggtgcctctg gcccagccac ctgctccagc 7380
ccctgtgctg accccaggac caccccagtc actgagcgct ccagtgccca agtctacaca 7440
ggccggcgag gggactctga gtgaagctct gctgcacctg cagttcgacg ctgatgagga 7500
cctgggagct ctgctgggga acagcaccga tcccggagtg ttcacagatc tggcctccgt 7560
ggacaactct gagtttcagc agctgctgaa tcagggcgtg tccatgtctc atagtacagc 7620
cgaaccaatg ctgatggagt accccgaagc cattacccgg ctggtgaccg gcagccagcg 7680
gccccccgac cccgctccaa ctcccctggg aaccagcggc ctgcctaatg ggctgtccgg 7740
agatgaagac ttctcaagca tcgctgatat ggactttagt gccctgctgt cacagatttc 7800
ctctagtggg cagggaggag gtggaagcgg cttcagcgtg gacaccagtg ccctgctgga 7860
cctgttcagc ccctcggtga ccgtgcccga catgagcctg cctgaccttg acagcagcct 7920
ggccagtatc caagagctcc tgtctcccca ggagcccccc aggcctcccg aggcagagaa 7980
cagcagcccg gattcaggga agcagctggt gcactacaca gcgcagccgc tgttcctgct 8040
ggaccccggc tccgtggaca ccgggagcaa cgacctgccg gtgctgtttg agctgggaga 8100
gggctcctac ttctccgaag gggacggctt cgccgaggac cccaccatct ccctgctgac 8160
aggctcggag cctcccaaag ccaaggaccc cactgtctcc tgagaattcg atatcaagct 8220
tatcgataat caacctctgg attacaaaat ttgtgaaaga ttgactggta ttcttaacta 8280
tgttgctcct tttacgctat gtggatacgc tgctttaatg cctttgtatc atgctattgc 8340
ttcccgtatg gctttcattt tctcctcctt gtataaatcc tggttgctgt ctctttatga 8400
ggagttgtgg cccgttgtca ggcaacgtgg cgtggtgtgc actgtgtttg ctgacgcaac 8460
ccccactggt tggggcattg ccaccacctg tcagctcctt tccgggactt tcgctttccc 8520
cctccctatt gccacggcgg aactcatcgc cgcctgcctt gcccgctgct ggacaggggc 8580
tcggctgttg ggcactgaca attccgtggt gttgtcgggg aaatcatcgt cctttccttg 8640
gctgctcgcc tgtgttgcca cctggattct gcgcgggacg tccttctgct acgtcccttc 8700
ggccctcaat ccagcggacc ttccttcccg cggcctgctg ccggctctgc ggcctcttcc 8760
gcgtcttcgc cttcgccctc agacgagtcg gatctccctt tgggccgcct ccccgcatcg 8820
ataccgtcga cctcgacctc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 8880
tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 8940
gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 9000
caggacagca agggggagga ttgggaagac aatggcaggc atg 9043
<210> 32
<211> 3812
<212> DNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(32)
<223> 第一rox位点
<220>
<221> misc_feature
<222> (111)..(710)
<223> 编码嘌呤霉素-N-乙酰转移酶以抵抗嘌呤霉素家族抗生素的序列
<220>
<221> misc_feature
<222> (797)..(2338)
<223> 聚腺苷酸化信号
<220>
<221> misc_feature
<222> (2363)..(2394)
<223> 第二rox位点
<220>
<221> misc_feature
<222> (2401)..(2640)
<223> 第一U6启动子
<220>
<221> misc_feature
<222> (2641)..(2797)
<223> 第一向导RNA编码序列
<220>
<221> misc_feature
<222> (2641)..(2660)
<223> n是a、c、g或t
<220>
<221> misc_feature
<222> (2883)..(3122)
<223> 第二U6启动子
<220>
<221> misc_feature
<222> (3123)..(3279)
<223> 第二向导RNA编码序列
<220>
<221> misc_feature
<222> (3123)..(3142)
<223> n是a、c、g或t
<220>
<221> misc_feature
<222> (3364)..(3603)
<223> 第三U6启动子
<220>
<221> misc_feature
<222> (3604)..(3760)
<223> 第三向导RNA编码序列
<220>
<221> misc_feature
<222> (3604)..(3623)
<223> n是a、c、g或t
<400> 32
taactttaaa taatgccaat tatttaaagt tacctgcagg acgtgttgac aattaatcat 60
cggcatagta tatcggcata gtataatacg acaaggtgag gaactaaacc atgaccgagt 120
acaagcccac ggtgcgcctc gccacccgcg acgacgtccc cagggccgta cgcaccctcg 180
ccgccgcgtt cgccgactac cccgccacgc gccacaccgt cgatccggac cgccacatcg 240
agcgggtcac cgagctgcaa gaactcttcc tcacgcgcgt cgggctcgac atcggcaagg 300
tgtgggtcgc ggacgacggc gccgcggtgg cggtctggac cacgccggag agcgtcgaag 360
cgggggcggt gttcgccgag atcggcccgc gcatggccga gttgagcggt tcccggctgg 420
ccgcgcagca acagatggaa ggcctcctgg cgccgcaccg gcccaaggag cccgcgtggt 480
tcctggccac cgtcggcgtc tcgcccgacc accagggcaa gggtctgggc agcgccgtcg 540
tgctccccgg agtggaggcg gccgagcgcg ccggggtgcc cgccttcctg gagacctccg 600
cgccccgcaa cctccccttc tacgagcggc tcggcttcac cgtcaccgcc gacgtcgagg 660
tgcccgaagg accgcgcacc tggtgcatga cccgcaagcc cggtgcctga cgcccgcccc 720
acgacccgca gcgcccgacc gaaaggagcg cacgacccca tgcatcgatg atctagagct 780
cgctgatcag cctcgactgt gccttctagt tgccagccat ctgttgtttg cccctccccc 840
gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa 900
attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac 960
agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt gggctctatg 1020
gcataacttc gtataatgta tgctatacgg gggatccgct gtaagtctgc agaaattgat 1080
gatctattaa acaataaaga tgtccactaa aatggaagtt tttcctgtca tactttgtta 1140
agaagggtga gaacagagta cctacatttt gaatggaagg attggagcta cgggggtggg 1200
ggtggggtgg gattagataa atgcctgctc tttactgaag gctctttact attgctttat 1260
gataatgttt catagttgga tatcataatt taaacaagca aaaccaaatt aagggccagc 1320
tcattcctcc cactcatgat ctatagatct atagatctct cgtgggatca ttgtttttct 1380
cttgattccc actttgtggt tctaagtact gtggtttcca aatgtgtcag tttcatagcc 1440
tgaagaacga gatcagcagc ctctgttcca catacacttc attctcagta ttgttttgcc 1500
aagttctaat tccatcagac ctcgacctgc agccgacgct aggtcgtcag tcaaagtacg 1560
tacctcaggt gcaggctgcc tatcagaagg tggtggctgg tgtggccaat gccctggctc 1620
acaaatacca ctgagatctt tttccctctg ccaaaaatta tggggacatc atgaagcccc 1680
ttgagcatct gacttctggc taataaagga aatttatttt cattgcaata gtgtgttgga 1740
attttttgtg tctctcactc ggaaggacat atgggagggc aaatcattta aaacatcaga 1800
atgagtattt ggtttagagt ttggcaacat atgcccatat gctggctgcc atgaacaaag 1860
gttggctata aagaggtcat cagtatatga aacagccccc tgctgtccat tccttattcc 1920
atagaaaagc cttgacttga ggttagattt tttttatatt ttgttttgtg ttattttttt 1980
ctttaacatc cctaaaattt tccttagatg ttttactagc cagatttttc ctcctctcct 2040
gactactccc agtcatagct gtccctcttc tcttatggag atccctcgag gacatgaggt 2100
cgtcgctgta atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc 2160
acacctcccc ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat 2220
tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt 2280
tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtcga 2340
cactgggtcg tgatcgggta cctaacttta aataatgcca attatttaaa gttagctagc 2400
tttcccatga ttccttcata tttgcatata cgatacaagg ctgttagaga gataattgga 2460
attaatttga ctgtaaacac aaagatatta gtacaaaata cgtgacgtag aaagtaataa 2520
tttcttgggt agtttgcagt tttaaaatta tgttttaaaa tggactatca tatgcttacc 2580
gtaacttgaa agtatttcga tttcttggct ttatatatct tgtggaaagg acgaaacacc 2640
nnnnnnnnnn nnnnnnnnnn gttttagagc taggccaaca tgaggatcac ccatgtctgc 2700
agggcctagc aagttaaaat aaggctagtc cgttatcaac ttggccaaca tgaggatcac 2760
ccatgtctgc agggccaagt ggcaccgagt cggtgctttt tttgttttag agctagaaat 2820
agcaagttaa aataaggcta gtccgttttg agctccataa gactcggcct tagaacaagc 2880
tttttcccat gattccttca tatttgcata tacgatacaa ggctgttaga gagataattg 2940
gaattaattt gactgtaaac acaaagatat tagtacaaaa tacgtgacgt agaaagtaat 3000
aatttcttgg gtagtttgca gttttaaaat tatgttttaa aatggactat catatgctta 3060
ccgtaacttg aaagtatttc gatttcttgg ctttatatat cttgtggaaa ggacgaaaca 3120
ccnnnnnnnn nnnnnnnnnn nngttttaga gctaggccaa catgaggatc acccatgtct 3180
gcagggccta gcaagttaaa ataaggctag tccgttatca acttggccaa catgaggatc 3240
acccatgtct gcagggccaa gtggcaccga gtcggtgctt tttttgtttt agagctagaa 3300
atagcaagtt aaaataaggc tagtccgttt tatgcatgtg gctcccattt atacctggcc 3360
ggctttccca tgattccttc atatttgcat atacgataca aggctgttag agagataatt 3420
ggaattaatt tgactgtaaa cacaaagata ttagtacaaa atacgtgacg tagaaagtaa 3480
taatttcttg ggtagtttgc agttttaaaa ttatgtttta aaatggacta tcatatgctt 3540
accgtaactt gaaagtattt cgatttcttg gctttatata tcttgtggaa aggacgaaac 3600
accnnnnnnn nnnnnnnnnn nnngttttag agctaggcca acatgaggat cacccatgtc 3660
tgcagggcct agcaagttaa aataaggcta gtccgttatc aacttggcca acatgaggat 3720
cacccatgtc tgcagggcca agtggcaccg agtcggtgct ttttttgttt tagagctaga 3780
aatagcaagt taaaataagg ctagtccgtt tt 3812
<210> 33
<211> 3814
<212> DNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(32)
<223> 第一rox位点
<220>
<221> misc_feature
<222> (111)..(710)
<223> 编码嘌呤霉素-N-乙酰转移酶以抵抗嘌呤霉素家族抗生素的序列
<220>
<221> misc_feature
<222> (797)..(2338)
<223> 聚腺苷酸化信号
<220>
<221> misc_feature
<222> (2363)..(2394)
<223> 第二rox位点
<220>
<221> misc_feature
<222> (2401)..(2640)
<223> 第一U6启动子
<220>
<221> misc_feature
<222> (2642)..(2798)
<223> 第一Ttr向导RNA编码序列
<220>
<221> misc_feature
<222> (2884)..(3123)
<223> 第二U6启动子
<220>
<221> misc_feature
<222> (3125)..(3281)
<223> 第二Ttr向导RNA编码序列
<220>
<221> misc_feature
<222> (3366)..(3605)
<223> 第三U6启动子
<220>
<221> misc_feature
<222> (3606)..(3762)
<223> 第三Ttr向导RNA编码序列
<400> 33
taactttaaa taatgccaat tatttaaagt tacctgcagg acgtgttgac aattaatcat 60
cggcatagta tatcggcata gtataatacg acaaggtgag gaactaaacc atgaccgagt 120
acaagcccac ggtgcgcctc gccacccgcg acgacgtccc cagggccgta cgcaccctcg 180
ccgccgcgtt cgccgactac cccgccacgc gccacaccgt cgatccggac cgccacatcg 240
agcgggtcac cgagctgcaa gaactcttcc tcacgcgcgt cgggctcgac atcggcaagg 300
tgtgggtcgc ggacgacggc gccgcggtgg cggtctggac cacgccggag agcgtcgaag 360
cgggggcggt gttcgccgag atcggcccgc gcatggccga gttgagcggt tcccggctgg 420
ccgcgcagca acagatggaa ggcctcctgg cgccgcaccg gcccaaggag cccgcgtggt 480
tcctggccac cgtcggcgtc tcgcccgacc accagggcaa gggtctgggc agcgccgtcg 540
tgctccccgg agtggaggcg gccgagcgcg ccggggtgcc cgccttcctg gagacctccg 600
cgccccgcaa cctccccttc tacgagcggc tcggcttcac cgtcaccgcc gacgtcgagg 660
tgcccgaagg accgcgcacc tggtgcatga cccgcaagcc cggtgcctga cgcccgcccc 720
acgacccgca gcgcccgacc gaaaggagcg cacgacccca tgcatcgatg atctagagct 780
cgctgatcag cctcgactgt gccttctagt tgccagccat ctgttgtttg cccctccccc 840
gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa 900
attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac 960
agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt gggctctatg 1020
gcataacttc gtataatgta tgctatacgg gggatccgct gtaagtctgc agaaattgat 1080
gatctattaa acaataaaga tgtccactaa aatggaagtt tttcctgtca tactttgtta 1140
agaagggtga gaacagagta cctacatttt gaatggaagg attggagcta cgggggtggg 1200
ggtggggtgg gattagataa atgcctgctc tttactgaag gctctttact attgctttat 1260
gataatgttt catagttgga tatcataatt taaacaagca aaaccaaatt aagggccagc 1320
tcattcctcc cactcatgat ctatagatct atagatctct cgtgggatca ttgtttttct 1380
cttgattccc actttgtggt tctaagtact gtggtttcca aatgtgtcag tttcatagcc 1440
tgaagaacga gatcagcagc ctctgttcca catacacttc attctcagta ttgttttgcc 1500
aagttctaat tccatcagac ctcgacctgc agccgacgct aggtcgtcag tcaaagtacg 1560
tacctcaggt gcaggctgcc tatcagaagg tggtggctgg tgtggccaat gccctggctc 1620
acaaatacca ctgagatctt tttccctctg ccaaaaatta tggggacatc atgaagcccc 1680
ttgagcatct gacttctggc taataaagga aatttatttt cattgcaata gtgtgttgga 1740
attttttgtg tctctcactc ggaaggacat atgggagggc aaatcattta aaacatcaga 1800
atgagtattt ggtttagagt ttggcaacat atgcccatat gctggctgcc atgaacaaag 1860
gttggctata aagaggtcat cagtatatga aacagccccc tgctgtccat tccttattcc 1920
atagaaaagc cttgacttga ggttagattt tttttatatt ttgttttgtg ttattttttt 1980
ctttaacatc cctaaaattt tccttagatg ttttactagc cagatttttc ctcctctcct 2040
gactactccc agtcatagct gtccctcttc tcttatggag atccctcgag gacatgaggt 2100
cgtcgctgta atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc 2160
acacctcccc ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat 2220
tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt 2280
tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtcga 2340
cactgggtcg tgatcgggta cctaacttta aataatgcca attatttaaa gttagctagc 2400
tttcccatga ttccttcata tttgcatata cgatacaagg ctgttagaga gataattgga 2460
attaatttga ctgtaaacac aaagatatta gtacaaaata cgtgacgtag aaagtaataa 2520
tttcttgggt agtttgcagt tttaaaatta tgttttaaaa tggactatca tatgcttacc 2580
gtaacttgaa agtatttcga tttcttggct ttatatatct tgtggaaagg acgaaacacc 2640
gacggttgcc ctctttccca agttttagag ctaggccaac atgaggatca cccatgtctg 2700
cagggcctag caagttaaaa taaggctagt ccgttatcaa cttggccaac atgaggatca 2760
cccatgtctg cagggccaag tggcaccgag tcggtgcttt ttttgtttta gagctagaaa 2820
tagcaagtta aaataaggct agtccgtttt gagctccata agactcggcc ttagaacaag 2880
ctttttccca tgattccttc atatttgcat atacgataca aggctgttag agagataatt 2940
ggaattaatt tgactgtaaa cacaaagata ttagtacaaa atacgtgacg tagaaagtaa 3000
taatttcttg ggtagtttgc agttttaaaa ttatgtttta aaatggacta tcatatgctt 3060
accgtaactt gaaagtattt cgatttcttg gctttatata tcttgtggaa aggacgaaac 3120
accgactgtc agactcaaag gtgcgtttta gagctaggcc aacatgagga tcacccatgt 3180
ctgcagggcc tagcaagtta aaataaggct agtccgttat caacttggcc aacatgagga 3240
tcacccatgt ctgcagggcc aagtggcacc gagtcggtgc tttttttgtt ttagagctag 3300
aaatagcaag ttaaaataag gctagtccgt tttatgcatg tggctcccat ttatacctgg 3360
ccggctttcc catgattcct tcatatttgc atatacgata caaggctgtt agagagataa 3420
ttggaattaa tttgactgta aacacaaaga tattagtaca aaatacgtga cgtagaaagt 3480
aataatttct tgggtagttt gcagttttaa aattatgttt taaaatggac tatcatatgc 3540
ttaccgtaac ttgaaagtat ttcgatttct tggctttata tatcttgtgg aaaggacgaa 3600
acaccgacaa taagtagtct tactcgtttt agagctaggc caacatgagg atcacccatg 3660
tctgcagggc ctagcaagtt aaaataaggc tagtccgtta tcaacttggc caacatgagg 3720
atcacccatg tctgcagggc caagtggcac cgagtcggtg ctttttttgt tttagagcta 3780
gaaatagcaa gttaaaataa ggctagtccg tttt 3814
<210> 34
<211> 20
<212> DNA
<213> 小家鼠
<400> 34
acggttgccc tctttcccaa 20
<210> 35
<211> 20
<212> DNA
<213> 小家鼠
<400> 35
actgtcagac tcaaaggtgc 20
<210> 36
<211> 20
<212> DNA
<213> 小家鼠
<400> 36
gacaataagt agtcttactc 20
<210> 37
<211> 157
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 37
acgguugccc ucuuucccaa guuuuagagc uaggccaaca ugaggaucac ccaugucugc 60
agggccuagc aaguuaaaau aaggcuaguc cguuaucaac uuggccaaca ugaggaucac 120
ccaugucugc agggccaagu ggcaccgagu cggugcu 157
<210> 38
<211> 157
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 38
acugucagac ucaaaggugc guuuuagagc uaggccaaca ugaggaucac ccaugucugc 60
agggccuagc aaguuaaaau aaggcuaguc cguuaucaac uuggccaaca ugaggaucac 120
ccaugucugc agggccaagu ggcaccgagu cggugcu 157
<210> 39
<211> 157
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 39
gacaauaagu agucuuacuc guuuuagagc uaggccaaca ugaggaucac ccaugucugc 60
agggccuagc aaguuaaaau aaggcuaguc cguuaucaac uuggccaaca ugaggaucac 120
ccaugucugc agggccaagu ggcaccgagu cggugcu 157
<210> 40
<211> 137
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 40
guuuuagagc uaggccaaca ugaggaucac ccaugucugc agggccuagc aaguuaaaau 60
aaggcuaguc cguuaucaac uuggccaaca ugaggaucac ccaugucugc agggccaagu 120
ggcaccgagu cggugcu 137
<210> 41
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 41
acgguugccc ucuuucccaa 20
<210> 42
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 42
acugucagac ucaaaggugc 20
<210> 43
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 43
gacaauaagu agucuuacuc 20
<210> 44
<211> 1965
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 44
Met Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys
1 5 10 15
Lys Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Ser Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
1385 1390 1395
Gly Gly Ser Gly Pro Lys Lys Lys Arg Lys Val Ala Ala Ala Gly
1400 1405 1410
Ser Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
1415 1420 1425
Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser
1430 1435 1440
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala
1445 1450 1455
Leu Asp Asp Phe Asp Leu Asp Met Leu Ile Asn Cys Thr Gly Ser
1460 1465 1470
Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu
1475 1480 1485
Asn Pro Gly Pro Met Ala Ser Asn Phe Thr Gln Phe Val Leu Val
1490 1495 1500
Asp Asn Gly Gly Thr Gly Asp Val Thr Val Ala Pro Ser Asn Phe
1505 1510 1515
Ala Asn Gly Val Ala Glu Trp Ile Ser Ser Asn Ser Arg Ser Gln
1520 1525 1530
Ala Tyr Lys Val Thr Cys Ser Val Arg Gln Ser Ser Ala Gln Lys
1535 1540 1545
Arg Lys Tyr Thr Ile Lys Val Glu Val Pro Lys Val Ala Thr Gln
1550 1555 1560
Thr Val Gly Gly Val Glu Leu Pro Val Ala Ala Trp Arg Ser Tyr
1565 1570 1575
Leu Asn Met Glu Leu Thr Ile Pro Ile Phe Ala Thr Asn Ser Asp
1580 1585 1590
Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu Leu Lys Asp Gly
1595 1600 1605
Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly Ile Tyr Ser
1610 1615 1620
Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
1625 1630 1635
Ser Gly Pro Lys Lys Lys Arg Lys Val Ala Ala Ala Gly Ser Pro
1640 1645 1650
Ser Gly Gln Ile Ser Asn Gln Ala Leu Ala Leu Ala Pro Ser Ser
1655 1660 1665
Ala Pro Val Leu Ala Gln Thr Met Val Pro Ser Ser Ala Met Val
1670 1675 1680
Pro Leu Ala Gln Pro Pro Ala Pro Ala Pro Val Leu Thr Pro Gly
1685 1690 1695
Pro Pro Gln Ser Leu Ser Ala Pro Val Pro Lys Ser Thr Gln Ala
1700 1705 1710
Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu His Leu Gln Phe Asp
1715 1720 1725
Ala Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro
1730 1735 1740
Gly Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln
1745 1750 1755
Gln Leu Leu Asn Gln Gly Val Ser Met Ser His Ser Thr Ala Glu
1760 1765 1770
Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr
1775 1780 1785
Gly Ser Gln Arg Pro Pro Asp Pro Ala Pro Thr Pro Leu Gly Thr
1790 1795 1800
Ser Gly Leu Pro Asn Gly Leu Ser Gly Asp Glu Asp Phe Ser Ser
1805 1810 1815
Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser
1820 1825 1830
Ser Gly Gln Gly Gly Gly Gly Ser Gly Phe Ser Val Asp Thr Ser
1835 1840 1845
Ala Leu Leu Asp Leu Phe Ser Pro Ser Val Thr Val Pro Asp Met
1850 1855 1860
Ser Leu Pro Asp Leu Asp Ser Ser Leu Ala Ser Ile Gln Glu Leu
1865 1870 1875
Leu Ser Pro Gln Glu Pro Pro Arg Pro Pro Glu Ala Glu Asn Ser
1880 1885 1890
Ser Pro Asp Ser Gly Lys Gln Leu Val His Tyr Thr Ala Gln Pro
1895 1900 1905
Leu Phe Leu Leu Asp Pro Gly Ser Val Asp Thr Gly Ser Asn Asp
1910 1915 1920
Leu Pro Val Leu Phe Glu Leu Gly Glu Gly Ser Tyr Phe Ser Glu
1925 1930 1935
Gly Asp Gly Phe Ala Glu Asp Pro Thr Ile Ser Leu Leu Thr Gly
1940 1945 1950
Ser Glu Pro Pro Lys Ala Lys Asp Pro Thr Val Ser
1955 1960 1965
<210> 45
<211> 157
<212> RNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(20)
<223> N为a、c、g或u
<400> 45
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaggccaaca ugaggaucac ccaugucugc 60
agggccuagc aaguuaaaau aaggcuaguc cguuaucaac uuggccaaca ugaggaucac 120
ccaugucugc agggccaagu ggcaccgagu cggugcu 157
<210> 46
<211> 5895
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 46
atgaaaaggc cggcggccac gaaaaaggcc ggccaggcaa aaaagaaaaa ggacaagaag 60
tacagcatcg gcctggccat cggcaccaac tctgtgggct gggccgtgat caccgacgag 120
tacaaggtgc ccagcaagaa attcaaggtg ctgggcaaca ccgaccggca cagcatcaag 180
aagaacctga tcggagccct gctgttcgac agcggcgaaa cagccgaggc cacccggctg 240
aagagaaccg ccagaagaag atacaccaga cggaagaacc ggatctgcta tctgcaagag 300
atcttcagca acgagatggc caaggtggac gacagcttct tccacagact ggaagagtcc 360
ttcctggtgg aagaggataa gaagcacgag cggcacccca tcttcggcaa catcgtggac 420
gaggtggcct accacgagaa gtaccccacc atctaccacc tgagaaagaa actggtggac 480
agcaccgaca aggccgacct gcggctgatc tatctggccc tggcccacat gatcaagttc 540
cggggccact tcctgatcga gggcgacctg aaccccgaca acagcgacgt ggacaagctg 600
ttcatccagc tggtgcagac ctacaaccag ctgttcgagg aaaaccccat caacgccagc 660
ggcgtggacg ccaaggccat cctgtctgcc agactgagca agagcagacg gctggaaaat 720
ctgatcgccc agctgcccgg cgagaagaag aatggcctgt tcggcaacct gattgccctg 780
agcctgggcc tgacccccaa cttcaagagc aacttcgacc tggccgagga tgccaaactg 840
cagctgagca aggacaccta cgacgacgac ctggacaacc tgctggccca gatcggcgac 900
cagtacgccg acctgtttct ggccgccaag aacctgtccg acgccatcct gctgagcgac 960
atcctgagag tgaacaccga gatcaccaag gcccccctga gcgcctctat gatcaagaga 1020
tacgacgagc accaccagga cctgaccctg ctgaaagctc tcgtgcggca gcagctgcct 1080
gagaagtaca aagagatttt cttcgaccag agcaagaacg gctacgccgg ctacattgac 1140
ggcggagcca gccaggaaga gttctacaag ttcatcaagc ccatcctgga aaagatggac 1200
ggcaccgagg aactgctcgt gaagctgaac agagaggacc tgctgcggaa gcagcggacc 1260
ttcgacaacg gcagcatccc ccaccagatc cacctgggag agctgcacgc cattctgcgg 1320
cggcaggaag atttttaccc attcctgaag gacaaccggg aaaagatcga gaagatcctg 1380
accttccgca tcccctacta cgtgggccct ctggccaggg gaaacagcag attcgcctgg 1440
atgaccagaa agagcgagga aaccatcacc ccctggaact tcgaggaagt ggtggacaag 1500
ggcgcttccg cccagagctt catcgagcgg atgaccaact tcgataagaa cctgcccaac 1560
gagaaggtgc tgcccaagca cagcctgctg tacgagtact tcaccgtgta taacgagctg 1620
accaaagtga aatacgtgac cgagggaatg agaaagcccg ccttcctgag cggcgagcag 1680
aaaaaggcca tcgtggacct gctgttcaag accaaccgga aagtgaccgt gaagcagctg 1740
aaagaggact acttcaagaa aatcgagtgc ttcgactccg tggaaatctc cggcgtggaa 1800
gatcggttca acgcctccct gggcacatac cacgatctgc tgaaaattat caaggacaag 1860
gacttcctgg acaatgagga aaacgaggac attctggaag atatcgtgct gaccctgaca 1920
ctgtttgagg acagagagat gatcgaggaa cggctgaaaa cctatgccca cctgttcgac 1980
gacaaagtga tgaagcagct gaagcggcgg agatacaccg gctggggcag gctgagccgg 2040
aagctgatca acggcatccg ggacaagcag tccggcaaga caatcctgga tttcctgaag 2100
tccgacggct tcgccaacag aaacttcatg cagctgatcc acgacgacag cctgaccttt 2160
aaagaggaca tccagaaagc ccaggtgtcc ggccagggcg atagcctgca cgagcacatt 2220
gccaatctgg ccggcagccc cgccattaag aagggcatcc tgcagacagt gaaggtggtg 2280
gacgagctcg tgaaagtgat gggccggcac aagcccgaga acatcgtgat cgaaatggcc 2340
agagagaacc agaccaccca gaagggacag aagaacagcc gcgagagaat gaagcggatc 2400
gaagagggca tcaaagagct gggcagccag atcctgaaag aacaccccgt ggaaaacacc 2460
cagctgcaga acgagaagct gtacctgtac tacctgcaga atgggcggga tatgtacgtg 2520
gaccaggaac tggacatcaa ccggctgtcc gactacgatg tggaccacat cgtgcctcag 2580
agctttctga aggacgactc catcgacaac aaggtgctga ccagaagcga caaggcccgg 2640
ggcaagagcg acaacgtgcc ctccgaagag gtcgtgaaga agatgaagaa ctactggcgg 2700
cagctgctga acgccaagct gattacccag agaaagttcg acaatctgac caaggccgag 2760
agaggcggcc tgagcgaact ggataaggcc ggcttcatca agagacagct ggtggaaacc 2820
cggcagatca caaagcacgt ggcacagatc ctggactccc ggatgaacac taagtacgac 2880
gagaatgaca agctgatccg ggaagtgaaa gtgatcaccc tgaagtccaa gctggtgtcc 2940
gatttccgga aggatttcca gttttacaaa gtgcgcgaga tcaacaacta ccaccacgcc 3000
cacgacgcct acctgaacgc cgtcgtggga accgccctga tcaaaaagta ccctaagctg 3060
gaaagcgagt tcgtgtacgg cgactacaag gtgtacgacg tgcggaagat gatcgccaag 3120
agcgagcagg aaatcggcaa ggctaccgcc aagtacttct tctacagcaa catcatgaac 3180
tttttcaaga ccgagattac cctggccaac ggcgagatcc ggaagcggcc tctgatcgag 3240
acaaacggcg aaaccgggga gatcgtgtgg gataagggcc gggattttgc caccgtgcgg 3300
aaagtgctga gcatgcccca agtgaatatc gtgaaaaaga ccgaggtgca gacaggcggc 3360
ttcagcaaag agtctatcct gcccaagagg aacagcgata agctgatcgc cagaaagaag 3420
gactgggacc ctaagaagta cggcggcttc gacagcccca ccgtggccta ttctgtgctg 3480
gtggtggcca aagtggaaaa gggcaagtcc aagaaactga agagtgtgaa agagctgctg 3540
gggatcacca tcatggaaag aagcagcttc gagaagaatc ccatcgactt tctggaagcc 3600
aagggctaca aagaagtgaa aaaggacctg atcatcaagc tgcctaagta ctccctgttc 3660
gagctggaaa acggccggaa gagaatgctg gcctctgccg gcgaactgca gaagggaaac 3720
gaactggccc tgccctccaa atatgtgaac ttcctgtacc tggccagcca ctatgagaag 3780
ctgaagggct cccccgagga taatgagcag aaacagctgt ttgtggaaca gcacaagcac 3840
tacctggacg agatcatcga gcagatcagc gagttctcca agagagtgat cctggccgac 3900
gctaatctgg acaaagtgct gtccgcctac aacaagcacc gggataagcc catcagagag 3960
caggccgaga atatcatcca cctgtttacc ctgaccaatc tgggagcccc tgccgccttc 4020
aagtactttg acaccaccat cgaccggaag aggtacacca gcaccaaaga ggtgctggac 4080
gccaccctga tccaccagag catcaccggc ctgtacgaga cacggatcga cctgtctcag 4140
ctgggaggcg acagcgctgg aggaggtgga agcggaggag gaggaagcgg aggaggaggt 4200
agcggaccta agaaaaagag gaaggtggcg gccgctggat ccggacgggc tgacgcattg 4260
gacgattttg atctggatat gctgggaagt gacgccctcg atgattttga ccttgacatg 4320
cttggttcgg atgcccttga tgactttgac ctcgacatgc tcggcagtga cgcccttgat 4380
gatttcgacc tggacatgct gattaactgt acaggcagtg gagagggcag aggaagtctg 4440
ctaacatgcg gtgacgtcga ggagaatcct ggcccaatgg cttcaaactt tactcagttc 4500
gtgctcgtgg acaatggtgg gacaggggat gtgacagtgg ctccttctaa tttcgctaat 4560
ggggtggcag agtggatcag ctccaactca cggagccagg cctacaaggt gacatgcagc 4620
gtcaggcagt ctagtgccca gaagagaaag tataccatca aggtggaggt ccccaaagtg 4680
gctacccaga cagtgggcgg agtcgaactg cctgtcgccg cttggaggtc ctacctgaac 4740
atggagctca ctatcccaat tttcgctacc aattctgact gtgaactcat cgtgaaggca 4800
atgcaggggc tcctcaaaga cggtaatcct atcccttccg ccatcgccgc taactcaggt 4860
atctacagcg ctggaggagg tggaagcgga ggaggaggaa gcggaggagg aggtagcgga 4920
cctaagaaaa agaggaaggt ggcggccgct ggatcccctt cagggcagat cagcaaccag 4980
gccctggctc tggcccctag ctccgctcca gtgctggccc agactatggt gccctctagt 5040
gctatggtgc ctctggccca gccacctgct ccagcccctg tgctgacccc aggaccaccc 5100
cagtcactga gcgctccagt gcccaagtct acacaggccg gcgaggggac tctgagtgaa 5160
gctctgctgc acctgcagtt cgacgctgat gaggacctgg gagctctgct ggggaacagc 5220
accgatcccg gagtgttcac agatctggcc tccgtggaca actctgagtt tcagcagctg 5280
ctgaatcagg gcgtgtccat gtctcatagt acagccgaac caatgctgat ggagtacccc 5340
gaagccatta cccggctggt gaccggcagc cagcggcccc ccgaccccgc tccaactccc 5400
ctgggaacca gcggcctgcc taatgggctg tccggagatg aagacttctc aagcatcgct 5460
gatatggact ttagtgccct gctgtcacag atttcctcta gtgggcaggg aggaggtgga 5520
agcggcttca gcgtggacac cagtgccctg ctggacctgt tcagcccctc ggtgaccgtg 5580
cccgacatga gcctgcctga ccttgacagc agcctggcca gtatccaaga gctcctgtct 5640
ccccaggagc cccccaggcc tcccgaggca gagaacagca gcccggattc agggaagcag 5700
ctggtgcact acacagcgca gccgctgttc ctgctggacc ccggctccgt ggacaccggg 5760
agcaacgacc tgccggtgct gtttgagctg ggagagggct cctacttctc cgaaggggac 5820
ggcttcgccg aggaccccac catctccctg ctgacaggct cggagcctcc caaagccaag 5880
gaccccactg tctcc 5895
<210> 47
<211> 1412
<212> DNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (241)..(260)
<223> n是a、c、g或t
<220>
<221> misc_feature
<222> (723)..(742)
<223> n是a、c、g或t
<220>
<221> misc_feature
<222> (1204)..(1223)
<223> n是a、c、g或t
<400> 47
tttcccatga ttccttcata tttgcatata cgatacaagg ctgttagaga gataattgga 60
attaatttga ctgtaaacac aaagatatta gtacaaaata cgtgacgtag aaagtaataa 120
tttcttgggt agtttgcagt tttaaaatta tgttttaaaa tggactatca tatgcttacc 180
gtaacttgaa agtatttcga tttcttggct ttatatatct tgtggaaagg acgaaacacc 240
nnnnnnnnnn nnnnnnnnnn gttttagagc taggccaaca tgaggatcac ccatgtctgc 300
agggcctagc aagttaaaat aaggctagtc cgttatcaac ttggccaaca tgaggatcac 360
ccatgtctgc agggccaagt ggcaccgagt cggtgctttt tttgttttag agctagaaat 420
agcaagttaa aataaggcta gtccgttttg agctccataa gactcggcct tagaacaagc 480
tttttcccat gattccttca tatttgcata tacgatacaa ggctgttaga gagataattg 540
gaattaattt gactgtaaac acaaagatat tagtacaaaa tacgtgacgt agaaagtaat 600
aatttcttgg gtagtttgca gttttaaaat tatgttttaa aatggactat catatgctta 660
ccgtaacttg aaagtatttc gatttcttgg ctttatatat cttgtggaaa ggacgaaaca 720
ccnnnnnnnn nnnnnnnnnn nngttttaga gctaggccaa catgaggatc acccatgtct 780
gcagggccta gcaagttaaa ataaggctag tccgttatca acttggccaa catgaggatc 840
acccatgtct gcagggccaa gtggcaccga gtcggtgctt tttttgtttt agagctagaa 900
atagcaagtt aaaataaggc tagtccgttt tatgcatgtg gctcccattt atacctggcc 960
ggctttccca tgattccttc atatttgcat atacgataca aggctgttag agagataatt 1020
ggaattaatt tgactgtaaa cacaaagata ttagtacaaa atacgtgacg tagaaagtaa 1080
taatttcttg ggtagtttgc agttttaaaa ttatgtttta aaatggacta tcatatgctt 1140
accgtaactt gaaagtattt cgatttcttg gctttatata tcttgtggaa aggacgaaac 1200
accnnnnnnn nnnnnnnnnn nnngttttag agctaggcca acatgaggat cacccatgtc 1260
tgcagggcct agcaagttaa aataaggcta gtccgttatc aacttggcca acatgaggat 1320
cacccatgtc tgcagggcca agtggcaccg agtcggtgct ttttttgttt tagagctaga 1380
aatagcaagt taaaataagg ctagtccgtt tt 1412
<210> 48
<211> 1414
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 48
tttcccatga ttccttcata tttgcatata cgatacaagg ctgttagaga gataattgga 60
attaatttga ctgtaaacac aaagatatta gtacaaaata cgtgacgtag aaagtaataa 120
tttcttgggt agtttgcagt tttaaaatta tgttttaaaa tggactatca tatgcttacc 180
gtaacttgaa agtatttcga tttcttggct ttatatatct tgtggaaagg acgaaacacc 240
gacggttgcc ctctttccca agttttagag ctaggccaac atgaggatca cccatgtctg 300
cagggcctag caagttaaaa taaggctagt ccgttatcaa cttggccaac atgaggatca 360
cccatgtctg cagggccaag tggcaccgag tcggtgcttt ttttgtttta gagctagaaa 420
tagcaagtta aaataaggct agtccgtttt gagctccata agactcggcc ttagaacaag 480
ctttttccca tgattccttc atatttgcat atacgataca aggctgttag agagataatt 540
ggaattaatt tgactgtaaa cacaaagata ttagtacaaa atacgtgacg tagaaagtaa 600
taatttcttg ggtagtttgc agttttaaaa ttatgtttta aaatggacta tcatatgctt 660
accgtaactt gaaagtattt cgatttcttg gctttatata tcttgtggaa aggacgaaac 720
accgactgtc agactcaaag gtgcgtttta gagctaggcc aacatgagga tcacccatgt 780
ctgcagggcc tagcaagtta aaataaggct agtccgttat caacttggcc aacatgagga 840
tcacccatgt ctgcagggcc aagtggcacc gagtcggtgc tttttttgtt ttagagctag 900
aaatagcaag ttaaaataag gctagtccgt tttatgcatg tggctcccat ttatacctgg 960
ccggctttcc catgattcct tcatatttgc atatacgata caaggctgtt agagagataa 1020
ttggaattaa tttgactgta aacacaaaga tattagtaca aaatacgtga cgtagaaagt 1080
aataatttct tgggtagttt gcagttttaa aattatgttt taaaatggac tatcatatgc 1140
ttaccgtaac ttgaaagtat ttcgatttct tggctttata tatcttgtgg aaaggacgaa 1200
acaccgacaa taagtagtct tactcgtttt agagctaggc caacatgagg atcacccatg 1260
tctgcagggc ctagcaagtt aaaataaggc tagtccgtta tcaacttggc caacatgagg 1320
atcacccatg tctgcagggc caagtggcac cgagtcggtg ctttttttgt tttagagcta 1380
gaaatagcaa gttaaaataa ggctagtccg tttt 1414
<210> 49
<211> 1490
<212> DNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (28)..(267)
<223> hU6启动子
<220>
<221> misc_feature
<222> (269)..(288)
<223> 向导1
<220>
<221> misc_feature
<222> (289)..(425)
<223> SAM Tracr
<220>
<221> misc_feature
<222> (426)..(477)
<223> 扩展终止子
<220>
<221> misc_feature
<222> (511)..(750)
<223> hU6启动子
<220>
<221> misc_feature
<222> (752)..(771)
<223> 向导2
<220>
<221> misc_feature
<222> (772)..(908)
<223> SAM Tracr
<220>
<221> misc_feature
<222> (909)..(960)
<223> 扩展终止子
<220>
<221> misc_feature
<222> (993)..(1232)
<223> hU6启动子
<220>
<221> misc_feature
<222> (1233)..(1252)
<223> 向导3
<220>
<221> misc_feature
<222> (1253)..(1389)
<223> SAM Tracr
<220>
<221> misc_feature
<222> (1390)..(1441)
<223> 扩展终止子
<400> 49
gctagccata agactcggcc ttagaacttt cccatgattc cttcatattt gcatatacga 60
tacaaggctg ttagagagat aattggaatt aatttgactg taaacacaaa gatattagta 120
caaaatacgt gacgtagaaa gtaataattt cttgggtagt ttgcagtttt aaaattatgt 180
tttaaaatgg actatcatat gcttaccgta acttgaaagt atttcgattt cttggcttta 240
tatatcttgt ggaaaggacg aaacaccgac ggttgccctc tttcccaagt tttagagcta 300
ggccaacatg aggatcaccc atgtctgcag ggcctagcaa gttaaaataa ggctagtccg 360
ttatcaactt ggccaacatg aggatcaccc atgtctgcag ggccaagtgg caccgagtcg 420
gtgctttttt tgttttagag ctagaaatag caagttaaaa taaggctagt ccgttttgag 480
ctccataaga ctcggcctta gaacaagctt tttcccatga ttccttcata tttgcatata 540
cgatacaagg ctgttagaga gataattgga attaatttga ctgtaaacac aaagatatta 600
gtacaaaata cgtgacgtag aaagtaataa tttcttgggt agtttgcagt tttaaaatta 660
tgttttaaaa tggactatca tatgcttacc gtaacttgaa agtatttcga tttcttggct 720
ttatatatct tgtggaaagg acgaaacacc gactgtcaga ctcaaaggtg cgttttagag 780
ctaggccaac atgaggatca cccatgtctg cagggcctag caagttaaaa taaggctagt 840
ccgttatcaa cttggccaac atgaggatca cccatgtctg cagggccaag tggcaccgag 900
tcggtgcttt ttttgtttta gagctagaaa tagcaagtta aaataaggct agtccgtttt 960
atgcatgtgg ctcccattta tacctggccg gctttcccat gattccttca tatttgcata 1020
tacgatacaa ggctgttaga gagataattg gaattaattt gactgtaaac acaaagatat 1080
tagtacaaaa tacgtgacgt agaaagtaat aatttcttgg gtagtttgca gttttaaaat 1140
tatgttttaa aatggactat catatgctta ccgtaacttg aaagtatttc gatttcttgg 1200
ctttatatat cttgtggaaa ggacgaaaca ccgacaataa gtagtcttac tcgttttaga 1260
gctaggccaa catgaggatc acccatgtct gcagggccta gcaagttaaa ataaggctag 1320
tccgttatca acttggccaa catgaggatc acccatgtct gcagggccaa gtggcaccga 1380
gtcggtgctt tttttgtttt agagctagaa atagcaagtt aaaataaggc tagtccgttt 1440
tggtcaccca gtgaggaagc taggacagac ctaggacggt tgcctgcagg 1490
<210> 50
<211> 72
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 50
aaacagcaua gcaaguuaaa auaaggcuag uccguuauca acuugaaaaa guggcaccga 60
gucggugcuu uu 72
<210> 51
<211> 82
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 51
guuggaacca uucaaaacag cauagcaagu uaaaauaagg cuaguccguu aucaacuuga 60
aaaaguggca ccgagucggu gc 82
<210> 52
<211> 83
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 52
guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60
ggcaccgagu cggugcuuuu uuu 83
<210> 53
<211> 80
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 53
guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60
ggcaccgagu cggugcuuuu 80
<210> 54
<211> 92
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 54
guuuaagagc uaugcuggaa acagcauagc aaguuuaaau aaggcuaguc cguuaucaac 60
uugaaaaagu ggcaccgagu cggugcuuuu uu 92
<210> 55
<211> 159
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 55
gacaauaagu agucuuacuc guuuuagagc uaggccaaca ugaggaucac ccaugucugc 60
agggccuagc aaguuaaaau aaggcuaguc cguuaucaac uuggccaaca ugaggaucac 120
ccaugucugc agggccaagu ggcaccgagu cggugcuuu 159
<210> 56
<211> 139
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 56
guuuuagagc uaggccaaca ugaggaucac ccaugucugc agggccuagc aaguuaaaau 60
aaggcuaguc cguuaucaac uuggccaaca ugaggaucac ccaugucugc agggccaagu 120
ggcaccgagu cggugcuuu 139
<210> 57
<211> 159
<212> RNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(20)
<223> N为a、c、g或u
<400> 57
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaggccaaca ugaggaucac ccaugucugc 60
agggccuagc aaguuaaaau aaggcuaguc cguuaucaac uuggccaaca ugaggaucac 120
ccaugucugc agggccaagu ggcaccgagu cggugcuuu 159
<210> 58
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 58
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 59
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 59
Pro Lys Lys Lys Arg Arg Val
1 5
<210> 60
<211> 16
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 60
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 61
<211> 5895
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 61
augaaaaggc cggcggccac gaaaaaggcc ggccaggcaa aaaagaaaaa ggacaagaag 60
uacagcaucg gccuggccau cggcaccaac ucugugggcu gggccgugau caccgacgag 120
uacaaggugc ccagcaagaa auucaaggug cugggcaaca ccgaccggca cagcaucaag 180
aagaaccuga ucggagcccu gcuguucgac agcggcgaaa cagccgaggc cacccggcug 240
aagagaaccg ccagaagaag auacaccaga cggaagaacc ggaucugcua ucugcaagag 300
aucuucagca acgagauggc caagguggac gacagcuucu uccacagacu ggaagagucc 360
uuccuggugg aagaggauaa gaagcacgag cggcacccca ucuucggcaa caucguggac 420
gagguggccu accacgagaa guaccccacc aucuaccacc ugagaaagaa acugguggac 480
agcaccgaca aggccgaccu gcggcugauc uaucuggccc uggcccacau gaucaaguuc 540
cggggccacu uccugaucga gggcgaccug aaccccgaca acagcgacgu ggacaagcug 600
uucauccagc uggugcagac cuacaaccag cuguucgagg aaaaccccau caacgccagc 660
ggcguggacg ccaaggccau ccugucugcc agacugagca agagcagacg gcuggaaaau 720
cugaucgccc agcugcccgg cgagaagaag aauggccugu ucggcaaccu gauugcccug 780
agccugggcc ugacccccaa cuucaagagc aacuucgacc uggccgagga ugccaaacug 840
cagcugagca aggacaccua cgacgacgac cuggacaacc ugcuggccca gaucggcgac 900
caguacgccg accuguuucu ggccgccaag aaccuguccg acgccauccu gcugagcgac 960
auccugagag ugaacaccga gaucaccaag gccccccuga gcgccucuau gaucaagaga 1020
uacgacgagc accaccagga ccugacccug cugaaagcuc ucgugcggca gcagcugccu 1080
gagaaguaca aagagauuuu cuucgaccag agcaagaacg gcuacgccgg cuacauugac 1140
ggcggagcca gccaggaaga guucuacaag uucaucaagc ccauccugga aaagauggac 1200
ggcaccgagg aacugcucgu gaagcugaac agagaggacc ugcugcggaa gcagcggacc 1260
uucgacaacg gcagcauccc ccaccagauc caccugggag agcugcacgc cauucugcgg 1320
cggcaggaag auuuuuaccc auuccugaag gacaaccggg aaaagaucga gaagauccug 1380
accuuccgca uccccuacua cgugggcccu cuggccaggg gaaacagcag auucgccugg 1440
augaccagaa agagcgagga aaccaucacc cccuggaacu ucgaggaagu gguggacaag 1500
ggcgcuuccg cccagagcuu caucgagcgg augaccaacu ucgauaagaa ccugcccaac 1560
gagaaggugc ugcccaagca cagccugcug uacgaguacu ucaccgugua uaacgagcug 1620
accaaaguga aauacgugac cgagggaaug agaaagcccg ccuuccugag cggcgagcag 1680
aaaaaggcca ucguggaccu gcuguucaag accaaccgga aagugaccgu gaagcagcug 1740
aaagaggacu acuucaagaa aaucgagugc uucgacuccg uggaaaucuc cggcguggaa 1800
gaucgguuca acgccucccu gggcacauac cacgaucugc ugaaaauuau caaggacaag 1860
gacuuccugg acaaugagga aaacgaggac auucuggaag auaucgugcu gacccugaca 1920
cuguuugagg acagagagau gaucgaggaa cggcugaaaa ccuaugccca ccuguucgac 1980
gacaaaguga ugaagcagcu gaagcggcgg agauacaccg gcuggggcag gcugagccgg 2040
aagcugauca acggcauccg ggacaagcag uccggcaaga caauccugga uuuccugaag 2100
uccgacggcu ucgccaacag aaacuucaug cagcugaucc acgacgacag ccugaccuuu 2160
aaagaggaca uccagaaagc ccaggugucc ggccagggcg auagccugca cgagcacauu 2220
gccaaucugg ccggcagccc cgccauuaag aagggcaucc ugcagacagu gaagguggug 2280
gacgagcucg ugaaagugau gggccggcac aagcccgaga acaucgugau cgaaauggcc 2340
agagagaacc agaccaccca gaagggacag aagaacagcc gcgagagaau gaagcggauc 2400
gaagagggca ucaaagagcu gggcagccag auccugaaag aacaccccgu ggaaaacacc 2460
cagcugcaga acgagaagcu guaccuguac uaccugcaga augggcggga uauguacgug 2520
gaccaggaac uggacaucaa ccggcugucc gacuacgaug uggaccacau cgugccucag 2580
agcuuucuga aggacgacuc caucgacaac aaggugcuga ccagaagcga caaggcccgg 2640
ggcaagagcg acaacgugcc cuccgaagag gucgugaaga agaugaagaa cuacuggcgg 2700
cagcugcuga acgccaagcu gauuacccag agaaaguucg acaaucugac caaggccgag 2760
agaggcggcc ugagcgaacu ggauaaggcc ggcuucauca agagacagcu gguggaaacc 2820
cggcagauca caaagcacgu ggcacagauc cuggacuccc ggaugaacac uaaguacgac 2880
gagaaugaca agcugauccg ggaagugaaa gugaucaccc ugaaguccaa gcuggugucc 2940
gauuuccgga aggauuucca guuuuacaaa gugcgcgaga ucaacaacua ccaccacgcc 3000
cacgacgccu accugaacgc cgucguggga accgcccuga ucaaaaagua cccuaagcug 3060
gaaagcgagu ucguguacgg cgacuacaag guguacgacg ugcggaagau gaucgccaag 3120
agcgagcagg aaaucggcaa ggcuaccgcc aaguacuucu ucuacagcaa caucaugaac 3180
uuuuucaaga ccgagauuac ccuggccaac ggcgagaucc ggaagcggcc ucugaucgag 3240
acaaacggcg aaaccgggga gaucgugugg gauaagggcc gggauuuugc caccgugcgg 3300
aaagugcuga gcaugcccca agugaauauc gugaaaaaga ccgaggugca gacaggcggc 3360
uucagcaaag agucuauccu gcccaagagg aacagcgaua agcugaucgc cagaaagaag 3420
gacugggacc cuaagaagua cggcggcuuc gacagcccca ccguggccua uucugugcug 3480
gugguggcca aaguggaaaa gggcaagucc aagaaacuga agagugugaa agagcugcug 3540
gggaucacca ucauggaaag aagcagcuuc gagaagaauc ccaucgacuu ucuggaagcc 3600
aagggcuaca aagaagugaa aaaggaccug aucaucaagc ugccuaagua cucccuguuc 3660
gagcuggaaa acggccggaa gagaaugcug gccucugccg gcgaacugca gaagggaaac 3720
gaacuggccc ugcccuccaa auaugugaac uuccuguacc uggccagcca cuaugagaag 3780
cugaagggcu cccccgagga uaaugagcag aaacagcugu uuguggaaca gcacaagcac 3840
uaccuggacg agaucaucga gcagaucagc gaguucucca agagagugau ccuggccgac 3900
gcuaaucugg acaaagugcu guccgccuac aacaagcacc gggauaagcc caucagagag 3960
caggccgaga auaucaucca ccuguuuacc cugaccaauc ugggagcccc ugccgccuuc 4020
aaguacuuug acaccaccau cgaccggaag agguacacca gcaccaaaga ggugcuggac 4080
gccacccuga uccaccagag caucaccggc cuguacgaga cacggaucga ccugucucag 4140
cugggaggcg acagcgcugg aggaggugga agcggaggag gaggaagcgg aggaggaggu 4200
agcggaccua agaaaaagag gaagguggcg gccgcuggau ccggacgggc ugacgcauug 4260
gacgauuuug aucuggauau gcugggaagu gacgcccucg augauuuuga ccuugacaug 4320
cuugguucgg augcccuuga ugacuuugac cucgacaugc ucggcaguga cgcccuugau 4380
gauuucgacc uggacaugcu gauuaacugu acaggcagug gagagggcag aggaagucug 4440
cuaacaugcg gugacgucga ggagaauccu ggcccaaugg cuucaaacuu uacucaguuc 4500
gugcucgugg acaauggugg gacaggggau gugacagugg cuccuucuaa uuucgcuaau 4560
gggguggcag aguggaucag cuccaacuca cggagccagg ccuacaaggu gacaugcagc 4620
gucaggcagu cuagugccca gaagagaaag uauaccauca agguggaggu ccccaaagug 4680
gcuacccaga cagugggcgg agucgaacug ccugucgccg cuuggagguc cuaccugaac 4740
auggagcuca cuaucccaau uuucgcuacc aauucugacu gugaacucau cgugaaggca 4800
augcaggggc uccucaaaga cgguaauccu aucccuuccg ccaucgccgc uaacucaggu 4860
aucuacagcg cuggaggagg uggaagcgga ggaggaggaa gcggaggagg agguagcgga 4920
ccuaagaaaa agaggaaggu ggcggccgcu ggauccccuu cagggcagau cagcaaccag 4980
gcccuggcuc uggccccuag cuccgcucca gugcuggccc agacuauggu gcccucuagu 5040
gcuauggugc cucuggccca gccaccugcu ccagccccug ugcugacccc aggaccaccc 5100
cagucacuga gcgcuccagu gcccaagucu acacaggccg gcgaggggac ucugagugaa 5160
gcucugcugc accugcaguu cgacgcugau gaggaccugg gagcucugcu ggggaacagc 5220
accgaucccg gaguguucac agaucuggcc uccguggaca acucugaguu ucagcagcug 5280
cugaaucagg gcguguccau gucucauagu acagccgaac caaugcugau ggaguacccc 5340
gaagccauua cccggcuggu gaccggcagc cagcggcccc ccgaccccgc uccaacuccc 5400
cugggaacca gcggccugcc uaaugggcug uccggagaug aagacuucuc aagcaucgcu 5460
gauauggacu uuagugcccu gcugucacag auuuccucua gugggcaggg aggaggugga 5520
agcggcuuca gcguggacac cagugcccug cuggaccugu ucagccccuc ggugaccgug 5580
cccgacauga gccugccuga ccuugacagc agccuggcca guauccaaga gcuccugucu 5640
ccccaggagc cccccaggcc ucccgaggca gagaacagca gcccggauuc agggaagcag 5700
cuggugcacu acacagcgca gccgcuguuc cugcuggacc ccggcuccgu ggacaccggg 5760
agcaacgacc ugccggugcu guuugagcug ggagagggcu ccuacuucuc cgaaggggac 5820
ggcuucgccg aggaccccac caucucccug cugacaggcu cggagccucc caaagccaag 5880
gaccccacug ucucc 5895

Claims (123)

1.一种用于将负荷物递送至靶基因以增加所述靶基因在动物或细胞中的表达的脂质纳米颗粒,其中所述负荷物包含:
(a)编码嵌合规律间隔成簇短回文重复序列(CRISPR)相关联(Cas)蛋白的核酸,所述蛋白包含与一个或多个转录激活域融合的无核酸酶活性的Cas蛋白;
(b)编码嵌合衔接蛋白的核酸,所述嵌合衔接蛋白包含与一个或多个转录激活域融合的衔接蛋白;以及
(c)一个或多个向导RNA或编码所述一个或多个向导RNA的一个或多个核酸,每个向导RNA包含所述嵌合衔接蛋白能够特异性结合的一个或多个衔接结合元件,并且其中所述一个或多个向导RNA中的每一个能够与所述Cas蛋白形成复合物并将其导向至所述靶基因内的靶序列,从而增加所述靶基因的表达。
2.根据权利要求1所述的脂质纳米颗粒,其中多顺反子或双顺反子核酸包含(a)和(b)。
3.根据权利要求2所述的脂质纳米颗粒,其中(a)和(b)通过所述多顺反子或双顺反子核酸中的2A蛋白编码序列链接。
4.根据权利要求1所述的脂质纳米颗粒,其中(a)和(b)是单独的核酸。
5.根据任一前述权利要求所述的脂质纳米颗粒,其中(a)和(b)各自均为信使RNA(mRNA)的形式。
6.根据权利要求5所述的脂质纳米颗粒,其中所述mRNA被修饰为被假尿苷完全取代。
7.根据权利要求5或6所述的脂质纳米颗粒,其中所述mRNA是包含(a)和(b)的多顺反子或双顺反子核酸,其中所述mRNA包含SEQ ID NO:61所示的序列。
8.根据任一前述权利要求所述的脂质纳米颗粒,其中(c)为RNA的形式。
9.根据权利要求8所述的脂质纳米颗粒,其中所述一个或多个向导RNA中的每一个被修饰以在5'末端和/或3'末端包含一个或多个稳定末端修饰。
10.根据权利要求9所述的脂质纳米颗粒,其中所述一个或多个向导RNA中的每一个的所述5'末端和/或所述3'末端被修饰以包含一个或多个硫代磷酸酯键。
11.根据权利要求9或10所述的脂质纳米颗粒,其中所述一个或多个向导RNA中的每一个的所述5'末端和/或所述3'末端被修饰以包含一个或多个2'-O-甲基修饰。
12.根据任一前述权利要求所述的脂质纳米颗粒,其中所述靶序列包含所述靶基因内的调控序列。
13.根据权利要求12所述的脂质纳米颗粒,其中所述调控序列包含启动子或增强子。
14.根据任一前述权利要求所述的脂质纳米颗粒,其中所述靶序列在所述靶基因的转录起始位点的200个碱基对内。
15.根据权利要求14所述的脂质纳米颗粒,其中所述靶序列在所述转录起始位点上游200个碱基对和所述转录起始位点下游1个碱基对的区域内。
16.根据任一前述权利要求所述的脂质纳米颗粒,其中所述一个或多个向导RNA中的每一个均包含所述嵌合衔接蛋白能够特异性结合的两个衔接结合元件。
17.根据权利要求16所述的脂质纳米颗粒,其中第一衔接结合元件处于所述一个或多个向导RNA中的每一个的第一环内,并且第二衔接结合元件处于所述一个或多个向导RNA中的每一个的第二环内。
18.根据权利要求17所述的脂质纳米颗粒,其中所述一个或多个向导RNA中的每一个是包含与反式激活CRISPR RNA(tracrRNA)部分融合的CRISPR RNA(crRNA)部分的单个向导RNA,并且
其中所述第一环是对应于SEQ ID NO:12、14、52或53的残基13至16的四环,并且所述第二环是对应于SEQ ID NO:12、14、52或53的残基53至56的茎环2。
19.根据任一前述权利要求所述的脂质纳米颗粒,其中所述衔接结合元件包含SEQ IDNO:16所示的序列。
20.根据权利要求19所述的脂质纳米颗粒,其中所述一个或多个向导RNA中的每一个包含SEQ ID NO:40、45、56或57所示的序列。
21.根据任一前述权利要求所述的脂质纳米颗粒,其中所述一个或多个向导RNA中的至少一个靶向Ttr基因,任选地,其中靶向Ttr的向导RNA靶向包含SEQ ID NO:34至36中任一个所示的序列的序列,或者任选地,其中所述靶向Ttr的向导RNA包含SEQ ID NO:37至39和55中任一个所示的序列。
22.根据任一前述权利要求所述的脂质纳米颗粒,其中所述一个或多个向导RNA靶向两个或更多个靶基因。
23.根据任一前述权利要求所述的脂质纳米颗粒,其中所述一个或多个向导RNA包含靶向单个靶基因的多个向导RNA。
24.根据任一前述权利要求所述的脂质纳米颗粒,其中所述一个或多个向导RNA包含靶向单个靶基因的至少三个向导RNA。
25.根据权利要求24所述的脂质纳米颗粒,其中所述至少三个向导RNA靶向小鼠Ttr基因座,并且其中第一向导RNA靶向包含SEQ ID NO:34的序列或者包含SEQ ID NO:37所示的序列,第二向导RNA靶向包含序列SEQ ID NO:35的序列或者包含SEQ ID NO:38所示的序列,并且第三向导RNA靶向包含SEQ ID NO:36的序列或者包含SEQ ID NO:39或55所示的序列。
26.根据任一前述权利要求所述的脂质纳米颗粒,其中所述Cas蛋白是Cas9蛋白。
27.根据权利要求26所述的脂质纳米颗粒,其中所述Cas9蛋白为酿脓链球菌Cas9蛋白、空肠弯曲杆菌Cas9蛋白或金黄色葡萄球菌Cas9蛋白。
28.根据权利要求26或27所述的脂质纳米颗粒,其中当与酿脓链球菌Cas9蛋白最佳比对时,所述Cas9蛋白包含对应于D10A和N863A或D10A和H840A的突变。
29.根据任一前述权利要求所述的脂质纳米颗粒,其中编码所述Cas蛋白的序列经过密码子优化以在所述动物或细胞中表达。
30.根据任一前述权利要求所述的脂质纳米颗粒,其中所述嵌合Cas蛋白中的一个或多个转录激活子域选自:VP16、VP64、p65、MyoD1、HSF1、RTA、SET7/9及其组合。
31.根据权利要求30所述的脂质纳米颗粒,其中所述嵌合Cas蛋白中的所述一个或多个转录激活子域包含VP64。
32.根据权利要求31所述的脂质纳米颗粒,其中所述嵌合Cas蛋白从N端到C端包含:无催化活性的Cas蛋白;核定位信号;以及VP64转录激活子域。
33.根据权利要求32所述的脂质纳米颗粒,其中所述嵌合Cas蛋白包含与SEQ ID NO:1所示的序列至少90%、95%、96%、97%、98%、99%或100%相同的序列。
34.根据权利要求33所述的脂质纳米颗粒,其中编码所述嵌合Cas蛋白的核酸包含与SEQ ID NO:25所示的序列至少90%、95%、96%、97%、98%、99%或100%相同的序列。
35.根据任一前述权利要求所述的脂质纳米颗粒,其中所述衔接蛋白位于所述嵌合衔接蛋白的N末端,并且所述一个或多个转录激活域位于所述嵌合衔接蛋白的C末端。
36.根据任一前述权利要求所述的脂质纳米颗粒,其中所述衔接蛋白包含MS2外壳蛋白或其功能片段或变体。
37.根据任一前述权利要求所述的脂质纳米颗粒,其中所述嵌合衔接蛋白中的所述一个或多个转录激活域选自:VP16、VP64、p65、MyoD1、HSF1、RTA、SET7/9及其组合。
38.根据权利要求37所述的脂质纳米颗粒,其中所述嵌合衔接蛋白中的所述一个或多个转录激活域包含p65和HSF1。
39.根据权利要求38所述的脂质纳米颗粒,其中所述嵌合衔接蛋白从N端到C端包含:MS2外壳蛋白;核定位信号;p65转录激活域;以及HSF1转录激活域。
40.根据权利要求39所述的脂质纳米颗粒,其中所述嵌合衔接蛋白包含与SEQ ID NO:6所示的序列至少90%、95%、96%、97%、98%、99%或100%相同的序列。
41.根据权利要求40所述的脂质纳米颗粒,其中编码所述嵌合衔接蛋白的核酸包含与SEQ ID NO:27所示的序列至少90%、95%、96%、97%、98%、99%或100%相同的序列。
42.根据任一前述权利要求所述的脂质纳米颗粒,其中所述动物是非人动物。
43.根据任一前述权利要求所述的脂质纳米颗粒,其中所述动物是哺乳动物。
44.根据权利要求43所述的脂质纳米颗粒,其中所述哺乳动物是啮齿动物。
45.根据权利要求44所述的脂质纳米颗粒,其中所述啮齿动物是大鼠或小鼠。
46.根据权利要求45所述的脂质纳米颗粒,其中所述啮齿动物是所述小鼠。
47.根据权利要求1至42中任一项所述的脂质纳米颗粒,其中所述动物是人。
48.根据任一前述权利要求所述的脂质纳米颗粒,其中所述靶基因是在肝脏中表达的基因。
49.根据任一前述权利要求所述的脂质纳米颗粒,其中所述靶基因是疾病相关联基因。
50.根据任一前述权利要求所述的脂质纳米颗粒,其中所述靶基因的表达或活性降低与疾病、病症或综合征相关联或者成为疾病、病症或综合征的病因。
51.根据任一前述权利要求所述的脂质纳米颗粒,其中所述靶基因是单倍体不足基因或者是OTC、HBG1或HBG2。
52.根据权利要求51所述的脂质纳米颗粒,其中所述靶基因是选自表3所列基因的单倍体不足基因。
53.根据权利要求51或52所述的脂质纳米颗粒,其中所述单倍体不足基因是KCNQ4、PINK1、TP73、GLUT1、MYH、ABCA4、LRH-1、PAX8、SLC40A1、BMPR2、PKD2、PIK3R1、HMGA1、GCK、ELN、GTF3、GATA3、BUB3、PAX6、FLI1、HNF1A、PKD1、MC4R、DMPK或MYH9。
54.根据权利要求1至49中任一项所述的脂质纳米颗粒,其中所述靶基因的表达或活性增加与疾病、病症或综合征相关联或者成为疾病、病症或综合征的病因。
55.根据任一前述权利要求所述的脂质纳米颗粒,其中所述脂质纳米颗粒包含阳离子脂质、中性脂质、辅助脂质和隐形脂质。
56.根据权利要求55所述的脂质纳米颗粒,其中所述阳离子脂质是MC3和/或所述中性脂质是DSPC和/或所述辅助脂质是胆固醇和/或所述隐形脂质是PEG-DMG。
57.根据权利要求56所述的脂质纳米颗粒,其中所述脂质纳米颗粒包含摩尔比为约50:10:38.5:1.5的MC3、DSPC、胆固醇和PEG-DMG。
58.一种用于在动物体内增加靶基因的表达的方法,所述方法包含向所述动物中引入:
(a)编码嵌合规律间隔成簇短回文重复序列(CRISPR)相关联(Cas)蛋白的核酸,所述蛋白包含与一个或多个转录激活域融合的无核酸酶活性的Cas蛋白;
(b)编码嵌合衔接蛋白的核酸,所述嵌合衔接蛋白包含与一个或多个转录激活域融合的衔接蛋白;以及
(c)一个或多个向导RNA或编码所述一个或多个向导RNA的一个或多个核酸,每个向导RNA包含所述嵌合衔接蛋白能够特异性结合的一个或多个衔接结合元件,并且其中所述一个或多个向导RNA中的每一个能够与所述Cas蛋白形成复合物并将其导向至所述靶基因内的靶序列,从而增加所述靶基因的表达,
其中(a)、(b)和(c)一起在同一脂质纳米颗粒(LNP)中递送。
59.根据权利要求58所述的方法,其中多顺反子或双顺反子核酸包含(a)和(b)。
60.根据权利要求59所述的方法,其中(a)和(b)通过所述多顺反子或双顺反子核酸中的2A蛋白编码序列链接。
61.根据权利要求58所述的方法,其中(a)和(b)是单独的核酸。
62.根据权利要求58至61中任一项所述的方法,其中(a)和(b)各自均以信使RNA(mRNA)的形式引入。
63.根据权利要求62所述的方法,其中所述mRNA被修饰为被假尿苷完全取代。
64.根据权利要求62或63所述的方法,其中所述mRNA是包含(a)和(b)的多顺反子或双顺反子核酸,其中所述mRNA包含SEQ ID NO:61所示的序列。
65.根据权利要求58至64中任一项所述的方法,其中(c)以RNA的形式引入。
66.根据权利要求65所述的方法,其中所述一个或多个向导RNA中的每一个被修饰以在5'末端和/或3'末端包含一个或多个稳定末端修饰。
67.根据权利要求66所述的方法,其中所述一个或多个向导RNA中的每一个的所述5'末端和/或所述3'末端被修饰以包含一个或多个硫代磷酸酯键。
68.根据权利要求66或67所述的方法,其中所述一个或多个向导RNA中的每一个的所述5'末端和/或所述3'末端被修饰以包含一个或多个2'-O-甲基修饰。
69.根据权利要求58至68中任一项所述的方法,其中所述靶序列包含所述靶基因内的调控序列。
70.根据权利要求69所述的方法,其中所述调控序列包含启动子或增强子。
71.根据权利要求58至70中任一项所述的方法,其中所述靶序列在所述靶基因的转录起始位点的200个碱基对内。
72.根据权利要求71所述的方法,其中所述靶序列在所述转录起始位点上游200个碱基对和所述转录起始位点下游1个碱基对的区域内。
73.根据权利要求58至72中任一项所述的方法,其中所述一个或多个向导RNA中的每一个均包含所述嵌合衔接蛋白能够特异性结合的两个衔接结合元件。
74.根据权利要求73所述的方法,其中第一衔接结合元件处于所述一个或多个向导RNA中的每一个的第一环内,并且第二衔接结合元件处于所述一个或多个向导RNA中的每一个的第二环内。
75.根据权利要求74所述的方法,其中所述一个或多个向导RNA中的每一个是包含与反式激活CRISPR RNA(tracrRNA)部分融合的CRISPR RNA(crRNA)部分的单个向导RNA,并且
其中所述第一环是对应于SEQ ID NO:12、14、52或53的残基13至16的四环,并且所述第二环是对应于SEQ ID NO:12、14、52或53的残基53至56的茎环2。
76.根据权利要求58至75中任一项所述的方法,其中所述衔接结合元件包含SEQ IDNO:16所示的序列。
77.根据权利要求76所述的方法,其中所述一个或多个向导RNA中的每一个包含SEQ IDNO:40、45、56或57所示的序列。
78.根据权利要求58至77中任一项所述的方法,其中所述一个或多个向导RNA中的至少一个靶向Ttr基因,任选地,其中靶向Ttr的向导RNA靶向包含SEQ ID NO:34至36中任一个所示的序列的序列,或者任选地,其中所述靶向Ttr的向导RNA包含SEQ ID NO:37至39和55中任一个所示的序列。
79.根据权利要求58至78中任一项所述的方法,其中所述一个或多个向导RNA靶向两个或更多个靶基因。
80.根据权利要求58至79中任一项所述的方法,其中所述一个或多个向导RNA包含靶向单个靶基因的多个向导RNA。
81.根据权利要求58至80中任一项所述的方法,其中所述一个或多个向导RNA包含靶向单个靶基因的至少三个向导RNA。
82.根据权利要求81所述的方法,其中所述至少三个向导RNA靶向小鼠Ttr基因座,并且其中第一向导RNA靶向包含SEQ ID NO:34的序列或者包含SEQ ID NO:37所示的序列,第二向导RNA靶向包含序列SEQ ID NO:35的序列或者包含SEQ ID NO:38所示的序列,并且第三向导RNA靶向包含SEQ ID NO:36的序列或者包含SEQ ID NO:39或55所示的序列。
83.根据权利要求58至82中任一项所述的方法,其中所述Cas蛋白是Cas9蛋白。
84.根据权利要求83所述的方法,其中所述Cas9蛋白为酿脓链球菌Cas9蛋白、空肠弯曲杆菌Cas9蛋白或金黄色葡萄球菌Cas9蛋白。
85.根据权利要求83或84所述的方法,其中当与酿脓链球菌Cas9蛋白最佳比对时,所述Cas9蛋白包含对应于D10A和N863A或D10A和H840A的突变。
86.根据权利要求58至85中任一项所述的方法,其中编码所述Cas蛋白的序列经过密码子优化以在所述动物中表达。
87.根据权利要求58至86中任一项所述的方法,其中所述嵌合Cas蛋白中的一个或多个转录激活子域选自:VP16、VP64、p65、MyoD1、HSF1、RTA、SET7/9及其组合。
88.根据权利要求87所述的方法,其中所述嵌合Cas蛋白中的所述一个或多个转录激活子域包含VP64。
89.根据权利要求88所述的方法,其中所述嵌合Cas蛋白从N端到C端包含:无催化活性的Cas蛋白;核定位信号;以及VP64转录激活子域。
90.根据权利要求89所述的方法,其中所述嵌合Cas蛋白包含与SEQ ID NO:1所示的序列至少90%、95%、96%、97%、98%、99%或100%相同的序列。
91.根据权利要求90所述的方法,其中编码所述嵌合Cas蛋白的核酸包含与SEQ ID NO:25所示的序列至少90%、95%、96%、97%、98%、99%或100%相同的序列。
92.根据权利要求58至91中任一项所述的方法,其中所述衔接蛋白位于所述嵌合衔接蛋白的N末端,并且所述一个或多个转录激活域位于所述嵌合衔接蛋白的C末端。
93.根据权利要求58至92中任一项所述的方法,其中所述衔接蛋白包含MS2外壳蛋白或其功能片段或变体。
94.根据权利要求58至93中任一项所述的方法,其中所述嵌合衔接蛋白中的所述一个或多个转录激活域选自:VP16、VP64、p65、MyoD1、HSF1、RTA、SET7/9及其组合。
95.根据权利要求94所述的方法,其中所述嵌合衔接蛋白中的所述一个或多个转录激活域包含p65和HSF1。
96.根据权利要求95所述的方法,其中所述嵌合衔接蛋白从N端到C端包含:MS2外壳蛋白;核定位信号;p65转录激活域;以及HSF1转录激活域。
97.根据权利要求96所述的方法,其中所述嵌合衔接蛋白包含与SEQ ID NO:6所示的序列至少90%、95%、96%、97%、98%、99%或100%相同的序列。
98.根据权利要求97所述的方法,其中编码所述嵌合衔接蛋白的核酸包含与SEQ IDNO:27所示的序列至少90%、95%、96%、97%、98%、99%或100%相同的序列。
99.根据权利要求58至98中任一项所述的方法,其中所述动物是人。
100.根据权利要求58至99中任一项所述的方法,其中所述动物是哺乳动物。
101.根据权利要求100所述的方法,其中所述哺乳动物是啮齿动物。
102.根据权利要求101所述的方法,其中所述啮齿动物是大鼠或小鼠。
103.根据权利要求102所述的方法,其中所述啮齿动物是所述小鼠。
104.根据权利要求58至99中任一项所述的方法,其中所述动物是人。
105.根据权利要求58至104中任一项所述的方法,其中所述动物是需要增加所述靶基因表达的对象,其中所述靶基因在所述对象中低表达,并且所述低表达与所述对象中的疾病、病症或综合征相关联或者成为疾病、病症或综合征的病因。
106.根据权利要求58至105中任一项所述的方法,其中所述靶基因是在肝脏中表达的基因。
107.根据权利要求58至106中任一项所述的方法,其中所述靶基因是疾病相关联基因。
108.根据权利要求58至107中任一项所述的方法,其中所述靶基因的表达或活性降低与疾病、病症或综合征相关联或者成为疾病、病症或综合征的病因。
109.根据权利要求58至108中任一项所述的方法,其中所述靶基因是单倍体不足基因或者是OTC、HBG1或HBG2。
110.根据权利要求109所述的方法,其中所述靶基因是选自表3所列基因的单倍体不足基因。
111.根据权利要求109或110所述的方法,其中所述单倍体不足基因是KCNQ4、PINK1、TP73、GLUT1、MYH、ABCA4、LRH-1、PAX8、SLC40A1、BMPR2、PKD2、PIK3R1、HMGA1、GCK、ELN、GTF3、GATA3、BUB3、PAX6、FLI1、HNF1A、PKD1、MC4R、DMPK或MYH9。
112.根据权利要求58至107中任一项所述的方法,其中所述靶基因的表达或活性增加与疾病、病症或综合征相关联或者成为疾病、病症或综合征的病因。
113.根据权利要求58至112中任一项所述的方法,其中所述脂质纳米颗粒包含阳离子脂质、中性脂质、辅助脂质和隐形脂质。
114.根据权利要求113所述的方法,其中所述阳离子脂质是MC3和/或所述中性脂质是DSPC和/或所述辅助脂质是胆固醇和/或所述隐形脂质是PEG-DMG。
115.根据权利要求114所述的方法,其中所述脂质纳米颗粒包含摩尔比为约50:10:38.5:1.5的MC3、DSPC、胆固醇和PEG-DMG。
116.根据权利要求58至115中任一项所述的方法,其中将所述一个或多个向导RNA施用于所述动物的途径是静脉内注射、实质内注射、腹膜内注射、经鼻安装或玻璃体内注射。
117.根据权利要求58至116中任一项所述的方法,其中所述靶基因的表达增加相对于对照动物高出至少0.5倍、1倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍或20倍。
118.根据权利要求58至117中任一项所述的方法,其中所述靶基因表达增加的持续时间为至少约1天、至少约2天、至少约3天、至少约4天、至少约5天、至少约6天、至少约1周、至少约2周、至少约3周、至少约4周、至少约1个月或至少约2个月。
119.根据权利要求58至118中任一项所述的方法,其中将包含(a)、(b)和(c)的所述脂质纳米颗粒循序引入所述动物中两次或更多次。
120.根据权利要求119所述的方法,其中将包含(a)、(b)和(c)的所述脂质纳米颗粒循序引入所述动物中三次或更多次。
121.根据权利要求119或120所述的方法,其中在每次循序引入所述脂质纳米颗粒后,所述靶基因的表达增加至至少相同的水平。
122.根据权利要求119至121中任一项所述的方法,其中与仅引入所述脂质纳米颗粒一次的方法相比,所述靶基因的表达增加至更高的水平。
123.一种用于增加靶基因在细胞中表达的方法,所述方法包含向所述细胞中引入:
(a)编码嵌合规律间隔成簇短回文重复序列(CRISPR)相关联(Cas)蛋白的核酸,所述蛋白包含与一个或多个转录激活域融合的无核酸酶活性的Cas蛋白;
(b)编码嵌合衔接蛋白的核酸,所述嵌合衔接蛋白包含与一个或多个转录激活域融合的衔接蛋白;以及
(c)一个或多个向导RNA或编码所述一个或多个向导RNA的一个或多个核酸,每个向导RNA包含所述嵌合衔接蛋白能够特异性结合的一个或多个衔接结合元件,并且其中所述一个或多个向导RNA中的每一个能够与所述Cas蛋白形成复合物并将其导向至所述靶基因内的靶序列,从而增加所述靶基因的表达,
其中(a)、(b)和(c)一起在同一脂质纳米颗粒(LNP)中递送。
CN202080075542.9A 2019-09-13 2020-09-11 使用由脂质纳米颗粒递送的crispr/cas系统在动物中进行的转录调控 Pending CN114616002A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962900080P 2019-09-13 2019-09-13
US62/900,080 2019-09-13
US202063042762P 2020-06-23 2020-06-23
US63/042,762 2020-06-23
PCT/US2020/050491 WO2021050940A1 (en) 2019-09-13 2020-09-11 Transcription modulation in animals using crispr/cas systems delivered by lipid nanoparticles

Publications (1)

Publication Number Publication Date
CN114616002A true CN114616002A (zh) 2022-06-10

Family

ID=72659909

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080075542.9A Pending CN114616002A (zh) 2019-09-13 2020-09-11 使用由脂质纳米颗粒递送的crispr/cas系统在动物中进行的转录调控

Country Status (8)

Country Link
US (1) US20210079394A1 (zh)
EP (1) EP4028063A1 (zh)
JP (1) JP2022548031A (zh)
KR (1) KR20220062079A (zh)
CN (1) CN114616002A (zh)
AU (1) AU2020346056A1 (zh)
CA (1) CA3153980A1 (zh)
WO (1) WO2021050940A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022232442A2 (en) * 2021-04-28 2022-11-03 Salk Institute For Biological Studies Multiplex crispr/cas9-mediated target gene activation system
WO2023077053A2 (en) * 2021-10-28 2023-05-04 Regeneron Pharmaceuticals, Inc. Crispr/cas-related methods and compositions for knocking out c5
AU2022382975A1 (en) * 2021-11-03 2024-05-02 Intellia Therapeutics, Inc. Polynucleotides, compositions, and methods for genome editing

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015089486A2 (en) * 2013-12-12 2015-06-18 The Broad Institute Inc. Systems, methods and compositions for sequence manipulation with optimized functional crispr-cas systems
WO2016106236A1 (en) * 2014-12-23 2016-06-30 The Broad Institute Inc. Rna-targeting system
WO2017106657A1 (en) * 2015-12-18 2017-06-22 The Broad Institute Inc. Novel crispr enzymes and systems
WO2017184786A1 (en) * 2016-04-19 2017-10-26 The Broad Institute Inc. Cpf1 complexes with reduced indel activity

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS501B1 (zh) 1970-05-19 1975-01-06
EP2571512B1 (en) 2010-05-17 2017-08-23 Sangamo BioSciences, Inc. Novel dna-binding proteins and uses thereof
WO2013141680A1 (en) 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
AU2013243948A1 (en) * 2012-04-02 2014-10-30 Moderna Therapeutics, Inc. Modified polynucleotides for the production of proteins associated with human disease
LT3401400T (lt) 2012-05-25 2019-06-10 The Regents Of The University Of California Būdai ir kompozicijos, skirtos rnr molekulės nukreipiamai tikslinės dnr modifikacijai ir rnr molekulės nukreipiamam transkripcijos moduliavimui
DE202013012597U1 (de) 2012-10-23 2017-11-21 Toolgen, Inc. Zusammensetzung zum Spalten einer Ziel-DNA, umfassend eine für die Ziel-DNA spezifische guide-RNA und eine Cas-Protein-codierende Nukleinsäure oder ein Cas-Protein, sowie deren Verwendung
EP3138911B1 (en) 2012-12-06 2018-12-05 Sigma Aldrich Co. LLC Crispr-based genome modification and regulation
PL2784162T3 (pl) 2012-12-12 2016-01-29 Broad Inst Inc Opracowanie systemów, metod oraz zoptymalizowanych kompozycji przewodnikowych do manipulacji sekwencyjnej
ES2658401T3 (es) 2012-12-12 2018-03-09 The Broad Institute, Inc. Suministro, modificación y optimización de sistemas, métodos y composiciones para la manipulación de secuencias y aplicaciones terapéuticas
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
CA3081054A1 (en) 2012-12-17 2014-06-26 President And Fellows Of Harvard College Rna-guided human genome engineering
EP3561050B1 (en) 2013-02-20 2021-12-08 Regeneron Pharmaceuticals, Inc. Genetic modification of rats
WO2014131833A1 (en) 2013-02-27 2014-09-04 Helmholtz Zentrum München Deutsches Forschungszentrum Für Gesundheit Und Umwelt (Gmbh) Gene editing in the oocyte by cas9 nucleases
CA2906553C (en) 2013-03-15 2022-08-02 The General Hospital Corporation Rna-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci
US9234213B2 (en) * 2013-03-15 2016-01-12 System Biosciences, Llc Compositions and methods directed to CRISPR/Cas genomic engineering systems
EP4286517A3 (en) 2013-04-04 2024-03-13 President and Fellows of Harvard College Therapeutic uses of genome editing with crispr/cas systems
US20140356956A1 (en) 2013-06-04 2014-12-04 President And Fellows Of Harvard College RNA-Guided Transcriptional Regulation
US20160237455A1 (en) 2013-09-27 2016-08-18 Editas Medicine, Inc. Crispr-related methods and compositions
CA2952697A1 (en) 2014-06-16 2015-12-23 The Johns Hopkins University Compositions and methods for the expression of crispr guide rnas using the h1 promoter
US20150376587A1 (en) 2014-06-25 2015-12-31 Caribou Biosciences, Inc. RNA Modification to Engineer Cas9 Activity
EP4223285A3 (en) 2014-07-16 2023-11-22 Novartis AG Method of encapsulating a nucleic acid in a lipid nanoparticle host
WO2016049258A2 (en) 2014-09-25 2016-03-31 The Broad Institute Inc. Functional screening with optimized functional crispr-cas systems
EP3237624B1 (en) 2014-12-23 2020-01-29 Syngenta Participations AG Methods and compositions for identifying and enriching for cells comprising site specific genomic modifications
EP3265559B1 (en) 2015-03-03 2021-01-06 The General Hospital Corporation Engineered crispr-cas9 nucleases with altered pam specificity
WO2016149484A2 (en) 2015-03-17 2016-09-22 Temple University Of The Commonwealth System Of Higher Education Compositions and methods for specific reactivation of hiv latent reservoir
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
US11279928B2 (en) 2015-06-29 2022-03-22 Massachusetts Institute Of Technology Compositions comprising nucleic acids and methods of using the same
US11845933B2 (en) 2016-02-03 2023-12-19 Massachusetts Institute Of Technology Structure-guided chemical modification of guide RNA and its applications
TWI773666B (zh) 2016-03-30 2022-08-11 美商英特利亞醫療公司 Crispr/cas 組分之脂質奈米粒子調配物
WO2018007871A1 (en) 2016-07-08 2018-01-11 Crispr Therapeutics Ag Materials and methods for treatment of transthyretin amyloidosis
SG10202106058WA (en) 2016-12-08 2021-07-29 Intellia Therapeutics Inc Modified guide rnas
EP3687581A1 (en) 2017-09-29 2020-08-05 Intellia Therapeutics, Inc. Polynucleotides, compositions, and methods for genome editing

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015089486A2 (en) * 2013-12-12 2015-06-18 The Broad Institute Inc. Systems, methods and compositions for sequence manipulation with optimized functional crispr-cas systems
WO2016106236A1 (en) * 2014-12-23 2016-06-30 The Broad Institute Inc. Rna-targeting system
WO2017106657A1 (en) * 2015-12-18 2017-06-22 The Broad Institute Inc. Novel crispr enzymes and systems
WO2017184786A1 (en) * 2016-04-19 2017-10-26 The Broad Institute Inc. Cpf1 complexes with reduced indel activity

Also Published As

Publication number Publication date
EP4028063A1 (en) 2022-07-20
KR20220062079A (ko) 2022-05-13
US20210079394A1 (en) 2021-03-18
CA3153980A1 (en) 2021-03-18
JP2022548031A (ja) 2022-11-16
AU2020346056A1 (en) 2022-03-31
WO2021050940A1 (en) 2021-03-18

Similar Documents

Publication Publication Date Title
KR102647714B1 (ko) CRISPR/Cas 시스템을 사용한 동물에서의 전사 조절
CN111163633B (zh) 包含人源化ttr基因座的非人类动物及其使用方法
CN110891420B (zh) Cas转基因小鼠胚胎干细胞和小鼠及其应用
AU2019403015B2 (en) Nuclease-mediated repeat expansion
CN114616002A (zh) 使用由脂质纳米颗粒递送的crispr/cas系统在动物中进行的转录调控
US20190032156A1 (en) Methods and compositions for assessing crispr/cas-induced recombination with an exogenous donor nucleic acid in vivo
CN113874510A (zh) 包括具有β滑移突变的人源化TTR基因座的非人动物和使用方法
RU2784927C1 (ru) Отличные от человека животные, включающие в себя гуманизированный ttr локус, и способы применения
RU2782358C2 (ru) Экспрессирующие cas мышиные эмбриональные стволовые клетки и мыши и их применения
EP4256052A1 (en) Crispr sam biosensor cell lines and methods of use thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination