CN118028368A - 靶向5’utr的不依赖于突变的基因敲入治疗 - Google Patents

靶向5’utr的不依赖于突变的基因敲入治疗 Download PDF

Info

Publication number
CN118028368A
CN118028368A CN202311414456.8A CN202311414456A CN118028368A CN 118028368 A CN118028368 A CN 118028368A CN 202311414456 A CN202311414456 A CN 202311414456A CN 118028368 A CN118028368 A CN 118028368A
Authority
CN
China
Prior art keywords
gene
wild
nucleic acid
vector
aspects
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311414456.8A
Other languages
English (en)
Inventor
熊文君
A·D·黄
廖保山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
City University of Hong Kong CityU
Original Assignee
City University of Hong Kong CityU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by City University of Hong Kong CityU filed Critical City University of Hong Kong CityU
Publication of CN118028368A publication Critical patent/CN118028368A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • A61K31/7105Natural ribonucleic acids, i.e. containing only riboses attached to adenine, guanine, cytosine or uracil and having 3'-5' phosphodiester links
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/17Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • A61K38/177Receptors; Cell surface antigens; Cell surface determinants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/465Hydrolases (3) acting on ester bonds (3.1), e.g. lipases, ribonucleases
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0008Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P27/00Drugs for disorders of the senses
    • A61P27/02Ophthalmic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14151Methods of production or purification of viral material
    • C12N2750/14152Methods of production or purification of viral material relating to complementing cells and packaging systems for producing virus or viral particles
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14171Demonstrated in vivo effect
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Biochemistry (AREA)
  • Epidemiology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Immunology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Cell Biology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Virology (AREA)
  • Mycology (AREA)
  • Ophthalmology & Optometry (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

公开了新的5’非翻译区(UTR)靶向基因敲入(KI)组合物和使用方法。基因KI组合物和方法采用了不依赖于同源性的靶向整合(HITI)介导的将野生型编码序列(CDS)插入到野生型基因突变变体的翻译起始元件上游的5’UTR中。与其他基因治疗方法相比,5’UTR靶向基因KI治疗组合物和方法提供了更安全且更有效的基因插入。

Description

靶向5’UTR的不依赖于突变的基因敲入治疗
序列表
本申请包含以XML格式提交的序列表,并且其全部内容通过引用并入本文。所述XML副本创建于2022年11月7日,命名为“CTYU.P0034US Sequence Listing”,大小为73,104字节。
技术领域
本公开涉及细胞生物学、分子生物学和医药领域,更具体涉及基因治疗。
背景技术
尽管近来针对单基因隐性遗传病的基因补充治疗取得了成功,但用以治疗显性常染色体遗传疾病的治疗方法却发展较慢。疾病等位基因的突变特异性敲低和/或敲除在很大程度上受限于RNA干扰的脱靶效应和原型间隔区相邻基序(PAM)位点的可用性。碱基编辑或先导编辑可以准确修复疾病等位基因,但不广泛适用于具有高突变异质性的疾病。
例如,显性常染色体视网膜色素变性(adRP)是一种具有高遗传异质性的常染色体显性光感受器变性疾病,具有超过90个致病基因,包括RHO(20-30%adRP)、RP1(5-10%adRP)、RPRH2(5%adRP)和IMPDH1(>2%adRP)。RHO基因编码的视紫红质蛋白即是一个具体的RP致病基因。视紫红质蛋白是一种光敏性G蛋白偶联受体,能够激活视网膜中杆状光感受细胞中的光转导。RHO突变占所有adRP的20-30%,并且已鉴定了超过200种功能丧失性和功能获得性RHO基因突变,其中RhoP23H(p.Pro23His,c.68C>A)突变是adRP患者中最常见的突变。1-3尽管基因补充治疗已成为一种有前景的隐性常染色体遗传RP(arRP)治疗方法,但由于对突变等位基因的破坏效率低以及存在大量尚未解决的功能丧失性和功能获得性突变,治疗常染色体显性RP(adRP)仍然面临挑战。
存在对用于治疗显性常染色体遗传病症的改进方法和组合物的需求。
发明内容
本发明基于以下发现:靶向5’非翻译区(UTR)的基因敲入(knock-in,KI)的新组合物和方法可以利用不依赖于同源性的靶向整合(homology-independent targetedintergration,HITI)介导的插入而将野生型编码序列(CDS)插入到野生型基因的突变变体的翻译起始元件上游的5’非翻译区(UTR)。与其他基因治疗方法相比,所述靶向5’UTR的基因KI治疗组合物和方法提供了惊人的安全性和插入效率。
在一些方面,本文提供了用于编辑细胞基因组的方法,该方法包括使细胞与包含核酸酶和编码敲入盒的外源核酸的组合物接触,所述敲入盒包含野生型基因的编码序列以及用于野生型基因表达的翻译起始和终止元件,其中核酸酶使编码野生型基因的突变变体的内源核酸在5’UTR内产生断裂,其中内源核酸在5’至3’方向上编码5’UTR、用于野生型基因突变变体表达的翻译起始元件以及野生型基因的突变变体的编码序列,其中编码敲入盒的外源核酸通过非同源依赖性靶向整合而被整合至由内源核酸编码的翻译起始元件上游(5’)的内源核酸的5’UTR中。
在一些方面,本文还提供了组合物,其包含:核酸酶;编码敲入盒的外源核酸,所述敲入盒包含野生型基因的编码序列以及用于表达野生型基因的翻译起始和终止元件;其中,当引入细胞中时,核酸酶引起编码野生型基因的突变变体的内源核酸的5’UTR内的断裂,其中内源核酸在5’至3’方向编码5’UTR、用于表达野生型基因突变变体的翻译起始元件、以及野生型基因的突变变体的编码序列,并且其中编码敲入盒的外源核酸通过不依赖于同源性的靶向整合被整合至由内源核酸编码的翻译起始元件上游(5’)的内源核酸的5’UTR中。
在一些方面,本文还提供了包含基因组修饰的工程化细胞,其中所述基因组修饰包括编码敲入盒的外源核酸在细胞的基因组中的整合,其中所述敲入盒包含野生型基因的编码序列,并且其中编码敲入盒的外源核酸被整合至编码野生型基因突变变体的内源核酸的5’UTR中,其中所述内源核酸在5’至3’方向上编码5’UTR、用于表达野生型基因突变变体的翻译起始元件、以及野生型基因突变变体的编码序列,并且其中编码敲入盒的外源核酸通过不依赖于同源性的靶向整合被整合至由内源核酸编码的翻译起始元件上游(5’)的内源核酸的5’UTR中。
在一些方面,本文还提供了用于治疗或预防被鉴定为表达突变基因的受试者中的常染色体遗传病症的方法,所述方法包括向受试者的细胞中引入有效量的组合物,该组合物包含:核酸酶;编码敲入盒的外源核酸,所述敲入盒包含野生型基因的编码序列以及用于表达野生型基因的翻译起始和终止元件;其中核酸酶引起编码突变基因变体的内源核酸的5’UTR内的断裂,其中内源核酸在5’至3’方向上编码5’UTR、用于表达突变基因变体的翻译起始元件、以及突变基因变体的编码序列,其中编码敲入盒的核酸通过不依赖于同源性的靶向整合被整合至由内源核酸编码的翻译起始元件上游(5’)的内源核酸的5’UTR中,并且其中编码敲入盒的核酸的整合导致野生型基因的表达,并且其中野生型基因的表达导致突变基因变体的表达减少。
在一些方面,本文还提供了组合物,其包含:Cas9核酸酶;编码敲入盒的外源核酸,所述敲入盒包含野生型基因的编码序列和用于表达野生型基因的翻译起始和终止元件;以及CRISPR/Cas核酸酶的引导分子,以将Cas9引导至编码野生型基因突变变体的内源核酸的5’UTR,其中所述内源核酸在5’至3’方向上编码5’UTR、用于表达野生型基因突变变体的翻译起始元件、以及野生型基因突变变体的编码序列,并且其中,当引入细胞中时,核酸酶引起编码野生型基因突变变体的内源核酸的5’UTR内的断裂,并且其中编码敲入盒的外源核酸通过不依赖于同源性的靶向整合被整合至由内源核酸编码的翻译起始元件上游(5’)的内源核酸的5’UTR中。
在本文公开的组合物和方法中,编码敲入盒的外源核酸不必须与编码野生型基因突变变体的内源核酸框内整合,即外源核酸的编码框可以与內源核损的编码框一致或者也可以不一致。
在本文公开的组合物和方法中,敲入盒的侧翼可以具有同源臂或者没有同源臂,从而外源核酸的敲入可以基于同源介导修复(homologous directed repair,HDR)进行,或者可以基于不依赖于同源性的靶向整合(HITI)进行。
在一些方面,编码敲入盒的外源核酸的整合导致细胞表达野生型基因。在一些方面,细胞对所敲入的野生型基因的表达抑制了野生型基因的突变变体的表达。
在本文公开的组合物和方法的一些方面,核酸酶是CRISPR/Cas核酸酶,并且所述方法还包括使细胞与用于CRISPR/Cas核酸酶的引导分子接触。在一些方面,核酸酶是锌指核酸酶(ZFN)、转录激活子样效应物核酸酶(TALEN)或大范围核酸酶。
在本文公开的组合物和方法的一些方面,核酸酶由编码敲入盒的同一外源核酸编码,并且其中外源核酸包含在载体中。在一些方面,核酸酶是CRISPR/Cas核酸酶,并且其中包含编码核酸酶和敲入盒的外源核酸的载体进一步包含编码用于CRISPR/Cas核酸酶的引导分子的核酸。在一些方面,载体是质粒、转座子、粘粒、人工染色体、脂质纳米颗粒或病毒载体。在一些方面,载体是病毒载体,并且其中病毒载体是腺相关病毒(AAV)载体、腺病毒载体、慢病毒载体或逆转录病毒载体。在特定的方面,病毒载体是AAV载体。
在本文公开的组合物和方法的一些方面,核酸酶由与编码敲入盒的外源核酸不同的核酸编码,并且其中编码核酸酶的核酸和编码敲入盒的外源核酸包含在两个不同的载体中。在一些方面,核酸酶是CRISPR/Cas核酸酶,并且包含编码敲入盒的外源核酸的载体还包含编码用于CRISPR/Cas核酸酶的引导分子的核酸。在一些方面,载体是质粒、转座子、粘粒、人工染色体、脂质纳米颗粒或病毒载体。在一些方面,载体是病毒载体,并且其中病毒载体是腺相关病毒(AAV)载体、腺病毒载体、慢病毒载体或逆转录病毒载体。在特定的方面,病毒载体是AAV载体。
在本文公开的组合物和方法的一些方面,野生型基因的编码序列有效连接至启动子。在一些方面,启动子是诱导型启动子、组成型启动子或组织特异性启动子。
在本文公开的组合物和方法的一些方面,野生型基因的突变变体(即,突变基因)是显性变体。在一些方面,野生型基因是RHO基因。在本文公开的组合物和方法的一些方面,野生型基因的突变变体(即,突变基因)是隐性变体。
在一些方面,本文还公开了:一种方法,包括向受试者引入治疗有效量的本文公开的组合物;在细胞中表达野生型基因(例如衍生出突变基因的野生型基因)的方法,包括向受试者引入治疗有效量的本文公开的组合物;和降低细胞中野生型基因(例如衍生出突变基因的野生型基因)的突变变体的表达的方法,包括向受试者引入治疗有效量的本文公开的组合物。在一些方面,受试者是人。在一些方面,受试者是动物。在一些方面,受试者先前被鉴定为具有表达野生型基因的突变变体的细胞。在一些方面,治疗有效量的组合物的引入抑制了野生型基因突变变体的表达。在一些方面,野生型基因突变变体是显性变体。在特定的方面,野生型基因是RHO基因,并且将组合物引入受试者的视网膜。在一些方面,野生型基因突变变体是隐性基因变体。
在特定的方面中还公开了增加受试者视网膜中的野生型RHO基因表达的方法,所述方法包括将治疗有效量的本文公开的组合物引入受试者的视网膜中。在一些方面,受试者先前被鉴定为具有表达RHO基因的突变变体的视网膜细胞。在一些方面,野生型RHO基因的表达抑制了突变RHO基因的表达。在一些方面,受试者是人。在一些方面,受试者是动物。
可以预期的是,本说明书中讨论的任何方面可以关于本公开的任何方法或组合物来实现,反之亦然。此外,本公开的组合物可用于实现本公开的方法。
本公开的其他目的、特征和优点将从以下详细描述中变得显而易见。然而,应当理解,详细描述和具体实施例虽然指示了本公开的具体方面,但仅以说明的方式给出,因为在本公开的精神和范围内的各种改变和修改对于本领域技术人员来说将从该详细描述中显而易见地得到。
附图说明
下列附图形成本说明书的一部分并且用于进一步展示本公开的某些方面。通过参考这些附图中的一幅或多幅并结合本文呈现的具体实施方案的详细描述可以更好地理解本公开。
图1示意性地示出了用于基因敲入(KI)至RHO 5’UTR基因座的不依赖于同源性的靶向整合(HITI)策略。绿色五边形,SpCas9-gRNA靶向区域;五边形内黑线,被切割部位;灰色矩形,外显子。黄色矩形,Kozak序列。红色矩形,终止密码子。红色星号,P23H突变。HITI供体,RHO编码序列(CDS)侧翼是两个引导RNA(gRNA)靶向序列。
图2显示了SpCas9 gRNA靶向序列。单下划线蓝色序列,SpCas9gRNA1/2靶向位点;双下划线红色序列,PAM;以阴影突出显示的序列,Kozak序列;以单下划线阴影标记的序列,ATG起始密码子。
图3示意性地示出了包装SpCas9、mCherry、gRNA1和GFP-或RHO-HITI供体的双AAV载体。SpCas9和mCherry报告子由hRK启动子驱动。gRNA1表达由U6启动子驱动。
图4显示了接受由AAV8-SpCas9-gRNA1介导的GFP或RHO KI的RHO-/-小鼠的代表性视网膜切片。比例尺,50μm。
图5显示了视网膜切片中具有KI的细胞(GFP+)/由AAV转导的细胞(mCherry+)的百分比的定量。用hRK-SpCas9 gRNA1(n=9)和hRK-SpCas9GFP KI(n=12)感染眼。数据表示为平均值±s.e.m.*P<0.05;**P<0.01;***P<0.001;****P<0.0001,未配对的双向学生t检验。
图6显示了分选的mCherry+光感受器细胞中RHO KI以及插入和/或缺失(INDEL)的等位基因频率的下一代测序(NGS)结果。
图7示出了用于测试RHOP23H/wt小鼠中的功效的实验设计。小鼠眼未经处理、用AAV8-SpCas9+AAV8-mCherry-U6-gRNA1(标记为SpCas9-gRNA1)处理、或用AAV8-SpCas9+AAV8-mCherry-U6-gRNA1 RHO KI(标记为SpCas9-Rho KI)处理。
图8显示了代表性光学相干断层扫描(OCT)图像,其显示了外核层(ONL)的厚度。从P30到P210,每30天,在距背侧区域视神经头(ONH)0.6mm处进行测量。
图9显示了从P30到P210,不同处理的RHOP23H/wt的ONL厚度。数据表示为平均值±s.e.m.*P<0.05;**P<0.01;***P<0.001;****P<0.0001,采用Tukey事后检验的双向ANOVA。
图10显示了在0.032cd.s.m-2的光强度下,对照和经处理的RHOP23H/wt眼的视杆暗视视网膜电图(ERG)反应的B波振幅。数据表示为平均值±s.e.m.*P<0.05;**P<0.01;***P<0.001;****P<0.0001,采用Tukey事后检验的双向ANOVA。
图11显示了在-4.0 1g(cd.s.m-2)至1.5 1g(cd.s.m-2)的光强度下,P180RHOP23H/wt眼的逐步暗视ERG反应的B波振幅。数据表示为平均值±s.e.m.*P<0.05;**P<0.01;***P<0.001;****P<0.0001,采用Tukey事后检验的双向ANOVA。
图12显示了在30cd.s.m-2的光强度下,P180 RHOP23H/wt眼的混合视杆-视锥细胞ERG反应的B波振幅。数据表示为平均值±s.e.m.*P<0.05;**P<0.01;***P<0.001;****P<0.0001,采用Tukey事后检验的双向ANOVA。
图13显示了终点P210处RHOP23H/wt小鼠的代表性视网膜切片图像。切片用抗mCAR(视锥细胞标志物,白色)和抗RHO(视杆细胞标志物,绿色)抗体染色。左列中显示整个视网膜切片的比例尺:500μm。其他列中的比例尺:50μm。
图14-15显示了距ONH不同距离处,P210 RHOP23H/wt视网膜的ONL厚度定量。未处理组(n=14);SpCas9-gRNA1(n=5);SpCas9-RHO KI(n=9)。数据表示为平均值±s.e.m.*P<0.05;**P<0.01;***P<0.001;****P<0.0001,采用Tukey事后检验的双向ANOVA。
图16A-16C显示了靶向RHO 5’UTR的SpCas9 gRNA的体外筛选。图16A:用于筛选spCas9 gRNA靶向效率的表达质粒的示意图。CMV和U6分别是驱动Cas9、mCherry和gRNA转录的启动子。BGHpA,牛生长激素聚腺苷酸化。2A,自切割肽序列。图16B:Cas9-gRNA靶向效率评估的时间线。将Cas9-gRNA质粒转染至野生型MEF细胞中,转染3天后分选mCherry+细胞,进行基因组DNA提取和基因编辑分析。图16C:通过ICE CRISPR分析工具分析SpCas9-gRNA的靶向效率。SpCas9-gRNA1显示出最高的敲除效率,为41%。
图17显示了由AAV-Cas9-gRNA介导的病毒感染和基因整合至RHO基因座的效率。来自未处理(左图)或仅被AAV8-gRNA-GFP供体感染(中图)或被AAV8-Cas9和AAV8-gRNA-GFP供体感染(右图)的视网膜的分离细胞的代表性FACS图。
图18A-18B示意性地示出了RHO-/-小鼠中的RHO或GFP整合。图18A:AAV载体将SpCas9、gRNA和RHO或GFP供体递送至视网膜的示意图。hRK启动子控制SpCas9和mCherry的表达。gRNA1受U6启动子控制。供体的侧翼是2个SpCas9-gRNA靶向位点。在RHO KO转基因小鼠中,RHO外显子1被PGK Neo盒取代;然而,SpCas9-gRNA靶向位点没有改变。图18B:RHO-/-小鼠中CRISPR/Cas9介导的RHO或GFP整合的实验设计。
图19A-19C显示了5’UTR中的基因整合破坏了内源RHO表达。图19A:SpCas9-gRNA1介导的基因敲入RHO基因座的示意图。绿色箭头,RHO的内源性启动子。黄色矩形,Kozak序列。蓝色矩形,外源RHO或GFP敲入序列。绿色多边形,由HITI介导的基因敲入诱导的反向互补序列。灰色矩形,内源性RHO编码外显子。红色矩形,终止密码子。图19B:模拟5’UTR基因敲入序列。左图:含有由SpCas9-gRNA1介导的基因整合至RHO基因座的产物的质粒CMV-Kozak-GFP-Kozak-RHO。右图:对照质粒CMV-Kozak-RHO-Kozak-GFP。将这些质粒转染至293T细胞中以确定下游基因是否表达。图19C:由Kozak-GFP-Kozak-RHO或Kozak-RHO-Kozak-GFP质粒转染的293T细胞的代表性图像。仅这些盒中的第一个基因可以表达。比例尺,50μm。
图20A-20E显示了5’UTR基因组修饰对视觉功能和RHO表达的影响。图20A:RHO CDS修饰和RHO 5’UTR修饰的示意图。绿色五边形,SaCas9或SpCas9-Grna靶向区域;五边形内黑线,被切割位点;灰色矩形,外显子。黄色矩形,Kozak序列。红色矩形,终止密码子序列。图20B:仅注射AAV8-gRNA2(n=3)和仅注射AAV8-SaCas9-gRNA1(n=3)或AAV8-gRNA1(n=3)和AAV8-SpCas9-gRNA1(n=3)的野生型小鼠的眼的纯化视杆细胞中的RHO表达水平。图20C:未经处理(n=10)或仅用AAV8-gRNA1(n=5)或AAV8-SpCas9-gRNA1(n=5)处理的野生型小鼠的P30视杆暗视ERG反应。图20D:野生型小鼠的P30视锥明视ERG反应。图20E:野生型小鼠的P30混合视杆和视锥ERG反应。对于ERG测量,仅显示B波数据。数据显示为平均值±s.e.m.,未配对双尾学生t检验(图20B)、使用Tukey事后检验的单向ANOVA(图20C-20E)。
图21显示了RHOP23H/wt小鼠的AAV-SpCas9保守视锥功能介导的RHO整合。10cd.s.m-2光适应后在30cd.s.m-2的光强度下,未经处理(n=14)或用AAV8-SpCas9-gRNA1(n=5)或AAV8-SpCas9-RHO KI(n=9)处理的RHOP23H/wt小鼠眼的P30-P210视锥明视ERG反应。每个点代表B波振幅。方框和须线显示平均值±s.e.m.*P<0.05,采用Tukey事后检验的双向ANOVA。
图22A-22B显示了adRP基因5’UTR中的PAM位点具有高度的跨物种保守性和可及性(accessibility)。图22A:小家鼠(Mus musculus)、食蟹猴(Macaca fascicular)和智人(Homo sapiens)之间的RHO基因组DNA比对。图22B:其他人类adRP相关基因的5’UTR中的潜在SpCas9靶位点。单下划线蓝色序列,SpCas9-gRNA靶区域。星号,相同的核碱基。双下划线橙色序列,PAM位点。以灰色阴影突出显示的区域,Kozak序列。
图23-28示意性地示出了用于基因敲入治疗的各种质粒。
具体实施方式
本公开至少部分基于本文公开的新的靶向5’非翻译区(UTR)的基因敲入(KI)组合物和使用方法的开发。基因KI组合物和方法利用不依赖于同源性的靶向整合(HITI)介导的野生型编码序列(CDS)至野生型基因的突变变体的翻译起始元件上游的5’非翻译区(UTR)的插入。下面包括的实验结果证明了与其他基因治疗方法相比,所公开的靶向5’UTR基因KI治疗组合物和方法具有令人惊讶的安全性和效率。
尽管最近在单基因隐性遗传疾病的基因补充治疗方面取得了成功,但仍然需要针对显性常染色体遗传疾病的治疗方法。因此,在一些方面,本文公开了一种新的基因敲入(KI)治疗,其利用AAV-Cas9介导的HITI使野生型CDS插入野生型基因突变变体的5’UTR,更具体地是紧邻翻译起始元件(例如Kozak序列)的上游。如本文实施例中所述,在杂合RHOP23H/wt小鼠中测试了该方法,该小鼠携带在显性常染色体遗传视网膜色素变性(adRP)患者中发现的最常见的显性点突变。在一些方面,HITI-AAV在体内介导小鼠RHO 5’UTR中的高效基因插入。在一些方面,HITI-AAV显著延长了光感受器存活和视觉功能。
本文公开的靶向野生型基因的突变变体的5’UTR的不依赖于突变的基因KI治疗方法显示了治疗例如常染色体遗传病症的治疗潜力,并且显示了相对于其他AAV-HITI介导的基因KI方法的进步,至少因为在一些方面,本发明的组合物和方法提供至少以下优势:1)5’UTR KI方法不是突变特异性的;2)插入的野生型基因CDS在基因组环境中处于顺式调控序列的控制下;3)5’UTR KI具有更高的插入效率,因为插入的序列可以但不要求与内源CDS位于框内;4)由内源等位基因表达截短的蛋白受到抑制,从而减少或避免可能的毒性显性负效应;5)5’UTR中的插入和/或缺失(INDEL)不会消除野生型等位基因的表达,但CDS中的INDEL可能导致阅读框移位和对野生型等位基因的敲除效应。
因此,在一些方面,本文提供了用于编辑细胞基因组的方法和组合物以及使用此类组合物和方法产生的工程化细胞。在一些方面,细胞可以与包含核酸酶和编码敲入盒的外源核酸的组合物接触,所述敲入盒包含野生型基因的编码序列以及用于表达野生型基因的翻译起始和终止元件。核酸酶可以引起编码野生型基因的突变变体的内源核酸的5’UTR内的断裂,所述内源核酸可以在5’至3’方向上编码5’UTR、用于表达野生型基因的突变变体的翻译起始元件、以及野生型基因的突变变体的编码序列。编码敲入盒的外源核酸可以通过不依赖于同源性的靶向整合被整合至由内源核酸编码的翻译起始元件上游(5’)的内源核酸的5’UTR中。编码敲入盒的外源核酸的整合可以导致细胞表达野生型基因,并且细胞对野生型基因的表达可以抑制野生型基因的突变变体的表达。在一些方面,还公开了在细胞中表达野生型基因(例如,突变基因变体由之衍生的野生型基因,例如RHO)的方法、降低细胞中野生型基因(例如突变基因变体由之衍生的野生型基因,例如RHO)的突变变体的表达的方法、用于治疗或预防受试者中的显性常染色体遗传病症(例如视网膜色素变性)的方法以及用于治疗或预防隐性常染色体遗传疾病的方法。
I.一些定义
本说明书通篇提及“一个方面”、“方面”、“特定方面”、“相关方面”、“某一方面”、“另外的方面”或“进一步的方面”或其组合时表示,与该方面关联描述的具体特征、结构或特性包括在本公开的至少一个方面中。因此,前述短语在整个说明书中不同地方的出现不一定都指同一方面。此外,具体特征、结构或特性可以在一个或多个方面以任何合适的方式组合。
贯穿本申请,术语“约”用于表示数值包括测量或定量方法的固有误差变化(例如,±10%的偏差)。
本文中对数值范围的叙述用作单独提及落入该范围内的每个单独值的简述方法。除非本文另有说明,否则每个单独的值均被并入说明书中,如同其在本文中单独提及一样。
术语“或”和“和/或”用于描述彼此组合或独有的多个组件。例如,“x、y和/或z”可以指仅“x”、仅“y”、仅“z”、“x、y和z”、“(x和y)或z”、“x或(y和z)”或“x或y或z”。还包括的情形是,x、y或z可以被具体地从一个方面排除。
术语“包含”、“具有”、“包括”或“含有”是包括性的或开放式的,并且不排除额外的、未列举的元素或方法步骤。
组合物及其使用方法可以“包含”整个说明书中公开的任何成分或步骤或“基本上由其组成”或“由其组成”。由所公开的任何成分或步骤“基本上组成”的组合物和方法将主张的范围限制于短语“由……组成”之后的内容。因此,短语“由......组成”表示所列出的元素是必需的或强制性的,并且不可以存在其他元素。由所公开的任何成分或步骤“基本上组成”的组合物和方法将主张的范围限制为在该短语之后列出的任何要素以及不会实质上影响本公开的各方面的基本的新特征的特定的物质或步骤。因此,短语“基本上由......组成”表示所列出的要素是必需的或强制性的,但是其他要素是可选的并且可以存在也可以不存在,这取决于它们是否影响所列要素的活性或作用。
在治疗、诊断或生理目的或效果的背景下的任何方法也可以用“用途”权利要求语言来描述,例如本文讨论的任何化合物、组合物或试剂用于实现或实施所描述的治疗、诊断或生理目的或效果的“用途”。
本文使用的术语“工程化”是指由人工产生的实体,包括细胞、核酸、多肽、载体等。在至少一些情况下,工程化实体是合成的,并且包含并非天然存在或以其在本公开中使用的方式配置的元件。例如,当两个或更多个在自然界中不按该顺序连接在一起的序列被人工操纵以在工程化多核苷酸中彼此直接连接和/或当多核苷酸中的特定残基是非天然存在的和/或当多核苷酸中的特定残基是通过人工作用导致与在自然界中不与其连接的实体或部分连接时,多核苷酸被视为是“工程化”的。
术语“内源的”是指由生物体、细胞或组织内部起源的任何物质。
术语“外源的”是指从生物体、细胞或组织外部引入的或源自生物体、细胞或组织外部的任何材料,其不产生自或源自其被引入的同一生物体、细胞或组织。
术语“分离的”是指从自然状态改变或移出。例如,天然存在于活体动物中的核酸或肽不是“分离的”,但与其天然状态的共存物质部分或完全分离的相同核酸或肽是“分离的”。分离的核酸或蛋白可以以基本上纯化的形式存在,或者可以存在于非天然环境例如宿主细胞中。
术语“转染”、“转化”或“转导”或这些术语的任何变体是指将外源核酸转移或引入细胞的过程。“转染的”、“转化的”或“转导的”细胞是已经用外源核酸转染、转化或转导的细胞。
如本文所用,“核酸”是包含核酸组分的分子,并且指DNA或RNA分子。它可以与术语“多核苷酸”互换使用。核酸分子是包含核苷酸单体或由核苷酸单体组成的聚合物,所述核苷酸单体通过糖/磷酸酯主链的磷酸二酯键彼此共价连接。核酸还可以包括修饰的核酸分子,例如碱基修饰的、糖修饰的或主链修饰等的DNA或RNA分子。核酸可以多种形式存在,例如分离的片段和所引入序列的重组载体或编码多肽(例如抗原或抗体的一条或两条链,或其片段、衍生物、突变蛋白或变体)的重组多核苷酸,足以用作杂交探针、PCR引物或测序引物以用于鉴定、分析、突变或扩增编码多肽的多核苷酸的多核苷酸,用于抑制多核苷酸表达的反义核酸,mRNA,saRNA和上述这些的互补序列。
核酸可以是单链或双链的,并且可以包含RNA和/或DNA核苷酸及其人工变体(例如,肽核酸)。在一些情况下,核酸序列可以编码具有额外的异源编码序列的多肽序列,例如以允许多肽的纯化、运输、分泌、翻译后修饰,或用于治疗益处,例如靶向或功效。可以将标签或其他异源多肽添加到修饰的多肽的编码序列中,其中“异源”是指与修饰的多肽不同的多肽。
术语“多核苷酸”所指的核酸分子可以是重组的或已从总基因组核酸中分离的。术语“多核苷酸”包括寡核苷酸(长度为100个残基或更少的核酸)、重组载体,包括例如质粒、粘粒、噬菌体、病毒等。在某些方面,多核苷酸包括调控序列,其基本上与其天然存在的基因或蛋白编码序列分离。多核苷酸可以是单链(编码或反义)或双链,并且可以是RNA、DNA(基因组、cDNA或合成的)、其类似物或其组合。额外的编码或非编码序列可以但不一定存在于多核苷酸内。
术语“基因”用于指编码蛋白、多肽或肽(包括正确转录、翻译后修饰或定位所需的任何序列)的核酸。如本领域技术人员将理解的,该术语涵盖基因组序列、表达盒、cDNA序列和较小工程化核酸片段,其表达或可经调整适合表达蛋白、多肽、结构域、肽、融合蛋白和突变体。编码全部或部分多肽的核酸可以含有编码全部或部分该多肽的连续核酸序列。具体的多肽可以由包含具有略微不同的核酸序列的变体的核酸编码,但是仍然编码相同或基本相似的多肽。
术语“表达”是指从核酸序列产生任何基因产物。在一些方面,基因产物可以是转录物。在一些方面,基因产物可以是多肽。在一些方面,核酸序列的表达涉及以下一项或多项:(1)从DNA序列产生RNA模板(例如,通过转录);(2)RNA转录物的加工(例如,通过剪接、编辑等);(3)将RNA翻译成多肽或蛋白;和/或(4)多肽或蛋白的翻译后修饰。
术语“蛋白”、“多肽”或“肽”在本文中作为同义词使用并且是指氨基酸单体的聚合物,例如包含至少两个氨基酸残基的分子。多肽可包括基因产物、天然存在的多肽、合成多肽、同源物、直向同源物、旁系同源物、片段和前述这些的其他等同物、变体和类似物。多肽可以是单分子,或者可以是多分子复合物例如二聚体、三聚体或四聚体。蛋白包含一个或多个肽或多肽,并且可以折叠成3维形式,这可能是蛋白发挥其生物学功能所必需的。
如本文所用,术语“野生型”或“WT”或“天然”是指生物体中天然存在的分子的内源形式。在一些方面,野生型多肽或核酸序列具有未经有意修饰的序列。在一些方面,采用多核苷酸或多肽的野生型形式,然而,本公开的其他方面涉及修饰的多核苷酸或多肽或变体多核苷酸或多肽。“修饰的”多核苷酸或多肽或“变体”多核苷酸或多肽是指其化学结构、特别是其核苷酸或氨基酸序列相对于野生型多核苷酸或多肽改变的多核苷酸或多肽。在一些方面,修饰的多核苷酸或多肽/变体多核苷酸或多肽具有至少一种修饰的活性或功能(多核苷酸或多肽可以具有多种活性或功能)。当本文具体提及多核苷酸或多肽时,其通常指天然(野生型)或重组(修饰的/变体)多核苷酸或多肽。多核苷酸或多肽可从其天然的生物体直接分离、通过重组DNA/外源表达方法产生、通过固相肽合成(SPPS)或其他体外方法产生。在一些具体的方面,分离的核酸片段和重组载体引入编码多肽的核酸序列(例如,野生型基因编码序列)。术语“重组的”可以与多肽或具体多肽的名称结合使用,并且这通常是指由已在体外操纵的核酸分子产生的多肽或者是这样的分子的复制产物。
通常来说,特定分子是否被适当地认为是参考分子(例如野生型分子)的“变体”取决于其与参考分子(例如野生型分子)的结构同一性程度。如本领域技术人员理解的,任何生物或化学参考分子都具有某些特征性结构元件。根据定义,变体是一种独特的分子,其与参考分子共有一个或多个这样的特征性结构元件,但在至少一个方面与参考分子不同。在一些方面,变体多肽或核酸可以由于氨基酸或核苷酸序列中的一个或多个差异和/或化学部分(例如,碳水化合物、脂质、磷酸基团)中的一个或多个差异而与参考多肽或核酸不同,所述化学部分是多肽或核酸的共价组分(例如,结合至多肽或核酸主链)。
在一些方面,变体多肽或核酸显示出与参考多肽或核酸的总体序列同一性为至少、至多、恰好为85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%或99%或处于前述任意两者之间。在一些方面,变体多肽或核酸不与参考多肽或核酸共有至少一个特征性序列元件。在一些方面,参考多肽或核酸具有一种或多种生物活性。在一些方面,变体多肽或核酸与参考多肽或核酸共有一种或多种生物活性。在一些方面,变体多肽或核酸缺乏参考多肽或核酸的一种或多种生物活性。在一些方面,与参考多肽或核酸相比,变体多肽或核酸显示一种或多种生物活性的水平降低。
在一些方面,如果目标多肽或核酸具有与参考序列相同的序列但在特定位置有少量序列改变,则该目标多肽或核酸被认为是参考多肽或核酸的“变体”。在一些方面,变体多肽或核酸序列与参考多肽或核酸序列相比具有至少一个修饰,例如1至约20个修饰。在一个方面,变体多肽或核酸序列与参考多肽或核酸序列相比具有1至约10个修饰。在一个方面,变体多肽或核酸序列与参考多肽或核酸序列相比具有1至约5个修饰。通常,与参考相比,变体中少于约20%、约15%、约10%、约9%、约8%、约7%、约6%、约5%、约4%、约3%或约2%的残基被取代、插入或缺失。通常,变体多肽或核酸相对于参考包含非常少量(例如,少于约5个、约4个、约3个、约2个或约1个)数量的取代、插入或缺失的功能残基(例如,参与特定生物活性的残基)。在一些方面,变体多肽或核酸与参考相比包含约25个、约20个、约19个、约18个、约17个、约16个、约15个、约14个、约13个、约10个、约9个、约8个、约7个、约6个、约5个、约4个、约3个、或约2个、或约1个取代残基。在一些方面,变体多肽或核酸与参考相比包含少于约25个、约20个、约19个、约18个、约17个、约16个、约15个、约14个、约13个、约10个、约9个、约8个、约7个、约6个、约5个、约4个、约3个或约2个添加或缺失。
出于本公开的目的,氨基酸序列(肽、蛋白或多肽)的“变体”包括氨基酸插入变体、氨基酸添加变体、氨基酸缺失变体和/或氨基酸取代变体。核苷酸序列的“变体”包括核苷酸插入变体、核苷酸添加变体、核苷酸缺失变体和/或核苷酸取代变体。术语“变体”包括所有突变体、剪接变体、翻译后修饰变体、构象、同工型、等位基因变体、物种变体和物种同源物,特别是天然存在的那些。
在本公开中,“载体”是指核酸分子,例如人工核酸分子。载体可用于引入核酸序列,例如包含开放阅读框的核酸序列。载体包括但不限于储存载体、表达载体、克隆载体和转移载体。载体可以是RNA载体或DNA载体。在一些方面,载体是DNA分子。在一些方面,载体是质粒载体。在一些方面,载体是病毒载体。通常,表达载体含有期望的编码序列和在特定宿主生物体(例如,细菌、酵母、植物、昆虫或哺乳动物)中或在体外表达系统中表达有效连接的编码序列所必需的适当的其他序列。克隆载体通常用于工程改造和扩增某个期望的片段(通常是DNA片段),并且可能缺乏表达目标片段所需的功能序列。
术语“抑制”、“减少”或“降低”或这些术语的任何变体包括任何可测量的减少(例如,5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或99%降低)或完全抑制以获得期望的结果。术语“改善”、“促进”或“增加”或这些术语的任何变体包括任何可测量的增加(例如,5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或99%增加)以实现期望的结果或产生蛋白或分子。
如本文所用,术语“参考”、“标准”或“对照”描述的值是相对于进行比较的值。例如,将药剂、受试者、群体、样品或目标值与参考、标准或对照药剂、受试者、群体、样品或目标值进行比较。参考、标准或对照的测试和/或确定可以基本上同时与和/或利用针对药剂、受试者、群体、样品或目标值的感兴趣的测试或确定,和/或可以在与评估中的药剂、受试者、群体、样本或目标值相当的条件或情况下确定或表征。
本文所用的术语“受试者”可以是作为方法或材料的对象的任何生物体或动物受试者,包括哺乳动物,例如人类、实验动物(例如灵长类动物、大鼠、小鼠、兔)、家畜(例如,牛、绵羊、山羊、猪、火鸡和鸡)、家庭宠物(例如,狗、猫和啮齿动物)、马和转基因非人类动物。受试者可以是例如患有或怀疑患有疾病(可以称为医学病况)例如常染色体疾病或病症(即显性常染色体遗传病症或隐性常染色体遗传病症)的患者。受试者可以正在接受治疗或已经接受过治疗。受试者可以没有症状。受试者可以是健康个体,但希望预防常染色体疾病或病症(即,显性常染色体遗传病症或隐性常染色体遗传病症)。至少在某些情况下,术语“个体”可以互换使用。如本文所用,“受试者”或“个体”可以被安置在或可以不被安置在医疗机构中并且可以被作为医疗机构的门诊病人来治疗。个体可以通过互联网接收一种或多种药物组合物。个体可以包括任何年龄的人类或非人类动物,因此包括成年和青少年(即,儿童)和婴儿,并且包括子宫内个体。该术语并不意味着需要医疗,因此,个体可以自愿或非自愿地参与临床实验或支持基础科学研究的实验。在特定的方面,受试者是人。在特定的方面,受试者是动物。
如本文所用,“治疗”包括对疾病或病理状况的症状或病理学的任何有益或期望的效果,并且可以包括所治疗的疾病或病况(例如常染色体疾病或病症)的一种或多种可测量标志物的甚至最小程度的减少。治疗可以任选地包括减少或改善疾病或病况的症状,或者延迟疾病或病况的进展。“治疗”不一定表示疾病或病症或其相关症状的完全根除或治愈。
如本文所用,“预防”及类似词语如“预防的”、“预防性”等表示用于预防、抑制疾病或病况(例如常染色体疾病)或减少疾病或病况发生或复发的可能性或风险的方法。它还指延迟疾病或病况的发作或复发或者延迟疾病或病况的症状的发生或复发。如本文所用,“预防”及类似词语还包括在疾病或病况发作或复发之前降低疾病或病况的强度、影响、症状和/或负担。
如从上下文中将理解的,疾病、病症和/或病况的“风险”是指特定个体将发展该疾病、病症和/或病况的可能性。在一些方面,风险被表示为百分比。在一些方面,风险是至少或至多0%、1%%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、30%、40%、50%、60%、70%、80%、90%直至100%。在一些方面,风险被表示为相对于与参考样品或参考样品组相关的风险的风险。在一些方面,参考样品或参考样品组具有已知的疾病、病症、病况和/或事件的风险。在一些方面,参考样品或参考样品组来自与特定个体相当的个体。在一些方面,风险可以反映一种或多种遗传属性,例如,其可以使个体倾向于发展(或不发展)特定疾病、病症和/或病况。在一些方面,风险可以反映一种或多种表观遗传事件或属性和/或一种或多种生活方式或环境事件或属性。“易患”疾病、病症和/或病况的个体是指比一般公众成员具有更高风险发展疾病、病症和/或病况的个体。在一些方面,易患疾病、病症和/或病况的个体可能未被诊断为患有该疾病、病症和/或病况。在一些方面,易患疾病、病症和/或病况的个体可能表现出疾病、病症和/或病况的症状。在一些方面,易患疾病、病症和/或病况的个体可能不表现出疾病、病症和/或病况的症状。在一些方面,易患疾病、病症和/或病况的个体将发展该疾病、病症和/或病况。在一些方面,易患疾病、病症和/或病况的个体将不会发展该疾病、病症和/或病况。
当治疗导致受试者(例如,人类或动物)疾病状态(例如,常染色体遗传病症)的一种或多种症状的数量、严重程度和频率的一项或多项减少时,该治疗是“治疗有效的”。一只动物)。在一些方面,治疗有效量的组合物可以导致活性野生型蛋白(例如,野生型RHO蛋白或具有所需活性的RHO蛋白变体)表达水平的增加(例如,与用组合物处理之前的表达水平相比)。在一些方面,治疗有效量的组合物可导致靶细胞(例如,视网膜细胞)中活性野生型蛋白(例如,野生型RHO蛋白或活性变体)的表达水平增加。在一些方面,治疗有效量的组合物可以导致活性野生型蛋白(例如,野生型RHO蛋白或活性变体)的表达水平增加,和/或靶细胞中野生型蛋白的一种或多种活性增加(例如,与参考水平相比,所述参考水平例如是治疗前受试者中的水平、在野生型基因中具有突变的受试者中的水平,或患有常染色体疾病的受试者或受试者群体中的水平)。
短语“药学上可接受的”包括当施用于人类或动物时不产生过敏或类似不良反应的组合物。通常,此类组合物被制备为局部组合物、液体溶液或悬浮液,也可以制备为适合在使用前溶于或悬浮于液体中的固体形式。施用途径可以根据待治疗病症的部位和性质而变化,包括例如局部、吸入、皮内、透皮、胃肠外、静脉内、肌内、鼻内、皮下、经皮、气管内、腹膜内、瘤内、灌注、灌洗、直接注射以及口服施用和制剂。
II.常染色体疾病
在一些方面,本文提供了用于治疗或预防被鉴定为表达突变基因变体的受试者中的常染色体遗传病症的方法和组合物。可以靶向表达野生型基因的内源突变变体(即突变的基因变体)的细胞,以改善患有常染色体遗传病症的个体中的常染色体遗传病症,或降低个体中常染色体疾病的风险或延迟其严重程度和/或发作。在特定情况下,表达至少部分引起常染色体遗传病症的野生型基因的内源突变变体(即突变的基因变体)的细胞被靶向,以达到抑制或减少野生型基因的内源突变变体的表达。
A.显性常染色体遗传疾病
在一些方面,待通过本文公开的方法和/或组合物治疗或预防的常染色体遗传病症是显性常染色体遗传病症。因此,在一些方面,野生型基因突变变体是显性变体,并且表达显性变体的细胞被靶向以抑制或减少野生型基因显性变体的表达。
显性常染色体遗传是某些遗传性疾病的遗传特征。“常染色体遗传”是指相关基因位于其中一条编号染色体上或非性染色体上。“显性”表示突变基因的单拷贝(来自父母之一)足以引起疾病。换句话说,显性是染色体上基因的一个变体(等位基因)(即显性变体)掩盖或覆盖另一染色体拷贝上相同基因的不同变体(即,隐性变体)的作用。
患有显性常染色体遗传疾病的人的孩子有50%的机率通过遗传显性等位基因而患有该疾病。举例来说,如果父母一方患有显性常染色体遗传疾病,因此是杂合子(Aa),而另一方父母不患病且是纯合子(aa),则50%的后代将有机率1)接受一个显性等位基因,导致杂合(Aa)状态并患有该疾病,或者2)接受两个隐性等位基因,导致纯合(aa)状态并且不患该疾病。如果父母均为杂合子并患有该疾病,则75%的后代有机率遗传显性等位基因并患有该疾病。如果父母之一是纯合子(即AA)并患有该疾病,则所有后代都可有机率遗传显性等位基因并患有该疾病。相比之下,隐性常染色体遗传疾病需要两个突变基因拷贝(父母各一份)才能导致该疾病。显性常染色体遗传疾病涉及常染色体或非性染色体,因此对男性和女性的影响相同。
已知与显性常染色体(AD)疾病相关的基因突变会导致功能丧失或获得。在一些方面,功能丧失的突变沿着蛋白序列均匀分布,而功能获得的突变位于关键区域。虽然显性遗传很常见,但由于父母性腺或发育中胎儿的零星突变,显性病况可能会在一个家庭内偶发或从头发生。事实上,许多显性常染色体遗传疾病突变是从头出现的,或者是在家族中在患病个体中是首次出现的。这些从头的突变不是遗传自父母的。
显性常染色体遗传疾病可以通过其外显率来表征,外显率是通过遗传疾病等位基因并表现出疾病表型的个体的百分比来衡量的。所有遗传了疾病等位基因的个体可能不会表现出疾病表型(外显率降低);然而,他们仍然可以传递等位基因并生出患病孩子。具有较高外显率的显性常染色体遗传疾病导致更多个体表现出遗传了疾病等位基因的表型。此外,当年龄是该疾病的一个因素时(即,它仅在成年期才显现),如果正在评估的个体年龄还不足以表现出表型,那么家族史可能不会占主导地位。显性常染色体遗传疾病的早期识别对于降低发病率和死亡率非常重要。
本公开的组合物和方法可以治疗或预防的显性常染色体遗传病症的实例包括但不限于软骨发育不全(achondroplasia)、急性间歇性卟啉症(acute intermittentporphyria)、抗凝血酶III缺乏症、BRCA1/BRCA2阳性乳腺癌、巨颌症(cherubism)、显性失明(例如,Leber先天性黑内障、视网膜色素变性、Stargardt样黄斑营养不良、静止性夜盲症、玻璃体视网膜脉络膜病变)、显性先天性耳聋、Ehlers-Danlos综合征、家族性腺瘤性息肉病、吉尔伯特病(Gilbert’s disease)、遗传性出血性毛细血管扩张症、遗传性椭圆形细胞增多症、遗传性球形红细胞增多症、前裂无脑畸形(holoproencephaly)、亨廷顿病、高胆固醇血症、特发性甲状旁腺功能减退症、肠息肉病、大理石骨病(marble bone disease)、马凡氏综合征(Marfan’s syndrome)、强直性肌营养不良、神经纤维瘤病、成骨不全、多囊肾病、蛋白C缺乏症、视网膜色素变性、视网膜母细胞瘤、特雷彻柯林斯综合征(Treacher Collinssyndrome)、结节性硬化症和冯·维勒布兰德氏病(Von Willebrand’s disease)。
1.视网膜色素变性
在一些具体的方面,常染色体遗传病症是显性常染色体遗传病症。在一些具体的方面,显性常染色体遗传病症是显性失明病症。在一些具体的方面,显性常染色体遗传性疾病是显性失明病症,并且显性失明病症是视网膜色素变性。视网膜色素变性是一组导致进行性视力丧失的相关眼部疾病。这些疾病会影响视网膜,即眼后部的光敏感组织层。视网膜色素变性是最常见的视网膜遗传性疾病(视网膜病)之一。据估计,在美国和欧洲,每3,500至4,000人中就有1人患有该疾病。在一些方面,治疗或预防视网膜色素变性包括治疗或预防视网膜色素变性的一种或多种症状。在患有视网膜色素变性的人中,视力丧失随着视网膜光感受细胞逐渐退化而发生。视网膜色素变性的首个症状通常是夜间视力丧失,这在儿童时期变得明显。夜视问题可能会导致在弱光下难以确定位置和方向。随后,这种疾病会导致侧面(周边)视力出现盲点。随着时间的推移,这些盲点融合产生视野狭窄。这种疾病会持续数年或数十年,影响中央视力,而中央视力是阅读、驾驶和识别面孔等精细任务所必需的。成年后,许多视网膜色素变性患者变为法律上的失明。视网膜色素变性的体征和症状通常仅限于视力丧失。当疾病单独发生时,它被描述为非综合征性的。
与视网膜色素变性相关的基因在视网膜中特殊光感受器细胞(光感受器)的结构和功能中发挥着重要作用。视网膜包含两种类型的光感受器:视杆细胞和视锥细胞。视杆细胞负责弱光下的视觉,而视锥细胞则负责亮光下的视觉,包括色觉。任何导致视网膜色素变性的基因突变都会导致视网膜中视杆细胞和视锥细胞逐渐丧失。这些细胞的进行性退化导致视网膜色素变性患者出现特征性的视力丧失模式。视杆细胞通常先于视锥细胞破裂,这就是为什么夜视障碍通常是这种疾病的首个迹象。由于视杆细胞和视锥细胞均丧失,日间视力随后受到干扰。
可以选择用于根据本公开的组合物和方法的基因KI治疗或从基因KI治疗中排除的与视网膜色素变性相关的各种基因的核苷酸以及蛋白、多肽和肽序列包括ABCA4、BEST1、C2ORF71、C8ORF37、CLRN1、CRB1、CRX、PDE6B、PRPH2、RHO、RP2、RPE65、RPGR、USH2A、WDR19、CA4、CERKL、CNGA1、CNGB1、DHDDS、EYS、FAM161A、FSCN2、GUCA1B、IDH3B、IMPDH1、IMPG2、KLHL7、LRAT、MAK、MERTK、MT-TS2、NR2E3、NRL、OFD1、PCARE、PDE6A、PDE6G、PRCD、PROM1、PRPF3、PRPF31、PRPF8、PRPF31、RBP3、RDH12、RGR、RLBP1、ROM1、RP1、RP9、SAG、SEMA4A、SNRNP200、SPATA7、TOPORS、TTC8、TULP1和ZNF513。这些基因中的任何一种或多种的突变变体可以被选择用于根据本公开的组合物和方法的基因KI治疗或从基因KI治疗中排除。
在一些具体的方面,内源RHO基因从野生型突变而来并且被选择用于根据本公开的组合物和方法的基因KI治疗。突变的变体RHO基因编码序列可以衍生自由NCBI基因ID:6010提供的野生型人RHO基因核苷酸和氨基酸编码序列,对应于GenBank登录号AB065668,其通过引用整体并入本文,并在下文以SEQ ID NO:1和2提供:
GGGGATTAATATGATTATGAACACCCCCAATCTCCCAGATGCTGATTCAGCCAGGAGCTTAGGAGGGGGAGGTCACTTTATAAGGGTCTGGGGGGGTCAGAACCCAGAGTCATCCAGCTGGAGCCCTGAGTGGCTGAGCTCAGGCCTTCGCAGCATTCTTGGGTGGGAGCAGCCACGGGTCAGCCACAAGGGCCACAGCCATGAATGGCACAGAAGGCCCTAACTTCTACGTGCCCTTCTCCAATGCGACGGGTGTGGTACGCAGCCCCTTCGAGTACCCACAGTACTACCTGGCTGAGCCATGGCAGTTCTCCATGCTGGCCGCCTACATGTTTCTGCTGATCGTGCTGGGCTTCCCCATCAACTTCCTCACGCTCTACGTCACCGTCCAGCACAAGAAGCTGCGCACGCCTCTCAACTACATCCTGCTCAACCTAGCCGTGGCTGACCTCTTCATGGTCCTAGGTGGCTTCACCAGCACCCTCTACACCTCTCTGCATGGATACTTCGTCTTCGGGCCCACAGGATGCAATTTGGAGGGCTTCTTTGCCACCCTGGGCGGTATGAGCCGGGTGTGGGTGGGGTGTGCAGGAGCCCGGGAGCATGGAGGGGTCTGGGAGAGTCCCGGGCTTGGCGGTGGTGGCTGAGAGGCCTTCTCCCTTCTCCTGTCCTGTCAATGTTATCCAAAGCCCTCATATATTCAGTCAACAAACACCATTCATGGTGATAGCCGGGCTGCTGTTTGTGCAGGGCTGGCACTGAACACTGCCTTGATCTTATTTGGAGCAATATGCGCTTGTCTAATTTCACAGCAAGAAAACTGAGCTGAGGCTCAAAGAAGTCAAGCGCCCTGCTGGGGCGTCACACAGGGACGGGTGCAGAGTTGAGTTGGAAGCCCGCATCTATCTCGGGCCATGTTTGCAGCACCAAGCCTCTGTTTCCCTTGGAGCAGCTGTGCTGAGTCAGACCCAGGCTGGGCACTGAGGGAGAGCTGGGCAAGCCAGACCCCTCCTCTCTGGGGGCCCAAGCTCAGGGTGGGAAGTGGATTTTCCATTCTCCAGTCATTGGGTCTTCCCTGTGCTGGGCAATGGGCTCGGTCCCCTCTGGCATCCTCTGCCTCCCCTCTCAGCCCCTGTCCTCAGGTGCCCCTCCAGCCTCCCTGCCGCGTTCCAAGTCTCCTGGTGTTGAGAACCGCAAGCAGCCGCTCTGAAGCAGTTCCTTTTTGCTTTAGAATAATGTCTTGCATTTAACAGGAAAACAGATGGGGTGCTGCAGGGATAACAGATCCCACTTAACAGAGAGGAAAACTGAGGCAGGGAGAGGGGAAGAGACTCATTTAGGGATGTGGCCAGGCAGCAACAAGAGCCTAGGTCTCCTGGCTGTGATCCAGGAATATCTCTGCTGAGATGCAGGAGGAGACGCTAGAAGCAGCCATTGCAAAGCTGGGTGACGGGGAGAGCTTACCGCCAGCCACAAGCGTCTCTCTGCCAGCCTTGCCCTGTCTCCCCCATGTCCAGGCTGCTGCCTCGGTCCCATTCTCAGGGAATCTCTGGCCATTGTTGGGTGTTTGTTGCATTCAATAATCACAGATCACTCAGTTCTGGCCAGAAGGTGGGTGTGCCACTTACGGGTGGTTGTTCTCTGCAGGGTCAGTCCCAGTTTACAAATATTGTCCCTTTCACTGTTAGGAATGTCCCAGTTTGGTTGATTAACTATATGGCCACTCTCCCTATGGAACTTCATGGGGTGGTGAGCAGGACAGATGTCTGAATTCCATCATTTCCTTCTTCTTCCTCTGGGCAAAACATTGCACATTGCTTCATGGCTCCTAGGAGAGGCCCCCACATGTCCGGGTTATTTCATTTCCCGAGAAGGGAGAGGGAGGAAGGACTGCCAATTCTGGGTTTCCACCACCTCTGCATTCCTTCCCAACAAGGAACTCTGCCCCACATTAGGATGCATTCTTCTGCTAAACACACACACACACACACACACACACAACACACACACACACACACACACACACACACACACAAAACTCCCTACCGGGTTCCCAGTTCAATCCTGACCCCCTGATCTGATTCGTGTCCCTTATGGGCCCAGAGCGCTAAGCAAATAACTTCCCCCATTCCCTGGAATTTCTTTGCCCAGCTCTCCTCAGCGTGTGGTCCCTCTGCCCCTTCCCCCTCCTCCCAGCACCAAGCTCTCTCCTTCCCCAAGGCCTCCTCAAATCCCTCTCCCACTCCTGGTTGCCTTCCTAGCTACCCTCTCCCTGTCTAGGGGGGAGTGCACCCTCCTTAGGCAGTGGGGTCTGTGCTGACCGCCTGCTGACTGCCTTGCAGGTGAAATTGCCCTGTGGTCCTTGGTGGTCCTGGCCATCGAGCGGTACGTGGTGGTGTGTAAGCCCATGAGCAACTTCCGCTTCGGGGAGAACCATGCCATCATGGGCGTTGCCTTCACCTGGGTCATGGCGCTGGCCTGCGCCGCACCCCCACTCGCCGGCTGGTCCAGGTAATGGCACTGAGCAGAAGGGAAGAAGCTCCGGGGGCTCTTTGTAGGGTCCTCCAGTCAGGACTCAAACCCAGTAGTGTCTGGTTCCAGGCACTGACCTTGTATGTCTCCTGGCCCAAATGCCCACTCAGGGTAGGGGTGTAGGGCAGAAGAAGAAACAGACTCTAATGTTGCTACAAGGGCTGGTCCCATCTCCTGAGCCCCATGTCAAACAGAATCCAAGACATCCCAACCCTTCACCTTGGCTGTGCCCCTAATCCTCAACTAAGCTAGGCGCAAATTCCAATCCTCTTTGGTCTAGTACCCCGGGGGCAGCCCCCTCTAACCTTGGGCCTCAGCAGCAGGGGAGGCCACACCTTCCTAGTGCAGGTGGCCATATTGTGGCCCCTTGGAACTGGGTCCCACTCAGCCTCTAGGCGATTGTCTCCTAATGGGGCTGAGATGAGACACAGTGGGGACAGTGGTTTGGACAATAGGACTGGTGACTCTGGTCCCCAGAGGCCTCATGTCCCTCTGTCTCCAGAAAATTCCCACTCTCACTTCCCTTTCCTCCTCAGTCTTGCTAGGGTCCATTTCTTACCCCTTGCTGAATTTGAGCCCACCCCCTGGACTTTTTCCCCATCTTCTCCAATCTGGCCTAGTTCTATCCTCTGGAAGCAGAGCCGCTGGACGCTCTGGGTTTCCTGAGGCCCGTCCACTGTCACCAATATCAGGAACCATTGCCACGTCCTAATGACGTGCGCTGGAAGCCTCTAGTTTCCAGAAGCTGCACAAAGATCCCTTAGATACTCTGTGTGTCCATCTTTGGCCTGGAAAATACTCTCACCCTGGGGCTAGGAAGACCTCGGTTTGTACAAACTTCCTCAAATGCAGAGCCTGAGGGCTCTCCCCACCTCCTCACCAACCCTCTGCGTGGCATAGCCCTAGCCTCAGCGGGCAGTGGATGCTGGGGCTGGGCATGCAGGGAGAGGCTGGGTGGTGTCATCTGGTAACGCAGCCACCAAACAATGAAGCGACACTGATTCCACAAGGTGCATCTGCATCCCCATCTGATCCATTCCATCCTGTCACCCAGCCATGCAGACGTTTATGATCCCCTTTTCCAGGGAGGGAATGTGAAGCCCCAGAAAGGGCCAGCGCTCGGCAGCCACCTTGGCTGTTCCCAAGTCCCTCACAGGCAGGGTCTCCCTACCTGCCTGTCCTCAGGTACATCCCCGAGGGCCTGCAGTGCTCGTGTGGAATCGACTACTACACGCTCAAGCCGGAGGTCAACAACGAGTCTTTTGTCATCTACATGTTCGTGGTCCACTTCACCATCCCCATGATTATCATCTTTTTCTGCTATGGGCAGCTCGTCTTCACCGTCAAGGAGGTACGGGCCGGGGGGTGGGCGGCCTCACGGCTCTGAGGGTCCAGCCCCCAGCATGCATCTGCGGCTCCTGCTCCCTGGAGGAGCCATGGTCTGGACCCGGGTCCCGTGTCCTGCAGGCCGCTGCCCAGCAGCAGGAGTCAGCCACCACACAGAAGGCAGAGAAGGAGGTCACCCGCATGGTCATCATCATGGTCATCGCTTTCCTGATCTGCTGGGTGCCCTACGCCAGCGTGGCATTCTACATCTTCACCCACCAGGGCTCCAACTTCGGTCCCATCTTCATGACCATCCCAGCGTTCTTTGCCAAGAGCGCCGCCATCTACAACCCTGTCATCTATATCATGATGAACAAGCAGGTGCCTACTGCGGGTGGGAGGGCCCCAGTGCCCCAGGCCACAGGCGCTGCCTGCCAAGGACAAGCTACTTCCCAGGGCAGGGGAGGGGGCTCCATCAGGGTTACTGGCAGCAGTCTTGGGTCAGCAGTCCCAATGGGGAGTGTGTGAGAAATGCAGATTCCTGGCCCCACTCAGAACTGCTGAATCTCAGGGTGGGCCCAGGAACCTGCATTTCCAGCAAGCCCTCCACAGGTGGCTCAGATGCTCACTCAGGTGGGAGAAGCTCCAGTCAGCTAGTTCTGGAAGCCCAATGTCAAAGTCAGAAGGACCCAAGTCGGGAATGGGATGGGCCAGTCTCCATAAAGCTGAATAAGGAGCTAAAAAGTCTTATTCTGAGGGGTAAAGGGGTAAAGGGTTCCTCGGAGAGGTACCTCCGAGGGGTAAACAGTTGGGTAAACAGTCTCTGAAGTCAGCTCTGCCATTTTCTAGCTGTATGGCCCTGGGCAAGTCAATTTCCTTCTCTGTGCTTTGGTTTCCTCATCCATAGAAAGGTAGAAAGGGCAAAACACCAAACTCTTGGATTACAAGAGATAATTTACAGAACACCCTTGGCACACAGAGGGCACCATGAAATGTCACGGGTGACACAGCCCCCTTGTGCTCAGTCCCTGGCATCTCTAGGGGTGAGGAGCGTCTGCCTAGCAGGTTCCCTCCAGGAAGCTGGATTTGAGTGGATGGGGCGCTGGAATCGTGAGGGGCAGAAGCAGGCAAAGGGTCGGGGCGAACCTCACTAACGTGCCAGTTCCAAGCACACTGTGGGCAGCCCTGGCCCTGACTCAAGCCTCTTGCCTTCCAGTTCCGGAACTGCATGCTCACCACCATCTGCTGCGGCAAGAACCCACTGGGTGACGATGAGGCCTCTGCTACCGTGTCCAAGACGGAGACGAGCCAGGTGGCCCCGGCCTAAGACCTGCCTAGGACTCTGTGGCCGACTATAGGCGTCTCCCATCCCCTACACCTTCCCCCAGCCACAGCCATCCCACCAGGAGCAGCGCCTGTGCAGAATGAACGAAGTCACATAGGCTCCTTAATTTTTTTTTTTTTTTTAAGAAATAATTAATGAGGCTCCTCACTCACCTGGGACAGCCTGAGAAGGGACATCCACCA(SEQID NO:1)
MNGTEGPNFYVPFSNATGVVRSPFEYPQYYLAEPWQFSMLAAYMFLLIVLGFPINFLTLYVTVQHKKLRTPLNYILLNLAVADLFMVLGGFTSTLYTSLHGYFVFGPTGCNLEGFFATLGGEIALWSLVVLAIERYVVVCKPMSNFRFGENHAIMGVAFTWVMALACAAPPLAGWSRYIPEGLQCSCGIDYYTLKPEVNNESFVIYMFVVHFTIPMIIIFFCYGQLVFTVKEAAAQQQESATTQKAEKEVTRMVIIMVIAFLICWVPYASVAFYIFTHQGSNFGPIFMTIPAFFAKSAAIYNPVIYIMMNKQFRNCMLTTICCGKNPLGDDEASATVSKTETSQVAPA(SEQ ID NO:2)。
本发明的多肽、蛋白或编码此类多肽或蛋白的多核苷酸可包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50(或其中的任何可形成的范围)或更多个变体氨基酸或核苷酸取代,或与SEQ ID NO:1或2的至少或至多3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、300、400、500、550、1000或更多个连续氨基酸或核苷酸或其中的任何可形成的范围具有至少60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%(或其中的任何可形成的范围)的相似性、同一性或同源性。
在一些方面,根据本公开的组合物和方法的基因KI治疗所靶向的内源RHO基因的显性突变相对于对应于人野生型RHO基因的SEQ ID NO:2包含以下突变中的一种或多种:P23H、P347L、G51V和/或T58R。在一些具体的方面,内源RHO基因的显性突变相对于对应于人野生型RHO基因的SEQ ID NO:2包含P23H。在一些具体的方面,内源RHO基因的显性突变相对于对应于人野生型RHO基因的SEQ ID NO:2包含P347L。在一些具体的方面,内源RHO基因的显性突变相对于对应于人野生型RHO基因的SEQ ID NO:2包含G51V。在特定的方面,内源RHO基因的显性突变相对于对应于人野生型RHO基因的SEQ ID NO:2包含T58R。
B.隐性常染色体遗传疾病
在一些方面,要通过本文公开的方法和/或组合物治疗或预防的常染色体遗传病症是隐性常染色体遗传病症。因此,在一些方面,野生型基因突变变体是隐性变体,并且表达隐性变体的细胞被靶向以抑制或减少野生型基因隐性变体的表达。
隐性常染色体遗传是某些遗传性疾病的特征性遗传模式。“常染色体遗传”意指相关基因位于其中一条编号的染色体上或非性染色体上。“隐性”意指需要两个拷贝的突变基因(父母各一个)以导致所述疾病。这些疾病通常由两个携带者传递。携带者的健康很少受到影响,但他们具有一个改变的基因(隐性基因)和一个未受影响的基因(显性基因)。两个携带者有25%的机率生出具有两个未受影响基因的未患病孩子,有50%的机率生出也是携带者的未患病孩子,还有25%的机率生出具有两个隐性的被改变基因的患病孩子。隐性常染色体遗传疾病涉及常染色体或非性染色体,因此对男性和女性的影响相同。
可以根据本发明的组合物和方法治疗或预防的隐性常染色体遗传疾病的实例包括但不限于眼皮肤白化病(oculocutaneous albinism)、黑酸尿症(alkaptonuria)、巴特综合征(Bartter’s syndrome)、囊性纤维化、地方性甲状腺肿克汀病(endemic goitrouscretinism)、家族性黑蒙性白痴(familial amaurotic idiocy)、半乳糖血症、戈谢病(Gaucher’s disease)、糖原贮积病、苯丙酮尿症、威尔逊病(Wilson’s disease)、镰状细胞病、泰-萨克斯病(Tay-Sachs disease)和色素性干皮病(xeroderma pigmentosa)。
C.野生型基因的突变变体
可以被选择用于根据本公开的组合物和方法的基因KI治疗或从基因KI治疗中排除的与常染色体疾病相关的各种基因的核苷酸以及蛋白、多肽和肽序列已经被公开,并且可以在公认的计算机化数据库中找到。两个常用的数据库是National Center forBiotechnology Information’s Genbank and GenPept databases(在World Wide Web上,网址为ncbi.nlm.nih.gov/)和The Universal Protein Resource(UniProt;在World WideWeb上,网址为uniprot.org)。这些基因的编码区可以使用本文公开的技术或如本领域普通技术人员已知的技术来扩增和/或表达。
1.多肽
可以被选择用于根据本公开的组合物和方法的基因KI治疗或从基因KI治疗中排除的与常染色体疾病相关的各种基因的核苷酸以及蛋白、多肽和肽序列可以包含至少、至多、等于1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50或更多个(或其中的任何可形成的范围)或介于任意两者之间个数的变体氨基酸取代、插入或缺失,或与野生型氨基酸序列(例如,野生型基因的突变变体的野生型基因编码序列)的至少、至多、等于3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、300、400、500、550、1000或更多个或介于任意两者之间个数的连续氨基酸或其中形成的任意范围具有至少、至多、等于60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%(或其中的任何可形成的范围)或介于任意两者之间百分数的相似性、同一性或同源性。
以下讨论了改变蛋白的氨基酸亚基以产生变体多肽或肽。此类变化可能在体内自发发生,导致野生型基因突变变体。例如,蛋白或多肽序列中的某些氨基酸可以被替换为其他氨基酸,而没有丧失或没有明显丧失与结构(例如底物分子上的结合位点)的相互作用的结合能力。由于蛋白的相互作用能力和性质决定了该蛋白的功能活性,因此可以在蛋白序列及其相应的DNA编码序列中进行某些氨基酸取代,并产生具有相似或不同特性的蛋白。因此,本发明人预期,可以对编码蛋白的基因的DNA序列进行各种改变,而没有丧失或没有明显丧失其生物效用或活性。
本文使用的术语“功能等同密码子”是指编码相同氨基酸的密码子,例如精氨酸的六种不同密码子。还考虑“中性取代”或“中性突变”,其指编码生物等效氨基酸的一个或多个密码子的改变。
本公开的氨基酸序列变体可以是取代变体、插入变体或缺失变体。与野生型相比,本公开多肽的变异可以影响蛋白或多肽的至少、至多、等于1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多个或介于任意两者之间个数的非连续或连续氨基酸。变体可以包含与本文提供或提到的任何序列具有至少、至多、等于50%、60%、70%、80%或90%或介于任意两者之间的百分数(包括其间的所有值和范围)的同一性的氨基酸序列。变体可包括至少、至多、等于2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多个或介于任意两者之间个数的取代氨基酸。
还应当理解,氨基酸和核酸序列可以分别包括额外的残基,例如额外的N-或C-末端氨基酸,或者5’或3’序列,并且仍然与本文公开的任一序列所示的基本相同,只要该序列满足上述标准,包括在涉及蛋白表达的情况下维持生物蛋白活性。末端序列的添加特别适用于核酸序列,该核酸序列可包括例如编码区5′或3′部分侧翼的多种非编码序列。
缺失变体通常缺乏天然或野生型蛋白的一个或多个残基。可以删除单个残基,或者可以删除多个连续的氨基酸。可以将终止密码子引入(通过取代或插入)到编码核酸序列中以产生截短的蛋白。
插入突变体通常涉及在多肽的非末端点位添加氨基酸残基。这可以包括插入一个或多个氨基酸残基。还可以产生末端添加并且可以包括融合蛋白,所述融合蛋白是本文描述或提到的一个或多个肽或多肽的多聚体或多联体。
取代变体通常在蛋白或多肽内的一个或多个位点处含有一种氨基酸与另一种氨基酸的交换,并且可以经设计而调控多肽的一种或多种性质,同时丧失或不丧失其他功能或性质。取代可以是保守的,即,一种氨基酸被另一种相似化学性质的氨基酸所取代。“保守氨基酸取代”可以涉及一个氨基酸类别中的成员与该类别中的另一个成员之间的交换。保守取代是本领域众所周知的,并且包括例如以下变化:丙氨酸变为丝氨酸;精氨酸变为赖氨酸;天冬酰胺变为谷氨酰胺或组氨酸;天冬氨酸变为谷氨酸;半胱氨酸变为丝氨酸;谷氨酰胺变为天冬酰胺;谷氨酸变为天冬氨酸;甘氨酸变为脯氨酸;组氨酸变为天冬酰胺或谷氨酰胺;异亮氨酸变为亮氨酸或缬氨酸;亮氨酸变为缬氨酸或异亮氨酸;赖氨酸变为精氨酸;甲硫氨酸变为亮氨酸或异亮氨酸;苯丙氨酸变为酪氨酸、亮氨酸或甲硫氨酸;丝氨酸变为苏氨酸;苏氨酸变为丝氨酸;色氨酸变为酪氨酸;酪氨酸变为色氨酸或苯丙氨酸;和缬氨酸变为异亮氨酸或亮氨酸。保守氨基酸取代可涵盖非天然存在的氨基酸残基,其通常通过化学肽合成而不是通过生物系统中的合成来掺入。这些包括肽模拟物或氨基酸部分的其他反向或倒置形式。
或者,取代可以是“非保守的”,使得多肽的功能或活性受到影响。非保守变化通常涉及氨基酸残基被在化学上不同的另一氨基酸残基取代,例如用极性或带电氨基酸取代非极性或不带电氨基酸,反之亦然。非保守取代可以涉及将一个氨基酸类别的中的成员交换为另一类别的成员。
本领域技术人员可以使用熟知的技术确定本文所述的多肽的变体。另外,本领域技术人员可以阅读结构-功能研究,鉴定类似多肽或蛋白中对活性或结构重要的残基。鉴于这样的比较,人们可以预测蛋白中与对类似蛋白的活性或结构重要的氨基酸残基相对应的氨基酸残基的重要性。本文公开的任何一种或多种改变可以修饰内源基因编码序列,以产生野生型基因编码序列的突变变体。
2.核酸
可以选择用于根据本公开的组合物和方法的基因KI治疗或从基因KI治疗中排除的与常染色体遗传病症相关的各种基因的蛋白、多肽和肽序列可以包括至少、至多、等于1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个(或其中的任何可形成的范围)或更多个或介于任意两者之间个数的变体核苷酸取代、插入或缺失,或与野生型核苷酸序列(例如,野生型基因突变变体的野生型基因编码序列)的至少、至多、等于3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、300、400、500、550、1000或更多个或介于任意两者之间个数的连续氨基酸或其中可形成的任意范围具有至少、至多、等于60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%(或其中的任何可形成的范围)或介于任意两者之间百分数的相似性、同一性或同源性。
在某些方面,核酸序列可以以多种情况存在,例如分离的片段和所引入序列的重组载体或编码抗体的一条或两条链或其片段、衍生物、突变蛋白或变体的重组多核苷酸,编码嵌合多肽的多核苷酸,编码嵌合抗原受体的多核苷酸,编码免疫细胞衔接子的多核苷酸,足以用作杂交探针、PCR引物或测序引物以鉴定、分析、突变或扩增编码多肽的多核苷酸的多核苷酸,用于抑制多核苷酸表达的反义核酸,和本文所述的互补序列。还提供了编码可插入基因的突变变体上游的其野生型编码序列的核酸,以及用于转导或转化细胞的核酸,促进编码可插入具基因的突变变体上游的其野生型编码序列的此类核酸的插入。核酸可以是单链或双链的,并且可以包含RNA和/或DNA核苷酸及其人工变体(例如肽核酸)。
在某些方面,多核苷酸变体与本文公开的野生型序列具有基本同一性;包含使用本文所述的方法(例如,使用标准参数的BLAST分析)而与本文提供的多核苷酸序列相比,至少、至多、等于70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%(包括其间的所有值和范围)或介于任意两者之间百分数的同一性的那些。在某些方面,分离的多核苷酸将包含编码在序列的整个长度上与本文所述的野生型氨基酸序列具有至少90%、优选95%或高达100%同一性的多肽的核苷酸序列。
无论编码序列本身的长度如何,核酸片段可以与其他核酸序列组合,所述其他核酸序列是例如启动子、聚腺苷酸化信号、额外的限制性酶位点、多克隆位点、其他编码片段等,使得它们的总长度可能有大的变化。核酸可以是任何长度。它们的长度可以是,例如,至少、至多、等于5、10、15、20、25、30、35、40、45、50、75、100、125、175、200、250、300、350、400、450、500、750、1000、1500、3000、5000或更多个或介于任意两者之间个数的核苷酸,和/或可以包含一个或多个另外的序列,例如调控序列,和/或可以是较大核酸的一部分,例如载体的一部分。因此预期可以采用几乎任何长度的核酸片段,其中总长度优选地受到制备的容易性和在预期的重组核酸方案中的使用的限制。在一些情况下,核酸序列可以编码具有额外的异源编码序列的多肽序列,例如以允许多肽的纯化、运输、分泌、翻译后修饰,或用于治疗益处,例如靶向或功效。如上所述,可以将标签或其他异源多肽添加到修饰的多肽编码序列中,其中“异源”是指与修饰的多肽不同的多肽。
可以通过突变将变化引入核酸中,从而导致其编码的多肽(例如,野生型基因的突变变体)的氨基酸序列的变化。突变可以在体内自发引入或者可以使用本领域已知的任何技术在体外引入。在一个方面,使用例如定点诱变方案改变一个或多个特定氨基酸残基。在另一个方面,使用例如随机诱变方案改变一个或多个随机选择的残基。无论它是如何产生的,都可以表达突变体多肽并筛选所需的特性。
可以将突变引入核酸中,显著改变或不显著改变其编码的多肽的生物活性。例如,可以进行核苷酸取代,导致非必需氨基酸残基处的氨基酸取代。或者,可以将一个或多个突变引入核酸中,选择性地改变其编码的多肽的生物活性。参见例如Romain Studer等人,Biochem.J.449:581-594(2013)。例如,突变可以定量或定性地改变生物活性。定量变化的示例包括增加、减少或消除活性。定性变化的示例包括改变蛋白的结合特异性。
III.载体
编码可被插入其内源突变变体上游的基因野生型编码序列的外源核酸,以及用于转导或转化细胞以促进编码可被插入其突变变体上游的基因野生型编码序列的此类外源核酸的插入的核酸,可以通过任何合适的载体,包括通过病毒载体或通过非病毒载体,被递送至受体细胞。术语“载体”包括当与适当的控制元件结合时能够复制的任何基因元件(例如,质粒、转座子、粘粒、人工染色体、病毒载体等)。病毒载体的实例至少包括逆转录病毒、慢病毒、腺病毒或腺相关病毒载体。非病毒载体的实例至少包括质粒、转座子、脂质、纳米颗粒、脂质纳米颗粒等。
在一些方面,载体是人工染色体。人工染色体是一种基因工程化染色体,其可用作携带大的DNA插入物的载体。在一些方面,人工染色体是人类人工染色体(HAC)(参见例如Kouprina等人,Expert Opin.Drug Deliv11(4):517-535,2014;Basu等人,Pediatr.Clin.North Am.53:843-853,2006;Ren等人,Stem.Cell Rev.2(l):43-50,2006;Kazuki等人,Mol.Ther.19(9):1591-1601,2011;Kazuki等人,Gen.Ther.18:384-393,2011;和Katoh等人,Biochem.Biophys.Res.Commun.321:280-290,2004)。在一些方面,载体是酵母人工染色体(YAC)(参见例如Murray等人,Nature 305:189-193,1983;Ikeno等人(1998)Nat.Biotech.16:431-439,1998)。在一些方面,载体是细菌人工染色体(BAC)(例如,pBeloBAC11、pECBAC1和pBAC108L)。在一些方面,载体是PI衍生的人工染色体(PAC)。人工染色体的示例是本领域已知的。在一些方面,载体是病毒载体(例如,腺相关病毒、腺病毒、慢病毒和逆转录病毒)。本文描述了病毒载体的非限制性实例。在一些方面,载体是腺相关病毒载体(AAV)(参见例如Asokan等人,Mol.Ther.20:699-7080,2012)。
重组AAV载体通常至少由转基因或其部分和调控序列以及任选的5’和3’AAV反向末端重复(ITR)组成。将这样的重组AAV载体包装到衣壳中并递送至选定的靶细胞。载体的AAV序列通常包含顺式作用5’和3’ITR序列(参见,例如,B.J.Carter,in“Handbook ofParvoviruses,”ed.,P.Tijsser,CRC Press,pp.155 168,1990)。典型的AAV ITR序列长度为约145个核苷酸。在一些方面,至少75%的典型ITR序列(例如,至少80%、至少85%、至少90%或至少95%)并入AAV载体中。修饰这些ITR序列的能力在本领域技术范围内(参见例如文本Sambrook等人,"Molecular Cloning.A Laboratory Manual,”2d ed.,Cold SpringHarbor Laboratory,New York,1989;和K.Fisher等人,J Virol.70:520 532,1996)。在一些方面,在AAV载体中,本文所述的任何编码序列的侧翼是5’和3’AAV ITR序列。AAV ITR序列可以从任何已知的AAV获得,包括目前鉴定的AAV类型。本文所述的AAV载体可以包括本文所述的任何调控元件(例如,启动子、polyA序列和IRES中的一种或多种)。在一些方面,AAV载体是AAV1载体、AAV2载体、AAV3载体、AAV4载体、AAV5载体、AAV6载体、AAV7载体、AAV8载体、AAV9载体、AAV2.7m8载体、AAV8BP2载体和AAV293载体。可用于本文的其他示例性AAV载体是本领域已知的。参见例如Kanaan等人,Mol.Ther.Nucleic Acids 8:184-197,2017;Li等人,Mol.Ther.16(7):1252-1260;Adachi等人,Nat.Commun.5:3075,2014;Isgrig等人,Nat.Commun.10(1):427,2019;和Gao等人,J.Virol.78(12):6381-6388。
本文提供的载体可以具有不同的大小。用于本文描述的任何组合物、试剂盒和方法中的载体的选择可取决于载体的大小。
在一些方面,载体是质粒,并且可以包括至多约1kb、至多约2kb、至多约3kb、至多约4kb、至多约5kb、至多约6kb、至多约7kb、至多约8kb、至多约9kb、至多约10kb、至多约11kb、至多约12kb、至多约13kb、至多约14kb或至多约15kb的总长度。在一些方面,载体是质粒,并且可以具有在约1kb至约2kb、约1kb至约3kb、约1kb至约4kb、约1kb至约5kb、约1kb至约6kb、约1kb至约7kb、约1kb至约8kb、约1kb至约9kb、约1kb至约10kb、约1kb至约11kb、约1kb至约12kb、约1kb至约13kb、约1kb至约14kb或约1kb至约15kb范围内的总长度。
在一些方面,载体是病毒载体,并且可以具有至多10kb的核苷酸总数。在一些方面,病毒载体可具有约1kb至约2kb、约1kb至约3kb、约1kb至约4kb、约1kb至约5kb、约1kb至约6kb、约1kb至约7kb、约1kb至约8kb、约1kb至约9kb、约1kb至约10kb、约2kb至约3kb、约2kb至约4kb、约2kb至约5kb、约2kb至约6kb、约2kb至约7kb、约2kb至约8kb、约2kb至约9kb、约2kb至约10kb、约3kb至约4kb、约3kb至约5kb、约3kb至约6kb、约3kb至约7kb、约3kb至约8kb、约3kb至约9kb、约3kb至约10kb、约4kb至约5kb、约4kb至约6kb、约4kb至约7kb、约4kb至约8kb、约4kb至约9kb、约4kb至约10kb、约5kb至约6kb、约5kb至约7kb、约5kb至约8kb、约5kb至约9kb、约5kb至约10kb、约6kb至约7kb、约6kb至约8kb、约6kb至约9kb、约6kb至约10kb、约7kb至约8kb、约7kb至约9kb、约7kb至约10kb、约8kb至约9kb、约8kb至约10kb或约9kb至约10kb范围内的核苷酸总数。
在一些方面,载体是腺相关病毒(AAV载体),并且可以包括至多10kb的核苷酸总数。在一些方面,AAV载体可包含约1kb至约2kb、约1kb至约3kb、约1kb至约4kb、约1kb至约5kb、约1kb至约6kb、约1kb至约7kb、约1kb至约8kb、约1kb至约9kb、约1kb至约10kb、约2kb至约3kb、约2kb至约4kb、约2kb至约5kb、约2kb至约6kb、约2kb至约7kb、约2kb至约8kb、约2kb至约9kb、约2kb至约10kb、约3kb至约4kb、约3kb至约5kb、约3kb至约6kb、约3kb至约7kb、约3kb至约8kb、约3kb约9kb、约3kb至约10kb、约4kb至约5kb、约4kb至约6kb、约4kb至约7kb、约4kb至约8kb、约4kb至约9kb、约4kb至约10kb、约5kb至约6kb、约5kb至约7kb、约5kb至约8kb、约5kb至约9kb、约5kb至约10kb、约6kb至约7kb、约6kb至约8kb、约6kb至约9kb、约6kb至约10kb、约7kb至约8kb、约7kb至约9kb、约7kb至约10kb、约8kb至约9kb、约8kb至约10kb、或约9kb至约10kb范围内的核苷酸总数。。
在一些方面,载体是腺相关病毒(AAV载体),并且包含与SEQ ID NO:31-36具有至少、至多、恰好80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%或99.9%或介于任意两者之间百分数的序列同一性的核苷酸序列。
在一些方面,编码可被插入其内源突变变体上游的基因的野生型编码序列的外源核酸,以及用于转导或转化细胞以促进编码可被插入其内源突变变体上游的基因的野生型编码序列的外源核酸的插入的核酸,可以通过脂质纳米颗粒递送至受体细胞。在一些具体的方面,脂质和外源核酸可以共同形成纳米颗粒,从而产生包含脂质的含有外源核酸的纳米颗粒。脂质可以以脂质纳米颗粒(LNP)的形式封装外源核酸或与外源核酸结合,以帮助外源核酸/脂质纳米颗粒的稳定性、进入细胞和细胞内释放。LNP可包含例如胶束、固体脂质纳米颗粒、纳米乳液、脂质体等或其组合。LNP的脂质组分可包括例如阳离子脂质、磷脂(例如不饱和脂质,例如DOPE或DSPC)、聚合物-脂质缀合物(例如聚乙二醇化脂质)、结构脂质(例如、胆固醇)、可电离脂质、中性脂质或其任意组合。脂质组分的元件可以以特定的级分提供。本领域熟知合适的阳离子脂质、磷脂、聚合物-脂质缀合物、结构脂质、可电离脂质和中性脂质以及针对本公开的组合物和方法提供这些脂质的具体级分。除了这些脂质组分之外,脂质纳米颗粒可以包括可用于药物组合物的任何物质。例如,脂质纳米颗粒可以包括一种或多种药学上可接受的赋形剂或辅助成分,例如但不限于一种或多种溶剂、分散介质、稀释剂、分散助剂、悬浮助剂、表面活性剂、缓冲剂、防腐剂以及其他物质。
本公开的LNP、LNP悬浮液、冻干LNP组合物或LNP制剂的化学性质可以通过多种方法表征。例如,显微镜术(例如,透射电子显微镜术或扫描电子显微镜术)可用于检查LNP的形态和大小分布。动态光散射或电位测定法(例如,电位滴定)可用于测量zeta电位。动态光散射也可用于确定颗粒大小。Zetasizer Nano ZS(Malvern Instruments Ltd,Malvern,Worcestershire,UK)等仪器也可用于测量LNP的多种特性,例如粒径、多分散指数和zeta电位。
本文提供了可用于本文所述的任何组合物和方法的示例性载体。可使用本领域已知的多种不同方法将本文公开的任何载体引入细胞中。用于将核酸引入哺乳动物细胞的方法的非限制性实例包括脂转染、转染(例如,磷酸钙转染、使用高度支化的有机化合物的转染、使用阳离子聚合物的转染、基于树枝状聚合物的转染、光学转染、基于颗粒的转染)(例如,纳米颗粒转染)或使用脂质体(例如,阳离子脂质体)的转染、转导、显微注射、电穿孔、细胞挤压、声穿孔、原生质体融合、刺穿(impalefection)、流体动力学递送、基因枪、磁转染、病毒转染和核转染。
在其中用编码外源核酸(所述外源核酸编码可被插入其内源突变变体上游的基因野生型编码序列)的载体转导细胞并且还需要将另一个基因或多个基因转导至细胞中(例如基因编辑技术和/或可选择标记)的情况下,核酸和基因编辑技术可以包含或可以不包含在同一载体上或使用同一载体。在一些情况下,核酸、基因编辑技术(或其元件,例如Cas蛋白或引导RNA分子)和/或选择标记由相同的载体分子(例如相同的病毒载体分子)表达。在此类情况下,核酸、基因编辑技术(或其元件,例如Cas蛋白或引导RNA分子)和/或选择标记的表达可以由或可以不由相同的调控元件调控。当核酸、基因编辑技术(或其元件,例如Cas蛋白或引导RNA分子)和/或选择标记位于同一载体上时,它们可以或可以不表达为单独的多肽。在它们表达为单独的多肽的情况下,作为示例,它们可以在载体上通过2A元件或IRES元件被分开(或者两种类型可以在同一载体上使用一次或多次)。
A.一般方面
本领域技术人员将有能力通过标准重组技术构建载体(参见例如,Sambrook等人,2001和Ausubel等人,1996,两者均通过引用整体并入本文)以用于表达本公开的病毒蛋白和/或抗原受体。载体可包含控制序列,包括转录起始序列、转录终止序列、启动子序列、增强子序列、RNA剪接序列、聚腺苷酸化(polyA)序列、Kozak共有序列、非翻译区、或选择或筛选标记。根据本公开的一些方面,任何一个或多个前述序列可以包括在载体中。在一些方面,任何一个或多个前述序列可以从载体中排除。
1.调控元件
在可用于本公开的载体中包含的表达盒特别含有(以5′至3′方向)有效连接至蛋白编码序列的真核转录启动子、包括间插序列的剪接信号、以及转录终止/多腺苷酸化序列。控制真核细胞中蛋白编码基因转录的启动子和增强子可由多个遗传元件组成。细胞机器能够收集和整合每个元件传递的调控信息,从而允许不同的基因进化出不同的且通常复杂的转录调控模式。在本公开的上下文中使用的启动子包括例如组成型启动子、诱导型启动子和组织特异性启动子。
2.启动子/增强子
本文提供的表达盒包含驱动病毒蛋白和/或抗原受体和其他顺反子基因产物表达的启动子。启动子包含了通常作用是定位RNA合成起始位点的序列。这样的序列的最熟知的示例是TATA盒,但在一些缺乏TATA盒的启动子中,例如哺乳动物末端脱氧核苷酸转移酶基因的启动子和SV40晚期基因的启动子,覆盖起始位点本身的离散元件有助于固定起始位置。额外的启动子元件调控转录起始的频率。通常,它们位于起始位点上游的区域中,尽管许多启动子已被证明也包含起始位点下游的功能元件。为了将编码序列置于启动子的“控制之下”,将转录阅读框的转录起始位点的5’端置于所选启动子的“下游”(即,3’)。“上游”启动子刺激DNA转录并促进表达编码RNA。
启动子元件之间的间隔通常是灵活的,因此当元件倒置或相对移动时,启动子功能得以保留。例如,在tk启动子中,在活性开始下降之前,启动子元件之间的间隔可以增加至50bp。根据启动子,各元件可以协同或独立地发挥作用来激活转录。启动子可以与或可以不与“增强子”结合使用,“增强子”是指参与核酸序列转录激活的顺式作用调控序列。
启动子可以是与核酸序列天然相关的启动子,如可以通过分离位于编码片段和/或外显子上游的5′非编码序列来获得。这样的启动子可以被称为“内源的”。类似地,增强子可以是与核酸序列天然相关联的增强子,位于该序列的下游或上游。或者,通过将编码核酸片段置于重组或异源启动子的控制下将获得某些优点,所述重组或异源启动子是指通常不与其天然环境中的核酸序列相关联的启动子。重组或异源增强子还指通常不与其天然环境中的核酸序列相关的增强子。此类启动子或增强子可以包括其他基因的启动子或增强子、从任何其他病毒或原核或真核细胞分离的启动子或增强子、以及非“天然存在的”(即含有不同转录调控区的不同元件和/或改变表达的突变)的启动子或增强子。例如,重组DNA构建中最常用的启动子包括β-内酰胺酶(青霉素酶)、乳糖和色氨酸(trp-)启动子系统。除了合成产生启动子和增强子的核酸序列之外,还可以结合本文公开的组合物使用重组克隆和/或核酸扩增技术(包括PCR)来产生序列。此外,预期也可以使用引导非核细胞器例如线粒体、叶绿体等内的序列转录和/或表达的控制序列。
自然,重要的是采用有效引导DNA片段在选择用于表达的细胞器、细胞类型、组织、器官或生物体中表达的启动子和/或增强子。分子生物学领域的技术人员通常知晓启动子、增强子和细胞类型组合用于蛋白表达的用途(参见,例如,Sambrook等人1989,其全部内容通过引用并入本文)。所采用的启动子可以是组成型的、组织特异性的、诱导型的和/或在适当的条件下有用的,以引导引入的DNA片段的高水平表达,例如有利于重组蛋白和/或肽的大规模生产。启动子可以是异源的或内源的。
另外,任何启动子/增强子组合(根据例如真核启动子数据库EPDB,通过万维网epd.isb-sib.ch/)也可用于驱动表达。使用T3、T7或SP6细胞质表达系统是另一个可能的方面。如果提供适当的细菌聚合酶,真核细胞可以支持某些细菌启动子的细胞质转录,无论是作为递送复合物的一部分还是作为额外的基因表达构建体。
启动子的非限制性实例包括早期或晚期病毒启动子,例如RNA聚合酶III启动子(例如U6)、SV40早期或晚期启动子、巨细胞病毒(CMV)即早期启动子、劳斯肉瘤病毒(RSV)早期启动子;真核细胞启动子,例如β肌动蛋白启动子、GADPH启动子、金属硫蛋白启动子;以及串联反应元件启动子,例如环AMP反应元件启动子(cre)、血清反应元件启动子(sre)、佛波酯启动子(TPA)和靠近最小TATA盒的反应元件启动子(tre)。还可以使用人生长激素启动子序列(例如,中描述的人生长激素最小启动子,登录号X05244,核苷酸283-341)或小鼠乳腺肿瘤启动子(可从ATCC获得,目录号ATCC 45007)。在某些方面,启动子是CMVIE、dectin-1、dectin-2、人CD11c、F4/80、SM22、RSV、SV40、Ad MLP、β-肌动蛋白、MHC I类或MHC II类启动子,然而任何其他可用于驱动治疗基因表达的启动子适用于本公开的实践。在特定的方面,启动子是U6。
在一些具体的方面,启动子是组织特异性启动子。示例性的组织特异性启动子包括但不限于以下启动子:肝特异性甲状腺素结合球蛋白(TBG)启动子、胰岛素启动子、胰高血糖素启动子、生长抑素启动子、胰多肽(PPY)启动子、突触蛋白-1(Syn)启动子、肌酸激酶(MCK)启动子、哺乳动物结蛋白(DES)启动子、α-肌球蛋白重链(a-MHC)启动子和心脏肌钙蛋白T(cTnT)启动子。另外的示例性启动子包括β-肌动蛋白启动子、乙型肝炎病毒核心启动子、甲胎蛋白(AFP)启动子、骨骨钙蛋白启动子;骨唾液蛋白启动子、CD2启动子;免疫球蛋白重链启动子;T细胞受体α链启动子、神经元如神经元特异性烯醇化酶(NSE)启动子、神经丝轻链基因启动子和神经元特异性vgf基因启动子。在特定的方面,组织特异性启动子是视网膜特异性启动子。在特定的方面,组织特异性启动子是人视紫红质激酶1启动子(hRK),其长度为292个碱基对并且对视杆和视锥光感受器具有活性和特异性。预期用于本文公开的载体中的其他组织特异性启动子包括VE-钙粘蛋白/钙粘蛋白5(CDH5)/CD144启动子、人卵黄状黄斑营养不良(Human vitelliform macular dystrophy)/黄斑病蛋白(Bestrophin)1启动子、与视锥转导蛋白α启动子融合的hIRBP增强子以及人红视蛋白启动子,然而,可用于驱动治疗基因表达的任何其他启动子是适用于本公开实践的视网膜。
在某些方面,本公开的方法还涉及增强子序列,即增加启动子活性并且具有顺式作用潜力的核酸序列,无论其方向如何,甚至在相对长的距离(与靶启动子距离长达数千个碱基)。然而,增强子功能不一定限于如此长的距离,因为它们也可以靠近给定启动子发挥作用。
3.Poly(A)序列
在一些方面,本文提供的任何载体可以包括poly(A)序列。大多数新生真核mRNA在其3’端具有poly(A)尾,该poly(A)尾是在一个复杂过程中添加的,该复杂过程包括初级转录物的切割和偶联的聚腺苷酸化反应(参见,例如,Proudfoot等人,Cell 108:501-512,2002)。poly(A)尾赋予了mRNA稳定性和可转移性(Molecular Biology of the Cell,ThirdEdition by B.Alberts等人,Garland Publishing,1994)。在一些方面,poly(A)序列位于编码野生型基因的外源核酸序列的3’。
如本文所用,“聚腺苷酸化”是指聚腺苷酸部分或其修饰变体与信使RNA分子的共价连接。在真核生物中,大多数信使RNA(mRNA)分子在3’端被聚腺苷酸化。3’poly(A)尾是通过聚腺苷酸聚合酶的作用添加至前mRNA的长的腺嘌呤核苷酸序列(例如,50、60、70、100、200、500、1000、2000、3000、4000或5000)。在高等真核生物中,poly(A)尾被添加到包含特定序列、聚腺苷酸化信号或“poly(A)序列”的转录物上。Poly(A)尾和与其结合的蛋白有助于保护mRNA免遭核酸外切酶降解。
多腺苷酸化对于转录终止、mRNA从细胞核输出和翻译也很重要。在DNA转录成RNA后,紧接着在细胞核中发生多聚腺苷酸化,但也可能稍后发生在细胞质中。转录终止后,mRNA链通过结合有RNA聚合酶的核酸内切酶复合物的作用而被切割。切割位点的一般特点是切割位点附近存在碱基序列AAUAAA。mRNA被切割后,腺苷残基被添加至切割位点的游离3’端。
如本文所用,“poly(A)序列”是触发mRNA的核酸内切酶切割并向被切割的mRNA的3’端添加一系列腺苷的序列。有多种Poly(A)序列可供使用,包括衍生自牛生长激素(bgh)、小鼠-P-珠蛋白、小鼠-a-珠蛋白、人胶原蛋白、多瘤病毒、单纯疱疹病毒胸苷激酶基因(HSVTK)、IgG重链基因聚腺苷酸化信号、人生长激素(hGH)或SV40 Poly(A)位点如SV40晚期和早期Poly(A)位点的Poly(A)序列。poly(A)序列可以是AATAAA序列。AATAAA序列可以被与AATAAA具有同源性且能够发出多腺苷酸化信号的其他六核苷酸序列取代,包括ATTAAA、AGTAAA、CATAAA、TATAAA、GATAAA、ACTAAA、AATATA、AAGAAA、AATAAT、AAAAAA、AATGAA、AATCAA、AACAAA、AATCAA、AATAAC、AATAGA、AATTAA或AATAAG。
4.起始信号和连接表达
具体的起始信号也可用于本公开提供的表达构建体中以有效翻译编码序列。这些信号包括ATG起始密码子或相邻序列。可能需要提供包括ATG起始密码子在内的外源翻译控制信号。Kozak共有序列(“Kozak共有”或“Kozak序列”)是一核酸基序,其在大多数真核生物mRNA转录物中充当蛋白翻译起始元件。该序列定义为5’-gccgccRccAUGG-3’(SEQ ID NO:3),其中下划线的核苷酸表示翻译起始密码子,编码甲硫氨酸;大写字母表示高度保守的碱基,例如“AUGG”序列;“R”表示在该位置观察到嘌呤(腺嘌呤或鸟嘌呤);小写字母表示碱基可能会发生变化的位置处的最常见的碱基。本领域普通技术人员将能够容易地确定蛋白翻译起始元件的适当序列并提供必要的信号。熟知的是,内源基因编码序列的起始密码子必须与目标编码序列的阅读框“位于框内”,以确保整个插入物的翻译。外源翻译控制信号和起始密码子可以是天然的或合成的,并且在一些方面,外源翻译控制元件可以与内源编码序列的阅读框“位于框外”。表达效率可以通过包含适当的转录增强子元件来增强。
在某些方面,使用内部核糖体进入位点(IRES)元件来产生多基因或多顺反子信息。IRES元件能够绕过5’甲基化帽依赖性翻译的核糖体扫描模型并在内部位点开始翻译。本领域技术人员已知多种IRES序列,包括来自例如口蹄疫病毒(FMDV)、脑心肌炎病毒(EMCV)、人鼻病毒(HRV)、蟋蟀麻痹病毒、人免疫缺陷病毒(HIV)、甲型肝炎病毒(HAV)、丙型肝炎病毒(HCV)和脊髓灰质炎病毒(PV)的那些IRES序列。IRES元件可以连接至异源开放阅读框。多个开放阅读框可以一起被转录,每个开放阅读框由IRES分隔,从而产生多顺反子信息。凭借IRES元件,核糖体可以访问每个开放阅读框以进行高效翻译。使用单个启动子/增强子转录单个信息可以有效表达多个基因。
如本文别处所详述,某些2A序列元件可用于在本公开提供的构建体中产生基因的连接表达或共表达。例如,切割序列可用于通过连接开放阅读框形成单个顺反子来共表达基因。示例性切割序列有马甲型鼻炎病毒(E2A)或F2A(口蹄疫病毒2A)或“2A样”序列(例如,明脉扁刺蛾(Thosea asigna)病毒2A;T2A)或猪捷申病毒-1(P2A)。在一些具体的方面,在单个载体中,多个2A序列是不相同的,尽管在一些替代方面,同一载体利用两个或更多个相同的2A序列。2A序列的实例在US2011/0065779中提供,其通过引用整体并入本文。
5.复制起点
为了在宿主细胞中繁殖载体,载体可以含有一个或多个复制位点起点(通常称为“ori”),它是复制启动位置处的特定核酸序列,例如对应于如上所述的EBV的oriP或具有类似或增强的编程功能的基因工程化oriP的核酸序列。或者,可以采用如上所述的其他染色体外复制病毒的复制起点或自主复制序列(ARS)。
6.非翻译区域(UTR)
在一些方面,所描述的任何载体可以包括非翻译区。在一些方面,载体可以包括5’UTR或3’UTR。基因的非翻译区(UTR)被转录但不被翻译。5’UTR从转录起始位点开始,一直延续至转录起始元件和起始密码子,但不包括起始密码子。3’UTR紧接着终止密码子开始,一直延续至转录终止信号。UTR的调控特征可以并入本文所述的任何载体、组合物、试剂盒或方法中。
天然5’UTR包含在翻译起始中发挥作用的序列。它们具有类似于Kozak序列的特征,公知的是这些特征参与核糖体启动许多基因翻译的过程。例如,在一些方面,5’UTR包含在本文描述的任何载体中。5’UTR的非限制性实例包括来自以下基因的5’UTR:白蛋白、血清淀粉样蛋白A、载脂蛋白A/B/E、转铁蛋白、甲胎蛋白、促红细胞生成素和因子VIII,可用于增强核酸分子如mRNA的表达。在一些方面,来自由细胞转录的mRNA的5’UTR可包含在本文所述的任何载体、组合物、试剂盒和方法中。
已知3’UTR具有嵌入其中的腺苷和尿苷的片段。这些富含AU的特征在高周转率的基因中尤其普遍。已知大多数与富含AU的元件结合的蛋白会使信使不稳定,而ELAV家族的成员,尤其是HuR,已被证明可以增加mRNA的稳定性。HuR与所有三种类别的ARE结合。
在本文所述的任何组合物的一些方面,5’UTR、3’UTR或两者包含在载体(例如,本文所述的任何载体)中。例如,本文描述的任何5’UTR可以有效连接至本文所述的任何编码序列中的起始密码子。例如,任何3’UTR可以有效连接至本文所述的任何编码序列中的3’-末端密码子(最后一个密码子)。
在其他方面,非UTR序列可以并入5’或3’UTR中。在一些方面,内含子或内含子序列的部分可以并入本文提供的任何载体、组合物、试剂盒和方法中的多核苷酸的侧翼区域中。内含子序列的并入可以增加蛋白产量以及mRNA水平。
7.选择和筛选标记
在一些方面,包含编码可被插入其内源突变变体上游的基因的野生型编码序列的外源核酸,或用于转导或转化细胞以促进编码可被插入其内源突变变体上游的基因的野生型编码序列的此类外源核酸的插入的核酸的本公开的细胞,可通过在表达载体中包含标记来在体外或体内鉴定。此类标记将赋予细胞可鉴定的变化,从而允许容易地鉴定含有表达载体的细胞。通常来说,选择标记是赋予允许选择的特性的标记。正选择标记是该标记的存在允许其被选择的标记,而负选择标记是该标记的存在阻止其被选择的标记。正选择标记的示例是耐药性标记。
通常,药物选择标记有助于转化子的克隆和鉴定,例如,赋予新霉素、嘌呤霉素、潮霉素、DHFR、GPT、博来霉素(zeocin)和组氨醇抗性的基因是可用的选择标记。除了赋予允许基于施加的条件来区分转化子的表型的标记之外,还可考虑其他类型的标记,包括筛选标记,例如基于比色分析的GFP和mCherry。或者,可以利用可筛选酶作为负选择标记,例如单纯疱疹病毒胸苷激酶(tk)或氯霉素乙酰转移酶(CAT)。本领域技术人员还知晓如何使用免疫标记,可能与FACS分析结合。所使用的标记并不重要,只要它能够与编码基因产物的核酸同时表达即可。选择和筛选标记的其他实例是本领域技术人员熟知的。
本文提供的任何载体可以任选地包括编码报告蛋白的序列(“报告序列”)。报告序列的非限制性实例包括编码以下的DNA序列:β-内酰胺酶、β-半乳糖苷酶(LacZ)、碱性磷酸酶、胸苷激酶、绿色荧光蛋白(GFP)、红色荧光蛋白、mCherry荧光蛋白、黄色荧光蛋白、氯霉素乙酰转移酶(CAT)和荧光素酶。报告序列的其他示例是本领域已知的。当与驱动其表达的调控元件结合时,报告序列可以提供可通过常规手段检测的信号,所述常规手段包括酶促、放射照相、比色、荧光或其他光谱测定;荧光激活细胞分选(FACS)测定;免疫学测定(例如,酶联免疫吸附测定(ELISA)、放射免疫测定(RIA)和免疫组织化学)。
B.多顺反子载体
在特定的方面,编码可被插入其内源突变变体上游的基因的野生型编码序列的外源核酸,或用于转导或转化细胞以促进编码可被插入其内源突变变体上游的基因野生型编码序列的此类外源核酸的插入的核酸,由多顺反子载体表达(本文使用的术语“顺反子”是指可以从中产生基因产物的核酸序列)。在特定的方面,多顺反子载体编码核酸、基因编辑技术(或其元件)和/或选择标记。在一些情况下,多顺反子载体编码至少一种编码可被插入其内源突变变体上游的基因的野生型编码序列的外源核酸和基因编辑技术的一种或多种元件(例如,Cas蛋白或引导RNA分子)。在一些情况下,多顺反子载体编码至少一种编码可被插入其内源突变变体上游的基因的野生型编码序列的外源核酸、基因编辑技术的一种或多种元件(例如,Cas蛋白或引导RNA分子)和选择标记。
在某些方面,本公开提供了一种灵活的、模块化的系统(本文所用的术语“模块化”是指允许其互换性的顺反子或顺反子的组件,例如分别通过移出和替换整个顺反子或顺反子的组件,例如通过使用标准重组技术),其利用具有以基本相同水平表达多个顺反子的能力的多顺反子载体。该系统可用于允许多个基因的组合表达(包括过表达)的细胞工程化。在一些具体的方面,由载体表达的一个或多个基因包括可被插入其内源突变变体上游的基因的一个、两个或更多个外源野生型编码序列,以及基因编辑技术的一个或多个元件(例如,Cas蛋白和/或引导RNA分子)。载体还可包含一个或多个选择标记或报告子,例如荧光或酶促报告子(例如,GFP、mCherry),例如用于细胞测定和动物成像。
在一些具体的情况下,载体可包含至少1、2、3、4或更多个顺反子,它们由任何类型的切割位点(例如2A切割位点)分隔。载体可以是或可以不是基于腺病毒相关病毒(AAV)的,包括3′和5′ITR和pAAVrep/Cap 2/2、2/8、2/7m8。载体可包含1、2、3、4或更多个顺反子,其具有1、2、3或更多个2A切割位点和多个ORF用于基因交换。该系统允许侧翼为限制性位点(以便通过亚克隆快速整合)的多个基因的组合过表达,并且在一些方面,该系统还至少包括2A自切割位点。因此,该系统允许表达编码可被插入其内源突变变体上游的基因的外源野生型编码序列的多个核酸、基因编辑技术的一个或多个元件(例如Cas蛋白或引导RNA分子)和选择标记。该系统还可以应用于其他病毒和非病毒载体,包括但不限于慢病毒以及非病毒质粒。
本公开的多个方面涵盖了利用多顺反子载体的系统,其中该载体的至少一部分是模块化的,例如通过允许移除和替换一个或多个顺反子(或一个或多个顺反子的一个或多个组件),例如通过利用一个或多个限制性酶位点(其序列和位置经过专门选择),以促进载体的模块化使用。在一些方面,该载体还具有其中多个顺反子被翻译成单个多肽并被加工成单独的多肽,从而赋予了载体以基本上等摩尔浓度表达单独的基因产物的优点。
本公开的载体被配置为模块化以能够改变载体的一个或多个顺反子和/或改变一个或多个特定顺反子的一个或多个组件。载体可被设计为利用位于一个或多个顺反子末端侧翼和/或位于特定顺反子的一个或多个组件末端侧翼的独特限制性酶位点。
本公开的多个方面包括多顺反子载体,其包含至少一个、至少两个、至少三个或至少四个顺反子,每个顺反子的侧翼为一个或多个限制性酶位点,其中至少一个顺反子编码至少一个基因外源野生型编码序列、基因编辑技术的一个或多个元件(例如,Cas蛋白或引导RNA分子)以及选择标记。在一些情况下,两个、三个、四个或更多个顺反子被翻译成单个多肽并被切割成多个单独的多肽,而在其他情况下,多个顺反子被翻译成单个多肽并被切割成多个单独的多肽。载体上的相邻顺反子可以被自切割位点(例如2A自切割位点)分隔。在一些情况下,每个顺反子表达来自该载体的单独的多肽。在特定情况下,载体上的相邻顺反子由IRES元件分隔。
在某些方面,本公开提供了一种用于进行细胞工程化以允许多个顺反子的组合表达(包括过度表达)的系统,例如,所述顺反子可以包括一个、两个或更多个基因外源野生型编码序列、基因编辑技术的一个或多个元件(例如Cas蛋白或引导RNA分子)和选择标记。在一些具体的方面,使用本文所述的多顺反子载体允许该载体从相同mRNA产生等摩尔水平的多个基因产物。多个基因可以包括但不限于基因的野生型编码序列、基因编辑技术的一个或多个元件(例如Cas蛋白或引导RNA分子)、选择标记等。
在一些具体的方面,载体是病毒载体(例如,逆转录病毒载体、慢病毒载体、腺病毒载体或腺相关病毒载体)或非病毒载体。当在载体中使用2A切割位点时,2A切割位点可包含P2A、T2A、E2A和/或F2A位点。限制性酶位点可以是任何类型,并且可以在其识别位点中包括任何数量的碱基,例如4至8个碱基;识别位点中的碱基数目可以是至少4、5、6、7、8或更多个。切割时的位点可以产生平端切割或粘性末端。限制性酶可以是例如I型、II型、III型或IV型的限制性酶。限制性酶位点可以从可用的数据库获得,例如Integrated relationalEnzyme数据库(IntEnz)或BRENDA(The Comprehensive Enzyme Information System)。
在利用自切割2A肽的一些方面中,2A肽可以是18-22个氨基酸(aa)长的病毒寡肽,其在真核细胞翻译期间介导多肽的“切割”。名称“2A”指的是病毒基因组的特定区域,不同的病毒2A通常以其来源的病毒命名。第一个发现的2A是F2A(口蹄疫病毒),之后还鉴定了E2A(马甲型鼻炎病毒)、P2A(猪捷申病毒-1 2A)和T2A(明脉扁刺蛾病毒2A)。发现2A介导的“自切割”机制是核糖体跳过了在2A的C末端处形成甘氨酰-脯氨酰肽键。
IV.细胞的基因编辑
在一些具体的方面,对包含编码可被插入其突变变体上游的基因的野生型编码序列的外源核酸的细胞进行基因编辑,以修饰细胞中一种或多种内源基因的表达。在特定情况下,细胞被修饰以降低一种或多种内源基因的表达水平,包括抑制一种或多种内源基因的表达(可称为敲除)。此类细胞可以扩增也可以不扩增。
在一些方面,核酸被单独引入或作为工程化构建体的一部分经由稳定的病毒载体引入,在其他方面,多核苷酸可以通过电穿孔引入以用于mRNA的瞬时表达,所述mRNA将在细胞内翻译成蛋白,并且在其他方面,可以使用基因编辑技术(包括但不限于CRISPR、TALEN、锌指和/或逆转录子等)通过敲入方法引入多核苷酸。敲入方法可以将多核苷酸引入特定的有利基因组位置和/或在适当的条件下引入,以引导高水平表达或抑制表达内源基因。敲入方法可以利用CRISPR/Cas9介导的不依赖于同源性的靶向整合,这描述于例如Suzuki K.等人(2016).Nature 540:144-149中,其全部内容通过引用并入本文。
在一些具体的情况下,细胞的一种或多种内源基因被修饰,例如表达被破坏(表达被部分或全部降低)。在一些具体的情况下,使用本公开的方法敲低或敲除一个或多个基因。在一些具体的情况下,多个基因被敲低或敲除,这可以发生在所述多个基因生产的同一步骤中或者可以不发生在所述多个基因生产的同一步骤中。在一些具体的情况下,使用本公开的方法敲入一个或多个基因;一个或多个基因的敲入可以导致一个或多个内源基因的敲低或敲除。在一些具体的情况下,有多个基因被敲入,这可以发生在所述多个基因生产的同一步骤中或者可以不发生在所述多个基因生产的同一步骤中。
在细胞内或细胞外编辑的基因可以是任何种类的基因,但在一些具体的方面,这些基因是其基因产物与显性常染色体遗传病症相关的基因,例如一个实例是RHO。
A.DNA结合核酸
在一些方面,使用DNA结合核酸进行基因编辑,例如通过RNA引导的核酸内切酶(RGEN)或逆转录子文库重组工程进行改变。
1.CRISPR/Cas
在一些方面,可以使用成簇规则间隔短回文重复序列(CRISPR)和CRISPR相关(Cas)蛋白进行基因编辑;在一些方面,使用的是CpF1而非Cas9。一般而言,“CRISPR系统”统指参与CRISPR相关(“Cas”)基因的表达或引导其活性的转录物和其他元件,包括编码Cas基因的序列、tracr(反式激活CRISPR)序列(例如,tracrRNA或活性部分tracrRNA)、tracr配对序列(在内源CRISPR系统的情况下涵盖了“同向重复序列(direct repeat)”和经tracrRNA处理的部分同向重复序列)、引导序列(在内源CRISPR系统的情况下也称为“间隔区”)和/或来自CRISPR基因座的其他序列和转录物。
CRISPR/Cas核酸酶或CRISPR/Cas核酸酶系统可以包括非编码RNA分子(引导)RNA,其序列特异性地结合DNA,以及具有核酸酶功能(例如,两个核酸酶结构域)的Cas蛋白(例如,Cas9)。CRISPR系统的一个或多个元件可以源自I型、II型或III型CRISPR系统,例如源自包含内源CRISPR系统的特定生物体,例如酿脓链球菌。
在一些方面,将Cas核酸酶和gRNA(包括对靶序列特异的crRNA和固定的tracrRNA的融合物)引入细胞中。一般而言,gRNA 5’端的靶位点使用互补碱基配对将Cas核酸酶靶向至靶位点,例如基因。靶位点可以基于其位置紧靠原型间隔子相邻基序(PAM)序列(例如典型的NGG或NAG)5′来选择。在这方面,通过对应于靶DNA序列来修饰引导RNA的前20、19、18、17、16、15、14、14、12、11或10个核苷酸,将gRNA靶向至目标序列。一般来说,CRISPR系统的特征在于促进在靶序列位点处形成CRISPR复合物的元件。通常,“靶序列”一般是指引导序列被设计为与其具有互补性的序列,其中靶序列与引导序列之间的杂交促进了CRISPR复合物的形成。不必要求完全互补,只要互补性足以引起杂交并促进CRISPR复合物的形成即可。
CRISPR系统可以在靶位点处诱导双链断裂(DSB),随后是破坏或改变,如本文所讨论。在其他方面,Cas9变体被视为“切口酶”,用于在靶位点处对单链进行切口。可以使用配对的切口酶,例如用以提高特异性,每个切口酶由一对不同的gRNA靶向序列引导,使得在引入切口的同时时也引入5’悬突。在其他方面,催化失活的Cas9与异源效应结构域例如转录阻遏物或激活物融合,以影响基因表达。
靶序列可包含任何多核苷酸,例如DNA或RNA多核苷酸。靶序列可以位于细胞的细胞核或细胞质中,例如细胞的细胞器内。一般而言,可用于重组至包含靶序列的靶向基因座中的序列或模板被称为“编辑模板”或“编辑多核苷酸”或“编辑序列”。在一些方面,外源模板多核苷酸可以称为编辑模板。在一些方面,重组是同源重组。
通常,在内源CRISPR系统的背景下,CRISPR复合物(包括与靶序列杂交并与一个或多个Cas蛋白复合的引导序列)的形成导致在靶序列中或接近靶序列(例如距离1、2、3、4、5、6、7、8、9、10、20、50或更多个碱基对内)的一条或两条链的切割。tracr序列,其可以包含野生型tracr序列的全部或部分(例如,野生型tracr序列的约或多于约20、26、32、45、48、54、63、67、85或更多个核苷酸)或由以上组成,也可以形成CRISPR复合物的一部分,例如通过沿着tracr序列的至少一部分与有效连接至引导序列的tracr配对序列的全部或一部分杂交。tracr序列与tracr配对序列(tracr mate sequence)具有足够的互补性以杂交并参与CRISPR复合物的形成,例如在最佳比对时沿着tracr配对序列的长度具有至少50%、60%、70%、80%、90%、95%或99%的序列互补性。
可以将驱动CRISPR系统的一种或多种元件表达的一种或多种载体引入细胞中,使得CRISPR系统的元件的表达引导CRISPR复合物在一个或多个靶位点处的形成。组分也可以作为蛋白和/或RNA被递送至细胞。例如,Cas酶、连接至tracr配对序列的引导序列和tracr序列可以各自有效连接至单独载体上的单独调控元件。或者,由相同或不同调控元件表达的两个或更多个元件可以组合在单个载体中,其中一个或多个另外的载体提供未包括在第一载体中的CRISPR系统的任何组件。载体可包含一个或多个插入位点,例如限制性核酸内切酶识别序列(也称为“克隆位点”)。在一些方面,一个或多个插入位点位于一种或多种载体的一种或多种序列元件的上游和/或下游。当使用多个不同的引导序列时,可以使用单个表达构建体将CRISPR活性靶向细胞内多个不同的相应靶序列。
载体可以包含与编码CRISPR酶(例如Cas蛋白)的酶编码序列有效连接的调控元件。Cas蛋白的非限制性实例包括Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csfl、Csf2、Csf3、Csf4、Cpf1(Cas12a)、其同源物或其修饰版本。这些酶是已知的;例如,酿脓链球菌Cas9蛋白的氨基酸序列可以在SwissProt数据库中以登录号Q99ZW2找到。
CRISPR酶可以是Cas9(例如,来自酿脓链球菌或肺炎链球菌)。在某些情况下,Cpf1(Cas12a)可以代替Cas9用作核酸内切酶。CRISPR酶可以在靶序列的位置处,例如在靶序列内和/或在靶序列的互补物内,引导一条链或两条链的切割。载体可编码相对于相应野生型酶为突变的CRISPR酶,使得突变的CRISPR酶缺乏切割含有靶序列的靶多核苷酸的一条或两条链的能力。例如,来自酿脓链球菌的Cas9的RuvC I催化结构域中的天冬氨酸至丙氨酸取代(D10A)将Cas9从切割两条链的核酸酶转化为切口酶(切割单链)。在一些方面,Cas9切口酶可以与一个或多个引导序列(例如两个引导序列,分别靶向DNA靶标的有义链和反义链)组合使用。该组合允许两条链都被切口,并用于诱导非同源末端连接(NHEJ)或同源引导修复(HDR)或不依赖于同源性的靶向整合(HITI)。
在一些方面,编码CRISPR酶的酶编码序列经密码子优化以在特定细胞(例如真核细胞)中表达。真核细胞可以是特定生物体的细胞或衍生自特定生物体的细胞,所述特定生物体例如是哺乳动物,包括但不限于人、小鼠、大鼠、兔、狗或非人灵长类动物。一般而言,密码子优化是指通过将天然序列的至少一个密码子替换为该宿主细胞基因中更频繁或最频繁使用的密码子而同时保持天然氨基酸序列来修饰核酸序列,以增强在目标宿主细胞中的表达的过程。不同的物种对特定氨基酸的某些密码子表现出特定的偏好。密码子偏好(生物体之间密码子使用的差异)通常与信使RNA(mRNA)的翻译效率相关,而信使RNA(mRNA)的翻译效率又被认为取决于被翻译密码子的特性以及特定转移RNA(tRNA)分子的可用性等。细胞中所选tRNA的优势通常反映了肽合成中最常用的密码子。因此,可以基于密码子优化来定制基因以在给定生物体中实现最佳基因表达。
一般而言,引导序列是与靶多核苷酸序列具有足够互补性以与靶序列杂交并引导CRISPR复合物与靶序列的序列特异性结合的任何多核苷酸序列。在一些方面,当使用合适的比对算法进行最佳比对时,引导序列与其对应靶序列之间的互补程度为约或大于约50%、60%、75%、80%、85%、90%、95%、97%、99%或更高。
最佳比对可以使用任何合适的用于比对序列的算法来确定,其非限制性实例包括Smith-Waterman算法、Needleman-Wunsch算法、基于Burrows-Wheeler Transform的算法(例如Burrows Wheeler Aligner)、Clustal W、Clustal X、BLAT、Novoalign(NovocraftTechnologies)、ELAND(Illumina,San Diego,Calif.)、SOAP(可从soap.genomics.org.cn获得)和Maq(可从maq.sourceforge.net获得)。
CRISPR酶可以是包含一个或多个异源蛋白结构域的融合蛋白的一部分。CRISPR酶融合蛋白可包含任何额外的蛋白序列,和任选的任何两个结构域之间的接头序列。可以与CRISPR酶融合的蛋白结构域的实例包括但不限于表位标签、报告基因序列和具有一种或多种以下活性的蛋白结构域:甲基化酶活性、去甲基化酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性和核酸结合活性。表位标签的非限制性实例包括组氨酸(His)标签、V5标签、FLAG标签、流感血凝素(HA)标签、Myc标签、VSV-G标签和硫氧还蛋白(Trx)标签。报告基因的实例包括但不限于谷胱甘肽-5-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)β半乳糖苷酶、β-葡萄糖醛酸酶、荧光素酶、绿色荧光蛋白(GFP)、HcRed、DsRed、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)和自发荧光蛋白,包括蓝色荧光蛋白(BFP)。CRISPR酶可以融合至编码结合DNA分子或结合其他细胞分子的蛋白或蛋白片段的基因序列,所述蛋白包括但不限于麦芽糖结合蛋白(MBP)、S-标签、Lex A DNA结合结构域(DBD)融合物、GAL4A DNA结合结构域融合物和单纯疱疹病毒(HSV)BP16蛋白融合物。可以形成包含CRISPR酶的融合蛋白的一部分的另外的结构域描述于US20110059502中,该文献通过引用并入本文。
1.逆转录子(retron)
在一些方面,使用逆转录子和逆转录子重组工程进行基因编辑。逆转录子是在许多细菌物种的基因组中发现的独特DNA序列,其编码逆转录酶和独特单链DNA/RNA杂交物(被称为多拷贝单链DNA(msDNA))。逆转录子msr RNA是由逆转录子元件产生的非编码RNA,是合成msDNA的中间性前体。逆转录子元件长约2000kb。它们包含控制RNA转录物合成的单操纵子,其携带参与msDNA合成的三个基因座msr、msd和ret。msDNA的DNA部分由msd基因编码,RNA部分由msr基因编码,而ret基因的产物是逆转录酶,类似于逆转录病毒和其他类型的逆转录元件产生的RT。与其他逆转录酶相似,逆转录子RT含有七个保守氨基酸区域,包括与催化核心结合的高度保守的tyr-ala-asp-asp(YADD)序列。ret基因产物负责将RNA转录物的msd/msr部分加工成msDNA。
逆转录子msr RNA折叠成特征性二级结构,其在茎环末端含有保守的鸟苷残基。由逆转录子编码的逆转录酶(RT)进行的DNA合成会产生DNA/RNA嵌合体,该嵌合体由与小单链RNA连接的小单链DNA组成。RNA链通过2’–5’磷酸二酯键连接至DNA链的5’端,该键发生在保守的内部鸟苷残基的2’位置。
使用逆转录子和逆转录子重组工程进行基因编辑的材料和方法公开于例如Schubert M.G.等人(April 2021).PNAS118(18):e2018181118中,其全部内容通过引用并入本文。
B.核酸酶
在一些方面,使用一种或多种核酸酶,例如一种或多种转录激活子样效应物核酸酶(TALEN)和/或锌指核酸酶(ZFN)进行基因编辑。
1.TALEN
TALEN是DNA结合限制性酶,其经过工程改造以切割特定的DNA序列,并且可通过将转录激活子样(TAL)效应物DNA结合结构域与DNA切割结构域(核酸酶)融合来制备。TAL效应子是由黄单胞菌分泌的蛋白。DNA结合结构域包含约33-34个氨基酸的重复的高度保守序列,其中第12个和第13个氨基酸有变化,称为重复可变残基(RVD),它们高度可变并与特定核苷酸识别显示出很强的相关性。在一些方面,通过选择含有适当RVD的重复片段的组合来工程改造特异性DNA结合结构域,并且RVD的轻微变化以及“非常规”RVD序列的引入可以提高靶向特异性。来自FokI核酸内切酶和/或其变体末端的非特异性DNA切割结构域可用于构建杂合核酸酶。FokI结构域作为二聚体发挥作用,其具有两个具有独特DNA结合结构域的构建体,以正确方向和间距用于靶基因组中的位点。在一些方面,TAL效应物DNA结合结构域和FokI切割结构域之间的氨基酸残基数量以及两个单独的TALEN结合位点之间的碱基数量都可以变化,以实现高水平的活性和/或特异性。
TALEN构建体的产生可以使用公开可用的软件程序(例如DNAWorks),用以计算适合在两步PCR寡核苷酸组装中组装和随后的全基因扩增的寡核苷酸。另外或可选地,可以使用多种模块化组装方案,例如描述于Cermak T.等人(July 2011).Nucleic AcidsResearch.39(12):e82;Zhang F.(Feb.2011)等人Nature Biotechnology.29(2):149–53;Morbitzer R.等人(July 2011).Nucleic Acids Research.39(13):5790–9;Li T.等人(August 2011).Nucleic Acids Research.39(14):6315–25;Geissler R.等人(2011).PLOS ONE.6(5):e19509;和Weber E.等人(2011).PLOS ONE.6(5):e19722中的那些,所有文献均通过引用整体并入本文。一旦TALEN构建体组装完成,可以将它们插入到病毒或非病毒载体中;然后用载体转染靶细胞,基因产物被表达并可以进入细胞核以访问基因组。TALEN可用于通过诱导双链断裂(DSB)来编辑基因组,细胞通过修复机制(例如,非同源末端连接和/或同源引导修复)来对双链断裂进行应答。另外或可选地,TALEN构建体可以作为mRNA递送至细胞。
2.ZFN
ZFN是通过将锌指DNA结合结构域与DNA切割结构域融合而产生的限制性内切酶。在一些方面,锌指结构域可被工程化以靶向特定的目标DNA序列,以使锌指核酸酶能够靶向基因组中的独特序列。DNA结合结构域可包含三至六个单独的锌指重复(例如,3、4、5或6个重复),并且各自可识别9至18个碱基对(例如,9、10、11、12、13、14、15、16、17或18个碱基对)。在识别3个碱基对的DNA序列后,ZFN可以生成能识别9个碱基对的靶位点的3-指阵列。另外或可选地,ZFN可以利用1-指或2-指模块来生成具有六个或更多个单独锌指的锌指阵列。可以使用例如噬菌体展示、酵母单杂交系统、细菌单杂交和双杂交系统以及哺乳动物细胞,从大量部分随机化的锌指阵列中选择结合给定DNA靶标的蛋白,以选择ZFN DNA结合结构域。在一些方面,使用细菌双杂交系统,并组合被选择用于结合给定的3个碱基对的DNA序列的预选ZFN库,随后进行第二轮选择以获得能够结合期望的9碱基对序列的3-指阵列。参见,例如,Maeder ML,等人(2008年9月).Mol.Cell.31(2):294–301,通过引用将其全部内容并入本文。
非特异性DNA切割结构域(例如,来自IIs型限制性内切核酸酶FokI)可以用作ZFN中的切割结构域。该切割结构域二聚化以切割DNA,并且在某些方面,一对ZFN用于靶向非回文DNA位点。标准ZFN将切割结构域融合至每个锌指结构域的C末端。为了让两个切割结构域二聚化并切割DNA,两个单独的ZFN结合DNA的相对链,它们的C末端相距一定距离。在一些方面,对于锌指结构域和切割结构域之间的接头序列,每个结合位点的5’边缘间隔5至7个碱基对。多种不同的蛋白工程化技术已用于提高ZFN中使用的核酸酶结构域的活性和特异性。例如,在一些方面,采用使用定向进化产生的具有增强的切割活性的FokI变体。参见,例如,Guo J.等人(2010).Journal of Molecular Biology.400(1):96–107,其通过引用以其整体并入本文。另外或可选地,可以采用基于结构的设计从而通过修饰二聚化界面来提高FokI的切割特异性,使得仅有目标异二聚体种类具有活性。
在一些方面,可以使用锌指切口酶(ZFNickase)。ZFNickase可以通过使双链切割所需的ZFN二聚体中的一个ZFN单体的催化活性失活来产生。ZFNickase在体外表现出链特异性切口活性,并且可以在DNA中提供高度特异性的单链断裂,其经历的针对DNA的细胞机制与ZFN利用的相同,但在其靶切口位点显示出显著降低的诱变NHEJ修复频率。这种降低可能会偏向于同源重组(HR)介导的基因修饰。
V.一般治疗方法
在各个方面,表达野生型基因的内源突变变体(即突变基因变体)的患病细胞或其他细胞被靶向,以改善患有医学病况的个体的医学病况或降低个体中医学病况的风险或延迟个体中医学病况的严重程度和/或发作。在特定情况下,表达野生型基因的内源突变变体(即,突变基因变体)的细胞被靶向,以达到抑制或减少野生型基因的内源突变变体的表达的目的。
使用如本文所涉及的用于转导或转化细胞以促进编码可被插入其内源突变变体上游的基因的野生型编码序列的外源核酸的插入的核酸,和/或包含其的药物组合物,以预防、治疗或改善疾病,例如常染色体疾病(即,显性常染色体遗传病症或隐性常染色体遗传病症)。
编码可被插入其内源突变变体上游的基因的野生型编码序列的外源核酸所针对使用的细胞可以是表达野生型基因的突变变体的任何细胞,以及在特定的方面是被工程化用于受试者的细胞治疗的细胞。在特定的方面,细胞已被工程化以表达一种或多种野生型基因。在一些方面,本公开的细胞已被工程化以表达一种或多种野生型基因并且野生型基因的内源突变变体的表达降低或不表达。
在特定的方面,本公开部分涉及编码可被插入其内源突变变体上游的基因的野生型编码序列的外源核酸,其可以使用标准载体和/或基因递送系统单独施用或以任何组合施用,并且在至少一些方面,与药学上可接受的载体或赋形剂一起施用。在某些方面,施用后,核酸分子或载体可以稳定地整合到受试者的基因组中。在特定的方面,可以使用对某些细胞或组织具有特异性并且持续存在于细胞中的病毒载体。本领域熟知合适的药物载体和赋形剂。根据本公开制备的组合物可用于预防或治疗或延缓上述疾病。
此外,本公开涉及用于预防、治疗或改善常染色体疾病(即,显性常染色体遗传病症或隐性常染色体遗传病症)的方法,其包括向有此需要的受试者施用有效量的编码可被插入其内源突变变体上游的基因的野生型编码序列的外源核酸、以及用于转导或转化细胞以促进编码可被插入其内源突变变体上游的基因的野生型编码序列的此类外源核酸的插入的核酸的步骤,如本文所涉及的和/或通过本文所涉及的方法产生的。
施用组合物的可能适应症是显性常染色体遗传病症,包括例如软骨发育不全、急性间歇性卟啉症、抗凝血酶III缺乏症、BRCA1/BRCA2阳性乳腺癌、巨颌症、显性失明(例如,Leber先天性黑内障、视网膜色素变性、Stargardt样黄斑营养不良、静止性夜盲症、玻璃体视网膜脉络膜病变)、显性先天性耳聋、Ehlers-Danlos综合征、家族性腺瘤性息肉病、吉尔伯特病、遗传性出血性毛细血管扩张症、遗传性椭圆形细胞增多症、遗传性球形红细胞增多症、前裂无脑畸形、亨廷顿病、高胆固醇血症、特发性甲状旁腺功能减退症、肠息肉病、大理石骨病、马凡氏综合征、强直性肌营养不良、神经纤维瘤病、成骨不全、多囊肾病、蛋白C缺乏症、视网膜色素变性、视网膜母细胞瘤、特雷彻柯林斯综合征、结节性硬化症或冯·维勒布兰德氏病。本公开的组合物的施用对于显性常染色体遗传病症的所有阶段和类型都是有用的。
可施用组合物的适应症有隐性常染色体遗传病症,包括眼皮肤白化病、黑酸尿症、巴特综合征、囊性纤维化、地方性甲状腺肿克汀病、家族性黑蒙性白痴、半乳糖血症、戈谢病、糖原贮积病、苯丙酮尿症、威尔逊病、镰状细胞病、泰-萨克斯病和色素性干皮病。本公开的组合物的施用对于隐性常染色体遗传病症的所有阶段和类型都是有用的。
因此,在一些方面,本文提供了将治疗有效量的本文所述的任何组合物引入受试者的方法。还提供了增加细胞中野生型基因(例如突变基因变体由之衍生的野生型基因)表达的方法,包括将治疗有效量的本文所述的任何组合物引入受试者的细胞中。还提供了抑制或降低细胞中野生型基因的突变变体(例如,突变基因变体由之衍生的野生型基因)的表达的方法,包括将治疗有效量的本文所述的任何组合物引入受试者的细胞中。还提供了治疗被鉴定为表达突变基因变体的受试者的常染色体遗传病症(即,显性常染色体遗传病症或隐性常染色体遗传病症)的方法,其中该方法包括将治疗有效量的本文所述的任何组合物施用至受试者的细胞。
在任何这些方法的一些方面,哺乳动物先前已被鉴定为具有缺陷的野生型基因(例如,基因具有突变而导致由该基因编码的蛋白的异常的表达和/或活性)。任何这些方法的一些方面进一步包括,在引入或施用步骤之前,确定受试者具有缺陷的野生型基因(例如,具有导致由该基因编码的蛋白的异常的表达和/或活性的突变的基因)。任何这些方法的一些方面还可包括检测受试者中野生型基因的突变。任何方法的一些方面还可包括鉴定或诊断受试者患有常染色体遗传病症(即,显性常染色体遗传病症或隐性常染色体遗传病症)。
在任何这些方法的一些方面,将两个或更多个剂量的本文所述的任何组合物引入或施用于受试者。任何这些方法的一些方面可以包括向受试者引入或施用第一剂量的组合物,在引入或施用第一剂量后评估受试者的表型,以及向被发现不具有正常表型(例如,如使用本领域已知的、任何测试所确定)的受试者施用额外剂量的组合物。
在本文所述的任何方法的一些方面,组合物可配制用于胃肠外施用。在本文所述的任何方法的一些方面,本文所述的组合物可通过局部或全身注射施用。在本文描述的任何方法的一些方面,组合物通过使用医疗装置施用。
在本文所述的任何方法的一些方面,受试者或哺乳动物患有显性常染色体遗传病症或处于发展显性常染色体遗传病症的风险中,所述显性常染色体遗传病症包括例如软骨发育不全、急性间歇性卟啉症、抗凝血酶III缺乏症、BRCA1/BRCA2阳性乳腺癌、巨颌症、显性失明(例如,Leber先天性黑内障、视网膜色素变性、Stargardt样黄斑营养不良、静止性夜盲症、玻璃体视网膜脉络膜病变)、显性先天性耳聋、Ehlers-Danlos综合征、家族性腺瘤性息肉病、吉尔伯特病、遗传性出血性毛细血管扩张症、遗传性椭圆形细胞增多症、遗传性球形红细胞增多症、前裂无脑畸形、亨廷顿病、高胆固醇血症、特发性甲状旁腺功能减退症、肠息肉病、大理石骨病、马凡氏综合征、强直性肌营养不良、神经纤维瘤病、成骨不全、多囊肾病、蛋白C缺乏症、视网膜色素变性、视网膜母细胞瘤、特雷彻柯林斯综合征、结节性硬化症或冯·维勒布兰德氏病。在本文所述的任何方法的一些方面,受试者或哺乳动物先前已被鉴定为在野生型基因(例如突变基因变体由之衍生的野生型基因)中具有突变。在本文所述的任何方法的一些方面,受试者或哺乳动物具有本文描述的或本领域中已知与显性常染色体遗传病症相关的野生型基因(例如突变基因变体由之衍生的野生型基因)中的任何突变。
在本文所述的任何方法的一些方面,受试者或哺乳动物患有隐性常染色体遗传病症或处于发展隐性常染色体遗传病症的风险中,所述隐性常染色体遗传病症包括眼皮肤白化病、黑酸尿症、巴特综合征、囊性纤维化、地方性甲状腺肿克汀病、家族性黑蒙性白痴、半乳糖血症、戈谢病、糖原贮积病、苯丙酮尿症、威尔逊病、镰状细胞病、泰-萨克斯病和色素性干皮病。在本文所述的任何方法的一些方面,受试者或哺乳动物先前已被鉴定为在野生型基因(例如突变基因变体由之衍生的野生型基因)中具有突变。在本文描述的任何方法的一些方面,受试者或哺乳动物具有本文描述的或本领域中已知与隐性常染色体遗传病症相关的野生型基因(例如突变基因变体由之衍生的野生型基因)中的任何突变。
在本文所述的任何方法的一些方面,受试者已被鉴定为具有野生型基因(例如,突变基因变体由之衍生的野生型基因)中的突变,并且已被诊断患有常染色体遗传病症(即,显性常染色体遗传病症或隐性常染色体遗传病症)。在本文所述的任何方法的一些方面,受试者已被鉴定为患有常染色体遗传病症(即,显性常染色体遗传病症或隐性常染色体遗传病症)。
本文还提供了增加细胞中野生型基因(例如突变基因变体由之衍生的野生型基因)表达的方法,包括将本文所述的任何组合物引入哺乳动物细胞中。在这些方法的一些方面,细胞是体内的。在这些方法的一些方面,哺乳动物细胞位于哺乳动物中。在这些方法的一些方面,细胞最初从受试者获得并离体培养。在一些方面,细胞先前已被确定为具有缺陷的野生型基因(例如突变基因变体由之衍生的野生型基因)。将本文所述的任何组合物引入细胞的方法是本领域已知的(例如,通过脂转染或通过使用病毒载体,例如本文所述的任何病毒载体)。
本公开进一步涵盖与其他化合物的共同施用方案。用于共同施用本发明化合物的临床方案可以包括在施用其他组分的同时、之前或之后共同施用。具体的组合治疗包括化疗、放疗、手术、激素治疗或其他类型的免疫治疗。
VI.一般药物组合物
在一些方面,将药物组合物施用给受试者。不同的方面可以涉及向受试者施用有效量的组合物。在一些方面,编码可被插入其内源突变变体上游的基因的野生型编码序列的核酸,以及用于转导或转化细胞以促进编码可被插入其内源突变变体上游的基因的野生型编码序列的此类核酸的插入的核酸,可以被递送至受试者,以预防或治疗病况(例如,常染色体遗传病症)。或者,针对编码可被插入其内源突变变体上游的基因的野生型编码序列的核酸,以及用于转导或转化细胞以促进编码可被插入其内源突变变体上游的基因的野生型编码序列的此类核酸的插入的核酸,编码它们的表达载体可以被给予受试者,作为预防性治疗。另外,此类组合物可以与另外的治疗剂(例如化疗剂、免疫治疗剂、生物治疗剂等)组合施用。此类组合物通常溶解或分散在药学上可接受的载体或水性介质中。
短语“药学上可接受的”或“药理学上可接受的”是指当施用于动物或人时不产生不利的、过敏的或其他不良反应的分子实体和组合物。如本文所用,“药学上可接受的载体”包括任何和所有溶剂、分散介质、包衣、抗细菌剂和抗真菌剂、等渗剂和吸收延迟剂等。此类介质和试剂用于药物活性物质的用途是本领域公知的。除非任何常规介质或试剂与活性成分不相容,否则考虑其在免疫原性和治疗性组合物中的用途。补充性活性成分,例如其他抗感染剂和疫苗,也可以掺入组合物中。
活性化合物可以配制用于胃肠外施用,例如配制用于通过静脉内、胸膜内、肌内、皮下或腹膜内途径注射。通常,此类组合物可以制备为液体溶液或悬浮液;还可以制备适合在注射前添加液体来制备溶液或混悬液的固体形式;并且,也可以将制备物乳化。
适合注射使用的药物剂型包括无菌水性溶液或分散液;制剂,包括例如水性丙二醇;以及无菌粉末,用于临时制备无菌注射溶液或分散液。在所有情况下,该形式必须是无菌的,并且必须是流动性的,以便于注射。它还应该在制造和储存条件下稳定,并且必须能够在保存下抵抗微生物(例如细菌和真菌)的污染作用。
蛋白组合物可以配制成中性或盐形式。药学上可接受的盐包括酸加成盐(与蛋白的游离氨基形成)并且其与无机酸(例如盐酸或磷酸)或有机酸(例如乙酸、草酸、酒石酸、扁桃酸)等形成。与游离羧基形成的盐也可以衍生自无机碱,例如氢氧化钠、氢氧化钾、氢氧化铵、氢氧化钙或氢氧化铁,以及有机碱,例如异丙胺、三甲胺、组氨酸、普鲁卡因等。
药物组合物可包括溶剂或分散介质,其含有例如水、乙醇、多元醇(例如甘油、丙二醇和液体聚乙二醇等)、其合适的混合物和植物油。适当的流动性可以例如通过使用包衣如卵磷脂、在分散液的情况下通过维持所需的粒度、以及通过使用表面活性剂来维持。可以通过各种抗细菌剂和抗真菌剂来防止微生物的作用,例如对羟基苯甲酸酯、三氯叔丁醇、苯酚、山梨酸、硫柳汞等。在许多情况下,优选包含等渗剂,例如糖或氯化钠。可通过在组合物中使用延迟吸收剂(例如单硬脂酸铝和明胶)来延长可注射组合物的吸收。
通过将所需量的活性化合物与上面列举的各种其他成分(根据需要)并入适当的溶剂中,然后进行过滤灭菌或等效程序,来制备无菌注射溶液。一般而言,分散液通过将各种无菌活性成分并入无菌媒介物中来制备,所述无菌媒介物含有基本分散介质和来自上面列举的那些的所需其他成分。在用于制备无菌注射溶液的无菌粉末的情况下,优选的制备方法是真空干燥和冷冻干燥技术,其产生活性成分加上来自其先前无菌过滤的溶液的任何其他所需成分的粉末。
组合物的施用通常通过任何常见途径进行。这包括但不限于眼眶内或视网膜内施用。在一些方面,组合物通过静脉内、肌内、胸膜内、皮下、局部、口服、透皮、腹膜内、眼眶内、通过植入、通过吸入、鞘内、心室内或鼻内施用。
配制后,溶液将以与剂量配制相容的方式并以治疗或预防有效的量施用。该制剂易于以多种剂型施用,例如上述的注射溶液类型。
合适的剂量可以根据待治疗的疾病类型、疾病的严重程度和病程、个体的临床状况、个体的临床病史和对治疗的反应以及主治医师的判断来确定。此类组合物通常作为药学上可接受的组合物施用,其包含生理学上可接受的载体、缓冲剂或其他赋形剂。
治疗可能包括各种“单位剂量”。单位剂量定义为含有预定量的治疗组合物。待施用的量以及具体途径和制剂在临床领域技术人员的技术范围内确定。单位剂量不需要作为单次注射施用,而是可以包括在设定时间段内的连续输注。在一些方面,单位剂量包括单次可施用的剂量。
根据治疗次数和单位剂量的待施用量取决于期望的治疗效果。有效剂量被理解为是指实现特定效果所需的量。在某些方面的实践中,预期10mg/kg至200mg/kg范围内的剂量可以影响这些试剂的保护能力。因此,预期剂量包括约0.1、0.5、1、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、100、105、110、115、120、125、130、135、140、145、145、150、155、160、165、170、175、175、180、185、185、185、190、195和200、300、300、400、500、1000μg/kg、mg/kg、μg/天或mg/天或其中可形成的任何范围的剂量。此外,此类剂量可以在一天内多次施用,和/或在多天、多周或多月期间施用。
在组合物包含病毒载体的某些方面,组合物中包含1×106至约1×1016vg/ml。在一些方面,组合物中包含1×1015vg/ml。在一些方面,包含大于1×106vg/ml。在一些方面,包含大于1×107vg/ml。在一些方面,包含大于1×108vg/ml。在一些方面,包含大于1×109vg/ml。在一些方面,包含大于1×1010vg/ml。在一些方面,包含大于1×1011vg/ml。在一些方面,包含大于1×1012vg/ml。在一些方面,包含大于1×1013vg/ml。在一些方面,包含大于1×1014vg/ml。在一些方面,包含大于1×1015vg/ml。
在某些方面,药物组合物的有效剂量是可以提供约1μM至150μM的血液水平的剂量。在另一个方面,有效剂量提供约4μM至100μM;或约1μM至100μM;或约1μM至50μM;或约1μM至40μM;或约1μM至30μM;或约1μM至20μM;或约1μM至10μM;或约10μM至150μM;或约10μM至100μM;或约10μM至50μM;或约25μM至150μM;或约25μM至100μM;或约25μM至50μM;或约50μM至150μM;或约50μM至100μM(或其中可形成的任何范围)的血液水平。在其他方面,所述剂量可以提供由施用于受试者的治疗剂产生的以下药剂血液水平:约、至少约、或至多约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100μM或其中可形成的任何范围。在某些方面,施用于受试者的治疗剂在体内代谢为代谢的治疗性药剂,在这种情况下,血液水平可以指该药剂的量。或者,在治疗剂不被受试者代谢的情况下,本文讨论的血液水平可以指未代谢的治疗剂。
治疗组合物的精确量还取决于从业者的判断并且对于每个个体来说是独特的。影响剂量的因素包括患者的身体和临床状态、施用途径、治疗的预期目标(缓解症状还是治愈)以及具体治疗物质的效力、稳定性和毒性或受试者可能正在接受的其他治疗。
本领域技术人员将理解并认识到,μg/kg或mg/kg体重的剂量单位可以转换并表示为μg/ml或mM(血液水平)的相当浓度单位,例如4μM至100μM。还应当理解,吸收取决于物种和器官/组织。关于吸收和浓度测量的适用转换因子和生理学假设是公知的,并且将允许本领域技术人员将一种浓度测量转换为另一种浓度测量,并对本文所述的剂量、功效和结果做出合理的比较和结论。
在某些情况下,需要多次施用所述组合物,例如2、3、4、5、6、7、8、9、10次或更多次施用。所述施用的间隔可以是至少、至多、等于1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59或60天、周、月或年(包括其间的所有范围)或介于任意两者之间。
VII.试剂盒
在多个方面涉及试剂盒,其包含本文定义的构建体、本文定义的核酸序列、本文定义的载体和/或本文定义的宿主细胞(例如免疫细胞)。还预期本公开的试剂盒包含如上文所述的药物组合物,其是单独的或与待施用于需要医学治疗或干预的个体的其他药物组合。
在非限制性实例中,细胞、产生细胞的试剂、载体以及产生载体的试剂和/或其组分可以包含在试剂盒中。在某些方面,细胞可以包含在试剂盒中,并且它们可以表达或不表达本公开的核酸、基因编辑技术(或其元件,例如Cas蛋白或引导RNA分子),和/或选择标记。这样的试剂盒可以具有也可以不具有一种或多种用于操纵细胞的试剂。此类试剂包括例如小分子、蛋白、核酸、抗体、缓冲液、引物、核苷酸、盐和/或其组合。编码可被插入其突变变体上游的基因的一种或多种野生型编码序列的核酸、一种或多种基因编辑技术(或其元件,例如Cas蛋白或引导RNA分子)、和/或者一种或多种选择标记可以包含在试剂盒中,包括产生其的试剂。试剂盒中可以包括蛋白,例如细胞因子或抗体,包括单克隆抗体。
在特定的方面,试剂盒包含本公开的基因治疗以及另一种治疗。在一些情况下,除了细胞治疗方面之外,试剂盒还包括第二治疗,例如化疗、激素治疗和/或免疫治疗。试剂盒可以针对个体的特定疾病(例如,特定的常染色体疾病)进行定制,并且包含用于个体的相应的第二治疗。
试剂盒可以包含适当等分的本公开的组合物。试剂盒的组分可以以水性介质或冻干形式包装。试剂盒的容器装置通常包括至少一个小瓶、试管、烧瓶、瓶、注射器或其他容器装置,可以将组分置于其中并且优选地进行适当等分。当试剂盒中存在多于一种组分时,试剂盒通常还可以包含第二、第三或其他额外容器,另外的组分可以分开置于其中。然而,小瓶中可以包含组分的多种组合。本公开的试剂盒通常还包括用于容纳组合物的装置和用于商业销售的紧密限制的任何其他试剂容器。此类容器可以包括注射或吹塑塑料容器,所需的小瓶被保留在其中。
具体实施方案1-121
1.一种用于体外编辑细胞基因组的方法,所述方法包括使所述细胞与包含核酸酶和编码敲入盒的外源核酸的组合物接触,所述敲入盒包含野生型基因的编码序列以及用于表达所述野生型基因的翻译起始和终止元件,
其中所述核酸酶引起编码所述野生型基因突变变体的内源核酸的5'端非编码区(5’UTR)内的断裂,
其中所述内源核酸在5’至3’方向上编码5’UTR、用于表达所述野生型基因突变变体的翻译起始元件、以及所述野生型基因突变变体的编码序列,
其中所述编码敲入盒的外源核酸通过不依赖于同源性的靶向整合被整合至由所述内源核酸编码的翻译起始元件上游(5’)的内源核酸的5’UTR中。
2.根据实施方案1所述的方法,其中所述编码敲入盒的外源核酸不与编码所述野生型基因突变变体的内源核酸框内整合。
3.根据实施方案1所述的方法,其中所述编码所述敲入盒的外源核酸与编码所述野生型基因突变变体的内源核酸框内整合。
4.根据实施方案1-3中任一项所述的方法,其中所述敲入盒的侧翼没有同源臂或者具有同源臂。
5.根据实施方案1-4中任一项所述的方法,其中所述编码敲入盒的外源核酸的整合导致所述细胞表达所述野生型基因。
6.根据实施方案5所述的方法,其中所述细胞对所述野生型基因的表达抑制了所述野生型基因突变变体的表达。
7.根据实施方案1-6中任一项所述的方法,其中所述核酸酶是CRISPR/Cas核酸酶,并且其中所述方法进一步包括使所述细胞与用于所述CRISPR/Cas核酸酶的引导分子接触。
8.根据实施方案1-6中任一项所述的方法,其中所述核酸酶是锌指核酸酶(ZFN)、转录激活子样效应物核酸酶(TALEN)或大范围核酸酶。
9.根据实施方案1-8中任一项所述的方法,其中所述核酸酶由编码所述敲入盒的同一外源核酸编码,并且其中所述外源核酸包含在载体中。
10.根据实施方案9所述的方法,其中所述核酸酶是CRISPR/Cas核酸酶,并且其中包含编码所述核酸酶和所述敲入盒的外源核酸的载体进一步包含编码用于所述CRISPR/Cas核酸酶的引导分子的核酸。
11.根据实施方案9或10所述的方法,其中所述载体是质粒、转座子、粘粒、人工染色体、脂质纳米颗粒或病毒载体。
12.根据实施方案9-11中任一项所述的方法,其中所述载体是病毒载体,并且其中所述病毒载体是腺相关病毒(AAV)载体、腺病毒载体、慢病毒载体或逆转录病毒载体。
13.根据实施方案12所述的方法,其中所述病毒载体是AAV载体。
14.根据实施方案1-8中任一项所述的方法,其中所述核酸酶由与编码所述敲入盒的外源核酸不同的核酸编码,并且其中所述编码核酸酶的核酸和所述编码敲入盒的外源核酸包含在两个不同的载体中。
15.根据实施方案14所述的方法,其中所述核酸酶是CRISPR/Cas核酸酶,并且其中所述包含编码敲入盒的外源核酸的载体还包含编码用于所述CRISPR/Cas核酸酶的引导分子的核酸。
16.根据实施方案14或15所述的方法,其中所述载体是质粒、转座子、粘粒、人工染色体、脂质纳米颗粒或病毒载体。
17.根据实施方案14-16中任一项所述的方法,其中所述载体是病毒载体,并且其中所述病毒载体是腺相关病毒(AAV)载体、腺病毒载体、慢病毒载体或逆转录病毒载体。
18.根据实施方案17所述的方法,其中所述病毒载体是AAV载体。
19.根据实施方案1-18中任一项所述的方法,其中所述野生型基因的编码序列有效连接至启动子。
20.根据实施方案19所述的方法,其中所述启动子是诱导型启动子、组成型启动子或组织特异性启动子。
21.根据实施方案1-20中任一项所述的方法,其中所述野生型基因突变变体是显性变体。
22.根据实施方案1-21中任一项所述的方法,其中所述野生型基因是RHO基因。
23.根据实施方案1-20中任一项所述的方法,其中所述野生型基因突变变体是隐性变体。
24.一种包含基因组修饰的工程化细胞,其中所述基因组修饰包括编码敲入盒的外源核酸在所述细胞的基因组中的整合,
其中所述敲入盒包含野生型基因的编码序列,并且
其中编码敲入盒的外源核酸被整合到编码野生型基因突变变体的内源核酸的5’UTR中,
其中内源核酸在5’至3’方向上编码5’UTR、用于表达野生型基因突变变体的翻译起始元件、以及野生型基因突变变体的编码序列,并且
其中编码敲入盒的外源核酸通过不依赖于同源性的靶向整合被整合至由所述内源核酸编码的翻译起始元件上游(5’)的内源核酸的5’UTR中。
25.根据实施方案24所述的工程化细胞,其中所述敲入盒还包含用于表达所述野生型基因的翻译起始和终止元件。
26.根据实施方案25所述的工程化细胞,其中所述编码敲入盒的外源核酸不与所述编码野生型基因突变变体的内源核酸框内整合。
27.根据实施方案25所述的工程化细胞,其中所述编码敲入盒的外源核酸与所述编码野生型基因突变变体的内源核酸框内整合。
28.根据实施方案24-27中任一项所述的工程化细胞,其中所述敲入盒的侧翼没有同源臂或具有同源臂。
29.根据实施方案24-28中任一项所述的工程化细胞,其中所述编码敲入盒的外源核酸的整合导致所述野生型基因的表达。
30.根据实施方案29所述的工程化细胞,其中所述野生型基因的表达抑制了所述野生型基因突变变体的表达。
31.根据实施方案24-30中任一项所述的工程化细胞,其中所述野生型基因的编码序列有效连接至启动子。
32.根据实施方案31所述的工程化细胞,其中所述启动子是诱导型启动子、组成型启动子或组织特异性启动子。
33.根据实施方案24-32中任一项所述的工程化细胞,其中所述野生型基因突变变体是显性变体。
34.根据实施方案24-33中任一项所述的工程化细胞,其中所述野生型基因是RHO基因。
35.根据实施方案24-32中任一项所述的工程化细胞,其中所述野生型基因突变变体是隐性变体。
36.一种组合物,其包含:
核酸酶;和
编码敲入盒的外源核酸,所述敲入盒包含野生型基因的编码序列和用于表达所述野生型基因的翻译起始和终止元件;
其中,当引入细胞中时,所述核酸酶引起编码所述野生型基因突变变体的内源核酸的5’UTR内的断裂,
其中所述内源核酸在5’至3’方向上编码5’UTR、用于表达所述野生型基因突变变体的翻译起始元件、以及所述野生型基因突变变体的编码序列,并且
其中所述编码敲入盒的外源核酸通过不依赖于同源性的靶向整合被整合至由所述内源核酸编码的翻译起始元件上游(5’)的内源核酸的5’UTR中。
37.根据实施方案36所述的组合物,其中所述敲入盒的侧翼没有同源臂或者具有同源臂。
38.根据实施方案36或37所述的组合物,其中所述核酸酶是CRISPR/Cas核酸酶。
39.根据实施方案36或37所述的组合物,其中所述核酸酶是锌指核酸酶(ZFN)、转录激活子样效应物核酸酶(TALEN)或大范围核酸酶。
40.根据实施方案36-39中任一项所述的组合物,其中所述核酸酶由编码所述敲入盒的同一外源核酸编码,并且其中所述外源核酸包含在载体中。
41.根据实施方案40所述的组合物,其中所述核酸酶是CRISPR/Cas核酸酶,并且其中包含编码所述核酸酶和所述敲入盒的外源核酸的载体还包含编码用于所述CRISPR/Cas核酸酶的引导分子的核酸。
42.根据实施方案40或41所述的组合物,其中所述载体是质粒、转座子、粘粒、人工染色体、脂质纳米颗粒或病毒载体。
43.根据实施方案40-42中任一项所述的组合物,其中所述载体是病毒载体,并且其中所述病毒载体是腺相关病毒(AAV)载体、腺病毒载体、慢病毒载体或逆转录病毒载体。
44.根据实施方案43所述的组合物,其中所述病毒载体是AAV载体。
45.根据实施方案36-39中任一项所述的组合物,其中所述核酸酶由与所述编码敲入盒的外源核酸不同的核酸编码,并且其中所述编码核酸酶的核酸和所述编码敲入盒的外源核酸包含在两个不同的载体中。
46.根据实施方案45所述的组合物,其中所述核酸酶是CRISPR/Cas核酸酶,并且其中包含所述编码敲入盒的外源核酸的载体还包含编码用于所述CRISPR/Cas核酸酶的引导分子的核酸。
47.根据实施方案45或46所述的组合物,其中所述载体是质粒、转座子、粘粒、人工染色体、脂质纳米颗粒或病毒载体。
48.根据实施方案45-47中任一项所述的组合物,其中所述载体是病毒载体,并且其中所述病毒载体是腺相关病毒(AAV)载体、腺病毒载体、慢病毒载体或逆转录病毒载体。
49.根据实施方案48所述的组合物,其中所述病毒载体是AAV载体。
50.根据实施方案36-49中任一项所述的组合物,其中所述野生型基因的编码序列有效连接至启动子。
51.根据实施方案50所述的组合物,其中所述启动子是诱导型启动子、组成型启动子或组织特异性启动子。
52.根据实施方案36-51中任一项所述的组合物,其中所述野生型基因突变变体是显性变体。
53.根据实施方案38-52中任一项所述的组合物,其中所述野生型基因是RHO基因。
54.根据实施方案36-51中任一项所述的组合物,其中所述野生型基因突变变体是隐性变体。
55.根据实施方案1-54中任一项所述的组合物,进一步包含药学上可接受的赋形剂。
56.一种体外在细胞中表达野生型基因的方法,所述方法包括将实施方案36-55中任一项所述的组合物引入所述细胞中。
57.根据实施方案56所述的方法,其中所述细胞是人或动物细胞。
58.根据实施方案56或57所述的方法,其中所述细胞先前被确定为表达所述野生型基因突变变体。
59.根据实施方案58所述的方法,其中所述野生型基因的表达抑制了所述野生型基因突变变体的表达。
60.根据实施方案56-59中任一项所述的方法,其中所述野生型基因突变变体是显性变体。
61.根据实施方案56-60中任一项所述的方法,其中所述野生型基因是RHO基因。
62.根据实施方案56-59中任一项所述的方法,其中所述野生型基因突变变体是隐性变体。
63.一种体外减少细胞中野生型基因突变变体的表达的方法,所述方法包括将实施方案36-55中任一项所述的组合物引入所述细胞中。
64.根据实施方案63所述的方法,其中所述细胞是人或动物细胞。
65.根据实施方案63或64所述的方法,其中所述野生型基因突变变体是显性变体。
66.根据实施方案63-65中任一项所述的方法,其中所述野生型基因是RHO基因。
67.根据实施方案63-65中任一项所述的方法,其中所述野生型基因突变变体是隐性变体。
68.组合物在制备用于治疗或预防被鉴定为表达突变基因变体的受试者中的常染色体遗传病症的药物中的用途,所述组合物包含:
核酸酶;和
编码敲入盒的外源核酸,所述敲入盒包含野生型基因的编码序列和用于表达所述野生型基因的翻译起始和终止元件;
其中所述核酸酶引起编码所述突变基因变体的内源核酸的5’UTR内的断裂,
其中所述内源核酸在5’至3’方向上编码5’UTR、用于表达所述突变基因变体的翻译起始元件、以及所述突变基因变体的编码序列,
其中所述编码敲入盒的核酸通过不依赖于同源性的靶向整合被整合至由所述内源核酸编码的翻译起始元件上游(5’)的内源核酸的5’UTR中,并且
其中所述编码敲入盒的核酸的整合导致所述野生型基因的表达,并且
其中所述野生型基因的表达导致所述突变基因变体的表达减少。
69.根据实施方案68所述的用途,其中所述编码敲入盒的外源核酸不与编码所述突变基因变体的内源核酸框内整合。
70.根据实施方案68所述的用途,其中所述编码敲入盒的外源核酸与所述编码野生型基因突变变体的内源核酸框内整合。
71.根据权利要求68-70中任一项所述的用途,其中所述敲入盒的侧翼没有同源臂或者具有同源臂。
72.根据实施方案68-70中任一项所述的用途,其中所述核酸酶是CRISPR/Cas核酸酶,并且任选地,其中所述组合物还包含所述CRISPR/Cas核酸酶的引导分子。
73.根据实施方案68-71中任一项所述的用途,其中所述核酸酶是锌指核酸酶(ZFN)、转录激活子样效应物核酸酶(TALEN)或大范围核酸酶。
74.根据实施方案68-72中任一项所述的用途,其中所述核酸酶由编码所述敲入盒的同一外源核酸编码,并且其中所述外源核酸包含在载体中。
75.根据实施方案74所述的用途,其中所述核酸酶是CRISPR/Cas核酸酶,并且其中包含编码所述核酸酶和所述敲入盒的外源核酸的载体进一步包含编码所述CRISPR/Cas核酸酶的引导分子的核酸。
76.根据实施方案74或75所述的用途,其中所述载体是质粒、转座子、粘粒、人工染色体、脂质纳米颗粒或病毒载体。
77.根据实施方案74-76中任一项所述的用途,其中所述载体是病毒载体,并且其中所述病毒载体是腺相关病毒(AAV)载体、腺病毒载体、慢病毒载体或逆转录病毒载体。
78.根据实施方案77所述的用途,其中所述病毒载体是AAV载体。
79.根据实施方案68-78中任一项所述的用途,其中所述核酸酶由与所述编码敲入盒的外源核酸不同的核酸编码,并且其中所述编码核酸酶的核酸和所述编码敲入盒的外源核酸包含在两个不同的载体中。
80.根据实施方案79所述的用途,其中所述核酸酶是CRISPR/Cas核酸酶,并且其中包含所述编码敲入盒的外源核酸的载体还包含编码所述CRISPR/Cas核酸酶的引导分子的核酸。
81.根据实施方案79或80所述的用途,其中所述载体是质粒、转座子、粘粒、人工染色体、脂质纳米颗粒或病毒载体。
82.根据实施方案79-81中任一项所述的用途,其中所述载体是病毒载体,并且其中所述病毒载体是腺相关病毒(AAV)载体、腺病毒载体、慢病毒载体或逆转录病毒载体。
83.根据实施方案82所述的用途,其中所述病毒载体是AAV载体。
84.根据实施方案68-83中任一项所述的用途,其中野生型基因的编码序列有效连接至启动子。
85.根据实施方案84所述的用途,其中所述启动子是诱导型启动子、组成型启动子或组织特异性启动子。
86.根据实施方案68-85中任一项所述的用途,其中所述常染色体遗传病症是常染色体显性遗传病症。
87.根据实施方案86所述的用途,其中所述突变基因变体是显性变体。
88.根据实施方案86或实施方案87所述的用途,其中所述野生型基因是RHO基因。
89.根据实施方案68-85中任一项所述的用途,其中所述常染色体遗传病症是常染色体隐性遗传病症。
90.根据实施方案89所述的用途,其中所述突变基因变体是隐性变体。
91.一种组合物,包含:
Cas9核酸酶;
编码敲入盒的外源核酸,所述敲入盒包含野生型基因的编码序列和用于表达所述野生型基因的翻译起始和终止元件;和
CRISPR/Cas核酸酶的引导分子,用于将Cas9核酸酶引导至编码所述野生型基因突变变体的内源核酸的5’UTR,
其中所述内源核酸在5’至3’方向上编码5’UTR、用于表达所述野生型基因突变变体的翻译起始元件、以及所述野生型基因突变变体的编码序列,并且
其中,当引入细胞中时,所述核酸酶引起编码所述野生型基因突变变体的内源核酸的5’UTR内的断裂,并且
其中所述编码敲入盒的外源核酸通过不依赖于同源性的靶向整合被整合至由所述内源核酸编码的翻译起始元件上游(5’)的内源核酸的5’UTR中。
92.根据实施方案91所述的组合物,其中所述敲入盒的侧翼没有同源臂或具有同源臂
93.根据实施方案91或92所述的组合物,其中所述Cas9核酸酶由与所述编码敲入盒的外源核酸不同的核酸编码,并且其中所述编码核酸酶的核酸和所述编码敲入盒的外源核酸包含在两个不同的载体中。
94.根据实施方案93所述的组合物,其中包含所述编码敲入盒的外源核酸的载体进一步包含编码Cas9核酸酶的引导分子的核酸。
95.根据实施方案93或94所述的组合物,其中所述载体是质粒、转座子、粘粒、人工染色体、脂质纳米颗粒或病毒载体。
96.根据实施方案93-95中任一项所述的组合物,其中所述载体是病毒载体,并且其中所述病毒载体是腺相关病毒(AAV)载体、腺病毒载体、慢病毒载体或逆转录病毒载体。
97.根据实施方案96所述的组合物,其中所述病毒载体是AAV载体。
98.根据实施方案93-97中任一项所述的组合物,其中所述野生型基因的编码序列有效连接至启动子。
99.根据实施方案98所述的组合物,其中所述启动子是诱导型启动子、组成型启动子或组织特异性启动子。
100.根据实施方案98-99中任一项所述的组合物,其中所述野生型基因突变变体是显性变体。
101.根据实施方案93-100中任一项所述的组合物,其中所述野生型基因是RHO基因。
102.根据实施方案98-99中任一项所述的组合物,其中所述野生型基因突变变体是隐性变体。
103.根据实施方案93-102中任一项所述的组合物,其进一步包含药学上可接受的赋形剂。
104.一种体外在细胞中表达野生型基因的方法,所述方法包括将实施方案93-103中任一项所述的组合物引入所述细胞中。
105.根据实施方案104所述的方法,其中所述细胞是人或动物细胞。
106.根据实施方案104-105中任一项所述的方法,其中所述细胞先前被确定为表达所述野生型基因突变变体。
107.根据实施方案106所述的方法,其中所述野生型基因的表达抑制了所述野生型基因突变变体的表达。
108.根据实施方案106或107所述的方法,其中所述野生型基因突变变体是显性变体。
109.根据实施方案108所述的方法,其中所述细胞是视网膜细胞。
110.根据实施方案109所述的方法,其中所述野生型基因是RHO基因。
111.根据实施方案106或107所述的方法,其中所述野生型基因突变变体是隐性变体。
112.一种体外减少细胞中野生型基因突变变体的表达的方法,所述方法包括将实施方案91-103中任一项所述的组合物引入所述细胞中。
113.根据实施方案112所述的方法,其中所述细胞是人或动物细胞。
114.根据实施方案112或实施方案113所述的方法,其中所述野生型基因突变变体是显性变体。
115.根据实施方案114所述的方法,其中所述细胞是视网膜细胞。
116.根据实施方案115所述的方法,其中所述野生型基因是RHO基因。
117.根据实施方案112或实施方案113所述的方法,其中所述野生型基因突变变体是隐性变体。
实施例
包括以下实施例以证明本公开的优选实施方案。本领域技术人员应当理解,在以下实施例中公开的技术代表发明人发现的在本公开的实践中发挥良好作用的技术,并且因此可以被认为构成其实践的优选模式。然而,本领域技术人员根据本公开应当理解,在不脱离本公开的精神和范围的情况下,可以对所公开的具体实施方案进行许多改变并且仍然获得相同或相似的结果。
实施例1——针对显性常染色体遗传视网膜色素变性的靶向5’UTR的不依赖于突变的基因敲入治疗
本文描述的是治疗RHO相关adRP的不依赖于突变的基因编辑策略。简言之,通过不依赖于同源性的靶向整合(HITI),将AAV-Cas9介导的基因敲入(KI)靶向至RHO基因的5’非翻译区(UTR)(图1)。4选择位于小鼠RHO基因的Kozak序列上游的SpCas9的两个gRNA(图2;包含在SEQ ID NO:20和21中)。具有较高切割效率的gRNA(gRNA1;包含在SEQ ID NO:20中)(图16)用于体内测试。为了确保SpCas9适合于AAV载体中,使用短的hRK启动子来驱动光感受器细胞中的SpCas9表达(图3)。将hRK-SpCas9包装在第一AAV载体中,并将hRK-mCherry、pU6-gRNA和HITI供体序列包装在第二AAV载体中(图3)。将两个载体经视网膜下注射至新生小鼠眼中,约60%的视杆细胞(32%的总视网膜细胞)被AAV感染,如mCherry表达所显示(图17)。HITI AAV介导的GFP KI效率在体内在感染的光感受器中高达45%(图4-6),并且RHO KI通过RHO-/-1小鼠中的RHO染色得以验证5,其仅保留了RHO 5’UTR中的gRNA1靶位点(图4,图18)。下一代测序(NGS)结果显示,体内KI效率高达43%,小INDEL率为44%,未修饰的等位基因仅占13%(图6)。总之,这些结果表明,在某些方面,HITI-AAV方法可以介导有效的基因KI至RHO 5’UTR中。
在一些方面,在插入的野生型RHO编码序列之后的内源RHOP23H等位基因保留了完整的翻译起始元件(例如,Kozak序列),并且毒性的突变RHO蛋白可被继续表达。因此,通过在整合GFP后合成RHO基因组序列来克隆报告质粒,对内源基因的表达进行评估。Kozak-GFP-STOP-Kozak-RHO构建体的表达表明,GFP蛋白被翻译,而RHO蛋白翻译被抑制(图19)。不希望受到理论的束缚,在一些方面,在整合基因的5’UTR内引入STOP密码子可以发出细胞中天然蛋白翻译停止的信号。
在一些方面,翻译起始位点附近的插入和/或缺失(INDEL)可导致较低水平的RHO表达并由此影响视觉功能。因此,评估了RHO基因座中的INDEL对RHO表达水平和小鼠视觉功能的影响。向C57BL/6小鼠注射不具有HITI供体的双载体,以产生INDEL。分离mCherry+光感受器,进行RHO mRNA水平检查。qPCR结果表明,RHO mRNA没有受到5’UTR KI的显著影响,这与CDS KI导致的表达显著降低相反(图20)。通过视动测定和视网膜电图(ERG)测试的视觉功能显示,注射组的视敏度和光诱导电位变化没有受到影响。因此,在一些方面,5’UTR中的INDEL不影响内源RHO基因表达或视觉功能。
为了测试5’UTR RHO KI的治疗效果,在P1用2个双AAV载体处理RHOP23H/wt小鼠,其具有与具有相同突变的人类患者相似的进行性光感受器退化(图7)。每月通过光学相干断层扫描(OCT)进行的视网膜结构检查显示,与对照组相比,RHO KI组中的光感受器层厚度从P60到P210有显著增加(图8-9)。ERG结果显示,从P180到P210,RHO KI眼在弱光条件下(0.032cd.s.m-2)具有显著更高的暗视ERG B波振幅,表明视杆细胞具有更好的光感应功能(图8-11)。视杆-视锥混合的暗视ERG和视锥主占的明视ERG均显示,RHO KI在后期的幅度增加(图10,图21)。在实验结束时,对收获的眼的组织学分析表明,RHO KI处理更好地保留了光感受器细胞层厚度,具有更多的视紫红质+视杆细胞和更好的视锥细胞形态(图11-13)。在所有测定中,没有HITI RHO供体的对照治疗在RHOP23H/wt小鼠中没有提供任何有益作用或诱导任何毒性作用(图9-12),这与野生型小鼠中的结果一致(图20)。总之,这些结果表明,在某些方面,AAV介导的RHO KI以不依赖于等位基因的方式进入5’UTR,可以有效地阻止RHOP23H/wt小鼠中的视杆细胞退化和视力丧失。
目前,已在小鼠视网膜和肝脏中显示了AAV-HITI介导的基因KI靶向疾病基因CDS5。如本文所示,在某些方面,基因KI靶向5’UTR而不是CDS是更有效且更安全的。首先,在一些方面,与KI靶向CDS不同,插入5’UTR的外源基因序列(其含有翻译起始元件)可以但不要求与内源CDS处于框内。其次,在某些方面,5’UTR中的所插入外源基因的终止密码子可以阻断下游内源基因的表达,而CDS KI可导致截短蛋白的表达,从而以有毒的显性负性方式发挥作用。此外,5’UTR INDEL不会消除没有成功KI的细胞中的内源基因表达,而CDS INDEL可能会产生阅读框移位和野生型等位基因的不利敲除效应。各种Cas9酶的PAM位点是容易获得的并且在最常见的adRP疾病基因的5’UTR中的翻译起始元件(例如,Kozak序列)上游的序列中是保守的(图22,SEQ ID NO:22-30),表明5’UTR基因KI可具有广泛的适用性。
总之,本文公开了一种新颖的不依赖于突变的基因KI方法,其靶向疾病基因的两个等位基因的5’UTR,在某些方面,其在治疗等位基因显性遗传疾病中具有治疗潜力。
实施例2——示例性方法
动物RHOP23H/P23H和C57BL/6J小鼠购自The Jackson Laboratory。RHO-/-小鼠获自Janis Lem(Tufts University,Boston,Massachusetts,USA)。1使用引物组,通过PCR对RHOP23H/wt、RHOP23H/P23H和RHO-/-小鼠进行基因分型,如早期出版物所建议的。1,2所有小鼠均保持在12小时光照/12小时黑暗的循环中。
质粒构建用于SpCas9 gRNA敲除效率测试的pAAV-CMV-SpCas9-2A-mCherry-bGHPA-U6-gRNA的构建如前文所述3。简言之,将pAAV-CMV-SaCas9-U6-Bsal-gRNA(AddgeneNo.61591)的SaCas9盒替换为SpCas9,SpCas9是通过AgeI和BamHI位点从LentiV-Cas9-puro(Addgene No.108100)扩增的。将gRNA1和gRNA2(引物组Rho gRNA1/2Sp F和R)通过BsaI位点插入pAAV-CMV-SpCas9-2A-mCherry-bGHPA-U6-gRNA中。
为了测试基因敲入治疗,构建了pAAV-hRK-SpCas9(SEQ ID NO:31)、pAAV-hRK-mCherry-U6-gRNA1(SEQ ID NO:32)、pAAV-hRK-mCherry-U6-gRNA1-RHO-HITI供体(SEQ IDNO:33)和pAAV-hRK-mCherry-U6-gRNA1-GFP-HITI供体(SEQ ID NO:34)。pAAV-hRK-SpCas9是通过将pAAV-hRK-iZsGreen(T.Li Laboratory,National Eye Institute,Bethesda,MD4)中的iZsGreen替换为SpCas9序列来制备的。通过首先经由Xbal和BamHI插入hRK-mCherry、然后经由BsaI位点插入gRNA1序列至骨架质粒pAAV-CMV-SaCas9-U6-Bsal-gRNA(AddgeneNo.61591),进行pAAV-hRK-mCherry-U6-gRNA1的克隆。为了构建RHO-HITI供体,使用包含CRISPR/Cas9 gRNA1靶位点的引物(RHO CDS F和R)从C57BL/6J的视网膜cDNA中扩增RHO-CDS,并将其插入骨架载体pAAV-hRK-mCherry-pA-U6-gRNA1中,以生成pAAV-hRK-mCherry-pA-U6-gRNA1-RHOHITI供体。pAAV-hRK-mCherry-pA-U6-gRNA-GFP HITI供体以类似的方法构建。
用于基因敲入治疗的质粒的核苷酸序列如下提供:
pAAV-hRK-SpCas9:
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCTCTAGACTCGAGTTGGGCCCCAGAAGCCTGGTGGTTGTTTGTCCTTCTCAGGGGAAAAGTGAGGCGGCCCCTTGGAGGAAGGGGCCGGGCAGAATGATCTAATCGGATTCCAAGCAGCTCAGGGGATTGTCTTTTTCTAGCACCTTCTTGCCACTCCTAAGCGTCCTCCGTGACCCCGGCTGGGATTTAGCCTGGTGCTGTGTCAGCCCCGGTCTCCCAGGGGCTTCCCAGTGGTCCCCAGGAACCCTCGACAGGGCCCGGTCTCTCTCGTCCAGCAAGGGCAGGGACGGGCCACAGGCCAAGGGCCCTCGATACCGGTGCCACCATGTACCCATACGATGTTCCAGATTACGCTTCGCCGAAGAAAAAGCGCAAGGTCGAAGCGTCCGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACAGCCCCAAGAAGAAGAGAAAGGTGGAGGCCAGCTAAGAATTCAATAAAAGATCTTTATTTTCATTAGATCTGTGTGTTGGTTTTTTGTGTGCGGCCGCAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACGTCAAAGCAACCATAGTACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCTTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTTGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACTCTATCTCGGGCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGTCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCTTAGACGTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGAAGCCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGT(SEQ ID NO:31;参见图23的质粒图谱)。
pAAV-hRK-mCherry-U6-gRNA1:
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCTCTAGACTCGAGTTGGGCCCCAGAAGCCTGGTGGTTGTTTGTCCTTCTCAGGGGAAAAGTGAGGCGGCCCCTTGGAGGAAGGGGCCGGGCAGAATGATCTAATCGGATTCCAAGCAGCTCAGGGGATTGTCTTTTTCTAGCACCTTCTTGCCACTCCTAAGCGTCCTCCGTGACCCCGGCTGGGATTTAGCCTGGTGCTGTGTCAGCCCCGGTCTCCCAGGGGCTTCCCAGTGGTCCCCAGGAACCCTCGACAGGGCCCGGTCTCTCTCGTCCAGCAAGGGCAGGGACGGGCCACAGGCCAAGGGCCCTCGATACCGGTGCCACCATGGTGAGCAAGGGCGAGGAGGATAACATGGCCATCATCAAGGAGTTCATGCGCTTCAAGGTGCACATGGAGGGCTCCGTGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAAGGGTGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCTCAGTTCATGTACGGCTCCAAGGCCTACGTGAAGCACCCCGCCGACATCCCCGACTACTTGAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGCGTGGTGACCGTGACCCAGGACTCCTCCCTGCAGGACGGCGAGTTCATCTACAAGGTGAAGCTGCGCGGCACCAACTTCCCCTCCGACGGCCCCGTAATGCAGAAGAAGACCATGGGCTGGGAGGCCTCCTCCGAGCGGATGTACCCCGAGGACGGCGCCCTGAAGGGCGAGATCAAGCAGAGGCTGAAGCTGAAGGACGGCGGCCACTACGACGCTGAGGTCAAGACCACCTACAAGGCCAAGAAGCCCGTGCAGCTGCCCGGCGCCTACAACGTCAACATCAAGTTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGAACAGTACGAACGCGCCGAGGGCCGCCACTCCACCGGCGGCATGGACGAGCTGTACAAGTAAGAATTCCTAGAGCTCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGAGAATAGCAGGCATGCTGGGGAGGTACCGAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTAGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGCTGTCTACGAAGAGCCCGTGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTGACGCGTCCGCGTCGACATAAGAATGCGGCCGCAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACGTCAAAGCAACCATAGTACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCTTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTTGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACTCTATCTCGGGCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGTCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCTTAGACGTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGAAGCCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGT(SEQ ID NO:32;参见图24的质粒图谱)。
pAAV-hRK-mCherry-U6-gRNA1-RHO-HITI供体:
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCTTCTAGACTCGAGTTGGGCCCCAGAAGCCTGGTGGTTGTTTGTCCTTCTCAGGGGAAAAGTGAGGCGGCCCCTTGGAGGAAGGGGCCGGGCAGAATGATCTAATCGGATTCCAAGCAGCTCAGGGGATTGTCTTTTTCTAGCACCTTCTTGCCACTCCTAAGCGTCCTCCGTGACCCCGGCTGGGATTTAGCCTGGTGCTGTGTCAGCCCCGGTCTCCCAGGGGCTTCCCAGTGGTCCCCAGGAACCCTCGACAGGGCCCGGTCTCTCTCGTCCAGCAAGGGCAGGGACGGGCCACAGGCCAAGGGCCCTCGATACCGGTGCCACCATGGTGAGCAAGGGCGAGGAGGATAACATGGCCATCATCAAGGAGTTCATGCGCTTCAAGGTGCACATGGAGGGCTCCGTGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAAGGGTGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCTCAGTTCATGTACGGCTCCAAGGCCTACGTGAAGCACCCCGCCGACATCCCCGACTACTTGAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGCGTGGTGACCGTGACCCAGGACTCCTCCCTGCAGGACGGCGAGTTCATCTACAAGGTGAAGCTGCGCGGCACCAACTTCCCCTCCGACGGCCCCGTAATGCAGAAGAAGACCATGGGCTGGGAGGCCTCCTCCGAGCGGATGTACCCCGAGGACGGCGCCCTGAAGGGCGAGATCAAGCAGAGGCTGAAGCTGAAGGACGGCGGCCACTACGACGCTGAGGTCAAGACCACCTACAAGGCCAAGAAGCCCGTGCAGCTGCCCGGCGCCTACAACGTCAACATCAAGTTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGAACAGTACGAACGCGCCGAGGGCCGCCACTCCACCGGCGGCATGGACGAGCTGTACAAGTAAGAATTCCTAGAGCTCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGAGAATAGCAGGCATGCTGGGGAGGTACCGAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTAGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGCTGTCTACGAAGAGCCCGTGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTGACGCGTCCCCACGGGCTCTTCGTAGACAGAGCCGCAGCCATGAACGGCACAGAGGGCCCCAATTTTTATGTGCCCTTCTCCAACGTCACAGGCGTGGTGCGGAGCCCCTTCGAGCAGCCGCAGTACTACCTGGCGGAACCATGGCAGTTCTCCATGCTGGCAGCGTACATGTTCCTGCTCATCGTGCTGGGCTTCCCCATCAACTTCCTCACGCTCTACGTCACCGTACAGCACAAGAAGCTGCGCACACCCCTCAACTACATCCTGCTCAACTTGGCCGTGGCTGACCTCTTCATGGTCTTCGGAGGATTCACCACCACCCTCTACACATCACTCCATGGCTACTTCGTCTTTGGGCCCACAGGCTGTAATCTCGAGGGCTTCTTTGCCACACTTGGAGGTGAAATCGCCCTGTGGTCCCTGGTGGTCCTGGCCATTGAGCGCTACGTGGTGGTCTGCAAGCCGATGAGCAACTTCCGCTTCGGGGAGAATCACGCTATCATGGGTGTGGTCTTCACCTGGATCATGGCGTTGGCCTGTGCTGCTCCCCCACTCGTTGGCTGGTCCAGGTACATCCCTGAGGGCATGCAATGTTCATGCGGGATTGACTACTACACACTCAAGCCTGAGGTCAACAACGAATCCTTTGTCATCTACATGTTCGTGGTCCACTTCACCATTCCTATGATCGTCATCTTCTTCTGCTATGGGCAGCTGGTCTTCACAGTCAAGGAGGCGGCTGCCCAGCAGCAGGAGTCAGCCACCACTCAGAAGGCAGAGAAGGAAGTCACCCGCATGGTTATCATCATGGTCATCTTCTTCCTGATCTGCTGGCTTCCCTACGCCAGTGTGGCCTTCTACATCTTCACCCACCAGGGCTCCAACTTCGGCCCCATCTTCATGACTCTGCCAGCTTTCTTTGCTAAGAGCTCTTCCATCTATAACCCGGTCATCTACATCATGTTGAACAAGCAGTTCCGGAACTGTATGCTCACCACGCTGTGCTGCGGCAAGAATCCACTGGGAGATGACGACGCCTCTGCCACCGCTTCCAAGACGGAGACCAGCCAGGTGGCTCCAGCCTAATAAGTCGACCCCCACGGGCTCTTCGTAGACAGGCGGCCGCAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACGTCAAAGCAACCATAGTACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCTTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTTGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACTCTATCTCGGGCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGTCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCTTAGACGTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGAAGCCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGT(SEQ ID NO:33;参见图25的质粒图谱)。
pAAV-hRK-mCherry-U6-gRNA1-GFP-HITI供体:
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCTCTAGACTCGAGTTGGGCCCCAGAAGCCTGGTGGTTGTTTGTCCTTCTCAGGGGAAAAGTGAGGCGGCCCCTTGGAGGAAGGGGCCGGGCAGAATGATCTAATCGGATTCCAAGCAGCTCAGGGGATTGTCTTTTTCTAGCACCTTCTTGCCACTCCTAAGCGTCCTCCGTGACCCCGGCTGGGATTTAGCCTGGTGCTGTGTCAGCCCCGGTCTCCCAGGGGCTTCCCAGTGGTCCCCAGGAACCCTCGACAGGGCCCGGTCTCTCTCGTCCAGCAAGGGCAGGGACGGGCCACAGGCCAAGGGCCCTCGATACCGGTGCCACCATGGTGAGCAAGGGCGAGGAGGATAACATGGCCATCATCAAGGAGTTCATGCGCTTCAAGGTGCACATGGAGGGCTCCGTGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAAGGGTGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCTCAGTTCATGTACGGCTCCAAGGCCTACGTGAAGCACCCCGCCGACATCCCCGACTACTTGAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGCGTGGTGACCGTGACCCAGGACTCCTCCCTGCAGGACGGCGAGTTCATCTACAAGGTGAAGCTGCGCGGCACCAACTTCCCCTCCGACGGCCCCGTAATGCAGAAGAAGACCATGGGCTGGGAGGCCTCCTCCGAGCGGATGTACCCCGAGGACGGCGCCCTGAAGGGCGAGATCAAGCAGAGGCTGAAGCTGAAGGACGGCGGCCACTACGACGCTGAGGTCAAGACCACCTACAAGGCCAAGAAGCCCGTGCAGCTGCCCGGCGCCTACAACGTCAACATCAAGTTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGAACAGTACGAACGCGCCGAGGGCCGCCACTCCACCGGCGGCATGGACGAGCTGTACAAGTAAGAATTCCTAGAGCTCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGAGAATAGCAGGCATGCTGGGGAGGTACCGAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTAGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGCTGTCTACGAAGAGCCCGTGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTGACGCGTCCCCACGGGCTCTTCGTAGACAGAGCCGCAGCCATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTAATAAGTCGACCCCCACGGGCTCTTCGTAGACAGGCGGCCGCAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACGTCAAAGCAACCATAGTACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCTTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTTGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACTCTATCTCGGGCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGTCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCTTAGACGTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGAAGCCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGT(SEQ IDNO:34;参见图26的质粒图谱)。
构建了含有整合至RHO基因座中的HITI供体片段的双Kozak报告质粒,pCMV-Kozak-GFP-Stop-Kozak-RHO-Stop(SEQ ID NO:35)和pCMV-Kozak-RHO-Stop-Kozak-GFP-Stop(SEQ ID NO:36)。为了构建CMV-Kozak-GFP-Stop-Kozak-RHO-Stop,将在整合基因和破坏的内源性RHO之间含有Kozak基序的序列(Kozak-RHO-Stop)进行扩增,并通过限制性酶位点(SalI和MluI)插入到pCMV骨架质粒(pAAV-CMV-SpCas9-U6-Bsal-gRNA)中,以产生pCMV-Kozak-RHO-Stop。接下来,将模拟SpCas9-RHO KI诱导的5’UTR RHO的整合片段的Kozak-GFP-Stop片段进行扩增,并亚克隆至pCMV-Kozak-RHO-Stop中,以生成pCMV-Kozak-GFP-Stop-Kozak-RHO-Stop。使用类似的方法构建pCMV-Kozak-RHO-Stop-Kozak-GFP-Stop。
报告质粒的核苷酸序列如下提供:
Kozak-GFP-Kozak-RHO:
GCTGGGGAGGGCCGCAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACGTCAAAGCAACCATAGTACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCTTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTTGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACTCTATCTCGGGCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGTCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCTTAGACGTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGAAGCCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTCCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCTCTAGACTCGAGGCGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTCTCTGGCTAACTACCGGTAGACAGAGCCGCAGCCATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTAATAAGTCGACCCCCACGTGGGGCAGCCTCGAGAGCCGCAGCCATGAACGGCACAGAGGGCCCCAATTTTTATGTGCCCTTCTCCAACGTCACAGGCGTGGTGCGGAGCCCCTTCGAGCAGCCGCAGTACTACCTGGCGGAACCATGGCAGTTCTCCATGCTGGCAGCGTACATGTTCCTGCTCATCGTGCTGGGCTTCCCCATCAACTTCCTCACGCTCTACGTCACCGTACAGCACAAGAAGCTGCGCACACCCCTCAACTACATCCTGCTCAACTTGGCCGTGGCTGACCTCTTCATGGTCTTCGGAGGATTCACCACCACCCTCTACACATCACTCCATGGCTACTTCGTCTTTGGGCCCACAGGCTGTAATCTCGAGGGCTTCTTTGCCACACTTGGAGGTGAAATCGCCCTGTGGTCCCTGGTGGTCCTGGCCATTGAGCGCTACGTGGTGGTCTGCAAGCCGATGAGCAACTTCCGCTTCGGGGAGAATCACGCTATCATGGGTGTGGTCTTCACCTGGATCATGGCGTTGGCCTGTGCTGCTCCCCCACTCGTTGGCTGGTCCAGGTACATCCCTGAGGGCATGCAATGTTCATGCGGGATTGACTACTACACACTCAAGCCTGAGGTCAACAACGAATCCTTTGTCATCTACATGTTCGTGGTCCACTTCACCATTCCTATGATCGTCATCTTCTTCTGCTATGGGCAGCTGGTCTTCACAGTCAAGGAGGCGGCTGCCCAGCAGCAGGAGTCAGCCACCACTCAGAAGGCAGAGAAGGAAGTCACCCGCATGGTTATCATCATGGTCATCTTCTTCCTGATCTGCTGGCTTCCCTACGCCAGTGTGGCCTTCTACATCTTCACCCACCAGGGCTCCAACTTCGGCCCCATCTTCATGACTCTGCCAGCTTTCTTTGCTAAGAGCTCTTCCATCTATAACCCGGTCATCTACATCATGTTGAACAAGCAGTTCCGGAACTGTATGCTCACCACGCTGTGCTGCGGCAAGAATCCACTGGGAGATGACGACGCCTCTGCCACCGCTTCCAAGACGGAGACCAGCCAGGTGGCTCCAGCCTAAGAATTCCTAGAGCTCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGAGAATAGCAGGCAT(SEQ ID NO:35;参见图27的质粒图谱)。
Kozak-RHO-Kozak-GFP:
AATTAACCTAATTCACTGGCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCAACTTAATCGCCTTGCAGCACATCCCCCTTTCGCCAGCTGGCGTAATAGCGAAGAGGCCCGCACCGATCGCCCTTCCCAACAGTTGCGCAGCCTGAATGGCGAATGGGACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTATAATTTCAGGTGGCATCTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAATAGTGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGTAATGGTAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGCGGTTTTGCTCACATGTTCTTTCCTGCGTTATCCCCTGATTCTGTGGATAACCGTATTACCGCCTTTGAGTGAGCTGATACCGCTCGCCGCAGCCGAACGACCGAGCGCAGCGAGTCAGTGAGCGAGGAAGCGGAAGAGCGCCCAATACGCAAACCGCCTCTCCCCGCGCGTTGGCCGATTCATTAATGCAGCTGGCACGACAGGTTTCCCGACTGGAAAGCGGGCAGTGAGCGCAACGCAATTAATGTGAGTTAGCTCACTCATTAGGCACCCCAGGCTTTACACTTTATGCTTCCGGCTCGTATGTTGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGCTATGACCATGATTACGCCAGATTTAATTAAGGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTTGTAGTTAATGATTAACCCGCCATGCTACTTATCTACGTAGCCATGCTCTAGGAAGATCGGAATTCGCCCTTAAGCTAGCTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTCTCTGGCTAACTAAGCCGCAGCCATGAACGGCACAGAGGGCCCCAATTTTTATGTGCCCTTCTCCAACGTCACAGGCGTGGTGCGGAGCCCCTTCGAGCAGCCGCAGTACTACCTGGCGGAACCATGGCAGTTCTCCATGCTGGCAGCGTACATGTTCCTGCTCATCGTGCTGGGCTTCCCCATCAACTTCCTCACGCTCTACGTCACCGTACAGCACAAGAAGCTGCGCACACCCCTCAACTACATCCTGCTCAACTTGGCCGTGGCTGACCTCTTCATGGTCTTCGGAGGATTCACCACCACCCTCTACACATCACTCCATGGCTACTTCGTCTTTGGGCCCACAGGCTGTAATCTCGAGGGCTTCTTTGCCACACTTGGAGGTGAAATCGCCCTGTGGTCCCTGGTGGTCCTGGCCATTGAGCGCTACGTGGTGGTCTGCAAGCCGATGAGCAACTTCCGCTTCGGGGAGAATCACGCTATCATGGGTGTGGTCTTCACCTGGATCATGGCGTTGGCCTGTGCTGCTCCCCCACTCGTTGGCTGGTCCAGGTACATCCCTGAGGGCATGCAATGTTCATGCGGGATTGACTACTACACACTCAAGCCTGAGGTCAACAACGAATCCTTTGTCATCTACATGTTCGTGGTCCACTTCACCATTCCTATGATCGTCATCTTCTTCTGCTATGGGCAGCTGGTCTTCACAGTCAAGGAGGCGGCTGCCCAGCAGCAGGAGTCAGCCACCACTCAGAAGGCAGAGAAGGAAGTCACCCGCATGGTTATCATCATGGTCATCTTCTTCCTGATCTGCTGGCTTCCCTACGCCAGTGTGGCCTTCTACATCTTCACCCACCAGGGCTCCAACTTCGGCCCCATCTTCATGACTCTGCCAGCTTTCTTTGCTAAGAGCTCTTCCATCTATAACCCGGTCATCTACATCATGTTGAACAAGCAGTTCCGGAACTGTATGCTCACCACGCTGTGCTGCGGCAAGAATCCACTGGGAGATGACGACGCCTCTGCCACCGCTTCCAAGACGGAGACCAGCCAGGTGGCTCCAGCCTAACGCGTCCCCACGGGCTCTTCGTAGACAGAGCCGCAGCCATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTAATAAGGCCTGCTGCCGGCTCTGCGGCCTCTTCCGCGTCTTCGAGATCTGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGACTCGAGTTAAGGGCGAATTCCCGATAAGGATCTTCCTAGAGCATGGCTACGTAGATAAGTAGCATGGCGGGTTAATCATTAACTACAAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCCTT(参见图28的质粒图谱)。
为了包装AAV8病毒,使用pAAV rep/Cap 2/2、2/8、2/7m8和腺病毒辅助质粒。
引物
细胞培养和转染将HEK293T和MEF细胞在DMEM、10%(v/v)FBS、1%(v/v)4青霉素/链霉素(P/S)培养基中培养于37℃、5%CO2培养箱中。每2-3天达到90-95%汇合后,对细胞进行胰蛋白酶消化并以1:5至1:10的比例进行分离。使用1(mg/ml)聚乙烯亚胺(PEI)或LIPOFECTAMINETM3000将质粒转染至HEK293T和MEF细胞中。将PEI或LIPOFECTAMINETM3000与质粒以3:1的比例在DMEM培养基中混合(200μl/1μg质粒),并在室温下孵育10-15分钟。随后将混合物添加至含有DMEM、10%(v/v)FBS、1%(v/v)青霉素/链霉素培养基的HEK293T或MEF细胞中,并置于37℃、5%CO2培养箱中。转染后24小时,去除旧培养基并更换为新鲜DMEM。
视网膜下注射AAV将新生小鼠幼崽在冰中低温麻醉2-3分钟。在眼睑上切开一个切口以暴露眼球。将AAV-hRK-Cas9和AAV-hRK-18mCherry-pU6-gRNA供体病毒在PBS中混合至每种病毒的终浓度为5E12vg/ml。使用由(EPPENDORFTM)控制的拉角玻璃移液器将0.25μl病毒混合物注入视网膜下腔。在动物对照中,对动物的右眼进行注射,而左眼不进行注射。
转导细胞的荧光激活细胞分选(FACS)在转染后三天,将带有mCherry标记的转染MEF细胞进行胰蛋白酶消化并通过FACS进行分选。在新生小鼠中通过视网膜下递送的AAV-hRK-mCherry来标记光感受器。注射后14天,摘除眼以使用木瓜蛋白酶溶液进行视网膜剥离和分离。mCherry+和/或GFP+阳性细胞通过Sony SH800细胞分选仪进行分选和收集。
DNA提取使用PURELINKTMGenomic DNA Mini Kit(Thermo Fisher Scientific)提取基因组DNA(gDNA)。简言之,收集细胞或组织并用PBS冲洗两次。冲洗后,用含有蛋白酶K和RNAase的DNA裂解缓冲液在55℃下处理细胞/组织1小时或直至沉淀物溶解。接下来,将细胞裂解混合物与DNA结合缓冲液和乙醇充分混合,然后通过10,000g离心1分钟流过结合柱。结合后,用500μl洗涤缓冲液洗涤柱两次。最后,将gDNA回收至50μl洗脱缓冲液中,并保存在-20℃下进行进一步分析。
分解追踪插入缺失(TIDE)分析分解追踪插入缺失(TIDE)是Brinkman等人,2014开发的一种快速且可靠的CRISPR/Cas9基因编辑效率评估方法。TIDE使用来自传统Sanger测序结果的定量序列追踪数据来估计插入和缺失(INDEL)的频率或编辑效率,并鉴定DNA序列中的主要INDEL类型。使用特异性引物对和高保真DNA聚合酶,从gDNA样品中扩增CRISPR/Cas9靶位点周围的区域。在一些方面,扩增的片段为约700bp,并且靶位点位于测序起始位点下游200bp。在本研究中,HF DNA聚合酶(NEB-M0530L)用于扩增DNA片段。用于TIDE分析的引物列于引物表中。扩增如下:98℃5分钟,25个循环的(98℃30秒,65℃20秒,72℃20秒),72℃10分钟,4℃保持。PCR产物通过Sanger法测序。随后将测序结果上传至网络工具TIDE(可在tid.deskgen.com访问)或ICE CRISPR Analysis(可在ice.synthego.com访问),以分析编辑效率。
AAV包装和滴定重组AAV8载体在HEK293T细胞中产生,AAV纯化过程基于碘克沙醇梯度法。3HEK293T细胞在80-90%汇合时转染。对于5个板(150mm)的HEK293T细胞,将35μgpAAV载体转基因质粒、35μg rep/cap包装质粒和100μg腺病毒辅助质粒与510μg聚乙烯亚胺(PEI)在DMEM中混合(DNA:PEI=1:3)。将混合物在室温下孵育15分钟,然后添加至在DMEM、10%(v/v)NU-SERUMTM(355500,)、1%(v/v)P/S中培养的HEK293T细胞中。24小时后,将旧培养基更换为新鲜DMEM,1%(v/v)P/S。转染后72小时,收集AAV8上清液,2000g、4℃离心15分钟以去除细胞碎片。将细胞碎片澄清后,将收集的上清液与8.5%(w/v)PEG-8000、0.4M NaCl在4℃下混合2小时,以沉淀AAV病毒。然后在4℃下以7,000×g离心10分钟以收集沉淀颗粒,并重悬于病毒裂解缓冲液(150mM NaCl和20mM Tris,pH 8.0)中。通过在碘克沙醇梯度在4℃下以147,000xg超速离心90分钟来进一步纯化病毒混合物。收集存在于40%碘克沙醇级分中的AAV,并使用100K柱(EMD Millipore)用PBS洗涤3次。收集约200μl最终体积的AAV并储存于-80℃。通过蛋白SDS-PAGE方法进行病毒滴定。
视动测定和视网膜电图(ERG)通过THE OptoMotry System(CerebralMechanics)中的视动测试,以最大空间频率测量小鼠视敏度。在不知道注射了哪些AAV的情况下检查小鼠视敏度以避免偏差。在~70cd/m2的背景光下测试明视视觉,并将光栅的对比度设置为100%。将测试的老鼠置于一个被四个屏幕包围的平台上。屏幕上显示设定空间频率的垂直黑白光栅,并顺时针或逆时针旋转。通过摄像屏幕,根据小鼠是否随着光栅旋转(每节约5秒)移动,来检查小鼠视力。在过程中进行了一系列测试,以确定小鼠左眼和右眼能够看到的最大空间频率。
使用Espion E3 22系统(Diagnosys LLC),通过ERG测量来确定小鼠眼的生理机能。ERG方案是根据表征野生型小鼠的视杆和视锥反应的先前研究而开发的。4,5在进行ERG测试之前,使小鼠在暗柜中适应过夜,然后用氯胺酮/甲苯噻嗪(100/10mg/kg)混合物麻醉。用一滴5%去氧肾上腺素和0.5%托吡卡胺溶液散瞳5分钟,并用角膜凝胶保持水分。将小鼠置于平台上后,将用于测量电反应的金线电极放置在每个眼角膜上,同时将参考电极和接地电极分别放置于嘴和尾部。所有这些步骤都是在暗室中在暗红光下进行的。对于暗视ERG记录,引发具有不同强度(增量从0.01cd s/m2至30 7cd.s/m2)的多重530nm光,以刺激特定时间间隔内的暗视反应。对于明视ERG记录,采用在10cd.s/m2光强度下曝光5分钟来抑制视杆功能。通过照明背景(10cd.s/m2)下的30cd.s/m2强度的多次闪光来测量明视反应。记录B波的平均幅度和隐含期,并导出用于进一步分析。
光学相干断层扫描(OCT)使用Bioptigen谱域光学相干断层扫描仪(SD-OCT,Bioptigen Envisu R4310 SD-OCT,德国),进行体内OCT。手术前,用氯胺酮/甲苯噻嗪标准混合物(100mg氯胺酮+10mg甲苯噻嗪)/kg体重,通过腹膜内注射麻醉小鼠。在麻醉期间通过加热垫为小鼠提供补充的间接温暖。麻醉角膜和瞳孔,滴注0.5%盐酸丙美卡因(Provain-POS,德国)、0.5%托吡卡胺和0.5%盐酸去氧肾上腺素(Mydrin-P,Santen PharmaceuticalCo.,日本)溶液进行散瞳。在视网膜成像过程中,用润滑滴眼液(ULTRA,Alcon)使角膜湿润。为了对视网膜进行成像,使体积强度投影以视神经为中心,并应用以下扫描参数:直径1.7mm的径向体积扫描、1000A扫描/B扫描、8B扫描/体积、24帧/B扫描、80失活A扫描/B扫描和1体积。使用ImageJ进一步测量视网膜厚度。
视网膜切片和组织学通过CO2安乐死和颈椎脱位处死小鼠。在摘除眼球之前对眼球进行背侧标记,解剖视网膜并在室温下在4%甲醛中固定30分钟。固定的视网膜用PBS洗涤3次,然后按顺序分别在5%、15%和30%蔗糖中冷冻保护15、30和60分钟。接下来,将眼杯(eyecup)在最佳切割温度(OCT)和30%蔗糖溶液1:1中于4℃浸泡过夜,随后按方向嵌入包埋模具中,以获得背-腹定向切片或感染-未感染定向切片。将组织冷冻至-20℃以下后,使用cryostat机器(EPREDIATMMicrom HM525 NX Cryostat,Thermo Fisher)切割一系列20μm切片并收集在载玻片上。在免疫染色过程中,将视网膜切片或整个视网膜杯在封闭溶液(含有3% BSA、0.1% Triton X-100的PBS-PBST)中孵育30分钟,然后在4°下用推荐稀释度的一抗覆盖过夜。一抗孵育后,用PBST洗涤样品3次,然后在DAPI(0.5μg/ml)和二抗的混合物中在室温下避光孵育2小时。一抗和二抗如下表所示。在显微镜术处理或冷藏之前,将切片或整个平封视网膜用防褪色溶液封片。使用Zeiss LSM780共焦显微镜或Nikon ECLIPSENi-E正置显微镜捕获载玻片图像。使用ImageJ软件进行组织学测量和图像处理。
抗体
NGS分析为了定量接受5’UTR RHO KI的RHOP23H/wt小鼠视网膜中的RHO KI和INDEL频率,进行NGS以检测靶位点处的序列。简言之,将mCherry+细胞通过Sony SH800细胞分选仪进行分选和收集。使用PURELINKTMGenomic DNA Mini Kit(Thermo Fisher Scientific)提取gDNA。设计位于靶位点侧翼的引物对(RHO KI F:5′-GCTGAGCTCGCCAAGCAGCCTTGGT-3′(SEQ ID NO:19);RHO KI R:5′-CATGTACGCTGCCAGCATGGAGAAC-3′(SEQ ID NO:20)),以扩增提取的gDNA。PCR产物使用Illumina NovaSeq 6000平台进行测序并通过CRISPResso进行分析。
统计学分析数据以平均值±s.e.m.的形式表示。每个实验的样品量均已标出。进行单向或双向ANOVA分析,然后进行Tukey检验来比较多个组,并使用非配对的双尾学生t检验来比较两个组。
根据本公开,无需过度实验即可制备和执行本文公开和要求保护的所有组合物和方法。虽然已经根据优选的实施方案描述了本公开的组合物和方法,但是对于本领域技术人员来说显而易见的是,可以不脱离本公开的概念、精神和范围的情况下对组合物和方法以及本文所述的方法的步骤或步骤顺序进行变化。更具体地,显然,可以用在化学上和生理学上均相关的某些试剂替代本文所述的试剂,同时将实现相同或相似的结果。对于本领域技术人员来说显而易见的所有此类相似的替代和修改被认为处于由所附权利要求限定的本公开的精神、范围和概念内。

Claims (10)

1.一种用于体外编辑细胞基因组的方法,所述方法包括使所述细胞与包含核酸酶和编码敲入盒的外源核酸的组合物接触,所述敲入盒包含野生型基因的编码序列以及用于表达所述野生型基因的翻译起始和终止元件,
其中所述核酸酶引起编码所述野生型基因突变变体的内源核酸的5'端非编码区(5’UTR)内的断裂,
其中所述内源核酸在5’至3’方向上编码5’UTR、用于表达所述野生型基因突变变体的翻译起始元件、以及所述野生型基因的突变变体的编码序列,
其中所述编码敲入盒的外源核酸通过不依赖于同源性的靶向整合被整合至由所述内源核酸编码的翻译起始元件上游(5’)的内源核酸的5’UTR中。
2.根据权利要求1所述的方法,其中所述编码敲入盒的外源核酸的整合导致所述细胞表达所述野生型基因。
3.根据权利要求2所述的方法,其中所述细胞对所述野生型基因的表达抑制了所述野生型基因突变变体的表达。
4.根据权利要求1-3中任一项所述的方法,其中所述核酸酶是CRISPR/Cas核酸酶,并且其中所述方法进一步包括使所述细胞与用于所述CRISPR/Cas核酸酶的引导分子接触。
5.根据权利要求1-3中任一项所述的方法,其中所述核酸酶是锌指核酸酶(ZFN)、转录激活子样效应物核酸酶(TALEN)或大范围核酸酶。
6.根据权利要求1-5中任一项所述的方法,其中所述核酸酶由编码所述敲入盒的同一外源核酸编码,并且其中所述外源核酸包含在载体中。
7.根据权利要求6所述的方法,其中所述核酸酶是CRISPR/Cas核酸酶,并且其中包含编码所述核酸酶和所述敲入盒的外源核酸的载体进一步包含编码用于所述CRISPR/Cas核酸酶的引导分子的核酸。
8.根据权利要求6或7所述的方法,其中所述载体是质粒、转座子、粘粒、人工染色体、脂质纳米颗粒或病毒载体。
9.根据权利要求6-8中任一项所述的方法,其中所述载体是病毒载体,并且其中所述病毒载体是腺相关病毒(AAV)载体、腺病毒载体、慢病毒载体或逆转录病毒载体。
10.根据权利要求9所述的方法,其中所述病毒载体是AAV载体。
CN202311414456.8A 2022-11-11 2023-10-27 靶向5’utr的不依赖于突变的基因敲入治疗 Pending CN118028368A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US17/985,765 2022-11-11
US17/985,765 US20240156985A1 (en) 2022-11-11 2022-11-11 Mutation-independent gene knock-in therapy targeting 5' utr

Publications (1)

Publication Number Publication Date
CN118028368A true CN118028368A (zh) 2024-05-14

Family

ID=90994031

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311414456.8A Pending CN118028368A (zh) 2022-11-11 2023-10-27 靶向5’utr的不依赖于突变的基因敲入治疗

Country Status (2)

Country Link
US (1) US20240156985A1 (zh)
CN (1) CN118028368A (zh)

Also Published As

Publication number Publication date
US20240156985A1 (en) 2024-05-16

Similar Documents

Publication Publication Date Title
KR102584873B1 (ko) 심부 인트론 돌연변이의 유전자 편집
Chalberg et al. φC31 integrase confers genomic integration and long-term transgene expression in rat retina
US20230067480A1 (en) Method for treating usher syndrome and composition thereof
US20220143155A1 (en) Treatment of retinitis pigmentosa using engineered meganucleases
US20210115419A1 (en) CRISPR/Cas9-Mediated Exon-Skipping Approach for USH2A-Associated Usher Syndrome
US20220133768A1 (en) Crispr/rna-guided nuclease-related methods and compositions for treating rho-associated autosomal-dominant retinitis pigmentosa (adrp)
AU2017260426B2 (en) Engineered nucleases useful for treatment of hemophilia A
KR102662879B1 (ko) 망막 기능장애 질환 치료를 위한 유전자 조작
AU2016355343A1 (en) Compositions and methods for correction of heritable ocular disease
US11993776B2 (en) Trans-splicing molecules
US20230001019A1 (en) Crispr and aav strategies for x-linked juvenile retinoschisis therapy
Carvalho et al. Gene therapy for inherited retinal diseases: exploiting new tools in genome editing and nanotechnology
US20240207448A1 (en) Crispr/rna-guided nuclease-related methods and compositions for treating rho-associated autosomal-dominant retinitis pigmentosa (adrp)
WO2021010303A1 (ja) 顕性型変異遺伝子に由来する疾患の治療剤
JP2020528735A (ja) 反復伸長変異のためのゲノム編集システム
US20240156985A1 (en) Mutation-independent gene knock-in therapy targeting 5&#39; utr
LLADO SANTAEULARIA THERAPEUTIC GENOME EDITING IN RETINA AND LIVER
CN116334141A (zh) 基于基因编辑的RHO-R135W-adRP基因编辑药物
WO2024108055A1 (en) Methods for treating cep290 associated disease

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication