CN113874515A - 多任务处理调控组件以识别细胞类型特异性调控组件 - Google Patents

多任务处理调控组件以识别细胞类型特异性调控组件 Download PDF

Info

Publication number
CN113874515A
CN113874515A CN202080037824.XA CN202080037824A CN113874515A CN 113874515 A CN113874515 A CN 113874515A CN 202080037824 A CN202080037824 A CN 202080037824A CN 113874515 A CN113874515 A CN 113874515A
Authority
CN
China
Prior art keywords
fold
transgene
expression
nucleic acid
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080037824.XA
Other languages
English (en)
Inventor
K·拉马摩尔提
A·塔纳豪斯
S·伍德
M·穆尔黑德
S·塔利亚泰拉
J·S·陈
R·霍苏尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Coding Therapy Co
Encoded Therapeutics Inc
Original Assignee
Coding Therapy Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Coding Therapy Co filed Critical Coding Therapy Co
Publication of CN113874515A publication Critical patent/CN113874515A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1086Preparation or screening of expression libraries, e.g. reporter assays
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • G01N33/502Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing non-proliferative effects
    • G01N33/5023Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing non-proliferative effects on expression patterns
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/008Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Virology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Cell Biology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Medicinal Chemistry (AREA)
  • Toxicology (AREA)
  • Food Science & Technology (AREA)
  • Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本申请提供一种用于筛选及识别在所关注的特定细胞类型中提供选择性表达的调控组件的高通量方法。还提供用于该高通量筛选方法中的核酸组合物。

Description

多任务处理调控组件以识别细胞类型特异性调控组件
本申请案主张2019年3月22日申请的美国临时专利申请案第62/822,528号的优先权益,其以引用的方式并入本申请中。
背景技术
近年来,已利用基因疗法治疗疾病的临床试验的数目已不断地增加。这些临床试验面临的主要挑战之一为控制治疗性基因的表达量或沉默水平的能力,以便在治疗功效与因治疗蛋白或基于RNA干扰的序列的过度表达引起的非特定毒性之间提供平衡。具体而言,达成治疗有关剂量所需的转基因表达量基于特定疾病的固有病理生理学及转基因产物的性质(例如,细胞内与细胞外,结构与酶功能)而变化。另外,转基因的细胞特异性表达为特别需要的,因为其提供选择性靶向病理相关性细胞类型(例如,癌细胞)的能力且降低患者中不良事件的可能性。因此,需要识别用于将基因疗法或基因表达靶向所关注组织或细胞类型的调控组件及其使用方法,其可减少脱靶效应,增加目标组织及/或细胞类型中的治疗功效,且通过降低达成功效所需要的有效剂量来增加患者安全性及耐受性。
发明内容
在一些实施方案中,本发明提供一种识别于给定细胞类型中提供选择性表达的调控组件的方法,其包含:a)向细胞提供载体的混合物,这些载体各自包含可操作地连接于转基因的候选调控组件,其中各载体进一步包含条形码(barcode);b)自表达该转基因的复数个单细胞中分离RNA;c)通过测序单细胞中的每一者的转录组(transcriptome)来识别这些单细胞中的每一者;及d)使转录组中的条形码与候选调控组件相关联,从而识别在该细胞类型中提供选择性表达的调控组件。在一些实施方案中,调控组件选择性地增加细胞类型中转基因的表达。在一些实施方案中,调控组件提供与相同细胞类型中通过另一候选调控及/或对照调控组件驱动的表达相比,大于或小于至少2倍、至少4倍、至少6倍、至少8倍或至少10倍的转基因的选择性表达。在一些实施方案中,调控组件提供与相同细胞类型中通过另一候选调控组件及/或对照调控组件驱动的表达相比,大于或小于至少2%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的转基因的选择性表达。在一些实施方案中,调控组件提供与相同细胞类型中通过另一候选调控组件及/或对照调控组件驱动的表达相比,大于或小于约1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、7.5倍、8倍、9倍或10倍的转基因的选择性表达。在一些实施方案中,调控组件提供与不同细胞类型中相同调控组件的转基因的表达相比,大于或小于至少2倍、至少4倍、至少6倍、至少8倍或至少10倍的转基因的选择性表达。在一些实施方案中,调控组件提供与不同细胞类型中相同调控组件的转基因的表达相比,大于或小于至少2%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的转基因的选择性表达。在一些实施方案中,调控组件提供与不同细胞类型中相同调控组件的转基因的表达相比,大于或小于约1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、7.5倍、8倍、9倍或10倍的转基因的选择性表达。在一些实施方案中,调控组件在一种细胞类型中提供相对于至少一种其他细胞类型的转基因的选择性表达。在一些实施方案中,与兴奋性神经元相比,调控组件在GABA能神经元中提供转基因的选择性表达。在其他实施方案中,调控组件在GABA能神经元亚型,诸如表达谷氨酸脱羧酶2(decarboxylase 2;GAD2)、GAD1、NKX2.1、DLX1、DLX5、SST、PV或VIP的GABA能神经元中提供转基因的选择性表达。在其他实施方案中,与非PV神经元相比,调控组件在小白蛋白(parvalbumin;PV)神经元中提供转基因的选择性表达。在一些实施方案中,非PV神经元为兴奋性神经元、多巴胺能的(dopaminergic)神经元、星形胶质细胞(astrocyte)、小神经胶质细胞(microglia)或运动神经元中的一或多者。在一些实施方案中,调控组件提供与不同GABA能神经元亚型中相同调控组件的转基因的表达相比,大于或小于至少2%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的转基因的选择性表达。在一些实施方案中,调控组件提供与不同GABA能神经元亚型中相同调控组件的转基因的表达相比,大于或小于约1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、7.5倍、8倍、9倍或10倍的转基因的选择性表达。
在一些实施方案中,本发明提供一种于细胞类型或细胞亚型中识别提供转基因的选择性表达的调控组件的方法,其包含:a)向细胞提供载体的混合物,这些载体各自包含可操作地连接于转基因的候选调控组件,其中各载体进一步包含条形码;b)自表达该转基因的复数个单细胞中分离RNA;c)通过测序单细胞中的每一者的转录组来识别这些单细胞中的每一者;d)使转录组中的条形码与候选调控组件相关联;及e)将通过各候选调控组件提供的转基因的表达量与转基因的参考表达量进行比较;从而识别在该细胞类型中提供转基因的选择性表达的候选调控组件。在一些实施方案中,调控组件选择性地增加或减少细胞类型中转基因的表达。在一些实施方案中,转基因的参考表达量通过对照调控组件提供。在一些实施方案中,调控组件提供与相同细胞类型中通过另一候选调控组件及/或对照调控组件驱动的表达相比,大于或小于至少2倍、至少4倍、至少6倍、至少8倍或至少10倍的转基因的选择性表达。在一些实施方案中,调控组件提供与相同细胞类型中通过另一候选调控组件及/或对照调控组件驱动的表达相比,大于或小于至少2%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的转基因的选择性表达。在一些实施方案中,调控组件提供与相同细胞类型中通过另一候选调控组件及/或对照调控组件驱动的表达相比,大于或小于约1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、7.5倍、8倍、9倍或10倍的转基因的选择性表达。在一些实施方案中,转基因的参考表达量通过泛细胞(pan-cellular)调控组件提供。在一些实施方案中,泛细胞调控组件选自由以下者组成的组:巨细胞病毒主要即刻早期启动子(cytomegalovirus major immediate-early promoter;CMV)、鸡β-肌动蛋白启动子(chickenβ-actin promoter;CBA)、CMV早期增强子/CBA启动子(CMV early enhancer/CBA promoter;CAG)、延伸因子-1α启动子(elongation factor-1αpromoter;EF1α)、猴病毒40启动子(simian virus 40promoter;SV40)、磷酸甘油酸激酶启动子(phosphoglycerate kinase promoter;PGK)及聚泛素C基因启动子(polyubiquitin C gene promoter;UBC)。在一些实施方案中,调控组件提供与相同细胞类型中通过泛细胞调控组件驱动的表达相比,大于或小于至少2倍、至少4倍、至少6倍、至少8倍或至少10倍的转基因的选择性表达。在一些实施方案中,调控组件提供与相同细胞类型中通过泛细胞调控组件驱动的表达相比,大于或小于至少2%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的转基因的选择性表达。在一些实施方案中,调控组件提供与相同细胞类型中通过泛细胞调控组件驱动的表达相比,大于或小于约1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、7.5倍、8倍、9倍或10倍的转基因的选择性表达。在一些实施方案中,调控组件在一种细胞类型中提供相对于至少一种其他细胞类型的转基因的选择性表达。在一些实施方案中,与非PV神经元相比,调控组件在PV神经元中导致转基因的选择性表达。在一些实施方案中,非PV神经元为兴奋性神经元、多巴胺能的神经元、星形胶质细胞、小神经胶质细胞或运动神经元中的一或多者。
在一些实施方案中,本发明提供一种识别选择性表达可操作地连接于调控组件的转基因的细胞类型的方法,其包含:a)向细胞提供载体的混合物,这些载体各自包含可操作地连接于转基因的候选调控组件,其中各载体进一步包含条形码;b)自表达该转基因的复数个单细胞中分离RNA;c)通过测序单细胞中的每一者的转录组来识别这些单细胞中的每一者;d)使转录组中的条形码与候选调控组件相关联;及e)将通过候选调控组件在一种细胞类型中提供的转基因的表达量与相同候选调控组件在不同细胞类型中的表达量进行比较;从而识别选择性表达可操作地连接调控组件的转基因的细胞类型。在一些实施方案中,与至少一种其他细胞类型相比,调控组件选择性地增加或减少一种细胞类型中转基因的表达。在一些实施方案中,调控组件在一种细胞类型中提供与至少一种其他细胞类型中通过调控组件驱动的表达相比,大于或小于至少2倍、至少4倍、至少6倍、至少8倍或至少10倍的转基因的选择性表达。在一些实施方案中,调控组件在一种细胞类型中提供与至少一种其他细胞类型中通过调控组件驱动的表达相比,大于或小于至少2%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的转基因的选择性表达。在一些实施方案中,调控组件在一种细胞类型中提供与至少一种其他细胞类型中通过调控组件驱动的表达相比,大于或小于约1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、7.5倍、8倍、9倍或10倍的转基因的选择性表达。在一些实施方案中,与非PV神经元相比,调控组件在PV神经元中导致转基因的选择性表达。在一些实施方案中,非PV神经元为兴奋性神经元、多巴胺能的神经元、星形胶质细胞、小神经胶质细胞或运动神经元中的一或多者。
正如可容易地理解,在所关注的细胞或细胞类型中通过调控组件驱动的表达的选择性可以许多方法测量。举例而言,目标细胞类型中的基因表达相对于非目标细胞类型的选择性可通过将表达来自可操作地连接于一或多个调控组件的基因的转录物的可检测水平的目标细胞的数目与表达该基因的细胞的总数目进行比较来测量。此类测量、检测及定量可在活体内或活体外进行。
在一些情况下,特异性细胞类型的选择性可使用共定位分析来确定。在一些情况下,共定位分析是基于免疫组织化学。在一些情况下,将可检测报导基因用作转基因以允许在所关注的细胞类型中检测及/或测量基因表达。在一些情况下,特异性标记目标细胞的可检测标记(例如,荧光标记或抗体)用于检测及/或测量目标细胞。在一些情况下,共定位分析采用成像(例如,荧光成像)以确定不同荧光标记之间的重叠,例如,指示目标细胞的荧光信号与指示基因表达的另一荧光信号之间的重叠。在一些情况下,用于共定位分析的荧光标记包括红色荧光蛋白(red fluorescent protein;RFP),诸如tdTomato报导基因,及绿色荧光报导蛋白,诸如eGFP。
在一些实施方案中,调控组件在细胞类型中的选择性可通过基于免疫组织化学的共定位分析确定。在一些实施方案中,分析包含使用:a)可检测报导基因作为可操作地连接于调控组件的转基因以测量转基因表达及b)识别对目标细胞类型具特异性的标记的结合剂,其中结合剂连接至可检测标记。在一些实施方案中,可使用基于免疫组织化学的共定位分析使用以下来确定或证实细胞类型的选择性:a)可操作地连接于调控组件的转基因以测量转基因表达及b)识别连接至第二荧光标记的所关注细胞类型的抗体。
在一些实施方案中,本发明提供一种于给定细胞类型中识别提供选择性表达的调控组件的方法,其包含:a)向细胞提供载体的混合物,这些载体各自包含可操作地连接于转基因的候选调控组件,其中各载体进一步包含条形码;b)自表达该转基因的复数个单细胞中分离RNA;c)通过测序单细胞中的每一者的转录组来识别这些单细胞中的每一者;及d)使转录组中的条形码与候选调控组件相关联,从而识别在该细胞类型中提供选择性表达的调控组件。为增加在单细胞核RNAseq中降至低于检测阈值的AAV构建体的检测,在扩增之前进行富集PCR步骤。在一些实施方案中,在通过测序单细胞中的每一者的转录组来识别这些单细胞中的每一者之前,进行PCR富集步骤。在一些实施方案中,PCR富集步骤产生至少1-50倍、至少2-25倍或至少3-10倍来自AAV构建体的信号扩增。
在本申请所揭示的方法中的任一者的一些实施方案中,RNA选自由以下者组成的组:mRNA、长非编码RNA、反义转录物及pri-miRNA。在本申请所揭示的方法中的任一者的一些实施方案中,载体选自由以下者组成的组:质粒、病毒载体或黏接粘粒(cosmid)。在本申请所揭示的方法中的任一者的一些实施方案中,病毒载体为腺相关病毒(adeno-associated virus;AAV)载体。在本申请所揭示的方法中的任一者的一些实施方案中,AAV载体为AAV1、AAV8、AAV9、scAAV1、scAAV8或scAAV9。在本申请所揭示的方法中的任一者的一些实施方案中,AAV载体为AAV9。在本申请所揭示的方法中的任一者的一些实施方案中,载体包含5'AAV反向末端重复(inverted terminal repeat;ITR)序列及3'AAV ITR序列。在本申请所揭示的方法中的任一者的一些实施方案中,载体的混合物包含至少104个候选调控组件。在本申请所揭示的方法中的任一者的一些实施方案中,各候选调控组件与至少一个独特条形码相关。在本申请所揭示的方法中的任一者的一些实施方案中,转基因包含报导基因序列。在本申请所揭示的方法中的任一者的一些实施方案中,报导基因序列可操作地连接于编码核结合域的序列。在本申请所揭示的方法中的任一者的一些实施方案中,转基因包含条形码。在本申请所揭示的方法中的任一者的一些实施方案中,报导基因序列包含条形码。在本申请所揭示的方法中的任一者的一些实施方案中,条形码包含替代密码子。在本申请所揭示的方法中的任一者的一些实施方案中,编码核结合域的序列包含条形码。在本申请所揭示的方法中的任一者的一些实施方案中,编码核结合域的序列编码Klarsicht/ANC-1/Syne同源(Klarsicht/ANC-1/Syne homology;KASH)域或Sad1p/UNC-84(Sad1p/UNC-84;SUN)域蛋白,或其生物活性片段。在本申请所揭示的方法中的任一者的一些实施方案中,细胞类型属于选自由以下者组成的组的组织:结缔组织、肌肉组织、神经组织及上皮组织。
在一些实施方案中,本发明提供一种核酸分子,其包含可操作地连接于转基因的调控组件,其中核酸分子包含条形码。在一些实施方案中,条形码包含替代密码子。在一些实施方案中,转基因包含报导基因序列。在一些实施方案中,报导基因序列可操作地连接于编码核结合域序列的核苷酸序列。在一些实施方案中,核结合域序列编码KASH域或SUN域蛋白或其生物活性片段。在一些实施方案中,调控组件为非天然存在的。在一些实施方案中,报导基因序列编码荧光蛋白。在一些实施方案中,荧光蛋白为绿色荧光蛋白(greenfluorescent protein;GFP);增强型绿色荧光蛋白(enhanced green fluorescentprotein;EGFP);黄色荧光蛋白(yellow fluorescent protein;YFP),诸如mBanana;红色荧光蛋白(red fluorescent protein;RFP),诸如mCherry、DsRed、dTomato、tdTomato、mHoneydew或mStrawberry、TagRFP;远红色荧光帕米膦酸盐(far-red fluorescentpamidronate;FRFP),诸如mGrape1或mGrape2;青色荧光蛋白质(cyan fluorescentprotein;CFP)、蓝色荧光蛋白(blue fluorescent protein;BFP);增强型青色荧光蛋白质(enhanced cyan fluorescent protein;ECFP);群青荧光蛋白(ultramarine fluorescentprotein;UMFP);橙色荧光蛋白(orange fluorescent protein;OFP),诸如mOrange或mTangerine;红色(橙色)荧光蛋白(red(orange)fluorescent protein;mROFP);TagCFP或四半胱氨酸荧光基序。在一些实施方案中,转基因包含条形码。在一些实施方案中,编码核结合域的序列包含条形码。在一些实施方案中,报导基因序列包含条形码。在一些实施方案中,条形码置放于转基因的编码区内。在一些实施方案中,核酸分子包含非编码区,且其中条形码置放于转基因的非编码区内。在一些实施方案中,核酸分子包含非翻译区(untranslated region;UTR)且条形码置放于UTR内。在一些实施方案中,条形码序列位于核酸中自polyA尾部开始的约25、30、35、50、100、150、200、250、300、350、400、450或500个碱基内。在其他实施方案中,核酸包含polyA序列,且其中条形码置放于polyA序列的上游至少35个碱基处。在一些实施方案中,条形码置放于转录起始位点的上游。
在一些实施方案中,本发明提供一种核酸分子,其中核酸分子为自DNA分子转录的RNA分子,其中RNA分子包含转基因及条形码序列,其中DNA分子包含调控组件,且其中RNA分子中的条形码序列与DNA分子中的调控组件相关。在一些实施方案中,转基因包含报导基因序列。在一些实施方案中,报导基因序列可操作地连接于编码核结合域的核苷酸序列。在一些实施方案中,核结合域为KASH域或SUN域蛋白或其生物活性片段。在一些实施方案中,调控组件为非天然存在的。在一些实施方案中,报导基因序列编码荧光蛋白。在一些实施方案中,荧光蛋白为绿色荧光蛋白(GFP);增强型绿色荧光蛋白(EGFP);黄色荧光蛋白(YFP),诸如mBanana;红色荧光蛋白(RFP),诸如mCherry、DsRed、dTomato、tdTomato、mHoneydew或mStrawberry、TagRFP;远红色荧光帕米膦酸盐(FRFP),诸如mGrape1或mGrape2;青色荧光蛋白质(CFP);蓝色荧光蛋白(BFP);增强型青色荧光蛋白质(ECFP);群青荧光蛋白(UMFP);橙色荧光蛋白(OFP),诸如mOrange或mTangerine;红色(橙色)荧光蛋白(mROFP);TagCFP或四半胱氨酸荧光基序。在一些实施方案中,转基因包含条形码。在一些实施方案中,编码核结合域的序列包含条形码。在一些实施方案中,报导基因序列包含条形码。在一些实施方案中,条形码包含替代密码子。在一些实施方案中,核酸分子包含飞翻译区(UTR)且条形码置放于UTR内。在一些实施方案中,核酸分子包含polyA序列,且其中条形码置放于polyA序列的上游至少30至50个碱基处。在一些实施方案中,核酸分子连接至微粒。在一些实施方案中,微粒为珠粒。在一些实施方案中,微粒连接至微粒聚核苷酸分子。在一些实施方案中,核酸分子经由微粒聚核苷酸分子连接至微粒。在一些实施方案中,微粒聚核苷酸分子包含引物序列。在一些实施方案中,微粒聚核苷酸分子包含细胞条形码序列。在一些实施方案中,微粒聚核苷酸分子包含独特分子标志(Unique Molecular Identifier;UMI)核苷酸序列。在一些实施方案中,微粒聚核苷酸分子包含寡聚-dT序列。在一些实施方案中,微粒聚核苷酸分子包含:a)引物序列,b)细胞条形码序列,c)独特分子标志(UMI)核苷酸序列,及d)寡聚-dT序列;其中核酸包含polyA核苷酸序列,且其中微粒按以下顺序连接至a)-d):微粒--a)--b)--c)--d);且其中polyA核苷酸序列与寡聚-dT序列杂合。在一些实施方案中,微粒为珠粒。
在一些实施方案中,本发明提供一种载体,其包含本申请所揭示的核酸中的任一者。在一些实施方案中,载体为病毒载体。在一些实施方案中,载体为腺相关病毒载体。在一些实施方案中,腺相关病毒载体为AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、rh10及其杂合体、禽类AAV、牛类AAV、犬类AAV、马类AAV、灵长类AAV、非灵长类AAV及绵羊类AAV中的任一者。在一些实施方案中,腺相关病毒载体为AAV9载体。
在一些实施方案中,本发明提供一种细胞,其包含本申请所揭示的核酸中的任一者。
在一些实施方案中,本发明提供一种细胞,其包含本申请所揭示的载体中的任一者。
在一些实施方案中,本发明提供一种微粒,其连接至本申请所揭示的核酸中任一者的一或多者。在一些实施方案中,微粒为珠粒。在一些实施方案中,微粒连接至微粒聚核苷酸分子。在一些实施方案中,微粒聚核苷酸分子包含引物序列。在一些实施方案中,微粒聚核苷酸分子包含独特分子识别符(UMI)。在一些实施方案中,微粒聚核苷酸分子包含寡聚-dT序列。在一些实施方案中,核酸包含polyA核苷酸序列,且其中polyA核苷酸序列与寡聚-dT序列杂合。在一些实施方案中,微粒聚核苷酸分子包含:a)引物序列,b)细胞条形码序列,c)独特分子标志(UMI)序列,及d)寡聚-dT序列;其中核酸包含polyA核苷酸序列,其中微粒按以下顺序连接至a)-d):微粒--a)--b)--c)--d);且其中polyA核苷酸序列与寡聚-dT序列杂合。在一些实施方案中,微粒为珠粒。
在一些实施方案中,本发明提供一种液滴,其包含本申请所揭示的核酸分子中的任一者。
在一些实施方案中,本发明提供一种液滴,其包含本申请所揭示的细胞中的任一者。
在一些实施方案中,本发明提供一种液滴,其包含本申请所揭示的微粒中的任一者。
在一些实施方案中,本发明提供一种液滴,其包含本申请所揭示的细胞中的任一者及本申请所揭示的微粒中的任一者。
附图说明
本发明的新颖特征在随附权利要求范围中细致阐述。将参考阐述利用本发明原理的说明性实施方案及其附图的以下详细描述来获得对本发明的特征及优势的更佳理解:
[图1]图1A为用于活体内多任务处理调控组件(「RE」)以通过使用单细胞核RNAseq来评估RE特异性的方法的简单说明。图1B为用于单细胞核RNAseq的10X基因组学铬单细胞3'v2试剂盒的工作流的简化示意图。
[图2]说明基于文献衍生的典型生物标记标注的丛集(clustering)。生物标记定义于表2中。「Exc」=兴奋性神经元;「GABA」=GABA能神经元;「NonN」=非神经元细胞;「TPM」=每百万个转录物。
[图3]说明在各细胞群体内各带条形码的AAV转基因在CamKII启动子、CBA启动子或RE1调控组件(例如,SEQ ID NO:1)下的表达。「Exc」=兴奋性神经元;「GABA」=GABA能神经元;「NonN」=非神经元细胞;「TPM」=每百万个转录物。
[图4]说明在各细胞群体内各AAV转基因的CBA标准化倍数变化(即,相对于给定细胞群体内的平均CBA表达的各AAV转基因的表达)。兴奋性群体内的倍数变化经标准化至1。分别展示各带条形码的AAV转基因。「Exc」=兴奋性神经元;「GABA」=GABA能神经元;「NonN」=非神经元细胞。
[图5]说明各细胞群体内的各AAV转基因的CBA标准化倍数变化。在各AAV转基因的两种带条形码的形式之间平均化表达值。兴奋性群体内的倍数变化经标准化至1。「Exc」=兴奋性神经元;「GABA」=GABA能神经元;「NonN」=非神经元细胞。
[图6]说明与四种GABA亚群(针对小白蛋白(PV)、血管活性肠多肽(vasoactiveintestinal polypeptide;VIP)、生长抑素(Sst)或神经元衍生的神经营养因子-颤蛋白(Ndnf-Reln)呈阳性的亚群)相比,兴奋性细胞中的AAV转基因表达。
[图7]为展示GABA能及兴奋性神经元中的各调控组件的AAV L3库的表达(TPM)的图式。对照调控组件为:CBA(构建体1)、EF1α(构建体2)及RE1(构建体3)。
[图8]为展示GABA能及兴奋性神经元中的各调控组件的AAV L3.2库(library)的表达(TPM)的图式。对照调控组件为:CBA(构建体1)、EF1α(构建体2)及RE1(构建体3)。
[图9]为展示GABA能神经元(AAV L3及AAV L3.2库)中的各种RE的细胞类型特异性表达的图式。各构建体的表达经标准化至AAV EF1α相关联的转基因的平均TPM表达。对照调控组件为:CBA(构建体1)、EF1α(构建体2)及RE1(构建体3)。
[图11]为展示一类GABA能神经元(例如,PV、SST及VIP细胞)内的特异性细胞类型内的细胞类型特异性表达(AAV9 L3.2库)的图式。各构建体的表达经标准化至AAV EF1α相关联的转基因的平均TPM表达。对照调控组件为:CBA(构建体1)、EF1α(构建体2)及RE1(构建体3)。
具体实施方式
一个基因疗法的挑战为确保所关注的转基因在适当的所关注的细胞类型或目标细胞类型中表达,以影响或靶向基因表达而没有或具有最小脱靶效应。靶向基因疗法的传统方法通常依赖于递送方法及/或媒剂(例如,改变所使用的病毒或病毒的壳体序列)。涉及递送转基因的治疗方法也具有大量挑战,例如转基因大小的限制,此系因为许多载体对于转基因大小具有有限容量。举例而言,AAV载体的最大容量为大约4.7kb,且两个反向末端重复序列(ITR)为约0.2-0.3kb,保留需要容纳转基因及控制转基因表达的调控组件两者的大约4.4kb。
本发明提供筛选调控组件以识别在所关注的细胞类型中提供所关注的基因(转基因)的选择性表达的调控组件的组合物及方法。特定而言,本发明提供筛选诸多(例如,10至104个)调控组件(例如,活体内或活体外)以便识别在特异性细胞群体中达成转基因的生理上或治疗上相关的表达水平的调控组件的方法。在一些实施方案中,本发明提供一种高通量系统,其用于在数千个候选调控组件中识别在所关注的细胞类型中提供所关注的转基因的选择性表达(从而当用于在治疗环境中驱动转基因表达时,有效地最小化或消除脱靶效应)的调控组件。本发明还可用于识别何种细胞类型对使用所关注的调控组件来表达转基因更适合(或更具选择性)。即,使用本发明方法,给定调控组件可「匹配」给定细胞类型(例如,PV神经元、心肌细胞等),以用于任何所关注的转基因的最佳选择性表达。通过使用本申请中所揭示的方法来识别调控组件,有可能改善基因疗法的功效、降低产生治疗效果所需的有效剂量、最小化副作用或脱靶效应且/或增加患者安全性及/或耐受性。本发明还提供适用于实践本发明方法的组合物。
定义
如本申请中所使用,除非上下文另外清楚地指示,否则单数形式「一(a/an)」及「该(the)」意欲也包括复数形式。此外,就实施方式及/或权利要求中使用的术语「包括(including/includes)」、「具有(having/has/with)」、或其变化形式的程度而言,此类术语意欲以类似于术语「包含」的方式包括端点。
术语「AAV」为腺相关病毒的缩写,且可用于指代病毒自身或其衍生物。除非另有要求,否则该术语涵盖所有血清型、亚型以及天然存在及重组形式两者。缩写「rAAV」指重组腺相关病毒。术语「AAV」包括AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、rh10及其杂合体、禽类AAV、牛类AAV、犬类AAV、马类AAV、灵长类AAV、非灵长类AAV及绵羊类AAV。AAV的各种血清型的基因组序列,以亚基的序列为所属领域中已知的。此类序列可发现于文献中或诸如GenBank的公共数据库中。如本申请中所使用,「rAAV载体」系指包含不属于AAV来源的聚核苷酸序列(即,与AAV异源的聚核苷酸)(通常为一种用于细胞的遗传转化的所关注序列)的AAV载体。在一些实施方案中,异源聚核苷酸通过至少一个,且一般通过两个AAV反向末端重复序列(ITR)侧接。rAAV载体可为单股(ssAAV)或自身互补型(scAAV)。「AAV病毒」或「AAV病毒颗粒」指由至少一个AAV壳体蛋白及壳体化聚核苷酸rAAV载体组成的病毒颗粒。若粒子包含异源聚核苷酸(即,除野生型AAV基因组(诸如待递送至哺乳动物细胞的转基因)以外的聚核苷酸),则其通常称为「rAAV病毒颗粒」或简称为「rAAV颗粒」。
术语「约(about)」或「大致(approximately)」意谓在如由本领域技术人员所测定的特定值的可接受误差范围内,其将部分取决于如何测量或测定该值,即测量系统的限制。举例而言,根据所属技术领域中的实践,「约」可意谓在一个或大于一个标准偏差的范围内。替代地,「约」可意谓高于或低于既定值至多20%、至多15%、至多10%、至多5%或至多1%的范围。
术语「连接至(connected to/connect to)」意谓两个或更多个实体之间的缔合,例如本申请中所揭示的核酸中的任一者中的两者或更多者之间的缔合。两个实体可通过例如共价键(例如,将两个或更多个核酸核苷酸链连接在一起的磷酸二酯键)或氢键(例如,与一个核酸分子上的核苷酸序列及另一核酸分子上的互补核苷酸序列之间的杂合相关的氢键)相互连接。
应理解,每当本申请中用语言「包含」描述实施方案时,还提供用术语「由…组成」及/或「基本上由…组成」所描述的类似实施方案。
术语「测定(determining)」、「测量(measuring)」、「评估(evaluating)」、「评定(assessing)」、「分析(assaying)」、「分析(analyzing)」及其文法等效者可在本申请中互换地使用以指任何测量形式,且包括确定要素是否存在(例如检测)。这些术语可包括定量及/或定性测定两者。评估可为相对或绝对的。
术语「表达(expression/expressing)」指核酸序列或核酸分子及/或聚核苷酸自DNA模板转录(诸如转录为mRNA或其他RNA转录物)的过程及/或将经转录mRNA随后翻译成肽、多肽或蛋白质的过程。术语「表达(expression/expressing)」也可指非编码RNA分子(诸如反义RNA分子、RNAi分子及/或短发夹(short hairpin)RNA分子)的转录。转录物及编码多肽可统称为「基因产物」。若聚核苷酸衍生自基因组DNA,则表达可包括真核细胞中mRNA的剪接。
核苷酸或肽序列的「片段」意谓指小于认为是「全长」序列的序列。
DNA或蛋白质序列的「功能片段」指序列的生物活性片段,其比全长或参考DNA或蛋白质序列短,但保留至少一种与全长或参考DNA或蛋白质序列的生物活性实质上类似的生物活性(功能性或结构性)。
术语「活体外」指发生于个体体外的事件。举例而言,活体外分析涵盖个体体外的任何分析操作。活体外分析涵盖基于细胞的分析,其中采用存活或死亡细胞。活体外分析也涵盖无细胞分析,其中不采用完整细胞。
术语「活体内」指发生于个体体内的事件。
「经分离」核酸指已与其天然环境的组分分离的核酸分子。经分离核酸包括通常含有核酸分子的细胞中所含有的核酸分子,但该核酸分子存在于染色体外,存在于不同于其天然染色体位置的染色体位置处,或仅含有编码序列。
如本申请中所使用,「可操作地连接(operably linked)」、「可操作连接(operablelinkage)」、「可操作地连接(operatively linked)」或其文法等效物指基因组件(例如启动子、增强子、聚腺苷酸化序列等)的并接,其中组件处于允许其以预期方式操作的关系。举例而言,若包含启动子的调控组件有助于起始编码序列的转录,则该调控组件可操作地连接至编码区。在一些实施方案中,在调控组件与编码区之间可存在中间残基,只要维持此功能关系即可。
术语「调控组件」(可与「RE」互换使用)指能够影响(例如,增加、减少或调节)可操作连接序列(诸如基因)的表达的核酸序列或基因组件。调控组件包括但不限于:启动子、增强子、抑制子、沉默子、绝缘子序列、内含子、UTR、反向末端重复(ITR)序列、长末端重复序列(long terminal repeat sequence;LTR)、稳定性组件、微RNA结合位点、翻译后反应组件或polyA序列或其组合。调控组件可例如通过调节基因表达的转录阶段、转录后阶段或翻译阶段的基因表达;通过调节翻译水平(例如,稳定用于翻译的mRNA的稳定性组件)、RNA裂解、RNA剪接及/或转录终止;通过向增加基因表达的编码区募集转录因子;通过提高产生RNA转录物的速率、提高产生RNA的稳定性及/或提高自RNA转录物蛋白质合成的速率;及/或通过防止RNA降解及/或提高其稳定性以促进蛋白质合成来在DNA及/或RNA水平方面起作用。在一些实施方案中,调控组件指增强子、抑制子、启动子或其组合,尤其增强子加启动子组合或抑制子加启动子组合。在一些实施方案中,调控组件衍生自人类序列,例如该序列与衍生自人类序列的序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少93%、至少95%、至少96%、至少97%、至少98%或至少99%序列一致性。在一些实施方案中,调控组件为合成序列。
「候选调控组件」意谓将以本发明的分析方法中的任一者评估的调控组件。「候选调控组件」可包括一种调控组件或多于一种调控组件的组合。
「对照调控组件」意谓与候选调控组件进行比较的调控组件。在一些实施方案中,「对照调控组件」为具有良好表征的表达图谱的调控组件。举例而言,在一些实施方案中,「对照调控组件」为天然存在的调控组件,诸如鸡β肌动蛋白启动子(CBA)。
如本申请中所使用,「RNAseq」或「RNA-seq」用以指转录组学方法,其中使用第二代高通量测序(next generation sequencing;NGS)技术(例如,SOLiD、454、依鲁米那(Illumina)或ION Torrent)分离且测序来自给定样品的RNA的总补体。在一些实施方案中,将RNAseq转录物逆转录为cDNA,且将衔接子连接至cDNA的各端。在一些实施方案中,测序可单向(单端测序)或双向(成对末端测序)进行且接着与参考基因组数据库比对。
一般而言,可互换使用的「序列一致性」或「序列同源性」分别指两个聚核苷酸或多肽序列的精确的核苷酸与核苷酸或氨基酸与氨基酸对应性。两个或更多个序列(聚核苷酸或氨基酸)可通过测定其「一致性百分比」(亦称为「同源性百分比」)来比较。与参考序列(例如,核酸或氨基酸序列)的一致性百分比可计算为两个最佳比对序列之间的精确相配物的数目除以参考序列的长度且乘以100。当针对序列一致性测定相配物的数目时,不将保守性取代视为相配物。应了解,当第一序列(A)的长度不等于第二序列(B)的长度时,A:B序列的一致性百分比将不同于B:A序列的一致性百分比。序列比对(诸如出于评估一致性百分比的目的)可通过任何适合的比对算法或程序执行,包括(但不限于)尼德曼-翁施算法(Needleman-Wunsch algorithm)(参见例如可于全球信息网ebi.ac.uk/Tools/psa/emboss_needle/上获得的EMBOSS Needle比对器)、BLAST算法(参见例如可于全球信息网blast.ncbi.nlm.nih.gov/Blast.cgi上获得的BLAST比对工具)、史密斯-沃特曼算法(Smith-Waterman algorithm)(参见例如可于全球信息网ebi.ac.uk/Tools/psa/emboss_water/上获得的EMBOSS Water比对器)及Clustal Omega比对程序(参见例如全球信息网clustal.org/omega/及F.Sievers等人,Mol Sys Biol.7:539(2011))。最佳比对可使用所选算法的任何适合的参数(包括预设参数)来评估。BLAST程序基于Karlin及Altschul,Proc.Natl.Acad.Sci.USA 87:2264-2268(1990)的比对方法及如Altschul等人,J.Mol.Biol.215:403-410(1990);Karlin及Altschul,Proc.Natl.Acad.Sci.USA 90:5873-5877(1993);及Altschul等人,Nucleic Acids Res.25:3389-3402(1997)中所论述的比对方法。
术语「个体(subject)」及「受试者(individual)」在本申请中可互换使用以指脊椎动物,优选为哺乳动物,更优选为人类。
核苷酸序列的「变体」指与最常见野生型DNA序列(例如,通过其GenBank寄存编号提及的cDNA或序列)或特定参考序列相比具有基因改变或突变的序列。
如本申请中所使用,「载体」指可用于介导将其连接的另一核酸分子递送至其可复制或表达的细胞中的核酸分子。术语包括作为自我复制核酸结构的载体以及并入其已引入的宿主细胞的基因组中的载体。某些载体能够导引其可操作地连接的核酸的表达。此类载体在本申请中称为「表达载体」。载体的其他实例包括质粒、病毒载体及黏粒。
如本申请中所使用,术语「转基因」指并非天然存在于特定细胞中的聚核苷酸序列、外源地添加至细胞中的聚核苷酸序列及/或载体(例如,病毒载体,诸如AAV载体)中所含有的异源聚核苷酸序列。转基因可包含天然序列(例如,编码天然蛋白质的序列)以及合成序列。转基因可包含编码及/或非编码序列。在一些实施方案中,转基因为可操作地连接至调控组件的序列。
术语「选择性表达」或「选择性地表达」指转基因表达相对于参考表达水平(如本申请所定义)的选择性增加或减少,该参考表达水平由转基因可操作地连接的调控组件(例如,候选调控组件)驱动。在各种实施方案中,由调控组件提供的转基因的选择性表达包括:一种细胞类型中的转基因表达,其高于或低于相同细胞类型中由不同调控组件提供的转基因表达水平;一种细胞类型中的转基因表达,其高于或低于一或多种其他细胞类型中由相同调控组件提供的转基因表达水平;特定细胞类型中的转基因表达的增加或减小,其在表达可操作地连接至相同调控组件的相同转基因的不同细胞类型(参考细胞类型)中未观察到;表达可操作地连接至细胞群体(例如,目标组织)中的候选调控组件的转基因的一种特定细胞类型的目标细胞数目的比率相比于表达可操作地连接至相同调控组件的转基因的群体中的细胞总数增加或减少;当转基因可操作地连接至候选调控组件时,表达转基因的目标细胞的数目与表达转基因的细胞总数的比率相比于转基因可操作地连接至不同调控组件时所获得的比率增加或减少;目标细胞中的转基因表达水平,其比非目标细胞或非目标组织(例如,人类个体中)中的转基因表达水平高至少10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、120%、140%、150%、200%、250%、300%、350%、400%、450%、500%;在目标组织中所关注的细胞类型的至少一部分中以有意义的(例如,治疗相关的)水平发生的转基因表达;及/或相比于其他组织的细胞,主要发生在目标组织的那些那些细胞中的转基因表达。
术语「参考表达水平」指通过以下提供的表达水平:所关注的相同细胞类型中的另一候选调控组件;不同细胞类型中的相同候选调控;所关注的相同细胞类型中的已知的对照调控组件;及/或不同细胞类型中的已知的对照调控组件。
在调控组件的上下文中,术语「泛细胞」指驱动基因或转基因表达的调控组件,该基因或转基因与诸多细胞类型可操作地(或广泛地)连接。此类调控组件的一些实例包括巨细胞病毒主要即刻早期启动子(CMV)、鸡β-肌动蛋白启动子(CBA)、CMV早期增强子/CBA启动子(CAG)、延伸因子-1α启动子(EF1α)、猴病毒40启动子(SV40)、磷酸甘油酸激酶启动子(PGK)及聚泛素C基因启动子(UBC)。
术语「细胞类型」指细胞的独特形态或功能形式。可使用各种特征来鉴别细胞类型,包括例如:基因表达图谱、表观遗传图谱、非编码RNA谱、蛋白质表达图谱、细胞表面标记、分化潜能、增殖能力、对刺激或信号的反应、解剖位置、形态、染色图谱及/或发育期间出现的时间及/或前述的任意组合。在一些实施方案中,基于特定特征或特征的组合来定义细胞类型。举例而言,在一些实施方案中,基于特定基因或基因的组合的表达来定义细胞类型。在一些实施方案中,细胞类型可由其来源或起源的组织来定义,该组织例如结缔组织、肌肉组织、神经组织或上皮组织。借助于实例,源自肌肉组织的细胞包括心肌细胞(cardiacmuscle cells)(例如,心肌细胞(cardiomyocytes))、平滑肌细胞、骨胳肌细胞及前述任一者的各种亚群。各种不同的细胞类型可获自单个生物体(或相同物种的生物体)、单个器官或单个组织。例示性细胞类型包括但不限于:膀胱(urinary bladder)、胰脏上皮细胞、胰脏α、胰脏β、胰脏内皮、骨髓淋巴母细胞、骨髓B淋巴母细胞、骨髓巨噬细胞、骨髓成红血细胞、骨髓树突、骨髓脂肪细胞、骨髓骨细胞、骨髓软骨细胞、早幼粒细胞(promyeloblast)、骨髓巨核母细胞(megakaryoblast)、膀胱(bladder)、大脑B淋巴细胞、脑神经胶质、神经元、脑星形胶质细胞、神经外胚层(neuroectoderm)、脑巨噬细胞、脑小神经胶质细胞、脑上皮细胞、心肌细胞、皮质神经元、脑纤维母细胞、乳腺上皮细胞、结肠上皮细胞、结肠B淋巴细胞、乳腺上皮细胞、乳腺肌上皮细胞、乳腺纤维母细胞、结肠肠上皮细胞、子宫颈上皮细胞、卵巢上皮细胞、卵巢纤维母细胞、乳房导管上皮细胞、舌上皮细胞、扁桃体树突、扁桃体B淋巴细胞、外周血淋巴母细胞、外周血T淋巴母细胞、外周血皮肤T淋巴球、外周血自然杀伤细胞、外周血B淋巴母细胞、外周血单核细胞、外周血成髓细胞、外周血单核母细胞(monoblast)、外周血早幼粒细胞、外周血巨噬细胞、外周血嗜碱性粒细胞、肝脏内皮细胞、肝脏肥大细胞、肝脏上皮细胞、肝脏B淋巴细胞、脾内皮细胞、脾上皮细胞、脾B淋巴细胞、肝脏肝细胞、肝脏亚历山大细胞(liver Alexander)、肝脏纤维母细胞、肺上皮细胞、支气管上皮细胞、肺纤维母细胞、肺B淋巴细胞、肺神经鞘、肺鳞状细胞、肺巨噬细胞、肺成骨细胞、神经内分泌细胞、肺泡细胞、胃上皮细胞及胃纤维母细胞。
术语「报导子分子」指可用作细胞或生物体中的特定生物过程、活性、事件或状态的发生或水平的指示符的分子(例如,蛋白质)。报导子分子通常具有一或多种特性或酶活性,使得其易于测量或允许选择表达报导子分子的细胞。一般而言,可通过确定报导子分子自身(例如,DNA、RNA及/或蛋白质)的存在及/或测量其水平或报导子分子的酶活性来分析细胞中报导子分子的存在。报导子分子可具有的可检测特征或活性包括例如荧光、生物发光、与特定基质结合的能力、序列、在存在适合的基质的情况下催化产生荧光或彩色物质的反应的能力,或基于发射及/或吸收光子(光)的其他读数。通常,报导子分子为未通过使用报导子分子的细胞或生物体内源表达的分子,或已经改性以允许在内源性分子内进行选择性检测的分子。
术语「域」或「蛋白质域」指可独立于蛋白质链的其余部分而存在且发挥功能的蛋白质链的一部分。
术语「非天然」或「非天然地」或「变体」应意谓展现偏离天然存在的物的质量。
术语「统计学上显著」或「显著地」指统计显著性且通常意谓偏离参考水平的至少两个标准偏差(2SD)其定义为当虚无假设实际上为真时,作出拒绝虚无假设的决定的机率。
在本申请中所使用的术语「减小(decrease)」、「减少(reduced)」、「减少(reduction)」、「减小(decrease)」或「抑制」通常皆意谓所测量参数的可观测的减小。
本申请中所使用的术语「增加(increased/increase)」或「增强」或「活化」通常皆意谓所测量参数的可观测的增加。
如本申请中所使用,术语「治疗(treat/treatment)」、「疗法」及类似者指获得所需药理学及/或生理学功效,包括但不限于缓解、推迟或减缓进展;减少影响或症状;预防发作;预防复发;抑制、改善疾病或病症的发作;获得关于疾病、病症或医学病况的有益或所需结果,诸如治疗效益及/或预防效益。如本申请中所使用,「治疗」涵盖对哺乳动物,尤其人类的疾病的任何治疗,且包括:(a)预防疾病出现于易患有疾病或处于获得疾病的风险下但尚未诊断患有该疾病的个体中;(b)抑制疾病,即,遏制其发展;及(c)缓解疾病,即,引起疾病消退或以下中的任一者的渐变。治疗效益包括根除或改善所治疗的潜在病症。此外,经由根除或改善与潜在病症相关的生理症状中的一或多者来达成治疗效益,从而观测到个体的改善,尽管该个体仍可能罹患潜在病症。在一些实施方案中,针对预防效益,向处于罹患特定疾病的风险下的个体投予组合物,或向报导疾病的生理症状中的一或多者的个体投予组合物,尽管此疾病的诊断可能尚未做出。本发明的方法可用于任何哺乳动物。在一些实施方案中,治疗可引起症状的减少或停止。预防作用包括推迟或消除疾病或病况的出现;推迟或消除疾病或病况的症状发作;减缓、阻止或逆转疾病或病况的进展;或其任何组合。
除非另有指示,否则本申请中所使用的所有术语具有其对于本领域技术人员所意味的相同含义且本发明的实践将采用分子生物学、微生物学及重组DNA技术的习知技术,其在本领域技术人员的认知内。
核酸组合物
在一些实施方案中,本发明关于(例如,活体内或活体外)筛选诸多(例如,10至104个)候选调控组件以便识别在特异性细胞群体中提供所关注的转基因的选择性表达的调控组件的方法。在一些实施方案中,本发明关于(例如,活体内或活体外)筛选10至20、10至50、10至100、10至200、10至400、10至600、10至800、10至1000、10至3000、10至6000、10至10,000、10至13,000、10至16,000、10至20,000、10至30,000、10至40,000、10至50,000、10至60,000、10至70,000、10至80,000、10至90,000、10至100,000、10至500,000或10至1,000,000个候选调控组件以便识别在特异性细胞群体中提供所关注的转基因的选择性表达的调控组件的方法。方法包括向细胞(例如,细胞群体或组织)提供载体的混合物,这些载体各自包含具有可操作地连接至编码转基因(例如,包含报导基因)的序列的一或多个候选调控组件的核酸分子及用于调控组件识别的条形码序列。因此,在一些态样中,本申请中提供适用于实践本发明的方法的核酸组分及组合物。
在一些实施方案中,核酸为DNA分子。在一些实施方案中,核酸为RNA分子。在一些实施方案中,核酸为本申请中所揭示的载体中的任一者中的DNA分子。在一些实施方案中,核酸分子包含本申请中所揭示的转基因中的任一者。在一些实施方案中,核酸分子包含本申请中所揭示的候选调控组件中的任一者。在一些实施方案中,核酸包含本申请中所揭示的条形码序列中的任一者。在一些实施方案中,核酸为包含本申请中所揭示的转基因中的任一者、本申请中所揭示的候选调控组件中的任一者及本申请中所揭示的条形码序列中的任一者的DNA分子。在一些实施方案中,核酸分子为包含本申请中所揭示的转基因中的任一者及本申请中所揭示的条形码序列中的任一者的RNA核酸分子。在一些实施方案中,RNA分子自本申请中所揭示的DNA分子(例如,包含本申请中所揭示的转基因、候选调控组件及条形码序列中的任一者的DNA分子)中的任一者转录。在一些实施方案中,RNA分子自本申请中所揭示的DNA分子(例如,包含本申请中所揭示的转基因、候选调控组件及条形码序列中的任一者的DNA分子)中的任一者转录,其中RNA分子包含转基因及条形码序列,其中RNA分子中的条形码序列与DNA分子中的候选调控组件相关。
如下文更详细地论述,在一些实施方案中,本申请中所揭示的核酸分子中的任一者连接至微粒。在特定实施方案中,连接至微粒的核酸分子为自DNA分子(例如,本申请中所揭示的DNA分子中的任一者)转录的RNA分子。在一些实施方案中,RNA分子包含转基因及条形码序列。在一些实施方案中,DNA分子包含调控组件,其中RNA分子中的条形码序列与DNA分子中的调控组件相关。在一些实施方案中,微粒为珠粒。在一些实施方案中,微粒连接至微粒聚核苷酸分子。在一些实施方案中,核酸分子经由微粒聚核苷酸分子(例如,经由核酸分子及微粒聚核苷酸分子上的互补核苷酸序列之间的杂合)连接至微粒。在一些实施方案中,微粒聚核苷酸分子包含引物序列。在一些实施方案中,微粒聚核苷酸分子包含条形码序列。在一些实施方案中,微粒聚核苷酸分子包含独特分子标志(UMI)核苷酸序列。在一些实施方案中,微粒聚核苷酸分子包含寡聚-dT序列。在一些实施方案中,微粒聚核苷酸分子包含:a)引物序列,b)条形码序列,c)独特分子标志(UMI)核苷酸序列,d)寡聚-dT序列,及e)核酸序列;其中核酸包含polyA核苷酸序列,且其中微粒按以下顺序连接至a)-e):微粒--a)--b)--c)--d)--e);且其中polyA序列与寡聚-dT序列杂合。在一些实施方案中,微粒聚核苷酸分子包含:a)引物序列,b)条形码序列,c)独特分子标志(UMI)核苷酸序列,d)寡聚-dT序列,及e)核酸序列;其中核酸包含polyA核苷酸序列,且其中微粒按以下顺序连接至a)-e):微粒--a)--c)--b)--d)--e);且其中polyA序列与寡聚-dT序列杂合。
调控组件标志条形码
在一些实施方案中,本申请中所揭示的核酸分子中的任一者包含用于识别与其相关联的特定调控组件的核酸条形码序列。如本申请中所描述,本发明方法能够(例如,活体内或活体外)筛选诸多(例如,10至104个)RE,以便识别在特异性细胞类型及/或细胞群体(例如,神经元、心肌细胞等)或细胞亚型(例如,GABA能亚型,诸如表达谷氨酸脱羧酶2(GAD2)、GAD1、NKX2.1、DLX1、DLX5、SST、PV或VIP的GABA能神经元)中提供所关注的转基因的选择性表达的RE。通过将特定条形码序列分配(或标记、匹配、配对)至特定候选RE,使识别在给定细胞类型中提供选择性表达的RE的能力成为可能。当在细胞中检测转基因表达(例如,通过报导基因(诸如编码EGFP的基因)的表达)时,存在于细胞中的条形码序列使得有可能确定哪个特定候选RE存在于细胞中以驱动转基因(例如,EGFP)的表达。在某些实施方案中,条形码序列对于特定调控组件为唯一的。因此,对于本发明方法中测试的每个候选调控组件,使唯一的条形码序列与各候选调控组件配对,从而能够识别各候选调控组件。在一些实施方案中,本发明提供表达本申请中所揭示的核酸中的任一者的方法。在一些实施方案中,核酸的表达涉及在核酸中转录所关注的转基因的步骤,其中转基因可操作地连接至候选RE。由于在一些实施例中,核酸中的候选RE不再与转基因一起转录,所以条形码序列为尤其适用的,这是因为其保留识别促进核酸中的所关注的转基因的转录的特定候选RE的信息。在特定实施方案中,条形码序列在DNA核酸分子中。在一些实施方案中,条形码序列在自本申请中所揭示的DNA核酸分子中的任一者转录的RNA核酸分子中。
条形码序列的大小可在长度为约4至约100、约4至约50、约4至约20或约6至约20或更多个核苷酸的范围内。在某些实施方案中,条形码序列的长度为6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个核苷酸或更长。在某些实施方案中,条形码序列的长度为至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个核苷酸。在一些实施方案中,条形码序列为相邻的,即,在相邻核苷酸的单个序列段中,或在一些实施方案中,条形码序列分离成两个或更多个独立的子序列,该条形码序列由1个或更多个核苷酸分离。在某些实施方案中,分离的条形码子序列的长度可为约4至约16个核苷酸。在一些实施方案中,条形码子序列为4、5、6、7、8、9、10、11、12、13、14、15、16个核苷酸或更长。在某些实施方案中,条形码子序列可为至少4、5、6、7、8、9、10、11、12、13、14、15、16个核苷酸或更长。在某些实施方案中,条形码子序列可为至多4、5、6、7、8、9、10、11、12、13、14、15、16个核苷酸或更短。在一些实施方案中,条形码序列包含2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个条形码子序列,其中条形码子序列的长度为至少2至10个核苷酸。在一些实施方案中,条形码序列包含2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个条形码子序列,其中条形码子序列的长度为至少4至20个核苷酸。在一些实施方案中,两个或更多个条形码子序列之间存在一或多个核苷酸。在一些实施方案中,两个或更多个条形码子序列之间存在1至200、1至150、1至100、1至90、1至80、1至70、1至60、1至50、1至40、1至30、1至20、1至10、5至200、5至150、5至100、5至90、5至80、5至70、5至60、5至50、5至40、5至30、5至20、5至10、10至200、10至150、10至100、10至90、10至80、10至70、10至60、10至50、10至40、10至30、10至20、20至200、20至150、20至100、20至90、20至80、20至70、20至60、20至50、20至40、20至30、30至200、30至150、30至100、30至90、30至80、30至70、30至60、30至50、30至40、50至200、50至150、50至100、50至90、50至80、50至70、50至60、75至200、75至150、75至100、75至90、75至80、80至200、80至150、80至100或80至90个核苷酸。在一些实施方案中,条形码包含两个条形码子序列,其中各条形码子序列的长度为4至20个核苷酸,且其中条形码子序列通过1至200、1至150、1至100、1至90、1至80、1至70、1至60、1至50、1至40、1至30、1至20、1至10、5至200、5至150、5至100、5至90、5至80、5至70、5至60、5至50、5至40、5至30、5至20、5至10、10至200、10至150、10至100、10至90、10至80、10至70、10至60、10至50、10至40、10至30、10至20、20至200、20至150、20至100、20至90、20至80、20至70、20至60、20至50、20至40、20至30、30至200、30至150、30至100、30至90、30至80、30至70、30至60、30至50、30至40、50至200、50至150、50至100、50至90、50至80、50至70、50至60、75至200、75至150、75至100、75至90、75至80、80至200、80至150、80至100或80至90个核苷酸间隔开。在一些实施方案中,条形码包含三个条形码子序列,其中各条形码子序列的长度为4至20个核苷酸,且其中条形码子序列通过1至200、1至150、1至100、1至90、1至80、1至70、1至60、1至50、1至40、1至30、1至20、1至10、5至200、5至150、5至100、5至90、5至80、5至70、5至60、5至50、5至40、5至30、5至20、5至10、10至200、10至150、10至100、10至90、10至80、10至70、10至60、10至50、10至40、10至30、10至20、20至200、20至150、20至100、20至90、20至80、20至70、20至60、20至50、20至40、20至30、30至200、30至150、30至100、30至90、30至80、30至70、30至60、30至50、30至40、50至200、50至150、50至100、50至90、50至80、50至70、50至60、75至200、75至150、75至100、75至90、75至80、80至200、80至150、80至100或80至90个核苷酸间隔开。在一些实施方案中,条形码包含四个条形码子序列,其中各条形码子序列的长度为4至20个核苷酸,且其中条形码子序列通过1至200、1至150、1至100、1至90、1至80、1至70、1至60、1至50、1至40、1至30、1至20、1至10、5至200、5至150、5至100、5至90、5至80、5至70、5至60、5至50、5至40、5至30、5至20、5至10、10至200、10至150、10至100、10至90、10至80、10至70、10至60、10至50、10至40、10至30、10至20、20至200、20至150、20至100、20至90、20至80、20至70、20至60、20至50、20至40、20至30、30至200、30至150、30至100、30至90、30至80、30至70、30至60、30至50、30至40、50至200、50至150、50至100、50至90、50至80、50至70、50至60、75至200、75至150、75至100、75至90、75至80、80至200、80至150、80至100或80至90个核苷酸间隔开。在一些实施方案中,条形码包含五个或更多个条形码子序列,其中各条形码子序列的长度为4至20个核苷酸,且其中条形码子序列通过1至200、1至150、1至100、1至90、1至80、1至70、1至60、1至50、1至40、1至30、1至20、1至10、5至200、5至150、5至100、5至90、5至80、5至70、5至60、5至50、5至40、5至30、5至20、5至10、10至200、10至150、10至100、10至90、10至80、10至70、10至60、10至50、10至40、10至30、10至20、20至200、20至150、20至100、20至90、20至80、20至70、20至60、20至50、20至40、20至30、30至200、30至150、30至100、30至90、30至80、30至70、30至60、30至50、30至40、50至200、50至150、50至100、50至90、50至80、50至70、50至60、75至200、75至150、75至100、75至90、75至80、80至200、80至150、80至100或80至90个核苷酸间隔开。
在一些实施方案中,一或多个条形码序列可包括于核酸分子的多于一个区域中。举例而言,一或多个条形码序列可包括于编码区(例如,编码表达转基因的序列)或非编码区(例如,UTR及/或内含子序列)或两者中。在一些实施方案中,转基因的编码区或非编码区皆不包含条形码序列。在一些实施方案中,条形码序列连接至转基因的编码区或非编码区。在一些实施方案中,若多于一个条形码序列包括于核酸分子内,则各条形码序列可为相同的(例如,通过至少1个核苷酸间隔开的相同条形码序列的三个复本),各者可彼此不同(例如,通过至少1个核苷酸间隔开的三个不同条形码序列),或条形码序列中的一些可彼此相同且不同。因此,任何数目的条形码序列(相同,各自不同或一些相同/一些不同)可包括于本申请中所揭示的核酸分子中的任一者中。在某些实施方案中,核酸分子包含至少1个、至少2个、至少3个、至少4个、至少5个或至少6个相同的条形码序列。在某些实施方案中,核酸分子包含至少1个、至少2个、至少3个、至少4个、至少5个或至少6个不同的条形码序列。
在一些实施方案中,条形码序列对于特定候选调控组件具有特异性。在一些实施方案中,条形码序列的组合对于特定候选调控组件具有特异性。
在一些实施方案中,核酸分子中的条形码序列的位置对于特定候选调控组件具有特异性。在一些实施方案中,a)条形码序列,b)条形码序列的组合,c)核酸分子中的条形码序列的位置或a)-c)的任何组合对于特定候选调控组件具有特异性。
在一些实施方案中,核酸分子中的任一者的编码区(例如,转基因)包含一或多个条形码序列。在一些实施方案中,转基因的编码区中的条形码包含替代性密码子。替代性密码子指编码DNA中的同义密码子。遗传密码描述为简并或冗余的,这是因为单个氨基酸可由多于一个密码子编码。举例而言,密码子TAT及密码子TAC皆编码氨基酸酪氨酸。因此,借助于实例,置放于编码EGFP的核苷酸序列的编码区中的条形码可设计以使用替代性密码子(例如,DNA序列的改变)编码EGFP的区域,同时保持EGFP野生型蛋白质序列的表达(即,存在于编码EGFP的核苷酸序列的编码区中的条形码序列内的替代性密码子不改变由该核苷酸序列编码的EGFP氨基酸序列)。在一些实施方案中,本申请中所揭示的核酸分子中的任一者的非编码区(例如,转基因的UTR及/或内含子区)包含一或多个条形码序列。在一些实施方案中,本申请中所揭示的核酸分子中的任一者的非编码区及编码区各自包含一或多个条形码序列。在一些实施方案中,本申请中所揭示的核酸分子中的任一者包含至少一个条形码序列,其至少部分在核酸分子的编码区中且至少部分在核酸分子的非编码区中。
一般而言,一或多个条形码序列可置放于核酸分子中的任何位置。在一些实施方案中,本申请中所揭示的核酸序列中的任一者包含polyA尾部及至少一个条形码序列。在一些实施方案中,条形码序列位于核酸中自polyA尾部开始的约25、30、35、50、100、150、200、250、300、350、400、450或500个碱基内。在一些实施方案中,条形码位于核酸中自polyA尾部开始的约50个碱基内。在一些实施方案中,核酸包含多个条形码,其中各条形码在核酸中接近polyA尾部的跨越约50个碱基的区域内间隔80至120bp。在一些实施方案中,至少一个条形码序列置放于接近polyA尾部的跨越约50个碱基的区域内的各80至120bp跨距中。
转基因
在一些实施方案中,可根据本发明方法使用的本申请中所提供的核酸分子中的任一者包含可操作地连接至用于多任务处理方法中的候选调控组件的转基因序列。在一些实施方案中,本发明组合物及方法的转基因充当用于检测(若存在)由候选调控组件驱动的表达的报导子。在一些实施方案中,候选RE位于转基因的上游。在一些实施方案中,候选RE位于转基因的非编码区内。
在一些实施方案中,转基因衍生自野生型参考基因序列(例如,编码EGFP蛋白质的基因序列)。在一些实施方案中,转基因与野生型基因序列具有至少60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性。在一些实施方案中,与野生型参考核苷酸序列相比,转基因不包含任何突变。在一些实施方案中,转基因连接至本申请中所揭示的条形码序列中的任一者或多者(即,条形码序列不在转基因的编码区或非编码区中)。所关注的任何转基因可经设计且用于本发明方法中。如本申请中所描述且举例说明,转基因可设计以包括可易于检测及/或可鉴别的特性、特征或部分。在一些实施方案中,与参考核苷酸序列相比,转基因包含经修饰的核苷酸序列(例如,替代性密码子)。在一些实施方案中,转基因可设计以具有某些有益特性,例如所表达的转基因特异性地位于细胞的特定隔室且/或所表达的转基因有助于分离及/或纯化转基因蛋白质、细胞或细胞组分(例如细胞核)。结合所属技术领域中已知的功能域及/或标记的各种蛋白质设计方法可用于产生适用于本发明方法的特定上下文中的转基因。在一些实施方案中,转基因为DNA核酸分子。在一些实施方案中,转基因为已自本申请中所描述的DNA核酸分子中的任一者转录的RNA核酸分子。
在一些实施方案中,转基因包含编码报导基因的序列。所属领域中已知的各种报导基因可用于产生用于本发明方法的转基因。报导基因包括有助于检测转基因表达的任何基因或核苷酸序列,若存在。报导基因可视情况允许定位表达产物,例如在细胞的特定区域或细胞器及/或多细胞生物体的特定细胞、组织、器官或任何部分中。此类报导基因亦可经设计使其编码融合蛋白质,该融合蛋白质包含报导子多肽(例如GFP蛋白质)及一或多个赋予功能性益处的域,该益处例如细胞分离、细胞识别或对细胞的区域的报导子定位(例如经由核结合域)。在一些实施方案中,本申请中所揭示的报导基因中的任一者编码一或多个荧光蛋白,诸如绿色荧光蛋白(GFP);增强型绿色荧光蛋白(EGFP);黄色荧光蛋白(YFP),诸如mBanana;红色荧光蛋白(RFP),诸如mCherry、DsRed、dTomato、tdTomato、mHoneydew、mStrawberry、TagRFP;远红色荧光帕米膦酸盐(FRFP),诸如mGrape1或mGrape2;青色荧光蛋白质(CFP);蓝色荧光蛋白(BFP);增强型青色荧光蛋白质(ECFP);群青荧光蛋白(UMFP);橙色荧光蛋白(OFP),诸如mOrange或mTangerine;红色(橙色)荧光蛋白(mROFP);TagCFP或四半胱氨酸荧光基序。在某些实施方案中,荧光蛋白为GFP或EGFP。在一些实施方案中,转基因编码可检测标记的蛋白质,诸如可检测标记的抗体或其抗原结合片段。在一些实施方案中,转基因编码可使用一或多种与蛋白质结合的试剂检测的蛋白质。举例而言,在一些实施方案中,转基因编码可用一或多个可检测标记的抗体(例如经荧光标记的抗体)检测的蛋白质。
如本申请中所举例说明,转基因可包含报导基因序列(例如,编码EGFP的序列),其可操作地连接至编码核结合域(例如,KASH域或SUN域蛋白或其生物活性片段)的序列,该序列将表达报导基因蛋白质(EGFP)靶向至外核膜。虽然EGFP能够易于识别及分选表达转基因的细胞,但核结合域有助于自细胞分离细胞核,其有益于在自完整组织解离期间易于细胞膜破裂的某些细胞(例如,神经元或脂肪细胞)。如本领域技术人员将识别,由报导基因序列编码的多肽不必连接至核结合域序列。在一些实施方案中,由报导基因(例如,EGFP)编码的多肽可单独使用以标记表达报导基因的细胞的胞溶质,从而允许识别表达转基因的细胞。此标记可用于自组织分离全细胞,这些组织在自完整组织(例如,上皮细胞及纤维母细胞)解离期间不易于破坏细胞膜。此类细胞可与其来源(例如,组织)分离,根据报导基因表达分选且测序其转录组用于进行本申请中所详述的分析。
在一些实施方案中,转基因包含编码细胞定位域的序列。各种细胞定位域为所属技术领域中已知的,且包括例如KASH域、SUN域。本领域技术人员知晓其他细胞定位域,诸如储存于LOCATE次细胞定位数据库中的那些那些细胞定位域(http://locate.imb.uq.edu.au)。
调控组件
在一些实施方案中,本发明的核酸分子中的任一者包括例如一或多个条形码序列及一或多个可操作地连接至转基因的候选调控组件。如本申请中所描述,本发明部分关于一种(例如,活体内或活体外)筛选诸多(例如,10至104个)候选RE以便识别在特异性细胞群体中提供所关注的转基因的选择性表达的RE的方法。可使用本申请中所描述的方法测试候选RE,以便识别在给定细胞类型(所关注的细胞类型或目标细胞)中提供转基因的选择性表达的RE。一般而言,可使用本申请中所描述的方法筛选、分离且识别任何已知的、天然的及/或合成的候选RE。已知及/或天然存在的RE可易于获得以用作本发明方法中的候选RE。可使用所属技术领域中已知的方法设计且生成适用于本发明的合成候选RE。在一些实施方案中,可用于本发明方法中的候选RE可为在一或多种细胞类型中活性已知但在其他细胞类型中未知的RE。在一些实施方案中,可用于本发明方法中的候选RE可为具有未知活性的RE。如本申请中所描述,可根据本发明方法筛选各种已知或新颖的(例如,合成)RE以识别其中RE提供选择性表达的细胞类型。在一些实施方案中,可用于本发明方法中的候选RE包括已知的RE,其可用作可与候选RE进行比较的阴性或阳性对照RE(例如,泛细胞RE)。
在特定实施方案中,候选RE为DNA核酸分子的部分。在一些实施方案中,DNA核酸分子包含本申请中所揭示的转基因中的任一者、一或多个候选RE及一或多个条形码序列,其中条形码序列与核酸中的候选RE相关(例如,条形码可用于识别核酸分子中所含有的RE)。在一些实施方案中,本发明提供自本申请中所揭示的DNA核酸分子(例如,包含本申请中所揭示的条形码序列、候选RE及转基因的DNA核酸分子)中的任一者转录的RNA核酸分子,其中RNA核酸分子包含转基因及条形码序列,且其中RNA分子中的条形码序列与DNA分子中的候选RE相关。
RE可在DNA及/或RNA水平下运作。RE可用以调节或控制细胞选择性(细胞特异性)基因表达。RE可用以在基因表达的转录阶段、转录后阶段或翻译阶段调节基因表达。RE包括(但不限于)启动子、增强子、内含子或其他非编码序列。在RNA水平,调控可在翻译(例如使mRNA稳定以用于翻译的稳定性组件)、RNA裂解、RNA剪接及/或转录终止的水平进行。在一些实施方案中,RE可募集转录因子,其选择性地增加所关注的细胞类型中的基因表达。在一些实施方案中,RE可增加产生RNA转录物的速率,增加产生RNA的稳定性且/或增加自RNA转录物蛋白合成的速率。
RE为核酸序列或遗传组件,其能够影响(例如,增加或减少)一或多个细胞类型或组织中的基因或转基因(例如,编码蛋白质(诸如EGFP或荧光素酶)的报导基因;编码定位域(诸如KASH域)的转基因;及/或治疗性基因)的表达。在一些实施方案中,RE可为内含子、启动子、增强子、UTR、反向末端重复(ITR)序列、长末端重复序列(LTR)、稳定性组件、翻译后反应组件、微RNA结合位点或polyA序列或其组合。在一些实施方案中,RE为启动子或增强子,或其组合。在一些实施方案中,RE衍生自人类序列。
在一些实施方案中,两个或更多个RE(已知的、天然的及/或合成RE)可经合并以形成可用作本申请中所描述的方法中的候选RE的较大RE。在一些实施方案中,可能需要产生较小的候选RE。保留转基因表达活性的较小RE在使用较大转基因的基因疗法方法中,及/或当载体或质粒的克隆能力由于使用基因疗法待递送的转基因的大小而受到限制时为有利的。因此,在一些实施方案中,通过例如每次截短一或多个碱基且根据本发明方法测试各所得候选RE驱动表达的能力,可自具有已知活性的RE得到候选RE。
在一些实施方案中,两个或更多个相对短的RE可合并以形成较大RE且用作本发明方法中的候选RE。先前已展示此类组合会得到高转基因表达活性及/或大小标准化的基因表达。因此,此候选RE可经筛选以识别例如其可提供选择性表达的细胞类型。
在一些实施方案中,本申请中所揭示的候选RE包含不超过500bp、600bp、700bp、800bp、900bp、1000bp、1100bp、1200bp、1300bp、1400bp、1500bp、1600bp、1700bp、1800bp、1900bp、2000bp、2100bp、2200bp、2300bp、2400bp、2500bp、2600bp、2700bp、2800bp、2900bp、3000bp、3100bp、3200bp、3300bp、3400bp、3500bp、3600bp、3700bp、3800bp、3900bp、4000bp、4100bp、4200bp、4300bp、4400bp、4500bp、4600bp、4700bp、4800bp、4900或5000bp。
在一些实施方案中,本申请中所揭示的候选RE包含不超过40bp、45bp、49bp、50bp、56bp、60bp、70bp、80bp、90bp、100bp、110bp、117bp、120bp、130bp、140bp、150bp、160bp、170bp、180bp、190bp、200bp、210bp、220bp、230bp、240bp、250bp、259bp、260bp、265bp、270bp、280bp、290bp、300bp、310bp、320bp、330bp、340bp、350bp、360bp、370bp、380bp、390bp或400bp。
在一些实施方案中,可以本发明方法筛选的候选RE不超过49bp、50bp、56bp、60bp、70bp、80bp、90bp、100bp、110bp、117bp、120bp、130bp、140bp、150bp、160bp、170bp、180bp、190bp、200bp、210bp、220bp、230bp、240bp、250bp、259bp、260bp、265bp、270bp、280bp、290bp、300bp、310bp、320bp、330bp、340bp、350bp、360bp、370bp、380bp、390bp或400bp。此类候选RE可适用于驱动较大转基因的表达(例如,在基因疗法或表达卡匣中),因为RE增强转基因表达,而不会占据AAV载体或表达卡匣内的大量空间,从而允许较大转基因具有更大的容量。
在一些实施方案中,本申请中所描述的候选RE为40-50bp、45-55bp、50-60bp或55-65bp。在一些实施方案中,候选RE为45-60bp。在一些实施方案中,本申请中所描述的候选RE为49bp或56bp。在一些实施方案中,候选RE可在100bp与150bp之间、在110bp与140bp之间、在110bp与130bp之间或在115bp与125bp之间。在一些实施方案中,候选RE为或为约100bp。
在一些实施方案中,可使用允许识别候选调控组件的任何方法(例如,DNA酶过敏反应、ATAC-Seq及ChIP-Seq)选择用于本申请中所描述的方法中的候选调控组件。参见例如WO 2018187363,其以全文引用的方式并入本申请中。在一些实施方案中,可使用基于分析的实验(例如,报导基因分析)、高通量实验(例如,染色体免疫沉淀实验)或计算方法(例如,ChIP-seq)来识别调控组件。参见例如Narlikar等人,2009,Briefings in FunctionalGenomics and Proteomics,8(4):215-230。在一些实施方案中,计算方法可用以识别所关注的特定基因组(例如hg19)中的调控组件。在一些实施方案中,可识别阻断增强子与启动子之间的交互作用的假定绝缘子区域,且用于评估基因组区域内基因及增强子的可能影响范围。参见例如Khan等人,2013,Genesis,51:311-324。在一些实施方案中,谱系足迹分析可用于计算顺式-调控组件的预测。特定而言,谱系足迹分析可用于识别可含有转录因子发现位点的DNA的保守片段,这些位点在整个进化过程中经保留。同上。在一些实施方案中,谱系足迹分析将仅在由假定绝缘子区域所界定的区域中使用,有效地允许选择候选调控组件。同上。
在一些实施方案中,候选RE衍生自已知的对照RE,诸如已知启动子。可使用的已知的对照启动子的实例包括但不限于:CMV启动子、超核心启动子、TTR启动子、Proto 1启动子、UCL-HLP启动子、AAT启动子、KAR启动子、EF1α启动子、EFS启动子或CMVe增强子/CMV启动子组合、鸡β肌动蛋白启动子(CBA)、CMV早期增强子/CBA启动子(CAG)、延伸因子-1α启动子(EF1α)、猴病毒40启动子(SV40)、磷酸甘油酸激酶启动子(PGK)及聚泛素C基因启动子(UBC)。可操作地连接至此类已知的对照RE的转基因的表达水平可相对于可操作地连接至候选RE的转基因(相同转基因)的表达水平进行分析。
在一些实施方案中,候选RE可为启动子,当包括于本发明的核酸分子时,该启动子可驱动下游序列转录,其可与下游序列(例如,转基因)紧密相关或直接接触。启动子可驱动所连接转基因的高、中或低表达。
在一些实施方案中,本申请中所揭示的候选RE包含人类衍生的序列。在一些实施方案中,本发明的候选RE为非天然存在的。在一些实施方案中,候选RE包含核苷酸序列,其与人类参考基因组(或人类基因组构筑)中的序列具有至少80%、90%、95%或99%序列一致性。同源序列可为具有与人类基因组的区域相比至少80%序列一致性(例如,如通过BLAST所测量)的区域的序列。举例而言,与人类序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%同源性的序列视为人类衍生序列。
在一些实施方案中,人类衍生的候选RE为与人类序列具有100%一致性的序列。在一些实施方案中,候选RE的序列为人类衍生的,其中候选RE与相应人类序列的差异为至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90或95个核苷酸或碱基对。
在一些实施方案中,至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、98%或99%的候选RE序列为人类衍生的。举例而言,候选RE的序列的50%可为人类衍生,且剩余的50%为非人类衍生(例如,小鼠衍生或全合成)。对于其他实例,视为50%人类衍生且包含300bp的候选RE可与人类基因组中的序列具有总共45%序列一致性,而候选RE的碱基对1-150可与人类基因组的类似大小区域具有90%一致性(例如,局部序列一致性)。
在一些实施方案中,候选RE含有人类衍生序列及非人类衍生序列,使得总体上RE与人类基因组具有低序列一致性。然而,候选RE的一部分与人类基因组具有100%序列一致性。在其他情况下,候选RE序列的至少50%、60%、70%、80%、90%、95%、98%或99%为人类衍生,或至少10、20、30、40或50个邻接核苷酸为人类衍生。举例而言,候选RE的序列的50%可为人类衍生,且剩余的50%为非人类衍生(例如,小鼠衍生、病毒衍生或全合成)。
候选RE可衍生自不同物种。在一些实施方案中,候选RE的至少一部分为人类衍生。非人类衍生RE可衍生自哺乳动物、病毒或合成序列。
如本申请中所描述,本发明涵盖一种识别RE的方法,其中RE可操作地连接至一或多个官能性序列,包括例如本申请中所描述的转基因。在DNA插入至载体中之前或之后实现此有效连接的方法为我们所熟知。
在一些实施方案中,本申请中所揭示的候选RE可衍生自基因组启动子序列。在一些实施方案中,本申请中所揭示的候选RE可衍生自基因组启动子序列及3'未翻译区(3'UTR)。在一些实施方案中,本申请中所揭示的候选RE可衍生自基因间序列。在一些实施方案中,本申请中所揭示的候选RE可衍生自基因的基因组序列下游、或5'UTR序列或5'UTR及下游序列的混合物。
在一些实施方案中,候选RE可为增强子,且可评估与通过启动子而不需增强子的相同转基因的表达相比,其在表达载体以及启动子中的活性是否在特异性细胞类型或特异性细胞群体中提供转基因(例如EGFP)的选择性表达(例如表达增加或减小)。
在一些实施方案中,本申请中的候选RE为内含子序列,或包含内含子,且可评估与通过启动子而不需内含子序列的相同转基因的表达相比,其在表达载体以及启动子中的活性是否在特异性细胞群体中提供转基因(例如编码EGFP的转基因)的选择性表达。
在一些实施方案中,本申请中的候选RE为启动子序列,或包含启动子序列,且其可操作地连接至本发明的核酸分子中的所关注的转基因,而不需任何其他启动子序列及/或增强子序列来表达转基因。
在一些实施方案中,候选RE包含5'未翻译区(5'UTR)的部分或所有。5'UTR候选RE可以数种不同的方式影响基因的表达。5'UTR候选RE可含有RNA结合蛋白的结合位点。此外,由5'UTR中的RE所形成的二级结构可影响翻译所需的RNA结合蛋白的结合。在一些实例中,候选RE可具有高度的二级结构。在一些实施方案中,候选RE可具有很少或没有二级结构。候选RE也可含有内部核糖体入口位点(internal ribosome entry site;IRES),允许5'帽独立翻译。候选RE可含有上游翻译起始密码子(upstream translation initiation codon;uAUG)。在一些实施方案中,候选RE不含有上游翻译起始密码子。在一些实施方案中,候选RE在AUG密码子的一个碱基内不含有任何密码子,或含有与偶然预期相比更少的类似于AUG密码子的密码子。在一些实施方案中,候选RE可含有上游开放阅读框架,其在上游AUG(或足够类似的序列)存在时发生,随后为框内终止密码子。在一些实例中,候选RE不包含uORF。在一些实施方案中,候选RE含有微RNA结合位点,或RNA结合蛋白的结合位点。
在一些实施方案中,本发明的候选RE还可为以上中的任一者的功能片段。当功能片段为增强子、内含子序列、启动子序列或其组合时,与无功能片段的类似载体或卡匣相比,当片段可操作地连接至转基因时,观测到更高、更低或更多选择性表达。在一些实施方案中,片段的长度小于或等于25bp、30bp、40bp、50bp、60bp、70bp、80bp、90bp、100bp或110bp。在一些实施方案中,可使用衍生自人类启动子序列的本发明的候选RE,而无需载体中的二级启动子。
在一些实施方案中,作为内含子序列的候选RE可偶合或可操作地连接至任何启动子。在一些实施方案中,作为启动子序列的候选RE可偶合或可操作地连接至转基因,而无需任何其他启动子序列。在一些实施方案中,包含启动子序列及内含子序列的候选RE可偶合或可操作地连接至转基因,而无需任何其他启动子序列。在一些实施方案中,包含启动子序列及增强子序列的候选RE可偶合或可操作地连接至转基因,而无需任何其他启动子序列。
微粒
在一些实施方案中,本发明提供连接至本申请中所揭示的核酸分子中的任一者的微粒。在特定实施方案中,连接至微粒的核酸分子为自本申请中所揭示的DNA核酸分子中的任一者转录的RNA分子。在一些实施方案中,RNA分子包含转基因及条形码序列。在一些实施方案中,DNA分子包含调控组件,其中RNA分子中的条形码序列与DNA分子中的调控组件相关。在一些实施方案中,微粒为珠粒。在一些实施方案中,微粒连接至微粒聚核苷酸分子。在一些实施方案中,微粒聚核苷酸序列包含引物序列。在特定实施方案中,引物序列有助于微粒聚核苷酸序列的至少一部分的扩增及/或表达。在一些实施方案中,引物序列有助于微粒聚核苷酸序列的至少一部分及与微粒聚核苷酸序列连接/杂合的本申请中所揭示的核酸分子中的任一者的至少一部分的扩增及/或表达。在一些实施方案中,微粒聚核苷酸包含微粒(例如,珠粒)特有的条形码核苷酸序列。在一些实施方案中,各微粒包含两个或更多个微粒聚核苷酸。在一些实施方案中,两个或更多个微粒聚核苷酸中的各者包含不同的独特分子标志(UMI)核苷酸序列。在一些实施方案中,微粒聚核苷酸包含寡聚-dT核苷酸序列。在一些实施方案中,寡聚-dT序列能够与本申请中所揭示的核酸分子中的任一者的polyA部分杂合。在一些实施方案中,微粒聚核苷酸分子包含:a)引物序列,b)条形码序列,c)独特分子标志(UMI)序列,d)寡聚-dT序列,及e)本申请中所揭示的核酸分子中的任一者。在一些实施方案中,微粒聚核苷酸分子包含:a)引物序列,b)条形码序列,c)独特分子标志(UMI)序列,d)寡聚-dT序列,及e)本申请中所揭示的核酸分子中的任一者;其中核酸包含polyA核苷酸序列,其中微粒按以下顺序连接至a)-e):微粒--a)--b)--c)--d)--e);且其中polyA序列与寡聚-dT序列杂合。在一些实施方案中,微粒聚核苷酸分子包含:a)引物序列,b)条形码序列,c)独特分子标志(UMI)序列,d)寡聚-dT序列,及e)本申请中所揭示的核酸分子中的任一者;其中核酸包含polyA核苷酸序列,其中微粒按以下顺序连接至a)-e):微粒--a)--c)--b)--d)--e);且其中polyA序列与寡聚-dT序列杂合。
递送方法及组合物
在一些实施方案中,本发明提供包含本申请中所揭示的核酸分子中的任一者的载体(例如,本申请中所揭示的载体中的任一者)。在一些实施方案中,载体为病毒载体(例如腺相关病毒载体)。在一些实施例中,载体为病毒颗粒。在一些实施例中,载体为非病毒载体。
在一些实施方案中,使用所属技术领域中可用的各种已知及适合的方法,活体外或活体内将本申请中所描述的核酸分子提供(或递送)至细胞或组织。常规的基于病毒及非病毒的基因递送方法可用于将本申请中所揭示的核酸分子引入至细胞(例如哺乳动物细胞)及目标组织中。非病毒表达载体系统包括核酸载体诸如(例如)直链寡核苷酸及环状质粒;人造染色体,诸如人类人造染色体(human artificial chromosomes;HAC)、酵母人造染色体(yeast artificial chromosomes;YAC)及细菌人造染色体(BAC或PACs);游离型载体;转座子(例如PiggyBac);及黏粒。病毒载体递送系统包括DNA及RNA病毒,诸如(例如)逆转录病毒载体、慢病毒载体、腺病毒载体及腺相关病毒载体。将本申请中所描述的核酸分子并入至非病毒及病毒表达系统中的任一者中的方法已为本领域技术人员所已知。
用于核酸的非病毒递送的方法及组合物为所属技术领域已知的,包括物理及化学方法。物理方法通常指在促进基因物质的胞内递送中采用物理力来抵消细胞膜障壁的递送方法。物理方法的实例包括使用针、弹道DNA、电穿孔、声致穿孔、光致穿孔、磁转染及水穿孔(hydroporation)。化学方法通常指其中化学载剂将核酸分子递送至细胞的方法且可包括无机粒子、基于脂质的载剂、基于聚合物的载剂及基于肽的载剂。
在一些实施方案中,使用无机粒子向目标细胞投予非病毒表达载体。无机粒子可指纳米粒子,诸如经工程改造得到各种大小、形状及/或孔隙率以自网状内皮系统逸出或保护经包覆分子免于降解的纳米粒子。无机纳米粒子可由金属(例如,铁、金及银)、无机盐或陶瓷(例如钙、镁或硅的磷酸盐或碳酸盐)来制备。这些纳米粒子的表面可经涂布以促进DNA结合或靶向基因递送。也可使用磁性纳米粒子(例如超磁性氧化铁)、富勒烯(例如可溶性碳分子)、碳纳米管(例如圆柱形富勒烯)、量子点及超分子系统。
在一些实施方案中,使用阳离子脂质(例如阳离子脂质体)向目标细胞投予非病毒表达载体。已研究各种类型的脂质的基因递送,诸如(例如)脂质纳米乳液(例如其为通过乳化剂稳定化的一种不可混溶液体于另一种液体中的分散液)或固体脂质纳米粒子。在一些实施方案中,可使用脂质纳米粒子(lipid nanoparticles;LNP)递送非病毒表达载体。在一些实施方案中,LNP包含阳离子脂质。在一些实施方案中,LNP包含十八-9,12-二烯酸(9Z,12Z)-3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙胺基)丙氧基)羰基)氧基)甲基)丙酯(也称为(9Z,12Z)-十八-9,12-二烯酸3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙胺基)丙氧基)羰基)氧基)甲基)丙酯)或另一可电离的脂质。参见例如WO2017/173054、WO2015/095340及WO2014/136086以及其中所提供的参考文献的脂质。
在一些实施方案中,使用基于肽的递送媒剂向目标细胞投予非病毒表达载体。基于肽的递送媒剂可具有保护待递送的遗传物质、靶向特异性细胞受体、破坏核内体膜及将遗传物质递送至细胞核中的优点。在一些实施方案中,使用基于聚合物的递送媒剂向目标细胞投予非病毒表达载体。基于聚合物的递送媒剂可包含天然蛋白质、肽及/或多糖或合成聚合物。在一个实施方案中,基于聚合物的递送媒剂包含聚乙烯亚胺(PEI)。PEI可将DNA缩合至带正电粒子中,这些带正电粒子结合至阴离子细胞表面残基且经由胞吞作用引入至细胞中。在其他实施方案中,基于聚合物的递送媒剂可包含聚-L-赖氨酸(ΜLL)、聚(DL-乳酸)(ΜLA)、聚(DL-丙交酯-共-糖苷)(ΜLGA)、聚鸟氨酸、聚精氨酸、组蛋白、鱼精蛋白、树枝状聚合物、壳聚糖、葡聚糖的合成胺基衍生物及/或阳离子丙烯酸聚合物。在某些实施方案中,基于聚合物的递送媒剂可包含聚合物的混合物,诸如(例如)PEG及ΜLL。
在一些实施方案中,本申请中所揭示的核酸分子中的任一者包含可操作地连接至转基因及条形码序列的候选调控组件,且可使用任何已知的适合的病毒载体进行递送,该病毒载体包括:例如逆转录病毒(例如,A型、B型、C型及D型病毒);腺病毒;细小病毒(例如,腺相关病毒或AAV);冠状病毒;负链RNA病毒,诸如正黏病毒(例如,流感病毒);杆状病毒(例如,狂犬病及水泡性口炎病毒);副粘病毒(例如,麻疹及仙台病毒(Sendai));正链RNA病毒,诸如小核糖核酸病毒及α病毒;及双链DNA病毒,包括腺病毒、疱疹病毒(例如,1型及2型单纯疱疹病毒(Herpes SimμLex virus)、埃-巴二氏病毒(Epstein-Barr virus)、巨细胞病毒);及痘病毒(例如,牛痘、禽痘及金丝雀痘)。逆转录病毒的实例包括禽类白血病肉瘤病毒、1型人类T-淋巴病毒(human T-lymphotrophic virus type 1;HTLV-1)、牛白血病病毒(bovineleukemia virus;BLV)、慢病毒及泡沫病毒属。其他病毒包括例如诺沃克病毒(Norwalkvirus)、披衣病毒(togavirus)、黄病毒、呼肠孤病毒(reoviruses)、乳多泡病毒(papovavirus)、嗜肝DNA病毒及肝炎病毒。病毒载体可根据其整合至宿主基因组中的能力分为两组-整合及非整合。致癌逆转录病毒及慢病毒可整合至宿主细胞染色体中,而腺病毒、腺相关病毒及疱疹病毒主要以染色体外游离基因形式保持于细胞核中。
在一些实施方案中,适合的病毒载体为逆转录病毒载体。逆转录病毒指逆转录病毒科的病毒。逆转录病毒的实例包括致癌逆转录病毒,诸如鼠类白血病病毒(MLV),及慢病毒,诸如人类免疫缺陷病毒1(human immunodeficiency virus 1;HIV-1)。逆转录病毒基因组为单链(ss)RNA且包含可以顺式或反式提供的各种基因。举例而言,逆转录病毒基因组可含有顺式作用序列,诸如两个长末端重复序列(LTR),具有用于基因表达、逆转录及整合至宿主染色体中的组件。其他组分包括包装信号(psi或ψ),以用于将特定RNA包装至新形成的病毒粒子(Virion)及聚嘌呤管道(polypurine tract;PPT)、在逆转录期间起始正链DNA合成的位点中。此外,在一些实施方案中,逆转录病毒基因组可包含gag、pol及env基因。gag基因编码结构蛋白,pol基因编码伴随ssRNA且进行将病毒RNA逆转录为DNA的酶,且env基因编码病毒包膜。一般而言,gag、pol及env以反式提供用于病毒复制及包装。
在一些实施方案中,本申请中所提供的逆转录病毒载体可为慢病毒载体。识别慢病毒的至少五个血清组或血清型。不同血清型的病毒可不同地感染某些细胞类型及/或宿主。举例而言,慢病毒包括灵长类逆转录病毒及非灵长类逆转录病毒。灵长类逆转录病毒包括HIV及猿猴免疫缺陷病毒(simian immunodeficiency virus;SIV)。非灵长类逆转录病毒包括猫类免疫缺陷病毒(feline immunodeficiency virus;FIV)、牛免疫缺陷病毒(bovineimmunodeficiency virus;BIV)、山羊关节炎-脑炎病毒(caprine arthritis-encephalitis virus;CAEV)、马传染性贫血病毒(equine infectious anemia virus;EIAV)及维思纳病毒(visnavirus)。慢病毒或慢病毒载体能够转导静止细胞。如同致癌逆转录病毒载体,慢病毒载体的设计可基于顺式作用及反式作用序列的分离。
在一些实施方案中,本发明提供经设计用于通过优化治疗性逆转录病毒载体递送的表达载体。逆转录病毒载体可为包含以下中的任一者或多者的慢病毒:左(5')LTR;有助于病毒包装及/或核导入的序列;启动子;视情况选用的一或多个额外调控组件(诸如(例如)增强子或polyA序列);视情况选用的慢病毒反向反应组件(RRE);构建体,其包含可操作地连接至转基因(例如EGFP-KASH)的候选调控组件;视情况选用的绝缘子;及右(3')逆转录病毒LTR。
在一些实施方案中,本申请中所提供的病毒载体为腺相关病毒(AAV)。AAV为感染人类及一些其他灵长类物种的小型、复制缺乏型、无包膜动物病毒。已知AAV不会引起人类疾病及诱导轻度免疫反应。AAV载体也可在不整合至宿主细胞基因组中的情况下感染分裂及静止细胞两者。
AAV基因组天然地由长度为约4.7kb的直链单股DNA组成。基因组由通过长度为约145bp的反向末端重复(ITR)序列侧接的两个开放阅读框架(ORF)组成。ITR由含有回文序列的5'端处的核苷酸序列(5'ITR)及位于3'端处的核苷酸序列(3'ITR)组成。ITR通过互补碱基配对折叠形成T形发夹结构而顺式起作用,该互补碱基配对在第二股合成的起始DNA复制期间充当引物。两个开放阅读框架编码参与病毒粒子的复制及包装的rep及cap基因。在一些实施方案中,本申请中所提供的AAV载体不含有rep或cap基因。此类基因可以反式提供用于产生病毒粒子,如下文进一步描述。
在一些实施方案中,AAV载体可包括填充核酸。在一些实施方案中,填充核酸可编码绿色荧光蛋白或提供对诸如卡纳霉素(kanamycin)或氨苄青霉素(ampicillin)的抗生素的抗性的抗生素抗性基因。在某些实施方案中,填充核酸可位于ITR序列外部(例如相比于转基因序列及调控序列,其位于5'与3'ITR序列之间)。
在一些实施方案中,AAV载体为以下中的任一者:AAV1、AAV2、AAV3、AAV3b、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAV13、AAV-DJ、AAV-DJ8、AAV-DJ9或嵌合、杂合或变体AAV。AAV还可为自身互补型AAV(scAAV)。这些血清型不同之处在于其趋向性或其所感染的细胞类型。在一些实施方案中,AAV载体包含来自多个血清型(例如假型)的基因组及壳体。举例而言,AAV可包含包装于血清型5或血清型9的壳体中的血清型2的基因组(例如ITR)。假型可提高转导效率以及改变趋向性。在一些实施方案中,AAV为AAV9血清型。在某些实施方案中,经设计用于通过AAV递送的表达载体包含5'ITR及3'ITR。
在一些实施方案中,AAV血清型6或AAV血清型9的ITR可用于本申请中所揭示的AAV载体中的任一者中。然而,可选择来自其他适合的血清型的ITR。在一些实施方案中,将本申请中所揭示的核酸分子中的任一者包装至壳体蛋白中且递送至所选择的宿主细胞。本发明的AAV载体可由各种腺相关病毒产生。可通过将一种血清型的重组基因组包装至衍生自另一AAV血清型的壳体中来改变载体的趋向性。在一些实施方案中,rAAV病毒的ITR可基于AAV1-12中的任一者的ITR且可与选自以下中的任一者的AAV壳体合并:AAV1-12、AAV-DJ、AAV-DJ8、AAV-DJ9或其他经修饰血清型。在特定实施方案中,基于待用AAV载体靶向的细胞或组织来选择AAV ITR及/或壳体。
在一些实施方案中,本发明提供一种载体,其包含本申请中所揭示的核酸中的任一者,其中载体为AAV载体或AAV病毒颗粒,或病毒粒子。在一些实施方案中,AAV载体或AAV病毒颗粒,或病毒粒子可用于递送本申请中所揭示的核酸分子中的任一者,这些核酸分子包含可操作地连接至本申请中所揭示的转基因中的任一者的本申请中所揭示的候选调控组件中的任一者,无论活体内、离体或活体外。在一些实施方案中,此种AAV载体为复制缺陷型。在一些实施方案中,AAV病毒经工程化或经遗传修饰以使得其可仅在辅助因子的存在下复制且产生病毒粒子。
在一些实施方案中,可使用本申请所描述的方法筛选一或多个可操作地连接至转基因的候选调控组件以确定候选调控组件是否在目标细胞、细胞类型或组织中提供转基因的选择性(例如,增加或减少)表达。在一些实施方案中,经设计用于由AAV递送的表达载体包含:5'ITR;启动子;核酸分子,其包含可操作地连接至转基因(例如编码EGFP-KASH的转基因)的候选调控组件及条形码序列;及3'ITR。在一些实施方案中,经设计用于由AAV递送的表达载体包含:5'ITR;增强子;启动子;核酸分子,其包含可操作地连接至转基因(例如编码EGFP-KASH的转基因)的候选调控组件及条形码序列;polyA序列及3'ITR。
在一些实施方案中,本发明提供一种包含本申请中所揭示的核酸中的任一者的病毒载体。术语「病毒颗粒(viral particle)」及「病毒粒子(virion)」在本申请可互换使用且关于感染性及通常复制缺陷性的病毒颗粒,其包含包装于壳体内的病毒基因组(例如病毒表达载体),且视具体情况,例如对于逆转录病毒,可为壳体周围的脂质包膜。「壳体」指包装病毒基因组的结构。壳体由数种由蛋白质制成的寡聚结构亚基组成。举例而言,AAV具有通过以下三种壳体蛋白的交互作用所形成的二十面体壳体:VP1、VP2及VP3。在一些实施方案中,本申请中所提供的病毒粒子为通过包装AAV载体所获得的重组AAV病毒粒子,如本申请中所描述,该AAV载体包含可操作地连接至蛋白质外壳中的转基因及条形码序列的候选调控组件。
在一些实施方案中,本申请中所提供的重组AAV病毒粒子可通过壳体化衍生自病毒颗粒中的特定AAV血清型的AAV基因组制备,该病毒颗粒由与相同特定血清型的AAV对应的天然Cap蛋白质形成。在其他实施方案中,本申请中所提供的AAV病毒颗粒包含病毒载体,该病毒载体包含包装至来自不同血清型的蛋白质中的给定AAV血清型的ITR。参见例如Bunning H等人JGene Med 2008;10:717-733。举例而言,具有来自给定AAV血清型的ITR的病毒载体可包装至以下各者中:a)由衍生自相同或不同AAV血清型的壳体蛋白(例如AAV2ITR及AAV9壳体蛋白;AAV2 ITR及AAV8壳体蛋白;等)构成的病毒颗粒;b)由来自不同AAV血清型的壳体蛋白或突变体的混合物(例如AAV2 ITR与AAV1及AAV9壳体蛋白)构成的嵌合体病毒颗粒;c)由已通过不同AAV血清型或变体之间的域交换截短的壳体蛋白或变体构成的嵌合病毒颗粒(例如AAV2 ITR与具有AAV9域的AAV8壳体蛋白);或d)靶向病毒颗粒,其经工程化以显示选择性结合域,使得能够与目标细胞特异性受体进行严格交互作用(例如AAV5ITR与通过插入肽配体而基因截短的AAV9壳体蛋白;或通过将肽配体偶合至壳体表面而进行非基因修饰的AAV9壳体蛋白)。
技术人员应了解,本申请中所提供的AAV病毒粒子可包含任何AAV血清型的壳体蛋白。在一个实施方案中,病毒颗粒包含来自选自由以下者组成的组的AAV血清型的壳体蛋白:AAV1、AAV2、AAV5、AAV6、AAV8及AAV9。
所属技术领域中已知诸多用于产生rAAV病毒粒子的方法,包括转染、稳定细胞系产生及感染性杂合病毒产生系统,其包括腺病毒-AAV杂合体、疱疹病毒-AAV杂合体(Conway,J E等人,(1997)J.Virology 71(11):8780-8789)及杆状病毒-AAV杂合体。在一些实施方案中,用于生产rAAV病毒颗粒的rAAV生产培养物包含:1)在杆状病毒生产系统的情况下的适合的宿主细胞,包括例如人类衍生细胞系,诸如HeLa、A549或293细胞,或昆虫衍生细胞系,诸如SF-9;2)适合的辅助病毒功能,由野生型或突变型腺病毒(诸如温度敏感性腺病毒)、疱疹病毒、杆状病毒或提供辅助功能的质粒构建体提供;3)AAV rep及cap基因及基因产物;4)核酸分子,其包含可操作地连接至转基因(例如编码可操作地连接至如本申请中所描述的报导基因序列的核结合域的核苷酸序列)的候选调控组件,其由AAV ITR序列侧接;其中核酸分子包含一或多个条形码序列;及5)用于支持rAAV生产的适合的培养基及培养基组分。
在一些实施方案中,生产细胞系为经提供Rep及Cap蛋白质的杆状病毒表达载体感染的昆虫细胞系(通常为Sf9细胞)。此系统不需要腺病毒辅助基因(Ayuso E等人,Curr.Gene Ther.2010,10:423-436)。
如本申请中所使用,术语「cap蛋白」指具有天然AAV Cap蛋白(例如VP1、VP2、VP3)的至少一种功能活性的多肽。cap蛋白的功能活性的实例包括诱导壳体形成、促进单股DNA积聚、促进AAV DNA包装至壳体中(即,壳体化)、结合至细胞受体及促进病毒粒子进入宿主细胞中的能力。原则上,任何Cap蛋白可用于本发明的上下文中。
已报导Cap蛋白对宿主趋向性、细胞、组织或器官特异性、受体使用、感染效率及AAV病毒的免疫原性具有影响。因此,可考虑到例如受试者的物种(例如人类或非人类)、个体的免疫状态、受试者对长期或短期治疗的适合性或特定治疗性应用(例如治疗特定疾病或病症,或递送至特定细胞、组织或器官)来选择用于rAAV中的AAV cap。在某些实施方案中,cap蛋白衍生自由AAV1、AAV2、AAV5、AAV6、AAV8及AAV9血清型组成的组的AAV。
在一些实施方案中,用于本申请所提供的方法中的AAV Cap可由前述AAV cap或其编码核酸中的一者的突变诱发(即,通过插入、缺失或取代)产生。在一些实施方案中,AAVcap与前述AAV cap中的一或多者具有至少70%、75%、80%、85%、90%、95%、98%或99%或更大相似性。
在一些实施方案中,AAV cap为嵌合的,包含来自两个、三个、四个或更多个前述AAV cap的域。在一些实施方案中,AAV cap为源自两种或三种不同AAV或重组AAV的VP1、VP2及VP3单体的嵌合体。在一些实施方案中,rAAV组合物包含前述cap中的多于一者。
在一些实施方案中,用于rAAV病毒粒子的AAV cap经工程化以含有异源序列或其他修饰。举例而言,赋予选择性靶向或免疫逃避的肽或蛋白质序列可工程化为cap蛋白。可替代地或另外,cap可经化学改性以使得rAAV的表面经聚乙二醇化(polyethyleneglycolated/pegylated),其可有助于免疫逃避。cap蛋白也可经突变诱发(例如以移除其天然受体结合,或掩蔽免疫原性抗原决定基)。
如本申请中所使用,术语「rep蛋白」指具有天然AAV rep蛋白(例如rep 40、52、68、78)的至少一种功能活性的多肽。rep蛋白的功能活性的实例包括与蛋白质的生理功能相关的任何活性,包括经由识别促进DNA复制、DNA复制的AAV来源的结合及切口以及DNA解螺旋酶活性。额外功能包括自AAV(或其他异源)启动子调节转录及将AAV DNA定点整合至宿主染色体中。在一些实施方案中,AAV rep基因可来自血清型AAV1、AAV2、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10或AAVrh10。
在一些实施方案中,用于本发明方法中的AAV rep蛋白可由前述AAV rep中的一者或其编码核酸的突变诱发(即,通过插入、缺失或取代)产生。在一些实施方案中,AAV rep与前述AAV rep中的一或多者具有至少70%、75%、80%、85%、90%、95%、98%或99%或更大相似性。
如本申请中所使用,表述「辅助功能」或「辅助基因」指AAV进行复制所依赖的病毒蛋白质。辅助功能包括AAV复制所需的那些蛋白质,包括但不限于参与AAV基因转录活化、阶段特异性AAV mRNA剪接、AAV DNA复制、cap表达产物合成及AAV壳体装配的那些蛋白质。基于病毒的辅助功能可衍生自已知辅助病毒,诸如腺病毒、疱疹病毒(除1型单纯疱疹病毒以外)及牛痘病毒中的任一者。辅助功能包括但不限于:腺病毒E1、E2a、VA及E4或疱疹病毒UL5、ULB、UL52及UL29,及疱疹病毒聚合酶。在一优选实施方案中,AAV进行复制所依赖的蛋白质衍生自腺病毒。
在一些实施方案中,用于本发明方法中的AAV进行复制所依赖的病毒蛋白可通过前述病毒蛋白中的一者或其编码核酸的突变诱发(即,通过插入、缺失或取代)产生。在一些实施方案中,病毒蛋白与前述病毒蛋白中的一或多者具有至少70%、75%、80%、85%、90%、95%、98%或99%或更大相似性。
分析AAV进行复制所依赖的cap蛋白、rep蛋白及病毒蛋白的功能的方法为所属技术领域中众所周知的。
在一些实施方案中,病毒表达载体可与向目标细胞投予的脂质递送媒剂(例如,如本申请中所描述的阳离子脂质粒或LNP)相关联。
含有本申请中所描述的核酸分子的各种递送系统可投予生物体以活体内递送至细胞或离体投予细胞或细胞培养物。投予是通过常用于引入分子以最终与血液、流体或细胞接触的途径中的任一者来进行,这些途径包括但不限于注射、输注、局部施用及电穿孔。投予此类核酸的适合方法为可获得的且为本领域技术人员已知。
可活体外、活体内或离体递送核酸分子以靶向各种细胞及/或组织。在一些实施方案中,递送可靶向各种器官/组织及相应的细胞,例如靶向大脑、心脏、骨胳肌肉、肝脏、肾脏、脾或胃。在一些实施方案中,核酸分子递送至神经元细胞、心肌细胞、骨胳肌肉细胞、平滑肌细胞、肝细胞、足细胞或上皮细胞中的任一者或多者。在一些实施方案中,递送可靶向患病细胞,诸如(例如)肿瘤或癌症细胞。在一些实施方案中,递送可靶向干细胞、血细胞或免疫细胞。
在一些实施方案中,本发明提供一种本申请中所揭示的载体中的任一者或本申请中所揭示的核酸中的任一者的混合物。在一些实施方案中,混合物包含两个或更多个核酸分子,其中核酸分子中的每一者包含不同的条形码核苷酸序列。在一些实施方案中,混合物包含约101至约104个核酸分子,其中各核酸分子包含不同的调控组件。在一些实施方案中,混合物包含约101个核酸分子,其中各核酸分子包含不同的调控组件。在一些实施方案中,混合物包含约102个核酸分子,其中各核酸分子包含不同的调控组件。在一些实施方案中,混合物包含约103个核酸分子,其中各核酸分子包含不同的调控组件。在一些实施方案中,混合物包含约104个核酸分子,其中各核酸分子包含不同的调控组件。在一些实施方案中,混合物或核酸分子包含约10、约50、约100、约250、约500、约750、约1000、约1250、约1500、约1750、约2000、约2500、约3000、约3500、约4000、约4500、约5000、约5500、约6000、约6500、约7000、约7500、约8000、约8500、约9000、约9500、约10000个或更多个不同的调控组件。
多任务处理分析的方法
如本申请中所描述,本发明部分关于(例如,活体内或活体外)筛选调控组件以便识别在特异性细胞群体中提供所关注的转基因的选择性表达的调控组件的高通量方法。
在一些实施方案中,方法包括通过载体的混合物提供/处理两个或更多个细胞(例如,细胞群体或组织),这些载体各自包含核酸序列,这些核酸序列包含可操作地连接至编码转基因(例如,包含报导基因及用于调控组件识别的条形码的转基因)的序列的候选调控组件。在一些实施方案中,本申请中所揭示的方法中的任一者可包含向细胞群体投予本申请中所揭示的核酸或载体中的任一者的步骤。投予是通过常用于引入分子以最终与细胞群体接触的途径中的任一者进行,这些途径包括但不限于注射、输注、局部施用及电穿孔。在一些实施方案中,细胞群体中的细胞为哺乳动物细胞。在一些实施方案中,细胞群体中的细胞为人类细胞。在一些实施方案中,细胞群体处于活体外。在一些实施方案中,细胞群体处于活体内。在一些实施方案中,细胞群体处于来自动物的组织或器官中。在一些实施方案中,细胞群体处于动物中。在一些实施方案中,动物为小鼠、大鼠、蛙、狗、兔、天竺鼠或非人类灵长类动物。在一些实施方案中,非人类灵长类动物为食蟹猕猴或黑猩猩。在一些实施方案中,若细胞群体处于动物中的组织或器官中,则自动物移除(例如以手术方式移除)组织或器官(或来自组织或器官的样品)以自细胞群体分开/分离细胞(如在下文更详细地描述)。在一些实施方案中,细胞群体处于动物中,且通过以下投予途径的任一者或多者向动物投予载体及/或核酸:静脉内、皮下、经口、鼻内、肌内、眼内、直接注射至所关注的组织中或鞘内。
在一些实施方案中,为了根据本发明方法识别调控组件,分开且分离经处理的细胞或组织的单个细胞以用于进一步分析,以例如评估转基因表达,确定表达转基因的各细胞的一致性及/或经表达的转基因与起始调控组件相关(例如使用条形码),如下文所描述。
单细胞RNA分离
在一些实施方案中,本发明提供并入允许自细胞(例如来自组织、器官或体液(例如血清)的细胞)的混合物分离或分开单细胞的任何方法的方法。在一些实施方案中,表达可操作地连接至调控组件的转基因的各细胞经分开/分离,以便测序细胞中的每一者的转录组。一般而言,用于自细胞(例如来自组织、器官或体液(例如血清)的细胞)的混合物分离单个细胞的各种方法为所属技术领域中已知的。此类方法包括但不限于:基于细胞分离组合物中的浮力密度分离细胞(美国专利第4,927,750号),基于密度梯度使用涂布有抗血清学因子的乳胶珠粒分离血清学因子(美国专利第3,862,303号),经由使用磁场分离细胞(美国专利第4,777,145号),及基于密度梯度分离T细胞及B细胞(美国专利第4,511,662号)。在一些实施方案中,基于细胞内或结合至细胞的荧光标记物发出的荧光强度,例如通过使用FACS分选来分离单个细胞。本领域技术人员可容易地针对特定背景或应用执行适合的方法。举例而言,某些细胞类型(例如,神经元及脂肪细胞)的细胞膜在自完整组织解离期间易于破裂。因此,某些标准器官解离技术(例如酶及机械力)相比于其他更适合于一些细胞类型。在一些情况下,视特定应用而定,细胞经完整地分开/分离(例如,无裂解)。在一些实施方案中,细胞的细胞核经完整地分开/分离(例如,无裂解)。
在一些实施方案中,单个细胞可自细胞群体(诸如自组织来源)分离。可用于本发明方法中的组织来源的实例包括结缔组织、肌肉组织、神经组织及上皮组织。可在本发明方法的应用中分开/分离且分析的结缔组织细胞的实例包括例如纤维母细胞、脂肪细胞、巨噬细胞、肥大细胞、浆细胞等。可在本发明方法的应用中分开/分离且分析的肌肉组织细胞的实例包括例如心肌细胞(cardiomyocytes)、骨胳肌肉细胞、心肌细胞(cardiac musclecells)、平滑肌细胞等。可在本发明方法的应用中分开/分离且分析的神经组织细胞的实例包括例如神经元、神经胶质等。可在本发明方法的应用中分开/分离且分析的神经组织细胞的实例包括神经元细胞的亚型,诸如GABA能细胞,包括(例如)表达谷氨酸脱羧酶2(GAD2)、GAD1、NKX2.1、DLX1、DLX5、SST、PV或VIP的GABA能神经元。可在本发明方法的应用中分开/分离且分析的上皮组织细胞的实例包括例如鳞状上皮细胞、立方体上皮细胞、柱状上皮细胞等。在一些实施方案中,单个细胞可自血细胞分开/分离。在一些实施方案中,单个细胞可自干细胞群体(例如自骨髓)分开/分离。在一些实施方案中,单个细胞可自肿瘤分开/分离。在一些实施方案中,单个细胞可自癌症分开/分离。
在一些实施方案中,本发明提供并入允许分选经分开/经分离细胞的任何方法的方法。在一些实施方案中,在进行单细胞RNA测序之前分选经分开/经分离细胞(或细胞核)。在某些实施方案中,基于转基因(例如,编码蛋白质(诸如EGFP或EGFP-KASH)的报导基因,如本申请中所举例说明)的表达,天然细胞特异性标记物的存在或添加标记的存在来分离且分选细胞。如本申请中所描述,出于细胞分选的目的,各种报导基因、天然细胞特异性标记物及标记为所属技术领域中已知的。如本领域技术人员将认识到,报导子转基因或标记可设计以按需要在细胞的任何部分(例如细胞表面或核包膜的表面)中表达。举例而言,皆作为代表性核结合域序列的KASH蛋白质(Klarsicht,ANC-1,Syne同源)及SUN蛋白质(Sad1及UNC-84)表达且位于核包膜的外膜。如本申请中所举例说明,包含荧光标记物及核结合域序列的转基因的表达允许基于转基因的表达进行细胞核分选。各种细胞分选方法(诸如荧光活化细胞分选(fluorescence-activated cell sorting;FACS)及磁体活化细胞分选(magnet-activated cell sorting;MACS)可用于本发明的实践中。
在一些实施方案中,在进行单细胞RNA测序之前不分选经分离细胞。
在一些实施方案中,本领域技术人员已知的任何标记物质可结合上文所描述的细胞分选方法使用。在某些实施方案中,可基于报导基因的表达(例如荧光标记,诸如EGFP的表达)分离且分选细胞。在一些实施方案中,标记为荧光标记。荧光标记的实例包括但不限于:绿色荧光蛋白(GFP);增强型绿色荧光蛋白(EGFP);黄色荧光蛋白(YFP),诸如mBanana;红色荧光蛋白(RFP),诸如mCherry、DsRed、dTomato、tdTomato、mHoneydew或mStrawberry、TagRFP;远红色荧光帕米膦酸盐(FRFP),诸如mGrape1或mGrape2;青色荧光蛋白质(CFP);蓝色荧光蛋白(BFP);增强型青色荧光蛋白质(ECFP);群青荧光蛋白(UMFP);橙色荧光蛋白(OFP),诸如mOrange或mTangerine;红色(橙色)荧光蛋白(mROFP);TagCFP或四半胱氨酸荧光基序。在某些实施方案中,荧光标记为GFP或EGFP。在一些实施方案中,将经分开/经分离细胞或细胞核包装于液滴中。在一些实施方案中,液滴为乳化液滴。在一些实施方案中,液滴具有纳升级别。在一些实施方案中,液滴进一步包含微粒。在一些实施方案中,微粒为珠粒。
在一些实施方案中,本发明提供并入划分细胞或细胞核以对其mRNA转录物进行进一步分析的任何方法的方法。在一些实施方案中,本发明提供包含本申请中所揭示的核酸中的任一者的液滴(例如,乳状液滴)。在一些实施方案中,本发明提供包含本申请中所揭示的细胞中的任一者的乳状液滴。在一些实施方案中,本发明提供包含本申请中所揭示的微粒中的任一者的液滴(例如,乳状液滴)。在一些实施方案中,本发明提供包含本申请中所揭示的微粒中的任一者以及本申请中所揭示的细胞中的任一者的液滴(例如乳状液滴)。
在一些实施方案中,一旦本申请中所揭示的细胞或细胞核中的任一者通过本申请中所揭示的液滴中的任一者包装,则细胞或细胞核经裂解以将细胞或细胞核的内容物(例如RNA内容物)释放至液滴中。在特定实施方案中,细胞或细胞核经裂解以将细胞或细胞核的内容物(例如RNA内容物)释放至液滴中,其中液滴进一步包含本申请中所揭示的微粒中的任一者。在一些实施方案中,复数个RNA分子连接至复数个微粒(例如珠粒),其中各珠粒带有独特的条形码。在一些实施方案中,微粒连接至微粒聚核苷酸,其中微粒聚核苷酸包含寡聚-dT核苷酸序列。在一些实施方案中,寡聚-dT核苷酸序列能够与自经裂解细胞或细胞核释放的mRNA分子中的任一者的3'聚腺苷酸化(poly(A))尾部杂合。在一些实施方案中,在本发明方法中捕获且分离用于分析的RNA包括mRNA、长非编码RNA、反义转录物及pri-miRNA。在一些实施方案中,经分离RNA为mRNA。在一具体实施例中,mRNA通过结合至带条形码的微粒(例如珠粒)分离。
识别经分离细胞的细胞类型的方法
如上文所描述,本发明方法预期测序单细胞转录组以确定细胞的一致性(即,细胞类型)及/或获得关于在特定细胞中表达的基因及转基因的信息。最终,序列信息可收集于库中,该库不仅可用以识别细胞,而且用于确定哪个候选调控组件能使转基因在特定细胞中表达,以及量化细胞中的转基因表达的水平。
在一些实施方案中,本发明提供并入允许自单细胞或单细胞核分离RNA的任何方法的方法。在一些实施方案中,本发明提供并入允许分析mRNA转录物同时保存关于转录物细胞的来源的信息的任何方法的方法。在一些实施方案中,本发明提供并入允许识别表达可操作地连接至候选调控组件的转基因的细胞的任何方法的方法。在一个实例中,单细胞可通过使用液滴-测序(也称为「Drop-Sequence」或「Drop-Seq」)方法识别。Drop-Sequence方法提供高通量单细胞RNA-seq及/或靶向核酸分析(例如,测序、定量逆转录聚合酶链反应和其类似物),其中使用独特带条形码的聚核苷酸单独标记来自不同细胞的RNA,从而允许创建单个库同时保留各测序mRNA的细胞标识。在一些实施方案中,分子条形码及基于乳液的微流体的组合用于以高通量方式自单个细胞分离、裂解、条形码化及制备核酸。
在Drop-Sequence方法中,连接至独特地带条形码的聚核苷酸的特别设计的微粒(例如,珠粒)用于细胞识别。如图1中所展示,可将含有大量独特地带条形码的聚核苷酸的单个微粒(珠粒)连同单细胞(或单细胞核)引入至单个乳状液滴中。在一些实施方案中,带条形码的聚核苷酸经由可挠性多原子接头共价连接至微粒(例如珠粒)(自5'至3',产生可用于酶促引发的游离3'末端)以形成带条形码的捕获珠粒。在一些实施方案中,带条形码的聚核苷酸经由可挠性多原子接头共价连接至5'至3'的微粒(例如珠粒)(产生可用于酶促引发的游离3'末端),以形成带条形码的捕获珠粒。
在一些实施方案中,本申请中所揭示的微粒(例如珠粒)中的任一者连接至聚核苷酸分子(在本申请中指「微粒聚核苷酸」)。在一些实施方案中,微粒聚核苷酸包含用作下游PCR及测序的引发位点的恒定序列。在一些实施方案中,微粒聚核苷酸包含微粒(例如珠粒)独有的条形码序列(「细胞条形码」),但该序列为连接至微粒的所有微粒聚核苷酸共有的。在一些实施方案中,微粒聚核苷酸包含各微粒聚核苷酸独有的独特分子标志(UMI)核苷酸序列。举例而言,若微粒包含两个或更多个微粒聚核苷酸,则微粒上的各微粒聚核苷酸将包含不同的UMI序列。在一些实施方案中,UMI可用以识别PCR复制品。在一些实施方案中,微粒聚核苷酸包含寡聚-dT序列。在一些实施方案中,寡聚-dT序列可用以捕获聚腺苷酸化mRNA(例如,经由与mRNA的polyA序列杂合)及/或引发逆转录。
在一些实施方案中,本申请中所揭示的微粒聚核苷酸分子中的任一者与本申请中所揭示的核酸分子中的任一者交互作用。在一些实施方案中,与微粒交互作用(例如连接至其)的核酸分子为自DNA分子转录的RNA分子。在一些实施方案中,RNA分子包含转基因及条形码序列。在一些实施方案中,DNA分子包含调控组件,其中RNA分子中的条形码序列与DNA分子中的调控组件相关。在一些实施方案中,核酸分子包含polyA尾部且微粒聚核苷酸分子包含寡聚-dT序列,且核酸分子的polyA尾部与微粒聚核苷酸的寡聚-dT序列杂合。
在一些实施方案中,各微粒聚核苷酸分子包含四个不同的区域:(1)恒定序列,其用作下游PCR及测序的引发位点(所有微粒上的微粒聚核苷酸分子相同);(2)「细胞条形码」,其在任一种微粒上的所有微粒聚核苷酸分子中为相同的,但不同于其他微粒上的细胞条形码(即,细胞条形码对于特定微粒为唯一的);(3)独特分子标志(UMI),其在各微粒聚核苷酸分子上为不同的,且用于识别PCR复制品;及(4)寡聚-dT序列,其用于捕获聚腺苷酸化mRNA及引发逆转录。
如上文所指出,由微流体装置所产生的乳状液滴(由不可混溶的载剂流体围绕的水性液滴)可用于用带条形码的微粒共包装细胞(或细胞核)。在一些实施方案中,细胞(或细胞核)在液滴内裂解,且来自经裂解细胞或细胞核的mRNA(转录组)与微粒(例如珠粒)的诸多微粒聚核苷酸分子(例如在微粒聚核苷酸分子的寡聚-dT区域上)杂合。参见例如图1。如本申请中所描述,在特定实施方案中,微粒带有独特的条形码,使得各液滴及其内容物为可区分的。本申请中所揭示的方法涵盖使用任何微粒类型的单细胞方法(例如10X基因组学铬单细胞基因表达分析)。参见例如美国公开申请案第20180030515号及Macosko等人,2015,「Highly Parallel Genome-wide Expression Profiling of Individual CellsUsing Nanoliter DroμLets」Cell 161,1202-1214;及Klein等人,2015,「DroμLetBarcoding for Single-Cell Transcriptomics ApμLied to Embryonic Stem Cells」Cell 161,1187-1201,其各自以全文引用的方式并入本申请中。可用以识别表达转基因的细胞的其他技术包括例如CEL-seq2/C1、MARS-seq、SCRB-seq、Smar-seq/C1及/或Smart-seq2。参见例如Ziegenhain等人,2017,Molecular Cell,65:631-643。
单细胞转录组测序
在一些实施方案中,如上文所论述,可使用本申请中所揭示的测序方法中的任一者来对来自经裂解细胞或细胞核的RNA进行测序,且收集序列信息以产生序列库。在一些实施方案中,本发明提供并入允许对细胞的转录组进行测序的任何方法的方法。用于产生序列库的各种方法为所属技术领域中已知的,且方法适用于正使用的特定高通量平台。在一些实施方案中,在mRNA分析中,3'聚腺苷酸化(poly(A))尾部经靶向,以便确保编码RNA与非编码RNA分离。在本申请中所描述的Drop-sequence方法中,带条形码的微粒聚核苷酸分子与mRNA杂合。参见例如图1。在一些实施方案中,在带条形码的微粒上获取mRNA之后,进行逆转录(RT)反应,以将各细胞的mRNA转化为第一股cDNA,其带有独特的条形码且共价连接至mRNA微粒。随后,在一些实施方案中,经由模版转换反应的通用引物用于在合成cDNA的下游引入PCR操作。在一些实施方案中,接着可使用PCR扩增cDNA中的每一者,定量且使用高通量平台(诸如第二代测序(NGS))并行测序以创建数据集。PCR方法在所属技术领域中为众所周知的。参见例如Dieffenbach及Dveksler,PCR Primer,实验室手册,Cold Spring HarborPress,ΜLainview,N.Y.[1995]。NGS方法,诸如Illumina/SolexaTM平台及NovaSeqTM平台已为本领域技术人员所已知。
一旦完成测序,则在一些实施方案中,原始序列数据可经历额外分析。在一些实施方案中,常规的库制备协定可用于制备RNA-Seq库。在一些实施方案中,可利用NGS数据的通用数据分析管线。在一些实施方案中,用于NGS数据的通用数据分析管线可包括但不限于预处理数据以移除衔接子序列及低质量读段,将数据映像至参考基因组或序列读数的重新比对,及分析编译的序列。举例而言,在一些实施方案中,序列可与特定人类转录组比对,且可提取其「细胞」条形码序列信息,以便识别哪些mRNA来自哪些细胞。在一些实施方案中,序列可与特定人类转录组比对,且可提取其「UMI」条形码序列信息,以便识别特定细胞中的特定转录物的丰度。在一些实施方案中,序列可与特定人类转录组比对,且可提取其「细胞」及「UMI」条形码序列信息,以便识别哪些mRNA来自哪些细胞及特定细胞中的特定转录物的丰度。序列的分析可包括各种生物信息学评估,包括但不限于:要求检测小核苷酸多态性(small nucleotide polymorphisms;SNP)的遗传变体的评估、新基因的检测、转基因插入位点的识别、表达转基因的细胞类型的确定、涉及转基因表达的候选调控组件的识别及/或基因(例如,转基因)转录物表达水平的评估。在一些实施方案中,经由单次测序运行,可同时获得数万个(或更多个)可区分的转录组。
单细胞表达图谱的分析
在一些实施方案中,本发明提供分析异质细胞群体以识别于给定细胞类型中提供选择性表达的候选调控组件的方法。在一些实施方案中,本发明提供并入任何允许识别选择性表达可操作地连接于候选调控组件的转基因的细胞的方法的方法。在一些实施方案中,细胞可在非均质细胞群体内。异质细胞群体不仅可包含不同类型的细胞(例如,不同谱系的细胞、不同分化状态的细胞及/或自整个身体中一或多种组织来源获得的细胞),而且可包含在各种细胞周期阶段中的细胞。在一些实施方案中,自这些异质细胞群体的转录组测量可进行多种生物信息评估。
在一些实施方案中,原始序列数据可与参考基因组比对,提供与各基因相关的读段数目的计数。在一些实施方案中,原始序列数据可与已知细胞类型或新颖细胞类型的基因表达的一或多个分子图谱中的序列数据比对。在一些实施方案中,通过使用UMI条形码量化转录物的数目来确定读段计数以识别且移除由于PCR扩增偏差而已包括在内的转录物。将数据标准化以解释在cDNA库形成及测序的效率方面的细胞与细胞变化。许多标准化方法为此项技术中已知的。参见例如以全文引用的方式并入本申请中的Risso等人,2018,「AGeneral and Flexible Method for Signal Extraction from Single-Cell RNA-seqData」Nat.Comm.9:284;1-17。在一些实施方案中,细胞或基因可基于其转录组图谱丛集以形成亚组,允许分别识别细胞亚型或共变基因。在一些实施方案中,诸如主成分分析(principal component analysis;PCA)或t-SNE的各种分析可用于通过将细胞自高维空间转换至低维空间来简化可视化及图案检测的数据。在一些实施方案中,代表性细胞标记(即,文献衍生的典型生物标记)可映像至各丛集上,以便识别特异性细胞群体。
在一些实施方案中,如本申请所描述,若细胞表达可操作地连接于候选调控组件的带条形码的转基因(例如,编码EGFP-KASH的转基因),则可对各转基因条形码进行比较性分析以评估给定候选调控组件对特定细胞类型中转基因表达的影响。举例而言,可评估可操作地连接于特定调控组件的特定转基因的表达量值。在一些实施方案中,可操作地连接于候选调控组件的特定转基因的表达量值(例如,表达的减少或增加量)可与可操作地连接于不同候选调控组件的相同转基因的表达量进行比较。在一些实施方案中,可操作地连接于候选调控组件的特定转基因在一种细胞类型中的表达量值(例如,表达的减少或增加量)可与不同细胞类型中连接至相同候选调控组件的相同转基因的表达量进行比较。另外,在一些实施方案中,进一步预期可进行比较以比较可操作地连接于候选调控组件的转基因在各种细胞类型中的表达。以此方式,可确定调控组件的细胞类型特异性及可操作地连接于调控组件的转基因的表达量值。
确定通过调控组件提供的选择性表达
在一些实施方案中,本发明的方法包括各种方法,例如用于自表达报导转基因的细胞中分离RNA、测序所关注的转录物、测量及/或检测转基因的表达、识别于所关注的细胞类型中提供转基因的表达的调控组件等。基于转基因在目标细胞类型中表达的选择性,本发明方法可用于识别且选择适合于在目标细胞类型中表达任何所关注的转基因的调控组件。在一些实施方案中,转基因的表达选择性为确定转基因是否在目标细胞类型中而非在非目标细胞类型中表达。在一些实施方案中,转基因的表达选择性为确定转基因是否以较大水平在目标细胞类型而非在非目标细胞类型中表达。在一些实施方案中,转基因的表达选择性为确定转基因是否以较低水平在目标细胞类型而非在非目标细胞类型中表达。
在一些实施方案中,本发明方法可用于识别在任何所关注的细胞类型中提供选择性表达的调控组件。在一些实施方案中,所关注的细胞类型为肌肉细胞、神经元细胞、上皮细胞或结缔组织细胞或其各种亚群。在一些实施方案中,肌肉细胞为心肌细胞(cardiomyocyte)、骨骼肌细胞、心肌细胞(cardiac muscle cell)或平滑肌细胞。在一些实施方案中,上皮细胞为鳞状上皮细胞、立方体上皮细胞或柱状上皮细胞。在一些实施方案中,神经元细胞为神经元或胶细胞。在一些实施方案中,结缔组织细胞为纤维母细胞、脂肪细胞、巨噬细胞、肥大细胞或浆细胞。在一些实施方案中,所关注的细胞为血细胞。在一些实施方案中,所关注的细胞为干细胞。在一些实施方案中,所关注的细胞为肿瘤细胞(例如,癌细胞)。在一些实施方案中,所关注的细胞类型为真核细胞,诸如哺乳动物细胞,其包括(但不限于)来自以下的细胞:人类、非人类灵长类动物(诸如猿、黑猩猩、猴及红毛猩猩),家养动物(包括狗及猫)以及家畜(诸如马、牛、猪、绵羊及山羊),或其他哺乳动物物种,包括但不限于小鼠、大鼠、天竺鼠、兔、仓鼠及其类似物。在一些实施方案中,所关注的细胞类型包括「转化体」及「转化细胞」,其包括初级转化细胞及自其衍生的子代(不考虑继代次数)。
在简单情形中,可确定给定候选调控组件(「调控组件A」)将转基因于特定细胞类型中的表达驱动至与相同细胞类型中的另一调控组件(「调控组件B」)相比更高的水平。在此类情形中,与调控组件B相比,调控组件A将视为在使转基因在特定细胞类型中表达方面更具选择性。在另一简单情形中,可确定给定调控组件A将转基因于特定细胞类型中的表达驱动至比相同细胞类型中的另一调控组件B更低的水平。在一些情况下,调控组件A可使转基因在给定组织(例如,神经元组织)的许多不同细胞类型中广泛表达。在一些实施方案中,调控组件B可使转基因在给定组织的目标细胞的离散群体中表达(即,调控组件B提供表达转基因的目标细胞相对于表达转基因的细胞总数的更高比率)。在此情形下,与调控组件A相比,调控组件B将视为在使转基因在更有限的细胞类型亚群中表达方面更具选择性,其可有益于例如减少脱靶事件。在上文简化的实例情形中,用于确定选择性的比较不为彼此互斥的。
在一些实施方案中,对于调控组件的特定用途及/或为实现特定治疗目的,可考虑多重比较。在一些实施方案中,适合于特定治疗目的的调控组件不需要在给定细胞类型中提供最高或最低表达量。如本申请所详述,可以多种方法测量及测定通过候选调控组件驱动的表达的选择性。
在一个态样中,本发明方法可用于自可操作地连接于转基因(例如,报导基因)的候选调控组件池筛选及识别允许转基因于所关注的细胞类型中的任何可检测表达的调控组件。即,可操作地连接于所关注的细胞类型中给定候选调控组件的转基因的任何可检测表达指示调控组件可用于所关注的细胞类型中以驱动任何转基因的表达。借助于实例,已识别为驱动转基因(例如,报导基因)于PV细胞中表达的调控组件指示识别的调控组件可用于PV细胞中以驱动所关注的转基因的表达。在一些实施方案中,转基因的表达量不需要与参考表达量相比较;可操作地连接于调控组件的转基因的任何可检测表达量指示调控组件在给定细胞类型中提供选择性表达。因此,在一些实施方案中,与另一细胞类型(其中检测到未表达或低表达)相比,识别的调控组件选择性地驱动转基因在一种细胞类型中的表达。在一些实施方案中,与另一候选调控组件(其并未驱动转基因在相同细胞类型中的表达)相比,识别的调控组件选择性地驱动转基因在一种细胞类型中的表达。
在一些态样中,本申请所描述的方法可用于自可操作地连接至转基因(例如,报导基因)的候选调控组件池筛选及识别与相同细胞类型中转基因的参考表达量相比允许转基因于所关注的细胞类型中选择性(例如,增加或减少)表达的调控组件。在一些实施方案中,转基因的参考表达量为通过对照调控组件提供的转基因表达量。本领域技术人员了解到本领域中的许多例示性对照调控组件(例如,CBA)。在一些实施方案中,对照调控组件为天然存在的调控组件(例如,CBA)。在一些实施方案中,转基因的参考表达量为通过相同细胞类型中的另一候选调控组件提供的转基因表达量。在一些实施方案中,转基因的参考表达量为通过相同细胞类型中的泛细胞调控组件提供的转基因表达量。泛细胞调控组件的实例包括例如,巨细胞病毒主要即刻早期启动子(CMV)、鸡β-肌动蛋白启动子(CBA)、CMV早期增强子/CBA启动子(CAG)、延伸因子-1α启动子(EF1α)、猴病毒40启动子(SV40)、磷酸甘油酸激酶启动子(PGK)及聚泛素C基因启动子(UBC)且如本申请所描述。借助于实例,候选调控组件于所关注的细胞类型中的选择性可通过将由细胞类型中调控组件提供的表达量与由相同细胞类型中一或多种不同候选调控组件驱动的表达量进行比较来确定。在一些实施方案中,调控组件提供与相同细胞类型中的参考表达量(例如,通过另一候选调控组件提供的转基因表达量;通过泛细胞调控组件提供的转基因表达量)相比,大于或小于至少1.2倍、至少1.4倍、至少1.6倍、至少1.8倍、至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少12倍、至少14倍、至少16倍、至少18倍、至少20倍的选择性表达。在一些实施方案中,调控组件提供与相同细胞类型中的参考表达量(例如,通过另一候选调控组件提供的转基因表达量;通过泛细胞调控组件提供的转基因表达量)相比,大于至少2%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少100%、至少125%、至少150%、至少175%、至少200%、至少250%、至少300%、至少350%、至少400%、至少450%或至少500%的选择性表达。在一些实施方案中,调控组件提供与相同细胞类型中的参考表达量(例如,通过另一候选调控组件提供的转基因表达量;通过泛细胞调控组件提供的转基因表达量)相比,小于至少2%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的选择性表达。在一些实施方案中,调控组件提供与相同细胞类型中的参考表达量(例如,通过另一候选调控组件提供的转基因表达量;通过泛细胞调控组件提供的转基因表达量)相比,大于约1.5倍、约2倍、约2.5倍、约3倍、约3.5倍、约4倍、约4.5倍、约5倍、约5.5倍、约6倍、约6.5倍、约7倍、约7.5倍、约8倍、约8.5倍、约9倍、约9.5倍或约10倍的选择性表达。在一些实施方案中,调控组件提供与相同细胞类型中的参考表达量(例如,通过另一候选调控组件提供的转基因表达量;通过泛细胞调控组件提供的转基因表达量)相比,小于约1.5倍、约2倍、约2.5倍、约3倍、约3.5倍、约4倍、约4.5倍、约5倍、约5.5倍、约6倍、约6.5倍、约7倍、约7.5倍、约8倍、约8.5倍、约9倍、约9.5倍或约10倍的选择性表达。
在一些态样中,本申请所描述的方法中的任一者可用于自可操作地连接至转基因(例如,报导基因)的候选调控组件池筛选及识别与一或多种不同细胞类型中可操作地连接至相同调控组件的相同转基因的表达量(参考表达量)相比,在一种细胞类型中可操作地连接至调控组件的转基因的选择性(例如,增加或减少)表达。借助于实例,候选调控组件于所关注的细胞类型中的选择性可通过将该细胞类型中由调控组件提供的表达量与一或多种不同细胞类型中由相同调控组件提供的表达量进行比较来确定。在一些实施方案中,调控组件提供与参考表达量(例如,通过一或多种不同细胞类型中相同调控组件提供的转基因表达量)相比,大于至少1.2倍、至少1.4倍、至少1.6倍、至少1.8倍、至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少12倍、至少14倍、至少16倍、至少18倍、至少20倍的选择性表达。在一些实施方案中,调控组件提供与参考表达量(例如,通过一或多种不同细胞类型中相同调控组件提供的转基因表达量)相比,小于至少1.2倍、至少1.4倍、至少1.6倍、至少1.8倍、至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少12倍、至少14倍、至少16倍、至少18倍、至少20倍的选择性表达。在一些实施方案中,调控组件提供与参考表达量(例如,通过一或多种不同细胞类型中相同调控组件提供的转基因表达量)相比,大于至少2%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少100%、至少125%、至少150%、至少175%、至少200%、至少250%、至少300%、至少350%、至少400%、至少450%或至少500%的选择性表达。在一些实施方案中,调控组件提供与参考表达量(例如,通过一或多种不同细胞类型中相同调控组件提供的转基因表达量)相比,小于至少2%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的选择性表达。在一些实施方案中,调控组件提供与参考表达量(例如,通过一或多种不同细胞类型中相同调控组件提供的转基因表达量)相比,大于约1.5倍、约2倍、约2.5倍、约3倍、约3.5倍、约4倍、约4.5倍、约5倍、约5.5倍、约6倍、约6.5倍、约7倍、约7.5倍、约8倍、约8.5倍、约9倍、约9.5倍或约10倍的选择性表达。在一些实施方案中,调控组件提供与参考表达量(例如,通过一或多种不同细胞类型中相同调控组件提供的转基因表达量)相比,小于约1.5倍、约2倍、约2.5倍、约3倍、约3.5倍、约4倍、约4.5倍、约5倍、约5.5倍、约6倍、约6.5倍、约7倍、约7.5倍、约8倍、约8.5倍、约9倍、约9.5倍或约10倍的选择性表达。
在一些实施方案中,可操作地连接至调控组件的转基因表达的选择性可通过测量在细胞群体中(例如,在组织中)表达转基因的所关注的特定细胞类型(所关注的假设细胞类型「Cell X」)的比率的方法来测定。在一些实施方案中,比率的测定不包括测量转基因表达量或转基因表达的量值;相反,在此类实施方案中,细胞中的任何可检测表达促成该比率。在一些实施方案中,可操作地连接至候选调控组件的转基因表达的选择性可通过将在细胞群体中(例如,在组织中)表达转基因的预定阈值水平(例如,可检测水平)的Cell X细胞的数目与表达可操作地连接至相同调控组件的转基因的细胞的总数目进行比较来测量。在一些实施方案中,此「比率」经计算为在细胞群体(Cell X+非Cell X细胞)中表达转基因的Cell X细胞的数目与表达转基因的细胞的总数目之比,其中转基因可操作地连接至细胞群体中所有细胞中的相同调控组件。借助于实例,与神经元组织中的其他非PV细胞相比,可操作地连接至GABA能神经元(诸如PV神经元)中的调控组件的转基因(例如,编码GFP的转基因)的选择性表达可通过将表达可检测水平的转基因(例如,表达GFP转基因)的PV细胞的数目与在相同调控组件A控制下神经元组织中表达GFP的细胞的总数目进行比较来测量(即,PV与表达GFP的总细胞(PV+非PV细胞)的比率)。根据本申请所描述的分析方法,此类测量、检测及定量可在活体内或活体外进行。举例而言,使用本申请详述的分析方法,可分开且分离表达GFP的细胞,可确定各经分离细胞的标识(例如,PV神经元与非PV细胞),且可量化在候选调控组件控制下的表达GFP的PV神经元及在相同调控组件控制下的表达GFP的非PV神经元的数目。在一些实施方案中,表达可操作地连接至调控组件的转基因的Cell X细胞的数目相对于表达可操作地连接至相同调控组件的转基因的总细胞愈高(即,比率愈高),调控组件对Cell X的选择性愈高。
在一些实施方案中,可使用基于免疫组织化学的共定位分析来确定或证实细胞类型中调控组件的选择性。在一些实施方案中,分析需要使用:a)可操作地连接至调控组件的转基因(例如,编码GFP的转基因)以测量转基因表达及,b)识别对目标细胞类型具特异性的标记的结合剂(例如,抗体),其中结合剂连接至可检测标记。举例而言,在一些实施方案中,可使用基于免疫组织化学的共定位分析来确定或证实细胞类型的选择性,该共定位分析使用:a)可操作地连接至调控组件的转基因(例如,编码GFP的转基因)以测量转基因表达及,b)识别连接至第二荧光标记(例如,红色荧光蛋白)的所关注的细胞类型(例如,与PV神经元特异性相互作用的抗PV抗体)的抗体。细胞类型中基因表达的选择性以对细胞类型(例如,PV细胞)也为阳性的GFP阳性细胞(例如,总细胞)的百分比形式测量。在此种分析中,也为GFP阳性的所关注的阳性细胞类型通过两种荧光信号的共定域指示,即,红色及绿色荧光的重叠。此种测量、分析及/或检测可通过眼睛检查或通过计算机进行。
在一些实施方案中,如本申请所描述的「比率」可通过将表达可操作地连接至候选调控组件的转基因的Cell X细胞的数目除以表达可操作地连接至相同调控组件的转基因的细胞的总数目(即,Cell X及非Cell X细胞)且乘以100以转换成百分比来计算。在一些实施方案中,若表达可操作地连接至调控组件A的转基因的细胞的总数目的约35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或大于约99%为Cell X细胞,则调控组件A对Cell X为选择性的。
在一些实施方案中,可使用调控组件针对Cell X细胞确定如上文所描述的比率(或百分比)且将其与使用一或多种不同调控组件针对Cell X细胞确定的比率(或百分比)进行比较。举例而言,在一些实施方案中,当表达转基因的Cell X细胞的百分比(例如,CellX细胞/总细胞×100)与可操作地连接至不同调控组件时表达相同转基因的Cell X细胞的百分比相比为更高百分比时,调控组件对Cell X中的表达具有选择性。在一些实施方案中,不同调控组件为参考调控组件。在一些实施方案中,不同调控组件为泛细胞调控组件,例如,巨细胞病毒主要即刻早期启动子(CMV)、鸡β-肌动蛋白启动子(CBA)、CMV早期增强子/CBA启动子(CAG)、延伸因子-1α启动子(EF1α)、猴病毒40启动子(SV40)、磷酸甘油酸激酶启动子(PGK)及聚泛素C基因启动子(UBC)且如本申请所描述。在一些实施方案中,当表达转基因的Cell X细胞的百分比(例如,Cell X细胞/总细胞×100)比可操作地连接至不同调控组件时表达相同转基因的Cell X细胞的百分比高至少2%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少100%、至少125%、至少150%、至少175%、至少200%、至少250%、至少300%、至少350%、至少400%、至少450%或至少500%,或高至少1-5%、5%-10%、10-15%、15-20%、20-25%、25-30%、30-35%、35-40%、40-45%、45-50%、50-55%、55-60%、65-70%、70-75%、75-80%、80-85%、85-90%、90-95%、100-125%、125-150%、150-200%、200-250%、250-300%、300-350%、350-400%、400-450%或450-500%时,调控组件在Cell X中提供选择性表达。在一些实施方案中,当表达转基因的Cell X细胞的百分比(例如,Cell X细胞/总细胞×100)比可操作地连接至不同调控组件时表达相同转基因的Cell X细胞的百分比低至少2%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%,或低至少1-5%、5%-10%、10-15%、15-20%、20-25%、25-30%、30-35%、35-40%、40-45%、45-50%、50-55%、55-60%、65-70%、70-75%、75-80%、80-85%、85-90%或90-95%时,调控组件在Cell X中提供选择性表达。在一些实施方案中,当表达转基因的Cell X细胞的百分比(例如,Cell X细胞/总细胞×100)与可操作地连接至不同调控组件时表达相同转基因的Cell X细胞的百分比相比高至少1.5倍、至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少15倍、至少20倍、至少25倍或至少50倍时,调控组件在Cell X中提供选择性表达。在一些实施方案中,当表达转基因的Cell X细胞的百分比(例如,Cell X细胞/总细胞×100)与可操作地连接至不同调控组件时表达相同转基因的Cell X细胞的百分比相比低至少1.5倍、至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少15倍、至少20倍、至少25倍或至少50倍时,调控组件在Cell X中提供选择性表达。在一些实施方案中,当表达转基因的Cell X细胞的百分比(例如,Cell X细胞/总细胞×100)为比可操作地连接至不同调控组件时表达转基因的Cell X细胞的百分比高至少1.1、1.2、1.3、1.4、1.5、2、2.5、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5、10、10.5、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100倍的水平时,调控组件在CellX中提供选择性表达。
在一些实施方案中,在Cell X中提供选择性表达的调控组件也具有高水平的活性。在某些实施方案中,与不具有调控组件或具有不同调控组件(参考调控组件)的Cell X细胞中相同构建体的表达量相比,在Cell X中提供选择性表达的调控组件将Cell X细胞中转基因的表达增加至少2、5、10、15、20、30、40、50、60、70、80、90、100倍或更多倍。在一些实施方案中,与不具有调控组件或具有不同调控组件(参考调控组件)的Cell X细胞中相同构建体的表达量相比,在Cell X中提供选择性表达的调控组件将基因表达增加至少1.5%、2%、5%、10%、15%、20%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。在一些实施方案中,与不同于Cell X的细胞类型中相同构建体的表达量相比,在Cell X中提供选择性表达的调控组件将Cell X细胞中的基因表达增加至少1.5%、2%、5%、10%、15%、20%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。在一些实施方案中,与表达可操作地连接至相同调控组件的相同转基因的不同细胞中的表达增加量相比,调控组件将Cell X细胞中的转基因表达增加至少1.5%、2%、5%、10%、15%、20%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。在一些实施方案中,与表达可操作地连接至不同调控组件(例如,参考调控组件或泛细胞调控组件)的相同转基因的Cell X细胞中的表达增加量相比,调控组件将Cell X细胞中的转基因表达增加至少1.5%、2%、5%、10%、15%、20%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。
一般而言,表达的增加或减少可以转录或转录后水平发生,且可测量转录或转录后产物。举例而言,以转录水平,调控组件可通过募集转录因子及/或RNA聚合酶、增加转录起始或募集增加转录水平的DNA及/或组蛋白修饰来增加表达。表达的增加或减少可通过测量表示转基因的RNA转录物的量的增加或减少来检测。以转录后水平,调控组件可通过增加翻译成蛋白质的RNA的量或速率来增加表达。此可经由各种机制,例如通过增加mRNA的稳定性或增加翻译所需蛋白质的募集及组装来实现。此种蛋白质表达的增加或减少可通过测量表示转基因的蛋白质表达的量来检测。产生的蛋白质的量可例如通过酶联免疫吸附分析法(enzyme linked immunosorbent assay;ELISA)直接测量或例如通过功能分析间接测量。
使用上述方法识别的各种RE的选择性可进一步测试及证实特异性细胞类型中的选择性基因表达。举例而言,使用免疫组织化学方法可测试RE在GABA能神经元(诸如PV、SST或VIP神经元)中的选择性基因表达。GABA能神经元可通过诸如谷氨酸脱羧酶2(GAD2)、GAD1、NKX2.1、DLX1、DLX5、SST、PV及VIP的表达的标记来识别。替代地,可测试RE在其他细胞类型中的选择性基因表达,诸如兴奋性神经元、多巴胺神经元、小神经胶质细胞、运动神经元、血管细胞、非GABA能神经元或其他CNS细胞、上皮细胞、心肌细胞或肝细胞或体内任何其他细胞类型。在所关注的细胞或细胞类型中通过调控组件驱动的表达的选择性可以许多方法测量。目标细胞类型中的基因表达相对于非目标细胞类型的选择性可通过将表达来自可操作地连接至一或多个调控组件的基因的转录物的可检测水平的目标细胞的数目与表达该基因的细胞的总数目进行比较来测量。此类测量、检测及定量可在活体内或活体外进行。
在一些情况下,特异性细胞类型的选择性可使用共定位分析来确定。在一些情况下,共定位分析是基于免疫组织化学。在一些情况下,将可检测报导基因用作转基因以允许在所关注的细胞类型中检测及/或测量基因表达。在一些情况下,特异性标记目标细胞的可检测标记(例如,荧光标记或抗体)用于检测及/或测量目标细胞。在一些情况下,共定位分析采用成像(例如,荧光成像)以确定不同荧光标记之间的重叠,例如,指示目标细胞的荧光信号与指示基因表达的另一荧光信号之间的重叠。在一些情况下,用于共定位分析的荧光标记包括红色荧光蛋白(RFP),诸如tdTomato报导基因,及绿色荧光报导蛋白,诸如eGFP。
在一些情况下,可操作地连接至一或多个调控组件的基因为荧光蛋白,例如eGFP或RFP,其中转基因的表达提供可检测信号。在一些情况下,将组织进行eGFP染色或使用荧光显微镜直接检测来自eGFP的荧光。具有不同荧光或可检测信号的第二荧光标记或报导基因可用于指示目标细胞,诸如识别目标细胞的抗体。举例而言,与PV神经元特异性相互作用的抗PV抗体可用于产生可检测信号,该可检测信号与用于测量基因表达的荧光可区分,诸如红色荧光或红色斑点。因此,在一实例中,其中eGFP为可操作地连接至一或多个在PV神经元中驱动选择性表达的调控组件的转基因,且其中PV神经元用抗PV抗体标记,PV细胞中基因表达的选择性以也为PV+的eGFP+细胞的百分比形式测量。在此种分析中,也为eGFP+的PV+细胞通过两种荧光信号的重叠来指示,即,红色及绿色荧光的重叠。此种测量、分析及/或检测可通过眼睛检查或通过计算机进行。
在一些情况下,与表达转基因的非目标细胞类型(或其他细胞)的比例相比,我们也可测量表达转基因的所关注的细胞类型(或目标细胞类型)的比例以评估一或多个可操作地连接至转基因的调控组件的选择性。类似地,表达的选择性可通过将表达可操作地连接至一或多个调控组件的转基因的目标细胞的数目与表达转基因的所有细胞的总数目进行比较来测量。在两种方法中,表达转基因的目标细胞的数目愈高,目标细胞的调控组件更具选择性。在一些情况下,目标细胞为PV神经元。
单细胞核多任务处理分析的替代应用
在某些实施方案中,本申请所描述的单细胞核多任务处理分析用于测量所关注的细胞中的AAV转导。在此类实施方案中,多任务处理分析可用于测量所关注的特定病毒向所关注的细胞中的转导,诸如特定AAV血清型、重组或经工程改造AAV或特定慢病毒株。在某些实施方案中,多任务处理分析用于测量选自由以下者组成的组的AAV向所关注的细胞中的转导:AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、rh10及其杂合体、禽类AAV、牛类AAV、犬类AAV、马类AAV、灵长类AAV、非灵长类AAV及绵羊类AAV。在某些实施方案中,本申请所描述的单细胞核多任务处理分析用于测量AAV向所关注的细胞类型中的转导,诸如CNS细胞(例如,神经元或胶质细胞(诸如星形胶质细胞))、非CNS细胞(例如,兴奋性神经元、多巴胺神经元、小神经胶质细胞、运动神经元、血管细胞、非GABA能神经元或其他CNS细胞)、上皮细胞、心肌细胞或肝细胞。在特定实施方案中,本申请所描述的单细胞核多任务处理分析用于测量AAV向GABA能神经元中的转导,其可通过诸如谷氨酸脱羧酶2(GAD2)、GAD1、NKX2.1、DLX1、DLX5、SST、PV及VIP的表达的标记来识别。
在特定实施方案中,本发明的单细胞核多任务处理分析用于通过测量所关注的细胞中病毒转导的增加或减少来识别增加病毒向关注细胞中的转导的新颖病毒壳体或病毒DNA序列。举例而言,可筛选新颖病毒壳体变体或病毒DNA序列的库以识别增加病毒向所关注的细胞中的转导(例如,AAV或慢病毒)的壳体或DNA序列。在一些情况下,壳体或DNA序列增加病毒向所关注的细胞类型中的转导,诸如CNS细胞(例如,神经元或胶细胞(诸如星形胶质细胞))、非CNS细胞(例如,兴奋性神经元、多巴胺神经元、小神经胶质细胞、运动神经元、血管细胞、非GABA能神经元或其他CNS细胞)、上皮细胞、心肌细胞或肝细胞。在特定情况下,本申请所描述的单细胞核多任务处理分析用于识别增加AAV向GABA能神经元(诸如表达谷氨酸脱羧酶2(GAD2)、GAD1、NKX2.1、DLX1、DLX5、SST、PV或VIP的GABA能神经元)中的转导的壳体或DNA序列。
在其他实施方案中,可筛选新颖病毒壳体变体或病毒DNA序列的库以识别减少或抑制病毒向所关注的细胞中的转导(例如,AAV或慢病毒)的病毒壳体或病毒DNA序列。举例而言,壳体或DNA序列减少或抑制病毒向所关注的细胞类型中的转导,诸如CNS细胞(例如,神经元或胶细胞(诸如星形胶质细胞))、非CNS细胞(例如,兴奋性神经元、多巴胺神经元、小神经胶质细胞、运动神经元、血管细胞、非GABA能神经元或其他CNS细胞)、上皮细胞、心肌细胞或肝细胞。在特定实施方案中,本申请所描述的单细胞核多任务处理分析用于识别减少或抑制AAV向GABA能神经元(诸如表达谷氨酸脱羧酶2(GAD2)、GAD1、NKX2.1、DLX1、DLX5、SST、PV或VIP的GABA能神经元)中的转导的壳体或DNA序列。
在另一个实施方案中,本发明的单细胞核多任务处理分析用于识别调节由病毒(例如,AAV、慢病毒、HSV等)向所关注的细胞中转导的转基因的翻译的因子。举例而言,筛选候选因子的库以识别增加或减少由病毒(例如,AAV、慢病毒、HSV等)向所关注的细胞中转导的转基因的翻译的因子。在一个实施方案中,因子增加或减少向所关注的细胞中转导的转基因的翻译,诸如CNS细胞(例如,神经元或胶细胞(诸如星形胶质细胞))、非CNS细胞(例如,兴奋性神经元、多巴胺神经元、小神经胶质细胞、运动神经元、血管细胞、非GABA能神经元或其他CNS细胞)、上皮细胞、心肌细胞或肝细胞。在特定实施方案中,本申请所描述的单细胞核多任务处理分析用于识别增加或减少向GABA能神经元(诸如表达谷氨酸脱羧酶2(GAD2)、GAD1、NKX2.1、DLX1、DLX5、SST、PV或VIP的GABA能神经元)中转导的转基因的翻译的因子。
在另一实施方案中,本发明的单细胞核多任务处理分析用于识别在所关注的细胞中促进病毒(例如,AAV)第二股合成的病毒DNA序列。举例而言,可筛选新颖病毒DNA序列的库以识别在所关注的细胞中增加或减少AAV第二股合成的DNA序列。举例而言,DNA序列在所关注的细胞类型中增加或减少AAV第二股合成,诸如CNS细胞(例如,神经元或胶细胞(诸如星形胶质细胞))、非CNS细胞(例如,兴奋性神经元、多巴胺神经元、小神经胶质细胞、运动神经元、血管细胞、非GABA能神经元或其他CNS细胞)、上皮细胞、心肌细胞或肝细胞。在特定实施方案中,本申请所描述的单细胞核多任务处理分析用于识别在GABA能神经元(诸如表达谷氨酸脱羧酶2(GAD2)、GAD1、NKX2.1、DLX1、DLX5、SST、PV或VIP的GABA能神经元)中增加或减少AAV第二股合成的病毒DNA序列。
在另一实施方案中,本发明的单细胞核多任务处理分析用于测量所关注的细胞中回应于所关注的功能蛋白(诸如功能蛋白效应子)的基因表达。在此类实施方案中,可将蛋白质的库添加至一或多个细胞中,且在所关注的细胞中测量回应于各独特蛋白质的基因表达。针对治疗反应、细胞路径信号传导反应、脱靶基因调节、免疫反应等,可分析响应于一或多种来自库的蛋白质的基因表达。
序列
SEQ ID NO:1
TCAACAGGGGGACACTTGGGAAAGAAGGATGGGGACAGAGCCGAGAGGACTGTTACACATTAGAGAAACATCAGTGACTGTGCCAGCTTTGGGGTAGACTGCACAAAAGCCCTGAGGCAGCACAGGCAGGATCCAGTCTGCTGGTCCCAGGAAGCTAACCGTCTCAGACAGAGCACAAAGCACCGAGACATGTGCCACAAGGCTTGTGTAGAGAGGTCAGAGGACAGCGTACAGGTCCCAGAGATCAAACTCAACCTCACCAGGCTTGGCAGCAAGCCTTTACCAACCCACCCCCACCCCACCCACCCTGCACGCGCCCCTCTCCCCTCCCCATGGTCTCCCATGGCTATCTCACTTGGCCCTAAAATGTTTAAGGATGACACTGGCTGCTGAGTGGAAATGAGACAGCAGAAGTCAACAGTAGATTTTAGGAAAGCCAGAGAAAAAGGCTTGTGCTGTTTTTAGAAAGCCAAGGGACAAGCTAAGATAGGGCCCAAGTAATGCTAGTATTTACATTTATCCACACAAAACGGACGGGCCTCCGCTGAACCAGTGAGGCCCCAGACGTGCGCATAAATAACCCCTGCGTGCTGCACCACCTGGGGAGAGGGGGAGGACCACGGTAAATGGAGCGAGCGCATAGCAAAAGGGACGCGGGGTCCTTTTCTCTGCCGGTGGCACTGGGTAGCTGTGGCCAGGTGTGGTACTTTGATGGGGCCCAGGGCTGGAGCTCAAGGAAGCGTCGCAGGGTCACAGATCTGGGGGAACCCCGGGGAAAAGCACTGAGGCAAAACCGCCGCTCGTCTCCTACAATATATGGGAGGGGGAGGTTGAGTACGTTCTGGATTACTCATAAGACCTTTTTTTTTTCCTTCCGGGCGCAAAACCGTGAGCTGGATTTATAATCGCCCTATAAAGCTCCAGAGGCGGTCAGGCACCTGCAGAGGAGCCCCGCCGCTCCGCCGACTAGCTGCCCCCGCGAGCAACGGCCTCGTGATTTCCCCGCCGATCCGGTCCCCGCCTCCCCACTCTGCCCCCGCCTACCCCGGAGCCGTGCAGCCGCCTCTCCGAATCTCTCTCTTCTCCTGGCGCTCGCGTGCGAGAGGGAACTAGCGAGAACGAGGAAGCAGCTGGAGGTGACGCCGGGCAGATTACGCCTGTCAGGGCCGAGCCGAGCGGATCGCTGGGCGCTGTGCAGAGGAAAGGCGGGAGTGCCCGGCTCGCTGTCGCAGAGCCGAGGTGGGTAAGCTAGCGACCACCTGGACTTCCCAGCGCCCAACCGTGGCTTTTCAGCCAGGTCCTCTCCTCCCGCGGCTTCTCAACCAACCCCATCCCAGCGCCGGCCACCCAACCTCCCGAAATGAGTGCTTCCTGCCCCAGCAGCCGAAGGCGCTACTAGGAACGGTAACCTGTTACTTTTCCAGGGGCCGTAGTCGACCCGCTGCCCGAGTTGCTGTGCGACTGCGCGCGCGGGGCTAGAGTGCAAGGTGACTGTGGTTCTTCTCTGGCCAAGTCCGAGGGAGAACGTAAAGATATGGGCCTTTTTCCCCCTCTCACCTTGTCTCACCAAAGTCCCTAGTCCCCGGAGCAGTTAGCCTCTTTCTTTCCAGGGAATTAGCCAGACACAACAACGGGAACCAGACACCGAACCAGACATGCCCGCCCCGTGCGCCCTCCCCGCTCGCTGCCTTTCCTCCCTCTTGTCTCTCCAGAGCCGGATCTTCAAGGGGAGCCTCCGTGCCCCCGGCTGCTCAGTCCCTCCGGTGTGCAGGACCCCGGAAGTCCTCCCCGCACAGCTCTCGCTTCTCTTTGCAGCCTGTTTCTGCGCCGGACCAGTCGAGGACTCTGGACAGTAGAGGCCCCGGGACGACCGAGCTG
SEQ ID NO:2
GAGGAGGAGGAGGAGACAGACAGCAGGATGCCCCACCTCGACAGCCCCGGTTCATCACAACCGAGACGCTCCTTCCTCTCAAGGGTGATCAGGGCAGCTCTACCGTTGCAGCTGCTTCTGCTGCTGCTGCTGCTCCTGGCCTGCCTGTTGCCTGCTTCAGAGGATGACTACAGCTGCACCCAGGCCAACAACTTTGCCCGATCCTTCTACCCCATGCTGCGGTACACCAACGGGCCACCTCCCACCTAGGACTCAGCT
SEQ ID NO:3
GAGGAGGAGGAGGAGACAGACAGCAGGATGCCCCACCTCGACAGCCCCGGTAGCAGCCAACCGAGACGCTCCTTCCTCTCAAGGGTGATCAGGGCAGCTCTACCGTTGCAGCTGCTTCTGCTGCTGCTGCTGCTCCTGGCCTGCCTGTTGCCTGCCAGCGAGGATGACTACAGCTGCACCCAGGCCAACAACTTTGCCCGATCCTTCTACCCCATGCTGCGGTACACCAACGGGCCACCTCCCACCTAGCTTACTAGC
SEQ ID NO:4
GAGGAGGAGGAGGAGACAGACAGCAGGATGCCCCACCTCGACAGCCCCGGCAGTAGTCAACCGAGACGCTCCTTCCTCTCAAGGGTGATCAGGGCAGCTCTACCGTTGCAGCTGCTTCTGCTGCTGCTGCTGCTCCTGGCCTGCCTGTTGCCCGCTAGTGAGGATGACTACAGCTGCACCCAGGCCAACAACTTTGCCCGATCCTTCTACCCCATGCTGCGGTACACCAACGGGCCACCTCCCACCTAGTCAGGAATC
SEQ ID NO:5
GAGGAGGAGGAGGAGACAGACAGCAGGATGCCCCACCTCGACAGCCCCGGCTCGTCGCAACCGAGACGCTCCTTCCTCTCAAGGGTGATCAGGGCAGCTCTACCGTTGCAGCTGCTTCTGCTGCTGCTGCTGCTCCTGGCCTGCCTGTTGCCCGCCTCGGAGGATGACTACAGCTGCACCCAGGCCAACAACTTTGCCCGATCCTTCTACCCCATGCTGCGGTACACCAACGGGCCACCTCCCACCTAGAGACAGGTA
SEQ ID NO:6
GAGGAGGAGGAGGAGACAGACAGCAGGATGCCCCACCTCGACAGCCCCGGATCTTCTCAACCGAGACGCTCCTTCCTCTCAAGGGTGATCAGGGCAGCTCTACCGTTGCAGCTGCTTCTGCTGCTGCTGCTGCTCCTGGCCTGCCTGTTGCCAGCATCTGAGGATGACTACAGCTGCACCCAGGCCAACAACTTTGCCCGATCCTTCTACCCCATGCTGCGGTACACCAACGGGCCACCTCCCACCTAGGATTCTCAG
SEQ ID NO:7
GAGGAGGAGGAGGAGACAGACAGCAGGATGCCCCACCTCGACAGCCCCGGGTCCTCCCAACCGAGACGCTCCTTCCTCTCAAGGGTGATCAGGGCAGCTCTACCGTTGCAGCTGCTTCTGCTGCTGCTGCTGCTCCTGGCCTGCCTGTTGCCGGCGTCCGAGGATGACTACAGCTGCACCCAGGCCAACAACTTTGCCCGATCCTTCTACCCCATGCTGCGGTACACCAACGGGCCACCTCCCACCTAGCAGATACCA
SEQ ID NO:8:CCCCTGGTT
SEQ ID NO:9:GGTTCATCACAA
SEQ ID NO:10:TTGCCTGCTTCAGAG
SEQ ID NO:11:CTAACGGTT
SEQ ID NO:12:GTGGATTCT
SEQ ID NO:13:GGTAGCAGCCAA
SEQ ID NO:14:TTGCCTGCCAGCGAG
SEQ ID NO:15:CTTTCTCTC
SEQ ID NO:16:GGTGGTACT
SEQ ID NO:17:GGCAGTAGTCAA
SEQ ID NO:18:TTGCCCGCTAGTGAG
SEQ ID NO:19:TCCCATCAT
SEQ ID NO:20:GGTTCCTTC
SEQ ID NO:21:GGCTCGTCGCAA
SEQ ID NO:22:TTGCCCGCCTCGGAG
SEQ ID NO:23:AAGTTGGCG
SEQ ID NO:24:GGTGGTACT
SEQ ID NO:25:GGATCTTCTCAA
SEQ ID NO:26:TTGCCAGCATCTGAG
SEQ ID NO:27:TCCCATCAT
SEQ ID NO:28:GGAGGCAAG
SEQ ID NO:29:GGGTCCTCCCAA
SEQ ID NO:30:TTGCCGGCGTCCGAG
SEQ ID NO:31:CATCAATCG
SEQ ID NO:32:TCGCAATCT
SEQ ID NO:33:GGTTCGTCGCAG
SEQ ID NO:34:CTCCCTGCATCGGAA
SEQ ID NO:35:ACGGCTACA
SEQ ID NO:36:CGCTACCAG
SEQ ID NO:37:GGTTCTTCTCAG
SEQ ID NO:38:CTCCCTGCTTCTGAA
SEQ ID NO:39:GCGTCGTAA
SEQ ID NO:40:ACAACACCT
SEQ ID NO:41:GGCTCCTCCCAG
SEQ ID NO:42:CTCCCCGCATCCGAA
SEQ ID NO:43:ATGACGACC
SEQ ID NO:44:AAAGTCCCG
SEQ ID NO:45:GGCTCATCACAG
SEQ ID NO:46:CTCCCCGCGTCAGAA
SEQ ID NO:47:TCTCATCCG
SEQ ID NO:48:GACTTCTCT
SEQ ID NO:49:GGAAGCAGCCAG
SEQ ID NO:50:CTCCCAGCCAGCGAA
SEQ ID NO:51:TCCACGGTT
SEQ ID NO:52:ACTCCAACT
SEQ ID NO:53:GGGAGTAGTCAG
SEQ ID NO:54:CTCCCGGCCAGTGAA
SEQ ID NO:55:TTCCAGCTC
SEQ ID NO:56:CAGGCTGAA
SEQ ID NO:57:GGTAGTTCTCAG
SEQ ID NO:58:TTGCCTGCATCTGAA
SEQ ID NO:59:TTCGCATTG
SEQ ID NO:60:CGTCGATGC
SEQ ID NO:61:GGCAGCTCCCAA
SEQ ID NO:62:TTGCCAGCTAGCGAG
SEQ ID NO:63:GACTCCACT
SEQ ID NO:64:GTTCGGAAA
SEQ ID NO:65:GGGAGCTCCCAG
SEQ ID NO:66:TTGCCGGCAAGTGAG
SEQ ID NO:67:ACTCCGTCG
SEQ ID NO:68
AATGATACGGCGACCACCGAGATCTACACTAGATCGCACACTCTTTCCCTACACGACGCTCTTCCGATCT
SEQ ID NO:69
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGATCCTTCTACCCCATGCTGCGG
SEQ ID NO:70
CAAGCAGAAGACGGCATACGAGATxxxxxxxxGTGACTGGAGTTCAGACGTGTGCTCTTCCGATC
实施例
这些实施例仅出于说明的目的提供且不限制本申请所提供的权利要求的范畴。
实施例1
在基于活体内AAV的感染中多任务处理调控组件(RE)以评估RE的特异性
在基于活体内AAV的系统中分析多种调控组件以便评估个别调控组件的细胞特异性。此分析允许识别细胞特异性调控组件及各转基因在细胞特异性调控组件下的表达量值。
设计、生产及活体内测试经多任务处理的RE AAV
为了测试系统多任务处理三个调控组件的能力,将所关注的转基因可操作地连接至三个以下候选RE中的一者:(1)CamKII、(2)CBA及(3)由SEQ ID NO:1的核酸序列编码的调控组件(RE1)。选择这些RE的条件为CamKII启动子在兴奋性神经元中展现优选表达,CBA启动子展现广泛表达,且通过SEQ ID NO:1的核酸序列编码的调控组件(RE1)在抑制性/小白蛋白(paravalbumin;PV)神经元中展现较优表达。转基因由编码融合至KASH核系栓域的EGFP蛋白(EGFP-KASH)的报导基因组成。EGFP-KASH转基因中KASH的三个特定区域经序列修饰以允许在混合池中进行个体识别(表1)。这些序列修饰仅影响EGFP-KASH的DNA及RNA序列且并未改变氨基酸序列。因此,序列修饰充当驱动各别EGFP-KASH转基因构建体的给定RE的独特条形码。将带条形码的转基因克隆至AAV基因组主链中,且通过经瞬时转染的HEK293细胞评定质粒且评估EGFP荧光。条形码策略展示于下表1中,其中KASH序列的带条形码区域以粗体及加下划线指示。
表1
Figure BDA0003365310530000701
Figure BDA0003365310530000711
为建立初始多任务处理实验(如图1的简化示意图中所示),指定各RE的两个条形码且制得包含相同量的各带条形码的构建体的质粒混合物(例如,CamKII-EGFP-KASH条形码1、CamKII-EGFP-KASH条形码2、CBA-EGFP-KASH条形码3、CBA-EGFP-KASH条形码4、RE1-EGFP-KASH条形码5及RE1-EGFP-KASH条形码6)。此混合物(称为L1)用于产生腺相关病毒9(AAV9),所选择的活体内递送媒剂。野生型(C57Bl6/J)小鼠(n=6)用AAV载体与AAV9 L1(2E14基因组复本(genome copies;gc)/小鼠)一起,或PBS对照两侧输注至背部及腹部海马(4个注射位点)中。注射后四周,处死动物且将右侧及左侧海马以手术方式移除且在4℃下储存于RNAlaterTM中隔夜。
经由人工冲洗将个别小鼠海马在裂解缓冲液中均质化,以便释放细胞核。浓缩的粗制细胞核制剂通过基于PBS的洗涤及离心获得。细胞核用DAPI染色以用于在细胞分选仪上识别且确认细胞核完整性。使用BD FACSAriaTMII细胞分选仪纯化细胞核,且PBS注射的对照样品用于限定闸控策略。对于每一样品,分选大致100,000个细胞核,且通过离心浓缩样品以用于单细胞核RNA测序(RNAsequencing;RNAseq)。用10X基因组学铬单细胞3'v2试剂盒进行单细胞核RNAseq。所得cDNA库进行次世代测序。
序列处理
测序后,自Illumina BaseSpace下载原始BCL序列档案(Illumina二进制格式)且使用定制的处理脚本将其转换成原始FASTQ读段档案。对于各样品,使用10×Cell Ranger软件(v.2.1.0)处理原始FASTQ以及小鼠基因组及基因标注(GENCODE版本M19,https://uswest.ensembl.org/Mus_musculus/Info/Annotation)。10×Cell Ranger软件根据细胞解多任务处理读段且接着将读段映像至转录物。为将读段映射至转录物,使用前mRNA参考转录组,因为来自核样品的大部分转录物为前mRNA。对于源自AAV载体的读段,各带条形码的AAV转录序列经人工添加至参考转录组中。10×Cell Ranger针对各样本产生含有各经检测细胞核中各基因的独特分子标志(UMI)计数的档案。这些UMI计数档案接着用于降维及丛集以限定组织亚群。
测序分析
来自上文的UMI计数档案是使用自定义R及Python脚本处理以识别细胞亚群。首先过滤细胞基因计数档案以移除含有总计小于300个UMI的细胞。利用细胞(列)及基因(行)的UMI计数的经过滤2D矩阵缩小至具有相同细胞(列)数目但基因行使用ZinbWave(版本1.3.4,D.Risso等人,Nature 9:284(2018))置换为35个缩小的维度的较小尺寸。35个缩小的维度为基因的线性组合且表示在不同细胞类型中活跃的生物模块。通过将约15K个基因的维度缩小至35个生物模块,数据中的噪声显著降低,有效地减轻熟知的单细胞数据的『漏失』问题,从而使丛集更易控制。前5000个可变基因(如通过Seurat:https://satijalab.org/seurat/计算,其中参数最小细胞数=300,最小基因数=200,y截止值=0.005)用于使用ZinbWave(默认参数)计算35个维度。另外,在ZinbWave方法中,将各细胞的总转录输出(总UMI)合并为共变量。
为对此矩阵进行丛集,使用如在Louvain软件包(版本0.6.1,https://pypi.org/project/louvain/)中实施的Louvain丛集算法。Louvain算法需要图式作为输入,其中细胞作为由边连接的顶点。若两个细胞之间的相关性(使用35维表示)大于0.5,则通过在两个细胞之间包括一条边来建构图式。接着基于文献衍生的典型生物标记标注识别的丛集(或细胞亚群)(参见表2及图2)。对神经元群体中的EGFP-KASH表达进行比较性分析以评估给定RE对转基因表达的影响。
表2
Figure BDA0003365310530000741
Figure BDA0003365310530000751
结果
基于各样本的已知生物标记,将丛集分组成三个丛集组-兴奋性神经元(Excitatory neurons;Exc)、GABA能神经元(GABAergic neurons;GABA)及非神经元细胞(Non-Neuronal cell;NonN)。为易于解释,这些丛集组中的每一者称为细胞群。根据UMI计数,计算每百万份转录物(Transcripts-Per-Million;TPM)中各带条形码的AAV转基因的表达(图3)。
基因TPM计算如下:
Figure BDA0003365310530000752
为能够比较GABA内表达与兴奋性且能够更易于比较不同RE驱动AAV转基因,将所有AAV基因的TPM表达标准化为其在兴奋性神经元中的表达。由于CBA用作广泛表达的阳性对照,各AAV基因的TPM表达在细胞群体内也标准化为AAV CBA转基因在该群体内的平均TPM表达。最后,为易于解释,将各AAV转基因(标准化为CBA)的相对表达表示为CBA标准化的倍数变化。
如所预期,与兴奋性细胞相比,两种CamKII AAV转基因的相对表达在GABA及非神经元群体中低约30%(图4)。与兴奋性神经元相比,两种RE1驱动AAV转基因在GABA神经元中高约20%,且在非神经元细胞中低约25%。
另外,由于各AAV转基因的两种带条形码的构建体在各细胞群体内展示类似表达,因此将各AAV转基因的两种带条形码的构建体之间的表达值平均化以获得简化表达标绘图(图5)。
与图4类似,图5证实与兴奋性细胞相比,CamKII AAV转基因的相对表达在GABA及非神经元群体中低约30%,且证实与兴奋性神经元相比,RE1驱动的AAV转基因在GABA神经元中高约20%,且在非神经元细胞中低约25%。
使用已知生物标记(PV、VIP、Sst、Ndnf-Reln)评估GABA能神经元的四种主要亚群。结果显示106m1转基因的表达在GABA的PV、VIP及Sst亚群内相当高(图6)。另外,结果证实RE1在PV亚群中的平均倍数变化最高(比兴奋性细胞高约50%)。
使用上述方法获得的这些数据显示可活体内筛选候选调控组件以识别细胞特异性调控组件及各转基因在细胞特异性调控组件下的表达量值。此外,结果展示这些方法可有效地用于进行调控组件的多任务处理分析以便识别在特定细胞群体中达成生理上相关剂量的调控组件。本申请所描述的分析可用于使用多种递送方法在活体内系统中筛选多达104种候选调控组件。
实施例2
使用基于活体内AAV的感染识别的RE评估RE的特异性的用途
在验证使用本申请所描述的筛选分析识别的调控组件的细胞选择性之后,调控组件可用于将特定转基因靶向特定细胞群体。特定言之,各调控组件可以可操作地连接至转基因以选择性地靶向表达至至少一种、两种、三种、四种、五种或多于五种非PV细胞上的特定细胞群体。
实施例3
大规模活体内多任务处理调控组件(RE)以评估复杂混合物中RE的特异性
表3
调控组件 L3条形码 L3.2条形码
构建体1(CBA-EGFP-KASH) MBC7 MBC7
构建体2(EF1α-EGFP-KASH) MBC10 MBC10
构建体3(RE 1-EGFP-KASH) MBC11 MBC11
构建体4(RE2-EGFP-KASH) MBC8 MBC8
构建体5(RE3-EGFP-KASH) MBC9 MBC9
构建体6(RE4-EGFP-KASH) MBC12 MBC12
构建体7(RE5-EGFP-KASH) MBC13 MBC13
构建体8(RE6-EGFP-KASH) MBC14 MBC14
构建体9(RE7-EGFP-KASH) MBC15 MBC15
构建体10(RE8-EGFP-KASH) MBC16 MBC16
构建体11(RE9-EGFP-KASH) MBC17 MBC17
构建体12(RE 10-EGFP-KASH) MBC18 MBC18
构建体13(RE11-EGFP-KASH) MBC19 MBC19
构建体14(RE 12-EGFP-KASH) MBC20 N/A
构建体15(RE 13-EGFP-KASH) MBC21 MBC21
为了测试多任务处理分析是否能够评估细胞类型特异性及细胞的复杂混合物中个别RE的表达量值,在基于活体内AAV的系统中分析十五个调控组件。此分析允许在多种不同构建体的复杂混合物内识别细胞特异性调控组件以及各转基因在细胞特异性调控组件下的表达量值。
设计、生产及活体内测试经多任务处理的RE AAV
为了测试系统多任务处理调控组件的复杂混合物的能力,将所关注的转基因可操作地连接至十五个候选RE中的一者。两种RE为CBA及EF1α,其皆经选择为广泛表达的对照启动子(分别为构建体1及构建体2)。在构建体3中使用通过SEQ ID NO:1的核酸序列编码的调控组件(RE1),其在抑制性/小白蛋白(PV)神经元中展现较佳表达。参见表3。其余的十二个启动子经选择用于其在抑制性/PV神经元中的较佳表达。转基因由编码融合至KASH核系栓域的EGFP蛋白(EGFP-KASH)的报导基因组成。EGFP-KASH转基因中的KASH的编码序列的两个区域(KASH序列1及KASH序列2)经序列修饰以允许在混合池中进行个体识别(表4)。这些序列修饰仅影响EGFP-KASH的DNA及RNA序列且并未改变氨基酸序列。因此,序列修饰充当驱动各别EGFP-KASH转基因构建体的给定RE的独特条形码。在各构建体的转录起始位点的上游插入额外独特条形码序列以允许在混合池中对特定构建体进行个体识别(表4,上游序列)。最后,在各构建体的EGFP转基因的终止密码子之后插入独特条形码序列以允许在混合池中对特定构建体进行个体识别(表4,下游序列)。将带条形码的转基因选殖至AAV基因组主链中且用于制备供活体内研究的AAV9病毒。独特条形码序列展示于下表4中。
表4
Figure BDA0003365310530000781
Figure BDA0003365310530000791
与实施例1中所描述的初始实验类似,建立复杂混合物的多任务处理,除包含独特上游序列的单一MBC条形码、KASH内部的两个独特序列以外,且针对各RE指定独特下游序列,且制得包含相同量的各带条形码的构建体的质粒混合物(例如,MBC7-CBA-EGFP-KASH、MBC10-EF1α-EGFP-KASH、MBC11-RE1-EGFP1-KASH等)。此混合物(称为L3)用于产生腺相关病毒9(AAV9),所选择的活体内递送媒剂。使用相同独特条形码序列第二次重复实验,不同之处在于包含条形码的序列片段(例如,上游序列、KASH内部的两个序列及下游序列)经不同地配置于构建体内。制得包含相同量的这些带条形码的构建体中的每一者的质粒混合物。此混合物(称为L3.2)用于产生额外AAV9。L3.2库不包括构建体14。
六至八周龄野生型(C57Bl6/J)雄性小鼠用1.5μL的AAV载体池与AAV9 L3或AAV9L3.2一起单侧输注至背部及腹部皮层,且用1.5μL的AAV载体集与AAV9 L3或AAV9 L3.2一起单侧输注至背部及腹部海马(2个注射位点,其中每位点3μL;海马为1.5μL且皮层为1.5μL),其中基因组含量为1.5×1011至2.4×1011个病毒基因组/小鼠(vg/小鼠),速率为0.3μL/分钟,且注射后休息4分钟。
注射后四周,处死动物且将其感测皮层及海马以手术方式移除,在4℃下储存于RNAlaterTM中24小时,且接着在-80℃下冷冻直至组织备用于处理。
RNAlaterTM大脑皮层或海马样品在冰上解冻。为了释放细胞核,将大致20毫克的组织在裂解缓冲液中人工均质化。浓缩的粗制细胞核制剂通过基于PBS的洗涤及离心获得。细胞核用DAPI染色以用于在细胞分选仪上识别且确认细胞核完整性。使用BD FACS Melody细胞分选仪纯化细胞核。对于每一样品,分选大致100,000个细胞核。通过离心浓缩样品以用于单细胞核RNAseq。用10X基因组学铬单细胞3'v3试剂盒进行单细胞核RNAseq(如制造商说明书中所描述-图1)。所得cDNA库进行第二代测序。
为增加在单细胞核RNAseq中UMI降至低于检测阈值的AAV构建体的检测,在扩增之前对来自10X工作流的cDNA样品进行富集PCR步骤。此富集步骤产生自10×库检测的AAV构建体信号的3-10倍扩增。用于富集PCR步骤中的PCR引物包括来自标准Illumina Truseq测序引物(501)的正向引物及经设计以结合至AAV转基因中相对靠近polyA位点的区域的反向引物。此反向引物已向其中添加读段2手柄(handle),使得其可在随后的PCR反应中用作向产物中添加Illumina衔接子的手段(用于测序目的)。此步骤在本申请中称为拔出PCR。此拔出PCR的引物序列展示于表5中。
表5
Figure BDA0003365310530000811
10X基因组学铬单细胞3'v3试剂盒工作流提高了灵敏度且允许在单细胞水平上检测DNA/蛋白质信息。在v3工作流中修饰并入至用于cDNA生产的单细胞核液滴中的珠粒。这些珠粒经工程改造以捕获polyA序列以及并入捕获1或捕获2序列的DNA/RNA序列。此有助于检测所关注的特定蛋白质的抗体-寡聚共轭物以及并入这些捕获序列的DNA物种。为了使试剂盒捕获这些DNA/RNA物种且在给定构建体中使其与RE独特地连接,紧靠捕获序列编码独特条形码特征。此条形码对各RE为独特的。
在10X基因组学铬单细胞3'v3试剂盒工作流中,各样品含有四个用于解多任务处理的样品索引。在拔出PCR中,各样品仅含有一个样品索引。为经由用于10X基因组学铬单细胞3'v3试剂盒工作流中的10×Cell Ranger软件处理拔出PCR样品,将一个拔出PCR样品索引与三个「假」索引(与任何10×索引相差至少两个核苷酸)合并以通过10×Cell Ranger软件仿真四个样品索引要求。在解多任务处理成10×-兼容FASTQ档案之后,处理继续与10×序列处理完全一样。
序列处理
测序后,自Illumina BaseSpace下载原始BCL序列档案(Illumina二进制格式)且使用10×Cell Ranger软件(v.3.0.2)将其转换成原始FASTQ读段档案以解多任务处理样本,其中各样本具有四个10×索引。对于各样品,使用10×Cell Ranger软件(v.3.0.2)处理原始FASTQ以及小鼠基因组及基因标注(GENCODE版本M19,https://uswest.ensembl.org/Mus_musculus/Info/Annotation)。10×Cell Ranger软件根据细胞解多任务处理读段且接着将读段映像至转录物。FASTQ档案含有成对末端读段,其中读段1含有UMI条形码及10×细胞条形码且读段2含有基因转录物序列。读段2与小鼠基因组及各RE序列比对以确定基因/RE标识。10×Cell Ranger软件针对各样本产生含有各经检测细胞核中各基因的独特分子标志(UMI)计数的档案。这些UMI计数档案接着用于降维及丛集以便限定组织亚群。
测序分析
对于降维,前5000个可变基因(如根据Stuart,Butler等人,bioRxiv,2018;Butler等人,Nature Biotechnology,2018;Hafemeister及Satija,bioRxiv2019计算;其中参数最小细胞数=300,最小基因数=200,y截止值=0.005)用于使用ZinbWave(默认参数)计算35个维度。另外,在ZinbWave方法中,将各细胞的总转录输出(总UMI)合并为共变量。与L1库的处理类似,UMI计数档案使用自定义R及Python脚本处理以识别细胞亚群。首先过滤细胞基因计数档案以移除含有总计小于300个UMI的细胞。利用细胞(列)及基因(行)的UMI计数的经过滤2D矩阵缩小至具有相同细胞(列)数目但基因行使用ZinbWave(版本1.3.4,D.Risso等人,Nature 9:284(2018))置换为35个缩小的维度的较小尺寸。35个缩小的维度为基因的线性组合且表示在不同细胞类型中活跃的生物模块。通过将约15K个基因的维度缩小至35个生物模块,数据中的噪声显著降低,有效地减轻熟知的单细胞数据的『漏失』问题,从而使丛集更易控制。
为对此矩阵进行丛集,如上文所描述使用如在Louvain软件包(版本0.6.1,https://pypi.org/project/louvain/)中实施的Louvain丛集算法。Louvain算法需要图式作为输入,其中细胞作为由边连接的顶点。若两个细胞之间的相关性(使用35维表示)大于0.5,则通过在两个细胞之间包括一条边来建构图式。如表2及图2中所指示,接着基于文献衍生的GABA能神经元、兴奋性神经元及非神经元细胞群体的典型生物标记来标注识别的丛集(或细胞亚群)。对神经元群体中的EGFP-KASH表达进行比较性分析以评估给定RE对转基因表达的相对表达量值及细胞类型特异性。
结果
如实施例1中所描述,基于以下各样本的已知生物标记,将丛集分组成三个丛集组:兴奋性神经元(Exc)、GABA能神经元(GABA)及非神经元细胞(NonN)。根据UMI计数,使用上文所论述的基因TPM算法计算每百万份转录物(TPM)中各带条形码的AAV转基因的表达。
最初,自兴奋性及GABA能神经元中的各RE分析L3及L3.2库两者中的TPM以确定各RE在兴奋性及GABA能神经元中的基因表达量值及细胞类型特异性。表达的量值提供对RE的强度的反馈。也显示兴奋性或GABA能神经元的细胞类型特异性,其中特定启动子在兴奋性与GABA能神经元之间的表达差异指示各别细胞类型的特异性。举例而言,构建体6及构建体3在GABA能神经元中展示较高表达,且因此指示此RE具有GABA能神经元特异性。然而,构建体1在GABA能及兴奋性神经元两者中展示相对类似的表达,从而表明缺乏启动子的细胞类型特异性。
为易于解释,将各AAV转基因的相对表达以对数标度呈现。观察到CBA启动子(构建体1)及EF1α启动子(构建体2)的表达增加。在CBA及EF1α启动子已知为普遍存在的强启动子的条件下,预期这些启动子的此表达增加。自RE1(构建体3)也观察到表达增加。自其他候选启动子观察到较低表达量,可能表明这些启动子驱动基因表达小于CBA及EF1α。引起关注地,针对若干构建体观察到经测试调控组件在GABA能神经元中的细胞类型特异性表达。参见图7及8。这些数据显示多任务处理分析能够在单一分析中检测多个RE以及识别细胞类型特异性RE及其强度。
针对GABA能神经元内的特异性,随后在L3及L3.2库两者中评估各RE的细胞类型特异性表达(图9)。此处,由于EF1α用作广泛表达的对照,各AAV基因的TPM表达在细胞群体内标准化为AAV EF1α相关的转基因在该群体内的平均TPM表达。此外,相对于兴奋性神经元中的表达,GABA能神经元内表达的特异性计算如下:
Log10(特异性)=log10(GABA神经元表达)–log10(兴奋性神经元表达)
为易于解释,将各AAV转基因(标准化为EF1α)的相对表达表示为EF1α-标准化的倍数变化且以对数标度呈现。
由于各TPM表达在群体内标准化为EF1α相关的转基因的平均TPM表达,因此EF1α的表达为零。CBA启动子(构建体1)的表达平均类似于EF1α启动子的表达。此为预期的,因为CBA及EF1α为高度表达的广泛启动子。相比之下,相对于兴奋性神经元,构建体3展示在GABA能神经元中实质上较高的表达,以及来自CBA及EF1α的广泛表达。此亦为预期的,因为构建体3利用在抑制性/小白蛋白(PV)神经元中展现较佳表达的RE(RE1,由SEQ ID NO:1编码)。相对于兴奋性神经元,其余的构建体在GABA能神经元中展示较高表达,以及来自CBA及EF1α的广泛表达,尽管表达不如构建体3高。此指示这些构建体中的RE在GABA能神经元中驱动细胞类型特异性表达。这些数据显示多任务处理分析能够检测驱动GABA能神经元特异性表达的多个RE。
测试多任务处理分析在GABA能神经元(例如,PV、SST及VIP细胞)类别而非一般GABA能神经元内的特异性细胞类型内测量细胞类型特异性表达(AAV L3.2库)的能力。由于EF1α用作广泛表达的对照,因此各AAV基因的TPM表达在细胞群体内标准化为AAV EF1α相关的转基因在该群体内的平均TPM表达。特异性也如上述所定义。如所预期,在所有特异性GABA能细胞类型中EF1α及CBA相关的转基因的表达类似且接近零,因为其为广泛表达的细胞。多任务处理分析也能够识别在所有GABA能细胞类型中具有较高转基因表达的RE(例如,构建体11),从而表明这些RE对GABA能神经元类别内的某些细胞类型不具有特异性(图10)。重要的是,多任务处理分析能够识别且描绘某些RE的表达,这些RE对GABA能神经元类别内的某些细胞类型的表达具有特异性。
使用上述方法获得的数据进一步显示可在活体内调控组件的复杂混合物中筛选候选调控组件以便识别细胞特异性调控组件以及各转基因在细胞特异性调控组件下的表达量值。此外,这些结果进一步展示本申请所描述的方法可有效地用于进行调控组件的多任务处理分析以便识别在特定细胞群体中达成生理上相关剂量的调控组件。本申请所描述的分析可用于使用多种递送方法在活体内系统中筛选多达104种候选调控组件。

Claims (108)

1.一种识别于给定细胞类型中提供选择性表达的调控组件的方法,其包含:
a.向细胞提供载体的混合物,该载体各自包含可操作地连接于转基因的候选调控组件,其中各载体进一步包含条形码;
b.自表达该转基因的复数个单细胞中分离RNA;
c.通过测序该单细胞中的每一者的转录组(transcriptome)来识别该单细胞中的每一者;及
d.使转录组中的条形码与候选调控组件相关联,从而识别在该细胞类型中提供选择性表达的调控组件。
2.根据权利要求1的方法,其中该调控组件选择性地增加该细胞类型中该转基因的表达。
3.根据权利要求1的方法,其中该调控组件提供与相同细胞类型中通过另一候选调控及/或对照调控组件驱动的表达相比,大于或小于至少2倍、至少4倍、至少6倍、至少8倍或至少10倍的该转基因的选择性表达。
4.根据权利要求1的方法,其中该调控组件提供与相同细胞类型中通过另一候选调控组件及/或对照调控组件驱动的表达相比,大于或小于至少2%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的该转基因的选择性表达。
5.根据权利要求1的方法,其中该调控组件提供与相同细胞类型中通过另一候选调控组件及/或对照调控组件驱动的表达相比,大于或小于约1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、7.5倍、8倍、9倍或10倍的该转基因的选择性表达。
6.根据权利要求1的方法,其中该调控组件提供与不同细胞类型中相同调控组件的该转基因的表达相比,大于或小于至少2倍、至少4倍、至少6倍、至少8倍或至少10倍的该转基因的选择性表达。
7.根据权利要求1的方法,其中该调控组件提供与不同细胞类型中相同调控组件的该转基因的表达相比,大于或小于至少2%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的该转基因的选择性表达。
8.根据权利要求1的方法,其中该调控组件提供与不同细胞类型中相同调控组件的该转基因的表达相比,大于或小于约1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、7.5倍、8倍、9倍或10倍的该转基因的选择性表达。
9.根据权利要求1的方法,其中该调控组件在一种细胞类型中提供相对于至少一种其他细胞类型的该转基因的选择性表达。
10.根据权利要求1的方法,其中与非PV神经元相比,该调控组件在小白蛋白(parvalbumin,PV)神经元中提供该转基因的选择性表达。
11.根据权利要求10的方法,其中该非PV神经元为兴奋性神经元、多巴胺(dopaminergic)神经元、星形胶质细胞、小神经胶质细胞或运动神经元中的一或多者。
12.一种识别于细胞类型中提供转基因的选择性表达的调控组件的方法,其包含:
a.向细胞提供载体的混合物,该载体各自包含可操作地连接于转基因的候选调控组件,其中各载体进一步包含条形码;
b.自表达该转基因的复数个单细胞中分离RNA;
c.通过测序该单细胞中的每一者的转录组来识别该单细胞中的每一者;
d.使转录组中的条形码与该候选调控组件相关联;及
e.将通过各候选调控组件提供的该转基因的表达量与该转基因的参考表达量进行比较;
从而识别在该细胞类型中提供该转基因的选择性表达的候选调控组件。
13.根据权利要求12的方法,其中该调控组件选择性地增加或减少该细胞类型中该转基因的表达。
14.根据权利要求12的方法,其中该转基因的参考表达量通过对照调控组件提供。
15.根据权利要求12的方法,其中该调控组件提供与相同细胞类型中通过另一候选调控组件及/或对照调控组件驱动的表达相比,大于或小于至少2倍、至少4倍、至少6倍、至少8倍或至少10倍的该转基因的选择性表达。
16.根据权利要求12的方法,其中该调控组件提供与相同细胞类型中通过另一候选调控组件及/或对照调控组件驱动的表达相比,大于或小于至少2%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的该转基因的选择性表达。
17.根据权利要求12的方法,其中该调控组件提供与相同细胞类型中通过另一候选调控组件及/或对照调控组件驱动的表达相比,大于或小于约1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、7.5倍、8倍、9倍或10倍的该转基因的选择性表达。
18.根据权利要求12的方法,其中该转基因的参考表达量通过泛细胞(pan-cellular)调控组件提供。
19.根据权利要求12的方法,其中该泛细胞调控组件选自由以下者组成的组:巨细胞病毒主要即刻早期启动子(CMV)、鸡β-肌动蛋白启动子(CBA)、CMV早期增强子/CBA启动子(CAG)、延伸因子-1α启动子(EF1α)、猴病毒40启动子(SV40)、磷酸甘油酸激酶启动子(PGK)及聚泛素C基因启动子(UBC)。
20.根据权利要求12的方法,其中该调控组件提供与相同细胞类型中通过泛细胞调控组件驱动的表达相比,大于或小于至少2倍、至少4倍、至少6倍、至少8倍或至少10倍的该转基因的选择性表达。
21.根据权利要求12的方法,其中该调控组件提供与相同细胞类型中通过泛细胞调控组件驱动的表达相比,大于或小于至少2%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的该转基因的选择性表达。
22.根据权利要求12的方法,其中该调控组件提供与相同细胞类型中通过泛细胞调控组件驱动的表达相比,大于或小于约1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、7.5倍、8倍、9倍或10倍的该转基因的选择性表达。
23.根据权利要求12的方法,其中该调控组件在一种细胞类型中提供相对于至少一种其他细胞类型的该转基因的选择性表达。
24.根据权利要求12的方法,其中与非PV神经元相比,该调控组件在PV神经元中导致该转基因的选择性表达。
25.根据权利要求24的方法,其中该非PV神经元为兴奋性神经元、多巴胺神经元、星形胶质细胞、小神经胶质细胞或运动神经元中的一或多者。
26.一种识别选择性表达可操作地连接于调控组件的转基因的细胞类型的方法,其包含:
a.向细胞提供载体的混合物,该载体各自包含可操作地连接于转基因的候选调控组件,其中各载体进一步包含条形码;
b.自表达该转基因的复数个单细胞中分离RNA;
c.通过测序该单细胞中的每一者的转录组来识别该单细胞中的每一者;
d.使转录组中的条形码与该候选调控组件相关联;及
e.将通过候选调控组件在一种细胞类型中提供的该转基因的表达量与相同候选调控组件在不同细胞类型中的表达量进行比较
从而识别选择性表达该可操作地连接调控组件的转基因的细胞类型。
27.根据权利要求26的方法,其中与至少一种其他细胞类型相比,该调控组件选择性地增加或减少一种细胞类型中该转基因的表达。
28.根据权利要求26的方法,其中该调控组件在一种细胞类型中提供与至少一种其他细胞类型中通过该调控组件驱动的表达相比,大于或小于至少2倍、至少4倍、至少6倍、至少8倍或至少10倍的该转基因的选择性表达。
29.根据权利要求26的方法,其中该调控组件在一种细胞类型中提供与至少一种其他细胞类型中通过该调控组件驱动的表达相比,大于或小于至少2%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的该转基因的选择性表达。
30.根据权利要求26的方法,其中该调控组件在一种细胞类型中提供与至少一种其他细胞类型中通过该调控组件驱动的表达相比,大于或小于约1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、7.5倍、8倍、9倍或10倍的该转基因的选择性表达。
31.根据权利要求26的方法,其中与非PV神经元相比,该调控组件在PV神经元中导致该转基因的选择性表达。
32.根据权利要求31的方法,其中该非PV神经元为兴奋性神经元、多巴胺神经元、星形胶质细胞、小神经胶质细胞或运动神经元中的一或多者。
33.根据权利要求1至32中任一项的方法,其中该RNA选自由以下者组成的组:mRNA、长非编码RNA、反义转录物及pri-miRNA。
34.根据权利要求1至33中任一项的方法,其中该载体选自由以下者组成的组:质粒、病毒载体或黏粒。
35.根据权利要求34的方法,其中该病毒载体为腺相关病毒(AAV)载体。
36.根据权利要求35的方法,其中该AAV载体为AAV1、AAV8、AAV9、scAAV1、scAAV8或scAAV9。
37.根据权利要求36的方法,其中该AAV载体为AAV9。
38.根据权利要求35至37中任一项的方法,其中该载体包含5'AAV反向末端重复(ITR)序列及3'AAV ITR序列。
39.根据权利要求1至38中任一项的方法,其中该载体的混合物包含至少104个候选调控组件。
40.根据权利要求1至39中任一项的方法,其中各候选调控组件与至少一个独特条形码相关。
41.根据权利要求1至40中任一项的方法,其中该转基因包含报导基因序列。
42.根据权利要求41的方法,其中该报导基因序列可操作地连接于编码核结合域的序列。
43.根据权利要求1至43中任一项的方法,其中该转基因包含该条形码。
44.根据权利要求42至44中任一项的方法,其中该报导基因序列包含该条形码。
45.根据权利要求43或44的方法,其中该条形码包含替代密码子。
46.根据权利要求43至45中任一项的方法,其中该编码核结合域的序列包含该条形码。
47.根据权利要求43至46中任一项的方法,其中该编码核结合域的序列编码Klarsicht/ANC-1/Syne同源(KASH)域或Sad1p/UNC-84(SUN)域蛋白,或其生物活性片段。
48.根据权利要求1至47中任一项的方法,其中该细胞类型属于选自由以下者组成的组的组织:结缔组织、肌肉组织、神经组织及上皮组织。
49.一种核酸分子,其包含可操作地连接于转基因的调控组件,其中该核酸分子包含条形码。
50.根据权利要求49的核酸分子,其中该条形码包含替代密码子。
51.根据权利要求49或50的核酸分子,其中该转基因包含报导基因序列。
52.根据权利要求51的核酸分子,其中该报导基因序列可操作地连接于编码核结合域序列的核苷酸序列。
53.根据权利要求52的核酸分子,其中该核结合域序列编码KASH域或SUN域蛋白或其生物活性片段。
54.根据权利要求50至53中任一项的核酸分子,其中该调控组件为非天然存在的。
55.根据权利要求49至54中任一项的核酸分子,其中该报导基因序列编码荧光蛋白。
56.根据权利要求55的核酸分子,其中该荧光蛋白为绿色荧光蛋白(GFP);增强型绿色荧光蛋白(EGFP);黄色荧光蛋白(YFP),诸如mBanana;红色荧光蛋白(RFP),诸如mCherry、DsRed、dTomato、tdTomato、mHoneydew或mStrawberry、TagRFP;远红色荧光帕米膦酸盐(far-red fluorescent pamidronate,FRFP),诸如mGrape1或mGrape2;青色荧光蛋白质(CFP);蓝色荧光蛋白(BFP);增强型青色荧光蛋白质(ECFP);群青荧光蛋白(UMFP);橙色荧光蛋白(OFP),诸如mOrange或mTangerine;红色(橙色)荧光蛋白(mROFP);TagCFP或四半胱氨酸荧光基序。
57.根据权利要求49至56中任一项的核酸分子,其中该转基因包含该条形码。
58.根据权利要求49至56中任一项的核酸分子,其中编码该核结合域的序列包含该条形码。
59.根据权利要求49至56中任一项的核酸分子,其中该报导基因序列包含该条形码。
60.根据权利要求49至59中任一项的核酸分子,其中该条形码置放于该转基因的编码区内。
61.根据权利要求49至59中任一项的核酸分子,其中该核酸分子包含非编码区,且其中该条形码置放于该转基因的非编码区内。
62.根据权利要求61的核酸分子,其中该核酸分子包含非翻译区(UTR)且该条形码置放于该UTR内。
63.根据权利要求61的核酸分子,其中该核酸分子包含polyA序列,且其中该条形码置放于该polyA序列的上游至少50个碱基处。
64.根据权利要求49至59中任一项的核酸分子,其中该条形码置放于转录起始位点的上游。
65.一种核酸分子,其中该核酸分子为自DNA分子转录的RNA分子,其中该RNA分子包含转基因及条形码序列,其中该DNA分子包含调控组件,且其中该RNA分子中的条形码序列与该DNA分子中的调控组件相关。
66.根据权利要求65的核酸分子,其中该转基因包含报导基因序列。
67.根据权利要求66的核酸分子,其中该报导基因序列可操作地连接于编码核结合域的核苷酸序列。
68.根据权利要求67的核酸分子,其中该核结合域为KASH域或SUN域蛋白或其生物活性片段。
69.根据权利要求65至68中任一项的核酸分子,其中该调控组件为非天然存在的。
70.根据权利要求66至69中任一项的核酸分子,其中该报导基因序列编码荧光蛋白。
71.根据权利要求70的核酸分子,其中该荧光蛋白为绿色荧光蛋白(GFP);增强型绿色荧光蛋白(EGFP);黄色荧光蛋白(YFP),诸如mBanana;红色荧光蛋白(RFP),诸如mCherry、DsRed、dTomato、tdTomato、mHoneydew或mStrawberry、TagRFP;远红色荧光帕米膦酸盐(FRFP),诸如mGrape1或mGrape2;青色荧光蛋白质(CFP);蓝色荧光蛋白(BFP);增强型青色荧光蛋白质(ECFP);群青荧光蛋白(UMFP);橙色荧光蛋白(OFP),诸如mOrange或mTangerine;红色(橙色)荧光蛋白(mROFP);TagCFP或四半胱氨酸荧光基序。
72.根据权利要求65至71中任一项的核酸分子,其中该转基因包含该条形码。
73.根据权利要求67至71中任一项的核酸分子,其中该编码核结合域的序列包含该条形码。
74.根据权利要求66至71中任一项的核酸分子,其中该报导基因序列包含该条形码。
75.根据权利要求66至74中任一项的核酸分子,其中该条形码包含替代密码子。
76.根据权利要求65至71中任一项的核酸分子,其中该核酸分子包含非翻译区(UTR)且该条形码置放于该UTR内。
77.根据权利要求65至71中任一项的核酸分子,其中该核酸分子包含polyA序列,且其中该条形码置放于该polyA序列的上游至少50个碱基处。
78.根据权利要求65至71中任一项的核酸分子,其中该条形码置放于转录起始位点的上游。
79.根据权利要求65至77中任一项的核酸分子,其中该核酸分子连接至微粒。
80.根据权利要求79的核酸分子,其中该微粒为珠粒。
81.根据权利要求79或80的核酸分子,其中该微粒连接至微粒聚核苷酸分子。
82.根据权利要求81的核酸分子,其中该核酸分子经由该微粒聚核苷酸分子连接至该微粒。
83.根据权利要求81或82的核酸分子,其中该微粒聚核苷酸分子包含引物序列。
84.根据权利要求81至83中任一项的核酸分子,其中该微粒聚核苷酸分子包含细胞条形码序列。
85.根据权利要求81至84中任一项的核酸分子,其中该微粒聚核苷酸分子包含独特分子标志(UMI)核苷酸序列。
86.根据权利要求81至85中任一项的核酸分子,其中该微粒聚核苷酸分子包含寡聚-dT序列。
87.根据权利要求81至86中任一项的核酸分子,其中该微粒聚核苷酸分子包含:a)引物序列,b)细胞条形码序列,c)独特分子标志(UMI)核苷酸序列,及d)寡聚-dT序列;其中该核酸包含polyA核苷酸序列,且其中该微粒按以下顺序连接至a)-d):微粒--a)--b)--c)--d);且其中该polyA核苷酸序列与该寡聚-dT序列杂合。
88.根据权利要求87的核酸分子,其中该微粒为珠粒。
89.一种载体,其包含根据权利要求49至65中任一项的核酸。
90.根据权利要求89的载体,其中该载体为病毒载体。
91.根据权利要求89的载体,其中该载体为腺相关病毒载体。
92.根据权利要求89的载体,其中该腺相关病毒载体为AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、rh10及其杂合体、禽类AAV、牛类AAV、犬类AAV、马类AAV、灵长类AAV、非灵长类AAV及绵羊类AAV中的任一者。
93.根据权利要求89的载体,其中该腺相关病毒载体为AAV9载体。
94.一种细胞,其包含根据权利要求49至87中任一项的核酸。
95.一种细胞,其包含根据权利要求88至92中任一项的载体。
96.一种微粒,其连接至根据权利要求65至88中任一项的核酸中的一或多者。
97.根据权利要求96的微粒,其中该微粒为珠粒。
98.根据权利要求96或97的微粒,其中该微粒连接至微粒聚核苷酸分子。
99.根据权利要求98的微粒,其中该微粒聚核苷酸分子包含引物序列。
100.根据权利要求98或99的微粒,其中该微粒聚核苷酸分子包含独特分子标志(UMI)。
101.根据权利要求98至100中任一项的微粒,其中该微粒聚核苷酸分子包含寡聚-dT序列。
102.根据权利要求98至101的微粒,其中该核酸包含polyA核苷酸序列,且其中该polyA核苷酸序列与该寡聚-dT序列杂合。
103.根据权利要求98至102中任一项的微粒,其中该微粒聚核苷酸分子包含:a)引物序列,b)细胞条形码序列,c)独特分子标志(UMI)序列,及d)寡聚-dT序列;其中该核酸包含polyA核苷酸序列,且其中该微粒按以下顺序连接至a)-d):微粒--a)--b)--c)--d);且其中该polyA核苷酸序列与该寡聚-dT序列杂合。
104.根据权利要求103的微粒,其中该微粒为珠粒。
105.一种液滴,其包含根据权利要求49至88中任一项的核酸分子。
106.一种液滴,其包含根据权利要求94或95的细胞。
107.一种液滴,其包含根据权利要求96至104中任一项的微粒。
108.一种液滴,其包含根据权利要求94或95的细胞及根据权利要求96至104中任一项的微粒。
CN202080037824.XA 2019-03-22 2020-03-20 多任务处理调控组件以识别细胞类型特异性调控组件 Pending CN113874515A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962822528P 2019-03-22 2019-03-22
US62/822,528 2019-03-22
PCT/US2020/023881 WO2020198017A1 (en) 2019-03-22 2020-03-20 Multiplexing regulatory elements to identify cell-type specific regulatory elements

Publications (1)

Publication Number Publication Date
CN113874515A true CN113874515A (zh) 2021-12-31

Family

ID=72611757

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080037824.XA Pending CN113874515A (zh) 2019-03-22 2020-03-20 多任务处理调控组件以识别细胞类型特异性调控组件

Country Status (17)

Country Link
US (1) US20220170910A1 (zh)
EP (1) EP3942055A4 (zh)
JP (1) JP2022525477A (zh)
KR (1) KR20210143855A (zh)
CN (1) CN113874515A (zh)
AU (1) AU2020245425A1 (zh)
BR (1) BR112021018819A2 (zh)
CA (1) CA3134501A1 (zh)
CL (1) CL2021002433A1 (zh)
CO (1) CO2021012576A2 (zh)
EA (1) EA202192580A1 (zh)
IL (1) IL286455A (zh)
MA (1) MA55386A (zh)
MX (1) MX2021011511A (zh)
SG (1) SG11202110298RA (zh)
TW (1) TW202102680A (zh)
WO (1) WO2020198017A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114085873A (zh) * 2021-11-16 2022-02-25 珠海中科先进技术研究院有限公司 一种癌细胞状态辨识基因电路组及其制备方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024005574A1 (ko) * 2022-06-29 2024-01-04 서울대학교산학협력단 Mrna 번역 증가용 조절 엘리먼트를 스크리닝하는 방법, 상기 방법에 따른 신규 조절 엘리먼트, 및 이의 용도

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140206546A1 (en) * 2013-01-14 2014-07-24 Cellecta, Inc. Methods and compositions for single cell expression profiling
WO2016134337A1 (en) * 2015-02-19 2016-08-25 University Of Florida Research Foundation, Inc. Site-specific integrating recombinant aav vectors for gene therapy and improved production methods
CN107849546A (zh) * 2015-05-15 2018-03-27 先锋国际良种公司 对cas内切核酸酶系统、pam序列和指导rna元件的快速表征
CN109153980A (zh) * 2015-10-22 2019-01-04 布罗德研究所有限公司 Vi-b型crispr酶和系统
US20190024120A1 (en) * 2017-04-03 2019-01-24 Encoded Therapeutics, Inc. Tissue selective transgene expression
US20190032078A1 (en) * 2014-12-16 2019-01-31 Board Of Regents Of The University Of Nebraska Gene therapy for juvenile batten disease

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140206546A1 (en) * 2013-01-14 2014-07-24 Cellecta, Inc. Methods and compositions for single cell expression profiling
US20190032078A1 (en) * 2014-12-16 2019-01-31 Board Of Regents Of The University Of Nebraska Gene therapy for juvenile batten disease
WO2016134337A1 (en) * 2015-02-19 2016-08-25 University Of Florida Research Foundation, Inc. Site-specific integrating recombinant aav vectors for gene therapy and improved production methods
CN107849546A (zh) * 2015-05-15 2018-03-27 先锋国际良种公司 对cas内切核酸酶系统、pam序列和指导rna元件的快速表征
CN109153980A (zh) * 2015-10-22 2019-01-04 布罗德研究所有限公司 Vi-b型crispr酶和系统
US20190024120A1 (en) * 2017-04-03 2019-01-24 Encoded Therapeutics, Inc. Tissue selective transgene expression

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
HARTL, D. E等: "Cis-regulatory landscapes of four cell types of the retina", NUCLEIC ACIDS RESEARCH, vol. 45, no. 20, 16 November 2017 (2017-11-16), pages 11608, XP055532252, DOI: 10.1093/nar/gkx923 *
SWIECH, L.等: ""In vivo interrogation of gene function in the mammalian brain using CRISPR-Cas9"", NATURE BIOTECHNOLOGY, vol. 33, no. 1, 19 October 2014 (2014-10-19), pages 2 *
TJHUNG, K. F等: ""Silent Encoding of Chemical Post-Translational Modifications in Phage-Displayed Libraries"", JOURNAL OF THE AMERICAN CHEMICAL SOCIETY, vol. 138, no. 1, 18 December 2015 (2015-12-18), pages 6 *
ZHENG, X. Y.等: ""Massively parallel digital transcriptional profiling of single cells"", NATURE COMMUNICATIONS, vol. 8, 16 January 2017 (2017-01-16), pages 1 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114085873A (zh) * 2021-11-16 2022-02-25 珠海中科先进技术研究院有限公司 一种癌细胞状态辨识基因电路组及其制备方法

Also Published As

Publication number Publication date
EP3942055A4 (en) 2022-12-28
TW202102680A (zh) 2021-01-16
IL286455A (en) 2021-12-01
CL2021002433A1 (es) 2022-09-20
US20220170910A1 (en) 2022-06-02
WO2020198017A1 (en) 2020-10-01
KR20210143855A (ko) 2021-11-29
EP3942055A1 (en) 2022-01-26
JP2022525477A (ja) 2022-05-16
MA55386A (fr) 2022-01-26
EA202192580A1 (ru) 2022-03-10
CA3134501A1 (en) 2020-10-01
MX2021011511A (es) 2022-01-31
BR112021018819A2 (pt) 2021-11-23
SG11202110298RA (en) 2021-10-28
AU2020245425A1 (en) 2021-10-07
CO2021012576A2 (es) 2021-10-20

Similar Documents

Publication Publication Date Title
CN101287834B (zh) 基因载体
CN111356763B (zh) 变体RNAi
KR20220066225A (ko) 선택적 유전자 조절을 위한 조성물 및 방법
JP2022522196A (ja) ラミノパシーを処置するための組成物および方法
WO2015113004A2 (en) Oligonucleotides and methods for treatment of cardiomyopathy using rna interference
Peviani et al. Lentiviral vectors carrying enhancer elements of Hb9 promoter drive selective transgene expression in mouse spinal cord motor neurons
US20220170910A1 (en) Multiplexing regulatory elements to identify cell-type specific regulatory elements
CN115515613A (zh) 密码子优化的gla基因及其用途
RU2566563C2 (ru) Векторная система на основе aslv
Zheng et al. Massively parallel in vivo Perturb-seq reveals cell-type-specific transcriptional networks in cortical development
Kuroda et al. A comparative analysis of constitutive and cell‐specific promoters in the adult mouse hippocampus using lentivirus vector‐mediated gene transfer
Chen et al. Vector Tropism
US20150197803A1 (en) Method for Detecting or Measuring the Impact of a Viral Vector Composition on Eukaryotic Cells and Biomarkers Used Thereof
RU2789647C2 (ru) ВАРИАНТ СРЕДСТВА ДЛЯ RNAi
US20230257736A1 (en) A Method for Assessing Transduction Efficiency and/or Specificity of Vectors at Single Cell Level
KR101242114B1 (ko) 초음파 영상 기반의 유전자 전달 기술 및 리포터 유전자를 이용한 생체 내 영상에 의한 형질전환 동물의 선별 방법
WO2006064847A1 (ja) ベクターに含まれる非ウイルス由来のエンハンサー
WO2024073310A2 (en) Elements for de-targeting gene expression in dorsal root ganglion and/or liver
CN116507732A (zh) 哺乳动物细胞及其工程化的方法
TW202408593A (zh) 用於在肝臟中去靶向基因表現之元件
WO2024191877A2 (en) Human central nervous system (cns) targeting aav variants
WO2021209941A1 (en) Use of an orphan motif to increase expression of a heterologous transgene
KR101257002B1 (ko) 초음파 영상 기반의 유전자 전달 기술을 이용한 형질전환 동물의 제조방법
CN118251229A (zh) 作为tau蛋白病的治疗模式的LEMD2、LEMD3或CHMP7的过表达
Stirnnagel et al. herapy by Prototype Foamy Virus Mediated Non-Viral RNA

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination