CN117597448A - 用于使用单细胞核测序在体内筛选治疗剂的组合物和方法 - Google Patents

用于使用单细胞核测序在体内筛选治疗剂的组合物和方法 Download PDF

Info

Publication number
CN117597448A
CN117597448A CN202280028074.9A CN202280028074A CN117597448A CN 117597448 A CN117597448 A CN 117597448A CN 202280028074 A CN202280028074 A CN 202280028074A CN 117597448 A CN117597448 A CN 117597448A
Authority
CN
China
Prior art keywords
cell
therapeutic moiety
aspects
nucleic acid
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280028074.9A
Other languages
English (en)
Inventor
M·B·詹森
D·福恩特斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Godian Biotechnology
Original Assignee
Godian Biotechnology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Godian Biotechnology filed Critical Godian Biotechnology
Publication of CN117597448A publication Critical patent/CN117597448A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1079Screening libraries by altering the phenotype or phenotypic trait of the host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1086Preparation or screening of expression libraries, e.g. reporter assays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • G01N33/5082Supracellular entities, e.g. tissue, organisms
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • G01N33/5082Supracellular entities, e.g. tissue, organisms
    • G01N33/5088Supracellular entities, e.g. tissue, organisms of vertebrates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/136Screening for pharmacological compounds

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Hematology (AREA)
  • Cell Biology (AREA)
  • Urology & Nephrology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Toxicology (AREA)
  • Food Science & Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本文提供了用于通过鉴定指示细胞状态的一个或多个报告基因来筛选多个独特可鉴定治疗部分的组合物以及其使用方法。所述方法包含施用表达盒的文库,所述表达盒包括多个核酸序列,每个核酸序列编码与治疗部分条形码可操作地连接的不同治疗部分;多个核酸序列,所述多个核酸序列编码一个或多个报告基因,当在细胞或分离的细胞核中表达时,所述一个或多个报告基因共同指示所述细胞的细胞状态或细胞状态的可能性;以及一个或多个序列,所述一个或多个序列编码非编码核保留RNA基序。

Description

用于使用单细胞核测序在体内筛选治疗剂的组合物和方法
相关申请的交叉引用
本申请根据35 U.S.C.§119(e)要求于2021年4月26日提交的美国序列号63/180,012的优先权权益,所述申请的全部内容以全文引用的方式并入本文中。
技术领域
本公开总体上涉及筛选治疗剂的方法,并且更具体地涉及使用单细胞和/或细胞核测序鉴定治疗剂的方法。
背景技术
尽管最近取得了进展,但在基因疗法和其它类型的临床干预中仍存在许多挑战,所述挑战包含将体外研究转化为体内疗法,在疾病病因未知或未被充分了解时设计疗法,筛选大量干预和疗法靶标,以及在体内筛选疗法以说明影响疗法设计、安全性和/或功效的细胞内和细胞外因素。由于导致疾病或病状的多种途径和因素,包含细胞和环境因素,和/或涉及知之甚少的机制,用于衰老相关疾病或病状的疗法可能是复杂的。
在用于筛选的最常见的单细胞和单细胞核测序方法中,仅捕获细胞或细胞核中总RNA的一小部分进行测序。因此,存在任何给定基因随机未被捕获并因此从输出数据中缺失的风险。对细胞核进行测序会加剧风险,因为细胞质中的大多数细胞RNA在制备分离的细胞核时被丢弃。捕获治疗部分条形码的随机失败经常导致含有治疗部分的测序的细胞从分析中被丢弃。
发明内容
需要更高效和有效的方法来筛选和鉴定应对该领域中的一种或多种挑战的新疗法或干预。
本公开至少部分基于与在单细胞核测序期间提高治疗部分条形码的捕获率相关的发现。具体地,本公开涉及将治疗部分条形码序列与调控RNA分子进出细胞核的流量的短基序组合。通过将条形码保留在细胞核中,减少捕获的随机失败,治疗部分条形码的有效浓度可以更高。
因此,在一个实施例中,提供了一种用于鉴定候选治疗部分的方法,所述方法包含向动物或类器官施用表达盒的文库,所述表达盒的文库可以包含多个核酸序列,每个所述核酸序列编码与治疗部分条形码可操作地连接的不同治疗部分;编码一个或多个报告基因的多个核酸序列,当在细胞或分离的细胞核中表达时,所述一个或多个报告基因共同指示所述细胞的细胞状态或细胞状态的可能性;以及编码非编码核保留RNA基序的一个或多个序列;以及鉴定引起所述动物或所述类器官的细胞的细胞状态或细胞状态的可能性变化的候选治疗部分,由此鉴定候选治疗部分。
在另一个实施例中,提供了一种用于鉴定候选治疗部分的方法,所述方法包含向动物或类器官施用表达盒的文库,所述表达盒的文库可以包含多个核酸序列,每个所述核酸序列编码与治疗部分条形码可操作地连接的不同治疗部分;编码一个或多个报告基因的多个核酸序列,当在细胞或分离的细胞核中表达时,所述一个或多个报告基因共同指示所述细胞的细胞状态或细胞状态的可能性;以及编码与一个或多个所述治疗部分条形码可操作地连接的非编码核保留RNA基序的一个或多个序列;以及鉴定引起所述动物或所述类器官的细胞的细胞状态或细胞状态的可能性变化的候选治疗部分,由此鉴定候选治疗部分。
在本文所提供的方法的一些方面,所述方法进一步包含分离包括所述一个或多个报告基因的一个或多个细胞的细胞核。在一些方面,本文所提供的方法进一步包含富集或分选具有细胞状态或细胞状态的可能性变化的细胞的细胞核的群体。在某些方面,本文所提供的方法进一步包含富集或分选具有细胞状态或细胞状态的可能性变化的细胞的细胞核的群体,其中富集或分选包含基于所述一个或多个报告基因的水平富集或分选细胞或分离的细胞核的群体。在一些方面,本文所提供的方法进一步包含富集或分选具有细胞状态或细胞状态的可能性变化的细胞的细胞核的群体,其中富集或分选包含基于所述一个或多个报告基因的水平富集或分选细胞或细胞核的群体,并且其中富集或分选包含进行FACS、亲和纯化方法、流式细胞术或微流体分选。
在本文所提供的方法的一些方面,鉴定引起所述动物或所述类器官的细胞的细胞状态或细胞状态的可能性变化的候选治疗部分包含基于所述细胞或所述细胞核中的所述治疗部分条形码的存在来鉴定所述候选治疗部分。在一些方面,鉴定包含基于所述细胞或所述细胞核中的所述治疗部分条形码的存在来鉴定所述候选治疗部分,并且其中所述鉴定包含进行单细胞分析、单细胞核分析、RNA测序、单细胞RNA测序、单细胞核RNA测序、基于液滴的单细胞RNA测序、基于液滴的单细胞核RNA测序、批量分析、对细胞核的群体进行测序或对细胞的群体进行测序以确定所述细胞的群体中存在的所述候选治疗部分的量。在一些方面,鉴定包含单细胞或单细胞核RNA测序。在一些方面,鉴定包含基于液滴的单细胞或单细胞核RNA测序。
在一些方面,编码非编码核保留RNA基序的一个或多个序列包含编码lncRNA或其片段的序列。在一些方面,编码非编码核保留RNA基序的一个或多个序列包含编码BMP2-OP1应答基因(BORG)或其片段的序列。在一些方面,编码非编码核保留RNA基序的一个或多个序列包含包括AGCCC(SEQ ID NO:1)的五聚体基序的一个或多个拷贝。在一些方面,编码非编码核保留RNA基序的一个或多个序列包含包括SEQ ID NO:1的五聚体基序的两个或更多个拷贝。在一些方面,编码非编码核保留RNA基序的一个或多个序列包含包括SEQ ID NO:1的五聚体基序的三个或更多个拷贝。在一些方面,编码非编码核保留RNA基序的一个或多个序列包含包括WNNNNSNNAGCCC(SEQ ID NO:2)、ANNNNCNNAGCCC(SEQ ID NO:3)、ANNNNGNNAGCCC(SEQ ID NO:4)、TNNNNCNNAGCCC(SEQ ID NO:5)、TNNNNGNNAGCCC(SEQ ID NO:6)或TacgtGAtAGCCC(SEQ ID NO:7)(其中W是A或T;S是C或G;并且N是A、T、C或G)的核酸序列的一个或多个拷贝。在一些方面,编码非编码核保留RNA基序的一个或多个序列包含包括SEQ IDNO:2、3、4、5、6或7的核酸序列的两个或更多个拷贝。在一些方面,编码非编码核保留RNA基序的一个或多个序列包含包括SEQ ID NO:2、3、4、5、6或7的核酸序列的三个或更多个拷贝。在一些方面,编码非编码核保留RNA基序的一个或多个序列包括JPX、PVT1或NR2F1-AS1序列或其片段。
在一些方面,编码治疗部分条形码的每个核酸序列与编码聚合酶III启动子的核酸序列可操作地连接。
在其它方面,捕获序列、一个或多个分子富集序列和/或独特基因组鉴定(UGI)在聚合酶III启动子的控制下与所述治疗部分条形码进一步可操作地连接。一方面,所述捕获序列具有包括SEQ ID NO:14-17中任一个的序列;所述一个或多个分子富集序列具有包括SEQ ID NO:18-97中任一个的序列;并且所述UGI具有包括SEQ ID NO:98的序列。
在各个方面,本文所提供的序列是表达盒的序列;同样,本文所公开的表达盒序列的转录物序列(例如,RNA转录物或具有所述转录物序列的合成的RNA)也被特别考虑。
在一些方面,编码非编码核保留RNA基序的一个或多个序列包括包含SEQ ID NO:7的一个或多个核酸序列。在一些方面,编码非编码核保留RNA基序的一个或多个序列包括包含SEQ ID NO:7的一个核酸序列。在一些方面,编码非编码核保留RNA基序的一个或多个序列包括包含SEQ ID NO:7的两个核酸序列。在一些方面,编码非编码核保留RNA基序的一个或多个序列包括包含SEQ ID NO:7的三个核酸序列。在一些方面,编码非编码核保留RNA基序的一个或多个序列包括包含SEQ ID NO:7的四个核酸序列。在一些方面,编码非编码核保留RNA基序的一个或多个序列包括包含SEQ ID NO:7的五个核酸序列。在一些方面,编码非编码核保留RNA基序的一个或多个序列包括包含SEQ ID NO:7的六个核酸序列。在一些方面,编码非编码核保留RNA基序的一个或多个序列包含SIRLOIN序列,所述SIRLOIN序列包括包含CGCCTCCCGGGTTCAAGCGATTCTCCTGCCTCAGCCTCCCGA(SEQ ID NO:9)或其片段的核酸序列。在一些方面,编码非编码核保留RNA基序的一个或多个序列包含包括RCCTCCC(SEQ IDNO:8)(其中R是A或G)的核酸序列的一个或多个拷贝。在一些方面,编码非编码核保留RNA基序的一个或多个序列包含与包括HNRNPK(SEQ ID NO:10)的氨基酸序列结合的序列。在一些方面,编码非编码核保留RNA基序的一个或多个序列包含编码enChr的序列。在一些方面,所述enChr包含U1 snRNP识别基序的一个或多个拷贝。包含在本文所提供的表达盒中的U1snRNP识别基序包含包括CAGGTGAGT(SEQ ID NO:11)、AGGTAAG(SEQ ID NO:12)或AGGTAA(SEQ ID NO:13)或其任何组合的核酸序列的一个或多个拷贝。在一些方面,编码非编码核保留RNA基序的一个或多个序列包含U1 snRNP识别基序。
在一些方面,本文所提供的方法中的所述细胞状态是健康细胞状态、非患病细胞状态或正常细胞状态。在一些情况下,所述细胞状态或所述细胞状态的可能性的变化与由所述候选治疗部分产生的治疗作用相关。在一些方面,所述细胞状态的可能性与所述细胞中蛋白质或寡核苷酸表达的水平相关。在一些方面,使用组织学或荧光染色方法测量蛋白质或寡核苷酸表达的水平。在一些方面,不同治疗部分选自有以下组成的组:DNA、RNA、shRNA、siRNA、miRNA、反义寡核苷酸、吗啉代、蛋白质降解标签、转基因的产物、基因编辑复合物、Cas融合蛋白、CRISPRi、CRISPRa、RNA编辑元件、RNA剪接的调控元件、RNA降解元件、表观遗传修饰元件以及其任何组合。在一些方面,不同治疗部分是转基因的产物。在一些方面,不同治疗部分是shRNA。在一些方面,所述表达盒的文库中的每个表达盒被包装在表达载体中。在一些方面,所述表达载体是病毒。在一些方面,所述病毒是腺相关病毒(AAV)、腺病毒或慢病毒。
另一方面,提供了通过前述任一项的方法鉴定的候选治疗部分。
另一方面,提供了一种包含多个细胞的生物实体,所述多个细胞中的每一个表达:与治疗部分条形码可操作地连接的不同治疗部分;以及一个或多个报告基因,当在细胞中表达时,所述一个或多个报告基因共同指示所述细胞的细胞状态或细胞状态的可能性。在一些方面,所述生物实体是动物或类器官。在一些方面,不同治疗部分选自有以下组成的组:DNA、RNA、shRNA、转基因的产物、基因编辑复合物、Cas融合蛋白、CRISPRi、CRISPRa、RNA编辑元件、siRNA、miRNA、反义寡核苷酸、吗啉代、蛋白质降解标签、RNA剪接的调控元件、RNA降解元件、表观遗传修饰元件以及其任何组合。在一些方面,所述生物实体是疾病模型。
本文进一步提供了用于在体内筛选治疗剂或临床干预的文库的组合物以及其使用方法,例如,可以在体内包含多个治疗部分的文库。在各个实施例中,此类体内筛选的方法是高通量的,包含基于单细胞的分析,如独特的条形码测序(例如,单细胞RNA测序、单细胞核RNA测序或基于液滴的单细胞或单细胞核RNA测序),其中每个治疗部分条形码与筛选的不同治疗部分相关。在一些方面,测序涉及使用一个或多个治疗部分条形码或序列的细胞的群体,例如,在从动物分离的细胞的群体或靶组织中筛选的治疗部分的丰度的测序。在一些方面,高通量体内筛选涉及一种或多种体外测定,例如检测与细胞状态相关的一个或多个报告基因、荧光染色、核酸杂交测定、蛋白质测定、基于抗体的测定、RNA测定等。在一些方面,高通量筛选或其使用方法进一步包含可以指示细胞状态或细胞状态变化(如从患病细胞到健康细胞或到改善的细胞状态)的一个或多个报告基因。在一些方面,此类报告基因允许分离被候选治疗部分改变或转化的细胞,然后可以从单个细胞或细胞的群体中鉴定所述候选治疗部分。从一种细胞状态到不同的细胞状态的此类改变提供了治疗指数,所述治疗指数允许筛选、鉴定、改进或制备/设计已知引起体内细胞状态的期望的改变或变化的新治疗部分或疗法。
本公开设想了一种文库,所述文库可以包含多个表达盒,每个所述表达盒包含:编码与治疗部分条形码可操作地连接的不同治疗部分(例如,DNA元件、RNA元件、治疗转基因或编码蛋白质的核酸序列)的核酸序列和共同指示细胞的细胞状态的可能性的一个或多个报告基因。在一些实施例中,所述细胞状态的可能性在统计学上显著大于随机分布。在一些方面,所述细胞状态的可能性是至少约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。在一些方面,所述细胞状态的可能性是相对于对照的,如没有任何治疗部分的表达盒或空载体。在一些实施例中,每个表达盒被包装在病毒中。在一些实施例中,每个表达盒是用于递送的非病毒载体或媒剂。在一些实施例中,非病毒载体是:线性载体、质粒、基于聚合物的载体或转座子。在一些方面,本文所公开的任何实施例的文库作为纳米颗粒、脂质纳米颗粒、RNA纳米颗粒或外泌体递送。在一些方面,任何实施例的文库被调配用于使用物理方法、针、弹道DNA、电穿孔、声孔效应、光致穿孔、磁转染或水穿孔递送,或者被调配用于与化学载剂、无机颗粒、金属纳米颗粒、磁性纳米颗粒、脂质、脂质纳米颗粒、肽、聚合物、聚乙烯亚胺(PEI)、壳聚糖、聚酯、树枝状聚合物或聚甲基丙烯酸酯一起递送。在一些实施例中,所述病毒是AAV、腺病毒或慢病毒。在一些实施例中,多个表达盒包括至少约10个、50个、100个、500个或1000个不同的表达盒。在一些实施例中,多个表达盒编码至少约10个、50个、100个、500个、1000个或10000个不同治疗部分。在一些实施例中,治疗部分是DNA或RNA序列、shRNA、siRNA、miRNA、反义寡核苷酸、吗啉代、蛋白质降解标签、治疗转基因的产物、基因编辑复合物、Cas融合蛋白、CRISPRi、CRISPRa、RNA编辑元件、RNA剪接的调控元件、RNA降解元件或表观遗传修饰元件。在一些实施例中,治疗部分是shRNA。在一些实施例中,治疗部分是siRNA。在一些实施例中,治疗部分是治疗转基因的产物。在一些实施例中,治疗部分是Cas融合蛋白。在一些实施例中,每个治疗部分条形码与其它治疗部分条形码相差至少约1个、2个、3个、4个、5个、6个、7个、8个、9个或10个碱基。在一些实施例中,本文所公开的治疗部分条形码是包括至少约2个、3个、4个、5个、6个、7个、8个、9个或10个碱基的核酸序列。在一些实施例中,所述治疗部分条形码位于本文所公开的治疗部分的开放阅读框中。在一些方面,治疗部分条形码的转录与所述治疗部分的转录连接。在一些实施例中,文库包括编码两个或更多个报告基因的核酸序列。在一些实施例中,编码每个报告基因的所述核酸序列与启动子可操作地连接。在一些实施例中,启动子进一步包括增强子。在一些实施例中,本文所公开的报告基因可以是选择标志物、可检测蛋白、细胞表面标志物、药物敏感元件、诱导型元件或荧光蛋白。在一些实施例中,来自所述荧光蛋白的荧光信号与细胞状态或从一种细胞状态到第二细胞状态的变化的可能性相关。在一些实施例中,细胞的群体中报告基因的量或计数大于随机分布指示细胞的群体中细胞状态的可能性。在一些实施例中,此类较大的随机的分布在统计学上是显著的。在一些实施例中,编码每个报告基因的所述核酸序列不超过4000bp、3500bp、3000bp、2500bp、2000bp、1500bp、1400bp、1300bp、1200bp、1100bp、1000bp、900bp、800bp、700bp、600bp、500bp、400bp、300bp、200bp或100bp。在一些实施例中,编码每个报告基因的所述核酸序列是700bp至1000bp或1000bp至2000bp。在一些实施例中,所述启动子不超过100bp、150bp、200bp、250bp、300bp、350bp、400bp、450bp或500bp。在一些实施例中,所述细胞状态是患病细胞状态、非患病细胞状态、健康细胞状态、正常细胞状态、异常细胞状态、衰老细胞状态、转移性状态、非转移性状态、凋亡细胞状态、非凋亡细胞状态、感染性细胞状态、非感染性细胞状态、癌细胞状态或非癌细胞状态、增生性状态、非增生性状态、多能状态、分化的细胞状态、增殖细胞状态、非增殖细胞状态、失调细胞状态、调控的细胞状态、免疫反应状态、非免疫反应状态、分裂细胞状态、静止细胞状态、癌细胞状态或非癌细胞状态或其任何组合。在一些实施例中,所述细胞状态是其中所述细胞具有疾病或病状(例如,年龄相关的疾病或病状)、以疾病或病状为特征或与疾病或病状相关的状态。在一些实施例中,本文所公开的一个或多个报告基因能够在不同的细胞状态之间进行分化。在一些实施例中,所述分化包含由所述细胞中的治疗部分产生的以下中的变化:细胞参数、细胞活性或功能、细胞生理学、细胞大小、细胞形态、细胞形状、细胞标志物、细胞形状或细胞密度、转录组学谱、蛋白质组学谱、代谢组学谱、表观遗传组学谱、蛋白质基因组学谱、免疫蛋白质组学谱、药物基因组学谱或核小体组学谱或其任何组合。在一些实施例中,所述细胞活性或功能包含转染、转录、复制、蛋白质表达、表观遗传修饰、细胞标志物表达、与外源性分子的相互作用或其任何组合。在一些实施例中,所述分化在患病细胞与健康细胞之间,或者在异常细胞与正常细胞之间。在一些实施例中,所述疾病或所述病状是年龄相关的疾病或病状、肝病或病状、代谢性疾病、心血管疾病、神经退行性疾病或病状、眼病或病状、退行性疾病或病状、炎性病状、纤维化病状、免疫病状、皮肤或毛发病状、癌症、一种类型的关节炎、非酒精性脂肪性肝炎、特发性肺纤维化、肌肉减少症、神经系统病状、阿尔茨海默氏病(Alzheimer's disease)或痴呆,或者其中所述疾病或所述病状与衰老、复制活性不足或不平衡、分泌表型改变、神经元信号传导改变、异常免疫活性、未分化的细胞状态或癌性相关。在一些实施例中,所述治疗部分和所述报告基因在同一表达盒上编码。在一些实施例中,所述治疗部分和所述报告基因在不同的表达盒上编码。在一些实施例中,所述报告基因的表达与在包括所述治疗部分的表达盒中响应于转录因子、重组酶或其它激活剂或与其连接的诱导型转录元件可操作地连接,或者其中所述报告基因的表达与所述治疗部分的表达连接。在一些实施例中,所述激活剂是Gal4、cre或FLP。
在一些方面,本公开设想了包含本文所描述的文库的生物实体(例如,动物或类器官)。在一些实施例中,所述文库包含至少约10个、50个、100个、500个或1000个不同的表达盒,每个所述表达盒编码不同治疗部分。在一些实施例中,所述生物实体是疾病模型。在一些实施例中,所述生物实体是动物,并且所述动物是哺乳动物、人源化哺乳动物或小鼠。在一些实施例中,所述生物实体是细胞或细胞的群体、组织或类器官。在一些实施例中,所述生物实体被表征为具有或是疾病或病状的模型。在一些实施例中,所述疾病或病状是年龄相关的疾病或病状、肝病或病状、代谢性疾病、心血管疾病、神经退行性疾病或病状、眼病或病状、退行性疾病或病状、炎性病状、纤维化病状、免疫病状、皮肤或毛发病状、癌症、一种类型的关节炎、非酒精性脂肪性肝炎、特发性肺纤维化、肌肉减少症、神经系统病状、阿尔茨海默氏病或痴呆。
在一些方面,本公开设想了一种用于鉴定候选治疗部分的方法,所述方法可以包含:向生物实体中施用本文所公开的任何实施例的文库,以及鉴定引起细胞状态或细胞状态的可能性变化的候选治疗部分。在一些实施例中,所述细胞状态是健康细胞状态、非患病细胞状态或正常细胞状态。在一些实施例中,所述细胞状态或所述细胞状态的可能性的变化与由所述治疗部分产生的治疗作用相关。在一些实施例中,所述方法进一步包括富集或分选具有所述细胞状态或所述细胞状态的可能性变化的细胞的群体或细胞的细胞核的群体。在一些实施例中,所述富集或分选包括进行流式细胞术(例如,荧光辅助细胞分选(FACS))、亲和纯化方法、使用细胞标志物的细胞分离或分离方法或微流体分选,以富集具有细胞状态变化或具有治疗作用的细胞或细胞的群体或细胞的细胞核的群体。在一些实施例中,所述富集或分选进一步包括检测一个或多个报告基因。在一些实施例中,所述鉴定包含单细胞分析、单细胞核分析、RNA测序、单细胞RNA测序、单细胞核RNA测序、基于液滴的单细胞或单细胞核RNA测序、批量分析或对细胞或核的群体进行测序,以确定细胞的群体中存在的治疗部分的量或存在。在一些实施例中,所述细胞状态的可能性与所述细胞中蛋白质或寡核苷酸表达的水平相关。在一些实施例中,使用组织学或染色方法(如荧光染色方法)测量蛋白质或寡核苷酸表达的水平。
在一些方面,本公开设想了一种报告基因构建体,所述报告基因构建体包括与编码一个或多个报告基因的核酸序列可操作地连接的启动子,其中所述报告基因的表达允许鉴定细胞的细胞状态的可能性的基于单细胞的方法。在一些实施例中,所述细胞状态的可能性与所述细胞中蛋白质或寡核苷酸表达的水平相关。在一些实施例中,使用组织学或染色方法(如荧光染色方法)测量蛋白质或寡核苷酸表达的水平。在一些实施例中,所述启动子是已知在所述细胞状态中下调或上调的基因的同源启动子。在一些实施例中,编码所述一个或多个报告基因的所述核酸序列与两个或更多个启动子可操作地偶联。在一些实施例中,所述报告基因进一步包括两个或更多个不同的报告基因。在一些实施例中,所述启动子进一步包括增强子。在一些实施例中,所述报告基因中的每一个是不同的可检测蛋白、不同的选择标志物、不同的荧光蛋白或不同的细胞表面标志物,或其任何组合。在一些实施例中,每个报告基因是可检测蛋白、选择标志物、荧光蛋白或细胞表面标志物。在一些实施例中,所述一个或多个报告基因的表达与和治疗部分相关的转录诱导剂或转录激活剂可操作地连接,使得所述治疗部分的表达诱导或激活所述报告基因的表达。在一些实施例中,检测所述报告基因允许不同细胞状态之间的分化。在一些实施例中,来自所述报告基因的荧光信号与所述细胞状态的可能性相关,从而允许不同细胞状态之间的分化。在一些实施例中,所述分化在患病细胞状态与健康细胞状态之间,或者在异常细胞状态与正常细胞状态之间。在一些实施例中,所述分化基于不同报告基因之间的荧光比率或基于在细胞的群体中表达的报告基因的量。在一些实施例中,不同细胞状态之间的分化包括由所述细胞中的所述治疗部分的表达产生的以下中的变化:细胞参数、细胞活性或功能、细胞生理学、细胞大小、细胞形态、细胞形状、细胞标志物、细胞形状或细胞密度、转录组学谱、蛋白质组学谱、代谢组学谱、表观遗传组学谱、蛋白质基因组学谱、免疫蛋白质组学谱、药物基因组学谱或核小体组学谱或其任何组合。在一些实施例中,通过检测或计数细胞的群体中的所述报告基因来测量分化。在一些实施例中,所述细胞参数包含细胞活性或功能、细胞生理学、细胞大小、细胞形态、细胞形状、细胞标志物、细胞密度或其任何组合。在一些实施例中,所述分化与治疗指数相关。在一些实施例中,所述不同报告基因或不同荧光蛋白之间的比率或在细胞的群体中表达的报告基因的量与治疗指数相关,所述治疗指数指示由在所述细胞中表达的治疗部分产生的治疗作用。在一些实施例中,治疗指数基于不同细胞状态之间的以下中的变化:细胞参数、细胞活性或功能、细胞生理学、细胞大小、细胞形态、细胞形状、细胞标志物或细胞密度、转录组学谱、蛋白质组学谱、代谢组学谱、表观遗传组学谱、蛋白质基因组学谱、免疫蛋白质组学谱、药物基因组学谱或核小体组学谱或其任何组合。在一些实施例中,所述细胞状态是疾病或病状。在一些实施例中,所述疾病或所述病状是年龄相关的疾病或病状、肝病或病状、代谢性疾病、心血管疾病、神经退行性疾病或病状、眼病或病状、退行性疾病或病状、炎性病状、纤维化病状、免疫病状、皮肤或毛发病状、癌症、一种类型的关节炎、非酒精性脂肪性肝病、非酒精性脂肪性肝炎、肝硬化、特发性肺纤维化、肌肉减少症、神经系统病状、阿尔茨海默氏病或痴呆。在一些实施例中,所述疾病或所述病状与衰老、复制活性不足或不平衡、分泌表型改变、神经元信号传导改变、异常免疫活性、未分化的细胞状态或癌性相关。在一些实施例中,所述细胞状态是患病细胞状态、非患病细胞状态、健康细胞状态、正常细胞状态、异常细胞状态、衰老细胞状态、转移性状态、非转移性状态、凋亡细胞状态、非凋亡细胞状态、感染性细胞状态、非感染性细胞状态、癌细胞状态或非癌细胞状态、增生性状态、非增生性状态、多能状态、分化的细胞状态、增殖细胞状态、非增殖细胞状态、失调细胞状态、调控的细胞状态、免疫反应状态、非免疫反应状态、分裂细胞状态、静止细胞状态、癌细胞状态或非癌细胞状态。在一些实施例中,所述细胞状态的可能性在统计学上显著大于随机分布,或者其中所述细胞状态的可能性是至少约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。在一些实施例中,所述细胞状态包含相对于患病状态至少约5%、10%、20%、30%、40%、50%、60%、70%、80%或90%的提高或改善,如通过相对于患病状态的细胞的细胞参数、细胞生理学、转录组学谱、蛋白质组学谱、代谢组学谱、表观遗传组学谱、蛋白质基因组学谱、免疫蛋白质组学谱、药物基因组学谱或核小体组学谱测量的,或如通过所述报告基因测量的。在一些实施例中,编码报告基因的所述核酸序列不超过约4000bp、3500bp、3000bp、2500bp、2000bp、1500bp、1400bp、1300bp、1200bp、1100bp、1000bp、900bp、800bp、700bp、600bp、500bp、400bp、300bp、200bp或100bp。在一些实施例中,所述启动子不超过约50bp、100bp、150bp、200bp、250bp、300bp、350bp、400bp、450bp或500bp。在一些实施例中,报告基因构建体进一步包含编码一个或多个治疗部分的核酸序列。在一些实施例中,所述治疗部分中的每一个与转录因子连接,所述转录因子与诱导型转录元件相互作用,所述诱导型转录元件与所述报告基因相关。在一些实施例中,所述激活剂是Gal4、cre或FLP。
在一些方面,生物实体包含本文所描述的报告基因构建体。在一些实施例中,所述生物实体是疾病模型。在一些实施例中,所述生物实体是动物,并且所述动物是哺乳动物、人源化哺乳动物或小鼠。在一些实施例中,所述生物实体是细胞或细胞的群体、组织或类器官。在一些实施例中,所述生物实体被表征为具有或是疾病或病状的模型。在一些实施例中,所述疾病或病状是年龄相关的疾病或病状、肝病或病状、代谢性疾病、心血管疾病、神经退行性疾病或病状、眼病或病状、退行性疾病或病状、炎性病状、纤维化病状、免疫病状、皮肤或毛发病状、癌症、一种类型的关节炎、非酒精性脂肪性肝病、非酒精性脂肪性肝炎、肝硬化、特发性肺纤维化、肌肉减少症、神经系统病状、阿尔茨海默氏病或痴呆。在一些实施例中,所述疾病或所述病状与衰老、复制活性不足或不平衡、分泌表型改变、神经元信号传导改变、异常免疫活性、未分化的细胞状态或癌性相关。
在一些方面,一种鉴定候选治疗部分的方法包含将本文所公开的报告基因构建体和治疗部分的文库施用于生物实体中,并且鉴定引起细胞状态变化的候选治疗部分。在一些实施例中,所述细胞状态是患病细胞状态、非患病细胞状态、健康细胞状态、正常细胞状态、异常细胞状态、衰老细胞状态、转移性状态、非转移性状态、凋亡细胞状态、非凋亡细胞状态、感染性细胞状态、非感染性细胞状态、癌细胞状态或非癌细胞状态、增生性状态、非增生性状态、多能状态、分化的细胞状态、增殖细胞状态、非增殖细胞状态、失调细胞状态、调控的细胞状态、免疫反应状态、非免疫反应状态、分裂细胞状态、静止细胞状态、癌细胞状态或非癌细胞状态。在一些实施例中,所述细胞状态的变化与治疗作用相关。在一些实施例中,所述治疗作用包含由细胞中表达的治疗部分产生的以下中的变化:细胞参数、细胞活性或功能、细胞生理学、细胞大小、细胞形态、细胞形状、细胞标志物或细胞密度、转录组学谱、蛋白质组学谱、代谢组学谱、表观遗传组学谱、蛋白质基因组学谱、免疫蛋白质组学谱、药物基因组学谱或核小体组学谱或其任何组合。在一些实施例中,所述鉴定包含单细胞分析、单细胞核分析、批量分析、测序、RNA测序、单细胞RNA测序、单细胞核RNA测序、基于液滴的单细胞或单细胞核RNA测序、对细胞的群体或细胞核的群体中一定量的治疗部分或治疗部分条形码的测序、组织学测定、染色测定或荧光染色测定。
在一些方面,本公开设想了一种试剂盒,所述试剂盒包括多个治疗表达盒,每个所述治疗表达盒包含编码与治疗部分条形码可操作地连接的不同治疗部分的核酸和转录激活剂或诱导剂分子,以及多个报告基因表达盒,每个所述报告基因表达盒包含与编码报告基因的核酸序列连接的诱导型转录元件。在一些实施例中,每个治疗表达盒中的所述转录激活剂或诱导剂分子与每个报告基因表达盒中的诱导型转录元件相互作用、对其进行激活或诱导,使得所述报告基因的表达与所述治疗部分的表达可操作地连接。在一些实施例中,所述报告基因包含一个或多个选择标志物。在一些实施例中,所述报告基因包含一种或多种可检测蛋白、荧光蛋白、细胞表面标志物、药物敏感元件或诱导型转录元件。在一些实施例中,所述报告基因的表达与启动子可操作地连接。在一些实施例中,所述启动子进一步包含增强子。在一些实施例中,所述多个治疗表达盒包含至少约10个、50个、100个、500个或1000个不同的治疗表达盒。在一些实施例中,所述多个治疗表达盒包含至少约10个、50个、100个、500个、1000个或10000个不同治疗部分。在一些实施例中,所述治疗部分包含DNA序列、RNA序列、shRNA、siRNA、miRNA、反义寡核苷酸、吗啉代、蛋白质降解标签、治疗转基因或基因编辑复合物。在一些实施例中,所述治疗部分包含Cas融合蛋白、CRISPRi、CRISPRa、RNA编辑元件、RNA剪接的调控元件、RNA降解元件或表观遗传修饰元件。在一些实施例中,所述治疗部分包含shRNA。在一些实施例中,所述治疗部分包含siRNA。在一些实施例中,所述治疗部分包含治疗转基因的产物。在一些实施例中,所述治疗部分包含Cas融合蛋白。在一些实施例中,每个治疗部分条形码与其它治疗部分条形码相差至少约1个、2个、3个、4个、5个、6个、7个、8个、9个或10个碱基。在一些实施例中,所述治疗部分条形码是包含至少约2个、3个、4个、5个、6个、7个、8个、9个或10个碱基的核酸序列。在一些实施例中,所述治疗部分条形码位于所述治疗部分的开放阅读框中,或者所述治疗部分条形码的转录与所述治疗部分的转录连接。在一些实施例中,所述报告基因的表达指示所述细胞中的所述治疗部分的表达。在一些实施例中,所述激活剂是Gal4、cre或FLP。在一些实施例中,所述治疗表达盒包含在病毒载体或非病毒载体中。在一些实施例中,所述选择表达盒是病毒载体或非病毒载体。在一些实施例中,将所述治疗表达盒与所述报告基因表达盒混合在一个样品中或作为单独的样品提供。在一些实施例中,所述病毒载体包含AAV、腺病毒或慢病毒。在一些实施例中,所述非病毒载体包含线性载体、质粒、基于聚合物的载体或转座子,或作为纳米颗粒、脂质纳米颗粒、RNA纳米颗粒或外泌体递送,或者被调配用于使用物理方法、针、弹道DNA、电穿孔、声孔效应、光致穿孔、磁转染或水穿孔递送,或者被调配用于与化学载剂、无机颗粒、金属纳米颗粒、磁性纳米颗粒、脂质、脂质纳米颗粒、肽、聚合物、聚乙烯亚胺(PEI)、壳聚糖、聚酯、树枝状聚合物或聚甲基丙烯酸酯一起递送。
在一些方面,一种用于鉴定候选治疗部分的方法包含将本文所公开的试剂盒的内容物(例如,表达盒的文库)施用于生物实体中,并且鉴定引起细胞状态变化的候选治疗部分。在一些实施例中,所述细胞状态是患病细胞状态、非患病细胞状态、健康细胞状态、正常细胞状态、异常细胞状态、衰老细胞状态、转移性状态、非转移性状态、凋亡细胞状态、非凋亡细胞状态、感染性细胞状态、非感染性细胞状态、癌细胞状态或非癌细胞状态、增生性状态、非增生性状态、多能状态、分化的细胞状态、增殖细胞状态、非增殖细胞状态、失调细胞状态、调控的细胞状态、免疫反应状态、非免疫反应状态、分裂细胞状态、静止细胞状态、癌细胞状态或非癌细胞状态。在一些实施例中,所述细胞状态的变化与治疗作用相关。在一些实施例中,所述治疗作用包含由细胞中表达的治疗部分产生的以下中的变化:细胞参数、细胞活性或功能、细胞生理学、细胞大小、细胞形态、细胞形状、细胞标志物或细胞密度、转录组学谱、蛋白质组学谱、代谢组学谱、表观遗传组学谱、蛋白质基因组学谱、免疫蛋白质组学谱、药物基因组学谱或核小体组学谱或其任何组合。在一些实施例中,所述鉴定包含单细胞分析、单细胞核分析、批量分析、测序、RNA测序、单细胞RNA测序、单细胞核RNA测序、基于液滴的单细胞或单细胞核RNA测序、对细胞的群体中一定量或强度的治疗部分或治疗部分条形码的测序、组织学测定或染色测定,例如,荧光染色测定。
在一些方面,本公开设想了一种用于鉴定候选治疗部分的方法,所述方法包含:在体内筛选多个不同治疗部分并使用单细胞分析或单细胞核分析富集所述候选治疗部分,以及使用治疗部分条形码鉴定所述候选治疗部分。
在一些方面,本公开设想了一种用于鉴定候选治疗部分的方法,所述方法包含:在体内筛选与指示细胞状态的可能性的一个或多个报告基因可操作地连接的多个不同治疗部分,在表征为具有所述细胞状态的可能性的细胞的群体中富集所述候选治疗部分,以及使用治疗部分条形码鉴定所述细胞的群体中的所述治疗部分。在一些实施例中,所述体内筛选包含向生物实体施用治疗部分的文库。在一些实施例中,所述施用包含局部注射或全身注射或输注。在一些实施例中,所述生物实体被表征为具有或作为以下的模型:年龄相关的疾病或病状、肝病或病状、代谢性疾病、心血管疾病、神经退行性疾病或病状、眼病或病状、退行性疾病或病状、一种类型的关节炎、非酒精性脂肪性肝病、非酒精性脂肪性肝炎、肝硬化、特发性肺纤维化、肌肉减少症、神经系统病状、阿尔茨海默氏病或痴呆,或与衰老、复制活性不足或不平衡、分泌表型改变、神经元信号传导改变、异常免疫活性、未分化的细胞状态或癌性相关的疾病或病状。在一些实施例中,所述细胞状态是疾病或病状,或其中所述细胞状态是患病细胞状态、健康细胞状态、衰老细胞状态、转移性状态、非转移性状态、凋亡细胞状态、非凋亡细胞状态,感染性细胞状态、非感染性细胞状态、增生性状态或非增生性状态、多能状态、分化的细胞状态、增殖细胞状态、非增殖细胞状态、失调细胞状态、调控的细胞状态、免疫反应状态、非免疫反应状态、分裂细胞状态、静止细胞状态、癌细胞状态或非癌细胞状态,或者其中所述细胞状态与衰老、受损的细胞功能、复制活性不足或不平衡、分泌表型改变、神经元信号传导改变、异常免疫活性、分化不良的细胞、未分化的细胞或癌症相关。在一些实施例中,所述多个不同治疗部分包含至少约10个、20个、50个、100个、500个或1000个不同治疗部分。在一些实施例中,所述治疗部分包含DNA、RNA、shRNA、治疗转基因的产物、基因编辑蛋白、Cas融合蛋白、CRISPRi、CRISPRa、RNA编辑元件、RNA剪接的调控元件、RNA降解元件或表观遗传修饰元件。在一些实施例中,所述富集包含使用一个或多个报告基因在不同细胞状态之间进行分化。在一些实施例中,所述方法进一步包含向两个或更多个报告基因。在一些实施例中,所述报告基因的表达由启动子驱动。在一些实施例中,所述启动子进一步包含增强子。在一些实施例中,所述启动子源自已知与疾病或病状相关的基因的同源启动子。在一些实施例中,所述报告基因是选择标志物、可检测蛋白、荧光蛋白、药物敏感元件、诱导型转录元件或细胞表面标志物。在一些实施例中,所述报告基因是不同的荧光蛋白。在一些实施例中,所述报告基因产生允许动物中不同细胞状态之间的分化的荧光信号。在一些实施例中,所述鉴定包含测量由所述治疗部分产生的以下中的变化:细胞参数、细胞生理学、转录组学谱、蛋白质组学谱、代谢组学谱、表观遗传组学谱、蛋白质基因组学谱、免疫蛋白质组学谱、药物基因组学谱或核小体组学谱或其任何组合。在一些实施例中,所述细胞状态是:疾病或病状,或其中所述细胞状态是患病细胞状态、健康细胞状态、衰老细胞状态、转移性状态、非转移性状态、凋亡细胞状态、非凋亡细胞状态,感染性细胞状态、非感染性细胞状态、增生性状态或非增生性状态、多能状态、分化的细胞状态、增殖细胞状态、非增殖细胞状态、失调细胞状态、调控的细胞状态、免疫反应状态、非免疫反应状态、分裂细胞状态、静止细胞状态、癌细胞状态或非癌细胞状态,或者其中所述细胞状态与衰老、受损的细胞功能、复制活性不足或不平衡、分泌表型改变、神经元信号传导改变、异常免疫活性、分化不良的细胞、未分化的细胞或癌症相关。在一些实施例中,所述富集包含进行FACS、亲和纯化方法、批量测序、流式细胞术或微流体分选以富集具有治疗作用的细胞或细胞的群体。在一些实施例中,所述富集进一步包含在具有治疗作用的细胞中存在化学或细胞应激源的情况下检测或测量报告基因、荧光或化学染色、细胞参数、细胞生理学或细胞存活。在一些实施例中,所述细胞参数或生理学包括细胞大小、形状或密度。在一些实施例中,批量测序包含对细胞的群体或细胞核的群体中的治疗部分或治疗部分条形码进行测序。在一些实施例中,所述细胞的群体中的所述治疗部分的丰度指示与所述治疗部分相关的治疗作用。在一些实施例中,使用一种或多种机器学习方法、统计方法、神经网络、差异共表达网络、相互作用网络、特征基因网络、聚类或基因集分析或其任何组合来鉴定所述启动子。在一些实施例中,所述机器学习方法进一步包括在不同细胞状态中共表达的或差异表达的基因的模块。
在一些实施例中,所述治疗作用包含所述细胞状态的变化,其中所述变化是疾病细胞状态的至少约5%、10%、20%、30%、40%、50%、60%、70%、80%或90%的减少,或者健康细胞状态的可能性的至少约5%、10%、20%、30%、40%、50%、60%、70%、80%或90%的增加,或者其中所述变化是细胞修复或再生的至少约5%、10%、20%、30%、40%、50%、60%、70%、80%或90%的增加。在一些实施例中,所述细胞状态是:疾病或病状,或其中所述细胞状态是患病细胞状态、健康细胞状态、衰老细胞状态、转移性状态、非转移性状态、凋亡细胞状态、非凋亡细胞状态,感染性细胞状态、非感染性细胞状态、增生性状态或非增生性状态、多能状态、分化的细胞状态、增殖细胞状态、非增殖细胞状态、失调细胞状态、调控的细胞状态、免疫反应状态、非免疫反应状态、分裂细胞状态、静止细胞状态、癌细胞状态或非癌细胞状态,或者其中所述细胞状态与衰老、受损的细胞功能、复制活性不足或不平衡、分泌表型改变、神经元信号传导改变、异常免疫活性、分化不良的细胞、未分化的细胞或癌症相关。在一些实施例中,所述单细胞分析包含RNA测序。在一些实施例中,所述单细胞分析包括基于液滴的单细胞或单细胞核RNA测序。在一些实施例中,所述RNA测序使用一个或多个条形码序列,所述一个或多个条形码序列可以在测序之前或期间被扩增。在一些实施例中,所述治疗部分条形码序列对于每个治疗部分是独特的。在一些实施例中,每个治疗部分条形码序列是至少约2个、3个、4个、5个、6个、7个、8个、9个、10个或多于10个碱基的核酸序列。在一些实施例中,所述治疗部分基于疾病或病状的转录组学特征进行工程化,或基于机器学习方法、统计方法、神经网络、差异共表达网络、特征基因网络、相互作用网络、聚类或基因集分析进行工程化。在一些实施例中,所述转录组学特征进一步包含与疾病状态相关的共调控的基因的模块的神经网络。在一些实施例中,所述富集进一步包含分选来自具有治疗作用或与所述细胞状态的可能性相同的动物的细胞或细胞的细胞核,如通过一个或多个报告基因测量的。在一些实施例中,所述报告基因包括选择标志物、可检测蛋白、荧光蛋白、药物敏感元件、诱导型转录元件或细胞表面标志物。在一些实施例中,方法进一步包含对分选的细胞中的所述治疗部分进行基于单细胞的测序或基于单细胞核的测序(例如,基于液滴的单细胞RNA测序或单细胞核RNA测序),以鉴定与所述治疗作用相关的所述治疗部分。在一些实施例中,所述基于单细胞或基于单细胞核的测序,如基于液滴的单细胞或单细胞核RNA测序包括对与每个治疗部分相关的治疗部分条形码进行测序,所述治疗部分可以在测序之前或期间扩增。在一些实施例中,所述方法进一步包含分析相对于健康细胞具有所述治疗作用的分选的细胞的细胞参数、细胞生理学、转录组学谱、蛋白质组学谱、代谢组学谱、表观遗传组学谱、蛋白质基因组学谱、免疫蛋白质组学谱、药物基因组学谱或核小体组学谱或其任何组合。在一些实施例中,所述方法进一步包含使用机器学习方法、统计方法、神经网络、差异共表达网络、特征基因网络、相互作用网络、聚类或基因集分析来修饰从所述体内筛选中鉴定的治疗部分。在一些实施例中,所述方法进一步包含将从所述体内筛选中鉴定的两个或更多个治疗部分组合。
通过引用并入
本说明书中所提及的所有出版物、专利和专利申请通过引用并入本文,其程度如同每个单独的出版物、专利或专利申请被专门地且单独地指示为通过引用并入。
附图说明
本公开的各个方面和实施例的一些新颖特征在所附权利要求中具体阐述。通过参考阐述了说明性实施例的以下详细说明,可以获得对本方面和实施例的特征和优点的更好理解,在这些实施例中利用了本发明的原理,并且在其附图中:
图1展示了使用本文所描述的方法从文库中鉴定候选治疗部分的过程的非限制性实例。
图2展示了本文所公开的无偏体内筛选方法的样品工作流程。
图3展示了用于鉴定与疾病相关的基因的簇分析的实例。
图4展示了疾病模块状态的样品报告基因。
图5A至5D展示了含有如本文所描述的表达盒的载体的非限制性实例的示意图。
图6展示了健康与患病模型中含有候选治疗部分的单细胞的细胞状态分析的实例。
图7展示了包含注射到疾病的小鼠模型中的文库的荧光激活的细胞分选(FACS)富集的工作流程。
图8展示了基因扰动对细胞状态的影响的加权相关分析。
图9展示了用于单细胞细胞核测序的治疗部分条形码的核保留。
图10示出了使用各种核保留基序的实验结果。图10的X轴提供了各种示例性条形码构建体,如下所示:“非_短”不具有核保留基序;“非_填充”不具有核保留基序,但添加了核苷酸碱基,因此构建体的长度与具有核保留基序的构建体相同或相似;“ZhangX1”具有单个13bp的Zhang核保留基序;“ZhangX3”具有三个13bp的Zhang核保留基序,其均匀分布在整个分子中;“ZhangX6”具有三个13bp的Zhang核保留基序,其背靠背地分布在整个分子中;“Sirloin”有一个42bp的Sirloin基序;并且“U1”有一个9bp的U1基序。Y轴是回收的独特核治疗部分条形码(UMI),其相对于递送给小鼠的文库中单个构建体的表示归一化。附图示出了治疗部分条形码与核保留基序的每个组合的UMI的归一化的数量。数据相对于文库内每个条形码的表示归一化。示出了用两种不同的核隔离缓冲液处理的两个实验。
具体实施方式
介绍
一些疾病或病状的患病率随着年龄的增长呈指数级增加,如在65岁的年龄之后。各种年龄相关的疾病或病状包含但不限于阿尔茨海默氏病、肌肉萎缩、骨密度降低、癌症、心血管疾病、痴呆、糖尿病和其它退行性疾病。全球和美国的老年群体的比例正在急剧上升。在药物发现或开发的早期,需要对多个治疗部分进行无偏体内筛选,从而可以同时和/或在同一生物实体(例如,动物或类器官)内筛选疗法的多个参数和方面。
本公开提供了用于体内筛选多种治疗部分的方法。本文的组合物和方法可以用于治疗部分的无偏体内筛选,如图1所描绘的。例如,可以使用组学技术查找保守的疾病模型(小图A)。可以为保守的模型内的细胞状态设计报告基因(小图B)。编码多个治疗部分的核酸序列的载体文库(例如,AAV文库)可以与编码细胞状态的报告基因的核酸序列汇集(小图C)。然后,细胞状态富集可以如下进行:(1)可以将汇集的文库(含有编码多个不同治疗部分的核酸序列和编码报告基因的核酸序列)注射到生物实体中,并且(2)可以基于示出处于不同状态的细胞的报告基因对细胞进行分选(小图D)。细胞状态模型可以基于治疗部分的作用进行改进。在此,可以使用组学,如单细胞或单细胞核组学(例如,单细胞转录组学)来证实细胞状态的逆转。
此类方法为传统方法提供了强大的替代方案,所述传统方法需要已知的靶标、对疾病病因的先验知识或理解,或一次分析一个治疗部分。本文所公开的组合物和方法的优点包含但不限于:不需要对疾病病因、机制或靶标的先验知识或理解;可以同时筛选文库或多个不同的疗法或治疗部分(例如,至少约5个、10个、20个、50个、100个、200个、500个、1000个、10,000个或超过10,000个疗法)(例如,全部在一个生物实体中),而不是一次一个疗法或使用大量生物实体;体内筛选允许捕获或解释细胞内和细胞外因子,例如环境因子、细胞外基质,以及组织、器官或全身水平上的复杂相互作用,包含可能影响疗法或治疗部分的远端全身相互作用(如淋巴系统、循环系统或免疫系统);体内高通量筛选通过考虑影响疗法或治疗部分的有效性、功效和/或安全性的各种临床因素,例如递送、吸收、代谢、药代动力学、药效学和/或免疫应答,促进了从体外研究到体内疗法的转换。在一些方面,在一个生物实体中筛选多个治疗部分提高了效率、一致性,并且允许在不同治疗部分之间进行并排比较。此类体内筛选减少了研究所需的生物实体的数量。
本文所公开的组合物以及其使用方法允许在体内对多个不同治疗部分进行高通量筛选。在一些方面,此类体内筛选允许在一个筛选中而不是一次一个参数中结合从施用或递送到治疗作用的多个体内参数来筛选不同治疗部分。例如,本公开提供了用于筛选不同AAV的文库的组合物以及其使用方法,所述不同的AAV以不同剂量编码以不同方式注射的多个不同治疗部分,以及在体内与不同靶标相互作用的治疗部分。使用单细胞分析或单细胞核分析(例如,独特的条形码测序,如基于液滴的单细胞或单细胞核RNA测序)或批量分析方法,可以快速识别、分选或富集显示治疗作用或细胞状态变化的细胞,并且确定负责治疗作用或细胞状态变化的治疗部分。可以重复本文所公开的任何方法的步骤,每次使用比前一轮筛选优化的或更小的候选治疗部分池。
在传统方法中,筛选通常基于已知的靶标和已知作用,当疾病或病状复杂、涉及多个靶标和通路和/或机制理解不清楚时,这并不总是可能的。常规筛选方法通常是耗时的,需要对不同的参数进行单独分析,如用于将疗法靶向所关注的靶组织或细胞类型的单独测定、用于安全性和副作用的单独测定、用于不同剂量的单独测定、用于每个治疗部分的单独测定,以及用于临床前分析的单独测定,其中每个治疗部分是单独施用的等。此方法使得筛选大量不同治疗部分(如至少约50个、至少100个、至少200个、至少500个、至少1000个或至少5000个治疗部分)不切实际或过于昂贵和耗时。此类传统的基于靶标的筛选方法通常依赖于基于源自体外或离体实验的通路的有限知识的生物学假设,所述体外或离体实验探测细胞功能障碍的有限方面,并且在体内测试之前无法完全验证。不考虑动物中或体内的体内因素,如细胞内和细胞外因素、环境因素、细胞与细胞相互作用、细胞与组织和组织-组织相互作用、组织与器官相互作用、不同水平的基质、微生物组环境、免疫应答和/或全身、循环或远端相互作用(例如,淋巴系统),筛选和/或鉴定疗法的常规方法无法捕获这些因素如何影响疗法,更不用说不同治疗部分的文库了。
此外,常规药物发现或疗法设计中靶标的先验知识可能是有限的,因为许多与衰老相关的疾病或病状是复杂的,并且对其了解甚少。本公开提供了一种依赖于细胞状态的差异或细胞状态的变化的体内筛选,即使在疾病病因未知或不清楚的情况下,也允许筛选治疗部分。此类体内筛选以及其使用方法提供了用于筛选和鉴定治疗部分和治疗的方法的强大工具,而不需要疗法靶标和/或机制的先验知识。
如本文所描述的,此类组合物以及其使用方法允许同时和/或在生物实体(例如,动物或类器官)内高通量体内筛选多个治疗部分。此类高通量的体内筛选可以提供更一致的数据,并且促进或加速药物发现和/或转化为在体内具有更大安全性和/或功效的临床疗法。
本公开提供了一种无偏体内筛选方法,所述方法可以包含基于细胞状态的变化来筛选多个候选治疗部分,其中细胞的变化可以是由治疗部分产生的细胞参数、细胞活性或功能、细胞生理学、细胞大小、细胞形态、细胞形状、细胞标志物、细胞密度、转录组学谱,蛋白质组学谱、代谢组学谱、表观遗传组学谱、蛋白质基因组学谱、免疫蛋白质组学谱、药物基因组学谱、核小体组学谱或其任何组合。在一些方面,此类筛选可以重复多次。在一些方面,筛选之后是候选治疗部分选择和/或体内优化、使用本文所公开的组合物和/或方法进行筛选(例如,在疾病模型中直接进行的高通量筛选)和候选优化的循环。
体内筛选工作流程的实例的示意图在图2中展示。例如,无偏疾病特征,如包括共表达模块的特征基因网络可以用于鉴定疾病或病状的多个不同治疗部分候选,例如不同的治疗性转基因。可以使用本文所公开的高通量筛选在体内筛选此类不同治疗部分候选的文库,以确定候选发明的功效和/或毒理学。在一些方面,毒理学可以通过未能鉴定特定治疗部分(指示细胞死亡)或疾病特征的恶化来确定。在一些方面,一种或多种报告基因用于提供治疗指数,所述治疗指数对应于由细胞中的或与细胞接触的候选治疗部分引起的细胞状态的期望的变化。在一些方面,具有积极治疗指数的候选被进一步优化。在一些方面,对优化的候选进行一次或多次筛选,以富集具有高治疗指数或引起相对于疾病特征的细胞状态的期望的变化的高可能性的一个或多个候选治疗部分。优化和体内筛选的此过程可以重复进行。在一些方面,选择优化的候选治疗部分用于进一步研究,例如,良好实验室规范(GLP)毒理学研究,或将优化的候选之一注射到动物体内用于进一步分析和/或验证。在一些方面,源自本文所公开的筛选的优化的候选治疗部分可以在临床试验中进一步测试,如研究新药(IND)。在一些方面,来自本文所公开的体内筛选的数据可以作为临床前数据提交,以支持IND应用和临床开发。
体内筛选方法可以包含从一个或多个疾病特征识别,源自其或基于其的多个候选治疗部分,例如,源自以下的特征:一种或多种机器学习方法或一种或多种统计方法、共表达网络、差异表达特征、特征基因网络或包含一个或多个共表达模块的网络。在一些方面,本文所公开的体内筛选方法是无偏的。在一些方面,本文所公开的体内筛选包含多个不同治疗部分,其中一个或多个治疗部分引起细胞状态的扰动。
体内筛选方法可以能够探测或测定内在和细胞外因素的扰动,包含但不限于组织、器官和全身水平的相互作用。在一些方面,此类扰动引起由细胞中的治疗部分产生的以下中的变化:细胞参数、细胞活性或功能、细胞生理学、细胞大小、细胞形态、细胞形状、细胞标志物、细胞密度、转录组学谱、蛋白质组学谱、代谢组学谱、表观遗传组学谱、蛋白质基因组学谱、免疫蛋白质组学谱、药物基因组学谱、核小体组学谱、微生物组学谱或其任何组合。
本文所描述的无偏体内筛选方法可以作为高通量体内筛选来实施。本文提供了用于鉴定候选治疗部分的方法,包含体内筛选多个不同的候选治疗部分,以及使用治疗部分条形码富集候选治疗部分,所述治疗部分条形码可以在测序之前或测序期间扩增。
无偏体内筛选方法可以用于筛选疾病。此方法的实施可以找到保守的疾病特征。在一些方面,文库可以与至多数千个条形码治疗部分汇集。在一些方面,可以将文库引入令人信服的疾病模型中。在一些方面,可以基于治疗部分的作用来改进疾病特征和文库设计。测序可以测试每个治疗部分对疾病状态的逆转。在一些方面,用来自文库的最高命中进行饱和治疗可以测试毒性并证实命中的治疗功效。在一些方面,可以在大型哺乳动物中进行临床开发,包含广泛的毒性研究和临床试验。
如本文所使用的,治疗部分可以包括遗传材料、遗传材料的调节剂或编码遗传材料的调节剂的遗传材料,所述遗传材料的调节剂在引入患有疾病或病状的受试者或疾病或病状的模型时可以产生治疗结果。
本文所描述的方法可以用于多种健康和疾病状态,所述状态可以包含具有复杂疾病病因的状态,但有强有力的证据表明细胞类型可靶向治疗作用。所述方法可以用于包括患者样品和动物模型的样品组。在一些方面,可以使用非常接近地反映人疾病或健康状态的理想动物模型。本文所描述的方法可以适用于年龄相关的和非年龄相关的疾病和健康状态。
术语“表达”是指从DNA模板转录核酸序列或多核苷酸(如转录为mRNA或其它RNA转录物)的过程和/或随后将经转录的mRNA翻译为肽、多肽、或蛋白质的过程。转录物和编码的多肽可以统称为“基因产物”。如果多核苷酸源自基因组DNA,则表达可以包含在真核细胞中剪接mRNA。
“表达盒”是指包括一个或多个调控元件的核酸分子,所述一个或多个调控元件与用于表达的编码序列(例如,一种基因或多种基因)可操作地连接。在一些方面,表达盒可以包含编码治疗部分的核酸序列。在一些方面,治疗部分与治疗部分条形码可操作地连接。在一些方面,治疗部分条形码与编码非编码核保留RNA基序的一个或多个序列可操作地连接。在一些方面,表达盒可以包含编码一个或多个报告基因的核酸序列。在一些方面,编码治疗部分的序列和编码一个或多个报告基因的序列可以在同一表达盒上。在其它方面,编码治疗部分的序列和编码一个或多个报告基因的序列可以在不同的表达盒上。
如本文所使用的,“可操作地连接”、“可操作连接”、“操作性地连接”或其语法等效物是指基因元件,例如启动子、增强子、聚腺苷酸化序列等的并置。其中所述元件处于允许其以预期方式操作的关系中。例如,如果启动子帮助启动对编码序列的转录,则启动子与编码区操作性地连接。只要维持这种功能关系,启动子与编码区,如增强子之间就会存在插入残基或元件。
如本文所使用的,术语“治疗(treat)”、“治疗(treatment)”和“疗法”等是指获得期望的药理学和/或生理学作用,包含但不限于减轻、延迟或减缓进展、减少作用或症状、预防发作、预防复发、抑制、改善疾病或病症的发作、获得关于疾病、病症或医学病状的有益或期望的结果,如治疗益处和/或预防益处。如本文所使用的,“治疗”涵盖哺乳动物,特别是人类的疾病的任何治疗,并且包含:(a)预防疾病发生在可能倾向于患有疾病或有患有所述疾病风险但尚未被诊断为患有所述疾病的受试者体内发生;(b)抑制疾病,例如,阻止其发展;以及(c)减轻疾病,例如,使疾病消退。治疗益处包含根除或改善正在被治疗的潜在病症。此外,治疗益处通过根除或改善与潜在病症相关联的一种或多种生理症状来实现,使得在受试者中观察到改善,尽管受试者可能仍患有潜在病症。在一些方面,对于预防益处,将组合物施用于处于发展特定疾病的风险的受试者,或施用于报告疾病的一种或多种生理症状的受试者,即使尚未作出此疾病的诊断。本公开的方法可以用于任何哺乳动物。在一些方面,治疗可以引起症状的减少或停止。预防性作用包含延迟或消除疾病或病状的出现,延迟或消除疾病或病状的发作,减缓、停止或逆转疾病或病状的进展,或其任何组合。
如本文所使用的,“载体”是指可以用于介导核酸分子递送到细胞中的任何媒剂,在细胞中所述核酸分子可以被复制或表达。所述术语包含作为自我复制核酸结构的载体以及并入到其已被引入到的宿主细胞的基因组中的载体。某些载体能够指导其可操作地连接到的核酸的表达。此类载体在本文中被称为“表达载体”。载体的实例包含质粒和病毒载体。
如本文所使用的,“治疗部分”、“治疗剂”和类似等效物可互换使用,是指对细胞或细胞状态具有治疗作用的任何部分或药剂。治疗部分可以包含但不限于生物、治疗转基因或其产物(例如,蛋白质)、酶替代物、DNA序列、RNA序列、适体、寡核苷酸、多肽、shRNA、siRNA、miRNA、反义寡核苷酸、吗啉代、蛋白质降解标签、基因编辑复合物、Cas融合蛋白、CRISPRi、CRISPRa、RNA编辑元件、RNA剪接的调控元件、RNA降解元件、表观遗传修饰元件或其任何组合。如本文所使用的,“候选治疗部分”是指已被鉴定为对细胞或细胞状态具有治疗作用或可能具有治疗作用的任何治疗部分(例如,在筛选如本文所提供的治疗部分的文库之后)。
如本文所使用的,“报告基因”是指产生可以被测量的蛋白质产物的任何序列,优选地,尽管不一定是在常规测定中。合适的报告基因包含但不限于编码介导抗生素抗性(例如,氨苄青霉素(ampicillin)抗性、新霉素(neomycin)抗性、G418抗性、嘌呤霉素(puromycin)抗性)的蛋白质的序列,编码有色或荧光或发光蛋白(例如,绿色荧光蛋白(GFP)、增强型绿色荧光蛋白(eGFP)、红色荧光蛋白、荧光素酶)的序列,以及介导增强的细胞生长和/或基因扩增的蛋白质(例如,二氢叶酸还原酶)。表位标签包含例如FLAG、His、myc、Tap、HA或任何可检测的氨基酸序列的一个或多个拷贝。“表达标签”包含编码报告基因的序列,所述报告基因与所期望的基因序列可操作地连接以监测所关注的基因的表达。在一些情况下,报告基因可能是报告基因的蛋白质产物。
在本文所描述的各个实施例中,报告基因用于GFP中。如本文所使用的,术语GFP通常意指从维多利亚发光水母(jellyfish Aequorea Victoria)纯化的野生型GFP,或者已经发现和/或工程化为显示GFP的改进的光谱特征的任何GFP衍生物两者,引起荧光、光稳定性增加,并且主激发峰移动到488nm,峰值发射保持在509nm,例如,GFP可以指37℃折叠效率(F64L)点突变体,产生增强的GFP(EGFP),并且其消光系数(表示为ε)为55,000M-1cm-1。[20]EGFP的荧光量子产率(QY)是0.60。相对亮度表示为ε·QY,为33,000M-1cm-1。在本文所描述的各个实施例中,报告基因是GFP,例如eGFP。
如本文所使用的,术语“条形码”通常是指传达或能够传达关于分析物的信息的标签或标识符。条形码可以是分析物的一部分。除了分析物的内源性特征(例如,分析物或末端序列的大小)之外,条形码可以是与分析物(例如,核酸分子)连接的标签或标签的组合。条形码还可以与分析物可操作地连接。条形码可以与除分析物以外的分子附接。条形码可以是独特的。条形码可以具有多种不同的格式,例如,条形码可以包含多核苷酸条形码、随机核酸序列和/或氨基酸序列,以及合成核酸序列和/或氨基酸序列。条形码可以以可逆或不可逆的方式与分析物附接。可以在样品测序之前、期间和/或之后将条形码添加到例如脱氧核糖核酸(DNA)或核糖核酸(RNA)样品的片段。条形码可以实时鉴定和/或量化单个测序读段。在一些方面,条形码可以是治疗部分条形码。在一些方面,条形码的前两个核苷酸是‘GG’。
如本文所使用的,术语“转基因”包含人工引入细胞或细胞的基因组中的任何外源性核酸序列。在一些方面,转基因可以是在人工引入的细胞中天然发现的外源性核酸序列。在其它方面,转基因可以是在人工引入的细胞中未天然发现的外源性核酸序列。在一些方面,转基因可以包括基因或基因的一部分。在一些方面,转基因可以包括相对于野生型核酸序列的一个或多个突变。在一些方面,转基因可以包括一种或多种调控元件、启动子、增强子、激活剂等。在一些方面,转基因可以是治疗转基因,这意味着转基因的产物(例如,蛋白质产物)对细胞具有或可能具有治疗作用。
如本文所使用的,术语“非编码核保留RNA基序”是指与在细胞质中积累相比,倾向于在细胞核中积累的RNA序列。非编码核保留RNA基序的示例性描述可以在以下中找到:Zhang等人,《分子与细胞生物学(Molecular and Cellular Biology)》,34:2318-2329(2014)(即“Zhang基序”),Lubelsky等人,《自然(Nature)》555(7694):107-111(2018),Yin等人,《生物预印本期刊(BioRxiv)》doi:https://doi.org/10.1101/310433(2018)。在一些实施例中,如本文所用的非编码核保留RNA基序使用Lubelsky等人设想的方法显示出超过15%、20%、25%、30%、35%或40%的核富集。在一些实施例中,如本文所提供的构建体包含1个或多个;或2个或更多个;或3个或更多个;或4个或更多个;或5个或更多个;或6个或更多个;或1个至8个;或1个至4个;或2个至4个;或2个至3个;或3个至4个;或3个至5个;或2个至5个;或5个至6个;或1个;或2个;或3个;或4个;或5个;或6个长度为13bp的Zhang基序。
Zhang基序可以由较短的五聚体基序定义,所述基序可以包含包括AGCCC(SEQ IDNO:1)的序列,其中需要围绕五聚体的序列限制。在一些方面,AGCCC(SEQ ID NO:1)的五聚体序列包含相对于五聚体的第一核苷酸在位置-8(T或A)和-3(G或C)处的序列限制。因此,示例性五聚体和周围上下文序列包含其中T在-8位置处且G在-3位置处的AGCCC(SEQ IDNO:1)、其中T在-8位置处且C在-3位置处的AGCCC(SEQ ID NO:1)、其中A在-8位置处且G在-3位置处的AGCCC和其中A在-8位置处且C在-3位置处的AGCCC(SEQ ID NO:1)。
如本文所使用的,Zhang基序是13bp长的核酸序列,其包括WNNNNSNNAGCCC(SEQ IDNO:2),其中W可以是A或T,S可以是C或G,并且N可以是A、T、C或G。在Zhang基序的13bp中,位置1和6处的核苷酸分别被限制为A或T以及C或G;位置9至13处的核苷酸分别被限制为A、G、C、C和C;并且位置2至5、7和8处的核苷酸是不受限制的。例如,Zhang基序可以读作ANNNNCNNAGCCC(SEQ ID NO:3)、ANNNNGNNAGCCC(SEQ ID NO:4)、TNNNNCNNAGCCC(SEQ IDNO:5)或TNNNNGNNAGCCC(SEQ ID NO:6),其中每个N可以单独地是A、T、C或G。在一些实施例中,Zhang基序是TacgtGAtAGCCC(SEQ ID NO:7)。
示例性非编码核保留RNA基序包含lncRNA的SINE源性核RNA定位(SIRLOIN)序列,如JPX、PVT1和NR2-F1-AS1;在lncRNA中发现的五聚体基序,如BORG(BMP2-OP1应答基因),例如lncRNA的染色质富集的RNA片段(enChrs),以及7-核苷酸核心U1 snRNP识别基序,如enChrs的U1 snRNP识别基序。
SIRLOIN元件可以包含具有RCCTCCC(SEQ ID NO:8)(R=A/G)的共有序列的一个或多个基序。在一些实施例中,Sirloin基序包括以下序列:CGCCTCCCGGGTTCAAGCGATTCTCCTGCCTCAGCCTCCCGA(SEQ ID NO:9)。在一些方面,SIRLOIN元件的转录物与RNA结合蛋白相互作用,例如HNRNPK(SEQ ID NO:10)。
示例性强U1 snRNP识别基序包含CAGGTGAGT(SEQ ID NO:11)序列(7-nt序列以及两个上游或5'CA核苷酸);示例性弱U1 snRNP识别基序包含AGGTAAG(SEQ ID NO:12)和AGGTAA(SEQ ID NO:13)序列。
任何非编码核保留RNA基序和任何非编码核保留RNA基序或其核心序列的任何数量的重复可以包含在本文所提供的治疗部分表达盒中。本领域技术人员将理解,在提供DNA序列的情况下,所述序列包含核苷酸A、G、T和C。本领域技术人员将进一步理解,DNA序列可以通过用U取代T而转化为对应的RNA序列。
本文提供了改进代码校正的方法和组合物。因此,所呈现的一些方面和实施例包含多个(例如,三个、四个、五个或多于五个)治疗部分条形码,每个所述治疗部分条形码鉴定相同的治疗部分。在基于液滴的单细胞测序期间,来自一个细胞的寡核苷酸可能被误标记为另一个细胞,或者一个细胞的片段以与另一个细胞连接并污染所述另一个细胞。每次治疗使用单个条形码可能会使区分以下内容变得困难或不可能:(1)污染条形码,以及(2)接收多个治疗部分并表达每个相关条形码的细胞。相反地,如果条形码的三联体描述单个治疗部分,则对三联体的单独组分的检测可以被鉴定为可能的污染,而对整个三联体与单独的独特三联体一起出现的检测允许鉴定已经接受多个独特治疗部分的细胞。包含多个条形码用于鉴定单个治疗部分显著降低了模板转换的风险,这降低了细胞所接收的治疗部分的错误鉴定的可能性。
在一些方面,治疗部分条形码区与启动子区以及与一个或多个另外的序列可操作地连接。
大多数基于液滴的单细胞测序系统专门捕获聚腺苷酸化的转录物,并且因此先前的汇集筛选表达来自聚合酶II启动子(Pol II)的条形码。聚合酶III启动子(Pol III)具有比Pol II更强的表达(约10x),但是所得转录物不是聚腺苷酸化的。最近的工作已经导致在单细胞测序系统中包含特异性特征(捕获序列),以优先捕获条形码RNA(Replogle2018)。因此,在一些实施例中,本文所提供的组合物和方法将Pol III驱动的治疗部分条形码与捕获序列系统组合,从而避免了捕获聚腺苷酸化序列的需要,并增加了捕获序列和治疗部分条形码的量。
在某些实施例中,系统包含具有捕获序列系统的Pol III驱动的条形码的多个拷贝,由此进一步增加转录物的数量。如本文所使用的,术语“PolIII/治疗部分条形码/捕获元件”或“P3TM元件”是指表达盒的核酸序列,所述表达盒包含与至少一个治疗部分条形码和可任选地包含捕获序列的一个或多个另外的序列可操作地连接的PolIII启动子。在各个实施例中,条形码和捕获序列转录物数量的增加可以提高条形码捕获效率,并提供通过代码校正检测测序错误的能力,因为其将被鉴定为来自同一细胞。
在一些方面和实施例中,编码与包含在例如P3TM元件中的PolIII启动子可操作地连接的治疗部分条形码区的核酸序列包含治疗部分条形码和由PolIII启动子控制的任选地另外的序列。
在一些方面和实施例中,与如本文所提供的PolIII启动子(例如P3TM元件)可操作地连接的表达盒的序列包含治疗部分条形码和由PolIII启动子控制的任选地另外的序列;其中由PolIII启动子控制的所述任选的另外的序列包含选自由以下组成的组的一个或多个序列:捕获序列;分子富集序列;和独特基因组鉴定(UGI)序列。在一些方面和实施例中,与如本文所提供的PolIII启动子(例如P3TM元件)可操作地连接的表达盒的序列包含治疗部分条形码和由PolIII启动子控制的任选地另外的序列;其中由PolIII启动子控制的所述任选的另外的序列包含如本文所提供的一个或多个捕获序列。在某些实施例中,本文所提供的捕获序列位于或靠近P3TM元件的3'端。在一些方面和实施例中,与如本文所提供的PolIII启动子(例如P3TM元件)可操作地连接的表达盒的序列包含治疗部分条形码和由PolIII启动子控制的任选地另外的序列;其中由PolIII启动子控制的所述任选的另外的序列包含如本文所提供的一个或多个分子富集序列。在一些方面和实施例中,与如本文所提供的PolIII启动子(例如,如本文所提供的P3TM元件)可操作地连接的表达盒的序列包含治疗部分条形码和由PolIII启动子控制的任选地另外的序列;其中由PolIII启动子控制的所述任选的另外的序列包含如本文所提供的一个或多个独特基因组鉴定(UGI)序列。在一些实施例中,本公开的P3TM(包含治疗部分条形码以及任选地捕获序列、分子富集序列和独特基因组鉴定(UGI)序列中的一个或多个)的长度为50个至500个碱基;或50个至250个碱基;或75个至200个碱基;或75个至100个碱基;或100个至150个碱基;或120个至130个碱基;或约100个碱基;或约110个碱基;或约120个碱基;或约125个碱基;或约130个碱基;或约140个碱基;或约150个碱基。在一些实施例中,与PolIII启动子(例如,在P3TM元件内)可操作地连接的治疗部分条形码的长度为5个至50个碱基;或10个至30个碱基;或12个至28个碱基;或14个至26个碱基;或15个至25个碱基;或16个至24个碱基;或17个至23个碱基;或18个至22个碱基;或19个至21个碱基;或约15个碱基;或约16个碱基;或约17个碱基;或约18个碱基;或约19个碱基;或约20个碱基;或约21个碱基;或约22个碱基;或约23个碱基;或约24个碱基;或约25个碱基。
如本文所使用的,术语“聚合酶III启动子”或“Pol III启动子”是指通过RNA聚合酶III(例如,U6启动子)招募并能够启动转录的DNA序列。这些启动子允许下游序列相对于启动子区的转录。
如本文所使用的,术语“捕获序列”是指添加到表达的寡核苷酸上的核酸序列,所述核酸序列与基于液滴的单细胞测序中使用的珠表面上存在的寡核苷酸序列反向互补。在不存在表达的寡核苷酸的聚腺苷酸化的情况下,此捕获序列允许表达的寡核苷酸被捕获到珠上并进入单细胞测序工作流程。在一些方面或实施例中,捕获序列包含选自由以下组成的组的序列:5'-GCTTTAAGGCCGGTCCTAGCAA-3'(SEQ ID NO:14)和5'-GCTCACCTATTAGCGGCTAAGG-3'(SEQ ID NO:15)。在一些实施例中,所述方法涉及使用与10x试剂和P3TM元件内的任何靶序列互补的寡核苷酸‘刺突’进行捕获,例如Replogle等人,《自然生物技术(Nature Biotechnology)》(doi.org/10.1038/s41587-020-0470-y)中所描述的。在此类实施例中,SEQ ID NO:14或15可能不需要作为捕获序列。示例性的刺突寡核苷酸包含SEQ ID NO:16和17。在一些方面,捕获序列可以被用于捕获靶序列的刺突寡核苷酸替代。在其它方面,捕获序列和刺突寡核苷酸可以用于捕获靶序列。
如本文所使用的术语“分子富集序列”是指经常与PolIII启动子可操作地连接的序列(例如P3TM元件内的序列),在某些实施例中,所述序列可以通过增加治疗部分条形码分子的表达、稳定性和/或捕获,来增加在本文所提供的方法中捕获、鉴定和/或测量的治疗部分条形码的量。
在一些实施例中,分子富集序列是或包含以下序列:CTTGGATCGTACCGTACGAA(SEQID NO:18)。在一些实施例中,分子富集序列是或包含以下序列:SEQ ID NO:18;其中所述序列在转录起始位点的10个碱基;或8个碱基;或5个碱基;或4个碱基;或3个碱基;或两个碱基;或一个碱基内开始。在其它实施例中,如本文所提供的分子富集序列包含序列CCCCNN(SEQ ID NO:19)或NNCCCC(SEQ ID NO:20)。在一些实施例中,如本文所提供的分子富集序列包含位于形成二级结构的低概率的区的SEQ ID NO:19或20。在一些实施例中,分子富集序列包含SEQ ID NO:19或20的重复序列,如1个重复序列;或2个重复序列;或3个重复序列;或4个重复序列;或5个重复序列;或更多个重复序列。在一些实施例中,分子富集序列包含SEQ ID NO:20的重复序列,如1个重复序列;或2个重复序列;或3个重复序列;或4个重复序列;或5个重复序列;或更多个重复序列,并且其中所述重复序列位于形成二级结构的低概率的区。
在一些实施例中,分子富集序列包含选自SEQ ID NO:21-67的一个或多个序列。在一些实施例中,分子富集序列(其可以包含在P3TM元件中)是或包含SEQ ID NO:21-67中的任一个,其中所述序列在转录起始位点的10个碱基;或8个碱基;或5个碱基;或4个碱基;或3个碱基;或两个碱基;或一个碱基内开始。
在其它实施例中,分子富集序列是或包含如下序列读数:(1-3Gs)(任选的A)(1-2Cs)(A/T)(A/T)。在一些实施例中,由PolIII启动子(如P3TM元件)驱动的序列的转录起始位点的第一个核苷酸是‘G’。在一些实施例中,由PolIII启动子(如P3TM元件)驱动的序列的转录起始位点的前两个核苷酸是‘GG’。在一些实施例中,分子富集序列(例如在P3TM元件中)是或包含如下序列读数:(1-3Gs)(任选的A)(1-2Cs)(A/T)(A/T);其中所述序列在转录起始位点的10个碱基;或8个碱基;或5个碱基;或4个碱基;或3个碱基;或两个碱基;或一个碱基内开始。在一些实施例中,分子富集序列包含选自SEQ ID NO:68-97的一个或多个序列。在一些实施例中,分子富集序列(例如包含在P3TM元件中)是或包含SEQ ID NO:68-97中的任一个,其中所述序列在转录起始位点的10个碱基;或8个碱基;或5个碱基;或4个碱基;或3个碱基;或两个碱基;或一个碱基内开始。在一些实施例中,分子富集序列(例如包含在P3TM元件中)是或包含SEQ ID NO:18-97中的任一个,其中所述序列在转录起始位点的10个碱基;或8个碱基;或5个碱基;或4个碱基;或3个碱基;或两个碱基;或一个碱基内开始。
术语“独特基因组鉴定(UGI)序列”是指引入到表达盒(例如,引入到P3TM元件中)的序列,并且对于文库中的特定质粒或病毒克隆而言是独特的。在本文所提供的方法的各个实施例中,UGI序列可以用于定量将特定治疗性干预递送到细胞中的特定质粒或病毒克隆的量。在各个实施例中,如本文所提供的UGI的核苷酸序列可以随机产生。在一些实施例中,UGI序列的长度为5-25个碱基或5-20个碱基;或5-15个碱基;或5-12个碱基;或5-10个碱基;或6-10个碱基;或约5个碱基;或约6个碱基;或约7个碱基;或约8个碱基;或约9个碱基;或约10个碱基;或约11个碱基;或约12个碱基;或约13个碱基;或约14个碱基;或约15个碱基。
本文进一步提供了包括多个治疗部分表达盒的试剂盒,每个所述治疗部分表达盒包括编码与治疗部分条形码可操作地连接的不同治疗部分的核酸序列。在一些方面,所述多个治疗部分表达盒进一步包括转录激活剂或诱导剂分子。在一些方面,试剂盒进一步包括多个报告基因表达盒。报告基因表达盒可以各自包括编码一个或多个报告基因的核酸序列。在一些方面,报告基因表达盒可以包括与编码一个或多个报告基因的序列连接的诱导型转录元件。在一些情况下,转录激活剂或诱导剂分子可以与每个报告基因表达盒中的诱导型转录元件相互作用、对其进行激活或诱导,使得报告基因的表达与如本文所描述的治疗部分的表达可操作地连接。在一些方面,所述一个或多个报告基因包括一种或多种选择标志物、可检测蛋白、荧光蛋白、细胞表面标志物、药物敏感选择标志物或诱导型转录元件。在一些方面,可以针对所关注的模型来选择或优化一个或多个报告基因。
在一些方面,试剂盒可以包括至少约10个、50个、100个、500个或1000个不同治疗部分表达盒。在一些方面,试剂盒可以包括至少约10个、50个、100个、500个、1000个或10000个不同治疗部分(或编码治疗部分的核酸序列)。在一些方面,治疗部分的数量可以与治疗部分表达盒的数量相同。在一些方面,治疗部分的数量可以大于治疗部分表达盒的数量。在一些方面,治疗部分的数量可以小于治疗部分表达盒的数量。
在一些试剂盒中,治疗部分表达盒和报告基因表达盒可以在一个样品中混合在一起,或者作为单独的样品供应。在一些方面,将表达盒在一个样品中混合可以使试剂盒更容易使用。在一些方面,将表达盒作为单独的样品供应可以允许试剂盒的模块性,从而允许混合和匹配的方法。在一些方面,将表达盒作为单独的样品供应可以允许表达盒指向模型中的不同组织或区。
本文进一步提供了用于鉴定候选治疗部分的方法,所述方法包括向生物实体(例如,动物或类器官)中施用表达盒的文库,每个所述表达盒包括编码治疗部分的核酸序列,并且鉴定引起细胞状态或细胞状态的可能性变化的候选治疗部分。
本文进一步提供了用于鉴定候选治疗部分的方法,所述方法包括在体内筛选多个不同的候选治疗部分,使用单细胞分析或单细胞核分析富集候选治疗部分,以及使用治疗部分条形码鉴定候选治疗部分。在一些方面,所述治疗部分条形码与编码非编码核保留RNA基序的一个或多个序列可操作地连接。
本文进一步提供了用于鉴定候选治疗部分的方法,所述方法包括在体内筛选与指示细胞状态的可能性的一个或多个报告基因可操作地连接的多个不同的候选治疗部分,以及在表征为具有细胞状态的可能性的细胞的群体中富集所述候选治疗部分。
保守的细胞状态模型的鉴定
方法可以包括鉴定和/或采用疾病或健康的保守的模型。保守的模型可以包含任何生物实体,包含动物模型、组织、类器官和细胞,如本文所描述的。模型可以是人疾病或健康状态的完整表示,或者可以表示疾病或健康状态的特征的子集。本文的模型可以包括表达盒或文库,并且可以受到表达盒或文库的影响。
疾病特征可以直接从患者或模型组织中鉴定。一些疾病特征可以是生物标志物。在一些方面,治疗部分测试可以直接在患者或模型组织中进行。一些方法可以在筛选期间提供关于候选治疗部分的体内副作用的信息。
来自报告基因的信号可以与细胞状态的可能性相关,从而允许不同细胞状态之间的分化。来自报告基因的信号可以在空间或时间上分布。在一些方面,信号是荧光信号、化学发光信号或比色信号。荧光信号可以是荧光蛋白、可以是报告基因结合配偶体的荧光分子或在与报告基因化学相互作用时可以产生荧光信号的分子。在一些方面,可以有多于一个报告基因,所述报告基因可以产生信号。分化可以基于不同报告基因之间的信号的比率,或者基于在细胞的群体中表达的报告基因的量。报告基因的量可以包括存在/不存在确定、报告基因的绝对数量或报告基因的相对数量。分化可以基于检测或计数细胞的群体中的报告基因。
分化可以与治疗指数相关。在一些方面,治疗指数可以将治疗部分的量与可以引起毒性的治疗部分的量进行比较。治疗指数可以基于不同细胞状态之间的以下中的变化:细胞参数、细胞活性或功能、细胞生理学、细胞大小、细胞形态、细胞形状、细胞标志物、细胞密度、转录组学谱、蛋白质组学谱、免疫蛋白质组学谱、药物基因组学谱、核小体组学谱或其任何组合。例如,在1型糖尿病的模型中,细胞活性或功能的变化可以包括胰腺β细胞的胰岛素分泌增加。分化技术可以用于分化具有来自治疗部分的治疗作用的细胞和具有来自治疗部分的毒性作用的细胞。在一些方面,不同报告基因之间的信号的比率或在细胞的群体中表达的报告基因的量可以与治疗指数相关,并且可以指示由在细胞中表达的治疗部分产生的治疗作用。
细胞状态可以变化。在一些方面,一种或多种细胞状态可以存在于细胞中,例如,增殖细胞状态和癌细胞状态。在一些方面,可以存在若干个细胞状态,例如,2个、3个、4个、5个、6个、7个、8个、9个或10个细胞状态。在一些方面,细胞状态可以是但不限于患病细胞状态、非患病细胞状态、健康细胞状态、正常细胞状态、异常细胞状态、衰老细胞状态、转移性状态、非转移性状态、凋亡细胞状态、非凋亡细胞状态、感染性细胞状态、非感染性细胞状态、癌细胞状态、非癌细胞状态、增生性状态、非增生性状态、多能状态、分化的细胞状态、未分化的细胞状态、增殖细胞状态、非增殖细胞状态、失调细胞状态、调控的细胞状态、免疫反应状态、非免疫反应状态、分裂细胞状态或静止细胞状态。在一些方面,细胞状态可以与衰老、受损的细胞功能、复制活性不足或不平衡、分泌表型改变、神经元信号传导改变、异常免疫活性、分化不良的细胞、未分化的细胞或癌症相关。
细胞状态可以是疾病或病状,或是其中细胞具有疾病或病状的状态。细胞状态可以是其中细胞可以以疾病或病状为特征的状态。细胞状态可以是健康的。细胞状态可以是其中细胞与疾病或病状相关的状态。在一些方面,疾病或病状可以是但不限于年龄相关的疾病或病状、肝病或病状、代谢性疾病或病状、心血管疾病或病状、神经退行性疾病或病状、眼病或病状、退行性疾病或病状、炎性病状、纤维化病状、免疫病状、皮肤病状、毛发病状、指甲病状、癌症、一种类型的关节炎、非酒精性脂肪性肝病、非酒精性脂肪性肝炎、肝硬化、特发性肺纤维化、肌肉减少症、神经系统病状、阿尔茨海默氏病或痴呆,或者所述疾病或病状可以与衰老、复制活性不足或不平衡、分泌表型改变、神经元信号传导改变、异常免疫活性、未分化的细胞状态或癌性相关。
在一些方面,所述细胞状态的可能性在统计学上显著大于随机分布,或者所述细胞状态的可能性是至少约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。在一些方面,细胞状态可以包括相对于疾病状态至少约5%、10%、20%、30%、40%、50%、60%、70%、80%或90%的提高或改善,如通过相对于疾病状态的细胞的细胞参数、细胞生理学、转录组学谱、蛋白质组学谱、代谢组学谱、表观遗传组学谱、蛋白质基因组学谱、免疫蛋白质组学谱、药物基因组学谱或核小体组学谱测量的,或如通过报告基因测量的。例如,与不包括治疗部分的阿尔茨海默氏病的模型的细胞相比,包括治疗部分的阿尔茨海默氏病的模型的细胞可以表现出更少的淀粉样蛋白斑块。
可以仔细选择健康和疾病的模型,以确保其反映一种或多种人健康或疾病状态。此平台可以使用健康和疾病的保守的模型来筛选疾病特征和进行治疗部分测试。疾病模型和健康模型的实例包含任何生物实体,包含组织,包含人组织、培养的细胞、类器官,以及疾病和健康状态的动物模型。公共数据、来自生物库的测序的患者样品、或动物模型和对照,或其任何组合可以用于绘制健康或疾病状态的特征转录特征。
生物实体可以是组织。所述组织可以是健康或疾病的模型。组织可以是活组织、死组织或固定的组织。植入动物体内的组织的实例可以是将人肿瘤细胞异种移植到小鼠组织中。组织可以通过活检、拭子或生物流体样品获得。组织可以从活受试者获得,或在死后获得。组织可以从患有疾病、易患疾病、易感疾病或明显健康的受试者获得。组织可以从消耗特定类型的水、食物或空气或来自特定来源的受试者获得。组织可以有特定的微生物组。组织可以离体生长、维持或分化。组织可以是固定的、新鲜的或冷冻至少一次。如果模型是组织,其可以从被表征为健康的或患有但不限于以下的受试者获得:年龄相关的疾病或病状、肝病或病状、代谢性疾病或病状、心血管疾病或病状、神经退行性疾病或病状、眼病或病状、退行性疾病或病状、炎性病状、纤维化病状、免疫病状、皮肤病状、毛发病状、指甲病状、癌症、一种类型的关节炎、非酒精性脂肪性肝病、非酒精性脂肪性肝炎、肝硬化、特发性肺纤维化、肌肉减少症、神经系统病状、阿尔茨海默氏病或痴呆,或者所述疾病或病状与衰老、复制活性不足或不平衡、分泌表型改变、神经元信号传导改变、异常免疫活性、未分化的细胞状态或癌性相关。
生物实体可以是细胞或细胞的群体。细胞或细胞的群体可以是健康或疾病的模型。实例包含可以植入动物体内的细胞。细胞模型的实例可以是肿瘤细胞,所述肿瘤细胞可以被注射到动物体内作为肿瘤转移的模型。在一些方面,可以从动物提取细胞模型。在一些方面,细胞模型可以是人来源的细胞或非人来源的细胞。在一些方面,细胞可以是患病细胞或非患病细胞。在一些方面,非患病细胞可以是易感疾病、易患疾病或先前患病的。在一些方面,非患病细胞可以是健康的细胞。细胞可以在标准培养基、含有另外的营养物、药物或毒素的培养基、充满营养物、药物或毒素的培养基、低氧环境、缺氧环境或高氧环境中培养。在一些方面,细胞可以是人或哺乳动物来源的。
细胞模型可以与另一种细胞类型共培养。细胞模型可以是分化的或未分化的细胞。如果模型是细胞,其可以是基因修饰的或非基因修饰的细胞。在一些方面,细胞可以被表征为健康的细胞或与以下相关的细胞:年龄相关的疾病或病状、肝病或病状、代谢性疾病或病状、心血管疾病或病状、神经退行性疾病或病状、眼病或病状、退行性疾病或病状、炎性病状、纤维化病状、免疫病状、皮肤病状、毛发病状、指甲病状、癌症、一种类型的关节炎、非酒精性脂肪性肝病、非酒精性脂肪性肝炎、肝硬化、特发性肺纤维化、肌肉减少症、神经系统病状、阿尔茨海默氏病或痴呆,或者所述疾病或病状与衰老、复制活性不足或不平衡、分泌表型改变、神经元信号传导改变、异常免疫活性、未分化的细胞状态或癌性相关。
在一些情况下,生物实体可以是类器官。在一些方面,类器官是健康或疾病的模型。本文所设想的类器官的非限制性实例包含脑类器官、肝类器官、胰腺类器官等。
在一些方面,生物实体包括动物。在一些方面,所述动物是健康或疾病的模型。在一些方面,动物模型是哺乳动物、灵长类动物、啮齿动物、小鼠、大鼠、兔、猪、狗、猫或猴。在一些方面,动物是人源化动物或人源化哺乳动物。在一些方面,动物被表征为具有或是本文锁公开的疾病或病状的模型的动物。在一些方面,所述动物是小鼠或被表征为具有或作为本文所公开的疾病或病状的模型的小鼠,例如,年龄相关的疾病或病状、肝病或病状、代谢性疾病、心血管疾病、神经退行性疾病或病状、眼病或病状、退行性疾病或病状、炎性病状、纤维化病状、免疫性病状、皮肤或毛发病状、癌症、一种类型的关节炎、非酒精性脂肪性肝病、非酒精性脂肪性肝炎、肝硬化、特发性肺纤维化、肌肉减少症、神经系统病状、阿尔茨海默氏病或痴呆,或与衰老、复制活性不足或不平衡、分泌表型改变、神经元信号传导改变、异常免疫活性、未分化的细胞状态或癌性相关的疾病或病状。一些动物模型可以患有或可以被表征为患有多于一种的疾病或病状。一些动物模型可以患有或可以被表征为患有比人疾病或病状更严重、更不严重或大约相同严重程度的疾病。
动物可能患有疾病或病状,或可以易患疾病或病状,或易感疾病或病状,或可以是明显健康的。在一些方面,动物可以是疾病或病状的模型,或者可以是倾向于发展疾病或病状的模型,或者可以是易于感染疾病或病状的模型,或者可以是明显健康的模型。在一些方面,明显健康的动物或明显健康的模型可以没有疾病或病状,没有若干种疾病或病状或没有所有疾病和病状。一些动物模型可以对疾病其整体进行建模,并且一些动物模型可以对疾病的一部分进行建模。
动物模型可以随着动物年龄或生长而发生表型变化。在一些方面,动物模型可以是基因修饰的动物。在一些方面,动物模型可以通过特殊的饮食、水或空气源饲养或维持。一些动物模型可以是无菌的。一些动物模型可以施用毒素、载体、药物或其它部分以诱导疾病或健康状态。一些动物模型可以是野生型。在一些方面,动物模型可以是基因修饰的。
健康和疾病的保守的模型不仅可以分析单独受影响的基因,还可以分析与健康和疾病状态不同的共调控的基因的模块。这可以实现一致的比较分析,例如在单细胞数据中。在一些方面,健康和疾病的保守的模型可以用于比较关于疾病病因的现有假设中的已鉴定的簇,所述假设可以基于基因本体论,并且任选地,将共表达与组织样品中的疾病病理学的强度相关联。
例如,对于保守的疾病模型中的疾病,考虑图3中具有簇A、B和X的基因的网络。在此情况下,基因A可以与在疾病中上调的一大组基因共表达(簇A,虚线圆圈),并且基因B可以与在疾病中下调的一大组基因共表达(簇B,实线)。在此实例中,基因A和基因B,以及簇A和簇B具有同样在人疾病中共表达的直系同源物。在此实例中,基因A或基因B可以是疾病的潜在靶标。在此情况下,还可以观察到簇X。经过分析,可以明显看出簇X在疾病的小鼠模型中共表达,但在人疾病中不表达。在此情况下,可以忽略簇X。健康和疾病的模型可以为药物发现提供系统级框架。例如,癫痫的模型中的分析可以将Csf1R鉴定为潜在的抗癫痫药物靶标。
生物实体可以包括如本文所公开的治疗部分的文库。生物实体可以是本文所描述的疾病或病状的模型或处于所述疾病或病状的风险中的模型。在一些方面,生物实体是动物。在一些方面,动物可以是哺乳动物、人源化疾病模型或小鼠。生物实体可以表达治疗部分、报告基因或两者,或者动物可以是一个或多个表达盒的载剂而不表达其中的基因。
本公开中进一步提供了生物实体,所述生物实体可以包括如本文所描述的治疗部分的文库。包括本文所描述的治疗部分的文库的生物实体可以是健康的或患病的。包括治疗部分的文库的生物实体可以已被施用了表达盒的文库,每个所述表达盒包括编码不同治疗部分的核酸序列。
表达治疗部分的文库的生物实体可以已通过局部注射或全身注射或输注施用了表达盒的文库。本文的注射可以是静脉内注射、肌内注射、眼内注射、关节内注射、玻璃体内注射、视网膜内注射、腹膜内注射、肝内注射、皮下注射、皮内注射、硬膜外注射、淋巴结注射、心内注射或任何其它类型的注射。
表达治疗部分的文库的生物实体可以被施用至少约10个、50个、100个、500个、1000个或更多个不同的表达盒。表达治疗部分的文库的生物实体可以已被施用了多个表达盒,其中一些或所有表达盒包括编码与文库中其它表达盒不同治疗部分的核酸序列。表达治疗部分的文库的生物实体可以已被施用了多个表达盒,其中一些或所有表达盒包括与文库中的其它表达盒的治疗部分条形码不同治疗部分条形码。治疗部分条形码可以与编码非编码核RNA保留基序的一个或多个序列可操作地连接。表达治疗部分的文库的生物实体可以已被施用了多个表达盒,每个所述表达盒包括编码不同治疗部分的核酸序列。表达治疗部分的文库的生物实体可以已被施用了多个表达盒,每个所述表达盒包括不同治疗部分条形码,所述治疗部分条形码可以与编码非编码核RNA保留基序的一个或多个序列可操作地连接。
在一些情况下,表达治疗部分的文库的生物实体可以是动物。动物可以是人或非人。非人类动物可以是小鼠、大鼠、土拨鼠、青蛙、兔、豚鼠、仓鼠、猪、猴、马、松鼠、果蝇、线虫、狗或猫。在一些情况下,表达治疗部分的文库的生物实体可以是组织、类器官、细胞或细胞的群体。
在非限制性实例中,在可以包括5只至10只小鼠的一组小鼠中,可以通过局部注射将表达盒的病毒文库(每个所述表达盒包括编码不同治疗部分(例如,RNAi)的核酸序列)和包括编码一个或多个报告基因的核酸序列的表达盒递送到患病组织。对照小鼠可以注射缺乏RNAi治疗部分的构建体或乱序的RNAi,以消除报告基因影响。可以对采集的细胞进行荧光分选,如荧光激活的细胞分选(FACS),以捕获其中疾病报告基因类似于健康状态的细胞,从而富集待测序的群体以鉴定有效的治疗部分。丢弃的细胞可以包括未感染的细胞,所述未感染的细胞可以被消极鉴定为不显示荧光的细胞,以及显示未改变/恶化的疾病状态或另一错误报告基因状态的细胞。
在另一个非限制性实例中,骨关节炎的小鼠模型可以在表达盒的文库的关节囊中接受注射,所述表达盒包括编码不同治疗部分的核酸序列,所述不同治疗部分可以改善骨关节炎。可以处死小鼠,并且可以采集关节囊组织,并且可以对采集的细胞进行FACS。在一些方面,最小化从处死到测序的时间可以减少来自对离体环境的应答的噪音。
在另一个非限制性实例中,包括编码不同治疗部分的核酸序列的表达盒的腺相关病毒(AAV)文库可以注射到胶质母细胞瘤的小鼠模型中。注射可以直接注射到原发性肿瘤,或是静脉内注射,使文库可以到达转移瘤。将构建体递送到小鼠后,可以提取和鉴定期望的类型的细胞(癌性、非癌性、转移性、治愈的等)。
在一些方面,可以捕获与所关注的其它报告基因状态相匹配的细胞,以获得关于疾病生物学的另外的信息。来自治疗部分的分析的候选可以转移到功效和安全性的临床前测试。在一些方面,基因治疗部分和表达盒可以与临床开发相容。在一些方面,文库可以包括命中,其中命中可以包含一个或多个治疗部分,所述一个或多个治疗部分可以在模型中引发治疗应答。在一些方面,用文库交换单个治疗部分,或消除一个或多个报告基因可以增加与临床开发的相容性。在一些方面,用文库交换单个治疗部分并消除报告基因可以增加与临床开发的相容性。在一些方面,递送、启动子强度或特异性或其组合可以针对临床开发进行优化。在一些方面,命中可以通过其它模式被靶向。例如,其它模式可以包含CRISPRi、CRISPRa、小分子或生物化合物的新型筛选或药物再利用。治疗部分的分析可以是转录组学、代谢组学、蛋白质组学、表观遗传组学、蛋白质基因组学、免疫蛋白质组学、药物基因组学或核小体组学分析,或其任何组合。
在另一个非限制性实例中,可以优化病毒滴度,以高覆盖患病组织,并且限制感染的多样性。可以评估相关临床前结果。相关临床前结果的实例可以包含骨关节炎模型中关节软骨结构的运动范围和改善的组织学评分。在一些方面,可以评估AAV或其它载体的免疫原性或其它安全性问题。本文提供的一些方法可以通过鉴定候选治疗部分来发现复杂疾病的基因治愈、治疗或疗法,包含进行性疾病或年龄相关的疾病。一些方法可以鉴定疾病或病状的候选治疗部分,所述疾病或病状包括生理学的广泛下降、不太清楚的机制或各种细胞或组织的多种相互关联的功能障碍。
本文的疾病或病状可以包括其中其细胞外环境随空间或时间变化而影响所述疾病或病状的疾病或病状,包含其中恢复细胞外环境可以治疗所述疾病或病状的疾病或病状。一些方法可以为包括一个或多个细胞或组织的一种或多种功能障碍的疾病或病状提供候选治疗部分。在一些方面,功能障碍包括改变的细胞间通讯、基因组不稳定、端粒损耗、表观遗传学改变、蛋白稳态的丧失、失调的营养感知、线粒体功能障碍、细胞衰老或干细胞衰竭。
在一些方面,通过局部注射,例如在所关注的器官或组织中注射,将一个或多个文库施用于本公开的生物实体。在一些方面,本公开的一个或多个文库是通过注射或输注施用的。
报告基因设计
本文所提供的方法可以包括在保守的细胞状态模型内设计细胞状态的一个或多个报告基因。报告基因可以是积极报告基因或消极报告基因。当从表达盒表达的治疗部分具有积极作用、没有作用或具有消极作用时,可以转录报告基因。一些报告基因可以与一个或多个增强子或报告基因或一个或多个另外的报告基因可操作地连接。
报告基因可以能够分化癌细胞和非癌细胞。在一些方面,包括一个或多个报告基因的文库能够在2种、3种、4种、5种、6种、7种、8种、9种、10种或更多种细胞状态之间进行分化。此类分化可以包括检测或测量以下中的变化或差异:细胞参数、细胞活性或功能、细胞生理学、细胞大小、细胞形态、细胞形状、细胞标志物、细胞密度、转录组学谱、蛋白质组学谱、代谢组学谱、表观遗传组学谱、蛋白质基因组学谱、免疫蛋白质组学谱、药物基因组学谱或核小体组学谱或其任何组合。
报告基因可以用于鉴定已受治疗部分影响的细胞。在一些方面,报告基因和治疗部分可以从相同的表达盒或从不同的表达盒表达。在一些方面,表达盒可以编码多于一个报告基因。
表达盒可以包括与编码一个或多个报告基因的核酸序列可操作地连接的启动子,其中报告基因的表达允许鉴定细胞的细胞状态的可能性的基于单细胞的方法。在一些方面,一个或多个报告基因指示细胞状态的变化。在一些方面,一个或多个报告基因允许富集、分选、分离或纯化具有相同细胞状态的细胞的群体,如报告基因所指示的。
表达盒可以包括驱动报告基因的表达的启动子。报告基因构建体可以进一步包括两个或更多个启动子,其中所述两个或更多个启动子可以相同或不同。启动子可以是已知在细胞状态中下调或上调的基因的同源启动子。同源启动子可以是多于一个启动子的相互作用集合。多于一个启动子的激活或失活可以诱导报告基因的转录。在一些方面,当细胞状态特异性启动子用于驱动报告基因(如可检测蛋白)的表达时,报告基因的表达指示细胞状态的变化。在此类方面,报告基因的表达指示启动子对其具有特异性或应答性的细胞状态的可能性。
报告基因可以与启动子连接。在一些方面,不同的报告基因可以与同一启动子,或者与不同的启动子连接。启动子可以是含有能够启动报告基因的转录的遗传材料的表达盒的区。在一些方面,报告基因可以与多于一个启动子连接。在一些方面,启动子可以进一步包括增强子。增强子可以是含有遗传材料的表达盒的区,所述遗传材料可以增加报告基因的转录的可能性。在一些方面,增强子可以增加与蛋白质(例如,激活剂)相互作用时转录的可能性。
报告基因可以包括荧光蛋白。例如,细胞状态报告基因可以包括常见的荧光蛋白、绿色荧光蛋白(GFP)和/或红色荧光蛋白(RFP)。在一些方面,荧光报告基因可以帮助鉴定含有治疗部分的细胞。在一些方面,来自所述荧光蛋白的荧光信号可以与细胞状态或从一种细胞状态到第二细胞状态的变化的可能性相关。
报告基因可以是选择标志物、可检测蛋白、细胞表面标志物、药物敏感元件、诱导型元件或荧光蛋白。一些报告基因可以包括两个或更多个报告基因。在具有两个或更多个报告基因的方面,每个报告基因中可以是不同的可检测蛋白、不同的选择标志物、不同的荧光蛋白或不同的细胞表面标志物,或其任何组合。
报告基因可以是健康状况或状态、疾病、衰老、细胞凋亡或其它细胞状态的报告基因。在一些方面,细胞状态报告基因可以指示疾病或健康状况良好的可能性。在一些方面,细胞状态报告基因可以证实疾病或健康状况良好。在一些方面,细胞状态报告基因可以指示细胞状态与疾病或健康之间的相关性。
细胞状态可以是疾病或病状。在一些方面,所述疾病或所述病状是但不限于年龄相关的疾病或病状、肝病或病状、代谢性疾病、心血管疾病、神经退行性疾病或病状、眼病或病状、退行性疾病或病状、炎性病状、纤维化病状、免疫病状、皮肤或毛发病状、癌症、一种类型的关节炎、非酒精性脂肪性肝病、非酒精性脂肪性肝炎、肝硬化、特发性肺纤维化、肌肉减少症、神经系统病状、阿尔茨海默氏病或痴呆。在一些方面,所述疾病或所述病状与衰老、复制活性不足或不平衡、分泌表型改变、神经元信号传导改变、异常免疫活性、未分化的细胞状态或癌性相关。
细胞状态可以是但不限于患病细胞状态、非患病细胞状态、健康细胞状态、正常细胞状态、异常细胞状态、衰老细胞状态、转移性状态、非转移性状态、凋亡细胞状态、非凋亡细胞状态、感染性细胞状态、非感染性细胞状态、癌细胞状态或非癌细胞状态、增生性状态、非增生性状态、多能状态、分化的细胞状态、增殖细胞状态、非增殖细胞状态、失调细胞状态、调控的细胞状态、免疫反应状态、非免疫反应状态、分裂细胞状态、静止细胞状态、癌细胞状态或非癌细胞状态。
报告基因蛋白的非限制性实例在图4中示出。弧表示报告基因构建体的线性结构,并且包括启动子(左部分)和荧光蛋白(右部分)。示出的蛋白质结构是荧光蛋白,所述荧光蛋白可以在本文所描述的文库中用作报告基因。
在一些方面,报告基因是能够在变化时产生荧光或可检测信号的荧光蛋白。在一些方面,荧光信号指示一种细胞状态,例如,疾病细胞状态。在一些方面,荧光信号指示第二细胞状态,例如,正常细胞状态。在一些方面,荧光信号的变化或来自不同报告基因蛋白的荧光信号的比率可以用于指示细胞状态的变化。
一个或多个报告基因的细胞状态的变化或荧光信号的变化可以用于基于不同细胞状态之间的以下中的变化确定治疗指数:细胞参数、细胞活性或功能、细胞生理学、细胞大小、细胞形态、细胞形状、细胞标志物或细胞密度、转录组学谱、蛋白质组学谱、代谢组学谱、表观遗传组学谱、蛋白质基因组学谱、免疫蛋白质组学谱、药物基因组学谱、核小体组学谱或其任何组合。在一些方面,不同报告基因或不同荧光蛋白之间的比率或在细胞的群体中表达的报告基因的量与治疗指数相关,所述治疗指数指示由在所述细胞中表达的治疗部分产生的治疗作用。
报告基因可以通过其存在或不存在、绝对值、相对值、归一化的值或分箱值来检测。在一些方面,报告基因的存在可以指示健康。在一些方面,报告基因的存在可以指示疾病或异常细胞状态。给定细胞状态的报告基因值可以包括单个值、窄范围的值或宽范围的值。给定细胞状态的报告基因值可以基于所使用的报告基因分子而变化。在一些方面,报告基因包括任何可检测标志物,例如,荧光蛋白或细胞表面标志物。在一些方面,报告基因包括药物敏感元件或诱导型转录元件。在一些方面,报告基因可以是允许对包括产生治疗作用的治疗部分的细胞进行分选或富集的任何标志物或元件。在一些方面,报告基因可以是允许对具有相同或相似细胞状态的细胞或具有由治疗部分引起的相同扰动或变化的细胞进行分选或富集的任何标志物或元件。
在一些方面,细胞的群体中报告基因的量、计数或值大于随机分布可以指示细胞的群体中细胞状态的可能性。在一些方面,大于随机的分布可以在统计学上是显著的。在一些方面,统计学显著可以包括等于或小于0.1、0.09、0.08、0.07、0.06、0.05、0.04、0.03、0.02、0.01、0.001、0.0001、0.00001或更小的p值。
在一些方面,编码报告基因的核酸序列可以是一系列大小。报告基因的大小可以小于4000个、3500个、3000个、2500个、2000个、1500个、1400个、1300个、1200个、1100个、1000个、900个、800个、700个、600个、500个、400个、300个、200个或100个碱基对。与报告基因的表达连接的启动子也可以是一系列大小的。在一些方面,每个报告基因的大小可以介于700个与1000个碱基对之间或介于1000个与2000个碱基对之间。在一些方面,启动子的大小可以不超过100个、150个、200个、250个、300个、350个、400个、450个或500个碱基对。
报告基因的表达可以与诱导型转录元件可操作地连接,所述诱导型转录元件可以响应于转录因子或与转录因子连接,其中所述转录因子可以包括一个或多个治疗部分,或者其中所述报告基因的表达与所述治疗部分的表达连接。诱导型转录元件可以是cre-loxP系统、粘病毒抗性1启动子、雌激素受体、光遗传学、蜕皮激素诱导性、Gal4/UAS或四环素(tetracyclin)关闭/打开系统的转录元件。在一些方面,诱导型转录元件可以允许控制基因表达水平、激活的时间或空间控制或细胞基因剂量/应答作用的分析。在一些方面,控制基因表达水平可以防止一些基因产物对细胞的毒性作用。在一些方面,诱导型转录元件可以防止报告基因的表达的泄漏。
在一些方面,一个或多个报告基因的表达可以与和治疗部分相关的转录诱导剂或转录激活剂可操作地连接,使得所述治疗部分的表达诱导或激活所述报告基因的表达。
在一些方面,报告基因的检测可以允许不同细胞状态之间的分化。例如,如果细胞中表达的报告基因与和阿尔茨海默氏病相关的启动子连接,则所述细胞可以具有或是阿尔茨海默氏病的模型。报告基因可以允许检测患有疾病或病状的细胞或缺乏疾病或病状的细胞。分化可以在患病细胞状态与健康细胞状态之间,或者在异常细胞状态与正常细胞状态之间。细胞状态之间的分化可以包括由细胞中的治疗部分的表达产生的以下中的变化:细胞参数、细胞活性或功能、细胞生理学、细胞大小、细胞形态、细胞形状、细胞标志物、细胞密度、转录组学谱、蛋白质组学谱、代谢组学谱、表观遗传组学谱、蛋白质基因组学谱、免疫蛋白质组学谱、药物基因组学谱或其任何组合。
具有报告基因和治疗部分两者的表达盒
本公开提供了包括多个表达盒的文库,每个所述表达盒包括编码不同治疗部分的核酸序列。在一些方面,表达盒的文库可以被引入、维持、繁殖或施用于生物实体。在一些方面,表达盒的文库可以在细胞或细胞的群体、细胞系或宿主细胞中繁殖。
一些文库可以包括多个表达盒。在一些方面,所述多个表达盒包括多个不同的表达盒。在一些方面,每个表达盒包括编码不同治疗部分的核酸序列。在一些方面,文库中的每个治疗部分与治疗部分条形码可操作地连接。在一些方面,每个治疗部分可以进一步与一个或多个报告基因可操作地连接,所述一个或多个报告基因共同指示细胞状态的可能性。在一些方面,包括一个或多个报告基因的文库可以共同将一种细胞状态与另一种细胞状态分化,如患病细胞与非患病细胞状态。
文库可以包括能够在细胞状态之间分化的一个或多个报告基因。在一些方面,两种不同细胞状态之间的此类分化可以在患病细胞与健康细胞之间,或者在异常细胞与正常细胞之间。
在一些方面,包括多个治疗部分的文库进一步包括一个或多个报告基因,所述一个或多个报告基因能够以至少约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%的准确度在细胞状态之间进行分化。一些报告基因可以以至少约约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%的准确度在细胞状态之间进行分化。
细胞状态之间的分化可以通过多种手段实现。可以为特定的报告基因、治疗部分条形码或模型选择细胞状态之间的分化手段。在一些方面,细胞状态之间的分化的基础可以包括以下中的变化:细胞参数、细胞活性或功能、细胞生理学、细胞大小、细胞形态、细胞形状、细胞标志物、细胞密度、转录组学谱、蛋白质组学谱、代谢组学谱、表观遗传组学谱、蛋白质基因组学谱、免疫蛋白质组学谱、药物基因组学谱或核小体组学谱或其任何组合。在一些方面,分化的基础可以由细胞中的治疗部分产生。分化可以包括细胞活性或功能的变化,其包含但不限于转染、转录、复制、蛋白质表达、表观遗传修饰、细胞标志物表达、与外源性分子的相互作用或其任何组合。
在一些方面,包括多个表达盒的文库进一步包括编码一个或多个报告基因的核酸序列。在一些方面,表达盒进一步包括与报告基因可操作地连接的启动子。在一些方面,报告基因进一步包括增强子或阻遏子。
在一些方面,表达盒的文库编码多个治疗部分,所述多个治疗部分与同一表达盒中的报告基因没有物理连接。在一些方面,表达盒的文库包括多个表达盒,其中每个表达盒编码治疗部分和报告基因。在一些方面,报告基因在与治疗部分不同的表达盒上编码,或者相对于治疗部分反式定位。在一些方面,报告基因相对于治疗部分顺式定位。在一些方面,报告基因在与治疗部分相同的表达盒上编码。在一些方面,治疗部分的表达以反式或顺式与报告基因的表达连接。在一些方面,报告基因的表达指示治疗部分的表达。在一些方面,治疗部分的表达引起转录因子的表达,所述转录因子激活反式或顺式报告基因的转录。
在一些方面,将编码多个治疗部分的表达盒的文库与编码多个不同报告基因的表达盒的第二文库汇集或混合。在一些方面,表达盒的文库包括编码多个不同治疗部分和一个或多个报告基因的表达盒。在一些方面,表达盒的文库包括用于文库中的所有表达盒的相同报告基因(例如,GFP),使得生物实体的每个细胞表达相同的报告基因。在一些方面,可以汇集不同的文库。
文库的非限制性实例可以包含插入体内表达构建体中的多重RNAi文库,其编码疾病特征基因的报告基因,其中所述表达构建体包括与编码荧光蛋白(如EGFP)的核酸序列可操作地连接的启动子。在一些方面,RNAi文库可以含有100s或1000s的RNAi治疗部分。每个治疗部分可以与治疗部分条形码配对或连接,所述治疗部分条形码可以在测序之前或期间扩增,以允许使用测序进行鉴定。治疗部分条形码可以与编码非编码核保留RNA基序的一个或多个序列可操作地连接,并且鉴定可以包含例如单细胞核测序。
包括表达盒的载体的非限制性示例示意图在图5A-5D中呈现。在这些实例中,编码治疗部分的核酸序列和编码报告基因的核酸序列位于同一表达载体内。报告基因可以在第一启动子(例如,Pol II启动子)的控制下,并且治疗部分(例如,shRNA)可以在第二启动子(例如,Pol III启动子)的控制下。载体可以进一步包含第三、第四、第五或更多个启动子。例如,载体可以包含两个或更多个pol III启动子,如图5C所描绘的。pol III启动子可以是相同或不同的启动子。载体可以进一步包含治疗部分条形码和聚腺苷酸化序列。治疗部分条形码可以与编码非编码核保留RNA基序的一个或多个序列可操作地连接,例如,如图5B-5D所描绘的。在一些方面,表达盒的文库包括多个载体(如图5A-5D所描绘的载体),其中每个载体包括不同治疗部分。在一些方面,表达盒的文库包括多种病毒、病毒颗粒或病毒载体。在一些方面,病毒载体是腺相关病毒(AAV)、腺病毒或慢病毒。在一些方面,表达盒的文库包括多个病毒,每个病毒衣壳化载体,所述载体包括由载体中的核酸序列编码的治疗部分。在一些方面,此类编码治疗部分的核酸序列与启动子可操作地连接。在一些方面,此类载体进一步包括在报告基因启动子的控制下编码可检测蛋白报告基因的序列,如荧光蛋白报告基因。在一些方面,驱动治疗部分的表达的相同启动子也可以驱动报告基因蛋白的表达。
候选治疗部分可以是基因疗法或其它疗法。候选治疗部分可以包括一个或多个治疗部分。编码候选治疗部分的表达盒可以包装成如本文所描述的病毒载体或非病毒载体。
治疗部分可以用于基因疗法。在一些情况下,治疗部分可以是但不限于DNA或RNA序列、shRNA、siRNA、miRNA、反义寡核苷酸、吗啉代、蛋白质降解标签、治疗转基因或治疗转基因的产物(例如,治疗蛋白质)、基因编辑复合物、Cas融合蛋白、CRISPRi、CRISPRa、RNA编辑元件、RNA剪接的调控元件、RNA降解元件或表观遗传修饰元件。在一些情况下,治疗部分可以包括多于一个治疗部分。在一些情况下,多于一个治疗部分可以在同一表达盒上编码。在一些情况下,多于一个治疗部分可以在不同的表达盒上编码。在一些情况下,治疗部分可以是蛋白质。在一些情况下,治疗部分可以包括非编码遗传材料。在一些情况下,治疗部分可以包括编码和非编码遗传材料两者。
治疗部分可以基于疾病或病状的转录组学特征进行工程化。在一些方法中,可以基于机器学习方法、统计方法、神经网络、差异共表达网络、相互作用网络、聚类或基因集分析对治疗部分进行工程化。在一些方面,转录组学特征可以进一步包括与疾病状态相关的共调控的基因的模块的神经网络。在一些方面,可以使用机器学习方法、统计方法、神经网络、差异共表达网络、相互作用网络、聚类或基因集分析来修饰从体内筛选中鉴定的一个或多个治疗部分。
在一些方面,编码治疗部分的核酸序列和编码报告基因的核酸序列可以包装在同一载体中。在一些方面,编码治疗部分的核酸序列和编码报告基因的核酸序列可以包装在单独的载体中。当编码治疗部分的序列和编码报告基因的序列被包装在单独的载体中时,报告基因转录可以依赖于治疗部分的转录。在一些方面,在引入生物实体用于体内筛选之前,将不同的载体汇集或混合在一起。
在一些方面,所述载体可以是AAV载体。在一些方面,可以选择或开发具有感染所关注的细胞类型的已知能力的AAV血清型。在一个实例中,可以将不同强度的三个启动子(具有增加细胞类型特异性的增强子)加上RNAi治疗部分的文库插入AAV构建体中。还可以插入到构建体中的是荧光蛋白基因和报告基因启动子。在一些方面,荧光蛋白基因可以是约700个碱基对。在一些方面,报告基因启动子可以是约300个碱基对。在一些方面,荧光报告基因和报告基因启动子一起可以包括AAV构建体的容量的约一半。
在一些方面,表达盒可以包括条形码或编码条形码的核酸序列。在一些方面,条形码可以是核酸条形码,如DNA条形码或RNA条形码。在一些方面,条形码可以包括多个核苷酸碱基。在一些方面,条形码可以是包括至少约2个、3个、4个、5个、6个、7个、8个、9个或10个碱基的核酸序列。在一些方面,表达盒中的每个条形码与其它表达盒中其它条形码相比是独特的。每个独特条形码可以与其它独特条形码相差至少约1个、2个、3个、4个、5个、6个、7个、8个、9个或10个碱基。一些条形码中的一部分碱基可以是所有表达盒所共有的。一些条形码中的一部分碱基可以是一些表达盒所共有的。一些条形码中的一部分碱基对于每个表达盒可以是独特的。一些条形码中的一部分碱基对于表达盒可以是独特的。一些条形码中的所有碱基对于每个表达盒可以是独特的。一些表达盒可以具有一个条形码。一些表达盒可以具有多于一个条形码。如本文所描述的一些条形码可以与文库中的多个表达盒上的治疗部分(例如,治疗部分条形码)连接。如本文所描述的一些条形码可以与编码非编码核保留RNA基序的一个或多个序列连接。
在一些方面,条形码是治疗部分条形码。在一些方面,治疗部分条形码的转录可以与治疗部分的转录连接。治疗部分条形码可以包含在治疗部分的开放阅读框中或不包含在开放阅读框中。在一些方面,治疗部分条形码可以与治疗部分直接附接。在一些方面,治疗部分条形码不与治疗部分直接附接。在一些情况下,治疗部分条形码可以从与治疗部分相同的表达盒表达,并且可以在相同启动子或不同启动子的控制下。治疗部分条形码的转录物和治疗部分的转录物可以是单独的转录物或单个转录物。治疗部分条形码的转录物可以包含编码非编码核保留RNA基序的一个或多个序列。非编码核保留RNA基序可以将编码治疗部分条形码的转录物引导到细胞核,从而增加细胞核中的治疗部分条形码的有效浓度。增加细胞核中的治疗部分条形码的有效浓度可以减少单细胞核测序应用中捕获的随机失败,例如,如图9所描绘的。在一些方面,表达盒的其它组分可以与治疗部分、治疗部分条形码或两者的转录连接。通常,治疗部分条形码在与治疗部分相同的细胞中表达,从而可以鉴定治疗部分。
在一些方面,治疗部分条形码可以含有特定元件,所述特定元件在测序之前或期间促进或允许其扩增(例如,通过PCR),以增加测序期间的读段数量或其它方法中的信号强度。在一些方面,当报告基因和治疗部分在单独的表达盒上编码时,表达盒中的每一个可以包括条形码(例如,治疗部分条形码和报告基因条形码)。在一些情况下,报告基因条形码和治疗部分条形码可以是不同的。在一些方面,报告基因条形码和治疗部分条形码可以是相同的。本文所描述的治疗部分条形码和报告基因条形码可以与编码非编码核保留RNA基序的一个或多个序列连接。
在一些情况下,治疗部分条形码对于每个治疗部分可以独特的。换言之,每个治疗部分可以与其自身独特的治疗部分条形码相关联,使得可以通过鉴定治疗部分条形码来确定治疗部分的同一性。在其它情况下,治疗部分条形码对于每个类别或类型的治疗部分可以是独特的。换言之,每个类别或类型的治疗部分可以与其自身独特的治疗部分条形码相关联,使得可以通过鉴定治疗部分条形码来确定治疗部分的类别或类型。治疗部分条形码可以是核酸条形码(例如,DNA或RNA条形码)。治疗部分条形码可以包括多个核苷酸碱基。治疗部分条形码可以是包括至少约2个、3个、4个、5个、6个、7个、8个、9个或10个碱基的核酸序列。每个独特的治疗部分条形码可以与其它独特的治疗部分条形码相差至少约1个、2个、3个、4个、5个、6个、7个、8个、9个或10个碱基。一些治疗部分条形码中的一部分碱基可以是所有治疗部分所共有的,例如,以允许扩增。一些治疗部分条形码中的一部分碱基可以是一些治疗部分所共有的。一些治疗部分条形码中的一部分碱基对于每个治疗部分可以是独特的。一些治疗部分条形码中的一部分碱基对于对应的治疗部分可以是独特的。一些治疗部分条形码中的所有碱基对于每个治疗部分可以是独特的。本文所描述的任何治疗部分条形码可以与编码非编码核保留RNA基序的一个或多个序列连接。
任何机器学习技术和/或统计方法都可以用于鉴定本文所公开的文库中使用的候选治疗部分。在一些方面,使用机器学习技术和/或统计方法来优化先前筛选的治疗部分。机器学习技术和/或统计方法可以包括与疾病状态相关的共调控的基因的模块的神经网络。在一些方面,机器学习技术和/或统计方法包括神经网络、差异共表达网络、相互作用网络、聚类或基因集分析,以修饰从体内筛选中鉴定的治疗部分。在一些方面,包括共表达模块的特征基因网络用于鉴定候选治疗部分和/或优化本文所公开的治疗部分。
数据可以成为疾病状态的全基因组共表达图谱的一部分。可以使用来自每个扰动的转录组作为主要输入,并且使用基因本体论或其它公共数据作为次要输入来收集此数据。这可以允许机器学习在体内预测治疗部分或治疗部分的组合的作用。
从包括给定疾病和细胞类型中的特征模块的特征基因列表中可以选择具有启动子区的现有知识的基因。启动子区的这种知识可以加速优化。这些基因的启动子可以与荧光蛋白融合。
本文所描述的方法可以通过存储在计算机系统的电子存储位置上的机器(例如,计算机处理器)可执行代码来实现。机器可执行代码或机器可读代码可以以软件的形式提供。使用期间,代码可以由处理器执行。在一些方面,可以从存储单元检索代码并将其存储在存储器单元上以供处理器随时访问。在一些情况下,可以排除电子存储单元,并且可以将机器可执行指令存储在存储器单元上。
对于特定疾病和细胞类型,可以存在基因模块,所述基因模块是高度连接的基因组,并且可以提供生物学见解,所述生物学见解可以类似于本文所描述的簇。在一些实施例中,基因模块可以表示为特征基因的列表。
可以包括加权基因共表达网络分析的生物信息学分析可以提供给定疾病和细胞类型中特征模块的特征基因的列表,其中特征基因可以是标准化模块表达数据的最佳总结。给定模块的模块特征基因可以定义为标准化的表达谱的第一主成分。模块特征基因可以用于将模块与临床特征相关联。例如,特征基因可以定义稳健的生物标志物。
特征基因可以用作更复杂的预测模块中的特征,包含决策树和贝叶斯网络(Bayesian networks)。可以构建模块特征基因之间的网络(特征基因网络,或者其节点可以是模块的网络)。基因可以与特征基因相关,以鉴定给定模块内的模块内枢纽基因。相对于模块基因的邻接的总和可以用于从特征基因中确定,以鉴定给定模块内的模块内枢纽基因。网络统计可以用于测试模块是否保留在另一个数据集中。
例如,可以组装单细胞和基因表达网络,并且可以在测序数据中鉴定如本文所描述的治疗部分条形码。可以针对每个靶标对多个RNA进行分组。可以通过转录组相对于健康和患病对照细胞的加权比较,例如通过差异表达分析来评估每种基因扰动的功效。在一些方面,差异表达分析可以包括执行统计分析以发现实验组之间表达水平的定量变化。在一些方面,差异表达分析包括计算可以分化健康细胞和患病细胞的特征基因。
例如,如图6所展示的,特征基因1和特征基因2代表包括共表达模块的两个组:健康和患病的。每个点对应一个RNAi,其可以与健康细胞或患病细胞相关联。在一些方面,机器学习技术可以允许预测在施用如本文所描述的作为表达盒的一部分的治疗时哪些RNAi值可以变化。
作为实例,此方法可以用于预测和验证I型糖尿病的疾病状态的有效报告基因。可以分析来自1型糖尿病疾病模型的转录组学数据。这些报告基因可以被递送到小鼠的肝脏,所述小鼠可以是I型糖尿病的疾病的保守的模型。可以测量这些小鼠在施用已知的、有效的治疗剂(例如胰岛素)后的行为。
载体文库可以与治疗部分的报告基因汇集。可以将含有不同治疗部分的载体收集到单个文库中。如本文所描述的,文库的大小可以变化。载体文库内的载体可以都具有相同的报告基因,或可以具有不同的报告基因或可以具有含有不同的启动子或增强子的相同的报告基因。文库可以包括一种类型的载体或多于一种类型的载体。
在一些文库中,多个表达盒可以包括至少约10个、100个、500个或1000个不同的表达盒。一些文库可以包括多于1000个不同的表达盒。在一些文库中,每个不同的表达盒可以包括不同治疗部分。在一些文库中,多个表达盒可以包括至少约10个、100个、500个或1000个不同治疗部分。一些文库可以包括多于1000个不同治疗部分。
在一些文库中,表达盒可以包装在载体中。载体可以有若干种类型,通过若干种策略递送,并且以各种调配物调配。载体可以是病毒载体或非病毒载体。病毒载体可以是腺相关病毒(AAV)、逆转录病毒、腺病毒或慢病毒。非病毒载体可以是线性载体、质粒、基于聚合物的载体、转座子或人工染色体。
在一些方面,非病毒载体可以作为纳米颗粒、脂质纳米颗粒、RNA纳米颗粒或外泌体递送。非病毒载体可以使用物理方法、针、弹道DNA、电穿孔、声孔效应、光致穿孔、磁转染或水穿孔调配用于递送。非病毒载体可以被调配成与化学载剂、无机颗粒、金属纳米颗粒、磁性纳米颗粒、脂质、脂质纳米颗粒、肽、聚合物、聚乙烯亚胺(PEI)、壳聚糖、聚酯、树枝状聚合物或聚甲基丙烯酸酯一起递送。
在一些方面,可以采用一种或多种化学方法来增强载体的递送,所述化学方法包括寡核苷酸、脂质复合物、聚合物囊泡、多聚复合物、树枝状聚合物、无机纳米颗粒或细胞穿透肽。在一些方面,病毒载体可以作为裸DNA进行转染。在一些方面,两种或更多种转染方法可以组合为转染的杂合方法。例如,包括具有灭活的病毒的脂质体的病毒颗粒可以用于转染。转染的杂合方法的其它实例可以包括阳离子脂质/病毒杂合体或杂合病毒/病毒杂合体。在一些方面,可以优化转染以增加转染水平或表达水平。
在一些方面,编码治疗部分的表达盒和编码报告基因的表达盒可以包装在同一载体中或单独的载体中。当编码治疗部分的表达盒和编码报告基因的表达盒被包装在单独的载体中时,报告基因转录可以依赖于治疗部分转录。
在一些方面,表达载体用于通过转染或转导将核酸分子递送到靶细胞。在一些方面,载体包括表达盒。
载体可以是整合或非整合载体,这是指载体将表达盒或转基因整合到宿主细胞的基因组中的能力。表达载体的实例包含但不限于(a)非病毒载体,如包含线性寡核苷酸和环状质粒的核酸载体;人工染色体,如人人工染色体(HAC)、酵母人工染色体(YAC)和细菌人工染色体(BAC或PAC);游离型载体;转座子(例如,PiggyBac);以及(b)病毒载体,如逆转录病毒载体、慢病毒载体、腺病毒载体和腺相关病毒载体。
表达载体可以是线性寡核苷酸或环状质粒,并且可以通过各种转染方法(包含物理和化学方法)递送到细胞。物理方法通常是指使用物理力来抵消细胞膜屏障以促进遗传材料的细胞内递送的递送的方法。物理方法的实例包含使用针、弹道DNA、电穿孔、声孔效应、光致穿孔、磁转染和水穿孔。化学方法通常是指其中化学载剂将核酸分子递送到细胞的方法,并且可以包含无机颗粒、基于脂质的载体、基于聚合物的载体和基于肽的载体。
可以使用无机颗粒将表达载体施用于靶细胞。无机颗粒可以指纳米颗粒,如针对各种大小、形状和/或孔隙率工程化的纳米颗粒,以从网状内皮系统逸出或保护包埋的分子免于降解。无机纳米颗粒可以由金属(例如,铁、金和银)、无机盐或陶瓷(例如,钙、镁或硅的磷酸盐或碳酸盐)制备。这些纳米颗粒的表面可以被包衣以促进DNA结合或靶向基因递送。还可以使用磁性纳米颗粒(例如,超顺磁性氧化铁)、富勒烯(例如,可溶性碳分子)、碳纳米管(例如,圆柱形富勒烯)、量子点和超分子系统。
可以使用阳离子脂质(例如,阳离子脂质体)将表达载体施用于靶细胞。已经研究了用于基因递送的各种类型的脂质,例如脂质纳米乳液(例如,一种不混溶的液体在另一种由乳化剂稳定的液体中的分散体)或固体脂质纳米颗粒。
可以使用基于肽的递送媒剂将表达载体施用于靶细胞。基于肽的递送媒剂可以具有保护待递送的遗传材料、靶向特定细胞受体、破坏内体膜和将遗传材料递送到细胞核中的优点。可以使用基于聚合物的递送媒剂将载体施用于靶细胞。基于聚合物的递送媒剂可以包括天然蛋白质、肽和/或多糖或合成聚合物。
本文进一步提供了用于组合检查治疗部分的方法。为了实现这一点,可以引入低覆盖率的文库,感染0%至10%的细胞,以避免或最小化单个细胞中的感染的多样性。可替代地,可以以更高的覆盖率引入文库,使得若干个或许多细胞可以含有多个治疗部分。存在于单个细胞或单个细胞核中的治疗部分的组合可以从其治疗部分条形码中确定。治疗部分条形码的存在可以通过例如单细胞核测序来确定。
多个文库或多个同一文库可以在单独的时间点施用于生物实体。在这些方面中报告基因的启动子可以被设计为将多个感染的表达归一化。在一个实例中,编码多个可鉴定报告基因(例如,GFP和RFP)的基因可以结合在不同的表达盒中,每个所述表达盒与治疗部分的文库配对。在此实例中,所关注的细胞可以含有多个报告基因颜色,并且可以避免从每个治疗部分分离单个报告基因的表达贡献的需要。
可以将多个治疗部分组合在单个表达载体中(基于疾病特征、先前筛选或其它激励信息),以测试对细胞状态的协同、相加或其它组合作用。
体内筛选
在一些方面,本文所提供的组合物和方法允许在体内筛选治疗部分的文库。在一些方面,体内筛选涉及在健康或疾病模型中筛选治疗部分的文库。在一些方面,体内筛选涉及筛选生物实体中的治疗部分的文库,所述生物实体如但不限于细胞或细胞群体(包含活组织、生物体、动物、类器官等内的细胞或细胞群体)、组织、类器官或动物。可以将表达盒或表达盒的文库施用到健康或疾病的模型中,使得所述模型可以包括表达盒或文库。在此类方面,模型(例如,生物实体)可以从表达盒表达治疗部分、报告基因或两者。例如,表达盒的文库可以被施用于疾病的小鼠模型。在模型中,由表达盒的文库编码的一个或多个治疗部分可以改变细胞状态。此类改变可以由报告基因报告。例如,荧光蛋白报告基因可以在由治疗部分诱导的细胞状态变化时被转录和翻译,并且可以允许检测或鉴定有效的治疗部分。
在一个实例中,本文所描述的方法和组合物可以用于鉴定可以作为年龄相关的疾病的治疗靶标的基因。可以使用作为年龄相关的疾病的模型的生物实体(例如,老年动物或类器官),例如老年动物。可以将文库施用到动物的受年龄相关的疾病影响的组织中。
治疗部分的文库可以施用于模型,其中所述模型可以是健康和疾病的保守的模型。在一些方面,健康和疾病的模型是生物实体,例如细胞或细胞的群体、组织、类器官或动物。文库可以局部、通过注射、通过洗涤、通过摄入、通过植入、通过吸入、舌下或通过其它方法施用。生物实体可以是健康的模型或以下的模型:年龄相关的疾病或病状、肝病或病状、代谢性疾病或病状、心血管疾病或病状、神经退行性疾病或病状、眼病或病状、退行性疾病或病状、炎性病状、纤维化病状、免疫病状、皮肤病状、毛发病状、指甲病状、癌症、一种类型的关节炎、非酒精性脂肪性肝病、非酒精性脂肪性肝炎、肝硬化、特发性肺纤维化、肌肉减少症、神经系统病状、阿尔茨海默氏病或痴呆,或者所述疾病或病状与衰老、复制活性不足或不平衡、分泌表型改变、神经元信号传导改变、异常免疫活性、未分化的细胞状态或癌性相关。
在非限制性实例中,作为阿尔茨海默氏病的模型的动物可以接受将文库注射到其脑中。在另一个非限制性实例中,作为1型糖尿病的模型的动物可以接受将文库注射到其胰腺中。
示例示意图在图7中示出,其描绘了注射了文库的小鼠。基于这些细胞的报告基因表达,可以将来自小鼠的细胞分选为健康细胞和患病细胞。
注射到生物实体中的文库可以包括AAV载体,每个所述载体包括编码报告基因的核酸序列、治疗部分和治疗部分独特的治疗部分条形码。文库中的载体中的每一个可以包括不同治疗部分。此类文库可以包括用于在生物实体中筛选的至少约1000个不同治疗部分。
文库中的报告基因可以针对特定的疾病模型进行设计。例如,1型糖尿病的模型的报告基因可以在胰岛素的存在下表达。在此方面,胰腺的细胞可以表达在刺激胰岛素产生中有效的治疗部分,并且胰岛素产生可以引起报告基因的表达。在此类方法中,报告基因的表达成为胰岛素产生的读出(并且刺激胰岛素产生的治疗部分可以通过鉴定与该细胞相关的治疗部分条形码来鉴定)。可替代地,报告基因可以在存在或不存在其它基因的情况下表达,所述其它基因不是明显疾病相关的,但是先前鉴定的疾病特征的一部分。在更一般的实例中,包括编码能够治疗年龄相关的疾病的治疗部分的载体的细胞可以表达报告基因。
可以采集疾病模型的组织或细胞用于分析。例如,在阿尔茨海默氏病模型中,可以采集脑。在另一个实例中,在1型糖尿病模型中,可以采集胰腺β细胞。然后可以对采集的细胞进行进一步的分析,包含分析采集的细胞以确定哪些细胞表达报告基因。FACS可以用于分选或富集表达指示细胞状态变化或治疗作用的报告基因的细胞或细胞的细胞核。然后可以使用测序方法分析来自此类富集的或分选的细胞或细胞核的RNA。可以进行治疗部分条形码(其可以在测序之前被扩增)的测序以鉴定与在细胞中观察到的治疗作用相关的治疗部分。
细胞和核富集
可以富集所关注的细胞状态。可以采集或收集疑似表达候选治疗部分的细胞、组织、器官、生物流体或其它所关注的区域。可以基于报告基因表达通过细胞状态对细胞进行分选或分析。例如,当使用荧光报告基因时,可以采用FACS对具有改变的细胞状态的细胞进行分选。具有细胞状态变化的细胞的细胞核的群体也可以被富集或分选。可以使用相关的治疗部分条形码来鉴定对细胞状态有影响的治疗部分
细胞状态模型可以基于治疗部分的作用进行改进。在此,细胞状态的逆转可以使用组学来证实,如单细胞组学。组学或其它分析可以允许对细胞状态、治疗部分或疾病模型进行详细分析和改进预测。在此,可以改进模型,使得可以确定更优化的治疗部分或“最有效”治疗部分的更小的集合。
一些方法可以进一步包括富集或分选具有细胞状态或细胞状态的可能性变化的细胞的群体或细胞的细胞核的群体。可以分选的细胞的群体可以是包括文库的细胞或不包括文库的细胞。可以富集或分选来自包括文库的细胞或不包括文库的细胞的细胞核的群体。包括文库的细胞可以具有可以作为治疗部分的直接结果而改变的细胞状态或细胞状态的可能性。不包括文库的细胞可以具有可以作为治疗部分的结果而间接改变的细胞状态或细胞状态的可能性。
细胞和细胞核分选可以通过一种或多种手段进行。细胞和细胞核分选可以包括进行FACS、亲和纯化方法、流式细胞术、微流体分选、使用缀合抗体的磁性分选或富集具有细胞状态变化或具有治疗作用的细胞、细胞的群体或细胞的细胞核的群体的其它方法。细胞和核分选可以选择具有标志物或不具有标志物的细胞进行分析。例如,对于其中进行FACS的方法,可以将具有荧光信号的细胞或细胞核与不具有荧光信号的细胞或细胞核分离,并且可以选择细胞的群体或细胞群体的细胞核的群体进行分析。在一些方面,细胞和核分选技术可以组合。例如,FACS之后可以采用亲和纯化技术来富集细胞或细胞核的亚群体以进行分析。在一些方面,富集或分选细胞的群体可以促进或随后富集或分选所述细胞的群体的细胞核的群体。
富集或分选可以进一步包括检测一个或多个报告基因。在一些方面,检测到的报告基因可以是表达盒的基因产物。例如,如果表达盒包含编码GFP的遗传材料作为报告基因,则可以进行FACS以选择GFP并富集表达GFP的细胞。
治疗部分的鉴定
细胞的群体中存在的治疗部分的强度(例如,RNAi对mRNA的减少程度或转基因的mRNA转录物的量)或量可能是所关注的。治疗部分的强度或量可以给出例如关于效力、毒性、效率或功效的信息。在一些方法中,可以鉴定候选治疗部分。在一些方面,鉴定包括单细胞分析、单细胞核分析、RNA测序、单细胞RNA测序、单细胞核RNA测序、基于液滴的单细胞RNA测序、基于液滴的单细胞核RNA测序、对细胞的群体或细胞核的群体中一定量的治疗部分或治疗部分条形码的测序、组织学测定或荧光染色测定以确定细胞的群体中存在的治疗部分的量。在一些方面,单细胞或单细胞核分析可以包括RNA测序。在一些方面,单细胞核分析可以包含RNA测序。在一些方面,单细胞分析可以包括基于液滴的单细胞RNA测序。在一些方面,单细胞核分析可以包含基于液滴的单细胞核RNA测序。鉴定可以是定量的或定性的,并且鉴定的数字结果可以是绝对的或相对的。
细胞状态的可能性可以与细胞内蛋白质或寡核苷酸表达的水平相关。在一些方面,更多蛋白质或寡核苷酸表达可以与更健康或更患病的细胞状态相关。在一些方面,更少蛋白质或寡核苷酸表达可以与更健康或更患病的状态相关。在一些方面,可以使用组织学或荧光染色方法测量蛋白质或寡核苷酸表达的水平。染色方法可以包括原位杂交、免疫荧光、免疫组织化学、丽春红(Ponceau)染色、考马斯(Coomassie)染色、银染色或其它方法。
可以使用单细胞转录组学来测量细胞状态的变化,如疾病状态的逆转。例如,包括患有疾病的细胞的生物实体(例如,动物模型或类器官)可以施用本文所描述的载体的文库。对于具有疾病的疾病状态特征的细胞的子集,细胞可以接收包含治疗部分的表达盒,所述治疗部分有效地引入改变某些细胞的细胞状态的扰动,引起其细胞状态从疾病状态变为健康或更健康的状态。
如图8所展示的,单细胞转录组学可以用于检测细胞或细胞的群体中的扰动,以鉴定有效引起此类扰动的治疗部分。如图8中的加权相关图所示,治疗部分从疾病到健康细胞状态(纵轴)的转录谱或转录组学变化是相对于相对于对照的扰动的量绘制的(在横轴上定量)。可以进行加权相关,其产生0.877的加权相关系数,允许基于单细胞转录组学数据在患病与健康细胞状态之间进行分化。在一些方面,优化算法可以预测来自指定大小的扰动的结果。例如,在一些方面,稍高剂量下的扰动可以引起更接近细胞的健康群体的细胞状态的细胞状态。在本文所提供的组合物和方法的一些实施例中,用于检测细胞或细胞的群体中的扰动以鉴定有效引起此类扰动的治疗部分的单细胞转录组学包含单细胞RNA测序;例如基于液滴的单细胞RNA测序。在一些实施例中,单细胞RNA测序(包含基于液滴的单细胞测序)可以使用基于或类似于以下中所描述的那些的单细胞RNA测序方法进行:Klein等人,《细胞(Cell)》161:1187-1201(2015);Macosko等人,《细胞》161:1202-1214(2015);Zheng等人,《生物预印本期刊》.http://dx.doi.org/10.1101/065912(2016);Dixit等人,《细胞》167:1853–1866(2016);Adamson,《细胞》167,1867–1882。在本文所提供的组合物和方法的一些方面,用于检测细胞或细胞的群体中的扰动以鉴定有效引起此类扰动的治疗部分的单细胞转录组学包含单细胞核RNA测序;例如基于液滴的单细胞核RNA测序。
示例性实施例的非限制性列表
实例
实例1
构建治疗部分文库
适于病毒包装的pFB AAV质粒用作制备治疗部分文库的主链。首先,将含有以下的序列克隆到此主链中:RNA聚合酶IIPgk启动子、hGH内含子、与组蛋白H4融合的绿色荧光蛋白的编码序列、牛生长激素聚腺苷酸化序列、小鼠U6启动子,以及用作后续步骤的PCR引物结合区的恒定区。然后,在小鼠U6启动子和PCR引物结合区的下游克隆治疗部分条形码和用于核条形码保留的一个或多个序列基序(Zhang、SIRLOIN或U1),然后捕获序列和RNA聚合酶III终止序列。通过创建治疗部分条形码和核条形码保留基序的独特组合,可以筛选增加的核条形码捕获。
将这些质粒转染到电感受态大肠杆菌(E.coli)中,培养并使用ZymoPURETMII质粒Midiprep试剂盒(Zymo研究公司(Zymo Research),制造商的方案)进行纯化。通过将每个治疗部分的质粒以等摩尔比混合来创建文库,并且将得到的混合的质粒发送到哈佛载体核心公司(Harvard Vector Core),用于商业生产含有混合的治疗部分文库的AAV6.2。
实例2
文库递送
选择具有基因型B6N.Cg-Ids(tm1Muen)/J(亨特氏综合征(Hunter syndrome)的模型)的成年(8周龄)半合子雄性小鼠作为治疗筛选的宿主。将病毒文库稀释在1x PBS中,以使最终滴度为50μL中10^11个病毒基因组。使用异氟烷麻醉后,使用以下中描述的方案通过滴注递送病毒:X.Su,M.Looney,L.Robriquet,X.Fang和M.A.Matthay,“直接视觉滴注作为将流体有效递送到麻醉的小鼠的远端空隙的方法(DIRECT VISUAL INSTILLATION AS AMETHOD FOR EFFICIENT DELIVERY OF FLUID INTO THE DISTAL AIRSPACES OFANESTHETIZED MICE)”,《实验肺脏研究(Exp.Lung Res.)》,第30卷,第6期,第479–493页,2004年1月。在小鼠从麻醉中醒来后以及在第二天早上对其进行观察,以确保不会发生对病毒递送的不良反应。
实例3
细胞核分离和测序
宿主小鼠在4周温育期后被处死,以允许文库转基因的表达。
首先,制备裂解溶液,所述裂解溶液由含有0.1% Triton-X洗涤剂的Tris缓冲盐水和RNA酶抑制剂混合物(赛默飞世尔公司(Thermo Fisher))组成。
使用异氟烷依次麻醉宿主小鼠和未注射的小鼠,用乙醇消毒,并通过外科手术打开腹腔以取出肺。取出肋骨以进入肺。肺用冷PBS灌注,气管用止血器闭合,并且取出肺并在液氮中快速冷冻。将冷冻的肺切片转移到2ml裂解缓冲液中的玻璃杜恩斯匀浆器(douncehomogenizer)中。将组织匀浆,然后通过40um的过滤器并重悬于2ml裂解缓冲液中。5分钟温育后,将溶液在4℃下以500g离心5分钟。将细胞核重悬于含有RNA酶抑制剂的溶液中,并且作为洗涤步骤再次离心。在相同的重悬后,使细胞核通过30um过滤器并进入FACS。
细胞核分选在FACS Aria2(BD)上进行,使用流速为6。由未注射的小鼠产生的细胞核悬浮液用于门控专门自发荧光的细胞核。在设置门控之后,分选来自注射的宿主小鼠的细胞核悬浮液,直到收集了100,000个GFP阳性细胞核。根据用于基于液滴的单细胞核RNA测序的制造商的方案,将收集的细胞核立即装载到铬芯片(10x基因组学公司(10xGenomics))中。按照制造商的方案,收集10x条形码GEM并将其转化成Illumina测序文库。在此过程期间,25%的GEM cDNA被分离,并且在测序之前用于PCR扩增治疗部分条形码。使用Q5聚合酶和缓冲液(NEB)进行25个循环的PCR扩增,PCR手柄中的引物包含在治疗部分中,并且10x条形码区中的引物通过铬与每段RNA附接。随后使用附接有Illumina P5和P7序列的相同引物进行5个循环,以实现下一代测序。
根据制造商的说明,使用75循环高输出试剂盒将10x GEM cDNA和扩增的条形码cDNA装载(95:5比率)到Illumina Nextseq。测序运行完成后,执行另一个相同的测序运行以增加读取深度。
实例4
数据分析
使用bcl2fastq软件(因美纳公司(Illumina))处理原始测序数据,使用STAR比对(A.Dobin等人,“STAR:超快通用RNA测序比对器(STAR:ultrafast universal RNA-seqaligner)”,《生物信息学(Bioinformatics)》,第29卷,第1期,第15-21页,2012年10月),然后使用CellRanger(10x基因组学公司)将读段分配给单个细胞。考虑到单细胞测序工作流的效率低,通过测序鉴定了约50,000个细胞。使用scVI对细胞类型进行聚类(R.Lopez,J.Regier,M.B.Cole,M.I.Jordan和N.Yosef,“单细胞转录组学的深度生成建模(Deepgenerative modeling for single-cell transcriptomics)”,《自然方法(Nat.Methods)》,第15卷,第12期,第1053–1058页,2018),基于N.Schaum等人,“20个小鼠器官的单细胞转录组学创建了Tabula Muris(Single-cell transcriptomics of 20 mouseorgans creates a Tabula Muris)”,《自然》,第562卷,第7727期,第367–372页,2018中的注释。然后,定制工具基于在治疗部分条形码读段中检测到的10x条形码将那些读段映射到各个细胞。这导致可鉴定为已接受特定治疗部分的细胞组,包含没有转基因的阴性对照治疗部分。比较跨这些组的差异基因表达,以鉴定治疗部分的转录效应。重复进行此分析,其中只对相同类型的细胞进行比较。另外,将先前针对亨特氏综合征训练的随机森林分类器以及健康小鼠单细胞数据应用于含有每个治疗部分的细胞组。与阴性对照治疗部分相比,亨特氏综合征小鼠的细胞更有可能被归类为‘健康’,这指示了治疗功效。
在实例1的特定构建体具有(A)没有核保留基序、(B)没有核保留基序但具有添加的核苷酸碱基,使得构建体与具有核保留基序的构建体具有相同或相似的长度、(C)一个或多个Zhang基序、(D)一个或多个Sirloin基序或(E)在实例1至4中的方法中使用一个或更多个U1基序,包含核分选和使用所描述的10x Genomics公司铬平台处理细胞核。通过计数检测到的治疗部分条形码(UMI)的独特分子的数量,将其相对于递送的AAV中每个构建体的输入量归一化,发现使用在表达的条形码RNA分子上均匀分布的三个Zhang基序,在测试的条件下显示出条形码RNA的检测的最大增加(参见图10)。三个13bp Zhang基序的表现均大于一个Zhang基序和六个Zhang基序两者。使用42bp Sirloin基序观察到条形码保留的一些增加,但没有使用三个Zhang基序那么多。单个9bp U1基序可能显示出边际改善。
可以在不存在本文未具体公开的任何一个或多个元件、一个或多个限制的情况下实践本文说明性地描述的本发明。已经采用的术语和表达被用作说明性而非限制性术语,并且不旨在使用排除所示出和描述的特征或其部分的任何等效物的此类术语和表达,但是应认识到,在所要求保护的本发明的范围内可以进行各种修改。因此,应当理解,尽管已经通过优选实施例和任选的特征具体地公开了本发明,但是本领域的技术人员可以对本文公开的概念进行修改和变更,并且此类修改和变更被认为是在如由所附权利要求和本发明的声明所限定的本发明的范围内。
本文提及或引用的文章、专利和专利申请的内容,以及所有其它文档和电子可用信息,均通过全文引用的方式并入本文,其程度与每一份单独的出版物被明确和单独地表示通过引用并入的方式相同。申请人保留将任何此类文章、专利、专利申请或其它文件中的任何和所有材料和信息实际并入本申请的权利。
本文说明性描述的本发明可在缺乏任何一个或多个元件、一个或多个限制或本文未具体公开的限制的情况下适当地实践。因此,例如,术语“包括”、“包含”、“含有”等应被扩展地理解并且不受限制。另外,本文所采用的术语和表达已被用作说明书的术语且不被限制,并且此类术语和表达的使用并不旨在排除所示及和所述的特征的任何等效物或其部分,但应当认识到,在所要求保护的本发明的范围内可以进行各种修改。因此,应当理解,尽管已经通过优选的实施例和任选的特征明确地公开了本发明,但是本领域的技术人员可以对本文所体现的本发明进行修改和变更,并且此类修改和变更被认为是在本文所设想的发明的各个方面和实施例的范围内。
本发明的某些方面和实施例已经在本文中进行了广泛和一般性的描述。落在一般公开内的较窄物种和亚属分组中的每一个也形成本文所设想的发明的一些方面和实施例的一部分。这包含本发明的一般性描述,其前提条件或负面限制从所述属中去除任何主题,无论所删除的材料是否在本文中具体叙述。
另外,在本发明的特征或方面是根据马库什基团(Markush group)来描述的情况下,本领域技术人员将认识到,本文所设想的发明的一些方面和实施例也由此根据马库什基团的任何单个成员或成员的亚组来描述。
尽管本文中已经示出并且描述了本发明的优选的实施例,但是对于本领域的技术人员而言将显而易见的是,此类实施例仅通过举例的方式提供。在不脱离本发明的情况下,本领域的技术人员现在将想到许多变化、改变和取代。应当理解,本文所描述的本发明的实施例的各个替代方案都可以用于实践本发明。所附权利要求书旨在限定本发明的范围,并且由此覆盖这些权利要求和其等效物的范围内的方法和结构。
序列
/>
/>
/>
尽管已经参考当前优选的实施例描述了本发明,但是应当理解,可以在不脱离本发明的精神的情况下进行各种修改。因此,本发明仅由以下权利要求限制。

Claims (41)

1.一种用于鉴定候选治疗部分的方法,所述方法包括:
(a)向动物或类器官施用表达盒的文库,所述表达盒包括:
多个核酸序列,每个核酸序列编码与治疗部分条形码可操作地连接的不同治疗部分;
多个核酸序列,所述多个核酸序列编码一个或多个报告基因,当在细胞或分离的细胞核中表达时,所述一个或多个报告基因共同指示所述细胞的细胞状态或细胞状态的可能性;以及
一个或多个序列,所述一个或多个序列编码非编码核保留RNA基序;以及
(b)鉴定引起所述动物或所述类器官的细胞的细胞状态或细胞状态的可能性的变化的候选治疗部分,
由此鉴定候选治疗部分。
2.一种用于鉴定候选治疗部分的方法,所述方法包括:
(a)向动物或类器官施用表达盒的文库,所述表达盒包括:
多个核酸序列,每个核酸序列编码与治疗部分条形码可操作地连接的不同治疗部分;
多个核酸序列,所述多个核酸序列编码一个或多个报告基因,当在细胞或分离的细胞核中表达时,所述一个或多个报告基因共同指示所述细胞的细胞状态或细胞状态的可能性;以及
一个或多个序列,所述一个或多个序列编码与所述治疗部分条形码中的一个或多个治疗部分条形码可操作地连接的非编码核保留RNA基序;以及
(b)鉴定引起所述动物或所述类器官的细胞的细胞状态或细胞状态的可能性的变化的候选治疗部分,
由此鉴定候选治疗部分。
3.根据前述权利要求中任一项所述的方法,其进一步包括分离包括所述一个或多个报告基因的一个或多个细胞的细胞核。
4.根据前述权利要求中任一项所述的方法,其进一步包括富集或分选具有所述细胞状态或所述细胞状态的所述可能性的所述变化的细胞的细胞核的群体。
5.根据前述权利要求中任一项所述的方法,其进一步包括富集或分选具有所述细胞状态或所述细胞状态的所述可能性的所述变化的细胞的细胞核的群体,其中所述富集或分选包括基于所述一个或多个报告基因的水平富集或分选细胞或细胞核的群体。
6.根据前述权利要求中任一项所述的方法,其进一步包括富集或分选具有所述细胞状态或所述细胞状态的所述可能性的所述变化的细胞的细胞核的群体,其中富集或分选包括基于所述一个或多个报告基因的水平富集或分选细胞或细胞核的群体,并且其中富集或分选包括进行FACS、亲和纯化方法、流式细胞术或微流体分选。
7.根据前述权利要求中任一项所述的方法,其中鉴定包括基于所述细胞或所述细胞核中的所述治疗部分条形码的存在来鉴定所述候选治疗部分。
8.根据前述权利要求中任一项所述的方法,其中鉴定包括基于所述细胞或所述细胞核中的所述治疗部分条形码的存在来鉴定所述候选治疗部分,并且其中鉴定包括进行单细胞分析、单细胞核分析、RNA测序、单细胞RNA测序、单细胞核RNA测序、基于液滴的单细胞RNA测序、基于液滴的单细胞核RNA测序、批量分析、对细胞核的群体进行测序或对细胞的群体进行测序以确定所述细胞的群体中存在的所述候选治疗部分的量。
9.根据前述权利要求中任一项所述的方法,其中鉴定包括单细胞或单细胞核RNA测序。
10.根据前述权利要求中任一项所述的方法,其中鉴定包括基于液滴的单细胞或基于液滴的单细胞核RNA测序。
11.根据前述权利要求中任一项所述的方法,其中所述编码非编码核保留RNA基序的一个或多个序列包括编码lncRNA或其片段的序列。
12.根据前述权利要求中任一项所述的方法,其中所述编码非编码核保留RNA基序的一个或多个序列包括编码BMP2-OP1应答基因(BORG)或其片段的序列。
13.根据前述权利要求中任一项所述的方法,其中所述编码非编码核保留RNA基序的一个或多个序列包括包含SEQ ID NO:1的五聚体基序的一个或多个拷贝。
14.根据前述权利要求中任一项所述的方法,其中所述编码非编码核保留RNA基序的一个或多个序列包括包含SEQ ID NO:1的五聚体基序的两个或更多个拷贝。
15.根据前述权利要求中任一项所述的方法,其中所述编码非编码核保留RNA基序的一个或多个序列包括包含SEQ ID NO:1的五聚体基序的三个或更多个拷贝。
16.根据前述权利要求中任一项所述的方法,其中所述编码非编码核保留RNA基序的一个或多个序列包括包含SEQ ID NO:2、3、4、5、6或7的核酸序列的一个或多个拷贝。
17.根据前述权利要求中任一项所述的方法,其中所述编码非编码核保留RNA基序的一个或多个序列包括包含SEQ ID NO:2、3、4、5、6或7的核酸序列的两个或更多个拷贝。
18.根据前述权利要求中任一项所述的方法,其中所述编码非编码核保留RNA基序的一个或多个序列包括包含SEQ ID NO:2、3、4、5、6或7的核酸序列的三个或更多个拷贝。
19.根据前述权利要求中任一项所述的方法,其中所述编码非编码核保留RNA基序的一个或多个序列包括JPX、PVT1或NR2F1-AS1序列或其片段。
20.根据前述权利要求中任一项所述的方法,其中所述编码非编码核保留RNA基序的一个或多个序列包括包含SEQ ID NO:7的一个或多个核酸序列。
21.根据前述权利要求中任一项所述的方法,其中所述编码非编码核保留RNA基序的一个或多个序列包括包含SEQ ID NO:7的一个核酸序列。
22.根据前述权利要求中任一项所述的方法,其中所述编码非编码核保留RNA基序的一个或多个序列包括包含SEQ ID NO:7的两个核酸序列。
23.根据前述权利要求中任一项所述的方法,其中所述编码非编码核保留RNA基序的一个或多个序列包括包含SEQ ID NO:7的三个核酸序列。
24.根据前述权利要求中任一项所述的方法,其中所述编码非编码核保留RNA基序的一个或多个序列包括包含SEQ ID NO:7的四个核酸序列。
25.根据前述权利要求中任一项所述的方法,其中所述编码非编码核保留RNA基序的一个或多个序列包括包含SEQ ID NO:7的五个核酸序列。
26.根据前述权利要求中任一项所述的方法,其中所述编码非编码核保留RNA基序的一个或多个序列包括包含SEQ ID NO:7的六个核酸序列。
27.根据前述权利要求中任一项所述的方法,其中所述编码非编码核保留RNA基序的一个或多个序列包括SIRLOIN序列,所述SIRLOIN序列包括包含SEQ ID NO:9或其片段的核酸序列。
28.根据前述权利要求中任一项所述的方法,其中所述编码非编码核保留RNA基序的一个或多个序列包括包含SEQ ID NO:8的核酸序列的一个或多个拷贝。
29.根据前述权利要求中任一项所述的方法,其中所述编码非编码核保留RNA基序的一个或多个序列包括与包括SEQ ID NO:10的氨基酸序列结合的序列。
30.根据前述权利要求中任一项所述的方法,其中所述编码非编码核保留RNA基序的一个或多个序列包括编码enChr的序列。
31.根据权利要求30所述的方法,其中所述enChr包括U1 snRNP识别基序的一个或多个拷贝。
32.根据权利要求31所述的方法,其中所述U1 snRNP识别基序包括包含SEQ ID NO:11、12、13或其任何组合的核酸序列的一个或多个拷贝。
33.根据前述权利要求中任一项所述的方法,其中所述编码非编码核保留RNA基序的一个或多个序列包括编码aU1 snRNP识别基序的序列。
34.根据权利要求33所述的方法,其中所述U1 snRNP识别基序包括包含SEQ ID NO:11、12、13或其任何组合的核酸序列的一个或多个拷贝。
35.根据前述权利要求中任一项所述的方法,其中编码治疗部分条形码的每个核酸序列与编码聚合酶III启动子的核酸序列可操作地连接。
36.根据权利要求35所述的方法,其中捕获序列在所述聚合酶III启动子的控制下进一步与所述治疗部分条形码可操作地连接。
37.根据权利要求36所述的方法,其中所述捕获序列具有包括SEQ ID NO:14-17中的任一个的序列。
38.根据权利要求35所述的方法,其中一个或多个分子富集序列在所述聚合酶III启动子的控制下与所述治疗部分条形码可操作地连接。
39.根据权利要求38所述的方法,其中所述一个或多个分子富集序列具有包括SEQ IDNO:18-97中的任一个的序列。
40.根据权利要求35所述的方法,其中独特基因组鉴定(UGI)序列在所述聚合酶III启动子的控制下与治疗部分条形码区可操作地连接。
41.根据权利要求40所述的方法,其中所述UGI具有包括SEQ ID NO:98的序列。
CN202280028074.9A 2021-04-26 2022-04-22 用于使用单细胞核测序在体内筛选治疗剂的组合物和方法 Pending CN117597448A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163180012P 2021-04-26 2021-04-26
US63/180,012 2021-04-26
PCT/US2022/026018 WO2022231980A1 (en) 2021-04-26 2022-04-22 Compositions and methods for in vivo screening of therapeutics using single nucleus sequencing

Publications (1)

Publication Number Publication Date
CN117597448A true CN117597448A (zh) 2024-02-23

Family

ID=83848630

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280028074.9A Pending CN117597448A (zh) 2021-04-26 2022-04-22 用于使用单细胞核测序在体内筛选治疗剂的组合物和方法

Country Status (4)

Country Link
US (1) US20240150751A1 (zh)
EP (1) EP4330406A1 (zh)
CN (1) CN117597448A (zh)
WO (1) WO2022231980A1 (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996038553A1 (en) * 1995-06-02 1996-12-05 M&E Biotech A/S A method for identification of biologically active peptides and nucleic acids
WO2001000864A2 (en) * 1999-06-25 2001-01-04 Vlaams Interuniversitair Instituut Voor Biotechnologie Vzw Nucleic acid binding of multi-zinc finger transcription factors
WO2011150453A1 (en) * 2010-06-01 2011-12-08 The University Of Queensland Diagnostic, prognostic and therapeutic use of a long non-coding rna
US8557787B2 (en) * 2011-05-13 2013-10-15 The Board Of Trustees Of The Leland Stanford Junior University Diagnostic, prognostic and therapeutic uses of long non-coding RNAs for cancer and regenerative medicine
US20220017894A1 (en) * 2018-11-06 2022-01-20 Gordian Biotechnology, Inc. Compositions and methods for in vivo screening of therapeutics

Also Published As

Publication number Publication date
US20240150751A1 (en) 2024-05-09
WO2022231980A1 (en) 2022-11-03
EP4330406A1 (en) 2024-03-06

Similar Documents

Publication Publication Date Title
US11197467B2 (en) Delivery, use and therapeutic applications of the CRISPR-cas systems and compositions for modeling mutations in leukocytes
US20220017894A1 (en) Compositions and methods for in vivo screening of therapeutics
Chow et al. AAV-mediated direct in vivo CRISPR screen identifies functional suppressors in glioblastoma
JP7136816B2 (ja) 核酸誘導型ヌクレアーゼ
US20130142861A1 (en) Compositions And Method For Detecting And Treating Abnormal Liver Homeostasis And Hepatocarcinogenesis
Brown et al. Deep parallel characterization of AAV tropism and AAV-mediated transcriptional changes via single-cell RNA sequencing
Meijboom et al. CRISPR/Cas9-mediated excision of ALS/FTD-causing hexanucleotide repeat expansion in C9ORF72 rescues major disease mechanisms in vivo and in vitro
EP2386564B1 (en) Regulatable fusion promoters
US20030143597A1 (en) Methods for making polynucleotide libraries, polynucleotide arrays, and cell libraries for high-throughput genomics analysis
US20070166720A1 (en) Small interfering RNA libraries and methods of synthesis and use
Graybuck et al. Enhancer viruses and a transgenic platform for combinatorial cell subclass-specific labeling
US20200017883A1 (en) Compositions and methods for studying the tat gene
US20220170910A1 (en) Multiplexing regulatory elements to identify cell-type specific regulatory elements
US20160298114A1 (en) Haplotype Based Generalizable Allele Specific Silencing for Therapy of Cardiovascular Disease
CN117597448A (zh) 用于使用单细胞核测序在体内筛选治疗剂的组合物和方法
US20240200229A1 (en) Compositions and methods for in vivo screening of therapeutics
WO2019199974A1 (en) Microrna regulated expression vectors, methods of making, and uses thereof
US11739370B1 (en) Methods and compositions for in vivo screening of therapeutics through spatial transcriptomics
EP4150102A2 (en) Viral delivery vehicle selection
WO2024071424A1 (ja) 細胞内の応答を引き起こす機能性分子の探索方法
US20090311695A1 (en) Method
CN113373148B (zh) 一种调控app表达的靶标位点序列及其在防治ad上的应用
US20240141328A1 (en) Assay for Massive Parallel RNA Function Perturbation Profiling
Li The Role of Circular RNAs in Cardiac Remodeling
Earnest-Noble et al. Two isoleucyl tRNAs that decode ‘synonymous’ codons divergently regulate breast cancer progression

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination