CN114127306A - 脂质修饰的寡核苷酸及其使用方法 - Google Patents

脂质修饰的寡核苷酸及其使用方法 Download PDF

Info

Publication number
CN114127306A
CN114127306A CN202080049879.2A CN202080049879A CN114127306A CN 114127306 A CN114127306 A CN 114127306A CN 202080049879 A CN202080049879 A CN 202080049879A CN 114127306 A CN114127306 A CN 114127306A
Authority
CN
China
Prior art keywords
lipid
region
cells
nucleic acid
dna oligonucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080049879.2A
Other languages
English (en)
Inventor
Z·加特纳
D·帕特森
埃里克·周
R·韦伯
C·麦金尼斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of California
Original Assignee
University of California
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of California filed Critical University of California
Publication of CN114127306A publication Critical patent/CN114127306A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6862Ligase chain reaction [LCR]

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本公开一般涉及单细胞条形码化的方法和应用以及使用包含脂质修饰的寡核苷酸的组合物进行核苷酸测序的方法。

Description

脂质修饰的寡核苷酸及其使用方法
相关申请的交叉引用
本申请要求2019年7月8日提交的第62/871,702号美国临时申请的优先权,该申请以全文引用的方式并入。
技术领域
本公开一般涉及单细胞条形码化的方法和应用以及使用包含脂质修饰的寡核苷酸的组合物进行核苷酸测序的方法。
背景技术
单细胞RNA测序已成为描绘细胞中的转录变化的有力工具。这种技术的主要优点是能够测查样品中细胞的多样性。所有单细胞RNA测序方案都共有共同的初始步骤,其中将来自细胞的转录RNA转化为cDNA。下一步是通过诸如PCR和体外转录(IVT)的方法进行扩增。后续步骤(最终为测序)允许对基因产物的表达水平进行定量。从单细胞中分离RNA并进行条形码化是单细胞RNA-seq中的第一个并且是关键的限制步骤。
最近,结合单细胞RNA测序进行了大规模筛选(使用shRNA或CRISPR的遗传扰动)以理解复杂的生物学现象。这些具有容易通过shRNA或CRISPR gRNA序列对样品进行识别/条形码化的独特优点。遗传扰动技术可直接与条形码引入相结合(即,通过将polyA+条形码添加到gRNA或shRNA本身中),而不涉及遗传操纵的化学/药物/患者筛选不能以可经由scRNA-seq“读出”的方式进行条形码化。参见例如Adamson等人,Cell 167(7):1867-82(2016);Aarts等人,Genes Dev.31(20):2085-98(2017);Jaitin等人,Cell 167(7):1883-96(2016)。
在单细胞RNA测序测定中,根据应用,传统上通过将分子条形码添加到cDNA片段或珠粒中来实现多重分析。这是在使用液滴微流体或使用微孔分离细胞后完成的。为了允许标记来自在单个液滴(或微孔)中分离的细胞的cDNA,珠粒可以与也含有条形码的实时PCR(RT)引物(或在一些情况下与珠粒上的条形码)一起使用。因此RT和条形码化可以发生在每个单独的液滴或孔中。目前的方法具有至少以下缺点:成本高、效率低、多重分析能力低。由于用于细胞乳液和与mRNA捕获珠粒共包封的离散通道的数目原因,基于商业液滴微流体的单细胞RNA测序的当前样品多重分析能力仅限于八个。
发明内容
本公开涉及包含特别设计成标记细胞的寡核苷酸的组合物和用对应于不同样品制备(例如,患者、扰动、单次实验的重复等)的不同外源寡核苷酸条形码标记的汇集细胞的组合物。通过以脂质修饰的外源寡核苷酸的形式结合样品特异性信息,样品通过量水平将不再限于由微流体装置的物理尺寸限定。增强样品多重分析将降低单细胞RNA测序的成本,限制由批次效应引起的技术噪声,并使单细胞转录组数据集信息量更大。
本公开涉及组合物和使用这些组合物对单细胞进行条形码化以及使用脂质修饰的寡核苷酸对取自受试者样品的组织片段进行RNA测序分析的方法。在一些实施方案中,本公开提供包含脂质缀合的DNA寡核苷酸的组合物,所述脂质缀合的DNA寡核苷酸包含脂质部分、条形码区和捕获序列。在一些实施方案中,本发明提供一种组合物,其包含:(a)包含脂质部分和第一引物区的第一脂质缀合的DNA寡核苷酸;和(b)包含第二引物区、条形码区和捕获序列的第二DNA寡核苷酸,其中所述第二引物区是所述第一引物区的反向互补体。在一些实施方案中,本公开提供一种组合物,其包含:(a)包含第一脂质部分、第一杂交区和第一引物区的第一脂质缀合的DNA寡核苷酸;(b)包含第二杂交区和第二脂质部分的第二脂质缀合的DNA寡核苷酸,其中所述第二杂交区是所述第一杂交区的反向互补体;和(c)包含第二引物区、条形码区和捕获序列的第三DNA寡核苷酸,其中所述第二引物区是所述第一引物区的反向互补体。
在一些实施方案中,本公开提供标记细胞样品的方法、从细胞样品中分离内源性DNA的方法或对来自细胞样品的核酸序列进行测序的方法,所述方法包括:(a)使所述细胞样品暴露于本文公开的一种或多种锚-脂质修饰的寡核苷酸或任何公开的组合物,持续足以使所述锚-脂质修饰的寡核苷酸将其自身包埋在所述细胞的细胞膜内的时间段;(b)使所述细胞样品暴露于与所述锚-脂质修饰的寡核苷酸互补的一种或多种标记寡核苷酸,持续足以使所述锚-脂质修饰的寡核苷酸与所述一种或多种标记寡核苷酸形成核酸的互补链的时间段;(c)将所述一种或多种标记寡核苷酸与所述一种或多种锚-脂质修饰的寡核苷酸连接;并任选(d)通过检测对应于所述一种或多种标记寡核苷酸的多个独特核苷酸序列中的一个来检测所述一种或多种标记寡核苷酸的存在;和/或(e)基于一种或多种标记寡核苷酸的存在分离所述细胞,其中通过检测对应于所述一种或多种标记寡核苷酸的一个或多个独特核苷酸序列来确定所述一种或多种标记寡核苷酸的存在。在一些实施方案中,所公开的方法中使用的细胞样品是来自受试者的组织样品的细胞的三维制剂,厚度为约0.1微米至约99微米。在一些实施方案中,细胞膜是将细胞质与细胞外部的点分开的质膜,或其中细胞膜是核膜。
在一些实施方案中,本公开提供对来自受试者样品的一个或多个细胞的核酸进行测序的方法,包括:(a)将对应于所述样品的区域的厚度为约0.1微米至约99微米的三维制剂或切片中的所述一个或多个细胞分配到容器中;(b)用本文公开的寡核苷酸标记对应于所述样品的区域的所述一个或多个细胞;(c)从所述一个或多个细胞中分离所述核酸;以及(d)对来自所述一个或多个细胞的所述核酸进行测序。在一些实施方案中,所公开的方法还包括:(e)编译来自所述一个或多个细胞中的每一个的序列信息。在一些实施方案中,所公开的方法还包括将所述核酸的所述序列信息和/或表达谱与所述样品内或所述受试者内的所述一个或多个细胞的空间位置相关联。
在一些实施方案中,所公开的方法中的编译步骤包括产生对应于所述样品的区域的所述一个或多个细胞中的每一个的表达谱。在一些实施方案中,所公开的方法中的标记步骤包括:(w)使所述一个或多个细胞暴露于一种或多种锚-脂质修饰的寡核苷酸,持续足以使所述锚-脂质修饰的寡核苷酸将其自身包埋在所述细胞的细胞膜内的时间段;和/或(x)使所述一个或多个细胞暴露于与所述锚-脂质修饰的寡核苷酸互补的一种或多种标记寡核苷酸,持续足以使所述锚-脂质修饰的寡核苷酸与所述一种或多种标记寡核苷酸形成核酸的互补链的时间段;和/或(y)将所述一种或多种标记寡核苷酸与所述一种或多种锚-脂质修饰的寡核苷酸连接;并任选(z)通过检测对应于所述一种或多种标记寡核苷酸的一个或多个独特核苷酸序列来检测所述一种或多种标记寡核苷酸的存在。在一些实施方案中,所公开的方法中的分离细胞的步骤包括基于一种或多种标记寡核苷酸的存在分离所述细胞,其中通过检测对应于所述一种或多种标记寡核苷酸的多个独特核苷酸序列中的一个来确定所述一种或多种标记寡核苷酸的存在。在一些实施方案中,在所公开的方法中使用的一种或多种锚-脂质修饰的寡核苷酸包括:(a)包含第一脂质部分、第一杂交区和第一引物区的第一脂质缀合的DNA寡核苷酸;(b)包含第二杂交区和第二脂质部分的第二脂质缀合的DNA寡核苷酸,其中所述第二杂交区是所述第一杂交区的反向互补体;和(c)包含第二引物区、条形码区和捕获序列的第三DNA寡核苷酸,其中所述第二引物区是所述第一引物区的反向互补体。
在一些实施方案中,本公开提供确认受试者的样品或组织内的核酸表达模式的空间位置的方法,所述方法包括:(a)将来自所述样品或对应于所述样品的区域的组织的一个或多个细胞分配到多个容器中的一个中;(b)用本文公开的已知寡核苷酸使对应于所述样品的区域的所述一个或多个细胞暴露,持续足以使所述已知寡核苷酸掺入所述一个或多个细胞中的时间,每种寡核苷酸对于一个或多个细胞暴露于其中的所述多个容器中的一个是独特的并且对应于所述多个容器中的一个;(c)根据所述已知寡核苷酸从所述一个或多个细胞中分离核酸;(d)对来自所述一个或多个细胞的核酸的表达进行定量和/或对所述核酸进行测序;(e)将表达谱中的核酸表达标准化;以及(f)将来自所述一个或多个细胞的表达谱与所述细胞在所述样品内、相对于所述组织或在所述组织内的空间位置相关联,其中在所述多个容器中的每一者中的本文公开的已知寡核苷酸独立地选自以下中的一种或组合:(x)包含第一脂质部分、第一杂交区和第一引物区的第一脂质缀合的DNA寡核苷酸;和/或(y)包含第二杂交区和第二脂质部分的第二脂质缀合的DNA寡核苷酸,其中所述第二杂交区是所述第一杂交区的反向互补体;和/或(z)包含第二引物区、条形码区和捕获序列的第三DNA寡核苷酸,其中所述第二引物区是所述第一引物区的反向互补体;其中分配步骤包括将厚度为约0.1至约99微米的所述样品的切片或三维制剂放置到多个容器中的一个中。在一些实施方案中,所公开的方法还包括:(g)使所述细胞暴露于流式细胞术。在一些实施方案中,在所公开的方法中分离细胞的步骤包括使所述细胞暴露于流式细胞术。
在一些实施方案中,本公开提供对来自受试者样品的一个或多个细胞的核酸进行测序的方法,包括:(a)将对应于所述样品的区域的所述一个或多个细胞分配到容器中;(b)用本文公开的寡核苷酸标记对应于所述样品的区域的所述一个或多个细胞;(c)从所述一个或多个细胞中分离所述核酸;以及(d)对来自所述一个或多个细胞的所述核酸进行测序,其中分配步骤包括将厚度为约0.1至约99微米的所述样品的切片或三维制剂放置到多个容器中的一个中。在一些实施方案中,所公开的方法还包括(e)编译来自所述一个或多个细胞中的每一个的序列信息。在一些实施方案中,所公开的方法还包括将所述核酸的所述序列信息和/或表达谱与所述样品内或所述受试者内的所述一个或多个细胞的空间位置相关联。
在一些实施方案中,所公开的方法的编译步骤包括产生对应于所述样品的区域的所述一个或多个细胞中的每一个的表达谱。在一些实施方案中,所公开的方法的标记步骤包括:(w)使所述一个或多个细胞暴露于一种或多种锚-脂质修饰的寡核苷酸,持续足以使所述锚-脂质修饰的寡核苷酸将其自身包埋在所述细胞的细胞膜内的时间段;和/或(x)使所述一个或多个细胞暴露于与所述锚-脂质修饰的寡核苷酸互补的一种或多种标记寡核苷酸,持续足以使所述锚-脂质修饰的寡核苷酸与所述一种或多种标记寡核苷酸形成核酸的互补链的时间段;和/或(y)将所述一种或多种标记寡核苷酸与所述一种或多种锚-脂质修饰的寡核苷酸连接;并任选(z)通过检测对应于所述一种或多种标记寡核苷酸的多个独特核苷酸序列中的一个来检测所述一种或多种标记寡核苷酸的存在。在一些实施方案中,所公开的方法的分离一个或多个细胞的核酸的步骤包括基于一种或多种标记寡核苷酸的存在来分离所述一个或多个细胞,其中通过检测对应于所述一种或多种标记寡核苷酸的多个独特核苷酸序列中的一个来确定所述一种或多种标记寡核苷酸的存在。
在一些实施方案中,本公开提供确认受试者的组织内的核酸的空间表达模式的方法,所述方法包括:(a)将来自对应于所述组织的区域的样品的一个或多个细胞分配到多个容器中的一个中;(b)用包含脂质部分、条形码区和捕获序列的脂质缀合的DNA寡核苷酸使所述一个或多个细胞暴露,持续足以使所述脂质部分将其自身包埋在所述一个或多个细胞的细胞膜内的时间段,其中所述脂质缀合的DNA寡核苷酸的所述条形码区对于所述一个或多个细胞暴露于其中的所述多个容器之一的每一者是独特的;(c)对所述一个或多个细胞中由所述脂质缀合的DNA寡核苷酸的所述捕获序列捕获的核酸进行测序;以及(d)根据包含在所述测序核酸中的每一者中的所述条形码区将来自所述一个或多个细胞的所述测序核酸与所述一个或多个细胞在所述组织内和/或相对于所述组织的空间位置相关联。在一些实施方案中,所公开的方法中使用的脂质缀合的DNA寡核苷酸包括:(i)包含所述脂质部分和第一引物区的第一脂质缀合的DNA寡核苷酸;和(ii)包含第二引物区、条形码区和捕获序列的第二DNA寡核苷酸,其中所述第二引物区是所述第一引物区的反向互补体。在一些实施方案中,所述第一脂质缀合的DNA寡核苷酸还包含第一杂交区。在一些实施方案中,所公开的方法还包括在测序的步骤之前使所述一个或多个细胞暴露于第二脂质缀合的DNA寡核苷酸,其中所述第二脂质缀合的DNA寡核苷酸包含第二杂交区和第二脂质部分,其中所述第二杂交区是所述第一杂交区的反向互补体。在一些实施方案中,所公开的方法还包括(e)使所述细胞暴露于流式细胞术。在一些实施方案中,所公开的方法的分配步骤包括将厚度为约0.1至约99微米的所述样品的组织切片或三维制剂放置到多个容器中的一个中。在一些实施方案中,所公开的方法中使用的所述一个或多个容器是多孔。在一些实施方案中,所公开的方法中使用的样品是组织切片。
在一些实施方案中,本公开的第一脂质缀合的DNA寡核苷酸(包括所公开的组合物和方法)从5'至3'取向包含所述第一脂质部分、所述第一杂交区和所述第一引物区。在其它实施方案中,本公开的第一脂质缀合的DNA寡核苷酸(包括所公开的组合物和方法)从3'至5'取向包含所述第一脂质部分、所述第一杂交区和所述第一引物区。
在一些实施方案中,本公开的第二脂质缀合的DNA寡核苷酸(包括所公开的组合物和方法)从5'至3'取向包含所述第二杂交区和所述第二脂质部分。在一些实施方案中,本公开的第二脂质缀合的DNA寡核苷酸(包括所公开的组合物和方法)从3'至5'取向包含所述第二杂交区和所述第二脂质部分。
在一些实施方案中,本公开的第三DNA寡核苷酸(包括所公开的组合物和方法)从5'至3'取向包含所述第二引物区、所述条形码区和所述捕获序列。在一些实施方案中,本公开的第三DNA寡核苷酸(包括所公开的组合物和方法)从3'至5'取向包含所述第二引物区、所述条形码区和所述捕获序列。
在一些实施方案中,本公开的第一脂质缀合的DNA寡核苷酸(包括所公开的组合物和方法)中使用的第一脂质部分包含具有约12至约28个碳的脂肪酸。在一些实施方案中,本公开的第二脂质缀合的DNA寡核苷酸(包括所公开的组合物和方法)中使用的第二脂质部分包含具有约12至约28个碳的脂肪酸。在一些实施方案中,本公开的脂质缀合的DNA寡核苷酸(包括所公开的组合物和方法)中使用的第一脂质部分和第二脂质部分均包含具有约12至约28个碳的脂肪酸。
在一些实施方案中,本公开的第一脂质缀合的DNA寡核苷酸(包括所公开的组合物和方法)中使用的第一脂质部分包含式I的化合物:
Figure BDA0003460412710000081
或其生理学上可接受的盐,
其中n1是5至25,n2是1至25,且X选自由NH、CH2、O和CH-R组成的组,其中R是C12至C28甘油单酯、烯基、烷基、芳基或芳烷基。在一些实施方案中,所述第一脂质部分包含选自由木蜡酸和胆固醇组成的组的脂质。在一些实施方案中,所述胆固醇是胆固醇-三甘醇(TEG)。
在一些实施方案中,本公开的第二脂质缀合的DNA寡核苷酸(包括所公开的组合物和方法)中使用的第二脂质部分包含式II的化合物:
Figure BDA0003460412710000091
或其生理学上可接受的盐,
其中n1是5至25,n2是0至24,且X选自由NH、CH2、O和CH-R组成的组,其中R是C12至C28甘油单酯、烯基、烷基、芳基或芳烷基。在一些实施方案中,所述第二脂质部分包含选自由棕榈酸和胆固醇组成的组的脂质。在一些实施方案中,所述胆固醇是胆固醇-三甘醇(TEG)。
在一些实施方案中,本公开的第三DNA寡核苷酸(包括所公开的组合物和方法)中使用的捕获序列是聚腺苷酸化区。
在一些实施方案中,本公开的第一脂质缀合的DNA寡核苷酸(包括所公开的组合物和方法)包含与SEQ ID NO:1(GTAACGATCCAGCTGTCACTTGGAATTCTCGGGTGCCAAGG)的核酸序列具有至少约70%序列同一性的核酸序列。在一些实施方案中,本公开的第二脂质缀合的DNA寡核苷酸(包括所公开的组合物和方法)包含与SEQ ID NO:2(AGTGACAGCTGGATCGTTAC)的核酸序列具有至少约70%序列同一性的核酸序列。在一些实施方案中,本公开的第三DNA寡核苷酸(包括所公开的组合物和方法)包含与SEQ ID NO:3(CCTTGGCACCCGAGAATTCCANNNN NNAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA)的核酸序列具有至少70%序列同一性的核酸序列。
在一些实施方案中,本公开的第一脂质缀合的DNA寡核苷酸(包括所公开的组合物和方法)与固体支持物结合。在一些实施方案中,本公开的第二脂质缀合的DNA寡核苷酸(包括所公开的组合物和方法)与固体支持物结合。在一些实施方案中,本公开的第三脂质缀合的DNA寡核苷酸(包括所公开的组合物和方法)与固体支持物结合。在一些实施方案中,所述第一脂质缀合的DNA寡核苷酸、所述第二脂质缀合的DNA寡核苷酸和所述第三脂质缀合的DNA寡核苷酸中的一者或多者与固体支持物结合。在一些实施方案中,所述固体支持物是珠粒。在一些实施方案中,本公开的第三DNA寡核苷酸(包括所公开的组合物和方法)中使用的捕获序列包含聚腺苷酸化区,并且所述珠粒包含与所述第三DNA寡核苷酸的所述聚腺苷酸化区杂交的聚(T)区。
附图说明
图1显示用作条形码分类工作流程的代表性实例的成人肠道实验的示意图和结果实例。注意,数据取自厚度超过1cm的组织的样品,并且仅是可以用实施例中提供的预测收集方法收集的数据的实例。
图2显示用作条形码分类工作流程的代表性实例的发育肠道实验的结果。注意,数据取自厚度超过1cm的组织的样品,并且仅是可以用实施例中提供的预测收集方法收集的数据的实例。
具体实施方式
在描述示例性实施方案之前要理解的是,本公开并不限于所描述的特定实施方案,因为这类实施方案当然可以是变化的。还要理解的是,本文使用的术语仅用于描述特定实施方案的目的,并不旨在为限制性的,因为本公开的范围将仅由所附权利要求限制。
在提供数值范围的情况下要理解的是,除上下文明确另有规定外,在该范围的上限与下限之间的每个中间值(精确到下限单位的十分之一)也被具体公开。规定范围内的任何规定值或中间值与该规定范围内的任何其它规定或中间值之间的每个较小范围都涵盖在本公开内。这些较小范围的上限和下限可独立地包括或排除在该范围内,并且其中任一限值都包括在较小范围内、任一限值都不包括在较小范围内或两个限值都包括在较小范围内的每个范围也涵盖在本公开内,受限于规定范围内的任何具体排除的限值。在规定范围包括限值中的一者或两者的情况下,排除那些包括的限值中的任一者或两者的范围也包括在本公开中。
除另有定义外,本文使用的所有技术和科学术语具有与本公开所属领域的普通技术人员通常理解的含义相同的含义。尽管在所公开的实施方案的实践或测试中可以使用与本文所述的那些类似或等同的任何方法和物质,但现在可以描述一些潜在的和示例性的方法和物质。本文提到的任何及所有出版物以全文引用的方式并入本文,以公开和描述与引用出版物相关的方法和/或物质。就存在矛盾的程度而言,本公开替代并入的出版物的任何公开内容。
进一步要注意的是,权利要求的设计可以排除任何可以是任选的要素。因此,这种表述旨在作为使用与权利要求要素的叙述相关的诸如“单独”、“仅”等排他性术语或使用“否定”限制的前置基础。
提供本文讨论的出版物仅仅是因为它们的公开内容在本申请的申请日之前。本文中的任何内容均不应解释为承认本公开无权先于这种出版物。进一步地,所提供的出版日期可能与可能需要独立确认的实际出版日期不同。在这类出版物可能给出的术语定义与本公开的明确或隐含定义冲突的程度上,以本公开的定义为准。
本领域技术人员在阅读本公开后将显而易见的是,本文描述和示出的每一个别实施方案都具有离散的组分和特征,这些组分和特征可以很容易地与其它若干实施方案中的任一者分开或组合,而不脱离本公开的范围或实质。任何列举的方法可以以列举的事件的顺序或以逻辑上可能的任何其它顺序来进行。
定义
在描述本发明组合物和方法之前要理解的是,本公开不限于所描述的特定分子、组合物、方法或方案,因为这些是可以变化的。还要理解的是,说明书中使用的术语仅用于描述特定形式或实施方案的目的,并不旨在限制本公开的范围,本公开的范围将仅由所附权利要求限制。要理解的是,这些实施方案不限于所描述的特定方法、方案、细胞系、载体和试剂,因为这些是可以变化的。还要理解的是,本文使用的术语仅用于描述特定实施方案的目的,并不旨在限制本发明实施方案或权利要求的范围。
除另有定义外,本文使用的所有技术和科学术语具有与本领域普通技术人员通常理解的含义相同的含义。尽管在本公开的实施方案的实践或测试中可以使用与本文所述的那些类似或等同的任何方法和物质,但现在对方法、装置和物质进行描述。本文提到的所有出版物以引用的方式并入本文。本文中的任何内容均不应解释为承认本公开无权借助在先公开而先于此类公开。
如本文在说明书和权利要求中使用的不定冠词“一个(种)”应被理解为意指“至少一个(种)”,除非明确指出相反的情况。
如本文在说明书和权利要求中所用的短语“和/或”应被理解为意指如此结合的要素中的“任一者或两者”,即在一些情况下结合地存在而在其它情况下分离地存在的要素。除了由“和/或”从句具体确认的要素之外,可任选存在其它要素,无论与具体确认的那些要素是否相关,除非明确指出相反的情况。因此,作为非限制性实例,当结合开放式语言如“包含”使用时提到“A和/或B”在一个实施方案中可以指A而没有B(任选包括除B以外的要素);在另一实施方案中指B而没有A(任选包括除A以外的要素);在又一实施方案中指A和B两者(任选包括其它要素);等等。
如本文在说明书和权利要求中所用,“或”应被理解为具有与如上所定义的“和/或”相同的含义。例如,当分隔列表中的项目时,“或”或“和/或”应被解释为包含性的,即包含多个要素或要素列表中的至少一个要素,但也包括多于一个要素,并且任选包括附加的未列项目。只有明确表示相反意思的术语,如“其中的仅一个”或“其中的恰好一个”,或在权利要求书中使用时,“由……组成”将指代包括多个要素或要素清单中的恰好一个要素。一般来说,如本文所用的术语“或”仅在前面有排他性措辞,“两者中的任一个”、“其中的一个”、“其中的仅一个”或“其中的恰好一个”时方可被解释为指示排他性替代方案(即“一个或另一个而不是二者”),“本质上由……组成”在权利要求书中使用时应具有专利法领域中所使用的一般含义。
如本文所用的术语“约”当指可测量的值如量、持续时间等时意指涵盖与指定值相差±20%、±10%、±5%、±1%或±0.1%的变化,因为这类变化适于实施所公开的方法。
如本文所用,短语“X至Y的整数”意指包括端点的任何整数。即,在公开了范围的情况下,包括端点的范围内的每个整数都被公开。例如,短语“X至Y的整数”公开了1、2、3、4或5以及1至5的范围。
如本文所用的术语“内源性”是指源自生物体内的物质。因此,“内源性”核酸是指源自或产生于生物体、组织或细胞内的核酸。
如本文所用,术语“标准化”或“标准化的”是指相对于一种或一组参考核酸的平均表达水平的核酸表达水平。参考核酸基于它们跨组织或细胞的最小变异。
术语“标记寡核苷酸”是指包含与本文定义的锚-脂质修饰的寡核苷酸的至少一部分互补的序列的寡核苷酸,使得锚-脂质修饰的寡核苷酸与标记寡核苷酸形成核酸的互补链。在一些实施方案中,标记寡核苷酸包含如本文所定义的引物区。在一些实施方案中,标记寡核苷酸包含如本文别处定义的条形码区。在一些实施方案中,标记寡核苷酸包含如本文所定义的捕获序列。
术语“脂质修饰的寡核苷酸”、“脂质-DNA”、“疏水锚定的寡核苷酸”及类似的术语应被广义地解释为包括通过任何方式附接于可被插入到膜中的疏水性、亲脂性或两亲性区域的任何寡核苷酸或多核苷酸,无论“脂质修饰的寡核苷酸”、“脂质-DNA”、“疏水锚定的寡核苷酸”或其部分是否实际插入到膜中。
术语“膜”或任何类似术语在本文中广泛和一般地用于指任何含脂质的膜、细胞膜、核膜、单层、双层、囊泡、脂质体、脂质双层等,并且本公开不旨在限于任何特定的膜。
如本文所用,可互换使用的术语“受试者”、“个体”或“患者”意指任何动物,包括哺乳动物,如小鼠、大鼠、其它啮齿动物、兔、狗、猫、猪、牛、绵羊、马,或灵长类动物,如人。
如本文所用,术语“试剂盒”是指在用于对核苷酸进行测序和/或分离核苷酸序列和/或基于来自样品或细胞的表达核苷酸序列的存在、不存在和/或量来诊断患有疾病或感染的受试者的系统的情况下提供的一组组件。在一些实施方案中,术语试剂盒是指在用于对核苷酸进行测序和/或分离核苷酸序列和/或基于样品或细胞中的表达核苷酸序列的空间位置来诊断患有疾病或感染的受试者的系统的情况下提供的一组组件。这类系统可包括例如允许在一个或多个细胞(例如,在适当容器中的寡核苷酸、编码酶的寡核苷酸,细胞外基质组分等)和/或支持物质(例如,缓冲液、培养基、细胞、用于进行测定的书面说明等)中储存、确认或从一个位置向另一位置递送表达基因的系统。例如,在一些实施方案中,试剂盒包括含有相关反应试剂和/或支持物质的一个或多个外壳(例如,盒)。如本文所用,术语“片段化试剂盒”是指包含两个或更多个单独容器的诊断测定,每个容器含有总试剂盒组分的子部分。容器可一起或分开地递送至预期的接受者。例如,第一容器可含有用于细胞培养测定的固体支持物或聚苯乙烯板,而第二容器可含有细胞,如对照细胞。作为另一实例,试剂盒可包括第一容器和第二容器,所述第一容器包含具有对本文公开的一种或多种生物标志物具有亲和力的一种或多种配体的固体支持物,如芯片或载玻片,所述第二容器包含检测和/或定量样品中脂质修饰的寡核苷酸的量所必需的任何一种或多种试剂。术语“片段化试剂盒”旨在涵盖含有根据Federal Food,Drug,and Cosmetic Act第520(e)条规定的分析物特异性试剂(ASR)的试剂盒,但不限于此。任何包含两个或多个单独容器的递送系统都包含在术语“碎片化试剂盒”中,每个容器包含总试剂盒组分的子部分。相比之下,“组合试剂盒”是指在单个容器中(例如,在容纳每种所需组分的单个盒中)含有所有组分的递送系统。术语“试剂盒”包括片段化的和组合的试剂盒两者。
如本文所用,术语“动物”包括但不限于人和非人类脊椎动物,如野生动物、啮齿动物如大鼠、雪貂,以及家养动物和农场动物,如狗、猫、马、猪、牛、绵羊和山羊。在一些实施方案中,所述动物是哺乳动物。在一些实施方案中,所述动物是人。在一些实施方案中,所述动物是非人类哺乳动物。
如本文所用,术语“哺乳动物”意指哺乳纲中的任何动物,如啮齿动物(即,小鼠、大鼠或豚鼠)、猴子、猫、狗、牛、马、猪或人。在一些实施方案中,所述哺乳动物是人。在一些实施方案中,所述哺乳动物是指任何非人类哺乳动物。本公开涉及本文公开的任何方法或物质组合物,其中样品取自哺乳动物或非人类哺乳动物。本公开涉及本文公开的任何方法或物质组合物,其中样品取自人。
如本文所用,短语“有需要的”意指动物或哺乳动物已被确认或怀疑有对特定方法或治疗的需要,所述特定方法或治疗是基于生物标志物的存在、不存在和/或量而需要的。在一些实施方案中,所述确认可通过任何诊断或观察手段进行。在本文所述的任何方法和治疗中,动物或哺乳动物可以是有需要的动物或哺乳动物。在一些实施方案中,动物或哺乳动物处于或将前往特定病症或病状流行或更有可能发生的环境中。
术语“核酸”、“寡核苷酸”和“多核苷酸”的特定用途决不应被认为是限制性的,并且在本文中可互换使用。当相关核酸分子通常包含少于约100个碱基时,使用“寡核苷酸”。当相关核酸分子通常包含超过约100个碱基时,使用“多核苷酸”。这两个术语都用于表示DNA、RNA、修饰或合成的DNA或RNA(包括但不限于包含合成和天然存在的碱基类似物、双脱氧糖或其它糖、硫醇或其它非天然或天然聚合物主链的核酸)或能够与DNA和/或RNA杂交的其它含核碱基的聚合物。因此,所述术语不应被解释为限定或限制本文提到和使用的核酸的长度,所述术语也不应被用于限制附接核碱基的聚合物主链的性质。
本公开的多核苷酸可以是单链的、双链的、三链的,或包括这些构象的组合。通常多核苷酸含有磷酸二酯键,尽管在一些情况下如下面所概述的那样包括可能具有替代主链的核酸类似物,包含磷酰胺、硫代磷酸酯、二硫代磷酸酯、O-甲基亚磷酰胺键接以及肽核酸主链和键接。其它类似物核酸包括吗啉代、锁核酸(LNA)以及具有正主链、非离子主链和非核糖主链的那些。含有一个或多个碳环糖的核酸也包括在核酸的定义内。可以对核糖-磷酸主链进行这些修饰,以便于添加另外的部分如标记,或者增加这类分子在生理环境中的稳定性和半衰期。
术语“核酸序列”或“多核苷酸序列”是指核苷酸碱基的连续串,并且在特定的上下文中还指核苷酸碱基在多核苷酸中出现时相对于彼此的特定布置。
如本文所用,术语“包含”及其任何形式(comprising/comprise/comprises/comprised)、“具有”及其任何形式(having/have/has)、“包括”及其任何形式(including/includes/include)或“含有”及其任何形式(containing/contains/contain)是包含性或开放式的,并且不排除附加未列举的要素或方法步骤。
如本文所用,术语“荧光探针”是指在暴露于已知波长的光时发射已知和/或可检测波长的光的任何分子(染料、肽或荧光标志物)。在一些实施方案中,具有已知切割位点的底物或肽可被一种或多种动物或单细胞生物体表达的任何酶识别。在一些实施方案中,荧光探针与本文公开的一种或多种寡核苷酸序列中的任一者附接。在一些实施方案中,荧光探针与本文公开的寡核苷酸的附接产生嵌合分子,所述嵌合分子在底物暴露于酶和已知波长的光时能够发射荧光,使得暴露于酶产生在荧光计或分光光度计存在下可定量的反应产物。在一些实施方案中,在底物的酶促切割之前,荧光探针在暴露于已知波长的光时完全猝灭,并且荧光探针发射已知波长的光,其强度可通过在荧光计的存在下和任选在探针从其上结合的寡核苷酸上切割之后的吸光度读数或强度水平来定量。在一些实施方案中,荧光探针是基于香豆素的染料或基于罗丹明的染料,其具有在预定波长的光的存在下或暴露于预定波长的光的情况下可测量或可定量的荧光发射光谱。在一些实施方案中,荧光探针包含罗丹明。在一些实施方案中,荧光探针包含罗丹明-100。基于香豆素的荧光探针是本领域中已知的,例如美国专利第7625758和7863048号,它们以全文引用的方式并入本文。在一些实施方案中,荧光探针是与与本文公开的任何酶共价结合、非共价结合、插入一种或多种底物的组分。在一些实施方案中,荧光探针选自ACC或AMC。在一些实施方案中,荧光探针是荧光素分子。在一些实施方案中,荧光探针能够在暴露于催化本文公开的一种或多种脂质修饰的寡核苷酸的切割的一种或多种酶之后发射可通过荧光计检测和/或定量的共振波。
如本文所用,术语“得分”是指可用作受试者的诊断、预后或临床治疗计划的预测模型中的组成部分的单个值或值范围,其中通过将原始数据值与基于系统中测量的特征或度量的对照值组合和/或将原始数据值针对基于系统中测量的特征或度量的对照值标准化来计算单个值。在一些实施方案中,通过解释函数或算法来计算得分。在一些实施方案中,受试者被怀疑具有促进或促成获得疾病状态的可能性或其表达与病原体的存在相关的基因的表达。可以使用在测序或分析样品中使用的设备内的计算机程序产品中可执行的已知算法来完成得分的计算。例如,在使用BioRAD ddSEQ单细胞隔离器的情况下,在标题为“Implementing the Drop-Seq Protocol on Bio-Rad’s ddSEQ Single-Cell Isolator”的BioRad出版物7139中描述了检测、定量或可视化探针和/或用探针标记的条形码所需的算法,网址为https://www.bio-rad.com/en-us/product/ddseq-single-cell-isolator?ID=OKNWBSE8Z,其内容以引用的方式全文并入。在一些实施方案中,本文公开的方法包括通过计算对照样品中的探针的量、计算细胞样品中的探针的量并通过减去获自对照样品的信号将获自细胞样品的信号标准化来检测给定条形码寡核苷酸的存在或不存在或量的子步骤。
为了便于检测本文公开的脂质修饰的寡核苷酸,可以对包括一个或多个反应容器的表面例如板、孔、珠粒或其它固体支持物预施加诸如可检测的物质。在一些实施方案中,样品可以在其被施加到表面上之前与稀释剂或试剂预混合。可检测的物质可充当可以在视觉上或通过仪器装置检测的脂质-寡核苷酸。通常能够产生可以在视觉上或通过仪器装置检测的信号的任何物质均可用作检测探针。合适的可检测物质可包括例如发光化合物(例如,荧光、磷光等);放射性化合物;可视化合物(例如,有色染料或金属物质,如金);含有产生信号的物质的脂质体或其它囊泡;酶和/或底物,等等。其它合适的可检测物质可参见授予Jou等人的美国专利第5,670,381号和授予Tarcha等人的美国专利第5,252,459号,上述美国专利出于所有目的以全文引用的方式并入本文。如果可检测物质是有色的,则理想的电磁辐射是互补波长的光。例如,蓝色检测探针强烈吸收红色光。在一些实施方案中,脂质修饰的寡核苷酸包含探针。在一些实施方案中,可检测探针包含发光化合物或由发光化合物组成,所述发光化合物产生对应于样品中的脂质-寡核苷酸的水平或量的光学可检测信号。例如,合适的荧光分子可包括但不限于荧光素、铕螯合物、藻胆蛋白、藻红蛋白、藻蓝蛋白、别藻蓝蛋白、邻苯二甲醛、荧光胺、罗丹明以及它们的衍生物和类似物。其它合适的荧光化合物有通常被称为“量子点”的半导体纳米晶体。例如,这类纳米晶体可含有式CdX的核,其中X是Se、Te、S等。纳米晶体也可以用式YZ的上覆壳钝化,其中Y是Cd或Zn,且Z是S或Se。合适半导体纳米晶体的其它实例也可参见授予Barbera-Guillem等人的美国专利第6,261,779号和授予Dapprich的美国专利第6,585,939号,上述美国专利出于所有目的以全文引用的方式并入本文。
进一步地,合适的磷光化合物可包括诸如钌、锇、铼、铱、铑、铂、铟、钯、钼、锝、铜、铁、铬、钨、锌等的一种或多种金属的金属络合物。特别优选钌、铼、锇、铂和钯。金属络合物可含有促进络合物在水性或非水性环境中溶解的一种或多种配体。例如,配体的一些合适的实例包括但不限于吡啶;吡嗪;异烟酰胺;咪唑;联吡啶;三联吡啶;菲咯啉;双吡啶并吩嗪;卟啉;卟吩;及其衍生物。这类配体可例如被烷基、取代的烷基、芳基、取代的芳基、芳烷基、取代的芳烷基、羧酸酯、甲醛、羧酰胺、氰基、氨基、羟基、亚氨基、羟基羰基、氨基羰基、脒、胍盐、酰脲、含硫基团、含磷基团和N-羟基琥珀酰亚胺的羧酸酯取代。
卟啉和卟啉金属络合物具有与亚甲基桥偶联在一起的吡咯基团以形成具有金属螯合内腔的环状结构。这些分子中的许多在室温下在合适的溶剂(例如,水)和无氧环境中表现出强磷光性质。能够表现出磷光性质的一些合适的卟啉络合物包括但不限于铂(II)粪卟啉-I和III、钯(II)粪卟啉、钌粪卟啉、锌(II)-粪卟啉-I、其衍生物等。类似地,能够表现出磷光性质的一些合适的卟吩络合物包括但不限于铂(II)四-内消旋-氟苯基卟吩和钯(II)四-内消旋-氟苯基卟吩。还有其它合适的卟啉和/或卟吩络合物描述于授予Schmidt等人的美国专利第4,614,723号;授予Hendrix的美国专利第5,464,741号;授予Soini的美国专利第5,518,883号;授予Ewart等人的美国专利第5,922,537号;授予Sagner等人的美国专利第6,004,530号;和授予Ponomarev等人的美国专利第6,582,930号,上述美国专利出于所有目的以全文引用的方式并入本文。
如本文所用,“序列同一性”通过使用用于两个序列(bl2seq)的可独立执行的BLAST引擎程序来确定,其可自National Center for Biotechnology Information(NCBI)ftp站点卸载,使用默认参数(Tatusova和Madden,FEMS Microbiol Lett.,1999,174,247-250;其以全文引用的方式并入本文)。使用术语“与…同源”与测量的“序列同一性”同义。
如本文所用,术语“样品”通常是指有限量的某物,其旨在类似于并代表较大量的该物。在本公开中,样品是要针对本文公开的测定或方法进行测试的收集物、拭子、刷布、刮屑、活检、移除的组织或手术切除物。在一些实施方案中,样品取自被认为包含过度增殖细胞的患者或受试者。在一些实施方案中,将被认为含有感染的样品与与已知不含一个或多个细胞的“对照样品”进行比较。在一些实施方案中,将被认为含有病原体细胞的样品与已知不含病原体细胞的对照样品进行比较。在一些实施方案中,将被认为含有过度增殖细胞的样品与已知不含过度增殖细胞的对照样品进行比较。在一些实施方案中,样品是环境场所或位置如实验室工作台或医疗装置的刷布。本公开考虑采用本文公开的任何一种或多种方法来基于有害基因或核苷酸序列的表达来确认、检测和/或定量特定物品或位置上的潜在有害的基因表达的量或有害病原体或有害细胞的量。
术语“互补的”或“互补性”是指通过碱基配对规则相关的多核苷酸(即,核苷酸的序列),例如,序列“5'-AGT-3'”与序列“5'-ACT-3'”互补。互补性可以是“部分的”,其中仅一些核酸的碱基根据碱基配对规则是匹配的,或者在核酸之间可以存在“完整的”或“完全的”互补性。在确定的条件下,核酸链之间的互补性程度可以对核酸链之间杂交的效率和强度具有显著影响。这对于依赖核酸碱基之间的结合的方法特别重要。
本文公开的任何探针可以是抗体。如本文所用的术语“抗体”是指由至少一个结合结构域组成的多肽或多肽组,所述结合结构域由具有三维结合空间的多肽链的折叠形成,所述结合空间具有与抗原的抗原决定簇的特征互补的内表面形状和电荷分布。抗体通常具有四聚体形式,包含两对相同的多肽链,每对具有一条“轻”链和一条“重”链。每个轻链/重链对的可变区形成抗体结合位点。如本文所用,“靶向结合剂”是优先与靶位点结合的抗体或其结合片段。在一个实施方案中,靶向结合剂仅对一个靶位点是特异性的。在其它实施方案中,靶向结合剂对多于一个靶位点是特异性的。在一个实施方案中,靶向结合剂可以是单克隆抗体,并且靶位点可以是细胞表面上的包含本文公开的一种或多种修饰的寡核苷酸的表位或抗原。抗体的“结合片段”通过重组DNA技术或通过完整抗体的酶促或化学切割产生。结合片段包括Fab、Fab'、F(ab')2、Fv和单链抗体。“双特异性”或“双功能”抗体以外的抗体被理解为其结合位点中的每一者都相同。当过量的抗体将与反受体结合的受体的量减少至少约20%、40%、60%或80%以及更通常超过约85%(如在体外竞争结合测定中测量)时,抗体基本上抑制受体与反受体的粘附。抗体可以是寡克隆抗体、多克隆抗体、单克隆抗体、嵌合抗体、CDR移植抗体、多特异性抗体、双特异性抗体、催化抗体、嵌合抗体、人源化抗体、完全人抗体、抗独特型抗体和可以可溶或结合形式标记的抗体以及其片段、变体或衍生物,单独或与已知技术提供的其它氨基酸序列组合。抗体可以来自任何物种。术语抗体还包括本发明的抗体的结合片段;示例性片段包括Fv、Fab、Fab'、单链抗体(svFC)、二聚体可变区(双抗体)和二硫化物稳定的可变区(dsFv)。如本文所讨论,本发明预期涵盖抗体或免疫球蛋白分子的氨基酸序列的微小变化,条件是氨基酸序列的变化与本文所述的抗体或免疫球蛋白分子保持至少75%、更优选至少80%、90%、95%且最优选99%的序列同一性。特别地,保守氨基酸置换是预期的。保守置换是发生在具有相关侧链的氨基酸家族内的那些。遗传编码的氨基酸通常分为以下家族:(1)酸性=天冬氨酸、谷氨酸;(2)碱性=赖氨酸、精氨酸、组氨酸;(3)非极性=丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸;和(4)不带电荷的极性=甘氨酸、天冬酰胺、谷氨酰胺、半胱氨酸、丝氨酸、苏氨酸、酪氨酸。更优选的家族是:丝氨酸和苏氨酸是脂族-羟基家族;天冬酰胺和谷氨酰胺是含酰胺的家族;丙氨酸、缬氨酸、亮氨酸和异亮氨酸是脂族家族;且苯丙氨酸、色氨酸和酪氨酸是芳族家族。例如,有理由预期用异亮氨酸或缬氨酸单独置换亮氨酸,用谷氨酸单独置换天冬氨酸,用丝氨酸单独置换苏氨酸,或用结构上相关的氨基酸进行类似的氨基酸置换,将不会对所得分子的结合功能或性质产生重大影响,特别是如果置换不涉及框架位点内的氨基酸。通过测定多肽衍生物的比活性可以很容易地确定氨基酸改变是否会产生功能性肽。测定在本文中有详细描述。本领域普通技术人员可以很容易地制备抗体或免疫球蛋白分子的片段或类似物。片段或类似物的优选氨基末端和羧基末端出现在功能结构域的边界附近。结构和功能结构域可通过将核苷酸和/或氨基酸序列数据与公共或专有序列数据库进行比较来确认。优选地,计算机化的比较方法用于确认出现在已知结构和/或功能的其它蛋白质中的序列基序或预测的蛋白质构象结构域。确认折叠成已知三维结构的蛋白质序列的方法是已知的,参见例如Bowie等人,Science 253:164(1991),该文献以引用的方式全文并入。可采用常规技术将抗体片段化,并以与上面针对完整抗体所述相同的方式对片段进行效用筛选。例如,可通过用胃蛋白酶处理抗体来产生F(ab′)2片段。可处理所得F(ab′)2片段以还原二硫桥,从而产生Fab′片段。
本公开还预期使用一种或多种嵌合抗体衍生物,即结合非人动物可变区和人恒定区的抗体分子。嵌合抗体分子可包括例如具有人恒定区的来自小鼠、大鼠或其它物种的抗体的抗原结合结构域。已经描述了多种制备嵌合抗体的方法,并且可用于制备含有识别分化细胞或肿瘤细胞表面上的选定抗原的免疫球蛋白可变区的嵌合抗体。参见例如Morrison等人,1985;Proc.Natl.Acad.Sci.U.S.A.81,6851;Takeda等人,1985,Nature 314:452;Cabilly等人,美国专利第4,816,567号;Boss等人,美国专利第4,816,397号;Tanaguchi等人,欧洲专利公布EP171496;欧洲专利公布0173494、英国专利GB 2177096B。在任何公开的方法中,所述方法可包括暴露对任何反应产物具有亲和力的任何抗体,所述反应产物是在将已知底物暴露于表1中列出的任何一种或多种酶后通过底物的切割产生的。
化学缀合基于使用具有E-氨基基团或铰链区硫醇基团的同型和异型双官能试剂。同型双官能试剂如5,5′-二硫代双(2-硝基苯甲酸)(DNTB)在两个Fab之间产生二硫键,且邻亚苯基二马来酰亚胺(O-PDM)在两个Fab之间产生硫醚键(Brenner等人,1985,Glennie等人,1987)。异型双官能试剂如N-琥珀酰亚胺基-3-(2-吡啶基二硫基)丙酸酯(SPDP)结合抗体和Fab片段的暴露氨基,而不管类别或同种型(Van Dijk等人,1989)。
可以使用各种形式来测试使用本公开的测定装置从受试者中分离的样品或细胞中存在或不存在脂质修饰的寡核苷酸或核酸序列或其功能片段。例如,“夹心”形式通常涉及将测试样品同与分析物的特异性结合成员(例如,抗体)缀合的脂质修饰的核酸序列混合,以在分析物与缀合探针之间形成络合物。然后使这些络合物与固定在检测区内的接受性物质(例如,抗体)接触。结合发生在分析物/探针缀合络合物与固定的接受性物质之间,从而定位可检测的“夹心”络合物,以指示分析物或抗原存在于本文公开的任一种细胞上。这种技术可用于获得定量或半定量结果。4,168,146号美国专利描述了这类夹心型测定的一些实例。
如本文所用,术语“杂交”用于指互补核酸的配对。杂交和杂交的强度(即,核酸之间缔合的强度)受诸如核酸之间的互补性程度、所涉及的条件的严格性和所形成的杂交体的Tm的因素的影响。“杂交”方法涉及一种核酸与另一种互补核酸(即具有互补核苷酸序列的核酸)的退火。
在允许特异性杂交的条件下进行杂交。互补序列的长度、二级结构和GC含量影响获得靶位点与靶核酸特异性杂交所需的杂交条件的热融点Tm。杂交可以在严格条件下进行。短语“严格杂交条件”是指这样的条件,在该条件下探针将与其靶子序列(通常在核酸的络合物混合物中),但不与可检测或显著水平的其它序列杂交。严格条件是序列依赖性的,并且在不同情况下是不同的。严格条件是这样的条件,其中在约6至约8之间的pH下盐浓度小于约1.0M钠离子,如小于约0.01M,包括约0.001M至约1.0M钠离子浓度(或其它盐),且温度在约20℃至约65℃的范围内。也可通过添加去稳定剂(如但不限于甲酰胺)来实现严格条件。
本公开的寡核苷酸序列、核酸序列或其它试剂尤其可作为药学上可接受的盐、酯或酰胺施用。术语“盐”是指本公开的化合物的无机和有机盐。盐可以在化合物的最终分离和纯化期间原位制备,或者通过使呈其游离碱或酸形式的纯化化合物与合适的有机或无机碱或酸单独反应并分离由此形成的盐来制备。代表性的盐包括氢溴酸盐、盐酸盐、硫酸盐、硫酸氢盐、硝酸盐、乙酸盐、草酸盐、棕榈酸盐、硬脂酸盐、月桂酸盐、硼酸盐、苯甲酸盐、乳酸盐、磷酸盐、甲苯磺酸盐、柠檬酸盐、马来酸盐、富马酸盐、琥珀酸盐、酒石酸盐、萘酸盐、甲磺酸盐、葡庚糖酸盐、乳糖醛酸盐和月桂基磺酸盐等。盐可包括基于以下的阳离子:碱金属和碱土金属,如钠、锂、钾、钙、镁等,以及无毒的铵、季铵和胺阳离子,包括但不限于铵、四甲基铵、四乙基铵、甲胺、二甲胺、三甲胺、三乙胺、乙胺等。参见例如S.M.Berge等人,“Pharmaceutical Salts,”J Pharm Sci,66:1-19(1977)。在一些实施方案中,本文公开的组合物包含本文公开的寡核苷酸序列的一种或多种盐。
术语“热融点”、“解链温度”或“Tm”在本文中是指这样的温度(在限定的离子强度、pH和核酸浓度下),在该温度下,50%的与靶互补的探针在平衡状态下与靶序列杂交(因为靶序列过量存在,在Tm下,50%的探针在平衡状态下被占据)。在一些情况下,术语“Td”用于定义至少一半的探针自完全匹配的靶核酸解离的温度。
在相应的核苷酸之间具有所有完全形成的氢键的双链体分子的形成被称为“匹配的”或“完全匹配的”,并且具有单对或几对不对应的核苷酸的双链体被称为“错配的”。在适当的实验条件下,单链RNA或DNA分子的任何组合可形成双链体分子(DNA:DNA、DNA:RNA、RNA:DNA或RNA:RNA)。类似地,合成类似物可以在适当的条件下彼此或与RNA和DNA形成双链体分子。
短语“选择性(或特异性)杂交”是指当特定核苷酸序列存在于络合物混合物(例如总细胞或文库DNA或RNA)中时,分子在严格杂交条件下仅与该序列结合、双链化或杂交。本领域普通技术人员将容易认识到,可利用替代杂交和洗涤条件来提供类似严格性的条件,并且将认识到,参数的组合比任何单个参数的测量重要得多。
“结合”是指大分子之间(例如,蛋白质与核酸之间)的序列特异性非共价相互作用。不是结合相互作用的所有组分都需要是序列特异性的(例如,与DNA主链中的磷酸残基接触),只要相互作用在整体上是序列特异性的。这类相互作用通常特征在于解离常数(Kd)为10-6M-1或更低。“亲和力”是指结合的强度:增加的结合亲和力与较低的Kd相关。
如在核酸或氨基酸序列同一性的上下文中使用的术语“基本上类似”是指具有至少约50%、至少约51%、至少约52%、至少约53%、至少约54%、至少约55%、至少约56%、至少约57%、至少约58%、至少约59%、至少约60%、至少约61%、至少约62%、至少约63%、至少约64%、至少约65%、至少约66%、至少约67%、至少约68%、至少约69%、至少约70%、至少约71%、至少约72%、至少约73%、至少约74%、至少约75%、至少约76%、至少约77%、至少约78%、至少约79%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%序列同一性的两个或更多个序列。
如本文所用,使用可得自作为European Molecular Biology Laboratory(EMBL)的一部分的European Bioinformatics Institute(EMBL-EBI)的EMBOSS成对比对算法工具来确定“%序列同一性”。这一工具可通过在"ebi.ac.uk/Tools/emboss/align/"的前面放置“www”定位的网站访问得到。这一工具利用Needleman-Wunsch全局比对算法(Needleman,S.B.和Wunsch,C.D.(1970)J.Mol.Biol.48,443-453;Kruskal,J.B.(1983)An overview ofsequence comparison In D.Sankoff and B.Kruskal,(编辑),Time warps,string editsand macromolecules:the theory and practice of sequence comparison,第1-44页Addison Wesley。利用默认设置,其包括Gap Open:10.0和Gap Extend 0.5。默认矩阵“Blosum62”用于氨基酸序列,且默认矩阵“DNAfull”用于核酸序列。
术语“可操作地连接”是指两种或更多种组分(如序列元件)的并置,其中组分的布置使得两种组分都正常发挥作用,并且允许组分中的至少一者可以介导施加于其它组分中的至少一者的功能的可能性。
如本文所用的“条形码”是指与多核苷酸相关的序列、标签或标签的组合,其特质(例如,标签DNA序列)可用于区分样品中的多核苷酸。在某些实施方案中,多核苷酸上的条形码用于确认多核苷酸的来源。例如,核酸样品可以是来源于不同来源的多核苷酸池(例如,来源于不同个体、不同组织或细胞的多核苷酸,或在不同时间点分离的多核苷酸),其中来自每种不同来源的多核苷酸用独特的条形码标记。因此,条形码提供了多核苷酸与其来源之间的相关性。在某些实施方案中,使用条形码来独特地标记样品中的每种单独的多核苷酸。样品中独特条形码的数目的确认可提供关于样品中存在多少种单独多核苷酸(或由多少种原始多核苷酸得到经操纵的多核苷酸样品;参见例如美国专利第7,537,897号,以全文引用的方式并入本文)的读数。条形码的长度范围可以为约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或约100个核苷酸碱基或更长,并且可以包括多个亚单位,其中每个不同的条形码具有不同的特质和/或亚单位顺序。在美国专利第7,544,473号以及美国专利第7,393,665号中描述了可用作条形码的示例性核酸标签,这两篇专利用于描述核酸标签及其在确认寡核苷酸中的用途的全文以引用的方式并入本文。在某些实施方案中,用于标记多个样品的一组条形码不需要具有任何特定的共同特性(例如,Tm、长度、碱基组成等),因为本文所述的方法可适应广泛多种的独特条形码组。这里要强调的是,条形码仅需要在给定的实验内是唯一的。因此,相同的条形码可用于标记在不同实验中处理的不同样品。此外,在某些实验中,使用者可使用相同的条形码来标记同一实验内的不同样品的子集。例如,来源于具有特定表型的个体的所有样品可以用相同的条形码标记,例如,来源于对照(或野生型)受试者的所有样品可以用第一条形码标记,而具有疾病状况的受试者可以用第二条形码(不同于第一条形码)标记。作为另一实例,可能希望用不同的条形码来标记来源于相同来源的不同样品(例如,随时间推移得到的或来源于组织内的不同部位的样品)。进一步地,可以以多种不同的方式产生条形码,例如通过组合标记方法,其中一个条形码通过连接(ligation)来附接,且第二条形码通过引物延伸来附接。在一些实施方案中,可以将多个独特的条形码附接于同一样品,以便增加其相对于其它样品的独特性。或者,一个条形码可代表一类样品(例如,孔板),且第二或第三条形码可代表该板内的特定孔。在一些实施方案中,可以通过将多于一种条形码寡核苷酸与脂质修饰的或疏水锚定的寡核苷酸杂交来用多个条形码标记样品,或者可以用多种条形码化脂质修饰的或疏水锚定的寡核苷酸标记样品。在一些实施方案中,个别细胞可经由分割池标记进行条形码化以产生与池中每个其它细胞不同的独特条形码谱。因此,可以以多种不同的方式设计和实施条形码,以在加工和分析期间跟踪多核苷酸片段,且因此在这方面不旨在进行限制。
“聚合酶链反应”或“PCR”意指通过DNA的互补链的同时引物延伸来体外扩增特定DNA序列的反应。换言之,PCR是用于产生侧接引物位点的靶核酸的多个拷贝或复制物的反应,这种反应包括以下步骤的一个或多个重复:(i)使靶核酸变性,(ii)将引物退火到引物位点,和(iii)在三磷酸核苷存在下通过核酸聚合酶延伸引物。通常,反应通过热循环仪仪器中针对每个步骤优化的不同温度循环进行。每个步骤的特定温度、持续时间以及步骤之间的变化速率取决于本领域普通技术人员熟知的许多因素,例如由以下参考文献例示:McPherson等人编,PCR:A Practical Approach和PCR2:A Practical Approach(IRLPress,Oxford,分别为1991和1995)。例如,在使用Taq DNA聚合酶的常规PCR中,双链靶核酸可在>90℃的温度下变性,引物在50-75℃范围内的温度下退火,且引物在72-78℃范围内的温度下延伸。术语“PCR”涵盖反应的衍生形式,包括但不限于RT-PCR、实时PCR、嵌套PCR、定量PCR、多重PCR等。反应体积在数百纳升(例如200nL)至数百μL(例如200μL)范围内。“逆转录PCR”或“RT-PCR”意指这样的PCR,在其之前是逆转录反应将靶RNA转化为互补单链DNA,其然后扩增,例如Tecott等人的美国专利第5,168,038号,该专利以引用的方式并入本文。“实时PCR”意指在反应进行时监测反应产物即扩增子的量的PCR。实时PCR有多种形式,其主要区别在于用于监测反应产物的检测化学,例如Gelfand等人,美国专利第5,210,015号
Figure BDA0003460412710000281
Wittwer等人,美国专利第6,174,670和6,569,627号(嵌入染料);Tyagi等人,美国专利第5,925,517号(分子信标);这些专利以引用的方式并入本文。实时PCR的检测化学综述于Mackay等人,Nucleic Acids Research,30:1292-1305(2002)中,该文献也以引用的方式并入本文。“嵌套PCR”意指两阶段PCR,其中第一PCR的扩增子成为使用新一组引物的第二PCR的样品,新一组引物中的至少一者与第一扩增子的内部位置结合。如本文所用,关于嵌套扩增反应的“初始引物”意指用于产生第一扩增子的引物,且“次级引物”意指用于产生第二或嵌套扩增子的一种或多种引物。“多重PCR”意指其中在相同的反应混合物中同时进行多个靶序列(或单个靶序列和一个或多个参考序列)的PCR,例如Bernard等人,Anal.Biochem.273:221-28(1999)(双色实时PCR)。通常,对每个被扩增的序列使用不同的引物组。
术语“过度增殖细胞”意指为癌性、癌前期、增生性或衰老的且不能正常地进行有丝分裂的细胞。在一些实施方案中,过度增殖细胞是肿瘤细胞。在一些实施方案中,过度增殖细胞包含功能失调的细胞周期,使其缺乏细胞凋亡或者代谢不稳定,使得细胞增殖快于相同类型且代谢稳定的细胞。
如本文所用,“表达”是指多核苷酸从DNA模板转录(如转录成mRNA或其它RNA转录物)的过程和/或转录的mRNA随后翻译成肽、多肽或蛋白质的过程。转录物和编码的多肽可统称为“基因产物”。如果多核苷酸来源于基因组DNA,则表达可包括真核细胞中的mRNA的剪接。
术语“功能片段”意指多肽或核酸序列中与相应的全长多肽或核酸相关的任何部分,其足够长且具有足够的结构以赋予至少类似于或基本上类似于该片段所基于的全长多肽或核酸的生物学效应。在一些实施方案中,功能片段是全长或野生型核酸序列的一部分,其编码本文公开的任一核酸序列,并且所述部分编码小于全长的一定长度和/或结构的多肽,但编码与全长或野生型蛋白相比仍具有生物学功能的结构域。在一些实施方案中,功能片段与该片段所基于的野生型或全长多肽序列相比可具有降低的生物活性、
大约相等的生物活性或增强的生物活性。在一些实施方案中,功能片段来源于生物体如人的序列。在这类实施方案中,功能片段可保留与衍生该序列的野生型人序列99%、98%、97%、96%、95%、94%、93%、92%、91%或90%的序列同一性。在一些实施方案中,功能片段可保留与衍生该序列的野生型序列或核苷酸的寡核苷酸部分85%、80%、75%、70%、65%或60%的序列同源性。
脂质修饰的寡核苷酸
本公开涉及用于细胞条形码化方法的组合物和使用所述组合物的方法,所述细胞条形码化方法使用最近开发的特定组的脂质缀合的或疏水锚定的寡核苷酸来有效地标记来源于不同患者或测试条件的单细胞。随后可将寡核苷酸条形码(用PCR手柄、独特的标识符和捕获序列工程化)引入到细胞和细胞亚群中,所述细胞和细胞亚群被处理用于基于液滴微流体的RNA测序文库制备。
Selden等人,J.Am.Chem.Soc.134:765-68(2012);Weber等人,BioMacromolecules15:4621-26(2014);和公布的美国专利申请第2017/0305955号中公开了经由双组分系统将脂质修饰的寡核苷酸稳定地包埋在细胞质膜内,上述每一者以全文引用的方式并入本文。
如本文公开的脂质修饰的寡核苷酸的一个一般和非限制性实例在权利要求中给出。此脂质修饰的寡核苷酸包括三种寡核苷酸:第一寡核苷酸,其从5'至3'取向包含第一脂质部分、第一杂交区和第一引物区;第二寡核苷酸,其从5'至3'取向包含第二杂交区和第二脂质部分,其中所述第二杂交区是所述第一杂交区的反向互补体;和第三寡核苷酸,其从5'至3'取向包含第二引物区、条形码区和捕获序列,其中所述第二引物区是所述第一引物区的反向互补体。
本公开还涉及微流体和标记的核酸。例如,某些方面通常涉及用于标记微流体液滴或其它区室(例如,来自细胞)内的核酸的系统和方法。在一组实施方案中,可制备含有可用于测定靶核酸的寡核苷酸的颗粒,例如附接于颗粒的表面。寡核苷酸可包括“条形码”或独特序列,其可用于将液滴中的核酸与另一液滴中的核酸区分开,例如甚至在核酸被汇集在一起或从液滴中移除后。本发明的某些实施方案通常涉及用于将另外的或任何的序列附接于微流体液滴或其它区室内的核酸的系统和方法,例如可用于选择性地确定或扩增怀疑存在于微滴内的所需序列的识别序列。这类系统可例如用于各种应用中的选择性扩增,例如高通量测序应用。
本公开的一些方面通常涉及用于在微流体微滴或其它合适的区室(例如,微孔板的微孔、载玻片或其它表面上的单个斑点等)内用脂质修饰的或疏水锚定的寡核苷酸容纳或包封核酸的系统和方法。在一些情况下,核酸和寡核苷酸可连接或附接在一起。核酸可来自于溶解的细胞、细胞器或液滴内的其它物质。液滴内的寡核苷酸可与其它液滴中(例如,多个液滴或液滴群内)的寡核苷酸区分开。例如,寡核苷酸可含有在各液滴之间不同的一个或多个独特的序列或“条形码”。因此,可通过确定与核酸相关的条形码来唯一地识别每个液滴内的核酸。这可能是重要的,例如如果液滴“破碎”或破裂,并且来自不同液滴的核酸随后合并或汇集在一起,例如用于测序或其它分析。
本公开涉及包含一种或多种脂质修饰的寡核苷酸的细胞,其中所述脂质修饰的寡核苷酸包含脂质部分区和任选捕获区。在一些实施方案中,所述细胞是过度增殖细胞来自细胞系的转化细胞或分离自受试者或患者的原代细胞。
本公开还涉及包括板、盘或其它固体支持物的系统,所述板、盘或其它固体支持物包括一个或多个容器,样品、活检、细胞或组织被固定到其中或吸收于容器表面,并暴露一个或多个条形码,每个容器包含对应于样品、活检、细胞或组织中的细胞和/或核酸表达位置的独特条形码或多个条形码。
脂质部分区
在一些实施方案中,脂质部分区包含烷基链和烯基、烷基、芳基或芳烷基链。此烯基、烷基、芳基或芳烷基链可包含约12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100个碳原子或更多。在一些实施方案中,烷基链包含约12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100个碳原子或更多,且烯基、烷基、芳基或芳烷基链包含约12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100个碳原子或更多。在一些实施方案中,所述链共享相同数目的碳原子。在其它实施方案中,一条链比另一条链少约1、2、3、4、5、6、7、8、9或10个碳原子。脂质部分区可包含多于一个烯基、芳基或芳烷基链,每条链包含12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100个碳原子或更多。
在一些实施方案中,脂质部分区可包含一个或多个不饱和碳键。在一些实施方案中,不饱和键全含在同一链内。在其它实施方案中,不饱和键可含在多于一条链中。
在某些实施方案中,脂质部分区包含二烷基磷酸甘油酯,且多核苷酸与二烷基磷酸甘油酯缀合。在一些实施方案中,二烷基磷酸甘油酯的每条链具有与其它链相同数目的碳原子。在其它实施方案中,二烷基磷酸甘油酯的两条烷基链之间碳原子数不同。在一些实施方案中,每条链具有12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100个碳原子或更多。在一些实施方案中,每条链具有约12个碳原子或约14个碳原子、约16个碳原子、约18个碳原子、约20个碳原子或约22个碳原子。在一些实施方案中,至少一条链具有约12个碳原子、约14个碳原子、约16个碳原子、约18个碳原子、约20个碳原子或约22个碳原子。
脂质部分区可包含单烷基酰胺,且多核苷酸可与单烷基酰胺缀合。在一些实施方案中,单烷基酰胺链具有约12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或约100个碳原子或更多。在一些实施方案中,单烷基酰胺链具有约12个碳原子或约14个碳原子、约16个碳原子、约18个碳原子、约20个碳原子或约22个碳原子。在某些实施方案中,单烷基酰胺包含约16或18个碳原子。
在其它实施方案中,脂质部分区和多核苷酸通过包含磷酸基团的化合物连接。在其它实施方案中,脂质部分区和多核苷酸通过包含脲基团的化合物连接。还在其它实施方案中,脂质部分区和多核苷酸通过包含磺酰基的化合物连接。在另一实施方案中,脂质部分区和多核苷酸通过包含磺酰胺、醚、硫醚、氨基甲酸酯或碳酸酯基团的化合物连接。
还在其它实施方案中,脂质部分区可包含固醇基团。在一些实施方案中,固醇基团可以是天然的或合成的或来源于带有(或修饰为带有)用于附接至多核苷酸的官能团的固醇化合物。例如,来自生物来源的固醇通常以游离固醇、酰化(固醇酯)、烷基化(固醇基烷基醚)、硫酸化(硫酸胆固醇)或与本身可以被酰化(酰化固醇糖苷)的糖苷部分(固醇基糖苷)连接的形式存在(参见例如Fahy等人,J.Lipid Res.46:839-61(2005),该文献全文并入)。实例包括(1)可获自动物来源的固醇,在本文中被称为“动物固醇”,如动物固醇胆固醇和某些类固醇激素;和(2)可获自植物、真菌和海洋来源的固醇,在本文中被称为“植物固醇”,如植物固醇菜油固醇、谷固醇、豆固醇和麦角固醇。这些固醇通常带有至少一个游离羟基,通常在环A的3位、在另一位置或其组合,或可根据需要进行修饰以加入合适的羟基或其它官能团。
特别受关注的固醇是带有用于附接至多核苷酸的独特官能团的简单固醇。特别受关注的是其中独特官能团是羟基的简单固醇,且特别是具有位于环A的3位的羟基的简单固醇(例如,胆固醇、β-谷固醇、豆固醇、菜油固醇和菜子固醇、麦角固醇等及其衍生物)。
胆固醇在某些实施方案中对于包含在脂质部分区中是特别受关注的。受关注的胆固醇类别(包括取代的胆固醇)的代表性固醇包括例如以下:(1)天然和合成固醇,如胆固醇(绵羊毛)、胆固醇(植物来源的)、链固醇、豆固醇、β-谷固醇、硫代胆固醇、3-胆固醇丙烯酸酯;(2)A-环取代的氧固醇,如胆固烷醇和胆固烯酮;(3)B-环取代的氧固醇,如7-酮基胆固醇、5α,6α-环氧胆固烷醇、5β,6β-环氧胆固烷醇和7-脱氢胆固醇;(4)D-环取代的氧固醇,如25-酮基胆固烯和15-酮基胆固烷;(5)侧链取代的氧固醇,如25-羟基胆固醇、27-羟基胆固醇、24(R/S)-羟基胆固醇、24(R/S),25-环氧胆固醇和24(S),25-环氧胆固醇;(6)羊毛固醇,如24-二氢羊毛固醇和羊毛固醇;(7)氟化固醇,如F7-胆固醇、F7-5α,6α-环氧胆固烷醇、F7-5β,6β-环氧胆固烷醇和F7-7-酮基胆固醇;(8)荧光胆固醇,如25-NBD胆固醇、脱氢麦角固醇和胆固醇三烯。这些化合物还可包括氘化和非氘化形式,并且是可商购的,如商购自AvantiPolar Lipids,Inc。
在某些实施方案中,脂质部分区可包含饱和或不饱和、直链或支链、取代或未取代的脂族链。特别受关注的是具有2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个碳的饱和或不饱和、直链或支链、取代或未取代的烃链。
进一步的实施方案可包含基于或可来源于各种脂质的元件,所述脂质如脂族酸、甘油脂质、甘油磷脂、鞘脂、异戊烯醇脂质、聚异戊烯醇脂质和糖脂,如来自Fahy等人,J.Lipid Res.46:839-61(2005)中描述的脂质。
“锚”脂质修饰的或疏水锚定的寡核苷酸(例如,从5'至3'方向或从3'至5'方向包含第一脂质部分、第一杂交区和第一引物区的脂质修饰的寡核苷酸)和“共锚”脂质修饰的或疏水锚定的寡核苷酸(例如,从5'至3'方向或从3'至5'取向包含第二杂交区和第二脂质部分的脂质修饰的寡核苷酸,其中第二杂交区是第一杂交区的反向互补体)可包含相同的脂质部分或不同的脂质部分(例如,不同的碳链长度、不同的组成或不同的修饰)。在一些实施方案中,“锚”脂质修饰的或疏水锚定的寡核苷酸包含含有与“共锚”脂质修饰的或疏水锚定的寡核苷酸的脂质部分相同数目的碳的脂质部分。在一些实施方案中,与“共锚”脂质修饰的或疏水锚定的寡核苷酸的脂质部分相比,“锚”脂质修饰的或疏水锚定的寡核苷酸包含含有约1、2、3、4、5、6、7、8、9、10、11或12或更多个碳的脂质部分。在一些实施方案中,与“锚”脂质修饰的或疏水锚定的寡核苷酸的脂质部分相比,“共锚”脂质修饰的或疏水锚定的寡核苷酸包含含有约1、2、3、4、5、6、7、8、9、10、11或12或更多个碳的脂质部分。在一些实施方案中,与“共锚”脂质修饰的或疏水锚定的寡核苷酸的脂质部分相比,“锚”脂质修饰的或疏水锚定的寡核苷酸包含含有约1、2、3、4、5、6、7、8、9、10、11或12或更多个碳的脂质部分。在一些实施方案中,仅使用锚脂质修饰的或疏水锚定的寡核苷酸,没有相应的共锚脂质修饰的或疏水锚定的寡核苷酸。
在一些实施方案中,脂质部分(即,在仅有锚脂质修饰的或疏水锚定的寡核苷酸的实施方案中的脂质部分,或在兼有锚脂质修饰的或疏水锚定的寡核苷酸和共锚脂质修饰的或疏水锚定的寡核苷酸的实施方案中的第一或第二脂质部分)包含式I的化合物:
Figure BDA0003460412710000361
或其生理学上可接受的盐,
其中n1是5至25,n2是1至25,且X选自由NH、CH2、O和CH-R组成的组,其中R是C12至C28甘油单酯、烯基、烷基、芳基或芳烷基。
在一些实施方案中,脂质部分(即,在仅有锚脂质修饰的或疏水锚定的寡核苷酸的实施方案中的脂质部分,或在兼有锚脂质修饰的或疏水锚定的寡核苷酸和共锚脂质修饰的或疏水锚定的寡核苷酸的实施方案中的第一或第二脂质部分)包含式II的化合物:
Figure BDA0003460412710000371
或其生理学上可接受的盐,
其中n1是5至25,n2是0至24,且X选自由NH、CH2、O和CH-R组成的组,其中R是C12至C28甘油单酯、烯基、烷基、芳基或芳烷基。在一些实施方案中,脂质部分、第一脂质部分、第二脂质部分或这两个脂质部分包含式III的化合物:
Figure BDA0003460412710000372
在一些实施方案中,“锚”脂质修饰的或疏水锚定的寡核苷酸包含固醇部分,且“共锚”脂质修饰的或疏水锚定的寡核苷酸包含脂质部分。在一些实施方案中,“共锚”脂质修饰的或疏水锚定的寡核苷酸包含固醇部分,且“锚”脂质修饰的或疏水锚定的寡核苷酸包含脂质部分。在一些实施方案中,“锚”脂质修饰的或疏水锚定的寡核苷酸和“共锚”脂质修饰的或疏水锚定的寡核苷酸均包含固醇部分。
杂交区
锚脂质修饰的或疏水锚定的寡核苷酸和共锚脂质修饰的或疏水锚定的寡核苷酸包含彼此互补的杂交区。锚脂质修饰的或疏水锚定的寡核苷酸包含与第一杂交区可操作地连接(例如,共价连接)的脂质部分,所述第一杂交区包含10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100或更多个核苷酸碱基的寡核苷酸。寡核苷酸可以是DNA、RNA或修饰或合成的DNA或RNA。
共锚脂质修饰的或疏水锚定的寡核苷酸包含与第二杂交区可操作地连接(例如,共价连接)的脂质部分,所述第二杂交区包含10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100或更多个核苷酸碱基的寡核苷酸。寡核苷酸可以是DNA、RNA或修饰或合成的DNA或RNA。在一些实施方案中,第二杂交区是与第一杂交区相同类型的核酸(例如,如果第一杂交区是DNA,则第二杂交区是DNA),或者第二杂交区与第一杂交区相比可以是不同类型的核酸(例如,如果第一杂交区是DNA,则第二杂交区可以是RNA或修饰或合成的DNA或RNA)。
第二杂交区是第一杂交区的反向互补体。在一些实施方案中,互补性可以是完全互补性(即,第二杂交区与第一杂交区长度相同,并且第二杂交区的每个碱基与其在第一杂交区上的碱基对完全互补)。在一些实施方案中,第一杂交区相比第二杂交区含有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79或80或更多个额外的碱基。在一些实施方案中,第二杂交区相比第一杂交区含有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79或80或更多个额外的碱基。在一些实施方案中,第一杂交区具有与第二杂交区至少约50%、至少约51%、至少约52%、至少约53%、至少约54%、至少约55%、至少约56%、至少约57%、至少约58%、至少约59%、至少约60%、至少约61%、至少约62%、至少约63%、至少约64%、至少约65%、至少约66%、至少约67%、至少约68%、至少约69%、至少约70%、至少约71%、至少约72%、至少约73%、至少约74%、至少约75%、至少约76%、至少约77%、至少约78%、至少约79%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%的序列同一性。
在一些实施方案中,第一杂交区具有与SEQ ID NO:4(GTAACGATCCAGCTGTCACT)至少约50%、至少约51%、至少约52%、至少约53%、至少约54%、至少约55%、至少约56%、至少约57%、至少约58%、至少约59%、至少约60%、至少约61%、至少约62%、至少约63%、至少约64%、至少约65%、至少约66%、至少约67%、至少约68%、至少约69%、至少约70%、至少约71%、至少约72%、至少约73%、至少约74%、至少约75%、至少约76%、至少约77%、至少约78%、至少约79%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%的序列同一性。
在一些实施方案中,第二杂交区具有与SEQ ID NO:2(AGTGACAGCTGGATCGTTAC)至少约50%、至少约51%、至少约52%、至少约53%、至少约54%、至少约55%、至少约56%、至少约57%、至少约58%、至少约59%、至少约60%、至少约61%、至少约62%、至少约63%、至少约64%、至少约65%、至少约66%、至少约67%、至少约68%、至少约69%、至少约70%、至少约71%、至少约72%、至少约73%、至少约74%、至少约75%、至少约76%、至少约77%、至少约78%、至少约79%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%的序列同一性。
引物区
锚脂质修饰的或疏水锚定的寡核苷酸和条形码寡核苷酸包含彼此互补的引物区。锚脂质修饰的或疏水锚定的寡核苷酸包含与第一杂交区可操作地连接(例如,共价连接)的脂质部分,所述第一杂交区与包含10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30或更多个核苷酸碱基的寡核苷酸的第一引物区可操作地连接(例如,共价连接)。寡核苷酸可以是DNA、RNA或修饰或合成的DNA或RNA。
条形码寡核苷酸包含与条形码区(下述)可操作地连接(例如,共价连接)的第二引物区,所述条形码区又与捕获序列(下述)可操作地连接(例如,共价连接),第二引物区包含10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30或更多个核苷酸碱基的寡核苷酸。寡核苷酸可以是DNA、RNA或修饰或合成的DNA或RNA。在一些实施方案中,第二引物区是与第一引物区相同类型的核酸(例如,如果第一引物区是DNA,则第二引物区是DNA),或者第二引物区与第一引物区相比可以是不同类型的核酸(例如,如果第一引物区是DNA,则第二引物区可以是RNA或修饰或合成的DNA或RNA)。
第二引物区是第一引物区的反向互补体。在一些实施方案中,互补性可以是完全互补性(即,第二引物区与第一引物区长度相同,并且第二引物区的每个碱基与其在第一引物区上的碱基对完全互补)。在一些实施方案中,第一引物区相比第二引物区含有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20或更多个额外的碱基。在一些实施方案中,第二引物区相比第一引物区含有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20或更多个额外的碱基。在一些实施方案中,第一引物区具有与第二引物区至少约50%、至少约51%、至少约52%、至少约53%、至少约54%、至少约55%、至少约56%、至少约57%、至少约58%、至少约59%、至少约60%、至少约61%、至少约62%、至少约63%、至少约64%、至少约65%、至少约66%、至少约67%、至少约68%、至少约69%、至少约70%、至少约71%、至少约72%、至少约73%、至少约74%、至少约75%、至少约76%、至少约77%、至少约78%、至少约79%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%的序列同一性。
在一些实施方案中,第一引物区具有与SEQ ID NO:5(TGGAATTCTCGGGTGCCAAGG)至少约50%、至少约51%、至少约52%、至少约53%、至少约54%、至少约55%、至少约56%、至少约57%、至少约58%、至少约59%、至少约60%、至少约61%、至少约62%、至少约63%、至少约64%、至少约65%、至少约66%、至少约67%、至少约68%、至少约69%、至少约70%、至少约71%、至少约72%、至少约73%、至少约74%、至少约75%、至少约76%、至少约77%、至少约78%、至少约79%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%的序列同一性。
在一些实施方案中,第二引物区具有与SEQ ID NO:6(CCTTGGCACCCGAGAATTCCA)至少约50%、至少约51%、至少约52%、至少约53%、至少约54%、至少约55%、至少约56%、至少约57%、至少约58%、至少约59%、至少约60%、至少约61%、至少约62%、至少约63%、至少约64%、至少约65%、至少约66%、至少约67%、至少约68%、至少约69%、至少约70%、至少约71%、至少约72%、至少约73%、至少约74%、至少约75%、至少约76%、至少约77%、至少约78%、至少约79%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%的序列同一性。
条形码区
条形码寡核苷酸包含与条形码区可操作地连接(例如,共价连接)的第二引物区,所述条形码区又与捕获序列(下述)可操作地连接(例如,共价连接),条形码区包含2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100或更多个核苷酸碱基的寡核苷酸。寡核苷酸可以是DNA、RNA或修饰或合成的DNA或RNA。设计条形码序列组的方法示于例如美国专利第6,235,475号中,该专利的内容以全文引用的方式并入本文。美国公布2008/0081330和美国公布2011/0301042中示出将条形码序列附接于核酸模板,上述美国公布中的每一者的内容以全文引用的方式并入本文。设计条形码序列组的方法和附接条形码序列的其它方法示于美国专利第6,138,077;6,352,828;5,636,400;6,172,214;6,235,475;7,393,665;7,544,473;5,846,719;5,695,934;5,604,097;6,150,516;RE39,793;7,537,897;6,172,218;和5,863,722号中,上述美国专利中的每一者的内容以全文引用的方式并入本文。美国公布2016/0046986中描述了用于测序和拷贝数估计的条形码,其以全文引用的方式并入本文。
条形码可以是完全随机的,或者它们可以用某些预定的序列进行工程化。它们可具有随机性或半随机性区及其它固定区。条形码可包括其它区,如引发位点、衔接子或将有利于进一步处理和分析的其它互补区。可以在通过第一和第二引物区的杂交结合或捕获锚脂质修饰的或疏水锚定的寡核苷酸之前产生特定条形码本身相对于其第二引物区的特质。因此,在一些实施方案中,产生所有条形码的数据库,并在一些实施方案中将其存储在计算机存储介质上。
在一些实施方案中,条形码区的最后一个核苷酸将与捕获序列的第一个核苷酸不相同。例如,如果捕获序列是聚腺苷酸化尾,则在一些实施方案中,条形码区的最后一个核苷酸将不是腺嘌呤。
条形码使得能够标记或跟踪包含脂质修饰的或疏水锚定的寡核苷酸的细胞或膜,以便允许特定细胞或膜的随后确认和来源。将条形码分配给个别寡核苷酸或寡核苷酸亚组可允许将独特的特质分配给个别序列、序列的片段或细胞。这可允许自个别样品获取数据,并且不限于样品的平均值。
在一些实施方案中,寡核苷酸可以共享共同的条形码,因此可以随后被确认为来源于相同的靶细胞。(相同或不同类型的)多个细胞可以通过使用多个条形码来确认,每个条形码确认特定的细胞类型或特定细胞类型内的多个细胞。
单细胞或膜可包含多于一种脂质修饰的或疏水锚定的寡核苷酸,每种脂质修饰的或疏水锚定的寡核苷酸具有不同的第一引物区。这类细胞或膜因此可通过不同的条形码寡核苷酸予以分离和/或确认,每种条形码寡核苷酸包含与不同的第一引物区具有互补性的第二引物区,且单个条形码用于每种条形码寡核苷酸,或者不同的条形码用于一些或所有的条形码寡核苷酸。
捕获序列
在一些实施方案中,条形码寡核苷酸包含与条形码区可操作地连接(例如,共价连接)的第二引物区,所述条形码区又与捕获序列(下述)可操作地连接(例如,共价连接),所述捕获序列包含2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100或更多个核苷酸碱基的寡核苷酸。寡核苷酸可以是DNA、RNA或修饰或合成的DNA或RNA。
在一些实施方案中,捕获序列是聚腺苷酸化尾(“聚(A)尾”),即整个捕获序列由腺嘌呤碱基组成。在一些实施方案中,捕获序列具有与聚(A)尾至少约50%、至少约51%、至少约52%、至少约53%、至少约54%、至少约55%、至少约56%、至少约57%、至少约58%、至少约59%、至少约60%、至少约61%、至少约62%、至少约63%、至少约64%、至少约65%、至少约66%、至少约67%、至少约68%、至少约69%、至少约70%、至少约71%、至少约72%、至少约73%、至少约74%、至少约75%、至少约76%、至少约77%、至少约78%、至少约79%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%的序列同一性。在一些实施方案中,捕获序列具有SEQ ID NO:7(AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA)的序列。
在一些实施方案中,捕获序列是聚胸腺嘧啶尾(“聚(T)尾”),即整个捕获序列由胸腺嘧啶碱基组成。在一些实施方案中,捕获序列具有与聚(T)尾至少约50%、至少约51%、至少约52%、至少约53%、至少约54%、至少约55%、至少约56%、至少约57%、至少约58%、至少约59%、至少约60%、至少约61%、至少约62%、至少约63%、至少约64%、至少约65%、至少约66%、至少约67%、至少约68%、至少约69%、至少约70%、至少约71%、至少约72%、至少约73%、至少约74%、至少约75%、至少约76%、至少约77%、至少约78%、至少约79%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%的序列同一性。
在一些实施方案中,捕获序列是聚尿嘧啶尾(“聚(U)尾”),即整个捕获序列由尿嘧啶碱基组成。在一些实施方案中,捕获序列具有与聚(U)尾至少约50%、至少约51%、至少约52%、至少约53%、至少约54%、至少约55%、至少约56%、至少约57%、至少约58%、至少约59%、至少约60%、至少约61%、至少约62%、至少约63%、至少约64%、至少约65%、至少约66%、至少约67%、至少约68%、至少约69%、至少约70%、至少约71%、至少约72%、至少约73%、至少约74%、至少约75%、至少约76%、至少约77%、至少约78%、至少约79%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%的序列同一性。
在一些实施方案中,捕获序列是聚(A)、聚(T)或聚(U)尾的变体。这类变体包括除纯聚(A)、聚(T)或聚(U)尾之外的碱基。例如,变体可包括捕获序列,如聚(A)变体,如AAUAAA、AUUAAA AACAAG、AACAAA、AAUAAU、AAUAAG、UAUAAA、AGUAAA、AAUACA、CAUAAA、AAUAUA、GAUAAA、AAUGAA、AAGAAA、ACUAAA、AAUAGA、AAUAAU、AACAAA、AUUACA、AUUAUA、AACAAG或AAUAAG,如果需要的话,每种变体含有额外的核苷酸碱基,例如7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100个额外的核苷酸碱基,大部分并且在一些实施方案中所有额外的核苷酸碱基是腺嘌呤。可类似地构建变体聚(T)和聚(U)捕获序列。
在一些实施方案中,代替捕获序列的是,偶联对的成员(例如抗体/抗原、受体/配体或抗生物素蛋白-生物素对,如以引用的方式并入本文的美国专利申请第2006/0252077号中所述)可连接于要捕获在用该偶联对的相应第二成员包被的表面上的每个片段。继捕获之后,可例如通过单分子检测/测序来分析序列,例如以引用的方式并入本文的美国专利第7,283,337号中所述。
合成脂质修饰的或疏水锚定的寡核苷酸的方法
可采用本领域中已知的方案来合成寡核苷酸,例如Caruthers等人,Meth.Enzymol.211:3(1992);WO 99/54459;Wincott等人,Nucleic Acids Res.23:2677(1995);Wincott等人,Meth.Mol.Bio.74:59(1997);Brennan等人,Biotechnol.Bioeng.61:33(1998);和美国专利第6,001,311号中所述。所有这些参考文献以引用的方式并入本文。寡核苷酸的合成利用常见的核酸保护和偶联基团,如5'-端处的二甲氧基三苯甲基和3'-端处的亚磷酰胺。
本文公开的寡核苷酸涵盖天然的和合成的或修饰的寡核苷酸。修饰的核酸具有一个或多个修饰,例如碱基修饰、主链修饰等,以提供具有新的或增强的特征(例如,改善的稳定性)的核酸。核苷可以是碱基-糖组合,其碱基部分是杂环碱基。杂环碱基包括嘌呤和嘧啶。核苷酸是还包括与核苷的糖部分共价连接的磷酸基团的核苷。对于包括戊呋喃糖基糖的那些核苷,磷酸基团可连接于糖的2'、3'或5'羟基部分。在形成寡核苷酸时,磷酸基团将相邻的核苷彼此共价连接以形成线型聚合化合物。在一些情况下,此线型聚合化合物的各端可进一步连接以形成环状化合物。此外,线型化合物可具有内部核苷酸碱基互补性,且因此可以以产生完全或部分双链化合物的方式折叠。在寡核苷酸内,磷酸基团可以被称为形成寡核苷酸的核苷间主链。RNA和DNA的键接或主链可以是3'至5'磷酸二酯键接。
含有修饰的合适核酸的实例包括具有修饰的主链或非天然核苷间键接的核酸。具有修饰的主链的核酸包括在主链中保留磷原子的核酸和在主链中没有磷原子的核酸。在其中含有磷原子的合适的修饰寡核苷酸主链包括例如硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基及其它烷基膦酸酯(包括3'-亚烷基膦酸酯、5'-亚烷基膦酸酯和手性膦酸酯)、次膦酸酯、氨基磷酸酯(包括3'-氨基氨基磷酸酯和氨基烷基氨基磷酸酯)、二氨基磷酸酯、硫羰基氨基磷酸酯、硫羰基烷基膦酸酯、硫羰基烷基磷酸三酯、具有正常3'-5'键接的硒代磷酸酯和硼代磷酸酯、这些的2'-5'连接类似物以及具有反转极性的那些,其中一个或多个核苷酸间键接是3'至3'、5'至5'或2'至2'键接。具有反转极性的合适寡核苷酸包括在最3'-核苷酸间键接处的单个3'至3'键接,即可以是碱性的单个反转核苷残基(核碱基缺失或有羟基替代)。还包括各种盐(例如钾或钠)、混合盐和游离酸形式。
在一些实施方案中,主题核酸具有一个或多个硫代磷酸酯和/或杂原子核苷间键接,特别是--CH2--NH--O--CH2--、--CH2--N(CH3)--O--CH2-(称为亚甲基(甲基亚氨基)或MMI主链)、--CH2--O--N(CH3)--CH2--、--CH2--N(CH3)--N(CH3)--CH2--和--O--N(CH3)--CH2--CH2--(其中天然磷酸二酯核苷酸间键接表示为--O--P(=O)(OH)--O--CH2--)。上面引用的美国专利第5,489,677号中公开了MMI型核苷间键接。美国专利第5,602,240号中公开了合适的酰胺核苷间键接。
具有吗啉代主链结构的核酸也是合适的,例如美国专利第5,034,506号中所述。例如,在一些实施方案中,主题核酸包括代替核糖环的6元吗啉代环。在这些实施方案的一些中,二氨基磷酸酯或其它非磷酸二酯核苷间键接代替磷酸二酯键接。
在其中不包括磷原子的合适的修饰多核苷酸主链具有由短链烷基或环烷基核苷间键接、混合杂原子和烷基或环烷基核苷间键接或一个或多个短链杂原子或杂环核苷间键接形成的主链。这些包括具有吗啉代键接(部分地由核苷的糖部分形成);硅氧烷主链;硫化物、亚砜和砜主链;甲酰乙酰基和硫代甲酰乙酰基主链;亚甲基甲酰乙酰基和硫代甲酰乙酰基主链;核糖乙酰基主链;含烯烃的主链;氨基磺酸酯主链;亚甲基亚氨基和亚甲基肼基主链;磺酸酯和磺酰胺主链;酰胺主链;及其它具有混合N、O、S和CH2组成部分的那些。
还包括核酸模拟物。术语“模拟物”在应用于多核苷酸时涵盖仅呋喃糖环或呋喃糖环和核苷酸间键接两者被非呋喃糖基团替代的多核苷酸,仅替代呋喃糖环也被称为糖替代物。保持杂环碱基部分或修饰的杂环碱基部分用于与适当的靶核酸杂交。一种这样的核酸(已显示具有优异的杂交特性的多核苷酸模拟物)被称为肽核酸(PNA)。在PNA中,多核苷酸的糖主链被含酰胺的主链特别是氨乙基甘氨酸主链替代。核苷酸被保留,并且与主链的酰胺部分的氮杂氮原子直接或间接地结合。
具有优异的杂交特性的一种多核苷酸模拟物是肽核酸(PNA)。PNA化合物中的主链是两个或更多个连接的氨乙基甘氨酸单元,其给予PNA含酰胺的主链。杂环碱基部分与主链的酰胺部分的氮杂氮原子直接或间接地结合。描述PNA化合物制备的代表性美国专利包括但不限于:美国专利第5,539,082;5,714,331;和5,719,262号。
另一类合适的多核苷酸模拟物基于连接的吗啉代单元(吗啉代核酸),其具有附接于吗啉代环的杂环碱基。已经报道了许多连接基团,它们可以连接吗啉代核酸中的吗啉代单体单元。已选择一类连接基团以得到非离子低聚化合物。基于非离子吗啉代的低聚化合物不太可能与细胞蛋白质发生不期望的相互作用。基于吗啉代的多核苷酸是寡核苷酸的非离子模拟物,其不太可能与细胞蛋白质形成不期望的相互作用(Braasch等人,Biochemistry,41(14):4503-10(2002))。美国专利第5,034,506号中公开了基于吗啉代的多核苷酸。已经制备了吗啉代类多核苷酸内的多种化合物,其具有连接单体亚单元的多种不同的连接基团。
另一合适类别的多核苷酸模拟物被称为环己烯基核酸(CeNA)。通常存在于DNA/RNA分子中的呋喃糖环被环己烯基环替代。已经按照经典的亚磷酰胺化学法制备了CeNADMT保护的亚磷酰胺单体,并用于低聚化合物合成。已经制备并研究了特定位置用CeNA修饰的完全修饰的CeNA低聚化合物和寡核苷酸(参见Wang等人,J.Am.Chem.Soc.,122:8595-8602(2000))。CeNA单体掺入DNA链中增加了DNA/RNA杂交体的稳定性。CeNA寡腺苷酸与RNA和DNA互补体形成络合物,其稳定性与天然络合物类似。NMR和圆二色性显示CeNA结构掺入天然核酸结构中以进行构象适应。
锁核酸(LNA)和/或LNA类似物也适合作为修饰核酸。在LNA中,2'-羟基与糖环的4'碳原子连接,从而形成2'-C,4'-C-氧亚甲基键接,并从而形成双环糖部分。键接可以是亚甲基(--CH2--)、桥接2'氧原子和4'碳原子的基团,其中n是1或2(Singh等人,Chem.Commun.,4:455-456(1998))。LNA和LNA类似物显示出非常高的双链体热稳定性与互补的DNA和RNA(Tm=+3至+10℃)、对3'-核酸外切降解的稳定性和良好的溶解特性。已经描述了含有LNA的有效且无毒的寡核苷酸(Wahlestedt等人,Proc.Natl.Acad.Sci.U.S.A.,97:5633-38(2000))。
已经描述了LNA单体腺嘌呤、胞嘧啶、鸟嘌呤、5-甲基-胞嘧啶、胸腺嘧啶和尿嘧啶的合成和制备以及它们的寡聚化和核酸识别特性(Koshkin等人,Tetrahedron,54:3607-30(1998))。WO98/39352和WO99/14226中也描述了LNA及其制备,这两篇专利特此以引用的方式全文并入。美国专利第7,399,845和7,569,686号中描述了示例性LNA类似物,这两篇专利特此以引用的方式全文并入。
核酸还可包括一个或多个取代的糖部分。合适的多核苷酸包括选自以下的糖取代基:OH;F;O-、S-或N-烷基;O-、S-或N-烯基;O-、S-或N-炔基;或O-烷基-O-烷基,其中所述烷基、烯基和炔基可以是取代或未取代的C1至C10烷基或C2至C10烯基和炔基。还合适的是O((CH2)nO)mCH3、O(CH2)nOCH3、O(CH2)nNH2、O(CH2)nCH3,O(CH2)nONH2和O(CH2)nON((CH2)nCH3)2,其中n和m是1至约10。其它合适的多核苷酸包括选自以下的糖取代基:C1至C10低级烷基、取代的低级烷基、烯基、炔基、烷芳基、芳烷基、O-烷芳基或O-芳烷基、SH、SCH3、OCN、Cl、Br、CN、CF3、OCF3、SOCH3、SO2CH3、ONO2、NO2、N3、NH2、杂环烷基、杂环烷芳基、氨基烷基氨基、聚烷基氨基、取代的甲硅烷基、RNA切割基团、报告基团、嵌入剂及具有类似特性的其它取代基。合适的修饰可包括2'-甲氧基乙氧基(2'-O--CH2CH2OCH3,也称为2'-O-(2-甲氧基乙基)或2'-MOE)(Martin等人,Helv.Chim.Acta,78:486-504(1995)),即烷氧基烷氧基。合适的修饰可包括2'-二甲氨基氧乙氧基,即O(CH2)2ON(CH3)2基团,也称为2'-DMAOE,和2'-二甲氨基乙氧基乙氧基(也称为2'-O-二甲基-氨基-乙氧基-乙基或2'-DMAEOE),即2'-O--CH2--O--CH2--N(CH3)2
其它合适的糖取代基包括甲氧基(--O—CH3)、氨基丙氧基(--OCH2CH2CH2NH2)、烯丙基(--CH2—CH=CH2)、--O-烯丙基(--O--CH2—CH=CH2)和氟(F)。2'-糖取代基可在阿拉伯糖(上)位或核糖(下)位。一种合适的2’-阿拉伯糖修饰是2'-F。也可以在寡聚化合物上的其它位置进行类似的修饰,特别是3'末端核苷上或2'-5'连接的寡核苷酸中的糖的3'位置和5'末端核苷酸的5'位置。低聚化合物还可具有糖模拟物,如环丁基部分代替戊呋喃糖基糖。
核酸还可包括核碱基(也称为“碱基”)修饰或取代。如本文所用,“未修饰的”或“天然的”核碱基包括嘌呤碱基腺嘌呤(A)和鸟嘌呤(G)以及嘧啶碱基胸腺嘧啶(T)、胞嘧啶(C)和尿嘧啶(U)。修饰的核碱基包括其它合成的和天然的核碱基,如5-甲基胞嘧啶(5-me-C)、5-羟甲基胞嘧啶、黄嘌呤、次黄嘌呤、2-氨基腺嘌呤、腺嘌呤和鸟嘌呤的6-甲基及其它烷基衍生物、腺嘌呤和鸟嘌呤的2-丙基及其它烷基衍生物、2-硫尿嘧啶、2-硫胸腺嘧啶和2-硫胞嘧啶、5-卤代尿嘧啶和胞嘧啶、5-丙炔基(--C=C--CH3)尿嘧啶和胞嘧啶及嘧啶碱基的其它炔基衍生物、6-偶氮尿嘧啶、胞嘧啶和胸腺嘧啶、5-尿嘧啶(假尿嘧啶)、4-硫尿嘧啶、8-卤代、8-氨基、8-巯基、8-硫烷基、8-羟基及其它8-取代的腺嘌呤和鸟嘌呤、5-卤代特别是5-溴、5-三氟甲基及其它5-取代的尿嘧啶和胞嘧啶、7-甲基鸟嘌呤和7-甲基腺嘌呤、2-F-腺嘌呤、2-氨基-腺嘌呤、8-氮杂鸟嘌呤和8-氮杂腺嘌呤、7-脱氮鸟嘌呤和7-脱氮腺嘌呤以及3-脱氮鸟嘌呤和3-脱氮腺嘌呤。修饰的核碱基还包括三环嘧啶如吩噁嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并噁嗪-2(3H)-酮)、吩噻嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并噻嗪-2(3H)-酮)、G-钳如取代的吩噁嗪胞苷(例如9-(2-氨基乙氧基)-H-嘧啶并(5,4-(b)(1,4)苯并噁嗪-2(3H)-酮)、咔唑胞苷(2H-嘧啶并(4,5-b)吲哚-2-酮)和吡啶并吲哚胞苷(H-吡啶并(3',2':4,5)吡咯并(2,3-d)嘧啶-2-酮)。
杂环碱基部分还可包括其中嘌呤或嘧啶碱基被其它杂环替代的那些,例如7-脱氮-腺嘌呤、7-脱氮鸟苷、2-氨基吡啶和2-吡啶酮。进一步的核碱基包括美国专利第3,687,808号中公开的那些、Concise Encyclopedia Of Polymer Science And Engineering,第858-859页,Kroschwitz,J.I.编著,John Wiley&Sons,1990中公开的那些、由Englisch等人,Angewandte Chemie,International Edition,1991,30,613公开的那些和由Sanghvi,Y.S.,第15章,Antisense Research and Applications,第289-302页,Crooke,S.T.和Lebleu,B.编,CRC Press,1993公开的那些。这些核碱基中的某些可用于增加寡聚化合物的结合亲和力。这些包括5-取代的嘧啶、6-氮杂嘧啶和N-2、N-6和O-6取代的嘌呤,包括2-氨基丙基腺嘌呤、5-丙炔基尿嘧啶和5-丙炔基胞嘧啶。已显示5-甲基胞嘧啶取代将核酸双链体稳定性增加0.6-1.2℃(Sanghvi等人编著,Antisense Research and Applications,CRCPress,Boca Raton,1993,第276-278页),并且是合适的碱基取代,例如当与2'-O-甲氧基乙基糖修饰组合时。
可通过任何化学或生物化学方法产生脂质(例如,脂质、多种脂质、多种脂质前体、脂质前体、多种油脂化学品或油脂化学品)(例如,见于US9,896,691、US9598710,US9,499,829、US9,428,779、US9,127,288,这些专利以全文引用的方式并入本文;和Kinney,1997,Genetic Engeneering,编著:J K Setlow,19:149-166;Ohlrogge和Browse,1995,PlantCell 7:957-970;Shanklin和Cahoon,1998,Annu.Rev.Plant Physiol.PlantMol.Biol.49:611-641;Voelker,1996,Genetic Engineering,编著:J K Setlow,18:111-13;Gerhardt,1992,Prog.Lipid R.31:397-417;Guhnemann-Schafer&Kindl,1995,Biochim.Biophys Acta 1256:181-186;Kunau等人,1995,Prog.Lipid Res.34:267-342;Stymne等人,1993,于Biochemistry and Molecular Biology of Membrane and StorageLipids of Plants,编著:Murata和Somerville,Rockville,American Society of PlantPhysiologists,150-158,Murphy&Ross 1998,Plant Journal.13(1):1-16),并且通过任何方便的方法收集(例如细胞外分泌的脂质的离心、暴露于溶剂、全细胞提取(例如细胞破碎和收集)、疏水溶剂提取(例如己烷)、液化、超临界二氧化碳提取、冷冻干燥、机械粉碎、分泌(例如通过添加有效的输出蛋白)或其组合)。在一些实施方案中,可以从例如植物、细菌或产油酵母或真菌中提取和纯化脂质。
在一些实施方案中,脂质与本文公开的寡核苷酸共价连接。在一些实施方案中,脂质与本文公开的寡核苷酸交联。脂质与寡核苷酸结合的方式没有特别限制。脂质和寡核苷酸可以直接结合或经由接头(连接区)结合。在一些实施方案中,用于将脂质与寡核苷酸结合的接头包含核酸。在一些实施方案中,用于将脂质与寡核苷酸结合的接头不包含核酸。
可使用的接头没有特别限制,只要脂质和寡核苷酸彼此共价连接即可。可用接头的实例包括具有以下结构的那些:--O-P(=O)(OH)-O--、--O--CO--O--、--NH--CO--O--、--NH--CO--NH--、--NH--(CH2)n1--、--S--(CH2)n1--、--CO--(CH2)n1--CO--、--CO--(CH2)n1--NH--、--NH--(CH2)n1--NH--、--CO--NH--(CH2)n1--NH--CO--、--C(=S)--NH--(CH2)n1--NH--CO--、--C(=S)--NH--(CH2)n1--NH--C--(=S)--、--CO--O--(CH2)n1--O--CO--、--C(.=S)--O--(CH2)n1--O--CO--、--C(=S)--O--(CH2)n1--O--C--(=S)--、--CO--NH--(CH2)n1--O--CO--、--C(=S)--NH--(CH2)n1--O--CO--、--C(=S)--NH--(CH2)n1--O--C--(=S)--、--CO--NH--(CH2)n1--O--CO--、--C(=S)--NH--(CH2)n1--CO--、--C(=S)--O--(CH2)n1--NH--CO--、--C(=S)--NH--(CH2)n1--O--C--(=S)--、--NH--(CH2CH2O)n2--CH(CH2OH)--、--NH--(CH2CH2O)n2--CH2--、--NH--(CH2CH2O)n2--CH2--CO--、--O--(CH2)n3--S--S--(CH2)n4--O--P(=O)2--、--CO--(CH2)n3--O--CO--NH--(CH2)n4--、--CO--(CH2)n3--CO--NH--(CH2)n4--,其中n1是约1至约40的整数,n2是约1至约20的整数,n3和n4可相同或不同,并且是约1至约20的整数。在一些实施方案中,接头是磷酸基团(--O-P(=O)(OH)-O--)。
使用方法
脂质修饰的或疏水锚定的寡核苷酸化合物和含有脂质修饰的或疏水锚定的寡核苷酸的组合物可用于多种不同的药物、药用化妆品、诊断和生物医学应用。例如,脂质修饰的或疏水锚定的寡核苷酸化合物和包含脂质修饰的或疏水锚定的寡核苷酸化合物的组合物可用于研究和治疗应用,包括细胞-细胞相互作用的研究、膜力学、组织的自下而上组装、非粘附细胞的定量成像或发生在细胞表面附近的生物过程的研究。脂质修饰的或疏水锚定的寡核苷酸化合物和含有脂质修饰的或疏水锚定的寡核苷酸的组合物也可用于研究来自受试者的样品或组织中的基因的空间表达谱。
在实施这类方法时,可首先使包含脂质修饰的或疏水锚定的寡核苷酸的组合物与膜在允许将所述组合物插入到所述膜的条件下接触,所述膜如细胞膜、将细胞质与细胞外部的点分开的质膜或核膜。在一些实施方案中,所述方法包括在允许将所述组合物插入到所述膜中的条件下,使膜与包含脂质修饰的或疏水锚定的寡核苷酸的组合物接触,并将所述组合物与所述膜一起孵育。在一些实施方案中,所述方法包括使膜与包含脂质修饰的或疏水锚定的寡核苷酸的组合物接触,并将所述组合物与所述膜一起孵育足以使锚-脂质修饰的寡核苷酸将其自身包埋在所述膜内的时间段。
在一些实施方案中,将锚脂质修饰的或疏水锚定的寡核苷酸和共锚脂质修饰的或疏水锚定的寡核苷同时添加到细胞或膜中。在一些实施方案中,将锚脂质修饰的或疏水锚定的寡核苷酸和共锚脂质修饰的或疏水锚定的寡核苷酸依次添加到细胞或膜中。在一些实施方案中,首先将锚脂质修饰的或疏水锚定的寡核苷酸添加到细胞或膜中,接着将共锚脂质修饰的或疏水锚定的寡核苷酸添加到细胞或膜中。在一些实施方案中,首先将共锚脂质修饰的或疏水锚定的寡核苷酸添加到细胞或膜中,接着将锚脂质修饰的或疏水锚定的寡核苷酸添加到细胞或膜中。在一些实施方案中,在将锚脂质修饰的或疏水锚定的寡核苷酸添加到细胞或膜中之前使其与条形码寡核苷酸预杂交。在这类实施方案中,锚脂质修饰的或疏水锚定的寡核苷酸与条形码寡核苷酸通过它们各自的引物区杂交。
在一些实施方案中,本公开涉及标记细胞或细胞样品的方法、从细胞样品中分离内源性DNA的方法或对来自细胞样品的核酸序列进行测序的方法,包括将所述细胞样品暴露于本文公开的一种或多种锚-脂质修饰的寡核苷酸,然后添加与所述锚-脂质修饰的寡核苷酸互补的至少第一标记寡核苷酸序列,所述第一标记寡核苷酸序列在其3'区上包含已知的核酸序列部分。在一些实施方案中,所述样品来自人。
在一些实施方案中,第一标记寡核苷酸与锚-脂质修饰的寡核苷酸的3'区互补,使得3'端的已知核酸序列的至少一部分是单链的。在一些实施方案中,所述方法还包括将第一标记寡核苷酸的单链3'端暴露于连接酶缓冲液和连接酶,以将第一标记寡核苷酸共价连接至锚脂质修饰的寡核苷酸。锚-脂质修饰的寡核苷酸可依次暴露于至少第二、第三或第四或更多种标记寡核苷酸,所述第一、第二、第三、第四或更多种标记寡核苷酸中的每一者在它们各自的分子3'区中包含独特的识别核酸序列。在一些实施方案中,所述方法还包括将所述锚脂质修饰的寡核苷酸和所述第一或多种标记寡核苷酸暴露于第一接头,这种寡核苷酸序列与所述第一标记寡核苷酸和所述第二标记寡核苷酸的一部分互补,使得当暴露于连接酶和游离dNTP时,所述第一接头用作模板核酸链,用于沿着作为每种标记寡核苷酸的3'端的单链区的核酸链连接并形成互补核酸序列。在一些实施方案中,本公开涉及标记细胞样品的方法、从细胞样品中分离内源性DNA的方法或对来自细胞样品的核酸序列进行测序的方法,所述方法包括:
(a)将所述细胞样品暴露于本文公开的一种或多种锚-脂质修饰的寡核苷酸或包含所述寡核苷酸的组合物,持续足以使所述锚-脂质修饰的寡核苷酸将其自身包埋在所述细胞的细胞膜内的时间段;
(b)将所述细胞样品暴露于与所述锚-脂质修饰的寡核苷酸互补的一种或多种标记寡核苷酸,持续足以使所述锚-脂质修饰的寡核苷酸与所述一种或多种标记寡核苷酸形成核酸的互补链的时间段;
(c)将所述一种或多种标记寡核苷酸与所述一种或多种锚-脂质修饰的寡核苷酸连接;并任选
(d)通过检测对应于所述一种或多种标记寡核苷酸的多个独特核苷酸序列中的一个来检测所述一种或多种标记寡核苷酸的存在;和/或
(e)基于一种或多种标记寡核苷酸的存在分离所述细胞,其中通过检测对应于所述一种或多种标记寡核苷酸的多个独特核苷酸序列中的一个来确定所述一种或多种标记寡核苷酸的存在。
在一些实施方案中,标记细胞样品的方法、从细胞样品中分离内源性DNA的方法或对来自细胞样品的核酸序列进行测序的方法包括:
(a)将细胞暴露于一种或多种锚-脂质修饰的寡核苷酸,持续足以使所述锚-脂质修饰的寡核苷酸将其自身包埋在所述细胞的细胞膜内的时间段;
(b)将所述细胞暴露于与所述锚-脂质修饰的寡核苷酸互补的第一标记寡核苷酸,持续足以使所述锚-脂质修饰的寡核苷酸与所述一种或多种标记寡核苷酸形成核酸的互补链的时间段
(c)将所述第一标记寡核苷酸与所述一种或多种锚-脂质修饰的寡核苷酸连接;并任选
(d)通过检测对应于所述第一标记寡核苷酸的多个独特核苷酸序列中的一个来检测所述第一标记寡核苷酸的存在;和/或
(e)基于所述第一标记寡核苷酸的存在来分离所述细胞,其中通过检测对应于所述第一标记寡核苷酸的多个独特核苷酸序列中的一个来确定所述第一标记寡核苷酸的存在。
在一些实施方案中,标记细胞样品的方法、从细胞样品中分离内源性DNA的方法或对来自细胞样品的核酸序列进行测序的方法包括:
(a)将细胞暴露于一种或多种锚-脂质修饰的寡核苷酸,持续足以使所述锚-脂质修饰的寡核苷酸将其自身包埋在所述细胞的细胞膜内的时间段;
(b)将所述细胞暴露于第一、第二、第三、第四或更多种标记寡核苷酸,其中所述第一标记寡核苷酸与所述一种或多种锚-脂质修饰的寡核苷酸互补并暴露于所述一种或多种锚-脂质修饰的寡核苷酸,持续足以使所述锚-脂质修饰的寡核苷酸与所述第一标记寡核苷酸形成核酸的互补链的时间段,且其中临在将所述第二、第三和/或第四或更多种标记寡核苷酸暴露于所述细胞之前将所述第二、第三和/或第四或更多种标记寡核苷酸依次暴露于对所述细胞暴露的所述标记寡核苷酸的3'部分,并持续足以使所述第二、第三和/或第四或更多种标记寡核苷酸与先前暴露的标记寡核苷酸共价或非共价结合的时间段;
(c)将所述一种或多种标记寡核苷酸与所述第一锚-脂质修饰的寡核苷酸连接,并且在所述第二、第三、第四或更多种标记寡核苷酸的情况下,将所述标记寡核苷酸同时彼此连接;并任选
(d)通过检测对应于所述第一、第二、第三、第四标记寡核苷酸中的每一者的多个独特核苷酸序列中的一个来检测所述第一、第二、第三、第四和/或更多种标记寡核苷酸的存在;和/或
(e)基于所述第一、第二、第三、第四和/或更多种标记寡核苷酸的存在或基于所述第一、第二、第三、第四和/或更多种标记寡核苷酸中的每一者的独特核苷酸序列的顺序组合来分离所述细胞,其中通过检测对应于所述标记寡核苷酸中的每一者的一种或组合的多个独特核苷酸序列中的一个来确定所述第一、第二、第三、第四和/或更多种标记寡核苷酸的存在。
在一些实施方案中,本公开涉及确认细胞样品中的内源性核酸表达的空间位置的方法、从细胞样品中分离内源性DNA的方法和/或对来自细胞样品的内源性表达的核酸序列进行测序的方法,包括:
(a)将细胞暴露于一种或多种锚-脂质修饰的寡核苷酸,持续足以使所述锚-脂质修饰的寡核苷酸将其自身包埋在所述细胞的细胞膜内的时间段;
(b)将所述细胞暴露于第一、第二、第三、第四或更多种标记寡核苷酸,其中所述第一标记寡核苷酸与所述一种或多种锚-脂质修饰的寡核苷酸互补并暴露于所述一种或多种锚-脂质修饰的寡核苷酸,持续足以使所述锚-脂质修饰的寡核苷酸与所述第一标记寡核苷酸形成核酸的互补链的时间段,且其中临在将所述第二、第三和/或第四或更多种标记寡核苷酸暴露于所述细胞之前将所述第二、第三和/或第四或更多种标记寡核苷酸依次暴露于对所述细胞暴露的所述标记寡核苷酸的3'部分,并持续足以使所述第二、第三和/或第四或更多种标记寡核苷酸与先前暴露的标记寡核苷酸共价或非共价结合的时间段;
(c)将所述一种或多种标记寡核苷酸与所述第一锚-脂质修饰的寡核苷酸连接,并且在所述第二、第三、第四或更多种标记寡核苷酸的情况下,将所述标记寡核苷酸同时彼此连接;并任选
(d)通过检测对应于所述第一、第二、第三、第四标记寡核苷酸中的每一者的多个独特核苷酸序列中的一个来检测所述第一、第二、第三、第四和/或更多种标记寡核苷酸的存在;和/或
(e)基于所述第一、第二、第三、第四和/或更多种标记寡核苷酸的空间位置或基于所述第一、第二、第三、第四和/或更多种标记寡核苷酸中的每一者的独特核苷酸序列的顺序组合来分析所述细胞的区域性表达,其中通过检测对应于所述标记寡核苷酸中的每一者的一种或组合的所述第一、第二、第三、第四和/或更多种标记寡核苷酸的空间位置来确定受核酸的内源性表达影响的细胞的空间位置。
在一些实施方案中,用于所公开的标记细胞样品的方法、从细胞样品中分离内源性DNA的方法或对来自细胞样品的核酸序列进行测序的方法的细胞或细胞样品是通过将对应于样品的区域的细胞分配到容器中来获得的。在一些实施方案中,通过将组织样品的切片或三维制剂放置在容器顶部并将对应于样品的区域的细胞定位到容器中来进行细胞的分配。在一些实施方案中,所述容器是孔。在一些实施方案中,所述容器是微孔。
在一些实施方案中,本公开提供确认受试者的样品或组织内的核酸表达模式的空间位置的方法,所述方法包括:
(a)通过将所述样品的切片或三维制剂放置到多个容器中的一个中将来自所述样品或对应于所述样品的区域的组织的一个或多个细胞分配到多个容器中的一个中;
(b)用本文公开的已知寡核苷酸使对应于样品的区域的一个或多个细胞暴露,持续足以使所述已知寡核苷酸掺入所述一个或多个细胞中的时间,每种寡核苷酸对于一个或多个细胞暴露于其中的所述多个容器中的一个是独特的并且对应于所述多个容器中的一个;
(c)根据已知的寡核苷酸从所述一个或多个细胞中分离核酸和/或进行测序;并
(d)将来自所述一个或多个细胞的表达谱与所述细胞在所述样品内、相对于所述组织或在所述组织内的空间位置相关联。
在这类实施方案中,所述多个容器中的每一者中的已知寡核苷酸独立地选自以下中的一者或组合:
(x)包含第一脂质部分、第一杂交区和第一引物区的第一脂质缀合的DNA寡核苷酸;和/或
(y)包含第二杂交区和第二脂质部分的第二脂质缀合的DNA寡核苷酸,其中所述第二杂交区是所述第一杂交区的反向互补体;和/或
(z)包含第二引物区、条形码区和捕获序列的第三DNA寡核苷酸,其中所述第二引物区是所述第一引物区的反向互补体。
在一些实施方案中,本公开提供确认受试者的组织内的核酸的空间表达模式的方法,所述方法包括:
(a)将来自对应于所述组织的区域的样品的一个或多个细胞分配到多个容器中的一个中;
(b)用包含如本文别处定义的脂质部分、如本文别处定义的条形码区和如本文别处定义的捕获序列的脂质缀合的DNA寡核苷酸暴露一个或多个细胞,持续足以使所述脂质部分将其自身包埋在所述一个或多个细胞的细胞膜内的时间段,其中所述脂质缀合的DNA寡核苷酸的所述条形码区对于所述一个或多个细胞暴露于其中的所述多个容器之一的每一者是独特的;
(c)对所述一个或多个细胞中由所述脂质缀合的DNA寡核苷酸的所述捕获序列捕获的核酸进行测序;以及
(d)根据包含在所述测序核酸中的每一者中的所述条形码区将来自所述一个或多个细胞的所述测序核酸与所述一个或多个细胞在所述组织内和/或相对于所述组织的空间位置相关联。
在一些实施方案中,这类方法中使用的脂质缀合的DNA寡核苷酸包含:(i)包含脂质部分和如本文别处定义的第一引物区的第一脂质缀合的DNA寡核苷酸;和(ii)包含如本文别处定义的第二引物区、条形码区和捕获序列的第二DNA寡核苷酸,其中所述第二引物区是所述第一引物区的反向互补体。在一些实施方案中,第一脂质缀合的DNA寡核苷酸还包含如本文别处定义的第一杂交区。在一些实施方案中,这类方法还包括在测序步骤之前将所述一个或多个细胞暴露于第二脂质缀合的DNA寡核苷酸,其中所述第二脂质缀合的DNA寡核苷酸包含如本文别处定义的第二杂交区和如本文别处定义的第二脂质部分,其中所述第二杂交区是所述第一杂交区的反向互补体。
在一些实施方案中,通过将如本文别处所述的具有适当厚度的所述组织的组织切片或三维制剂放置到多个容器中的一个中来进行细胞分配。在一些实施方案中,通过将所述组织的组织切片或三维制剂放置在多个容器中的一个的顶部并迫使对应于所述组织样品的限定区域的一个或多个细胞进入多个容器中的所述一个中来进行细胞分配。在一些实施方案中,多个容器中的一个是微孔。微孔阵列可采用软光刻直接产生到基板如SU-8中。光刻制作的SU-8模具也可用于在PDMS中制作微孔。PDMS印模也可用作用于其它聚合物如TPE、NOA81和PUMA的模具。或者,可以采用3D打印方法如Nanoscribe来制作阵列。也可采用本领域中已知用于产生微孔阵列的任何其它选择,包括但不限于注塑或热压印。
根据微孔的尺寸,所公开的方法中使用的孔的空间分辨率可以为约100、90、80、70、60、50、40、30、20或10微米。在一些实施方案中,孔的空间分辨率小于约10微米。在一些实施方案中,孔的空间分辨率为约10微米。在一些实施方案中,孔的空间分辨率为约20微米。在一些实施方案中,孔的空间分辨率为约30微米。在一些实施方案中,孔的空间分辨率为约40微米。在一些实施方案中,孔的空间分辨率为约50微米。在一些实施方案中,孔的空间分辨率为约60微米。在一些实施方案中,孔的空间分辨率为约70微米。在一些实施方案中,孔的空间分辨率为约80微米。在一些实施方案中,孔的空间分辨率为约90微米。在一些实施方案中,孔的空间分辨率为约100微米。在一些实施方案中,孔的空间分辨率大于约100微米。
在一些实施方案中,通过一种或多种探针或标记的寡核苷酸的检测或定量来进行条形码寡核苷酸的检测和/或分析。例如,诸如Biorad ddSEQ读数器的设备可用于以多重格式检测和分析单细胞或多细胞样品。例如Nature Biotechnology,第37卷,第916-924页(2019)公开了用于量化、检测和分析条形码化样品的存在或不存在的已知方法。这类技术以引用的方式全文并入。
在一些实施方案中,细胞样品是来自受试者的组织样品的细胞的三维制剂。在一些实施方案中,细胞样品是组织切片。在一些实施方案中,细胞样品的厚度为约0.05微米至约150微米。在一些实施方案中,细胞样品的厚度为约0.1微米至约99微米。在一些实施方案中,细胞样品的厚度为约0.5微米至约80微米。在一些实施方案中,细胞样品的厚度为约1微米至约50微米。在一些实施方案中,细胞样品的厚度为约2微米至约40微米。在一些实施方案中,细胞样品的厚度为约3微米至约30微米。在一些实施方案中,细胞样品的厚度为约4微米至约20微米。在一些实施方案中,细胞样品的厚度为约0.05微米。在一些实施方案中,细胞样品的厚度为约0.1微米。在一些实施方案中,细胞样品的厚度为约0.5微米。在一些实施方案中,细胞样品的厚度为约1微米。在一些实施方案中,细胞样品的厚度为约5微米。在一些实施方案中,细胞样品的厚度为约10微米。在一些实施方案中,细胞样品的厚度为约20微米。在一些实施方案中,细胞样品的厚度为约30微米。在一些实施方案中,细胞样品的厚度为约40微米。在一些实施方案中,细胞样品的厚度为约50微米。在一些实施方案中,细胞样品的厚度为约60微米。在一些实施方案中,细胞样品的厚度为约70微米。在一些实施方案中,细胞样品的厚度为约80微米。在一些实施方案中,细胞样品的厚度为约90微米。在一些实施方案中,细胞样品的厚度为约100微米。在一些实施方案中,细胞样品的厚度为约150微米。在一些实施方案中,细胞样品的厚度大于约150微米。
在一些实施方案中,本公开涉及标记来自样品的多个细胞的方法,并且如果所述方法包括将所述细胞暴露于多种标记寡核苷酸,则所述方法还包括在将所述细胞对暴露于第二、第三、第四或更多种标记寡核苷酸中的每个连续步骤暴露之前将所述细胞汇集在单个容器中的步骤。在一些实施方案中,所述方法还包括在将所述细胞对暴露于第二、第三、第四或更多种标记寡核苷酸中的每个连续步骤暴露之后将所述细胞汇集在单个容器中的步骤。
一方面,微流体液滴用于例如容纳细胞。微流体液滴可用于保持多个细胞中的细胞分开并且可识别,例如使得可识别不同细胞之间的差异。可以在低至单细胞水平的分辨率下例如通过使用本文公开的脂质修饰的或疏水锚定的寡核苷酸来研究多个细胞,其中的一些或所有细胞可能含有个体差异。
细胞样品可来自任何受试者,例如人,或来自非人动物,例如无脊椎动物细胞(例如,来自果蝇的细胞)、鱼细胞(例如,斑马鱼细胞)、两栖动物细胞(例如,青蛙细胞)、爬行动物细胞、鸟细胞或哺乳动物细胞,如猴、猿、母牛、绵羊、山羊、马、驴、骆驼、美洲驼、羊驼、兔、猪、小鼠、大鼠、豚鼠、仓鼠、狗、猫等。如果细胞样品来自多细胞生物体,则细胞样品可来自生物体的任何部分。在一些实施方案中,可以研究组织。例如,可以处理来自生物体的组织以产生细胞样品(例如,通过将组织切片),使得可以确定组织内的差异,如本文所讨论的那样。
细胞样品或组织可来自健康受试者或患病或疑似患病的受试者。例如,可以从受试者中取出细胞样品或组织并进行研究,以确定那些细胞样品或组织的特征中的差异或变化,例如以确定受试者是健康还是患有疾病,例如动物是否患有癌症(例如,通过确定细胞样品或组织内的癌症特异性表达谱)。在一些情况下,可以研究肿瘤(例如,使用活检),并且可以确定肿瘤的特征。
液滴可以容纳在微流体通道中。例如,在某些实施方案中,液滴的平均尺寸或直径可小于约1mm、小于约500微米、小于约300微米、小于约200微米、小于约100微米、小于约75微米、小于约50微米、小于约30微米、小于约25微米、小于约10微米、小于约5微米、小于约3微米,或在一些情况下小于约1微米。在某些情况下,平均直径也可以为至少约1微米、至少约2微米、至少约3微米、至少约5微米、至少约10微米、至少约15微米或至少约20微米。液滴可以是球形或非球形的。如果液滴是非球形的,则可以将液滴的平均直径或尺寸当作是与非球形液滴体积相同的完全球体的直径。
可以采用任何合适的技术产生液滴。例如,通道的汇合部可用于产生液滴。汇合部可以是例如T型汇合部、Y型汇合部、通道内通道型汇合部(例如,按同轴布置,或包括内通道和围绕内通道的至少一部分的外通道)、交叉(或“X”)型汇合部、流动聚焦型汇合部或用于产生液滴的任何其它合适的汇合部。参见例如WO 2004/091763和WO2004/002627,其每一者以全文引用的方式并入本文。在一些实施方案中,可以构造和布置汇合部以产生基本上单分散的液滴。
在一些情况下,可以以相对高的速率将细胞包封在液滴内。例如,液滴中的细胞包封速率可以为至少约10个细胞/s、至少约30个细胞/s、至少约100个细胞/s、至少约300个细胞/s、至少约1,000个细胞/s、至少约3,000个细胞/s、至少约10,000个细胞/s、至少约30,000个细胞/s、至少约100,000个细胞/s、至少约300,000个细胞/s或至少约106个细胞/s。
可以使用例如任何微流体装置(包括例如与多样品纳米分配器接合的微流体装置)进行PCR反应(包括例如利用本文公开的脂质修饰的或疏水锚定的寡核苷酸的逆转录PCR和引物延伸PCR)。微流体装置是流体系统,其中流体的体积很小,通常在微升到纳升的数量级。在一些实施方案中,微流体可以按小体积处理数十至数千个样品。微流体可以是有源的或无源的。通过在微流体装置中使用诸如阀的有源元件,可以产生微流体回路。这不仅允许采用小的试剂体积,而且还允许高任务并行化,因为可以在同一芯片上处理和物理地安装多个程序。
在微流体通道中,液体的流动可以是完全层流的,即所有的流体在同一方向上并且以相同的速度移动。与湍流流动不同,这使得非常容易预测流体中的分子传输。微流体装置可由玻璃或塑料制成。在一些实施方案中,可以使用聚二甲基硅氧烷(PDMS),这是一种类型的硅酮。PDMS的一些优点包括价格低廉、光学透明,并且可透过多种物质,包括气体。在一些实施方案中,软光刻或微模塑可用于产生基于PDMS的微流体装置。所述装置可使用压力驱动流、电动流或润湿驱动流。
在一些实施方案中,微流体装置具有多个室,每个室具有实时微阵列。在一些实施方案中,将阵列结合到微流体装置中。在一些实施方案中,通过给具有多个实时微阵列的平面表面增加特征以便产生室来形成微流体装置,其中所述室对应于所述实时微阵列。在一些实施方案中,将具有三维特征的基板(例如具有孔、微孔或通道的PDMS表面)放置成与具有多个实时微阵列的表面相接触以形成在多个室中具有多个阵列的微流体装置。
为了同时分析多个样品,可以使用具有多个室的装置,每个室具有实时微阵列。在一些实施方案中,多个室具有来源于同一样品的样品流体。在多个室中具有来自同一样品的样品流体可用于例如用不同的阵列测量每一者,用于分析同一样品的不同方面,或者例如用于通过在相同阵列上的平行测量来提高准确度。在一些情况下,同一样品内的不同扩增子将具有不同的最佳温度分布条件。因此,在一些实施方案中,同一样品被分成不同的流体体积,且不同的流体体积在具有实时微阵列的不同室中;并且不同流体体积中的至少一些被给予不同的温度循环。
在一些实施方案中,多个室具有来自不同来源的样品流体。具有来自不同来源的样品流体可以是有用的,以便通过在给定的仪器上在给定的时间段内测量更多的样品来增加通量。在一些实施方案中,具有包括实时微阵列的多个室的微流体可用于诊断应用。所述装置可具有约2、3、4、5、6、7、8、9、10、10-15、15-20、20-30、30-50、50-75、75-100或多于100个室,每个室具有实时微阵列。
一些实施方案涉及与固体支持物结合的脂质修饰的或疏水锚定的寡核苷酸的用途。“固体支持物”是指具有表面的任何基板,分子可通过共价或非共价键直接或间接地附接于所述表面。固体支持物可包括能够为附接于表面的探针提供物理支持的任何基板材料。所述材料通常能够耐受与条形码寡核苷酸附接于所述表面和在进行测定期间遇到的任何后续处理、操纵或加工相关的条件。所述材料可以是天然存在的、合成的或天然存在的材料的改性物。合适的固体支持材料可包括硅、石墨、镜面、层压材料、陶瓷、塑料(包括聚合物,例如聚(氯乙烯)、环烯烃共聚物、聚丙烯酰胺、聚丙烯酸酯、聚乙烯、聚丙烯、聚(4-甲基丁烯)、聚苯乙烯、聚甲基丙烯酸酯、聚(对苯二甲酸乙二醇酯)、聚四氟乙烯(PTFE或
Figure BDA0003460412710000661
)、尼龙、聚(丁酸乙烯酯))、锗、砷化镓、金、银等,独立地使用或与其它材料结合使用。可以考虑另外的刚性材料,如玻璃,其包括二氧化硅,并且还包括例如可用作生物玻璃的玻璃。可以使用的其它材料包括多孔材料,例如可控孔度的玻璃珠。还涵盖本领域中已知能够具有结合在其表面上的一个或多个官能团的任何其它材料,所述官能团如任何氨基、羧基、硫醇或羟基官能团。
用于固体支持物的材料可采用从简单到复杂的多种构造中的任一种。固体载体可具有多种形状中的任一种,包括条、板、盘、棒、颗粒,包括珠粒、管、孔等。通常,所述材料是相对平面的,例如载玻片,尽管其可以是球形的,例如珠粒,或者是圆柱形的(例如,柱)。在许多实施方案中,所述材料通常被成形为长方形固体。可以在片材上合成多个预定的布置物,例如探针阵列,然后将其切成单个阵列基板,即通过沿划线断裂来切割。可以使用的示例性固体支持物包括微量滴定孔、显微镜载玻片、膜、磁珠、带电纸、Langmuir-Blodgett薄膜、硅晶片芯片、流通芯片和微珠。在一些实施方案中,珠粒是塑料或聚苯乙烯。在一些实施方案中,珠粒是磁性的。在珠粒暴露于磁力后,来自细胞的核酸分子或序列能够被分离。单独的DNA和RNA
在一些实施方案中,条形码寡核苷酸经由其捕获序列如聚(A)尾与固体支持物直接缀合是可能的。在这类实施方案中,包含锚和任选共锚脂质修饰的或疏水锚定的寡核苷酸的细胞或膜可以在杂交条件下暴露于固体支持物,使得包含锚和任选共锚脂质修饰的或疏水锚定的寡核苷酸的细胞或膜与条形码寡核苷酸结合。然后可以洗涤固体支持物上的非结合物质,并通过测序或其它识别方案进一步分析剩下的固体支持物,包括结合的细胞和膜。
在一些实施方案中,固体支持物最初是未结合的,并且通过条形码寡核苷酸的捕获序列与条形码寡核苷酸结合。在这类实施方案中,包含锚和任选共锚脂质修饰的或疏水锚定的寡核苷酸的细胞或膜已经通过第一和第二引物区与条形码寡核苷酸杂交。然后可以洗涤固体支持物上的非结合物质,并通过测序或其它识别方案进一步分析剩下的固体支持物,包括结合的细胞和膜。
在一些实施方案中,本公开涉及用本文公开的条形码或脂质修饰的寡核苷酸标记细胞的方法。在一些实施方案中,所述方法包括使所公开的寡核苷酸的一种或多种均匀混合物或非均质混合物与来自样品或组织的一个或多个细胞接触。在一些实施方案中,使所述细胞与至少第一和第二脂质修饰的寡核苷酸接触,使得脂质-寡核苷酸与细胞中存在的RNA、DNA或RNA/DNA杂交体杂交。在一些实施方案中,寡核苷酸的捕获区用于将寡核苷酸分离到固体支持物或另一种固定的寡核苷酸上,使得可以从细胞中移除未杂交的元件或组分,并保留从细胞中捕获的RNA/DNA的滞留物。在一些实施方案中,可以在培养容器中分离从单细胞中捕获的RNA/DNA。在一些实施方案中,可以将多个捕获的DNA/RNA序列保持在对应于其从中分离的细胞的文库中。在一些实施方案中,对所述多个捕获的DNA/RNA序列进行测序,使得测序的DNA或RNA对应于该细胞的表达模式。
本公开涉及制备由单细胞或分离的多细胞表达的寡核苷酸的文库的方法,产生所述文库的方法包括在将所述一个或多个细胞暴露于本文公开的一种或多种脂质修饰的寡核苷酸之后对来自所述一个或多个细胞的RNA或DNA进行测序。在一些实施方案中,可以通过将与脂质修饰的寡核苷酸结合的探针的已知信号或频率与寡核苷酸在其上结合的细胞相关联来分离和/或确认来自一个或多个细胞的内源性核苷酸。探针的信号或频率可与内源性DNA和/或RNA的来源配对。在一些实施方案中,内源性核苷酸是由一个或多个细胞表达的mRNA或通过例如PCR或由分离的mRNA产生cDNA文库的其它已知技术由构建mRNA的互补链的文库形成的cDNA。在一些实施方案中,通过使单细胞与本文公开的一种或多种脂质修饰的寡核苷酸接触而从所述细胞中分离cDNA或mRNA,使得每个捕获的细胞可以同与脂质修饰的一种或多种寡核苷酸结合的探针的确认、数目或检测相关联。一种或多种脂质修饰的寡核苷酸在一个或多个细胞上的不同分布可用于将该细胞与其特定组的内源性表达模式相关联。可以使用对细胞表面上的抗原或其它蛋白质特异性的抗体来分离携带一种或两种或更多种脂质修饰的寡核苷酸的细胞。细胞的表达模式(通过对由所述细胞表达的一个或多个内源性序列进行测序产生)可与具有已知抗原的细胞的相应特质相关联,所述已知抗原通过已知结合抗体的靶序列的抗体的粘附而确认。
实施例
一般空间信息
LMO也可用于根据相对空间取向对细胞进行条形码化。一般来说,有两种方法实现空间条形码化:(1)物理分离细胞/组织区域,接着如前所述进行条形码化,以及;(2)向细胞添加脂质修饰的寡核苷酸锚,接着添加空间限定的条形码寡核苷酸。在第一种情况下,可以通过用解剖刀解剖、微孔隔离或激光捕获显微解剖在一系列长度尺度上实现物理分离。一旦细胞被分离,可以将条形码引入到每个独特的样品中,指示细胞在该样品中的相对位置。在第二种情况下,所有细胞在添加条形码寡核苷酸之前接受锚和共锚。条形码对位置是特异性的,并从导入位置扩散,以经由与锚链杂交而被捕获在细胞上。通过空间条形码的数量和相对比率确定细胞的相对位置。空间条形码的引入可通过包括微阵列点样器、喷墨打印机、声学液体处理器和从固体支持物(例如,阵列或珠粒)上切割在内的若干方法实现。
发育肠道的空间条形码化(PROPHETIC)
为了将MULTI-seq应用于scRNA-seq样品的中尺度空间条形码化,我们首先将从新近安乐死并解剖的小鼠或从解剖的胚胎中手术移除小肠。然后在用解剖刀移除结缔组织和脂肪之前沿表面拉伸小肠。然后在用冰冷的PBS振荡洗涤4x之前将小肠切成片。洗涤后,将每条肠切成大小相等的段(即,对于成人肠沿近端-远端轴长度约1至约100微米;对于发育肠约1至约100微米)。然后将各段在2mL解离培养基(具有3%FBS、1%pen/strep、1%丙酮酸钠、1%MEM非必需氨基酸、1%L-谷氨酰胺、2.5%HEPES、5mM EDTA和10mM DTT的RPMI1640)中在室温下振荡解离20分钟。
在解离和用p1000移液器手动搅拌之后,将解离溶液通过100mM过滤器过滤到冰上的15mL锥形小瓶中。然后将留在过滤器顶部的组织块转移到含有4mL EDTA的单独15mL锥形小瓶中进行进一步消化(例如,剧烈摇动30秒),之后重新过滤。将此过程重复两次,产生粗略过滤的细胞悬浮液。然后将此粗略过滤的悬浮液通过70mM过滤器过滤到新的15mL锥形小瓶中,之后以1500rpm离心8分钟。
然后将每个细胞悬浮液用10mL冰冷的PBS洗涤一次,之后再悬浮成在冰冷的PBS中的160mL单细胞悬浮液。然后将单细胞悬浮液转移到48孔板的各个孔中,之后添加20mL与单个MULTI-seq样品条形码预杂交的2.5mM锚LMO。然后手动搅拌细胞悬浮液,并在冰上孵育5分钟,之后添加20mL的2.5mM共锚LMO,并随后在冰上孵育5分钟。MULTI-seq标记之后,用300mL的5%BSA稀释标记溶液以淬灭环境LMO,之后进行汇集、抗体染色和活细胞的FACS富集。然后使用液滴微流体对活细胞进行标准的10x基因组scRNA-seq工作流程。
使用微孔的物理分离
微孔阵列可采用软光刻直接产生到基板如SU-8中。光刻制作的SU-8模具也可用于在PDMS中制作微孔。此外,PDMS印模可用作用于其它聚合物如TPE、NOA81和PUMA的模具。或者可以采用3D打印方法如Nanoscribe来制作阵列。产生阵列的其它选择有注塑或热压印。孔的空间分辨率可以为100、90、80、70、60、50、40、30、20或10微米。
一旦制成,可以将组织解离试剂沉积到孔中。另外,将具有不同和限定的条形码或条形码组合的20至500nM锚添加到每个孔中,提供空间信息。将组织切片放置在阵列上,并用密封件向下夹住。这迫使组织进入孔中。解离后,移除密封件,并将阵列放置在含有淬灭试剂和非淬灭共锚的溶液中。洗涤细胞并通过细胞过滤器过滤,并且分选完整细胞。
可以使用任何数量的商业单细胞测序平台如10X Genomics、Bio-Rad ddSEQ、CelSee Genesis等进一步处理细胞。与每个细胞相关的MULTI-seq条形码或条形码组合揭示该细胞在原始阵列中的空间位置,并且可以与来自该细胞的转录信息联系起来。
使用寡核苷酸条形码阵列的基于扩散的方法
将组织切片放置在具有<10μM分辨率的寡核苷酸条形码的微阵列上。在组织切片之上洗涤锚(100nM至2μM),并使其扩散通过组织,之后添加等摩尔共锚。然后释放空间条形码(例如,切割二硫化物接头),并使其扩散通过组织。然后将组织解离,并且可以使用任何数量的商业单细胞测序平台如10X Genomics、Bio-Rad ddSEQ、CelSee Genesis等进一步处理。可通过每个空间条形码的相对量来确定细胞位置信息。
引入用于基于扩散的方法的条形码的替代方式
代替使用寡核苷酸阵列,使用声学液体处理器如Labcyte Echo或EDC ATS,条形码化试剂可通过打印针阵列直接递送至含有组织的组织溶液。也可以通过使不同的条形码沿不同的轴流向组织的不同区域将条形码化试剂递送到组织中进入微流体装置。
序列表
<110> 加利福尼亚大学董事会
Z·加特纳
D·帕特森
埃里克·周
R·韦伯
C·麦金尼斯
<120> 脂质修饰的寡核苷酸及其使用方法
<130> 37944.0014P1
<150> US 62/871,702
<151> 2019-07-08
<160> 7
<170> PatentIn version 3.5
<210> 1
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA寡核苷酸
<400> 1
gtaacgatcc agctgtcact tggaattctc gggtgccaag g 41
<210> 2
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 第二杂交区
<400> 2
agtgacagct ggatcgttac 20
<210> 3
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA寡核苷酸
<220>
<221> misc_feature
<222> (22)..(27)
<223> n是a、c、g或t
<400> 3
ccttggcacc cgagaattcc annnnnnaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaa 59
<210> 4
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 第一杂交区
<400> 4
gtaacgatcc agctgtcact 20
<210> 5
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 第一引物区
<400> 5
tggaattctc gggtgccaag g 21
<210> 6
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 第二引物区
<400> 6
ccttggcacc cgagaattcc a 21
<210> 7
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 捕获序列
<400> 7
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aa 32

Claims (95)

1.一种组合物,其包含:
(a)包含第一脂质部分、第一杂交区和第一引物区的第一脂质缀合的DNA寡核苷酸;
(b)包含第二杂交区和第二脂质部分的第二脂质缀合的DNA寡核苷酸,其中所述第二杂交区是所述第一杂交区的反向互补体;和
(c)包含第二引物区、条形码区和捕获序列的第三DNA寡核苷酸,其中所述第二引物区是所述第一引物区的反向互补体。
2.如权利要求1所述的组合物,其中所述第一脂质缀合的DNA寡核苷酸从5'至3'取向包含所述第一脂质部分、所述第一杂交区和所述第一引物区。
3.如权利要求1所述的组合物,其中所述第一脂质缀合的DNA寡核苷酸在3'至5'取向上包含所述第一脂质部分、所述第一杂交区和所述第一引物区。
4.如权利要求1至3中任一项所述的组合物,其中所述第二脂质缀合的DNA寡核苷酸从5'至3'取向包含所述第二杂交区和所述第二脂质部分。
5.如权利要求1至3中任一项所述的组合物,其中所述第二脂质缀合的DNA寡核苷酸从3'至5'取向包含所述第二杂交区和所述第二脂质部分。
6.如权利要求1至5中任一项所述的组合物,其中所述第三DNA寡核苷酸从5'至3'取向包含所述第二引物区、所述条形码区和所述捕获序列。
7.如权利要求1至5中任一项所述的组合物,其中所述第三DNA寡核苷酸从3'至5'取向包含所述第二引物区、所述条形码区和所述捕获序列。
8.如权利要求1至7中任一项所述的组合物,其中所述第一脂质部分和所述第二脂质部分包含具有约12至约28个碳的脂肪酸。
9.如权利要求1至8中任一项所述的组合物,其中所述第一脂质部分包含式I的化合物:
Figure FDA0003460412700000021
或其生理学上可接受的盐,
其中n1是5至25,n2是1至25,且X选自由NH、CH2、O和CH-R组成的组,其中R是C12至C28甘油单酯、烯基、烷基、芳基或芳烷基。
10.如权利要求1至9中任一项所述的组合物,其中所述第二脂质部分包含式II的化合物:
Figure FDA0003460412700000022
或其生理学上可接受的盐,
其中n1是5至25,n2是约0至约24,且X选自由NH、CH2、O和CH-R组成的组,其中R是C12至C28甘油单酯、烯基、烷基、芳基或芳烷基。
11.如权利要求1至10中任一项所述的组合物,其中所述第一脂质部分包含选自木蜡酸和胆固醇的脂质。
12.如权利要求1至11中任一项所述的组合物,其中所述第二脂质部分包含选自棕榈酸和胆固醇的脂质。
13.如权利要求11或12所述的组合物,其中所述胆固醇是胆固醇-三甘醇(TEG)。
14.如权利要求1至13中任一项所述的组合物,其中所述捕获序列是聚腺苷酸化区。
15.如权利要求1至14中任一项所述的组合物,其中所述第一脂质缀合的DNA寡核苷酸包含与SEQ ID NO:1(GTAACGATCCAGCTGTCACTTGGAATTCTCG GGTGCCAAGG)的核酸序列具有至少约70%的序列同一性的核酸序列。
16.如权利要求1至15中任一项所述的组合物,其中所述第二脂质缀合的DNA寡核苷酸包含与SEQ ID NO:2(AGTGACAGCTGGATCGTTAC)的核酸序列具有至少约70%的序列同一性的核酸序列。
17.如权利要求1至16中任一项所述的组合物,其中所述第三DNA寡核苷酸包含与SEQID NO:3(CCTTGGCACCCGAGAATTCCANNNNNNAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA)的核酸序列具有至少70%的序列同一性的核酸序列。
18.如权利要求1至17中任一项所述的组合物,其中所述第一脂质缀合的DNA寡核苷酸、所述第二脂质缀合的DNA寡核苷酸和所述第三脂质缀合的DNA寡核苷酸中的一者或多者与固体支持物结合。
19.如权利要求18所述的组合物,其中所述固体支持物是珠粒。
20.如权利要求19所述的组合物,其中所述捕获序列包含聚腺苷酸化区,且所述珠粒包含与所述第三DNA寡核苷酸的所述聚腺苷酸化区杂交的聚(T)区。
21.一种包含脂质缀合的DNA寡核苷酸的组合物,所述脂质缀合的DNA寡核苷酸包含脂质部分、条形码区和捕获序列。
22.一种组合物,其包含:
(a)包含脂质部分和第一引物区的第一脂质缀合的DNA寡核苷酸;和
(b)包含第二引物区、条形码区和捕获序列的第二DNA寡核苷酸,其中所述第二引物区是所述第一引物区的反向互补体。
23.一种标记细胞样品的方法、从细胞样品中分离内源性DNA的方法或对来自细胞样品的核酸序列进行测序的方法,所述方法包括:
(a)将所述细胞样品暴露于本文公开的一种或多种锚-脂质修饰的寡核苷酸或权利要求1至22中任一项的组合物,持续足以使所述锚-脂质修饰的寡核苷酸将其自身包埋在所述细胞的细胞膜内的时间段;
(b)将所述细胞样品暴露于与所述锚-脂质修饰的寡核苷酸互补的一种或多种标记寡核苷酸,持续足以使所述锚-脂质修饰的寡核苷酸与所述一种或多种标记寡核苷酸形成核酸的互补链的时间段;
(c)将所述一种或多种标记寡核苷酸与所述一种或多种锚-脂质修饰的寡核苷酸连接;并任选
(d)通过检测对应于所述一种或多种标记寡核苷酸的多个独特核苷酸序列中的一个来检测所述一种或多种标记寡核苷酸的存在;和/或
(e)基于一种或多种标记寡核苷酸的存在分离所述细胞,其中通过检测对应于所述一种或多种标记寡核苷酸的多个独特核苷酸序列中的一个来确定所述一种或多种标记寡核苷酸的存在。
24.如权利要求23所述的方法,其中所述细胞样品是来自受试者的组织样品的细胞的三维制剂,厚度为约0.1微米至约99微米。
25.如权利要求23或24所述的方法,其中所述细胞膜是将细胞质与所述细胞外部的点分开的质膜,或其中所述细胞膜是核膜。
26.一种对来自受试者样品的一个或多个细胞的核酸进行测序的方法,包括:
(a)将对应于所述样品的区域的厚度为约0.1微米至约99微米的三维制剂或切片中的所述一个或多个细胞分配到容器中;
(b)用本文公开的寡核苷酸标记对应于所述样品的区域的所述一个或多个细胞;
(c)从所述一个或多个细胞中分离所述核酸;以及
(d)对来自所述一个或多个细胞的所述核酸进行测序。
27.如权利要求26所述的方法,还包括:
(e)编译来自所述一个或多个细胞中的每一个的序列信息。
28.如权利要求27所述的方法,其中所述编译步骤包括产生对应于所述样品的区域的所述一个或多个细胞中的每一个的表达谱。
29.如权利要求28所述的方法,还包括将所述核酸的所述序列信息和/或所述表达谱与所述样品内或所述受试者内的所述一个或多个细胞的空间位置相关联。
30.如权利要求26至29中任一项所述的方法,其中所述标记步骤包括:
(w)将所述一个或多个细胞暴露于一种或多种锚-脂质修饰的寡核苷酸,持续足以使所述锚-脂质修饰的寡核苷酸将其自身包埋在所述细胞的细胞膜内的时间段;和/或
(x)使所述一个或多个细胞暴露于与所述锚-脂质修饰的寡核苷酸互补的一种或多种标记寡核苷酸,持续足以使所述锚-脂质修饰的寡核苷酸与所述一种或多种标记寡核苷酸形成核酸的互补链的时间段;和/或
(y)将所述一种或多种标记寡核苷酸与所述一种或多种锚-脂质修饰的寡核苷酸连接;并任选
(z)通过检测对应于所述一种或多种标记寡核苷酸的一个或多个独特核苷酸序列来检测所述一种或多种标记寡核苷酸的存在。
31.如权利要求30所述的方法,其中所述分离细胞的步骤包括基于一种或多种标记寡核苷酸的存在分离所述细胞,其中通过检测对应于所述一种或多种标记寡核苷酸的多个独特核苷酸序列中的一个来确定所述一种或多种标记寡核苷酸的存在。
32.如权利要求30所述的方法,其中所述一种或多种锚-脂质修饰的寡核苷酸包含:
(a)包含第一脂质部分、第一杂交区和第一引物区的第一脂质缀合的DNA寡核苷酸;
(b)包含第二杂交区和第二脂质部分的第二脂质缀合的DNA寡核苷酸,其中所述第二杂交区是所述第一杂交区的反向互补体;和
(c)包含第二引物区、条形码区和捕获序列的第三DNA寡核苷酸,其中所述第二引物区是所述第一引物区的反向互补体。
33.如权利要求32所述的方法,其中所述第一脂质缀合的DNA寡核苷酸从5'至3'取向包含所述第一脂质部分、所述第一杂交区和所述第一引物区。
34.如权利要求32所述的方法,其中所述第一脂质缀合的DNA寡核苷酸从3'至5'取向包含所述第一脂质部分、所述第一杂交区和所述第一引物区。
35.如权利要求32至34中任一项所述的方法,其中所述第二脂质缀合的DNA寡核苷酸从5'至3'取向包含所述第二杂交区和所述第二脂质部分。
36.如权利要求32至34中任一项所述的方法,其中所述第二脂质缀合的DNA寡核苷酸从3'至5'取向包含所述第二杂交区和所述第二脂质部分。
37.如权利要求32至36中任一项所述的方法,其中所述第三DNA寡核苷酸从5'至3'取向包含所述第二引物区、所述条形码区和所述捕获序列。
38.如权利要求32至36中任一项所述的方法,其中所述第三DNA寡核苷酸从3'至5'取向包含所述第二引物区、所述条形码区和所述捕获序列。
39.如权利要求32至38中任一项所述的方法,其中所述第一脂质部分和所述第二脂质部分包含具有约12至约28个碳的脂肪酸。
40.如权利要求32至39中任一项所述的方法,其中所述第一脂质部分包含式I的化合物:
Figure FDA0003460412700000081
或其生理学上可接受的盐,
其中n1是5至25,n2是1至25,且X选自由NH、CH2、O和CH-R组成的组,其中R是C12至C28甘油单酯、烯基、烷基、芳基或芳烷基。
41.如权利要求32至40中任一项所述的方法,其中所述第二脂质部分包含式II的化合物:
Figure FDA0003460412700000082
或其生理学上可接受的盐,
其中n1是5至25,n2是0至24,且X选自由NH、CH2、O和CH-R组成的组,其中R是C12至C28甘油单酯、烯基、烷基、芳基或芳烷基。
42.如权利要求32至41中任一项所述的方法,其中所述第一脂质部分包含选自木蜡酸和胆固醇的脂质。
43.如权利要求32至42中任一项所述的方法,其中所述第二脂质部分包含选自棕榈酸和胆固醇的脂质。
44.如权利要求42或43所述的方法,其中所述胆固醇是胆固醇-三甘醇(TEG)。
45.如权利要求32至44中任一项所述的方法,其中所述捕获序列是聚腺苷酸化区。
46.如权利要求32至45中任一项所述的方法,其中所述第一脂质缀合的DNA寡核苷酸包含与SEQ ID NO:1(GTAACGATCCAGCTGTCACTTGGAATTCTCG GGTGCCAAGG)的核酸序列具有至少约70%的序列同一性的核酸序列。
47.如权利要求32至46中任一项所述的方法,其中所述第二脂质缀合的DNA寡核苷酸包含与SEQ ID NO:2(AGTGACAGCTGGATCGTTAC)的核酸序列具有至少约70%的序列同一性的核酸序列。
48.如权利要求32至47中任一项所述的方法,其中所述第三DNA寡核苷酸包含与SEQ IDNO:3(CCTTGGCACCCGAGAATTCCANNNNNNAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAA,其中N是任何核酸)的核酸序列具有至少约70%的序列同一性的核酸序列。
49.如权利要求32至48中任一项所述的方法,其中所述第一脂质缀合的DNA寡核苷酸、所述第二脂质缀合的DNA寡核苷酸和所述第三脂质缀合的DNA寡核苷酸中的一者或多者与固体支持物结合。
50.如权利要求49所述的方法,其中所述固体支持物是珠粒。
51.如权利要求50所述的方法,其中所述捕获序列包含聚腺苷酸化区,且所述珠粒包含与所述第三DNA寡核苷酸的所述聚腺苷酸化区杂交的聚(T)区。
52.一种确认受试者的样品或组织内的核酸表达模式的空间位置的方法,所述方法包括:
(a)将来自所述样品或对应于所述样品的区域的组织的一个或多个细胞分配到多个容器中的一个中;
(b)用本文公开的已知寡核苷酸使对应于样品的区域的一个或多个细胞暴露,持续足以使所述已知寡核苷酸掺入所述一个或多个细胞中的时间,每种寡核苷酸对于一个或多个细胞暴露于其中的所述多个容器中的一个是独特的并且对应于所述多个容器中的一个;
(c)根据所述已知寡核苷酸从所述一个或多个细胞中分离核酸;
(d)对来自所述一个或多个细胞的核酸的表达进行定量和/或对所述核酸进行测序;
(e)将表达谱中的核酸表达标准化;以及
(f)将来自所述一个或多个细胞的表达谱与所述细胞在所述样品内、相对于所述组织或在所述组织内的空间位置相关联,
其中在所述多个容器中的每一者中的本文公开的已知寡核苷酸独立地选自以下中的一种或组合:
(x)包含第一脂质部分、第一杂交区和第一引物区的第一脂质缀合的DNA寡核苷酸;和/或
(y)包含第二杂交区和第二脂质部分的第二脂质缀合的DNA寡核苷酸,其中所述第二杂交区是所述第一杂交区的反向互补体;和/或
(z)包含第二引物区、条形码区和捕获序列的第三DNA寡核苷酸,其中所述第二引物区是所述第一引物区的反向互补体;
其中所述分配步骤包括将厚度为约0.1至约99微米的所述样品的切片或三维制剂放置到多个容器中的一个中。
53.如权利要求52所述的方法,还包括:
(g)使所述细胞暴露于流式细胞术。
54.如权利要求52或53所述的方法,其中所述分离细胞的步骤包括使所述细胞暴露于流式细胞术。
55.一种对来自受试者样品的一个或多个细胞的核酸进行测序的方法,包括:
(a)将对应于所述样品的区域的所述一个或多个细胞分配到容器中;
(b)用本文公开的寡核苷酸标记对应于所述样品的区域的所述一个或多个细胞;
(c)从所述一个或多个细胞中分离所述核酸;以及
(d)对来自所述一个或多个细胞的所述核酸进行测序,
其中所述分配步骤包括将厚度为约0.1至约99微米的所述样品的切片或三维制剂放置到多个容器中的一个中。
56.如权利要求55所述的方法,还包括:
(e)编译来自所述一个或多个细胞中的每一个的序列信息。
57.如权利要求56所述的方法,其中所述编译步骤包括产生对应于所述样品的区域的所述一个或多个细胞中的每一个的表达谱。
58.如权利要求55至57中任一项所述的方法,还包括将所述核酸的所述序列信息和/或所述表达谱与所述样品内或所述受试者内的所述一个或多个细胞的空间位置相关联。
59.如权利要求55至58中任一项所述的方法,其中所述标记步骤包括:
(w)将所述一个或多个细胞暴露于一种或多种锚-脂质修饰的寡核苷酸,持续足以使所述锚-脂质修饰的寡核苷酸将其自身包埋在所述细胞的细胞膜内的时间段;和/或
(x)使所述一个或多个细胞暴露于与所述锚-脂质修饰的寡核苷酸互补的一种或多种标记寡核苷酸,持续足以使所述锚-脂质修饰的寡核苷酸与所述一种或多种标记寡核苷酸形成核酸的互补链的时间段;和/或
(y)将所述一种或多种标记寡核苷酸与所述一种或多种锚-脂质修饰的寡核苷酸连接;并任选
(z)通过检测对应于所述一种或多种标记寡核苷酸的多个独特核苷酸序列中的一个来检测所述一种或多种标记寡核苷酸的存在。
60.如权利要求59所述的方法,其中所述分离一个或多个细胞的核酸的步骤包括基于一种或多种标记寡核苷酸的存在来分离所述一个或多个细胞,其中通过检测对应于所述一种或多种标记寡核苷酸的多个独特核苷酸序列中的一个来确定所述一种或多种标记寡核苷酸的存在。
61.如权利要求52至60中任一项所述的方法,其中所述第一脂质缀合的DNA寡核苷酸从5'至3'取向包含所述第一脂质部分、所述第一杂交区和所述第一引物区。
62.如权利要求52至61中任一项所述的方法,其中所述第一脂质缀合的DNA寡核苷酸在3’至5’取向上包含所述第一脂质部分、所述第一杂交区和所述第一引物区。
63.如权利要求52至62中任一项所述的方法,其中所述第二脂质缀合的DNA寡核苷酸从5'至3'取向包含所述第二杂交区和所述第二脂质部分。
64.如权利要求52至62中任一项所述的方法,其中所述第二脂质缀合的DNA寡核苷酸从3'至5'取向包含所述第二杂交区和所述第二脂质部分。
65.如权利要求52至64中任一项所述的方法,其中所述第三DNA寡核苷酸从5'至3'取向包含所述第二引物区、所述条形码区和所述捕获序列。
66.如权利要求52至64中任一项所述的方法,其中所述第三DNA寡核苷酸从3'至5'取向包含所述第二引物区、所述条形码区和所述捕获序列。
67.如权利要求52至66中任一项所述的方法,其中所述第一脂质部分和所述第二脂质部分包含具有约12至约28个碳的脂肪酸。
68.如权利要求52至67中任一项所述的方法,其中所述第一脂质部分包含式I的化合物:
Figure FDA0003460412700000131
Figure FDA0003460412700000141
或其生理学上可接受的盐,
其中n1是5至25,n2是1至25,且X选自由NH、CH2、O和CH-R组成的组,其中R是C12至C28甘油单酯、烯基、烷基、芳基或芳烷基。
69.如权利要求52至68中任一项所述的方法,其中所述第二脂质部分包含式II的化合物:
Figure FDA0003460412700000142
或其生理学上可接受的盐,
其中n1是5至25,n2是0至24,且X选自由NH、CH2、O和CH-R组成的组,其中R是C12至C28甘油单酯、烯基、烷基、芳基或芳烷基。
70.如权利要求52至69中任一项所述的方法,其中所述第一脂质部分包含选自木蜡酸和胆固醇的脂质。
71.如权利要求52至70中任一项所述的方法,其中所述第二脂质部分包含选自棕榈酸和胆固醇的脂质。
72.如权利要求70或71所述的方法,其中所述胆固醇是胆固醇-三甘醇(TEG)。
73.如权利要求52至72中任一项所述的方法,其中所述捕获序列是聚腺苷酸化区。
74.如权利要求52至73中任一项所述的方法,其中所述第一脂质缀合的DNA寡核苷酸包含与SEQ ID NO:1(GTAACGATCCAGCTGTCACTTGGAATTCTCG GGTGCCAAGG)的核酸序列具有至少约70%的序列同一性的核酸序列。
75.如权利要求52至74中任一项所述的方法,其中所述第二脂质缀合的DNA寡核苷酸包含与SEQ ID NO:2(AGTGACAGCTGGATCGTTAC)的核酸序列具有至少约70%的序列同一性的核酸序列。
76.如权利要求52至75中任一项所述的方法,其中所述第三DNA寡核苷酸包含与SEQ IDNO:3(CCTTGGCACCCGAGAATTCCANNNNNNAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAA,其中N是任何核酸)的核酸序列具有至少约70%的序列同一性的核酸序列。
77.如权利要求52至76中任一项所述的方法,其中所述对一个或多个细胞的核酸表达进行测序的步骤或所述对一个或多个细胞的核酸的表达进行定量的步骤包括在测序装置中进行液滴微流体化。
78.一种确认受试者的组织内的核酸的空间表达模式的方法,所述方法包括:
(a)将来自对应于所述组织的区域的样品的一个或多个细胞分配到多个容器中的一个中;
(b)用包含脂质部分、条形码区和捕获序列的脂质缀合的DNA寡核苷酸使所述一个或多个细胞暴露,持续足以使所述脂质部分将其自身包埋在所述一个或多个细胞的细胞膜内的时间段,其中所述脂质缀合的DNA寡核苷酸的所述条形码区对于所述一个或多个细胞暴露于其中的所述多个容器之一的每一者是独特的;
(c)对所述一个或多个细胞中由所述脂质缀合的DNA寡核苷酸的所述捕获序列捕获的核酸进行测序;以及
(d)根据包含在所述测序核酸中的每一者中的所述条形码区将来自所述一个或多个细胞的所述测序核酸与所述一个或多个细胞在所述组织内和/或相对于所述组织的空间位置相关联。
79.如权利要求78所述的方法,其中所述脂质缀合的DNA寡核苷酸包含:
(i)包含脂质部分和第一引物区的第一脂质缀合的DNA寡核苷酸;和
(ii)包含第二引物区、条形码区和捕获序列的第二DNA寡核苷酸,其中所述第二引物区是所述第一引物区的反向互补体。
80.如权利要求79所述的方法,其中所述第一脂质缀合的DNA寡核苷酸还包含第一杂交区。
81.如权利要求80所述的方法,还包括在所述测序步骤之前将所述一个或多个细胞暴露于第二脂质缀合的DNA寡核苷酸,其中所述第二脂质缀合的DNA寡核苷酸包含第二杂交区和第二脂质部分,其中所述第二杂交区是所述第一杂交区的反向互补体。
82.如权利要求78至81中任一项所述的方法,其中所述第一脂质部分和所述第二脂质部分包含具有约12至约28个碳的脂肪酸。
83.如权利要求78至82中任一项所述的方法,其中所述第一脂质部分包含式I的化合物:
Figure FDA0003460412700000171
或其生理学上可接受的盐,
其中n1是5至25,n2是1至25,且X选自由NH、CH2、O和CH-R组成的组,其中R是C12至C28甘油单酯、烯基、烷基、芳基或芳烷基。
84.如权利要求78至83中任一项所述的方法,其中所述第二脂质部分包含式II的化合物:
Figure FDA0003460412700000172
或其生理学上可接受的盐,
其中n1是5至25,n2是0至24,且X选自由NH、CH2、O和CH-R组成的组,其中R是C12至C28甘油单酯、烯基、烷基、芳基或芳烷基。
85.如权利要求78至84中任一项所述的方法,其中所述第一脂质部分包含选自木蜡酸和胆固醇的脂质。
86.如权利要求78至85中任一项所述的方法,其中所述第二脂质部分包含选自棕榈酸和胆固醇的脂质。
87.如权利要求85或86所述的方法,其中所述胆固醇是胆固醇-三甘醇(TEG)。
88.如权利要求78至87中任一项所述的方法,其中所述捕获序列是聚腺苷酸化区。
89.如权利要求78至88中任一项所述的方法,其中所述第一脂质缀合的DNA寡核苷酸包含与SEQ ID NO:1(GTAACGATCCAGCTGTCACTTGGAATTCTCG GGTGCCAAGG)的核酸序列具有至少约70%的序列同一性的核酸序列。
90.如权利要求78至89中任一项所述的方法,其中所述第二脂质缀合的DNA寡核苷酸包含与SEQ ID NO:2(AGTGACAGCTGGATCGTTAC)的核酸序列具有至少约70%的序列同一性的核酸序列。
91.如权利要求78至90中任一项所述的方法,其中所述第三DNA寡核苷酸包含与SEQ IDNO:3(CCTTGGCACCCGAGAATTCCANNNNNNAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAA)的核酸序列具有至少70%的序列同一性的核酸序列。
92.如权利要求78至91中任一项所述的方法,还包括:
(e)使所述细胞暴露于流式细胞术。
93.如权利要求78至92中任一项所述的方法,其中所述分配步骤包括将厚度为约0.1至约99微米的所述样品的组织切片或三维制剂放置到多个容器中的所述一个中。
94.如权利要求78至93中任一项所述的方法,其中所述一个或多个容器是多孔。
95.如权利要求78至94中任一项所述的方法,其中所述样品是组织切片。
CN202080049879.2A 2019-07-08 2020-07-08 脂质修饰的寡核苷酸及其使用方法 Pending CN114127306A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962871702P 2019-07-08 2019-07-08
US62/871702 2019-07-08
PCT/US2020/041277 WO2021007367A1 (en) 2019-07-08 2020-07-08 Lipid-modified oligonucleotides and methods of using the same

Publications (1)

Publication Number Publication Date
CN114127306A true CN114127306A (zh) 2022-03-01

Family

ID=74115001

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080049879.2A Pending CN114127306A (zh) 2019-07-08 2020-07-08 脂质修饰的寡核苷酸及其使用方法

Country Status (5)

Country Link
US (1) US20220275438A1 (zh)
EP (1) EP3997237A4 (zh)
JP (1) JP2022540443A (zh)
CN (1) CN114127306A (zh)
WO (1) WO2021007367A1 (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004044141A2 (en) * 2002-11-05 2004-05-27 Isis Pharmaceuticals, Inc. Conjugated oligomeric compounds and their use in gene modulation
US20050119470A1 (en) * 1996-06-06 2005-06-02 Muthiah Manoharan Conjugated oligomeric compounds and their use in gene modulation
US20140294782A1 (en) * 2011-11-02 2014-10-02 The Regents Of The University Of California Reprogramming of Cellular Adhesion
WO2018022581A1 (en) * 2016-07-26 2018-02-01 President And Fellows Of Harvard College Barcoded systems with multiple information

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050119470A1 (en) * 1996-06-06 2005-06-02 Muthiah Manoharan Conjugated oligomeric compounds and their use in gene modulation
WO2004044141A2 (en) * 2002-11-05 2004-05-27 Isis Pharmaceuticals, Inc. Conjugated oligomeric compounds and their use in gene modulation
US20140294782A1 (en) * 2011-11-02 2014-10-02 The Regents Of The University Of California Reprogramming of Cellular Adhesion
US20170305955A1 (en) * 2011-11-02 2017-10-26 The Regents Of The University Of California Reprogramming of Cellular Adhesion
WO2018022581A1 (en) * 2016-07-26 2018-02-01 President And Fellows Of Harvard College Barcoded systems with multiple information

Also Published As

Publication number Publication date
EP3997237A1 (en) 2022-05-18
US20220275438A1 (en) 2022-09-01
JP2022540443A (ja) 2022-09-15
EP3997237A4 (en) 2023-08-02
WO2021007367A1 (en) 2021-01-14

Similar Documents

Publication Publication Date Title
US20230393071A1 (en) Methods and compositions for partitioning a biological sample
US20220403455A1 (en) Methods for determining a location of an analyte in a biological sample
US20230220454A1 (en) Methods of releasing an extended capture probe from a substrate and uses of the same
US20240043908A1 (en) Methods, compositions, and kits for blocking a capture probe on a spatial array
US11952627B2 (en) Methods for identifying a location of an RNA in a biological sample
JP7456637B2 (ja) 脂質修飾オリゴヌクレオチドおよびその使用方法
EP3420110B1 (en) Multiplexed single molecule rna visualization with a two-probe proximity ligation system
JP7038209B2 (ja) エピタコ電気泳動を使用する試料分析のための装置
AU2021385065A1 (en) Methods and compositions for analyzing immune infiltration in cancer stroma to predict clinical outcome
EP3766988B1 (en) High-throughput single-cell analysis combining proteomic and genomic information
CN105264088B (zh) 提高鉴定细胞中的多个表位的动态范围
WO2023086880A1 (en) Methods, compositions, and kits for determining the location of an analyte in a biological sample
CN103890191B (zh) 单细胞全基因组扩增方法
CN110114520A (zh) Dna条形码组合物和在微流体装置中原位识别的方法
KR20180040586A (ko) 절편화된 조직의 사용자-한정된 영역에서의 유전자 발현의 동시적인 정량화
EP3864403A1 (en) Detection methods for epitachophoresis workflow automation
CN101883870B (zh) 用于快速分析目标分析物并具有增强的灵敏度和特异度的逆向导流平台及其装置
JP7493725B2 (ja) 新規細胞表現型スクリーニング方法
JP7279885B2 (ja) 1種以上の被検物質と共存した細胞のゲノム関連情報を検出する方法
US20220275438A1 (en) Lipid-modified oligonucleotides and methods of using the same
CN116888278A (zh) 分析癌症基质中免疫浸润以预测临床转归的方法和组合物
JP4474551B2 (ja) 神経膠腫細胞株u251の増殖能抑制剤及び浸潤能抑制剤
JP2022543562A (ja) 標的分析に関連する方法および組成物
JP2003093073A (ja) シトクロムp450遺伝子の発現を解析するためのプライマーおよびプライマーセット、並びにそのプライマーセットを用いた被検物質の毒性を予測する方法、そのプライマーセットを含む試薬球体、その試薬球体を具備する反応容器
AU2004291700A1 (en) Identification of diagnostic markers for communicable subacute spongiform encephalopathies

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination