CN118103504A - 高空间分辨率表观基因组分析 - Google Patents

高空间分辨率表观基因组分析 Download PDF

Info

Publication number
CN118103504A
CN118103504A CN202180095057.2A CN202180095057A CN118103504A CN 118103504 A CN118103504 A CN 118103504A CN 202180095057 A CN202180095057 A CN 202180095057A CN 118103504 A CN118103504 A CN 118103504A
Authority
CN
China
Prior art keywords
spatial
tissue
seq
depicts
barcoded polynucleotides
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180095057.2A
Other languages
English (en)
Inventor
樊荣
邓彦翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yale University
Original Assignee
Yale University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yale University filed Critical Yale University
Publication of CN118103504A publication Critical patent/CN118103504A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01LCHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
    • B01L3/00Containers or dishes for laboratory use, e.g. laboratory glassware; Droppers
    • B01L3/50Containers for the purpose of retaining a material to be analysed, e.g. test tubes
    • B01L3/502Containers for the purpose of retaining a material to be analysed, e.g. test tubes with fluid transport, e.g. in multi-compartment structures
    • B01L3/5027Containers for the purpose of retaining a material to be analysed, e.g. test tubes with fluid transport, e.g. in multi-compartment structures by integrated microfluidic structures, i.e. dimensions of channels and chambers are such that surface tension forces are important, e.g. lab-on-a-chip
    • B01L3/502707Containers for the purpose of retaining a material to be analysed, e.g. test tubes with fluid transport, e.g. in multi-compartment structures by integrated microfluidic structures, i.e. dimensions of channels and chambers are such that surface tension forces are important, e.g. lab-on-a-chip characterised by the manufacture of the container or its components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01LCHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
    • B01L2300/00Additional constructional details
    • B01L2300/08Geometry, shape and general structure
    • B01L2300/0861Configuration of multiple channels and/or chambers in a single devices
    • B01L2300/0883Serpentine channels
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10056Microscopic image

Landscapes

  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Theoretical Computer Science (AREA)
  • Clinical Laboratory Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Radiology & Medical Imaging (AREA)
  • Dispersion Chemistry (AREA)
  • Medical Informatics (AREA)
  • Hematology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本文提供了用于产生生物样本的高分辨率空间表观基因组图的组合物和方法。

Description

高空间分辨率表观基因组分析
相关申请的交叉引用
本申请要求2020年12月31日提交的美国临时专利申请号63/132,659的权益,该申请据此全文以引用方式并入本文。
背景技术
已经广泛认识到表观遗传机制在正常发育和疾病发展中是关键的。分析原始组织样本中所有相关的表观遗传改变是必要的,并且理想的情况下还利用空间位置信息,因为正是组织内不同细胞中差异激活的表观遗传程序的差异导致了不同的细胞类型和组织成为功能性组织或器官。另外,这种分析应该以无偏的方式在全基因组规模上进行,以便获得组织中每个细胞的表观遗传状态的完整图像,并发现不能用表观遗传位点的靶向检测来探索的新机制。然而,这种分析对于任何现有技术都是不可能的。现有技术水平的表观基因组分析仍然主要基于bulk组织样本或含有数万个细胞的样本。已经开发了使用测序(scATAC-seq)分析方法的转座酶可及染色质的单细胞测定,但是其具有相当有限的覆盖或每细胞总读段。当前的方法都不能提供空间信息。
因此,本领域需要用于空间表观基因组分析的系统和方法。本发明解决了本领域中这种未满足的需要。
发明内容
在一个实施方案中,本发明涉及一种方法,该方法包括:
(a)将转座酶和接头衔接子序列递送到安放在基底上的组织样本中的目标区域;
(b)将第一组条形码化多核苷酸递送到该目标区域,其中这些条形码化多核苷酸包含用于连接到该接头衔接子序列的第一区域、用于空间条形码化的第二独特区域和用于连接到第二条形码的区域或通用连接接头的第三接头区域,其中该第一组条形码化多核苷酸通过夹持到该目标区域的第一微流体装置递送;
(c)将连接试剂递送到该目标区域以将连接衔接子接合到该第一组的这些条形码化多核苷酸;
(d)将第二组条形码化多核苷酸递送到该目标区域,其中这些条形码化多核苷酸包含用于连接到第一条形码的接头区域或通用连接接头的第一区域、用于空间条形码化的第二独特区域和包含用于被DNA扩增用引物识别的序列的第三连接区域,其中该第二组条形码化多核苷酸通过夹持到该目标区域的第二微流体装置递送,其中该第二微流体装置在该目标区域上垂直于该第一微流体装置的微通道的方向取向;
(e)将连接试剂递送到该目标区域以将该第一组的条形码化多核苷酸接合到该第二组的条形码化多核苷酸;
(f)对该目标区域进行成像以产生样本图像;
(g)将裂解缓冲液或变性试剂递送到该目标区域以产生裂解或变性的组织样本;以及
(h)从该裂解或变性的组织样本中提取DNA。
在一个实施方案中,该方法还包括在递送转座酶和接头衔接子序列之前透化组织样本的步骤。
在一个实施方案中,步骤(a)包括将(i)特异性结合目标表观基因组标记物的一抗、(ii)二抗以及(iii)转座酶和接头衔接子序列递送到安放在基底上的组织样本中的目标区域。
在一个实施方案中,一抗选自完整抗体、Fab抗体片段、F(ab')2抗体片段、单特异性Fab2片段、双特异性Fab2片段、三特异性Fab3片段、单链可变片段(scFv)、双特异性双抗体、三特异性双抗体、scFv-Fc分子、纳米抗体和微型抗体。
在一个实施方案中,表观基因组标记物是H2AK5ac、H2AK9ac、H2BK120ac、H2BK12ac、H2BK15ac、H2BK20ac、H2BK5ac、H2Bub、H3、H3ac、H3K14ac、H3K18ac、H3K23ac、H3K23me2、H3K27me1、H3K27me2、H3K36ac、H3K36me1、H3K36me2、H3K4ac、H3K56ac、H3K79me1、H3K79me3、H3K9acS10ph、H3K9me2、H3S10ph、H3T11ph、H4、H4ac、H4K12ac、H4K16ac、H4K5ac、H4K8ac、H4K91ac、H3F3A、H3K27me3、H3K36me3、H3K4me1、H3K79me2、H3K9me1、H3K9me2、H3K9me3、H4K20me1、H2AFZ、H3K27ac、H3K4me2、H3K4me3或H3K9ac。
在一个实施方案中,该方法还包括将连接接头序列递送到生物样本,其中该连接接头是
a)核酸分子,该核酸分子包含与转座子相关联的连接衔接子的连接接头序列互补的序列和与第一组的条形码化多核苷酸的连接接头序列互补的序列;或
b)核酸分子,该核酸分子包含与第一组的条形码化多核苷酸的连接接头序列互补的序列和与第二组的条形码化多核苷酸的连接接头序列互补的序列。
在一个实施方案中,该方法还包括步骤(i)对DNA进行测序以产生DNA读段。在一个实施方案中,该方法还包括通过将空间可寻址条形码化缀合物与对应测序读段匹配来构建组织切片的空间图。在一个实施方案中,该方法还包括通过将空间图与样本图像相关联来鉴定核酸的解剖位置。
在一个实施方案中,安放在载玻片上的组织切片通过以下步骤产生:将福尔马林固定石蜡包埋(FFPE)组织切片,任选地切成5μm至10μm的切片,并将组织切片安放在基底上,任选地是聚-L-赖氨酸涂层的载玻片;
向组织切片施加洗涤溶液,任选地是二甲苯溶液,以使组织切片脱蜡;
向组织切片施加再水合溶液以使组织切片再水合;
向组织切片施加酶溶液以透化组织切片;以及
将福尔马林施加到组织切片以对组织切片进行后固定。
在一个实施方案中,第一微流体装置和/或第二微流体装置由聚二甲基硅氧烷(PDMS)制造。
在一个实施方案中,第一微流体装置和/或第二微流体装置包括10至1000个微通道。
在一个实施方案中,第一微流体装置和/或第二微流体装置包括蛇形微通道。
在一个实施方案中,该方法还包括将第三组条形码化多核苷酸递送到目标区域,其中第三组条形码化多核苷酸被递送到特定区,使得每个区会区分第一条形码序列和第二条形码序列的特定重叠区域;其中第三组条形码化多核苷酸任选地通过夹持到基底的装置中的一组孔被直接递送到组织切片,其中每个孔被直接定位在第一条形码序列和第二条形码序列的重叠区上方。
在一个实施方案中,使用负压系统通过第一微流体装置递送第一组条形码化多核苷酸和/或使用负压系统通过第二微流体装置递送第二组条形码化多核苷酸。
在一个实施方案中,任选地通过夹持到基底的装置中的孔,裂解缓冲液或变性试剂被直接递送到组织切片,其中该孔被直接定位在目标区域上方。
在一个实施方案中,第一组条形码化多核苷酸和/或第二组条形码化多核苷酸包含至少10个条形码化多核苷酸。
在一个实施方案中,成像用光学显微镜或荧光显微镜进行。
在一个实施方案中,基底选自玻璃载玻片和塑料载玻片。
附图说明
当结合附图阅读时,将更好地理解本发明的优选实施方案的以下详细描述。出于解释本发明的目的,在附图中示出了目前优选的实施方案。然而,应当理解,本发明不限于附图中所示的实施方案的精确布置和机构。
图1描绘了用于空间分辨转录组和蛋白质作图的DBiT-seq。(图1A)示意性工作流程。(图1B)用于对50×50个组织像素(10μm)进行条形码化的微流体装置。(图1C)比较通过DBiT-seq和其他技术检测的基因和UMI数量。(图1D)E10小鼠胚胎中眼区发育的空间作图。(图1E)选择基因的空间表达揭示了视网膜色素上皮(RPE)中的视泡和单层黑素细胞。(图1F)scRNA-seq和DBiT-seq组合数据的计算分析揭示了DBiT-seq组织像素(10μm)受单细胞转录组支配。(图1G)不同基因聚类的空间表达模式进一步鉴定了不同的组织类型。
图2描绘了hsrATAC-seq的示意图:通过使用DBiT进行测序来进行染色质可及性的高空间分辨率测定,以用于组织中表观遗传状态的空间作图。
图3A和图3B描绘了其他空间表观基因组分析技术的示例性示意图。示意图示出了Tn5化学的修饰,例如,对于空间CHIP-seq(图3A)或空间甲基化组-seq(图3B)。
图4描绘了在微流体系统中产生的人造人胚胎。该系统可容易地用于产生这些样本,以用于胚胎发育的空间表观基因组作图。
图5A至图5E描绘了hsrChST-seq的设计。(图5A)直接在组织载玻片上进行的Cut&Tag方案的示意图。(图5B)一抗检测特异性组蛋白修饰,并且Tn5转座子复合物可共价缀合至该抗体或通过结合至二抗。(图5C)并入Tn5转座体复合物中的接头序列的设计。(图5D)将条形码A和B空间地递送到组织像素(tixel)的工作流程以及对样本进行放大和排序的化学工作流程。(图5E)两个微流体芯片用于交叉流动条形码化A和B以直接在组织切片中产生地址码的2D点阵。
图6A至图6C描绘了经由组织区条形码化的超大可作图区域hsrChSTseq。(图6A)当前的装置能够对每个载玻片的一个样本进行作图。(图6B)提出了实现高样本通量的微流体装置设计。(图6C)用于条形码化每次运行的24个组织切片的大型微孔阵列。(图6C)设计用于交叉流动条形码化每次运行的>100个样本的“宏”流体芯片。
图7A和图7B描绘了MSD骨髓空间作图的示意描绘。具有混合谱系发育异常(MLD)的低度MDS(图7A)和具有过量母细胞(EB2)的高度MDS(图7B)组织切片,其中具有10μm像素的DBITseq网格的覆盖。放大的示例描绘了测序像素与细胞结构的预期关系,其中在图7A中有成红细胞岛,并且在图7B中有与脂肪细胞和发育异常的巨核细胞相关的母细胞。
图8描绘了使用具有50个通道、每个50μm宽的微流体装置,对E11小鼠胚胎进行hsrCUT&Tag的实验结果。左图显示了暴露于Tn5转座酶后,在空间条形码化和交联逆转后产生的片段的大小分布。大约10个碱基对的片段大小的周期性质与每10个碱基对执行一轮的DNA双螺旋结构相关。较长尺度的结构与组蛋白结构施加在基因组DNA上的结构一致。右图显示了在每个tixel中回收的独特片段的平均数量的分布。与包括scCUT&Tag的其他方法相比,1,000至10,000之间的片段的中值数量是有利的。10.2%的PCR重复率表明更深的测序可产生更高数量的每个细胞的片段。分布中的结构可与一个tixel内的多个细胞类型的存在相关。片段分布不包括基础结构,因此仅示出基因组DNA片段的长度。
图9描绘了实验结果,这些实验结果证明了由下调组蛋白修饰的变化驱动的tixel的无监督聚类。
图10描绘了染色质沉默评分(CSS)的热图。通过对最小(0)和最大组蛋白修饰计数进行作图并将其作图为范围(-2,2)来计算评分。每行表示无监督聚类(参见图9)。行的排序试图确保对角化。左图示出了代表每个聚类的下调的标记物基因(log倍数变化<-1;很少K27me3)。较亮的颜色表明在H3K27me3位点有更多的组蛋白修饰。每个像素颜色表明在该聚类中的该基因上发现的H3K27me3修饰的数量。右图示出了上调的标记物基因(log倍数变化>1;许多K27me3)。
图11描绘了聚类1的空间图,包括标记物基因Foxa2。在右图中,x轴示出了基因组坐标,并且y轴示出了聚类和基因坐标之间K27me3位点的相对数量。在中间图左下方的蓝色聚类显示很少K27me3位点,因此Foxa2的表达在那些细胞中应该上调。
图12描绘了使用基因本体分析对聚类1的标记物基因的生物学功能的研究。GeneRatio度量聚类中标记物基因和参考数据库中该本体的基因特征之间的重叠。大小(计数)表明在该本体中发现的标记物基因的数量。颜色度量重叠的统计显著性。由于聚类是由标记物基因驱动的(由K27me3频率鉴定),因此与生物途径的高度统计显著(p值<0.001)重叠证实了由表观遗传标记物鉴定的聚类对应于生物官能团。
图13描绘了聚类2的空间图,包括标记物基因Gata4。
图14描绘了使用基因本体分析对聚类2的标记物基因的生物学功能的研究。
图15描绘了聚类3的空间图,包括标记物基因Pou3f3。
图16描绘了使用基因本体分析对聚类3的标记物基因的生物学功能的研究。
图17描绘了聚类4的空间图,包括标记物基因Syt3。
图18描绘了使用基因本体分析对聚类4的标记物基因的生物学功能的研究。
图19描绘了聚类5的空间图,包括标记物基因Otx2。
图20描绘了使用基因本体分析对聚类5的标记物基因的生物学功能的研究。
图21描绘了聚类6的空间图,包括标记物基因Nr2e1。
图22描绘了使用基因本体分析对聚类6的标记物基因的生物学功能的研究。
图23描绘了聚类7的空间图,包括标记物基因Ccdc106。
图24描绘了聚类8的空间图,包括标记物基因Hoxa9。
图25描绘了证明了Hox基因表达在成人和小鼠胚胎中的分布的图。
图26描绘了聚类9的空间图,包括标记物基因Six1。
图27描绘了使用基因本体分析对聚类9的标记物基因的生物学功能的研究。
图28描绘了聚类10的空间图,包括标记物基因Spats2l。
图29描绘了聚类11的空间图,包括标记物基因Hoxc4。
图30描绘了使用基因本体分析对聚类11的标记物基因的生物学功能的研究。
图31描绘了聚类12的空间图,包括标记物基因Tbx2。
图32描绘了使用基因本体分析对聚类12的标记物基因的生物学功能的研究。
图33描绘了使用具有50个通道、每个50μm宽的微流体装置,对E11小鼠胚胎进行hsrCUT&Tag的实验结果。TSS=转录起始位点。左图描绘了片段大小分布的相似结构,对应于10bp和更大的谱特征。右图描绘了密度散点图。X轴是独特片段数量的以10为底的对数。Y轴示出了呈线性尺度的转录起始位点富集,如通过H3K4me2结合位点的数量所测量的。高TSS表明该方案已经正确地鉴定了转录可及的位点。颜色对应于每个点周围的邻域中的点的密度。
图34描绘了由上调组蛋白修饰的变化驱动的tixel的无监督聚类。聚类不像H3K27me3下调的情况那样分化良好。
图35描绘了基于鉴定H3K4me2与聚类1(包括Hoxc4)的结合位点的基因活性分析。
图36描绘了使用基因本体分析对聚类1的标记物基因的生物学功能的研究。
图37描绘了基于鉴定H3K4me2与聚类2(包括Vmn1r45)的结合位点的基因活性分析。
图38描绘了使用基因本体分析对聚类2的标记物基因的生物学功能的研究。
图39描绘了基于鉴定H3K4me2与聚类3(包括Tmem119)的结合位点的基因活性分析。
图40描绘了使用基因本体分析对聚类3的标记物基因的生物学功能的研究。
图41描绘了基于鉴定H3K4me2与聚类4(包括Ttyh1)的结合位点的基因活性分析。
图42描绘了使用基因本体分析对聚类4的标记物基因的生物学功能的研究。
图43描绘了基于鉴定H3K4me2与聚类5(包括Basp1)的结合位点的基因活性分析。
图44描绘了使用基因本体分析对聚类5的标记物基因的生物学功能的研究。
图45描绘了H3K4me2的harCUT&Tag数据的分析以及与scRNAseq数据(MOCA)的整合。假定K4me2与高基因转录相关联,则应该能够将上调基因与转录组中高度差异表达的基因匹配。该UMAP中的每个点与前一个UMAP中的点对应,但是聚类是根据MOCA数据而不是K4me2数据来标记的。
图46描绘了来自前一个UMAP图的所选聚类的细胞类型的热图。
图47描绘了H3K4me2的hsrCUT&Tag数据的分析。当K4me2抗体结合基因位点时,可确定该位点是启动子还是增强子。因此,在测序后,可比较P&E频率。(E有多种情况,E1、E2、…)。X轴示出了基因坐标。Y轴示出了K4me2结合位点的数量。左和右示出了基因组中的两个不同位置。左:不同峰之间的相关性。对应于非编码区的峰可能位于K4me2与增强子或启动子结合的位置。右:峰和基因之间的关系。给定K4me2结合中的峰,找到对应基因起始位点。
图48描绘了含Ttyh1基因的聚类4的基序富集的分析。
图49描绘了当前染色质可及性测定的图。
图50描绘了随机条形码化使能大规模平行单细胞ATAC-seq的示意图。这种方法不提供空间信息。
图51描绘了用于高分辨率和确定性空间ATAC-seq的方法的图。
图52描绘了使用化学版本1的hsrATAC-seq实验工作流程的步骤1:将Tn5序列与第1条形码和UMI以及Tn5结合位点19bp嵌合端(ME)底链退火以组装Tn5转座体。
图53描绘了使用化学版本1的hsrATAC-seq实验工作流程的步骤2:沿第1方向流动并使用条形码化Tn5转座体进行标签化。在该步骤后有3种不同的产物。
图54描绘了使用化学版本1的hsrATAC-seq实验工作流程的步骤3至5。步骤3:洗涤并沿第2方向流动,并使用第2条形码进行连接。步骤4:细胞裂解和文库扩增。步骤5:最终的库结构。
图55描绘了包括片段大小分布和条形码回收的测序结果。
图56描绘了使用化学版本2的hsrATAC-seq实验工作流程的步骤1:将Tn5序列与第1接头和Tn5结合位点19bp嵌合端(ME)底链退火以组装Tn5转座体。
图57描绘了使用化学版本2的hsrATAC-seq实验工作流程的步骤2:沿第1方向流动并使用Tn5转座体进行标签化。
图58描绘了使用化学版本2的hsrATAC-seq实验工作流程的步骤3至6。步骤3:洗涤并使用第1个条形码(BC1_1-BC1_50)进行连接。步骤4:洗涤并使用第2个条形码(BC2_1-BC2_50)进行连接。步骤5:细胞裂解和文库扩增。步骤6:最终的库结构。
图59描绘了包括片段大小分布和条形码回收以及TSS富集的测序结果。
图60描绘了使用hsrATAC-seq实验工作流程(使用化学版本2)的独特片段序列。
图61描绘了使用hsrATAC-seq实验工作流程(使用化学版本2)的UMAP聚类。
图62描绘了使用hsrATAC-seq实验工作流程(使用化学版本2)的基因活性图。
图63描绘了使用包括步骤0的化学版本2.1的hsrATAC-seq实验工作流程的测序结果,包括片段大小分布和条形码回收以及TSS富集:透化15分钟;并包括在步骤1中使用2×Tn5酶。
图64描绘了使用hsrATAC-seq实验工作流程(使用化学版本2.1)的独特片段序列。
图65描绘了使用hsrATAC-seq实验工作流程(使用化学版本2.1)的UMAP聚类。
图66描绘了使用hsrATAC-seq实验工作流程(使用化学版本2.1)的基因活性图。
图67描绘了使用化学版本2.1在玻璃载玻片上的NIH-3T3细胞上进行的hsrATAC-seq实验工作流程的测序结果,包括片段大小分布和TSS富集
图68描绘了使用4X(第一行)和2X(第二行)Tn5酶在E11小鼠胚胎上的hsrATAC-seq的示例性信号轨迹。最后一行来自于在玻璃载玻片上的NIH-3T3细胞上使用1X Tn5酶的hsrATAC-seq。图69描绘了使用化学版本2.2在小鼠脑区域8上进行在hsrATAC-Seq实验工作流程的测序结果,包括片段大小分布和TSS富集,其中标签化时间为30分钟。
图70描绘了使用化学版本2.2在ME11细胞上进行的hsrATAC-seq实验工作流程的测序结果,包括片段大小分布和TSS富集,其中标签化时间为30分钟。
图71A至图71空间-CUT&Tag:设计和验证。图71A描绘了示意性工作流程。在组织切片中顺序进行一抗结合、二抗结合和pA-Tn5转座。然后,将两组DNA条形码(A1-A50,B1-B50)原位连接。在对组织样本进行成像后,通过逆转交联释放DNA片段。在聚合酶链反应(PCR)期间构建文库,然后通过下一代测序(NGS)进行测序。图71B描绘了本工作中的空间方法和其他非空间染色质分析方法之间,对于不同组蛋白标记和不同微流体通道宽度,独特片段数量的比较。图71C描绘了本工作中的空间方法和其他非空间染色质分析方法之间,对于不同组蛋白标记和不同微流体通道宽度,峰中读段比例(FRiP)的比较。图71D描绘了本工作中的空间方法和其他非空间染色质分析方法之间,对于不同组蛋白标记和不同微流体通道宽度,线粒体读段比例的比较。图71E描绘了来自E11小鼠胚胎的相邻组织切片的H&E图像和具有50μm像素尺寸的空间表观基因组作图的目标区域。图71F描绘了无监督聚类分析和每个聚类对于不同组蛋白修饰(50μm像素大小)的空间分布。图71G描绘了对于每种组蛋白修饰(50μm像素大小)的无监督聚类分析的UMAP包埋。聚类的标识和聚类的颜色与(图71F)一致。图71H描绘了E11.5小鼠胚胎数据集的不同细胞类型的ENCODE bulk ChIP-seq数据在空间-CUT&Tag包埋上的LSI投影。
图72描绘了空间-CUT&Tag的化学工作流程。用甲醛轻轻固定标准胺化玻璃载玻片上的组织切片。然后,添加结合靶组蛋白修饰或染色质相互作用蛋白的一抗,随后添加结合以增强pA-Tn5转座体的系连的二抗。然后通过添加Mg++并在37℃下温育样本来活化pA-Tn5转座体。然后将含有连接接头1的衔接子在抗体识别位点插入到切割的基因组DNA中。然后,通过微通道引导的流动递送引入一组DNA条形码A溶液以进行原位连接反应,从而用于添加独特的空间条形码Ai(i=1-50)和连接接头2。然后,使用与第一流动条形码步骤中的微流体通道垂直的另一组微流体通道引入第二组条形码Bj(j=1-50),随后在交叉处连接,从而产生组织像素的嵌合体,每个含有条形码Ai和Bj(i=1-50,j=1-50)的独特组合。在通过逆转交联收集DNA片段后,在PCR扩增期间完成文库构建。
图73A和图73B描绘了证明DNA片段的大小分布的数据。图73A描绘了DNA片段的生物分析仪数据。图73B描绘了片段长度的分布。
图74A和图74B描绘了证明通过游离Tn5评价标签化程度的数据。图74A描绘了不同方法在50μm像素大小的E11小鼠胚胎的空间-CUT&Tag H3K27me3峰周围的信号富集。将从空间-CUT&Tag调用的峰分为两部分:与ChIP-seq峰重叠的峰和与ChIP-seq峰不重叠的峰。图74B描绘了通过游离Tn5确定标签化程度的定量分析。结果示出,约11.5%的不与ChIP-seq峰重叠的峰与ATAC-seq峰重叠,这可能对应于与所用抗体无关的Tn5插入事件。
图75A至图75I描绘了证明空间-CUT&Tag的再现性的数据。图75A至图75C描绘了每种组蛋白标记的重复之间片段的相关性。H3K27me3的重复2来自bulk实验。图75D至图75F描绘了用于评估可复制性的MAstyle图(x轴;平均读段数量;重复之间的y轴倍数变化)。H3K27me3的重复2来自bulk实验。图75G描绘了来自两个不同的空间-CUT&Tag实验的H3K4me3修饰的无监督聚类分析和每个聚类的空间分布。图75H描绘了来自两个不同的空间-CUT&Tag实验的H3K27ac修饰的无监督聚类分析和每个聚类的空间分布。图75I描绘了维恩图,其示出了来自两个不同的空间-CUT&Tag实验的峰的重叠。
图76A和图76B描绘了证明用空间-CUT&Tag数据调用的峰的基准的数据。图76A描绘了维恩图,其示出了从空间-CUT&Tag和ENCODE大量ChIP-seq调用的峰的重叠。图76B描绘了从bulk ChIP-seq数据集调用的峰周围的来自肝脏描绘的ChIP-seq和空间-CUT&Tag信号的宏基因热图。
图77A和图77B描绘了证明E11小鼠胚胎(50μm像素大小)的空间表观基因组作图中的独特片段计数的数据。图77A描绘了空间热图,其示出了针对三种不同的组蛋白标记(H3K27me3、H3K4me3和H3K27ac)分析的每像素的独特片段计数的空间分布。图77B描绘了对用每像素的独特片段数量来阴影化的每种组蛋白修饰的无监督聚类分析的UMAP包埋。
图78A至图78I描绘了证明E11小鼠胚胎的空间表观基因组作图和整合分析的数据。图78A描绘了对于不同聚类中的所选标记物基因,通过H3K27me3修饰进行基因沉默的基因组浏览器轨迹(左)和空间作图(右)。图78B描绘了对于不同聚类中的所选标记物基因,通过H3K4me3修饰进行基因活化的基因组浏览器轨迹(左)和空间作图(右)。图78C描绘了H3K27ac分析中预测的Ascl1(chr10:87,463,659-87,513,660;mm10)(左)和Kcnq3(chr15:66,231,223-66,331,224;mm10)(右)的增强子。每个轨迹的聚类对应于图71F。在主要图之间示出了通过体内报告子测定验证的增强子。图78D和图78F描绘了来自E11.5小鼠胚胎的scRNA-seq(Cao等人,2019年,Nature,第566卷:第496-502页)和空间-CUT&Tag数据的整合。组合数据的无监督聚类通过不同细胞类型着色。图78E和图78G描绘了通过从scRNA-seq到空间-CUT&Tag的标记转移鉴定的所选细胞类型的空间作图。图78H描绘了scRNA-seq中所有鉴定的细胞类型的列表。图78I描绘了放射状胶质细胞的精确聚类使得能够鉴定亚群。比例15尺,1mm。
图79A和图79B描绘了证明E11小鼠胚胎(50μm像素大小)的H3K27me3修饰的空间分析的数据。图79A描绘了对于不同聚类中所选标记物基因,通过H3K27me3修饰进行基因沉默的空间作图(参见图71F)。图79B描绘了在所选聚类(C1和C8)中差异沉默基因的GO富集分析。
图80A和图80B描绘了证明在具有50μm像素大小的E11小鼠胚胎中H3K4me3修饰的空间分析的数据。图80A描绘了对于不同聚类中所选标记物基因,通过H3K4me3修饰进行基因活化的空间作图(参见图71F)。图80B描绘了在所选聚类(C2、C3和C6)中差异活化基因的GO富集分析。
图81A和图81B描绘了证明在具有50μm像素大小的E11小鼠胚胎中H3K27ac修饰的空间分析的数据。图81A描绘了对于不同聚类中所选标记物基因,通过H3K27ac修饰进行基因活化的空间作图(参见图71F)。图81B描绘了在所选聚类(C1、C2和C4)中差异活化基因的GO富集分析。
图82A和图82B描绘了证明E11小鼠胚胎中H3K4me3修饰的基序富集的数据。图82A描绘了对在所选聚类(C2-肝脏,C4脊髓)中鉴定的标记物峰的基序富集分析。图82B描绘了从CIS-BP数据库中检索到的转录因子(TF)基序评分和基序标志表示的空间作图(Stahl等人,2016年,Science,第353卷:第78-82页)。
图83A和图83B描绘了证明E11小鼠胚胎中H3K27ac修饰的基序富集的数据。图83A描绘了对在所选聚类(C4为肝脏,C2为脊髓)中鉴定的标记物峰的基序富集分析。图83B描绘了从CIS-BP数据库中检索到的TF基序评分和基序标志表示的空间作图(Stahl等人,2016年,Science,第353卷:第78-82页)。
图84A至图84D描绘了证明scRNA-seq、DBiT-seq和空间-CUT&Tag的整合分析的数据。图84A描绘了通过从scRNA-seq到空间-CUT&Tag(H3K4me3,50μm)的标记转移鉴定的所选细胞类型的空间作图。图84B描绘了软骨细胞和成骨细胞的精确聚类使得能够鉴定亚群,并且与发育中的牙齿相关的基因(例如Barx1)在亚聚类2中具有更高的表达。图84C描绘了来自E11小鼠脑的DBiT-seq(Bartosovic等人,2021年,Nature Biotechnology)和空间-CUT&Tag数据(H3K4me3,50μm)的整合。聚类的标识与图71F一致。图84D描绘了来自E11小鼠脑的DBiT-seq(Bartosovic等人,2021年,Nature Biotechnology)和空间-CUT&Tag数据(H3K27ac,50μm)的整合。聚类的标识与图71F一致。比例尺,1mm。
图85A至图85D描绘了证明发育中的脑中的伪时间空间轨迹的数据。图85A描绘了来自相邻组织切片的H&E图像。图85B描绘了在空间中绘制的从放射状胶质细胞、有丝分裂后早熟神经元到兴奋性神经元的发育过程的伪时间重建。图85C描绘了基于H3K4me3的所选基因活性沿图(图85B)所示的伪时间的动力学。图85D描绘了从放射状胶质细胞、有丝分裂后早熟神经元到兴奋性神经元的基因评分变化的伪时间热图。比例尺,1mm。
图86A至图86I描绘了证明免疫荧光染色的小鼠嗅球组织切片在细胞水平上的空间表观基因组作图的数据。图86A描绘了来自相邻组织切片的小鼠嗅球的H&E图像和用于空间表观基因组作图的目标区域。图86B描绘了在用于空间表观基因组作图的相同组织切片上进行的在目标区域中用DAPI进行的核染色的荧光图像。图86C描绘了通过H3K27me3修饰(20μm像素大小)的小鼠嗅球的每个聚类的无监督聚类分析和空间分布。图86D描绘了通过H3K27me3修饰对所选标记物基因进行基因沉默的空间作图(左)。对应基因的原位杂交(右)和表达图像(中)来自Allen研究所数据库。图86E描绘了含有单核(DAPI)的所选像素的荧光图像。图86F描绘了所选像素的染色质沉默评分的热图。图86G描绘了具有非单核(>1个核)和单核的像素中独特片段数量的比较。图86H描绘了含有单核的所选像素的无监督聚类分析的UMAP。图86I描绘了通过所选基因的染色质沉默评分着色的UMAP。
图87A至图87K描绘了证明具有20μm像素大小的E11小鼠胚胎的空间表观基因组作图的数据。图87A描绘了来自相邻组织切片的E11小鼠胚胎的H&E图像和用于空间表观基因组作图的目标区域。图87B描绘了无监督聚类分析和每个组蛋白标记的E11小鼠胚胎的每个聚类的空间分布。图87C描绘了对于每种组蛋白修饰的无监督聚类分析的UMAP包埋。聚类的标识和聚类的颜色与(图87B)一致。图87D描绘了E11.5小鼠胚胎数据集的不同器官的ENCODE bulk ChIP-seq数据在空间-CUT&Tag包埋中的LSI投影。图87E描绘了对于E11小鼠胚胎数据的不同聚类中的所选标记物基因,通过H3K27me3修饰进行基因沉默的基因组浏览器轨迹(左)和空间作图(右)。图87F描绘了UMAP空间中活性组蛋白修饰(H3K4me3和H3K27ac)的空间-CUT&Tag数据的共包埋(左)和不同组蛋白修饰的每个聚类的空间分布(右)。图87G和图87I描绘了来自E11.5小鼠胚胎19的scRNA-seq和空间-CUT&Tag数据的整合。组合数据的无监督聚类通过不同细胞类型着色。图87H和图87J描绘了通过从scRNA-seq到空间-CUT&Tag的标记转移鉴定的所选细胞类型的空间作图。图87K描绘了scRNA-seq中所有鉴定的细胞类型的列表。比例尺,500μm。
图88A和图88B描绘了证明在具有20μm像素大小的E11小鼠胚胎中H3K27me3修饰的空间分析的数据。图88A描绘了对于不同聚类中所选标记物基因,通过H3K27me3修饰进行基因沉默的空间作图。图88B描绘了在所选聚类(C1、C2和C4)中差异沉默基因的GO富集分析。
图89A至图89J描绘了证明P21小鼠脑在细胞水平的空间表观基因组作图和整合分析的数据。图89A描绘了在执行空间-CUT&Tag之前成像的小鼠脑组织切片。空间表观基因组作图的目标区域用虚线框表示。图89B和图89C描绘了无监督聚类分析和每个组蛋白标记(20μm像素尺寸)的小鼠脑的每个聚类的空间分布。图89D描绘了对于不同聚类中所选标记物基因,通过H3K4me3修饰进行基因活化的空间作图。图89E描绘了对于不同聚类中所选标记物基因,通过H3K27me3修饰进行基因沉默的空间作图。图89F描绘了能够鉴定具有不同空间分布和标记物基因的神经元中的亚群的精确聚类过程。图89G描绘了来自小鼠脑的scCUT&Tag(Bartosovic等人,2021年,Nature Biotechnology)和空间-CUT&Tag的整合。图89H描绘了来自小鼠脑的scRNA-seq(Zeisel等人,2018年,Cell,第174卷:第999-1014页,e1022)和空间-CUT&Tag数据的整合。图89I描绘了scRNA-seq中所有鉴定的细胞类型的列表。图89J描绘了通过从scRNA-seq到空间-CUT&Tag的标记转移鉴定的所选细胞类型的空间作图。MGL1:小神经胶质细胞,未活化;MSN2:D2中型多棘神经元,纹状体;MOL1:成熟少突胶质细胞;ACTE2:端脑星形胶质细胞,原生质的;TEGLU3:兴奋性神经元、大脑皮层;TEGLU8:兴奋性神经元、大脑皮层。比例尺,500μm。
图90A至图90N描绘了证明在具有20μm像素大小的小鼠脑中H3K4me3修饰的空间分析的数据。图90A、图90C、图90E、图90G、图90I、图90K和图90M描绘了通过H3K4me3修饰对不同聚类中所选标记物基因的基因活化的空间作图。图90B、图90D、图90F、图90H、图90J、图90L和图90N描绘了所选标记物基因在不同聚类中的基因表达,沿细胞类型分类学示出。每行表示一个标记物基因,并且列表示细胞类型分类学。来自小鼠CNS单细胞转录组学图谱(Burgess等人,2019年,Nat Rev Genet,第20卷:第317页)和来自小鼠脑组织的数据。
图91A至图91J描绘了证明在具有20μm像素大小的小鼠脑中H3K27me3修饰的空间分析的数据。图91A、图91C、图91E、图91G和图91I描绘了对于不同聚类中所选标记物基因,通过H3K27me3修饰进行基因沉默的空间作图。图91B、图91D、图91F、图91H和图91J描绘了所选标记物基因在不同聚类中的基因表达,沿细胞类型分类学示出。每行表示一个标记物基因,并且列表示细胞类型分类学。来自小鼠CNS单细胞转录组学图谱(Burgess等人,2019年,Nat Rev Genet,第20卷:第317页)和来自小鼠脑组织的数据。
图92描绘了小鼠脑中潜在的H3K4me3/H3K27me3二价的解卷积。从每种细胞类型中调用的H3K4me3峰的基因座处H3K4me3(左)和H3K27me3(右)占据的宏基因热图。每个x轴示出标记物峰任一侧的10kb。热图示出了跨标记物区域的信号。
图93描绘了高空间分辨率多组学分析的化学工作流程。用甲醛轻轻固定标准胺化玻璃载玻片上的组织切片。然后,首先将抗体-DNA标签(ADT)的混合物添加到组织表面以捕获靶膜蛋白。在透化后,一抗结合靶组蛋白修饰或染色质相互作用蛋白,添加细胞内蛋白的ADT和代谢物的ADT,然后添加二抗结合以增强pA-Tn5转座体的系连。然后通过添加Mg++并在37℃下温育,活化与甲基化敏感性限制酶连接的pA-Tn5转座体和Tn5蛋白质,并将含有连接接头1的衔接子插入抗体结合位点。然后,添加与连接接头1组合的RT混合物用于mRNA捕获、逆转录和模板转换。然后,引入一组DNA条形码A溶液以进行原位连接反应,从而用于添加独特的空间条形码Ai(i=1-50)和连接接头2。然后,垂直于第一流动条形码的微流体通道引入第二组条形码Bj(j=1-50),在交叉处连接,从而产生组织像素的嵌合体,每个含有条形码Ai和Bj(i=1-50,j=1-50)的独特组合。在通过逆转交联收集DNA片段和cDNA后,进行PCR扩增和文库构建。
图94a至图94i描绘了空间-ATAC-seq:设计、工作流程和数据质量。图94a描绘了示意性工作流程。在组织切片中进行Tn5转座,随后原位连接两组DNA条形码(A1-A50,B1-B50)。图94b描绘了使用荧光DNA探针的原位转座和连接的验证。Tn5转座在用DAPI染色(蓝色)的玻璃载玻片上的3T3细胞中进行。然后,将FITC标记的条形码A连接到转座酶可及基因组DNA上的衔接子上。比例尺,50μm。图94c描绘了集合空间染色质可及性分析,概括了E13小鼠胚胎肝脏中ATAC-seq的公开图谱。图94d描绘了本工作的空间方法和10x scATAC-seq之间,对于不同方案和微流体通道宽度,独特片段数量的比较。图94e描绘了本工作的空间方法和10x scATAC-seq之间,对于不同方案和微流体通道宽度,TSS片段比例的比较。图94f描绘了本工作的空间方法和10x scATAC-seq之间,对于不同方案和微流体通道宽度,线粒体片段比例的比较。图94g描绘了本工作的空间方法和10xscATAC-seq之间,对于不同方案和微流体通道宽度,ATAC-seq片段的插入物大小分布的比较。图94h描绘了在本工作的空间方法和10x scATAC-seq之间,对于不同方案和微流体通道宽度,ATAC-seq读段围绕TSS的富集的比较。着色与(图94g)一致图94h描绘了散点图,其示出了对于人扁桃体,TSS富集评分与每个细胞的独特核片段。
图95描绘了空间-ATAC-seq的化学工作流程的图。用甲醛轻轻固定标准胺化玻璃载玻片上的组织切片。然后,在37℃下进行Tn5转座,将含有连接接头1的衔接子在转座酶可及位点插入到切割的基因组DNA中。然后,通过微通道引导的流动递送引入一组DNA条形码A溶液以进行原位连接反应,从而用于添加独特的空间条形码Ai(i=1-50)和连接接头2。然后,使用与第一流动条形码步骤中的微流体通道垂直的另一组微流体通道引入第二组条形码Bj(j=1-50),随后在交叉处连接,从而产生组织像素的嵌合体,每个含有条形码Ai和Bj(i=1-50,j=1-50)的独特组合。在通过逆转交联收集DNA片段后,在PCR扩增期间完成文库构建。
图96a和图96b描绘了空间ATAC-seq数据集的质量控制度量。图96a描绘了散点图,其示出了对于不同方案和微流体通道宽度,TSS富集评分与每个细胞的独特核片段。图96b描绘E13小鼠胚胎上生物重复之间的再现性。皮尔逊相关系数r=0.95。
图97a至图97i描绘了E13小鼠胚胎的空间染色质可及性图。图97a描绘了基于所有组织像素(50μm像素尺寸)的染色质可及性进行的无偏聚类分析。用组织图像覆盖聚类揭示了空间染色质可及性聚类精确地匹配解剖区域。图97b描绘了用于染色质可及性的无监督聚类分析的UMAP包埋。聚类的标识和聚类的颜色与(图97a)一致。图97c描绘了不同聚类中所选标记物基因的基因评分的空间作图,并且所选基因的染色质可及性是高度组织特异性的。图97d描绘了来自E13.5小鼠胚胎的scRNA-seq(Cao等人,2019年,Nature,第566卷:第496-502页)和空间ATAC-seq数据的整合。组合数据的无监督聚类通过不同细胞类型着色。图97e描绘了基于H&E图像的主要组织区域的解剖注释。图97f描绘了通过从scRNA-seq到空间ATAC-seq数据的标记转移鉴定的所选细胞类型的空间作图。图97g描绘了在空间中绘制的从放射状胶质细胞、有丝分裂后早熟神经元到兴奋性神经元的发育过程的伪时间重建。图97h描绘了所选基因评分沿(图97g)所示的伪时间的动力学。图97h描绘了从放射状胶质细胞、有丝分裂后早熟神经元到兴奋性神经元的TF基序变化的伪时间热图。
图98a至图98g描绘了E13小鼠胚胎的空间染色质可及性作图的进一步分析、ENCODE的验证以及在肝脏中的亚聚类。图98a描绘了来自相邻组织切片的H&E图像和用于空间染色质可及性作图的目标区域(50μm像素大小)。图98b描绘了无监督聚类分析和每个聚类的空间分布。图98c描绘了空间ATAC-seq的无监督聚类分析的UMAP包埋。聚类的标识和聚类的颜色与(图98b)一致。图98d描绘了来自E13.5小鼠胚胎数据集的不同细胞类型的ENCODE bulk ATAC-seq数据在空间ATAC-seq包埋上的LSI投影。图98e和图98f描绘了不同聚类中的所选标记物基因的基因组浏览器轨迹(图98e)和基因评分(图98f)的空间作图。图98g描绘了E13小鼠胚胎中胎儿肝脏的精确聚类使得能够鉴定亚群,并且一些与造血相关的基因(例如Hbb-y、Slc4a1、Sptb)在亚聚类1中具有更高的表达水平。
图99a至图99j描绘了E13小鼠胚胎中基因评分的空间作图和与ISH参考数据的比较。图88a、图88c、图88e、图88g和图88i描绘了E13小鼠胚胎中所选基因评分的空间作图。图99b、图99d、图99f、图99h和图99j描绘了在来自Allen发育小鼠脑图谱的E13.5小鼠胚胎处所选基因的原位杂交。
图100描绘了E13小鼠胚胎的空间ATAC-seq数据的GO富集分析。在所选聚类(C1、C5和C6)中差异活化基因的GO富集分析。
图101a和图101b描绘了沿脊柱的前后轴的基因评分。图101a描绘了通过空间ATAC-seq分析的E13小鼠胚胎的脊柱区。图101b描绘了发现形成沿前后轴的表达梯度的所选基因。
图102a至图102c描绘了E13小鼠胚胎数据的基序富集分析。图102a描绘了用偏差匹配差示测试鉴定的所有聚类的空间ATAC-seq标记物峰的热图。图102b描绘了每个聚类的标记物峰内基序超几何富集-调节的P值的热图。图102c描绘了所选TF基序偏差评分的空间作图。
图103a至图103d描绘了E13小鼠胚胎和兴奋性神经元亚聚类的空间ATAC-seq和scRNA-seq的综合分析。图103a描绘了通过从scRNA-seq到空间ATAC-seq的标记转移鉴定的所选细胞类型的空间作图。图103b至图103d描绘了精确聚类过程使得能够鉴定具有不同空间分布(图103b)和标记物基因(图103c、图103d)的兴奋性神经元中的亚群。
图104a至图104p描绘了E11小鼠胚胎的空间染色质可及性作图和时空分析。图104a描绘了无监督聚类分析和每个聚类的空间分布。与组织图像的重叠揭示了空间染色质可及性聚类精确地匹配解剖区域图104b描绘了用于染色质可及性的无监督聚类分析的UMAP包埋。聚类的标识和聚类的颜色与(图104a)一致。图104c描绘了不同聚类中所选标记物基因的基因评分的空间作图,并且所选基因的染色质可及性是高度组织特异性的。图104d描绘了来自E11.5小鼠胚胎的scRNA-seq(Cao等人,2019年,Nature,第566卷:第496-502页)和空间ATAC-seq数据的整合。组合数据的无监督聚类通过不同细胞类型着色。图104e描绘了基于H&E图像的主要组织区域的解剖注释。图104f描绘了通过从scRNA-seq到空间ATAC-seq数据的标记转移鉴定的所选细胞类型的空间作图。图104g描绘了在空间中绘制的从放射状胶质细胞到兴奋性神经元的发育过程的伪时间重建。图104h描绘Notch1的基因评分的空间作图。图104i描绘了所选基因评分沿(图104g)所示的伪时间的动力学。图104j描绘了从放射状胶质细胞到兴奋性神经元的TF基序变化的伪时间热图。图104k描绘了从E11到E13小鼠胚胎的胎儿肝脏中TF基序变化的伪时间热图。图104l描绘了E13小鼠胚胎与E11小鼠胚胎相比,胎儿肝脏的差示峰分析。图104m描绘了E13小鼠胚胎与E11小鼠胚胎相比,胎儿肝脏中更可及的峰中富集基序的排序。图104n描绘了从E11到E13小鼠胚胎的兴奋性神经元中TF基序变化的伪时间热图。图104o描绘了E13小鼠胚胎与E11小鼠胚胎相比,兴奋性神经元的差示峰分析。图104p描绘了E13小鼠胚胎与E11小鼠胚胎相比,兴奋性神经元中更可及的峰中富集基序的排序。
图105a至图105f描绘了E11小鼠胚胎的空间染色质可及性作图的进一步分析和ENCODE验证参考数据。图105a描绘了来自相邻组织切片的H&E图像和用于空间染色质可及性作图的目标区域(50μm像素大小)。图105b描绘了无监督聚类分析和每个聚类的空间分布。图105c描绘了空间ATAC-seq的无监督聚类分析的UMAP包埋。聚类的标识和聚类的颜色与(图105b)一致。图105d描绘了来自E11.5小鼠胚胎数据集的不同细胞类型的ENCODE bulkATAC-seq数据在空间ATAC-seq包埋上的LSI投影。图105e和图105f描绘了不同聚类中的所选标记物基因的基因组浏览器轨迹(图105e)和基因评分(图105f)的空间作图。
图106描绘了E11小鼠胚胎的空间ATAC-seq数据的GO富集分析。在所选聚类(C1、C3和C4)中差异活化基因的GO富集分析。
图107a至图107b描绘了E11小鼠胚胎的基序富集分析。图107a描绘了用偏差匹配差示测试鉴定的所有聚类的空间ATAC-seq标记物峰的热图。图107b描绘了所选TF基序偏差评分的空间作图。
图108描绘了E11小鼠胚胎的空间ATAC-seq和scRNA-seq的整合分析以及所选细胞类型的空间图谱可视化。通过从scRNA-seq到空间ATAC-seq的标记转移鉴定的所选细胞类型的空间作图。
图109a至图109i描绘了具有20μm像素大小的人扁桃体的空间染色质可及性作图。图109a描绘来自相邻组织切片的人扁桃体的H&E图像和用于空间染色质可及性作图的目标区域。图109b描绘了无监督聚类分析和每个聚类的空间分布。图109c描绘了主要扁桃体区域的解剖注释。图109d描绘了所选基因的基因评分的空间作图。图109e描绘了scRNA-seq数据(King等人,2021年,bioRxiv,2021.2003.2016.435578)和空间ATAC-seq数据的整合。组合数据的无监督聚类通过不同细胞类型着色。图109f描绘了通过从scRNA-seq到空间ATAC-seq数据的标记转移鉴定的所选细胞类型的空间作图。比例尺,500μm。图109g描绘了在空间中绘制的从幼稚B细胞到GC B细胞发育过程的伪时间重建。图109h描绘了所选基因评分沿(图109g)所示的伪时间的动力学。图109h描绘了从幼稚B细胞到GC B细胞的TF基序变化的伪时间热图。
图110a和图110b描绘了人扁桃体中的免疫细胞子集的单细胞作图。图110a描绘了扁桃体免疫scRNA-seq参考数据的UMAP(King等人,2021年,bioRxiv,2021.2003.2016.435578)。图110b描绘了比较所选免疫细胞类型之间的关键标记物基因表达的热图。
图111描绘了与人扁桃体中的蛋白质表达相比的空间染色质可及性基因评分图。免疫组织化学参考数据获自人蛋白质图谱(Uhlén等人,2015年,Science,第347卷:第1260419页)。
图112描绘了人扁桃体的空间ATAC-seq数据的基序富集分析。KLF家族转录因子的基序偏离评分的空间作图。
图113描绘了具有20μm像素大小的人扁桃体的空间染色质可及性作图和特定标记物基因的可视化。所选基因的基因评分的空间作图。
具体实施方式
本发明整体涉及用于直接在原始组织样本中在单细胞水平上的空间分辨表观基因组分析的系统和方法。目前描述的系统和方法代表了表观基因组领域的重大飞跃和潜在的破土技术,以实现在发育生物学、癌症研究、免疫学、心血管疾病研究、组织病理学和治疗发现中具有深远影响的新生物医学研究领域。
本公开提供了一种用于空间表观基因组-高分辨率和确定性空间ATAC-seq(hsrATAC-seq)的基本新技术。具有平行通道(例如,20μm或50μm宽)的微流体芯片直接抵靠载玻片上的组织样本放置,并且在一些实施方案中,使用特定的夹持力夹持到目标区域。然后,在某些实施方案中,添加高活性Tn5转座酶和蛋白质A的装配有用作连接接头的DNA寡核苷酸序列的融合蛋白。转座酶的活化启动了标签化,其中转座酶切割表观基因组标记物任一侧的DNA分子,并使DNA连接接头序列与切割的DNA退火。标签化后,第一组独特DNA条形码(A1-Ai,其中i是1至1001之间的整数)沿第一方向(A)流过微流体芯片的通道,并将第一条形码组连接到连接接头,随后洗涤,移除芯片,应用第二微流体芯片,其中第二微流体芯片被放置成使得流动方向垂直于第一芯片的流动方向(A),并使第二组独特DNA条形码(B1-Bj,其中j是1至1001之间的整数)沿垂直于第一方向(A)的第二方向(B)流过微流体芯片的通道,并将第二组条形码连接到第一条形码组。然后,裂解组织,检索空间条形码化DNA分子,合并,并通过PCR扩增,以制备用于NGS测序的文库。
在一些实施方案中,将转座酶连接到甲基化敏感性限制酶。在一些实施方案中,在添加二抗之前添加对表观基因组标记物具有特异性的一抗,并添加转座酶和接头序列。在此类实施方案中,本发明的方法可将切割和标签化限于特定的目标区域,包括具有特定表观基因组标记物的区域,从而允许产生空间表观基因组图。
本文提供的数据已经证明了小鼠胚胎中转录组和表观基因组标记物的高空间分辨率作图。通过检测组蛋白甲基化的增加或减少区域,如实地检测到染色质沉默或基因活化的增加或减少区域。空间表观基因组图还鉴定胚胎发育期间基因表达的差异模式。hsrATAC-seq不需要任何DNA点微阵列或解码的DNA条形码化珠阵列,但仅需要一组试剂。它对现有的固定组织载片起作用,不需要其他方法所需的新制备的组织切片(Rodriques etal.,2019,Science,363:1463-1467;Stahl et al.,2016,Science,353:78-82)。其是高度通用的,从而允许直接在组织载玻片上组合用于多组学测量的不同试剂。因此,hsrATAC-seq是潜在的平台技术,其可容易地被来自广泛的生物学和生物医学研究领域的研究者采用。
定义
除非另有定义,否则本文所用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的相同的含义。尽管与本文所述的那些类似或等同的任何方法和材料可用于本发明的实践或测试,但描述的是优选的方法和材料。
如本文所用,以下术语中的每一者具有与本章节中的术语相关联的含义。
冠词“一个”和“一种”在本文中用于指一个或多于一个(即,至少一个)冠词的语法对象。举例来说,“元素”是指一个元素或多于一个元素。
如本文所用,当提及可测量值诸如量、持续时间等时,“约”意指涵盖相对于指定值的±20%或±10%,更优选±5%,甚至更优选±1%,并且还更优选±0.1%的变化,因为此类变化适于进行所公开的方法。
当用于生物体、组织、细胞或其组分的上下文时,术语“异常”是指那些生物体、组织、细胞或其组分在至少一种可观察或可检测的特征(例如年龄、治疗、一天中的时间等)上不同于那些显示“正常”(预期)相应特征的生物体、组织、细胞或其组分。对于一种细胞或组织类型正常或预期的特征对于不同的细胞或组织类型可能是异常的。
范围:在整个公开中,本发明的各个方面可以范围形式呈现。应当理解,范围格式的描述仅仅是为了方便和简洁起见,而不应被解释为对本方面的范围的非灵活限制。因此,对范围的描述应被认为已经具体公开了所有可能的子范围以及该范围内的单个数值。例如,对范围诸如1至6的描述应被认为具有具体描述的子范围(诸如1至3、1至4、1至5、2至4、2至6、3至6等),以及该范围内的单个数字,例如1、2、2.7、3、4、5、5.3和6。这与范围的宽度无关。
描述
在一些实施方案中,本发明提供了用于完整组织的高空间分辨率、无偏的表观基因组作图的新方法,其不需要复杂的成像,但是可利用高通量下一代测序(NGS)的能力。本发明涉及用于进行hsrATAC-seq的组合物和方法。
在一个实施方案中,该方法包括以下步骤:将具有平行通道(例如,20μm或50μm宽)的第一微流体芯片直接放置在待分析的组织样本载玻片上,使样本与装配有用作连接接头的DNA寡核苷酸序列的转座酶接触,使第一组独特DNA条形码(A1-Ai,其中i是1至1001之间的整数)沿第一方向(A)流过微流体芯片的通道,将第一条形码组连接到连接接头,洗涤,移除第一微流体芯片,应用第二微流体芯片,其中第二微流体芯片被放置成使得流动方向垂直于第一芯片的流动方向(A),使第二组独特DNA条形码(B1-Bj,其中j是1至1001之间的整数)沿垂直于第一方向(A)的第二方向(B)流过微流体芯片的通道,以及将第二组条形码连接到第一条形码组。在一些实施方案中,该方法还包括裂解细胞,检索空间条形码化DNA分子,并由空间条形码化DNA分子制备NGS测序文库。在一个实施方案中,该方法还包括在使样本与一抗接触之前透化的步骤。例如,在一个实施方案中,在样本与转座酶接触之前,用NP40-洋地黄皂苷缓冲液透化样本。在一个实施方案中,转座酶是高活性Tn5转座酶和蛋白质A的融合蛋白。
在一个实施方案中,该方法包括以下步骤:将具有平行通道(例如,20μm或50μm宽)的第一微流体芯片直接放置在待分析的组织样本载玻片上,使样本与一种或多种表观基因组标记物特异性抗体接触,使样本与二抗和装配有用作连接接头的DNA寡核苷酸序列的转座酶接触,使第一组独特DNA条形码(A1-Ai,其中i是1至1001之间的整数)沿第一方向(A)流过微流体芯片的通道,将第一条形码组连接到连接接头,洗涤,移除第一微流体芯片,应用第二微流体芯片,其中第二微流体芯片被放置成使得流动方向垂直于第一芯片的流动方向(A),使第二组独特DNA条形码(B1-Bj,其中j是1至1001之间的整数)沿垂直于第一方向(A)的第二方向(B)流过微流体芯片的通道,以及将第二组条形码连接到第一条形码组。在一些实施方案中,该方法还包括裂解细胞,检索空间条形码化DNA分子,并由空间条形码化DNA分子制备NGS测序文库。在一个实施方案中,该方法还包括在使样本与一抗接触之前透化的步骤。例如,在一个实施方案中,在样本与一抗接触之前,用NP40-洋地黄皂苷缓冲液透化样本。在一个实施方案中,转座酶是高活性Tn5转座酶和蛋白质A的融合蛋白。
在一个实施方案中,本发明的方法使用“切割和标记”方法或“标签化”将DNA连接衔接子或DNA条形码序列或它们的组合并入包含目标表观基因组标记的核酸分子上。如本文所用,术语“标签化”是指通过与包含转座子端序列的衔接子复合的包含转座酶的转座体复合物对DNA的修饰。标签化导致包含目标表观基因组标记的靶DNA分子的同时断裂,并将衔接子连接到两链双链片段的5'端。在除去转座酶的纯化步骤后,可将另外的序列(例如条形码)添加到适应的片段两端,例如通过PCR、连接或本领域技术人员已知的任何其他合适的方法。
本发明的方法可使用任何转座酶,该转座酶可接受转座酶端序列并将靶核酸片段化,从而连接转移端,但不连接非转移端。“转座体”至少由转座酶和转座酶识别位点组成。在一些此类系统中,称为“转座体”,转座酶可与能够催化转座反应的转座子识别位点形成功能性复合物。转座酶或整合酶可结合到转座酶识别位点,并且在有时称为“标签化”的过程中将转座酶识别位点插入到靶核酸中。在一些此类插入事件中,转座酶识别位点的一条链可被转移到靶核酸中。
一些实施方案可包括使用高活性Tn5转座酶和Tn5型转座酶识别位点(Goryshin和Reznikoff,J.Biol.Chem.,第273卷:第7367页,1998年),或MuA转座酶以及包含R1和R2端序列的Mu转座酶识别位点(Mizuuchi,K.,Cell,第35卷:第785页,1983年;Savilahti,H等人,EMBO J.,第14卷:第4893页,1995年)。与高活性Tn5转座酶(例如EZ-Tn5TM转座酶,EpicentreBiotechnologies,Madison,Wis.)形成复合物的示例性转座酶识别位点。
可用于本文提供的某些实施方案的转座系统的更多示例包括金黄色葡萄球菌Tn552(Colegio等人,J.Bacteriol.,第183卷:第2384-2388页,2001年;Kirby C等人,Mol.Microbiol.,第43卷:第173-186页,2002年)、Ty1(Devine&Boeke,Nucleic AcidsRes.,第22卷:第3765-3772页,1994年;以及国际公开WO 95/23875)、转座子Tn7(Craig,NL,Science,第271卷:第1512页,1996年;Craig,N L,综述于:Curr Top MicrobiolImmunol.,第204卷:第27-48页,1996年)、Tn/O和IS10(Kleckner N等人,Curr TopMicrobiol Immunol.,第204卷:第49-82页,1996年)、Mariner转座酶(Lampe D J等人,EMBOJ.,第15卷:第5470-5479页,1996年)、Tc1(Plasterk R H,Curr.TopicsMicrobiol.Immunol.,第204卷:第125-143卷,1996页)、P元素(Gloor,G B,MethodsMol.Biol.,第260卷:第97-114页,2004年)、Tn3(Ichikawa&Ohtsubo,J Biol.Chem.,第265卷:18829-18832页,1990年)、细菌插入序列(Ohtsubo&Sekine,Curr.Top.Microbiol.Immunol.,第204卷:第1-26页,1996年)、逆转录病毒(Brown等人,Proc Natl Acad Sci USA,第86卷:第2525-2529,1989年)和酵母的逆转录转座子(Boeke&Corces,Annu Rev Microbiol.第43卷:第403-434页,1989年)。更多的示例包括ISS、Tn10、Tn903、IS911和转座酶家族酶的工程化形式(Zhang等人,2009年,PLoS Genet.,第5卷:e1000689。Epub,2009年10月16日;Wilson C.等人,2007年,J.Microbiol.Methods,第71卷,第332-335页)。
在一个实施方案中,转座酶是系连于蛋白质A的高活性Tn5转座酶。
在一个实施方案中,将转座酶连接到甲基化敏感性限制酶。甲基化敏感性限制酶(MSRE)包括但不限于Aat II、Acc II、Aor13H I、Aor51H I、BspT104 I、BssH II、Cfr10I、Cla I、Cpo I、Eco52 I、Hae II、Hap II、Hha I、Mlu I、Nae I、Not I、Nru I、Nsb I、PmaC I、Psp1406 I、Pvu I、Sac II、Sal I、Sma I和SnaB I。
在一个实施方案中,在使第一条形码组流过流体微芯片之前,允许标签化反应进行至少10分钟、至少15分钟、至少20分钟、至少25分钟、至少30分钟或超过30分钟。
在一个实施方案中,用于标签化反应的转座体的浓度在1μL至20μL之间。例如,在一个实施方案中,装配8μl Tn5转座体,其包含2μl DNA寡核苷酸、4μl EZ-Tn5转座酶(1U/μl)和2μl甘油。在标签化反应之前,将Tn5转座体与Tagment DNA缓冲液、1X PBS、10%Tween-20、1%洋地黄皂苷混合至总量为200μl。在一个实施方案中,标签化使用至少15分钟、至少20分钟、至少25分钟、至少30分钟或多于30分钟的反应时间进行。在一个实施方案中,使用8μl Tn5转座体进行标签化,其中反应时间为30分钟。
表观基因组标记物鉴定
在一些实施方案中,本发明的方法包括条形码化生物样本中含有目标表观基因组标记物的核酸分子。在一些实施方案中,该方法包括使用特异性结合目标表观基因组标记物的一抗。抗体的非限制性示例包括完整抗体、Fab抗体片段、F(ab')2抗体片段、单特异性Fab2片段、双特异性Fab2片段、三特异性Fab3片段、单链可变片段(scFv)、双特异性双抗体、三特异性双抗体、scFv-Fc分子、纳米抗体和微型抗体。
在一个实施方案中,用于本发明的方法的一抗对表观基因组标记物具有特异性。可使用本发明的方法鉴定的示例性表观基因组标记物包括但不限于H2AK5ac、H2AK9ac、H2BK120ac、H2BK12ac、H2BK15ac、H2BK20ac、H2BK5ac、H2Bub、H3、H3ac、H3K14ac、H3K18ac、H3K23ac、H3K23me2、H3K27me1、H3K27me2、H3K36ac、H3K36me1、H3K36me2、H3K4ac、H3K56ac、H3K79me1、H3K79me3、H3K9acS10ph、H3K9me2、H3S10ph、H3T11ph、H4、H4ac、H4K12ac、H4K16ac、H4K5ac、H4K8ac、H4K91ac、H3F3A、H3K27me3、H3K36me3、H3K4me1、H3K79me2、H3K9me1、H3K9me2、H3K9me3、H4K20me1、H2AFZ、H3K27ac、H3K4me2、H3K4me3和H3K9ac。对表观基因组标记物具有特异性的示例性一抗包括但不限于:(登录号来自encodeproject.org)ENCAB841KJH、ENCAB000AOZ、ENCAB000APA、ENCAB000AOY、ENCAB000ARP、ENCAB000AQJ、ENCAB000ASI、ENCAB000AOS、ENCAB000AOR、ENCAB000APJ、ENCAB000API、ENCAB000ARU、ENCAB050QKP、ENCAB000AQK、ENCAB000AOT、ENCAB928LTI、ENCAB788ZME、ENCAB928HBB、ENCAB417DUO、ENCAB000AHF、ENCAB296TBH、ENCAB000APH、ENCAB000APG、ENCAB000ARW、ENCAB188IXL、ENCAB039IRN、ENCAB000AOK、ENCAB000AOL、ENCAB960XYH、ENCAB000ARX、ENCAB000ARY、ENCAB000ASZ、ENCAB602YNP、ENCAB205THQ、ENCAB375PDS、ENCAB931TIC、ENCAB961FBP、ENCAB750SJL、ENCAB453MST、ENCAB592AAE、ENCAB638MGM、ENCAB382YEO、ENCAB127FOW、ENCAB790SCK、ENCAB000ASH、ENCAB000ASJ、ENCAB121PMJ、ENCAB470FGK、ENCAB056ZFO、ENCAB000AOM、ENCAB000AOO、ENCAB000AON、ENCAB231VKB、ENCAB458UGW、ENCAB502YEA、ENCAB000ANJ、ENCAB829JCF、ENCAB002YEX、ENCAB093UKQ、ENCAB376DXS、ENCAB783AQT、ENCAB062SHF、ENCAB172ZWF、ENCAB638TXJ、ENCAB113TJV、ENCAB630GBO、ENCAB000AQQ、ENCAB529WLG、ENCAB150MLG、ENCAB255ALZ、ENCAB862RIQ、ENCAB327ADQ、ENCAB000AQT、ENCAB413BOQ、ENCAB498DNV、ENCAB093TAW、ENCAB151HMS、ENCAB000ARR、ENCAB000ARQ、ENCAB846BDR、ENCAB864KQT、ENCAB647DFQ、ENCAB000ART、ENCAB000ARS、ENCAB000APB、ENCAB494QXU、ENCAB723WFC、ENCAB984FPK、ENCAB738OTL、ENCAB844TLA、ENCAB771AMN、ENCAB643NJW、ENCAB219DGO、ENCAB155VEG、ENCAB036YAO、ENCAB268VLH、ENCAB009VWX、ENCAB000AQY、ENCAB266AZH、ENCAB000AUP、ENCAB000AQZ、ENCAB000ANB、ENCAB000ATC、ENCAB000ASA、ENCAB694MYM、ENCAB000AUT、ENCAB900FRR、ENCAB000ASD、ENCAB000ASC、ENCAB000ASB、ENCAB000AXZ、ENCAB000AXS、ENCAB323UEU、ENCAB000ADT、ENCAB169CDD、ENCAB782COR、ENCAB000ATF、ENCAB000ANC、ENCAB000ARI、ENCAB000ARJ、ENCAB000BLC、ENCAB000BLA、ENCAB000BLB、ENCAB910BYC、ENCAB773ECH、ENCAB570ZTO、ENCAB261ELA、ENCAB661HUV、ENCAB405MHV、ENCAB582RBY、ENCAB000ARD、ENCAB000AQW、ENCAB211WTE、ENCAB861ENQ、ENCAB000ADV、ENCAB360BDG、ENCAB523NUQ、ENCAB000AQB、ENCAB000BKT、ENCAB000APZ、ENCAB000AQC、ENCAB000AQD、ENCAB000ASN、ENCAB000ADU、ENCAB000AQE、ENCAB000ATB、ENCAB000AUW、ENCAB000AQF、ENCAB000AND、ENCAB000AQG、ENCAB000ARH、ENCAB000BKX、ENCAB000BSH、ENCAB543RHW、ENCAB027VOE、ENCAB539BDB、ENCAB969VGQ、ENCAB256MFX、ENCAB093ZAC、ENCAB663IEY、ENCAB650MWL、ENCAB472HKJ、ENCAB000ADW、ENCAB249ROX、ENCAB644AJI、ENCAB491AYZ、ENCAB000ARZ、ENCAB000APR、ENCAB000APS、ENCAB000ADX、ENCAB000ATH、ENCAB000AYB、ENCAB378MIH、ENCAB845ARK、ENCAB000AQU、ENCAB208AUK、ENCAB000ANE、ENCAB000ARE、ENCAB000APP、ENCAB000APO、ENCAB775EVT、ENCAB483QLF、ENCAB913CFY、ENCAB627HBE、ENCAB001LDA、ENCAB000AOQ、ENCAB000ANI、ENCAB000ANH、ENCAB000AQP、ENCAB004CMB、ENCAB352FQM、ENCAB180QII、ENCAB000APT、ENCAB000ANP、ENCAB681ELK、ENCAB449CFZ、ENCAB778TBN、ENCAB172IHG、ENCAB929ZIJ、ENCAB027OJQ、ENCAB769IVA、ENCAB164QXS、ENCAB890YOB、ENCAB691OYV、ENCAB499JWV、ENCAB292IFT、ENCAB130GEM、ENCAB369JSU、ENCAB003LHL、ENCAB000ANQ、ENCAB679IZV、ENCAB048FFK、ENCAB000AUR、ENCAB000APW、ENCAB000APV、ENCAB000APY、ENCAB000APU、ENCAB000AXW、ENCAB000APX、ENCAB000ANX、ENCAB000ANY、ENCAB000ATI、ENCAB000AQS、ENCAB000ARG、ENCAB000ARF、ENCAB972UJU、ENCAB027NDF、ENCAB343QJE、ENCAB000ANZ、ENCAB000AUS、ENCAB000AQV、ENCAB629MIV、ENCAB000AQI、ENCAB000BKS、ENCAB000ASY、ENCAB000AOU、ENCAB000BSK、ENCAB721ICQ、ENCAB343GLF、ENCAB749NPH、ENCAB943WPC、ENCAB661VDQ、ENCAB101KHB、ENCAB974EBC、ENCAB372RPK、ENCAB502OHI、ENCAB557LLB、ENCAB088TFM、ENCAB037IXK、ENCAB003HJF、ENCAB793BZS、ENCAB228OWC、ENCAB000ADS、ENCAB654QHT、ENCAB000AQM、ENCAB137OAB、ENCAB000AQN、ENCAB000APD、ENCAB000APF、ENCAB000APE、ENCAB000APC、ENCAB000ANA、ENCAB000BKR、ENCAB000BSI、ENCAB749UMK、ENCAB638ANC、ENCAB813FEB、ENCAB492DPX、ENCAB346FTT、ENCAB420YAH、ENCAB716RFU、ENCAB382AVR、ENCAB367DWC、ENCAB413RSR、ENCAB000AOP、ENCAB000ADY、ENCAB000ASO、ENCAB000AUX、ENCAB000ANF、ENCAB000BSJ、ENCAB725RFE、ENCAB610CEF、ENCAB008SYM、ENCAB170RJO、ENCAB582RSV、ENCAB385IEP、ENCAB081ENJ、ENCAB902NZL、ENCAB848NER、ENCAB682XRE、ENCAB388GOH、ENCAB884CKI、ENCAB000ARL、ENCAB008TOZ、ENCAB513PLB、ENCAB000ARB、ENCAB000ARO、ENCAB000ARC、ENCAB000ARA、ENCAB000ARK、ENCAB000ASG、ENCAB000AUU、ENCAB000ARM、ENCAB000ARN、ENCAB140BWE、ENCAB000ANU、ENCAB000AQR、ENCAB000AAA、ENCAB000ANL、ENCAB000APM、ENCAB000APL、ENCAB000ANG、ENCAB000ATA、ENCAB000AUV、ENCAB000APN、ENCAB000ANV、ENCAB000BKU、ENCAB000BKY、ENCAB000BLG、ENCAB000BLD、ENCAB000BLJ、ENCAB000BLH、ENCAB000BLE、ENCAB000BLI、ENCAB000BLF、ENCAB874PYE、ENCAB237XGS、ENCAB261POO、ENCAB576XIU、ENCAB851GAY、ENCAB000AOX、ENCAB000ANM、ENCAB000ANK、ENCAB000ANN、ENCAB000ANO和ENCAB000ARV。
条形码化多核苷酸
在一些实施方案中,这些方法涉及使样本与至少一组条形码化多核苷酸接触。在一些实施方案中,这些方法涉及使样本与至少两组条形码化多核苷酸接触。在一些实施方案中,一组中独特条形码化多核苷酸的数量对应于微流体芯片上通道的数量。因此,在各种实施方案中,一组条形码化多核苷酸包含5至1000个独特条形码序列。
实施例7中提供的本公开的条形码化多核苷酸(例如,条形码化DNA)的非限制性示例。在一些实施方案中,条形码化多核苷酸(例如,第一组条形码化多核苷酸的条形码化多核苷酸)包括两个连接接头序列和空间条形码序列,其中空间条形码序列在任一侧上由连接接头序列侧接。在一些实施方案中,条形码化多核苷酸(例如,第二组条形码化多核苷酸的条形码化多核苷酸)包括连接接头序列、空间条形码序列和与PCR引物互补的序列。
在一个示例性实施方案中,为了与包含50个微通道的微流体芯片一起使用,一组条形码化多核苷酸包含50个条形码化多核苷酸。50个条形码化多核苷酸的示例性组包含实施例7的组“A”条形码,其包含SEQ ID NO:1-SEQ ID NO:50。在一个示例性实施方案中,为了与包含50个微通道的微流体芯片一起使用,第二组条形码化多核苷酸包含实施例7的组“B”条形码,其包含SEQ ID NO:51-SEQ ID NO:100。
连接接头序列是与本文提供的连接衔接子序列或通用连接接头的序列互补的任何序列。连接接头序列的长度可变化。例如,连接接头序列可具有5至50个核苷酸(例如,5至40、5至30、5至20、5至10、10至50、10至40、10至30或10至20个核苷酸)的长度。在一些实施方案中,连接接头序列可具有5、10、15、20、25、30、35、40、45或50个核苷酸的长度。本文考虑了较长的连接接头序列。在一些实施方案中,一组(例如,第一组)的条形码化多核苷酸的连接接头序列与另一组(例如,第二组)的条形码化多核苷酸的连接接头序列不同(例如,具有不同的核苷酸组成和/或不同的长度)。
条形码序列是可用于区分生物样本中的条形码化多核苷酸与同一生物样本中的其他条形码化多核苷酸的独特序列。空间条形码序列是与生物样本(例如,安放在载玻片上的组织切片)中的特定位置相关联的条形码序列。“条形码”和将条形码附加到核酸和其他蛋白质和非蛋白质材料的概念是本领域普通技术人员已知的(参见例如,Liszczak G等人,Angew Chem Int Ed Engl.,2019年3月22日,第58卷第13期:第4144-4162页)。因此,应当理解,术语“独特”是关于单生物样本的分子,并且意指样本的特定分子或分子的子集中的“仅一个”。因此,包含独特空间可寻址条形码化缀合物(或可空间寻址的条形码化缀合物的独特子集)的“像素”(也称为“像素块(patch))是样本中的唯一像素,其包括该特定的独特条形码化多核苷酸(或独特条形码化多核苷酸子集),使得像素(和像素内的任何分子)可基于该独特条形码化缀合物(或独特条形码化缀合物子集)来鉴定。
例如,在一些实施方案中,(条形码A的)子集A1的多核苷酸用特定的条形码序列编码,而子集A2、A3、A4等的多核苷酸各自用不同的条形码序列编码,每个条形码对该子集具有特异性。同样,(条形码B的)子集B1的多核苷酸用特定的条形码序列编码,而子集B2、B3、B4等的多核苷酸各自用不同的条形码序列编码,每个条形码对该子集具有特异性。因此,包括条形码A子集和条形码B子集的唯一组合的每个重叠像素块包含独特合成条形码(条形码A+条形码B)。例如,包含A1+B1条形码的重叠像素(像素块)相对于其相邻重叠像素块被唯一地编码,这些相邻重叠像素块包含A2+B1条形码、A1+B2条形码、A2+B2条形码等。
空间条形码序列的长度可变化。例如,空间条形码序列可具有5至50个核苷酸(例如,5至40、5至30、5至20、5至10、10至50、10至40、10至30或10至20个核苷酸)的长度。在一些实施方案中,空间条形码序列可具有5、10、15、20、25、30、35、40、45或50个核苷酸的长度。本文考虑了较长的空间条形码序列。
可根据本发明的方法添加到核酸分子的示例性条形码序列包括但不限于包含SEQID NO:1-100的核苷酸序列的核酸分子。在一个实施方案中,该方法包括添加第一“A”条形码序列和第二“B”条形码序列。在一个实施方案中,“A”条形码序列包含SEQ ID NO:1-50的核苷酸序列,并且“B”条形码序列包含SEQ ID NO:51-100的核苷酸序列。
在一个实施方案中,本发明的方法还包括使样本与一个或多个另外的条形码序列(例如,“区”条形码序列,以区分较大表面的特定区域或“区”)接触因此,在各种实施方案中,这些方法包括将至少一个、两个、三个、四个、五个或多于五个独特条形码序列顺序连接到靶核酸分子。在一个实施方案中,每个条形码化多核苷酸组包含至少10个条形码化多核苷酸。
通用连接接头
本文还提供了通用连接接头,这些通用连接接头可以是多核苷酸,例如,包括(i)第一核苷酸序列,该第一核苷酸序列与第一组条形码化多核苷酸的条形码化多核苷酸的接头序列互补和/或结合,和(ii)第二核苷酸序列,该第二核苷酸序列与第二组条形码化多核苷酸的条形码化多核苷酸的接头序列互补和/或结合。通用连接接头的目的是用作接合来自两个不同组的条形码化多核苷酸的桥(例如,第一组包含侧翼为空间条形码序列的两个连接接头序列,并且第二组包含连接接头序列、空间条形码序列和与PCR引物互补的序列)。通用连接接头的长度可变化。例如,通用连接接头可具有10至100个核苷酸(例如,10至90、10至80、10至70、10至60、10至50、10至40、10至30、10至20、20至100、20至90、20至80、20至70、20至60、20至50、20至40或20至30个核苷酸)的长度。在一些实施方案中,通用连接接头可具有10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100个核苷酸的长度。本文考虑了更长的通用连接接头。
通用连接接头通常在递送一组条形码化多核苷酸后添加生物样本中,尽管在一些实施方案中,通用连接接头在递送之前与条形码化多核苷酸退火。
在一些实施方案中,在本发明的方法期间,添加到核酸的5'和/或3'端的连接衔接子或通用连接接头包括但不限于包含SEQ ID NO:103或SEQ ID NO:104的核苷酸序列或它们的片段的核酸分子。在一些实施方案中,在本发明的方法期间,添加到核酸的5'和/或3'端的连接衔接子或通用连接接头包括但不限于用于与SEQ ID NO:103或SEQ ID NO:104的核苷酸序列或他们的片段杂交的核酸分子。
方法
在一些实施方案中,这些方法包括向生物组织递送第一组条形码化多核苷酸。第一组可包含任何数量的条形码化多核苷酸。在一些实施方案中,第一组包含5至1000个条形码化多核苷酸。例如,第一组可包含5至900、5至800、5至700、5至600、5至500、5至400、5至300、5至200、5100、10至1000、10至900、10至800、10至700、10至600、10至500、10至400、10至300、10至200、20至1000、20至900、20至800、20至700、20至600、20至500、20至400、20至300、20至200、50至1000、50至900、50至800、50至700、50至600、50至500、50至400、50至300或50至200个条形码化多核苷酸。本文考虑了第一组中超过1000个条形码化多核苷酸。
在一些实施方案中,该方法还包括在递送第一组条形码化多核苷酸之前,例如通过第一微流体装置进行透化的步骤。因此,在一些实施方案中,这些方法包括向生物组织递送透化试剂(例如,洗涤剂诸如Triton-X 100或Tween-20)。在一些实施方案中,这些方法包括向生物组织递送第一组条形码化多核苷酸,然后向生物组织递送透化试剂。
在一些实施方案中,这些方法包括向生物样本递送第二组条形码化多核苷酸。第二组可包含任何数量的条形码化多核苷酸。在一些实施方案中,第二组包含5至1000个条形码化多核苷酸。例如,第一组可包含5至900、5至800、5至700、5至600、5至500、5至400、5至300、5至200、5100、10至1000、10至900、10至800、10至700、10至600、10至500、10至400、10至300、10至200、20至1000、20至900、20至800、20至700、20至600、20至500、20至400、20至300、20至200、50至1000、50至900、50至800、50至700、50至600、50至500、50至400、50至300或50至200个条形码化多核苷酸。本文考虑了第二组中超过1000个条形码化多核苷酸。
在一些实施方案中,这些方法包括将第一组的条形码化多核苷酸接合到第二组的条形码化多核苷酸。在一些实施方案中,这些方法包括使生物样本暴露于连接反应,从而产生与目标分子结合的空间可寻址条形码化缀合物的二维阵列,其中空间可寻址条形码化缀合物包含来自第一组和第二组的条形码化多核苷酸的独特组合。
在一些实施方案中,这些方法包括对生物样本进行成像以产生样本图像。例如,光学显微镜或荧光显微镜可用于对样本进行成像。
测序
在一些实施方案中,这些方法包括测序步骤。例如,下一代测序(NGS)方法(或其他测序方法)可用于对细胞裂解后回收的核酸分子进行测序。在一些实施方案中,这些方法包括体外制备NGS文库。因此,在一些实施方案中,这些方法包括对条形码化核酸分子文库进行测序以产生测序读段。其他测序方法是已知的,并且本文提供了示例方案。
在一些实施方案中,这些方法包括通过将空间可寻址条形码化缀合物与对应测序读段匹配来构建生物样本的空间表观基因组图。在一些实施方案中,这些方法包括通过将空间表观基因组图与样本图像相关联来鉴定目标分子的位置。
多组学方法
在一些实施方案中,空间表观基因组作图与一种或多种另外的空间组学作图方法组合,包括但不限于空间蛋白质或空间RNA分析。可与本发明的方法结合的示例性其他空间组学方法包括但不限于以下中所述的那些:美国专利申请号17/036,401,以及Liu等人,2020年,Cell,第183卷第6页:第1665-1681页,其中每一篇的全文以引用方式并入本文。图93提供了用于空间表观基因组作图与空间蛋白质或RNA分析的组合的详细实验工作流程。
基于HSR微流体的系统
为了在生物环境中实现高空间分辨率,检测器(例如,微流体装置)应分析单细胞并分辨足够小的空间特征以有意义地对单细胞和细胞组的空间排列中的图案进行成像。可用于本发明的方法的示例性高空间分辨率的基于微流体的系统详细描述于以下中:美国专利申请号17/036,401,以及Liu等人,2020年,Cell,第183卷第6期:第1665-1681页,其中每一篇的全文以引用方式并入本文。
单细胞分辨率。如果检测器的像素的大小近似等于或小于细胞的大小,则检测器可分析单细胞。考虑到哺乳动物细胞大小在大约5微米(μm)至20μm的长度范围内,这需要利用具有大约同一长度的像素的检测器。尽管样本内的细胞大小不同,并且一些细胞可能比具有恒定大小的检测器像素更大和更小,但是发明人已经发现,通过将光学成像与数字空间重建组合,它们可选择限制单细胞的那些像素,以便实现真实的单细胞分辨率,即使仅对于重建图像的子集。
对多细胞基序进行成像。除了分析单个细胞之外,考虑成像探测器分辨由成像像素之间的中心-中心距离确定的空间特征的能力也是有用的。当检查包含细胞组而不是单个细胞的结构或基序时,诸如在小鼠胚胎中发育类器官时,这种观点变得更加相关,如本文提供的实施例中所示。
在时域和空间域中的数据处理中使用的标准是奈奎斯特准则,其规定给定一定数量微米的中心-中心距离,检测器可忠实地再现仅低至大约两倍的中心-中心距离的成像的空间特征。给定范围从大约5μm至20μm并且通常面对面彼此相邻的哺乳动物细胞大小,细胞邻域的特征应当在等于一个或多个细胞长度的距离上变化。因此,为了解决这些特征,在一些实施方案中,本文提供的HSR检测器包括像素之间的中心-中心距离不超过几个单元长度的像素,例如10μm至50μm。
像素大小和中心-中心距离远大于这些值的成像系统不能描绘单细胞或分辨细胞特征或多细胞特征,因此不显示HSR。例如,具有1毫米大小的像素的检测器将探测1mm至2mm或更大的距离尺度,并且将不能分辨单细胞或多细胞特征。如本文别处所述的本公开,远小于该范围(例如,小于一微米)的像素导致不合适的检测器,因为它们的可作图面积变得极小,并且逻辑任务(包括试剂装载和递送)变得不能实现。本发明人发现,对于具有例如大约2.5μm50μm之间的沟道宽度和间距(靠近目标区域)的高通量HSR检测存在临界范围。
微流体装置
在一些实施方案中,可使用微流体装置(例如,芯片)以空间限定的方式将条形码化多核苷酸递送至生物样本。基于交叉微流体通道的系统,诸如本文所述的那些,具有几个关键参数,其主要确定装置的空间分辨率和可作图区域。这些包括(1)微流体通道的数量(η/eta);(2)以微米测量的微通道宽度(ω/omega),即,每个微流体通道中的开放空间的宽度(对这些开放空间下方的组织进行成像);以及(3)微通道间距(Δ/delta),以微米为单位测量,即,一个通道的一端与另一个通道的起点之间的封闭空间的宽度(这些封闭空间下方的组织未被成像)。
在一些实施方案中,本文提供的微流体装置包括特征在于一定宽度、深度和间距的多个微通道。在一些实施方案中,本发明的微流体装置在单细胞水平上实现了高空间分辨率。
在一个实施方案中,本发明的系统包括两个微流体装置。例如,在一个实施方案中,第一装置使试剂从左向右流动并绘制为一系列行,并且第二装置使试剂从上向下流动并绘制为一系列列。检测器的像素包括两组形状之间的重叠区域,并且如图中可见,这种几何形状赋予正方形边长ω微米。作为说明性示例,假设利用具有η=50、ω=10微米和Δ=10微米的微流体装置的检测方案。在一些实施方案中,检测器将以边缘长度为10微米的正方形的像素为特征,并且水平和垂直方向上的正方形之间的距离等于20微米。这意味着它可分析大约10微米或更大的单细胞,并分辨40微米或更大的空间特征(例如,细胞邻域的特征)。在一些实施方案中,这种基于微流体的检测器将显示由设计和设计参数确定的某些性能特征,包括但不限于分析单个细胞的能力;空间特征再现的最小长度比例;以及可作图区域的大小。
微通道数量。在一些实施方案中,第一组条形码化多核苷酸通过第一微流体芯片递送,该第一微流体芯片包含被定位在生物样本表面上的平行微通道。在一些实施方案中,第一微流体芯片包括至少5个、至少10个、至少20个、至少30个、至少40个或至少50个平行微通道。在一些实施方案中,第一微流体芯片包括5、10、20、30、40或50个平行微通道。在一些实施方案中,第一微流体芯片包括5至1000个平行微通道(例如,5至10、5至25、5至50、5至75、10至25、10至50、10至75、10至1000、25至500、25至200、25至100、50至200或50至100个平行微通道)。在一些实施方案中,第二组条形码化多核苷酸通过第二微流体芯片递送,该第二微流体芯片包含垂直于第一微流体芯片的微通道的方向被定位在生物样本上的平行微通道。在一些实施方案中,第二微流体芯片包括至少5个、至少10个、至少20个、至少30个、至少40个或至少50个平行微通道。在一些实施方案中,第二微流体芯片包括5至1000个平行微通道(例如,5至10、5至25、5至50、5至75、10至25、10至50、10至75、10至1000、25至500、25至200、25至100、50至200或50至100个平行微通道)。
微通道宽度。在一些实施方案中,微通道具有至少5μm的宽度(例如,至少5μm、至少10μm、至少15μm、至少20μm、至少25μm、至少30μm、至少35μm、至少40μm或至少50μm)。在一些实施方案中,微通道具有10μm、15μm、20μm、25μm、30μm、35μm、40μm、50μm或大于50μm的宽度。在一些实施方案中,微通道具有5μm至1000μm(例如,10μm至500μm、10μm至100μm、20μm至200μm、20μm至100μm)的宽度。
在一些实施方案中,微通道具有可变的宽度。可变的通道宽度使流体易于流过微流体通道。例如,在一个实施方案中,50μm装置的特征在于100μm通道,这些通道仅在目标区域附近缩小至50μm。又如,20μm装置的通道缩小至100、50,然后在目标区域附近缩小至20μm。再如,10μm装置的通道范围在目标区域附近为从100μm、50μm、25μm至10μm。
在一些实施方案中,微通道在入口端口和出口端口附近具有20μm至1000μm的宽度,并且在目标区域附近具有5μm至100μm的宽度。例如,微通道在入口端口和出口端口附近可具有100μm的宽度,并且在目标区域附近可具有50μm的宽度。又如,微通道在入口端口和出口端口附近可具有100μm的宽度,并且在目标区域附近可具有20μm的宽度。在一些实施方案中,微通道在入口端口和出口端口附近具有50μm、60μm、70μm、80μm、90μm、100μm、110μm、120μm、130μm、130μm、140μm或150μm的宽度。在一些实施方案中,微通道在目标区域附近具有10μm、20μm、30μm、40μm或50μm的宽度。
在一些实施方案中,微通道是蛇形的,从而允许流体以一定的图案来回流过样本(参见例如图6B)。蛇形微通道的使用可用于以重复模式将特定条形码序列施加在样本上。在一些实施方案中,蛇形微流体装置与非蛇形微流体装置和将条形码应用于特定非重叠区的第三方法相组合,该非蛇形微流体装置使第二组条形码以直线模式流动,使得每个tixel包含唯一的一组条形码。
微通道高度。在一个实施方案中,微通道高度近似等于(例如,在10%内)微通道宽度。在一些实施方案中,微通道具有至少10μm的高度(例如,至少15μm、至少20μm、至少25μm、至少30μm、至少35μm、至少40μm或至少50μm)。在一些实施方案中,微通道具有10μm、15μm、20μm、25μm、30μm、35μm、40μm或50μm的高度)。在一些实施方案中,微通道具有10μm至150μm的高度(例如,10μm至125μm、10μm至100μm、25μm至150μm、25μm至125μm、25μm至100μm、50μm至150μm、50μm至125μm或50μm至100μm)。这些高度已经被测试并示出为足以提供例如灰尘或组织堵塞物上方的间隙,并且足够低以提供良好的足够刚性并防止通道在夹持和流动期间变形。
在一些实施方案中,微通道具有10μm的宽度和12μm至15μm的高度。在其他实施方案中,微通道具有25μm的宽度和17μm至22μm的高度。在其他实施方案中,微通道具有50μm的宽度和20μm至100μm的高度。
微通道间距。间距是微流体装置(例如芯片)的微通道之间的距离。在一些实施方案中,微流体装置的间距为至少10μm(例如,至少15μm、至少20μm、至少25μm、至少30μm、至少35μm、至少40μm或至少50μm)。在一些实施方案中,微流体装置的间距为10μm、15μm、20μm、25μm、30μm、35μm、40μm或50μm。在一些实施方案中,微流体装置的间距为10μm至150μm(例如,10μm至125μm、10μm至100μm、25μm至150μm、25μm至125μm、25μm至100μm、50μm至150μm、50μm至125μm或50μm至100μm)。
负压系统
许多微流体平台经由注射泵、蠕动泵和其他类型的正压泵利用正压,由此流体从贮存器被泵送到装置中。通常,进行连接以使贮存器/泵组件与微流体装置对接;这通常采取管的形式,这些管端接在插入装置上的入口端口的销中。然而,这种类型的系统需要费力且耗时的装配过程的微调,这与若干缺点相关联。例如,如果销插入到入口井中的深度不够,或者销的直径相对于端口太小,则在泵启动时,流体压力将从端口喷射管。又如,如果将销插入到孔中过深,则在启动泵时,流体压力将使微流体装置与玻璃基底分离,从而导致泄漏。虽然用环氧树脂将销固定到端口中和/或经由等离子体结合或热结合将微流体装置结合到基底可能解决上述缺点,但是这些策略使得难以非破坏性方式拆卸系统,从而导致部件损失,并且当基底包含敏感材料诸如组织切片和/或抗体时是不切实际的。
相反,本文提供的方法和装置通过在一些实施方案中使用负压系统克服了与现有微流体平台相关联的缺点,该负压系统利用真空从后面拉动液体通过装置,而不是利用正压从前面推动液体通过装置。这具有几个优点,包括例如(i)通过将装置和基底拉在一起而降低泄漏的风险,以及(ii)提高效率和使用方便—真空可被施加到所有出口端口,这与必须单独插入每个入口端口的销不同。使用负压系统节省了每次微调和销组装的几小时。
因此,在本文提供的一些实施方案中,使用负压(真空)通过微流体装置(例如,芯片)将条形码化多核苷酸递送至目标区域。在一些实施方案中,使用负压系统通过第一微流体装置递送第一组条形码化多核苷酸。在一些实施方案中,使用负压系统通过第二微流体装置递送第二组条形码化多核苷酸。
入口端口和出口端口
在一些实施方案中,具有共同出口端口的微流体装置易受试剂通过不正确的微通道回流到目标区域中的影响,特别是在装置拆卸期间。这种回流可导致靶分子的不正确寻址,从而导致在这些方法的后续步骤中(例如,在测序后)进行的靶分子的空间图的不正确重建。为了限制试剂回流的可能性,在一些实施方案中,本文提供的微流体装置包括微通道,这些微通道各自具有其自己的入口端口和出口端口。例如,在一个实施方案中,包括50个微通道的微通道装置具有50个入口端口和50个出口端口。在一个实施方案中,包括100个微通道的微通道装置具有100个入口端口和100个出口端口。
夹持
在用于测试本文提供的微流体装置和方法的初始实验期间,在目标区域上的通道之间发生了频繁的试剂泄漏。传统的夹持机构证明是笨重的,并且在解决入口端口和出口端口方面引入了困难。为了解决所鉴定的问题,开发了一种新夹持机构,该夹持机构结合了包括局部夹持力和特定夹持力的特定夹持参数。研究了夹持力的范围—在一些情况下,夹持力不足以防止泄漏,并且在其他情况下,夹持力如此之大以至于在一些或所有微通道中流动显著减少或甚至完全停止。在不受理论约束的情况下,这是由于通道横截面因夹持力而变形,从而减小了横截面面积,并使通道更容易受到堵塞的影响,例如,由于灰尘或占据整个微通道的组织。
在一些实施方案中,微流体芯片由聚二甲基硅氧烷(PDMS)制造。可使用其他基底。
样本
在一些实施方案中,样本是生物样本。生物样本的非限制性示例包括组织、细胞和体液(例如,血液、尿液、唾液、脑脊液和精液)。生物样本可以是例如成人组织、胚胎组织或胎儿组织。在一些实施方案中,生物样本来自人或其他动物。例如,生物样本可从鼠(例如,小鼠或大鼠)、猫科动物(例如,猫)、犬科动物(例如,狗)、马科动物(例如,马)、牛科动物(例如,牛)、兔科动物(例如,兔)、猪科动物(例如,猪)、山羊科动物(例如,山羊)、熊科动物(例如,熊)或鱼科动物(例如,鱼)获得。本文考虑了其他动物。
在一些实施方案中,生物样本是固定的,因此被称为固定的生物样本。固定(例如,组织固定)是指化学保存生物样本的自然状态的过程,例如,用于随后的组织学分析。常规使用各种固定剂,包括例如福尔马林(例如福尔马林固定石蜡包埋(FFPE)组织)、甲醛、多聚甲醛和戊二醛,其中任一种可在本文中用于固定生物样本。本文还考虑了其他固定试剂(固着剂)。
在一些实施方案中,生物样本是组织。在一些实施方案中,生物样本是细胞。在一些实施方案中,生物样本,诸如组织或细胞,被切片并安放在表面,诸如载玻片上。在此类实施方案中,样本可在其被切片之前或之后被固定。在一些实施方案中,固定过程包括对从中收集样本的动物进行灌注。
试剂盒
本文还提供了用于产生例如生物样本的高分辨率空间表观基因组图的试剂盒。在一些实施方案中,试剂盒包含连接接头序列、第一组条形码化多核苷酸和第二组条形码化多核苷酸。
在一些实施方案中,试剂盒包含(i)特异性结合目标表观基因组标记物的一抗、(ii)二抗和(iii)蛋白质A系连转座酶。在一个实施方案中,蛋白质A系连转座子预先加载了连接衔接子序列。
在一些实施方案中,试剂盒包含选自组织固定试剂、逆转录试剂、连接试剂、聚合酶链反应试剂、模板转换试剂和测序试剂的至少一种试剂。
在一些实施方案中,试剂盒包括组织载玻片(例如,玻璃载玻片)。
在一些实施方案中,试剂盒包括至少一个微流体芯片,该至少一个微流体芯片包括平行或蛇形微通道。
实验实施例
通过参考以下实验实施例进一步详细描述本发明。这些实施例仅用于说明的目的,并且除非另有说明,否则不是限制性的。因此,本发明决不应被解释为限于以下实施例,而是应被解释为包括由于本文提供的教导而变得明显的任何和所有变化。
在没有进一步描述的情况下,相信本领域普通技术人员可使用前述描述和以下说明性实施例制备和利用本发明的化合物并实施所要求保护的方法。因此,以下工作实施例具体指出本发明的优选实施方案,并且不应被解释为以任何方式限制本公开的其余部分。
实施例1:用于高通量空间表观基因组作图的系统
尽管最近在大规模平行单细胞测序方面取得了突破,这使生物医学研究发生了革命性的变化,但是越来越认识到,单细胞在其组织背景中的空间信息对于新生物学和疾病发病机理的真实机理理解是必要的。然而,这些关联在单细胞组学数据中常常缺失。出现了新“空间转录组学”领域,以解决所有早期基于单分子荧光原位杂交(smFISH)的尝试的挑战。该技术从检测少量基因快速发展到经由重复杂交和成像循环进行的近转录组范围的测量。最近的第一类示范诸如Slide-seq(Rodriques等人)和HDST(Vickovic等人)使用下一代测序(NGS)无偏地重建高空间分辨率(约10μm)转录组图。然而,为了研究不同细胞类型的空间组织和它们的组织环境中的功能的机制,不仅有必要检查基因表达,而且还以单细胞分辨检查表观遗传基础,诸如染色质可及性和修饰。这种能力将使分子生物学的核心法则能够在单个细胞中从表观基因组到转录组和蛋白质组进行新型原因性作图,对组织的组织方式具有广泛的意义,这是现代生物学的巨大挑战。
一种经由微流体工程化、分子条形码化和NextGen测序中的主要创新用于高通量空间表观基因组作图的系统。最近,已经开发了用于全转录组和一组22种蛋白质的空间分辨测序(DBiT-seq)的组织中的微流体确定性条形码,分辨率为约10μm像素大小(图1)(Liu等人,2020年,Cell,第183卷:第1665-1681页)。这种组织内条形码化是独特的,因为它是高度通用的,并且能够原位条形码化其他生物分子信息,诸如表观遗传状态。该组织内确定性条形码化方法用于开发新型原位转座酶标签化化学,以实现高空间分辨率(约10μm)的表观基因组和转录组学作图。通过对组织载玻片中单个细胞核的位置进行成像(PFA固定的或FFPE),明确地鉴定了包含单个细胞核的组织像素,从而允许使用NGS测序进行单细胞分辨的空间分辨的表观基因组和转录组学作图。迄今为止,基于NGS的空间转录组学仍处于起步阶段。在不久的将来,基于NGS的单细胞分辨率表观基因组空间作图似乎是不可能的。然而,如果充分实现这种技术,则可将其转化为包括发育生物学、神经科学、免疫学、肿瘤学和临床病理学的多种生物医学研究领域,从而使得能够在人类健康和疾病中进行科学发现和转化医学。
已经开发了用于组织中的确定性条形码化的方案,用于经由新型微流体技术进行空间分辨的mRNA和蛋白质作图(图1A)。用类似于单细胞CITE-seq的DNA-抗体缀合物的混合物对组织载玻片进行染色。随后,使用夹具将聚二甲基硅氧烷(PDMS)微流体芯片置于组织载玻片上。将一组条形码寡核苷酸溶液移液到芯片的入口中并通过室内真空吸入(图1B)。这些寡聚物包含用于检测mRNA的多聚T序列和用于空间鉴定共定位细胞的不同行条形码A1至A50。在该第一流动条形码化步骤期间,在组织上原位进行逆转录,以合成第1链cDNA。随后,取出PDMS芯片,并将第二个微流体芯片正交放置在同一位置以引入列条形码B1至B50,其在交叉处与第一组条形码A1至A50连接,从而产生条形码化组织像素的2D阵列。然后,回收、纯化并PCR扩增条形码化cDNA以制备NGS测序文库。像素由唯一的行+列条形码标记,从而产生所有像素和对应转录物或蛋白质的空间条形码AiBj(i=1-50,j=1-50),其允许在接近单细胞水平(10μm像素大小)构建空间组学图。DBiT-seq优于其他新兴的空间RNA-seq技术,包括ST(点大小:100μm)、10x基因组Visium(55μm)和Slide-seq(10μm)(图1C)。Visium示出了每个点的可比较基因计数(>2,000个基因),但具有高得多的空间分辨率(10μm与55μm)。该技术优于Slide-Seq,后者具有相当的分辨率(10μm),但灵敏度低(约150个基因/点),从而限制了其分析细胞状态的能力。DBiT-seq用PFA固定的小鼠胚胎组织在对应于眼区发育的目标区域上进行验证(图1D)。通过组装已知在胚胎眼发育中重要的所选基因如Pmel、Pax6、Trpm1、和Six6的像素,空间表达图能够区分眼区,并且令人印象深刻地区分衬在视泡上的单细胞层黑素细胞。scRNA-seq和DBiT-seq数据的计算机整合允许在空间像素中进行准确的细胞类型鉴定,并且揭示大多数空间组织像素(10μm)由单细胞转录组支配(图1F)。无监督聚类分析揭示了25个细胞子集,其中每一个细胞子集都可经由单细胞和空间测序数据的集成计算分析明确地作图为空间表达(图1G)。这种条形码化方法已经证明在空间转录组学中的优越性。此处,翻译该条形码化策略以实现其先头类型的空间表观基因组测序,与空间转录组学组合,并应用于正常生理和血液癌症中人淋巴结的3D作图。
单细胞分辨率hsrATAC-seq的装置和化学的开发。
开发了类似的微流体交叉流动条形码化装置(图1A)以进行空间分辨的组织条形码化,其中关键问题是如何对染色质状态或可及性进行条形码化。本文提出了如图2中示意性说明的基于转座体的DNA标签化化学。将两种DNA寡聚物并入转座酶Tn5,其中一种低聚物与DNA条形码序列Ai(i=1-50)连接。然后,使用微流体通道阵列芯片(通道宽度:约10μm),将并入条形码A的Tn5酶流到组织载玻片上,随后使用单独的微流体芯片沿正交方向使条形码B流动,在此过程期间进行原位连接以产生空间条形码AiBj(i=1-100,j=1-100)的2D阵列。该条形码在Tn5转座酶切割位点与消化的基因组DNA链连接,从而为固定组织中暴露的DNA链提供空间条形码。最近,通过对Tn5切割位点进行原位成像测试了组织固定、交联和透化,并且发现在组织样本中只透化核膜而不透化线粒体的条件。在执行整个hsrATAC-seq工作流程后,同一组织载玻片可用于光学或荧光成像(例如,DAPI核染色),从而允许将核边界与空间组织像素精确地关联,使得可明确地鉴定包含单个核的像素。在研究的小鼠胚胎组织中小于65%的像素(10μm)含有单个核。因此,在该项目中产生的数据实际上是单细胞分辨率空间ATAC-seq图,其中经由成像鉴定的真阳性单细胞直接监督NGS条形码。最近,证明了没有空间条形码的生物化学工作流程的可行性,以在组织中进行转座体消化并收集NGS的回收的DNA片段(图3)。计算分析揭示,读段在转录起始位点(TSS)富集,这是非常令人鼓舞的。滴定实验用于优化Tn5转座体浓度以获得最佳切割效率,并用于针对不同组织类型调节通道。使用在玻璃载玻片上培养的粘附细胞层(例如,NIH3T3)验证hsrATAC-seq,并将hsrATAC-seq与经充分验证的scATAC-seq数据库进行比较。hsrATAC-seq进一步用来自E8-E12的小鼠胚胎组织切片进行验证,其中scATAC-seq数据容易获得。
空间染色质修饰状态分析、空间CHIP-seq和空间DNA甲基化测序。
定制的Tn5转座酶与DNA条形码模式化方法作为基础,通过修饰Tn5的功能以识别不同的表观遗传特征,开发了其他空间表观遗传作图技术。为了对转录因子(TF)的结合位点作图,使用SANH-SFB偶联反应将Tn5共价连接到针对目标TF的抗体(图3A)。然后,使该复合物装配有条形码A寡聚物,失活,并使其流过微流体通道以结合组织中的TF。然后,Tn5酶被再活化以进行标签化,从而在TF结合区并入条形码A。最后,可添加条形码B,并与图2中的条形码B类似地连接,这给出了完整的空间条形码AB,以构建空间TF结合位点图。对于空间甲基化测序,两个Tn5蛋白与甲基化敏感性限制酶(MSRE)连接(图3B),并且该复合物的递送结合DNA甲基化位点以使得能够对组织中的个体核中的DNA甲基化组进行分析。这种连接Tn5技术的并入重建了空间分辨的单细胞分辨DNA甲基化组图。因此,该方法能够以单细胞分辨率对宽范围的表观遗传特征进行空间分辨作图。
在人工人胚胎模型的组织切片中对单细胞的空间表观基因组分析进行原位作图。
胚胎发育是高度动态和快节奏的组织形态发生过程,在每个阶段都受到表观遗传变化的精确控制。经由梳理多年来不同研究的结果,人们对小鼠胚胎发生有很多了解。然而,由于伦理法规和缺乏样本,人们对人胚胎发育,尤其是在早期器官发生中的胚胎发育仍知之甚少。最近,有报道称,来自人多能干细胞(hPSC)的人工胚胎使用微流体系统再现了早期胚胎发生。在该项目中,该方法用于在早期阶段(1周至4周)的不同时间点生成人工人胚胎,并将上述高空间分辨率表观基因组图谱技术与提供匹配的空间信使mRNA和蛋白质数据的DBiT-seq结合,以在3D和基因组尺度上研究人胚胎器官发生的时空动力学。这为改善对人发育机制以及发育缺陷、疾病和潜在干预措施之间关系的理解提供了前所未有的见解。
实施例2:hsrChST-seq的开发和验证。
已经开发了化学工作流程,使用DNA条形码并入的Tn5转座体来实施染色质的组织内条形码化,该转座体进一步被标记至用于不同组蛋白修饰的特异性抗体。直接在天然组织样本上进行,以产生空间条形码化组织像素,随后进行NGS,以构建空间染色质状态图。该技术使用小鼠胚胎组织样本进行验证,以比较hsrChST-seq方法鉴定的细胞类型与公开的单细胞测序数据鉴定的细胞类型。它还通过NIH ENCODE联合体良好表征的癌症细胞系(即GM12878类淋巴母细胞)进行了验证。
实验程序。
染色质切割和标记方案(图5A)用于用识别不同组蛋白修饰(诸如H3K27me3或H3K4me3)的一抗原位标记组织。系连有转座酶Tn5的二抗装配有用作连接接头的独特DNA寡核苷酸序列(图5B和5C)。在应用这种一抗-人组蛋白抗体和修饰的二抗-Tn5转座体复合物后,在对应于特异性组蛋白修饰的基因组DNA序列的位点处用连接接头原位标记整个组织切片。独特的组织内交叉流动条形码化方法被用于经由两个流动连接步骤进行含有空间DNA条形码的空间分辨组织像素。第一流动将行地址DNA条形码Ai(i=1-50)通过模板连接并入接头序列。然后,第二流动将使用单独的微流体芯片沿正交方向引入不同组条形码(列地址DNA条形码Bi(i=1-50),在此期间进行原位连接以产生组织像素的2D阵列,每个组织像素包含独特的空间条形码AiBj(i=1-100,j=1-100)。该条形码序列在Tn5转座酶切割位点处与DNA链连接,该位点由针对特定染色质状态的抗体(例如H3K27me3)确定。最后,使用Illumina Next-Seq中的配对端NGS对释放的DNA片段进行测序。读段1对应于空间地址代码AiBj,并且读段2含有位于目标组蛋白修饰位点处的DNA序列。最近,原位测试了组织固定、交联和通过对Tn5切割位点进行成像的透化作用,并发现了组织样本中仅透化核膜而不透化线粒体的条件。在执行整个hsrChST-seq工作流程后,同一组织载玻片可用于光学或荧光成像(例如,DAPI核染色),从而允许将核边界与空间组织像素精确地关联,使得可明确地鉴定包含单个核的像素。根据初步测试,小鼠组织样本中>70%的像素(10μm)含有单个核。因此,所产生的数据实际上是单细胞分辨率空间染色质状态图。最近,尽管没有将空间条形码应用于组织中的转座体消化,仍进行Tn5生物化学工作流程,并收集NGS的标签化DNA片段。计算分析揭示了读段确实在染色质位点富集。
染色质状态和转录组的空间共作图的扩展。
为了将基因表达分析与单个组织像素(tixel)和单细胞中的表观遗传基础联系起来,将空间mRNA作图的工作流程与所开发的hsrChST-seq方法组合在单个实验中,以在细胞水平和组织环境中实现染色质表观基因组和mRNA转录组的空间分辨共作图。同样,通过比较由ENCODE的单细胞测序数据鉴定的细胞类型,用组织样本验证该技术。
实验程序
组织内条形码化方法的独特之处在于,它不需要预制的捕获或检测探针阵列,而只使用流过组织载玻片上的微流体通道的一组试剂。因此,经由在相同的微流体通道中共流动两种试剂,将hsrChST-seq的试剂与hsrRNA-seq直接结合,以实现空间表观基因组和转录组共测序。因此,通过利用在同一组织载玻片上进行高分辨率光学成像和测序数据的计算去卷积的能力,开发了一种在组织环境和基因组尺度上与表观遗传状态相关的基因表达的单细胞水平作图方法。为了验证该技术,使用充分表征的E8-E12小鼠胚胎组织切片(PFA和FFPE)进行空间-组学测序并将数据与scRNA-seq和scChIP-seq数据整合,二者都是公开可得的。该研究产生了许多新见解,以便在空前的水平上更好地理解胚胎发育和早期器官发生。定制的免疫标记和Tn5转座酶与组织内条形码化一起通过修改Tn5的功能以识别不同的表观遗传特征,为开发其他空间表观遗传作图技术奠定了基础。例如,为了对转录因子(TF)的结合位点作图,使用SANH-SFB偶联反应将Tn5共价连接到针对目标TF的抗体。然后,使该复合物装配有条形码A寡聚物,失活,并使其流过微流体通道以结合组织中的TF。然后,Tn5酶被再活化以进行标签化,从而在TF结合区并入条形码A。最后,添加条形码B,并与图5E中的条形码B类似地连接,这给出了完整的空间条形码AB,以构建组织中的空间转录因子结合位点图。
用R(V3.4.1)中的Seurat包(V2.3.0)进行数据分析,以将空间基因表达与表观遗传修饰联系起来。它用于鉴定单细胞中差异表达的基因。用于聚类分析的质量控制标准包括:1)多于1,000个基因和少于5,000个基因的表达;2)线粒体基因的低表达(<细胞中总计数的10%)。主成分分析(PCA)和t-分布随机相邻物包埋t-SNE)用于发现细胞异质性。使用Monocle包(V2.6.4)分析单细胞伪时间轨迹以检查细胞分化轨迹和表型转变。为了比较不同发育阶段或不同条件/组的样本,使用学生t-检验来评估相关性。对于其他比较,具有显著差异的统计学分析(单向ANOVA)被假定为p<0.05。还在调整了采样条件的情况下执行多变量线性混合建模。模型选择利用赤池信息准则(AIC)和贝叶斯信息准则(BIC)。
临床组织学样本的大面积空间作图。
为了进一步增加临床组织学标本(厘米级)所需的可作图面积,并且还增加样本通量,减少操作时间,以及每个样本的成本,这些都是该技术在生物医学和临床研究中广泛应用的关键,开发了微流体组织区条形码化方法,将可作图区域显著增加10倍,达到2cm×2cm,或在组织微阵列载玻片上同时分析约96个组织样本。
实验程序。
为了进一步增加通量并降低样本制备时间和成本,这对于基础和转化研究中的广泛采用是关键的,开发了对组织切片的条形码“宏观”区的方法,其中的每一者可用hsrChST-seq分析,但一起覆盖每个实验所作图的组织的大得多的区域。为此,在组织像素的交叉流动条形码化(AiBj,i和j=1-50)后进行另一连接步骤,使得所有“区”被集中并一起排序,同时仍然允许每个组织像素被追溯回特定组织区域。首先,重新设计微流体装置(图6A)以使通道以蛇形方式来回转向(图6B),从而覆盖整个组织切片(2cm×2cm)。在初始组织像素条形码化(像素AiBj,i和j=1-50)后,添加组织“区”条形码。添加“区”条形码的一种方法包括使用大的方形孔阵列垫圈将区条形码试剂直接移到组织区域。第二种方法包括设计“宏”流体芯片以执行交叉流动组织区条形码化(即,使用不同组DNA条形码,即AA1-AA15和BB1-BB10以条形码化>100个组织区,这可将可作图区域从2mm×2mm的当前技术增加到2cm×2cm的10×更大面积)(图6C)。然后,将所有100个区的染色质DNA序列一起检索用于PCR扩增和测序以实现超大面积表观基因组作图。它也可应用于组织微阵列以增加样本通量并降低成本。所有这些对于在医学或临床环境中广泛采用hsrChST-seq是关键的。
对血癌患者的人骨髓生态位进行作图。
骨髓增生异常综合征(MDS)是一种近年来呈上升趋势的造血干细胞(HSC)癌症,通过化疗或靶向治疗无法治愈,并且可能发展为急性髓系白血病并最终死亡。原发性MDS的深层分子、表观基因组和表型图谱作图揭示了MDS的发病机制和MDS免疫微环境的作用,并有助于发现MDS和潜在的其他血癌的新型靶向治疗方法。
确认患者骨髓(BM)凝块切片的hsrChST-seq和hsrRNA-seq:保持和捕获BM结构的“凝块切片”:骨髓抽吸除去缺乏小梁骨但保留造血/血管/基质BM生态位的BM“颗粒”可用于研究。使用标准组织病理学方案处理这些样本用于研究。
MDS BM免疫微环境的空间作图。首先,为了验证凝块切片(包括BM微环境细胞(基质细胞、内皮细胞、脂肪细胞、T-、B-和NK细胞等))的细胞组成和结构的保持,对正常和MDS对应的BM活检和凝块切片进行染色,以确定单个细胞群的标记物:CD34(母细胞和内皮细胞)、CD3、CD19、CD56(T-、B、NK)、巢蛋白(间充质基质细胞)、CXCL12(CXCL12-丰富的网状(CAR)细胞)与骨髓子集标记物(诸如CD33(骨髓祖细胞)、CD71(红细胞样祖细胞)、CD68(巨噬细胞))联合。接下来,对MDS凝块切片进行m hsrChST-seq和hsrRNS-seq。将10μm网格和50×50条形码用于hsrChST-seq(图7)。示出了针对低等级(图7A)和高等级(图7B)MDS的单元到像素和像素到像素关系的示例。
区分恶性和非恶性造血干细胞/祖细胞(HSPC)以及解码它们相应的微环境。
HsrChST-seq和hsrRNA-seq在MDS和年龄/性别匹配的对照BM上进行。由于在染色质修饰位点进行基因组DNA测序,因此同一数据可用于区分驱动突变的子集,以区分恶性(癌性)HSPC与非恶性HSPC。另选地,设计突变特异性探针以捕获复发性的样本特异性热点突变,从而鉴定突变造血细胞与正常造血细胞,以及鉴定突变造血细胞与非突变基质/微环境细胞。总之,这种高空间分辨率的原发性MDS的深层分子(表观遗传和转录)基因型、表型数据将阐明相关MDS发病机理和MDS免疫-微环境的作用,并可能导致开发MDS和其他相关血癌的新型靶向治疗剂。
实施例3:经由确定性的原位条形码化的高分辨率空间表观遗传
图8至图32证明了本发明的系统在空间上鉴定H3K27me3表观基因组标记物以及由于H3K27me3水平的增加或降低而被活化或沉默的基因的用途。
图33至图48证明了本发明的系统在空间上鉴定H3K4me2表观基因组标记物以及由于H3K4me2水平的增加或降低而被活化或沉默的基因的用途。
图49和图50描绘了测定染色质可及性的先前方法。这些方法不能提供空间信息。
图51描绘了hsrATAC-seq方法的示意图。
图52至图55描绘了用hsrATAC-seq方法的第一版本(hsrATAC-seq v1)产生的结果。
图56至图62描绘了用hsrATAC-seq方法的第二版本(hsrATAC-seq v2)产生的结果。
图63至图68描绘了用优化hsrATAC-Seq方法的第二版本(hsrATAC-Seq v2.1)产生的结果。
图69至图70描绘了用优化hsrATAC-seq方法的2.1版本(hsrATAC-seq v2.2)产生的结果。
实施例4:空间-CUT&Tag:组织尺度和细胞水平的空间分辨染色质修饰分析
本文提供的数据描述了具有高空间分辨率的组织切片中原位染色质状态的分析。尽管空间-CUT&Tag专门集中于染色质状态的组织作图,但通过在相同的微流体通道中组合DBiT-seq(Liu等人,2020年,Cell,第183卷:第1665-1681页,e1618)和空间-CUT&Tag的试剂以实现空间多组学分析,在组织条形码化方法中用微流体整合其他空间测定诸如转录组和蛋白质是可行的。此外,可通过增加条形码数量(例如100×100)或使用蛇形微流体通道设计来进一步增加空间-CUT&Tag的作图面积,而无需增加DNA条形码数量。空间-CUT&Tag是一种基于NGS的方法,其对于在组织环境中对生物分子机制进行作图是无偏见的和全基因组的。这种能力将使分子生物学的整个核心法则能够在单个细胞中从表观基因组到转录组和蛋白质组新发现原因性关系,对组织的组织方式和疾病的发展方式具有广泛的意义。该方法的多功能性和可扩展性可加速在大的组织规模和细胞水平上对染色质状态进行作图,以用空间分辨的表观基因组显著丰富细胞图谱,从而为空间生物学增加了新的维度。
现在描述材料和方法
动物
将C57BL/6xCD1混合遗传背景下的小鼠品系Sox10:Cre-RCE:LoxP(EGFP)用于P21小鼠的实验。它是通过使C57BL/6j遗传背景下的Sox10:Cre动物(Kelsey等人,2017年,Science,第358卷:第69-7522页)(杰克逊实验室小鼠库存编号#025807)与C57BL/6xCD1混合遗传背景下的RCE:loxP(增强型绿色荧光蛋白(EGFP))动物(Nguyen等人,2018年,Frontiers in Cell and Developmental Biology,第6页)(杰克逊实验室小鼠库存编号#32037-JAX)杂交产生的。具有半合子Cre等位基因的雌性与缺少Cre等位基因的雄性的育种(而报告等位基因在雌性和雄性中都保持半合子性或纯合性)导致用EGFP标记少突胶质细胞系。将不含常见病毒病原体、外寄生物、内寄生物和小鼠细菌病原体的小鼠以每笼最多5只的最大数量圈养在单独通风的笼中(IVC sealsafe GM500,Tecniplast)。笼配备有硬木垫(TAPVEI)、筑巢材料、碎纸、啃咬棒和纸板箱掩蔽物(Scanbur)。小鼠使用每周更换的水瓶接受常规咀嚼饮食和水。每隔一周在层流空气流动箱中更换笼。一般的居住参数,诸如相对湿度、温度和通风遵循欧洲公约,以用于保护脊椎动物,用于实验和其他科学目的条约ETS123。使用以下光/暗循环:黎明6:00-7:00,白天7:00-18:00,黄昏18:00-19:00,夜晚19:00-6:00。
组织制备和切片:
胚胎组织样本是商业购买的。由Zyagen(San Diego,CA)制备小鼠C57胚胎矢状冷冻切片(Zyagen,MF-104-11-C57)和小鼠C57嗅球冠状冷冻切片(Zyagen,MF-201-01-C57)。将胚胎迅速冷冻在OCT块中,切成7μm至10μm厚的切片,并固定在聚-L-赖氨酸包被的玻璃载玻片(Electron Microscopy Sciences,63478-AS)的中心。用于50μm实验的组织切片来自相同的小鼠胚胎,并且用于20μm实验的组织切片来自另一小鼠胚胎。
通过用氯胺酮(120mg/kg体重)和甲苯噻嗪(14mg/kg体重)麻醉,随后用冷充氧的人工脑脊液aCSF(dH2O中的87mM NaCl、2.5mM KCl、1.25mM NaH2PO4、26mM NaHCO3、75mM蔗糖、20mM葡萄糖、1mM CaCl2*2H2O、2mM MgSO4*7H2O)经颅灌注,处死幼小(P21)小鼠。从颅骨分离脑,包埋在Tissue-O.C.T.化合物(Sakura)中,并使用干冰和乙醇的混合物快速冷冻。
脑经冠状冷冻切片成10μm切片(1:8系列),并收集在聚-L-赖氨酸包被的玻璃载玻片(Electron Microscopy Sciences,63478-AS)上。将样本储存在-80℃下直到进一步使用。
微流体装置制造和组装
使用光刻制造微流体装置的模具。按照制造商的指导,将SU-8负性光致抗蚀剂(Microchem,SU-2010,SU-2025)旋涂在硅片(WaferPro,C04004)上。50μm宽的微流体通道装置的特征高度为50μm,并且对于20μm宽的装置为约23μm。在UV曝光期间使用铬光掩模(前范围光掩模)。
然后使用软光刻制造微流体装置。通过以10:1的比例混合基质和固化剂(Ellsworth Adhesives,184SIL ELAST KIT 3.9KG)来制备聚二甲基硅氧烷(PDMS)。然后将PDMS加到SU-8母版上。在真空中脱气30分钟后,将PDMS在65℃下固化2小时。切下固化的PDMS板,并冲出入口孔和出口孔,完成制备。
DNA条形码和其他关键试剂
用于PCR和测序文库制备的DNA寡聚物列于表1中,DNA条形码序列列于表3(实施例7)中,并且所使用的所有其他关键试剂列于表2中。
H&E染色
带有冷冻组织切片的载玻片首先在室温下保持10分钟,然后用4%甲醛固定10分钟。接下来,将500μL异丙醇添加到组织中并温育1分钟。在除去异丙醇之后,将组织放置风干。在室温下用1mL苏木精(Sigma)染色7分钟。然后,用DI水洗涤载玻片,并在室温下在1mL发蓝试剂(Sigma,0.3%酸性醇)中温育2分钟。最后,在用DI水另外冲洗后,用曙红对组织载玻片染色2分钟,并再次用DI水冲洗。使用EVOS(Thermo Fisher EVOS fl)以20X的放大倍数对染色的组织切片进行成像。
转座体制剂
未加载的pA-Tn5转座酶购自Diagenode(C01070002),并按照制造商的指导组装转座体。在转座体组装期间使用的寡核苷酸是:
Tn5ME-A:
5'-/5Phos/CATCGGCGTACGACTAGATGTGTATAAGAGACAG-3'(SEQ ID NO:115)
Tn5ME-B:
5'-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG-3'(SEQ ID NO:102)
Tn5MErev:
5'-/5Phos/CTGTCTCTTATACACATCT-3'(SEQ ID NO:101)
空间-CUT&Tag
通过10分钟温育使具有冷冻组织切片的载玻片达到室温。然后,用0.2%甲醛固定组织5分钟,并在室温下用1.25M甘氨酸淬灭5分钟。在固定后,用1mL洗涤缓冲液(20mMHEPES pH 7.5;150mM NaCl;0.5mM亚精胺;1片蛋白酶抑制剂混合物)洗涤组织两次,并用DI水冲洗。然后用NP40-洋地黄皂苷洗涤缓冲液(0.01% NP40,0.01%洋地黄皂苷洗涤缓冲液)透化组织切片5分钟。除去NP40-洋地黄皂苷洗涤缓冲液后,添加一抗(表2)(在抗体缓冲液中1:50稀释(在NP40-洋地黄皂苷洗涤缓冲液中2mM EDTA和0.001%BSA),然后在4℃下温育过夜,然后除去一抗,并添加二抗(表2)(在NP40-洋地黄皂苷洗涤缓冲液中1:50稀释),随后在室温下温育30分钟。使用洗涤缓冲液5分钟除去未结合的抗体。添加在300-洗涤缓冲液中的1:100稀释的pA-Tn5衔接子复合物,随后在室温下温育1小时。使用300-洗涤缓冲液(20mM HEPES pH 7.5;300mM NaCl;0.5mM亚精胺;1片蛋白酶抑制剂混合物)5分钟除去过量的pA-Tn5蛋白。接下来,添加标签化缓冲液(10mM MgCl2的300-洗涤缓冲液中),随后在37℃下温育1小时。为了终止标签化,除去标签化缓冲液后添加40mM EDTA,室温下温育5分钟。除去EDTA后,用1X NEBuffer 3.1洗涤组织切片5分钟。
为了原位连接条形码A,将第1个PDMS装置置于组织载玻片的顶部,覆盖目标区域,随后用10X物镜(Thermo Fisher EVOS fl显微镜)进行成像,用于下游分析中的比对。然后,用丙烯酸夹具将组织载玻片和PDMS装置紧紧夹住。连接混合物在1.5mL管中使用72.4μL不含RNase的水、27μL T4 DNA连接酶缓冲液、11μL T4 DNA连接酶和5.4μL的5%Triton X-100制备。
首先通过添加10μL的每种DNA条形码A(100μM)、10μL的连接接头(100μM)和20μL的2X退火缓冲液(20mM Tris,pH 7.5-8.0,100mM NaCl,2mM EDTA)使DNA条形码A与连接接头1退火。通过将2μL的连接混合物、2μL的1X NEBuffer 3.1和1μL的每种DNA条形码A(A1-A50,25μM)合并来制备连接反应溶液(50管)。然后将溶液真空加载到50个通道的每一者中。将芯片保持在湿箱中并在37℃下温育30分钟。通过流动1X NEBuffer3.1洗涤5分钟后,除去夹具和PDMS。将载玻片迅速浸入水中并风干。
为了连接条形码B,将具有垂直于第1个PDMS的通道的第2个PDMS板小心地附着到干燥的载玻片上。拍摄明视野图像(10X放大率下的EVOS),并使用夹具将PDMS压在组织上。接下来,制备115.8μL连接混合物。首先通过添加10μL的每种DNA条形码B(100μM)、10μL的连接接头(100μM)和20μL的2X退火缓冲液(20mM Tris,pH 7.5-8.0,100mM NaCl,2mM EDTA)使DNA条形码B与连接接头2退火。通过将2μL的连接混合物、2μL的1X NEBuffer 3.1和1μL的每种DNA条形码B(B1-B50,25μM)合并来制备连接反应溶液(50管)。再次将溶液真空加载到50个通道的每一者中。将芯片保持在湿箱中并在37℃下温育30分钟。通过流动1×DPBS洗涤5分钟后,除去夹具和第2个PDMS。将组织切片浸入水中并风干,然后拍摄最终的明视野图像(10X放大率下的EVOS)。
可在组织消化之前用普通的核染色染料进行组织切片的荧光染色,以便于目标组织区域的鉴定。将DAPI的工作溶液混合物加到组织顶部,然后在室温下温育20分钟,随后用1X PBS洗涤两次。使用具有10X物镜和DAPI光立方体的EVOS显微镜拍摄组织的图像。
然后,用正方形PDMS孔垫片覆盖目标组织区域,然后在加载裂解溶液(0.1% SDS,10mM TAPS)之前用TAPS洗涤缓冲液(10mM TAPS,0.2mM EDTA)洗涤两次。在湿盒中在60℃下进行裂解2小时。然后将组织裂解物收集到200μL PCR管中,并在65℃下旋转温育另外1小时。
为了构建文库,将裂解物分配到PCR管中(每管5μL),然后向每个管中添加15μLTriton中和溶液(0.67% Triton-X100)、2μL的10μM新P5 PCR引物、2μL的10μM i7引物和25μLNEBnext PCR Master Mix。然后,使用以下程序进行PCR:在58℃下初始温育5分钟,随后在72℃下温育5分钟以及在98℃下温育30秒,在98℃下温育10秒进行12个循环,并在60℃下温育10秒,随后在72℃下最终温育1分钟。为了除去剩余的PCR引物,使用标准方法通过1.3XAmpure XP珠纯化PCR产物,并在10mM Tris-HCl pH 8中洗脱。
在测序前,用Agilent Bioanalyzer高灵敏度芯片定量文库的大小分布和浓度。然后使用HiSeq 4000测序仪,以配对端150bp模式,用定制读段1引物进行NGS测序。
数据预处理
读段1首先通过两个恒定接头序列(接头1和接头2)过滤。然后将过滤的序列处理成细胞排列atac形式(10x基因组),其中新读段1是基因组序列,并且新读段2包括条形码A和条形码B。将所得fastq文件与小鼠基因组(mm10)比对,过滤重复,并使用Cell RangerATAC v1.2计数,产生BED样片段文件用于下游分析。片段文件包含基因组的组织位置信息(条形码A×条形码B)和片段信息。为了计算空间-CUT&Tag数据中的FRiP,使用MACS2从每个样本中调用峰(Denisenko等人,2020年,Genome Biology,第21卷:第130页)。使用在github.com/dyxmvp/spatial-CUT&Tag共享的Snakemake工作流管理系统开发了预处理管线。
数据可视化
对于每个实验,在顶部具有通道的情况下拍摄显微镜图像。通过将通道图像与组织图像重叠,鉴定像素位置。首先使用Adobe Illustrator(github.com/rongfan8/DBiT-seq)从显微镜图像中手动选择来降低组织上的像素,并且使用定制的python脚本来生成与用于空间数据集的Seurat工作流兼容的元数据文件。
然后,将片段文件作为5kb基因组分仓大小的平铺矩阵读取到ArchR中,并基于上一步生成的元数据文件除去不在组织上的像素。使用潜在语义索引(LSI)(迭代=2,分辨率=0.2,varFeatures=25000,dimsToUse=1:30,sampleCells=10000,n.start=10)进行数据归一化和维数缩减,随后进行图聚类和均匀流形近似和投影(UMAP)包埋(nNeighbors=30,公制=余弦,minDist=0.5)(Han等人,2017年,Nucleic Acids Res,第45页)。
染色质沉默评分(CSS)和基因活性评分(GAS)使用ArchR中的基因评分模型计算,并且生成基因评分矩阵用于下游分析。使用ArchR中的getMarkerFeatures和getMarkers函数(testMethod=“wilcoxon”,cutOff=“FDR<=0.05”)鉴定每个聚类的标记物区域/基因,并使用addImputeWeights函数实现基因评分归算,以用于数据可视化。使用MACS2调用峰。使用ArchR中的peakAnnoEnrichment和addDeviationsMatrix函数计算基序富集和基序偏差。使用clusterProfiler包(qvalueCutoff=0.05)(van den Brink等人,2017年,NatureMethods,第14卷:第935-936页)进行GO富集分析。为了将数据作图为组织切片,将ArchR中获得的结果加载到Seurat V3.2中进行空间数据可视化(Lake等人,2018年,NatBiotechnol,第36卷:第70-80页;Larsson等人,2021年,Nat Methods,第18卷:第15-18页)。
为了设计bulk ChIP-seq数据,下载与来自ENCODE的mm10(BAM文件)比对的原始序列数据。在chromVAR中使用getCounts函数在5kb平铺基因组中对读段进行计数(Rodriques等人,2019年,Science,第363卷:第1463-1467页)后,然后在ArchR中使用bulk投影函数。
通过与scRNA-seq参考数据整合,添加细胞类型鉴定和伪scRNA-seq分析(Hu等人,2016年,Genome Biol,第17页)。FindTransferAnchors函数(Seurat V3.2包)用于通过比较空间-CUT&Tag基因评分矩阵和scRNA-seq基因表达矩阵,将空间-CUT&Tag的像素与scRNA-seq的细胞进行比对。ArchR中的GeneIntegrationMatrix函数用于添加细胞标识和伪scRNA-seq分析。
为了计算每个细胞基序的活性,在使用addBgdPeaks生成背景峰集之后,使用cisbp基序集使用addDeviationsMatrix运行chromVAR(Rodriques等人,2019年,Science,第363卷:第1463-1467页)。使用ArchR中的addTrajectory函数实现伪时间重建。概述如何进行下游分析的代码可在github.com/dyxmvp/spatial-CUT Tag上找到。
综合数据分析和细胞类型鉴定
通过与和scRNA-seq参考数据整合,添加细胞类型鉴定和伪scRNA-seq分析(Hu等人,2016年,Genome Biol,第17页)。通过将空间-CUT&Tag基因评分矩阵与scRNA-seq基因表达矩阵进行比较,将空间-CUT&Tag的像素与scRNA-seq的细胞进行比对,这是使用SeuratV3.2包中的FindTransferAnchors功能进行的。然后,使用ArchR中的addGeneIntegrationMatrix函数添加细胞标识和伪scRNA-seq谱。使用Seurat v3中实现的CCA,将来自20μm空间-CUT&Tag P21小鼠脑的数据与单细胞CUT&Tag数据进行整合。5kbH3K4me3和H3K27me3基质用于整合。相关代码在github.com/dyxmvp/spatial-CUT-Tag上分享。
与其他技术的数据质量比较
为了与其他技术进行比较,下载公布的数据:scCUT&Tag:GSE163532。
ENCODE(bulk):从ENCODE下载公共bulk ChIP-seq数据集(来自小鼠胚胎E11.5的H3K27me3、H3K4me3和H3K27ac)。
小鼠器官发生细胞图谱(MOCA):
oncoscape.v3.sttrcancer.org/atlas.gs.washington.edu.mouse.rna/downloads
Mouse Brain Atlas:mousebrain.org/
DBiT-seq:GSE137986(小鼠胚胎脑E1110μm分辨率)。
现在描述实验结果
染色质状态在确定基因组的功能性输出中是非常重要的,并且以细胞类型特异性的方式被动态调节(Schwartzman等人,2015年,Nature Reviews Genetics,第16卷:第716-726页;Kelsey等人,2017年,Science,第358卷:第69页;Carter等人,2020年,NatureReviews Genetics;Gorkin等人,2020年,Nature,第583卷:第744-751页;Deng等人,2019年,Annual Review of Biomedical Engineering,第21卷:第365-393页)。尽管最近在大规模平行单细胞测序方面取得了突破(Macosko等人,2015年,Cell,第161卷:第1202-1214页;Klein等人,2015年,Cell,第161卷:第1187-1201页;Cao等人,2019年,Nature,第566卷:第496-502页;Gierahn等人,2017年,Nat Methods,第14卷:第395-398页;Bose等人,2015年,Genome Biol,第16卷:第120页;Dura等人,2019年,Nucleic Acids Res,第47卷:e16;Fan等人,2015年,Science,第347卷:第1258367页),也使得能够对单个细胞中的表观基因组进行分析(Rotem等人,2015年,Nature Biotechnology,第33卷:第1165-1172页;Grosselin等人,2019年,Nature Genetics,第51卷:第1060-1066页;Bartosovic等人,2021年,NatureBiotechnology;Wu等人,2021年,Nature Biotechnology;Mezger等人,2018年,NatCommun,第9卷:第3647页;Han等人,2017年,Nucleic Acids Res,第45卷:Hu等人,2016年,Genome Biol,第17页;Ma等人,2020年,Cell,第183卷:第1103-1116页,e1120;Lake等人,2018年,Nat Biotechnol,第36卷:第70-80页;Kelsey等人,2017年,Science,第358卷:第69-75页),但人们越来越认识到,初始组织中单细胞的空间信息对于理解生物过程和疾病发病机制同样重要。然而,这些关联目前在单细胞表观基因组数据中缺失。此外,单细胞技术中的组织解离可优先选择某些细胞类型或干扰细胞状态,作为解离或其他环境应激的结果(Nguyen,2018年,Frontiers in Cell and Developmental Biology,第6页;Denisenko等人,2020年,Genome Biology,第21卷:第130页;van den Brink等人,2017年,NatureMethods,第14卷:第935-936页)。
空间分辨的转录组出现是为了应对这一挑战(Larsson的,2021年,Nat Methods,第18卷:第15-18页;Rodriques等人,2019年,Science,第363卷:第1463-1467页;Stahl等人,2016年,Science,第353卷:第78-82页;Burgess等人,2019年,Nat Rev Genet,第20卷:第317页;Vickovic等人,2019年,Nat Methods)。最近,它被扩展到经由组织中的确定性条形码(DBiT-seq)对转录组和一组蛋白质进行共作图(Liu等人,2020年,bioRxiv,2020.2010.2013.338475;Liu等人,2020年,Cell,第183卷:第1665-1681页,e1618)到目前为止,在完整的组织切片中进行空间分辨的表观基因组测序仍然是不可能的。本文报道了第一种用于空间染色质修饰分析的技术,名为空间-CUT&Tag,其将组织内确定性条形码化的概念与目标下切割和标记(CUT&Tag)化学相结合(Kaya-Okur等人,2019年,NatureCommunications,第10卷:第1930页;Henikoff等人,2020年,eLife,第9卷:e63274)(图71A和图72)。首先,用0.2%甲醛轻轻固定标准胺化玻璃载玻片上的组织切片。添加针对靶组蛋白修饰的抗体,随后添加二抗结合以增强pA-Tn5转座体的系连。通过添加Mg++来活化组织中的转座体,将含有连接接头的衔接子插入组蛋白标记抗体识别位点的基因组DNA中。然后,经由微通道引导递送将一组DNA条形码A溶液引入组织切片(Lu等人,2015年,P NatlAcad Sci USA,第112卷:E607-E61535),以进行原位连接,从而附加不同的空间条形码Ai(i=1-50)。然后,使第二组条形码Bj(j=1-50)在与第一流动条形码化步骤中的微通道垂直的微通道中的组织表面上流动。然后将这些条形码在交叉点处连接,从而产生组织像素的二维(2D)嵌合体,其中的每一者包含条形码Ai和Bj的独特组合(i=1-50,j=1-50)。可在每个流动条形码化步骤之前、期间或之后对被处理的组织载玻片进行成像,使得组织形态可与空间表观基因组图相关。在形成空间条形码化组织嵌合体后,通过交联逆转收集DNA片段并通过聚合酶链反应(PCR)扩增以完成文库构建。为了提高新鲜冷冻组织切片的产量和信噪比,空间-CUT&Tag的优化方案包括(1)bulk转座,随后依次连接DNA条形码,而不是使用插入DNA空间条形码的Tn5转座(图71A和图72),以及(2)光固定(0.2%甲醛)
然后在E11小鼠胚胎中用针对H3K27me3(抑制基因座)、H3K4me3(活化启动子)和H3K27ac(活化增强子和/或启动子)的抗体进行空间-CUT&Tag。基于独特片段的总数、每像素峰中读段比例(FRiP)和每像素线粒体读段比例(图71B至图71D)评估空间表观基因组测序数据的质量。在50μm像素大小的空间-CUT&Tag实验中,每个像素获得9,788(H3K27me3)、16,777(H3K4me3)或19,721(H3K27ac)个独特片段的中值,其中16%(H3K27me3)、67%(H3K4me3)或16%(H3K27ac)的片段落在峰区域内,表明基因组序列的高覆盖率和低水平的背景(作为参考,具有H3K27me3的E11小鼠胚胎的bulk CUT&Tag的FRiP为约24%)。另外,在所有数据集中,线粒体片段的比例都很低(片段的0.16%(H3K27me3)、0.13%(H3K4me3)或0.01%(H3K27ac)的中值来自线粒体读段)。在20μm像素大小(细胞水平)的空间-CUT&Tag实验中,获得了每个像素10,064(H3K27me3)、7,310(H3K4me3)或13,171(H3K27ac)个独特片段的中值,其中20%(H3K27me3)、37%(H3K4me3)或12%(H3K27bc)的片段落在峰区域内。对线粒体进行作图的读取对的分数为0.01%(H3K27me3)、0.02%(H3K4me3)或0%(H3K27ac)。另外,对于所有修饰,片段长度分布与核小体和亚核小体片段的捕获一致(亚核小体片段可表示来自未系连Tn5的背景信号)(图73)。为了测量游离Tn5的标签化程度,将空间-CUT&TagH3K27me3信号与现有的ChIP-seq和ATAC-seq参考数据集进行比较(Gorkin等人,2020年,Nature,第583卷:第744-751页)。结果示出,在ATAC-seq峰中观察到约11.5%与ChIP-seq峰不重叠的峰(图74),这可能对应于与用于给定组蛋白标记的抗体无关的Tn5插入事件(Wang等人,2021年,bioRxiv,2021.2007.2009.451758)。
还将空间-CUT&Tag(20μm像素大小)与在同一测序深度下具有相同抗体(H3K4me3和H3K27me3)的同一样本(P21小鼠脑)上已发表的scCUT&Tag数据集进行了比较(Bartosovic等人,2021年,Nature Biotechnology)。结果示出,空间-CUT&Tag比scCUT&Tag检测到了更独特的片段,前者有(H3K27me3:9,735,H3K4me3:3,686),后者有(H3K27me3:682,H3K4me3:453)(图71B)。然而,来自空间-CUT&Tag的FRiP(H3K27me3:10%,H3K4me3:53%)低于scCUT&Tag(H3K27me3:24%,H3K4me3:82%)(图71C)。其中一个潜在的原因是,空间-CUT&Tag数据不是像scCUT&Tag中那样从活细胞产生的,而是从新鲜冷冻样本产生的,据报道,这会影响染色质结构并产生更高的背景噪声(Milani等人,2016年,ScientificReports,第6卷:第25474页)。
为了评价该方法的稳健性,首先验证了来自不同空间-CUT&Tag实验的重复的再现性。对于所有实验,皮尔逊相关系数大于0.95(图75A至图75F),这证明了空间-CUT&Tag的一致性能。另外,空间-CUT&Tag能够再现每种组蛋白修饰的染色质状态模式(图75G和图75H),并且从不同的空间-CUT&Tag实验中调用的峰示出强重叠(图75I)。此外,将从空间-CUT&Tag集合数据中调用的峰与从ENCODE bulk ChIP-seq数据中调用的峰进行比较。结果示出,这两个数据集之间有显著重叠(图76A)。胎儿肝脏区域像素也从空间-CUT&Tag中提取,并生成伪bulk样本,将其与bulk胎儿肝脏ENCODE数据进行比较。绘制了从ENCODE bulk数据集调用的峰周围的聚集空间-CUT&Tag信号的峰中心热图,并且观察到空间-CUT&Tag产生了与参考数据相当的高质量曲线(图76B)。
为了通过染色质状态从头鉴定细胞类型,通过在E11小鼠胚胎空间-CUT&Tag实验中将读段聚集在基因组上的5千碱基仓中,产生用于不同修饰的平铺细胞矩阵(Bartosovic等人,2021年,Nature Biotechnology;Wu等人,2021年,Nature Biotechnology)。然后应用潜在语义索引(LSI)和均匀流形近似与投影(UMAP)进行降维和包埋,然后使用ArchR包进行Louvain聚类(Granja等人,2021年,Nature Genetics,第53卷:第403-411页)。将聚类作图为空间位置,该空间位置被鉴定为与H&E染色的邻近组织切片中的组织学一致的空间上不同的模式(图71E至图71G、图77)。聚类1(H3K27me3)和聚类6(H3K4me3)表示小鼠胚胎的心脏。聚类2(H3K27me3和H3K4me3)和聚类4(H3K27ac)对肝脏区域具有特异性。聚类8(H3K27me3)、聚类3(H3K4me3)和聚类1(H3K27ac)与前脑相关联,而聚类9(H3K27me3)、聚类5(H3K4me3)和聚类3(H3K27ac)与脑干相关联,包括中脑。聚类11(H3K27me3)、聚类8(H3K4me3)和聚类2(H3K27ac)存在于中枢神经系统的更靠后的区域,如脊髓。这些结果从未在组织切片中直接观察到,并且证明空间-CUT&Tag可以高空间分辨率分辨表观遗传控制的主要组织结构。
为了对空间-CUT&Tag数据进行基准分析,使用UMAP转换函数将ENCODE器官特异性ChIP-seq数据投影到UMAP包埋上(Gorkin等人,2020年,Nature,第583卷:第744-751页;Granja等人,2021年,Nature Genetics,第53卷:第403-411页)。总体上,聚类鉴定与ChIP-seq投影(图71G和图71H)匹配良好,并且区分了E11小鼠胚胎中的主要细胞类型。为了进一步比较空间-CUT&Tag与发育期间已知的空间模式,检测了细胞类型特异性标记物基因,并从染色质修饰数据中估计了这些基因的表达。对于H3K27me3,基于与给定基因座(16)相关联的总信号计算染色质沉默评分(CSS)以预测基因表达。由于在标记物基因区域附近缺乏H3K27me3阻抑标记,因此活性基因应具有低CSS(图78A和图79A)。例如,血管发育所需并在心脏形态发生中起关键作用的Hand2(Stelzer等人,2016年,Current Protocols inBioinformatics,第54卷:1.30.31-31.30.33)示出在心脏中缺乏H3K27me3富集(对于H3K27me3为C1)。
Foxa2是几种肝脏特异性基因的转录活化剂(Stelzer等人,2016年,CurrentProtocols in Bioinformations,第54卷:1.30.31-31.30.33),主要在肝脏区域具有低CSS(C2)。与前脑中缺乏H3K27me3修饰(C8)相关的Nr2e1是前脑分化和模式化所需的,并且还参与视网膜发育(Stelzer等,2016,Current Protocols in Bioinformatics,第54卷:1.30.31-31.30.33)。Otx2是一种可能参与脑和感觉器官发育的转录因子(Stelzer等人,2016年,Current Protocols in Bioinformations,第54卷:1.30.31-31.30.33),在脑干聚类(C9)处呈现低H3K27me3。对于H3K4me3和H3K27ac,使用基因活性评分(GAS),因为它们与活性基因相关(图78B、图80A和图81A)。例如,Nfe2和Hemgn对调节红系和造血细胞成熟和分化至关重要(Stelzer等人,2016年,Current Protocols in Bioinformations,第54卷:1.30.31-31.30.33),它们在肝脏和一定程度上在心脏中具有活性(对于H3K4me3为C2和C6)。H3K4me3在Foxg1基因座的前脑(C3)中高度富集,其在发育中的脑的区域分部的建立和端脑的发育中起着重要作用(Stelzer等人,2016年,Current Protocols inBioinformations,第54卷:1.30.31-31.30.33)。Ina参与神经元的形态发生(Stelzer等人,2016年,Current Protocols in Bioinformations,第54卷:1.30.31-31.30.33),在脑干(C5)以及脊髓(C4)中示出高GAS。Gata4在心肌分化和功能中起着关键作用(Stelzer等人,2016年,Current Protocols in Bioinformations,第54卷:1.30.31-31.30.33),在心脏中被广泛活化(C6)。对每个聚类进行基因本体论(GO)富集分析,并且GO途径与解剖注释匹配良好(图79B、图80B和图81B)。为了理解哪些调控因子在聚类间最具活性,使用ArchR计算H3K4me3和H3K27ac修饰基因座中转录因子(TF)基序富集(图82和图83)。如所预期的,肝脏中最富集的基序对应于GATA转录因子,包括充分研究的Gata2在造血细胞谱系的发育和增殖中的作用。在心肌发育中介导细胞功能的Mef2a在心脏区域富集(Stelzer等人,2016年,Current Protocols in Bioinformatics,第54卷:1.30.31-31.30.33)。为了预测增强子及其靶基因在聚类间的基因调控相互作用,通过scRNA-seq(Cao等人,2019年,Nature,第566卷:第496-502页)和H3K27ac修饰测量的基因表达在候选增强子处使用ArchR进行关联(图78C)。基于相关性的图以高空间分辨率预测了实验验证的增强子-基因相互作用。例如,所预测的Ascl1和Kcnq3的增强子在中枢神经系统(CNS)中富集(聚类C1、C2、C3和C6),这与VISTA验证的元件一致(Visel等人,2007年,Nucleic Acids Research,第35卷:D88-D92)。
然后将来自小鼠器官发生细胞图谱(Cao等人,2019年,Nature,第566卷:第496-502页)的ScRNA-seq数据与空间-CUT&Tag数据(即H3K4me3和H3K27ac)整合,以在空间表观基因组图谱中鉴定细胞类型(图78D至图78H、图84)。发现空间组织像素很好地符合单细胞转录组的聚类,使得细胞类型注释能够从单细胞转录组数据转移至组织中的空间像素,并进一步转移至染色质修饰状态。
检测到几种器官特异性细胞类型(图78E和图78G)。例如,最终红系谱系细胞仅在肝脏中富集,肝脏是胚胎发育这一阶段的主要造血器官(Stelzer等人,2016年,CurrentProtocols in Bioinformations,第54卷:1.30.31-31.30.33)。仅在与解剖注释一致的心脏区域中观察到心肌细胞类型。在胚胎面部突起中广泛观察到软骨细胞和成骨细胞。抑制性中间神经元在脑干中高度富集。在脊髓区域广泛观察到有丝分裂后早熟神经元。高分辨率聚类分析进一步鉴定了具有不同空间分布和染色质状态的发育中神经元的亚群(图78I、图84B)。例如,H3K27ac放射状胶质细胞可以是三个聚类的另外子集。与中枢神经系统(例如Sox1)中干细胞维持相关的基因在亚聚类2中具有较高的表达,其在发育中的脑干和脊髓中沿心室富集。相反,亚聚类3细胞在脊髓实质中,而亚聚类1细胞主要在CNS外,因此可能代表神经嵴祖细胞(例如活性Sox10)的表观遗传状态(图78I)。另外,在软骨细胞和成骨细胞中发现了具有不同空间分布的两种亚聚类,并且与发育中的牙齿相关的基因(例如Barx1)在亚聚类2中具有较高的表达(图84B)。
在胚胎发育期间,染色质状态随时间和空间的动态变化有助于调节复杂组织结构和终末分化细胞类型的形成(Stickels等人,2020年,Nature Biotechnology)。在胚胎CNS中,放射状胶质细胞作为原代祖细胞或神经干细胞发挥作用,其在CNS中产生多种细胞类型(Kriegstein等人,2009年,Annual Review of Neuroscience,第32卷:第149-184页)。因此,测试了空间-CUT&Tag数据是否可被用于回收空间组织发育轨迹,并检查发育过程如何在组织空间上进行。研究了从放射状胶质细胞到兴奋性神经元的发育过程的过程,其中将有丝分裂后早熟神经元作为放射状胶质细胞分化后的即时状态,并使用ArchR在伪时间内对这些细胞进行排序。每个像素的伪时间值的空间投影揭示了神经元中空间有组织的发育轨迹(图85)。有趣的是,观察到分化早期的细胞染色质状态在发育中的脑干中脑室周围成聚类,而更远的那些表现出更加分化的表型(图85B)。在整个发育过程中,基因活性的变化是基于H3K4me3确定的,并且许多回收的基因在神经元发育中很重要,包括调节参与神经元分化和存活的特定基因的表达的Pou4f1(Stelzer等人,2016年,Current Protocols inBioinformatics,第54卷:1.30.31-31.30.33)和据报道参与神经元分化的Car10(Luo等人,2021年,BMC Biology,第19卷:第135页)(图85C和图85D)。
证明了空间-CUT&Tag与免疫荧光染色在同一组织切片中的组合(图86)。用DAPI(4',6-二脒基-2-苯基吲哚)(蓝色核DNA染料)对小鼠嗅球组织切片进行染色(图86A和图86B)。然后,针对20μm像素大小的H3K27me3进行空间-CUT&Tag,其区分了主要的细胞类型,包括肾小球体层(聚类1)和颗粒层(聚类2)(图86)。通过空间-CUT&Tag揭示的H3K27me3修饰状态的空间模式通过原位杂交数据验证,如图86D所示。对核进行DAPI染色,选择目标像素,诸如仅包含一个核的像素或示出特定染色质修饰的像素。在同一组织载玻片上,将免疫荧光与细胞水平(20μm像素大小)的空间-CUT&Tag结合,可在没有组织解离的情况下原位提取单细胞表观基因组数据(图86E至图86I)。
用20μm像素大小进行空间-CUT&Tag,以分析E11小鼠胚胎的脑区域(图87)。无监督聚类示出了不同组蛋白修饰的不同空间模式,并且H3K27me3与大多数聚类相关联(图87A至图87C)。聚类鉴定与UMAP包埋上的ENCODE器官特异性bulk ChIP-seq投影匹配(图87C和图87D)。调查了H3K27me3修饰,并在聚类之间观察到不同的修饰模式(图87E和图88A)。除了在前脑的一部分中,Cfap77被广泛抑制。Six1参与肢体发育,在聚类5中具有低CSS。尽管Sfta3-ps和Rhcg仅在前脑中缺乏H3K27me3富集,但它们具有不同的空间模式。标记物基因的途径分析揭示,聚类1主要参与前脑发育,聚类2对应于前/后模式规范,并且聚类4与心脏形态发生相关联,所有这些都与解剖注释良好一致(图87A和图88B)。接下来,通过整合H3K4me3和H3K27ac组蛋白标记的数据改善了聚类分辨率。为此,使用典型相关分析(CCA),并以基因分辨率对数据进行整合。从综合分析获得的数据的二维表示的粒度被进一步改善(图87F)。为了将细胞类型分配给每个聚类,将空间-CUT&Tag数据(H3K4me3和H3K27ac)与小鼠胚胎的scRNA-seq图谱整合(Cao等人,2019年,Nature,第566卷:第496-502页)(图86G至图86K)。例如,软骨细胞和成骨细胞主要在胚胎面部突起中,并且在前脑中观察到放射状胶质细胞和抑制性神经元祖细胞(图87H和图87J)。尽管H3K4me3和H3K27ac在20μm分辨率下具有比H3K27me3更少的聚类,但发现似乎是同质的聚类可进一步去卷积成亚群,从而表明使用单细胞或空间转录组数据与充分注释的细胞类型的综合分析可进一步改进细胞标识的定义并与染色质修饰状态的空间分布相关(Stuart等人,2019年,Cell,第177卷:第1888-1902页,e1821)。
最后,为了证明在不同组织类型中空间分辨染色质状态分析的能力,将20μm像素大小的空间-CUT&Tag应用于P21小鼠脑组织切片。无监督聚类揭示了独特的空间特征(图89A至图89C)。研究了特定标记物基因的空间模式以区分细胞类型,并与小鼠CNS单细胞转录组图谱中的基因表达分布进行了比较(Zeisel等人,2018年,Cell,第174卷:第999-1014页,e1022)(图89D和图89E、图90和图91)。例如,Sox10在H3K4me3数据的聚类2中示出高GAS,并且Itpr2在H3K27me3数据的聚类6中具有低CSS,从而表明这些聚类富集了少突胶质细胞谱系细胞。这些聚类的细胞特别富集在对应于胼胝体的条纹样结构中(图89D和图89E)。对于H3K4me3和H3K27me3数据的聚类3,观察到Adcy5被活化并且Rbms3被抑制,从而表明中型多棘神经元的表观遗传状态在这些聚类中富集。进一步的亚聚类示出,一些似乎是同质的聚类可进一步去卷积为具有不同空间分布的亚群(图89F)。例如,H3K27me3数据中的聚类2可进一步子集化为两个聚类。Cux2是浅皮层2和3的标记物,在亚聚类1中具有较低的H3K27me3信号。相反,Blc11b,较深皮层4至6的标记物在亚聚类1中呈现较高的H3K27me3。虽然Polycomb先前已被证明在胚胎阶段的皮层建立中发挥作用(Hirabayashi等人,2009年,Neuron,第63卷:第600-613页;Morimoto-Suzki等人,2014年,Development,第141卷:第4343-4353页;Oishi等人,2018年,bioRxiv,431684;Pereira等人,2010年,Proceedings ofthe National Academy of Sciences,第107卷:第15957页),但数据表明H3K27me3也参与了出生后阶段的皮层身份维持。为了检查活性和阻抑性标记物之间的相互作用并推断潜在的H3K4me3/H3K27me3二价,鉴定了对H3K4me3标记的各个群体特异性的所有活性启动子,并绘制了每种细胞类型的H3K4me3和H3K27me3的信号(图92)。如所预期的,当启动子在相应群体中富集H3K4me3时,H3K27me3信号被耗尽。然而,在少突胶质细胞和中型多棘神经元中也观察到了围绕少数标记物基因的H3K27me3信号。
为了进一步鉴定哪些细胞类型可能与每个聚类相关,将空间-CUT&Tag数据与最近产生的小鼠脑scCUT&Tag数据集(Bartosovic等人,2021年,Nature Biotechnology)和公众可获得的小鼠脑scRNA-seq数据集(Zeisel等人,2018年,Cell,第174卷:第999-1014页,e1022)整合。整合数据分析揭示,在H3K4me3数据集中,小神经胶质细胞、成熟少突胶质细胞、中型多棘神经元、星形胶质细胞和兴奋性神经元分别富集在聚类1、2、3、4和7中,并且此外可鉴定神经元亚群(图89G至图89J、图90和图91)。此外,空间-CUT&Tag与scRNA-seq或scCUT&Tag的整合可预测scRNA-seq或scCUT&Tag中的特定细胞位于哪个区域(图89G至图89J)。成熟少突胶质细胞(MOL1)在胼胝体中丰富,而中型多棘神经元(MSN2)存在于纹状体中,并且TEGLU3兴奋性神经元存在于更深的皮层6中,这与先前报道的数据一致(Zeisel等人,2018年,Cell,第174卷:第999-1014页,e1022),并在本文中通过表观遗传修饰状态确定。TEGLU8兴奋性神经元已示出填充皮层4(Zeisel等人,2018年,Cell,第174卷:第999-1014页,e1022),并且实际上观察到该神经元群体的对应表观遗传状态分布在比TEGLU3更浅的皮层中(图89J)。有趣的是,发现未活化小胶质细胞(MGL1)的亚群主要位于纹状体中,而不是胼胝体或皮质中。另外,与原生质星形胶质细胞(ACTE2)相关联的表观遗传状态主要位于胼胝体,尽管也在皮质和纹状体中以较低频率观察到。因此,来自空间-CUT&Tag的数据可作为表观遗传状态的空间图谱,利用该图谱可将细胞类型从单细胞转录组或表观基因组数据集作图为空间分布。
50μm装置和20μm装置都能够进行表观基因组标记物的空间表观基因组作图。50μm装置可覆盖更大的组织面积。20μm装置提供更高的空间分辨率,接近细胞分辨率。
实施例5:高空间分辨率多组学分析
图93示出了高空间分辨率多组学分析的化学工作流程。用甲醛轻轻固定标准胺化玻璃载玻片上的组织切片。然后,首先将抗体-DNA标签(ADT)的混合物添加到组织表面以捕获靶膜蛋白。在透化后,一抗结合靶组蛋白修饰或染色质相互作用蛋白,添加细胞内蛋白的ADT和代谢物的ADT,然后添加二抗结合以增强pA-Tn5转座体的系连。然后通过添加Mg++并在37℃下温育,活化与甲基化敏感性限制酶连接的pA-Tn5转座体和Tn5蛋白质,并将含有连接接头1的衔接子插入抗体结合位点。然后,添加与连接接头1组合的RT混合物用于mRNA捕获、逆转录和模板转换。然后,引入一组DNA条形码A溶液以进行原位连接反应,从而用于添加独特的空间条形码Ai(i=1-50)和连接接头2。然后,垂直于第一流动条形码的微流体通道引入第二组条形码Bj(j=1-50),在交叉处连接,从而产生组织像素的嵌合体,每个含有条形码Ai和Bj(i=1-50,j=1-50)的独特组合。在通过逆转交联收集DNA片段和cDNA后,进行PCR扩增和文库构建。
实施例6:空间-ATAC-seq:组织在基因组规模和细胞水平上的空间分辨染色质可 及性分析
空间-ATAC-seq是为了在细胞水平上对像素大小(20μm)的完整组织切片中的染色质可及性进行空间分辨的无偏和全基因组分析而开发的。数据质量是优异的,每20μm像素检测到约15,000个独特片段,并且每50μm像素检测到高达约100,000个独特片段。将其应用于小鼠胚胎(E11和E13)以描绘器官发生的表观遗传情况,鉴定具有独特染色质可及性状态的所有主要组织类型,并揭示发育中的时空变化。它还用于对人扁桃体中不同免疫细胞的表观遗传状态进行作图,并揭示B细胞活化对GC反应的动力学。进一步发展的限制或区域包括以下内容。首先,无缝整合高分辨率组织图像,即多色免疫荧光图像,以鉴定每个像素中的细胞。观察到大量像素(20μm)含有单个核,并且从这些像素提取测序读段可产生空间限定的单细胞ATAC-seq数据。第二,与其他空间组学测量诸如转录组和蛋白质整合,以提供组织空间背景内细胞类型和细胞状态的全面描述。在同一微流体条形码化步骤中将DBiT-seq(Liu等人,2020年,Cell,的183卷:第1665-1681页,e1618)和空间-ATAC-seq的试剂组合以实现空间多组学分析,这在理论上起作用,但需要进一步优化组织固定和反应条件以使这些分析相容。第三,它还进一步扩展到人疾病组织以实现空间-ATAC-seq在临床研究中的全部潜力。空间-ATAC-seq为空间生物学增加了新维度,其可转化为包括发育生物学、神经科学、免疫学、肿瘤学和临床病理学的多种生物医学研究领域,从而使得能够在人类健康和疾病中进行科学发现和转化医学。
现在描述材料和方法
微流体装置的制造和组装
在洁净室中用标准光刻制造用于微流体装置的模具。按照制造商的指导,在硅片(C04004,WaferPro)上旋涂SU-8负性光刻胶(SU-2010,SU-2025,Microchem)。50μm宽和20μm宽的微流体通道装置的特征高度分别为约50μm和23μm。在UV曝光期间,使用铬光掩模(前范围光掩模)。软刻用于聚二甲基硅氧烷(PDMS)微流体装置制造。将基质和固化剂以10:1的比例混合,并加到SU-8母版上。在真空中脱气(30分钟)后,固化PDMS(65℃,2小时)。在固化后,切下PDMS板。对出口孔和入口孔进行冲压以供进一步使用。
组织载玻片的制备
小鼠C57胚胎矢状冷冻切片(MF-104-11-C57)和人扁桃体冷冻切片(HF-707)购自Zyagen(San Diego,CA)。将组织在OCT(最佳切割温度)化合物中快速冷冻,切片(厚度为7μm至10μm)并置于聚-L-赖氨酸覆盖的载玻片(63478-AS,Electron Microscopy Sciences)的中心。
H&E染色
将冷冻的载玻片在室温下温热10分钟,并用1mL 4%甲醛固定(10分钟)。在用1XDPBS洗涤一次后,将载玻片迅速浸入水中并风干。然后将异丙醇(500μl)添加到载玻片,并在移出前温育1分钟。在空气中完全干燥后,用1mL苏木精(Sigma)对组织切片进行7分钟染色,并在DI水中清洗。然后将载玻片在1mL发蓝试剂(0.3%酸性醇,Sigma)中温育2分钟,并在DI水中漂洗。最后,用1mL曙红(Sigma)对组织载玻片进行2分钟染色,并在DI水中清洗。
转座体的制备
未加载的Tn5转座酶(C01070010)购自Diagenode,并且转座体按照制造商的指导进行装配。用于转座体组装的寡聚物如下:
Tn5MErev:
5'-/5Phos/CTGTCTCTTATACACATCT-3'(SEQ ID NO:101)
Tn5ME-A:
5'-/5Phos/CATCGGCGTACGACTAGATGTGTATAAGAGACAG-3'(SEQ ID NO:115)
Tn5ME-B:
5'-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG-3'(SEQ ID NO:102)
DNA寡核苷酸、DNA条形码序列和其他关键试剂
用于测序文库构建和PCR的DNA寡聚物列于表1中,其他关键试剂列于表2中,DNA条形码序列示于表3中(实施例7)。
表1:用于PCR的DNA寡核苷酸和测序文库的制备。
表2:化学品和试剂。
空间ATAC-seq分析
将冷冻的载玻片在室温下温热10分钟。用甲醛(0.2%,5分钟)固定组织,并在室温下用甘氨酸(1.25M,5分钟)淬灭。在固定后,用1mL 1X DPBS洗涤组织两次,并在DI水中清洗。然后用500μL裂解缓冲液(10mM Tris-HCl,pH 7.4;10mM NaCl;3mM MgCl2;0.01%Tween-20;0.01% NP-40;0.001%iDigitonin;1% BSA)透化组织切片15分钟,并用500μL洗涤缓冲液(10mM Tris-HCl pH 7.4;10mM NaCl;3mM MgCl2;1% BSA;0.1%Tween-20)洗涤5分钟。添加100μL转座混合物(50μL 2X标签化缓冲液;33μL 1X DPBS;1μL 10% Tween-20;1μL 1%洋地黄皂苷;5μL转座体;10μL无核酸酶H2O),随后在37℃下温育30分钟。在除去转座混合物后,添加500μL 40mM EDTA,室温温育5分钟以终止转座。最后,除去EDTA,用500μL 1X NEBuffer 3.1洗涤组织切片5分钟。
对于条形码A原位连接,用第1个PDMS板覆盖目标区域,用10X物镜(Thermo FisherEVOS fl显微镜)拍摄明视野图像用于进一步比对。然后用丙烯酸夹具夹住组织载玻片和PDMS装置。首先,将DNA条形码A与连接接头1退火,将10μL的每种DNA条形码A(100μM)、10μL的连接接头(100μM)和20μL的2X退火缓冲液(20mM Tris,pH 7.5-8.0,100mM NaCl,2mMEDTA)添加到一起并充分混合。然后,通过添加2μL连接混合物(72.4μL无RNA酶的水,27μL的T4 DNA连接酶缓冲液,11μL T4 DNA连接酶,5.4μL的5%Triton X-100),2μL的1X NEBuffer3.1和1μL的每种退火DNA条形码A(A1-A50,25μM)制备5μL连接反应溶液(50管),并真空加载到50个通道的每一者中。将芯片保持在湿箱中以进行温育(37℃,30分钟)。在流过1XNEBuffer 3.1进行洗涤(5分钟)后,除去夹具和PDMS。将载玻片迅速浸入水中并风干。
对于条形码B原位连接,将具有垂直于第1个PDMS的通道的第2个PDMS板小心地附着到干燥的载玻片上。拍摄明视野图像,并使用丙烯酸夹具将PDMS压在组织上。DNA条形码B与连接接头2的退火与DNA条形码A和连接接头1的退火相同。DNA条形码B(B1-B50,25μM)的连接反应溶液的制备和添加也与DNA条形码A(A1-A50,25μM)相同。将芯片保持在湿箱中以进行温育(37℃,30分钟)。在流过1X DPBS以进行洗涤(5分钟)后,除去夹具和PDMS,将组织切片浸入水中并用空气干燥。获取组织的最终明视野图像。
为了进行组织消化,用正方形PDMS孔垫片覆盖组织的目标区域,并将100μL反向交联溶液(50mM Tris-HCl,pH 8.0;1mM EDTA;1% SDS;200mM NaCl;0.4mg/mL蛋白酶K)加载到其中。裂解在湿盒(58℃,2小时)中进行。将最终的组织裂解物收集到200μLPCR管中,用于旋转温育(65℃,过夜)。
对于文库构建,首先用Zymo DNA清洗浓缩器-5纯化裂解物,并洗脱至20μL的DNA洗脱缓冲液中,随后与PCR溶液(2.5μL 25μM新P5 PCR引物;2.5μL 25μM Ad2引物;25μL2xNEBNext Master Mix)混合。然后,用下列程序进行PCR:72℃下5分钟,98℃下30秒,然后在98℃下10秒,63℃下10秒,72℃下1分钟循环5次。为了确定另外的循环,首先将5μL的预扩增的混合物与qPCR溶液(0.5μL 25μM新P5 PCR引物;0.5μL 25μM Ad2引物;0.24μL25x SYBRGreen;5μL 2x NEBNext Master Mix;3.76μL无核酸酶H2O)混合。然后,在下列条件下进行qPCR反应:98℃下30秒,然后在98℃下10秒、63℃下10秒和72℃下1分钟循环20次。最后,通过运行所需数量的额外PCR循环(在qPCR中达到1/3个饱和信号所需的循环)来扩增剩余的45μL预扩增DNA。
为了除去PCR引物残基,根据标准方法,用1X Ampure XP珠(45μL)纯化最终PCR产物,并在20μL无核酸酶的H2O中洗脱。在测序前,使用Agilent Bioanalyzer高灵敏度芯片定量文库的浓度和大小分布。使用Illumina HiSeq 4000测序仪(具有定制读段1引物的配对端150bp模式)进行下一代测序(NGS)。
数据预处理
使用两个恒定接头序列(接头1和接头2)过滤读段1,并将过滤的序列转化到CellRanger ATAC格式(10x基因组)。基因组序列在新读段1中,条形码A和条形码B包括在新读段2中。将所得fastq文件与小鼠参考(mm10)或人参考(GRCh38)进行比对,过滤以除去重复,并使用细胞Ranger ATAC v1.2计数。产生BED样片段文件用于下游分析。片段文件包含关于基因组和组织位置的片段信息(条形码A×条形码B)。使用在github.com/dyxmvp/Spatial_ATAC-seq共享的Snakemake工作流管理系统开发了预处理管线。
数据可视化
使用Adobe Illustrator(github.com/rongfan8/DBiT-seq)从显微镜图像中手动选择来鉴定组织上的像素,并且使用定制的python脚本来生成与用于空间数据集的Seurat工作流兼容的元数据文件。
将片段文件作为5kb基因组分仓大小的平铺矩阵读取到ArchR中,并基于上一步生成的元数据文件除去不在组织上的像素。使用迭代潜在语义索引(LSI)(迭代=2,分辨率=0.2,varFeatures=25000,dimsToUse=1:30,sampleCells=10000,n.start=10)进行数据归一化和维数缩减,随后进行图聚类和均匀流形近似和投影(UMAP)包埋(nNeighbors=30,公制=余弦,minDist=0.5)(Granja等人,2020年,bioRxiv,2020.2004.2028.066498)。
采用ArchR中的基因评分模型进行基因可及性评分。生成基因评分矩阵用于下游分析。ArchR中的getMarkerFeatures和getMarkers函数(testMethod=“wilcoxon”,cutOff=“FDR<=0.05&Log2FC>=0.25”)用于识别每个聚类的标记物区域/基因,并用addImputeWeights实现基因评分归算,以用于数据可视化。clusterProfiler包中的enrichGO函数用于GO富集分析(qvalueCutoff=0.05)(Yu等人,2012年,Omics:a journalof integrative biology,第16卷:第284-287页)。为了空间数据可视化,将ArchR中获得的结果加载到Seurat V3.2.3以将数据作图为组织切片(Stuart等人,2019年,Cell,第177卷:第1888-1902页,e1821;Butler等人,2018年,Nat Biotechnol,第36卷:第411-420页)。
为了设计bulk ATAC-seq数据,从ENCODE下载与mm10(BAM文件)比对的原始序列数据。在使用chromVAR中的getCounts函数对5kb平铺基因组中的读段进行计数后(Schep等人,2017年,Nature Methods,第14卷:第975-978页),使用ArchR中的projectBulkATAC函数。
通过与scRNA-seq参考数据整合,添加细胞类型鉴定和假scRNA-seq分析(Cao等人,2019年,Nature,第566卷:第496-502页)。FindTransferAnchors函数(Seurat V3.2包)用于通过比较空间ATAC-seq基因评分矩阵和scRNA-seq基因表达矩阵,将空间ATAC-seq的像素与scRNA-seq的细胞进行比对。ArchR中的GeneIntegrationMatrix函数用于添加细胞标识和伪scRNA-seq分析。
用addGroupCoverages生成基于聚类标识的伪bulk组覆盖,并使用ArchR中的addReproduciblePeakSet函数用macs2进行峰值调用。为了计算每个细胞基序的活性,在使用addBgdPeaks生成背景峰集之后,使用cisbp基序集使用addDeviationsMatrix运行chromVAR(Schep等人,2017年,Nature Methods,第14卷:第975-978页)。用getMarkerFeatures(bias=c(“TSSEnrichment”、“log10(nFrags)”)、testMethod=“wilcoxon”)和getMarkers(cutOff=“FDR<=0.05&Log2FC>=0.1”)鉴定细胞类型特异性标记物峰。使用ArchR中的addTrajectory函数实现伪时间重建。
用于数据质量比较和综合数据分析的已发布数据10x scATAC seq(速冻):来自胚胎小鼠脑的速冻皮层、海马体和室区(E18)。(Cell Ranger ATAC 1.2.0的单细胞ATAC数据集)ENCODE(bulk):从ENCODE下载公共bulk ATAC-seq数据集(E11.5和E13.5)。
现在描述实验结果
经由结合组织中的微流体确定性条形码化策略(Liu等人,2020年,Cell,第183卷第6期:第1665-1681页)和转座酶可及染色质测定的化学性质(Buenrostro等人,2013年,Nat Methods,第10卷:第1213-1218页,Corces等人,2017年,Nat Methods,第14卷:第959-962页),提出了在细胞水平上对组织切片中染色质可及性作图的空间-ATAC-seq(图94a和图95)。空间ATAC-seq的主要工作流程示于图94a中。用甲醛固定标准胺化玻璃载玻片上的新鲜冷冻组织切片。然后进行Tn5转座,并将含有连接接头的衔接子插入转座酶可及基因组DNA基因座。然后,使用微通道阵列将一组DNA条形码A溶液引入组织表面,用于将不同的空间条形码Ai(i=1-50)原位连接至衔接子。然后,将第二组条形码Bj(j=1-50)引入在与第一流动条形码化步骤中的微通道垂直的微通道中的组织表面上。随后将它们在交叉点处连接,从而产生组织像素的2D嵌合体,其中的每一者包含条形码ai和Bj的独特组合(i=1-50,j=1-50)。在每次流动期间或之后,在光学显微镜下对组织载玻片进行成像,使得空间条形码化可及染色质可与组织形态相关。在形成空间条形码化组织嵌合体(n=2500)后,进行反向交联以释放条形码化DNA片段,其通过PCR扩增以用于对文库制备进行测序。为了评价原位转座和连接的性能,用甲醛将4',6-二脒基-2-苯基吲哚(DAPI)染色的粘附NIH 3T3细胞固定在玻璃载玻片上。然后用Tn5转座酶转座细胞,随后连接用异硫氰酸荧光素(FITC)标记的虚拟条形码A以用荧光显微镜评价化学性质。所得图像揭示了核(蓝色)和FITC信号(绿色)之间的强重叠,表明仅在核中用连接的条形码A将衔接子成功插入到可及染色质基因座中(图94b)。
为了获得高产率和高信噪比的组织切片作图,已经进行了几种版本的化学开发空间-ATAC-seq,并优化了方案(图94d至图94i和图96a)。在化学V1中,将一组50个含有条形码A和衔接子的DNA寡聚物引入到组织切片中用于原位转座,但效率低,部分原因是微通道中Tn5 DNA的量有限。在化学V2中,进行bulk转座,随后进行两个连接步骤以引入空间条形码A-B。通过将甲醛浓度从化学V1中的4%降低到化学V2中的0.2%来优化固定条件。测试了不同Tn5转座酶的敏感性(在化学V2.1中的Diagenode(C01070010),与化学V2中的Lucigen(TNP92110))。通过所检测的独特片段和从V1、V2至V2.1的转录起始位点(TSS)富集评分所测定的性能总结于图96a中。将优化的空间-ATAC-seq方案V2.1应用于小鼠胚胎(E11和E13)和人扁桃体,并且通过与来自商业化平台(10x基因组)的非空间scATAC-seq数据进行比较来评估数据质量。在50μm空间ATAC-seq实验中,每个像素获得了36,303(E11)和100,786(E13)个独特片段的中值,其中15%(E11)和14%(E13)的片段与TSS区域重叠。另外,E11和E13两者的线粒体片段比例低(1%)。对于人扁桃体的20μm空间ATAC-seq实验,获得了每个像素14,939个独特片段的中值,其中18%的片段落在TSS区域内。将读段对作图为线粒体的比例是3%。总之,来自组织切片的空间-ATAC-seq的数据质量与非空间scATAC-seq(每个细胞17,321个独特片段,23% TSS片段,和0.4%线粒体读段)相当。此外,空间-ATAC-seq片段的插入大小分布与所有组织类型的核小体和亚核小体片段的捕获一致(图94g)。在连续组织切片的生物学重复之间进行空间-ATAC-seq的相关性分析,这示出了高再现性,其中皮尔逊相关系数为0.95(图96b)。使用空间-ATAC-seq,产生了E13小鼠胚胎胎肝中单个组织像素的DNA可及性分析。空间ATAC-seq数据的聚集分析精确地再现了从ENCODE参考数据库获得的可及性的bulk测量(图94c)。
E13小鼠胚胎的空间染色质可及性作图
接下来,寻求通过染色质可及性从E13小鼠胚胎从头鉴定细胞类型。通过将读段聚集在小鼠基因组上的5千碱基区中,产生平铺像素矩阵。然后应用潜在语义索引(LSI)和均匀流形近似与投影(UMAP)进行降维和包埋,然后使用ArchR包进行Louvain聚类(Granja等人,2021年,Nature Genetics,第53卷:第403-411页)。无监督聚类鉴定了8个主要聚类,并且这些聚类的空间图揭示了与相邻H&E染色的组织切片中示出的组织学一致的独特模式(图97a至图97c、图98)。例如,聚类1表示小鼠胚胎的胎肝,并且聚类2特异于脊柱区域,包括背根神经节(图99a、图99b、图99i、图99j)。聚类3至聚类5与外周和中枢神经系统(PNS和CNS)相关联。聚类6包括存在于发育中的肢体中的几种细胞类型,并且聚类8包括几种发育中的内脏。为了对空间-ATAC-seq数据进行基准分析,使用UMAP变换函数将ENCODE器官特异性ATAC-seq数据投影到UMAP包埋上(Gorkin等人,2020年,Nature,第583卷:第744-751页)。通常,聚类鉴定与bulk ATAC-seq投影(图98b至图98d)匹配良好,并且区分E13小鼠胚胎中的所有主要发育组织和器官。此外,检查了细胞类型特异性标记物基因,并基于给定基因座的总体信号,从染色质可及性数据中估计了这些基因的表达(Granja等人,2021年,NatureGenetics,第53卷:第403-411页)(图97c、图98e、图98f)。Sptb在红细胞膜的稳定性中发挥作用,在肝脏中被广泛活化。Syt8在神经传递中很重要,在脊柱中具有高水平的基因活性。Ascl1在小鼠脑中示出强烈富集,已知其参与神经元和少突胶质细胞的定型和分化(图97c、图99e、图99f)。Sox10标记少突神经胶质祖细胞(OPC)。它在与脊髓相邻的背根神经节(DRG)中高水平表达(图99a、图99b)。Olig2是神经祖细胞、pre-OPC和OPC的标记物。Olig2在脊髓的小区域、前脑的腹侧区域和一些后侧区域中表达(脑干、中脑和后脑),这与空间ATAC-seq数据中的高基因评分一致(图99c、图99d)。然而,如通过原位杂交所检测的,其在前脑中的表达在该发育阶段被限制在背侧(图99c),但是染色质可及性在背侧和腹侧都是开放的,表明表观遗传引发的可能性。Ror2与软骨细胞和软骨的早期形成相关,并且在肢体中高度表达(Stelzer等人,2016年,Current Protocols in Bioinformatics,第54卷:1.30.31-31.30.33)。标记物基因的途径分析揭示,聚类1与红细胞分化相关联,聚类5对应于前脑发育,并且聚类6参与肢体发育,所有这些都与解剖注释一致(图100)。有趣的是,发现似乎是同质的聚类可进一步去卷积为具有不同空间分布的亚群(图98g)。例如,胎儿肝脏可进一步子集化为两个聚类,并且发现一些与造血作用相关的基因(例如Hbb-y、Slc4a1、Sptb)在亚聚类1中具有较高的表达(图98g)。此外,进一步研究了E13小鼠胚胎脊柱中的表达模式,并选择了沿前后轴示出表观遗传学梯度的基因(图101)。
除了推断细胞类型特异性标记物基因之外,该方法还使得能够无偏地鉴定细胞类型特异性染色质调控元件(图102),这提供了用于将调控元件定义为细胞类型特异性报道基因的资源。为了进一步利用潜在的染色质可及性数据,人们试图利用TF基序的偏差来检测每个聚类中的细胞类型特异性转录因子(TF)调节因子。研究发现在胎儿肝脏中更容易接近的峰中最富集的基序对应于Gata转录因子,与它们在红细胞分化中充分研究的作用一致(图102b、图102c)。富含支持其在CNS发育中的作用的Sox6基序的聚类5。标记后侧模式并在肢体形态发生中起作用的Hoxd11在肢体中富集(图102c)。
将空间ATAC-seq数据与scRNA-seq数据整合,以将细胞类型分配给每个聚类(Cao等人,2019年,Nature,第566卷:第496-502页)(图97d至图97f、图103a)。例如,在肝脏中专门富集了永久性红系细胞。另外,在该区域中发现很少的肝细胞和白细胞,这在E11数据中未鉴定,从而表明这些细胞类型是在后来的发育时间点出现的。在内脏区域鉴定到了中胚层,并且放射状胶质细胞主要分布在CNS中。精确聚类过程还使得能够鉴定具有不同空间分布、标记物基因和染色质调控元件的兴奋性神经元中的亚群(图103b至图103d)。在胚胎发育期间,染色质可及性随时间和空间的动态变化有助于调节复杂组织结构和终末分化细胞类型的形成(Stickels等人,2020年,Nature Biotechnology,doi:10.1038/s41587-020-0739-1)。在胚胎CNS中,放射状胶质细胞作为原代祖细胞或神经干细胞(NSC)发挥作用,其产生各种类型的神经元(Kriegstein等人,2009年,Annual Review of Neuroscience,第32卷:第149-184页)。因此,利用空间ATAC-seq数据来回收空间组织发育轨迹,并检查发育过程如何在组织空间上进行。此处,研究了从放射状胶质细胞到兴奋性神经元的发育过程的过程,其中将有丝分裂后早熟神经元作为放射状胶质细胞分化后的即时状态,并使用ArchR在伪时间内对这些细胞进行排序。每个像素的伪时间值的空间投影揭示了神经元中空间有组织的发育轨迹(图97g)。在整个发育过程中,基因表达和TF偏差发生了变化,并且许多回收的基因在神经元发育中很重要,包括中枢神经系统中干细胞维持所需的Sox2和参与控制模式形成和神经元回路形成的Ntng1(图97h、图97i)。
E11小鼠胚胎的空间染色质可及性作图和与E13比较以研究时空关系
为了在小鼠胎儿发育期间对染色质可及性进行作图,在E11时分析小鼠胚胎。无监督聚类鉴定具有不同空间模式的4个主要聚类,这与相邻H&E染色组织切片中的解剖结构示出良好一致(图104a至图104c、图105a至图105c)。聚类1位于胎儿肝脏和主动脉-性腺-中肾(AGM)中,其与胚胎造血有关。应当注意,空间ATAC-seq可分辨小鼠胚胎的精细结构,诸如AGM,从而示出了其以高空间分辨率方式分析染色质可及性的能力。聚类2和聚类3由与神经元发育相关联的组织诸如小鼠脑和神经管组成。聚类4包括胚胎面部突起、内脏和肢体。另外,聚类鉴定与UMAP包埋上的ENCODE器官特异性bulk ATAC-seq投影匹配(图105d)。
调查了区分每个聚类的染色质可及性模式(图104c、图105e、图105f)。例如,对于红细胞膜的正常柔韧性和稳定性以及正常红细胞形状所需的Slc4a1在肝脏和AGM中是高活性的。Nova2参与发育中神经元的特定子集中的RNA剪接或代谢调节,在脑和神经管中高度富集。Rarg在肢芽发育、骨骼生长和基质稳态中起着重要作用,在胚胎面部突起和肢体中被广泛活化(Stelzer等人,2016年,Current Protocols in Bioinformatics,第54卷:1.30.31-31.30.33)。此外,对每个聚类进行基因本体(GO)富集分析,并且GO途径鉴定了与解剖注释一致的发育过程(图106)。为了获得对每个组织中的调节因子的深入了解,对染色质调节元件进行聚类并富集TF结合基序,并检测这些基序的表达模式(图107)。在分别与胚胎造血和神经元发育相关联的聚类中观察到Gata2(图106b)和Ascl2(图107c)基序的强富集。这些主调节器进一步验证了每个聚类的唯一性。
为了将细胞类型分配给每个聚类,将空间ATAC-seq数据与小鼠胚胎的scRNA-seq图谱整合(Cao等人,2019年,Nature,第566卷:第496-502页),并鉴定了几种器官特异性细胞类型(图104d至图104f、图108)。原始红系细胞对于早期胚胎红系细胞发育至关重要,在肝脏和AGM中强富集,与解剖注释一致。在脑和神经管中发现放射状胶质细胞、有丝分裂后早熟神经元和抑制性神经元祖细胞。与E13相比,在E11小鼠胚胎中鉴定出更高比例的放射状胶质细胞,从而表明它们在CNS发育期间具有短暂的性质(Li等人,2008年,Glia,第56卷:第646-658页)。在胚胎面部隆突中观察到丰富的软骨细胞和成骨细胞,并且在肢体区域高度富集了肢体间充质。重建了E11小鼠胚胎中从放射状胶质细胞到兴奋性神经元的空间组织的神经元发育轨迹(图104g至图104j),并在该发育过程中鉴定了神经元发育相关基因和TF偏差的变化,包括在放射状胶质细胞中高度表达并在发育期间调节神经干细胞数量和功能的Notch1(Li等人,2008年,Glia,第56卷:第646-658页;Patten等人,2006年,TheJournal of Neuroscience,第26卷:第3102页)(图104h)。
为了更直接地评估发育期间染色质可及性的时间动力学,在胎儿肝脏和兴奋性神经元内鉴定了显示从E11到E13小鼠胚胎的可及性的显著变化的动态峰。在不同发育阶段之间,在胎儿肝脏和兴奋性神经元的染色质可及性中观察到显著差异(图104k至图104p)。特别地,E13时胎儿肝脏染色质可及性分析富含Gata基序序列(图104k、图104m),已知TF在红细胞分化中是重要的(Granja等人,2021年,Nature Genetics,第53卷:第403-411页)。另外,Egr1基序在E13时的兴奋性神经元中富集,这在脑发育期间具有功能暗示,特别是对于兴奋性神经元的说明(Yin等人,2020年,Computational and Structural BiotechnologyJournal,第18卷:第942-952页)。
人扁桃体和免疫细胞状态的空间染色质可及性作图
为了证明在不同组织类型和物种中分析空间染色质可及性的能力,然后将具有20μm像素大小的空间-ATAC-seq应用于人扁桃体组织。无监督聚类揭示了明显的空间特征,其中生发中心(GC)主要在聚类1中确定(图109a至图109c)。接下来,探索特定标记物基因的空间模式以区分细胞类型(图109d、图110),并与扁桃体中蛋白质表达的分布进行比较(图111)。对于B细胞相关基因,CD10(成熟GC B细胞的标记物)的可及性在GC区域富集。CD27是记忆B细胞的标记物,在GC和滤泡外区域具有活性。发现标记活化B细胞的CD38富含GC。CXCR4在GC暗区的中心母细胞中表达,出乎意料地仅在非GC细胞中示出高可及性。表观遗传状态和蛋白质表达之间的不一致可能表明在进入GC之前pre-GC B细胞的表观遗传引发。这也可能是由于CXCR4+T细胞在炎症32环境中支持卵泡外B细胞反应。PAX5是毛囊和记忆B细胞的转录因子,在GC中富集,但在记忆B细胞迁移到的毛囊外区也观察到。BHLHE40是一种鲜为人知的转录因子,可与IgH基因座的主要调控区域结合,发现其在卵泡外区域富集,但在GC中完全缺失,从而表明其在pre-GC状态下对类转换重组的调控中具有潜在作用。这支持了在GC响应形成之前发生的类转换重组的表观遗传控制模型。对于T细胞相关基因,CD3对应于T细胞区,并且也发现在GC中具有活性。已知滤泡辅助T细胞(TFH)运输到GC需要下调CCR7和上调CXCR5。在GC中观察到显著降低的CCR7可及性,而在GC外观察到强富集,从而表明该TFH功能实际上是表观遗传调节的。CXCR5可及性在GC中广泛检测到,但也在GC外观察到,从而表明在GC进入B细胞辅助之前TFH细胞可能存在早期表观遗传引发。TFH主转录因子BCL6的基因座可及性如预期的那样在GC中强富集。FOXP3,一种卵泡调节性T细胞(TFR)的主要转录因子,根据人蛋白质图谱数据,主要位于卵泡外区中,但频率低(图111)。有趣的是,它示出了广泛的开放基因座可及性,从而表明广泛的pre-GC T细胞的表观遗传引发,以潜在地发展平衡GC活性所需的TFR功能。CD25是调节性T细胞的表面标记物,在GC和滤泡外区都有活性。对于非淋巴细胞,CD11B(巨噬细胞标记物)在GC中无活性,相反CD11A在GC淋巴细胞中更有活性。CD103在GC滤泡树突细胞中富集。CD144编码血管内皮钙粘蛋白(VE-钙粘蛋白),对应于隐窝附近或滤泡之间的内皮微血管。CD32是参与吞噬作用和免疫复合物清除的表面受体,并且CD55是补体衰变加速因子,在同一区域都有活性,使得通过阻断膜攻击复合物的形成,可保护不应该被清除的细胞免受吞噬作用。在每个聚类中检查细胞类型特异性TF调节剂,并且数据揭示了KLF家族转录因子在非生发中心细胞中高度富集,与先前研究一致(King等人,2021年,bioRxiv,2021.2003.2016.435578)(图112)。
为了将细胞类型作图到每个聚类上,将空间-ATAC-seq数据与公众可获得的扁桃体scRNA-seq数据集(King等人,2021年,bioRxiv,2021.2003.2016.435578)整合。在对scRNA-seq数据进行无监督聚类和将标记转移到空间-ATAC-seq数据后,发现来自聚类0的细胞广泛分布在非GC区域,而来自聚类4的细胞富含GC(图109e、图109f、图113a)。鉴定了具有从聚类13富集的细胞的小区域(图109f、图113a)。为了确定scRNA-seq聚类的细胞标识,检查每个聚类的标记物基因,发现聚类0由幼稚B细胞组成,聚类4对应于GC B细胞,并且聚类13是巨噬细胞(图113b),与组织学一致(图109f)。
淋巴细胞的活化、成熟和分化受转录因子控制下的基因网络调节(King等人,2021年,bioRxiv,2021.2003.2016.435578)。为了理解动态调节过程,实施了B细胞活化对GC反应的伪时间重建(图109g至图109i)。同时,在该动态过程中,每个像素的伪时间值到空间坐标上的投影揭示了空间上不同的区域。有趣的是,发现富集的巨噬细胞群体与灭活的B细胞共定位,这与B细胞通过在GC进入或形成之前从抗原呈递巨噬细胞获得抗原而被活化的事实一致(Kleshchevnikov等人,2020年,bioRxiv,2020.2011.2015.378125)(图109g)。另外,B细胞活化的伪时间排序揭示了在进入GC状态之前的动态表达和染色质活性(图109h、图109i),包括BCL2的早期活性和与原初群体相比GC B细胞内可及性降低,表明如果GC B细胞没有被选择并通过存活信号拯救,则该抗凋亡分子可被主动抑制以确保GC B细胞通过凋亡而被消除。相反,LMO2在GC B细胞内的靶位点表现出增加的可及性,这与先前发现LMO2在GC中特异性上调一致(Cubedo等人,2012年,Blood,第119卷:第5478-5491页)。
实施例7:序列
表3:条形码序列
本文引用的每个专利、专利申请和出版物的公开全文以引用方式并入本文。尽管已经参考具体实施方案公开了本发明,但是显然,在不脱离本发明的真实精神和范围的情况下,本领域的其他技术人员可设计出本发明的其他实施方案和变型。所附权利要求书旨在被解释为包括所有这些实施方案和等效变型。

Claims (19)

1.一种方法,所述方法包括:
(a)将转座酶和接头衔接子序列递送到安放在基底上的组织样本中的目标区域;
(b)将第一组条形码化多核苷酸递送到所述目标区域,其中所述条形码化多核苷酸包含用于连接到所述接头衔接子序列的第一区域、用于空间条形码化的第二独特区域和用于连接到第二条形码的区域或通用连接接头的第三接头区域,其中所述第一组条形码化多核苷酸通过夹持到所述目标区域的第一微流体装置递送;
(c)将连接试剂递送到所述目标区域以将连接衔接子接合到所述第一组的所述条形码化多核苷酸;
(d)将第二组条形码化多核苷酸递送到所述目标区域,其中所述条形码化多核苷酸包含用于连接到第一条形码的所述接头区域或通用连接接头的第一区域、用于空间条形码化的第二独特区域和包含用于被DNA扩增用引物识别的序列的第三连接区域,其中所述第二组条形码化多核苷酸通过夹持到所述目标区域的第二微流体装置递送,其中所述第二微流体装置在所述目标区域上垂直于所述第一微流体装置的所述微通道的方向取向;
(e)将连接试剂递送到所述目标区域以将所述第一组的条形码化多核苷酸接合到所述第二组的条形码化多核苷酸;
(f)对所述目标区域进行成像以产生样本图像;
(g)将裂解缓冲液或变性试剂递送到所述目标区域以产生裂解或变性的组织样本;以及
(h)从所述裂解或变性的组织样本中提取DNA。
2.根据权利要求1所述的方法,所述方法还包括在递送所述转座酶和接头衔接子序列之前透化所述组织样本的步骤。
3.根据权利要求1所述的方法,其中步骤(a)包括将(i)特异性结合目标表观基因组标记物的一抗、(ii)二抗以及(iii)转座酶和接头衔接子序列递送到安放在基底上的组织样本中的所述目标区域。
4.根据权利要求3所述的方法,其中所述一抗选自完整抗体、Fab抗体片段、F(ab')2抗体片段、单特异性Fab2片段、双特异性Fab2片段、三特异性Fab3片段、单链可变片段(scFv)、双特异性双抗体、三特异性双抗体、scFv-Fc分子、纳米抗体和微型抗体。
5.根据权利要求3所述的方法,其中所述表观基因组标记物选自H2AK5ac、H2AK9ac、H2BK120ac、H2BK12ac、H2BK15ac、H2BK20ac、H2BK5ac、H2Bub、H3、H3ac、H3K14ac、H3K18ac、H3K23ac、H3K23me2、H3K27me1、H3K27me2、H3K36ac、H3K36me1、H3K36me2、H3K4ac、H3K56ac、H3K79me1、H3K79me3、H3K9acS10ph、H3K9me2、H3S10ph、H3T11ph、H4、H4ac、H4K12ac、H4K16ac、H4K5ac、H4K8ac、H4K91ac、H3F3A、H3K27me3、H3K36me3、H3K4me1、H3K79me2、H3K9me1、H3K9me2、H3K9me3、H4K20me1、H2AFZ、H3K27ac、H3K4me2、H3K4me3和H3K9ac。
6.根据前述权利要求中任一项所述的方法,其中所述方法还包括向所述生物样本递送连接接头序列,其中所述连接接头选自:
a)核酸分子,所述核酸分子包含与转座子相关联的所述连接衔接子的所述连接接头序列互补的序列和与所述第一组的所述条形码化多核苷酸的所述连接接头序列互补的序列;和
b)核酸分子,所述核酸分子包含与所述第一组的所述条形码化多核苷酸的所述连接接头序列互补的序列和与所述第二组的所述条形码化多核苷酸的所述连接接头序列互补的序列。
7.根据前述权利要求中任一项所述的方法,所述方法还包含步骤(i)对所述DNA进行测序以产生DNA读段。
8.根据权利要求7所述的方法,所述方法还包括通过将空间可寻址条形码化缀合物与对应测序读段匹配来构建所述组织切片的空间图。
9.根据权利要求8所述的方法,所述方法还包括通过将所述空间图与所述样本图像相关联来鉴定所述核酸的解剖位置。
10.根据前述权利要求中任一项所述的方法,其中安放在载玻片上的所述组织切片通过以下步骤产生:
将福尔马林固定石蜡包埋(FFPE)组织切片,任选地切成5μm至10μm的切片,并将所述组织切片安放在基底上,任选地是聚-L-赖氨酸涂层的载玻片;
向所述组织切片施加洗涤溶液,任选地是二甲苯溶液,以使所述组织切片脱蜡;
向所述组织切片施加再水合溶液以使所述组织切片再水合;
向所述组织切片施加酶溶液以透化所述组织切片;以及
将福尔马林施加到所述组织切片以对所述组织切片进行后固定。
11.根据前述权利要求中任一项所述的方法,其中所述第一微流体装置和/或所述第二微流体装置由聚二甲基硅氧烷(PDMS)制造。
12.根据前述权利要求中任一项所述的方法,其中所述第一微流体装置和/或所述第二微流体装置包括10至1000个微通道。
13.根据前述权利要求中任一项所述的方法,其中所述第一微流体装置和/或所述第二微流体装置包括蛇形微通道。
14.根据权利要求13所述的方法,所述方法还包括将第三组条形码化多核苷酸递送到所述目标区域,其中所述第三组条形码化多核苷酸被递送到特定区,使得每个区会区分所述第一条形码序列和所述第二条形码序列的特定重叠区域;其中所述第三组条形码化多核苷酸任选地通过夹持到所述基底的装置中的一组孔被直接递送到所述组织切片,其中每个孔被直接定位在所述第一条形码序列和所述第二条形码序列的重叠区上方。
15.根据前述权利要求中任一项所述的方法,其中所述第一组条形码化多核苷酸的递送是使用负压系统通过所述第一微流体装置递送的以及/或者所述第二组条形码化多核苷酸的递送是使用负压系统通过所述第二微流体装置递送的。
16.根据前述权利要求中任一项所述的方法,其中任选地通过夹持到所述基底的装置中的孔,所述裂解缓冲液或变性试剂被直接递送到所述组织切片,其中所述孔被直接定位在所述目标区域上方。
17.根据前述权利要求中任一项所述的方法,其中所述第一组条形码化多核苷酸和/或第二组条形码化多核苷酸包含至少10个条形码化多核苷酸。
18.根据前述权利要求中任一项所述的方法,其中所述成像是利用光学或荧光显微镜。
19.根据前述权利要求中任一项所述的方法,其中所述基底选自玻璃载玻片和塑料载玻片。
CN202180095057.2A 2020-12-31 2021-12-30 高空间分辨率表观基因组分析 Pending CN118103504A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063132659P 2020-12-31 2020-12-31
US63/132,659 2020-12-31
PCT/US2021/065669 WO2022147239A1 (en) 2020-12-31 2021-12-30 High-spatial-resolution epigenomic profiling

Publications (1)

Publication Number Publication Date
CN118103504A true CN118103504A (zh) 2024-05-28

Family

ID=82261111

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180095057.2A Pending CN118103504A (zh) 2020-12-31 2021-12-30 高空间分辨率表观基因组分析

Country Status (4)

Country Link
US (1) US20240279712A1 (zh)
EP (1) EP4271811A1 (zh)
CN (1) CN118103504A (zh)
WO (1) WO2022147239A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115386966B (zh) * 2022-10-26 2023-03-21 北京寻因生物科技有限公司 Dna表观修饰的建库方法、测序方法及其建库试剂盒
WO2024178273A1 (en) * 2023-02-24 2024-08-29 The Regents Of The University Of California Methods for epigenetic analysis

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3234192B1 (en) * 2014-12-19 2021-07-14 The Broad Institute, Inc. Unbiased identification of double-strand breaks and genomic rearrangement by genome-wide insert capture sequencing
KR102650753B1 (ko) * 2016-10-01 2024-03-26 버클리 라잇츠, 인크. 미세유체 장치에서 인 시츄 식별을 위한 dna 바코드 조성물 및 방법

Also Published As

Publication number Publication date
WO2022147239A1 (en) 2022-07-07
EP4271811A1 (en) 2023-11-08
WO2022147239A9 (en) 2022-09-09
US20240279712A1 (en) 2024-08-22

Similar Documents

Publication Publication Date Title
US11702693B2 (en) Methods for printing cells and generating arrays of barcoded cells
US20230340577A1 (en) Spatial transcriptomics for antigen-receptors
CN107208157B (zh) 用于条形编码核酸以用于测序的方法和组合物
JP6882453B2 (ja) 全ゲノムデジタル増幅方法
CN114787348A (zh) 用于空间组学测序的确定性条形码
EP4107282A1 (en) Capturing genetic targets using a hybridization approach
CN112041459A (zh) 核酸扩增方法
CA2905517A1 (en) Methods and compositions for tagging and analyzing samples
CN108424834A (zh) 用于高通量分析的微流控细胞捕获和分析设备
KR20120107521A (ko) T-세포 수용체 v/d/j 유전자 내의 반복 서열에 의한 클론 세포의 확인 방법
CN118103504A (zh) 高空间分辨率表观基因组分析
Ginsberg et al. RNA amplification in brain tissues
CN115461473A (zh) 空间分辨单细胞rna测序方法
JP2024088778A (ja) 患者層別化のための液滴単一細胞エピゲノムプロファイリングの使用
US20230227809A1 (en) Multiplex Chromatin Interaction Analysis with Single-Cell Chia-Drop
JPWO2018061674A1 (ja) 脊椎動物由来の単一細胞の塩基配列情報を取得する方法
CN113106160B (zh) 评估肝谱系细胞成熟度的标志物、双组学试剂盒及构建方法
WO2020218554A1 (ja) デジタル体細胞変異解析
US12071654B2 (en) Capture probe-based library normalization
US20240318236A1 (en) Capture Probe-Based Library Normalization
WO2002008453A2 (en) Canine toxicity genes
US12098417B2 (en) Spatial transcriptomics for antigen-receptors
US11352714B1 (en) Xseq
US20220145285A1 (en) Compartment-Free Single Cell Genetic Analysis
US20240271210A1 (en) Spatial nucleic acid analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination