CN117552114A

CN117552114A - 基于核酸适体测序的单细胞图谱分析

Info

Publication number: CN117552114A
Application number: CN202311275408.5A
Authority: CN
Inventors: 谭蔚泓; 邴涛; 武晓秋; 刘雨晴; 宋佳; 符婷; 吴芩
Original assignee: Institute Of Basic Medicine And Oncology Chinese Academy Of Sciences Preparatory
Current assignee: Institute Of Basic Medicine And Oncology Chinese Academy Of Sciences Preparatory
Priority date: 2023-09-28
Filing date: 2023-09-28
Publication date: 2024-02-13

Abstract

本发明公开了基于核酸适体测序的单细胞图谱分析，即HIMseq。此技术利用核酸适体代替抗体用以定量测定细胞表面分子的丰度，将此方法与目前表征细胞膜蛋白水平的金标准技术—流式细胞术进行了比较，发现核酸适体测序的结果与流式细胞仪的检测结果具有显著相关性，初步证明了用核酸适体测序表征细胞膜蛋白的可行性。进一步地，通过改造核酸适体使其与现有的单细胞转录组测序平台兼容，实现了细胞系和临床样本中转录组和表面膜蛋白组的同时数字化。通过实施单细胞HIM Apt‑seq(scHIM‑seq)，本发明比较了5‑氟尿嘧啶敏感和耐药性结肠癌细胞分别结合的核酸适体数量，发现了一种可能与5‑氟尿嘧啶耐药相关的干预靶点，值得一提的是这一靶点仅用转录组数据是无法发现的。

Description

基于核酸适体测序的单细胞图谱分析

技术领域

本发明属于生物化学领域，涉及生物材料尤其是核酸材料与单细胞材料的多组学分析。

背景技术

高通量测序技术的出现，已经在单细胞基因组学和转录组学领域引发了一次革命式的转变，基于单细胞的转录组测序可以揭示前所未有的细胞多样性。虽然RNA提供了关于细胞功能的重要见解，但是蛋白质才是细胞的主要功能分子。因此，对蛋白质组的无偏量化对于补充单细胞转录组学具有重要潜力，可以提供对不同细胞状态更全面的描述和表征。

尽管单细胞RNA测序取得了快速进展，但高通量蛋白质定量技术仍然滞后。这可能归因于蛋白质的低丰度以及单细胞内蛋白质修饰和动态性的高多样性。值得注意的是，与核酸不同，蛋白质无法被扩增放大。目前，各种基于抗体的技术，如流式细胞术和质谱流式细胞术，已用于检测单个细胞中的蛋白质。但这两种方法都受到荧光标记的光谱重叠限制(～17)，或者流式细胞术或质谱细胞术中稳定同位素的数量限制(～40)。另一方面，已经发展出抗体寡核苷酸技术来定量单个细胞的细胞表面蛋白质，诸如CITE-seq、REAP-seq和Ab-seq利用带有DNA条形码的抗体，与现有的单细胞RNA测序平台相结合，通过高通量测序在单细胞分辨率上同时进行表位和mRNA的分析。此外，DNA-抗体偶联物的制备妨碍了条形码抗体文库的可扩展和集成构建。此外，这些技术的高昂成本也限制了它们在科学研究中的应用。因此，迫切需要在单细胞分辨率下实现高通量蛋白质定量分析的低成本分子工具。

核酸适体，常被称为“化学抗体”，是新型的分子识别探针，可形成独特的三维构象，并对蛋白表位表现出特异性结合。Cell-SELEX技术利用活细胞有选择性地识别蛋白靶标的核酸适体，已经促使大量核酸适体的生成，在癌症诊断和治疗等生物医学研究中得到广泛应用。与通过费时费力的体内筛选获得的抗体不同，核酸适体可以通过高效地在体外数天内筛选获得。另外，核酸适体可以在无批次差异的情况下进行化学合成。相对于抗体(～150kDa)，具有相对较小(<20kDa)和较小空间位阻的核酸适体更有利于特异性结合细胞表面分子。值得注意的是，通过细胞-SELEX筛选获得地在其天然状态下能够识别细胞表面分子，包括翻译后的修饰蛋白、蛋白质复合物等。核酸适体从理论上可以检测微小的差异，例如，核酸适体可以特异地结合蛋白异源二聚体而不识别单体，而抗体无法对其进行区分。核酸适体的固有核酸序列可以通过高通量测序轻松测定，而无需偶联额外的DNA标签。因此，核酸适体的独特优势使其成为高通量细胞表面组蛋白质、多糖、不同修饰或聚集体的分子工具，具有极高的应用前景。

本发明我们对核酸适体序列进行了改造，利用高通测序测定与细胞结合的核酸适体数量和种类，从而使其在多细胞水平和单细胞水平实现细胞膜表面不同蛋白分子的检测。我们观察到测序数据与流式数据的阳性率结果之间的显著正相关性。这项技术与商业化的10xGenomics单细胞RNA测序平台兼容，并在同一样本中实现了mRNA和蛋白质检测，即使mRNA水平过低也能测量蛋白质丰度。此外，这种方法还能更深入地理解治疗干预的潜在机制。因此，通过利用高通量测序检测细胞结合的核酸适体来分析细胞膜分子的巨大潜力，HIM-seq成为了通过同时集成mRNA和蛋白质来表征细胞异质性和表型的创新工具。

发明内容

细胞膜蛋白参与调控细胞运动、物质运输、信号转导等重要生命过程，被广泛用作疾病精准诊断和药物靶向治疗领域。对转录组和蛋白组进行单细胞分辨率的同时检测，可以加深我们在单细胞水平基因层面和表型层面的理解和认识。目前，单细胞膜蛋白组学的测定主要依赖于抗体与寡核苷酸的偶联，结合高通量测序技术将蛋白质组的信息转化为可读取的核酸信息。然而，目前抗体-寡核苷酸偶联物的化学制备面临多项挑战，例如成本高、偶联效率低、偶联比例难控制等。此外，抗体较大的分子量引起的空间位阻可能会影响结果的准确判定。核酸适体是与抗体一样具有高亲和、高特异性结合靶标的识别探针，本文发展了一种基于核酸适体高通量测序的表征细胞膜蛋白的方法，即HIMseq。

本发明首先提供用于多组学分析的核酸适体库，所述库中核酸适体3’端和/或5’端连接捕获序列和通用引物。

在本发明的具体实施方式中，所述捕获序列不为Poly(A)；优选地，所述捕获序列与分子标签微珠或磁珠的相应片段互补以实现核酸适体的捕获。

在本发明的具体实施方式中，所述通用引物通过反转录或连接反应在核酸适体中引入UMI标签。

在本发明的具体实施方式中，所述核酸适体的结构为：通用引物-核酸适体序列-捕获序列(5’到3’)。

在本发明的具体实施方式中，所述核酸适体被荧光标记。

在本发明的具体实施方式中，所述核酸适体靶点已知。

在本发明的具体实施方式中，所述核酸适体库中的核酸适体是通过Cell-SELEX方法获得。

在本发明的具体实施方式中，所述核酸适体通过高级别浆液性卵巢癌细胞系OVCAR4作为靶细胞，低级别浆液性卵巢癌细胞系A2780作为阴性细胞，进行筛选获得。

在本发明的具体实施方式中，所述筛选为16轮。

在本发明的具体实施方式中，通过筛选获得包含5000个核酸适体的库。

在本发明的具体实施方式中，所述核酸适体的靶点包括：PD-L1(CD274)、CD71、CD318、PTPRF、PTK-7、SELL、TFRC、CD274、MET、ITGA3、EPCAM、CD109、AREG、PNRP、L1CAM、EGFR、CD24、TFIP11、CDCP1。

在本发明的具体实施方式中，所述核酸适体的序列为：

本发明第二方面提供对生物样品进行多组学分析的方法，所述方法包括：

1)生物样品与本发明第一方面的核酸适体库接触；

2)与生物样品结合的核酸适体连接UMI；

3)对生物样品进行转录组和核酸适体库的高通量测序；

4)对测序数据进行分析。

在本发明的具体实施例方式中，所述生物样品为来自临床样本或细胞系的单细胞悬浮液。

在本发明的具体实施例方式中，细胞与核酸适体孵育后，通过流式细胞仪进行分选。

在本发明的具体实施例方式中，所述高通量测序基于10X平台进行。

在本发明的具体实施例方式中，步骤2)中使用包含双抓手序列的珠子，其中一个抓手序列聚(dT)捕获mRNA，另一抓手序列通过与上述捕获序列配对捕获和引导核酸适体。

在本发明的具体实施例方式中，所述测序数据中核酸适体库的测序结果代表细胞表面蛋白/膜蛋白的表达水平。

本发明第三方面提供第一方面核酸适体库或第二方面方法的应用，包括：

1)用于细胞聚类或分型；

2)用于细胞因子分析；

3)用于鉴定药物靶点或筛选药物；

4)用于细胞膜蛋白表达量分析。

本发明第四方面提供用于多组学分析核酸适体构建体库，所述核酸适体构建体的结构为3’端和/或5’端连接有捕获序列和UMI的核酸适体。

在本发明的具体实施方式中，所述核酸适体如本发明第一方面所述。

本发明第五方面提供一种多组学分析的试剂盒或试剂组合，所述试剂盒包含上述的核酸适体库。

优选地，所述试剂盒或试剂组合还包括测序试剂；

进一步优选地，所述测序试剂包括具有双抓手序列的珠子，其中一个抓手序列聚(dT)捕获mRNA，另一抓手序列通过与所述捕获序列配对捕获和引导核酸适体。

有益的技术效果

本发明发展了基于核酸适体测序的单细胞双组学研究，由于其易化学制备的优势，在同时表征转录组和细胞膜蛋白组方面以及将来适配于更多组学的联合研究中具有巨大潜力，未来可广泛应用于药物发现与生物机制研究领域。

附图说明

以下附图构成本说明书的一部分，并且被包括在内以进一步说明本公开的某些方面，通过参考这些附图中的一个或多个并结合本文给出的特定实施方案的详细描述可以更好地理解这些方面。

图1.HIMseq原理示意图。(a)来自临床样本或细胞系的单细胞悬浮液与经过捕获序列修饰的核酸适体孵育，1,000个细胞-核酸适体复合物通过流式细胞术进行分选，然后与UMI文库进行DNA连接。(b)核酸适体经过捕获序列修饰以适应商用的10x Genomics单细胞平台。

图2.在多细胞水平上核酸适体能够定量地表征细胞膜蛋白。(a)通过流式细胞术，使用特异核酸适体分析了五种细胞系上四种蛋白的表达情况。利用阳性率结果绘制了热图。(b)高通量测序技术评估了核酸适体在五种细胞系中与目标蛋白的结合拷贝数。(c)HIMseq数据与流式细胞术数据之间的Spearman秩相关系数，结果显示HIMseq与流式细胞术在定性上是显著正相关的。(d)每种细胞系展示出一种独特的类似条形码的图案，核酸适体探针包中核酸适体在分子级别对细胞膜表面分子进行分析具有高潜力。

图3.HIMseq不影响转录组测定。(a)分析未经处理的CCRF-CEM细胞或经Sgc8核酸适体或结合缓冲液处理的CCRF-CEM细胞的转录组。将前4000个最高表达的基因在未经处理的细胞和经Sgc8核酸适体处理或缓冲液处理的细胞之间进行了比较。显著的高相关性(R＝0.98,p<2.2e-16)表明核酸适体不影响转录组。(b)类似地，缓冲液处理和未经处理的细胞之间的高相关性表明缓冲液不影响mRNA基因表达。(c)基于转录组对CCRF-CEM细胞(未经处理、缓冲液处理、Sgc8核酸适体处理)进行聚类，聚类结果高度重叠。(d)小提琴图显示未经处理、缓冲液处理或核酸适体处理的细胞基因表达在低表达和高表达基因中是高度匹配的。

图4.scHIMseq在单细胞水平上定性和定量上与流式细胞术匹配。(a)Apt-seq与商用单细胞平台(10x Genomics)完全兼容，可以同时测量细胞表面蛋白和转录本。(b)通过单细胞测序，CCRF-CEM中的PTK7的mRNA表达水平高于3AO。(c)通过流式细胞术测得的Sgc8水平的合并直方图。(d)通过HIMseq测得的Sgc8水平的合并直方图。(e)在PTK7阳性CCRF-CEM细胞系中，Sgc8的密度逐渐增加，直至饱和。(f)使用单细胞测序数据测得的表观平衡解离常数(Kd)。(g)即使浓度增加，Sgc8与3AO之间未检测到增加的结合。

图5.scHIMseq能够在临床血液肿瘤标本中实现不同细胞的区分。(a)通过组合APT-seq和scRNA-seq对临床肿瘤标本进行分析的实验设计示意图。(b)基于转录组的卵巢癌组织APT-seq单细胞表达谱的聚类，揭示出不同的细胞群体。(c)簇级别上归一化mRNA表达与CLR转换后的核酸适体计数之间的相关性。在计算Pearson相关系数之前，mRNA和APT信号在簇内进行了平均。(d)从图b的UMAP图上投影的APT-seq核酸适体面板上的mRNA(绿色)和相应的APT(蓝色)信号。(e)点图显示了每个细胞中对应靶标蛋白的核酸适体计数与mRNA表达水平之间的相关性，由单细胞测序测得。(f)从图b的UMAP图上投影的CD274 mRNA(绿色)和PD-L1核酸适体(蓝色)信号。

图6.scHIMseq对临床实体肿瘤标本的细胞表面分子多重特性描述。(a)通过组合的APT-seq和scRNA-seq对临床肿瘤标本进行表征的实验设计示意图。EC：上皮细胞；MSC：间充质干细胞；FB：成纤维细胞。(b)转录组学为基础的APT-seq单细胞表达谱聚类显示卵巢癌组织的不同细胞群体。(c)在簇水平上，归一化mRNA表达与CLR转化的ADT计数之间的相关性。在计算Pearson相关系数之前，mRNA和APT信号在簇内平均。(d)对上皮细胞的scHIMApt-seq单细胞核酸适体谱进行了重新聚类，结果得到7个亚群。(e)来自(d)中的7个细胞群体中13个核酸适体水平。

图7.HIM-seq发现潜在治疗靶点的能力。(a)小提琴图显示HCT-8或HCT-8-5FU细胞中CD71和CDCP1蛋白的表达分布。每个点代表一个单独的细胞，表达水平经过对数转换。(b)直方图显示使用流式细胞术进一步验证了CD71和CDCP1蛋白的表达，使用抗体进行验证。(c)火山图显示HCT-8和HCT-8-5-FU细胞之间差异基因表达。(d)火山图显示HCT-8和HCT-8-5-FU细胞之间差异蛋白表达。(e)siNC和siPD-L1 HCT-8细胞在5-FU处理下的生长曲线。

图8.核酸适体与抗体结合细胞情况。分别将针对CD71的抗体和核酸适体分别与六种不同的细胞系孵育(a，b)；(c)核酸适体和抗体的平均荧光强度之间存在显著的相关性。

图9.针对OVCAR-4细胞的富集核酸适体探针组。(a)5个富集的DNA文库与阴性细胞系A2780的结合，在R16中观察到很少的富集。(b)5个富集的DNA文库与目标细胞系OVCAR4的结合，R16文库在OVCAR4细胞上具有较高的结合能力。

图10.PolyA对一些核酸适体与细胞的结合能力的影响。(a)CD109核酸适体带或不带PolyA与CEM细胞的结合情况。PolyA尾巴可能增加CD109核酸适体与CEM细胞的非特异性结合。(b)C-Kit核酸适体带或不带PolyA与CEM细胞的结合情况。PolyA尾巴可能降低C-Kit核酸适体与CEM细胞的结合。(c)PTK7核酸适体带或PolyA与CEM细胞的结合情况。PolyA对CD109核酸适体与CEM细胞的结合影响较小。

图11.捕获序列对核酸适体与靶细胞结合的影响。(a)含有或不含有捕获序列的Sgc8核酸适体合成，并通过流式细胞术验证结合情况。(b)部分互补和完全互补的DNA链被用于检测捕获序列对Sgc3b和XQ-3b结合效应的影响。3/5P代表与3'/5'端捕获序列部分互补的DNA序列。3/5F代表与3'/5'端捕获序列完全互补的DNA序列。

图12.通过流式细胞术测定的解离平衡常数。(a)Sgc8核酸适体与PTK7阳性CEM细胞的流式细胞术结合情况。(b)解离平衡常数(Kd)为26.74nM。(c)Sgc8核酸适体与PTK7阴性3AO细胞的流式细胞术结合情况。

图13.基于核酸适体测序拷贝数的上皮细胞聚类。(a)使用模块性优化对上皮细胞进行了单细胞核酸适体分析聚类，得到了7个具有不同核酸适体组合的细胞群体。(b)在由核酸适体水平定义的聚类中，13种标记物的核酸适体水平。核酸适体水平由蓝色到深蓝色进行了标注。

图14.亲本细胞和耐药细胞显示出不同的核酸适体结合模式。(左)HCT-8细胞中15种核酸适体的结合情况；(右)HCT-8-5FU细胞中15种核酸适体的结合情况。

图15.小提琴图显示HCT-8或HCT-8-5FU细胞中蛋白质和mRNA的表达分布。通过使用scHIM Apt-seq，低RNA表达者显示高蛋白质水平。

具体实施方式

1.材料与实验方法

1.1细胞培养

人类细胞系CCRF-CEM(ATCC)、3AO(Mingzhou Bio，宁波)和HCT-8(ATCC)按照标准程序在含有10％胎牛血清(FBS，Gibco)和100单位/毫升青霉素-链霉素(PS)RPMI-1640培养基(Thermo Fisher，美国)，在37℃和5％ CO2的条件下培养。5-氟尿嘧啶耐药型HCT-8细胞(HCT-8-5FU)在含有10％ FBS、100单位/毫升PS和6微克/毫升5-氟尿嘧啶的RPMI-1640培养基中培养。对于Sgc8核酸适体滴定实验，CCRF-CEM或3AO细胞与6个不同浓度的核酸适体孵育，并以相等的比例混合后进行单细胞HIMseq。

1.2临床样本的单细胞制备

从卵巢癌组织制备单细胞悬浮液(取自浙江癌症医院，已签订知情同意书)制备如下：从患者的卵巢中分离出新鲜的卵巢癌组织，且在分离后保持在冰上；然后使用手术刀将组织切成小块，并在震动37℃水浴中使用酶试剂(含0.2毫克/毫升的胶原酶IV(Sigma-Aldrich)，2毫克/毫升的分散酶和0.002毫克/毫升的DNase I(Thermo FisherScientific))酶解30分钟。用含有10％ FBS的DMEM/F12培养基停止消化，然后300X g离心10分钟以获得细胞沉淀物。将细胞在含有2％ FBS和1％ PS的D-PBS中洗涤一次，然后利用70μm细胞过滤器(Corning，美国)过滤，离心10分钟，细胞沉淀物通过含有10％ FBS，1％PS和1％非必需氨基酸的DMEM/F12培养基重悬、过夜培养。

髓瘤骨髓样本(获患者知情同意)加入红细胞裂解液，在室温下处理10分钟去除红细胞。然后使用洗涤缓冲液(D-PBS中含有4.5g/L葡萄糖和5mM氯化镁)洗涤细胞，并利用70μm的细胞过滤器(VWR，美国)过滤，计数，然后用于后续实验。

1.3流式细胞术分析实验

为了分析核酸适体的结合能力，不同类型的细胞(5x 10⁵个)在100μL结合缓冲液中与200nM核酸适体在4℃下孵育30分钟。孵育后，每个细胞样品用200μL洗涤缓冲液洗涤3次，然后用300μL结合缓冲液中重新悬浮，用流式细胞术分析(CytoFLEX流式细胞术仪)。所有结合分的实验都重复了三次。根据几何均值荧光强度计算阳性率，并使用GraphPadPrism软件(Jandel Scientific)进行分析。为了测量核酸适体与靶细胞的平衡解离常数(Kd)，细胞(5x 10⁵个)与不同浓度的核酸适体(5nM、25nM、50nM、100nM、200nM和500nM)孵育。不同核酸适体的Kd通过拟合细胞/aptamer复合物的荧光强度与核酸适体浓度的关系来确定，其方程式为Y＝B_max X/(Kd+X)。对于抗体分析，根据使用推荐浓度在4℃孵育与细胞(5x 105个)孵育30分钟。

1.4HIMseq实验中的细胞染色

本工作中使用的所有序列均由上海生工合成。首先，将核酸适体稀释到5μM的D-PBS中，在95℃加热5分钟，然后在冰上冷却以供进一步使用。将大约1.0x 10⁶来自细胞系或临床样本的细胞在冷冻结合缓冲液(D-PBS中含有4.5g/L葡萄糖、5mM氯化镁、0.1mg/mL酵母tRNA和1mg/mL牛血清蛋白)中重新悬浮，以阻止非特异性aptamer结合。随后，将细胞与核酸适体混合，在4℃孵育30分钟。

为了评估结合缓冲液和核酸适体对mRNA测序的影响，我们将CCRF-CEM细胞与结合缓冲液或Sgc8核酸适体在冰上孵育30分钟，然后进行RNA-seq。将未处理的CCRF-CEM细胞用作阴性对照。然后，在未处理的CCRF-CEM和缓冲液处理或Sgc8核酸适体处理的CCRF-CEM细胞之间比较了前4000个最高表达的基因。

为了评估HIM Apt-seq在临床样本中的高灵敏度，我们从一个被诊断为多发性骨髓瘤的患者那里获得了一个骨髓样本。去除血细胞后，在室温用红细胞溶解缓冲液处理样本10分钟，然后用洗涤液(D-PBS中含有4.5g/L葡萄糖和5mM氯化镁)洗涤细胞，然后通过70μm细胞过滤器(VWR，美国)过滤，计数，然后用于后续实验。

卵巢癌组织的单细胞悬浮液去除死细胞和悬浮细胞群体后，使用无酶细胞解离溶液去除粘附细胞，加入13个不同的核酸适体冰上孵育30分钟，洗涤两次后进行Apt-seq和RNA-seq。

将敏感HCT-8细胞(1*10⁶个)和5-FU耐药细胞(1*10⁶个)用无酶细胞解离溶液分离后，分别加入15个核酸适体孵育，然后在冰上孵育30分钟。洗涤2次后，将两个样品重悬，用于单细胞测序。

1.5HIM Apt-seq在多细胞水平的分析

为了将核酸适体用于细胞表面蛋白定量分析，高通量测序之前，需将结合细胞的核酸适体序列与唯一分子标识符(UMI)DNA库连接在一起。首先，在100uL结合缓冲液中，将4个核酸适体混合物分别与5种细胞系孵育30分钟。孵育后，洗涤三次，利用流式细胞仪器(BDFACS Aria III)，将1,000个细胞分选到一个PCR管中。然后，收集的细胞在95℃下加热10分钟，冷却将所有的核酸适体序列都标记一个唯一的UMI分子。具体如下：将2μL 2μM CBLK3、2μL 2μM UMI库和2μL 1/10XT4 DNA连接酶缓冲液加入到收集的细胞后，在95℃下加热3分钟，然后在55℃下加热3分钟，并在室温孵育10分钟。然后向连接复合物中加入2.5μL 10xT4DNA缓冲液，充分混合后在室温孵育20分钟，在此期间每5分钟混合一次复合物。然后加入1μL T4 DNA连接酶，室温孵育30分钟，在此期间每5分钟混合一次。最后，在65℃下10分钟灭活酶活性。然后将复合物经过PCR(前30s在95℃、30s在57℃和30s在72℃，随后5min在72℃)扩增10个循环，使用SELEX库的正向引物和UMI库的反向引物作为模板。然后将第二个PCR扩增的产物用作另一次扩增(15个循环，每10μL反应样本中使用1μL PCR产物)。第二个PCR扩增的产物使用Illumina MiSeq(Repugene Technology Co.Ltd.杭州，中国)进行高通量测序。最后，利用每个核酸适体与不同细胞系结合的拷贝数通过计算UMI类型来确定核酸适体的个数，进而反应其靶标蛋白分子的量。

1.6基于核酸适体探针包的细胞分型

将200nM的R16文库在95℃下变性5分钟，然后冰上10分钟。在4℃，3X 10⁵个13种不同细胞分别与R16文库孵育30分钟。经过3次洗涤后，细胞用流式细胞仪(BD FACS AriaIII)分选1000个。然后将收集的细胞在95℃下加热10分钟，分别加入2μL的2μM CBLK3、2μL的2μM UMI文库和2μL的1/10x T4 DNA连接酶缓冲液。连接条件与上述相同，PCR产物也使用10％变性SDS-PAGE分离并进行高通量测序，数据通过生物信息学分析进行分析。简而言之，我们根据细胞条形码鉴定了13种细胞类型，然后计算了每种细胞系中不同核酸适体的拷贝数。然后用差分进化算法来比较测序数据，使用GraphPad Prism软件(Jandel Scientific)制作拷贝数的热图。

1.7scHIMseq对细胞RNA-seq的影响实验

使用Countess II自动细胞计数器(ThermoFisher)测量细胞数目和活力，将3X10⁶个CCRF-CEM细胞分成三组，其中一组在冰上保存以供进一步使用。另外两组分别在冰上与结合缓冲液或Sgc8核酸适体孵育30分钟。然后，这三个样本分别应用于BGI单细胞测序平台中的cDNA和寡核苷酸文库构建，根据制造商的说明进行操作。

1.8基于10x平台的scHIMseq

使用Chromium Next GEM Single Cell 3’试剂盒v3.1(双索引)在10x平台上同时对细胞表面膜核酸适体组和转录组进行分析。将与核酸适体孵育的细胞加载到ChromiumController(10x Genomics)中，每个通道定位10,000个细胞。使用Chromium Next GEMSingle Cell 3’试剂盒v3.1(双索引)(10x Genomics)根据说明书处理样本。简而言之，核酸适体与细胞孵育并洗涤后，将细胞封装到液滴中。然后，mRNA反转录寡核苷酸杂交与核酸适体被编入细胞条码。根据大小进一步选择cDNA和核酸适体产物。核酸适体和cDNA文库被合并在HiSeq2500Rapid Run上进行测序(Illumina，美国)。

1.9单细胞RNA测序分选

使用Cell Ranger v7.0.0(10x Genomics)以特征条形码模式对原始测序数据进行比对、过滤和唯一分子标识符(UMI)计数。在Cell Ranger的配置文件中，库类型为“基因表达”，参考为从10x Genomics官方网站获得的人类GRCh38基因组数据集。DecontXv1.12.0从基因表达矩阵中去除了环境RNA和双峰。使用Seurat v4.3.0对数据进行过滤、标准化、降维和聚类。保留线粒体读数率>0.5％和<25％且表达了>1500个基因的高质量细胞用于后续分析。每个细胞的基因表达计数被除以该细胞的总计数，然后乘以1x 10⁴，并进行对数转换。选择了具有最高基因表达方差的前2000个高变量基因。每个基因的基因表达归一化计数被缩放和居中。主成分分析(PCA)以缩放的高变量基因计数为输入，降低数据的维数。计算了K最近邻，构建了共享最近邻(SNN)图，然后使用原始Louvain算法确定了细胞簇。使用前10个主成分来展示结果簇的均匀流形逼近和投影(UMAP)嵌入。使用cell typistv1.3.0和“Immune_All_Low.pkl”模型进行细胞类型注释。

1.10单细胞核酸适体测序分析

使用Cell Ranger v7.0.0(10x Genomics)以特征条形码模式对原始测序数据进行比对、过滤和唯一分子标识符(UMI)计数。在Cell Ranger的配置文件中，库类型为“Aptamer Capture”，测序读数与核酸适体的参考库对齐。使用通过单细胞RNA数据选择的高质量细胞。使用Seurat v4.3.0进行数据标准化。核酸适体计数应用于跨中心对数比变换，然后进行缩放和居中。PCA以缩放的核酸适体计数为输入，降低数据的维数。

1.11单细胞RNA测序数据与核酸适体数据比较

为了比较单细胞核酸适体和转录组表达，将mRNA和核酸适体单细胞表达数据投影到UMAP图中保留的聚类结构上。对于每个核酸适体靶基因，在所有细胞中计算mRNA和核酸适体数据的Pearson相关系数。

1.12siRNA实验

从GenePharma(上海)购买的PD-L1 siRNA寡核苷酸使用RNAiMAX试剂(Invitrogen)转染到指示的寡核苷酸中。转染48小时后，细胞被分装到96孔板中，然后与梯度浓度的5-氟尿嘧啶孵育。处理后，通过CCK-8确定存活细胞的数量。数据以相对于未处理细胞的增长百分比表示。

1.13统计分析

在相同实验中，各组之间的差异的统计显著性由标准偏差(SD)和多重比较的Student's t检验来确定。当P值<0.05时，认为统计显著。所有实验至少重复两次以确认可重复性。所有数据显示为平均值±SD。

2.技术术语

10X测序平台

10x Genomics平台基于微流控技术分选单个细胞，将带有barcode标签的凝胶珠与细胞或细胞核、酶以及分液油混合，产生成千上万个单细胞乳液微滴，每个微滴都作为单独的反应体系，凝胶珠在其中溶解，捕获每个细胞的目标分子，添加barcode并扩增。这样来自同一细胞或细胞核的所有片段都共享一种10x barcode。将成千上万个细胞的带有barcode的产物混合，进行下游反应，从而产生与短读长测序仪兼容的文库。

10x Genomics平台还会在扩增时，在每个目标分子上添加唯一标识分子(UMI)标签。

在本发明优选的实施例中，使用包含了两个抓手的凝胶珠，以分别捕获转录组目标分子和核酸适体分子，所述的两个抓手一个是捕获转录组分子的polyT，另一个是不为polyT的寡核酸序列，与核酸适体分子连接的捕获序列互补。

分子标签微珠或磁珠

在单细胞测序技术中，无论微流控芯片技术还是微孔板技术，都会使用微珠或磁珠捕获细胞的裂解后的核酸如mRNA，磁珠和微珠表面固定有捕获核酸的抓手序列，以及通过延伸或扩增反应引入UMI或其他功能序列的片段。

唯一标识分子(UMI)标签

唯一分子标记(UMI)是一种分子条形码，可以在测序过程中错误校正，提高准确性。

这些分子条形码均为短序列，可特异性的标记样本文库中的每个分子。UMI可用于各种测序应用，许多是与DNA和cDNA的PCR重复相关的应用。RNA-seq基因表达分析和其他定量测序方法也可以采用UMI来去除重复。

Cell-SELEX

SELEX技术是一种体外指数富集配体的系统进化的组合化学技术，能够有效地用于核酸结构分析与功能研究，其原理为：人工化学合成一个文库容量为10¹⁴-10¹⁵的随机寡核苷酸文库，其总长度一般为70-100nt，中间包含20-40nt的随机序列。文库与靶标物质孵育一定时间后形成核酸-靶标的复合物，利用一定的方法除去未与靶标结合的文库序列，复合物热解离获得与靶标结合的序列，并以此为模板进行PCR扩增，进而制备下一级文库。经过8-20轮不断筛选获得对靶标具有高特异性与高亲和力的寡核苷酸序列，即核酸适体。

细胞SELEX(Cell-SELEX)技术，该方法的主要靶标物质是细胞、细菌或病毒等，操作过程中采用离心、沉淀的方法分离去除未结合适配体，再通过热解离或酶切作用获得特异性适配体序列。

基于分子身份证的SELEX方法

本申请发明人发展了基于分子身份证的SELEX方法(申请号：202211085986.8，该申请的全文通过引用的方式结合于本发明中。)，本申请优选使用基于该方法获得的核酸适体。

一个典型的基于分子身份证的核酸适体筛选及甄别方法包括如下步骤：通过DNA连接法或者延伸法在筛选或富集获得的核酸适体文库上标记独特的分子身份证，基于分子身份证定量实现核酸适体的筛选和甄别，并可以利用筛选获得的核酸适体探针包绘制靶细胞的膜蛋白数字化图谱，所述筛选或富集获得核酸适体文库为单轮筛选，或者寡轮筛选。

所述寡轮筛选为少于20轮，优选少于10轮，最优选少于5轮。

优选地，的核酸适体筛选方法可以实现单轮筛选。

优选地，在上述的方法中，所述分子身份证标签的连接策略包括由连接子介导的T4连接酶连接法、或由互补链介导的聚合酶延伸法。

优选地，互补链介导的聚合酶延伸法可通过Chromium Next GEM Single Cell 3′Reagent Kits v3.1试剂盒实现。

优选地，所述连接策略为连接子介导的T4连接酶连接法，包含与连接子连接部分、用于标记分子或者实验的分子标签部分、用于分子计数的随机序列部分、以及用于文库扩增的引物部分。

基于分子身份证的SELEX方法具体包括以下步骤：

1)筛选文库和分子身份证文库设计；

2)单轮筛选或者寡轮筛选、富集文库扩增及制备单链文库；

3)单链文库与靶标孵育并与分子身份证文库连接或延伸；

4)偶联分子身份证的核酸文库扩增；

5)高通量测序并根据分子身份证定量获得候选序列。

优选地，所述核酸适体的靶标为肿瘤细胞、蛋白或动物活体。

实施例

实施例1：HIMseq测序设计原理

为了证明核酸适体在膜蛋白质定量分析中的可行性，我们通过流式细胞术，在不同癌细胞系中比较了XQ-1核酸适体和抗CD71抗体结合相关性(图8a，图9b)。研究结果表明，核酸适体和抗体结合之间存在显著的正相关关系(R2＝0.9632，p<0.0005)(图8c)，从而证实了核酸适体在细胞表面蛋白质分析中的潜力。与需要额外修饰寡核苷酸的抗体不同，核酸适体可以直接用于测序。因此，与高通量测序(HTS)技术结合，核酸适体在细胞表面蛋白质的高通量测定方面具有显著的潜力。

为此，我们设计了通过高通测序技术可以数字化映射细胞表面分子的方法，该方法中核酸适体分子包括通用的PCR引物和捕获序列。为量化结合到细胞表面核酸适体的数量，我们将细胞-核酸适体复合物与分子身份证标签文库结合，该标签文库包含一个5'端的正向引物和一个用于细胞条形码的唯一标识分子(UMI)标签。无论其数量如何，只要共享相同的UMI，该序列将被视为一个序列。这种方法有效地减轻了PCR偏差的影响(图1a)。此外，为了实现转录组和适体组学的同时单细胞测序，我们选择了一种新型的10x Genomics试剂盒，其中包括用于构建基因表达和细胞表面蛋白质文库的双抓手序列。除了聚(dT)可以从聚腺苷酸化的mRNA产生带条形码的全长cDNA外，这些珠子还包含一个额外的引物序列，用于捕获和引导核酸适体。进一步评估了添加序列对核酸适体结合的影响，结果显示捕获序列对核酸适体与靶细胞结合没有明显影响(附图11)。10x Genomics RNA测序平台利用微流控技术通过单细胞凝胶珠来分离单个细胞。基于液滴的mRNA和核酸适体的捕获使得每个寡核苷酸都能进行细胞特异性条形码化。在回收珠子后，RNA和核酸适体测序文库可以按大小分离并独立扩增。核酸适体组学的寡核苷酸成分在测序过程中保留，从而直接反映检测到的蛋白质。

本实施例使用的核酸适体如下：

实施例2：核酸适体与高通量测序相结合实现细胞表面组学高通量测定能力

为了评估HIM Apt-seq蛋白质检测的定量特性和灵敏度，我们选择了四个已知靶蛋白的核酸适体：XQ-1、XQ-3、XQ-7、XQ-13，分别靶向CD71、CD318、PTPRF和PTK-7。为了定量这些膜蛋白，我们将过饱和核酸适体分别与OVCAR-4、A2780、ES-2、SKOV3和3AO在冰上孵育30分钟。然后，使用流式细胞仪器(FACS)对1,000个细胞-核酸适体复合物进行分选，以便进行带UMI文库的DNA连接(图2a)。连接产物经过HIM Apt-seq进行测序和分析(图2b)。结果显示，从HIM Apt-seq获得的核酸适体拷贝数与流式细胞术的阳性率在定性正相关，具有较高的Spearman秩相关系数(r＝0.93，p<0.0001)(图2c)。

接下来，我们旨在通过利用经过多轮进化获得的富集核酸适体文库，也称为核酸适体探针包，来开展高通量、多参数的方法，以全面表征膜蛋白。每个核酸适体探针包含数万个核酸适体候选物，非常适合用于细胞膜表面分子的分析。为了针对高级别浆液性卵巢癌细胞膜蛋白选择特异核酸适体，我们以高级别浆液性卵巢癌细胞系OVCAR4作为靶细胞，低级别浆液性卵巢癌细胞系A2780作为阴性细胞，进行了16轮进化，获得了一个高度富集的核酸适体探针包(图9)。将这个高度富集的核酸适体探针包与四种类型的癌症中的13种不同细胞进行孵育，以对细胞膜进行分析。根据不同的比较分析算法，从这个富集文库中存在的9754个核酸适体候选物中，选择了500个核酸适体对13种细胞系进行分析。使用HIM Apt-seq定量分析核酸适体与这13种细胞系的结合情况，数据显示不同的癌细胞对这些核酸适体有着不同的结合模式(图2d)，表明核酸适体探针包中的核酸适体具有对细胞膜表面分子进行定量分析的潜力；另外由于核酸适体易于标记荧光分子且保持原有的选择性和亲和力，因此，该方法亦可直接分选后进行单细胞测序。

本实施例使用的核酸适体如下：

实施例3：核酸适体组与转录组学兼容情况

为了进一步评估HIMseq是否能够与转录组测序兼容，并且在单细胞水平上同时对mRNA和蛋白质进行分析，我们首先验证核酸适体或缓冲液孵育对mRNA测序的影响情况。为此，我们分别将CCRF-CEM细胞与Sgc8核酸适体、结合缓冲液孵育，然后将经过Sgc8核酸适体孵育、结合缓冲液孵育以及未经处理的CCRF-CEM细胞的转录组进行比较。我们比较了未经处理的细胞和经过Sgc8核酸适体处理或缓冲液处理的细胞中前4000个最高表达的基因。我们观察到CCRF-CEM细胞与经过Sgc8核酸适体处理的细胞之间的标准化基因表达高度相关(R＝0.98,p<2.2e-16)(图3a)。类似的结果也在经过缓冲液处理的CCRF-CEM细胞和未经处理的细胞之间找到(图3b)。基于三个样本的mRNA分析得出的UMAP图重叠在一起，表明核酸适体和缓冲液对mRNA分析没有影响(图3c)。此外，小提琴图显示三个样本中基因表达的分布，表明在scHIM Apt-seq和scRNA-seq之间，低丰度或高丰度细胞表达的基因分布是相似的(图3d)。所有这些结果都得出结论，核酸适体或结合缓冲液不会影响mRNA的测序，HIMApt-seq可以与scRNA-seq结合，同时测量蛋白质和转录本。

本实施例使用的核酸核酸适体如下：

实施例4：HIMseq在单细胞水平上进行定性和定量分析

为了在单个细胞水平上同时分析细胞膜蛋白和转录组，之前有报道将核酸适体偶联PolyA，以模拟mRNA的结构直接进行测序。然而，测序数据显示大多数读数属于转录组，只有一个较小的部分属于与核酸适体，而且多聚腺苷尾对一些核酸适体与细胞的结合能力有一定影响，限制了其进一步的应用(图10)。因此，为了提高捕获效率并减少mRNA和多聚腺苷化核酸适体之间的交叉效应，我们使用捕获序列而不是多聚腺苷化核酸适体，并且引入了一个通用扩增引物(图4a)。为确保配对的转录组测序所需的捕获序列和PCR引物不干扰核酸适体的结合，我们使用流式细胞术评估了Sgc8和Sgc8CN(在两端都有捕获序列和通用扩增引物的Sgc8修饰物)对CEM细胞中PTK7的结合特性(图11a)。为了进一步验证3'端的捕获序列和5'端的PCR引物不会影响核酸适体与靶细胞的结合能力，我们使用3'/5'端部分或完全互补的序列来阻断捕获序列和PCR引物，评估了Sgc3b和XQ-3b对HCT-8细胞的结合能力。如预期，带有或不带有互补序列阻断的Sgc3b均未与HCT-8细胞结合，而XQ-3b在带有或不带有互补序列阻断时均表现出较高的结合能力，结合荧光偏移是可比的，表明通用PCR引物和捕获序列不影响核酸适体的结合特异性(图11b)。

因此，我们进一步旨在通过将高通量测序获得的蛋白质定量与流式细胞术获得的定量差异进行比较，来评估scHIMseq的灵敏度。为此，我们分别将CCRF-CEM(PTK7阳性细胞系)和3AO(PTK7阴性细胞系)与Sgc8CN孵育。然后，等量的CCRF-CEM细胞和3AO细胞混合用于scHIMseq。单细胞测序显示，CCRF-CEM细胞中的PTK7 mRNA表达水平比3AO细胞中的高得多(图4b)。与此同时，Sgc8CN与CCRF-CEM和3AO的结合能力也通过流式细胞术进行了评估(图4c)。scHIMseq也观察到了类似的PTK7相对表达水平(图4d)。因此，我们得出结论，scHIMseq的蛋白质测定结果与金标准流式细胞术一致，因此可以与转录组一起进行细胞表面蛋白的高通量分析。所有这些数据表明，scHIMseq可以定性地分析细胞表面蛋白。此外，我们评估了scHIMseq是否可以定量地表征膜蛋白质，我们通过将Sgc8CN与CCRF-CEM细胞孵育的六个连续浓度进行滴定实验，并将通过scHIMseq获得的解离平衡常数与流式细胞术评估的Kd进行了比较。单细胞测序数据显示，Sgc8CN与CCRF-CEM的结合逐渐增加，最终达到平台(图4e)，这与流式细胞术测量结果一致。使用蛋白质读数数据测得的表观平衡解离常数(Kd)为25.41nM，与流式细胞术测得的26.74nM相当(图4f和附图13a、13b)。然而，在PTK7阴性的3AO细胞中观察到即使在Sgc8CN浓度逐渐增加的情况下，也没有增加的结合，这一点在scHIMApt-seq和流式细胞术中都有观察到(图4g，附图12c)。500nM组中相对较高的读数可能归因于DNA浓度过高，导致非特异性结合。这些结果证明了HIM Apt-seq在单细胞水平上定性和定量分析膜分子的潜力，并且与当前的scRNA测序技术兼容，可以进行双组学分析。

本实施例使用的核酸核酸适体如下：

*两端都有捕获序列和通用扩增引物的Sgc8修饰物

实施例5：scHIMseq实现单细胞水平上低表达mRNA蛋白的检测

为了确定HIMseq是否可以在复杂样本中直接分析膜蛋白，我们获取了一个临床多发性骨髓瘤(MM)骨髓样本。去除红细胞后，单细胞悬液与靶向L-选择素、转铁蛋白受体蛋白1、非活性酪氨酸蛋白激酶7和程序性细胞死亡1配体1的核酸适体一起孵育，随后进行双组学测序(图5a)。接下来，我们应用统一流形近似和投影(UMAP)来可视化MM样本的转录组细胞簇(图5b)。我们检测到较高的核酸适体读数，这些读数高于单个细胞中相同基因的mRNA水平，表明scHIMseq可以用于检测低mRNA表达水平的蛋白质。此外，当对簇中的表达进行平均时，我们发现核酸适体读数与mRNA计数之间存在很高的相关性(图5c)。此外，我们还查询了核酸适体的分布模式是否与相应的mRNA相匹配。对于SELL和TFRC，我们观察到在单个细胞基础上，核酸适体计数与mRNA表达水平之间存在很好的相关性(图5d、5e)。

为了确定HIMseq是否可以用于识别低mRNA丰度的细胞，我们关注PD-L1，这是一种重要的免疫治疗靶点。我们观察到PD-L1的mRNA主要在一些浆细胞样树突状细胞中可检测到(图5f，左)，这与先前的报告一致。然而，scHIMseq数据显示PD-L1蛋白也在B细胞中表达(图5f，右)。根据以前的报告，B细胞中PD-L1的表达增加在调节体液免疫方面起关键作用，B细胞中的PD-L1表达水平可以预测免疫治疗的疗效。因此，这些数据暗示该患者可能对免疫治疗不敏感。对于针对细胞表面分子(如PTK7)的药物传递试验(如PTK7靶向的抗体-药物偶联物)，基于蛋白质表达水平来识别和研究细胞的能力将对理解药物反应至关重要。因此，我们还进行了双组学数据的比较，发现只有一小部分癌细胞在转录组中显示出PTK7的阳性(图5g，左)。然而，scHIMseq可以识别相对较高比例的癌细胞(图5g，右)。这些结果表明，在蛋白质水平上，HIMseq可以用于识别高和低表达，特别是当mRNA表达水平较低时。

本实施例使用的核酸核酸适体如下：

实施例6：scHIMseq对临床实体肿瘤标本的表型进行多重特性描述

我们进一步验证scHIMseq是否能够在复杂的实体肿瘤组织样本中实现细胞表面蛋白绘制。首先，我们选择了已知特异性靶标的13个核酸适体探针组，进行相应标志物的检测。这些核酸适体已根据上述方法进行了捕获序列的修饰。由于我们使用的13个核酸适体主要是针对肿瘤细胞的，因此将外科切除的卵巢癌标本制备成单细胞悬液，并利用过夜培养的策略去除免疫细胞和死细胞。然后将附着细胞分离并与核酸适体探针一起孵育，随后进行转录组学和核酸适体组学的联合分析(图6a)。我们应用UMAP来可视化肿瘤样本的转录组学派生细胞簇(图6b)，并将八个标记物的蛋白和mRNA表达投影在UMAP图上，以评估核酸适体计数和mRNA计数之间的相关性。对于每个标记物，簇内的平均mRNA和蛋白表达是相关的。每个标记物的Pearson相关系数为MET(R＝0.98)、ITGA3(R＝0.94)、EPCAM(R＝0.59)、CD109(R＝0.65)、PTPRF(R＝0.55)、PTK7(R＝0.88)、TFRC(R＝0.87)和PRNP(R＝0.97)(图6c)，这表明了HIMseq用于复杂组织样本分析的可行性。我们还在单细胞水平分析了mRNA与核酸适体之间的相关性。针对Met、CD109、L1CAM、PTPRF和PRNP的核酸适体与它们的mRNA水平呈正相关(附图13a)。然而，并不是所有的核酸适体在单细胞水平上都与mRNA有很高的相关性，这也与先前报道的结果一致(10)。为了证明核酸适体是否可以像转录组一样用于发现新的细胞类型，我们进一步使用模块化优化对上皮细胞进行聚类。我们发现有7个细胞群体具有明显不同的核酸适体组合(图6d和附图13b)。同时，我们总结了每个上皮细胞亚群中的核酸适体水平热图(图6e)。这些结果表明，scHIM Apt-seq可以在蛋白质水平上显示更精确的细胞聚类，并定义细胞群体。

本实施例使用的核酸适体探针如下

实施例7：HIMseq可发现潜在治疗靶点

迄今为止，在结直肠癌(CRC)中，对5-氟尿嘧啶(5-FU)的获得性抗药性仍然是一个临床挑战，阐明抗药机制对于开发有效的治疗方案至关重要。scRNA-seq已经成为通过揭示细胞异质性而发现新的差异基因以揭示疾病潜在机制的最先进方法。然而，RNA不是调节细胞命运的功能分子。因此，在蛋白质和mRNA的表达水平不完全相关时，同时检测蛋白质和RNA尤其有用。在这里，我们使用与scRNA-seq互补的scHIM Apt-seq来识别潜在的治疗靶点。为了构建5-FU耐药性细胞系，我们使用HCT-8作为亲本细胞(HCT-8-5FU)，分别将这两种类型的细胞与核酸适体共孵育，然后进行单细胞测序。我们观察到两种细胞类型之间不同的核酸适体结合模式，表明膜蛋白的表达差异(附图14)。然后，我们比较了耐药细胞和亲本细胞之间的mRNA表达和蛋白表达，发现对于一些低表达的相应mRNA，如CD24、L1CAM和CD109在mRNA水平非常低。然而，scHIM Apt-seq显示了较高的读数(附图15)。对于高表达蛋白如TFRC和CDCP1，基因水平的趋势与蛋白水平的变化一致，并使用相应的抗体流式细胞术验证了表达的变化(图7a和7b)。火山图显示了HCT-8和HCT-8-5FU细胞之间差异基因和蛋白表达的差异(图7c、7d)，表明在这15个核酸适体中，两个核酸适体(靶向TFRC和PTK7)在HCT-8-5FU细胞中的表达量显著减少，而靶向CDCP1的核酸适体的读数在HCT-8-5FU细胞中显著上调。基因水平和蛋白水平的结果显示出相同的趋势。然而，根据核酸适体数据，CD274在HCT-8-5FU细胞中显著下降，而根据mRNA读数没有发现差异，这意味着scHIM-Apt-seq可以提供通过单独的scRNA-seq无法找到的新信息。如预期的那样，HCT-8细胞中PD-L1的沉默显著降低了对5-FU治疗的敏感性，这表明scHIMseq能够发现克服耐药性的新型治疗靶点(图7e)。

本实施例使用如下核酸适体：

结果与讨论

将单细胞蛋白质组的表征整合到高通量测序技术的工作流程中，可以产生关于细胞状态和通路的多层信息。目前开发的最先进方法，如TotalSeq和REAP-seq，依赖于抗体寡核苷酸偶联物来实现这一目的。然而，这些嵌合大分子的化学合成在低批次效应和高化学计量精度方面技术要求很高。此外，IgG抗体的较大尺寸可能导致靶蛋白的立体干扰和不必要的交联。我们推测核酸适体在解决上述问题方面具有潜力，因为：(1)核酸适体具有与抗体相似的高靶点特异性，且可以直接测序；(2)核酸适体本身的序列可用作条形码标识符；(3)核酸适体可以轻松设计并大规模合成；(4)核酸适体尺寸较小；(5)核酸适体与抗体具有不同的结合模式，它们的靶点范围从特异性表面抗原到特异性分子状态，如二聚体；(6)核酸适体可以通过针对真实样本的快速筛选来生成，如单轮SELEX，从而为个性化分子诊断和疾病治疗打开了可能性。

通过高通量测序定量测量细胞表面结合的核酸适体是分子分析的前提条件。为了适应商业化的单细胞测序技术，核酸适体需要根据所应用的平台进行附加捕获序列的修饰。我们将HIMseq与流式细胞术进行了比较，流式细胞术是细胞表面分析的金标准技术，发现这两种方法在不同细胞系中显示了类似的靶蛋白的表达情况。细胞表面结合的核酸适体数量不仅取决于其靶蛋白的表达水平，还取决于处理细胞时使用的核酸适体的浓度。通过协同转录组分析，我们证明了核酸适体用于分析目标蛋白的特异性，因为我们观察到mRNA表达水平与核酸适体计数之间存在良好的相关性。使用核酸适体进行细胞表面蛋白质组分析的潜在优势可能在于从细胞SELEX获得的核酸适体库具有巨大的靶点多样性。在本研究中，我们展示了500个核酸适体候选者的有前途的能力，用于参数化不同类型的癌细胞，这些细胞表现出完全不同的核酸适体结合模式。尽管这些核酸适体候选者的明确分子靶点仍在调查中，但我们预期HIMseq可能为具有更高参数化水平的单细胞分析开辟新的途径。

Claims

1.用于多组学分析的核酸适体库，所述库中核酸适体3’端和/或5’端连接捕获序列和通用引物；

优选地，所述捕获序列不为Poly(A)；进一步优选地，所述捕获序列与分子标签微珠或磁珠的相应片段互补以实现核酸适体的捕获；

优选地，所述核酸适体被荧光标记；

优选地，所述通用引物通过反转录或连接反应在核酸适体中引入UMI标签。

2.如权利要求1所述的核酸适体库，所述核酸适体的结构为：通用引物-核酸适体序列-捕获序列(5’到3’)。

3.如权利要求1所述的核酸适体库，所述核酸适体库中的核酸适体通过Cell-SELEX方法获得；

优选地，所述核酸适体通过高级别浆液性卵巢癌细胞系OVCAR4作为靶细胞，低级别浆液性卵巢癌细胞系A2780作为阴性细胞，进行筛选获得。

4.如权利要求1所述的核酸适体库，所述库中核酸适体的靶点已知，

优选地，所述核酸适体的靶点包括：PD-L1、CD71、CD318、PTPRF、PTK-7、SELL、TFRC、CD274、MET、ITGA3、EPCAM、CD109、AREG、PNRP、L1CAM、EGFR、CD24、TFIP11、CDCP1；

优选地，所述核酸适体的序列为：序列1-4、6，或序列27-43。

5.对生物样品进行多组学分析的方法，所述方法包括：

1)生物样品与权利要求1-4任一项所述的核酸适体库接触；

2)与生物样品结合的核酸适体连接UMI；

3)对生物样品进行转录组和核酸适体库的高通量测序；

4)对测序数据进行分析；

优选地，所述高通量测序为单细胞测序；

优选地，步骤2)中使用具有双抓手序列的珠子，其中一个抓手序列聚(dT)捕获mRNA，另一抓手序列通过与上述捕获序列配对捕获和引导核酸适体；

优选地，所述测序数据中核酸适体库的测序结果代表细胞表面蛋白/膜蛋白的表达水平。

6.如权利要求5所述的对生物样品进行多组学分析的方法，其中步骤1)还包括根据结合核酸适体的荧光信号进行分选，同时进行多组学测序分选。

7.如权利要求5所述的对生物样品进行多组学分析的方法，所述生物样品为来自临床样本或细胞系的多细胞体系或单细胞悬浮液。

8.权利要求1-4任一项所述的核酸适体库或权利要求5所述的方法的用途，包括：

1)用于细胞聚类或分型；

2)用于细胞因子分析；

3)用于鉴定药物靶点或筛选药物；

4)用于细胞膜蛋白表达量分析；

优选地，所述用途为非诊断目的。

9.用于多组学分析核酸适体构建体库，所述核酸适体构建体的结构为3’端和/或5’端连接有捕获序列和UMI的核酸适体；

优选地，所述构建体库基于权利要求1-4任一项所述的核酸适体库得到。

10.一种多组学分析的试剂盒或试剂组合，所述试剂盒包含权利要求1-4任一项所述的核酸适体库；

优选地，所述试剂盒或试剂组合还包括测序试剂；