CN117580959A

CN117580959A - 用于基于小珠的核酸的组合索引的方法和组合物

Info

Publication number: CN117580959A
Application number: CN202280044218.XA
Authority: CN
Inventors: A·曼佐; C·布朗; S·诺伯格; T·哈灵顿
Original assignee: Inmair Ltd
Current assignee: Inmair Ltd
Priority date: 2021-06-24
Filing date: 2022-06-23
Publication date: 2024-02-20
Also published as: BR112023026984A2; AU2022297521A1; WO2022271954A1; EP4359557A1; KR20240024835A; CA3223500A1; JP2024523570A; MX2023014950A; IL309566A; US20240287505A1

Abstract

一些实施方案涉及用于制备组合索引小珠的方法和组合物。一些实施方案包括向附着到小珠的多核苷酸中顺序添加不同的索引。在一些实施方案中，通过化学连接、聚合酶延伸、部分双链衔接子的连接或短夹板连接来添加索引。

Description

用于基于小珠的核酸的组合索引的方法和组合物

相关申请

本申请要求2021年6月24日提交的名称为“METHODS AND COMPOSITIONS FORCOMBINATORIAL INDEXING OF BEAD-BASED NUCLEIC ACIDS”的美国临时申请号63/214,693的优先权，该申请全文以引用方式并入本文。

序列表的参考

本申请连同电子格式的序列表一起提交。该序列表以创建于2022年6月17日的名称为“ILLINC608WOSEQLIST”的文件提供，该文件大小为大约3.15千字节。该序列表的电子格式的信息全文以引用方式并入本文。

技术领域

背景技术

生物样本中存在的特定核酸序列的检测已被用作例如鉴定和分类微生物、诊断传染病、检测和表征遗传异常、鉴定与癌症相关联的遗传变化、研究对疾病的遗传易感性，以及测量对各种类型的治疗的反应的方法。用于检测生物样本中的特定核酸序列的常用技术是核酸测序。

核酸测序方法已从Maxam和Gilbert所使用的化学降解方法以及Sanger所使用的链延长方法得到了显著发展。现在使用了允许在单个芯片上并行处理数千个核酸的若干测序方法。一些平台包括基于小珠的形式和微阵列形式，其中二氧化硅小珠用探针官能化，这取决于此类形式在包括测序、基因分型、基因表达谱分析在内的应用中的应用。

在当前基于小珠的阵列上对不同样本进行基因分型的方法可能需要垫片将小珠芯片的不同区域物理地细分成多个扇区(sector)。然后将各个样本装载到由垫片创建的每个离散区段中。然而，此类方法可能以相对较低的样本数量输入使用，但当每个小珠芯片的样本密度从每个小珠芯片24个样本增加到每个小珠芯片96、384、1536个或更多个样本时，这些方法被证明是费力的或难以管理的。

发明内容

本文所提供的方法和组合物的一些实施方案包括制备多个组合索引小珠的方法，包括：(a)获得包含第一多核苷酸的初级索引小珠群体，该第一多核苷酸包含第一索引，其中该初级索引小珠群体包含多个第一索引小珠亚群，其中该第一索引小珠亚群包含彼此不同的第一索引；(b)将该初级索引小珠群体拆分成多个第二小珠亚群；(c)获得次级索引小珠群体，包括：(i)使该多个第二小珠亚群的第一多核苷酸与包含第二索引的第二多核苷酸进行延伸以获得第二索引小珠亚群，其中该第二索引小珠亚群包含彼此不同的第二索引，以及(ii)组合该第二索引小珠亚群以获得该次级索引小珠群体；并且任选地，还包括：(d)将该次级索引小珠群体拆分成多个第三小珠亚群；以及(e)获得三级索引小珠群体，包括：(i)使该多个第三小珠亚群的第二多核苷酸与包含第三索引的第三多核苷酸进行延伸以获得第三索引小珠亚群，其中该第三索引小珠亚群包含彼此不同的第三索引，以及(ii)组合该第三索引小珠亚群以获得该三级索引小珠群体。

在一些实施方案中，(c)包括通过化学连接使第一多核苷酸与第二多核苷酸进行延伸。

在一些实施方案中，第一多核苷酸包含末端3'修饰的脱氧核苷酸(dNTP)，该末端3'修饰的dNTP包含能够参与点击化学反应的3'官能部分；第二多核苷酸包含末端5'修饰的dNTP，该末端5'修饰的dNTP包含相容性5'官能部分，该相容性5'官能部分能够参与和3'-官能部分的点击化学反应；并且3'官能部分和5'官能部分能够彼此反应，以形成经修饰的主链键。

在一些实施方案中，使第一多核苷酸与第二多核苷酸进行延伸获得次级索引多核苷酸，并且该方法还包括修饰该次级索引多核苷酸以获得包含末端3'修饰的脱氧核苷酸(dNTP)的经修饰的多核苷酸，该末端3'修饰的dNTP包含能够参与点击化学反应的3'官能部分。

在一些实施方案中，该修饰包括使该次级索引多核苷酸与模板非依赖性聚合酶接触。在一些实施方案中，该模板非依赖性聚合酶选自末端脱氧核苷酸转移酶(TdT)、PolyA聚合酶或添加CCA的RNA聚合酶。在一些实施方案中，该模板非依赖性聚合酶是TdT。

一些实施方案还包括通过化学连接反应使经修饰的多核苷酸与第三多核苷酸进行延伸，其中该第三多核苷酸包含末端5'修饰的dNTP，该末端5'修饰的dNTP包含相容性5'官能部分，该相容性5'官能部分能够参与和3'官能部分的点击化学反应。

在一些实施方案中，3'官能部分选自叠氮化物、炔基、烯基、硫醇和硝酮。

在一些实施方案中，5'官能部分不同于3'官能部分并且与该3'官能部分相容，并且该5'官能部分选自叠氮化物、炔基、烯基、硫醇和硝酮。

在一些实施方案中，3'官能部分和5'官能部分选自以下对：(i)3'-叠氮基/5'-炔基；(ii)3'-炔基/5'叠氮基；(iii)3'-硫醇/5'-炔基；(iv)3'-硫醇/5'-烯基；(v)3'-炔基/5'-硫醇；(vi)3'-烯基/5'-硫醇；(vii)3'-叠氮基/5'-环辛炔基；(viii)3'-环辛炔/5'-叠氮基；(ix)3'-硝酮/5'-环辛炔基；和(x)3'-环辛炔基/5'-硝酮。在一些实施方案中，3'官能部分是3'-叠氮基，并且5'官能部分是5'-炔基。

在一些实施方案中，点击化学反应包括铜催化的叠氮化物-炔烃环加成(CuAAC)，以形成包含三唑基的经修饰的主链键。

在一些实施方案中，(c)包括通过聚合酶延伸使第一多核苷酸进行延伸，其中该第一多核苷酸包含第一接头。

一些实施方案还包括(i)获得第一衔接子，该第一衔接子包含能够与第一接头杂交的区域和包含第二索引或第二索引的互补物的区域；(ii)使第一衔接子与第一接头杂交；以及(iii)使第一多核苷酸进行延伸以获得次级索引多核苷酸。

在一些实施方案中，第一衔接子包含不可延伸的3'端。在一些实施方案中，该不可延伸的3'端包含3'2'双脱氧核苷酸或C3接头。

一些实施方案还包括从次级索引多核苷酸中去除第一衔接子。在一些实施方案中，该去除包括通过热或碱使第一衔接子变性，或通过酶促降解使第一衔接子降解。

在一些实施方案中，第一接头具有小于10个连续核苷酸的长度。在一些实施方案中，第一接头具有小于5个连续核苷酸的长度。

在一些实施方案中，(e)包括通过聚合酶延伸使第二多核苷酸进行延伸。

在一些实施方案中，第一衔接子包含第二接头的互补物，使得次级索引多核苷酸包含第二接头。

一些实施方案还包括(i)获得第二衔接子，该第二衔接子包含能够与第二接头杂交的区域和包含第三索引或第三索引的互补物的区域；(ii)使第二衔接子与第二接头杂交；以及(iii)使次级索引多核苷酸进行延伸以获得三级索引多核苷酸。

在一些实施方案中，第二衔接子包含不可延伸的3'端。

在一些实施方案中，该不可延伸的3'端包含3'2'双脱氧核苷酸或C3接头。

一些实施方案还包括从三级索引多核苷酸中去除第二衔接子。在一些实施方案中，该去除包括通过热或碱使第一衔接子变性，或通过酶促降解使第一衔接子降解。

在一些实施方案中，第二接头具有小于10个连续核苷酸的长度。在一些实施方案中，第二接头具有小于5个连续核苷酸的长度。

在一些实施方案中，(c)包括通过连接使第一多核苷酸与第二多核苷酸进行延伸。

一些实施方案还包括(i)获得双链第一衔接子和3'单链突出端，该双链第一衔接子包含第二多核苷酸，该3'单链突出端能够与第一多核苷酸的第一接头杂交；(ii)使第一衔接子与第一接头杂交；以及(iii)使第一多核苷酸与第二多核苷酸连接以获得次级索引多核苷酸。

一些实施方案还包括通过连接使第二多核苷酸与第三多核苷酸进行延伸。

一些实施方案还包括(i)获得双链第二衔接子和3'单链突出端，该双链第二衔接子包含第三多核苷酸，该3'单链突出端能够与第二多核苷酸的第二接头杂交；(ii)使第二衔接子与第二接头杂交，并且任选地，使额外的寡核苷酸与第一索引杂交；以及(iii)使第二多核苷酸与第三多核苷酸连接以获得三级索引多核苷酸。

在一些实施方案中，该连接包括使用连接酶。

在一些实施方案中，该连接包括点击化学反应。

在一些实施方案中，(c)包括通过连接使第一多核苷酸进行延伸，其中第一多核苷酸包含第一接头，并且第二多核苷酸包含第二接头。

一些实施方案还包括(i)获得第一衔接子，该第一衔接子包含能够与第一接头杂交的区域和能够与第二接头杂交的区域；(ii)使第一衔接子与第一接头杂交；(iii)使第二寡核苷酸与能够与第二接头杂交的区域杂交；以及(iv)使第一多核苷酸与第二多核苷酸连接以获得次级索引多核苷酸。

在一些实施方案中，第一接头和/或第二接头具有小于10个连续核苷酸的长度。在一些实施方案中，第一接头和/或第二接头具有小于5个连续核苷酸的长度。

在一些实施方案中，和与第一衔接子具有相同长度的寡核苷酸相比，第一接头和/或第二接头被修饰为具有增加的Tm。

在一些实施方案中，与具有相同长度的寡核苷酸相比，第一接头和/或第二接头包含增加的G/C含量，或包含经修饰的核苷酸。

在一些实施方案中，(e)包括通过连接使第二多核苷酸进行延伸，其中第二寡核苷酸包含第三接头使得次级索引多核苷酸包含该第三接头，并且其中第三多核苷酸包含第四接头。

一些实施方案还包括(i)获得第二衔接子，该第二衔接子包含能够与第三接头杂交的区域和能够与第四接头杂交的区域；(ii)使第二衔接子与第三接头杂交；(iii)使第三多核苷酸经由能够与第四索引杂交的区域与第二衔接子杂交；以及(iv)使次级索引多核苷酸与第三多核苷酸连接以获得三级索引多核苷酸。

在一些实施方案中，第三接头和/或第四接头具有小于9个连续核苷酸的长度。在一些实施方案中，第三接头和/或第四接头具有小于5个连续核苷酸的长度。

在一些实施方案中，和与第二衔接子具有相同长度的寡核苷酸相比，第三接头和/或第四接头被修饰为具有增加的Tm。

在一些实施方案中，与具有相同长度的寡核苷酸相比，第三接头和/或第四接头包含增加的G/C含量，或者包含经修饰的核苷酸。

一些实施方案还包括从三级索引多核苷酸中去除第二衔接子。

在一些实施方案中，该去除包括通过热或碱使第一衔接子变性，或通过酶促降解使第一衔接子降解。

在一些实施方案中，(a)包括：(i)使第一多核苷酸附着到多个第一小珠亚群以获得第一索引小珠亚群，其中第一多核苷酸针对每个第一小珠亚群包含不同的第一索引；以及(ii)组合第一索引小珠亚群以获得初级索引小珠群体。

在一些实施方案中，第一多核苷酸经由第一结合配偶体和第二结合配偶体附着到小珠。在一些实施方案中，第一结合配偶体或第二结合配偶体选自生物素、链霉亲和素、生物素衍生物、链霉亲和素衍生物、抗体和抗体的抗原结合片段。

一些实施方案还重复(d)和(e)，并且将额外的索引添加到索引小珠亚群中。

在一些实施方案中，第一多核苷酸包含选自P5序列、P5'序列、P7序列和P7'序列的引物结合位点。

在一些实施方案中，第一索引、第二索引和/或第三索引具有小于20个连续核苷酸的长度。在一些实施方案中，第一索引、第二索引和/或第三索引具有小于10个连续核苷酸的长度。

在一些实施方案中，(b)包括将初级索引小珠群体随机分配到多个隔室中。

在一些实施方案中，(d)包括将次级索引小珠群体随机分配到多个隔室中。

在一些实施方案中，该多个隔室包括选自孔、通道或液滴的隔室。

在一些实施方案中，多个组合索引小珠包括磁珠。

一些实施方案还将该多个组合索引小珠分配在阵列上。一些实施方案还对阵列上的该组合索引小珠进行测序。

一些实施方案还基于该组合索引对阵列上的该多个组合索引小珠中的小珠的位置进行解码。

在一些实施方案中，该多个组合索引小珠中的每个小珠包含捕获探针。在一些实施方案中，第一多核苷酸、第二多核苷酸或第三多核苷酸包含该捕获探针。一些实施方案还使多个靶核酸与该捕获探针杂交。一些实施方案还使该捕获探针进行延伸。

附图说明

图1示出了包括合并和拆分策略的组合索引的示例性实施方案。

图2示出了通过使用接头-夹板的顺序夹板连接反应来接合附着到底物的第一索引(索引A)、第二索引(索引B)和第三索引(索引C)的示意图的实施方案。

图3示出了通过点击化学连接使第二索引(索引B)接合附着到底物的第一索引(索引A)的示意图的实施方案。

图4示出了通过顺序聚合酶延伸反应来添加附着到底物的第一索引(索引A)、第二索引(索引B)和第三索引(索引C)的示意图的实施方案。

图5示出了使用包含双链区域和单链突出端的衔接子来添加附着到底物的第一索引(索引A)、第二索引(索引B)和第三索引(索引C)的示意图的实施方案。

图6示出了通过使用短接头-夹板的顺序夹板连接反应来添加附着到底物的第一索引(索引A)、第二索引(索引B)和第三索引(索引C)的示意图的实施方案。

图7A示出了包括以下小珠的示意图：具有捕获寡核苷酸(P5-索引A-连接1a)和用于测量捕获寡核苷酸的量的引物位置的小珠，该捕获寡核苷酸与用于聚合酶延伸的延伸模版(连接1a'-索引B'-Hyb')杂交；以及具有延伸产物和可用于测量全长延伸产物的量的引物位置的小珠。

图7B示出了各种条件下的捕获寡核苷酸的量，以及来自捕获寡核苷酸的连接延伸或捕获寡核苷酸的聚合酶延伸的全长产物的量的图。

图8A是概述在3级索引方法中测试的步骤和条件的示意图，这些方法包括通过聚合酶延伸或连接来延伸捕获寡核苷酸。编号对应于测试的条件。

图8B是总结用于比较夹板连接(SL)和聚合酶延伸(PE)的各种实验条件的表，并且该表包括图8A中编号的1级索引(L1)、2级索引(L2)和3级索引(L3)的各种条件(cond)。

图9是显示各种条件下的捕获寡核苷酸(CO)、2级延伸产物和3级延伸产物的量的图。

图10是通过定量PCR测量的捕获寡核苷酸的浓度的图，这些捕获寡核苷酸具有经由生物素或双脱硫生物素(ddbiotin)附着到小珠并且经各种变性条件处理的1级延伸产物。

图11A是显示对小珠上的合成产物进行测序读段取向的示意图，其包括3级索引产物、源自该合成产物的PCR产物和源自该PCR产物的测序读段。

图11B是显示对包括完全正确的序列，或者其中两个索引均可用于通过聚合酶延伸或夹板连接来产生延伸产物的序列进行测序读段的百分比的图。可用的索引包括可用索引纠错实施方式进行解码校正的那些，并且在以3个核苷酸汉明距离(Hamming distance)设计的索引内包含不超过一个“SNP”，并且在整个“索引”区域上没有插入缺失(indel)，例如，在3级索引寡核苷酸中，索引区域包含3个索引。

图11C是显示对包括完全正确的序列，或者其中两个索引均可用于通过聚合酶延伸或夹板连接来产生延伸产物的序列进行测序读段的每个碱基错误率的图，该碱基错误率包括无论该错误是缺失、插入还是碱基改变(SNP)。可用的索引包括可用索引纠错实施方式进行解码校正的那些，并且在以3个核苷酸汉明距离(Hamming distance)设计的索引内包含不超过一个“SNP”，并且在整个“索引”区域上没有插入缺失(indel)，例如，在3级索引寡核苷酸中，索引区域包含3个索引。

图12A是显示标准夹板连接方法(左图)和双链夹板连接方法(右图)的步骤的示意图。在一些实施方案中，双链夹板连接方法可包括额外的寡核苷酸(索引1')。

图12B是显示在标准夹板连接和双链夹板连接方法的步骤中测试的条件的示意图。

图12C是显示用于测量来自标准连接或双链连接的延伸产物的正向或反向引物的位置的示意图。

图13A是显示通过定量PCR测量的延伸产物的浓度的图。使用F2和R1引物测量捕获寡核苷酸，并使用F2和R2引物或者F3和R2引物测量全长产物，如图12C所示。

图13B是显示相对于全长对照归一化的延伸产物的相对浓度的图。

图13C是显示相对于捕获寡核苷酸浓度归一化的延伸产物的相对浓度的图。

图13D是显示在不同量的双链夹板寡核苷酸的存在下产生的延伸产物的浓度的图。

图13E是显示在与图12A所示的索引1互补的额外的寡核苷酸的存在下产生的延伸产物的浓度的图。

图13F是显示在具有不可延伸的3'ddC端的寡核苷酸的存在下产生的延伸产物的浓度的图。

图13G是显示在室温或75℃下用预连接步骤产生的延伸产物的浓度的图。

图14A是显示对包括完全正确的序列，或者其中两个索引均可用于通过夹板连接延伸或双链夹板连接来产生延伸产物的序列进行测序读段的百分比的图。可用的索引包括可用索引纠错实施方式进行解码校正的那些，并且在以3个核苷酸汉明距离(Hammingdistance)设计的索引内包含不超过一个“SNP”，并且在整个“索引”区域上没有插入缺失(indel)，例如，在3级索引寡核苷酸中，索引区域包含3个索引。

图14B是显示对通过夹板连接延伸或双链夹板连接产生的延伸产物进行测序读段的每个碱基错误率的图，该碱基错误率包括无论该错误是缺失、插入还是碱基改变(SNP)。

图15A是显示标准夹板连接方法(左图)和双链夹板连接方法(右图)的3级索引中的步骤的示意图。

图15B是显示在使用标准夹板连接或双链夹板连接的3级索引的方法的步骤中测试的条件的示意图。

图16A是显示通过定量PCR测量的捕获寡核苷酸、2级产物和3级产物的延伸产物的浓度的图。

图16B是显示对包括完全正确的序列，或者其中全部三个索引均可用于通过夹板连接延伸或双链夹板连接来产生延伸产物的序列进行测序读段的百分比的图。可用的索引包括可用索引纠错实施方式进行解码校正的那些，并且在以3个核苷酸汉明距离(Hammingdistance)设计的索引内包含不超过一个“SNP”，并且在整个“索引”区域上没有插入缺失(indel)，例如，在3级索引寡核苷酸中，索引区域包含3个索引。

图16C是显示对通过夹板连接延伸或双链夹板连接产生的延伸产物进行测序读段的每个碱基错误率的图，该碱基错误率包括无论该错误是缺失、插入还是碱基改变(SNP)。

图17是显示通过标准夹板连接或者通过使用缩短夹板的夹板连接(上图)来延伸捕获寡核苷酸的示意图。下图示出了用于测量延伸产物的引物位置。

图18A是显示各种夹板寡核苷酸的示意图。图18A中描述的序列包括SEQ ID NO:07-16。

图18B是显示各种实验条件的表格，包括具有1级索引的捕获寡核苷酸(L1寡核苷酸)、夹板寡核苷酸(夹板)和2级寡核苷酸(L2寡核苷酸)。

图18C是全长延伸产物相对于对照全长延伸产物的图，这些对照全长延伸产物通过用各种夹板寡核苷酸进行夹板连接延伸而产生的延伸产物。

图19A是包括双链夹板连接的组合索引方法的示意图，该双链夹板连接包括接头序列“KS-3'”和“MS-3'”。

图19B是对包括双链夹板连接的组合索引方法的示例性工作流程进行概述的示意图。

具体实施方式

其中每个小珠均匀地包被有单个寡核苷酸序列的连接小珠的寡核苷酸库是测序方法(诸如合成长读测序)的组成部分。此类小珠库的组合组装可用于实现足够的索引多样性；然而，一些方法依赖于夹板连接策略来接合索引的连续层级。夹板连接具有以下缺点：将不变碱基引入到小珠代码中，并且增加了读取完整小珠代码所需的边合成边测序(SBS)循环的数量。本文提供的某些实施方案包括标准夹板连接小珠代码合成策略的几种替代方案，这些替代方案减少小珠代码中不变碱基的数量，增加小珠代码信息密度并允许更有效的小珠代码测序。

连接小珠的寡核苷酸的组合组装允许产生含有大量独特索引的小珠库，其中每个小珠均匀地包被有单个独特索引寡核苷酸。从衍生用于寡核苷酸捕获的磁珠(诸如表面附着的链霉亲和素)的共同库开始，将小珠等分到多孔板的“M”个孔中，每个孔含有已用小珠捕获部分(诸如生物素)合成的单个寡核苷酸序列。结合之后，将小珠再次合并、混合，并拆分到多孔板的“N”个孔中以附着二级索引。第二索引反应中的每个孔含有一级寡核苷酸的均匀混合物，因此在附着第二索引之后，独特索引的总数变为“M”×“N”个。重复该过程多次，可从一小组单独索引寡核苷酸中产生具有数百万个独特索引的小珠库，该一小组单独索引寡核苷酸可容易地适合标准多孔板，诸如96孔板、192孔板或384孔板。图1中示出了包括合并和拆分策略的组合索引的示例性实施方案。

对于除直接捕获之外的一级索引，需要一种方法将单链索引寡核苷酸共价附着到结合小珠的索引上。这可使用长夹板连接方法来进行(图2)。直接捕获的一级寡核苷酸被设计成在其3'端具有8个核苷酸的捕获序列(L1A)，并且引入的索引寡核苷酸在其5'端具有第二8个核苷酸的捕获序列(L1B)，以及在5'端具有磷酸。在一些实施方案中，LIA和/或LIB可具有等于或大于4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸的长度。然后在连接反应中用与3'端的L1A和5'端的L1B互补的具有16个核苷酸的夹板寡核苷酸来组装这两个片段；所结合的夹板与结合小珠的捕获寡核苷酸和溶液中的索引寡核苷酸两者杂交，使这两个片段的3'端和5'端彼此直接相邻。然后，该反应中的连接酶将索引寡核苷酸的磷酸化5'端与捕获寡核苷酸的3'端共价连接。表1列出了在某些方法中使用12-多孔板、96-多孔板、192-多孔板或384-多孔板和768-多孔板可获得的独特小珠代码的数量。一些此类方法包括：(a)将小珠分配在第一多孔板的孔中，每个孔含有不同的索引A；将索引A附着到小珠；合并小珠；(b)将小珠重新分配到第二多孔板的孔中，每个孔含有不同的索引B，并将索引B附着到小珠；(c)将小珠重新分配到第三多孔板的孔中，每个孔含有不同的索引C，并将索引C附着到小珠。

表1

夹板连接方法需要在可变索引区域之间的16个核苷酸的不变夹板序列，以用于小珠代码中每种层级的索引。因为小珠代码通常用单次读段来测序，所以这些不变区域必须仅通过化学来读段，诸如在SBS期间的“暗”循环。例如，不变区域中的每个碱基需要额外的SBS循环以维持正确的相位。这些通常是“仅化学”或“暗”SBS循环，其中使用聚合化学步骤而没有成像步骤。对于具有8个核苷酸的单独子索引的三级索引，这意味着需要至少32个总暗循环才能对信息性索引序列的仅24个核苷酸进行测序。对于索引序列读段和任何随后的插入测序读段两者而言，已经观察到这种大量循环导致读段质量降低。

本文提供的某些实施方案除了长夹板连接策略之外，还包括小珠代码合成策略，以减少不变碱基的数量，并因此减少读取小珠代码所需的仅化学的SBS循环。一些此类实施方案包括通过使用叠氮化物-炔烃点击化学进行化学连接的小珠代码合成；通过模板聚合酶延伸的小珠代码合成；通过双链片段的酶促连接的小珠代码合成；以及通过用含有非标准核苷酸的短夹板进行夹板连接的小珠代码合成。

本文提供的一些实施方案涉及阵列上的高通量基因分型。一些实施方案涉及解码微特征在阵列中的位置。在一些实施方案中，微特征包括具有条形码和索引的多核苷酸。一些实施方案包括对条形码和索引进行测序，以识别多核苷酸在阵列中的位置。对于本文公开的方法和组合物可能有用的某些方面公开于WO 2020/086746中，该专利全文以引用方式并入。

通过杂交解码包括识别捕获探针在随机分布的捕获探针阵列中的位置。该方法通常涉及使标记的杂交探针与捕获探针的一个或多个部分杂交、对杂交事件成像以及移除杂交探针的若干连续循环。通过杂交解码需专用试剂、专用流体设备和专用检测器。在一些实施方案中，通过杂交解码可花费长达8小时的7-8个连续循环。

本文提供的实施方案包括含有引物结合位点和条形码的多核苷酸的随机分布阵列。在一些实施方案中，可使用高通量测序系统容易地对条形码进行测序以解码阵列。一些实施方案可显著减少在没有额外试剂、杂交探针或专用解码设备的情况下解码阵列所花费的时间。

一些实施方案包括使用下一代测序(NGS)技术和基于小珠的微阵列。一些此类实施方案提供了高性能、低成本和高通量的基因分型测定，这种测定可在通用NGS测序平台上运行，对基板和试剂进行微小的修改。

一些实施方案包括进行基因分型测定，其中含有“S”个孔的多孔板装载有S个小珠库，每个小珠库具有独特的样本索引，其中每个孔含有“N”种独特的小珠类型。在从样本生成核酸文库后，诸如用包括随机引物扩增、随后酶促片段化和纯化的步骤来处理核酸样本，将每个样本文库添加到索引孔中，并允许其与捕获探针杂交。在杂交完成后，通过添加包含荧光核苷酸和适当聚合酶的掺入混合物来执行单碱基延伸测定以探测感兴趣的SNP。在掺入结束时，将板中的所有小珠捕获样本合并并装载到流通池中。流通池可以是普通的或有图案的，并且表面被适当地改性以支持小珠在所需密度下的固定。在一些实施方案中，在小珠固定时，执行SNP读出，该SNP读出包括单个扫描循环以读取来源于SNP位点处的荧光掺入的信号。该循环可包括仪器上的SBS循环。还进行条形码读出，包括12-20个SBS循环(取决于小珠库的多重性)来识别捕获探针和流通池内特定小珠的位置。在一些实施方案中，该步骤可被经过所识别的SNP的额外测序循环替换。还进行样本索引读出，包括6-12个SBS循环来读取样本索引。在一些实施方案中，整个流通池测定可包括少于约30个SBS循环，并且可在少于4小时内执行。

定义

如本文所用，“核酸”旨在与其在本领域中的用途一致，并且包括天然存在的核酸或其功能类似物。特别有用的功能类似物能够以序列特异性方式与核酸杂交或能够用作复制特定核苷酸序列的模板。天然存在的核酸通常具有包含磷酸二酯键的主链。类似结构可具有替代的主链键，包括本领域已知的多种主链键中的任一种。天然存在的核酸通常具有脱氧核糖(例如存在于脱氧核糖核酸(DNA)中)或核糖(例如存在于核糖核酸(RNA)中)。核酸可包含本领域已知的这些糖部分的多种类似物中的任一种。核酸可包括天然的或非天然的碱基。就这一点而言，天然脱氧核糖核酸可具有选自由腺嘌呤、胸腺嘧啶、胞嘧啶或鸟嘌呤组成的组的一个或多个碱基，并且核糖核酸可具有选自由尿嘧啶、腺嘌呤、胞嘧啶或鸟嘌呤组成的组的一个或多个碱基。可包含在核酸中的有用的非天然碱基是本领域已知的。非天然碱基的示例包括锁核酸(LNA)和桥核酸(BNA)。LNA碱基和BNA碱基可掺入DNA寡核苷酸中并增加寡核苷酸杂交强度和特异性。LNA碱基和BNA碱基以及此类碱基的用途是本领域技术人员已知的，并且是常规的。

如本文所用，术语“核苷酸类似物”是指具有修饰的核苷酸碱基部分、修饰的戊糖部分和/或修饰的磷酸酯部分，以及在多核苷酸的情况下修饰的核苷酸间键的合成类似物。修饰的核苷酸间键包括磷酸酯类似物、具有非手性和不带电荷的亚单位间键的类似物、以及具有非手性亚单位间键的不带电荷的基于吗啉代的聚合物。一些核苷酸间键类似物包括吗啉酸酯、缩醛和聚酰胺连接的杂环。磷酸酯类似物的示例包括但不限于硫代磷酸酯、二硫代磷酸酯、磷酸硒酸酯、磷酸二硒酸酯、苯胺磷酸硫醇酯、苯胺磷酸酯、氨基磷酸酯、硼酸磷酸盐，包括相关的抗衡离子，例如H+、NH4+、Na+(如果存在此类抗衡离子)。修饰的核苷酸碱基部分的示例包括但不限于5-甲基胞嘧啶(5mC)；C-5-丙炔基类似物，包括但不限于C-5丙炔基-C和C-5丙炔基-U；2,6-二氨基嘌呤，也称为2-氨基腺嘌呤或2-氨基-dA)；次黄嘌呤、假尿苷、2-硫代嘧啶、异胞嘧啶(isoC)、5-甲基isoC和异鸟嘌呤(isoG)。修饰的戊糖部分的示例包括但不限于锁定核酸(LNA)类似物，包括但不限于Bz-A-LNA、5-Me-Bz-C-LNA、dmf-G-LNA和T-LNA以及2'-修饰或3'-修饰，在该修饰中2'-位置或3'-位置是氢、羟基、烷氧基(例如甲氧基、甲氧基-乙基、-O-甲基、乙氧基、烯丙氧基、异丙氧基、丁氧基、异丁氧基和苯氧基)、叠氮基、氨基、烷基氨基、氟、氯或溴。其他示例包括2-氨基嘌呤；5-溴du；脱氧尿苷；脱氧肌苷；羟甲基dC；5-甲基dC；5-硝基吲哚；5-羟丁基-2'-脱氧尿苷；和8-氮杂-7-脱氮鸟苷。

如本文所用，“靶标”当用于提及核酸时，旨在作为本文所示的方法或组合物的上下文中核酸的语义标识符，并且不一定限制核酸的结构或功能，除非另有明确说明。靶核酸基本上可以是任何已知或未知序列的核酸。其可以是例如基因组DNA或cDNA的片段。测序能够确定靶分子的全部或一部分的序列。靶标可来源于初级核酸样品，诸如细胞核或无细胞样品。在一个实施方案中，可通过将通用序列置于每个靶片段的末端，从而将靶标处理成适于扩增的模板。靶标也可通过逆转录成cDNA从初级RNA样品获得。

如本文所用，当用于描述核苷酸序列时，“通用”是指两个或更多个核酸分子共有的序列区域，其中这些分子也具有彼此不同的序列区域。存在于分子集合的不同成员中的通用序列可允许使用通用捕获核酸群体(例如，与通用序列(例如，通用捕获序列)的一部分互补的捕获寡核苷酸)捕获多种不同的核酸。通用捕获序列的非限制性示例包括与P5和P7引物相同或互补的序列。类似地，存在于分子集合的不同成员中的通用序列可允许使用与通用序列(例如，通用锚定序列)的一部分互补的通用引物的群体来扩增或复制(例如，测序)多种不同的核酸。因此，捕获寡核苷酸或通用引物包含可与通用序列特异性杂交的序列。杂交的两个通用序列称为通用结合对。例如，杂交的捕获寡核苷酸和通用捕获序列是通用结合对。

如本文所用，当涉及引物序列或引物结合位点时，可使用术语“P5”和“P7”。术语“P5'”(P5引物)和“P7'”(P7引物)分别是指P5和P7的互补物。应当理解，任何合适的扩增引物都可用于本文所呈现的方法中，并且P5和P7的使用仅为示例性实施方案。在流通池上使用扩增引物诸如P5和P7是本领域已知的，如WO 2007/010251、WO 2006/064199、WO 2005/065814、WO 2015/106941、WO 1998/044151和WO 2000/018957的公开内容所例示，这些文献中的每一篇全文均以引用方式并入本文。例如，任何合适的正向扩增引物，无论是固定化的还是处于溶液状态的，都可用于本文所呈现的方法中，以用于与互补序列杂交和扩增序列。类似地，任何合适的反向扩增引物，无论是固定化的还是处于溶液状态的，都可用于本文所呈现的方法中，以用于与互补序列杂交和扩增序列。本领域的技术人员将理解如何设计和使用适用于捕获和/或扩增本文所呈现的核酸的引物序列。

如本文所用，“隔室”旨在表示将某物与其他事物分开或隔离的区域或体积。示例性隔室包括小瓶、管、孔、液滴、团块、小珠、容器、表面特征，或由物理力诸如流体流动、磁力、电流等分开的区域或体积。在一个实施方案中，隔室是多孔板(诸如96孔板或384孔板)的孔。

如本文所用，术语“引物”及其派生词通常是指可与所关注靶序列杂交的任何核酸。通常，引物用作底物，核苷酸可以通过聚合酶聚合到该底物上；然而，在一些实施方案中，引物可掺入合成的核酸链中并提供另一引物可与之杂交的位点，以引发与合成的核酸分子互补的新链的合成。引物可包括核苷酸或其类似物的任何组合。在一些实施方案中，引物是单链寡核苷酸或多核苷酸。术语“多核苷酸”和“寡核苷酸”在本文中可互换使用，是指任何长度的核苷酸的聚合形式，并且可包括核糖核苷酸、脱氧核糖核苷酸、它们的类似物或它们的混合物。这些术语应当被理解为包括由核苷酸类似物制成的DNA或RNA的类似物作为等同物，并且适用于单链(诸如有义或反义)多核苷酸和双链多核苷酸。如本文所用，该术语还涵盖cDNA，即由RNA模板例如通过逆转录酶的作用产生的互补DNA或拷贝DNA。该术语仅是指分子的主要结构。因此，该术语包括三链、双链和单链脱氧核糖核酸(“DNA”)，以及三链、双链和单链核糖核酸(“RNA”)。

如本文所用，术语“衔接子”或“衔接头”以及它们的派生词(例如，通用衔接子)通常是指可连接到核酸分子上或在连接反应中形成夹板的任何线性寡核苷酸。在一些实施方案中，衔接子或衔接子的一部分与靶序列的3'端或5'端(诸如靶核酸的接头区)基本上互补或互补。一般来讲，衔接子可包括核苷酸和/或核酸的任何组合。在一些方面，衔接子可包括在一个或多个位置处的一个或多个可切割基团。在另一方面，衔接子可包括与引物(例如，通用引物)的至少一部分基本上相同或基本上互补的序列。在一些实施方案中，衔接子可包括条形码或标签以有助于下游纠错、识别或测序。术语“衔接子”和“衔接头”可互换使用。

如本文所用，“阵列”是指可根据相对位置彼此区分的一组位点。位于阵列的不同位点处的不同分子可根据位点在阵列中的位置而彼此区分。阵列的单个位点可包含一种或多种特定类型的分子。例如，位点可包含具有特定序列的单个靶核酸分子，或者位点可包含具有相同序列(和/或其互补序列)的若干核酸分子。阵列的位点可以是位于同一基板上的不同特征。示例性特征包括但不限于基板中的孔、基板中或基板上的小珠(或其他颗粒)、基板的突出部、基板上的脊或基板中的通道。阵列的位点可以是各自带有不同分子的单独的基板。可根据基板在与基板相关联的表面上的位置，或者根据基板在液体或凝胶中的位置，来识别附接到单独基板的不同分子。其中单独的底物位于表面上的示例性阵列包括在孔中具有小珠的那些阵列。在一些实施方案中，阵列可位于流通池上。

组合索引

本文提供的方法和组合物的一些实施方案包括通过组合索引来制备索引小珠，其中通过顺序添加索引来延伸附着到小珠的第一多核苷酸。在一些实施方案中，通过各种方法，包括通过化学连接、通过聚合酶延伸、通过包含第二多核苷酸和单链突出端的双链衔接子的连接、或通过夹板连接，用包含索引的第二多核苷酸(诸如单链DNA多核苷酸)来延伸第一多核苷酸(诸如单链DNA多核苷酸)。

一些实施方案包括拆分和库索引。例如，将第一小珠群体拆分成多个第一亚群，并且通过将包含第一索引的第一多核苷酸附着到小珠而将不同的第一索引添加到每个亚群中，并且将这些亚群组合以获得第二小珠群体。将第二小珠群体拆分成多个第二亚群，并且通过使所附着的第一多核苷酸与包含第二索引的多核苷酸进行延伸而将不同的第二索引添加到每个亚群中，并且将这些亚群组合以获得第三小珠群体。将第三小珠群体拆分成多个第三亚群，并且通过使第二多核苷酸与包含第三索引的多核苷酸进行延伸而将不同的第三索引添加到每个亚群中，并且将这些亚群组合以获得第四小珠群体。可以重复将这些群体拆分成亚群以及将不同的索引添加到每个亚群中，以产生甚至更多样的组合索引。

用于制备多个组合索引小珠的一些实施方案包括：(a)获得包含第一多核苷酸的初级索引小珠群体，该第一多核苷酸包含第一索引，其中该初级索引小珠群体包含多个第一索引小珠亚群，其中该第一索引小珠亚群包含彼此不同的第一索引；(b)将该初级索引小珠群体拆分成多个第二小珠亚群；(c)获得次级索引小珠群体，包括：(i)使该多个第二小珠亚群的第一多核苷酸与包含第二索引的第二多核苷酸进行延伸以获得第二索引小珠亚群，其中该第二索引小珠亚群包含彼此不同的第二索引，以及(ii)组合该第二索引小珠亚群以获得该次级索引小珠群体。

一些实施方案还包括：(d)将该次级索引小珠群体拆分成多个第三小珠亚群；以及(e)获得三级索引小珠群体，包括：(i)使该多个第三小珠亚群的第二多核苷酸与包含第三索引的第三多核苷酸进行延伸以获得第三索引小珠亚群，其中该第三索引小珠亚群包含彼此不同的第三索引，以及(ii)组合该第三索引小珠亚群以获得该三级索引小珠群体。一些实施方案还重复(d)和(e)并将额外的索引添加到索引小珠亚群中，以获得甚至更多样化，从而产生甚至更多样化的组合索引。

在一些实施方案中，获得包含第一多核苷酸(其包含第一索引)的初级索引小珠群体，包括：(i)使该第一多核苷酸附着到多个第一小珠亚群以获得第一索引小珠亚群，其中该第一多核苷酸针对每个第一小珠亚群包含不同的第一索引；以及(ii)组合第一索引小珠亚群以获得初级索引小珠群体。在一些实施方案中，第一多核苷酸经由第一结合配偶体和第二结合配偶体附着到多个第一小珠亚群中的小珠。在一些实施方案中，第一结合配偶体或第二结合配偶体选自生物素、链霉亲和素、生物素衍生物、链霉亲和素衍生物、抗体和抗体的抗原结合片段。在一些实施方案中，第一多核苷酸通过共价附着(例如经由化学反应)而附着到小珠。

在一些实施方案中，第一多核苷酸包含引物结合位点。引物结合位点的示例可包括P5序列、P5'序列、P7序列和P7'序列。P5序列：AAT GAT ACG GCG ACC ACC GA(SEQ ID NO:01)；和P7序列：CAA GCA GAA GAC GGC ATA CGA GAT(SEQ ID NO:02)。在一些实施方案中，第一多核苷酸包含可切割接头。在一些实施方案中，第一多核苷酸包含通用序列。

在一些实施方案中，第一索引、第二索引和/或第三索引具有大于、小于或等于100、90、80、70、60、50、40、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2个连续核苷酸的长度，或在前述数字的任两个数字的范围内的长度。在一些实施方案中，索引或索引的组合可用于标记元件，诸如所附着的核酸或小珠。可用于本文提供的实施方案的某些方法和组合物公开于U.S.20180023119和U.S.20180355348中，这些文献各自全文以引用方式并入。

在一些实施方案中，拆分索引小珠群体，诸如初级索引小珠群体或次级索引小珠群体，可包括将这些索引小珠群体随机分配到多个隔室中。在一些实施方案中，该多个隔室包括选自孔、通道或液滴的隔室。在一些实施方案中，该多个隔室包括96孔板、192孔板或384孔板。在一些实施方案中，流通池包括多个隔室。

在一些实施方案中，该多个小珠包括磁珠。

一些实施方案还包括将多个组合索引小珠分配在阵列上。在一些实施方案中，将该多个组合索引小珠随机分配在阵列上。

一些实施方案还包括对组合索引小珠进行测序。例如，可对小珠的组合索引或其互补物进行测序。在一些实施方案中，可在阵列上对组合索引或其互补物进行测序。在一些实施方案中，测序可包括边合成边测序(SBS)。可容易地适于与本文提供的方法和组合物一起使用的示例性SBS程序、流体系统和检测平台描述于以下文献中：例如Bentley等人，Nature，第456卷：第53-59页(2008年)；WO 04/018497；美国专利申请号7,057,026；美国专利申请号7,329,492；美国专利申请号7,211,414；美国专利申请号7,315,019；美国专利申请号7,405,281，这些文献中的每一篇均以引用方式并入本文。一些实施方案还包括基于小珠的组合索引对阵列上的多个组合索引小珠中的小珠的位置进行解码。

在一些实施方案中，多个组合索引小珠中的小珠包含捕获探针。在一些实施方案中，第一多核苷酸、第二多核苷酸或第三多核苷酸包含该捕获探针。一些实施方案还包括使靶核酸与捕获探针杂交。一些实施方案还包括使捕获探针进行延伸。

包括化学连接的组合索引

本文提供的方法和组合物的一些实施方案包括通过组合索引来制备索引小珠，其中使用化学连接通过顺序添加索引来延伸附着到小珠的多核苷酸。可用于本文提供的实施方案的某些方法和组合物公开于U.S.20180127816中，该文献全文以引用方式并入。

在一些实施方案中，通过化学连接来顺序添加索引包括铜催化的叠氮化物-炔烃环加成“点击”反应(CuAAC)，以共价结合连续水平的索引寡核苷酸或多核苷酸(图3)。点击化学与DNA寡核苷酸相容，并且环状三唑产物具有与DNA中存在的磷酸二酯键相似的尺寸。环状三唑产物与存在于DNA中的磷酸二酯键具有相似尺寸使得三唑键成为许多DNA聚合酶的可行模板，并且含三唑的DNA链可通过包括聚合酶链反应(PCR)的方法进行扩增。化学连接的优点包括这样一种方法：其中不同单链多核苷酸的末端可在不存在夹板寡核苷酸或夹板衔接子的情况下通过使用过量的索引寡核苷酸或多核苷酸来接合，并且消除最终小珠代码或组合索引内的所有或仅少量不变碱基位置。此外，酶促连接步骤的不存在增加了反应条件的灵活性，因为CuAAC反应可在替代溶剂中和在非标准温度下进行。

在一些实施方案中，用于小珠代码或组合索引合成的化学连接包括两步合成策略。对于小珠代码的第一层级，用CuAAC柄(叠氮化物或炔烃)在3'端产生初始捕获寡核苷酸，诸如包含第一索引的第一多核苷酸，并且该寡核苷酸经由结合配偶(体诸如5'-生物素/链霉亲和素)与磁珠结合。对于小珠代码的第二层级，将过量的索引寡核苷酸(诸如包含第二索引的第二多核苷酸)与同源CuAAC柄(诸如3'-叠氮化物/5'炔烃，或3'-炔烃/5'-叠氮化物)和铜催化剂一起添加到结合小珠的第一多核苷酸中。在一些实施方案中，包含第二索引的多核苷酸将仅在5'端具有点击柄。当反应完成时，使小珠沉淀并洗掉任何剩余的CuAAC试剂。这导致索引层级(诸如第一多核苷酸和第二多核苷酸)之间的基本上“无疤痕”连接，而无需不变碱基来分隔这些层级。

在一些实施方案中，附着包含第三索引的第三多核苷酸可包括使用在5'端和3'端两者上具有互补点击柄的合成的第二多核苷酸；然而，这可能导致长串联体的形成。为了添加额外的索引层级同时避免多联体的形成，使用酶诸如末端脱氧核苷酸转移酶(TdT)将脱氧核糖的3'OH位置处含有点击柄的单个碱基插入到所组装的二级小珠代码的3'端。TdT几乎没有特异性地将核苷酸三磷酸附接到单链寡核苷酸的3'端，但由于点击柄阻断3'OH，因此每个寡核苷酸仅附接到单个碱基。在洗去TdT后，使用与前两个寡核苷酸的键相同的程序来添加额外的索引层级。因为点击反应可能不具有100％的效率，所以可阻断进一步的连接以避免具有“跳过”层级的组合索引。这通过添加含有互补点击柄的小分子以封闭任何未反应的3'基团来实现。

在一些实施方案中，化学连接可用于夹板连接策略以减少反应所需的寡核苷酸的量。化学连接与非标准核苷酸的使用相容。使用某些具有较高杂交特异性的非标准核苷酸允许较短的夹板寡核苷酸。例如，经修饰的核苷酸诸如肽核酸(PNA)、锁定核酸(LNA)或2'-OMe碱基可提高寡核苷酸的熔融温度而不增加长度。

图3示出了通过点击化学连接使第二索引(索引B)接合附着到底物的第一索引(索引A)的示意图的实施方案。如图3所示，包含P5序列和索引A的第一多核苷酸经由生物素/链霉亲和素结合对与小珠接合。例如，小珠包被有生物素，并且第一多核苷酸包含与链霉亲和素连接的5'端；或者小珠包被有链霉亲和素，并且第一多核苷酸包含与生物素连接的5'端。第一多核苷酸包含具有炔丙基部分的3'端。第二多核苷酸包含索引B和具有叠氮化物部分的5'端。铜催化的点击反应导致第一多核苷酸和第二多核苷酸的接合。通过首先用TdT处理连接小珠的多核苷酸以添加包含炔丙基部分的单核苷酸，从而将额外的多核苷酸添加到第二多核苷酸的3'端。包含具有叠氮化物部分的5'端的额外的多核苷酸可用于经由额外的点击反应进一步延伸连接小珠的多核苷酸。

一些实施方案包括通过化学连接反应使第一多核苷酸(诸如连接小珠的第一多核苷酸)与第二多核苷酸进行延伸。在一些实施方案中，第一多核苷酸包含末端3'修饰的脱氧核苷酸(dNTP)，该末端3'修饰的dNTP包含能够参与点击化学反应的3'官能部分。在一些实施方案中，第二多核苷酸包含末端5'修饰的核苷酸，该末端5'修饰的核苷酸包含相容性5'官能部分，该相容性5'官能部分能够参与和3'-官能部分的点击化学反应。在一些实施方案中，3'官能部分和5'官能部分能够彼此反应，以形成经修饰的主链键。

在一些实施方案中，使第一多核苷酸与第二多核苷酸进行延伸获得次级索引多核苷酸，并且该方法还包括修饰该次级索引多核苷酸以获得包含末端3'修饰的核苷酸的经修饰的多核苷酸，该末端3'修饰的核苷酸包含能够参与点击化学反应的3'官能部分。在一些实施方案中，该修饰包括使该次级索引多核苷酸与模板非依赖性聚合酶接触。在一些实施方案中，该模板非依赖性聚合酶选自末端脱氧核苷酸转移酶(TdT)、PolyA聚合酶或添加CCA的RNA聚合酶。在一些实施方案中，该模板非依赖性聚合酶是TdT。

一些实施方案还包括通过化学连接反应使经修饰的多核苷酸与第三多核苷酸进行延伸，其中该第三多核苷酸包含末端5'修饰的核苷酸，该末端5'修饰的核苷酸包含相容性5'官能部分，该相容性5'官能部分能够参与和3'官能部分的点击化学反应。

在一些实施方案中，3'官能部分选自叠氮化物、炔基、烯基、硫醇和硝酮。在一些实施方案中，5'官能部分不同于3'官能部分并且与该3'官能部分相容，并且该5'官能部分选自叠氮化物、炔基、烯基、硫醇和硝酮。在一些实施方案中，3'官能部分和5'官能部分选自以下对：(i)3'-叠氮基/5'-炔基；(ii)3'-炔基/5'叠氮基；(iii)3'-硫醇/5'-炔基；(iv)3'-硫醇/5'-烯基；(v)3'-炔基/5'-硫醇；(vi)3'-烯基/5'-硫醇；(vii)3'-叠氮基/5'-环辛炔基；(viii)3'-环辛炔/5'-叠氮基；(ix)3'-硝酮/5'-环辛炔基；和(x)3'-环辛炔基/5'-硝酮。在一些实施方案中，3'官能部分是3'-叠氮基，并且5'官能部分是5'-炔基。在一些实施方案中，如果在L1/L2索引和L2/L3索引之间使用正交点击反应，则可避免TdT步骤。

包括聚合酶延伸的组合索引

本文提供的方法和组合物的一些实施方案包括通过组合索引来制备索引小珠，其中通过聚合酶延伸通过顺序添加索引来延伸附着到小珠的多核苷酸。

在一些实施方案中，衔接子包含寡核苷酸，该寡核苷酸含有以下两者：与结合小珠的第一多核苷酸(其包含第一索引)的3'接头(L1A)区互补的3'区，以及第二索引序列的反向互补物(图4)。衔接子寡核苷酸与结合小珠的第一多核苷酸杂交，并且DNA聚合酶和dNTP延伸第一多核苷酸，产生共价连接的、结合小珠的寡核苷酸，该寡核苷酸在其3'端含有衔接子的互补物。因为衔接子直接与第一多核苷酸杂交，所以一半数量的碱基足以实现类似的结合特异性，诸如8个碱基对当前夹板连接工作流程的16个碱基。一旦聚合完成，衔接子可通过使用热、碱(NaOH)变性或用USER酶处理来去除，例如在衔接子包含代替胸腺嘧啶的脱氧尿嘧啶(deoxyUracil)残基的情况下。可通过将包含第三索引的第二衔接子与所延伸的第一多核苷酸的3'端杂交，并使用聚合反应和所杂交的第二衔接子使所延伸的第一多核苷酸进一步延伸，从而添加额外的索引层级。在一些实施方案中，为了防止聚合酶使用衔接头的3'端作为引物并产生不期望的产物，可阻断衔接头的3'端，例如用3'2'双脱氧核苷酸、C3接头或其他标准阻断化学物质进行阻断。

图4示出了通过顺序聚合酶延伸反应来添加附着到底物的第一索引(索引A)、第二索引(索引B)和第三索引(索引C)的示意图的实施方案。如图4所示，包含P5序列、索引A和第一接头(连接1a)的第一多核苷酸经由生物素/链霉亲和素结合对与小珠接合。例如，小珠包被有生物素，并且第一多核苷酸包含与链霉亲和素连接的5'端；或者小珠包被有链霉亲和素，并且第一多核苷酸包含与生物素连接的5'端。使包含能够与第一接头杂交的区域、索引B'和接头2a'的第一衔接子与第一接头杂交，并且在存在聚合酶的情况下延伸第一多核苷酸，以获得包含索引A和B的延伸的多核苷酸。去除第一衔接子。使包含能够与接头2a杂交的区域、索引C'和捕获探针'(Hyb')的第二衔接子与包含索引A和B的延伸的多核苷酸的接头2a区域杂交，并且在存在聚合酶的情况下进一步延伸包含索引A和B的延伸的多核苷酸，以获得包含索引A、B和C以及捕获探针(Hyb)的延伸的多核苷酸。

一些实施方案包括通过聚合酶延伸使第一多核苷酸进行延伸。在一些实施方案中，第一多核苷酸包含第一接头。一些实施方案还包括(i)获得第一衔接子，该第一衔接子包含能够与第一接头杂交的区域和包含第二索引或第二索引的互补物的区域；(ii)使第一衔接子与第一接头杂交；以及(iii)使第一多核苷酸进行延伸以获得次级索引多核苷酸。在一些实施方案中，第一衔接子包含不可延伸的3'端。在一些实施方案中，不可延伸的3'端包含3'2'双脱氧核苷酸或C3接头，诸如3-碳间隔臂。一些实施方案还包括从次级索引多核苷酸中去除第一衔接子。在一些实施方案中，该去除包括通过热或碱使第一衔接子变性，或通过酶促降解使第一衔接子降解。在一些实施方案中，第一接头具有小于10、9、8、7、6、5、4、3或2个连续核苷酸的长度。在一些实施方案中，第一接头具有小于5个连续核苷酸的长度。

在一些实施方案中，获得三级索引小珠群体包括通过聚合酶延伸使第二多核苷酸进行延伸。在一些实施方案中，第一衔接子包含第二接头的互补物，使得次级索引多核苷酸包含第二接头。一些实施方案还包括(i)获得第二衔接子，该第二衔接子包含能够与第二接头杂交的区域和包含第三索引或第三索引的互补物的区域；(ii)使第二衔接子与第二接头杂交；以及(iii)使次级索引多核苷酸进行延伸以获得三级索引多核苷酸。在一些实施方案中，第二衔接子包含不可延伸的3'端。在一些实施方案中，该不可延伸的3'端包含3'2'双脱氧核苷酸或C3接头。一些实施方案还包括从三级索引多核苷酸中去除第二衔接子。在一些实施方案中，该去除包括通过热或碱使第一衔接子变性，或通过酶促降解使第一衔接子降解。在一些实施方案中，第二接头具有小于10、9、8、7、6、5、4、3或2个连续核苷酸的长度。在一些实施方案中，第二接头具有小于5个连续核苷酸的长度。

包括双链片段的连接的组合索引

本文提供的方法和组合物的一些实施方案包括通过组合索引来制备索引小珠，其中通过连接包含第二多核苷酸和双链区域的衔接子通过顺序添加索引来延伸附着到小珠的多核苷酸。在一些实施方案中，部分双链衔接子的使用意味着单个接头序列可用于将额外的索引连接到连接小珠的寡核苷酸，从而与一些其他方法相比减少组合索引的寡核苷酸中的接头序列的长度。例如，图15A(左图)示出了标准夹板连接的示例性实施方案，其中夹板含有两个接头序列“KS-3”和“KS-5”，这两个接头序列分别与连接小珠的寡核苷酸中的“KS-3'”序列以及含有索引2的衔接子序列中的“KS-5'”序列退火。相反，图15A(右图)中所示的双链夹板连接的示例性实施方案示出了含有单个接头序列“KS-3”的双链夹板，该单个接头序列足以将含有索引的衔接子序列连接到连接小珠的寡核苷酸。

一些实施方案包括使用包含索引寡核苷酸的双链衔接头，这些索引寡核苷酸具有从双链体的两条链的3'端延伸的互补突出端(参见例如图5、图15A和图19A)。一些此类实施方案将小珠代码中不变碱基的数量减少了多达50％，因为仅互补碱基的单个区域就足以用于组装。从包含第一索引的结合小珠的第一多核苷酸开始，将包含双链片段的衔接子添加到小珠中并允许杂交，该双链片段具有与第一多核苷酸的3'端互补的3'突出端。然后通过酶促或化学连接将含有索引序列和用于下一索引层级的3'杂交序列的“顶部”片段连接到第一多核苷酸。一旦连接完成，就可通过变性去除衔接子的双链索引部分的底部链，并且可通过相同的程序添加额外的索引层级。在一些实施方案中，在连接期间可存在额外的单链寡核苷酸(参见例如图12，右图“索引1'寡核苷酸”)。额外的寡核苷酸可与结合小珠的多核苷酸的索引序列杂交。在一些此类实施方案中，额外的寡核苷酸可进一步稳定连接复合物并促进连接。

图5示出了使用包含双链区域和单链突出端的衔接子来添加附着到底物的第一索引(索引A)、第二索引(索引B)和第三索引(索引C)的示意图的实施方案。如图5所示，包含P5序列、索引A和第一接头(连接1a)的第一多核苷酸经由生物素/链霉亲和素结合对与小珠接合。例如，小珠包被有生物素，并且第一多核苷酸包含与链霉亲和素连接的5'端；或者小珠包被有链霉亲和素，并且第一多核苷酸包含与生物素连接的5'端。使包含单链5'突出端的第一衔接子与第一接头杂交，该单链5'突出端包含能够与第一接头杂交的区域、包含索引B的双链区域和包含第二接头(连接2a)的区域。通过使用连接酶的连接，或者通过化学连接，将第一衔接子分别经由第一多核苷酸和衔接子的接头1a和索引B区域与第一多核苷酸共价接合，以获得包含索引A和B的延伸的多核苷酸。去除未与第一多核苷酸共价接合的第一衔接子的链。使包含单链5'突出端的第二衔接子与第二接头杂交，该单链5'突出端包含能够与第二接头杂交的区域、包含索引C的双链区域和捕获探针(Hyb)。通过使用连接酶的连接，或者通过化学连接，将第二衔接子分别经由第一多核苷酸和衔接子的接头1a和索引B区域与延伸的第一多核苷酸共价接合，以获得包含索引A、B和C以及捕获探针(Hyb)的延伸的多核苷酸。去除未与包含索引A、B和C以及捕获探针(Hyb)的延伸的多核苷酸共价接合的第二衔接子的链。

图19A示出了组合索引的额外的示例性实施方案，其中通过连接包含第二多核苷酸和双链区域的衔接子，通过顺序添加索引来延伸附着到小珠的多核苷酸。如图19A所示，包含P5序列、索引1和KS-3'序列的寡核苷酸经由生物素(B)和链霉亲和素(SA)连接到小珠。其中一条链包含KS-3序列、索引2'和MS-3序列并且另一条链包含索引2序列和MS-3'序列的部分双链衔接头经由KS-3和KS-3'序列与连接小珠的寡核苷酸退火。衔接头序列与连接小珠的序列连接，以形成与衔接头的链杂交的延伸的连接小珠的寡核苷酸。将衔接头的链通过变性去除。进行第二轮索引。

一些实施方案包括通过连接使第一多核苷酸与第二多核苷酸进行延伸。一些实施方案还包括(i)获得双链第一衔接子和3'单链突出端，该双链第一衔接子包含第二多核苷酸，该3'单链突出端能够与第一多核苷酸的第一接头杂交；(ii)使第一衔接子与第一接头杂交；以及(iii)使第一多核苷酸与第二多核苷酸连接以获得次级索引多核苷酸。一些实施方案还包括通过连接使第二多核苷酸与第三多核苷酸进行延伸。一些实施方案还包括(i)获得双链第二衔接子和3'单链突出端，该双链第二衔接子包含第三多核苷酸，该3'单链突出端能够与第二多核苷酸的第二接头杂交；(ii)使第二衔接子与第二接头杂交；以及(iii)使第二多核苷酸与第三多核苷酸连接以获得三级索引多核苷酸。在一些实施方案中，该连接包括使用连接酶。在一些实施方案中，连接包括化学连接反应，诸如本文所公开的点击化学反应。

包括夹板连接的组合索引

本文提供的方法和组合物的一些实施方案包括通过组合索引来制备索引小珠，其中通过夹板连接通过顺序添加索引来延伸附着到小珠的多核苷酸，其中该夹板包含具有增加的杂交特异性的核苷酸。在一些实施方案中，该夹板包含与互补序列具有更强结合的核苷酸，例如包含导致核苷酸序列的Tm增加的核苷酸的核苷酸序列。在一些实施方案中，该夹板包含一种或多种经修饰的核苷酸或核苷酸类似物。在一些实施方案中，该夹板包含锁定核酸(LNA)。在一些实施方案中，该夹板包含一种或多种肌苷核苷酸。

一些实施方案包括使用夹板连接将连续层级的索引与夹板中数量减少的碱基连接，该夹板包含经化学修饰的碱基，这些经化学修饰的碱基增加夹板和索引/捕获寡核苷酸之间的杂交强度(图6)。在它们的当前形式中，夹板序列为8个核苷酸长，其中变性的中点(Tm)接近室温(25℃)。这确保了夹板可在室温连接反应期间结合捕获寡核苷酸和索引寡核苷酸两者。

图6示出了通过使用短接头-夹板的顺序夹板连接反应来添加附着到底物的第一索引(索引A)、第二索引(索引B)和第三索引(索引C)的示意图的实施方案。如图6所示，包含P5序列、索引A和第一接头(连接1a)的第一多核苷酸经由生物素/链霉亲和素结合对与小珠接合。例如，小珠包被有生物素，并且第一多核苷酸包含与链霉亲和素连接的5'端；或者小珠包被有链霉亲和素，并且第一多核苷酸包含与生物素连接的5'端。第二多核苷酸包含第二接头(连接1b)、索引B和第三接头(连接2a)。使包含能够与第一接头杂交的区域和能够与第二接头杂交的区域的单链第一衔接子(诸如夹板)与第一多核苷酸的第一接头和第二多核苷酸的第二接头两者杂交。第一多核苷酸通过连接与第二多核苷酸共价接合，诸如通过使用连接酶，以获得包含索引A和B以及第三接头(连接2a)的延伸的多核苷酸。去除第一衔接子。第三多核苷酸包含第四接头(连接2b)、索引C和捕获探针(Hyb)。使包含能够与第三接头杂交的区域和能够与第四接头杂交的区域的单链第二衔接子(诸如夹板)与延伸多核苷酸的第三接头和第三多核苷酸的第四接头两者杂交。第三多核苷酸通过连接与延伸的多核苷酸共价接合，诸如通过使用连接酶，以获得包含索引A、B和C以及捕获探针的延伸的多核苷酸。去除第二衔接子。

一些实施方案包括通过连接使第一多核苷酸进行延伸，其中第一多核苷酸包含第一接头，并且第二多核苷酸包含第二接头。一些实施方案还包括(i)获得第一衔接子，该第一衔接子包含能够与第一接头杂交的区域和能够与第二接头杂交的区域；(ii)使第一衔接子与第一接头杂交；(iii)使第二寡核苷酸与能够与第二接头杂交的区域杂交；以及(iv)使第一多核苷酸与第二多核苷酸连接以获得次级索引多核苷酸。在一些实施方案中，第一接头和/或第二接头具有小于10、9、8、7、6、5、4、3或2个连续核苷酸的长度。在一些实施方案中，第一接头和/或第二接头具有小于5个连续核苷酸的长度。在一些实施方案中，和与第一衔接子具有相同长度的寡核苷酸相比，第一接头和/或第二接头被修饰为具有增加的Tm。在一些实施方案中，与具有相同长度的寡核苷酸相比，第一接头和/或第二接头包含增加的G/C含量，或包含经修饰的核苷酸。一些实施方案还包括从次级索引多核苷酸中去除第一衔接子。在一些实施方案中，该去除包括通过热或碱使第一衔接子变性，或通过酶促降解使第一衔接子降解。

在一些实施方案中，获得三级索引小珠群体包括通过连接使第二多核苷酸进行延伸，其中第二寡核苷酸包含第三接头，使得次级索引多核苷酸包含第三接头，并且其中第三多核苷酸包含第四接头。一些实施方案还包括(i)获得第二衔接子，该第二衔接子包含能够与第三接头杂交的区域和能够与第四接头杂交的区域；(ii)使第二衔接子与第三接头杂交；(iii)使第三多核苷酸经由能够与第四索引杂交的区域与第二衔接子杂交；以及(iv)使次级索引多核苷酸与第三多核苷酸连接以获得三级索引多核苷酸。在一些实施方案中，第三接头和/或第四接头具有小于9、8、7、6、5、4、3或2个连续核苷酸的长度。在一些实施方案中，第三接头和/或第四接头具有小于5个连续核苷酸的长度。在一些实施方案中，和与第二衔接子具有相同长度的寡核苷酸相比，第三接头和/或第四接头被修饰为具有增加的Tm。在一些实施方案中，与具有相同长度的寡核苷酸相比，第三接头和/或第四接头包含增加的G/C含量，或者包含经修饰的核苷酸。一些实施方案还包括从三级索引多核苷酸中去除第二衔接子。在一些实施方案中，该去除包括通过热或碱使第一衔接子变性，或通过酶促降解使第一衔接子降解。

靶核酸的测序和分析

一些实施方案包括靶核酸的测序和/或分析。可用于本文提供的实施方案的某些方法和组合物公开于U.S.2021/0087613中，该文献全文以引用方式并入。一些实施方案包括根据本文提供的方法解码多核苷酸在阵列中的位置；使靶核酸与捕获探针杂交；使捕获探针延伸；以及检测在阵列上的某个位置处与靶核酸杂交的捕获探针的延伸。在一些实施方案中，在使靶核酸与多核苷酸杂交之前，可解码多核苷酸在阵列上的位置。在一些实施方案中，在检测到与靶核酸杂交的捕获探针的延伸之后，可解码多核苷酸在阵列上的位置。在一些此类实施方案中，每个多核苷酸可通过共同元件与捕获探针相关联。例如，多核苷酸和捕获探针可各自结合到相同的微特征诸如小珠。在更多此类实施方案中，每个多核苷酸可包含捕获探针。

一些实施方案包括捕获探针的单碱基延伸(SBE)。在一些实施方案中，SBE可用于检测靶核酸中的等位基因、突变或其他特征。简而言之，SBE利用在接近或邻近检测位置的位置处与靶基因组片段杂交的捕获探针，该检测位置指示特定基因座。聚合酶可用于用标记有检测标记的核苷酸类似物来延伸捕获探针的3'端。基于酶的保真度，仅当核苷酸与靶核酸中的检测位置互补时，才将该核苷酸掺入捕获探针中。如果需要，可将核苷酸衍生化，使得使用封闭基团(包括可逆的封闭基团)不会发生进一步的延伸，因此仅添加单个核苷酸。可例如在阵列中的特定位置处检测延伸的捕获探针中标记的核苷酸的存在，并且识别所添加的核苷酸以确定基因座或等位基因的种类。SBE可在已知条件下进行，诸如描述于美国专利号9,441,267和9,045,796中的那些，这些专利中的每一篇均全文以引用方式并入。

一些实施方案包括等位基因特异性引物延伸(ASPE)。在一些实施方案中，ASPE可包括在其3'端核苷酸组成不同的捕获探针的延伸。ASPE方法可使用含有可切割接头的核苷或核苷酸进行，使得可在检测到探针之后移除标记。这允许进一步使用探针或验证检测到的信号是由于现在已被移除的标记。简而言之，ASPE可通过使靶核酸与捕获探针杂交来进行，该捕获探针具有与检测位置互补的3'序列部分和与邻近检测位置的序列互补的5'部分。捕获探针的3'部分的模板指导修饰，例如通过聚合酶添加标记的核苷酸，产生标记的延伸产物，但仅在模板包括靶序列的情况下。然后可检测这种标记的引物延伸产物的存在，例如，基于其在阵列中的位置来指示特定等位基因的存在。在一些实施方案中，ASPE可用多个捕获探针进行，这些多个捕获探针具有相似的5'端，使得它们在靶核酸中的相同检测位置附近退火，但具有不同的3'端，使得聚合酶仅修饰具有与检测位置互补的3'端的捕获探针。具有与特定检测位置互补的3'端碱基的捕获探针被称为该位置的完全匹配(PM)探针，而具有3'端错配碱基并且不能在ASPE反应中延伸的捕获探针是该位置的错配(MM)探针。可检测PM探针中标记的核苷酸的存在，并确定捕获探针的3'序列以识别在检测位置处的特定等位基因。

试剂盒和系统

本文提供的一些实施方案包括试剂盒和系统。一些此类实施方案可包括用于执行本文提供的某些方法的试剂，包括小珠、多孔板、酶(诸如连接酶和聚合酶)、多核苷酸、结合对(诸如生物素和链霉亲和素或它们的衍生物)以及点击化学试剂。

实施例

实施例1—通过点击化学连接合成小珠代码

多个小珠包被有链霉亲和素并被分配在第一96孔板的孔中。将不同的第一多核苷酸分配到每个孔中。每个第一多核苷酸包含与生物素连接的5'端，使得第一多核苷酸经由生物素/链霉亲和素结合对与小珠接合。第一多核苷酸包含P5序列、索引A和具有炔丙基部分的3'端。每个孔中的第一多核苷酸与不同孔中的第一多核苷酸具有不同的索引A。将小珠合并并分配到第二96孔板的孔中。

将第二多核苷酸添加到第二96孔板的每个孔中。第二多核苷酸包含索引B和具有叠氮化物部分的5'端。每个孔的索引B是不同的。在每个孔中进行铜催化的点击反应，并导致第一核苷酸和第二多核苷酸的接合。用TdT处理连接小珠的多核苷酸，以添加包含炔丙基部分的单个核苷酸。将小珠合并并分配到第三96孔板的孔中。

将额外的多核苷酸添加到第二多核苷酸的3'端中。包含具有叠氮化物部分和索引C的5'端的第三多核苷酸可用于经由额外的点击反应进一步延伸连接小珠的多核苷酸。每个孔的索引C是不同的。

实施例2—包括聚合酶延伸的组合索引

多个小珠包被有链霉亲和素并被分配在第一96孔板的孔中。将不同的第一多核苷酸分配到每个孔中。每个第一多核苷酸包含与生物素连接的5'端，使得第一多核苷酸经由生物素/链霉亲和素结合对与小珠接合。第一多核苷酸包含P5序列、索引A和8个核苷酸的第一接头。每个孔中的第一多核苷酸与不同孔中的第一多核苷酸具有不同的索引A。将小珠合并并分配到第二96孔板的孔中。

将第一衔接子添加到第二96孔板的每个孔中。第一衔接子包含能够与第一接头杂交的区域、索引B'序列和接头2a'。每个孔的索引B'序列是不同的。使第一衔接子与第一接头杂交，并且在存在聚合酶的情况下延伸第一多核苷酸，以获得包含索引A和B的延伸的多核苷酸。从小珠中去除第一衔接子。将小珠合并并分配到第三96孔板的孔中。

将第二衔接子添加到第三96孔板的每个孔中。第二衔接子包含能够与接头2a杂交的区域、索引C'和捕获探针'(Hyb')。在一些实施方案中，捕获探针可用于这样的特定应用：其中将通用转座体附着到连接小珠的寡核苷酸的3'端，并且可能与索引无关(即，这可以是取决于该应用的任何序列)。每个孔的索引C'序列是不同的。使第二衔接子与包含索引A和B的延伸的多核苷酸的接头2a区域杂交，并且在存在聚合酶的情况下进一步延伸包含索引A和B的延伸的多核苷酸，以获得包含索引A、B和C以及捕获探针(Hyb)的延伸的多核苷酸。从小珠中去除第二衔接子。

实施例3—包括双链片段的连接的组合索引

将第一衔接子添加到第二96孔板的每个孔中。第一衔接子包含单链5'突出端，该单链5'突出端包含能够与第一接头杂交的区域、包含索引B的双链区域和包含第二接头(连接2a)的区域。每个孔的索引B是不同的。使第一衔接子头与第一接头杂交。通过使用连接酶的连接，或者通过化学连接，将第一衔接子分别经由第一多核苷酸和衔接子的接头1a和索引B区域与第一多核苷酸共价接合，以获得包含索引A和B的延伸的多核苷酸。去除未与第一多核苷酸共价接合的第一衔接子的链。将小珠合并并分配到第三96孔板的孔中。

将第二衔接子添加到第三96孔板的每个孔中。第二衔接子包含单链5'突出端，该单链5'突出端包含能够与第二接头杂交的区域、包含索引C的双链区域和捕获探针(Hyb)。使第二衔接子与第二接头杂交。通过使用连接酶的连接，或者通过化学连接，将第二衔接子分别经由第一多核苷酸和衔接子的接头1a和索引B区域与延伸的第一多核苷酸共价接合，以获得包含索引A、B和C以及捕获探针(Hyb)的延伸的多核苷酸。从小珠中去除未与包含索引A、B和C以及捕获探针(Hyb)的延伸的多核苷酸共价接合的第二衔接子的链。

实施例4—包括夹板连接的组合索引

多个小珠包被有链霉亲和素并被分配在第一96孔板的孔中。将不同的第一多核苷酸分配到每个孔中。每个第一多核苷酸包含与生物素连接的5'端，使得第一多核苷酸经由生物素/链霉亲和素结合对与小珠接合。第一多核苷酸包含P5序列、索引A和第一接头。每个孔中的第一多核苷酸与不同孔中的第一多核苷酸具有不同的索引A。将小珠合并并分配到第二96孔板的孔中。

将第二多核苷酸添加到第二96孔板的每个孔中。第二多核苷酸包含第二接头(连接1b)、索引B和第三接头(连接2a)。每个孔的索引B是不同的。将包含能够与第一接头杂交的区域和能够与第二接头杂交的区域的单链第一衔接子(诸如夹板)添加到每个孔中。使第一衔接子与第一多核苷酸的第一接头和第二多核苷酸的第二接头两者杂交。第一多核苷酸通过连接与第二多核苷酸共价接合，诸如通过使用连接酶，以获得包含索引A和B以及第三接头(连接2a)的延伸的多核苷酸。去除第一衔接子。将小珠合并并分配到第三96孔板的孔中。

将第三多核苷酸添加到第三96孔板的每个孔中。第三多核苷酸包含第四接头(连接2b)、索引C和捕获探针(Hyb)。每个孔的索引B是不同的。将包含能够与第三接头杂交的区域和能够与第四接头杂交的区域的单链第二衔接子(诸如夹板)添加到每个孔中。使第二衔接子与延伸的多核苷酸的第三接头和第三多核苷酸的第四接头两者杂交。第三多核苷酸通过连接与延伸的多核苷酸共价接合，诸如通过使用连接酶，以获得包含索引A、B和C以及捕获探针的延伸的多核苷酸。从小珠中去除第二衔接子。

实施例5—包括聚合酶延伸的组合索引

将包括聚合酶延伸的组合索引(参见例如图4)与包括夹板连接的组合索引(参见例如图2)进行比较。使用具有捕获寡核苷酸(P5-索引A-连接1a)和延伸模版(连接1a'-索引B'-Hyb')的小珠执行通过聚合酶延伸的2级索引方案。用不同量的模板以及具有和不具有核酸外切酶活性的T4聚合酶进行聚合酶延伸。使用定量PCR(qPCR)测量捕获探针的数量和全长产物的数量，其中引物位于图7A所示的位置。如图7B所示，(1)T4聚合酶(Exo+)降解捕获探针和延伸模板；(2)T4聚合酶(Exo-)对捕获寡核苷酸表现出减少的降解；(3)捕获寡核苷酸上50X过量的延伸模板(330fmol/μg)足以使用T4聚合酶(Exo-)进行全长延伸。

图8A和图8B总结了在3级索引方案中测试的各种条件。体积为25μl/条件，一式两份。聚合酶延伸在20℃下进行15分钟(无旋转)，并且用NaOH延伸寡核苷酸变性。夹板连接进行过夜和4小时(无旋转)，并且在60℃下夹板变性。读出包括定量PCR(qPCR)测定和直接小珠代码测序。对于qPCR，使用化学合成的全长对照寡核苷酸(与相应的3级PE或SL寡核苷酸相同的序列)来产生用于定量的标准曲线。根据大小差异来调节夹板连接(SL)2级和3级扩增子的浓度。

图9总结了qPCR结果并表明PE(8)比SL(12)产生更少的全长寡核苷酸。与SL相比，PE的合成效率较低，例如，PE:20％的寡核苷酸是全长的，并且SL:40％的寡核苷酸是全长的，这可能是由于第二连接比第一连接的效率低得多(12)，以及/或者在没有旋转的情况下在20℃下孵育。与全长(FL)PE(1)和SL(10至12)相比，经历PE的样品显示出较低的捕获寡核苷酸(CO)分子/小珠(3至8)。每次延伸减少了CO分子/小珠(3至5与6至8)。一些损失是由于NaOH洗涤将生物寡核苷酸从小珠上剥离。如在(6)与(7和8)以及(3)与(5)中，一些损失可能是由于T4聚合酶回切寡核苷酸，但这在(3)与(4)中未观察到。

测试0.2N NaOH在变性步骤中的作用。在5种不同的变性处理和对照中，在不进行延伸/连接的情况下使用具有6.6fmol的1级寡核苷酸(B1索引)的小珠，该寡核苷酸经由5'生物素或5'双脱硫生物素与小珠结合：无(-对照)；无变性，仅洗涤步骤(每种层级2次洗涤，总共4次)；2次60℃加热变性+洗涤；2次80℃加热变性+洗涤；1次0.2N NaOH变性+洗涤；以及2次0.2N NaOH变性+洗涤。通过qPCR w/1级引物来测量剩余的寡核苷酸。结果总结在图10中，其显示0.2N NaOH变性引起生物素特异性CO损失。

进行直接小珠代码测序分析以进行3级索引。简言之，该测定涉及使用靶向Hyb区域的P5正向引物和反向引物，通过PCR从小珠扩增合成的小珠代码寡核苷酸。将反向引物引入样品索引、ME_V2_B15测序引物的结合区域和P7'序列以实现聚集。图11A概述了用于分析的读取方向。该分析包括针对预期序列的每次读取的修剪和成对比对，其中错误调用包括缺失和推定的“SNP”的鉴定，这指示序列中的碱基改变错误。完全正确的索引不包括跨索引区域的错误(SNP、插入缺失)，例如在3级索引：索引1、索引2和索引3中。所有可用的索引包括可利用索引纠错实施方式正确解码的那些索引。图11B和图11C示出了完全正确的序列、可用索引和每碱基错误率的水平。夹板连接比聚合酶延伸更有效，同时两者具有相似水平的误差。

根据前述研究，3级聚合酶延伸产生比夹板连接更少的全长分子。添加0.2N NaOH变性和T4聚合酶核酸外切酶活性可能有助于减少总捕获寡核苷酸。在该实验中，聚合酶延伸似乎不如夹板连接有效。0.2N NaOH变性导致小珠损失生物素化的寡核苷酸，尽管这可通过用5'双脱硫生物素替换单个5'生物素来减轻。与夹板连接方法相比，合成的聚合酶延伸寡核苷酸具有相似水平的误差。

实施例6—使用双链夹板连接的2级索引

将包括双链夹板连接的2级索引与包括夹板连接(标准)的2级索引进行比较。图12A中示出了对通过夹板连接和双链夹板连接的标准组合索引的概述。与标准夹板连接相比，在双链方法中，夹板的5'一半可与二级索引互补，从而将索引之间的共同序列长度减半。所测试的方案和条件的概述描述于图12B中。

进行qPCR测定，并使用全长夹板连接和双链连接寡核苷酸产生标准曲线。包括夹板连接(标准)的组合索引和包括双链夹板连接(dsindex连接)的组合索引的引物位置显示在图12C中，其中使用包括F2和R2或F3和R2的引物组合来确定产物。使用每个样品的适当标准曲线来测定浓度。图13A示出了qPCR的结果，并且图13B和图13C示出了标准化qPCR的结果，其中合成的ds索引连接寡核苷酸与夹板连接寡核苷酸相似。在归一化SL和DS全长对照寡核苷酸之间的差异扩增后，DS连接和夹板连接的寡核苷酸显示出相似的性能。

用增加量的ds索引寡核苷酸进行双链夹板连接，并用qPCR测量产物。如图13D所示，产物的量没有显著增加。在与索引1互补的寡核苷酸的存在下进行双链夹板连接，并用qPCR测量产物。如图13E所示，在存在与索引1互补的寡核苷酸的情况下进行双链夹板连接时，产物的量没有显著增加。用具有3'ddC的寡核苷酸进行双链夹板连接，并用qPCR测量产物。如图13F所示，在用具有3'ddC的寡核苷酸进行双链夹板连接时，产物的量没有显著增加。进行双链夹板连接，包括在室温或75℃下预连接孵育，并用qPCR测量产物。如图13G所示，当在室温或75℃下用预连接孵育进行双链夹板连接时，产物的量没有显著增加。

进行2级双链索引连接的直接小珠代码测序。结果总结在图14A和图14B中。

根据前述2级实验，双链索引连接给出与夹板连接相似的结果，如通过qPCR所测量的。对于高于33fmol/μg小珠的双链索引量，单次连接的全长产物没有显著增加，或者小珠代码内的错误增加。以下操作几乎没有效果：(1)添加与索引1互补的寡核苷酸；(2)去除3'ddC修饰；或者(3)用室温孵育代替75℃下的预连接孵育。此外，与夹板连接相比，小珠代码测序显示双链连接较少的错误。

实施例7—使用双链夹板连接的3级索引

将包括双链夹板连接的3级索引与包括夹板连接(标准)的3级索引进行比较。实验设计的概述示于图15A和图15B中。

使用双链夹板连接或夹板连接对3级索引产物进行qPCR。使用全长双链连接索引对照作为标准曲线(更高纯度)，并对夹板连接扩增子的浓度进行大小调整。结果总结于图16A中。对于夹板连接，在80℃变性减少了寡核苷酸的总数(2与3)，在50℃退火略微增加了寡核苷酸的总数(3与4)。对于夹板连接与ds连接，在50℃下退火和在80℃下变性，用夹板和ds连接方法得到相当数量的全长寡核苷酸(4与7)，寡核苷酸是全长的(3级寡核苷酸对生物寡核苷酸)，并且ds连接显示较低数量的2级寡核苷酸。对于全长对照，存在较低的分子总数，可能是由于纯度问题。

进行3级双链索引连接的直接小珠代码测序。结果总结于图16B和图16C中。

根据前述双链夹板连接研究，夹板连接和ds连接给出了相当数量的全长寡核苷酸，并且在80℃变性导致损失一些捕获寡核苷酸(COs)，但是在50℃退火略微增加了COs的数量。通过ds连接合成的COs比通过夹板连接合成的COs具有更少的错误。

实施例8—含LNA的夹板寡聚物

缩短的第一夹板(kangaroo夹板)被设计成含有锁定核酸核苷酸(LNA)。kangaroo夹板基于序列：(SEQ ID NO:03)ATGCTCTAGACAAGT/3ddC，其中“3ddC”是3'双脱氧胞苷。产生的夹板包括从5'端和3'端两者缩短的那些夹板(这些夹板全都保留了最后一个碱基双脱氧胞苷(ddC))，以及含有所有可能的LNA取代的那些夹板。产生的寡核苷酸用IDT的寡核苷酸分析仪(Integrated DNA Technologies^TM，Coralville，Iowa)进行分析。产生的寡核苷酸根据Qiagen对LNA寡核苷酸的设计指南进行选择，包括：在30％至60％之间的GC含量；行中<4个LNA碱基；行中<3个Gs或Cs。选择具有与初始夹板相似的Tm并在与连接位点互补的碱基位置处没有任何LNA的产生的寡核苷酸。选择在室温下没有次级结构或自杂交并且不与P5或Hyb序列互补的产生的寡核苷酸。表2列出了三种示例性寡核苷酸。

表2

5'TM和3'TM使用IDT的寡核苷酸分析仪进行计算，其中设定如下(基于连接反应)：1.98μM寡核苷酸，100mM Na⁺，7.9mM Mg⁺⁺。全长TM使用IDT的寡核苷酸分析仪进行计算，其中设定如下(基于夹板变性)：0.05μM寡核苷酸，100mM Na⁺。该实验的概述示于图17中。

实施例9—减少接头序列长度的经修饰的夹板寡核苷酸

另外的夹板被设计成其中磷酸化寡核苷酸夹板杂交序列减少到6个核苷酸，并且G/C含量增加。针对新的磷酸化寡核苷酸设计了多个夹板。所设计的夹板的概述示于图18A中，该图示出了列于表3中的序列，其中X为肌苷。

表3

SEQ ID NO:	序列
		SEQ ID NO:07	GACTTGTCCGGTGG
SEQ ID NO:08	CTGAACAGGCCACC
		SEQ ID NO:09	CTGAACAGGCCA
SEQ ID NO:10	GAACAGGCCACC
		SEQ ID NO:11	CTGAACAGGCCACCX
SEQ ID NO:12	CTGAACAGGCCACCXX
		SEQ ID NO:13	CTGAACAGGCCAXX
SEQ ID NO:14	CTGAACAGGCCAXXXX

实验条件的总结示于图18B中。测试条件包括20℃与12℃的夹板连接，其在热循环仪(无旋转)中进行过夜。使用快速冷却方案(在75℃下孵育，立即转移至冰中)或缓慢退火(样品在热循环仪中在75℃下孵育，然后温度以1℃/30s的下降速率逐渐降低)进行DS寡核苷酸退火。qPCR测量捕获寡核苷酸和全长寡核苷酸。结果总结于图18C中，其显示使用重新设计的6个核苷酸磷酸化寡核苷酸/夹板的连接少约10％至20％。使用重新设计的4个核苷酸夹板的连接少约40％至50％。根据图18A中所示的“6bp_New_6bp-K splint”的结果(其具有所测试夹板的夹板的最短3'部分)，据推测，将夹板的3'一半减少到仅6个核苷酸会降低连接效率约90％。缓慢退火对全长寡核苷酸的数量几乎没有影响。添加肌苷碱基可能没有改善连接效率。用肌苷替换碱基可能会降低连接效率。总之，重新设计夹板序列并将夹板的5'端缩短为6个核苷酸和4个核苷酸会降低连接效率，即使在低于夹板Tm的情况下进行连接时也是如此。将肌苷添加到夹板的5'端没有改善连接效率。用肌苷替换夹板5'端的碱基降低了连接效率。发现缓慢退火对连接效率几乎没有影响。在制备具有短接头序列的连接小珠的索引寡核苷酸中，连接效率的降低可能会被测序工作流程效率的提高所抵消，该测序工作流程包括使用长度缩短的接头序列。

实施例10—用双链夹板连接进行索引的工作流程

图19A中示出了对用双链夹板连接进行索引的概述，并且图19B中示出了示例性工作流程。在图19A所示的方案中，退火包括：60℃下3分钟，转移到冰中；连接包括：第1次连接：O/N，第2次连接：5小时；并且变性包括80℃下2分钟，立即去除缓冲液。以下总结了制备通过双链夹板连接索引的小珠库的步骤。

寡核苷酸制备

冻干的寡核苷酸
	如果不在溶液中，则悬浮于RS1(1x TE)中至100μM浓度。
对于索引A寡核苷酸，在96孔板中制备1μM工作储备液。
	推荐寡核苷酸储存在4℃下。
稀释ds-SL寡核苷酸
	在小珠库制备当天制备新鲜的工作稀释液。

索引A：96DDTB寡核苷酸	索引B：24个索引	索引C：24个索引
			对于250nM稀释：	对于5uM稀释：	对于5uM稀释：
7.5μl 1x TE	28.5μl 1x TE	28.5μl 1x TE
			2.5μl 1μM工作储备液	1.5μl 100μM储备液	1.5μl 100μM储备液

起始M280小珠定量

在吸移之前彻底混合M280小珠的储备液。
	制备M280小珠w/TWB的1000x稀释液
-25x：5μL M280在120μL TWB中
	-1000x：4μL 25x稀释液在156μL TWB中
在Countess上测量小珠/μL

小珠/μL	752,500
		μg小珠/μL(宣传值)	10
小珠/μg(计算值)	75,250
		fmoles/摩尔	1.00E+15
分子/摩尔	6.02E+23
		靶分子/小珠(计算值)	48,016

DDTB寡核苷酸结合(96-plex)

第1次夹板连接(24-plex)

第2次夹板连接(24-plex)

最终M280小珠定量

制备M280 w/TWB的1000x稀释液
	-25x：5μL M280在120μL TWB中
-1000x：4μL 25x稀释液在156μL TWB中
	在Countess上测量小珠/μL

以下总结了定量PCR(qPCR)的步骤。

制备样品稀释液：
	制备1000x稀释液：
-将3μL样品添加到147μL RSBT(50x)中。
	-将5μL的50x稀释液添加到95μL RSBT中(1000x)
-使用countess测量1000x qPCR稀释液的小珠计数(在qPCR期间/之后)

如本文所用，术语“包含”与“包括”、“含有”或“特征在于”同义，并且是包括性的或开放式的，并且不排除另外的未列举的要素或方法步骤。

以上描述公开了本发明的几种方法和材料。本发明易于在方法和材料上进行修改，以及在制造方法和装备上进行改变。考虑到本公开或本文公开的本发明的实践，这种修改对于本领域技术人员来说将变得显而易见。因此，并非意图将本发明限制于本文所公开的具体实施方案，而是其涵盖了落入本发明的真实范围和精神内的所有修改形式和替代形式。

本文引用的所有参考文献，包括但不限于公开和未公开的申请、专利和参考文献，均全文以引用方式并入本文，并且据此成为本说明书的一部分。就以引用方式并入的出版物和专利或专利申请与说明书中包含的公开内容相矛盾的程度而言，本说明书旨在取代和/或优先于任何此类矛盾的材料。

序列表

<110> A·曼佐

C·布朗

S·诺伯格

T·哈灵顿

<120> 用于基于小珠的核酸的组合索引的方法和组合物

<130> FIC23210137P

<150> 63214693

<151> 2021-06-24

<160> 14

<170> FastSEQ for Windows Version 4.0

<210> 1

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 人工寡核苷酸

<400> 1

aatgatacgg cgaccaccga 20

<210> 2

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 人工寡核苷酸

<400> 2

caagcagaag acggcatacg agat 24

<210> 3

<211> 16

<212> DNA

<213> 人工序列

<220>

<223> 人工寡核苷酸

<400> 3

atgctctaga caagtc 16

<210> 4

<211> 12

<212> DNA

<213> 人工序列

<220>

<223> 人工寡核苷酸

<400> 4

tgctctacaa gc 12

<210> 5

<211> 12

<212> DNA

<213> 人工序列

<220>

<223> 人工寡核苷酸

<400> 5

gctctaacaa gc 12

<210> 6

<211> 12

<212> DNA

<213> 人工序列

<220>

<223> 人工寡核苷酸

<400> 6

gctctaacaa gc 12

<210> 7

<211> 14

<212> DNA

<213> 人工序列

<220>

<223> 人工寡核苷酸

<400> 7

gacttgtccg gtgg 14

<210> 8

<211> 14

<212> DNA

<213> 人工序列

<220>

<223> 人工寡核苷酸

<400> 8

ctgaacaggc cacc 14

<210> 9

<211> 12

<212> DNA

<213> 人工序列

<220>

<223> 人工寡核苷酸

<400> 9

ctgaacaggc ca 12

<210> 10

<211> 12

<212> DNA

<213> 人工序列

<220>

<223> 人工寡核苷酸

<400> 10

gaacaggcca cc 12

<210> 11

<211> 15

<212> DNA

<213> 人工序列

<220>

<223> 人工寡核苷酸

<220>

<221> misc_feature

<222> 15

<223> N是肌苷

<400> 11

ctgaacaggc caccn 15

<210> 12

<211> 16

<212> DNA

<213> 人工序列

<220>

<223> CTGAACAGGCCACCNN

<220>

<221> misc_feature

<222> 15, 16

<223> N是肌苷

<400> 12

ctgaacaggc caccnn 16

<210> 13

<211> 14

<212> DNA

<213> 人工序列

<220>

<223> 人工寡核苷酸

<220>

<221> misc_feature

<222> 13, 14

<223> N是肌苷

<400> 13

ctgaacaggc cann 14

<210> 14

<211> 16

<212> DNA

<213> 人工序列

<220>

<223> 人工寡核苷酸

<220>

<221> misc_feature

<222> 13, 14, 15, 16

<223> N是肌苷

<400> 14

ctgaacaggc cannnn 16

Claims

1.一种制备多个组合索引小珠的方法，所述方法包括：

(a)获得包含第一多核苷酸的初级索引小珠群体，所述第一多核苷酸包含第一索引，其中所述初级索引小珠群体包含多个第一索引小珠亚群，其中所述第一索引小珠亚群包含彼此不同的第一索引；

(b)将所述初级索引小珠群体拆分成多个第二小珠亚群；

(c)获得次级索引小珠群体，包括：

(i)使所述多个第二小珠亚群的所述第一多核苷酸与包含第二索引的第二多核苷酸进行延伸以获得第二索引小珠亚群，其中所述第二索引小珠亚群包含彼此不同的第二索引，以及

(ii)组合所述第二索引小珠亚群以获得所述次级索引小珠群体；并且任选地，还包括：

(d)将所述次级索引小珠群体拆分成多个第三小珠亚群；以及

(e)获得三级索引小珠群体，包括：

(i)使所述多个第三小珠亚群的所述第二多核苷酸与包含第三索引的第三多核苷酸进行延伸以获得第三索引小珠亚群，其中所述第三索引小珠亚群包含彼此不同的第三索引，以及

(ii)组合所述第三索引小珠亚群以获得所述三级索引小珠群体。

2.根据权利要求1所述的方法，其中(c)包括通过化学连接使所述第一多核苷酸与所述第二多核苷酸进行延伸。

3.根据权利要求2所述的方法，其中：

所述第一多核苷酸包含末端3'修饰的脱氧核苷酸(dNTP)，所述末端3'修饰的dNTP包含能够参与点击化学反应的3'官能部分；

所述第二多核苷酸包含末端5'修饰的dNTP，所述末端5'修饰的dNTP包含相容性5'官能部分，所述相容性5'官能部分能够参与和所述3'-官能部分的点击化学反应；并且

所述3'官能部分和所述5'官能部分能够彼此反应，以形成经修饰的主链键。

4.根据权利要求3所述的方法，其中使所述第一多核苷酸与所述第二多核苷酸进行所述延伸获得次级索引多核苷酸，并且所述方法还包括修饰所述次级索引多核苷酸以获得包含末端3'修饰的脱氧核苷酸(dNTP)的经修饰的多核苷酸，所述末端3'修饰的dNTP包含能够参与点击化学反应的3'官能部分。

5.根据权利要求4所述的方法，其中所述修饰包括使所述次级索引多核苷酸与模板非依赖性聚合酶接触。

6.根据权利要求5所述的方法，其中所述模板非依赖性聚合酶选自末端脱氧核苷酸转移酶(TdT)、PolyA聚合酶或添加CCA的RNA聚合酶。

7.根据权利要求6所述的方法，其中所述模板非依赖性聚合酶是TdT。

8.根据权利要求3至7中任一项所述的方法，还包括通过化学连接反应使所述经修饰的多核苷酸与所述第三多核苷酸进行延伸，其中所述第三多核苷酸包含末端5'修饰的dNTP，所述末端5'修饰的dNTP包含相容性5'官能部分，所述相容性5'官能部分能够参与和所述3'官能部分的点击化学反应。

9.根据权利要求3至8中任一项所述的方法，其中所述3'官能部分选自叠氮化物、炔基、烯基、硫醇和硝酮。

10.根据权利要求3至9中任一项所述的方法，其中所述5'官能部分不同于所述3'官能部分并且与所述3'官能部分相容，并且所述5'官能部分选自叠氮化物、炔基、烯基、硫醇和硝酮。

11.根据权利要求3至10中任一项所述的方法，其中所述3'官能部分和所述5'官能部分选自以下对：(i)3'-叠氮基/5'-炔基；(ii)3'-炔基/5'叠氮基；(iii)3'-硫醇/5'-炔基；(iv)3'-硫醇/5'-烯基；(v)3'-炔基/5'-硫醇；(vi)3'-烯基/5'-硫醇；(vii)3'-叠氮基/5'-环辛炔基；(viii)3'-环辛炔/5'-叠氮基；(ix)3'-硝酮/5'-环辛炔基；和(x)3'-环辛炔基/5'-硝酮。

12.根据权利要求3至11中任一项所述的方法，其中所述3'官能部分是3'-叠氮基，并且所述5'官能部分是5'-炔基。

13.根据权利要求3至12中任一项所述的方法，其中所述点击化学反应包括铜催化的叠氮化物-炔烃环加成(CuAAC)，以形成包含三唑基的经修饰的主链键。

14.根据权利要求1所述的方法，其中(c)包括通过聚合酶延伸使所述第一多核苷酸进行延伸，其中所述第一多核苷酸包含第一接头。

15.根据权利要求14所述的方法，还包括：

(i)获得第一衔接子，所述第一衔接子包含能够与所述第一接头杂交的区域和包含所述第二索引或所述第二索引的互补物的区域；

(ii)使所述第一衔接子与所述第一接头杂交；以及

(iii)使所述第一多核苷酸进行延伸以获得次级索引多核苷酸。

16.根据权利要求14或15所述的方法，其中所述第一衔接子包含不可延伸的3'端。

17.根据权利要求16所述的方法，其中所述不可延伸的3'端包含3'2'双脱氧核苷酸或C3接头。

18.根据权利要求14至17中任一项所述的方法，还包括从所述次级索引多核苷酸中去除所述第一衔接子。

19.根据权利要求18所述的方法，其中所述去除包括通过热或碱使所述第一衔接子变性，或者通过酶促降解使所述第一衔接子降解。

20.根据权利要求14至19中任一项所述的方法，其中所述第一接头具有小于10个连续核苷酸的长度。

21.根据权利要求14至20中任一项所述的方法，其中所述第一接头具有小于5个连续核苷酸的长度。

22.根据权利要求14至21中任一项所述的方法，其中(e)包括通过聚合酶延伸使所述第二多核苷酸进行延伸。

23.根据权利要求15至22中任一项所述的方法，其中所述第一衔接子包含第二接头的互补物，使得所述次级索引多核苷酸包含所述第二接头。

24.根据权利要求23所述的方法，还包括：

(i)获得第二衔接子，所述第二衔接子包含能够与所述第二接头杂交的区域和包含所述第三索引或所述第三索引的互补物的区域；

(ii)使所述第二衔接子与所述第二接头杂交；以及

(iii)使所述次级索引多核苷酸进行延伸以获得三级索引多核苷酸。

25.根据权利要求24所述的方法，其中所述第二衔接子包含不可延伸的3'端。

26.根据权利要求25所述的方法，其中所述不可延伸的3'端包含3'2'双脱氧核苷酸或C3接头。

27.根据权利要求24至26中任一项所述的方法，还包括从所述三级索引多核苷酸中去除所述第二衔接子。

28.根据权利要求27所述的方法，其中所述去除包括通过热或碱使所述第一衔接子变性，或者通过酶促降解使所述第一衔接子降解。

29.根据权利要求23至28中任一项所述的方法，其中所述第二接头具有小于10个连续核苷酸的长度。

30.根据权利要求23至29中任一项所述的方法，其中所述第二接头具有小于5个连续核苷酸的长度。

31.根据权利要求1所述的方法，其中(c)包括通过连接使所述第一多核苷酸与所述第二多核苷酸进行延伸。

32.根据权利要求31所述的方法，还包括：

(i)获得双链第一衔接子和3'单链突出端，所述双链第一衔接子包含所述第二多核苷酸，所述3'单链突出端能够与所述第一多核苷酸的第一接头杂交；

(ii)使所述第一衔接子与所述第一接头杂交，并且任选地，使额外的寡核苷酸与所述第一索引杂交；以及

(iii)使所述第一多核苷酸与所述第二多核苷酸连接以获得次级索引多核苷酸。

33.根据权利要求32所述的方法，还包括通过连接使所述第二多核苷酸与第三多核苷酸进行延伸。

34.根据权利要求33所述的方法，还包括：

(i)获得双链第二衔接子和3'单链突出端，所述双链第二衔接子包含所述第三多核苷酸，所述3'单链突出端能够与所述第二多核苷酸的第二接头杂交；

(ii)使所述第二衔接子与所述第二接头杂交；以及

(iii)使所述第二多核苷酸与所述第三多核苷酸连接以获得三级索引多核苷酸。

35.根据权利要求31至34中任一项所述的方法，其中所述连接包括使用连接酶。

36.根据权利要求31至34中任一项所述的方法，其中所述连接包括化学连接反应。

37.根据权利要求1所述的方法，其中(c)包括通过连接使所述第一多核苷酸进行延伸，其中所述第一多核苷酸包含第一接头，并且所述第二多核苷酸包含第二接头。

38.根据权利要求37所述的方法，还包括：

(i)获得第一衔接子，所述第一衔接子包含能够与所述第一接头杂交的区域和能够与所述第二接头杂交的区域；

(ii)使所述第一衔接子与所述第一接头杂交；

(iii)使所述第二寡核苷酸与能够与所述第二接头杂交的所述区域杂交；以及

(iv)使所述第一多核苷酸与所述第二多核苷酸连接以获得次级索引多核苷酸。

39.根据权利要求38所述的方法，其中所述第一接头和/或所述第二接头具有小于10个连续核苷酸的长度。

40.根据权利要求39所述的方法，其中所述第一接头和/或所述第二接头具有小于5个连续核苷酸的长度。

41.根据权利要求37至40中任一项所述的方法，其中和与所述第一衔接子具有相同长度的寡核苷酸相比，所述第一接头和/或所述第二接头被修饰为具有增加的T_m。

42.根据权利要求41所述的方法，其中与具有所述相同长度的所述寡核苷酸相比，所述第一接头和/或所述第二接头包含增加的G/C含量，或包含经修饰的核苷酸。

43.根据权利要求37至42中任一项所述的方法，还包括从所述次级索引多核苷酸中去除所述第一衔接子。

44.根据权利要求43所述的方法，其中所述去除包括通过热或碱使所述第一衔接子变性，或者通过酶促降解使所述第一衔接子降解。

45.根据权利要求37至44中任一项所述的方法，其中(e)包括通过连接使所述第二多核苷酸进行延伸，其中所述第二寡核苷酸包含第三接头，使得所述次级索引多核苷酸包含所述第三接头，并且其中所述第三多核苷酸包含第四接头。

46.根据权利要求45所述的方法，还包括：

(i)获得第二衔接子，所述第二衔接子包含能够与所述第三接头杂交的区域和能够与所述第四接头杂交的区域；

(ii)使所述第二衔接子与所述第三接头杂交；

(iii)使所述第三多核苷酸经由能够与所述第四索引杂交的所述区域与所述第二衔接子杂交；以及

(iv)使所述次级索引多核苷酸与所述第三多核苷酸连接以获得三级索引多核苷酸。

47.根据权利要求46所述的方法，其中所述第三接头和/或所述第四接头具有少于9个连续核苷酸的长度。

48.根据权利要求47所述的方法，其中所述第三接头和/或所述第四接头具有少于5个连续核苷酸的长度。

49.根据权利要求45至48中任一项所述的方法，其中和与所述第二衔接子具有相同长度的寡核苷酸相比，所述第三接头和/或所述第四接头被修饰为具有增加的T_m。

50.根据权利要求49所述的方法，其中与具有所述相同长度的所述寡核苷酸相比，所述第三接头和/或所述第四接头包含增加的G/C含量，或包含经修饰的核苷酸。

51.根据权利要求46至50中任一项所述的方法，还包括从所述三级索引多核苷酸中去除所述第二衔接子。

52.根据权利要求51所述的方法，其中所述去除包括通过热或碱使所述第一衔接子变性，或者通过酶促降解使所述第一衔接子降解。

53.根据权利要求1至52中任一项所述的方法，其中(a)包括：

(i)使所述第一多核苷酸附着到多个第一小珠亚群以获得所述第一索引小珠亚群，其中所述第一多核苷酸针对每个第一小珠亚群包含不同的第一索引；以及

(ii)组合所述第一索引小珠亚群以获得所述初级索引小珠群体。

54.根据权利要求53所述的方法，其中所述第一多核苷酸经由第一结合配偶体和第二结合配偶体附着到小珠。

55.根据权利要求54所述的方法，其中所述第一结合配偶体或所述第二结合配偶体选自生物素、链霉亲和素、生物素衍生物、链霉亲和素衍生物、抗体和抗体的抗原结合片段。

56.根据权利要求1至55中任一项所述的方法，还包括重复(d)和(e)并且将额外的索引添加到索引小珠亚群中。

57.根据权利要求1至56中任一项所述的方法，其中所述第一多核苷酸包含选自P5序列、P5'序列、P7序列和P7'序列的引物结合位点。

58.根据权利要求1至57中任一项所述的方法，其中所述第一索引、所述第二索引和/或所述第三索引具有小于20个连续核苷酸的长度。

59.根据权利要求1至58中任一项所述的方法，其中所述第一索引、所述第二索引和/或所述第三索引具有小于10个连续核苷酸的长度。

60.根据权利要求1至59中任一项所述的方法，其中(b)包括将所述初级索引小珠群体随机分配到多个隔室中。

61.根据权利要求1至60中任一项所述的方法，其中(d)包括将所述次级索引小珠群体随机分配到多个隔室中。

62.根据权利要求60或61所述的方法，其中所述多个隔室包括选自孔、通道或液滴的隔室。

63.根据权利要求1至62中任一项所述的方法，其中所述多个组合索引小珠包括磁珠。

64.根据权利要求1至63中任一项所述的方法，还包括将所述多个组合索引小珠分配在阵列上。

65.根据权利要求1至64中任一项所述的方法，还包括对阵列上的所述组合索引小珠进行测序。

66.根据权利要求65所述的方法，还包括基于所述组合索引对阵列上的所述多个组合索引小珠中的小珠的位置进行解码。

67.根据权利要求1至66中任一项所述的方法，其中所述多个组合索引小珠中的每个小珠包含捕获探针。

68.根据权利要求67所述的方法，其中所述第一多核苷酸、所述第二多核苷酸或所述第三多核苷酸包含所述捕获探针。

69.根据权利要求1至68中任一项所述的方法，还包括使多个靶核酸与所述捕获探针杂交。

70.根据权利要求69所述的方法，还包括使所述捕获探针进行延伸。