CN116334202A

CN116334202A - 化学组合物及其使用方法

Info

Publication number: CN116334202A
Application number: CN202310011990.8A
Authority: CN
Inventors: M.黄; M.格雷戈里; D.金; D.L.杜纳维; E.A.曼劳; J.M.比彻姆; R.卡菲佐夫; S.科鲁康达; Y.邓
Original assignee: Nanostring Technologies Inc
Current assignee: Nanostring Technologies Inc
Priority date: 2016-11-21
Filing date: 2017-11-21
Publication date: 2023-06-27
Also published as: EP3541957A1; US20220213532A1; AU2017361521A1; JP2020500514A; KR102187291B1; AU2020210277A1; CN110225980B; KR20200138426A; SG10202100951SA; US20180142286A1; KR20210126155A; AU2020210277B2; US20240084361A1; US12049666B2; US20230257800A1; JP7532458B2; JP2021000085A; US20190390258A1; KR102695749B1; AU2023226700A1

Abstract

本发明涉及化学组合物及其使用方法。本公开涉及化学组合物、试剂盒和装置以及用于在各种测定中使用这些组合物、试剂盒和装置的方法。

Description

化学组合物及其使用方法

本申请是申请日为2017年11月21日的中国专利申请201780084155.X“化学组合物及其使用方法”的分案申请。

相关申请的交叉参考

本申请要求2016年11月21日提交的美国临时申请第62/424887号、2017年2月10日提交的美国临时申请第62/457237号和2017年7月24日提交的美国临时申请第62/536147号的优先权和益处。每个上述专利申请的内容通过参考以其全部结合至本文中。

序列表

本申请包含一个序列表，该序列表已经EFS-Web以ASCII格式提交，并且特此通过参考以其全部结合。2017年11月20日创建的所述ASCII拷贝命名为NATE033-001WO_SeqList_ST25.txt，并且大小为19351字节。

背景技术

目前有多种用于核酸测序的方法，即确定核酸分子内核苷酸的准确顺序的方法。目前的方法需要酶促扩增核酸，例如PCR和/或通过克隆。需要进一步的酶促聚合以产生通过光检测方法可检测的信号。这种扩增和聚合步骤是昂贵和/或耗时的。因此，本领域需要一种快速且无扩增和无酶的核酸测序方法。本公开解决这些需求。

发明内容

本公开提供测序探针、方法、试剂盒和装置，其提供具有长读取长度和低错误率的快速无酶、无扩增和无文库核酸测序。本文所述的测序探针包含条形码结构域，其中条形码结构域中的每个位置对应于靶结合结构域中的至少两个核苷酸。此外，方法、试剂盒和装置具有快速的应答样本能力。这些特征对于在临床环境下测序特别有用。本公开是对专利公开号U.S.2016/0194701中公开的公开内容的改进，其内容通过参考以其全部结合至本文中。

本公开提供一种复合物，其包含a)一种包含靶结合结构域和条形码结构域的组成，其中靶结合结构域包含至少8个核苷酸并且能够结合靶核酸，其中靶结合结构域中的至少6个核苷酸能够识别靶核酸分子中的相应核苷酸和其中靶结合结构域中的至少2个核苷酸不识别靶核酸分子中的相应核苷酸；其中靶结合结构域中的至少6个核苷酸的至少2个核苷酸为修饰的核苷酸或核苷酸类似物；其中条形码结构域包含合成主链，条形码结构域包含至少3个附接位置，每个附接位置包含至少1个附接区，附接区包含至少1个能够由互补核酸分子结合的核酸序列，其中至少3个附接位置的核酸序列确定靶核酸中由靶结合结构域结合的至少6个核苷酸的位置和身份，和其中至少3个附接位置的每一个具有不同的核酸序列；和与至少3个附接位置的第一附接位置杂交的第一互补一级核酸分子，其中第一一级互补核酸分子包含至少2个结构域和1个接头修饰，其中第一结构域与条形码结构域的第一附接位置杂交和第二结构域能够与至少1个互补二级核酸分子杂交，和其中接头修饰为

和其中接头修饰位于第一和第二结构域之间。

本公开提供一种复合物，其包含a)一种包含靶结合结构域和条形码结构域的组成，其中靶结合结构域包含至少8个核苷酸并且能够结合靶核酸，其中靶结合结构域中的至少6个核苷酸能够识别靶核酸分子中的相应核苷酸和其中靶结合结构域中的至少2个核苷酸不识别靶核酸分子中的相应核苷酸；其中靶结合结构域中的至少6个核苷酸的至少2个核苷酸为修饰的核苷酸或核苷酸类似物；其中条形码结构域包含合成主链，条形码结构域包含至少3个附接位置，每个附接位置包含至少1个附接区，附接区包含至少1个能够由互补核酸分子结合的核酸序列，其中至少3个附接位置的核酸序列确定靶核酸中由靶结合结构域结合的至少6个核苷酸的位置和身份，其中至少3个附接位置的每个附接位置对应于靶结合结构域中的至少6个核苷酸的2个核苷酸和至少3个附接位置的每一个具有不同的核酸序列，和其中至少3个附接位置的每个位置的核酸序列确定靶核酸中由靶结合结构域结合的至少6个核苷酸的相应两个核苷酸的位置和身份；和与至少3个附接位置的第一附接位置杂交的第一互补一级核酸分子，其中第一一级互补核酸分子包含至少2个结构域和1个接头修饰，其中第一结构域与条形码结构域的第一附接位置杂交和第二结构域能够与至少1个互补二级核酸分子杂交，和其中接头修饰为

和其中接头修饰位于第一和第二结构域之间。

本公开提供一种测序探针，其包含靶结合结构域和条形码结构域，其中靶结合结构域包含至少8个核苷酸并且能够结合靶核酸，其中靶结合结构域中的至少6个核苷酸能够识别靶核酸分子中的相应核苷酸和其中靶结合结构域中的至少2个核苷酸不识别靶核酸分子中的相应核苷酸；其中靶结合结构域中的至少6个核苷酸的至少2个核苷酸为修饰的核苷酸或核苷酸类似物；其中条形码结构域包含合成主链，条形码结构域包含至少3个附接位置，每个附接位置包含至少1个附接区，附接区包含至少1个能够由互补核酸分子结合的核酸序列，其中至少3个附接位置的核酸序列确定靶核酸中由靶结合结构域结合的至少6个核苷酸的位置和身份，和其中至少3个附接位置的每一个具有不同的核酸序列。

本公开提供一种测序探针，其包含靶结合结构域和条形码结构域，其中靶结合结构域包含至少8个核苷酸并且能够结合靶核酸，其中靶结合结构域中的至少6个核苷酸能够识别靶核酸分子中的相应核苷酸和其中靶结合结构域中的至少2个核苷酸不识别靶核酸分子中的相应核苷酸；其中靶结合结构域中的至少6个核苷酸的至少2个核苷酸为修饰的核苷酸或核苷酸类似物；其中条形码结构域包含合成主链，条形码结构域包含至少3个附接位置，每个附接位置包含至少1个附接区，附接区包含至少1个能够由互补核酸分子结合的核酸序列，其中至少3个附接位置的每个附接位置对应于靶结合结构域中的至少6个核苷酸的2个核苷酸和至少3个附接位置的每一个具有不同的核酸序列，和其中至少3个附接位置的每个位置的核酸序列确定靶核酸中由靶结合结构域结合的至少6个核苷酸的相应2个核苷酸的位置和身份。

本公开提供一种测序探针，其包含靶结合结构域和条形码结构域，其中靶结合结构域包含至少10个核苷酸并且能够结合靶核酸，其中靶结合结构域中的至少6个核苷酸能够识别靶核酸分子中的相应核苷酸和其中靶结合结构域中的至少4个核苷酸不识别靶核酸分子中的相应核苷酸；其中条形码结构域包含合成主链，条形码结构域包含至少3个附接位置，每个附接位置包含至少1个附接区，附接区包含至少1个能够由互补核酸分子结合的核酸序列，其中至少3个附接位置的核酸序列确定靶核酸中由靶结合结构域结合的至少6个核苷酸的位置和身份，和其中至少3个附接位置的每一个具有不同的核酸序列。

本公开还提供一种测序探针，其包含靶结合结构域和条形码结构域，其中靶结合结构域包含至少10个核苷酸并且能够结合靶核酸，其中靶结合结构域中的至少6个核苷酸能够识别靶核酸分子中的相应核苷酸和其中靶结合结构域中的至少4个核苷酸不识别靶核酸分子中的相应核苷酸；其中条形码结构域包含合成主链，条形码结构域包含至少3个附接位置，每个附接位置包含至少1个附接区，附接区包含至少1个能够由互补核酸分子结合的核酸序列，其中至少3个附接位置的每个附接位置对应于靶结合结构域中的至少6个核苷酸的2个核苷酸和至少3个附接位置的每一个具有不同的核酸序列，和其中至少3个附接位置的每个位置的核酸序列确定靶核酸中由靶结合结构域结合的至少6个核苷酸的相应2个核苷酸的位置和身份。

合成主链可包括多糖、多核苷酸、肽、肽核酸或多肽。合成主链可包含DNA。合成主链包含单链DNA。测序探针可包含单链DNA合成主链和靶结合结构域与条形码结构域之间的双链DNA间隔序列。双链DNA间隔序列的长度可为约1个核苷酸-约100个核苷酸、长度为约2个核苷酸-约50个核苷酸或者长度为20个核苷酸-40个核苷酸。双链DNA间隔序列的长度为约36个核苷酸。测序探针可包含单链DNA合成主链和靶结合结构域与条形码结构域之间的基于聚合物的间隔区，其中基于聚合物的间隔区提供与双链DNA间隔序列类似的机械性能。

靶结合结构域中的核苷酸的数目可与条形码结构域中的附接位置的数目相同、小于或大于其数目。优选地，靶结合结构域中的核苷酸的数目大于条形码结构域中的附接位置的数目。靶结合结构域中的核苷酸的数目可为比条形码结构域中的附接位置的数目多至少3个、多至少4个、多至少5个、多至少6个、多至少7个、多至少8个、多至少9个或多至少10个。优选地，靶结合结构域包含8个核苷酸和条形码结构域包含3个附接位置。

能够识别靶核酸分子中的相应核苷酸的靶结合结构域中的至少3个、至少4个、至少5个或至少6个核苷酸可为修饰的核苷酸或核苷酸类似物。修饰的核苷酸或核酸类似物可为锁定核酸(LNA)、桥接核酸(BNA)、丙炔修饰的核酸、拉链核酸

异鸟嘌呤、异胞嘧啶或其任何组合。优选地，修饰的核苷酸或核酸类似物为锁定核酸(LNA)。

靶结合结构域中不识别相应的核苷酸的至少2个核苷酸可位于靶结合结构域中的至少6个核苷酸之前。靶结合结构域中不识别相应的核苷酸的至少2个核苷酸可位于靶结合结构域中的至少6个核苷酸之后。靶结合结构域中不识别相应的核苷酸的至少2个核苷酸的至少1个位于靶结合结构域中的至少6个核苷酸之前和其中靶结合结构域中不识别相应的核苷酸的至少2个核苷酸中的至少1个位于靶结合结构域中的至少6个核苷酸之后。也就是说，靶结合结构域中不识别相应的核苷酸的至少2个核苷酸位于靶结合结构域中的至少6个核苷酸的侧翼。

靶结合结构域中不识别靶核酸分子中的相应核苷酸的至少2个核苷酸可为通用碱基、简并碱基或其组合。靶结合结构域中不识别靶核酸分子中的相应核苷酸的至少4个核苷酸的至少2个可为通用碱基、简并碱基或其组合。

条形码结构域中的每个附接位置可包含1个附接区。条形码结构域中的每个附接位置可包含1个以上附接区。

条形码结构域中的每个附接位置可包含相同数目的附接区。条形码结构域中的每个附接位置可包含不同数目的附接区。条形码结构域中的至少3个附接位置的至少1个可包含与另外两个不同数目的附接区。当条形码结构域中的附接位置包含多于1个附接区时，附接区可为相同的。当条形码结构域中的附接位置包含1个以上附接区时，附接区可包含相同的核酸序列。当条形码结构域中的附接位置包含1个以上附接区时，附接区可为不同的。当条形码结构域中的附接位置包含1个以上附接区时，附接区可包含不同的核酸序列。

包含条形码结构域中的每个附接区的每个核酸序列的长度为约8个核苷酸-约20个核苷酸。包含条形码结构域中的每个附接区的每个核酸序列的长度为约12个核苷酸。包含条形码结构域中的每个附接区的每个核酸序列的长度为约14个核苷酸。

条形码结构域中的至少3个附接位置的至少1个、至少2个或至少3个可与至少1个侧翼单链多核苷酸相邻。条形码结构域中的至少3个附接位置的每一个可与至少1个侧翼单链多核苷酸相邻。

至少1个附接位置中的至少1个、至少2个或至少3个附接区可与合成主链成为一体。至少3个附接位置的每一个中的每个附接区可与合成主链成为一体。至少1个附接位置中的至少1个、至少2个或至少3个附接区可从合成主链分支。至少3个附接位置的每一个中的每个附接区可从合成主链分支。

能够直接或间接地与每个附接位置内的至少1个附接区内的至少1个核酸序列结合的互补核酸分子可为RNA、DNA或PNA。优选地，互补核酸分子为DNA。

互补核酸分子可为一级核酸分子，其中一级核酸分子直接与条形码结构域的至少1个附接位置内的至少1个附接区结合。

一级核酸分子可包含至少2个结构域，即能够与条形码结构域的至少1个附接位置内的至少1个附接区结合的第一结构域和能够与至少1个互补二级核酸分子结合的第二结构域。一级核酸分子可包含至少2个结构域，即能够与条形码结构域的至少1个附接位置内的至少1个附接区结合的第一结构域和包含第一可检测标记和至少第二可检测标记的第二结构域。

一级核酸分子可与条形码结构域的至少1个附接位置内的至少一个附接区杂交和与至少1个、至少2个、至少3个、至少4个、至少5个或更多个二级核酸分子杂交。优选地，一级核酸分子与4个二级核酸分子杂交。一级核酸分子可与条形码结构域的至少1个附接位置内的至少1个附接区杂交和可与第一可检测标记和至少第二可检测标记杂交。第一和至少第二可检测标记可具有相同的发射光谱或可具有不同的发射光谱。

一级核酸分子可包含可切割接头。优选地，可切割接头位于第一结构域与第二结构域之间。可切割接头可为光可切割接头(例如UV光可切割接头)、还原剂可切割接头或酶促可切割接头。优选地，接头为光可切割接头。

二级核酸分子可包含至少2个结构域，即能够与至少1个一级核酸分子中的互补序列结合的第一结构域和能够与(a)第一可检测标记和至少第二可检测标记，与(b)至少1个互补三级核酸分子，或(c)其组合结合的第二结构域。

二级核酸分子可与至少1个一级核酸分子杂交和与至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个或更多个三级核酸分子杂交。优选地，二级核酸分子与1个三级核酸分子杂交。二级核酸分子可与至少1个一级核酸分子杂交并可包含第一可检测标记和至少第二可检测标记。二级核酸分子可与至少1个一级核酸分子、至少1个三级核酸分子和与第一可检测标记和至少第二可检测标记杂交。第一和至少第二可检测标记可具有相同的发射光谱或可具有不同的发射光谱。当二级核酸分子与至少1个一级核酸分子、至少1个包含第一可检测标记和至少第二可检测标记的三级核酸分子，和与第一可检测标记和至少第二可检测标记杂交时，位于二级核酸分子上的至少第一和第二可检测标记可具有相同的发射光谱和位于三级核酸分子上的至少第一和第二可检测标记可具有相同的发射光谱，并且其中二级核酸分子上的可检测标记的发射光谱可与三级核酸分子上的可检测标记的发射光谱不同。

二级核酸分子可包含可切割接头。优选地，可切割接头位于第一结构域与第二结构域之间。可切割接头可为光可切割接头(例如UV光可切割接头)、还原剂可切割接头或酶促可切割接头。优选地，接头为光可切割接头。

三级核酸分子可包含至少2个结构域，即能够与至少1个二级核酸分子中的互补序列结合的第一结构域和能够与第一可检测标记和至少第二可检测标记结合的第二结构域。

三级核酸分子可与至少1个二级核酸分子杂交并可包含第一可检测标记和至少第二可检测标记。第一和至少第二可检测标记可具有相同的发射光谱或可具有不同的发射光谱。

三级核酸分子可包含可切割接头。优选地，可切割接头位于第一结构域与第二结构域之间。可切割接头可为光可切割接头(例如UV光可切割接头)、还原剂可切割接头或酶促可切割接头。优选地，接头为光可切割接头。

本公开还提供一个测序探针群，其包含多个本文公开的测序探针。优选地，多个测序探针内的每个测序探针包含不同的靶结合结构域并结合靶核酸内的不同区域。

本公开还提供一种用于对核酸进行测序的方法，方法包括：(1)使本文所述的测序探针与任选地在一个或多个位置固定于基底上的靶核酸杂交；(2)使包含第一可检测标记和至少第二可检测标记的第一互补核酸分子与条形码结构域的至少3个附接位置的第一附接位置结合；(3)检测结合的第一互补核酸分子的第一和至少第二可检测标记；(4)鉴定固定的靶核酸中的至少2个核苷酸的位置和身份；(5)使缺少可检测标记的第一杂交核酸分子与第一附接位置结合，从而解除包含可检测标记的第一互补核酸分子的结合，或者使包含可检测标记的第一互补核酸分子与足以释放第一可检测标记和至少第二可检测标记的力接触；(6)使包含第三可检测标记和至少第四可检测标记的第二互补核酸分子与条形码结构域的至少3个附接位置的第二附接位置结合；(7)检测结合的第二互补核酸分子的第三和至少第四可检测标记；(8)鉴定任选固定的靶核酸中的至少2个核苷酸的位置和身份；(9)重复步骤(5)至(8)，直至条形码结构域中的至少3个附接位置的每个附接位置已由包含2个可检测标记的互补核酸分子结合，并且已检测到结合的互补核酸分子的2个可检测标记，从而鉴定与测序探针的靶结合结构域杂交的任选固定的靶核酸的至少第一区域的至少6个核苷酸的线性顺序；和(10)从任选固定的靶核酸去除测序探针。

方法可进一步包括：(11)使第二测序探针与任选地在一个或多个位置固定于基底上的靶核酸杂交，并且其中第一测序探针和第二测序探针的靶结合结构域不同；(12)使包含第一可检测标记和至少第二可检测标记的第一互补核酸分子与条形码结构域的至少3个附接位置的第一附接位置结合；(13)检测结合的第一互补核酸分子的第一和至少第二可检测标记；(14)鉴定任选固定的靶核酸中的至少2个核苷酸的位置和身份；(15)使缺少可检测标记的第一杂交核酸分子与第一附接位置结合，从而解除包含可检测标记的第一互补核酸分子或复合物的结合，或者使包含可检测标记的第一互补核酸分子或复合物与足以释放第一可检测标记和至少第二可检测标记的力接触；(16)使包含第三可检测标记和至少第四可检测标记的第二互补核酸分子与条形码结构域的至少3个附接位置的第二附接位置结合；(17)检测结合的第二互补核酸分子的第三和至少第四可检测标记；(18)鉴定任选固定的靶核酸中的至少2个核苷酸的位置和身份；(19)重复步骤(15)至(18)，直至条形码结构域中的至少3个附接位置的每个附接位置已由包含两个可检测标记的互补核酸分子结合，并且已检测到结合的互补核酸分子的2个可检测标记，从而鉴定与测序探针的靶结合结构域杂交的任选固定的靶核酸的至少第二区域的至少6个核苷酸的线性顺序；和(20)从任选固定的靶核酸去除第二测序探针。

方法可进一步包括组装固定的靶核酸的至少第一区域和至少第二区域中的每个鉴定的核苷酸线性顺序，从而鉴定固定的靶核酸的序列。

步骤(5)和(6)可依序或同时发生。第一和至少第二可检测标记可具有相同的发射光谱或可具有不同的发射光谱。第三和至少第四可检测标记可具有相同的发射光谱或可具有不同的发射光谱。

第一互补核酸分子可包含可切割接头。第二互补核酸分子可包含可切割接头。第一互补核酸分子和第二互补核酸分子可各自包含可切割接头。优选地，可切割接头为光可切割的。释放力可以是光。优选地，UV光。光可由选自弧光灯、激光器、聚焦UV光源和发光二极管的光源提供。

第一互补核酸分子和缺少可检测标记的第一杂交核酸分子可包含相同的核酸序列。缺少可检测标记的第一杂交核酸分子可包含与同条形码结构域中的第一附接位置相邻的侧翼单链多核苷酸互补的核酸序列。

第二互补核酸分子和缺少可检测标记的第二杂交核酸分子可包含相同的核酸序列。缺少可检测标记的第二杂交核酸分子可包含与同条形码结构域中的第二附接位置相邻的侧翼单链多核苷酸互补的核酸序列。

本公开还提供一种用于对核酸进行测序的方法，方法包括：(1)使包含多个本文所述的测序探针的至少1个第一群的第一测序探针与任选地在一个或多个位置固定于基底上的靶核酸杂交；(2)使包含第一可检测标记和至少第二可检测标记的第一互补核酸分子与条形码结构域的至少3个附接位置的第一附接位置结合；(3)检测结合的第一互补核酸分子的第一和至少第二可检测标记；(4)鉴定任选固定的靶核酸中的至少2个核苷酸的位置和身份；(5)使缺少可检测标记的第一杂交核酸分子与第一附接位置结合，从而解除包含可检测标记的第一互补核酸分子的结合，或者使包含可检测标记的第一互补核酸分子与足以释放第一可检测标记和至少第二可检测标记的力接触；(6)使包含第三可检测标记和至少第四可检测标记的第二互补核酸分子与条形码结构域的至少3个附接位置的第二附接位置结合；(7)检测结合的第二互补核酸分子的第三和至少第四可检测标记；(8)鉴定任选固定的靶核酸中的至少2个核苷酸的位置和身份；(9)重复步骤(5)至(8)，直至条形码结构域中的至少3个附接位置的每个附接位置已由包含2个可检测标记的互补核酸分子结合，并且已检测结合的互补核酸分子的2个可检测标记，从而鉴定与测序探针的靶结合结构域杂交的任选固定的靶核酸的至少第一区域的至少6个核苷酸的线性顺序；和(10)从任选固定的靶核酸去除至少1个第一群的第一测序探针。

方法可进一步包括：(11)使包含多个本文公开的测序探针的至少1个第二群的第二测序探针与任选地在一个或多个位置固定于基底上的靶核酸杂交，并且其中第一测序探针和第二测序探针的靶结合结构域不同；(12)使包含第一可检测标记和至少第二可检测标记的第一互补核酸分子与条形码结构域的至少3个附接位置的第一附接位置结合；(13)检测结合的第一互补核酸分子的第一和至少第二可检测标记；(14)鉴定任选固定的靶核酸中的至少2个核苷酸的位置和身份；(15)使缺少可检测标记的第一杂交核酸分子与第一附接位置结合，从而解除包含可检测标记的第一互补核酸分子或复合物的结合，或者使包含可检测标记的第一互补核酸分子或复合物与足以释放第一可检测标记和至少第二可检测标记的力接触；(16)使包含第三可检测标记和至少第四可检测标记的第二互补核酸分子与条形码结构域的至少3个附接位置的第二附接位置结合；(17)检测结合的第二互补核酸分子的第三和至少第四可检测标记；(18)鉴定任选固定的靶核酸中的至少2个核苷酸的位置和身份；(19)重复步骤(15)至(18)，直至条形码结构域中的至少3个附接位置的每个附接位置已由包含2个可检测标记的互补核酸分子结合，并且已检测到结合的互补核酸分子的2个可检测标记，从而鉴定与测序探针的靶结合结构域杂交的任选固定的靶核酸的至少第二区域的至少6个核苷酸的线性顺序；和(20)从任选固定的靶核酸去除至少1个第二群的第二测序探针。

本公开还提供一种用于测定核酸的核苷酸序列的方法，方法包括：(1)使本文公开的第一测序探针与任选地在一个或多个位置固定于基底上的靶核酸杂交；(2)使包含第一可检测标记和第二可检测标记的第一互补核酸分子与条形码结构域的至少3个附接位置的第一附接位置杂交；(3)鉴定与第一附接位置杂交的第一互补核酸分子的第一和第二可检测标记；(4)去除与第一附接位置杂交的第一和第二可检测标记；(5)使包含第三可检测标记和第四可检测标记的第二互补核酸分子与条形码结构域的至少3个附接位置的第二附接位置杂交；(6)鉴定与第二附接位置杂交的第二互补核酸分子的第三和第四可检测标记；(7)去除与第二附接位置杂交的第三和第四可检测标记；(8)使包含第五可检测标记和第六可检测标记的第三互补核酸分子与条形码结构域的至少3个附接位置的第三附接位置杂交；(9)鉴定与第三附接位置杂交的第三互补核酸分子的第五和第六可检测标记；和(10)基于第一可检测标记、第二可检测标记、第三可检测标记、第四可检测标记、第五可检测标记和第六可检测标记的身份，鉴定与测序探针的靶结合结构域杂交的任选固定的靶核酸的至少6个核苷酸的线性顺序。

方法可进一步包括：(11)从任选固定的靶核酸的第一区域去除至少第一测序探针；(12)使本文公开的至少第二测序探针与任选地在一个或多个位置固定于基底上的靶核酸的第二区域杂交，并且其中第一测序探针和至少第二测序探针的靶结合结构域不同；(13)使包含第一可检测标记和第二可检测标记的第一互补核酸分子与条形码结构域的至少3个附接位置的第一附接位置杂交；(14)检测与第一附接位置杂交的第一互补核酸分子的第一和第二可检测标记；(15)使包含第三可检测标记和第四可检测标记的第二互补核酸分子与条形码结构域的至少3个附接位置的第二附接位置杂交；(16)检测与第二附接位置杂交的第二互补核酸分子的第三和第四可检测标记；(17)去除与第二附接位置杂交的第三和第四可检测标记；(18)使包含第五可检测标记和第六可检测标记的第三互补核酸分子与条形码结构域的至少3个附接位置的第三附接位置杂交；(19)鉴定与第三附接位置杂交的第三互补核酸分子的第五和第六可检测标记；和(20)基于第一可检测标记、第二可检测标记、第三可检测标记、第四可检测标记、第五可检测标记和第六可检测标记的身份，鉴定与至少第二测序探针的靶结合结构域杂交的任选固定的靶核酸的第二区域中的至少6个核苷酸的线性顺序。

步骤(4)和(5)可依序或同时发生。第一和至少第二可检测标记可具有相同的发射光谱或可具有不同的发射光谱。第三和至少第四可检测标记可具有相同的发射光谱或可具有不同的发射光谱。第五和至少第六可检测标记可具有相同的发射光谱或可具有不同的发射光谱。

第一互补核酸分子可包含可切割接头。第二互补核酸分子可包含可切割接头。第三互补核酸分子可包含可切割接头。第一互补核酸分子、第二互补核酸分子和至少第三互补核酸分子可各自包含可切割接头。优选地，可切割接头为光可切割的。去除第一互补核酸分子、第二互补核酸分子和至少第三互补核酸分子的任何一个的方法可包括与光接触。优选地，UV光。光可由选自弧光灯、激光器、聚焦UV光源和发光二极管的光源提供。

本公开还提供一种用于测定核酸的核苷酸序列的方法，方法包括：(1)使本文公开的第一测序探针与从预定基因获得的靶核酸的第一区域杂交，其中靶核酸任选地在一个或多个位置固定于基底上；(2)使包含第一可检测标记和第二可检测标记的第一互补核酸分子与条形码结构域的至少3个附接位置的第一附接位置杂交；(3)检测与第一附接位置杂交的第一互补核酸分子的第一和第二可检测标记；(4)去除与第一附接位置杂交的第一和第二可检测标记；(5)使包含第三可检测标记和第四可检测标记的第二互补核酸分子与条形码结构域的至少3个附接位置的第二附接位置杂交；(6)检测与第二附接位置杂交的第二互补核酸分子的第三和第四可检测标记；(7)去除与第二附接位置杂交的第三和第四可检测标记；(8)使包含第五可检测标记和第六可检测标记的第三互补核酸分子与条形码结构域的至少3个附接位置的第三附接位置杂交；(9)鉴定与第三附接位置杂交的第三互补核酸分子的第五和第六可检测标记；和(10)基于第一可检测标记、第二可检测标记、第三可检测标记、第四可检测标记、第五可检测标记和第六可检测标记的身份，鉴定与第一测序探针的靶结合结构域杂交的任选固定的靶核酸的第一区域中的至少6个核苷酸的线性顺序。

第一互补核酸分子可包含可切割接头。第二互补核酸分子可包含可切割接头。第三互补核酸分子可包含可切割接头。第一互补核酸分子、第二互补核酸分子和至少第三互补核酸分子可各自包含可切割接头。优选地，可切割接头为光可切割的。去除第一互补核酸分子、第二互补核酸分子和至少第三互补核酸分子的任何一个的方法包括与光接触。优选地，UV光。光可由选自弧光灯、激光器、聚焦UV光源和发光二极管的光源提供。

本公开还提供一种用于实施本文公开的任何方法的装置。

本公开还提供一种或多种试剂盒，试剂盒包含基底、本文公开的测序探针群、至少3种互补核酸分子(包含第一可检测标记和至少两种第二可检测标记)及使用说明书。一种或多种试剂盒可进一步包含至少一种捕获探针。一种或多种试剂盒可进一步包含至少两种捕获探针。

任何以上方面可与任何其他方面组合。

除非另外定义，否则本文使用的所有技术和科学术语具有与本公开所属领域的普通技术人员通常理解的相同含义。在本说明书中，除非上下文另外明确规定，否则单数形式也包括复数；作为实例，术语“a”、“an”和“the”应理解为单数或复数，和术语“或”应理解为包括性的。举例来说，“要素”意指一个或多个要素。在整个说明书中，单词“包含(comprising)”或变体比如“包含(comprises)”或“包含(comprising)”应理解为意指包括所述要素、整数或步骤，或者要素、整数或步骤组，但不排除任何其他要素、整数或步骤，或者要素、整数或步骤组。约可理解为在所述值的10％、9％、8％、7％、6％、5％、4％、3％、2％、1％、0.5％、0.1％、0.05％或0.01％的范围内。除非从上下文另外清楚，否则本文提供的所有数值均由术语“约”修饰。

尽管与本文所述的那些类似或等同的方法和材料可用于本公开的实践或测试，但以下描述合适的方法和材料。本文提及的所有公开、专利申请、专利和其他参考文献均通过参考以其全部结合。本文引用的参考文献不认为是要求保护的发明的现有技术。如果发生冲突，以本说明书(包括定义)为准。另外，材料、方法和实施例仅为说明性的而不旨在限制性的。根据以下详述和权利要求，本公开的其他特征和优势将显而易见。

附图说明

该专利或申请文件含有至少一幅彩色附图。具有彩色附图的本专利或专利申请公开的副本将在请求和支付必要费用后由主管局提供。

从以下详述连同附图一起将更清楚地意识到以上和进一步特征。

图1为本公开的一种示例性测序探针的图示。

图2显示本公开的标准和3部分测序探针的设计。

图3为与本公开的示例性测序探针杂交的本公开的示例性报告复合物的图示。

图4显示本公开的示例性报告探针的示意图。

图5为本公开的几种示例性报告探针的示意图。

图6为包含“额外手柄”的本公开的示例性报告探针的示意图。

图7为包含三级核酸的不同排列的本公开的几种示例性报告探针的示意图。

图8为包含支化三级核酸的本公开的几种示例性报告探针的示意图。

图9为包含可切割接头修饰的本公开的一种示例性报告探针的图示。

图10显示本公开的示例性报告探针内可切割接头修饰的可能位置。

图11为使用本公开的双捕获探针系统捕获靶核酸的示意图。

图12显示用FFPE样品，使用本发明方法捕获和检测由100种靶标组成的多路复用癌症组的实验结果。

图13显示与捕获探针、阻断寡核苷酸和测序探针杂交用于大靶核酸分子的靶向测序的两种捕获的靶DNA分子的示意图。

图14为本公开的测序方法的单个循环的示意图。

图15为本公开的测序方法的一个循环的示意图和在该循环期间收集的相应成像数据。

图16图解说明本公开的示例性测序探针池配置，其中8种颜色组合用于设计8个不同的测序探针池。

图17将U.S.2016/019470中公开的条形码结构域设计与本公开的条形码结构域设计进行比较。

图18为与捕获的靶核酸分子杂交的本公开的单个测序探针或多个测序探针的示意图。

图19显示当单个测序探针或多个测序探针与靶核酸杂交时在本公开的测序方法期间记录的荧光图像。

图20为沿着靶核酸的长度结合的本公开的多个测序探针的示意图和相应记录的荧光图像。

图21显示在本公开的测序循环期间记录的示例性的成像数据和本公开的报告探针的荧光信号强度曲线。

图22为本公开的测序循环的示意图，其中使用可切割接头修饰来使条形码位置变暗。

图23为本公开的示例性测序循环的说明性实例，其中条形码结构域内的位置通过一级核酸的置换而变暗。

图24显示从FFPE样品中综合捕获RNA和DNA的实例。

图25为本公开的测序方法如何使得能够用不同的测序探针对靶核酸的相同碱基进行测序的示意图。

图26显示可如何组合从一种或多种测序探针记录的靶核酸上特定核苷酸位置的多个碱基响应以产生一致序列，从而提高最终碱基响应的准确率。

图27显示在捕获、拉伸和检测33千碱基DNA片段之后，本公开的测序方法记录的荧光图像。

图28显示使用本公开的测序方法获得并使用ShortStack^TM算法进行分析的测序实验结果。对于左图中的图表，从左上方图表顺时针方向开始，所示的序列对应于SEQ ID NO:3、4、6、8、7和5。对于右侧的表格，从顶部开始向下移动，序列对应于SEQ ID NO:3、4、7、8、6和5。

图29显示来自FFPE样品的癌基因靶标的多路复用捕获和测序的实验设计的示意图。

图30显示直接RNA测序的说明性示意图和测试RNA分子与本公开的测序方法的相容性的实验结果。

图31显示使用本公开的测序方法对具有相同核苷酸序列的RNA分子和DNA分子进行测序。

图32显示RNA组的多路复用靶标捕获的结果。

图33显示ShortStack^TM软件流水线的步骤的示意性概述。

图34显示使用ShortStack^TM软件流水线对模拟数据集进行突变分析的结果。

图35显示用于各种类型突变的ShortStack^TM软件流水线的总体突变响应准确率。

图36显示用特定颜色组合标记的报告复合物的强度分布。

图37显示本公开的典型沉积梯度。

图38显示DNA质量输入在25ng-500ng之间的滴定期间本公开的捕获效率。

图39显示本发明的示例性报告复合物的HLPC纯化。

图40显示在存在不同缓冲添加剂的情况下本公开的报告探针的杂交效率和准确率。

图41显示当在存在不同缓冲添加剂的情况下使用本公开的测序方法时靶核酸损失的百分比。

图42显示包含12聚体互补核酸的本公开的示例性报告探针的效率和误差。

图43显示使用示例性的8x8x814聚体报告探针组的报告探针的效率和误差。

图44显示使用示例性10x10x1014聚体报告探针组的报告探针的效率和误差。

图45显示本公开的标准和3部分测序探针的性能比较。

图46显示使用单个探针在本公开的示例性靶结合结构域内LNA取代的影响。

图47显示使用一池9个探针在本公开的示例性靶结合结构域内LNA取代的影响。

图48显示在本公开的示例性靶结合结构域中修饰的核苷酸和核酸类似物取代的影响。

图49显示用于量化本公开的测序方法的原始准确率的实验结果。

图50显示当通过1种以上测序探针对靶核酸中的核苷酸进行测序时，确定本公开的测序方法的准确率的实验结果。

发明详述

本公开提供测序探针、报告探针、方法、试剂盒和装置，其提供具有长读取长度和低错误率的快速无酶、无扩增和无文库的核酸测序。

本公开的组成

本公开提供一种测序探针，其包含靶结合结构域和条形码结构域，其中靶结合结构域包含至少8个核苷酸并且能够结合靶核酸，其中靶结合结构域中的至少6个核苷酸能够识别靶核酸分子中的相应(互补)核苷酸和其中靶结合结构域中的至少2个核苷酸不识别靶核酸分子中的相应核苷酸；其中靶结合结构域中的至少6个核苷酸的至少1个或至少2个核苷酸为修饰的核苷酸或核苷酸类似物和其中靶结合结构域中的至少1个或至少2个核苷酸为通用或简并碱基；其中条形码结构域包含合成主链，条形码结构域包含至少3个附接位置，每个附接位置包含至少1个附接区，附接区包含至少1个能够由互补核酸分子结合的核酸序列，其中至少3个附接位置的每个附接位置对应于靶结合结构域中的至少6个核苷酸的2个核苷酸和至少3个附接位置的每一个具有不同的核酸序列，和其中至少3个附接位置的每个位置的核酸序列确定靶核酸中由靶结合结构域结合的至少6个核苷酸的相应2个核苷酸的位置和身份。

本公开还提供一种测序探针，其包含靶结合结构域和条形码结构域，其中靶结合结构域包含至少10个核苷酸并且能够结合靶核酸，其中靶结合结构域中的至少6个核苷酸能够识别靶核酸分子中的相应(互补)核苷酸和其中靶结合结构域中的至少4个核苷酸不识别靶核酸分子中的相应核苷酸；其中条形码结构域包含合成主链，条形码结构域包含至少3个附接位置，每个附接位置包含至少1个附接区，附接区包含至少1个能够由互补核酸分子结合的核酸序列，其中至少3个附接位置的每个附接位置对应于靶结合结构域中的至少6个核苷酸的2个核苷酸和至少3个附接位置的每一个具有不同的核酸序列，和其中至少3个附接位置的每个位置的核酸序列确定靶核酸中由靶结合结构域结合的至少6个核苷酸的相应2个核苷酸的位置和身份。

本公开还提供一个测序探针群，其包含多个本文公开的任何测序探针。

以下更详细地描述了所公开的测序探针的靶结合结构域、条形码结构域和主链以及互补核酸分子(例如报告分子或报告复合物)。

本公开的测序探针包含靶结合结构域和条形码结构域。图1为本公开的示例性测序探针的示意图。图1显示靶结合结构域能够结合靶核酸。靶核酸可为本公开的测序探针可与其杂交的任何核酸。靶核酸可为DNA或RNA。靶核酸可从受试者的生物样品获得。术语“靶结合结构域”和“测序结构域”本文可互换使用。

靶结合结构域可包含一系列核苷酸(例如为多核苷酸)。靶结合结构域可包含DNA、RNA或其组合。在靶结合结构域为多核苷酸的情况下，靶结合结构域通过与同测序探针的靶结合结构域互补的靶核酸的一部分杂交而与靶核酸结合，如图1所示。

可设计测序探针的靶结合结构域以控制测序探针杂交和/或去杂交的可能性以及这些发生的速率。通常，探针的Tm越低，探针与/从靶核酸去杂交越快且越可能。因此，使用较低Tm探针将减少与靶核酸结合的探针的数目。

靶结合结构域的长度部分地影响探针与靶核酸杂交并保持与靶核酸杂交的可能性。通常，靶结合结构域越长(核苷酸数目越多)，互补序列在靶核苷酸中存在的可能性越小。相反，靶结合结构域越短，互补序列在靶核苷酸中存在的可能性越大。例如，四聚体序列将位于靶核酸中的概率为1/256，而六聚体序列将位于靶核酸中的概率为1/4096。因此，当与一系列较长探针相比较，对于给定的核酸段，一系列较短的探针可能会在更多位置结合。

在一些情况下，优选的是具有较短靶结合结构域的探针以增加给定核酸段中的读取数目，从而富集靶核酸或靶核酸的一部分，尤其是特别感兴趣的一部分的覆盖范围，例如当检测突变或SNP等位基因时。

靶结合结构域的长度可为任何数量或数目的核苷酸。靶结合结构域的长度可为至少12个核苷酸、长度至少10个核苷酸、长度至少8个核苷酸、长度至少6个核苷酸或长度至少3个核苷酸。

靶结合结构域中的每个核苷酸可识别(或编码)靶分子的互补核苷酸。或者，靶结合结构域中的一些核苷酸识别(或编码)靶分子的互补核苷酸和靶结合结构域中的一些核苷酸不识别(或编码)靶分子的互补核苷酸。

靶结合结构域可包含至少1个天然碱基。靶结合结构域可不包含天然碱基。靶结合结构域可包含至少1个修饰的核苷酸或核酸类似物。靶结合结构域可不包含修饰的核苷酸或核酸类似物。靶结合结构域可包含至少1个通用碱基。靶结合结构域可不包含通用碱基。靶结合结构域可包含至少1个简并碱基。靶结合结构域可不包含简并碱基。

靶结构域可包含任何组合天然碱基(例如0、1、2、3、4、5、6、7、8、9、10或更多个天然碱基)、修饰的核苷酸或核酸类似物(例如0、1、2、3、4、5、6、7、8、9、10或更多个修饰的或类似核苷酸)、通用碱基(例如0、1、2、3、4、5、6、7、8、9、10或更多个通用碱基)或简并碱基(例如0、1、2、3、4、5、6、7、8、9、10或更多个简并碱基)。当以组合存在时，特定靶结合结构域的天然碱基、修饰的核苷酸或核酸类似物、通用碱基和简并碱基可以任何顺序排列。

术语“修饰的核苷酸”或“核酸类似物”包括(但不限于)锁定核酸(LNA)、桥接核酸(BNA)、丙炔修饰的核酸、拉链核酸

异鸟嘌呤和异胞嘧啶。靶结合结构域可包含0-6个(例如0、1、2、3、4、5或6个)修饰的核苷酸或核酸类似物。优选地，修饰的核苷酸或核酸类似物为锁定核酸(LNA)。

本文使用的术语“锁定核酸(LNA)”包括(但不限于)修饰的RNA核苷酸，其中核糖部分包含连接2’氧和4’碳的亚甲基桥。这种亚甲基桥将核糖以3-内构型(也称为北构型，其在A型RNA双链体中发现)锁定。术语难以接近的RNA可与LNA互换使用。本文使用的术语“桥接核酸(BNA)”包括(但不限于)包含具有固定3’-内构型(也称为北构型)的五元或六元桥接结构的修饰的RNA分子。桥接结构将核糖的2’氧与核糖的4’碳连接起来。各种不同的桥结构可能含有碳、氮和氢原子。本文使用的术语“丙炔修饰的核酸”包括(但不限于)嘧啶，即胞嘧啶和胸腺嘧啶/尿嘧啶，其在核酸碱基的C5位包含丙炔修饰。本文使用的术语“拉链核酸

”包括(但不限于)与阳离子精胺部分缀合的寡核苷酸。

本文使用的术语“通用碱基”包括(但不限于)不遵循Watson-Crick碱基对规则，而是可与位于靶核酸上的4种规范碱基(A、T/U、C、G)中的任何一种结合的核苷酸碱基。本文使用的术语“简并碱基”包括(但不限于)不遵循Watson-Crick碱基对规则，而是可与4种规范碱基(A、T/U、C、G)中的至少2种但不是全部4种结合的核苷酸碱基。简并碱基也可称为Wobble碱基，这些术语本文可互换使用。

图1所示的示例性的测序探针图解说明一种靶结合结构域，其包含特异性地与待测序的靶核酸的互补核苷酸1-6杂交的长6个核苷酸(6聚体)序列(b₁-b₂-b₃-b₄-b₅-b₆)。靶结合结构域的6聚体部分(b₁-b₂-b₃-b₄-b₅-b₆)鉴定(或编码)靶序列中的互补核苷酸(1-2-3-4-5-6)。该6聚体序列的两侧各有1个碱基(N)。由(N)表示的碱基可独立地为通用或简并碱基。一般地，由(N)表示的碱基独立地为规范碱基之一。由(N)表示的碱基不识别(或编码)其在靶序列中结合的互补核苷酸，并且独立于(6聚体)序列的核酸序列(b₁-b₂-b₃-b₄-b₅-b₆)。

图1所示的测序探针可与本公开的测序方法结合使用，仅使用杂交反应对靶核酸进行测序，不需要共价化学、酶或扩增。为了对靶核酸分子中的所有可能的6聚体序列进行测序，需要总计4096种测序探针(4^6＝4096)。

图1为本公开的测序探针的靶结合结构域的一种配置的示例。表1提供本公开的靶结合结构域的几种其他配置。一种优选的靶结合结构域，称为“6LNA”靶结合结构域，在靶结合结构域的b1-b6位包含6个LNA。这6个LNA的两侧各有1个碱基(N)。本文使用的(N)碱基可为通用/简并碱基或规范碱基，其独立于(6聚体)序列的核酸序列(b₁-b₂-b₃-b₄-b₅-b₆)。换句话说，尽管碱基b₁-b₂-b₃-b₄-b₅-b₆可对任何给定的靶序列具有特异性，但(N)碱基可为通用/简并碱基或由对碱基b₁-b₂-b₃-b₄-b₅-b₆所决定的靶标不具有特异性的4种规范碱基中的任何一种组成。例如，如果待查询的靶序列为CAGGCATA，则靶结合结构域的碱基b₁-b₂-b₃-b₄-b₅-b₆应为TCCGTA，而靶结合结构域的每个(N)碱基可独立地为A、C、T或G，使得得到的靶结合结构域可具有序列ATCCGTAG、TTCCGTAC、GTCCGTAG或任何其他16种可能的迭代。或者，2个(N)碱基可位于6个LNA之前。还或者，两个(N)碱基可位于6个LNA之后。

表1

B＝天然碱基；+＝修饰的核苷酸或核苷酸类似物(例如LNA)；N＝天然、通用或简并碱基。

表1还描述了“10聚体”靶结合结构域，其包含10个天然的靶标特异性碱基。

表1进一步描述了“天然I”靶结合结构域，其在b1-b6位包含6个天然碱基。这6个天然碱基的两侧各有2个(N)碱基。或者，所有4个(N)碱基均可位于6个天然碱基之前。还或者，所有4个(N)碱基可位于6个天然碱基之后。4个(N)碱基(即1、2、3或4)中的任何数目可位于6个天然碱基之前，而剩余的(N)碱基可位于6个天然碱基之后。

表1进一步描述了“天然II”靶结合结构域，其在b1-b6位包含6个天然碱基。这6个天然碱基的两侧各有1个(N)碱基。或者，2个(N)碱基均可位于6个天然碱基之前。还或者，2个(N)碱基可位于6个天然碱基之后。

表1还描述了“2LNA”靶结合结构域，其包含靶结合结构域的b1-b6位的2个LNA和4个天然碱基的组合。2个LNA和4个天然碱基可以任何顺序存在。例如，b3和b4位可为LNA，而b1、b2、b5和b6位为天然碱基。碱基b1-b6的两侧各有1个(N)碱基。或者，碱基b1-b6前面可为2个(N)碱基。还或者，碱基b1-b6后面可为2个(N)碱基。

表1进一步描述了“4LNA”靶结合结构域，其包含靶结合结构域的b1-b6位的4个LNA和2个天然碱基的组合。4个LNA和2个天然碱基可以任何顺序存在。例如，b2-b5位可为LNA，而b1和b6位为天然碱基。碱基b1-b6的两侧各有1个(N)碱基。或者，碱基b1-b6前面可为2个(N)碱基。还或者，碱基b1-b6后面可为2个(N)碱基。

本公开的测序探针包含合成主链。靶结合结构域和条形码结构域可操作地连接。靶结合结构域和条形码结构域可共价连接，作为1个合成主链的一部分。靶结合结构域和条形码结构域可经接头(例如核酸接头、化学接头)连接。合成主链可包括任何物质，例如多糖、多核苷酸、聚合物、塑料、纤维、肽、肽核酸或多肽。优选地，合成主链为刚性的。合成主链可包含单链DNA分子。主链可包含6个DNA双螺旋的“DNA折纸”(参见例如Lin et al,“Submicrometre geometrically encoded fluorescent barcodes self-assembled fromDNA.”Nature Chemistry；2012Oct；4(10):832-9)。条形码可由DNA折纸瓦片制成(Jungmannet al,“Multiplexed 3D cellular super-resolution imaging with DNA-PAINT andExchange-PAINT”,Nature Methods,Vol.11,No.3,2014)。

本公开的测序探针可包含部分双链合成主链。测序探针可包含单链DNA合成主链和靶结合结构域与条形码结构域之间的双链DNA间隔序列。测序探针可包含单链DNA合成主链和在靶结合结构域与条形码结构域之间具有与双链DNA类似的机械性能的基于聚合物的间隔区。典型的基于聚合物的间隔区包括聚乙二醇(PEG)型聚合物。

双链DNA间隔序列的长度可为约1个核苷酸-约100个核苷酸、长度约2个核苷酸-约50个核苷酸、长度约20个核苷酸-约40个核苷酸。优选地，双链DNA间隔序列的长度为约36个核苷酸。

在图2的左图中图解说明本公开的一种测序探针，称为“标准探针”。图2的标准探针包含共价连接于靶结合结构域的条形码结构域，使得靶结合和条形码结构域存在于同一单链寡核苷酸内。在图2左图中，单链寡核苷酸与茎寡核苷酸结合以产生称为茎的36个核苷酸长的双链间隔区。使用该架构，探针池中的每个测序探针可与相同的茎序列杂交。

在图2的右图中图解说明本公开的另一种测序探针，称为“3部分探针”。图2的3部分探针包含经接头连接于靶结合结构域的条形码结构域。在该实例中，接头为单链茎寡核苷酸，其与含有靶结合结构域的单链寡核苷酸和含有条形码结构域的单链寡核苷酸杂交，产生桥接条形码结构域(18个核苷酸)和靶结合结构域(18个核苷酸)的36个核苷酸长的双链间隔区。使用该示例性的探针配置，为了防止条形码结构域的交换，可设计每个条形码使得其与独特的茎序列杂交。此外，在将不同的测序探针汇集在一起之前，每个条形码结构域也可与其相应的茎寡核苷酸杂交。

条形码结构域包含多个附接位置，例如1、2、3、4、5、6、7、8、9、10或更多个附接位置。附接位置的数目可少于、等于或多于靶结合结构域中的核苷酸数目。靶结合结构域可包含比主链结构域中的附接位置数目更多的核苷酸，例如多1、2、3、4、5、6、7、8、9、10或更多个核苷酸。靶结合结构域可包含8个核苷酸和条形码结构域包含3个附接位置。靶结合结构域可包含10个核苷酸和条形码结构域包含3个附接位置。

条形码结构域的长度不受限制，只要对于至少3个附接位置有足够的空间，如下所述。术语“附接位置”、“位置”和“位点(spot)”本文可互换使用。术语“条形码结构域”和“报告结构域”本文可互换使用。

条形码结构域中的每个附接位置对应于靶结合结构域中的2个核苷酸(二核苷酸)，并因此对应于靶核酸中与靶结合结构域中的二核苷酸杂交的互补二核苷酸。作为非限制性实例，条形码结构域中的第一附接位置对应于靶结合结构域中的第一和第二核苷酸(例如图1，其中R1为条形码结构域中的第一附接位置和R1对应于靶结合结构域中的二核苷酸b1和b2-其转而识别靶核酸的二核苷酸1和2)；条形码结构域中的第二附接位置对应于靶结合结构域中的第三和第四核苷酸(例如图1，其中R2为条形码结构域中的第二附接位置和R2对应于靶结合结构域中的二核苷酸b3和b4-其转而识别靶核酸的二核苷酸3和4)；和条形码结构域中的第三附接位置对应于靶结合结构域中的第五和第六核苷酸(例如图1，其中R3为条形码结构域中的第三附接位置和R3对应于靶结合结构域中的二核苷酸b5和b6-其转而识别靶核酸的二核苷酸5和6)。

条形码结构域中的每个附接位置包含至少1个附接区，例如1-50或更多个附接区。条形码结构域中的某些位置可具有比其他位置更多的附接区(例如第一附接位置可具有3个附接区，而第二附接位置可具有2个附接位置)；或者，条形码结构域中的每个位置具有相同数目的附接区。条形码结构域中的每个附接位置可包含1个附接区。条形码结构域中的每个附接位置可包含1个以上附接区。条形码结构域中的至少3个附接位置的至少1个可包含与条形码结构域中的另外两个附接位置不同数目的附接区。

每个附接区包含能够由互补核酸分子(例如DNA或RNA)可逆结合的核酸序列的至少1个(即1-50个，例如10-30个)拷贝。单个附接位置处的附接区的核酸序列可以相同，因此，结合那些附接区的互补核酸分子相同。或者，1个位置处的附接区的核酸序列不相同，因此，结合那些附接区的互补核酸分子不同。

包含条形码结构域中的每个附接区的核酸序列的长度可为约8个核苷酸-约20个核苷酸。包含条形码结构域中的每个附接区的核酸序列的长度可为约12或为约14个核苷酸。优选地，包含条形码结构域中的每个附接区的核酸序列的长度为约14个核苷酸。

包含条形码结构域中的每个附接区的每个核酸可独立地为规范碱基或修饰的核苷酸或核酸类似物。条形码结构域中的附接区中的至少1、至少2、至少3、至少4、至少5或至少6个核苷酸可为修饰的核苷酸或核苷酸类似物。条形码结构域中的修饰的核苷酸或核苷酸类似物与规范碱基的典型比率为1:2-1:8。可用于条形码结构域中的附接区的典型修饰的核苷酸或核酸类似物为异鸟嘌呤和异胞嘧啶。例如，使用修饰的核苷酸或核苷酸类似物(比如异鸟嘌呤和异胞嘧啶)可提高报告探针与条形码结构域中的适当附接区的结合效率和准确率，同时最小化别处(包括与靶标)的结合。

一个或多个附接区可与多核苷酸主链成为一体，也就是说，主链为单个多核苷酸和附接区为单个多核苷酸序列的部分。一个或多个附接区可与合成主链中的修饰的单体(例如修饰的核苷酸)连接，使得附接区从合成主链分支出来。附接位置可包含一个以上附接区，其中一些附接区从合成主链分支出来和一些附接区与合成主链成为一体。至少1个附接位置中的至少1个附接区可与合成主链成为一体。至少3个附接位置的每一个中的每个附接区可与合成主链成为一体。至少1个附接位置中的至少1个附接区可从合成主链分支出来。至少3个附接位置中的每一个中的每个附接区可从合成主链分支出来。

条形码结构域内的每个附接位置对应于16种二核苷酸中的一种，即腺嘌呤-腺嘌呤、腺嘌呤-胸腺嘧啶/尿嘧啶、腺嘌呤-胞嘧啶、腺嘌呤-鸟嘌呤、胸腺嘧啶/尿嘧啶-腺嘌呤、胸腺嘧啶/尿嘧啶-胸腺嘧啶/尿嘧啶、胸腺嘧啶/尿嘧啶-胞嘧啶、胸腺嘧啶/尿嘧啶-鸟嘌呤、胞嘧啶-腺嘌呤、胞嘧啶-胸腺嘧啶/尿嘧啶、胞嘧啶-胞嘧啶、胞嘧啶-鸟嘌呤、鸟嘌呤-腺嘌呤、鸟嘌呤-胸腺嘧啶/尿嘧啶、鸟嘌呤-胞嘧啶或鸟嘌呤-鸟嘌呤。因此，位于条形码结构域的单个附接位置中的一个或多个附接区对应于16种二核苷酸中的一种，并且包含对附接区对应的二核苷酸具有特异性的核酸序列。位于条形码结构域的不同附接位置中的附接区包含独特的核酸序列，即使条形码结构域内的这些位置对应于相同的二核苷酸。例如，鉴于本公开的测序探针含有具有编码序列A-G-A-G-A-C的六聚体的靶结合结构域，该测序探针的条形码结构域将含有3个位置，即对应于腺嘌呤-鸟嘌呤二核苷酸的第一附接位置、对应于腺嘌呤-鸟嘌呤二核苷酸的第二附接位置和对应于腺嘌呤-胞嘧啶二核苷酸的第三附接位置。位于该实例探针的位置1中的附接区包含与位于位置2中的附接区的核酸序列不同的核酸序列，即使附接位置1和附接位置2两者均对应于二核苷酸腺嘌呤-鸟嘌呤。设计和测试特定附接位置的序列，使得特定附接位置的互补核酸不与不同的附接位置相互作用。另外，互补核酸的核苷酸序列不受限制，优选地其与已知的核苷酸序列缺少基本同源性(例如50％-99.9％)，这限制互补核酸和靶核酸的不期望的杂交。

图1显示包含示例性条形码结构域的本公开的一个示例性测序探针的图示。图1所示的示例性的条形码结构域包含3个附接位置(R₁、R₂和R₃)。每个附接位置对应于靶结合结构域的6聚体序列(b1至b6)内存在的特定二核苷酸。在该实例中，R₁对应于b₁和b₂位，R₂对应于b₃和b₄位，和R₃对应于b₅和b₆位。因此，每个位置解码靶结合结构域的6聚体序列中存在的特定二核苷酸，使得能够鉴定每个特定二核苷酸中存在的特定2个碱基(A、C、G或T)。

在图1所示的示例性的条形码结构域中，每个附接位置包含与合成主链成为一体的单个附接区。3个附接位置的每个附接区含有特定的核苷酸序列，其对应于由每个附接位置编码的特定二核苷酸。例如，附接位置R₁包含具有对应于二核苷酸b₁-b₂的身份的特定序列的附接区。

条形码结构域可进一步包含一个或多个结合区。条形码结构域可包含至少1个与至少1个附接位置相邻或侧翼的单链核酸序列。条形码结构域可包含至少2个与至少2个附接位置相邻或侧翼的单链核酸序列。条形码结构域可包含至少3个与至少3个附接位置相邻或侧翼的单链核酸序列。这些侧翼部分称为“立足点”，可用于通过为单链寡核苷酸提供另外的结合位点来加速与立足点相邻杂交的寡核苷酸的交换速率(例如“Toe-Hold”Probes；参见例如,Seeling et al.,“Catalyzed Relaxation ofa Metastable DNA Fuel”；J.Am.Chem.Soc.2006,128(37),pp12211-12220)。

本公开的测序探针可具有约20nm-约50nm的总长度(包括靶结合结构域、条形码结构域和任何任选结构域)。测序探针的主链可为包含约120个核苷酸的多核苷酸分子。

测序探针可包含可切割接头修饰。可使用本领域技术人员已知的任何可切割接头修饰。可切割接头修饰的非限制性实例包括(但不限于)UV光可切割接头、还原剂可切割接头和酶促可切割接头。酶促可切割接头的实例为插入尿嘧啶以通过USER^TM酶进行切割。可切割接头修饰可位于沿着测序探针长度的任何位置，包括(但不限于)靶结合结构域与条形码结构域之间的区域。图10的右图描绘了可掺入本公开的探针中的示例性的可切割接头修饰。

报告探针

与本公开的测序探针的条形码结构域的至少1个附接位置内的至少1个附接区内的互补核酸序列结合(例如杂交)并且包含(直接或间接)可检测的标记的核酸分子在本文称为“报告探针”或“报告探针复合物”，这些术语本文可互换使用。报告探针可为DNA、RNA或PNA。优选地，报告探针为DNA。

报告探针可包含至少2个结构域，即能够结合至少1个第一互补核酸分子的第一结构域和能够结合第一可检测标记和至少第二可检测标记的第二结构域。图3显示本公开的示例性报告探针的示意图，其结合于示例性测序探针的条形码结构域的第一附接位置。在图3中，报告探针的第一结构域(以带阴影的褐红色显示)结合条形码结构域的附接位置R₁内的互补核酸序列，和报告探针的第二结构域(以灰色显示)与2个可检测标记(一个绿色标记、一个红色标记)结合。

或者，报告探针可包含至少2个结构域，即能够结合至少1个第一互补核酸分子的第一结构域和能够结合至少1个第二互补核酸分子的第二结构域。至少1个第一和至少1个第二互补核酸分子可以不同(具有不同的核酸序列)。

“一级核酸分子”为包含至少2个结构域(能够与测序探针的条形码结构域的至少1个附接位置内的至少1个附接区内的互补核酸序列结合(例如杂交)的第一结构域和能够与至少1种另外的互补核酸结合(例如杂交)的第二结构域)的报告探针。一级核酸分子可直接结合测序探针的条形码结构域的至少一个附接位置内的至少一个附接区内的互补核酸序列。一级核酸分子可经核酸接头间接结合测序探针的条形码结构域的至少1个附接位置内的至少1个附接区内的互补核酸序列。一级核酸分子可包含可切割接头。可切割接头可位于第一结构域与第二结构域之间。优选地，可切割接头为光可切割的。

包含一级核酸分子的第一结构域的每个核酸可独立地为规范碱基或修饰的核苷酸或核酸类似物。一级核酸分子的第一结构域中的至少1个、2个、至少3个、至少4个、至少5个或至少6个核苷酸可为修饰的核苷酸或核苷酸类似物。条形码结构域中的修饰的核苷酸或核苷酸类似物与规范碱基的典型比率为1:2-1:8。可用于一级核酸分子的第一结构域中的典型修饰的核苷酸或核酸类似物为异鸟嘌呤和异胞嘧啶。例如，使用修饰的核苷酸或核苷酸类似物(比如异鸟嘌呤和异胞嘧啶)可提高一级核酸分子的第一结构域与测序探针的条形码结构域的至少1个附接位置内的至少1个附接区内的适当互补核酸序列的结合效率和准确率，同时最小化别处(包括与靶标)的结合。

结合一级核酸分子的至少1种另外的互补核酸本文称为“二级核酸分子”。一级核酸分子可与至少1个、至少2个、至少3个、至少4个、至少5个或更多个二级核酸分子结合(例如杂交)。优选地，一级核酸分子与4个二级核酸分子结合(例如杂交)。

二级核酸分子包含至少2个结构域，即能够与至少1个一级核酸分子中的至少1个互补序列结合(例如杂交)的第一结构域和能够与以下结合(例如杂交)的第二结构域：(a)第一可检测标记和至少第二可检测标记；(b)至少1种另外的互补核酸；或(c)或其组合。二级核酸分子可包含可切割接头。可切割接头可位于第一结构域与第二结构域之间。优选地，可切割接头为可光切割的。

包含二级核酸分子的第一结构域的每个核酸可独立地为规范碱基或修饰的核苷酸或核酸类似物。二级核酸分子的第一结构域中的至少1个、2个、至少3个、至少4个、至少5个或至少6个核苷酸可为修饰的核苷酸或核苷酸类似物。条形码结构域中的修饰的核苷酸或核苷酸类似物与规范碱基的典型比率为1:2-1:8。可用于二级核酸分子的第一结构域的典型修饰的核苷酸或核酸类似物为异鸟嘌呤和异胞嘧啶。例如，使用修饰的核苷酸或核苷酸类似物(比如异鸟嘌呤和异胞嘧啶)可提高二级核酸分子的第一结构域与一级核酸分子的第二结构域内的适当互补核酸序列的结合效率和准确率，同时最小化别处的结合。

结合二级核酸分子的至少1种另外的互补核酸本文称为“三级核酸分子”。二级核酸分子可与至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个或更多个三级核酸分子结合(例如杂交)。优选地，至少1个二级核酸分子与一个三级核酸分子结合(例如杂交)。

三级核酸分子包含至少2个结构域，即能够与至少1个二级核酸分子中的至少1个互补序列结合(例如杂交)的第一结构域和能够与第一可检测标记和至少第二可检测标记结合(例如杂交)的第二结构域。或者，第二结构域可经使用例如亚磷酰胺或NHS化学在寡核苷酸合成期间直接或间接附接标记而包含第一可检测标记和至少第二可检测标记。三级核酸分子可包含可切割接头。可切割接头可位于第一结构域与第二结构域之间。优选地，可切割接头为可光切割的。

包含三级核酸分子的第一结构域的每个核酸可独立地为规范碱基或修饰的核苷酸或核酸类似物。三级核酸的第一结构域中的至少1个、2个、至少3个、至少4个、至少5个或至少6个核苷酸可为修饰的核苷酸或核苷酸类似物。三级核酸分子的第一结构域中的修饰的核苷酸或核苷酸类似物与规范碱基的典型比率为1:2-1:8。可用于三级核酸分子的第一结构域中的典型修饰的核苷酸或核酸类似物为异鸟嘌呤和异胞嘧啶。例如，使用修饰的核苷酸或核苷酸类似物(比如异鸟嘌呤和异胞嘧啶)可提高三级核酸分子的第一结构域与二级核酸分子的第二结构域内的适当互补核酸序列的结合效率和准确率，同时最小化别处的结合。

报告探针与第一可检测标记和至少第二可检测标记结合以产生双色组合。荧光染料的这种双重组合可包括单一颜色的双重性，例如蓝色-蓝色。本文使用的术语“标记”包括能够产生可检测信号的单个部分或能够产生相同或基本相同的可检测信号的多个部分。例如，标记包括单一黄色荧光染料(比如ALEXA FLUOR^TM 532)或多种黄色荧光染料(比如ALEXAFLUOR^TM 532)。

报告探针可与第一可检测标记和至少第二可检测标记结合，其中每种可检测标记为以下4种荧光染料之一：蓝色(B)、绿色(G)、黄色(Y)和红色(R)。使用这4种染料产生以下10种可能的双色组合：BB、BG、BR、BY、GG、GR、GY、RR、RY或YY。在一些方面，本公开的报告探针用以下8种可能的颜色组合之一标记：BB、BG、BR、BY、GG、GR、GY或YY，如图3所示。可检测标记和至少第二可检测标记可具有相同的发射光谱或可具有不同的发射光谱。

在包含测序探针和一级核酸分子的方面，本公开提供一种包含靶结合结构域和条形码结构域的测序探针，其中靶结合结构域包含至少8个核苷酸并且能够结合靶核酸，其中靶结合结构域中的至少6个核苷酸能够识别靶核酸分子中的相应(互补)核苷酸和其中靶结合结构域中的至少2个核苷酸不识别靶核酸分子中的相应核苷酸；其中靶结合结构域中的至少6个核苷酸的至少1个或至少2个核苷酸为修饰的核苷酸或核苷酸类似物；其中条形码结构域包含合成主链，条形码结构域包含至少3个附接位置，每个附接位置包含至少1个附接区，附接区包含至少1个由至少1个互补一级核酸分子结合的核酸序列，其中互补一级核酸分子包含第一可检测标记和至少第二可检测标记，其中至少3个附接位置的每个附接位置对应于靶结合结构域中的至少6个核苷酸的2个核苷酸和至少3个附接位置的每一个具有不同的核酸序列，并且其中与至少3个附接位置的每个位置结合的每个互补一级核酸分子的至少第一可检测标记和至少第二可检测标记确定靶核酸中由靶结合结构域结合的至少6个核苷酸的相应2个核苷酸的位置和身份。靶结合结构域中不识别靶核酸分子中的相应核苷酸的至少2个核苷酸可为对靶结合结构域中的至少6个核苷酸所决定的靶标不具有特异性的4种规范碱基中的任何一种或者通用或简并碱基。

在包含测序探针和一级核酸分子的方面，本公开还提供一种包含靶结合结构域和条形码结构域的测序探针，其中靶结合结构域包含至少10个核苷酸并且能够结合靶核酸，其中靶结合结构域中的至少6个核苷酸能够识别靶核酸分子中的相应(互补)核苷酸和其中靶结合结构域中的至少4个核苷酸不识别靶核酸分子中的相应核苷酸；其中条形码结构域包含合成主链，条形码结构域包含至少3个附接位置，每个附接位置包含至少1个附接区，附接区包含至少1个由至少1个互补一级核酸分子结合的核酸序列，其中互补一级核酸分子包含第一可检测标记和至少第二可检测标记，其中至少3个附接位置的每个附接位置对应于靶结合结构域中的至少6个核苷酸的2个核苷酸和至少3个附接位置的每一个具有不同的核酸序列，其中与至少3个附接位置的每个位置结合的每个互补一级核酸分子的至少第一可检测标记和至少第二可检测标记确定靶核酸中由靶结合结构域结合的至少6个核苷酸的相应2个核苷酸的位置和身份。

在包含测序探针、一级核酸分子和二级核酸分子的方面，本公开提供一种包含靶结合结构域和条形码结构域的测序探针，其中靶结合结构域包含至少8个核苷酸并且能够结合靶核酸，其中靶结合结构域中的至少6个核苷酸能够识别靶核酸分子中的相应(互补)核苷酸和其中靶结合结构域中的至少2个核苷酸不识别靶核酸分子中的相应核苷酸；其中靶结合结构域中的至少6个核苷酸的至少1个或至少2个核苷酸为修饰的核苷酸或核苷酸类似物和其中靶结合结构域中的至少1个或至少2个核苷酸为对靶结合结构域中的其他碱基所决定的靶标不具有特异性的4种规范碱基中的任何一种或者通用或简并碱基；其中条形码结构域包含合成主链，条形码结构域包含至少3个附接位置，每个附接位置包含至少1个附接区，附接区包含至少1个由至少1个互补一级核酸分子结合的核酸序列，其中互补一级核酸分子进一步由至少1个互补二级核酸分子结合，互补二级核酸分子包含至少第一可检测标记和至少第二可检测标记，其中至少3个附接位置的每个附接位置对应于靶结合结构域中的至少6个核苷酸的2个核苷酸和至少3个附接位置的每一个具有不同的核酸序列，并且其中与至少3个附接位置的每个位置结合的每个互补二级核酸分子的至少第一可检测标记和至少第二可检测标记确定靶核酸中由靶结合结构域结合的至少6个核苷酸的相应2个核苷酸的位置和身份。

在包含测序探针、一级核酸分子和二级核酸分子的方面，本公开还提供一种包含靶结合结构域和条形码结构域的测序探针，其中靶结合结构域包含至少10个核苷酸并且能够结合靶核酸，其中靶结合结构域中的至少6个核苷酸能够识别靶核酸分子中的相应(互补)核苷酸和其中靶结合结构域中的至少4个核苷酸不识别靶核酸分子中的相应核苷酸；其中条形码结构域包含合成主链，条形码结构域包含至少3个附接位置，每个附接位置包含至少1个附接区，附接区包含至少1个由至少1个互补一级核酸分子结合的核酸序列，其中互补一级核酸分子进一步由至少1个互补二级核酸分子结合，互补二级核酸分子包含第一可检测标记和至少第二可检测标记，其中至少3个附接位置的每个附接位置对应于靶结合结构域中的至少6个核苷酸的2个核苷酸和至少3个附接位置的每一个具有不同的核酸序列，其中与至少3个附接位置的每个位置结合的每个互补二级核酸分子的至少第一可检测标记和至少第二可检测标记确定靶核酸中由靶结合结构域结合的至少6个核苷酸的相应2个核苷酸的位置和身份。

在包含测序探针、一级核酸分子、二级核酸分子和三级核酸分子的方面，本公开提供一种包含靶结合结构域和条形码结构域的测序探针，其中靶结合结构域包含至少8个核苷酸并且能够结合靶核酸，其中靶结合结构域中的至少6个核苷酸能够识别靶核酸分子中的相应(互补)核苷酸和其中靶结合结构域中的至少2个核苷酸不识别靶核酸分子中的相应核苷酸；其中靶结合结构域中的至少6个核苷酸的至少1个或至少2个核苷酸为修饰的核苷酸或核苷酸类似物和其中靶结合结构域中不识别靶核酸分子中的相应核苷酸的至少2个核苷酸可为对靶结合结构域中的至少6个核苷酸所决定的靶标不具有特异性的4种规范碱基中的任何一种或者通用或通用或简并碱基；其中条形码结构域包含合成主链，条形码结构域包含至少3个附接位置，每个附接位置包含至少1个附接区，附接区包含至少1个由至少1个互补一级核酸分子结合的核酸序列，其中互补一级核酸分子进一步由至少1个互补二级核酸分子结合，和其中至少1个互补二级核酸分子进一步由至少1个互补三级核酸分子结合，互补三级核酸分子包含第一可检测标记和至少第二可检测标记，其中至少3个附接位置的每个附接位置对应于靶结合结构域中的至少6个核苷酸的2个核苷酸和至少3个附接位置的每一个具有不同的核酸序列，并且其中与至少3个附接位置的每个位置结合的每个互补三级核酸分子的至少第一可检测标记和至少第二可检测标记确定靶核酸中由靶结合结构域结合的至少6个核苷酸的相应2个核苷酸的位置和身份。

在包含测序探针、一级核酸分子、二级核酸分子和三级核酸分子的方面，本公开还提供一种包含靶结合结构域和条形码结构域的测序探针，其中靶结合结构域包含至少10个核苷酸并且能够结合靶核酸，其中靶结合结构域中的至少6个核苷酸能够识别靶核酸分子中的相应(互补)核苷酸和其中靶结合结构域中的至少4个核苷酸不识别靶核酸分子中的相应核苷酸；其中条形码结构域包含合成主链，条形码结构域包含至少3个附接位置，每个附接位置包含至少1个附接区，附接区包含至少1个由至少1个互补一级核酸分子结合的核酸序列，其中互补一级核酸分子进一步由至少1个互补二级核酸分子结合，和其中至少1个互补二级核酸分子进一步由至少1个互补三级核酸分子结合，互补三级核酸分子包含第一可检测标记和至少第二可检测标记，其中至少3个附接位置的每个附接位置对应于靶结合结构域中的至少6个核苷酸的2个核苷酸和至少3个附接位置的每一个具有不同的核酸序列，其中与至少3个附接位置的每个位置结合的每个互补三级核酸分子的至少第一可检测标记和至少第二可检测标记确定靶核酸中由靶结合结构域结合的至少6个核苷酸的相应2个核苷酸的位置和身份。

本公开还提供在二级核酸分子和三级核酸分子两者上均具有可检测标记的测序探针和报告探针。例如，二级核酸分子可结合一级核酸分子，并且二级核酸分子可包含第一可检测标记和至少第二可检测标记两者，并且还与至少1个包含第一可检测标记和至少第二可检测标记的三级分子结合。位于二级核酸分子上的第一和至少第二可检测标记可具有相同的发射光谱或可具有不同的发射光谱。位于三级核酸分子上的第一和至少第二可检测标记可具有相同的发射光谱或可具有不同的发射光谱。二级核酸分子上可检测标记的发射光谱可与三级核酸分子上可检测标记的发射光谱相同或不同。

图4为本公开的示例性报告探针的说明性示意图，其包含示例性的一级核酸分子、二级核酸分子和三级核酸分子。在3'末端，一级核酸包含第一结构域，其中第一结构域包含与测序探针条形码结构域的附接位置内的互补附接区杂交的12个核苷酸序列。在5'末端为与6个二级核酸分子杂交的第二结构域。所示的示例性二级核酸分子又包含与一级核酸分子杂交的5'末端中的第一结构域和与5个三级核酸分子杂交的3'部分中的结构域。

三级核酸分子包含至少2个结构域。第一结构域能够与二级核酸分子结合。三级核酸的第二结构域能够与第一可检测标记和至少第二可检测标记结合。通过将一种或多种荧光标记的核苷酸单体直接掺入到三级核酸的第二结构域的序列中，可使三级核酸的第二结构域与第一可检测标记和至少第二可检测标记结合。通过使标记的短多核苷酸与二级核酸的第二结构域杂交，二级核酸分子的第二结构域可由第一可检测标记和至少第二可检测标记结合。这些称为“标记的寡核苷酸”的短多核苷酸可通过直接掺入荧光标记的核苷酸单体或通过本领域技术人员已知的其他标记核酸的方法来标记。图4所示的示例性的三级核酸分子(其可认为是“标记的寡核苷酸”)包含与二级核酸分子杂交的第一结构域和通过寡核苷酸合成期间使用例如NHS化学或者在三级核酸分子合成期间掺入一种或多种荧光标记的核苷酸单体间接附接标记物而荧光标记的第二结构域。标记的寡核苷酸可为DNA、RNA或PNA。

在备选方面，二级核酸的第二结构域能够与第一可检测标记和至少第二可检测标记结合。通过将一种或多种荧光标记的核苷酸单体直接掺入到二级核酸的第二结构域的序列中，可使二级核酸的第二结构域与第一可检测标记和至少第二可检测标记结合。通过使标记的短多核苷酸与二级核酸的第二结构域杂交，二级核酸分子的第二结构域可由第一可检测标记和至少第二可检测标记结合。这些称为“标记的寡核苷酸”的短多核苷酸可通过直接掺入荧光标记的核苷酸单体或通过本领域技术人员已知的其他标记核酸的方法来标记。

一级核酸分子可包含约100、约95、约90、约85、约80或约75个核苷酸。一级核酸分子可包含约100-约80个核苷酸。一级核酸分子可包含约90个核苷酸。二级核酸分子可包含约90、约85、约80、约75或约70个核苷酸。二级核酸分子可包含约90-约80个核苷酸。二级核酸分子可包含约87个核苷酸。二级核酸分子可包含约25、约20、约15或约10个核苷酸。三级核酸分子可包含约20-约10个核苷酸。三级核酸分子可包含约15个核苷酸。

本公开的报告探针可具有各种设计。例如，一级核酸分子可与至少1个(例如1、2、3、4、5、6、7、8、9、10或更多个)二级核酸分子杂交。每个二级核酸分子可与至少1个(例如1、2、3、4、5、6、7、8、9、10或更多个)三级核酸分子杂交。为了产生用特定双色组合标记的报告探针，设计报告探针以使探针包含二级核酸分子、三级核酸分子、标记的寡核苷酸或者二级核酸分子、三级核酸分子和寡核苷酸的任何组合，其用特定双色组合的每种颜色标记。例如，图4描绘了本公开的报告探针，其包含总计30种染料，15种染料用于颜色1和15种染料用于颜色2。为了防止不同荧光染料之间的颜色交换或交叉杂交，与特定标记或荧光染料结合的每个三级核酸或标记的寡核苷酸包含独特的核苷酸序列。

图5描绘了本公开的4种示例性报告探针设计。图5的左上图描绘了5x5报告探针。5x5报告探针包含一级核酸，其中一级核酸包含12个核苷酸的第一结构域。一级核酸还包含第二结构域，其中第二结构域包含可与5个二级核酸分子杂交的核苷酸序列。每个二级核酸包含核苷酸序列，使得通过可检测标记结合的5个三级核酸可与每个二级核酸杂交。

图5的右上图描绘了4x3报告探针。4x3报告探针包含一级核酸，其中一级核酸包含12个核苷酸的第一结构域。一级核酸还包含第二结构域，其中第二结构域包含可与4个二级核酸分子杂交的核苷酸序列。每个二级核酸包含核苷酸序列，使得与可检测标记结合的3个三级核酸可与每个二级核酸杂交。

图5的左下图描绘了3x4报告探针。3x4报告探针包含一级核酸，其中一级核酸包含12个核苷酸的第一结构域。一级核酸还包含第二结构域，其中第二结构域包含可与3个二级核酸分子杂交的核苷酸序列。每个二级核酸包含核苷酸序列，使得与可检测标记结合的4个三级核酸可与每个二级核酸杂交。

图5的右下图描绘了间隔区3x4报告探针。间隔区3x4报告探针包含一级核酸，其中一级核酸包含12个核苷酸的第一结构域。位于一级核酸的第一结构域与第二结构域之间的为由20-40个核苷酸组成的间隔区。间隔区被鉴定为20-40个核苷酸长，然而，间隔区的长度为非限制性的，并且其可短于20个核苷酸或长于40个核苷酸。一级核酸的第二结构域包含可与3个二级核酸分子杂交的核苷酸序列。每个二级核酸包含核苷酸序列，使得与可检测标记结合的4个三级核酸可与每个二级核酸杂交。

在图5中，每个一级核酸包含长12个核苷酸的第一结构域。然而，一级核酸的第一结构域的长度不受限制，并且可少于12个或多于12个核苷酸。优选地，一级核酸的第一结构域为14个核苷酸。

图5的特定图中所示的特定报告探针设计的任何特征可与图5的不同图中所示的或本文别处所述的报告探针设计的任何特征组合。例如，可修饰5x5报告探针以在互补核酸与一级核酸之间含有约20-40个核苷酸的间隔区。在另一个实例中，可修饰4x3报告探针，使得4个二级核酸包含核苷酸序列，使得与可检测标记结合的5个三级核酸能够与每个二级核酸杂交，从而产生4x5报告探针。

参阅图5，5x5报告探针(25)含有比4x3报告探针(12)更多的荧光标记，并且因此5x5报告探针的荧光强度将更大。在任何给定视场FOV中检测到的荧光为多种变量的函数，包括给定报告探针的荧光强度和该FOV内任选结合的靶分子的数目。每个视场(FOV)的任选结合的靶分子的数目可为每个FOV 1-250万个靶标。每个FOV结合的靶分子的典型数目为20000-40000、220000-440000或1百万-2百万个靶分子。典型的FOV为0.05mm²-1 mm²。典型FOV的进一步实例为0.05mm²-0.65mm²。

图6显示了报告探针设计，其中二级核酸分子包含“额外手柄”，其不与三级核酸分子杂交并且在一级核酸分子的远端。在图6中，每个“额外手柄”为长12个核苷酸(“12聚体”)，然而，其长度不受限制，并且可少于12或多于12个核苷酸。“额外手柄”可各自包含与二级核酸分子杂交的一级核酸分子的第一结构域的核苷酸序列。因此，当报告探针包含“额外手柄”时，报告探针可经一级核酸分子的第一结构域或经“额外手柄”与测序探针杂交。因此，报告探针与测序探针结合的可能性增加。“额外手柄”设计还可改善杂交动力学。不受任何理论的束缚，“额外手柄”可增加报告探针的互补核酸的有效浓度。预计5x4“额外手柄”报告探针产生每标准FOV约4750个荧光计数。预计5x3“额外手柄”报告探针、4x4“额外手柄”报告探针、4x3“额外手柄”报告探针和3x4“额外手柄”报告探针全部产生每标准FOV约6000个荧光计数。图5所示的示例性报告探针设计也可修饰为包含“额外手柄”。

报告探针的单个二级核酸分子可与三级核酸分子杂交，三级核酸分子全部用相同的可检测标记进行标记。例如，图7的左图描绘了“5x6”报告探针。5x6报告探针包含1个包含第二结构域的一级核酸，其中第二结构域包含与6个二级核酸分子杂交的核苷酸序列。每个二级核酸包含核苷酸序列，使得与可检测标记结合的5个三级核酸分子与每个二级核酸杂交。与特定二级核酸分子结合的5个三级核酸分子的每一个用相同的可检测标记进行标记。例如，3个二级核酸分子与用黄色荧光染料标记的三级核酸分子结合和另外3个二级核酸与用红色荧光染料标记的三级核酸分子结合。

报告探针的单个二级核酸分子可与用不同可检测标记进行标记的三级核酸分子杂交。例如，图7的中图描绘了“3x2x6”报告探针设计。“3x2x6”报告探针包含1个包含第二结构域的一级核酸，其中第二结构域包含与6个二级核酸分子杂交的核苷酸序列。每个二级核酸包含核苷酸序列，使得与可检测标记结合的5个三级核酸与每个二级核酸杂交。每个二级核酸与用黄色荧光染料标记的三级核酸分子和与用红色荧光染料标记的三级核酸分子两者结合。在该具体实例中，3个二级核酸分子结合2个红色和3个黄色三级核酸分子，而另外3个二级核酸分子结合2个红色和3个黄色三级核酸分子。每个二级核酸分子可与由不同可检测标记结合的任何数目的三级核酸分子结合。在图7的中图中，排列与单个二级核酸分子结合的三级核酸分子，使得标记的颜色交替(即红-黄-红-黄-红或黄-红-黄-红-黄)。

在任何所述的报告探针设计中，用不同的可检测标记进行标记的三级核酸可以任何顺序沿着二级核酸排列。例如，图7的右图描绘了“Fret抗性3x2x6”报告探针，其类似于3x2x6报告探针设计，除了沿着每个二级核酸分子的红色和黄色三级核酸分子的排列(例如线性顺序或分组)以外。

图8描绘了本公开的更多示例性报告探针设计，其包含与不同三级核酸分子结合的单个二级核酸分子。左图描绘了包含1个一级核酸分子的“6x1x4.5”报告探针，其中一级核酸分子包含第二结构域，其中第二结构域包含与6个二级核酸分子杂交的核苷酸序列。每个二级核酸分子与5个三级核酸分子杂交。与每个二级核酸分子杂交的5个三级核酸分子中的4个直接用相同颜色的可检测标记进行标记。表示为支化三级核酸的第五三级核酸与双色组合的另一颜色的5个标记的寡核苷酸结合。在6个二级核酸中，其中3个与用双色组合的一种颜色(在该实例中为红色)标记的支化三级核酸结合，而另外3个二级核酸与用双色组合的另一颜色(在该实例中为黄色)标记的支化三级核酸结合。总共，6x1x4.5报告探针用总共54种染料标记，每种颜色27种染料。图8的中图描绘了“4x1x4.5”报告探针，其与6x1x4.5报告探针共具相同的总体架构，除了4x1x4.5报告探针的一级核酸仅结合4个二级核酸，使得总共有36种染料，每种颜色18种以外。

对于双色组合的每种颜色，报告探针可包含相同数目的染料。对于双色组合的每种颜色，报告探针可包含不同数目的染料。关于哪种颜色在报告探针内具有更多染料的选择可基于两种染料吸收的光的能级来进行。例如，图8的右图描绘了“5x5能量优化的”报告探针设计。该报告探针设计包含15种黄色染料(其能量较高)和10种红色染料(其能量较低)。在该实例中，15种黄色染料可构成第一标记和10种红色染料可构成第二标记。

可检测部分、标记或报告分子可以多种方式与二级核酸分子、三级核酸分子或标记的寡核苷酸结合，包括直接或间接附接可检测部分，比如荧光部分、比色部分等。本领域的技术人员可参考涉及标记核酸的参考文献。荧光部分的实例包括(但不限于)黄色荧光蛋白(YFP)、绿色荧光蛋白(GFP)、青色荧光蛋白(CFP)、红色荧光蛋白(RFP)、伞形酮、荧光素、异硫氰酸荧光素、罗丹明、二氯三嗪基胺荧光素、花青、丹磺酰氯、藻蓝蛋白、藻红蛋白等。

许多综述中描述了荧光标记及其与核苷酸和/或寡核苷酸的附接，包括Haugland,Handbook ofFluorescentProbes andResearch Chemicals,Ninth Edition(MolecularProbes,Inc.,Eugene,2002)；Keller and Manak,DNA Probes,2nd Edition(StocktonPress,New York,1993)；Eckstein,editor,Oligonucleotides andAnalogues:APracticalApproach(IRL Press,Oxford,1991)；和Wetmur,Critical Reviews in Biochemistry andMolecular Biology,26:227-259(1991)。适用于本公开的特定方法学在以下参考文献样本中公开：美国专利第4757141、5151507和5091519号。一种或多种荧光染料可用作标记的靶序列的标记，例如，如美国专利第5188934(4,7-二氯荧光素染料)、5366860(光谱可分辨的罗丹明染料)、5847162(4,7-二氯罗丹明染料)、4318846(醚取代的荧光素染料)、5800996(能量转移染料)、Lee等人5066580(黄嘌呤染料)、5688648(能量转移染料)号等中所公开的那样。标记也可用量子点进行，如以下专利和专利公开中所公开的那样：美国专利第6322901、6576291、6423551、6251303、6319426、6426513、6444143、5990479、6207392、2002/0045045和2003/0017264号。本文使用的术语“荧光标记”包含通过一种或多种分子的荧光吸收和/或发射特性传递信息的信号传导部分。这种荧光特性包括荧光强度、荧光寿命、发射光谱特征、能量转移等。

易于掺入到核苷酸和/或寡核苷酸序列中的市售可得到的荧光核苷酸类似物包括(但不限于)Cy3-dCTP、Cy3-dUTP、Cy5-dCTP、Cy5-dUTP(Amersham Biosciences,Piscataway,NJ)、荧光素-12-dUTP、四甲基罗丹明-6-dUTP、TEXAS RED^TM-5-dUTP、CASCADEBLUE^TM-7-dUTP、BODIPY TMFL-14-dUTP、BODIPY TMR-14-dUTP、BODIPY TMTR-14-dUTP、RHODAMINE GREEN^TM-5-dUTP、OREGON GREENR^TM 488-5-dUTP、TEXAS RED^TM-12-dUTP、BODIPYTM 630/650-14-dUTP、BODIPY TM 650/665-14-dUTP、ALEXA FLUOR^TM 488-5-dUTP、ALEXAFLUOR^TM 532-5-dUTP、ALEXA FLUOR^TM 568-5-dUTP、ALEXA FLUOR^TM 594-5-dUTP、ALEXAFLUOR^TM 546-14-dUTP、荧光素-12-UTP、四甲基罗丹明-6-UTP、TEXAS RED^TM-5-UTP、mCherry、CASCADE BLUE^TM-7-UTP、BODIPY TM FL-14-UTP、BODIPY TMR-14-UTP、BODIPY TMTR-14-UTP、RHODAMINE GREEN^TM-5-UTP、ALEXA FLUOR^TM 488-5-UTP、LEXA FLUOR^TM 546-14-UTP(Molecular Probes,Inc.Eugene,OR)等。或者，可在寡核苷酸合成期间使用例如亚磷酰胺或NHS化学添加上述荧光团和本文提及的那些荧光团。本领域已知用于定制合成具有其他荧光团的核苷酸的方案(参见Henegariu et al.(2000)Nature Biotechnol.18:345)。2-氨基嘌呤为一种荧光碱基，可在寡核苷酸序列合成期间直接掺入其中。也可用嵌入染料比如DAPI、YOYO-1、溴化乙锭、花青染料(例如SYBR Green)等先验地染色核酸。

可用于合成后附接的其他荧光团包括(但不限于)ALEXA FLUOR^TM 350、ALEXAFLUOR^TM 405、ALEXA FLUOR^TM 430、ALEXA FLUOR^TM 532、ALEXA FLUOR^TM 546、ALEXA FLUOR^TM568、ALEXA FLUOR^TM 594、ALEXA FLUOR^TM 647、BODIPY493/503、BODIPY FL、BODIPY R6G、BODIPY 530/550、BODIPY TMR、BODIPY 558/568、BODIPY 558/568、BODIPY 564/570、BODIPY576/589、BODIPY 581/591、BODIPY TR、BODIPY 630/650、BODIPY650/665、瀑布蓝、瀑布黄、丹磺酰、丽丝胺罗丹明B、海洋蓝、俄勒冈绿488、俄勒冈绿514、太平洋蓝、太平洋橙、罗丹明6G、罗丹明绿、罗丹明红、四甲基罗丹明、德克萨斯红(可得自Molecular Probes,Inc.,Eugene,OR)、Cy2、Cy3、Cy3.5、Cy5、Cy5.5、Cy7(Amersham Biosciences,Piscataway,NJ)等。也可使用FRET串联荧光团，包括(但不限于)PerCP-Cy5.5、PE-Cy5、PE-Cy5.5、PE-Cy7、PE-德克萨斯红、APC-Cy7、PE-Alexa染料(610、647和680)、APC-Alexa染料等。

金属银或金颗粒可用于增强来自荧光标记的核苷酸和/或寡核苷酸序列的信号(Lakowicz et al.(2003)BioTechniques 34:62)。

用于寡核苷酸序列的其他合适标记可包括荧光素(FAM、FITC)、地高辛、二硝基苯酚(DNP)、丹磺酰、生物素、溴脱氧尿苷(BrdU)、六组氨酸(6xHis)、磷-氨基酸(例如P-tyr、P-ser、P-thr)等。以下半抗原/抗体对可用于检测，其中每种抗体用可检测标记衍生化：生物素/a-生物素、地高辛/a-地高辛、二硝基苯酚(DNP)/a-DNP、5-羧基荧光素(FAM)/a-FAM。

本文描述的可检测标记为光谱可分辨的。关于多个荧光标记的“光谱可分辨的”意指标记的荧光发射带足够不同，即足够不重叠，各个标记所附接的分子标签可基于以下区分：由各标记产生的通过标准光检测系统检测的荧光信号，例如采用带通滤波器和光电倍增管等系统，例如美国专利第4230558、4811218号等或在Wheeless et al.,pgs.21-76,inFlow Cytometry:Instrumentation and Data Analysis(Academic Press,New York,1985)中所述的系统。光谱可分辨的有机染料(比如荧光素、罗丹明等)意指波长发射最大值间隔至少20nm，并且在另一方面，间隔至少40nm。对于螯合的镧系元素化合物、量子点等，光谱可分辨的意指波长发射最大值间隔至少10nm或至少15nm。

报告探针可包含一个或多个可切割接头修饰。一个或多个可切割接头修饰可位于报告探针中的任何位置。可切割接头修饰可位于报告探针的一级核酸分子的第一与第二结构域之间。图9描绘了本公开的示例性的报告探针，其包含在一级核酸分子的第一与第二结构域之间的可切割接头修饰。可切割接头修饰可存在于报告探针的二级核酸分子的第一与第二结构域之间。可切割接头修饰可存在于报告探针的一级核酸分子和二级核酸分子的第一与第二结构域之间。图10的左图描绘了本公开的示例性的报告探针，其包含在一级核酸的第一与第二结构域之间以及在二级核酸的第一与第二结构域之间的可切割接头修饰。

可切割接头修饰可为以下式(I)的化合物或其立体异构体或盐：

其中：R₁为氢、卤素、C_1-6烷基、C_2-6链烯基、C_2-6炔基，其中所述C_1-6烷基、C_2-6链烯基、C_2-6炔基每一个独立地任选地用至少1个取代基R₁₀取代；R₂为O、NH或N(C_1-6烷基)；R₃为环烷基、杂环烷基、芳基或杂芳基，每一个任选地用至少1个取代基R₁₀取代；每个R₄和R₇独立地为C_1-6烷基、C_2-6链烯基、C_2-6炔基，其中所述C_1-6烷基、C_2-6链烯基、C_2-6炔基各自独立地任选地用至少1个取代基R₁₀取代；R₅和R₉各自独立地为环烷基、杂环烷基、芳基或杂芳基，每一个任选地用至少1个取代基R₁₀取代；R₆为O、NH或N(C_1-6烷基)；R₈为O、NH或N(C_1-6烷基)；每一个R₁₀独立地为氢、卤素、-C_1-6烷基、-C_2-6链烯基、-C_2-6炔基、卤代C_1-6烷基、卤代C_2-6链烯基、卤代C_2-6炔基、环烷基、杂环基、芳基、杂芳基、-CN、-NO₂、氧代、-OR₁₁、-SO₂R₁₁、-SO₃ ^-、-COR₁₁、-CO₂R₁₁、-CONR₁₁R₁₂、-C(＝NR₁₁)NR₁₂R₁₃、-NR₁₁R₁₂、-NR₁₂COR₁₂、-NR₁₁CONR₁₂R₁₃、-NR₁₁CO₂R₁₂、-NR₁₁SONR₁₂R₁₃、-NR₁₁SO₂NR₁₂R₁₃或-NR₁₁SO₂R₁₂；和R₁₁、R₁₂和R₁₃可以相同或不同，各自独立地为氢、-C_1-6烷基、-C_2-6链烯基、-C_2-6炔基、卤代C_1-6烷基、卤代C_2-6链烯基、卤代C_2-6炔基、C_1-6烷氧基C_1-6烷基-、环烷基、杂环基、芳基或杂芳基。

在一个方面，R₁为C_1-6烷基，优选地为C_1-3烷基，比如甲基、乙基、丙基或异丙基；R₂为NH或N(C_1-6烷基)；R₃为5-至6-元环烷基，优选地为环己基；R₄为C_1-6烷基，优选地为C_1-3亚烷基，比如亚甲基、亚乙基、亚丙基或亚异丙基；R₅为5-至6-元杂环基，其包含1个氮原子和0或1个另外的选自N、O和S的杂原子，其中所述杂环基任选地用1或2个R₁₀取代；R₆为O；R₇为C_1-6烷基，优选地为C_1-3亚烷基，比如亚甲基、亚乙基、亚丙基或亚异丙基；R₈为O；R₉为5-至6-元杂环基，其包含1个氮原子和0或1个另外的选自N、O和S的杂原子，其中所述杂环基任选地用1或2个R₁₀取代；并且每个R₁₀独立地为卤素、C_1-6烷基、卤代C_1-6烷基、氧代、-SO₂H或-SO₃ ^-。

在一个方面，R₃为环己基，R₄为亚甲基，R₅为1H-吡咯-2,5-二酮，和R₉为吡咯烷-2,5-二酮，任选地用SO₃ ^-取代。

接头化合物可为以下或其立体异构体或盐：

接头化合物可为以下或其立体异构体或盐：

接头化合物或接头修饰可为

接头化合物或接头修饰可为

报告探针可通过使3种储备溶液与水混合在一起来组装。一种储备溶液含有一级核酸分子，一种储备溶液含有二级核酸分子和最后一种储备溶液含有三级核酸分子。表2描绘了可混合以组装特定报告探针设计的每种储备溶液的示例性的量。

表2

靶核酸

本公开提供了使用本文公开的测序探针对核酸进行测序的方法。使用本公开的方法测序的核酸本文称为“靶核酸”。术语“靶核酸”应意指其序列通过本公开的探针、方法和装置测定的核酸分子(DNA、RNA或PNA)。通常，术语“靶核酸”、“靶核酸分子”、“靶核酸序列”、“靶核酸片段”、“靶寡核苷酸”和“靶多核苷酸”可互换使用并且旨在包括(但不限于)可具有各种长度的聚合形式的核苷酸(脱氧核糖核苷酸或核糖核苷酸)或其类似物。核酸的非限制性实例包括基因、基因片段、外显子、内含子、基因间DNA(非限制性地包括异染色质DNA)、信使RNA(mRNA)、转运RNA、核糖体RNA、核酶、小干扰RNA(siRNA)、非编码RNA(ncRNA)、cDNA、重组多核苷酸、支链多核苷酸、质粒、载体、序列的分离的DNA、序列的分离的RNA、核酸探针和引物。在使用本公开的方法测序之前，靶核酸的身份和/或序列为已知的。或者，身份和/或序列为未知的。在使用本公开的方法测序之前，靶核酸的一部分序列也可为已知的。例如，方法可涉及测定已知靶核酸分子中的点突变。

本方法直接对从样品(例如来自生物体的样品)获得的核酸分子测序，并且优选地无需转化(或扩增)步骤。例如，对于直接基于RNA的测序，本方法不需要在可获得序列之前将RNA分子转化成DNA分子(即经合成cDNA)。由于不需要扩增或转化，本公开中测序的核酸将保留当核酸处于样品中或当其从样品中获得时核酸中存在的任何独特碱基和/或表观遗传标志物。这种独特的碱基和/或表观遗传标志物在本领域已知的测序方法中丢失。

本方法可用于以单分子分辨率进行测序。换句话说，本方法使得用户能够基于从单个靶核酸分子收集的数据产生最终序列，而不是必须组合来自不同靶核酸分子的数据，这保留该特定靶标的任何独特特征。

靶核酸可从任何核酸样品或来源获得，例如任何细胞、组织或生物体、体外、化学合成仪等。靶核酸可通过任何本领域公认的方法获得。核酸可从临床受试者的血液样品获得。核酸可使用本领域熟知的方法和试剂盒从来源或样品提取、分离或纯化。

靶核酸可通过本领域已知的任何方法片段化。优选地，通过酶促或机械方法进行片段化。机械方法可为声处理或物理剪切。酶促方法可通过用核酸酶(例如脱氧核糖核酸酶I(DNase I))或者一种或多种限制性内切核酸酶消化来进行。

当包含靶核酸的核酸分子为完整染色体时，应采取措施以避免使染色体片段化。

靶核酸可包括天然或非天然核苷酸，包括如本领域所熟知的修饰的核苷酸或核酸类似物。

靶核酸分子可包括长达数百的千碱基(例如1、2、3、4、5、10、20、30、40、50、100、200、500或更多千碱基)的DNA、RNA和PNA分子。

捕获探针

靶核酸可固定(例如在1、2、3、4、5、6、7、8、9、10或更多个位置)于基底上。

示例性的有用基底包括包含选自配体、抗原、碳水化合物、核酸、受体、凝集素和抗体的结合部分的那些基底。捕获探针包含能够与基底的结合部分结合的基底结合部分。包含反应性部分的示例性的有用基底包括(但不限于)包含环氧、醛、金、酰肼、巯基、NHS-酯、胺、炔、叠氮化物、硫醇、羧酸酯、马来酰亚胺、羟甲基膦、亚氨酸酯、异氰酸酯、羟基、五氟苯基酯、补骨脂素、吡啶基二硫化物或乙烯基砜、聚乙二醇(PEG)、水凝胶或其混合物的表面。这种表面可从商业来源获得或根据标准技术制备。包含反应性部分的示例性的有用基底包括(但不限于)OptArray-DNA NHS组(Accler8)、Nexterion Slide AL(Schott)和NexterionSlide E(Schott)。

基底可为本领域已知的任何固体支持物，例如涂覆的载玻片和微流体装置，其能够固定靶核酸。基底可为表面、膜、珠粒、多孔材料、电极或阵列。例如基底可为聚合物材料、金属、硅、玻璃或石英。靶核酸可固定于本领域技术人员显而易见的任何基底上。

当基底为阵列时，基底可包含孔，其大小和间隔根据待附接的靶核酸分子而变化。在一个实例中，构建基底使得附接超密集有序的靶核酸阵列。基底上靶核酸阵列密度的实例包括500000-10000000个靶核酸分子/mm²、1000000-4000000个靶核酸分子/mm²或850000-3500000个靶核酸分子/mm²。

基底中的孔为用于靶核酸分子附接的位置。孔的表面可用上述反应性部分官能化以吸引和结合存在于靶核酸分子上的特定化学基团或捕获与靶核酸分子结合的探针以吸引、固定和结合靶核酸分子。众所周知，这些官能团能够通过各种缀合化学特异性地吸引和结合生物分子。

对于在基底上的单核酸分子比如阵列进行测序，将通用捕获探针或与捕获探针的基底结合部分互补的通用序列连接至每个孔。然后使单个靶核酸分子与通用捕获探针或者与捕获探针结合的捕获探针的基底结合部分互补的通用序列结合，并可开始测序。

靶核酸可通过一个或多个捕获探针(即2、3、4、5、6、7、8、9、10或更多个捕获探针)结合。捕获探针包含与靶核酸的一部分互补的结构域和含有基底结合部分的结构域。捕获探针与之互补的靶核酸部分可为靶核酸的末端或不朝向末端。

捕获探针的基底结合部分可为生物素和基底可为亲和素(例如链霉亲和素)。包含亲和素的有用基底可市售得到，包括TB0200(Accelr8)、SAD6、SAD20、SAD100、SAD500、SAD2000(Xantec)、SuperAvidin(Array-It)、链霉亲和素载玻片(目录号MPC 000,Xenopore)和STREPTAVIDINn载玻片(目录号439003,Greiner Bio-one)。捕获探针的基底结合部分可为亲和素(例如链霉亲和素)和基底可为生物素。可市售得到的包含生物素的有用基底包括(但不限于)Optiarray-生物素(Accler8)、BD6、BD20、BD100、BD500和BD2000(Xantec)。

捕获探针的基底结合部分可为能够通过光活化与基底结合的反应性部分。基底可包含光反应性部分，或者纳米报告探针的第一部分可包含光反应性部分。光反应性部分的一些实例包括芳基叠氮化物(比如N-((2-吡啶基二硫代)乙基)-4-叠氮基水杨酰胺)、氟化芳基叠氮化物(比如4-叠氮基-2,3,5,6-四氟苯甲酸)、二苯甲酮类试剂(比如4-苯甲酰基苯甲酸的琥珀酰亚胺酯)和5-溴-脱氧尿苷。

捕获探针的基底结合部分可为可与互补的基底的结合部分杂交的核酸。包含捕获探针的基底结合部分的每种核酸可独立地为规范碱基或修饰的核苷酸或核酸类似物。捕获探针的基底结合部分中的至少1个、至少2个、至少3个、至少4个、至少5个或至少6个核苷酸可为修饰的核苷酸或核苷酸类似物。捕获探针的基底结合部分中的修饰的核苷酸或核苷酸类似物与规范碱基的典型比率为1:2-1:8。可用于捕获探针的基底结合部分中的典型修饰的核苷酸或核酸类似物为异鸟嘌呤和异胞嘧啶。

捕获探针的基底结合部分可经本领域技术人员显而易见的其他结合对固定于基底上。在与基底结合之后，可通过施加足以延伸靶核酸的力(例如重力、水动力、电磁力“电拉伸”、流动拉伸、后退弯月面技术及其组合)来伸长靶核酸。捕获探针可包含可检测标记或与可检测标记相关联(即基准点)。

靶核酸可通过第二捕获探针结合，第二捕获探针包含与靶核酸的第二部分互补的结构域。由第二捕获探针结合的靶核酸的第二部分不同于由第一捕获探针结合的靶核酸的第一部分。该部分可为靶核酸的末端或不朝向末端。第二捕获探针的结合可发生在靶核酸伸长之后或期间，或者发生于尚未伸长的靶核酸。第二捕获探针可具有如上所述的结合。

靶核酸可被第三、第四、第五、第六、第七、第八、第九或第十捕获探针结合，捕获探针包含与靶核酸的第三、第四、第五、第六、第七、第八、第九或第十部分互补的结构域。该部分可为靶核酸的末端或不朝向末端。第三、第四、第五、第六、第七、第八、第九或第十捕获探针的结合可发生在靶核酸伸长之后或期间，或者发生于尚未伸长的靶核酸。第三、第四、第五、第六、第七、第八、第九或第十捕获探针可具有如上所述的结合。

捕获探针能够从样品中分离靶核酸。在此，将捕获探针添加至包含靶核酸的样品中。捕获探针经其与靶核酸的区域互补的捕获探针的区域结合靶核酸。当靶核酸接触包含结合捕获探针的基底结合部分的部分的基底时，核酸变成固定于基底上。

图11显示使用本公开的2个捕获探针系统捕获靶核酸。基因组DNA在95℃下变性并与捕获试剂池杂交。该捕获试剂池包含寡核苷酸探针A、探针B和反义阻断探针。探针A包含探针3'末端处的生物素部分和与靶核酸的5'末端互补的序列。探针B包含纯化结合序列，其可通过探针5'末端处的顺磁珠和与靶核酸的3'末端互补的核苷酸序列结合。反义阻断探针包含与待测序的靶核酸部分的反义链互补的核苷酸序列。在与捕获试剂杂交之后，在杂交的探针A和探针B之间的靶核酸上产生测序窗口。靶核酸使用与探针B的5'序列结合的顺磁珠进行纯化。洗掉任何过量的捕获试剂或互补的反义DNA链，导致预期的靶核酸的纯化。然后使纯化的靶核酸流过流动室，流动室包括可与杂交的探针A上的生物素部分(比如链霉亲和素)结合的表面。这导致靶核酸的一端束缚于流动池的表面。为了捕获另一端，对靶核酸进行流动拉伸，并添加与探针B的纯化结合序列互补的生物素化探针。在与探针B的纯化结合序列杂交后，生物素化探针可与流动池的表面结合，导致捕获的靶核酸分子伸长并在两端处与流动池表面结合。

为了确保用户从高度片段化的样品中“捕获”尽可能多的靶核酸分子，包括多种捕获探针是有帮助的，每种捕获探针与靶核酸的不同区域互补。例如，可存在3个捕获探针池，第一池与靶核酸的其5'末端附近区域互补，第二池与靶核酸的中间区域互补和第三池与其3'末端附近区域互补。这可类推至每个靶核酸的“n个感兴趣区域”。在该实例中，每个单个的片段化靶核酸池与包含或同生物素标签结合的捕获探针结合。对于每个池室，分离输入样品的1/n(其中n＝靶核酸中不同区域的数目)。捕获探针结合感兴趣的靶核酸。然后靶核酸经捕获探针的生物素固定于附着于基底的亲和素分子上。任选地，例如经流动或静电力拉伸靶核酸。所有n个池可同时拉伸和结合，或者，为了最大化完全拉伸的分子的数目，可首先拉伸和结合池1(其捕获最5'区域)，然后可拉伸和结合池2(其捕获靶标的中间区域)，最后可拉伸和结合池3。

本公开还使得用户能够捕获并同时对多个靶核酸进行测序，多个捕获探针可与靶核酸的混合样品杂交。多个靶核酸可包括一组1个以上的其中每个核酸含有相同序列的核酸或者一组1个以上的其中每个核酸不一定含有相同序列的核酸。同样地，多个捕获探针可包括一组1个以上的其序列相同的捕获探针或者一组1个以上的其序列不一定相同的捕获探针。例如，使用多个全部含有相同序列的捕获探针可使得用户能够捕获多个全部含有相同序列的靶核酸。通过对多个含有相同序列的靶核酸进行测序，由于数据冗余，可实现更高水平的测序准确率。在另一个实例中，可使用一组捕获探针对两种或多种感兴趣的特定基因进行同时捕获和测序，捕获探针包括与每种感兴趣的基因互补的捕获探针。这使得用户能够进行特定基因的多路复用测序。图12显示使用本发明方法用FFPE样品捕获和检测由100种靶标组成的多路复用癌症基因组的实验结果。

当期望完整的测序覆盖率时，所需的不同捕获探针的数目与靶核酸片段的大小成反比。换句话说，高度片段化的靶核酸将需要更多的捕获探针。对于具有高度片段化和降解的靶核酸的样品类型(例如福尔马林固定的石蜡包埋组织)，包括多个捕获探针池可能是有用的。另一方面，对于具有长靶核酸片段的样品，例如体外获得的分离的核酸，5'末端处的单个捕获探针可能就足够了。

两个捕获探针之间或者一个捕获探针之后和靶核酸的末端之前的靶核酸区域本文称为“测序窗口”。在图11中标出了当两个捕获探针用于捕获靶核酸时产生的测序窗口。测序窗口为靶核酸的一部分，其可用于由测序探针结合。最小测序窗口为靶结合结构域长度(例如4-10个核苷酸)和最大测序窗口为整个染色体的大部分。

当使用本发明方法对大的靶核酸分子进行测序时，可沿着靶核酸的长度杂交一个“阻断寡核苷酸”或多个阻断寡核苷酸，以控制测序窗口的大小。阻断寡核苷酸在特定位置与靶核酸杂交，从而阻止测序探针在那些位置的结合，产生较小的感兴趣的测序窗口。图13显示与捕获探针、阻断寡核苷酸和测序探针杂交的两个捕获的靶DNA分子的示意图。通过创建较小的测序窗口，测序反应局限于靶DNA分子上的特定感兴趣区域，提高测序的速度和准确率。当对靶核酸内的已知位置处的特定突变进行测序时，阻断寡核苷酸的使用特别有用，因为整个靶核酸不需要进行测序。图13中的实例显示两个杂合位点的有针对性的测序，以区分两种不同的单倍型。

本公开的方法

本公开的测序方法包括使本文公开的至少一种测序探针与靶核酸可逆性地杂交。

用于对核酸进行测序的方法可包括(1)使本文所述的测序探针与靶核酸杂交。靶核酸可任选地在一个或多个位置固定于基底上。示例性的测序探针可包含靶结合结构域和条形码结构域，其中靶结合结构域包含至少8个与靶核酸杂交的核苷酸，其中靶结合结构域中的至少6个核苷酸可识别靶核酸分子中的相应核苷酸(例如当靶结合结构域序列为正好6个核苷酸时，那6个核苷酸识别与其杂交的靶分子的6个互补核苷酸)和其中靶结合结构域中的至少2个核苷酸不识别靶核酸分子中的相应核苷酸(例如那至少2个核苷酸不识别与其杂交的靶分子的2个互补核苷酸)；其中靶结合结构域中的至少6个核苷酸的至少2个核苷酸为修饰的核苷酸或核苷酸类似物；其中条形码结构域包含合成主链，条形码结构域包含至少3个附接位置，每个附接位置包含至少1个附接区，附接区包含至少1个能够由互补核酸分子结合的核酸序列，其中至少3个附接位置的每个附接位置对应于靶结合结构域中的至少6个核苷酸的2个核苷酸和至少3个附接位置的每一个具有不同的核酸序列，和其中至少3个附接位置的每个位置的核酸序列确定靶核酸中由靶结合结构域结合的至少6个核苷酸的相应2个核苷酸的位置和身份。

在测序探针与靶核酸杂交后，方法包括(2)使包含第一可检测标记和至少第二可检测标记的第一互补核酸分子与条形码结构域的至少3个附接位置的第一附接位置结合；(3)检测结合的第一互补核酸分子的第一和至少第二可检测标记；(4)鉴定固定的靶核酸中的至少2个核苷酸的位置和身份。例如，当第一互补核酸分子包含2个可检测标记时，2个可检测标记鉴定固定的靶核酸中的至少2个核苷酸。

在检测至少2种可检测标记后，从第一互补核酸分子去除至少2种可检测标记。因此，方法进一步包括(5)使缺少可检测标记的第一杂交核酸分子与第一附接位置结合，从而解除包含可检测标记的第一互补核酸分子的结合，或者使包含可检测标记的第一互补核酸分子与足以释放第一可检测标记和至少第二可检测标记的力接触。因此，在步骤(5)之后，没有可检测标记与第一附接位置结合。方法进一步包括(6)使包含第三可检测标记和至少第四可检测标记的第二互补核酸分子与条形码结构域的至少3个附接位置的第二附接位置结合；(7)检测结合的第二互补核酸分子的第三和至少第四可检测标记；(8)鉴定任选固定的靶核酸中的至少2个核苷酸的位置和身份；(9)重复步骤(5)至(8)，直至条形码结构域中的至少3个附接位置的每个附接位置已由包含2个可检测标记的互补核酸分子结合，并且已检测到结合的互补核酸分子的2个可检测标记，从而鉴定由测序探针的靶结合结构域杂交的固定的靶核酸的至少第一区域的至少6个核苷酸的线性顺序；和(10)从任选固定的靶核酸去除测序探针。

方法可进一步包括：(11)使第二测序探针与任选地在一个或多个位置固定于基底上的靶核酸杂交，并且其中第一测序探针和第二测序探针的靶结合结构域不同；(12)使包含第一可检测标记和至少第二可检测标记的第一互补核酸分子与条形码结构域的至少3个附接位置的第一附接位置结合；(13)检测结合的第一互补核酸分子的第一和至少第二可检测标记；(14)鉴定任选固定的靶核酸中的至少2个核苷酸的位置和身份；(15)使缺少可检测标记的第一杂交核酸分子与第一附接位置结合，从而解除包含可检测标记的第一互补核酸分子或复合物的结合，或者使包含可检测标记的第一互补核酸分子或复合物与足以释放第一可检测标记和至少第二可检测标记的力接触；(16)使包含第三可检测标记和至少第四可检测标记的第二互补核酸分子与条形码结构域的至少3个附接位置的第二附接位置结合；(17)检测结合的第二互补核酸分子的第三和至少第四可检测标记；(18)鉴定固定的靶核酸中的至少2个核苷酸的位置和身份；(19)重复步骤(15)至(18)，直至条形码结构域中的至少3个附接位置的每个附接位置已由包含2个可检测标记的互补核酸分子结合，并且已检测到结合的互补核酸分子的2个可检测标记，从而鉴定由测序探针的靶结合结构域杂交的固定的靶核酸的至少第二区域的至少6个核苷酸的线性顺序；和(20)从任选固定的靶核酸去除第二测序探针。

第一互补核酸分子可包含可切割接头。第二互补核酸分子可包含可切割接头。第一互补核酸分子和第二互补核酸分子可各自包含可切割接头。优选地，可切割接头为光可切割的。释放力可以是光。优选地，为UV光。光可由选自弧光灯、激光器、聚焦UV光源和发光二极管的光源提供。

第一互补核酸分子和缺少可检测标记的第一杂交核酸分子可包含相同的核酸序列。例如，缺少可检测标记的第一杂交核酸分子可包含与同条形码结构域的至少3个附接位置的第一附接位置结合的第一互补核酸分子的所述部分相同的核酸序列。缺少可检测标记的第一杂交核酸分子可包含与同条形码结构域中的第一附接位置相邻的侧翼单链多核苷酸互补的核酸序列。

本发明进一步提供利用本文公开的多种测序探针对核酸进行测序的方法。例如，靶核酸与一种以上的测序探针杂交，并且每种探针可对与其杂交的靶核酸部分进行测序。

本公开还提供一种用于对核酸进行测序的方法，方法包括：(1)使包含多个本文所述的测序探针的至少1个第一群的第一测序探针与任选地在一个或多个位置固定于基底上的靶核酸杂交；(2)使包含第一可检测标记和至少第二可检测标记的第一互补核酸分子与条形码结构域的至少3个附接位置的第一附接位置结合；(3)检测结合的第一互补核酸分子的第一和至少第二可检测标记；(4)鉴定固定的靶核酸中的至少2个核苷酸的位置和身份；(5)使缺少可检测标记的第一杂交核酸分子与第一附接位置结合，从而解除包含可检测标记的第一互补核酸分子的结合，或者使包含可检测标记的第一互补核酸分子与足以释放第一可检测标记和至少第二可检测标记的力接触；(6)使包含第三可检测标记和至少第四可检测标记的第二互补核酸分子与条形码结构域的至少3个附接位置的第二附接位置结合；(7)检测结合的第二互补核酸分子的第三和至少第四可检测标记；(8)鉴定任选固定的靶核酸中的至少2个核苷酸的位置和身份；(9)重复步骤(5)至(8)，直至条形码结构域中的至少3个附接位置的每个附接位置已由包含2个可检测标记的互补核酸分子结合，并且已检测到结合的互补核酸分子的2个可检测标记，从而鉴定由测序探针的靶结合结构域杂交的固定的靶核酸的至少第一区域的至少6个核苷酸的线性顺序；和(10)从任选固定的靶核酸去除至少1个第一群的第一测序探针。

方法可进一步包括：(11)使包含多个本文公开的测序探针的至少1个第二群的第二测序探针与任选地在一个或多个位置固定于基底上的靶核酸杂交，并且其中第一测序探针和第二测序探针的靶结合结构域不同；(12)使包含第一可检测标记和至少第二可检测标记的第一互补核酸分子与条形码结构域的至少3个附接位置的第一附接位置结合；(13)检测结合的第一互补核酸分子的第一和至少第二可检测标记；(14)鉴定任选固定的靶核酸中的至少2个核苷酸的位置和身份；(15)使缺少可检测标记的第一杂交核酸分子与第一附接位置结合，从而解除包含可检测标记的第一互补核酸分子或复合物的结合，或者使包含可检测标记的第一互补核酸分子或复合物与足以释放第一可检测标记和至少第二可检测标记的力接触；(16)使包含第三可检测标记和至少第四可检测标记的第二互补核酸分子与条形码结构域的至少3个附接位置的第二附接位置结合；(17)检测结合的第二互补核酸分子的第三和至少第四可检测标记；(18)鉴定固定的靶核酸中的至少2个核苷酸的位置和身份；(19)重复步骤(15)至(18)，直至条形码结构域中的至少3个附接位置的每个附接位置已由包含2个可检测标记的互补核酸分子结合，并且已检测到结合的互补核酸分子的2个可检测标记，从而鉴定由测序探针的靶结合结构域杂交的固定的靶核酸的至少第二区域的至少6个核苷酸的线性顺序；和(20)从任选固定的靶核酸去除至少1个第二群的第二测序探针。

本文进一步描述了测序方法。

图14显示本公开的单个示例性的测序循环的示意性概述。尽管本发明方法不需要在测序之前固定靶核酸，但在该实例中，方法以已使用捕获探针捕获并结合于流动池表面的靶核酸开始，如最左上图所示。然后使1个测序探针池流入流动池中，以使得测序探针能够与靶核酸杂交。在该实例中，测序探针为图1所示的那些。这些测序探针包含靶结合结构域内与靶核酸杂交的6聚体序列。该6聚体的两侧各有(N)碱基，其可为通用/简并碱基或由对碱基b₁-b₂-b₃-b₄-b₅-b₆所决定的靶标不具有特异性的4种规范碱基中的任何一种组成。使用6聚体序列，一组4096(4^6)个测序探针使得能够对任何靶核酸进行测序。对于该实例，使该组8池4096个测序探针(每池512个测序探针)与靶核酸杂交。测序探针的靶结合结构域中的6聚体序列将沿着靶核酸的长度在6聚体与靶核酸之间存在完全互补匹配的位置处杂交，如图14的中上图所示。在该实例中，单个测序探针与靶核酸杂交。使任何未结合的测序探针从流动池中洗出。

这些测序探针还包含如上所述具有3个附接位置R₁、R₂和R₃的条形码结构域。附接位置R₁内的附接区包含一个或多个核苷酸序列，其对应于测序探针的6聚体的第一二核苷酸。因此，只有包含对应于测序探针的靶结合结构域中存在的第一二核苷酸的身份的互补核酸的报告探针将与附接位置R₁杂交。同样地，测序探针的附接位置R₂内的附接区对应于靶结合结构域中存在的第二二核苷酸和测序探针的附接位置R₃内的附接区对应于靶结合结构域中存在的第二二核苷酸。

方法以图14的最右上图继续。使1个报告探针池流入流动池中。报告探针池中的每个报告探针包含双色组合形式的可检测标记和可与测序探针的附接位置R₁内的相应附接区杂交的互补核酸。如上所述，特定报告探针的双色组合和互补核酸对应于16种可能的二核苷酸之一。设计每个报告探针池，使得在测序之前建立对应于特定二核苷酸的双色组合。例如，在图14所示的测序实验中，对于与附接位置R₁杂交的第一报告探针池，双色组合黄色-红色可对应于二核苷酸腺嘌呤-胸腺嘧啶。在报告探针与附接位置R₁杂交之后，如图14的右上图所示，然后使任何未结合的报告探针从流动池中洗出，并记录结合的报告探针的可检测标记以确定6聚体的第一二核苷酸的身份。

去除归因于与附接位置R₁杂交的报告探针的可检测标记。为了去除可检测标记，报告探针可包含可切割接头，并且可添加适当的切割剂。或者，使缺少可检测标记的互补核酸与测序探针的附接位置R₁杂交并用可检测标记置换报告探针。不管去除可检测标记的方法如何，附接位置R₁不再发出可检测信号。先前发出可检测信号的条形码结构域的附接位置不再能够发出可检测信号的过程本文称为“变暗”。

使第二报告探针池流入流动池中。报告探针池中的每个报告探针包含双色组合形式的可检测标记和可与测序探针的附接位置R₂内的相应附接区杂交的互补核酸。特定报告探针的双色组合和互补核酸对应于16种可能的二核苷酸之一。特定的双色组合可能在第一报告探针池的情况下对应于一种二核苷酸和在第二报告探针池的情况下对应于不同的二核苷酸。在报告探针与附接位置R₂杂交之后，如图14的右下图所示，然后使任何未结合的报告探针从流动池中洗出，并记录可检测标记以确定测序探针中存在的6聚体的第二二核苷酸的身份。

为了去除位置R₂处的可检测标记，报告探针可包含可切割接头，并且可添加适当的切割剂。或者，使缺少可检测标记的互补核酸与测序探针的附接位置R₂杂交并用可检测标记置换报告探针。不管去除可检测标记的方法如何，附接位置R₂不再发出可检测信号。

然后使第三报告探针池流入流动池中。第三报告探针池中的每个报告探针包含双色组合形式的可检测标记和可与报告探针的附接位置R₃内的相应附接区杂交的互补核酸。特定报告探针的双色组合和互补核酸对应于16种可能的二核苷酸之一。在报告探针与位置R₃杂交之后，如图14的中下图所示，然后使任何未结合的报告探针从流动池中洗出，并记录可检测标记以确定测序探针中存在的6聚体的第三二核苷酸的身份。以这种方式，鉴定了靶结合结构域的所有3个二核苷酸，并且可组装在一起以揭示靶结合结构域的序列并因此揭示靶核酸的序列。

为了继续对靶核酸进行测序，可从靶核酸中去除任何结合的测序探针。即使报告探针仍然与条形码结构域的位置R₃杂交，也可从靶核酸中去除测序探针。或者，可在从靶结合结构域去除测序探针之前，从条形码结构域去除与位置R₃杂交的报告探针，例如通过使用如上所述的对位置R₁和R₂的报告探针的暗化程序。

图14所示的测序循环可重复任何次数，每个测序循环开始于使同一测序探针池与靶核酸分子杂交或者使不同测序探针池与靶核酸杂交。第二测序探针池可在与第一测序循环期间第一测序探针或测序探针池结合的位置重叠的位置与靶核酸结合。因此，靶核酸内的某些核苷酸可测序1次以上和使用1种以上的测序探针。

图15描绘了本公开的测序方法的一个完整循环和在该循环期间收集的相应成像数据的示意图。在该实例中，使用的测序探针为图1所示的那些和测序步骤与图14所示的和上述那些相同。在测序探针的测序结构域与靶核酸杂交之后，使报告探针与测序探针的第一附接位置(R₁)杂交。然后对第一报告探针成像以记录彩色点。在图15中，彩色点用虚线圆圈标记。彩色点对应于在整个循环期间记录的单个测序探针。在该实例中，记录7个测序探针(1-7)。然后使条形码结构域的第一附接位置变暗，并使双荧光报告探针与测序探针的第二附接位置(R₂)杂交。然后对第二报告探针成像以记录彩色点。然后使条形码结构域的第二附接位置变暗，并使双荧光报告探针与测序探针的第三附接位置(R₃)杂交。然后对第三报告探针成像以记录彩色点。然后按顺序排列来自每个测序探针1-7的3个彩色点。然后使用解码矩阵将每个色斑映射成特定的二核苷酸，以揭示测序探针1-7的靶结合结构域的序列。

在单个测序循环期间，确定与靶核酸结合的任何测序探针的靶结合结构域的序列所需的报告探针池的数目与条形码结构域中的附接位置的数目相同。因此，对于具有3个位置的条形码结构域，将对测序探针循环3个报告探针池。

1个测序探针池可包含多个序列完全相同的测序探针或多个序列不完全相同的测序探针。当1个测序探针池包含多个序列不完全相同的测序探针时，每种不同的测序探针可以相同的数目存在，或者不同的测序探针可以不同的数目存在。

图16显示本公开的示例性的测序探针池配置，其中当测序探针含有以下时，上述8种颜色组合用于设计8个不同的测序探针池：(a)特异性地与靶核酸结合的具有6个核苷酸(6聚体)的靶结合结构域和(b)条形码结构域中的3个附接位置(R₁、R₂和R₃)。可能存在4096个独特的6聚体序列(4x4x4x4x4x4＝4096)。鉴于条形码结构域中的3个附接位置的每一个可与由8种不同颜色组合之一结合的互补核酸杂交，可存在512种独特的3色组合组(8*8*8＝512)。例如，其中R₁与同颜色组合GG结合的互补核酸杂交、R₂与同颜色组合BG结合的互补核酸杂交和R₃与同颜色组合YR结合的互补核酸杂交的探针，因此，3色组合组相应地为GG-BG-YR。在1个测序探针池内，每个独特的3色组合组将对应于靶结合结构域内的独特6聚体。鉴于每个池含有512个独特的6聚体，并且存在总计4096个可能的6聚体，需要8个池来对所有可能的6聚体进行测序(4096/512＝8)。确定置于8个池的每一个中的特异性测序探针以确保每个测序探针与靶核酸的最佳杂交。为确保最佳杂交，采取包括以下的几项预防措施：(a)将完全的6聚体补体分成不同的池；(b)将具有高Tm和低Tm的6聚体分成不同的池；和(c)基于根据经验学习的杂交模式将6聚体分成不同的池。

图17显示美国专利公开第20160194701号所述的测序探针与本公开的测序探针之间的差异。如图17的左图所示，美国专利公开第20160194701号描述了具有条形码结构域的测序探针，条形码结构域包含与互补核酸杂交的6个附接位置。每种互补核酸与4种不同荧光染料之一结合。在该配置中，每种颜色(红色、蓝色、绿色、黄色)对应于靶结合结构域中的1个核苷酸(A、T、C或G)。该探针设计可创建4096个独特探针(4^6)。如图17的右图所示，在本公开的一个实例中，每个测序探针的条形码结构域包含3个与互补核酸杂交的附接位置，如图17的右图所示。与美国专利公开第20160194701号不同，这些互补核酸由8种不同颜色组合(GG、RR、GY、RY、YY、RG、BB和RB)之一结合。每种颜色组合对应于靶结合结构域中的特定二核苷酸。该配置创建512个独特探针(8^3)。为了覆盖靶结合结构域内的所有可能的六聚体组合(4096)，需要8个单独池的这512个独特探针来对整个靶核酸进行测序。由于使用8种颜色组合来标记互补核酸，但是存在16种可能的二核苷酸，某些颜色组合将对应于不同的二核苷酸，这取决于正在使用哪个池的测序探针。例如，在图17中，在第1、第2、第3和第4测序探针池中，颜色组合BB对应于二核苷酸AA和颜色组合GG对应于二核苷酸AT。在第5、第6、第7和第8测序探针池中，颜色组合BB对应于二核苷酸CA和颜色组合CT对应于二核苷酸AT。

多个测序探针(即1个以上的测序探针)可在测序窗口内杂交。在测序期间，记录与多个杂交的测序探针中的每个测序探针结合的可检测标记的身份和空间位置。这使得能够随后鉴定多个二核苷酸的位置和身份两者。换句话说，通过使多个测序探针同时与单个靶核酸分子杂交，可同时对沿着靶核酸的多个位置进行测序，从而提高测序速度。

图18显示与捕获的靶核酸分子杂交的单个测序探针和多个测序探针的示意图。两个杂交的5’和3’捕获探针之间的测序窗口使得能够沿着靶核酸分子的长度杂交单个测序探针(左图)或多个测序探针(右图)。通过沿着靶核酸分子的长度杂交多个测序探针，靶核酸分子上的1个以上位置可同时进行序列，从而提高测序速度。图19显示当单个探针(左图)或多个探针(右图)与捕获的靶核酸杂交时在本公开的测序方法期间记录的荧光图像。图19的右图显示来自沿着靶核酸的长度结合的多个探针的单个探针的荧光信号可在空间上分辨。

图20显示其沿着长度为15千碱基的靶核酸的长度结合的本公开的多个测序探针和相应记录的荧光图像的示意图。测序探针可沿着靶核酸的长度以均匀的间隔结合，如图20的右图所示。测序探针不需要沿着靶核酸的长度以均匀的间隔结合，如图20的左图所示。图20所示的荧光图像证实来自沿着靶核酸的长度结合的多个测序探针的信号可在空间上分辨，以同时在靶核酸的多个位置获得测序信息。

沿着靶核酸长度的探针分布对于可检测信号的分辨率至关重要。有时1个区域中的探针太多会导致其可检测标记重叠，从而妨碍2个邻近探针的分辨率。这解释如下。鉴于1个核苷酸长度为0.34nm和鉴于测序装置的横向(x-y)空间分辨率为约200nm，测序装置的分辨率极限为约588个碱基对(即1个核苷酸/0.34nmx 200nm)。也就是说，当2个探针在彼此约588个碱基对内时，上述测序装置将不能分辨来自与靶核酸杂交的2个探针的信号。因此，取决于测序装置的分辨率，2个探针将需要间隔开约600bp，之后其可检测标记可被分辨为不同的“位点(spot)”。因此，在最佳间隔下，每600bp靶核酸应该有1个单个探针。优选地，1个探针群中的每个测序探针将彼此结合紧密度不超过600个核苷酸。多种软件方法(例如利用荧光强度值和波长依赖性比率)可用于监测、限制和潜在地去除在靶核酸的可分辨区域内杂交的探针数目，并相应地设计探针群。此外，可选择提供更多离散信号的可检测标记(例如荧光标记)。此外，文献中的方法(例如Small and Parthasarthy:“Superresolutionlocalization methods.”Annu.Rev.Phys Chem.,2014；65:107-25)描述了结构光照明和多种超分辨率方法，其将测序显微镜的分辨率极限降低至10纳米。使用更高分辨率的测序装置使得能够使用具有更短靶结合结构域的探针。

如上所述，设计探针的Tm可影响与靶核酸杂交的探针的数目。或者或另外，可增加群中测序探针的浓度以增加靶核酸的特定区域中探针的覆盖率。可减少测序探针的浓度以降低靶核酸的特定区域中探针的覆盖率，例如高于测序装置的分辨率极限。

尽管2个可检测标记的分辨率极限为约600个核苷酸，但这不妨碍本公开的强大的测序方法。在某些方面，任何群中的多个测序探针在靶核酸上不会被分开600个核苷酸。然而，统计学上(遵循泊松分布)，将存在仅有1个测序探针与其结合并且测序探针为光学可分辨的靶核酸。对于在600个核苷酸内结合有多个探针的靶核酸(并因此不是光学可分辨的)，可丢弃这些不可分辨的测序探针的数据。重要的是，本公开的方法提供多个回合的结合和检测多个测序探针。因此，在某些回合中可检测来自所有测序探针的信号，在某些回合中仅检测来自一部分测序探针的信号和在某些回合中不检测来自任何测序探针的信号。在一些方面，可操控与靶核酸结合的测序探针的分布(例如通过控制浓度或稀释)，使得每个靶核酸仅结合一个测序探针。

随机地，但部分地取决于靶结合结构域的长度、探针的Tm和所应用的探针浓度，群中的2个不同测序探针可在彼此600个核苷酸内结合。

或者或另外，可减少群中的测序探针的浓度以降低靶核酸的特定区域中的探针的覆盖率，例如高于测序装置的分辨率极限，从而从分辨率受限的位点产生单个读数。

如果在使用本公开的方法对靶核酸进行测序之前已知靶核酸的序列或序列的一部分，则可设计和选择测序探针，使得没有2个测序探针会在彼此600个核苷酸内与靶核酸结合。

在使测序探针与靶核酸杂交之前，一个或多个可由第一可检测标记和至少第二可检测标记结合的互补核酸分子可与测序探针的条形码结构域内的一个或多个附接位置杂交。例如，在与靶核酸杂交之前，可使一个或多个由第一可检测标记和至少第二可检测标记结合的互补核酸分子与每个测序探针的第一附接位置杂交。因此，当与其靶核酸接触时，测序探针能够从第一附接位置发出可检测信号，并且没有必要提供指向条形码结构域上的第一位置的第一的互补核酸或报告探针池。在另一个实例中，可使一个或多个由第一可检测标记和至少第二可检测标记结合的互补核酸分子与测序探针的条形码结构域内的所有附接位置杂交。因此，在该实例中，可读取6核苷酸序列而无需依序替换互补核酸。使用这种预杂交的测序探针-报告探针复合物将减少获得序列信息的时间，因为省略了所述方法的许多步骤。然而，该探针将得益于可检测标记不重叠，例如荧光团被非重叠波长的光激发或者荧光团发出非重叠波长的光。

在测序期间，来自记录的彩色点的信号强度可用于更准确地对靶核酸进行测序。图21显示在本公开的测序循环期间记录的示例性的成像数据。图21的右图显示在报告探针与测序探针的第一附接位置杂交之后记录的荧光显微镜图像。突出显示特定的颜色点并标注所记录的特定颜色组合，证实双荧光信号为清晰可检测和可区分的。来自基准标志物的明亮信号用箭头表示。图21的左图显示颜色点内的特定颜色的位点强度可用于确定特定颜色点对应于一种颜色的双重性的颜色组合(即BB、GG、YY或RR)的概率。

条形码结构域内的位置变暗可通过与所述位置杂交的报告探针内存在的可切割接头修饰处的链切割来实现。图22描绘了使用可切割接头修饰在测序循环期间使条形码位置变暗。基于图22的最左侧图描绘的第一步包括使报告探针的一级核酸与测序探针的第一附接位置杂交。一级核酸与条形码结构域的第一位置的附接区内的特定互补序列杂交。一级核酸的第一和第二结构域通过可切割接头修饰共价连接。在第二步中，然后记录可检测标记以确定测序探针的靶结合结构域中的特定二核苷酸的身份和位置。在第三步中，通过在可切割接头修饰处切割报告探针使条形码结构域的第一位置变暗。这释放一级核酸的第二结构域，从而释放可检测标记。使现缺少任何可检测标记的一级核酸分子的第一结构域与条形码结构域的第一附接位置杂交，从而条形码结构域的第一位置不再发出可检测信号，并且在随后的测序步骤中将不能与任何其他报告探针杂交。在最后步骤中，如图22的最右侧图所示，报告探针与条形码结构域的第二位置杂交以继续测序。

条形码结构域的附接位置可通过置换报告探针中由可检测标记结合的任何二级或三级核酸而变暗，同时仍使得报告探针的一级核酸分子能够保持与测序探针杂交。这种置换可通过与未由可检测标记结合的一级核酸二级或三级核酸杂交来实现。图23为本公开的示例性测序循环的说明性实例，其中条形码结构域内的位置通过标记的二级核酸的置换而变暗。图23的最左侧图描绘了测序循环的开始，其中报告探针的一级核酸分子与测序探针的条形码结构域的第一附接位置杂交。然后使与可检测标记结合的二级核酸分子与一级核酸分子杂交并记录可检测标记。为了使条形码结构域的第一位置变暗，与可检测标记结合的二级核酸分子由缺少可检测标记的二级核酸分子置换。在测序循环的下一步中，使包含可检测标记的报告探针与条形码结构域的第二位置杂交。

条形码结构域的附接位置可通过在相应的条形码结构域附接位置未由可检测标记结合的核酸处与测序探针杂交来置换报告探针的任何一级核酸分子而变暗。在其中条形码结构域包含至少1个与至少1个附接位置相邻或位于侧翼的单链核酸序列的情况下，未由可检测标记结合的核酸可通过与由一级核酸分子占据的条形码结构域的侧翼序列和一部分杂交来置换一级核酸分子。如果需要，可通过掺入加速可检测标记的交换速率的小单链寡核苷酸来加速可检测标记交换的速率(例如“Toe-Hold”Probes；see,e.g.,Seeling etal.,“Catalyzed Relaxation ofa Metastable DNA Fuel”；J.Am.Chem.Soc.2006,128(37),pp 12211-12220)。

可从附接区去除包含可检测标记的互补核酸或报告探针，但不用缺少可检测标记的杂交核酸替换。例如，这可通过添加离液剂、升高温度、改变盐浓度、调节pH和/或施加水动力来发生。在这些实例中，需要更少的试剂(即缺少可检测标记的杂交核酸)。

本公开的方法可用于同时对来自同一样品的RNA和DNA分子(包括mRNA和gDNA)进行捕获和测序。来自同一样品的RNA和DNA分子两者的捕获和测序可在同一流动池中进行。图24的左图为可如何使用本公开的方法同时对来自FFPE样品的gDNA和mRNA两者进行捕获、检测和测序的说明性示意图。

本公开的测序方法进一步包括为固定的靶核酸的每个区域组装每个鉴定的核苷酸线性顺序的步骤，从而鉴定固定的靶核酸的序列。组装步骤使用非暂时性计算机可读存储介质，其上存储有可执行程序。程序指示微处理器为靶核酸的每个区域排列每个鉴定的核苷酸线性顺序，从而获得核酸的序列。组装可“实时”发生，即在从测序探针收集数据的同时而不是在已收集所有数据之后或在完成数据采集后。

本公开的测序方法的原始特异性为约94％。通过用多于1个测序探针对靶核酸中的相同碱基进行测序，可将本公开的测序方法的准确率提高至约99％。图25描绘了本公开的测序方法如何使得能够用不同的测序探针对靶核酸的相同碱基进行测序。该实例中的靶核酸为NRAS外显子2(SEQ ID NO:1)的片段。感兴趣的特定碱基为靶核酸中突出显示的胞嘧啶(C)。感兴趣的碱基将与两种不同的测序探针杂交，每种测序探针具有与靶核酸杂交的不同足迹。在该实例中，测序探针1-4(条形码1-4)结合感兴趣的碱基左侧的3个核苷酸，而测序探针5-8(条形码5-8)结合感兴趣的碱基左侧的5个核苷酸。因此，感兴趣的碱基将由两种不同的探针进行测序，从而增加所述特定位置的碱基响应的量，从而提高该特定位置的总准确率。图26显示可如何组合从一种或多种测序探针记录的靶核苷酸上的特定核苷酸位置的多种不同碱基响应以产生一致序列(SEQ ID NO:2)，从而提高最终碱基响应的准确率。

术语“Hyb&Seq化学”、“Hyb&Seq测序”和“Hyb&Seq”是指上述本公开的方法。

任何上述方面可与本文公开的任何其他方面组合。

定义

本文使用的术语“退火”和“杂交”可互换使用，意指形成稳定的双链体。在一个方面，稳定的双链体意指双链体结构在条件比如比双链体的链的Tm低约5℃或高约5℃的温度和低单价盐浓度(例如低于0.2M或低于0.1M或本领域技术人员已知的盐浓度)下通过严格洗涤不会破坏。当用于指涉双链体时，术语“完全匹配”意指构成双链体的多核苷酸和/或寡核苷酸链彼此形成双链结构，使得每条链中的每个核苷酸经历与另一条链中的核苷酸进行Watson-Crick碱基配对。术语“双链体”包括(但不限于)可使用的核苷类似物(比如脱氧肌苷、具有2-氨基嘌呤碱基的核苷、PNA等)的配对。双链体中的两个寡核苷酸之间的“错配”意指双链体中的一对核苷酸不能进行Watson-Crick键合。

本文使用的术语“杂交条件”一般地包括盐浓度小于约1M，更通常地小于约500mM和甚至更通常地小于约200mM。杂交温度可低至5℃，但一般地高于22℃，更一般地高于约30℃，并且通常超过约37℃。杂交通常在严格条件(例如探针特异性地与其靶子序列杂交的条件)下进行。严格条件为序列依赖性的，并且在不同情况下是不同的。较长的片段可能需要较高的杂交温度以进行特异性杂交。由于其他因素可能影响杂交的严格性，包括碱基组成和互补链的长度、有机溶剂的存在和碱基错配的程度，参数的组合比单独任何一个的绝对测量更重要。

通常，严格条件选择为在确定的离子强度和pH下比特定序列的Tm低约5℃。示例性的严格条件包括在pH 7.0-8.3和至少25℃的温度下盐浓度为至少0.01M-不超过1M的Na离子浓度(或其他盐)。例如，5X SSPE(750mM NaCl,50mM磷酸钠,5mM EDTA,pH 7.4)和25-30℃温度的条件适合于等位基因特异性的探针杂交。对于严格条件，参见例如Sambrook,Fritsche and Maniatis,“Molecular Cloning ALaboratory Manual,2nd Ed.”ColdSpring Harbor Press(1989)and Anderson Nucleic Acid Hybridization,1st Ed.,BIOSScientific Publishers Limited(1999)。本文使用的术语“特异性与…地杂交”或“与…特异性地杂交”或类似术语是指分子在严格条件下基本上与一种或多种特定核苷酸序列结合、双链体化或杂交。

与探针的特定位置相关的可检测标记可被“读取”(例如检测到其荧光)一次或多次，“读取”可与术语“碱基响应”同义。多次读取可提高准确率。当检测到源自单个原始靶分子的一段相接序列信息时，“读取”靶核酸序列；一般地，这是经多通道一致(如下定义)产生。本文使用的术语“覆盖率”或“覆盖深度”是指靶区域已被测序(经离散读取)并与参考序列比对的次数。读取覆盖率为映射到特定参考目标序列的读取总数，碱基覆盖率为在特定基因组位置进行的碱基响应的总数。

“读取”为测序仪输出的单位。一段相接序列信息源自单个原始靶分子。每次读取均有一个与读取内的碱基响应的置信水平相关联的质量度量。测序仪输出的单位。一段相接序列信息源自单个原始靶分子。在Hyb&Seq中，所有读取经多通道一致产生。

“读取长度”为描述每次读取的序列长度(以bp为单位)的度量。该量度由测序技术确定。

本文使用的“Hyb&Seq循环”是指检测特定探针或探针群上的每个附接区所需的所有步骤。例如，对于能够检测靶核酸上的6个位置的探针，一个“Hyb&Seq循环”将至少包括使探针与靶核酸杂交，使互补核酸/报告探针与探针的条形码结构域上的6个位置的每一个的附接区杂交，并检测与6个位置的每一个相关的可检测标记。

术语“k聚体探针”与本公开的测序探针同义。k聚体读数为Hyb&Seq数据的基本单位。每单个Hyb&Seq循环从单个靶分子获得单个k聚体读数。进行多个Hyb&Seq循环以从单个靶分子产生足够的离散k聚体读数，以使得离散的k聚体能够明确比对成一段相接序列。

当比对来自离散读数的两个或多个序列时，可组合重叠部分以产生单个一致序列。在其中重叠部分具有相同碱基(单列比对)的位置，这些碱基变成一致序列。可使用各种规则来对其中重叠序列当中存在不一致的位置产生一致序列。简单多数规则使用列中最常见的碱基作为一致序列。“多通道一致”为来自单个靶分子的所有离散探针读数的比对。根据所应用的探针群/计票的循环总数，可用不同的冗余或重叠水平查询单个靶分子内的每个碱基的位置，通常，冗余会增加碱基响应的置信水平。

“一致”为当比对来自离散读段的两个或多个DNA序列时，可组合重叠部分以产生单个一致序列。在其中重叠部分具有相同碱基(比对单列)的位置，这些碱基成为一致序列。可使用各种规则来对其中重叠序列当中存在不一致的位置产生一致序列。简单多数规则使用列中最常见的碱基作为一致序列。

“原始准确率”为系统正确识别碱基的固有能力的量度。原始准确率取决于测序技术。“一致性准确率”为系统利用另外的读取和统计功效正确识别碱基的能力的量度。“特异性”是指每次运行的总读数中映射到预期目标的读数百分比。“统一性”是指跨目标区域的序列覆盖的可变性，高统一性与低可变性相关。该特征通常报告为覆盖所有靶向区域的平均覆盖深度的≥20％的所靶向区域的分数。随机误差(即固有测序化学误差)可通过相同靶核酸的“多遍”测序易于校正，如果通过足够遍数，则可实现基本上“完全一致”或“无错误”测序。

可使用能够实施方法和/或记录结果的任何设备来实施本文所述的方法和/或记录结果。可使用的设备的实例包括(但不限于)电子计算设备，包括所有类型的计算机。当以计算机实施和/或记录本文所述的方法时，可用于配置计算机以实施方法的步骤的计算机程序可包含在能够包含计算机程序的任何计算机可读介质中。可使用的计算机可读介质的实例包括(但不限于)磁盘、CD-ROM、DVD、ROM、RAM、非暂时性计算机可读介质以及其他存储器和计算机存储设备。可用于配置计算机以实施方法的步骤、组装序列信息和/或记录结果的计算机程序也可经电子网络提供，例如经互联网、内联网或其他网络。

“可消耗的测序卡”可结合至本领域已知的荧光成像设备中。具有许多不同特征的任何荧光显微镜均能够进行该测序读取。例如：宽场灯、激光器、LED、多光子、共焦或全内反射照明可用于激发和/或检测。在荧光显微镜的发射检测通道上可使用具有基于滤光器或基于光栅的光谱分辨率(一种或多种光谱分辨的发射波长)的相机(单个或多个)和/或光电倍增管(单个或多个)。标准计算机可控制可消耗的测序卡、流经卡的试剂和通过荧光显微镜的检测。

可通过任何数目的标准下一代测序装配器分析测序数据(参见例如Wajid andSerpedin,“Review of general algorithmic features for genome assemblersfornextgeneration sequencers”Genomics,proteomics&bioinformatics,10(2),58-73,2012)。在显微镜的单个衍射极限区内获得的测序数据被“当地组装”以从衍射斑内的多个读数产生一致序列。然后将多个衍射斑组装的读数一起映射以产生代表整个靶向的基因集的相接序列，或整个基因组的从头组装。

与本公开相关的另外讲授在以下一个或多个中描述：U.S.8148512、U.S.7473767、U.S.7919237、U.S.7941279、U.S.8415102、U.S.8492094、U.S.8519115、U.S.2009/0220978、U.S.2009/0299640、U.S.2010/0015607、U.S.2010/0261026、U.S.2011/0086774、U.S.2011/0145176、U.S.2011/0201515、U.S.2011/0229888、U.S.2013/0004482、U.S.2013/0017971、U.S.2013/0178372、U.S.2013/0230851、U.S.2013/0337444、U.S.2013/0345161、U.S.2014/0005067、U.S.2014/0017688、U.S.2014/0037620、U.S.2014/0087959、U.S.2014/0154681、U.S.2014/0162251和U.S.2016/0194701，其每一个通过参考以其全部结合至本文中。

具体实施方式

本发明还涉及以下实施方案：

1.一种测序探针，其包含一个靶结合结构域和一个条形码结构域；

其中所述靶结合结构域包含至少8个核苷酸并且能够结合靶核酸，其中所述靶结合结构域中的至少6个核苷酸能够识别所述靶核酸分子中的相应核苷酸和其中所述靶结合结构域中的至少2个核苷酸不识别所述靶核酸分子中的相应核苷酸；其中所述靶结合结构域中的至少6个核苷酸的至少2个核苷酸为修饰的核苷酸或核苷酸类似物；

其中所述条形码结构域包含一个合成主链，所述条形码结构域包含至少3个附接位置，每个附接位置包含至少1个附接区，所述附接区包含至少1个能够与互补核酸分子结合的核酸序列，其中所述至少3个附接位置的所述核酸序列确定所述靶核酸中由所述靶结合结构域结合的所述至少6个核苷酸的位置和身份，和其中所述至少3个附接位置中的每一个具有不同的核酸序列。

2.一种测序探针，其包含一个靶结合结构域和一个条形码结构域；

其中所述条形码结构域包含一个合成主链，所述条形码结构域包含至少3个附接位置，每个附接位置包含至少1个附接区，所述附接区包含至少一1个能够由互补核酸分子结合的核酸序列，

其中所述至少3个附接位置的每一个附接位置对应于所述靶结合结构域中的所述至少6个核苷酸2个核苷酸和所述至少3个附接位置的每一个具有不同的核酸序列，和

其中所述至少3个附接位置的每个位置的核酸序列确定所述靶核酸中由所述靶结合结构域结合的所述至少6个核苷酸的所述相应2个核苷酸的所述位置和身份。

3.一种测序探针，其包含一个靶结合结构域和一个条形码结构域；

其中所述靶结合结构域包含至少10个核苷酸并且能够结合靶核酸，其中所述靶结合结构域中的至少6个核苷酸能够识别所述靶核酸分子中的相应核苷酸和其中所述靶结合结构域中的至少4个核苷酸不识别所述靶核酸分子中的相应核苷酸；

其中所述条形码结构域包含一个合成主链，所述条形码结构域包含至少3个附接位置，每个附接位置包含至少1个附接区，所述附接区包含至少1个能够由互补核酸分子结合的核酸序列，其中所述至少3个附接位置的所述核酸序列确定所述靶核酸中由所述靶结合结构域结合的所述至少6个核苷酸的位置和身份，和其中所述至少3个附接位置的每一个具有不同的核酸序列。

4.一种测序探针，其包含一个靶结合结构域和一个条形码结构域；

其中所述条形码结构域包含一个合成主链，所述条形码结构域包含至少3个附接位置，每个附接位置包含至少1个附接区，所述附接区包含至少1个能够由互补核酸分子结合的核酸序列，

其中所述至少3个附接位置的每一个附接位置对应于所述靶结合结构域中的所述至少6个核苷酸的2个核苷酸和所述至少3个附接位置的每一个具有不同的核酸序列，和

其中所述至少3个附接位置的每个位置的所述核酸序列确定所述靶核酸中由所述靶结合结构域结合的所述至少6个核苷酸的所述相应2个核苷酸的位置和身份。

5.一种复合物，其包含：

a)一种包含一个靶结合结构域和一个条形码结构域的组成：

其中所述靶结合结构域包含至少8个核苷酸并且能够结合靶核酸，其中所述靶结合结构域中的至少6个核苷酸能够识别所述靶核酸分子中的相应核苷酸和其中所述靶结合结构域中的至少2个核苷酸不识别所述靶核酸分子中的相应核苷酸；

其中所述靶结合结构域中的所述至少6个核苷酸的至少2个核苷酸为修饰的核苷酸或核苷酸类似物；

其中所述条形码结构域包含一个合成主链，所述条形码结构域包含至少3个附接位置，每个附接位置包含至少1个附接区，所述附接区包含至少1个能够由互补核酸分子结合的核酸序列，其中所述至少3个附接位置的所述核酸序列确定所述靶核酸中由所述靶结合结构域结合的所述至少6个核苷酸的位置和身份，和其中所述至少3个附接位置中的每一个具有不同的核酸序列；和

与所述至少3个附接位置的第一附接位置杂交的第一互补一级核酸分子，

其中所述第一一级互补核酸分子包含至少2个结构域和1个接头修饰，

其中所述第一结构域与所述条形码结构域的所述第一附接位置杂交和所述第二结构域能够与至少一个互补二级核酸分子杂交，和

其中所述接头修饰为

和其中所述接头修饰位于所述第一与第二结构域之间。

6.一种复合物，其包含：

a)一种包含一个靶结合结构域和一个条形码结构域的组成，

其中所述条形码结构域包含一个合成主链，所述条形码结构域包含至少3个附接位置，每个附接位置包含至少1个附接区，所述附接区包含至少1个能够由互补核酸分子结合的核酸序列，其中所述至少3个附接位置的所述核酸序列确定所述靶核酸中由所述靶结合结构域结合的所述至少6个核苷酸的位置和身份，

其中所述至少3个附接位置的每个附接位置对应于所述靶结合结构域中所述至少6个核苷酸的2个核苷酸和所述至少3个附接位置的每一个具有不同的核酸序列；和

其中所述至少3个附接位置的每个位置的所述核酸序列确定所述靶核酸中由所述靶结合结构域结合的所述至少6个核苷酸的所述相应2个核苷酸的位置和身份；和

其中所述第一结构域与所述条形码结构域的所述第一附接位置杂交和所述第二结构域能够与至少1个互补二级核酸分子杂交，和

其中所述接头修饰为

和其中所述接头修饰位于所述第一与第二结构域之间。

7.实施方案1-4中任何一项的测序探针，其中所述合成主链包括多糖、多核苷酸、肽、肽核酸或多肽。

8.实施方案1-4中任何一项的测序探针，其中所述合成主链包含单链DNA。

9.实施方案1-4中任何一项的测序探针，其中所述测序探针包含单链DNA合成主链和所述靶结合结构域与所述条形码结构域之间的双链DNA间隔序列。

10.实施方案9的测序探针，其中所述双链DNA间隔序列的长度为约1个核苷酸-约100个核苷酸。

11.实施方案9的测序探针，其中所述双链DNA间隔序列的长度为约36个核苷酸。

12.实施方案1-4中任何一项的测序探针，其中所述靶结合结构域中的核苷酸的所述数目大于所述条形码结构域中的附接位置的所述数目。

13.实施方案1-4中任何一项的测序探针，其中所述靶结合结构域中的核苷酸的所述数目比所述条形码结构域中的附接位置的所述数目多至少5个。

14.实施方案1-4中任何一项的测序探针，其中所述靶结合结构域包含8个核苷酸和所述条形码结构域包含3个附接位置。

15.实施方案1-4中任何一项的测序探针，其中所述靶结合结构域中的所述至少6个核苷酸的至少4个核苷酸为修饰的核苷酸或核苷酸类似物。

16.实施方案1-4中任何一项的测序探针，其中所述靶结合结构域中的所述至少6个核苷酸的至少6个核苷酸为修饰的核苷酸或核苷酸类似物。

17.实施方案1-4中任何一项的测序探针，其中所述修饰的核苷酸或核酸类似物为锁定核酸(LNA)。

18.实施方案1-4中任何一项的测序探针，其中所述靶结合结构域中不识别所述靶核酸分子中的相应核苷酸的所述至少2个核苷酸的至少1个位于所述靶结合结构域中的所述至少6个核苷酸之前和其中所述靶结合结构域中不识别所述靶核酸分子中的相应核苷酸的所述至少2个核苷酸的至少2个位于所述靶结合结构域中的所述至少6个核苷酸之后。

19.实施方案1-4中任何一项的测序探针，其中所述条形码结构域中的每个附接位置包含相同数目的附接区。

20.实施方案1-4中任何一项的测序探针，其中所述条形码结构域中的所述至少3个附接位置的至少1个包含与另外两个不同数目的附接区。

21.实施方案1-4中任何一项的测序探针，其中所述条形码结构域中的每个附着位置包含1个附接区。

22.实施方案1-4中任何一项的测序探针，其中所述条形码结构域中的每个附着位置包含多于1个附接区。

23.实施方案1-4中任何一项的测序探针，其中当所述条形码结构域中的所述附接位置包含多于1个附接区时，所述附接区为相同的。

24.实施方案1-4中任何一项的测序探针，其中当所述条形码结构域中的所述附接位置包含多于1个附接区时，所述附接区可为不同的。

25.实施方案1-4中任何一项的测序探针，其中包含所述条形码结构域中的每个附接区的每个核酸序列的长度为约8个核苷酸-约20个核苷酸。

26.实施方案1-4中任何一项的测序探针，其中包含所述条形码结构域中的每个附接区的每个核酸序列的长度为约12个核苷酸。

27.实施方案1-4中任何一项的测序探针，其中包含所述条形码结构域中的每个附接区的每个核酸序列的长度为约14个核苷酸。

28.实施方案1-4中任何一项的测序探针，其中所述条形码结构域中的所述至少3个附接位置的至少1个与至少1个侧翼单链多核苷酸相邻。

29.实施方案1-4中任何一项的测序探针，其中所述条形码结构域中的所述至少3个附接位置的每一个与至少1个侧翼单链多核苷酸相邻。

30.实施方案1-4中任何一项的测序探针，其中至少1个附接位置中的至少1个附接区与所述合成主链成为一体。

31.实施方案1-4中任何一项的测序探针，其中所述至少3个附接位置的每一个中的每个附接区与所述合成主链成为一体。

32.实施方案1-4中任何一项的测序探针，其中所述互补核酸分子为RNA、DNA或PNA。

33.实施方案32的测序探针，其中所述互补核酸分子为DNA。

34.实施方案1-4中任何一项的测序探针，其中所述互补核酸分子为一级核酸分子，其中所述一级核酸分子直接与所述条形码结构域的至少1个附接位置内的至少1个附接区结合。

35.实施方案34的测序探针，其中所述一级核酸分子包含至少2个结构域，

能够与所述条形码结构域的至少1个附接位置内的至少1个附接区结合的第一结构域和

能够与至少1个互补二级核酸分子结合的第二结构域。

36.实施方案35的测序探针，其中所述一级核酸分子包含可切割接头。

37.实施方案36的测序探针，其中所述可切割接头位于所述第一结构域与所述第二结构域之间。

38.实施方案36的测序探针，其中所述接头为光可切割的。

39.实施方案34的测序探针，其中所述一级核酸分子与所述条形码结构域的至少1个附接位置内的至少1个附接区杂交并且包含第一可检测标记和至少第二可检测标记。

40.实施方案35的测序探针，其中所述一级核酸分子与所述条形码结构域的至少1个附接位置内的至少1个附接区杂交和与至少1个二级核酸分子杂交。

41.实施方案40的测序探针，其中所述一级核酸分子与至少1个、2个、3个、4个、5个或更多个二级核酸分子杂交。

42.实施方案40的测序探针，其中所述一级核酸分子与4个二级核酸分子杂交。

43.实施方案39的测序探针，其中所述第一和至少第二可检测标记具有相同的发射光谱或具有不同的发射光谱。

44.实施方案35的测序探针，其中所述二级核酸分子包含至少2个结构域，

能够与至少1个一级核酸分子中的互补序列结合的第一结构域；和

能够与(a)第一可检测标记和至少第二可检测标记，与(b)至少1个互补三级核酸分子，或(c)其组合结合的第二结构域。

45.实施方案44的测序探针，其中所述二级核酸分子包含可切割接头。

46.实施方案45的测序探针，其中所述可切割接头位于所述第一结构域与所述第二结构域之间。

47.实施方案45的测序探针，其中所述接头为光可切割的。

48.实施方案44的测序探针，其中所述二级核酸分子与至少1个一级核酸分子杂交，并且包含第一可检测标记和至少第二可检测标记。

49.实施方案44的测序探针，其中所述二级核酸分子与至少1个一级核酸分子杂交和与至少1个三级核酸分子杂交。

50.实施方案44的测序探针，其中所述二级核酸分子与(a)至少1个一级核酸分子，(b)至少1个三级核酸分子，和(c)第一可检测标记和至少第二可检测标记杂交。

51.实施方案49的测序探针，其中所述二级核酸分子与至少1个、2个、3个、4个、5个、6个、7个或更多个三级核酸分子杂交。

52.实施方案49的测序探针，其中所述二级核酸分子与1个三级核酸分子杂交。

53.实施方案48的测序探针，其中所述第一和至少第二可检测标记具有相同的发射光谱或具有不同的发射光谱。

54.实施方案44的测序探针，其中所述三级核酸分子包含至少2个结构域，

能够与二级核酸分子中的互补序列结合的第一结构域；和

能够与第一可检测标记和至少第二可检测标记结合的第二结构域。

55.实施方案54的测序探针，其中所述三级核酸分子包含可切割接头。

56.实施方案55的测序探针，其中所述可切割接头位于所述第一结构域与所述第二结构域之间。

57.实施方案55的测序探针，其中所述接头为光可切割的。

58.实施方案54的测序探针，其中所述三级核酸分子与至少1个二级核酸分子杂交并且包含第一可检测标记和至少第二可检测标记。

59.实施方案54的测序探针，其中所述第一和至少第二可检测标记具有相同的发射光谱或具有不同的发射光谱。

60.实施方案57的测序探针，其中位于所述二级核酸分子上的所述至少第一和第二可检测标记具有相同的发射光谱，和位于所述三级核酸分子上的所述至少第一和第二可检测标记具有相同的发射光谱，并且其中所述二级核酸分子上的所述可检测标记的所述发射光谱不同于所述三级核酸分子上的所述可检测标记的所述发射光谱。

61.一个测序探针群，其包含多个实施方案1-4中任何一项的测序探针。

62.一种用于测定核酸的核苷酸序列的方法，其包括：

(1)使实施方案1-4中任何一项的第一测序探针与任选地在一个或多个位置固定于基底上的靶核酸杂交；

(2)使包含第一可检测标记和第二可检测标记的第一互补核酸分子与所述条形码结构域的所述至少3个附接位置的第一附接位置杂交；

(3)鉴定与所述第一附接位置杂交的所述第一互补核酸分子的所述第一和所述第二可检测标记；

(4)去除与所述第一附接位置杂交的所述第一和所述第二可检测标记；

(5)使包含第三可检测标记和第四可检测标记的二级互补核酸分子与所述条形码结构域的所述至少3个附接位置的第二附接位置杂交；

(6)鉴定与所述第二附接位置杂交的所述第二互补核酸分子的所述第三和所述第四可检测标记；

(7)去除与所述第二附接位置杂交的所述第三和第四可检测标记；

(8)使包含第五可检测标记和第六可检测标记的第三互补核酸分子与所述条形码结构域的所述至少3个附接位置的第三附接位置杂交；

(9)鉴定与所述第三附接位置杂交的所述第三互补核酸分子的所述第五和所述第六可检测标记；和

(10)基于所述第一可检测标记、第二可检测标记、第三可检测标记、第四可检测标记、第五可检测标记和第六可检测标记的身份，鉴定与所述测序探针的所述靶结合结构域杂交的所述任选固定的靶核酸的至少6个核苷酸的所述线性顺序。

63.一种用于测定核酸的所述核苷酸序列的方法，其包括：

(1)使实施方案1-4中任何一项的第一测序探针与从预定基因获得的靶核酸的第一区域杂交，其中所述靶核酸任选地在一个或多个位置固定于基底上；

(3)检测与所述第一附接位置杂交的所述第一互补核酸分子的所述第一和所述第二可检测标记；

(5)使包含第三可检测标记和第四可检测标记的第二互补核酸分子与所述条形码结构域的所述至少3个附接位置的第二附接位置杂交；

(6)检测与所述第二附接位置杂交的所述第二互补核酸分子的所述第三和所述第四可检测标记；

(7)去除与所述第二附接位置杂交的所述第三和所述第四可检测标记；

(10)基于所述第一可检测标记、第二可检测标记、第三可检测标记、第四可检测标记、第五可检测标记和第六可检测标记的身份，鉴定与所述第一测序探针的所述靶结合结构域杂交的所述任选固定的靶核酸的所述第一区域中的所述至少6个核苷酸的线性顺序。

64.实施方案62或63的方法，其中步骤(4)和(5)依序或同时发生。

65.实施方案62或63的方法，其中所述第一和第二可检测标记具有相同的发射光谱或具有不同的发射光谱。

66.实施方案62或63的方法，其中所述第三和第四可检测标记具有相同的发射光谱或具有不同的发射光谱。

67.实施方案62或63的方法，其中所述第五和第六可检测标记具有相同的发射光谱或具有不同的发射光谱。

68.实施方案62或63的方法，其中所述第一互补核酸分子包含可切割接头。

69.实施方案62或63的方法，其中所述第二互补核酸分子包含可切割接头。

70.实施方案62或63的方法，其中所述第二互补核酸分子

71.实施方案62或63的方法，其中所述第一互补核酸分子、所述第二互补核酸分子和所述第三互补核酸分子各自(each)包含可切割接头。

72.实施方案68的方法，其中所述可切割接头为光可切割的。

73.实施方案72的方法，其中去除所述第一互补核酸分子包括使所述第一互补核酸分子与光接触。

74.实施方案73的方法，其中所述光由选自弧光灯、激光器、聚焦UV光源和发光二极管的光源提供。

75.实施方案62或63的方法，其进一步包括：

(11)从所述任选固定的靶核酸的所述第一区域去除所述至少第一测序探针；

(12)使实施方案1或2的至少第二测序探针与任选地在一个或多个位置固定于基底上所述靶核酸的第二区域杂交，并且其中所述第一测序探针和所述至少第二测序探针的所述靶结合结构域不同；

(13)使包含第一可检测标记和第二可检测标记的第一互补核酸分子与所述条形码结构域的所述至少3个附接位置的第一附接位置杂交；

(14)检测与所述第一附接位置杂交的所述第一互补核酸分子的所述第一和所述第二可检测标记；

(15)使包含第三可检测标记和第四可检测标记的第二互补核酸分子与所述条形码结构域的所述至少3个附接位置的第二附接位置杂交；

(16)检测与所述第二附接位置杂交的所述第二互补核酸分子的所述第三和所述第四可检测标记；

(17)去除与所述第二附接位置杂交的所述第三和第四可检测标记；

(18)使包含第五可检测标记和第六可检测标记的第三互补核酸分子与所述条形码结构域的所述至少3个附接位置的第三附接位置杂交；

(19)鉴定与所述第三附接位置杂交的所述第三互补核酸分子的所述第五和所述第六可检测标记；和

(20)基于所述第一可检测标记、第二可检测标记、第三可检测标记、第四可检测标记、第五可检测标记和第六可检测标记的所述身份，鉴定与所述至少第二测序探针的所述靶结合结构域杂交的所述任选固定的靶核酸的所述第二区域中的至少6个核苷酸的线性顺序。

76.实施方案75的方法，其进一步包括组装所述任选固定的靶核酸的所述至少第一区域和至少第二区域中的每个鉴定了线性顺序的核苷酸，从而鉴定所述任选固定的靶核酸的序列。

77.一种用于实施实施方案62-76中任何一项的方法的装置。

78.一种试剂盒，其包含基底、实施方案61的测序探针群、至少1种捕获探针、至少3种互补核酸分子(包含第一可检测标记和至少两种第二可检测标记)及使用说明书。

实施例：

实施例1-使用Hyb&Seq化学进行单分子长读取

本发明公开的测序探针和使用测序探针的方法便利地称为Hyb&Seq。在整个说明书中使用该术语来描述所公开的测序探针和方法。Hyb&Seq为一种无文库、无扩增的单分子测序技术，将荧光分子条形码的核酸杂交循环应用于天然靶标。

使用Hyb&Seq进行的长读取在单分子DNA靶标33千碱基(kb)长上，用以下关键步骤得到证实：(1)捕获长DNA分子并将其水动力拉伸至测序流动池上；(2)使多个完全匹配的测序探针在长的单分子靶上杂交；(3)使荧光报告探针与测序探针中的条形码区域杂交以鉴定所有结合的序列；和/或(4)使用空间分辨的荧光数据确定单分子靶标内的序列的相对位置。

使用Hyb&Seq进行长读取的主要优势包括(但不限于)：读取长度由分子长度决定，不受化学限制；简单、有限的样品制备导致片段化较少；与测序探针相关的位置信息帮助组装；和/或使变体定相至长范围单倍型的能力。

Hyb&Seq化学设计-测序探针包含与单分子靶标碱基配对的靶结合结构域和具有至少3个对应于靶结合结构域中存在的6聚体序列的位置(R₁、R₂和R₃)的条形码结构域。一组4096个测序探针使得能够对任何靶序列进行测序。报告探针：3个报告探针依序与条形码结构域的位置结合。每个报告复合物对应于特定的二核苷酸。杂交驱动功能。

本公开的长读取和短读取测序方法使用相同的简单探针杂交工作流程，用于靶向捕获核酸，如图18和19所示。多个测序探针可同时与靶核酸杂交，如图18的右图所示，并且光学分辨率使得每个长靶标的几个位点能够被单个区分，如图19的右图所示。通过同时杂交和记录多个测序探针，增加了单次读取的信息内容。长范围单倍型为单分子分析中固有的，并且可通过实际物理位置而不是计算重建来组装。使用本公开的测序方法，长达数百的千碱基的长测序读取是可行的。

特定测序探针池以预期模式与15千碱基靶标杂交，如图20所示。测序探针以预期的序列特异性位置和相对物理距离与拉伸的靶标(优选地为水动力拉伸的靶标)杂交。与短读取技术相比较，本公开的测序方法具有增加的信息内容，使得每个循环能够读取更多碱基。本公开的测序方法还记录测序读数的相对位置，这有助于长读取的组装。使用本公开的测序方法，读取长度＝一致序列长度＝捕获的靶分子的长度。

图27显示实验的结果，其中捕获33千碱基DNA片段，拉伸，与测序探针和报告探针杂交并进行检测。本公开的测序方法与长达33千碱基及更长的DNA片段相容。读取长度仅受靶核酸片段的初始长度限制，而不受酶或测序化学的限制。

图13显示关于靶向定相长读取的本公开的测序方法的另外能力。长范围定相单倍型为数据中固有的，并且易于鉴定其变体定相。不需要对整个长靶分子进行测序，因为“阻断寡核苷酸”可用于将测序循环限于感兴趣的测序窗口。

实施例1的结果表明，本公开的测序方法能够进行具有长读取长度的单分子测序。特别是，结果显示：15千碱基和33千碱基单链DNA分子的成功捕获和水动力拉伸；空间分辨的荧光数据准确地对应于长单分子的实际相对位置；和每个测序循环同时读取10+碱基序列。

实施例2-ShortStack^TM技术：解析短核苷酸变体和InDels的靶向测序的Hyb&Seq读取的准确、参考引导的装配

ShortStack为一种开源算法，被设计用于进行Hyb&Seq的独特六聚体读数(六聚体谱)的装配。该算法为利用来自每个成像特征的六聚体读取进行靶标识别，并伴随误差校正基于单个分子将六聚体读数组装成一致序列的统计方法。

使用Hyb&Seq化学和ShortStack的单分子测序如下进行：在使用Hyb&Seq化学的每次杂交循环之后产生单分子靶标的六聚体读数；在多次杂交循环之后，产生覆盖每个单分子靶区域的六聚体谱；和六聚体谱与每个靶核酸分子的参考序列一起，用于得出每个单分子靶标的一致序列。

使用Hyb&Seq技术和ShortStack进行靶标测序的结果显示：使用六聚体谱的单分子靶标识别算法具有100％的成功率；参考引导装配算法以5x覆盖率产生>99％(～QV 32)的单分子一致性准确率；使用预先表征的参考gDNA样品证实了一致的体细胞变体检测(R²～90％)；和/或使用所有六聚体和ShortStack的计算机模拟实验证实，较大的靶标组的平均QV>90。

ShortStack算法可准确地组装Hyb&Seq数据。图28显示使用本公开的测序方法获得并使用ShortStack算法分析的测序实验的结果。在该实验中，测序的靶核酸包括基因BRAF(SEQ ID NO:3)、EGFRex18(SEQ ID NO:4)、KRAS(SEQ ID NO:5)、PIK3CA(SEQ IDNO:6)、EGFRex20(SEQ ID NO:7)和NRAS(SEQ ID NO:8)的片段。图28显示碱基覆盖率和变体响应两者。覆盖率图显示FFPE(福尔马林固定的石蜡包埋)gDNA中的碱基覆盖率。结果显示，可用的测序探针覆盖了多种靶标的大多数碱基。误差图显示FFPE gDNA样品中的各种靶标的查询位置的错误率与覆盖率。结果显示，在8x覆盖率下，错误率<1％。频率图显示了测序的Horizon gDNA样品中的变体的预期和已知频率之间的相关性。该表提供了测序的HorizonGenomic Reference gDNA，并显示出变体分子的分数与参考样品的已知频率一致。

实施例2中的结果显示ShortStack为使用本公开的测序方法获得的六聚体谱的子组装的准确算法。特别是结果表明：使用模拟数据，靶标识别的准确率为100％和平均每碱基质量值>30；在5x覆盖率下，实验Hyb&Seq数据中的碱基响应的准确率>99％；以与已知值一致的频率检测基因组DNA的变体(R²～90％)；和计算性能是有效的，并且随着组装的六聚体的数目线性扩大，能够在～15分钟内于个人计算机上组装69k分子。

实施例3-使用Hyb&Seq^TM技术-基于杂交的单分子测序系统，对来自FFPE样品的天然gDNA进行无文库、靶向测序

使用本公开的测序方法(Hyb&Seq)对来自FFPE样品的天然gDNA进行靶向癌症组测序以证实：具有准确碱基响应的癌基因靶标的靶向单分子测序；准确检测已知的致癌单核苷酸变体(SNV)和插入/缺失(InDel)；从FFPE提取的gDNA多路复用捕获癌基因靶标(中位DNA片段大小为200个碱基)；和/或在高级原型仪器上进行端到端自动测序。

Hyb&Seq化学和工作流程演示如下：使感兴趣的基因组靶标直接捕获至测序流动池上；使含有数百个六聚体测序探针的池流入测序室；荧光报告探针依序地与测序探针的条形码区域杂交，以经3个报告探针交换循环鉴定六聚体碱基；一旦鉴定出碱基，就将测序探针洗掉；和用1个新的测序探针池重复该循环，直至目标区域已被读取至足够的深度。

Hyb&Seq的主要优势：FFPE工作流程简单快速-临床样本在60分钟内开始测序；没有酶或扩增/没有文库构建；总动手时间为15分钟；准确率高-化学错误率低+固有误差校正；和/或长和短读取两者-读取长度由输入样品决定，不受化学限制。

Hyb&Seq化学设计如实施例1所述。用于处理FFPE组织的Hyb&Seq样品制备包括3个简单步骤：(1)单管脱蜡和溶解；(2)使用注射器过滤器去除颗粒；和(3)任选的DNA片段化和靶标捕获。该过程需要每个样品使用1-3个10微米FFPE卷状物。整个过程在60分钟内完成，仅需要常见的实验室设备：加热块、移液器、过滤器和试剂。

图29显示来自FFPE样品的癌基因靶标的多路复用捕获和测序的实验设计的示意图。设计和构建总计425种测序探针以对11种致癌基因靶标(SEQ ID NOs:3-13)的部分进行测序。每个基因靶标的已知变体的基因座用许多测序探针覆盖(完全匹配+单个错配)。在这些区域测量碱基覆盖率和每个碱基准确率。使用预先表征的参考样品，获得变体检测的准确率。图29的上图显示测序探针(蓝色)与围绕已知变体位置(红色)的靶序列(灰色)的比对。对于每个变体位置(红色)，每个(A、G、C、T)碱基变体包括4个探针序列。在测序期间，跟踪单个靶DNA分子进行800次条形码交换循环，提供多个六聚体读数，将其通过ShortStack^TM算法重新组装，如实施例2所述。

图28显示测序结果，包括每个靶标的平均覆盖率、单碱基错误率以及观察到的与预期的变异频率。实施例3中的结果显示Hyb&Seq测序可用于对FFPE和参考gDNA样品中的11个靶区域进行多路复用测序，其中检测到单核苷酸变异，误差较小。

实施例4-使用Hyb&Seq^TM化学进行直接单分子RNA测序而无需cDNA转化

使用Hyb&Seq化学进行直接单分子RNA测序如下所示：在没有cDNA转化的情况下直接捕获天然RNA分子并将其固定于测序流动池上；使含有数百个六聚体测序探针的池流入测序流动池中；使完全匹配的测序探针在单分子RNA靶标上随机杂交；使荧光报告探针依序地与测序探针的条形码区域杂交以鉴定六聚体碱基；和鉴定出碱基并然后洗掉测序探针；重复循环直至将靶标读取至足够的深度。

主要结果：对靶向的单分子RNA进行测序，显示出与DNA类似的覆盖谱；在整个超过200次Hyb&Seq循环中，RNA分子稳定地保持在流动池上；同时捕获来自单个FFPE切片的mRNA和基因组DNA并定量；和/或使用少至10ng的总RNA进行8个转录物的多路复用捕获并定量。

Hyb&Seq化学设计如实施例1所述。图30的左图显示与使用cDNA转化进行的常规RNA测序相关的步骤相比较，与进行直接RNA测序相关的实验步骤的说明性示意图。图30的中和左图显示用于测试RNA分子与本公开的测序方法的相容性的实验结果。在实验中，对4种靶RNA分子进行测序(SEQ ID NOs:14-17)。结果显示RNA分子可被捕获并检测至少200个测序循环，证实了本公开的测序方法与RNA分子的相容性。

图31显示使用本公开的测序方法验证进行直接单分子RNA测序的实验结果。在没有cDNA转化的情况下编码NRASex2片段(SEQ IDNO:18)的天然RNA分子被直接捕获，并固定于测序流动池上且使用本发明方法进行测序。还使用捕获的DNA分子代替RNA重复实验。图31显示DNA和RNA的测序覆盖率相当，证实可使用本公开的测序方法在没有转化成cDNA的情况下直接对RNA进行测序。

图24显示从FFPE样品中综合捕获RNA和DNA的实例。图24的左图为可如何使用本公开的方法同时对来自FFPE样品的gDNA和mRNA两者进行捕获、检测和测序的说明性示意图。使用实施例3所述的相同FFPE工作流程制备样品。使用相同的捕获方案，但用RNA和DNA特异性的捕获探针。用相同的测序探针在同一流动池中同时对DNA和RNA分子进行测序。图24的右图显示同时捕获和检测来自扁桃体FPPE样品的NRAS RNA和DNA的实验结果。荧光图像显示可捕获和检测RNA和DNA两者。条形图表明，需要特异性的RNA和DNA捕获探针同时捕获RNA和DNA。

图32显示RNA组的多路复用靶标捕获的结果。用各种输入量的总RNA(0ng、1ng、10ng、100ng、1000ng)对基于人类通用参考RNA的8种中至高表达转录物进行多路复用捕获。使多路复用捕获的RNA分子固定于流动池上，并使特异性的测序探针和报告探针与固定的RNA分子杂交以进行定量。图32的下图显示来自100ng输入捕获的荧光图像。用转录物名称和用于鉴定的相应报告复合物颜色组合圈出每个RNA的一个实例。图32的上图显示每种特定RNA靶标的计数的定量。

实施例4中的结果显示用Hyb&Seq化学实现单分子RNA测序。特别是，结果证实：(1)在没有cDNA转化的情况下进行直接RNA测序；(2)RNA分子在整个Hyb&Seq循环过程中稳定；(3)RNA和DNA分子两者均可在一个Hyb&Seq工作流程中捕获和测序；和(4)mRNA组的靶标捕获可用少至10ng的总RNA输入进行。

实施例5-用于从Hyb&Seq测序平台产生的高通量分子水平短读取的综合生物信息学算法

ShortStack^TM软件旨在进行基于标准测序的生物信息学分析任务，比如比对、纠错、突变响应和读取组装。图33显示ShortStack^TM软件流水线的步骤的示意性概述，包括：六聚体的比对和覆盖率估计、突变的序列鉴定、图表数据结构构建和/或分子水平序列重建和纠错。

所有算法均严格地在从单个分子获得的信息内进行，确保最终的突变响应结果不会由于样品的突变频率而有偏差。根据组结合位置将六聚体分组成不同的分子。为了将分子指定给靶标，每个分子将六聚体与所有不同的靶区域进行比对，并选择最匹配的基因靶标。

测量统计度量以评价分子鉴定的质量。针对N个不同靶区域的比对为每个靶标产生N个总计覆盖率值的分布。选择最高总计覆盖率分数匹配作为正确匹配。测量所选择的最高匹配分数相对于所有N个不同靶标的分数分布的Z分数统计。滤掉低置信度分子鉴定(在2.5个σ的z分数下)。

ShortStack^TM算法的主要优势包括：通过实施分层哈希索引设计准确处理可能的序列歧义；和/或高级算法设计结构通过优先级确保映射质量和防止高估突变。

另外，突变图表数据结构使得能够对各种类型的突变(取代、插入和缺失)进行计算建模，并为序列重建和变体响应产生输出：取代变体在与原始序列相同长度的图表中表示为附加节点；插入可通过添加任何长度的连接节点来建模；缺失被建模为在图表中用空碱基对字符串添加人工节点；在盲目突变搜索(即搜索突变耐受的序列比对)中，从每个参考序列位置测量汉明距离，并将新节点添加至表示搜索到的突变的图表；和/或使用分层哈希表进行突变的六聚体的覆盖率估计。

构建的图表数据结构使得能够进行分子水平序列重建和仪器纠错。在构建的图表中，应用动态规划算法以发现最佳得分路径，其中得分被定义为标准化的碱基覆盖率。图表的最佳得分路径代表分子水平序列重建。包括正确的突变序列，同时丢弃六聚体中的仪器误差。

模拟数据集证实该软件能够提供高度准确的分子水平序列组装和突变响应结果。图34显示使用ShortStack^TM软件流水线对模拟数据集进行突变分析的结果。这些结果显示10个随机突变的突变响应准确率。在中等仪器误差数据集中，准确率平均显示为99.39％(靶向搜索)和98.02％(盲目搜索)。在升高仪器误差模拟下，性能平均显示为97.19％(靶向搜索)和93.53％(盲目搜索)。当分子水平碱基覆盖率阈值增加至2x时，结果提高至99.5％(2x覆盖率)和99.9％(3x覆盖率)。

ShortStack^TM软件可处理广泛范围的各种突变。图35显示总体突变响应准确率，其中每个条形代表来自各种类型突变的10种不同突变靶标的平均值。插入和缺失的长度在1bp-15bp之间选择。这些结果表明，突变响应准确率为94.4％(1x覆盖率)、97.7％(2x覆盖率)、至98.5％(3x覆盖率)。

实施例6-用于处理用于Hyb&Seq的FFPE组织的样品制备

福尔马林固定的石蜡包埋(FFPE)组织为用于传统测序平台的具有挑战性的样品输入类型。Hyb&Seq的样品制备方法成功地处理用于下游测序的FFPE组织输入。首先，在一步法中，从福尔马林固定的石蜡包埋(FFPE)组织中提取待测序的核酸。在水基核酸提取缓冲液中加热一个或多个10μm厚的FFPE卷状物，以同时熔化石蜡、分解组织并从细胞中释放核酸。合适的提取缓冲液为本领域已知的，并且一般地包含蛋白酶、去污剂比如Triton-100、螯合剂比如EDTA和铵离子。将FFPE卷状物和提取缓冲液在56℃下温育30分钟以分离石蜡与组织并使得蛋白酶K消化组织结构且使包埋的细胞暴露于去污剂以使细胞溶解。将溶液以8分钟间隔倒置3次，以助于在组织脱蜡和消化过程期间混合试剂。在该步骤后，将溶液加热至98℃以促进甲醛交联的逆转，以进一步助于核酸的提取。

一旦从FFPE组织中提取了核酸，使用具有2.7μm孔径的玻璃纤维过滤器(Whatman)过滤溶液以去除组织碎片和凝固的石蜡。生成的溶液为均匀的半透明溶液，其含有由于福尔马林固定过程和储存条件而高度片段化的核酸。如果需要进一步片段化，可使用Covaris聚焦超声波发生器对DNA进行机械剪切。由于缓冲条件，需要延长声处理来剪切核酸。使用50W峰值入射功率、20％占空因数、200个循环/脉冲的标准设置进行声处理600秒，以实现捕获目标的增加最大。为了获得更短的片段长度，通过在21000g和4℃下离心15分钟，可使乳化的石蜡从过滤的溶液中沉淀出来。这使得DNA能够剪切至约225bp。

接下来，通过在快速杂交步骤期间使捕获探针与靶核酸分子结合配对来进行靶标捕获。5'捕获探针含有3'生物素部分，这使得靶标能够在靶标沉积过程期间与链霉亲和素包被的流动池表面结合。3'捕获探针含有5'标签序列(G序列)，这使得能够在纯化过程期间与珠粒结合。反应速率受到捕获探针浓度的驱动，其以低纳摩尔范围加入以最大化反应速率。捕获探针以侧翼于感兴趣区域的方式与靶标杂交，以产生测序窗口。对于每个DNA靶标，捕获探针组还包括由与测序窗口相同的序列组成的寡核苷酸，以与靶标的反义链杂交并防止再退火。将含有捕获探针的溶液加热至98℃保持3分钟以使基因组DNA变性，随后在65℃下温育15分钟。该杂交反应使用400mM-600mM范围内的NaCl浓度。表3中列出了已实验验证的一组超过100种靶标，详细描述了靶向的DNA区域的基因和外显子。

表3：靶向的DNA区域的基因和外显子

在靶向的DNA区域与捕获探针结合之后，其从基因组DNA的其余部分纯化以产生富集的靶标溶液。将用反义寡核苷酸(反义G序列)包被至3'捕获探针的结合序列的珠粒与捕获反应混合物在室温下一起温育15分钟。在结合步骤之后，珠粒用0.1x SSPE洗涤3次以去除非靶标DNA和含有生物素的5'捕获探针。洗涤后，使珠粒重新悬浮于14μL的0.1x SSPE中，然后在45℃下加热10分钟以从珠粒洗脱纯化的DNA靶标。洗脱之后，加入1μL的5M NaCl以确保捕获探针保持与DNA靶标结合。

样品制备过程的最后步骤为使DNA靶标沉积到流动池表面上，其中可使用本文公开的本公开的探针分析它们。使用注射泵来控制靶标被加载到流动池流体通道中的速率，使得所有靶标有时间漫过通道的高度扩散并与链霉亲和素表面结合。这种加载方法产生靶标的密度梯度，其中每单位面积的最高分子数在流体通道入口处最大，并且沿着通道长度在朝向出口的流体流动方向上减小。对于1.6mm的通道宽度和40μm的高度，0.35μL/秒的流速实现了在约10mm的通道长度内的定量捕获。一旦通过生物素化的5'捕获探针使靶标与表面结合，就注入生物素化的寡核苷酸(G-钩)的溶液，其为3'捕获探针的结合序列的反向互补序列，以固定靶标的自由端，创建桥接结构，其中中间的ssDNA区域为感兴趣的测序窗口。接下来，添加G-序列寡核苷酸的溶液以与表面上过量G-钩杂交，以减少表面上ssDNA的量。图11显示使用本公开的双捕获探针系统捕获靶核酸。

实施例7-Hyb&Seq的多色报告图像处理

图像处理流水线包括以下步骤：背景减除、配准、特征检测和分类。在背景减除中，任何给定通道的平均背景为散粒噪声和曝光的函数。在我们的系统中，蓝色通道具有最高的背景水平和更大方差。使用具有半径为7像素的圆形结构元素的简单顶帽过滤器来进行局部背景减除。对于配准，必须将感兴趣的特征与多色和多循环特征分析进行完全比对。系统需要两种配准形式。对于第一种形式，局部仿射变换应用于单个采集叠加内的所有图像通道。该变换为光学系统的函数，并因此对于给定的仪器是一致的。该函数针对每次运行预先计算，并应用于所获取的每个图像。对于第二种形式，使用归一化互相关来计算刚性移位形式的全局变换，以捕获运行期间机械机架的漂移。下一步为特征检测。

一旦配准所有图像，就经LoG(Laplace ofGaussian)滤波器使用匹配滤波器检测特征。滤波器使用固定的内核尺寸(与特征的衍射极限相匹配)和不同的标准偏差(与相应通道的波长相匹配)来匹配应用以增强位点响应。局部最大值用于鉴定潜在的报告探针位置。检索每个鉴定的特征的相关强度值以进行分类。最后一步为分类。使用高斯朴素贝叶斯模型对多色报告探针(强度进行分类。模型假设报告探针强度为独立的并且遵循正态分布。然后，模型使用最大后验或MAP规则计算特定特征

(由所有通道的强度

决定)属于某个类别(C_k)的概率：

用特定颜色组合标记的报告复合物的强度分布如图36所示。图36图解说明使用2种染料的编码方案：蓝色和红色。在双色编码场景中可有6个类别(包括背景)。在实施的系统中，4种颜色的选择导致14种潜在的类别。请注意，单半染料与全染料分布之间存在一些重叠。因此，这些类别之间的分类呈现出更高的错误率，‘xG’和‘GG’之间的最大错误分类率为11.8％。10类模型的错误分类率低于0.2％。由于每个报告探针需要最多8个类别，因此很简单选择分类错误最少的类别。基于查找表将检测到的颜色代码翻译成鉴定的碱基对。使用本文公开的本公开的探针，跨多个循环跟踪特征。

实施例8-靶核酸使用捕获探针的纯化和沉积

为了捕获靶核酸分子，使用双捕获探针系统进行高度特异性富集。捕获探针被设计成在靶向的感兴趣区域侧翼的位置处与靶核酸结合，产生“测序窗口”。称为CapB的5'捕获探针含有3'生物素部分。称为CapA的3'捕获探针含有5'亲和标签序列，称为G序列。平均而言，捕获探针的长度为约40个核苷酸，并基于Tm和序列上下文进行设计。测序窗口长度为约70个核苷酸，并且易于调整。图11显示双捕获探针系统的示意图。

CapB上的生物素部分将靶核酸拴系于链霉亲和素包被的流动池表面用于测序。CapA上的亲和标签使得靶核酸分子能够在纯化期间与磁珠可逆性结合。CapA和CapB的使用使得能够进行高度严格的靶标富集，因为两种探针保持与单个靶核酸分子结合，以使靶标在磁珠纯化和表面沉积过程两者中均可存活。多路复用捕获已被证明同时具有多达100种靶标。为了在短时间段内实现有效捕获，以1nM-10nM的浓度范围添加捕获探针。

在实验测试中，使用G-珠和双探针捕获系统纯化一组～10种靶核酸分子。首先使CapA和CapB探针与靶核酸杂交。然后使结合的CapA探针的G-序列部分与G-珠上的G-钩杂交，从而使靶核酸分子连接至G-珠。使用0.1x SSPE进行一系列严格洗涤以去除非靶向的DNA和未结合的CapB。为了从G-珠释放靶核酸分子，进行低盐，45℃洗脱以使G序列变性，同时仍允许CapA和CapB保持与靶核酸杂交。

测试表明，当纯化一组～100种靶核酸分子时，非特异性/背景信号显著增加。背景的增加可能是由于包括以下的几种因素造成的：(1)CapA和CapB探针种类之间的相互作用增加，这导致通过纯化携带的游离CapB探针的量增加；和(2)CapB探针与G-钩或G-珠之间的相互作用增加，这导致不需要的靶核酸的纯化。此外，随着组的大小增加，CapB种类、CapA种类和测序探针之间可能的相互作用呈指数增加。这些相互作用可干扰密集沉积靶标的能力并导致测序读取的浪费。

为了减少由于游离探针种类和不需要的靶核酸分子的纯化而产生的非特异性和背景信号，可对纯化程序进行一些修改。首先，在靶核酸分子与G-珠结合期间使用的缓冲液中包含浓度为30％v/v的甲酰胺使背景计数减少两倍(如通过对缺少靶分子的对照组计数测量的那样)，可能是通过干扰游离捕获探针与G-钩的不完全杂交，使得过量的探针被洗去。其次，在G-珠上的G-钩中包含4种iso-dG碱基(iso-G-钩)和在CapA G-序列中包含互补的iso-dC碱基，使背景计数减少3倍(如通过对缺少靶分子的对照组计数测量的那样)。Iso-dC和iso-dG为天然dC和dG碱基的异构体变体。由于异碱基将与其他异碱基但不与天然碱基碱基配对，捕获探针与iso-G-钩之间的不完全杂交可仅存在于G-序列的非异碱基和iso-G-钩之间。在严格洗涤期间，这些不完全的相互作用更易于破坏。最后，用

XP(Agencourt Biosciences Company)珠粒随后纯化iso-G-珠洗脱液进一步将背景计数减少至少20倍(如通过对缺少靶分子的对照组计数测量的那样)。在

XP珠粒纯化期间，将DNA样品与羧基化磁珠在聚乙二醇(PEG)和NaCl的溶液中的混悬液混合。可滴定PEG和NaCl的浓度，使得仅高于分子量阈值的分子沉淀并与珠粒结合。与捕获探针杂交的Hyb&Seq靶标大约为81kDa，而游离探针大约为17kDa或更小。通过将

XP珠粒混悬液与iso-G-珠洗脱液以1.8:1的体积比率混合，使杂交的靶标与珠粒结合，并且可在最终洗脱之前洗去大部分游离探针。

因此，模型纯化工作流程包括以下步骤：(1)使捕获探针-靶核酸组装体在5xSSPE/30％甲酰胺中与iso-G-珠杂交；(2)用0.1x SSPE洗涤iso-G-珠；(3)在45℃下于0.1xSSPE中洗脱捕获探针-靶核酸组装体；(4)使iso-G珠-洗脱液与1.8x体积的

XP珠结合；(5)用75％乙醇洗涤

XP珠粒；和(6)以0.1x SSPE洗脱捕获探针-靶核酸组装体，使得靶标以7.5μL洗脱，随后加入0.5μL的5M NaCl。

纯化之后，使用输注注射泵将捕获探针-靶核酸组装体沉积到测序表面上，以通过流动池缓慢注射纯化的靶标。为了确定沉积梯度，流动池在沿着通道长度的各个位置处成像。典型的沉积梯度如图37所示。对于20μm的通道高度，以0.167μL/min的流速加载样品将使靶标集中，使得所有靶标的80％在沿着通道长度5.1mm内结合，这代表Gen2成像仪的～240个FOV，FOV为0.0357mm²和流动池通道宽度为1.7mm。梯度可通过在沉积期间调整流速来调节。

上述程序用于测试100plex靶核酸组的纯化和沉积，其中基因组DNA剪切至大小为～300个碱基对。一式三份进行一系列实验，DNA输入范围在25ng-500ng之间。通过对沉积梯度进行成像来外推流动池上的总靶标数，以获得平均计数的数目，如图38所示。捕获效率为6.6％，并且在DNA质量输入范围内保持一致。

实施例9-测序探针的设计和特征

测序探针经靶结合结构域与靶核酸分子杂交。在本实施例中，靶结合结构域长8个核苷酸并且含有锁定核(LNA)六聚体，其侧翼为(N)碱基，后者可为通用/简并碱基或规范碱基(N₁-B₁-B₂-B₃-B₄-B₅-B₆-N₂，其中B₁-B₆为LNA，和N₁和N₂为独立于(6聚体)序列的核酸序列B₁-B₂-B₃-B₄-B₅-B₆的通用/简并碱基或规范碱基)。一整套4096个测序探针编码所有可能的六聚体，并能够对任何靶核酸进行测序。每个测序探针还包含条形码结构域，其编码靶结合结构域中存在的六聚体序列。每个条形码结构域含有3个位置(R1、R2和R3)。条形码结构域中的每个位置对应于靶结合结构域的六聚体中的特定二核苷酸，并含有可与特定标记的报告复合物结合的独特序列。测序探针的示意性概述如图1所示。条形码结构域中的每个位置编码8种“颜色组合”，使用4种荧光染料产生：蓝色(B)、绿色(G)、黄色(Y)和红色(R)。在每个测序循环期间，报告复合物与条形码结构域中的3个位置之一结合，表明靶结合结构域的六聚体中的相应二核苷酸的身份。在3个依序测序循环期间，记录3个“颜色组合”，一个组合用于条形码结构域中的每个位置，使得能够鉴定靶结合结构域的整个六聚体。将4096个测序探针分成8个池，每个池与512种可能的条形码之一相关联。

实施例10-报告复合物设计、纯化和结合条件

在该实施例中，每个报告复合物为37种DNA寡聚体分支结构，设计用于容纳总计30种荧光染料，每种颜色的颜色组合有15种染料。构成报告复合物的37种DNA寡聚体可按其大小分类。称为一级核酸的最大寡聚体与长度为12或14个核苷酸的互补核酸共价连接。一级核酸长96个核苷酸。一级互补核酸与测序探针的条形码结构域上的位置R₁、R₂或R₃结合。下一个最大的DNA寡聚体长89个核苷酸，并且称为二级核酸。每个报告复合物有6个二级核酸，对于每种颜色的颜色组合每个具有3个二级核酸。每个二级核酸包含长14个核苷酸的序列，其使得二级核酸与一级核酸杂交。最小的DNA寡聚体长15个核苷酸，称为三级核酸。每双色探针有30个三级核酸，每种颜色有15个三级核酸。5个三级核酸与每个二级核酸结合。37种DNA寡聚体分支结构的示意图如图4所示。

三级核酸包括荧光染料形式的可检测标记。有4种荧光染料：蓝色(B)、绿色(G)、黄色(Y)和红色(R)。在报告复合物中将染料组合在一起导致10种可能的双色组合(BB、BG、BR、BY、GG、GR、GY、RR、YR、YY)。为了防止不同荧光染料之间的颜色交换或交叉杂交，对应于特定荧光染料的每个二级和三级核酸含有独特序列。例如，用Alexa 488荧光团或蓝色标记的每个三级核酸包含仅与蓝色二级核酸互补的序列。蓝色二级核酸进一步具有不同的序列，其仅与对应于包括蓝色的颜色组合的一级核酸分子互补。

每个互补核酸含有在测序探针的条形码结构域的位置R1、R2和R3之间不同的序列。因此，即使相同条形码结构域的位置R1和R2编码相同的二核苷酸，识别位置R1处的二核苷酸的互补核酸分子的结合也不会与位置R2结合。同样地，识别位置R2处的二核苷酸的互补核酸分子不会与位置R1结合。设计互补核酸，使得其可使用竞争性的立足点交换(对于长度为12个核苷酸的互补核酸)或UV切割(对于长度为14个核苷酸的互补核酸)有效地解除与测序探针的结合。

报告复合物的制备以两个依序的杂交步骤发生：(1)三级核酸与二级核酸和然后(2)三级核酸+二级核酸与一级核酸。通过在4.2XSSPE缓冲液中于室温下将100μM的二级核酸和600μM的三级核酸混合30分钟来制备4个单独的三级核酸-二级核酸反应物。然后使用2μM的一级核酸、7.2μM的二级核酸+染料#1三级核酸和7.2μM的二级核酸+染料#2三级核酸，在4.8X SSPE中分别制备24种报告探针。将这些反应物在45℃下加热5分钟，并然后在室温下冷却30分钟。然后将24种反应物合并到3个对应于条形码结构域(即R1、R2和R3)的不同池中。例如，将与R₁条形码结构域结合的8种不同报告探针(每种2μM)合并在一起，稀释10倍至每种报告复合物的最终工作浓度为200nM。可使用高效液相色谱(HPLC)纯化报告复合物。图39显示HPLC纯化可去除游离寡聚体和畸形探针以产生报告探针。

以下报告复合物制备为质量保证的标准测试。以3个单独的流动池测试3个报告探针池的每一个与其相应的条形码区域(R1、R2和R3)的结合。对修饰的测序探针构建体(仅存在条形码结构域并固定于流动池上)进行测试。代表每种颜色的所有8种12聚体均为多路复用的，并且预计所有8种报告探针均鉴定为有高颜色计数。

为了提高报告探针与测序探针的条形码结构域杂交的效率和准确率，测试了各种缓冲添加剂。图40显示来自实验的结果，其表明含有5％硫酸葡聚糖(500K)和15％甲酰胺或15％碳酸乙烯酯的缓冲液使得能够以短杂交时间最有效和准确地使报告探针与测序探针杂交。然而，图41显示来自实验的结果，其表明碳酸乙烯酯对测序载玻片的表面具有负面影响，导致靶核酸随着时间的推移高度损失。因此，含有5％硫酸葡聚糖(500K)和15％甲酰胺的缓冲液对于报告探针与测序探针的有效和准确杂交是占优势的。

实施例11-互补核酸序列的设计和验证

报告探针含有互补核酸，其与测序探针的条形码结构域上的特定位置(R1、R2或R3)结合。设计并测试含有12个核苷酸(12聚体)或14个核苷酸(14聚体)的互补核酸以确定用于杂交的最佳序列。对于筛选，使用以下标准来确定最佳序列：序列必须显示出高结合效率，如报告探针和测序探针结合所定义，在10个测序循环中效率>80％；序列必须显示出在15秒-30秒内发生快速杂交动力学；和序列必须显示出高特异性，在报告探针池中交叉杂交错误<5％。

表4显示被鉴定的24种12聚体序列(SEQ ID NOs:19-42)。由于每个条形码结构域含有3个位置，因此24种12聚体序列可分成3组，以产生8x8x812聚体报告探针组。

表4

14聚体序列以类似方式设计，但在3个方面与12聚体序列不同。首先，14聚体序列含有较长的杂交序列，鉴于14聚体序列含有14个单链核苷酸，其与条形码结构域上的特定位置结合，而不是12聚体中存在的12个单链核苷酸。其次，14聚体序列含有更多的序列多样性，因为它们不是为了适应立足点介导的去除而设计的。由于14聚体序列更强烈地与测序探针杂交，因此立足点介导的去除效率降低。因此，针对14聚体序列探索了序列无关的去除策略，减轻了筛选期间的序列限制。使用包括以下规则组的算法设计用于筛选的序列：缺少“G”或“C”的核苷酸组成(即低复杂性序列)；GC含量在40％-60％之间；熔解温度(Tm)在35℃-37℃之间；发夹折叠能量(dG)>2；和与其他测序探针的相容性(汉明距离>＝7)。为了最小化14聚体序列与可存在于靶核酸中的基因组序列的杂交，使用External RNA ControlsConsortium序列作为指导过滤潜在序列。第三，设计14聚体序列以通过在其中14聚体互补核酸与报告复合物的一级核酸附接的位置处使用可切割接头修饰进行链切割而从测序探针的条形码结构域中去除。去除14聚体序列导致报告复合物信号“变暗”，使得能够发生下一个循环的测序和信号检测。测试了各种可切割接头修饰，包括UV-光可切割接头、还原剂(比如TCEP)可切割接头和酶促可切割接头(比如由USER^TM酶切割的尿嘧啶)。发现所有这些可切割接头修饰促进有效的报告复合物变暗。通过将可切割接头修饰引入到二级核酸中进一步增强变暗。将这些可切割接头修饰置于与一级核酸杂交的序列和与三级核酸杂交的序列之间。图10显示报告探针内可切割接头修饰的可能位置。

筛选潜在的14聚体序列导致鉴定出两组可接受的序列。表5显示第一组，其含有24种序列(SEQ ID NOs:43-66)。这24种序列可分成3组，以产生8x8x814聚体报告探针组。

表5

报告探针	14-聚体序列	报告探针名称	颜色	SEQ
					A	ATCTTTTCCCCACT	R14-BG_RC-Sc3_B2	BG	43
A	CCCCACTATTTCTT	RPTR14-BY_Screen4_I2	BY	44
					A	CTACCCACAACATA	RPTR14-YR_Screen3_D9	YR	45
A	CCATATAAACCCCA	R14-GG_RC-Sc3_B5	GG	46
					A	AAACTCCAATCTCC	R14-GR_RC-Sc3_B7	GR	47
A	CTATTCTCAACCTA	RPTR14-YY_RS0255_H8	YY	48
					A	CCCCCTCTTTTAAA	R14-BB_RC-Sc3_B1	BB	49
A	CCAATCTTACCTCA	RPTR14-RR_Screen3_B10	RR	50
					B	CCCTCACATAACTT	RPTR14-BG_Screen4_I1	BG	51
B	CTCCTCTACTTTCC	RPTR14-BB_ERCC_00014.1_10	BB	52
					B	CCCTAAACCCAAAA	RPTR14-BY_Screen3_D3	BY	53
B	CACTTTTTCCCATC	RPTR14-GY_Screen3_D6	GY	54
					B	CATCTGATTCCTCC	R14-RR_ERCC_00042.1_150RC	RR	55
B	CTAAACCCCCTACT	R14-BR_RC-Sc3_B4	BR	56
					B	CCTTTACAAACACA	RPTR14-GR_RS0247_H7	GR	57
B	ATACCACCCTCTTT	RPTR14-YY_Screen3_B8	YY	58
					C	TATTCTTCTACCCC	RPTR14-YR_Screen4_I5	YR	59
C	TCTACCCTTCTCAT	R14-BG_RC-Sc3_D2	BG	60
					C	CCACAATAACAACC	RPTR14-BR_Screen3_D4	BR	61
C	ACCTTAACATTCCC	R14-GG_RC-Sc3_D5	GG	62
					C	ATTTCCCACTAACC	RPTR14-GR_Screen3_D7	GR	63
C	ACTTAAAACCCTCC	RPTR14-YY_Screen3_D8	YY	64
					C	TACCTATTCCTCCA	RPTR14-BB_Screen3_D1	BB	65
C	CCCCTTTCTCTAAG	RPTR14-RR_ERCC_00051.1_220	RR	66

表6显示另一组，其含有30种序列(SEQ ID NOs:67-96)。这30种序列可分成3组，以产生10x10x1014聚体报告探针组。

表6

报告探针	14-聚体序列	报告探针名称	颜色	SEQ ID
					A	GATGATGGTAGGTG	R14_PC_J2_BB_v2	BB	67
A	ATGAGAAGGGTAGA	R14_PC_D2_BG_v2	BG	68
					A	GTTTTGTTGGTGAG	R14_PC_K2_BY_v2	BY	69
A	TTAGTGTGTTGGAG	R14_PC_K5_BR_v2	BR	70
					A	ATGTAGGAGAGAGA	R14_PC_L1_GG_v2	GG	71
A	GGGAATGTTAAGGT	R14_PC_D5_GY_v2	GY	72
					A	GGTTAGTGGGAAAT	R14_PC_rcD7_GR_v2	GR	73
A	GGAGGGTTTTAAGT	R14_PC_rcD8_YY_v2	YY	74
					A	GTAGTGTGGATGTT	R14_PC_J5_YR_v2	YR	75
A	CTTAGAGAAAGGGG	R14_PC_ERCC51_RR_v2	RR	76
					B	GGAAGAGGATGAAA	R14_PC_K1_BB_v2	BB	77
B	AAGTTATGTGAGGG	R14_PC_spB_BG_v1	BG	78
					B	GGAAAGTAGAGGAG	R14_PC_spB_BY_v1	BY	79
B	TTTTGGGTTTAGGG	R14_PC_spB_BR_v1	BR	80
					B	AGATGTATGGGTGA	R14_PC_L2_GG_v2	GG	81
B	GATGGGAAAAAGTG	R14_PC_spB_GY_v1	GY	82
					B	GGAGGAATCAGATG	R14_PC_spB_GR_v1	GR	83
B	AGAGGGATTGATGA	R14_PC_J4_YY_v2	YY	84
					B	TGTGTTTGTAAAGG	R14_PC_spB_YR_v1	YR	85
B	AAGGAGTGATAGGA	R14_PC_J1_RR_v2	RR	86
					C	TGGTGATTTAGAGG	R14_J3_BB_v2	BB	87
C	GGGGTAGAAGAATA	R14_rcI5_BG_v2	BG	88
					C	AAGAAATAGTGGGG	R14_PC_spA_BY_v1	BY	89
C	TATGTTGTGGGTAG	R14_PC_spA_BR_v1	BR	90
					C	GTTAAAGGGAGGTT	R14_K3_GG_v2	GG	91
C	TGGGGTTTATATGG	R14_PC_spA_GY_v1	GY	92
					C	AGGGAATATGGAGA	R14_K6_GR_v2	GR	93
C	TAGGTTGAGAATAG	R14_PC_spA_YY_v1	YY	94
					C	TTTAAAAGAGGGGG	R14_PC_spA_YR_v1	YR	95
C	TGAGGTAAGATTGG	R14_PC_spA_RR_v1	RR	96

筛选之后，通过实验验证了8x8x812聚体、8x8x814聚体和10x10x1014聚体报告探针组。对于8x8x812聚体结合方案，使用Hyb&Seq原型进行验证以记录10个测序循环。在长和短工作流程两种方法中使用3个报告探针池。测试所有512种可能的测序探针条形码结构域。表7显示长和短工作流程方法的实验步骤。

表7

长工作流程实验导致变暗效率>97％。对于短工作流程实验，假设变暗效果差不多，但是预计很少频率的非变暗报告探针会在每个图像中留存下来并被误称为新报告探针。确实，短工作流程实验中的最高条形码计数为YYYYYY，这可能是非变暗和背景的假象。图42显示，与长工作流程相比较，短工作流程中的8x8x812聚体报告探针组的性能通常较低。与长工作流程相比较，报告复合物1(其与条形码结构域的位置R1结合)和报告复合物3(其与条形码结构域的位置R3结合)在短工作流程中效率较低。这对于报告复合物3为预期的，因为其包含8个另外的立足点寡核苷酸，每个寡核苷酸的浓度高达2.5μM，这可干扰报告探针杂交。报告探针复合物1应在两种工作流程之间表现类似，因为在短或长工作流程中没有使用立足点来去除第一报告复合物。与所有3种报告探针的长工作流程相比较，短工作流程中的总误差也更高(1.3-2倍)。

通过测试与所有512个可能的测序探针条形码结构域杂交的效率、特异性和速度来验证8x8x814聚体报告探针组。将测序探针条形码结构域直接固定于Hyb&Seq测序盒的玻璃上。图43显示8x8x814聚体报告探针在仅15秒内杂交，平均效率为88％，平均错误率为5.1％。这种错误的大部分是由于报告探针的不正确识别而不是由于不正确的杂交造成的。报告探针的错分误差仍然是报告误差的最大组成部分。

通过测试与30个互补，截短的测序探针条形码结构域杂交的效率、特异性和速度来验证10x10x1014聚体报告探针组。每个条形码结构域仅含有1个报告探针结合位点。使这些条形码结构域直接固定于Hyb&Seq测序盒的玻璃上。图44显示10x10x1014聚体报告探针组在仅15秒内杂交，平均效率为90％，平均错误率为5.0％。同样，绝大多数错误是由于报告探针的不正确识别而不是由于不正确的杂交造成的。

实施例12-标准和3部分测序探针的设计和测试

测序探针的靶结合和条形码结构域由双链“茎”分开。图2显示两种通过实验测试的测序探针架构。在标准测序探针上，靶结合和条形码结构域存在于同一寡核苷酸上，其与茎寡核苷酸结合以产生长36个核苷酸的双链区。使用该架构，探针池中的每个测序探针使用相同的茎序列。在3部分探针上，靶结合和条形码结构域为通过36个核苷酸的茎寡核苷酸结合在一起的单独的DNA寡核苷酸。为了防止条形码结构域的可能交换，每个条形码具有独特的茎序列，并且在汇集测序探针之前分别杂交。

图45显示将3部分测序探针与标准测序探针比较所进行的一系列实验的结果。这些实验证实，3部分测序探针在整个测序循环中存活，其中两种配置的所有读取的～80％包括第三报告探针的检测。当与标准测序探针相比较，3部分探针显示计数减少～12％。为了研究条形码结构域寡核苷酸的交换倾向，向反应中加入高浓度的含有相同茎序列的短备选寡核苷酸。结果表明，～13％的检测到的3部分测序探针已交换条形码寡核苷酸。需要通过掺入独特的茎序列来减轻寡核苷酸的交换。尽管性能略有下降，但3部分探针具有设计灵活性、快速寡核苷酸合成和降低成本的益处。

实施例13-锁定核酸取代在靶结合结构域中的作用

如下测试锁定核酸(LNA)取代到测序探针的靶结合结构域中的作用。使测序探针与报告探针在溶液中杂交，并纯化适当形成的测序探针-报告探针。然后使测序探针-报告探针与合成靶核酸在溶液中杂交并加载到原型测序盒上。合成的靶核酸由50个核苷酸组成并被生物素化。测序探针单独或在9种测序探针的池中进行测试。对于9种测序探针的池，设计探针以沿着靶核酸的长度结合。为了分析，通过面包板仪器将整个反应沉积到链霉亲和素包被的盖玻片上，并然后流动拉伸。然后使用适当的仪器和软件对报告探针进行成像和计数，例如用NanoString

仪器和软件。

每个测序探针含有10个核苷酸的靶结合结构域(SEQ ID NO:97)。使靶结合结构域内的LNA取代在图46中所示的位置包含2、3或4个LNA碱基。图46显示单个测序探针对靶核酸的结合亲和力随着LNA碱基数目的增加而增加。重要的是，图46显示LNA碱基的掺入不会降低序列探针结合的特异性。当探针可竞争靶结合时，测试9种测序探针的池以确定碱基覆盖率。图47显示当将单个LNA探针引入到池中时，受影响碱基的覆盖率增加，而对围绕围探针的结合几乎没有影响。这些结果表明LNA碱基取代可在不降低特异性的情况下提高碱基敏感性。

实施例14-修饰的核苷酸和核酸类似物取代在靶结合结构域中的作用

如下测试各种修饰的核苷酸和核酸类似物(包括锁定核酸(LNA)、桥接核酸(BNA)、丙炔修饰的核酸、拉链核酸

异鸟嘌呤和异胞嘧啶)取代到测序探针的靶结合结构域中的作用。将长度为50个核苷酸的生物素化的靶核酸加载到原型测序盒的链霉亲和素盖玻片上。然后将测序和报告探针依序引入到样品室中并使用Hyb&Seq原型仪器成像。处理图像以比较每种不同测序探针的计数。测序探针的10个核苷酸(SEQ ID NO:99)靶结合结构域中的取代包括在图48中所示的位置处的LNA、BNA、丙炔和

碱基。图48显示含有LNA和BNA的探针在保持特异性的同时显示出结合亲和力的增加最大，如针对匹配和错配靶标检测到的计数的数目所示。这些结果表明LNA或BNA碱基取代可在没有降低特异性的情况下提高碱基敏感性。

实施例15-测定本公开的测序方法的准确率

图49描绘量化本公开的测序方法的原始特异性的实验结果。在该实验中，进行测序反应，其中使一池4种不同的测序探针与包含NRAS外显子2的片段(SEQ ID NO:1)的靶核酸杂交。除了靶结合结构域的六聚体在位置b5处不同以外，每个测序探针(条形码1至4)具有相同的靶结合结构域，如图49的上图所示。在该实例中，条形码4为正确的测序探针。在测序探针杂交之后，使报告探针依序地与条形码结构域的3个位置(R1、R2和R3)的每一个杂交，并记录相应的荧光数据。图49的中图描绘针对3个条形码结构域位置记录每种颜色组合的次数以及记录正确组合的时间百分比。R1处的颜色组合在96％的时间被正确识别，R2处的颜色组合在97％的时间被正确识别和R3处的正确颜色组合在94％的时间被正确识别。如图49的下图所示，这导致94％的总体原始特异性。可以解释误称的条形码结构域位置的错误来源包括：(a)报告探针与流动池表面的非特异性结合和(b)报告探针的不正确杂交。估计报告探针的杂交错误量为约2％-4％。

图50显示当通过一种以上测序探针对靶核酸中的核苷酸进行测序时确定本公开的测序方法的准确率的实验结果。如图50的上图所示，该实施例中的靶核酸为NRAS外显子2的片段(SEQ ID NO:1)。感兴趣的特定碱基为在靶核酸中突出显示的胞嘧啶(C)。感兴趣的碱基将与两种不同的测序探针杂交，每种测序探针具有与靶核酸杂交的不同足迹。在该实施例中，测序探针1-4(条形码1-4)结合感兴趣的碱基左侧的3个核苷酸，而测序探针5-8(条形码5-8)结合感兴趣的碱基左侧的5个核苷酸。图50的中图显示在测序探针的条形码结构域的每个位置记录特定颜色组合的次数。在图像量化和使用图26所示的碱基响应技术之后，可记录到～98.98％的平均准确率。

Claims

1.检测样品中的靶核酸的方法，其包括：

(1)使至少一种探针与样品中的靶核酸杂交，

其中所述探针包含靶结合结构域和条形码结构域，

其中所述靶结合结构域包含至少12个核苷酸并且能够结合靶核酸，并且

其中所述条形码结构域包含合成主链，所述条形码结构域包含至少2个附接位置，每个附接位置包含至少一个附接区，所述附接区包含至少一个能够由报告探针结合的核酸序列，其中所述至少2个附接位置的每一个具有不同的核酸序列，其中所述至少2个附接位置的序列特异性鉴定所述靶结合结构域；

(2)使包含第一可检测标记和第二可检测标记的第一报告探针与所述条形码结构域的至少2个附接位置的第一附接位置杂交；

(3)鉴定与所述第一附接位置杂交的所述第一报告探针的所述第一可检测标记和所述第二可检测标记；

(4)去除与所述第一附接位置杂交的所述第一可检测标记和所述第二可检测标记；

(5)使包含第三可检测标记和第四可检测标记的第二报告探针与所述条形码结构域的至少2个附接位置的第二附接位置杂交；

(6)鉴定与所述第二附接位置杂交的所述第二报告探针的所述第三可检测标记和所述第四可检测标记；

(7)基于所述第一可检测标记、第二可检测标记、第三可检测标记和第四可检测标记的身份，检测所述样品中的靶核酸。

2.检测样品中的靶核酸的方法，其包括：

(1)使至少一种探针与样品中的靶核酸杂交，

其中所述探针包含靶结合结构域和条形码结构域，

其中所述条形码结构域包含合成主链，所述条形码结构域包含至少4个附接位置，每个附接位置包含至少一个附接区，所述附接区包含至少一个能够由报告探针结合的核酸序列，其中所述至少4个附接位置的每一个具有不同的核酸序列，其中所述至少4个附接位置的序列特异性鉴定所述靶结合结构域；

(2)使包含第一可检测标记和第二可检测标记的第一报告探针与所述条形码结构域的至少4个附接位置的第一附接位置杂交；

(5)使包含第三可检测标记和第四可检测标记的第二报告探针与所述条形码结构域的至少4个附接位置的第二附接位置杂交；

(7)去除与所述第二附接位置杂交的所述第三可检测标记和所述第四可检测标记；

(8)使包含第五可检测标记和第六可检测标记的第三报告探针与所述条形码结构域的至少4个附接位置的第三附接位置杂交；

(9)鉴定与所述第三附接位置杂交的所述第三报告探针的所述第五可检测标记和所述第六可检测标记；

(10)去除与所述第三附接位置杂交的所述第五可检测标记和所述第六可检测标记；

(11)使包含第七可检测标记和第八可检测标记的第四报告探针与所述条形码结构域的至少4个附接位置的第四附接位置杂交；

(12)鉴定与所述第四附接位置杂交的所述第四报告探针的所述第七可检测标记和所述第八可检测标记；和

(13)基于所述第一可检测标记、第二可检测标记、第三可检测标记、第四可检测标记、第五可检测标记、第六可检测标记、第七可检测标记和第八可检测标记的身份，检测所述样品中的靶核酸。

3.权利要求1或权利要求2的方法，其中所述报告探针中的每一个包含与至少6个二级核酸分子杂交的一级核酸分子，

其中多个二级核酸分子中的每一个与至少5个三级核酸分子杂交，

其中所述三级核酸分子中的每一个包含至少一种可检测标记。

4.权利要求1或权利要求2的方法，其中每一报告探针进一步包含至少一种可切割接头。

5.权利要求4的方法，其中所述至少一种可切割接头是光可切割接头。

6.权利要求3的方法，其中每一报告探针的一级核酸分子包含至少一种可切割接头。

7.权利要求3的方法，其中每一报告探针的一级核酸分子包含第一结构域和第二结构域，

其中所述报告探针的至少6个二级核酸分子与所述第二结构域杂交，并且

其中每一报告探针包含位于所述一级核酸分子的第一结构域和第二结构域之间至少一种可切割接头。

8.权利要求7的方法，其中所述至少一种可切割接头是光可切割接头。

9.权利要求7的方法，其中每一报告探针的每一二级核酸分子包含至少一种可切割接头。

10.权利要求9的方法，其中所述至少一种可切割接头是光可切割接头。

11.权利要求7的方法，其中所述报告探针的每一二级核酸分子包含第一结构域和第二结构域，

其中所述第一结构域与所述报告探针的一级核酸分子杂交并且所述第二结构域与所述报告探针的至少5个三级核酸分子杂交，并且

其中每一报告探针包含位于所述二级核酸分子的第一结构域和第二结构域之间至少一种可切割接头。

12.权利要求3的方法，其中每一报告探针包含至少30种可检测标记。

13.权利要求12的方法，其中所述至少30种可检测标记全部具有相同的发射光谱。

14.权利要求12的方法，其中所述30种可检测标记的至少一种具有第一发射光谱且所述30种可检测标记的至少一种具有第二发射光谱，其中所述第一发射光谱和所述第二发射光谱是光学可分辨的。

15.权利要求5、权利要求8或权利要求10的方法，其中步骤(4)中去除所述第一可检测标记和第二可检测标记包括使第一报告探针与光接触。

16.探针，其包含：

与至少6个二级核酸分子杂交的一级核酸分子，

17.权利要求16的探针，其中所述探针进一步包含至少一种可切割接头。

18.权利要求17的探针，其中所述至少一种可切割接头是光可切割接头。

19.权利要求17的探针，其中所述一级核酸分子包含至少一种可切割接头。

20.权利要求16的探针，其中所述一级核酸分子包含第一结构域和第二结构域，其中所述至少6个二级核酸分子与所述第二结构域杂交。

21.权利要求20的探针，其进一步包含位于所述第一结构域和第二结构域之间至少一种可切割接头。

22.权利要求17的探针，其中所述二级核酸分子中的每一个包含至少一种可切割接头。

23.权利要求16的探针，其中每一二级核酸分子包含第一结构域和第二结构域，其中所述第一结构域与一级核酸分子杂交并且所述第二结构域与至少5个三级核酸分子杂交。

24.权利要求23的探针，其进一步包含位于所述第一结构域和第二结构域之间至少一种可切割接头。

25.权利要求16的探针，其中所述探针包含至少30种可检测标记。

26.权利要求25的探针，其中所述至少30种可检测标记全部具有相同的发射光谱。

27.权利要求25的探针，其中所述30种可检测标记的至少一种具有第一发射光谱且所述30种可检测标记的至少一种具有第二发射光谱。

28.检测样品中的靶分析物的方法，其包括：

(a)将样品与权利要求16的探针与在使得所述探针直接或间接结合靶分析物的条件下接触；

(b)检测所述探针的可检测标记，由此检测所述样品中的靶分析物。

29.检测样品中的靶分析物的方法，其包括：

(a)将样品与权利要求18的第一探针与在使得所述探针直接或间接结合靶分析物的条件下接触；

(b)检测所述第一探针的可检测标记；

(c)去除所述第一探针的可检测标记；

(d)将所述样品与权利要求16的至少第二探针与在使得所述探针直接或间接结合靶分析物的条件下接触；

(e)检测所述第一探针的可检测标记，由此检测所述样品中的靶分析物。

30.权利要求4、6、7、9、11、17、21、22和24中任一项的方法，其所述可切割接头选自