CN111164220A

CN111164220A - 靶标双链核酸杂交期间的错误检测

Info

Publication number: CN111164220A
Application number: CN201880063180.4A
Authority: CN
Inventors: 马修·詹姆斯·海因斯; 拉克尔·玛丽亚·桑切斯-库珀; 丹尼尔·艾德里安·拜格雷夫
Original assignee: Evonetix Ltd
Current assignee: Evonetix Ltd
Priority date: 2017-09-29
Filing date: 2018-09-27
Publication date: 2020-05-15
Anticipated expiration: 2038-09-27
Also published as: WO2019064006A1; CA3077106A1; EP3688189B1; US20200248254A1; DK3688189T3; AU2018343116A1; JP2020537511A; US11629377B2; GB201721441D0; ES2920355T3; EP3688189A1; IL273298A; GB201715852D0; SG11202002188YA; GB2568974A; GB2566986A; CN111164220B; KR20200058461A; JP7201674B2

Abstract

执行一系列杂交以从初始片段形成靶标双链核酸，其中每个另外的杂交步骤使成对的较早杂交步骤的直接产物杂交。对于至少一个另外的杂交步骤H_F，对应的成对较早杂交步骤H_E二者都包括错误检测类型的杂交步骤，所述错误检测类型的杂交步骤包括错误检测操作以检测在所述错误检测类型的杂交步骤H_E中形成的杂交片段是否包括至少一个错误杂交片段，以及丢弃所述错误片段的至少部分以将所述至少部分从后续另外的杂交步骤中排除。通过在整个分段和受控的杂交过程中检测并去除错误片段，防止了在每个杂交步骤中错误片段稀释无错误片段的池，以改善产率。

Description

靶标双链核酸杂交期间的错误检测

本发明的技术涉及使核酸片段杂交以形成靶标双链核酸，例如在DNA或其他双链核酸的人工合成领域中。

对双链核酸(诸如DNA、RNA或XNA)的人工合成或合成性(synthetic)合成的需求不断增长。通过使得能够在工厂或实验室中从头合成双链核酸的靶标序列，而不是例如依靠基于克隆的技术复制现有双链核酸的部分，产生双链核酸的靶标序列的成本可大大降低，并且可以提高可生成序列的速度。通常，可以通过例如使用化学手段(例如亚磷酰胺偶联化学)和/或酶促手段(例如经修饰的末端脱氧核苷酸转移酶)将期望的核苷酸掺入序列中来制备单链核酸片段，诸如寡核苷酸。初始批次的单链核酸片段可被选择为使得它们具有重叠区，所述重叠区包含核苷酸(碱基)的互补序列，因此当将相应片段放在一起时，它们可能以正确的次序杂交。

然而，将核苷酸掺入寡核苷酸中固有地包括错误，所述错误以随机分布遍布单链核酸片段发生。例如，错误可由于将有误的碱基掺入寡核苷酸、由于将附加的碱基插入寡核苷酸、在当至少一个另外的碱基应被添加时某一寡核苷酸停止生长超过某一点的情况下由于截短，或者在片段的某个碱基被省略，并且随后该片段继续增长为下一个碱基接合至前一个碱基，它们之间已跳过了至少一个碱基的情况下由于缺失而发生。一些技术可用于检测核酸片段内的某些掺入错误，但是这些技术可能很昂贵且并不完美，因此一批单链核酸片段仍可能包含合理比例的错误。

因此，在合成双链核酸的典型方法中，将一批不同的单链核酸片段置于共同的容器中，并基于匹配的重叠区进行杂交。然而，初始单链核酸片段中掺入错误的存在意味着无错误地形成的最终靶标双链核酸的产率可相对较低。通常，在杂交过程完成后，能够鉴定出核酸的错误双链部分。例如，这可以使用克隆来完成，其中从制造的靶标双链核酸批次中进行随机选择，并将该样本提供给宿主(例如细菌宿主)，随后所述宿主可用于生成随机选择的样本的多个拷贝。然后可以使用测序来确定所选样本是否没有错误。许多平行的克隆系可以对从制造的靶标双链核酸样本中随机选择出的不同批次进行操作。然后取决于产率，一定百分比的这些克隆系可返回更大量的无错误靶标双链核酸样本。然而，该方法的问题在于克隆相对昂贵且缓慢，并且使用常规技术通常获得的产率太低以至于在实践中需要许多克隆系来提供足够的机会使所述克隆系中的一个将生成无错误样本。

实际上，错误掺入率意味着能够人工合成而不是使用用宿主生成的克隆片段的杂交而合成的双链核酸的最大长度(碱基对数)，是相对较低的，并且人工合成双链核酸的基因长度序列仍是不切实际的。这是因为根据幂次定律，错误的可能性与双链核酸的长度成比例，因此对于较长的靶标序列，产率会大大降低。

至少一些示例提供了从多个核酸片段提供靶标双链核酸的一个或多个实例(instances)的方法，所述方法包括：

多个初始杂交步骤，每个初始杂交步骤包括使相应成对的部分重叠的核酸片段杂交以形成多个杂交片段；以及

一个或多个另外的杂交步骤，每个另外的杂交步骤包括使作为对应的成对较早杂交步骤的直接产物的相应成对的部分重叠的杂交片段杂交以形成较长的杂交片段，其中所述成对的较早杂交步骤中的每一个均包括所述初始杂交步骤中的一个或所述另外的杂交步骤中的一个；

其中所述一个或多个另外的杂交步骤包括至少一个另外的杂交步骤，对所述至少一个另外的杂交步骤来说，所述对应的成对较早杂交步骤二者都包括错误检测类型的杂交步骤；

所述错误检测类型的杂交步骤包括：

执行错误检测操作以检测在所述错误检测类型的杂交步骤中形成的所述杂交片段是否包括至少一个错误杂交片段，所述至少一个错误杂交片段在于所述错误检测类型的杂交步骤中杂交的重叠区中包含至少一个错配碱基对；以及

丢弃所述至少一个错误片段的至少部分以将所述至少一个错误片段从后续另外的杂交步骤中排除；

其中所述靶标双链核酸包含与单链核酸第二链杂交的单链核酸第一链；并且

在每个杂交步骤中，在所述杂交步骤中形成的核酸杂交片段经由所述第一链或所述第二链与反应位点的表面结合。

至少一些示例提供了计算机可读程序或数据结构，所述计算机可读程序或数据结构包括用于控制设备以执行上述方法的指令或控制数据。所述计算机程序或数据结构可存储在存储介质上。所述存储介质可以是非暂时性存储介质。

提供了这样的杂交序列，所述杂交序列包括用于使核酸片段杂交的多个初始杂交步骤，以及一个或多个另外的杂交步骤，其中每个另外的杂交步骤使成对的重叠杂交片段杂交，所述成对的重叠杂交片段是对应的成对较早杂交步骤(所述对应的成对较早杂交步骤可以是两个较早的初始杂交步骤、两个较早的另外杂交步骤，或一个较早的初始杂交步骤和一个较早的另外杂交步骤)的直接产物。每个另外的杂交步骤均作用于成对较早杂交步骤的直接产物，因为所述每个另外的杂交步骤作用于成对较早杂交步骤中产生的相同分子，而不是例如作用于由细菌宿主从在较早的杂交步骤中产生的分子复制的克隆分子。因此，杂交序列可以相对较快地完成。

对于至少一个另外的杂交步骤，提供要在该另外的杂交步骤中杂交的片段的成对较早杂交步骤二者均是错误检测类型的杂交步骤。错误检测类型的杂交步骤包括错误检测操作，所述错误检测操作用于检测在错误检测步骤中形成的杂交片段是否包括至少一个错误片段，所述至少一个错误片段在于该杂交步骤中杂交的重叠区中具有至少一个错配碱基对。如果检测到错误片段，则将错误片段的至少部分丢弃以将所述部分从后续另外的杂交步骤中排除。

因此，通过确保馈入给定的另外的杂交步骤的两个较早的杂交步骤均包括错误检测，将来自成对的较早杂交步骤中的一个的更多“良好”片段与来自成对较早杂交步骤中的另一个的“良好”片段配对。这通过将“良好”片段与错误的片段配对而减少了“良好”片段的浪费，这是导致使用现有技术增加长度时产率急剧下降的主要原因。可以在仍对成对较早杂交步骤的直接产物执行后续杂交的同时执行错误检测操作，因此无需将较早杂交步骤的结果输出，到例如细菌宿主，这将是缓慢且昂贵，以执行错误检测。与使用现有技术时可行的情况相比，通过提高产率，可以更快且更成本有效地执行DNA或其他双链核酸的人工合成，以提供给定量的靶标双链核酸。

为了使得能够在错误检测类型的杂交步骤中以及在后续的杂交步骤之前执行错误检测操作，以便能够从该下一杂交步骤中排除错误片段，可能需要对特定片段的杂交的次序和时机进行一定程度的控制。用于进行此的一种方法可以是将样本从一个容器手动或自动控制移液到另一个容器中，以控制片段被放在一起的顺序，并防止不同容器中的片段杂交，直到已经对在较早的杂交中产生的片段执行了错误检测为止。

然而，一种较快且较不劳动密集的方式可以是使用一种设备来执行该方法，该设备具有在预定方向上对准的反应位点的至少一个泳道；以及流体控制元件，所述流体控制元件用于以所述预定方向引导每个反应位点上的流动流体。利用此类设备，流动流体可用于将片段从一个反应位点传输到另一反应位点。该设备还可在每个反应位点处包括独立受控的“阱”(例如，由静电电场或振荡电场，或磁场与铁珠的组合提供)，以促进片段从一个反应位点转移到另一个反应位点，从而防止杂交步骤期间产率的损失。反应位点可包括表面的在相邻反应位点之间没有永久的物理屏障(或者可能根本没有物理屏障，或者任何物理屏障都可以是可选择性去除的)的部分，因此能够容易地将片段从一个位点运输到另一个位点。该设备还可包括温度控制电路，所述温度控制电路用于独立地控制每个反应位点处的温度。例如，温度控制可用于控制错误检测步骤。使用该方法，能够小心地控制靶标核酸的相应部分杂交的次序和时机，因此以更成本有效的方式在连续的杂交步骤之间执行错误检测变得实际可行。

在实践中，为了形成给定长度的靶标双链核酸，可能需要杂交树，该杂交树从初始单链片段或相对较小的双链片段开始，并且在初始片段与在较早杂交中形成的杂交片段之间连续经历多次杂交。可以在该树的任何杂交步骤中，例如在初始杂交步骤中，或在另外的杂交步骤中，提供错误检测类型的杂交步骤。为了以一定的错误率实现产率的某种提高，存在仅单个另外的杂交步骤就足够了，对于该单个另外的杂交步骤，馈入该另外的杂交步骤的成对较早杂交步骤二者均为错误检测类型的。然而，通过提供作用于成对错误检测类型的杂交步骤的直接产物的多于一个另外的杂交步骤，能够实现相对于合并(pooled)或亚合并(sub-pooled)方法而言更大的产率提高。每个杂交步骤均可以使在靶标双链核酸的不同重叠区处的片段杂交，因此，错误检测类型的杂交步骤越多，将要检验错误的靶标核酸的比例越大，以及因此产率提高更大。如果每个另外的杂交步骤作用于二者均为错误检测类型的成对较早杂交步骤，则能够实现最大的产率提高，例如通过确保每个初始杂交步骤和每个另外的杂交步骤均为错误检测类型的。但是，在一些情况下，可以通过接受较低的产率以使装配过程加速(例如，通过省略错误检测步骤，这可以允许在单个反应位点处一起执行多个杂交步骤，从而减少将片段从一个位点转移到另一个位点的单独运输事件的次数，以及减少提供对许多错误检测操作的控制的延迟)而在产率和性能之间进行权衡。

所述错误检测操作可包括弱化形成每个错误杂交片段的部分重叠片段之间的键，以及提供流体以洗去至少一个错误杂交片段的至少部分。例如，每个杂交对中的片段中的一个可以固定至表面，并且因此通过弱化和/或破坏错误杂交片段中的片段之间的键，然后使流体流过所述片段，这能够有效地洗去杂交形成错误杂交片段的成对片段中的一个片段，而另一片段固定至所述表面上。对于无错误的片段，键可通过错误检测步骤而被弱化至较小的程度或保持完整，并且因此这些片段由于键强到足以保持成对片段结合在一起并附着所述表面而不会被洗去。这提供了一种快速且低成本地检测和去除错误的机制

对于弱化错误片段中的键，同时保持剩余的无错误片段不被弱化或弱化至较小的程度，可能存在不同的选项。在一个示例中，错误检测操作可包括将上面形成有杂交片段的反应位点的温度调节至对应于裕度(margin)的目标温度，所述裕度低于在无错误的杂交片段的杂交步骤中形成的重叠区的预期解链温度。这利用了以下事实：在错误的杂交片段中，解链温度通常将低于如果杂交片段无错误的情况，因为杂交片段之间的整体键较弱。重叠区的预期解链温度能够基于计算机模拟进行预测，并且因此通过提供受独立温度控制的反应位点并将给定位点的温度调节到低于正确的无错误片段的预期解链温度的裕度，这能够实现对仅在错误双链片段中而不是在剩余的无错误片段中的键的充分弱化，以使得能够分离错误杂交片段，并且例如随后在所述片段上进行流体流动以洗去每个错误双链片段的部分。即使该错误检测机制不是100％准确的，这仍然能够大大提高产率，同时提供连续杂交之间的成本有效的错误检测手段。

将所述靶标双链核酸分割(partitioning)成单链核酸片段可被选择为使得在每个重叠区处，无错误的杂交片段中的重叠区的预期解链温度与在重叠区内具有至少一个碱基错误的错误杂交片段中的重叠区的预期解链温度之间的差值大于预定阈值。例如，靶标核酸的计算机模拟可以基于核酸的不同点处的碱基的特定组成，来确定靶标的哪些部分是优选的分割点，在所述优选的分割点处靶标应被分成核酸片段，以使无错误杂交片段和错误杂交片段之间的预期解链温度差值最大化，以增加错误检测步骤能够检测出错误片段并将所述错误片段从后续杂交中排除的可能性。更具体地，由于不同的错误可导致不同的重叠序列，因此可以执行分割以使相对于无错误杂交片段的平均预期解链温度差值最大化，其中该平均值是对在重叠区中具有不同类型的错误的多个候选错误片段评估的。例如，所使用的预定阈值可以是至少0.1℃。

在错误检测步骤期间反应位点的温度设定至的低于无错误双链片段的预期解链温度的裕度可例如与用于确定分割的阈值差不同。在一些情况下，可为有用的是针对每种错误检测类型的杂交步骤计算定制的温度裕度。由于每个重叠区可包含不同的碱基序列，因此在重叠区中具有完全匹配碱基的“良好”片段的解链温度与在重叠区中具有至少一个不正确的碱基的错误片段的解链温度之间的平均温度差值(跨所有潜在的错误片段)将根据重叠区的组成而变化。对于那些具有较大平均温度差值的重叠，可为有用的是将用于错误检测的温度裕度设置为大于在“差”片段和“良好”片段之间具有较小平均温度差值的重叠，如通过增加温度裕度(例如，将反应位点的温度设置为相对于无错误的重叠的预期解链温度更低)、使一些“良好”片段被剔除(rejected)的可能性降低、增大因错误检测操作引起的“差”片段被剔除与“良好”片段被剔除的比率，以及由此提高产率。

或者，检测错误杂交片段的另一种方法可以是使用一种或多种错配碱基对检测酶。可以通过一种或多种错配碱基对检测酶来识别和切割具有由不完全杂交导致的错配碱基对的双链核酸，所述错配碱基对检测酶的示例包括T7核酸内切酶I、T4核酸内切酶VII、大肠杆菌(Escherichia coli)核酸内切酶V、CELI和CJE核酸酶(Till,B.J.等人(2004)Nucleic Acids Research 32:2632-2641；Fuhrmann,M.等人(2005)Nucleic AcidsResearch 33:e58)。切割产物可以解离，从而留下单链悬突。随后，可以使用单链特异性核酸外切酶(例如大肠杆菌核酸外切酶I)或校正DNA聚合酶来降解这些单链悬突。

如上所述，杂交片段可以通过在流动流体中运输而在执行相应杂交步骤的反应位点之间运输。这可以比从容器到容器进行手动或自动移液的效率更高，并且还使得能够使用与用于在错误检测期间丢弃错误片段的流体流动机制相同的流体流动机制来执行杂交片段的运输。当片段从一个位点释放并在流动流体中运输到下一反应位点时，可以设置屏障以防止这些释放的片段流动超过下一反应位点。例如，可以通过电场或磁场或场梯度(电阱或磁阱)，或通过物理手段(诸如选择性地引入闸门屏障)来提供屏障。

靶标双链核酸可以包含与单链核酸第二链杂交的单链核酸第一链。第一链和第二链中的每一个可以被分割成用于形成靶标双链核酸的初始(单链或双链)片段。为了支持如上所述使用流体来控制运输和错误检测，在每个杂交步骤中，在该杂交步骤中形成的核酸的双链片段可以经由第一链或第二链结合至反应位点的表面。结合可发生在第一链或第二链的5'端或3'端。结合可以强到足以承受由流动流体提供的力，除非结合被选择性地分离(detached)(如下文更详细地讨论)。这意味着当杂交片段结合至表面，并且错误检测操作弱化了重叠区处的键时，所述片段上方的冲洗流体可洗去错误片段的键已被充分弱化的部分，但保留“良好”片段保持完整并结合至表面。

然而，如果在每个杂交步骤中形成的核酸片段始终经由靶标的第一链和第二链中的同一链结合至反应位点，则这可能意味着即使在一个杂交步骤中检测到了错误片段，所述错误片段可能仍然在下一个杂交步骤中与“良好”片段杂交，并因此浪费“良好”片段并降低产率，即使检测到错误也如此。这是以下事实的结果：当通过丢弃结合到表面的片段(其键已被弱化)的部分来检测并消除错误时，只有被弱化的杂交片段的“松散”部分(未直接结合至表面的部分)可被丢弃，并且“结合”部分(直接结合至表面的部分)将保持固定至反应位点的表面，因此当剩余片段被释放以运输到反应位点进行下一杂交步骤时，错误片段的“结合”部分仍然存在，并且因此如果存在并暴露出匹配的重叠区，则所述“结合”部分可能与其他片段结合。如果在每个杂交步骤中将相同的链固定至反应位点，则在下一杂交中暴露的重叠区将对应于先前杂交的“结合”部分，使得可以使在先前检测到的错误片段的结合侧上的“孤独(orphaned)”片段在下一次杂交时与“良好”片段杂交，由此降低产率。“结合的”和“松散的”部分可以是核酸的单链片段或核酸的双链片段，这取决于在执行错误检测的杂交步骤中杂交的片段。

可以通过以下方式来解决该问题：替代地确保在给定反应位点处执行并作用于均为错误检测类型的成对较早杂交步骤的产物的给定杂交步骤包括使经由第一链和第二链中的一者与给定反应位点的表面结合的第一杂交片段与当经由第一链和第二链中的另一者与较早反应位点的表面结合时在较早反应步骤中在所述较早反应位点形成的第二杂交片段杂交。这在连续的杂交步骤之间有效地交替靶标的第一链和第二链中的哪一条与反应位点结合。这意味着在下一次杂交中杂交的重叠区对应于在先前杂交步骤中形成的杂交片段的“松散”部分，因此如果已经检测到错误并且错误片段的松散侧已被丢弃，则由于错误片段的剩余“结合”部分不具有与下次杂交时暴露的重叠区匹配的重叠区，因此无法进行后续杂交。

如果不是所有的杂交步骤都为错误检测类型，则对每对连续的杂交步骤而言不是必需的是在杂交步骤之间交替将哪条链结合至反应位点。然而，为了支持更多数目的错误检测步骤，可为有用的是在从一个杂交步骤到另一个杂交步骤的每个过渡处交替将第一链和第二链中的哪一条结合至反应位点。因此，所述初始杂交步骤和所述至少一个另外的杂交步骤可形成杂交步骤序列，在所述杂交步骤序列中，对于这样的任何成对杂交步骤，在所述任何成对杂交步骤中所述对的第二杂交步骤使在所述对的第一杂交步骤中形成的杂交片段与另一片段杂交，在成对杂交步骤中形成的杂交片段分别经由所述第一链和所述第二链的相对链与对应的反应位点的表面结合。该方法增加了丢弃错误片段并避免所述错误片段与“良好”片段杂交，从而提高产率的机会。通过控制每个反应位点上初始片段的初始布置以及杂交片段组合放到一起的序列，可以进行对在每个杂交步骤中哪条链与表面结合的控制。

在所述错误检测类型的杂交步骤中的至少一个中，在所述错误检测操作之后的剩余杂交片段可从反应位点的表面选择性分离。在另一个反应位点上的片段中的至少一些可以保持附着至另一个反应位点。不必对每个错误检测类型的杂交步骤都执行选择性分离，因为对于一些杂交步骤，下一杂交步骤可以在与先前杂交步骤相同的位点处执行(其中另一个杂交步骤的产物被运输至相同的位点)，因此有时剩余的杂交片段可保持固定以等待下一批片段到达，以进行下一杂交步骤。

而且，选择性分离的精度不必是100％完全的。可以使用用于从靶反应位点分离片段的分离机制，所述分离机制允许在相关重叠区中不包含错误的一些剩余片段保持附着至靶反应位点，或者所述分离机制允许除了靶反应位点以外的反应位点处的一些片段被分离。由这种不正确分离引起的损失可能不如相对于由错误检测提供的合并或子合并方法引起的产率提高显著，因此即使具有由不正确分离引起的一些损失，总产率仍可提高。因此，即使不是所有片段都从靶反应位点分离或者一些片段从非靶反应位点分离，也可足以提供从靶反应位点分离的概率高于从其他非靶反应位点分离的概率的分离机制。在任何情况下，阻止由不正确的分离引起的这些损失的一种方法可以是在分离步骤期间在每个反应位点使用电阱或磁阱。

分离机制可以以不同的方式实现。在一些示例中，可切割的接头物质可用于将片段附接至相应的反应位点，其可被布置为当经受某种化学试剂时使所述片段与所述反应位点分离。可切割的接头物质的示例包括具有与核苷酸部分结合的琥珀酸酯部分的化学组合物，例如使得切割产生3'羟基核苷酸。更特别地，可切割的接头可以是5'-二甲氧基三苯甲基-胸苷-3'-琥珀酸酯、4-N-苯甲酰基-5'-二甲氧基三苯甲基-脱氧胞苷-3'-琥珀酸酯、1-N-苯甲酰基-5'-二甲氧基三苯甲基-脱氧腺苷-3'-琥珀酸酯、2-N-异丁酰基-5'-二甲氧基三苯甲基-脱氧鸟苷-3'-琥珀酸酯中的一者，或它们的组合。

片段也可以酶促地分离，例如通过使用位于待分离核酸侧翼的特异性识别序列，所述特异性识别序列可以被酶(诸如限制性核酸内切酶)识别。限制性核酸内切酶可切割位点和酶本身的选择可取决于切割产物的期望性质。例如，某些限制性核酸内切酶产生“平”端(“blunt”end)，而另一些限制性核酸内切酶产生核酸的“悬突”。在一个实施方式中，限制性核酸内切酶是II型限制性核酸内切酶。切割其识别序列内的核酸(例如DNA)并产生具有平端的产物的示例性II型限制性核酸内切酶包括AluI、EcoRV、HaeIII、PvuII和SmaI。HaeIII还可以切割单链核酸。切割其识别序列内的核酸(例如DNA)并产生具有悬突的产物的II型限制性核酸内切酶的示例包括BamHI、EcoRI、NotI和XbaI。在另一个实施方式中，限制性核酸内切酶是IIS型酶。此类IIS型酶切割在其识别序列外部的核酸。IIS型限制性核酸内切酶的示例包括MlyI、BspMI、BmrI、BtsI和FokI。在另一个优选的实施方式中，将尿嘧啶-DNA糖基化酶(UDG)和无嘌呤/无嘧啶(AP)位点核酸内切酶用于片段的分离。识别序列可包含至少一个尿苷。用UDG处理会生成无碱基位点。然后用无嘌呤/无嘧啶(AP)位点内切核酸酶对合适的底物进行处理将切割核酸链。

在一些示例中，分离机制可以通过提供防止某些位点受到分离机制影响的物理手段来靶向特异性位点。例如，在每个反应位点对应于物理上分开的容器、导管(vessel)或孔的实施方式中，用于分解接头物质的试剂或酶可以仅应用于靶反应位点，而不应用于其他位点。或者，可以使用带有控制阀的供应通道将试剂或酶引导到特定位点。另一种方法可以是使用温度活化的释放机制。例如，在一些示例中，选择性分离可包括将反应位点加热至使剩余的杂交片段与反应位点结合的接头物质的预定分离温度，其中所述接头物质被布置为当处于所述预定分离温度时与所述表面分离。或者，选定的分离可包括将剩余的杂交片段暴露于分离酶，例如温度活化的分离酶，以及将反应位点的温度调节至分离酶的活化温度。在分离过程期间也可以使用电阱或磁阱，以提高产率。这些阱使互补核酸片段对能够在由于所需分离温度而解链的情况下保持彼此靠近。通过使用阱将对保持在反应位点处，则即使在分离过程期间一些对分开，这也提供了当在阱被释放之前温度降低时所述对再次进行重退火，以使得能够将所述片段运输至后续反应位点的机会。不管实现分离机制的特定方式如何，通过提供机制来选择片段何时从一个位点释放，以便能够将所述片段运输到另一个位点，这提供了对执行片段的连续杂交的次序和时机的控制，从而使得片段能够在一个反应位点处分离，而其他片段保持附着在另一个反应位点处，因此能够推迟进一步的杂交步骤，直到在连续杂交之间已经执行了错误检测为止。

除了对成对的单链片段执行的杂交步骤以外，每个杂交步骤可包括对在该杂交步骤中形成的杂交片段执行的连接操作。对于错误检测类型的杂交步骤，对除在错误检测操作中检测到的至少一个错误片段以外的剩余杂交片段执行连接操作。因此，在错误检测之后保留在给定位点处的剩余双链片段可以经受连接酶，所述连接酶连接核酸骨架中的空位，从而有效地将片段接合在一起。这可能具有以下效应：增加在片段被转移到下一杂交步骤之前相应链之间的键的强度，使得即使在后续的杂交或错误检测步骤中反应位点的温度被调节至先前杂交的重叠区的解链温度，先前执行的连接步骤防止在先前杂交步骤中杂交的链分开。连接操作避免了以下需要：随着片段长度的增加，在错误检测操作中检测单个碱基错误所需的温度控制的精度不断提高。这是因为在最近杂交的重叠区的边界处执行骨架连接会增加核酸骨架无空位连续所沿的片段部分的长度，因此这两条链需要更高的解链温度来沿着具有连续骨架的部分分开。因此，这意味着在后续杂交步骤中检验其他重叠区处的键的强度所需的解链温度可以显著低于使核酸的已杂交区段解离所需的解链温度，使得后续的错误检测步骤不会影响片段的与已检验的重叠区相对应的部分。作用于成对的单链片段的杂交步骤不需要连接步骤，因为在这种情况下，核酸骨架已经沿着所述片段的全长完全连接(其仅为将具有粘性端的双链片段与在骨架中具有空位并且因此可以经受连接的另一单链或双链片段进行连接的步骤)。

可以使用合适的连接酶(诸如T4 DNA连接酶或拓扑异构酶)来执行连接操作。被连接的核酸应优选在5'端被磷酸化。可以使用合适的激酶(诸如T4多核苷酸激酶)来执行此类磷酸化。可以在连接酶之前使用激酶，或者可以使用激酶和连接酶两者的组合。

在一些示例中，初始批次的核酸片段可包含单链核酸片段。因此，初始杂交步骤可包括单链杂交以形成双链片段。在该情况下，初始批次的核酸片段中的每一个可包含至少一个重叠区，所述至少一个重叠区用于与所述核酸片段中的另一个的对应重叠区重叠，并且靶标双链核酸的每个碱基(在第一链和第二链两者中)可以在所述核酸片段中的一个的重叠区之一内。因此，这意味着对于至少一个杂交步骤，每个碱基将在重叠区内，因此如果在每次杂交中执行错误检测，则对每个碱基进行错误检验，因此这增加了能够检测到的错误的百分比。

或者，可以对核酸的部分重叠的双链片段(具有粘性端或悬突，即单链核酸的突出到所述片段的双链部分的端部以外的区域，在所述区域中重叠区将与另一片段的重叠区杂交)执行初始杂交步骤，使得初始批次中的每个片段已经有这样的一些部分，在所述一些部分中所述片段的中间部分中的碱基已经在另一链上具有其互补碱基。在该情况下，并非靶标双链核酸的所有碱基都将在初始批次片段的重叠区之一内，因此这可减少能够检测到错误的程度。

可以在执行初始杂交步骤之前在与用于执行杂交步骤的设备相同的设备上形成初始批次的核酸片段。例如，许多单链核酸片段(例如寡核苷酸)可以在反应位点上生长，然后那些反应位点中的一些也可以用于执行后续的杂交步骤。流体运输机制和受温度控制的释放机制可用于控制在杂交步骤的序列中将哪些核酸片段杂交在一起。或者，在其他方法中，可以单独形成一些预装配的初始片段，并在执行杂交步骤序列之前将其附着到杂交位点的表面。

可以提供一种计算机程序或计算机可读数据结构，所述计算机程序或计算机可读数据结构包括用于控制设备以执行上述方法的指令或控制数据。例如，程序或数据结构可以指定要调节相应反应位点处的温度的时机和水平，以便控制错误检测和流动。因此，可以提供与特定靶标核酸样本相对应的不同计算机程序或数据结构，从而提供用于装配所述特定靶标的特定对照数据。

核酸

本发明的方法使得能够仅从信息开始创建核酸，诸如基因、基因组和染色体，即本发明可以提供核酸而无需现有的核酸分子，诸如基因或基因组。

本发明的方法不特别限于要提供的核酸的类型。例如，核酸可以是脱氧核糖核酸(DNA)、核糖核酸(RNA)或异源(xeno)核酸(XNA)。

在一个实施方式中，核酸是DNA。在一个实施方式中，核酸是RNA。在一个实施方式中，核酸是XNA。异源核酸(XNA)是合成核酸，其为DNA和RNA的人工替代物。与DNA和RNA一样，XNA是一种存储信息的聚合物，然而XNA在糖磷酸骨架的结构上不同于DNA和RNA。到2011年，至少有6种合成糖已被用于产生能够存储和检索遗传信息的XNA骨架。骨架糖的取代使XNA在功能和结构上均类似于DNA和RNA。

如本文所用，术语“寡核苷酸”可以指短核酸聚合物，例如DNA、RNA或XNA核苷酸的聚合物。尽管对寡核苷酸的确切长度没有特别限制，但是寡核苷酸的长度可以是例如约4-200个核苷酸。

如本文所用，术语“多核苷酸”可以指较长的核酸聚合物，例如DNA、RNA或XNA核苷酸的聚合物。

如本文所用的术语“核苷酸”可以指这样的核苷酸，诸如DNA和RNA核苷酸，以及核苷酸类似物。

如本文所用的术语“杂交”是指相对核酸链的氢键键合，优选互补核苷或核苷酸碱基之间的沃森-克里克(Watson-Crick)氢键键合。

核苷酸各自包含核碱基。如本文所用的术语“核碱基”或“碱基”是指这样的含氮碱基，所述含氮碱基包括嘌呤和嘧啶，诸如DNA核碱基A、T、G和C；RNA核碱基A、U、C和G；以及非DNA/RNA核碱基，诸如5-甲基胞嘧啶(^MeC)、异胞嘧啶、假异胞嘧啶、5-溴尿嘧啶、5-丙炔尿嘧啶、5-丙炔-6-氟尿嘧啶、5-甲基噻唑尿嘧啶、6-氨基嘌呤、2-氨基嘌呤、肌苷、2,6-二氨基嘌呤、7-丙炔-7-脱氮杂嘌呤、7-丙炔-7-脱氮鸟嘌呤和2-氯-6-氨基嘌呤。

核酸可以是例如单链或双链的。

“有义”链(“正”链或“编码”链)具有与双链多核苷酸转录成的信使RNA相同的序列(除了任何典型的核碱基差异外，例如DNA与RNA之间的差异，T被U代替)。相对的“反义”链(“负”链或“反编码”链)在转录期间用作信使RNA的模板。因此，反义链负责可例如翻译成蛋白质的RNA，而有义链则具有与信使RNA几乎相同的组成。

互补性是影响两个单链核酸结合形成双链核酸的原理。这是两个核酸序列之间共享的性质，使得当它们彼此反向平行对准时，两个序列中彼此相对的核苷酸将全部互补以实现最佳结合。在分子水平上，互补性是通过特定碱基对之间的最佳氢键键合而确定的。例如，在DNA中，腺嘌呤与胸腺嘧啶互补，并且鸟嘌呤与胞嘧啶互补；并且在RNA中，腺嘌呤与尿嘧啶互补，并且鸟嘌呤与胞嘧啶互补。碱基的互补配对允许信息从一个分子拷贝到另一个分子，并且本质上从一代细胞拷贝到另一代细胞。在双链核酸的碱基对处缺乏互补性可以被称为“错配”。

双链核酸可以由相同长度的两条链组成，在这种情况下双链核酸的两个端部可以是平端的。

或者，双链核酸的一个或两个端部可以表现出单链核酸的悬突，例如如果一条链长于另一条链，或者如果两条链彼此偏移(此类悬突可以被称为“粘性端部”)。此类悬突可使得单链核酸或双链核酸能够与两个或更多个互补核酸结合，并且因此，出于相同的原因，双链核酸可借助于与悬突进行碱基配对而与一个或多个另外的单链或双链核酸结合，从而在相对的单链核酸之间产生重叠区。

这些概念仅以举例的方式在图1中说明，图1示出了由10个寡核苷酸组成的示例双链DNA。每条链由许多分开的寡核苷酸组成，所述许多分开的寡核苷酸在图中以不同的文本格式(纯文本、下划线、粗体和/或斜体)表示。顶部(有义)链由5个寡核苷酸(A1-A5)组成，底部(反义)链由5个寡核苷酸(B1-B5)组成。使有义链和反义链包含相同数目的寡核苷酸不是必需的。在该示例中，顶部链和底部链是互补的，并且例如寡核苷酸A2与寡核苷酸B3和B4重叠，具有与B3和B4中的每一者互补的区域。

解链温度(T_m)

核酸序列的解链温度(T_m)是50％的核酸及其补体呈双链体形式的温度。

核酸序列的解链温度可以凭经验确定。例如，可以在受温度控制的紫外分光光度计中将单链核酸及其补体引入细胞。然后可以将适当波长(例如260nm)下紫外线吸收率的变化作为温度的函数测量，这通常会产生具有两个平台期的S形曲线。然后可以将解链温度确定为解链曲线上为两个平台期之间的一半的点处的温度。

尽管经验手段可为确定解链温度的准确方法，但这些实验通常是耗时的。或者，可以使用为此目的而开发的许多公式中的任何一个来计算解链温度，并且技术人员将能够容易地选择合适的方法。

已经开发了许多公式，所述公式使得能够仅基于核酸序列的核苷酸含量来计算解链温度。举例来说，以下公式可用于计算核酸的解链温度：

T_m＝4×(G+C)+2×(A+T)

其中：G、C、A和T是每个核苷酸的出现次数。

用于计算核酸的解链温度的替代示例公式为：

其中：G、C、A和T是每个核苷酸的出现次数。

核苷酸含量以外的因素可能会影响溶液中核酸的解链温度，所述因素为诸如核酸链浓度、盐浓度和任何变性剂(诸如甲酰胺或DMSO)的浓度。考虑到此类因素，已经开发出了另外的公式。例如，包含盐浓度调节的以下公式可用于计算核酸的解链温度：

T_m＝4×(G+C)+2×(A+T)-16.6×log₁₀0.050+16.6×log₁₀[Na⁺]

其中：G、C、A和T是每个核苷酸的出现次数。

包括盐浓度调节的用于计算核酸解链温度的另一示例公式是：

其中：G、C、A和T是每个核苷酸的出现次数。

尽管这些示例公式涉及DNA碱基，但是相似的公式可同样适用于其他核酸，诸如RNA。

其他方法可以基于使用热力学计算来确定解链温度。通过观察解链温度，可以实验地确定核酸序列的相关热力学参数(ΔG、ΔH和ΔS)，反之亦然，当已知给定核酸序列的热力学参数时，可以预测所述序列的解链温度。

最近邻模型为确定给定核酸序列的热力学参数提供了一种准确的手段，因此可用于预测解链温度。该模型基于以下理解：不同链上碱基之间的相互作用也可取决于相邻碱基。例如，代替将核酸双链体视为碱基对之间的许多相互作用，最近邻模型将双链体视为“相邻”碱基对之间的许多相互作用。因此，凭经验确定的所有可能的最近邻相互作用的热力学基础集(例如，对于DNA，参见Breslauer,K.J.等人(1986)Proc.Natl.Acad.Sci.USA83:3746-3750；对于RNA，参见Freier,S.M.等人(1986)Proc.Natl.Acad.Sci.USA 83:9373-9377)可用来计算特定序列的热力学参数，并由此预测该序列的解链温度。

制备寡核苷酸

寡核苷酸可以例如使用溶液方法或固相方法制备。

寡核苷酸可以例如化学地(例如使用亚磷酰胺偶联化学品(Beaucage等人(1981)Tetrahedron Lett.22:1859；Beaucage等人(1992)Tetrahedron 48:2223-2311))或酶促地合成。

使用自动合成器能够实现高通量的寡核苷酸合成。

基于亚磷酰胺的寡核苷酸合成涉及通过与活化剂反应来活化核苷亚磷酰胺单体前体以形成活化的中间体，然后将活化的中间体顺序添加至生长中的寡核苷酸链以形成寡核苷酸产物。寡核苷酸链通常在一个端部锚定到合适的固体支撑物。

取决于后续纯化方法，可以保留或去除末端保护基团(例如5'-DMT)。然后可以在纯化之前从固体支撑物上切割寡核苷酸，通常通过用氢氧化铵处理，所述处理也可以用于去除碱和磷酸三酯保护基团。

示例性酶促方法包括本文所述的“不受控制的”偶联和“受控制的”偶联方法。

“不受控制”的方法可以使用聚合酶(诸如非模板依赖性聚合酶或核苷酸基转移酶)来添加期望的核苷酸以延伸现有的寡核苷酸。每个延伸步骤的产物是这样的寡核苷酸混合物，其中已添加了不同数量的核苷酸(即[起始寡核苷酸]+(n)个核苷酸，其中n＝0、1、2、3等)。然后可以从试剂和副产物中纯化期望的延伸产物。可以重复核苷酸转移酶孵育和寡核苷酸纯化步骤，直到达到最终的寡核苷酸为止。核苷酸转移酶的示例包括多核苷酸磷酸化酶(Shum等人(1978)Nucleic Acids Res.5:2297-2311)和末端脱氧核苷酸转移酶(Schott等人(1984)Eur.J.Biochem.143:613-620)。

“受控制的”方法是对上述方法的改进，其中在延伸步骤中使用的核苷酸试剂被封闭，以防止在酶促延伸步骤中添加多于一个核苷酸。该“受控制的”方法可能需要经工程化修饰的非模板依赖性聚合酶以能够掺入这些封闭的核苷酸。在延伸步骤之后，去除封闭基团以使得能够添加后续封闭的核苷酸。

从下面的示例描述中，本发明技术的其他方面、特征和优点将变得明显，所述描述将结合附图进行阅读，在所述附图中：

图1示出了被分割成单链片段的靶标DNA序列的示例(A＝SEQ ID NO:1)；

图2示出了合并和子合并；

图3是示出使用合并或子合并装配过程制备的各种长度的DNA序列所预期的无错误DNA的产率百分比的图；

图4是示出对于不同长度的DNA分子，每分子的累积错误概率的图；

图5是示出当可以容许一定的最大错误率时，使用合并的或子合并的装配过程制备的DNA的产率百分比如何与DNA长度成比例的图；

图6至图8比较了合并的、顺序的和二元装配过程，并显示出在二元装配过程中，在馈入给定杂交步骤的成对较早杂交步骤二者都涉及错误检测的情况下，怎样能够提高产率；

图9示出了使用二元装配过程的杂交步骤树的示例，其中至少一个另外的杂交步骤组合了成对错误检测杂交步骤的产物；

图10和图11示出了能够在其上进行二元装配过程的设备的示例；

图12示出了执行错误检测类型的杂交步骤的方法；

图13A至图13F示意性地示出了使用带有错误检测的二元装配过程来执行杂交树的工作示例；

图14A和图14B示出了在连续的杂交步骤之间如何切换靶标双链核酸分子的哪条链结合至反应位点的表面以防止在先前杂交步骤中检测到的错误片段在下一杂交步骤中与无错误片段杂交；

图15是示出对于错误检测操作的多种不同错误检测率，用二元装配过程生成的无错误DNA的产率百分比如何与长度成比例的图表；

图16是显示与使用合并方法或子合并方法实现的产率相比，在二元装配过程中实现的产率的相对提高的图表；

图17示出了用于实现二元装配过程的替代技术；

图18示出了四个片段在三个重叠区处杂交的示例(完整序列，SEQ ID NO:2；s1，SEQ ID NO:3；a1，SEQ ID NO:4；s2，SEQ ID NO:5；a2，SEQ ID NO:6)；

图19是示出图18的三个重叠区的螺旋度百分比(当加热到给定温度时保持完整的DNA分子中键的百分比)如何与温度成比例的图表。

图20是这样的图表，其示出了，对于三个重叠区中的每一个，并考虑在该重叠区内包含单个碱基错误的所有可能的错误双链片段，相对于无错误双链片段的预期解链温度差值将小于给定温度差值的那些错误双链片段的百分比；

图21是这样的图表，其示出了，对于三个重叠区，当使用比“良好”片段中重叠区的预期解链温度低0.5℃的温度裕度检测到错误时，在重叠区中具有至少一个碱基错误的所有可能的错误片段中，“差”与“良好”片段剔除比率的累积分布；

图22是示出三个重叠区的所有可能的错误片段的平均剔除比率如何随温度分辨率变化的图表；以及

图23是示出示例性DNA序列的所有可能分割的三个重叠中的平均单碱基错配浓度比的累积分布的图表。

在后续示例中，为简洁起见，将DNA被用作双链核酸的示例。应当理解的是，该技术也可以用于装配其他类型的双链核酸，诸如RNA或XNA(异源核酸，天然核酸DNA和RNA的一种合成替代物)。

下文描述的技术提供了一种从许多较短的寡核苷酸装配DNA序列的方法，与其他装配技术相比，所述方法能够导致DNA或基因无错误序列的更高产率。在基于合并或子合并的方法中，在合成寡核苷酸中偶尔出现的错误会在整个装配过程中随机累积，并随着序列长度的增加而大大降低无错误双链DNA的产率。结果是需要昂贵且费时的技术(诸如克隆和错误校正)以在最终装配之前获得无错误序列。本文所述的方法避免了该问题，从而通过在分段(staged)且受控的杂交过程的至少一个中间点中检测并去除错误片段来容许有限的错误率。防止了在后续的杂交步骤中具有序列错误的寡核苷酸稀释无错误双链DNA的池。提供了对将某些片段放在一起的时机的控制，从而使得寡核苷酸和DNA片段能够以特定次序组合，并且提供了一种用于在杂交期间检测和去除错误序列的方法。益处与序列长度成比例地增长，从而使得能够在不需要外部纯化技术的情况下以精简且集成的过程从头合成长DNA片段。

图1示意性地示出了DNA序列的示例，该DNA序列由具有碱基A、G、C、T的两条互补链A、B形成，使得一条链中的每个碱基A、T、G、C都在另一条链中具有互补碱基T、A、C、G。一条链A对应于有义(5'至3'方向)链，并且另一链B对应于反义(3'至5'方向)链。每条链被分割成许多部分重叠的单链片段A1-A5和B1-B5。除了每条链端部之一处的片段A1、A5、B1、B5外，中间片段A2-A4和B2-B4均跨越另一条链的两个不同片段(例如，链B的片段B3跨越链A的片段A2和A3的部分)。给定的成对的部分重叠片段(所述部分重叠片段来自每条链)重叠的区域被称为重叠区。例如，在该示例中片段A3与B2之间的重叠区对应于片段A3中的碱基5'-GCTC-3'和片段B2中的互补碱基3'-CGAG-5'。

合成的DNA通常在被称为合并的过程中由许多较短的寡核苷酸装配而成，所述合并是一种需要重叠区中的独特序列来确保正确杂交的策略。图2的顶部部分示出了合并装配方法，其中一旦所有的单链片段A1-A5和B1-B5已形成，就将它们放置在共用容器中。通过选择相应链中将链A、B分割为片段，使得每个重叠区与其他重叠区相比具有独特序列的位置，则当将片段都放置在容器中时，每个片段将与具有互补重叠区的其他正确片段杂交，例如片段A3将在一个端部与B3杂交，并在另一端部与B2杂交。每个重叠区杂交的相对次序是随机且不受控制的—例如，A3的一些实例将在B2之前与B3杂交，而A3的其他实例将在B3之前与B2杂交。

作为可能的独特序列的数目，n随着重叠长度(l)以指数方式增加，N＝4^l，一旦重叠超过一定值(20至30个碱基对是共同的—为简明起见，图1中示出了3-5个碱基的较短重叠)，则序列能够是几乎独特的。然而，该情况由于高度重复序列的存在而复杂化，这大大减少了可能的组合的数量，或者富含GC或AT的区域(GC键比AT更强，因此错配的富含GC的序列很可能如正确匹配的序列那样进行键合)的数量。出于该原因，通常的做法是在子池(sub-pool)中进行装配，以减少错误杂交的机会。图2的下部部分说明了如何通过将整体靶标DNA分子的不同片段子集最初放置在不同容器中，以防止一个子集中的片段与另一子集中的片段杂交，这可以允许即使当与另一DNA分子中的重叠区序列相比，DNA分子的一部分中的重叠区序列不再独特时，也能够形成较长的DNA分子。一旦每个子池已经杂交后，就能够将所得的部分DNA片段放在一起，以进一步杂交形成整体DNA分子。

基于合并或子合并的方法共有的缺点是：只有在整个池或子池已经杂交后才可以检测或校正错误。在发生任何杂交之前，可以对最初形成的单链片段A1-A5、B1-B5应用一些错误检测技术(例如，使用酶)，但这可能是缓慢且昂贵的，并且可能仍然允许未被检测到的显著错误率。因此，在合成的寡核苷酸中偶然的错误(截短、缺失、插入或误掺入)在整个杂交过程中随机积累，并随着装配的DNA片段长度的增加而大大降低无错误DNA的产率。如果错误率，或在任何碱基位置中的错误的独立概率，是P_e，则无错误DNA的产率Y不能超过在n次试验中错误零发生的概率，Y≤(1-P_e)ⁿ，这在图3中针对几种不同的错误率图解地示出。

此限制仅取决于所产生的DNA的长度，而不取决于用于装配该DNA的寡核苷酸的长度，或子合并步骤的数量(子合并仅降低了由于一个片段的重叠区与所述第一片段不应与之杂交的不正确片段的重叠区相匹配而导致的误杂交的概率，但是并没有降低初始批次的单链片段中的掺入错误对产率的影响)。出于该原因，目前不实际的是直接使用亚磷酰胺化学法合成大于几千个碱基的片段，其中错误率为约1/200。从图3还应明显看出，寡核苷酸合成中掺入错误率的非常显著的降低对于实现DNA长度的适度增加将是必要的。替代地，在后续装配以形成更大的片段之前，通过克隆和测序从子池中选择无错误片段，后续装配以形成更大的片段是昂贵且费时的过程。

然而，并非总是必须具有完全无错误的DNA，其中某些应用能够容忍某些给定的错误率。长度为n的已装配DNA群体中错误数m的概率密度为二项式，并由下式给出：

每个DNA分子的预期错误值为E(n)＝n(l-P_e)。累积分布

可用于计算错误数将低于任意数字m的概率。对于大的DNA分子群体，这是具有m个或更少错误的分子的分数，或者是针对给定最大错误数的产率。图4示出了针对不同DNA长度，在假设掺入错误以1/200的错误率发生时，每分子的错误累积概率。如从图4能够看出，随着DNA的长度相对于错误率增加，大多数DNA分子将具有预期的错误数，并且非常少的分子将具有比预期更少的错误(因为与DNA长度为100相比，DNA长度为3000的累积概率线的梯度要陡峭得多，这表明预期从分子到分子存在较小的错误数变化—大多数长度为3000的分子具有的错误核苷酸为约0.05％，即1/200)。因此，可以针对任意期望的目标错误率(每个分子中错误核苷酸的分数)构建与图3中所示的无错误产率极限相似的图表，但是如果期望的准确度超过了基本误差率(1-P_e)所建议的准确度，则这些图表将总是显示出产率随着DNA长度而指数下降。一个示例在图5的图表中示出。假设初始批次的片段中掺入错误的发生率是1/200，则图5示出了使用合并或子合并技术制备的小于目标DNA错误率(1个分子中错误核苷酸的分数)的DNA分子的百分比如何随DNA长度成比例，例如两个目标DNA比率分别为1/1000和1/500。能够看出，即使当允许每个DNA分子有高达1/500分数的核苷酸为错误的，随着长度的增长，满足目标DNA错误率的DNA的产率仍然较低，并且随着长度的增加而迅速下降。

图6至图8示出了多种替代装配方法，以说明所获得的无错误产率的差异。图6示出了上面讨论的简单合并或子合并方法。图7示出了顺序装配方法。图8示出了二元装配方法。为了易于理解，这些图显示了仅四个标记为A1、B1、A2、B2的DNA片段的杂交，其中重叠区使得所述片段杂交形成序列A1-B1-A2-B2，其中重叠分别在A1/B1、B1/A2和A2/B2之间。为了使无错误产率的比较更加明显，假设初始单链片段A1-B2的掺入(合成)错误率是人为高达50％，即每批片段A1、B1、A2和B2中的50％是错误的，因为它们包含至少一个不正确的碱基(无论是由于误掺入、截短、缺失还是插入)。显然，在实践中可能会出现更低的掺入错误率，但是即使实际的掺入错误率较低，图8的二元装配方法仍将导致与替代方法相比较高的产率。在图6至图8所示的每个框中，阴影线区域显示了在该杂交阶段剩余的“良好”片段的产率百分比，该产率百分比表示“良好”无错误片段相对于每个初始片段A1、B1、A2、B2的实例数的分数。也就是说，如果提供了每个初始片段的N个实例，并且在稍后的杂交阶段中“良好”杂交片段的实例数为G，则产率对应于G/N。

图6示出了应用合并方法的示例，其中将所有片段简单地放置在共用容器中并允许在匹配的重叠区处进行杂交。由于四个初始批次的片段均具有50％的错误片段，并且杂交序列不受控制，因此杂交完成后剩余的装配序列的无错误实例A1-B1-A2-B2的产率为0.5*0.5*0.5*0.5＝0.0625，即四舍五入到最接近的整数，则无错误产率为6％。即使使用子池，这仍将导致两个单独的子池A1/B1和A2/B2，从而产生25％的产率(0.5*0.5)，然后这两个子池之间的杂交将导致一个子池中的“良好”片段的四分之一与来自另一个子池中的“良好”片段配对，即无错误产率仍将为0.25*0.25＝0.0625，即再次为6％。

为了进行比较，图7示出了顺序装配过程的示例，其中首先使成对单链片段A1、B1杂交，在该杂交之后检测并丢弃错误杂交片段，然后使剩余的无错误片段A1-B1与下一单链片段A2杂交。再次，检测并丢弃错误片段，然后将剩余的无错误片段A1-B1-A2与最终的单链片段B2杂交。可能有人认为，每次杂交后消除错误片段将有助于提高产率。然而，由于在每次连续的顺序杂交中加入的单链片段仍然含有50％的错误片段，所以从先前杂交步骤产生的无错误片段中的一半在下一杂交步骤中与错误片段配对，并且结果是相对于初始材料的量，无错误片段的产率仍然与图6中相同。在每个杂交步骤中错误片段的消除仅实现了最终杂交步骤中仍然存在的错误片段的量的减少(在图7中，相对于初始材料的产率为6％现在表示剩余片段的50％，而不是如图6中的剩余片段的6％)。但是，对于给定量的输入材料，所制备的有用材料的量不大于图6中的量。

图8示出了具有错误检测的二元装配过程，其中另外的杂交步骤H_F使成对的较早杂交步骤H_E的直接产物杂交，该成对的较早杂交步骤二者都是错误检测杂交步骤，所述错误检测杂交步骤包括以下步骤：检测在杂交步骤中形成的错误片段，以及丢弃每个检测到的错误片段的部分，使得所述部分从后续的另外杂交步骤H_F中被排除。因此，尽管较早杂交步骤H_E中的每一个仍产生相对于所提供的初始材料的量25％(0.5*0.5)的有用产率，但75％的错误片段被检测到并丢弃，留下了纯化的“良好”片段群体，所述纯化的“良好”片段群体随后在另外的杂交步骤H_F中杂交在一起。由于没有错误片段剩余，因此另外的杂交步骤H_F不会再进一步降低产率，因为所有的“良好”片段都与其他“良好”片段配对。因此，在另外的杂交步骤H_F结束时所得的产率仍为25％，相对于图6或图7中的6％明显提高。当然，实际上合成错误率不太可能高达50％，在较早杂交步骤H_E之后执行的错误检测操作在检测错误片段方面可能不是100％准确的，并且可能存在导致“良好”片段损失的其他损失机制，但是如下所述，即使错误检测率较低并且存在一些附加的损失，随着合成的DNA的总长度变得越来越长，图8所示的方法相对于图6或图7的相对改进变得越来越大。

图6至图8示出了一个示例，其中四个片段经杂交以形成靶标DNA分子，但是如图9所示，可以按顺序执行进一步的杂交以形成杂交树。作为杂交序列的源材料提供的初始片段可以是已经由单链片段部分杂交的双链片段，或更常见的可以是单链片段，使得初始杂交步骤是首次产生DNA的部分重叠的双链片段。在该示例中，初始片段是单链片段A1、B4、A2等(如图1所示)。杂交树包括多个初始杂交步骤H₁-H₄，所述多个初始杂交步骤H₁-H₄使被提供为杂交过程源材料的相应成对初始片段杂交；以及多个另外的杂交步骤H₅、H₆、H₇，所述多个另外的杂交步骤H₅、H₆、H₇使在较早杂交步骤(所述较早杂交步骤可以是初始杂交步骤或稍后的杂交步骤)中生成的成对片段杂交。如果初始片段的数目是2的精确幂(exactpower)(例如，如果仅提供了片段A1-A4和B1-B4)，则杂交树会形成完整的二元树，如图9中的步骤H₁至H₇中所示。如果初始片段的数目不是2的幂(例如，如果存在如图9的虚线所示的附加片段A5)，则可能还需要一些附加的杂交步骤来使较早杂交步骤的结果与尚未进行杂交的初始片段杂交。类似地，为简明起见，B5与A1的杂交可能需要图9中未示出的附加杂交步骤。

每个杂交步骤H对应于靶标DNA序列的特定重叠区，并使在该特定重叠区处的一对或多对相应片段杂交。例如，在该示例中的初始杂交步骤H₂对应于单链片段A2与B3之间的重叠，并且在该示例中的另外杂交步骤H₇对应于单链片段B3-A3之间的重叠，并且使一对或多对相应的由较早杂交H₅产生的片段A1-B4-A2-B3和由较早杂交H₆产生的片段A3-B2-A4-B1杂交。每个杂交步骤可以对相应批次的每个对应成对片段重复多次，以形成对应批次的杂交片段。

另外的杂交步骤H₅-H₇中的任一者都可对应于图8中所示的另外的杂交步骤H_F，使得馈入该杂交步骤的两个较早杂交步骤H_E都包含错误检测操作。在图9的示例中，杂交步骤H₁和H₂是错误检测操作，使得在下一杂交步骤H₅中产生的双链片段B4-A2的产率能够由于参照图8解释的原因而得到提高。同样，如果H₃和H₄是错误检测类型的杂交，则能够提高在后续步骤H₆中产生的产率(对后续步骤中的产率有撞击效应)，并且如果H₅和H₆是错误检测类型的杂交步骤，则能够提高在H₇中产生的产率。

如果每个杂交步骤均为错误检测类型，则产率能够是最高的。这是因为以下描述的错误检测机制可能仅能够检测在对应的杂交步骤中杂交的重叠区中的错误，使得在每个杂交处都需要错误检测操作，以便使能够检测到错误的区域扩展到被装配的靶标DNA分子的整个序列。但是，并非每次杂交都必须是错误检测类型的-可以省略一些错误检测操作以节省时间并提高处理速度，因为在该情况下，杂交树的多个级别可以合并在单个位点处。

应当理解的是，图9仅示出了杂交的相对排序，而未示出绝对时机。也就是说，排序使得杂交H₁和H₂需要在能够执行另外的杂交H₅或H₇之前完成，因为H₅或H₇都依赖于H₁和H₂的结果。然而，由于H₃、H₄和H₆独立于H₅，所以在H₅之前或之后执行H₃、H₄和H₆都没有关系。虽然如果并行执行树的给定级别处的所有杂交步骤，则过程可最快，但这不是必需的，并且可以灵活地更改独立杂交之间的相对时机。

可以执行针对每个错误检测类型的杂交步骤执行的错误检测操作，而无需将杂交步骤的结果输出给宿主进行克隆和测序。替代地，对在错误检测类型的杂交步骤中形成的杂交片段执行错误检测操作，并且将在错误检测操作中未丢弃的剩余片段直接转移到下一杂交步骤，使得下一杂交步骤作用于通过先前杂交步骤产生的直接产物(相同分子)上，而不是在先前杂交步骤中产生的分子的克隆拷贝上。因此，该过程能够比涉及克隆的过程快得多。需要注意的是，可以对在先前杂交步骤中产生的分子执行操作(诸如连接)，然后执行下一杂交步骤，其中此类操作仅修改现有分子，而不是生成全新的分子—此类中介操作的结果仍被认为是先前杂交步骤的直接产物，因为另外的杂交是对在先前杂交步骤中生成的物理上相同的分子执行的。

图10和图11示出了可在其上执行上述二元装配过程的装置2。为简洁起见，未示出用于创建电阱或磁阱的任何机构，但仍可以提供所述机构。如图10所示，提供了流体流动元件(例如泵)以控制流体穿过流体流动路径4跨越装置2的顶部的流动。在跨越温度控制装置2的平面的各个位置处提供了多个反应位点(主动热位点)6。每个反应位点6的顶部可包括反应表面(例如金盖)，在所述反应表面上可发生单链核酸片段的生长或杂交步骤。每个反应位点6对应于水平表面的部分，使得在相邻反应位点6之间没有物理屏障。每个反应位点6具有设置在反应位点表面下方的加热元件7，以对流过该位点的流体的对应部分施加热量，以控制该流体的温度以执行错误检测。如图11所示，反应位点6以二维矩阵(网格)布置，以两行或更多行(泳道)9布置，其中泳道/行方向平行于流体穿过流体流动路径4流动的方向。位于主动热位点6之间的区域形成一个或多个被动热区域8，所述被动热区域8不包括任何加热元件，而是通过将热量从流体朝向装置2的基材10传导而提供被动冷却。在行方向上的每个主动热位点6的长度x长于位于同一行中的成对相邻的主动热位点6之间的每个被动热区域8的长度y。在垂直于基材的方向上在每个主动热位点6下方提供的材料的热阻可以大于在垂直于基材的方向上在每个被动热区域8下方提供的材料热阻。如图10所示，可以提供冷却机构12来冷却基材10以用作散热器。

替代地，不是使用主动区域6和被动区域8通过在主动位点处进行主动加热和在冷却位点处被动冷却至散热器10来控制温度，而是反应位点的阵列可以使用单个热-电冷却元件来控制它们的温度，所述单个热-电冷却元件根据供应给热-电冷却元件的控制电流，使用珀尔帖效应(Peltier effect)将热量传递到所述反应位点或从所述反应位点传递热量(例如，可以使用WO 2017/006119 A2的控制系统)。

在使用中，待杂交在一起的寡核苷酸或其他初始片段可以在装置2的给定泳道的相应反应位点6上生长，或者可以在于其他地方形成后锚定到反应位点6上。每个反应位点6锚定具有相同序列，但在不同位点6处具有不同序列的许多寡核苷酸。各组寡核苷酸可以独立地从反应位点释放，并经运输以与它们的邻居成对杂交。寡核苷酸中的错误能够通过检验这些杂交的重叠区的结合强度来检测，随后去除错误的寡核苷酸。然后重复该过程以接合成对的所得片段，在每个成对的杂交步骤中延长片段的长度。在每次杂交时反转互补重叠序列的方向，使得每个核苷酸均作为从底物释放的单链或双链片段的部分进行检验，并且错误片段能够被去除，而不会在后续步骤中与“良好”片段杂交。可以将热控制用作检验杂交键强度的机制，其中通过流动去除错误片段。

在每次成对杂交后去除错误片段的结果是，防止这些错误稀释无错误片段的池，从而随着长度的增加而大大提高了无错误DNA的产率。通过该过程，无错误DNA的产率不再随长度而急剧下降，而是替代地遵循更渐进的下降，所述更渐进的下降取决于错误检测效率和细节(诸如运输损失和杂交效率)。因此，对于长序列，能够获得无错误DNA的产率的非常显著的提高，这是相对于任何随DNA长度增加的现有技术的改进。

图12示出了流程图，说明了执行错误检测类型的杂交步骤(例如，其可以是图9中所示的任何杂交步骤)的方法。在步骤20处，对在与特定杂交步骤的重叠区对应的相关重叠区处重叠的对应成对片段执行多次杂交，以形成在该重叠区处结合的多个杂交片段。由于在与该杂交步骤中杂交的重叠区相对应的位置处的初始片段中的一个中存在掺入错误，杂交片段中的一些可能是错误的。

步骤22和24表示在给定反应位点处执行的错误检测类型的杂交步骤中执行的错误检测操作。在步骤22中，将给定反应位点的温度控制为设定的温度，所述设定的温度是低于在重叠区内不包含碱基错误的无错误杂交片段的对应杂交步骤中形成的重叠区的预期解链温度的裕度(应注意的是，无错误杂交片段在所述序列的在该重叠区之外的其他部分中仍可具有碱基错误，所述碱基错误在该特定错误检测步骤中未进行检验)。要用于给定反应位点的特定温度能够通过针对每个杂交步骤，使用对重叠区中不同碱基序列的预期解链温度的计算机模拟和通过将温度设定为特定水平而被剔除的“差”片段与“良好”片段的比率来确定，这将在下面更详细地讨论。通过将温度设置为低于预期解链温度的裕度，与在重叠区中具有完全匹配的碱基序列的“良好”片段相比，在重叠区中具有至少一个碱基错误的错误片段更有可能解离。在步骤24中，将流体在反应位点处的杂交片段上洗涤，以洗去片段的在所述片段的“未结合”或“松散”链(该链不是直接固定至反应位点的表面)上的部分。由于错误片段比“良好”片段更有可能通过温度调节步骤来弱化其键，因此更多的错误片段会被丢弃在流动的流体中，而其余的片段仍固定在表面上。每个错误片段的结合的一半保持固定至表面，但是当结合的片段随后在步骤28中被释放时，在连续的杂交步骤之间哪条链结合到所述表面的交替阻止了这些孤独的片段在后续步骤中的杂交。

在步骤26中，执行连接步骤，其中在将错误片段的未结合部分洗去之后，将剩余片段暴露于连接酶，所述连接酶接合同一条链的相邻单链片段之间的糖-磷酸骨架。如果杂交步骤是对两个单链片段执行的初始杂交步骤，则可以省略连接步骤。例如，在图9中所示的杂交步骤H5中，在步骤20中重叠区B4-A2的杂交和在步骤22、24中检测/丢弃错误片段之后，连接步骤26可以连接链A的片段A1与片段A2之间以及链B的片段B3与B4之间的糖-磷酸骨架，以便即使后续加热到高于或加热至B4与A2之间的重叠区的解链温度，也能够防止杂交片段解离。

在步骤28中，将剩余片段从给定的反应位点释放。释放机制可以通过将片段经由可切割的接头物质附接到反应位点来提供，所述可切割的接头物质可以通过将所述接头物质暴露于另一种切割物质或通过加热至给定温度而被切割。或者，释放可以通过酶(例如以上给出的示例)活化。可切割的接头物质的示例包括具有与核苷酸部分结合的琥珀酸酯部分的化学组合物，使得切割产生3'羟基核苷酸。更特别地，可切割的接头可以是5'-二甲氧基三苯甲基-胸苷-3'-琥珀酸酯、4-N-苯甲酰基-5'-二甲氧基三苯甲基-脱氧胞苷-3'-琥珀酸酯、1-N-苯甲酰基-5'-二甲氧基三苯甲基-脱氧腺苷-3'-琥珀酸酯、2-N-异丁酰基-5'-二甲氧基三苯甲基-脱氧鸟苷-3'-琥珀酸酯中的一者，或它们的组合。在一些实施方式中，除了为主要运输流体本身提供的流动通道之外，供应通道网络可以设置有控制阀，以允许选择性地将试剂或酶供应至特定的反应位点，以允许片段从特定位点靶向释放。或者，可以使用温度失活的接头，使得通过将对应位点的温度调节至释放温度来触发片段从给定反应位点的释放。例如，可以使用在给定温度下变得有活性的酶，并且可以仅将要释放片段的所需位点加热至酶的活化温度。无论使用哪种特定的释放机制，对于形成靶标核酸的最终杂交步骤以外的所有步骤，从给定反应位点释放的片段都将随后在由流体流动路径4提供的流动流体中运输至将进行后续杂交的下一个反应位点。可以使用电阱或磁阱来使互补片段彼此靠近(即使它们在分离释放期间由于温度升高而解链以活化切割机制)，并帮助从一个反应位点运输到另一个反应位点。也就是说，在将温度升高至将片段与给定反应位点分离所需的温度之前，可以活化给定反应位点的阱，然后一旦在阱仍保持活性时已释放出了片段就再次降低温度，然后一旦温度已降低就使阱失活。这意味着即使附着机制的释放温度高于一些片段的解链温度，这些片段也会通过阱保持在一起，直到温度再次降低，然后可以重新退火，然后将阱释放以将片段运输到下一个位点。可以使用用磁场或电场来操纵或捕获核酸片段的任何已知方法(例如，使用静电阱、电泳阱或介电泳阱)。

图13A至图13F示出了作用于将8个单链片段A1-A4和B1-B4杂交在一起的简化示例的二元装配过程，所述8个单链片段旨在以图1所示的方式杂交在一起(为简明起见，A5和B5的杂交步骤以及阱的任何使用均未示出)。应当理解的是，图13A至13F所示的步骤可以形成较大的杂交树的一部分，以形成较长的DNA分子。为了便于理解，每个初始单链片段A1-A4和B1-B4在图13A至13F中被示出为具有相同的长度(箭头指向5'-至-3'方向)，但实际上如图1所示，不同的片段可具有不同数目的碱基。在该示例中每个初始批次的给定类型的初始片段均包含该片段的3个实例—显然在实践中每个位点上提供每个片段的更多实例。错误核苷酸的位置在图13A中用叉号标记。当然，插入、缺失或截短错误实际上可能导致同一片段内的多个错误核苷酸，但为简明起见，该示例的每个错误均被假定为误掺入错误，在所述误掺入错误中仅单个核苷酸被错误地替换为替代核苷酸。

如图13A所示，初始片段或者在对应的反应位点上原位合成，或者在于其他地方合成后施加到所述反应位点，并经由可切割的接头机制结合至每个位点。片段的初始布置经选择为使得该过程以不同反应位点上的交替有义(A)片段和反义(B)片段开始。该模式以第一位点上的有义(A)和第二位点上的反义(B)开始。对于位点数量的每次加倍，在右边添加的新位点是左边现有位点的补体(即A->B、B->A)。因此，前几个模式是：AB、ABBA、ABBABAAB、ABBABAABBAABABBA、ABBABAABBAABABBABAABABBAABBABAAB等。应注意，在这种模式下可以交换有义和反义。该模式遵循Thue-Morse序列的至少部分。在Thue-Morse序列中，如果n的二元表示中1的数目为奇数，则该序列的第n个元素t_n为1；并且如果n的二元表示中1的数目为偶数，则该序列的第n个元素t_n为0。因此，n＝0至15的前16个元素应为0110100110010110。Thue-Morse序列的1和0可以分别映射至A和B(有义和反义)，或反之亦然，因此0可以映射至A和B中的一者，而1可以映射到A和B中的另一者。如果初始片段的数量不是2的精确幂，则针对2的下一最高幂的Thue-Morse序列可以被截短为适当的长度(通过去除序列的初始部分或通过去除序列的最终部分)。对于图13A的特定示例，有8个位点，因此使用模式ABBABAAB，使得位点0至7分别包含片段A2、B3、B4、A1、B2、A3、A4、B1(当然BAABABBA也可以已使用-例如可以将次序A2...B1逆转以得到B1...A2)。总之，可以为一系列反应位点分配有义片段(经由有义链与反应位点结合)和反义片段(经由反义链与反应位点结合)，使得给定反应位点是分配有义片段还是反义片段的指示序列对应于Thue-Morse序列的部分。

在其中片段在对应的反应位点上原位生长的实现方式中，不管在给定位点处提供的片段是对应于有义(A)片段还是反义(B)片段，所述片段均以相同方向生长。在图13A的示例中，片段以5'至3'方向生长(如向上的箭头所示)，其中5'端最靠近表面。在其他示例中，片段可以以3'至5'方向生长，且3'端最靠近表面。使用哪个方向取决于是使用亚磷酰胺化学手段还是酶促手段来使片段生长。无论片段以哪个方向生长，每个片段中碱基的次序都选择为与装配成最终靶标核酸分子时对应片段将出现的方向一致。

应注意，图13A至图13F所示的示例基本上对应于图9的示例，但是由于未提供片段A5而忽略了虚线。因此，图13B、图13D和图13F中所示的标记H₁至H₇是指图9的对应杂交步骤。在该示例中，假设每个杂交步骤都是错误检测类型的杂交步骤。

如图13B所示，为了执行初始杂交步骤H₁-H₄，例如通过加热至接头机制的释放温度，或通过将切割酶或化学物质引导至所需位点(例如，使用上述供应通道)，来分别从位点0、2、4和6释放片段A2、B4、B2、A4。在位点1、3、5和7处的片段保持与反应位点结合。流动流体将释放的片段从偶数编号的位点运输到随后的奇数编号的位点，其中重叠区中互补的碱基序列导致在对应重叠区处的杂交。如有必要，可以使用通过电场或磁场控制的或使用选择性引入的物理屏障的屏障机制来阻止释放的片段超过靶反应位点的进程，以阻止释放的片段在它们能够杂交之前越过下一个反应位点。杂交步骤H₂、H₁、H₃和H₄分别在位点1、3、5和7处执行，以形成对应的双链片段，所述对应的双链片段片段仍具有粘性端，其中该片段的一条链上的重叠区延伸超越另一条链的端部。

图13C示出了针对初始杂交步骤H₁-H₄执行的错误检测步骤。将位点1、3、5、7的温度设置为低于在该位点杂交的重叠区的预期解链温度T_m的裕度(Δ)。例如，对于位点1，相关的重叠区位于片段B3与A2之间，因此将温度设置为T_m(B3A2)-Δ。在一些实施方式中，不仅可以针对每个位点定制选择解链温度，而且可以定制选择裕度Δ，以最大化通过错误检测被剔除的“差”片段相对于“良好”片段的分数。通过加热到刚刚低于“良好”片段中重叠区的预期解链温度，在重叠区中具有错误碱基的错误片段比碱基在重叠区中完全匹配的“良好”片段更有可能被分开。流动流体洗去了错误片段的分开的松散部分。例如，在位点1处，一个松散的A2片段具有错误，因此它在该反应位点处与结合的片段B3分开并被洗去，留下B3作为孤独片段，所述孤独片段没有配偶体(partner)，但仍与反应位点结合。在其他情况下，错误可能在已结合的片段上，因此即使“良好”的松散片段不包含错误，其也可能被丢弃(尽管如此，还是期望丢弃“良好”的松散片段以防止错误片段在后续杂交步骤中与其他片段杂交)。应注意的是，在于当前杂交步骤中杂交的重叠区中没有错误的剩余杂交片段中，重叠区之外的片段其他部分中仍可能存在错误(例如，参见位点3处的一个片段和位点7处的一个片段—这些错误可以在稍后的杂交步骤中被检测到)。对于图13B和图13C中所示的初始杂交步骤，不需要上述连接步骤，因为杂交是在成对的单链片段上执行的。

如图13D所示，位点1和5处的片段被释放并在流动流体中运输到接下来的反应位点(在此示例中为位点3和7)。在位点3和7处执行的杂交分别对应于图9的杂交步骤H₅和H₆。从位点1和5释放的“良好”片段能够与在位点3和7处提供的片段杂交，因为它们具有匹配的重叠区(例如，对于对应于杂交步骤H₅的位点3，重叠在B4与A2之间)。然而，在先前错误检测步骤中被检测为错误的任何孤独片段，虽然与“良好”片段一起被运输，但是不会在下一位点处找到配偶体，因为它们没有可与在下一位点处暴露的重叠区杂交的重叠区。例如，在位点1处孤独的片段B3无法与位点3处的A1-B4片段杂交，因为需要被洗去的片段A2在B3与B4之间进行桥接(见图1)。因此，孤独片段不能进行杂交。如位点3和7处所示，这些位点处的一些“良好”片段本身可能变得孤独，这是因为没有足够的“良好”配偶体可以与其进行杂交，而不是因为它们本身包含错误。

如图13E所示，执行另一个错误检测步骤作为杂交步骤H₅和H₆的部分，其中将位点3和7加热到低于“良好”片段中的对应重叠区的预期解链温度的裕度。在该特定示例中，错误碱基的随机位置使得在这些杂交步骤中结合的重叠区不包含任何错误，因此没有片段被丢弃，但是在其他情况下，在该阶段可检测到一些错误。在错误检测之后执行连接，以在图13E中用圆圈指示的位置处连接在对应杂交步骤中接合的片段的骨架。有效地，连接的骨架是指图13E之后的所得片段是长度比在步骤图13D中杂交的较短片段更长的双链片段。

如图13F中所示，然后释放来自位点3的片段，以在杂交步骤H₇中与位点7处的片段杂交。在该杂交步骤之后，将位点7的温度加热至T_m(B3A3)-Δ，以执行与先前错误检测操作相似的另一错误检测操作，以检测在杂交步骤H₇中杂交的重叠区A3-B3中的错误。应注意，由于图13F中用圆圈标识的位置处的核酸的骨架被预先连接，与温度T_m(B3A3)-Δ相比，为了弱化错误片段中A3与B3之间重叠区处的键，需要高得多的温度才能使沿着核酸的具有连续的连接骨架的部分的相应链解离(即，与使A1-B4-A2-B3与A3-B2-A4-B1分开相比，相对较难使A1-A2与B4-B3分开，并且相对较难使B1-B2与A3-A4分开)，因此先前杂交的重叠区不会在其他重叠区处执行的另外杂交步骤中解离。

如果图13A至图13F中所示的杂交形成较大的杂交树的部分，则可以使用杂交步骤H₇的结果，通过每次根据需要重复图13B/13C所示的步骤来执行后续杂交步骤。应注意，将在此类另外的杂交步骤中检测到留在图13F所示的片段中的一个中的A1和B1中的错误(即使A1内的错误会在下一杂交步骤中由于从杂交步骤到杂交步骤的定向翻转而附着到结合的片段上，A1中的错误会导致A1与其重叠匹配A1的下一片段之间的重叠区中的错配，因此在下一杂交步骤之后执行的错误检测会导致其他片段被洗去，留下含有A1的错误形式的片段成为孤独的，使得所述片段不会在下一杂交步骤之后参与后续杂交)。

另一方面，如果杂交步骤H₇实际上是树的最终杂交步骤，则由该杂交步骤H₇产生的片段将不会具有粘性端(相反，片段B4、A4将更长以分别延伸至片段A1、B1的端部)，因此在这种情况下，图13F中位点7处所示的片段的粘性端中的错误实际上已经在杂交步骤H₁和H₄期间执行的较早错误检测操作中被检测到，因为在这些步骤中检验的重叠区将延伸到该片段的端部。

在图13B的示例中，所有四个杂交步骤H₁-H₄并行执行，但是也可以顺序地执行它们。同样，例如可以在H₃或H₄之前执行杂交步骤H₅。因此，各步骤的相对时机并不重要。尽管如此，通过并行执行杂交树的每个级别，该过程可更快。

尽管在图13A至图13F的示例中，在杂交步骤H₇之后，装配的序列中只有一个片段在位点7处保持无错误，但是实际上每个位点处存在较大的初始片段群体，因此存在这样的较大片段群体，从所述较大片段群体中可以选择“良好”片段与其它“良好”片段配对，从而提高了较大群体量时较高产率的机会。错误检测步骤减少了错误片段与“良好”片段配对的机会，以提高产率。

图14A和图14B示出了为什么图13A中所示的交替布置ABBABAAB能够使错误检测操作从后续杂交中排除错误片段。两个图均显示了四个片段A1、B1、A2、B2的一系列杂交，其中位点S2处的另外的杂交步骤H_F分别作用于位点S1、S2处的两个较早杂交步骤H_E1、H_E2的产物。在图14A的比较例中，杂交步骤H_E1、H_E2、H_F中的每一个都执行与由靶标DNA分子的相同链(链A)结合的所得杂交片段进行杂交。这意味着，即使在杂交步骤H_E1中在片段A1中检测到了错误，在错误检测操作中释放B1也不能消除该错误，并且由于在杂交步骤H_F中在位点S2处暴露的重叠区为B2，因此这可以仍然在另外的杂交步骤H_F中与错误片段A1杂交，从而污染在杂交步骤H_E2之后剩余的“良好”A2-B2片段的群体。这是因为使用图14A中所示的布置时，在后续杂交步骤H_F中发生杂交的重叠区对应于在步骤H_E1中杂交的A1-B1片段的结合端，并且在该结合端处的A1的粘性端将保持完整，而不论是否在A1-B1重叠区中检测到错误。

相比之下，如图14B所示，通过将片段的初始布置交替，使得片段结合至在连续位点之间的相对链处的反应表面，另外的杂交步骤H_F使先前经由链A与反应位点结合时检验到错误的一个片段与经由链B与反应位点结合时检验到错误的另一片段结合。由于有义/反义翻转，先前最接近表面且未杂交的核苷酸现在位于片段的顶部，准备好用于下一杂交步骤。这意味着，即使杂交步骤H_E1中的错误在结合的链A中，而不是在松散的链B中，因为剩余片段A1与在下一杂交步骤H_f中暴露的重叠区(A2-B1)不匹配并且应与该重叠区(B1)结合的片段由于被丢弃而缺失，孤独的A1链与位点S2处的A2-B2片段的杂交被阻止。类似地，如果在杂交步骤H_E2中在B2的重叠区中检测到错误，则B2将被阻止与从杂交步骤H_E1产生的“良好”A1-B1片段结合，因为需要与B1的重叠区结合的A2片段将会缺失。因此，如上所述的ABBABAAB等模式中的初始片段的排列模式的交替使得错误检测能够抑制先前检测到的错误片段与下一个位点的“良好”片段的杂交。

上面讨论的二元装配序列对产率的影响的预测很难进行分析建模，但是可以简单地进行数值模拟。在每个“二元”杂交(即，以上示出的图13B和图13C中所示的步骤)中，产率通过去除错误片段而被降低，但是降低了剩余片段的错误率。为了解释检测和剔除错误的有限概率，可以使用蒙特卡洛模拟(Monte-Carlo simulation)。假设每个杂交步骤均为错误检测类型，则对于从长度为100的寡核苷酸(单链核酸片段)以1/200的错误率装配DNA的情况，结果在图15中示出。从图15能够看出，如果检测到很大比例的错误，则在第一个二元步骤之后产率几乎不会下降。如果未检测到错误，则产率与通过现有合并或子合并装配方法获得的产率相同。即使错误检测准确度适中(例如，低至35％)，这仍然会导致显著的产率提高，其与DNA长度成比例地增加，如在图16中能够看出的，该图绘制了相同的数据相对于通过合并获得的产率(即合并的示例是等于1的平线，并且其他线示出了通过具有给定错误率的二元装配获得的产率与通过合并获得的产率之间的比率)。因此，即使错误检测操作可能会遗漏某些错误片段，或者可能剔除某些“良好”片段，甚至相对较低的错误检测准确度的整体效应也是将能够实现的产率大大提高了几个数量级，并且随着靶标DNA分子长度的增加，这种提高变得更加显著。虽然用于生成图15和图16的模拟忽略了通过运输的产率损失，事实上错误检测也会剔除一些没有错误的寡核苷酸，以及将降低产率的其他实际问题，但是随着DNA长度的增加，可获得的产率增益变得如此之大，以至于二元方法能够容忍由于这些实际性而导致的显著损失，而不会失去其显着的益处。

如上所述，可以使用在连续流中操作的可热寻址阵列来实现二元装配序列。寡核苷酸可在反应位点上适当地合成，或预先合成并然后附着至各个反应位点。从底物的释放可以通过化学或酶促反应来实现，该化学或酶促反应的反应速率对温度高度敏感。然后，将流以及任选的电场或磁场或电阱或磁阱用作驱动机制，以在反应位点之间实现运输，从而导致许多平行的装配泳道。每个泳道中的反应位点之间缺乏永久的物理边界，使得二元装配的成对运输和杂交能够在精简和集成过程中完全在流动池内进行。

然而，并非必须使用流体流作为运输机制，图17示出了一种替代方案，其中每个反应位点可对应于一个孔或容器，其中在相邻容器之间具有物理屏障，并且可以使用手动或自动控制的移液来在需要时将片段从一个容器转移到下一个容器。片段可以在孔中生长(例如通过上面讨论的寡核苷酸制备技术)，或单独生长，然后锚定至每个孔。片段可以通过可切割的连接机制结合到容器的表面，该可切割的连接机制可以在需要时被分离(例如，通过施加化学试剂或酶)。通过加热到刚刚低于相关重叠区的预期解链温度，可以使用上述相同的机制来执行错误检测。在分离剩余的片段并将它们转移到下一个反应容器之前，可以通过用流体充分洗涤容器，洗去其键已被弱化的错误片段。用于在反应位点之间运输片段的另一种方法可以是为每个反应位点提供磁珠，并使用磁场物理移动反应位点以将片段的不同组合聚集在一起。

上面讨论的错误检测方法检验了部分杂交的寡核苷酸与双链DNA之间的键强度。这是可行的，因为键解链或分开的温度是可预测的且与序列有关。例如，图18的顶部部分示出了期望的DNA序列的示例(为简洁起见，仅示出了有义链)。如在图18的中间部分中所示，该DNA序列可以在第34位和第67位处被打断以形成寡核苷酸s1、a1、s2、a2(s是指有义并且a是指反义)。然后可以按照图18底部处所示的3种杂交装配期望的序列，其中每种杂交处的独特重叠序列会导致不同的解链温度。应注意，这3个重叠区可以以与图18的示例中所示次序不同的次序进行杂交。

解链温度是50％的键断裂的温度，并且剩余键的百分比(螺旋度％)随温度不断降低。图19示出了三个重叠区的螺旋度如何随温度变化，该曲线图通常被称为解链曲线。

需要检测多种错误机制：

1.核苷酸的误掺入(例如，对于s1，以ACGGTGA...替代ATGGTGA...)

2.截短(例如对于s1的ATGGTGAGCAAGG(SEQ ID NO:7)，在第13个碱基后被截短)

3.缺失(例如对于s1，以ATGGGA...替代ATGGTGA...)

4.插入(例如对于s1，以ATGGATGA...替代ATGGTGA...)。

在这些中，误掺入是最难检测的，因为它们会导致单个错配的核苷酸；其他错误类型通常会导致多于一个的错配核苷酸，因此更易于检测。仅考虑杂交区域中单个错配的影响，在每个位置处存在三个可能的错误核苷酸，从而导致了所有可能的不正确重叠序列的解链温度分布。如果将反应位点的温度提高到刚刚低于正确重叠的解链温度，例如低0.5℃，则解链温度降低了0.5℃或更多的任何不正确重叠都应分开并通过流动去除。不正确重叠的解链温度相对于正确序列的解链温度的降低的累积分布在图20中示出，并且可用来估计将通过相对于无错误片段的预期解链温度的0.5℃温度下降(或任何其他期望的温度裕度)检测到的可能错误的分数，以及因此如果错误位置随机分布则将被检测到的错误的百分比。

根据图20，我们能够得出三个观察结果：

1)对于这3个重叠，大多数可能的错误使解链温度差值大于0.5℃，因此检测到随机错误的概率高。

2)该概率取决于重叠的序列，例如参见图20中的图例，该图例示出了检测到解链温度差值为0.5℃的错误片段的概率。

3)可能的错误的一小部分会使解链温度升高(参见图20中指示的区域40)，因此无法通过该技术检测到。这是因为GC键的键强度比AT键的键强度相对更高。

当然，对于具有降低的解链温度的任何键，检测和剔除并不是简单地以绝对意义发生，因为键强度随着温度而逐渐降低，如图19中解链曲线所示。替代地，反应位点的“检验”温度可以经选择以最大化当解链温度降低某一裕度(在该示例中为0.5℃)时的螺旋度降低与在重叠区中没有错误的“良好”片段中不想要的螺旋度降低的比率。这实质上是“差”(错误重叠)与“良好”(正确重叠)检测的平均分数之比，或者是正确重叠的浓度比。为每个重叠选择不同的最佳温度，在所有可能的错误上所得浓度的累积分布如图21所示，其中平均比率为约1.3倍(即可通过错误检测检验剔除的错误片段是“良好”片段的1.3倍)。随着温度控制精度的提高，检测错误的能力也得到提高；图22示出了在以较小温度差值(即，假设改变0.5℃)重复进行分析时，平均浓度比如何增加。图20至图22中示出的分析显示了最难检测的错误类型(误掺入)。对于其他类型的错误，平均“差”与“良好”的剔除比率会更高，因为这些错误导致重叠区中多于一个的错配碱基，使得错误片段中的键比具有单个误掺入的错误片段更弱，并且能够通过错误检测操作更容易地检测到和剔除。

无错误重叠的总浓度比取决于不同错误机制的相对概率，以及它们产生多少个碱基对错配。如果对于在此分析的最困难的误掺入情况，浓度比大于1，则始终会存在一定浓度的无错误重叠或对错误重叠的剔除。因此，虽然根据该分析量化完整的错误检测效力是不实际的，但是可以使用单碱基错配浓度比作为不同重叠序列之间的相对度量，并因此作为靶标DNA序列的不同分割(即序列被打断成寡核苷酸的核苷酸位置)。

为了比较序列分割对错误检测效力的影响，图23示出了在给定寡核苷酸长度为20至80并且重叠区长度为20至40的约束下，在先前DNA序列的所有可能分割的三个重叠中，平均单碱基错配浓度比的累积分布。从图23中能够看出，存在通过适当地选择序列的分割而获得的在错误检测能力方面的显著益处—通过使用区域50中的分割而不是区域60中的分割，能够提高错误检测能力(并且降低假阳性检测率)。少量的最佳分割将产生比通过不考虑这一点的传统分割方法获得的浓度比更高的浓度比。该示例是针对短DNA序列；随着序列长度的增加，以这种方式优化分割的重要性增加。当然，DNA分割也可能会造成其他限制，诸如二级结构的最小化和避免GC含量的局部浓缩。因此，以该方式最大化错误检测能力可能只是多变量优化中的一个参数。但是通常，选择用于将靶标DNA序列分成初始片段的分割点，使得(a)“良好”片段与“差”片段之间的平均解链温度差值至少为预定阈值，并且(b)分割为这样的分割，所述分割实现尽可能高的“差”与“良好”的剔除比率(当考虑到上述其他限制时)，能够实现更好的错误检测性能。

此外，模拟“差”与“良好”的剔除比率还使得能够实现根据给定重叠区的错误片段与“良好”片段之间的平均解链温度差值，为每个反应位点定制温度裕度—对于具有较大解链温度差值的重叠区，温度裕度(预期解链温度与反应位点被加热到的温度与预期解链温度之间的差值)可以大于具有较小解链温度差值的重叠区的温度裕度，以便通过剔除较少的“良好”片段来提高“差”与“良好”的剔除比率。

一些示例可以提供用于从多个单链核酸片段集合形成靶标双链核酸分子的多个实例的方法，每个集合包括靶标双链核酸分子的相应部分的多个实例，所述方法包括：

在包括反应位点的泳道的设备的相应反应位点处提供每个单链核酸片段集合；以及

执行多个杂交步骤，其中每个杂交步骤在泳道的给定反应位点处执行，并且包括：

使在先前反应位点处提供的单链核酸片段，或在于先前反应位点处执行的先前杂交步骤中杂交的双链核酸片段从所述先前反应位点的表面选择性分离；

将分离的单链或双链核酸片段从所述先前反应位点运输至所述给定反应位点；以及

使运输的片段与在所述给定反应位点处提供的另外的单链片段杂交，或与在于所述给定反应位点处执行的先前杂交步骤中杂交的双链片段杂交，以形成双链片段。

在此类示例中，设备还可包括流体流动元件，所述流体流动元件被配置为在反应位点的泳道上引导流动流体，并且将分离的单链或双链核酸片段从先前反应位点运输至给定的反应位点可以通过在由流体流动元件提供的流动流体中的运输来执行。在执行杂交步骤之前，每个单链核酸片段集合(对应于靶标双链核酸分子的不同部分)可以在对应的一个反应位点处生长。

以下条款中列出了进一步的示例性布置：

(1)一种从多个核酸片段提供靶标双链核酸的多个实例的方法，所述方法包括：

一个或多个另外的杂交步骤，每个另外的杂交步骤对应于成对的较早杂交步骤并且包括使作为成对的较早杂交步骤的直接产物的相应成对的部分重叠的杂交片段杂交以形成较长的杂交片段，其中所述成对的较早杂交步骤中的每一个均包括所述初始杂交步骤中的一个或所述另外的杂交步骤中的一个；

所述错误检测类型的杂交步骤包括：

执行错误检测操作以检测在所述错误检测类型的杂交步骤中形成的杂交片段是否包括至少一个错误杂交片段，所述至少一个错误杂交片段在于所述错误检测类型的杂交步骤中杂交的重叠区中包含至少一个错配碱基对；以及

丢弃所述至少一个错误片段的至少部分以将所述至少一个错误片段从后续另外的杂交步骤中排除。

(2)根据条款(1)所述的方法，其中所述方法是使用这样的设备执行的，所述设备包括：在预定方向上对准的反应位点的至少一个泳道；以及流体控制元件，所述流体控制元件用于以所述预定方向引导每个反应位点上的流动流体。

(3)根据条款(2)所述的方法，所述设备还包括温度控制电路，所述温度控制电路用于独立地控制每个反应位点处的温度。

(4)根据条款(2)和(3)中任一项所述的方法，其中所述反应位点包括以下项中的一者：

表面的在相邻反应位点之间没有物理屏障的部分，和

表面的在相邻反应位点之间具有可选择性去除的物理屏障的部分。

(5)根据任一前述条款所述的方法，其中所述多个初始杂交步骤中的至少一个是所述错误检测类型的杂交步骤。

(6)根据任一前述条款所述的方法，其中每个初始杂交步骤均为所述错误检测类型的杂交步骤。

(7)根据任一前述条款所述的方法，其中所述另外的杂交步骤中的至少一个是所述错误检测类型的杂交步骤。

(8)根据任一前述条款所述的方法，其中每个另外的杂交步骤均为所述错误检测类型的杂交步骤。

(9)根据任一前述条款所述的方法，其中所述错误检测操作包括弱化形成每个检测到的错误杂交片段的部分重叠的片段之间的键，以及提供流体以洗去所述至少一个错误杂交片段的所述至少部分。

(10)根据任一前述条款所述的方法，其中所述错误检测操作包括将在其上形成所述杂交片段的反应位点的温度调节至对应于裕度的目标温度，所述裕度低于在无错误的杂交片段的所述杂交步骤中形成的重叠区的预期解链温度。

(11)根据条款(10)所述的方法，其中将所述靶标双链核酸分割成核酸片段被选择为使得在每个重叠区处，无错误的杂交片段中的重叠区的预期解链温度与在重叠区内具有至少一个碱基错误的错误杂交片段中的所述重叠区的预期解链温度之间的差值大于预定阈值。

(12)根据条款(11)所述的方法，其中所述预定阈值为至少0.1℃。

(13)根据条款(1)至(9)中任一项所述的方法，其中所述错误检测操作包括使所述杂交片段暴露于错配碱基对检测酶。

(14)根据任一前述条款所述的方法，其中在执行相应杂交步骤的反应位点之间的流动流体中运输杂交片段。

(15)根据任一前述条款所述的方法，其中所述靶标双链核酸包含与单链核酸第二链杂交的单链核酸第一链；并且

(16)根据条款(15)所述的方法，其中在给定反应位点处执行的所述至少一个另外的杂交步骤中的一个包括使以下项杂交：

第一杂交片段，所述第一杂交片段经由所述第一链和所述第二链中的一者与所述给定反应位点的表面结合；和

第二双链片段，所述第二双链片段当经由所述第一链和所述第二链中的另一者与较早的反应位点的表面结合时在较早的杂交步骤中在所述较早的反应位点处形成。

(17)根据条款(15)和(16)中任一项所述的方法，其中所述初始杂交步骤和所述至少一个另外的杂交步骤形成杂交步骤序列，在所述杂交步骤序列中，对于这样的任何成对杂交步骤，在所述任何成对杂交步骤中所述对的第二杂交步骤使在所述对的第一杂交步骤中形成的杂交片段与另一片段杂交，在所述成对杂交步骤中形成的杂交片段分别经由所述第一链和所述第二链的相对链与对应的反应位点的表面结合。

(18)根据任一前述条款所述的方法，其中在所述错误检测类型的杂交步骤中的至少一个中，将在所述错误检测操作之后的剩余杂交片段从反应位点的表面选择性分离。

(19)根据条款(18)所述的方法，其中所述剩余杂交片段的所述选择性分离是受温度控制的。

(20)根据条款(18)和(19)中任一项所述的方法，其中所述剩余杂交片段的所述选择性分离包括将所述反应位点加热至将所述剩余杂交片段与所述反应位点结合的接头物质的预定分离温度，其中所述接头物质被布置为当处于所述预定分离温度时从所述表面分离。

(21)根据条款(18)和(19)中任一项所述的方法，其中所述剩余杂交片段的所述选择性分离包括使所述剩余杂交片段暴露于温度活化的分离酶；以及将所述反应位点的温度调节至所述分离酶的活化温度。

(22)根据任一前述条款所述的方法，其中除对成对单链片段执行的任何杂交步骤以外的每个杂交步骤包括都对所述杂交片段执行的连接操作；

其中对于错误检测类型的杂交步骤，对排除在所述错误检测操作中检测到的所述至少一个错误杂交片段的所述剩余的双链片段执行所述连接操作。

(23)根据任一前述条款所述的方法，其中所述多个核酸片段中的每一个均包含至少一个重叠区，所述至少一个重叠区用于与所述核酸片段中的另一个的对应重叠区重叠；并且

所述靶标双链核酸的每个碱基均在所述多个核酸片段中的一个的所述重叠区中的一个内。

(24)根据任一前述条款所述的方法，所述方法包括在执行所述多个初始杂交步骤之前形成所述多个核酸片段的步骤。

(25)一种计算机可读程序或数据结构，所述计算机可读程序或数据结构包括用于控制设备以执行根据任一前述权利要求所述的方法的指令或控制数据。

(26)一种存储介质，所述存储介质存储根据条款(25)所述的程序或数据结构。

尽管本文已经参考附图详细描述了本发明的说明性实施方式，但是应该理解的是，本发明不限于这些精确的实施方式，并且在不脱离由所附权利要求书限定的本发明的范围和精神的情况下，本领域的技术人员可以对这些实施方式进行各种改变和修改。

序列表

<110> 埃万奈蒂克有限公司

<120> 靶标双链核酸杂交期间的错误检测

<130> P112960PCT1

<150> GB1715852.8

<151> 2017-09-29

<150> GB1721441.2

<151> 2017-12-20

<160> 7

<170> PatentIn version 3.5

<210> 1

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 示例性靶标DNA序列

<400> 1

gaacatgtcg agcaggtacg gctctcacta gggccgccgc 40

<210> 2

<211> 100

<212> DNA

<213> 人工序列

<220>

<223> 期望的DNA序列

<400> 2

atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60

ggcgacgtaa ggagctgttc accggggtgg tgaggagctg 100

<210> 3

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸s1

<400> 3

atggtgagca agggcgagga gctgttcacc gggg 34

<210> 4

<211> 67

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸a1

<400> 4

cgtcgccgtc cagctcgacc aggatgggca ccaccccggt gaacagctcc tcgcccttgc 60

tcaccat 67

<210> 5

<211> 66

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸s2

<400> 5

tggtgcccat cctggtcgag ctggacggcg acgtaaggag ctgttcaccg gggtggtgag 60

gagctg 66

<210> 6

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸a2

<400> 6

cagctcctca ccaccccggt gaacagctcc tta 33

<210> 7

<211> 13

<212> DNA

<213> 人工序列

<220>

<223> 示例性错误机制(截短)

<400> 7

atggtgagca agg 13

Claims

1.一种从多个核酸片段提供靶标双链核酸的一个或多个实例的方法，所述方法包括：

所述错误检测类型的杂交步骤包括：

2.根据权利要求1所述的方法，其中在给定反应位点处执行的所述至少一个另外的杂交步骤中的一个包括使以下项杂交：

3.根据权利要求1和2中任一项所述的方法，其中所述初始杂交步骤和所述至少一个另外的杂交步骤形成杂交步骤序列，在所述杂交步骤序列中，对于这样的任何成对杂交步骤，在所述任何成对杂交步骤中所述对的第二杂交步骤使在所述对的第一杂交步骤中形成的杂交片段与另一片段杂交，在所述成对杂交步骤中形成的杂交片段分别经由所述第一链和所述第二链的相对链与对应的反应位点的表面结合。

4.根据任一前述权利要求所述的方法，其中所述方法是使用这样的设备执行的，所述设备包括：在预定方向上对准的反应位点的至少一个泳道；以及流体控制元件，所述流体控制元件用于以所述预定方向引导每个反应位点上的流动流体。

5.根据权利要求4所述的方法，所述设备还包括温度控制电路，所述温度控制电路用于独立地控制每个反应位点处的温度。

6.根据权利要求4和5中任一项所述的方法，其中所述反应位点包含以下项中的一者：

表面的在相邻反应位点之间没有物理屏障的部分，和

7.根据任一前述权利要求所述的方法，其中所述多个初始杂交步骤中的至少一个是所述错误检测类型的杂交步骤。

8.根据任一前述权利要求所述的方法，其中每个初始杂交步骤均为所述错误检测类型的杂交步骤。

9.根据任一前述权利要求所述的方法，其中所述另外的杂交步骤中的至少一个是所述错误检测类型的杂交步骤。

10.根据任一前述权利要求所述的方法，其中每个另外的杂交步骤均为所述错误检测类型的杂交步骤。

11.根据任一前述权利要求所述的方法，其中所述错误检测操作包括弱化形成每个检测到的错误杂交片段的部分重叠的片段之间的键；以及提供流体以洗去所述至少一个错误杂交片段的所述至少部分。

12.根据任一前述权利要求所述的方法，其中所述错误检测操作包括将在其上形成所述杂交片段的反应位点的温度调节至对应于裕度的目标温度，所述裕度低于在无错误的杂交片段的所述杂交步骤中形成的重叠区的预期解链温度。

13.根据权利要求12所述的方法，其中将所述靶标双链核酸分割成核酸片段被选择为使得在每个重叠区处，无错误的杂交片段中的重叠区的预期解链温度与在重叠区内具有至少一个碱基错误的错误杂交片段中的所述重叠区的预期解链温度之间的差值大于预定阈值。

14.根据权利要求13所述的方法，其中所述预定阈值为至少0.1℃。

15.根据权利要求1至11中任一项所述的方法，其中所述错误检测操作包括使所述杂交片段暴露于错配碱基对检测酶。

16.根据任一前述权利要求所述的方法，其中在执行相应杂交步骤的反应位点之间的流动流体中运输杂交片段。

17.根据任一前述权利要求所述的方法，其中在所述错误检测类型的杂交步骤中的至少一个中，将在所述错误检测操作之后的剩余杂交片段从反应位点的表面选择性分离。

18.根据权利要求17所述的方法，其中所述剩余杂交片段的所述选择性分离是受温度控制的。

19.根据权利要求17和18中任一项所述的方法，其中所述剩余杂交片段的所述选择性分离包括将所述反应位点加热至将所述剩余杂交片段与所述反应位点结合的接头物质的预定分离温度，其中所述接头物质被布置为当处于所述预定分离温度时从所述表面分离。

20.根据权利要求17和18中任一项所述的方法，其中所述剩余杂交片段的所述选择性分离包括使所述剩余杂交片段暴露于温度活化的分离酶；以及将所述反应位点的温度调节至所述分离酶的活化温度。

21.根据任一前述权利要求所述的方法，其中除对成对单链片段执行的任何杂交步骤以外的每个杂交步骤都包括对所述杂交片段执行的连接操作；

22.根据任一前述权利要求所述的方法，其中所述多个核酸片段中的每一个均包含至少一个重叠区，所述至少一个重叠区用于与所述核酸片段中的另一个的对应重叠区重叠；并且

所述靶标双链核酸的每个碱基都在所述多个核酸片段中的一个的所述重叠区中的一个内。

23.根据任一前述权利要求所述的方法，所述方法包括在执行所述多个初始杂交步骤之前形成所述多个核酸片段的步骤。

24.一种从多个核酸片段提供靶标双链核酸的一个或多个实例的方法，所述方法包括：

一个或多个另外的杂交步骤，每个另外的杂交步骤包括使作为成对的较早杂交步骤的直接产物的相应成对的部分重叠的杂交片段杂交以形成较长的杂交片段，其中所述成对的较早杂交步骤中的每一个均包括所述初始杂交步骤中的一个或所述另外的杂交步骤中的一个；

其中所述靶标双链核酸包含与单链核酸第二链杂交的单链核酸第一链；

在每个杂交步骤中，在所述杂交步骤中形成的核酸杂交片段经由所述第一链或所述第二链与反应位点的表面结合；以及

所述方法包括控制执行所述多个初始杂交步骤和一个或多个另外的杂交步骤的序列的次序和时机。

25.根据权利要求24所述的方法，其中所述一个或多个另外的杂交步骤中的至少一个包括错误检测类型的杂交步骤。

26.一种计算机可读程序或数据结构，所述计算机可读程序或数据结构包括用于控制设备以执行根据任一前述权利要求所述的方法的指令或控制数据。

27.一种存储介质，所述存储介质存储根据权利要求26所述的程序或数据结构。