CN102084007A

CN102084007A - 用于检测hiv向性变体的系统和方法

Info

Publication number: CN102084007A
Application number: CN2009801255768A
Authority: CN
Inventors: B.B.西门; E.P.圣约翰
Original assignee: F Hoffmann La Roche AG
Current assignee: F Hoffmann La Roche AG; Roche Diagnostics GmbH
Priority date: 2008-07-01
Filing date: 2009-06-29
Publication date: 2011-06-01
Also published as: USRE46293E1; US8344123B2; US20110165556A1; CA2725643A1; EP2297362A1; JP2011525365A; US20100003687A1; WO2010000427A1; US7888034B2

Abstract

描述了用于检测与抗药性有关的一个或更多个HIV序列变体的低频发生的方法的一个实施方案，其包含下述步骤：从HIV样品群体中的每个RNA分子，产生cDNA物质；从cDNA物质扩增至少一种第一扩增子，其中每种第一扩增子包含多个扩增的拷贝，并用一对界定所述第一扩增子的基因座的核酸引物扩增；克隆地扩增第一扩增子的扩增拷贝，以生成多个第二扩增子，其中多个第二扩增子包含来自第一扩增子的扩增拷贝之一的基本上相同的拷贝的固定化群体；在单个基底上平行地测定来自至少100个固定化群体的基本上相同的拷贝的核酸序列组成；和检测在至少100个固定化群体的核酸序列组成中以5%或更低的频率出现的一个或更多个序列变体；和将检测的序列变体与与HIV向性有关的变异相关联。

Description

用于检测HIV向性变体的系统和方法

技术领域

本发明提供了用于检测和分析进化枝A、B、C、D和G（它们占世界范围内遇到的大多数感染）中与HIV-1向性有关的序列变体的系统、方法、试剂和试剂盒。另外，本发明也提供了分析进化枝F、H、J和K（它们占小于1%的感染，关于它们可以得到的序列信息量有限）中的序列变体的实用性。本发明的一个有力的方面是，从靶多核苷酸群体（诸如例如源自患者样品的群体）平行地检测变体，并测定群体中的变体的等位基因频率。本发明也包括变体频率的分析，用于确定具有希望的结果的最高可能性的治疗方案。

背景技术

人免疫缺陷病毒(通常称作HIV)持续成为世界上的一个重大问题，尽管已经批准了多种用于治疗的化合物。由于病毒反转录酶的易错性质和高病毒周转(t½ = 1-3天)，HIV基因组非常快地突变。例如，据估计，反转录酶平均每复制9.7 Kb基因组产生1个突变，其不会显著影响病毒的繁殖能力。这导致“准种”的形成，其中许多不同的突变体以动态关系存在。

HIV病毒颗粒通过CD4受体和共受体分子进入细胞。给定病毒颗粒的共受体特异性决定了它的向性(术语“向性”通常是指病毒颗粒对特定细胞和受体类型的亲和力)。大多数HIV-1株利用趋化因子受体 CCR5 (R5 向性)、CXCR4 (X4 向性)或二者(R5X4或双向性)。大多数新感染的个体表现得主要具有R5向性病毒，且已经将SI表型与晚期HIV感染和低CD4细胞数以及向AIDS 的加速恶化相关联。

HIV向性株的其它实例和它们与疾病恶化的关系描述在：Poveda 等人, AIDS 2006, 20:1359-1367；Jensen 等人, AIDS Rev 2003；5:104-112；Jensen 等人, Journal of Virology 2006年5月, 第4698-4704页；Jensen 等人, Journal of Virology, 2003年12月, 第13376-13388页；和Nelson 等人, Journal of Virology, 1997年11月, 第8750-8758页，它们各自为所有目的通过引用整体并入本文。

目前仅有一种通过破坏它与共受体的相互作用来抑制HIV进入的FDA-批准的药物，但是更多处于开发中。Maraviroc (也称作Selzentry，由辉瑞（Pfizer Inc.）投放市场)是一种小分子CCR5抑制剂。由FDA公布的当前推荐声称，在开具Maraviroc处方之前，要测试每位患者的HIV群体的向性。这是由于下述事实，即Maraviroc临床试验期间治疗失败的患者中的HIV准种的克隆分析表明，在开始治疗之前，存在小量的X4向性病毒，并认为针对CCR5进入的选择为X4病毒提供了胜过大多数R5株的优点。该抗性发展模式类似于对“经典的”HIV药物（即蛋白酶和反转录酶抑制剂）的抗性的出现，其中HIV感染的受试者的大量子集在药物暴露之前携带预先存在的抗性株——最可能是由于暴露于来自经历过治疗的个体的病毒所造成的原发感染。除了该途径以外，由于如上所述的病毒反转录酶的易错性质，通过在药物选择压力下复制，不断从野生型病毒重新生成抗性株。但是，预先存在的抗性的或（在maraviroc治疗情况下）X4向性病毒的派生(outgrowth)，在药物治疗中更有效，并导致加速的治疗失败。

病毒向性由gp120 表面包膜蛋白中的暴露的氨基酸序列决定。具体地，V3(第三个可变)区已经涉入共受体使用选择。正如名称所暗示的，约35氨基酸长序列是高度可变的，但是在该序列内存在区分R5和X4向性病毒的公共特性。已经直接基于V3序列开发出了许多向性预测算法，它们在以后几年中可能继续优化。例如，已经公开了几个位置特异性的评分矩阵(PSSM)算法，它们将V3中的氨基酸残基与向性表型(以及可以测定的那些)直接关联，有些甚至可以通过互联网来访问。

表型向性测试现在可商业上得到，然而是昂贵的、劳动密集的、且费时的。另外，表型分析严重依赖于病毒序列文库的有效产生，所以任何克隆偏倚将产生系统性测试误差。表型和基于序列的向性测定目前作为群体试验来进行，它们在性质上不如基于每个病毒株的克隆分离的试验敏感。但是，克隆分析是非常劳动密集的，且需要测试来自每位受试者的数千克隆，以便达到高灵敏度。所述发明的实施方案包括基于序列的向性测定试验，其中直接从病毒RNA准种获得克隆序列，没有劳动密集的克隆步骤。可从454 Life Science Corporation得到的长读数长度454测序（Long read-length 454 sequencing），非常适合在单个测序运行中从多位受试者产生数千克隆读数。此外，所述测序技术的实施方案能够实现所谓的“大量平行”，其能实现低丰度变体（包括群体中1%或更低频率的等位基因变体）的检测灵敏度。这与向性预测算法一起，提供了以非常高的灵敏度快速地且有效地得到向性信息的便利方法。

发明内容

本发明的实施方案涉及测定核酸序列。更具体地，本发明的实施方案涉及用于纠正通过SBS测定核酸序列期间获得的数据中的错误的方法和系统。

下面详细公开的新方法可以在99%置信水平检测每个序列变体。

因而，在一个实施方案中，使用新方法测定来自至少400个固定化群体的基本上相同的拷贝的核酸组成，且每个检测的序列变体以1.85%或更低的频率发生。在一个具体的实施方案中，使用新方法测定来自至少10000个固定化群体的基本上相同的拷贝的核酸组成，且每个检测的序列变体以0.74%或更低的频率发生。在一个非常具体的实施方案中，使用新方法测定来自至少200000个固定化群体的基本上相同的拷贝的核酸组成，且每个检测的序列变体以0.003%或更低的频率发生。

另外，描述了用于执行所述方法的试剂盒，其包含一对或更多对选自下述的引物：V3-1F和V3-1R; V3-2F和V3-2R; V3-1F和V3-2R；和V3-2F和V3-1R。

附图简述

当联合考虑附图时，可从以下详述中更清楚地了解以上及另外的特征。在附图中，相似的参考数字表明相似的结构、元件或方法步骤，参考数字最左边的数字表明参考元件在其中首先出现的图的编号(例如，元件160首先出现在图1中)。然而，所有这些规定意欲为代表性或例证性，而非限制。

图1是在计算机控制下的测序仪器和和反应基底的一个实施方案的功能框图；

图2A和2B是相对于HIV V3env区的扩增子位置关系和引物种类的一个实施方案的简化图示实例。

图3是对比从多个HIV RNA得到的序列数据和HIV V3区部分的共有序列的一个实施方案的简化图示实例。在图3中提供的序列从上到下是如下的：SEQ ID NO: 8、SEQ ID NO: 8、SEQ ID NO: 9、SEQ ID NO: 9、SEQ ID NO: 10、SEQ ID NO: 8、SEQ ID NO: 8、SEQ ID NO: 11、SEQ ID NO: 12、SEQ ID NO: 8和SEQ ID NO: 8；

图4A和4B是与来自HIV样品的向性类型有关的HIV向性单元型的鉴别频率的一个实施方案的简化图示实例。在图4A中所示的序列与下述序列相对应(从上到下): SEQ ID NO: 13、SEQ ID NO: 14、SEQ ID NO: 13、SEQ ID NO: 14、SEQ ID NO: 14、SEQ ID NO: 13、SEQ ID NO: 13、SEQ ID NO: 13、SEQ ID NO: 14和SEQ ID NO: 14。在图4B中，序列从上到下是如下的：SEQ ID NO: 15、SEQ ID NO: 16、SEQ ID NO: 15和SEQ ID NO: 15。

发明详述

如下面将更详细地描述的，本发明的实施方案包括用于靶向测序的系统、方法和试剂盒，其中使用特异性地扩增包含HIV变体的序列区域的引物种类，并使用用于变体的高灵敏度检测的那些扩增的序列区域。

具体地，本发明的实施方案涉及，通过平行地对从样品扩增的靶核酸序列群体进行测序，检测在至少1%的群体中存在的每个变体，并将检测的变体与治疗方案相结合，研究HIV向性变异。在一个实施方案中，通过聚合酶链式反应(PCR)，克隆复制来自样品中的总群体HIV病毒的代表部分的一个或更多个目标区域，其中克隆群体(也称作“扩增子”)各自源自单个病毒颗粒。平行地对克隆群体测序，以鉴别以前已知和未知组成的变体以及每个变体的发生频率，后者是原始样品中的变体频率的代表。

如上所述，本发明的实施方案采用这样的核酸引物，其特异性地用于扩增HIV RNA或它的互补DNA的env区，包括所谓的第三可变区(以后称作V3区)。另外，已经特异性地选择了引物的靶序列，因为它们邻近目标区域，也因为它们表现出低突变率，据预测其能实现HIV 核酸群体中靶核酸区的引物杂交和扩增。以大量平行的、有效的和节省成本的方式对数千单个HIV扩增子进行测序，以产生在HIV病毒颗粒群体中发现的序列变体的分布。

a. 概述

术语“流程图”通常是指通过SBS方法、尤其是基于焦磷酸酯的测序方法(也称作“焦磷酸测序”)产生的序列数据的图示，且可以更具体地称作“pyrogram”。

本文使用的术语“读数”或“序列读数”通常是指从单个核酸模板分子或模板核酸分子的多个基本上相同的拷贝群体得到的整个序列数据。

本文使用的术语“运行”或“测序运行”通常是指在一种或更多种模板核酸分子的测序操作中进行的一系列的测序反应。

本文使用的术语“流”通常是指将溶液加到包含模板核酸分子的环境中的一系列或重复的循环，其中所述溶液可以包括用于加到新生分子中的核苷酸物质或诸如缓冲液或酶等其它试剂，它们可用于测序反应中，或用于降低来自先前核苷酸物质流循环的剩余物(carryover)或噪声影响。

本文使用的术语“流循环”通常是指一系列连续的流，其中在循环期间核苷酸物质流一次(即流循环可包括以T、A、C、G核苷酸物质的次序连续加入，但其它的次序组合也考虑为定义的部分)。通常流循环为重复循环，其具有从循环到循环的流的相同序列。

本文使用的术语“阅读长度”通常是指可以可靠地测序的模板分子长度上限。影响系统和/或处理的阅读长度的因素有多种，包括但不限于模板核酸分子的GC含量程度。

本文使用的术语“测试片段”或“TF”通常是指已知序列组成的核酸元件，可将它们用于质量控制、标定或其它有关目的。

“新生分子”通常是指通过掺入核苷酸物质由模板-依赖性DNA聚合酶延伸的DNA链，其与模板分子中对应的核苷酸物质互补。

术语“模板核酸”、“模板分子”、“靶核酸”或“靶分子”通常是指作为测序反应对象的核酸分子，由其产生序列数据或信息。

本文使用的术语“核苷酸物质”通常是指核酸单体的身份，包括通常掺入到新生核酸分子中的嘌呤类(腺嘌呤、鸟嘌呤)和嘧啶类(胞嘧啶、尿嘧啶、胸腺嘧啶)。

本文使用的术语“单体重复”或“同聚物”通常是指包含相同核苷酸物质(即重复的核苷酸物质)的两个或更多个序列位置。

本文使用的术语“同质延伸”通常是指延伸反应关系或阶段，其中基本相同的模板分子群的各个成员在反应中同质地实施相同的延伸步骤。

本文使用的术语“完成效率”通常是指在既定流期间合适地延伸的新生分子的百分比。

本文使用的术语“不完全延伸率”通常是指未能适当地延伸的新生分子数与所有新生分子数的比率。

本文使用的术语“基因组文库”或“鸟枪文库”通常是指来源于和/或代表生物体或个体的整个基因组(即基因组的所有区域)的分子集合。

本文使用的术语“扩增子”通常是指所选择的扩增产物，例如从聚合酶链式反应或连接酶链式反应技术产生的产物。

本文使用的术语“变体”、“准种”或“等位基因”通常是指，各自编码类似的序列组成、但是彼此具有一定程度差异的多个种类之一。所述差异可以包括相关领域的普通技术人员已知的任意类型的遗传变异，包括、但不限于，单核苷酸多态性(SNP)、插入或缺失(插入/缺失事件的组合也称作"indel")、重复序列(也称作串联重复) 数目的差异和结构变异。

本文使用的术语“等位基因频率”或“等位基因的频率”通常是指，在由特定变体组成的群体中的所有变体的比例。

本文使用的术语“关键序列”或“关键元件”通常是指在已知位置(即通常包括在已连接的衔接子元件中)与模板核酸分子连接的核酸序列元件(通常约4个序列位置，即TGAC或核苷酸物质的其它组合)，其包含用作关于模板分子所产生的序列数据的质量控制参考的已知序列组成。如果在纠正位置包括与关键元件相关的已知序列组成，则序列数据通过质量控制。

本文使用的术语“关键通过(keypass)”或“关键通过孔(keypass well)”通常是指反应孔中已知序列组成的全长核酸测试序列(即，在上面称作“测试片段”或“TF”)的序列测定，其中将来源于关键通过测试序列的序列准确度与已知序列组成比较，用于测量测序的准确度和质量控制。在典型的实施方案中，测序运行中总数的一定比例的孔为关键通过孔，在某些实施方案中，其可为区域性分布。

本文使用的术语“平末端” 的解释与相关领域的普通技术人员的理解相一致，通常是指具有以互补核苷酸碱基物质对结束的末端的线性双链核酸分子，其中平末端对总是可以彼此连接。

本文使用的术语“粘性末端”或“突出端” 的解释与相关领域的普通技术人员的理解相一致，通常是指在分子的一条链的末端具有一个或更多个未配对的核苷酸物质的线性双链核酸分子，其中未配对的核苷酸物质可以存在于任一条链上，包括单个碱基位置或多个碱基位置(有时也被称为“粘末端”)。

本文使用的术语“珠粒”或“珠粒基底”通常是指任何适宜大小的并由任意数目已知材料制成的任何类型的珠粒，所述材料例如纤维素、纤维素衍生物、丙烯酸树脂、玻璃、硅胶、聚苯乙烯、明胶、聚乙烯吡咯烷酮、乙烯基和丙烯酰胺的共聚物、与二乙烯基苯等交联的聚苯乙烯(例如如Merrifield, Biochemistry 1964, 3, 1385-1390中所述)、聚丙烯酰胺、胶乳凝胶、聚苯乙烯、葡聚糖、橡胶、硅、塑料、硝基纤维素、天然海绵、硅胶、控制孔玻璃(control pore glass)、金属、交联葡聚糖(例如Sephadex™)琼脂糖凝胶(Sepharose™)和本领域技术人员所知的其它固相珠粒支持体。

与样品制备和处理、序列数据产生及序列数据分析有关的系统和方法的某些示例性实施方案在下文中概述，它们中的某些或所有都适用于本发明所述的实施方案。具体地，阐述了用于制备模板核酸分子、扩增模板分子、产生靶标特异性扩增子和/或基因组文库、测序方法及仪器化和计算机系统的系统和方法的示例性实施方案。

在典型的实施方案中，应该将来源于实验或诊断样品的核酸分子由其原始形式制备并处理成适用于高通量测序的模板分子。处理方法可视应用不同而变化，从而产生具有不同特性的模板分子。例如，在高通量测序的某些实施方案中，优选产生的模板分子具有为至少在特定的测序方法中可准确产生序列数据的长度的序列或阅读长度。在该实例中，长度可包括以下范围：约25-30个碱基对、约50-100个碱基对、约200-300个碱基对、约350-500个碱基对、大于500个碱基对或适用于特定测序应用的其它长度。在某些实施方案中，用本领域一般技术人员已知的多种方法使来自样品(例如基因组样品)的核酸片段化。在优选的实施方案中，使核酸随机片段化(即不选择特定序列或区域)的方法可包括被称为雾化法或超声法的方法。然而，应该了解，其它片段化方法(例如用限制性内切酶消化)可用于片段化目的。在该实例中，某些处理方法还可采用本领域已知的大小选择方法，以选择性分离所需长度的核酸片段。

此外，在某些实施方案中，优选将另外的功能元件与每一模板核酸分子连接(associate)。可采用多种功能元件，包括但不限于用于扩增和/或测序方法的引物序列、质量控制元件、编码例如与原始样品或患者样品的多种关联物(association)的独特标识物(也被称为多元标识物或“MID”)或其它功能元件。某些或所有所述的功能元件可以组合成衔接子元件，它们在某些加工步骤中偶联到核苷酸序列上。例如，某些实施方案可使包含互补序列组成的引发序列元件(priming sequence element)或区域与用于扩增和/或测序的引物序列连接。另外，同样的元件可用于可被称为“链选择”的过程中，并将核酸分子固定化到固相基底。在某些实施方案中，可采用两组引发序列区域(下文被称为引发序列A和引发序列B)用于链选择，其中仅选择具有一个拷贝引发序列A和一个拷贝引发序列B的单链，并将其包括作为已制备的样品。在替代性实施方案中，衔接子元件的设计特征排除了对链选择的需要。在用于扩增和固定化的方法中可采用同样的引发序列区域，其中例如引发序列B可被固定化到固体基底上，并由此延伸扩增产物。

用于片段化、链选择和添加功能元件和衔接子的样品处理的另外的实例参见：2004年1月28日提交的美国专利申请系列号10/767,894，其标题为“Method for preparing single-stranded DNA libraries”；2008年5月29日提交的美国专利申请系列号12/156,242，其标题为“System and Method for Identification of Individual Samples from a Multiplex Mixture”，和2009年2月23日提交的美国专利申请系列号 12/380,139，其标题为“System and Method for Improved Processing of Nucleic Acids for Production of Sequencable Libraries”，它们各自为所有目的通过引用整体并入本文。

阐述了用于扩增模板核酸分子以产生基本上相同的拷贝群的系统和方法的各种实例。一般技术人员显而易见的是，在某些SBS实施方案中，当将一个或更多个核苷酸物质掺入到与模板分子拷贝缔合的每一个新生分子中时，期需产生各种核酸元件的多个拷贝，以产生较强的信号。本领域有多种用于产生核酸分子拷贝的已知技术，例如：用被称为细菌载体的扩增；“滚环”扩增(阐述于美国专利第6,274,320号和第7,211,390号中，其通过引用并入本文)；和聚合酶链式反应(PCR)法，每一种技术都适用于本发明。尤其适用于高通量应用的一种PCR技术包括被称为乳液PCR方法(也被称为emPCR^TM方法)的技术。

乳液PCR方法的典型实施方案包括产生两种不能互溶物质的稳定的乳液，所述两种不能互溶物质形成反应可在其中发生的水性小滴。具体地，适用于PCR方法的乳液的水性小滴可包括第一流体(例如基于水的流体)，其作为小滴(也称作间断相)悬浮或分散在另一种流体中，诸如通常包括某种类型的油的疏水流体(也称作连续相)。可以采用的油的实例包括、但不限于：矿物油、基于有机硅的油或氟化的油。

另外，某些乳液实施方案可采用表面活性剂，其起稳定乳液的作用，特别可用于特异性处理方法例如PCR中。表面活性剂的某些实施方案可包括一种或更多种有机硅或氟化的表面活性剂。例如，可以采用一种或更多种非离子型表面活性剂，包括、但不限于，失水山梨糖醇单油酸酯(也被称为Span^TM 80)、聚氧乙烯失水山梨糖醇单油酸酯(也被称为Tween^TM 80)，或在某些优选实施方案中为二甲聚硅氧烷共聚醇(也被称为Abil^® EM90)、聚硅氧烷、聚烷基聚醚共聚物、聚甘油酯、泊洛沙姆(poloxamer)和PVP/十六烷共聚物(也被称为Unimer U-151)，或在更优选的实施方案中为环戊硅氧烷中的高分子量有机硅聚醚(也被称为DC 5225C，购自Dow Corning)。

乳液小滴还可被称为隔室(compartment)、微胶囊、微反应器、微环境或相关领域常用的其它名称。水性小滴大小范围可视乳液组分或组合物的组成、其中含有的内容物和采用的形成技术而定。所述乳液形成可在其中进行化学反应(例如PCR)的微环境。例如，实施所需PCR反应所需要的模板核酸及所有试剂可被包封，并在化学上隔离在乳液小滴中。在某些实施方案中可采用另外的表面活性剂或其它稳定剂，以提升上述小滴的附加稳定性。可用小滴来实行PCR方法的典型热循环操作，以扩增被包封的核酸模板，从而产生包含许多基本相同的模板核酸拷贝的群。在某些实施方案中，小滴中的群可被称为“克隆分离”、“隔室化”、“隔离”、“包封”或“局部化”的群。此外，在该实例中，某些或所有所述小滴还可进一步包封固体基底（例如珠粒），用于连接模板和模板的扩增拷贝、与模板互补的扩增拷贝或其组合。此外，固体基底可以用于连接其它类型的核酸、试剂、标记物或其它目标分子。

用于本发明的乳液实施方案可包括能够使所述化学反应以大规模并行方式进行的极高密度的小滴或微胶囊。用于扩增的乳液及其测序应用用途的另外的实例阐述于以下美国专利申请系列号中：10/861,930；10/866,392；10/767,899；11/045,678，它们各自为所有目的通过引用整体并入本文。

本发明还可采用产生用于测序的靶标特异性扩增子的实施方案，其包括用特异性核酸引物组来扩增所选择的靶区域或来自包含靶核酸的样品的区域。另外，样品可包括已知或怀疑含有序列变体的核酸分子群，可采用引物来扩增，并深入了解样品中序列变体的分布。例如，可实施用于通过特异性扩增并测定核酸样品中的多个等位基因的序列来鉴定序列变体的方法。首先用一对设计用于扩增目标区域周围的区域或核酸群的共同区段的PCR引物来扩增核酸。随后在单独的反应容器(例如上述基于乳液的容器)中进一步单独扩增PCR反应的每一个产物(第一扩增子)。对得到的各自来源于第一扩增子群的一个成员的扩增子(本文称为第二扩增子)进行序列测定，将来自不同乳液PCR扩增子(即第二扩增子)的序列集合用于测定等位基因频率。

所述靶标特异性扩增和测序方法的某些优点包括比先前实现的灵敏度水平更高。另外，在采用高通量测序仪器化的实施方案中，例如采用由454 Life Sciences Corporation提供的被称为PicoTiterPlate®阵列(有时也被称为PTP^TM盘或阵列)的孔的实施方案中，可采用所述方法以每次运行或实验产生超过100,000、超过300,000、超过500,000或超过1,000,000个核酸区域的序列组成，并可以至少部分地依赖于用户偏好，诸如通过使用衬垫等实现的泳道构造。所述方法还提供可代表1%或更低等位变体的低丰度等位基因的检测灵敏度。所述方法的另一优点包括产生包含所分析区域的序列的数据。重要的是，不必具有所分析的基因座的序列的预先认识。

用于测序的靶标特异性扩增子的另外的实例阐述于：2005年4月12日提交的美国专利申请系列号11/104,781，其标题为“Methods for determining sequence variants using ultra-deep sequencing”；和2008年3月14日提交的PCT专利申请系列号US 2008/003424，其标题为“System and Method for Detection of HIV Drug Resistant Variants”，它们各自为所有目的通过引用整体并入本文。

另外，测序实施方案可包括：Sanger型技术、通常称为杂交测序(SBH)、连接测序(SBL)或掺入测序(SBI)技术等的技术。另外，测序技术可以包括所谓的polony 测序技术；纳米孔、波导及其它单分子检测技术；或可逆终止子技术。如上所述，优选技术可包括合成法测序。例如，某些SBS实施方案测定基本相同的核酸模板拷贝的群体的序列，并且通常采用一种或更多种设计成与样品模板分子的预定互补位置退火的寡核苷酸引物或一种或更多种与模板分子连接的衔接子。在核酸聚合酶存在下，引物/模板复合物被供以核苷酸物质。如果核苷酸物质与对应于样品模板分子上的序列位置(其直接与寡核苷酸引物3’端相邻)的核酸物质互补，那么聚合酶将用核苷酸物质延伸引物。或者，在某些实施方案中，引物/模板复合物同时被供以多种目标核苷酸物质(通常为A、G、C和T)，与样品模板分子上的对应序列位置(其直接与寡核苷酸引物3’端相邻)互补的核苷酸物质得以掺入。在任一所述实施方案中，可化学封闭(例如在3’-O位置)核苷酸物质以防止进一步延伸，并需要在下一轮合成之前去封闭。同样应该了解，将核苷酸物质加到新生分子末端的过程基本上与上述加入到引物末端的过程相同。

如上所述，可通过多种本领域已知方法检测核苷酸物质的掺入，例如通过检测焦磷酸(PPi)的释放(实例阐述于美国专利第6,210,891号；第6,258,568号；和第6,828,100号中，它们各自为所有目的通过引用整体并入本文)或经由连接到核苷酸的可检测标记。可检测标记的某些实例包括但不限于质量标签(mass tag)和荧光或化学发光标记。在典型实施方案中，例如通过洗涤来除掉未掺入的核苷酸。另外，在某些实施方案中，可对未掺入的核苷酸进行酶降解，例如用腺苷三磷酸双磷酸酶或焦磷酸酶降解，其如以下文献所述：2008年6月27日提交的美国专利申请系列号12/215,455，其标题为“System and Method for Adaptive Reagent Control in Nucleic Acid Sequencing”；和2009年1月29日提交的代理人案号21465-538001 US，其标题为“System and Method for Improved Signal Detection in Nucleic Acid Sequencing”；它们各自为所有目的通过引用整体并入本文。

在使用可检测标记的实施方案中，在下一个合成循环进行之前通常必须让所述可检测标记失活(例如通过化学裂解或光漂白)。然后如上所述，在模板/聚合酶复合物中的下一个序列位置可用另一个目标核苷酸物质或多个目标核苷酸物质探询(query)。加入核苷酸、延伸、信号探测及洗涤的重复循环使得能够测定模板链的核苷酸序列。延续该实例，为了获得强到可以可靠地检测的信号，通常在任何一个测序反应中同时分析大量基本相同的模板分子或基本相同的模板分子群(例如10³、10⁴、10⁵、10⁶或10⁷个分子)。

另外，在某些实施方案中，可能有利的是，通过采用可被称为“配对末端”的测序策略来提高阅读长度容量和测序处理质量。例如，某些测序方法实施方案具有可产生高质量和可靠读数的分子总长度的限制。换言之，用于可靠阅读长度的序列位置总数不应超过25、50、100或500个碱基，其视所采用的测序实施方案而定。配对末端测序策略通过分别测定分子的每一个末端(有时被称为“标签”末端)的序列扩展了可靠阅读长度，所述分子包含通过接头序列在每一末端处连接中心的原始模板核酸分子的片段。已知模板片段的原始位置关系，因此，可将来自序列读数的数据重新组合为具有更长的高质量阅读长度的单一读数。配对末端测序实施方案的另外的实例阐述于以下文献中：2006年6月6日提交的美国专利申请系列号11/448,462，其标题为“Paired end sequencing”；和2009年1月28日提交的美国专利申请系列号 12/322,119，其标题为“Paired end sequencing”，它们各自为所有目的通过引用整体并入本文。

某些SBS仪器实例可实施上述某些或所有方法，并可包括一个或更多个检测设备，例如电荷耦合设备(即CCD摄影机)或共焦型结构、微流体室或流室(flow cell)、反应基底和/或泵及流量阀。以基于焦磷酸的测序为例，仪器的实施方案可采用产生固有低水平背景噪音的化学发光检测策略。

在某些实施方案中，用于测序的反应基底可包括如上所述被称为PTP^TM阵列的阵列，其由纤维光学面板构成，所述面板经由酸蚀以产生数十万或更多个极小的孔，每一孔能够容纳基本相同的模板分子群(即某些优选实施方案在70x75mm PTP^TM阵列上以35μm孔-孔距(well pitch)包含约330万个孔)。在某些实施方案中，可将每一群基本相同的模板分子置于固体基底例如珠粒上，每一群可置于所述孔之一中。例如，仪器可包括试剂递送元件以及CCD型检测设备，前者用于将流体试剂提供到PTP板支持物(plate holder)中，后者能够收集从PTP板各孔发射的光子。包含用于改进的信号识别特性的反应基底实例阐述于2005年8月30日提交的美国专利申请系列号11/215,458中，其标题为“THIN-FILM COATED MICROWELL ARRAYS AND METHODS OF MAKING SAME”，为所有目的通过引用整体并入本文。用于实施SBS型测序和焦磷酸测序的仪器和方法的其它实例阐述于美国专利第7,323,305号和美国专利申请系列号11/195,254中，以上两者都通过引用并入本文。

另外，可采用使一个或更多个样品制备过程自动化的系统和方法，例如上述emPCR^TM过程。例如，可采用自动化系统以提供用于以下的有效解决方案：产生用于emPCR处理的乳液；实施PCR热循环操作；和富集用于测序的成功制备的核酸分子群。自动样品制备系统实例阐述于2005年1月28日提交的美国专利申请系列号11/045,678中，其标题为“Nucleic acid amplification with continuous flow emulsion”，为所有目的通过引用整体并入本文。

本发明所述实施方案的系统和方法还可包括用存储用于在计算机系统上执行的计算机可读介质实行某些设计、分析或其它操作。例如，以下详述几个用SBS系统和方法处理检测信号和/或分析所产生的数据的实施方案，其中处理和分析实施方案可在计算机系统上实行。

用于本发明的计算机系统的示例性实施方案可包括任何类型的计算机平台，例如工作站、个人计算机、服务器或任何其它现有或将来的计算机。但是，本领域普通技术人员会理解，本文所述的前述计算机平台特别地构造成执行本发明的专门操作，且不视作一般目的计算机。计算机通常包括已知组件，例如处理器、操作系统、系统存储器(system memory)、存储器存储设备(memory storage device)、输入输出控制器、输入-输出设备和显示设备。相关领域一般技术人员还应理解，存在多种可能的计算机配置和组件，还可包括高速缓冲存储器、数据备份单元和很多其它设备。

显示设备可包括提供可视化信息的显示设备，所述信息通常可在逻辑上和/或物理上组织成像素阵列。还可包括界面控制器，所述界面控制器可包括用于提供输入和输出界面的多种已知软件程序或将来软件程序中的任一种。例如，界面可包括通常被称为“图形用户界面(Graphical User Interface)”(经常被称为GUI)的界面，其为用户提供一个或更多个图示。通常用相关领域的一般技术人员已知的选择或输入手段使界面能接受用户输入。

在相同或备选实施方案中，在计算机上应用可采用包括被称为“命令行界面(command line interface)”(通常被称为CLI)的界面。CLI通常在应用和用户之间提供基于文本的互动(interaction)。通常，命令行界面通过显示设备作为文本行显示输出并接受输入。例如，某些执行可包括所谓的“shell”，例如相关领域的一般技术人员已知的Unix Shells，或采用面向对象程序设计体系结构(architecture)的Microsoft Windows Powershell，例如Microsoft .NET框架。

相关领域一般技术人员应了解，界面可包括一个或更多个GUI、CLI或其组合。

处理器可包括市售处理器，例如Intel公司制造的Centrino®、Core^TM 2、Itanium®或Pentium®处理器，Sun Microsystems制造的SPARC®处理器，AMD公司制造的Athalon^TM或Opteron^TM处理器，或处理器可为现在或将来可获得的其它处理器之一。处理器的某些实施方案可包括被称为多核处理器和/或在单核或多核配置中能够采用并行处理技术的处理器。例如，多核体系结构通常包含两个或更多个处理器“执行核心”。在该实例中，每一执行核心可作为能够并行执行多线的独立处理器来运行。另外，相关领域的一般技术人员应了解，可以以通常被称为32或64位体系结构或现在已知或将来可能开发的其它体系结构配置来配置处理器。

处理器通常执行操作系统，所述操作系统可为例如：Windows®-型操作系统(例如来自Microsoft Corporation的Windows® XP或Windows Vista®)；来自Apple 计算机Corp.的Mac OS X 操作系统 (例如Mac OS X v10.5 “Leopard”或“Snow Leopard”操作系统)；自很多卖方或被称为公开来源获得的Unix®或Linux-型操作系统；另一种或未来操作系统；或其某些组合。操作系统以众所周知的方式连接(interface)固件(firmware)和硬件，并有助于处理器协调并执行各种可以多种程序设计语言编写的计算机程序功能。操作系统通常与处理器配合协调并执行计算机其它组件的功能。操作系统还提供调度、输入-输出控制、文件和数据管理、存储器管理和通信控制和有关服务，所有这些都根据已知技术。

系统存储器可包括多种已知或未来存储器存储设备中的任何一种。实例包括任何通常可获得的随机存取存储器(RAM)、磁性介质(例如常驻硬盘或磁带)、光学介质(例如读写光盘)或其它存储器存储设备。存储器存储设备可包括多种已知或未来设备中的任何一种，包括光盘驱动器、磁带驱动器、移动硬盘驱动器、USB或闪存驱动器或软磁盘驱动器。所述存储器存储设备类型通常从程序存储介质(未显示)读取和/或向其写入，例如分别为光盘、磁带、可移动硬盘、USB或闪存驱动器或软磁盘。可以认为任何这些程序储存介质或现在使用或以后可开发的其它储存介质为计算机程序产品。可以了解，这些程序存储介质通常存储计算机软件程序和/或数据。计算机软件程序还称为计算机控制逻辑，通常被储存在系统存储器和/或与存储器存储设备联合使用的程序存储设备中。

在某些实施方案中，阐述了计算机程序产品，其包括具有储存在其中的控制逻辑(计算机软件程序，包括程序代码)的计算机可用介质。当处理器执行控制逻辑时，其促使处理器实施本文所述功能。在其它实施方案中，某些功能主要用例如硬件状态机器在硬件中执行。为了实施本文所述功能，硬件状态机器的执行将为相关领域技术人员所明了。

输入输出控制器可包括多种用于接收并处理来自用户(不管所述用户是人或机器，不管其是本地或远程)的信息的已知设备中的任何一种。所述设备包括例如调制解调卡、无线卡、网络接口卡、声卡或用于多种已知输入设备中的任何一种的其它类型的控制器。输出控制器可包括多种用于为用户(不管所述用户是人或机器，不管其是本地或远程)显示信息的已知显示设备中的任何一种的控制器。在所述实施方案中，计算机功能元件经由系统总线彼此通信。计算机的某些实施方案可用网络或其它类型的远程通信与某些功能元件通信。

相关领域技术人员显而易见的是，设备控制和/或数据处理应用程序(data processing application)如果要在软件中执行，可被载入到系统存储器和/或存储器存储设备中，并可从其中执行。所有或部分设备控制和/或数据处理应用程序还可常驻在只读存储器或存储器存储设备的类似设备中，所述设备不需要首先通过输入输出控制器载入设备控制和/或数据处理应用程序。相关领域技术人员应理解，设备控制和/或数据处理应用程序或其部分，可以由处理器以已知方式根据执行的有利情况载入到系统存储器或高速缓冲存储器或两者中。

计算机还可包括储存在系统存储器中的一个或更多个库文件、实验数据文件和互联网客户端(internet client)。例如，实验数据可包括与一个或更多个实验或测定有关的数据，例如检测信号值或其它与一个或更多个SBS实验或处理有关的数值。另外，互联网客户端可包括能用网络访问另一计算机上的远程服务的应用程序(application)，并可例如包括通常所谓的“网页浏览器”。在该实例中，某些常用的网页浏览器包括自Microsoft Corporation获得的Microsoft® Internet Explorer 7、来自Mozilla Corporation的Mozilla Firefox® 2、来自Apple 计算机Corp.的Safari 1.2或目前本领域已知或将来要开发的其它类型的网页浏览器。在同样的或其它实施方案中，互联网客户端还可包括或可以是专业软件应用程序元件，其能够经由网络访问远程信息，例如用于SBS应用的数据处理应用程序。

网络可包括本领域一般技术人员众所周知的多种不同网络类型中的一种或更多种。例如，网络可包括采用通常所谓的TCP/IP协议套来通信的局域网或广域网。网络可包括包含互相连接的计算机网络的全球系统的网络，其通常被称为互联网；或还可包括各种内联网体系结构。相关领域的一般技术人员还应了解，网络化环境中的某些用户可能偏好采用通常所谓的“防火墙”(有时也被称为包过滤器或边界保护设备(Border Protection Device))，来控制信息流入硬件和/或软件系统及从其中流出。例如，防火墙可包括硬件或软件元件或其某些组合，通常设计为强制执行由用户(例如网络管理员等)设置的安全政策。

b. 本发明的实施方案

如上所述，本发明涉及通过使变体序列组成与R5或X4向性类型相结合，检测来自样品的HIV向性序列变体和鉴别所述样品中存在的向性类型的方法。具体地，本发明的实施方案包括靶向已知与向性变体有关的HIV区域的两阶段PCR 技术(即生产如上所述的第一和第二扩增子)，其与从数千病毒颗粒平行地生成序列信息的测序技术相结合，所述测序技术能鉴别HIV向性类型的发生(基于向性类型与检测出的样品中的变体的序列组成的关联)，尽管那些类型以低频率出现在样品中。实际上，本发明的实施方案可以检测样品中存在的向性序列变体，所述样品含有非计量等位基因量的HIV病毒颗粒，例如，以小于50%、小于25%、小于10%、小于5%或小于1%存在的HIV向性变体。所述的实施方案能以快速、可靠且节省成本的方式实现这样的鉴别。

典型地，采用一种或更多种仪器元件，其使一个或更多个处理步骤自动化。例如，用仪器化可执行测序方法的实施方案，以使某些或所有处理步骤自动化并实施它们。图1提供了测序仪100的例证性实施例，其包含光学子系统和流体子系统。采用测序仪100以执行测序过程的实施方案可包括流体子系统中的各种流体组件、光学子系统中的各种光学组件以及在图1中未显示的其它组件，后者可以包括某些功能的局部控制的微处理器和/或微控制器组件。此外，如图1所示，测序仪100可以可操作地连接到一个或更多个外部计算机组件（诸如计算机130，其可以例如执行系统软件）或固件（诸如应用程序135，其可以提供一个或更多个组件和/或某些数据分析功能的指令控制）上。在相同的或替代性的实施方案中，可以通过网络150将计算机130连接至另一台计算机、内联网或互联网。在该实例中，测序仪100和/或计算机130或网络150可包括大致如上所述的实施方案的某些或所有组件和特性。

在本发明的一个方面，通过比对超过10,000个已知的HIV env序列，它们用于以非常低偏倚的方式产生至少2种直接用于所述测序用途中的扩增子，设计靶物特异性的引物。图2A提供了从引物产生的扩增子205和扩增子215的例证性实施例。在图2A中，扩增子205和215以交错的关系跨V3区排列，但是应当理解，扩增子205和215是示例性的，不应视作限制。例如，扩增子205和215可以从不同的引物组合生成，且具有不同的长度和覆盖。图2B显示了引物221、223、225和227，其中使用引物223和227的组合可以生成在图2A中所示的扩增子205，且使用引物221和225可以生成扩增子215。或者，可以有利地使用不同的引物组合生成不同的扩增子产物，诸如这样的扩增子产物，其具有在被长扩增子产物覆盖的区域内的短扩增子产物，其中被短产物覆盖的区域出现在两种扩增子中。两种策略会提供被扩增子“双重覆盖”的区域，这在扩增子产物之一不能适当扩增的情况下是有益的。在本实施例中，使用引物221和227可以产生长扩增子产物，使用引物223和225可以产生短扩增子产物。也应当理解，使用包括“交错的”和“短/长”扩增子策略的引物组合，可以产生多达4种扩增子。在某些实施方案中，使用有关的引物组合，在单独的反应中产生每种扩增子。或者，可以在单个反应室中合并和扩增引物，其中存在来自不同组合的代表性产物。例如，引物221、223和225可以组合进单个反应罐(即排除引物227)，生成2种不同长度的扩增子产物。尽管在某些可能优先生成一种扩增子超过另一种扩增子的情况下，该方案可能具有限制。

相关领域的普通技术人员也会理解，使用引物221、223、225和227，可以采用“嵌套”型扩增策略。例如，通常采用嵌套的PCR策略来减少污染的影响，所述污染通常由多个引物结合部位和不希望的扩增产物的产生所造成。在本实施例中，使用正向引物221和反向引物227（它们可能含有某些不希望的产物）可以生成第一组扩增产物。然后可以执行使用正向引物223和反向引物225和第一组扩增产物的第二轮扩增，其中第一组的不希望的产物不太可能具有引物223和225的结合部位，产生与希望的目标区域具有高得多的特异性的扩增产物集合。

在某些实施方案中，引物221/223和225/227的组合各自靶向足够长度的高度保守区域，以在组合中容纳两种引物(即正向引物种类或反向引物种类)。实际上，可能存在更邻近V3区的保守区域，其缺少足以设计针对靶物的两种引物种类的长度，由于有限的长度，这样的靶物可能是更不希望的。但是，本文所述的测序技术提供了足够的阅读长度，其允许引物靶向更远的区域，同时提供V3区的完全覆盖。实际上，具有低于300碱基对的阅读长度的测序技术不能使用所述的引物种类对整个V3区测序，这是由于它们有限的阅读长度。实际上，预测算法需要在克隆水平来自每个病毒的完整序列，因为在V3区的每个末端的序列组成对于向性类型的精确预测而言是重要的。在相同的或替代性的实施方案中，使用具有所述引物组合的2种扩增子方案(即第一扩增子的)会提高覆盖度和进化枝相容性，这是合乎希望的，特别对于诊断型应用。例如，使用2种第一扩增子方案会产生更有效的试验，这是单个第一扩增子方案所不能提供的。首先，2种扩增子的靶向产生会提供冗余，所以不会产生一种扩增子，例如由于目标区域中未预测的SNP或其它未知的序列组成的发生，存在成功地生成其它扩增子的大量可能性，这允许该过程继续。另外，在某些实施方案中，诸如所述的交错的第一扩增子方案，存在成功地生成两种扩增子，并以V3区的更大覆盖度进行测序的更大可能性，因为从头至尾的整个扩增子的测序效率。

重要的是，为了扩增混合物中的巨大量的序列而特异性地设计引物集合，因为临床样品含有多种病毒。例如，从在Los Alamos公开序列数据库中列出的>99.4%的所有(>10,000)进化枝B和C准种产生至少一种扩增子。这可以实现在临床血浆样品中存在的所有序列的非常低偏倚的扩增和快速的克隆测序，由此可以跨整个V3区检测所有变异(以高和低频率)。实际上，本发明的引物与占世界上HIV感染的大多数的进化枝A、B、C、D和G相容。正如普通技术人员会理解的，进化枝(也称作亚型) C占2004年全世界感染的50%，A占12%，B占10%，G占6%，D占3%。如上所述，认为本发明的引物也与进化枝F、H、J和K相容，它们共占2004年全世界HIV感染的0.94%，但是由于足够的序列信息的不一致，没有证实引物序列的特异性。普通技术人员也会理解，目前存在9个鉴别出的进化枝，它们用字母A-K指示，其中某些进化枝类型与特定地理区域有关。例如，HIV进化枝B常见于北美和欧洲，而进化枝C常见于南非和印度。

使用相关领域的普通技术人员已知的方法，可以执行已知的HIV序列的比对。例如，本领域可以得到许多序列比对方法、算法和应用程序，包括但不限于Smith-Waterman算法(Smith TF, Waterman MS (1981)。"Identification of Common Molecular Subsequences". Journal of Molecular Biology 147: 195-197，它为所有目的通过引用整体并入本文)、BLAST算法(Altschul, S.F., Gish, W., Miller, W., Myers, E.W. & Lipman, D.J. (1990) "Basic local alignment search tool." J. Mol. Biol. 215:403-410，它为所有目的通过引用整体并入本文)、和Clustal (Thompson JD, Gibson TJ, Plewniak F, Jeanmougin F, Higgins DG (1997)。The ClustalX windows interface: flexible strategies for multiple sequence alignment aided by quality analysis tools. Nucleic Acids Research, 25:4876-4882，它为所有目的通过引用整体并入本文)。序列与单个序列的比对，会提供HIV序列群体的最频繁的序列组成的共有序列。也在本实施例中，软件应用程序可以相对于比对的共有序列绘制向性分型的目标区域以及引物序列的目标区域。目标区域包括已知易于突变的区域，且可能有助于病毒向性分型。然后可以为比已知的突变易感区域更保守(即突变的可能性更低)的共有序列区域，设计引物集合。为比已知的突变易感区域更保守(即突变的可能性更低)的共有序列区域，设计本文公开的引物集合。引物设计靶向具有低突变率的序列区域的优点包括，可靠地使用设计的引物的能力，没有由于目标区域的变异（其会使引物不能结合）导致失败的巨大风险，以及对于多个进化枝使用相同引物集合的可能性。另外，本领域普通技术人员会理解，在共有序列的可以视作“保守”区的区域内的某些位置，它们的组成仍然可能变化，且被视作“简并”位置。在某些优选的实施方案中，用于引物设计的参数包括，在下述情况下，在引物组成中的位置处插入简并碱基：其中在用于测定共有序列的多个序列比对中，在该位置处存在小于98%频率的核苷酸物质。另外，影响结合目标区域和引物组成的选择的其它参数包括，将简并位置限制为仅具有2个备选核苷酸物质的那些，以及将引物组成限制为不超过2个简并位置，以降低在扩增反应中形成引物二聚体的风险。在某些实施方案中也希望，将简并位置限制为引物组成的最后5个序列位置(即在正向引物的3’末端和反向引物的5’末端)，因为就结合效率而言，使最后5个位置高度保守是有利的。例如，简并序列位置通常具有多个可能的不同的核苷酸物质，其作为备选序列组成发生在该位置。简并碱基是本领域熟知的，且用IUPAC标识表示不同类型的简并，所述IUPAC标识表示与该类型有关的备选核苷酸组成。例如，IUPAC标识R 表示，嘌呤碱基(即A和G)是备选可能性。

本发明的实施方案包括下述引物种类，它们用于生产至少2种适合高通量测序的扩增子:

本领域普通技术人员会理解，引物集合的序列组成存在某些变异性，且与公开的引物序列具有90%或更大的同源性视作在本发明的范围内。例如，引物集合的目标区域可以轻微移位，因而，预见到引物序列组成中的某些差异。另外，可以对共有序列进行细化，指示目标区域中序列组成的轻微差异，并类似地预见到引物序列组成中的某些变异。

如上所述，使用本发明的引物实施方案，生产至少2种扩增子。例如，普通技术人员会理解，可以同时采用短/长和交错的扩增子方案，其会提供V3区的基本上4X覆盖。如果采用交错的扩增子策略，V3-1扩增子包含389碱基对的平均长度，且V3-2扩增子包含393碱基对的平均长度。或者，如果采用交错的短/长策略，V3-短扩增子包含348碱基对的平均长度，且V3-长扩增子包含434碱基对的平均长度。另外，本发明的引物实施方案会可靠地且有效地生成希望的扩增子。例如，使用短/长扩增子策略(即从V3-2F – V3-1R生成短扩增子；并从V3-1F -V3-2R生成长扩增子)，以113至242 ng/μl的浓度生成扩增子。也使用交错的扩增子策略 (即从V3-1F– V3-1R生成一种扩增子；并从V3-2 F-V3-2R生成第二扩增子)，以113至251 ng/μl的浓度生成扩增子。

在某些实施方案中，将衔接子元件连接到扩增子的末端，其包含另一种通用引物，该引物用于从单个扩增子的第二轮扩增，生成克隆拷贝群体(即生成第二扩增子)。应当理解，衔接子也可以包括本说明书别处所述的其它元件诸如质量控制元件，其它引物诸如测序引物和/或扩增引物(或能起扩增和测序引物功能的单个引物)、独特的标识符元件(即如上所述的MID元件)等。另外，在某些实施方案中，上述的靶物特异性的引物可以与可在后续加工步骤中使用的一种或更多种其它元件相组合。例如，单链核酸分子可以在一个末端包含靶物特异性的引物序列，具有邻近的额外序列元件。靶物特异性的引物与目标区域杂交，可能有其它元件悬出（hang off），这是由于它们的序列组成与紧靠目标区域的侧接序列的非互补性质，其中扩增产物包括目标区域的拷贝以及额外序列元件。

在本发明的某些实施方案中，使用靶物特异性的引物，从HIV RNA生成第一链cDNA。在一个实施方案中，使用单个引物，例如在下面关于图5所示的方法所述的缺少测序衔接子(也称作SAD)的V3-1R引物，可以生成第一链cDNA。随后，使用靶物特异性的引物/加工元件策略，生成至少2种扩增子(即扩增子短/长或交错策略，或来自两种策略的一个或更多个扩增子成员的组合)。由于它们与引物的结合，得到的扩增子因而包含必需的加工元件。

也在优选的实施方案中，使用上述的基于乳液的PCR扩增策略进行第二轮扩增，其通常产生第二扩增子在珠粒基底上的固定化的克隆群体，其有效地隔离第二扩增子，防止当乳液破碎时扩散。典型地，然后如本说明书别处所述，平行地对数千第二扩增子测序。例如，可以将含有第二扩增子的固定化群体的珠粒装载上反应环境基底105，并使用测序仪100加工，其从每个样品产生>1000克隆读数，并将序列数据输出到计算机130上，用于加工。计算机130执行专门的软件，以鉴别来自样品的1%丰度或更低的变体。

图3 提供了序列分析软件输出的例证性实施例，包括界面300，后者包括多个方格，并为用户101提供了共有序列303与多个序列305相比对的视觉显示，所述序列305每个来自单个HIV RNA分子的单个读数。界面300也鉴别碱基调用310，其与共有序列303存在序列组成差异，其中这样的鉴别可以包括以不同颜色、粗体、斜体或相关领域已知的其它可视表示手段高亮显示的碱基调用310。界面300也为用户101提供了通过参照序列303中的碱基位置对样品中检出的变异320的水平的可视表示以及在那些碱基位置处序列读数330的数目的表示。在图3的实施例中，通过检查克隆读数，可以容易地测定在样品中以1%或更低的频率出现的变体，在所示的实施例中，从临床样品产生了>60,000个读数(正向或反向测序方向)，完全或部分覆盖V3。

还可以通过软件应用程序的相同或不同的实施方案，进一步分析序列数据，以将来自每个读数的序列信息与与向性类型有关的已知单元型相关联，其中来自单个读数的序列数据可以包含或不包含来自共有序列的变异。本文使用的术语“单元型”通常是指与核酸序列有关的等位基因的组合，所述核酸序列在HIV的情况下包括HIV RNA序列。本领域普通技术人员会理解，所述关联可以包括使用一个或更多个专门的数据结构，例如一个或更多个数据库，其储存单元型和/或向性关联信息。软件应用程序可以包括数据结构或以已知的方式与数据结构交流，以从数据结构提取信息和/或为数据结构提供新的信息。

图4A和4B提供了这样的序列分析软件输出的例证性实施例，且分别包括界面400’和400’’。两个实施例400’和400’’都例证了鉴别的单元型405；在长扩增子413、短扩增子415、V3-1扩增子417和V3-2扩增子419中鉴别出单元型的频率；向性调用425，和单元型序列435。普通技术人员会理解，界面400’提供了单元型405中的“ntHap006”的参照，其与向性调用425中的X4向性类型相对应。也应当理解，界面400’’提供了单元型405中的“ntHap004”的参照，其以小于1%的频率在每个扩增子413、415、417和419中鉴别出。

如上所述，平行地测序许多核酸模板，会提供本发明所需的灵敏度。例如，基于二项式统计，完全装载60 mm x 60 mm PicoTiterPlate (2 X 10⁶高品质碱基，由200,000 x 100碱基读数组成)的检测下限(即，一个事件)，是95%置信度（对于等位基因频率是至少0.002%的群体）和99%置信度（对于等位基因频率是至少0.003%的群体）(也应当理解，可以如上所述采用70 x 75 mm PicoTiterPlate，其允许甚至更大的读数数目和因而增加的灵敏度)。为了对比，通过基于焦磷酸酯的测序所进行的SNP检测已经报道了四倍体基因组上单独等位基因状态的检测，只要最低频率的等位基因存在于10%或更多的群体中(Rickert 等人, 2002 BioTechniques. 32:592-603)。常规的荧光DNA测序甚至更不灵敏，经历麻烦的分辨50/50(即，50%)杂合子等位基因 (Ahmadian 等人, 2000 Anal. BioChem. 280:103-110)。

表1显示了对于给定数目N (=100)的测序扩增子，基于SNP在总群体中的发生率，检测0或1或更多个事件的概率。“*”表示当发生率是5.0%时，没有检出至少1个事件的3.7%的概率；类似地，“**”表示当发生率是7%时，没有检出1个或更多个事件的0.6%的概率。

该表因而表明，检测在5%水平存在的SNP的置信水平是95%或更好，且类似地，检测在7%水平存在的SNP的置信水平是99%或更好。

表 1

自然地，多路分析具有比检测深度更大的适用性，且表2显示了可以在单个picotiter平板上同时筛选的SNP的数目，在95%和99%置信度可检测的最低等位基因频率。

表2

图5提供了鉴别HIV V3区中的低频率变异的方法的一个实施方案的一个例证性实施例，其包括初期样品输入的步骤503。为了连贯地检测低至3%频率的微小变体，用于该方法中的HIV-1 RNA样品要求160 IU/μl的最低病毒含量，如通过Artus HIV 实时定量PCR试验(可从Artus Biotech GmbH得到)所测得的。为了检测低至1%频率，最低病毒含量应当是至少500 IU/μl。

如果定量RNA样品不实用，可以在至少140 μl血浆上进行RNA提取，放入最多60 μl的总洗脱物中（如果血浆中的最初病毒负载是100,000拷贝/ml）。对于更低的病毒负载，相应地放大血浆的量，并在20,600 rpm 4℃沉淀病毒1小时30分钟。取出足够的上清液，剩下140 μl浓缩物，用于提取程序。为几个样品建立PCR和序列副本反应，以验证低频率变体的一致检测。

接着，如步骤505所示处理RNA样品，以从HIV样品群体产生一个或更多个cDNA模板。使用下述程序，可以从样品产生cDNA:

1. 把96孔平板放入冷却器中

2. 加入11.5 μl RNA/孔

3. 加入0.5 μl引物V3-1R

在65℃温育10分钟，然后立即将试管置于冰上。

制备反转录酶(RT)混合物，根据试管数放大:

1. Transcriptor RT反应缓冲液 (购自Roche) 4 μl

2. Protector RNase抑制剂 (购自Roche) 0.5 μl

3. dNTPs 2 μl

4. DTT (购自Roche) 1 μl

5. Transcriptor 反转录酶 (购自Roche) 0.5 μl

通过涡旋简单混合，并放在冰上，直到加入RNA样品。

6. 加入 8 μl RT混合物/孔

7. 密封平板，并简单离心

8. 置于热循环仪中，并运行下述cDNA程序

60 min, 50℃

5 min, 85℃

4℃持续

9. 加入1 μl RNA酶H (购自New England Biolabs)/孔

10. 置于37℃热循环仪块中(加热盖设定在50℃或以上) 20 min。

11. 立即进行扩增子生产，或在-80℃储存cDNA。

随后，如步骤510所示，使用下述程序，采用区域特异性的引物对，从在步骤505中生成的cDNA模板扩增目标区域。

1. 下述的13x混合物对于1个96孔平板是足够的(2个扩增子, 47个样品 + 1对照)。根据需要，可以放大或缩小该方法。

2. 标记2个1.5 ml离心试管“V3-1”和“V3-S”。这些标记是指下述的扩增子/引物集合:

(注：除了上述的靶物特异性的引物序列以外，下述引物包括下述元件: +6碱基，正向=CGTATC, 反向=CTATGC; 对正向和反向引物特异性的SAD序列；和关键元件=TCAG)

3. 如果实验需要多路标识物(MIDs)，则对于每个扩增子集合，加入对应的MID引物。例如，如果使用MID1，则引物集合A的所有引物应当具有加入引物中的MID1（用于正向和反向）。MID 序列是10碱基对长，且应当在序列衔接子序列之后插入引物，并在靶引物序列之前且与其紧邻。

4. 在每个试管中，制备PCR主混合物，其含有标签指示的引物集合:

5. 吸量22 μl “V3-1” PCR主混合物到第一行的每个孔中。

6. 吸量22 μl “V3-S” PCR主混合物到第二行的每个孔中。

7. 根据下述方案 (每列1种样品)，加入3 μl cDNA/孔。

8. 第11列中的阳性对照是已知的样品cDNA，第12列中的阴性对照是来自cDNA合成平板的水对照。

9. 用平板密封物覆盖平板。

10. 在900xg离心平板30秒。

11. 将平板置于热循环仪块中，并运行程序“Ti_V3Amp”

94℃ 3 min

40个循环:

72℃ 45秒

72℃ 8 min

4℃持续

12. 如果不立即进行下一步，在冰上(对于当天处理)或在-20℃储存平板。

在某些实施方案中，然后可以如步骤513所示，使用相关领域已知的固相可逆固定化(也称作SPRI)或凝胶截断方法（对于尺寸选择），净化或纯化在步骤510中产生的扩增子。例如，可以使用下述过程，进行扩增子纯化:

1. 在900 x g离心平板30秒。

2. 使用8-通道多头吸移管，吸量22.5 μl 分子级水到96-孔圆底PP平板 (购自Fisher Scientific)的第1-11列中的每个孔中。

3. 从PCR平板转移22.5 μl PCR产物到圆底PP平板的每个孔中；对于2个平板，保持相同的安排。

4. 将72 μl SPRI 珠粒加入每个孔，并通过上下抽吸至少12次彻底混合，直到SPRI 珠粒/ PCR混合物是均匀的。

5. 在室温温育平板10 min，直到上清液澄清。

6. 把平板放置在96-孔磁环工作台(购自Ambion, Inc.)上，并在室温温育5 min。

7. 在平板仍然在磁环工作台上时，小心地取出并抛弃上清液，不扰乱珠粒。

8. 从磁环工作台取下PP平板，并加入200 μl新制备的70%乙醇。

9. 将PP平板返回磁环工作台。轻打或在磁环工作台上前后地/圆周运动地移动PP平板约10次，以搅拌溶液，并辅助沉淀物分散 (沉淀物可能不会完全分散；这是可接受的)。

10. 将PP平板放在磁环工作台上，并温育1 min。

11. 在平板仍然在磁环工作台上时，小心地取出并抛弃上清液，不扰乱珠粒。

12. 重复步骤8-11。去除尽可能多的上清液。

13. 将PP平板/磁环工作台一起放置在设定在40℃的加热块上，直到所有沉淀物彻底干燥(10-20 min.)

14. 将10 μl 1X TE (pH 7.6 ± 0.1)加入每个孔。轻打/在磁环工作台上同样地前后地/圆周运动地移动PP平板，直到所有沉淀物分散。

15. 将PP平板放在磁环工作台上，并温育2 min。

16. 从每个孔吸量上清液到新的96-孔(黄色)平板。很难避免一些孔中的沉淀物的任何转移；这是可接受的。

17. 给平板盖上平板密封物，并在-20℃储存。

在一个或更多个实施方案中，定量扩增子也可能是有利的。在本实施例中，可以使用下述过程进行扩增子定量:

1. 使用本领域已知的方法，用PicoGreen® 试剂定量1 μl这样的扩增子。

2. 定量等于或低于5 ng/μl 的任意扩增子应当在2100 Bioanalyzer (购自Agilent Technologies)上进一步评价：将1 μl每种纯化的扩增子装载上Bioanalyzer DNA芯片，并运行DNA-1000系列II试验。

a. 如果存在预期大小的带，且以3:1或更低的摩尔比看到引物二聚体，使用PicoGreen定量，并进行扩增子合并。

b. 如果存在预期大小的带，且以大于3:1的摩尔比看到引物二聚体，重复SPRI和PicoGreen定量，随后进行Bioanalyzer分析，以证实引物二聚体的去除。

3. 在Bioanalyzer 上分析1 ul阴性PCR对照反应物。不应当看到除了引物二聚体以外的带。

接着，如步骤515所示，如本说明书别处所述，选择来自扩增子的核酸链，并导入乳液小滴，并扩增。在某些实施方案中，每种样品可以建立2种乳液，1种使用Amplicon A试剂盒，1种使用Amplicon B 试剂盒，二者都购自454 Life Sciences Corporation。应当理解，在不同的实施方案中，可以采用不同数目的乳液和/或不同的试剂盒。使用下述过程，可以为最终的混合物选择扩增子：

1. 为每个样品生产2种扩增子，它们各自理想地以等摩尔量相混合，用于emPCR反应。由于并非所有扩增子都以相同的效率产生，偶尔产生非常少的扩增子，但是可能替代性地存在大量引物二聚体。为了达到最佳测序结果，重要的是，对于每个样品的最终混合物，仅使用确定地定量的和相对纯的(参见下面)扩增子，即使当一些扩增子的质量低于标准时。由于不同扩增子之间的大量重叠，这是可能的，因为并不需要完全覆盖给定样品的所有2种扩增子。当不可得到2种高质量扩增子的集合时，遵循下述规则来为每个样品的最终混合物选择扩增子:

i. 如果扩增子在Bioanalyzer上没有被识别为可量化的带，在6.2中不把它用于最终扩增子混合物。

ii. 如果引物-二聚体与扩增子的摩尔比是3:1或更高，不用于最终的扩增子混合物。该测量仅可用于低浓度扩增子，其在6.1的Agilent Bioanalyzer试验中进一步定量。

iii. 如果扩增子不满足上述标准，或总是错过(missing)，根据下述方案，增加其它重叠的扩增子的量：

2. 如果扩增子V3-1错过，倍增扩增子V3-S的量。

3. 如果扩增子V3-S错过，倍增扩增子V3-1的量

4. 如果扩增子V3-1和V3-S都错过，不能对V3区测序。对于这些扩增子，重复PCR。

也作为步骤515的一部分，可以将下述的混合和稀释扩增子的过程用于emPCR中:

1. 使用下述方程，计算源自给定的样品的2种扩增子各自的浓度，按照分子/μl计算:

2. 制备2种扩增子各自的10⁹分子/μl稀释液:

向1 μl扩增子溶液中，加入下述体积的1 x TE:

3. 混合等体积的2种扩增子各自的稀释液，例如，10 μl。如果错过任一个扩增子，根据步骤505中的指导，增加重叠扩增子的体积。

4. 通过将1 μl 10⁹分子/μl溶液加入499 μl 1xTE，将混合的扩增子进一步稀释至2x10⁶分子/μl。

5. 在具有o-环帽的0.5 ml试管中，在-20℃储存最终稀释液(2x10⁶分子/μl)。

扩增后，如步骤520所示，破碎乳液，并富集含有扩增的固定化的核酸群体的珠粒。例如，可以如本说明书别处所述富集含有DNA的珠粒，其可以包括下述过程组件：

1. 在即将建立乳液之前，制备来自6.3.4的2x10⁶分子/μl溶液的10-倍稀释液，这通过将10 μl加入90 μl珠粒洗涤缓冲液来实现。涡旋5秒，进行混合。

2. 对于每个样品，制备1份A和1份B乳液，它们含有1 cpb (即，12 ul上述稀释液/乳液(2,400,000 珠粒))。

3. 为了更容易操作，在破碎过程中，可以合并给定样品的2份乳液。

然后如步骤530所示，对富集的珠粒测序。在某些实施方案中，如在本说明书别处所述，对每个样品测序。例如，在为测序富集和加工后，将每个泳道的来自合并的乳液的80,000珠粒(包括阳性对照样品)装载上70x75金属化的PTP，其配有16-泳道衬垫，并在GS-FLX 仪器 (购自454 Life Sciences Corporation)上测序。

GS-FLX测序仪包含3个主要部件: 流控子系统、光导纤维载玻片筒/流室和成像子系统。试剂进入管、多阀歧管和蠕动泵形成流控子系统的一部分。将单一试剂连接到适当的试剂进入管，其允许以预先编程的流速和持续时间，将试剂递送进流室，一次递送一种试剂。光导纤维载玻片筒/流室在载玻片的蚀刻侧面和流室顶之间具有250 μm空隙。流室也包括试剂的温控装置和光导纤维载玻片以及不透光的外壳。载玻片的抛光的(未蚀刻的)侧面放置成直接接触成像系统。

通过流控系统的预先编程的操作，实现测序试剂向光导纤维载玻片孔中的循环递送和测序反应副产物从孔洗出。所述程序通常写成界面控制语言(ICL)脚本的形式，指定试剂名称(洗液、dATPαS、dCTP、dGTP、dTTP和PPi标准品)、流速和每个脚本步骤的持续时间。例如，在一个可能的实施方案中，流速可以设定为4 mL/min（对于所有试剂），流室内的线速度接近约1 cm/s。可以将测序试剂的流动次序组织成核，其中第一个核包含PPi流(21秒)，随后是14秒底物流、28秒腺苷三磷酸双磷酸酶洗液和21秒底物流。第一个PPi流之后可以是21个dNTP流的循环(dC-底物-腺苷三磷酸双磷酸酶洗液-底物dA-底物-腺苷三磷酸双磷酸酶洗液-底物-dG-底物-腺苷三磷酸双磷酸酶洗液-底物-dT-底物-腺苷三磷酸双磷酸酶洗液-底物)，其中每个dNTP流由4个单个的核组成。每个核是84秒长(dNTP-21秒、底物流-14秒、腺苷三磷酸双磷酸酶洗液-28秒、底物流-21秒)；在21秒之后和63秒之后，捕获图像。21个dNTP流循环后，导入PPi核，然后是另外21个dNTP流循环。测序运行结束后，是第三个PPi 核。总运行时间是244分钟。完成该运行所需的试剂体积如下：500 ml每种洗涤溶液，100 ml每种核苷酸溶液。在运行过程中，所有试剂保持在室温。流室和流室进料管的温度控制在30℃，并将进入流室的所有试剂预热至30℃。

随后，如步骤540所示，分析输出序列数据。在某些实施方案中，使用专门的扩增子软件，处理含有为高质量过滤过的流程图数据的SFF文件，并分析数据。

应该理解，上述步骤仅是为了例证目的，无意进行限制，且进一步，在不同的实施方案中，可以以不同的组合采用一些或所有步骤。例如，在上述方法中采用的引物可以与其它引物集合相组合，用于查询其它HIV特征/区域，以提供更综合的诊断或治疗益处。在本实施例中，这样的组合可以“干燥地（dry down）”提供在平板上，并包括所述的向性引物以及用于检测HIV抗药性或整合酶区以及任何其它目标区域的一些或所有引物。其它实施例公开在2008年3月14日提交的标题为“System and Method for Detection of HIV Drug Resistant Variants”的PCT申请系列号US 2008/003424和/或2008年12月1日提交的标题为“System and Method for Detection of HIV Integrase Variants”的美国临时专利申请系列号61/118,815中，它们各自为所有目的通过引用整体并入本文。

序列表

<110> Binderup Simen, Birgitte

St. John, Elizabeth P.

<120> 用于检测HIV向性变体的系统和方法

<130> 21465-540001US

<140> To be assigned

<141> 2009-06-15

<150> US 61/077,356

<151> 2008-07-01

<160> 16

<170> PatentIn version 3.5

<210> 1

<211> 25

<212> DNA

<213> 人工的

<220>

<223> 寡核苷酸引物

<400> 1

tcagcacagt acartgyaca catgg 25

<210> 2

<211> 24

<212> DNA

<213> 人工的

<220>

<223> 寡核苷酸引物

<400> 2

cattacaatt tctrggtcyc ctcc 24

<210> 3

<211> 25

<212> DNA

<213> 人工的

<220>

<223> 寡核苷酸引物

<400> 3

caactcaact rctgttaaat ggyag 25

<210> 4

<211> 24

<212> DNA

<213> 人工的

<220>

<223> 寡核苷酸引物

<400> 4

tgttgtatta cagtagaara aytc 24

<210> 5

<211> 50

<212> DNA

<213> 人工的

<220>

<223> 寡核苷酸引物

<400> 5

cgtatcgcct ccctcgcgcc atcagtcagc acagtacart gyacacatgg 50

<210> 6

<211> 49

<212> DNA

<213> 人工的

<220>

<223> 寡核苷酸引物

<400> 6

ctatgcgcct tgccagcccg ctcagcatta caatttctrg gtcycctcc 49

<210> 7

<211> 50

<212> DNA

<213> 人工的

<220>

<223> 寡核苷酸引物

<400> 7

cgtatcgcct ccctcgcgcc atcagcaact caactrctgt taaatggyag 50

<210> 8

<211> 54

<212> DNA

<213> 人工的

<220>

<223> 寡核苷酸

<400> 8

aggtagaaaa ttaagagaac aatttaataa tagaacaata gtctttaatc aatc 54

<210> 9

<211> 54

<212> DNA

<213> 人工的

<220>

<223> 寡核苷酸

<400> 9

aggtagaaaa ttaagagaac aatttaataa tagaacaata gtctttaatc actc 54

<210> 10

<211> 54

<212> DNA

<213> 人工的

<220>

<223> 寡核苷酸

<400> 10

aggtaaaaaa ttaagagaac aatttaataa tagaacaata gtctttaatc actc 54

<210> 11

<211> 54

<212> DNA

<213> 人工的

<220>

<223> 寡核苷酸

<400> 11

aggtagaaaa ttaagagaac aatttaataa tagaacaata gtctttaacc actc 54

<210> 12

<211> 54

<212> DNA

<213> 人工的

<220>

<223> 寡核苷酸

<400> 12

aggtagaaaa ttaagagaac aatttaataa tagaacaata gtctttaacc aatc 54

<210> 13

<211> 23

<212> DNA

<213> 人工的

<220>

<223> 寡核苷酸

<400> 13

tgtacaagac ccaacaacaa tac 23

<210> 14

<211> 23

<212> DNA

<213> 人工的

<220>

<223> 寡核苷酸

<400> 14

tgtacaagac ccagcaacaa tac 23

<210> 15

<211> 25

<212> DNA

<213> 人工的

<220>

<223> 寡核苷酸

<400> 15

tgtacaagac ccaacaataa tacaa 25

<210> 16

<211> 25

<212> DNA

<213> 人工的

<220>

<223> 寡核苷酸

<400> 16

tgtacaaggc ccaacaataa tacaa 25

Claims

1.用于检测与抗药性有关的一个或更多个HIV序列变体的低频发生的方法，其包含下述步骤：

(a) 从HIV样品群体中的每个RNA分子产生多个cDNA物质；

(b) 从所述cDNA物质扩增至少一种第一扩增子，其中每种第一扩增子包含多个扩增的拷贝，并用一对界定所述第一扩增子的基因座的核酸引物扩增；

(b) 克隆地扩增第一扩增子的扩增拷贝，以生成多个第二扩增子，其中多个第二扩增子包含来自第一扩增子的扩增拷贝之一的基本上相同的拷贝的固定化群体；

(c) 在单个基底上平行地测定来自至少100个固定化群体的基本上相同的拷贝的核酸序列组成；和

(d) 检测在至少100个固定化群体的核酸序列组成中以5%或更低的频率出现的一个或更多个序列变体；和

(e) 将检测的序列变体与与HIV向性有关的变异相关联。

2.权利要求1的方法，其中：

已知与HIV向性有关的变异与共受体有关，所述共受体优选地选自CCR5和CXCR4。

3.权利要求1的方法，其中：

产生cDNA物质的步骤生成2种cDNA物质，它们优选地具有重叠的序列组成。

4.权利要求1的方法，其中：

HIV样品群体源自单个患者。

5.权利要求1的方法，其中：

多个第一扩增子包含2种扩增子。

6.权利要求1的方法，其中：

第一扩增子的引物对靶向低突变频率的区域。

7.权利要求1的方法，其中：

第一扩增子的引物对被设计用于扩增选自下述的HIV进化枝区域：进化枝A、进化枝B、进化枝C、进化枝D和进化枝 G。

8.权利要求7的方法，其中：

第一扩增子的引物对包含选自下述的引物对组：V3-1F (SEQ ID NO:: 1)和V3-1R (SEQ ID NO:: 2)；V3-2F (SEQ ID NO:: 3)和V3-2R (SEQ ID NO:: 4)；V3-1F (SEQ ID NO:: 1)和V3-2R (SEQ ID NO:: 4)；和V3-2F (SEQ ID NO:: 3)和V3-1R (SEQ ID NO:: 2)。

9.权利要求1的方法，其中：

第一扩增子的基因座包括与V3区有关的HIV区域，其优选是HIV包膜区。

10.权利要求1的方法，其中：

使用一对通用引物扩增第二扩增子。

11.权利要求1的方法，其中：

检测步骤采用仪器，所述仪器包含单个检测装置，该装置能检测从在单个基底上进行的多个测序反应产生的信号。

12.用于执行权利要求1的方法的试剂盒，其包含:

一对或更多对选自下述的引物：V3-1F (SEQ ID NO:: 1)和V3-1R (SEQ ID NO:: 2)；V3-2F (SEQ ID NO:: 3)和V3-2R (SEQ ID NO:: 4)；V3-1F (SEQ ID NO:: 1)和V3-2R (SEQ ID NO:: 4)；和V3-2F (SEQ ID NO:: 3)和V3-1R (SEQ ID NO:: 2)。