CN101896623B - 寡核苷酸及其应用 - Google Patents

寡核苷酸及其应用 Download PDF

Info

Publication number
CN101896623B
CN101896623B CN2008801199852A CN200880119985A CN101896623B CN 101896623 B CN101896623 B CN 101896623B CN 2008801199852 A CN2008801199852 A CN 2008801199852A CN 200880119985 A CN200880119985 A CN 200880119985A CN 101896623 B CN101896623 B CN 101896623B
Authority
CN
China
Prior art keywords
oligonucleotide
target polynucleotide
series connection
dna
probe
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2008801199852A
Other languages
English (en)
Other versions
CN101896623A (zh
Inventor
尼特亚·加雷
保罗·德贝纳姆
戴维·约翰·弗伦奇
丽贝卡·霍华德
戴维·戈登·麦克道尔
汤姆·布朗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LGC Ltd
Original Assignee
LGC Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GB0720675A external-priority patent/GB0720675D0/en
Priority claimed from GB0815113A external-priority patent/GB0815113D0/en
Application filed by LGC Ltd filed Critical LGC Ltd
Publication of CN101896623A publication Critical patent/CN101896623A/zh
Application granted granted Critical
Publication of CN101896623B publication Critical patent/CN101896623B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism

Abstract

本发明涉及用于确定靶多核苷酸内串联重复的数目的方法,所述方法包括:(a)提供包含所述靶多核苷酸的样品,其中所述靶多核苷酸内的一个或多个串联重复是单链形式,(b)使经标记的探针寡核苷酸与靶多核苷酸的单链部分杂交,其中所述探针寡核苷酸与所述靶多核苷酸的单链部分中的至少一个串联重复互补,并且所述探针寡核苷酸中的至少5个核苷酸与所述靶多核苷酸的单链部分中的串联重复互补,和(c)基于所述探针寡核苷酸与所述靶多核苷酸的单链部分的杂交,确定所述靶多核苷酸内串联重复的数目。

Description

寡核苷酸及其应用
本发明涉及寡核苷酸,特别涉及寡核苷酸在检测DNA内串联重复中的应用。
已知多种用于检测特异DNA序列并评价已知单核苷酸多态性(SNP)的技术和探针系统,包括均相聚合酶链式反应(PCR)、TaqManTM探针、Eclipse探针、分子信标、Scorpion引物、简便杂交探针、ResonSense探针、GenePin探针和杂交信标
Figure GPA00001153669100011
这些内容例如在本申请人较早期的专利申请WO 01/73118和WO 2007/010268中被讨论。
尽管许多DNA多态性和突变是SNP,但很多是由于DNA序列的串联重复造成的。目前,通常通过如在PCR扩增靶DNA序列后的大小分析或DNA测序来分析基因组DNA中的此类重复。尽管曾尝试使用寡核苷酸探针系统来鉴定DNA中的串联重复(例如,参见Radtkey et al(2000)Nucl.Acids Res.28,e17(i-vi)),但迄今为止尚没有使用杂交探针分析这些重复序列的实践方法。
Alec Jeffreys根据其有关人类基因组内重复DNA序列的发现(Jeffreys1985a,1985b),发明了DNA指纹或DNA图谱分析(DNA profiling)。发现所谓STR(短串联重复)或VNTR(可变数目串联重复)的重复序列在不同个体内的长度不同。在首次描述的DNA图谱分析中,通过使用限制性酶(在特异的核苷酸序列处切割DNA的酶)分型了很多此类基因座,其中该限制性酶基于酶识别序列之间重复序列的重复数目释放长度不同的片段。在那些早期的DNA图谱分析中,在琼脂糖凝胶上分离片段,并且通过使用放射性DNA探针鉴定包含目标STR的特异片段。这是复杂且耗时的方法,而自从首次描述DNA图谱分析和特性确定(identity determination)后,大量的改进和研发已经对此方法产生了极大的影响,提高了分析的容易性,并由此提高了可处理样品的数量,以及辨识能力和成本。
在该方法的最新形式中,使用聚合酶链式反应(PCR)扩增STR基因座,随后通过如毛细管电泳(CE)的技术将其分离。在英国,每年处理包括从常规口腔拭样到严重犯罪现场样品在内的数以万计的样品,用于与目前拥有超过200万此类图谱的国家DNA数据库进行比较。
尽管在紧急情况下,实验室具有在短至单个工作日内由例如口腔拭样的简单样品生成图谱的能力,但是难以想象如何能对于所有的样品在常规基础上实现这一点。此外,如果考虑从样品收集至到达实验室的时间,显然无法及时测定大部分图谱。结果,常常在DNA图谱被获得并分析前在没有其他证据的情况下而不得不释放被捕的嫌疑人。这样做的结果可能是,某个因相对较小的犯罪而被逮捕并随后又被释放的个体在此后可能被确定为严重犯罪的主犯,对于此类主犯,如果真的能确定其位置,则必须将其重新逮捕。这个过程不仅耗时多且成本高,而且还存在该个体实施其他潜在的严重犯罪的风险,而如果能够在该个体仍被拘留期间获得所述图谱分析,则完全可能防范这种风险。
目前基于PCR的方法包括DNA提取、STR扩增、基于CE的大小分离和分析,此方法的各个方面以及所用设备的成本和复杂性意味着STR图谱分析主要局限于专业实验室,其结果又制约了最终完成的周转时间。然而,如果要使图谱分析变得足够快速以至于能够在个体仍被拘留期间通过常规方式获得结果,就必须找到能够进行原位分析的方法。
在其他非法医DNA分析中,已有使用均相PCR的适合方法,其中通过荧光的简单变化在同一试管中进行DNA的扩增和分析。现已将多种此类基于荧光的探针系统,包括HyBeacon和TaqMan探针(参见WO 01/73118和WO 2007/010268的综述)用于测定DNA序列中的变异,例如单核苷酸多态性(SNP)插入和删除。然而,此类探针尚未用于测定对于如STR或其他DNA序列分析所要求的较长的长度多态性,实际上也不知道使用均相探针系统如何能够测定这些长度多态性。
已有多个小组描述了均相探针系统,其能够使在单个管中进行PCR产物分析,该分析使用例如扩增首先被检测的循环以提供一条DNA序列在另一条中的相对定量(例如用于食品分析中各类动物样品的混合物),或者提供一个等位基因变体在另一个中的相对定量(例如用于关于单核苷酸多态性或SNP的基因分型以及载体状态)。本发明的发明人此前描述了新型的荧光探针系统HyBeacons,其能够鉴定微小的序列差异,例如SNP,或者小插入或缺失,因为这些差异显著地影响解链温度,HyBeacons结构的新性质使其能够完成这一点。此类方法可通过SNP分型以均相且可能便携的方式鉴别个体。然而,现有的数据库通常基于STR,这是因为与在每个基因座通常仅具有2个等位基因的SNP相比,在每个基因座平均具有10个等位基因的STR的可变性明显大很多。因此,英国法医DNA图谱分析的工业标准为来自AppliedBiosystems的包含10个STR的SGM+试剂盒,而性别测试优先可选的SNP分型组(alternative SNP typing panel),SNP分型组需要约50-100个SNP的区域以获得个体鉴定的可比较水平。显然,尽管SNP组可用于比较个体样品,但是目前只有基于STR的数据库,个体样品可与之进行比较。
在使STR分型能够在专业实验室之外的背景中应用的尝试中,曾试图通过使用微型化CE而将标准图谱分析方法的各个步骤组合成均相的形式。此类微型化系统的主要优点是由较短的毛细管获得更快速的分析。通常将此类毛细管蚀刻在显微镜载玻片中,并且通常深10-50μm,宽50μm,长度在几个厘米的范围,并且由玻璃盖玻片密封(Wooley and Mathies,1994)。还描述过其他可选形式,例如使用注入成型的塑料(McCormick et al,1997)。
与更为常见的柱长36cm的ABI系统相反,用于Promega PowerPlexTM1.1STR试剂盒的长数个厘米的微型化CE柱能够将分离时间从约45分钟减少至仅2.5分钟(Schmalzing et al,1999)。还曾描述过可在仅2分钟内同时分析多达96个样品的毛细管阵列系统(Shi et al,1999),以及最近开发的多色系统,不过其分离时间相对较长(Goedecke et al,2004)。
还需要在分离前扩增DNA的便携式PCR系统,现已证明了多种此类系统,范围涉及从已证实用于4个基因座的由电池供电的系统(Belgrader et al,1998),到集成微芯片CE装置的系统(Lagally et al,2001)。今后面临的挑战之一将是使用具有快速扩增技术的多STR试剂盒。多重PCR需要仔细的优化,并且必须在不同引物对的反应优化之间进行折衷和平衡。快速PCR的反应条件通常更为严谨,因此,其对多重PCR系统特别需要的任何折衷的容忍性都较小。
在进一步简化STR分析的尝试中,Nanogen Inc.(San Diego,CA)试图使用杂交的形式,其中将PCR扩增的靶与固定在微型硅芯片不同位置的长度不同的捕获探针杂交。随后使用带有末端标记的长度恒定的探针检测靶序列的其余部分,所述探针主要靶向非重复序列。在需要由电场严格控制的严谨条件以及用于控制重复单元在杂交期间滑移的温度下,只有能够使探针和捕获序列在彼此靠近时立即杂交的靶才能允许末端碱基参与碱基堆叠并稳定此结构。此类复合物是足够稳定的,以允许通过微芯片上荧光的位置确定给定基因座的不同等位基因(Radtkey et al,2000,Westin et al,2000),不过从较短的捕获探针序列也产生信号。此类探针由单个荧光团进行末端标记,并且其荧光不随其杂交状态而改变。因此,为了检测给定位点的给定序列,必须依赖探针的捕获并且洗去任何未杂交的探针。
长度多态性,特别是重复长度多态性的鉴定为法医提供了大量情报。然而,此类多态性还有很多其他的应用。在整个人类基因组中有15,000多个STR标记物,并且基于该信息(informity),可用于在绘图(mapping)研究中排除直到数个厘摩的基因组(Weissenbach et al,1992)。举例而言,STR绘图研究已经用于鉴定与肥厚型心肌病相关的新基因座(Watkins et al,1993,Carrier etal,1993,Thierfelder et al,1993)。
已知其他长度多态性,特别是三联体重复扩增导致疾病,特别是神经变性疾病和其他类型的疾病,包括强直性肌营养不良、脆性X综合征、亨廷顿病,多种脊髓小脑型共济失调症和弗里德里希共济失调症(Friedreich ataxia)(Sinden 1999)。还有其他长度多态性与疾病易感性相关。例如,在胰岛素基因上游600碱基由14bp重复单元构成的微小卫星影响个体患糖尿病的风险(Bell et al,1982),而微卫星不稳定性和杂合性的损失也是包括肺癌在内的很多癌症的特征(Ionov et al,1993)。现已将微卫星不稳定性与高突变率及DNA修复过程相关连(Loeb,L. A.1994,Frayling,I.M.1999)。
在很多其他物种中发现长度多态性,并可有利地用于分型的目的。例如,巴西副球孢子菌(Paracoccidioides brasiliensis)是拉丁美洲地方性疾病,副球孢子菌病的病原因子,在拉丁美洲估计有1000万人受此病影响(Restrepo-Moreno,2003)。为进一步了解该具有临床重要性的生物体而进行的个体分离物和系统分类物种的研究直到最近仍受到缺少用于分型目的的分子标记物而被阻碍,但近期Matute基于其他人的成功对其进行了整理(Matute etal,2006)。微卫星标记物系统为大量其他生物体的DNA图谱分析提供了高度有效的方法,并已经成功地用于真菌,例如酿酒酵母(Saccharomyces cerevisiae)(Hennequin 2001)、烟曲霉(Aspergillus fumigatus)(Bart-Delabesse et al,2001)和假丝酵母(Candida spp.)(Foulet et al,2005)的分型。
现已公开用于植物物种的类似分型方法。现已从测序的水稻基因组鉴定出多于2,000个简单序列重复标记物(McCouch et al,2002),还在小麦基因组(Roder et al,1998)和水稻基因组(Brondani et al,1998,2003)等中鉴定出其他的标记物。
不应将本说明书列出或讨论的明显先公开文件视为承认所述文件是现有技术的一部分或承认所述文件是公知常识。
本发明提供了寡核苷酸,以及使用寡核苷酸的方法,其可用于检测并区分多核苷酸序列中不同数目的串联重复。因此,本发明可应用于医学诊断学和法医科学领域,并且可以应用于亲子和亲缘关系测定,连锁制图、微生物分型,以及食物链内的示踪能力等。
本发明的第一方面提供了用于确定靶多核苷酸内串联重复的数目的方法,所述方法包括:
(a)提供包含所述靶多核苷酸的样品,其中所述靶多核苷酸内的一个或多个串联重复是单链形式,
(b)使经标记的探针寡核苷酸与靶多核苷酸的单链部分杂交,其中所述探针寡核苷酸与所述靶多核苷酸的单链部分中的至少一个串联重复互补,并且所述探针寡核苷酸中的至少5个核苷酸与所述靶多核苷酸的单链部分中的串联重复互补,和
(c)基于所述探针寡核苷酸与所述靶多核苷酸的单链部分的杂交,确定所述靶多核苷酸内串联重复的数目。
此方法也可被视为确定靶多核苷酸内串联重复的数目的测定法。
所述靶多核苷酸可以是DNA或可以是RNA。通常为DNA。
众所周知,很多天然存在的多核苷酸,特别是DNA分子包含串联重复,例如(ABCD....)n形式的重复,其中A、B、C和D为核苷酸,n是此核苷酸序列重复的次数。重复可能比该形式更复杂,并且特定的重复可能散布在其他特定重复中。通常,每个串联重复包含2、3、4、5或6个核苷酸,并可重复2-50次或更多,即n可以是2-50或更大。部分重复可能出现在重复的靶序列中。此外,STR等位基因可包含多于一种类型的重复,并可包含位于重复元件之间的非重复序列,例如,对于D251338和FGA STR基因座分别为(TGCC)m(TTCC)n和(TTTC)3 TTTTTTCT(CTTT)nCTCC(TTCC)2(SEQ ID No.1和SEQ ID No.2)。下表21给出了常见的串联重复序列。
常见的串联重复的实例为(GATA)n、(CAG)n和(TCTTA)n
在某些串联重复中,重复序列可具有多态性,致使例如一个或多个重复序列与核心重复序列略有不同。例如,STR THO1具有特异的核心重复序列AATG。然而,在被称作9.3的一个等位基因中,第七个重复缺少A碱基。如实施例12中的详细讨论,某些STR包含可变的TCTA和TCTG重复。
在此方法的步骤(a)中,提供包含所述靶多核苷酸的样品,其中所述靶多核苷酸内的一个或多个串联重复是单链形式。如下文详述,这允许探针寡核苷酸与靶的单链区杂交。靶多核苷酸可以是合成的DNA分子的一部分,或者是可以是天然DNA分子的一部分。当靶多核苷酸为DNA时,通常通过扩增另一个DNA分子例如天然DNA分子的一部分而产生。在此实施方案中,通过扩增方法本身或者扩增产物的进一步加工产生其中一个或多个串联重复是单链形式的靶DNA。例如,可使用PCR反应,其中采用与天然DNA(例如人基因组DNA)内侧翼于串联重复的区域杂交的引物。如本领域所熟知的,可通过例如其中一种引物相对于另一条引物摩尔过量的不对称PCR而将PCR产物制成单链,或者可通过例如解链将双链PCR产物制成单链。
应理解,给定的串联重复可出现在天然DNA的多于一个的区域。因此,通常可期望从天然DNA(例如基因组DNA)扩增特定的目标靶多核苷酸(如DNA),例如使用与独特区域杂交的PCR引物,所述独特区域侧翼于在天然DNA内存在的目标串联重复区域。
当所述靶多核苷酸是RNA分子时,通常通过转录由适合的DNA模板产生。例如,靶RNA可通过DNA分子的体外转录产生,其中所述DNA分子包含位于待分析基因座上游的启动子。适合用于产生靶RNA的RNA聚合酶包括SP6和T7 RNA聚合酶。因此,例如,可使用PCR从天然DNA扩增DNA,其中引物之一包含RNA聚合酶的识别位点。在存在RNA聚合酶和适合的核苷酸的条件下,可产生单链RNA。
在优选的实施方式中,所述方法包括在步骤(a)后或同时进行的另外的步骤:
(a1)使阻断寡核苷酸与步骤(a)中提供的靶多核苷酸中的至少一个但并非全部串联重复杂交,从而使所述靶多核苷酸中的一个或多个串联重复在与阻断寡核苷酸杂交后保持单链的形式。
在一个实施方式中,在步骤(a1)中,将两个或更多个阻断寡核苷酸与步骤(a)中提供的靶多核苷酸中的至少一个但并非全部串联重复杂交,从而使所述靶多核苷酸中的一个或多个串联重复在与阻断寡核苷酸杂交后保持单链的形式。
应理解,通过使用一个或多个阻断寡核苷酸,可限制样品中靶寡核苷酸内存在的单链形式串联重复的数目。例如,如果靶多核苷酸(在没有阻断寡核苷酸时)在靶多核苷酸内包含12个单链形式的串联重复,而阻断寡核苷酸能够与其中3个杂交(因为其包含与3个串联重复互补的多核苷酸部分),那么在存在阻断寡核苷酸的条件下,在样品中靶多核苷酸存在的单链形式重复的数目是9。
通常,一个或多个阻断寡核苷酸与靶DNA单链部分中的至少两个串联重复杂交,例如3或4或5或6或7或8或9或10或20或30或40个。通过可存在于待分析的具体基因座的串联重复的可能数目确定阻断寡核苷酸内串联重复的数目。通常,阻断寡核苷酸与存在于靶DNA单链部分的串联重复中的至少8个核苷酸(或至少12个,或至少16个,或至少20个核苷酸)互补。利用现有技术能够合成长达250个核苷酸单元的寡核苷酸,而预期在未来能够合成更长的寡核苷酸。
优选阻断寡核苷酸(沿其长度与靶DNA中的单链DNA互补时)的长度为12-150个核苷酸,例如12-120,12-100或12-90个核苷酸。当阻断寡核苷酸具有如下文所述的其他功能时,寡核苷酸可更长,例如20-180个核苷酸,通常其长度为30-150个核苷酸,例如30-120、30-100或30-80个核苷酸的长度。
所述一个或多个阻断寡核苷酸无需是串联重复中碱基的整数倍。实际上,它们可包括部分重复,这样阻断寡核苷酸以“偏置(off-set)”的方式与串联重复结合。
在使用两个或更多个阻断寡核苷酸时,特别优选使用“偏置”型阻断寡核苷酸,而且此类“偏置”型阻断寡核苷酸也可用于例如以下情况中。
在存在7个重复的阻断剂的条件下分析包含类型8、10个重复的样品时,表现出1和3个重复单元的组合供探针与之杂交。然而,这似乎与存在10个重复的阻断剂的条件下分析包含11、13个重复的样品时获得的结果类似。因此,当两种阻断剂同时存在时,将难以确定样品中存在哪种重复组合。
在上述实例中,如果使用10.2个重复的阻断剂(其中″.2″代表下一个重复的最开始的两个碱基)代替10个重复的阻断剂,那么包含11、13个重复的样品将仅具有供杂交的0.2和2.2个重复序列,这将导致解链峰移动。因此,偏置型阻断方法在解链峰可能重叠的情况下特别有用。例如,偏置型阻断方法可用于将多至4个阻断剂与4个碱基重复序列组合(通过使用由添加1个碱基而具有长度偏移的大小增加的阻断剂),或用于5个碱基重复的5个阻断剂,以此类推。
这样,阻断寡核苷酸可被“重叠”以提供“完全在同一试管中进行”的测定法,其可用于区分相同样品内不同数目的重复。通常选择具有部分重复的可重叠的偏置型阻断寡核苷酸,这样在(串联重复数目中的)各个不同长度变体之间具有至少0.5℃的解链峰Tm差异。通常,通过使用不同的偏置型阻断寡核苷酸,可以在单个PCR中分析可能包含串联重复数目不同的多个等位基因的单个可变基因座。此实施方案在实施例12中更详细地被描述。
为了避免争议,可通过使用能够与y串联重复杂交的一个或多个阻断寡核苷酸,将包含单链形式的x串联重复的本发明的靶DNA转化成包含单链形式的(x-y)串联重复的本发明的靶DNA。
通常,在靶多核苷酸中有单链形式的2或3或4或5或6或7或8或9或10或11或12或13或14或15个串联重复。优选其在2-10个之间,更优选4-8个之间。靶多核苷酸中单链形式的这些串联重复的通常数目可在阻断寡核苷酸存在或不存在下获得。包含串联重复的靶多核苷酸的单链部分通常包含至少8个,优选至少12个,更优选至少16或至少20个核苷酸。
众所周知,多态性的常见类型涉及在具体基因座的串联重复的数目,其可发生显著的变化。应理解,本发明的方法是用于测定串联重复的数目,并且优选在任何给定的测定中,小范围的串联重复是单链形式。因此,为了确定可能存在于具体基因座的串联重复的数目,有必要进行不使用阻断寡核苷酸的方法,并且进行分别使用一个或多个阻断寡核苷酸的方法,其中所述阻断寡核苷酸能够与不同数目的串联重复杂交。这样,对于已知具有串联重复数目不同的多个等位基因的任何给定基因座,可产生具有类似大小的单链部分的靶多核苷酸(例如,单链形式的重复的数目的可变性降低)。应理解,可以使用多于一个的阻断寡核苷酸,只要在与所述阻断寡核苷酸杂交后,在靶多核苷酸中保留单链形式的一个或多个串联重复。
在串联重复序列具有多态性(例如STR THO1或实施例12中描述的STR)的一个实施方式中,可期望阻断寡核苷酸阻断具有可变性的区域,从而使单链形式的靶多核苷酸仅包含相同的重复。例如,如实施例12所述,用于STRD8S1179的阻断寡核苷酸仅留下可与探针寡核苷酸杂交的TCTA重复。
优选地,除非按照上文使用偏置型阻断剂,优选通过阻断剂生成在与阻断寡核苷酸杂交后包含保持单链形式的一个或多个串联重复的不同靶多核苷酸,从而避免不同的等位基因具有相同的Tm。
如下文详述,所述阻断寡核苷酸也可以是用于生产靶多核苷酸的寡核苷酸,其中所述靶多核苷酸中的一个或多个串联重复是单链形式,例如作为PCR反应中使用的引物部分。
步骤(b)中的经标记的探针寡核苷酸可以是任何适合的探针寡核苷酸。所述探针寡核苷酸通常与至少2个或3个或4个或5个或6个或7个或8个串联重复互补,这可基于待分析的基因座而确定。优选探针寡核苷酸与4-10个串联重复互补,不过对于双核苷酸重复,可优选探针寡核苷酸与至少5个或6个串联重复互补。通常,探针寡核苷酸中5-40个核苷酸部分与靶多核苷酸中单链形式的串联重复互补。探针寡核苷酸通常与靶多核苷酸内以单链部分存在的串联重复中的至少8个核苷酸互补:更优选其与存在的串联重复中的至少10个、12个、15个或20个核苷酸互补。
如下文详述,优选寡核苷酸探针能够与单链靶多核苷酸结合,且其Tm在40℃-70℃的范围。
在优选的实施方式中,所述寡核苷酸探针是荧光标记的。其可包含单个荧光标记物,或者可包含多个荧光标记物。所述荧光标记物通常与内部残基相连。
寡核苷酸通常具有2或3或4或5或6或7或8或9或10个由荧光团标记的内部残基。其数目可取决于寡核苷酸的长度。通常使用荧光团标记约三分之一的内部残基,但更少的标记也是可以的。
优选本发明的探针寡核苷酸的长度适合与靶多核苷酸的单链部分杂交,从而提供稳定的杂交体,此杂交体的解链温度取决于靶的精确序列以及靶单链部分内串联重复的数目,但通常在40℃至70℃的范围内。在很多情况下,包含小于15个核苷酸残基的寡核苷酸不形成足够稳定的杂交体,特别是在两条杂交序列不完全地互补的情形下,不过它们可以在某些情况下使用。长度大于约40个核苷酸残基的寡核苷酸可形成杂交体,其解链温度对于可能存在的单核苷酸错配相对较不敏感,不过它们可以在某些情况下使用。对于具有长度多态性的靶,长寡核苷酸探针与长重复序列的杂交产生的Tm的差异小。如下文详述,使用与靶多核苷酸中大于约30-40个的核苷酸杂交的寡核苷酸探针通常需要使用高度敏感的方法进行解链曲线和解链峰的分析。
探针寡核苷酸的长度通常为10-60个核苷酸残基,优选长度为15-50个核苷酸残基,更优选长度为15-40个核苷酸残基。因此,寡核苷酸的长度为从10或11或12或13或14或15个核苷酸残基至(并包括)35或36或37或38或39或40或45个核苷酸残基。因此,本发明包括大小在上述任意范围内的探针寡核苷酸的应用。
长度范围在15-60个核苷酸的寡核苷酸可以是单个标记的,或者具有至多约14个(对于60mer的寡核苷酸)由荧光团标记的内部核苷酸残基,但长度在此范围内的寡核苷酸通常具有2或3或4或5或6个由荧光团标记的内部残基。通常在非末端荧光标记的核苷酸之间有大约3个碱基。
核苷酸碱基通常衍生自天然存在的核苷A、C、G、T和U。然而,可在用于本发明的探针寡核苷酸的一个或多个位点使用核苷酸类似物,例如核苷酸类似物在碱基部分和/或糖部分和/或磷酸连接处被修饰。碱基修饰如丙炔基dU(dT-类似物)和2-氨基dA(dA类似物)通常改变杂交性质,并可使得具有小于15个核苷酸残基的寡核苷酸的应用更具吸引力。对于包含丙炔基dU的寡核苷酸的情况,其长度为约10个残基,这取决于与所需靶序列的解链温度。也可使用如N4-乙基-dC(dC类似物)的碱基修饰使长寡核苷酸探针去稳定,从而增大在与长靶序列的解链温度上的差异。因此,在一些实施方式中,可使用碱基修饰获得适合的Tm变化。
或者,也可以使用包含肽核酸(PNA)、锁核酸(LNA)、2′-O-甲基RNA、亚磷酰胺DNA、硫代磷酸酯DNA、甲基膦酸酯DNA或磷酸三酯DNA的寡核苷酸,或者由肽核酸(PNA)、锁核酸(LNA)、2′-O-甲基RNA、亚磷酰胺DNA、硫代磷酸酯DNA、甲基膦酸酯DNA或磷酸三酯DNA组成的寡核苷酸,以形成化学或酶促更稳定的与靶序列的相互作用。
优选在用于本发明的探针核苷酸中使用同一荧光团。然而,在寡核苷酸被复用时,在该同一寡核苷酸中使用两种或多种不同荧光团可能特别有利。例如,可在不同探针上使用谱性不同的荧光团,从而在单个反应管中同时分析多个STR等位基因。只要不阻止寡核苷酸与其靶序列的杂交,可使用能够与核苷酸残基相连的任何荧光团。(也可以通过使用长度不同的寡核苷酸探针,并使用或不使用不同的阻断寡核苷酸来增强多倍分析,特别是对于极长STR等位基因)。
适合的荧光团包括基于荧光素的荧光团,例如FAM(6-羧基荧光素)、TET(四氯荧光素)、HEX(六氯荧光素);基于罗丹明的荧光团,例如ROX(6-羧基-X-罗丹明)和TAMRA(6-羧基四甲基罗丹明);Cy类染料,特别是Cy3和Cy5,上述均可得自于Glen Research,22825 Davis Drive,Sterling,VA 20164,USA。
也可使用其他荧光素染料,例如具有不同发射谱的那些,例如NED和JOE。也可使用其他荧光团,例如Alexa、Atto、Dyomics、Dyomics Megastokes和Thilyte染料类中的那些,详见下表14-20。
在本发明优选的实施方式中,分别使用C6 FAM dU(可得自于Universityof Southampton,UK)或荧光素dT(可得自于Glen Research,Sterling,VA)标记探针寡核苷酸内部尿嘧啶/胸腺嘧啶碱基的5-位(在本文中,dT和dU的结构相同,因此这两个术语可互换)。可将FMOC-保护的亚磷酰胺加入寡核苷酸的内部T位点,并可将其用作各种荧光染料的连接位点,所述荧光染料包括但不限于FAM、TET、HEX、ROX、TAMRA、Cy3和Cy5,上述所有染料均由Glen Research获得。在合成寡核苷酸后,可从2′-保护的尿苷除去FMOC基团,并且将荧光亚磷酰胺,例如适当保护的6-羧酸荧光素亚磷酰胺偶联到游离的2′-羟基基团。在另一个实施方式中,可在内部的A、C或G位点标记寡核苷酸,其中在固相寡核苷酸合成期间加入作为亚磷酰胺的标记核苷酸,或者在合成寡核苷酸后使用受保护的亚磷酰胺(例如,8-氨基烷基-dA、7-氨基烷基7-脱氮-dA、N(4)-氨基烷基dC和5-氨基烷基-dC)来连接荧光团。
特别优选的标记探针寡核苷酸为WO 01/73118公开的
Figure GPA00001153669100111
探针,或者如WO 2007/010268公开的寡核苷酸探针。
应理解,在另一个实施方式中,可使用淬灭分子标记探针寡核苷酸,并且靶多核苷酸包含荧光分子,当探针寡核苷酸与靶多核苷酸结合时,所述荧光分子的荧光被淬灭。或者,可使用荧光分子标记探针寡核苷酸,并且靶多核苷酸包含淬灭分子,当探针寡核苷酸与靶多核苷酸结合时,所述淬灭分子使探针寡核苷酸上荧光分子的荧光淬灭。在另一个实施方式中,可使用荧光团和淬灭部分标记探针和阻断寡核苷酸,以在与相邻靶序列杂交(或分离)后增强/淬灭荧光发射。
在另一个实施方案中,使用一个荧光团标记探针寡核苷酸,且靶多核苷酸包含另一个荧光团,这样在探针寡核苷酸与靶多核苷酸结合时有能够被测量的荧光共振能量转移(FRET)。在另一个实施方式中,可使用供体和受体荧光团标记探针和阻断寡核苷酸,以在与相邻靶序列杂交后促进FRET。
在使用步骤(a1)并且由此使用一个或多个阻断寡核苷酸的本发明的方法的实施方式中,如果阻断寡核苷酸包含荧光团且探针寡核苷酸包含淬灭剂,则是方便的,反之亦然。适合的荧光团/淬灭剂对在本领域是众所周知的。类似地,如果使用能够相互参与FRET的荧光团来标记探针寡核苷酸和阻断寡核苷酸,则是方便的。适合的荧光团对在本领域是也公知的。
应理解,当携带荧光团的一条或多条寡核苷酸以某种构型杂交时,能够参与FRET的两个荧光团应当在适合发生FRET的距离之内,以指示特定的期望结果。类似地,荧光团和淬灭剂应当在适合发生淬灭的距离之内,当淬灭发生时指示特定的期望结果。在阻断寡核苷酸包含淬灭剂且探针寡核苷酸包含荧光团的实施方式中(或者阻断寡核苷酸和探针寡核苷酸分别包含能够进行FRET的荧光团的实施方式中),所述阻断寡核苷酸和探针寡核苷酸相邻地与串联重复杂交,从而使荧光团/淬灭剂(或荧光团/荧光团)对彼此相邻。
应理解,在优选的实施方式中,在与适当标记的阻断寡核苷酸结合后,标记物(例如,淬灭分子或荧光分子)可与靶多核苷酸结合并成为靶多核苷酸的一部分。
在优选的实施方式中,探针寡核苷酸与靶多核苷酸的单链部分中的至少一个串联重复完全地互补。
换句话说,在靶多核苷酸的单链部分与探针寡核苷酸之间的整个杂交区域上存在Watson-Crick碱基配对。然而,应理解,可存在某些错配或非Watson-Crick碱基配对,但探针仍然能够杂交。在这种情况下,探针寡核苷酸与单链靶多核苷酸部分地互补。在一些情况下,可能期望探针寡核苷酸与靶多核苷酸的单链部分部分地互补,这是因为错配能够降低寡核苷酸-靶杂交体的Tm,从而在一定程度上控制Tm(以及ΔTm,即取决于与探针寡核苷酸杂交的串联重复的数目而出现的Tm差异)。
与此类似,阻断寡核苷酸可以与单链靶多核苷酸完全地互补(优选),或部分地互补(次优选)。
在另一个优选实施方式中,靶多核苷酸内的串联重复由一个或两个单链区域侧翼。在这种情况下,阻断寡核苷酸(如果使用)或探针寡核苷酸或这二者(如果靶多核苷酸内的两个侧翼区域均为单链)可包含与串联重复侧翼区域互补的锚定部分。应理解,如果所使用的阻断寡核苷酸和探针寡核苷酸均包含锚定部分,那么寡核苷酸之一中的锚定部分将与一个侧翼区域互补,而另一条寡核苷酸内的锚定部分将与另一个侧翼区域互补。
阻断寡核苷酸或探针寡核苷酸的锚定部分可包含3-40个核苷酸;通常为4-30个核苷酸,例如4-20个核苷酸。对于探针寡核苷酸,锚定部分通常为5-10个核苷酸。锚定部分通常与侧翼区域完全地互补。应理解,阻断寡核苷酸(如果使用)和探针寡核苷酸的锚定部分的大小和组成可影响阻断寡核苷酸和探针寡核苷酸的Tm,因此通过改变探针寡核苷酸锚定区域,可以在一定程度上控制Tm(和ΔTm)。
此外,还应理解,锚定区域可用于减少或防止“滑移”(即,其锚定寡核苷酸与侧翼区域的杂交)。这可以改进寡核苷酸与靶多核苷酸杂交的选择性,并且改进与寡核苷酸(特别是探针寡核苷酸)结合的不同数目的串联重复之间的差异。
在优选的实施方式中,同时进行此方法的步骤(a)和(a1)。因此,在此实施方式中,在提供包含靶多核苷酸的样品的同时提供一条或多条阻断寡核苷酸,这样在一条或多条阻断寡核苷酸的存在下,样品中的靶多核苷酸包含被一条或多条阻断寡核苷酸阻断的一些串联重复,以及有(保持)单链形式的一些串联重复,从而可以自由地与探针寡核苷酸杂交。在一个实施方式中,阻断寡核苷酸与靶多核苷酸分离(即没有共价结合)。在一个实施方式中,在图6中以图示的方式例示了此实施方式。至少在靶多核苷酸的产生和阻断方面,可将其视为双分子反应。
在特别优选的实施方式中,PCR产生靶DNA,其中所述靶DNA内的一个或多个串联重复为单链形式,并且在PCR中使用的引物也包含阻断寡核苷酸。在一个实施方式中,在图8中以图示的方式例示了此实施方式。至少在靶多核苷酸的产生和阻断方面,可将其视为单分子反应。优选还包含阻断寡核苷酸的PCR引物不具有基本自身互补的任何区域。
在优选的实施方式中,在PCR中使用的引物(此引物还包含阻断寡核苷酸)在其3′端包含与靶DNA中待分析的串联重复的3′端区域互补的部分,并且在其5′端包含与通过所述引物合成的PCR产物的链中至少一个串联重复互补的部分。因此,此引物是在PCR反应中产生DNA链的引物,其中所述DNA链包含靶DNA中的串联重复。因为此引物还包含与一个或多个这些串联重复互补的部分,所以其由引物的5′部分(在此实施方式中,其还是阻断寡核苷酸)与通过在PCR中使用此引物合成的一个或多个串联重复之间的分子内杂交形成发卡结构。引物的5′部分不与引物或寡核苷酸探针的任何部分互补,并且在通过PCR扩增靶序列之前不参与杂交。应理解,如果引物在其5′端包含与y串联重复互补的部分,y将被阻断。如果在PCR扩增的位点存在x串联重复,那么在所产生的单链形式的靶DNA中将存在x-y串联重复。
在本发明的此实施方式中,特别优选引物从3′向5′方向包含:(i)与靶DNA内串联重复3′端区域互补的部分,(ii)任选的间隔子部分,(iii)与通过所述引物合成的PCR产物的链中的侧翼区域互补的锚定部分,和(iv)与通过所述引物合成的PCR产物的链中的至少一个串联重复互补的部分。
在另一个实施方式中,此引物进一步包含(v)与探针寡核苷酸3′端的钳部分互补的钳部分。所述钳部分位于(iv)(与通过所述引物合成的PCR产物的链中的至少一个串联重复互补的部分)的5′端。
在另一个实施方式中,使用至少两对不同的PCR引物和探针寡核苷酸,其中每对阻断寡核苷酸和探针寡核苷酸各自的钳部分彼此互补。优选地,选择钳部分的核苷酸序列,以使每对互补的钳部分具有不同的Tm。不同Tm之间的差别通常为至少0.5℃。
在PCR引物包含钳部分的实施方式中,所述钳部分具有如下文详述的阻断寡核苷酸的钳部分的性质。
图15中以图示的方式例示此实施方式。
特别优选使用不对称PCR增强阻断剂和探针与合成的靶的杂交。例如,与可在PCR中以有限浓度使用的其他引物相比,单分子阻断寡核苷酸/引物以过量的浓度存在,使得在PCR中早早地耗尽其他引物,从而产生单链DNA靶。
图8中以图示的方式显示了此实施方式的实例(在此实施方式中,PCR引物和探针寡核苷酸不包含钳部分)。
在不同的实施方式中,PCR中使用的引物(此引物还包含阻断寡核苷酸)还包含探针寡核苷酸。图16中以图示的方式例示此实施方式。通常在探针寡核苷酸和阻断寡核苷酸之间还存在间隔子部分。因此,在典型的实施方式中,所述引物从3响5′方向包含:(i)与靶DNA内串联重复的3′端区域互补的部分,(ii)任选的间隔子部分,(iii)与通过所述引物合成的PCR产物的链中的侧翼区域互补的锚定部分,(iv)与通过所述引物合成的PCR产物的链中的至少一个串联重复互补的部分,(v)第二间隔子部分,和(vi)探针寡核苷酸。探针寡核苷酸(vi)包含在PCR引物中,并可被视为探针部分。其通常具有荧光标记,并且与通过所述引物合成的PCR产物的链中的至少一个串联重复互补。与靶DNA内串联重复的3′端区域互补的引物部分能够在例如PCR条件下,与串联重复的3′端杂交。通常,此引物部分包含与3′侧翼区域互补的10-30个核苷酸,例如15-30或15-20个核苷酸。优选其包含18-25个核苷酸。3′侧翼区域通常位于靶序列3′端的1-200个核苷酸。
优选此部分与靶DNA内串联重复的3′端区域完全地互补;不过其可以是部分互补的,只要其能够杂交并参与PCR。引物的3′端自由参与链延伸反应,并且因此包含3′OH基团。引物还可包含“通用”碱基,例如5-硝基吲哚和肌苷,从而“中和”在人群中鉴定的已知单核苷酸多态性。
间隔子部分(ii)是任选的。当存在时,其可包含任何适合的间隔子,其含义包括占据约1-20个核苷酸残基的长度,但不参与碱基配对的化学单元。所述间隔子通常可以是六甘醇(HEG)或四甘醇(TEG)基团。在另一个实施方式中,所述间隔子可以是一个或多个无碱基残基。无碱基残基保留核苷酸残基的间隔,但不参与碱基配对(因为没有碱基)。在另一个实施方式中,存在核苷酸残基,但这些残基与靶链中的核苷酸残基错配,因此不参与碱基配对。
所述间隔子通常占据约1、2、3、4或5个核苷酸残基的长度。
在探针寡核苷酸包含在PCR引物中(图16)的实施方式中,探针寡核苷酸和阻断寡核苷酸之间的间隔子(v)通常具有以下性质。其充当允许探针寡核苷酸与阻断寡核苷酸独立杂交的物理间隔子,而没有对稳定性和探针Tm的累计作用。适合地,使用如碳水化合物或肽聚合物的简单线性分子,从而具有最小的三维转动限制,并且长度足以在空间中完成环形结构(这样其末端能够返回到非常接近)。优选间隔子不具有对核酸的内在亲和力,并且不与核酸结合。优选间隔子对靶序列的杂交过程保持中立。显然,间隔子必须能够与阻断寡核苷酸和探针寡核苷酸化学结合。
引物中与通过所述引物合成的PCR产物的链中的侧翼区域互补的锚定部分可包含5-25个核苷酸,通常为5-20个核苷酸,例如10-20个核苷酸。这可以随侧翼区域的序列组成而改变。方便地,引物的锚定部分具有的Tm高于探针寡核苷酸锚定部分。锚定部分通常与侧翼区域完全地互补。
与通过所述引物合成的PCR产物的链中的至少一个串联重复互补的部分(其是引物的一部分)通常与至少一个,或两个,或三个,或四个或五个串联重复互补。其通常与2-20个之间,例如4-8个串联重复互补。优选此部分与串联重复完全地互补,但也可部分地互补,只要其仍能够与通过所述引物合成的PCR产物内的串联重复杂交。
上述间隔子部分也可存在于探针寡核苷酸内或阻断寡核苷酸内。在这些情况下,优选所述间隔子的长度约为1或2或3或4或5个或更多个核苷酸。
应理解,在阻断寡核苷酸不是PCR引物一部分的实施方式中,优选其3′端不包含OH基团。这样使其不能参与链延伸反应。因此,通常使用例如磷酸基团或辛二醇封闭其3′端。
类似地,应理解,通常可期望探针寡核苷酸不包含3′-OH,并且通过例如磷酸或辛二醇封闭以防止链延伸。这样,在使用PCR实施本发明的方法时,探针寡核苷酸(如果在PCR期间存在)不会被存在的DNA聚合酶延伸。
在另一个实施方式中,阻断寡核苷酸在其3′(或5′)端包含与存在于探针寡核苷酸5′(或3′)端的钳部分互补的钳部分。在此实施方式中,当阻断寡核苷酸和探针寡核苷酸与靶多核苷酸的单链部分杂交时,阻断寡核苷酸的钳部分与探针寡核苷酸的钳部分杂交在一起。在一个具体实施方式中,图12中以图示的方式例示了此实施方式。钳部分通常具有3-10个核苷酸,例如4-8个,如6-8个核苷酸。钳部分通常主要包含G或C残基;优选大于75%的碱基为G或C。钳部分的序列优选不与STR的任何部分互补。方便地,钳部分对热稳定性贡献10℃到30℃,通常确保探针与正确的序列杂交并且防止滑移。钳部分的Tm不应将探针寡核苷酸的Tm提高到阻止区分相似长度的靶重复的程度。在一个实施方式中,探针寡核苷酸的钳部分包含荧光标记物,且阻断寡核苷酸的钳部分包含淬灭分子(反之亦然),从而使荧光团和淬灭剂在与靶多核苷酸的单链部分结合后发生相互作用。或者,探针寡核苷酸和阻断寡核苷酸的钳部分均包含荧光团,从而能够在与靶多核苷酸杂交后参与FRET(参见图17)。
在优选的实施方式中,使用至少两对不同的阻断寡核苷酸和探针寡核苷酸,其中每对阻断寡核苷酸和探针寡核苷酸各自的钳部分彼此互补。通常,不同的阻断寡核苷酸和探针寡核苷酸对具有不同的钳部分。因此,一对可具有表示为A1:A1′(A1和A1′互补)的钳部分,而另一对可具有表示为B1:B1′的钳部分,等等,其中,例如A1存在于阻断寡核苷酸上,而A1′存在于探针寡核苷酸上。通常选择钳部分的核苷酸序列,以使每对互补的钳部分具有不同的Tm
带有钳(clamp)部分的阻断寡核苷酸和带有钳部分的探针寡核苷酸可被视为接头寡核苷酸(junction oligonucleotide)。
在双分子形式中,阻断寡核苷酸通常将包含(i)与紧邻于串联重复5′或3′端的侧翼区域互补的锚定部分,(ii)与所合成的PCR产物中的至少一个串联重复互补的部分,和(iii)与连接到待使用的探针寡核苷酸5′或3′端的钳序列互补的富含G/C的短钳序列。
在单分子模式中,阻断寡核苷酸/引物从3′至5′通常包含:(i)与靶DNA内串联重复的3′端区域互补的部分,(ii)任选的间隔子部分,(iii)与通过所述引物合成的PCR产物的链中的侧翼区域互补的锚定部分,(iv)与通过所述引物合成的PCR产物的链中的至少一个串联重复互补的部分,和(v)与连接至待使用的探针寡核苷酸5′端的钳序列互补的富含G/C的短钳序列。
可以方便地实施本发明的方法,其中选择探针寡核苷酸以使可以根据其解链温度(Tm)区分靶多核苷酸的单链部分中的串联重复的数目。因此,相同的探针寡核苷酸能够区分存在的不同数目的串联重复。通常,探针寡核苷酸可区分靶多核苷酸中以单链形式存在的2个、3个和4个串联重复,或者3个、4个和5个,或者4个、5个和6个,或者5个、6个和7个,或者6个、7个和8个,或者7个、8个和9个,或者8个、9个和10个,或者9个、10个和11个串联重复,等等。探针寡核苷酸可以方便地区分靶多核苷酸中以单链形式存在的2个、3个、4个、5个和6个串联重复。然而,通过使用适合的阻断寡核苷酸,可以分析带有很多种可能的串联重复的STR。
优选连续数目的重复之间的ΔTm(即,取决于与探针寡核苷酸杂交的串联重复的数目的Tm差异)不小于0.5℃。更优选ΔTm为至少1℃,通常为至少2℃,例如至少3℃。可通过改变其长度、组成、与单链多核苷酸靶的互补程度、锚定部分(如果存在)或钳部分(如果存在)来调整探针寡核苷酸的杂交性质。
优选此方法的杂交步骤(b)在接近由靶多核苷酸的单链部分和探针寡核苷酸之间形成的一个或多个杂合体的一个或多个Tm的指定温度下进行。可以通过参考靶多核苷酸的单链部分中待分析的串联重复的数目,是否存在单链侧翼区域,以及上述探针寡核苷酸的形式来选择预定的温度。
更优选此方法的杂交步骤(b)在包括由靶多核苷酸的单链部分和探针寡核苷酸之间形成的一个或多个杂合体的Tm的一定温度范围内进行。
方便地,所述温度范围可以为30℃-75℃。形成的杂交体通常具有在40℃-65℃范围内的Tm。解链峰分析通常应用一套算法以平滑数据(即除去荧光噪声),其在ΔTm较小时降低区分等位基因的潜能。通过解链峰的Tm确定重复的数目。高分辨率解链曲线分析将温度范围的低温区域和高温区域内荧光发射水平进行平均,以进行背景校正。具有小ΔTm的多态性等位基因更可能通过使用高分辨率解链曲线分析来区分。可通过解链曲线的形状区分STR等位基因,但确定重复数目可能需要一整套互补的长度标准品进行比较。
可获得具有低热分辨率限的各种仪器,可将其用于区分Tm非常接近的分子的解链。例如,来自Idaho Technologies的高分辨率解链(HRM)HR-1仪器能够区别差别小于1℃,例如0.5℃,乃至仅差别0.1℃的Tm。其他适合的仪器包括LightScanner(Idaho Technologies)、Light Cycler 480(RocheDiagnostics)和Rotor-Gene 6000(Corbett Life Sciences),据报道,其可处理超过1.0℃的热分辨率。Corbett声称其Rotor-Gene 6000具有0.02℃的热分辨率,不过这是基于解链曲线,而非解链峰。
靶多核苷酸可以是包含串联重复的任何靶多核苷酸。靶多核苷酸通常是由待分析的天然DNA生成的DNA或RNA。天然DNA通常是来自植物、动物或微生物的基因组DNA。如引言部分所述,在很多基因组中发现串联重复序列,其分析可用于很多情况。对人和其他哺乳动物DNA内串联重复的分析可用于医学诊断、法医学、亲子和亲缘关系测试,以及绘制连锁图。
对微生物基因组内串联重复的分析可用于疾病控制(例如菌株鉴定)和工业情况(例如,鉴定酿酒酵母和面包酵母株)。
对食品中DNA内串联重复的分析可用于跟踪食物链中的材料,例如所使用的植物材料的类型等。
特别优选的天然DNA是人基因组DNA。如上所述,靶DNA通常通过扩增反应,例如PCR生成。
本发明的第二方面提供了用于确定靶多核苷酸内串联重复的数目的系统,其中所述靶多核苷酸内一个或多个串联重复为单链形式,所述系统包括:
(a)与靶多核苷酸的单链部分中的至少一个串联重复互补的标记探针寡核苷酸,且所述探针寡核苷酸的至少5个核苷酸与靶多核苷酸的单链部分中的串联重复互补,和
(b)与靶多核苷酸中至少一个但并非全部串联重复互补的阻断寡核苷酸。
所述标记探针寡核苷酸和阻断寡核苷酸优选具有如本发明第一方面的方法中所述的性质。
方便的系统包括但不限于:
(1)(a)包含钳部分的标记探针寡核苷酸,和(b)包含互补钳部分的阻断寡核苷酸;
(2)(a)标记探针寡核苷酸,和(b)包含上述阻断寡核苷酸的PCR引物;
(3)(a)包含钳部分的标记探针寡核苷酸,和(b)包含上述阻断寡核苷酸和钳部分的PCR引物;和
(4)包含上述阻断寡核苷酸和探针寡核苷酸的PCR引物。
可将此系统视为包含两条寡核苷酸(或者在某些实施方式中为一条寡核苷酸)的“组分试剂盒”。方便地,此试剂盒也可包含用于从天然存在的DNA分子产生靶多核苷酸的PCR成分。此试剂盒还可包含用于检测探针寡核苷酸与靶多核苷酸的杂交的方法。
本发明的第三方面提供了寡核苷酸,其包含含有与锚定部分结合的至少两个串联重复的部分,其中所述锚定部分的序列和所述至少两个串联重复在靶多核苷酸中连续地存在。
优选所述寡核苷酸是标记的。优选寡核苷酸的标记如上所述。在本文第三方面,靶DNA通常是全部或部分的人STR及其侧翼区域。优选所述靶DNA是表21所示任何STR和侧翼区域的全部或部分。
优选所述锚定部分具有与上述阻断寡核苷酸或探针寡核苷酸的优选性质相同的性质。
优选本发明此方面的寡核苷酸还包含间隔子部分。优选所述间隔子部分具有上述间隔子部分的性质。
本发明的第四方面提供了参与PCR反应以扩增包含串联重复的靶DNA的寡核苷酸引物,所述引物从3′向5′方向包含:(i)与靶DNA内串联重复的3′端区域互补的部分,(ii)任选的间隔子部分,(iii)与通过所述引物合成的PCR产物的链中的侧翼部分互补的锚定部分,和(iv)与通过所述引物合成的PCR产物的链中的至少一个串联重复互补的部分。
任选地,所述寡核苷酸还进一步包含(v)钳部分。此寡核苷酸可用于上述本发明的适合的实施方式中。
任选地,在不同的实施方式中,寡核苷酸可进一步包含(v)间隔子部分和(vi)探针寡核苷酸。此寡核苷酸可用于上述本发明的适合的实施方式中。
优选寡核苷酸引物不具有基本自身互补的任何区域。锚定部分和阻断部分(即(iv)部分)在靶DNA合成之前不参与杂交。
在本文第四方面,靶DNA优选如上述第三方面所述。
与此类似,锚定部分和间隔子部分优选如上述第三方面所述。
本发明还包括用于测定靶DNA内串联重复的数目的系统,所述系统包含本发明第三方面和第四方面的寡核苷酸。
本发明还包括用于制备本发明第三方面的寡核苷酸的方法,所述方法包括:
(a)选择包含串联重复的靶DNA,
(b)获得串联重复的序列以及一个或多个侧翼区域的序列,
(c)合成寡核苷酸,该寡核苷酸包含含有与锚定部分结合的至少两个串联重复的部分和任选的在其3′端的钳部分,其中所述锚定部分的序列和所述至少两个串联重复在靶DNA中连续地存在。
本发明还包括用于制备本发明第四方面的寡核苷酸的方法,所述方法包括:
(a)选择包含串联重复的靶DNA,
(b)获得串联重复的序列以及一个或多个侧翼区域的序列,
(c)合成寡核苷酸,其从3响5′方向包含:(i)与靶DNA内串联重复的3′端区域互补的部分,(ii)任选的间隔子部分,(iii)与通过所述引物合成的PCR产物的链中的侧翼区域互补的锚定部分,(iv)与通过所述引物合成的PCR产物的链中的至少一个串联重复互补的部分,和任选的(v)钳部分,或任选的(v)间隔子部分,和(vi)探针寡核苷酸。
应理解,如果此寡核苷酸是具有阻断重复的引物,则优选其中存在间隔子,从而能够形成用于杂交的茎环。
本发明这些方面选择的靶DNA可以是包含串联重复的任何DNA。靶DNA通常是基因组DNA。优选其为哺乳动物基因组DNA,更优选人基因组DNA。然而,也可以是来自植物、酵母或细菌的DNA。
优选所述靶DNA含有包括侧翼序列的人STR。更优选所述STR是表21中所述之一。
本文引用的所有文献均并入本说明书中。
现在将参考以下附图和实施例更详细地描述本发明。
图1:由STRV2寡核苷酸与寡核苷酸靶的杂交产生的解链峰。由左向右的各个解链峰分别是由具有5、7、8、10和11个TATC串联重复的靶产生的。
图2:A)150nM STRV2寡核苷酸与75nM RC7靶寡核苷酸及75nMRC11靶寡核苷酸的杂交的解链曲线分析。产生ΔTm为6.6℃的两个清晰解链峰。B)150nM STRV2探针与75nM RC10靶寡核苷酸及75nM RC11靶寡核苷酸的杂交的解链曲线分析。产生的宽解链峰阻碍了对等位基因组成的清楚鉴定。C)STRV2探针与RC8和RC10寡核苷酸混合物的杂交产生了ΔTm为3.7℃的两个清晰解链峰。
图3:A)由STRV3探针与RC10d和RC11d靶寡核苷酸的杂交产生的解链峰。观察到两个解链峰。B)由于没有锚定序列,HYBSTR探针与RC10e靶寡核苷酸的杂交产生宽且多噪音的解链峰。
图4:从NCBI数据库获得的D16S539 STR序列(登录号G07925)(SEQ IDNo.:70)。
图5:A)使用LightCycler仪器和HYBSTR寡核苷酸探针对D16S539序列进行的实时扩增和检测。B)使用11和13个重复的杂合样品产生的解链峰。C)使用8和13个重复的杂合样品产生的解链峰。
图6:A)使用双分子阻断剂策略分析STR靶。STR靶以黑色方格表示;阻断寡核苷酸中的重复以网纹方格表示;荧光探针中的重复以灰色方格表示。当重复数目小于15时,阻断剂的长锚定部分以及所使用的摩尔过量(相对于探针)阻止探针与靶完全杂交。B)在B1阻断剂存在下,使用FL1探针与靶寡核苷酸产生的解链峰。由左向右的各个解链峰分别是由具有8、9、10、11和12个GATA重复的靶产生的。C)在没有B1阻断剂时,使用FL1探针与靶寡核苷酸产生的解链峰。由左向右的各个解链峰分别是由具有5、6、7、8和9个GATA重复的靶产生的。
图7:A)使用LightCycler仪器、FL1探针和B1阻断剂对来自提取DNA和唾液样品的STR靶进行的实时扩增。双分子B1阻断剂降低了PCR的效率,从而将检测循环(Cts)推迟到约38-40个循环。省略PCR分析中的阻断剂获得约32个循环的Cts。B)使用9和12个重复的等位基因的杂合样品产生的解链峰。
图8:A)使用单分子阻断剂/引物策略分析STR靶。STR靶以黑色方格表示;阻断寡核苷酸中的重复以网纹方格表示;荧光探针中的重复以灰色方格表示。阻断剂重复、锚定序列和正向引物均包含在单个寡核苷酸内。阻断剂和扩增的靶序列成为同一DNA链的部分,因此单分子阻断剂不会通过妨碍Taq聚合酶的行进而抑制PCR。在热力学上,阻断剂与扩增的重复之间的单分子结合比探针杂交更为有利,从而在重复数目小于15时,阻止探针全长结合。提供了与具有8和13个重复的D16S539等位基因的探针杂交的例示。
图9:A)使用LightCycler仪器、FL1探针和单分子BP1阻断剂/引物对来自提取DNA和唾液样品的STR靶进行的实时扩增。扩增产品的检测Cts为约32个循环。B)由左向右,由11、12和13个重复的等位基因的纯合样品产生的的解链峰。C)使用8和13个重复的等位基因的杂合样品产生的解链峰。D)具有9和12个重复的等位基因的杂合样品。D)具有11和13个重复的等位基因的杂合样品。D)具有11和12个重复的等位基因的杂合样品。D)具有12和13个重复的等位基因的杂合样品。
图10:由FL4探针和BP1阻断剂产生的解链峰。A)提取的具有9和12个重复的等位基因的杂合DNA样品。B)未纯化的11/13基因型唾液样品的直接分析。C)未纯化的8/13基因型唾液样品的直接分析。D)提取的10/11基因型DNA样品。E)提取的10/13基因型DNA样品。
图11:使用HR-1高分辨率解链仪器重新分析包含扩增的靶序列、BP1单分子阻断剂/探针和FL1寡核苷酸的LightCycler毛细管。A)由左向右,由11、12和13个重复的等位基因产生的解链峰。纯合的11/11、12/12和13/13基因型产生单个解链峰,而杂合的11/12和12/13基因型产生带有肩峰的较宽的峰型。B)高分辨率解链曲线数据证实11、12和13个重复的等位基因的可靠区别。C)11/12和12/13基因型与11/11、12/12和13/13基因型的区别。D)使用OriginPro 7.5软件(OriginLab,Massachusetts,USA)重新分析LightCycler数据。在BP1阻断剂存在下,FL1探针对11/13基因型唾液样品产生宽解链峰,对11个重复的等位基因仅表现出小的肩峰。OriginPro软件将此肩峰鉴定为真峰(true peak),并且绘制了11和13个重复的等位基因的两个组分的解链峰。
图12:合成具有5和7个TATC重复、锚定序列和富含GC的钳的阻断寡核苷酸。合成具有10和8个TATC重复,并且带有与阻断剂中的钳互补的GC钳的寡核苷酸。A)在5LSB1阻断剂的存在下,10SFL1寡核苷酸中仅有5个重复与10个重复的靶杂交。B)在7LSB2阻断剂的存在下,8SFL2寡核苷酸中仅有3个重复与10个重复的靶杂交。C)使用具有8-14个GATA重复的互补寡核苷酸由5LSB1和10SFL1产生的解链峰。D)使用具有10-15个GATA重复的互补寡核苷酸由7LSB2和8SFL2产生的解链峰。
图13:从NCBI数据库获得的TH01STR序列(登录号NT_009237)(SEQID No.:71)。
图14:使用HYBTH01探针和双分子阻断剂TH01_BL,由扩增的TH01STR等位基因获得的解链峰。显示了代表8、9、9.3和10个重复的等位基因的解链峰。
图15:单分子阻断剂可具有长度和/或组成不同的钳部分(A1、A1、A3等),探针寡核苷酸可具有与PCR引物上钳部分互补的钳部分(A1′、A2′、A3′等)。
图16:与单分子构建物中PCR引物相连的探针寡核苷酸。
图17:包含能够进行FRET的荧光团,或荧光团:淬灭剂对的互补钳部分。
图18:使用两个“偏置”D8S1179阻断剂的结果,允许检测8、9、10、11、12和13个重复的等位基因。标为“+”的解链峰来自于全长探针与未阻断的靶重复的杂交。
图19:11和15个重复的D8S1179等位基因的检测。分别使用HYBD8探针与7.2个重复和10.3个重复的阻断剂同时检测11和15个重复的等位基因,所有的寡核苷酸均包含在同一个管中。
实施例1
用于实施例的材料和方法
寡核苷酸探针的设计和合成
标准DNA亚磷酰胺(DNA phosphoramidite)、固相支持物和其他试剂购自于Link Technologies或Applied Biosystems Ltd。补骨脂素C6亚磷酰胺购自于Glen Research Inc。所有的寡核苷酸均使用0.2微摩尔亚磷酰胺进行的酸催化脱三苯甲基作用、偶联、加帽和碘氧化循环在Applied Biosystems 394自动DNA/RNA合成仪上合成。使正常单体(A、G、C和T)偶联25秒,并允许所有其他单体再偶联额外的300秒。通过测量三苯甲基阳离子导电性来测定分步偶联效率以及带有DMT保护的单体的总产量,在所有情况下均>98.0%。在密封试管中在55℃下于浓氨水(33%)中将寡核苷酸从固相支持物上断裂去除,反应进行5小时。使用C6FAM dU(University of Southampton,UK)或荧光素dT(Glen Research,Sterling,VA)将荧光团连接到探针序列的内部残基上。在C6 FAM dU的情况下,通过本领域技术人员熟知的DNA合成方法将6-羧基荧光素(FAM)连接到尿嘧啶碱基的5-位。本发明的寡核苷酸具有3′-磷酸组分或其他阻断剂以阻止将探针加入实时PCR测定中时由Taq介导的延伸。通过将寡核苷酸探针等分试样溶解在指定体积的水中并测量260nm处的紫外吸收来测量合成获得的探针的量。由寡核苷酸的UV吸收及其在260nm处的消光系数计算探针的浓度。通过将构成此寡核苷酸的未修饰的和荧光标记的核苷酸的单个消光系数的加和来计算寡核苷酸的消光系数。
寡核苷酸的纯化
使用由Gilson 7.12软件控制的ABI Aquapore柱(C8),8mm x 250mm,孔径300
Figure GPA00001153669100251
在Gilson系统上通过反相HPLC进行寡核苷酸的纯化。使用以下程序:运行时间:30分钟;流速:3mL/分钟;二元系统:时间按分钟计(缓冲液B%);0(0);3(0);5(20);22(100);25(100);27(0);30(0)。洗脱缓冲液A:0.1M乙酸铵,pH7.0;缓冲液B:0.1M乙酸铵和25%乙腈,pH7.0。通过310nm处(荧光素寡聚物)或295nm处(所有其他寡聚物)检测洗脱过程。HPLC纯化后,按照厂商的说明,使用一次性NAP 10 Sephadex柱(Pharmacia)对寡核苷酸进行脱盐,等分取样至Eppendorf管中,并在-20℃下贮存于蒸馏去离子水中。
聚合酶链式反应
PCR的体积通常为20μl,一般包含2μl样品,1x QIAGEN PCR缓冲液、0.5μM正向引物、0.1μM反向引物、1单位Taq HotStarTaq聚合酶、3mM总MgCl2、5ng/μl BSA(Roche Diagnostics)、1mM dNTPs(GE Healthcare)和150nM探针。使用LightCycler仪器(Roche Diagnostics)进行靶的均相扩增和检测,其中在初步的变性反应步骤(95℃,15min)后,使用包括变性(95℃,5s)、引物退火(55℃,10s)和产物延伸(72℃,10s)的50个循环来扩增靶。在每个循环中的每个引物退火步骤结束时进行荧光采集。在LightCycler扩增后,立即进行解链曲线分析,其中快速地将样品变性(95℃,5秒)并冷却(35℃,30秒),然后使用0.1℃/秒的转变率将温度从35℃升高到95℃,并进行连续的荧光采集。通过绘制荧光相对于温度的负导函数(y轴上的-dF/dT)与温度(x轴)的曲线,使用LightCycler软件(3.5版)获得解链峰。使用探针峰的解链温度(Tm)检测并鉴定靶。
还使用384孔PCR白板(Bio-Rad)和384孔Tetrad热循环仪(MJ ResearchInc)进行靶序列的扩增。热程序通常由以下组成:用于激活热启动酶的初步变性阶段(95℃,15分钟),随后进行包含变性(95℃,15s)、引物退火(55℃,30s)和产物延伸(72℃,30s)的50个PCR循环。在扩增后,立即使用LightTyper仪器(Roche Diagnostics)进行解链曲线分析,使用0.1℃/秒或0.05℃/秒的转变率将样品从35℃逐步加热至75℃。
短串联重复的分析
使用一系列寡核苷酸靶研究寡核苷酸探针分析短串联重复(STR)的可能性。合成3种探针,用于检测和区分D16S539等位基因(表1),D16S539等位基因可包含5-15个GATA重复。所有探针均包含5′-GGTG锚定序列,发现此锚定序列降低探针沿重复序列滑移的可能性,从而防止产生宽且多噪音的解链峰。在没有锚的情况下,STR探针的5′重复可能与靶重复中的任意一个相互作用,从而可能出现全长杂交或部分杂交的事件。紧侧翼于重复序列的锚定序列促使探针在特异位点杂交,并且有助于防止DNA滑移的现象。锚的稳定性和有效性在很大程度上由其长度和序列组成决定。稳定性不足将导致一定程度的DNA滑移,而Tm过大的锚可能妨碍对STR等位基因的区分。因此,锚序列有助于优先于探针在任何数目的位点中结合之前完成靶序列的第一重复与寡核苷酸探针的第一同源重复的杂交。
STRV2和STRV3探针还包含试图将探针分隔成两个分离组分的六甘醇(HEG)修饰,从而降低整个探针的Tm并改进用于区分等位基因的可能性。探针由两个荧光素部分标记并具有3′-磷酸以阻止其在包括于PCR测定中时被Taq聚合酶的延伸。
表1:寡核苷酸和寡核苷酸靶序列,其中5、(HEG)和3P分别代表荧光团C6FAM dU、六甘醇和3′-磷酸。
  寡聚物   SEQ ID   序列   标注
  HYBSTR   3   GGTGGATAGA5AGATAGA5AGATAGATAGATAGATAGATAGATAGATAGATAGATAGATA3P   14个重复
  STRV2   4   GGTGGATAGATAGATA(HEG)GATGA5AGATAGA5AGATAGATAGATAGATA3P   11个重复
  STRV3   5   GGTGGATAGATAGATA(HEG)(HEG)GATAGA5AGATAGA5AGATAGATAGATAGATAGATAGATAGATAGATA3P   16个重复
  RC5   6   TATCTATCTATCTATCTATCCACC   5个重复
  RC7   7   TATCTATCTATCTATCTATCTATCTATCCACC   7个重复
  RC8   8   TATCTATCTATCTATCTATCTATCTATCTATCCACC   8个重复
  RC10   9   TATCTATCTATCTATCTATCTATCTATCTATCTATCTATCCACC   10个重复
  RC11   10   TATCTATCTATCTATCTATCTATCTATCTATCTATCTATCTATCCACC   11个重复
  RC10b   11   TATCTGTCTATCTGTCTATCTGTCTATCTGTCTATCTGTCCACC   5G/T错配
  RC10c   12   TGTCTGTCTGTCTGTCTGTCTGTCTGTCTGTCTGTCTGTCCACC   10G/T错配
  RC10d   13   TATCTATCTATCTATCCCCTTATCTATCTATCTATCTATCCACC   “敲除”个重复6
  RC10e   14   TATCTATCTATCTATCTATCTATCTATCTATCTATCTATC   除去4bp锚
  RC11b   15   TATCTGTCTATCTGTCTATCTGTCTATCTGTCTATCTGTCTATCCACC   5G/T错配
  RC11c   16   TGTCTGTCTGTCTGTCTGTCTGTCTGTCTGTCTGTCTGTCTGTCCACC   11G/T错配
  RC11d   17   TATCTATCTATCTATCTATCCCCTTATCTATCTATCTATCTATCCACC   “敲除”个重复6
  RC11e   18   TATCTATCTATCTATCTATCTATCTATCTATCTATCTATCTATC   除去4bp锚
探针HYBSTR为研发的起点。对探针ΔTm和等位基因鉴别的改进应当再参考此探针。
合成寡核苷酸靶用于模拟各种D16S539等位基因,该D16S539等位基因具有5、7、8、10和11个TATC重复以及与探针锚互补的3′-CACC序列(表1)。在TaKaRa PCR缓冲液和总计3mM的MgCl2中,将150nM的D16寡核苷酸探针与150nM的各靶寡核苷酸杂交。使用LightCycler仪器进行解链曲线分析,其中在将初步变性(95℃,5秒)并冷却(35℃,30秒)后,使用0.1℃/秒的转变率将反应从35℃加热到95℃。表2中详细列出了由合成靶序列观察到的探针解链温度。图1中显示了由STRV2探针和各寡核苷酸靶产生的解链峰。
另外,还使用靶寡核苷酸的组合分析了探针,其中所述组合模拟了具有不同重复数目的等位基因的杂合基因型。对杂合样品进行基因分型的能力取决于所存在的两个D16等位基因的ΔTm。LightCycler仪器通常需要至少3℃的Tm差异以产生具有清晰组分峰的杂合解链印迹(然而,可获得提供更好分辨率的其他仪器,例如高分辨率解链仪器,如来自Idaho Technologies的HR-1)。较短的D16靶(例如5和7个重复)显示出比较长的序列(例如10和11个重复)大很多的ΔTm,因此更易于区分。图2显示了使用STRV2可清楚地区分7/11和8/10基因型,而10和11个重复的Tm过于类似而不能同时检测。(然而,如上所述,使用阻断寡核苷酸(BP1)和不同的探针寡核苷酸(FL1)实现了10和11个重复的同时检测,显示ΔTm为3.5℃)。
表2:探针Tm和由与寡核苷酸靶序列的杂交获得的ΔTm
Figure GPA00001153669100281
Figure GPA00001153669100291
实施例2
使用实施例1中所述的寡核苷酸设计不是总可以准确地分辨出包含长重复序列的杂合样品。由于探针ΔTm的量级依赖于STR靶的长度和组成,使杂交不稳定化可能提高对长度多态性的敏感度。可通过如下策略完成探针的不稳定化:
·引入核苷酸错配以降低探针Tm。错配的数目取决于探针的长度和序列组成以及所采用的错配的类型。可在沿探针长度上的多个重复中使用较大量的稳定错配,例如G/T以降低Tm。可能需要较少量高度不稳定的错配,例如C/A以完成相同的Tm降低。沿探针长度上分配错配的另一种方式是将错配成簇,从而从寡核苷酸上除去整个重复,例如,将15个重复的探针分成5个重复和9个重复组分。
·加入碱基类似物,例如N4-乙基-dC7-脱氮-dG、7-脱氮-dC、C-5丙炔基-dC、C-5丙炔基-dU、5-甲基-dC、2-氨基-dA、G-钳1(三环氨基乙基吩噁嗪2′-dC类似物)、锁核酸(LNA)、5′-三甲氧基芪帽、5′-芘帽。使用这些类似物在提高Tm方面具有优点,可进一步区分不同探针区域对整体解链温度的贡献,从而进一步增强在不同重复长度之间的观测的ΔTm,以改进探针Tm。
·包含较长的HEG、TEG(或其他)间隔子以将探针拆分成单独的组分。
·使用两个以上的荧光团标记寡核苷酸。
为了研究核苷酸错配对探针Tm和ΔTm的影响,将碱基取代加入寡核苷酸靶而非探针中,以便于试验评估。表1中详细列出了对包含10和11个重复的靶序列的修饰。
RC10b、RC10c、RC11b和RC11c中加入了有规则地分布在整个探针/靶双链中的5和10个G/T核苷酸错配。碱基取代显著地降低了探针/靶双链的Tm(比较表2和表3),并且还提高了HYBSTR、STRV2和STRV3探针的ΔTm。然而,ΔTm增加的量级不足以使用LightCycler软件对10和11个STR重复的等位基因进行可靠的区分。
RC10d和RC11d寡核苷酸在STR靶共有的第六个重复中加入了4个核苷酸错配。这些错配降低了D16寡核苷酸的Tm,并且提高了10和11个重复的寡核苷酸之间的ΔTm(表3)。使用STRV3探针可见到10和11个重复的两个峰(图3A)。然而,还需要进一步增强探针ΔTm,从而能够使用LightCycler软件可靠地鉴定并区分长STR靶,下文对此进行了详述。
RC10e和RC11e靶寡核苷酸证明HYBSTR探针需要4bp的锚。寡核苷酸对所有其他修饰和未修饰的靶产生确定的平滑曲线,但在没有锚时产生宽且多噪音的印迹(图3B)。峰质量的下降是由于探针沿靶序列滑移造成的。值得注意的是,STRV2在不存在锚的情况下没有显示出此类峰质量的下降,这可能是由于存在内部HEG修饰造成的。
表3:探针与错配寡核苷酸靶的Tm和ΔTm
  探针   RC10b   RC11b   ΔTm   RC10c   RC11c   ΔTm   RC10d   RC11d   ΔTm
  HYBSTR   56.33   57.44   1.11   48.34   49.37   1.03   57.80   59.46   1.66
  STRV2   52.18   53.47   1.29   46.03   45.02   1.01   53.2   55.3   2.1
  STRV3   51.05   53.54   2.49   43.22   44.54   1.32   54.37   56.03   1.66
实施例3
使用引物STRF2和STRR2,通过聚合酶链式反应(PCR)扩增D16S539靶序列。扩增子的大小随重复数目而变化,范围从133bp至173bp(基因序列参见图4)。
STRF2 CAGATCCCAAGCTCTTCCTCTTCCCTAG    (SEQ ID:19)
STRR2 ACGTTTGTGTGTGCATCTGTAAGCATGTATC (SEQ ID:20)
未经DNA纯化,使用HYBSTR探针和LightCycler仪器直接分析7份唾液样品。唾液样品均为具有9/12、13/15、9/13、11/14、9/12、11/13和8/13个重复基因型的杂合样品。实时荧光的增加以及产生的解链峰确认了从唾液样品有效地扩增出D16靶。具有相差2、3或4个重复的D16等位基因的杂合基因型没有对每个组成等位基因产生清晰的个体峰。反而产生了由各D16重复的峰组合而成的宽解链图谱。8/13D16基因型的5个重复差异足以对每个等位基因产生清晰的峰(图5)。
实施例4
使用既具有5′-又具有3′-锚定序列的探针以及仅具有3′-锚定序列的探针来研究无碱基位点对双链稳定性的影响(表4)。根据DNA的负链(minus)设计探针,增加用于连接荧光团的可能位点的数目(表5)。探针与具有5、7、10、12和15个重复的互补寡核苷酸杂交(表5)。
表4:用于分析无碱基位点的影响的寡核苷酸探针,其中4和5分别代表无碱基位点和荧光素dT荧光标记。
  探针   SEQ ID   序列
  02466R   21   CAATGATA5CTATCTA5CTATCTA5CTATCTA5CTATCTA5CTATCTA5CTATCTATCTATCTATCCACC
  02467R   22   CAATGATA5CTATCTA5CTATCTA5CTATCTA5CTATCTA5CTATCTA5C4ATCTATCTATCTATCCACC
  02468R   23   TA5CTATCTA5CTATCTA5CTATCTA5CTATCTA5CTATCTATCTATCTATCTATCTATCCACC
  02469R   24   TA5CTATCTA5CTATCTA5CTATCTA5CTATCTA5CTATC4ATCTATCTATCTATCTATCCACC
表5:用于探针评估的作为靶使用的寡核苷酸,其中(GATA)n代表STR重复的数目。
  寡核苷酸   SEQ ID   序列
  C5   25   CCCTAGATCAATACAGACAGACAGACAGGTG(GATA)5TCATTGAAAG
  C7   26   CCCTAGATCAATACAGACAGACAGACAGGTG(GATA)7TCATTGAAAG
  C8   27   CCCTAGATCAATACAGACAGACAGACAGGTG(GATA)8TCATTGAAAG
  C9   28   CCCTAGATCAATACAGACAGACAGACAGGTG(GATA)9TCATTGAAAG
  C10   29   CCCTAGATCAATACAGACAGACAGACAGGTG(GATA)10TCATTGAAAG
  C11   30   CCCTAGATCAATACAGACAGACAGACAGGTG(GATA)11TCATTGAAAG
  C12   31   CCCTAGATCAATACAGACAGACAGACAGGTG(GATA)12TCATTGAAAG
  C13   32   CCCTAGATCAATACAGACAGACAGACAGGTG(GATA)13TCATTGAAAG
  C14   33   CCCTAGATCAATACAGACAGACAGACAGGTG(GATA)14TCATTGAAAG
  C15   34   CCCTAGATCAATACAGACAGACAGACAGGTG(GATA)15TCATTGAAAG
包含无碱基位点通常将探针杂交的Tm降低约1-2℃。然而,没有获得ΔTm的改进(表6)。使用包含5和6个荧光标记的T碱基的探针产生了高质量的解链峰。其他探针设计在具有多至8个荧光标记碱基时产生高质量的解链峰。迄今为止尚未测试具有超过8个荧光团的探针,但预期在适合的探针长度和标记之间的间隔时,此类探针具有功能性。
表6:无碱基位点对探针Tm的影响
  重复   02466R   02467R   02468R   02469R
  5   47.2℃   49.0℃
  7   60.6℃   58.6℃   54.9℃   54.0℃
  10   64.8℃   63.2℃   63.0℃   57.5℃
  12   67.0℃   64.3℃   67.4℃   66.1℃
  15   68.9℃   66.8℃   68.9℃   68.0℃
  7/15的ΔTm   8.3℃   8.2℃   14.0℃   14.0℃
实施例5
D16S539的等位基因总是具有至少5个GATA重复。因此,如果将STR重复分成两个寡核苷酸,可以降低探针杂交的Tm(表7)。第一寡核苷酸没有荧光,作为阻断剂,其包含前面5个共有重复。第二寡核苷酸是仅与其他重复杂交的荧光探针,即仅检测10个重复的等位基因中的5个重复(图6A)。阻断剂的目的是减少荧光探针可利用的STR重复的数目,从而提高长度类似的等位基因之间的ΔTm。
阻断寡核苷酸(B1)由5个d(TATC)重复、用于防止滑移的31-mer锚定序列(其与侧翼序列完全地互补)和用于防止探针在PCR期间延伸的3′-磷酸组成。荧光寡核苷酸探针(FL1)具有10个d(TATC)重复、5个内部荧光素dT碱基(Glen Research)、6个核苷酸的短锚(其与另一个侧翼序列完全地互补)和位于3′-端的辛二醇PCR阻断剂(表7)。
表7:使用双分子阻断剂和寡核苷酸探针的STR分析,其中P、5和6T分别代表3′-磷酸、荧光素dT和辛二醇。
  寡核苷酸   SEQ ID   序列
  B1   35   TATCTATCTATCTATCTATCCACCTGTCTGTCTGTCTGTATTGATCTAGGGP
  FL1   36   5ATCTATC5ATCTATC5ATCTATC5ATCTATC5ATCTATC6T
使用摩尔过量的阻断寡核苷酸有利于与5个共有重复的杂交。使用100nM FL1探针和600nM B1阻断剂分析具有8、9、10、11和12个GATA重复的互补寡核苷酸(图6B)。表8中列出了对每个靶的探针Tm和ΔTm。将STR探针分成两个组分的设计显著改进了ΔTm以及区分长度类似的等位基因的能力。例如,在使用全长HYBSTR探针进行分析时,10/11基因型的ΔTm为0.92℃,但使用此双分子阻断策略,可将ΔTm提高至2.2℃。
检测5和7个重复的等位基因可能需要省略反应中的阻断寡核苷酸。图6C说明了在没有B1阻断剂时,使用FL1探针产生的解链峰。需要平行进行具有和没有阻断寡核苷酸的分析,以检测和鉴定所有范围的D16S539等位基因。
表8:在双分子阻断剂B1的存在下,由FL1探针与寡核苷酸靶序列的杂交获得的探针Tm和ΔTm。
  重复组合   Tm &(ΔTm)
  8/8   40.0℃
  9/9   47.5℃
  10/10   51.8℃
  11/11   54.0℃
  12/12   57.0℃
  8/9   (7.5℃)
  8/10   (11.8℃)
  8/11   (14.0℃)
  8/12   (17.0℃)
  9/10   (4.3℃)
  9/11   (6.5℃)
  9/12   (9.5℃)
  10/11   (2.2℃)
  10/12   (5.2℃)
  11/12   (3.0℃)
实施例6
使用引物STRF2和STRR2从提取的DNA扩增D16S539靶序列,并直接从唾液样品扩增D16S539靶序列。需要优化B1阻断剂和FL1探针寡核苷酸的相对浓度,从而能够有效地扩增靶,同时防止探针与具有不到15个重复的靶全长杂交。通过分析阻断寡核苷酸和探针寡核苷酸的各种浓度和比例完成优化。发现阻断寡核苷酸与探针寡核苷酸之间的比例为6∶1是有用的。B1阻断剂不足导致在约59℃时产生常规峰,其中FL1探针没有被完全阻断,从而可以与全部10个重复杂交。反之,过量的B1阻断剂抑制靶的扩增,增加了检测靶所需的循环数(图7A)。发现最佳浓度为使用37.5nM FL1探针和225nM B1阻断剂。使用具有11/11、10/11、12/12、10/13、11/12、13/13、12/13和9/12基因型的提取DNA和唾液样品进行分析。对应于9、10、11、12和13个重复的解链峰Tm分别为47.0℃、51.5℃、53.5℃、56.0℃和57.5℃。9/12基因型的样品是唯一获得两个清晰峰的解链图谱(图7B)。使用任何样品都不能有效地检测10个重复的峰。与11和13个重复相比,10个重复的峰具有降低的高度。小ΔTm意味着10个重复的峰被隐藏在11和13个重复的印迹中,从而导致连肩峰也观察不到。如FL4所示提高ΔTm或者试着标准化或改进较短重复的峰高度应克服这个问题。11/12和12/13杂合样品产生Tm介于纯合峰之间的单个解链峰(即分别约54.5℃和57.0℃)。HRM仪器的应用应当有助于使用这些中间峰Tm鉴定杂合体。
通过加入修饰碱基丙炔基dU和丙炔基dC,以及通过加入G-钳和5′-三甲氧基芪修饰提高了阻断剂的稳定性。
实施例7
将STRF2正向引物和B1阻断剂序列组合到单条非荧光寡核苷酸中,使用六甘醇(HEG)作为连接子和PCR阻断剂。单分子引物/阻断剂寡核苷酸(BP1)包含5个d(TATC)重复、用于防止滑移的10-mer锚定序列、HEG和正向引物(表9)。
表9:使用单分子阻断剂/引物和寡核苷酸探针的STR分析,其中P、5、6T和(HEG)分别代表3′-磷酸、荧光素dT、辛二醇和六甘醇。
  寡核苷酸   SEQID   序列
  BP1   37   TATCTATCTATCTATCTATCCACCTGTCTG(HEG)GATCCCAAGCTCTTCCTCTT
  FL1   38   CAATGA5ATCTATC5ATCTATC5ATCTATC5ATCTATC5ATCTATC6T
  FL2   39   CAATGATATC5ATCTATC5ATCTATCTATCTATCTATC5ATCTATCP
  FL3   40   CAATGA5ATCTA5CTATC5ATCTA5CTATC5ATCTA5CTATC5ATCP
  FL4   41   CAATGATATC5ATCTA5CTATCTATCTATCTATCTATC5ATCTATCP
  FL5   42   CAATGATATCTA5CTATCTA5CTATCTA5CTATCTA5CTATCTATC6T
此方法的优点是阻断剂和靶序列在扩增后成为同一DNA链的一部分。在热力学上,阻断剂和靶之间的单分子相互作用比探针杂交更为有利。此外,由于阻断剂在靶序列扩增后才能杂交,所以PCR效率没有损失(图8)。
使用0.5μM BP1和0.05μM STRR2反向引物从提取的DNA和直接从唾液样品扩增D16S539靶序列。使用50nM的FL1探针检测并鉴定从11/11、12/12、13/13、10/11、10/13、11/12、12/13、9/12、11/13和8/13基因型的样品扩增的靶序列。实时LightCycler荧光数据证明靶扩增和检测的效率高于使用双分子阻断剂方法获得的效率(图9A)。另外,还使用384孔PCR板进行靶扩增,随后使用LightTyper仪器进行解链分析。对应于8、9、11、12和13个重复的解链峰的Tm分别为40.0℃、46.0℃、53.0℃、55.5℃和57.5℃(图9)。在这些样品的任一个中都没能可靠地检测到10个重复的峰,这是因为由于10个重复的峰的小ΔTm和降低的峰高度使其被隐藏在11和13个重复的印迹中。这可以通过上文讨论的方式克服。8/13和9/12基因型的样品产生了代表组分等位基因的两个清晰解链峰(图9C-D)。另一方面,11/12、12/13基因型的杂合样品产生Tm介于纯合等位基因Tm之间的单个解链峰(即约54.5℃和56.0℃,分别显示在图9F-G中)。
使用BP1和寡核苷酸探针FL2、FL3、FL4和FL5重复对DNA和唾液样品的分析,其中上述探针具有不同数目的荧光团标记碱基和在荧光团之间不同的间隔子(表9)。由扩增的STR靶产生的解链峰Tm显示在表10中。与FL1探针类似,FL3和FL5构建物不能可靠地检测杂合基因型例如10/11和10/13中具有10个重复的等位基因。荧光标记碱基的数目和间隔影响探针的信噪比和解链峰质量。探针FL2和FL4仅具有3个荧光团标记的碱基,并且能够检测10/11和10/13基因型中的10个重复的等位基因(图10D-E)。线性的未修饰HYBSTR探针对10和11个重复的等位基因显示出0.92℃的Tm。使用单分子阻断剂BP1和FL4HyBeacon获得了3.5℃的ΔTm。
表10:使用单分子BP1阻断剂/引物从提取的DNA和未提取的唾液样品扩增出的靶产生的解链峰的Tms。
Figure GPA00001153669100361
实施例8
使用高分辨率解链曲线仪器(HR-1,Idaho Technology Inc,Utah,USA)重新分析包含扩增的D16S539靶、BP1阻断剂和F6A寡核苷酸的LightCycler毛细管。HR-1能够清楚地区分由11、12和13个重复序列产生的解链峰(图11A)。然而,如上所述,解链峰不能用于鉴定杂合基因型,例如11/12。高分辨率解链曲线软件的确能够清楚地区分9/12、11/11、11/12、12/12、12/13和13/13基因型(图11B-C)。高分辨率分析在区分长度类似的等位基因时不需要超过3℃的ΔTm。此外,改进的数据分析方法能够将宽峰和峰肩清楚地分成组分等位基因(图11D)。
实施例9
重复阻断方法的另一个实施方式是将探针锚定至阻断剂而不是锚定至侧翼于重复靶的DNA序列。此方法提高了在阻断剂存在下探针杂交的稳定性,从而提高了阻断效率。在双分子形式中,阻断寡核苷酸可包含指定数目的序列重复、用于防止滑移的适合的锚定序列和富含GC的钳(图12)。阻断寡核苷酸的钳与探针寡核苷酸中的互补钳杂交。在单分子形式中,可通过适合的间隔子/PCR阻断剂(例如HEG)将阻断重复、锚定序列和富含GC的钳连接到PCR引物之一上。用于这些阻断剂的荧光探针可具有与阻断剂中富含GC的序列互补的富含GC的序列。当阻断剂与邻近的探针寡核苷酸杂交时,富含GC的钳将形成接头(junction)。对于D16S539的情况,当靶重复数目小于15时,可防止探针全长杂交(图12A-B)。
分别将具有5个D16重复(5LSB1)和7个重复(7LSB2)的阻断寡核苷酸与具有10个重复(10SFL1)和8个重复(8SFL2)的荧光探针组合。使这些接头探针和阻断剂(表11)与具有8-15个重复的互补靶寡核苷酸(表5)杂交,并使用LightCycler仪器分析(图12C-D)。表12中列出了探针的Tm。由于探针长度减小,7LSB2的ΔTm增大。在没有阻断剂分子时,可分析包含9个或更少重复的等位基因。
表11:接头探针和阻断剂的序列,其中6为吡咯-脱氧胞嘧啶(pdC),5为荧光素dT,P为3′-磷酸,而(HEG)为六甘醇。
  寡核苷酸   SEQ ID   序列
  5LSB1   43   GCGGCTATCTATCTATCTATCTATCCACCTGTCTGTCTGTCTGTA(HEG)GATCCCAAGCTCTTCCTCTT
  7LSB2   44   GCGGCTATCTATCTATCTATCTATCTATCTATCCACCTGTCTGTCTGTCTGTATTGATCTAGGGP
  10SFL1   45   TATCTATCTA56TATCTATCTA56TATCTAT65ATCTATCGCCGCP
  8SFL2   46   TATCTAT65ATCTAT65ATCTAT65ATCTATCGCCGCP
表12:使用寡核苷酸同源物由接头探针和阻断剂产生的解链峰的Tm。
  重复   Tm5SBP1/10SFL1   Tm7LSB2/8SFL2
  8   36.1℃
  9   44.6℃
  10   51.3℃   34.9℃
  11   55.2℃   44.4℃
  12   57.6℃   50.5℃
  13   60.2℃   55.0℃
  14   61.4℃   57.6℃
  15   62.1℃   59.7℃
作为上述实施方式的变式,单分子阻断剂(PCR引物)可具有长度和/或组成不同的钳部分(A1、A1、A3等),探针寡核苷酸可包含与PCR引物上钳部分互补的钳部分(A1′、A2′、A3′等)。这样,例如在PCR分析中可包含3种或更多探针,并可将钳部分的序列用于修饰峰Tm。图15中给出了此变式的图示说明。
实施例10
研究了第二个STR基因座,以证明通过解链曲线分析来检测并区分重复序列并非仅适用于D16S539。TH01基因座包含(AATG)n的重复,并且报道了具有3-14个重复的等位基因(基因序列参见图13)。TH01序列可包含部分重复,例如在9.3等位基因(AATG)6ATG(AATG)3(SEQ ID NO.:47)中。在设计验证原理的TH01分析时,仅考虑最常见的重复等位基因,其中99.5%的等位基因包含6个重复(23%)、7个重复(24.1%)、8个重复(11.6%)、9个重复(20%)、9.3个重复(17.9%)或10个重复(2.9%)。TH01等位基因分析的其他挑战是不仅要区分长度相差4个碱基的一倍或多倍的完整重复等位基因,而且还要区分长度仅相差单个核苷酸的9.3个部分重复和10个完整重复的等位基因。
设计探针HYBTH01以用于检测和区分TH01等位基因。此探针包含6.1个AATG重复(表13)和5′-TGGFG锚定序列。使用相隔7个核苷酸的两个荧光素dT染料标记探针,其中一个标记位于锚定序列中。使用图6所示的双分子阻断策略。设计双分子阻断剂TH01_BL以防止HYBTH01探针在靶等位基因内的重复数目小于10时与靶序列完全杂交。TH01_BL阻断剂包含3.3个AATG重复和3′-AGGGAAATAAGGG锚定序列(表13)。
使用引物TH01_F和TH01_R(表13)从纯化DNA样品以及未纯化的唾液扩增TH01靶序列。使用不对称PCR增强探针与扩增靶序列杂交的效率,其中引物TH01_F和TH01_R的浓度分别为0.1μM和1μM。所使用的探针和阻断寡核苷酸的浓度分别为75nM和375nM。使用5倍摩尔过量的阻断寡核苷酸以防止探针与TH01等位基因共有的3.1个AATG重复杂交。阻断寡核苷酸限制了可用于探针杂交的靶序列的量,有效地将6-10个重复的等位基因的长度缩短至2.1-6.1个重复,从而改进了基于解链峰Tm区分TH01等位基因的能力。
表13:TH01重复的分析,其中5和P分别代表荧光素dT和3′-磷酸。
  寡核苷酸   SEQ ID   序列
  HYBTH01   48   TGG5GAATGAA5GAATGAATGAATGAATGAP
  TH01_BL   49   ATGAATGAATGAATGAGGGAAATAAGGGP
  TH01_F   50   GGCTTCCGAGTGCAGGTCA
  TH01_R   51   GGTGATTCCCATTGGCCTG
HYBTH01探针和TH01_BL阻断剂的组合能够可靠地检测并鉴定扩增的8、9、9.3和10个重复的等位基因,显示出分别为约53℃、57℃、60.5℃和61.5℃的解链峰Tm(图14)。由于6和7个重复的等位基因的解链峰太低,不能可靠地通过这一设计用于检测在此基因座内更具挑战性的较长重复序列的具体探针结构形式进行检测。显而易见地,通过减少阻断剂中重复的数目,增加探针中重复的数目或提高探针的Tm(通过增加锚定序列的长度,或通过加入DNA碱基类似物或亚磷酰胺帽,例如5′-三甲氧基芪)能够应用本发明所述的相同原理检测6和7个重复的等位基因。与此类似,预期在使用包含通过六甘醇(HEG)修饰分隔的TH01_BL阻断剂和TH01_R引物序列的长寡核苷酸的单分子模式中,该TH01分析也有效地发挥功能。
结论
可使用寡核苷酸探针分析重复序列,其中通过靶长度和杂交探针的比例确定重复的数目。需要超过60个核苷酸的长寡核苷酸探针分析短串联重复。长重复之间的探针Tm差异通常小,妨碍了某些等位基因的可靠鉴定。可通过使探针不稳定化或通过将重复序列分隔成长度减小的非荧光阻断剂和荧光探针来提高ΔTm。本文描述的各种阻断策略均具有增加的探针ΔTm,以及区分具有大量重复的D16S539和TH01等位基因的能力。本发明的实施例可延伸至其他STR,包括但不限于D19S433和D18S51。
实施例11
预防探针与阻断剂的交叉杂交
D8S1179和D3S1358基因座均包含(TCTA)n重复序列。探针和阻断剂可能交叉杂交,妨碍有效的靶检测或导致错误的结果。将阻断剂与引物相连(即单分子阻断)防止了交叉杂交。将探针与单分子构建物相连防止了对错误靶等位基因的检测。出于杂交稳定性的目的使用将阻断剂和探针组分分成两个单独部分的寡核苷酸间隔子来实现这一点(参见图16)。
实施例12
将多个阻断剂包含在单个管中,利用解链峰Tm的移动来检测其他重复等位基因。这通过使用部分重复(偏置)阻断剂而实现,该阻断剂允许(长度/序列)不等的探针杂交。
尽管已报道D8S1179等位基因包含TCTA和TCTG元件,但TCTG重复仅限于具有13个或更多个重复的等位基因并且仅位于第二、第三和第四个重复位置(GenBank登录号AF216671)。因此,可变的TCTA和TCTG重复位于阻断寡核苷酸中,仅留下TCTA重复可与探针杂交。已报道D8S1179基因座具有6-25个四核苷酸重复,然而,在设计D8S1179分析时,仅考虑了最常见的重复等位基因,其中99.9%的等位基因包含8个重复(0.9%)、9个重复(0.8%)、10个重复(8.8%)、11个重复(7.3%)、12个重复(12.6%)、13个重复(27.6%)、14个重复(22.6%)、15个重复(14.1%)、16个重复(4.3%)或17个重复(0.9%)。
设计探针HYBD8以用于检测和区分D8S1179等位基因。此探针包含8个TCTA重复(表14)和3′-FTCCCCP锚定序列。使用相隔5个核苷酸的两个荧光素dT染料标记探针,其中一个标记位于锚定序列中。使用图6所示的双分子阻断策略,其中使用3个阻断寡核苷酸来检测和区分全长的常见D8S1179等位基因。设计双分子阻断剂D8BL5、D8BL8和D8BL11(表14),分别用于防止HYBD8探针在靶等位基因内重复的数目小于13、16和19时与靶序列完全杂交。
使用引物D8F和D8R(表14)从纯化DNA样品以及未纯化的唾液扩增D8S1179靶序列。使用不对称PCR增强探针与扩增靶序列杂交的效率,其中引物D8F和D8R的浓度分别为0.1μM和1μM。所使用的探针和阻断剂寡核苷酸的浓度分别为75nM和375nM。使用5倍摩尔过量的阻断寡核苷酸以防止全长探针与不恰当的靶等位基因杂交。
在D8BL5存在下的解链曲线分析能够可靠地检测并鉴定8、9和10个重复的等位基因(表15)。D8BL8阻断剂用于检测11、12和13个重复的等位基因,而D8BL11能够鉴定14、15、16和17个重复的等位基因。
在分别与D8BL5、D8BL8和D8BL11阻断剂组合使用时,HYBD8探针与9个重复、12个重复和15个重复靶等位基因的杂交产生了44.73℃、44.4℃和44.4℃的解链峰Tm。由于D8BL5、D8BL8和D8BL11各留下与探针杂交的3个靶重复,预期9、12和15个重复的等位基因产生类似的解链峰Tm。因此,在单一试管中同时检测9、12和15个重复的等位基因时,不能将D8BL5、D8BL8和D8BL11阻断寡核苷酸一起使用。
表14:D8S1179重复的分析,其中5、P和X分别代表荧光素dT、3′-磷酸和3′-氨基C7
  寡核苷酸   SEQ ID   序列
  D8F   52   CGGCCTGGCAACTTATATGT
  D8R   53   GCCTTAATTTATTTACCTATCCTGTAGA
  HYBD8   54   TCTATCTATCTATCTATCTATCTATC5ATCTA5TCCCCP
  D8BL5   55   GTATTTCATGTGTACATTCGTA(tcta)5x
  D8BL8   56   GTATTTCATGTGTACATTCGTA(tcta)8x
  D8BL11   57   GTATTTCATGTGTACATTCGTA(tcta)11x
  D8BL7.2   58   GTATTTCATGTGTACATTCGTA(tcta)7tcx
  D8BL10.3   59   GTATTTCATGTGTACATTCGTA(tcta)10tctx
使用带有部分重复的阻断寡核苷酸可导致解链峰Tm的移动(“偏置”),增加可同时检测的STR等位基因的数目。使用具有11-17个重复的扩增靶评估包含7.2个(即(TCTA)7TC)和10.3个(即(TCTA)10TCT)重复的部分重复阻断剂。相对于D8BL8和D8BL11,减少阻断剂的长度能够使更长的探针杂交,从而提高了解链峰Tm(表15)。例如,在D8BL7.2阻断剂存在下,探针与12个重复的靶的杂交产生46.88℃的解链峰Tm,这样,D8BL5和D8BL7.2阻断剂可用于同时检测9和12个重复的等位基因(图18)。图19说明使用D8BL7.2和D8BL10.3阻断剂在单一试管中同时检测11和15个重复的等位基因。
表15
  阻断剂   靶   Tm   偏置阻断剂   靶   预期Tm   Tm   ΔTm
  D8BL5   8   37.12
  D8BL5   9   44.73
  D8BL5   10   49.36
  D8BL5   11   52.67
  D8BL8   11   37.12   D8BL7.2   11   40.76   40.43   3.31
  D8BL8   12   44.4   D8BL7.2   12   46.88   46.38   1.98
  D8BL8   13   49.36   D8BL7.2   13   51.02   50.68   1.32
  D8BL8   14   52.67   D8BL7.2   14   53.83   53.66   0.99
  D8BL11   14   36.79   D8BL10.3   14   39.33   39.1   2.31
  D8BL11   15   44.4   D8BL10.3   15   46.27   45.72   1.32
  D8BL11   16   D8BL10.3   16   50.89
  D8BL11   17   52.67   D8BL10.3   17   53.44   53.66   0.99
适合的染料列表
表14:用于寡核苷酸标记的通用荧光染料
  染料   λ-激发   λ-发射   颜色
  荧光素   494nm   525nm   绿色
  四氯荧光素TET   521nm   536nm   橙色
  JOE   525nm   555nm   绿色
  Yakima Yellow   530nm   549nm   黄色
  六氯荧光素HEX   535nm   556nm   粉色
  Cy3(也称作Quasar 570)   546nm   563nm   红色
  5-TAMRA   541nm   568nm   玫瑰色
  6-TAMRA   547nm   573nm   玫瑰色
  Redmond Red   579nm   595nm   红色
  Cy3.5   588nm   604nm   紫色
  ROX   585nm   610nm   红色
  Pulsar 650   490nm   650nm   紫色
  Cy5(也称作670)   646nm   662nm   蓝紫色
  Cy5.5   683nm   707nm   深蓝色
表15:Alexa染料(Invitrogen)
  Alexa染料   λ-激发   λ-发射
  Alexafluor 350   350nm   442nm
  Alexafluor 405   405nm   421nm
  Alexafluor 430   430nm   540nm
  Alexafluor 488   488nm   518nm
  Alexafluor 500   502nm   524nm
  Alexafluor 514   518nm   542nm
  Alexafluor 532   534nm   553nm
  Alexafluor 546   546nm   565nm
  Alexafluor 555   552nm   567nm
  Alexafluor 568   578nm   603nm
  Alexafluor 594   591nm   618nm
  Alexafluor 610   612nm   628nm
  Alexafluor 633   633nm   650nm
  Alexafluor 647   647nm   662nm
  Alexafluor 660   663nm   690nm
  Alexafluor 680   679nm   702nm
  Alexafluor 700   696nm   719nm
  Alexafluor 750   752nm   779nm
表16:ATTO染料(ATTO-TEC GmbH)
  ATTO染料   λ-激发   λ-发射
  ATTO 425   436nm   484nm
  ATTO 465   453nm   508nm
  ATTO 488   501nm   523nm
  ATTO 495   495nm   527nm
  ATTO 520   525nm   545nm
  ATTO 532   532nm   553nm
  ATTO 550   554nm   576nm
  ATTO 565   563nm   592nm
  ATTO 590   594nm   624nm
  ATTO 610   615nm   634nm
  ATTO 620   619nm   643nm
  ATTO 635   635nm   659nm
  ATTO 647   645nm   669nm
  ATTO 655   633nm   684nm
  ATTO 680   680nm   700nm
  ATTO 700   700nm   719nm
表17:Dyomics染料(Dyomics GmbH)
  Dyomics染料   λ-激发   λ-发射
  DY415   418nm   465nm
  DY495   495nm   520nm
  DY505   505nm   530nm
  DY547   557nm   574nm
  DY548/549   558nm   572nm
  DY550   553nm   578nm
  DY555   555nm   580nm
  DY556   548nm   573nm
  DY560   559nm   578nm
  DY590   580nm   599nm
  DY610   609nm   629nm
  DY615   62nm   641nm
  DY630   636nm   657nm
  DY631   637nm   658nm
  DY632/633/634   637nm   657nm
  DY635   647nm   671nm
  DY636   645nm   671nm
  DY647   652nm   673nm
  DY648   653nm   674nm
  DY650   653nm   674nm
  DY651   653nm   678nm
  DY652   654nm   675nm
  DY675/676   674nm   699nm
  DY677   673nm   694nm
  DY680/682   690nm   709nm
  DY700   702nm   723nm
  DY701   706nm   731nm
  DY730   734nm   750nm
  DY731/734   736nm   759nm
  DY732   736nm   759nm
  DY750   747nm   776nm
  DY751   751nm   779nm
  DY752   748nm   772nm
  DY776   771nm   801nm
  DY781   783nm   800nm
  DY782   782nm   800nm
表18:Dyomics Megastokes染料(Dyomics GmbH)。均能在488nm激发。
  Dyomics染料   λ-激发   λ-发射
  DY475XL   493nm   514nm
  DY480XL   500nm   630nm
  DY485XL   485nm   560nm
  DY500XL   505nm   555nm
  DY510XL   509nm   590nm
  DY600XL   603nm   634nm
  DY520XL   520nm   664nm
表19:Hilyte染料(Cambridge Bioscience)
  染料   λ-激发   λ-发射
  Hilyte Fluor 488   502nm   527nm
  Hilyte Fluor 555   552nm   569nm
  Hilyte Fluor 647   649nm   674nm
  Hilyte Fluor 680   678nm   699nm
表20:低激发波长(UV)荧光团
  衍生物   Abs*   Em*
  Alexa Fluor 350   346   442
  Alexa Fluor 405   402   412
  苯氨基萘   326   462
  Bimane   375   456
  丹磺酰   328   563
  Dapoxyl   374   572
  3,5-双溴甲基-2,6-二甲基吡唑并[1,2-a]吡唑-1,7-二酮(Dibromobimane)   394   490
  二乙基氨基香豆素   384   470
  二甲基氨基香豆素   376   465
  二甲基氨基萘   391   500
  Monobromobimane   394   490
  Monochlorobimane   394   490
  萘   336   490
  芘   339   384
  芪   329   408
表21:常见STR
基因座名称   染色体定位   共有序列基序   报道的等位基因
D3S1358   3p   TCTA(TCTG)1-3(TCTA)n(SEQ ID NO:60-62)   9,10,11,12,13,14,15,15.2,16,16.2,17,17.1,18,19,20
vWA   12p12-pter   TCTA(TCTG)3-4(TCTA)n(SEQ ID NO:63-64)   10,11,12,13,14,15,15.2,16,17,18,18.2,18.2,19,19.2,20,21,22,23,24,25
D16S539   16q24-qter   (AGAT)n   5,8,9,10,11,12,13,14,15
D2S1338   2q35-37.1   (TGCC)n(TTCC)n(SEQ ID NO:65)   15,16,17,18,19,20,21,22,23,24,25,26,27,28
釉原蛋白(Amelogenin)   X:p22.1-22.3Y:p11.2 -   X,Y
  D8S1179a   8   (TCTR)n b   6,7,8,9,10,11,12,13,14,15,16,17,18,19,20.2,21.2
  D21S11   21q11.2-q21   (TCTA)n(TCTG)n[(TCTA)3TA(TCTA)3TCA(SEQ ID NO:66)   24,24.2,25,25.2,26,26.1,27,27.2,27.3,
  (TCTA)2TCCA TA](TCTA)n(SEQ ID NO:67)   28,28.2,28.3,29,29.1,29.2,29.3,30,30.1,30.2,31,31.1,31.2,31.3,32,32.132.2,32.2,33,33.3,34,34.2,34.3,35,35.2,35.3,36,36.2,36.3,37,37.2,38,38.2
  D18S51   18q21.3   (AGAA)n   7,8,9,9.2,10,10.2,11,12,12.2,13,13.2,14,14.2,15,15.1,15.2,15.3,16,16.2,16.3,17,17.1,17.3,18,18.1,18.2,19,19.2,20,20.1,20.2,21,21.2,22,23,23.1,24,25,26,27
  D19S433   19q12-13.1   (AAGG)(AAAG)(AAGG)(TAGG)(SEQ ID NO:68)   9,10,11,12,12.2,13,13.2,14,14.2,15,
  (AAGG)n   15.2,16,16.2,17,17.2,18,18.2,19
  TH01   11p15.5   (AATG)n   3,4,5,5.3,6,6.1,6.3,7,7.1,7.3,8,8.3,9,9.3,10,10.3,11,13.3,14
  FGA   4q28   (TTTC)3TTTTTTCT(CTTT)n CTCC(SEQ ID NO:69)   12.2,13,15,16,16.1,16.2,17,17.1,17.2,
  (TTCC)2   18,18.1,18.2,19,19.1,19.2,19.3,20,20.1,20.2,20.3,21,21.2,22,22.1,22.2,22.3,23,23.2,23.3,24,24.1,24.2,24.3,25,25.1,25.2,25.3,26,26.1,26.2,27,27.1,27.3,28,28.1,29,29.2,30,30.2,31,31.2,32,32.2,33.2,35.2,42.2,43.2,44.2,45.2,46.2,47.2,48.2,49.2,50.2,51.2
a.在一些文献中,将此基因座命名为D6S502。
b.R可代表A或G核苷酸。
常用的STR
在英国使用的SGM+基因座为:
D3S1358、VWA、D16S539、D2S1338、D8S1179、D21S11、D18S51、D19S433、THO1 FGA。
在美国使用的13CODIS基因座为:
CSF1PO、FGA、TH01、TPOX、VWA、D3S1358、D5S818、D7S820、D8S1179、D13S317、D16S539、D18S51和D21S11。
世界各地的实验室广泛使用一套核心Y-染色体STR(Y-STR)基因座进行个人身份鉴定和遗传谱系学。在20世纪90年代晚期从可用的Y-STR小集合中选择了最小的单倍型基因位点(MHL)。MHL包括DYS19、DYS389I、DYS389II、DYS390、DYS391、DYS392、DYS393和多态性多拷贝标记DYS385。2003年,美国DNA分析方法科学工作组(Scientific Working Groupon DNA Analysis Methods,SWGDAM)的Y-染色体小组推荐了命名为DYS438和DYS439的另外两个Y-STR。
参考文献
Bart-Delabesse,E.,Sarfati,J.,Debeaupuis,J.P,van Leeuwen,W.,vanBelkum,A.,Bretagne,S.,Latge,J.P.(2001).Comparison ofrestriction fragmentlength  polymorphism,microsatellite  length  polymorphism,and  randomamplification of polymorphic DNA analyses  for fingerprinting Aspergillusfumigatus isolates.J. Clin.Microbiol.39:2683-6.
Belgrader,P.,Smith,J.K.,Weedn,V.W.,Northrup,M.A.(1998).RapidPCR for identity testing using a battery-powered miniature thermal cycler.JForensic Sci.43(2):315-9.
Bell,GI.,Selby,M.J.,Rutter,W.J.(1982).The highly polymorphic regionnear the human insulin gene is composed of simple tandemly repeating sequences.Nature 295:31-5.
Brondani,C.,Borba,T.C.,Rangel,P.H.N.,and Brondani,R.P.V.(1998).Determination of genetic variability of traditional varieties of Brazilian rice usingmicrosatellite markers.Genetics 149:2007-2023.
Brondani,C.,Rangel,P.H.,Borba,T.C,.Brondani,R.P.(2003).Transferability of microsatellite and sequence tagged site markers in Oryzaspecies.Hereditas.138(3):187-92.
Carrier.L,,Hengstenberg.C,,Beckmann.J,S,,Guicheney.P.,Dufour,C.,Bercovici,J.,Dausse,E.,Berebbi-Bertrand,I.,Wisnewsky,C.,Pulvenis,D.et al(1993).Mapping of a novel gene for familial hypertrophic cardiomyopathy tochromosome 11.Nat.Genet.4:311-3.
Frayling,I.M.(1999).Microsatellite instability.Gut 45:1-4.
Goedecke,N.,McKenna,B.,El-Difrawy,S.,Carey,L.,Matsudaira,P.,Ehrlich D.(2004).A high-performance multilane microdevice system designedfor the DNA forensics laboratory.Electrophoresis 25:1678-86.
Ionov,Y.,Peinado,M.A.,Malkhosyan,S.,Shibata D.,and Perucho.M.(1993).Ubiquitous somatic mutations in simple repeated sequences reveal a newmechanism for colonic carcinogenesis.Nature 363:558-561.
Jeffreys  AJ,Wilson V,Thein SL.(1985a).Natuer 314:67-73.Hypervariable ′minisatellite′regions in human DNA.
Jeffreys  AJ,Wilson V,Thein SL.Nature.(1985b).316:76-9.Individual-specific′fingerprints′of human DNA.
Lagally,E.T.,Emrich,C.A.,Mathies,R.A.(2001).Fully integratedPCR-capillary electrophoresis microsystem for DNA analysis.Lab Chip1:102-7.
Loeb,L. A.(1994).Microsatellite instability:marker of a mutatorphenotype in cancer.Cancer Res.54:5059-5063.
Matute,D.R.,Sepulveda,V.E.,Quesada,L.M.,Goldman,GH.,Taylor,J.W.,Restrepo,A.,McEwen,J.G.(2006).Microsatellite  analysis of threephylogenetic species of Paracoccidioides brasiliensis.J. Clin.Microbiol.44:2153-7.
McCormick,R.M.,Nelson,R.J.,Alonso-Amigo,M.G,Benvegnu,D.J.,Hooper,H.H.(1997).Microchannel electrophoretic separations of DNA ininjection-molded plastic substrates.Anal Chem.69:2626-30.
McCouch,S.R.,Teytelman,L.,Xu,Y.,Lobos K.B.,C1are K.,Walton,M.,Fu,B.,Maghirang R.,Li,Z.,Xing,Y,Zhang,Q.,Kono,I.,Yano M.,Fjellstrom,R.,DeClerk,G.,Schneider,D.,Cartinhour,S.,Ware,D.and Stein,L.(2002).Development and mapping of 2240new SSR markers for rice(Oryza sativa L).DNA Res.9:199-207.
Radtkey,R.,Feng,L.,Muralhidar,M.,Duhon,M.,Canter,D.,DiPierro,D.,Fallon,S.,Tu,E.,McElfresh,K.,Nerenberg,M.,Sosnowski,R.(2000).Rapid,high fidelity analysis of simple sequence repeats on an electronically active DNAmicrochip.Nucleic Acids Res.28:E17.
Roder.,M.S.,Korzun,V.,Wendehake,K.,Plaschke,J.,Tixier,M.H.,Leroy,P.,Ganal,M.W.(1998).Genetics 149:2007-23.A microsatellite map ofwheat.
Schmalzing,D.,Koutny,L.,Chisholm,D.,Adourian,A.,Matsudaira,P.,Ehrlich,D.(1999).Two-color mnltiplexed analysis of eight short tandem repeatloci with an electrophoretic microdevice.Anal.Biochem.270:148-52.
Shi,Y.,Simpson,P.C.,Scherer,J.R.,Wexler,D.,Skibola,C.,Smith,M.T.,Mathies,R.A.(1999).Radial capillary array electrophoresis microplate andscanner for high-performance nucleic acid analysis.Anal Chem.71:5354-61.
Sinden,R.R.(1999).Biological implications of the DNA structuresassociated with disease-causing triplet repeats.Am.J.Hum.Genet.64:346-53.
Thierfelder,L.,MacRae,C.,Watkins,H.,Tomfohrde,J.,Williams,M.,McKenna.,W.,Bohm K.,Noeske,G.,Schlepper,M.,Bowcock,A.et al(1993).A familial hypertrophic cardiomyopathy locus maps to chromosome 15q2.Proc.Natl.Acad. Sci U S A.90:6270-4.
Watkins,H.,MacRae,C.,Thierfelder,L.,Chou,Y.H.,Frenneaux,M.,McKenna,W.,Seidman,J.G.,Seidman,C.E.(1993).A disease locus for familialhypertrophic cardiomyopathy maps to chromosome lq3.Nat.Genet.3:333-7.
Weissenbach,J.,Gyapay,G.,Dib,C.,Vignal,A.,Morissette,J.,Millasseau,P.,Vaysseix,G.,Lathrop,M.(1992).A second-generation linkage map of thehuman genome.Nature 359:794-801.
Westin,L.,Xu,X.,Miller,C.,Wang,L.,Edman,C.E,Nerenberg,M.(2000).Anchored multiplex amplification on a microelectronic chip array.NatureBiotechnol.18:199-204.
Wooley,A.T.and Mathies,R.A.(1994).Proc.Natl. Acad. Sci.USA91:11348-11352.
序列表
<110>南安普顿大学
<110>LGC有限公司
<120>寡核苷酸及其应用
<130>LGCBW/P41789PC
<150>GB 0720675.8
<151>22October 2007
<160>71
<170>SeqWin99
<210>1
<211>16
<212>DNA
<213>人工序列
<220>
<223>STR重复
<400>1
tgcctgcctt ccttcc                                                16
<210>2
<211>40
<212>DNA
<213>人工序列
<220>
<223>STR重复
<400>2
tttctttctt tcttttttct ctttctttct ccttccttcc                       40
<210>3
<211>61
<212>DNA
<213>人工序列
<220>
<223>HYBSTR
<220>
<221>modified_base
<222>(11)...(11)
<223>C6FAM dU
<220>
<221>modified_base
<222>(19)...(19)
<223>C6FAM dU
<220>
<221>misc_feature
<222>(61)...(61)
<223>3末端磷酸封闭基团
<400>3
ggtggataga nagatagana gatagataga tagatagata gatagataga tagatagata  60
n                                                                  61
<210>4
<211>50
<212>DNA
<213>人工序列
<220>
<223>STRV2
<220>
<221>misc_feature
<222>(17)...(17)
<223>六甘醇间隔子
<220>
<221>modified_base
<222>(24)...(24)
<223>C6FAM dU
<220>
<221>modified_base
<222>(32)...(32)
<223>C6FAM dU
<220>
<221>misc_feature
<222>(50)...(50)
<223>3末端磷酸封闭基团
<400>4
ggtggataga tagatangat aganagatag anagatagat agatagatan      50
<210>5
<211>67
<212>DNA
<213>人工序列
<220>
<223>STRV3
<220>
<221>misc_feature
<222>(17)...(18)
<223>六甘醇间隔子
<220>
<221>modified_base
<222>(25)...(25)
<223>C6FAM dU
<220>
<221>modified_base
<222>(33)...(33)
<223>C6FAM dU
<220>
<221>misc_feature
<222>(67)...(67)
<223>3末端磷酸封闭基团
<400>5
ggtggataga tagatannga taganagata ganagataga tagatagata gatagataga  60
tagatan                                                            67
<210>6
<211>24
<212>DNA
<213>人工序列
<220>
<223>RC5
<400>6
tatctatcta tctatctatc cacc                                          24
<210>7
<211>32
<212>DNA
<213>人工序列
<220>
<223>RC7
<400>7
tatctatcta tctatctatc tatctatcca cc                                  32
<210>8
<211>36
<212>DNA
<213>人工序列
<220>
<223>RC8
<400>8
tatctatcta tctatctatc tatctatcta tccacc           36
<210>9
<211>44
<212>DNA
<213>人工序列
<220>
<223>RC10
<400>9
tatctatcta tctatctatc tatctatcta tctatctatc cacc    44
<210>10
<211>48
<212>DNA
<213>人工序列
<220>
<223>RC11
<400>10
tatctatcta tctatctatc tatctatcta tctatctatc tatccacc 48
<210>11
<211>44
<212>DNA
<213>人工序列
<220>
<223>RC10b
<400>11
tatctgtcta tctgtctatc tgtctatctg tctatctgtc cacc     44
<210>12
<211>44
<212>DNA
<213>人工序列
<220>
<223>RC10c
<400>12
tgtctgtctg tctgtctgtc tgtctgtctg tctgtctgtc cacc      44
<210>13
<211>44
<212>DNA
<213>人工序列
<220>
<223>RC10d
<400>13
tatctatcta tctatcccct tatctatcta tctatctatc cacc       44
<210>14
<211>40
<212>DNA
<213>人工序列
<220>
<223>RC10e
<400>14
tatctatcta tctatctatc tatctatcta tctatctatc             40
<210>15
<211>48
<212>DNA
<213>人工序列
<220>
<223>RC11b
<400>15
tatctgtcta tctgtctatc tgtctatctg tctatctgtc tatccacc    48
<210>16
<211>48
<212>DNA
<213>人工序列
<220>
<223>RC11c
<400>16
tgtctgtctg tctgtctgtc tgtctgtctg tctgtctgtc tgtccacc    48
<210>17
<211>48
<212>DNA
<213>人工序列
<220>
<223>RC11d
<400>17
tatctatcta tctatctatc cccttatcta tctatctatc tatccacc    48
<210>18
<211>44
<212>DNA
<213>人工序列
<220>
<223>RC11e
<400>18
tatctatcta tctatctatc tatctatcta tctatctatc tatc        44
<210>19
<211>28
<212>DNA
<213>人工序列
<220>
<223>STRF2
<400>19
cagatcccaa gctcttcctc ttccctag                          28
<210>20
<211>31
<212>DNA
<213>人工序列
<220>
<223>STRR2
<400>20
acgtttgtgt gtgcatctgt aagcatgtat c                      31
<210>21
<211>70
<212>DNA
<213>人工序列
<220>
<223>02466R
<220>
<221modified_base
<222>(9)...(9)
<223>荧光素dT
<220>
<221>modified_base
<222>(17)...(17)
<223>荧光素dT
<220>
<221>modified_base
<222>(25)...(25)
<223>荧光素dT
<220>
<221>modified_base
<222>(33)...(33)
<223>荧光素dT
<220>
<221>modified_base
<222>(41)...(41)
<223>荧光素dT
<220>
<221>modified_base
<222>(49)...(49)
<223>荧光素dT
<400>21
caatgatanc tatctancta tctanctatc tanctatcta nctatctanc tatctatcta  60
tctatccacc                                                         70
<210>22
<211>70
<212>DNA
<213>人工序列
<220>
<223>02467R
<220>
<221>modified_base
<222>(9)...(9)
<223>荧光素dT
<220>
<221>modified_base
<222>(17)...(17)
<223>荧光素dT
<220>
<221>modified_base
<222>(25)...(25)
<223>荧光素dT
<220>
<221>modified_base
<222>(33)...(33)
<223>荧光素dT
<220>
<221>modified_base
<222>(41)...(41)
<223>荧光素dT
<220>
<221>modified_base
<222>(49)...(49)
<223>荧光素dT
<220>
<221>misc_feature
<222>(51)...(51)
<223>无碱基位点
<400>22
caatgatanc tatctancta tctanctatc tanctatcta nctatctanc natctatcta  60
tctatccacc                                                         70
<210>23
<211>64
<212>DNA
<213>人工序列
<220>
<223>02468R
<220>
<221>modified_base
<222>(3)...(3)
<223>荧光素dT
<220>
<221>modified_base
<222>(11)...(11)
<223>荧光素dT
<220>
<221>modified_base
<222>(19)...(19)
<223>荧光素dT
<220>
<221>modified_base
<222>(27)...(27)
<223>荧光素dT
<220>
<221>modified_base
<222>(35)...(35)
<223>荧光素dT
<400>23
tanctatcta nctatctanc tatctancta tctanctatc tatctatcta tctatctatc  60
cacc                                                               64
<210>24
<211>64
<212>DNA
<213>人工序列
<220>
<223>02469R
<220>
<221>modified_base
<222>(3)...(3)
<223>荧光素dT
<220>
<221>modified_base
<222>(11)...(11)
<223>荧光素dT
<220>
<221>modified_base
<222>(19)...(19)
<223>荧光素dT
<220>
<221>modified_base
<222>(27)...(27)
<223>荧光素dT
<220>
<221>modified_base
<222>(35)...(35)
<223>荧光素dT
<220>
<221>misc_feature
<222>(41)...(41)
<223>无碱基位点
<400>24
tanctatcta nctatctanc tatctancta tctanctatc natctatcta tctatctatc  60
cacc                                                               64
<210>25
<211>61
<212>DNA
<213>人工序列
<220>
<223>C5
<400>25
ccctagatca atacagacag acagacaggt ggatagatag atagatagat atcattgaaa  60
g                                                                  61
<210>26
<211>69
<212>DNA
<213>人工序列
<220>
<223>C7
<400>26
ccctagatca atacagacag acagacaggt ggatagatag atagatagat agatagatat  60
cattgaaag                                                          69
<210>27
<211>73
<212>DNA
<213>人工序列
<220>
<223>C8
<400>27
ccctagatca atacagacag acagacaggt ggatagatag atagatagat agatagatag  60
atatcattga aag                                                     73
<210>28
<211>77
<212>DNA
<213>人工序列
<220>
<223>C9
<400>28
ccctagatca atacagacag acagacaggt ggatagatag atagatagat agatagatag  60
atagatatca ttgaaag                                                 77
<210>29
<211>81
<212>DNA
<213>人工序列
<220>
<223>C10
<400>29
ccctagatca atacagacag acagacaggt ggatagatag atagatagat agatagatag  60
atagatagat atcattgaaa g                                            81
<210>30
<211>85
<212>DNA
<213>人工序列
<220>
<223>C11
<400>30
ccctagatca atacagacag acagacaggt  ggatagatag atagatagat agatagatag    60
atagatagat agatatcatt gaaag                                       85
<210>31
<211>89
<212>DNA
<213>人工序列
<220>
<223>C12
<400>31
ccctagatca atacagacag acagacaggt ggatagatag atagatagat agatagatag  60
atagatagat agatagatat cattgaaag                                    89
<210>32
<211>93
<212>DNA
<213>人工序列
<220>
<223>C13
<400>32
ccctagatca atacagacag acagacaggt ggatagatag atagatagat agatagatag  60
atagatagat agatagatag atatcattga aag                               93
<210>33
<211>97
<212>DNA
<213>人工序列
<220>
<223>C14
<400>33
ccctagatca atacagacag acagacaggt ggatagatag atagatagat agatagatag  60
atagatagat agatagatag atagatatca ttgaaag                           97
<210>34
<211>101
<212>DNA
<213>人工序列
<220>
<223>C15
<400>34
ccctagatca atacagacag acagacaggt ggatagatag atagatagat agatagatag  60
atagatagat agatagatag atagatagat atcattgaaa g                      101
<210>35
<211>52
<212>DNA
<213>人工序列
<220>
<223>B1
<220>
<221>misc_feature
<222>(52)...(52)
<223>3末端磷酸封闭基团
<400>35
tatctatcta tctatctatc cacctgtctg tctgtctgta ttgatctagg gn          52
<210>36
<211>41
<212>DNA
<213>人工序列
<220>
<223>FL1
<220>
<221>modified_base
<222>(1)...(1)
<223>荧光素dT
<220>
<221>modified_base
<222>(9)...(9)
<223>荧光素dT
<220>
<221>modified_base
<222>(17)...(17)
<223>荧光素dT
<220>
<221>modified_base
<222>(25)...(25)
<223>荧光素dT
<220>
<221>modified_base
<222>(33)...(33)
<223>荧光素dT
<220>
<221>misc_feature
<222>(41)...(41)
<223>辛二醇封闭基团
<400>36
natctatcna tctatcnatc tatcnatcta tcnatctatc n              41
<210>37
<211>51
<212>DNA
<213>人工序列
<220>
<223>BP1
<220>
<221>misc_feature
<222>(31)...(31)
<223>六甘醇间隔子
<400>37
tatctatcta tctatctatc cacctgtctg ngatcccaag ctcttcctct t    51
<210>38
<211>47
<212>DNA
<213>人工序列
<220>
<223>FL1
<220>
<221>modified_base
<222>(7)...(7)
<223>荧光素dT
<220>
<221>modified_base
<222>(15)...(15)
<223>荧光素dT
<220>
<221>modified_base
<222>(23)...(23)
<223>荧光素dT
<220>
<221>modified_base
<222>(31)...(31)
<223>荧光素dT
<220>
<221>modified base
<222>(39)...(39)
<223>荧光素dT
<220>
<221>misc_feature
<222>(47)...(47)
<223>辛二醇封闭基团
<400>38
caatganatc tatcnatcta tcnatctatc natctatcna tctatcn 47
<210>39
<211>47
<212>DNA
<213>人工序列
<220>
<223>FL2
<220>
<221>modified_base
<222>(11)...(11)
<223>荧光素dT
<220>
<221>modified_base
<222>(19)...(19)
<223>荧光素dT
<220>
<221>modified_base
<222>(39)...(39)
<223>荧光素dT
<220>
<221>misc_feature
<222>(47)...(47)
<223>3末端磷酸封闭基团
<400>39
caatgatatc natctatcna tctatctatc tatctatcna tctatcn 47
<210>40
<211>47
<212>DNA
<213>人工序列
<220>
<223>FL3
<220>
<221>modified_base
<222>(7)...(7)
<223>荧光素dT
<220>
<221>modified_base
<222>(13)...(13)
<223>荧光素dT
<220>
<221>modified_base
<222>(19)...(19)
<223>荧光素dT
<220>
<221>modified_base
<222>(25)...(25)
<223>荧光素dT
<220>
<221>modified_base
<222>(31)...(31)
<223>荧光素dT
<220>
<221>modified_base
<222>(37)...(37)
<223>荧光素dT
<220>
<221>modified_base
<222>(43)...(43)
<223>荧光素dT
<220>
<221>misc_feature
<222>(47)...(47)
<223>3末端磷酸封闭基团
<400>40
caatganatc tanctatcna tctanctatc natctancta tcnatcn    47
<210>41
<211>47
<212>DNA
<213>人工序列
<220>
<223>FL4
<220>
<221>modified_base
<222>(11)...(11)
<223>荧光素dT
<220>
<221>modified_base
<222>(17)...(17)
<223>荧光素dT
<220>
<221>modified_base
<222>(39)...(39)
<223>荧光素dT
<220>
<221>misc_feature
<222>(47)...(47)
<223>3末端磷酸封闭基团
<400>41
caatgatatc natctancta tctatctatc tatctatcna tctatcn    47
<210>42
<211>47
<212>DNA
<213>人工序列
<220>
<223>FL5
<220>
<221>modified_base
<222>(13)...(13)
<223>荧光素dT
<220>
<221>modified_base
<222>(21)...(21)
<223>荧光素dT
<220>
<221>modified_base
<222>(29)...(29)
<223>荧光素dT
<220>
<221>modified_base
<222>(37)...(37)
<223>荧光素dT
<220>
<221>misc_feature
<222>(47)...(47)
<223>辛二醇封闭基团
<400>42
caatgatatc tanctatcta nctatctanc tatctancta tctatcn              47
<210>43
<211>66
<212>DNA
<213>人工序列
<220>
<223>5LSB1
<220>
<221>misc_feature
<222>(46)...(46)
<223>六甘醇间隔子
<400>43
gcggctatct atctatctat ctatccacct gtctgtctgt ctgtangatc ccaagctctt  60
cctctt                                                             66
<210>44
<211>65
<212>DNA
<213>人工序列
<220>
<223>7LSB2
<220>
<221>misc_feature
<222>(65)...(65)
<223>3末端磷酸封闭基团
<400>44
gcggctatct atctatctat ctatctatct atccacctgt ctgtctgtct gtattgatct  60
agggn                                                              65
<210>45
<211>46
<212>DNA
<213>人工序列
<220>
<223>10SFL1
<220>
<221>modified_base
<222>(11)...(11)
<223>荧光素dT
<220>
<221>modified_base
<222>(12)...(12)
<223>吡咯-脱氧胞嘧啶
<220>
<221>modified_base
<222>(23)...(23)
<223>荧光素dT
<220>
<221>modified_base
<222>(24)...(24)
<223>吡咯-脱氧胞嘧啶
<220>
<221>modified_base
<222>(32)...(32)
<223>吡咯-脱氧胞嘧啶
<220>
<221>modified_base
<222>(33)...(33)
<223>荧光素dT
<220>
<221>misc_feature
<222>(46)...(46)
<223>3末端磷酸封闭基团
<400>45
tatctatcta nntatctatc tanntatcta tnnatctatc gccgcn    46
<210>46
<211>38
<212>DNA
<213>人工序列
<220>
<223>8SFL2
<220>
<221>modified_base
<222>(8)...(8)
<223>吡咯-脱氧胞嘧啶
<220>
<221>modified_base
<222>(9)...(9)
<223>荧光素dT
<220>
<221>modified_base
<222>(16)...(16)
<223>吡咯-脱氧胞嘧啶
<220>
<221>modified_base
<222>(17)...(17)
<223>荧光素dT
<220>
<221>modified_base
<222>(24)...(24)
<223>吡咯-脱氧胞嘧啶
<220>
<221>modified_base
<222>(25)...(25)
<223>荧光素dT
<220>
<221>misc_feature
<222>(38)...(38)
<223>3末端磷酸封闭基团
<400>46
tatctatnna tctatnnatc tatnnatcta tcgccgcn                    38
<210>47
<211>39
<212>DNA
<213>人工序列
<220>
<223>TH019.3等位基因
<400>47
aatgaatgaa tgaatgaatg aatgatgaat gaatgaatg                   39
<210>48
<211>31
<212>DNA
<213>人工序列
<220>
<223>HYBTH01
<220>
<221>modified_base
<222>(4)...(4)
<223>荧光素dT
<220>
<221>modified_base
<222>(12)...(12)
<223>荧光素dT
<220>
<221>misc_feature
<222>(31)...(31)
<223>3末端磷酸封闭基团
<400>48
tggngaatga angaatgaat gaatgaatga n    31
<210>49
<211>29
<212>DNA
<213>人工序列
<220>
<223>TH01_BL
<220>
<221>misc_feature
<222>(29)...(29)
<223>3末端磷酸封闭基团
<400>49
atgaatgaat gaatgaggga aataagggn       29
<210>50
<211>19
<212>DNA
<213>人工序列
<220>
<223>TH01_F
<400>50
ggcttccgag tgcaggtca                  19
<210>51
<211>19
<212>DNA
<213>人工序列
<220>
<223>TH01_R
<400>51
ggtgattccc attggcctg                  19
<210>52
<211>20
<212>DNA
<213>人工序列
<220>
<223>D8F
<400>52
cggcctggca acttatatgt                 20
<210>53
<211>28
<212>DNA
<213>人工序列
<220>
<223>D8R
<400>53
gccttaattt atttacctat cctgtaga                           28
<210>54
<211>39
<212>DNA
<213>人工序列
<220>
<223>HYBD8
<220>
<221>modified_base
<222>(27)...(27)
<223>荧光素dT
<220>
<221>modified_base
<222>(33)...(33)
<223>荧光素dT
<220>
<221>misc_feature
<222>(39)...(39)
<223>3末端磷酸封闭基团
<400>54
tctatctatc tatctatcta tctatcnatc tantccccn                 39
<210>55
<211>43
<212>DNA
<213>人工序列
<220>
<223>D8BL5
<220>
<221>misc_feature
<222>(43)...(43)
<223>3末端氨基C7封闭基团
<400>55
gtatttcatg tgtacattcg tatctatcta tctatctatc tan               43
<210>56
<211>55
<212>DNA
<213>人工序列
<220>
<223>D8BL8
<220>
<221>misc_feature
<222>(55)...(55)
<223>3末端氨基C7封闭基团
<400>56
gtatttcatg tgtacattcg tatctatcta tctatctatc tatctatcta tctan    55
<210>57
<211>67
<212>DNA
<213>人工序列
<220>
<223>D8BL11
<220>
<221>misc_feature
<222>(67)...(67)
<223>3末端氨基C7封闭基团
<400>57
gtatttcatg tgtacattcg tatctatcta tctatctatc tatctatcta tctatctatc  60
tatctan                                                            67
<210>58
<211>53
<212>DNA
<213>人工序列
<220>
<223>D8BL7.2
<220>
<221>misc_feature
<222>(53)...(53)
<223>3末端氨基C7封闭基团
<400>58
gtatttcatg tgtacattcg tatctatcta tctatctatc tatctatcta tcn          53
<210>59
<211>66
<212>DNA
<213>人工序列
<220>
<223>D8BL10.3
<220>
<221>misc_feature
<222>(66)...(66)
<223>3末端氨基C7封闭基团
<400>59
gtatttcatg tgtacattcg tatctatcta tctatctatc tatctatcta tctatctatc   60
tatctn                                                              66
<210>60
<211>16
<212>DNA
<213>人工序列
<220>
<223>D3S1358-1
<400>60
tctatctgtc tatcta                                                   16
<210>61
<211>20
<212>DNA
<213>人工序列
<220>
<223>D3S1358-2
<400>61
tctatctgtc tgtctatcta                                               20
<210>62
<211>24
<212>DNA
<213>人工序列
<220>
<223>D3S1358-3
<400>62
tctatctgtc tgtctgtcta tcta                                          24
<210>63
<211>24
<212>DNA
<213>人工序列
<220>
<223>vWA-3
<400>63
tctatctgtc tgtctgtcta tcta                             24
<210>64
<211>28
<212>DNA
<213>人工序列
<220>
<223>vWA-4
<400>64
tctatctgtc tgtctgtctg tctatcta                         28
<210>65
<211>16
<212>DNA
<213>人工序列
<220>
<223>D2S1338
<400>65
tgcctgcctt ccttcc                                      16
<210>66
<211>45
<212>DNA
<213>人工序列
<220>
<223>D21S11
<400>66
tctatctatc tgtctgtcta tctatctata tctatctatc tatca      45
<210>67
<211>22
<212>DNA
<213>人工序列
<220>
<223>D21S11-2
<400>67
tctatctatc catatctatc ta                               22
<210>68
<211>16
<212>DNA
<213>人工序列
<220>
<223>D19S433
<400>68
aaggaaagaa ggtagg                                     16
<210>69
<211>32
<212>DNA
<213>人工序列
<220>
<223>FGA
<400>69
tttctttctt tcttttttct ctttctttct cc                   32
<210>70
<211>420
<212>DNA
<213>人(Homo sapiens)
<220>
<221>unsure
<222>(38)...(38)
<223>未知核苷酸
<220>
<221>unsure
<222>(390)...(390)
<223>未知核苷酸
<220>
<221>unsure
<222>(397)...(397)
<223>未知核苷酸
<220>
<221>unsure
<222>(402)...(402)
<223>未知核苷酸
<220>
<221>unsure
<222>(413)...(413)
<223>未知核苷酸
<400>70
atggctgccc tcacggctgc accgggagga tgactgtntt cccactctca gtcctgccga  60
ggtgcctgac agccctgcac ccaggagctg gggggtctaa gagcttgtaa aaagtgtaca  120
agtgccagat gctcgttgtg cacaaatcta aatgcagaaa agcactgaaa gaagaatcca  180
gaaaaccaca gttcccattt ttatatggga gcaaacaaag gcagatccca agctcttcct  240
cttccctaga tcaatacaga cagacagaca ggtggataga tagatagata gatagataga  300
tagatagata gatagatatc attgaaagac aaaacagaga tggatgatag atacatgctt  360
acagatgcac acacaaacgt aaatggtatn aaaaatngga tncactcttg tanggttgtt  420
<210>71
<211>239
<212>DNA
<213>人
<400>71
ccagcctggc ccacacagtc ccctgtacac agggcttccg agtgcaggtc acagggaaca  60
cagactccat ggtgaatgaa tgaatgaatg aatgaatgaa tgagggaaat aagggaggaa  120
caggccaatg ggaatcaccc cagagcccag ataccctttg aattttgccc cctatttgcc  180
caggaccccc caccatgagc tgctgctaga gcctgggaag ggccttgggg ctgcctccc   239

Claims (48)

1.用于确定靶多核苷酸内串联重复的数目的方法,其中已知所述靶多核苷酸在给定的多态性基因座具有不同数目的串联重复的多个等位基因,
所述方法包括:
(a)提供包含所述靶多核苷酸的样品,其中所述靶多核苷酸内的两个或更多个串联重复是单链形式,
(a1)使阻断寡核苷酸与步骤(a)中提供的所述靶多核苷酸中的至少一个但并非全部串联重复杂交,从而使所述靶多核苷酸中的一个或多个串联重复在与阻断寡核苷酸杂交后保持单链形式,
(b)使经标记的探针寡核苷酸与所述靶多核苷酸的单链部分杂交,其中所述探针寡核苷酸与所述靶多核苷酸的单链部分中的至少一个串联重复互补,并且所述探针寡核苷酸中的至少5个核苷酸与所述靶多核苷酸的单链部分中的串联重复互补,其中所述探针寡核苷酸允许根据其解链温度(Tm)区分所述靶多核苷酸的单链部分中串联重复的数目,并且,其中所述探针寡核苷酸与所述靶多核苷酸的单链部分中的至少一个串联重复完全或部分互补,和
(c)基于所述探针寡核苷酸与所述靶多核苷酸的单链部分的杂交及其解链温度,确定所述靶多核苷酸内串联重复的数目,
其中,所述方法用于非诊断和治疗目的。
2.如权利要求1所述的方法,其中,所述方法用于法医科学领域、亲子和亲缘关系测定、连锁制图、微生物分型或食物链内的示踪。
3.如权利要求1所述的方法,其中,所述靶多核苷酸是DNA。
4.如权利要求1所述的方法,其中,在步骤(c)中使用解链峰分析或高分辨率解链曲线分析进行所述确定。
5.如权利要求1-4中任一项所述的方法,其中,在步骤(a)中,所述靶多核苷酸内的三个或更多个串联重复为单链形式。
6.如权利要求1-5中任一项所述的方法,其中,在步骤(b)中,所述探针寡核苷酸与所述靶多核苷酸的单链部分中的至少两个串联重复互补。
7.如权利要求6所述的方法,其中,在步骤(b)中,所述探针寡核苷酸与所述靶多核苷酸的单链部分中的至少三个串联重复互补。
8.如前述权利要求中任一项所述的方法,其中,在步骤(a)中,所述包含串联重复的靶多核苷酸的单链部分包含至少8个核苷酸。
9.如前述权利要求中任一项所述的方法,其中,在步骤(a)中,所述包含串联重复的靶多核苷酸的单链部分包含至少16个核苷酸。
10.如权利要求1所述的方法,其中,在步骤(a1)中,所述阻断寡核苷酸与所述靶多核苷酸的单链部分中的至少两个串联重复杂交。
11.如权利要求10所述的方法,其中,在步骤(a1)中,所述阻断寡核苷酸与所述靶多核苷酸的单链部分中的至少三个串联重复杂交。
12.如权利要求1所述的方法,其中,在步骤(a1)中,两个或更多个串联重复在与所述阻断寡核苷酸杂交后保持单链形式。
13.如权利要求12所述的方法,其中,在步骤(a1)中,三个或更多个串联重复在与所述阻断寡核苷酸杂交后保持单链形式。
14.如权利要求1所述的方法,其中,在步骤(a1)中,将两个或更多个阻断寡核苷酸与步骤(a)中提供的至少一个但并非全部串联重复杂交,从而使所述靶多核苷酸中的一个或多个串联重复在与阻断寡核苷酸杂交后保持单链形式。
15.如权利要求14所述的方法,其中一个或多个阻断寡核苷酸与部分数目的串联重复杂交。
16.如前述权利要求中任一项所述的方法,其中,在步骤(a)中的样品在扩增反应期间或之后产生。
17.如权利要求16所述的方法,其中所述扩增反应是PCR。
18.如前述权利要求中任一项所述的方法,其中所述探针寡核苷酸是荧光标记的。
19.如权利要求1所述的方法,其中所述阻断寡核苷酸与所述靶多核苷酸中的至少一个串联重复完全地互补。
20.如权利要求1所述的方法,其中所述阻断寡核苷酸与所述靶多核苷酸中的至少一个串联重复部分地互补。
21.如前述权利要求中任一项所述的方法,其中,在步骤(a)中,在所述靶多核苷酸中侧翼于串联重复的一个区域或两个区域都为单链形式。
22.如权利要求21所述的方法,其中,在步骤(b)中,所述探针寡核苷酸包含锚定部分,该锚定部分与所述靶多核苷酸中侧翼于串联重复的区域互补。
23.如权利要求1所述的方法,其中,在步骤(a)中,在所述靶多核苷酸中侧翼于串联重复的一个或两个区域都为单链形式,并且所述阻断寡核苷酸包含锚定部分,该锚定部分与侧翼于所述串联重复的区域互补。
24.如权利要求23所述的方法,其中,在步骤(b)中,所述探针寡核苷酸包含锚定部分,该锚定部分与侧翼于所述串联重复的区域互补,但该侧翼于所述串联重复的区域不与所述阻断寡核苷酸的锚定部分互补。
25.如权利要求1所述的方法,其中所述阻断寡核苷酸在其3'或5'端包含钳部分,该钳部分与在所述探针寡核苷酸的5'或3'端的钳部分互补。
26.如权利要求25所述的方法,其中使用至少两对不同的阻断寡核苷酸和探针寡核苷酸,其中每对阻断寡核苷酸和探针寡核苷酸各自的钳部分彼此互补。
27.如权利要求26所述的方法,其中选择所述钳部分的核苷酸序列,以使每对互补的钳部分具有不同的Tm
28.如权利要求1所述的方法,其中所述步骤(a)和(a1)同时进行。
29.如权利要求28所述的方法,其中PCR产生靶多核苷酸,其中,所述靶多核苷酸是DNA,所述靶DNA内的两个或更多个串联重复为单链形式,并且在所述PCR中使用的引物也包含所述阻断寡核苷酸。
30.如权利要求29所述的方法,其中所述引物在其3'端包含与靶DNA内串联重复的3'端区域互补的部分,并且在其5'端包含与通过所述引物合成的PCR产物的链中的至少一个串联重复互补的部分。
31.如权利要求30所述的方法,其中所述引物从3'向5'方向包含:(i)与所述靶DNA内串联重复的3'端区域互补的部分,(ii)任选的间隔子部分,(iii)与通过所述引物合成的PCR产物的链中的侧翼部分互补的锚定部分,和(iv)与通过所述引物合成的PCR产物的链中的至少一个串联重复互补的部分。
32.如权利要求31所述的方法,其中所述引物进一步包含(v)钳部分,该钳部分与探针寡核苷酸的3'端的钳部分互补。
33.如权利要求31所述的方法,其中使用至少两对不同的PCR引物和探针寡核苷酸,其中每对阻断寡核苷酸和探针寡核苷酸各自的钳部分彼此互补。
34.如权利要求29所述的方法,其中所述PCR中使用的引物还包含探针寡核苷酸。
35.如权利要求31所述的方法,其中所述引物进一步包含(v)间隔子部分和(vi)探针寡核苷酸。
36.如权利要求1所述的方法,其中由所述探针寡核苷酸和包含所述串联重复的靶DNA的单链部分之间形成的杂交体的Tm之间的解链温度差异(ΔTm)为至少0.5℃。
37.如前述权利要求中任一项所述的方法,其中所述杂交步骤(b)在30℃至75℃的温度范围内进行。
38.用于确定靶多核苷酸内串联重复的数目的系统,其中已知所述靶多核苷酸在给定的多态基因座具有不同数目的串联重复的多个等位基因,并且,其中所述靶多核苷酸内的一个或多个串联重复为单链形式,所述系统包括:
(a)经标记的探针寡核苷酸,其与所述靶多核苷酸的单链部分中的至少一个串联重复互补,且所述探针寡核苷酸的至少5个核苷酸与所述靶多核苷酸的单链部分中的串联重复互补,其中所述探针寡核苷酸允许根据其解链温度(Tm)区分所述靶多核苷酸的单链部分中串联重复的数目,并且,其中所述探针寡核苷酸与所述靶多核苷酸的单链部分中的至少一个串联重复完全或部分互补,和
(b)阻断寡核苷酸,其与所述靶多核苷酸中至少一个但并非全部串联重复互补。
39.寡核苷酸引物,其用于参与PCR反应以扩增包含串联重复的靶DNA,所述引物从3'向5'方向包含:(i)与靶DNA内串联重复的3'端区域互补的部分,(ii)任选的间隔子部分,(iii)与通过所述引物合成的PCR产物的链中的侧翼部分互补的锚定部分,和(iv)与通过所述引物合成的PCR产物的链中的至少一个串联重复互补的部分。
40.如权利要求39所述的寡核苷酸引物,其进一步包含(v)间隔子部分和(vi)探针寡核苷酸。
41.用于确定靶多核苷酸内串联重复的数目的系统,所述系统包括:标记的寡核苷酸,其包含含有与锚定部分结合的至少两个串联重复的部分,其中所述锚定部分的序列和所述至少两个串联重复在靶多核苷酸中连续地存在,和权利要求39所述的寡核苷酸引物。
42.用于确定靶多核苷酸内串联重复的数目的系统,所述系统包括:标记的寡核苷酸,其包含含有与锚定部分结合的至少两个串联重复的部分,其中所述锚定部分的序列和所述至少两个串联重复在靶多核苷酸中连续地存在,其进一步在其3'端包含钳部分,和权利要求39所述的寡核苷酸引物,其进一步包含(v)钳部分,其中所述钳部分是彼此互补的。
43.用于确定靶多核苷酸内串联重复的数目的系统,其包含两对或更多对权利要求42所述的标记的寡核苷酸和寡核苷酸引物,其中所述寡核苷酸对具有互补的钳部分。
44.权利要求39所述的用于参与PCR反应以扩增包含串联重复的靶DNA的寡核苷酸引物的制备方法,所述方法包括:
(a)选择包含串联重复的靶DNA,
(b)获得串联重复的序列以及一个或多个侧翼区域的序列,和
(c)合成寡核苷酸,该寡核苷酸从3'向5'方向包含:(i)与靶DNA内串联重复的3'端区域互补的部分,(ii)任选的间隔子部分,(iii)与通过所述引物合成的PCR产物的链中的侧翼区域互补的锚定部分,(iv)与通过所述引物合成的PCR产物的链中的至少一个串联重复互补的部分,和任选的(v)钳部分,或任选的(v)间隔子部分,和(vi)探针寡核苷酸。
45.权利要求41所述的系统的制备方法,所述方法包括:
(a)选择包含串联重复的靶DNA,
(b)获得串联重复的序列以及一个或多个侧翼区域的序列,和
(c)合成权利要求41中所述的标记的寡核苷酸,该寡核苷酸包含含有与锚定部分结合的至少两个串联重复的部分和任选的在其3'端的钳部分,其中所述锚定部分的序列和所述至少两个串联重复在靶多核苷酸中连续地存在,其中标记所述寡核苷酸,并且通过权利要求44所述的方法制备权利要求39或40所述的寡核苷酸引物。
46.如权利要求1-37、44或45中任一项所述的方法,其中所述靶多核苷酸或DNA是人基因组DNA。
47.如权利要求38、41或43中任一项所述的系统,其中所述靶多核苷酸或DNA是人基因组DNA。
48.如权利要求39或40所述的寡核苷酸引物,其中所述靶多核苷酸或DNA是人基因组DNA。
CN2008801199852A 2007-10-22 2008-10-21 寡核苷酸及其应用 Expired - Fee Related CN101896623B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
GB0720675.8 2007-10-22
GB0720675A GB0720675D0 (en) 2007-10-22 2007-10-22 Oligonucleotides and uses thereof
GB0815113.6 2008-08-19
GB0815113A GB0815113D0 (en) 2008-08-19 2008-08-19 Oligonucleotides and uses thereof
PCT/GB2008/003555 WO2009053679A1 (en) 2007-10-22 2008-10-21 Oligonucleotides and uses thereof

Publications (2)

Publication Number Publication Date
CN101896623A CN101896623A (zh) 2010-11-24
CN101896623B true CN101896623B (zh) 2013-12-18

Family

ID=40202890

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008801199852A Expired - Fee Related CN101896623B (zh) 2007-10-22 2008-10-21 寡核苷酸及其应用

Country Status (12)

Country Link
US (1) US9404148B2 (zh)
EP (1) EP2217719B1 (zh)
JP (1) JP5604302B2 (zh)
CN (1) CN101896623B (zh)
AT (1) ATE516371T1 (zh)
AU (1) AU2008315791B2 (zh)
CA (1) CA2703227C (zh)
ES (1) ES2395240T3 (zh)
HK (1) HK1147524A1 (zh)
NZ (1) NZ584739A (zh)
PT (1) PT2217719E (zh)
WO (1) WO2009053679A1 (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG2014011381A (en) 2009-02-13 2014-06-27 Chem Inc X Methods of creating and screening dna-encoded libraries
JP5716217B2 (ja) * 2009-12-15 2015-05-13 公益財団法人ヒューマンサイエンス振興財団 長鎖繰返し配列を含有する遺伝子又は遺伝子産物の選択又は優先的回収方法
GB201010237D0 (en) 2010-06-18 2010-07-21 Lgc Ltd Methods and apparatuses
JP5985503B2 (ja) * 2010-12-16 2016-09-06 バイオ−ラッド ラボラトリーズ インコーポレーティッド 定量的増幅のためのユニバーサルリファレンス色素
AU2012206487A1 (en) * 2011-01-14 2013-07-18 Genefirst Limited Methods, compositions, and kits for determining the presence/absence of a variant nucleic acid sequence
EP3828271A1 (en) 2011-09-07 2021-06-02 X-Chem, Inc. Methods for tagging dna-encoded libraries
GB201116131D0 (en) * 2011-09-19 2011-11-02 Epistem Ltd Probe
WO2013106807A1 (en) * 2012-01-13 2013-07-18 Curry John D Scalable characterization of nucleic acids by parallel sequencing
US20130183666A1 (en) 2012-01-18 2013-07-18 Marc N. Feiglin Partial genotyping by differential hybridization
EA034141B1 (ru) 2012-07-13 2020-01-09 Икс-Чем, Инк. Днк-кодированные библиотеки, содержащие связи кодирующих олигонуклеотидов, не доступные для считывания полимеразами
US9437397B2 (en) * 2013-06-27 2016-09-06 Varian Semiconductor Equipment Associates, Inc. Textured silicon liners in substrate processing systems
WO2015120406A1 (en) 2014-02-07 2015-08-13 University Of Iowa Research Foundation Oligonucleotide-based probes and methods for detection of microbes
US11118216B2 (en) 2015-09-08 2021-09-14 Affymetrix, Inc. Nucleic acid analysis by joining barcoded polynucleotide probes
JP6685138B2 (ja) * 2016-01-27 2020-04-22 シスメックス株式会社 核酸増幅の精度管理方法、精度管理用試薬およびその試薬キット
WO2017173279A1 (en) * 2016-03-31 2017-10-05 Arizona Board Of Regents On Behalf Of Arizona State University Probes and methods for measuring tandem repeats
KR20220041211A (ko) 2019-08-09 2022-03-31 넛크래커 테라퓨틱스 인코포레이티드 치료학적 조성물로부터 물질을 제거하기 위한 제조 방법 및 장치
US20210116369A1 (en) * 2019-10-22 2021-04-22 Bio-Rad Laboratories, Inc. Measurement of molecular interactions at single molecule level using substrates that enhance fluorescence detection
CN110951878B (zh) * 2019-12-20 2023-02-28 北京优迅医学检验实验室有限公司 与基因组稳定性相关的微卫星位点的筛选方法、筛选装置及应用
CA3168815A1 (en) * 2020-03-03 2021-09-10 Universiteit Gent Hydrolysis-based probe and method for str genotyping

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5210015A (en) 1990-08-06 1993-05-11 Hoffman-La Roche Inc. Homogeneous assay system using the nuclease activity of a nucleic acid polymerase
US6207373B1 (en) * 1998-02-25 2001-03-27 Nanogen, Inc. Methods for determining nature of repeat units in DNA
US6465183B2 (en) * 1999-07-01 2002-10-15 Agilent Technologies, Inc. Multidentate arrays
ATE334228T1 (de) 2000-03-29 2006-08-15 Lgc Ltd Hybridisierungsprobe und methode zum schnellen nachweis und zur schnellen unterscheidung von sequenzen
ATE306562T1 (de) 2000-11-15 2005-10-15 Hoffmann La Roche Verfahren zur analyse von wiederkehrenden pcr- podukten, das auf der analyse von dns- schmelzkurven basiert
US20060008823A1 (en) * 2004-05-12 2006-01-12 Kemp Jennifer T DNA profiling and SNP detection utilizing microarrays
GB0514889D0 (en) 2005-07-20 2005-08-24 Lgc Ltd Oligonucleotides
US7977108B2 (en) * 2005-07-25 2011-07-12 Roche Molecular Systems, Inc. Method for detecting a mutation in a repetitive nucleic acid sequence
CN101421406B (zh) * 2006-02-13 2016-08-31 孟山都技术有限公司 用于产生改变的种子油组成的核酸构建体和方法

Also Published As

Publication number Publication date
JP2011507488A (ja) 2011-03-10
JP5604302B2 (ja) 2014-10-08
AU2008315791A1 (en) 2009-04-30
EP2217719B1 (en) 2011-07-13
CA2703227C (en) 2017-02-28
CN101896623A (zh) 2010-11-24
AU2008315791B2 (en) 2014-04-10
US9404148B2 (en) 2016-08-02
PT2217719E (pt) 2011-10-03
US20110003290A1 (en) 2011-01-06
HK1147524A1 (en) 2011-08-12
NZ584739A (en) 2012-06-29
EP2217719A1 (en) 2010-08-18
CA2703227A1 (en) 2009-04-30
ATE516371T1 (de) 2011-07-15
ES2395240T3 (es) 2013-02-11
WO2009053679A1 (en) 2009-04-30

Similar Documents

Publication Publication Date Title
CN101896623B (zh) 寡核苷酸及其应用
US9587272B2 (en) Probe based nucleic acid detection
CN108823287B (zh) 一种检测靶核酸序列的方法
USRE42325E1 (en) Homogeneous multiplex hybridization analysis by color and Tm
JP5632476B2 (ja) 核酸の違いを検出するためのプローブの形式
US7803543B2 (en) Methods and kits for the detection of nucleotide mutations using peptide nucleic acid as both PCR clamp and sensor probe
KR102295290B1 (ko) Dna 증폭 기술
US20200172958A1 (en) Multiplex probes
CN101268200A (zh) 寡核苷酸
WO2010066407A1 (en) Nuclease-free real-time detection of nucleic acids
US10597710B2 (en) Ligase activity
CN107267615A (zh) G形夹用于改进的等位基因特异性pcr的用途
JP5597939B2 (ja) 部分競合型プローブを用いた標的塩基配列の検出方法
CN104838017B (zh) 高分辨率解链的改进校准
US7101673B2 (en) Method for detecting a nucleic acid comprising asymmetrical amplification
CN111321211A (zh) 人β地中海贫血基因分型检测的试剂及检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20131218

Termination date: 20181021

CF01 Termination of patent right due to non-payment of annual fee