CN100487135C

CN100487135C - 用于证实遗传身份的方法和测试试剂盒

Info

Publication number: CN100487135C
Application number: CNB038076659A
Authority: CN
Inventors: A·H·舒尔曼; L·G·波林
Original assignee: BOREAL PLANT BREEDING Ltd
Current assignee: BOREAL PLANT BREEDING Ltd
Priority date: 2002-01-30
Filing date: 2003-01-29
Publication date: 2009-05-13
Anticipated expiration: 2023-01-29
Also published as: ZA200405089B; FI112093B; CN1646701A; AU2003201974B2; EP1468115A1; RU2004126246A; CA2472153A1; FI20020176A0; RU2322507C2; US20030170705A1; JP2005515789A; FI20020176A; WO2003064686A1

Abstract

用共显性评分证实确定的种群集合体内的遗传身份、遗传多样性、基因组变异或多态性，特别是等位基因变异，还有生物多样性的方法和试剂盒。所述方法和测试试剂盒应用可动因子(ME)，如转座子或逆转录转座子，而且以使用与固相支持物连接的一组或多组任选成对或平行的寡核苷酸为基础。每个寡核苷酸序列代表可动因子的一个插入位点连接点。本发明还涉及所述方法和试剂盒通过证实遗传身份、遗传多样性、基因组变异或多态性，特别是通过提供共显性评分，用于系统发育研究、亲子关系鉴定、基因型分析、单倍型分析、谱系分析、法学、人类医学诊断以及植物和动物繁殖的用途。

Description

用于证实遗传身份的方法和测试试剂盒

本发明的技术领域

本发明涉及一种用共显性评分证实确定的种群集合体内的遗传身份、遗传多样性、基因组变异或多态性，特别是等位基因变异，以及生物多样性的方法和测试试剂盒。该方法和测试试剂盒应用可动因子(ME)，而且以使用与固相支持物连接的一组或多组任选成对或平行的寡核苷酸为基础。每个寡核苷酸序列代表可动因子(ME)的一个插入位点连接点。所述方法和测试试剂盒用于遗传身份确定、系统发育研究、亲子关系鉴定、基因型分析、单倍型分析、谱系分析、法学、人类医学诊断和植物及动物的繁殖。

发明背景

已知特定种群内特定个体(例如，人、动物、细菌、植物等)的基因组对于主要部分而言是独特的，除非高度近亲交配或克隆或无性繁殖。特定基因组的独特性很大程度是由其中所含的DNA序列确定的。假如个体间基因组独特性的差异可反映DNA序列的差异，那么DNA序列变异可用于把个体彼此区别开来，即基因型分析可区别表型。检测DNA序列变异可使用各种实验室过程进行，每个过程都有它们各自固有的限制和优点；在确定所选方法有效性的这两个极端之间存在着一种平衡。无论使用什么方法，目的都是相同的：即为了检测DNA序列变异并使用该信息把个体彼此区别开来。把一个个体与另外一个个体区别开来的DNA序列变异的图谱被称作“DNA指纹”。作为一种技术，DNA指纹具有广泛的应用范围，包括但不限制于，法医鉴定、系统发育研究、亲子关系鉴定、法学、人类医学诊断、谱系分析以及动物和植物繁殖。

例如，传统的植物繁殖依赖于“繁殖人员眼睛”的专门技术来鉴定，并遵循特定性状的遗传，这些特定性状是通过杂交和回交从供体植物引入到受体种类中的，直到消除供体不需要的遗传背景。实现此繁殖程序目的所需的回交步骤数通常需要若干年的努力。为了加速繁殖程序，可应用高度选择性的标记辅助选择(MAS)和DNA指纹作图法；这些方法是利用分子生物学技术在实验室中进行的。DNA指纹分析可用的DNA标记有很多。每个标记都有其自身固有的优点和缺点。

限制性片段长度多态性(RFLP)(Botstein等，Am.J.Hum.Genet·32：314-331，1980；WO90/13668)是其中一种较为先进的标记系统。RFLE的分辨能力可鉴定杂合及纯合状态。换句话说，RFLP是共显性标记。然而，对于常规标记辅助选择(MAS)和DNA指纹分析而言，存在很多与使用RFLP有关的显著缺点。RFLP分析是强度非常大的工作，包括花费较长时间拟定方案和高能放射性同位素的使用，且研究经费高。此外，每次测定可分析的标记数一般仅为1个或2个。

由于RFLP的引入，已经研究出了很多可选择性的标记，包括单核苷酸多态性(SNP；Kwok等，Genomics31：123-126，1996)、随机扩增的多态DNA(RAPD；Williams等，Nucl.Acids Res.18：6531-6535，1990)、简单序列重复(SSR；Zhao & Kochert，P1ant Mol.Biol.21：607-614，1993；Zietkiewicz等，Genomics 20：176-183，1989)、扩增片段长度多态性(AFLP；Vos等，Nucl.Acids Res.21：4407-4414，1995)、短串联重复(STRs)或可变数量的串联重复(VNTR)以及微卫星(Tautz，Nucl.Acids.Res.17：6463-6471，1989；Weber和May，Am.J.Hum.Genet.44：388-396，1989)。

在应用标记的系统之中，可提及序列-特异性扩增的多态性方法(SSAP；Waugh等，Mol.Gen.Genet.253：687-694，1997)，逆转录转座子微卫星扩增的多态性(REMAP)系统和间逆转录转座子间的扩增的多态性(IRAP)系统。与常规的RFLP系统相比，REMAP和IRAP(Kalendar等，Theor.Appl.Genet.98：704-711，1999)系统耗费的时间明显更少，应用广泛，且可提供更多的信息，但应注意的是，REMAP和IRAP不是共显性标记，因此通常不能用于区别杂合及纯合基因型。

基于逆转录转座子的插入多态性(RBIP)(Flavell等，Plant J16：643-650，1998)是一种基于逆转录转座子的标记系统。它与微卫星标记系统最为相似，因为每个引物对分析单一位点，且该引物与侧翼于可变区的序列相对应，该可变区产生等位基因变异性。因此，RBIP不同于SSAP、IRAP、和REMAP，其用每个PCR扩增反应揭示多个但无名的位点，且不像微卫星系统，其不仅检测引物间一组简单序列重复(SSR)中的等位基因变异，而且可检测该位置是否存在逆转录转座子。上面讨论的标记分子和系统在WO 93/06239、WO00/35418、EP967291、WO01/27321、US 6,114,116、WO 95/11995和WO 99/67421中公开。

上面所列标记、标记系统以及专利或专利申请是非穷举的。尽管可获得或建议的系统有很多，但很明显每个系统都有其自身固有的优点和缺点，对于所有目的而言，还没有哪个系统是理想的。应用PCR和基因组因子的标记系统的其中一个问题在于扩增整个基因组因子的能力有时会失败，导致微小误差加倍，降低分辨率。因此，仍然需要提供可选择性的系统，其对于满足现代繁殖技术的要求足够有效。

很显然需要一种可选择性的标记系统，包括方法和测试试剂盒，其应用广泛，可使用便宜且技术简单的检测系统提供标记模式的强有力、可再现的产生。

发明概述

本发明涉及一种用于证实确定的种群集合体内的遗传身份、遗传多样性、基因组变异或多态性，特别是等位基因变异，以及生物多样性的方法和试剂盒，它们是以检测种群集合体中的基因型整个范围内是否存在可动因子(ME)及其各自的插入位点连接点为基础的。应用与固相支持物连接的寡核苷酸序列的该方法可用于遗传身份确定、系统发育研究、亲子关系鉴定、基因型分析、单倍型分析、谱系分析、法学、人类医学诊断以及植物和动物繁殖。该方法通过记录是否存在可动因子(ME)而检测某一基因组位置的改变。在种群集合体/基因型集合体内得到所期望分辨水平是使用本发明公开的方法和测试试剂盒实现的，其可使用剪切的未标记样品DNA进行杂交。这表示，不需要特别小心保存DNA样品。

未标记的样品DNA用于杂交的事实意味着当样品DNA本身被标记时，DNA纯度并不重要。此外，参考样品可很容易地维持，且无需像标记DNA那样特别小心地使用。可更便宜地处理大量样品DNA，这是因为只需剪切(DNA提取后)。

用于在检测步骤中检测杂交寡核苷酸的方法和测试试剂盒对于样品DNA本身并不特异，但它们以常规方法为基础，依靠一种或多种方式将杂交形式与未杂交的寡核苷酸形式区别开来。因此，它是标准化和自动化的，与所研究的特定样品或其质量无关。

由于使用相对简单，该方法和测试试剂盒可使本发明内部应用，例如，由繁殖者使用。本发明的方法和测试试剂盒为繁殖者提供了一种直接和可行的方法，他们监测并负责他们自己的内部质量控制。

本发明方法和测试试剂盒的特殊优点是它们可用于对给定的目标基因，可靠地区别回交子代的杂合及纯合状态，而无需在回交后，通过回顾性常规筛选相应的(自体受精)后代来确定接合状态。这样做具有重要的成本效益，可显著缩短繁殖程序。

因此，本发明涉及一种方法和测试试剂盒，其可用共显性评分鉴定确定的种群集合体内的遗传身份、遗传多样性和基因变异，如基因组变异或多态性，特别是等位基因变异，以及生物多样性。本发明应用可动因子(ME)，而且以使用与固相支持物连接的任选成对或平行的寡核苷酸组为基础。每个寡核苷酸序列代表可动因子(ME)的完全或空整合位点，且由两部分组成，其或者代表可动因子(ME)的末端，或者代表所述可动因子(ME)的侧翼区。检测完全整合位点的寡核苷酸序列部分包含确定的可动因子(ME)的侧翼区，部分包含所述可动因子(ME)的末端，而检测空整合位点的寡核苷酸序列在整合位点的每一侧包含左侧翼区和右侧翼区。所述方法和测试试剂盒可用于遗传统一性确定、系统发育研究、亲子关系鉴定、基因型分析、单倍型分析、谱系分析、法学、人类医学诊断，并确保和促进繁殖，特别是提供共显性评分。

在该方法中，使代表样品总DNA的未标记、任选断裂的单链寡核苷酸序列与不止一组任选成对或平行的寡核苷酸序列杂交，如上所述它们由两个因子或部分组成，长度不定。换句话说，每组寡核苷酸代表一个确定的基因组位置或整合位点。

在本发明的优选实施方案中，该方法包括杂交、杂交后处理、杂交的记录和评分在内的不同步骤都是自动化的。

本发明还涉及一种用共显性评分证实确定的种群集合体内的遗传多样性、遗传身份、基因组变异或多态性，特别是等位基因变异，以及生物多样性的测试试剂盒。更具体而言，该测试试剂盒包括固相支持物，它可以是膜、滤器、载玻片、平板、芯片、培养皿等。甚至是微量滴定平板上的微孔也适合作为固相支持物。固相支持物可由下列材料制成，如玻璃、塑料、硝化纤维素、尼龙、聚丙烯酸、硅等。该测试试剂盒可含有任选的试剂，包括标记、洗涤缓冲液、末端保护试剂和/或使用说明。

该测试试剂盒的特征在于包含不止一组任选成对或平行的寡核苷酸序列。因此，在其最简单的形式中，该测试试剂盒包含两种不同的单一寡核苷酸，一个是空整合位点，一个是完全整合位点，其中每个寡核苷酸能够识别可动因子(ME)的特异性、确定的插入位点连接点，以及所述插入位点连接点是否存在可动因子(ME)。然而，本领域的技术人员应认识到，为了获得有关种群集合体遗传多样性的具有足够信息量的信息，必须提供更为复杂的系统。

因此，在本发明的优选实施方案中，需要更多组寡核苷酸。经计算，为了在具有7对染色体的二倍体生物中获得最佳的指纹分析或绘图结果，寡核苷酸组的最小值应为约70-80。对于具有更多染色体的生物而言，需要更多组寡核苷酸。然而，对寡核苷酸组的数量没有上限。

一对就足够了，上限由所要鉴定被试者的可获得特征性DNA序列，特别是可动因子(ME)的存在提供。换句话说，寡核苷酸组数取决于可提供信息的侧翼序列DNA对的可获得性且，就标记辅助的选择(MAS)而言，取决于序列对相对于已知目标基因的位置。

可利用本发明获得的信息不仅可通过使用若干组寡核苷酸进一步提高，而且可通过对所要测定的每个可动因子(ME)提供两组或多组任选平行或成对的寡核苷酸进一步提高。所述任选成对或平行的寡核苷酸组合可被设计如下：

-左侧翼区(FL)+可动因子(ME)的末端组合左侧翼区(FL)+右侧翼区(FR)；

-右侧翼区(FR)+可动因子(ME)的末端组合左侧翼区(FL)+右侧翼区(FR)；

-左侧翼区(FL)+可动因子(ME)的末端，右侧翼区(FR)+可动因子(ME)的另一末端组合左侧翼区(FL)+右侧翼区(FR)。

所述寡核苷酸可从任一互补链制备，这是因为在进行杂交反应前，DNA样品的两条链都将以单链形式存在。

该测试试剂盒的寡核苷酸序列可任选被末端保护，且当使用可逆的开发和杂交记录处理时，具有与固相支持物连接的寡核苷酸的测试试剂盒可重新使用。

本发明可使用所述方法和试剂盒，通过任何特定基因组位置中的至少一个可动因子(ME)或任何特定基因组位置中的至少一个侧翼区来区别任何生物。还包括使用所述方法和测试试剂盒用于遗传身份确定、系统发育研究、亲子关系鉴定、基因型分析、单倍型分析、谱系分析、法学、人类医学诊断以及植物和动物繁殖。

附图简述

图1表示不同类型的可动因子(ME)。

图1A描述DNA-介导的转座子，其构成所谓的II类因子，并通过切割和粘贴染色体节段到新的位置而移动。II类因子包括自主(自我活动)和非-自主因子；非自主因子包括微型反向重复序列转座因子(MITEs)，它是可动因子(ME)的高度缺失形式。缩写词：ds，双链。

图1B描述RNA-介导的转座因子，逆转录转座子，或I类因子，它不能象II类因子那样切除，但可使子代拷贝进行逆转录，然后被插入到基因组新的基因组位置中。缩写词：ds，双链；rev.，反向；AAAnA，聚(A)尾部。

图1C描述长末端重复序列(LTR)逆转录转座子。LTR逆转录转座子代表两个主要的I类转座因子组的其中一个。该组包括吉普赛-样(a)和copia-样(b)因子，前者在结构和序列方面更象逆转录病毒样。LTR、U3、R和U5的结构域如下所示。缩写词：PBS，引物结合位点；GAG，衣壳蛋白；AP，天门冬氨酸蛋白酶；IN，整合酶；LTR，长末端重复序列；RT，逆转录酶；RH，核糖核酸酶H；PPT，聚嘌呤道。

图1D描述非-长末端重复序列(非-LTR)逆转录转座子。非-LTR逆转录转座子包括长散布因子(LINE)(a)和短散布因子(SINE)(b)。有关逆转录转座子的种类和它们编码的产物的详细描述见Kumar &Bennetzen，Annu Rev.Genet.33：479-532，1999。缩写词：GAG，衣壳蛋白；RT，逆转录酶；RH，核糖核酸酶H；UTR，非翻译区；EN，内切核酸酶，(A)n，3′聚腺苷酸化序列。

图2示意性说明寡核苷酸的可选择性排列，该寡核苷酸与经由连接区和固相支持物连接的可动因子(ME)左侧翼(FL)和/或右侧翼(FR)和/或相应末端相对应。缩写词：ME，可动因子；FL，左侧翼区；FR，右侧翼区。值得注意的是，图中所示的每个寡核苷酸代表许多完全相同的寡核苷酸。

图2A示意性说明单一寡核苷酸的其中一种可选择性排列，该寡核苷酸经由连接区与代表基因组DNA中的单一可动因子(ME)插入位点的固相支持物连接(a)。不同类型的寡核苷酸都可使用并在此处提出，有2个寡核苷酸与可动因子(ME)插入位点连接点相对应，其中左侧翼或右侧翼及可动因子(ME)的相应末端由(b)表示，(c)表示插入连接点具有左侧翼和右侧翼，但可动因子(ME)的连接点未被占据(c)。

图2B示意性说明独立寡核苷酸的排列，该寡核苷酸代表经由独立连接区与固相支持物连接的左侧翼(FL)和/或右侧翼(FR)和/或可动因子(ME)相应末端。其中提出了3种排列，2种与可动因子(ME)插入位点连接点相对应(a)和(b)，1种代表可动因子(ME)插入位点事件的未被占据位点(c)。即使独立寡核苷酸之间似乎存在空位，寡核苷酸足够紧密地定位也是非常必要的，这样基因组样品DNA才可与完全或空插入位点情况下的两种寡核苷酸杂交。

图2C示意性说明独立寡核苷酸的排列，该寡核苷酸代表经由互补寡核苷酸延伸区(互补碱基配对)连接的左侧翼(FL)和/或右侧翼(FR)和/或可动因子(ME)相应末端，该互补寡核苷酸延伸区(互补碱基对)与固相支持物上连接的独立连接区连接。其中提出了3种排列，2种与可动因子(ME)插入位点连接点相对应(a)和(b)，1种代表可动因子(ME)插入位点事件的未被占据位点(c)。

图3示意性说明包括固相支持物的本发明概念。缩写词：ME，可动因子；FL，左侧翼区；FR，右侧翼区。

图3A示意性说明上面固定了3种寡核苷酸的固相支持物(灰条)。连接区用黑色的椭圆形表示。3种寡核苷酸如实施例所示：左侧翼/右侧翼(FL/FR)(a)，左侧翼(FL)和右侧翼(FR)节段分别用不同条纹模式的阴影表示；左侧翼/可动因子(FL/ME)(b)，可动因子(ME)由阴影格子表示；和可动因子/右侧翼(ME/FR)(c)。寡核苷酸末端的小圆圈是加入到寡核苷酸上的一个或多个碱基的延伸，不与侧翼序列匹配。固相支持物可以是任何固相支持物，包括珠子，且这3种寡核苷酸无需被固定在同一支持物上。所示的3种寡核苷酸代表一个特定基因组位置的3种寡核苷酸。

图3B示意性表示总DNA(a；波形曲线)；b、c、d和e代表不同的DNA片段，这些不同的DNA片段是从总DNA剪切下来的并代表图3A所示寡核苷酸的基因组等同物，连同侧翼序列(波形曲线)。侧翼序列包括由阴影格子表示的内部可动因子(ME)序列。

图3C示意性表示固相支持物上的寡核苷酸，如图3A所示，与基因组DNA的片段杂交。在本特殊实施例中，只有空位点[左侧翼/右侧翼(FL/FR)]寡核苷酸完全匹配基因组DNA(a)。对于含有左侧翼/可动因子(FL/ME)的寡核苷酸而言，只有可动因子(ME)匹配剪切基因组DNA的一个特定片段(b)；对于可动因子/右侧翼(ME/FR)而言，在另外一种情况下，只有右侧翼(FR)节段匹配(c)。在其它情况下，不同的模式都要检测。

图3D示意性说明进行的洗涤步骤，该洗涤步骤仅除去与固相支持物上连接的寡核苷酸部分杂交的基因组DNA。

图3E示意性说明进行的检测步骤。通过杂交DNA延伸而掺入的可检测标记用黑色圆圈表示。

图3F示意性表示检测反应的评分。寡核苷酸左侧翼/右侧翼(FL/FR)(a)代表空位点，并产生正信号。寡核苷酸左侧翼/右侧翼(FL/ME)(b)和可动因子/右侧翼(ME/FR)(c)代表完全位点，且两者都没有产生信号。因此该位点被证实为空的。

图4表示用于进行比较的、现有技术的基于逆转录转座子的插入多态性(RBIP)方法。该方法依靠检测特定基因组位置上是否存在可动因子(ME)插入(Flavell等，Plant J.16，643-650，1998)。缩写词：ME，可动因子；FL，左侧翼区；FR，右侧翼区。

图4A证实使用引物，自可动因子(ME)插入区的左侧翼(FL)和右侧翼(FR)，在空位点进行PCR，产生一种产物(下文)。

图4B证实可动因子(ME)插入后，基因组位置的PCR反应。关于可动因子(ME)的有义方向，左侧翼(FL)和右侧翼(FR)引物与指向左(L)和右(R)的引物组合。使用组合FL+FR的PCR扩增通常不能产生产物，这是因为在该实例中，由插入的可动因子(ME)大小决定的PCR引物之间的距离较大(N.B.缺少相应的PCR产物时，在下面用虚线表示)。组合FL+L和FR+R可产生该完全基因组位置的产物，而空基因组位置不能产生产物(图4A)。如文献所述(Flavell等，Plant J 16：643-650，1998)，RBIP是通过在琼脂糖凝胶上分离PCR产物而评分的。可选择性地，可将PCR反应产物放在适宜的滤器上，然后使用适宜的、源于可动因子(ME)或侧翼序列扩增部分的寡核苷酸在独立反应中杂交。

图5描述可动因子(ME)插入多态性如何区别杂合与纯合状态。

图5A表示在同一基因组位置具有一个(杂合状态)或两个(纯合状态)可动因子(ME)的同源染色体。

图5B表示使用引物进行的反向PCR，该引物被设计成鉴定植物基因组DNA序列(虚线)的可动因子(ME)，该植物基因组DEA序列直接侧翼于可动因子(ME)。应注意的是，在杂合状态下，其中一个同源染色体上缺少可动因子(ME)。

图5C表示使用面向内的引物进行的长程PCR，该引物被设计成扩增一个或两个PCR产物(a或b)的左和右可动因子(ME)，这取决于可动因子(ME)是否存在于一个或两个同源染色体上。

图5D表示按照大小分离PCR扩增产物的凝胶电泳(在该实施例中，′a′单独或′a′和′b′)，由此分离杂合状态与纯合状态。

图6示意性说明包括固相支持物的本发明的改进。该检测方法不同于图3所示。缩写词：ME，可动因子；FL，左侧翼区；FR，右侧翼区。

图6A示意性描述上面固定了3种寡核苷酸的固相支持物(灰条)。连接区用黑色椭圆形表示。三种寡核苷酸如实施例所示：左侧翼/右侧翼(FL/FR)(a)，左侧翼(FL)和右侧翼(FR)节段分别用不同条纹样式的阴影表示；左侧翼/可动因子(FL/ME)(b)，可动因子(ME)用阴影格子表示；和可动因子/右侧翼(ME/FR)(c)。所述固相支持物可以是任何固相支持物，包括珠子，且3种寡核苷酸无需固定在同一支持物上。所示3种寡核苷酸代表一个特定基因组位置的3种寡核苷酸。

图6B示意性表示总DNA(a；波形曲线)；b、c、d和e代表不同的剪切DNA片段，这些片段是从总DNA剪切下来的并代表图6A所示寡核苷酸的基因组等同物，连同侧翼序列(波形曲线)。侧翼序列包括由阴影格子表示的内部可动因子(ME)序列。

图6C示意性表示固相支持物上的寡核苷酸，如图3A所示，与基因组DNA杂交。在本特殊实施例中，只有空位点[左侧翼/右侧翼(FL/FR)]寡核苷酸完全匹配基因组DNA(a)。对于含有左侧翼/可动因子(FL/ME)的寡核苷酸而言，只有可动因子(ME)匹配基因组DNA的一个特定剪切片段(b)；对于可动因子/右侧翼(ME/FR)而言，在另外一种情况下，只有右侧翼(FR)节段匹配(c)。在其它情况下，不同模式都要检测。

图6D示意性描述所进行的检测步骤。加入标记的双脱氧核苷酸，其被掺入到寡核苷酸末端，使寡核苷酸与作为模板的基因组DNA杂交。与匹配寡核苷酸的区域相邻的基因组位置上的核苷酸序列是已知的，且因此所要掺入的特定核苷酸(A、C、G、T或U)是已知的。在所示实施例中，寡核苷酸b和C没有延伸，这是因为它们缺少杂交的基因组DNA。

图6E示意性表示检测反应的评分。示意性说明评分。寡核苷酸左侧翼/右侧翼(FL/FR)(a)代表空位点，并产生正信号。寡核苷酸左侧翼/可动因子(FL/ME)(b)和可动因子/右侧翼(ME/FR)(c)代表完全位点，两者都没有产生信号。因此，该位点被证实是空的。

图7表示sb17.seq(SEQ ID NO：20)的1767nt序列。在逆转录转座子微卫星扩增多态性(REMAP)方法中，使用引物7286(SEQ IDNO：18)和(CTC)9C(SEQ ID NO：19)，多态带被鉴定仅存在于春大麦中，而不存在于冬大麦中。该带是从溴化乙锭染色的琼脂糖凝胶上切除下来的，被克隆并测序。在BARE-1插入片段的LTR下面加下划线。它代表与可读框有义方向相反的LTR末端。由插入产生的预测的5bp同向重复序列，CCACT，用粗斜体字表示。

图8表示wb17.seq(SEQ ID NO：21)的3186nt序列。在逆转录转座子微卫星扩增多态性(REMAP)方法中，使用引物7286(SEQID NO：18)和(CTC)9C(SEQ ID NO：19)，多态带被鉴定存在于冬大麦中。该带是从溴化乙锭染色的琼脂糖凝胶上切除下来的，被克隆并测序。冬大麦在该基因组位置缺少BARE-1插入。该序列与sb17序列(SEQ ID NO：20)几乎完全相同，只是它缺少BARE-1序列。BARE-1在sb17(SEQ ID NO：20)中的插入位点用wb17(SEQ ID NO：21)序列中的箭头标记，且位于wb17(SEQ ID NO：21)中的核苷酸1511和1512之间。在这些侧翼核苷酸下面加下划线。在sb17(SEQ ID NO：20)中形成同向重复序列的5bp序列用粗体字表示。

图9表示可动因子/左侧翼(ME/FL)区如何能够分别从BARE-1LTR，预测的5bp同向重复序列，和wb17序列预测。

图9A表示代表反向BARE-1LTR的前100nt，和对sb175′连接区(SEQ ID NO：23)预测的约100nt的序列。

图9B表示以下列方式概括的左侧翼和右侧翼(FL和RF)及反向可动因子(ME)：左侧翼(FL)/可动因子(ME)(SEQ ID NO：24)；右侧翼(FR)/可动因子(ME)(SEQ ID NO：25)。这些寡核苷酸是合成的、任选末端保护的，并与芯片连接，代表玉米的单一基因组位置。另外50个或更多基因组位置的寡核苷酸是以相似方式衍生并处理的。

发明详述

缩写词

AFLP 扩增片段长度多态性

BARE 大麦逆转录转座子

FL 左侧翼区；左侧翼

FR 右侧翼区；右侧翼

IRAP 逆转录转座子间扩增多态性

LINE 长散布因子

LTR 长末端重复序列

MAS 标记辅助的选择

ME 可动因子

MITE 微型反向重复序列转座因子

RAPD 随机扩增的多态DNA

REMAP 逆转录转座子微卫星扩增多态性

RBIP 基于逆转录转座子的插入多态性

RFLP 限制性片段长度多态性

SINE 短散布因子

SNP 单核苷酸多态性

SSR 简单序列重复

SSAP 序列特异性扩增多态性

STR 短串联重复

TRIM 微型末端重复序列逆转录转座子

VNTR 可变数量的串联重复

说明书中所用的术语

在本说明书中所用的绝大多数术语通常具有与遗传学、人类医学诊断、重组DNA技术、分子生物学及植物和动物繁殖领域中相同的含义。然而，有些术语稍有不同，并在下面详细解释。

术语＂遗传身份＂是指确定的种群集合体内个体的遗传多样性、基因组变异或多态性，等位基因变异或遗传独特性，其特征在于代表遗传多样性的等位基因变异、基因组变异或多态性。种群集合体包括植物，特别是农作物，包括大麦、马铃薯、芸苔等，动物，特别是畜牧动物，包括牛和马等，或宠物，包括狗、猫等，不排除人类。

术语＂多态性＂是指以若干不同形式存在的性质或特性。例如，在本说明书中，即杂交模式之间的差异，即＂多态性＂是指特定位点处是否存在可动因子(ME)或可动因子(ME)与确定的种群集合体中的特定侧翼序列相邻。

术语＂共显性＂是指，例如，在二倍体生物中，可将杂合与纯合等位基因彼此区别开来。本发明产生的标记是共显性标记。

在本说明书中，术语＂可动因子(ME)＂是指遗传因子，其散布在高等植物和动物以及原核生物的基因组中(Lodish等，Molecular CellBiology，W.H.Freeman and Company，NY，2000)。它们的长度从几十或几百到上千个碱基对，且可被复制并通过转座(逆转录转座子-样可动因子)被重新插入到基因组新位点中或它们可自我切除并自主或非自主地重新插入到基因组其它处(转座子)。

可动因子(ME)可分成两类：1)DNA-介导的转座子(图1A)，其直接转座为DNA，且通常被称为转座子。DNA转座子包括细菌插入序列(IS因子，例如IS1、IS10)，细菌转座子(例如，Tn9)及真核生物转座子(例如，源于果蝇的P因子，源于玉米的Ac和Ds因子)，2)RNA-介导的转座因子(图1B)。所述因子经由RNA中间体转座，该RNA中间体是通过RNA聚合酶从可动因子转录的。此后，它们通过逆转录酶转换成双链DNA。它们被称作逆转录转座子，这是因为它们的移动与逆转录病毒的感染过程类似。逆转录转座子包括病毒-样逆转录转座子，如长末端重复序列(LTR)逆转录转座子(图1C)(例如，源于酵母的Ty因子，copia-样和吉普赛-样因子)和非病毒-样逆转录转座子，如非-LTR-逆转录转座子(图1D)[例如，F和G因子(果蝇)，长散布因子(LINE)和短散布因子(SINE)(哺乳动物和植物)，(Alu)序列(人)]。非-自主性逆转录转座子还包括微型末端-重复序列逆转录转座子(TRIM)因子(Witte等，Proc Natl Acad Sci98：13778-13783，2001)。逆转录转座子不能像DNA转座子那样切除，但它们可自我复制，并将它们的重复拷贝重新插入到基因组其它处。因此，逆转录转座子涉及基因组进化，这是因为重复的姐妹拷贝基本随机插入到基因组中可改变基因组的整个构成。逆转录转座子已经广泛用于研究繁殖种群的谱系，这是因为每代都有产生新的特殊逆转录转座子分布的一定可能性。

逆转录转座子或DNA转座子的可动因子(ME)插入产生包括基因组中成百上千碱基对的插入片段(图1)。当比较两个基因型的最后共同祖先之前已经发生活动事件时，这些是多态的。对于绝大多数可动因子(ME)而言，在两个基因组的同一位置很少会出现两个独立的插入，因为在平均真核生物基因组中大于10⁹bp。

术语＂样品DNA＂是指代表样品总DNA的多核苷酸，其用于未标记且任选断裂的形式中，且使其在使用前成为单链。样品DNA可来源于任何样品或生物，例如，来源于植物、动物、人类、细菌、真菌或它可以是古老的DNA。

术语＂寡核苷酸＂是指单个核苷酸的任何聚合物，其以单链形式用于本发明中，与固相支持物连接，从而证实任何样品的DNA样品中的遗传身份。术语＂寡核苷酸＂不限于任何特定数量的核苷酸。换句话说，术语＂寡核苷酸＂是指通常由大约20个核苷酸组成的聚合物，且上限为任何长度，它可使用寡核苷酸合成仪合成。目前的上限约为150bp。自然地，如果提高寡核苷酸合成仪的能力，上限可以更高。即使附图显示仅有一个寡核苷酸，但术语寡核苷酸，特别是术语寡核苷酸或寡核苷酸序列是指许多基本相同的寡核苷酸。

术语＂标记的寡核苷酸＂是指与所连接的寡核苷酸序列完全相对应的标记的多核苷酸。

＂寡核苷酸＂是单链多核苷酸序列。每个寡核苷酸包含不同长度的两个不同部分，一个部分是侧翼于可动因子(ME)的区，另一个部分含有所述可动因子(ME)的末端或位于第一侧翼区相反一侧上的侧翼区。所述寡核苷酸序列具有大约20个核苷酸的大小，更优选至少25，最优选多于30，以便在所连接的寡核苷酸与样品DNA之间提供足够稳定的杂交产物。对于每个可动因子(ME)而言，所述寡核苷酸含有3个选择对象，即左侧翼区(FL)组合可动因子(ME)的一个末端，右侧翼区(FR)组合可动因子(ME)的另一个末端或左侧翼区和右侧翼区(FL+FR)的组合，用于检测可动因子(ME)是否存在。代表侧翼区的寡核苷酸可含有与侧翼于侧翼区的区，以便使杂交更稳定且更容易分辨。

术语＂寡核苷酸组＂是指许多能够识别特异性确定的可动因子(ME)或特异性基因组位置是否存在的多核苷酸序列。可使用若干组寡核苷酸，每个可用的可动因子(ME)或基因组位置至少使用一个。可选择性地，一个可动因子(ME)可与不同的侧翼区组合或一个侧翼区可与不同的可动因子(ME)组合。用于获得最佳绘图或指纹分析结果的寡核苷酸组估计最小值，例如，用于繁殖目的时，对于具有7个染色体的二倍体生物而言至少为70。然而，这不能为使用较小或较大数量寡核苷酸组的本发明方法和测试试剂盒提供阻碍。＂寡核苷酸组＂可包含用于检测整合位点是否存在可动因子(ME)的单一寡核苷酸。可选择性地，该组可包含检测可动因子(ME)的寡核苷酸以及检测可动因子(ME)缺乏的另一寡核苷酸。所述两种类型的寡核苷酸，形成一组成对的寡核苷酸，能够同时鉴定完全和空整合位点。＂寡核苷酸组＂还可包含代表相同整合位点的3个或多个平行寡核苷酸，即这3个寡核苷酸检测可动因子(ME)的左和右末端，以及缺少的可动因子(ME)。当使用互补链时，也可获得其它组的寡核苷酸。所述寡核苷酸的平行组可提供更可靠的结果，这是通过证实可动因子(ME)的两个末端都存在可达到的。＂寡核苷酸组＂可与单一固相支持物或含有一个或多个独立固相支持物的固相支持物连接。＂一组寡核苷酸＂是代表可动因子(ME)的单寡核苷酸，一对寡核苷酸或平行寡核苷酸。

术语＂评分＂是指比较可记录的杂交模式，杂交模式可被记录，且其中杂交是否存在可分别证实相应的可动因子(ME)插入是否存在。收集评分的结果，并评估为完全、空、衰退或无效等位基因。

术语＂完全位点＂是指基因组位置或整合位点的含有可动因子(ME)的形式。它可使用与固相支持物连接的寡核苷酸序列加以证实，其包含具有各自侧翼序列的可动因子(ME)末端。含有可动因子(ME)的基因组位置的DNA序列与和固相支持物连接的寡核苷酸杂交，所述寡核苷酸由两个不定长度的独特序列区组成，其中一个独特序列区由可动因子(ME)的侧翼区、可动因子(ME)另一末端、以及含有可动因子(ME)末端片段的其它部分组成，但不与由两个相反侧翼区组成的寡核苷酸杂交。

术语＂空位点＂是指基因组位置或整合位点的缺少可动因子(ME)的形式，其可用与固相支持物连接的寡核苷酸序列加以证实，它与不存在或缺失可动因子(ME)的空位点或基因组位置相对应。因此，缺少可动因子(ME)的基因组位置的DNA序列与寡核苷酸序列杂交，与固相支持物连接，该寡核苷酸序列由两个相等或不定长度的部分组成，其中一个部分包含左侧翼区(FL)，另一个部分包含缺少可动因子(ME)的右侧翼区(FR)。

术语＂衰退等位基因＂相当于基因组位置的损失，或更准确地说，是与基因组位置杂交能力的损失，并且是空寡核苷酸和完全的寡核苷酸产生非-杂交反应时的得分。术语＂衰退等位基因＂是指用左侧翼/右侧翼(FL/FR)寡核苷酸评分为完全，但用左侧翼/可动因子(FL/ME)或右侧翼/可动因子(FR/ME)寡核苷酸评分为空的等位基因。＂衰退等位基因＂可由任何一系列原因引起，如充分插入/缺失点突变在侧翼的积聚破坏了杂交能力、低质量探针、影响杂交效率或检测的污染等。

术语＂无效等位基因＂是＂衰退等位基因＂的亚组，且相当于基因组位置损害。＂无效等位基因＂是指含有左侧翼(FL)、右侧翼(FR)的位点本身，且很可能可动因子(ME)缺少基因组，以致用左侧翼/右侧翼(FL/FR)寡核苷酸将该位点评分为完全，而用左侧翼/可动因子(FL/ME)寡核苷酸或右侧翼/可动因子(FR/ME)寡核苷酸将该位点评分为空。＂无效等位基因＂特别是指由于，例如重组事件导致的侧翼缺失。

术语＂侧翼于可动因子(ME)的区＂是指直接侧翼于可动因子(ME)的区，其可包括串联重复、其它可动因子(ME)、基因、启动子、内含子、外显子等，但还可包括其它侧翼于侧翼区的连续区。

术语＂可动因子(ME)的末端＂是指可动因子(ME)5′-或3′-末端或它们的互补链或其任意组合。

术语＂位于第一侧翼区另一侧上的侧翼区＂是指可动因子(ME)被两个侧翼序列围绕，整合位点每一侧上有一个侧翼序列。

术语＂固相支持物＂是指固相的不含水基质，且可以是膜、滤器、载玻片、平板、芯片、培养皿，由选自玻璃、塑料、硝化纤维素、硅等的材料制成。优选的固相支持物是膜、滤器、载玻片、平板、培养皿、微孔平板。＂固相支持物＂可由选自玻璃、塑料、硝化纤维素、尼龙、聚丙烯酸、硅等的材料制成。固相支持物连同与它连接的寡核苷酸形成本说明书的测试试剂盒或产物。

术语＂杂交状态的记录＂是指可检测杂交的任何方法，包括使杂交可见或可以其它方式检测的任何方法，但该术语还包括需要一定的分析仪器来实现检测或就该方法的自动化应用而言，可记录杂交状态的方法。

术语＂记录＂是指使用任何标记和允许记录杂交状态的方法测量或检测每对寡核苷酸序列是否杂交。

术语＂杂交＂是指通过氢键把核酸的两个互补链，即两个独立的DNA多核苷酸、寡核苷酸链，或一个DNA与一个RNA链结合在一起的方法。杂交通常是在适宜的缓冲液中，例如但不限制于6x SSC、0.05％焦磷酸钠、0.1％SDS、如在常规实验室操作中规定的(Ausubel等，2001，John Wiley & Sons，Inc.，New York，vol.1，unit 6.4.2.supplement13)，在适宜的温度下进行的，例如但不限制于53℃，通常为12℃，低于杂交体的确定解链温度，考虑杂交缓冲液的盐浓度。

术语＂杂交后处理＂是指在不同的严格条件下，通过应用洗涤步骤除去未与固相支持物上连接的寡核苷酸序列完全杂交的单链样品DNA，或通过任选的消化处理或使用对单链核苷酸序列特异的核酸酶进行酶处理而除去从寡核苷酸伸出的部分杂交的单链。洗涤的严格条件遵循常规的实验室操作(Ausubel等，2001，John Wiley & Sons，Inc.，New York)，但通常是约60℃，在含有6x SSC的缓冲液中，虽然它可能更高或更低。通常，洗涤是在低于杂交分子解链温度下进行的。

术语＂可记录的标记＂是指任何标记或标志，它们可用于指示或追踪杂交已经发生。它们可以是可见或可检测的标记，其本身是可记录的或与其它试剂接触时，是可检测或可记录的。由于它们的电化学或磁性、荧光、发光、它们的红外吸收、放射性或酶反应而可记录的标记或标志是特别适宜的，很容易通过自动化手段或仪器记录的任何示踪标记都可使用。

优选的可记录标记是荧光染料或荧光团，如荧光标记可在巯基-反应性染料中找到，如5-(2-((碘乙酰基)氨基)乙基)氨基亚萘基-1-磺酸)(1，5-IEDANS)或荧光素、Bodipy、FTC、Texas红、藻红蛋白、若丹明、羧基四甲基若丹明、DAPI、一种indopyras染料，Cascade蓝、Oregon绿、曙红、藻红素、吡啶基噁唑、苯并噁二唑、氨基亚萘基、芘、马来酰亚胺、香豆素、Lucifer黄、Propidium碘化物、porhyrin、CY3、CY5、CY9、镧系元素的穴状化合物、镧系元素的螯合物或所述示踪分子的衍生物或类似物。荧光标记的寡核苷酸特别用于自动化或半-自动化记录。

术语＂样品DNA的剪切＂是指使较长的DNA链断裂的任何化学、机械或物理方法，从而获得独立DNA片段上的可动因子(ME)进行记录。使DNA断裂的方法包括限制酶处理、超声处理等。

术语＂末端保护＂是指保护所连接的寡核苷酸，从而稳定具有固相支持物的测试试剂盒，并避免寡核苷酸受损，从而防止记录错误或伪迹得分。有效的末端保护是用已知方法获得的，选自5′OH-衍生化，氨基-衍生化等。

术语＂测试试剂盒＂是指连接了一组或多组任选成对或平行寡核苷酸的固相支持物。成对或平行的寡核苷酸是指代表同一可动因子(ME)的不同寡核苷酸。不言而喻，每组都含有很多基本相同的寡核苷酸。该测试试剂盒可任选与辅助试剂和说明书包装在一起提供。

术语＂半杂交体＂是指探针-样品DNA杂交体，其仅仅是部分双链的，这是因为样品DNA与探针寡核苷酸不完全同源。术语＂完全杂交体＂是指探针-样品DNA杂交体，其是完全双链的。辨别性杂交温度使全长杂交体，“完全杂交体”保持退火，而半长杂交体，＂部分杂交体＂将解链。本方法的关键是区别两种状态，＂部分杂交体＂与＂完全杂交体＂。这两种状态相当于可动因子完全插入位点左侧翼/可动因子(FL/ME)的探针与仅含空位点片段左侧翼/右侧翼(FL/FR)的样品DNA杂交的情况；在这种情况下，左侧翼(FL)节段可杂交，而探针的可动因子(ME)部分不会被与左侧翼(FL)相邻的探针DNA区覆盖。

发明概述

本发明的主要目的是用共显性评分提供一种可靠的方法和测试试剂盒，用于遗传身份确定、系统发育研究、亲子关系鉴定、基因型分析、单倍型分析、谱系分析、法医鉴定、人类医学诊断和/或植物或动物繁殖。在遗传多样性的证实中，一种可靠的方法和测试试剂盒应当利用基因组中确定且保守的DNA实体，并以较高频率对在基因组中扩散的改变进行评分，由此，例如产生密集且良好分布的重组图。

本说明书的方法和测试试剂盒应用分子标记或实体，它们作为简单的Mendelian性状是可遗传的而且易于评分。该标记允许详细研究遗传性和变异性、连锁图的构成、以及携带特定连锁基因的个体或谱系的诊断。先前已经使用过的表型和生化(酶)标记倾向于具有限制它们杂交能力的多态性程度较低、基因组位置相对较少的缺点，限制了可产生图谱的密度，以及环境可变的表达、使评分和基因型的确定复杂。这些已经被基于DNA的方法取代，其产生指纹或分子标记，是所分辨的DNA片段的区别模式，例如，通过在琼脂糖或丙烯酰胺凝胶中进行电泳而分离，并通过染色或标记而检测。分子标记实质上是一种与基因组中特定物理位置相对应的核苷酸序列。它的存在或大小应当是多态性的，它充分改变，从而遵循其遗传模式。

本发明的一般原理是提供一种方法和一种测试试剂盒，其应用含有永久性或非-永久性连接的可评分寡核苷酸序列的固相支持物或芯片，能够识别基因组中的特定基因组位置。重要的是，应当对基因组中长度适合进行杂交和筛选的任何结构域进行评分。如果在杂交后用内切核酸酶进行消化，应当对这些位点内的多态性进行评分。内切核酸酶可裂解杂交样品/寡核苷酸对内的不匹配或鼓泡。最终的断裂导致杂交体不稳定，并释放那些裂解的片段。

更具体而言，每个基因组位置的寡核苷酸序列可以三种基本不同类型的寡核苷酸存在，即它们可包含左侧翼区(FL)组合可动因子(ME)的其中一个末端、右侧翼区(FR)组合可动因子(ME)的另外一个末端或围绕整合位点的左侧翼区和右侧翼区(FL+FR)的组合(图2A)。所述寡核苷酸可一个接一个、成对或平行、或组合所有3种寡核苷酸类型使用。优选，每个基因组位置由某些确定的侧翼区组合某些确定的可动因子(ME)代表，但因为同一可动因子(ME)可插入到不同的整合位点，还可使每个确定的可动因子(ME)与不同种类的侧翼区组合。

本发明所用的寡核苷酸序列含有大约20个核苷酸，更优选至少25个，最优选超过30个核苷酸，以便在连接的寡核苷酸与样品DNA之间提供足够稳定的杂交产物。值得注意的是，寡核苷酸由2个独特序列区组成，因此寡核苷酸应当足够长，以便能够与侧翼区和可动因子(ME)杂交，或当缺失可动因子(ME)时，与所述可动因子(ME)整合位点两侧上的每个侧翼区杂交。在本发明特定的实施方案中，代表侧翼区的部分寡核苷酸排列可包含侧翼于侧翼区，从而使杂交更稳定且分辨度更好的区。因此，来源于寡核苷酸一部分的侧翼区长度可大于代表可动因子(ME)末端的长度。每个寡核苷酸的长度是由它应当使所连接的寡核苷酸与样品DNA之间的杂交产物足够稳定的事实确定的。自然，两个部分可以等长。

通常使用不止一组寡核苷酸，每组都能够识别特异且确定的可动因子(ME)或基因组位置是否存在。优选，每个所要鉴定目标的同源物应当使用不止一个寡核苷酸对。例如，对于具有7个染色体对的二倍体生物而言，可计算出用于获得最佳绘图结果至少需要70-80组寡核苷酸对，每组代表特定的基因组位置或可动因子(ME)。对于具有更多染色体的生物而言，需要更多寡核苷酸。下限是一个寡核苷酸对，上限由所述方法和测试试剂盒的期望分辨能力而定。

优选通过任何常规的标记系统在原位记录杂交，例如应用末端转移酶和常规的可记录标记。作为原位标记的一种选择，杂交的样品DNA可从固相支持物释放，随后与标记多核苷酸序列杂交，该标记多核苷酸序列与固相支持物上连接的每个原始寡核苷酸相对应。杂交任选是可逆的，且固相支持物可恢复至其原始状态重新使用。

只要寡核苷酸与作为模板的基因组DNA杂交，那么就可将标记的双脱氧核苷酸掺入到寡核苷酸的末端。与匹配寡核苷酸区相邻的基因组位置上的核苷酸序列是已知的，因此，要掺入的特定核苷酸(A、C、G、T或U)是已知的(图6)。

共-显性评分是用成对的，即两个，或平行的，即三个或更多寡核苷酸序列获得的。一组成对的寡核苷酸能够同时鉴定完全和空整合位点。该寡核苷酸组还可包含代表相同整合位点的三个或更多平行寡核苷酸，即这3个寡核苷酸可检测可动因子(ME)的左和右末端以及缺少的可动因子(ME)。将所获得的结果记录为完全、空的、衰退或无效等位基因，并可用于区别杂合和/或纯合基因型。就标记辅助的选择(MAS)方法的使用而言，可提供信息的侧翼序列DNA对的数量取决于序列对图谱相对于已知目标基因的位置。

提供任选的杂交后处理，包括洗涤和消化是为了除去未与固相支持物上连接的寡核苷酸序列完全杂交的样品DNA，例如在标记之前和之后进行。是否杂交是利用可记录杂交状态的任何方法记录的。

本发明公开了一种技术，其使用与固相支持物连接的寡核苷酸组，每个寡核苷酸序列的其中一部分含有侧翼于可动因子(ME)的区，所述寡核苷酸序列的另一部分含有可动因子(ME)的末端，或如果缺少可动因子(ME)，含有相反的侧翼位点。

因此，本发明的目的是提供一种检测基因组变异的方法，该方法是以使用永久性或非永久性连接寡核苷酸的固相支持物检测基因型集合体的任何已知位置中是否插入可动因子(ME)为基础的。该方法可鉴定含有可动因子(ME)或缺少可动因子(ME)的基因组位置。目的是在具有较大基因型多样性的确定种群集合体内提供所期望水平的分辨。该方法可进行共显性评分，即区别杂合与纯合基因型。本发明进一步涉及一种测试试剂盒，它含有一种或多种以可动因子(ME)插入为基础检测基因组变异的工具。

可动因子(ME)可以是任何类型的可动遗传因子，包括DNA转座子，如真核生物转座子、细菌插入序列和细菌转座子、逆转录转座子，包括病毒-样逆转录转座子，如长末端重复序列(LTR)逆转录转座子，例如吉普赛-样和copia-样因子(Kumar和Bennetzen，Amm.Rev.Genet.33：479-532，1999)，尤其是来源于大麦(BARE-1、BARE-2、BARE-3、Sukkula、Sabrina、Nikita、BAGY-1、BAGY-2等)，非-病毒-样逆转录转座子，如非-LTR逆转录转座子[例如，哺乳动物中的长散布因子(LINE)和短散布因子(SINE)以及人类的(Alu)序列]，噬菌体等，非-自主因子，包括微型反向重复序列转座因子(MITE)(Wessler等，Curr.Opin.Genet.Dev.5：814-821，1995)，它们是可动因子(ME)的高度缺失形式，或微型末端-重复序列逆转录转座子(TRIM)(Witte等，Proc.Natl.Acad.Sci USA 98：13778-13783，2001)。

在本发明的优选实施方案中使用逆转录转座子，它近来已经被开发成满足理想标记系统众多需要的分子标记系统。优选逆转录转座子是因为与可活动到位点外的DNA转座子相比，它们转座的复制方式可增加基因组位置状态的稳定性，由此产生更有力的系统发育分辨力。

因此，本发明方法的背离点是将代表未标记总样品DNA的单链寡核苷酸放在固相支持物上，所述支持物可由任何材料制成，携带不止一组永久性连接的、未标记的、序列-确定的寡核苷酸，代表，例如，可动因子(ME)和它们的插入位点连接点。

本发明的方法可使未标记的、任选断裂的样品总DNA与固相支持物上连接的不止一组寡核苷酸序列杂交，每个寡核苷酸序列由不定长度的两个部分组成，一个部分含有侧翼于可动因子(ME)的区，另一部分含有可动因子(ME)的末端或位于第一侧翼区相反那侧上的侧翼区。

与固相支持物连接的是许多与可动因子(ME)整合位点相对应的寡核苷酸，即在所要测定的基因型有效集合体内被确立为多态的插入位点，从而获得有意义的绘图或指纹分析结果以及基因型之间的所需水平分辨力。事实上，这意味着对于在生物中评分的每个同源物，必须鉴定至少一个，优选更多组寡核苷酸。在某些情况下，甚至是单一的多态位点也可分辨各类基因型之间的基本分组。这种情况包括，例如，区别春大麦和冬大麦，细菌或真菌病原体株，或人类种群。

所述任选成对或平行的寡核苷酸序列的每一组都含有与完全位点相应的一个寡核苷酸序列，以及与空位点相应的另一个寡核苷酸序列。完全位点所含的寡核苷酸序列由两个连续部分组成，其中一个部分含有可动因子(ME)的侧翼区，另外一个部分含有可动因子(ME)的一个末端。与空位点相对应的寡核苷酸序列含有由相等或不同长度的两个部分组成的寡核苷酸序列，其中一个部分是左侧翼区(FL)，另外一个部分是围绕缺少可动因子(ME)位点的右侧翼区(FR)。左侧翼区(FL)，例如，与可动因子(ME)的5′末端组合，右侧翼区(FR)，例如，与可动因子(ME)的3′末端组合，反之亦然。所述寡核苷酸可从两个链制备，且它们可以任意组合的方式使用。它们可与寡核苷酸组合，该寡核苷酸可识别含有左侧翼区和右侧翼区(FL+FR)的空位点。

更具体而言，每个寡核苷酸序列由相等或不同长度的两个部分组成，一个部分含有侧翼于可动因子(ME)的区，另一部分含有可动因子(ME)的末端，或位于第一侧翼区另一侧上的侧翼区。在可选择性的实施方案中，代表侧翼区的序列要长于代表可动因子(ME)的部分。

重要的是，代表可动因子(ME)的每组寡核苷酸中的3种不同类型的寡核苷酸都可用于本发明中(图2A)。代表侧翼区和可动因子(ME)末端的寡核苷酸可被设计成一个单一的连续序列，其通过连接区与固相支持物连接，且其序列对也被设计成一个单一的连续序列，通过独立的连接区与固相支持物连接，该序列对含有围绕整合位点的两个侧翼区并代表空位点。

在可选择性实施方案中，可将寡核苷酸的侧翼区和可动因子(ME)分开放在两个独立的连接区上，连接区与彼此靠近的固相支持物连接(图2B)。含有围绕整合位点的侧翼区的相应序列对也通过其它连接区与固相支持物连接。

上述寡核苷酸的各个部分可用合成制备的延长序列，即一种所谓的茎序列提供(图2C)。茎序列是与另一寡核苷酸上的相似区互补的区，用于使两个寡核苷酸共同退火。因此，该茎序列可位于两个寡核苷酸之间，这样两个寡核苷酸可共同与基因组位置的DNA序列杂交。所述部分互补的寡核苷酸通过与双链末端连接的连接区与固相支持物连接。

还可获得用于构建用于生产测试试剂盒的合成寡核苷酸序列的适宜核苷酸序列，例如，通过筛选细菌人工染色体(BAC)文库，并对含有可动因子(ME)的区进行测序，或通过序列-特异性扩增的多态性(SSAP)方法获得PCR产物，其可确定可动因子(ME)在特定基因组中的插入位点。基础策略是通过被称作反向-PCR的标准PCR过程或通过被称作基因组步查的标准方法鉴定逆转录转座子每一侧上的侧翼序列(Siebert等，Nucl.Acids Res.23：1087-1088，1995)，然后使用独特的侧翼DNA序列使标记显影。

在特定基因组位置侧翼于可动因子(ME)的区可被用作引物，并与可动因子的引物组合，扩增是通过PCR方法进行的。分离所得PCR产物，并长征相应的序列。随后，所述新的可动因子(ME)可用于鉴定新的侧翼区，用于设计测试试剂盒中使用的侧翼区PCR引物。当已鉴定了足够数量的有效可动因子(ME)和侧翼区时，它们可被用作生产寡核苷酸序列的模型，该寡核苷酸可用于制造测试试剂盒。

通过重组DNA技术或合成或半-合成产生的寡核苷酸可通过各种方法与固相支持物连接。寡核苷酸不应当空间受限，否则会干扰杂交。寡核苷酸序列任选被末端保护。寡核苷酸的末端保护是通过本身已知的方法进行的，选自，例如5′OH衍生化和氨基-衍生化。

未标记、任选断裂的样品总DNA可来源于任何样品，来源于任何物种和/或来源于任何生物，例如，来源于植物、动物、人类、细菌、真菌和/或古老DNA。任选地，用物理、机械或酶方法，例如用常见切割酶进行酶消化或优选通过超声处理将代表总DNA的DNA剪切成大约500bp或更小的片段。剪切的目的是物理分离在不同DNA碎片上评分的特定基因组位置，从而增加该方法的效率。通过本身已知的方法，例如在与其它类型杂交所用相似的缓冲液中煮沸，可将样品DNA分离成单链状态。

固相支持物包括膜、滤器、载玻片、平板、芯片、培养皿，它们可由选自玻璃、塑料、硝化纤维素、或混合组合物或杂交体培养基制成。

杂交反应发生的条件为使任选断裂的单链样品DNA退火于与固相支持物连接的全长寡核苷酸序列。

杂交通常是在适宜的缓冲液中，例如但不限制于6xSSC，0.05％焦磷酸钠，0.1％SDS，如在常规实验室实践中所规定的(Ausubel等，2001John Wiley Sons，Inc.New York，vol.1.，unit 6.4.2.supplelent13)，在适宜的温度下进行的，例如但不限制于53℃，通常为12℃，低于杂交体的确定解链温度，考虑杂交缓冲液的盐浓度。任选地，可使用缓冲液，如1xPCR缓冲液(50mM KCl、10mM Tris-HCl，pH9(25℃)、0.1％Triton-X 100、1.5mM MgCl₂)。

杂交后，可在一定条件下进行任选的杂交后处理，一定条件包括盐浓度和温度，释放未完全或几乎完全与固相支持物上连接的寡核苷酸序列杂交的所有样品DNA。任选的杂交后处理包括在不同的严格条件下，利用洗涤步骤除去未与固相支持物上连接的寡核苷酸序列完全杂交的单链样品DNA，并进行任选的消化处理，从而除去不与所连接的寡核苷酸序列完全对应的单链样品DNA片段。洗涤通常是利用熟知的培养过程在缓冲液中进行的，所述缓冲液含有，但不限制于6X SSC、0.05％焦磷酸钠，温度为65℃，或刚刚高于计算的杂交体解链温度。

在本发明其中一个实施方案中，杂交的基因组片段，它们绝大部分显著长于寡核苷酸，是通过在杂交之后，加入消化步骤而调整的。在消化步骤中，未杂交的寡核苷酸或部分杂交的单链寡核苷酸是通过用酶，如单链特异性核酸酶，优选一种外切核酸酶进行酶消化而除去的，在固相支持物上保留杂交的寡核苷酸。这种消化可产生更有效的杂交和更清楚的得分。在这种情况下，重要的是保护寡核苷酸末端免被消化。在洗涤和/或消化步骤结束时，固相支持物应当具有寡核苷酸，在其上面，与特定基因组位置相对应的样品DNA片段有或没有杂交。有些寡核苷酸是没有杂交的，其它是杂交的。

然后按照上面所述检测这些寡核苷酸，或，相反，可剥离携带寡核苷酸的固相支持物上的杂交样品DNA，然后在固相支持物上与匹配每个原始寡核苷酸的标记寡核苷酸杂交。继续第二组洗涤，记录并观察标记的杂交寡核苷酸。

记录杂交步骤后，以这种可检测它们杂交状态的方式区别杂交和未杂交寡核苷酸。每对寡核苷酸序列是否杂交是利用可记录杂交状态的任何方法进行的。

在其中一个实施方案中，利用末端转移酶的酶作用延伸杂交的DNA，提供与具有标记、永久性连接的寡核苷酸杂交的基因组样品DNA，并提供选自放射性、荧光、酶、免疫化学、化学和亲和标记的标记而记录(检测)杂交状态。化学标记是，例如生物素。然后通过与标记类型相应的常规方法检测标记的延伸。

在本发明的特定实施方案中，免疫化学标记是一种能够检测酶促掺入到与寡核苷酸杂交的DNA中的生物素的抗体，其与催化荧光或显色反应的酶连接。

在另一实施方案中，杂交状态是通过使用不与基因组位置相对应的、含有标准化尾部的寡核苷酸，用改进的微型-测序反应检测的，在反应中，杂交片段可作为在尾部延伸的引物。微型-测序反应可掺入标记核苷酸，然后对它们进行检测。实质上，可使用区别寡核苷酸杂交与未杂交状态的任何方法。

在另一特殊实施方案中，将寡核苷酸的一端生物素化，并固定在涂覆了链霉抗生物素蛋白的聚苯乙烯珠上。检测将通过在寡核苷酸序列上加入一个碱基延伸而检测，所述碱基与基因组序列本身的碱基不同。随后，将使用具有荧光标记的双脱氧寡核苷酸的延伸。因为已知寡核苷酸后什么碱基是标准的，因此可以这种方式消除某些背景。左侧翼/右侧翼(FL/FR)位点所用的寡核苷酸事实上是其它两个位点的反向寡核苷酸(即，代表另一条链)。这样做是为了降低背景，因为寡核苷酸的左侧翼(FL)和右侧翼(FR)部分不与左侧翼/可动因子(FL/ME)和可动因子/右侧翼(ME/FR)中的左侧翼(FL)和右侧翼(FR)共有。

在另一实施方案中，寡核苷酸依靠在生物合成过程中连接的生物素部分结合。该方法的关键在于区别两种状态，其中一种状态是探针-样品DNA杂交体为完全双链的，另外一种状态是杂交体为部分双链的，这是因为样品DNA与探针不完全同源。这两种状态相当于可动因子的完全插入位点左侧翼/右侧翼(FL/ME)的探针与仅含空位点片段左侧翼/右侧翼(FL/FR)的样品DNA杂交；在这种情况下，左侧翼(FL)节段将杂交，但探针的可动因子(ME)部分不会被与FL相邻的探针DNA区覆盖。该寡核苷酸对应于检测探针和各自完全互补或半长互补的寡核苷酸。实验中使用可区别的杂交温度，即可使全长杂交体保持退火，而半长杂交体解链的温度。为了检测成功解链处理、双链的探针/样品杂交体与单链探针之间的差异，使用染料(PicoGreen

MolecularProbes，Inc)。按照制造商PicoGreen

特别检测dsDNA。测定混合物很可能在解链后，含有ssDNA(单链)、dsDNA(双链)、和半-ss-半-dsDNA的混合物。ssDNA-特异性核酸酶处理用于除去ssDNA。

在检测方法中，如图3所示，寡核苷酸是用不匹配侧翼序列的一个或多个碱基延伸提供的。可检测标记通过杂交DNA延伸而掺入。图6显示，加入了标记的双脱氧核苷酸，其可被掺入到寡核苷酸末端，提供与作为模板的基因组DNA杂交的寡核苷酸。

含有与基因组中特定基因组位置相应的可评分寡核苷酸的本发明方法及测试试剂盒的概念十分普遍。因此，长度适于杂交和筛选的基因组中任何结构域都可被评分。如果杂交后用内切核酸酶消化，那么可评分这些位点内的多态性。内切核酸酶可裂解杂交样品/寡核苷酸对内的不匹配或鼓泡。最终的断裂导致杂交体不稳定，并释放那些裂解的片段。

分别对可记录的杂交模式评分，其中是否杂交可表示可动因子(ME)插入是否存在。对每个基因组位置进行共-显性评分，其中使用侧翼序列和侧翼/可动因子(ME)寡核苷酸作为任选成对或平行的组，以便能够对下列待区别的等位基因进行二倍体基因型分析：完全、空的、衰退或无效等位基因。对于共-显性评分而言，构建用于鉴定空和完全位点的寡核苷酸需要至少两个侧翼寡核苷酸序列连同可动因子(ME)序列。当空寡核苷酸和完全寡核苷酸产生非-杂交反应时，评分对应于基因组位置损失或更准确地说，对应于与基因组位置杂交能力损失的无效或衰退等位基因。然后根据常规的共显性标记系统分析该数据。

将得分记录为＂差分表＂，其中，例如，垂直列出目录，水平列出评分的基因组位置。在表上的每个空格中填入分值，2代表纯合的完全/完全，1代表杂合，0代表纯合的空/空。衰退或无效被记为遗漏数据(-)。然后利用适合特定问题的方法分析数据。遗传距离可使用Nei及合作者的方程，从差分表评估(Nei和Li，Proc Natl Acad SciUSA 76：5269-5273，1979；Saitou和Nei，Mol.Biol.Evol.4：406-425，1987)。树(进化树)可通过邻接而构造(Saitou和Nei，Mol.Biol.Evol.4：406-425，1987)，或统计学差异可用主成分分析或其它标准试验评估。现有用于此目的的软件包(Bevan和Houlston，Mol.Biotechnol.17：83-89，2001；Tores和Barillot，Bioinformatics17：174-179，2001)。

本发明的杂交、洗涤、记录和评分全部都是自动化的。在其中一个实施方案中，用与样品DNA杂交的固定寡核苷酸处理固相支持物是在具有自动化处理步骤、为特定目的而制造的腔室内进行的。正如上面所讨论的，包括杂交、杂交后处理、杂交状态记录和评分在内的步骤都可以是自动化的。

在优选实施方案中，测试试剂盒包括DNA芯片数据收集装置(DCD)。DNA芯片DCD是一种便携式半-固体状态装置，其中可装载、扫描和评分DNA芯片。本发明DNA芯片DCD的开发和制造是本领域熟知的(US 5,445,934，US 5,510,270，US 5,744，305，US 5,700,637)。

杂交的样品DNA是从固相支持物释放的，随后与标记的寡核苷酸序列杂交，该标记的寡核苷酸序列相应于固相支持物上连接的每个原始寡核苷酸序列。显影和观察的过程可逆很有用，但并不十分重要，在于具有固定寡核苷酸的固相支持物可恢复至其原始状态并重新使用。

在本发明用于共-显性评分的优选实施方案中，还包括下列步骤。

寡核苷酸是在含有不止一组任选成对或平行的单链寡核苷酸序列的固相支持物上提供的，所述每个寡核苷酸序列都含有一个与完全位点相对应的寡核苷酸序列，和另外一个与空位点相对应的寡核苷酸序列，其中完全位点含有由两个部分组成的寡核苷酸序列，其中一个部分含有可动因子(ME)的侧翼区，另外一个部分含有可动因子(ME)的末端，与空位点相对应的寡核苷酸序列含有由两个部分组成的寡核苷酸序列，其中一个部分是左侧翼区(FL)，另外一个部分是围绕缺失可动因子(ME)的右侧翼区(FR)。

在第一步中，用物理、机械或酶方法任选剪切代表样品总DNA的样品DNA，从而获得在不同DNA碎片上区别的生物的可动因子(ME)。

此后，在使样品DNA退火于全长寡核苷酸序列的条件下，使断裂的单链样品DNA与固相支持物上连接的单链寡核苷酸序列杂交。未杂交或部分杂交的样品DNA是通过任选的杂交后处理除去的，可包括在不同的严格条件下进行的一个或多个洗涤步骤和酶消化，以防止单链寡核苷酸序列从相连的探针伸出，干扰标记以及随后结果的记录。

杂交状态是通过提供与具有可记录标记的相连寡核苷酸序列杂交的样品DNA而记录的。

在利用记录杂交状态的任何方法记录每对寡核苷酸序列是否杂交之前，可在不同的严格条件下应用任选的洗涤步骤。上述方法可对可记录的杂交模式评分，其中杂交是否存在可表示插入位点中是否存在可动因子(ME)。该方法是共-显性的。

本发明将在下列实施例中更加详细的描述，其中本发明可应用于某些植物。这些实施例不应当被解释为将本发明范围限制在所述举例的生物。本领域的技术人员应当明白，所述方法和测试试剂盒可用于证实任何生物和任何样品的遗传多样性。

实施例

实施例1

用于设计寡核苷酸的侧翼序列的鉴定

(a)序列特异性扩增的多态性(SSAP)方法(现有技术)

1.SSAP反应是按照上面所述(Waugh等，Mol.Gen.Genet.253：687-694，1997)，使用Taq或所述其它耐热聚合酶及试剂，在热循环仪(Applied Biosystems GeneAmp System 9700)中进行的。引物包括一个被设计与BARE-1的长末端重复序列相对应的引物，BARE-1可能加入了选择性碱基，如SSAP所述(Waugh等，Mol.Gen.Genet.253：687-694，1997)，另一个引物是PstI SSAP接头引物。BARE-1引物与3′末端上具有一个额外A选择性碱基的因子的前19个碱基互补。PstI接头引物是GACTGCGTACATGCAG(SEQ ID NO：1)。模板DNA是通过对样品DNA，如大麦DNA进行PstI和MseI消化获得的。该DNA是使用DNeasy植物微型试剂盒(Qiagen product 69103)通过标准方法产生的。

2.丙烯酰胺测序凝胶是按照标准过程制备的(Ausubel等，CurrentProtocols in Molecular Biology，John Wiley & Sons，Inc.，New York，1995)，以匹配标准垂直丙烯酰胺电泳设备(Hoeffer SQ3测序仪，Amersham Pharmacia Biotech目录号80-6301-16)。电泳分离是按照设备提供的说明书进行的。选择目录中的多态带，即目标带。自含有目标带的目录，从凝胶上将该带切除下来，然后浸渍在100μl TE缓冲液(Tris-EDTA，10mM Tris-HCl，pH8.0，1mM NaEDTA，pH8.0，Ausubel等，Current Protocols in Molecular Biology，John Wiley & Sons，Inc.，New York，1995)中。

3.目标带中的DNA，它是从凝胶上切除下来的，并在步骤2中洗脱，是在与步骤1中SSAP所用相同的条件下，按照步骤1所述，用原始引物进行PCR扩增的，其中使用作为模板的提取带的100μl洗脱物中的0.5μl循环25次。

4.使用商业测序装置或可选择性地任何标准测序仪器(AppliedBiosystems ABI Pri sm 3700 DNA Analyzer)以及制造商的试剂和方案，对切除并提取过的带的DNA进行测序，以确定与可动因子(ME)的侧翼区序列。

5.从侧翼区，两个嵌套引物，它们的位置尽可能远离可动因子(ME)并具有与可动因子(ME)匹配的解链温度(对于BARE-1而言，它是60-65℃)，被设计成向着可动因子(ME)插入的方向扩增。

6.该引物(步骤5中制备的)与PstI消化且与接头连接的DNA组合使用，该DNA源于缺少从SSAP凝胶所见到的插入的目录。

7.在进行连续35次PCR循环时，作为引物，首先使用来自侧翼区的外引物，然后是来自侧翼区的内引物，而作为模板，使用100μl提取带中的0.5μl。

8.通过在标准琼脂糖凝胶上进行电泳分离来检查PCR产物的大小和产率，琼脂糖的百分比是由预期的大小测定的。高产率带应当出现在最后的扩增中。按照上面所述对产物进行测序，产生可动因子(ME)整合位点的原始侧翼及另一侧匹配侧翼的序列。通过设计其它侧翼的引物并证实缺少SSAP带目录的空位点扩增，可知插入是合理的。

9.通过上述步骤获得的侧翼序列可用于设计与固相支持物连接的寡核苷酸。

(b)基因组步行策略(现有技术)

该方法主要是遵循Siebert等，Nucl.Acids Res.23：1087-1088，1995)的方法，使用基因组步行者^TM试剂盒(BD BiosciencesClonetech，Palo Alto，USA)，按照制造商的说明进行的。

该方法遵循用于测定一个侧翼的实施例1a所述的步骤。

该步骤之后，用试剂盒中详列的限制酶，连接的接头及接头-引物以及侧翼区引物建立基因组-步行者库。每个库主要带的序列应当与同一位点一致。换言之，侧翼序列应当是相同的，在其上面，可动因子(ME)被插入到含有可动因子(ME)的等位基因中。此后，重复实施例1中描述的步骤8和9。

与可动因子(ME)的独特侧翼区相对应的多核苷酸是按照上述方法鉴定的。分别与长末端重复序列(LTR)和侧翼区相对应的引物可用于进行基于逆转录转座子的微卫星扩增的多态性(RBIP)扩增，如Flavell等(Plant J.16：643-650，1998)所述。对基因型进行RBIP分析，其中所述基因型与很可能要进行分析并根据特定应用加以区别的基因型范围相对应。选择可有效区别这些基因型的引物对进行进一步的研究。每种情况下的侧翼区是用可动因子(ME)和侧翼引物，被测序的区进行PCR扩增的，且多核苷酸是以它们的序列为基础合成的。

实施例2

玉米中基因组变异的检测

本方法用于检测玉米(Zea mays L.)的多态性，对于近交系BSS53内的22kDa α玉米醇溶蛋白基因簇而言，使用可动因子Zeon-1，核苷酸数据库登记号AF090447(346296bp)，且在Heartbreaker(Hbr)微型反向重复序列转座因子(MITE)上，一种因子的多态性插入片段以及用作分子标记的用途描述于Zhang等，Proc.Natl.Acad.Sci.USA97(3)：1160-1165，2000和Casa等，Proc.Natl.Acad.Sci.USA 97(18)：10083-10089，2000。

如Zhang等，Proc.Natl.Acad.Sci.USA 97(3)：1160-1165，2000所述，一个Hbr7(登记号AF203730)(SEQ ID NO：2)(现有技术)因子在左侧上具有基因组侧翼序列：CGGACGCGCCAGCCAT(SEQ IDNO：3)，在右侧上具有CATCCTTTGCTTTGGT(SEQ ID NO：4)(图5，Zhang等，Proc.Natl.Acad.Sci.USA 97(3)：1160-1165，2000)，CAT是通过因子插入而产生的末端同向重复序列。

已知这些序列，左侧翼/可动因子(FL/ME)寡核苷酸可被设计为：5′CGCCAGCCATgggtctgttt 3′(SEQ ID NO：5)(小写的Hbr)，完全杂交探针的估计Tm为58.4℃，半杂交体的估计Tm分别为37.5℃(FL)和29.0℃(ME)。

可动因子/右侧翼(ME/FR)寡核苷酸可被设计为：5′aaacagggccCATCCTTTGC 3′(SEQ ID NO：6)，完全杂交探针的估计Tm为58.5℃(ME)，半杂交体的Tm为34.4℃(ME)和30.3℃(FR)。

左侧翼/右侧翼(FL/FR)寡核苷酸可被设计为：5′GCGCCAGCCATCCTTTGC 3′(SEQ ID NO：7)，在该点为从来没有先前HbrMITE插入的空位点的情况下，完全杂交体的估计Tm为58.0℃。因为MITE因子被认为按照与DNA转座子相同的方式切除，因此该基因组位置的第二种形式可在某些植物目录中存在，反映剩余双-重复序列＂足迹＂(用粗体表示)的切除事件。这将是：5′GCGCCAGCCATCATCCTTTGC 3′(SEQ ID NO：8)，并具有62.6℃的Tm。

这些寡核苷酸是合成的、任选末端-保护的，并与芯片(固相支持物)连接，且代表玉米的单一基因组位置。另外50个或更多基因组位置的寡核苷酸是用基于上述侧翼和因子测序的方法，针对Heartbreaker或其它微型反向重复序列转座因子(MITE)衍生的(Zhang等，Proc.Natl.Acad.Sci.USA 97(3)：1160-1165，2000；Casa等，Proc.Natl.Acad.Sci.USA 97(18)：10083-10089，2000)。

在另一实施例中，从玉米数据库登记号AF090447(含有包括玉米22kDa α玉米醇溶蛋白簇在内的346296bp连续区)，找到了Zeon-1 LTR逆转录转座子。该因子的100bp左侧翼(FL)区是SEQ ID NO：9且使用BLAST不能产生与玉米重复因子的任何匹配。该因子的100bp左侧翼(FL)区是SEQ ID NO：10且使用BLAST不能产生与玉米重复因子的任何匹配。

Zeon-1LTR的左端是5′TGTTGGGGGCCTTCGGCTTCCGAAGGTCCTCAAAAACAAGATTTAACTG3′(SEQ ID NO：11)，Zeon-1LTR的右端是5′TGTGTTGCCTTGTTCTTAATTCATAGCATTTGAGAACAAGTCCCCAACA3′(SEQ IDNO：12)，即加下划线的LTR内的8bp末端反向重复序列。

该基因组位置上的左侧翼/可动因子(FL/ME)连接点是CTAACCTGAAAGGTACTGTTGGGGGC......(SEQ ID NO：13)，可动因子/右侧翼(ME/FR)的连接点是......AAGTCCCCAACAGGTACCCACTGGTAGCCCT(SEQ ID NO：14)，其中用粗体字表示通过插入产生的同向重复序列，在左和右LTR的末端下面加下划线，中间插入的Zeon-1序列用圆点表示。

以这些序列为基础，左侧翼/可动因子(FL/ME)寡核苷酸可被设计为5′TGAAAGGTACTGTTGGGGGC3′(SEQ ID NO：15)，完全杂交寡核苷酸的Tm为54.4℃，左侧和右侧半杂交体的Tm分别为25.4℃和36.9℃。

可动因子/右侧翼(ME/FR)寡核苷酸可被设计为5′GTCCCCAACAGGTACCCACTG3′(SEQ ID NO：16)，完全寡核苷酸的Tm值为54.7℃，ME半-杂交体为31.5℃，FR半-杂交体为31.2℃。

左侧翼/右侧翼(FL/FR)寡核苷酸可被设计为5′CTGAAAGGTACCCACTGGTAGC3′(SEQ ID NO：17)，Tm为53.7℃。应当注意的是，就其它逆转录转座子左侧翼/右侧翼(FL/FR)寡核苷酸而言，在未间断天然位点中，插入产生的同向重复序列仅以1个，而不是2个拷贝存在。

这些寡核苷酸是合成、任选末端-保护的，并与芯片连接，代表玉米的单一基因组位置(图3)。其它LTR逆转录转座子的另外50个或更多基因组位置的寡核苷酸可按照实施例1衍生。

此外，寡核苷酸左侧翼/可动因子(FL/ME)(SEQ ID NO：26)、右侧翼/左侧翼(FR/FL)(SEQ ID NO：27)和右侧翼/可动因子(FR/ME)(SEQ ID NO：22s)在图6提出的方法中使用。选择这些寡核苷酸，这样不同的核苷酸将作为双脱氧延伸中的下一个核苷酸(分别A、G、C和T或U)而掺入。

实施例3

样品DNA的制备

DNA是通过CTAB法(Ausubel等，Current Protocols in MolecularBiology，John Wiley & Sons，Inc.，New York，1995)制备的，并按照其中所述进行RNA酶处理。可选择性地，使用商业制备系统(Qiagen′s试剂盒，DNeasy，或临床样品的基因组顶端)。在没有进行任何制备步骤前，利用超声装置对DNA进行超声处理。超声处理在高DNA浓度，如10μg/μl下最有效。使用具有20kHz输出频率和350瓦最大功率以及针状探针probe l 40 TL(目录号853 811/5)的适宜设备(B.Braun Biotech Internat ional Labsonic)对DNA进行超声处理。超声处理是用50％工作循环和大约10-20％的功率水平(＂低＂)，优选在冰上进行的，时间为10-20分钟，或进行的时间使样品粘度明显降低，且DNA片段大小降低至大约500bp或更小。通过任意方法将样品DNA剪切成小(大约500bp或更小)碎片，包括用常见的(如4-碱基)限制酶或(优选的)超声处理。剪切的目的是物理分离在DNA不同碎片上评分的特定基因组位置，从而增加该过程的效率。

实施例4

记录杂交

杂交记录步骤遵循，并包括区别杂交和未杂交的寡核苷酸，以这种方式可检测它们的杂交状态。在其中一个实施方案中，(图3E)杂交基因组DNA是通过末端转移酶的酶作用延伸的，其中使用放射性标记的、荧光、或化学标记的(例如，生物素)寡核苷酸。然后利用与标记类型相应的常规方法检测标记的延伸。在另一实施方案中，在不与基因组位置相对应的5′末端上，寡核苷酸含有标准化的尾部。然后，杂交片段可作为改进的微型-测序反应中，在尾部按典型的5′-->3′方向扩展的引物。微型-测序反应可掺入标记的寡核苷酸，然后检测它们。本质上，可区别寡核苷酸杂交和未杂交状态的任何方法都可使用。有用但并不必要的是显影和观察的过程可逆，其中芯片可恢复至其原始状态并重新使用。

实施例5

所记录杂交模式的评分

然后对所记录的杂交模式进行评分。评分是对每个基因组位置进行的，使用侧翼寡核苷酸和侧翼/可动因子(ME)寡核苷酸。如此可将下列等位基因区别为：完全、空的、和无效或衰退。然后用常规的共显性标记系统对数据进行分析。将得分记录为＂差分表＂，其中，例如，目录是垂直列出的，且表的水平方向列出评分的基因组位置。在表的每个空格中填入分值，2代表完全/完全，1代表杂合，0代表空/空。衰退或无效被标记为遗漏数据(-)。然后通过适合特定问题的方法分析数据。使用Nei及合作者的方程式根据差分表评估遗传距离(Nei和Li，Proc.Natl.Acad.Sci.USA 76：5269-5273，1979；Saitou和Nei，Mol.Biol.Evol.4：406-425，1987)。树(进化树)可通过邻接(Saitou和Nei，Mol.Biol.Evol.4：406-425，1987)构造，或统计学差异可用主成分分析或其它标准试验评估。现有用于此目的的软件包。谱系分析同样可根据这些数据进行。用于此的方法和软件在本领域中是已知的，例如Kindred和Gap(Bevan和Houlston，Mol.Biotechnol.Jan；17(1)：83-9，2001；Tores和Barillot，Bioinformatics 2001 Feb；17(2)：174-9，2001)。

本说明书的杂交、洗涤、记录和评分所有都是自动化的。在其中一个实施方案中，所述处理是在为特定目的而造的、具有自动化处理步骤的腔室内进行的。

实施例6

大麦基因组变异的检测

本方法用于检测大麦(大麦)的多态性，其中使用可动因子BARE-1。多态性是使用逆转录转座子间扩增多态性(IRAP)和逆转录转座子微卫星扩增的多态性(REMAP)检测的，利用IRAP和REMAP法及BARE-1 LTR引物筛选春大麦和冬大麦的繁殖植物。

在REMAP中使用引物7286(GGAATTCATAGCATGGATAATAAACGATTATC)(SEQ ID NO：18)和(CTC)9C(SEQ ID NO：19)，经鉴定多态带只存在于春大麦中而不存在于冬大麦中。该带是从溴化乙锭染色的琼脂糖凝胶上切除下来的，并被克隆和测序。1767nt序列sb17(SEQ IDNO：20)在图7中给出。在BARE-1插入的LTR下面加下划线。它代表与可读框有义方向相反的LTR末端。通过插入产生的预测5bp同向重复序列CCACT在图7中用粗斜体字表示。

与该带相对应的区同样是从冬大麦克隆的。冬大麦在该基因组位置缺少BARE-1插入。3186nt序列wb17(SEQ ID NO：21)在图8中给出。该序列与上述sb17序列(SEQ ID NO：20)几乎完全相同，区别在于它缺少BARE-1序列。BARE-1在sb17(SEQ ID NO：20)中的插入位点是用图8wb17(SEQ ID NO：21)序列中的箭头标记的，并位于wb17(SEQ ID NO：21)的核苷酸1511和1512之间。这些侧翼核苷酸下面加了下划线。在sb17(SEQ ID NO：20)中形成同向重复序列的5bp序列在图8中用粗体字表示。

已知sb17序列(SEQ ID NO：20)，一个23nt右侧翼/可动因子(FR/ME)寡核苷酸可被设计为5′tatttccaacaCCCACTTCCTCG3′(SEQ IDNO：22)(小写的BARE-1)，完全杂交探针的估计Tm为57.8℃，半-杂交体的估计Tm分别为38.2℃(FR)和28.6℃(ME)。可动因子/左侧翼(ME/FL)侧翼于区可以下列方式分别从BARE-1LTR预测，预测的5bp同向重复序列，和wb17(SEQ ID NO：21)序列预测(图9a)。SEQ IDNO：23代表反向BARE-1LTR的前100nt，和对sb17(SEQ ID NO：20)5′连接区预测的大约100nt。侧翼和插入的可动因子(ME)在图9b中给出。

左侧翼/可动因子(FL/ME)是GTAAGTGCGGGGCCCACGGCACCACTTGTTGGGGAACGTCGCATGG(SEQ ID NO：24)，右侧翼/可动因子(FR/ME)是CCTCTAGGGCATATTTCCAACACCACTTCCTCGTGCTCCTCCTCAACTTC(SEQ IDNO：25)。

这些寡核苷酸是合成、任选末端保护的，并与芯片连接，代表玉米的单一基因组位置。另外50个或更多基因组位置的寡核苷酸是以相似方式衍生并处理的。

寡核苷酸，例如可动因子/右侧翼(ME/FR)的一端被生物素化。这样即可与固相支持物连接。引入剪切DNA，并在＂非-许可＂温度下杂交，即半-杂交体不粘着。将荧光标记的、4种ddNTP中的每一种加入到试管中。将与寡核苷酸末端后的下一个碱基相对应的ddNTP掺入到寡核苷酸的末端。另外3个反应是对照组，它们被预测不会产生掺入的ddNTP。这样可控制识别的特异性。该反应是在循环仪中建立的，且经过大约5个解链、退火和延伸的循环，以增加灵敏度。然后，在链霉抗生物素蛋白苯乙烯珠上捕获生物素标记，测量荧光素的荧光。

在该实施方案中，寡核苷酸延伸，以致它不能重新使用，而不是加入的基因组DNA。如此可消除对核酸酶调整步骤的需要，因为寡核苷酸发生杂交，且可使得剪切变得并不必需。

在更复杂的情况中，反应是在具有与平板预-连接的寡核苷酸的微量滴定平板上进行的，每次一个孔。

实施例7

杂交状态的区别

寡核苷酸是在生物合成过程中，依靠所连接的生物素部分结合的。该方法的关键是区别两种状态，其中一种状态是探针-样品DNA杂交体为完全双链的，另外一种状态是杂交体为仅部分双链的，这是因为样品DNA与探针不完全同源。这两种状态对应于可动因子(ME)完全插入位点左侧翼/可动因子(FL/ME)的探针与只含空位点片段左侧翼/右侧翼(FL/FR)的样品DNA杂交；在这种情况下，左侧翼(FL)节段将杂交，但探针的可动因子(ME)部分不会被与左侧翼(FL)相连的探针DNA区所覆盖。

所述寡核苷酸，如下面详细描述的，与检测探针相对应，且分别是完全互补或半长互补的寡核苷酸。在实验中使用区别性杂交温度，即可使全长杂交体保持退火而半长杂交体解链的温度。

(a)样品DNA

作为样品DNA，使用寡核苷酸，如下面详细描述的，它与检测探针相对应，且分别是完全互补的或半长互补的寡核苷酸。3个不同的单链序列代表了样品DNA的3种不同的基因组状态，即可动因子(ME)(F0740；SEQ ID NO：30)，右侧翼/可动因子(FR/ME)(F0739；SEQ IDNO：29)和右侧翼/左侧翼(FR/FL)(F0738；SEQ ID NO：28)，即空位点。

双链□DNA被用作标准品。

*DNA样品

F0738 5′CAC GGC ACC ACT TCC TCG TGC3′FR/FLSEQ ID NO：28

F0739 5′GAG GAA GTG GGT GTT GFGA AATA3′FR/MESEQ ID NO：29

F0740 5′CTC CTT CAC CCT GTT GGA AATA3′MESEQ ID NO：30

(b)探针

两个单链寡核苷酸代表右侧翼/左侧翼(FR/FL)(E2458；SEQ IDNO：27)和右侧翼/可动因子(FR/ME)(E2460；SEQ ID NO：22)：

E2458 5′AGC ACG AGG AAG TGG TGC CGT G3′FR/FLSEQ ID NO：27

E2460 5′TAT TTC CAA CAC CCA CTT CCT CG3′FR/MESEQ ID NO：22

用作探针的寡核苷酸是生物素化的。

(c)方法

杂交是用下列反应混合物进行的。使用不同浓度的(1μg、0.5μg、0.1μg、50pg和25pg)生物素化寡核苷酸(E2458或E2460)和其它寡核苷酸(F0738、F0739或F0740)。调节MQ-水的量，使总反应体积等于50μl。

反应混合物：

xμg生物素化的寡核苷酸(E2458或E2460)

xμg 其它寡核苷酸(F0738、F0739或F0740)

5μl 10xTE+2000mM NaC l

xμl MQ-水

50μl 总体积

*生物素化寡核苷酸与固相支持物的连接

使不同浓度，1μg、0.5μg、0.1μg、50pg和25pg的生物素化寡核苷酸(E2458或E2460)与固相支持物连接。将涂覆过链霉抗生物素蛋白的平板(DELFIA链霉抗生物素蛋白微量滴定平板，Wallac Oy)用作固相支持物。将上述反应混合物中的寡核苷酸及MQ-水吸量到涂覆过链霉抗生物素蛋白的平板上，在平板摇动器上振摇30分钟混合。

*杂交

加入相同浓度作为生物素化寡核苷酸的其它寡核苷酸(F0738、F0739或F0740)和1xTE+200mM NaCl。在水浴中加热反应混合物至65℃，培养30分钟。培养过后，将反应混合物冷却至室温(25℃)。

杂交的寡核苷酸对为：

1A FR/ME，单独的ME互补序列(F0740、E2460)

1B FR/ME，FR/ME互补序列(F0739、E2460)

1C FR/FL，FR/FL互补序列(F0738、E2458)

*外切核酸酶T处理

杂交后，用外切核酸酶T处理杂交的寡核苷酸对，从而除去游离的ssDNA。所述处理在具有所连接寡核苷酸的平板上的反应混合物中进行。

反应混合物：

50μl 杂交寡核苷酸对(1A、1B或1C)

10μl 10xNE缓冲液

0.2μl 外切核酸酶T(5U/1)

39.8μl MQ-水

100μl 总体积

反应物在25℃(室温)培养1小时。将反应物加热至45℃，培养2分钟。该温度对于半-杂交体是非-许可的。

*检测

为了检测成功解链-处理过的、双链探针/样品杂交体与单链探针之间的差异，使用

染料(MoleCular Probes，Inc)。按照制造商

特异性检测dsDNA。在解链之后，测定混合物很肯能含有ssDNA(单链)、dsDNA(双链)、和半-ss-半-dsDNA的混合物。不可能从制造商处获得有关从ssDNA预期有多少荧光的确切信息。在本实验中，明确的结果只能从解链与ssDNA-特异性核酸酶处理相结合除去ssDNA来获得。

新鲜的

工作溶液是通过在来自

原液的1xTE中稀释200-倍而制备的。向每个孔中加入100μl picogreen工作溶液，然后在平板摇动器中混合。将100μlPi cogreen工作溶液和100μl 1xTE用作空白。将样品在黑暗中培养5分钟。培养过后，测量每份样品的荧光(激发485nm、发射535nm)。将平板阅读器的增益设定设置为使信号背景水平最佳化的值。

*结果

杂交结果在表1中提出。

表1

(平均值-零)和标准差零孔平均244

*结论

通过荧光反应的2-到3-倍差异可区别半杂交体(1A)与完全杂交体(1B、1C)。半-杂交体和完全-杂交体的区别是一致的，且足以应用。

实施例8

基因组DNA背景中杂交状态的区别

该实验按照实施例8所述进行，区别在于将与剪切大麦DNA混合的寡核苷酸用作样品DNA。

(a)样品DNA

使用通过超声处理的剪切的大麦DNA(繁殖植物Bomi)作为样品DNA，如下所述，所用的寡核苷酸与检测探针相对应，且分别是完全互补或半长互补的寡核苷酸。3种不同的单链序列代表3种不同的样品DNA基因组状态，即可动因子(ME)(F0740；SEQ ID NO：30)、右侧翼/可动因子(FR/ME)(F0739；SEQ ID NO：29)和右侧翼/左侧翼(FR/FL)(F0738；SEQ ID NO：28)，即空位点。

将双链□DNA用作标准品。

*DNA-样品

F0738 5′CAC GGC ACC ACT TCC TCG TGC3′FR/FLSEQ ID NO：28

F0739 5′GAG GAA GTG GGT GTT GGA AATA3′FR/MESEQ ID NO：29

F0740 5′CTC CTT CAC CCT GTT GGA AAT A3′MESEQ ID NO：30

向每种反应物中加入剪切的大麦DNA。

(b)探针

两个单链寡核苷酸代表右侧翼/可动因子(FR/ME)(E2460；SEQ IDNO：22)和右侧翼/左侧翼(FR/FL)(E2458；SEQ ID NO：27)。

E2458 5′AGC ACG AGG AAG TGG TGC CGT G3′FR/FL SEQ ID NO：27

E2460 5′TAT TTC CAA CAC CCA CTT CCT CG3′FR/MESEQ ID NO：22

用作探针的寡核苷酸是生物素化的。

(c)方法

杂交是使用下列反应混合物进行的。使用不同浓度(1μg、0.5μg、0.1μg、50pg和25pg)的生物素化寡核苷酸(E2458或E2460)和其它寡核苷酸(F0738、F0739或F0740)。调节MQ-水的量，使总体积等于50μl。

反应混合物：

xμg 生物素化寡核苷酸

xμg 其它寡核苷酸

10ng 剪切的大麦DNA

5μl 10xTE+2000mM NaCl

x μl MQ-水

50μl 总体积

*生物素化寡核苷酸与固相支持物的连接

使不同浓度，50pg和100pg的生物素化寡核苷酸(E2458或E2460)与固相支持物连接。将涂覆过链霉抗生物素蛋白的平板(DELFIA链霉抗生物素微量滴定平板，Wallac Oy)用作固相支持物。将上述反应混合物中的寡核苷酸及MQ-水吸量到涂覆过链霉抗生物素蛋白的平板上，并通过在平板摇动器上振摇30分钟而混合。

*杂交

使用前，将剪切的大麦DNA加热至96℃5分钟，立即在冰上冷却。将相同浓度作为生物素化寡核苷酸的大麦DNA和其它寡核苷酸(F0738、F0739或F0740)混合，加入1xTE+200mM NaCl。将反应混合物在水浴中加热至65℃，并培养30分钟。培养之后，使反应混合物冷却至室温(25℃)。

杂交的寡核苷酸对是：

1A FR/ME，单独的ME互补序列(F0740、E2460)

1B FR/ME，FR/ME互补序列(F0739、E2460)

1C FR/FL，FR/FL互补序列(F0738、E2458)

*外切核酸酶T处理

杂交后，用外切核酸酶T处理杂交寡核苷酸对，从而除去游离的ssDNA。该处理是在具有所连接的寡核苷酸的平板上进行的。

反应混合物：

50μl 杂交产物(1A、1B或1C)

10μl 10xNE缓冲液

0.2μl 外切核酸酶T(5U/1)

39.8μl MQ-水

100μl 总体积

将反应物在25℃(室温)培养1小时。然后将反应物加热至45℃，并培养2分钟。该温度对于半-杂交体而言是不许可的。

*检测

新鲜的

(Molecular Probes，Inc.)工作溶液是通过在源于

原液的1xTE中200-倍稀释而制备的。向每个孔中加入100μl 工作溶液，并在平板摇动器中混合。100μl

工作溶液和100μl 1xTE被用作空白对照。在黑暗中培养样品5分钟。培养之后，测量每份样品的荧光(激发485nm、发射535nm)。平板阅读器的增益设定被设置使信号背景水平最佳化的值。

*结果

杂交的结果在表2中给出。

表2

*结论

通过荧光反应的2-3倍差异，可区别半-杂交体(1A)与完全杂交体(1B和1C)。100或200倍过量基因组DNA(10ng)的存在不会影响信号；具有和没有基因组DNA(实施例7)的结果在统计学上没有差异。这表明部分杂交基因组序列的存在不会干扰溶液中正确的、完全杂交寡核苷酸，发现了其位于固相支持物上的相应靶。在右侧翼/可动因子(FR/ME)对的情况下，这是特别重要的，1B，其中基因组中大量的BARE-1LTR将被预期与全长右侧翼/可动因子(FR/ME)竞争结合。

本领域技术人员应当明白，在不背离本发明下列原则的条件下，可对上述本发明优选实施方案的详细描述进行多种改变。因此，本发明的范围应仅由下列权利要求确定。

序列表

<110>Boreal Plant Breeding Ltd

<120>用于证实遗传身份的方法和测试试剂盒

<130>A1435PC

<140>

<141>

<150>FI 20020176

<151>2002-01-30

<160>30

<170>PatentIn Ver.2.1

<210>1

<211>16

<212>DNA

<213>人工序列

<220>

<223>Pst I SSAP接头引物

<400>1

<210>2

<211>313

<212>DNA

<213>玉米(Zea mays)

<220>

<223>Heartbreaker(Hbr7)微型反向重复序列转座因子(MITE)(AF 203730)

<400>2

<210>3

<211>16

<212>DNA

<213>玉米

<220>

<223>Hbr7的左侧翼(FR)序列

<400>3

<210>4

<211>16

<212>DNA

<213>玉米

<220>

<223>Hbr7的右侧翼(FR)序列

<400>4

<210>5

<211>20

<212>DNA

<213>人工序列

<220>

<223>FL/ME寡核苷酸

<220>

<223>11-20Hbr

<400>5

<210>6

<211>20

<212>DNA

<213>人工序列

<220>

<223>ME/FR寡核苷酸

<220>

<223>1-10Hbr

<400>6

<210>7

<211>18

<212>DNA

<213>人工序列

<220>

<223>FL/FR寡核苷酸

<400>7

<210>8

<211>21

<212>DNA

<213>人工序列

<220>

<223>MITE基因座的第二种形式

<220>

<223>10-14双重复序列“足迹”

<400>8

<210>9

<211>100

<212>DNA

<213>玉米

<220>

<223>Zeon-1 LTR逆转录转座子的FL区

<400>9

<210>10

<211>100

<212>DNA

<213>玉米

<220>

<223>Zeon-1 LTR逆转录转座子的FR区

<400>10

<210>11

<211>49

<212>DNA

<213>玉米

<220>

<223>Zeon-1 LTR的右端

<220>

<223>1-8末端反向重复序列

<400>11

<210>12

<211>49

<212>DNA

<213>玉米

<220>

<223>Zeon-1 LTR的右端

<220>

<223>42-49末端反向重复序列

<400>12

<210>13

<211>26

<212>DNA

<213>玉米

<220>

<223>FL/ME连接点

<220>

<223>12-16由插入产生的同向重复序列

<220>

<223>17-26左LTR的末端

<400>13

<210>14

<211>31

<212>DNA

<213>玉米

<220>

<223>ME/FR连接点

<220>

<223>1-12右LTR的末端

<220>

<223>13-16由插入产生的同向重复序列

<400>14

<210>15

<211>20

<212>DNA

<213>人工序列

<220>

<223>ME/FR寡核苷酸

<220>

<223>6-10右LTR的末端

<220>

<223>11-20由插入产生的同向重复序列

<400>15

<210>16

<211>21

<212>DNA

<213>人工序列

<220>

<223>ME/FR寡核苷酸

<220>

<223>1-10右LTR的末端

<220>

<223>11-15由插入产生的同向重复序列

<400>16

<210>17

<211>22

<212>DNA

<213>人工序列

<220>

<223>FL/FR寡核苷酸

<220>

<223>7-11由插入产生的同向重复序列

<400>17

<210>18

<211>32

<212>DNA

<213>人工序列

<220>

<223>引物7286

<400>18

<210>19

<211>28

<212>DNA

<213>人工序列

<220>

<223>(CTC)9C

<400>19

<210>20

<211>1767

<212>DNA

<213>大麦(Hordeum vulgare)

<220>

<223>sb17，春大麦中存在的多态性片段

<220>

<223>1-92 BARE-1插入片段的LTR

<220>

<223>93-97由插入产生的预测同向重复序列

<400>20

<210>21

<211>3186

<212>DNA

<213>大麦

<220>

<223>wb17，缺少BARE-1插入的冬大麦的序列

<220>

<223>1511-1512春大麦中BARE-1插入片段的侧翼核苷酸

<220>

<223>1512-1516由插入产生的同向重复序列

<400>21

<210>22

<211>23

<212>DNA

<213>人工序列

<220>

<223>FR/ME寡核苷酸

<220>

<223>1-11 BARE-1

<400>22

<210>23

<211>266

<212>DNA

<213>人工序列

<220>

<223>ME/FL侧翼区

<220>

<223>112-116由插入产生的同向重复序列

<400>23

<210>24

<211>46

<212>DNA

<213>人工序列

<220>

<223>FL/ME

<220>

<223>22-26由插入产生的同向重复序列

<400>24

<210>25

<211>50

<212>DNA

<213>人工序列

<220>

<223>ME/FR

<220>

<223>23-27由插入产生的同向重复序列

<400>25

<210>26

<211>21

<212>DNA

<213>人工序列

<220>

<223>FL/ME寡核苷酸

<400>26

<210>27

<211>22

<212>DNA

<213>人工序列

<220>

<223>FR/FL寡核苷酸

<400>27

<210>28

<211>21

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：-

<220>

<223>FR/FL寡核苷酸

<400>28

<210>29

<211>22

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：-

<220>

<223>FR/ME寡核苷酸

<400>29

<210>30

<211>22

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：-

<220>

<223>ME寡核苷酸

<400>30

Claims

1.一种用于证实确定的种群集合体内的遗传身份、遗传多样性、基因组变异或多态性，等位基因变异和共显性评分的方法，其特征在于该方法包括下列步骤：

(a)使代表样品总DNA的未标记、单链的样品DNA与一组或多组不同的成对或平行的单链寡核苷酸序列杂交，其中

每个寡核苷酸序列代表至少一个可动因子的完全或空整合位点；

一组成对的寡核苷酸序列包括至少一个代表所述可动因子的完全整合位点的寡核苷酸序列和至少一个代表所述可动因子的空整合位点的寡核苷酸序列；

一组平行的寡核苷酸序列包括至少两个代表所述可动因子的完全整合位点的寡核苷酸序列和至少一个代表所述可动因子的空整合位点的寡核苷酸序列；

且每个寡核苷酸序列与固相支持物上确定的可识别位置连接；

(b)提供杂交后处理，以便除去没有与固相支持物上连接的成对或平行的寡核苷酸序列完全杂交的样品DNA；

(c)提供具有可记录标记的杂交产物，所述标记允许记录杂交模式，并由此评分至少一个可动因子的完全或空整合位点的存在或缺乏；和

(d)通过对步骤(c)的杂交模式进行评分，证实确定的种群集合体内的遗传身份、遗传多样性、基因组变异或多态性，等位基因变异和共显性评分，其中当代表完全整合位点的寡核苷酸序列产生阳性信号且代表空整合位点的寡核苷酸序列不产生信号时，证实存在完全整合位点；当代表空整合位点的寡核苷酸序列产生阳性信号且代表完全整合位点的寡核苷酸序列不产生信号时，证实存在空整合位点；当用所述寡核苷酸序列都没有获得信号时，证实整合位点衰退或损失。

2.根据权利要求1所述的方法，其特征在于与固相支持物连接的每个寡核苷酸序列代表可动因子的至少一个完全整合位点或一个相应的空整合位点中的连接点，其中代表完全整合位点的寡核苷酸序列包含2个相等或不同长度的独特序列区，其中一个独特序列区是侧翼于所述可动因子的区，另一个独特序列区是所述可动因子的末端，且代表空整合位点的寡核苷酸序列包含2个独特序列区，每个都由围绕所述可动因子整合位点的侧翼区组成。

3.根据权利要求1所述的方法，其特征在于进行共显性评分时，对种群集合体中所要评分的可动因子的每个整合位点提供至少一组成对或平行的寡核苷酸序列。

4.根据权利要求1所述的方法，其特征在于将对代表完全或空整合位点的寡核苷酸序列记录的杂交模式用于进行共显性评分。

5.根据权利要求1所述的方法，其特征在于在代表完全位点的寡核苷酸序列中包含侧翼区的独特序列区要比包含可动因子末端的独特序列区长。

6.根据权利要求1所述的方法，其特征在于杂交反应在使未标记、单链的样品DNA退火于与固相支持物连接的寡核苷酸序列的条件下进行。

7.根据权利要求1所述的方法，其特征在于杂交后处理是在释放没有与固相支持物上连接的寡核苷酸序列完全杂交的所有样品DNA的条件下进行的。

8.根据权利要求1所述的方法，其特征在于杂交模式是通过在杂交和用可记录标记进行杂交后处理之后提供样品DNA而记录的。

9.根据权利要求1所述的方法，其特征在于进行杂交和杂交后处理之后的样品DNA是从固相支持物释放的，且随后与和固相支持物连接的每个寡核苷酸序列完全相同的被标记的核苷酸序列杂交。

10.根据权利要求1所述的方法，其特征在于所述记录是可逆的，且固相支持物恢复至其原始状态重新使用。

11.根据权利要求1所述的方法，其特征在于包括杂交、杂交后处理、记录和评分在内的步骤都是自动化的。

12.根据权利要求1所述的方法，其特征在于该方法包括下列步骤：

(a)提供含有不止一组成对或平行的寡核苷酸序列的固相支持物，其中每组都含有至少一个代表完全整合位点的寡核苷酸序列和一个代表空整合位点的寡核苷酸序列；

(b)用物理、机械或酶方法剪切代表总DNA的样品DNA，以便在不同的DNA碎片上获得可动因子；

(c)使所述剪切的样品DNA成为单链，并使所述单链样品DNA片段与固相支持物上连接的单链寡核苷酸序列序列杂交；

(d)提供杂交后处理，包括利用不同严格条件下的洗涤处理除去未与固相支持物上连接的寡核苷酸序列完全杂交的单链样品DNA和消化处理；

(e)利用能够证实杂交的任何方法记录每组寡核苷酸序列的杂交模式；

(f)对可记录的杂交模式评分，其中与固相支持物上连接的代表完全整合位点的寡核苷酸序列杂交表示存在可动因子，与固相支持物上连接的代表空整合位点的寡核苷酸序列杂交表示在至少一个可动因子的整合位点中不存在可动因子，没有进行杂交则表示缺少整合位点。

13.根据权利要求1所述的方法，其特征在于所述样品DNA是断裂的。

14.根据权利要求1的方法，其特征在于该方法用包含与固相支持物连接的不止一组成对或平行的单链寡核苷酸序列的测试试剂盒进行，每个寡核苷酸序列代表至少一个可动因子的至少一个完全整合位点或一个空整合位点中的连接点，其中代表完全整合位点的寡核苷酸序列包含2个相等或不同长度的独特序列区，其中一个独特序列区是可动因子的侧翼区，另一个独特序列区是所述可动因子的末端，且代表空整合位点的寡核苷酸序列包含2个围绕所述可动因子的侧翼区，并且其中所述固相支持物包括由选自玻璃、塑料、硝化纤维素、尼龙、聚丙烯酸或硅的材料制成的膜、滤器、载玻片、平板、芯片、培养皿或微孔。

15.根据权利要求14所述的方法，其特征在于所述测试试剂盒包括试剂、标记、洗涤缓冲液、末端保护试剂和/或使用说明。

16.根据权利要求14所述的方法，其特征在于所述寡核苷酸序列被末端保护。

17.根据权利要求1-16任意一项所述方法在区别任何特定基因组位置中至少一个可动因子整合位点的至少一个整合位点不同的任何生物中的用途。

18.根据权利要求1-16任意一项所述的方法在通过证实遗传身份、遗传多样性、基因组变异或多态性和共显性评分，用于基因型分析、系统发育研究、亲子关系鉴定、法学、单倍型分析和谱系分析以及植物和动物繁殖中的用途。