CN116887669A

CN116887669A - 具有细胞质雄性不育恢复基因的玉米植物的鉴定和选择方法

Info

Publication number: CN116887669A
Application number: CN202180094251.9A
Authority: CN
Inventors: M·克洛伊贝尔-迈茨; C·克纳克; H·达尔奥基奥; J-C·卡斯特勒
Original assignee: KWS SAAT SE and Co KGaA
Current assignee: KWS SAAT SE and Co KGaA
Priority date: 2020-12-22
Filing date: 2021-12-22
Publication date: 2023-10-13
Also published as: EP4266873A1; WO2022136491A1; US20240057538A1; CA3202093A1; CL2023001795A1; EP4018821A1; AR124476A1

Abstract

本发明涉及用于鉴定植物或植物部分例如玉米植物或植物部分的方法，所述植物或植物部分包含新型育性基因座恢复基因，特别是育性基因座的细胞质雄性不育恢复基因。本发明还涉及与此类基因座相关的分子标记以及此类标记在植物鉴定中的用途。本发明还涉及产生包含新型育性基因座恢复基因的植物或植物部分的方法。

Description

具有细胞质雄性不育恢复基因的玉米植物的鉴定和选择方法

发明领域

本发明涉及鉴定植物或植物部分、特别是具有育性基因型或表型恢复基因、特别是育性基因型或表型的细胞质育性恢复基因的玉米植物或植物部分的方法。本发明还涉及如此鉴定的植物，以及产生此类植物的方法。本发明进一步涉及适合于鉴定或产生此类植物的多核酸和多肽。

发明背景

为了抑制杂交生产中雌性品系的自花授粉，将CMS(细胞质雄性不育)施用于全世界的植物育种计划中。CMS的特点是母系遗传突变，导致植物无法产生花粉(Schnable,P.S.,&Wise,R.P.(1998).The molecular basis of cytoplasmic male sterility andfertility restoration.Trends in plant science,3(5),175-180.)。

为了确保杂交后代完全可育并能够产生种子，杂交生产中的父本系需要拥有所谓的恢复基因，该基因可以覆盖和消除CMS的影响。

对于玉米cms胞质cmsC，位于8号染色体起始处的主要恢复基因座RF4是众所周知的(WO 2012/047595)。在将雌性品系转变为CMSC之前，必须保证RF4在该品系中无活性。否则，必须先渗入保持基因座，然后才能进行CMS转变。通过标记应用和表型观察来定义恢复基因型。

本发明的一个目的是鉴定用于植物育种计划、特别是包括使用CMS的玉米植物育种计划的新恢复基因型。新恢复基因型的鉴定，特别是与玉米8号染色体上已知的恢复基因型不同的新恢复基因型的鉴定，扩大了其在植物育种、特别是基因渗入中的可用性。

发明概述

本发明涉及植物或植物部分，特别是具有恢复基因型或表型的玉米植物或植物部分及其用途。所述恢复基因型或表型特别是指细胞质雄性不育(CMS)恢复基因型或表型，即恢复雄性育性的基因型或表型。

优选地，所述恢复基因型由位于玉米3号染色体上的一种或多种恢复基因所致，即RF-03-01。

本发明有利地可以鉴定具有CMS恢复表型的玉米品系，其包含众所周知的恢复基因或基因座，例如RF4。与已知的恢复基因座相比，本发明的恢复基因座的不同染色体位置扩展了用于生成以及保持恢复基因系的工具箱，或者用于确保不需要的恢复基因型/表型保持不存在或可以被选择。

本发明具体地由以下编号的陈述1至96中的任一项或一项或多项的任何组合来体现，其可以与任何其它陈述和/或实施方案组合。

1.一种鉴定(玉米)植物或植物部分的方法，包括筛选3号染色体上的细胞质雄性不育(CMS)(育性)恢复基因座(RF-03-01)的存在、及所述基因座的检测或鉴定(与其相关的单倍型)。

2.根据陈述1的方法，其中所述基因座包含或被包含在3号染色体上对应于B73AGPv4或其片段的位置195629901至198023573的区域中。

3.根据陈述1或2的方法，其中所述基因座包含或被包含在3号染色体上对应于B73AGPv4或其片段的位置197453646至197698278的区域中。

4.根据陈述1至3中任一项的方法，其中所述基因座包含表4或表5的一个或多个分子标记(等位基因)。

5.根据陈述1至4中任一项的方法，其中所述基因座包含一种或多种多核酸，所述多核酸包含SEQ ID NO:17至200中的一个或多个序列。

6.根据陈述1至5中任一项的方法，其中所述基因座包含一种或多种多核酸，所述多核酸包含SEQ ID NO:68至140中的一个或多个序列。

7.根据陈述1至6中任一项的方法，其中所述基因座包含Zm00001d043358、Zm00001d043352、Zm00001d043356和Zm00001d043357中的一个或多个。

8.根据陈述1至7中任一项的方法，其中所述基因座包含Zm00001d043358。

9.根据陈述1至8中任一项的方法，其中所述基因座包含多核酸，所述多核酸包含SEQ ID NO:1、5、9和13中的一个或多个序列或者SEQ ID NO:2、6、10和14中的一个或多个序列，或包含与SEQ ID NO:1、5、9和13或SEQ ID NO:2、6、10和14中任一个或多个序列具有至少80％、优选至少85％、更优选至少90％、最优选至少95％相同性的序列。

10.根据陈述1至9中任一项的方法，其中所述基因座包含多核酸，所述多核酸包含SEQ ID NO:1或2的序列，或者包含与SEQ ID NO:1或2中任一个或多个序列具有至少80％、优选至少85％、更优选至少90％、最优选至少95％相同性的序列。

11.根据陈述1至10中任一项的方法，包括筛选SEQ ID NO:17至200中的任一个或多个序列的存在。

12.根据陈述1至11中任一项的方法，包括筛选SEQ ID NO:68至140中的任一个或多个序列的存在。

13.根据陈述1至12中任一项的方法，包括筛选SEQ ID NO:70、72、76、79、86、88、92、93、99、104、105、107、108、109、115和134中的任一个或多个序列的存在。。

14.根据陈述1至13中任一项的方法，包括筛选SEQ ID NO:1、5、9和13中任一个或多个序列或SEQ ID NO:2、6、10和14中一个或多个序列或其(独特的)片段的存在，或包括筛选包含与SEQ ID NO:1、5、9和13中任一个或多个序列或SEQ ID NO:2、6、10和14中一个或多个序列或其(独特的)片段具有至少80％、优选至少85％、更优选至少90％、最优选至少95％相同性的序列的多核酸的存在。

15.根据陈述1至14任一项的方法，包括筛选SEQ ID NO:1或2或其(独特的)片段的存在，或包括筛选包含与SEQ ID NO:1或2的序列或其(独特的)片段具有至少80％、优选至少85％、更优选至少90％、最优选至少95％相同性的序列的多核酸的存在。

16.根据陈述1至14任一项的方法，包括筛选Zm00001d043358、Zm00001d043352、Zm00001d043356和/或Zm00001d043357中的一个或多个序列或其片段的存在，其中：

Zm00001d043358

具有SEQ ID NO:1或2的基因组序列，或与SEQ ID NO:1或2至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的基因组序列；

具有SEQ ID NO:201或3的编码序列，或与SEQ ID NO:201或3至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的编码序列；和/或

编码具有SEQ ID NO:202或4的序列的蛋白质，或具有与SEQ ID NO:202或4的序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列的蛋白质；

Zm00001d043352

具有SEQ ID NO:5或6的基因组序列，或与SEQ ID NO:5或6至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的基因组序列；

具有SEQ ID NO:203或7的编码序列，或与SEQ ID NO:203或7至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的编码序列；和/或

编码具有SEQ ID NO:204或8的序列的蛋白质，或具有与SEQ ID NO:204或8的序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列的蛋白质；

Zm00001d043356

具有SEQ ID NO:9或10的基因组序列，或与SEQ ID NO:9或10至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的基因组序列；

具有SEQ ID NO:205或11的编码序列，或与SEQ ID NO:205或11至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的编码序列；和/或

编码具有SEQ ID NO:206或12的序列的蛋白质，或具有与SEQ ID NO:206或12至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列的蛋白质；

Zm00001d043357

具有SEQ ID NO:13或14的基因组序列，或与SEQ ID NO:13或14至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的基因组序列；

具有SEQ ID NO:207或15的编码序列，或与SEQ ID NO:207或15至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的编码序列；和/或

编码具有SEQ ID NO:208或16的序列的蛋白质，或具有与SEQ ID NO:208或16至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列的蛋白质。

17.根据陈述1至16任一项的方法，包括筛选表4或表5的任一个或多个分子标记(等位基因)的存在。

18.一种用于鉴定(玉米)植物或植物部分(在3号染色体上具有育性基因座恢复基因)的方法，包括筛选表4或表5的任一个或多个分子标记(等位基因)的存在。

19.一种用于鉴定(玉米)植物或植物部分(在3号染色体上具有育性基因座恢复基因)的方法，包括筛选SEQ ID NO:17至200中的任一个或多个序列的存在。

20.一种用于鉴定(玉米)植物或植物部分(在3号染色体上具有育性基因座恢复基因)的方法，包括筛选SEQ ID NO:68至140中的任一个或多个序列的存在。

21.一种用于鉴定(玉米)植物或植物部分(在3号染色体上具有育性基因座恢复基因)的方法，包括筛选SEQ ID NO:70、72、76、79、86、88、92、93、99、104、105、107、108、109、115和134中的任一个或多个序列的存在。

22.一种用于鉴定(玉米)植物或植物部分(在3号染色体上具有育性基因座恢复基因)的方法，包括筛选SEQ ID NO:1、5、9和13中任一个或多个序列或其(独特的)片段或包含与SEQ ID NO:1、5、9和13中任一个或多个序列或其(独特的)片段至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列的多核酸的存在；或筛选SEQ ID NO:2、6、10和14中任一个或多个序列或其(独特的)片段或包含与SEQ ID NO:2、6、10和14中任一个或多个序列或其(独特的)片段至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列的多核酸的存在。

23.一种用于鉴定(玉米)植物或植物部分(在3号染色体上具有育性基因座恢复基因)的方法，包括筛选SEQ ID NO:1或2或其(独特)片段的存在，或包括筛选包含与SEQ IDNO:1或2或其(独特的)片段至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列的多核酸的存在。

24.一种用于鉴定(玉米)植物或植物部分(在3号染色3上具有育性基因座恢复基因)的方法，包括筛选Zm00001d043358、Zm00001d043352、Zm00001d043356和/或Zm00001d043357或其片段的存在，其中：

Zm00001d043358

编码具有SEQ ID NO:202或4的序列的蛋白质，或具有与SEQ ID NO:202或4至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列的蛋白质；

Zm00001d043352

编码具有SEQ ID NO:204或8的序列的蛋白质，或具有与SEQ ID NO:204或8至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列的蛋白质；

Zm00001d043356

编码具有SEQ ID NO:206或12的序列的蛋白质，或具有与SEQ ID NO:206或12的序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列的蛋白质；

Zm00001d043357

25.一种(分离的)多核酸，其包含表4或表5的一个或多个分子标记(等位基因)，或所述多核酸的互补体或反向互补体。

26.一种(分离的)多核酸，其包含对应于表4的SNP的一个或多个核苷酸，或所述多核酸的互补体或反向互补体。

27.一种(分离的)多核酸，或者所述多核酸的互补体或反向互补体，所述多核酸包含至少15个连续核苷酸，所述至少15个连续核苷酸包含在对应于两侧是下表中任何指示的5’和3’位置的区域的区域中，并且所述多核酸包含对应于参考玉米3号染色体B73AGPv4指示的SNP位置的核苷酸

28.一种(分离的)多核酸，或者所述多核酸的互补体或反向互补体，所述多核酸包含至少15个连续核苷酸，所述至少15个连续核苷酸包含在对应于两侧是下表中任何指示的5’和3’位置的区域的区域中，并且所述多核酸包含对应于参考玉米3号染色体B73AGPv4指示的SNP位置的核苷酸

5’(-100nt)	5’(-50nt)	SNP	3’(+50nt)	3’(+100nt)
					197453608	197453658	197453708	197453758	197453858
197454530	197454580	197454630	197454680	197454780
					197454733	197454783	197454833	197454883	197454983
197456822	197456872	197456922	197456972	197457072
					197488651	197488701	197488751	197488801	197488901
197524389	197524439	197524489	197524539	197524639
					197525525	197525575	197525625	197525675	197525775
197525890	197525940	197525990	197526040	197526140
					197556127	197556177	197556227	197556277	197556377
197611794	197611844	197611894	197611944	197612044
					197613035	197613085	197613135	197613185	197613285
197613558	197613608	197613658	197613708	197613808
					197614989	197615039	197615089	197615139	197615239
197615361	197615411	197615461	197615511	197615611
					197633760	197633810	197633860	197633910	197634010
197696092	197696142	197696192	197696242	197696342

。

29.一种(分离的)多核酸，或者所述多核酸的互补体或反向互补体，所述多核酸包含至少15个连续核苷酸，所述至少15个连续核苷酸包含在对应于两侧是下表中任何指示的5’和3’位置的区域的区域中，并且所述多核酸包含对应于指示的SEQ ID NO的位置的核苷酸

/>

30.一种(分离的)多核酸，或者所述多核酸的互补体或反向互补体，所述多核酸包含至少15个连续核苷酸，所述至少15个连续核苷酸包含在对应于两侧是下表中任何指示的5’和3’位置的区域的区域中，并且所述多核酸包含对应于指示的SEQ ID NO的位置的核苷酸

/>

31.根据陈述25至30中任一项的(分离的)多核酸，其包含至多500个核苷酸，优选至多200个核苷酸，更优选至多100个核苷酸，最优选至多50个核苷酸，例如至多35个核苷酸。

32.一种(分离的)多核酸，其与根据陈述25至31中任一项的多核酸或所述多核酸的互补体或反向互补体特异性杂交。

33.根据陈述25至32中任一项的(分离的)多核酸，其是引物或探针。

34.根据陈述25至33中任一项的(分离的)多核苷酸，其是等位基因特异性引物或探针。

35.根据陈述25至34中任一项的(分离的)多核酸，其是KASP引物。

36.一种引物或探针，其包含根据陈述25至35中任一项的(分离的)多核酸。

37.根据陈述36的引物，其是等位基因特异性引物。

38.根据陈述36或37的引物，其是KASP引物。

39.一种与表4或表5的分子标记(等位基因)或其互补体或反向互补体特异性杂交的引物。

40.一种能够特异性检测表4或表5的分子标记(等位基因)的引物。

41.一种能够特异性检测表4或表5的分子标记(等位基因)的引物组。

42.一种能够扩增包含表4或表5的分子标记(等位基因)的多核酸的引物组。

43.一种(玉米)植物或植物部分，其包含表4或表5的一个或多个分子标记(等位基因)、如陈述1至10中任一项定义的基因座、和/或如陈述5、6、9、10或25至30任一项定义的多核酸。

44.一种用于产生(玉米)植物或植物部分的方法，包括在所述植物或植物部分的基因组中引入如陈述1至10任一项定义的基因座或其(功能)片段。

45.根据陈述44的方法，其中引入基因组中包括通过转基因法。

46.根据陈述44或45的方法，其中引入基因组中包括通过基因渗入。

47.根据陈述44至46中任一项的方法，包括用编码如陈述1至10中任一项定义的基因座的多核酸转化植物或植物部分，优选转化植物细胞，更优选转化原生质体，并且任选从所述植物细胞、优选原生质体中再生植物。

48.根据陈述47的方法，其中引入的所述多核酸具有与所述植物相应的多核酸不同的序列。

49.一种用于产生(玉米)植物或植物部分的方法，包括(a)提供根据陈述1至24中任一项鉴定的或根据陈述40至44中任一项产生的第一(玉米)植物，(b)使所述第一(玉米)植物与具有细胞质雄性不育的第二(玉米)植物杂交；以及任选(d)从后代收获所述(玉米)植物部分。

50.根据陈述1至24或44至49中任一项的方法，其中所述植物部分是细胞、组织或器官。

51.根据陈述1至24或44至50中任一项的方法，其中所述植物部分是原生质体。

52.根据陈述1至24或44至50中任一项的方法，其中所述植物部分是种子。

53.根据陈述1至24中任一项的方法，其中所述基因座、多核酸或分子标记(等位基因)是纯合的。

54.根据陈述1至24中任一项的方法，其中所述基因座、多核酸或分子标记(等位基因)是杂合的。

55.根据陈述5、6、9、10或25至42中任一项的多核酸、引物或探针、或引物组在鉴定(玉米)植物或植物部分中的用途。

56.根据陈述5、6、9、10或25至30中任一项的多核酸或根据陈述1至10中任一项定义的基因座在产生(玉米)植物或植物部分中的用途。

57.根据陈述9至17或22至24中任一项的方法，其中与SEQ ID NO:1、5、9或13中任一个或多个序列具有至少80％、优选至少85％、更优选至少90％、最优选至少95％相同性的所述序列包含表5中列出的一个或多个、优选全部各自相关的(恢复基因)多态性。

58.根据陈述9至17或22至24中任一项的方法，其中与SEQ ID NO:2、6、10或14中任一个或多个序列具有至少80％、优选至少85％、更优选至少90％、最优选至少95％相同性的所述序列包含表5中列出的一个或多个、优选全部各自相关的(保持基因)多态性。

59.根据陈述1至24或57至58中任一项的方法，其是用于区分在3号染色体上具有所述细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)的玉米植物或植物部分与在3号染色体上缺乏所述细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)的玉米植物的方法。

60.根据陈述1至17或57至59中任一项的方法，其中如果检测到在3号染色体上的所述细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)，则所述玉米植物或植物部分被鉴定为在3号染色体上具有所述细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)。

61.根据陈述1至17或57至59中任一项的方法，其中如果未检测到3号染色体上的所述细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)，则所述玉米植物或植物部分被鉴定为在3号染色体上缺乏所述细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)。

62.根据权利要求18或59中任一项所述的方法，其中如果鉴定出与表4或5中的所述恢复基因座相关的一个或多个分子标记等位基因，则所述玉米植物或植物部分被鉴定为在3号染色体上具有所述细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)。

63.根据陈述18或59中任一项的方法，其中如果未鉴定出与表4或5中的所述恢复基因座相关的一个或多个分子标记等位基因，则所述玉米植物或植物部分被鉴定为在3号染色体上缺乏所述细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)。

64.根据陈述18或59中任一项的方法，其中如果鉴定出与表4或5中的保持基因座相关的一个或多个分子标记等位基因，则所述玉米植物或植物部分被鉴定为在3号染色体上缺乏所述细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)。

65.根据权利要求19或59中任一项的方法，其中如果鉴定出具有恢复基因SNP的SEQ ID NO:17至200中的任一个或多个序列，则所述玉米植物或植物部分被鉴定为在3号染色体上具有所述细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)。

66.根据陈述19或59中任一项的方法，其中如果鉴定出不具有恢复基因SNP的SEQID NO:17至200中的一个或多个序列，则所述玉米植物或植物部分被鉴定为在3号染色体上缺乏所述细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)。

67.根据陈述19或59中任一项的方法，其中如果鉴定出具有保持基因SNP的SEQ IDNO:17至200中的任一个或多个序列，则所述玉米植物或植物部分被鉴定为在3号染色体上缺乏所述细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)。

68.根据陈述20或59中任一项的方法，其中如果鉴定出具有恢复基因SNP的SEQ IDNO:68至140中的任一个或多个序列，则所述玉米植物或植物部分被鉴定为在3号染色体上具有所述细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)。

69.根据陈述20或59中任一项的方法，其中如果鉴定出不具有恢复基因SNP的SEQID NO:68至140中的任一个或多个序列，则所述玉米植物或植物部分被鉴定为在3号染色体上缺乏所述细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)。

70.根据陈述20或59中任一项的方法，其中如果鉴定出具有保持基因SNP的SEQ IDNO:68至140中的任一个或多个序列，则所述玉米植物或植物部分被鉴定为在3号染色体上缺乏所述细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)。

71.根据陈述21或59任一项的方法，其中如果鉴定出具有恢复基因SNP的SEQ IDNO:70、72、76、79、86、88、92、93、99、104、105、107、108、109、115和134中的任一个或多个序列，则所述玉米植物或植物部分被鉴定为在3号染色体上具有所述细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)。

72.根据陈述21或59任一项的方法，其中如果鉴定出不具有恢复基因SNP的SEQ IDNO:70、72、76、79、86、88、92、93、99、104、105、107、108、109、115和134中的任一个或多个序列，则所述玉米植物或植物部分被鉴定为在3号染色体上缺乏所述细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)。

73.根据陈述21或59任一项的方法，其中如果鉴定出具有保持基因SNP的SEQ IDNO:70、72、76、79、86、88、92、93、99、104、105、107、108、109、115和134中的任一个或多个序列，则所述玉米植物或植物部分被鉴定为在3号染色体上缺乏所述细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)。

74.根据陈述22、24或57至59中任一项的方法，其中如果鉴定出SEQ ID NO:1、5、9或13中的任一个或多个序列、或包含与SEQ ID NO:1、5、9或13中任一个或多个序列具有至少80％、优选至少85％、更优选至少90％、最优选至少95％相同性的序列的多核酸，则所述玉米植物或植物部分被鉴定为在3号染色体上具有所述细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)。

75.根据陈述22、24或57至59中任一项的方法，其中如果未鉴定出SEQ ID NO:1、5、9或13中的任一个或多个序列、或者包含与SEQ ID NO:1、5、9或13中任一个或多个序列具有至少80％、优选至少85％、更优选至少90％、最优选至少95％相同性的序列的多核酸，则所述玉米植物或植物部分被鉴定为在3号染色体上缺乏的所述细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)。

76.根据陈述22、24或57至59中任一项的方法，其中如果鉴定出SEQ ID NO:2、6、10或14中的任一个或多个序列、或包含与SEQ ID NO:2、6、10或14中任一个或多个序列具有至少80％、优选至少85％、更优选至少90％、最优选至少95％相同性的序列的多核酸，则所述玉米植物或植物部分被鉴定为在3号染色体上缺乏所述细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)。

77.根据陈述23或57至59中任一项的方法，其中如果鉴别出SEQ ID NO:1或包含与SEQ ID NO:1所示序列具有至少80％、优选至少85％、更优选至少90％、最优选至少95％相同性的序列的多核酸，则所述玉米植物或植物部分被鉴定为在3号染色体上具有所述细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)。

78.根据陈述23或57至59中任一项的方法，其中如果未鉴别出SEQ ID NO:1或包含与SEQ ID NO:1所示序列具有至少80％、优选至少85％、更优选至少90％、最优选至少95％相同性的序列的多核酸，则所述玉米植物或植物部分被鉴定为在3号染色体上缺乏所述细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)。

79.根据陈述23或57至59中任一项的方法，其中如果鉴别出SEQ ID NO:2或包含与SEQ ID NO:2所示序列具有至少80％、优选至少85％、更优选至少90％、最优选至少95％相同性的序列的多核酸，则所述玉米植物或植物部分被鉴定为在3号染色体上缺乏所述细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)。

80.一种(分离的)多核酸，其具有SEQ ID NO:1、5、9或13中任一所示序列或其(独特的)片段，或者包含与SEQ ID NO:1、5、9和13中任一个或多个序列具有至少80％、优选至少85％、更优选至少90％、最优选至少95％相同性的序列的多核酸；或具有SEQ ID NO:2、6、10和14中的一个或多个序列或其(独特的)片段，或包含与SEQ ID NO:2、6、10和14中任一个或多个序列或其(独特的)片段具有至少80％、优选至少85％、更优选至少90％、最优选至少95％相同性的序列的多核酸。

81.一种(分离的)多核酸，

Zm00001d043358

Zm00001d043352

Zm00001d043356

编码具有SEQ ID NO:206或12的序列的蛋白质，或具有与SEQ ID NO:206或12的序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列的蛋白质；或者

Zm00001d043357

编码具有SEQ ID NO:208或16的序列的蛋白质，或具有与SEQ ID NO:208或16的序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列的蛋白质。

82.根据陈述80或81的多核酸，其中与所述SEQ ID NO具有至少80％、优选至少85％、更优选至少90％、最优选至少95％相同性的序列包含表5中列出的一种或多种、优选全部各自相关的(恢复基因)多态性。

83.根据陈述80或81任一项的多核酸，其中与所述SEQ ID NO具有至少80％、优选至少85％、更优选至少90％、最优选至少95％相同性的序列包含表5中列出的一种或多种、优选全部各自相关的(保持基因)多态性。

84.根据陈述44至54的方法，包括向所述植物或植物部分的基因组中引入根据陈述1至17中任一项定义的基因座或根据陈述80至83中任一项定义的多核酸，或其(功能)其片段。

85.根据陈述44至54或84中任一项的方法，其中所述多核酸是两侧是分子标记ma0016fm86和ma0004tr23的基因组多核酸。

86.根据陈述44至54或84的方法，其中所述多核酸是两侧是分子标记ma0000sa77和ma0016fu05的基因组多核酸。

87.根据陈述44至54或84至86中任一项的方法，其中所述基因座或多核酸包含表5的保持基因多态性。

88.根据陈述44至54或84至87中任一项的方法，其中所述基因座或多核酸包含表4的保持基因多态性。

89.根据陈述44至54或84至86中任一项的方法，其中所述基因座或多核酸包含表5的恢复基因多态性。

90.根据陈述44至54或84至86或89中任一项的方法，其中所述基因座或多核酸包含表4的恢复基因多态性。

91.根据陈述44至54或84至90中任一项的方法，包括使第一玉米植物与第二玉米植物杂交，并选择包含根据前述陈述中任一项定义的基因座或多核酸的后代。

92.根据陈述91的方法，包括选择不包含恢复基因座或多核酸的后代，所述基因座或多核酸包含如任何陈述定义的恢复基因多态性或SNP。

93.根据陈述91或92的方法，其中所述第一或第二玉米植物是细胞质雄性不育玉米植物。

94.根据陈述25至42或80至83中任一项的多核酸在鉴定玉米植物或植物部分或产生玉米植物或植物部分中的用途。

95.根据权利要求25至42或80至83中任一项的多核酸在鉴定玉米植物或植物部分中的用途。

96.根据权利要求80至83中任一项的多核酸在产生玉米植物或植物部分中的用途。

附图简述

图1：基于Illumina Chip数据(35K)使用rf4品系进行GWAS分析。

图2：参考B73基因组的Zm00001d043358(SEQ ID NO:2)与本发明实施方案的Zm00001d043358(SEQ ID NO:1)的基因组序列的序列比对。

图3：参考B73基因组的Zm00001d043352(SEQ ID NO:6)与本发明的实施方案的Zm00001d043352(SEQ ID NO:5)的基因组序列的序列比对。

图4：参考B73基因组的Zm00001d043356(SEQ ID NO:10)与本发明实施方案的Zm00001d043356(SEQ ID NO:9)的基因组序列的序列比对。

图5：参考B73基因组的Zm00001d043357(SEQ ID NO:14)与本发明实施方案的Zm00001d043357(SEQ ID NO:13)的基因组序列的序列比对。

发明详述

在描述本发明的系统和方法之前，应当理解，本发明不限于所描述的特定系统和方法或组合，因为这样的系统和方法及组合当然可以变化。还应当理解，本文所使用的术语并不旨在进行限制，因为本发明的范围将仅由所附权利要求来限制。

如本文所用，单数形式“一”、“一个”和“所述”包括单数和复数指代对象，除非上下文另外明确指出。

本文使用的术语“包含”和“由…组成”与“包括”或“含有”同义，并且是广义包含或开放式的，且不排除另外的、未列举的成员、元件或方法步骤。应当理解，本文使用的术语“包含”和“由...组成”包括术语“由.....组成”，以及术语“基本上由...组成”。

通过端点列举的数值范围包括纳入在各个范围内的所有数字和分数，以及所列举的端点。

如本文所用，术语“约”或“大约”当指可测量值例如参数、量、持续时间等时，意在涵盖指定值+/-20％或更少的变化，优选+/-10％或更小，更优选+/-5％或更小，并且还更优选+/-1％或更小，只要这样的变化适合在公开的本发明中执行即可。应当理解，修饰语“约”或“大约”所指的值本身也是具体且优选地公开的。

尽管术语“一个或多个”或“至少一个”，例如一组成员中的一个或多个或至少一个成员，本身是清楚的，但通过进一步的示例，该术语尤其涵盖所述成员中的任一个、或所述成员中的任两个或更多个，例如任意≥3、≥4、≥5、≥6或≥7个等所述成员，并且直至所有所述成员。

本说明书中引用的所有参考文献均通过引用整体并入本文。特别地，本文特别提及的所有参考文献的教导均通过引用并入。

除非另有定义，公开本发明时使用的所有术语，包括技术和科学术语，具有本发明所属领域的普通技术人员通常理解的含义。通过进一步的指导，本文包括术语定义以更好地理解本发明的教导。

阐述重组DNA技术一般原理的标准参考书包括：Molecular Cloning:ALaboratory Manual,2nd ed.,vol.1-3,ed.Sambrook et al.,Cold Spring HarborLaboratory Press,Cold Spring Harbor,N.Y.,1989；Current Protocols in MolecularBiology,ed.Ausubel et al.,Greene Publishing and Wiley-Interscience,New York,1992(定期更新)(“Ausubel et al.1992”)；the series Methods in Enzymology(Academic Press,Inc.)；Innis et al.,PCR Protocols:A Guide to Methods andApplications,Academic Press:San Diego,1990；PCR 2:A Practical Approach(M.J.MacPherson,B.D.Hames and G.R.Taylor eds.(1995)；Harlow and Lane,eds.(1988)Antibodies,a Laboratory Manual；及Animal Cell Culture(R.I.Freshney,ed.(1987)。微生物学的一般原理阐述于例如Davis,B.D.et al.,Microbiology,3rd edition,Harper&Row,publishers,Philadelphia,Pa.(1980)。

在以下段落中，更详细地定义了本发明的不同方面。如此定义的每个方面可以与任何其它一个或多个方面组合，除非清楚地表明相反。具体地，被指示为优选或有利的任何特征均可以与被指示为优选或有利的任何其它特征组合。

在整个说明书中提及“一个实施方案”或“实施方案”意味着结合该实施方案描述的特定特征、结构或特性被包括在本发明的至少一个实施方案中。因此，在整个说明书的各个地方出现的短语“在一个实施例方案”或“在实施方案中”不一定都指代相同的实施方案，而是可以指代相同的实施方案。此外，在一个或多个实施方案中，如本领域技术人员根据本公开将显而易见的，可以以任何合适的方式组合所述特定特征、结构或特性。此外，如本领域技术人员将理解的，虽然本文描述的一些实施方案包括其它实施方案中包括的一些但非其它特征，但是不同实施方案的特征的组合意味着在本发明的范围内，并且构成不同的实施方案。例如，在所附权利要求中，任何要求保护的实施方案均可以以任何组合使用。

在本发明的以下详细描述中，参考了构成本发明一部分的附图，并且附图中仅以示例的方式示出了可以实践本发明的具体实施方案。应当理解，在不脱离本发明的范围的情况下，可以利用其它实施方案并且可以进行结构或逻辑改变。因此，下面的详细描述不应被视为限制意义，并且本发明的范围由所附权利要求限定。

本发明的优选陈述(特征)和实施方案如下所述。如此定义的本发明的每个陈述和实施方案可以与任何其它陈述和/或实施方案组合，除非清楚地表明相反。具体地，被指示为优选或有利的任何特征可以与被指示为优选或有利的任何其它特征或陈述组合。

术语“植物”包括整个植物，包括其后代或子代。除非另有明确说明，否则本文所用的术语“植物”意指处于任何发育阶段的植物。术语“植物部分”包括植物的任何部分或衍生物，包括特定的植物组织或结构、植物细胞、植物原生质体、从中可以再生植物的植物细胞或组织培养物、植物愈伤组织、完整地存在于植物或植物部分中的植物丛(plant clumps)和植物细胞，例如种子、籽粒、穗轴、花、子叶、叶、茎、芽、根、根尖、秸秆等。植物部分可以包括加工的植物部分或衍生物，包括花、油、提取物等。“植物部分”例如是发芽营养器官/结构，例如叶、茎和块茎；根、花和花器官/结构，例如苞片、萼片、花瓣、雄蕊、心皮、花药和胚珠；种子，包括胚、胚乳和种皮；果实和成熟的子房；植物组织，例如维管组织、基本组织等；和细胞，例如保卫细胞、卵细胞、花粉、腺毛等；及其后代。植物部分可以附着在完整的植物上，也可以与完整的植物分开。此类植物部分包括但不限于植物的器官、组织和细胞，并且优选种子。“植物细胞”是植物的结构和生理单位，包含原生质体和细胞壁。植物细胞可以是分离的单细胞或培养细胞的形式，或者作为高级组构单位例如植物组织、植物器官或整个植物的一部分。“植物细胞培养物”是指植物单位的培养物，例如原生质体、细胞培养的细胞、植物组织中的细胞、花粉、花粉管、胚珠、胚囊、合子和处于不同发育阶段的胚。“植物材料”是指叶、茎、根、花或花部分、果实、花粉、卵细胞、合子、种子、插条、细胞或组织培养物，或植物的任何其它部分或产品，包括粗粉。这还包括愈伤组织或愈伤组织组织以及提取物(例如来自主根的提取物)或样品。“植物器官”是植物的独特且明显结构化和分化的部分，例如根、茎、叶、花芽或胚。如本文所用，“植物组织”是指组构成结构和功能单元的一组植物细胞。包括在植物学或培养物中的任何植物组织。这个术语包括但不限于整个植物、植物器官、植物种子、组织培养物和组构成结构和/或功能单元的任何植物细胞群。这个术语与如上列出的或这个定义以其它方式包含的任何特定类型的植物组织联合使用或不存在后者的情况下的使用并不旨在排除任何其它类型的植物组织。

在某些实施方案中，植物部分或衍生物是或包含(功能性)繁殖材料，例如种质、种子或植物胚或可以再生植物的其它材料。在某些实施方案中，植物部分或衍生物不是(功能性)繁殖材料，例如种质、种子或植物胚或从中可以再生植物的其它材料。在某些实施方案中，植物部分或衍生物不包含(功能性)雄性和雌性生殖器官。在某些实施方案中，植物部分或衍生物是或包含繁殖材料，但繁殖材料不是或不能(不再)用于产生或生成新植物，例如已经通过化学、机械或其它方式使其非功能性的繁殖材料，例如通过热处理、酸处理、压实、压碎、切碎等。

如本文所用，术语“后代”和“后代植物”是指由一种或多种亲本植物有性繁殖产生的植物。后代植物可以通过单个亲本植物自交或通过使两个亲本植物杂交来获得。例如，后代植物可以通过亲本植物自交或通过两个亲本植物杂交获得，并且包括自交以及F1或F2或更进一步的世代。F1是由亲本产生的第一代后代，其中至少一个亲本首次用作性状的供体，而第二代(F2)或后续世代(F3、F4等)的后代是通过F1、F2等的自交、互交、回交和/或其它杂交产生的。因此，F1可以是(并且在一些实施方案中是)由两个真正育种亲本之间杂交产生的杂交体(即，真正育种的亲本对于感兴趣的性状或其等位基因均是纯合的)，而F2可以是(并且在一些实施例中是)F1杂交体自花授粉产生的后代。术语“后代”在某些实施方案中可以与“子代”互换使用，特别是当植物或植物材料源自亲本植物的有性杂交时。根据本发明，后代优选是指F1后代。

如本文所用，不同时态的术语“杂交”均意指配子通过授粉融合以产生后代(即细胞、种子或植物)。该术语涵盖有性杂交(一种植物通过另一种植物授粉)和自体受精(自交、自花授粉，即当花粉和胚珠(或小孢子和大孢子)来自同一植物或遗传相同的植物时)。优选地，本文所指的杂交是一种植物由另一种植物的受精，即非自花授粉。

如本文所用，术语植物群可以与植物的群体互换使用。植物群优选包含大量个体植物，例如优选至少10个，例如20、30、40、50、60、70、80或90个，更优选至少100个，例如200、300、400个、500、600、700、800或900，甚至更优选至少1000，例如至少10000或至少100000个植物。

如本文所用，术语“表型”、“表型性状”或“性状”是指植物或植物细胞的一种或多种性状。所述表型可以用肉眼观察，或通过本领域已知的任何其它评估方式观察，例如通过显微镜、生化分析或机电设备测定。在某些情况下，表型直接由单个基因或遗传基因座控制(即对应于“单基因性状”)。在单倍体诱导的情况下，使用颜色标记，例如R Navajo，以及其它标记，包括通过种子内颜色的存在或不存在而观察的转基因，通过证据表明种子是否是诱导的单倍体种子。R Navajo作为颜色标记的使用和转基因的使用是本领域众所周知的检测雌性植物上单倍体种子的诱导的手段。在其它情况下，表型是几个基因之间相互作用的结果，在一些实施方案中，这也是植物和/或植物细胞与其环境相互作用的结果。

如本文所用，“玉米”是指玉米(Zea mays)物种的植物，优选栽培玉米亚种(Zeamays ssp mays)。

如本文所用，术语“雄性不育”植物(品系、栽培品种或变种)具有其在本领域中的普通含义。作为进一步指导，且不限于此，该术语是指不能作为花粉供体产生后代的植物，并且可能是由于无法产生(功能性)花药、花粉或配子而导致的。细胞质雄性不育植物具有细胞质基因，通常位于线粒体中，编码破坏或阻止花粉发育的因子，使其为雄性不育，雄性不育性通过母系遗传。利用细胞质雄性不育来生产杂交种子通常需要三个单独的植物系：雄性不育系、用于繁殖的同基因雄性可育系(“保持系”)以及恢复杂交体育性的品系，由此其可以产生种子(“恢复系”)。所述雄性不育系在杂交中用作受体亲本，保持系在遗传上与所述雄性不育系相同，只是其没有细胞质不育因子，而恢复系是掩盖细胞质不育因子的任何品系。所述恢复系对于那些植物非常重要，例如高粱或棉花，其有用作物是种子本身或种子相关结构。遗传雄性不育与细胞质雄性不育相似，但不同之处在于不育因子编码在核DNA中。通常，遗传雄性不育是指植物遗传结构的变化，导致其产生和/或传播有活力的花粉的能力。遗传雄性不育植物系可以自然发生。也可以使用重组技术创建雄性不育植物系。无论是天然存在的还是转基因产生的，雄性不育系仍然需要使用姐妹保持系进行繁殖，这必然导致繁殖种子中至少有50％的雄性可育植物。这是雄性不育系和保持系的遗传结果。如果雄性不育因子是隐性的，就像大多数一样，雄性不育植物必须是纯合隐性的才能显示出性状。优选地，根据本发明，雄性不育是指遗传雄性不育。优选地，根据本发明，雄性不育不是或不涵盖细胞质雄性不育。

优选地，根据本发明，本文提及的CMS是CMS-C(或C型CMS)，但也设想其它类型的CMS，包括CMS-T和CMS-S。

如本文所用，术语“恢复基因(restorer)”或“育性恢复基因”是指恢复CMS植物育性的基因。术语“恢复系(restorer)”还可以指携带恢复基因的植物或品系。通过扩展，术语恢复基因可应用于恢复基因座(等位基因)、单倍型或基因型，意指携带恢复基因或负责恢复基因表型的基因座(等位基因)、单倍型或基因型。根据本发明，恢复基因、基因座(等位基因)、单倍型、基因型或表型与本文别处所述的本发明的多态性(等位基因)、多核酸或标记相关/连锁。因此，恢复基因座(等位基因)或育性恢复基因座(等位基因)是指携带恢复基因的基因组区间，其特征在于存在如本文所述的一种或多种多态性(等位基因)、多核酸或分子标记。根据本发明，恢复基因不(只)是或不(只)包含Rf4。

本发明的任一种或多种标记(等位基因)的组合可以称为本发明的标记单倍型。

如本文所用，术语“保持基因/保持系(maintainer)”可相同地用于雄性可育以及(等基因)雄性不育系，因此指这样的植物(或品系)，所述植物或品系确实不具有恢复基因表型和/或包含恢复基因表型、单倍型或基因座(等位基因)(均为杂合或纯合的)，与术语“恢复基因/恢复系”相反，“恢复基因/恢复系”确实具有恢复基因表型和/或包含恢复基因型、单倍型或(等位基因)(均为杂合或纯合的)，优选本发明的恢复基因表型、基因型、单倍型或基因座(等位基因)。因此，术语“保持基因/保持系”可以同等地用于严格意义上的保持基因系，即用于“保持”CMS系的CMS系的等基因可育对应物，以及CMS系本身。在某些实施方案中，保持基因/保持系不具有恢复基因表型和/或包含本发明的恢复基因基因型、单倍型或基因座(等位基因)，例如本发明的任一种或多种分子标记(等位基因)，特别是与本发明的恢复基因表型、基因型、单倍型或基因座(等位基因)相关/连锁的分子标记(等位基因)，其可以是纯合的或杂合的。在某些实施方案中，保持基因/保持系具有与所述恢复基因表型不同的恢复基因表型和/或包含所述恢复基因表型之外的恢复基因基因型、单倍型或基因座(等位基因)和/或包含本发明的恢复基因基因型、单倍型或基因座(等位基因)，例如Rf4，其可以是纯合的或杂合的。

术语“基因座”(及复数形式基因座)是指染色体上的一个或多个特定位置或位点，其中发现了例如QTL/单倍型、基因或遗传标记。如本文所用，术语“数量性状基因座”或“QTL”具有本领域已知的普通含义。通过进一步指导，且不限于此，QTL可以指与至少一种遗传背景中(例如，至少一种育种群体中)数量表型性状的差异表达相关的DNA区域。QTL区域涵盖或与影响相关性状的一个或多个基因紧密连锁。

如本文所用，术语“等位基因”或“多个等位基因”是指基因座的一种或多种替代形式，即基因座的不同核苷酸序列。

“基因座的等位基因”可以包含连续基因组区域或连锁群内的多个基因或其它遗传因子，例如单倍型。基因座的等位基因可以表示指定窗口内的单倍型，其中所述窗口是可以用一组一个或多个多态性标记来定义和追踪的连续基因组区域。单倍型可以通过指定窗口内每个标记处的等位基因的独特指纹来定义。基因座可以编码影响连续分布(定量)表型的表达性的一个或多个等位基因。在某些实施方案中，本文所述的基因座、等位基因、多核酸或分子标记(等位基因)可以是纯合的。在某些实施方案中，本文所述的基因座、等位基因、多核酸或分子标记(等位基因)可以是杂合的。

如本文所用，术语“突变等位基因”或等位基因的“突变”包括具有一个或多个突变的等位基因，所述突变例如插入、缺失、终止密码子、碱基改变(例如，转换或颠换)或剪接点的改变，其可能会也可能不会产生改变的基因产物。等位基因的修饰可能发生在编码区或非编码区(例如启动子区、外显子、内含子或剪接点)。

“标记”是在遗传或物理图谱(上寻找位置的手段)，或者标记和性状基因座(影响性状的基因座)之间的联系。标记检测的位置可以通过检测多态性等位基因及其遗传作图或者通过杂交、序列匹配或已经物理作图的序列的扩增而获知。标记可以是DNA标记(检测DNA多态性)、蛋白质(检测编码的多肽的变异)或简单的遗传表型(例如“waxy”表型)。DNA标记可以从基因组核苷酸序列或表达的核苷酸序列(例如，从剪接的RNA或cDNA)中开发。根据DNA标记技术，标记可由基因座侧翼的互补引物和/或与基因座处的多态性等位基因杂交的互补探针组成。术语标记基因座是所述标记检测的基因座(基因、序列或核苷酸)。“标记”或“分子标记”或“标记基因座”也可用于表示足够独特以表征基因组上的特定基因座的核酸或氨基酸序列。任何可检测的多态性性状都可以用作标记，只要它是差异遗传的并且与感兴趣的表型性状表现出连锁不平衡即可。

检测群成员之间遗传多态性的标记在本领域中是充分确立的。标记可以通过其检测的多态性类型以及用于检测多态性的标记技术来定义。标记类型包括但不限于例如检测限制性片段长度多态性(RFLP)、检测同工酶标记、随机扩增多态性DNA(RAPD)、扩增片段长度多态性(AFLP)、检测简单序列重复(SSR)，检测植物基因组的扩增可变序列，检测自我维持的序列复制，或检测单核苷酸多态性(SNP)。SNP可以通过以下方式被检测，例如DNA测序、基于PCR的序列特异性扩增方法、通过等位基因特异性杂交(ASH)检测多核苷酸多态性、动态等位基因特异性杂交(DASH)、分子信标、微阵列杂交、寡核苷酸连接酶测定、Flap核酸内切酶、5’核酸内切酶、引物延伸、单链构象多态性(SSCP)或温度梯度凝胶电泳(TGGE)。DNA测序，例如焦磷酸测序技术，其优点是能够检测构成单倍型的一系列连锁的SNP等位基因。单倍型往往比SNP提供更多信息(检测更高水平的多态性)。

“标记等位基因”，或者“标记基因座的等位基因”，可以指在群体的标记基因座处发现的多个多态性核苷酸序列之一。对于SNP标记，等位基因是指该个体植物中该SNP基因座处存在的特定核苷酸碱基。

“精细作图”是指可以更准确地确定(缩小范围)基因组区域(例如QTL)的位置并且减小包含QTL的基因渗入片段的大小的方法。例如，可以制备QTL或单倍型的近等基因系(QTL/单倍型-NIL)，其在轮回亲本的统一遗传背景内含有不同的、重叠的基因渗入片段。然后可以使用这样的品系来作图QTL/单倍型位于哪个片段上并鉴定具有包含QTL/单倍型的较短基因渗入片段的品系。

“标记辅助选择”(MAS)是根据标记基因型选择个体植物的方法。“标记辅助反选择”是利用标记基因型来鉴定不会被选择的植物的方法，从而使所述植物能够从育种计划或种植中去除。标记辅助选择利用与特定基因座或特定染色体区域(例如基因渗入片段、转基因、多态性、突变等)遗传连锁的分子标记的存在来选择存在特定基因座或区域(基因渗入片段、转基因、多态性、突变等)的植物。例如，与本文定义的基因组区域(例如单倍型)或基因(例如赋予病原体抗性的RLKl等位基因)遗传连锁的分子标记可用于检测和/或选择在染色体8上包含HT2/HT3的植物。分子标记与所述基因座的遗传连锁越紧密(例如约7cM、6cM、5cM、4cM、3cM、2cM、1cM、0.5cM或更小)，则标记通过减数分裂重组从基因座解离的可能性越小。同样，两个标记彼此连锁越紧密(例如，7或5cM、4cM、3cM、2cM、1cM或更小)，则这两个标记彼此分离的可能性就越小(并且其作为一个单元共同隔离的可能性就越大)。与另一标记在“7cM或5cM、3cM、2cM或1cM内”的标记是指遗传作图于在所述标记两侧(即所述标记的任一侧)7cM或5cM、3cM、2cM或1cM区域内的标记。类似地，在另一标记的5Mb、3Mb、2.5Mb、2Mb、1Mb、0.5Mb、0.4Mb、0.3Mb、0.2Mb、0.1Mb、50kb、20kb、10kb、5kb、2kb、1kb或更小范围内的标记是指物理上位于所述标记两侧(即所述标记的任一侧)基因组DNA区域的5Mb、3Mb、2.5Mb、2Mb、1Mb、0.5Mb、0.4Mb、0.3Mb、0.2Mb、0.1Mb、50kb、20kb、10kb、5kb、2kb、1kb或更小范围内的标记。“LOD-分数”(几率的对数(以10为底))是指常用于动物和植物种群连锁分析的统计检验。LOD分数将两个基因座(分子标记基因座和/或表型性状基因座)确实连锁时获得测试数据的可能性与纯粹偶然观察到相同数据的可能性进行比较。正LOD分数有利于连锁的存在，并且LOD分数大于3.0被认为是连锁的证据。LOD分数为+3表示所观察到的连锁并非偶然发生的可能性为1000比1。

“标记单倍型”是指(标记)基因座处的(标记)等位基因的组合。

“标记基因座”是物种基因组中可以发现特定标记的特定染色体位置。标记基因座可用于追踪第二连锁基因座的存在，例如影响表型性状表达的基因座。例如，标记基因座可用于监测遗传或物理连锁基因座处等位基因的分离。

“标记探针”是可用于通过核酸杂交鉴定标记基因座的存在的核酸序列或分子，例如与标记基因座序列互补的核酸探针。包含标记基因座的30个或更多个连续核苷酸(标记基因座序列的“全部或部分”)的标记探针可用于核酸杂交。或者，在一些方面，标记探针是指能够区分(即，基因分型)标记基因座处存在的特定等位基因的任何类型的探针。

术语“分子标记”可用于指在鉴定连锁基因座时用作参考点的遗传标记或其编码产物(例如蛋白质)。标记可以源自基因组核苷酸序列或表达的核苷酸序列(例如，源自剪接的RNA、cDNA等)，或者源自编码的多肽。该术语还指与标记序列互补或位于标记序列侧翼的核酸序列，例如用作能够扩增标记序列的探针或引物对的核酸。“分子标记探针”是可用于鉴定标记基因座的存在的核酸序列或分子，例如与标记基因座序列互补的核酸探针。或者，在一些方面，标记探针是指能够区分(即，基因分型)标记基因座处存在的特定等位基因的任何类型的探针。当核酸在溶液中特异性杂交时，例如根据Watson-Crick碱基配对规则，则其是“互补的”。当位于插入缺失区域(例如本文描述的非共线区域)时，本文描述的一些标记也称为杂交标记。这是因为根据定义，插入区域是相对于没有插入的植物的多态性。因此，标记仅需要指示插入缺失区域是否存在。可以使用任何合适的标记检测技术来鉴定这样的杂交标记，例如本文提供的实施例中使用的SNP技术。

“遗传标记”是种群中多态性的核酸，并且其中其等位基因可以通过一种或多种分析方法例如RFLP、AFLP、同工酶、SNP、SSR等来检测和区分。术语“分子标记”和“遗传标记”在本文中可互换使用。该术语还指与基因组序列互补的核酸序列，例如用作探针的核酸。对应于种群成员之间的遗传多态性的标记可以通过本领域充分确立的方法来检测。这些方法包括例如基于PCR的序列特异性扩增方法、限制性片段长度多态性(RFLP)的检测、同工酶标记的检测、通过等位基因特异性杂交(ASH)检测多核苷酸多态性、植物基因组的扩增可变序列的检测、自我持续的序列复制的检测、简单序列重复(SSR)的检测、单核苷酸多态性(SNP)检测或扩增片段长度多态性(AFLP)检测。用于检测表达序列标签(EST)和源自EST序列的SSR标记和随机扩增的多态性DNA(RAPD)的充分确立的方法也是已知的。

如本文所提及的，如果本文描述的本发明的多核酸包含在其中第一标记(等位基因)位于所述多核酸上游(即5’)及和第二标记(等位基因)位于所述多核酸的下游(即3’)的多核酸内，则称本发明的多核酸两侧是某些分子标记或分子标记等位基因。这样的第一和第二标记(等位基因)可以与多核酸毗邻。核酸可以同等地包含这样的第一和第二标记(等位基因)，例如分别在5’和3’末端处或附近，例如分别在5’和3’末端的50kb内，优选在5’和3’末端的10kb内，例如5’和3’端的5kb内、5’和3’端的1kb内或更少。

“多态性”是种群内两个或多个个体之间DNA的变异。多态性优选在种群中具有至少1％的频率。有用的多态性可包括单核苷酸多态性(SNP)、简单序列重复(SSR)或插入/缺失多态性，在本文中也称为“插入缺失”。术语“插入/缺失”是指插入或缺失，其中一个品系可以被称为相对于第二个品系具有插入的核苷酸或DNA片段，或者第二个品系可以被称为相对于第一个品系具有缺失的核苷酸或DNA片段。

同一染色体上的基因座之间(例如分子标记之间和/或表型标记之间)的“物理距离”是以碱基或碱基对(bp)、千碱基或千碱基对(kb)或兆碱基或兆碱基对(Mb)表示的实际物理距离。

同一染色体上的基因座之间(例如分子标记之间和/或表型标记之间)的“遗传距离”通过交换频率或重组频率(RF)来测量，并以厘摩(cM)表示。1cM对应于1％的重组频率。如果发现无重组，则RF为零，并且基因座要么在物理上极其接近，要么完全相同。两个基因座相距越远，RF越高。

基因组的“物理作图”是显示染色体DNA上可识别标志(包括基因、标记等)的线性顺序的图。然而，与遗传作图相反，地标之间的距离是绝对的(例如，以碱基对或分离的且重叠的连续遗传片段来测量)，而不是基于遗传重组(在不同种群体可能有所不同)。

当等位基因与性状连锁时，并且当等位基因的存在指示在包含该等位基因的植物中不会出现期望的性状或性状形式时，所述等位基因与性状“负”相关。当等位基因与性状连锁并且当等位基因的存在指示包含该等位基因的植物中将出现所需性状或性状形式时，所述等位基因与性状“正”相关。

厘摩(“cM”)是重组频率的测量单位。1cM等于在一个遗传基因座处的标记因单代中的交换而与第二基因座处的标记分离的1％几率。

如本文所用，术语“染色体间隔”指驻留在植物中单个染色体上的基因组DNA的连续线性跨度。位于单个染色体间隔上的遗传元件或基因是物理连锁的。染色体间隔的大小没有特别限制。在一些方面，位于单个染色体间隔内的遗传元件是遗传连锁的，通常具有例如小于或等于20cM、或者小于或等于10cM的遗传重组距离。也就是说，单个染色体间隔内的两个遗传元件以小于或等于20％或10％的频率进行重组。

在本申请中，术语“紧密连锁”是指两个连锁基因座之间的重组以等于或小于约10％的频率发生(即，在遗传图谱上相隔不超过10cM)。换句话说，紧密连锁的基因座在至少90％的情况下是共分离的。当标记基因座表现出与所需性状(例如，灰斑病抗性)共分离(连锁)的显著概率时，对于本公开的主题特别有用。紧密连锁的基因座例如标记基因座和第二基因座可表现出10％或更低、优选约9％或更低、还更优选约8％或更低、还更优选约7％或更低、更优选约6％或更低、进一步优选约5％或更低、进一步优选约4％或更低、进一步优选约3％或更低、进一步优选约2％或更低的基因座间重组频率。在高度优选的实施方案中，相关基因座显示重组频率为约1％或更低，例如约0.75％或更低，更优选约0.5％或更低，或者还更优选约0.25％或更低。位于同一染色体上的两个基因座，并且距离使得两个基因座之间发生重组的频率小于10％(例如，约9％、8％、7％、6％、5％、4％、3％、2％、1％、0.75％、0.5％、0.25％或更少)也被称为彼此“接近”。在某些情况下，两个不同的标记可以具有相同的遗传图谱坐标。在这种情况下，两个标记彼此非常接近，以至于它们之间发生重组的频率非常低，以至于无法检测到。

“连锁”是指如果等位基因的传递是独立的，则等位基因比预期更频繁地一起分离的趋势。通常，连锁是指同一染色体上的等位基因。基因重组在整个基因组中以假定的随机频率发生。遗传图谱是通过测量成对的性状或标记之间的重组频率来构建的。染色体上的性状或标记彼此越接近，则重组频率越低，连锁程度越大。如果性状或标记通常共分离，则在本文中认为它们是连锁的。每代1/100的重组概率定义为遗传图谱距离为1.0厘摩(1.0cM)。术语“连锁不平衡”是指遗传基因座或性状(或两者)的非随机分离。在任一情况下，连锁不平衡意味着相关基因座沿着染色体长度具有足够的物理接近度，使得它们以大于随机(即非随机)频率一起分离。显示连锁不平衡的标记被认为是连锁的。连锁基因座在超过50％的机会、例如约51％至约100％的机会共分离。换句话说，共分离的两个标记具有小于50％的重组频率(并且根据定义，在同一连锁群上相隔小于50cM)。如本文所用，连锁可以在两个标记之间，或者在标记和影响表型的基因座之间。标记基因座可以与性状“关联”(连锁)。测量标记基因座和影响表型性状的基因座的连锁程度，例如作为该分子标记与表型共分离的统计概率(例如，F统计量或LOD评分)。

位于单个染色体节段上的遗传元件或基因是物理连锁的。在一些实施方案中，两个基因座非常接近，使得在减数分裂期间两个基因座之间不会以高频率发生同源染色体对之间的重组，例如使得连锁基因座有至少约90％的机会共分离，例如91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％、99.75％或更多机会。位于染色体区段内的遗传元件也是“遗传连锁的”，通常在小于或等于50cM的遗传重组距离内，例如约49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、0.75、0.5、0.25cM或更小。也就是说，单个染色体节段内的两个遗传元件在减数分裂期间以小于或等于约50％的频率彼此经历重组，例如约49％、48％、47％、46％、45％、44％、43％、42％、41％、40％、39％、38％、37％、36％、35％、34％、33％、32％、31％、30％、29％、28％、27％、26％、25％、24％、23％、22％、21％、20％、19％、18％、17％、16％、15％、14％、13％、12％、11％、10％、9％、8％、7％、6％、5％、4％、3％、2％、1％、0.75％、0.5％、0.25％或更低。“紧密连锁的”标记显示与给定标记的交换频率为约10％或更低，例如9％、8％、7％、6％、5％、4％、3％、2％、1％、0.75％、0.5％、0.25％或更低(给定的标记基因座在紧密连锁的标记基因座的约10cM内，例如紧密连锁的标记基因组的9、8、7、6、5、4、3、2、1、0.75、0.5、0.25cM或更低)。换句话说，紧密连锁的标记基因座以至少约90％的机会共分离，例如91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％、99.75％或更多机会。

如本文所用，不同语法时态的术语“基因渗入”是指天然和人工过程，借此通过杂交这些物种将一个物种、品种或栽培品种的染色体片段或基因移入另一物种、品种或栽培品种的基因组中。该过程可以任选通过与轮回亲本回交来完成。例如，所需等位基因在特定基因座的渗入可通过同一物种的两个亲本之间的有性杂交传递至至少一个后代，其中至少一个亲本在其基因组中具有所需等位基因。或者，例如，等位基因的传递可以通过两个供体基因组之间的重组而发生，例如在融合的原生质体中，其中至少一个供体原生质体在其基因组中具有所需的等位基因。所需等位基因可以例如通过与表型、单倍型、QTL、转基因等相关的标记来检测。在任何情况下，包含所需等位基因的后代可以与具有所需遗传背景的品系重复回交并选择所需等位基因，以导致等位基因固定在选定的遗传背景中。当“基因渗入”过程重复两次或更多次时，“基因渗入”过程通常被称为“回交”。“基因渗入片段”或“基因渗入节段”或“基因渗入区域”是指已人工或自然地例如通过杂交或传统育种技术例如回交引入相同或相关物种的另一植物中的染色体片段(或染色体部分或区域)，即基因渗入片段是通过动词“基因渗入”(例如回交)的育种方法的结果。应当理解，术语“基因渗入片段”从不包括整个染色体，而仅包括染色体的一部分。基因渗入片段可以较大，例如甚至染色体的四分之三或一半，但优选较小，例如约15Mb或更小，例如约10Mb或更小、约9Mb或更小、约8Mb或更小、约7Mb或更小、约6Mb或更小、约5Mb或更小、约4Mb或更小、约3Mb或更小、约2.5Mb或2Mb或更小、约1Mb(等于1,000,000个碱基对)或更小、或约0.5Mb(等于500,000个碱基对)或更小，例如约200,000bp(等于200kbp)或更小、约100,000bp(100kb)或更少、约50,000bp(50kb)或更小、约25,000bp(25kb)或更小。

如果遗传元件、基因渗入片段、或赋予性状的基因或等位基因可以使用传统育种技术而被从其存在的植物转移到不存在其的另一种植物(例如品系或品种)中而不会导致受体植物除了添加由所述遗传元件、基因座、基因渗入片段、基因或等位基因赋予的性状之外的表型改变，则所述遗传元件、基因渗入片段、或赋予性状的基因或等位基因被认为是“可得自”或可“得自”或“可衍生自”或可“衍生自”或“存在于”或“发现于”如本文别处描述的植物或植物部分中。这些术语可互换使用，并且遗传元件、基因座、基因渗入片段、基因或等位基因因此可以转移到缺乏该性状的任何其它遗传背景中。不仅可以使用包含所述遗传元件、基因座、基因渗入片段、基因或等位基因的植物，而且可以使用已选择保留所述遗传元件、基因座、基因渗入片段、基因或等位基因的此类植物的后代/子代，这些后代涵盖在本文中。植物(或植物的基因组DNA、细胞或组织)是否包含可得自此类植物的相同的遗传元件、基因座、基因渗入片段、基因或等位基因可以由技术人员使用本领域已知的一种或多种技术来确定，例如表型测定、全基因组测序、分子标记分析、性状作图、染色体涂染、等位性检验等，或这些技术的组合。应当理解，还可以涵盖转基因植物。

在某些实施方案中，所述多核酸是通过重组或转基因方式引入(及基因组整合)的。所述多核酸可以被引入(及基因组整合)在天然基因座处，以置换内源多核酸(例如不赋予病原体抗性的多核酸)，或者可以被引入(及基因组整合)在与内源性基因座不同的基因座处(例如通过在基因组中的随机整合)。在某些实施方案中，产生玉米植物或植物部分的方法包括用所述多核酸转化植物或植物部分，优选植物细胞，更优选原生质体，所述多核酸可以提供在载体上，如本文别处所述。在某些实施方案中，所述多核酸具有与内源多核酸(例如不赋予病原体抗性的内源多核酸)不同的序列。

如本文所用，术语“基因工程”、“转化”和“遗传修饰”在本文中均用作将分离的和克隆的基因转移至另一生物体的DNA、通常为染色体DNA或基因组中的同义词。

如本文所用，“转基因的”或“遗传修饰的生物体”(GMO)是其遗传物质已使用通常称为“重组DNA技术”的技术而被改变的生物体。重组DNA技术包括将不同来源的DNA分子离体(例如在试管中)组合成一个分子的能力。术语“转基因”在此是指通过引入非内源核酸序列进行遗传修饰。通常，将物种特异性核酸序列以某种形式、排列或数量引入细胞中所述核酸序列在细胞中非天然存在的位置。这个术语通常不涵盖其遗传组成已通过常规杂交育种或通过“诱变”育种而被改变的生物体，因为这些方法早于重组DNA技术的发现。如本文所用，“非转基因”是指植物和衍生自植物的食品不是上述定义的“转基因的”或“基因修饰的生物体”。

“转基因”或“嵌合基因”是指包含DNA序列的遗传基因座，例如重组基因，其已通过转化例如农杆菌介导的转化而被引入植物基因组中。包含稳定整合到其基因组中的转基因的植物被称为“转基因植物”。

“基因编辑”或“基因组编辑”是指在活生物体基因组中插入、缺失、修饰或置换DNA或RNA的基因工程。基因编辑可包括靶向或非靶向(随机)诱变。靶向诱变可以例如使用设计核酸酶来完成，例如使用大范围核酸酶、锌指核酸酶(ZFN)、转录激活因子样效应物核酸酶(TALEN)和规律成簇间隔短回文重复(CRISPR/Cas9)系统。这些核酸酶在基因组中的所需位置产生位点特异性双链断裂(DSB)。诱导的双链断裂通过非同源末端连接(NHEJ)或同源重组(HR)进行修复，从而产生靶向突变或核酸修饰。使用设计核酸酶特别适合产生基因敲除或敲低。在某些实施方案中，开发了设计者核酸酶，其特异性引入如本文所述的根据本发明的一种或多种分子标记(等位基因)。设计核酸酶系统的递送和表达系统是本领域众所周知的。

在某些实施方案中，核酸酶或靶向/位点特异性/归巢核酸酶是、包含、基本上由或由(修饰的)CRISPR/Cas系统或者复合的(修饰的)Cas蛋白、(修饰的)锌指、(修饰的)锌指核酸酶(ZFN)、(修饰的)转录因子样效应物(TALE)、(修饰的)转录因子样效应物核酸酶(TALEN)或(修饰的)大范围核酸酶的复合物组成。在某些实施方案中，所述(修饰的)核酸酶或靶向/位点特异性/归巢核酸酶是、包含、基本上由或由(修饰的)RNA引导的核酸酶组成。应当理解，在某些实施方案中，所述核酸酶可以针对在植物中的表达进行密码子优化。如本文所用，术语所选核酸序列的“靶向”是指核酸酶或核酸酶复合物以核苷酸序列特异性方式起作用。例如，在CRISPR/Cas系统的背景下，引导RNA能够与选择的核酸序列杂交。如本文所用，不同语法时态的“杂交”是指其中一种或多种多核苷酸反应形成通过核苷酸残基的碱基之间的氢键稳定的复合物的反应，即其中单链核酸分子将自身附着于互补的核酸链上的过程，即与这个碱基配对一致。杂交的标准程序在例如Sambrook et al.(MolecularCloning.A Laboratory Manual,Cold Spring Harbor Laboratory Press,3rd edition2001)中描述。氢键可通过Watson Crick碱基配对、Hoogstein结合或以任何其它序列特异性方式发生。所述复合物可包含形成双链体结构的两条链、形成多链复合物的三个或更多个链、单个自杂交链、或这些链的任何组合。杂交反应可以构成更广泛的过程中的一个步骤，例如PGR的启动，或多核苷酸被酶的切割。能够与给定序列杂交的序列被称为给定序列的“互补体”。优选地，这将被理解为是指所述核酸链的至少50％、更优选至少55％、60％、65％、70％、75％、80％或85％、更优选90％、91％、92％、93％、94％、95％、96％、97％、98％或99％的碱基与互补核酸链形成碱基对。这种结合的可能性取决于杂交条件的严格性。

基因编辑可涉及基因编辑组件或系统的瞬时、诱导或组成型表达。基因编辑可能涉及基因编辑组件或系统的基因组整合或附加型存在。基因编辑组件或系统可以在载体例如质粒上提供，其可以通过如本领域已知的适当递送载体被递送。优选的载体是表达载体。

基因编辑可包括提供重组模板，以实现同源定向修复(HDR)。例如，可以通过提供重组模板的基因编辑来置换遗传元件。DNA可以在需要被置换的序列的上游和下游被切割。因此，待置换的序列被从DNA中切除。通过HDR，切除的序列随后被模板置换。在某些实施方案中，本文所述的本发明的标记(等位基因)可以在模板上提供/作为模板。通过设计系统，使得双链断裂被引入不包含标记(等位基因)的植物基因组中相应区域的上游和下游，该区域被切除并且可以用包含本发明标记(等位基因)的模板置换。以这种方式，将本发明的标记(等位基因)引入植物中不需要涉及多次回交，特别是在具有特定遗传背景的植物中。类似地，本发明的多核酸可以提供在模板上/作为模板。然而，更有利地，本发明的多核酸可以在不使用重组模板的情况下产生，而是仅通过内切核酸酶作用产生双链DNA断裂，该断裂被NHEJ修复，导致所述插入缺失的产生。

在某些实施方案中，核酸修饰通过随机诱变实现。可以使细胞或生物体可以暴露于诱变剂，例如UV辐射或诱变化学品(例如甲磺酸乙酯(EMS))，然后选择具有所需特征的突变体。例如，可以通过TILLING(定向诱导基因组局部突变技术)来鉴定突变体。所述方法将诱变(例如使用甲磺酸乙酯(EMS)等化学诱变剂的诱变)与鉴定靶基因中的单碱基突变/点突变的敏感DNA筛选技术相结合。TILLING方法依赖于DNA异源双链体的形成，该异源双链体是通过PCR扩增多个等位基因，然后加热并缓慢冷却时形成的。两条DNA链错配时会形成“气泡”，其随后被单链核酸酶切割。然后根据尺寸分离产物，例如通过HPLC。也见McCallum etal.“Targeted screening for induced mutations”；Nat Biotechnol.2000Apr；18(4):455-7和McCallum et al.“Targeting induced local lesions IN genomes(TILLING)forplant functional genomics”；Plant Physiol.2000Jun；123(2):439-42。

如本文所用，术语“纯合子”是指在一个或多个或所有基因座处具有相同等位基因的个体细胞或植物。当该术语用于特定基因座或基因时，它至少意味着该基因座或基因具有相同的等位基因。如本文所用，术语“纯合”是指当相同等位基因位于同源染色体上的相应基因座时存在的遗传状况。如本文所用，术语“杂合子”是指在一个或多个或所有基因座处具有不同等位基因的个体细胞或植物。当该术语用于特定基因座或基因时，它至少意味着该基因座或基因具有不同的等位基因。如本文所用，术语“杂合”是指当不同等位基因位于同源染色体上的相应基因座时存在的遗传状况。在某些实施方案中，本文所述的单倍型和/或一种或多种标记是纯合的。在某些实施方案中，本文所述的单倍型和/或一种或多种标记是杂合的。在某些实施方案中，本文所述的单倍型等位基因和/或一种或多种标记等位基因是纯合的。在某些实施方案中，本文所述的单倍型等位基因和/或一种或多种标记等位基因是杂合的。

如本文所用，术语“序列相同性”是指任何给定核酸序列与靶核酸序列之间的相同性程度。序列相同性百分比的计算方法是确定比对的核酸序列中匹配位置的数量，将匹配位置的数量除以比对的核苷酸的总数，然后乘以100。匹配的位置是指其中在比对的核酸序列中的相同位置出现相同核苷酸的位置。还可以确定任何氨基酸序列的序列相同性百分比。为了确定序列相同性百分比，使用来自包含BLASTN和BLASTP的BLASTZ独立版本的BLAST2Sequences(Bl2seq)程序比较靶核酸或氨基酸序列与鉴定的核酸或氨基酸序列。这个BLASTZ的独立版本可以得自Fish&Richardson网站(World Wide Web at fr.com/blast)或美国政府的国家生物技术信息中心网站(World Wide Web at ncbi.nlm.nih.gov)。解释如何使用Bl2seq程序的说明可见于BLASTZ附带的自述文件中。BI2seq使用BLASTN或BLASTP算法在两个序列之间进行比较。

BLASTN用于比较核酸序列，而BLASTP用于比较氨基酸序列。为了比较两个核酸序列，选项设置如下：-i设置为含有第一个待比较核酸序列的文件(例如，C:\seq l.txt)；-j设置为含有待比较的第二个核酸序列的文件(例如，C:\seq2.txt)；-p设置为blastn；-o设置为任何所需的文件名(例如，C:\output.txt)；-q设置为-1；-r设置为2；所有其它选项保留默认设置。以下命令将生成一个含有两个序列之间比较的输出文件：C:\B12seq-ic:\seql.txt-j c:\seq2.txt-p blastn-o c:\output.txt-q-1-r 2。如果目标序列与已识别序列的任何部分具有同源性，则指定的输出文件将把这些同源区域呈现为比对序列。如果目标序列与已识别序列的任何部分不具有同源性，则指定的输出文件将不会呈现比对序列。一旦比对，通过对与来自鉴定序列的序列比对呈现的靶序列的连续核苷酸的数量进行计数来确定长度，从任何匹配位置开始并以任何其它匹配位置结束。匹配位置是在靶序列和鉴定序列中均存在相同核苷酸的任何位置。由于空位不是核苷酸，因此不计数靶序列中存在的空位。同样，由于计数的是靶序列核苷酸，而不是来自鉴定序列的核苷酸，因此不计数鉴定序列中存在的空位。特定长度上的相同性百分比通过计数该长度上匹配位置的数量并将该数量除以长度，然后将所得值乘以100来确定。例如，如果(i)将500个碱基的核酸靶序列与主题核酸序列进行比较，(ii)Bl2seq程序呈现来自靶序列的200个碱基，与主题序列的一个区域比对，其中该200个碱基区域的第一个和最后一个碱基匹配，以及(iii)如果这200个比对碱基的匹配数为180，则500个碱基的核酸靶序列含有长度为200个碱基且该长度上的序列相同性为90％(即，180/200×100＝90)。应当理解，与鉴定的序列比对的单个核酸靶序列内的不同区域可以各自具有其自己的相同性百分比。注意，相同性百分比值四舍五入到最接近的十分位。例如，78.11、78.12、78.13和78.14向下舍入为78.1，而78.15、78.16、78.17、78.18和78.19向上舍入为78.2。还要注意的是，长度值始终是整数。

术语“序列”当在本文中使用时涉及核苷酸序列、多核苷酸、核酸序列、核酸、核酸分子、肽、多肽和蛋白质，这取决于其中使用术语“序列”的语境。术语“核苷酸序列”、“多核苷酸”、“核酸序列”、“核酸”、“核酸分子”、“多核酸”在本文可互换使用，是指任何长度的聚合无支链形式的核苷酸，即核糖核苷酸或脱氧核糖核苷酸或两者的组合。核酸序列包括DNA、cDNA、基因组DNA、RNA、合成形式和混合的聚合物，有义链和反义链，或者可以含有非天然或衍生化的核苷酸碱基，这些将为本领域技术人员容易理解。

“分离的核酸序列”或“分离的DNA”是指不再存在于其分离自之中的天然环境中的核酸序列，例如细菌宿主细胞或植物核或质体基因组中的核酸序列。当本文提及“序列”时，应当理解具有这样的序列的分子是指例如核酸分子。“宿主细胞”或“重组宿主细胞”或“转化细胞”是指由于至少一个核酸分子已被引入所述细胞而产生的新个体细胞(或生物体)。所述宿主细胞优选是植物细胞或细菌细胞。宿主细胞可以含有作为染色体外(附加型)复制分子的核酸，或包含整合到宿主细胞的核或质体基因组中的核酸，或作为引入的染色体的核酸，例如微型染色体。

当提及与参考序列具有“基本序列相同性”或与参考序列具有至少80％、例如至少85％、90％、95％、>98％或>99％的核酸序列相同性的核酸序列(例如DNA或基因组DNA)时，在一个实施方案中，所述核苷酸序列被认为与给定的核苷酸序列基本上相同并且可以使用严格杂交条件来鉴定。在另一个实施方案中，与给定的核苷酸序列相比，所述核酸序列包含一个或多个突变，但仍然可以使用严格杂交条件来鉴定。“严格杂交条件”可用于鉴定与给定核苷酸序列基本相同的核苷酸序列。严格条件是序列依赖性的并且在不同情况下会有所不同。一般来说，严格条件选择为在指定的离子强度和pH下低于特定序列的热熔点(Tm)约5℃。Tm是50％的靶序列与完美匹配的探针杂交时的温度(在指定的离子强度和pH下)。通常选择的严格条件是其中盐浓度在pH 7时约为0.02摩尔且温度至少为60℃。降低盐浓度和/或升高温度会增加严格性。对于RNA-DNA杂交的严格条件(使用例如100nt探针的Northern印迹)是例如包括在0.2X SSC在63℃至少1次洗涤20分钟或同等条件。对于DNA-DNA杂交的严格条件(使用例如100nt探针的Southern印迹)是例如0.2X SSC中在至少50℃、通常约55℃的温度下至少1次(通常2次)洗涤20分钟或同等条件。也见Sambrook et al.(1989)和Sambrook and Russell(2001)所述。

当本文使用时，术语“多肽”或“蛋白质”(这两个术语在本文中可互换使用)是指涵盖给定长度的氨基酸链的肽、蛋白质或多肽，其中氨基酸残基通过共价肽键连接。然而，本发明还涵盖这样的蛋白质/多肽的肽模拟物，其中氨基酸和/或肽键已被功能类似物置换，以及除了20种编码基因的氨基酸之外，例如硒代半胱氨酸。肽、寡肽和蛋白质可称为多肽。术语多肽还指且不排除多肽的修饰，例如糖基化、乙酰化、磷酸化等。这些修饰在基础教材和更详细的专著以及研究文献中都有很好的描述。

氨基酸取代涵盖其中氨基酸被不同的天然存在的氨基酸残基取代的氨基酸改变。此类取代可被分类为“保守取代1”，其中野生型蛋白质中包含的氨基酸残基被具有相似特性的另一种天然存在的氨基酸取代，例如Gly<->Ala、Val<->Ile<->Leu、Asp<->Glu、Lys<->Arg、Asn<->Gln或Phe<->Trp<->Tyr。本发明涵盖的取代也可以是“非保守取代”，其中存在于野生型蛋白质中的氨基酸残基被具有不同特性的氨基酸取代，例如来自不同组的天然存在的氨基酸(例如，用丙氨酸取代带电或疏水性氨基酸)。如本文所用，“相似的氨基酸”是指具有相似氨基酸侧链的氨基酸，即具有极性、非极性或实际上中性侧链的氨基酸。如本文所用，“非相似氨基酸”是指具有不同氨基酸侧链的氨基酸，例如具有极性侧链的氨基酸与具有非极性侧链的氨基酸不相似。极性侧链通常存在于蛋白质表面，在此其可以与细胞中的水环境相互作用(“亲水”氨基酸)。另一方面，“非极性”氨基酸往往位于蛋白质的中心，在此其可以与相似的非极性邻居相互作用(“疏水性”氨基酸)。具有极性侧链的氨基酸的实例是精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、组氨酸、赖氨酸、丝氨酸和苏氨酸(除了半胱氨酸是疏水性之外均是亲水性)。具有非极性侧链的氨基酸的实例是丙氨酸、甘氨酸、异亮氨酸、亮氨酸、甲硫氨酸、苯丙氨酸、脯氨酸和色氨酸(除甘氨酸是中性外均为疏水性)。

本文使用的术语“基因”是指任何长度的核苷酸(核糖核苷酸或脱氧核糖核苷酸)的聚合形式。该术语包括双链和单链DNA和RNA。还包括已知类型的修饰，例如甲基化、“加帽”、用类似物取代一个或多个天然存在的核苷酸。优选地，基因包含编码本文定义的多肽的编码序列。“编码序列”是当置于或处于合适的调节序列控制下时转录成mRNA和/或翻译成多肽的核苷酸序列。编码序列的边界由5'末端的翻译起始密码子和3'末端的翻译终止密码子确定。编码序列可以包括但不限于mRNA、cDNA、重组核酸序列或基因组DNA，而在某些情况下也可以存在内含子。

如本文所用，术语“内源”是指存在于其天然基因组位置的基因或等位基因。术语“内源”可以与“天然”互换使用。然而，这并不排除与野生型等位基因存在一个或多个核酸差别。在具体的实施方案中，与野生型等位基因的差别可以限于小于9个，优选小于6个，更特别是小于3个核苷酸差别，例如0个核苷酸差别。更具体地，与野生型序列的差别可以仅在于一个核苷酸。优选地，内源等位基因编码与野生型蛋白质具有小于9个、优选小于6个、更特别小于3个、甚至更优选仅1个氨基酸差别或没有氨基酸差别的修饰的蛋白质。

如本文所用，术语“外源多核苷酸”是指重组引入细胞(或植物)中的多核苷酸，例如基因(或cDNA)或等位基因。外源多核苷酸可以是附加型的或基因组整合的。整合可以是随机的或定向的。整合可以包括置换相应的内源多核苷酸。应当理解，外源多核苷酸并非天然存在于细胞或植物中。

如本文所用，B73参考基因组AGPv4(或AGPv04)是指在玉米遗传学和基因组数据库

(https://www.maizegdb.org/genome/genome_assembly/Zm-B73-REFERENCE-GRAMENE-4.0)上提供的装配的B73 RefGen_v4(也称作AGPv4，B73 RefGen_v4)。

用于筛选本文所述的本发明的多核酸或(分子)标记(等位基因)的存在的方法是本领域已知的。非限制性地，筛选可涵盖或包含测序，基于杂交的方法(例如(动态)等位基因特异性杂交、分子信标、SNP微阵列)，基于酶的方法(例如PCR、KASP(竞争性等位基因特异性PCR)、RFLP、ALFP、RAPD、Flap核酸内切酶、引物延伸、5'-核酸酶、寡核苷酸连接测定)，基于DNA物理性质的扩增后方法(如单链构象多态性、温度梯度凝胶电泳、变性高效液相色谱、整个扩增子的高分辨率熔解、使用DNA错配结合蛋白、SNPlex、surveyor核酸酶测定)等。

一方面，本发明涉及鉴定植物、植物部分或植物材料、特别是玉米植物或植物部分的方法，包括筛选3号染色体上的细胞质雄性不育恢复基因座、特别是RF-03-01的存在，或者检测或鉴定所述细胞质雄性不育恢复基因座，如本文别处所述。

一方面，本发明涉及鉴定植物、植物部分或植物材料、特别是玉米植物或植物部分的方法，包括筛选3号染色体上不存在细胞质雄性不育恢复基因座、特别是RF-03-01，如本文别处所述。

一方面，本发明涉及鉴定植物、植物部分或植物材料、特别是玉米植物或植物部分的方法，包括筛选3号染色体上细胞质雄性不育保持基因座、特别是RF-03-01的存在或者检测或鉴定所述细胞质雄性不育保持基因座，如本文别处所述。

一方面，本发明涉及鉴定植物、植物部分或植物材料、特别是玉米植物或植物部分的方法，包括筛选3号染色体上不存在细胞质雄性不育保持基因座、特别是RF-03-01，如本文别处所述。

一方面，本发明涉及鉴定植物、植物部分或植物材料、特别是玉米植物或植物部分的方法，包括筛选3号染色体上细胞质雄性不育恢复基因座、特别是RF-03-01(相关的/连锁的单倍型)的存在或检测或鉴定所述基因座，如本文别处所述。

一方面，本发明涉及鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选3号染色体上不存在细胞质雄性不育恢复基因座、特别是RF-03-01(相关的单倍型)，如本文别处所述。

一方面，本发明涉及鉴定植物、植物部分或植物材料、特别是玉米植物或植物部分的方法，包括筛选3号染色体上细胞质雄性不育保持基因座、特别是RF-03-01(相关/连锁的单倍型)的存在或检测或鉴定所述基因座，如本文别处所述。

一方面，本发明涉及鉴定植物、植物部分或植物材料、特别是玉米植物或植物部分的方法，包括筛选3号染色体上不存在细胞质雄性不育保持基因座、特别是RF-03-01(相关/连锁的单倍型)，如本文别处所述。

一方面，本发明涉及鉴定植物、植物部分或植物材料、特别是玉米植物或植物部分的方法，包括筛选表4或表5中的一种或多种分子标记的存在或检测或鉴定所述分子标记。一方面，本发明涉及鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选表4或表5中的两种或更多种分子标记的存在或者检测或鉴定所述分子标记。一方面，本发明涉及鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选表4或表5中的三种或更多种分子标记的存在或者检测或鉴定所述分子标记。在某些实施方案中，所述方法是鉴定包含细胞质雄性不育恢复基因座的植物或植物部分的方法。在某些实施方案中，所述方法是鉴定包含细胞质雄性不育保持基因座的植物或植物部分的方法。

一方面，本发明涉及鉴定植物、植物部分或植物材料、特别是玉米植物或植物部分的方法，包括筛选表4或表5的一种或多种分子标记等位基因(以及具有对应于或包含在细胞质雄性不育恢复基因座中的多态性)的存在，或者检测或鉴定所述分子标记等位基因(以及具有对应于或包含在细胞质雄性不育恢复基因座中的多态性)。一方面，本发明涉及鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选表4或表5中的两种或更多种分子标记等位基因(以及具有对应于或包含在细胞质雄性不育恢复基因座中的多态性)的存在，或者检测或鉴定所述分子标记等位基因(以及具有对应于或包含在细胞质雄性不育恢复基因座中的多态性)。一方面，本发明涉及鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选表4或表5的三种或更多种分子标记等位基因(以及具有对应于或包含在细胞质雄性不育恢复基因座中的多态性)的存在，或者检测或鉴定所述分子标记等位基因(以及具有对应于或包含在细胞质雄性不育恢复基因座中的多态性)。

一方面，本发明涉及鉴定植物、植物部分或植物材料、特别是玉米植物或植物部分的方法，包括筛选表4或表5中的一种或多种分子标记等位基因(以及具有对应于或包含在细胞质雄性不育保持基因座中的多态性)的存在，或者检测或鉴定所述分子标记等位基因(以及具有对应于或包含在细胞质雄性不育保持基因座中的多态性)。一方面，本发明涉及鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选表4或表5的两种或更多种分子标记等位基因(以及具有对应于或包含在细胞质雄性不育保持基因座中的多态性)的存在，或者检测或鉴定所述分子标记等位基因(以及具有对应于或包含在细胞质雄性不育保持基因座中的多态性)。一方面，本发明涉及鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选表4或表5中的三种或更多种分子标记等位基因(以及具有对应于或包含在细胞质雄性不育保持基因座中的多态性)的存在，或者检测或鉴定所述分子标记等位基因(以及具有对应于或包含在细胞质雄性不育保持基因座中的多态性)。

一方面，本发明涉及鉴定植物、植物部分或植物材料、特别是玉米植物或植物部分的方法，包括筛选一个或多个多核酸序列的存在或者检测或鉴定所述多核酸序列，所述多核酸序列具有SEQ ID NO:1、5、9、13、2、6、10或14中任一个所示序列，或具有与SEQ ID NO:1、5、9、13、2、6、10或14中任一个或多个所示的序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列。一方面，本发明涉及一种鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选两个或更多个多核酸序列的存在或检测或鉴定所述多核酸序列，所述多核酸序列具有SEQ ID NO:1、5、9、13、2、6、10或14中任一个所示序列，或具有与SEQ ID NO:1、5、9、13、2、6、10或14中的任一个或多个所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列。一方面，本发明涉及一种鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选三个或更多个多核酸序列的存在或者检测或鉴定所述多核酸序列，所述多核酸序列具有SEQ ID NO:1、5、9、13、2、6、10或14中任一个所示序列，或者具有与SEQ ID NO:1、5、9、13、2、6、10或14中任一个或多个所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列。在某些实施方案中，所述方法是鉴定包含细胞质雄性不育恢复基因座的植物或植物部分的方法。在某些实施方案中，所述方法是鉴定包含细胞质雄性不育保持基因座的植物或植物部分的方法。

一方面，本发明涉及鉴定植物、植物部分或植物材料、特别是玉米植物或植物部分的方法，包括筛选一个或多个多核酸序列的存在或者检测或鉴定所述多核酸序列，所述多核酸序列具有SEQ ID NO:1、5、9或13中任一个所示序列，或具有与SEQ ID NO:1、5、9或13中任一个或多个所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列。一方面，本发明涉及鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选两个或更多个多核酸序列的存在或者检测或鉴定所述多核酸序列，所述多核酸序列具有SEQ ID NO:1、5、9或13中任一个所示序列，或者具有与SEQ ID NO:1、5、9或13中任一个或多个所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列。一方面，本发明涉及鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选三个或更多个多核酸序列的存在或者检测或鉴定所述多核酸序列，所述多核酸序列具有SEQ IDNO:1、5、9或13中任一个所示序列，或具有与SEQ ID NO:1、5、9或13中任一个或多个所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列。在某些实施方案中，所述方法是鉴定包含细胞质雄性不育恢复基因座的植物或植物部分的方法。

一方面，本发明涉及鉴定植物、植物部分或植物材料、特别是玉米植物或植物部分的方法，包括筛选一个或多个多核酸序列的存在或者检测或鉴定所述多核酸序列，所述多核酸序列具有SEQ ID NO:2、6、10或14中任一个所示序列，或具有与SEQ ID NO:2、6、10或14中任一个或多个所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列。一方面，本发明涉及鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选两个或更多个多核酸序列的存在或者检测或鉴定所述多核酸序列，所述多核酸序列具有SEQ ID NO:2、6、10或14中任一个所示序列，或具有与SEQ ID NO:2、6、10或14中任一个或多个所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列。一方面，本发明涉及鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选三个或更多个多核酸序列的存在或者检测或鉴定所述多核酸序列，所述多核酸序列具有SEQID NO:2、6、10或14中任一所示序列的，或具有与SEQ ID NO:2、6、10或14中任一个或多个所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列。在某些实施方案中，所述方法是鉴定包含细胞质雄性不育保持基因座的植物或植物部分的方法。

一方面，本发明涉及鉴定植物、植物部分或植物材料、特别是玉米植物或植物部分的方法，包括筛选选自Zm00001d043358、Zm00001d043352、Zm00001d043356和Zm00001d043357的一个或多个基因的存在，或检测或鉴定所述基因，所述基因分别具有SEQID NO:201、203、205、207、3、7、11或15中任一个所示编码序列，或者具有与SEQ ID NO:201、203、205、207、3、7、11或15中任一个或多个所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的编码序列。一方面，本发明涉及鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选选自Zm00001d043358、Zm00001d043352、Zm00001d043356和Zm00001d043357的两个或更多个基因的存在，或者检测或鉴定所述基因，所述基因分别具有SEQ ID NO:201、203、205、207、3、7、11或15中任一个所示编码序列，或者具有与SEQ ID NO:201、203、205、207、3、7、11或15中任一个或多个所示序列至少80％、优选至少85％、更优选至少90％，最优选至少95％相同的编码序列。一方面，本发明涉及鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选选自Zm00001d043358、Zm00001d043352、Zm00001d043356和Zm00001d043357的三个或更多个基因的存在，或检测或鉴定所述基因，所述基因分别具有SEQ ID NO:201、203、205、207、3、7、11或15中任一个所示编码序列，或具有与SEQ ID NO:201、203、205、207、3、7、11或15中任一个或多个所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的编码序列。在某些实施方案中，所述方法是鉴定包含细胞质雄性不育恢复基因座的植物或植物部分的方法。在某些实施方案中，所述该方法是鉴定包含细胞质雄性不育保持基因座的植物或植物部分的方法。

一方面，本发明涉及鉴定植物、植物部分或植物材料、特别是玉米植物或植物部分的方法，包括筛选选自Zm00001d043358、Zm00001d043352、Zm00001d043356和Zm00001d043357的一个或多个基因的存在，或检测或鉴定所述基因，所述基因分别具有如SEQ ID NO:201、203、205或207中任一个所示编码序列，或者具有与SEQ ID NO:201、203、205或207中任一个或多个所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的编码序列。一方面，本发明涉及一种鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选选自Zm00001d043358、Zm00001d043352、Zm00001d043356和Zm00001d043357的两个或多个基因的存在，或检测或鉴定所述基因，所述基因分别具有如SEQ ID NO:201、203、205或207中任一个所示的编码序列，或具有与SEQ ID NO:201、203、205或207中的任一个或多个所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的编码序列。一方面，本发明涉及一种鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选选自Zm00001d043358、Zm00001d043352、Zm00001d043356和Zm00001d043357的三个或更多个基因的存在，或者检测或鉴定所述基因，所述基因分别具有SEQ ID NO:201、203、205或207中任一个所示的编码序列，或者具有与SEQ ID NO:201、203、205或207中任一个或多个所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的编码序列。在某些实施方案中，所述方法是鉴定包含细胞质雄性不育恢复基因座的植物或植物部分的方法。

一方面，本发明涉及鉴定植物、植物部分或植物材料、特别是玉米植物或植物部分的方法，包括筛选选自Zm00001d043358、Zm00001d043352、Zm00001d043356和Zm00001d043357的一个或多个基因的存在，或检测或鉴定所述基因，所述基因分别具有SEQID NO:3、7、11或15中任一个所示的编码序列，或者具有与SEQ ID NO:3、7、11或15中任一个或多个所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的编码序列。一方面，本发明涉及一种鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选选自Zm00001d043358、Zm00001d043352、Zm00001d043356和Zm00001d043357的两个或多个基因的存在，或检测或鉴定所述基因，所述基因分别具有SEQ ID NO:3、7、11或15中任一个所示的编码序列，或具有与SEQ ID NO:3、7、11或15中的任一个或多个所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的编码序列。一方面，本发明涉及一种鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选选自Zm00001d043358、Zm00001d043352、Zm00001d043356和Zm00001d043357的三个或更多个基因的存在，或者检测或鉴定所述基因，所述基因分别具有SEQ ID NO:3、7、11或15中任一个所示的编码序列，或者具有与SEQ ID NO:3、7、11或15中任一个或多个所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的编码序列。在某些实施方案中，所述方法是鉴定包含细胞质雄性不育保持基因座的植物或植物部分的方法。

一方面，本发明涉及鉴定植物、植物部分或植物材料、特别是玉米植物或植物部分的方法，包括筛选选自Zm00001d043358、Zm00001d043352、Zm00001d043356和Zm00001d043357的一个或多个基因，或者检测或鉴定所述基因，所述基因分别编码具有SEQID NO:202、204、206、208、4、8、12或16中任一个所示序列的多肽，或编码具有与SEQ ID NO:202、204、206、208、4、8、12或16中任一个或多个所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列的多肽。一方面，本发明涉及鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选选自Zm00001d043358、Zm00001d043352、Zm00001d043356和Zm00001d043357的两个或更多个基因的存在，或者检测或鉴定所述基因，所述基因分别编码具有如SEQ ID NO:202、204、206、208、4、8、12或16中任一个所示序列的多肽，或者编码具有与SEQ ID NO:202、204、206、208、4、8、12或16中任一个或多个所示序列至少80％、优选在至少85％、更优选至少90％、最优选至少95％相同的序列的多肽。一方面，本发明涉及鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选选自Zm00001d043358、Zm00001d043352、Zm00001d043356和Zm00001d043357的三个或更多个基因的存在，或者检测或鉴定所述基因，所述基因分别编码具有SEQ ID NO:202、204、206、208、4、8、12或16中任一个所示序列的多肽，或编码具有与SEQ ID NO:202、204、206、208、4、8、12或16中任一个或多个所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列的多肽。在某些实施方案中，所述方法是鉴定包含细胞质雄性不育恢复基因座的植物或植物部分的方法。在某些实施方案中，所述方法是鉴定包含细胞质雄性不育保持基因座的植物或植物部分的方法。

一方面，本发明涉及鉴定植物、植物部分或植物材料、特别是玉米植物或植物部分的方法，包括筛选选自Zm00001d043358、Zm00001d043352、Zm00001d043356和Zm00001d043357的一个或多个基因的存在，或者检测或鉴定所述基因，所述基因分别编码具有如SEQ ID NO:202、204、206或208中任一个所示序列的多肽，或者编码具有与SEQ IDNO:202、204、206或208中任一个或多个所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列的多肽，优选选自Zm00001d043358、Zm00001d043352和Zm00001d043357的基因，所述基因编码具有SEQ ID NO:202、204或208中任一个所示序列的多肽，或编码具有与SEQ ID NO:202、204或208中任一个或多个所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列的多肽。一方面，本发明涉及一种鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选选自Zm00001d043358、Zm00001d043352、Zm00001d043356和Zm00001d043357的两个或更多个基因的存在，或检测或鉴定所述基因，所述基因分别编码具有SEQ ID NO:202、204、206或208中任一个所示序列的多肽，或编码具有与SEQ ID NO:202、204、206或208中任一个或多个所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列的多肽，优选选自Zm00001d043358、Zm00001d043352和Zm00001d043357的基因，所述基因分别编码具有SEQID NO:202、204或208中任一个所示序列的多肽，或编码具有与SEQ ID NO:202、204或208中任一个或多个所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列的多肽。一方面，本发明涉及鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选选自Zm00001d043358、Zm00001d043352、Zm00001d043356和Zm00001d043357的三个或更多个基因的存在，或检测或鉴定所述基因，所述基因分别编码具有SEQ ID NO:202、204、206或208中任一个所示序列的多肽，或编码具有与SEQ ID NO:202、204、206或208中任一个或多个所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列的多肽，优选选自Zm00001d043358、Zm00001d043352和Zm00001d043357的基因，所述基因分别编码具有SEQ ID NO:202、204、或208中任一个所示序列的多肽，或编码具有与SEQID NO:202、204或208任一个或多个所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列的多肽。在某些实施方案中，所述方法是鉴定包含细胞质雄性不育恢复基因座的植物或植物部分的方法。

一方面，本发明涉及鉴定植物、植物部分或植物材料、特别是玉米植物或植物部分的方法，包括筛选选自Zm00001d043358、Zm00001d043352和Zm00001d043357的一个或多个基因的存在，或者检测或鉴定所述基因，所述基因分别编码具有SEQ ID NO:4、8或16中任一个所示序列的多肽，或编码具有与SEQ ID NO:4、8或16中的任一个或多个所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列的多肽。一方面，本发明涉及一种鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选选自Zm00001d043358、Zm00001d043352和Zm00001d043357的两个或多个基因的存在，或者检测或鉴定所述基因，所述基因分别编码具有SEQ ID NO:4、8、或16中任一个所示序列的多肽，或编码具有与SEQ ID NO:4、8或16中任一个或多个所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列的多肽。一方面，本发明涉及鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选选自Zm00001d043358、Zm00001d043352和Zm00001d043357的三个或更多个基因的存在，或者检测或鉴定所述基因，所述基因分别编码具有SEQ ID NO:4、8或16中任一个所示序列的多肽，或编码具有与SEQ ID NO:4、8或16中任一个或多个所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列的多肽。在某些实施方案中，所述方法是鉴定包含细胞质雄性不育保持基因座的植物或植物部分的方法。

在某些优选的实施方案中，当本文提及与特定SEQ ID NO中列出的序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列时，此类序列包含如本文别处所述的与保持基因或恢复基因基因座/等位基因(及包含在该SEQ ID NO中)相关的一种或多种、优选全部多态性(例如SNP、插入或缺失)，特别是如表5中所述的多态性。例如，与SEQID NO:1中所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列可以包含表5中标识符1至39的一种或多种、优选全部恢复基因(或恢复基因相关的)多态性，例如对应于SEQ ID NO:1的位置35的位置处的“g”。例如，与SEQ ID NO:2所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列可以包含表5中标识符1至39的一种或多种、优选全部保持基因(或保持基因相关的)多态性，例如对应于SEQ IDNO:2的位置35的位置处的“t”。例如，与SEQ ID NO:5所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列可以包含表5中标识符40至69的一种或多种、优选全部恢复基因(或恢复基因相关的)多态性，例如对应于SEQ ID NO:5的位置486的位置处的“a”。例如，与SEQ ID NO:6所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列可以包含表5中标识符40至69的一种或多种、优选全部保持基因(或保持基因相关的)多态性，例如对应于SEQ ID NO:6的位置486的位置处的“t”。例如，与SEQ IDNO:9所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列可以包含表5中标识符70至98的一种或多种、优选全部恢复基因(或恢复基因相关的)多态性，例如对应于SEQ ID NO:9的位置392-393的位置处的“tg”。例如，与SEQ ID NO:10所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列可以包含表5中标识符70至98的一种或多种、优选全部保持基因(或保持基因相关的)多态性，例如对应于SEQID NO:10的位置393-397的位置处的“gtggt”。例如，与SEQ ID NO:13所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列可以包含表5中标识符99至100的一种或多种、优选全部恢复基因(或恢复基因相关的)多态性，例如对应于SEQ ID NO:13的位置651-652的位置处的“cc”。例如，与SEQ ID NO:14所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列可以包含表5中标识符99至100的一种或多种、优选全部保持基因(或保持基因相关的)多态性，例如在对应于SEQ ID NO:14的位置652-654的位置处的“cgc”。虽然上述SEQ ID NO是基因组序列，但是技术人员将理解也暗含了SEQ ID NO编码序列中的相应多态性。

一方面，本发明涉及鉴定植物、植物部分或植物材料、特别是玉米植物或植物部分的方法，包括筛选具有SEQ ID NO:17至200中任一个所示序列的一个或多个多核酸序列的存在，或者检测或鉴定所述多核酸序列。一方面，本发明涉及鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选具有SEQ ID NO:17至200中任一个所示序列的两个或多个多核酸序列的存在，或者检测或鉴定所述多核酸序列。一方面，本发明涉及鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选具有SEQ ID NO:17至200中任一个所示序列的三个或更多个多核酸序列的存在，或者检测或鉴定所述多核酸序列。

一方面，本发明涉及鉴定植物、植物部分或植物材料、特别是玉米植物或植物部分的方法，包括筛选具有SEQ ID NO:17至200中任一个所示序列并且具有对应于细胞质雄性不育恢复基因座的多态性的一个或多个多核酸序列的存在，或者检测或鉴定所述多核酸序列。一方面，本发明涉及一种鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选具有SEQ ID NO:17至200中的任一个所示序列并且具有对应于细胞质雄性不育恢复基因座的多态性的两个或更多个多核酸序列的存在，或者检测或鉴定所述多核酸序列。一方面，本发明涉及一种鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选具有SEQ ID NO:17至200中的任一个所示序列并且具有对应于细胞质雄性不育恢复基因座的多态性的三个或更多个多核酸序列的存在，或者检测或鉴定所述多核酸序列。

一方面，本发明涉及鉴定植物、植物部分或植物材料、特别是玉米植物或植物部分的方法，包括筛选具有SEQ ID NO:17至200中任一个所示序列并且具有不对应于细胞质雄性不育保持基因座的多态性的一个或多个多核酸序列的存在，或者检测或鉴定所述多核酸序列。一方面，本发明涉及鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选具有SEQ ID NO:17至200中的任一个所示序列并且具有不对应于细胞质雄性不育保持基因座的多态性的两个或更多个多核酸序列的存在，或者检测或鉴定所述多核酸序列。一方面，本发明涉及一种鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选具有SEQ ID NO:17至200中的任一个所示序列并且具有不对应于细胞质雄性不育保持基因座的多态性的三个或更多个多核酸序列的存在，或者检测或鉴定所述多核酸序列。

一方面，本发明涉及鉴定植物、植物部分或植物材料、特别是玉米植物或植物部分的方法，包括筛选一种或多种、两种或多种或三种或多种以下多态性的存在或检测或鉴定所述多态性(位置对应于玉米参考B73 AGPv4染色体3)：

/>

举例来说，本发明涉及鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选在对应于玉米参考B73 AGPv4染色体3位置195629901的位置处的多态性的存在或者检测或鉴定所述多态性。举例来说，本发明涉及鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选在对应于玉米参考B73 AGPv4染色体3位置195629901的位置处的SNP的存在或者检测或鉴定所述SNP。举例来说，本发明涉及鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选在对应于玉米参考B73 AGPv4染色体3位置195629901的位置处的SNP的存在或者检测或鉴定所述SNP，其中如果检测到G，则所述玉米植物或植物部分是恢复系或包含恢复系(基因、基因座、单倍型、基因组或表型)，特别是本发明的恢复基因。举例来说，本发明涉及鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选在对应于玉米参考B73AGPv4染色体3位置195629901的位置处的SNP的存在或者检测或鉴定所述SNP，其中如果检测到除了G之外的核苷酸，则所述玉米植物或植物部分不是恢复系或不包含恢复系(基因、基因座、单倍型、基因组或表型)，特别是本发明的恢复基因。举例来说，本发明涉及鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选在对应于玉米参考B73 AGPv4染色体3位置195629901的位置处的SNP的存在或者检测或鉴定所述SNP，其中如果检测到除了G之外的核苷酸，则所述玉米植物或植物部分是保持系或包含保持系(基因、基因座、单倍型、基因组或表型)，特别是本发明的保持基因。举例来说，本发明涉及鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选在对应于玉米参考B73 AGPv4染色体3位置195629901的位置处的SNP的存在或者检测或鉴定所述SNP，其中如果检测到核苷酸A，则所述玉米植物或植物部分不是恢复系或不包含恢复系(基因、基因座、单倍型、基因组或表型)，特别是本发明的恢复基因。举例来说，本发明涉及鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选在对应于玉米参考B73 AGPv4染色体3位置195629901的位置处的SNP的存在或者检测或鉴定所述SNP，其中如果检测到核苷酸A，则所述玉米植物或植物部分是保持系或包含保持系(基因、基因座、单倍型、基因组或表型)，特别是本发明的保持基因。

相应的实施方案适用于每个其它多态性/SNP。

应当理解，所示的核苷酸位置是指定的AGPv04 B73染色体3位置的核苷酸位置，并且根据本发明的玉米植物中的标记位置对应于所示的标记位置，但在不同的基因组中不一定是或包含相同的位置(例如来自不同的种族或品系)。技术人员将理解，如本领域已知的，可以通过适当的比对来确定相应的核苷酸位置。

在指示恢复基因等位基因的位置处的核苷酸(SNP)允许筛选或鉴定根据本发明的恢复基因表型。在指示保持基因等位基因的位置处的核苷酸(SNP)允许筛选或鉴定非恢复基因表型(即，玉米染色体上不存在恢复基因座)。应当理解，为了鉴定非恢复基因等位基因，所示的SNP核苷酸可以与表中所示核苷酸的不同(只要这些核苷酸不同于恢复基因等位基因所示的SNP核苷酸即可)。

一方面，本发明涉及鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选一种或多种、两种或多种、或三种或多种以下多态性的存在或检测或鉴定所述多态性(位置对应于各个SEQ ID NO的指定位置)：

/>

举例来说，本发明涉及鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选对应于SEQ ID NO:1的位置35的位置的多态性或与SEQ ID NO:1所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列(包含多态性)的存在处或者检测或鉴定所述多态性。举例来说，本发明涉及鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选对应于SEQ ID NO:2的位置35的位置的多态性或与SEQ IDNO:2所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列(包含多态性)的存在或者检测或鉴定所述多态性。

举例来说，本发明涉及鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选对应于SEQ ID NO:1的位置35的位置的多态性或与SEQ ID NO:1所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列(包含多态性)的存在或者检测或鉴定所述多态性，其中如果检测到G，则所述玉米植物或植物部分是保持基因系或不是恢复基因系或包含保持基因系(基因、基因座、单倍型、基因组或表型)或不包含恢复基因系(基因、基因座、单倍型、基因组或表型)，特别是本发明的保持基因/恢复基因。举例来说，本发明涉及鉴定植物或植物部分、特别是玉米植物或植物部分的方法，包括筛选对应于SEQ ID NO:2的位置35的位置的多态性或与SEQ ID NO:2所示序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列(包含多态性)的存在或者检测或鉴定所述多态性，其中如果检测到T，则所述玉米植物或植物部分是恢复基因系或包含恢复基因系(基因、基因座、单倍型、基因组或表型)，特别是本发明的恢复基因。

相应的实施方案适用于其它多态性、SNP、插入、缺失和取代中的每一个。

可以通过本领域已知的方式实现对各个多态性的筛选，例如KASP，如本文别处所述。例如，可以开发KASP引物来区分恢复基因与非恢复基因/保持基因多态性。

如本文所述的鉴定(玉米)植物或植物部分的方法可以包括筛选从(玉米)植物或植物部分获得的样品，特别是包含(玉米)植物或植物部分的基因组DNA的样品。因此，所述方法可以包括从(玉米)植物或植物部分获得样品(包含基因组DNA)的步骤，或提供从(玉米)植物或植物部分获得的样品(包含基因组DNA)的步骤。用于筛选或鉴定标记的方法是本领域众所周知的，也如本文别处所述。

应当理解，如本文所述的鉴定(玉米)植物或植物部分的方法使得可以基于本文描述的多态性或多态性等位基因的相同性区分具有细胞质雄性不育恢复基因或细胞质雄性不育保持基因基因型、单倍型和/或表型的植物或植物部分。因此，本发明的分子标记(等位基因)可有利地用于鉴定玉米植物是恢复基因系或是具有恢复基因、基因座(等位基因)、单倍型、基因型或表型或不是恢复基因系或不具有恢复恢复基因、基因座(等位基因)、单倍型、基因型或表型，特别是本发明的恢复基因。也如本文别处所述，此类植物或植物部分仍然可以包含其它恢复基因或基因座。

一方面，用于鉴定本文所述的(玉米)植物或植物部分的方法是用于区分具有本文别处所述的本发明细胞质雄性不育恢复基因的(玉米)植物或植物部分与缺乏如本文别处所述的本发明细胞质雄性不育恢复基因的(玉米)植物或植物部分的方法。一方面，用于鉴定如本文所述的(玉米)植物或植物部分的方法是用于鉴定具有如本文别处所述的本发明细胞质雄性不育恢复基因的(玉米)植物或植物部分的方法。一方面，用于鉴定如本文所述的(玉米)植物或植物部分的方法是用于鉴定缺乏如本文别处所述的本发明细胞质雄性不育恢复基因的(玉米)植物或植物部分的方法。

在某些实施方案中，如果(在植物或植物部分的基因组中)检测到所述恢复基因座、单倍型、标记(等位基因)、SNP等，例如表4或5中提供的SEQ ID NO:1、5、9、13等，则所述(玉米)植物或植物部分被鉴定为具有如本文别处所述的本发明的细胞质雄性不育恢复基因。在某些实施方案中，如果(在植物或植物部分的基因组中)未检测到所述恢复基因座、单倍型、标记(等位基因)、SNP等，例如表4或5中提供SEQ ID NO:1、5、9、13等，则所述(玉米)植物或植物部分被鉴定为缺乏如本文别处所述的本发明的细胞质雄性不育恢复基因。在某些实施方案中，如果(在植物或植物部分的基因组中)检测到保持基因座、单倍型、标记(等位基因)、SNP等，例如表4或5中所提供的SEQ ID NO:2、6、10、14等，则所述(玉米)植物或植物部分被鉴定为缺乏如本文别处所述的本发明的细胞质雄性不育恢复基因。

本发明的基础是CMS(细胞质雄性不育)恢复基因座的鉴定，特别是位于玉米3号染色体上的基因座。因此，本文所述的用于鉴定植物或植物部分的方法可以是鉴定包含所述CMS恢复基因座的植物或植物部分的方法，或者鉴定不包含所述CMS恢复基因座的植物或植物部分的可选方法。这种鉴定可以基于本文描述的多态性，特别是与恢复基因座相关/连锁的多态性等位基因，或者与保持基因座相关/连锁的多态性等位基因。因此，本文所述的用于鉴定植物或植物部分的方法可以是鉴定包含CMS保持基因座的植物或植物部分的方法，或者是鉴定不包含CMS保持基因座的植物或植物部分的方法。

在某些实施方案中，本发明的恢复基因座包含在玉米3号染色体上对应于B73参考玉米基因组AGPv4或其片段的(核酸)位置195629901至198023573的基因组区间中。在某些实施方案中，所述恢复基因座包含在玉米3号染色体上对应于B73参考玉米基因组AGPv4或其片段的(核酸)位置195629901至198023573的基因组区间。在某些实施方案中，所述恢复基因座在玉米3号染色体上两侧是对应于B73参考玉米基因组AGPv4或其片段的位置195629901和198023573的(核酸)位置。

在某些实施方案中，本发明的恢复基因座包含在玉米3号染色体上对应于B73参考玉米基因组AGPv4或其片段的(核酸)位置197453646至197698278的基因组区间中。在某些实施方案中，所述恢复基因座包含在玉米3号染色体上对应于B73参考玉米基因组AGPv4或其片段的(核酸)位置197453646至197698278的基因组区间。在某些实施方案中，所述恢复基因座在玉米3号染色体上两侧是对应于B73参考玉米基因组AGPv4或其片段的位置197453646和197698278的(核酸)位置。

在某些实施方案中，本发明的恢复基因座包含在玉米3号染色体上对应于B73参考玉米基因组AGPv4或其片段的(核酸)位置195629901至197698278的基因组区间中。在某些实施方案中，所述恢复基因座包含在玉米3号染色体上对应于B73参考玉米基因组AGPv4或其片段的(核酸)位置195629901至197698278的基因组区间。在某些实施方案中，所述恢复基因座在玉米3号染色体上两侧是对应于B73参考玉米基因组AGPv4或其片段的位置195629901和197698278的(核酸)位置。

在某些实施方案中，本发明的恢复基因座包含在玉米3号染色体上对应于B73参考玉米基因组AGPv4或其片段的(核酸)位置197453646至198023573的基因组区间中。在某些实施方案中，所述恢复基因座包含在玉米3号染色体上对应于B73参考玉米基因组AGPv4或其片段的(核酸)位置197453646至198023573的基因组区间。在某些实施方案中，所述恢复基因座在玉米3号染色体上两侧是对应于B73参考玉米基因组AGPv4或其片段的位置197453646和198023573的(核酸)位置。

在某些实施方案中，分子标记(等位基因)选自表4或5。如表4和5所示，所有标记都是多态性的并且能够区分恢复基因与非恢复基因(或保持基因)。因此，恢复基因的鉴定需要鉴定一种或多种恢复基因相关/连锁的多态性，如表4和表5所示，而非恢复基因/保持基因的鉴定需要鉴定一种或多种非恢复基因/保持基因相关/连锁的多态性，如表4和表5所示。

如本文所提及的，如果本文描述的本发明的多核酸/基因座包含在其中分别第一标记(等位基因)位于所述多核酸的上游(即5’)并且第二标记(等位基因)位于所述多核酸的下游(即3’)的多核酸内，则称该多核酸或基因座两侧是某些分子标记或分子标记等位基因。这样的第一和第二标记(等位基因)可以与所述多核酸毗邻。所述核酸可以同等地包含这样的第一和第二标记(等位基因)，例如分别在5’和3’末端处或附近，例如分别在5’和3’末端的50kb内，优选在5’和3’末端的10kb内，例如5’和3’端的5kb内、5’和3’端的1kb内或更少。

在某些实施方案中，本发明的鉴定玉米植物或植物部分的方法包括筛选选自SEQID NO:17至200的一种或多种分子标记(等位基因)的存在或者检测或鉴定所述分子标记(等位基因)，其中n是恢复基因多态性(SNP)的相应的核苷酸(如表4所示)。

在某些实施方案中，本发明用于鉴定玉米植物或植物部分的方法包括筛选选自SEQ ID NO:17至200的一种或多种分子标记(等位基因)的存在或者检测或鉴定所述分子标记(等位基因)，其中n是非恢复基因/保持基因多态性(SNP)的相应的核苷酸(如表4所示)。

在某些实施方案中，本发明的鉴定玉米植物或植物部分的方法包括筛选不存在选自SEQ ID NO:17至200的一种或多种分子标记(等位基因)，其中n是恢复基因多态性(SNP)的相应核苷酸(如表4所示)。

在某些实施方案中，本发明的鉴定玉米植物或植物部分的方法包括筛选不存在选自SEQ ID NO:17至200的一种或多种分子标记(等位基因)，其中n是非恢复基因/保持基因多态性(SNP)的相应核苷酸(如表4所示)。

在某些实施方案中，本发明的鉴定玉米植物或植物部分的方法包括筛选选自SEQID NO:68至140的一种或多种分子标记(等位基因)的存在或者检测或鉴定所述分子标记(等位基因)，其中n是恢复基因多态性(SNP)的相应核苷酸(如表4所示)。

在某些实施方案中，本发明的鉴定玉米植物或植物部分的方法包括筛选选自SEQID NO:68至140的一种或多种分子标记(等位基因)的存在或者检测或鉴定所述分子标记(等位基因)，其中n是非恢复基因/保持基因多态性(SNP)的相应的核苷酸(如表4所示)。

在某些实施方案中，本发明的鉴定玉米植物或植物部分的方法包括筛选不存在选自SEQ ID NO:68至140的一种或多种分子标记(等位基因)，其中n是恢复基因多态性(SNP)的相应核苷酸(如表4所示)。

在某些实施方案中，本发明的鉴定玉米植物或植物部分的方法包括筛选不存在选自SEQ ID NO:68至140的一种或多种分子标记(等位基因)，其中n是非恢复基因/保持基因多态性(SNP)的相应核苷酸(如表4所示)。

在某些实施方案中，本发明的鉴定玉米植物或植物部分的方法包括筛选选自SEQID NO:70、72、76、79、86、88、92、93、99、104、105、107、108、109、115和134的一种或多种分子标记(等位基因)的存在或者检测或鉴定所述分子标记(等位基因)，其中n是恢复基因多态性(SNP)的相应核苷酸(如表4所示)。

在某些实施方案中，本发明的鉴定玉米植物或植物部分的方法包括筛选选自SEQID NO:70、72、76、79、86、88、92、93、99、104、105、107、108、109、115和134的一种或多种分子标记(等位基因)的存在或者检测或鉴定所述分子标记(等位基因)，其中n是非恢复基因/保持基因多态性(SNP)的相应核苷酸(如表4所示)。

在某些实施方案中，本发明的鉴定玉米植物或植物部分的方法包括筛选不存在选自SEQ ID NO:70、72、76、79、86、88、92、93、99、104、105、107、108、109、115和134的一种或多种分子标记(等位基因)，其中n是恢复基因多态性(SNP)的相应核苷酸(如表4所示)。

在某些实施方案中，本发明的鉴定玉米植物或植物部分的方法包括筛选不存在选自SEQ ID NO:70、72、76、79、86、88、92、93、99、104、105、107、108、109、115和134的一种或多种分子标记(等位基因)，其中n是非恢复基因/保持基因多态性(SNP)的相应核苷酸(如表4所示)。

在某些实施方案中，本发明的鉴定玉米植物或植物部分的方法包括筛选SEQ IDNO:1、5、9和13中的任一个或多个序列或其(独特的)片段、或与SEQ ID NO:1、5、9和13中任一或多个所示序列或其(独特)片段至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列的存在，或筛选SEQ ID NO:2、6、10和14中的一个或多个序列或其(独特)片段、或与SEQ ID NO:2、6、10和14中的任一个或多个序列或其(独特)片段至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列的存在，或检测或鉴定所述序列。在某些实施方案中，本发明的鉴定玉米植物或植物部分的方法包括筛选SEQ ID NO:1、5、9和13中的任一个或多个序列或其(独特的)片段、或与SEQ ID NO:1、5、9和13或其(独特的)片段中任一个或多个序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列的存在，或检测或鉴定所述序列，其中存在所述序列表明该植物或植物部分是恢复基因系或包含恢复基因系(基因、基因座(等位基因)、单倍型、基因组或表型)。在某些实施方案中，本发明的鉴定玉米植物或植物部分的方法包括筛选SEQ ID NO:1、5、9和13中的任一个或多个序列或其(独特的)片段、或与SEQ ID NO:1、5、9和13或其(独特的)片段中任一或多个序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列的存在，或检测或鉴定所述序列，其中不存在所述序列表明该植物或植物部分不是恢复基因系或不包含恢复基因系(基因、基因座(等位基因)、单倍型、基因组或表型)。在某些实施方案中，本发明的鉴定玉米植物或植物部分的方法包括筛选SEQ ID NO:1、5、9和13中的任一个或多个序列或其(独特的)片段、或与SEQ ID NO:1、5、9和13或其(独特的)片段中任一或多个序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列的存在，或检测或鉴定所述序列，其中不存在所述序列表明该植物或植物部分是保持基因系或包含保持基因系(基因、基因座(等位基因)、单倍型、基因组或表型)。

在某些实施方案中，本发明的鉴定玉米植物或植物部分的方法包括筛选SEQ IDNO:2、6、10和14中的任一个或多个序列或其(独特的)片段、或与SEQ ID NO:2、6、10和14或其(独特的)片段中任一或多个序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列的存在，或检测或鉴定所述序列，其中存在所述序列表明该植物或植物部分不是恢复基因系或不包含恢复基因系(基因、基因座(等位基因)、单倍型、基因组，或表型)。在某些实施方案中，本发明的鉴定玉米植物或植物部分的方法包括筛选SEQ ID NO:2、6、10和14中的任一个或多个序列或其(独特的)片段、或与SEQ ID NO:2、6、10和14或其(独特的)片段中任一个或多个序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列的存在，或检测或鉴定所述序列，其中存在所述序列表明该植物或植物部分是保持基因系或包含保持基因系(基因、基因座(等位基因)、单倍型、基因组或表型)。在某些实施方案中，本发明的鉴定玉米植物或植物部分的方法包括筛选SEQ ID NO:2、6、10和14中的任一个或多个序列或其(独特的)片段、或与SEQ ID NO:2、6、10和14或其(独特的)片段中任一个或多个序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列的存在，或检测或鉴定所述序列，其中不存在所述序列表明该植物或植物部分是恢复基因系或包含恢复基因系(基因、基因座(等位基因)、单倍型、基因组或表型)。

一方面，本发明涉及(分离的)多核酸或其片段或其互补体或其反向互补体，所述多核酸包含或由本文别处所述的任一个或多个的所述序列、分子标记或分子标记等位基因组成。

在某些实施方案中，本文所述的根据本发明的多核苷酸或多核酸是分离的多核苷酸或多核酸。

一方面，本发明涉及(分离的)多核酸或其互补体或其反向互补体，所述多核酸包含或由本文别处所述的任何的所述序列、分子标记或分子标记等位基因的(独特)片段组成。优选地，所述多核酸是至少15个核苷酸，更优选至少20个核苷酸，例如至少25、30、35、40、45、50、75、100、125、150、175、200或更多个核苷酸。在某些实施方案中，所述多核酸为至多500个核苷酸，优选至多250个核苷酸，例如至多200、150、100或50个核苷酸。在某些实施方案中，所述多核酸具有15至500个核苷酸，例如20至250个核苷酸或20至100个核苷酸，例如20至50个核苷酸。

一方面，本发明涉及(分离的)多核酸或其互补体或其反向互补体，所述多核酸与本文别处所述任何的所述序列、分子标记或分子标记等位基因(特异性地)杂交。优选地，所述多核酸是至少15个核苷酸，更优选至少20个核苷酸，例如至少25、30、35、40、45、50、75、100、125、150、175、200或更多个核苷酸。在某些实施方案中，所述多核酸为至多500个核苷酸，优选至多250个核苷酸，例如至多200、150、100或50个核苷酸。在某些实施方案中，所述多核酸具有15至500个核苷酸，例如20至250个核苷酸或20至100个核苷酸，例如20至50个核苷酸。

一方面，本发明涉及包含表4或表5的分子标记(等位基因)或其(独特)片段的多核酸，和/或其互补体或反向互补体。一方面，本发明涉及包含表4或表5的恢复基因分子标记(等位基因)或其(独特)片段的多核酸，和/或其互补体或反向互补体。一方面，本发明涉及包含表4或表5的非恢复基因/保持基因分子标记(等位基因)或其(独特的)片段的多核酸，和/或其互补体或反向互补体。

根据某些实施方案，当提及多核酸或蛋白质的片段时，这种片段分别包含至少15个核苷酸或氨基酸，优选至少20个核苷酸或氨基酸。

应当理解，根据本发明的多核酸包含或特异性杂交一种或多种分子标记(等位基因)和(天然地)在各个标记(等位基因)(或其互补体或反向互补体)两侧的另外的5’和/或3’连续核苷酸。在这种情况下，两侧的核苷酸量在某些实施方案中可以是至少14或15个核苷酸(其可以或可以不完全是5’或完全3’的侧翼核苷酸，例如5个3’侧翼核苷酸加上10个5’侧翼核苷酸)。在某些实施方案中，本发明的分子标记(等位基因)(或其互补体)是最多5’核苷酸的多核酸。在某些实施方案中，本发明的分子标记(等位基因)(或其互补体)是第二最多5’核苷酸的多核酸。在某些实施方案中，本发明的分子标记(等位基因)(或其互补体)是第三最多5’核苷酸的多核酸。在某些实施方案中，本发明的分子标记(等位基因)(或其互补体)是最多3’核苷酸的多核酸。在某些实施方案中，本发明的分子标记(等位基因)(或其互补体)是第二最多3’核苷酸的多核酸。在某些实施方案中，本发明的分子标记(等位基因)(或其互补体)是第三最多3’核苷酸多核酸。此类末端定位标记(例如SNP)有利地允许等位基因特异性引物的开发，例如用于KASP中的引物。

一方面，本发明涉及包含或包含在SEQ ID NO:1至208中任一个序列或其(独特)片段中的多核酸，和/或其互补体或其反向互补体。一方面，本发明涉及与包含或包含在SEQID NO:1至208中任一个序列、或其(独特的)片段中的多核酸特异性杂交的多核酸，和/或其互补体或其反向互补体。应理解，此类多核酸包含至少一个或多个的如本文别处提及的本发明多态性核苷酸插入、缺失或取代以及如本文别处所述的连续5’和/或3”侧翼序列。

在某些实施方案中，所述多核酸包含或包含在SEQ ID NO:17至200中的任一个序列中，其中n是恢复基因多态性(SNP)的相应核苷酸(如表4所示)。

在某些实施方案中，所述多核酸包含或包含在SEQ ID NO:17至200中的任一个序列中，其中n是非恢复基因/保持基因多态性(SNP)的相应核苷酸(如表4所示)。

在某些实施方案中，所述多核酸包含或包含在SEQ ID NO:68至140中的任一个序列中，其中n是恢复基因多态性(SNP)的相应核苷酸(如表4所示)。

在某些实施方案中，所述多核酸包含或包含在SEQ ID NO:68至140中的任一个序列中，其中n是非恢复基因/保持基因多态性(SNP)的相应核苷酸(如表4所示)。

在某些实施方案中，所述多核酸包含或包含在SEQ ID NO:70、72、76、79、86、88、92、93、99、104、105、107、108、109、115和134中的任一个序列中，其中n是恢复基因多态性(SNP)的相应核苷酸(如表4所示)。

在某些实施方案中，所述多核酸包含或包含在SEQ ID NO:70、72、76、79、86、88、92、93、99、104、105、107、108、109、115和134中的任一个序列中，其中n是非恢复基因/保持基因多态性(SNP)的相应核苷酸(如表4所示)。

在某些实施方案中，所述多核酸包含或包含在任一个的SEQ ID NO:1-3、5-7、9-11、13-15、201、203、205或207或其互补体、或其反向互补体或其(独特的)片段中，或包含或被包含在与任一个或多个的SEQ ID NO:1-3、5-7、9-11、13-15、201、203、205或207序列或其互补体、或其反向互补体、或其(独特的)片段序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列中。在某些实施方案中，所述多核酸包含或包含在多核酸或其互补体或其反向互补体或其(独特的)片段中，所述多核酸编码SEQ ID NO:4、8、12、16、202、204、206、208的蛋白质，或包含或被包含在多核酸或其互补体、或其反向互补体、或其(独特的)片段中，所述多核酸编码具有与SEQ ID NO:4、8、12、16、202、204、206、208中任一个或多个序列具有至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列的蛋白质。在某些实施方案中，所述多核酸包含或包含在SEQ ID NO:1、5、9、13、201、203、205或207中的任一个序列中，优选SEQ ID NO:1或201，或其互补体，或其反向互补体或其(独特的)片段，或包含或被包含在与SEQ ID NO:1、5、9、13、201、203、205或207中任一个或多个序列、优选SEQ ID NO:1或201、或其互补体或其反向互补体、或其(独特的)片段至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列中。在某些实施方案中，所述多核酸包含或包含在多核酸或其互补体或其反向互补体或其(独特的)片段中，所述多核酸编码SEQ ID NO:202、204、206、208、优选SEQ ID NO:202的蛋白质，或包含或被包含在多核酸或其互补体、或其反向互补体、或其(独特的)片段中，所述多核酸编码具有与SEQ IDNO:202、204、206、208中任一个或多个、优选SEQ ID NO:202至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列的蛋白质。在某些实施方案中，所述多核酸包含或包含在任一的SEQ ID NO:2-3、6-7、10-11、14-15、优选SEQ ID NO:2序列或其互补体、或反向互补体或其(独特的)片段中，或包含或被包含在与SEQ ID NO:2-3、6-7、10-11、14-15任一或多个、优选SEQ ID NO:2或其互补体、或其反向互补体或其(独特的)片段至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列中。在某些实施方案中，所述多核酸包含或包含在这样的多核酸或其互补体、或其反向补体或其(独特的)片段中，其编码SEQ ID NO:4、8、12、16、优选SEQ ID NO:4的蛋白质，或包含或被包含在这样的多核酸或其互补体、或其反向补体或其(独特的)片段中，其编码具有与SEQ ID NO:4、8、12、16、优选SEQID NO:4至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列的蛋白质。此类多核酸如本文别处所述适合于鉴定植物或植物部分以及产生植物。

在某些实施方案中，所述多核酸包含或由至少15个核苷酸组成，例如16、17、18、19、20、21、22、23、24或25个核苷酸，例如至少30、35、40、45或50个核苷酸，例如至少100、200、300或500个核苷酸。

在某些实施方案中，所述多核酸包含或由如本文别处提及的编号27至30的陈述中定义的多核酸组成。

在某些实施方案中，所述多核酸包含或由至多1500个核苷酸组成，例如1200、1000、800、600、400、200个核苷酸，例如至多100、80、60、50、40或30个核苷酸。

在某些实施方案中，所述多核酸包含或由至少15个核苷酸组成，例如16、17、18、19、20、21、22、23、24或25个核苷酸，例如至少30、35、40、45或50个核苷酸，例如至少100、200、300或500个核苷酸，并且所述多核酸包含至多1500个核苷酸，例如1200、1000、800、600、400、200个核苷酸，例如至多100、80、60、50、40或30个核苷酸。

在某些实施方案中，所述(分离的)多核苷酸的长度范围为15至500个核苷酸，优选15至100个核苷酸，优选15至50个核苷酸，更优选15至35个核苷酸。

在某些实施方案中，所述(分离的)多核苷酸是引物或探针。

在某些实施方案中，所述(分离的)多核苷酸是等位基因特异性引物或探针。

在某些实施方案中，所述(分离的)多核苷酸是KASP(竞争性等位基因特异性PCR)引物。引物，包括KASP引物，是本领域众所周知的并且可以由技术人员根据已知标准设计。通过进一步指导，并且不限于此，使用两种(或更多种)等位基因特异性引物(其可以是正向引物)和通常一种通用引物(其可以是反向引物)进行KASP。所述等位基因特异性引物通常用尾部序列延长(其中为每个等位基因特异性引物提供不同的尾部序列)。所述尾部序列允许掺入荧光标记的互补序列，从而可以通过荧光区分不同的等位基因。

在某些实施方案中，所述尾部序列的长度包含在引物总长度中。在某些实施方案中，所述尾部序列的长度不包含在引物总长度中。

在某些实施方案中，所述多核酸是(PCR)引物或(杂交)探针。在某些实施方案中，所述多核酸是等位基因特异性引物或探针。在某些实施方案中，所述多核酸是KASP引物。

一方面，本发明涉及包含本发明的(分子)标记(等位基因)或本发明的(分子)标记(等位基因)的互补体或反向互补体的(分离的)多核酸。在某些实施方案中，本发明涉及包含本发明的(分子)标记(等位基因)或本发明的(分子)标记(等位基因)的互补体或反向互补体的至少10个连续核苷酸、优选至少15个连续核苷酸或至少20个连续核苷酸的多核酸。在某些实施方案中，所述多核酸能够区分本发明的(分子)标记(等位基因)与非分子标记等位基因，例如与本发明的(分子)标记等位基因特异性杂交。在某些实施方案中，所述多核酸或其互补体或反向互补体与源自玉米自交系B73的(基因组)DNA(基本上)不杂交或结合。在某些实施方案中，所述多核酸或其互补体或反向互补体的序列不发生于或不存在于玉米自交系B73中。

一方面，本发明涉及试剂盒，其包含一种或多种本文所述的多核苷酸，例如本文所述的一种或多种引物或探针。技术人员将理解，所述多核苷酸可以包含在例如单个容器中，例如单个小瓶中，或包含在单独的容器中，例如单独的小瓶中。

应当理解，“特异性杂交”是指多核酸与(分子)标记等位基因杂交(例如在如本文别处定义的严格杂交条件下)，但与不包含所述标记等位基因的多核酸(基本上)不杂交，或(基本上)不能用作PCR引物。举例来说，在合适的读出中，具有标记等位基因的杂交信号或标记等位基因的PCR扩增比具有非标记等位基因或任何其它序列的杂交信号强至少5倍，优选至少10倍或更多。

一方面，本发明涉及如上所述的一组引物或探针，例如一组等位基因特异性引物或探针。在某些实施方案中，所述引物或探针组还可以包含(通用)正向或反向引物(取决于等位基因特异性引物是反向引物还是正向引物)。

一方面，本发明涉及包含此类多核酸的试剂盒，例如引物(包含正向引物(例如一种或多种等位基因特异性引物或可选地通用引物)和/或反向引物(例如通用引物或可选地一种或多种等位基因特异性引物))和/或探针(例如一种或多种等位基因特异性探针)。所述试剂盒还可包含使用说明。

应当理解，在涉及一组正向和反向引物的实施方案中，两种引物(正向或反向)中仅一个引物可能需要能够区分本发明的(分子)标记等位基因与非标记等位基因，因此可能是独特的。另一引物可以能够或不能区分本发明的(分子)标记等位基因与非标记等位基因，因此可以是或可以不是独特的。

一方面，本发明涉及包含本文所述的本发明的(分离的)多核酸的载体。在某些实施方案中，所述载体是(植物)表达载体。在某些实施方案中，所述载体是诱导型(植物)表达载体。在某些实施方案中，所述表达是组织或器官特异性表达。在某些实施方案中，所述表达是发育特异性表达。在某些实施方案中，所述表达是组织或器官特异性的并且是发育特异性的表达。

在某些实施方案中，所述载体包含SEQ ID NO:1-3、5-7、9-11、13-15、201、203、205或207中的任一个序列或其互补体，或其反向互补体，或其(独特的)片段，或与SEQ ID NO:1-3、5-7、9-11、13-15、201、203、205或207、或其互补体、或其反向互补体、或其(独特的)片段中的任一个或多个序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列。在某些实施方案中，所述载体包含多核酸或其互补体、或其反向互补体、或其(独特的)片段，所述多核酸编码SEQ ID NO:4、8、12、16、202、204、206或208的蛋白质，或与SEQ IDNO:4、8、12、16、202、204、206或208中任一个或多个序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列。在某些实施方案中，所述载体包含SEQ ID NO:1、5、9、13、201、203、205或207中的任一个序列，优选SEQ ID NO:1或201的序列，或其互补体，或其反向互补体，或其(独特的)片段，或与SEQ ID NO:1、5、9、13、201、203、205或207、优选SEQID NO:1或201、或其互补体、或其反向互补体、或其(独特的)片段中的任一个或多个序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列。在某些实施方案中，所述载体包含多核酸或其互补体、或其反向互补体、或其(独特的)片段，所述多核酸编码SEQ ID NO:202、204、206、208、优选SEQ ID NO:202的蛋白质，或与SEQ ID NO:202、204、206、208、优选SEQ ID NO:202中任一个或多个序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列。在某些实施方案中，所述载体包含SEQ ID NO:2-3、6-7、10-11、14-15、优选SEQ ID NO:2中的任一个序列，或其互补体，或其反向互补体，或其(独特的)片段，或与SEQ ID NO:2-3、6-7、10-11、14-15、优选SEQ ID NO:2或其互补体、或其反向互补体、或其(独特的)片段中的任一个或多个序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列。在某些实施方案中，所述载体包含多核酸或其互补体、或其反向互补体、或其(独特的)片段，所述多核酸编码SEQ ID NO:4、8、12、16、优选SEQ IDNO:4的蛋白质，或与SEQ ID NO:4、8、12、16、优选SEQ ID NO:4中任一个或多个序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列。此类多核酸如本文别处所述适合于鉴定植物或植物部分以及产生植物。

如本文所用，“载体”具有本领域中的普通含义，并且可以例如是质粒、粘粒、噬菌体或表达载体、转化载体、穿梭载体或克隆载体；其可以是双链或单链、线性或环状的；或者其可以通过整合到基因组中或在染色体外转化原核或真核宿主。根据本发明的核酸优选在载体中与允许在原核或真核宿主细胞中转录和任选表达的一个或多个调节序列可操作地连接。调节序列-优选DNA-可以与根据本发明的核酸同源或异源。例如，所述核酸处于合适的启动子或终止子的控制下。合适的启动子可以是组成型诱导的启动子(例如：来自“花椰菜花叶病毒”的35S启动子(Odell et al.,1985)；那些组织特异性的启动子尤其合适(例如：花粉特异性启动子，Chen et al.(2010)，Zhao et al.(2006)或Twell et al.(1991))，或者是发育特异性启动子(例如：开花特异性启动子)。合适的启动子也可以是合成的或嵌合的启动子，其不存在于自然界中，由多个元件组成，并含有一个最小启动子，以及在最小启动子的上游有至少一个顺式调节元件，作为特定转录因子的结合位点。嵌合启动子可以根据所需的特异性设计，并通过不同的因素诱导或抑制。此类启动子的实例可见于Gurr&Rushton(2005)或Venter(2007)。例如，合适的终止子是nos-终止子(Depicker et al.,1982)。所述载体可以通过接合、动员、基因枪转化、农杆菌介导的转化、转染、转导、真空渗透或电穿孔而引入。所述载体可以是质粒、粘粒、噬菌体或表达载体、转化载体、穿梭载体或克隆载体；其可以是双链或单链、线性或环状的。所述载体可以通过整合到其基因组中或在染色体外转化原核或真核宿主。

如本文所用，术语“可操作地连接”或“可操作连接”意指以这样的方式连接在共同的核酸分子中，使得连接的元件相对于彼此定位和定向，由此可以发生核酸分子的转录。与启动子可操作地连接的DNA处于这个启动子的转录控制之下。

一方面，本发明涉及如本文所述的根据本发明的多核酸或载体在产生玉米植物或植物部分中的用途。

在某些实施方案中，所述载体是表达载体。优选地，所述核酸在载体中与允许在原核或真核宿主细胞中转录和任选表达的一个或多个调节序列可操作地连接。调节序列可以与核酸同源或异源。例如，所述核酸处于合适的启动子或终止子的控制下。合适的启动子可以是组成型诱导的启动子，例如来自“花椰菜花叶病毒”的35S启动子(Odell et al.,1985.Identification of DNA sequences required for activity of the cauliflowermosaic virus35S promoter.)。特别合适的是组织特异性启动子，例如花粉特异性启动子，如Chen et al.(2010.Molecular Biology Reports 37(2):737-744)、Zhao et al.(2006.Planta 224(2):405-412)或Twell et al.(1991.Genes&Development 5(3):496-507)所述，以及发育特异性启动子，例如开花特异性启动子。合适的启动子还可以是合成的或嵌合的启动子，其在自然界中不存在并且由多个元件组成。这种合成的或嵌合的启动子可以含有最小启动子，以及至少一个用作特定转录因子的结合位点的顺式调节元件。嵌合启动子可以根据所需的细节进行设计，并且可以通过不同的因素来诱导或抑制。此类启动子的实例可见于Gurr&Rushton(2005.Trends in Biotechnology 23(6):275-282)或Venter(2007.Trends in Plant Science:12(3):118-124)。例如，合适的终止子是nos-终止子(Depicker et al.,1982.Journal of Molecular and Applied Genetics 1(6):561-573)。

在某些实施方案中，所述载体是条件表达载体。在某些实施方案中，所述载体是组成型表达载体。在某些实施方案中，所述载体是组织特异性表达载体，例如花粉特异性表达载体。在某些实施方案中，所述载体是诱导型表达载体。所有此类载体是本领域众所周知的。制备所述载体的方法对于本领域技术人员来说是司空见惯的(Sambrook et al.,2001)。

本文还研究了宿主细胞，例如植物细胞，其包含本文所述的核酸，优选本文所述的诱导促进核酸或编码双链RNA的核酸，或本文所述的载体。所述宿主细胞可以含有作为染色体外(附加型)复制分子的核酸，或包含整合到宿主细胞的核或质体基因组中的核酸，或作为引入的染色体的核酸，例如微型染色体。

宿主细胞可以是原核细胞(例如，细菌)或真核细胞(例如，植物细胞或酵母细胞)。例如，宿主细胞可以是农杆菌，例如根癌农杆菌(Agrobacterium tumefaciens)或发根农杆菌(Agrobacterium rhizogenes)。优选地，宿主细胞是植物细胞。

一方面，本发明涉及如本文所述的根据本发明的多核酸或载体在鉴定玉米植物或植物部分中的用途。

本文描述的核酸或本文描述的载体取决于所选择的宿主细胞可以通过众所周知的方法引入宿主细胞中，包括例如接合、动员、基因枪转化、农杆菌介导的转化、转染、转导、真空渗透或电穿孔。具体地，用于将核酸或载体引入农杆菌细胞中的方法是技术人员众所周知的并且可以包括接合或电穿孔方法。用于将核酸或载体引入植物细胞的方法也是已知的(Sambrook et al.,2001)，可以包括多种转化方法，例如基因枪转化和农杆菌介导的转化。

在具体的实施方案中，本发明涉及转基因植物细胞，其包含本文所述的核酸、特别是诱导促进核酸或编码双链RNA的核酸，以及如本文所述转基因或载体。在进一步的实施方案中，本发明涉及包含所述转基因植物细胞的转基因植物或其部分。

例如，这样的转基因植物细胞或转基因植物是优选用本文所述的核酸、特别是诱导促进核酸或编码双链RNA的核酸或如本文所述的载体稳定转化的植物细胞或植物。

优选地，转基因植物细胞中的核酸与允许在植物细胞中转录和任选表达的一种或多种调节序列可操作地连接。调节序列与所述核酸可以同源或异源。由根据本发明的核酸和调节序列组成的总体结构可以代表转基因。

一方面，本发明涉及本文所述的一种或多种(分子)标记(等位基因)在鉴定具有育性恢复基因(基因、基因座、单倍型、基因型或表型)的植物或植物部分中的用途。一方面，本发明涉及本文所述的一种或多种(分子)标记(等位基因)的用途，其能够检测至少一种诊断标记等位基因，用于鉴定例如具有育性恢复基因(基因、基因座、单倍型、基因型或表型)的植物或植物部分。一方面，本发明涉及检测本文所述的一种或多种(分子)标记等位基因，用于鉴定具有育性恢复基因(基因、基因座、单倍型、基因型或表型)的植物或植物部分。

一方面，本发明涉及通过本文所述的本发明方法鉴定的(玉米)植物或植物部分。在具体实施方案中，这包括从所述植物或植物部分获得的植物材料。

一方面，本发明涉及包含本文所述的一种或多种的本发明的(分子)标记(等位基因)、多核酸、基因座或载体(玉米)植物或植物部分。

一方面，本发明涉及包含表4或5的一种或多种(分子)标记(等位基因)的(玉米)植物或植物部分。

一方面，本发明涉及包含SEQ ID NO:1至208中一种或多种多核酸的(玉米)植物或植物部分。一方面，本发明涉及包含SEQ ID NO:17至200中的一种或多种多核酸的(玉米)植物或植物部分。在某些实施方案中，SEQ ID NO:17至200的多核酸对应于本发明的恢复基因的多核酸。在某些实施方案中，SEQ ID NO:17至200的多核酸对应于本发明的非恢复基因/保持基因的多核酸。技术人员将意识到，恢复基因和非恢复基因/保持基因之间的区分可以基于SEQ ID NO:17至200中“n”的相同性，也如本文别处所述(例如基于表4)。一方面，本发明涉及包含SEQ ID NO:68至140中的一种或多种多核酸的(玉米)植物或植物部分。一方面，本发明涉及包含SEQ ID NO:70、72、76、79、86、88、92、93、99、104、105、107、108、109、115和/或134中的一种或多种多核酸的(玉米)植物或植物部分。一方面，本发明涉及(玉米)植物或植物部分，其包含SEQ ID NO:1、5、9或13中的一种或多种多核酸，或与SEQ ID NO:1、5、9或13中的任一个或多个序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列，或SEQ ID NO:2、6、10、和14中的一或多个序列，或与SEQ ID NO:2、6、10、和14中任一个或多个序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列。一方面，本发明涉及(玉米)植物或植物部分，其包含编码Zm00001d043358、Zm00001d043352、Zm00001d043356和Zm00001d043357的一种或多种多核酸，所述多核酸分别具有SEQ ID NO:201、203、205和207所示编码序列，或与SEQ ID NO:201、203、205和207中任一个或多个序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列，或分别具有SEQ ID NO:3、7、11和15中任一个所示编码序列，或与SEQ ID NO:3、7、11和15中任一个或多个序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列。一方面，本发明涉及(玉米)植物或植物部分，其包含一种或多种多肽，所述多肽具有如SEQ ID NO:202、204、206或208中任一所示序列，或与SEQ ID NO:202、204、206或208中任一或多个序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列，或具有SEQ ID NO:4、8、12或16中任一所示序列，或与SEQ ID NO:4、8、12或16中任一个或多个序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列。优选地，所述植物或植物部分包含编码所述多肽的多核酸，其可以在载体上提供或者可以是基因组整合的。

在某些实施方案中，本文定义的标记(等位基因)、多核酸或基因座是纯合的。因此，在二倍体植物中，两个等位基因是相同的(至少就特定标记(等位基因)、多核酸或基因座而言)，在四倍体植物中，四个等位基因是相同的，以及在六倍体植物中，六个等位基因在标记(等位基因)、多核酸或基因座方面是相同的。在某些实施方案中，本文定义的标记(等位基因)、多核酸或基因座是杂合的。因此，在二倍体植物中，两个等位基因不相同，在四倍体植物中，四个等位基因不相同(例如，仅一个、两个或三个等位基因包含特定标记(等位基因)、多核酸或基因座)，以及在六倍体植物中，六个等位基因在突变或标记方面不相同(例如仅一个、两个、三个、四个或五个等位基因包含特定标记(等位基因)、多核酸或基因座)。类似的考虑也适用于假多倍体植物的情况。

一方面，本发明涉及产生(玉米)植物或植物部分的方法，包括在所述植物或植物部分(的基因组)中引入如本文定义的本发明多肽、多核酸、基因座(等位基因)或(分子)标记(等位基因)，或其(功能)片段。优选地，引入植物或植物部分是基因组引入。然而，在某些实施方案中，引入是非基因组引入，例如附加型引入。在某些实施方案中，引入是通过载体实现的，如本领域已知的并且也如本文别处所述。

一方面，本发明涉及一种产生(玉米)植物或植物部分的方法，包括向所述植物或植物部分(的基因组)中引入SEQ ID NO:1至208的一个或多个多核酸。一方面，本发明涉及产生(玉米)植物或植物部分的方法，包括向所述植物或植物部分(的基因组)中引入SEQ IDNO:17至200的一个或多个多核酸。在某些实施方案中，SEQ ID NO:17至200的多核酸酸对应于本发明的恢复基因的多核酸。在某些实施方案中，SEQ ID NO:17至200的多核酸对应于本发明的非恢复基因/保持基因的多核酸。技术人员将意识到，恢复基因与非恢复基因/保持基因之间的区分可以基于SEQ ID NO:17至200中“n”的相同性，也如本文别处所述(例如基于表4)。一方面，本发明涉及产生(玉米)植物或植物部分的方法，包括向所述植物或植物部分(的基因组)中引入SEQ ID NO:68至140的一个或多个多核酸。一方面，本发明涉及产生(玉米)植物或植物部分的方法，包括向所述植物或植物部分(的基因组)中引入SEQ ID NO:70、72、76、79、86、88、92、93、99、104、105、107、108、109、115和/或134的一个或多个多核酸。一方面，本发明涉及一种产生(玉米)植物或植物部分的方法，包括向所述植物或植物部分(的基因组)中引入SEQ ID NO:1、5、9或13的一个或多个多核酸，或与SEQ ID NO:1、5、9或13中的任一个或多个序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列，或SEQ ID NO:2、6、10和14中的一个或多个序列，或与SEQ ID NO:2、6、10和14中任一个或多个序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列。一方面，本发明涉及产生(玉米)植物或植物部分的方法，包括向所述植物或植物部分(的基因组)中引入编码Zm00001d043358、Zm00001d043352、Zm00001d043356和Zm00001d043357的一个或多个多核酸，所述多核酸分别具有如SEQ ID NO:201、203、205和207中任一所示的编码序列，或与SEQ ID NO:201、203、205和207中任一个或多个序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列，或分别具有SEQ ID NO:3、7、11和15所示任一编码序列，或与SEQ ID NO:3、7、11和15中任一个或多个序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列。一方面，本发明涉及产生(玉米)植物或植物部分的方法，包括向所述植物或植物部分中引入一种或多种多肽，所述多肽具有SEQ ID NO:202、204、206或208所示任一序列，或与SEQ ID NO:202、204、206或208中任一个或多个序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列，或具有SEQ IDNO:4、8、12或16任一所示序列，或与SEQ ID NO:4、8、12或16中任一个或多个序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列。优选地，所述植物或植物部分包含编码多肽的多核酸，其可以提供在载体上或者可以是基因组整合的。一方面，本发明涉及一种产生(玉米)植物或植物部分的方法，包括向所述植物或植物部分(的基因组)中引入编码多肽的一个或多个多核酸，所述多肽具有SEQ ID NO:202、204、206或208任一所示序列，或与SEQ ID NO:202、204、206或208中任一个或多个序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列，或具有SEQ ID NO:4、8、12或16任一所示序列，或与SEQ ID NO:4、8、12或16中任一个或多个序列至少80％、优选至少85％、更优选至少90％、最优选至少95％相同的序列。

技术人员将理解优选地引入基因组序列。

在某些实施方案中，本文提及的引入(至基因组中)包括转基因法。

在某些实施方案中，本文提及的引入(至基因组中)包括转化。

在某些实施方案中，本文提及的引入(至基因组中)包括重组，例如同源重组。

在某些实施方案中，本文提及的引入(至基因组中)包括诱变。

在某些实施方案中，本文提及的引入(至基因组中)包括基因渗入。在某些实施方案中，本文提及的引入至基因组中不包括基因渗入。

在某些实施方案中，本文提及的引入至基因组中包括引入至植物部分的基因组中。在某些实施方案中，所述植物部分是植物器官。在某些实施方案中，所述植物部分是植物组织。在某些实施方案中，所述植物部分是植物细胞。在某些实施方案中，所述植物部分是原生质体。

在某些实施方案中，本文提及的引入至基因组中包括在体外引入基因组中。在某些实施方案中，本文提及的引入至基因组中包括在体内引入基因组中。

在某些实施方案中，产生玉米植物或植物部分的方法包括用本文别处所述的多核酸转化植物或植物部分、优选植物细胞、更优选原生质体，以及任选从所述植物细胞、优选原生质体中再生植物。

在某些实施方案中，所述转化的植物或植物部分不内源地包含如本文所述的根据本发明的多核酸。

在某些实施方案中，所述转化的植物或植物部分不内源地包含如本文所述的根据本发明的一个或多个分子标记(等位基因)。

在某些实施方案中，根据本发明获得或产生如本文所述的植物或植物部分的方法涉及或包括转基因和/或基因编辑，例如包括CRISPR/Cas、TALEN、ZFN、大范围核酸酶；(诱导的)诱变，可以是或可以不是随机诱变，例如TILLING。

在某些实施方案中，根据本发明获得如本文所述的植物或植物部分的方法不涉及或包括转基因、基因编辑和/或诱变。

在某些实施方案中，根据本发明获得如本文所述的植物或植物部分的方法涉及、包括或由繁育和/或选择组成。

在某些实施方案中，根据本发明获得如本文所述的植物或植物部分的方法不涉及、包括或由繁育组成。

一方面，本发明涉及如本文所述的通过根据本发明的方法获得或可获得的玉米植物或植物部分，所述方法例如是鉴定玉米植物或植物部分的方法或产生玉米植物或植物部分的方法。本发明还涉及此类植物的后代。

一方面，本发明涉及如本文所述的包含根据本发明的多核酸的玉米植物或植物部分。在某些实施方案中，所述多核酸等位基因是纯合的。在某些实施方案中，所述多核酸等位基因是杂合的。

一方面，本发明涉及如本文所述的包含根据本发明的任一个或多个分子标记(等位基因)的玉米植物或植物部分。在某些实施方案中，所述分子标记(等位基因)是纯合的。在某些实施方案中，所述分子标记(等位基因)是杂合的。

在某些实施方案中，所述玉米植物不是玉米品种。在某些实施方案中，所述植物不排他地通过基本的生物学工艺获得。在某些实施方案中，所述植物通过包含除杂交之外的至少一个步骤的方法获得，即筛选本文所述的多核苷酸的存在。

如本文别处所述，在某些实施方案中，此类(玉米)植物或植物部分不内源性地包含所列举的多核酸。

在某些实施方案中，所述玉米植物或植物部分是转基因的、基因编辑的或诱变的。在某些实施方案中，所述玉米植物或植物部分是转基因的、基因编辑的或诱变的，以便包含如本文所述的根据本发明的一个或多个分子标记(等位基因)、或一种或多种所述多核酸。

一方面，本发明涉及产生(玉米)植物或植物部分的方法，包括(a)提供根据本发明的或根据本发明鉴定的或根据本发明产生的第一(玉米)植物，(b)使所述第一(玉米)植物与具有细胞质雄性不育性的第二玉米植物杂交；以及任选地(d)从后代收获所述(玉米)植物部分。

一方面，本发明涉及产生(玉米)植物或植物部分的方法，包括(a)提供根据本发明的或根据本发明鉴定的或根据本发明产生的第一(玉米)植物，(b)使所述第一(玉米)植物与具有细胞质雄性不育性的第二玉米植物杂交；以及任选地(d)从后代收获所述(玉米)植物部分，其中所述第一植物是恢复基因系(优选本发明的恢复基因系)。

一方面，本发明涉及产生(玉米)植物或植物部分的方法，包括(a)提供根据本发明的或根据本发明鉴定的或根据本发明产生的第一(玉米)植物，(b)使所述第一(玉米)植物与具有细胞质雄性不育性的第二玉米植物杂交；以及任选地(d)从后代收获所述(玉米)植物部分，其中所述第二植物是恢复基因系(优选本发明的恢复基因系)。

一方面，本发明涉及产生(玉米)植物或植物部分的方法，包括(a)提供根据本发明的或根据本发明鉴定的或根据本发明产生的第一(玉米)植物，(b)使所述第一(玉米)植物与具有细胞质雄性不育性的第二玉米植物杂交；以及任选地(d)从后代收获所述(玉米)植物部分，其中所述第一植物不是恢复基因系(优选不是本发明的恢复基因系)。

一方面，本发明涉及产生(玉米)植物或植物部分的方法，包括(a)提供根据本发明的或根据本发明鉴定的或根据本发明产生的第一(玉米)植物，(b)使所述第一(玉米)植物与具有细胞质雄性不育性的第二玉米植物杂交；以及任选地(d)从后代收获所述(玉米)植物部分，其中所述第二植物不是恢复基因系(优选不是本发明的恢复基因系)。

一方面，本发明涉及产生(玉米)植物或植物部分的方法，包括(a)提供根据本发明的或根据本发明鉴定的或根据本发明产生的第一(玉米)植物，(b)使所述第一(玉米)植物与具有细胞质雄性不育性的第二玉米植物杂交；以及任选地(d)从后代收获所述(玉米)植物部分，其中所述第一植物是恢复基因系(优选本发明的恢复基因系)，并且其中所述第二植物不是恢复基因系(优选不是本发明的恢复基因系)。

一方面，本发明涉及产生(玉米)植物或植物部分的方法，包括(a)提供根据本发明的或根据本发明鉴定的或根据本发明产生的第一(玉米)植物，(b)使所述第一(玉米)植物与具有细胞质雄性不育性的第二玉米植物杂交；以及任选地(d)从后代收获所述(玉米)植物部分，其中所述第一植物不是恢复基因系(优选不是本发明的恢复基因系)，并且其中所述第二植物是恢复基因系(优选本发明的恢复基因系)。

一方面，本发明涉及产生(玉米)植物或植物部分的方法，包括使第一(玉米)植物与第二玉米植物杂交，并选择包含如本文所述的基因座、单倍型、多核酸、标记(等位基因)、多态性或SNP中的任一或多项的后代。

一方面，本发明涉及产生(玉米)植物或植物部分的方法，包括使第一(玉米)植物与第二玉米植物杂交，并选择缺乏如本文所述的基因座、单倍型、多核酸、标记(等位基因)、多态性或SNP中的任一或多项的后代。

一方面，本发明涉及产生(玉米)植物或植物部分的方法，包括使第一(玉米)植物与第二玉米植物杂交，并选择包含如本文所述的恢复基因(相关的)基因座、单倍型、多核酸、标记(等位基因)、多态性或SNP中的任一或多项的后代。

一方面，本发明涉及产生(玉米)植物或植物部分的方法，包括使第一(玉米)植物与第二玉米植物杂交，并选择缺乏如本文所述的恢复基因(相关的)基因座、单倍型、多核酸、标记(等位基因)、多态性或SNP中任一或多项的后代。

一方面，本发明涉及产生(玉米)植物或植物部分的方法，包括使第一(玉米)植物与第二玉米植物杂交，并选择包含如本文所述的保持基因(相关的)基因座、单倍型、多核酸、标记(等位基因)、多态性或SNP中任一或多项的后代。

一方面，本发明涉及产生(玉米)植物或植物部分的方法，包括使第一(玉米)植物与第二玉米植物杂交，并选择缺乏如本文所述的保持基因(相关的)基因座、单倍型、多核酸、标记(等位基因)、多态性或SNP中任一或多项的后代。

优选地，所述第一或第二植物是细胞质雄性不育植物。

所述恢复基因或保持基因基因座、单倍型、多核酸、标记(等位基因)、多态性或SNP可包含表4或5中列出的相应标记、多态性或SNP。

在某些实施方案中，选择不包含本发明的恢复基因座的植物或植物部分。

在某些实施方案中，选择包含本发明的恢复基因座的植物或植物部分。

本发明的各方面和实施方案由以下非限制性实施例进一步支持。提供以下实施例、包括进行的实验和获得的结果，仅用于示例说明目的，并不构成对本发明的限制。

实施例

实施例1：3号染色体上玉米恢复基因型的鉴定

在过去的几年中，在雌性繁育库4中观察到CMSC恢复基因系的比例较高，但这些恢复基因系中只有部分携带恢复基因RF4。

本发明人测试了具有库4表型的374个玉米品系的RF4的存在和各自的恢复表型(表1)。数据显示所述库中似乎存在一个或多个其它恢复基因。使用所有不携带RF4的库4品系进行的GWAS分析证实了这一假设，并显示对3号染色体有明显的影响(图1)。新的恢复基因被命名为RF-03-01。

表1：RF4恢复基因的存在/不存在(RF4+/rf4-)的分析

单倍型	保持基因	恢复基因
			RF4+	1	45
rf4-	174	93

对143个恢复和未恢复库4品系(全部不含RF4)的600k数据进行的分析显示，0.25Mb的基因组区域与恢复相关。在分析的材料中，仅存在两种单倍型，其中一种解释了恢复情况。所述单倍型含有64个多态性600k标记(表4：标识符52、53、55、57-71、73-75、78-88、90、94-124)，其处于高度连锁不平衡(LD)状态。所有库4品系(包括RF4携带者)的14％携带RF-03-01恢复基因单倍型。

表2：单倍型分析

单倍型	保持基因	恢复基因
			A	100	22
B	0	21

单倍型A的恢复基因部分只能通过迄今为止未鉴定的进一步的微小恢复基因来解释。

根据AGPv4注释，3号染色体上的区域含有6个基因(https://www.maizegdb.org/genome/assembly/Zm-B73-REFERENCE-GRAMENE-4.0)，其中4个在花粉中表达，1个参与线粒体组构，从而代表最突出的候选基因(Zm00001d043358)。所有四个基因在两个单倍型之间都是多态性的。

表3：候选基因列表

开发了16个KASP标记(表4：标识符54、56、60、63、70、72、76、77、83、88、89、91、92、93、99和118)，可用于检测单倍型，部分通过600k标记的转化进行检测，部分通过在候选基因内使用新的SNP进行检测。

将这些标记与已知的RF4标记组合使用，可以检测库4中最重要的恢复基因，并在杂交玉米品系的开发过程中为指定品系决定最合理的转化策略。一般来说，表4中列出的所有标记均可用于此目的。此外，图2至5示出了源自RF-03-01恢复基因型和参考基因型(B73)的候选基因的基因组DNA的序列比对。以黑色和白色突出显示的字母是多态性，它们还适合检测不需要的恢复基因型。关于根据表4的标记列表，具有标识符52至124的标记示出与3号染色体上的恢复基因座100％相关。因此，参考B73 AGPv4的从位置197453646到197698278的区域最适合作为RF-03-01恢复基因型的标记相关鉴定的靶位点。对应于位置195629901至196989408和位置197708137至198023573的区域的标识符1至51和125至184的标记也可用于鉴定，因为在大多数基因型(主要等位基因)中都可以发现潜在的多态性，但并不是100％连锁的。

RF-03-01也存在于flint库中用作雄性，尽管所述库对恢复的影响低于库4。无论如何，在这个库中也应充分了解恢复基因，因为恢复雄性系对于cms的效用很重要。在仅存在RF-03-01而不存在RF4的情况中，所述恢复可能会太弱，或者在某些环境中可能会失败，因为这个恢复基因不如RF4稳定。因此，除了表型分析之外，良好的基因分型方法对于安全生产也很重要。

表4：标记列表；标记序列可见于最后一列所示各个SEQ ID NO下的序列表中找到。此外，在标识符<223>下的序列表中，定义了多态性在标记序列中的位置(@后面的数字给出了在序列中的位置)。因此，位置“n”对应于能够区分恢复基因和非恢复基因/保持基因的多态性。

/>

表5：基于图2至5的标记列表。针对各自的SEQ ID NO标示了核苷酸位置

/>

Claims

1.一种鉴定玉米植物或植物部分的方法，包括筛选在3号染色体上的细胞质雄性不育性(育性)恢复基因座(RF-03-01)(与其相关的单倍型)的存在。

2.根据权利要求1所述的方法，其中所述基因座包含或被包含在3号染色体上对应于B73 AGPv4的位置195629901至198023573、优选对应于B73 AGPv4的位置197453646至197698278或其片段的区域。

3.根据权利要求1至2中任一项所述的方法，其中所述基因座包含表4或表5的一个或多个分子标记(等位基因)。

4.根据权利要求1至3中任一项所述的方法，其中所述基因座包含多核酸，所述多核酸包含SEQ ID NO:1、5、9和13中的一个或多个序列，或与SEQ ID NO:1、5、9和13中任一个或多个序列具有至少80％、优选至少85％、更优选至少90％、最优选至少95％的相同性的序列；或者包含SEQ ID NO:2、6、10和14中的一个或多个序列，或与SEQ ID NO:2、6、10和14中任一个或多个序列具有至少80％、优选至少85％、更优选至少90％、最优选至少95％的相同性的序列。

5.根据权利要求1至4中任一项所述的方法，包括筛选SEQ ID NO:17至200中的任一个或多个序列的存在。

6.根据权利要求1至5中任一项所述的方法，包括筛选SEQ ID NO:1、5、9和13中任一或多个序列，或与SEQ ID NO:1、5、9和13中任一或多个序列具有至少80％、优选至少85％、更优选至少90％、最优选至少95％相同性的序列的存在；或筛选SEQ ID NO:2、6、10和14中一或多个序列，或与SEQ ID NO:2、6、10和14中任一或多个序列具有至少80％、优选至少85％、更优选至少90％、最优选至少95％相同性的序列的存在。

7.根据权利要求4至6中任一项所述的方法，其中与SEQ ID NO:1、5、9或13中任一个或多个序列具有至少80％、优选至少85％、更优选至少90％、最优选至少95％相同性的序列包含表5中列出的一种或多种、优选全部各自相关的(恢复基因)多态性。

8.根据权利要求4至6中任一项所述的方法，其中与SEQ ID NO:2、6、10或14中的任一个或多个序列具有至少80％、优选至少85％、更优选至少90％、最优选至少95％相同性的序列包含表5中列出的一种或多种、优选全部各自相关的(保持基因)多态性。

9.根据权利要求1至8中任一项所述的方法，其是用于区分具有所述在3号染色体上的细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)的玉米植物或植物部分与不具有所述在3号染色体上的细胞质雄性不育(育性)恢复基因座RF-03-01)(与其相关的单倍型)的玉米植物的方法。

10.根据权利要求1至9中任一项所述的方法，其中如果检测到在3号染色体上的细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)，则所述玉米植物或植物部分被鉴定为具有所述在3号染色体上的细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)。

11.根据权利要求1至9中任一项所述的方法，其中如果未检测到在3号染色体上的细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)，则所述玉米植物或植物部分被鉴定为不具有所述在3号染色体上的细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)。

12.根据权利要求1至9中任一项所述的方法，其中如果检测到表4或表5的一个或多个恢复基因分子标记等位基因，则所述玉米植物或植物部分被鉴定为具有所述在3号染色体上的细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)。

13.根据权利要求1至9中任一项所述的方法，其中如果未检测到表4或表5的一个或多个恢复基因分子标记等位基因，或者检测到表4或表5的一个或多个保持基因分子标记等位基因，则所述玉米植物或植物部分被鉴定为具有所述在3号染色体上的细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)。

14.根据权利要求1至9中任一项所述的方法，其中如果检测到SEQ ID NO:1、5、9和13中的一个或多个序列或与SEQ ID NO:1、5、9和13中的任一个或多个序列具有至少80％、优选至少85％、更优选至少90％、最优选至少95％相同性的序列，则所述玉米植物或植物部分被鉴定为具有所述在3号染色体上的细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)。

15.根据权利要求1至9中任一项所述的方法，其中如果未检测到SEQ ID NO:1、5、9和13中的一个或多个序列或与SEQ ID NO:1、5、9和13中的任一个或多个序列具有至少80％、优选至少85％、更优选至少90％、最优选至少95％相同性的序列，或者检测到SEQ ID NO:2、6、10和14中的一个或多个序列或与SEQ ID NO:2、6、10和14中的任一个或多个序列具有至少80％、优选至少85％、更优选至少90％、最优选至少95％相同性的序列，则所述玉米植物或植物部分被鉴定为具有所述在3号染色体上的细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)。

16.根据权利要求1至9中任一项所述的方法，其中如果检测到具有恢复基因SNP的SEQID NO:17至200的一个或多个序列，则所述玉米植物或植物部分被鉴定为具有所述在3号染色体上的细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)。

17.根据权利要求1至9中任一项所述的方法，其中如果未检测到具有恢复基因SNP的SEQ ID NO:17至200的一个或多个序列，或者检测到具有保持基因SNP的SEQ ID NO:17至200的一个或多个序列，则所述玉米植物或植物部分被鉴定为具有所述在3号染色体上的细胞质雄性不育(育性)恢复基因座(RF-03-01)(与其相关的单倍型)。

18.一种(分离的)多核酸，或所述多核酸的互补体或反向互补体，所述多核酸包含表4或表5的一个或多个分子标记(等位基因)。

19.一种(分离的)多核酸，其包含或由SEQ ID NO:1、5、9和13中的一个或多个序列或其片段、或与SEQ ID NO:1、5、9和13中任一个或多个序列或其片段具有至少80％、优选至少85％、更优选至少90％，最优选95％相同的序列组成；或包含或由SEQ ID NO:2、6、10和14中的一个或多个序列或其片段、或与SEQ ID NO:2、6、10和14中任一个或多个序列或其片段具有至少80％、优选至少85％、更优选至少90％、最优选至少95％相同性的序列组成。

20.根据权利要求19所述的方法，其中与SEQ ID NO:1、5、9或13中任一个或多个序列具有至少80％、优选至少85％、更优选至少90％、最优选至少95％的相同性的序列包含表5中列出的一种或多种、优选全部各自相关的(恢复基因)多态性。

21.根据权利要求19所述的方法，其中与SEQ ID NO:2、6、10或14中任一个或多个序列具有至少80％、优选至少85％、更优选至少90％、最优选至少95％的相同性的序列包含表5中列出的一种或多种、优选全部各自相关的(保持基因)多态性。

22.一种包含至少15个连续核苷酸的(分离的)多核酸或所述多核酸的互补体或反向互补体，所述至少15个连续核苷酸被包含在对应于两侧是下表中指示的任何5’和3’位置的区域的区域中，并且所述至少15个连续多核酸包含对应于参考玉米3号染色体B73AGPv4指示的SNP位置的核苷酸。

23.根据权利要求18或22所述的(分离的)多核酸，其包含恢复基因分子标记等位基因、多态性或SNP。

24.根据权利要求18或22所述的(分离的)多核酸，其包含保持基因分子标记等位基因、多态性或SNP。

25.根据权利要求18至24中任一项所述的(分离的)多核酸，其包含至多500个核苷酸，优选至多200个核苷酸，更优选至多100个核苷酸，最优选至多50个核苷酸，例如至多35个核苷酸。

26.根据权利要求18至25中任一项所述的(分离的)多核酸，其是引物或探针。

27.根据权利要求18至26中任一项所述的(分离的)多核苷酸，其是等位基因特异性引物或探针，优选KASP引物。

28.一种玉米植物或植物部分，其包含表4或表5中的一个或多个分子标记(等位基因)、权利要求1至17中任一项定义的基因座、和/或权利要求18至27中任一项定义的多核酸。

29.一种产生玉米植物或植物部分的方法，包括向所述植物或植物部分的基因组中引入权利要求1至17中任一项定义的基因座或权利要求18至27中任一项定义的多核酸，或其(功能)片段。

30.根据权利要求29所述的方法，包括向所述植物或植物部分的基因组中引入权利要求1至17中任一项定义的基因座或权利要求19至21或23至24中任一项定义的多核酸，或其(功能)片段。

31.根据权利要求29或30所述的方法，其中所述多核酸是两侧是分子标记ma0016fm86和ma0004tr23的基因组多核酸。

32.根据权利要求29或30所述的方法，其中所述多核酸是两侧是分子标记ma0000sa77和ma0016fu05的基因组多核酸。

33.根据权利要求29至32中任一项所述的方法，其中所述基因座或多核酸包含表5的保持基因多态性。

34.根据权利要求29至33中任一项所述的方法，其中所述基因座或多核酸包含表4的保持基因多态性。

35.根据权利要求29至32中任一项所述的方法，其中所述基因座或多核酸包含表5的恢复基因多态性。

36.根据权利要求29至32或35中任一项所述的方法，其中所述基因座或多核酸包含表4的恢复基因多态性。

37.根据权利要求29至36中任一项所述的方法，包括使第一玉米植物和第二玉米植物杂交，并选择包含权利要求1至17中任一项定义的基因座或权利要求18至27中任一项定义的多核酸的后代。

38.根据权利要求37所述的方法，包括选择不包含权利要求1至17或33至36中任一项定义的恢复基因座和/或不包含具有权利要求18至27或30至36任一项中定义的恢复基因多态性或SNP的多核酸的后代。

39.根据权利要求37或38所述的方法，其中所述第一或第二玉米植物是细胞质雄性不育玉米植物。

40.根据权利要求18至27中任一项的多核酸在鉴定玉米植物或植物部分或产生玉米植物或植物部分中的用途。

41.根据权利要求18至27中任一项的多核酸在鉴定玉米植物或植物部分中的用途。

42.根据权利要求19至21或23至24中任一项的多核酸在产生玉米植物或植物部分中的用途。