CN103184275A - 一种水稻基因组基因标识的新方法 - Google Patents
一种水稻基因组基因标识的新方法 Download PDFInfo
- Publication number
- CN103184275A CN103184275A CN2011104496411A CN201110449641A CN103184275A CN 103184275 A CN103184275 A CN 103184275A CN 2011104496411 A CN2011104496411 A CN 2011104496411A CN 201110449641 A CN201110449641 A CN 201110449641A CN 103184275 A CN103184275 A CN 103184275A
- Authority
- CN
- China
- Prior art keywords
- gene
- breeding
- variety
- genome
- identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
一种水稻基因组基因标识的新方法1基因组测序与数据分析。2品种特异基因标识。提供全基因组标识,代表品种全基因组特异性。提供基因标识,揭示品种基因结构、基因功能。揭示品种来源、昭示新一代品种基因特征。基于分子育种,发展设计育种,发展新一代品种。现代育种往往采用常规育种与分子育种方法相结合。约有半数的育种家在发展“设计育种计划”,未来的育种更多地依赖核心种质、骨干亲本和推广品种。本技术具有持续降低成本、提高育种效能、发展系列品种的有益效果。
Description
技术领域
本发明属于生物学的基因组基因标识方法,特别涉及一种水稻基因组基因标识的新方法。
背景技术
在科学层面,国际上陆续发明了第一代、第二代、第三代分子标记。这些标记用于DNA指纹制作,定位基因,分子标记辅助选择,鉴定真假杂种,甚至有的还用于标记某些特定基因。在一些生物保护中,还有用一些标识物(如大熊猫粪便)标识动物存在,预测种群数量等。在医学领域,有的用标识物(如肠粘膜脱落细胞)标识直肠癌病程特征。在一些癌症预后中,还有标识数个基因的报道。在技术层面,小卫星DNA指纹、微卫星标记、SNP单倍型、基因序列等,都有相关技术开发,用以标识品种专利、品种保护权的先例。
对作物品种,通过品种审定、品种保护、专利保护等一系列措施,在一定程度上保护了品种所有权人的发明权和使用权。
但是,以上技术具有如下问题及不足:
(1)专属技术界定不足
在水稻、玉米、小麦、大豆、棉花等主要作物中,某些核心亲本作为公共亲本配租,决定了品种特异性、一致性、稳定性等方面的“实质等同”(没有根本的区别或足够大的区别)。以水稻品种“丰两优1号”(广占63/93-11)和“扬两优6号”(广占63/扬稻6号)两个品种(组合)没有很大的差别。因为扬稻6号和9311本来就是一个基本品种的两个名称。在玉米品种指纹绘制中,一般也只是几个微卫星标记的标记,在核心亲本被用来作为主要配租亲本的现有育种体系中,难免以更换名称、寻找变异系等方式提交品种权申请,生产姊妹系等方式投入生产,专属技术界定不足。
(2)缺乏足够的“质”、“量”界定
以几个微卫星标记指纹图谱,一个或几个基因界定品种,无论在“质”或“量”上都显不足。微卫星只是基因组中重复序列的一种,2-6个碱基的重复一般不能说明重要性状的实质。而一个或少数几个基因的界定也同样不能界定一个品种的本质特征。一般而言,品种属性应是更多性状属性的总和。以产量、株高、生育期、品质等农艺性为例,多是由数量性状位点(QTL)决定的复杂性状,一般不能简单的由一个基因或少数几个基因决定。
(3)缺乏“系谱学”依据
品种多是由系谱决定的特殊基因型或生态型。以水稻杂交组合“汕优63”(珍汕97A/明恢63)为例,父本“明恢63”的亲本组合为“IR30/圭630”。汕优63是我国推广面积最大的杂交组合。由明恢63为亲本,选育出131个恢复系,审定249个杂交组合。其中,恢复系198的系谱是DT713/明恢63,仍然保持了明恢63理想株形、分蘖力强、群体繁茂的特点。现有的标记体系难以体现系谱特征和品种缘源。
发明内容
本发明所要解决的技术问题:通过全基因组测序、特定单倍型鉴定、目标基因跟踪,增加技术鉴定的性质和成分。
以几个微卫星标记指纹图谱,一个或几个基因界定品种,无论在“质”或“量”上都显不足。微卫星只是基因组中重复序列的一种,2-6个碱基的重复一般不能说明重要性状的实质。而一个或少数几个基因的界定也同样不能界定一个品种的本质特征。一般而言,品种属性应是更多性状属性的总和。以产量、株高、生育期、品质等农艺性为例,多是由数量性状位点(QTL)决定的复杂性状,一般不能简单的由一个基因或少数几个基因决定。
1)增加标记数量---由现有技术体系的一个或少数几个标记改为全基因组SNP标记。
2)建立基因标识体系---由“分子标记”改为“基因标识”。
分子标记定义:有A则有B,则B为A的分子标记。
基因标识定义:与品种特异性、稳定性、一致性有关的形态特征、酶学变化、分子标记、多态基因、特有基因、品种单倍型、品种基因型、品种基因构型的总称。
由分子标记改为基因标识后,更直接,更本质。
(2)缺乏足够的“质”、“量”界定
以几个微卫星标记指纹图谱,一个或几个基因界定品种,无论在“质”或“量”上都显不足。微卫星只是基因组中重复序列的一种,2-6个碱基的重复一般不能说明重要性状的实质。而一个或少数几个基因的界定也同样不能界定一个品种的本质特征。一般而言,品种属性应是更多性状属性的总和。以产量、株高、生育期、品质等农艺性为例,多是由数量性状位点(QTL)决定的复杂性状,一般不能简单的由一个基因或少数几个基因决定。
品种标识需要从“质”和“量”两个方面界定。
1)“质”的界定
品种的“质”主要表现为,该品种与其他品种显著不同(特异性)。比如,产量、品质、抗性、适应性(如生育期、抽穗期、灌浆期、收获期等),至少,全基因组标识中包括一个重要基因标识(如上描述)。
2)“量”的界定
品种在“量”的表现为,基因组有显著的差别。比如,该品种基因组(个体基因组)与其他品种基因组有1%的差别。
要解决的技术问题:在“质”和“量”两个向度做出标识。
(3)缺乏“系谱学”依据
品种多是由系谱决定的特殊基因型或生态型。以水稻杂交组合“汕优63”(珍汕97A/明恢63)为例,父本“明恢63”的亲本组合为“IR30/圭630”。汕优63是我国推广面积最大的杂交组合。由明恢63为亲本,选育出131个恢复系,审定249个杂交组合。其中,恢复系198的系谱是DT713/明恢63,仍然保持了明恢63理想株形、分蘖力强、群体繁茂的特点。现有的标记体系难以体现系谱特征和品种缘源。
要解决的技术问题:
一个品种系谱学依据,主要从以下两个方面获取:
1)全基因组结构与基因组成
从全基因组结构看,能反映品种遗传结构结构的轮廓(profile)。
2)主要农艺性状基因
从主要农艺性状基因看,可以了解基因组成、基因来源和基因交换(如籼粳杂交基因组印记)。
根据“进化非同步理论”,全基因组进化和重要农艺性状基因进化可能存在非同步现象。这为我们解决“全基因组基因标识”提供了理论依据和技术依据。
技术方案:
(1)基因组测序与数据分析
测序采用重测序原理,基因组DNA切割成500bp片段,同时进行两端测序,读取双末端各90bp片段序列。所得序列与参考基因组序列(日本晴基因组序列)进行比对。分析方法如下:
1)比对
所有测序所得的短序列通过SOAPaligner和参考序列进行比对,在比对时,所有reads都经过了如下的处理:如果一个原始的read无法比对上参考序列,其第一个和最后两个碱基将会被去除,之后再和参考序列进行比对。如果仍然无法匹配,则再去掉最后两个碱基再比对,迭代进行,直到能够匹配或reads短于某一固定长度(一般27bp)为止。根据比对结果,计算出平均深度和覆盖度。
2)一致序列组装和SNP检测
根据比对结果,综合考虑数据特征、测序质量及实验方面的影响因素,利用贝叶斯模型,在实际观察到的数据基础上计算出每个可能的基因型概率。挑选出概率最大的基因型作为该测序个体的特定位点的基因型,并在此基础上给出一个反映该基因型准确的质量值,并且得到一致序列。在一致序列的基础上,对于参考序列存在着多态性的位点进行筛选和过滤,例如要求质量值【Q:Q=-10lge(e为碱基测序错位率)】大于20,最少2个(这个数受到测序深度的影响,不同测序深度可能有所不同)reads支持等。并且符合以下三个条件:Q20质量截止(质量值Q20以下的SNPs过滤掉),Copy number数小于2(指覆盖该位点reads唯一性的平均数),SNP位点彼此至少相隔5bp。
3)Short InDel检测
在Short InDel检测中,比对reads必须满足paired-end要求,并且仅在一个末端包含比对上的gap。容许1-10bp Indels的paired-end比对。
在Indels检测过程中,需整合候选的Indels。Gaps至少需要3对非冗余的paired-end reads支持。覆盖候选Indel的un-gap reads数低于2才能进行Indel检测。
4)SV(结构变异)检测
根据双末端的测序原理,正常情况下,paired-end的两个reads,一个可以比对上正链(forward),另一个比对上负链(reverse),两个reads比对后的距离应该与插入片段大小一致。即成对的两条reads比对到基因组时应该有正常的方向和合适的跨度。如果在比对结果中,成对的两条reads的方向或跨度与预期不一致,则该区域有可能发生结构变异。通过将异常的paired-end比对结果进行聚类分析,并与预先定义的结构性变异类型进行比较。可以据此进行结构变异检测,一般至少要有3对异常的paired-end支持。当两对paired-end能正常读取时,由于测试品种中间paired-end缺失,根据该区域参考基因组序列和待测基因组序列的比较结果,可以确定该区域插入或缺失。
(2)品种特异基因标识
1)染色体倒位标识
检测到染色体倒位后,确定倒位两侧位置、两侧Reads及其序列、两侧转座子,然后绘制染色体倒位图谱。染色体倒位区内基因(倒位圈)及两侧基因(倒位圈附近)进行列表。如果涉及到插入或缺失,则同时对插入、缺失“事件”列表,分析其基因效应。进而,绘制染色体倒位基因效应图。
2)品种特异基因标识
品种特异性是由品种特异基因、特定基因组合或特定表达程式决定的。对特异性基因,通过测序、相关预测或相关技术处理,做出品种特异基因(或特异基因表达)图谱。
本技术有益效果:
本技术的工作原理是:基于分子育种,发展设计育种,发展新一代品种。现代育种者多采用分子育种方法。约有半数的育种家在发展“设计育种计划”,未来的育种更多地依赖核心种质、骨干亲本和正推广品种。因而,本技术具有持续降低成本、提高育种效能、发展系列品种的有益效果。
附图说明
图1是水稻品种全基因组标识原理与组成。
图2是具体实施方式。
图3是染色体倒位图。
具体实施方式
(1)基因组测序与数据分析
测序采用重测序原理,基因组DNA切割成500bp片段,同时进行两端测序,读取双末端各90bp片段序列。所得序列与参考基因组序列(日本晴基因组序列)进行比对。分析方法如下:
1)比对
所有测序所得的短序列通过SOAPaligner和参考序列进行比对,在比对时,所有reads都经过了如下的处理:如果一个原始的read无法比对上参考序列,其第一个和最后两个碱基将会被去除,之后再和参考序列进行比对。如果仍然无法匹配,则再去掉最后两个碱基再比对,迭代进行,直到能够匹配或reads短于某一固定长度(一般27bp)为止。根据比对结果,计算出平均深度和覆盖度。
2)一致序列组装和SNP检测
根据比对结果,综合考虑数据特征、测序质量及实验方面的影响因素,利用贝叶斯模型,在实际观察到的数据基础上计算出每个可能的基因型概率。挑选出概率最大的基因型作为该测序个体的特定位点的基因型,并在此基础上给出一个反映该基因型准确的质量值,并且得到一致序列。在一致序列的基础上,对于参考序列存在着多态性的位点进行筛选和过滤,例如要求质量值【Q:Q=-10lge(e为碱基测序错位率)】大于20,最少2个(这个数受到测序深度的影响,不同测序深度可能有所不同)reads支持等。并且符合以下三个条件:Q20质量截止(质量值Q20以下的SNPs过滤掉),Copy number数小于2(指覆盖该位点reads唯一性的平均数),SNP位点彼此至少相隔5bp。
3)Short InDel检测
在Short InDel检测中,比对reads必须满足paired-end要求,并且仅在一个末端包含比对上的gap。容许1-10bp Indels的paired-end比对。
在Indels检测过程中,需整合候选的Indels。Gaps至少需要3对非冗余的paired-end reads支持。覆盖候选Indel的un-gap reads数低于2才能进行Indel检测。
4)SV(结构变异)检测
根据双末端的测序原理,正常情况下,paired-end的两个reads,一个可以比对上正链(forward),另一个比对上负链(reverse),两个reads比对后的距离应该与插入片段大小一致。即成对的两条reads比对到基因组时应该有正常的方向和合适的跨度。如果在比对结果中,成对的两条reads的方向或跨度与预期不一致,则该区域有可能发生结构变异。通过将异常的paired-end比对结果进行聚类分析,并与预先定义的结构性变异类型进行比较。可以据此进行结构变异检测,一般至少要有3对异常的paired-end支持。当两对paired-end能正常读取时,由于测试品种中间paired-end缺失,根据该区域参考基因组序列和待测基因组序列的比较结果,可以确定该区域插入或缺失。
(2)品种特异基因标识
1)染色体倒位标识
检测到染色体倒位后,确定倒位两侧位置、两侧Reads及其序列、两侧转座子,然后绘制染色体倒位图谱。染色体倒位区内基因(倒位圈)及两侧基因(倒位圈附近)进行列表。如果涉及到插入或缺失,则同时对插入、缺失“事件”列表,分析其基因效应。进而,绘制染色体倒位基因效应图。
2)品种特异基因标识
品种特异性是由品种特异基因、特定基因组合或特定表达程式决定的。对特异性基因,通过测序、相关预测或相关技术处理,做出品种特异基因(或特异基因表达)图谱。
具体实施方式参见附图2.
基因组标识(1)分为基因组测序与数据分析(2)和品种特异性标识(3)。基因组测序采用重测序方法(见本专利重测序原理)。测序按5X测序(测得2G有效数据量)。测序完成后,进行SNP分析(4)、Indel分析(5)、SV分析(6)。方法见本专利“基因组测序与分析”方法。品种特异性标识分染色体倒位标识(7)和品种特异性标识(8)。全部标识的具体信息、特征为品种特异性(9)。
测序获得序列通过SOAPal igner软件比对。
染色体倒位图仿附图3绘制。
参考资料:
【1】Xuehui Huang,Xinghua Wei,Tao Sang,Qiang Zhao,Qi Feng,Yan Zhao,Canyang Li Chuanrang Zhu,Tingting Lu,Zhiwu Zhang,Meng Li Danlin Fan,Yunli Guo,Ahong Wang,Lu Wang,Liuwei Deng,Wenjun Li,Yiqi Lu,Qi junWeng,Kunyan Liu,Tao Huang,Taoying Zhou,Yufeng Jing,Wei Li,ZhangLin,Edward S Buckler,Qian Qian,Qi-Fa Zhang,Jiayang Li&,Bin Han,Genome-wide association studies of 14 agronomic traits in rice landraces.Nature Genetics.2010,1038:695-704
【2】王凤格.中国玉米新品种标准DNA指纹库构建研究的几点思考.植物学通报,2005,22(1):121-128
【3】生物品种基因组DNA指纹图谱:中国CN01131595.4号专利;
【4】水稻稻瘟菌DNA指纹图谱带型编码程式分类分析方法:中国CN200510040237.3号专利
Claims (1)
1.一种水稻基因组基因标识的新方法,其特征在于:方法和步骤:
(1)基因组测序与数据分析;
1)比对,
2)一致序列组装和SNP检测,
3)Short InDel检测,
4)SV(结构变异)检测。
(2)品种特异基因标识。
1)染色体倒位标识,
2)品种特异基因标识。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011104496411A CN103184275A (zh) | 2011-12-29 | 2011-12-29 | 一种水稻基因组基因标识的新方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011104496411A CN103184275A (zh) | 2011-12-29 | 2011-12-29 | 一种水稻基因组基因标识的新方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103184275A true CN103184275A (zh) | 2013-07-03 |
Family
ID=48675721
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011104496411A Pending CN103184275A (zh) | 2011-12-29 | 2011-12-29 | 一种水稻基因组基因标识的新方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103184275A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104630382A (zh) * | 2015-03-16 | 2015-05-20 | 中国科学院华南植物园 | 一种基于基因组杂合度鉴定猕猴桃杂交种质的方法 |
CN104726604A (zh) * | 2015-04-03 | 2015-06-24 | 河北医科大学 | 一种腐败检材降解dna的检测方法及其应用 |
CN110189796A (zh) * | 2019-05-27 | 2019-08-30 | 新疆农业大学 | 一种绵羊全基因组重测序分析方法 |
CN110527736A (zh) * | 2019-08-19 | 2019-12-03 | 中国农业科学院作物科学研究所 | 用于水稻种质资源和品种鉴定的snp标记组合及其应用 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1422962A (zh) * | 2001-12-06 | 2003-06-11 | 中南大学 | 生物品种基因组dna指纹图谱 |
CN1699564A (zh) * | 2005-05-26 | 2005-11-23 | 江苏省农业科学院 | 水稻稻瘟菌dna指纹图谱带型编码程式分类分析方法 |
US20090136938A1 (en) * | 2007-06-08 | 2009-05-28 | Nengbing Tao | Methods for sequence-directed molecular breeding |
CN102286632A (zh) * | 2011-09-14 | 2011-12-21 | 中山大学 | 一种检测基因组目的区域结构变异的方法 |
-
2011
- 2011-12-29 CN CN2011104496411A patent/CN103184275A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1422962A (zh) * | 2001-12-06 | 2003-06-11 | 中南大学 | 生物品种基因组dna指纹图谱 |
CN1699564A (zh) * | 2005-05-26 | 2005-11-23 | 江苏省农业科学院 | 水稻稻瘟菌dna指纹图谱带型编码程式分类分析方法 |
US20090136938A1 (en) * | 2007-06-08 | 2009-05-28 | Nengbing Tao | Methods for sequence-directed molecular breeding |
CN102286632A (zh) * | 2011-09-14 | 2011-12-21 | 中山大学 | 一种检测基因组目的区域结构变异的方法 |
Non-Patent Citations (4)
Title |
---|
XUEHUI HUANG ET.AL: "Genome-wide association studies of 14 agronomic traits", 《NATURE GENETICS》 * |
XUN XU ET.AL: "resequencing 50 accessions of cultivated and wild rice yields markers for identifying agronomically important genes", 《NATURE BIOTECHNOLOGY》 * |
刘霞等: "基因标识与基因标识育种", 《中国植物生理学会第十次代表大会暨全国学术年会》 * |
赵强: "基于高通量测序的水稻基因型鉴定以及水稻籼粳第四号染色体比较基因组研究", 《上海交通大学博士毕业论文》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104630382A (zh) * | 2015-03-16 | 2015-05-20 | 中国科学院华南植物园 | 一种基于基因组杂合度鉴定猕猴桃杂交种质的方法 |
CN104726604A (zh) * | 2015-04-03 | 2015-06-24 | 河北医科大学 | 一种腐败检材降解dna的检测方法及其应用 |
CN110189796A (zh) * | 2019-05-27 | 2019-08-30 | 新疆农业大学 | 一种绵羊全基因组重测序分析方法 |
CN110527736A (zh) * | 2019-08-19 | 2019-12-03 | 中国农业科学院作物科学研究所 | 用于水稻种质资源和品种鉴定的snp标记组合及其应用 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105008599B (zh) | 水稻全基因组育种芯片及其应用 | |
CN104232777B (zh) | 同时确定胎儿核酸含量和染色体非整倍性的方法及装置 | |
CN105441432B (zh) | 组合物及其在序列测定和变异检测中的用途 | |
CN106868131B (zh) | 陆地棉6号染色体与纤维强度相关的snp分子标记 | |
CA2724160C (en) | Using structural variation to analyze genomic differences for the prediction of heterosis | |
CN101539967A (zh) | 一种单核苷酸多态性检测方法 | |
CN103114150B (zh) | 基于酶切建库测序与贝叶斯统计的单核苷酸多态性位点鉴定的方法 | |
CN105631242A (zh) | 一种利用全基因组测序数据鉴定转基因事件的方法 | |
CN109545278B (zh) | 一种鉴定植物lncRNA与基因互作的方法 | |
Shen et al. | Development of GBTS and KASP panels for genetic diversity, population structure, and fingerprinting of a large collection of broccoli (Brassica oleracea L. var. italica) in China | |
CN107345248A (zh) | 基于大数据的基因与位点风险评估方法及其系统 | |
CN108998550A (zh) | 用于水稻基因分型的snp分子标记及其应用 | |
CN105950707A (zh) | 一种确定核酸序列的方法及系统 | |
CN103184275A (zh) | 一种水稻基因组基因标识的新方法 | |
Wang et al. | Analysis of the genetic structure and diversity of upland cotton groups in different planting areas based on SNP markers | |
CN104988142A (zh) | 一种新型黄瓜snp分子标记 | |
CN105925664A (zh) | 一种确定核酸序列的方法及系统 | |
CN108875307A (zh) | 一种基于孕妇外周血中胎儿游离dna的亲子鉴定方法 | |
CN112226529A (zh) | 一种冬瓜抗枯萎病基因的snp分子标记及应用 | |
CN105907860B (zh) | 一种利用|Δ(SNP-index)|进行性状定位的QTL-seq方法及其应用 | |
CN108416189B (zh) | 一种基于分子标记技术的农作物品种杂种优势模式鉴定方法 | |
WO2020082314A1 (zh) | 水稻绿色基因芯片与应用 | |
CN102154452B (zh) | 一种鉴定顺式和反式调控作用的方法和系统 | |
KR20230095709A (ko) | 배추의 종자순도 검정을 위한 kasp 마커 세트와 효율적인 마커 개발을 위한 방법 | |
CN110468226B (zh) | 杨树抗叶锈病的分子标记及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20130703 |