CN104573409B - 基因定位的多重检验方法 - Google Patents

基因定位的多重检验方法 Download PDF

Info

Publication number
CN104573409B
CN104573409B CN201510005209.1A CN201510005209A CN104573409B CN 104573409 B CN104573409 B CN 104573409B CN 201510005209 A CN201510005209 A CN 201510005209A CN 104573409 B CN104573409 B CN 104573409B
Authority
CN
China
Prior art keywords
assignment
phenotypic
dna sample
gene mapping
genes gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510005209.1A
Other languages
English (en)
Other versions
CN104573409A (zh
Inventor
刘三阳
范崇仪
钱晓菊
张新明
高金龙
罗亚丹
范玉美
赵艳艳
王兆宝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HANGZHOU HEYI GENE TECHNOLOGY Co Ltd
Original Assignee
HANGZHOU HEYI GENE TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HANGZHOU HEYI GENE TECHNOLOGY Co Ltd filed Critical HANGZHOU HEYI GENE TECHNOLOGY Co Ltd
Priority to CN201510005209.1A priority Critical patent/CN104573409B/zh
Publication of CN104573409A publication Critical patent/CN104573409A/zh
Application granted granted Critical
Publication of CN104573409B publication Critical patent/CN104573409B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种基因定位的多重检验方法,其特征在于,包括:步骤一:对亲本DNA样品和子代DNA样品进行测序,获得高精度短片段序列;步骤二:对获得的所述高精度短片段序列与参考序列比对或者相互聚类,得到准确的SNP信息;步骤三:将SNP信息转换成群体SNP,进一步转换成标准的分子标准格式,进行遗传图谱构建,并在遗传图谱的基础上,进行QTL分析得到QTL座位信息;步骤四:鉴定子代DNA样品的表型信息,并准确地统计表型值分布,将表型值按梯度分组,把极端的表型值所对应的子代DNA样品的高精度短片段序列分别混合,分析基因型频率分布,通过卡方检验和秩和检验,找到相关的显著区域;步骤五:整合QTL座位信息与步骤四得到准确基因定位信息。

Description

基因定位的多重检验方法
技术领域
本发明涉及生物信息技术领域,尤其涉及一种基因定位的多重检验方法。
背景技术
简化基因组方法是一种利用酶切技术、序列捕获芯片技术或其他实验手段降低物种基因组复杂程度,进而研究基因组各类遗传结构性变异的技术手段。目前常见的简化基因组技术包括RAD(Restriction site Associated DNA)和GBS(Genotyping BySequencing)。这些技术都可以在极短的时间内开发出成千上万的SNP标记,而分子标记是开展遗传作图、关联分析、群体遗传分析以及生态多样性分析等的基础,所以利用简化基因组技术开展科研工作是当前第二代测序技术的一种热门应用。
BSA(分离体分组混合分析法或混合分组分析法,又称集团分离分析法,BulkedSegregation Analysis)分析法首次由Michlmore等…提出并成功地在莴苣中筛选出与目的基因相连锁的标记。该方法首先从一对具有目标基因的表型差异的亲本所产生的任何一种分离群体中,根据目标基因的表型分别选取一定数量的植株,构成2个亚群或集团。将每群的DNA等量混合,形成两个相对性状的“基因池”(GENE poor),然后用合适的分子标记对两个基因池进行分析,在两群问表现多态性的分子标记遗传上与目标性状基因座位相连锁。在获得了与目标基因相连锁的分子标记以后,可以利用某一作图群体进行分析以便进一步检测所得分子标记与目标性状基因的连锁程度,以及其在某已知分子图谱中或染色体上的位置,这样才能完成真正意义上的对基因的标记定位。由于建池时使用了特定的分离群体,并且在分组时仅对目标性状进行选择,这样可以保证其他性状的遗传背景基本相同,两个基因池之间理论上就应主要在目标基因区段存在差异,因此两基因池又被称为近等基因池,这就排除了环境及人为因素的影响,使研究结果更为准确可靠。BSA法克服了很多作物难以得到近等基因系的限制,并且比近等基因系法省时省力,是一种非常实用的基因标记定位的方法,应用非常广泛。
但是,由于两者都属于初定位的范畴,对于基因定位的精度难以满足功能基因的研究。因此需要一种方法提高定位的精度与准确度。以前传统标记(例如SSR、RFLP等)无法实现在一次独立实验中同时进行两个分析的可能。然而基于简化基因组的测序技术,测得的数据不仅为遗传图构建提供了可能,而且,测序的reads也为BSA分析提供了便利。
发明内容
本发明的目的是解决以上提出的问题,提供一种基因定位的多重检验方法,通过简化基因组测序技术结合混合分析分离分析思路,来提升基因定位的精度和准确度。
本发明的技术方案如下:
一种基因定位的多重检验方法,其特征在于,包括:
步骤一:利用第二代测序技术对亲本DNA样品和子代DNA样品进行测序,获得高精度短片段序列;
步骤二:利用SNP分析软件对获得的所述高精度短片段序列与参考序列比对或者相互聚类,得到每个样品准确的SNP信息;
步骤三:将这类SNP信息转换成群体SNP,进一步转换成标准的分子标准格式,利用作图软件进行遗传图谱构建,并在遗传图谱的基础上,进行QTL分析得到QTL座位信息;
步骤四:鉴定子代DNA样品的表型信息,并准确地统计表型值分布,将表型值按梯度分组,把极端的表型值所对应的子代DNA样品的高精度短片段序列分别混合,分析基因型频率分布,通过卡方检验和秩和检验,找到与表型信息相关的显著区域;
步骤五:整合QTL座位信息与步骤四得到准确的与表型信息相关的基因定位信息。
作为优选,所述的子代DNA样品为亲本DNA样品杂交产生的后代。
作为优选,步骤一之前还包括步骤建库,所述的建库为把DNA分子处理成可以上机测序的分子集合,得到DNA文库。
作为优选,所述步骤建库之前还包括步骤酶切,所述的酶切为用限制性内切酶切断DNA分子。
作为优选,步骤一之后还包括步骤质控,所述的质控为判断高精度短片段序列的质量,并去除低质量的高精度短片段序列。
作为优选,所述步骤四包括以下步骤:
A.统计子代DNA样品的表型值;
B.以表型值为依据,将表型值按梯度进行分组,将极端表型值所对应的子代DNA样品测序得到的高精度短片段序列分别混合;
C.通过每组混合的高精度短片段序列提供的基因型频率信息,利用卡方检验和秩和检验,找到与表型信息相关的显著区域。
作为优选,所述的第二代测序技术为Illumina第二代测序技术,采用的是Hiseq测序仪,测序文库包括简化基因组文库、全基因组鸟枪法文库。
作为优选,所述的SNP分析软件为SOAP2、SOAPsnp、BWA、samtools或Stacks,分析过程包括比对或者相互聚类。
作为优选,步骤三中的作图软件为joinmap、linkage或mapmaker。
本发明的有益效果如下:
本发明实现了简化基因组测序技术与混合分离分析思路在一次独立的遗传群体构建实验中的结合,有效了提高了研究材料与研究数据的利用率;通过综合使用这两种方法,在不增加实验成本的情况下,一次实验中完成遗传图谱的构建与BSA分析,并以远低于其它基因精细定位手段的成本,提升基因定位的精度和准确度;同时也显著缩短了基因定位研究的周期,可以有效地为后续的遗传群体构建与分析提供指导与参考。同时,本发明的数据也是基因克隆与功能基因组学研究的第一手数据。
附图说明
图1是本发明的流程示意图。
具体实施方式
下面结合附图对本发明的实施例进行进一步详细说明:
本发明公开了一种基因定位的多重检验方法,其特征在于,包括:
步骤一:利用第二代测序技术对亲本DNA样品和子代DNA样品进行测序,获得高精度短片段序列;
步骤二:利用SNP分析软件对获得的所述高精度短片段序列与参考序列比对或者相互聚类,得到每个样品准确的SNP信息;
步骤三:将这类SNP信息转换成群体SNP,进一步转换成标准的分子标准格式,利用作图软件进行遗传图谱构建,并在遗传图谱的基础上,进行QTL分析得到QTL座位信息;
步骤四:鉴定子代DNA样品的表型信息,并准确地统计表型值分布,将表型值按梯度分组,把极端的表型值所对应的子代DNA样品的高精度短片段序列分别混合,分析基因型频率分布,通过卡方检验和秩和检验,找到与表型信息相关的显著区域;
步骤五:整合QTL座位信息与步骤四得到准确的与表型信息相关的基因定位信息。
所述的子代DNA样品为亲本DNA样品杂交产生的后代。
步骤一之前还包括步骤建库,所述的建库为把DNA分子处理成可以上机测序的分子集合,得到DNA文库。
步骤建库之前还包括步骤酶切,所述的酶切为用限制性内切酶切断DNA分子。
步骤一之后还包括步骤质控,所述的质控为判断高精度短片段序列的质量,并去除低质量的高精度短片段序列。
所述步骤四包括以下步骤:
A.统计子代DNA样品的表型值;
B.以表型值为依据,将表型值按梯度进行分组,将极端表型值所对应的子代DNA样品测序得到的高精度短片段序列分别混合;
C.通过每组混合的高精度短片段序列提供的基因型频率信息,利用卡方检验和秩和检验,找到与表型信息相关的显著区域。
所述的第二代测序技术为Illumina第二代测序技术,采用的是Hiseq测序仪,测序文库包括简化基因组文库、全基因组鸟枪法文库。
所述的SNP分析软件为SOAP2、SOAPsnp、BWA、samtools或Stacks,分析过程包括比对或者相互聚类。
步骤三中的作图软件为joinmap、linkage或mapmaker。
如图1所示,图中:
亲本DNA:亲本指动植物杂交时所选用的雌雄性个体,参与杂交的雄性个体叫父本,用符号♂表示;参与杂交的雌性个体叫母本,用符号♀表示,亲本的脱氧核糖核酸(DNA)即是亲本DNA。
子代DNA:上述亲本杂交产生的后代即是子代,来自同一(对)亲本的子代称为子代群体,子代的脱氧核糖核酸(DNA)即是子代DNA。
酶切:用限制性内切酶切断DNA分子。
建库:把DNA分子处理可以上机测序的分子集合,称之为DNA文库。
测序与质控:将上述的DNA文库于测序仪中进行测序,得到高精度短片段序列,这一步是测序;判断高精度短片段序列的质量,并去除部分低质量的序列,称为质控。
SNP检测、注释、统计、遗传图谱构建及QTL定位:用一些聚类或者比对软件处理高精度短片段序列可以得到单核苷酸多态性(SNP);把SNP归属至所在的基因,这步处理称为注释;通过SNP信息可以用作图构建遗传图谱,进一步用于QTL分析。
子代群体表型打分:鉴定子代DNA样品的表型信息,并准确地统计表型值分布,将表型值按梯度分组;以株高为例,株高为表型信息,每个子代的株高为表型值,统计每个子代的株高,根据高度分布按梯度分组,即是表型打分。
极端表型个体reads混合:把极端的表型值所对应的子代DNA样品的高精度短片段序列分别混合,分析基因型频率分布,通过卡方检验和秩和检验,找到与表型相关的显著区域;以株高为例,把最高的子代DNA样品的高精度短片段序列混合在一起,的高精度短片段序列(reads)混合在一起,把最矮的子代DNA样品的高精度短片段序列混合在一起,分析基因型频率分布,通过卡方检验和秩和检验,找到与株高相关的显著区域。
整合快速定位基因:整合QTL分析得到的QTL座位信息与极端表型个体reads混合得到的基因定位信息得出准确的与表型信息相关的基因定位信息。
以上所述的仅是本发明的优选实施方式,应当指出,对于本技术领域中的普通技术人员来说,在不脱离本发明核心技术特征的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (9)

1.一种基因定位的多重检验方法,其特征在于,包括:
步骤一:利用第二代测序技术对亲本DNA样品和子代DNA样品进行测序,获得高精度短片段序列;
步骤二:利用SNP分析软件对获得的所述高精度短片段序列与参考序列比对或者相互聚类,得到每个样品准确的SNP信息;
步骤三:将这类SNP信息转换成群体SNP,进一步转换成标准的分子标准格式,利用作图软件进行遗传图谱构建,并在遗传图谱的基础上,进行QTL分析得到QTL座位信息;
步骤四:鉴定子代DNA样品的表型信息,并准确地统计表型值分布,将表型值按梯度分组,把极端的表型值所对应的子代DNA样品的高精度短片段序列分别混合,分析基因型频率分布,通过卡方检验和秩和检验,找到与表型信息相关的显著区域;
步骤五:整合QTL座位信息与步骤四得到准确的与表型信息相关的显著区域,从而得到准确的与表型信息相关的基因定位信息。
2.根据权利要求1所述的基因定位的多重检验方法,其特征在于,所述的子代DNA样品为亲本DNA样品杂交产生的后代。
3.根据权利要求1或2所述的基因定位的多重检验方法,其特征在于,步骤一之前还包括步骤建库,所述的建库为把DNA分子处理成可以上机测序的分子集合,得到DNA文库。
4.根据权利要求3所述的基因定位的多重检验方法,其特征在于,所述步骤建库之前还包括步骤酶切,所述的酶切为用限制性内切酶切断DNA分子。
5.根据权利要求1或2所述的基因定位的多重检验方法,其特征在于,步骤一与步骤二之间还包括步骤质控,所述的质控为判断高精度短片段序列的质量,并去除低质量的高精度短片段序列。
6.根据权利要求1或2所述的基因定位的多重检验方法,其特征在于,所述步骤四包括以下步骤:
A.统计子代DNA样品的表型值;
B.以表型值为依据,将表型值按梯度进行分组,将极端表型值所对应的子代DNA样品测序得到的高精度短片段序列分别混合;
C .通过每组混合的高精度短片段序列提供的基因型频率信息,利用卡方检验和秩和检验,找到与表型信息相关的显著区域。
7.根据权利要求1或2所述的基因定位的多重检验方法,其特征在于,所述的第二代测序技术为Illumina第二代测序技术,采用的是Hiseq测序仪,测序文库包括简化基因组文库、全基因组鸟枪法文库。
8.根据权利要求1或2所述的基因定位的多重检验方法,其特征在于,所述的SNP分析软件为SOAP2、SOAPsnp、BWA、samtools或Stacks,分析过程包括比对或者相互聚类。
9.根据权利要求1或2所述的基因定位的多重检验方法,其特征在于,步骤三中的作图软件为joinmap、linkage或mapmaker。
CN201510005209.1A 2015-01-04 2015-01-04 基因定位的多重检验方法 Active CN104573409B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510005209.1A CN104573409B (zh) 2015-01-04 2015-01-04 基因定位的多重检验方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510005209.1A CN104573409B (zh) 2015-01-04 2015-01-04 基因定位的多重检验方法

Publications (2)

Publication Number Publication Date
CN104573409A CN104573409A (zh) 2015-04-29
CN104573409B true CN104573409B (zh) 2017-07-25

Family

ID=53089455

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510005209.1A Active CN104573409B (zh) 2015-01-04 2015-01-04 基因定位的多重检验方法

Country Status (1)

Country Link
CN (1) CN104573409B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110010203B (zh) * 2019-03-29 2022-05-27 广州基迪奥生物科技有限公司 一种基于生物云平台的交互式动态qtl分析系统及方法
CN112164424B (zh) * 2020-08-03 2024-04-09 南京派森诺基因科技有限公司 一种基于无参考基因组的群体进化分析方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1415020A (zh) * 1999-11-08 2003-04-30 荣研化学株式会社 检测突变和/或多态性的方法
CN1448515A (zh) * 2002-04-02 2003-10-15 浙江大学 基于基因组外显子芯片的数量性状基因位点定位新方法
CN101760541A (zh) * 2008-12-19 2010-06-30 李祥 Qtl定位的原理
CN101818201A (zh) * 2010-04-09 2010-09-01 南通大学 一种验证顺式作用基因表达数量性状基因座真实性的方法
CN104017883A (zh) * 2014-06-18 2014-09-03 深圳华大基因科技服务有限公司 组装基因组序列的方法和系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103160937B (zh) * 2011-12-15 2015-02-18 深圳华大基因科技服务有限公司 对高等植物复杂基因组基因进行富集建库和snp分析的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1415020A (zh) * 1999-11-08 2003-04-30 荣研化学株式会社 检测突变和/或多态性的方法
CN1448515A (zh) * 2002-04-02 2003-10-15 浙江大学 基于基因组外显子芯片的数量性状基因位点定位新方法
CN101760541A (zh) * 2008-12-19 2010-06-30 李祥 Qtl定位的原理
CN101818201A (zh) * 2010-04-09 2010-09-01 南通大学 一种验证顺式作用基因表达数量性状基因座真实性的方法
CN104017883A (zh) * 2014-06-18 2014-09-03 深圳华大基因科技服务有限公司 组装基因组序列的方法和系统

Also Published As

Publication number Publication date
CN104573409A (zh) 2015-04-29

Similar Documents

Publication Publication Date Title
CN105441432B (zh) 组合物及其在序列测定和变异检测中的用途
CN105740650B (zh) 一种快速准确鉴定高通量基因组数据污染源的方法
CN108998550B (zh) 用于水稻基因分型的snp分子标记及其应用
CN104293778B (zh) 兰属微卫星标记的建立方法、核心指纹标记库与试剂盒
CN107217101A (zh) 适于农作物品种分子身份鉴别和确权鉴定的检测方法
CN111088382A (zh) 一种玉米全基因组snp芯片及其应用
CN105868584A (zh) 通过选取极端性状个体来进行全基因组选择育种的方法
CN109706231A (zh) 一种用于凡纳滨对虾分子育种的高通量snp分型方法
CN110444253B (zh) 一种适用于混池基因定位的方法及系统
CN117095746A (zh) 一种用于水牛的gbs全基因组关联分析方法
CN104573409B (zh) 基因定位的多重检验方法
Huber et al. Primer design for an accurate view of picocyanobacterial community structure by using high-throughput sequencing
CN104293892A (zh) 检测核基因组中与表型形状相关基因的方法
CN105907860B (zh) 一种利用|Δ(SNP-index)|进行性状定位的QTL-seq方法及其应用
CN117089644A (zh) 用于芦竹品种鉴定的mnp标记位点、引物组合物和试剂盒及其应用
CN111276189A (zh) 基于ngs的染色体平衡易位检测分析系统及应用
CN105861729A (zh) 一种用于凡纳滨对虾种质鉴定的分子标记组合及其应用
CN107535350B (zh) 一种基于ssr标记的玉米组配模式优选方法及系统
CN115948521A (zh) 一种检测非整倍体缺失染色体信息的方法
CN108416189A (zh) 一种基于分子标记技术的农作物品种杂种优势模式鉴定方法
Literman et al. Reference‐free discovery of nuclear SNPs permits accurate, sensitive identification of Carya (hickory) species and hybrids
CN111206104B (zh) 一种高效简便获取木虱总科昆虫线粒体基因组的通用引物和方法及其应用
CN105349659B (zh) 一套适于不结球白菜品种核酸指纹数据库构建的核心snp标记及其应用
CN101565744B (zh) 一种三疣梭子蟹多元高通量遗传标记系统及遗传分析方法
CN110305974A (zh) 基于检测五个snp位点区分常见小鼠近交系的pcr分析引物及其分析方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Gene mapping multi-inspection method

Effective date of registration: 20180905

Granted publication date: 20170725

Pledgee: Hangzhou United Rural Commercial Bank Limited by Share Ltd Lian Zhuang sub branch

Pledgor: HANGZHOU HEYI GENE TECHNOLOGY CO., LTD.

Registration number: 2018330000258