CN104573409A - 基因定位的多重检验方法 - Google Patents

基因定位的多重检验方法 Download PDF

Info

Publication number
CN104573409A
CN104573409A CN201510005209.1A CN201510005209A CN104573409A CN 104573409 A CN104573409 A CN 104573409A CN 201510005209 A CN201510005209 A CN 201510005209A CN 104573409 A CN104573409 A CN 104573409A
Authority
CN
China
Prior art keywords
information
dna sample
assignment
gene mapping
phenotypic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510005209.1A
Other languages
English (en)
Other versions
CN104573409B (zh
Inventor
刘三阳
范崇仪
钱晓菊
张新明
高金龙
罗亚丹
范玉美
赵艳艳
王兆宝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HANGZHOU HEYI GENE TECHNOLOGY Co Ltd
Original Assignee
HANGZHOU HEYI GENE TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HANGZHOU HEYI GENE TECHNOLOGY Co Ltd filed Critical HANGZHOU HEYI GENE TECHNOLOGY Co Ltd
Priority to CN201510005209.1A priority Critical patent/CN104573409B/zh
Publication of CN104573409A publication Critical patent/CN104573409A/zh
Application granted granted Critical
Publication of CN104573409B publication Critical patent/CN104573409B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种基因定位的多重检验方法,其特征在于,包括:步骤一:对亲本DNA样品和子代DNA样品进行测序,获得高精度短片段序列;步骤二:对获得的所述高精度短片段序列与参考序列比对或者相互聚类,得到准确的SNP信息;步骤三:将SNP信息转换成群体SNP,进一步转换成标准的分子标准格式,进行遗传图谱构建,并在遗传图谱的基础上,进行QTL分析得到QTL座位信息;步骤四:鉴定子代DNA样品的表型信息,并准确地统计表型值分布,将表型值按梯度分组,把极端的表型值所对应的子代DNA样品的高精度短片段序列分别混合,分析基因型频率分布,通过卡方检验和秩和检验,找到相关的显著区域;步骤五:整合QTL座位信息与步骤四得到准确基因定位信息。

Description

基因定位的多重检验方法
技术领域
本发明涉及生物信息技术领域,尤其涉及一种基因定位的多重检验方法。
背景技术
简化基因组方法是一种利用酶切技术、序列捕获芯片技术或其他实验手段降低物种基因组复杂程度,进而研究基因组各类遗传结构性变异的技术手段。目前常见的简化基因组技术包括RAD(Restriction site Associated DNA)和GBS(Genotyping By Sequencing)。这些技术都可以在极短的时间内开发出成千上万的SNP标记,而分子标记是开展遗传作图、关联分析、群体遗传分析以及生态多样性分析等的基础,所以利用简化基因组技术开展科研工作是当前第二代测序技术的一种热门应用。
BSA(分离体分组混合分析法或混合分组分析法,又称集团分离分析法,Bulked Segregation Analysis)分析法首次由Michlmore等…提出并成功地在莴苣中筛选出与目的基因相连锁的标记。该方法首先从一对具有目标基因的表型差异的亲本所产生的任何一种分离群体中,根据目标基因的表型分别选取一定数量的植株,构成2个亚群或集团。将每群的DNA等量混合,形成两个相对性状的“基因池”(GENE poor),然后用合适的分子标记对两个基因池进行分析,在两群问表现多态性的分子标记遗传上与目标性状基因座位相连锁。在获得了与目标基因相连锁的分子标记以后,可以利用某一作图群体进行分析以便进一步检测所得分子标记与目标性状基因的连锁程度,以及其在某已知分子图谱中或染色体上的位置,这样才能完成真正意义上的对基因的标记定位。由于建池时使用了特定的分离群体,并且在分组时仅对目标性状进行选择,这样可以保证其他性状的遗传背景基本相同,两个基因池之间理论上就应主要在目标基因区段存在差异,因此两基因池又被称为近等基因池,这就排除了环境及人为因素的影响,使研究结果更为准确可靠。BSA法克服了很多作物难以得到近等基因系的限制,并且比近等基因系法省时省力,是一种非常实用的基因标记定位的方法,应用非常广泛。
但是,由于两者都属于初定位的范畴,对于基因定位的精度难以满足功能基因的研究。因此需要一种方法提高定位的精度与准确度。以前传统标记(例如SSR、RFLP等)无法实现在一次独立实验中同时进行两个分析的可能。然而基于简化基因组的测序技术,测得的数据不仅为遗传图构建提供了可能,而且,测序的reads也为BSA分析提供了便利。
发明内容
本发明的目的是解决以上提出的问题,提供一种基因定位的多重检验方法,通过简化基因组测序技术结合混合分析分离分析思路,来提升基因定位的精度和准确度。
本发明的技术方案如下:
一种基因定位的多重检验方法,其特征在于,包括:
步骤一:利用第二代测序技术对亲本DNA样品和子代DNA样品进行测序,获得高精度短片段序列;
步骤二:利用SNP分析软件对获得的所述高精度短片段序列与参考序列比对或者相互聚类,得到每个样品准确的SNP信息;
步骤三:将这类SNP信息转换成群体SNP,进一步转换成标准的分子标准格式,利用作图软件进行遗传图谱构建,并在遗传图谱的基础上,进行QTL分析得到QTL座位信息;
步骤四:鉴定子代DNA样品的表型信息,并准确地统计表型值分布,将表型值按梯度分组,把极端的表型值所对应的子代DNA样品的高精度短片段序列分别混合,分析基因型频率分布,通过卡方检验和秩和检验,找到与表型信息相关的显著区域;
步骤五:整合QTL座位信息与步骤四得到准确的与表型信息相关的基因定位信息。
作为优选,所述的子代DNA样品为亲本DNA样品杂交产生的后代。
作为优选,步骤一之前还包括步骤建库,所述的建库为把DNA分子处理成可以上机测序的分子集合,得到DNA文库。
作为优选,所述步骤建库之前还包括步骤酶切,所述的酶切为用限制性内切酶切断DNA分子。
作为优选,步骤一之后还包括步骤质控,所述的质控为判断高精度短片段序列的质量,并去除低质量的高精度短片段序列。
作为优选,所述步骤四包括以下步骤:
A.统计子代DNA样品的表型值;
B.以表型值为依据,将表型值按梯度进行分组,将极端表型值所对应的子代DNA样品测序得到的高精度短片段序列分别混合;
C.通过每组混合的高精度短片段序列提供的基因型频率信息,利用卡方检验和秩和检验,找到与表型信息相关的显著区域。
作为优选,所述的第二代测序技术为Illumina第二代测序技术,采用的是Hiseq测序仪,测序文库包括简化基因组文库、全基因组鸟枪法文库。
作为优选,所述的SNP分析软件为SOAP2、SOAPsnp、BWA、samtools或Stacks,分析过程包括比对或者相互聚类。
作为优选,步骤三中的作图软件为joinmap、linkage或mapmaker。
本发明的有益效果如下:
本发明实现了简化基因组测序技术与混合分离分析思路在一次独立的遗传群体构建实验中的结合,有效了提高了研究材料与研究数据的利用率;通过综合使用这两种方法,在不增加实验成本的情况下,一次实验中完成遗传图谱的构建与BSA分析,并以远低于其它基因精细定位手段的成本,提升基因定位的精度和准确度;同时也显著缩短了基因定位研究的周期,可以有效地为后续的遗传群体构建与分析提供指导与参考。同时,本发明的数据也是基因克隆与功能基因组学研究的第一手数据。
附图说明
图1是本发明的流程示意图。
具体实施方式
下面结合附图对本发明的实施例进行进一步详细说明:
本发明公开了一种基因定位的多重检验方法,其特征在于,包括:
步骤一:利用第二代测序技术对亲本DNA样品和子代DNA样品进行测序,获得高精度短片段序列;
步骤二:利用SNP分析软件对获得的所述高精度短片段序列与参考序列比对或者相互聚类,得到每个样品准确的SNP信息;
步骤三:将这类SNP信息转换成群体SNP,进一步转换成标准的分子标准格式,利用作图软件进行遗传图谱构建,并在遗传图谱的基础上,进行QTL分析得到QTL座位信息;
步骤四:鉴定子代DNA样品的表型信息,并准确地统计表型值分布,将表型值按梯度分组,把极端的表型值所对应的子代DNA样品的高精度短片段序列分别混合,分析基因型频率分布,通过卡方检验和秩和检验,找到与表型信息相关的显著区域;
步骤五:整合QTL座位信息与步骤四得到准确的与表型信息相关的基因定位信息。
所述的子代DNA样品为亲本DNA样品杂交产生的后代。
步骤一之前还包括步骤建库,所述的建库为把DNA分子处理成可以上机测序的分子集合,得到DNA文库。
步骤建库之前还包括步骤酶切,所述的酶切为用限制性内切酶切断DNA分子。
步骤一之后还包括步骤质控,所述的质控为判断高精度短片段序列的质量,并去除低质量的高精度短片段序列。
所述步骤四包括以下步骤:
A.统计子代DNA样品的表型值;
B.以表型值为依据,将表型值按梯度进行分组,将极端表型值所对应的子代DNA样品测序得到的高精度短片段序列分别混合;
C.通过每组混合的高精度短片段序列提供的基因型频率信息,利用卡方检验和秩和检验,找到与表型信息相关的显著区域。
所述的第二代测序技术为Illumina第二代测序技术,采用的是Hiseq测序仪,测序文库包括简化基因组文库、全基因组鸟枪法文库。
所述的SNP分析软件为SOAP2、SOAPsnp、BWA、samtools或Stacks,分析过程包括比对或者相互聚类。
步骤三中的作图软件为joinmap、linkage或mapmaker。
如图1所示,图中:
亲本DNA:亲本指动植物杂交时所选用的雌雄性个体,参与杂交的雄性个体叫父本,用符号♂表示;参与杂交的雌性个体叫母本,用符号♀表示,亲本的脱氧核糖核酸(DNA)即是亲本DNA。
子代DNA:上述亲本杂交产生的后代即是子代,来自同一(对)亲本的子代称为子代群体,子代的脱氧核糖核酸(DNA)即是子代DNA。
酶切:用限制性内切酶切断DNA分子。
建库:把DNA分子处理可以上机测序的分子集合,称之为DNA文库。
测序与质控:将上述的DNA文库于测序仪中进行测序,得到高精度短片段序列,这一步是测序;判断高精度短片段序列的质量,并去除部分低质量的序列,称为质控。
SNP检测、注释、统计、遗传图谱构建及QTL定位:用一些聚类或者比对软件处理高精度短片段序列可以得到单核苷酸多态性(SNP);把SNP归属至所在的基因,这步处理称为注释;通过SNP信息可以用作图构建遗传图谱,进一步用于QTL分析。
子代群体表型打分:鉴定子代DNA样品的表型信息,并准确地统计表型值分布,将表型值按梯度分组;以株高为例,株高为表型信息,每个子代的株高为表型值,统计每个子代的株高,根据高度分布按梯度分组,即是表型打分。
极端表型个体reads混合:把极端的表型值所对应的子代DNA样品的高精度短片段序列分别混合,分析基因型频率分布,通过卡方检验和秩和检验,找到与表型相关的显著区域;以株高为例,把最高的子代DNA样品的高精度短片段序列混合在一起,的高精度短片段序列(reads)混合在一起,把最矮的子代DNA样品的高精度短片段序列混合在一起,分析基因型频率分布,通过卡方检验和秩和检验,找到与株高相关的显著区域。
整合快速定位基因:整合QTL分析得到的QTL座位信息与极端表型个体reads混合得到的基因定位信息得出准确的与表型信息相关的基因定位信息。
以上所述的仅是本发明的优选实施方式,应当指出,对于本技术领域中的普通技术人员来说,在不脱离本发明核心技术特征的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (9)

1.一种基因定位的多重检验方法,其特征在于,包括:
步骤一:利用第二代测序技术对亲本DNA样品和子代DNA样品进行测序,获得高精度短片段序列;
步骤二:利用SNP分析软件对获得的所述高精度短片段序列与参考序列比对或者相互聚类,得到每个样品准确的SNP信息;
步骤三:将这类SNP信息转换成群体SNP,进一步转换成标准的分子标准格式,利用作图软件进行遗传图谱构建,并在遗传图谱的基础上,进行QTL分析得到QTL座位信息;
步骤四:鉴定子代DNA样品的表型信息,并准确地统计表型值分布,将表型值按梯度分组,把极端的表型值所对应的子代DNA样品的高精度短片段序列分别混合,分析基因型频率分布,通过卡方检验和秩和检验,找到与表型信息相关的显著区域;
步骤五:整合QTL座位信息与步骤四得到准确的与表型信息相关的基因定位信息。
2.根据权利要求1所述的基因定位的多重检验方法,其特征在于,所述的子代DNA样品为亲本DNA样品杂交产生的后代。
3.根据权利要求1或2所述的基因定位的多重检验方法,其特征在于,步骤一之前还包括步骤建库,所述的建库为把DNA分子处理成可以上机测序的分子集合,得到DNA文库。
4.根据权利要求3所述的基因定位的多重检验方法,其特征在于,所述步骤建库之前还包括步骤酶切,所述的酶切为用限制性内切酶切断DNA分子。
5.根据权利要求1或2所述的基因定位的多重检验方法,其特征在于,步骤一之后还包括步骤质控,所述的质控为判断高精度短片段序列的质量,并去除低质量的高精度短片段序列。
6.根据权利要求1或2所述的基因定位的多重检验方法,其特征在于,所述步骤四包括以下步骤:
A.统计子代DNA样品的表型值;
B.以表型值为依据,将表型值按梯度进行分组,将极端表型值所对应的子代DNA样品测序得到的高精度短片段序列分别混合;
C.通过每组混合的高精度短片段序列提供的基因型频率信息,利用卡方检验和秩和检验,找到与表型信息相关的显著区域。
7.根据权利要求1或2所述的基因定位的多重检验方法,其特征在于,所述的第二代 测序技术为Illumina第二代测序技术,采用的是Hiseq测序仪,测序文库包括简化基因组文库、全基因组鸟枪法文库。
8.根据权利要求1或2所述的基因定位的多重检验方法,其特征在于,所述的SNP分析软件为SOAP2、SOAPsnp、BWA、samtools或Stacks,分析过程包括比对或者相互聚类。
9.根据权利要求1或2所述的基因定位的多重检验方法,其特征在于,步骤三中的作图软件为joinmap、linkage或mapmaker。
CN201510005209.1A 2015-01-04 2015-01-04 基因定位的多重检验方法 Active CN104573409B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510005209.1A CN104573409B (zh) 2015-01-04 2015-01-04 基因定位的多重检验方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510005209.1A CN104573409B (zh) 2015-01-04 2015-01-04 基因定位的多重检验方法

Publications (2)

Publication Number Publication Date
CN104573409A true CN104573409A (zh) 2015-04-29
CN104573409B CN104573409B (zh) 2017-07-25

Family

ID=53089455

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510005209.1A Active CN104573409B (zh) 2015-01-04 2015-01-04 基因定位的多重检验方法

Country Status (1)

Country Link
CN (1) CN104573409B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110010203A (zh) * 2019-03-29 2019-07-12 广州基迪奥生物科技有限公司 一种基于生物云平台的交互式动态qtl分析系统及方法
CN112164424A (zh) * 2020-08-03 2021-01-01 南京派森诺基因科技有限公司 一种基于无参考基因组的群体进化分析方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1415020A (zh) * 1999-11-08 2003-04-30 荣研化学株式会社 检测突变和/或多态性的方法
CN1448515A (zh) * 2002-04-02 2003-10-15 浙江大学 基于基因组外显子芯片的数量性状基因位点定位新方法
CN101760541A (zh) * 2008-12-19 2010-06-30 李祥 Qtl定位的原理
CN101818201A (zh) * 2010-04-09 2010-09-01 南通大学 一种验证顺式作用基因表达数量性状基因座真实性的方法
WO2013086964A1 (zh) * 2011-12-15 2013-06-20 深圳华大基因科技有限公司 对高等植物复杂基因组基因区进行富集建库和snp分析的方法
CN104017883A (zh) * 2014-06-18 2014-09-03 深圳华大基因科技服务有限公司 组装基因组序列的方法和系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1415020A (zh) * 1999-11-08 2003-04-30 荣研化学株式会社 检测突变和/或多态性的方法
CN1448515A (zh) * 2002-04-02 2003-10-15 浙江大学 基于基因组外显子芯片的数量性状基因位点定位新方法
CN101760541A (zh) * 2008-12-19 2010-06-30 李祥 Qtl定位的原理
CN101818201A (zh) * 2010-04-09 2010-09-01 南通大学 一种验证顺式作用基因表达数量性状基因座真实性的方法
WO2013086964A1 (zh) * 2011-12-15 2013-06-20 深圳华大基因科技有限公司 对高等植物复杂基因组基因区进行富集建库和snp分析的方法
CN104017883A (zh) * 2014-06-18 2014-09-03 深圳华大基因科技服务有限公司 组装基因组序列的方法和系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110010203A (zh) * 2019-03-29 2019-07-12 广州基迪奥生物科技有限公司 一种基于生物云平台的交互式动态qtl分析系统及方法
CN110010203B (zh) * 2019-03-29 2022-05-27 广州基迪奥生物科技有限公司 一种基于生物云平台的交互式动态qtl分析系统及方法
CN112164424A (zh) * 2020-08-03 2021-01-01 南京派森诺基因科技有限公司 一种基于无参考基因组的群体进化分析方法
CN112164424B (zh) * 2020-08-03 2024-04-09 南京派森诺基因科技有限公司 一种基于无参考基因组的群体进化分析方法

Also Published As

Publication number Publication date
CN104573409B (zh) 2017-07-25

Similar Documents

Publication Publication Date Title
Naik et al. Cellular barcoding: a technical appraisal
CN104975105B (zh) 用于小鼠近交系鉴定的snp标记、引物对及其应用
CN102676676B (zh) 一种y染色体str基因座荧光检测试剂盒及其应用
CN108998550B (zh) 用于水稻基因分型的snp分子标记及其应用
CN104293778B (zh) 兰属微卫星标记的建立方法、核心指纹标记库与试剂盒
CN105969862A (zh) 十二对黄绿卷毛菌微卫星引物的设计、扩增与测序方法
CN109182538A (zh) 奶牛乳腺炎关键SNPs位点rs88640083及2b-RAD基因分型和分析方法
CN102321752B (zh) 一种同时分析犬基因组dna 17个基因座的荧光标记检测试剂盒及其检测方法和应用
Severn-Ellis et al. Genotyping for species identification and diversity assessment using double-digest restriction site-associated DNA sequencing (ddRAD-seq)
CN104573409B (zh) 基因定位的多重检验方法
CN105907860B (zh) 一种利用|Δ(SNP-index)|进行性状定位的QTL-seq方法及其应用
CN109706231B (zh) 一种用于凡纳滨对虾分子育种的高通量snp分型方法
CN111684113B (zh) 水稻绿色基因芯片与应用
CN105861729A (zh) 一种用于凡纳滨对虾种质鉴定的分子标记组合及其应用
CN106367498A (zh) 美洲大蠊微卫星位点及其应用
CN113789407B (zh) 一种用于油莎豆基因分型的snp分子标记组合及其应用
CN106326689A (zh) 确定群体中受到选择作用的位点的方法和装置
CN109182505A (zh) 奶牛乳腺炎关键SNPs位点rs75762330及2b-RAD基因分型和分析方法
CN101565744B (zh) 一种三疣梭子蟹多元高通量遗传标记系统及遗传分析方法
CN111206104B (zh) 一种高效简便获取木虱总科昆虫线粒体基因组的通用引物和方法及其应用
CN114657269A (zh) 一组高效能常染色体微单倍型遗传标记以及用于检测该组遗传标记的引物组
Lee et al. Genetic differentiation and introgression among Korean evergreen Quercus (Fagaceae) are revealed by microsatellite markers
CN104212898B (zh) 一种大批量开发苎麻基因组snp标记的方法及其开发的引物
CN108642190B (zh) 基于14个常染色体snp遗传标记的法医学复合检测试剂盒
CN113528620A (zh) 用于玉米自交系shl03品种保护的分子标记引物组、试剂盒及其应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Gene mapping multi-inspection method

Effective date of registration: 20180905

Granted publication date: 20170725

Pledgee: Hangzhou United Rural Commercial Bank Limited by Share Ltd Lian Zhuang sub branch

Pledgor: HANGZHOU HEYI GENE TECHNOLOGY CO., LTD.

Registration number: 2018330000258

PE01 Entry into force of the registration of the contract for pledge of patent right