CN1462805A - 显性分子标记群体遗传多样性和遗传分化参数估算优化方法 - Google Patents
显性分子标记群体遗传多样性和遗传分化参数估算优化方法 Download PDFInfo
- Publication number
- CN1462805A CN1462805A CN03131911.4A CN03131911A CN1462805A CN 1462805 A CN1462805 A CN 1462805A CN 03131911 A CN03131911 A CN 03131911A CN 1462805 A CN1462805 A CN 1462805A
- Authority
- CN
- China
- Prior art keywords
- genetic
- colony
- mute
- gene frequency
- statistic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002068 genetic effect Effects 0.000 title claims abstract description 88
- 238000000034 method Methods 0.000 title claims abstract description 44
- 239000003550 marker Substances 0.000 title claims abstract description 26
- 230000004069 differentiation Effects 0.000 title claims description 34
- 238000005457 optimization Methods 0.000 title claims description 10
- 238000007619 statistical method Methods 0.000 claims abstract description 6
- 108090000623 proteins and genes Proteins 0.000 claims description 59
- 230000007614 genetic variation Effects 0.000 claims description 19
- 238000013398 bayesian method Methods 0.000 claims description 13
- 238000012935 Averaging Methods 0.000 claims description 3
- 239000003147 molecular marker Substances 0.000 abstract description 5
- 238000004590 computer program Methods 0.000 abstract description 4
- 238000004364 calculation method Methods 0.000 abstract description 2
- 108700028369 Alleles Proteins 0.000 abstract 1
- 238000005516 engineering process Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 241000196324 Embryophyta Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241000124033 Salix Species 0.000 description 1
- 208000005652 acute fatty liver of pregnancy Diseases 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
Landscapes
- Complex Calculations (AREA)
Abstract
获得显性分子标记群体遗传多样性和遗传分化参数优化估算的方法:根据输入的显性分子遗传标记,采用Zhivotovsky提出的基于Bayesian统计理论新的估算哑等位基因频率的方法和多种统计方法对多种群体遗传统计量进行群体遗传多样性和遗传分化遗传参数进行优化估算,运用本项方法,可以对动植物以及微生物的显性分子遗传标记数据进行群体遗传多样性和遗传分化等遗传参数进行优化估算,可以降低通过平方根法估算哑等位基因频率来估算群体遗传多样性和遗传分化参数所带来的统计误差。通过本发明计算机程序可以实现上述全部遗传参数的自动分析,大大降低了计算工作量并避免了因手工计算可能带来的计算错误。
Description
一、技术领域
本项技术属于生物学领域。尤其涉及显性分子标记群体遗传多样性和遗传分化参数估算优化方法。
二、背景技术
众所周知,近十几年来,分子生物学特别是分子遗传标记得到长足的发展。它在群体遗传学的研究中得到广泛应用,大大推进了群体遗传学尤其是遗传多样性和遗传分化方面的研究。
在众多的分子遗传标记中,RAPD(随机扩增多态性DNA)和AFLP(扩增片段长度多态性)等基于PCR技术并具有设备简便、无需预先知道基因组信息、可以同时在较短时间内完成大量样品的分析等特色,因此在生物资源管理和群体遗传多样性以及其它研究领域占有十分重要的地位(Haig 1998;Kuang等1998;Silbiger等1998)。但由于它们是显性标记,不能区分纯合子和杂合子,在基因频率的统计上存在困难。过去一直采用平方根法在假定群体处于遗传平衡的前提下来进行哑等位基因频率的估算(Stewart和Excoffier 1996),但平方根法会导致统计上的有偏估计。1994年,Lynch和Milligan就此提出了改进,但改进的方法受样本大小影响很大,由于该方法选择具有较高哑等位基因频率仍然导致遗传变异和遗传距离的有偏估计(L.A.ZHIVOTOVSKY 1999)。1999年,L.A.ZHIVOTOVSKY提出了基于Bayesian理论的新的统计方法用于显性分子遗传标记的哑等位基因频率估算。在Szmidt等(1996)的实例中,用该方法估计出的遗传参数更接近大配子体的结果。S.L.KRAUSS(2000)也指出该方法对J型分布的显性分子标记数据能够给出比其它方法更精确的结果。
基于Bayesian理论的新的统计方法需要计算GAMMA函数,虽然Excel中提供了该函数,但是对于分子群体参数的估算还是非常不方便,而且用手工计算常常由于大量数据及复杂的中间过程会产生错误,不利于新方法的推广和应用。
对显性分子遗传标记的遗传多样性和遗传分化的分析,通常包括两个方面:(1)基于等位基因频率(假定群体处于遗传平衡)
通常采用Nei’s H和Shannon H统计量估算遗传多样性;Nei’sG统计量Wright’s F统计量估算遗传分化。采用平方根方法估算的各统计量差异很大,研究工作者常常因此不知所措,无从选择。有的甚至错误地认为较大的就是最好的,从发表的众多发表的论文中也常常看到作者对各种统计量进行比较,试图找出所谓最佳答案。(2)基于分子表型
通常采用分子表型频率,然后用Shannon信息指数计算多样性指数,再进行多样性分解,估算出多样性在群体间和群体内所占的比率。但至尽尚未对此进行统计量的定义,不利于描述以及与其它定义的统计量进行比较。
目前国内外尚无基于Bayesian理论的新的统计方法对多种群体遗传统计量同时进行遗传参数分析和比较及优化的报道。
三、发明内容
本发明目的是:提供一套用于显性分子标记数据进行群体遗传多样性和遗传分化参数估算的优化方法,降低通过平方根法估算哑等位基因频率进行群体遗传参数估算的误差。尤其是用Bayesian法估算显性分子标记群体遗传多样性和遗传分化参数估算优化方法。
本发明的技术方案是:获得显性分子标记群体遗传多样性和遗传分化参数优化估算的方法:根据输入的显性分子遗传标记,采用Zhivotovsky提出的基于Bayesian统计理论新的估算哑等位基因频率的方法和多种统计方法对多种群体遗传统计量进行群体遗传多样性和遗传分化遗传参数进行优化估算,估算哑等位基因频率的方法是:对各位点分别先计算无带总数加“1”的Gamma函数的自然对数加上有带和无带总和加“1.5”的Gamma函数的自然对数,减去无带总数加“0.5”的Gamma函数的自然对数,再减去有带和无带总和加“2”的Gamma函数的自然对数,这个结果的指数即是哑等位基因频率;分别用Nei’s H统计量和Shannon H统计量计算群体内遗传多样性;再经算术、加权和全局三种平均方法计算整个群体的平均哑等位基因频率,再计算整个群体的总的遗传多样性,最后根据Nei’s G统计量计算出各位点的Gst和整个群体平均遗传分化系数Gst;另外用Bayesian法计算出来的哑等位基因频率计算群体间基因频率方差,根据Wright’s F统计量估算出各位点的Fst和所有标记位点的平均Fst。
其中具体有关用Bayesian法估算群体遗传参数的步骤和方法如下:(1)对原始分子标记数据进行检测,然后进行基本统计:(A)各群体各标记位点有带和无带的和;(B)从整个群体(即全局法)统计,各标记位点的有带和无带的总和。(2)Bayesian法计算哑等位基因频率的方法是:对各位点分别先计算:无带总数加“1”的Gamma函数的自然对数加上有带和无带总和加“1.5”的Gamma函数的自然对数,减去无带总数加“0.5”的Gamma函数的自然对数,再减去有带和无带总和加“2”的Gamma函数的自然对数,这个结果的指数即是哑等位基因频率。(3)然后用Bayesian法计算出来的哑等位基因频率分别用Nei’s H统计量和Shannon H统计量计算群体内遗传多样性;再经算术、加权和全局三种平均方法计算整个群体的平均哑等位基因频率,再计算整个群体的总的遗传多样性,最后根据Nei’s G统计量计算出群体遗传分化系数Gst。(4)用Bayesian法计算出来的哑等位基因频率计算群体间基因频率方差,根据Wright’s F统计量估算出各位点的Fst和所有标记位点的平均Fst。
本发明通过利用Zhivotovsky提出的基于Bayesian统计理论新的估算哑等位基因频率的方法,采用三种方法(算术平均、加权平均和全局法)计算平均哑等位基因频率,并分别采用Nei’s H统计量,Shannon H统计量来估算群体内遗传多样性和总群体的遗传多样性,用Nei’s G统计量估算的群体间遗传分化参数Gst以及Wight的F统计量估算的群体间哑等位基因频率的方差和遗传分化参数Fst(其中首次采用Bayesian方法估算的哑等位基因频率进行Shannon H统计量的估算)。
本发明特点是:通过应用基于Bayesian统计理论的新的估算哑等位基因频率的方法估算的各种统计量的群体遗传多样性参数特别是群体遗传分化参数,与基于平方根法得到参数相比,明显降低了统计误差,而且各统计量得出的参数基本一致。
本发明方法利用计算机程序处理数据,能得到自洽和一致的有关参数,可以降低通过平方根法估算哑等位基因频率来估算群体遗传多样性和遗传分化参数所带来的统计误差。通过本项发明提供的计算机程序可以实现上述全部遗传参数的自动分析,大大降低了计算工作量并避免了因手工计算可能带来的计算错误。在动植物或微生物用显性分子标记进行群体遗传多样性和群体遗传分化参数估算中具有重要价值。
四、附图说明
图1为本发明程序框图
五、具体实施方式
本项发明提供的计算机程序实现的全部分析过程如下:
(1)对原始显性分子标记数据进行自动检测,并对给出的群体及分子标记数据的参数与实际的数据进行统计分析后核对,然后对原始显性分子遗传标记的群体遗传数据进行基本统计,给出了(A)各群体各标记位点有带和无带以及总和的统计结果;(B)从整个群体(即全局法)来分析,各标记位点的有带和无带以及总和的统计结果。
(2)基于平方根法计算出各群体各位点的哑等位基因频率,采用Nei’sH统计量给出了群体内遗传多样性Hs;各位点的算术平均哑等位基因频率和Hs以及Ht;采用Nei’s G统计量估算出群体遗传分化参数Gst;各位点的加权平均哑等位基因频率和Hs以及在加权平均上获得的Ht和Gst;各位点的全局法哑等位基因频率和Ht以及获得的Gst(算术平均和加权平均);各群体所有位点平均哑等位基因频率和Hs;在算术平均、加权平均和全局法三种条件下,整个群体所有位点的总的Ht,Hs和Gst。
(3)基于平方根法计算出各群体各位点的哑等位基因频率,采用Shannon H统计量给出了群体内遗传多样性参数Hs;各位点的算术平均哑等位基因频率和Hs以及Ht;和采用Nei’s G统计量估算出群体遗传分化参数Gst;各位点的加权平均哑等位基因频率和Hs以及在加权平均上获得的Ht和Gst;各位点的全局法哑等位基因频率和Ht以及获得的Gst(算术平均和加权平均);各群体所有位点平均哑等位基因频率和Hs;在算术平均、加权平均和全局法三种条件下,整个群体所有位点的总的Ht,Hs和Gst。
(4)基于平方根法,结合Wright’s F统计量给出了各位点哑等位基因频率方差和Fst,所有标记位点的平均Fst。
(5)用Bayesian法计算出哑等位基因频率,采用Nei’s H统计量给出了群体内遗传多样性Hs;各位点的算术平均哑等位基因频率和Hs以及Ht,采用Nei’s G统计量估算出群体遗传分化参数Gst;各位点的加权平均哑等位基因频率和Hs以及在加权平均上获得的Ht和Gst;各位点的全局法哑等位基因频率和Ht以及获得的Gst(算术平均和加权平均);各群体所有位点平均哑等位基因频率和Hs;在算术平均、加权平均和全局法三种条件下,整个群体所有位点的总的Ht,Hs和Gst。
(6)基于Bayesian法计算出各群体各位点的哑等位基因频率,采用Shannon H统计量给出了群体遗传多样性Hs;各位点的算术平均哑等位基因频率和Hs以及Ht;采用Nei’s G统计量估算出群体遗传分化参数Gst;各位点的加权平均哑等位基因频率和Hs以及在加权平均上获得的Ht和Gst;各位点的全局法哑等位基因频率和Ht以及获得的Gst(算术平均和加权平均);各群体所有位点平均哑等位基因频率和Hs;在算术平均、加权平均和全局法三种条件下,整个群体所有位点的总的Ht,Hs和Gst。
(7)基于Bayesian法,结合Wright’s F统计量给出了各位点哑等位基因频率方差和Fst,所有标记位点的平均Fst。
(8)基于Shannon Information Index(Chalmers等1992),给出了新定义的Z统计量—分子表型遗传分化。计算出各群体各个位点的分子表型频率和群体内分子表型多样性参数Hpop;各位点的算术和加权平均分子表型频率和平均Hpop;整个群体总的分子表型多样性Hsp、群体内分子表型遗传分化参数Zpop和群体间分子表型遗传分化参数Zst;各群体所有位点平均频率和Hpop;在算术平均、加权平均条件下,整个群体所有位点的总的Hsp、Hpop、Zpop和Zst。实例分析结果:
实例数据来自加拿大Alberta大学群体遗传研究小组提供的8个天然杨树群体的28个RAPD分子标记。根据本项技术重新分析后得出的群体遗传分化参数与平方根法比较结果如下:
Nei’s G统计量(Gst)
群体分化参数 Wright F统计量(Fst)
Nei’s H统计量 Shannon H统计量
Bayesian法 0.0391 0.0373 0.0386
平方根法 0.0535 0.0858 0.0589(本表中的结果根据加权平均计算的平均哑等位基因频率)
本项技术已经应用于美国国家自然科学基金项目“Iris耐盐天然群体分子进化和分子生态学研究”项目,还将应用于国家海洋863项目“海滨锦葵的分子育种”项目等。
Claims (3)
1、获得显性分子标记群体遗传多样性和遗传分化参数优化估算的方法:根据输入的显性分子遗传标记,采用Zhivotovsky提出的基于Bayesian统计理论新的估算哑等位基因频率的方法和多种统计方法对多种群体遗传统计量进行群体遗传多样性和遗传分化遗传参数进行优化估算,其特征是估算哑等位基因频率的方法是:对各位点分别先计算无带总数加“1”的Gamma函数的自然对数加上有带和无带总和加“1.5”的Gamma函数的自然对数,减去无带总数加“0.5”的Gamma函数的自然对数,再减去有带和无带总和加“2”的Gamma函数的自然对数,这个结果的指数即是哑等位基因频率;分别用Nei’s H统计量和Shannon H统计量计算群体内遗传多样性;再经算术、加权和全局三种平均方法计算整个群体的平均哑等位基因频率,再计算整个群体的总的遗传多样性,最后根据Nei’s G统计量计算出各位点的Gst和整个群体平均遗传分化系数Gst;另外用Bayesian法计算出来的哑等位基因频率计算群体间基因频率方差,根据Wright’s F统计量估算出各位点的Fst和所有标记位点的平均Fst。
2、由权利要求1所述的获得显性分子标记群体遗传多样性和遗传分化参数优化估算的方法:其特征是用基于Bayesian方法估算哑等位基因频率,采用Nei’sH统计量和Shannon H统计量计算出群体内遗传多样性参数(Hs);各位点的算术平均哑等位基因频率和Hs以及整个群体总的遗传多样性(Ht);采用Nei’s G统计量估算出群体遗传分化参数(Gst);各位点的加权平均哑等位基因频率和Hs以及在加权平均上获得的Ht和Gst;各位点的全局法哑等位基因频率和Ht以及获得的算术平均和加权平均Gst;各群体所有位点平均哑等位基因频率和Hs;在算术平均、加权平均和全局法三种条件下,整个群体所有位点的总的Ht,Hs和Gst。
3、由权利要求2所述的获得显性分子标记群体遗传多样性和遗传分化参数优化估算的方法:其特征是采用Wrigh’s F统计量给出了各位点哑等位基因频率方差和Fst,以及所有标记位点的平均Fst;并基于Shannon Information Index新定义的Z统计量,计算出各群体各位点分子表型频率;各位点群体内分子表型多样性Hpop;各位点的算术和加权平均分子表型频率和Hpop;整个群体总的分子表型多样性Hsp;在算术平均、加权平均条件下,整个群体所有位点的群体内分子表型多样性分化参数(Zpop)和群体间分子表型多样性分化参数(Zst)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN03131911.4A CN1462805A (zh) | 2003-06-17 | 2003-06-17 | 显性分子标记群体遗传多样性和遗传分化参数估算优化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN03131911.4A CN1462805A (zh) | 2003-06-17 | 2003-06-17 | 显性分子标记群体遗传多样性和遗传分化参数估算优化方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1462805A true CN1462805A (zh) | 2003-12-24 |
Family
ID=29748483
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN03131911.4A Pending CN1462805A (zh) | 2003-06-17 | 2003-06-17 | 显性分子标记群体遗传多样性和遗传分化参数估算优化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1462805A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102184348A (zh) * | 2011-01-12 | 2011-09-14 | 湖北大学 | 基于自然生殖过程的昆虫遗传群体的模拟方法 |
CN102317946A (zh) * | 2007-09-06 | 2012-01-11 | 海因·范·德尔·斯蒂恩 | 一种通过定量基因分型评估显著性的系统和方法 |
CN106022005A (zh) * | 2016-05-21 | 2016-10-12 | 安徽省农业科学院畜牧兽医研究所 | 一种连续性状和阈性状基因组育种值联合估计的贝叶斯方法 |
-
2003
- 2003-06-17 CN CN03131911.4A patent/CN1462805A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102317946A (zh) * | 2007-09-06 | 2012-01-11 | 海因·范·德尔·斯蒂恩 | 一种通过定量基因分型评估显著性的系统和方法 |
CN102184348A (zh) * | 2011-01-12 | 2011-09-14 | 湖北大学 | 基于自然生殖过程的昆虫遗传群体的模拟方法 |
CN102184348B (zh) * | 2011-01-12 | 2013-10-02 | 湖北大学 | 基于自然生殖过程的昆虫遗传群体的模拟方法 |
CN106022005A (zh) * | 2016-05-21 | 2016-10-12 | 安徽省农业科学院畜牧兽医研究所 | 一种连续性状和阈性状基因组育种值联合估计的贝叶斯方法 |
CN106022005B (zh) * | 2016-05-21 | 2019-02-05 | 安徽省农业科学院畜牧兽医研究所 | 一种连续性状和阈性状基因组育种值联合估计的贝叶斯方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Qanbari | On the extent of linkage disequilibrium in the genome of farm animals | |
Govindaraj et al. | Importance of genetic diversity assessment in crop plants and its recent advances: an overview of its analytical perspectives | |
Chesnokov et al. | Evaluation of the measure of polymorphism information of genetic diversity | |
Kremer et al. | Monitoring genetic diversity in tropical trees with multilocus dominant markers | |
Vaughn et al. | The genetic architecture of seed composition in soybean is refined by genome-wide association scans across multiple populations | |
Habier et al. | Genomic selection using low-density marker panels | |
Zhivotovsky | Estimating population structure in diploids with multilocus dominant DNA markers | |
Aagaard et al. | RAPDs and allozymes exhibit similar levels of diversity and differentiation among populations and races of Douglas-fir | |
Field et al. | Patterns of hybridization and asymmetrical gene flow in hybrid zones of the rare Eucalyptus aggregata and common E. rubida | |
Olson et al. | Nucleotide diversity and linkage disequilibrium in balsam poplar (Populus balsamifera) | |
Hall et al. | Parentage and relatedness reconstruction in Pinus sylvestris using genotyping-by-sequencing | |
Degen et al. | Comparative study of genetic variation and differentiation of two pedunculate oak (Quercus robur) stands using microsatellite and allozyme loci | |
Hopkins et al. | Molecular signatures of selection on reproductive character displacement of flower color in Phlox drummondii | |
Oddou-Muratorio et al. | Population estimators or progeny tests: what is the best method to assess null allele frequencies at SSR loci? | |
Zhang et al. | Identifying and reducing AFLP genotyping error: an example of tradeoffs when comparing population structure in broadcast spawning versus brooding oysters | |
Harper et al. | Analysis of museum specimens suggests extreme genetic drift in the adonis blue butterfly (Polyommatus bellargus) | |
Sullivan et al. | Hybridization and divergence in multi-species oak (Quercus) communities | |
Nguyen et al. | Genome-wide SNP discovery and core marker sets for assessment of genetic variations in cultivated pumpkin (Cucurbita spp.) | |
Frisch et al. | The length of the intact donor chromosome segment around a target gene in marker-assisted backcrossing | |
Takou et al. | Maintenance of adaptive dynamics and no detectable load in a range-edge outcrossing plant population | |
Saravanan et al. | Advanced software programs for the analysis of genetic diversity in livestock genomics: a mini review | |
Manco et al. | Comparative analysis of genomic-and EST-SSRs in European plum (Prunus domestica L.): Implications for the diversity analysis of polyploids | |
Gonçalves-Dias et al. | PopAmaranth: a population genetic genome browser for grain amaranths and their wild relatives | |
Bush et al. | Characterising a Eucalyptus cladocalyx breeding population using SNP markers | |
Chen et al. | Genetic diversity of Prunus sibirica L. superior accessions based on the SSR markers developed using restriction-site associated DNA sequencing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |