CN112349348A - 分子标记指纹数据的比对方法、非暂存态存储介质和装置 - Google Patents

分子标记指纹数据的比对方法、非暂存态存储介质和装置 Download PDF

Info

Publication number
CN112349348A
CN112349348A CN202011225870.0A CN202011225870A CN112349348A CN 112349348 A CN112349348 A CN 112349348A CN 202011225870 A CN202011225870 A CN 202011225870A CN 112349348 A CN112349348 A CN 112349348A
Authority
CN
China
Prior art keywords
fingerprint
genotype
difference
comparison
sites
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011225870.0A
Other languages
English (en)
Other versions
CN112349348B (zh
Inventor
王凤格
江彬
霍永学
吴昊天
张云龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Academy of Agriculture and Forestry Sciences
Original Assignee
Beijing Academy of Agriculture and Forestry Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Academy of Agriculture and Forestry Sciences filed Critical Beijing Academy of Agriculture and Forestry Sciences
Priority to CN202011225870.0A priority Critical patent/CN112349348B/zh
Publication of CN112349348A publication Critical patent/CN112349348A/zh
Application granted granted Critical
Publication of CN112349348B publication Critical patent/CN112349348B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical & Material Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Analytical Chemistry (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本发明涉及生物信息学领域,具体涉及分子标记指纹数据的比对方法、非暂存态存储介质和装置。本发明通过契合分子标记DNA指纹数据特点,先进行位点和基因型分组后再进行统计,构建了一个快速指纹比对方法。这种方法适用于任意标记DNA数据比对业务场景,该算法解决了指纹数据建库和指纹筛查时的快速比对需要,并可结合实际业务需要通过软件程序化实现该方法,其设计思路非常适合计算机的软件编程实现。该方法还可以应用于多线程和分布式指纹比对这类应用程序中,可以非常明显地提升整体计算效率。

Description

分子标记指纹数据的比对方法、非暂存态存储介质和装置
技术领域
本发明涉及生物信息学领域,具体涉及分子标记指纹数据的比对方法、非暂存态存储介质和装置。
背景技术
DNA指纹数据库构建过程中,指纹库中所有指纹之间的差异和无差异情况是一个重要的建库质量参数。植物DNA指纹数据建库时,单一品种可能会存在的多个不同年份的标准样品,而确定它们之间的差异情况可以用来确定样品是否被更换或产生变异。在人类DNA建库后,也涉及库内数据的互比筛查,而应用建库时也需要将给定样本指纹与全库进行比对,这些业务场景不可避免的需要用到指纹数据间比对算法来实现。所以如何对标记技术生产的指纹数据进行快速比对成为一个关键性技术。
目前已有的各种指纹数据库系统中包含的指纹比对功能,大部分均采用循环成对比较的方式。这种方式实际就是对从给定的两个队列中各选取一个指纹,然后执行位点数据比对,这样得到两个指纹间的位点缺失、差异和无差异情况。这种算法实现方式最大优点是实现非常简单,但其随着指纹数据增加将暴露自身的缺陷,使得无法适应大规模的指纹数据应用环境,需要更加快速的比对算法。
出现上述缺陷最主要的原因在于——进行了过多的无效计算,例如指纹比对后主要关注指纹间的差异性,而采用循环比对算法会导致应用程序必须全部比对完成才能得到差异位点信息。
发明内容
为了解决上述技术问题,本发明提供了一种分子标记指纹数据的比对方法、非暂存态存储介质和装置。
具体而言,本发明首先提供一种分子标记指纹数据的比对方法,包括:
设置指纹和位点ID号:为待比指纹列表和对比指纹列表中包含的所有指纹设置ID号,并将ID号同时绑定指纹包含的位点上;
按照位点分组:分别将待比指纹列表和对比指纹列表中的所有位点过滤出来并按照位点分组后,设置到不同位点分组中的待比指纹ID列表和对比指纹ID列表中;
按照基因型分组:将每一个位点分组进一步按照基因型分组,得到基因型分组列表;
按基因型比对:将每个基因型分组中的基因型进行比对,若存在差异则构建差异关联信息对,若无差异则忽略之;将所有位点分组逐一处理后,得到所有的差异基因型关联信息对;
统计差异信息:以指纹ID为索引,对所得到的差异基因型关联信息对进行统计。
在指纹间的差异性通常是有限的,另外,因为任意单个标记包含的等位基因也是有限的,所以指纹数据所包含的基因分型也是有限的。这使得本发明中的比对方法可以以更小的时间空间代价提供更快比对速度。
本发明中所述的分子标记包括SSR分子标记、InDel分子标记和SNP分子标记。
作为优选,在所述按基因型比对中,通过比对字符数据的差异,判断是否存在SNP分子标记的差异位点。
适用于SNP标记AGCT碱基型数据基因型比对算法只需要判定字符数据是否存在差异,例如A/G与A/T基因型间是存在差异的。
作为优选,在所述按基因型比对中,通过比对数字格式的基因型,判断是否存在SSR或InDel分子标记的差异位点。
适用于SSR、InDel标记数字格式的基因型比对,数据比对时通常需要提供一个误差值,以提供自动校正平台误差的功能。
作为本发明的优选方案,数字格式的基因型的具体比对方法如下:
定义Lx(ai,bi)和Lx(aj,bj)表示序号x的位点上的两个基因型数据,根据CE平台特性,设置一个碱基偏移量参数offset≤1,并按如下方式计算:
R1=(|ai-aj|≤offset)
R2=(|bi-bj|≤offset)
R3=(|ai-bj|≤offset)
R4=(|bi-aj|≤offset)
R=((R1&&R2)||(R3&&R4))
其中,当R为TRUE值时,判定基因型Lx(ai,bi)和Lx(aj,bj)之间不存在差异,当R为FALSE值时,判定基因型Lx(ai,bi)和Lx(aj,bj)之间存在差异位点。
作为优选,所述统计差异信息具体包括:
以指纹ID为索引构建一个结果矩阵表,将统计得到的位点差异信息在矩阵表中进行计数;
将所有差异基因型关联信息对完成统计,得到所有指纹间的差异数信息。
本领域人员可以对上述优选方案进行组合,得到本发明的较佳实施例。
作为本发明的一个优选方案,所述的比对方法具体包括:
设置指纹和位点ID号:为待比指纹列表G(n,p)和对比指纹列表G(m,p)中包含的所有指纹设置ID号,并将ID号同时绑定指纹包含的位点上;其中n和m表示列表包含的指纹数,p表示列表包含的位点数;
按照位点分组:将G(n,p)中的所有位点过滤出来并按照位点分组后,设置到L1~Lp分组中的待比指纹ID列表中;将G(m,p)中的所有位点过滤出来并按照位点分组后,设置到L1~Lp分组中的对比指纹ID列表中;
按照基因型分组:从L1~Lp分组中提取出Lx分组(1≤x≤p),假设第x位点包含了y个基因型,则将Lx分组按照基因型分组成Lx(a1,b1)~Lx(ay,by),其中a1,b1,ay,by表示Lx位点包含的基因;
按基因型比对:将Lx的y个基因型分组中的第i和j个分组基因型比对(1≤i≤p,1≤j≤p),若存在差异则构建差异关联信息对,若无差异则忽略之;将p个位点的所有分组逐一循环处理得到所有的差异基因型关联信息对;
统计差异信息:以指纹ID为索引,对所得到的差异基因型关联信息对进行统计。
在两个指纹数据进行比对时,定义差异位点数为D,无差异位点数为S,缺失位点数为M,通常需要关注的是差异位点情况,故D即为有效计算,而S和M为非有效计算。G(n,p)和G(m,p)比对产生的全部比对结果数为C=n*m。定义参数μ(μ∈[0,p])表示比对结果的平均差异位点数,v为平均差异位点数占比。所以比对过程中提取出所有差异位点数信息的计算量之和即为有效计算量之和记为T,则有公式如下:
Figure BDA0002763635620000041
Figure BDA0002763635620000042
假设T值表示当需要提取出比对时的全部差异位点信息时所需要执行的最小计算量。对于任意的G(n,p)和G(m,p)指纹列表进行比对,假设某次比对时算法的实际计算量为t,由上述公式可以计算出有效计算量的最优值T,则可知:
1)t>T:表示算法执行了多余的无效计算;
2)t=T:表示算法已达到最优性能了;
3)t<T:表示无法获取全部有效信息。
任意比对算法的比对过程中,t值会趋向于T,却不可能等于T,因为任何比对算法都无法直接规避掉所有无效的计算量。
因为本发明的比对方法中进行了位点分组和基因型分组,在实际实现时是可以一次性完成的,所以其计算量可计为t1p*(n+m),而由于统计时实际是对所有差异位点数进行计数,所以可以根据平均差异位点数V计算得到计算量为t2=C*v=n*m*v,所以本发明比对方法的计算量为:
t=t1+t2=p*(n+m)+n*m*v
由于平均差异位点数占比v∈[0,1],故本算法的计算规模的范围为:
t∈[p*(n+m),p*(n+m)+n*m]
算法效率的推导结论如下:
1)当V=0时,表示全部位点均为无差异位点,此时计算量最小,规模为p*(n+m),此时只在数据分组过程中耗费了时间;
2)当V=1时,表示全部位点均为差异位点,此时计算量最大,规模为p*(n+m)+n*m,此时在数据分组和统计过程中均耗费了时间。
所以本发明中的比对方法在指纹比对过程中是非常高效的,其算法规模在最极端情况下也仅是平方级别的,但实际应用过程中这种情况很少出现,因为物种内的差异不可能大到这种程度,一般应该呈现一个正态分布的规律,所以其效率是比较稳定的。
本发明进一步提供一种非暂存态存储介质,其储存能够由电子数据处理设备运行的指令,以执行上述的分子标记指纹数据的比对方法。
本发明进一步提供一种装置,包括:电子数据处理设备,其被编程以执行上述的分子标记指纹数据的比对方法。
本发明进一步提供所述的比对方法或所述的非暂存态存储介质或所述的装置在指纹数据建库中的应用。
具体的,在建库时需要将给定样本指纹与全库指纹数据进行比对,以保证指纹库中所有指纹之间存在差异,就可以应用本发明中的比对方法。
本发明进一步提供所述的比对方法或所述的非暂存态存储介质或所述的装置在指纹数据筛查中的应用。
本发明中的指纹数据源自具有分子标记的生物,包括动物(比如人)、植物(比如常规经济作物)和微生物。
基于上述方案,本发明的有益效果如下:
本发明通过契合分子标记DNA指纹数据特点,采用分组和统计的方式,构建了一个快速指纹比对方法。这种方法适用于任意标记DNA数据比对业务场景,该算法解决了指纹数据建库和指纹筛查时的快速比对需要,并可结合实际业务需要通过软件程序化实现该方法,其设计思路非常适合计算机的软件编程实现。该方法还可以应用于多线程和分布式指纹比对这类应用程序中,可以非常明显地提升整体计算效率。
附图说明
图1为本发明实施例1中比对方法的流程图。
具体实施方式
以下实施例用于说明本发明,但不用来限制本发明的范围。
实施例中未注明具体技术或条件者,按照本领域内的文献所描述的技术或条件,或者按照产品说明书进行。
实施例1
本实施例提供一种分子标记指纹数据的比对方法,流程图如图1所示,具体包括如下步骤:
1)设置指纹和位点ID号。为G(n,p)和G(m,p)中包含的所有指纹设置ID号,并将ID号同时绑定指纹包含的位点上;
2)按照位点分组。将G(n,p)中所有位点过滤出来并按照位点分组,并设置到L1~Lp分组中待比指纹ID列表中。将G(m,p)中所有位点过滤出来按照位点分组,并设置到L1~Lp分组中对比指纹ID列表中。这样L1~Lp分组中均包含了待比和对比位点列表;
3)按照基因型分组。从L1~Lp分组中取出Lx分组(1≤x≤p),假设第x位点包含了y个基因型,则将Lx分组按照基因型分组成Lx(a1,b1)~Lx(ay,by),其中a1,b1,ay,by表示Lx位点包含的基因;
4)按基因型比对。将Lx的y个基因型分组中的第i和j个分组基因型比对(1≤i≤p,1≤j≤p),若存在差异则构建差异关联信息对,若无差异则忽略之;将p个位点的所有分组逐一循环处理得到所有差异基因型关联信息对;
在所述按基因型比对中,通过比对字符数据的差异,判断是否存在SNP分子标记的差异位点。
通过比对数字格式的基因型,判断是否存在SSR或InDel分子标记的差异位点。
数字格式的基因型的具体比对方法如下:
定义Lx(ai,bi)和Lx(aj,bj)表示序号x的位点上的两个基因型数据,根据CE平台特性,设置一个碱基偏移量参数offset≤1,并按如下方式计算:
R1=(|ai-aj|≤offset)
R2=(|bi-bj|≤offset)
R3=(|ai-bj|≤offset)
R4=(|bi-aj|≤offset)
R=((R1&&R2)||(R3&&R4))
其中,当R为TRUE值时,判定基因型Lx(ai,bi)和Lx(aj,bj)之间不存在差异,当R为FALSE值时,判定基因型Lx(ai,bi)和Lx(aj,bj)之间存在差异位点。
5)统计差异信息。逐一遍历差异基因型关联信息对,例如假设Lx(ai,bi)和Lx(aj,bj)分组存在差异,则Lx(ai,bi)分组的待比指纹ID列表与Lx(aj,bj)分组的对比指纹ID列表之间位点数据是存在差异的,Lx(ai,bi)分组的对比指纹ID列表与Lx(aj,bj)分组的待比指纹ID列表之间位点数据是存在差异的,所以只需要以指纹ID为索引构建一个结果矩阵表,即可将统计得到的位点差异信息在矩阵表中进行计数。只需要将所有差异基因型关联信息对完成统计,就可以得到所有指纹间的差异数信息(如图中D1~D4表示比对后得到的指纹间差异位点数),至此完成了G(n,p)和G(m,p)队列间全部指纹间的比对。
本实施例进一步提供一种装置,包括:电子数据处理设备,其被编程以执行上述的分子标记指纹数据的比对方法。
通过上述装置,本发明对玉米指纹数据的40个SSR标记的数据1000~10000份指纹数据进行比对,比对结果见表1,比对时间采用的是ms为单位。
表1
Figure BDA0002763635620000081
Figure BDA0002763635620000091
通过上述装置,本发明对玉米指纹数据的384个SNP标记的1000~10000份指纹数据进行比对,比对结果见表2,比对时间采用的是ms为单位。
表2
Figure BDA0002763635620000092
表1采用的是10000份包含40个位点的SSR标记指纹数据集,表2采用10000份包含384个位点的SNP标记指纹数据集。但都是采用每次增加1000份指纹数据的方式,以指纹队列内部进行两两比对的方式开展比对的,通过排列组合计算公式可以得到比对结果数,所以表1和表2的前三列数据必然是相同的,但因为表2中比对位点数远高于表1,所以平均比对时间也是必然增加,不过可以看出,表2中的比对时间仍然是非常高效的。
虽然,上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。

Claims (10)

1.一种分子标记指纹数据的比对方法,其特征在于,包括:
设置指纹和位点ID号:为待比指纹列表和对比指纹列表中包含的所有指纹设置ID号,并将ID号同时绑定指纹包含的位点上;
按照位点分组:分别将待比指纹列表和对比指纹列表中的所有位点过滤出来并按照位点分组后,设置到不同的位点分组中的待比指纹ID列表和对比指纹ID列表中;
按照基因型分组:将每一个位点分组进一步按照基因型分组,得到基因型分组列表;
按基因型比对:将每个基因型分组中的基因型进行比对,若存在差异则构建差异关联信息对,若无差异则忽略之;将所有位点分组逐一处理后,得到所有的差异基因型关联信息对;
统计差异信息:以指纹ID为索引,对所得到的差异基因型关联信息对进行统计。
2.根据权利要求1所述的比对方法,其特征在于,所述分子标记包括SSR分子标记、InDel分子标记和SNP分子标记。
3.根据权利要求2所述的比对方法,其特征在于,在所述按基因型比对中,通过比对字符数据的差异,判断是否存在SNP分子标记的差异位点。
4.根据权利要求2或3所述的比对方法,其特征在于,在所述按基因型比对中,通过比对数字格式的基因型,判断是否存在SSR或InDel分子标记的差异位点。
5.根据权利要求4所述的比对方法,其特征在于,数字格式的基因型的具体比对方法如下:
定义Lx(ai,bi)和Lx(aj,bj)表示序号x的位点上的两个基因型数据,根据CE平台特性,设置一个碱基偏移量参数offset≤1,并按如下方式计算:
R1=(|ai-aj|≤offset)
R2=(|bi-bj|≤offset)
R3=(|ai-bj|≤offset)
R4=(|bi-aj|≤offset)
R=((R1&&R2)||(R3&&R4))
其中,当R为TRUE值时,判定基因型Lx(ai,bi)和Lx(aj,bj)之间不存在差异,当R为FALSE值时,判定基因型Lx(ai,bi)和Lx(aj,bj)之间存在差异位点。
6.根据权利要求1~5中任一项所述的比对方法,其特征在于,所述统计差异信息具体包括:
以指纹ID为索引构建一个结果矩阵表,将统计得到的位点差异信息在矩阵表中进行计数;
将所有差异基因型关联信息对完成统计,得到所有指纹间的差异数信息。
7.一种非暂存态存储介质,其储存能够由电子数据处理设备运行的指令,以执行权利要求1~6中任一项所述的比对方法。
8.一种装置,包括:
电子数据处理设备,其被编程以执行权利要求1~6中任一项所述的比对方法。
9.权利要求1~6中任一项所述的比对方法或权利要求7所述的非暂存态存储介质或权利要求8所述的装置在指纹数据建库中的应用。
10.权利要求1~6中任一项所述的比对方法或权利要求7所述的非暂存态存储介质或权利要求8所述的装置在指纹数据筛查中的应用。
CN202011225870.0A 2020-11-05 2020-11-05 分子标记指纹数据的比对方法、非暂存态存储介质和装置 Active CN112349348B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011225870.0A CN112349348B (zh) 2020-11-05 2020-11-05 分子标记指纹数据的比对方法、非暂存态存储介质和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011225870.0A CN112349348B (zh) 2020-11-05 2020-11-05 分子标记指纹数据的比对方法、非暂存态存储介质和装置

Publications (2)

Publication Number Publication Date
CN112349348A true CN112349348A (zh) 2021-02-09
CN112349348B CN112349348B (zh) 2023-10-13

Family

ID=74429907

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011225870.0A Active CN112349348B (zh) 2020-11-05 2020-11-05 分子标记指纹数据的比对方法、非暂存态存储介质和装置

Country Status (1)

Country Link
CN (1) CN112349348B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009130520A1 (en) * 2008-04-25 2009-10-29 Novalis Ltd. Method for the annotation of natural product gene-clusters and for the generation of novel biologically active chemical entities from dna sequences in silico
US20120117584A1 (en) * 2010-11-01 2012-05-10 Gordon Donald F Method and System for Presenting Additional Content at a Media System
US20140123255A1 (en) * 2012-10-25 2014-05-01 Uniloc Luxembourg, S.A. System and method for device authentication with built-in tolerance
CN106244681A (zh) * 2016-07-28 2016-12-21 中国农业科学院作物科学研究所 一种利用基因组ssr和est‑ssr指纹图谱鉴别绿豆品种的方法及应用
CN108009401A (zh) * 2017-11-29 2018-05-08 内蒙古大学 一种筛选指纹图谱遗传标记的方法
CN108416189A (zh) * 2018-02-08 2018-08-17 北京市农林科学院 一种基于分子标记技术的农作物品种杂种优势模式鉴定方法
WO2019084236A1 (en) * 2017-10-26 2019-05-02 Institute For Systems Biology METHOD AND SYSTEM FOR GENERATING AND COMPARING GENOTYPES
CA3101527A1 (en) * 2018-06-06 2019-12-12 Lexent Bio, Inc. Methods for fingerprinting of biological samples
EP3693970A1 (en) * 2019-02-07 2020-08-12 BVBA Biostrand Biological sequence information handling

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009130520A1 (en) * 2008-04-25 2009-10-29 Novalis Ltd. Method for the annotation of natural product gene-clusters and for the generation of novel biologically active chemical entities from dna sequences in silico
US20120117584A1 (en) * 2010-11-01 2012-05-10 Gordon Donald F Method and System for Presenting Additional Content at a Media System
US20140123255A1 (en) * 2012-10-25 2014-05-01 Uniloc Luxembourg, S.A. System and method for device authentication with built-in tolerance
CN106244681A (zh) * 2016-07-28 2016-12-21 中国农业科学院作物科学研究所 一种利用基因组ssr和est‑ssr指纹图谱鉴别绿豆品种的方法及应用
WO2019084236A1 (en) * 2017-10-26 2019-05-02 Institute For Systems Biology METHOD AND SYSTEM FOR GENERATING AND COMPARING GENOTYPES
CN108009401A (zh) * 2017-11-29 2018-05-08 内蒙古大学 一种筛选指纹图谱遗传标记的方法
CN108416189A (zh) * 2018-02-08 2018-08-17 北京市农林科学院 一种基于分子标记技术的农作物品种杂种优势模式鉴定方法
CA3101527A1 (en) * 2018-06-06 2019-12-12 Lexent Bio, Inc. Methods for fingerprinting of biological samples
EP3693970A1 (en) * 2019-02-07 2020-08-12 BVBA Biostrand Biological sequence information handling

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HAN ZHENGZHOU: "SSR marker development and intraspecific genetic divergence exploration of Chrysanthemum indicum based on transcriptome analysis", BMC GENOMICS *
王凤格;田红丽;易红梅;赵涵;霍永学;匡猛;张力科;吕远大;丁曼卿;赵久然;: "植物品种DNA指纹鉴定原理及其鉴定方案", 分子植物育种, no. 14 *
田红丽: "兼容型maizeSNP384标记筛选与玉米杂交种DNA指纹图谱构建", 作物学报 *

Also Published As

Publication number Publication date
CN112349348B (zh) 2023-10-13

Similar Documents

Publication Publication Date Title
US11335435B2 (en) Identifying ancestral relationships using a continuous stream of input
Zhang et al. Horizontal transfer and evolution of transposable elements in vertebrates
Heslot et al. Impact of marker ascertainment bias on genomic selection accuracy and estimates of genetic diversity
Harvey et al. Similarity thresholds used in DNA sequence assembly from short reads can reduce the comparability of population histories across species
Gori et al. Clustering genes of common evolutionary history
Lehermeier et al. Genomic variance estimates: With or without disequilibrium covariances?
He et al. Evaluation of genomic prediction for pasmo resistance in flax
Nevado et al. Resequencing studies of nonmodel organisms using closely related reference genomes: optimal experimental designs and bioinformatics approaches for population genomics
Latorre et al. Genomic surveillance uncovers a pandemic clonal lineage of the wheat blast fungus
CN111312334B (zh) 一种影响细胞间通讯的受体-配体系统分析方法
Freyman et al. Fast and robust identity-by-descent inference with the templated positional burrows–wheeler transform
Zhou et al. Assembly of whole-chromosome pseudomolecules for polyploid plant genomes using outbred mapping populations
CN112599198A (zh) 一种用于宏基因组测序数据的微生物物种与功能组成分析方法
Almeida et al. Genetic diversity, population structure, and andean introgression in Brazilian common bean cultivars after half a century of genetic breeding
Hämälä et al. Gene expression modularity reveals footprints of polygenic adaptation in Theobroma cacao
Huang Parapatric genetic introgression and phenotypic assimilation: testing conditions for introgression between Hercules beetles (Dynastes, Dynastinae)
Thareja et al. Genotyping-by-sequencing identifies date palm clone preference in agronomics of the State of Qatar
Sakamoto et al. Comparison of shape quantification methods for genomic prediction, and genome-wide association study of sorghum seed morphology
Howard et al. Integration of Infinium and Axiom SNP array data in the outcrossing species Malus× domestica and causes for seemingly incompatible calls
Gouda et al. Development and validation of diagnostic SNP markers for quality control genotyping in a collection of four rice (Oryza) species
Ignacio et al. Genetic mapping by sequencing more precisely detects loci responsible for anaerobic germination tolerance in rice
Contaldi et al. Practical Workflow from high-throughput genotyping to genomic estimated breeding values (GEBVs)
Wang et al. Genomic landscape of parallel domestication of upland rice and its implications
CN112349348A (zh) 分子标记指纹数据的比对方法、非暂存态存储介质和装置
Wang et al. Interpretation of manhattan plots and other outputs of genome-wide association studies

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant