CN111524552A - 简化基因组测序文库构建分析方法、检测设备及存储介质 - Google Patents

简化基因组测序文库构建分析方法、检测设备及存储介质 Download PDF

Info

Publication number
CN111524552A
CN111524552A CN202010333594.3A CN202010333594A CN111524552A CN 111524552 A CN111524552 A CN 111524552A CN 202010333594 A CN202010333594 A CN 202010333594A CN 111524552 A CN111524552 A CN 111524552A
Authority
CN
China
Prior art keywords
dna fragment
genome
original
sample
simplified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010333594.3A
Other languages
English (en)
Other versions
CN111524552B (zh
Inventor
莫晖
姜宁
尹良超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Ruhan Technology Co ltd
Original Assignee
Shenzhen Ruhan Gene Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Ruhan Gene Technology Co ltd filed Critical Shenzhen Ruhan Gene Technology Co ltd
Priority to CN202010333594.3A priority Critical patent/CN111524552B/zh
Publication of CN111524552A publication Critical patent/CN111524552A/zh
Application granted granted Critical
Publication of CN111524552B publication Critical patent/CN111524552B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • G16B35/10Design of libraries
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • G16B35/20Screening of libraries

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Library & Information Science (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Immunology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开一种简化基因组测序文库的构建方法、简化基因组测序数据的分析方法、检测设备及存储介质,包括:将基因组DNA进行酶切处理,形成多个DNA片段;将每个DNA片段的两端分别连接接头,形成DNA片段样本;从DNA片段样本中选择符合预设设计长度大小的DNA片段样本;将选择出来的DNA片段样本进行第二轮酶切处理,提取出有效细胞核基因组序列DNA片段;使用引物将有效细胞核基因组序列DNA片段进行PCR扩增;从PCR扩增后的有效基因组序列DNA片段中选择目标基因组序列DNA片段,得到原始简化基因组测序DNA片段。通过本发明实施例,实现基因组简化程度、预判可检测的多态性位点数目、完成检测目标区域在基因组分布的密度和均一度评估分析,灵活、准确的进行简化基因组测序文库构建。

Description

简化基因组测序文库构建分析方法、检测设备及存储介质
技术领域
本发明涉及基因检测领域,特别涉及一种简化基因组测序文库的构建方法、简化基因组测序数据的分析方法、检测设备及存储介质。
背景技术
目前,在某个物种的个体之间检测全基因组水平的遗传特征是当前国际上动植物基因组学研究的热点之一。这对研究物种的进化历史、环境适应性、自然选择、遗传图谱构建、目标性状连锁分析以及性状QTL精确定位等方面具有重大意义。为了提高上述研究的检测强度、检测精度以及检测的准确性,通常需要在大规模群体内(样本量≥100,甚至需要200)找到高密度的单核苷酸遗传多态位点(SNPs,Single Nucleotide Polymorphisms)或是插入缺失位点(INDELs,Insertion-Deletion)。以目前高通量测序技术平台的成本水平,在如此大样本群体中进行全基因组重测序是很难实现的。
简化基因组测序(RAD-seq,Restriction-site associated DNA sequencing)是基于限制性内切酶关联片段技术,特定的选择基因组中一小部分目标区域进行高通量测序,进而鉴定变异标记信息的方法。该技术操作便捷、稳定性好,可以大幅降低基因组的复杂度,减少测序通量,特别适合大样本量的分析,从而可以高效、经济、准确的在大样本群体中开展遗传标记的开发和分型分析。目前简化基因组RAD-seq技术存在着以下三个主要的技术缺陷:
限制性内切酶的选择标准不明确。目前已有限制性内切酶,不同的内切酶在同一物种的基因组中酶切位点的位置和数目会有很大的差别。在实验设计时,选择哪个或是那几个内切酶进行RAD-seq文库构建?选择的内切酶可以将基因组重测序简化的什么程度?选择的目标测序片段在基因组中的密度,是否随机均匀分布?能够检测到多少遗传多态性位点?这些遗传多态性位点在基因组中的密度和分布情况,能否满足后续分析研究的要求?上述问题在传统的简化基因组RAD-seq测序中均不能解答。
大量冗余测序数据混杂在测序结果中,及增加了测序成本,又增加了后续分析的复杂度。对于植物,通常用幼苗或叶片组织抽提DNA,会有极高拷贝数(≥2,000,有的物质甚至≥10,000)的叶绿体DNA序列混杂在基因组DNA中。对于简化基因组RAD-seq测序,会导致大量的测序reads(读段)回贴到叶绿体DNA序列上,而不是感兴趣的核基因组DNA中,这一比例会是40%~60%,甚至可以达到70%以上。最终,对测序数据造成了极大的浪费,无形中增加了测序成本。
在不同样本间,目标测序区域的一致性较差。简化基因组测序文库构建的技术关键点也是难点是:检测的目标区域的一致性(即在所有测序样本中,要同时检测到基因组相同的目标区域)。在文库构建过程中,打断后的DNA片段大小选择的精确度和分布均一度决定着样本间目标区域的一致性。对于传统的RAD-seq文库构建,是通过一次手工凝胶电泳割胶的方式进行片段选择,甚至有的方法是粗放的通过调整磁珠浓度的方式对目标片段大小进行大概的选择。这就造成了小片段DNA序列污染、片段选择范围不准确,分布均一性差,最终导致样本间目标测序区域的一致性差。
发明内容
有鉴于此,本发明实施例提供的一种简化基因组测序文库的构建方法、简化基因组测序数据的分析方法、检测设备及存储介质,实现所需的基因组简化程度、预判可检测的多态性位点数目、完成检测目标区域在基因组分布的密度和均一度评估分析,实现基于需求,灵活、准确的进行简化基因组测序RAD-seq文库构建。
本发明解决上述技术问题所采用的技术方案如下:
根据本发明实施例的一个方面,提供的一种简化基因组测序文库的构建方法,所述方法包括:
将基因组DNA进行第一轮酶切处理,形成多个DNA片段;
将每个DNA片段的两端分别连接接头,形成DNA片段样本;
从DNA片段样本中选择符合预设设计长度大小的DNA片段样本;
将选择出来的所述DNA片段样本进行第二轮酶切处理,提取出有效细胞核基因组序列DNA片段;
使用引物将所述有效基因组序列DNA片段进行PCR扩增;
从PCR扩增后的有效基因组序列DNA片段中选择目标基因组序列DNA片段,得到原始简化基因组测序DNA片段。
在一个可能的设计中,所述将基因组DNA进行酶切处理,形成多个DNA片段;包括:使用REs酶切组合对基因组DNA进行第一轮酶切处理,形成多个DNA片段。
在一个可能的设计中,所述将每个DNA片段的两端分别连接接头,形成DNA片段样本;包括:所述接头包括条形码接头和通用接头;将每个DNA片段的两端分别连接一个条形码接头和一个通用接头,构成一个DNA片段样本。
在一个可能的设计中,所述从DNA片段样本中选择符合预设设计长度大小的DNA片段样本,包括:
将所有的DNA片段样本构建形成DNA片段样本池;
在所述DNA片段样本池中选择符合预设设计长度大小的DNA片段样本。
在一个可能的设计中,所述在所述DNA片段样本池中选择符合预设设计长度大小的DNA片段样本,包括:
采用Pippin-Prep全自动片段选择回收仪在所述DNA片段样本池中自动选择符合预设设计长度大小的DNA片段样本。
在一个可能的设计中,所述将选择出来的所述DNA片段样本进行第二轮酶切处理,提取出有效细胞核基因组序列DNA片段;包括:
使用预设的REs酶切组合对按照预先设计长度大小选择出来的DNA片段样本进行第二轮酶切处理,切除所述DNA片段样本中的高拷贝的非目标基因组序列片段,保留细胞核基因组序列DNA片段,得到有效基因组序列DNA片段。
在一个可能的设计中,所述从PCR扩增后的有效基因组序列DNA片段中选择目标基因组序列DNA片段,得到原始简化基因组测序DNA片段,包括:
从经过PCR扩增后的有效基因组序列DNA片段中进行第二轮选择符合预设设计长度大小的目标基因组序列DNA片段;
去除在所述目标基因组序列DNA片段的两端接头处形成的DNA片段和高拷贝的非细胞核基因组DNA片段,得到原始简化基因组测序DNA片段。
根据本发明实施例的另一个方面,提供一种简化基因组测序数据的分析方法,所述方法包括:
处理原始简化基因组测序DNA片段数据,提取出完全唯一匹配的读段样本;
对提取出的所述读段样本进行原始遗传多态性检测,得到原始indels/原始SNPs;
过滤所述原始indels/原始SNPs,得到高质量的原始简化基因组测序DNA片段的遗传多态性。
在一个可能的设计中,所述处理原始简化基因组测序DNA片段数据,提取完全唯一匹配的读段样本;包括:
根据预设读段质量控制标准,评估原始简化基因组测序DNA片段数据的质量,筛选出符合预设读段质量控制标准的读段;
将筛选出的所述读段分别分配给不同的读段样本;
将每个读段样本分别与参考基因组进行匹配,分别筛选出与所述参考基因组匹配的读段样本,形成各自的匹配读段样本集合;
从每个匹配读段样本集合中,分别提取出完全唯一匹配的读段样本。
在一个可能的设计中,所述对提取出的所述读段样本进行原始遗传多态性检测,得到原始indels/原始SNPs;包括:
将提取出的所有读段样本分别进行遗传基因座loci鉴定,得到鉴定后的读段样本;
采用Samtools算法,分别对鉴定后的读段样本进行检测,得到原始indels/原始SNPs。
在一个可能的设计中,所述过滤原始indels/原始SNPs,得到高质量的原始遗传多态性;包括:
将原始indels/原始SNPs以预设评估过滤标准进行过滤,过滤得到高质量的原始遗传多态性。
根据本发明实施例的另一个方面,提供一种检测设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现本发明实施例提供的所述的一种简化基因组测序文库构建方法的步骤,或者实现本发明实施例提供的所述的一种简化基因组测序数据分析方法的步骤。
根据本发明实施例的另一个方面,提供一种存储介质,所述存储介质上存储有简化基因组测序文库的构建方法,所述简化基因组测序文库的构建方法的程序被处理器执行时实现本发明实施例提供的所述的一种简化基因组测序文库的构建方法的步骤;或者,所述存储介质上存储有简化基因组测序数据的分析方法的程序,所述简化基因组测序数据的分析方法的程序被处理器执行时实现本发明实施例提供的所述的一种简化基因组测序数据的分析方法的步骤。
与相关技术相比,本发明实施例提供的一种简化基因组测序文库的构建方法、简化基因组测序数据的分析方法、检测设备及存储介质,所述构建方法包括:将基因组DNA进行第一轮酶切处理,形成多个DNA片段;将每个DNA片段的两端分别连接接头,形成DNA片段样本;从DNA片段样本中选择符合预设设计长度大小的DNA片段样本;将选择出来的所述DNA片段样本进行第二轮酶切处理,提取出有效细胞核基因组序列DNA片段;使用引物将所述有效基因组序列DNA片段进行PCR扩增;从PCR扩增后的有效基因组序列DNA片段中选择目标基因组序列DNA片段,得到原始简化基因组测序DNA片段。通过本发明实施例,在构建简化基因组测序RAD-seq文库时,从多种商业化的限制性内切酶中选择最优化的酶或是酶的组合进行两轮酶切处理,有效去除来自于叶绿体、核糖体(或是线粒体)等冗余DNA测序reads,保证数据的可用性;采用两轮预设设计长度大小的选择策略,提高不同样本间DNA片段选择的准确度和均一性分布的程度,最终确保目标测序区域在样本间的一致性。从而实现所需的基因组简化程度、预判可检测的多态性位点数目、完成检测目标区域在基因组分布的密度和均一度评估分析,实现基于需求,灵活、准确的进行简化基因组测序RAD-seq文库构建。
附图说明
图1为本发明实施例提供的一种简化基因组测序文库的构建方法的流程示意图;
图2为本发明实施例提供的一种简化基因组测序文库的构建方法应用在拟南芥RAD-seq测序中切酶组合生成的目标区域分布的示意图;
图3为本发明实施例提供的一种简化基因组测序文库的构建方法应用在在马铃薯RAD-seq测序中切酶组合生成的目标区域分布的示意图;
图4为本发明实施例提供的去除来自于叶绿体、核糖体(或是线粒体)等冗余DNA测序数据的有效性的示意图;
图5为本发明实施例提供的全自动片段选择回收仪(Pippin-Prep)的两轮片段选择策略提高片段选择的准确度的示意图;
图6为本发明实施例提供的一种简化基因组测序数据的分析方法的流程示意图;
图7为本发明实施例提供的一种检测设备的结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合附图和实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅以解释本发明,并不用于限定本发明。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
在一个实施例中,如图1所示,本发明提供一种简化基因组测序RAD-seq文库的构建方法,所述方法包括:
S11、将基因组DNA进行第一轮酶切处理,形成多个DNA片段。
S12、将每个DNA片段的两端分别连接接头,形成DNA片段样本。
S13、从DNA片段样本中选择符合预设设计长度大小的DNA片段样本。
S14、将选择出来的所述DNA片段样本进行第二轮酶切处理,提取出有效细胞核基因组序列DNA片段。
S15、使用引物将所述有效基因组序列DNA片段进行PCR(Polymerase ChainReaction,聚合酶链式反应)扩增。
S16、从PCR扩增后的有效基因组序列DNA片段中选择目标基因组序列DNA片段,得到原始简化基因组测序DNA片段。
在本实施例中,在构建简化基因组测序RAD-seq文库时,从多种商业化的限制性内切酶中选择最优化的酶或是酶的组合进行两轮酶切处理,有效去除来自于叶绿体、核糖体(或是线粒体)等冗余DNA测序reads,保证数据的可用性;采用两轮预设设计长度大小的选择策略,提高不同样本间DNA片段选择的准确度和均一性分布的程度,最终确保目标测序区域在样本间的一致性。从而实现所需的基因组简化程度、预判可检测的多态性位点数目、完成检测目标区域在基因组分布的密度和均一度评估分析,实现基于需求,灵活、准确的进行简化基因组测序RAD-seq文库构建。
在一个实施例中,在步骤S11中,所述将基因组DNA进行第一轮酶切处理,形成多个DNA片段。包括:
根据不同需求,确定最优的REs(Restriction site of different enzymes,不同酶的限制性位点)酶切组合,使用Res酶切组合对基因组DNA进行第一轮酶切处理,形成多个DNA片段。具体包括:从多种(例如269种)商业化的限制性内切酶中选择最优化的酶或是酶的组合进行第一轮酶切处理,酶切处理后形成多个DNA片段。
在一个实施例中,所述步骤S12中,所述将每个DNA片段的两端分别连接接头,形成DNA片段样本。包括:
步骤S121、所述接头包括条形码接头(Barcoded adapter)和通用接头(Universaladapter);
步骤S122、将每个DNA片段的两端分别连接一个条形码接头和一个通用接头,构成一个DNA片段样本。
在一个实施例中,所述步骤S13中,所述从DNA片段样本中选择符合预设设计长度大小的DNA片段样本。包括:
步骤S131、将所有的DNA片段样本构建形成DNA片段样本池;
步骤S132、在所述DNA片段样本池中选择符合预设设计长度大小的DNA片段样本。
优选的,采用Pippin-Prep全自动片段选择回收仪在所述DNA片段样本池中自动选择符合预设设计长度大小的DNA片段样本。
在一个实施例中,所述步骤S14中,所述将选择出来的所述DNA片段样本进行第二轮酶切处理,提取出有效细胞核基因组序列DNA片段。包括:
使用预设的REs酶切组合对按照预先设计长度大小选择出来的DNA片段样本进行第二轮酶切处理,切除所述DNA片段样本中的叶绿体序列(Chloroplast sequence)和核糖体基因序列等来自细胞器基因组序列的高拷贝的冗余DNA片段,保留细胞核基因组序列(Genome sequence)DNA片段,得到有效基因组序列DNA片段。
在本实施例中,从多种(例如269种)商业化的限制性内切酶之间的组合模拟分析以及两轮酶切处理等策略,进而选择最优化的REs酶切组合。该优化REs酶切组合既可以将基因组打断并选择出特定数目的目标DNA片段,又可以将来自于叶绿体、线粒体等来自细胞器基因组序列的具有极高拷贝数的DNA片段进一步酶切去除掉,最终可以有效去除来自于叶绿体、核糖体基因序列、线粒体等冗余DNA测序reads(读段)数据,保证数据的可用性。
例如,本发明实施例的一种简化基因组测序RAD-seq文库的构建方法应用在拟南芥基因组中,从269种商业化的限制性内切酶中选择最优化的酶或是酶的组合,实现拟南芥基因组所需的基因组简化程度(如表1所示)、预判可检测的多态性位点数目(表1所示)、完成检测目标区域在基因组分布的密度和均一度评估分析(如图2所示)。
表1拟南芥基因组中不同限制性内切酶组合的RAD-seq简化程度表
Figure BDA0002465821780000091
本发明实施例的一种简化基因组测序RAD-seq文库的构建方法应用在马铃薯基因组中,从269种商业化的限制性内切酶中选择最优化的酶或是酶的组合,实现马铃薯基因组所需的基因组简化程度(如表2所示)、预判可检测的多态性位点数目(如表2所示)、完成检测目标区域在基因组分布的密度和均一度评估分析(如图3所示)。
表2马铃薯基因组中不同限制性内切酶组合的RAD-seq简化程度表
Figure BDA0002465821780000092
图4显示的是通过对拟南芥基因组样本RAD-seq测序数据分析,可以有效的去除来自于叶绿体、核糖体(或是线粒体)等冗余DNA测序数据的示意图。
在一个实施例中,所述步骤S15,所述使用引物将所述有效基因组序列DNA片段进行PCR扩增。包括:
使用illumina TruSeq Primer引物将所述有效基因组序列DNA片段进行PCR扩增。
在本实施例中,通过使用illumina TruSeq Primer引物将所述有效基因组序列DNA片段进行PCR扩增,可以放大所述有效基因组序列DNA片段的测序信号,提高后续的基因组序列DNA片段筛选效率。
在一个实施例中,所述步骤S16中,所述从PCR扩增后的有效基因组序列DNA片段中选择目标基因组序列DNA片段,得到原始简化基因组测序DNA片段。包括:
步骤S161、从经过PCR扩增后的有效基因组序列DNA片段中进行第二轮选择符合预设设计长度大小的目标基因组序列DNA片段;
步骤S162、去除在所述目标基因组序列DNA片段的两端接头处形成的DNA片段和来自于细胞器基因组序列DNA片段等高拷贝的非细胞核基因组DNA片段,得到原始简化基因组测序DNA片段。
优选的,采用Pippin-Prep全自动片段选择回收仪从经过PCR扩增后的有效基因组序列DNA片段中进行第二轮自动选择符合预设设计长度大小的目标基因组序列DNA片段,并去除在所述目标基因组序列DNA片段的两端接头处形成的DNA片段和来自于细胞器基因组序列DNA片段等高拷贝的非细胞核基因组DNA片段,得到原始简化基因组测序DNA片段。
在本实施例中,采用Pippin-Prep全自动片段选择回收仪的按照预设设计长度大小的两轮DNA片段选择策略,提高不同样本间DNA片段选择的准确度和均一性分布的程度,最终确保目标测序区域在样本间的一致性。从而实现所需的基因组简化程度、预判可检测的多态性位点数目、完成检测目标区域在基因组分布的密度和均一度评估分析,实现基于需求,灵活、准确的进行简化基因组测序RAD-seq文库构建。
图5显示的是通过对拟南芥样本RAD-seq测序数据分析,超过96%的测序数据都来自于实验设计时选定的目标测序区域,并且超过85%的目标测序区域可以在至少80%的样本中深度覆盖(coverage≥10)。
在一个实施例中,如图6所示,本发明提供一种简化基因组测序RAD-seq数据的分析方法,所述方法包括:
S21、处理原始简化基因组测序DNA片段数据,提取出完全唯一匹配的读段(reads)样本;
S22、对提取出的所述读段样本进行原始遗传多态性检测,得到原始indels/原始SNPs;
S23、过滤所述原始indels/原始SNPs,得到高质量的原始简化基因组测序DNA片段的遗传多态性。
在本实施例中,通过对原始简化基因组测序DNA片段数据进行分析过滤,可以得到高质量的原始遗传多态性。
在一个实施例中,所述步骤S21中,所述处理原始简化基因组测序tdRAD-seq DNA片段数据,提取出完全唯一匹配的读段样本,包括:
步骤S211、根据预设读段质量控制标准,评估原始简化基因组测序DNA片段数据的质量,筛选出符合预设读段质量控制标准的读段。
其中,所述预设读段质量控制标准至少包括以下之一:与预设读段样本条形码(barcode)匹配关系、与预先设计长度匹配关系、与预设测序质量阈值关系。
在所述步骤S211中,所述根据预设读段质量控制标准,评估原始简化基因组测序DNA片段数据的质量,筛选出符合预设读段质量控制标准的读段;包括:
将原始简化基因组测序DNA片段的读段barcode与预设读段样本barcode进行匹配,如能匹配,则所述读段符合预设读段质量控制标准,否则,所述读段不符合预设读段质量控制标准;或者,
将原始简化基因组测序DNA片段的读段长度与预先设计长度进行匹配,如能匹配,则所述读段符合预设读段质量控制标准,否则,所述读段不符合预设读段质量控制标准;或者,
将原始简化基因组测序DNA片段的读段测序质量与预设测序质量阈值进行匹配,如读段测序质量小于预设测序质量阈值,则所述读段符合预设读段质量控制标准,否则,所述读段不符合预设读段质量控制标准。
步骤S212、将筛选出的所述读段分别分配给不同的读段样本。
步骤S213、将每个读段样本分别与参考基因组进行匹配,分别筛选出与所述参考基因组匹配的读段样本,形成各自的匹配读段样本集合。
步骤S214、从每个匹配读段样本集合中,分别提取出完全唯一匹配的读段样本。
在本实施例中,在本实施例中,通过预设读段质量控制标准对原始简化基因组测序DNA片段数据进行筛选分析、提取,可以得到完全唯一匹配的读段样本。
在一个实施例中,所述步骤S22中,所述对提取出的所述读段样本进行原始遗传多态性检测,得到原始indels/原始SNPs;包括:
步骤S221、将提取出的所有读段样本分别进行遗传基因座loci鉴定,得到鉴定后的读段样本;
步骤S222、采用Samtools算法,分别对鉴定后的读段样本进行检测,得到原始indels/原始SNPs。
在本实施例中,通过对提取出的所有读段样本进行两次检测,即先通过遗传基因座loci鉴定,初步得到所述读段样本的遗传多态性检测;然后采用Samtools算法,对初步得到所述读段样本的遗传多态性检测进行进一步检测,最终得到原始indels/原始SNPs。从而准确地得到原始indels/原始SNPs。
在一个实施例中,所述步骤S23中,所述过滤所述原始indels/原始SNPs,得到高质量的原始简化基因组测序DNA片段的遗传多态性;包括:
将原始indels/原始SNPs以预设评估过滤标准进行过滤,过滤得到高质量的原始遗传多态性。
其中,所述预设评估过滤标准包括至少以下之一的过滤标准:家谱、已知变异、HWE(Hardy-Weinberg Equilibriumt,哈迪-温伯格平衡)测试、遗传多态性质量。
在本实施例中,通过以预设评估过滤标准对原始indel/原始SNPs进行过滤,从而得到高质量的原始遗传多态性。
此外,本发明实施例还提供一种检测设备,如图7所示,包括:存储器、处理器及存储在所述存储器中并可在所述处理器上运行的一个或者多个计算机程序,所述一个或者多个计算机程序被所述处理器执行时以实现本发明实施例提供的一种简化基因组测序RAD-seq文库的构建方法的以下步骤:
S11、将基因组DNA进行第一轮酶切处理,形成多个DNA片段。
S12、将每个DNA片段的两端分别连接接头,形成DNA片段样本。
S13、从DNA片段样本中选择符合预设设计长度大小的DNA片段样本。
S14、将选择出来的所述DNA片段样本进行第二轮酶切处理,提取出有效细胞核基因组序列DNA片段。
S15、使用引物将所述有效基因组序列DNA片段进行PCR扩增。
S16、从PCR扩增后的有效基因组序列DNA片段中选择目标基因组序列DNA片段,得到原始简化基因组测序DNA片段。
或者,
实现本发明实施例提供的一种简化基因组测序RAD-seq数据的分析方法的以下步骤:
S21、处理原始简化基因组测序DNA片段数据,提取出完全唯一匹配的读段样本;
S22、对提取出的所述读段样本进行原始遗传多态性检测,得到原始indels/原始SNPs;
S23、过滤所述原始indels/原始SNPs,得到高质量的原始简化基因组测序DNA片段的遗传多态性。
上述本发明实施例揭示的方法可以应用于所述处理器901中,或者由所述处理器901实现。所述处理器901可能是一种集成电路芯片,具有信号处理能力。在实现过程中,上述方法的各步骤可以通过所述处理器901中的硬件的集成逻辑电路或软件形式的指令完成。所述处理器901可以是通用处理器、DSP、或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。所述处理器901可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本发明实施例所公开的方法的步骤,可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中,该存储介质位于存储器902,所述处理器901读取存储器902中的信息,结合其硬件完成前述方法的步骤。
可以理解,本发明实施例的存储器902可以是易失性存储器或者非易失性存储器,也可以包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM,Read-Only Memory)、可编程只读存储器(PROM,Programmable Read-Only Memory)、可擦除可编程只读存储器(EPROM,Erasable Read-Only Memory)、电可擦除只读存储器(EEPROM,Electrically Erasable Programmable Read-Only Memory)、磁性随机存取存储器(FRAM,Ferromagnetic Random Access Memory)、闪存(Flash Memory)或其他存储器技术、光盘只读存储器(CD-ROM,Compact Disk Read-Only Memory)、数字多功能盘(DVD,Digital VideoDisk)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置;易失性存储器可以是随机存取存储器(RAM,Random Access Memory),通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(SRAM,Static Random Access Memory)、静态随机存取存储器(SSRAM,Synchronous Static Random Access Memory)、动态随机存取存储器(DRAM,Dynamic Random Access Memory)、同步动态随机存取存储器(SDRAM,SynchronousDynamic Random Access Memory)、双倍数据速率同步动态随机存取存储器(DDRSDRAM,Double Data Rate Synchronous Dynamic Random Access Memory)、增强型同步动态随机存取存储器(ESDRAM,Enhanced Synchronous Dynamic Random Access Memory)、同步连接动态随机存取存储器(SLDRAM,SyncLink Dynamic Random Access Memory)、直接内存总线随机存取存储器(DRRAM,Direct Rambus Random Access Memory)。本发明实施例描述的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
需要说明的是,上述检测设备实施例与方法实施例属于同一构思,其具体实现过程详见方法实施例,且方法实施例中的技术特征在检测设备实施例中均对应适用,这里不再赘述。
另外,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有简化基因组测序RAD-seq文库的构建方法或简化基因组测序RAD-seq数据的分析方法程序,所述简化基因组测序文库RAD-seq的构建方法或简化基因组测序RAD-seq数据的分析方法被处理器执行时以实现本发明实施例提供的一种简化基因组测序RAD-seq文库的构建方法的以下步骤:
S11、将基因组DNA进行第一轮酶切处理,形成多个DNA片段。
S12、将每个DNA片段的两端分别连接接头,形成DNA片段样本。
S13、从DNA片段样本中选择符合预设设计长度大小的DNA片段样本。
S14、将选择出来的所述DNA片段样本进行第二轮酶切处理,提取出有效细胞核基因组序列DNA片段。
S15、使用引物将所述有效基因组序列DNA片段进行PCR扩增。
S16、从PCR扩增后的有效基因组序列DNA片段中选择目标基因组序列DNA片段,得到原始简化基因组测序DNA片段。
或者,
实现本发明实施例提供的一种简化基因组测序RAD-seq数据的分析方法的以下步骤:
S21、处理原始简化基因组测序DNA片段数据,提取出完全唯一匹配的读段样本;
S22、对提取出的所述读段样本进行原始遗传多态性检测,得到原始indels/原始SNPs;
S23、过滤所述原始indels/原始SNPs,得到高质量的原始简化基因组测序DNA片段的遗传多态性。
需要说明的是,上述计算机可读存储介质上的一种简化基因组测序RAD-seq文库的构建方法程序或一种简化基因组测序RAD-seq数据的分析方法实施例与方法实施例属于同一构思,其具体实现过程详见方法实施例,且方法实施例中的技术特征在上述计算机可读存储介质的实施例中均对应适用,这里不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。

Claims (13)

1.一种简化基因组测序文库的构建方法,其特征在于,所述方法包括:
将基因组DNA进行第一轮酶切处理,形成多个DNA片段;
将每个DNA片段的两端分别连接接头,形成DNA片段样本;
从DNA片段样本中选择符合预设设计长度大小的DNA片段样本;
将选择出来的所述DNA片段样本进行第二轮酶切处理,提取出有效细胞核基因组序列DNA片段;
使用引物将所述有效基因组序列DNA片段进行PCR扩增;
从PCR扩增后的有效基因组序列DNA片段中选择目标基因组序列DNA片段,得到原始简化基因组测序DNA片段。
2.根据权利要求1所述的方法,其特征在于,所述将基因组DNA进行酶切处理,形成多个DNA片段;包括:使用REs酶切组合对基因组DNA进行第一轮酶切处理,形成多个DNA片段。
3.根据权利要求1或2所述的方法,其特征在于,所述将每个DNA片段的两端分别连接接头,形成DNA片段样本;包括:所述接头包括条形码接头和通用接头;将每个DNA片段的两端分别连接一个条形码接头和一个通用接头,构成一个DNA片段样本。
4.根据权利要求3所述的方法,其特征在于,所述从DNA片段样本中选择符合预设设计长度大小的DNA片段样本,包括:
将所有的DNA片段样本构建形成DNA片段样本池;
在所述DNA片段样本池中选择符合预设设计长度大小的DNA片段样本。
5.根据权利要求4所述的方法,其特征在于,所述在所述DNA片段样本池中选择符合预设设计长度大小的DNA片段样本,包括:
采用Pippin-Prep全自动片段选择回收仪在所述DNA片段样本池中自动选择符合预设设计长度大小的DNA片段样本。
6.根据权利要求4或5所述的方法,其特征在于,所述将选择出来的所述DNA片段样本进行第二轮酶切处理,提取出有效细胞核基因组序列DNA片段;包括:
使用预设的REs酶切组合对按照预先设计长度大小选择出来的DNA片段样本进行第二轮酶切处理,切除所述DAN片段样本中的高拷贝的非目标基因组序列片段,保留细胞核基因组序列DNA片段,得到有效基因组序列DNA片段。
7.根据权利要求1所述的方法,其特征在于,所述从PCR扩增后的有效基因组序列DNA片段中选择目标基因组序列DNA片段,得到原始简化基因组测序DNA片段,包括:
从经过PCR扩增后的有效基因组序列DNA片段中进行第二轮选择符合预设设计长度大小的目标基因组序列DNA片段;
去除在所述目标基因组序列DNA片段的两端接头处形成的DNA片段和高拷贝的非细胞核基因组DNA片段,得到原始简化基因组测序DNA片段。
8.一种简化基因组测序数据的分析方法,其特征在于,所述方法包括:
处理原始简化基因组测序DNA片段数据,提取出完全唯一匹配的读段样本;
对提取出的所述读段样本进行原始遗传多态性检测,得到原始indels/原始SNPs;
过滤所述原始indels/原始SNPs,得到高质量的原始简化基因组测序DNA片段的遗传多态性。
9.根据权利要求8所述的方法,其特征在于,所述处理原始简化基因组测序DNA片段数据,提取完全唯一匹配的读段样本;包括:
根据预设读段质量控制标准,评估原始简化基因组测序DNA片段数据的质量,筛选出符合预设读段质量控制标准的读段;
将筛选出的所述读段分别分配给不同的读段样本;
将每个读段样本分别与参考基因组进行匹配,分别筛选出与所述参考基因组匹配的读段样本,形成各自的匹配读段样本集合;
从每个匹配读段样本集合中,分别提取出完全唯一匹配的读段样本。
10.根据权利要求9所述的方法,其特征在于,所述对提取出的所述读段样本进行原始遗传多态性检测,得到原始indels/原始SNPs;包括:
将提取出的所有读段样本分别进行遗传基因座loci鉴定,得到鉴定后的读段样本;
采用Samtools算法,分别对鉴定后的读段样本进行检测,得到原始indels/原始SNPs。
11.根据权利要求10所述的方法,其特征在于,所述过滤原始indels/原始SNPs,得到高质量的原始遗传多态性;包括:
将原始indels/原始SNPs以预设评估过滤标准进行过滤,过滤得到高质量的原始遗传多态性。
12.一种检测设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的一种简化基因组测序文库构建方法的步骤,或者实现如权利要求8至11中任一项所述的一种简化基因组测序数据分析方法的步骤。
13.一种存储介质,其特征在于,所述存储介质上存储有简化基因组测序文库的构建方法,所述简化基因组测序文库的构建方法的程序被处理器执行时实现如权利要求1至7中任一项所述的一种简化基因组测序文库的构建方法的步骤;或者,所述存储介质上存储有简化基因组测序数据的分析方法的程序,所述简化基因组测序数据的分析方法的程序被处理器执行时实现如权利要求8至11中任一项所述的一种简化基因组测序数据的分析方法的步骤。
CN202010333594.3A 2020-04-24 2020-04-24 简化基因组测序文库构建分析方法、检测设备及存储介质 Active CN111524552B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010333594.3A CN111524552B (zh) 2020-04-24 2020-04-24 简化基因组测序文库构建分析方法、检测设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010333594.3A CN111524552B (zh) 2020-04-24 2020-04-24 简化基因组测序文库构建分析方法、检测设备及存储介质

Publications (2)

Publication Number Publication Date
CN111524552A true CN111524552A (zh) 2020-08-11
CN111524552B CN111524552B (zh) 2021-05-11

Family

ID=71910777

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010333594.3A Active CN111524552B (zh) 2020-04-24 2020-04-24 简化基因组测序文库构建分析方法、检测设备及存储介质

Country Status (1)

Country Link
CN (1) CN111524552B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114356222A (zh) * 2021-12-13 2022-04-15 深圳先进技术研究院 数据存储方法、装置、终端设备及计算机可读存储介质
WO2022267867A1 (zh) * 2021-06-23 2022-12-29 深圳华大基因股份有限公司 基因测序分析方法、装置、存储介质和计算机设备

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101045928A (zh) * 2007-02-12 2007-10-03 湖南西城杂交水稻基因科技有限公司 一种克隆野生稻新抗性基因的方法
CN104561294A (zh) * 2014-12-26 2015-04-29 北京诺禾致源生物信息科技有限公司 基因分型测序文库的构建方法和测序方法
CN104694635A (zh) * 2015-02-12 2015-06-10 北京百迈客生物科技有限公司 一种高通量简化基因组测序文库的构建方法
CN105368930A (zh) * 2015-10-13 2016-03-02 中国农业大学 测序基因分型技术中测序酶切组合的确定方法
CN105624272A (zh) * 2014-10-29 2016-06-01 深圳华大基因科技有限公司 基因组预定区域核酸测序文库的构建方法及装置
CN107794575A (zh) * 2017-10-16 2018-03-13 深圳华大基因股份有限公司 用于Pacbio平台的DNA大片段文库构建方法和试剂盒
CN108060227A (zh) * 2018-02-22 2018-05-22 南京市妇幼保健院 一种检测pah基因突变的扩增引物、试剂盒及其检测方法
CN108179174A (zh) * 2018-01-15 2018-06-19 武汉爱基百客生物科技有限公司 一种高通量简化基因组测序文库的构建方法
CN108265049A (zh) * 2017-12-05 2018-07-10 中国水稻研究所 全基因组互作文库及其构建方法
US20180195060A1 (en) * 2015-04-20 2018-07-12 Bgi Shenzhen Method for constructing long fragment dna library
CN110396546A (zh) * 2018-04-24 2019-11-01 中国农业大学 一种与猪高繁殖性状相关的基因和snp分子标记及应用

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101045928A (zh) * 2007-02-12 2007-10-03 湖南西城杂交水稻基因科技有限公司 一种克隆野生稻新抗性基因的方法
CN105624272A (zh) * 2014-10-29 2016-06-01 深圳华大基因科技有限公司 基因组预定区域核酸测序文库的构建方法及装置
CN104561294A (zh) * 2014-12-26 2015-04-29 北京诺禾致源生物信息科技有限公司 基因分型测序文库的构建方法和测序方法
CN104694635A (zh) * 2015-02-12 2015-06-10 北京百迈客生物科技有限公司 一种高通量简化基因组测序文库的构建方法
US20180195060A1 (en) * 2015-04-20 2018-07-12 Bgi Shenzhen Method for constructing long fragment dna library
CN105368930A (zh) * 2015-10-13 2016-03-02 中国农业大学 测序基因分型技术中测序酶切组合的确定方法
CN107794575A (zh) * 2017-10-16 2018-03-13 深圳华大基因股份有限公司 用于Pacbio平台的DNA大片段文库构建方法和试剂盒
CN108265049A (zh) * 2017-12-05 2018-07-10 中国水稻研究所 全基因组互作文库及其构建方法
CN108179174A (zh) * 2018-01-15 2018-06-19 武汉爱基百客生物科技有限公司 一种高通量简化基因组测序文库的构建方法
CN108060227A (zh) * 2018-02-22 2018-05-22 南京市妇幼保健院 一种检测pah基因突变的扩增引物、试剂盒及其检测方法
CN110396546A (zh) * 2018-04-24 2019-11-01 中国农业大学 一种与猪高繁殖性状相关的基因和snp分子标记及应用

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022267867A1 (zh) * 2021-06-23 2022-12-29 深圳华大基因股份有限公司 基因测序分析方法、装置、存储介质和计算机设备
CN114356222A (zh) * 2021-12-13 2022-04-15 深圳先进技术研究院 数据存储方法、装置、终端设备及计算机可读存储介质
CN114356222B (zh) * 2021-12-13 2022-08-19 深圳先进技术研究院 数据存储方法、装置、终端设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN111524552B (zh) 2021-05-11

Similar Documents

Publication Publication Date Title
Kozarewa et al. Overview of target enrichment strategies
Williams‐Carrier et al. Use of Illumina sequencing to identify transposon insertions underlying mutant phenotypes in high‐copy Mutator lines of maize
JP5389638B2 (ja) 制限断片に基づく分子マーカーのハイスループットな検出
Tin et al. Degenerate adaptor sequences for detecting PCR duplicates in reduced representation sequencing data improve genotype calling accuracy
CN111524552B (zh) 简化基因组测序文库构建分析方法、检测设备及存储介质
SA517381091B1 (ar) طرق وأنظمة لتحليل بيانات توالي الحمض النووي
Vidalis et al. Design and evaluation of a large sequence-capture probe set and associated SNPs for diploid and haploid samples of Norway spruce (Picea abies)
CN105734048A (zh) 一种基因组DNA的PCR-free测序文库制备方法
CN112885408A (zh) 一种基于低深度测序检测snp标记位点的方法及装置
CN110669834A (zh) 一种基于转录组序列开发多态性ssr标记的方法
Owens et al. A novel post hoc method for detecting index switching finds no evidence for increased switching on the Illumina HiSeq X
CN113337590A (zh) 一种二代测序方法和文库构建方法
Wells et al. Sequencing-based variant detection in the polyploid crop oilseed rape
CN108642209B (zh) 一种小麦植株千粒重判断标记及其应用
CN108707685B (zh) 与谷子分蘖数性状相关的snp标记及其检测引物和应用
CN113981070B (zh) 胚胎染色体微缺失的检测方法、装置、设备和存储介质
US20170204474A1 (en) Bulk Allele Discrimination Assay
CN108642203B (zh) 与谷子茎粗性状相关的snp标记及其检测引物和应用
Burg Molecular Markers for Genetic Diversity
Tagu et al. Techniques for molecular biology
Meilan et al. Forest genomics and biotechnology
KR102613521B1 (ko) 시나노골드 사과와 이의 아조변이 품종 판별용 분자마커 및 이의 용도
CN114525363B (zh) 与菜花颜色相关的分子标记的引物及鉴别菜花颜色的方法
CN108642197B (zh) 与谷子码数性状相关的snp标记及其检测引物和应用
CN112927756B (zh) 鉴别转录组rRNA污染源的方法、装置和改善rRNA污染的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Mo Hui

Inventor after: Yin Liangchao

Inventor before: Mo Hui

Inventor before: Jiang Ning

Inventor before: Yin Liangchao

GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 518000, Unit 207, Building B, 2nd Floor, Libaoyi Biotechnology Building, No. 25 Shihua Road, Fubao Community, Futian District, Shenzhen City, Guangdong Province, China

Patentee after: Shenzhen Ruhan Technology Co.,Ltd.

Address before: 701e, bike technology building, No.9, scientific research road, Maling community, Yuehai street, Nanshan District, Shenzhen, Guangdong 518000

Patentee before: Shenzhen Ruhan Gene Technology Co.,Ltd.