CN112786109B - 一种基因组完成图的基因组组装方法 - Google Patents
一种基因组完成图的基因组组装方法 Download PDFInfo
- Publication number
- CN112786109B CN112786109B CN202110069693.XA CN202110069693A CN112786109B CN 112786109 B CN112786109 B CN 112786109B CN 202110069693 A CN202110069693 A CN 202110069693A CN 112786109 B CN112786109 B CN 112786109B
- Authority
- CN
- China
- Prior art keywords
- genome
- contig
- chromosome
- contigs
- anchoring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 210000000349 chromosome Anatomy 0.000 claims abstract description 63
- 238000004873 anchoring Methods 0.000 claims abstract description 22
- 238000012163 sequencing technique Methods 0.000 claims abstract description 19
- 238000010586 diagram Methods 0.000 claims abstract description 7
- 239000012634 fragment Substances 0.000 claims description 5
- 230000002068 genetic effect Effects 0.000 claims description 5
- 238000013507 mapping Methods 0.000 claims description 4
- 238000011144 upstream manufacturing Methods 0.000 claims description 4
- 241001465754 Metazoa Species 0.000 abstract description 6
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 10
- 241000209094 Oryza Species 0.000 description 9
- 235000007164 Oryza sativa Nutrition 0.000 description 9
- 230000037361 pathway Effects 0.000 description 9
- 235000009566 rice Nutrition 0.000 description 9
- 241000196324 Embryophyta Species 0.000 description 7
- 240000008467 Oryza sativa Japonica Group Species 0.000 description 6
- 239000002299 complementary DNA Substances 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 244000184734 Pyrus japonica Species 0.000 description 5
- 108090000623 proteins and genes Proteins 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 210000002230 centromere Anatomy 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 238000007671 third-generation sequencing Methods 0.000 description 2
- 108020004414 DNA Proteins 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 102100030569 Nuclear receptor corepressor 2 Human genes 0.000 description 1
- 101710153660 Nuclear receptor corepressor 2 Proteins 0.000 description 1
- 241000220317 Rosa Species 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010170 biological method Methods 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 235000009973 maize Nutrition 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/20—Sequence assembly
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B45/00—ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
Abstract
本发明公开了一种基因组完成图的基因组组装方法,首先使用高保真测序数据(HiFi)进行基因组组装,生成重叠群、重叠群路径、边信息和重叠信息;将重叠群锚定在参考基因组的染色体上,得到锚定结果;将重叠群路径按照的锚定结果连接成染色体路径;对于每条染色体,按照重叠群在染色体路径的位置在字符串图上遍历每个重叠群,并为每一对重叠群之间的缺口寻找最短路径并填补缺口。本发明实现了高保真测序(HiFi)的无缺口动植物基因组组装完成图,并且完成图准确性高、质量好。
Description
技术领域
本发明属于基因组学领域,具体涉及一种利用近缘物种参考基因组辅助重叠群(contigs)锚定到染色体,以及把重叠群(contigs)在染色体上的位置信息整合到字符串图(string graph)中实现高等动植物基因组完成图的方法。
背景技术
自1953年Watson和Crick提出DNA分子双螺旋结构以来,对遗传信息的解码一直是生命科学工作者的追求,很多研究者开始了对DNA测序技术的探索。现在已有的测序技术包括一代测序(Sanger测序,一般可测1kb左右的序列)、二代测序(next-generationsequencing,一般可测50~500bp的序列)、三代测序(可测100kb甚至更长的序列)。三代测序主要太平洋生物(PacBio)单分子实时测序(single molecule Real-time,SMRT)技术和牛津纳米孔单分子测序(Oxford Nanopore Technologies,ONT)技术。其中太平洋生物公司(PacBio)推出的高保真数据(HiFi)是首个在长度(大于10kb)和准确性(大于99%)方面均具有优势的数据类型。这使获得高质量的高等动植物基因组成为可能。
每一个物种的基因组序列的产生都要先通过测序的方法,获得基因组的测序片段(reads),然后再进行从头拼接,最后还原测序物种的各条染色体的序列。基因组中最难组装的区域是重复序列,这些区域经常错误的组装、组装成一份、或者完全丢失。随着三代长片段测序技术的发展,基因组组装的连续性已提高了几个数量级。一些最新的生物学技术,例如单分子光学图谱(BioNano)技术,高通量染色体构象捕获(hic)技术和单细胞测序(10xGenomics)技术,进一步提高了基因组组装的连续性。例如,水稻,玉米和玫瑰的基因组只有少数的缺口。然而,基因组组装的最终目标,即高准确性的无缺口的高等动植物基因组尚未实现。
仅仅依靠当前的测序技术和组装算法来实现无缺口的染色体水平的基因组组装是困难的。
发明内容
发明目的:为针对基于现有基因组组装技术的不足,本发明提供一种基因组完成图的基因组组装方法,利用其他的生物学手段,如遗传图谱、高通量染色体构象捕获(hic)技术或者与近缘物种(相关物种)基因组序列比对,来辅助组装,以实现基于高保真测序(HiFi)的无缺口动植物基因组组装完成图。
技术方案:为实现上述目的,本发明采用的技术方案为:
一种基因组完成图的基因组组装方法,包括以下步骤:
步骤1,使用太平洋生物公司(PacBio)的高保真测序数据(HIFI)进行基因组组装,生成重叠群(contig)、重叠群(contig)在字符串图(string graph)中的重叠群路径(contig paths)、边信息(sg_edges_list)和重叠信息(pread.m4)。
步骤2,将重叠群(contigs)锚定在参考基因组的染色体上,得到锚定结果,锚定结果包括参考基因组的每个染色体上重叠群(contigs)的位置和方向。
步骤3,将步骤1中生成的每个重叠群(contig)在字符串图(string graph)中的重叠群路径(contig paths)按照步骤2的锚定结果连接成每个染色体在字符串图(stringgraph)中的染色体路径(chromosome paths)。每个染色体由重叠群路径(contig paths)和它们之间的缺口表示。如果两个重叠群(contig)相邻,则它们之间将没有缺口。
步骤4,使用步骤1中生成的边信息(sg_edges_list)和重叠信息(pread.m4)重建字符串图(string graph)。对于每条染色体,按照重叠群(contigs)在每个染色体在字符串图(string graph)中的路径染色体路径(chromosome paths)遍历每个重叠群(contig),并在字符串图(string graph)上为每一对重叠群(contig)之间的缺口寻找最短路径并填补缺口,以实现无缺口的组装。
优选的:步骤2中将重叠群锚定在参考基因组的染色体上的方法为遗传图谱法、高通量染色体构象捕获法hic或者近缘参考基因组法。
优选的:步骤2中将重叠群(contigs)锚定在参考基因组的染色体上的方法:采用Nucmer或MCScan软件将重叠群(contigs)映射到参考基因组的染色体上,接着检索映射在参考基因组的染色体上的共线块的位置和方向。如果重叠群(contigs)映射到多条参考基因组的染色体上,将映射到多条参考基因组的染色体上的重叠群(contigs)分配给共线块数最多参考基因组的染色体。然后根据重叠群(contigs)在参考基因组的染色体上最长共线块的位置和方向,对重叠群(contigs)进行排序和定向。
优选的:步骤2中相邻的重叠群(contigs)100N连接。
优选的:步骤2中删除一些较短(一般小于300Kb)的重叠群(contigs)以提高锚定精度。
优选的:步骤4中寻找最短路径的方法:对于每个缺口,以缺口的起点为中心构建自我图(ego graph),并在自我图(ego graph)中找到从缺口的起点到终点的路径。如果存在多个路径,选择重叠最多的最短路径。
优选的:步骤4中寻找最短路径时,如果未找到路径,则删除缺口上下游的唯一性可组装片段(untigs),然后再次寻找最短路径,最后,如果仍未找到最短路径,在相应位置插入100个N。
本发明相比现有技术,具有以下有益效果:
本发明通过整合重叠群(contigs)在染色体上的位置信息到字符串图(stringgraph)中,来辅助组装,实现了高保真测序(HiFi)的无缺口动植物基因组组装完成图,其完成图准确性高、质量好。
附图说明
图1:组装过程的示意图。
图2:Minghui 63完成图和参考基因组MH63RS2的共线性分析。
图3:长末端重复组装指数(LAI)分析。
图4:12个着丝粒区域的细菌人工染色体(BAC)序列的共线性。
具体实施方式
下面结合附图和具体实施例,进一步阐明本发明,应理解这些实例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
一种基因组完成图的基因组组装方法,如图1所示,我们实现了粳稻基因组Minghui 63的完成图,包括以下步骤:
步骤A,使用太平洋生物公司(PacBio)高保真测序数据(HIFI)进行基因组组装,生成重叠群(contig)、重叠群(contig)在字符串图(string graph)中的重叠群路径(contigpaths)、边信息(sg_edges_list)和重叠信息(pread.m4)。
首先从美国国立生物技术信息中心(NCBI)下载了大约25.3Gb(SRX6957825)Minghui63太平洋生物公司(PacBio)高保真测序(HIFI)测序数据。接着使用pb-assembly软件(https://github.com/PacificBiosciences/pb-assembly)对太平洋生物公司(PacBio)高保真测序数据进行从头组装,参数为'-k21-h850-e.99-l2000-s100--max-diff 400--max-cov 400--min-cov 2--n-core 24--min-idt 99.7--ignore-indels'。组装结果如表1所示。
表1:初步组装结果统计。
步骤B,将重叠群(contigs)锚定在参考基因组的染色体上,得到锚定结果,锚定结果包括在参考基因组每个染色体上的重叠群(contigs)的位置和方向。
在这里,我们利用粳稻参考基因组(MH63RS2)将重叠群(contigs)映射到12条染色体上。接着检索映射在粳稻参考基因组染色体上的共线块的位置和方向。如果重叠群(contigs)映射到多条粳稻参考基因组染色体上,将这些重叠群(contigs)分配给共线块数最多的粳稻参考基因组染色体。然后根据重叠群(contigs)在粳稻参考基因组染色体上最长共线块的位置和方向,对重叠群(contigs)进行排序和定向。相邻的重叠群(contigs)以100N连接。当然,遗传图谱,高通量染色体构象捕获(hic)技术或其他生物学方法也可用于锚定重叠群(contigs)。在这里,对重叠群(contigs)的锚定精度的要求较高,需要删除一些较短的重叠群(contigs)(小于300Kb)以提高锚定精度(表2)。
表2:初步组装结果锚定到MH63RS2染色体上的结果统计
步骤C,将重叠群路径(contig paths)连接成染色体路径(chromosome paths)。
根据上一步中锚定结果提取每个染色体上重叠群(contigs)的位置和方向,以连接重叠群路径(contig paths)(代表每个重叠群在字符串图中的路径)。每个染色体可以由重叠群路径(contig paths)和它们之间的缺口表示。如果两个重叠群(contig)相邻,则它们之间将没有缺口。如图1所示,重叠群(contigs)按照在每个染色体上的顺序连接,并且在字符串图(string graph)中可以找到重叠群(contigs)之间每个缺口的路径。方框表示重叠群和缺口,实线表示重叠群(contigs)位置,虚线表示缺口位置。此步骤之后,染色体路径(chromosome paths)中仅存在25个缺口。
步骤D,在字符串图(string graphs)中为每个缺口找到一个最佳的路径并填补缺口,如图1所示,共有14条染色体。
使用边和重叠信息重建字符串图(string graphs)。对于每个缺口,以缺口的起点为中心构建自我图(ego graph),并在自我图(ego graph)中找到从缺口的起点到终点的路径。如果存在多个路径,选择重叠最多的最短路径。由于缺口的上游和下游可能存在组装错误,因此,如果未找到路径,则删除缺口上下游的唯一性可组装片段(untigs),然后再次检索最短路径。最后,如果仍未找到最短路径,在相应位置插入100个N。通过此步骤,填充了24个缺口。在去掉可能的组装错误后,因为相邻的重叠群(contigs)变得连接在一起去除了一个缺口。最终获得了每个染色体从起点到终点的路径,从而实现了粳稻基因组完成图(表3)。
表3:粳稻完成图的组装结果统计。
对粳稻完成图进行了质量评估。
因美纳(Illumina)的双末端读段(reads)比对统计。将因美纳(Illumina)的双末端读段比对到粳稻完成图上,比对率为99.34%,覆盖率为98.98%(表4)。
表4:因美纳(Illumina)的双末端读段(reads)比对统计。
全长互补脱氧核糖核酸(cDNA)序列评估。将2,045个全长互补脱氧核糖核酸(cDNA)序列比对到粳稻完成图,比对率96.38%(1,971个)(http://server.ncgr.ac.cn/ricd/dym/ftp.php)(表5)。
表5:全长互补脱氧核糖核酸(cDNA)序列评估。
共线性分析。使用了NUCmer和MCScan分析了粳稻完成图与粳稻参考基因组MH63RS2之间的共线性,并发现了整个基因组的共线性较高(图2)。
基因区完整性评估。使用单拷贝直系同源基因(BUSCO)评估了粳稻完成图的完整性。在胚胎植物中鉴定出的1,614个单拷贝直系同源基因中,有98.6%在粳稻完成图中是完整的,优于已发表的水稻基因组(表6)。
表6:使用单拷贝直系同源基因(BUSCO)评估基因区完整性。
长末端重复反转录转座子(LTR-RTs)注释显示长末端重复组装指数(LAI)得分为22.72,达到了当前的金标准(图3)。
细菌人工染色体(BAC)评估。将粳稻完成图与从基因银行(GenBank)获得的12个着丝粒区域的细菌人工染色体(BAC)序列进行了比较(http://rice.plantbiology.msu.edu/annotation_pseudo_centromeres.shtml)。所有细菌人工染色体(BAC)序列均能比对到粳稻完成图,覆盖率超过90%(图4,表7)。
表7:12个着丝粒区域的细菌人工染色体(BAC)序列组装评估。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (4)
1.一种基因组完成图的基因组组装方法,其特征在于,包括以下步骤:
步骤1,使用高保真测序数据HiFi进行基因组组装,生成重叠群以及重叠群在字符串图中的重叠群路径、边信息和重叠信息;
步骤2,将重叠群锚定在参考基因组的染色体上,得到锚定结果,锚定结果包括参考基因组的每个染色体上重叠群的位置和方向;
将重叠群锚定在参考基因组的染色体上的方法:采用Nucmer或MCScan软件将重叠群映射到参考基因组的染色体上,接着检索映射在参考基因组的染色体上的共线块的位置和方向;如果重叠群映射到多条参考基因组的染色体上,将映射到多条参考基因组的染色体上的重叠群分配给共线块数最多参考基因组的染色体;然后根据重叠群在参考基因组的染色体上最长共线块的位置和方向,对重叠群进行排序和定向;
步骤3,将步骤1中生成的重叠群在字符串图中的重叠群路径按照步骤2的锚定结果连接成每个染色体在字符串图中的染色体路径;每个染色体路径由重叠群路径和它们之间的缺口表示;如果两个重叠群相邻,则它们之间将没有缺口;
步骤4,使用步骤1中生成的边信息和重叠信息重建字符串图得到重建后字符串图;对于每条染色体,按照步骤3得到的染色体路径遍历步骤1生成的重叠群,并在重建后字符串图上为每一对之间的缺口寻找最短路径并填补缺口,以实现无缺口的组装;
寻找最短路径的方法:对于每个缺口,以缺口的起点为中心构建自我图,并在自我图中找到从缺口的起点到终点的路径;如果存在多个路径,选择重叠最多的最短路径;
寻找最短路径时,如果未找到路径,则删除缺口上下游的唯一性可组装片段,然后再次寻找最短路径,最后,如果仍未找到最短路径,在相应位置插入100 个N。
2.根据权利要求1所述基因组完成图的基因组组装方法,其特征在于:步骤2中将重叠群锚定在参考基因组的染色体上的方法为遗传图谱法、高通量染色体构象捕获法hic或者近缘参考基因组法。
3.根据权利要求2所述基因组完成图的基因组组装方法,其特征在于:步骤2中相邻的重叠群以100 个N连接。
4.根据权利要求3所述基因组完成图的基因组组装方法,其特征在于:步骤2中删除小于300Kb的重叠群以提高锚定精度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110069693.XA CN112786109B (zh) | 2021-01-19 | 2021-01-19 | 一种基因组完成图的基因组组装方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110069693.XA CN112786109B (zh) | 2021-01-19 | 2021-01-19 | 一种基因组完成图的基因组组装方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112786109A CN112786109A (zh) | 2021-05-11 |
CN112786109B true CN112786109B (zh) | 2024-04-16 |
Family
ID=75757627
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110069693.XA Active CN112786109B (zh) | 2021-01-19 | 2021-01-19 | 一种基因组完成图的基因组组装方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112786109B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114464260B (zh) * | 2021-12-29 | 2023-09-26 | 上海诺禾致源医学检验实验室有限公司 | 染色体水平基因组的组装方法和组装装置 |
CN115691673B (zh) * | 2022-10-25 | 2023-08-15 | 广东省农业科学院蔬菜研究所 | 一种端粒到端粒的基因组组装方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109273053A (zh) * | 2018-09-27 | 2019-01-25 | 华中科技大学鄂州工业技术研究院 | 一种高通量测序的微生物数据处理方法 |
CN109923217A (zh) * | 2016-10-13 | 2019-06-21 | 生物梅里埃公司 | 宏基因组样品中病原体的鉴定和抗生素表征 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015094844A1 (en) * | 2013-12-18 | 2015-06-25 | Pacific Bioscences Inc. | String graph assembly for polyploid genomes |
US20150286775A1 (en) * | 2013-12-18 | 2015-10-08 | Pacific Biosciences Of California, Inc. | String graph assembly for polyploid genomes |
-
2021
- 2021-01-19 CN CN202110069693.XA patent/CN112786109B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109923217A (zh) * | 2016-10-13 | 2019-06-21 | 生物梅里埃公司 | 宏基因组样品中病原体的鉴定和抗生素表征 |
CN109273053A (zh) * | 2018-09-27 | 2019-01-25 | 华中科技大学鄂州工业技术研究院 | 一种高通量测序的微生物数据处理方法 |
Non-Patent Citations (2)
Title |
---|
冷鲜鸡肉中莓实假单胞菌NMC25的全基因组测序及分析;王光宇等;《食品科学》;20200925;第42卷(第16期);第233-238页 * |
水稻二萜合成途径中代谢流调控机制研究进展;张艺丹等;《植物生理学报》;20191220;第55卷(第12期);第1762–1768页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112786109A (zh) | 2021-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Golicz et al. | The long intergenic noncoding RNA (LincRNA) landscape of the soybean genome | |
CN112786109B (zh) | 一种基因组完成图的基因组组装方法 | |
Palkopoulou et al. | Complete genomes reveal signatures of demographic and genetic declines in the woolly mammoth | |
Li et al. | Genome structure and evolution of Antirrhinum majus L | |
Xue et al. | L_RNA_scaffolder: scaffolding genomes with transcripts | |
Tong et al. | Comprehensive analysis of RNA-seq data reveals the complexity of the transcriptome in Brassica rapa | |
Deschamps et al. | Utilization of next-generation sequencing platforms in plant genomics and genetic variant discovery | |
Van Nieuwerburgh et al. | Illumina mate-paired DNA sequencing-library preparation using Cre-Lox recombination | |
WO2015149719A1 (zh) | 杂合基因组处理方法 | |
US20160350478A1 (en) | De novo diploid genome assembly and haplotype sequence reconstruction | |
CN113808668B (zh) | 提升基因组组装完整性的方法、装置及其应用 | |
Yang et al. | Genomic resources for functional analyses of the rice genome | |
KR20080026153A (ko) | 다이태그 서열의 처리 방법 및/또는 게놈 맵핑 | |
Scheibye-Alsing et al. | Sequence assembly | |
CN110621785B (zh) | 基于三代捕获测序对二倍体基因组单倍体分型的方法和装置 | |
Aury et al. | Long-read and chromosome-scale assembly of the hexaploid wheat genome achieves high resolution for research and breeding | |
Bista et al. | Genomics of cold adaptations in the Antarctic notothenioid fish radiation | |
CN111584004A (zh) | 一种基于三维组学数据的西藏特色鱼类基因组组装方法 | |
Zhang et al. | Assessment of human diploid genome assembly with 10x Linked-Reads data | |
Yang et al. | Hybrid de novo genome assembly of the Chinese herbal fleabane Erigeron breviscapus | |
Brown et al. | The mouse genome | |
Gao et al. | Chromosome-scale genome assembly of the resurrection plant Acanthochlamys bracteata (Velloziaceae) | |
CN115691673B (zh) | 一种端粒到端粒的基因组组装方法 | |
Martinez et al. | Genome assembly of the acoel flatworm Symsagittifera roscoffensis, a model for research on photosymbiosis | |
Yang et al. | CloG: a pipeline for closing gaps in a draft assembly using short reads |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |