CN114464261B - 组装延长性染色体的方法及装置 - Google Patents

组装延长性染色体的方法及装置 Download PDF

Info

Publication number
CN114464261B
CN114464261B CN202210376925.0A CN202210376925A CN114464261B CN 114464261 B CN114464261 B CN 114464261B CN 202210376925 A CN202210376925 A CN 202210376925A CN 114464261 B CN114464261 B CN 114464261B
Authority
CN
China
Prior art keywords
chromosome
data
potential
depth
sex
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210376925.0A
Other languages
English (en)
Other versions
CN114464261A (zh
Inventor
周勋
赵勇
王龙
曹斌斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Novogene Biological Information Technology Co ltd
Original Assignee
Tianjin Novogene Biological Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Novogene Biological Information Technology Co ltd filed Critical Tianjin Novogene Biological Information Technology Co ltd
Priority to CN202210376925.0A priority Critical patent/CN114464261B/zh
Publication of CN114464261A publication Critical patent/CN114464261A/zh
Application granted granted Critical
Publication of CN114464261B publication Critical patent/CN114464261B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/20Sequence assembly
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本发明公开了一种组装延长性染色体的方法及装置。其中,该方法包括:S1,使用hifi数据对基因组组装挂载,根据hifi数据的深度在未挂载区域对潜在的性染色体片段根据深度进行鉴定,其中,性染色体为y染色体或w染色体;S2,使用超长数据对单独的潜在性染色体片段连长,得到性染色体片段,超长数据为N50长度到达50Kb以上的数据。与现有的组装技术相比,本发明在现有组装技术的水平上,单独对性染色体(y染色体或w染色体)根据reads深度做了鉴定,同时将鉴定出的潜在性染色体(y染色体或w染色体)进行连长和补洞,使性染色体(y染色体或w染色体)片段的连续性和完整性更高。

Description

组装延长性染色体的方法及装置
技术领域
本发明涉及基因组组装技术领域,具体而言,涉及一种组装延长性染色体的方法及装置。
背景技术
基因组组装一般分为二代测序数据组装和三代测序数据组装,二代测序数据常用的组装软件为soapdenovo,通过小片段及大片段数据结合,组装结果为支架(scaffold)水平基因组;三代测序数据常用的组装软件为canu或者falcon,组装结果为重叠群(contig)水平基因组。
三代测序常规的数据分为pacbio的clr数据和nanopore数据,下机数据的单碱基准确度在85%左右。Pacbio公司近期推出的ccs测序模式,下机数据N50在20k左右,单碱基准确度可以达到99%,称为hifi数据。hifi数据常用的组装软件为hifiasm,组装结果为重叠群(contig)水平基因组,组装的连续性相比clr数据和ont数据更好。nanopore超长模式产生的数据N50长度可以到达50Kb以上,可以有效的跨过重复度较高的区域。
Hi-C(High-through chromosome conformation capture)技术为高通量染色体构象捕获技术,利用染色体内部互做强度远大于染色体间互做强度的原理,对组织进行甲醛交联固定,特异性的限制酶对基因组进行酶切,然后经过加生物素标记和末端修复,再次进行酶连,打断,使用磁珠捕获带生物素标记的片段进行高通量测序,测序的数据结合contig或者scaffold水平的基因组使用3d-dna软件进行挂载,生成的hic文件和assembly文件,经过juicebox手动调整后,最终得到染色体水平基因组。
性染色体,例如y染色体是决定雄性性别的染色体,与多数成对存在的染色体不同,y染色体在减数分裂时,只有其端部同X染色体可以配对。y染色体具有高度的重复区域以及大型的重复片段,存在大范围的异染色质,目前基因组组装挂载中,y染色体几乎不能被挂载成染色体水平,仅以短的contig形式存在于未挂载区域。
发明内容
本发明旨在提供一种组装延长性染色体的方法及装置,以得到更加完整的性染色体片段。
为了实现上述目的,根据本发明的一个方面,提供了一种组装延长性染色体的方法。该方法包括:S1,使用hifi数据对基因组组装挂载,根据hifi数据的深度在未挂载区域对潜在的性染色体片段根据深度进行鉴定,其中,性染色体为y染色体或w染色体;S2,使用超长数据对单独的潜在性染色体片段连长,得到性染色体片段,超长数据为N50长度到达50Kb以上的数据。
进一步地,S1包括:1)对hifi数据进行组装,得到contig水平的基因组;2)结合hic数据进行挂载,得到需要调整的hic文件;3)对hic文件进行手动调整,得到挂载后染色体水平的基因组;4)将hifi数据与染色体水平基因组比对,得到比对后的bam文件;5)计算bam文件中每条scaffold和contig的深度。
进一步地,S1包括:1)使用hifiasm对40X深度hifi数据进行组装,得到contig水平的基因组;2)使用3d-dna结合hic数据进行挂载,得到需要调整的hic文件;3)使用juicebox对hic文件进行手动调整,得到挂载后染色体水平的基因组;4)使用minimap2将hifi数据与染色体水平基因组比对,得到比对后的bam文件;5)使用samtools的depth命令计算bam文件中每条scaffold和contig的深度。
进一步地,S2包括:6)挑选具有特定深度的contig作为潜在的性染色体片段;7)将潜在性染色体片段的序列提取出来;8)对潜在的性染色体片段进行连长和补洞,得到连长后的染色体片段。
进一步地,S2包括:6)挑选contig深度为15-25的作为潜在的y染色体片段;7)使用samtools的faidx命令将潜在染色体片段的序列提取出来;8)使用LRScaf结合nanopore超长数据,对潜在的y染色体片段进行连长和补洞,得到连长后y染色体片段。
根据本发明的另一个方面,提供一种组装延长性染色体的装置。该装置包括:深度鉴定模块,设置为使用hifi数据对基因组组装挂载,根据hifi数据的深度在未挂载区域对潜在的性染色体片段根据深度进行鉴定,其中,性染色体为y染色体或w染色体;组装延长模块,设置为使用超长数据对单独的潜在性染色体片段连长,得到性染色体片段,超长数据为N50长度到达50Kb以上的数据。
进一步地,深度鉴定模块包括:组装单元,设置为对hifi数据进行组装,得到contig水平的基因组;挂载单元,设置为结合hic数据进行挂载,得到需要调整的hic文件;调整单元,设置为通过对hic文件进行手动调整,得到挂载后染色体水平的基因组;比对单元,设置为将hifi数据与染色体水平基因组比对,得到比对后的bam文件;计算单元,设置为计算bam文件中每条scaffold和contig的深度。
进一步地,深度鉴定模块包括:组装单元,设置为使用hifiasm对40X深度hifi数据进行组装,得到contig水平的基因组;挂载单元,设置为使用3d-dna结合hic数据进行挂载,得到需要调整的hic文件;调整单元,设置为使用juicebox对hic文件进行手动调整,得到挂载后染色体水平的基因组;比对单元,设置为使用minimap2将hifi数据与染色体水平基因组比对,得到比对后的bam文件;计算单元,设置为使用samtools的depth命令计算bam文件中每条scaffold和contig的深度。
进一步地,组装延长模块包括:挑选单元,设置为挑选具有特定深度的contig作为潜在的性染色体片段;提取单元,设置为将潜在性染色体片段的序列提取出来;连长及补洞单元,设置为对潜在的性染色体片段进行连长和补洞,得到连长后的染色体片段。
进一步地,组装延长模块包括:挑选单元,设置为挑选contig深度为15-25的作为潜在的y染色体片段;提取单元,设置为使用samtools的faidx命令将潜在染色体片段的序列提取出来;连长及补洞单元,设置为使用LRScaf结合nanopore超长数据,对潜在的y染色体片段进行连长和补洞,得到连长后y染色体片段。
根据本发明的又一方面,提供了一种存储介质。该存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行本申请上述任一种组装延长性染色体的方法。
根据本发明的再一方面,提供了一种处理器。该处理器用于运行程序,其中,程序运行时执行本申请上述任一种组装延长性染色体的方法。
与现有的组装技术相比,本发明在现有组装技术的水平上,单独对性染色体(y染色体或w染色体)根据reads深度做了鉴定,同时将鉴定出的潜在性染色体(y染色体或w染色体)进行连长和补洞,使性染色体(y染色体或w染色体)片段的连续性和完整性更高。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了根据本发明一实施方式的使用hifi数据和nanopore超长数据组装延长y染色体流程图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
基因组通过二代或者三代测序技术组装到coting或者scaffold水平,进行hic挂载之后,x染色体一般可以通过同源物种的共线性进行确认,y染色体因为高度重复序列以及异染色质化,组装结果为短的contig序列,不能挂载成染色体。本发明提供了一种结合hifi数据和ont超长数据对y染色体组装和延伸的方法,可以得到更加完整的y染色体片段。
根据本发明一种典型的实施方式,提供一种组装延长性染色体的方法。该方法包括:S1,使用hifi数据对基因组组装挂载,根据hifi数据的深度在未挂载区域对潜在的性染色体片段根据深度进行鉴定,其中,性染色体为y染色体或w染色体;S2,使用超长数据对单独的潜在性染色体片段连长,得到性染色体片段,超长数据为N50长度到达50Kb以上的数据。
本发明除了可以对y染色体进行组装延伸,还可以对具有特殊性染色体的物种,如鸟类爬行类动物的w染色体进行组装延伸。
与现有的组装技术相比,本发明在现有组装技术的水平上,单独对性染色体(y染色体或w染色体)根据reads做了鉴定,同时将鉴定出的潜在性染色体(y染色体或w染色体)进行连长和补洞,使性染色体(y染色体或w染色体)片段的连续性和完整性更高。
在本发明一典型的实施例中,提供了一种结合hifi数据和nanopore超长数据,对y染色体进行组装延长的方法,参见图1,y染色体组装延长的具体方法为:
1.使用hifiasm对40X深度hifi数据进行组装,得到contig水平的基因组。
2.使用3d-dna结合hic数据进行挂载,得到需要调整的hic文件。
3.使用juicebox对hic文件进行手动调整,得到挂载后染色体水平的基因组。
4.使用minimap2将hifi数据与染色体水平基因组比对,得到比对后的bam文件。
5.使用samtools的depth命令计算bam文件中每条scaffold和contig的深度。
6.挑选contig深度为15-25的作为潜在的y染色体片段。
7.使用samtools的faidx命令将潜在染色体片段的序列提取出来。
8.使用LRScaf结合nanopore超长数据,对潜在的y染色体片段进行连长和补洞,得到连长后y染色体片段。
下面将结合具体实施例进一步说明本发明的有益效果。
实施例1
对猪的y染色体组装延伸,具体方法为:
1. 使用hifiasm对40X深度猪的hifi数据进行组装,得到猪contig水平的基因组。
2.使用3d-dna结合猪的hic数据进行挂载,得到需要调整的hic文件。
3.使用juicebox对hic文件进行手动调整,得到猪挂载后染色体水平的基因组。
4.使用minimap2将hifi数据与猪染色体水平基因组比对,得到比对后的bam文件。
5.使用samtools的depth命令计算bam文件中每条scaffold和contig的深度。
6.挑选contig深度为15-25的作为潜在的猪y染色体片段。
7.使用samtools的faidx命令将潜在猪y染色体片段的序列提取出来。
8.使用LRScaf结合nanopore超长数据,对猪潜在的y染色体片段进行连长和补洞,得到连长后猪y染色体片段。
延伸前猪y染色体最大片段长度为150k,经过本发明方法延伸后猪y染色体最大片段长度为900k,效果提升显著。
实施例2
本实施例提供了一种组装延长性染色体的装置。该装置包括:
深度鉴定模块,设置为使用hifi数据对基因组组装挂载,根据hifi数据的深度在未挂载区域对潜在的性染色体片段根据深度进行鉴定,其中,性染色体为y染色体或w染色体;
组装延长模块,设置为使用超长数据对单独的潜在性染色体片段连长,得到性染色体片段,超长数据为N50长度到达50Kb以上的数据。
优选地,深度鉴定模块包括:
组装单元,设置为使用hifiasm对40X深度hifi数据进行组装,得到contig水平的基因组;
挂载单元,设置为使用3d-dna结合hic数据进行挂载,得到需要调整的hic文件;
调整单元,设置为使用juicebox对hic文件进行手动调整,得到挂载后染色体水平的基因组;
比对单元,设置为使用minimap2将hifi数据与染色体水平基因组比对,得到比对后的bam文件;
计算单元,设置为使用samtools的depth命令计算bam文件中每条scaffold和contig的深度。
优选地,组装延长模块包括:
挑选单元,设置为挑选contig深度为15-25的作为潜在的y染色体片段;
提取单元,设置为使用samtools的faidx命令将潜在染色体片段的序列提取出来;
连长及补洞单元,设置为使用LRScaf结合nanopore超长数据,对潜在的y染色体片段进行连长和补洞,得到连长后y染色体片段。
实施例3
本实施例提供了一种存储介质,该存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行任一种组装延长性染色体的方法。
本实施例还提供了一种处理器,该处理器用于运行程序,其中,程序运行时执行上述任一种组装延长性染色体的方法。
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种组装延长性染色体的方法,其特征在于,包括:
S1,使用hifi数据对基因组组装挂载,根据hifi数据的深度在未挂载区域对潜在的性染色体片段根据深度进行鉴定,其中,所述性染色体为y染色体或w染色体;
S2,使用超长数据对单独的潜在性染色体片段连长,得到性染色体片段,所述超长数据为N50长度到达50Kb以上的数据;
所述S1包括:
1)使用hifiasm对40X深度hifi数据进行组装,得到contig水平的基因组;
2)使用3d-dna结合hic数据进行挂载,得到需要调整的hic文件;
3)使用juicebox对hic文件进行手动调整,得到挂载后染色体水平的基因组;
4)使用minimap2将hifi数据与染色体水平基因组比对,得到比对后的bam文件;
5)使用samtools的depth命令计算bam文件中每条scaffold和contig的深度。
2.根据权利要求1所述的方法,其特征在于,所述S2包括:
6)挑选具有特定深度的contig作为潜在的所述性染色体片段;
7)将潜在所述性染色体片段的序列提取出来;
8)对潜在的所述性染色体片段进行连长和补洞,得到连长后的染色体片段。
3.根据权利要求2所述的方法,其特征在于,所述S2包括:
6)挑选contig深度为15-25的作为潜在的y染色体片段;
7)使用samtools的faidx命令将潜在染色体片段的序列提取出来;
8)使用LRScaf结合nanopore超长数据,对潜在的y染色体片段进行连长和补洞,得到连长后y染色体片段。
4.一种组装延长性染色体的装置,其特征在于,包括:
深度鉴定模块,设置为使用hifi数据对基因组组装挂载,根据hifi数据的深度在未挂载区域对潜在的性染色体片段根据深度进行鉴定,其中,所述性染色体为y染色体或w染色体;
组装延长模块,设置为使用超长数据对单独的潜在性染色体片段连长,得到性染色体片段,所述超长数据为N50长度到达50Kb以上的数据;
所述深度鉴定模块包括:
组装单元,设置为使用hifiasm对40X深度hifi数据进行组装,得到contig水平的基因组;
挂载单元,设置为使用3d-dna结合hic数据进行挂载,得到需要调整的hic文件;
调整单元,设置为使用juicebox对hic文件进行手动调整,得到挂载后染色体水平的基因组;
比对单元,设置为使用minimap2将hifi数据与染色体水平基因组比对,得到比对后的bam文件;
计算单元,设置为使用samtools的depth命令计算bam文件中每条scaffold和contig的深度。
5.根据权利要求4所述的装置,其特征在于,所述组装延长模块包括:
挑选单元,设置为挑选具有特定深度的contig作为潜在的所述性染色体片段;
提取单元,设置为将潜在所述性染色体片段的序列提取出来;
连长及补洞单元,设置为对潜在的所述性染色体片段进行连长和补洞,得到连长后的染色体片段。
6.根据权利要求5所述的装置,其特征在于,所述组装延长模块包括:
挑选单元,设置为挑选contig深度为15-25的作为潜在的y染色体片段;
提取单元,设置为使用samtools的faidx命令将潜在染色体片段的序列提取出来;
连长及补洞单元,设置为使用LRScaf结合nanopore超长数据,对潜在的y染色体片段进行连长和补洞,得到连长后y染色体片段。
7.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至3中任意一项所述的组装延长性染色体的方法。
8.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至3中任意一项所述的组装延长性染色体的方法。
CN202210376925.0A 2022-04-12 2022-04-12 组装延长性染色体的方法及装置 Active CN114464261B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210376925.0A CN114464261B (zh) 2022-04-12 2022-04-12 组装延长性染色体的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210376925.0A CN114464261B (zh) 2022-04-12 2022-04-12 组装延长性染色体的方法及装置

Publications (2)

Publication Number Publication Date
CN114464261A CN114464261A (zh) 2022-05-10
CN114464261B true CN114464261B (zh) 2022-07-01

Family

ID=81417937

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210376925.0A Active CN114464261B (zh) 2022-04-12 2022-04-12 组装延长性染色体的方法及装置

Country Status (1)

Country Link
CN (1) CN114464261B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115579061B (zh) * 2022-12-07 2023-04-07 北京诺禾致源科技股份有限公司 基因组hic分析的方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108885649A (zh) * 2015-11-12 2018-11-23 塞缪尔·威廉姆斯 使用纳米孔技术对短dna片段进行快速测序
CN111778563A (zh) * 2020-07-24 2020-10-16 天津诺禾致源生物信息科技有限公司 细胞Hi-C测序文库的构建方法
CN112289382A (zh) * 2020-10-28 2021-01-29 天津诺禾致源生物信息科技有限公司 多倍体基因组同源染色体的拆分方法、装置及其应用
CN112522382A (zh) * 2020-12-22 2021-03-19 广州深晓基因科技有限公司 一种基于液相探针捕获的y染色体测序方法
CN113160877A (zh) * 2021-01-11 2021-07-23 东南大学 一种细胞特异性基因组g-四链体的预测方法
CN113205857A (zh) * 2021-07-02 2021-08-03 天津诺禾致源生物信息科技有限公司 基因组性染色体非同源区域的鉴定方法和装置
CN114058713A (zh) * 2021-11-30 2022-02-18 淮阴师范学院 乌苏里拟鲿y染色体序列的获取方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112908415B (zh) * 2021-02-23 2022-05-17 广西壮族自治区农业科学院 一种获得染色体水平基因组的方法
CN113808668B (zh) * 2021-11-18 2022-02-18 北京诺禾致源科技股份有限公司 提升基因组组装完整性的方法、装置及其应用

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108885649A (zh) * 2015-11-12 2018-11-23 塞缪尔·威廉姆斯 使用纳米孔技术对短dna片段进行快速测序
CN111778563A (zh) * 2020-07-24 2020-10-16 天津诺禾致源生物信息科技有限公司 细胞Hi-C测序文库的构建方法
CN112289382A (zh) * 2020-10-28 2021-01-29 天津诺禾致源生物信息科技有限公司 多倍体基因组同源染色体的拆分方法、装置及其应用
CN112522382A (zh) * 2020-12-22 2021-03-19 广州深晓基因科技有限公司 一种基于液相探针捕获的y染色体测序方法
CN113160877A (zh) * 2021-01-11 2021-07-23 东南大学 一种细胞特异性基因组g-四链体的预测方法
CN113205857A (zh) * 2021-07-02 2021-08-03 天津诺禾致源生物信息科技有限公司 基因组性染色体非同源区域的鉴定方法和装置
CN114058713A (zh) * 2021-11-30 2022-02-18 淮阴师范学院 乌苏里拟鲿y染色体序列的获取方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Accurate circular consensus long-read sequencing improves variant detection and assembly of a human genome;Aaron M Wenger;《Nat Biotechnol》;20191024;全文 *
Haplotype-resolvedde novoassembly with phasedassembly graphs;Haoyu Cheng;《arXiv:2008.01237v1》;20200803;全文 *
皱纹盘鲍与西氏鲍性染色体的识别和性别分子标记的开发;蔡明夷;《中国优秀硕士学位论文全文数据库 农业科技辑》;20220115;全文 *
菠菜性别基因X/Y连锁标记的筛选及应用;刘丹丹;《中国优秀博硕士学位论文全文数据库(硕士)农业科技辑》;20160115;全文 *

Also Published As

Publication number Publication date
CN114464261A (zh) 2022-05-10

Similar Documents

Publication Publication Date Title
CN114464261B (zh) 组装延长性染色体的方法及装置
Botero-Castro et al. Avian genomes revisited: hidden genes uncovered and the rates versus traits paradox in birds
CN113808668B (zh) 提升基因组组装完整性的方法、装置及其应用
Zou et al. Genome‐wide selection footprints and deleterious variations in young Asian allotetraploid rapeseed
US20200181694A1 (en) High throughput detection of molecular markers based on aflp and high through-put sequencing
Pucholt et al. Recent sex chromosome divergence despite ancient dioecy in the willow Salix viminalis
Ray et al. Alu insertion loci and platyrrhine primate phylogeny
EP2264501A3 (en) Method of adding equipment to a fiber distribution hub
RU2008115517A (ru) Векторные плазмиды для клонирования модулей днк и способы их применения
ATE309342T1 (de) Verfahren zur herstellung in vitro von rekombinierten nucleotidsequenzen, und so hergestelte genbanken und sequenzen
CN111445948A (zh) 一种利用Hi-C进行多倍体鱼类的染色体构建方法
CN107784201B (zh) 一种二代序列和三代单分子实时测序序列联合补洞方法和系统
Sackton et al. Population genomic inferences from sparse high-throughput sequencing of two populations of Drosophila melanogaster
CN108897986B (zh) 一种基于蛋白质信息的基因组序列拼接方法
Cheng et al. Chicken genomics
Scarlett et al. Multiple origins, one evolutionary trajectory: gradual evolution characterizes distinct lineages of allotetraploid Brachypodium
CN113205857B (zh) 基因组性染色体非同源区域的鉴定方法和装置
CN112430586B (zh) 一种VI-B型CRISPR/Cas13基因编辑系统及其应用
CN102789553A (zh) 利用长转录组测序结果装配基因组的方法及装置
DE60228935D1 (de) Verfahren zur entwicklung einer zelle mit einem gewünschten phänotyp und entwickelte zellen
Dobson et al. De novo assembly and annotation of the North American bison (Bison bison) reference genome and subsequent variant identification
CN107784198B (zh) 一种二代序列和三代单分子实时测序序列联合组装方法和系统
CN112559579A (zh) 一种红外码库的高效对码方法、装置、设备和介质
WO2001063543A3 (en) Method and system for the assembly of a whole genome using a shot-gun data set
Braun et al. Enigmatic phylogeny of skuas: an alternative hypothesis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant