CN111584004B - 一种基于三维组学数据的西藏特色鱼类基因组组装方法 - Google Patents

一种基于三维组学数据的西藏特色鱼类基因组组装方法 Download PDF

Info

Publication number
CN111584004B
CN111584004B CN202010399433.4A CN202010399433A CN111584004B CN 111584004 B CN111584004 B CN 111584004B CN 202010399433 A CN202010399433 A CN 202010399433A CN 111584004 B CN111584004 B CN 111584004B
Authority
CN
China
Prior art keywords
genome
sequence
tibetan
fish
contig
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010399433.4A
Other languages
English (en)
Other versions
CN111584004A (zh
Inventor
刘海平
牟振波
肖世俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Animal Husbandry and Veterinary Medicine of Tibet Academy of Agriculture and Animal Husbandry Sciences
Original Assignee
Institute of Animal Husbandry and Veterinary Medicine of Tibet Academy of Agriculture and Animal Husbandry Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Animal Husbandry and Veterinary Medicine of Tibet Academy of Agriculture and Animal Husbandry Sciences filed Critical Institute of Animal Husbandry and Veterinary Medicine of Tibet Academy of Agriculture and Animal Husbandry Sciences
Priority to CN202010399433.4A priority Critical patent/CN111584004B/zh
Publication of CN111584004A publication Critical patent/CN111584004A/zh
Application granted granted Critical
Publication of CN111584004B publication Critical patent/CN111584004B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/20Sequence assembly
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/80Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in fisheries management
    • Y02A40/81Aquaculture, e.g. of fish

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及一种基于三维组学数据的西藏特色鱼类基因组组装方法,该方法将西藏特色鱼类待测样本的Hi‑C测序数据比对到该待测样本初步基因组contig序列中获得contig序列之间的位置关系,然后填补contig序列之间的空缺获得高质量的西藏特色鱼类基因组编码信息。因此,本发明的方法显著提高了组装结果中contig水平的连续性,从而提升特色西藏鱼类复杂基因组组装的质量。同时,本发明的组装方法获得连续性更好的参考基因组,为后续进行大规模基因组上的基因进化和功能研究提供保障,也更有利于西藏和其他地区鱼类的相关功能基因的QTL定位和GWAS研究,以及相关的群体遗传多样性和群体结构研究。

Description

一种基于三维组学数据的西藏特色鱼类基因组组装方法
技术领域
本发明涉及基因工程技术领域,更具体地,涉及一种基于三维组学数据的西藏特色鱼类基因组组装方法。
背景技术
人类基因组计划(Human Genome Project,HGP)以及其他模式生物基因组研究极大的促进了基础和应用生物学研究的进展,加深了人类对生命现象本质的理解和认识。正是由于模式生物基因组学技术的发展以及在人类的营养,衰老,疾病防治的方面的应用,科学家们发现了大量的与人类健康和临床相关的功能性基因和代谢通路,使人们看到基因组技术在生命科学研究中的重大价值。随着高通量测序成本的迅速下降,以基因组从头测序(de novo sequencing)为代表的基因组技术逐步应用到其他非模式生物相关的研究领域。目前已有近10种水产养殖物种全基因组序列得到解析和公布。
由于西藏地区特殊的历史地理情况,孕育了众多国际范围内特有的本地鱼类,形成了西藏区域特色的遗传资源。这些遗传资源为我们解析西藏鱼类和其他生物进化、古地理和古气候变化历程和西藏特有种质资源保护等具有重要的意义。目前已有黑斑原鮡、尖裸鲤和异齿裂腹鱼等多种西藏特有鱼类的全基因组序列得到解析和公布,并且数目还在迅速增加。然而二代测序固有的扩增偏好和读长过短等特点导致基因组的重复序列难以拼接;同时,西藏特有鱼类的高杂合度、高重复序列和多倍化等基因组结构复杂性对基因组序列的准确拼接等提出了更高的挑战。由于西藏特色鱼类基因组的高复杂度,传统的二代测序技术无法满足西藏特色鱼类基因组研究中对参考序列完整性和准确度的要求,需要在更高的尺度上进行染色体水平的深度组装。
对于众多没有参考基因组序列的非模式生物而言,该物种的基因图谱,包括遗传图谱和物理图谱,为基因组染色体水平的super-scaffold提供了scaffold在染色体上的准确的排序和位置信息。遗传图谱以基因位点在染色体上的连锁和交换为基础,以位点的重组值作为标记间的距离,而物理图谱以基因位点的物理距离为基础,分析基因位点在染色体上的物理定位而形成的图谱。然而,遗传图谱和物理图谱都不含有物种基因组DNA的具体序列信息:遗传图谱中的遗传距离来自于重组率的估计,无法准确的代替物理距离,并且由于遗传图谱的标记密度的限制,难以精确确定所有的基因组scaffold的位置和方向;物理图谱能够展示基因标记的物理距离,但是传统物理图谱的片段长度有限,比如BAC末端的指纹图谱平均长度约为150kb且只能用于BAC序列的super-scaffold,限制了物理图谱在基因组拼接上的作用。近年来,由于单分子物理技术的介人,许多新颖的物理制图方法涌现出来,比如光学制图(Optical Mapping)等。这些技术拓展了物理图谱的构建策略,但是它们的缺点是错误率高,分辨率低,通量不高。随着三维基因组组学的发展,科学家们发现,以Hi-C为代表的三维组学为基因组组装提供了更大尺度的组装信息,可能辅助进行基因组组装。然而目前Hi-C技术用于基因组组装仅仅主要在染色体构建上,在contig序列组装方面的Hi-C的报告还不多,应用于针对于西藏鱼类复杂基因组的三维辅助组装方法尚未报道。
发明内容
针对现有技术中的不足,本发明提出了一种基于三维组学数据的西藏特色鱼类基因组组装方法,该方法将样本的Hi-C数据比对到初步基因组contig序列中并计算获得contig序列的染色体分布、contig之间的排序和方向,然后利用contig前后的序列之间的序列网络,将序列填充到contig之间的空缺,从而大大提高组装结果的contig水平的连续性,提升西藏鱼类基因组组装的完整性。
为实现上述目的,本发明是通过以下技术方案实现的:
一种基于三维组学数据的西藏特色鱼类基因组组装方法,将西藏特色鱼类待测样本的Hi-C测序数据比对到该待测样本初步基因组contig序列中获得cont ig序列之间的位置关系,然后填补contig序列之间的空缺获得高质量的西藏特色鱼类基因组编码信息。
进一步地,所述方法具体包括:
(1)获取超长的西藏特色鱼类基因组测序片段;
(2)使用短序列比对工具获得序列比对信息,并基于所述序列比对信息获得步骤(1)的超长基因组测序片段之间的overlap信息,从而构建序列关系图谱;
(3)基于序列关系图谱构建初步基因组contig序列;
(4)基于西藏特色鱼类待测样本Hi-C测序数据获得contig序列之间的位置关系;
(5)填补contig序列之间的空缺。
更进一步地,所述步骤(2)的短序列比对工具为daligner或者minimap。
更进一步地,采用daligner比对时,序列纠错阶段的参数为:pa_HPCdalign er_option=-v-B10-t16-e.70-l1000-s1000-T12;纠错后序列比对参数为:ovlp_HPCdaligner_option=-v-B10-t32-h60-e.96-l500-s1000-T12。
进一步地,基于西藏特色鱼类待测样本Hi-C测序数据获得contig序列之间的位置关系的具体操作为:使用Bowtie v1.0通过迭代比对的方法,将Hi-C测序数据通过允许空缺的方式比对到初步基因组contig序列上;基于比对结果,使用hiclib方法计算contig序列之间的互作频率;通过互作频率信息,使用3D-DNA确定contig序列的染色体分布、contig之间的排序和方向。
更进一步地,所述Bowtie软件参数为:-f-a-m 20-v 1。
进一步地,所述方法还包括将填补后的序列进行去冗余操作及对整个基因组进行升级整理。
传统方法进行三代基因组组装后,使用Hi-C进行contig串联,无法对contig之间的空缺进行补洞。本发明针对西藏特色鱼类复杂基因组组装的难题,提出一种利用三维组学数据对基因组组装的contig序列长度进行质量提升的方法,与现有技术相比,本发明的有益效果在于:
(1)本发明利用Hi-C三维数据获得三代组装contig之间相对位置关系,然后进一步利用contig序列位置关系信息明确contig序列之间的空缺信息并进行填补,因此,本发明将Hi-C三维数据应用于contig序列组装,不仅重复利用了Hi-C提供的基因组信息,更显著地提高了组装结果中contig水平的连续性,从而提升特色西藏鱼类复杂基因组组装的质量。
(2)本发明的组装方法将获得连续性更好的参考基因组,为后续进行大规模基因组上的基因进化和功能研究提供保障。同时本发明构建的基因组也将更有利于西藏和其他地区鱼类的相关功能基因的QTL定位和GWAS研究,以及相关的群体遗传多样性和群体结构研究。
附图说明
图1为本发明实施例基于三维组学数据的西藏特色鱼类基因组组装方法流程示意图;
图2为实施例1中黄斑褶鮡基因组组装结果示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明基于三维组学数据的西藏特色鱼类基因组组装方法流程示意图,如图1所示,本发明提供的一种西藏特色鱼类基因组组装方法,包括对样本DNA提取及以下步骤:
S1:样本的Hi-C数据比对到初步基因组contig序列中并计算获得contig序列的染色体分布、contig之间的排序和方向。具体地如:
S101:获取超长的西藏特色鱼类基因组测序片段。通过PacBio或者Nanopore测序技术,获得超长片段的西藏特色鱼类基因组的片段;
S102:使用短序列比对工具获得序列比对信息,并基于所述序列比对信息获得S101的超长基因组测序片段之间的overlap信息,从而构建序列关系图谱。利用daligner或者minimap等软件获得序列比对信息,得到S101中获得的超长测序片段之间的overlap信息,构建序列之间的串联关系网络;
S103:基于序列关系图谱构建初步基因组contig序列。利用S102的序列关系图谱构建初步基因组contig序列。使用Falcon或者Canu等软件,通过测序片段之间的序列关系网络,构建最优的contig序列集;
S104:基于西藏特色鱼类待测样本Hi-C测序数据获得contig序列之间的位置关系、利用contig序列位置关系信息明确contig序列之间的空缺信息。
S2:填补contig序列之间的空缺。利用S102中获得的序列关系图谱,填补S104中寻找到的序列之间的空缺获得高质量的西藏特色鱼类基因组编码信息。
具体地,S102的短序列比对工具可以为daligner、minimap等软件。当采用daligner比对时,序列纠错阶段的参数为:pa_HPCdaligner_option=-v-B10-t16-e.70-l1000-s1000-T12;纠错后序列比对参数为:ovlp_HPCdaligner_option=-v-B10-t32-h60-e.96-l500-s1000-T12。按照上述方法设置软件参数时,基于PacBio三代长片段测序的基因组组装质量及后续的经Hi-C数据提升后的基因组装质量最优。
具体地,S104中基于西藏特色鱼类待测样本Hi-C测序数据获得contig序列之间的位置关系的具体操作为:使用Bowtie v1.0通过迭代比对的方法,将Hi-C测序数据通过允许空缺的方式比对到初步基因组contig序列上;基于比对结果,使用hiclib方法计算contig序列之间的互作频率;通过互作频率信息,使用3D-DNA确定contig序列的染色体分布、contig之间的排序和方向。其中Bowtie软件参数为-f-a-m 20-v 1时后续的经Hi-C数据提升后的基因组装质量最优。
为了进一步提升西藏特色鱼类基因组组装质量,填补contig序列之间的空缺后,补齐的序列继续进行去冗余等操作,对整个基因组进行升级整理,获得高质量的西藏特色鱼类复杂基因组的参考序列。
为了进一步的验证本方法的实用性,研究人员以一种西藏高原特有鱼类黄斑褶鮡作为研究对象进行测序、基因组组装,并进行了结果表征。
实施例1
1、实验材料预处理
本实验采用一种西藏高原特有鱼类黄斑褶鮡作为研究对象。从西藏雅江野外捕获的雌性黄斑褶鮡成鱼。记录基本的性状指标后,取黄斑褶鮡肌肉组织用液氮速冻一小时,并放于-80℃冰箱保存。
2、黄斑褶鮡DNA提取与高通测序
利用苯酚法提取黄斑褶鮡的DNA,具体方法是:将黄斑褶鮡肌肉组织样品进行液氮研磨至粉状。加入1ml消化液,于37℃下静置5小时。待冷却到室温,取0.5ml苯酚混合进行4000×g离心10min,吸出水相。加入由苯酚、氯仿和异戊醇组成的DNA提取混合液(苯酚、氯仿和异戊醇体积比为25:24:1)0.5ml再提取两次,提取水相并加入NaCl至浓度0.3M。加入乙醇,进行3000×g离心15min后,使用70%乙醇漂洗二次,吸出上清液,晾干。粉末样本在TE中在悬浮,加入NaCl至100mM,加入RNA酶A至浓度100ug/ml,并于37℃下保持3hr后,加入SDS至最终浓度0.2%。获得的DNA样品在260nm下测定OD值已确定浓度,并置于-20℃环境下保存。
将上述操作获得的DNA样品使用PacBio测序平台推荐的方法进行测序文库构建,并使用PacBio Sequel测序平台进行测序,获得约70Gb长片段测序数据,序列平均读长达到11kb,测序序列N50达到13kb。
3、黄斑褶鮡肌肉组织Hi-C建库测序
取新鲜肌肉组织,使用细胞筛获得细胞悬浮液。使用37%甲醛进行甲醛处理。使用SDS、Triton处理以后,离心去除上清,用限制性内切酶Buffer重悬沉淀物,加入不同用量的限制性内切酶HindⅢ-HF,在37℃于旋转混匀仪上酶切过夜。在酶切结束以后,选择低温23℃进行末端补平标记。补平产物4℃低温500g离心2min,去上清,沉淀用1×T4 DNA LigaseBuffer重悬,按照1~2Cohesive unit/μL的连接酶用量在250μL连接体系中进行平末端连接,16℃连接4~8h。连接产物加入终浓度200mmol/L的NaCl、1μg/μL的蛋白酶K,65℃解交联过夜、RNase A处理去除RNA,乙醇沉淀回收DNA,经QIAGEN DNA回收试剂盒再次纯化后,NanoDrop ND-1000测浓度。分别取基因组DNA、限制性酶切产物、连接产物等电泳,通过条带大小等进行酶切、连接效果的检测与质量控制。在低温12℃以及底物核苷酸不完全等条件下,优先激活T4DNA聚合酶的外切酶活性。Hi-C样品经过超声破碎、片段断裂成200~300bp大小的DNA,样品经琼脂糖凝胶电泳缓慢分离、切胶回收、QIAGEN DNA回收试剂盒纯化、NanoDrop ND-1000定量。使用预洗过的Streptavidin C1 beads通过混匀、磁力架富集、去上清、洗涤再富集等步骤,回收带生物素标记的DNA。为了便于缓冲体系的转换,在捕获有DNA的磁珠上进行末端修复、加“A”与Adapter连接等后续步骤。取不同量的Hi-C文库模板,使用KAPA HiFi聚合酶进行固定10个循环的PCR扩增,扩增产物经电泳、切胶纯化后得到Hi-C文库。
构建好的Hi-C文库经过质量检测,利用高通量测序技术对Hi-C library包含样品进行双末端测序。共获得60Gb的Hi-C测序数据。
4、基于PacBio三代长片段测序的基因组组装
本实施例分别使用Falcon和canu两种方法对PacBio测序平台获得的测序数据进行三代基因组组装,组装过程分为三步,分别是1)使用daligner进行序列纠错、2)获得序列的比对信息构建序列关系图谱和3)序列组装。
在序列纠错阶段,取15kb作为阈值,将15kb以下的序列比对到15kb以上的序列上,利用比对结果进行纠错,获得长片段的纠错序列。本实施例比对阶段使用daligner进行比对,序列纠错阶段的参数为:pa_HPCdaligner_option=-v-B10-t16-e.70-l1000-s1000-T12,纠错后序列比对参数为:ovlp_HPCdaligner_option=-v-B10-t32-h60-e.96-l500-s1000-T12。利用纠错序列进行比对,过滤掉长度低于1kb的比对结果,构建序列之间的序列关系图谱。最后使用序列关系图谱信息构建最长的序列路径,获得初步基因组contig序列。
5、基于Hi-C数据的contig关系构建
使用Bowtie v1.0通过迭代比对的方法,将Hi-C测序数据通过允许空缺的方式比对到上述Falcon组装的contig序列上,具体Bowtie软件参数为:-f-a-m 20-v 1。基于比对结果,使用hiclib的方法计算contig序列之间的互作频率。通过互作频率信息,使用3D-DNA确定contig序列的染色体分布、contig之间的排序和方向,从而确定相邻contig序列的空缺区域。
6、利用contig之间的序列网络,填充contig之间的空缺
获得contig之间的排序和方向关系之后,利用contig前后的序列之间的序列关系图谱,使用gapCloser将序列填充到Falcon组装的contig序列之间的空缺,从而延伸contig序列到更长的范围,提升组装的连续性。
结果分析:
将本发明的方法获得的基因组组装结果与和Falcon、canu组装结果进行对比可知(如图2所示),本发明的方法组装黄斑褶鮡基因组750Mb,其中canu组装、Falcon组装contigN50长度分别为1.1Mb、1.3Mb,而通过Hi-C数据进行组装提升后,contig N50长度达到4.5Mb。由此可知,本发明的方法显著地提高了组装结果中contig水平的连续性,从而提升特色西藏鱼类复杂基因组组装的质量。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (5)

1.一种基于三维组学数据的西藏特色鱼类基因组组装方法,其特征在于,将西藏特色鱼类待测样本的Hi-C测序数据比对到该待测样本初步基因组contig序列中获得contig序列之间的位置关系,然后填补contig序列之间的空缺获得高质量的西藏特色鱼类基因组编码信息;具体包括:
(1)获取超长的西藏特色鱼类基因组测序片段;
(2)使用短序列比对工具获得序列比对信息,并基于所述序列比对信息获得步骤(1)的超长基因组测序片段之间的overlap信息,从而构建序列关系图谱;
(3)基于序列关系图谱构建初步基因组contig序列;
(4)基于西藏特色鱼类待测样本Hi-C测序数据获得contig序列之间的位置关系;
填补contig序列之间的空缺;
基于西藏特色鱼类待测样本Hi-C测序数据获得contig序列之间的位置关系的具体操作为:使用Bowtie v1.0 通过迭代比对的方法,将Hi-C测序数据通过允许空缺的方式比对到初步基因组contig序列上;基于比对结果,使用hiclib方法计算contig序列之间的互作频率;通过互作频率信息,使用3D-DNA确定contig序列的染色体分布、contig之间的排序和方向。
2.根据权利要求1所述的一种基于三维组学数据的西藏特色鱼类基因组组装方法,其特征在于,所述步骤(2)的短序列比对工具为daligner或者minimap。
3.根据权利要求2所述的一种基于三维组学数据的西藏特色鱼类基因组组装方法,其特征在于,采用daligner比对时,序列纠错阶段的参数为:pa_HPCdaligner_option = -v -B10 -t16 -e.70 -l1000 -s1000 -T12;纠错后序列比对参数为:ovlp_HPCdaligner_option = -v -B10 -t32 -h60 -e.96 -l500 -s1000 -T12。
4.根据权利要求1所述的一种基于三维组学数据的西藏特色鱼类基因组组装方法,其特征在于,所述Bowtie软件参数为:-f -a -m 20 -v 1。
5.根据权利要求1所述的一种基于三维组学数据的西藏特色鱼类基因组组装方法,所述方法还包括将填补后的序列进行去冗余操作及对整个基因组进行升级整理。
CN202010399433.4A 2020-05-12 2020-05-12 一种基于三维组学数据的西藏特色鱼类基因组组装方法 Active CN111584004B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010399433.4A CN111584004B (zh) 2020-05-12 2020-05-12 一种基于三维组学数据的西藏特色鱼类基因组组装方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010399433.4A CN111584004B (zh) 2020-05-12 2020-05-12 一种基于三维组学数据的西藏特色鱼类基因组组装方法

Publications (2)

Publication Number Publication Date
CN111584004A CN111584004A (zh) 2020-08-25
CN111584004B true CN111584004B (zh) 2023-06-27

Family

ID=72126572

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010399433.4A Active CN111584004B (zh) 2020-05-12 2020-05-12 一种基于三维组学数据的西藏特色鱼类基因组组装方法

Country Status (1)

Country Link
CN (1) CN111584004B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112289382B (zh) * 2020-10-28 2023-02-24 天津诺禾致源生物信息科技有限公司 多倍体基因组同源染色体的拆分方法、装置及其应用
CN113151426A (zh) * 2021-04-16 2021-07-23 中国农业科学院兰州畜牧与兽药研究所 一种基于三代PacBio和Hi-C技术组装和注释霍巴藏绵羊基因组的方法
CN114464260B (zh) * 2021-12-29 2023-09-26 上海诺禾致源医学检验实验室有限公司 染色体水平基因组的组装方法和组装装置
CN115691673B (zh) * 2022-10-25 2023-08-15 广东省农业科学院蔬菜研究所 一种端粒到端粒的基因组组装方法
CN115810395B (zh) * 2022-12-05 2023-09-26 武汉贝纳科技有限公司 一种基于高通量测序动植物基因组t2t组装方法
CN117153270B (zh) * 2023-10-30 2024-02-02 吉林华瑞基因科技有限公司 一种基因二代测序数据处理方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104726558A (zh) * 2015-02-07 2015-06-24 红河学院 一种巨魾鱼线粒体全基因组测序的方法
CN105046105A (zh) * 2015-07-09 2015-11-11 天津诺禾医学检验所有限公司 染色体跨度的单体型图及其构建方法
CN105420375A (zh) * 2015-12-24 2016-03-23 北京大学 一种环境微生物基因组草图的构建方法
CN106947827A (zh) * 2017-05-09 2017-07-14 中国科学院水生生物研究所 一种获得鳙性别特异分子标记及其筛选方法和应用
CN107058298A (zh) * 2017-06-06 2017-08-18 中国海洋大学 一种基于人工减数分裂的辅助基因组组装方法
CN109326323A (zh) * 2018-09-13 2019-02-12 北京百迈客生物科技有限公司 一种基因组的组装方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017214461A1 (en) * 2016-06-08 2017-12-14 The Broad Institute, Inc. Linear genome assembly from three dimensional genome structure

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104726558A (zh) * 2015-02-07 2015-06-24 红河学院 一种巨魾鱼线粒体全基因组测序的方法
CN105046105A (zh) * 2015-07-09 2015-11-11 天津诺禾医学检验所有限公司 染色体跨度的单体型图及其构建方法
CN105420375A (zh) * 2015-12-24 2016-03-23 北京大学 一种环境微生物基因组草图的构建方法
CN106947827A (zh) * 2017-05-09 2017-07-14 中国科学院水生生物研究所 一种获得鳙性别特异分子标记及其筛选方法和应用
CN107058298A (zh) * 2017-06-06 2017-08-18 中国海洋大学 一种基于人工减数分裂的辅助基因组组装方法
CN109326323A (zh) * 2018-09-13 2019-02-12 北京百迈客生物科技有限公司 一种基因组的组装方法及装置

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
Integrating Hi-C links with assembly graphs for chromosome-scale assembly;Ghurye J等;《PLoS computational biology》;第15卷(第8期);1-19 *
全基因组测序在重要家畜上的研究进展;李晓凯等;《生物技术通报》;第34卷(第6期);11-21 *
基于2b-RAD技术的辅助基因组组装和标记分型研究;窦锦壮;《中国博士学位论文全文数据库 (基础科学辑)》(第10期);A006-17 *
复杂基因组测序技术研究进展;高胜寒等;《遗传》(地11期);24-43 *
西伯利亚白刺基因组信息初探;朱礼明等;《林业科学研究》(第1期);144-151 *
金针菇基因组测序与组装策略分析;徐伟南等;《菌物学报》;第37卷(第12期);1578-1585 *

Also Published As

Publication number Publication date
CN111584004A (zh) 2020-08-25

Similar Documents

Publication Publication Date Title
CN111584004B (zh) 一种基于三维组学数据的西藏特色鱼类基因组组装方法
CN107385059B (zh) 一种与肉鸡生长性状相关的分子标记及其应用
CN105368930B (zh) 测序基因分型技术中测序酶切组合的确定方法
CN113463202B (zh) 一种新的rna高通量测序的方法、引物组和试剂盒及其应用
CN113308562A (zh) 棉花全基因组40k单核苷酸位点及其在棉花基因分型中的应用
CN113789394B (zh) 一种鉴定三疣梭子蟹氨氮耐受性状的分子标记c13及其应用
CN110042148A (zh) 一种高效获取叶绿体dna测序数据的方法及其应用
CN106755371A (zh) 利用pcr‑rflp检测绵羊pcnp基因单核苷酸多态性的方法及其应用
CN112481402B (zh) 一种基于Sanger测序的结核分枝杆菌MLST分型检测用引物组及其应用
CN107937395B (zh) 一种远海梭子蟹多态性微卫星分子标记及鉴定方法与应用
CN110564867B (zh) 一种秦川牛cfl1基因的snp分子标记及其检测方法
CN113801945B (zh) 一种鉴定三疣梭子蟹氨氮耐受性状的分子标记c768及其应用
CN108998538A (zh) 一种斑鰶snp标记及其筛选方法和应用
CN109584956A (zh) 一种利用iib型限制性内切酶进行微生物群落鉴定的方法
CN106701930B (zh) 利用pcr-sscp检测绵羊fth-1基因插入缺失多态性的方法及其应用
CN110343741B (zh) 一种基于双酶切的简化基因组测序文库的构建方法
CN113584187A (zh) 一种用于筛选具有耐低温性状的日本对虾的分子标记a2629及其扩增引物和应用
CN107354151A (zh) 基于梅花鹿全基因组开发的str分子标记及其应用
CN111564180A (zh) 一种鮡科鱼类古染色体进化比较分析的方法
CN111647680A (zh) 基于二代高通量测序的全基因组水平对苔草品种快速鉴定和溯源的方法
CN113684280A (zh) 一种仿刺参抗高温育种低密度12k snp芯片及应用
CN108642199B (zh) 与谷子旗叶长性状相关的snp标记及其检测引物和应用
CN117701780B (zh) 汉滩病毒全基因组靶向捕获引物组及其应用
CN113930518B (zh) 一种鉴定三疣梭子蟹氨氮耐受性状的分子标记c49及其应用
CN114561484B (zh) 一种扩增水稻产量相关基因位点的多重pcr引物组合及其试剂盒

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant