CN112481413B - 基于二代和三代测序技术的植物线粒体基因组组装方法 - Google Patents

基于二代和三代测序技术的植物线粒体基因组组装方法 Download PDF

Info

Publication number
CN112481413B
CN112481413B CN202110043700.9A CN202110043700A CN112481413B CN 112481413 B CN112481413 B CN 112481413B CN 202110043700 A CN202110043700 A CN 202110043700A CN 112481413 B CN112481413 B CN 112481413B
Authority
CN
China
Prior art keywords
sequence
generation
generation sequencing
mitochondrial genome
genome
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110043700.9A
Other languages
English (en)
Other versions
CN112481413A (zh
Inventor
高海东
周向阳
徐雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Jisi Huiyuan Biotechnology Co.,Ltd.
Nanjing xinpuhua Biotechnology Co., Ltd
Original Assignee
Nanjing Xinpuhua Biotechnology Co ltd
Nanjing Jisi Huiyuan Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Xinpuhua Biotechnology Co ltd, Nanjing Jisi Huiyuan Biotechnology Co ltd filed Critical Nanjing Xinpuhua Biotechnology Co ltd
Priority to CN202110043700.9A priority Critical patent/CN112481413B/zh
Publication of CN112481413A publication Critical patent/CN112481413A/zh
Application granted granted Critical
Publication of CN112481413B publication Critical patent/CN112481413B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Analytical Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Botany (AREA)
  • Mycology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种基于二代和三代测序技术的植物线粒体基因组组装方法,对样品DNA进行二代测序和三代测序,利用二代测序数据进行三代数据的校正;利用构建好的植物线粒体编码基因数据库,使用此植物线粒体编码基因数据库中所有参考序列比对第(3)步校正得到的三代序列数据集,获取seed序列进行下一步分析;对seed序列进行延伸,获取全长的线性线粒体基因组DNA序列,对线性线粒体基因组DNA序列进行环化,获取环状线粒体基因组DNA序列。本发明组装方法能够快速地从三代测序数据中得到完整的植物线粒体基因组序列,适用于大部分植物线粒体基因组。

Description

基于二代和三代测序技术的植物线粒体基因组组装方法
技术领域
本发明涉及一种基于二代和三代测序技术的植物线粒体基因组组装方法。
背景技术
随着二代和三代测序技术的发展,通量提高和测序成本的快速下降,极大的推动了线粒体基因组学的发展。
植物线粒体(mitochondrion)是一种存在于大多数植物细胞中的由两层膜包被的细胞器,是细胞进行有氧呼吸的主要场所,被称为"power house"。
植物线粒体基因组结构和大小是高度变化的,通常植物线粒体基因组是一个单链环状DNA分子结构,如拟南芥、西瓜;也有植物线粒体基因组以线性DNA分子存在,如水稻等;此外线粒体基因组中存在多元环状的情况,例如蝇子草中存在59个环状DNA序列,包括1个主环和58个小环。高等植物在所有已知的高等生物中拥有最大的线粒体,从200kb到11M变化不等。同一物种线粒体基因组大小差异主要是由重复序列尤其是基因区的非编码序列引起的。线粒体基因组的进化方式主要靠内部重组和外部重组,内部重组即是由于复杂而引起的内部重排,是序列获得和缺失的主要原因;外部重组是指核、叶绿体、类质体以及未知来源的序列整合到植物线粒体基因组导致的重组。
传统的获取线粒体基因组的方法是通过Long-range PCR对植物线粒体基因组进行扩增和Sanger测序,最后对测序得到的不同片段进行拼接得到完整的植物线粒体基因组。但该方法成本高,效率低。
而现有的通过高通量测序方法进行植物线粒体基因组组装的软件和方法,只能解决一部分的高等生物线粒体组装问题,比如使用目前已开发的线粒体组装工具,只能获取高等植物线粒体基因组线性序列,不能成环,而且得到的序列普遍存在不完整的现象。
发明内容
本发明的目的在于提供一种基于二代和三代测序技术的植物线粒体基因组组装方法,拼接完整度高,可以获取完整的环状植物线粒体基因组序列。
本发明的目的通过以下技术方案实现:
一种基于二代和三代测序技术的植物线粒体基因组组装方法,其步骤包括:
(1)对样品DNA进行二代测序,得到Clean reads;
(2)对样品DNA进行三代测序,得到Clean reads;
(3)利用二代测序数据进行三代数据的校正;
(4)利用构建好的植物线粒体编码基因数据库,使用此植物线粒体编码基因数据库中所有参考序列比对第(3)步校正得到的三代序列数据集,使用的比对软件是blast(v2.10.1+),evalue阈值设置为10-10、相似度和覆盖度均大于70%,记录比对上的编码基因名称信息,挑选比对上的最长的一条序列作为seed序列,获取得到的seed序列进行下一步分析;其中植物线粒体基因数据库是从美国国家生物技术信息中心(NCBI)中下载目前已发表的所有植物线粒体基因组基因,用来构建参考序列数据库,数据库需要定期更新,通常每个月更新一次;
(5)对seed序列进行延伸,得到候选的线粒体基因组DNA序列(延伸方法请见补充),再使用mumer将步骤(4)获取的植物线粒体编码基因序列数据比对候选的线粒体基因组DNA序列,查看比对上的基因数量以及比对上的完整度,判断标准:比对上的编码基因数量不能有缺失,编码基因长度要完整;如果基因数量有缺失,则可能是多结构引起的片段丢失,把包含缺失基因的最长三代测序数据序列进行单独延伸,然后融合到已有的候选序列中(如果无法融合,则遗弃该基因)。对候选的线性线粒体基因组DNA序列进行环化,获取环状线粒体基因组DNA序列,称为pseudo genome序列;
(6)检查步骤:将校正后的三代测序数据使用minimap2比对到pseudo genome序列上,然后筛选比对上的长度大于3kb的测序数据,然后使用mumer查看比对上的三代测序数据和pseudo genome的共线性情况,判断所有比对上的三代测序数据是否均出现在pseudogenome路径上,如果是,则线粒体基因组组装完整;如果在同一位置存在三代测序数据某些序列前端无法比对上且同时存在某些序列后端无法比对上pseudo genome上,则该处存在由于多结构导致的片段丢失,需要对该处存在的序列使用三代测序数据进行延伸,填补缺失的序列。
优选的,步骤(5)中延伸方法为:设置overlap>600,相似度>95,由于线粒体基因组序列存在多结构情况,延伸过程中如果遇到分支,保留所有分支情况,并对分支进行延伸,得到多条contig序列,然后使用三代测序数据和contig之间用overlap进行连接,将所有contig连接成一条序列,从而获取初步的植物线粒体基因组DNA序列。
优选的,还包括步骤(7):使用NextPolish软件用三代测序数据对步骤(6)得到的植物线粒体基因组DNA序列进行polish,然后使用pilon软件用二代测序数据对三代测序数据校正完成的植物线粒体基因组DNA序列进一步polish,得到最终的基因组组装结果。
优选的,还包括步骤(8):如果测序数据量达到标准,且线性线粒体基因组DNA序列无法环化,则判定此物种为线性基因组序列。测序数据量标准为植物线粒体基因组覆盖度10X以上。
优选的,步骤(5)中环化方法为:检测到植物线粒体基因组序列末尾延伸的过程中与序列开头有重叠,即可判断该序列成环状,将该序列的首尾相连,生成环状结构。具体而言,重叠的具体长度视开头和结尾的contig长度而定,因为线粒体一般都是环状序列,得到的线性序列开头和结尾的序列肯定会有重叠,如若不然,线粒体基因组序列要么是延伸错误,要么此物种线粒体基因组是线性序列而非环状序列。发现重叠序列后,根据开头和结尾的序列产生交叠的部分来确定线粒体基因组环状结构。
优选的,步骤(1)中二代测序采用Illumina公司的PE150二代测序Novaseq6000平台,并用fastp软件去除二代数据中的低质量序列。
优选的,步骤(3)中使用LorDEC软件用二代测序数据进行三代数据的校正(1)
本发明组装方法能够快速地从二代+三代测序数据中得到完整的植物线粒体基因组DNA序列,适用于大部分植物线粒体基因组,从而推动了基于线粒体基因组数据在相关领域的研究和应用,例如系统发育演化、谱系遗传学,种群遗传结构等。
附图说明
图1是实施例1得到的铃铛子线粒体基因组的结构。
图2 是本发明的流程示意图。
具体实施方式
以下是结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
本基于二代和三代测序技术的植物线粒体基因组组装方法,其步骤包括:
(1)对铃铛子样品DNA进行二代Novaseq6000平台测序,并使用fastp软件过滤得到clean data数据,过滤标准为平均质量值大于5;
(2)对样品DNA进行三代nanopore平台测序,得到Clean reads;
(3)使用二代测序数据和LorDEC软件对三代测序数据进行校正,获取高质量的三代测序数据;
(4)利用构建好的植物线粒体编码基因数据库,使用此植物线粒体编码基因数据库中所有参考序列比对第(3)步校正得到的三代序列数据集,使用的比对软件是blast(v2.10.1+),evalue阈值设置为10-10、相似度和覆盖度均大于70%,记录比对上的编码基因名称信息,挑选比对上的最长的一条序列作为seed序列,获取得到的seed序列进行下一步分析;其中植物线粒体基因数据库是从美国国家生物技术信息中心(NCBI)中下载目前已发表的所有植物线粒体基因组基因,用来构建参考序列数据库,并且数据库进行定时更新;
(5)对seed序列进行延伸,得到候选的铃铛子线粒体基因组DNA序列(延伸方法请见补充),再使用mumer将步骤(4)获取的植物线粒体编码基因序列数据比对候选的铃铛子线粒体基因组DNA序列,查看比对上的基因数量以及比对上的完整度,判断标准:比对上的编码基因数量不能有缺失,编码基因长度要完整;如果基因数量有缺失,则可能是多结构引起的片段丢失,把包含缺失基因的最长三代测序数据序列进行单独延伸,然后融合到已有的铃铛子候选序列中(如果无法融合,则遗弃该基因)。对候选的铃铛子线性线粒体基因组DNA序列进行环化,获取环状铃铛子线粒体基因组DNA序列,称为铃铛子pseudo genome序列。
(6)检查步骤:将校正后的三代测序数据使用minimap2比对到铃铛子pseudogenome序列上,然后筛选比对上的长度大于3kb的测序数据,然后使用mumer查看比对上的三代测序数据和铃铛子pseudo genome的共线性情况,发现所有比对上的三代测序数据均出现在铃铛子pseudo genome路径上,铃铛子线粒体基因组组装完整。
(7)使用NextPolish软件用三代测序数据对步骤(6)得到的铃铛子植物线粒体基因组DNA序列进行polish,然后使用pilon软件用二代测序数据对三代测序数据校正完成的铃铛子植物线粒体基因组DNA序列进一步polish,得到最终的基因组组装结果。
对于线状线粒体基因组DNA序列,如果在步骤(5)中无法环化,且测序数据量达到标准,则判定此物种为线性基因组序列。测序数据量标准为植物线粒体基因组覆盖度10X(即此物种线粒体基因组大小的10倍数据量)以上。
参考文献:
1、L. Salmela, E. Rivals. (2014) LoRDEC: accurate and efficient longread error correction Bioinformatics, 30 (24): 3506-3514, 2014.)。

Claims (6)

1.一种基于二代和三代测序技术的植物线粒体基因组组装方法,其步骤包括:
(1)对样品DNA进行二代测序,所述样品DNA含有该样品的线粒体基因组序列,得到Clean reads;
(2)对样品DNA进行三代测序,所述样品DNA含有该样品的线粒体基因组序列,得到Clean reads;
(3)利用二代测序数据进行三代数据的校正;
(4)利用已发表的植物线粒体基因组基因构建植物线粒体编码基因数据库,使用上述植物线粒体编码基因数据库中所有参考序列比对第(3)步校正得到的三代序列数据集,使用的比对软件是blast,evalue阈值设置为10-10、相似度和覆盖度均大于70%,记录比对上的编码基因名称信息,挑选比对上的最长的一条序列作为seed序列,进行下一步分析;
(5)对seed序列进行延伸,得到候选的线粒体基因组DNA序列,再使用mumer将步骤(4)获取的植物线粒体编码基因序列数据比对候选的线粒体基因组DNA序列,查看比对上的基因数量以及比对上的完整度,判断标准:比对上的编码基因数量不能有缺失,编码基因长度要完整;如果基因数量有缺失,则把包含缺失基因的最长三代测序数据序列进行单独延伸,然后融合到已有的候选序列中,如果无法融合,则遗弃该基因;对候选的线性线粒体基因组DNA序列进行环化,获取环状线粒体基因组DNA序列,称为pseudo genome序列;
(6)检查步骤:将校正后的三代测序数据使用minimap2比对到pseudo genome序列上,然后筛选比对上的长度大于3kb的测序数据,然后使用mumer查看比对上的三代测序数据和pseudo genome的共线性情况,判断所有比对上的三代测序数据是否均出现在pseudogenome路径上,如果是,则线粒体基因组组装完整;如果在pseudo genome同一位置存在三代测序数据某些序列前端无法比对上、且同时存在三代测序数据某些序列后端无法比对上,则上述pseudo genome位置存在由于多结构导致的片段丢失,需要对上述pseudogenome位置存在的序列使用三代测序数据进行延伸,填补缺失的序列。
(7):使用NextPolish软件用三代测序数据对步骤(6)得到的植物线粒体基因组DNA序列进行polish,然后使用pilon软件用二代测序数据对三代测序数据校正完成的植物线粒体基因组DNA序列进一步polish,得到最终的基因组组装结果。
2.根据权利要求1所述的基于二代和三代测序技术的植物线粒体基因组组装方法,其特征在于:步骤(5)中延伸方法为:设置overlap>600,相似度>95,延伸过程中如果遇到分支,保留所有分支情况,并对分支进行延伸,得到多条contig序列,然后使用测序的reads和contig之间有overlap进行连接,将所有contig连接成一条序列,从而获取完整的植物线粒体基因组序列。
3.根据权利要求1所述的基于二代和三代测序技术的植物线粒体基因组组装方法,其特征在于:步骤(5)中环化方法为:检测到植物线粒体基因组序列末尾延伸的过程中与序列开头有重叠,即可判断该序列成环状,将该序列的首尾相连,生成环状结构。
4.根据权利要求1所述的基于二代和三代测序技术的植物线粒体基因组组装方法,其特征在于:还包括步骤(8):如果测序数据量达到标准,且线性线粒体基因组DNA序列无法环化,则判定此物种为线性基因组序列。
5. 根据权利要求1-4中任一项所述的基于二代和三代测序技术的植物线粒体基因组组装方法,其特征在于: 步骤(1)中二代测序采二代Novaseq6000平台,并用fastp软件去除二代数据中的低质量序列。
6.根据权利要求5所述的基于二代和三代测序技术的植物线粒体基因组组装方法,其特征在于:步骤(3)中使用LorDEC软件用二代测序数据进行三代数据的校正。
CN202110043700.9A 2021-01-13 2021-01-13 基于二代和三代测序技术的植物线粒体基因组组装方法 Active CN112481413B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110043700.9A CN112481413B (zh) 2021-01-13 2021-01-13 基于二代和三代测序技术的植物线粒体基因组组装方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110043700.9A CN112481413B (zh) 2021-01-13 2021-01-13 基于二代和三代测序技术的植物线粒体基因组组装方法

Publications (2)

Publication Number Publication Date
CN112481413A CN112481413A (zh) 2021-03-12
CN112481413B true CN112481413B (zh) 2022-02-15

Family

ID=74912200

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110043700.9A Active CN112481413B (zh) 2021-01-13 2021-01-13 基于二代和三代测序技术的植物线粒体基因组组装方法

Country Status (1)

Country Link
CN (1) CN112481413B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105506103A (zh) * 2015-12-28 2016-04-20 天津中医药大学 线粒体基因组扩增的通用引物混合物及其设计和扩增方法
CN105637099A (zh) * 2013-08-23 2016-06-01 考利达基因组股份有限公司 使用短读段的长片段从头组装
CN107287333A (zh) * 2017-08-03 2017-10-24 华子昂 一种人类线粒体全长单倍型测定及遗传变异分析方法
CN109280700A (zh) * 2018-09-17 2019-01-29 上海海洋大学 精确测定中华绒螯蟹线粒体全基因组序列的方法
CN109411014A (zh) * 2018-10-09 2019-03-01 中国科学院昆明植物研究所 一种基于二代测序的植物叶绿体全基因组组装成环方法
WO2020056451A1 (en) * 2018-09-21 2020-03-26 Garvan Institute Of Medical Research Phenotypic and molecular characterisation of single cells

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105653899B (zh) * 2014-09-30 2018-02-09 深圳华大基因研究院 同时确定多种样本的线粒体基因组序列信息的方法和系统
WO2019116119A1 (en) * 2017-12-13 2019-06-20 King Abdullah University Of Science And Technology Deepsimulator method and system for mimicking nanopore sequencing
CN111286504A (zh) * 2018-11-21 2020-06-16 中国农业科学院油料作物研究所 调控油菜种子含油量的基因orf188

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105637099A (zh) * 2013-08-23 2016-06-01 考利达基因组股份有限公司 使用短读段的长片段从头组装
CN105506103A (zh) * 2015-12-28 2016-04-20 天津中医药大学 线粒体基因组扩增的通用引物混合物及其设计和扩增方法
CN107287333A (zh) * 2017-08-03 2017-10-24 华子昂 一种人类线粒体全长单倍型测定及遗传变异分析方法
CN109280700A (zh) * 2018-09-17 2019-01-29 上海海洋大学 精确测定中华绒螯蟹线粒体全基因组序列的方法
WO2020056451A1 (en) * 2018-09-21 2020-03-26 Garvan Institute Of Medical Research Phenotypic and molecular characterisation of single cells
CN109411014A (zh) * 2018-10-09 2019-03-01 中国科学院昆明植物研究所 一种基于二代测序的植物叶绿体全基因组组装成环方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
Assembly and comparative analysis of the complete mitochondrial genome sequence of Sophora japonica "JinhuaiJ2";Yancai Shi等;《PLoS One》;20180816;第13卷(第3期);第1页摘要,第3页第3段-第4页第1段,第14页第2段,图1 *
Assembly of the Mitochondrial Genome in the Campanulaceae Family Using Illumina Low-Coverage Sequencing;Hyun-Oh Lee;《Genes (Basel)》;20180730;第9卷(第8期);第2页第3段-第3页第1段,图1 *
Evolution and Diversification of Kiwifruit Mitogenomes through Extensive Whole-Genome Rearrangement and Mosaic Loss of Intergenic Sequences in a Highly Variable Region;Shuaibin Wang等;《Genome Biol Evol》;20190321;第11卷(第4期);第1193页右栏第4-第1194页左栏第3段 *
GetOrganelle: a fast and versatile toolkit for accurate de novo assembly of organelle genomes;Jian-Jun Jin等;《Genome Biol》;20200910;第21卷(第1期);第1-31页 *
NOVOPlasty: de novo assembly of organelle genomes from whole genome data;Nicolas Dierckxsens等;《Nucleic Acids Res.》;20161024;第45卷(第4期);第1-9页 *
叶绿体基因组_二代测序组装;穆易⻘;《CSND-blog》;20200818;第1页1-7 *

Also Published As

Publication number Publication date
CN112481413A (zh) 2021-03-12

Similar Documents

Publication Publication Date Title
Gallaher et al. High‐throughput sequencing of the chloroplast and mitochondrion of Chlamydomonas reinhardtii to generate improved de novo assemblies, analyze expression patterns and transcript speciation, and evaluate diversity among laboratory strains and wild isolates
Patwardhan et al. Molecular markers in phylogenetic studies-a review
Michael et al. Comprehensive definition of genome features in Spirodela polyrhiza by high‐depth physical mapping and short‐read DNA sequencing strategies
Qiu et al. The genome of Populus alba x Populus tremula var. glandulosa clone 84K
CN105112435B (zh) 植物多基因敲除载体的构建及应用
CN109207515A (zh) 一种设计和构建猪全基因组CRISPR/Cas9敲除文库的方法
Qi et al. The haplotype-resolved chromosome pairs of a heterozygous diploid African cassava cultivar reveal novel pan-genome and allele-specific transcriptome features
Wang et al. A draft genome assembly of halophyte Suaeda aralocaspica, a plant that performs C4 photosynthesis within individual cells
WO2015144045A1 (zh) 包含两个随机标记的质粒库及其在高通量测序中的应用
Rogers Integrated evolution of ribosomal RNAs, introns, and intron nurseries
Renganaath et al. Systematic identification of cis-regulatory variants that cause gene expression differences in a yeast cross
Zhang et al. Evolution of gene structural complexity: an alternative-splicing-based model accounts for intron-containing retrogenes
Wang et al. Comparative analysis of the mitochondrial genomes of Nicotiana tabacum: hints toward the key factors closely related to the cytoplasmic male sterility mechanism
Feng et al. Phasing analysis of the transcriptome and epigenome in a rice hybrid reveals the inheritance and difference in DNA methylation and allelic transcription regulation
CN112481413B (zh) 基于二代和三代测序技术的植物线粒体基因组组装方法
Hoang et al. De novo assembly and characterizing of the culm-derived meta-transcriptome from the polyploid sugarcane genome based on coding transcripts
CN112786109B (zh) 一种基因组完成图的基因组组装方法
CN112430586B (zh) 一种VI-B型CRISPR/Cas13基因编辑系统及其应用
CN106636065B (zh) 一种全基因组高效基因区富集测序方法
CN115691673A (zh) 一种端粒到端粒的基因组组装方法
CN112259169B (zh) 一种从转录组数据中快速获取叶绿体基因组的方法
CN109628447B (zh) 特异靶向羊友好位点H11的sgRNA及其编码DNA和应用
Li et al. A multiplexed, three-dimensional pooling and next-generation sequencing strategy for creating barcoded mutant arrays: construction of a Schizosaccharomyces pombe transposon insertion library
CN112786106A (zh) 一种植物线粒体基因组结构注释方法
Riaño-Pachón et al. Surveying the complex polyploid sugarcane genome sequence using synthetic long reads

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20220117

Address after: Room 545, building F7, No.9, Weidi Road, Xianlin University Town, Xianlin street, Qixia District, Nanjing City, Jiangsu Province, 210000

Applicant after: Nanjing Jisi Huiyuan Biotechnology Co.,Ltd.

Applicant after: Nanjing xinpuhua Biotechnology Co., Ltd

Address before: Room 545, building F7, No.9, Weidi Road, Xianlin University Town, Xianlin street, Qixia District, Nanjing City, Jiangsu Province, 210000

Applicant before: Nanjing Jisi Huiyuan Biotechnology Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant