CN105653893A - 一种基因组重测序分析系统及方法 - Google Patents

一种基因组重测序分析系统及方法 Download PDF

Info

Publication number
CN105653893A
CN105653893A CN201510997979.9A CN201510997979A CN105653893A CN 105653893 A CN105653893 A CN 105653893A CN 201510997979 A CN201510997979 A CN 201510997979A CN 105653893 A CN105653893 A CN 105653893A
Authority
CN
China
Prior art keywords
genome
resurveyed
sequence
script
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510997979.9A
Other languages
English (en)
Inventor
郑洪坤
孔关义
刘威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING BIOMARKER TECHNOLOGIES Co Ltd
Original Assignee
BEIJING BIOMARKER TECHNOLOGIES Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING BIOMARKER TECHNOLOGIES Co Ltd filed Critical BEIJING BIOMARKER TECHNOLOGIES Co Ltd
Priority to CN201510997979.9A priority Critical patent/CN105653893A/zh
Publication of CN105653893A publication Critical patent/CN105653893A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations

Abstract

本发明提供了一种基因组重测序分析系统及方法,所述系统包括:Web应用单元,用于接收基因组重测序数据和基因组重测序参数;Java交互单元,用于根据所述Web应用单元接收的基因组重测序参数,生成基因组重测序任务信息;分析单元,用于根据所述Java交互单元生成的基因组重测序任务信息,读取所述基因组重测序数据,并通过调用生物信息学软件库和脚本库,对所述基因组重测序数据进行分析,获取基因组重测序分析结果。本发明通过调用生物信息学软件和个性化分析脚本库,简化基因组重测序分析流程,提高基因组重测序效率,节省了科研成本。此外,本发明还具有保存基因组重测序分析结果,进行二次查询的功能。

Description

一种基因组重测序分析系统及方法
技术领域
本发明涉及生物信息分析技术领域,尤其涉及一种基因组重测序分析系统及方法。
背景技术
生物信息学(Bioinformatics)是研究生物信息的采集、处理、存储、传播,分析和解释等各方面的学科,也是随着生命科学和计算机科学的迅猛发展,生命科学和计算机科学相结合形成的一门新学科。它通过综合利用生物学,计算机科学和信息技术而揭示大量而复杂的生物数据所赋有的生物学奥秘。
基因组重测序是对已知基因组序列的物种进行不同个体的基因组测序,并在此基础上对个体或群体进行差异性分析。基因组重测序方向是生物信息学中比较重要的一个分支,已经广泛应用到了农学、医学等领域,并对育种和靶向治疗起到了极具意义的指导作用。
高通量测序技术(High-throughputsequencing)又称“下一代”测序技术("Next-generation"sequencingtechnology),以能一次并行对几十万到几百万条DNA分子进行序列测定和一般读长较短等为标志。高通量测序技术的出现使基因组学数据出现了指数型增长,海量数据的产生给生物信息学带来了极大的挑战,如何快速、高效、准确的完成数据分析,挖掘数据中的科学意义
发明内容
针对现有技术中的缺陷,本发明提供一种基因组重测序分析系统及方法,用于简化基因组重测序分析流程,提高基因组重测序效率,节省了科研成本。
第一方面,本发明提供一种基因组重测序分析系统,所述系统包括:
Web应用单元,用于接收基因组重测序数据和基因组重测序参数,并将所述基因组重测序参数发送至Java交互单元;
Java交互单元,用于根据所述Web应用单元接收的基因组重测序参数,生成基因组重测序任务信息,并将所述基因组重测序任务信息发送至分析单元;
分析单元,用于根据所述Java交互单元生成的基因组重测序任务信息,读取所述基因组重测序数据,并通过调用生物信息学软件库和脚本库,对所述基因组重测序数据进行分析,获取基因组重测序分析结果;
其中,所述生物信息学软件库,包括:BWA、samtools、GATK、picard、breakdancer、Control-FREEC、SnpEff和blast;
所述脚本库,包括:SNP检测脚本、InDel检测脚本、SV检测脚本、CNV检测脚本、功能注释脚本和绘图及统计脚本。
优选地,所述Java交互单元包括:
任务调度模块,用于根据所述Web应用单元接收的基因组重测序数据和基因组重测序参数,生成基因组重测序任务信息,并将所述基因组重测序任务信息发送至分析单元;
所述任务调度模块,在基因组重测序过程中,还用于实时监测基因组重测序任务的运行状态及进度。
优选地,所述Java交互单元还包括:
结果推送模块,用于在基因组重测序分析结束时,根据所述任务调度模块发送的展示指令,将所述分析单元获取的基因组重测序分析结果在Web应用单元进行呈现。
优选地,所述Java交互单元还包括:
数据库交互模块,用于在基因组重测序分析结束时,根据所述任务调度模块发送的存储指令,将所述分析单元获取的基因组重测序分析结果存储至数据库。
优选地,所述分析单元包括:
数据评估模块,用于对所述基因组重测序数据进行质量检测,并根据质量检测结果,判断所述基因组重测序数据是否可以进行基因组重测序;
其中,所述质量检测包括碱基质量分布检测和碱基类型分布检测。
优选地,所述分析单元还包括:
序列比对模块,用于将所述数据评估模块评估后的基因组重测序数据与参考基因组分别进行比对率统计、测序深度分布统计、插入片段分布统计,分别得到比对率、基因组覆盖深度、基因组覆盖度;
所述序列比对模块,还用于过滤评估后的基因组重测序数据中的重复序列,得到过滤后的基因组重测序数据。
优选地,所述分析单元还包括:
突变检测模块,用于通过调用所述生物信息学软件库和脚本库,对所述过滤后的基因组重测序数据进行突变检测分析;
其中所述突变检测分析包括单核苷酸多态性检测、插入缺失检测、结构变异检测和拷贝数变异检测。
优选地,所述突变检测模块还用于,
在突变检测分析过程中,对突变所在的基因组位置进行注释,所述基因位置包括基因区、基因间区和非翻译区。
优选地,所述分析单元还包括:
功能注释模块,在突变检测分析过程中,用于根据功能注释数据库,对突变基因进行功能注释;
其中,所述功能注释数据库包括GO、COG\KOG、Pfam、KEGG、NR、SWISS-PROT。
第二方面,本发明提供一种基因组重测序分析方法,所述方法包括:
接收基因组重测序数据和基因组重测序参数;
根据所述基因组重测序参数,生成基因组重测序任务信息;
根据所述基因组重测序任务信息,通过调用生物信息学软件库和脚本库,对所述基因组重测序数据进行分析,获取基因组重测序分析结果;
其中,所述生物信息学软件库,包括:BWA、samtools、GATK、picard、breakdancer、Control-FREEC、SnpEff和blast;
所述脚本库,包括:SNP检测脚本、InDel检测脚本、SV检测脚本、CNV检测脚本、功能注释脚本和绘图及统计脚本。
由上述技术方案可知,本发明提供了一种基因组重测序分析系统及方法,通过Web应用单元接收基因组重测序数据和基因组重测序参数,Java交互单元根据Web应用单元接收的基因组重测序参数,生成基因组重测序任务信息,分析单元根据Java交互单元生成的基因组重测序任务信息,读取所述基因组重测序数据,并通过调用生物信息学软件库和脚本库,对所述基因组重测序数据进行分析,获取基因组重测序分析结果。本发明通过调用生物信息学软件和个性化分析脚本库,简化基因组重测序分析流程,提高基因组重测序效率,节省了科研成本。此外,本发明还具有保存基因组重测序分析结果,进行二次查询的功能。
附图说明
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些图获得其他的附图。
图1为本发明一实施例提供的一种基因组重测序分析系统的结构示意图;
图2为本发明另一实施例提供的一种基因组重测序分析系统的结构示意图;
图3为本发明一实施例提供的一种基因组重测序分析方法的流程示意图;
图4为本发明一实施例中基因组重测序流程示意图。
具体实施方式
下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
以下对本发明实施例中提及的部分词语进行说明。
单核苷酸的多态性SNP(SingleNucleotidePolymorphism)是指在基因组上单个核苷酸的变异,包括转换、颠换、缺失和插入,形成的遗传标记,其数量很多,多态性丰富。
插入缺失标记InDel(InsertionandDeletion),指的是两种亲本中在全基因组中的差异,相对另一个亲本而言,其中一个亲本的基因组中有一定数量的核苷酸插入或缺失(Janderetal.,2002)。
结构变异SV(Structurevariation)是染色体变异的一种,是内因和外因共同作用的结果,外因有各种射线、化学药剂、温度的剧变等,内因有生物体内代谢过程的失调、衰老等。主要类型有缺失、重复、倒位、易位。
基因拷贝数变异CNV(Copynumbervariation),异常的DNA拷贝数变化(CNV)是许多人类疾病(如癌症、遗传性疾病、心血管疾病)的一种重要分子机制。
图1示出了本发明一实施例提供的一种基因组重测序分析系统的结构示意图,如图1所示,本实施例的一种基因组重测序分析系统10,包括:
Web应用单元11,用于接收基因组重测序数据和基因组重测序参数,并将所述基因组重测序参数发送至Java交互单元12;
Java交互单元12,用于根据所述Web应用单元11接收的基因组重测序参数,生成基因组重测序任务信息,并将所述基因组重测序任务信息发送至分析单元13;
分析单元13,用于根据所述Java交互单元12生成的基因组重测序任务信息,读取所述基因组重测序数据,并通过调用生物信息学软件库和脚本库,对所述基因组重测序数据进行分析,获取基因组重测序分析结果;
其中,所述生物信息学软件库,包括:BWA、samtools、GATK、picard、breakdancer、Control-FREEC、SnpEff和blast;
所述脚本库,包括:SNP检测脚本、InDel检测脚本、SV检测脚本、CNV检测脚本、功能注释脚本和绘图及统计脚本。
可以理解的是,基因组重测序是对已知基因组序列的物种进行不同个体的基因组测序,并在此基础上对个体或群体进行差异性分析。基因组重测序的个体,通过序列比对,可以找到大量的单核苷酸多态性位点SNP(SingleNucleotidePolymorphisms),插入缺失位点InDel(Insertion-Deletion)、结构变异位点SV(StructureVariation)位点。
现有技术中,重测序数据分析需要用到多款生物信息学软件,要对每款软件的使用方法都比较了解,且不同分析模块间的衔接需要人工干预,导致分析繁琐,效率低下,为解决该问题,本发明能够实现自动化的生物信息学分析流程。
本实施例通过调用生物信息学软件和个性化分析脚本库,简化基因组重测序分析流程,提高基因组重测序效率,节省了科研成本。此外,本发明还具有保存基因组重测序分析结果,进行二次查询的功能。
图2示出了本发明另一实施例提供的一种基因组重测序分析系统的结构示意图,如图2所示,本实施例的一种基因组重测序分析系统20,包括:Web应用单元21、Java交互单元22、分析单元23;
其中,Java交互单元22包括:结果推送模块221、任务调度模块222、数据交互模块223;
分析单元23包括:数据评估模块231、序列比对模块232、突变检测模块233、功能注释模块234。
Web应用单元21用于接收基因组重测序数据和基因组重测序参数,并将所述基因组重测序参数发送至Java交互单元22的任务调度模块222。
具体来说,Web应用单元21包括用户应用单元和管理应用单元。其中,用户应用单元用于接收外部输入的基因组重测序数据和基因组重测序参数。管理应用单元用于接收外部输入的管理指令和限制指令,从而实现对项目的管理操作,如监控、停止、删除。管理应用单元为扩展模块,可以对不同级别的用户权限进行限制和修改,进而保证系统的稳定性。
进一步的,基因组重测序数据是进行基因重测序的待检测数据,通过预设格式文本导入Web应用单元21,格式文本包括但不限于FastQ、TXT,其中FastQ文件是高通量测序产生的标准测序结果文件,包括碱基序列和对应碱基的质量值。基因组重测序参数是进行基因重测序的设置参数,包括但不限于参考物种、检测种类、数据库种类。
Java交互单元22,用于根据所述Web应用单元21接收的基因组重测序参数,生成基因组重测序任务信息,并将所述基因组重测序任务信息发送至分析单元23。
Java交互单元22,包括:结果推送模块221、任务调度模块222、数据交互模块223。
任务调度模块222,用于根据所述Web应用单元21接收的基因组重测序数据和基因组重测序参数,生成基因组重测序任务信息,并将所述基因组重测序任务信息发送至分析单元23。
可以理解的是,基因组重测序参数包含基因组重测序过程所需的各项参数,进一步的,重测序任务信息包括进行重测序过程的计算资源需求,生物信息学软件库和脚本库等信息。
上述的任务调度模块222,在基因组重测序过程中,还用于实时监测基因组重测序任务的运行状态及进度。
具体来说,任务调度模块222实时监测基因组重测序任务的运行状态及进度,生成日志界面,记录指令组装、资源申请、任务投递、任务监控以及与结果推送模块221和数据交互模块223通信的操作过程,方便项目运行出错后的错误排查。
结果推送模块221,用于在基因组重测序分析结束时,根据任务调度模块222发送的展示指令,将分析单元23获取的基因组重测序分析结果在Web应用单元进行呈现。
具体来说,重测序分析结果能够以预设格式进行下载或在Web应用单元进行呈现,预设格式包括但不限于WORD、PDF。重测序分析结果包括项目名称、关键词、结果概述等内容,实现自动、高效、便捷的数据分析,为科研工作者提供了一种无任何技术门槛的数据分析手段,可以帮助其快速完成数据分析,并全方位的对分析结果进行挖掘,找出更有生物学意义的结果。
数据库交互模块223,用于在基因组重测序分析结束时,根据所述任务调度模块222发送的存储指令,将所述分析单元23获取的基因组重测序分析结果存储至数据库。
具体来说,数据库交互模块223将项目信息、重测序流程运行参数以及重测序分析结果存储至数据库中,当Web应用单元21对结果进行查看或二次检索时,任务调度系统222再次通过数据库交互模块223从数据库中读取重测序分析结果在Web应用单元进行呈现。
分析单元23,用于根据所述Java交互单元22生成的基因组重测序任务信息,读取所述基因组重测序数据,并通过调用生物信息学软件库和脚本库,对所述基因组重测序数据进行分析,获取基因组重测序分析结果;
其中,所述生物信息学软件库,包括:BWA、samtools、GATK、picard、breakdancer、Control-FREEC、SnpEff和blast;
所述脚本库,包括:SNP检测脚本、InDel检测脚本、SV检测脚本、CNV检测脚本、功能注释脚本和绘图及统计脚本。
分析单元23,包括:数据评估模块231、序列对比模块232、突变检测模块233、功能注释模块234。
数据评估模块231,用于对所述基因组重测序数据进行质量检测,并根据质量检测结果,判断所述基因组重测序数据是否可以进行基因组重测序;
其中,所述质量检测包括碱基质量分布检测和碱基类型分布检测。
可以理解的是,所述质量检测包括碱基质量分布检测,基于测序数据中包含的碱基质量值,利用Perl脚本对所有碱基的质量值进行统计,当85%以上的碱基质量值高于30分时,此数据才可以继续进行后续分析,否则需要先进行低质量序列过滤才可使用;
其中,所述质量检测还包括碱基类型分布检测,用于检测有无AT、GC碱基分离现象,高通量测序时,基因组随机打断,由于位点在基因组上的分布是近似均匀的,同时,G/C、A/T含量也是近似均匀的,因此,根据大数定理,在每个测序循环上,GC、AT含量应当分别相等,且等于基因组的GC、AT含量,因此当发生AT或GC分离的情况时,此数据不能继续进行后续分析。
序列比对模块232,用于将所述数据评估模块评估后的基因组重测序数据与参考基因组分别进行比对率统计、测序深度分布统计、插入片段分布统计,分别得到比对率、基因组覆盖深度、基因组覆盖度。
上述的序列比对模块232,还用于过滤评估后的基因组重测序数据中的重复序列,得到过滤后的基因组重测序数据。
具体来说,序列比对模块232还用于过滤比对结果中的重复序列,重复序列主要是由于测序PCR产生的,会影响测序深度等比对评估参数,最终导致突变检测的假阳性,比对结果一般以BAM格式(二进制的比对结果存储格式,占用空间小,检索速度快)进行存储,使用Picard的MarkDuplicate模块进行处理去重复,屏蔽PCR-duplication的影响。
突变检测模块233,用于通过调用所述生物信息学软件库和脚本库,对所述过滤后的基因组重测序数据进行突变检测分析;
可以理解的是,所述突变检测分析包括单核苷酸多态性检测、插入缺失检测、结构变异检测和拷贝数变异检测。
进一步的,突变检测模块233,在突变检测分析过程中,还用于对突变所在的基因组位置进行注释,所述基因位置包括基因区、基因间区和非翻译区。
功能注释模块234,在突变检测分析过程中,用于根据功能注释数据库,对突变基因进行功能注释;
其中,所述功能注释数据库包括GO、COG\KOG、Pfam、KEGG、NR、SWISS-PROT。
综上所述,分析单元23,如图4所示,具体用于:比对,用BWA将测序数据比对到参考基因组上,并用picard去除比对重复,用samtools统计比对结果;SNP和InDel检测,基于比对结果,用GATK进行检测,检测前要进行InDel附近重新比对、碱基校正,以降低检测的假阳性;使用breakdancer基于成对reads间的距离关系进行SV检测;使用Control-FREEC进行CNV检测;突变基因注释,使用SnpEff进行功能区域注释,使用blast进行基因功能注释。
本实施例通过调用生物信息学软件和个性化分析脚本库,简化基因组重测序分析流程,提高基因组重测序效率,节省了科研成本。此外,本发明还具有保存基因组重测序分析结果,进行二次查询的功能。
图3示出了本发明另一实施例提供的一种基因组重测序分析方法的流程示意图,如图3所示,本实施例的一种基因组重测序分析方法,包括:
S1、接收基因组重测序数据和基因组重测序参数。
S2、根据所述基因组重测序参数,生成基因组重测序任务信息。
S3、根据所述基因组重测序任务信息,通过调用生物信息学软件库和脚本库,对所述基因组重测序数据进行分析,获取基因组重测序分析结果。
其中,所述生物信息学软件库,包括:BWA、samtools、GATK、picard、breakdancer、Control-FREEC、SnpEff和blast;
所述脚本库,包括:SNP检测脚本、InDel检测脚本、SV检测脚本、CNV检测脚本、功能注释脚本和绘图及统计脚本。
本实施例通过调用生物信息学软件和个性化分析脚本库,简化基因组重测序分析流程,提高基因组重测序效率,节省了科研成本。此外,本发明还具有保存基因组重测序分析结果,进行二次查询的功能。
本领域普通技术人员可以理解:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。

Claims (10)

1.一种基因组重测序分析系统,其特征在于,所述系统包括:
Web应用单元,用于接收基因组重测序数据和基因组重测序参数,并将所述基因组重测序参数发送至Java交互单元;
Java交互单元,用于根据所述Web应用单元接收的基因组重测序参数,生成基因组重测序任务信息,并将所述基因组重测序任务信息发送至分析单元;
分析单元,用于根据所述Java交互单元生成的基因组重测序任务信息,读取所述基因组重测序数据,并通过调用生物信息学软件库和脚本库,对所述基因组重测序数据进行分析,获取基因组重测序分析结果;
其中,所述生物信息学软件库,包括:BWA、samtools、GATK、picard、breakdancer、Control-FREEC、SnpEff和blast;
所述脚本库,包括:SNP检测脚本、InDel检测脚本、SV检测脚本、CNV检测脚本、功能注释脚本和绘图及统计脚本。
2.根据权利要求1所述的系统,其特征在于,所述Java交互单元包括:
任务调度模块,用于根据所述Web应用单元接收的基因组重测序数据和基因组重测序参数,生成基因组重测序任务信息,并将所述基因组重测序任务信息发送至分析单元;
所述任务调度模块,在基因组重测序过程中,还用于实时监测基因组重测序任务的运行状态及进度。
3.根据权利要求2所述的系统,其特征在于,所述Java交互单元还包括:
结果推送模块,用于在基因组重测序分析结束时,根据所述任务调度模块发送的展示指令,将所述分析单元获取的基因组重测序分析结果在Web应用单元进行呈现。
4.根据权利要求2所述的系统,其特征在于,所述Java交互单元还包括:
数据库交互模块,用于在基因组重测序分析结束时,根据所述任务调度模块发送的存储指令,将所述分析单元获取的基因组重测序分析结果存储至数据库。
5.根据权利要求1所述的系统,其特征在于,所述分析单元包括:
数据评估模块,用于对所述基因组重测序数据进行质量检测,并根据质量检测结果,判断所述基因组重测序数据是否可以进行基因组重测序;
其中,所述质量检测包括碱基质量分布检测和碱基类型分布检测。
6.根据权利要求5所述的系统,其特征在于,所述分析单元还包括:
序列比对模块,用于将所述数据评估模块评估后的基因组重测序数据与参考基因组分别进行比对率统计、测序深度分布统计、插入片段分布统计,分别得到比对率、基因组覆盖深度、基因组覆盖度;
所述序列比对模块,还用于过滤评估后的基因组重测序数据中的重复序列,得到过滤后的基因组重测序数据。
7.根据权利要求6所述的系统,其特征在于,所述分析单元还包括:
突变检测模块,用于通过调用所述生物信息学软件库和脚本库,对所述过滤后的基因组重测序数据进行突变检测分析;
其中所述突变检测分析包括单核苷酸多态性检测、插入缺失检测、结构变异检测和拷贝数变异检测。
8.根据权利要求7所述的系统,其特征在于,所述突变检测模块还用于,
在突变检测分析过程中,对突变所在的基因组位置进行注释,所述基因位置包括基因区、基因间区和非翻译区。
9.根据权利要求7所述的系统,其特征在于,所述分析单元还包括:
功能注释模块,在突变检测分析过程中,用于根据功能注释数据库,对突变基因进行功能注释;
其中,所述功能注释数据库包括GO、COG\KOG、Pfam、KEGG、NR、SWISS-PROT。
10.一种基因组重测序分析方法,其特征在于,所述方法包括:
接收基因组重测序数据和基因组重测序参数;
根据所述基因组重测序参数,生成基因组重测序任务信息;
根据所述基因组重测序任务信息,通过调用生物信息学软件库和脚本库,对所述基因组重测序数据进行分析,获取基因组重测序分析结果;
其中,所述生物信息学软件库,包括:BWA、samtools、GATK、picard、breakdancer、Control-FREEC、SnpEff和blast;
所述脚本库,包括:SNP检测脚本、InDel检测脚本、SV检测脚本、CNV检测脚本、功能注释脚本和绘图及统计脚本。
CN201510997979.9A 2015-12-25 2015-12-25 一种基因组重测序分析系统及方法 Pending CN105653893A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510997979.9A CN105653893A (zh) 2015-12-25 2015-12-25 一种基因组重测序分析系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510997979.9A CN105653893A (zh) 2015-12-25 2015-12-25 一种基因组重测序分析系统及方法

Publications (1)

Publication Number Publication Date
CN105653893A true CN105653893A (zh) 2016-06-08

Family

ID=56477050

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510997979.9A Pending CN105653893A (zh) 2015-12-25 2015-12-25 一种基因组重测序分析系统及方法

Country Status (1)

Country Link
CN (1) CN105653893A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106557666A (zh) * 2016-11-15 2017-04-05 上海派森诺生物科技股份有限公司 一种能够基于Nextseq500高通量测序平台的数据过滤方法
CN107122626A (zh) * 2017-03-13 2017-09-01 上海海云生物科技有限公司 二代测序dna突变检测的生物信息学分析的方法及系统
CN108229103A (zh) * 2018-01-15 2018-06-29 臻和(北京)科技有限公司 循环肿瘤dna重复序列的处理方法及装置
CN108319817A (zh) * 2018-01-15 2018-07-24 臻和(北京)科技有限公司 循环肿瘤dna重复序列的处理方法及装置
CN109448789A (zh) * 2018-09-17 2019-03-08 上海派森诺生物科技股份有限公司 一种基于perl语言的种群特异SNP位点的自动化分析方法
CN110189796A (zh) * 2019-05-27 2019-08-30 新疆农业大学 一种绵羊全基因组重测序分析方法
CN110265086A (zh) * 2019-07-04 2019-09-20 北京肿瘤医院(北京大学肿瘤医院) 一种基因检测方法和装置
CN110491445A (zh) * 2018-05-11 2019-11-22 广州华大基因医学检验所有限公司 Uid测序、uid序列设计、uid去重质量值校正的方法及应用
CN111429967A (zh) * 2020-04-23 2020-07-17 北京诺禾致源科技股份有限公司 Pacbio三代测序数据的处理方法
CN111653316A (zh) * 2020-05-27 2020-09-11 上海寻因生物科技有限公司 基于二代测序的可视化分析方法、系统及存储介质
CN116403647A (zh) * 2023-06-08 2023-07-07 上海精翰生物科技有限公司 一种检测慢病毒整合位点的生物信息检测方法及其应用

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101094120A (zh) * 2007-07-04 2007-12-26 中兴通讯股份有限公司 一种基于网络堆叠系统的自动测试系统以及测试方法
CN103324866A (zh) * 2013-03-26 2013-09-25 张弘 Ripple系统
CN104331640A (zh) * 2014-10-17 2015-02-04 北京百迈客生物科技有限公司 基于生物云平台的项目结题报告分析系统和方法
CN104462211A (zh) * 2014-11-04 2015-03-25 北京诺禾致源生物信息科技有限公司 重测序数据的处理方法和处理装置
CN104762402A (zh) * 2015-04-21 2015-07-08 广州定康信息科技有限公司 超快速检测人类基因组单碱基突变和微插入缺失的方法
KR20150117362A (ko) * 2014-04-09 2015-10-20 국립암센터 유전자 다형성을 이용한 소라페닙 치료에 대한 반응성 예측방법

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101094120A (zh) * 2007-07-04 2007-12-26 中兴通讯股份有限公司 一种基于网络堆叠系统的自动测试系统以及测试方法
CN103324866A (zh) * 2013-03-26 2013-09-25 张弘 Ripple系统
KR20150117362A (ko) * 2014-04-09 2015-10-20 국립암센터 유전자 다형성을 이용한 소라페닙 치료에 대한 반응성 예측방법
CN104331640A (zh) * 2014-10-17 2015-02-04 北京百迈客生物科技有限公司 基于生物云平台的项目结题报告分析系统和方法
CN104462211A (zh) * 2014-11-04 2015-03-25 北京诺禾致源生物信息科技有限公司 重测序数据的处理方法和处理装置
CN104762402A (zh) * 2015-04-21 2015-07-08 广州定康信息科技有限公司 超快速检测人类基因组单碱基突变和微插入缺失的方法

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106557666A (zh) * 2016-11-15 2017-04-05 上海派森诺生物科技股份有限公司 一种能够基于Nextseq500高通量测序平台的数据过滤方法
CN107122626A (zh) * 2017-03-13 2017-09-01 上海海云生物科技有限公司 二代测序dna突变检测的生物信息学分析的方法及系统
CN108319817B (zh) * 2018-01-15 2020-12-25 无锡臻和生物科技有限公司 循环肿瘤dna重复序列的处理方法及装置
CN108229103A (zh) * 2018-01-15 2018-06-29 臻和(北京)科技有限公司 循环肿瘤dna重复序列的处理方法及装置
CN108319817A (zh) * 2018-01-15 2018-07-24 臻和(北京)科技有限公司 循环肿瘤dna重复序列的处理方法及装置
CN108229103B (zh) * 2018-01-15 2020-12-25 无锡臻和生物科技有限公司 循环肿瘤dna重复序列的处理方法及装置
CN110491445A (zh) * 2018-05-11 2019-11-22 广州华大基因医学检验所有限公司 Uid测序、uid序列设计、uid去重质量值校正的方法及应用
CN110491445B (zh) * 2018-05-11 2023-05-30 广州华大基因医学检验所有限公司 Uid测序、uid序列设计、uid去重质量值校正的方法及应用
CN109448789A (zh) * 2018-09-17 2019-03-08 上海派森诺生物科技股份有限公司 一种基于perl语言的种群特异SNP位点的自动化分析方法
CN110189796A (zh) * 2019-05-27 2019-08-30 新疆农业大学 一种绵羊全基因组重测序分析方法
CN110265086A (zh) * 2019-07-04 2019-09-20 北京肿瘤医院(北京大学肿瘤医院) 一种基因检测方法和装置
CN111429967A (zh) * 2020-04-23 2020-07-17 北京诺禾致源科技股份有限公司 Pacbio三代测序数据的处理方法
CN111653316A (zh) * 2020-05-27 2020-09-11 上海寻因生物科技有限公司 基于二代测序的可视化分析方法、系统及存储介质
CN116403647A (zh) * 2023-06-08 2023-07-07 上海精翰生物科技有限公司 一种检测慢病毒整合位点的生物信息检测方法及其应用
CN116403647B (zh) * 2023-06-08 2023-08-15 上海精翰生物科技有限公司 一种检测慢病毒整合位点的生物信息检测方法及其应用

Similar Documents

Publication Publication Date Title
CN105653893A (zh) 一种基因组重测序分析系统及方法
Meyer et al. AMBER: assessment of metagenome BinnERs
US20210265012A1 (en) Systems and methods for use of known alleles in read mapping
Mysara et al. From reads to operational taxonomic units: an ensemble processing pipeline for MiSeq amplicon sequencing data
US20190172549A1 (en) Systems and methods for analysis and interpretation of nucliec acid sequence data
Wang et al. Network-based methods for human disease gene prediction
Angly et al. Grinder: a versatile amplicon and shotgun sequence simulator
CN106021979A (zh) 人基因组重测序数据分析系统及方法
Ritz et al. Structural variation analysis with strobe reads
Cappelli et al. Combining DNA methylation and RNA sequencing data of cancer for supervised knowledge extraction
Knowles et al. Grape RNA-Seq analysis pipeline environment
Spinozzi et al. VISPA2: a scalable pipeline for high-throughput identification and annotation of vector integration sites
Baker et al. Comprehensive comparison of cloud-based NGS data analysis and alignment tools
Karimi et al. Prospects and challenges of cancer systems medicine: from genes to disease networks
Churakov et al. A 4-lineage statistical suite to evaluate the support of large-scale retrotransposon insertion data to reconstruct evolutionary trees
Agapito Computer tools to analyze microarray data
Kaiser et al. Automated structural variant verification in human genomes using single-molecule electronic DNA mapping
Kauff et al. WASABI: an automated sequence processing system for multigene phylogenies
Henke et al. Identification of Mutations in Zebrafish Using Next‐Generation Sequencing
Baßler et al. A Bioinformatic Toolkit for Single-Cell mRNA Analysis
Albrecht et al. Single-cell specific and interpretable machine learning models for sparse scChIP-seq data imputation
Thangam et al. CRCDA—Comprehensive resources for cancer NGS data analysis
Ebrahimi et al. scTagger: fast and accurate matching of cellular barcodes across short-and long-reads of single-cell RNA-seq experiments
Zhang Metagenome Assembly and Contig Assignment
Vasquez et al. Parsing Next Generation Sequencing Data in Parallel Environments for Downstream Genetic Variation Analysis

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160608

RJ01 Rejection of invention patent application after publication