CN106021984A - 一种全外显子组测序数据分析系统 - Google Patents

一种全外显子组测序数据分析系统 Download PDF

Info

Publication number
CN106021984A
CN106021984A CN201610319413.5A CN201610319413A CN106021984A CN 106021984 A CN106021984 A CN 106021984A CN 201610319413 A CN201610319413 A CN 201610319413A CN 106021984 A CN106021984 A CN 106021984A
Authority
CN
China
Prior art keywords
genome
read
unit
sequencing data
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610319413.5A
Other languages
English (en)
Inventor
薛成海
吕艳玲
郑文辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wankangyuan (tianjin) Gene Technology Co Ltd
Original Assignee
Wankangyuan (tianjin) Gene Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wankangyuan (tianjin) Gene Technology Co Ltd filed Critical Wankangyuan (tianjin) Gene Technology Co Ltd
Priority to CN201610319413.5A priority Critical patent/CN106021984A/zh
Publication of CN106021984A publication Critical patent/CN106021984A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations

Abstract

本发明提供了一种全外显子组测序数据分析系统,包括质控模块,用于通过对原始测序数据文件中单碱基质量,以及read质量的评估;基因组映射模块:用于利用BWA的aln算法完成read到基因组的映射过程;基因组变异模块:用于利用GATK包的UnifiedGenotyper方法找基因组上的变异位点;变异位点注释模块:用于对变异的候选位点或基因组区间做注释。本发明通过简单的参数提交完成大规模数据的分析,包括原始数据的质量检测、数据去噪、测序read的基因组映射上游承接下机的原始测序数据,通过参数自动化提交分析模块,完成测序数据的分析,输出候选的致病突变位点和相关基因,为后期的实验验证提供依据。

Description

一种全外显子组测序数据分析系统
技术领域
本发明属于基因信息数据处理领域,特别是涉及到一种全外显子组测序数据分析系统。
背景技术
随着人类基因组计划和国际人类单体型图谱构建的完成,快速推动了通过解析基因组信息研究疾病易感位点的预测和功能研究。这类研究主要是基于生物芯片的基因分型技术,利用全基因组关联分析研究(GWAS)方法来寻找与复杂疾病相关的遗传因素。随着生物芯片中探针越来越密集,特别是叠瓦式探针的设计,对于疾病风险位点的挖掘也越来越全面。然而,GWAS的局限在于:识别的多数关联位点位于基因组的基因间区、内含子、调控区;其次,芯片的探针都是基于目前已知的(绝大多数是常见SNP)设计的,不能识别低频的致病变异和新的致病突变。
短短几年内,新一代技术的迅猛发展在数据通量和成本上都显示出巨大的优势。特别是全外显子组捕获测序技术,通过特异性探针富集到具有编码功能的外显子区,针对这些功能区域进行深度测序,不仅可以更全面的检测编码区域的变异,且能够识别低频的和新的变异位点。全外显子测序包含目标区间的捕获、文库构建和上机测序,以及生物信息学分析三个过程。目前最流行的三种外显子捕获试剂分别来自罗氏NimbleGen、
Illumina和安捷伦。技术的不断推广,涌现出海量的基因组测序数据,如何快速、且系统性地挖掘这些大数据中的信息,以更全面的解析疾病,服务于生物医学,为数据分析团队提出了更高的要求和新的挑战。
发明内容
有鉴于此,本发明提出一种全外显子组测序数据分析系统,便于更快速、准确地挖掘测序数据中的信息。
为达到上述目的,本发明的技术方案是这样实现的:一种全外显子组测序数据分析系统,包括:
质控模块:用于通过对原始测序数据文件中单碱基质量,以及read质量的评估,判断测序数据是否可用于后续分析,同时,筛选去除测序因素产生的数据噪音;
基因组映射模块:用于利用BWA的aln算法完成read到基因组的映射过程,通过多线程运算达到快速比对的结果;
基因组变异模块:用于利用GATK包的UnifiedGenotyper方法找基因组上的变异位点,包括SNV和小片段的INDEL;
变异位点注释模块:用于对变异的候选位点或基因组区间做注释,包含这些变异在基因组的位置、是否影响氨基酸编码、人群频率、对于蛋白质功能是否有害;
所述质控模块、基因组映射模块、基因组变异模块、变异位点注释模块依次连接。
进一步的,所述质控模块包括fastqc单元和trimming单元;所述fastqc单元用于对原始测序文件进行质控,输出为数据质量的统计结果以及评估报告;所述trimming单元用于在质控基础上,针对数据进行修剪,包括去除低质量的read片段、去除测序异常的read、去除测序过程中添加的适配器,输出高质量的read用于后续信息挖掘。
更进一步的,所述质控模块还包括BaseQualStat单元,用于对原始测序文件中每个碱基的ASCII质量值做转换。
进一步的,所述基因组映射模块包括映射单元和格式单元,所述映射单元用于利用BWA的aln算法完成read到基因组的映射过程,通过多线程运算达到快速比对的结果;所述格式单元用于整合picard、samtool和GATK多种方法对比对结果进行数据格式转换、排序、质量校正,输出准确比对到基因组上的read信息。
进一步的,所述基因组变异模块包括gatk-snv单元、varscan-Somatic单元和CNV单元,所述gatk-snv单元用于寻找每个样本中的基因组变异,所述varscan-Somatic单元通过对配对的组织找变异位点,然后二者之间比较以及相应的统计学检验,区分出该例样本的生殖细胞突变和体细胞突变;所述CNV单元用于外显子组测序数据找基因组的拷贝数改变。
相对于现有技术,本发明所述的一种全外显子组测序数据分析系统具有以下优势:
本发明针对外显子组捕获测序数据进行分析,包括从下机的测序数据-->数据的质量控制-->数据的基本处理-->测序read的基因组映射-->找基因组变异-->计算基因组拷贝数-->注释变异位点的功能整个分析过程,本发明集成了全面的数据质量报告、结果统计和展示,通过简单的参数提交完成大规模数据的分析,包括原始数据的质量检测、数据去噪、测序read的基因组映射上游承接下机的原始测序数据,通过参数自动化提交分析模块,完成测序数据的分析,输出候选的致病突变位点和相关基因,为后期的实验验证提供依据。
附图说明
构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明的流程示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
下面将参考附图并结合实施例来详细说明本发明。
如图1所示,本发明的软件系统用于系统性分析全外显子组测序数据(适用于单样本或者配对的组织样本),输入为原始的测序数据(fq.gz文件),输出为基因组变异位点和相关突变基因,以及图形化结果展示。分析内容主要包含测序数据质控、测序read比对基因组、寻找基因组变异、变异信息注释和图形展示。
详细说明
1、测序数据的质控
相比先前的基因芯片数据,二代测序技术凸显其明显的优势是高通量,然而,这一优势也给研究者们带来了新的挑战―检测数据质量。除了数据的规模,数据质量同样是影响结果的重要因素之一。本发明系统中质控模块的fastqc和trimming两个单元可以完成对测序数据的严格质量检测和控制,通过对单碱基质量,以及read质量的评估,判断测序数据是否可用于后续分析,同时,筛选去除测序因素产生的数据噪音。
Fastqc单元的输入是原始的fq.gz文件(单/双末端测序数据都适用)。输出为数据质量的统计结果以及网页式的评估报告,内容包括:碱基质量分布、GC含量统计、A/T/G/C碱基分布、read长度统计、显著富集的段序列检测等。
Trimming单元的输入与fastqc单元输入相同,区别在于fastqc只针对数据的质量进行统计,而trimming是在质控基础上,针对数据进行“去伪存真”的修剪,包括去除低质量的read片段、去除测序异常的read(如高比例的N)、去除测序过程中添加的适配器等,输出高质量的read用于后续信息挖掘。输出结果中会统计修剪掉的低质量read比例,以评估数据的整体质量。
另外,还设有BaseQualStat单元是对fq.gz文件中每个碱基的ASCII质量值做转换(根据测序版本选择33或者64),将ASCII字符码转换成Phred值,然后可便于统计Q20、Q30等信息。
2、测序数据的基因组映射
二代测序数据分析中重要的一个内容是如何将短序列映射到基因上,然后解析基因组的信息。本发明的系统中mapping模块(基因组映射模块)包括映射单元,利用BWA的aln算法完成read到基因组的映射过程,通过多线程运算达到快速比对的结果(sam文件)。还包括格式单元,整合了picard、samtool和GATK多种方法对比对结果进行数据格式转换、排序、质量校正等过程,输出准确比对到基因组上的read信息(bam文件)。其中,aln的参数-n控制read比对到基因组上的方式(完全匹配、允许错配的部分匹配)。每一步数据处理中,都可以利用samtools工具对当前步骤中分析的read进行统计,如总的read数、比对率、重复read比例,read对的分布等。
bam文件是sam的二进制格式,也是测序数据中推荐的数据存储格式,具体说明:
每一行表示一条read的信息,每列分别代表
1、read编号
2、Flag信息:用于统计read信息的综合得分,如73表示该read和其配对的read(mate)都在bam文件中,但是mate是unmapp的read
3、染色体名称
4、碱基位置:1_based定义的基因组位置
5、比对打分:Phred-scale的质量分数
6、CIARG:该read的比对详细信息,如100M表示100个碱基完全比对到基因组
7、Mate read:配对的read的比对情况
8、Mate read的基因组位置:配对read起始碱基位置
9、read的长度
10、read的序列信息
11、read的质量
12、read的各种tag描述,如NM是read和参考基因组的编辑距离(即差异),XT记录read是唯一比对或者基因组多定位。
3、测序数据找高置信的基因组变异
本发明中基因组变异模块中的gatk-snv单元利用GATK包的UnifiedGenotyper方法找基因组上的变异,包括SNV和小片段的INDEL。UnifiedGenotyper集成了多种基因组变异检测方法,基于贝叶斯最大似然模型来估计基因分型和基因频率,同时对每个位点的变异都会计算一个后验概率。UnifiedGenotyper是基于检测样本基因组和参考基因组的比较,因此既适用于单个样本的变异位点检测,也可做群体的变异检测。gatk-snv的输入是比对后的bam文件,输出是vcf文件,包含每个位点的基因型和该位点详细的比对、统计信息。这里的变异位点结果中包含很多假阳性的结果(特别是INDEL),为了得到高置信的变异位点,需要对INDEL区域重新设计比对、以及碱基质量的矫正(VariantFiltration)。在满足变异数据量的条件下,推荐使用VQSR对变异位点进行过滤。VQSR过滤变异位点的原理:根据已知的变异位点(包括真的变异HapMap和Omni 2.5M SNP芯片中的位点)训练高斯模型,此外,算法会输出一组图形化结果可以形象地了解模型中注释信息对于变异位点分组的效能。然后将该模型用于UnifiedGenotyper找到的变异位点,并计算每个位点的变异概率,并得到该位点是真的变异位点与假阳性位点的比值(VQSLOD),记录在INFO信息中,这个值越大说明该位点是真的基因组变异的可能性越大。由于变异位点假阳性过滤依赖于高斯模型的构建,SNV和INDEL需要分开进行。
gatk-snv单元用于寻找每个样本中的基因组变异(包含遗传获得的生殖细胞变异和后天产生的体细胞变异)。二代测序技术在生物医学中一个重要的应用是疾病发病机理的研究,如癌症。目前报道的大多数复杂疾病和癌症都是由于体细胞突变导致功能失调,进而诱发疾病产生。而这类研究的实验设计通常包含有配对的样本DNA,例如癌症患者的癌组织和血样、或者癌组织和癌旁的正常组织。针对这一类问题,本发明的系统软件中,varscan-Somatic单元通过对配对的组织找变异位点,然后二者之间比较以及相应的统计学检验,区分出该例样本的生殖细胞突变和体细胞突变,其中,体细胞突变可用于后续解析无遗传背景的疾病的发生过程和分子机理。
此外,CNV单元可用于外显子组测序数据找基因组的拷贝数改变。然而,由于外显子组测序中通过特异性探针捕获了基因组的片段,因此,这种数据统计基因组的fragment和断裂点时不如全基因组测序数据精准。
4、变异位点的注释
annotation模块(变异位点注释模块)是对比变异位点的注释工具。为了进一步解释变异位点的功能,需要将其定位到基因组、基因,分析碱基改变是否影响氨基酸编码、阅读框结构;其次,通过公开的健康人群频率过滤常见的SNP;此外,利用PolyPhen、CADD、SIFT等方法预测氨基酸改变对蛋白质功能的影响;结合现有的疾病数据库(COSMIC,ClinVar、OMIM等)筛查目前已报到的疾病突变和新的突变位点,提供候选的致病突变和基因。
本发明具体运行实例:
1、数据简介
数据类型:全外显子组测序
组织来源:DNA来自同一例患者的癌组织和外周血
实验设计:外显子捕获测序
测序平台:Illumina Hiseq 2000,双末端测序
read平均长度:100bp
原始测序数据质量统计如表*。
表4.1全外显子组测序数据质量统计
2、系统使用
全外显子组测序数据分析流程包含:测序数据质量评估和控制、高质量read筛选、read比对到参考基因组、寻找基因组变异、配对样本寻找体细胞突变、计算拷贝数变异、功能注释等过程。下面,将利用软件集成的功能模块逐步实现每一个分析步骤。
(1)原始测序数据的质量控制。本示例包含两个全外显子组数据,利用fastQC分别对两套测序进行质量评估。
(2)利用trimming,基于滑窗方法计算碱基质量,过滤低质量的read。方法原理是:输入测序的fq文件(包含read标号、序列、碱基质量)。
Qual w i n d o w = Σ i ∈ w i n d o w Qual i / n u m _ base w i n d o w
(3)利用mapping,将高质量的read比对到人类参考基因组(hg19)上。比对方法采用BWA,步骤包括read的基因组定位->bam生产->根据位置排序->标记由于PCR产生的重复片段->indel周围的重新比对,以去除假阳性变异信息->碱基质量的矫正->提取唯一比对到基因组上的raed做后续分析。
(4)利用gatk-snv,分别找癌组织和外周血DNA中的SNV和INDEL。通过癌组织基因组和参考基因组比较识别了49707个SNV和5386个INDEL。在外周血中发现了49655个SNP和5263个INDEL。
(5)利用varscan-Somatic比较配对的癌组织和外周血,识别癌细胞中的突变。基于p值0.05,最少5个read覆盖,共获得237个体细胞突变和340个LOH。
(6)利用CNV模块分析癌组织中DNA拷贝数的改变。
(7)利用annotation对SNV、INDEL和CNV的候选位点或基因组区间做注释,包含这些变异在基因组的位置、是否影响氨基酸编码、人群频率、对于蛋白质功能是否有害等。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种全外显子组测序数据分析系统,其特征在于,包括:
质控模块:用于通过对原始测序数据文件中单碱基质量,以及read质量的评估,判断测序数据是否可用于后续分析,同时,筛选去除测序因素产生的数据噪音;
基因组映射模块:用于利用BWA的aln算法完成read到基因组的映射过程,通过多线程运算达到快速比对的结果;
基因组变异模块:用于利用GATK包的UnifiedGenotyper方法找基因组上的变异位点,包括SNV和小片段的INDEL;
变异位点注释模块:用于对变异的候选位点或基因组区间做注释,包含这些变异在基因组的位置、是否影响氨基酸编码、人群频率、对于蛋白质功能是否有害;
所述质控模块、基因组映射模块、基因组变异模块、变异位点注释模块依次连接。
2.根据权利要求1所述的一种全外显子组测序数据分析系统,其特征在于,所述质控模块包括fastqc单元和trimming单元;所述fastqc单元用于对原始测序文件进行质控,输出为数据质量的统计结果以及评估报告;所述trimming单元用于在质控基础上,针对数据进行修剪,包括去除低质量的read片段、去除测序异常的read、去除测序过程中添加的适配器,输出高质量的read用于后续信息挖掘。
3.根据权利要求2所述的一种全外显子组测序数据分析系统,其特征在于,所述质控模块还包括BaseQualStat单元,用于对原始测序文件中每个碱基的ASCII质量值做转换。
4.根据权利要求1所述的一种全外显子组测序数据分析系统,其特征在于,所述基因组映射模块包括映射单元和格式单元,所述映射单元用于利用BWA的aln算法完成read到基因组的映射过程,通过多线程运算达到快速比对的结果;所述格式单元用于整合picard、samtool和GATK多种方法对比对结果进行数据格式转换、排序、质量校正,输出准确比对到基因组上的read信息。
5.根据权利要求1所述的一种全外显子组测序数据分析系统,其特征在于,所述基因组变异模块包括gatk-snv单元、varscan-Somatic单元和CNV单元,所述gatk-snv单元用于寻找每个样本中的基因组变异,所述varscan-Somatic单元通过对配对的组织找变异位点,然后二者之间比较以及相应的统计学检验,区分出该例样本的生殖细胞突变和体细胞突变;所述CNV单元用于外显子组测序数据找基因组的拷贝数改变。
CN201610319413.5A 2016-05-13 2016-05-13 一种全外显子组测序数据分析系统 Pending CN106021984A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610319413.5A CN106021984A (zh) 2016-05-13 2016-05-13 一种全外显子组测序数据分析系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610319413.5A CN106021984A (zh) 2016-05-13 2016-05-13 一种全外显子组测序数据分析系统

Publications (1)

Publication Number Publication Date
CN106021984A true CN106021984A (zh) 2016-10-12

Family

ID=57100479

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610319413.5A Pending CN106021984A (zh) 2016-05-13 2016-05-13 一种全外显子组测序数据分析系统

Country Status (1)

Country Link
CN (1) CN106021984A (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106611106A (zh) * 2016-12-06 2017-05-03 北京荣之联科技股份有限公司 基因变异检测方法及装置
CN106709028A (zh) * 2016-12-28 2017-05-24 上海华点云生物科技有限公司 高通量测序数据统计方法和统计装置
CN107292129A (zh) * 2017-05-26 2017-10-24 中国科学院上海药物研究所 易感基因型检测方法
CN107391965A (zh) * 2017-08-15 2017-11-24 上海派森诺生物科技股份有限公司 一种基于高通量测序技术的肺癌体细胞突变检测分析方法
CN107423578A (zh) * 2017-03-02 2017-12-01 北京诺禾致源科技股份有限公司 检测体细胞突变的装置
CN107978345A (zh) * 2017-12-21 2018-05-01 扬州医联生物科技有限公司 基于基因序列分析的健康数据分析报告生成系统和方法
CN107974490A (zh) * 2017-12-08 2018-05-01 东莞博奥木华基因科技有限公司 基于半导体测序的pku致病基因突变检测方法及装置
CN109033749A (zh) * 2018-06-29 2018-12-18 深圳裕策生物科技有限公司 一种肿瘤突变负荷检测方法、装置和存储介质
CN109493917A (zh) * 2018-09-02 2019-03-19 上海市儿童医院 一种基因突变有害性预测值的害阶位计算方法
CN109686408A (zh) * 2018-04-19 2019-04-26 江苏先声医学诊断有限公司 一种鉴定耐药基因和/或耐药基因突变位点的宏基因组数据分析方法及系统
CN109686439A (zh) * 2018-12-04 2019-04-26 东莞博奥木华基因科技有限公司 遗传病基因检测的数据分析方法、系统及存储介质
CN110211630A (zh) * 2019-06-06 2019-09-06 广州金域医学检验中心有限公司 致病性单亲二倍体的筛查装置及存储介质和处理器
CN110867207A (zh) * 2019-11-26 2020-03-06 北京橡鑫生物科技有限公司 验证ngs变异检测方法的评估方法及评估装置
CN111540407A (zh) * 2020-04-13 2020-08-14 中南大学湘雅医院 一种整合多种神经发育性疾病筛选候选基因的方法
CN111723261A (zh) * 2019-03-22 2020-09-29 昆明逆火科技股份有限公司 基于搜索引擎的dna比对算法
CN112102878A (zh) * 2020-09-16 2020-12-18 张云鹏 一种LncRNA学习系统
CN112885412A (zh) * 2021-02-25 2021-06-01 深圳华大基因科技服务有限公司 基因组注释方法、装置、可视化平台和存储介质
CN113362901A (zh) * 2021-05-14 2021-09-07 海南大学 快速进行全基因组注释区间比较的方法及系统
CN115331829A (zh) * 2022-10-14 2022-11-11 神州医疗科技股份有限公司 应用于医学领域的数据显示方法、装置、电子设备和介质
CN115458057A (zh) * 2022-08-15 2022-12-09 新疆碳智干细胞库有限公司 一种人类基因全外显检测数据的分析方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
KAI WANG ETC: ""ANNOVAR:functional annotation of genetic variants from high-throughput sequencing data"", 《NUCLEIC ACIDS RESEARCH》 *
刘永波 等: ""基于Solexa平台高通量测序数据的分析与处理流程研究"", 《农业网络信息》 *
李文轲 等: ""基因组二代测序数据的自动化分析流程"", 《遗传》 *

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106611106B (zh) * 2016-12-06 2019-05-03 北京荣之联科技股份有限公司 基因变异检测方法及装置
CN106611106A (zh) * 2016-12-06 2017-05-03 北京荣之联科技股份有限公司 基因变异检测方法及装置
CN106709028A (zh) * 2016-12-28 2017-05-24 上海华点云生物科技有限公司 高通量测序数据统计方法和统计装置
CN107423578A (zh) * 2017-03-02 2017-12-01 北京诺禾致源科技股份有限公司 检测体细胞突变的装置
CN107423578B (zh) * 2017-03-02 2020-09-22 北京诺禾致源科技股份有限公司 检测体细胞突变的装置
CN107292129A (zh) * 2017-05-26 2017-10-24 中国科学院上海药物研究所 易感基因型检测方法
CN107391965A (zh) * 2017-08-15 2017-11-24 上海派森诺生物科技股份有限公司 一种基于高通量测序技术的肺癌体细胞突变检测分析方法
CN107974490B (zh) * 2017-12-08 2019-05-14 东莞博奥木华基因科技有限公司 基于半导体测序的pku致病基因突变检测方法及装置
CN107974490A (zh) * 2017-12-08 2018-05-01 东莞博奥木华基因科技有限公司 基于半导体测序的pku致病基因突变检测方法及装置
CN107978345A (zh) * 2017-12-21 2018-05-01 扬州医联生物科技有限公司 基于基因序列分析的健康数据分析报告生成系统和方法
CN109686408B (zh) * 2018-04-19 2023-02-03 江苏先声医学诊断有限公司 一种鉴定耐药基因和/或耐药基因突变位点的宏基因组数据分析方法及系统
CN109686408A (zh) * 2018-04-19 2019-04-26 江苏先声医学诊断有限公司 一种鉴定耐药基因和/或耐药基因突变位点的宏基因组数据分析方法及系统
CN109033749A (zh) * 2018-06-29 2018-12-18 深圳裕策生物科技有限公司 一种肿瘤突变负荷检测方法、装置和存储介质
CN109493917A (zh) * 2018-09-02 2019-03-19 上海市儿童医院 一种基因突变有害性预测值的害阶位计算方法
CN109686439A (zh) * 2018-12-04 2019-04-26 东莞博奥木华基因科技有限公司 遗传病基因检测的数据分析方法、系统及存储介质
CN111723261A (zh) * 2019-03-22 2020-09-29 昆明逆火科技股份有限公司 基于搜索引擎的dna比对算法
CN110211630A (zh) * 2019-06-06 2019-09-06 广州金域医学检验中心有限公司 致病性单亲二倍体的筛查装置及存储介质和处理器
CN110867207A (zh) * 2019-11-26 2020-03-06 北京橡鑫生物科技有限公司 验证ngs变异检测方法的评估方法及评估装置
CN111540407A (zh) * 2020-04-13 2020-08-14 中南大学湘雅医院 一种整合多种神经发育性疾病筛选候选基因的方法
CN111540407B (zh) * 2020-04-13 2023-06-27 中南大学湘雅医院 一种整合多种神经发育性疾病筛选候选基因的方法
CN112102878B (zh) * 2020-09-16 2024-01-26 张云鹏 一种LncRNA学习系统
CN112102878A (zh) * 2020-09-16 2020-12-18 张云鹏 一种LncRNA学习系统
CN112885412A (zh) * 2021-02-25 2021-06-01 深圳华大基因科技服务有限公司 基因组注释方法、装置、可视化平台和存储介质
CN113362901A (zh) * 2021-05-14 2021-09-07 海南大学 快速进行全基因组注释区间比较的方法及系统
CN113362901B (zh) * 2021-05-14 2023-09-01 海南大学 快速进行全基因组注释区间比较的方法及系统
CN115458057A (zh) * 2022-08-15 2022-12-09 新疆碳智干细胞库有限公司 一种人类基因全外显检测数据的分析方法
CN115331829A (zh) * 2022-10-14 2022-11-11 神州医疗科技股份有限公司 应用于医学领域的数据显示方法、装置、电子设备和介质

Similar Documents

Publication Publication Date Title
CN106021984A (zh) 一种全外显子组测序数据分析系统
CN104762402B (zh) 超快速检测人类基因组单碱基突变和微插入缺失的方法
US10354747B1 (en) Deep learning analysis pipeline for next generation sequencing
CN102952854B (zh) 单细胞分类和筛选方法及其装置
CN105930690A (zh) 一种全外显子组测序数据分析方法
CN106971071A (zh) 一种临床决策支持系统及方法
CN107849612A (zh) 比对和变体测序分析管线
CN108319813A (zh) 循环肿瘤dna拷贝数变异的检测方法和装置
CN110021346B (zh) 基于RNAseq数据的基因融合与突变检测方法及系统
CN109994154A (zh) 一种单基因隐性遗传疾病候选致病基因的筛选装置
Bhargava et al. DNA barcoding in plants: evolution and applications of in silico approaches and resources
US20220277811A1 (en) Detecting False Positive Variant Calls In Next-Generation Sequencing
CN108021788A (zh) 基于细胞游离dna的深度测序数据提取生物标记物的方法和装置
CN111584006A (zh) 基于机器学习策略的环形rna识别方法
JP2015089364A (ja) 体細胞多重変異によるがん診断方法、がん医薬開発方法及びがん診断装置
Miller et al. Quality-controlled R-loop meta-analysis reveals the characteristics of R-loop consensus regions
CN109524060B (zh) 一种遗传病风险提示的基因测序数据处理系统与处理方法
CN109461473B (zh) 胎儿游离dna浓度获取方法和装置
CN109686414A (zh) 仅用于肝癌筛查的特异甲基化检测位点组合的选取方法
US20160357906A1 (en) Biological data annotation and visualization
CN116564406A (zh) 一种遗传变异自动化解读方法及设备
CN104598775A (zh) 一种rna编辑事件识别机制及其高效实现方案
Nelson et al. Statistical issues in constructing high resolution physical maps
Lavrichenko et al. SeeCiTe: a method to assess CNV calls from SNP arrays using trio data
Padmavathi et al. A comprehensive in-silico computational analysis of twenty cancer exome datasets and identification of associated somatic variants reveals potential molecular markers for detection of varied cancer types

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20161012

RJ01 Rejection of invention patent application after publication