CN107480468B - 基因样本分析方法及电子设备 - Google Patents

基因样本分析方法及电子设备 Download PDF

Info

Publication number
CN107480468B
CN107480468B CN201710546112.0A CN201710546112A CN107480468B CN 107480468 B CN107480468 B CN 107480468B CN 201710546112 A CN201710546112 A CN 201710546112A CN 107480468 B CN107480468 B CN 107480468B
Authority
CN
China
Prior art keywords
sample
gene
variation
gene sample
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710546112.0A
Other languages
English (en)
Other versions
CN107480468A (zh
Inventor
蔡文君
何光铸
王东辉
侯晓帆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ronglian Technology Group Co Ltd
Original Assignee
Ronglian Technology Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ronglian Technology Group Co Ltd filed Critical Ronglian Technology Group Co Ltd
Priority to CN201710546112.0A priority Critical patent/CN107480468B/zh
Publication of CN107480468A publication Critical patent/CN107480468A/zh
Application granted granted Critical
Publication of CN107480468B publication Critical patent/CN107480468B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/252Integrating or interfacing systems involving database management systems between a Database Management System and a front-end application
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression

Abstract

本发明公开了一种基因样本分析方法,包括:接收基因样本选取指令;显示变异过滤选取界面;同时,根据被选取的基因样本,提取各被选取的基因样本的共同变异信息,形成待分析样本数据并将其缓存在内存中;接收过滤条件选取指令;从内存中调用所述待分析样本数据,并根据过滤条件完成基因样本变异分析。本发明公开了一种采用了所述基因样本分析方法的电子设备。本发明提供的基因样本分析方法及电子设备,能够提高基因样本分析的反应速度。

Description

基因样本分析方法及电子设备
技术领域
本发明涉及数据处理技术领域,特别是指一种基因样本分析方法及电子设备。
背景技术
基因样本变异分析需要对比多个基因样本,而每个基因样本可含几十万个变异,数据量可达十个GB。例如,一个人外显子(WES)数据,每个基因样本大约有20万个变异,每个变异信息数据大约在1-2KB左右,所以一个基因样本大约有200-400MB的数据。在小规模的群体数据分析中,当有40个基因样本的时候,数据量便达到了10GB之多。
基因样本变异分析是要从这几十万个变异当中,找出几个最可能致病的变异,而过程中需要多次反复使用多种不同的过滤和对比条件,所以用户界面的反应速度是影响用户体验和工作效率的重要因素。
一般来说,对应于不同的病人症状,一个病理学医生会有一系列不同的过滤条件。另一方面,虽然变异总数有很多,但与病人的疾病相关的变异却不多,与之关联的每一条医疗记录都必须被详细检查是否支持病人的症状。所以,医生使用变异过滤系统来筛选出相关的变异需要经过很多轮。
在多基因样本变异分析系统中,需要对变异进行频繁的过滤和比较,每次操作可能需要几十秒以上才能反应过来,如Garven Institute的Seave系统,输入3个基因样本的数据,每次操作反应时间在15秒以上,用户界面反馈较慢,操作体验不佳。
此外,由于基因样本的数据量较大,无法把基因样本数据缓存在有限的内存之中,而单是从一般的储存设备(如硬盘)中把基因样本数据读一次,就可能需要长达十秒的时间。同时,由于可供过滤和对比条件太多,也无法通过预先建立索引的方式来降低需要读取的数据量。
发明内容
有鉴于此,本发明的目的在于提供一种基因样本分析方法及电子设备,能够提高基因样本分析的反应速度。
基于上述目的本发明提供的基因样本分析方法,包括:
接收基因样本选取指令;
显示变异过滤选取界面;同时,根据被选取的基因样本,提取各被选取的基因样本的共同变异信息,形成待分析样本数据并将其缓存在内存中;
接收过滤条件选取指令;
从内存中调用所述待分析样本数据,并根据过滤条件完成基因样本变异分析。
可选的,根据被选取的基因样本,提取各被选取的基因样本的共同变异信息,形成待分析样本数据,包括:
在同一个变异信息出现在多个基因样本之中时,仅设置一个记录,每条记录里设置标记字段来记录该变异信息在每个样品中是否出现。
可选的,根据被选取的基因样本,提取各被选取的基因样本的共同变异信息,形成待分析样本数据,还包括:
保留各被选取的基因样本的独有变异信息,以支持关于所述独有变异信息的查询。
可选的,所述方法还包括:
采用Manifest.json文件来管理每个基因样本的共同变异信息。
可选的,根据过滤条件完成基因样本变异分析的步骤之后,还包括:
输出基因样本变异分析结果。
可选的,所述基因样本变异分析结果为output.json格式。
可选的,输出基因样本变异分析结果的步骤之后,还包括:
接收二次过滤条件选取指令;
调用所述基因样本变异分析结果,并根据二次过滤条件再次完成基因样本变异分析。
可选的,根据二次过滤条件再次完成基因样本变异分析的步骤之后,还包括:
再次输出基因样本变异分析结果。
可选的,所述方法还包括:
接收停止分析指令;
将所述基因样本变异分析结果存储于磁盘并退出分析。
本发明实施例的第二个方面,提供了一种电子设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1-9任意一项所述的方法。
从上面所述可以看出,本发明提供的基因样本分析方法及电子设备,通过构建待分析样本数据,从而将样本数据进行了压缩,使其占用空间大大减小(整体的数据量能够把数据量压缩到1GB以内,从而能够减少90%以上),同时把经压缩的数据缓存在内存中,能够满足用户快速分析的需要;并且,通过令用户在过滤条件选择界面下进行过滤条件选择的同时进行待分析样本数据的创建(即表面上用户在进行过滤条件选取,在后台也在同时进行待分析样本数据的创建),从而利用用户界面设计,隐藏了系统从存储设备中读出基因样本数据和压缩数据所需的时间。
附图说明
图1为本发明提供的基因样本分析方法的一个实施例的流程示意图;
图1a为本发明提供的基因样本分析方法实施例中待分析样本数据的数据结构示意图;
图2为本发明提供的基因样本分析方法的另一个实施例的流程示意图;
图2a为本发明提供的基因样本分析方法的另一个实施例中的用户操作流程示意图;
图3为本发明提供的基因样本分析装置的一个实施例的结构示意图;
图4为本发明提供的电子设备的一个实施例的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
基于上述目的,本发明实施例的第一个方面,提出了一种能够提高基因样本分析的反应速度的基因样本分析方法。如图1所示,为本发明提供的基因样本分析方法的一个实施例的流程示意图。
所述基因样本分析方法,包括:
步骤101:接收基因样本选取指令;这里,所述基因样本选取指令中包含了用户在样本列表中选定的基因样本(参见图2a,样本关系框中打勾的即为被选取的基因样本);
步骤102:显示变异过滤选取界面(参见图2a,变异过滤选取界面可以是变异过滤器框中显示的内容),供用户对需要进行过滤的选项进行选择;同时,根据被选取的基因样本,从存储基因样本数据的数据库中获取被选取的基因样本并提取各被选取的基因样本的共同变异信息,形成待分析样本数据(参考图2a中的memory table)并将其缓存在内存中;
步骤103:接收过滤条件选取指令;这里,所述基因样本选取指令中包含了用户所选取的过滤条件;如下是一个过滤条件的例子,可以用来比较和分析样品:“常染色体显性遗传(autosomal dominant),常染色体隐性遗传(autosomal recessive),新发突变(denovo),X染色体显性遗传(X-link dominant)”;
步骤104:从内存中调用所述待分析样本数据,并根据过滤条件,通过应用过滤器(参考附图2a)完成基因样本变异分析,得到基因样本变异分析结果(参考附图2a中右下角的表格)。
从上述实施例可以看出,本发明实施例提供的基因样本分析方法,通过构建待分析样本数据,从而将样本数据进行了压缩,使其占用空间大大减小(整体的数据量能够把数据量压缩到1GB以内,从而能够减少90%以上),同时把经压缩的数据缓存在内存中,能够满足用户快速分析的需要;并且,通过令用户在过滤条件选择界面下进行过滤条件选择的同时进行待分析样本数据的创建(即表面上用户在进行过滤条件选取,在后台也在同时进行待分析样本数据的创建),从而利用用户界面设计,隐藏了系统从存储设备中读出基因样本数据和压缩数据所需的时间。本发明实施例提供的基因样本分析方法,在进行变异分析的各种操作上,均可以在5秒之内反应,而且一般的硬件配置就可以满足要求。
可选的,所述待分析样本数据中的共同变异信息可以包括下表1中的变量(variant)中的多个。VCF(Variant Call Format)是一个用于存储基因序列突变信息的文本格式,表示单碱基突变、插入/缺失、拷贝数变异和结构变异等。BCF格式文件是VCF格式的二进制文件。
表1
Figure BDA0001343146190000051
Figure BDA0001343146190000061
Figure BDA0001343146190000071
为了使表1的内容更加容易理解,以下补充一些关于相应变量的补充说明。
phred_quality:一个碱基的错误概率的对数值,Phred quality score=-10*log10(error probability),例如Phred值为30,则这个碱基测序错误的概率为0.001。
barcode:多个样本在一条lane(测序泳道)测序时,区分不同样本的标签序列。
0-based/1-based:指基因组坐标从0开始计数或是从1开始计数。
Ensembl ID:Ensembl是一项生物信息学研究计划,旨在开发一种能够对真核生物基因组进行自动注释并加以维护的系统。Ensembl ID是Ensembl数据库中使用的编号,前缀是物种学名和类型,后面是一串数字和版本号。
RefSeq ID:NCBI的参考序列(RefSeq)计划,为多种生物提供序列的数据信息及相关资料,用于医学、基因功能等研究。RefSeq数据库是一个综合性的、非冗余的、提供参考序列注释的数据库,包括基因、转录本、蛋白质等信息。RefSeq ID指RefSeq数据库中使用的编号。
COSMIC数据库:COSMIC(the Catalogue Of Somatic Mutations In Cancer)是探索人类癌症中体细胞突变影响的世界上最大最全面的资源库。
OMIM数据库:OMIM(Online Mendelian Inheritance in Man)是记录人类基因和遗传性疾病的在线数据库。
Orphanet数据库:一个收集了罕见病和罕见病药物的知识库,致力于提高罕见病的诊断、护理和治疗效果。
dbSNP:一个关于单碱基多态性以及短的碱基插入、删除多态性的资源库。
Clinvar:Clinvar是一个描述人类变异-表型相关性及其证据的免费的、公开的数据库。
ExAC:ExAC(Exome Aggregation Consortium)是一个外显子组整合数据库,综合了多个测序项目的外显子组测序数据,目前有超过六万例不相关个体的测序数据。
dbNSFP:人类基因组非同义单碱基变异功能预测和注释数据库,包括了多种预测算法、保守型分值和其他相关信息(例如等位基因频率、不同的基因ID、基因功能描述、基因表达、基因互作等)。
CADD(Combined Annotation Dependent Depletion)值:是CADD工具对SNV(单碱基变异)、Indel(短序列的插入删除)的有害性的打分,整合多种信息注释变异位点。
CAROL(Combined Annotation scoRing toOL)值:是一个非同义突变的综合功能注释分值,综合了PolyPhen-2和SIFT两个软件的信息,来提高对非同义突变的预测。
SIFT(Sorting Intolerant From Tolerant)值:表示该变异对蛋白序列的影响。SIFT_score是SIFT分值,分值越小表示该SNV导致蛋白结构或功能变异的可能性越大。SIFT_pred是预测结果,取值为T或者D,T为Tolerated,表示变异对功能影响较小,D为Deleterious,表示可能对功能影响较大。当该变异同时影响多个蛋白序列时,对每条蛋白序列有一个SIFT值,取最小值。
PolyPhen 2HVAR预测:利用PloyPhen2基于HumanVar数据库预测该变异对蛋白序列的影响,用于孟德尔遗传病的诊断。Polyphen2_HVAR_score是PolyPhen2分值,数值越大表明该变异导致蛋白结构或功能改变的可能性越大。Polyphen2_HVAR_pred是预测结果,取值为D或P或B(D:Probably damaging;P:possibly damaging;B:benign)
FATHMM值:FATHMM预测结果,表示该变异对蛋白序列的影响。FATHMM_score是FATHMM初始分值,分值越小表明该变异导致蛋白结构或功能改变的可能性大。FATHMM_pred是D或T(D:Deleterious;T:Tolerated)。
LRT预测:LRT预测结果,表示该变异对蛋白序列的影响,LRT_score是LRT分值,分值越小表明该变异导致蛋白或功能变异的可能性越大。LRT_pred是预测结果,取值为D、N或U(D:Deleterious;N:Neutral;U:Unknown)。
MutationAssessor预测:MutationAssessor预测结果,表示该变异对蛋白序列的影响。MutationAssessor_score是MutationAssessor初始分值,分值越大表明变异导致蛋白结构或功能改变的可能性大。MutationAssessor_pred是H、M、L、N(H:heigh;M:medium;L:low;N:neutral)。
MutationTaster预测:MutationTaster预测结果,表示该变异对蛋白序列的影响。MutationTaster_score是MutationTaster分值,取值0-1,分值越大越可能有害。MutationTaster_pred是预测结果,取值为A、D、N或者P。"A"("disease_causing_automatic");"D"("disease_causing");"N"("polymorphism");"P"("polymorphism_automatic")。
phyloP 20way mammalian预测:PhyloP预测结果,基于20个哺乳动物的多序列比对得到位点的保守性分值,分值越大,位点越保守。
GERP++RS:用GERP(Genomic Evolutionary Rate Profiling)方法预测变异的分值,分值越高,位点越保守,大于2的位点认为是保守位点。
SiPhy 29way logOdds:SiPhy是基于29种哺乳动物的多序列比对得到位点的保守性分值,分值越大,位点越保守。
Align GVGD预测:整合氨基酸和蛋白多序列比对的特点,预测目标区基因的错义替换。
GeneSplicer:一个快速灵活的检测各种真核基因组中剪接位点的系统。
MaxEntScan:基于短序列motifs建模方法对变异的打分。
Case-Control关系:病例对照研究。
Trio Analysis:三人核心家系分析,即父母和子女组成的三人家系。
ESP6500:代表6500人的外显子测序数据库。
PolyPhen-2:Polymorphism Phenotyping version 2,多态表现型v2版。
GERP++中性率:GERP++软件预测该变异位点的中性进化速率。
GERP++RS(rejected substitutions)值:中性进化速率减去最大似然法预估的进化速率。
在一些可选实施方式中,所述根据被选取的基因样本,提取各被选取的基因样本的共同变异信息,形成待分析样本数据的步骤102,具体包括:
在同一个变异信息出现在多个基因样本之中时,仅设置一个记录,每条记录里设置标记字段来记录该变异信息在每个样品中是否出现。
在一些可选实施方式中,根据被选取的基因样本,提取各被选取的基因样本的共同变异信息,形成待分析样本数据的步骤102,还可包括:
保留各被选取的基因样本的独有变异信息,以支持关于所述独有变异信息的查询;可选的,还可以保留各被选取的基因样本的变异特有数据,以支持关于所述变异特有数据的查询。
可选的,所述被选取的基因样本的独有变异信息和被选取的基因样本的变异特有数据可进一步整合到所述待分析样本数据中,以方便数据的存储和查询。
在一些可选实施方式中,所述基因样本分析方法,还包括:
采用Manifest.json文件来管理每个基因样本的共同变异信息,可选的,所述Manifest.json文件的具体格式如下:
Figure BDA0001343146190000101
Figure BDA0001343146190000111
在一些可选实施方式中,根据过滤条件完成基因样本变异分析的步骤104之后,还可包括:
输出基因样本变异分析结果,从而便于用户对分析结果进行进一步分析。
在一些可选实施方式中,所述基因样本变异分析结果为output.json格式,可选的,该output.json文件的具体格式如下:
Figure BDA0001343146190000112
Figure BDA0001343146190000121
在一些可选实施方式中,输出基因样本变异分析结果的步骤之后,还包括:
接收二次过滤条件选取指令;
调用所述基因样本变异分析结果,并根据二次过滤条件再次完成基因样本变异分析。
这样,可以对已经获得的基因样本变异分析结果进行二次分析。
在一些可选实施方式中,根据二次过滤条件再次完成基因样本变异分析的步骤之后,还包括:
再次输出基因样本变异分析结果,从而便于用户进行进一步的二次分析。
在一些可选实施方式中,所述基因样本分析方法,还包括:
接收停止分析指令;
将所述基因样本变异分析结果存储于磁盘并退出分析。
本发明还提供了一种能够提高基因样本分析的反应速度的基因样本分析方法的另一个实施例。如图2所示,为本发明提供的基因样本分析方法的另一个实施例的流程示意图。
参考附图2并结合附图2a,所述基因样本分析方法,包括:
步骤201:显示基因样本列表界面和基因样本关系界面;样品关系指:单个样品分析、Case-Control(病例对照)关系、Trio Analysis(三人核心家系分析)关系;
步骤202:接收基因样本选取指令;
步骤203:显示变异过滤选取界面(变异过滤器);同时,根据被选取的基因样本,提取各被选取的基因样本的共同变异信息,形成待分析样本数据并将其缓存在内存中;
步骤204:接收过滤条件选取指令;
步骤205:从内存中调用所述待分析样本数据,并根据过滤条件完成基因样本变异分析;
步骤206:输出基因样本变异分析结果;
步骤207:接收二次过滤条件选取指令(改变过滤标准);
步骤208:调用所述基因样本变异分析结果,并根据二次过滤条件再次完成基因样本变异分析;
步骤209:再次输出基因样本变异分析结果;这里,若有需要可以更改过滤条件并再次进行二次过滤,重复步骤207~步骤209直至得到所需的分析结果;
步骤210:接收停止分析指令;
步骤211:将所述基因样本变异分析结果存储于磁盘并退出分析。
从上述实施例可以看出,本发明实施例提供的基因样本分析方法,通过构建待分析样本数据,从而将样本数据进行了压缩,使其占用空间大大减小(整体的数据量能够把数据量压缩到1GB以内,从而能够减少90%以上),同时把经压缩的数据缓存在内存中,能够满足用户快速分析的需要;并且,通过令用户在过滤条件选择界面下进行过滤条件选择的同时进行待分析样本数据的创建(即表面上用户在进行过滤条件选取,在后台也在同时进行待分析样本数据的创建),从而利用用户界面设计,隐藏了系统从存储设备中读出基因样本数据和压缩数据所需的时间。本发明实施例提供的基因样本分析方法,在进行变异分析的各种操作上,均可以在5秒之内反应,而且一般的硬件配置就可以满足要求。
基于上述目的,本发明实施例的第二个方面,提出了一种能够提高基因样本分析的反应速度的基因样本分析装置。如图3所示,为本发明提供的基因样本分析装置的一个实施例的结构示意图。
所述基因样本分析装置,包括:
指令接收模块301,用于接收基因样本选取指令和过滤条件选取指令;
显示模块302,用于显示变异过滤选取界面;
样本数据提取模块303,用于根据被选取的基因样本,提取各被选取的基因样本的共同变异信息,形成待分析样本数据并将其缓存在内存中;
分析模块304,用于从内存中调用所述待分析样本数据,并根据过滤条件完成基因样本变异分析。
在一些可选实施方式中,所述样本数据提取模块303,具体用于:
在同一个变异信息出现在多个基因样本之中时,仅设置一个记录,每条记录里设置标记字段来记录该变异信息在每个样品中是否出现。
在一些可选实施方式中,所述样本数据提取模块303,还用于:
保留各被选取的基因样本的独有变异信息,以支持关于所述独有变异信息的查询。
在一些可选实施方式中,所述样本数据提取模块303,具体用于:
采用Manifest.json文件来管理每个基因样本的共同变异信息。
在一些可选实施方式中,所述分析模块304,具体用于:
输出基因样本变异分析结果。
在一些可选实施方式中,所述基因样本变异分析结果为output.json格式。
在一些可选实施方式中,所述指令接收模块301,还用于接收二次过滤条件选取指令;
所述分析模块304,还用于调用所述基因样本变异分析结果,并根据二次过滤条件再次完成基因样本变异分析。
在一些可选实施方式中,所述分析模块304,还用于:
再次输出基因样本变异分析结果。
在一些可选实施方式中,所述指令接收模块301,还用于接收停止分析指令;
所述分析模块304,还用于将所述基因样本变异分析结果存储于磁盘并退出分析。
基于上述目的,本发明实施例的第三个方面,提出了一种执行所述基因样本分析方法的装置的一个实施例。如图4所示,为本发明提供的执行所述基因样本分析方法的装置的一个实施例的硬件结构示意图。
如图4所示,所述装置包括:
一个或多个处理器401以及存储器402,图4中以一个处理器401为例。
所述执行所述基因样本分析方法的装置还可以包括:输入装置403和输出装置404。
处理器401、存储器402、输入装置403和输出装置404可以通过总线或者其他方式连接,图4中以通过总线连接为例。
存储器402作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本申请实施例中的所述基因样本分析方法对应的程序指令/模块(例如,附图3所示的指令接收模块301、显示模块302、样本数据提取模块303和分析模块304)。处理器401通过运行存储在存储器402中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例的基因样本分析方法。
存储器402可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据基因样本分析装置的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器402可选包括相对于处理器401远程设置的存储器,这些远程存储器可以通过网络连接至会员用户行为监控装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置403可接收输入的数字或字符信息,以及产生与基因样本分析装置的用户设置以及功能控制有关的键信号输入。输出装置404可包括显示屏等显示设备。
所述一个或者多个模块存储在所述存储器402中,当被所述一个或者多个处理器401执行时,执行上述任意方法实施例中的基因样本分析方法。所述执行所述基因样本分析方法的装置的实施例,其技术效果与前述任意方法实施例相同或者类似。
本申请实施例提供了一种非暂态计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的列表项操作的处理方法。所述非暂态计算机存储介质的实施例,其技术效果与前述任意方法实施例相同或者类似。
最后需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关硬件来完成,所述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储器(Read-Only Memory,ROM)或随机存储器(RandomAccess Memory,RAM)等。所述计算机程序的实施例,其技术效果与前述任意方法实施例相同或者类似。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本发明难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本发明难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本发明的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本发明的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本发明。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本发明的具体实施例对本发明进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本发明的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本发明的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基因样本分析方法,其特征在于,包括:
接收基因样本选取指令;
显示变异过滤选取界面;同时,根据被选取的基因样本,提取各被选取的基因样本的共同变异信息,形成待分析样本数据并将其缓存在内存中;
接收过滤条件选取指令;
从内存中调用所述待分析样本数据,并根据过滤条件完成基因样本变异分析;
其中,根据被选取的基因样本,提取各被选取的基因样本的共同变异信息,形成待分析样本数据,包括:在同一个变异信息出现在多个基因样本之中时,仅设置一个记录,每条记录里设置标记字段来记录该变异信息在每个样品中是否出现;
根据被选取的基因样本,提取各被选取的基因样本的共同变异信息,形成待分析样本数据,还包括:保留各被选取的基因样本的独有变异信息,以支持关于所述独有变异信息的查询。
2.根据权利要求1所述的方法,其特征在于,还包括:
采用Manifest.json文件来管理每个基因样本的共同变异信息。
3.根据权利要求1所述的方法,其特征在于,根据过滤条件完成基因样本变异分析的步骤之后,还包括:
输出基因样本变异分析结果。
4.根据权利要求3所述的方法,其特征在于,所述基因样本变异分析结果为output.json格式。
5.根据权利要求3所述的方法,其特征在于,输出基因样本变异分析结果的步骤之后,还包括:
接收二次过滤条件选取指令;
调用所述基因样本变异分析结果,并根据二次过滤条件再次完成基因样本变异分析。
6.根据权利要求5所述的方法,其特征在于,根据二次过滤条件再次完成基因样本变异分析的步骤之后,还包括:
再次输出基因样本变异分析结果。
7.根据权利要求3-6任一项所述的方法,其特征在于,还包括:
接收停止分析指令;
将所述基因样本变异分析结果存储于磁盘并退出分析。
8.一种电子设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储可被所述一个处理器执行指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1-7任意一项所述的方法。
CN201710546112.0A 2017-07-06 2017-07-06 基因样本分析方法及电子设备 Active CN107480468B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710546112.0A CN107480468B (zh) 2017-07-06 2017-07-06 基因样本分析方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710546112.0A CN107480468B (zh) 2017-07-06 2017-07-06 基因样本分析方法及电子设备

Publications (2)

Publication Number Publication Date
CN107480468A CN107480468A (zh) 2017-12-15
CN107480468B true CN107480468B (zh) 2020-10-02

Family

ID=60595578

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710546112.0A Active CN107480468B (zh) 2017-07-06 2017-07-06 基因样本分析方法及电子设备

Country Status (1)

Country Link
CN (1) CN107480468B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109727646A (zh) * 2018-12-29 2019-05-07 北京优迅医学检验实验室有限公司 基因样本的处理方法及装置、移动终端
CN110008217B (zh) * 2019-04-08 2021-11-30 湖南大地同年生物科技有限公司 一种面向基因组突变数据的存储和索引处理方法
CN112187953B (zh) * 2020-10-13 2022-05-03 南开大学 一种基于json的基因本体映射系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104603609A (zh) * 2013-07-31 2015-05-06 株式会社日立制作所 基因变异分析装置、基因变异分析系统以及基因变异分析方法
CN106055926A (zh) * 2016-05-13 2016-10-26 万康源(天津)基因科技有限公司 一种基因拷贝数变异分析系统
CN106611106A (zh) * 2016-12-06 2017-05-03 北京荣之联科技股份有限公司 基因变异检测方法及装置
CN106682393A (zh) * 2016-11-29 2017-05-17 北京荣之联科技股份有限公司 基因组序列比对方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104603609A (zh) * 2013-07-31 2015-05-06 株式会社日立制作所 基因变异分析装置、基因变异分析系统以及基因变异分析方法
CN106055926A (zh) * 2016-05-13 2016-10-26 万康源(天津)基因科技有限公司 一种基因拷贝数变异分析系统
CN106682393A (zh) * 2016-11-29 2017-05-17 北京荣之联科技股份有限公司 基因组序列比对方法及装置
CN106611106A (zh) * 2016-12-06 2017-05-03 北京荣之联科技股份有限公司 基因变异检测方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Bicluster数据分析软件设计与实现;黄安杰;《中国优秀硕士学位论文全文数据库信息科技辑》;20120615(第6期);第I138-172页 *

Also Published As

Publication number Publication date
CN107480468A (zh) 2017-12-15

Similar Documents

Publication Publication Date Title
US10204208B2 (en) Systems and methods for genomic variant annotation
Schlicker et al. Improving disease gene prioritization using the semantic similarity of Gene Ontology terms
US8751166B2 (en) Parallelization of surprisal data reduction and genome construction from genetic data for transmission, storage, and analysis
Clima et al. HmtDB 2016: data update, a better performing query system and human mitochondrial DNA haplogroup predictor
US20150066378A1 (en) Identifying Possible Disease-Causing Genetic Variants by Machine Learning Classification
Barker et al. EvoPipes. net: bioinformatic tools for ecological and evolutionary genomics
US20160026755A1 (en) Identifying Ancestral Relationships using a Continuous Stream of Input
CN107480468B (zh) 基因样本分析方法及电子设备
WO2015140794A1 (en) Methods and systems for genome comparison
US20160048633A1 (en) Systems and methods for genomic variant annotation
CA2986810C (en) Thermodynamic measures on protein-protein interaction networks for cancer therapy
US20220301672A1 (en) Computing device with improved user interface for interpreting and visualizing data
US8855938B2 (en) Minimization of surprisal data through application of hierarchy of reference genomes
He et al. Comprehensive fundamental somatic variant calling and quality management strategies for human cancer genomes
CN114334078A (zh) 用于推荐药物的方法、电子设备和计算机存储介质
CN107967411B (zh) 一种脱靶位点的检测方法、装置及终端设备
CN107408162B (zh) 用于分析基因的方法及装置
US10331626B2 (en) Minimization of surprisal data through application of hierarchy filter pattern
CN111128308A (zh) 一种神经精神疾病新发突变信息知识平台
CN114822700B (zh) 用于呈现重排或融合结构亚型的方法、设备和介质
Mackay et al. A statistical approach to mutation detection in zebrafish with next‐generation sequencing
US20140310214A1 (en) Optimized and high throughput comparison and analytics of large sets of genome data
Tan et al. Interactive exploration, analysis, and visualization of complex phenome–genome datasets with ASPIREdb
CN110570908A (zh) 测序序列多态识别方法及装置、存储介质、电子设备
Kumar et al. Big Data Analysis Techniques for Visualization of Genomics in Medicinal Plants

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 1002-1, 10th floor, No.56, Beisihuan West Road, Haidian District, Beijing 100080

Applicant after: Ronglian Technology Group Co.,Ltd.

Address before: 100080, Beijing, Haidian District, No. 56 West Fourth Ring Road, glorious Times Building, 10, 1002-1

Applicant before: UNITED ELECTRONICS Co.,Ltd.

GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20171215

Assignee: CHINA TECHNOLOGY EXCHANGE Co.,Ltd.

Assignor: Ronglian Technology Group Co.,Ltd.

Contract record no.: X2021980013287

Denomination of invention: Gene sample analysis method and electronic equipment

Granted publication date: 20201002

License type: Exclusive License

Record date: 20211124

PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Gene sample analysis method and electronic equipment

Effective date of registration: 20211130

Granted publication date: 20201002

Pledgee: CHINA TECHNOLOGY EXCHANGE Co.,Ltd.

Pledgor: Ronglian Technology Group Co.,Ltd.

Registration number: Y2021110000080

PC01 Cancellation of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20230129

Granted publication date: 20201002

Pledgee: CHINA TECHNOLOGY EXCHANGE Co.,Ltd.

Pledgor: Ronglian Technology Group Co.,Ltd.

Registration number: Y2021110000080

EC01 Cancellation of recordation of patent licensing contract
EC01 Cancellation of recordation of patent licensing contract

Assignee: CHINA TECHNOLOGY EXCHANGE Co.,Ltd.

Assignor: Ronglian Technology Group Co.,Ltd.

Contract record no.: X2021980013287

Date of cancellation: 20230321

EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20171215

Assignee: CHINA TECHNOLOGY EXCHANGE Co.,Ltd.

Assignor: Ronglian Technology Group Co.,Ltd.

Contract record no.: X2023110000048

Denomination of invention: Gene Sample Analysis Methods and Electronic Devices

Granted publication date: 20201002

License type: Exclusive License

Record date: 20230323

PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Gene Sample Analysis Methods and Electronic Devices

Effective date of registration: 20230327

Granted publication date: 20201002

Pledgee: CHINA TECHNOLOGY EXCHANGE Co.,Ltd.

Pledgor: Ronglian Technology Group Co.,Ltd.

Registration number: Y2023110000130