发明内容
针对以上对敲除策略的GC含量筛选分析耗时耗力耗人才,而且筛选分析方 式单一、出错率高和效率效益低下的问题缺陷,本发明提供一种自动并行化敲 除策略GC含量分析的方法及系统,使对敲除策略的GC含量筛选分析省时省力 ,筛选方式智能并行化、出错率低和效率效益高。
本发明具体通过以下技术方案实现:
一种自动并行化敲除策略GC含量分析的方法,所述方法具体包括如下步骤 :
步骤S10,获取需要进行GC含量分析的敲除策略数据信息;
步骤S20,对敲除策略数据信息进行GC含量分析和过滤筛选;
步骤S30,针对GC含量分析结果数据按照含量高或低进行分值赋予;
步骤S40,根据分值赋予数据,整理生成敲除策略GC含量数据信息集。
进一步地,所述对敲除策略数据信息进行GC含量分析为并行化分析;
所述针对GC含量分析结果数据按照含量高或低进行分值赋予为并行化分值 赋予。
进一步地,所述整理生成敲除策略GC含量数据信息集,包括整理生成敲除 策略GC含量分析结果报告。
进一步地,所述步骤S20中,设置有GC含量范围阀值;
所述步骤S20中,还包括如下步骤:
步骤S201,将敲除策略与所述的GC含量范围阀值进行对比判定;
步骤S202,剔除超出所述的GC含量范围阀值的敲除策略。
进一步地,所述步骤S40中,还包括如下步骤:
步骤S401,获取已赋予分值的敲除策略GC含量数据信息;
步骤S402,对含有分值的敲除策略GC含量数据信息进行整理对比;
步骤S403,统计生成分值最高的GC含量敲除策略。
为达到上述目的,本发明还提供一种自动并行化敲除策略GC含量分析的系 统,所述系统包括:
数据获取单元,用于获取需要进行GC含量分析的敲除策略数据信息;
分析过滤筛选单元,用于对敲除策略数据信息进行GC含量分析和过滤筛选 ;
分值赋予单元,用于针对GC含量分析结果数据按照含量高或低进行分值赋 予;
数据整理生成单元,用于根据分值赋予数据,整理生成敲除策略GC含量数 据信息集。
进一步地,所述的分析过滤筛选单元中设置有多个阀值;
所述的分析过滤筛选单元还包括:阈值对比模块和剔除模块;
阈值对比模块,用于将敲除策略与所述的GC含量范围阀值进行对比判定;
剔除模块,用于剔除超出所述的GC含量范围阀值的敲除策略。
进一步地,所述的数据整理生成单元包括:
第一数据获取模块,用于获取已赋予分值的敲除策略GC含量数据信息;
分值排比模块,用于对含有分值的敲除策略GC含量数据信息进行整理对比 ;
统计生成模块,用于统计生成分值最高的GC含量敲除策略。
为达到上述目的,本发明还提供一种自动并行化敲除策略GC含量分析的平 台,包括处理器、存储器以及自动并行化敲除策略GC含量分析的平台控制程序 ;
其中在所述处理器执行所述平台控制程序,所述自动并行化敲除策略GC含 量分析的平台控制程序被存储在所述存储器中,所述自动并行化敲除策略GC含 量分析的平台控制程序,实现所述的自动并行化敲除策略GC含量分析的方法步 骤。
为达到上述目的,本发明还提供一种计算机可读取存储介质,所述计算机 可读取存储介质存储有自动并行化敲除策略GC含量分析的平台控制程序,所述 自动并行化敲除策略GC含量分析的平台控制程序,实现所述的自动并行化敲除 策略GC含量分析的方法步骤。
与现有技术相比,本发明具有以下有益效果:
本发明通过一种自动并行化敲除策略GC含量分析的方法、系统、平台以及 存储介质,可以提高工作效率;降低出错概率;实现自动化并行化分析;实现 可视化展示;通过分析结果信息化,可以直接接入下游的生产系统,随时可取 ,随时可用;通过对分析方法模块化,即可作为一个独立的整体使用,亦可以 作为一部分接入任意一个进行敲除策略选取的自动化并行化系统。
具体实施方式
为便于更好的理解本发明的目的、技术方案和优点更加清楚,下面结合附 图和具体的实施方式对本发明作进一步说明,本领域技术人员可由本说明书所 揭示的内容轻易地了解本发明的其它优点与功效。
本发明亦可通过其它不同的具体实例加以施行或应用,本说明书中的各项 细节亦可基于不同观点与应用,在不背离本发明的精神下进行各种修饰与变更。
需要说明,若本发明实施例中有涉及方向性指示(诸如上、下、左、右、 前、后……),则该方向性指示仅用于解释在某一特定姿态(如附图所示)下各 部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方 向性指示也相应地随之改变。
另外,若本发明实施例中有涉及“第一”、“第二”等的描述,则该“第一 ”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性 或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特 征可以明示或者隐含地包括至少一个该特征。其次,各个实施例之间的技术方 案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术 方案的结合出现相互矛盾或无法实现时,应当认为这种技术方案的结合不存在 ,也不在本发明要求的保护范围之内。
优选地,本发明自动并行化敲除策略GC含量分析的方法应用在一个或者多 个终端或者服务器中。所述终端是一种能够按照事先设定或存储的指令,自动 进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成 电路(ApplicationSpecific Integrated Circuit,ASIC)、可编程门阵列(Field -Programmable GateArray,FPGA)、数字处理器(Digital Signal Processor ,DSP)、嵌入式设备等。
所述终端可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设 备。所述终端可以与客户通过键盘、鼠标、遥控器、触摸板或声控设备等方式 进行人机交互。
本发明为实现自动并行化敲除策略GC含量分析,提供的一种自动并行化敲 除策略GC含量分析的方法及系统。
如图2所示,是本发明实施例提供的一种自动并行化敲除策略GC含量分析 的方法的流程图。
在本实施例中,所述自动并行化敲除策略GC含量分析的方法,可以应用于 具备显示功能的终端或者固定终端中,所述终端并不限定于个人电脑、智能手 机、平板电脑、安装有摄像头的台式机或一体机等。
所述自动并行化敲除策略GC含量分析的方法也可以应用于由终端和通过网 络与所述终端进行连接的服务器所构成的硬件环境中。网络包括但不限于:广 域网、城域网或局域网。本发明实施例的自动并行化敲除策略GC含量分析的方 法可以由服务器来执行,也可以由终端来执行,还可以是由服务器和终端共同 执行。
例如,对于需要进行自动并行化敲除策略GC含量分析的终端,可以直接在 终端上集成本发明的方法所提供的自动并行化敲除策略GC含量分析功能,或者 安装用于实现本发明的方法的客户端。再如,本发明所提供的方法还可以软件 开发工具包(SoftwareDevelopment Kit,SDK)的形式运行在服务器等设备上 ,以SDK的形式提供自动并行化敲除策略GC含量分析功能的接口,终端或其他 设备通过所提供的接口即可实现自动并行化敲除策略GC含量分析的功能。
如图2所示,本发明提供了一种自动并行化敲除策略GC含量分析的方法, 所述方法具体包括如下步骤,根据不同的需求,该流程图中步骤的顺序可以改 变,某些步骤可以省略。
步骤S10,获取需要进行GC含量分析的敲除策略数据信息;
步骤S20,对敲除策略数据信息进行GC含量分析和过滤筛选;
步骤S30,针对GC含量分析结果数据按照含量高或低进行分值赋予;
步骤S40,根据分值赋予数据,整理生成敲除策略GC含量数据信息集。
较佳地,所述对敲除策略数据信息进行GC含量分析为并行化分析;
所述针对GC含量分析结果数据按照含量高或低进行分值赋予为并行化分值 赋予。
也就是说,本方法可以同时对多个不同的敲除策略进行自动化GC含量分析 ,也可以同时对一个敲除策略中的不同片段进行自动化GC含量分析。首先将GC 含量分析的模块和GC含量打分模块进行自动化流程化的整合,然后在不同的CPU 上进行任务部署,随时等待执行命令的指令。对不同敲除策略进行划分之后或 者对一个敲除策略进行区域划分之后,将需要进行GC含量分析的区域一一进行 任务发布,发布到不同的可接受GC含量分析和GC含量打分的自动化流程任务 的线程中,即可并行化对很多区域进行完整的GC含量分析,并最终得到GC含 量分析的分数。自动化并行化可以大大节省分析时间,提高分析效率。
所述整理生成敲除策略GC含量数据信息集,包括整理生成敲除策略GC含 量分析结果报告。
具体地,本方法可以同时对多个不同的敲除策略进行GC含量分析,也可以 同时对一个敲除策略中的不同区域进行GC含量分析。获得一个合适的敲除策略 ,需要对敲除区域、敲除区域的上游区域和敲除区域的下游区域进行分析,目 的是通过分析确保敲除该区域,不会对该区域的上下游区域的功能造成影响, 否则该敲除区域就不是一个合适的敲除区域,不能作为一个合适的敲除策略进 行基因敲除。对区域进行划分之后,将需要进行GC含量分析的区域传输到GC 含量分析模块,进行GC含量分析,得到GC含量分析的结果。再将GC含量分析 的结果传送至GC含量打分模块,结合GC含量特别高或者特别低的区域在敲除区域的具体位置,对敲除区域进行打分并输出,再根据该敲除策略的GC含量分 析结果判定该敲除策略是否为一个合适的敲除策略。
如图3所示,假设基因XX,有3个潜在的敲除策略A、B、C,当前需要对A、 B、C三个敲除策略进行GC含量分析,以确定每一个敲除策略是否满足GC含量 要求,若不满足,则该敲除策略需要被剔除。若满足,需要根据GC含量分析结 果判定满足条件的所有敲除策略中,哪一个敲除策略更优异。
首先,对ABC策略并行化进行GC含量分析流程。以策略A为例,划出敲除 区域、敲除区域上游区域和敲除区域下游区域,对3个区域并行化进行GC含量 分析并进行打分,获得每一个区域的GC含量分值,并计算出该敲除策略的综合 分值,即为敲除策略A的GC含量分值。若该分值小于等于m,则该区域可用, 否则不可用。同理,策略BC与策略A的分析流程一致。假设策略A不可用,策 略BC可用,而策略B的GC含量分值高于策略C的GC含量分值,则策略C为基 因XX的最优策略。
如图4所示,为本发明第二优选实施例。
所述步骤S20中,设置有GC含量范围阀值;
所述步骤S20中,还包括如下步骤:
步骤S201,将敲除策略与所述的GC含量范围阀值进行对比判定;
步骤S202,剔除超出所述的GC含量范围阀值的敲除策略。
也就是说,所述超出所述的GC含量范围阀值的敲除策略,直接被剔除。若 符合所述的GC含量范围阀值的敲除策略,则保留该敲除策略,进而进入下一操 作步骤。
也就是说,针对一个需要进行GC含量分析的区域而言,需要用户设定一个 其关注的片段长度window size,然后根据window size对分析区域进行划分 ,划分为连续的小片段,再对每一个小片段进行传统的GC含量分析。
假设分析区域长度为seq_length,以用户关注的片段长度window size对 该区域进行连续小片段的划分,得到n个连续的小片段:从第一个碱基开始,1 ~window size的片段为第一个小片段;2~window size+1为第二个小片段;3 ~window size+2为第三个小片段……seq_length-window size+1~seq_length 为第n个小片段。
将连续小片段中的每一个小片段进行传统意义上的GC含量分析,得到整个 分析区域中的每一个连续小片段的GC含量及其位置,即组成整个分析区域的GC 含量分析结果。
也就是说,本发明的GC含量方法是根据用户关注的序列片段长度,将整体 序列划分成长度为window size的连续小片段,对每一个连续小片段的GC碱基 组成占据整个小片段的碱基组成比例,作为该小片段的GC含量组成,然后整合 所有连续小片段的GC含量结果组成整条序列的GC含量分析结果。本发明的GC 含量分析结果如图5所示,序列共有200个碱基,其中碱基A有38个,碱基G 有65个,碱基T有31个,碱基C有66个,整条序列GC含量为(65+66) /200=131/200=65.5%。图例中window size为20,我们关注长度为20的每个序 列小片段的GC含量组成,长度为20的每个序列小片段内GC碱基的总数除以20 ,即为该小片段的GC含量,具体地,附图5中,横坐标表示碱基坐标,第一个 碱基坐标为1;纵坐标表示GC含量(单位%);具体内容为:Summary:总结;Full Length(200bp):序列全长200bp;A(19.0%38):序列中有38个碱基A,占比 19.0%;C(33.0%66):序列中有66个碱基A,占比33.0%;G(32.5%65):序列 中有65个碱基A,占比32.5%;T(15.5%31):序列中有31个碱基A,占比15.5%。
传统的GC含量分析,只考虑完整区域的GC碱基占整个区域碱基组成的比 例,作为该区域的GC含量,最终得到一个GC含量的结果,若将结果用可视化 图形展示,得到的是一个只有GC含量值的点。本模块区别于传统的GC含量分 析,是将完整的序列片段进行区域划分,得到n个连续片段的GC含量,若将结 果用可视化图形展示,得到的是一条有位置信息有GC含量值的波动起伏的折线 图,可直观的展示整个区域中不同区域GC含量的组成状况。
本发明第二优选实施例,具体包括如下步骤:
步骤S10,获取需要进行GC含量分析的敲除策略数据信息;
步骤S201,将敲除策略与所述的GC含量范围阀值进行对比判定;
步骤S202,剔除超出所述的GC含量范围阀值的敲除策略。
即本发明实施例的步骤S20,对敲除策略数据信息进行GC含量分析和过滤 筛选;
步骤S30,针对GC含量分析结果数据按照含量高或低进行分值赋予;
步骤S40,根据分值赋予数据,整理生成敲除策略GC含量数据信息集。
在本发明实施例中,具体地,所述的步骤S30,针对GC含量分析结果数据 按照含量高或低进行分值赋予;
经过步骤S20对敲除策略数据信息进行GC含量分析和过滤筛选后,对保留 下来的敲除策略进行分析处理,然后按照对敲除策略分析处理结果进行具体的 GC含量分值赋予。
更进一步地,所述分值为二进制分值、十进制分值或十六进制分值。
较佳地,所述针对GC含量分析结果数据按照含量高或低进行分值赋予为并 行化分值赋予。
也就是说,在本实施例中,保留下来的敲除策略将送入到打分机制中,同 时进行分值赋予,而且对其各个需要打分的类型同时进行分值赋予。
所述分值赋予可以对一个或多个敲除策略的GC含量同时进行分值赋予。
打分机制对敲除策略的GC含量进行打分,是根据敲除策略区域不同位置的 GC含量高低对敲除策略可行性的影响,得出出一套GC含量打分机制。并通过最 终敲除策略区域GC含量分值判定该敲除策略的可行性。
具体地GC含量打分机制如下:
敲除区域上游x bp至敲除区域下游y bp范围内,GC含量高于z或者低于 k,则敲除区域打s分,如果存在n个高于z或者低于k的区域,则打分为s*n。
敲除区域上游x1bp至敲除区域下游y1bp范围内,GC含量高于z1或者 低于k1,则敲除区域打s1分,如果存在n1个高于z1或者低于k1的区域,则 打分为s1*n1。
敲除区域上游x2bp至敲除区域下游y2bp范围内,GC含量高于z2或者 低于k2,则敲除区域打s2分,如果存在n2个高于z2或者低于k2的区域,则 打分为s2*n2。
敲除区域上游x3bp至敲除区域下游y3bp范围内,GC含量高于z3或者 低于k3,则敲除区域打s3分,如果存在n3个高于z3或者低于k3的区域,则 打分为s3*n3。
通过GC含量分析模块,现已得到敲除策略区域的GC含量组成。将此GC含 量组成的结果结合GC含量打分机制,即可获得整个敲除策略区域的GC含量分 值。
较佳地,所述步骤S40中,还包括如下步骤:
步骤S401,获取已赋予分值的敲除策略GC含量数据信息;
步骤S402,对含有分值的敲除策略GC含量数据信息进行整理对比;
步骤S403,统计生成分值最高的GC含量敲除策略。
具体地,经过针对GC含量分析结果数据按照含量高或低进行分值赋予后, 针对含有GC含量分值的敲除策略数据信息进行整理对比,即进行对敲除策略分 值高低排序,最终统计生成分值最高的GC含量敲除策略。
也就是说,在本发明实施例中,
如图6所示,本发明提供了一种自动并行化敲除策略GC含量分析的系统, 所述系统包括:
数据获取单元,用于获取需要进行GC含量分析的敲除策略数据信息;
分析过滤筛选单元,用于对敲除策略数据信息进行GC含量分析和过滤筛选 ;
分值赋予单元,用于针对GC含量分析结果数据按照含量高或低进行分值赋 予;
数据整理生成单元,用于根据分值赋予数据,整理生成敲除策略GC含量数 据信息集。
较佳地,所述的分析过滤筛选单元中设置有多个阀值;
如图7所示,所述的分析过滤筛选单元还包括:阈值对比模块和剔除模块 ;
阈值对比模块,用于将敲除策略与所述的GC含量范围阀值进行对比判定;
剔除模块,用于剔除超出所述的GC含量范围阀值的敲除策略。
所述的数据整理生成单元包括:
第一数据获取模块,用于获取已赋予分值的敲除策略GC含量数据信息;
分值排比模块,用于对含有分值的敲除策略GC含量数据信息进行整理对比 ;
统计生成模块,用于统计生成分值最高的GC含量敲除策略。
如图8所示,为本发明实施例提供的终端的结构示意图。在本发明较佳实 施例中,所述终端3包括存储器31、至少一个处理器32、至少一条通信总线33 及显示屏幕34。
本领域技术人员应该了解,图8示出的终端的结构并不构成本发明实施例 的限定,既可以是总线型结构,也可以是星形结构,所述终端3还可以包括比 图示更多或更少的其他硬件或者软件,或者不同的部件布置。
在一些实施例中,所述终端3包括一种能够按照事先设定或存储的指令, 自动进行数值计算和/或信息处理的终端,其硬件包括但不限于微处理器、专用 集成电路、可编程门阵列、数字处理器、嵌入式设备等。所述终端3还可包括 客户设备,所述客户设备包括但不限于任何一种可与客户通过键盘、鼠标、遥 控器、触摸板或声控设备等方式进行人机交互的电子产品,例如,个人计算机、 平板电脑、智能手机、数码相机等。
需要说明的是,所述终端3仅为举例,其他现有的或今后可能出现的电子 产品如可适应于本发明,也应包含在本发明的保护范围以内,并以引用方式包 含于此。
在一些实施例中,所述存储器31用于存储程序代码和各种数据,例如安装 在所述终端3中的自动并行化敲除策略GC含量分析系统,并在终端3的运行过 程中实现高速、自动地完成程序或数据的存取。所述存储器31包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可 编程只读存储器(Programmable Read-OnlyMemory,PROM)、可擦除可编程只 读存储器(Erasable Programmable Read-Only Memory,EPROM)、一次可编程 只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子擦除 式可复写只读存储器(Electrically-Erasable Programmable Read-OnlyMemory ,EEPROM)、只读光盘(Compact Disc Read-Only Memory,CD-ROM)或其他光 盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机 可读的任何其他介质。
在一些实施例中,所述至少一个处理器32可以由集成电路组成,例如可以 由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集 成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU )、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述至少 一个处理器32是所述终端3的控制核心(Control Unit),利用各种接口和线 路连接整个终端3的各个部件,通过运行或执行存储在所述存储器31内的程序 或者模块,以及调用存储在所述存储器31内的数据,以执行终端3的各种功能 和处理数据,例如执行自动并行化敲除策略GC含量分析的功能。
在一些实施例中,所述至少一条通信总线33被设置为实现所述存储器31、 所述至少一个处理器32以及所述显示屏幕34等之间的连接通信。
在一些实施例中,所述显示屏幕34可用于显示由观看者输入的信息或提供 给观看者的信息以及终端3的各种图形观看者接口,这些图形观看者接口可以 由图形、文本、图标、视频和其任意组合来构成。所述显示屏幕34可包括显示 面板,可选的,可以采用液晶显示屏幕(Liquid Crystal Display,LCD)、有 机发光二极管(Organic Light-EmittingDiode,OLED)等形式来配置显示面 板。
所述显示屏幕34还可以包括触摸面板。如果所述显示屏幕34包括触摸面 板,所述显示屏幕34可以被实现为触摸屏,以接收来自观看者的输入信号。触 摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。上 述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与上述触摸或 滑动操作相关的持续时间和压力。所述显示面板与所述触摸面板可以作为两个 独立的部件来实现输入和输入功能,但是在某些实施例中,可以将所述显示面 板与所述触摸面板进行集成而实现输入和输出功能。
尽管未示出,所述终端3还可以包括给各个部件供电的电源(比如电池), 优选的,电源可以通过电源管理装置与所述至少一个处理器32逻辑相连,从而 通过电源管理装置实现管理充电、放电、以及功耗管理等功能。电源还可以包 括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源 转换器或者逆变器、电源状态指示器等任意组件。所述终端3还可以包括多种 传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的 限制。
上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可 读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用 以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)或处理 器(processor)执行本发明各个实施例所述方法的部分。
在进一步的实施例中,结合图8,所述至少一个处理器32可执行所述终端的操作装置以及安装的各类应用程序(如所述的自动并行化敲除策略GC含量 分析系统)、程序代码等,例如,上述的各个模块。
所述存储器31中存储有程序代码,且所述至少一个处理器32可调用所述 存储器31中存储的程序代码以执行相关的功能。例如,系统中所述的各个模块 是存储在所述存储器31中的程序代码,并由所述至少一个处理器32所执行, 从而实现所述各个模块的功能以达到自动并行化敲除策略GC含量分析的目的。
在本发明的一个实施例中,所述存储器31存储多个指令,所述多个指令被 所述至少一个处理器32所执行以实现自动并行化敲除策略GC含量分析的方法。
在本发明的一个实施例中,所述处理器32对所述多个指令的执行包括:
步骤S10,获取需要进行GC含量分析的敲除策略数据信息;
步骤S20,对敲除策略数据信息进行GC含量分析和过滤筛选;
步骤S30,针对GC含量分析结果数据按照含量高或低进行分值赋予;
步骤S40,根据分值赋予数据,整理生成敲除策略GC含量数据信息集。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置,装置和方 法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性 的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另 外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为 模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者 也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部 模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中, 也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元 中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能 模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节, 而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现 本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非 限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落 在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权 利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一 词不排除其他单元或,单数不排除复数。装置权利要求中陈述的多个单元或装 置也可以由一个单元或装置通过软件或者硬件来实现。
本发明通过一种自动并行化敲除策略GC含量分析的方法各个步骤,及系统 的各功能单元与功能模块,可以解决对经验丰富的专家的依赖,针对没有丰富 经验的普通人员也可以进行GC含量敲除策略选取。
而且还解决敲除策略GC含量分析的时间问题,倘若一个基因的敲除策略GC 含量报告需要半天时间才能获得,将严重制约基因打靶相关的商业及基础研究 发展。通过本发明的步骤方法和系统几分钟内即可获得一份敲除策略GC含量分 析报告。
本发明通过一种自动并行化敲除策略GC含量分析的方法、系统、平台以及 存储介质,
可以提高工作效率;降低出错概率;实现自动化并行化分析;实现可视化 展示;通过分析结果信息化,可以直接接入下游的生产系统,随时可取,随时 可用;通过对分析方法模块化,即可作为一个独立的整体使用,亦可以作为一 部分接入任意一个进行敲除策略选取的自动化并行化系统。
也就是说,在研发本自动化并行化对敲除策略进行GC含量分析的方法之前 ,进行敲除策略选取的时候,需要将一个一个候选的敲除策略进行GC含量分析 ,以筛选出适用的敲除策略,因此相同的分析流程我们需要串联地重复进行。 因此设想倘若有一套GC含量分析流程,可以同时对多个敲除策略进行分析,将 大大节省了工作量,节约了时间。因此,首要解决的是将GC含量分析的完整方 法进行模块封装,实现流程化。然后研发并行化计算,将该GC含量分析流程同 步进行分析,实现多个敲除策略的分析同步进行。而针对每一个需要进行GC含 量分析的敲除策略,需要对敲除策略中的敲除区域、敲除区域上游和敲除区域下游分别进行GC含量分析,然后综合3个区域的分析结果,判定该敲除策略是 否为合适的敲除策略,因此也需要实现敲除区域、敲除区域上游区域和敲除区 域下游区域同时进行GC含量分析。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细 ,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领 域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形 和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所 附权利要求为准。