CN110751982A - 一种智能并行化敲除策略筛选的方法及系统 - Google Patents

一种智能并行化敲除策略筛选的方法及系统 Download PDF

Info

Publication number
CN110751982A
CN110751982A CN201810766174.7A CN201810766174A CN110751982A CN 110751982 A CN110751982 A CN 110751982A CN 201810766174 A CN201810766174 A CN 201810766174A CN 110751982 A CN110751982 A CN 110751982A
Authority
CN
China
Prior art keywords
knockout
strategy
threshold
knockout strategy
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810766174.7A
Other languages
English (en)
Other versions
CN110751982B (zh
Inventor
刘嘉惠
黎妃凤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Saiye Baimu Biotechnology Co ltd
Original Assignee
Saiye Guangzhou Biotechnology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Saiye Guangzhou Biotechnology Co Ltd filed Critical Saiye Guangzhou Biotechnology Co Ltd
Publication of CN110751982A publication Critical patent/CN110751982A/zh
Application granted granted Critical
Publication of CN110751982B publication Critical patent/CN110751982B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/40Network security protocols
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Genetics & Genomics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Analytical Chemistry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Chemical & Material Sciences (AREA)
  • Epidemiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Stored Programmes (AREA)

Abstract

本发明涉及生物信息领域,具体涉及一种智能并行化敲除策略筛选的方法及系统。本发明通过获取敲除策略原始数据信息;对敲除策略原始数据信息进行过滤筛选;针对过滤筛选后且未被剔除的敲除策略进行分值赋予;整理已赋予分值的敲除策略分值情况;汇总生成敲除策略数据信息集。相对传统敲除策略可以大大提高产出和工作效率,原本半天才能完成的报告,现在只需要几分钟,解放了人力物力;实现了规范的敲除策略报告,降低出错概率、打破知识背景壁垒,利用人工智能算法来代替人工的敲除策略选取,把专业性强、繁琐、耗时且容易出错的工作交给人工智能系统,从而解决领域内一个瓶颈问题,实现了随时、实时和免费地拿到各种基因打靶方案。

Description

一种智能并行化敲除策略筛选的方法及系统
技术领域
本发明涉及生物信息领域,具体涉及一种智能并行化敲除策略筛选的方法及系统。
背景技术
2007年,美国科学家MarioCapecchi、OliverSmith与英国科学家MartinEvans,凭借基因打靶技术共同分享了诺贝尔生理学奖或医学奖,奖励他们对小鼠ES胚胎细胞进行基因靶向操作也就是“基因打靶”的工作,评委会认为他们的研究成果“开创了全新的研究领域”,为人类攻克某些疾病提供了药物试验的动物模型。
ES基因打靶技术是指利用细胞DNA可与外源性DNA同源序列发生同源重组的性质,定向改造生物某一基因的技术。借助这一从上世纪80年代发展起来的技术,人们得以按照预先设计的方式对生物遗传信息进行精细改造。比如科学家可以瞄准某一特定基因进行敲除操作,使其失去活性,进而研究该特定基因的功能。经过30年的发展,这些经典的技术已经成为小鼠基因改造无可替代的金标准。
但随着生物技术的发展,传统的基于ES的基因打靶技术已经远不能满足科学家们对工作效率的追求,我们需要更加高效便捷的基因编辑器。人工核酸内切酶技术的兴起为基因编辑提供新的可行性。科技界和生物产业界已经形成共识:CRISPR基因编辑将给基础研究和转化医学研究带来革命性变革,是下一代生物技术的核心。
当前并没有一款可以在线进行基因敲除策略分析,获得敲除策略报告的软件,传统操作中,获取一个基因的最优敲除策略需要一个具有多年丰富经验的策略专家进行纯手工的分析操作,将所有可能性结果进行排列组合,然后进行一系列策略分析,最终筛选出合适的基因敲除策略,并撰写详细的策略报告。完成所有分析,并获得一份敲除策略报告往往需要半天时间。如此操作既耗时又耗力。
而且,由于人工敲除策略筛选方案用时很长,因此需要投入很多人力才能满足一天内获得许多基因的敲除策略方案的需求。而不同专家间的思维模式不一样,在进行方案筛选的时候,倘若方案一与方案二的基因打靶成效相近,不同专家间筛选所得的最优敲除策略可能存在细微差异,会造成同一个基因在不同时期或者不同专家筛选所得最优策略不一致的情况。此外,敲除策略的报告撰写规范和格式等也会参差不齐。
所以,传统意义上的对敲除策略的筛选耗时耗力耗人才,而且筛选方式单一、出错率高和效率效益低下,敲除策略的报告也不规范,
发明内容
针对以上对敲除策略的筛选耗时耗力耗人才,而且筛选方式单一、出错率高和效率效益低下,敲除策略的报告也不规范的问题缺陷,本发明提供一种智能并行化敲除策略筛选的方法及系统,使对敲除策略的筛选省时省力,筛选方式智能并行化、出错率低和效率效益高,而且生成统一格式的规划的敲除策略报告。
本发明具体通过以下技术方案实现:
一种智能并行化敲除策略筛选的方法,所述方法具体包括如下步骤:
步骤S10,获取敲除策略原始数据信息;
步骤S20,对敲除策略原始数据信息进行过滤筛选;
步骤S30,针对过滤筛选后且未被剔除的敲除策略进行分值赋予;
步骤S40,整理已赋予分值的敲除策略分值情况;
步骤S50,汇总生成敲除策略数据信息集。
进一步地,所述敲除策略原始数据信息为基因敲除策略的所有组合。
进一步地,所述对敲除策略原始数据信息进行的过滤筛选为并行化过滤筛选;
所述过滤筛选后且未被剔除的敲除策略进行分值赋予为并行化进行分值赋予。
进一步地,所述分值为二进制分值、十进制分值或十六进制分值。
进一步地,所述统计生成敲除策略数据信息集包括生成敲除策略数据信息分析处理结果报告。
进一步地,所述步骤S20中,设置有多个阀值;
所述步骤S20中,还包括如下步骤:
步骤S201,设置多个阀值,将敲除策略与所述阀值进行对比判定;
步骤S202,剔除超出所述阀值的敲除策略;
所述超出所述阀值的敲除策略,将不再参与同其他未对比判定过的阀值进行对比判定。
进一步地,所述阀值包括:类型阀值、第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值和序列复杂性阀值。
进一步地,所述序列复杂性阀值包括GC含量范围阀值、序列重复度阀值和序列同源性阀值。
进一步地,所述步骤S30中,还包括如下步骤:
步骤S301,获取过滤筛选后且未被剔除的敲除策略数据信息;
步骤S302,对敲除策略数据信息进行处理;
步骤S303,根据敲除策略数据信息的分析处理结果,进行相应的分值赋予。
进一步地,所述分值赋予包括:类型分值赋予、第一长度分值赋予、第一比例分值赋予、第二比例分值赋予、位置分值赋予、第二长度分值赋予、区域范围分值赋予和序列复杂性分值赋予。
进一步地,所述序列复杂性分值赋予包括GC含量分值赋予、序列重复度分值赋予和序列同源性分值赋予。
进一步地,所述步骤S40中,还包括如下步骤:
步骤S401,获取已赋予分值的敲除策略数据信息;
步骤S402,对含有分值的敲除策略数据信息进行整理对比;
步骤S403,统计生成分值最高的敲除策略。
为达到上述目的,本发明还提供一种智能并行化敲除策略筛选的系统,其特征在于,所述系统包括:
数据获取单元、过滤筛选单元、分值赋予单元、分值整理单元和信息集汇总单元;
数据获取单元,用于获取敲除策略原始数据信息;
过滤筛选单元,用于对敲除策略原始数据信息进行过滤筛选;
分值赋予单元,用于针对过滤筛选后且未被剔除的敲除策略进行分值赋予;
分值整理单元,用于整理已赋予分值的敲除策略分值情况;
信息集汇总单元,用于汇总生成敲除策略数据信息集。
进一步地,所述过滤筛选单元中设置有多个阀值;
所述过滤筛选单元包括:阈值对比模块和剔除模块;
阈值对比模块,用于设置多个阀值,将敲除策略与所述阀值进行对比判定;
剔除模块,用于剔除超出所述阀值的敲除策略。
进一步地,所述分值赋予单元包括:第一数据获取模块、数据分析处理模块和打分模块;
第一数据获取模块,用于获取过滤筛选后且未被剔除的敲除策略数据信息;
数据分析处理模块,用于对敲除策略数据信息进行处理;
打分模块,用于根据敲除策略数据信息的分析处理结果,进行相应的分值赋予。
进一步地,所述分值整理单元包括:
第二数据获取模块,用于获取已赋予分值的敲除策略数据信息;
分值排比模块,用于对含有分值的敲除策略数据信息进行整理对比;
统计生成模块,用于统计生成分值最高的敲除策略。
为实现上述目的,本发明还提供一种智能并行化敲除策略筛选的平台,包括处理器、存储器以及智能并行化敲除策略筛选的平台控制程序;
其中在所述处理器执行所述平台控制程序,所述智能并行化敲除策略筛选的平台控制程序被存储在所述存储器中,所述智能并行化敲除策略筛选的平台控制程序,实现所述的智能并行化敲除策略筛选的方法步骤。
为实现上述目的,本发明还提供一种计算机可读取存储介质,所述计算机可读取存储介质存储有智能并行化敲除策略筛选的平台控制程序,所述智能并行化敲除策略筛选的平台控制程序,实现所述的智能并行化敲除策略筛选的方法步骤。
与现有技术相比,本发明具有以下有益效果:
本发明通过智能并行化敲除策略筛选的方法,
步骤S10,获取敲除策略原始数据信息;
步骤S20,对敲除策略原始数据信息进行过滤筛选;
步骤S30,针对过滤筛选后且未被剔除的敲除策略进行分值赋予;
步骤S40,整理已赋予分值的敲除策略分值情况;
步骤S50,汇总生成敲除策略数据信息集。
及相应地系统单元:
数据获取单元,用于获取敲除策略原始数据信息;
过滤筛选单元,用于对敲除策略原始数据信息进行过滤筛选;
分值赋予单元,用于针对过滤筛选后且未被剔除的敲除策略进行分值赋予;
分值整理单元,用于整理已赋予分值的敲除策略分值情况;
信息集汇总单元,用于汇总生成敲除策略数据信息集。
及智能并行化敲除策略筛选的平台和种计算机可读取存储介质;
可以大大提高产出和工作效率,原本半天才能完成的报告,现在只需要几分钟;解放人力物力;实现了智能化并行化敲除策略筛选模式和智能化撰写敲除策略报告,从而降低出错概率;打破知识背景壁垒,也就是说,针对没有丰富经验的学生研究者也可以快速获得基因的敲除策略;有助开启新的销售模式,带来更大的收益,原技术的瓶颈下,客户通过销售传达感兴趣基因到策略专家处,策略专家分析获得敲除策略优选方案再通过销售反馈给客户,客户了解感兴趣的基因的敲除策略往往需要一两天,而现在通过线上分析,几分钟即可获得完整的敲除策略分析报告,因此可即时定制感兴趣的基因打靶服务。
利用人工智能算法来代替人工的敲除策略选取,把专业性强、繁琐、耗时且容易出错的工作交给人工智能系统,从而解决领域内一个瓶颈问题,让全球科学家能随时、实时和免费地拿到各种基因打靶方案。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种智能并行化敲除策略筛选的方法架构流程示意图;
图2为本发明一种智能并行化敲除策略筛选的方法之第二优选实施例架构流程示意图;
图3为本发明一种智能并行化敲除策略筛选的方法之第三优选实施例架构流程示意图;
图4为本发明一种智能并行化敲除策略筛选的方法之第四优选实施例架构流程示意图;
图5为本发明一种智能并行化敲除策略筛选的方法之第五优选实施例架构流程示意图;
图6为本发明一种智能并行化敲除策略筛选的方法之第六优选实施例架构流程示意图;
图7为本发明一种智能并行化敲除策略筛选的方法之第七优选实施例架构流程示意图;
图8为本发明一种智能并行化敲除策略筛选的方法之第八优选实施例架构流程示意图;
图9为本发明一种智能并行化敲除策略筛选的方法之第九优选实施例架构流程示意图;
图10为本发明一种智能并行化敲除策略筛选的方法之第十优选实施例架构流程示意图;
图11为本发明一种智能并行化敲除策略筛选的方法之第十一优选实施例架构流程示意图;
图12为本发明一种智能并行化敲除策略筛选的系统架构示意图;
图13为本发明一种智能并行化敲除策略筛选的系统之模块架构示意图;
图14为本发明一种智能并行化敲除策略筛选的方法及系统实施例提供的终端的架构示意图;
附图标记说明:
3-终端;31-存储器;32-处理器;33-通信总线;34-显示屏幕;
本发明目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为便于更好的理解本发明的目的、技术方案和优点更加清楚,下面结合附图和具体的实施方式对本发明作进一步说明,本领域技术人员可由本说明书所揭示的内容轻易地了解本发明的其它优点与功效。
本发明亦可通过其它不同的具体实例加以施行或应用,本说明书中的各项细节亦可基于不同观点与应用,在不背离本发明的精神下进行各种修饰与变更。
需要说明,若本发明实施例中有涉及方向性指示(诸如上、下、左、右、前、后……),则该方向性指示仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。
另外,若本发明实施例中有涉及“第一”、“第二”等的描述,则该“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。其次,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时,应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
优选地,本发明智能并行化敲除策略筛选的方法应用在一个或者多个终端或者服务器中。所述终端是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述终端可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端可以与客户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
本发明为实现智能并行化敲除策略筛选,提供的一种智能并行化敲除策略筛选的方法及系统。
如图1所示,是本发明实施例提供的一种智能并行化敲除策略筛选的方法的流程图。
在本实施例中,所述智能并行化敲除策略筛选的方法,可以应用于具备显示功能的终端或者固定终端中,所述终端并不限定于个人电脑、智能手机、平板电脑、安装有摄像头的台式机或一体机等。
所述智能并行化敲除策略筛选的方法也可以应用于由终端和通过网络与所述终端进行连接的服务器所构成的硬件环境中。网络包括但不限于:广域网、城域网或局域网。本发明实施例的智能并行化敲除策略筛选的方法可以由服务器来执行,也可以由终端来执行,还可以是由服务器和终端共同执行。
例如,对于需要进行智能并行化敲除策略筛选的终端,可以直接在终端上集成本发明的方法所提供的智能并行化敲除策略筛选功能,或者安装用于实现本发明的方法的客户端。再如,本发明所提供的方法还可以软件开发工具包(Software Development Kit,SDK)的形式运行在服务器等设备上,以SDK的形式提供智能并行化敲除策略筛选功能的接口,终端或其他设备通过所提供的接口即可实现智能并行化敲除策略筛选的功能。
如图1所示,本发明提供了一种智能并行化敲除策略筛选的方法,所述方法具体包括如下步骤,根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
步骤S10,获取敲除策略原始数据信息;
步骤S20,对敲除策略原始数据信息进行过滤筛选;
步骤S30,针对过滤筛选后且未被剔除的敲除策略进行分值赋予;
步骤S40,整理已赋予分值的敲除策略分值情况;
步骤S50,汇总生成敲除策略数据信息集。
在本发明实施例中,所述敲除策略原始数据信息为基因敲除策略的所有组合。
较佳地,所述对敲除策略原始数据信息进行的过滤筛选为并行化过滤筛选;
所述过滤筛选后且未被剔除的敲除策略进行分值赋予为并行化进行分值赋予。
更进一步地,所述分值为二进制分值、十进制分值或十六进制分值。
所述统计生成敲除策略数据信息集包括生成敲除策略数据信息分析处理结果报告。
如图2所示,为本发明第二优选实施例。
较佳地,在本实施例中,于所述步骤S20之中,设置有多个阀值;
所述步骤S20中,还包括如下步骤:
步骤S201,设置多个阀值,将敲除策略与所述阀值进行对比判定;
步骤S202,剔除超出所述阀值的敲除策略;
所述超出所述阀值的敲除策略,直接被剔除,将不再参与同其他未对比判定过的阀值进行对比判定。若符合所述阀值的敲除策略,则保留该敲除策略,进而再参与同其他未对比判定过的阀值进行对比判定,直到判定符合所有阈值,则最终被保留下来,进而进入下一操作步骤。
在本实施例中,所述阀值包括:类型阀值、第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值和序列复杂性阀值。
也就是说,于步骤S20中设置多个阀值,将敲除策略与所述阀值进行对比判定,包括将敲除策略与所述类型阀值、第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值和序列复杂性阀值中的任意一个阈值进行对比判定;
超出所述类型阀值、第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值和序列复杂性阀值中的任意一个阈值的敲除策略,将不再参与同其他未对比判定过的阀值进行对比判定,如果符合所述类型阀值、第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值和序列复杂性阀值中一个阈值,则保留相应的该敲除策略,进而参与同其他未对比判定过的阀值进行对比判定,直到判定符合所有阈值,则最终被保留下来,进而进入下一操作步骤。
具体地,若敲除策略不等于所述类型阀值,则被剔除,否则保留该敲除策略数据信息,即如果该敲除策略被保留,则继续与第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值和序列复杂性阀值进行对比判定,直到判定符合剩余所有阈值,则最终被保留下来,进而进入下一操作步骤;如果该敲除策略被剔除后,将不再参与同第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值和序列复杂性阀值进行对比判定。
若敲除策略小于第一长度阀值,则被剔除,否则保留该敲除策略数据信息;即如果该敲除策略被保留,则继续与类型阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值和序列复杂性阀值进行对比判定,直到判定符合剩余所有阈值,则最终被保留下来,进而进入下一操作步骤;如果该敲除策略被剔除后,将不再参与同类型阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值和序列复杂性阀值进行对比判定。
若敲除策略小于第一比例阀值,则被剔除,否则保留该敲除策略数据信息;即如果该敲除策略被保留,则继续与第一长度阀值、类型阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值和序列复杂性阀值进行对比判定,直到判定符合剩余所有阈值,则最终被保留下来,进而进入下一操作步骤;如果该敲除策略被剔除后,将不再参与同第一长度阀值、类型阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值和序列复杂性阀值进行对比判定。
若敲除策略小于第二比例阀值,则被剔除,否则保留该敲除策略数据信息;即如果该敲除策略被保留,则继续与第一长度阀值、第一比例阀值、类型阀值、位置阀值、第二长度阀值、区域范围阀值和序列复杂性阀值进行对比判定,直到判定符合剩余所有阈值,则最终被保留下来,进而进入下一操作步骤;如果该敲除策略被剔除后,将不再参与同第一长度阀值、第一比例阀值、类型阀值、位置阀值、第二长度阀值、区域范围阀值和序列复杂性阀值进行对比判定。
若敲除策略位于位置阀值之后,则被剔除,否则保留该敲除策略数据信息;即如果该敲除策略被保留,则继续与第一长度阀值、第一比例阀值、第二比例阀值、类型阀值、第二长度阀值、区域范围阀值和序列复杂性阀值进行对比判定,直到判定符合剩余所有阈值,则最终被保留下来,进而进入下一操作步骤;如果该敲除策略被剔除后,将不再参与同第一长度阀值、第一比例阀值、第二比例阀值、类型阀值、第二长度阀值、区域范围阀值和序列复杂性阀值进行对比判定。
若敲除策略大于第二长度阀值,则被剔除,否则保留该敲除策略数据信息;即如果该敲除策略被保留,则继续与第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、类型阀值、区域范围阀值和序列复杂性阀值进行对比判定,直到判定符合剩余所有阈值,则最终被保留下来,进而进入下一操作步骤;如果该敲除策略被剔除后,将不再参与同第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、类型阀值、区域范围阀值和序列复杂性阀值进行对比判定。
若敲除策略位于区域范围阀值内,则被剔除,否则保留该敲除策略数据信息;即如果该敲除策略被保留,则继续与第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、类型阀值和序列复杂性阀值进行对比判定,直到判定符合剩余所有阈值,则最终被保留下来,进而进入下一操作步骤;如果该敲除策略被剔除后,将不再参与同第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、类型阀值和序列复杂性阀值进行对比判定。
若敲除策略超出序列复杂性阀值,则被剔除,否则保留该敲除策略数据信息;即如果该敲除策略被保留,则继续与第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值和类型阀值进行对比判定,直到判定符合剩余所有阈值,则最终被保留下来,进而进入下一操作步骤;如果该敲除策略被剔除后,将不再参与同第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值和类型阀值进行对比判定。
比如说,对外显子类型过滤,假设外显子分为若干种类型,若敲除区域的外显子不属于类型阀值中的一种,则该敲除策略则认为是超出要求,进而被剔除,将不再参与同阀值进行对比判定;若敲除区域的外显子不属于类型阀值中的一种,则被保留下来,进而进入下一操作步骤。
同理,其它内含子的过滤、序列的过滤以及位置大小的过滤等过滤模式都与对外显子类型过滤一样,先判定与阀值的关系,再确定该敲除策略是否被剔除抑或被保留。
在本实施例中,序列复杂性过滤包括:GC含量过滤、序列重复度过滤和序列同源性过滤。
也就是说,本发明第二优选实施例,具体包括如下步骤:
步骤S10,获取敲除策略原始数据信息;
步骤S201,设置多个阀值,将敲除策略与所述阀值进行对比判定;
步骤S202,剔除超出所述阀值的敲除策略;
即本发明实施例的步骤S20,对敲除策略原始数据信息进行过滤筛选;
步骤S30,针对过滤筛选后且未被剔除的敲除策略进行分值赋予;
步骤S40,整理已赋予分值的敲除策略分值情况;
步骤S50,汇总生成敲除策略数据信息集。
在本实施例中,所述敲除策略原始数据信息为基因敲除策略的所有组合。
较佳地,所述对敲除策略原始数据信息进行的过滤筛选为并行化过滤筛选;
所述过滤筛选后且未被剔除的敲除策略进行分值赋予为并行化进行分值赋予。
更进一步地,所述分值为二进制分值、十进制分值或十六进制分值。
所述统计生成敲除策略数据信息集包括生成敲除策略数据信息分析处理结果报告。
如图3所示,为本发明第三优选实施例。
较佳地,第三优选实施例为第二优选实施例更进一步的实施例,于所述步骤S20之中,设置有多个阀值,包括GC含量范围阀值;
所述步骤S20中,还包括如下步骤:
步骤S201,设置多个阀值,将敲除策略与所述阀值进行对比判定,包括将敲除策略与所述GC含量范围阀值进行对比判定;
步骤S202,剔除超出所述阀值的敲除策略;
所述超出所述阀值的敲除策略,直接被剔除,将不再参与同其他未对比判定过的阀值进行对比判定。若符合所述阀值的敲除策略,则保留该敲除策略,进而再参与同其他未对比判定过的阀值进行对比判定,直到判定符合所有阈值,则最终被保留下来,进而进入下一操作步骤。
在本实施例中,所述阀值包括:类型阀值、第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值和GC含量范围阀值。
也就是说,于步骤S20中设置多个阀值,将敲除策略与所述阀值进行对比判定,包括将敲除策略与所述类型阀值、第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值和GC含量范围阀值中的任意一个阈值进行对比判定;
超出所述类型阀值、第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值和GC含量范围阀值中的任意一个阈值的敲除策略,将不再参与同其他未对比判定过的阀值进行对比判定,如果符合所述类型阀值、第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值和GC含量范围阀值中一个阈值,则保留相应的该敲除策略,进而参与同其他未对比判定过的阀值进行对比判定,直到判定符合所有阈值,则最终被保留下来,进而进入下一操作步骤。
具体地,敲除策略与所述类型阀值、第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值判定情况和第二优选实施例相同,在第三优选实施例中不再赘述。
若敲除策略不在GC含量范围阀值范围内,则被剔除,否则保留该敲除策略数据信息;即如果该敲除策略被保留,则继续与第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值和类型阀值进行对比判定,直到判定符合剩余所有阈值,则最终被保留下来,进而进入下一操作步骤;如果该敲除策略被剔除后,将不再参与同第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值和类型阀值进行对比判定。
比如说,对外显子类型过滤,假设外显子分为若干种类型,若敲除区域的外显子不属于类型阀值中的一种,则该敲除策略则认为是超出要求,进而被剔除,将不再参与同阀值进行对比判定;若敲除区域的外显子不属于类型阀值中的一种,则被保留下来,进而进入下一操作步骤。
同理,其它内含子的过滤、序列的过滤以及位置大小的过滤等过滤模式都与对外显子类型过滤一样,先判定与阀值的关系,再确定该敲除策略是否被剔除抑或被保留。
也就是说,本发明第三优选实施例,具体包括如下步骤:
步骤S10,获取敲除策略原始数据信息;
步骤S201,设置多个阀值,将敲除策略与所述阀值进行对比判定,包括将敲除策略与所述GC含量范围阀值进行对比判定;
步骤S202,剔除超出所述阀值的敲除策略;
即本发明实施例的步骤S20,对敲除策略原始数据信息进行过滤筛选;
步骤S30,针对过滤筛选后且未被剔除的敲除策略进行分值赋予,包括GC含量分值赋予;
步骤S40,整理已赋予分值的敲除策略分值情况;
步骤S50,汇总生成敲除策略数据信息集。
在本实施例中,所述敲除策略原始数据信息为基因敲除策略的所有组合。
较佳地,所述对敲除策略原始数据信息进行的过滤筛选为并行化过滤筛选;
所述过滤筛选后且未被剔除的敲除策略进行分值赋予为并行化进行分值赋予。
更进一步地,所述分值为二进制分值、十进制分值或十六进制分值。
所述统计生成敲除策略数据信息集包括生成敲除策略数据信息分析处理结果报告。
如图4所示,为本发明第四优选实施例。
较佳地,第四优选实施例为第二优选实施例更进一步的实施例,于所述步骤S20之中,设置有多个阀值,包括序列重复度阀值;
所述步骤S20中,还包括如下步骤:
步骤S201,设置多个阀值,将敲除策略与所述阀值进行对比判定,包括将敲除策略与所述序列重复度阀值进行对比判定;
步骤S202,剔除超出所述阀值的敲除策略;
所述超出所述阀值的敲除策略,直接被剔除,将不再参与同其他未对比判定过的阀值进行对比判定。若符合所述阀值的敲除策略,则保留该敲除策略,进而再参与同其他未对比判定过的阀值进行对比判定,直到判定符合所有阈值,则最终被保留下来,进而进入下一操作步骤。
在本实施例中,所述阀值包括:类型阀值、第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值和序列重复度阀值。
也就是说,于步骤S20中设置多个阀值,将敲除策略与所述阀值进行对比判定,包括将敲除策略与所述类型阀值、第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值和序列重复度阀值中的任意一个阈值进行对比判定;
超出所述类型阀值、第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值和序列重复度阀值中的任意一个阈值的敲除策略,将不再参与同其他未对比判定过的阀值进行对比判定,如果符合所述类型阀值、第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值和序列重复度阀值中一个阈值,则保留相应的该敲除策略,进而参与同其他未对比判定过的阀值进行对比判定,直到判定符合所有阈值,则最终被保留下来,进而进入下一操作步骤。
具体地,敲除策略与所述类型阀值、第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值判定情况和第二优选实施例相同,在第四优选实施例中不再赘述。
若敲除策略大于序列重复度阀值,则被剔除,否则保留该敲除策略数据信息;即如果该敲除策略被保留,则继续与第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值和类型阀值进行对比判定,直到判定符合剩余所有阈值,则最终被保留下来,进而进入下一操作步骤;如果该敲除策略被剔除后,将不再参与同第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值和类型阀值进行对比判定。
比如说,对外显子类型过滤,假设外显子分为若干种类型,若敲除区域的外显子不属于类型阀值中的一种,则该敲除策略则认为是超出要求,进而被剔除,将不再参与同阀值进行对比判定;若敲除区域的外显子不属于类型阀值中的一种,则被保留下来,进而进入下一操作步骤。
同理,其它内含子的过滤、序列的过滤以及位置大小的过滤等过滤模式都与对外显子类型过滤一样,先判定与阀值的关系,再确定该敲除策略是否被剔除抑或被保留。
也就是说,本发明第四优选实施例,具体包括如下步骤:
步骤S10,获取敲除策略原始数据信息;
步骤S201,设置多个阀值,将敲除策略与所述阀值进行对比判定,包括将敲除策略原始数据信息与所述序列重复度阀值进行对比判定;
步骤S202,剔除超出所述阀值的敲除策略;
即本发明实施例的步骤S20,对敲除策略原始数据信息进行过滤筛选;
步骤S30,针对过滤筛选后且未被剔除的敲除策略进行分值赋予,包括序列重复度分值赋予;
步骤S40,整理已赋予分值的敲除策略分值情况;
步骤S50,汇总生成敲除策略数据信息集。
在本实施例中,所述敲除策略原始数据信息为基因敲除策略的所有组合。
较佳地,所述对敲除策略原始数据信息进行的过滤筛选为并行化过滤筛选;
所述过滤筛选后且未被剔除的敲除策略进行分值赋予为并行化进行分值赋予。
更进一步地,所述分值为二进制分值、十进制分值或十六进制分值。
所述统计生成敲除策略数据信息集包括生成敲除策略数据信息分析处理结果报告。
如图5所示,为本发明第五优选实施例。
较佳地,第五优选实施例为第二优选实施例更进一步的实施例,于所述步骤S20之中,设置有多个阀值,包括序列同源性阀值;
所述步骤S20中,还包括如下步骤:
步骤S201,设置多个阀值,将敲除策略与所述阀值进行对比判定,包括将敲除策略与所述序列同源性阀值进行对比判定;
步骤S202,剔除超出所述阀值的敲除策略;
所述超出所述阀值的敲除策略,直接被剔除,将不再参与同其他未对比判定过的阀值进行对比判定。若符合所述阀值的敲除策略,则保留该敲除策略,进而再参与同其他未对比判定过的阀值进行对比判定,直到判定符合所有阈值,则最终被保留下来,进而进入下一操作步骤。
在本实施例中,所述阀值包括:类型阀值、第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值和序列同源性阀值。
也就是说,于步骤S20中设置多个阀值,将敲除策略与所述阀值进行对比判定,包括将敲除策略与所述类型阀值、第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值和序列同源性阀值中的任意一个阈值进行对比判定;
超出所述类型阀值、第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值和序列同源性阀值中的任意一个阈值的敲除策略,将不再参与同其他未对比判定过的阀值进行对比判定,如果符合所述类型阀值、第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值和序列同源性阀值中一个阈值,则保留相应的该敲除策略,进而参与同其他未对比判定过的阀值进行对比判定,直到判定符合所有阈值,则最终被保留下来,进而进入下一操作步骤。
具体地,敲除策略与所述类型阀值、第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值判定情况和第二优选实施例相同,在第四优选实施例中不再赘述。
若敲除策略大于序列同源性阀值,则被剔除,否则保留该敲除策略数据信息;即如果该敲除策略被保留,则继续与第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值和类型阀值进行对比判定,直到判定符合剩余所有阈值,则最终被保留下来,进而进入下一操作步骤;如果该敲除策略被剔除后,将不再参与同第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值和类型阀值进行对比判定。
比如说,对外显子类型过滤,假设外显子分为若干种类型,若敲除区域的外显子不属于类型阀值中的一种,则该敲除策略则认为是超出要求,进而被剔除,将不再参与同阀值进行对比判定;若敲除区域的外显子不属于类型阀值中的一种,则被保留下来,进而进入下一操作步骤。
同理,其它内含子的过滤、序列的过滤以及位置大小的过滤等过滤模式都与对外显子类型过滤一样,先判定与阀值的关系,再确定该敲除策略是否被剔除抑或被保留。
也就是说,本发明第五优选实施例,具体包括如下步骤:
步骤S10,获取敲除策略原始数据信息;
步骤S201,设置多个阀值,将敲除策略与所述阀值进行对比判定,包括将敲除策略原始数据信息与所述序列同源性阀值进行对比判定;
步骤S202,剔除超出所述阀值的敲除策略;
即本发明实施例的步骤S20,对敲除策略原始数据信息进行过滤筛选;
步骤S30,针对过滤筛选后且未被剔除的敲除策略进行分值赋予,包括序列同源性分值赋予;
步骤S40,整理已赋予分值的敲除策略分值情况;
步骤S50,汇总生成敲除策略数据信息集。
在本实施例中,所述敲除策略原始数据信息为基因敲除策略的所有组合。
较佳地,所述对敲除策略原始数据信息进行的过滤筛选为并行化过滤筛选;
所述过滤筛选后且未被剔除的敲除策略进行分值赋予为并行化进行分值赋予。
更进一步地,所述分值为二进制分值、十进制分值或十六进制分值。
所述统计生成敲除策略数据信息集包括生成敲除策略数据信息分析处理结果报告。
如图6所示,为本发明第六优选实施例。
较佳地,在本实施例中,于步骤S30之中,还包括如下步骤:
步骤S301,获取过滤筛选后且未被剔除的敲除策略数据信息;
步骤S302,对敲除策略数据信息进行处理;
步骤S303,根据敲除策略数据信息的分析处理结果,进行相应的分值赋予。
也就是说,经过步骤S20对敲除策略原始数据信息进行过滤筛选后,对保留下来的敲除策略进行分析处理,比如:分析敲除策略的种类类型、分析敲除策略的长度类型、分析敲除策略的比例关系、分析敲除策略的位置关系、分析敲除策略的区域范围类型、分析敲除策略的序列复杂性等一系列需要分值赋予的类型分析处理,即对一个或多个敲除策略同时进行分值赋予的类型,然后按照对敲除策略分析处理结果进行具体分值赋予。
更进一步地,所述分值为二进制分值、十进制分值或十六进制分值。
较佳地,过滤筛选后且未被剔除的敲除策略进行分值赋予为并行化进行分值赋予。
也就是说,在本实施例中,保留下来的敲除策略将送入到打分机制中,同时进行分值赋予,而且对其各个需要打分的类型同时进行分值赋予。
具体地,所述分值赋予包括:类型分值赋予、第一长度分值赋予、第一比例分值赋予、第二比例分值赋予、位置分值赋予、第二长度分值赋予、区域范围分值赋予和序列复杂性分值赋予。
若对过滤筛选后且未被剔除的敲除策略(即对保留下来的敲除策略)进行类型分值赋予,则根据不同类型的敲除策略赋予相应不同的分值,进而对其进行第一长度分值赋予或第一比例分值赋予或第二比例分值赋予或位置分值赋予或第二长度分值赋予或区域范围分值赋予或序列复杂性分值赋予,直至所有种类分值赋予都对敲除策略都赋予了分值。
所述分值赋予可以对一个或多个敲除策略同时进行分值赋予。
打分机制对敲除策略进行打分,具体地:
比如说,对外显子类型打分,假设外显子分为若干种类型(N1、N2……Nn),则对每一种类型赋予不同的分值(SN1、SN2……SNn)。
同理,其它内含子的分值赋予、序列的分值赋予以及位置大小的分值赋予等分值赋予模式都与对外显子类型分值赋予一样,先对各模式分值赋予,再针对所赋予的分值进行下一步操作。
在本实施例中,序列复杂性打分包括GC含量打分、序列重复度打分和序列同源性打分。
也就是说,本发明第六优选实施例,具体包括如下步骤:
步骤S10,获取敲除策略原始数据信息;
步骤S20,对敲除策略原始数据信息进行过滤筛选;
步骤S301,获取过滤筛选后且未被剔除的敲除策略数据信息;
步骤S302,对敲除策略数据信息进行处理;
步骤S303,根据敲除策略数据信息的分析处理结果,进行相应的分值赋予。
即本发明实施例的步骤S30,针对过滤筛选后且未被剔除的敲除策略进行分值赋予;
步骤S40,整理已赋予分值的敲除策略分值情况;
步骤S50,汇总生成敲除策略数据信息集。
在本实施例中,所述敲除策略原始数据信息为基因敲除策略的所有组合。
较佳地,所述对敲除策略原始数据信息进行的过滤筛选为并行化过滤筛选;
所述统计生成敲除策略数据信息集包括生成敲除策略数据信息分析处理结果报告。
如图7所示,为本发明第七优选实施例。
较佳地,第七优选实施例为第六优选实施例更进一步的实施例,在本实施例中,于步骤S30之中,还包括如下步骤:
步骤S301,获取过滤筛选后且未被剔除的敲除策略数据信息;
步骤S302,对敲除策略数据信息进行处理;
步骤S303,根据敲除策略数据信息的分析处理结果,进行相应的分值赋予,包括GC含量分值赋予。
也就是说,经过步骤S20对敲除策略原始数据信息进行过滤筛选后,对保留下来的敲除策略进行分析处理,比如:分析敲除策略的种类类型、分析敲除策略的长度类型、分析敲除策略的比例关系、分析敲除策略的位置关系、分析敲除策略的区域范围类型、分析敲除策略的序列复杂性等一系列需要分值赋予的类型分析处理,即对一个或多个敲除策略同时进行分值赋予的类型,然后按照对敲除策略分析处理结果进行具体的GC含量分值赋予。
更进一步地,所述分值为二进制分值、十进制分值或十六进制分值。
较佳地,过滤筛选后且未被剔除的敲除策略进行分值赋予为并行化进行分值赋予,
也就是说,在本实施例中,保留下来的敲除策略将送入到打分机制中,同时进行分值赋予,而且对其各个需要打分的类型同时进行分值赋予。
具体地,所述分值赋予包括:类型分值赋予、第一长度分值赋予、第一比例分值赋予、第二比例分值赋予、位置分值赋予、第二长度分值赋予、区域范围分值赋予和GC含量分值赋予。
若对过滤筛选后且未被剔除的敲除策略(即对保留下来的敲除策略)进行类型分值赋予,则根据不同类型的敲除策略赋予相应不同的分值,进而对其进行第一长度分值赋予或第一比例分值赋予或第二比例分值赋予或位置分值赋予或第二长度分值赋予或区域范围分值赋予或GC含量分值赋予,直至所有种类分值赋予都对敲除策略都赋予了分值。
所述分值赋予可以对一个或多个敲除策略同时进行分值赋予。
打分机制对敲除策略进行打分,具体地:
比如说,对外显子类型打分,假设外显子分为若干种类型(N1、N2……Nn),则对每一种类型赋予不同的分值(SN1、SN2……SNn)。
同理,其它内含子的分值赋予、序列的分值赋予以及位置大小的分值赋予等分值赋予模式都与对外显子类型分值赋予一样,先对各模式分值赋予,再针对所赋予的分值进行下一步操作。
也就是说,本发明第七优选实施例,具体包括如下步骤:
步骤S10,获取敲除策略原始数据信息;
步骤S20,对敲除策略原始数据信息进行过滤筛选,包括将敲除策略原始数据信息与所述GC含量范围阀值进行对比判定;
步骤S301,获取过滤筛选后且未被剔除的敲除策略数据信息;
步骤S302,对敲除策略数据信息进行处理;
步骤S303,根据敲除策略数据信息的分析处理结果,进行相应的分值赋予,包括GC含量分值赋予。
即本发明实施例的步骤S30,针对过滤筛选后且未被剔除的敲除策略进行分值赋予;
步骤S40,整理已赋予分值的敲除策略分值情况;
步骤S50,汇总生成敲除策略数据信息集。
在本实施例中,所述敲除策略原始数据信息为基因敲除策略的所有组合。
较佳地,所述对敲除策略原始数据信息进行的过滤筛选为并行化过滤筛选;
所述统计生成敲除策略数据信息集包括生成敲除策略数据信息分析处理结果报告。
如图8所示,为本发明第八优选实施例。
较佳地,第八优选实施例为第六优选实施例更进一步的实施例,在本实施例中,于步骤S30之中,还包括如下步骤:
步骤S301,获取过滤筛选后且未被剔除的敲除策略数据信息;
步骤S302,对敲除策略数据信息进行处理;
步骤S303,根据敲除策略数据信息的分析处理结果,进行相应的分值赋予,包括序列重复度分值赋予。
也就是说,经过步骤S20对敲除策略原始数据信息进行过滤筛选后,对保留下来的敲除策略进行分析处理,比如:分析敲除策略的种类类型、分析敲除策略的长度类型、分析敲除策略的比例关系、分析敲除策略的位置关系、分析敲除策略的区域范围类型、分析敲除策略的序列复杂性等一系列需要分值赋予的类型分析处理,即对一个或多个敲除策略同时进行分值赋予的类型,然后按照对敲除策略分析处理结果进行具体的序列重复度分值赋予。
更进一步地,所述分值为二进制分值、十进制分值或十六进制分值。
较佳地,过滤筛选后且未被剔除的敲除策略进行分值赋予为并行化进行分值赋予,
也就是说,在本实施例中,保留下来的敲除策略将送入到打分机制中,同时进行分值赋予,而且对其各个需要打分的类型同时进行分值赋予。
具体地,所述分值赋予包括:类型分值赋予、第一长度分值赋予、第一比例分值赋予、第二比例分值赋予、位置分值赋予、第二长度分值赋予、区域范围分值赋予和序列重复度分值赋予。
若对过滤筛选后且未被剔除的敲除策略(即对保留下来的敲除策略)进行类型分值赋予,则根据不同类型的敲除策略赋予相应不同的分值,进而对其进行第一长度分值赋予或第一比例分值赋予或第二比例分值赋予或位置分值赋予或第二长度分值赋予或区域范围分值赋予或序列重复度分值赋予,直至所有种类分值赋予都对敲除策略都赋予了分值。
所述分值赋予可以对一个或多个敲除策略同时进行分值赋予。
打分机制对敲除策略进行打分,具体地:
比如说,对外显子类型打分,假设外显子分为若干种类型(N1、N2……Nn),则对每一种类型赋予不同的分值(SN1、SN2……SNn)。
同理,其它内含子的分值赋予、序列的分值赋予以及位置大小的分值赋予等分值赋予模式都与对外显子类型分值赋予一样,先对各模式分值赋予,再针对所赋予的分值进行下一步操作。
也就是说,本发明第八优选实施例,具体包括如下步骤:
步骤S10,获取敲除策略原始数据信息;
步骤S20,对敲除策略原始数据信息进行过滤筛选,包括将敲除策略原始数据信息与所述序列重复度阀值进行对比判定;
步骤S301,获取过滤筛选后且未被剔除的敲除策略数据信息;
步骤S302,对敲除策略数据信息进行处理;
步骤S303,根据敲除策略数据信息的分析处理结果,进行相应的分值赋予,包括序列重复度分值赋予。
即本发明实施例的步骤S30,针对过滤筛选后且未被剔除的敲除策略进行分值赋予;
步骤S40,整理已赋予分值的敲除策略分值情况;
步骤S50,汇总生成敲除策略数据信息集。
在本实施例中,所述敲除策略原始数据信息为基因敲除策略的所有组合。
较佳地,所述对敲除策略原始数据信息进行的过滤筛选为并行化过滤筛选;
所述统计生成敲除策略数据信息集包括生成敲除策略数据信息分析处理结果报告。
如图9所示,为本发明第九优选实施例。
较佳地,第九优选实施例为第六优选实施例更进一步的实施例,在本实施例中,于步骤S30之中,还包括如下步骤:
步骤S301,获取过滤筛选后且未被剔除的敲除策略数据信息;
步骤S302,对敲除策略数据信息进行处理;
步骤S303,根据敲除策略数据信息的分析处理结果,进行相应的分值赋予,包括序列同源性分值赋予。
也就是说,经过步骤S20对敲除策略原始数据信息进行过滤筛选后,对保留下来的敲除策略进行分析处理,比如:分析敲除策略的种类类型、分析敲除策略的长度类型、分析敲除策略的比例关系、分析敲除策略的位置关系、分析敲除策略的区域范围类型、分析敲除策略的序列复杂性等一系列需要分值赋予的类型分析处理,即对一个或多个敲除策略同时进行分值赋予的类型,然后按照对敲除策略分析处理结果进行具体的序列同源性分值赋予。
更进一步地,所述分值为二进制分值、十进制分值或十六进制分值。
较佳地,过滤筛选后且未被剔除的敲除策略进行分值赋予为并行化进行分值赋予,
也就是说,在本实施例中,保留下来的敲除策略将送入到打分机制中,同时进行分值赋予,而且对其各个需要打分的类型同时进行分值赋予。
具体地,所述分值赋予包括:类型分值赋予、第一长度分值赋予、第一比例分值赋予、第二比例分值赋予、位置分值赋予、第二长度分值赋予、区域范围分值赋予和序列同源性分值赋予。
若对过滤筛选后且未被剔除的敲除策略(即对保留下来的敲除策略)进行类型分值赋予,则根据不同类型的敲除策略赋予相应不同的分值,进而对其进行第一长度分值赋予或第一比例分值赋予或第二比例分值赋予或位置分值赋予或第二长度分值赋予或区域范围分值赋予或序列同源性分值赋予,直至所有种类分值赋予都对敲除策略都赋予了分值。
所述分值赋予可以对一个或多个敲除策略同时进行分值赋予。
打分机制对敲除策略进行打分,具体地:
比如说,对外显子类型打分,假设外显子分为若干种类型(N1、N2……Nn),则对每一种类型赋予不同的分值(SN1、SN2……SNn)。
同理,其它内含子的分值赋予、序列的分值赋予以及位置大小的分值赋予等分值赋予模式都与对外显子类型分值赋予一样,先对各模式分值赋予,再针对所赋予的分值进行下一步操作。
也就是说,本发明第九优选实施例,具体包括如下步骤:
步骤S10,获取敲除策略原始数据信息;
步骤S20,对敲除策略原始数据信息进行过滤筛选,包括将敲除策略原始数据信息与所述序列同源性阀值进行对比判定;
步骤S301,获取过滤筛选后且未被剔除的敲除策略数据信息;
步骤S302,对敲除策略数据信息进行处理;
步骤S303,根据敲除策略数据信息的分析处理结果,进行相应的分值赋予,包括序列同源性分值赋予。
即本发明实施例的步骤S30,针对过滤筛选后且未被剔除的敲除策略进行分值赋予;
步骤S40,整理已赋予分值的敲除策略分值情况;
步骤S50,汇总生成敲除策略数据信息集。
在本实施例中,所述敲除策略原始数据信息为基因敲除策略的所有组合。
较佳地,所述对敲除策略原始数据信息进行的过滤筛选为并行化过滤筛选;
所述统计生成敲除策略数据信息集包括生成敲除策略数据信息分析处理结果报告。
如图10所示,为本发明第十优选实施例。
在本实施例中,于步骤S40之中,还包括如下步骤:
步骤S401,获取已赋予分值的敲除策略数据信息;
步骤S402,对含有分值的敲除策略数据信息进行整理对比;
步骤S403,统计生成分值最高的敲除策略。
具体地,经过步骤S30针对过滤筛选后且未被剔除的敲除策略进行分值赋予,对相应各种类型赋予相应的分值后,针对含有分值的敲除策略数据信息进行整理对比,即进行对敲除策略分值高低排序,最终统计生成分值最高的敲除策略;
相应地,本实施例中的,对敲除策略原始数据信息进行过滤筛选,以及针对过滤筛选后且未被剔除的敲除策略进行分值赋予,适用于上述所有的实施例,在本实施例中就不再赘述。
也就是说,本发明第十优选实施例,具体包括如下步骤:
步骤S10,获取敲除策略原始数据信息;
步骤S20,对敲除策略原始数据信息进行过滤筛选;
步骤S30,针对过滤筛选后且未被剔除的敲除策略进行分值赋予;
步骤S401,获取已赋予分值的敲除策略数据信息;
步骤S402,对含有分值的敲除策略数据信息进行整理对比;
步骤S403,统计生成分值最高的敲除策略。
即本发明实施例的步骤S40,整理已赋予分值的敲除策略分值情况;
步骤S50,汇总生成敲除策略数据信息集。
在本实施例中,所述敲除策略原始数据信息为基因敲除策略的所有组合。
较佳地,所述对敲除策略原始数据信息进行的过滤筛选为并行化过滤筛选;
所述过滤筛选后且未被剔除的敲除策略进行分值赋予为并行化进行分值赋予。
更进一步地,所述分值为二进制分值、十进制分值或十六进制分值。
所述统计生成敲除策略数据信息集包括生成敲除策略数据信息分析处理结果报告。
如图11所示,为本发明第十一优选实施例。
以筛选基因Z的ES条件性敲除最优敲除策略为例,具体阐述一种智能并行化敲除策略筛选的方法,相应操作过程如下:
首先列举基因Z的所有可能的敲除策略,例如:基因Z有4个外显子,分别为Exon1、Exon2、Exon3、Exon4,其中编码区域是Exon1~Exon4,因此可能的敲除策略有敲除Exon1、敲除Exon2、敲除Exon3、敲除Exon4、敲除Exon1~Exon2、敲除Exon1~Exon3、敲除Exon1~Exon4、敲除Exon2~Exon3、敲除Exon2~Exon4、敲除Exon3~Exon4共10个敲除策略。
根据以上10个敲除策略并行化分析,同时进入敲除策略筛选总流程,也就是说超出所述阀值的敲除策略,直接被剔除,将不再参与同其他未对比判定过的阀值进行对比判定。若符合所述阀值的敲除策略,则保留该敲除策略,进而再参与同其他未对比判定过的阀值进行对比判定,直到判定符合所有阈值,则最终被保留下来,进而进入下一操作步骤。
以上述策略为例,阐述敲除策略总流程的分析过程,策略1,敲除Exon1,因此需要分析敲除Exon1是否能满足使基因Z失去活性。Exon1首先进入过滤流程,对其进行所有类型过滤,具体过滤分析如下:
对外显子类型过滤,假设外显子分为若干种类型,若敲除区域的外显子不属于类型阀值中的一种,则该敲除策略则认为是超出要求,进而被剔除,将不再参与同阀值进行对比判定;若敲除区域的外显子不属于类型阀值中的一种,则被保留下来,进而进入下一操作步骤。
同理,其它内含子的过滤、序列的过滤以及位置大小的过滤等过滤模式都与对外显子类型过滤一样,先判定与阀值的关系,再确定该敲除策略是否被剔除抑或被保留。
Exon1完成过滤流程,并满足所有条件,被保留下来,作为待选的敲除策略,将进入打分流程(即打分机制,分值赋予机制),对其相应的敲除策略进行打分,比如对以上的各类型进行逐一赋予分值,而且按照各项指标并行化进行分值赋予(即打分)。
也就是说,保留下来的敲除策略将送入到打分机制中,同时进行分值赋予,而且对其各个需要打分的类型同时进行分值赋予。
例如,对敲除Exon1的策略外显子类型打分,假设外显子类型为若干种类型(N1、N2……Nn)中的N1,则其相对应的分值为SN1
同理,其它内含子的分值赋予、序列的分值赋予以及位置大小的分值赋予等分值赋予模式都与对外显子类型分值赋予一样,对各模式分值赋予,比如说,所有分值模式分别被赋予的分值为SM2、SF3……SXN
综上所述,因此敲除Exon1的策略的综合得分为:
N1+SM2+SF3+……+SXN=FS1分
同时进行筛选策略总流程分析的其他9个策略中,完成过过滤流程被保留下来的策略包含敲除Exon1~Exon2、敲除Exon2~Exon3、敲除Exon2~Exon4、敲除Exon3~Exon4。4个策略继续进入打分流程,分别最终得分为FS2、FS3、FS4。
若其中分值排序为FS2>FS1>FS3>FS4,因此敲除Exon1~Exon2的策略最优,作为基因Z的优选策略。
最终,以敲除Exon1~Exon2的策略的分析过程和结果作为数据基础,采用智能报告撰写系统,输出完整的基因z的ES条件性敲除策略报告,即是统计生成敲除策略数据信息集,比如生成敲除策略数据信息分析处理结果报告。
在本实施例中,所述敲除策略为基因敲除策略的所有组合。
较佳地,进行的过滤筛选为并行化过滤筛选;过滤筛选后且未被剔除的敲除策略进行分值赋予为并行化进行分值赋予。
更进一步地,所述分值为二进制分值、十进制分值或十六进制分值。
如图12所示,本发明提供了一种智能并行化敲除策略筛选的系统,所述系统具体包括:
数据获取单元、过滤筛选单元、分值赋予单元、分值整理单元和信息集汇总单元;
数据获取单元,用于获取敲除策略原始数据信息;
过滤筛选单元,用于对敲除策略原始数据信息进行过滤筛选;
分值赋予单元,用于针对过滤筛选后且未被剔除的敲除策略进行分值赋予;
分值整理单元,用于整理已赋予分值的敲除策略分值情况;
信息集汇总单元,用于汇总生成敲除策略数据信息集。
在本系统中,所述敲除策略原始数据信息为基因敲除策略的所有组合。
较佳地,所述对敲除策略原始数据信息进行的过滤筛选为并行化过滤筛选;
所述过滤筛选后且未被剔除的敲除策略进行分值赋予为并行化进行分值赋予。也就是说,保留下来的敲除策略将送入到打分机制中,同时进行分值赋予,而且对其各个需要打分的类型同时进行分值赋予。
更进一步地,所述分值为二进制分值、十进制分值或十六进制分值。
所述统计生成敲除策略数据信息集包括生成敲除策略数据信息分析处理结果报告。
具体地,所述过滤筛选单元中设置有多个阀值;
所述过滤筛选单元包括:阈值对比模块和剔除模块;
阈值对比模块,用于设置多个阀值,将敲除策略与所述阀值进行对比判定;
剔除模块,用于剔除超出所述阀值的敲除策略。
所述超出所述阀值的敲除策略,直接被剔除,将不再参与同其他未对比判定过的阀值进行对比判定。若符合所述阀值的敲除策略,则保留该敲除策略,进而再参与同其他未对比判定过的阀值进行对比判定,直到判定符合所有阈值,则最终被保留下来,进而进入下一操作步骤。
较佳地,阈值对比模块包括:类型阀值判定模块、第一长度阀值判定模块、第一比例阀值判定模块、第二比例阀值判定模块、位置阀值判定模块、第二长度阀值判定模块、区域范围阀值判定模块和序列复杂性阀值判定模块。
类型阀值判定模块,用于对敲除策略的类型进行对比判定,若敲除策略不等于所述类型阀值,则被剔除,否则保留该敲除策略数据信息。
第一长度阀值判定模块,用于对敲除策略的第一长度进行对比判定,若敲除策略小于第一长度阀值,则被剔除,否则保留该敲除策略数据信息。
第一比例阀值判定模块,用于对敲除策略的第一比例进行对比判定,若敲除策略小于第一比例阀值,则被剔除,否则保留该敲除策略数据信息。
第二比例阀值判定模块,用于对敲除策略的第二比例进行对比判定,若敲除策略小于第二比例阀值,则被剔除,否则保留该敲除策略数据信息。
位置阀值判定模块,用于对敲除策略的位置进行对比判定,若敲除策略位于位置阀值之后,则被剔除,否则保留该敲除策略数据信息。
第二长度阀值判定模块,用于对敲除策略的第二长度进行对比判定,若敲除策略大于第二长度阀值,则被剔除,否则保留该敲除策略数据信息。
区域范围阀值判定模块,用于对敲除策略的区域范围进行对比判定,若敲除策略位于区域范围阀值内,则被剔除,否则保留该敲除策略数据信息。
序列复杂性阀值判定模块,用于对敲除策略的序列复杂性进行对比判定,若敲除策略超出序列复杂性阀值,则被剔除,否则保留该敲除策略数据信息。
更进一步地,所述序列复杂性阀值判定模块还包括:GC含量范围阀值判定模块、序列重复度阀值判定模块和序列同源性阀值判定模块。
GC含量范围阀值判定模块,用于对敲除策略的GC含量范围进行对比判定,若敲除策略不在GC含量范围阀值范围内,则被剔除,否则保留该敲除策略数据信息。
序列重复度阀值判定模块,用于对敲除策略的序列重复度进行对比判定,若敲除策略大于序列重复度阀值,则被剔除,否则保留该敲除策略数据信息。
序列同源性阀值判定模块,用于对敲除策略的序列同源性进行对比判定,若敲除策略大于序列同源性阀值,则被剔除,否则保留该敲除策略数据信息。
具体地,如图13所示,所述分值赋予单元包括:第一数据获取模块、数据分析处理模块和打分模块;
第一数据获取模块,用于获取过滤筛选后且未被剔除的敲除策略数据信息;
数据分析处理模块,用于对敲除策略数据信息进行处理;
打分模块,用于根据敲除策略数据信息的分析处理结果,进行相应的分值赋予。
较佳地,如图13所示,所述打分模块包括:类型分值赋予模块、第一长度分值赋予模块、第一比例分值赋予模块、第二比例分值赋予模块、位置分值赋予模块、第二长度分值赋予模块、区域范围分值赋予模块和序列复杂性分值赋予模块。
类型分值赋予模块,用于若对过滤筛选后且未被剔除的敲除策略(即对保留下来的敲除策略)进行类型分值赋予,根据不同类型的敲除策略赋予相应不同的分值。
第一长度分值赋予模块,用于若对过滤筛选后且未被剔除的敲除策略(即对保留下来的敲除策略)进行第一长度分值赋予,根据不同第一长度的敲除策略赋予相应不同的分值。
第一比例分值赋予模块,用于若对过滤筛选后且未被剔除的敲除策略(即对保留下来的敲除策略)进行第一比例分值赋予,根据不同第一比例的敲除策略赋予相应不同的分值。
第二比例分值赋予模块,用于若对过滤筛选后且未被剔除的敲除策略(即对保留下来的敲除策略)进行第二比例分值赋予,根据不同第二比例的敲除策略赋予相应不同的分值。
位置分值赋予模块,用于若对过滤筛选后且未被剔除的敲除策略(即对保留下来的敲除策略)进行位置分值赋予,根据不同位置的敲除策略赋予相应不同的分值。
第二长度分值赋予模块,用于若对过滤筛选后且未被剔除的敲除策略(即对保留下来的敲除策略)进行第二长度分值赋予,根据不同第二长度的敲除策略赋予相应不同的分值。
区域范围分值赋予模块,用于若对过滤筛选后且未被剔除的敲除策略(即对保留下来的敲除策略)进行区域范围分值赋予,根据不同区域范围的敲除策略赋予相应不同的分值。
序列复杂性分值赋予模块,用于若对过滤筛选后且未被剔除的敲除策略(即对保留下来的敲除策略)进行序列复杂性分值赋予,根据不同序列复杂性的敲除策略赋予相应不同的分值。
更进一步地,如图13所示,所述序列复杂性分值赋予模块包括GC含量分值赋予模块、序列重复度分值赋予模块和序列同源性分值赋予模块
GC含量分值赋予模块,用于若对过滤筛选后且未被剔除的敲除策略(即对保留下来的敲除策略)进行GC含量分值赋予,根据不同GC含量的敲除策略赋予相应不同的分值。
序列重复度分值赋予模块,用于若对过滤筛选后且未被剔除的敲除策略(即对保留下来的敲除策略)进行序列重复度分值赋予,根据不同序列重复度的敲除策略赋予相应不同的分值。
序列同源性分值赋予模块,用于若对过滤筛选后且未被剔除的敲除策略(即对保留下来的敲除策略)进行序列同源性分值赋予,根据不同序列同源性的敲除策略赋予相应不同的分值。
具体地,如图13所示,所述分值整理单元包括:
第二数据获取模块,用于获取已赋予分值的敲除策略数据信息;
分值排比模块,用于对含有分值的敲除策略数据信息进行整理对比;
统计生成模块,用于统计生成分值最高的敲除策略。
如图14所示,为本发明实施例提供的终端的结构示意图。在本发明较佳实施例中,所述终端3包括存储器31、至少一个处理器32、至少一条通信总线33及显示屏幕34。
本领域技术人员应该了解,图14示出的终端的结构并不构成本发明实施例的限定,既可以是总线型结构,也可以是星形结构,所述终端3还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置。
在一些实施例中,所述终端3包括一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的终端,其硬件包括但不限于微处理器、专用集成电路、可编程门阵列、数字处理器、嵌入式设备等。所述终端3还可包括客户设备,所述客户设备包括但不限于任何一种可与客户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、数码相机等。
需要说明的是,所述终端3仅为举例,其他现有的或今后可能出现的电子产品如可适应于本发明,也应包含在本发明的保护范围以内,并以引用方式包含于此。
在一些实施例中,所述存储器31用于存储程序代码和各种数据,例如安装在所述终端3中的智能并行化敲除策略筛选系统,并在终端3的运行过程中实现高速、自动地完成程序或数据的存取。所述存储器31包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子擦除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(Compact Disc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
在一些实施例中,所述至少一个处理器32可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述至少一个处理器32是所述终端3的控制核心(Control Unit),利用各种接口和线路连接整个终端3的各个部件,通过运行或执行存储在所述存储器31内的程序或者模块,以及调用存储在所述存储器31内的数据,以执行终端3的各种功能和处理数据,例如执行智能并行化敲除策略筛选的功能。
在一些实施例中,所述至少一条通信总线33被设置为实现所述存储器31、所述至少一个处理器32以及所述显示屏幕34等之间的连接通信。
在一些实施例中,所述显示屏幕34可用于显示由观看者输入的信息或提供给观看者的信息以及终端3的各种图形观看者接口,这些图形观看者接口可以由图形、文本、图标、视频和其任意组合来构成。所述显示屏幕34可包括显示面板,可选的,可以采用液晶显示屏幕(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板。
所述显示屏幕34还可以包括触摸面板。如果所述显示屏幕34包括触摸面板,所述显示屏幕34可以被实现为触摸屏,以接收来自观看者的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。上述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与上述触摸或滑动操作相关的持续时间和压力。所述显示面板与所述触摸面板可以作为两个独立的部件来实现输入和输入功能,但是在某些实施例中,可以将所述显示面板与所述触摸面板进行集成而实现输入和输出功能。
尽管未示出,所述终端3还可以包括给各个部件供电的电源(比如电池),优选的,电源可以通过电源管理装置与所述至少一个处理器32逻辑相连,从而通过电源管理装置实现管理充电、放电、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述终端3还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分。
在进一步的实施例中,结合图14,所述至少一个处理器32可执行所述终端3的操作装置以及安装的各类应用程序(如所述的智能并行化敲除策略筛选系统)、程序代码等,例如,上述的各个模块。
所述存储器31中存储有程序代码,且所述至少一个处理器32可调用所述存储器31中存储的程序代码以执行相关的功能。例如,系统中所述的各个模块是存储在所述存储器31中的程序代码,并由所述至少一个处理器32所执行,从而实现所述各个模块的功能以达到智能并行化敲除策略筛选的目的。
在本发明的一个实施例中,所述存储器31存储多个指令,所述多个指令被所述至少一个处理器32所执行以实现智能并行化敲除策略筛选的方法。
在本发明的一个实施例中,所述处理器32对所述多个指令的执行包括:
步骤S10,获取敲除策略原始数据信息;
步骤S20,对敲除策略原始数据信息进行过滤筛选;
步骤S30,针对过滤筛选后且未被剔除的敲除策略进行分值赋予;
步骤S40,整理已赋予分值的敲除策略分值情况;
步骤S50,汇总生成敲除策略数据信息集。
所述敲除策略原始数据信息为基因敲除策略的所有组合。
较佳地,所述对敲除策略原始数据信息进行的过滤筛选为并行化过滤筛选;
所述过滤筛选后且未被剔除的敲除策略进行分值赋予为并行化进行分值赋予。
更进一步地,所述分值为二进制分值、十进制分值或十六进制分值。
所述统计生成敲除策略数据信息集包括生成敲除策略数据信息分析处理结果报告。
具体地,所述至少一个处理器32对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。
本发明通过一种智能并行化敲除策略筛选的方法各个步骤,及系统的各功能单元与功能模块,可以解决对经验丰富的专家的依赖,针对没有丰富经验的普通人员也可以进行敲除策略选取。
而且还解决敲除策略的时间问题,倘若一个基因的敲除策略报告需要半天时间才能获得,将严重制约基因打靶相关的商业及基础研究发展。通过本发明的步骤方法和系统几分钟内即可获得一份敲除策略报告。
具更进一步地,还解决敲除策略选取对不同时间不同专家的依赖,针对同一个基因,只要基因的信息没有发生变化(随着研究深入,基因的功能等信息可能会发生变化,影响敲除策略),该基因的最优敲除策略都是一致的,报告内容及格式也一致,不受外在因素的干扰而发生改变的敲除策略选取。
也就是说,原有技术获得基因的敲除策略,需要丰富经验的专家来完成,而本发明将专家多年以来的实践经验进行梳理总结,研发所得一种智能并行化敲除策略筛选的方法及系统,使用者将不需要具备敲除策略相关知识,只需要输入其感兴趣的基因,几分钟内即可得到一份分析详尽,结果完善的敲除策略报告。利用人工智能算法来代替人工的敲除策略选取,把专业性强、繁琐、耗时且容易出错的工作交给人工智能系统,从而解决领域内一个瓶颈问题,让全球科学家能随时、实时和免费地拿到各种基因打靶方案。
比如说,通过本发明一种智能并行化敲除策略筛选的方法及系统目前可以完成小鼠ES打靶的条件性敲除、CRISPR/Cas9的广泛敲除及条件性敲除的敲除策略筛选。3种类型的整体实现方法一样,也就是说先进行敲除策略排列组合,随后进行一系列并行分析,筛选出最优的敲除策略这个实现流程一致。
总的来说,通过本发明的方法及系统,可以大大提高产出和工作效率,原本半天才能完成的报告,现在只需要几分钟;解放人力物力;实现了智能化并行化敲除策略筛选模式和智能化撰写敲除策略报告,从而降低出错概率;打破知识背景壁垒,也就是说,针对没有丰富经验的学生研究者也可以快速获得基因的敲除策略;有助开启新的销售模式,带来更大的收益,原技术的瓶颈下,通过客户通过销售传达感兴趣基因到策略专家处,策略专家分析获得敲除策略优选方案再通过销售反馈给客户,客户了解感兴趣的基因的敲除策略往往需要一两天,而现在通过线上分析,几分钟即可获得完整的敲除策略分析报告,因此可即时定制感兴趣的基因打靶服务。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (18)

1.一种智能并行化敲除策略筛选的方法,其特征在于,所述方法具体包括如下步骤:
步骤S10,获取敲除策略原始数据信息;
步骤S20,对敲除策略原始数据信息进行过滤筛选;
步骤S30,针对过滤筛选后且未被剔除的敲除策略进行分值赋予;
步骤S40,整理已赋予分值的敲除策略分值情况;
步骤S50,汇总生成敲除策略数据信息集。
2.根据权利要求1所述的一种智能并行化敲除策略筛选的方法,其特征在于,所述敲除策略原始数据信息为基因敲除策略的所有组合。
3.根据权利要求1所述的一种智能并行化敲除策略筛选的方法,其特征在于,所述对敲除策略原始数据信息进行的过滤筛选为并行化过滤筛选;
所述过滤筛选后且未被剔除的敲除策略进行分值赋予为并行化进行分值赋予。
4.根据权利要求3所述的一种智能并行化敲除策略筛选的方法,其特征在于,所述分值为二进制分值、十进制分值或十六进制分值。
5.根据权利要求1所述的一种智能并行化敲除策略筛选的方法,其特征在于,所述汇总生成敲除策略数据信息集,包括生成敲除策略数据信息分析处理结果报告。
6.根据权利要求1所述的一种智能并行化敲除策略筛选的方法,其特征在于,所述步骤S20中,设置有多个阀值;
所述步骤S20中,还包括如下步骤:
步骤S201,设置多个阀值,将敲除策略与所述阀值进行对比判定;
步骤S202,剔除超出所述阀值的敲除策略;
所述超出所述阀值的敲除策略,将不再参与同其他未对比判定过的阀值进行对比判定。
7.根据权利要求6所述的一种智能并行化敲除策略筛选的方法,其特征在于,所述阀值包括:类型阀值、第一长度阀值、第一比例阀值、第二比例阀值、位置阀值、第二长度阀值、区域范围阀值和序列复杂性阀值。
8.根据权利要求7所述的一种智能并行化敲除策略筛选的方法,其特征在于,所述序列复杂性阀值包括GC含量范围阀值、序列重复度阀值和序列同源性阀值。
9.根据权利要求1所述的一种智能并行化敲除策略筛选的方法,其特征在于,所述步骤S30中,还包括如下步骤:
步骤S301,获取过滤筛选后且未被剔除的敲除策略数据信息;
步骤S302,对敲除策略数据信息进行处理;
步骤S303,根据敲除策略数据信息的分析处理结果,进行相应的分值赋予。
10.根据权利要求9所述的一种智能并行化敲除策略筛选的方法,其特征在于,所述分值赋予包括:类型分值赋予、第一长度分值赋予、第一比例分值赋予、第二比例分值赋予、位置分值赋予、第二长度分值赋予、区域范围分值赋予和序列复杂性分值赋予。
11.根据权利要求10所述的一种智能并行化敲除策略筛选的方法,其特征在于,所述序列复杂性分值赋予包括GC含量分值赋予、序列重复度分值赋予和序列同源性分值赋予。
12.根据权利要求1所述的一种智能并行化敲除策略筛选的方法,其特征在于,所述步骤S40中,还包括如下步骤:
步骤S401,获取已赋予分值的敲除策略数据信息;
步骤S402,对含有分值的敲除策略数据信息进行整理对比;
步骤S403,统计生成分值最高的敲除策略。
13.一种智能并行化敲除策略筛选的系统,其特征在于,所述系统包括:
数据获取单元、过滤筛选单元、分值赋予单元、分值整理单元和信息集汇总单元;
数据获取单元,用于获取敲除策略原始数据信息;
过滤筛选单元,用于对敲除策略原始数据信息进行过滤筛选;
分值赋予单元,用于针对过滤筛选后且未被剔除的敲除策略进行分值赋予;
分值整理单元,用于整理已赋予分值的敲除策略分值情况;
信息集汇总单元,用于汇总生成敲除策略数据信息集。
14.根据权利要求13所述的一种智能并行化敲除策略筛选的系统,其特征在于,所述过滤筛选单元中设置有多个阀值;
所述过滤筛选单元包括:阈值对比模块和剔除模块;
阈值对比模块,用于设置多个阀值,将敲除策略与所述阀值进行对比判定;
剔除模块,用于剔除超出所述阀值的敲除策略。
15.根据权利要求13所述的一种智能并行化敲除策略筛选的系统,其特征在于,所述分值赋予单元包括:第一数据获取模块、数据分析处理模块和打分模块;
第一数据获取模块,用于获取过滤筛选后且未被剔除的敲除策略数据信息;
数据分析处理模块,用于对敲除策略数据信息进行处理;
打分模块,用于根据敲除策略数据信息的分析处理结果,进行相应的分值赋予。
16.根据权利要求13所述的一种智能并行化敲除策略筛选的系统,其特征在于,所述分值整理单元包括:
第二数据获取模块,用于获取已赋予分值的敲除策略数据信息;
分值排比模块,用于对含有分值的敲除策略数据信息进行整理对比;
统计生成模块,用于统计生成分值最高的敲除策略。
17.一种智能并行化敲除策略筛选的平台,其特征在于,包括:
处理器、存储器以及智能并行化敲除策略筛选的平台控制程序;
其中在所述处理器执行所述平台控制程序,所述智能并行化敲除策略筛选的平台控制程序被存储在所述存储器中,所述智能并行化敲除策略筛选的平台控制程序,实现如权利要求1至12中任一项所述的智能并行化敲除策略筛选的方法步骤。
18.一种计算机可读取存储介质,其特征在于,所述计算机可读取存储介质存储有智能并行化敲除策略筛选的平台控制程序,所述智能并行化敲除策略筛选的平台控制程序,实现如权利要求1至12中任一项所述的智能并行化敲除策略筛选的方法步骤。
CN201810766174.7A 2018-07-04 2018-07-12 一种智能并行化敲除策略筛选的方法及系统 Active CN110751982B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201810722034X 2018-07-04
CN201810722034 2018-07-04

Publications (2)

Publication Number Publication Date
CN110751982A true CN110751982A (zh) 2020-02-04
CN110751982B CN110751982B (zh) 2023-11-10

Family

ID=69060610

Family Applications (4)

Application Number Title Priority Date Filing Date
CN201810766174.7A Active CN110751982B (zh) 2018-07-04 2018-07-12 一种智能并行化敲除策略筛选的方法及系统
CN201811063870.8A Active CN110689922B (zh) 2018-07-04 2018-09-12 一种自动并行化敲除策略gc含量分析的方法及系统
CN201811635741.1A Active CN110689923B (zh) 2018-07-04 2018-12-29 一种自动并行化敲除策略序列重复性分析方法及其系统
CN201910588833.7A Active CN110689924B (zh) 2018-07-04 2019-07-02 一种基于多种敲除类型的敲除策略筛选方法及系统

Family Applications After (3)

Application Number Title Priority Date Filing Date
CN201811063870.8A Active CN110689922B (zh) 2018-07-04 2018-09-12 一种自动并行化敲除策略gc含量分析的方法及系统
CN201811635741.1A Active CN110689923B (zh) 2018-07-04 2018-12-29 一种自动并行化敲除策略序列重复性分析方法及其系统
CN201910588833.7A Active CN110689924B (zh) 2018-07-04 2019-07-02 一种基于多种敲除类型的敲除策略筛选方法及系统

Country Status (2)

Country Link
CN (4) CN110751982B (zh)
WO (1) WO2020007349A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112614541A (zh) * 2020-12-16 2021-04-06 广州源井生物科技有限公司 基因编辑位点的自动筛选方法、系统、装置及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102521528A (zh) * 2011-12-05 2012-06-27 中国科学院计算机网络信息中心 一种基因序列数据的筛选方法
CN106845151A (zh) * 2015-12-07 2017-06-13 中国农业大学 CRISPR-Cas9系统sgRNA作用靶点的筛选方法及装置
WO2017181735A2 (zh) * 2016-04-20 2017-10-26 广东省农业科学院农业生物基因研究中心 一种用于猪基因编辑的高效特异性sgRNA识别位点引导序列及其筛选方法
CN108055272A (zh) * 2017-12-21 2018-05-18 广州科瑞工程信息咨询有限公司 基于远程授权的投标文件筛选方法和系统

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2031068A1 (en) * 1999-07-14 2009-03-04 Transgenic Inc. Trap vector and gene trapping method by using the same
JP3711367B2 (ja) * 2001-05-25 2005-11-02 独立行政法人科学技術振興機構 ノックアウト動物
JP3713513B2 (ja) * 2001-05-25 2005-11-09 独立行政法人科学技術振興機構 ノックアウト動物
EP1654371A4 (en) * 2001-06-21 2010-02-10 Verenium Corp METHOD FOR PRODUCING PURE ENANTIOMERIC PURELY COMPOUNDS AND SELECTION OF ENANTIOSELECTIVE ENZYMES
US20050220781A1 (en) * 2003-09-04 2005-10-06 Duen-Hwa Yan IFIX, a novel HIN-200 protein, for cancer therapy
US7948988B2 (en) * 2006-07-27 2011-05-24 Sourcefire, Inc. Device, system and method for analysis of fragments in a fragment train
US9617557B2 (en) * 2007-09-14 2017-04-11 Basf Plant Science Gmbh Plants having increased yield-related traits by expressing a growth-regulating factor (GRF) polypeptide and method for making the same
CN102229940B (zh) * 2010-12-20 2013-05-08 中国热带农业科学院热带生物技术研究所 一种莱茵衣藻目标基因敲除方法
JP2014223067A (ja) * 2013-04-18 2014-12-04 学校法人 岩手医科大学 PSD−Zip70遺伝子ノックアウト非ヒト動物、およびその用途
CN104598769A (zh) * 2015-02-10 2015-05-06 上海丰核信息科技有限公司 自动化DNase-seq数据处理分析系统
CN105400810B (zh) * 2015-09-06 2019-05-07 吉林大学 采用敲除技术建立低磷性佝偻病模型的方法
US11905521B2 (en) * 2015-11-17 2024-02-20 The Chinese University Of Hong Kong Methods and systems for targeted gene manipulation
US20190134227A1 (en) * 2016-04-18 2019-05-09 The Board Of Regents Of The University Of Texas System Generation of genetically engineered animals by crispr/cas9 genome editing in spermatogonial stem cells
CN106446600B (zh) * 2016-05-20 2019-10-18 同济大学 一种基于CRISPR/Cas9的sgRNA的设计方法
CN107513538A (zh) * 2016-06-17 2017-12-26 北京大学 基因敲除方法
CN106119283A (zh) * 2016-06-24 2016-11-16 广西壮族自治区水牛研究所 一种利用CRISPR‑Cas9靶向敲除MSTN基因的方法
CN106191114B (zh) * 2016-07-29 2020-02-11 中国科学院重庆绿色智能技术研究院 利用CRISPR-Cas9系统敲除鱼类MC4R基因的育种方法
CN106222177B (zh) * 2016-08-13 2018-06-26 江苏集萃药康生物科技有限公司 一种靶向人STAT6的CRISPR-Cas9系统及其用于治疗过敏性疾病的应用
CN106484844B (zh) * 2016-09-30 2019-06-25 云润大数据服务有限公司 大数据挖掘方法及系统
CN106713341A (zh) * 2017-01-04 2017-05-24 成都四方伟业软件股份有限公司 一种基于大数据的网络安全预警方法与系统
CN107868798A (zh) * 2017-03-31 2018-04-03 上海市公共卫生临床中心 一种基于基因敲除细胞的阳性筛选体系的建立方法
CN107937445B (zh) * 2017-07-25 2021-05-04 北京希诺谷生物科技有限公司 利用体细胞克隆技术制备基因敲除犬的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102521528A (zh) * 2011-12-05 2012-06-27 中国科学院计算机网络信息中心 一种基因序列数据的筛选方法
CN106845151A (zh) * 2015-12-07 2017-06-13 中国农业大学 CRISPR-Cas9系统sgRNA作用靶点的筛选方法及装置
WO2017181735A2 (zh) * 2016-04-20 2017-10-26 广东省农业科学院农业生物基因研究中心 一种用于猪基因编辑的高效特异性sgRNA识别位点引导序列及其筛选方法
CN108055272A (zh) * 2017-12-21 2018-05-18 广州科瑞工程信息咨询有限公司 基于远程授权的投标文件筛选方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SOREN H. HOUGH ET AL.: "Guide Picker is a comprehensive design tool for visualizing and selecting guides for CRISPR experiments", 《BMC BIOINFORMATICS》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112614541A (zh) * 2020-12-16 2021-04-06 广州源井生物科技有限公司 基因编辑位点的自动筛选方法、系统、装置及存储介质

Also Published As

Publication number Publication date
CN110689923B (zh) 2022-05-17
CN110689923A (zh) 2020-01-14
CN110689922B (zh) 2023-07-14
CN110689924A (zh) 2020-01-14
WO2020007349A1 (zh) 2020-01-09
CN110751982B (zh) 2023-11-10
CN110689924B (zh) 2023-07-14
CN110689922A (zh) 2020-01-14

Similar Documents

Publication Publication Date Title
CN109634801B (zh) 数据趋势分析方法、系统、计算机装置及可读存储介质
CN109684162B (zh) 设备状态预测方法、系统、终端及计算机可读存储介质
CN109885452A (zh) 性能监控方法、装置及终端设备
CN111782900B (zh) 异常业务检测方法、装置、电子设备及存储介质
EP3420485A1 (en) Method and system for quantifying the likelihood that a gene is casually linked to a disease
CN115271648B (zh) 一种项目可视化监管系统、方法、设备及存储介质
CN111950706A (zh) 基于人工智能的数据处理方法、装置、计算机设备及介质
CN111176767A (zh) 表数据处理方法、装置、计算机设备和存储介质
CN114519521A (zh) 一种资源调度方法、装置、计算机设备及存储介质
CN110659717A (zh) 一种智能识别染色体数量的方法及系统
CN111652282A (zh) 基于大数据的用户偏好分析方法、装置及电子设备
CN111415062A (zh) 众包任务分配方法、装置、电子设备及存储介质
CN110751982B (zh) 一种智能并行化敲除策略筛选的方法及系统
CN112346838A (zh) 一种基于物联网的智能调度方法及装置
CN109460234B (zh) 应用程序瘦身方法、装置、终端及存储介质
CN113822379B (zh) 工艺制程异常分析方法、装置、电子设备及存储介质
CN115913763A (zh) 流量异常检测方法、装置、设备及介质
CN113657499B (zh) 基于特征选择的权益分配方法、装置、电子设备及介质
CN115271821A (zh) 网点分布处理方法、装置、计算机设备及存储介质
CN114863994A (zh) 污染评估方法、装置、电子设备及存储介质
CN114238233A (zh) 文件自动化清理方法、装置、设备及存储介质
CN115796710B (zh) 电力物资智能抽检方法、装置、电子设备及可读存储介质
CN111026307B (zh) 一种用于快速关联图形组态工具中图元的方法及装置
CN115242662B (zh) 基于云计算的数据资源分配方法及装置
CN111881661B (zh) 基于电子表格的数据处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20210319

Address after: 510663 rooms 1401, 1501 and 1601, building C, 288 Shenzhou Road, Huangpu District, Guangzhou City, Guangdong Province

Applicant after: Guangzhou Saiye Baimu Biotechnology Co.,Ltd.

Address before: Room d314, D315, d316, D317, Guangzhou Science City International Incubator Building (Zone D), Guangzhou hi tech Industrial Development Zone, Guangdong 510663

Applicant before: CYAGEN BIOSCIENCES (GUANGZHOU) Inc.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant