CN109698028A - 疾病影响变量筛选方法、装置和计算机设备 - Google Patents

疾病影响变量筛选方法、装置和计算机设备 Download PDF

Info

Publication number
CN109698028A
CN109698028A CN201811586455.0A CN201811586455A CN109698028A CN 109698028 A CN109698028 A CN 109698028A CN 201811586455 A CN201811586455 A CN 201811586455A CN 109698028 A CN109698028 A CN 109698028A
Authority
CN
China
Prior art keywords
independent variable
undetermined
variable
regression model
strategy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811586455.0A
Other languages
English (en)
Inventor
冯洁瑜
李菁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Tianpeng Computer Technology Co ltd
First Affiliated Hospital of Guangzhou Medical University
Original Assignee
Guangzhou Tian Peng Computer Science And Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Tian Peng Computer Science And Technology Co Ltd filed Critical Guangzhou Tian Peng Computer Science And Technology Co Ltd
Priority to CN201811586455.0A priority Critical patent/CN109698028A/zh
Publication of CN109698028A publication Critical patent/CN109698028A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Operations Research (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Epidemiology (AREA)
  • Algebra (AREA)
  • Pathology (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种疾病影响变量筛选方法、装置和计算机设备,其方法包括:获取待分析疾病的因变量,以及,获取待分析疾病的多个待定自变量;根据所述多个待定自变量从预存的多个候选筛选策略中确定自变量筛选策略;根据所述自变量筛选策略、所述因变量和预设回归模型,从所述多个待定自变量中,筛选出符合所述预设回归模型的引入条件的待定自变量;将所筛选出的所述待定自变量,作为与所述因变量相关的自变量;针对不同自变量确定对应的变量筛选方法,有效提高数据分析的准确性。

Description

疾病影响变量筛选方法、装置和计算机设备
技术领域
本发明涉及计算机技术领域,特别是涉及一种疾病影响变量筛选方法、装置和计算机设备。
背景技术
线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。
然而,在许多回归分析的应用中,由于没有清晰的理论依据,回归模型所包含的自变量难以预先确定,如果将一些不重要的自变量也引入方程,会降低模型的精度,因此选择有意义的自变常常是回归分析的第一步。
现有技术中的分析软件仅给出了回归的最终结果,不能根据不同自变量确定对应的变量筛选方法,数据分析准确性不够高。
发明内容
本发明的目的在于提供一种疾病影响变量筛选方法、装置、计算机设备和可读存储介质,针对不同自变量确定对应的变量筛选方法,有效提高数据分析的准确性。
本发明的目的通过如下技术方案实现:
一种疾病影响变量筛选方法,所述方法包括:
获取待分析疾病的因变量,以及,获取待分析疾病的多个待定自变量;
根据所述多个待定自变量从预存的多个候选筛选策略中确定自变量筛选策略;
根据所述自变量筛选策略、所述因变量和预设回归模型,从所述多个待定自变量中,筛选出符合所述预设回归模型的引入条件的待定自变量;
将所筛选出的所述待定自变量,作为与所述因变量相关的自变量。
在其中一个实施例中,所述根据所述多个待定自变量从预存的多个候选筛选策略中确定自变量筛选策略,包括:
展示多个候选筛选策略和所述多个待定自变量;
将选取的所述候选筛选策略作为所述自变量筛选策略。
在其中一个实施例中,所述根据所述多个待定自变量从预存的多个候选筛选策略中确定自变量筛选策略,包括:
获取所述多个待定自变量的数量;
查询预存的多个所述候选筛选策略中,与所述待定自变量数量对应的自变量筛选策略。
在其中一个实施例中,所述候选筛选策略包括逐步引入策略、逐步剔除策略和双向筛选策略中的至少一种。
在其中一个实施例中,所述根据所述自变量筛选策略、所述因变量和预设回归模型,从所述多个待定自变量中,筛选出符合所述预设回归模型的引入条件的待定自变量,包括:
当所述自变量筛选策略为逐步引入策略时,将所述因变量引入所述预设回归模型;
从所述多个待定自变量中选取待定自变量,对选取的所述待定自变量做联合假设检验,当所述检验结果符合预设条件,将选取的待定自变量引入所述预设回归模型;
获取所有引入所述预设回归模型的待定自变量。
在其中一个实施例中,所述根据所述自变量筛选策略、所述因变量和预设回归模型,从所述多个待定自变量中,筛选出符合所述预设回归模型的引入条件的待定自变量,包括:
当所述自变量筛选策略为逐步剔除策略时,将所述因变量和所述多个待定自变量全部引入所述预设回归模型;
从所述多个待定自变量中选取待定自变量,对选取的所述待定自变量做联合假设检验,当所述检验结果不符合预设条件,将选取的待定自变量从所述预设回归模型中删除;
获取所有保留在所述预设回归模型的待定自变量。
在其中一个实施例中,所述根据所述自变量筛选策略、所述因变量和预设回归模型,从所述多个待定自变量中,筛选出符合所述预设回归模型的引入条件的待定自变量,包括:
当所述自变量筛选策略为双向筛选策略时,将所述因变量引入所述预设回归模型;
从所述多个待定自变量中选取第一待定自变量,对所述第一待定自变量做联合假设检验,当所述检验结果符合第一预设条件,将所述第一待定自变量引入所述预设回归模型;
从引入所述预设回归模型的待定自变量中选取第二待定自变量,对所述第二待定自变量做联合假设检验,当所述检验结果不符合第二预设条件,将选取所述第二待定自变量从所述预设回归模型中删除;
获取所有保留在所述预设回归模型的待定自变量。
一种疾病影响变量筛选装置,所述装置包括:
待定自变量获取模块,用于获取待分析疾病的因变量,以及,获取待分析疾病的多个待定自变量;
策略选取模块,用于根据所述多个待定自变量从预存的多个候选筛选策略中确定自变量筛选策略;
筛选模块,用于根据所述自变量筛选策略、所述因变量和预设回归模型,从所述多个待定自变量中,筛选出符合所述预设回归模型的引入条件的待定自变量;
自变量确定模块,用于将所筛选出的所述待定自变量,作为与所述因变量相关的自变量。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如下步骤:
获取待分析疾病的因变量,以及,获取待分析疾病的多个待定自变量;
根据所述多个待定自变量从预存的多个候选筛选策略中确定自变量筛选策略;
根据所述自变量筛选策略、所述因变量和预设回归模型,从所述多个待定自变量中,筛选出符合所述预设回归模型的引入条件的待定自变量;
将所筛选出的所述待定自变量,作为与所述因变量相关的自变量。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如下步骤:
获取待分析疾病的因变量,以及,获取待分析疾病的多个待定自变量;
根据所述多个待定自变量从预存的多个候选筛选策略中确定自变量筛选策略;
根据所述自变量筛选策略、所述因变量和预设回归模型,从所述多个待定自变量中,筛选出符合所述预设回归模型的引入条件的待定自变量;
将所筛选出的所述待定自变量,作为与所述因变量相关的自变量。
根据上述本发明的方案,其获取待分析疾病的因变量,以及,获取待分析疾病的多个待定自变量;根据所述多个待定自变量从预存的多个候选筛选策略中确定自变量筛选策略;根据所述自变量筛选策略、所述因变量和预设回归模型,从所述多个待定自变量中,筛选出符合所述预设回归模型的引入条件的待定自变量;将所筛选出的所述待定自变量,作为与所述因变量相关的自变量;针对不同自变量确定对应的变量筛选方法,有效提高数据分析的准确性。
附图说明
图1为一个实施例中疾病影响变量筛选方法的应用环境图;
图2为一个实施例中疾病影响变量筛选方法的流程示意图;
图3为一个实施例中疾病影响变量筛选装置的结构框图;
图4为一个实施例中计算机设备的内部结构图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不限定本发明的保护范围。
本申请提供的疾病影响变量筛选方法,可以应用于如图1所示的应用环境中。其中,服务器获取待分析疾病的因变量,以及,获取待分析疾病的多个待定自变量;服务器根据所述多个待定自变量从预存的多个候选筛选策略中确定自变量筛选策略;服务器根据所述自变量筛选策略、所述因变量和预设回归模型,从所述多个待定自变量中,筛选出符合所述预设回归模型的引入条件的待定自变量;服务器将所筛选出的所述待定自变量,作为与所述因变量相关的自变量。其中,服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。本领域技术人员可以理解,本申请提供的疾病影响变量筛选方法,不仅可以应用于图1所示的应用环境中,还可以应用但不限于各种计算机中。
在一个实施例中,如图2所示,提供了一种疾病影响变量筛选,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤S201,获取待分析疾病的因变量,以及,获取待分析疾病的多个待定自变量。
其中,自变量是指研究者主动操纵,而引起因变量发生变化的因素或条件,因此自变量被看作是因变量的原因。
例如,自变量数据包括年龄,性别,体重等等,对应的因变量数据包括中心粒细胞计数。
步骤S202,根据所述多个待定自变量从预存的多个候选筛选策略中确定自变量筛选策略。
在具体实施过程中,服务器可以展示多个候选筛选策略和多个待定因变量,用户查看多个待定因变量,然后选取自变量筛选策略。
在另一种实施例过程中,服务器中存储有多个候选筛选策略和对应的待定因变量数量,获取待定因变量的数量,就可以查询和因变量数量对应的候选筛选策略,将查询到的候选筛选策略作为自变量筛选策略。
步骤S203,根据所述自变量筛选策略、所述因变量和预设回归模型,从所述多个待定自变量中,筛选出符合所述预设回归模型的引入条件的待定自变量。
其中,回归模型是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。
在具体实施过程中,回归模型是线性回归模型;每次引入一个自变量到回归模型,或者每次从回归模型中剔除一个自变量,决定取舍基于对自变量的偏回归平方和的F检验系数。
其中,F检验最常用的别名叫做联合假设检验此外也称方差比率检验、方差齐性检验。它是一种在零假设之下,统计值服从F-分布的检验。其通常是用来分析用了超过一个参数的统计模型,以判断该模型中的全部或一部分参数是否适合用来估计母体。
步骤S204,将所筛选出的所述待定自变量,作为与所述因变量相关的自变量。
在具体实施中,筛选完成时得到的回归方程,可以直接用于回归计算因变量和自变量的关系,筛选得到的待定自变量就是与所述因变量相关的自变量。
上述疾病影响变量筛选方法中,通过获取待分析疾病的因变量,以及,获取待分析疾病的多个待定自变量;根据所述多个待定自变量从预存的多个候选筛选策略中确定自变量筛选策略;根据所述自变量筛选策略、所述因变量和预设回归模型,从所述多个待定自变量中,筛选出符合所述预设回归模型的引入条件的待定自变量;将所筛选出的所述待定自变量,作为与所述因变量相关的自变量;针对不同自变量确定对应的变量筛选方法,有效提高数据分析的准确性。
在其中一个实施例中,所述根据所述多个待定自变量从预存的多个候选筛选策略中确定自变量筛选策略,包括:
展示多个候选筛选策略和所述多个待定自变量。
其中,候选筛选策略包括多种对自变量的筛选方式,不同在于选入自变量的顺序不同。
在具体实施过程中候选筛选策略包括逐步引入策略、逐步剔除策略和双向筛选策略中的至少一种。
将选取的所述候选筛选策略作为所述自变量筛选策略。
在具体实施过程中,服务器包括显示屏,显示屏展示多个候选筛选策略,以及展示多个待定自变量,用户根据展示的多个候选筛选策略和多个待定自变量,从多个候选筛选策略中选取一个作为自变量筛选策略。
在其中一个实施例中,所述根据所述多个待定自变量从预存的多个候选筛选策略中确定自变量筛选策略,包括:
获取所述多个待定自变量的数量。
在具体实施过程中,由于不同的自变量筛选策略引入自变量的顺序不同,因此,适合的待定自变量的数目也不同。
例如,逐步引入策略适合的自变量数目较少,因为后续变量不断引入的话,可能会导致先前进入回归模型的自变量变得毫无统计学意义。
查询预存的多个所述候选筛选策略中,与所述待定自变量数量对应的自变量筛选策略。
在具体实施过程中,服务器中存储有多个候选筛选策略和对应的待定因变量数量,获取待定因变量的数量,就可以查询和因变量数量对应的候选筛选策略,将查询到的候选筛选策略作为自变量筛选策略。
例如,待定自变量个数小于30时,对应的候选筛选策略为逐步引入策略;待定自变量个数为30-60时,对应的候选筛选策略为双向筛选策略;待定自变量个数大于60时,对应的候选筛选策略为逐步剔除策略。
在其中一个实施例中,所述根据所述自变量筛选策略、所述因变量和预设回归模型,从所述多个待定自变量中,筛选出符合所述预设回归模型的引入条件的待定自变量,包括:
当所述自变量筛选策略为逐步引入策略时,将所述因变量引入所述预设回归模型。
在具体实施过程中,因变量对每一个待定自变量做直线回归。
从所述多个待定自变量中选取待定自变量,对选取的所述待定自变量做联合假设检验,当所述检验结果符合预设条件,将选取的待定自变量引入所述预设回归模型;
在具体实施过程中,对回归平方和最大的待定自变量做F检验,通过F检验结果判断回归平方和最大的待定自变量是否有统计学意义,如果偏回归系数有统计学意义,那么将这个待定自变量引入回归方程;在余下的待定自变量中,考虑在进入回归方程的第一个待定自变量的基础上,计算其他自变量的偏回归平方和,选取偏回归平方和最大的一个待定自变量做F检验以决定是否选入;如果有统计学意义则进入方程,然后以同样的方式寻找下一个待定自变量,一直做下去,直到所有的待定自变量判断完毕。
获取所有引入所述预设回归模型的待定自变量。
在其中一个实施例中,所述根据所述自变量筛选策略、所述因变量和预设回归模型,从所述多个待定自变量中,筛选出符合所述预设回归模型的引入条件的待定自变量,包括:
当所述自变量筛选策略为逐步剔除策略时,将所述因变量和所述多个待定自变量全部引入所述预设回归模型。
在具体实施过程中,先将全部待定自变量选入预设的回归模型,然后逐步剔除没有统计学意义的待定自变量。
从所述多个待定自变量中选取待定自变量,对选取的所述待定自变量做联合假设检验,当所述检验结果不符合预设条件,将选取的待定自变量从所述预设回归模型中删除。
在具体实施过程中,在引入全部待定自变量的回归方程中,选一个偏回归平方和最小的待定自变量,做F检验决定它是否剔除,如果没有统计学意义,那么将其删除,然后对剩余的自变量建立新的回归方程;重复这一过程,直到方程中所有的自变量都不能剔除为止。
获取所有保留在所述预设回归模型的待定自变量。
在其中一个实施例中,所述根据所述自变量筛选策略、所述因变量和预设回归模型,从所述多个待定自变量中,筛选出符合所述预设回归模型的引入条件的待定自变量,包括:
当所述自变量筛选策略为双向筛选策略时,将所述因变量引入所述预设回归模型。
从所述多个待定自变量中选取第一待定自变量,对所述第一待定自变量做联合假设检验,当所述检验结果符合第一预设条件,将所述第一待定自变量引入所述预设回归模型。
从引入所述预设回归模型的待定自变量中选取第二待定自变量,对所述第二待定自变量做联合假设检验,当所述检验结果不符合第二预设条件,将选取所述第二待定自变量从所述预设回归模型中删除。
在具体实施过程中,双向筛选策略本质上是一种逐步引入策略,但是每引入一个待定自变量到回归方程,要对方程中已经有的每一个待定自变量做基于偏回归平方和的F检验,看是否需要提出一些退化为不显著的待定自变量,以确保每次引入新的待定自变量之前,回归方程中只包含有显著作用的待定自变量;这一双向筛选过程反复进行,直到没有新的待定自变量需要引入回归方程,也没有待定自变量需要从方程中剔除为止。
获取所有保留在所述预设回归模型的待定自变量。
在其中一个实施例中,如图3所示,提供了一种疾病影响变量筛选装置,所述装置包括:
待定自变量获取模块301,用于获取待分析疾病的因变量,以及,获取待分析疾病的多个待定自变量;
策略选取模块302,用于根据所述多个待定自变量从预存的多个候选筛选策略中确定自变量筛选策略;
筛选模块303,用于根据所述自变量筛选策略、所述因变量和预设回归模型,从所述多个待定自变量中,筛选出符合所述预设回归模型的引入条件的待定自变量;
自变量确定模块304,用于将所筛选出的所述待定自变量,作为与所述因变量相关的自变量。
在其中一个实施例中,所述策略选取模块302包括:
展示单元,用于展示多个候选筛选策略和所述多个待定自变量;
选取单元,用于将选取的所述候选筛选策略作为所述自变量筛选策略。
在其中一个实施例中,所述策略选取模块302包括:
数量获取单元,用于获取所述多个待定自变量的数量;
查询单元,用于查询预存的多个所述候选筛选策略中,与所述待定自变量数量对应的自变量筛选策略。
在其中一个实施例中,所述候选筛选策略包括逐步引入策略、逐步剔除策略和双向筛选策略中的至少一种。
在其中一个实施例中,所述筛选模块包括:
第一引入单元,用于当所述自变量筛选策略为逐步引入策略时,将所述因变量引入所述预设回归模型;
第一检验单元,用于从所述多个待定自变量中选取待定自变量,对选取的所述待定自变量做联合假设检验,当所述检验结果符合预设条件,将选取的待定自变量引入所述预设回归模型;
第一自变量获取单元,用于获取所有引入所述预设回归模型的待定自变量。
在其中一个实施例中,所述筛选模块包括:
第二引入单元,用于当所述自变量筛选策略为逐步剔除策略时,将所述因变量和所述多个待定自变量全部引入所述预设回归模型;
第二检验单元,用于从所述多个待定自变量中选取待定自变量,对选取的所述待定自变量做联合假设检验,当所述检验结果不符合预设条件,将选取的待定自变量从所述预设回归模型中删除;
第二自变量获取单元,用于获取所有保留在所述预设回归模型的待定自变量。
在其中一个实施例中,所述筛选模块包括:
第三引入单元,用于当所述自变量筛选策略为双向筛选策略时,将所述因变量引入所述预设回归模型;
第三检验单元,用于从所述多个待定自变量中选取第一待定自变量,对所述第一待定自变量做联合假设检验,当所述检验结果符合第一预设条件,将所述第一待定自变量引入所述预设回归模型;
第四检验单元,用于从引入所述预设回归模型的待定自变量中选取第二待定自变量,对所述第二待定自变量做联合假设检验,当所述检验结果不符合第二预设条件,将选取所述第二待定自变量从所述预设回归模型中删除;
第三自变量获取单元,用于获取所有保留在所述预设回归模型的待定自变量。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图4所示。该计算机设备包括通过装置总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作装置、计算机程序和数据库。该内存储器为非易失性存储介质中的操作装置和计算机程序的运行提供环境。该计算机设备的数据库用于存储绩效考核涉及的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种疾病影响变量筛选方法。
本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取待分析疾病的因变量,以及,获取待分析疾病的多个待定自变量;根据所述多个待定自变量从预存的多个候选筛选策略中确定自变量筛选策略;根据所述自变量筛选策略、所述因变量和预设回归模型,从所述多个待定自变量中,筛选出符合所述预设回归模型的引入条件的待定自变量;将所筛选出的所述待定自变量,作为与所述因变量相关的自变量。
在其中一个实施例中,处理器执行计算机程序时所述根据所述多个待定自变量从预存的多个候选筛选策略中确定自变量筛选策略,包括:展示多个候选筛选策略和所述多个待定自变量;将选取的所述候选筛选策略作为所述自变量筛选策略。
在其中一个实施例中,处理器执行计算机程序时所述根据所述多个待定自变量从预存的多个候选筛选策略中确定自变量筛选策略,包括:获取所述多个待定自变量的数量;查询预存的多个所述候选筛选策略中,与所述待定自变量数量对应的自变量筛选策略。
在其中一个实施例中,处理器执行计算机程序时所述候选筛选策略包括逐步引入策略、逐步剔除策略和双向筛选策略中的至少一种。
在其中一个实施例中,处理器执行计算机程序时所述根据所述自变量筛选策略、所述因变量和预设回归模型,从所述多个待定自变量中,筛选出符合所述预设回归模型的引入条件的待定自变量,包括:当所述自变量筛选策略为逐步引入策略时,将所述因变量引入所述预设回归模型;从所述多个待定自变量中选取待定自变量,对选取的所述待定自变量做联合假设检验,当所述检验结果符合预设条件,将选取的待定自变量引入所述预设回归模型;获取所有引入所述预设回归模型的待定自变量。
在其中一个实施例中,处理器执行计算机程序时所述根据所述自变量筛选策略、所述因变量和预设回归模型,从所述多个待定自变量中,筛选出符合所述预设回归模型的引入条件的待定自变量,包括:当所述自变量筛选策略为逐步剔除策略时,将所述因变量和所述多个待定自变量全部引入所述预设回归模型;从所述多个待定自变量中选取待定自变量,对选取的所述待定自变量做联合假设检验,当所述检验结果不符合预设条件,将选取的待定自变量从所述预设回归模型中删除;获取所有保留在所述预设回归模型的待定自变量。
在其中一个实施例中,处理器执行计算机程序时所述根据所述自变量筛选策略、所述因变量和预设回归模型,从所述多个待定自变量中,筛选出符合所述预设回归模型的引入条件的待定自变量,包括:当所述自变量筛选策略为双向筛选策略时,将所述因变量引入所述预设回归模型;从所述多个待定自变量中选取第一待定自变量,对所述第一待定自变量做联合假设检验,当所述检验结果符合第一预设条件,将所述第一待定自变量引入所述预设回归模型;从引入所述预设回归模型的待定自变量中选取第二待定自变量,对所述第二待定自变量做联合假设检验,当所述检验结果不符合第二预设条件,将选取所述第二待定自变量从所述预设回归模型中删除;获取所有保留在所述预设回归模型的待定自变量。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取待分析疾病的因变量,以及,获取待分析疾病的多个待定自变量;根据所述多个待定自变量从预存的多个候选筛选策略中确定自变量筛选策略;根据所述自变量筛选策略、所述因变量和预设回归模型,从所述多个待定自变量中,筛选出符合所述预设回归模型的引入条件的待定自变量;将所筛选出的所述待定自变量,作为与所述因变量相关的自变量。
在其中一个实施例中,计算机程序被处理器执行时所述根据所述多个待定自变量从预存的多个候选筛选策略中确定自变量筛选策略,包括:展示多个候选筛选策略和所述多个待定自变量;将选取的所述候选筛选策略作为所述自变量筛选策略。
在其中一个实施例中,计算机程序被处理器执行时所述根据所述多个待定自变量从预存的多个候选筛选策略中确定自变量筛选策略,包括:获取所述多个待定自变量的数量;查询预存的多个所述候选筛选策略中,与所述待定自变量数量对应的自变量筛选策略。
在其中一个实施例中,计算机程序被处理器执行时所述候选筛选策略包括逐步引入策略、逐步剔除策略和双向筛选策略中的至少一种。
在其中一个实施例中,计算机程序被处理器执行时所述根据所述自变量筛选策略、所述因变量和预设回归模型,从所述多个待定自变量中,筛选出符合所述预设回归模型的引入条件的待定自变量,包括:当所述自变量筛选策略为逐步引入策略时,将所述因变量引入所述预设回归模型;从所述多个待定自变量中选取待定自变量,对选取的所述待定自变量做联合假设检验,当所述检验结果符合预设条件,将选取的待定自变量引入所述预设回归模型;获取所有引入所述预设回归模型的待定自变量。
在其中一个实施例中,计算机程序被处理器执行时所述根据所述自变量筛选策略、所述因变量和预设回归模型,从所述多个待定自变量中,筛选出符合所述预设回归模型的引入条件的待定自变量,包括:当所述自变量筛选策略为逐步剔除策略时,将所述因变量和所述多个待定自变量全部引入所述预设回归模型;从所述多个待定自变量中选取待定自变量,对选取的所述待定自变量做联合假设检验,当所述检验结果不符合预设条件,将选取的待定自变量从所述预设回归模型中删除;获取所有保留在所述预设回归模型的待定自变量。
在其中一个实施例中,计算机程序被处理器执行时所述根据所述自变量筛选策略、所述因变量和预设回归模型,从所述多个待定自变量中,筛选出符合所述预设回归模型的引入条件的待定自变量,包括:当所述自变量筛选策略为双向筛选策略时,将所述因变量引入所述预设回归模型;从所述多个待定自变量中选取第一待定自变量,对所述第一待定自变量做联合假设检验,当所述检验结果符合第一预设条件,将所述第一待定自变量引入所述预设回归模型;从引入所述预设回归模型的待定自变量中选取第二待定自变量,对所述第二待定自变量做联合假设检验,当所述检验结果不符合第二预设条件,将选取所述第二待定自变量从所述预设回归模型中删除;获取所有保留在所述预设回归模型的待定自变量。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种疾病影响变量筛选方法,其特征在于,所述方法包括:
获取待分析疾病的因变量,以及,获取待分析疾病的多个待定自变量;
根据所述多个待定自变量从预存的多个候选筛选策略中确定自变量筛选策略;
根据所述自变量筛选策略、所述因变量和预设回归模型,从所述多个待定自变量中,筛选出符合所述预设回归模型的引入条件的待定自变量;
将所筛选出的所述待定自变量,作为与所述因变量相关的自变量。
2.根据权利要求1所述的方法,其特征在于,所述根据所述多个待定自变量从预存的多个候选筛选策略中确定自变量筛选策略,包括:
展示多个候选筛选策略和所述多个待定自变量;
将选取的所述候选筛选策略作为所述自变量筛选策略。
3.根据权利要求1所述的方法,其特征在于,所述根据所述多个待定自变量从预存的多个候选筛选策略中确定自变量筛选策略,包括:
获取所述多个待定自变量的数量;
查询预存的多个所述候选筛选策略中,与所述待定自变量数量对应的自变量筛选策略。
4.根据权利要求1所述的方法,其特征在于,所述候选筛选策略包括逐步引入策略、逐步剔除策略和双向筛选策略中的至少一种。
5.根据权利要求4所述的方法,其特征在于,所述根据所述自变量筛选策略、所述因变量和预设回归模型,从所述多个待定自变量中,筛选出符合所述预设回归模型的引入条件的待定自变量,包括:
当所述自变量筛选策略为逐步引入策略时,将所述因变量引入所述预设回归模型;
从所述多个待定自变量中选取待定自变量,对选取的所述待定自变量做联合假设检验,当所述检验结果符合预设条件,将选取的待定自变量引入所述预设回归模型;
获取所有引入所述预设回归模型的待定自变量。
6.根据权利要求4所述的方法,其特征在于,所述根据所述自变量筛选策略、所述因变量和预设回归模型,从所述多个待定自变量中,筛选出符合所述预设回归模型的引入条件的待定自变量,包括:
当所述自变量筛选策略为逐步剔除策略时,将所述因变量和所述多个待定自变量全部引入所述预设回归模型;
从所述多个待定自变量中选取待定自变量,对选取的所述待定自变量做联合假设检验,当所述检验结果不符合预设条件,将选取的待定自变量从所述预设回归模型中删除;
获取所有保留在所述预设回归模型的待定自变量。
7.根据权利要求4所述的方法,其特征在于,所述根据所述自变量筛选策略、所述因变量和预设回归模型,从所述多个待定自变量中,筛选出符合所述预设回归模型的引入条件的待定自变量,包括:
当所述自变量筛选策略为双向筛选策略时,将所述因变量引入所述预设回归模型;
从所述多个待定自变量中选取第一待定自变量,对所述第一待定自变量做联合假设检验,当所述检验结果符合第一预设条件,将所述第一待定自变量引入所述预设回归模型;
从引入所述预设回归模型的待定自变量中选取第二待定自变量,对所述第二待定自变量做联合假设检验,当所述检验结果不符合第二预设条件,将选取所述第二待定自变量从所述预设回归模型中删除;
获取所有保留在所述预设回归模型的待定自变量。
8.一种疾病影响变量筛选装置,其特征在于,所述装置包括:
待定自变量获取模块,用于获取待分析疾病的因变量,以及,获取待分析疾病的多个待定自变量;
策略选取模块,用于根据所述多个待定自变量从预存的多个候选筛选策略中确定自变量筛选策略;
筛选模块,用于根据所述自变量筛选策略、所述因变量和预设回归模型,从所述多个待定自变量中,筛选出符合所述预设回归模型的引入条件的待定自变量;
自变量确定模块,用于将所筛选出的所述待定自变量,作为与所述因变量相关的自变量。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN201811586455.0A 2018-12-25 2018-12-25 疾病影响变量筛选方法、装置和计算机设备 Pending CN109698028A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811586455.0A CN109698028A (zh) 2018-12-25 2018-12-25 疾病影响变量筛选方法、装置和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811586455.0A CN109698028A (zh) 2018-12-25 2018-12-25 疾病影响变量筛选方法、装置和计算机设备

Publications (1)

Publication Number Publication Date
CN109698028A true CN109698028A (zh) 2019-04-30

Family

ID=66231936

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811586455.0A Pending CN109698028A (zh) 2018-12-25 2018-12-25 疾病影响变量筛选方法、装置和计算机设备

Country Status (1)

Country Link
CN (1) CN109698028A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117235533A (zh) * 2023-11-10 2023-12-15 腾讯科技(深圳)有限公司 对象变量分析方法、装置、计算机设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130245960A1 (en) * 2010-02-11 2013-09-19 Ameritox, Ltd. Methods of normalizing measured drug concentrations and testing for non-compliance with a drug treatment regimen
CN106980763A (zh) * 2017-03-30 2017-07-25 大连理工大学 一种基于基因突变频率的癌症驱动基因的筛选方法
CN107621849A (zh) * 2017-10-26 2018-01-23 中国人民解放军总医院 前列腺穿刺活检的阳性风险预测方法和装置
CN107833633A (zh) * 2017-10-30 2018-03-23 银江股份有限公司 一种高血压病人随访推荐的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130245960A1 (en) * 2010-02-11 2013-09-19 Ameritox, Ltd. Methods of normalizing measured drug concentrations and testing for non-compliance with a drug treatment regimen
CN106980763A (zh) * 2017-03-30 2017-07-25 大连理工大学 一种基于基因突变频率的癌症驱动基因的筛选方法
CN107621849A (zh) * 2017-10-26 2018-01-23 中国人民解放军总医院 前列腺穿刺活检的阳性风险预测方法和装置
CN107833633A (zh) * 2017-10-30 2018-03-23 银江股份有限公司 一种高血压病人随访推荐的方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
方霞等: "《R软件与金融数据分析》", 31 August 2017, 中国金融出版社 *
易东: "《军事医学统计学》", 31 August 2001, 第四军医大学出版社 *
杜茂林等: "《医学统计学》", 30 November 2015, 人民军医出版社 *
程胜高: "《环境统计学》", 31 December 1988, 中国地质大学出版社 *
许汝福: ""Logistic回归变量筛选及回归方法选择实例分析"", 《中国循证医学杂志》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117235533A (zh) * 2023-11-10 2023-12-15 腾讯科技(深圳)有限公司 对象变量分析方法、装置、计算机设备和存储介质
CN117235533B (zh) * 2023-11-10 2024-03-01 腾讯科技(深圳)有限公司 对象变量分析方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
CN108804548B (zh) 测试数据查询方法、装置、计算机设备和存储介质
CN106055464B (zh) 数据缓存集群压力测试装置及方法
CN109766263A (zh) 自动化测试分析处理方法、装置、计算机设备及存储介质
DE102008038347A1 (de) Verfahren zur Analyse der Leistungscharakteristik einer Gasturbine und System zur Analyse der Leistungscharakteristik einer Gasturbine
DE602005002931T2 (de) Prüfung eines Testobjekts mit Abtastung vom Taktsignal und vom Datensignal
CN107908548A (zh) 一种生成测试用例的方法和装置
Dobos et al. Evaluating green suppliers: improving supplier performance with DEA in the presence of incomplete data
CN111522728A (zh) 自动化测试用例的生成方法、电子设备及可读存储介质
CN110188036A (zh) 一种软件测试方法及装置
CN110287104A (zh) 测试用例生成方法、装置、终端及计算机可读存储介质
CN113010413A (zh) 一种接口自动化测试方法和装置
CN109698028A (zh) 疾病影响变量筛选方法、装置和计算机设备
EP0580663A1 (de) Verfahren zur verifikation datenverarbeitender systeme.
CN111858354A (zh) 自动生成测试报告的方法、装置、存储介质及电子设备
CN115841046A (zh) 基于维纳过程的加速退化试验数据处理方法和装置
CN105740111B (zh) 一种性能检测方法及装置
Soubra et al. Design of a functional size measurement procedure for real-time embedded software requirements expressed using the simulink model
WO2020159438A1 (en) Methods and system for processing lipid contents of at least one oil sample and simulating at least one training sample, and for predicting a blending formula, amongst others
CN110515982A (zh) 抽检方法、装置、计算机设备和存储介质
CN109325781A (zh) 客户品质分析方法、装置、计算机设备和存储介质
CN108509315A (zh) 处理器性能评测比较方法、装置、计算机设备和存储介质
Fantinato et al. Applying extended finite state machines in software testing of interactive systems
CN110473114A (zh) 保单份额计算方法、装置、计算机设备和存储介质
Mendes et al. Investigating the use of chronological splitting to compare software cross-company and single-company effort predictions: a replicated study
CN116342256A (zh) 风控策略测试方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200107

Address after: 510120 No. 151 Yanjiang Road, Guangzhou, Guangdong, Yuexiu District

Applicant after: THE FIRST AFFILIATED HOSPITAL OF GUANGZHOU MEDICAL University

Applicant after: GUANGZHOU TIANPENG COMPUTER TECHNOLOGY CO.,LTD.

Address before: 510665 Room 503, Room 504, No. 100, West Huangpu Avenue, Tianhe District, Guangzhou City, Guangdong Province

Applicant before: GUANGZHOU TIANPENG COMPUTER TECHNOLOGY CO.,LTD.

CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Zheng Jinping

Inventor after: Chen Yijun

Inventor after: Liang Zhenyu

Inventor after: Feng Jieyu

Inventor after: Jian Wenhua

Inventor after: Li Jing

Inventor after: Zhang Zhe

Inventor before: Feng Jieyu

Inventor before: Li Jing

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190430