CN114743619A - 一种用于疾病风险预测的调查问卷质量评价方法及系统 - Google Patents
一种用于疾病风险预测的调查问卷质量评价方法及系统 Download PDFInfo
- Publication number
- CN114743619A CN114743619A CN202210415038.XA CN202210415038A CN114743619A CN 114743619 A CN114743619 A CN 114743619A CN 202210415038 A CN202210415038 A CN 202210415038A CN 114743619 A CN114743619 A CN 114743619A
- Authority
- CN
- China
- Prior art keywords
- questionnaire
- samples
- disease
- influence factor
- credibility
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 201000010099 disease Diseases 0.000 title claims abstract description 81
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 81
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000013441 quality evaluation Methods 0.000 title claims abstract description 27
- 238000011156 evaluation Methods 0.000 claims abstract description 27
- 238000012549 training Methods 0.000 claims abstract description 15
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 6
- 238000003745 diagnosis Methods 0.000 claims description 6
- 238000013136 deep learning model Methods 0.000 claims description 2
- 230000002496 gastric effect Effects 0.000 description 20
- 206010028980 Neoplasm Diseases 0.000 description 14
- 201000011510 cancer Diseases 0.000 description 14
- 230000000391 smoking effect Effects 0.000 description 13
- 210000002784 stomach Anatomy 0.000 description 11
- 238000013145 classification model Methods 0.000 description 7
- 235000005911 diet Nutrition 0.000 description 7
- 230000003340 mental effect Effects 0.000 description 7
- 230000037213 diet Effects 0.000 description 6
- 230000005586 smoking cessation Effects 0.000 description 6
- 230000035622 drinking Effects 0.000 description 5
- 201000011591 microinvasive gastric cancer Diseases 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- PCTMTFRHKVHKIS-BMFZQQSSSA-N (1s,3r,4e,6e,8e,10e,12e,14e,16e,18s,19r,20r,21s,25r,27r,30r,31r,33s,35r,37s,38r)-3-[(2r,3s,4s,5s,6r)-4-amino-3,5-dihydroxy-6-methyloxan-2-yl]oxy-19,25,27,30,31,33,35,37-octahydroxy-18,20,21-trimethyl-23-oxo-22,39-dioxabicyclo[33.3.1]nonatriaconta-4,6,8,10 Chemical compound C1C=C2C[C@@H](OS(O)(=O)=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2.O[C@H]1[C@@H](N)[C@H](O)[C@@H](C)O[C@H]1O[C@H]1/C=C/C=C/C=C/C=C/C=C/C=C/C=C/[C@H](C)[C@@H](O)[C@@H](C)[C@H](C)OC(=O)C[C@H](O)C[C@H](O)CC[C@@H](O)[C@H](O)C[C@H](O)C[C@](O)(C[C@H](O)[C@H]2C(O)=O)O[C@H]2C1 PCTMTFRHKVHKIS-BMFZQQSSSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000378 dietary effect Effects 0.000 description 1
- 238000013399 early diagnosis Methods 0.000 description 1
- 235000006694 eating habits Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000001303 quality assessment method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000013058 risk prediction model Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 208000018556 stomach disease Diseases 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/20—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/254—Fusion techniques of classification results, e.g. of results related to same input data
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
本发明属于计算机辅助医疗技术领域,具体涉及一种用于疾病风险预测的调查问卷质量评价方法及系统,包括:确定调查问卷中所述疾病的影响因素;获取多个疾病阳性样本和多个疾病阴性样本,对于所述疾病的每个影响因素,分别计算信息增益,得到每个影响因素的权重;获取多个调查问卷样本,所述调查问卷样本中包括真实样本和不真实样本,针对调查问卷中的每个影响因素,分别训练可信度评价网络;获取待评价调查问卷,对其中的每个影响因素,分别根据填写结果,采用相应可信度评价网络得到各个影响因素的可信度,然后基于相应影响因素的权重,得到所述待评价调查问卷的整体可信度。本发明对调查问卷分主题进行真实性评价,提高了评价结果的可信度。
Description
技术领域
本发明涉及计算机辅助医疗技术领域,具体涉及一种用于疾病风险预测的调查问卷质量评价方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
胃早癌等高危疾病风险的预测可以提高疾病早期的诊断率,能够让患者早发现早治疗。为了对患者进行风险预测,问卷调查是重要的一种数据获取方式,调查问卷内容主要涉及患者的基本信息、饮食习惯、近期主要症状、疾病家族史和疾病既往史,可以通过收集胃病患者的问卷调查数据,分析患者早期胃早癌风险级别,然而调查问卷的填写质量层次不齐,有必要对调查问卷的质量进行评价,以期获得准确的数据来源,从而提高胃早癌高危风险的预测效果。
现有技术的分析方法单一,大多基于统计学方法以及临床研究与医学经验相结合,当面临样本数足够多,疾病涉及因素广的情况时,此类方法往往导致效率低下,分析出的结果对于疾病的预防与诊治没有太大的帮助。
技术方案
为克服上述现有技术的不足,本发明提供了一种用于疾病风险预测的调查问卷质量评价方法及系统,对调查问卷分主题进行真实性评价,并且通过计算调查问卷中各个影响因素的信息增益来反映各影响因素对问卷结果真实性的影响,从而能够更准确地判断调查问卷填写的质量。
为实现上述目的,本发明的一个或多个实施例提供了如下技术方案:
一种用于疾病风险预测的调查问卷质量评价方法,包括以下步骤:
确定调查问卷中所述疾病的影响因素;
获取多个疾病阳性样本和多个疾病阴性样本,对于所述疾病的每个影响因素,分别计算信息增益,得到每个影响因素的权重;
获取多个调查问卷样本,所述调查问卷样本中包括真实样本和不真实样本,针对调查问卷中的每个影响因素,分别训练可信度评价网络;
获取待评价调查问卷,对其中的每个影响因素,分别根据填写结果,采用相应可信度评价网络得到各个影响因素的可信度,然后基于相应影响因素的权重,得到所述待评价调查问卷的整体可信度。
进一步地,确定调查问卷中包含的疾病影响因素包括:
获取多个所述疾病阳性样本对应的正确填写的调查问卷,对调查问卷进行主题分类,根据主题对疾病的影响,确定调查问卷中所述疾病的影响因素。
进一步地,每个影响因素的信息增益计算方法包括:
根据疾病样本中阳性样本和阴性样本的占比,计算疾病样本的信息熵;
根据调查问卷中所述影响因素的选项个数,对疾病样本划分子集,根据每个子集中诊断结果为阳性和阴性的占比,计算各个子集的信息熵;
根据疾病样本的信息熵和该影响因素各个子集的信息熵,计算所述影响因素的信息增益。
进一步地,疾病样本的信息熵计算方法为:
其中,D为疾病样本总数,N和M分别是其中阳性样本和阴性样本的个数。
进一步地,所述影响因素每个子集的信息熵计算方法为:
其中,Dv表示所述影响因素第v个子集,|Dv|表示该子集的样本数,Nv和Mv分别是其中阳性样本和阴性样本的个数。
进一步地,所述影响因素的信息增益计算方法为:
其中,n表示所述影响因素的子集个数。
进一步地,每个影响因素的可信度评价网络训练方法包括:
获取多个调查问卷样本中针对所述影响因素的填写结果;
根据各选项的占比和排序,生成特征向量;
基于深度学习模型,训练所述影响因素的可信度评价网络。
一个或多个实施例提供了一种用于疾病风险预测的调查问卷质量评价系统,包括:
影响因素确定模块,用于确定调查问卷中所述疾病的影响因素;
信息增益计算模块,用于获取多个疾病阳性样本和多个疾病阴性样本,对于所述疾病的每个影响因素,分别计算信息增益,得到每个影响因素的权重;
网络模型训练模块,用于获取多个调查问卷样本,所述调查问卷样本中包括真实样本和不真实样本,针对调查问卷中的每个影响因素,分别训练可信度评价网络;
质量评价模块,用于获取待评价调查问卷,对其中的每个影响因素,分别根据填写结果,采用相应可信度评价网络得到各个影响因素的可信度,然后基于相应影响因素的权重,得到所述待评价调查问卷的整体可信度。
一个或多个实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的用于疾病风险预测的调查问卷质量评价方法。
一个或多个实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现所述的用于疾病风险预测的调查问卷质量评价方法。
以上一个或多个技术方案存在以下有益效果:
通过计算调查问卷中各个影响因素的信息增益,来反映各影响因素对问卷结果真实性的影响,同时,针对调查问卷中每个影响因素分模块进行真实性评价,最终结合每个影响因素的真实性和信息增益得到调查问卷的评价结果,能够充分保留有价值问卷,为后续风险预测模型的准确性提供了数据保障。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明一个或多个实施例中用于疾病风险预测的调查问卷质量评价方法流程图;
图2为本发明实施例二中用于疾病风险预测的调查问卷质量评价系统框架图。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
实施例一
本实施例提供了一种用于疾病风险预测的调查问卷质量评价方法,包括以下步骤:
确定调查问卷中所述疾病的影响因素;
获取多个疾病阳性样本和多个疾病阴性样本,对于所述疾病的每个影响因素,分别计算信息增益,得到每个影响因素的权重;
获取多个调查问卷样本,所述调查问卷样本中包括真实样本和不真实样本,针对调查问卷中的每个影响因素,分别训练可信度评价网络;
获取待评价调查问卷,对其中的每个影响因素,分别根据填写结果,采用相应可信度评价网络得到各个影响因素的可信度,然后基于相应影响因素的权重,得到所述待评价调查问卷的整体可信度。
以胃早癌为例,对所述方法进行具体阐述,包括以下步骤:
步骤1:确定调查问卷中包含的胃早癌影响因素;
具体地,获取多个胃早癌阳性样本对应的正确填写的调查问卷,通过调查问卷信息确定出胃早癌对应的影响因素。
由于胃早癌的实际确诊需要考虑的因素,相对于调查问卷要更为复杂,不便于直接用来评价调查问卷,因此本实施例基于待评价的调查问卷,首先进行主题分类,例如调查问卷的主题被划分为烟酒史,个人病史,家族病史,饮食史,精神状况;然后根据各主题对胃早癌的影响,确定调查问卷中胃早癌的影响因素。需要说明的是,此处确定的影响因素可以包含调查问卷中的全部主题,也可以仅包含其中的部分主题。
步骤2:获取多个胃早癌阳性样本和多个胃早癌阴性样本,对于胃早癌的每个影响因素,分别计算信息增益,得到每个影响因素的权重。
具体地,对于胃早癌的每个影响因素:吸烟史,饮酒史,个人病史,家族病史,饮食史,精神状况,通过计算每个影响因素在样本数据集下的信息增益,做归一化处理得到每个影响因素的权重。
所述步骤2具体包括以下步骤:
步骤2.1:获取多个胃早癌阳性样本和多个胃早癌阴性样本;
步骤2.2:根据其中阳性样本和阴性样本的占比,计算胃早癌样本的信息熵;
步骤2.3:对于每个影响因素,根据调查问卷中所述影响因素的选项个数,对疾病样本划分子集,根据每个子集中诊断结果为阳性和阴性的占比,计算各个子集的信息熵,根据胃早癌样本的信息熵和该影响因素各个子集的信息熵,计算所述影响因素的信息增益,作为该影响因素的权重。
所述影响因素每个子集的信息熵计算方法为:
其中,Dv表示所述影响因素第v个子集,|Dv|表示该子集的样本数,Nv和Mv分别是其中阳性样本和阴性样本的个数。
胃早癌有6个相关联的影响因素{吸烟史,饮酒史,个人病史,家族病史,饮食史,精神状况},计算出每个影响因素的信息增益。以“吸烟史”为例,有5个可能的取值:{未吸烟、吸烟史少于5年现已戒烟,吸烟史大于5年未戒烟,吸烟史大于5年现已戒烟,吸烟史大于5年未戒烟}。
用该特征对数据集D进行划分,则可得到5个子集。分别记为D1(未吸烟),D2(吸烟史少于5年现已戒烟),D3(吸烟史大于5年未戒烟),D4(吸烟史大于5年现已戒烟),D5(吸烟史大于5年未戒烟)。
假定D1有A个样本,确诊胃早癌的阳性样本有A_N个,不是胃早癌的阴性样本有A_M个,则D2有B个样本,确诊胃早癌的阳性样本有B_N个,不是胃早癌的阴性样本有B_M个,则D3有C个样本,确诊胃早癌的阳性样本有C_N个,不是胃早癌的阴性样本有C_M个,则D4有D个样本,确诊胃早癌的阳性样本有D_N个,不是胃早癌的阴性样本有D_M个,则D5有E个样本,确诊胃早癌的阳性样本有E_N个,不是胃早癌的阴性样本有E_M个,则
可以计算出用“吸烟史”划分之后所获得的5个子集的信息熵为
于是可以计算得到特征“吸烟史”的信息增益为
同理可得其他特征的信息增益:
Gain(D,饮酒史)、Gain(D,个人病史)
Gain(D,家族病史)、(D,饮食史)、Gain(D,精神状况)。
可以计算出每个属性的权重:
步骤3:获取多个调查问卷样本,所述调查问卷样本中包括真实样本和不真实样本,针对调查问卷中的每个影响因素,分别训练可信度评价网络;
具体操作如下:获取过往问卷调查统计信息,以及该患者问卷对应的真实标签:可信为1、不可信为0两类进行模型训练,调查问卷中包括个人病史、家族史、饮食史、精神状况等模块,各个模块的特征规格不一样,不属于同一量纲,特征集合放在一起会导致有效特征信息利用率低,所以这里采用针对不同模块的问卷选项训练所对应的分类模型,从而训练出多个模型。
通过各个模块中ABCD选项的占比和选项的排列顺序依次训练个人病史选项、家族史选项、饮食史选项、精神状况选项、吸烟史、饮酒史对应的网络模型。
步骤4:获取待评价调查问卷,对其中的每个影响因素,分别根据填写结果,采用相应可信度评价网络得到各个影响因素的可信度,然后基于相应影响因素的权重,得到所述待评价调查问卷的整体可信度。
评价阶段输入需要确定填写质量的调查问卷,依次调用上述子模型得到对应的可信度评判,再基于步骤一确定出的权重对应的属性部分计算出该调查问卷的可信度。比如:[精神状况二分类模型、吸烟史二分类模型、饮酒史二分类模型、个人病史二分类模型、家族史二分类模型、饮食史二分类模型],依次对应的权重分别是:[0.1,0.05,0.2,0.2,0.2,0.25]。假如单个模型识别结果:[1,1,1,1,0,0],总的可信度:0.1*1+0.05*1+0.2*1+0.2*1+0.2*0+0.25*0=0.55,高于某阈值认定为该问卷可信,阈值可根据医生经验确定。
实施例二
在实施例一所述方法的基础上,本实施例提供了一种用于疾病风险预测的调查问卷质量评价系统,包括:
影响因素确定模块,用于确定调查问卷中所述疾病的影响因素;
信息增益计算模块,用于获取多个疾病阳性样本和多个疾病阴性样本,对于所述疾病的每个影响因素,分别计算信息增益,得到每个影响因素的权重;
网络模型训练模块,用于获取多个调查问卷样本,所述调查问卷样本中包括真实样本和不真实样本,针对调查问卷中的每个影响因素,分别训练可信度评价网络;
质量评价模块,用于获取待评价调查问卷,对其中的每个影响因素,分别根据填写结果,采用相应可信度评价网络得到各个影响因素的可信度,然后基于相应影响因素的权重,得到所述待评价调查问卷的整体可信度。
实施例三
在实施例一所述方法的基础上,本实施例的提供了一种电子设备。
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如实施例一所述的用于疾病风险预测的调查问卷质量评价方法。
实施例四
本实施例的目的是提供一种计算机可读存储介质。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如实施例一所述的用于疾病风险预测的调查问卷质量评价方法。
以上实施例二至四中涉及的各步骤与方法实施例一相对应,具体实施方式可参见实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括一个或多个指令集的单个介质或多个介质;还应当被理解为包括任何介质,所述任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本发明中的任一方法。
以上一个或多个实施例首先通过计算调查问卷中各个影响因素的信息增益,来反映各影响因素对问卷结果真实性的影响,然后,针对调查问卷中每个影响因素,分模块进行真实性评价,结合信息增益加权求和得到调查问卷的评价结果。
本领域技术人员应该明白,上述本发明的各模块或各步骤可以用通用的计算机装置来实现,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本发明不限制于任何特定的硬件和软件的结合。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
Claims (10)
1.一种用于疾病风险预测的调查问卷质量评价方法,其特征在于,包括以下步骤:
确定调查问卷中所述疾病的影响因素;
获取多个疾病阳性样本和多个疾病阴性样本,对于所述疾病的每个影响因素,分别计算信息增益,得到每个影响因素的权重;
获取多个调查问卷样本,所述调查问卷样本中包括真实样本和不真实样本,针对调查问卷中的每个影响因素,分别训练可信度评价网络;
获取待评价调查问卷,对其中的每个影响因素,分别根据填写结果,采用相应可信度评价网络得到各个影响因素的可信度,然后基于相应影响因素的权重,得到所述待评价调查问卷的整体可信度。
2.如权利要求1所述的一种用于疾病风险预测的调查问卷质量评价方法,其特征在于,确定调查问卷中包含的疾病影响因素包括:
获取多个所述疾病阳性样本对应的正确填写的调查问卷,对调查问卷进行主题分类,根据主题对疾病的影响,确定调查问卷中所述疾病的影响因素。
3.如权利要求1所述的一种用于疾病风险预测的调查问卷质量评价方法,其特征在于,每个影响因素的信息增益计算方法包括:
根据疾病样本中阳性样本和阴性样本的占比,计算疾病样本的信息熵;
根据调查问卷中所述影响因素的选项个数,对疾病样本划分子集,根据每个子集中诊断结果为阳性和阴性的占比,计算各个子集的信息熵;
根据疾病样本的信息熵和该影响因素各个子集的信息熵,计算所述影响因素的信息增益。
7.如权利要求1所述的一种用于疾病风险预测的调查问卷质量评价方法,其特征在于,每个影响因素的可信度评价网络训练方法包括:
获取多个调查问卷样本中针对所述影响因素的填写结果;
根据各选项的占比和排序,生成特征向量;
基于深度学习模型,训练所述影响因素的可信度评价网络。
8.一种用于疾病风险预测的调查问卷质量评价系统,其特征在于,包括:
影响因素确定模块,用于确定调查问卷中所述疾病的影响因素;
信息增益计算模块,用于获取多个疾病阳性样本和多个疾病阴性样本,对于所述疾病的每个影响因素,分别计算信息增益,得到每个影响因素的权重;
网络模型训练模块,用于获取多个调查问卷样本,所述调查问卷样本中包括真实样本和不真实样本,针对调查问卷中的每个影响因素,分别训练可信度评价网络;
质量评价模块,用于获取待评价调查问卷,对其中的每个影响因素,分别根据填写结果,采用相应可信度评价网络得到各个影响因素的可信度,然后基于相应影响因素的权重,得到所述待评价调查问卷的整体可信度。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7任一项所述的用于疾病风险预测的调查问卷质量评价方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7任一项所述的用于疾病风险预测的调查问卷质量评价方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210415038.XA CN114743619B (zh) | 2022-04-20 | 2022-04-20 | 一种用于疾病风险预测的调查问卷质量评价方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210415038.XA CN114743619B (zh) | 2022-04-20 | 2022-04-20 | 一种用于疾病风险预测的调查问卷质量评价方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114743619A true CN114743619A (zh) | 2022-07-12 |
CN114743619B CN114743619B (zh) | 2024-03-29 |
Family
ID=82284171
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210415038.XA Active CN114743619B (zh) | 2022-04-20 | 2022-04-20 | 一种用于疾病风险预测的调查问卷质量评价方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114743619B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115063030A (zh) * | 2022-07-12 | 2022-09-16 | 河北金融学院 | 基于双向熵值度量的教学数据评鉴可信度检验系统 |
CN118658626A (zh) * | 2024-08-19 | 2024-09-17 | 杭州和壹基因科技有限公司 | 一种基于机器学习的消化系统肿瘤的筛查方法及系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104504297A (zh) * | 2015-01-21 | 2015-04-08 | 甘肃百合物联科技信息有限公司 | 一种利用神经网络的高血压预测方法 |
CN106228006A (zh) * | 2016-07-20 | 2016-12-14 | 广东药科大学 | 一种早期胃癌筛查系统及方法 |
CN111080117A (zh) * | 2019-12-12 | 2020-04-28 | 国家电网有限公司大数据中心 | 设备风险标签的构建方法、装置、电子设备及存储介质 |
CN111212279A (zh) * | 2018-11-21 | 2020-05-29 | 华为技术有限公司 | 一种视频质量的评估方法及装置 |
CN111739641A (zh) * | 2020-06-23 | 2020-10-02 | 杭州和壹医学检验所有限公司 | 一种胃癌风险预测方法、系统、计算机设备及可读存储介质 |
KR20200136687A (ko) * | 2019-05-28 | 2020-12-08 | 이신재 | 모바일 및 온라인 설문을 통한 개인별 건강행태자료 수집에 기초한 기업별 및 산업별 건강지수 생성방법 및 그에 따라 획득되는 빅데이터 |
CN112101413A (zh) * | 2020-08-12 | 2020-12-18 | 海南大学 | 面向脑卒中风险预测的智能系统 |
CN112270994A (zh) * | 2020-10-14 | 2021-01-26 | 中国医学科学院阜外医院 | 一种风险预测模型的构建方法、设备、终端及存储介质 |
CN113988065A (zh) * | 2021-11-01 | 2022-01-28 | 中国建设银行股份有限公司 | 影响因素分析方法及装置、存储介质及电子设备 |
-
2022
- 2022-04-20 CN CN202210415038.XA patent/CN114743619B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104504297A (zh) * | 2015-01-21 | 2015-04-08 | 甘肃百合物联科技信息有限公司 | 一种利用神经网络的高血压预测方法 |
CN106228006A (zh) * | 2016-07-20 | 2016-12-14 | 广东药科大学 | 一种早期胃癌筛查系统及方法 |
CN111212279A (zh) * | 2018-11-21 | 2020-05-29 | 华为技术有限公司 | 一种视频质量的评估方法及装置 |
KR20200136687A (ko) * | 2019-05-28 | 2020-12-08 | 이신재 | 모바일 및 온라인 설문을 통한 개인별 건강행태자료 수집에 기초한 기업별 및 산업별 건강지수 생성방법 및 그에 따라 획득되는 빅데이터 |
CN111080117A (zh) * | 2019-12-12 | 2020-04-28 | 国家电网有限公司大数据中心 | 设备风险标签的构建方法、装置、电子设备及存储介质 |
CN111739641A (zh) * | 2020-06-23 | 2020-10-02 | 杭州和壹医学检验所有限公司 | 一种胃癌风险预测方法、系统、计算机设备及可读存储介质 |
CN112101413A (zh) * | 2020-08-12 | 2020-12-18 | 海南大学 | 面向脑卒中风险预测的智能系统 |
CN112270994A (zh) * | 2020-10-14 | 2021-01-26 | 中国医学科学院阜外医院 | 一种风险预测模型的构建方法、设备、终端及存储介质 |
CN113988065A (zh) * | 2021-11-01 | 2022-01-28 | 中国建设银行股份有限公司 | 影响因素分析方法及装置、存储介质及电子设备 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115063030A (zh) * | 2022-07-12 | 2022-09-16 | 河北金融学院 | 基于双向熵值度量的教学数据评鉴可信度检验系统 |
CN115063030B (zh) * | 2022-07-12 | 2024-01-05 | 河北金融学院 | 基于双向熵值度量的教学数据评鉴可信度检验系统 |
CN118658626A (zh) * | 2024-08-19 | 2024-09-17 | 杭州和壹基因科技有限公司 | 一种基于机器学习的消化系统肿瘤的筛查方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114743619B (zh) | 2024-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | Logistic random effects regression models: a comparison of statistical packages for binary and ordinal outcomes | |
CN114743619B (zh) | 一种用于疾病风险预测的调查问卷质量评价方法及系统 | |
US20230385553A1 (en) | Techniques to add smart device information to machine learning for increased context | |
CN109817339B (zh) | 基于大数据的患者分组方法和装置 | |
US20150095069A1 (en) | Algorithms to Identify Patients with Hepatocellular Carcinoma | |
CN111009321A (zh) | 一种机器学习分类模型在青少年孤独症辅助诊断中的应用方法 | |
Uddin et al. | Machine learning based diabetes detection model for false negative reduction | |
CN114724717B (zh) | 一种胃早癌高危风险筛查系统 | |
CN113679348A (zh) | 血糖预测方法、血糖预测装置、设备及存储介质 | |
CN114494263B (zh) | 融合临床信息的医学影像病变检测方法、系统及设备 | |
CN112541066A (zh) | 基于文本结构化的医技报告检测方法及相关设备 | |
CN116705310A (zh) | 围术期风险评估的数据集构建方法、装置、设备及介质 | |
CN113220895A (zh) | 基于强化学习的信息处理方法、装置、终端设备 | |
CN110414562B (zh) | X光片的分类方法、装置、终端及存储介质 | |
CN115526882A (zh) | 一种医学图像的分类方法、装置、设备及存储介质 | |
CN112052874A (zh) | 一种基于生成对抗网络的生理数据分类方法及系统 | |
CN118248350A (zh) | 改进随机森林预测结果的方法、装置、设备及介质 | |
CN114446470A (zh) | 基于人工智能模型的急性肾损伤恢复时间预测方法 | |
US20230223132A1 (en) | Methods and systems for nutritional recommendation using artificial intelligence analysis of immune impacts | |
CN111700592A (zh) | 一种癫痫脑电自动分类模型的获取方法、系统及分类系统 | |
Latif et al. | Improving Thyroid Disorder Diagnosis via Ensemble Stacking and Bidirectional Feature Selection. | |
Zhan et al. | Reliability-based cleaning of noisy training labels with inductive conformal prediction in multi-modal biomedical data mining | |
He et al. | Optimal treatment regimes for competing risk data using doubly robust outcome weighted learning with bi-level variable selection | |
US20210241147A1 (en) | Method and device for predicting pair of similar questions and electronic equipment | |
CN114649092A (zh) | 基于半监督学习和多尺度特征融合的辅助诊断方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |