CN114724717B - 一种胃早癌高危风险筛查系统 - Google Patents
一种胃早癌高危风险筛查系统 Download PDFInfo
- Publication number
- CN114724717B CN114724717B CN202210415491.0A CN202210415491A CN114724717B CN 114724717 B CN114724717 B CN 114724717B CN 202210415491 A CN202210415491 A CN 202210415491A CN 114724717 B CN114724717 B CN 114724717B
- Authority
- CN
- China
- Prior art keywords
- gastric
- questionnaire
- early cancer
- early
- risk prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 206010028980 Neoplasm Diseases 0.000 title claims abstract description 62
- 201000011510 cancer Diseases 0.000 title claims abstract description 62
- 210000002784 stomach Anatomy 0.000 title claims abstract description 23
- 238000012216 screening Methods 0.000 title claims abstract description 22
- 230000002496 gastric effect Effects 0.000 claims abstract description 39
- 201000011591 microinvasive gastric cancer Diseases 0.000 claims abstract description 22
- 238000000034 method Methods 0.000 claims abstract description 12
- 238000013528 artificial neural network Methods 0.000 claims abstract description 11
- 238000013058 risk prediction model Methods 0.000 claims abstract description 11
- 238000011156 evaluation Methods 0.000 claims description 52
- 238000012549 training Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 7
- 239000013598 vector Substances 0.000 claims description 7
- 238000003745 diagnosis Methods 0.000 claims description 6
- 238000013210 evaluation model Methods 0.000 claims description 6
- 201000010099 disease Diseases 0.000 claims description 5
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 5
- 230000000694 effects Effects 0.000 claims description 5
- 238000003062 neural network model Methods 0.000 claims description 3
- 230000009286 beneficial effect Effects 0.000 abstract description 5
- 238000005065 mining Methods 0.000 abstract description 2
- 238000013145 classification model Methods 0.000 description 19
- 230000000391 smoking effect Effects 0.000 description 14
- 230000035622 drinking Effects 0.000 description 11
- 230000037213 diet Effects 0.000 description 5
- 235000005911 diet Nutrition 0.000 description 5
- 230000003340 mental effect Effects 0.000 description 5
- 235000019504 cigarettes Nutrition 0.000 description 4
- 208000005718 Stomach Neoplasms Diseases 0.000 description 3
- 206010017758 gastric cancer Diseases 0.000 description 3
- 239000000779 smoke Substances 0.000 description 3
- 201000011549 stomach cancer Diseases 0.000 description 3
- 241000208125 Nicotiana Species 0.000 description 2
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000001574 biopsy Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000006694 eating habits Nutrition 0.000 description 1
- 238000002575 gastroscopy Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/20—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- General Engineering & Computer Science (AREA)
- Computational Mathematics (AREA)
- Mathematical Optimization (AREA)
- Evolutionary Computation (AREA)
- Mathematical Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Pathology (AREA)
- Probability & Statistics with Applications (AREA)
- Operations Research (AREA)
- Genetics & Genomics (AREA)
- Algebra (AREA)
- Biophysics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明涉及计算机辅助医疗技术领域,公开了一种胃早癌高危风险筛查系统,包括:调查问卷获取模块,用于获取待筛查调查问卷;胃早癌风险预测模块,用于根据所述调查问卷,基于预先训练的胃早癌风险预测模型,判断是否存在风险;其中,所述胃早癌风险预测模型包括:分模块风险预测单元,用于根据各影响因素的填写结果,采用相应二分类神经网络进行风险预测;整体风险预测单元,用于对基于各影响因素的风险预测结果进行加权求和,得到整体风险。本发明有助于充分挖掘对每个影响因素对胃早癌的影响,避免遗漏有价值影响因素,提高了预测准确度。
Description
技术领域
本发明属于计算机辅助医疗技术领域,尤其涉及一种胃早癌高危风险筛查系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
胃癌高危风险预测评估可以提高早期胃癌的诊断率,能够让患者早发现早治疗,加强早期胃癌的诊断筛查是挽救胃癌患者生命及提高患者生存质量的关键。以往提高早期胃癌检出率的方法大多是改良胃镜检查和病理组织活检等临床技术,这些技术对患者有一定的创伤,且普及率低。目前仍缺乏有效的非浸入性的早癌筛查诊断方法。
通过调查问卷进行早期筛查是一种简单有效方式,有助于提高早期筛查的普及率,目前主要基于logistics回归分析等方法建立胃癌与问卷中各影响因素之间的关系模型,通过模型进行筛查,并且,为了提高模型预测精度,往往会进行自变量筛选,通过统计学分析手段,舍弃一些对模型精度贡献度较差的自变量。这种方式虽然能够一定程度上提高模型的精度,但是,通过统计学手段舍弃影响因素不会考虑到影响因素的实际意义,可能会导致有价值影响因素的丢失,不能将调查问卷中的特征进行充分利用起来。
发明内容
为克服上述现有技术的不足,本发明提供了一种胃早癌高危风险筛查系统。分别对调查问卷中每个影响因素进行风险预测,基于每个因素的风险预测结果进行加权求和得到整体风险预测结果,有助于充分挖掘对每个影响因素对胃早癌的影响,提高了预测准确度。
为实现上述目的,本发明的一个或多个实施例提供了如下技术方案:
一种胃早癌高危风险筛查系统,包括:
调查问卷获取模块,用于获取待筛查调查问卷;
胃早癌风险预测模块,用于根据所述调查问卷,基于预先训练的胃早癌风险预测模型,判断是否存在风险;
其中,所述胃早癌风险预测模型包括:
分模块风险预测单元,用于根据各影响因素的填写结果,采用相应二分类神经网络进行风险预测;
整体风险预测单元,用于对基于各影响因素的风险预测结果进行加权求和,得到整体风险。
进一步地,各影响因素的二分类神经网络模型训练方法为:
获取多个调查问卷样本,所述调查问卷样本中包括胃早癌阳性样本和胃早癌阴性样本,分别根据每个影响因素的填写结果,训练相应二分类神经网络。
进一步地,基于各影响因素的风险预测结果的权重计算方法为:
对各影响因素的二分类神经网络的分类效果进行评价;
将分类效果归一化处理,得到基于各影响因素的风险预测结果的权重。
进一步地,获取待筛查调查问卷或多个调查问卷样本后,首先进行特征编码,将调查问卷中胃早癌的每个影响因素填写结果,编码成一个特征向量。
进一步地,若一个影响因素中包括多个细分影响因素,将多个细分影响因素的填写结果进行特征编码后进行串联,得到该影响因素的特征向量。
进一步地,所述系统还包括可信度评价模块,用于对所述调查问卷的可信度进行评价,若评价结果为真实,转入胃早癌风险预测模块;若评价结果为不真实,则向用户反馈评价结果。
进一步地,所述可信度评价模块采用预先训练的可信度评价模型对调查问卷进行可信度评价,其中,所述可信度评价模型包括:
分模块可信度评价单元,用于根据调查问卷中胃早癌各影响因素的填写结果,分别基于相应可信度评价网络进行可信度评价;
整体可信度评价单元,用于将各影响因素的可信度评价结果进行加权求和,得到所述待评价调查问卷的整体可信度;
进一步地,其中,各影响因素的可信度评价网络训练方法为:
获取多个调查问卷样本,所述调查问卷样本中包括真实样本和不真实样本,针对调查问卷中的每个影响因素,分别训练可信度评价网络。
进一步地,各影响因素可信度评价结果的权重计算方法为:
获取多个胃早癌阳性样本和多个胃早癌阴性样本,对于胃早癌的每个影响因素,分别计算信息增益,得到每个影响因素可信度评价结果的权重。
进一步地,对于胃早癌的每个影响因素,分别计算信息增益包括:
根据胃早癌样本中阳性样本和阴性样本的占比,计算胃早癌样本的信息熵;
对于每个影响因素,根据调查问卷中所述影响因素的选项个数,对疾病样本划分子集,根据每个子集中诊断结果为阳性和阴性的占比,计算各个子集的信息熵,根据胃早癌样本的信息熵和该影响因素各个子集的信息熵,计算所述影响因素的信息增益。
以上一个或多个技术方案存在以下有益效果:
通过基于调查问卷中每个影响因素分别进行风险预测,然后基于每个因素的风险预测结果进行加权求和得到整体风险预测结果,有助于充分挖掘对每个影响因素对胃早癌的影响,避免遗漏有价值影响因素,提高了预测准确度。
将各个影响因素风险预测模型的分类准确度作为权重,能够更准确的衡量各个影响因素风险预测模型对于整体预测结论的影响,提高了整体预测精度。
通过基于调查问卷中每个影响因素分别进行真实性预测,有助于对调查问卷进行全面评价,最大限度的保留有价值的调查问卷,为后续风险预测模型的训练提供了数据保障。
通过计算调查问卷中各个影响因素的信息增益,来反映各影响因素对问卷结果真实性的影响,结合每个影响因素的真实性和信息增益得到调查问卷的评价结果,提高了调查问卷评价的准确性。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明实施例中胃早癌高危风险筛查系统框架图。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
实施例一
本实施例公开了一种胃早癌高危风险筛查系统,包括:
调查问卷获取模块,用于获取待筛查调查问卷。
可信度评价模块,用于对所述调查问卷的可信度进行评价,若评价结果为真实,转入胃早癌风险预测模块;若评价结果为不真实,则向用户反馈评价结果,不继续执行胃早癌风险预测。
胃早癌风险预测模块,用于根据所述调查问卷,基于预先训练的胃早癌风险预测模型,判断是否存在风险。
调查问卷内容主要涉及患者的基本信息、饮食习惯、近期主要症状、疾病家族史和疾病既往史。
所述可信度评价模块中,采用预先训练的可信度评价模型对调查问卷进行可信度评价。其中,所述可信度评价模型包括分模块可信度评价单元和整体可信度评价单元。所述分模块可信度评价单元用于根据调查问卷中胃早癌各影响因素的填写结果,分别基于相应可信度评价网络进行可信度评价;所述整体可信度评价单元用于将各影响因素的可信度评价结果进行加权求和,得到所述待评价调查问卷的整体可信度。
所述分模块可信度评价单元中,各影响因素的可信度评价网络训练方法为:获取多个调查问卷样本,所述调查问卷样本中包括真实样本和不真实样本(真实标签可信为1、不可信为0),针对调查问卷中的每个影响因素,分别训练可信度评价网络。
所述整体可信度评价单元中,各影响因素可信度评价结果的权重计算方法为:
获取多个胃早癌阳性样本和多个胃早癌阴性样本,对于胃早癌的每个影响因素,分别计算信息增益,得到每个影响因素可信度评价结果的权重。
对于胃早癌的每个影响因素,分别计算信息增益包括:
(1)根据胃早癌样本中阳性样本和阴性样本的占比,计算胃早癌样本的信息熵;
假设胃早癌二分类数据集有D个样本,其中确诊胃早癌的阳性样本有N个,不是胃早癌的阴性样本有M个,则计算出胃早癌样本的信息熵为:
(2)对于每个影响因素,根据调查问卷中所述影响因素的选项个数,对疾病样本划分子集,根据每个子集中诊断结果为阳性和阴性的占比,计算各个子集的信息熵,根据胃早癌样本的信息熵和该影响因素各个子集的信息熵,计算所述影响因素的信息增益。
所述影响因素每个子集的信息熵计算方法为:
其中,Dv表示所述影响因素第v个子集,|Dv|表示该子集的样本数,Nv和Mv分别是其中阳性样本和阴性样本的个数。
第i个影响因素的信息增益计算方法为:
其中,n表示第i个影响因素相应的子集个数。
每个影响因素的信息增益占所有影响因素的信息增益总和的比重,即该影响因素的权重。
所述可信度评价模块获取需要确定可信度的调查问卷后,根据其中各影响因素的填写结果,依次进行可信度评判,然后加权求和计算出该调查问卷的可信度。比如:[精神状况二分类模型、吸烟史二分类模型、饮酒史二分类模型、个人病史二分类模型、家族史二分类模型、饮食史二分类模型],依次对应的权重分别是:[0.1,0.05,0.2,0.2,0.2,0.25]。假如单个模型识别结果:[1,1,1,1,0,0],总的可信度:0.1*1+0.05*1+0.2*1+0.2*1+0.2*0+0.25*0=0.55,高于某阈值认定为该问卷可信,阈值可根据医生经验确定。
所述胃早癌风险预测模块中,胃早癌风险预测模型包括特征编码单元、分模块风险预测单元和整体风险预测单元。其中,所述特征编码单元用于对调查问卷中各影响因素的填写结果进行特征编码;所述分模块风险预测单元用于根据各影响因素的填写结果,采用相应二分类神经网络进行风险预测;所述整体风险预测单元用于对基于各影响因素的风险预测结果进行加权求和,得到整体风险。
所述特征编码单元中,将调查问卷中胃早癌的每个影响因素填写结果,编码成一个特征向量。由于调查问卷中各影响因素对应的选项都是离散的特征信息,因此本实施例采用one-hot编码对各影响因素的填写结果进行特征编码,得到特征的数字化表示,one-hot编码可以保证每个样本中的单个特征只有1位处于状态1,其他的都是0,使得各影响因素的每个选项都具有唯一对应的编码值。
若一个影响因素中包括多个细分影响因素,如烟酒史,调查问卷中烟酒史主题对应两部分:吸烟史和饮酒史,将多个细分影响因素的填写结果进行编码后进行串联,得到该影响因素的特征向量。
以烟酒史为例,吸烟史的特征选项包括:["未吸烟","吸烟史少于5年现已戒烟","吸烟史多于5年现已戒烟","吸烟史少于5年未戒烟","吸烟史多于5年未戒烟"],饮酒史的特征选项包括:["未饮酒","饮酒史少于5年现已戒酒","饮酒史多于5年现已戒酒","饮酒史少于5年未戒酒","饮酒史多于5年未戒酒"]。吸烟史的各特征选项转换后的表述形式:
"未吸烟":10000
"吸烟史少于5年现已戒烟":01000
"吸烟史多于5年现已戒烟":00100
"吸烟史少于5年未戒烟":00010
"吸烟史多于5年未戒烟":00001
将吸烟史和饮酒史的特征进行组合即为烟酒史这一影响因素的特征向量:[吸烟史的one-hot编码,饮酒史的one-hot编码]。
所述分模块风险预测单元中,各影响因素的二分类神经网络模型训练方法为:
获取多个调查问卷样本,所述调查问卷样本中包括胃早癌阳性样本和胃早癌阴性样本,分别根据每个影响因素的填写结果,训练相应二分类神经网络子模型。具体地,依次训练烟酒史、个人病史、家族史、饮食史、精神状况对应的二分类神经网络子模型。以烟酒史为例,以调查问卷样本中烟酒史部分的填写结果及相应调查问卷样本的诊断结果,训练基于烟酒史的二分类神经网络子模型,进行胃早癌高风险判断。
所述整体风险预测单元中,各影响因素风险预测结果的权重计算方法为:
为了确定调查问卷里的烟酒史选项、个人病史选项、家族史选项、饮食史选项、精神状况选项对胃早癌的影响因素比重,本实施例在测试集下分别测试每个子模型的分类效果,并统计识别正确分类的个数,对各个子模型正确分类的个数做归一化处理,即可得到各个子模型对胃早癌的影响的权重。
所述胃早癌风险预测模块获取需要确定高危风险的调查问卷后,依次调用烟酒史二分类模型、个人病史二分类模型、家族史二分类模型、饮食史二分类模型、精神状况二分类模型得到对应的胃早癌高风险评判子结果,再基于确定出的权重对应的属性部分计算出该调查问卷的胃早癌高风险程度。比如:[烟酒史二分类模型、个人病史二分类模型、家族史二分类模型、饮食史二分类模型、精神状况二分类模型],依次对应的权重分别是:[0.1,0.3,0.2,0.2,0.2,]。单个子模型识别结果表示:胃早癌高风险是1,胃早癌低风险是0。假如单个模型识别结果:[0,0,1,1,1,1],总的危险程度:0.1*0+0.3*0+0.2*1+0.2*1+0.2*1=0.6,超过设定阈值认为高危型,阈值由医生根据经验确定。
调查问卷中各个模块的特征规格不一样,不属于同一量纲,特征集合放在一起会导致有效特征信息利用率低,所以这里采用针对不同模块的问卷选项分别训练所对应的分类模型,有助于对调查问卷中的所有信息进行充分利用。
本领域技术人员应该明白,上述本发明的各模块或各步骤可以用通用的计算机装置来实现,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本发明不限制于任何特定的硬件和软件的结合。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
Claims (9)
1.一种胃早癌高危风险筛查系统,其特征在于,包括:
调查问卷获取模块,用于获取待筛查调查问卷;
胃早癌风险预测模块,用于根据所述调查问卷,基于预先训练的胃早癌风险预测模型,判断是否存在风险;
其中,所述胃早癌风险预测模型包括:
分模块风险预测单元,用于根据各影响因素的填写结果,采用相应二分类神经网络进行风险预测;
整体风险预测单元,用于对基于各影响因素的风险预测结果进行加权求和,得到整体风险;
所述系统还包括可信度评价模块;
所述可信度评价模块采用预先训练的可信度评价模型对调查问卷进行可信度评价,其中,所述可信度评价模型包括:
分模块可信度评价单元,用于根据调查问卷中胃早癌各影响因素的填写结果,分别基于相应可信度评价网络进行可信度评价;
整体可信度评价单元,用于将各影响因素的可信度评价结果进行加权求和,得到所述调查问卷的整体可信度。
2.如权利要求1所述的一种胃早癌高危风险筛查系统,其特征在于,各影响因素的二分类神经网络模型训练方法为:
获取多个调查问卷样本,所述调查问卷样本中包括胃早癌阳性样本和胃早癌阴性样本,分别根据每个影响因素的填写结果,训练相应二分类神经网络。
3.如权利要求1所述的一种胃早癌高危风险筛查系统,其特征在于,基于各影响因素的风险预测结果的权重计算方法为:
对各影响因素的二分类神经网络的分类效果进行评价;
将分类效果归一化处理,得到基于各影响因素的风险预测结果的权重。
4.如权利要求1或2所述的一种胃早癌高危风险筛查系统,其特征在于,获取待筛查调查问卷或多个调查问卷样本后,首先进行特征编码,将调查问卷中胃早癌的每个影响因素填写结果,编码成一个特征向量。
5.如权利要求4所述的一种胃早癌高危风险筛查系统,其特征在于,若一个影响因素中包括多个细分影响因素,将多个细分影响因素的填写结果进行特征编码后进行串联,得到该影响因素的特征向量。
6.如权利要求1所述的一种胃早癌高危风险筛查系统,其特征在于,可信度评价模块,用于对所述调查问卷的可信度进行评价,若评价结果为真实,转入胃早癌风险预测模块;若评价结果为不真实,则向用户反馈评价结果。
7.如权利要求1所述的一种胃早癌高危风险筛查系统,其特征在于,其中,各影响因素的可信度评价网络训练方法为:
获取多个调查问卷样本,所述调查问卷样本中包括真实样本和不真实样本,针对调查问卷中的每个影响因素,分别训练可信度评价网络。
8.如权利要求1所述的一种胃早癌高危风险筛查系统,其特征在于,各影响因素可信度评价结果的权重计算方法为:
获取多个胃早癌阳性样本和多个胃早癌阴性样本,对于胃早癌的每个影响因素,分别计算信息增益,得到每个影响因素可信度评价结果的权重。
9.如权利要求1所述的一种胃早癌高危风险筛查系统,其特征在于,对于胃早癌的每个影响因素,分别计算信息增益包括:
根据胃早癌样本中阳性样本和阴性样本的占比,计算胃早癌样本的信息熵;
对于每个影响因素,根据调查问卷中所述影响因素的选项个数,对疾病样本划分子集,根据每个子集中诊断结果为阳性和阴性的占比,计算各个子集的信息熵,根据胃早癌样本的信息熵和该影响因素各个子集的信息熵,计算所述影响因素的信息增益。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210415491.0A CN114724717B (zh) | 2022-04-20 | 2022-04-20 | 一种胃早癌高危风险筛查系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210415491.0A CN114724717B (zh) | 2022-04-20 | 2022-04-20 | 一种胃早癌高危风险筛查系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114724717A CN114724717A (zh) | 2022-07-08 |
CN114724717B true CN114724717B (zh) | 2024-04-12 |
Family
ID=82245538
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210415491.0A Active CN114724717B (zh) | 2022-04-20 | 2022-04-20 | 一种胃早癌高危风险筛查系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114724717B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117238532B (zh) * | 2023-11-10 | 2024-01-30 | 武汉楚精灵医疗科技有限公司 | 智能随访方法及装置 |
CN117457234A (zh) * | 2023-11-20 | 2024-01-26 | 四川互慧软件有限公司 | 基于神经网络模型的蛇伤等级预测方法与系统 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008040670A (ja) * | 2006-08-03 | 2008-02-21 | Central Res Inst Of Electric Power Ind | アンケート評価方法及びシステム |
CN102034133A (zh) * | 2010-12-16 | 2011-04-27 | 浙江工业大学 | 一种基于量子神经网络的多因素系统的综合评价方法 |
CN106815746A (zh) * | 2017-01-06 | 2017-06-09 | 中国科学院城市环境研究所 | 一种网络问卷调查可信度评估方法 |
CN111739641A (zh) * | 2020-06-23 | 2020-10-02 | 杭州和壹医学检验所有限公司 | 一种胃癌风险预测方法、系统、计算机设备及可读存储介质 |
CN112116966A (zh) * | 2020-09-14 | 2020-12-22 | 中国科学院大学宁波华美医院 | 一种基于机器学习算法的智能化癌症问卷分析方法 |
CN112185549A (zh) * | 2020-09-29 | 2021-01-05 | 郑州轻工业大学 | 基于临床表型和逻辑回归分析的食管鳞癌风险预测方法 |
CN112768074A (zh) * | 2021-01-19 | 2021-05-07 | 大禹(上海)医疗健康科技有限公司 | 一种基于人工智能的重疾风险预测方法及系统 |
CN113283795A (zh) * | 2021-06-11 | 2021-08-20 | 同盾科技有限公司 | 基于二分类模型的数据处理方法及装置、介质、设备 |
CN113823411A (zh) * | 2021-09-26 | 2021-12-21 | 萱闱(北京)生物科技有限公司 | 风险预测模型的训练方法、装置、介质和计算设备 |
CN113990503A (zh) * | 2021-10-28 | 2022-01-28 | 全志辉 | 一种人工智能结合医疗经验的慢性病风险预测方法及系统 |
CN114300126A (zh) * | 2021-12-30 | 2022-04-08 | 济南大学 | 一种基于早癌筛查问卷与前馈神经网络的癌症预测系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180330802A1 (en) * | 2017-05-15 | 2018-11-15 | Koninklijke Philips N.V. | Adaptive patient questionnaire generation system and method |
-
2022
- 2022-04-20 CN CN202210415491.0A patent/CN114724717B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008040670A (ja) * | 2006-08-03 | 2008-02-21 | Central Res Inst Of Electric Power Ind | アンケート評価方法及びシステム |
CN102034133A (zh) * | 2010-12-16 | 2011-04-27 | 浙江工业大学 | 一种基于量子神经网络的多因素系统的综合评价方法 |
CN106815746A (zh) * | 2017-01-06 | 2017-06-09 | 中国科学院城市环境研究所 | 一种网络问卷调查可信度评估方法 |
CN111739641A (zh) * | 2020-06-23 | 2020-10-02 | 杭州和壹医学检验所有限公司 | 一种胃癌风险预测方法、系统、计算机设备及可读存储介质 |
CN112116966A (zh) * | 2020-09-14 | 2020-12-22 | 中国科学院大学宁波华美医院 | 一种基于机器学习算法的智能化癌症问卷分析方法 |
CN112185549A (zh) * | 2020-09-29 | 2021-01-05 | 郑州轻工业大学 | 基于临床表型和逻辑回归分析的食管鳞癌风险预测方法 |
CN112768074A (zh) * | 2021-01-19 | 2021-05-07 | 大禹(上海)医疗健康科技有限公司 | 一种基于人工智能的重疾风险预测方法及系统 |
CN113283795A (zh) * | 2021-06-11 | 2021-08-20 | 同盾科技有限公司 | 基于二分类模型的数据处理方法及装置、介质、设备 |
CN113823411A (zh) * | 2021-09-26 | 2021-12-21 | 萱闱(北京)生物科技有限公司 | 风险预测模型的训练方法、装置、介质和计算设备 |
CN113990503A (zh) * | 2021-10-28 | 2022-01-28 | 全志辉 | 一种人工智能结合医疗经验的慢性病风险预测方法及系统 |
CN114300126A (zh) * | 2021-12-30 | 2022-04-08 | 济南大学 | 一种基于早癌筛查问卷与前馈神经网络的癌症预测系统 |
Non-Patent Citations (2)
Title |
---|
基于人工神经网络技术的老年龋预测模型的构建及预测方法学比较的泛化能力验证研究;刘璐;《中国优秀博硕士学位论文全文数据库(博士)信息科技辑》(第02期);1-115 * |
基于机器学习的问卷可信度审核系统;苏迪;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》(第01期);1-86 * |
Also Published As
Publication number | Publication date |
---|---|
CN114724717A (zh) | 2022-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114724717B (zh) | 一种胃早癌高危风险筛查系统 | |
CN110443798B (zh) | 一种基于磁共振图像的自闭症检测方法、装置及系统 | |
CN111554401B (zh) | Ai慢性肾病风险筛查建模方法、慢性肾病风险筛查方法及系统 | |
CN113204969A (zh) | 医疗命名实体识别模型的生成方法、装置和计算机设备 | |
CN113077434A (zh) | 基于多模态信息的肺癌识别方法、装置及存储介质 | |
CN115602325A (zh) | 一种基于多模型算法的慢性病风险评估方法及其系统 | |
CN114037011B (zh) | 一种中医舌色噪声标注样本的自动识别与清洗方法 | |
CN111370124A (zh) | 一种基于面手部识别和大数据的健康分析系统及方法 | |
CN108847279A (zh) | 一种基于脉搏波数据的睡眠呼吸状态自动判别方法及系统 | |
CN113674862A (zh) | 一种基于机器学习的急性肾功能损伤发病预测方法 | |
CN112116966A (zh) | 一种基于机器学习算法的智能化癌症问卷分析方法 | |
CN113128654A (zh) | 一种用于冠心病预诊断中的改进型随机森林模型及其预诊断系统 | |
CN113080907A (zh) | 脉搏波信号处理方法及装置 | |
CN116259415A (zh) | 一种基于机器学习的患者服药依从性预测方法 | |
CN117912689A (zh) | 基于大语言模型的胃癌健康宣教和患病风险预测系统和方法 | |
CN114743619A (zh) | 一种用于疾病风险预测的调查问卷质量评价方法及系统 | |
CN117315379A (zh) | 面向深度学习的医学影像分类模型公平性评估方法及装置 | |
CN112131354A (zh) | 答案筛选方法、装置、终端设备和计算机可读存储介质 | |
CN117219127A (zh) | 认知状态识别方法以及相关设备 | |
CN113261975B (zh) | 一种基于深度学习的心电分类方法 | |
JP2024508852A (ja) | 医療画像における病変分析方法 | |
Kawarkhe et al. | Prediction of Diabetes Using Diverse Ensemble Learning Classifiers | |
Latif et al. | Improving Thyroid Disorder Diagnosis via Ensemble Stacking and Bidirectional Feature Selection. | |
CN117893528A (zh) | 一种心脑血管疾病分类模型的构建方法及装置 | |
CN115631386B (zh) | 一种基于机器学习的病理图像分类方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |