CN110689961B - 一种基于大数据分析技术的胃癌疾病风险检测装置 - Google Patents

一种基于大数据分析技术的胃癌疾病风险检测装置 Download PDF

Info

Publication number
CN110689961B
CN110689961B CN201910828098.2A CN201910828098A CN110689961B CN 110689961 B CN110689961 B CN 110689961B CN 201910828098 A CN201910828098 A CN 201910828098A CN 110689961 B CN110689961 B CN 110689961B
Authority
CN
China
Prior art keywords
data
risk
disease risk
disease
gastric cancer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910828098.2A
Other languages
English (en)
Other versions
CN110689961A (zh
Inventor
廖军
刘丹丹
刘礼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN201910828098.2A priority Critical patent/CN110689961B/zh
Publication of CN110689961A publication Critical patent/CN110689961A/zh
Application granted granted Critical
Publication of CN110689961B publication Critical patent/CN110689961B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Primary Health Care (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Epidemiology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了一种基于大数据分析技术的胃癌疾病风险检测装置,主要包括数据采集模块、数据库、数据预处理模块、特征提取模块和风险评估模块。本发明可有效的提高胃癌风险评估准确性。

Description

一种基于大数据分析技术的胃癌疾病风险检测装置
技术领域
本发明涉及大数据分析领域,具体是一种基于大数据分析技术的胃癌疾病风险检测装置。
背景技术
近些年,随着我国人口老龄化进程的加快以及城市污染等危险因素的逐渐加重,城市老百姓的癌症发病率不断上升,在临床医疗中,胃癌(gastric cancer)是世界最常见的系源于上皮的恶性肿瘤之一,在医学中对胃癌进行有效全面的风险检测越来越受到人们的重视。
目前,绝大多数胃癌属于腺癌,早期无明显症状,或出现上腹不适、嗳气等非特异性症状,常与胃炎、胃溃疡等胃慢性疾病症状相似,易被忽略,胃癌的早期诊断检测率仍较低;医生仅通过临床经验,无法有效的检测出胃癌疾病的风险情况。
由于年龄、性别、种族的特异性,不同地域的经济、文化、生存环境以及饮食等方面的差异;国内外对于胃癌风险评估结果已有成熟的数据;市场上也有成熟的疾病风险检测产品,但是还没有直接检测胃癌疾病风险的装置。
发明内容
本发明的目的是解决现有技术中存在的问题。
为实现本发明目的而采用的技术方案是这样的,一种基于大数据分析技术的胃癌疾病风险检测装置,主要包括数据采集模块、数据库、数据预处理模块、特征提取模块、风险评估模块和计算机可读介质。
所述数据采集模块获取测试者基本数据,并存储在数据库的疾病风险数据集中。
所述数据采集模块通过通信网络与医院信息装置和/或测试者终端互联,从而获取测试者基本数据。
所述测试者基本数据主要包括身高、年龄、体重、性别、每日饮食、生活环境、既往患病史、恶性肿瘤家族史数据和测试者防癌风险评估等级数据。
所述数据库存储数据预处理模块、特征提取模块和风险评估模块。
所述数据预处理模块对疾病风险数据集进行预处理,得到预处理后的疾病风险数据样本单元x1,…,xn,并发送至特征提取模块。
数据预处理模块对疾病风险数据集进行预处理的主要步骤如下:
1)删除疾病风险数据集中数据信息缺失项大于80%的行或列,从而更新疾病风险数据集。
2)将更新后的疾病风险数据集中的离散项进行数值化标注:判断测试者基本数据影响风险评估结果的概率,若概率大于50%,则将测试者基本数据数值化为2,相反,则将测试者基本数据数值化为1。
3)将更新后的疾病风险数据集中的连续项整合,再进行数值化标注。
4)基于数值化标注结果,建立预处理后的疾病风险数据单元x1,…,xn
所述特征提取模块利用近邻成分分析法提取疾病风险数据单元x1,…,xn的特征,从而建立风险特征数据集T={(x1,y1),...,(xn,yn)},并发送至风险评估模块。
特征提取模块利用近邻成分分析法提取疾病风险数据样本单元x1,…,xn特征的主要步骤如下:
1)给定疾病风险数据样本单元x1,…,xn,计算疾病风险数据样本单元xi和疾病风险数据样本单元xj之间的加权距离Dw(xi,xj),即:
Figure BDA0002189772870000021
式中,xi为d维特征向量。w为权重向量。wl是关联于第l个特征的权值。|xil-xjl|表示第l个特征下疾病风险数据单元xi和疾病风险数据单元xj距离绝对值。i=1,2,…,n。j=1,2,…,n。
3)基于留一法,计算疾病风险数据样本单元xi选择疾病风险数据样本单元xj作为近邻时的概率分布pij,即:
Figure BDA0002189772870000031
式中,k(z)=exp(-z/σ)是核函数。σ为核宽度。
3)将疾病风险数据样本单元xi通过近邻样本单元正确分类的概率pi如下所示:
Figure BDA0002189772870000032
式中,yij为样本标签,当且仅当yi=yj时yij=1,否则yij=0。yi∈{1...C}为xi所对应的分类标签。
4)特征权重的目标函数ξ(w)如下所示:
Figure BDA0002189772870000033
式中,λ为正则化参数。λ≥0。
5)选取特征权重wl大于0的数据样本单元作为胃癌风险数据的特征属性,从而建立风险数据集T={(x1,y1),...,(xn,yn)}。
所述风险评估模块对风险特征数据集T={(x1,y1),...,(xn,yn)}进行深度学习,得到风险评估结果yc
风险评估结果yc如下:
Figure BDA0002189772870000034
式中,e为输出神经元的激活函数。
Figure BDA0002189772870000035
表示权重矩阵中第j个输入样本到连接到第c个输出神经元的权重。xi为疾病风险数据样本单元。
Figure BDA0002189772870000036
表示权重矩阵中第i个输入样本连接到第j个神经元的权重,rj为输入样本到隐藏层第j神经元的偏置。rc为第c神经元输出的偏置。f为输入层到隐藏层的激活函数。
yc=1,表示无高风险,yc=2,表示高风险。
所述计算机可读介质内写入数据库所有数据。。
本发明的技术效果是毋庸置疑的。本发明具有以下效果:1)直接采集疾病风险数据,可有效的提高胃癌风险评估准确性,2)本发明可以避免受试者在医院有不必要的检查过程,提高检测速度。本发明通过胃癌特征数据评估胃癌疾病等级的风险,为预防疾病健康风险提供依据,节约了医疗资源,具有一致性和实用性。本发明直接检测胃癌疾病风险等级,可以提高胃癌风险检测的效率,并让患者避免不必要的检查过程,可以方便公众和相关部门掌握公众健康风险的走势。
附图说明
图1为检测装置示意图。
具体实施方式
下面结合实施例对本发明作进一步说明,但不应该理解为本发明上述主题范围仅限于下述实施例。在不脱离本发明上述技术思想的情况下,根据本领域普通技术知识和惯用手段,做出各种替换和变更,均应包括在本发明的保护范围内。
实施例1:
参见图1,一种基于大数据分析技术的胃癌疾病风险检测装置,主要包括数据采集模块、数据库、数据预处理模块、特征提取模块、风险评估模块和计算机可读介质。
所述数据采集模块获取测试者基本数据,并存储在数据库的疾病风险数据集中。
所述数据采集模块通过通信网络与医院信息装置和/或测试者终端互联,从而获取测试者基本数据。
所述测试者基本数据主要包括身高、年龄、体重、性别、每日饮食、生活环境、生活方式、生活习惯、心理情绪、既往患病史、恶性肿瘤家族史数据和测试者防癌风险评估等级数据。以数值方式对烦躁、高兴、伤心等心理情绪进行标注。每日饮食包括甜、辣、咸等。
所述数据库存储数据预处理模块、特征提取模块和风险评估模块。
所述数据预处理模块对疾病风险数据集进行预处理,得到预处理后的疾病风险数据样本单元x1,…,xn,并发送至特征提取模块。
数据预处理模块对疾病风险数据集进行预处理的主要步骤如下:
1)删除疾病风险数据集中数据信息缺失项大于80%的行或列,从而更新疾病风险数据集。
2)将更新后的疾病风险数据集中的离散项进行数值化标注:判断测试者基本数据影响风险评估结果的概率,若概率大于50%,则将测试者基本数据数值化为2,相反,则将测试者基本数据数值化为1。
比如对身高h和体重w进行体质比BMI计算,计算公式如下:
BMI=w/h2; (1)
计算后,按标准BMI值范围顺序进行数值标注。
3)将更新后的疾病风险数据集中的连续项整合,再进行数值化标注。
4)基于数值化标注结果,建立预处理后的疾病风险数据单元x1,…,xn
所述特征提取模块利用近邻成分分析法提取疾病风险数据单元x1,…,xn的特征,从而建立胃癌风险特征数据集T={(x1,y1),...,(xn,yn)},并发送至风险评估模块。
特征提取模块利用近邻成分分析法提取疾病风险数据样本单元x1,…,xn特征的主要步骤如下:
1)给定疾病风险数据样本单元x1,…,xn,计算疾病风险数据样本单元xi和疾病风险数据样本单元xj之间的加权距离Dw(xi,xj),即:
Figure BDA0002189772870000051
式中,xi为d维特征向量。w为权重向量。wl是关联于第l个特征的权值。|xil-xjl|表示第l个特征下疾病风险数据单元xi和疾病风险数据单元xj距离绝对值。i=1,2,…,n。j=1,2,…,n。l=1,2,…,d。n为向量个数。
4)基于留一法,计算疾病风险数据样本单元xi选择疾病风险数据样本单元xj作为近邻时的概率分布pij,即:
Figure BDA0002189772870000061
式中,k(z)=exp(-z/σ)是核函数。σ为核宽度。核宽度σ影响每个点被选为参考点的概率。特别地,如果σ→0,则只有测试样本的最近邻可以被选为参考点。如果σ→+∞,则除测试样本外的所有样本点被选为参考点的概率相同。z指代Dw(xi,xj)或Dw(xi,xk)。xk为疾病风险数据单元。
3)将疾病风险数据样本单元xi通过近邻样本单元正确分类的概率pi如下所示:
Figure BDA0002189772870000062
式中,yij为样本标签,当且仅当yi=yj时yij=1,否则yij=0。yi∈{1...C}为xi所对应的分类标签。
4)为了进行特征选择,重要的特征应该具有较大的权值,冗余和不相关的特征具有较小的权值。根据进一步引入正则化项,特征权重的目标函数ξ(w)如下所示:
Figure BDA0002189772870000063
式中,λ为正则化参数。λ≥0,可以通过交叉验证方法确定。
5)为了过滤掉不相关的特征,选取特征权重wl大于0的数据样本单元作为胃癌风险数据的特征属性,从而建立胃癌风险数据集T={(x1,y1),...,(xn,yn)}。
所述风险评估模块对胃癌风险特征数据集T={(x1,y1),...,(xn,yn)}进行深度学习,得到风险评估结果yc
风险评估结果yc如下所示:
将胃癌风险数据集T={(x1,y1),...,(xn,yn)}输入到深度神经网络中,计算得到风险评估结果yc,即:
Figure BDA0002189772870000064
式中,e为输出神经元的激活函数。
Figure BDA0002189772870000071
表示权重矩阵中第j个输入样本到连接到第c个输出神经元的权重。xi为疾病风险数据样本单元。
Figure BDA0002189772870000072
表示权重矩阵中第i个输入样本连接到第j个神经元的权重,rj为输入样本到隐藏层第j神经元的偏置。rc为第c神经元输出的偏置。f为输入层到隐藏层的激活函数。
yc=1,表示无高风险,yc=2,表示高风险。
所述计算机可读介质内写入数据库所有数据,并实时更新。
实施例2:
一种基于大数据分析技术的胃癌疾病风险检测装置,主要包括数据采集模块、数据库、数据预处理模块、特征提取模块和风险评估模块。
所述数据采集模块获取测试者基本数据,并存储在数据库的疾病风险数据集中。
所述数据库存储数据预处理模块、特征提取模块和风险评估模块。
所述数据预处理模块对疾病风险数据集进行预处理,得到预处理后的疾病风险数据样本单元x1,…,xn,并发送至特征提取模块。
所述特征提取模块利用近邻成分分析法提取疾病风险数据单元x1,…,xn的特征,从而建立胃癌风险特征数据集T={(x1,y1),...,(xn,yn)},并发送至风险评估模块。
所述风险评估模块对胃癌风险特征数据集T={(x1,y1),...,(xn,yn)}进行深度学习,得到风险评估结果yc
实施例3:
一种基于大数据分析技术的胃癌疾病风险检测装置,主要结构同实施例2所示,其中,所述数据采集模块通过通信网络与医院信息装置和/或测试者终端互联,从而获取测试者基本数据。
所述测试者基本数据主要包括身高、年龄、体重、性别、每日饮食、生活环境、既往患病史、恶性肿瘤家族史数据和测试者防癌风险评估等级数据。
实施例4:
一种基于大数据分析技术的胃癌疾病风险检测装置,主要结构同实施例2所示,其中,数据预处理模块对疾病风险数据集进行预处理的主要步骤如下:
1)删除疾病风险数据集中数据信息缺失项大于80%的行或列,从而更新疾病风险数据集。
2)将更新后的疾病风险数据集中的离散项进行数值化标注。
3)将更新后的疾病风险数据集中的连续项整合,再进行数值化标注。
4)基于数值化标注结果,建立预处理后的疾病风险数据单元x1,…,xn
实施例5:
一种基于大数据分析技术的胃癌疾病风险检测装置,主要结构同实施例2所示,其中,
实施例6:
一种基于大数据分析技术的胃癌疾病风险检测装置,主要结构同实施例2所示,其中,特征提取模块利用近邻成分分析法提取疾病风险数据样本单元x1,…,xn特征的主要步骤如下:
1)给定疾病风险数据样本单元x1,…,xn,计算疾病风险数据样本单元xi和疾病风险数据样本单元xj之间的加权距离Dw(xi,xj),即:
Figure BDA0002189772870000081
式中,xi为d维特征向量。w为权重向量。wl是关联于第l个特征的权值。|xil-xjl|表示第l个特征下疾病风险数据单元xi和疾病风险数据单元xj距离绝对值。i=1,2,…,n。j=1,2,…,n。
5)基于留一法,计算疾病风险数据样本单元xi选择疾病风险数据样本单元xj作为近邻时的概率分布pij,即:
Figure BDA0002189772870000082
式中,k(z)=exp(-z/σ)是核函数。σ为核宽度。
3)将疾病风险数据样本单元xi通过近邻样本单元正确分类的概率pi如下所示:
Figure BDA0002189772870000091
式中,yij为样本标签,当且仅当yi=yj时yij=1,否则yij=0。yi∈{1...C}为xi所对应的分类标签。
4)特征权重的目标函数ξ(w)如下所示:
Figure BDA0002189772870000092
式中,λ为正则化参数。λ≥0。
5)选取特征权重wl大于0的数据样本单元作为胃癌风险数据的特征属性,从而建立胃癌风险数据集T={(x1,y1),...,(xn,yn)}。
实施例7:
一种基于大数据分析技术的胃癌疾病风险检测装置,主要结构同实施例2所示,其中,计算风险评估结果yc的主要步骤如下:
1)建立深度神经网络。
2)将胃癌风险数据集T={(x1,y1),...,(xn,yn)}输入到深度神经网络中,计算得到风险评估结果yc,即:
Figure BDA0002189772870000093
式中,e为输出神经元的激活函数。
Figure BDA0002189772870000094
表示权重矩阵中第j个输入样本到连接到第c个输出神经元的权重。xi为疾病风险数据样本单元。
Figure BDA0002189772870000095
表示权重矩阵中第i个输入样本连接到第j个神经元的权重,rj为输入样本到隐藏层第j神经元的偏置。rc为第c神经元输出的偏置。f为输入层到隐藏层的激活函数。
实施例8:
一种基于大数据分析技术的胃癌疾病风险检测装置,主要结构同实施例2所示,还包括显示模块。显示模块显示风险评估结果yc
实施例9:
一种验证基于大数据分析技术的胃癌疾病风险检测装置的实验:
数据采集模块采集疾病风险数据。
所述数据预处理模块对疾病风险数据集进行预处理,得到预处理后的疾病风险数据样本单元x1,…,xn,并发送至特征提取模块。
比如数据预处理模块对测试者身高h和体重w数据进行体质比BMI计算。
计算后,按标准BMI值范围顺序进行数值标注;BMI值预处理表如表1所示;
表1 BMI值在模型中的划分区间及赋值
类型 BMI值 赋值
肥胖 BMI>30 1
偏胖 25<BMI<30 2
正常 18<BMI<25 3
偏瘦 BMI<18 4
所述特征提取模块利用近邻成分分析法提取疾病风险数据单元x1,…,xn的特征,从而建立胃癌风险特征数据集T={(x1,y1),...,(xn,yn)},并发送至风险评估模块。胃癌风险数据集如表2如示。
表2胃癌风险数据特征结果
序号. 属性 数值
1 胃癌 1=非高风险,2=高风险
2 性别 1=男,2=女
4 BMI 1=’BMI>30’,2=’25<BMI<=30’,3=’18<BMI<=25’,4=’BMI<18’
5 B22干稀 1=干,2=适中,3=稀
6 B23咸淡 1=重盐,2=适中,3=清淡
7 C05饮酒 1=从不,2=有时,3=经常
8 D01精神创伤 1=是,2=否
9 E06_1何种胃炎 1=慢性浅表性胃炎,2=慢性萎缩性胃炎
10 E07胃溃疡 1=是,2=否
11 E08十二指肠溃疡 1=是,2=否
12 F13一级血亲胃癌 1=是,2=否
所述风险评估模块对胃癌风险特征数据集T={(x1,y1),...,(xn,yn)}进行深度学习,得到风险评估结果yc
当胃癌特征数据值如表3所示,检测出来胃癌疾病风险等级为2,高风险。
表3胃癌特征数据值
序号. 属性 数值
1 性别 1
2 BMI 2
4 B22干稀 1
5 B23咸淡 2
6 C05饮酒 2
7 D01精神创伤 2
8 E06_1何种胃炎 1
9 E07胃溃疡 1
10 E08十二指肠溃疡 1
11 F13一级血亲胃癌 1

Claims (5)

1.一种基于大数据分析技术的胃癌疾病风险检测装置,其特征在于,主要包括数据采集模块、数据库、数据预处理模块、特征提取模块和风险评估模块;
所述数据采集模块获取测试者基本数据,并存储在数据库的疾病风险数据集中;
所述数据库存储数据预处理模块、特征提取模块和风险评估模块;
所述数据预处理模块对疾病风险数据集进行预处理,得到预处理后的疾病风险数据样本单元x1,…,xn,并发送至特征提取模块;
所述特征提取模块利用近邻成分分析法提取疾病风险数据单元x1,…,xn的特征,从而建立风险特征数据集T={(x1,y1),...,(xn,yn)},并发送至风险评估模块;
特征提取模块利用近邻成分分析法提取疾病风险数据样本单元x1,…,xn特征的主要步骤如下:
1)给定疾病风险数据样本单元x1,…,xn,计算疾病风险数据样本单元xi和疾病风险数据样本单元xj之间的加权距离Dw(xi,xj),即:
Figure FDA0003846579880000011
式中,xi为d维特征向量;w为权重向量;wl是关联于第l个特征的权值;|xil-xjl|表示第l个特征下疾病风险数据单元xi和疾病风险数据单元xj距离绝对值;i=1,2,…,n;j=1,2,…,n;
2)基于留一法,计算疾病风险数据样本单元xi选择疾病风险数据样本单元xj作为近邻时的概率分布pij,即:
Figure FDA0003846579880000012
式中,k(z)=exp(-z/σ)是核函数;σ为核宽度;
3)将疾病风险数据样本单元xi通过近邻样本单元正确分类的概率pi如下所示:
Figure FDA0003846579880000021
式中,yij为样本标签,当且仅当yi=yj时yij=1,否则yij=0;yi∈{1...C}为xi所对应的分类标签;
4)特征权重的目标函数ξ(w)如下所示:
Figure FDA0003846579880000022
式中,λ为正则化参数;λ≥0;
5)选取特征权重wl大于0的数据样本单元作为胃癌风险数据的特征属性,从而建立胃癌风险数据集T={(x1,y1),...,(xn,yn)};
所述风险评估模块对风险特征数据集T={(x1,y1),...,(xn,yn)}进行深度学习,得到风险评估结果yc;yc=1,表示无高风险,yc=2,表示高风险;
风险评估结果yc如下所示:
Figure FDA0003846579880000023
式中,e为输出神经元的激活函数;
Figure FDA0003846579880000024
表示权重矩阵中第j个输入样本到连接到第c个输出神经元的权重;xi为疾病风险数据样本单元;
Figure FDA0003846579880000025
表示权重矩阵中第i个输入样本连接到第j个神经元的权重,rj为输入样本到隐藏层第j神经元的偏置;rc为第c神经元输出的偏置;f为输入层到隐藏层的激活函数。
2.根据权利要求1所述的一种基于大数据分析技术的胃癌疾病风险检测装置,其特征在于:所述测试者基本数据主要包括身高、年龄、体重、性别、每日饮食、生活环境、既往患病史、恶性肿瘤家族史数据和测试者防癌风险评估等级数据。
3.根据权利要求1或2所述的一种基于大数据分析技术的胃癌疾病风险检测装置,其特征在于:数据预处理模块对疾病风险数据集进行预处理的主要步骤如下:
1)删除疾病风险数据集中数据信息缺失项大于80%的行或列,从而更新疾病风险数据集;
2)将更新后的疾病风险数据集中的离散项进行数值化标注:判断测试者基本数据影响风险评估结果的概率,若概率大于50%,则将测试者基本数据数值化为2,相反,则将测试者基本数据数值化为1;
3)将更新后的疾病风险数据集中的连续项整合,再进行数值化标注;
4)基于数值化标注结果,建立预处理后的疾病风险数据单元x1,…,xn
4.根据权利要求1所述的一种基于大数据分析技术的胃癌疾病风险检测装置,其特征在于,所述数据采集模块通过通信网络与医院信息装置和/或测试者终端互联,从而获取测试者基本数据。
5.根据权利要求1所述的一种基于大数据分析技术的胃癌疾病风险检测装置,其特征在于,还包括计算机可读介质;
所述计算机可读介质内写入数据库所有数据。
CN201910828098.2A 2019-09-03 2019-09-03 一种基于大数据分析技术的胃癌疾病风险检测装置 Active CN110689961B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910828098.2A CN110689961B (zh) 2019-09-03 2019-09-03 一种基于大数据分析技术的胃癌疾病风险检测装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910828098.2A CN110689961B (zh) 2019-09-03 2019-09-03 一种基于大数据分析技术的胃癌疾病风险检测装置

Publications (2)

Publication Number Publication Date
CN110689961A CN110689961A (zh) 2020-01-14
CN110689961B true CN110689961B (zh) 2022-12-09

Family

ID=69108825

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910828098.2A Active CN110689961B (zh) 2019-09-03 2019-09-03 一种基于大数据分析技术的胃癌疾病风险检测装置

Country Status (1)

Country Link
CN (1) CN110689961B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112133427A (zh) * 2020-09-24 2020-12-25 江苏天瑞精准医疗科技有限公司 一种基于人工智能的胃癌辅助诊断系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103984959A (zh) * 2014-05-26 2014-08-13 中国科学院自动化研究所 一种基于数据与任务驱动的图像分类方法
CN106355033A (zh) * 2016-09-27 2017-01-25 无锡金世纪国民体质与健康研究有限公司 一种生活风险评估系统
CN107220506A (zh) * 2017-06-05 2017-09-29 东华大学 基于深度卷积神经网络的乳腺癌风险评估分析系统
CN108122612A (zh) * 2017-12-20 2018-06-05 姜涵予 数据库的建立、多维度健康风险等级确定方法及装置
CN109389314A (zh) * 2018-10-09 2019-02-26 宁波大学 一种基于最优近邻成分分析的质量软测量与监测方法
CN109409425A (zh) * 2018-10-09 2019-03-01 宁波大学 一种基于近邻成分分析的故障类型识别方法
CN109726230A (zh) * 2018-12-04 2019-05-07 重庆大学 一种大数据分析模型预测发动机性能的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170140273A1 (en) * 2015-11-18 2017-05-18 Video Inform Ltd System and method for automatic selection of deep learning architecture

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103984959A (zh) * 2014-05-26 2014-08-13 中国科学院自动化研究所 一种基于数据与任务驱动的图像分类方法
CN106355033A (zh) * 2016-09-27 2017-01-25 无锡金世纪国民体质与健康研究有限公司 一种生活风险评估系统
CN107220506A (zh) * 2017-06-05 2017-09-29 东华大学 基于深度卷积神经网络的乳腺癌风险评估分析系统
CN108122612A (zh) * 2017-12-20 2018-06-05 姜涵予 数据库的建立、多维度健康风险等级确定方法及装置
CN109389314A (zh) * 2018-10-09 2019-02-26 宁波大学 一种基于最优近邻成分分析的质量软测量与监测方法
CN109409425A (zh) * 2018-10-09 2019-03-01 宁波大学 一种基于近邻成分分析的故障类型识别方法
CN109726230A (zh) * 2018-12-04 2019-05-07 重庆大学 一种大数据分析模型预测发动机性能的方法

Also Published As

Publication number Publication date
CN110689961A (zh) 2020-01-14

Similar Documents

Publication Publication Date Title
CN108806792B (zh) 深度学习面诊系统
CN108717867A (zh) 基于梯度迭代树的疾病预测模型建立方法及装置
Austria et al. Comparison of machine learning algorithms in breast cancer prediction using the coimbra dataset
CN107169526A (zh) 自动特征分析、比较和异常检测的方法
CN102930163A (zh) 一种2型糖尿病风险状态判定方法
CN108742513A (zh) 脑卒中患者康复预测方法及系统
CN103714261A (zh) 二阶段混合模型的智能辅助医疗决策支持方法
CN108565017A (zh) 一种宫颈病变的临床决策系统及其方法
CN111248859A (zh) 基于卷积神经网络的睡眠呼吸暂停自动检测方法
CN109472784A (zh) 基于级联全卷积网络病理图像有丝分裂细胞的识别方法
CN113593708A (zh) 基于集成学习算法的脓毒症预后预测方法
Yang et al. A convolutional neural network trained with dermoscopic images of psoriasis performed on par with 230 dermatologists
Thotad et al. Diabetes disease detection and classification on Indian demographic and health survey data using machine learning methods
CN114943629A (zh) 一种健康管理保健服务系统及其健康管理方法
CN110689961B (zh) 一种基于大数据分析技术的胃癌疾病风险检测装置
CN111986814A (zh) 一种红斑狼疮患者的狼疮性肾炎预测模型的建模方法
CN116864062B (zh) 一种基于互联网的健康体检报告数据分析管理系统
CN115130645A (zh) 基于自学习小波卷积神经网络的跨个体学习方法
CN109492690B (zh) 一种基于卷积神经网络检测ct图像的方法
CN114238558A (zh) 一种电子病历的质检方法、装置、存储介质及设备
CN111276243B (zh) 一种基于生物标志物的多变量分类系统和方法
CN108376567A (zh) 一种基于标签传播算法的临床药品-药品不良反应检测方法
Hang et al. Electronic medical record based machine learning methods for adverse pregnancy outcome prediction
Hao et al. Feature Optimization of Exhaled Breath Signals Based on Pearson‐BPSO
Akkala et al. Skin Cancer Detection Using Deep Learning (CNN)

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant