CN112309564A - 一种人工智能诊断系统及智能机器人 - Google Patents

一种人工智能诊断系统及智能机器人 Download PDF

Info

Publication number
CN112309564A
CN112309564A CN201910682163.5A CN201910682163A CN112309564A CN 112309564 A CN112309564 A CN 112309564A CN 201910682163 A CN201910682163 A CN 201910682163A CN 112309564 A CN112309564 A CN 112309564A
Authority
CN
China
Prior art keywords
data
unit
diagnosis
artificial intelligence
diagnostic system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910682163.5A
Other languages
English (en)
Inventor
熊斌
蒲宗瑜
贺立文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Bonoming Medical Technology Co ltd
Original Assignee
Shenzhen Bonoming Medical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Bonoming Medical Technology Co ltd filed Critical Shenzhen Bonoming Medical Technology Co ltd
Priority to CN201910682163.5A priority Critical patent/CN112309564A/zh
Publication of CN112309564A publication Critical patent/CN112309564A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Abstract

本发明提供了一种人工智能诊断系统及智能机器人,其中,人工智能诊断系统,包括:数据采集模块,用于采集用户当前的身体健康数据;模型训练模块,用于根据健康大数据训练诊断模型;智能医生模块,用于对比所述当前的身体健康数据与所述诊断模型,并根据对比结果向所述用户推送诊断建议。本发明基于健康大数据训练相应的诊断模型,针对一些常规的疾病,用户可以足不出户就可以得到准确的诊断结果,不仅给用户带来了方便,而且能够极大地缓解医疗资源的不足的问题。

Description

一种人工智能诊断系统及智能机器人
技术领域
本发明属于智能医疗技术领域,尤其涉及一种人工智能诊断系统及智能机器人。
背景技术
随着当代人们生活节奏的加快,生活压力的增加,亚健康状态的人大量存在,同时,人们不健康的饮食习惯和生活方式也使得高血压、糖尿病等疾病日益增多,威胁着人们的健康。
不过,随着人们越来越注重自己身体的健康状况,电子科技领域中的智能硬件设备让人体监测项目的逐渐进入了大众视野,成为人们关注自身健康的途径之一,许多公司推出了简单易操作的智能手环、体重体脂秤、家用血压血糖仪等产品,但是这些简易设备无法对这些数据进行综合、科学地处理并给出相应的建议,而如果每次都需要去医院咨询/问诊,则会给本来就稀缺的医疗资源增加进一步的压力。
因此,现有技术还有待于改进和发展。
发明内容
本发明所要解决的技术问题在于提供一种人工智能诊断系统及智能机器人,旨在解决现有的智能健康设备不能提供科学的诊断的问题。
为解决上述技术问题,本发明是这样实现的,一种人工智能诊断系统,包括:
数据采集模块,用于采集用户当前的身体健康数据;
模型训练模块,用于根据健康大数据训练诊断模型;
智能医生模块,用于对比所述当前的身体健康数据与所述诊断模型,并根据对比结果向所述用户推送诊断建议。
进一步地,所述数据采集模块,包括USB单元、触摸屏单元、摄像头单元、语音识别单元和蓝牙单元中的一种或多种。
进一步地,所述模型训练模块包括:
数据清洗单元,用于删除所述健康大数据中的重复数据和孤立点,并进行特征选择,获得第一数据集;
数据集成单元,用于将所述第一数据集中的数据建立联系,形成可进行信息交换和共享的第二数据集;
数据变换单元,用于消除所述第二数据集中的与分析目标不相关、弱相关的数据,并转换成便于数据挖掘的形式,获得诊断模型。
进一步地,所述模型训练模块还包括:模型检验单元,用于检验所述诊断模型的正确性。
进一步地,所述数据清洗单元,包括:
重复数据处理子单元,用于根据重复数据检测算法,检测并删除所述健康大数据中的重复数据;
孤立点处理子单元,用于根据孤立点检测算法,检测并删除所述第一数据集中的干扰数据;
特征选择子单元,用于对删除重复数据和干扰数据后的数据按照规则生成特征子集,形成所述第一数据集。
进一步地,所述智能医生模块包括:
诊断单元,用于对比所述当前的身体健康数据与所述诊断模型,并反馈诊断结果;
信息推送单元,用于将所述诊断结果推送给用户。
进一步地,所述诊断结果包括用户的健康状况和就诊建议。
进一步地,所述智能医生模块还包括:
挂号单元,用于用户进行远程挂号。
一种智能机器人,用于家庭健康服务,所述智能机器人集成有如上所述的人工智能诊断系统。
本发明与现有技术相比,有益效果在于:本发明的人工智能诊断系统,模型训练模块是基于历史的健康大数据来训练相应的诊断模型,然后智能医生模块根据所述诊断模型对获取的当前健康数据进行诊断,并将诊断结果推送给用户。本技术方案,针对一些常规的疾病,用户可以足不出户就可以得到准确的诊断结果,不仅给用户带来了方便,而且能够极大地缓解医疗资源的不足的问题。
附图说明
图1是本发明第一种人工智能诊断系统的实施例模块图;
图2是本发明第二种人工智能诊断系统的实施例模块图;
图3是本发明的一种数据清洗单元的实施例模块图;
图4a是包含孤立点的原始数据图;
图4b是现有的算法处理后的效果图;
图4c是本发明的改进算法处理后的效果图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供了一种人工智能诊断系统,如图1所示,包括:数据采集模块1、模型训练模块2以及智能医生模块3。其中,数据采集模块1用于采集用户当前的身体健康数据。用户当前的身体健康数据可以是心率、血糖浓度、血压指数等等,这些数据可以通过简易的智能设备如手环、手表、血糖仪、血压计等测出,用户可以将数据拷贝出来然后通过USB单元输入或直接由蓝牙单元无线传输到人工智能诊断系统中,或通过设置触摸屏单元、语音识别单元等进行手动或语音输入,当然也可以通过摄像头单元输入图片数据,例如CT照片。模型训练模块2,用于根据健康大数据训练诊断模型。在医疗诊断系统中,长期积累的病历数据量十分庞大,本发明的模型训练模块是基于历史的健康大数据来训练相应的诊断模型,然后智能医生模块3根据所述诊断模型对获取的当前健康数据进行诊断,并将诊断结果推送给用户。本技术方案,针对一些常规的疾病,用户可以足不出户就可以得到准确的诊断结果,不仅给用户带来了方便,而且能够极大地缓解医疗资源的不足的问题。
进一步地,本发明提供了另一种人工智能诊断系统的较佳实施例,如图2所示,模型训练模块具体包括:数据清洗单元21、数据集成单元22和数据变换单元23。
数据清洗单元21,用于删除所述健康大数据中的重复数据和孤立点,并进行特征选择,获得第一数据集。原始大数据常呈现大量重复、噪声数据较多以及特征维数较高等特点,给后续的数据分析和挖掘的结果带来了很大的影响。数据清洗的原理,即是通过分析这些不合格的数据的产生原因和结构特点,检测和删除重复数据,并检测出孤立点来“清理”数据,通过特征选择来降低数据分析的复杂度,从而获得高质量第一数据集。
各大医院和医疗机构经过信息化发展之后,各自积累了大量的数据。但不同系统间的数据结构、存储方式都不一致,彼此之间无法进行有效的信息交换和共享,从而形成“信息孤岛”。数据集成单元22,可以将所述第一数据集中的数据建立联系,形成可进行信息交换和共享的第二数据集,解决“信息孤岛”的问题。
在第二数据集中,数据的维度较高,且存在着很多对数据分析没有太大影响或信息冗余的数据项,这些信息的存在不仅会影响数据分析的结果,还会影响数据分析的效率。通过数据变换单元23,消除所述第二数据集中的与分析目标不相关、弱相关的数据,并转换成便于数据挖掘的形式,最后通过深度学习获得诊断模型。
可选的,所述模型训练模块还包括:模型检验单元24,用于检验所述诊断模型的正确性。例如,随机选择10%的样本作为测试集对模型进行测试,若正确率满足要求则对模型进行保存,否则重新进行清洗、分类调整等操作,直到正确率符合要求。
进一步的,所述数据清洗单元如图3所示,还可以包括:重复数据处理子单元211、孤立点处理子单元212和特征选择子单元213。
重复数据的删除能够有效地减少医疗数据存储的空间,提高数据质量,本发明的重复数据处理子单元211,可以采用聚类算法进行处理。聚类算法将相似度较高的数据通过聚类聚集到同一个类中,其中ICAD(基于可调密度的改进聚类算法)便是基于此思想的一种改进。该算法是对DBSCAN算法的继承和改进,首先对数据集进行聚类,然后通过计算同一个类中的数据相似度来判断其是否为近似重复数据,并调整邻域半径来修改其密度参数,不断迭代,直到类中的数据均为近似重复数据为止,以此来完成对重复数据的检测,进而删除所述健康大数据中的重复数据。
孤立点是在数据集中偏离大部分数据的数据,且这些偏离的数据可能由不同于正常数据的机制产生,而不是随机产生。基于此而发展出的孤立点检测算法大致可以分为:基于统计的方法,基于距离的方法,基于偏差的方法,基于密度的方法等等,本发明的孤立点处理子单元212采用基于投票策略的全局孤立点检测方法,本检测方法是基于:偏离于数据集的异常数据与正常数据存在的差异性要比正常数据间的差异性大,基于投票策略的改进算法使得每一个样本点都能给与其相差最大的那些样本进行投票,经过所有样本投票后,得票越多的点与越多的样本存在明显差异,也越可能成为孤立点。改进前后算法处理效果对比如图4a-4c所示。根据本方法可以有效检测并删除所述第一数据集中的孤立点干扰数据。
健康数据中数据信息十分庞杂,且其中存在着一些信息冗余属性项或对数据分析无关紧要的属性项,这些特征对于最后的分类分析没有太大的作用,反而容易导致分析特征、训练模型所需的时间较长,模型变得复杂,同时也会导致维度灾难。因此,需对数据集进行特征选择。现有的基于随机森林的特征选择算法存在以下问题:在随机森林的建立过程中,在建立每一棵决策树时会随机选择属性子集建立随机树,但无法保证在所有决策树建立完成后,所有属性项都参与了随机森林的建立。即当有特征没被选上时,即使其重要程度较高,因无法得到其重要度而无法入选最优特征子集。本发明的特征选择子单元213是基于局部优先度的特征选择算法,改进如下:
(1)基于部分属性在建树过程中无法被选择到从而无法计算重要度的问题,记录属性集中被选择到的次数,停止建立新树的条件之一是:若每个属性被至少选择到两次,则可以停止建树,否则继续随机挑选属性建立新的决策树。
(2)在计算重要度时,引入局部特征顺序的影响因子,来平衡重要度计算时带来的误差。本发明在建立随机森林的过程中,使用的决策树为C4.5,其所使用选择分裂节点的方法为信息增益率:
Figure BDA0002145151950000061
其中g(D,A)为其信息增益,HA(D)是训练数据集D关于特征A的值的熵。信息增益率越大的点,分类能力越强,在局部特征子集中重要程度越靠前。鉴于此,即可将各属性项在决策树中的信息增益率作为其局部优先度影响因子,值越大,在决策树中起到作用越大,局部重要度越高。另外,每一棵树的初始分类错误率不一样,决策树因样本扰动带来的错误率改变程度不一样,各属性的错误率改变值应替换成错误率改变率,则最后各属性的重要度计算为:
Figure BDA0002145151950000062
本发明的改进算法所选择的特征子集小,但分类精度却很高。
可选的,如图2所示,所述智能医生模块还可以包括:诊断单元31,用于对比所述当前的身体健康数据与所述诊断模型,并反馈诊断结果;信息推送单元32,用于将所述诊断结果推送给用户,其中,诊断结果可以是用户的健康状况,例如是否患病,或者患有慢性病的患者,病情相比之前是否有恶化;诊断结果也可以是就诊建议,例如展示用户附近的医院医疗水平、距离远近等等信息,以供用户参考选择。可选的,所述智能医生模块还可以包括:挂号单元33,用于用户进行远程挂号,用户可以通过该系统,根据需要按地区省市医院或按病种挂号。
本发明的人工智能诊断系统可以集成到各种终端上,例如计算机、服务器、移动终端、智能家居、智能机器人等等。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种人工智能诊断系统,其特征在于,包括:
数据采集模块,用于采集用户当前的身体健康数据;
模型训练模块,用于根据健康大数据训练诊断模型;
智能医生模块,用于对比所述当前的身体健康数据与所述诊断模型,并根据对比结果向所述用户推送诊断建议。
2.如权利要求1所述的人工智能诊断系统,其特征在于,所述数据采集模块,包括USB单元、触摸屏单元、摄像头单元、语音识别单元和蓝牙单元中的一种或多种。
3.如权利要求1所述的人工智能诊断系统,其特征在于,所述模型训练模块包括:
数据清洗单元,用于删除所述健康大数据中的重复数据和孤立点,并进行特征选择,获得第一数据集;
数据集成单元,用于将所述第一数据集中的数据建立联系,形成可进行信息交换和共享的第二数据集;
数据变换单元,用于消除所述第二数据集中的与分析目标不相关、弱相关的数据,并转换成便于数据挖掘的形式,获得诊断模型。
4.如权利要求3所述的人工智能诊断系统,其特征在于,所述模型训练模块还包括:模型检验单元,用于检验所述诊断模型的正确性。
5.如权利要求3所述的人工智能诊断系统,其特征在于,所述数据清洗单元,包括:
重复数据处理子单元,用于根据重复数据检测算法,检测并删除所述健康大数据中的重复数据;
孤立点处理子单元,用于根据孤立点检测算法,检测并删除所述第一数据集中的干扰数据;
特征选择子单元,用于对删除重复数据和干扰数据后的数据按照规则生成特征子集,形成所述第一数据集。
6.如权利要求1所述的人工智能诊断系统,其特征在于,所述智能医生模块包括:
诊断单元,用于对比所述当前的身体健康数据与所述诊断模型,并反馈诊断结果;
信息推送单元,用于将所述诊断结果推送给用户。
7.如权利要求6所述的人工智能诊断系统,其特征在于,所述诊断结果包括用户的健康状况和就诊建议。
8.如权利要求6所述的人工智能诊断系统,其特征在于,所述智能医生模块还包括:
挂号单元,用于用户进行远程挂号。
9.一种智能机器人,用于家庭健康服务,其特征在于,所述智能机器人集成有如权利要求1-8任一所述的人工智能诊断系统。
CN201910682163.5A 2019-07-26 2019-07-26 一种人工智能诊断系统及智能机器人 Pending CN112309564A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910682163.5A CN112309564A (zh) 2019-07-26 2019-07-26 一种人工智能诊断系统及智能机器人

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910682163.5A CN112309564A (zh) 2019-07-26 2019-07-26 一种人工智能诊断系统及智能机器人

Publications (1)

Publication Number Publication Date
CN112309564A true CN112309564A (zh) 2021-02-02

Family

ID=74329711

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910682163.5A Pending CN112309564A (zh) 2019-07-26 2019-07-26 一种人工智能诊断系统及智能机器人

Country Status (1)

Country Link
CN (1) CN112309564A (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105260588A (zh) * 2015-10-23 2016-01-20 福建优安米信息科技有限公司 一种健康守护机器人系统及其数据处理方法
CN106951719A (zh) * 2017-04-10 2017-07-14 荣科科技股份有限公司 临床诊断模型的构建方法及构建系统、临床诊断系统
CN107066791A (zh) * 2016-12-19 2017-08-18 银江股份有限公司 一种基于病人检验结果的辅助疾病诊断方法
CN107887024A (zh) * 2017-12-14 2018-04-06 华子昂 基于中医机器人的智能诊断系统及中医机器人
CN107910061A (zh) * 2017-12-01 2018-04-13 中南大学 一种医疗数据处理方法及系统
CN108573758A (zh) * 2018-04-26 2018-09-25 贵州大学 一种智能医疗大数据服务系统及应用方法
CN109003674A (zh) * 2017-06-06 2018-12-14 深圳大森智能科技有限公司 一种健康管理方法及系统
CN109394183A (zh) * 2018-12-14 2019-03-01 量子云未来(北京)信息科技有限公司 一种医疗疾病预警方法、系统及存储介质
CN109887589A (zh) * 2019-02-21 2019-06-14 吉林禾熙科技开发有限公司 人工智能医疗大数据系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105260588A (zh) * 2015-10-23 2016-01-20 福建优安米信息科技有限公司 一种健康守护机器人系统及其数据处理方法
CN107066791A (zh) * 2016-12-19 2017-08-18 银江股份有限公司 一种基于病人检验结果的辅助疾病诊断方法
CN106951719A (zh) * 2017-04-10 2017-07-14 荣科科技股份有限公司 临床诊断模型的构建方法及构建系统、临床诊断系统
CN109003674A (zh) * 2017-06-06 2018-12-14 深圳大森智能科技有限公司 一种健康管理方法及系统
CN107910061A (zh) * 2017-12-01 2018-04-13 中南大学 一种医疗数据处理方法及系统
CN107887024A (zh) * 2017-12-14 2018-04-06 华子昂 基于中医机器人的智能诊断系统及中医机器人
CN108573758A (zh) * 2018-04-26 2018-09-25 贵州大学 一种智能医疗大数据服务系统及应用方法
CN109394183A (zh) * 2018-12-14 2019-03-01 量子云未来(北京)信息科技有限公司 一种医疗疾病预警方法、系统及存储介质
CN109887589A (zh) * 2019-02-21 2019-06-14 吉林禾熙科技开发有限公司 人工智能医疗大数据系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
方积乾: "《医学统计学手册》", 31 May 2018, 北京:中国统计出版社, pages: 291 *
程光等: "《互联网大数据挖掘与分类》", 31 December 2015, 南京:东南大学出版社, pages: 170 *

Similar Documents

Publication Publication Date Title
Qin et al. A machine learning methodology for diagnosing chronic kidney disease
US11562222B2 (en) Systems and methods of identity analysis of electrocardiograms
Wen et al. MVS-GCN: A prior brain structure learning-guided multi-view graph convolution network for autism spectrum disorder diagnosis
CN109935336B (zh) 一种儿童呼吸科疾病的智能辅助诊断系统
EP3367883B1 (en) Monitoring activities of daily living of a person
Zimmer et al. Modeling disability trajectories and mortality of the oldest-old in China
WO2017147552A9 (en) Multi-format, multi-domain and multi-algorithm metalearner system and method for monitoring human health, and deriving health status and trajectory
Chén et al. Building a machine-learning framework to remotely assess Parkinson's disease using smartphones
AU2018432124A1 (en) Human body health assessment method and system based on sleep big data
CN107145715B (zh) 一种基于推举算法的临床医学智能判别装置
Ambica et al. An efficient expert system for diabetes by naive Bayesian classifier
CN109712712A (zh) 一种健康评估方法、健康评估装置及计算机可读存储介质
Boisclair et al. A health microsimulation model for Quebec and Canada
CN114190897B (zh) 睡眠分期模型的训练方法、睡眠分期方法及装置
CN112908452A (zh) 事件数据建模
CN109785964A (zh) 一种健康评估方法、健康评估装置及计算机可读存储介质
Nabi et al. Machine learning approach: Detecting polycystic ovary syndrome & it's impact on bangladeshi women
CN108122005B (zh) 一种临床药物层次分类的方法
CN116739037A (zh) 具有人格特征的人格模型构建方法及装置
CN112309564A (zh) 一种人工智能诊断系统及智能机器人
CN114388089A (zh) 一种基于人工智能的个人健康管理方法及系统
Ren et al. Biclustering of medical monitoring data using a nonparametric hierarchical Bayesian model
CN111243697A (zh) 一种基于神经网络对目标对象数据进行判断的方法及系统
CN113593703B (zh) 一种构建压力性损伤风险预测模型的装置及方法
RAJAEI et al. Diagnosis of escherichia coli bacteria patient by data mining

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination