CN113440101A - 一种基于集成学习的眩晕诊断装置及系统 - Google Patents

一种基于集成学习的眩晕诊断装置及系统 Download PDF

Info

Publication number
CN113440101A
CN113440101A CN202110138661.0A CN202110138661A CN113440101A CN 113440101 A CN113440101 A CN 113440101A CN 202110138661 A CN202110138661 A CN 202110138661A CN 113440101 A CN113440101 A CN 113440101A
Authority
CN
China
Prior art keywords
vertigo
model
diagnosis
subunit
ensemble learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110138661.0A
Other languages
English (en)
Other versions
CN113440101B (zh
Inventor
李华伟
张�诚
孙珊
邓皓文
周凌霄
唐冬梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eye and ENT Hospital of Fudan University
Original Assignee
Eye and ENT Hospital of Fudan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Eye and ENT Hospital of Fudan University filed Critical Eye and ENT Hospital of Fudan University
Priority to CN202110138661.0A priority Critical patent/CN113440101B/zh
Publication of CN113440101A publication Critical patent/CN113440101A/zh
Application granted granted Critical
Publication of CN113440101B publication Critical patent/CN113440101B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/40Detecting, measuring or recording for evaluating the nervous system
    • A61B5/4005Detecting, measuring or recording for evaluating the nervous system for evaluating the sensory system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/20ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/60ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
    • G16H40/67ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for remote operation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Epidemiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Primary Health Care (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Biology (AREA)
  • Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Neurosurgery (AREA)
  • Computational Linguistics (AREA)
  • Neurology (AREA)
  • Databases & Information Systems (AREA)
  • Physiology (AREA)
  • Biophysics (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Molecular Biology (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提供一种基于集成学习的眩晕诊断装置及系统;所述基于集成学习的眩晕诊断装置包括:眩晕信息获取模块,用于获取目标患者的眩晕信息;诊断模型获取模块,用于获取一基于集成学习的眩晕诊断模型;眩晕诊断模块,与所述眩晕信息获取模块和所述诊断模型获取模块相连,用于利用所述眩晕诊断模型对所述目标患者的眩晕信息进行处理,以获取目标患者的诊断结果;其中,所述眩晕诊断模型由一诊断模型构建模块生成。在利用所述基于集成学习的眩晕诊断装置对目标患者进行诊断的过程中,基本无需人工参与,因此,对眩晕的诊断不受医务人员水平的限制且诊断过程简单。

Description

一种基于集成学习的眩晕诊断装置及系统
技术领域
本发明属于计算机辅助诊断领域,涉及一种诊断装置,特别是涉及一种基于集成学习的眩晕诊断装置及系统。
背景技术
耳源性眩晕是耳鼻喉科的常见病之一,其发病率高、危害大,主要以旋转性眩晕为特征,涉及中枢神经系统、感觉系统、运动系统等多个器官和系统。耳源性眩晕常伴有耳部前庭器官的功能损害,即使及时使用正确的药物治疗,部分功能依然不会完全恢复,患者的平衡功能障碍,是影响眩晕患者生活质量的最大障碍。而科学的康复训练,可以极为有效的让患者通过功能代偿实现正常生活的完全恢复,是眩晕疾病后遗症状的极为有效的辅助治疗手段。
然而,发明人在实际应用中发现,临床上对耳源性眩晕的诊断往往需要影像学和神经电生理检查明确诊断,治疗往往需要联合耳鼻喉科、神经科、老年科、康复科、护理科等多个专科协作,治疗过程复杂且对医务人员的水平要求较高;尤其是对于基层医院来说,受到医疗水平和医疗设备的制约,基层医院很难对患者的耳源性眩晕进行合理的诊断。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种基于集成学习的眩晕诊断装置及系统,用于解决现有耳源性眩晕的治疗方案中,诊断过程复杂且对医务人员的水平要求较高的问题。
为实现上述目的及其他相关目的,本发明的第一方面提供一种基于集成学习的眩晕诊断装置及系统;所述基于集成学习的眩晕诊断装置包括:眩晕信息获取模块,用于获取目标患者的眩晕信息;诊断模型获取模块,用于获取一基于集成学习的眩晕诊断模型;眩晕诊断模块,与所述眩晕信息获取模块和所述诊断模型获取模块相连,用于利用所述眩晕诊断模型对所述目标患者的眩晕信息进行处理,以获取目标患者的诊断结果;其中,所述眩晕诊断模型由一诊断模型构建模块生成,所述诊断模型构建模块包括:训练数据获取单元,用于获取训练数据;模型训练单元,与所述训练数据获取单元相连,用于根据所述训练数据对一个或多个集成学习模型进行训练,以获取最优集成学习模型;概率校准单元,与所述模型训练单元相连,用于对所述最优集成学习模型进行概率校准,以获取所述眩晕诊断模型。
于所述第一方面的一实施例中,所述训练数据获取单元包括:数据获取子单元,用于获取一个或多个患者的历史诊断数据;特征提取子单元,与所述数据获取子单元相连,用于对所述一个或多个患者的历史诊断数据进行变量重编码,以获取所述历史诊断数据的特征数据;所述特征数据即为所述训练数据。
于所述第一方面的一实施例中,所述集成学习模型为一基于直方图算法的梯度提升模型;所述诊断模型构建模块还包括一集成学习模型生成单元,用于生成所述基于直方图算法的梯度提升模型。
于所述第一方面的一实施例中,所述集成学习模型生成单元包括:数据分隔子单元,与所述特征提取子单元相连,用于采用直方图算法对所述特征数据进行分割,以获取多个离散箱;第一生成子单元,与所述数据分隔子单元相连,用于根据所述多个离散箱生成多个弱分类器;第二生成子单元,与所述第一生成子单元相连,用于将所述多个弱分类器进行集成以获取一强分类器,所述强分类器即为所述集成学习模型。
于所述第一方面的一实施例中,所述模型训练单元包括:超参数获取子单元,用于获取至少两个备选超参数,并获取各备选超参数对应的平均预测准确度,进而从所述至少两个备选超参数中选取一最优超参数;模型训练子单元,与所述训练数据获取单元和所述超参数获取子单元相连,用于根据所述最优超参数和所述训练数据对所述集成学习模型进行训练,以获取所述最优集成学习模型。
于所述第一方面的一实施例中,所述超参数获取子单元采用无放回抽取的方式从一超参数抽样空间内获取所述至少两个备选超参数。
于所述第一方面的一实施例中,其特征在于:对于任一备选超参数,所述模型训练子单元采用有放回抽取的方式从所述训练数据中获取多组训练-验证集,并根据所述多组训练-验证集获取该备选超参数对应的平均预测准确度;所述模型训练子单元根据各备选超参数对应的平均预测准确度获取所述最优集成学习模型。
于所述第一方面的一实施例中,所述概率校准单元包括:预测区间划分子单元,用于将所述训练数据的取值范围划分成若干个预测区间;实际比率获取子单元,与所述预测区间划分子单元相连,用于获取各预测区间内患者的实际平均患病比率;预测概率获取子单元,与所述预测区间划分子单元和所述模型训练单元相连,用于根据所述最优集成学习模型获取各预测区间内患者的预测患病概率;回归拟合子单元,与所述实际比率获取子单元和所述预测概率获取子单元相连,用于采用Sigmoid函数对所述实际平均患病比率和所述预测患病概率进行拟合,以获取一Sigmoid校准模型;诊断模型生成子单元,与所述模型训练单元和所述回归拟合子单元相连,用于根据所述最优集成学习模型和所述Sigmoid校准模型获取所述眩晕诊断模型。
于所述第一方面的一实施例中,所述目标患者的诊断结果包括所述目标患者患有眩晕疾病的概率。
本发明的第二方面提供一种眩晕诊断系统,所述眩晕诊断系统包括服务器和诊断设备,其中:所述服务器包括:存储模块,其上存储有训练数据;本发明第一方面任一项所述的诊断模型构建模块,与所述存储模块相连,用于根据所述训练数据生成所述眩晕诊断模型;所述诊断设备与所述服务器通信相连,包括本发明第一方面任一项所述基于集成学习的眩晕诊断装置,用于利用所述眩晕诊断模型对目标患者进行诊断,以获取所述目标患者的诊断结果。
如上所述,本发明所述基于集成学习的眩晕诊断装置及系统的一个技术方案具有以下有益效果:
所述基于集成学习的眩晕诊断装置能够利用所述眩晕诊断模型对所述目标患者的眩晕信息进行处理,以获取目标患者的诊断结果,从而为医生提供辅助诊断工具。该过程基本无需人工参与,因此,对眩晕的诊断不受医务人员水平的限制且诊断过程简单。
此外,所述基于集成学习的眩晕诊断装置所采用的眩晕诊断模型为一经过概率校准的集成学习模型,该模型能够减少预测概率与实际患病概率之间的分布差异,因而在临床应用中具有更高的稳定性和可靠性。
并且,所述基于集成学习的眩晕诊断装置可以被配置为采用基于直方图算法的梯度提升模型作为所述集成学习模型,该模型能够有效处理所述目标患者的眩晕信息中所包含的高维数据和/或高噪声数据,较传统的Logistic模型等具有更高的分类准确度。
附图说明
图1A显示为本发明所述基于集成学习的眩晕诊断装置于一具体实施例中的结构示意图。
图1B显示为本发明所述基于集成学习的眩晕诊断装置于一具体实施例中诊断模型构建模块的结构示意图。
图2显示为本发明所述基于集成学习的眩晕诊断装置于一具体实施例中训练数据获取单元的结构示意图,
图3A显示为本发明所述基于集成学习的眩晕诊断装置于一具体实施例中集成学习模型生成单元的结构示意图。
图3B显示为本发明所述基于集成学习的眩晕诊断装置于一具体实施例中生成所述集成学习模型的流程图。
图4显示为本发明所述基于集成学习的眩晕诊断装置于一具体实施例中模型训练单元的结构示意图。
图5显示为本发明所述基于集成学习的眩晕诊断装置于一具体实施例中概率校准单元的结构示意图。
元件标号说明
1 眩晕诊断装置
11 眩晕信息获取模块
12 诊断模型获取模块
13 眩晕诊断模块
14 诊断模型构建模块
141 训练数据获取单元
1411 数据获取子单元
1412 特征提取子单元
142 模型训练单元
1421 超参数获取子单元
1422 模型训练子单元
143 概率校准单元
1431 预测区间划分子单元
1432 实际比率获取子单元
1433 预测概率获取子单元
1434 回归拟合子单元
1435 诊断模型生成子单元
144 集成学习模型生成单元
1441 数据分隔子单元
1442 第一生成子单元
1443 第二生成子单元
S31~S39 步骤
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,图示中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。此外,此外,在本文中,诸如“第一”、“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
临床上对耳源性眩晕的诊断往往需要影像学和神经电生理检查明确诊断,治疗往往需要联合耳鼻喉科、神经科、老年科、康复科、护理科等多个专科协作,治疗过程复杂且对医务人员的水平要求较高;尤其是对于基层医院来说,受到医疗水平和医疗设备的制约,基层医院很难对患者的耳源性眩晕进行合理的诊断。
针对这一问题,本发明提供一种基于集成学习的眩晕诊断装置。所述基于集成学习的眩晕诊断装置能够利用所述眩晕诊断模型对所述目标患者的眩晕信息进行处理,以获取目标患者的诊断结果,从而为医生提供辅助诊断工具。该过程基本无需人工参与,因此,对眩晕的诊断不受医务人员水平的限制且诊断过程简单。
请参阅图1A,于本发明的一实施例中,所述基于集成学习的眩晕诊断装置1包括眩晕信息获取模块11、诊断模型获取模块12和眩晕诊断模块13。
所述眩晕信息获取模块11用于获取目标患者的眩晕信息;其中,所述患者的眩晕信息包括患者的症状信息。具体地,所述症状信息例如为视物旋转、恶心、耳鸣等。
所述诊断模型获取模块12用于获取一基于集成学习的眩晕诊断模型。所述眩晕诊断模型由一诊断模型构建模块生成。其中,所述眩晕诊断模型可以包含于本发明所述基于集成学习的眩晕诊断装置1,此时,所述眩晕诊断模型由本地设备生成;所述眩晕诊断模块也可以包含于外部设备或服务器,此时,所述眩晕诊断模型由外部设备或服务器生成。具体地,请参阅图1B,所述诊断模型构建模块14包括训练数据获取单元141、模型训练单元142和概率校准单元143。
训练数据获取单元141,用于获取训练数据;所述训练数据包括一个或多个已确诊患者的历史诊断数据,其可以从患者的病历或医院数据库等途径获取,所述一个或多个已确诊患者是指与目标患者具有相同或相似眩晕信息的病人。
模型训练单元142,与所述训练数据获取单元相连,用于根据所述训练数据对一个或多个集成学习模型进行训练,以获取最优集成学习模型。其中,当所述集成学习模型的数量为一个时,对该集成学习模型训练完成以后即可得到所述最优集成学习模型。当所述集成学习模型的数量为两个或多个时,该两个或多个集成学习模型的超参数不同,所述模型训练单元142对各集成学习模型训练完成以后,选取平均预测准确率最高的一个集成学习模型作为所述最优集成学习模型。
概率校准单元143,与所述模型训练单元142相连,用于对所述最优集成学习模型进行概率校准,以获取所述眩晕诊断模型。
所述眩晕诊断模块13与所述眩晕信息获取模块11和所述诊断模型获取模块12相连,用于利用所述眩晕诊断模型对所述目标患者的眩晕信息进行处理,以获取目标患者的诊断结果。具体地,将所述目标患者的眩晕信息输入所述眩晕诊断模型,所述眩晕诊断模型的输出即为所述目标患者的诊断结果。可选地,所述目标患者的诊断结果包括目标患者的患病概率,所述患病概率包括各常见眩晕病的概率和其他病的概率。特别地,对于任意一种疾病,所述患者的患病概率可以为0~1之间的任意数值,用于定量表示患者患有该疾病的可能性;对于任一目标患者,所有患病概率加和为1。
根据以上描述可知,本实施例所述基于集成学习的眩晕诊断装置能够利用所述眩晕诊断模型对所述目标患者的眩晕信息进行处理,以获取目标患者的诊断结果,从而为医生提供辅助诊断工具。该过程基本无需人工参与,因此,对眩晕的诊断不受医务人员水平的限制且诊断过程简单。
此外,所述基于集成学习的眩晕诊断装置所采用的眩晕诊断模型为一经过概率校准的集成学习模型,该模型能够减少预测概率与实际患病概率之间的分布差异,因而在临床应用中具有更高的稳定性和可靠性。
于本发明的一实施例中,所述眩晕信息获取模块包括眩晕问卷生成单元和眩晕信息获取单元。
所述眩晕问卷生成单用于辅助所述目标患者输入问卷信息,即:所述目标患者可以根据所述眩晕问卷的提示输入所述问卷信息。具体地,所述目标患者可以通过网页、小程序等途径获取所述眩晕问卷生成单元生成的眩晕问卷,并根据所述眩晕问卷输入问卷信息。所述问卷信息例如为:发作时是否天旋地转或视物旋转、发作持续时间是多长、是否反复发作;所述发病时机子问卷用于辅助患者输入发病时机,例如为:是否在躺下或从坐位或卧位快速起身时发作、是否在失眠或休息不好后发作等;所述伴随症状子问卷用于辅助患者输入眩晕发作时的伴随症状,例如:发作时是否伴随头疼、病程中是否有波动性听力下降等;所述疾病史子问卷用于辅助患者输入患病史和/或家族遗传史,例如:是否有眼部疾病史、直系亲属是否有类似疾病史等;所述用药史子问卷用于辅助患者输入用药信息,例如:最近用过耳毒性药物、最近用过镇静药等。
所述眩晕信息获取单元用于收集并存储所述目标患者输入的问卷信息,并根据所述问卷信息生成所述目标患者的眩晕信息。其中,已确诊病例的眩晕信息将输入所述诊断模型构建模块用于生成所述训练数据,未确诊(待确诊)病例的眩晕信息将输入所述眩晕诊断模块进行处理并获得诊断结果。
请参阅图2,于本发明的一实施例中,所述训练数据获取单元141包括数据获取子单元1411和特征提取子单元1412。所述数据获取子单元1411用于获取一个或多个患者的历史诊断数据。所述特征提取子单元1412与所述数据获取子单元1411相连,用于对所述一个或多个患者的历史诊断数据进行变量重编码,以获取所述历史诊断数据的特征数据;所述特征数据即为所述训练数据。其中,所述变量重编码的方式可以采用现有技术实现,此处不做赘述。
于本发明的一实施例中,所述集成学习模型为一基于直方图算法的梯度提升模型;所述诊断模型构建模块还包括一集成学习模型生成单元,用于生成所述基于直方图算法的梯度提升模型。
可选地,请参阅图3A,所述集成学习模型生成单元144包括数据分隔子单元1441、第一生成子单元1442和第二生成子单元1443。
所述数据分隔子单元1441与所述特征提取子单元1412相连,用于采用直方图算法对所述特征数据进行分割,以获取k个离散箱,其中k为大于等于2的整数。具体地,所述数据分隔子单元将连续的特征数据离散化为k个整数,并构造一个宽度为k的直方图。在遍历数据的过程中,根据离散化后的值作为索引在直方图中累积统计量,当遍历一次数据后,直方图累积了需要的统计量,然后根据直方图的离散值,遍历寻找最优的分割点。通过此种方式能够减少系统的计算量。
所述第一生成子单元1442与所述数据分隔子单元1441相连,用于根据所述多个离散箱生成多个弱分类器。优选地,所述第一生成子单元1442采用leaf-wise策略进行决策树生成,在每次生成决策树时均遍历叶节点中的k个离散箱来寻找最优分割点,直到达到预设的树生成停止条件,此时,输出当前树作为一个弱分类器;此后,所述第一生成子单元1442根据该弱分类器的预测结果,调高预测错误的样本的权重,重复上述步骤继续生成弱分类器,直到达到预设的训练停止条件;通过上述过程,所述第一生成子单元1442能够获取多个弱分类器。
所述第二生成子单元1443与所述第一生成子单元1442相连,用于将所述多个弱分类器进行集成以获取一强分类器,所述强分类器即为所述集成学习模型。
具体地,请参阅图3B,显示为所述集成学习模型生成单元144生成所述集成学习模型的流程图,该过程具体包括:
S31,初始化样本权重为1。
S32,初始化树的根节点。
S33,采用直方图算法对训练数据进行分隔,以生成k个离散箱。
S34,按leaf-wise策略进行决策树生成。
S35,遍历叶节点中的k个离散箱以寻找最优分割点。
S36,判断是否达到预设的生成树停止条件:若是,则执行步骤S37;否则,跳转至步骤S34。
S37,判断是否达到预设的训练停止条件:若是,则执行步骤S39,否则,执行步骤S38。
S38,调高预测错误样本的权重,并跳转至步骤S32。
S39,将多个弱分类器进行集成,以形成一强分类器,该强分类器即为所述集成学习模型。
患者的眩晕信息中往往会包含高维数据和/或高噪声数据,特别是当所述患者的眩晕信息是由眩晕问卷得到时,其中包含大量的高维数据和高噪声数据,这些高维数据和/或高噪声数据会导致分类准确度的下降。针对这一问题,本实施例采用基于直方图算法的梯度提升模型作为所述集成学习模型,该模型能够有效处理所述目标患者的眩晕信息中所包含的高维数据和/或高噪声数据,较传统的Logistic模型等具有更高的分类准确度。
请参阅图4,于本发明的一实施例中,所述模型训练单元142包括超参数获取子单元1421和模型训练子单元1422。
所述超参数获取子单元1421用于获取至少两个备选超参数,并获取各备选超参数对应的平均预测准确度,进而从所述至少两个备选超参数中选取一最优超参数。
可选地,所述超参数获取子单元1421采用无放回抽取的方式从一预定义的超参数抽样空间内获取所述至少两个备选超参数。
所述模型训练子单元1422与所述训练数据获取单元141和所述超参数获取子单元1421相连,用于根据所述最优超参数和所述训练数据对所述集成学习模型进行训练,以获取所述最优集成学习模型。具体地,所述模型训练子单元1422根据每一备选超参数生成一备选集成学习模型,并获取各备选集成学习模型的平均预测准确度,作为各备选超参数对应的平均预测准确度。所述模型训练子单元1422根据各备选集成学习模型的平均预测准确度从中选取所述最优集成学习模型。优选地,所述模型训练子单元1422从各所述备选集成学习模型中选取平均预测准确度最高的一个模型作为所述最优集成学习模型。
可选地,对于任一备选超参数A,所述模型训练子单元1422采用有放回抽取的方式从所述训练数据中获取多组训练-验证集,并根据所述多组训练-验证集获取该备选超参数A对应的平均预测准确度。其中,每一组训练-验证集均包含一训练数据集和一验证数据集。具体地,所述模型训练子单元1422根据该备选超参数A生成一备选集成学习模型a,并获取该备选集成学习模型a在各组训练-验证集上的预测准确度,进而获取该备选集成学习模型a的平均预测准确度作为该备选超参数A对应的平均预测准确度。例如,对于一组训练-验证集Q,所述模型训练子单元1422利用Q的训练数据集对该备选集成学习模型a进行训练,且利用Q的验证数据集对训练完成后的该备选集成学习模型a进行验证,以获取该备选集成学习模型a在Q上的预测准确度。
请参阅图5,于本发明的一实施例中,所述概率校准单元143包括预测区间划分子单元1431、实际比率获取子单元1432、预测概率获取子单元1433、回归拟合子单元1434和诊断模型生成子单元1435。
所述预测区间划分子单元1431用于将所述训练数据的取值范围划分成若干个预测区间。可选地,所述预测区间划分子单元1431采用固定的步长(例如为0.1)将所述训练数据的取值范围划分成若干个预测区间。优选地,所述训练数据为一个或多个患者的历史诊断数据的特征数据。
所述实际比率获取子单元1432与所述预测区间划分子单元1431相连,用于获取各预测区间内患者的实际平均患病比率。其中,对于任一预测区间B,该预测区间B内患者的实际平均患病比率为:该预测区间B内患有眩晕疾病的患者人数与该预测区间B内总患者人数的比值。
所述预测概率获取子单元1433与所述预测区间划分子单元1431和所述模型训练单元142相连,用于根据所述最优集成学习模型获取各预测区间内患者的预测患病概率。具体地,所述预测概率获取子单元1433首先获取所述最优集成学习模型在所有训练数据上的预测概率(取值为0-1)作为原预测概率,进而获取各预测区间内原预测概率的平均值作为各预测区间内患者的预测患病概率。
回归拟合子单元1434与所述实际比率获取子单元1432和所述预测概率获取子单元1433相连,用于采用Sigmoid函数对所述实际平均患病比率和所述预测患病概率进行拟合,以获取一Sigmoid校准模型。具体地,所述回归拟合子单元1434以各预测区间内患者的预测患病概率作为解释变量,以各预测区间内患者的实际平均患病比率作为被解释变量,并将拟合过程中的函数形式配置为Sigmoid函数,基于此可以获取所述Sigmoid校准模型。
诊断模型生成子单元1435与所述模型训练单元142和所述回归拟合子单元1434相连,用于根据所述最优集成学习模型和所述Sigmoid校准模型获取所述眩晕诊断模型。具体地,所述诊断模型生成子单元1435将所述Sigmoid校准模型串联接在所述最优诊断模型之后,即可得到所述眩晕诊断模型。
于本发明的一实施例中,所述目标患者的诊断结果包括所述目标患者患有眩晕疾病的概率。
基于以上对所述基于集成学习的眩晕诊断装置的描述,本发明还提供一种眩晕诊断系统。所述眩晕诊断系统包括服务器和诊断设备。其中,所述服务器包括存储模块和本发明所述的诊断模型构建模块,所述存储器存储有训练数据,所述诊断模型构建模块与所述存储模块相连,用于根据所述训练数据生成所述眩晕诊断模型。所述诊断设备与所述服务器通信相连,包括本发明所述基于集成学习的眩晕诊断装置,用于利用所述眩晕诊断模型对目标患者进行诊断,以获取所述目标患者的诊断结果。
根据以上描述可知,本发明所述基于集成学习的眩晕诊断装置能够利用所述眩晕诊断模型对所述目标患者的眩晕信息进行处理,以获取目标患者的诊断结果,从而为医生提供辅助诊断工具。该过程基本无需人工参与,因此,对眩晕的诊断不受医务人员水平的限制且诊断过程简单。
此外,所述基于集成学习的眩晕诊断装置所采用的眩晕诊断模型为一经过概率校准的集成学习模型,该模型能够减少预测概率与实际患病概率之间的分布差异,因而在临床应用中具有更高的稳定性和可靠性。
并且,所述基于集成学习的眩晕诊断装置可以被配置为采用基于直方图算法的梯度提升模型作为所述集成学习模型,该模型能够有效处理所述目标患者的眩晕信息中所包含的高维数据和/或高噪声数据,较传统的Logistic模型等具有更高的分类准确度。
综上所述,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (10)

1.一种基于集成学习的眩晕诊断装置,其特征在于,所述基于集成学习的眩晕诊断装置包括:
眩晕信息获取模块,用于获取目标患者的眩晕信息;
诊断模型获取模块,用于获取一基于集成学习的眩晕诊断模型;
眩晕诊断模块,与所述眩晕信息获取模块和所述诊断模型获取模块相连,用于利用所述眩晕诊断模型对所述目标患者的眩晕信息进行处理,以获取目标患者的诊断结果;
其中,所述眩晕诊断模型由一诊断模型构建模块生成,所述诊断模型构建模块包括:
训练数据获取单元,用于获取训练数据;
模型训练单元,与所述训练数据获取单元相连,用于根据所述训练数据对一个或多个集成学习模型进行训练,以获取最优集成学习模型;
概率校准单元,与所述模型训练单元相连,用于对所述最优集成学习模型进行概率校准,以获取所述眩晕诊断模型。
2.根据权利要求1所述基于集成学习的眩晕诊断装置,其特征在于,所述训练数据获取单元包括:
数据获取子单元,用于获取一个或多个患者的历史诊断数据;
特征提取子单元,与所述数据获取子单元相连,用于对所述一个或多个患者的历史诊断数据进行变量重编码,以获取所述历史诊断数据的特征数据;所述特征数据即为所述训练数据。
3.根据权利要求2所述基于集成学习的眩晕诊断装置,其特征在于,所述集成学习模型为一基于直方图算法的梯度提升模型;所述诊断模型构建模块还包括一集成学习模型生成单元,用于生成所述基于直方图算法的梯度提升模型。
4.根据权利要求3所述基于集成学习的眩晕诊断装置,其特征在于,所述集成学习模型生成单元包括:
数据分隔子单元,与所述特征提取子单元相连,用于采用直方图算法对所述特征数据进行分割,以获取多个离散箱;
第一生成子单元,与所述数据分隔子单元相连,用于根据所述多个离散箱生成多个弱分类器;
第二生成子单元,与所述第一生成子单元相连,用于将所述多个弱分类器进行集成以获取一强分类器,所述强分类器即为所述集成学习模型。
5.根据权利要求1所述基于集成学习的眩晕诊断装置,其特征在于,所述模型训练单元包括:
超参数获取子单元,用于获取至少两个备选超参数,并获取各备选超参数对应的平均预测准确度,进而从所述至少两个备选超参数中选取一最优超参数;
模型训练子单元,与所述训练数据获取单元和所述超参数获取子单元相连,用于根据所述最优超参数和所述训练数据对所述集成学习模型进行训练,以获取所述最优集成学习模型。
6.根据权利要求5所述基于集成学习的眩晕诊断装置,其特征在于:所述超参数获取子单元采用无放回抽取的方式从一超参数抽样空间内获取所述至少两个备选超参数。
7.根据权利要求5所述基于集成学习的眩晕诊断装置,其特征在于:
对于任一备选超参数,所述模型训练子单元采用有放回抽取的方式从所述训练数据中获取多组训练-验证集,并根据所述多组训练-验证集获取该备选超参数对应的平均预测准确度;
所述模型训练子单元根据各备选超参数对应的平均预测准确度获取所述最优集成学习模型。
8.根据权利要求1所述基于集成学习的眩晕诊断装置,其特征在于,所述概率校准单元包括:
预测区间划分子单元,用于将所述训练数据的取值范围划分成若干个预测区间;
实际比率获取子单元,与所述预测区间划分子单元相连,用于获取各预测区间内患者的实际平均患病比率;
预测概率获取子单元,与所述预测区间划分子单元和所述模型训练单元相连,用于根据所述最优集成学习模型获取各预测区间内患者的预测患病概率;
回归拟合子单元,与所述实际比率获取子单元和所述预测概率获取子单元相连,用于采用Sigmoid函数对所述实际平均患病比率和所述预测患病概率进行拟合,以获取一Sigmoid校准模型;
诊断模型生成子单元,与所述模型训练单元和所述回归拟合子单元相连,用于根据所述最优集成学习模型和所述Sigmoid校准模型获取所述眩晕诊断模型。
9.根据权利要求1所述基于集成学习的眩晕诊断装置,其特征在于:所述目标患者的诊断结果包括所述目标患者患有眩晕疾病的概率。
10.一种眩晕诊断系统,其特征在于,所述眩晕诊断系统包括服务器和诊断设备,其中:
所述服务器包括:
存储模块,其上存储有训练数据;
权利要求1-9任一项所述的诊断模型构建模块,与所述存储模块相连,用于根据所述训练数据生成所述眩晕诊断模型;
所述诊断设备与所述服务器通信相连,包括权利要求1-9任一项所述基于集成学习的眩晕诊断装置,用于利用所述眩晕诊断模型对目标患者进行诊断,以获取所述目标患者的诊断结果。
CN202110138661.0A 2021-02-01 2021-02-01 一种基于集成学习的眩晕诊断装置及系统 Active CN113440101B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110138661.0A CN113440101B (zh) 2021-02-01 2021-02-01 一种基于集成学习的眩晕诊断装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110138661.0A CN113440101B (zh) 2021-02-01 2021-02-01 一种基于集成学习的眩晕诊断装置及系统

Publications (2)

Publication Number Publication Date
CN113440101A true CN113440101A (zh) 2021-09-28
CN113440101B CN113440101B (zh) 2023-06-23

Family

ID=77808880

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110138661.0A Active CN113440101B (zh) 2021-02-01 2021-02-01 一种基于集成学习的眩晕诊断装置及系统

Country Status (1)

Country Link
CN (1) CN113440101B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114708964A (zh) * 2022-06-06 2022-07-05 上海志听医疗科技有限公司 一种基于智能特征分类的眩晕症辅助分析统计方法及系统
CN115099355A (zh) * 2022-07-08 2022-09-23 中山大学孙逸仙纪念医院 一种基于XGBoost算法的眩晕病因诊断模型的构建方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6383150B1 (en) * 2001-07-02 2002-05-07 Vestent, L.P. Network-based system for diagnosing balance disorders
CN104143081A (zh) * 2014-07-07 2014-11-12 闻泰通讯股份有限公司 基于嘴部特征的笑脸识别系统及方法
US20180049663A1 (en) * 2014-06-17 2018-02-22 Seoul National University Hospital Apparatus for diagnosing and treating dizziness
CN111225612A (zh) * 2017-10-17 2020-06-02 萨蒂什·拉奥 基于机器学习的神经障碍识别和监测系统
CN112037908A (zh) * 2020-08-05 2020-12-04 复旦大学附属眼耳鼻喉科医院 一种耳源性眩晕诊疗装置、系统及大数据分析平台

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6383150B1 (en) * 2001-07-02 2002-05-07 Vestent, L.P. Network-based system for diagnosing balance disorders
US20180049663A1 (en) * 2014-06-17 2018-02-22 Seoul National University Hospital Apparatus for diagnosing and treating dizziness
CN104143081A (zh) * 2014-07-07 2014-11-12 闻泰通讯股份有限公司 基于嘴部特征的笑脸识别系统及方法
CN111225612A (zh) * 2017-10-17 2020-06-02 萨蒂什·拉奥 基于机器学习的神经障碍识别和监测系统
CN112037908A (zh) * 2020-08-05 2020-12-04 复旦大学附属眼耳鼻喉科医院 一种耳源性眩晕诊疗装置、系统及大数据分析平台

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114708964A (zh) * 2022-06-06 2022-07-05 上海志听医疗科技有限公司 一种基于智能特征分类的眩晕症辅助分析统计方法及系统
CN114708964B (zh) * 2022-06-06 2022-09-06 上海志听医疗科技有限公司 一种基于智能特征分类的眩晕症辅助分析统计方法及系统
CN115099355A (zh) * 2022-07-08 2022-09-23 中山大学孙逸仙纪念医院 一种基于XGBoost算法的眩晕病因诊断模型的构建方法及系统

Also Published As

Publication number Publication date
CN113440101B (zh) 2023-06-23

Similar Documents

Publication Publication Date Title
Pal et al. Fuzzy expert system approach for coronary artery disease screening using clinical parameters
CN111492437A (zh) 支持医学决策的方法和系统
EP3312748A1 (en) Method for aiding a diagnosis, program and apparatus
CN107785057B (zh) 医疗数据处理方法、装置、存储介质和计算机设备
KR20170061222A (ko) 건강데이터 패턴의 일반화를 통한 건강수치 예측 방법 및 그 장치
CN116364299B (zh) 一种基于异构信息网络的疾病诊疗路径聚类方法及系统
CN113440101A (zh) 一种基于集成学习的眩晕诊断装置及系统
CN112951362A (zh) 药物推荐方法、装置、设备及存储介质
WO2019172181A1 (ja) 診断支援装置、プログラム、学習済みモデル、および学習装置
CN112734746A (zh) 一种基于图像识别的骨科伤病谱匹配系统及方法
CN116597214A (zh) 基于多模态超图注意网络的阿尔茨海默症分类方法及系统
CN117423423B (zh) 一种基于卷积神经网络的健康档案整合方法、设备及介质
CN113409911B (zh) 一种基于病例临床表型关联度的中药组方推荐方法及系统
CN111540442A (zh) 基于计算机视觉的医学图像诊断调度管理系统
GB2555381A (en) Method for aiding a diagnosis, program and apparatus
JP7365747B1 (ja) 階層図ニューラルネットワークに基づく疾患診療過程異常識別システム
CN113223734A (zh) 基于算法、医学影像和大数据的疾病诊断和大健康管理平台
CN117809823A (zh) 一种基于特征分析的医疗方案推荐方法及装置
CN107066816B (zh) 基于临床数据的就医指导方法、装置及服务器
CN112802598A (zh) 基于语音诊疗数据的实时辅助诊疗方法及系统
Chattopadhyay et al. Fuzzy-logic-based screening and prediction of adult psychoses: A novel approach
US20230307133A1 (en) Method and system for generating a patient-specific clinical meta-pathway using machine learning
CN116843036A (zh) 面向阿尔兹海默症辅助诊断的个性化联邦学习方法
CN116798576A (zh) 一种基于深度学习的智能中医诊断系统
KR20180002229A (ko) 치매 정보 데이터베이스 구축을 위한 에이전트 장치 및 그 운영방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant