CN116524248B - 医学数据处理装置、方法及分类模型训练装置 - Google Patents

医学数据处理装置、方法及分类模型训练装置 Download PDF

Info

Publication number
CN116524248B
CN116524248B CN202310410604.2A CN202310410604A CN116524248B CN 116524248 B CN116524248 B CN 116524248B CN 202310410604 A CN202310410604 A CN 202310410604A CN 116524248 B CN116524248 B CN 116524248B
Authority
CN
China
Prior art keywords
data
liver disease
feature
target
liver
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310410604.2A
Other languages
English (en)
Other versions
CN116524248A (zh
Inventor
任鹏玲
尹红霞
王振常
赵新颜
胡艳军
牛宇翔
吕婷婷
骆敏
张友书
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yading Information Technology Co ltd
Beijing Friendship Hospital
Original Assignee
Beijing Yading Information Technology Co ltd
Beijing Friendship Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yading Information Technology Co ltd, Beijing Friendship Hospital filed Critical Beijing Yading Information Technology Co ltd
Priority to CN202310410604.2A priority Critical patent/CN116524248B/zh
Publication of CN116524248A publication Critical patent/CN116524248A/zh
Application granted granted Critical
Publication of CN116524248B publication Critical patent/CN116524248B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • G06V10/765Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects using rules for classification or partitioning the feature space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/809Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of classification results, e.g. where the classifiers operate on the same input data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本申请公开了医学数据处理装置、方法及分类模型训练装置。该装置中,第一获取模块获取不同模态的多个医学数据。第一处理模块对多个医学数据进行特征聚类处理,以得到目标特征数据,其中,目标特征数据为反映肝病的指标数据。第一确定模块基于目标特征数据、以及目标特征数据与肝病类型之间的预设映射关系,确定目标特征数据对应的多个待选肝病分类结果。第一融合模块对多个待选肝病分类结果进行融合,获得与多个医学数据相对应的目标分类结果。即将不同模态且相关性较高的多个医学数据聚合起来,确定多个待选肝病分类结果,并融合多个待选肝病分类结果以确定出目标分类结果,提高肝病类型的评估结果的准确性,辅助医生完成对肝病类型的评估。

Description

医学数据处理装置、方法及分类模型训练装置
技术领域
本申请属于数据处理技术领域,尤其涉及医学数据处理装置、方法及分类模型训练装置。
背景技术
随着人工智能、以及医疗大数据挖掘等技术的发展,人工智能技术在医疗保健领域中发挥越来越重要的作用,利用人工智能技术对医学数据进行处理,以辅助专家分析医学数据。然而,由于医疗领域的信息是庞大且繁杂的,信息的来源、模态与维度存在诸多的不同,不同种类的信息形成了一定的隔离,难以高效统一,无法直接对多模态的多个医学数据进行处理,目前传统的医学数据处理方法一般对单一来源数据进行分析处理。
然而,多来源数据既互补又重叠,能够从特定的角度为临床数据挖掘任务提供患者宏观层面和微观层面的信息,可以提高对肝病类型的评估准确性并辅助个性化医疗决策。因此,有待提出一种新的解决方案。
发明内容
有鉴于此,本申请提供一种解决或部分解决上述技术问题的医学数据处理装置、方法及分类模型训练装置。
第一方面,本申请实施例提供一种医学数据处理装置,该装置包括:
第一获取模块,用于获取不同模态的多个医学数据;
第一处理模块,用于对所述多个医学数据进行特征聚类处理,以得到目标特征数据,所述目标特征数据为反映肝病的指标数据;
第一确定模块,用于基于所述目标特征数据、以及所述目标特征数据与肝病类型之间的映射关系,确定所述目标特征数据对应的多个待选肝病分类结果;
第一融合模块,用于对所述多个待选肝病分类结果进行融合,获得与所述多个医学数据相对应的目标分类结果。
第二方面,本申请实施例提供一种医学数据处理,方法包括:
获取不同模态的多个医学数据;
对所述多个医学数据进行特征聚类处理,以得到目标特征数据,所述目标特征数据为反映肝病的指标数据;
基于所述目标特征数据、以及所述目标特征数据与肝病类型之间的映射关系,确定所述目标特征数据对应的多个待选肝病分类结果;
对所述多个待选肝病分类结果进行融合,获得与所述多个医学数据相对应的目标分类结果。
第三方面,本申请实施例提供一种分类模型的训练装置,包括:
第二获取模块,用于获取不同模态的多个医学数据样本、与所述多个医学数据样本对应的肝病分类结果样本;
第二提取模块,用于从所述多个医学数据样本中提取多个特征数据;
第二处理模块,用于对所述多个特征数据进行特征聚类处理,以得到目标特征数据,所述目标特征数据为反映肝病的指标数据;
第二确定模块,用于基于所述目标特征数据、以及预先标注的所述目标特征数据样本与肝病类型之间的映射关系,确定所述目标特征数据对应的多个待选肝病分类结果;
第二融合模块,用于对所述多个肝病分类结果进行融合,获得与所述多个医学数据相对应的目标分类结果;
第二生成模块,用于判断所述目标分类结果与所述多个医学数据样本对应的肝病分类结果样本的一致性,在所述目标分类结果与肝病分类结果样本的一致性大于或等于预设阈值时,则生成肝病分类模型。
第四方面,本申请实施例提供一种分类模型的训练方法,包括:
获取不同模态的多个医学数据样本、与所述多个医学数据样本对应的肝病分类结果样本;
从所述多个医学数据样本中提取多个特征数据;
对所述多个特征数据样本进行特征聚类处理,以得到目标特征数据,所述目标特征数据为反映肝病的指标数据;
基于所述目标特征数据、以及预先标注的所述目标特征数据与肝病类型之间的映射关系,确定所述目标特征数据对应的多个肝病分类结果;
对所述多个肝病分类结果进行融合,获得与所述多个医学数据相对应的目标分类结果;
判断所述目标分类结果与所述多个医学数据样本对应的肝病分类结果样本的一致性,在所述目标分类结果与肝病分类结果样本的一致性大于或等于预设阈值时,则生成肝病分类模型。
第五方面,本申请实施例提供一种电子设备,包括:存储器及处理器;其中,
存储器,用于存储程序;
处理器,与存储器耦合,用于执行存储器中存储的程序,以用于:
获取不同模态的多个医学数据:
对所述多个医学数据进行特征聚类处理,以得到目标特征数据,所述目标特征数据为反映肝病的指标数据;
基于所述目标特征数据、以及所述目标特征数据与肝病类型之间的映射关系,确定所述目标特征数据对应的多个待选肝病分类结果;
对所述多个待选肝病分类结果进行融合,获得与所述多个医学数据相对应的目标分类结果。
第六方面,本申请实施例提供一种计算机存储介质,用于储存计算机程序,计算机程序使计算机执行时实现如下方法:
获取不同模态的多个医学数据:
对所述多个医学数据进行特征聚类处理,以得到目标特征数据,所述目标特征数据为反映肝病的指标数据;
基于所述目标特征数据、以及所述目标特征数据与肝病类型之间的映射关系,确定所述目标特征数据对应的多个待选肝病分类结果;
对所述多个待选肝病分类结果进行融合,获得与所述多个医学数据相对应的目标分类结果。
本申请实施例提供的方案通过第一获取模块获取不同模态的多个医学数据。然后,第一处理模块对多个医学数据进行特征聚类处理,以得到目标特征数据,其中,目标特征数据为反映肝病的指标数据。接着,第一确定模块基于目标特征数据、以及目标特征数据与肝病类型之间的预设映射关系,确定目标特征数据对应的多个待选肝病分类结果。最后,第一融合模块对多个待选肝病分类结果进行融合,获得与多个医学数据相对应的目标分类结果。
本申请技术方案中,通过对不同模态的多个医学数据进行特征聚类,不仅可以打破不同模态数据之间的隔离,将不同模态且相关性较高的多个医学数据聚合起来,还可以选取出与肝病相关性较高的目标特征数据,以达到筛选指标数据的目的,从而提高医学数据处理速度。另外,通过选取出的目标特征数据、以及目标特征数据与肝病类型之间的预设映射关系,确定目标特征数据对应的多个待选肝病分类结果,并融合多个待选肝病分类结果以确定出目标分类结果,可以降低分类结果的误差,准确地识别出与多个医学数据相对应的肝病类型,提高了肝病类型的评估结果的准确性,辅助医生完成对肝病类型的评估。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本申请实施例提供的一种医学数据处理装置的结构示意图;
图2为本申请实施例提供的一种医学数据处理方法的流程示意图;
图3为本申请实施例提供的一种医学数据处理方法的应用示意图;
图4为本申请实施例提供的一种分类模型训练装置的结构示意图;
图5为本申请实施例提供的一种分类模型训练方法的流程示意图;
图6为本申请实施例提供的电子设备的结构示意图。
具体实施方式
在介绍本申请各实施例提供的技术方案之前,先对本文中涉及到专有名词进行简单的介绍。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本申请实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种,但是不排除包含至少一种的情况。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。
下面结合附图对本申请的一些实施方式作详细说明。在各实施例之间不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。另外,下述各方法实施例中的步骤时序仅为一种举例,而非严格限定。
肝脏疾病是从炎症到肿瘤的广泛病理学,已成为全世界的主要健康问题。对肝病进行快速分类对于人类专家来说可能是一项复杂的任务,并且需要依赖专家的医学经验。
目前,专家对单一数据源进行分析以快速确定肝病类型,但是基于单一数据源来预测肝病类型的效能往往不理想,并且无法确保预测结果地准确性。然而,由于医疗领域的信息是庞大且繁杂的,信息的来源、模态与维度存在诸多的不同,不同种类的信息形成了一定的隔离,难以高效统一,无法直接对多模态的多个医学数据进行处理,目前传统的医学数据处理方法一般对单一来源数据进行分析处理。
然而,多来源数据既互补又重叠,能够从特定的角度为临床数据挖掘任务提供患者宏观层面和微观层面的信息,可以提高对肝病类型的评估准确性并辅助个性化医疗决策。因此,有待提出一种解决多模态医学数据处理问题的解决方案。在对肝病类型进行预测时,增加多种维度数据,从不同维度反应与肝病类型的相关性,并且将多种维度信息融合起来共同预测肝病类型,希望得到1+1>2的效果。
本申请实施例提供的技术方案的执行主体可以是一个装置也可以是多个装置。所述装置可以包括但不限于:集成在智能手机、平板电脑、PDA(Personal DigitalAssistant,个人数字助理)、智能电视、膝上型便携计算机、台式计算机、智能穿戴设备、医疗设备等任意终端设备上的装置。所述装置包括用于获取不同模态的多个医学数据(如下文介绍的实验室检查数据、病史信息、体格检查数据、影像数据、药物治疗数据、手术治疗数据、放化疗数据等)的第一获取模块、以及用于处理上述多个医学数据的第一处理模块、第一确定模块、以及第一融合模块。所述装置的多个模块可以集成在同一设备中,也可以分别集成在不同设备中,本申请实施例并不限定。可选地,所述装置还包括显示模块,用于展示所述装置的处理结果,例如终端设备中的屏幕显示目标分类结果。
实际应用中,所述装置的第一获取模块可以与不同数据采集设备通信,从而通过通信连接接收这些数据采集设备各自获取到的不同模态的医学数据。其中,不同数据采集设备中集成有不同功能的传感器。也可以直接通过与医院的病例系统获取患者的匿名化处理后的多种模态的医学数据。
例如,集成在核磁检测设备中的超声传感器,该核磁检测设备设置于目标评估对象侧。该核磁数据检测设备例如实现为集成有超声传感器的CT扫描检查装置,该CT扫描检查装置与集成第一获取模块的装置相连。当然,为适应多种应用场景,该CT扫描检查装置与所述装置的连接方式可以是有线连接,也可以是无线连接,例如WiFi、5G、4G、蓝牙等。
另一实施例中,第一获取模块、第一处理模块、第一确定模块、第一融合模块、以及数据采集设备可以集成在同一系统中,例如第一获取模块、第一处理模块、第一确定模块、第一融合模块、以及数据采集设备可以集成在肝病类型评估系统中。进而,在肝病类型评估系统中直接展示处理结果,例如发出用于表示肝病类型的目标分类结果的语音信息、或者显示肝病类型的目标分类结果。或者,由该肝病类型评估系统将处理结果发送至终端设备,并由终端设备对处理结果进行展示。
实际上,所述装置的硬件结构可以根据具体应用场景进行设置,本申请实施例中仅为示例,具体设置并不限定。
应当注意的是,无论执行主体实现为哪一种硬件结构,执行主体的核心意图都是:
获取不同模态的多个医学数据:对多个医学数据进行特征聚类处理,以得到目标特征数据,其中目标特征数据为反映肝病的指标数据;基于目标特征数据、以及目标特征数据与肝病类型之间的映射关系,确定目标特征数据对应的多个待选肝病分类结果;对多个待选肝病分类结果进行融合,获得与多个医学数据相对应的目标分类结果,以更加准确地区分各种肝病类型,提高肝病类型评估结果的准确性,辅助医生完成检查。
下面结合具体实施例介绍技术方案的具体实施方式。
如图1为本申请实施例提供的一种医学数据处理装置的结构示意图。从图1中可以看到,所述装置包括如下模块:
第一获取模块101,用于获取不同模态的多个医学数据。
第一处理模块102,用于对多个医学数据进行特征聚类处理,以得到目标特征数据,目标特征数据为反映肝病的指标数据。
第一确定模块103,用于基于目标特征数据、以及目标特征数据与肝病类型之间的映射关系,确定目标特征数据对应的多个待选肝病分类结果。
第一融合模块104,用于对多个待选肝病分类结果进行融合,获得与多个医学数据相对应的目标分类结果。
本实施例提供的医学数据处理装置可以对获取到的不同模态的多个医学数据进行分析处理,以获得精准的肝病分类结果。其中,将肝病类型可以分类为脂肪肝、肝硬化、乙肝、药物性肝炎、肝癌、无肝病。
具体的,该装置在对肝病分类结果进行预测时,首先第一获取模块101获取不同模态的多个医学数据。其中,本申请实施例中,医学数据主要用于反映评估目标的生理指标。比如医学数据可以是不同类型的生理指标数据,例如多个医学数据包括以下至少之一:实验室检查数据、病史信息、体格检查数据、影像数据、药物治疗数据、手术治疗数据、放化疗数据。并且,实验室检查数据可以包括血常规数据、肝功能检查数据、肿瘤标志物数据、乙肝、丙肝等。病史信息可以包括现病史、既往史、家族史等。影像数据包括CT图像、核磁共振图像(MRI图像)、超声图像等。这些数据可以为肝病分类结果的预测提供基础。
可选地,这些生理指标数据可以来自于历史评估数据,例如预先录入的,也可以实时检测得到的,例如对评估目标进行检测。比如,采用血压计测量血压,采用智能移动设备采集心率、体温、血氧饱和度,采用CT扫描仪采集CT图像等。
接着,第一处理模块对多个医学数据进行特征聚类处理,以得到目标特征数据。特征聚类是将具有较大依赖关系(冗余度高)的特征数据聚集到一起,根据特征与特征之间相关性及特征与特征簇之间的相关性将特征集划分成多个簇群。由于待处理的医学数据种类以及个数很多,在数据规模较大、难以通过一次操作完成全部数据归档的情况下,可以根据各个数据与各个肝病类型之间的关系,对原始的多个医学数据进行分割,以使得相似性较高的医学数据聚类在一起,并基于特征聚类结果,确定最优的目标特征数据。
其中,目标特征数据为反映肝病的指标数据,并且目标特征数据包括至少一种特征数据,也就是说目标特征数据可以为表示为反映肝病的特征数据集。通过这种特征聚类获取到的目标特征数据的方式可以打破不同模态数据之间的隔离,更好地将相关性较高的不同模态医学数据聚合起来,并且这样确定出的目标特征数据可以更好地反映与各个肝病类型之间的关系。
在对多个医学数据进行特征聚类处理时,可以基于特征重要性对多种医学数据与各个肝病类型的相关性进行排序;根据排序结果筛选出与预设肝病类型最相关的特征数据作为目标特征数据。其中,特征重要性是用于衡量每一输入特征对预测结果贡献的指标参数。通过特征重要性度量能提升筛选出的目标特征数据的准确性。
通过上述步骤可以对多种医学数据进行特征聚类之后,得到更高效可靠的目标特征数据。并且,针对不同肝病类型采集到的医学数据进行特征聚类,以选取目标特征数据,可以进一步融合更多不同类型的生理特征数据,以进一步提高各种肝病分类结果的预测准确性,提高肝功能以及肝病分类评估结果的准确性,辅助医生完成检查。
接着,第一确定模块103基于目标特征数据、以及目标特征数据与肝病类型之间的预设映射关系,确定目标特征数据对应的多个待选肝病分类结果。具体的,预先构建多个各个特征数据与肝病类型之间的映射关系,基于上述筛选出的目标特征数据,利用预先构建的多个各个特征数据与肝病类型之间的映射关系,分别得到多个待选肝病分类结果。为了提高预测结果的准确性,可以采用相同的方法预先多次构建各个特征数据与肝病类型之间的映射关系,分别利用各个预设映射关系,确定目标特征数据所对应的多个待选肝病分类结果。
最后,第一融合模块104对多个待选肝病分类结果进行融合,获得与多个医学数据相对应的目标分类结果。其中,目标分类结果是融合多个待选肝病分类结果后获得的最终肝病分类结果。那么,在得到多个待选肝病分类结果之后,对这些待选肝病分类结果进行融合,根据融合结果,确定最终的目标分类结果,这样获得的目标分类结果更加准确,可以有效提高肝病分类结果的准确性。
进一步地,该装置还可以包括显示模块,具体的可以向终端用户展示目标分类结果,以提示使用者获取到当前评估目标所对应的肝病类型。
本实施例,通过对不同模态的多个医学数据进行特征聚类,不仅可以打破不同模态数据之间的隔离,将不同模态且相关性较高的多个医学数据聚合起来,还可以选取出与肝病相关性较高的目标特征数据,以达到筛选指标数据的目的,从而提高医学数据处理速度。另外,通过选取出的目标特征数据、以及目标特征数据与肝病类型之间的预设映射关系,确定目标特征数据对应的多个待选肝病分类结果,并融合多个待选肝病分类结果以确定出目标分类结果,在确定待选肝病分类结果时融合了多种模态的医学数据,可以使得多个待选肝病分类结果更准确,并结合多个待选肝病分类结果确定目标分类结果,这样不仅实现了对多模态的医学数据的处理,并且目标分类结果是基于多模态医学数据确定的,同时还可以降低分类结果的误差,准确地识别出与多个医学数据相对应的肝病类型,提高了肝病类型的评估结果的准确性,辅助医生完成对肝病类型的判断。
在实际应用中,每个患者对应有不同模态的多个医学数据,由于患者的医学数据较多,若在对不同模态数据进行分析处理时,对每一个医学数据都进行分析处理,将使得整个医学数据处理过程十分复杂且数据处理效率较低,并且医学数据中的很多指标数据与预测肝病分类结果的相关性较低,那么对这些医学数据进行处理,不仅浪费大量的资源,而且这样将会影响筛选出的聚类后的目标特征数据可靠性,从而影响最终的分类结果的准确性。因此,在一可选实施例中,在获取到不同模态的多个医学数据之后,先从该多个医学数据进行特征提取处理,获得多个特征数据,再对多个特征数据进行特征聚类处理。
在一可选实施例中,特征提取的具体实现方式可以为:多个医学数据中提取出反映肝病发生可能性的特征数据。例如,获取到的多个医学数据包括实验室检查数据、体格检查数据、影像数据。其中,实验室检查数据包括:血常规数据、肝功能检查数据、肿瘤标志物数据,影像数据包括:CT图像、MRI图像、超声图像。第一处理模块从多个医学数据中提取多个特征数据时,具体用于:基于血常规数据提取对应的红细胞计数、血红蛋白、白细胞、白细胞分类计数及血小板转氨酶。基于肝功能检查数据提取对应的总蛋白、白蛋白、球蛋白以及胆红素。基于肿瘤标志物数据提取对应的胚胎抗原、糖类标志物。基于体格检查数据提取对应的心率、体温、收缩压、舒张压、平均动脉压、呼吸率、血氧饱和度和葡萄糖。基于CT数据提取对应的病变区域。基于MRI数据提取对应的感兴趣区域的灰度特征、纹理特征、形状特征。基于超声图像提取血管弹性等特征。提取出的这些特征数据可以更好地反映与各个肝病类型之间的关系,不仅起到筛选数据的目的,还可以提高特征聚类效果,以获得更优的目标特征数据。
然而,提取到的这些特征数据可能出现数据缺失以及数据明显异常等情况,那么基于这些异常数据或者缺失数据进行数据分析,可能会影响后续预测出的目标分类结果。因此,在对特征数据进行分析处理时,可以先对这些数据进行清洗,以剔除缺失数据以及存在明显异常的医学数据。
由于本实施例中的提取到的多个特征数据可能所对应的数据类型不同,那么在对数据进行清洗处理时,可以采用不同的方法。对于连续数值型数据,例如血常规数据、肝功能检查数据、肿瘤标志物数据、体格检查数据等可以先进行异常值处理,若某类数据存在多个记录值,仅保留最新的记录值,通过数字异常值方法对最新记录值中的特征数据处理,以筛选出特征数据中的异常值。然后,检测是否存在数据缺失情况,若某个临床变量一个观测值都没有,则利用该类数据的样本总体均值进行补全。最后,采用最小最大放缩方法(Min-max Scalar)进行归一化处理。其中,数字异常值方法可以为四分位距方法(inter-quartilerange,简称IQR),根据特征数据,计算四分位间距,将四分位间距上下限以外的值视为异常值,去掉所有四分位间距上下限之外的值。
对于分类型数据,例如乙肝、丙肝、现病史、既往史、家族史、器质性病变等信息,获取到的这些数据通过记载有是否有乙肝、丙肝,现病史、既往史、家族史、器质性病变等信息中是否有相关肝病,因此对于这类数据可以采取0、1进行二值编码。对于空缺数据,可以利用该类数据的样本总体均值进行补全。
对于编码类型数据,例如药物治疗数据、手术治疗数据、放化疗数据等,这类数据通常采用统一规定的编码进行记录相关数据,由于编码型数据中的有些数据编码较长,可以将编码型数据只保留小数点后两位,例如肝动脉插管术数据的ICD-9编码为38.91002,预处理后为38.91。
对于图像数据,例如CT图像、核磁共振(MRI)图像、超声图像等,首先进行标准化处理,消除不必要的混杂变异因素,接着对感兴趣区域进行二维或三维分割处理,其中分割方法可以为手动、半自动、自动等分割方式。例如,对于肝脏CT图像和MRI图像中的感兴趣区域ROI的分割,可以依靠医生的手动完成分割,主要观察肝的大小、形态、轮廓及密度(信号)有无改变,有无局灶性病变(病灶的部位、大小、形态、边界是否清楚、信号密度是否均匀等)。
其中,肝脏CT扫描包括平扫和增强扫描,平扫图像的局部病灶呈现低密度影;增强后,动脉期图像的病灶区相对正常区域信号较强,静脉期图像的病灶区相对正常区域信号没有太大改变。具体的,可以根据信号强度,对CT图像的平扫图像和增强图像的病灶区进行分割。多参数肝脏MRI包括三个图像序列,T1WI、T2WI和DWI,其中T1WI图像包括平扫和增强图像,病灶区在平扫MRI图像的T1WI序列图像中呈略低信号,增强后T1WI序列图像中病灶区信号增强;T2WI序列图像中病灶区呈高信号,DWI序列图像中病灶区可能呈现高信号。具体的,可以根据信号强度,对MRI图像的平扫图像和增强图像的病灶区都进行分割。
在获取到预处理后的多个特征数据之后,对该多个特征数据进行特征聚类处理,以获得目标特征数据。其中,在对特征进行聚类处理时,可以采用模糊聚类算法,对多个特征数据进行特征聚类,其具体的实现过程可以如下步骤:从多个医学数据中提取多个特征数据;利用模糊聚类算法,对多个特征数据进行特征聚类处理,以获得聚类结果;根据聚类结果,确定目标特征数据。当聚类涉及到事物之间的模糊界线时,需要运用模糊聚类分析方法,对多个特征数据进行分析,以寻找到最优的目标特征数据。
由于肝病类型的确定比较复杂,很多种医学数据都或多或少对肝病类型的确定起着一定的作用,一种数据可能同时会对多种肝病类型都存在一定的影响,并且目标评估个体的差异性等原因,那么在确定反映肝病的指标数据时可以采用模糊聚类方法来确定目标特征数据。其中,模糊聚类是指一种典型的无监督学习算法,主要用于将相似的数据自动归到一个类别中。
在一可选实施例中,可以利用模糊逻辑神经元网络学习方法对多个特征数据进行特征聚类,以求出各个特征数据支持肝病、非肝病的特征向量,并将具有相似特征的特征矢量归为一类,不同类之间的特征矢量差别较大。当对各个特征数据完成聚类之后,根据聚类结果,确定出反映肝病的目标特征数据。其中,基于模糊逻辑神经元网络的聚类算法,主要利用模糊逻辑算子来完成网络计算,通过竞争学习得到网络输出和期望输出的差值,然后再通过调整参数来减小差值。每次学习将有一个结点的网络参数得到调整,通过调整来逐次减小误差,整个聚类过程是由这些学习过程反复进行完成的,该算法大大改善了聚类有效性。
在确定出目标特征数据之后,第一确定模块103基于目标特征数据、以及目标特征数据与肝病类型之间的预设映射关系,确定目标特征数据对应的多个待选肝病分类结果。在一可选实施例中,可以利用BP神经网络构建各个特征数据与肝病类型之间的映射关系,获得各个特征数据所对应的分类决策结果。其中,BP神经网络是一种按照误差逆向传播算法训练的多层前馈神经网络。
在一可选实施例中,第一确定模块103基于目标特征数据、以及目标特征数据与肝病类型之间的预设映射关系,确定目标特征数据对应的多个待选肝病分类结果时,具体用于:分别将目标特征数据输入至预先训练的多个BP神经网络模型,以利用BP神经网络模型获得与目标特征数据对应的待选肝病分类结果,其中,BP神经网络模型被训练为用于确定待选肝病分类结果。
其中,在对BP神经网络模型进行训练之前,获取多个目标特征数据样本,并为目标特征数据样本标注相应的分类标签,可以基于多个目标特征数据样本对BP神经网络模型进行训练,以获得训练好的BP神经网络模型。
本实施例中,通过训练好的BP神经网络模型对目标特征数据进行分析处理,获得与目标特征数据相对应的待选肝病分类结果,不仅有效地保证了待选肝病分类结果获取的准确可靠性,并且也保证了基于目标特征数据来获得待选肝病分类结果的质量和效率,进一步提高了该方法使用的稳定可靠性。
由于单一的BP神经网络很容易进行局部极小点,导致预测准确度较低,因此,在本实施例中,为了降低预测分类结果的误差,同时利用多个BP神经网络模型对目标特征数据处理,以获得多个待选肝病分类结果。
接着,第一确定模块103在获取到多个待选肝病分类结果之后,第一融合模块104对多个待选肝病分类结果进行融合,获得与多个医学数据相对应的目标分类结果。在对多个待选肝病分类结果进行融合处理时,可以采用DS证据理论,对多个待选肝病分类结果进行融合,获得融合后的目标分类结果。其中,DS证据理论具有处理不确定信息的能力,D-S证据理论是将证据集划分称两个或两个以上的不相关部分,利用它们对识别框架独立进行判断,然后用组合规则将其组合起来,并结合信度函数和证据间的支持度原则进行修正。那么,在对多个待选肝病分类结果进行特征融合时,将BP神经网络模型的输出结果待选肝病分类结果作为证据信息输入基本概率指派BPA,根据DS组合规则对多个待选肝病分类结果进行融合,确定融合结果,并根据融合结果,预测评估目标所对应的肝病类型。
在一可选实施例中,第一融合模块104基于DS证据理论,对多个待选肝病分类结果进行融合,获得融合后的目标分类结果,具体还用于:基于多个待选肝病分类结果,确定与各个待选肝病分类结果相对应的基本概率指派;根据DS证据理论合成规则,对基本概率指派进行合成,获得合成后的基本概率指派;基于信度函数和多个待选肝病分类结果之间的支持度原则,对合成后的基本概率指派进行修正,获得修正后的肝病分类结果;根据修正后的肝病分类结果,确定多个医学数据所对应的目标分类结果。
具体的,利用DS证据理论进行特征融合过程如下:
设多个证据E1,E2,…En在同一识别框架Θ下,这些证据的基本概率指派(basicprobability assignment,BPA)分别为m1,m2,…mn,D-S组合规则为
基于上述公式构造基本概率指派函数,将BP神经网络的softmax的输出转为D-S证据理论模型,计算公式为:
不确定性描述的计算公式为:
其中,Ai为目标分类结果(脂肪肝、肝硬化、乙肝、药物性肝炎、肝癌和无肝病);y(Ai)为BP神经网络的肝病分类结果;Ek为网络的样本误差。
本实施例中,通过模糊聚合算法对不同模态的多个特征数据进行特征聚类,打破了不同模态特征数据之间的隔离,将其聚合起来,并根据聚合结果确定目标特征数据。而后,将目标特征数据分别输入至多个预先训练好的BP神经网络模型,获得多个待选肝病分类结果,以降低预测误差;并利用DS证据理论对多个待选肝病分类结果进行特征融合,以获得目标分类结果,利用多源异构的信息来进行完成肝病分类预测,提高了肝病分类结果的准确性。
如图2为本申请实施例提供的一种医学数据处理方法的流程示意图。具体包括如下步骤:
201、获取不同模态的多个医学数据。
202、对多个医学数据进行特征聚类处理,以得到目标特征数据,目标特征数据为反映肝病的指标数据。
203、基于目标特征数据、以及目标特征数据与肝病类型之间的映射关系,确定目标特征数据对应的多个待选肝病分类结果。
204、对多个待选肝病分类结果进行融合,获得与多个医学数据相对应的目标分类结果。
本实施例提供的医学数据处理方法可以对多模态医学数据进行处理,并基于处理后的多模态医学数据,确定评估目标所对应的目标分类结果。在对医学数据进行处理时,首先获取不同模态的多个医学数据。其中,多个医学数据可以包括以下至少之一:实验室检查数据、病史信息、体格检查数据、影像数据、药物治疗数据、手术治疗数据、放化疗数据。其中,实验室检查数据可以包括:血常规数据、肝功能检查数据、肿瘤标志物数据,影像数据包括:CT图像、核磁共振图像、超声图像。
可选地,在对多个医学数据进行分析处理之前,该方法还可以包括特征提取过程,从多个医学数据中提取多个特征数据。其中,基于血常规数据提取对应的红细胞计数、血红蛋白、白细胞、白细胞分类计数及血小板转氨酶;基于肝功能检查数据提取对应的总蛋白、白蛋白、球蛋白以及胆红素;基于肿瘤标志物数据提取对应的胚胎抗原、糖类标志物;基于体格检查数据提取对应的心率、体温、收缩压、舒张压、平均动脉压、呼吸率、血氧饱和度和葡萄糖;基于CT图像提取对应的病变区域;基于核磁共振图像提取对应的感兴趣区域的灰度特征、纹理特征、形状特征;基于超声弹性成像仪提取血管弹性等特征。
接着,在提取出多个特征数据之后,利用模糊聚类算法,对多个特征数据进行特征聚类处理,以获得聚类结果;根据聚类结果,确定目标特征数据而后,基于目标特征数据、以及目标特征数据与肝病类型之间的映射关系,确定目标特征数据对应的多个待选肝病分类结果。
可选地,基于目标特征数据、以及目标特征数据与肝病类型之间的映射关系,确定目标特征数据对应的多个待选肝病分类结果的具体实现方式可以包括:分别将目标特征数据输入至预先训练的多个BP神经网络模型,以利用BP神经网络模型获得与目标特征数据对应的待选肝病分类结果,其中,BP神经网络模型被训练为用于确定待选肝病分类结果。
而后,对多个待选肝病分类结果进行融合,获得与多个医学数据相对应的目标分类结果。其中,对评估目标进行目标分类结果预测时,融合了更多的特征数据,即利用多源异构的信息,充分挖掘多维信息,并融合了多个待选肝病分类结果,提高了目标分类结果的准确性。
在一可选实施例中,对多个待选肝病分类结果进行融合,获得与多个医学数据相对应的目标分类结果的具体实现方式可以为:基于DS证据理论,对多个待选肝病分类结果进行融合,获得融合后的目标分类结果。
具体的,基于DS证据理论,对多个待选肝病分类结果进行融合,获得融合后的目标分类结果可以包括:基于多个待选肝病分类结果,确定与各个待选肝病分类结果相对应的基本概率指派;根据DS证据理论合成规则,对基本概率指派进行合成,获得合成后的基本概率指派;基于信度函数和多个待选肝病分类结果之间的支持度原则,对合成后的基本概率指派进行修正,获得修正后的肝病分类结果;根据修正后的肝病分类结果,确定多个医学数据所对应的目标分类结果。
本实施例中,通过获取不同模态的多个医学数据,对多个医学数据进行特征聚类处理,以得到目标特征数据,目标特征数据为反映肝病的指标数据。基于目标特征数据、以及目标特征数据与肝病类型之间的映射关系,确定目标特征数据对应的多个待选肝病分类结果,对多个待选肝病分类结果进行融合,获得与多个医学数据相对应的目标分类结果。即充分挖掘多维信息,基于更多的特征数据以及多个待选肝病分类结果,获得最终的目标分类结果,提高了目标分类结果的准确性。
值得说明的是,医学数据处理方法与图1提供的医学数据处理装置的实施方式类似,相似之处参见上文,此处不展开。
为了便于理解上述方法,结合图3对具体实现方式进行示例性说明。具体应用时,获取评估目标的多个医学数据,其中多个医学数据可以包括实验室检查数据(血常规、肝脏生化、肿瘤标志物、乙肝、丙肝)、病史(现病史、既往史、家族史)、体格检查、药物治疗、手术治疗、放化疗,及影像数据(CT、MRI、超声)。选取反映肝病(脂肪肝、肝硬化、乙肝、药物性肝炎、肝癌)发生可能性的多类指标,并收集各种指标下对应肝病是否发生的取值。
具体的,从多个医学数据中提取多个特征数据。具体来说,基于血常规数据提取:红细胞计数(RBC)、血红蛋白(Hb)、白细胞(WBC)、白细胞分类计数及血小板(PLT)转氨酶等5类特征。基于肝功能检查提取总蛋白、白蛋白、球蛋白以及胆红素等4类特征。基于肿瘤标志物提取AFP,A199、CA125等3类特征。基于体格检查提取心率、体温、收缩压(SysBP)、舒张压(DiasBP)、平均动脉压(MeanBP)、呼吸率(RespRate)、血氧饱和度(SpO2)和葡萄糖等8类特征。基于CT数据自动提取病变区域大小等特征。基于MRI数据自动提取感兴趣区的灰度、纹理、形状等特征。基于超声弹性成像仪自动提取血管弹性等特征。
在提取出多个特征数据之后,对多个特征数据进行预处理。对于所有类型的数据,首先进行数据清洗,剔除数据缺失过多或数据明显异常的患者记录。具体的,对于连续数值型数据,首先进行异常值处理。通过数字异常值(numericoutlier)方法筛选数据中的异常值,IQR(inter-quartilerange)可计算得到四分位间距,将四分位间距上下限以外的值视为异常值,去掉所有四分位间距上下限之外的值。若某类数据存在多个记录值,仅保留最新的记录值。若某个特征数据一个观测值都没有,则利用该类数据的样本总体均值进行补全。最后,采用最小最大放缩方法(Min-max Scalar)进行归一化处理。对于分类型数据采取0、1进行二值编码。对于编码型数据只保留小数点后两位,例如手术治疗数据使用ICD-9拓展编码来表示,如肝动脉插管术数据的ICD-9编码为38.91002,预处理后为38.91。对于图像数据,首先进行标准化处理,消除不必要的混杂变异因素,接着对感兴趣区域进行二维或三维分割,分割方法包括手动、半自动、自动三种分割方式。
然后,利用模糊逻辑神经元聚类网络学习法求取各个特征数据类型支持肝病、非肝病的特征向量,并对多个特征向量进行聚类,得到基于模糊聚类法的肝病、非肝病的特征聚类结果。并根据特征聚类结果提取目标特征数据。利用BP神经网络构建各个特征数据与肝病类型之间的映射关系,得出每一种特征数据所对应的分类决策结果,以获得预先训练的BP神经网络模型。
为了降低BP神经网络模型预测结果的误差,利用上述方法训练生成6个BP神经网络模型。将提取出的目标特征数据分别输入至6个神经网络模型,获得各自对应的待选肝病分类结果。
将6个BP神经网络得到的分类结果,按照D-S证据理论合成规则,融合6个分类信息,得到最终的肝病分类结果。特征融合诊断时,将BP神经网络的输出结果作为证据信息输入BPA,根据DS组合规则进行融合。根据融合结果,预测评估目标的目标分类结果。
图4为本申请实施例提供的一种分类模型训练装置的结构示意图。如图4所示,装置包括:第二获取模块41、第二提取模块42、第二处理模块43、第二确定模块44、第二融合模块45、第二生成模块46;其中,
第二获取模块41,用于获取不同模态的多个医学数据样本、与所述多个医学数据样本对应的肝病分类结果样本。
第二提取模块42,用于从所述多个医学数据样本中提取多个特征数据。
第二处理模块43,用于对所述多个特征数据进行特征聚类处理,以得到目标特征数据,所述目标特征数据为反映肝病的指标数据。
第二确定模块44,用于基于所述目标特征数据、以及预先标注的所述目标特征数据样本与肝病类型之间的映射关系,确定所述目标特征数据对应的多个待选肝病分类结果。
第二融合模块45,用于对所述多个肝病分类结果进行融合,获得与所述多个医学数据相对应的目标分类结果。
第二生成模块46,用于判断所述目标分类结果与所述多个医学数据样本对应的肝病分类结果样本的一致性,在所述目标分类结果与肝病分类结果样本的一致性大于或等于预设阈值时,则生成肝病分类模型。
值得说明的是,上述装置训练得到的分类模型的实现原理,相似之处可以参见上文,此处不展开。
图5为本申请实施例提供的一种分类模型训练方法的流程示意图。如图5所示,方法包括:
501、获取不同模态的多个医学数据样本、与多个医学数据样本对应的肝病分类结果样本。
502、从多个医学数据样本中提取多个特征数据。
503、对多个特征数据样本进行特征聚类处理,以得到目标特征数据,目标特征数据为反映肝病的指标数据。
504、基于目标特征数据、以及预先标注的所述目标特征数据与肝病类型之间的映射关系,确定目标特征数据对应的多个肝病分类结果。
505、对多个肝病分类结果进行融合,获得与多个医学数据相对应的目标分类结果。
506、判断目标分类结果与多个医学数据样本对应的肝病分类结果样本的一致性,在目标分类结果与肝病分类结果样本的一致性大于或等于预设阈值时,则生成肝病分类模型。
值得说明的是,上述方法训练得到的分类模型的实现原理相似部分可以参见上文,此处不展开。
图6为本申请实施例提供的电子设备的结构示意图。如图6所示,电子设备包括:存储器61以及处理器62;其中,
存储器61,用于存储程序;
处理器62,与存储器耦合,用于执行存储器中存储的程序,以用于:
获取不同模态的多个医学数据:
对所述多个医学数据进行特征聚类处理,以得到目标特征数据,所述目标特征数据为反映肝病的指标数据;
基于所述目标特征数据、以及所述目标特征数据与肝病类型之间的映射关系,确定所述目标特征数据对应的多个待选肝病分类结果;
对所述多个待选肝病分类结果进行融合,获得与所述多个医学数据相对应的目标分类结果。
上述存储器61可被配置为存储其它各种数据以支持在计算设备上的操作。这些数据的示例包括用于在计算设备上操作的任何应用程序或方法的指令。存储器61可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
上述处理器62在执行存储器61中的程序时,除了上面的功能之外,还可实现其它功能,具体可参见前面各实施例的描述。
进一步,如图6所示,电子设备还包括:显示器63、电源组件64、通讯组件65等其它组件。图6中仅示意性给出部分组件,并不意味着该电子设备只包括图6所示组件。
相应的,本申请实施例还提供一种存储有计算机程序的可读存储介质,所述计算机程序被计算机执行时能够实现上述各实施例提供的医学数据处理方法的步骤或功能。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
需要说明的是,本申请所涉及的用户信息和数据,均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (4)

1.一种医学数据处理装置,其特征在于,包括:
第一获取模块,用于获取不同模态的多个医学数据,所述多个医学数据包括:实验室检查数据、体格检查数据、影像数据,所述实验室检查数据包括血常规数据、肝功能检查数据、肿瘤标志物数据,所述影像数据包括CT图像、核磁共振图像;
第一处理模块,用于基于所述血常规数据提取对应的红细胞计数、血红蛋白、白细胞、白细胞分类计数及血小板转氨酶;
基于所述肝功能检查数据提取对应的总蛋白、白蛋白、球蛋白以及胆红素;
基于所述肿瘤标志物数据提取对应的胚胎抗原、糖类标志物;
基于所述体格检查数据提取对应的心率、体温、收缩压、舒张压、平均动脉压、呼吸率、血氧饱和度和葡萄糖;
基于所述CT图像提取对应的病变区域;
基于所述核磁共振图像提取对应的感兴趣区域的灰度特征、纹理特征、形状特征;
利用模糊逻辑神经元网络学习方法对多个特征数据进行特征聚类,以获得多个特征数据各自对应的特征向量,所述特征向量反映特征数据与肝病的相关性;根据所述特征向量确定所述多个特征数据对肝病分类结果的特征重要性,并基于所述多个特征数据的特征重要性,对所述多个特征数据与各个肝病类型的相关性进行排序,获得排序结果;根据所述排序结果筛选出与预设肝病类型相关性较高的特征数据作为目标特征数据,所述目标特征数据为反映肝病的指标数据;
第一确定模块,用于分别将所述目标特征数据输入至预先训练的多个BP神经网络模型,以利用所述多个BP神经网络模型获得与所述目标特征数据对应的多个待选肝病分类结果,其中,所述BP神经网络模型被训练为用于确定待选肝病分类结果;
第一融合模块,用于将所述多个待选肝病分类结果作为证据信息输入基本概率指派函数中,确定与各个待选肝病分类结果相对应的基本概率指派;其中,Ai为目标分类结果,y(Ai)为BP神经网络输出的待选肝病分类结果;Ek为网络的样本误差;
根据DS证据理论合成规则
对基本概率指派进行合成,获得合成后的基本概率指派;
基于信度函数和多个待选肝病分类结果之间的支持度原则,对所述合成后的基本概率指派进行修正,获得修正后的肝病分类结果;
根据修正后的肝病分类结果,确定多个医学数据所对应的目标分类结果。
2.一种医学数据处理方法,其特征在于,包括:
获取不同模态的多个医学数据,所述多个医学数据包括:实验室检查数据、体格检查数据、影像数据,所述实验室检查数据包括血常规数据、肝功能检查数据、肿瘤标志物数据,所述影像数据包括CT图像、核磁共振图像;
基于所述血常规数据提取对应的红细胞计数、血红蛋白、白细胞、白细胞分类计数及血小板转氨酶;
基于所述肝功能检查数据提取对应的总蛋白、白蛋白、球蛋白以及胆红素;
基于所述肿瘤标志物数据提取对应的胚胎抗原、糖类标志物;
基于所述体格检查数据提取对应的心率、体温、收缩压、舒张压、平均动脉压、呼吸率、血氧饱和度和葡萄糖;
基于所述CT图像提取对应的病变区域;
基于所述核磁共振图像提取对应的感兴趣区域的灰度特征、纹理特征、形状特征;
利用模糊逻辑神经元网络学习方法对多个特征数据进行特征聚类,以获得多个特征数据各自对应的特征向量,所述特征向量反映特征数据与肝病的相关性;
根据所述特征向量确定所述多个特征数据对肝病分类结果的特征重要性,并基于所述多个特征数据的特征重要性,对所述多个特征数据与各个肝病类型的相关性进行排序,获得排序结果;
根据所述排序结果筛选出与预设肝病类型相关性较高的特征数据作为目标特征数据;
分别将所述目标特征数据输入至预先训练的多个BP神经网络模型,以利用所述多个BP神经网络模型获得与所述目标特征数据对应的多个待选肝病分类结果,其中,所述BP神经网络模型被训练为用于确定待选肝病分类结果;
将所述多个待选肝病分类结果作为证据信息输入基本概率指派函数中,确定与各个待选肝病分类结果相对应的基本概率指派;其中,Ai为目标分类结果,y(Ai)为BP神经网络输出的待选肝病分类结果;Ek为网络的样本误差;
根据DS证据理论合成规则
对基本概率指派进行合成,获得合成后的基本概率指派;
基于信度函数和多个待选肝病分类结果之间的支持度原则,对所述合成后的基本概率指派进行修正,获得修正后的肝病分类结果;
根据修正后的肝病分类结果,确定多个医学数据所对应的目标分类结果。
3.一种分类模型的训练装置,其特征在于,包括:
第二获取模块,用于获取不同模态的多个医学数据样本、与所述多个医学数据样本对应的肝病分类结果样本,所述多个医学数据样本包括:实验室检查数据、体格检查数据、影像数据,所述实验室检查数据包括血常规数据、肝功能检查数据、肿瘤标志物数据,所述影像数据包括CT图像、核磁共振图像;
第二提取模块,用于基于所述血常规数据提取对应的红细胞计数、血红蛋白、白细胞、白细胞分类计数及血小板转氨酶;基于所述肝功能检查数据提取对应的总蛋白、白蛋白、球蛋白以及胆红素;基于所述肿瘤标志物数据提取对应的胚胎抗原、糖类标志物;基于所述体格检查数据提取对应的心率、体温、收缩压、舒张压、平均动脉压、呼吸率、血氧饱和度和葡萄糖;基于所述CT图像提取对应的病变区域;基于所述核磁共振图像提取对应的感兴趣区域的灰度特征、纹理特征、形状特征;
第二处理模块,用于利用模糊逻辑神经元网络学习方法对多个特征数据进行特征聚类,以获得多个特征数据各自对应的特征向量,所述特征向量反映特征数据与肝病的相关性;
根据所述特征向量确定所述多个特征数据对肝病分类结果的特征重要性,并基于所述多个特征数据的特征重要性,对所述多个特征数据与各个肝病类型的相关性进行排序,获得排序结果;
根据所述排序结果筛选出与预设肝病类型相关性较高的特征数据作为目标特征数据;
第二确定模块,用于分别将所述目标特征数据输入至预先训练的多个BP神经网络模型,以利用所述多个BP神经网络模型获得与所述目标特征数据对应的多个待选肝病分类结果,其中,所述BP神经网络模型被训练为用于确定待选肝病分类结果;
第二融合模块,用于将所述多个待选肝病分类结果作为证据信息输入基本概率指派函数中,确定与各个待选肝病分类结果相对应的基本概率指派;其中,Ai为目标分类结果,y(Ai)为BP神经网络输出的待选肝病分类结果;Ek为网络的样本误差;
根据DS证据理论合成规则
对基本概率指派进行合成,获得合成后的基本概率指派;
基于信度函数和多个待选肝病分类结果之间的支持度原则,对所述合成后的基本概率指派进行修正,获得修正后的肝病分类结果;
根据修正后的肝病分类结果,确定多个医学数据所对应的目标分类结果;
第二生成模块,用于判断所述目标分类结果与所述多个医学数据样本对应的肝病分类结果样本的一致性,在所述目标分类结果与肝病分类结果样本的一致性大于或等于预设阈值时,则生成肝病分类模型。
4.一种分类模型的训练方法,其特征在于,包括:
获取不同模态的多个医学数据样本、与所述多个医学数据样本对应的肝病分类结果样本,所述多个医学数据样本包括:实验室检查数据、体格检查数据、影像数据,所述实验室检查数据包括血常规数据、肝功能检查数据、肿瘤标志物数据,所述影像数据包括CT图像、核磁共振图像;
基于所述血常规数据提取对应的红细胞计数、血红蛋白、白细胞、白细胞分类计数及血小板转氨酶;基于所述肝功能检查数据提取对应的总蛋白、白蛋白、球蛋白以及胆红素;基于所述肿瘤标志物数据提取对应的胚胎抗原、糖类标志物;基于所述体格检查数据提取对应的心率、体温、收缩压、舒张压、平均动脉压、呼吸率、血氧饱和度和葡萄糖;基于所述CT图像提取对应的病变区域;基于所述核磁共振图像提取对应的感兴趣区域的灰度特征、纹理特征、形状特征;
利用模糊逻辑神经元网络学习方法对多个特征数据进行特征聚类,以获得多个特征数据各自对应的特征向量,所述特征向量反映特征数据与肝病的相关性;
根据所述特征向量确定所述多个特征数据对肝病分类结果的特征重要性,并基于所述多个特征数据的特征重要性,对所述多个特征数据与各个肝病类型的相关性进行排序,获得排序结果;
根据所述排序结果筛选出与预设肝病类型相关性较高的特征数据作为目标特征数据,所述目标特征数据为反映肝病的指标数据;
分别将所述目标特征数据输入至预先训练的多个BP神经网络模型,以利用所述多个BP神经网络模型获得与所述目标特征数据对应的多个待选肝病分类结果,其中,所述BP神经网络模型被训练为用于确定待选肝病分类结果;
将所述多个待选肝病分类结果作为证据信息输入基本概率指派函数中,确定与各个待选肝病分类结果相对应的基本概率指派;其中,Ai为目标分类结果,y(Ai)为BP神经网络输出的待选肝病分类结果;Ek为网络的样本误差;
根据DS证据理论合成规则
对基本概率指派进行合成,获得合成后的基本概率指派;
基于信度函数和多个待选肝病分类结果之间的支持度原则,对所述合成后的基本概率指派进行修正,获得修正后的肝病分类结果;
根据修正后的肝病分类结果,确定多个医学数据所对应的目标分类结果;
判断所述目标分类结果与所述多个医学数据样本对应的肝病分类结果样本的一致性,在所述目标分类结果与肝病分类结果样本的一致性大于或等于预设阈值时,则生成肝病分类模型。
CN202310410604.2A 2023-04-17 2023-04-17 医学数据处理装置、方法及分类模型训练装置 Active CN116524248B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310410604.2A CN116524248B (zh) 2023-04-17 2023-04-17 医学数据处理装置、方法及分类模型训练装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310410604.2A CN116524248B (zh) 2023-04-17 2023-04-17 医学数据处理装置、方法及分类模型训练装置

Publications (2)

Publication Number Publication Date
CN116524248A CN116524248A (zh) 2023-08-01
CN116524248B true CN116524248B (zh) 2024-02-13

Family

ID=87396763

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310410604.2A Active CN116524248B (zh) 2023-04-17 2023-04-17 医学数据处理装置、方法及分类模型训练装置

Country Status (1)

Country Link
CN (1) CN116524248B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117637093B (zh) * 2024-01-25 2024-04-12 西南医科大学附属医院 基于智慧医疗的患者信息管理方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108492877A (zh) * 2018-03-26 2018-09-04 西安电子科技大学 一种基于ds证据理论的心血管病辅助预测方法
CN112289441A (zh) * 2020-11-19 2021-01-29 吾征智能技术(北京)有限公司 一种基于多模态的医学生物特征信息匹配系统
WO2021022752A1 (zh) * 2019-08-07 2021-02-11 深圳先进技术研究院 一种多模态三维医学影像融合方法、系统及电子设备
CN113177602A (zh) * 2021-05-11 2021-07-27 上海交通大学 图像分类方法、装置、电子设备和存储介质
WO2021147217A1 (zh) * 2020-01-20 2021-07-29 平安科技(深圳)有限公司 医疗影像分类方法、装置、介质及电子设备
CN113870259A (zh) * 2021-12-02 2021-12-31 天津御锦人工智能医疗科技有限公司 多模态医学数据融合的评估方法、装置、设备及存储介质
CN114202524A (zh) * 2021-12-10 2022-03-18 中国人民解放军陆军特色医学中心 多模态医学图像的性能评价方法与系统
CN115131642A (zh) * 2022-08-30 2022-09-30 之江实验室 一种基于多视子空间聚类的多模态医学数据融合系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108492877A (zh) * 2018-03-26 2018-09-04 西安电子科技大学 一种基于ds证据理论的心血管病辅助预测方法
WO2021022752A1 (zh) * 2019-08-07 2021-02-11 深圳先进技术研究院 一种多模态三维医学影像融合方法、系统及电子设备
WO2021147217A1 (zh) * 2020-01-20 2021-07-29 平安科技(深圳)有限公司 医疗影像分类方法、装置、介质及电子设备
CN112289441A (zh) * 2020-11-19 2021-01-29 吾征智能技术(北京)有限公司 一种基于多模态的医学生物特征信息匹配系统
CN113177602A (zh) * 2021-05-11 2021-07-27 上海交通大学 图像分类方法、装置、电子设备和存储介质
CN113870259A (zh) * 2021-12-02 2021-12-31 天津御锦人工智能医疗科技有限公司 多模态医学数据融合的评估方法、装置、设备及存储介质
CN114202524A (zh) * 2021-12-10 2022-03-18 中国人民解放军陆军特色医学中心 多模态医学图像的性能评价方法与系统
CN115131642A (zh) * 2022-08-30 2022-09-30 之江实验室 一种基于多视子空间聚类的多模态医学数据融合系统

Also Published As

Publication number Publication date
CN116524248A (zh) 2023-08-01

Similar Documents

Publication Publication Date Title
KR101880678B1 (ko) 기계학습을 통한 의료영상 판독 및 진단 통합 시스템
CN100481096C (zh) 心脏成像的自动区域心肌评定的方法
CN107582097A (zh) 一种基于多模态超声组学的智能辅助决策系统
CN106682435A (zh) 一种多模型融合自动检测医学图像中病变的系统及方法
WO2005081168A2 (en) Systems and methods for automated diagnosis and decision support for heart related diseases and conditions
CN114926477A (zh) 一种基于深度学习的脑肿瘤多模态mri影像分割方法
CN116524248B (zh) 医学数据处理装置、方法及分类模型训练装置
CN112686899B (zh) 医学图像分析方法和装置、计算机设备及存储介质
US20240185428A1 (en) Medical Image Analysis Using Neural Networks
CN115206478A (zh) 医学报告生成方法以及装置、电子设备、可读存储介质
CN112508884A (zh) 一种癌变区域综合检测装置及方法
Abut et al. Paradigm shift from Artificial Neural Networks (ANNs) to deep Convolutional Neural Networks (DCNNs) in the field of medical image processing
CN115547502B (zh) 基于时序数据的血透病人风险预测装置
Hernanda et al. Semantic segmentation of venous on deep vein thrombosis (DVT) case using UNet-ResNet
CN116664592A (zh) 基于图像的动静脉血管分离方法、装置、电子设备及介质
Ibrahim et al. Liver Multi-class Tumour Segmentation and Detection Based on Hyperion Pre-trained Models.
Ji et al. ResDSda_U-Net: A novel U-Net based residual network for segmentation of pulmonary nodules in lung CT images
CN115719329A (zh) 基于深度学习对ra超声模态滑膜评分融合的方法及系统
Li et al. Structure regularized attentive network for automatic femoral head necrosis diagnosis and localization
CN112991314A (zh) 血管分割方法、装置及存储介质
Ramkumar Identification and Classification of Breast Cancer using Multilayer Perceptron Techniques for Histopathological Image
Ayub et al. Deep 3D-CNN using Resonance Imaging for Diagnosing Alzheimer’s
CN115619810B (zh) 一种前列腺分区分割方法、系统及设备
CN118071695B (zh) 基于深度学习的临床医学影像分析方法及系统
CN113743414B (zh) 基于语义编码的病灶识别方法、装置及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant