CN116110542A - 一种基于可信多视图的数据分析方法 - Google Patents

一种基于可信多视图的数据分析方法 Download PDF

Info

Publication number
CN116110542A
CN116110542A CN202211656042.1A CN202211656042A CN116110542A CN 116110542 A CN116110542 A CN 116110542A CN 202211656042 A CN202211656042 A CN 202211656042A CN 116110542 A CN116110542 A CN 116110542A
Authority
CN
China
Prior art keywords
view
representing
data
trusted
data analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211656042.1A
Other languages
English (en)
Inventor
彭博
谢朱洋
姚远
滕飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest Jiaotong University
Original Assignee
Southwest Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest Jiaotong University filed Critical Southwest Jiaotong University
Priority to CN202211656042.1A priority Critical patent/CN116110542A/zh
Publication of CN116110542A publication Critical patent/CN116110542A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/20ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/40ICT specially adapted for the handling or processing of medical images for processing medical images, e.g. editing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Radiology & Medical Imaging (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本发明提供了一种基于可信多视图的数据分析方法,属于数据处理技术领域。该方法包括:对原始三高数据进行处理,提取视图数据;根据提取的视图数据,利用三高数据分析模型输出多视图的类别概率和不确定性质量,同时,该方法设计了注意力模块,动态地建模视图内各指标数据间的关系,并为指标分配不同的权重整合视图内信息进行视图表示,此外,将学习到的多视图表示送入到可信多视图融合模块,结合证据理论执行可靠的多视图融合,并给出不同三高数据的关联因素。本发明结合可信多视图融合方法,在含有不同质量的多视图医疗数据情况下,结合证据理论执行可靠的多视图融合,分析三高数据的关联因素。

Description

一种基于可信多视图的数据分析方法
技术领域
本发明属于数据处理技术领域,尤其涉及一种基于可信多视图的数据分析方法。
背景技术
随着现代医疗技术的发展,医疗数据采集变得容易可获取,在临床实验、健康管理以及病理研究过程中产生了大量的医疗数据。“医疗大数据”的出现也促进了医疗信息化,使用大数据方法能够有效地挖掘和分析病理关系,辅助专家进行医疗决策,结合人工智能技术进行病理研究。以“三高”为例(“三高”是指高血压、高血脂、高血糖),在构建三高数据的过程中,会有这样的现象:同一个病人可能有着多个检测表单,例如血常规表单、生化结果表单、免疫全套表单等,这些表单形成了多视图医疗数据。多视图医疗数据带来了机遇和挑战:一方面,三高数据包含多个视图的检测数据,这些多视图数据可能有着不同程度的信息丢失,这在整合多视图信息的过程中带来了阻碍,如何有效、可靠地整合不同质量的视图信息关系到医疗数据的应用。
然而,现在分析方法忽略了两个问题:1)不同视图数据的影响程度不同。对不同的疾病数据进行分析时,会优先考虑特定视图的信息。例如,对糖尿病进行分析时,会重点考虑血糖相关的视图信息,而减少对其它视图数据的关注;2)不同视图携带的信息质量有所差别,不能将这些视图信息视为同等重要。由于检测的指标差异,数据的缺失,记录人员的习惯不同,造成各医疗视图不同程度的信息丢失。
发明内容
针对现有技术中的上述不足,本发明提供的一种基于可信多视图的数据分析方法,通过可信多视图融合自动地整合不同质量的视图信息,得到可靠的分析结果并给出不同质量视图的贡献,从而分析三高数据的特点和关联。
为了达到以上目的,本发明采用的技术方案为:
本方案提供一种基于可信多视图的数据分析方法,包括以下步骤:
S1、对原始三高数据进行处理,提取视图数据;
S2、根据提取的视图数据,利用三高数据分析模型输出多视图的类别概率和不确定性质量,完成基于可信多视图的数据分析。
本发明的有益效果是:本发明通过对原始的数据进行处理,通过数据的预处理得到多视图数据,能够剔除原始三高数据中的异常值和缺失值,并且通过归一化处理得到能够用于模型的平稳数据,提取可用于模型的数据;将提取得到的多视图数据分别输入到单视图特征提取模块,捕获每个视图特有的特征;根据得到的视图特有特征,学习多视图融合表示;将多视图融合表示输入到三高数据分析模型,输出最终的结果,其中,输出的类别概率用作参考分析的结果,不确定性质量用于评估三高数据的不同视图重要性,不确定性质量越低表示对应视图特征越重要,不确定性质量越高表示对应视图特征的贡献程度越小。本发明在不同质量的视图条件下,通过可信多视图融合的方式进行多视图融合,并给出不同质量视图的贡献,从而帮助分析三高数据的特点和关联。
再进一步地,所述步骤S2包括以下步骤:
S201、根据提取的视图数据,构建数据集X;
S202、将数据集X作为输入,利用多层感知器MLP提取各视图的指标特征;
S203、利用注意力模块为不同指标特征分配权重,并整合各指标特征得到单视图特征;
S204、将各单视图特征输入至可信多视图整合模块,学习多个视图的融合表示;
S205、构建三高数据分析模型,并根据多个视图的融合表示,利用三高数据分析模型输出多视图的类别概率bj和不确定性质量u。
上述进一步方案的有益效果是:可信多视图整合模块为多视图特征学习一致的融合表示,通过可信多视图融合方法,为不同的视图特征估计概率类别以及不确定性质量,用于三高数据之间的特征关联。
再进一步地,所述步骤S202中视图的指标特征的表达式如下:
Figure BDA0004012812920000031
其中,hm表示提取得到的视图的指标特征,MLPm(·)表示视图m的多层感知器,xm表示输入的视图数据,θm表示神经网络参数,d表示特征提取后的维度,T表示视图特征的数量,
Figure BDA0004012812920000032
表示T×d大小的特征空间。
上述进一步方案的有益效果是:通过设计的特定视图的多层感知器,用于学习不同视图的特有特征。
再进一步地,所述步骤S203中单视图特征的表达式如下:
Figure BDA0004012812920000033
am=hmWa,m
其中,fm表示单视图特征,am,i表示视图m对应的注意力权重am中的第i个指标特征,hm,i表示视图m的第i个指标特征,am表示注意力权重,Wa,m表示视图m的权值向量。
上述进一步方案的有益效果是:通过采用注意力机制为视图内的特征动态地分配权重,注意力权重的大小反映了不同视图特征与疾病数据的关联。
再进一步地,所述步骤S204包括以下步骤:
S2041、对于第m个视图,通过以下公式计算得到k个类别的观测:
Figure BDA0004012812920000034
其中,om表示对k个类别的观测,FCm(·)表示用于视图m的全连接层,wm表示可学习网络参数;
S2042、将观测结果与狄利克雷分布的参数进行关联,并为视图m分配类别概率bm以及不确定性质量um
S2043、根据类别概率bm以及不确定性质量um执行可信多视图融合,得到最终融合的类别概率bj和不确定性质量u,完成多个视图的融合表示。
再进一步地,所述类别概率bm的表达式如下:
Figure BDA0004012812920000041
Figure BDA0004012812920000042
其中,Sm表示视图m的狄利克雷强度,
Figure BDA0004012812920000043
表示视图m的狄利克雷分布参数的第j个值,
Figure BDA0004012812920000044
表示类别观测om的第j个值;
所述不确定性质量um的表达式如下:
Figure BDA0004012812920000045
上述进一步方案的有益效果是:采用狄利克雷分布来表示各视图的不确定性,其中类别概率bj表示三高数据的分析结果,不确定性质量u反映了三高数据不同视图的重要性,不确定性质量越低表示视图特征越重要,不确定性质量越高表示视图特征的影响越小。
再进一步地,所述三高数据分析模型的损失函数表达式如下:
Figure BDA0004012812920000046
其中,L表示损失函数,yl表示样本标签,ψ(·)表示伽马函数,al表示整合后的狄利克雷分布参数,S表示整合后的狄利克雷分布强度。
上述进一步方案的有益效果是:损失函数能够确保每个样本对应的正确标签比其他的类别标签产生更多的观测证据。
附图说明
图1为本发明的方法流程图。
图2为本实施例中提出的网络模型结构图。
图3为本实施例中样例展示的结果图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
实施例
如图1-图2所示,本发明提供了一种基于可信多视图的数据分析方法,其实现方法如下:
S1、对原始三高数据进行处理,提取视图数据;
本实施例中,对三高数据进行处理,提取用于模型输入的数据,三高数据(高血压、高血脂、高血糖),共计6个视图数据(主要数据、血常规结果、生化结果、小便常规、术前凝血常规以及免疫全套),对数据进行特殊字符替换、缺失数据(缺失率超过30%丢弃)处理后,可用数据18000条,删除冗余指标后,可用指标117个(6个视图对应指标分别为15,20,34,26,8,14)。
本实施例中,对提取的6个视图使用数据归一化:v'=(v-mean)/σ,其中,v表示指标数值,mean和σ分别表示该特征下的均值和标准差,v'是归一化后的指标数值。
本实施例中,将上述处理后的6个视图数据构建数据集
Figure BDA0004012812920000061
其中,m表示第m个视图,T表示视图m内含有的指标数量。数据集X按照8:2的比例进行划分,得到训练集和测试集。
S2、根据提取的视图数据,利用三高数据分析模型输出多视图的类别概率和不确定性质量,完成基于可信多视图的数据分析,其实现方法如下:
S201、根据提取的视图数据,构建数据集X;
S202、将数据集X作为输入,利用多层感知器MLP提取各视图的指标特征;
S203、利用注意力模块为不同指标特征分配权重,并整合各指标特征得到单视图特征;
S204、将各单视图特征输入至可信多视图整合模块,学习多个视图的融合表示,其实现方法如下:
S2041、对于第m个视图,通过以下公式计算得到k个类别的观测:
Figure BDA0004012812920000062
其中,om表示对k个类别的观测,FCm(·)表示用于视图m的全连接层,wm表示可学习网络参数;
S2042、将观测结果与狄利克雷分布的参数进行关联,并为视图m分配类别概率bm以及不确定性质量um
S2043、根据类别概率bm以及不确定性质量um执行可信多视图融合,得到最终融合的类别概率bj和不确定性质量u,完成多个视图的融合表示;
S205、构建三高数据分析模型,并根据多个视图的融合表示,利用三高数据分析模型输出多视图的类别概率bj和不确定性质量u。
本实施例中,构建单视图特征提取模块:将构建好的数据集X作为输入,通过多层感知器MLP分别为所述6个视图的指标特征进行特征抽取,公式如下
Figure BDA0004012812920000071
其中,hm表示提取得到的视图的指标特征,MLPm(·)表示视图m的多层感知器,xm表示输入的视图数据,θm表示神经网络参数,d表示特征提取后的维度,T表示视图特征的数量,
Figure BDA0004012812920000072
表示T×d大小的特征空间。
本实施例中,为了捕获视图内各指标之间的关系,使用注意力模块为不同指标分配权重,自动整合各指标信息,得到单视图特征。具体如下
Figure BDA0004012812920000073
am=hmWa,m
其中,fm表示单视图特征,am,i表示视图m对应的注意力权重am中的第i个指标特征,hm,i表示视图m的第i个指标特征,am表示注意力权重,Wa,m表示视图m的权值向量。
本实施例中,可信多视图融合模块采用可信多视图网络TMC(Trusted Multi-viewClassification),将以上6种单视图特征fm输入到可信多视图融合模块,学习多个视图的融合表示。具体来说,对于k类别的三高数据,使用全连接层为单视图特征fm学习k个类别的观测。对于第m个视图,其计算过程如下:
Figure BDA0004012812920000074
其中,om表示对k个类别的观测,FCm(·)表示用于视图m的全连接层,wm表示可学习网络参数。
对于视图m,将观测结果om与狄利克雷分布的参数αm进行关联:αm=om+1,并为视图om分配类别概率bm以及一个不确定性质量um,具体过程如下:
Figure BDA0004012812920000075
Figure BDA0004012812920000076
其中,Sm表示视图m的狄利克雷强度,
Figure BDA0004012812920000077
表示视图m的狄利克雷分布参数的第j个值,
Figure BDA0004012812920000081
表示类别观测om的第j个值。注意的是,bm的k个值都是非负的,并且类别概率bm以及不确定性质量um总和为1,即:
Figure BDA0004012812920000082
根据类别概率以及不确定性质量执行可信多视图融合,以2个视图融合为例,具体规则如下:
Figure BDA0004012812920000083
Figure BDA0004012812920000084
其中,
Figure BDA0004012812920000085
Figure BDA0004012812920000086
表示视图1和视图2的第j个类别概率,u1和u2分别表示视图1和视图2的不确定性质量,bj和u表示融合后的类别概率以及不确定性质量,
Figure BDA0004012812920000087
表示两个视图的冲突度量,
Figure BDA0004012812920000088
表示归一化比例缩放因子。按照上述的融合规则,逐步地将6个医疗视图进行融合,得到最终融合的类别概率bi和不确定性质量u。因此,整合后的多视图观测和狄利克雷分布参数为:
o=bj×S
Figure BDA0004012812920000089
a=o+1
其中,o表示多视图融合后的观测,S和a分别表示整合后的狄利克雷分布强度以及狄利克雷分布参数。
对于多个视图的融合,有如下算法流程:
输入:m个视图的类别概率
Figure BDA00040128129200000810
以及不确定性质量u1,u2,...,um
1、使用视图1的
Figure BDA00040128129200000811
和u1以及视图2的
Figure BDA00040128129200000812
和u2,按照上述的两个视图融合规则得到bj和u,并设置计数器count=3;
2、余下的视图中,遍历第count个视图对应的
Figure BDA00040128129200000813
和ucount,并与bj和u执行两个视图融合规则,得到新的bj和u;
3、转到步骤2,重复迭代,直到遍历完m-2个视图;
4、输出m个视图融合的结果bj和u。
本实施例中,为了从正确的标签得到更多的证据,采用调整的交叉熵作为损失函数,具体过程如下:
Figure BDA0004012812920000091
其中,L表示损失函数,yl表示样本标签,ψ(·)表示伽马函数,al表示整合后的狄利克雷分布参数,S表示整合后的狄利克雷分布强度。
最终,三高数据分析模型输出多视图的类别概率bm和不确定性质量um,以及多视图融合后的类别概率bj和不确定性质量u。由于类别概率以及不确定性质量总和为1,因此,不确定性质量越低,则类别概率的观测越准确,该视图特征的贡献越重要。
在训练阶段,为了指导模型学习参数,使用调整的交叉熵损失函数进行优化,并在测试集上验证模型性能。具体来说,整个训练阶段设置100次迭代,每隔10次在测试集上验证并计算损失,将损失最小的模型参数更新。重复上述过程,直到模型训练完毕,得到最优的模型参数。
本发明通过设计注意力模块,用于建模不同视图内部指标之间的关系,动态地为这些指标分配权重从而整合视图内各指标信息,得到单个视图表示。该方法在不同质量的视图条件下,通过可信多视图融合的方式进行多视图信息整合,并给出不同质量视图的贡献,从而帮助分析三高数据的特点和关联。
本实施例中,将构建的数据集X划分为测试集,在训练集上训练三高数据分析模型,再用测试集对三高数据分析模型进行验证,最后验证的结果即是输出多视图的类别概率和不确定性质量,完成基于可信多视图的数据分析。
为了验证基于可信多视图的三高数据分析方法的有效性,在真实数据集上进行了对比实验,采用Pytorch的深度学习框架来构建深度模型。实验采用的数据集是由华西医院提供的数据,是一个典型的多标签数据集,共计6个视图表格数据(主要数据、血常规结果、生化结果、小便常规、术前凝血常规以及免疫全套)。6个视图表格共171个指标,由于记录的表格数据存在特殊字符,数据缺失,异常值等问题,对数据进行特殊字符替换、缺失数据(缺失率超过30%丢弃)处理后,可用数据18000条,删除冗余指标后,可用指标117个(6个视图对应指标数量分别为15,20,34,26,8,14),按照8:2进行数据集划分,得到训练集14400条,测试集3600条。
实验结果评估:
图3是具体几个测试样例,用于三高数据的关联分析。糖尿病,高血压以及冠心病的标签依次设置为0,1和2。模型为每个样本输出分析结果,包括6个视图的不确定性质量um,以及多视图融合后的不确定性质量u。其中,不确定性质量um是对6个视图的质量评估,不确定性质量越低说明该视图特征越加重要,不确定性质量越高说明该视图的特征影响程度越小。可以看到,对于分析正确的样本,部分视图有着较低的不确定性质量,说明该视图指标与三高数据密切相关,并且融合后的不确定性质量整体偏低,表示分析的结果是可信的。而对于分析错误的样本,在不同视图上有着更高的不确定性质量,因此融合后的整体不确定性质量较高,表示模型对分析的结果不可信。
对本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。

Claims (7)

1.一种基于可信多视图的数据分析方法,其特征在于,包括以下步骤:
S1、对原始三高数据进行处理,提取视图数据;
S2、根据提取的视图数据,利用三高数据分析模型输出多视图的类别概率和不确定性质量,完成基于可信多视图的数据分析。
2.根据权利要求2所述的基于可信多视图的数据分析方法,其特征在于,所述步骤S2包括以下步骤:
S201、根据提取的视图数据,构建数据集X;
S202、将数据集X作为输入,利用多层感知器MLP提取各视图的指标特征;
S203、利用注意力模块为不同指标特征分配权重,并整合各指标特征得到单视图特征;
S204、将各单视图特征输入至可信多视图整合模块,学习多个视图的融合表示;
S205、构建三高数据分析模型,并根据多个视图的融合表示,利用三高数据分析模型输出多视图的类别概率bj和不确定性质量u。
3.根据权利要求2所述的基于可信多视图的数据分析方法,其特征在于,所述步骤S202中视图的指标特征的表达式如下:
Figure FDA0004012812910000011
其中,hm表示提取得到的视图的指标特征,MLPm(·)表示视图m的多层感知器,xm表示输入的视图数据,θm表示神经网络参数,d表示特征提取后的维度,T表示视图特征的数量,
Figure FDA0004012812910000012
表示T×d大小的特征空间。
4.根据权利要求3所述的基于可信多视图的数据分析方法,其特征在于,所述步骤S203中单视图特征的表达式如下:
Figure FDA0004012812910000013
am=hmWa,m
其中,fm表示单视图特征,am,i表示视图m对应的注意力权重am中的第i个指标特征,hm,i表示视图m的第i个指标特征,am表示注意力权重,Wa,m表示视图m的权值向量。
5.根据权利要求4所述的基于可信多视图的数据分析方法,其特征在于,所述步骤S204包括以下步骤:
S2041、对于第m个视图,通过以下公式计算得到k个类别的观测:
Figure FDA0004012812910000021
其中,om表示对k个类别的观测,FCm(·)表示用于视图m的全连接层,wm表示可学习网络参数;
S2042、将观测结果与狄利克雷分布的参数进行关联,并为视图m分配类别概率bm以及不确定性质量um
S2043、根据类别概率bm以及不确定性质量um执行可信多视图融合,得到最终融合的类别概率bj和不确定性质量u,完成多个视图的融合表示。
6.根据权利要求5所述的基于可信多视图的数据分析方法,其特征在于,所述类别概率bm的表达式如下:
Figure FDA0004012812910000022
Figure FDA0004012812910000023
其中,Sm表示视图m的狄利克雷强度,
Figure FDA0004012812910000024
表示视图m的狄利克雷分布参数的第j个值,
Figure FDA0004012812910000025
表示类别观测om的第j个值;
所述不确定性质量um的表达式如下:
Figure FDA0004012812910000026
7.根据权利要求6所述的基于可信多视图的数据分析方法,其特征在于,所述三高数据分析模型的损失函数表达式如下:
Figure FDA0004012812910000031
其中,L表示损失函数,yl表示样本标签,ψ(·)表示伽马函数,al表示整合后的狄利克雷分布参数,S表示整合后的狄利克雷分布强度。
CN202211656042.1A 2022-12-22 2022-12-22 一种基于可信多视图的数据分析方法 Pending CN116110542A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211656042.1A CN116110542A (zh) 2022-12-22 2022-12-22 一种基于可信多视图的数据分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211656042.1A CN116110542A (zh) 2022-12-22 2022-12-22 一种基于可信多视图的数据分析方法

Publications (1)

Publication Number Publication Date
CN116110542A true CN116110542A (zh) 2023-05-12

Family

ID=86258970

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211656042.1A Pending CN116110542A (zh) 2022-12-22 2022-12-22 一种基于可信多视图的数据分析方法

Country Status (1)

Country Link
CN (1) CN116110542A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117542503A (zh) * 2023-10-16 2024-02-09 南通大学 基于动态证据融合神经网络的精神分裂症多视图分类方法
CN118520944A (zh) * 2024-07-25 2024-08-20 杭州电子科技大学 一种基于大语言模型的知识图谱三元组可信性验证方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117542503A (zh) * 2023-10-16 2024-02-09 南通大学 基于动态证据融合神经网络的精神分裂症多视图分类方法
CN117542503B (zh) * 2023-10-16 2024-09-24 南通大学 基于动态证据融合神经网络的精神分裂症多视图分类方法
CN118520944A (zh) * 2024-07-25 2024-08-20 杭州电子科技大学 一种基于大语言模型的知识图谱三元组可信性验证方法

Similar Documents

Publication Publication Date Title
US20240203599A1 (en) Method and system of for predicting disease risk based on multimodal fusion
CN111540468B (zh) 一种诊断原因可视化的icd自动编码方法与系统
CN116110542A (zh) 一种基于可信多视图的数据分析方法
Ahmadi et al. Evaluating the factors affecting the implementation of hospital information system (HIS) using AHP method
CN109036577B (zh) 糖尿病并发症分析方法及装置
CN113779272B (zh) 基于知识图谱的数据处理方法、装置、设备及存储介质
CN110600121B (zh) 一种基于知识图谱病因初步诊断方法
CN111477320B (zh) 治疗效果预测模型的构建系统、治疗效果预测系统及终端
CN112150298A (zh) 数据处理方法、系统、设备及可读介质
Lu et al. A survey of group decision making methods in Healthcare Industry 4.0: bibliometrics, applications, and directions
CN117457192A (zh) 智能远程诊断方法及系统
CN116186422A (zh) 基于社交媒体和人工智能的疾病相关舆情分析系统
CN111524570A (zh) 一种基于机器学习的超声随访患者筛选方法
CN113360643A (zh) 一种基于短文本分类的电子病历数据质量评价方法
CN117577253A (zh) 基于大数据的医疗临床数据质量分析方法及系统
Gutsche Automatic weak signal detection and forecasting
Okikiola et al. A systematic review of health care ontology
RU2723674C1 (ru) Способ прогнозирования диагноза на основе обработки данных, содержащих медицинские знания
CN114153952A (zh) 一种面试考官管理系统及评分质量监测分析方法
CN118153537B (zh) 基于文献pdf表格的临床症状和实验室指标的抽取方法
Giner-Miguelez et al. On the Readiness of Scientific Data for a Fair and Transparent Use in Machine Learning
CN114944209B (zh) 一种医疗相似病历的集成式计算方法及系统
Jeyabalan et al. Forecasting Covid-19 outbreak using CLR optimized stacked generalization computational models
Rahman Optimizing Customer Satisfaction through Sentiment Analysis: A BERT-based Machine Learning Approach to Extract Insights
Sasikala et al. Mean Silhouette Genetic and Elman Deep Recurrent Network based Sentimental Analysis for Twitter Social Media Healthcare Data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination