CN116958149B - 医疗模型训练方法、医疗数据分析方法、装置及相关设备 - Google Patents

医疗模型训练方法、医疗数据分析方法、装置及相关设备 Download PDF

Info

Publication number
CN116958149B
CN116958149B CN202311219135.2A CN202311219135A CN116958149B CN 116958149 B CN116958149 B CN 116958149B CN 202311219135 A CN202311219135 A CN 202311219135A CN 116958149 B CN116958149 B CN 116958149B
Authority
CN
China
Prior art keywords
medical
graph structure
model
node
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311219135.2A
Other languages
English (en)
Other versions
CN116958149A (zh
Inventor
陈晓红
唐鸿凯
梁伟
胡东滨
徐雪松
曹文治
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Red Pu Innovation Technology Development Co ltd
Original Assignee
Hunan Red Pu Innovation Technology Development Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Red Pu Innovation Technology Development Co ltd filed Critical Hunan Red Pu Innovation Technology Development Co ltd
Priority to CN202311219135.2A priority Critical patent/CN116958149B/zh
Publication of CN116958149A publication Critical patent/CN116958149A/zh
Application granted granted Critical
Publication of CN116958149B publication Critical patent/CN116958149B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Quality & Reliability (AREA)
  • Radiology & Medical Imaging (AREA)
  • Data Mining & Analysis (AREA)
  • Pathology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本发明涉及医疗数据处理领域,公开了一种医疗模型训练方法、医疗数据分析方法、装置及相关设备,所述方法包括:获取图结构和每个医疗客户端对应的局部模型参数;对所述图结构中的每个节点进行特征提取,得到每个所述节点的结构特征;采用拉普拉斯核函数,对所述图结构中任意两个节点进行相似度计算,得到相似度结果;对满足预设条件的相似度结果对应的两个节点构造伪边,并根据构造的所有伪边确定伪边图结构;将所述伪边图结构和所述图结构融合,得到增强图结构;基于所述增强图结构,对所述初始医疗模型进行训练,当满足训练结束条件时,将训练得到的模型作为医疗模型。采用本发明提高对医疗数据分析的准确率。

Description

医疗模型训练方法、医疗数据分析方法、装置及相关设备
技术领域
本发明涉及医疗数据处理领域,尤其涉及一种医疗模型训练方法、医疗数据分析方法、装置及相关设备。
背景技术
在现实中,在各大医疗机构的信息化建设过程中,对医疗数据存在医疗数据孤岛的问题,各大医疗机构的医疗数据均为隐私数据,不能直接用于研究。现有解决数据孤岛问题的方法是联邦学习。联邦学习允许各个医疗机构在不分享医疗数据的前提下,分布式地训练一个人工智能模型,打破了医疗机构之间的“数据孤岛”局面。联邦学习只要求分享模型参数,而不需要分享数据,降低了数据泄露的可能性。但在面临客户端数据分布不平衡时,由联邦学习获得的模型往往会表现出不准确、不公平的结果,从而造成对医疗数据进行分析时,分析结果准确率不高。
因此,在客户端数据分布不平衡的情况下,存在对医疗数据进行分析的准确率低的技术问题。
发明内容
本发明实施例提供一种医疗模型训练方法、医疗数据分析方法、装置及相关设备,以提高对医疗数据分析的准确率。
为了解决上述技术问题,本申请实施例提供一种医疗模型训练方法,包括:
获取图结构和每个医疗客户端对应的局部模型参数,其中,所述局部模型参数是指所述医疗客户端对初始医疗模型训练得到的参数,所述图结构包括连接边和节点,一个节点对应一个所述医疗客户端和所述医疗客户端对应的局部模型参数,所述连接边用于连接节点;
对所述图结构中的每个节点进行特征提取,得到每个所述节点的结构特征;
采用拉普拉斯核函数,对所述图结构中任意两个节点进行相似度计算,得到相似度结果;
对满足预设条件的相似度结果对应的两个节点构造伪边,并根据构造的所有伪边确定伪边图结构;
将所述伪边图结构和所述图结构融合,得到增强图结构;
基于所述增强图结构,对所述初始医疗模型进行训练,当满足训练结束条件时,将训练得到的模型作为医疗模型。
为了解决上述技术问题,本申请实施例提供一种医疗数据分析方法,包括:
获取待分析医疗数据;
将所述待分析医疗数据输入本地医疗模型中进行分析,得到分析结果,其中,所述本地医疗模型为通过医疗客户端训练得到的模型,所述医疗模型为根据上述医疗模型训练方法训练得到的模型。
为了解决上述技术问题,本申请实施例还提供一种医疗模型训练装置,包括:
模型参数获取模块,用于获取图结构和每个医疗客户端对应的局部模型参数,其中,所述局部模型参数是指所述医疗客户端对初始医疗模型训练得到的参数,所述图结构包括连接边和节点,一个节点对应一个所述医疗客户端和所述医疗客户端对应的局部模型参数,所述连接边用于连接节点;
结构特征确定模块,用于对所述图结构中的每个节点进行特征提取,得到每个所述节点的结构特征;
相似度计算模块,用于采用拉普拉斯核函数,对所述图结构中任意两个节点进行相似度计算,得到相似度结果;
伪边图结构确定模块,用于对满足预设条件的相似度结果对应的两个节点构造伪边,并根据构造的所有伪边确定伪边图结构;
融合模块,用于将所述伪边图结构和所述图结构融合,得到增强图结构;
医疗模型确定模块,用于基于所述增强图结构,对所述初始医疗模型进行训练,当满足训练结束条件时,将训练得到的模型作为医疗模型。
为了解决上述技术问题,本申请实施例还提供一种医疗数据分析装置,包括:
待分析医疗数据获取模块,用于获取待分析医疗数据;
分析模块,用于将所述待分析医疗数据输入本地医疗模型中进行分析,得到分析结果,其中,所述本地医疗模型为通过医疗客户端训练得到的模型,所述医疗模型为根据上述医疗模型训练方法训练得到的模型。
为了解决上述技术问题,本申请实施例还提供一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述医疗模型训练方法的步骤,或者,所述处理器执行所述计算机程序时实现上述医疗数据分析方法的步骤。
为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述医疗模型训练方法的步骤,或者,所述计算机程序被处理器执行时实现上述医疗数据分析方法的步骤。
本发明实施例提供的医疗模型训练方法、医疗数据分析方法、装置及相关设备,通过获取图结构和每个医疗客户端对应的局部模型参数;对所述图结构中的每个节点进行特征提取,得到每个所述节点的结构特征;采用拉普拉斯核函数,对所述图结构中任意两个节点进行相似度计算,得到相似度结果;对满足预设条件的相似度结果对应的两个节点构造伪边,并根据构造的所有伪边确定伪边图结构;将所述伪边图结构和所述图结构融合,得到增强图结构;基于所述增强图结构,对所述初始医疗模型进行训练,当满足训练结束条件时,将训练得到的模型作为医疗模型。通过对医疗客户端的图结构进行增强,并基于增强后的图结构和每个医疗客户端对应的局部模型参数训练得到医疗模型,能有效提高对医疗数据分析的准确率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请可以应用于其中的示例性系统架构图;
图2是本申请的医疗模型训练方法的一个实施例的流程图;
图3是本申请的医疗数据分析方法的一个实施例的流程图;
图4是根据本申请的医疗模型训练装置的一个实施例的结构示意图;
图5是根据本申请的医疗数据分析装置的一个实施例的结构示意图;
图6是根据本申请的计算机设备的一个实施例的结构示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器( Moving Picture EpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3 )、MP4(Moving PictureEperts Group Audio Layer IV,动态影像专家压缩标准音频层面4 )播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。
需要说明的是,本申请实施例所提供的医疗模型训练方法、医疗数据分析方法由服务器执行,相应地,医疗模型训练装置、医疗数据分析装置设置于服务器中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器,本申请实施例中的终端设备101、102、103具体可以对应的是实际生产中的应用系统。
请参阅图2,图2示出本发明实施例提供的一种医疗模型训练方法,以该方法应用在图1中的服务端为例进行说明,详述如下:
S201、获取图结构和每个医疗客户端对应的局部模型参数,其中,局部模型参数是指医疗客户端对初始医疗模型训练得到的参数,图结构包括连接边和节点,一个节点对应一个医疗客户端和医疗客户端对应的局部模型参数,连接边用于连接节点。
在步骤S201中,上述图结构是指不同医疗客户端在地理分布的结构图。此处需要说明的是,存储在各个医疗客户端的医疗数据往往呈现不平衡和非独立同分布的特征,医疗客户端在地理上的分布往往具有一定的结构化特征,该结构化特征是指各个医疗机构由于地域和患者群体的差异,某些疾病在特定地区的发病率会高于其他地区,相同疾病在不同地区上患者的表现也不尽相同,医疗数据的分布往往不一致。因此,可通过图结构表示医疗客户端的分布情况。
图结构的获取方式包括但不限于图神经网络结合医疗客户端信息,图卷积算法结合医疗客户端信息。其中,医疗客户端信息的获取方式包括但不限于全球定位系统、医疗保健数据共享平台、医疗信息交换平台。上述平台提供医疗机构之间的合作关系的一些信息。例如,通过全球定位系统获取医疗客户端的地理信息,确定医疗客户端的连接关系,并通过图神经网络将该医疗客户端作为节点,连接关系作为边构建图结构。
上述图结构g=(V,E),其中,V是指由n个医疗客户端构成的节点集合,一个节点对应一个医疗客户端,E是指医疗客户端之间具有连接关系的边的集合,边用于连接两个节点,也就是说,一条边对应的两个节点,为邻居关系。
根据图结构中边的集合,可确定邻接矩阵,其中,当第i个医疗客户端与第j个医疗客户端为邻居节点,则邻接矩阵中的第i行第j列和第j行第i列的值均为1,否则邻接矩阵的第i行第j列和第j行第i列的值均为0。
每个医疗客户端对应的局部模型参数是指医疗客户端对初始医疗模型训练得到的参数。
具体地,将初始医疗模型发送至每个医疗客户端,医疗客户端对初始医疗模型进行训练,得到局部模型参数。获取每个医疗客户端对应的局部模型参数。
服务端进行初始化,得到初始化医疗模型,并将初始化医疗模型的参数下发给各个医疗客户端进行训练,医疗客户端利用初始化医疗模型的参数和本地医疗数据训练出局部模型,并将局部模型参数发送给服务端。
通过获取到的图结构,可提取出不同医疗客户端的连接关系,利用图结构和局部模型参数训练医疗模型,实现在客户端数据分布不平衡的情况下,提高对医疗数据进行分析的准确率。
S202、对图结构中的每个节点进行特征提取,得到每个节点的结构特征。
在步骤S202中,结构特征是指节点与图结构中其他节点的连接特征。结构特征包括直接相邻的节点和经过多跳可到达的节点。其中,多跳是指可以连通两个不相邻节点的多条连接线的执行步骤。
应理解,在图结构中,节点之间的连接关系是确定的。不相邻的两个节点之间的相似性可能更高,但由于不相邻的两个节点之间不存在直接相连的边的关系,不相邻的两个节点之间只能通过多跳的方式进行信息共享,从而影响了医疗模型的准确性。通过强化每个节点的结构信息,将每个节点的特征扩大为包括本身模型的参数和结构信息两部分,从而实现利用节点之间的相似性增强原始的图结构。
具体地,按照如下公式(1)计算每个节点的结构特征:
(1)
其中,i是指第i个节点,i的取值范围为(1,n),i为正整数,n为节点总数,N(i)是指第i个节点的邻居节点集合,k的取值范围为(1,N),k为正整数,N为第i个节点的邻居节点集合的节点总数,是指第i个节点与邻居节点集合中的第k个节点连接边的权重,/>是指度矩阵中第i行第i列的值,/>是指度矩阵中第k行第k列的值。度矩阵是一个对角矩阵。
进一步地,邻居节点集合的范围可进行调整,例如,邻居节点集合用于存放步数低于5的所有节点,邻居节点集合用于存放步数低于10的所有节点,步数是指多跳的次数。
通过调整邻居节点范围,可以从一阶邻居扩展到二阶甚至更高阶的邻居,有效地扩大感受野,提供更广阔的上下文信息,增加了模型对于周围节点和边缘节点的感知能力,进一步提高图卷积算法的表达能力和性能。
S203、采用拉普拉斯核函数,对图结构中任意两个节点进行相似度计算,得到相似度结果。
在步骤S203中,拉普拉斯核函数是一种非线性核函数,用于计算图结构中任意两个节点的相似性。
按照如下公式(2)计算任意两个节点之间的相似度结果:
(2)
其中,是指第a个节点,/>是指第b个节点,a和b的取值范围均为(1,n),a和b均为正整数,n为节点总数,/>是指第a个节点和第b个节点的相似度结果,/>为指数,/>是拉普拉斯核函数的带宽参数,用于控制相似性的衰减速度,/>是指第a个节点和第b个节点的加权特征相似度。
按照如下公式(3)计算任意两个节点之间的加权特征相似度:
(3)
其中,是指第a个节点对应的局部模型参数,/>是指第b个节点对应的局部模型参数,T是指转置矩阵,M为对角权重矩阵,用于对不同的局部模型参数赋予权重,M的获取方式包括但不限于经验值获取,可根据实际情况进行获取,/>是指超参数,为可用于训练的权重参数,/>是指第a个节点的结构特征,/>是指第b个节点的结构特征。
通过对不同节点的结构特征进行加权,学习到各个局部模型参数对应的权重值,从而在距离计算中更重视具有较大权重的特征,即强化了对模型聚合重要性更高的参数的贡献度,从而更准确地度量节点之间的差异。
代入拉普拉斯核函数的公式中,即可计算出两个节点之间的拉普拉斯核值,对拉普拉斯核值进行归一化操作后,可用于度量两个节点之间的相似性。
S204、对满足预设条件的相似度结果对应的两个节点构造伪边,并根据构造的所有伪边确定伪边图结构。
在步骤S204中,上述预设条件包括但不限于两个节点之间的相似度结果大于预设相似度度结果、该相似度结果为其中一个节点的最大相似度结果、两个节点不直接相连。此处需要说明的是,预设条件可以为多个条件组合。
优选地,本申请实施例的预设条件为同时满足三个条件:1、两个节点之间的相似度结果大于预设相似度度结果;2、该相似度结果为其中一个节点的最大相似度结果;3、两个节点不直接相连。
将满足预设条件的相似度对应的两个节点进行连接,建立一条连接边,该连接边为伪边,伪边在原图结构中不存在,构建完所有伪边后,形成伪边图结构。
通过构建伪边图结构,使得节点之间能够充分传递模型参数,从而减少了信息传递的中间损失。
S205、将伪边图结构和图结构融合,得到增强图结构。
在步骤S205中,上述融合是指将伪边图结构和图结构中的连接边进行合并处理,得到增强图结构。
应理解,伪边图结构中的连接边,即伪边,该伪边是将相似度较高的节点进行连接边构建得到的,其在图结构中不存在,因此,将该伪边图结构中的所有伪边加入图结构中,则得到增强图结构。
通过融合伪边图结构和图结构,强化了对模型聚合重要性更高的参数的贡献度,从而提高对医疗数据分析的准确率。
S206、基于增强图结构,对初始医疗模型进行训练,当满足训练结束条件时,将训练得到的模型作为医疗模型。
在步骤S206中,上述训练结束条件包括但不限于训练轮次达到预设轮次,损失值达到预设损失值。
优选地,本申请实施例采用梯度下降法进行模型训练。
在本实施例中,通过对医疗客户端的图结构进行增强,并基于增强后的图结构和每个医疗客户端对应的局部模型参数训练得到医疗模型,能有效提高对医疗数据分析的准确率。
在本实施例的一些可选的实现方式中,当所述图结构为分级图结构时,步骤S205包括:
S2051、将伪边图结构和图结构融合,得到融合图结构,其中,融合图结构中的节点包括等级信息。
S2052、根据节点的等级信息,对融合图结构进行节点聚合,得到增强图结构。
在步骤S2051中,节点的等级信息包括但不限于(一级医疗机构,二级医疗机构、三级医疗机构),(高级医疗客户端、低级医疗客户端)。一个节点对应一个等级信息。
优选地,本申请采用(一级医疗机构,二级医疗机构)作为节点的等级信息。其中,划分一级医疗机构和二级医疗机构的标准包括但不限于机构规模、诊疗科目、床位数、设施设备。例如,一级医疗机构的床位数通常较少,一般在100张以下;而二级医疗机构的床位数较多,一般在100张以上,具体可根据实际情况进行调整。
对于步骤S2052,上述节点聚合是指将满足条件的节点聚合。
该条件可根据具体实际情况进行设定。例如,将一级医疗机构对应的节点合并到相似度最高的二级医疗机构对应的节点中,该合并为局部模型参数的融合。
应理解,二级医疗机构通过聚合与其相似度高的一级医疗机构对应的节点,能在保留二级医疗机构自身特征的同时,丢弃掉贡献度较低的一级医疗机构,减少图结构的规模和复杂性,从而提高模型分析的准确性。
训练得到的医疗模型参数通过服务端发送给各个医疗客户端,解决了数据孤岛问题的同时,提高了不同医疗客户端在数据不平衡的情况下的模型分析准确率。
在本实施例中,通过对融合图结构进行节点聚合,得到增强图结构,减少增强图结构的规模和复杂性,从而提高模型分析的准确性。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
请参阅图3,图3示出本发明实施例提供的一种医疗数据分析方法,以该方法应用在图2中的医疗模型为例进行说明,详述如步骤S301至步骤S302:
S301、获取待分析医疗数据。
S302、将待分析医疗数据输入本地医疗模型中进行分析,得到分析结果,其中,本地医疗模型为通过医疗客户端训练得到的模型,医疗模型为根据上述医疗模型训练方法训练得到的模型。
在步骤S301中,上述待分析医疗数据包括但不限于医疗图像、医疗文本数据。
在步骤S302中,上述分析包括但不限于文本类型预测、图像分析。
将待分析医疗数据输入本地医疗模型,基于该本地医疗模型的具体功能进行分析,得到分析结果。例如,当本地医疗模型为文本类型预测模型,则分析结果为文本类型。具体内容本申请不做限制。
在本实施例中,通过待分析医疗数据,并将待分析医疗数据输入本地医疗模型中进行分析,得到分析结果,该本地医疗模型融合了不同医疗客户端的训练得到的医疗模型的参数,提高该医疗客户端在数据不平衡的情况下的模型分析准确率。应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
图4示出与上述实施例医疗模型训练方法一一对应的医疗模型训练装置的原理框图。如图4所示,该医疗模型训练装置包括模型参数获取模块41、结构特征确定模块42、相似度计算模块43、伪边图结构确定模块44、融合模块45和医疗模型确定模块46。各功能模块详细说明如下:
模型参数获取模块41,用于获取图结构和每个医疗客户端对应的局部模型参数,其中,局部模型参数是指医疗客户端对初始医疗模型训练得到的参数,图结构包括连接边和节点,一个节点对应一个医疗客户端和医疗客户端对应的局部模型参数,连接边用于连接节点。
结构特征确定模块42,用于对图结构中的每个节点进行特征提取,得到每个节点的结构特征。
相似度计算模块43,用于采用拉普拉斯核函数,对图结构中任意两个节点进行相似度计算,得到相似度结果。
伪边图结构确定模块44,用于对满足预设条件的相似度结果对应的两个节点构造伪边,并根据构造的所有伪边确定伪边图结构。
融合模块45,用于将伪边图结构和图结构融合,得到增强图结构。
医疗模型确定模块46,用于基于增强图结构,对初始医疗模型进行训练,当满足训练结束条件时,将训练得到的模型作为医疗模型。
在本实施例的一些可选的实现方式中,模型参数获取模块41包括:
训练单元,用于将初始医疗模型发送至每个医疗客户端,医疗客户端对初始医疗模型进行训练,得到局部模型参数。
局部模型参数获取单元,用于获取每个医疗客户端对应的局部模型参数。
图结构构建单元,用于基于图神经网络和医疗客户端信息,构建图结构。
在本实施例的一些可选的实现方式中,结构特征确定模块42包括:
按照如下公式(1)计算每个节点的结构特征:
(1)
其中,i是指第i个节点,i的取值范围为(1,n),i为正整数,n为节点总数,N(i)是指第i个节点的邻居节点集合,k的取值范围为(1,N),k为正整数,N为第i个节点的邻居节点集合的节点总数,是指第i个节点与邻居节点集合中的第k个节点连接边的权重,/>是指度矩阵中第i行第i列的值,/>是指度矩阵中第k行第k列的值。
在本实施例的一些可选的实现方式中,相似度计算模块43包括:
按照如下公式(2)计算任意两个节点之间的相似度结果:
(2)
其中,是指第a个节点,/>是指第b个节点,a和b的取值范围均为(1,n),a和b均为正整数,n为节点总数,/>是指第a个节点和第b个节点的相似度结果,/>为指数,/>是拉普拉斯核函数的带宽参数,/>是指第a个节点和第b个节点的加权特征相似度。
在本实施例的一些可选的实现方式中,融合模块45包括:
融合图结构确定单元,用于将伪边图结构和图结构融合,得到融合图结构,其中,融合图结构中的节点包括等级信息。
增强图结构确定单元,用于根据节点的等级信息,对融合图结构进行节点聚合,得到增强图结构。
关于医疗模型训练装置的具体限定可以参见上文中对于医疗模型训练方法的限定,在此不再赘述。上述医疗模型训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。图5示出与上述实施例医疗数据分析方法一一对应的医疗数据分析装置的原理框图。如图5所示,该医疗数据分析装置包括待分析医疗数据获取模块51和分析模块52。各功能模块详细说明如下:
待分析医疗数据获取模块51,用于获取待分析医疗数据。
分析模块52,用于将待分析医疗数据输入本地医疗模型中进行分析,得到分析结果,其中,本地医疗模型为通过医疗客户端训练得到的模型,医疗模型为根据上述医疗模型训练方法训练得到的模型。
关于医疗数据分析装置的具体限定可以参见上文中对于医疗数据分析方法的限定,在此不再赘述。上述医疗数据分析装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图6,图6为本实施例计算机设备基本结构框图。
所述计算机设备6包括通过系统总线相互通信连接存储器61、处理器62、网络接口63。需要指出的是,图中仅示出了具有组件连接存储器61、处理器62、网络接口63的计算机设备6,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器 (Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器61至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或D界面显示存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器61可以是所述计算机设备6的内部存储单元,例如该计算机设备6的硬盘或内存。在另一些实施例中,所述存储器61也可以是所述计算机设备6的外部存储设备,例如该计算机设备6上配备的插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(Secure Digital, SD)卡,闪存卡(Flash Card)等。当然,所述存储器61还可以既包括所述计算机设备6的内部存储单元也包括其外部存储设备。本实施例中,所述存储器61通常用于存储安装于所述计算机设备6的操作系统和各类应用软件,例如电子文件的控制的程序代码等。此外,所述存储器61还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器62在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器62通常用于控制所述计算机设备6的总体操作。本实施例中,所述处理器62用于运行所述存储器61中存储的程序代码或者处理数据,例如运行电子文件的控制的程序代码。
所述网络接口63可包括无线网络接口或有线网络接口,该网络接口63通常用于在所述计算机设备6与其他电子设备之间建立通信连接。
本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有界面显示程序,所述界面显示程序可被至少一个处理器执行,以使所述至少一个处理器执行如上述的医疗模型训练方法的步骤,或者,以使所述至少一个处理器执行如上述的医疗数据分析方法的步骤。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。

Claims (9)

1.一种医疗模型训练方法,其特征在于,所述医疗模型训练方法包括:
获取图结构和每个医疗客户端对应的局部模型参数,其中,所述局部模型参数是指所述医疗客户端对初始医疗模型和本地医疗数据训练得到的参数,所述图结构包括连接边和节点,一个节点对应一个所述医疗客户端和所述医疗客户端对应的局部模型参数,所述连接边用于连接节点;
对所述图结构中的每个节点进行特征提取,得到每个所述节点的结构特征;
采用拉普拉斯核函数,对所述图结构中任意两个节点进行相似度计算,得到相似度结果;
对满足预设条件的相似度结果对应的两个节点构造伪边,并根据构造的所有伪边确定伪边图结构;
将所述伪边图结构和所述图结构融合,得到增强图结构;
基于所述增强图结构,对所述初始医疗模型进行训练,当满足训练结束条件时,将训练得到的模型作为医疗模型;
其中,当所述图结构为分级图结构时,所述将伪边图结构和所述图结构融合,得到增强图结构的步骤包括:
将伪边图结构和所述图结构融合,得到融合图结构,其中,所述融合图结构中的节点包括等级信息;
根据节点的等级信息,对融合图结构进行节点聚合,得到增强图结构,一个节点对应一个等级信息。
2.如权利要求1所述的医疗模型训练方法,其特征在于,所述获取图结构和每个医疗客户端对应的局部模型参数的步骤包括:
将初始医疗模型发送至每个医疗客户端,所述医疗客户端对初始医疗模型进行训练,得到局部模型参数;
获取每个所述医疗客户端对应的局部模型参数;
基于图神经网络和医疗客户端信息,构建图结构。
3.如权利要求1所述的医疗模型训练方法,其特征在于,所述对所述图结构中的每个节点进行特征提取,得到每个所述节点的结构特征的步骤包括:
按照如下公式计算每个节点的结构特征:
其中,i是指第i个节点,i的取值范围为(1,n),i为正整数,n为节点总数,N(i)是指第i个节点的邻居节点集合,k的取值范围为(1,N),k为正整数,N为第i个节点的邻居节点集合的节点总数,Ai,k是指第i个节点与邻居节点集合中的第k个节点连接边的权重,Di是指度矩阵中第i行第i列的值,Dk是指度矩阵中第k行第k列的值。
4.如权利要求1所述的医疗模型训练方法,其特征在于,所述采用拉普拉斯核函数,对所述图结构中任意两个节点进行相似度计算,得到相似度结果的步骤包括:
按照如下公式计算任意两个节点之间的相似度结果:
其中,va是指第a个节点,vb是指第b个节点,a和b的取值范围均为(1,n),a和b均为正整数,n为节点总数,L(va,vb)是指第a个节点和第b个节点的相似度结果,为指数,/>是拉普拉斯核函数的带宽参数,D(va,vb)是指第a个节点和第b个节点的加权特征相似度。
5.一种医疗数据分析方法,其特征在于,所述医疗数据分析方法包括:
获取待分析医疗数据;
将所述待分析医疗数据输入本地医疗模型中进行分析,得到分析结果,其中,所述本地医疗模型为根据权利要求1至4任一项所述的医疗模型训练方法训练得到的模型。
6.一种医疗模型训练装置,其特征在于,所述医疗模型训练装置包括:
模型参数获取模块,用于获取图结构和每个医疗客户端对应的局部模型参数,其中,所述局部模型参数是指所述医疗客户端对初始医疗模型和本地医疗数据训练得到的参数,所述图结构包括连接边和节点,一个节点对应一个所述医疗客户端和所述医疗客户端对应的局部模型参数,所述连接边用于连接节点;
结构特征确定模块,用于对所述图结构中的每个节点进行特征提取,得到每个所述节点的结构特征;
相似度计算模块,用于采用拉普拉斯核函数,对所述图结构中任意两个节点进行相似度计算,得到相似度结果;
伪边图结构确定模块,用于对满足预设条件的相似度结果对应的两个节点构造伪边,并根据构造的所有伪边确定伪边图结构;
融合模块,用于将所述伪边图结构和所述图结构融合,得到增强图结构;
医疗模型确定模块,用于基于所述增强图结构,对所述初始医疗模型进行训练,当满足训练结束条件时,将训练得到的模型作为医疗模型;
其中,当所述图结构为分级图结构时,所述融合模块包括:
融合图结构确定单元,用于将伪边图结构和所述图结构融合,得到融合图结构,其中,所述融合图结构中的节点包括等级信息;
增强图结构确定单元,用于根据节点的等级信息,对融合图结构进行节点聚合,得到增强图结构,一个节点对应一个等级信息。
7.一种医疗数据分析装置,其特征在于,所述医疗数据分析包括:
待分析医疗数据获取模块,用于获取待分析医疗数据;
分析模块,用于将所述待分析医疗数据输入本地医疗模型中进行分析,得到分析结果,其中,所述本地医疗模型为根据权利要求1至4任一项所述的医疗模型训练方法训练得到的模型。
8.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述的医疗模型训练方法,或者,所述处理器执行所述计算机程序时实现如权利要求5所述的医疗数据分析方法。
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述的医疗模型训练方法,或者,所述计算机程序被处理器执行时实现如权利要求5所述的医疗数据分析方法。
CN202311219135.2A 2023-09-21 2023-09-21 医疗模型训练方法、医疗数据分析方法、装置及相关设备 Active CN116958149B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311219135.2A CN116958149B (zh) 2023-09-21 2023-09-21 医疗模型训练方法、医疗数据分析方法、装置及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311219135.2A CN116958149B (zh) 2023-09-21 2023-09-21 医疗模型训练方法、医疗数据分析方法、装置及相关设备

Publications (2)

Publication Number Publication Date
CN116958149A CN116958149A (zh) 2023-10-27
CN116958149B true CN116958149B (zh) 2024-01-12

Family

ID=88449657

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311219135.2A Active CN116958149B (zh) 2023-09-21 2023-09-21 医疗模型训练方法、医疗数据分析方法、装置及相关设备

Country Status (1)

Country Link
CN (1) CN116958149B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9558265B1 (en) * 2016-05-12 2017-01-31 Quid, Inc. Facilitating targeted analysis via graph generation based on an influencing parameter
CN112216401A (zh) * 2020-10-12 2021-01-12 中国石油大学(华东) 一种基于df的新冠肺炎联邦学习检测方法
WO2021120676A1 (zh) * 2020-06-30 2021-06-24 平安科技(深圳)有限公司 联邦学习网络下的模型训练方法及其相关设备
CN113361279A (zh) * 2021-06-25 2021-09-07 扬州大学 一种基于双邻域图神经网络的医疗实体对齐方法及系统
CN114741527A (zh) * 2022-03-28 2022-07-12 华南理工大学 基于多源异构医疗知识图谱的图表示学习方法及装置
CN115311478A (zh) * 2022-08-16 2022-11-08 悉科大创新研究(深圳)有限公司 一种基于图深度聚类的联邦影像分类方法、存储介质
WO2022252596A1 (zh) * 2021-05-31 2022-12-08 华为云计算技术有限公司 构建ai集成模型的方法、ai集成模型的推理方法及装置
CN116346863A (zh) * 2023-05-29 2023-06-27 湘江实验室 基于联邦学习的车载网数据处理方法、装置、设备及介质
CN116522988A (zh) * 2023-07-03 2023-08-01 粤港澳大湾区数字经济研究院(福田) 基于图结构学习的联邦学习方法、系统、终端及介质
CN116580824A (zh) * 2023-05-17 2023-08-11 广西师范大学 基于联邦图机器学习的跨地域医疗合作预测方法
CN116663049A (zh) * 2023-05-15 2023-08-29 成都信息工程大学 一种基于区块链网络的医学图像分割协作方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11238966B2 (en) * 2019-11-04 2022-02-01 Georgetown University Method and system for assessing drug efficacy using multiple graph kernel fusion
US20220391781A1 (en) * 2021-05-27 2022-12-08 Nvidia Corporation Architecture-agnostic federated learning system
US20230101741A1 (en) * 2021-09-28 2023-03-30 Siemens Healthcare Gmbh Adaptive aggregation for federated learning

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9558265B1 (en) * 2016-05-12 2017-01-31 Quid, Inc. Facilitating targeted analysis via graph generation based on an influencing parameter
WO2021120676A1 (zh) * 2020-06-30 2021-06-24 平安科技(深圳)有限公司 联邦学习网络下的模型训练方法及其相关设备
CN112216401A (zh) * 2020-10-12 2021-01-12 中国石油大学(华东) 一种基于df的新冠肺炎联邦学习检测方法
WO2022252596A1 (zh) * 2021-05-31 2022-12-08 华为云计算技术有限公司 构建ai集成模型的方法、ai集成模型的推理方法及装置
CN113361279A (zh) * 2021-06-25 2021-09-07 扬州大学 一种基于双邻域图神经网络的医疗实体对齐方法及系统
CN114741527A (zh) * 2022-03-28 2022-07-12 华南理工大学 基于多源异构医疗知识图谱的图表示学习方法及装置
CN115311478A (zh) * 2022-08-16 2022-11-08 悉科大创新研究(深圳)有限公司 一种基于图深度聚类的联邦影像分类方法、存储介质
CN116663049A (zh) * 2023-05-15 2023-08-29 成都信息工程大学 一种基于区块链网络的医学图像分割协作方法
CN116580824A (zh) * 2023-05-17 2023-08-11 广西师范大学 基于联邦图机器学习的跨地域医疗合作预测方法
CN116346863A (zh) * 2023-05-29 2023-06-27 湘江实验室 基于联邦学习的车载网数据处理方法、装置、设备及介质
CN116522988A (zh) * 2023-07-03 2023-08-01 粤港澳大湾区数字经济研究院(福田) 基于图结构学习的联邦学习方法、系统、终端及介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Capital equilibrium strategy for uncertain multi-model systems;Yi Cui;Information Sciences;全文 *
全局和局部信息融合的案情关键要素识别;毛星亮,陈晓红;软件学报;全文 *

Also Published As

Publication number Publication date
CN116958149A (zh) 2023-10-27

Similar Documents

Publication Publication Date Title
CN112116155A (zh) 基于智能决策的人口流动预测方法、装置及计算机设备
CN112863683B (zh) 基于人工智能的病历质控方法、装置、计算机设备及存储介质
CN112508118B (zh) 针对数据偏移的目标对象行为预测方法及其相关设备
CN111860398A (zh) 遥感图像目标检测方法、系统及终端设备
CN112016502B (zh) 安全带检测方法、装置、计算机设备及存储介质
CN113139490B (zh) 一种图像特征匹配方法、装置、计算机设备及存储介质
CN115423031B (zh) 一种模型训练的方法以及相关装置
CN116935449A (zh) 指纹图像匹配模型训练方法、指纹匹配方法及相关介质
WO2021174881A1 (zh) 多维度信息的组合预测方法、装置、计算机设备及介质
US12148295B2 (en) Method of predicting traffic volume, electronic device, and medium
CN112765481B (zh) 一种数据处理方法、装置、计算机及可读存储介质
CN112016503B (zh) 人行道检测方法、装置、计算机设备及存储介质
CN116958149B (zh) 医疗模型训练方法、医疗数据分析方法、装置及相关设备
CN110347973B (zh) 用于生成信息的方法和装置
US20230334096A1 (en) Graph data processing method and apparatus, computer device, and storage medium
CN116681045A (zh) 报表生成方法、装置、计算机设备及存储介质
CN112259239B (zh) 一种参数处理方法、装置、电子设备及存储介质
CN115758271A (zh) 数据处理方法、装置、计算机设备和存储介质
CN114841361A (zh) 一种模型训练方法及其相关设备
CN112241767A (zh) 管网水压监测节点布置方法、装置、设备及存储介质
CN109542986A (zh) 网络数据的要素归一化方法、装置、设备及存储介质
CN113434632B (zh) 基于语言模型的文本补全方法、装置、设备及存储介质
CN118035560A (zh) 基于人工智能的数据推荐方法、装置、设备及存储介质
CN117876021A (zh) 基于人工智能的数据预测方法、装置、设备及存储介质
CN117272080A (zh) 风险商户聚类分析方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant