CN117316462A - 一种医疗数据管理方法 - Google Patents

一种医疗数据管理方法 Download PDF

Info

Publication number
CN117316462A
CN117316462A CN202311510419.7A CN202311510419A CN117316462A CN 117316462 A CN117316462 A CN 117316462A CN 202311510419 A CN202311510419 A CN 202311510419A CN 117316462 A CN117316462 A CN 117316462A
Authority
CN
China
Prior art keywords
medical
matrix
vector
data
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311510419.7A
Other languages
English (en)
Inventor
韩之雷
饶正伟
蒋虹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangxi Hanshi Medical Development Co ltd
Original Assignee
Jiangxi Hanshi Medical Development Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangxi Hanshi Medical Development Co ltd filed Critical Jiangxi Hanshi Medical Development Co ltd
Priority to CN202311510419.7A priority Critical patent/CN117316462A/zh
Publication of CN117316462A publication Critical patent/CN117316462A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Public Health (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本申请涉及智能管理领域,其具体公开了一种医疗数据管理方法,其使用基于深度学习模型的人工智能技术来对正常医疗数据与待检测医疗数据进行特征提取与编码,以得到待检测医疗数据是否存在缺陷的分类结果。这样,通过智能地进行医疗数据检测以提高数据的可信度和可靠性,提高了检测的精度,降低检测的时间成本和人力成本。

Description

一种医疗数据管理方法
技术领域
本申请涉及智能管理领域,且更为具体的涉及一种医疗数据管理。
背景技术
医疗数据的管理和存储对于医院和医生来说非常重要。它们提供了对患者的详细信息,支持医生进行准确的诊断和治疗决策。此外,医疗数据还可以用于研究和统计分析,以改善医疗服务质量和提高患者的康复率。在目前的医疗数据管理方法中,医疗数据通常由医生负责管理,并存储在医院的服务器上。这些数据包括病人在医院治疗过程中的各个方面的信息,如检测设备的设置参数数据、检测设备的检测结果数据、医疗设备的设置参数数据、患者的康复情况数据、医生的诊断数据等。然而,随着医疗数据的不断增长和数字化的进展,医疗数据的来源多样性是一个挑战,因为不同的数据来源可能存在不同的问题,如错误、缺失或不一致性。这些问题可能会对数据的质量和可靠性产生负面影响:1、医疗数据通常来自不同的来源和系统,可能存在格式、单位和标准的差异。这些问题可能导致数据的可读性和准确性下降。2、数据可能会存在缺失或不完整的情况。缺失的数据可能导致信息的丢失或分析结果的偏差。这些问题可能导致数据的准确性和一致性受到影响。传统的对医疗数据进行检测的方法主要是1、统计方法:使用统计学方法对数据进行分析和检测。例如,计算均值、标准差、离群点等统计指标,通过与预期的分布或模式进行比较来检测异常值。这种方法适用于部分数据类型,但对于非线性和复杂的数据关系可能不够准确。2、人工审核:通过人工审核对数据进行检测和校验。这种方法依赖于专业人员的经验和判断力,可以发现一些复杂的异常情况,但是耗时耗力,并且可能存在主观性和一致性的问题
因此,期待一种优化的医疗数据管理方案。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种医疗数据管理方法,其使用基于深度学习模型的人工智能技术来对正常医疗数据与待检测医疗数据进行特征提取与编码,以得到待检测医疗数据是否存在缺陷的分类结果。这样,通过智能地进行医疗数据检测以提高数据的可信度和可靠性,提高了检测的精度,降低检测的时间成本和人力成本。
根据本申请的一个方面,提供了一种医疗数据管理方法,其包括:
获取被标注为正常的医疗数据;
将所述被标注为正常的医疗数据通过包含嵌入层的上下文编码器以得到正常医疗特征向量;
获取待检测医疗数据;
将所述待检测医疗数据中的多个数据项通过包含嵌入层的上下文编码器以得到多个医疗上下文语义特征向量;
将所述多个医疗上下文语义特征向量通过双向长短期记忆神经网络模型以得到第一尺度医疗语义特征向量;
将所述多个医疗上下文语义特征向量进行二维排列为医疗语义特征矩阵后通过双向注意力机制模型以得到第二尺度医疗语义特征向量;
融合所述第一尺度医疗语义特征向量和所述第二尺度医疗语义特征向量以得到待检测医疗特征向量;
计算所述待检测医疗特征向量与所述正常医疗特征向量之间的转移矩阵作为分类特征矩阵;
对所述分类特征矩阵进行先验秩序性的几何非刚性一致化以得到优化分类特征矩阵;
将所述优化分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示待检测医疗数据是否存在缺陷。
在上述的医疗数据管理方法中,将所述待检测医疗数据中的多个数据项通过包含嵌入层的上下文编码器以得到多个医疗上下文语义特征向量,包括:
将所述待检测医疗数据中的多个数据项通过所述上下文编码器的嵌入层以得到多个数据项嵌入向量;
将所述多个数据项嵌入向量输入所述上下文编码器以得到所述多个医疗上下文语义特征向量。
在上述的医疗数据管理方法中,将所述待检测医疗数据中的多个数据项通过所述上下文编码器的嵌入层以得到多个数据项嵌入向量,包括:
通过所述上下文编码器的嵌入层分别将所述各个数据项中的文本数据映射为词嵌入向量;
将所述各个数据项中的数值数据添加到所述各个数据项的词嵌入向量的尾部以得到所述数据项嵌入向量。
在上述的医疗数据管理方法中,将所述多个数据项嵌入向量输入所述上下文编码器以得到所述多个医疗上下文语义特征向量,包括:
将所述多个数据项嵌入向量排列为输入向量;
将所述输入向量分别通过可学习嵌入矩阵转化为查询向量和关键向量;
计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;
对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;
将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;
将所述自注意力特征矩阵与以所述多个数据项嵌入向量中各个数据项嵌入向量作为值向量分别进行相乘以得到所述多个医疗上下文语义特征向量。
在上述的医疗数据管理方法中,将所述多个医疗上下文语义特征向量进行二维排列为医疗语义特征矩阵后通过双向注意力机制模型以得到第二尺度医疗语义特征向量,包括:
将所述医疗语义特征矩阵分别沿着水平方向和垂直方向进行池化以得到第一向池化向量和第二向池化向量;
对所述第一向池化向量和所述第二向池化向量进行关联编码以得到双向关联矩阵;
将所述双向关联矩阵输入Sigmoid激活函数以得到双向关联权重矩阵;
计算所述双向关联权重矩阵和所述医疗语义特征矩阵之间的按位置点乘以得到所述增强特征矩阵;
将所述增强特征矩阵进行沿通道维度的各个特征矩阵的池化处理以得到第二尺度医疗语义特征向量。
在上述的医疗数据管理方法中,融合所述第一尺度医疗语义特征向量和所述第二尺度医疗语义特征向量以得到待检测医疗特征向量,包括:
以如下级联公式融合所述第一尺度医疗语义特征向量和所述第二尺度医疗语义特征向量以得到待检测医疗特征向量;
其中,所述级联公式为:
V=Concat[V1,V2]
其中,V1表示所述第一尺度医疗语义特征向量,V2表示所述第二尺度医疗语义特征向量,M表示所述待检测医疗特征向量,Concat[·,·]表示级联函数。
在上述的医疗数据管理方法中,计算所述待检测医疗特征向量与所述正常医疗特征向量之间的转移矩阵作为分类特征矩阵,包括:
以如下转移公式计算所述待检测医疗特征向量与所述正常医疗特征向量之间的转移矩阵作为分类特征矩阵;
其中,所述转移公式为:
其中,Va表示待检测医疗特征向量,Vb表示所述正常医疗特征向量,表示矩阵乘法,M表示所述分类特征矩阵。
在上述的医疗数据管理方法中,对所述分类特征矩阵进行先验秩序性的几何非刚性一致化以得到优化分类特征矩阵,包括:
以如下优化公式对所述分类特征矩阵进行先验秩序性的几何非刚性一致化以得到优化分类特征矩阵;其中,所述优化公式为:
其中,mi,j表示所述分类特征矩阵中的第(i,j)位置的特征值,表示所述分类特征矩阵中的所有特征值的均值,log表示以2为底的对数函数值,m'i,j表示所述优化分类特征矩阵中的第(i,j)位置的特征值。
在上述的医疗数据管理方法中,将所述优化分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示待检测医疗数据是否存在缺陷,包括:
使用所述分类器以如下分类公式对所述优化分类特征矩阵进行处理以获得所述分类结果;
其中,所述分类公式为:
O=softmax{(Wc,Bc)|Project(F)}
其中,Project(F)表示将所述优化分类特征矩阵投影为向量,Wc为权重矩阵,Bc表示偏置向量,softmax表示归一化指数函数,O表示所述分类结果。
与现有技术相比,本申请提供的医疗数据管理系统,其使用基于深度学习模型的人工智能技术来对正常医疗数据与待检测医疗数据进行特征提取与编码,以得到待检测医疗数据是否存在缺陷的分类结果。这样,通过智能地进行医疗数据检测以提高数据的可信度和可靠性,提高了检测的精度,降低检测的时间成本和人力成本。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1为根据本申请实施例的医疗数据管理方法的流程图。
图2为根据本申请实施例的医疗数据管理方法的架构图。
图3为根据本申请实施例的医疗数据管理方法中将所述待检测医疗数据中的多个数据项通过包含嵌入层的上下文编码器以得到多个医疗上下文语义特征向量的流程图。
图4为根据本申请实施例的医疗数据管理方法中将所述待检测医疗数据中的多个数据项通过所述上下文编码器的嵌入层以得到多个数据项嵌入向量的流程图。
图5为根据本申请实施例的医疗数据管理方法中将所述多个数据项嵌入向量输入所述上下文编码器以得到所述多个医疗上下文语义特征向量的流程图。
图6为根据本申请实施例的电子设备的框图。
具体实施方式
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
示例性方法
图1为根据本申请实施例的医疗数据管理方法的流程图。图2为根据本申请实施例的医疗数据管理方法的架构图。如图1和图2所示,根据本申请实施例的医疗数据管理方法,包括:S110,获取被标注为正常的医疗数据;S120,将所述被标注为正常的医疗数据通过包含嵌入层的上下文编码器以得到正常医疗特征向量;S130,获取待检测医疗数据;S140,将所述待检测医疗数据中的多个数据项通过包含嵌入层的上下文编码器以得到多个医疗上下文语义特征向量;S150,将所述多个医疗上下文语义特征向量通过双向长短期记忆神经网络模型以得到第一尺度医疗语义特征向量;S160,将所述多个医疗上下文语义特征向量进行二维排列为医疗语义特征矩阵后通过双向注意力机制模型以得到第二尺度医疗语义特征向量;S170,融合所述第一尺度医疗语义特征向量和所述第二尺度医疗语义特征向量以得到待检测医疗特征向量;S180,计算所述待检测医疗特征向量与所述正常医疗特征向量之间的转移矩阵作为分类特征矩阵;S190,对所述分类特征矩阵进行先验秩序性的几何非刚性一致化以得到优化分类特征矩阵;以及S200,将所述优化分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示待检测医疗数据是否存在缺陷。
在步骤S110中,获取被标注为正常的医疗数据。如上述背景技术所言,传统的对医疗数据进行检测的方法主要是1、统计方法:使用统计学方法对数据进行分析和检测。例如,计算均值、标准差、离群点等统计指标,通过与预期的分布或模式进行比较来检测异常值。这种方法适用于部分数据类型,但对于非线性和复杂的数据关系可能不够准确。2、人工审核:通过人工审核对数据进行检测和校验。这种方法依赖于专业人员的经验和判断力,可以发现一些复杂的异常情况,但是耗时耗力,并且可能存在主观性和一致性的问题。因此,期待一种优化的医疗数据管理方案。
针对上述技术问题,提出了一种优化的医疗数据管理方案,其使用基于深度学习模型的人工智能技术来对正常医疗数据与待检测医疗数据进行特征提取与编码,以得到待检测医疗数据是否存在缺陷的分类结果。这样,通过智能地进行医疗数据检测以提高数据的可信度和可靠性,提高了检测的精度,降低检测的时间成本和人力成本。
目前,深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、语音信号处理等领域。此外,深度学习以及神经网络在图像分类、物体检测、语义分割、文本翻译等领域,也展现出了接近甚至超越人类的水平。
近年来,深度学习以及神经网络的发展为医疗数据管理方案提供了新的解决思路和方案。
具体地,首先,获取被标注为正常的医疗数据。所述医疗数据包括:检测设备的设置参数数据、检测设备的检测结果数据、医疗设备的设置参数数据、患者的康复情况数据、医生的诊断数据。正常数据可以被认为是没有明显缺陷或异常的数据,代表了医疗数据的正常状态。
在步骤S120中,将所述被标注为正常的医疗数据通过包含嵌入层的上下文编码器以得到正常医疗特征向量。考虑到医疗数据通常包含大量的细节和噪音,直接使用原始数据进行分析和应用可能会导致结果的不准确性。通过使用嵌入层和上下文编码器,可以将医疗数据转化为更具有代表性和抽象性的特征向量,从而提取出数据中的关键信息。医疗数据往往具有高维度的特征空间,使用原始数据进行分析和应用可能会面临维度灾难的问题。通过使用嵌入层和上下文编码器,可以将高维度的医疗数据映射到低维度的特征向量空间,从而减少数据的复杂性和计算复杂度。对所述正常医疗数据的处理方式参考对待检测医疗数据的处理方式。
在步骤S130中,获取待检测医疗数据。通过将待检测数据与正常数据进行比较,可以判断待检测数据是否存在缺陷或异常。
在步骤S140中,将所述待检测医疗数据中的多个数据项通过包含嵌入层的上下文编码器以得到多个医疗上下文语义特征向量。医疗数据由多个数据项组成,这些数据项之间可能存在着内在的关联性。通过将多个数据项输入到嵌入层和上下文编码器中,可以学习到数据项之间的关联性,将其转化为医疗上下文语义特征向量。这样可以更好地捕捉到医疗数据的整体语义信息,有助于后续的分析和应用。医疗数据往往是在特定的上下文中收集和记录的。这些上下文信息对于理解和解释医疗数据的含义和价值非常重要。通过嵌入层和上下文编码器,可以将上下文信息融入到特征向量中,使得特征向量能够更好地反映医疗数据的上下文语义。通过嵌入层和上下文编码器,可以学习到每个数据项的特征表示,并将其转化为医疗上下文语义特征向量。这些特征向量可以捕捉到数据项的重要性、关联性和语义信息,有助于后续的分类、聚类、预测等任务。
图3为根据本申请实施例的医疗数据管理方法中将所述待检测医疗数据中的多个数据项通过包含嵌入层的上下文编码器以得到多个医疗上下文语义特征向量的流程图。如图3所示,将所述待检测医疗数据中的多个数据项通过包含嵌入层的上下文编码器以得到多个医疗上下文语义特征向量,包括:S141,将所述待检测医疗数据中的多个数据项通过所述上下文编码器的嵌入层以得到多个数据项嵌入向量;以及S142,将所述多个数据项嵌入向量输入所述上下文编码器以得到所述多个医疗上下文语义特征向量。
图4为根据本申请实施例的医疗数据管理方法中将所述待检测医疗数据中的多个数据项通过所述上下文编码器的嵌入层以得到多个数据项嵌入向量的流程图。如图4所示,将所述待检测医疗数据中的多个数据项通过所述上下文编码器的嵌入层以得到多个数据项嵌入向量,包括:S1411,通过所述上下文编码器的嵌入层分别将所述各个数据项中的文本数据映射为词嵌入向量;S1412,将所述各个数据项中的数值数据添加到所述各个数据项的词嵌入向量的尾部以得到所述数据项嵌入向量。
图5为根据本申请实施例的医疗数据管理方法中将所述多个数据项嵌入向量输入所述上下文编码器以得到所述多个医疗上下文语义特征向量的流程图。如图5所示,将所述多个数据项嵌入向量输入所述上下文编码器以得到所述多个医疗上下文语义特征向量,包括:S1421,将所述多个数据项嵌入向量排列为输入向量;S1422,将所述输入向量分别通过可学习嵌入矩阵转化为查询向量和关键向量;S1423,计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;S1424,对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;S1425,将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及S1426,将所述自注意力特征矩阵与以所述多个数据项嵌入向量中各个数据项嵌入向量作为值向量分别进行相乘以得到所述多个医疗上下文语义特征向量。
在步骤S150中,将所述多个医疗上下文语义特征向量通过双向长短期记忆神经网络模型以得到第一尺度医疗语义特征向量。为了进一步整合和提取特征,以获取更高层次的医疗语义表示将多个医疗上下文语义特征向量通过双向长短期记忆(BiLSTM)神经网络模型以得到第一尺度医疗语义特征向量。通过BiLSTM模型,可以对多个医疗上下文语义特征向量进行上下文建模。BiLSTM模型能够同时考虑特征向量的前向和后向上下文信息,捕捉到特征序列中的时序依赖关系。这有助于更好地理解和表示医疗数据的上下文语义,提取出更丰富和准确的特征。医疗数据中的信息往往具有长期依赖性,即前面的数据项可能对后面的数据项产生影响。BiLSTM模型通过记忆单元和门控机制,能够有效地捕捉到长期依赖性,并将其反映在特征向量中。这样可以更好地捕捉到医疗数据的时序特征,提高特征的表达能力。
在步骤S160中,将所述多个医疗上下文语义特征向量进行二维排列为医疗语义特征矩阵后通过双向注意力机制模型以得到第二尺度医疗语义特征向量。通过将特征向量排列为矩阵,并应用双向注意力机制模型,可以对特征之间的关联性进行建模。双向注意力机制能够自适应地计算特征之间的相似度或权重,从而捕捉到特征之间的关联关系。这有助于更好地理解和表示医疗数据的关联信息,提高特征的表达能力。通过双向注意力机制模型,可以对特征进行重要性加权。模型可以自动学习到每个特征的重要性权重,将更多的注意力集中在对任务有贡献的特征上。这样可以提高特征的区分度和表达能力,减少不相关特征的干扰。同时,通过双向注意力机制模型,可以将特征矩阵整合为一个第二尺度医疗语义特征向量。这个特征向量综合了特征之间的关联性和重要性信息,能够更全面地反映医疗数据的语义含义。这对于后续的分类、聚类、预测等任务非常有价值。
具体地,在上述的医疗数据管理方法中,将所述多个医疗上下文语义特征向量进行二维排列为医疗语义特征矩阵后通过双向注意力机制模型以得到第二尺度医疗语义特征向量,包括:将所述医疗语义特征矩阵分别沿着水平方向和垂直方向进行池化以得到第一向池化向量和第二向池化向量;对所述第一向池化向量和所述第二向池化向量进行关联编码以得到双向关联矩阵;将所述双向关联矩阵输入Sigmoid激活函数以得到双向关联权重矩阵;计算所述双向关联权重矩阵和所述医疗语义特征矩阵之间的按位置点乘以得到所述增强特征矩阵;以及,将所述增强特征矩阵进行沿通道维度的各个特征矩阵的池化处理以得到第二尺度医疗语义特征向量。
在步骤S170中,融合所述第一尺度医疗语义特征向量和所述第二尺度医疗语义特征向量以得到待检测医疗特征向量。第一尺度医疗语义特征向量和第二尺度医疗语义特征向量分别从不同的角度捕捉了医疗数据的语义信息。融合这两个尺度的特征向量可以综合利用它们的优势,丰富特征的信息内容。这有助于提高待检测医疗特征向量的表达能力和判别性。融合这两个尺度的特征向量可以提供多尺度的视角,更全面地理解和描述医疗数据的语义含义。同时,第一尺度医疗语义特征向量和第二尺度医疗语义特征向量往往具有不同的特点和互补性。融合这两个尺度的特征向量可以弥补彼此的不足,提高特征的全面性和稳健性。这有助于减少特征的偏差和噪声,提高待检测医疗特征向量的准确性和可靠性。
具体地,在上述的医疗数据管理方法中,融合所述第一尺度医疗语义特征向量和所述第二尺度医疗语义特征向量以得到待检测医疗特征向量,包括:以如下级联公式融合所述第一尺度医疗语义特征向量和所述第二尺度医疗语义特征向量以得到待检测医疗特征向量;其中,所述级联公式为:
V=Concat[V1,V2]
其中,V1表示所述第一尺度医疗语义特征向量,V2表示所述第二尺度医疗语义特征向量,M表示所述待检测医疗特征向量,Concat[·,·]表示级联函数。
在步骤S180中,计算所述待检测医疗特征向量与所述正常医疗特征向量之间的转移矩阵作为分类特征矩阵。通过计算转移矩阵,可以将待检测医疗特征向量与正常医疗特征向量进行特征对齐。转移矩阵可以学习到两种类型数据之间的特征映射关系,将它们映射到同一特征空间中。这有助于消除待检测数据与正常数据之间的特征差异,提高分类任务的一致性和准确性。转移矩阵可以捕捉到待检测医疗特征向量与正常医疗特征向量之间的领域差异和转化规律。通过学习转移矩阵,可以实现跨领域的特征泛化,使得模型能够更好地适应待检测医疗数据的特征分布。这对于在缺乏大量待检测数据的情况下进行分类任务非常有帮助。
具体地,在上述的医疗数据管理方法中,计算所述待检测医疗特征向量与所述正常医疗特征向量之间的转移矩阵作为分类特征矩阵,包括:以如下转移公式计算所述待检测医疗特征向量与所述正常医疗特征向量之间的转移矩阵作为分类特征矩阵;其中,所述转移公式为:
其中,Va表示待检测医疗特征向量,Vb表示所述正常医疗特征向量,表示矩阵乘法,M表示所述分类特征矩阵。
在步骤S190中,对所述分类特征矩阵进行先验秩序性的几何非刚性一致化以得到优化分类特征矩阵。在本申请的技术方案中,通过多个步骤对医疗数据进行特征提取和分类。然而,考虑到如果对特征的全局性过度关注,可能会导致局部特征的周期性缺失。具体地,在使用包含嵌入层的上下文编码器将医疗数据转换为特征向量的这一步骤中,将整个医疗数据作为输入,通过编码器得到整体的医疗特征向量。这种处理方式可能会导致一些局部特征在整体特征中被平均或混合,从而丧失了其独特的周期性或变化模式。在使用双向长短期记忆神经网络模型将医疗上下文语义特征向量转换为第一尺度医疗语义特征向量这一步骤中,通过双向长短期记忆神经网络模型对多个医疗上下文语义特征向量进行处理,得到第一尺度的医疗语义特征向量。虽然这个模型可以捕捉到序列数据中的长期依赖关系,但它可能会忽略一些局部的、短期的特征变化。在使用双向注意力机制模型得到第二尺度医疗语义特征向量的这一步骤中,通过双向注意力机制模型对医疗语义特征矩阵进行处理,得到第二尺度的医疗语义特征向量。虽然注意力机制可以帮助模型关注重要的特征,但如果过度关注全局特征,可能会导致对局部特征的忽略。当对特征的全局性过度关注时,模型可能会更加关注整体的数据模式和趋势,而忽略了局部特征的周期性变化。这可能会导致一些局部特征的周期性缺失,使模型对于某些重要的局部特征无法准确捕捉和识别。为了解决这个问题,在本申请技术方案中,对所述分类特征矩阵进行先验秩序性的几何非刚性一致化。
具体地,对所述分类特征矩阵进行先验秩序性的几何非刚性一致化以得到优化分类特征矩阵,包括:以如下优化公式对所述分类特征矩阵进行先验秩序性的几何非刚性一致化以得到优化分类特征矩阵;其中,所述优化公式为:
其中,mi,j表示所述分类特征矩阵中的第(i,j)位置的特征值,表示所述分类特征矩阵中的所有特征值的均值,log表示以2为底的对数函数值,m'i,j表示所述优化分类特征矩阵中的第(i,j)位置的特征值。
对所述分类特征矩阵进行基于先验秩序性的几何非刚性一致化,其可以有效地提高深度神经网络模型在特征提取时的鲁棒性和稳定性。具体地,通过将所述分类特征矩阵的基于先验秩序性的几何非刚性一致化损失解释为单变量差分的负对数,来获得包含特征值的特殊分布的一般性概率分布。相应地,这种分布具有先验秩序性,即特征值按照从大到小的顺序排列,从而保证了特征表达的有效性和紧凑性。同时,通过对特征矩阵进行非线性变换,使得不同位置的特征具有相似的方向和尺度。这样,可以对深度神经网络模型在特征提取时由于过度关注特征全局性而导致的局部特征周期性缺失做出补偿,以与深度神经网络相结合来改进特征表达整体在随机性和周期性缺失影响下的确定性。
在步骤S200中,将所述优化分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示待检测医疗数据是否存在缺陷。通过使用分类器,可以自动对待检测医疗数据进行分类,而无需手动进行人工判断。分类器可以根据输入的优化分类特征矩阵学习出分类模型,并将待检测数据分为不同的类别,例如正常和缺陷。这大大提高了分类的效率和准确性。分类结果可以用于表示待检测医疗数据是否存在缺陷或异常。通过训练分类器,可以使其学习到正常医疗数据和缺陷医疗数据之间的差异和边界。当待检测数据被分类为缺陷类别时,可以推断该数据存在某种异常或缺陷。这有助于及时发现和诊断潜在的问题。
具体地,在上述的医疗数据管理方法中,将所述优化分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示待检测医疗数据是否存在缺陷,包括:使用所述分类器以如下分类公式对所述优化分类特征矩阵进行处理以获得所述分类结果;其中,所述分类公式为:
O=softmax{(Wc,Bc)|Project(F)}
其中,Project(F)表示将所述优化分类特征矩阵投影为向量,Wc为权重矩阵,Bc表示偏置向量,softmax表示归一化指数函数,O表示所述分类结果。
综上,根据本申请实施例的医疗数据管理方法已被阐明,其使用基于深度学习模型的人工智能技术来对正常医疗数据与待检测医疗数据进行特征提取与编码,以得到待检测医疗数据是否存在缺陷的分类结果。这样,通过智能地进行医疗数据检测以提高数据的可信度和可靠性,提高了检测的精度,降低检测的时间成本和人力成本。
示例性电子设备
下面,参考图6来描述根据本申请实施例的电子设备。图6为根据本申请实施例的电子设备的框图。如图6所示,电子设备10包括一个或多个处理器11和存储器12。
处理器11可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备10中的其他组件以执行期望的功能。
存储器12可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器11可以运行所述程序指令,以实现上文所述的本申请的各个实施例的医疗数据管理方法中的功能以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如被标注为正常的医疗数据和待检测医疗数据等各种内容。
在一个示例中,电子设备10还可以包括:输入装置13和输出装置14,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
该输入装置13可以包括例如键盘、鼠标等等。
该输出装置14可以向外部输出各种信息,包括待检测医疗数据是否存在缺陷等。该输出装置14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图6中仅示出了该电子设备10中与本申请有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备10还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的医疗数据管理方法中的功能中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的医疗数据管理方法中的功能中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (9)

1.一种医疗数据管理方法,其特征在于,包括:
获取被标注为正常的医疗数据;
将所述被标注为正常的医疗数据通过包含嵌入层的上下文编码器以得到正常医疗特征向量;
获取待检测医疗数据;
将所述待检测医疗数据中的多个数据项通过包含嵌入层的上下文编码器以得到多个医疗上下文语义特征向量;
将所述多个医疗上下文语义特征向量通过双向长短期记忆神经网络模型以得到第一尺度医疗语义特征向量;
将所述多个医疗上下文语义特征向量进行二维排列为医疗语义特征矩阵后通过双向注意力机制模型以得到第二尺度医疗语义特征向量;
融合所述第一尺度医疗语义特征向量和所述第二尺度医疗语义特征向量以得到待检测医疗特征向量;
计算所述待检测医疗特征向量与所述正常医疗特征向量之间的转移矩阵作为分类特征矩阵;
对所述分类特征矩阵进行先验秩序性的几何非刚性一致化以得到优化分类特征矩阵;
将所述优化分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示待检测医疗数据是否存在缺陷。
2.根据权利要求1所述的医疗数据管理方法,其特征在于,将所述待检测医疗数据中的多个数据项通过包含嵌入层的上下文编码器以得到多个医疗上下文语义特征向量,包括:
将所述待检测医疗数据中的多个数据项通过所述上下文编码器的嵌入层以得到多个数据项嵌入向量;
将所述多个数据项嵌入向量输入所述上下文编码器以得到所述多个医疗上下文语义特征向量。
3.根据权利要求2所述的医疗数据管理方法,其特征在于,将所述待检测医疗数据中的多个数据项通过所述上下文编码器的嵌入层以得到多个数据项嵌入向量,包括:
通过所述上下文编码器的嵌入层分别将所述各个数据项中的文本数据映射为词嵌入向量;
将所述各个数据项中的数值数据添加到所述各个数据项的词嵌入向量的尾部以得到所述数据项嵌入向量。
4.根据权利要求3所述的医疗数据管理方法,其特征在于,将所述多个数据项嵌入向量输入所述上下文编码器以得到所述多个医疗上下文语义特征向量,包括:
将所述多个数据项嵌入向量排列为输入向量;
将所述输入向量分别通过可学习嵌入矩阵转化为查询向量和关键向量;
计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;
对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;
将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;
将所述自注意力特征矩阵与以所述多个数据项嵌入向量中各个数据项嵌入向量作为值向量分别进行相乘以得到所述多个医疗上下文语义特征向量。
5.根据权利要求4所述的医疗数据管理方法,其特征在于,将所述多个医疗上下文语义特征向量进行二维排列为医疗语义特征矩阵后通过双向注意力机制模型以得到第二尺度医疗语义特征向量,包括:
将所述医疗语义特征矩阵分别沿着水平方向和垂直方向进行池化以得到第一向池化向量和第二向池化向量;
对所述第一向池化向量和所述第二向池化向量进行关联编码以得到双向关联矩阵;
将所述双向关联矩阵输入Sigmoid激活函数以得到双向关联权重矩阵;
计算所述双向关联权重矩阵和所述医疗语义特征矩阵之间的按位置点乘以得到所述增强特征矩阵;
将所述增强特征矩阵进行沿通道维度的各个特征矩阵的池化处理以得到第二尺度医疗语义特征向量。
6.根据权利要求5所述的医疗数据管理方法,其特征在于,融合所述第一尺度医疗语义特征向量和所述第二尺度医疗语义特征向量以得到待检测医疗特征向量,包括:
以如下级联公式融合所述第一尺度医疗语义特征向量和所述第二尺度医疗语义特征向量以得到待检测医疗特征向量;
其中,所述级联公式为:
V=Concat[V1,V2]
其中,V1表示所述第一尺度医疗语义特征向量,V2表示所述第二尺度医疗语义特征向量,M表示所述待检测医疗特征向量,Concat[·,·]表示级联函数。
7.根据权利要求6所述的医疗数据管理方法,其特征在于,计算所述待检测医疗特征向量与所述正常医疗特征向量之间的转移矩阵作为分类特征矩阵,包括:
以如下转移公式计算所述待检测医疗特征向量与所述正常医疗特征向量之间的转移矩阵作为分类特征矩阵;
其中,所述转移公式为:
其中,Va表示待检测医疗特征向量,Vb表示所述正常医疗特征向量,表示矩阵乘法,M表示所述分类特征矩阵。
8.根据权利要求7所述的医疗数据管理方法,其特征在于,对所述分类特征矩阵进行先验秩序性的几何非刚性一致化以得到优化分类特征矩阵,包括:
以如下优化公式对所述分类特征矩阵进行先验秩序性的几何非刚性一致化以得到优化分类特征矩阵;其中,所述优化公式为:
其中,mi,j表示所述分类特征矩阵中的第(i,j)位置的特征值,表示所述分类特征矩阵中的所有特征值的均值,log表示以2为底的对数函数值,m'i,j表示所述优化分类特征矩阵中的第(i,j)位置的特征值。
9.根据权利要求8所述的医疗数据管理方法,其特征在于,将所述优化分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示待检测医疗数据是否存在缺陷,包括:
使用所述分类器以如下分类公式对所述优化分类特征矩阵进行处理以获得所述分类结果;
其中,所述分类公式为:O=softmax{(Wc,Bc)|Project(F)},其中project(F)表示将所述优化分类特征矩阵投影为向量,Wc为权重矩阵,Bc表示偏置向量,softmax表示归一化指数函数,O表示所述分类结果。
CN202311510419.7A 2023-11-14 2023-11-14 一种医疗数据管理方法 Pending CN117316462A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311510419.7A CN117316462A (zh) 2023-11-14 2023-11-14 一种医疗数据管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311510419.7A CN117316462A (zh) 2023-11-14 2023-11-14 一种医疗数据管理方法

Publications (1)

Publication Number Publication Date
CN117316462A true CN117316462A (zh) 2023-12-29

Family

ID=89255393

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311510419.7A Pending CN117316462A (zh) 2023-11-14 2023-11-14 一种医疗数据管理方法

Country Status (1)

Country Link
CN (1) CN117316462A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117831698A (zh) * 2024-03-04 2024-04-05 吉林大学 用于护理病历的智能质量控制系统及方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117831698A (zh) * 2024-03-04 2024-04-05 吉林大学 用于护理病历的智能质量控制系统及方法
CN117831698B (zh) * 2024-03-04 2024-05-24 吉林大学 用于护理病历的智能质量控制系统及方法

Similar Documents

Publication Publication Date Title
US11790171B2 (en) Computer-implemented natural language understanding of medical reports
CN107516110B (zh) 一种基于集成卷积编码的医疗问答语义聚类方法
EP3956901A1 (en) Computer-implemented natural language understanding of medical reports
CN112149414B (zh) 文本相似度确定方法、装置、设备及存储介质
Ji et al. A novel deep learning approach for anomaly detection of time series data
CN117251699B (zh) 基于人工智能的医疗大数据分析方法及系统
US11520993B2 (en) Word-overlap-based clustering cross-modal retrieval
CN115796173A (zh) 针对监管报送需求的数据处理方法和系统
CN116580849B (zh) 医疗数据的采集分析系统及其方法
CN116665086A (zh) 一种基于学习行为智能分析的教学方法及系统
CN117316462A (zh) 一种医疗数据管理方法
CN116257406A (zh) 用于智慧城市的网关数据管理方法及其系统
CN116975728B (zh) 用于煤层气钻井工程的安全管理方法及其系统
CN116245513A (zh) 基于规则库的自动化运维系统及其方法
CN116759053A (zh) 基于物联网系统的医疗体系防控方法及系统
CN117438087A (zh) 基于健康监测数据分析的健康管理方法及系统
CN116561748A (zh) 一种组件子序列相关性感知的日志异常检测装置
CN117831698B (zh) 用于护理病历的智能质量控制系统及方法
CN117421655A (zh) 工业互联网数据流异常检测方法及系统
CN116739219A (zh) 熔喷布生产管理系统及其方法
CN116912072A (zh) 水产运输管理系统及其方法
CN111562943A (zh) 一种基于事件嵌入树及gat网络的代码克隆检测方法和装置
CN118093885B (zh) 一种数据处理方法、装置及设备、介质、产品
CN117633514A (zh) 智慧实验室的智能管理平台及其方法
CN116777295B (zh) 一种基于数据智能的医药追溯系统及其方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination