CN117556265A - 一种检测指标预测方法、装置、设备及存储介质 - Google Patents

一种检测指标预测方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN117556265A
CN117556265A CN202410041556.9A CN202410041556A CN117556265A CN 117556265 A CN117556265 A CN 117556265A CN 202410041556 A CN202410041556 A CN 202410041556A CN 117556265 A CN117556265 A CN 117556265A
Authority
CN
China
Prior art keywords
index
detection index
prediction
historical
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410041556.9A
Other languages
English (en)
Inventor
马鹤桐
李姣
郝洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Medical Information CAMS
Original Assignee
Institute of Medical Information CAMS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Medical Information CAMS filed Critical Institute of Medical Information CAMS
Priority to CN202410041556.9A priority Critical patent/CN117556265A/zh
Publication of CN117556265A publication Critical patent/CN117556265A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种检测指标预测方法、装置、设备及存储介质,通过将第一历史检测指标输入,基于将结构化特征数据和非结构化特征数据进行特征融合得到的第一特征数据及第四历史检测指标对预测模型进行训练获得的第一指标预测模型,获得第一历史预测结果以及第一指标预测模型对应的中间层输出向量;基于该中间层输出向量、第一历史预测结果以及第二历史检测指标,对第一指标预测模型的第一模型参数进行调节,获得第二模型参数。将第二历史检测指标输入第二模型参数对应的第二指标预测模型,获得检测指标预测结果。本申请中利用基于多个时间段的历史检测指标来进行检测指标预测,考虑了检测指标的动态变化,可以有效提高检测指标预测的准确性。

Description

一种检测指标预测方法、装置、设备及存储介质
技术领域
本申请涉及数据处理技术领域,特别是涉及一种检测指标预测方法、装置、设备及存储介质。
背景技术
检测指标预测,是指利用已有的检测指标数据对未来的检测指标数据进行预测的一种数据分析方法。在数字化发展的背景下,检测指标预测方法的应用日益广泛。
在实际的应用场景中,可以基于过去某一时间段的检测指标,对未来的检测指标进行预测。由于检测指标随着时间的推移,可能会发生变化,而目前基于过去某一时间段的检测指标,来对未来的检测指标进行静态预测的过程中,并未考虑检测指标的动态变化对检测指标预测结果的影响,进而导致现有的检测指标预测方法具有准确率低的问题。
发明内容
基于上述问题,本申请提供了一种检测指标预测方法、装置、设备及存储介质。
本申请实施例公开了如下技术方案:
第一方面:本申请提供一种检测指标预测方法,包括:
对用户的第一历史检测指标进行信息提取,获得所述第一历史检测指标对应的结构化指标和所述第一历史检测指标对应的非结构化指标;
对所述第一历史检测指标对应的结构化指标和所述第一历史检测指标对应的非结构化指标进行特征提取,获得所述结构化指标对应的结构化特征数据和所述非结构化指标对应的非结构化特征数据;
将所述结构化特征数据和所述非结构化特征数据进行特征融合,并基于特征融合得到的第一特征数据及第四历史检测指标对预测模型进行训练,获得第一指标预测模型;
将所述第一历史检测指标输入所述第一指标预测模型进行预测,获得第一历史预测结果以及所述第一指标预测模型对应的中间层输出向量;
基于所述第一指标预测模型对应的中间层输出向量、所述第一历史预测结果以及第二历史检测指标,对所述第一指标预测模型的第一模型参数进行调节,获得第二模型参数,所述第二历史检测指标的生成时间在所述第一历史检测指标及所述第四历史检测指标的生成时间之后;
将所述第二历史检测指标输入所述第二模型参数对应的第二指标预测模型,对所述用户的当前检测指标进行预测,获得检测指标预测结果。
在一种可能的实现方式中,所述将所述结构化特征数据和所述非结构化特征数据进行特征融合,并基于特征融合得到的第一特征数据及第四历史检测指标对预测模型进行训练,获得第一指标预测模型,包括:
根据所述结构化特征数据的维数,对所述非结构化特征数据的维数进行调整,获得调整维数后的非结构化特征数据;
将所述结构化特征数据和所述调整维数后的非结构化特征数据进行特征融合,并基于特征融合得到的第一特征数据及第四历史检测指标对预测模型进行训练,获得第一指标预测模型。
在一种可能的实现方式中,所述基于所述第一指标预测模型对应的中间层输出向量、所述第一历史预测结果以及第二历史检测指标,对所述第一指标预测模型的第一模型参数进行调节,获得第二模型参数,包括:
基于所述第一指标预测模型对应的中间层输出向量、所述第一历史预测结果以及第三历史检测指标,对所述第一指标预测模型的第一模型参数进行调节,获得第三模型参数,所述第三历史检测指标的生成时间在所述第一历史检测指标和所述第四历史检测指标生成时间之后,所述第三历史检测指标的生成时间在所述第二历史检测指标的生成时间之前;
将所述第三历史检测指标输入所述第三模型参数对应的第三指标预测模型,对所述用户的第二历史检测指标进行预测,获得第二历史预测结果以及所述第三指标预测模型对应的中间层输出向量;
基于所述第三指标预测模型对应的中间层输出向量、所述第二历史预测结果以及第二历史检测指标,对所述第三指标预测模型的第三模型参数进行调节,获得所述第二模型参数。
在一种可能的实现方式中,所述基于所述第一指标预测模型对应的中间层输出向量、所述第一历史预测结果以及第二历史检测指标,对所述第一指标预测模型的第一模型参数进行调节,获得第二模型参数,包括:
将所述第一历史预测结果和所述第二历史检测指标进行比对,获得预测误差;
基于所述第一指标预测模型对应的中间层输出向量和所述预测误差,对所述第一指标预测模型的第一模型参数进行调节,获得第二模型参数。
在一种可能的实现方式中,所述检测指标预测结果用预设的字段项表示。
第二方面:本申请提供一种检测指标预测装置,包括:
信息提取单元、特征提取单元、训练单元、第一预测单元、调节单元以及第二预测单元;
所述信息提取单元,用于对用户的第一历史检测指标进行信息提取,获得所述第一历史检测指标对应的结构化指标和所述第一历史检测指标对应的非结构化指标;
所述特征提取单元,用于对所述第一历史检测指标对应的结构化指标和所述第一历史检测指标对应的非结构化指标进行特征提取,获得所述结构化指标对应的结构化特征数据和所述非结构化指标对应的非结构化特征数据;
所述训练单元,用于将所述结构化特征数据和所述非结构化特征数据进行特征融合,并基于特征融合得到的第一特征数据及第四历史检测指标对预测模型进行训练,获得第一指标预测模型;
所述第一预测单元,用于将所述第一历史检测指标输入所述第一指标预测模型进行预测,获得第一历史预测结果以及所述第一指标预测模型对应的中间层输出向量;
所述调节单元,用于基于所述第一指标预测模型对应的中间层输出向量、所述第一历史预测结果以及第二历史检测指标,对所述第一指标预测模型的第一模型参数进行调节,获得第二模型参数,所述第二历史检测指标的生成时间在所述第一历史检测指标及所述第四历史检测指标的生成时间之后;
所述第二预测单元,用于将所述第二历史检测指标输入所述第二模型参数对应的第二指标预测模型,对所述用户的当前检测指标进行预测,获得检测指标预测结果。
在一种可能的实现方式中,所述训练单元,包括:维数调整子单元和训练子单元;
所述维数调整子单元,用于根据所述结构化特征数据的维数,对所述非结构化特征数据的维数进行调整,获得调整维数后的非结构化特征数据;
所述训练子单元,用于将所述结构化特征数据和所述调整维数后的非结构化特征数据进行特征融合,并基于特征融合得到的第一特征数据及第四历史检测指标对预测模型进行训练,获得第一指标预测模型。
在一种可能的实现方式中,所述调节单元,包括:
第一模型参数调节子单元、第二历史检测指标预测子单元和第三模型参数调节子单元;
所述第一模型参数调节子单元,用于基于所述第一指标预测模型对应的中间层输出向量、所述第一历史预测结果以及第三历史检测指标,对所述第一指标预测模型的第一模型参数进行调节,获得第三模型参数,所述第三历史检测指标的生成时间在所述第一历史检测指标和所述第四历史检测指标生成时间之后,所述第三历史检测指标的生成时间在所述第二历史检测指标的生成时间之前;
所述第二历史检测指标预测子单元,用于将所述第三历史检测指标输入所述第三模型参数对应的第三指标预测模型,对所述用户的第二历史检测指标进行预测,获得第二历史预测结果以及所述第三指标预测模型对应的中间层输出向量;
所述第三模型参数调节子单元,用于基于所述第三指标预测模型对应的中间层输出向量、所述第二历史预测结果以及第二历史检测指标,对所述第三指标预测模型的第三模型参数进行调节,获得所述第二模型参数。
在一种可能的实现方式中,所述调节单元,包括:
比对子单元和调节子单元;
所述比对子单元,用于将所述第一历史预测结果和所述第二历史检测指标进行比对,获得预测误差;
所述调节子单元,用于基于所述第一指标预测模型对应的中间层输出向量和所述预测误差,对所述第一指标预测模型的第一模型参数进行调节,获得第二模型参数。
在一种可能的实现方式中,所述检测指标预测结果用预设的字段项表示。
第三方面:本申请提供一种电子设备,所述电子设备包括:处理器以及存储器;
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行如上所述的一种检测指标预测方法的步骤。
第四方面:本申请提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的一种检测指标预测方法的步骤。
相较于现有技术,本申请具有以下有益效果:
本申请提供一种检测指标预测方法、装置、设备及存储介质,通过对用户的第一历史检测指标进行信息提取,获得第一历史检测指标对应的结构化指标和第一历史检测指标对应的非结构化指标;对第一历史检测指标对应的结构化指标和第一历史检测指标对应的非结构化指标进行特征提取,获得结构化指标对应的结构化特征数据和非结构化指标对应的非结构化特征数据;将结构化特征数据和非结构化特征数据进行特征融合,获得第一历史检测指标对应的第一特征数据;基于第一特征数据及第四历史检测指标进行模型训练,获得第一指标预测模型;将第一历史检测指标输入第一指标预测模型进行预测,获得第一历史预测结果以及第一指标预测模型对应的中间层输出向量;基于第一指标预测模型对应的中间层输出向量、第一历史预测结果以及第二历史检测指标,对第一指标预测模型的第一模型参数进行调节,获得第二模型参数,第二历史检测指标的生成时间在第一历史检测指标的生成时间之后;将第二历史检测指标输入第二模型参数对应的第二指标预测模型,对用户的当前检测指标进行预测,获得检测指标预测结果。本申请中利用基于多个时间段的历史检测指标,即利用基于第一历史检测指标和第二历史检测指标来进行模型训练获得的第二指标预测模型,来进行检测指标预测,考虑了检测指标的动态变化,可以有效提高检测指标预测的准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种检测指标预测方法的流程图;
图2为本申请实施例提供的一种调节特征数据维数的示意图;
图3为本申请实施例提供的一种获得第二模型参数的示意图;
图4为本申请实施例提供的一种检测指标预测模型的示意图;
图5为本申请实施例提供的一种检测指标预测装置的结构示意图。
具体实施方式
正如前文描述,目前如何提高检测指标预测的准确性成为本领域技术人员亟待解决的技术问题。
在实际的应用场景中,可以基于过去某一时间段的检测指标,对未来的检测指标进行预测。由于检测指标随着时间的推移,可能会发生变化。而目前基于过去某一时间段的检测指标,来对未来的检测指标进行静态预测的过程中,并未考虑检测指标的动态变化对检测指标预测结果的影响,进而导致现有的检测指标预测方法具有准确率低的问题。
示例性的,许多疾病在发病时,需要在有限的时间内对患者进行救治。为了能够为患者提供及时的治疗,可以通过用户的历史检测指标对患者发生疾病的概率进行预测,以便提前采取对应的预防措施。
基于目前的检测指标预测方法,可以基于用户的过去某一时间段的检测指标,对用户近期或者未来某一段时间的检测指标进行预测。然而,由于用户的身体状况是处于不断变换当中的,例如用户在过去某一段时间的身体状况不佳,但是近期由于采取了一定的措施,使得用户的身体状况有所好转。若仅采用该用户身体状况不佳时的那一次检测指标,对用户近期的发病概率进行预测,则该预测过程并未考虑到用户后来身体状态已经有所好转这一变化,进而导致检测指标预测结果不准确,其检测指标预测结果不能为用户提供有效的参考。
基于此,本申请提供一种检测指标预测方法,利用基于多个时间段的历史检测指标,即利用基于第一历史检测指标、第四历史检测指标和第二历史检测指标来进行模型训练获得的第二指标预测模型,来进行检测指标预测,考虑了检测指标的动态变化,可以有效提高检测指标预测的准确性。与此同时,基于本申请提供的检测指标预测方法,可以减少用户的实际检测次数,节省用户的检测时间以及经济支出。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,本申请所涉及的用户信息和数据(包括但不限于用户的第一历史检测指标、第二历史检测指标,以及用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
参见图1,该图为本申请实施例提供的一种检测指标预测方法的流程图,包括S101-S106。
S101、对用户的第一历史检测指标进行信息提取,获得所述第一历史检测指标对应的结构化指标和所述第一历史检测指标对应的非结构化指标。
示例性的,用户的第一历史检测指标,以及后续涉及的第二历史检测指标、第三历史检测指标可以包括用户的电子病历、检查报告等中的数据。在一示例中,用户的第一历史检测指标、第二历史检测指标,以及第三历史检测指标为可以表征用户的身体状态的指标。
本申请实施例中,用户的第一历史检测指标可以由结构化指标和非结构化指标构成。其中,结构化指标可以为表格、数据库等按照一定格式表示的指标数据;非结构化指标可以为文本、音频、视频、图片等指标数据。
以第一历史检测指标为用户在过去某段时间的电子病历为例,非结构化指标可以包括核磁共振成像(MRI)影像报告中的数据等,结构化指标可以包括血液指标检查数据等。
S102、对所述第一历史检测指标对应的结构化指标和所述第一历史检测指标对应的非结构化指标进行特征提取,获得所述结构化指标对应的结构化特征数据和所述非结构化指标对应的非结构化特征数据。
示例性的,对于第一历史检测指标对应的非结构化指标,可以采用来自变压器的双向编码器表示(Bidirectional Encoder Representations from Transformers,BERT)等自然语言处理模型对其进行特征提取,获得非结构化特征数据。
S103、将所述结构化特征数据和所述非结构化特征数据进行特征融合,并基于特征融合得到的第一特征数据及第四历史检测指标对预测模型进行训练,获得第一指标预测模型。
在获得结构化特征数据和非结构化特征数据后,可以通过将结构化特征数据与非结构化特征数据拼接的方式进行特征融合,获得第一特征数据。
由于通常情况下,非结构化特征数据占比较大,预测结果可能会因其占比较大而向非结构化指标偏移,导致预测结果不准确。进而在一种可能的实现方式中,可以根据所述结构化特征数据的维数,对所述非结构化特征数据的维数进行调整,获得调整维数后的非结构化特征数据。将所述结构化特征数据和所述调整维数后的非结构化特征数据进行特征融合,并基于特征融合得到的第一特征数据及第四历史检测指标对预测模型进行训练,获得第一指标预测模型。
示例性的,如图2所示,该图为本申请实施例提供的一种调节特征数据维数的示意图。本申请实施例中可以采用BERT等自然语言处理模型对非结构化指标进行向量化表示。在自然语言处理模型的最后一层后面添加一层结构,其神经元数目N根据结构化特征数据的特征数量确定,N为正整数,其数值可以上下浮动,但与结构化特征数据的特征数量在同一量级,以防非结构化指标对应的特征过多,而降低检测指标预测结果的准确性。
在获得调整维数后的非结构化特征数据之后,可以将所述结构化特征数据与所述调整维数后的非结构化特征数据进行拼接,获得所述第一历史检测指标对应的第一特征数据。
S104、将所述第一历史检测指标输入所述第一指标预测模型进行预测,获得第一历史预测结果以及所述第一指标预测模型对应的中间层输出向量。
示例性的,第一历史检测指标可以是血检和影像报告,第四历史检测指标可以是与第一历史检测指标同期或者是之后不久做的评分指标,如美国国立卫生研究院卒中量表(National Institute of Health stroke scale,NIHSS)评分等。本申请实施例中可以以第四历史检测指标作为第一指标预测模型的输出,以基于第一历史检测指标提取出来的特征数据作为第一指标预测模型的输入去训练模型的参数,实现参数优化,获得第二指标预测模型。
S105、基于所述第一指标预测模型对应的中间层输出向量、所述第一历史预测结果以及第二历史检测指标,对所述第一指标预测模型的第一模型参数进行调节,获得第二模型参数。
其中,所述第二历史检测指标的生成时间在所述第一历史检测指标及所述第四历史检测指标的生成时间之后。
在一种可能的实现方式中,可以将所述第一历史预测结果和所述第二历史检测指标进行比对,获得预测误差;基于所述第一指标预测模型对应的中间层输出向量和所述预测误差,对所述第一指标预测模型的第一模型参数进行调节,获得第二模型参数。将所述第一历史预测结果和所述第二历史检测指标进行比对相当于将预测结果与实际的真实指标数据进行比对,从而获得预测误差来对第一模型参数进行调节。
在一示例中,用户的第一历史检测指标为用户3年前的检测指标,用户的第二历史检测指标为用户1年前的检测指标。则可以以3年前的检测指标作为输入,进行模型训练得到第一指标预测模型。将该3年前的检测指标输入该训练完成的第一指标预测模型,可以得到第一指标预测模型的中间层输出向量和第一历史预测结果。将该第一历史预测结果和1年前的检测指标进行比对,可以获得预测误差,基于该预测误差可以对所述第一指标预测模型的第一模型参数进行调节,获得第二模型参数。
示例性的,如图3所示,该图为本申请实施例提供的一种获得第二模型参数的示意图。将用户的第一特征数据作为模型的输入,通过训练得到第一指标预测模型和第一特征数据对应的第一历史预测结果。在获得第一指标预测模型后,可以取出训练完成时的第一指标预测模型中修正线性单元(Rectifying Linear Units,Relu)之前的隐藏层,即中间层输出向量。
可以基于第一指标预测模型的中间层输出向量、第一历史预测结果与所述用户的第二历史检测指标对该第一指标预测模型的第一模型参数进行调节,以得到第二模型参数,该第二模型参数对应第二指标预测模型。
如图4所示,该图为本申请实施例提供的一种检测指标预测模型的示意图。本申请实施例中,基于所述第一指标预测模型的中间层输出向量、第一历史预测结果与所述用户的第二历史检测指标,对所述第一指标预测模型的第一模型参数进行调节,获得第二模型参数。在得到第二模型参数后,可以执行S106、将所述第二历史检测指标输入所述第二模型参数对应的第二指标预测模型,对所述用户的当前检测指标进行预测,获得检测指标预测结果。
在一种可能的实现方式中,所述检测指标预测结果用预设的字段项表示。例如一段时间后用户的检测指标,或各方面的评分,如NIHSS评分等。
以用户的第一历史检测指标为用户3年前的检测指标,用户的第二历史检测指标为用户1年前的检测指标为例,第二模型参数是基于用户3年前的检测指标和用户1年前的检测指标对第一模型参数进行调节获得的,在将用户1年前的检测指标输入第二模型参数对应的第二指标预测模型,进行检测指标预测的过程中考虑到了用户的检测指标的动态变化情况,由此基于第二指标预测模型获得的检测指标预测结果可以更加准确。
需要说明的是,本申请中可以基于多个时间段的历史检测指标对第一模型参数进行调节以获得调节后的该第二模型参数,本申请中对时间段的数量不作具体限定,示例性的,本申请中可以基于至少两个时间段的历史检测指标以进行检测指标预测。同时,本申请对不同时间段之间的间隔也不做具体限定。
可以理解的时,上述仅以用户1年前和3年前的检测指标为例进行说明。示例性的,本申请中可以基于用户1个月前和1年前的检测指标进行检测指标预测,也可以基于用户1个月前、3个月前和1年前的检测指标进行检测指标预测,本申请对此不做具体限定。
在一种可能的实现方式中,可以基于所述第一指标预测模型对应的中间层输出向量、所述第一历史预测结果以及第三历史检测指标,对所述第一指标预测模型的第一模型参数进行调节,获得第三模型参数。
其中,所述第三历史检测指标的生成时间在所述第一历史检测指标和所述第四历史检测指标生成时间之后,所述第三历史检测指标的生成时间在所述第二历史检测指标的生成时间之前。
在通过调节获得第三模型参数后,可以将所述第三历史检测指标输入所述第三模型参数对应的第三指标预测模型,对所述用户的第二历史检测指标进行预测,获得第二历史预测结果以及所述第三指标预测模型对应的中间层输出向量;基于所述第三指标预测模型对应的中间层输出向量、所述第二历史预测结果以及第二历史检测指标,对所述第三指标预测模型的第三模型参数进行调节,获得所述第二模型参数。
示例性的,用户的第二历史检测指标可以为用户5年前的检测指标,第三历史检测指标可以为用户3年前的检测指标,用户的第一历史检测指标可以为用户1年前的检测指标。
在此情况下,可以以5年前的检测指标作为输入,进行模型训练得到第一指标预测模型。将该5年前的检测指标输入该训练完成的第一指标预测模型,可以得到5年前的检测数据对应的检测指标预测结果,即第一历史预测结果。基于该第一指标预测模型的中间层输出向量和3年前的检测指标,以及第一历史预测结果,可以对该第一指标预测模型的第一模型参数进行调节,获得第三模型参数。基于该第三模型参数进行模型训练,得到第三指标预测模型。
将3年前的检测指标输入该第三指标预测模型,可以得到3年前的检测指标对应的检测指标预测结果,即第二历史预测结果。基于该历史预测结果、第三指标预测模型的中间层输出向量和1年前的检测指标,可以对该第三模型参数进行调节,获得第二模型参数。
将1年前的检测指标输入该第二模型参数对应的第二指标预测模型,可以对所述用户的当前检测指标进行预测,获得检测指标预测结果。
此时,第二指标预测模型是基于5年前,3年前和1年前的检测指标进行训练得到的,在将1年前的检测指标输入该第二指标预测模型进行检测指标预测的过程中,考虑到了用户的检测指标的动态变化情况,由此基于第二指标预测模型获得的检测指标预测结果可以更加准确,可以基于该检测指标预测结果了解用户近期或未来一段时间内的检测指标变化方向以及可能发生变化的程度,以便可以提前采取相关措施。
在本申请实施例中,可以基于用户在多个不同时间段的检测指标,对用户近期或者未来一段时间的检测指标进行预测,采取的时间段越多,获得的检测指标预测结果越准确。
综上所述,本申请提供一种检测指标预测方法,利用基于多个时间段的历史检测指标,即利用基于第一历史检测指标和第二历史检测指标来进行模型训练获得的第二指标预测模型,来进行检测指标预测,考虑了检测指标的动态变化,可以有效提高检测指标预测的准确性。与此同时,基于本申请提供的检测指标预测方法,可以减少用户的实际检测次数,节省用户的检测时间以及经济支出。
在对用户的发病概率进行预测的应用场景中,基于用户在不同阶段的检测指标,可以实现对用户状态的动态预测,提高检测指标预测结果的准确性,便于了解用户的病情可能发生变化的方向以及可能发生变化的程度,从而提前采取对应的措施,辅助用户进行病情改善。
本申请提供一种检测指标预测装置,参见图5,该图为本申请实施例提供的一种检测指标预测装置的结构示意图,其具体实现方式与上述方法的实施例中记载的实施方式、所达到的技术效果一致,部分内容不再赘述。
本申请提供一种检测指标预测装置1100,包括:
信息提取单元1101、特征提取单元1102、训练单元1103、第一预测单元1104、调节单元1105以及第二预测单元1106;
所述信息提取单元1101,用于对用户的第一历史检测指标进行信息提取,获得所述第一历史检测指标对应的结构化指标和所述第一历史检测指标对应的非结构化指标;
所述特征提取单元1102,用于对所述第一历史检测指标对应的结构化指标和所述第一历史检测指标对应的非结构化指标进行特征提取,获得所述结构化指标对应的结构化特征数据和所述非结构化指标对应的非结构化特征数据;
所述训练单元1103,用于将所述结构化特征数据和所述非结构化特征数据进行特征融合,并基于特征融合得到的第一特征数据及第四历史检测指标对预测模型进行训练,获得第一指标预测模型;
所述第一预测单元1104,用于将所述第一历史检测指标输入所述第一指标预测模型进行预测,获得第一历史预测结果以及所述第一指标预测模型对应的中间层输出向量;
所述调节单元1105,用于基于所述第一指标预测模型对应的中间层输出向量、所述第一历史预测结果以及第二历史检测指标,对所述第一指标预测模型的第一模型参数进行调节,获得第二模型参数,所述第二历史检测指标的生成时间在所述第一历史检测指标及所述第四历史检测指标的生成时间之后;
所述第二预测单元1106,用于将所述第二历史检测指标输入所述第二模型参数对应的第二指标预测模型,对所述用户的当前检测指标进行预测,获得检测指标预测结果。
在一种可能的实现方式中,所述训练单元,包括:维数调整子单元和训练子单元;
所述维数调整子单元,用于根据所述结构化特征数据的维数,对所述非结构化特征数据的维数进行调整,获得调整维数后的非结构化特征数据;
所述训练子单元,用于将所述结构化特征数据和所述调整维数后的非结构化特征数据进行特征融合,并基于特征融合得到的第一特征数据及第四历史检测指标对预测模型进行训练,获得第一指标预测模型。
在一种可能的实现方式中,所述调节单元,包括:
第一模型参数调节子单元、第二历史检测指标预测子单元和第三模型参数调节子单元;
所述第一模型参数调节子单元,用于基于所述第一指标预测模型对应的中间层输出向量、所述第一历史预测结果以及第三历史检测指标,对所述第一指标预测模型的第一模型参数进行调节,获得第三模型参数,所述第三历史检测指标的生成时间在所述第一历史检测指标和所述第四历史检测指标生成时间之后,所述第三历史检测指标的生成时间在所述第二历史检测指标的生成时间之前;
所述第二历史检测指标预测子单元,用于将所述第三历史检测指标输入所述第三模型参数对应的第三指标预测模型,对所述用户的第二历史检测指标进行预测,获得第二历史预测结果以及所述第三指标预测模型对应的中间层输出向量;
所述第三模型参数调节子单元,用于基于所述第三指标预测模型对应的中间层输出向量、所述第二历史预测结果以及第二历史检测指标,对所述第三指标预测模型的第三模型参数进行调节,获得所述第二模型参数。
在一种可能的实现方式中,所述调节单元,包括:
比对子单元和调节子单元;
所述比对子单元,用于将所述第一历史预测结果和所述第二历史检测指标进行比对,获得预测误差;
所述调节子单元,用于基于所述第一指标预测模型对应的中间层输出向量和所述预测误差,对所述第一指标预测模型的第一模型参数进行调节,获得第二模型参数。
在一种可能的实现方式中,所述检测指标预测结果用预设的字段项表示。
综上所述,本申请提供的装置,利用基于多个时间段的历史检测指标,即利用基于第一历史检测指标和第二历史检测指标来进行模型训练获得的第二指标预测模型,来进行检测指标预测,考虑了检测指标的动态变化,可以有效提高检测指标预测的准确性。与此同时,基于本申请提供的检测指标预测装置,可以减少用户的实际检测次数,节省用户的检测时间以及经济支出。
本申请提供一种电子设备,所述电子设备包括:处理器以及存储器;
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行如上所述的一种检测指标预测方法的步骤。
本申请提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的一种检测指标预测方法的步骤。
以上所述,仅为本申请的一种具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。

Claims (10)

1.一种检测指标预测方法,其特征在于,包括:
对用户的第一历史检测指标进行信息提取,获得所述第一历史检测指标对应的结构化指标和所述第一历史检测指标对应的非结构化指标;
对所述第一历史检测指标对应的结构化指标和所述第一历史检测指标对应的非结构化指标进行特征提取,获得所述结构化指标对应的结构化特征数据和所述非结构化指标对应的非结构化特征数据;
将所述结构化特征数据和所述非结构化特征数据进行特征融合,并基于特征融合得到的第一特征数据及第四历史检测指标对预测模型进行训练,获得第一指标预测模型;
将所述第一历史检测指标输入所述第一指标预测模型进行预测,获得第一历史预测结果以及所述第一指标预测模型对应的中间层输出向量;
基于所述第一指标预测模型对应的中间层输出向量、所述第一历史预测结果以及第二历史检测指标,对所述第一指标预测模型的第一模型参数进行调节,获得第二模型参数,所述第二历史检测指标的生成时间在所述第一历史检测指标及所述第四历史检测指标的生成时间之后;
将所述第二历史检测指标输入所述第二模型参数对应的第二指标预测模型,对所述用户的当前检测指标进行预测,获得检测指标预测结果。
2.根据权利要求1所述的方法,其特征在于,所述将所述结构化特征数据和所述非结构化特征数据进行特征融合,并基于特征融合得到的第一特征数据及第四历史检测指标对预测模型进行训练,获得第一指标预测模型,包括:
根据所述结构化特征数据的维数,对所述非结构化特征数据的维数进行调整,获得调整维数后的非结构化特征数据;
将所述结构化特征数据和所述调整维数后的非结构化特征数据进行特征融合,并基于特征融合得到的第一特征数据及第四历史检测指标对预测模型进行训练,获得第一指标预测模型。
3.根据权利要求1所述的方法,其特征在于,所述基于所述第一指标预测模型对应的中间层输出向量、所述第一历史预测结果以及第二历史检测指标,对所述第一指标预测模型的第一模型参数进行调节,获得第二模型参数,包括:
基于所述第一指标预测模型对应的中间层输出向量、所述第一历史预测结果以及第三历史检测指标,对所述第一指标预测模型的第一模型参数进行调节,获得第三模型参数,所述第三历史检测指标的生成时间在所述第一历史检测指标和所述第四历史检测指标生成时间之后,所述第三历史检测指标的生成时间在所述第二历史检测指标的生成时间之前;
将所述第三历史检测指标输入所述第三模型参数对应的第三指标预测模型,对所述用户的第二历史检测指标进行预测,获得第二历史预测结果以及所述第三指标预测模型对应的中间层输出向量;
基于所述第三指标预测模型对应的中间层输出向量、所述第二历史预测结果以及第二历史检测指标,对所述第三指标预测模型的第三模型参数进行调节,获得所述第二模型参数。
4.根据权利要求1所述的方法,其特征在于,所述基于所述第一指标预测模型对应的中间层输出向量、所述第一历史预测结果以及第二历史检测指标,对所述第一指标预测模型的第一模型参数进行调节,获得第二模型参数,包括:
将所述第一历史预测结果和所述第二历史检测指标进行比对,获得预测误差;
基于所述第一指标预测模型对应的中间层输出向量和所述预测误差,对所述第一指标预测模型的第一模型参数进行调节,获得第二模型参数。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述检测指标预测结果用预设的字段项表示。
6.一种检测指标预测装置,其特征在于,包括:
信息提取单元、特征提取单元、训练单元、第一预测单元、调节单元以及第二预测单元;
所述信息提取单元,用于对用户的第一历史检测指标进行信息提取,获得所述第一历史检测指标对应的结构化指标和所述第一历史检测指标对应的非结构化指标;
所述特征提取单元,用于对所述第一历史检测指标对应的结构化指标和所述第一历史检测指标对应的非结构化指标进行特征提取,获得所述结构化指标对应的结构化特征数据和所述非结构化指标对应的非结构化特征数据;
所述训练单元,用于将所述结构化特征数据和所述非结构化特征数据进行特征融合,并基于特征融合得到的第一特征数据及第四历史检测指标对预测模型进行训练,获得第一指标预测模型;
所述第一预测单元,用于将所述第一历史检测指标输入所述第一指标预测模型进行预测,获得第一历史预测结果以及所述第一指标预测模型对应的中间层输出向量;
所述调节单元,用于基于所述第一指标预测模型对应的中间层输出向量、所述第一历史预测结果以及第二历史检测指标,对所述第一指标预测模型的第一模型参数进行调节,获得第二模型参数,所述第二历史检测指标的生成时间在所述第一历史检测指标及所述第四历史检测指标的生成时间之后;
所述第二预测单元,用于将所述第二历史检测指标输入所述第二模型参数对应的第二指标预测模型,对所述用户的当前检测指标进行预测,获得检测指标预测结果。
7.根据权利要求6所述的装置,其特征在于,所述训练单元,包括:维数调整子单元和训练子单元;
所述维数调整子单元,用于根据所述结构化特征数据的维数,对所述非结构化特征数据的维数进行调整,获得调整维数后的非结构化特征数据;
所述训练子单元,用于将所述结构化特征数据和所述调整维数后的非结构化特征数据进行特征融合,并基于特征融合得到的第一特征数据及第四历史检测指标对预测模型进行训练,获得第一指标预测模型。
8.根据权利要求6所述的装置,其特征在于,所述调节单元,包括:
第一模型参数调节子单元、第二历史检测指标预测子单元和第三模型参数调节子单元;
所述第一模型参数调节子单元,用于基于所述第一指标预测模型对应的中间层输出向量、所述第一历史预测结果以及第三历史检测指标,对所述第一指标预测模型的第一模型参数进行调节,获得第三模型参数,所述第三历史检测指标的生成时间在所述第一历史检测指标和所述第四历史检测指标生成时间之后,所述第三历史检测指标的生成时间在所述第二历史检测指标的生成时间之前;
所述第二历史检测指标预测子单元,用于将所述第三历史检测指标输入所述第三模型参数对应的第三指标预测模型,对所述用户的第二历史检测指标进行预测,获得第二历史预测结果以及所述第三指标预测模型对应的中间层输出向量;
所述第三模型参数调节子单元,用于基于所述第三指标预测模型对应的中间层输出向量、所述第二历史预测结果以及第二历史检测指标,对所述第三指标预测模型的第三模型参数进行调节,获得所述第二模型参数。
9.一种电子设备,其特征在于,所述电子设备包括:处理器以及存储器;
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行如权利要求1-5任一项所述的一种检测指标预测方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-5任一项所述的一种检测指标预测方法的步骤。
CN202410041556.9A 2024-01-11 2024-01-11 一种检测指标预测方法、装置、设备及存储介质 Pending CN117556265A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410041556.9A CN117556265A (zh) 2024-01-11 2024-01-11 一种检测指标预测方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410041556.9A CN117556265A (zh) 2024-01-11 2024-01-11 一种检测指标预测方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN117556265A true CN117556265A (zh) 2024-02-13

Family

ID=89815158

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410041556.9A Pending CN117556265A (zh) 2024-01-11 2024-01-11 一种检测指标预测方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN117556265A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109493976A (zh) * 2018-12-20 2019-03-19 广州天鹏计算机科技有限公司 基于卷积神经网络模型的慢性病复发预测方法和装置
CN109767839A (zh) * 2018-12-28 2019-05-17 首都医科大学附属北京地坛医院 一种预测e抗原血清转换率的处理方法及装置
CN114373544A (zh) * 2021-12-23 2022-04-19 中国人民解放军总医院第一医学中心 一种基于机器学习的预测膜性肾病的方法、系统和装置
WO2022134357A1 (zh) * 2020-12-25 2022-06-30 平安科技(深圳)有限公司 分诊数据处理方法、装置、计算机设备及存储介质
CN114983341A (zh) * 2022-05-25 2022-09-02 东华大学 基于多模态特征融合的阿尔茨海默病多分类预测系统
CN116364292A (zh) * 2023-03-31 2023-06-30 上海交通大学医学院附属第九人民医院 甲状腺眼病的预后预测方法、装置、设备及存储介质
CN117274185A (zh) * 2023-09-19 2023-12-22 阿里巴巴达摩院(杭州)科技有限公司 检测方法、检测模型产品、电子设备及计算机存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109493976A (zh) * 2018-12-20 2019-03-19 广州天鹏计算机科技有限公司 基于卷积神经网络模型的慢性病复发预测方法和装置
CN109767839A (zh) * 2018-12-28 2019-05-17 首都医科大学附属北京地坛医院 一种预测e抗原血清转换率的处理方法及装置
WO2022134357A1 (zh) * 2020-12-25 2022-06-30 平安科技(深圳)有限公司 分诊数据处理方法、装置、计算机设备及存储介质
CN114373544A (zh) * 2021-12-23 2022-04-19 中国人民解放军总医院第一医学中心 一种基于机器学习的预测膜性肾病的方法、系统和装置
CN114983341A (zh) * 2022-05-25 2022-09-02 东华大学 基于多模态特征融合的阿尔茨海默病多分类预测系统
CN116364292A (zh) * 2023-03-31 2023-06-30 上海交通大学医学院附属第九人民医院 甲状腺眼病的预后预测方法、装置、设备及存储介质
CN117274185A (zh) * 2023-09-19 2023-12-22 阿里巴巴达摩院(杭州)科技有限公司 检测方法、检测模型产品、电子设备及计算机存储介质

Similar Documents

Publication Publication Date Title
US9996670B2 (en) Clinical content analytics engine
Kainz et al. Non-invasive diagnosis of deep vein thrombosis from ultrasound imaging with machine learning
US20070196804A1 (en) Question-answering system, question-answering method, and question-answering program
CN113724848A (zh) 基于人工智能的医疗资源推荐方法、装置、服务器及介质
CN112069329B (zh) 文本语料的处理方法、装置、设备及存储介质
CN109522397B (zh) 信息处理方法及装置
US20230154593A1 (en) Systems and methods for medical data processing
CN112632393A (zh) 课程推荐方法、装置及电子设备
CN114462616A (zh) 用于防止敏感数据在线公开的机器学习模型
CN112509661B (zh) 用于识别体检报告的方法、计算设备和介质
CN112541066A (zh) 基于文本结构化的医技报告检测方法及相关设备
CN113707299A (zh) 基于问诊会话的辅助诊断方法、装置及计算机设备
WO2023160264A1 (zh) 医疗数据处理方法、装置及存储介质
CA3110455A1 (en) Visualization of social determinants of health
CN114334065B (zh) 病历处理方法、计算机可读存储介质及计算机设备
Lindvall et al. Deep learning for cancer symptoms monitoring on the basis of electronic health record unstructured clinical notes
Ambalavanan et al. Using contextual representations for suicide risk assessment from Internet forums
CN117556265A (zh) 一种检测指标预测方法、装置、设备及存储介质
CN116662515A (zh) 检索式多轮对话方法及装置、存储介质、电子设备
CN116541711A (zh) 模型训练方法、课程推荐方法、装置、设备及介质
CN112397195A (zh) 用于生成体格检查模型的方法、装置、电子设备和介质
CN112711579A (zh) 医疗数据的质量检测方法及装置、存储介质及电子设备
CN113704481B (zh) 一种文本处理方法、装置、设备及存储介质
CN116306925B (zh) 一种生成端到端实体链接方法和系统
CN116502629B (zh) 基于自训练文本纠错和文本匹配的医学直报方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination