CN114242233A - 一种诊断信息的生成方法、系统、电子设备及存储介质 - Google Patents

一种诊断信息的生成方法、系统、电子设备及存储介质 Download PDF

Info

Publication number
CN114242233A
CN114242233A CN202111496955.7A CN202111496955A CN114242233A CN 114242233 A CN114242233 A CN 114242233A CN 202111496955 A CN202111496955 A CN 202111496955A CN 114242233 A CN114242233 A CN 114242233A
Authority
CN
China
Prior art keywords
medical record
record data
training
model
training parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111496955.7A
Other languages
English (en)
Inventor
罗立刚
张旸
马睿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zero Krypton Medical Intelligent Technology Guangzhou Co ltd
Original Assignee
Zero Krypton Medical Intelligent Technology Guangzhou Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zero Krypton Medical Intelligent Technology Guangzhou Co ltd filed Critical Zero Krypton Medical Intelligent Technology Guangzhou Co ltd
Priority to CN202111496955.7A priority Critical patent/CN114242233A/zh
Publication of CN114242233A publication Critical patent/CN114242233A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H15/00ICT specially adapted for medical reports, e.g. generation or transmission thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Pathology (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本申请实施例提供一种诊断信息的生成方法、系统、电子设备及存储介质,其中,该方法包括:获取病历数据;对病历数据进行规范化处理,获得病历数据集;根据机器学习模型对病历数据集进行训练,得到训练参数;根据联邦学习框架对训练参数进行聚合处理,生成融合模型;将病历数据集输入融合模型,生成诊断信息。实施本申请实施例,可以形成精确的诊断信息,提高了诊断信息的生成准确率。

Description

一种诊断信息的生成方法、系统、电子设备及存储介质
技术领域
本申请涉及医疗信息处理技术领域,具体而言,涉及一种诊断信息的生成方法、系统、电子设备及计算机可读存储介质。
背景技术
医院信息系统存在一种辅助诊断的功能需求,即输入患者的病情数据,计算机系统自动生成相应的诊断信息的生成结果。医院通常直接在医院内部进行诊断生成模型的训练和使用。
但是由于每个医院存在数据样本量不足,无法训练出效果好的模型,输出的结果通常不能准确地反映患者的病情,严重时还会导致误诊,耽误救治,并且,在这个过程中会发生患者的隐私数据遭到泄露的情况,给医院和患者都带来了巨大的困扰,甚至因此耽误患者的病情。
发明内容
本申请实施例的目的在于提供一种诊断信息的生成方法、系统、电子设备及计算机可读存储介质,可以形成精确的诊断信息的生成,提高了诊断信息的准确率,提高了医院的办事效率。
第一方面,本申请实施例提供了一种诊断信息的生成方法,所述方法包括:
获取病历数据;
对所述病历数据进行规范化处理,获得病历数据集;
根据机器学习模型对所述病历数据集进行训练,得到训练参数;
根据联邦学习框架对所述训练参数进行聚合处理,生成融合模型;
将所述病历数据集输入所述融合模型,生成诊断信息。
在上述实现过程中,利用机器学习模型对获取到的病历数据进行训练,得到训练参数,并根据训练参数得到融合模型,使得融合模型可以融入多个病历数据的特征,并对病历数据进行精准的分析,从而形成精确的诊断信息,提高了诊断信息的生成准确率。
进一步地,所述对所述病历数据进行规范化处理,获得病历数据集的步骤,包括:
获取所述病历数据中的病情数据,作为输入病历数据;
获取所述病情数据对应的诊断数据,作为输出病历数据;
将所述输入病历数据和所述输出病历数据进行规范化处理,得到多个二元组数据;
将所述多个二元组数据生成所述病历数据集。
在上述实现过程中,将病情数据和诊断数据一一对应起来,并进行规范化处理得到相应的二元组数据,可以使得模型的输入和输出更加符合真实数据,从而使得结果更加精确。
进一步地,所述根据机器学习模型对所述病历数据集进行训练,得到训练参数的步骤,包括:
获取所述机器学习模型;
将所述病历数据集输入所述机器学习模型进行训练,得到所述训练参数。
在上述实现过程中,机器学习模型可以学习到病历数据中的特征,并将病历数据的特征融入到训练参数中,使得训练参数具有病历数据的特征,更加能够代表病历数据。
进一步地,根据以下公式根据联邦学习框架对所述训练参数进行聚合处理,生成融合模型:
Figure BDA0003401080840000031
其中,Wt h为所述训练参数,Σh表示聚合规则,Wt+1为融合模型。
在上述实现过程中,联邦学习框架可以起到保护病历数据的作用,使得病历数据在被获取的同时不会发生信息泄露,同时也保证了诊断信息的生成的准确性。
第二方面,本申请实施例还提供了一种诊断信息的生成系统,所述系统包括:
获取模型,用于获取病历数据;
规范处理模块,用于对所述病历数据进行规范化处理,获得病历数据集;
训练模块,用于根据机器学习模型对所述病历数据集进行训练,得到训练参数;
聚合模型,用于根据联邦学习框架对所述训练参数进行聚合处理,生成融合模型;
生成模块,用于将所述病历数据集输入所述融合模型,生成诊断信息。
在上述实现过程中,利用机器学习模型对获取到的病历数据进行训练,得到训练参数,并根据训练参数得到融合模型,使得融合模型可以融入多个病历数据的特征,并对病历数据进行精准的分析,从而形成精确的诊断信息,提高了诊断信息的生成准确率。
进一步地,所述规范处理模块还用于:
获取所述病历数据中的病情数据,作为输入病历数据;
获取所述病情数据对应的诊断数据,作为输出病历数据;
将所述输入病历数据和所述输出病历数据进行规范化处理,得到多个二元组数据;
将所述多个二元组数据生成所述病历数据集。
在上述实现过程中,将病情数据和诊断数据一一对应起来,并进行规范化处理得到相应的二元组数据,可以使得模型的输入和输出更加符合真是数据,从而使得结果更加精确。
进一步地,所述训练模块还用于:
获取所述机器学习模型;
将所述病历数据集输入所述机器学习模型进行训练,得到所述训练参数。
在上述实现过程中,机器学习模型可以学习到病历数据中的特征,并将病历数据的特征融入到训练参数中,使得训练参数具有病历数据的特征,更加能够代表病历数据。
进一步地,所述聚合模型还用于:
根据以下公式根据联邦学习框架对所述训练参数进行聚合处理,生成融合模型:
Figure BDA0003401080840000041
其中,Wt h为所述训练参数,Σh表示聚合规则,Wt+1为融合模型。
在上述实现过程中,联邦学习框架可以起到保护病历数据的作用,使得病历数据在被获取的同时不会发生信息泄露,同时也保证了诊断信息的生成的准确性。
第三方面,本申请实施例提供的一种电子设备,包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面任一项所述的方法的步骤。
第四方面,本申请实施例提供的一种计算机可读存储介质,所述存储介质上存储有指令,当所述指令在计算机上运行时,使得所述计算机执行如第一方面任一项所述的方法。
第五方面,本申请实施例提供的一种计算机程序产品,所述计算机程序产品在计算机上运行时,使得计算机执行如第一方面任一项所述的方法。
本公开的其他特征和优点将在随后的说明书中阐述,或者,部分特征和优点可以从说明书推知或毫无疑义地确定,或者通过实施本公开的上述技术即可得知。
并可依照说明书的内容予以实施,以下以本申请的较佳实施例并配合附图详细说明如后。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的诊断信息的生成方法的流程示意图;
图2为本申请实施例提供的诊断信息的生成系统的结构组成示意图;
图3为本申请实施例提供的电子设备的结构组成示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
下面结合附图和实施例,对本申请的具体实施方式作进一步详细描述。以下实施例用于说明本申请,但不用来限制本申请的范围。
实施例一
图1是本申请实施例提供的诊断信息的生成方法的流程示意图,如图1所示,该方法包括:
S1,获取病历数据;
S2,对病历数据进行规范化处理,获得病历数据集;
S3,根据机器学习模型对病历数据集进行训练,得到训练参数;
S4,根据联邦学习框架对训练参数进行聚合处理,生成融合模型;
S5,将病历数据集输入融合模型,生成诊断信息。
以本实施例为例,利用机器学习模型对获取到的病历数据进行训练,得到训练参数,并根据训练参数得到融合模型,使得融合模型可以融入多个病历数据的特征,并对病历数据进行精准的分析,从而形成精确的诊断信息,提高了诊断信息的生成的准确率。
在本申请实施例中,病历数据来自医院的信息系统,通过对接医院信息系统,适配不同的数据源,获取病历数据。示例性地,调用医院信息系统提供的数据访问接口获取病历数据,或者直接访问医院信息系统的数据库。
由于不同医院的信息系统差异,获取病历数据的方式需要进行适配,以保证每家医院获取到的病历数据的形式是一致的,不会存在较大差异。
进一步地,S2包括:
获取病历数据中的病情数据,作为输入病历数据;
获取病情数据对应的诊断数据,作为输出病历数据;
将输入病历数据和输出病历数据进行规范化处理,得到多个二元组数据;
将多个二元组数据生成病历数据集。
病情数据包括患者从入院到出院的所有患病信息,例如就诊科室、主诉、现病史、既往史、个人史、家族史、阳性体征、必要的阴性体征等,将这些病情数据作为输入的文本,形成输入病历数据。
诊断数据为医生根据患者的患病信息做出的诊断,每一份病历的病情数据和诊断数据一一对应,将诊断数据作为输出文本,输出病历数据。
示例性地,一个病历数据为“8个月前无明显诱因出现咳嗽、咳痰,无声音嘶哑,病情出现反复,与当地医院行抗炎治疗......谷丙转氨酶:144U/L,尿酸:188umol/L......行胸部CT(某某医院,编号12345678)检查,示1.左肺上叶肺癌。2.左肺上叶尖段一小结节”,诊断:“左肺腺癌”。
以本实施例为例,将病情数据和诊断数据一一对应起来,并进行规范化处理得到相应的二元组数据,可以使得模型的输入和输出更加符合真是数据,从而使得结果更加精确。
进一步地,S3包括:
获取机器学习模型;
将病历数据集输入机器学习模型进行训练,得到训练模型以及对应的训练参数。
示例性地,每一家医院都可以根据机器学习模型对本医院的病历数据进行训练,得到相应的训练模型以及对应的训练参数,因此,每一家医院的训练参数包含了医院的病历数据的特征,训练参数可以指示该医院患者的就医特点。
以本实施例为例,机器学习模型可以学习到病历数据中的特征,并将病历数据的特征融入到训练参数中,使得训练参数具有病历数据的特征,更加能够代表病历数据。
在S4中,根据联邦学习框架对训练参数进行聚合处理,生成融合模型。
进一步地,根据以下公式对训练参数进行聚合处理,生成融合模型:
Figure BDA0003401080840000071
其中,Wt h为训练参数,Σh表示聚合规则,Wt+1为融合模型。
聚合多家医院的训练参数,并利用联合学习框架对训练参数进行聚合计算,得到融合模型,常见的聚合规则有FedAvg(FederatedAveraging)、FedProx(FederatedProximal)。
对训练参数进行多次聚合、迭代,使得模型不断收敛,最终获得融合模型,融合模型融合了多家医院的就诊信息以及就诊特点,可以根据每一家医院的患者的病历数据做出准确、及时的诊断信息。
联邦学习(Federated machine learning/Federated Learning)又名联邦机器学习、联合学习或联盟学习。联邦学习是一个机器学习框架,能有效帮助多个机构在满足用户隐私保护、数据安全和政府法规的要求下,进行数据使用和机器学习建模。联邦学习作为分布式的机器学习范式,可以有效解决数据孤岛问题,让参与方在不共享数据的基础上联合建模,能从技术上打破数据孤岛。
同时,联邦学习框架可以在病历数据交互时保证信息的安全,保护病历数据和个人数据隐私,使得每一位患者的病历数据不会泄露,同时还可以进行精准的诊断信息的生成。
在上述实现过程中,联邦学习框架可以起到保护病历数据的作用,使得病历数据在被生成系统获取的同时不会发生信息泄露,同时也保证了诊断信息的准确性。
在S5中,将病历数据集输入融合模型,生成诊断信息。
讲现病史、既往史、个人史、家族史等病历数据输入融合模型中,融合模型可以输出相应的诊断信息,为患者和医生提供可靠的参考依据。
在上述实现过程中,联邦学习框架可以起到保护病历数据的作用,使得病历数据在被生成系统获取的同时不会发生信息泄露,同时也保证了诊断信息的生成准确性。
实施例二
为了执行上述实施例一对应的方法,以实现相应的功能和技术效果,下面提供一种诊断信息的生成系统,如图2所示,该系统包括:
获取模型1,用于获取病历数据;
规范处理模块2,用于对病历数据进行规范化处理,获得病历数据集;
训练模块3,用于根据机器学习模型对病历数据集进行训练,得到训练参数;
聚合模型4,用于根据联邦学习框架对训练参数进行聚合处理,生成融合模型;
生成模块5,用于将病历数据集输入所述融合模型,生成诊断信息。
在上述实现过程中,利用机器学习模型对获取到的病历数据进行训练,得到训练参数,并根据训练参数得到融合模型,使得融合模型可以融入多个病历数据的特征,并对病历数据进行精准的分析,从而形成精确的诊断信息,提高了诊断信息的生成的准确率。
进一步地,规范处理模块2还用于:
获取病历数据中的病情数据,作为输入病历数据;
获取病情数据对应的诊断数据,作为输出病历数据;
将输入病历数据和输出病历数据进行规范化处理,得到多个二元组数据,作为病历数据集。
在上述实现过程中,将病情数据和诊断数据一一对应起来,并进行规范化处理得到相应的二元组数据,可以使得模型的输入和输出更加符合真是数据,从而使得结果更加精确。
进一步地,训练模块3还用于:
获取机器学习模型;
将病历数据集输入机器学习模型进行训练,得到训练模型以及对应的训练参数。
在上述实现过程中,机器学习模型可以学习到病历数据中的特征,并将病历数据的特征融入到训练参数中,使得训练参数具有病历数据的特征,更加能够代表病历数据。
进一步地,聚合模型4还用于:
根据以下公式根据联邦学习框架对训练参数进行聚合处理,生成融合模型:
Figure BDA0003401080840000101
其中,Wt h为训练参数,Σh表示聚合规则,Wt+1为融合模型。
在上述实现过程中,联邦学习框架可以起到保护病历数据的作用,使得病历数据在被获取的同时不会发生信息泄露,同时也保证了诊断信息的生成的准确性。
上述的诊断信息的生成系统可实施上述实施例一的方法。上述实施例一中的可选项也适用于本实施例,这里不再详述。
本申请实施例的其余内容可参照上述实施例一的内容,在本实施例中,不再进行赘述。
实施例三
本申请实施例提供一种电子设备,包括存储器及处理器,该存储器用于存储计算机程序,该处理器运行计算机程序以使电子设备执行实施例一的诊断信息的生成方法。
可选地,上述电子设备可以是服务器。
请参见图3,图3为本申请实施例提供的电子设备的结构组成示意图。该电子设备可以包括处理器31、通信接口32、存储器33和至少一个通信总线34。其中,通信总线34用于实现这些组件直接的连接通信。其中,本申请实施例中设备的通信接口32用于与其他节点设备进行信令或数据的通信。处理器31可以是一种集成电路芯片,具有信号的处理能力。
上述的处理器31可以是通用处理器,包括中央处理器(Central ProcessingUnit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器31也可以是任何常规的处理器等。
存储器33可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。存储器33中存储有计算机可读取指令,当计算机可读取指令由所述处理器31执行时,设备可以执行上述图1方法实施例涉及的各个步骤。
可选地,电子设备还可以包括存储控制器、输入输出单元。存储器33、存储控制器、处理器31、外设接口、输入输出单元各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通信总线34实现电性连接。处理器31用于执行存储器33中存储的可执行模块,例如设备包括的软件功能模块或计算机程序。
输入输出单元用于提供给用户创建任务以及为该任务创建启动可选时段或预设执行时间以实现用户与服务器的交互。输入输出单元可以是,但不限于,鼠标和键盘等。
可以理解,图3所示的结构仅为示意,电子设备还可包括比图3中所示更多或者更少的组件,或者具有与图3所示不同的配置。图3中所示的各组件可以采用硬件、软件或其组合实现。
另外,本申请实施例还提供一种计算机可读存储介质,其存储有计算机程序,该计算机程序被处理器执行时实现实施例一的诊断信息的生成方法。
本申请实施例还提供一种计算机程序产品,该计算机程序产品在计算机上运行时,使得计算机执行方法实施例所述的方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统和方法,也可以通过其它的方式实现。以上所描述的系统实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种诊断信息的生成方法,其特征在于,所述方法包括:
获取病历数据;
对所述病历数据进行规范化处理,获得病历数据集;
根据机器学习模型对所述病历数据集进行训练,得到训练参数;
根据联邦学习框架对所述训练参数进行聚合处理,生成融合模型;
将所述病历数据集输入所述融合模型,生成诊断信息。
2.根据权利要求1所述的诊断信息的生成方法,其特征在于,所述对所述病历数据进行规范化处理,获得病历数据集的步骤,包括:
获取所述病历数据中的病情数据,作为输入病历数据;
获取所述病情数据对应的诊断数据,作为输出病历数据;
将所述输入病历数据和所述输出病历数据进行规范化处理,得到多个二元组数据;
将所述多个二元组数据生成所述病历数据集。
3.根据权利要求1所述的诊断信息的生成方法,其特征在于,所述根据机器学习模型对所述病历数据集进行训练,得到训练参数的步骤,包括:
获取所述机器学习模型;
将所述病历数据集输入所述机器学习模型进行训练,得到所述训练参数。
4.根据权利要求1所述的诊断信息的生成方法,其特征在于,根据以下公式根据联邦学习框架对所述训练参数进行聚合处理,生成融合模型:
Figure FDA0003401080830000011
其中,
Figure FDA0003401080830000012
为所述训练参数,Σh表示聚合规则,Wt+1为融合模型。
5.一种诊断信息的生成系统,其特征在于,所述系统包括:
获取模型,用于获取病历数据;
规范处理模块,用于对所述病历数据进行规范化处理,获得病历数据集;
训练模块,用于根据机器学习模型对所述病历数据集进行训练,得到训练参数;
聚合模型,用于根据联邦学习框架对所述训练参数进行聚合处理,生成融合模型;
生成模块,用于将所述病历数据集输入所述融合模型,生成诊断信息。
6.根据权利要求5所述的诊断信息的生成系统,其特征在于,所述规范处理模块还用于:
获取所述病历数据中的病情数据,作为输入病历数据;
获取所述病情数据对应的诊断数据,作为输出病历数据;
将所述输入病历数据和所述输出病历数据进行规范化处理,得到多个二元组数据;
将所述多个二元组数据生成所述病历数据集。
7.根据权利要求5所述的诊断信息的生成系统,其特征在于,所述训练模块还用于:
获取所述机器学习模型;
将所述病历数据集输入所述机器学习模型进行训练,得到所述训练参数。
8.根据权利要求5所述的诊断信息的生成系统,其特征在于,所述聚合模型还用于:
根据以下公式根据联邦学习框架对所述训练参数进行聚合处理,生成融合模型:
Figure FDA0003401080830000021
其中,
Figure FDA0003401080830000022
为所述训练参数,Σh表示聚合规则,Wt+1为融合模型。
9.一种电子设备,其特征在于,包括存储器及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述电子设备执行根据权利要求1至4中任一项所述的诊断信息的生成方法。
10.一种计算机可读存储介质,其特征在于,其存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至4中任一项所述的诊断信息的生成方法。
CN202111496955.7A 2021-12-09 2021-12-09 一种诊断信息的生成方法、系统、电子设备及存储介质 Pending CN114242233A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111496955.7A CN114242233A (zh) 2021-12-09 2021-12-09 一种诊断信息的生成方法、系统、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111496955.7A CN114242233A (zh) 2021-12-09 2021-12-09 一种诊断信息的生成方法、系统、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN114242233A true CN114242233A (zh) 2022-03-25

Family

ID=80754210

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111496955.7A Pending CN114242233A (zh) 2021-12-09 2021-12-09 一种诊断信息的生成方法、系统、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN114242233A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117009924A (zh) * 2023-10-07 2023-11-07 之江实验室 电子病历引导的多模态自适应多中心数据融合方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117009924A (zh) * 2023-10-07 2023-11-07 之江实验室 电子病历引导的多模态自适应多中心数据融合方法及系统
CN117009924B (zh) * 2023-10-07 2024-01-26 之江实验室 电子病历引导的多模态自适应多中心数据融合方法及系统

Similar Documents

Publication Publication Date Title
Sukumar et al. Quality of Big Data in health care
Hoffman et al. The use and misuse of biomedical data: is bigger really better?
Shah et al. Panacea of challenges in real-world application of big data analytics in healthcare sector
Morley et al. The debate on the ethics of AI in health care: a reconstruction and critical review
US11869667B2 (en) Methods, apparatuses, and systems for gradient detection of significant incidental disease indicators
Hompes et al. Detecting change in processes using comparative trace clustering
WO2015134668A1 (en) Automated quality control of diagnostic radiology
Pearce et al. Coding and classifying GP data: the POLAR project
EP3329403A1 (en) Reliability measurement in data analysis of altered data sets
Uciteli et al. Ontology-based specification, identification and analysis of perioperative risks
Marquardt How and how much does expert error matter? Implications for quantitative peace research
Dahlawi et al. Medical negligence in healthcare organizations and its impact on patient safety and public health: a bibliometric study
Winnenburg et al. Metrics for assessing the quality of value sets in clinical quality measures
MacRae et al. Accessing primary care Big Data: the development of a software algorithm to explore the rich content of consultation records
CN114242233A (zh) 一种诊断信息的生成方法、系统、电子设备及存储介质
Gibson et al. Foraging for information in the EHR: The search for adherence related information by mental health clinicians
Paik et al. Digital Determinants of Health: Health data poverty amplifies existing health disparities—A scoping review
Wang et al. What may impact trustworthiness of ai in digital healthcare: Discussion from patients’ viewpoint
Ranallo et al. Psychological assessment instruments: a coverage analysis using SNOMED CT, LOINC and QS terminology
US20230005616A1 (en) Methods, systems, and computer program products for capturing missing current procedural terminology (cpt) codes for care provided to a patient
Tsang Quantifying judicious use of health information technology
WO2022079593A1 (en) A system and a way to automatically monitor clinical trials - virtual monitor (vm) and a way to record medical history
Andersen Conceptualising research quality in medicine for evaluative bibliometrics
Conway et al. Cross disciplinary consultancy to bridge public health technical needs and analytic developers: negation detection use case
Weber et al. Data Quality by Contract–Towards an Architectural View for Data Quality in Health Information Systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination