CN116612848B - 一种电子病历的生成方法、装置、设备及存储介质 - Google Patents
一种电子病历的生成方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN116612848B CN116612848B CN202310886966.9A CN202310886966A CN116612848B CN 116612848 B CN116612848 B CN 116612848B CN 202310886966 A CN202310886966 A CN 202310886966A CN 116612848 B CN116612848 B CN 116612848B
- Authority
- CN
- China
- Prior art keywords
- medical record
- inquiry
- feedback information
- modifier
- record data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 239000003607 modifier Substances 0.000 claims abstract description 95
- 238000012545 processing Methods 0.000 claims abstract description 36
- 238000012163 sequencing technique Methods 0.000 claims abstract description 8
- 238000012549 training Methods 0.000 claims description 18
- 238000012937 correction Methods 0.000 claims description 14
- 238000013507 mapping Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 10
- 238000003062 neural network model Methods 0.000 claims description 8
- 208000024891 symptom Diseases 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 6
- 230000007246 mechanism Effects 0.000 claims description 5
- 230000000306 recurrent effect Effects 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 2
- 206010008479 Chest Pain Diseases 0.000 description 9
- 208000004998 Abdominal Pain Diseases 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 208000002193 Pain Diseases 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- Medical Informatics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Epidemiology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本公开提供了一种电子病历的生成方法、装置、设备及存储介质,所述方法包括:首先获取目标结构化病历数据,提取目标结构化病历数据中的问诊反馈信息,然后基于预设的问诊关键字之间的顺序关系,对提取到的问诊反馈信息进行排序,生成问诊反馈信息序列,再将问诊反馈信息序列输入至目标文本生成模型中,经过目标文本生成模型的处理后,输出具有对应关系的问诊反馈信息和修饰词以及修饰词的显示位置信息,最后基于修饰词的显示位置信息,将修饰词添加至问诊反馈信息序列中,生成目标结构化病历数据对应的自然语言病历。可见,本公开实施例能够将目标结构化病例数据自动生成该目标结构化病例数据对应的自然语言病例,提升了电子病例的书写效率。
Description
技术领域
本公开涉及数据处理领域,尤其涉及一种电子病历的生成方法、装置、设备及存储介质。
背景技术
目前临床工作中,通常使用人工录入的方式来创建电子病历,导致电子病历的书写效率较低,因此,如何提升电子病历的书写效率成为亟需解决的一个技术问题。
发明内容
为了解决上述技术问题,本公开实施例提供了一种电子病历的生成方法。
第一方面,本公开提供了一种电子病历的生成方法,所述方法包括:
获取目标结构化病历数据;其中,所述目标结构化病历数据包括具有对应关系的问诊关键字和问诊反馈信息;
提取所述目标结构化病历数据中的问诊反馈信息;
基于预设的问诊关键字之间的顺序关系,对提取到的所述问诊反馈信息进行排序,生成问诊反馈信息序列;
将所述问诊反馈信息序列输入至目标文本生成模型中,经过所述目标文本生成模型的处理后,输出具有对应关系的问诊反馈信息和修饰词以及所述修饰词的显示位置信息;其中,所述目标文本输入模型为基于结构化病历数据样本集和自然语言病历数据样本集训练得到;
基于所述修饰词的显示位置信息,将所述修饰词添加至所述问诊反馈信息序列中,生成所述目标结构化病历数据对应的自然语言病历。
一种可选的实施方式中,所述基于预设的问诊关键字之间的顺序关系,对提取到的所述问诊反馈信息进行排序,生成问诊反馈信息序列之前,且在所述提取所述目标结构化病历数据中的问诊反馈信息之后,还包括:
利用映射规则字典中包括的所述问诊反馈信息和标准化问诊信息的对应关系,确定所述问诊反馈信息对应的标准化问诊信息;
相应地,所述基于预设的问诊关键字之间的顺序关系,对提取到的所述问诊反馈信息进行排序,生成问诊反馈信息序列,包括:
基于预设的问诊关键字之间的顺序关系,对所述标准化问诊信息进行排序,生成问诊反馈信息序列;
相应地,所述将所述问诊反馈信息序列输入至目标文本生成模型中,经过所述目标文本生成模型的处理后,输出具有对应关系的问诊反馈信息和修饰词以及所述修饰词的显示位置信息,包括:
将所述问诊反馈信息序列输入至目标文本生成模型中,经过所述目标文本生成模型的处理后,输出具有对应关系的标准化问诊信息和修饰词以及所述修饰词的显示位置信息。
一种可选的实施方式中,所述将所述问诊反馈信息序列输入至目标文本生成模型中,经过所述目标文本生成模型的处理后,输出具有对应关系的问诊反馈信息和修饰词以及所述修饰词的显示位置信息之前,还包括:
获取结构化病历数据样本集和自然语言病历数据样本集;
利用所述结构化病历数据样本集和所述自然语言病历数据样本集进行模型训练,得到目标文本生成模型。
一种可选的实施方式中,所述基于所述修饰词的显示位置信息,将所述修饰词添加至所述问诊反馈信息序列中,生成所述目标结构化病历数据对应的自然语言病历之后,还包括:
对所述自然语言病历中的修饰词进行错别字校正处理,得到第一自然语言病历。
一种可选的实施方式中,所述对所述自然语言病历中的修饰词进行错别字校正处理,得到第一自然语言病历之后,还包括:
对所述第一自然语言病历进行语法校正处理,得到第二自然语言病历。
一种可选的实施方式中,所述方法还包括:
基于预设的病历排版规则,对所述自然语言病历进行排版,得到排版后的自然语言病历。
一种可选的实施方式中,所述目标文本生成模型由循环神经网络模型和/或自注意力机制的神经网络模型构建。
第二方面,本公开提供了一种电子病历的生成装置,所述装置包括:
第一获取模块,用于获取目标结构化病历数据;其中,所述目标结构化病历数据包括具有对应关系的问诊关键字和问诊反馈信息;
提取模块,用于提取所述目标结构化病历数据中的问诊反馈信息;
排序模块,用于基于预设的问诊关键字之间的顺序关系,对提取到的所述问诊反馈信息进行排序,生成问诊反馈信息序列;
第一处理模块,用于将所述问诊反馈信息序列输入至目标文本生成模型中,经过所述目标文本生成模型的处理后,输出具有对应关系的问诊反馈信息和修饰词以及所述修饰词的显示位置信息;其中,所述目标文本输入模型为基于结构化病历数据样本集和自然语言病历数据样本集训练得到;
生成模块,用于基于所述修饰词的显示位置信息,将所述修饰词添加至所述问诊反馈信息序列中,生成所述目标结构化病历数据对应的自然语言病历。
第三方面,本公开提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备实现上述的方法。
第四方面,本公开提供了一种电子病历的生成设备,包括:存储器,处理器,及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现上述的方法。
第五方面,本公开提供了一种计算机程序产品,所述计算机程序产品包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现上述的方法。
本公开实施例提供的技术方案与现有技术相比至少具有如下优点:
本公开实施例提供了一种电子病历的生成方法,首先获取目标结构化病历数据,其中,目标结构化病历数据包括具有对应关系的问诊关键字和问诊反馈信息,提取目标结构化病历数据中的问诊反馈信息,然后基于预设的问诊关键字之间的顺序关系,对提取到的问诊反馈信息进行排序,生成问诊反馈信息序列,再将问诊反馈信息序列输入至目标文本生成模型中,经过目标文本生成模型的处理后,输出具有对应关系的问诊反馈信息和修饰词以及修饰词的显示位置信息,其中,目标文本输入模型为基于结构化病历数据样本集和自然语言病历数据样本集训练得到,最后基于修饰词的显示位置信息,将修饰词添加至问诊反馈信息序列中,生成目标结构化病历数据对应的自然语言病历。可见,本公开实施例能够将目标结构化病例数据自动生成该目标结构化病例数据对应的自然语言病例,提升了电子病例的书写效率。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本公开实施例提供的一种电子病历的生成方法的流程图;
图2为本公开实施例提供的另一种电子病历的生成方法的流程图;
图3为本公开实施例提供的一种电子病历的生成装置的结构示意图;
图4为本公开实施例提供的一种电子病历的生成设备的结构示意图。
具体实施方式
为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。
目前临床工作中,住院时录入的电子病历绝大部分靠人工在床旁询问完患者病史,然后医生回到办公室在电脑上进行录入,导致电子病历的书写效率较低。
为了提升电子病例的书写效率,本公开实施例提供了一种电子病历的生成方法。
具体地,首先获取目标结构化病历数据,其中,目标结构化病历数据包括具有对应关系的问诊关键字和问诊反馈信息,提取目标结构化病历数据中的问诊反馈信息,然后基于预设的问诊关键字之间的顺序关系,对提取到的问诊反馈信息进行排序,生成问诊反馈信息序列,再将问诊反馈信息序列输入至目标文本生成模型中,经过目标文本生成模型的处理后,输出具有对应关系的问诊反馈信息和修饰词以及修饰词的显示位置信息,其中,目标文本输入模型为基于结构化病历数据样本集和自然语言病历数据样本集训练得到,最后基于修饰词的显示位置信息,将修饰词添加至问诊反馈信息序列中,生成目标结构化病历数据对应的自然语言病历。可见,本公开实施例能够将目标结构化病例数据自动生成该目标结构化病例数据对应的自然语言病例,提升了电子病例的书写效率。
基于此,本公开实施例提供了一种电子病历的生成方法,参考图1,为本公开实施例提供的一种电子病历的生成方法的流程图,该方法包括:
S101:获取目标结构化病历数据。
其中,目标结构化病历数据包括具有对应关系的问诊关键字和问诊反馈信息。
本公开实施例中,目标结构化病历数据可以为任一用户的结构化病历数据,具体地,该目标结构化病历数据包括具有对应关系的问诊关键字和问诊反馈信息。
其中,问诊关键字是指用于描述症状、病史、体征等方面的参数,相应地,问诊反馈信息是指对应问诊关键字对应的参数值。
示例性地,可以参照表1提供的一种结构化病历数据表。
表1
如表1所示,示例性说明了问诊关键字与问诊反馈信息的对应关系,问诊关键字为“症状”时,相应地,问诊反馈信息为“胸痛”;问诊关键字为“频次”时,相应地,问诊反馈信息为“反复”;问诊关键字为“持续时间”时,相应地,问诊反馈信息为“3个月”;问诊关键字为“趋势”时,相应地,问诊反馈信息为“无明显变化”;问诊关键字为“诱因”时,相应地,问诊反馈信息为“运动”;问诊关键字为“部位”时,相应地,问诊反馈信息为“心前区”;问诊关键字为“性质”时,相应地,问诊反馈信息为“闷痛”;问诊关键字为“面积”时,相应地,问诊反馈信息为“手掌大小”;问诊关键字为“程度”时,相应地,问诊反馈信息为“中度”。
需要说明的是,上述表1仅为示例性说明,不应当被视为限制,在实际应用中对问诊关键字和问诊反馈信息的具体内容不做任何限制。
S102:提取目标结构化病历数据中的问诊反馈信息。
本公开实施例中,在获取目标结构化病历数据之后,可以利用问诊关键字访问相应的问诊反馈信息,进而对问诊反馈信息进行提取。
S103:基于预设的问诊关键字之间的顺序关系,对提取到的问诊反馈信息进行排序,生成问诊反馈信息序列。
本公开实施例中,预设的问诊关键字之间的顺序关系可以为预先设定的的问诊关键字之间的逻辑顺序关系。
为便于理解,以目标结构化病历数据为症状:胸痛,诱因:运动,部位:心前区为例,相应地,预设的问诊关键字之间的顺序关系为“诱因”、“部位”、“症状”。
具体地,在提取目标结构化病历数据(即症状:胸痛,诱因:运动,部位:心前区)中的问诊反馈信息(即“胸痛”、“运动”、“心前区”)之后,根据预设的问诊关键字之间的顺序关系(即“诱因”、“部位”、“症状”),对其对应的问诊反馈信息进行排序,生成问诊反馈信息序列{运动,心前区,胸痛}。
S104:将问诊反馈信息序列输入至目标文本生成模型中,经过目标文本生成模型的处理后,输出具有对应关系的问诊反馈信息和修饰词以及修饰词的显示位置信息。
其中,目标文本输入模型为基于结构化病历数据样本集和自然语言病历数据样本集训练得到。
具体地,目标文本生成模型的训练方式如下所述:
一种可选的实施方式中,首先获取结构化病历数据样本集和自然语言病历数据样本集,然后利用结构化病历数据样本集和自然语言病历数据样本集进行模型训练,得到目标文本生成模型。
具体地,在目标文本生成模型的训练过程中,可以考虑上下文信息、语法结构、语义关系,以及适当的模型设计和注意力机制,同时还可以通过最大似然估计等方法调整目标文本生成模型的相关参数,使其能够学习到电子病历的语言模式和逻辑规律。
本公开实施例中,目标文本生成模型可以由循环神经网络模型和/或自注意力机制的神经网络模型构建。
本公开实施例中,修饰词是指用于修饰问诊反馈信息序列中问诊反馈信息的修饰词,具体地,修饰词可以为问诊反馈信息序列中各个问诊反馈信息分别对应的前修饰词和/或后修饰词。
相应地,修饰词的显示位置信息是指修饰词在问诊反馈信息序列中的位置信息,具体地,修饰词的显示位置信息可以为反馈信息序列中与对应问诊反馈信息的相对位置信息。
为便于理解,继续以反馈信息序列为{运动,心前区,胸痛}为例,具体地,将反馈信息序列{运动,心前区,胸痛}输入至目标文本生成模型中,经过目标文本生成模型的处理后,输出具有对应关系的问诊反馈信息和修饰词(“患者”、“由于”、“导致”、“发生”),以及各个修饰词分别在反馈信息序列中的显示位置信息。
S105:基于修饰词的显示位置信息,将修饰词添加至问诊反馈信息序列中,生成目标结构化病历数据对应的自然语言病历。
本公开实施例中,在生成具有对应关系的问诊反馈信息和修饰词以及修饰词的显示位置信息之后,根据修饰词的显示位置信息,将修饰词添加至问诊反馈信息序列中的对应位置,生成目标结构化病历数据对应的自然语言病历,进而提升了电子病例的书写效率,同时也减少了人工录入电子病历的风险,提高了电子病历的准确性和可靠性。
为了便于理解,继续以反馈信息序列为{运动,心前区,胸痛}为例,在经过目标文本生成模型的处理后,输出具有对应关系的问诊反馈信息和修饰词(“患者”、“由于”、“导致”、“发生”),以及各个修饰词分别在反馈信息序列中的显示位置信息之后,基于各个修饰词分别在反馈信息序列中的显示位置信息,将修饰词(“患者”、“由于”、“导致”、“发生”)添加至问诊反馈信息序列中的对应位置,生成目标结构化病历数据对应的自然语言病历(即“患者由于运动导致心前区发生胸痛”)。
本公开实施例中,在生成目标结构化病历数据对应的自然语言病历之后,还可以将该自然语言病历同步至EMR(Electronic Medical Record,电子病历系统)中。
另外,为了提升自然语言病历的准确性,一种可选的实施方式中,还可以对自然语言病历中的修饰词进行错别字校正处理,得到第一自然语言病历。
本公开实施例中,可以利用预设规则库中包括的修饰词和标准化词的对应关系,对自然语言病历中的修饰词进行错别字校正处理,得到第一自然语言病历。
需要说明的是,本公开实施例对自然语言病历中的修饰词进行错别字校正处理的具体方式,不做任何限定。
进一步地,为了提升自然语言病历的流畅性,一种可选的实施方式中,还可以对第一自然语言病历进行语法校正处理,得到第二自然语言病历。
本公开实施例中,可以通过预设语法规则,逐句对第一自然语言病历进行语法校正处理,得到第二自然语言病历。
需要说明的是,本公开实施例对第一自然语言病历进行语法校正处理的具体方式,不做任何限定。
另外,为了与现有电子病历结构保持一致,还可以对自然语言病历进行排版。为此,一种可选的实施方式中,基于预设的病历排版规则,对自然语言病历进行排版,得到排版后的自然语言病历。
本公开实施例提供的电子病例的生成方法中,首先获取目标结构化病历数据,其中,目标结构化病历数据包括具有对应关系的问诊关键字和问诊反馈信息,提取目标结构化病历数据中的问诊反馈信息,然后基于预设的问诊关键字之间的顺序关系,对提取到的问诊反馈信息进行排序,生成问诊反馈信息序列,再将问诊反馈信息序列输入至目标文本生成模型中,经过目标文本生成模型的处理后,输出具有对应关系的问诊反馈信息和修饰词以及修饰词的显示位置信息,其中,目标文本输入模型为基于结构化病历数据样本集和自然语言病历数据样本集训练得到,最后基于修饰词的显示位置信息,将修饰词添加至问诊反馈信息序列中,生成目标结构化病历数据对应的自然语言病历。可见,本公开实施例能够将目标结构化病例数据自动生成该目标结构化病例数据对应的自然语言病例,提升了电子病例的书写效率。
在上述实施例的基础上,为提高生成电子病例的准确率,在基于预设的问诊关键字之间的顺序关系,对提取到的问诊反馈信息进行排序,生成问诊反馈信息序列之前,且在提取目标结构化病历数据中的问诊反馈信息之后,还可以对提取到的问诊反馈信息进行标准化处理。为此,本公开实施例还提供了一种电子病历的生成方法,参考图2,为本公开实施例提供的另一种电子病历的生成方法的流程图,该方法包括:
S201:获取目标结构化病历数据。
其中,目标结构化病历数据包括具有对应关系的问诊关键字和问诊反馈信息。
S202:提取目标结构化病历数据中的问诊反馈信息。
需要说明的是,步骤S201-S202与步骤S101-S102相同,具体参考对步骤S101-S102的描述。
S203:利用映射规则字典中包括的问诊反馈信息和标准化问诊信息的对应关系,确定问诊反馈信息对应的标准化问诊信息。
本公开实施例中,在提取目标结构化病历数据中的问诊反馈信息之后,将该问诊反馈信息与映射规则字典进行匹配,如果该问诊反馈信息与映射规则字典匹配成功,则利用映射规则字典中包括的问诊反馈信息和标准化问诊信息的对应关系,将问诊反馈信息转换为其对应的标准化问诊信息。
示例性地,以问诊反馈信息为“肚子痛”为例,具体地,将“肚子痛”与映射规则字典进行匹配,如果该问诊反馈信息与映射规则字典匹配成功,则利用映射规则字典中包括的问诊反馈信息和标准化问诊信息的对应关系,将“肚子痛”转换为“腹痛”。
S204:基于预设的问诊关键字之间的顺序关系,对标准化问诊信息进行排序,生成问诊反馈信息序列。
S205:将问诊反馈信息序列输入至目标文本生成模型中,经过目标文本生成模型的处理后,输出具有对应关系的标准化问诊信息和修饰词以及修饰词的显示位置信息。
其中,目标文本输入模型为基于结构化病历数据样本集和自然语言病历数据样本集训练得到。
S206:基于修饰词的显示位置信息,将修饰词添加至问诊反馈信息序列中,生成目标结构化病历数据对应的自然语言病历。
需要说明的是,步骤S204-S206与步骤S102-S105相近,具体参考对步骤S102-S105的描述。
本公开实施例提供的电子病历生成方法中,首先获取目标结构化病历数据,其中,目标结构化病历数据包括具有对应关系的问诊关键字和问诊反馈信息,提取目标结构化病历数据中的问诊反馈信息,然后利用映射规则字典中包括的问诊反馈信息和标准化问诊信息的对应关系,确定问诊反馈信息对应的标准化问诊信息,基于预设的问诊关键字之间的顺序关系,对标准化问诊信息进行排序,生成问诊反馈信息序列,再将问诊反馈信息序列输入至目标文本生成模型中,经过目标文本生成模型的处理后,输出具有对应关系的标准化问诊信息和修饰词以及修饰词的显示位置信息,其中,目标文本输入模型为基于结构化病历数据样本集和自然语言病历数据样本集训练得到,最后基于修饰词的显示位置信息,将修饰词添加至问诊反馈信息序列中,生成目标结构化病历数据对应的自然语言病历。
可见,本公开实施例能够将目标结构化病例数据自动生成该目标结构化病例数据对应的自然语言病例,提升了电子病例的书写效率。
另外,本公开实施例在提取目标结构化病历数据中的问诊反馈信息之后,还对提取到的问诊反馈信息进行标准化处理,提高了生成电子病例的准确率。
基于上述方法实施例,本公开还提供了一种电子病历的生成装置,参考图3,为本公开实施例提供的一种电子病历的生成装置的结构示意图,所述装置包括:
第一获取模块301,用于获取目标结构化病历数据;其中,所述目标结构化病历数据包括具有对应关系的问诊关键字和问诊反馈信息;
提取模块302,用于提取所述目标结构化病历数据中的问诊反馈信息;
排序模块303,用于基于预设的问诊关键字之间的顺序关系,对提取到的所述问诊反馈信息进行排序,生成问诊反馈信息序列;
第一处理模块304,用于将所述问诊反馈信息序列输入至目标文本生成模型中,经过所述目标文本生成模型的处理后,输出具有对应关系的问诊反馈信息和修饰词以及所述修饰词的显示位置信息;其中,所述目标文本输入模型为基于结构化病历数据样本集和自然语言病历数据样本集训练得到;
生成模块305,用于基于所述修饰词的显示位置信息,将所述修饰词添加至所述问诊反馈信息序列中,生成所述目标结构化病历数据对应的自然语言病历。
一种可选的实施方式中,所述装置还包括:
确定模块,用于利用映射规则字典中包括的所述问诊反馈信息和标准化问诊信息的对应关系,确定所述问诊反馈信息对应的标准化问诊信息;
相应地,所述排序模块303具体用于:
基于预设的问诊关键字之间的顺序关系,对所述标准化问诊信息进行排序,生成问诊反馈信息序列;
相应地,所述第一处理模块304具体用于:
将所述问诊反馈信息序列输入至目标文本生成模型中,经过所述目标文本生成模型的处理后,输出具有对应关系的标准化问诊信息和修饰词以及所述修饰词的显示位置信息。
一种可选的实施方式中,所述装置还包括:
第二获取模块,用于获取结构化病历数据样本集和自然语言病历数据样本集;
训练模块,用于利用所述结构化病历数据样本集和所述自然语言病历数据样本集进行模型训练,得到目标文本生成模型。
一种可选的实施方式中,所述装置还包括:
第二处理模块,用于对所述自然语言病历中的修饰词进行错别字校正处理,得到第一自然语言病历。
一种可选的实施方式中,所述装置还包括:
第三处理模块,用于对所述第一自然语言病历进行语法校正处理,得到第二自然语言病历。
一种可选的实施方式中,所述装置还包括:
排版模块,用于基于预设的病历排版规则,对所述自然语言病历进行排版,得到排版后的自然语言病历。
一种可选的实施方式中,所述目标文本生成模型由循环神经网络模型和/或自注意力机制的神经网络模型构建。
本公开实施例提供的电子病例的生成装置中,首先获取目标结构化病历数据,其中,目标结构化病历数据包括具有对应关系的问诊关键字和问诊反馈信息,提取目标结构化病历数据中的问诊反馈信息,然后基于预设的问诊关键字之间的顺序关系,对提取到的问诊反馈信息进行排序,生成问诊反馈信息序列,再将问诊反馈信息序列输入至目标文本生成模型中,经过目标文本生成模型的处理后,输出具有对应关系的问诊反馈信息和修饰词以及修饰词的显示位置信息,其中,目标文本输入模型为基于结构化病历数据样本集和自然语言病历数据样本集训练得到,最后基于修饰词的显示位置信息,将修饰词添加至问诊反馈信息序列中,生成目标结构化病历数据对应的自然语言病历。可见,本公开实施例能够将目标结构化病例数据自动生成该目标结构化病例数据对应的自然语言病例,提升了电子病例的书写效率。
除了上述方法和装置以外,本公开实施例还提供了一种计算机可读存储介质,计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备实现本公开实施例所述的电子病历的生成方法。
本公开实施例还提供了一种计算机程序产品,所述计算机程序产品包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现本公开实施例所述的电子病历的生成方法。
另外,本公开实施例还提供了一种电子病历的生成设备,参见图4所示,可以包括:
处理器401、存储器402、输入装置403和输出装置404。电子病历的生成设备中的处理器401的数量可以一个或多个,图4中以一个处理器为例。在本公开的一些实施例中,处理器401、存储器402、输入装置403和输出装置404可通过总线或其它方式连接,其中,图4中以通过总线连接为例。
存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的软件程序以及模块,从而执行电子病历的生成设备的各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。输入装置403可用于接收输入的数字或字符信息,以及产生与电子病历的生成设备的用户设置以及功能控制有关的信号输入。
具体在本实施例中,处理器401会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现上述电子病历的生成设备的各种功能。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种电子病历的生成方法,其特征在于,所述方法包括:
获取目标结构化病历数据;其中,所述目标结构化病历数据包括具有对应关系的问诊关键字和问诊反馈信息,所述问诊关键字包括症状参数、病史参数以及体征参数中的至少一种参数,所述问诊反馈信息为对应问诊关键字的参数值;
提取所述目标结构化病历数据中的问诊反馈信息;
利用映射规则字典中包括的所述问诊反馈信息和标准化问诊信息的对应关系,确定所述问诊反馈信息对应的标准化问诊信息;
基于预设的问诊关键字之间的顺序关系,对所述标准化问诊信息进行排序,生成问诊反馈信息序列;
将所述问诊反馈信息序列输入至目标文本生成模型中,经过所述目标文本生成模型的处理后,输出具有对应关系的标准化问诊信息和修饰词以及所述修饰词的显示位置信息;其中,所述目标文本生成模型为基于结构化病历数据样本集和自然语言病历数据样本集训练得到;
基于所述修饰词的显示位置信息,将所述修饰词添加至所述问诊反馈信息序列中,生成所述目标结构化病历数据对应的自然语言病历。
2.根据权利要求1所述的方法,其特征在于,所述基于预设的问诊关键字之间的顺序关系,对提取到的所述问诊反馈信息进行排序,生成问诊反馈信息序列之前,且在所述提取所述目标结构化病历数据中的问诊反馈信息之后,还包括:
利用映射规则字典中包括的所述问诊反馈信息和标准化问诊信息的对应关系,确定所述问诊反馈信息对应的标准化问诊信息;
相应地,所述基于预设的问诊关键字之间的顺序关系,对提取到的所述问诊反馈信息进行排序,生成问诊反馈信息序列,包括:
基于预设的问诊关键字之间的顺序关系,对所述标准化问诊信息进行排序,生成问诊反馈信息序列;
相应地,所述将所述问诊反馈信息序列输入至目标文本生成模型中,经过所述目标文本生成模型的处理后,输出具有对应关系的问诊反馈信息和修饰词以及所述修饰词的显示位置信息,包括:
将所述问诊反馈信息序列输入至目标文本生成模型中,经过所述目标文本生成模型的处理后,输出具有对应关系的标准化问诊信息和修饰词以及所述修饰词的显示位置信息。
3.根据权利要求1所述的方法,其特征在于,所述将所述问诊反馈信息序列输入至目标文本生成模型中,经过所述目标文本生成模型的处理后,输出具有对应关系的问诊反馈信息和修饰词以及所述修饰词的显示位置信息之前,还包括:
获取结构化病历数据样本集和自然语言病历数据样本集;
利用所述结构化病历数据样本集和所述自然语言病历数据样本集进行模型训练,得到目标文本生成模型。
4.根据权利要求1所述的方法,其特征在于,所述基于所述修饰词的显示位置信息,将所述修饰词添加至所述问诊反馈信息序列中,生成所述目标结构化病历数据对应的自然语言病历之后,还包括:
对所述自然语言病历中的修饰词进行错别字校正处理,得到第一自然语言病历。
5.根据权利要求4所述的方法,其特征在于,所述对所述自然语言病历中的修饰词进行错别字校正处理,得到第一自然语言病历之后,还包括:
对所述第一自然语言病历进行语法校正处理,得到第二自然语言病历。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于预设的病历排版规则,对所述自然语言病历进行排版,得到排版后的自然语言病历。
7.根据权利要求1所述的方法,其特征在于,所述目标文本生成模型由循环神经网络模型和/或自注意力机制的神经网络模型构建。
8.一种电子病历的生成装置,其特征在于,所述装置包括:
第一获取模块,用于获取目标结构化病历数据;其中,所述目标结构化病历数据包括具有对应关系的问诊关键字和问诊反馈信息,所述问诊关键字包括症状参数、病史参数以及体征参数中的至少一种参数,所述问诊反馈信息为对应问诊关键字的参数值;
提取模块,用于提取所述目标结构化病历数据中的问诊反馈信息;
确定模块,用于利用映射规则字典中包括的所述问诊反馈信息和标准化问诊信息的对应关系,确定所述问诊反馈信息对应的标准化问诊信息;
排序模块,用于基于预设的问诊关键字之间的顺序关系,对所述标准化问诊信息进行排序,生成问诊反馈信息序列;
第一处理模块,用于将所述问诊反馈信息序列输入至目标文本生成模型中,经过所述目标文本生成模型的处理后,输出具有对应关系的标准化问诊信息和修饰词以及所述修饰词的显示位置信息;其中,所述目标文本生成模型为基于结构化病历数据样本集和自然语言病历数据样本集训练得到;
生成模块,用于基于所述修饰词的显示位置信息,将所述修饰词添加至所述问诊反馈信息序列中,生成所述目标结构化病历数据对应的自然语言病历。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备实现如权利要求1-7任一项所述的方法。
10.一种电子病历的生成设备,其特征在于,包括:存储器,处理器,及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1-7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310886966.9A CN116612848B (zh) | 2023-07-19 | 2023-07-19 | 一种电子病历的生成方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310886966.9A CN116612848B (zh) | 2023-07-19 | 2023-07-19 | 一种电子病历的生成方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116612848A CN116612848A (zh) | 2023-08-18 |
CN116612848B true CN116612848B (zh) | 2023-11-10 |
Family
ID=87685692
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310886966.9A Active CN116612848B (zh) | 2023-07-19 | 2023-07-19 | 一种电子病历的生成方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116612848B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111326226A (zh) * | 2020-02-14 | 2020-06-23 | 腾讯科技(深圳)有限公司 | 电子病历的解析处理及显示方法、装置、设备及存储介质 |
CN112069783A (zh) * | 2020-09-10 | 2020-12-11 | 卫宁健康科技集团股份有限公司 | 一种病历输入法及其输入系统 |
CN112259182A (zh) * | 2020-11-05 | 2021-01-22 | 中国联合网络通信集团有限公司 | 一种电子病历的生成方法和装置 |
CN112614559A (zh) * | 2020-12-29 | 2021-04-06 | 苏州超云生命智能产业研究院有限公司 | 病历文本处理方法、装置、计算机设备和存储介质 |
WO2021202696A1 (en) * | 2020-03-31 | 2021-10-07 | F. Hoffmann-La Roche Ag | Text entry assistance and conversion to structured medical data |
CN114360678A (zh) * | 2021-12-23 | 2022-04-15 | 阿里云计算有限公司 | 信息处理方法、装置、设备和存储介质 |
CN114912887A (zh) * | 2022-04-20 | 2022-08-16 | 深圳市医未医疗科技有限公司 | 一种基于电子病历的临床数据录入方法及录入装置 |
CN115458113A (zh) * | 2022-09-22 | 2022-12-09 | 云知声智能科技股份有限公司 | 一种病历生成方法、系统、存储介质和电子设备 |
-
2023
- 2023-07-19 CN CN202310886966.9A patent/CN116612848B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111326226A (zh) * | 2020-02-14 | 2020-06-23 | 腾讯科技(深圳)有限公司 | 电子病历的解析处理及显示方法、装置、设备及存储介质 |
WO2021202696A1 (en) * | 2020-03-31 | 2021-10-07 | F. Hoffmann-La Roche Ag | Text entry assistance and conversion to structured medical data |
CN112069783A (zh) * | 2020-09-10 | 2020-12-11 | 卫宁健康科技集团股份有限公司 | 一种病历输入法及其输入系统 |
CN112259182A (zh) * | 2020-11-05 | 2021-01-22 | 中国联合网络通信集团有限公司 | 一种电子病历的生成方法和装置 |
CN112614559A (zh) * | 2020-12-29 | 2021-04-06 | 苏州超云生命智能产业研究院有限公司 | 病历文本处理方法、装置、计算机设备和存储介质 |
CN114360678A (zh) * | 2021-12-23 | 2022-04-15 | 阿里云计算有限公司 | 信息处理方法、装置、设备和存储介质 |
CN114912887A (zh) * | 2022-04-20 | 2022-08-16 | 深圳市医未医疗科技有限公司 | 一种基于电子病历的临床数据录入方法及录入装置 |
CN115458113A (zh) * | 2022-09-22 | 2022-12-09 | 云知声智能科技股份有限公司 | 一种病历生成方法、系统、存储介质和电子设备 |
Non-Patent Citations (1)
Title |
---|
结构化电子病历数据录入方法;李昊旻;段会龙;吕旭东;黄正行;;浙江大学学报(工学版)(第10期);第1693-1696页 * |
Also Published As
Publication number | Publication date |
---|---|
CN116612848A (zh) | 2023-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107341264B (zh) | 一种支持自定义实体的电子病历检索系统及方法 | |
US10977444B2 (en) | Method and system for identifying key terms in digital document | |
JP6902945B2 (ja) | テキスト要約システム | |
AU2020372605B2 (en) | Mapping natural language utterances to operations over a knowledge graph | |
CN108427702B (zh) | 目标文档获取方法及应用服务器 | |
CN104123269A (zh) | 一种基于模板的出版物半自动生成方法及系统 | |
CN110032734B (zh) | 近义词扩展及生成对抗网络模型训练方法和装置 | |
CN110600094A (zh) | 一种电子病历的智能书写方法及系统 | |
CN111506595B (zh) | 一种数据查询方法、系统及相关设备 | |
CN113111159A (zh) | 问答记录生成方法、装置、电子设备及存储介质 | |
JP7211901B2 (ja) | 情報処理装置および情報処理方法 | |
JP2009217689A (ja) | 情報処理装置、情報処理方法、及びプログラム | |
CN114490984A (zh) | 基于关键词指导的问答知识抽取方法、装置、设备及介质 | |
CN116701437B (zh) | 数据转化方法、数据转化系统、电子设备及可读存储介质 | |
CN116612848B (zh) | 一种电子病历的生成方法、装置、设备及存储介质 | |
US20120185496A1 (en) | Method of and a system for retrieving information | |
JP5679400B2 (ja) | カテゴリ主題語句抽出装置及び階層的タグ付与装置及び方法及びプログラム及びコンピュータ読み取り可能な記録媒体 | |
US20210318949A1 (en) | Method for checking file data, computer device and readable storage medium | |
CN112257408A (zh) | 一种文本对比的方法及相关装置 | |
CN106547753B (zh) | 一种信息分析方法及电子设备 | |
US20240078827A1 (en) | Method and apparatus for extracting area of interest in a document | |
US20240184985A1 (en) | Information representation structure analysis device, and information representation structure analysis method | |
CN110471901B (zh) | 数据导入方法及终端设备 | |
WO2018035333A1 (en) | Computer-implemented methods and systems for categorization and analysis of documents and records | |
CN111061863B (zh) | 期刊目录展示方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |