CN114242196B - 临床医疗记录自动生成方法和装置 - Google Patents

临床医疗记录自动生成方法和装置 Download PDF

Info

Publication number
CN114242196B
CN114242196B CN202111518752.3A CN202111518752A CN114242196B CN 114242196 B CN114242196 B CN 114242196B CN 202111518752 A CN202111518752 A CN 202111518752A CN 114242196 B CN114242196 B CN 114242196B
Authority
CN
China
Prior art keywords
time
space
taking
predicted
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111518752.3A
Other languages
English (en)
Other versions
CN114242196A (zh
Inventor
张静
申霖
周琴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiangya Hospital of Central South University
Original Assignee
Xiangya Hospital of Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiangya Hospital of Central South University filed Critical Xiangya Hospital of Central South University
Priority to CN202111518752.3A priority Critical patent/CN114242196B/zh
Publication of CN114242196A publication Critical patent/CN114242196A/zh
Application granted granted Critical
Publication of CN114242196B publication Critical patent/CN114242196B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Epidemiology (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本申请涉及一种临床医疗记录自动生成方法、装置、计算机设备和存储介质。所述方法包括:获取电子病程记录以及对应的时间信息;根据诊断信息,选择分词库对电子病程记录进行分词,得到病例关键词,以每个电子病程记录为节点,病例关键词为节点的空间信息,电子病程记录的时间间隔为时间信息,构建时空特征;将时空特征中的连续n个序列数据作为训练样本、病例关键词作为组合标签,训练时空序列模型,得到训练好的时空序列模型;根据训练好的时空序列模型以及预测时刻的时间间隔,输出预测时刻对象的预测病例关键词,根据预测时刻检测到的检测报告,与所述预测关键词进行比对,生成临床医疗文本。采用本方法能够自动生成临床医疗文本。

Description

临床医疗记录自动生成方法和装置
技术领域
本申请涉及文本数据处理技术领域,特别是涉及一种临床医疗记录自动生成方法和装置。
背景技术
医疗信息管理系统是现代化医院运营的必要技术支撑和基础设施,实现医疗信息管理系统的目的就是为了以更现代化、科学化、规范化的手段来加强医院的管理,提高医院的工作效率,改进医疗质量,从而树立现代医院的新形象,这也是未来医院发展的必然方向。随着文本数据处理技术的发展,在传统医院的医疗信息系统智能化水平也越来越高,从而使得医疗工作者的工作量得到极大的释放。
在目前的医疗系统中,虽然数据库中存储了大量的患者数据,但是在每次检测结果出来之后,还是需要医生撰写病历本,无法有效的提高医疗资源的利用效率。
发明内容
基于此,有必要针对上述技术问题,提供一种能够辅助医疗文本生成的临床医疗记录自动生成方法、装置、计算机设备和存储介质。
一种临床医疗记录自动生成方法,所述方法包括:
从医疗信息系统获取对象的电子病程记录以及所述电子病程记录对应的时间信息;
根据对象的诊断信息,选择预先设置的所述诊断信息对应的分词库对所述电子病程记录进行分词,得到病例关键词;
以每个所述电子病程记录为节点,所述病例关键词为所述节点的空间信息,所述电子病程记录的时间间隔为时间信息,构建时空特征;
将所述时空特征中的连续n个序列数据作为训练样本、所述n个序列数据的下一个节点的病例关键词作为组合标签,训练预先构建的时空序列模型,得到训练好的时空序列模型;
根据训练好的时空序列模型以及预测时刻的时间间隔,输出预测时刻对象的预测病例关键词,根据预测时刻检测到的检测报告,与所述预测关键词进行比对,生成临床医疗文本。
在其中一个实施例中,还包括:根据所述病例关键词,构建第一文本特征矩阵;
将所述第一文本特征矩阵输入词嵌入模型,得到词向量矩阵,将所述词向量矩阵中的元素依次输入encoder-decoder模型中,得到一维特征向量;
对所述时间间隔进行向量化,得到时间向量,将所述时间向量和所述一维特征向量进行融合,得到融合特征向量;
将所述融合特征向量输入预先构建的时空序列模型,得到训练好的时空序列模型。
在其中一个实施例中,还包括:对所述时间间隔进行取整操作,得到时间向量。
在其中一个实施例中,还包括:将所述时间向量和所述一维特征向量进行自适应加权,拼接后得到融合特征向量;其中,在训练预先构建的时空序列模型时,输出自适应加权的权重。
在其中一个实施例中,还包括:将所述时空特征中的连续n个序列数据作为训练样本;
构建时间查询表,根据n个序列数据的下一个节点的病例关键词,构建时间查询表中每个元素的标签,得到组合标签。
在其中一个实施例中,还包括:将所述时空特征中的连续n个序列数据作为训练样本、所述n个序列数据的下一个节点的病例关键词作为组合标签,训练预先构建的时空序列模型,得到时间查询表中每个元素对应的时空序列模型。
在其中一个实施例中,还包括:根据预测时刻的时间间隔,查询所述时间查询表,得到对应的时空序列模型,通过对应的时空序列模型输出预测时刻对象的预测病例关键词。
一种临床医疗记录自动生成装置,所述装置包括:
数据获取模块,用于从医疗信息系统获取对象的电子病程记录以及所述电子病程记录对应的时间信息;
分词模块,用于根据对象的诊断信息,选择预先设置的所述诊断信息对应的分词库对所述电子病程记录进行分词,得到病例关键词;
特征构建模块,用于以每个所述电子病程记录为节点,所述病例关键词为所述节点的空间信息,所述电子病程记录的时间间隔为时间信息,构建时空特征;
训练模块,用于将所述时空特征中的连续n个序列数据作为训练样本、所述n个序列数据的下一个节点的病例关键词作为组合标签,训练预先构建的时空序列模型,得到训练好的时空序列模型;
文本生成模块,用于根据训练好的时空序列模型以及预测时刻的时间间隔,输出预测时刻对象的预测病例关键词,根据预测时刻检测到的检测报告,与所述预测关键词进行比对,生成临床医疗文本。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
从医疗信息系统获取对象的电子病程记录以及所述电子病程记录对应的时间信息;
根据对象的诊断信息,选择预先设置的所述诊断信息对应的分词库对所述电子病程记录进行分词,得到病例关键词;
以每个所述电子病程记录为节点,所述病例关键词为所述节点的空间信息,所述电子病程记录的时间间隔为时间信息,构建时空特征;
将所述时空特征中的连续n个序列数据作为训练样本、所述n个序列数据的下一个节点的病例关键词作为组合标签,训练预先构建的时空序列模型,得到训练好的时空序列模型;
根据训练好的时空序列模型以及预测时刻的时间间隔,输出预测时刻对象的预测病例关键词,根据预测时刻检测到的检测报告,与所述预测关键词进行比对,生成临床医疗文本。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
从医疗信息系统获取对象的电子病程记录以及所述电子病程记录对应的时间信息;
根据对象的诊断信息,选择预先设置的所述诊断信息对应的分词库对所述电子病程记录进行分词,得到病例关键词;
以每个所述电子病程记录为节点,所述病例关键词为所述节点的空间信息,所述电子病程记录的时间间隔为时间信息,构建时空特征;
将所述时空特征中的连续n个序列数据作为训练样本、所述n个序列数据的下一个节点的病例关键词作为组合标签,训练预先构建的时空序列模型,得到训练好的时空序列模型;
根据训练好的时空序列模型以及预测时刻的时间间隔,输出预测时刻对象的预测病例关键词,根据预测时刻检测到的检测报告,与所述预测关键词进行比对,生成临床医疗文本。
上述临床医疗记录自动生成方法、装置、计算机设备和存储介质,通过从医疗信息系统获取对象的电子病程记录以及电子病程记录对应的时间信息,根据对象的诊断信息,选择预先设置的诊断信息对应的分词库对电子病程记录进行分词,得到病例关键词,以每个电子病程记录为节点,病例关键词为节点的空间信息,电子病程记录的时间间隔为时间信息,构建时空特征,从而将医疗信息系统中数据库的历史信息利用起来,并且时空特征能够有效的反应医疗数据的时间不确定性,将时空特征中的连续n个序列数据作为训练样本、n个序列数据的下一个节点的病例关键词作为组合标签,训练预先构建的时空序列模型,得到训练好的时空序列模型;根据训练好的时空序列模型以及预测时刻的时间间隔,输出预测时刻对象的预测病例关键词,根据预测时刻检测到的检测报告,与所述预测关键词进行比对,生成病例文本。本发明通过检测报告和时空序列模型输出的结果,可以辅助医护工作者进行判断,从而指引医疗文本的生成,并且输出的预测关键词,可以直接结合电子病程记录模板,在线生成医疗文本。
附图说明
图1为一个实施例中临床医疗记录自动生成方法的流程示意图;
图2为一个实施例中临床医疗记录自动生成装置的结构框图;
图3为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种临床医疗记录自动生成方法,包括以下步骤:
步骤102,从医疗信息系统获取对象的电子病程记录以及电子病程记录对应的时间信息。
医疗信息系统中存储了对象整个医疗过程中的历史记录,即电子病程记录,以及每个电子病程记录的时间信息。
步骤104,根据对象的诊断信息,选择预先设置的诊断信息对应的分词库对电子病程记录进行分词,得到病例关键词。
分词库是依据专家信息构建的,不同的诊断结果,起侧重的关键词不同,因此选择预先设置的诊断信息对应的分词库对电子病程记录进行分词,得到病例关键词。
步骤106,以每个电子病程记录为节点,病例关键词为节点的空间信息,电子病程记录的时间间隔为时间信息,构建时空特征。
本步骤中,将每个对象的电子病程记录转化为节点序列,节点之间存在一定的间隔,并且对于每个节点,通过病例关键词进行描述。因此,时空特征为时间不确定的三维特征。
步骤108,将时空特征中的连续n个序列数据作为训练样本、n个序列数据的下一个节点的病例关键词作为组合标签,训练预先构建的时空序列模型,得到训练好的时空序列模型。
针对时空特征,需要学习的是其中包含的时间信息和空间信息,因此,选择连续n个序列数据作为训练样本,一定程度上可以体现时间序列的重要性,对于空间信息,可以通过模型训练进行体现。
步骤110,根据训练好的时空序列模型以及预测时刻的时间间隔,输出预测时刻对象的预测病例关键词,根据预测时刻检测到的检测报告,与预测关键词进行比对,生成临床医疗文本。
上述临床医疗记录自动生成方法中,通过从医疗信息系统获取对象的电子病程记录以及电子病程记录对应的时间信息,根据对象的诊断信息,选择预先设置的诊断信息对应的分词库对电子病程记录进行分词,得到病例关键词,以每个电子病程记录为节点,病例关键词为节点的空间信息,电子病程记录的时间间隔为时间信息,构建时空特征,从而将医疗信息系统中数据库的历史信息利用起来,并且时空特征能够有效的反应医疗数据的时间不确定性,将时空特征中的连续n个序列数据作为训练样本、n个序列数据的下一个节点的病例关键词作为组合标签,训练预先构建的时空序列模型,得到训练好的时空序列模型;根据训练好的时空序列模型以及预测时刻的时间间隔,输出预测时刻对象的预测病例关键词,根据预测时刻检测到的检测报告,与所述预测关键词进行比对,生成病例文本。本发明通过检测报告和时空序列模型输出的结果,可以辅助医护工作者进行判断,从而指引医疗文本的生成,并且输出的预测关键词,可以直接结合电子病程记录模板,在线生成医疗文本。
在其中一个实施例中,根据所述病例关键词,构建第一文本特征矩阵;将所述第一文本特征矩阵输入词嵌入模型,得到词向量矩阵,将词向量矩阵中的元素依次输入encoder-decoder模型中,得到一维特征向量;对时间间隔进行向量化,得到时间向量,将时间向量和一维特征向量进行融合,得到融合特征向量;将融合特征向量输入预先构建的时空序列模型,得到训练好的时空序列模型。
值得说明的是,时空序列模型可以选择LSTM网络,然而LSTM网络中每个输入为长度范围内的向量,而不能输入二维特征,因此将词向量矩阵通过encoder-decoder模型转化为一维特征向量。
在其中一个实施例中,对时间间隔进行取整操作,得到时间向量。
在其中一个实施例中,将时间向量和一维特征向量进行自适应加权,拼接后得到融合特征向量;其中,在训练预先构建的时空序列模型时,输出自适应加权的权重。值得说明的是,对于一维特征向量,占据了融合特征向量中大部分信息,为了均衡时间信息和空间信息,因此需要对时间信息和空间信息进行加权,但是如何设置合适的权重是不确定的,因此采用自适应加权,在进行模型训练时,通过多个权重的组合分别训练,从而可以确定出合适的权重。
在其中一个实施例中,将时空特征中的连续n个序列数据作为训练样本;构建时间查询表,根据n个序列数据的下一个节点的病例关键词,构建时间查询表中每个元素的标签,得到组合标签。
在其中一个实施例中,将时空特征中的连续n个序列数据作为训练样本、所述n个序列数据的下一个节点的病例关键词作为组合标签,训练预先构建的时空序列模型,得到时间查询表中每个元素对应的时空序列模型。
在其中一个实施例中,根据预测时刻的时间间隔,查询时间查询表,得到对应的时空序列模型,通过对应的时空序列模型输出预测时刻对象的预测病例关键词。
在上述实施例中,通过建立时间查询表,可以输出任意时刻的预测病例关键词,然而,对于医疗数据,间隔时间太长将失去参考意义,因此,时间查询表的时间元素只需要选择以小时、天为单位,并且7天之内的数据比较具有参考价值。
应该理解的是,虽然图1的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图2所示,提供了一种临床医疗记录自动生成装置,包括:数据获取模块202、分词模块204、特征构建模块206、训练模块208和文本生成模块210,其中:
数据获取模块202,用于从医疗信息系统获取对象的电子病程记录以及所述电子病程记录对应的时间信息;
分词模块204,用于根据对象的诊断信息,选择预先设置的所述诊断信息对应的分词库对所述电子病程记录进行分词,得到病例关键词;
特征构建模块206,用于以每个所述电子病程记录为节点,所述病例关键词为所述节点的空间信息,所述电子病程记录的时间间隔为时间信息,构建时空特征;
训练模块208,用于将所述时空特征中的连续n个序列数据作为训练样本、所述n个序列数据的下一个节点的病例关键词作为组合标签,训练预先构建的时空序列模型,得到训练好的时空序列模型;
文本生成模块210,用于根据训练好的时空序列模型以及预测时刻的时间间隔,输出预测时刻对象的预测病例关键词,根据预测时刻检测到的检测报告,与所述预测关键词进行比对,生成临床医疗文本。
在其中一个实施例中,训练模块208还用于根据所述病例关键词,构建第一文本特征矩阵;将所述第一文本特征矩阵输入词嵌入模型,得到词向量矩阵,将所述词向量矩阵中的元素依次输入encoder-decoder模型中,得到一维特征向量;对所述时间间隔进行向量化,得到时间向量,将所述时间向量和所述一维特征向量进行融合,得到融合特征向量;将所述融合特征向量输入预先构建的时空序列模型,得到训练好的时空序列模型。
在其中一个实施例中,训练模块208还用于对所述时间间隔进行取整操作,得到时间向量。
在其中一个实施例中,训练模块208还用于将所述时间向量和所述一维特征向量进行自适应加权,拼接后得到融合特征向量;其中,在训练预先构建的时空序列模型时,输出自适应加权的权重。
在其中一个实施例中,训练模块208还用于将所述时空特征中的连续n个序列数据作为训练样本;构建时间查询表,根据n个序列数据的下一个节点的病例关键词,构建时间查询表中每个元素的标签,得到组合标签。
在其中一个实施例中,训练模块208还用于将所述时空特征中的连续n个序列数据作为训练样本、所述n个序列数据的下一个节点的病例关键词作为组合标签,训练预先构建的时空序列模型,得到时间查询表中每个元素对应的时空序列模型。
在其中一个实施例中,文本生成模块210还用于根据预测时刻的时间间隔,查询所述时间查询表,得到对应的时空序列模型,通过对应的时空序列模型输出预测时刻对象的预测病例关键词。
关于临床医疗记录自动生成装置的具体限定可以参见上文中对于临床医疗记录自动生成方法的限定,在此不再赘述。上述临床医疗记录自动生成装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储医疗数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种临床医疗记录自动生成方法。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现上述实施例中方法的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (7)

1.一种临床医疗记录自动生成方法,其特征在于,所述方法包括:
从医疗信息系统获取对象的电子病程记录以及所述电子病程记录对应的时间信息;
根据对象的诊断信息,选择预先设置的所述诊断信息对应的分词库对所述电子病程记录进行分词,得到病例关键词;
以每个所述电子病程记录为节点,所述病例关键词为所述节点的空间信息,所述电子病程记录的时间间隔为时间信息,构建时空特征;
将所述时空特征中的连续n个序列数据作为训练样本、所述n个序列数据的下一个节点的病例关键词作为组合标签,训练预先构建的时空序列模型,得到训练好的时空序列模型;
根据训练好的时空序列模型以及预测时刻的时间间隔,输出预测时刻对象的预测病例关键词,根据预测时刻检测到的检测报告,与所述预测病例关键词进行比对,生成临床医疗记录文本;
将所述时空特征中的连续n个序列数据作为训练样本、所述n个序列数据的下一个节点的病例关键词作为组合标签,训练预先构建的时空序列模型,得到训练好的时空序列模型,包括:
根据所述病例关键词,构建第一文本特征矩阵;
将所述第一文本特征矩阵输入词嵌入模型,得到词向量矩阵,将所述词向量矩阵中的元素依次输入encoder-decoder模型中,得到一维特征向量;
对所述时间间隔进行向量化,得到时间向量,将所述时间向量和所述一维特征向量进行融合,得到融合特征向量;
将所述融合特征向量输入预先构建的时空序列模型,得到训练好的时空序列模型。
2.根据权利要求1所述的方法,其特征在于,对所述时间间隔进行向量化,得到时间向量,包括:
对所述时间间隔进行取整操作,得到时间向量。
3.根据权利要求2所述的方法,其特征在于,所述将所述时间向量和所述一维特征向量进行融合,得到融合特征向量,包括:
将所述时间向量和所述一维特征向量进行自适应加权,拼接后得到融合特征向量;其中,在训练预先构建的时空序列模型时,输出自适应加权的权重。
4.根据权利要求1至3任一项所述的方法,其特征在于,将所述时空特征中的连续n个序列数据作为训练样本、所述n个序列数据的下一个节点的病例关键词作为组合标签,包括:
将所述时空特征中的连续n个序列数据作为训练样本;
构建时间查询表,根据n个序列数据的下一个节点的病例关键词,构建时间查询表中每个元素的标签,得到组合标签。
5.根据权利要求4所述的方法,且特征在于,将所述时空特征中的连续n个序列数据作为训练样本、所述n个序列数据的下一个节点的病例关键词作为组合标签,训练预先构建的时空序列模型,得到训练好的时空序列模型,包括:
将所述时空特征中的连续n个序列数据作为训练样本、所述n个序列数据的下一个节点的病例关键词作为组合标签,训练预先构建的时空序列模型,得到时间查询表中每个元素对应的时空序列模型。
6.根据权利要求1所述的方法,其特征在于,所述根据训练好的时空序列模型以及预测时刻的时间间隔,输出预测时刻对象的预测病例关键词,包括:
根据预测时刻的时间间隔,查询时间查询表,得到对应的时空序列模型,通过对应的时空序列模型输出预测时刻对象的预测病例关键词。
7.一种临床医疗记录自动生成装置,其特征在于,所述装置包括:
数据获取模块,用于从医疗信息系统获取对象的电子病程记录以及所述电子病程记录对应的时间信息;
分词模块,用于根据对象的诊断信息,选择预先设置的所述诊断信息对应的分词库对所述电子病程记录进行分词,得到病例关键词;
特征构建模块,用于以每个所述电子病程记录为节点,所述病例关键词为所述节点的空间信息,所述电子病程记录的时间间隔为时间信息,构建时空特征;
训练模块,用于将所述时空特征中的连续n个序列数据作为训练样本、所述n个序列数据的下一个节点的病例关键词作为组合标签,训练预先构建的时空序列模型,得到训练好的时空序列模型;
文本生成模块,用于根据训练好的时空序列模型以及预测时刻的时间间隔,输出预测时刻对象的预测病例关键词,根据预测时刻检测到的检测报告,与所述预测病例关键词进行比对,生成临床医疗记录文本;
将所述时空特征中的连续n个序列数据作为训练样本、所述n个序列数据的下一个节点的病例关键词作为组合标签,训练预先构建的时空序列模型,得到训练好的时空序列模型,包括:
根据所述病例关键词,构建第一文本特征矩阵;
将所述第一文本特征矩阵输入词嵌入模型,得到词向量矩阵,将所述词向量矩阵中的元素依次输入encoder-decoder模型中,得到一维特征向量;
对所述时间间隔进行向量化,得到时间向量,将所述时间向量和所述一维特征向量进行融合,得到融合特征向量;
将所述融合特征向量输入预先构建的时空序列模型,得到训练好的时空序列模型。
CN202111518752.3A 2021-12-13 2021-12-13 临床医疗记录自动生成方法和装置 Active CN114242196B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111518752.3A CN114242196B (zh) 2021-12-13 2021-12-13 临床医疗记录自动生成方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111518752.3A CN114242196B (zh) 2021-12-13 2021-12-13 临床医疗记录自动生成方法和装置

Publications (2)

Publication Number Publication Date
CN114242196A CN114242196A (zh) 2022-03-25
CN114242196B true CN114242196B (zh) 2022-08-02

Family

ID=80755219

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111518752.3A Active CN114242196B (zh) 2021-12-13 2021-12-13 临床医疗记录自动生成方法和装置

Country Status (1)

Country Link
CN (1) CN114242196B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114431836A (zh) * 2022-04-11 2022-05-06 中南大学湘雅医院 基于人工智能的甲黑线良恶性预测系统
CN118692620A (zh) * 2024-08-22 2024-09-24 浙江大学医学院附属第二医院 一种抗菌药物临床使用病程记录生成方法和系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060074720A1 (en) * 2004-09-21 2006-04-06 Alfons Brutting Medical planning agent
JP2013200592A (ja) * 2012-03-23 2013-10-03 Fujifilm Corp 医療情報検索装置、方法およびプログラム
US11024406B2 (en) * 2013-03-12 2021-06-01 Nuance Communications, Inc. Systems and methods for identifying errors and/or critical results in medical reports
CN109003677B (zh) * 2018-06-11 2021-11-05 清华大学 病历数据结构化分析处理方法
CN111696640A (zh) * 2020-06-12 2020-09-22 上海联影医疗科技有限公司 自动获取病历模板的方法、装置和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
电子病历数据预处理技术;庄军等;《计算机科学》;20070325(第03期);第145-148页 *

Also Published As

Publication number Publication date
CN114242196A (zh) 2022-03-25

Similar Documents

Publication Publication Date Title
CN114242196B (zh) 临床医疗记录自动生成方法和装置
CN110929047B (zh) 关注邻居实体的知识图谱推理方法和装置
US10810491B1 (en) Real-time visualization of machine learning models
CN112882974B (zh) 一种json数据转换方法、装置、计算机设备和存储介质
CN110069572A (zh) 基于大数据平台的hive任务调度方法、装置、设备及存储介质
CN109711802A (zh) 项目信息处理方法、装置、计算机设备和存储介质
CN109886554B (zh) 违规行为判别方法、装置、计算机设备和存储介质
CN109215771B (zh) 医疗映射关系库建立方法、装置、计算机设备和存储介质
CN112287068B (zh) 基于人工智能的问诊对话数据处理方法及装置
CN112035611B (zh) 目标用户推荐方法、装置、计算机设备和存储介质
CN112231224A (zh) 基于人工智能的业务系统测试方法、装置、设备和介质
CN110457361B (zh) 特征数据获取方法、装置、计算机设备和存储介质
CN113723956A (zh) 异常监控方法、装置、设备及存储介质
CN113419950A (zh) Ui自动化脚本的生成方法、装置、计算机设备及存储介质
CN111274202B (zh) 电子合同生成方法、装置、计算机设备及存储介质
CN111428009A (zh) 关系查询方法、装置、计算机设备和存储介质
CN113343711B (zh) 工单生成方法、装置、设备及存储介质
CN110889357A (zh) 基于标注区域的地下电缆故障检测方法和装置
CN109003193B (zh) 投保风险预测方法、装置、计算机设备和存储介质
CN110705714A (zh) 深度学习模型检测方法、深度学习平台以及计算机设备
CN113239171B (zh) 对话管理系统更新方法、装置、计算机设备及存储介质
CN111368412B (zh) 用于护理需求预测的仿真模型构建方法和装置
CN114944942A (zh) 一种基于有效埋点的数据上报方法、装置、计算机设备及介质
CN113779937A (zh) 基于人工智能的文本内容转换方法、装置、设备和介质
CN111354449B (zh) 长期护理策略分配方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant